Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

Apache Spark™

An integrated part of CDH and supported with Cloudera Enterprise, Apache Spark is the open standard for flexible in-memory data processing that enables batch, real-time, and advanced analytics on the Apache Hadoop platform. Via the One Platform Initiative, Cloudera is committed to helping the ecosystem adopt Spark as the default data execution engine for analytic workloads.

Essayer maintenant

Learn why Spark is the heir to MapReduce

Développement facile et productif

Des API simples mais riches pour Java, Scala et Python ouvrent les données à la découverte interactive et au développement itératif d'applications. Grâce à un code commun partagé, les scientifiques de données et développeurs peuvent augmenter la productivité avec un prototypage rapide des applications de lots et de flux, à l'aide du langage et des outils tiers sur lesquels ils s'appuient déjà.

Découvrez pourquoi Spark est attractif pour les développeurs

Explorez le Developer Guide pour Spark


Traitement rapide

Profitez du stockage intégré distribué de Spark pour un traitement de haute performance parmi une multitude d'utilisations, notamment, le traitement par lots, le chargement en temps réel et la modélisation et les analyses avancées. Avec d'excellentes améliorations sur la performance par rapport à MapReduce, Spark est un outil de choix pour que les scientifiques et analystes de données transforment leurs données et résultats concrets.

Découvrir pourquoi Apache Spark est un succès chez les data scientistes

Mode d’emploi : Analyser la ligue Fantasy Sports avec Spark et le SQL

Close up of pen pointing to graph on screen
Diagram of Spark's benefits

Intégrée sur l'ensemble de la plate-forme

En tant que partie intégrante de la plate-forme Cloudera, Spark bénéficie d'une gestion des ressources unifiée (à travers YARN), d'une administration simple (à travers Cloudera Manager) et d'une sécurité et gouvernance partagées conformes aux normes (à travers Apache Sentry et Cloudera Navigator) — le tout étant indispensable pour une bonne exécution de la production.

En savoir plus

L'initiative One Platform

Apache Spark is well-positioned to replace MapReduce as the default data-processing engine in the Hadoop ecosystem, but for customers to fully embrace Spark for all production workloads, there is still work to be done to make it enterprise-grade. Cloudera's One Platform Initiative focuses on the need to deeply integrate Spark with the Hadoop ecosystem so users get maximum benefits from their big data infrastructure..

Pour réaliser cette vision, les personnes engagées chez Cloudera, travaillant aux côtés de la communauté, aborderont en particulier les problèmes présentés dans le diagramme à droite (quelques éléments ont déjà été réalisés).

Diagram of issues addressed and still outstanding

La différence Cloudera pour Apache Spark

The first integrated solution to support Apache Spark, Cloudera not only has the most experience — with production customers across industries — but also has built the deepest engineering integration between Spark and the rest of the ecosystem, including bringing Spark to YARN and adding necessary security and management integrations (500+ patches contributed, to date).

Cloudera compte aussi beaucoup de personnes qui contribuent à Spark parmi son personnel, pour que vous ayez un accès et puissiez influencer la feuille de route, en fonction de vos besoins et utilisations.

Vidéo : Spark dans l'entreprise, 2 ans après

Close up of man typing on laptop

Partenariat avec l'écosystème

Intégration fluide avec les outils que vos scientifiques de données et développeurs utilisent déjà en profitant de l'écosystème de plus de 1 700 partenaires de Cloudera. Avec un programme de certification partenaire solide et un programme Spark Partner Accelerator dédié, nous travaillons sans cesse pour développer des intégrations de production durables entre Spark et les outils tiers les plus connus.

En savoir plus sur nos partenaires

Assistance experte pour Apache Spark

Cloudera compte sur des expert·e·s Spark partout dans le monde, pour une assistance mondiale 24/24, 7/7. Avec plus d'expérience parmi plus de clients, pour plus d'utilisations, Cloudera est l'acteur principale de l’assistance Spark pour que vous puissiez vous concentrer sur les résultats.

Crew team rowing a boat

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.