Apache Spark™

An integrated part of CDH and supported with Cloudera Enterprise, Apache Spark is the open standard for flexible in-memory data processing that enables batch, real-time, and advanced analytics on the Apache Hadoop platform. Via the One Platform Initiative, Cloudera is committed to helping the ecosystem adopt Spark as the default data execution engine for analytic workloads.

Essayer maintenant

Développement facile et productif

Des API simples mais riches pour Java, Scala et Python ouvrent les données à la découverte interactive et au développement itératif d'applications. Grâce à un code commun partagé, les scientifiques de données et développeurs peuvent augmenter la productivité avec un prototypage rapide des applications de lots et de flux, à l'aide du langage et des outils tiers sur lesquels ils s'appuient déjà.

Explorez le Developer Guide pour Spark


Traitement rapide

Profitez du stockage intégré distribué de Spark pour un traitement de haute performance parmi une multitude d'utilisations, notamment, le traitement par lots, le chargement en temps réel et la modélisation et les analyses avancées. Avec d'excellentes améliorations sur la performance par rapport à MapReduce, Spark est un outil de choix pour que les scientifiques et analystes de données transforment leurs données et résultats concrets.

Demystifying Spark Jobs to Optimize for Cost and Performance

Close up of pen pointing to graph on screen
Diagram of Spark's benefits

Intégrée sur l'ensemble de la plate-forme

En tant que partie intégrante de la plate-forme Cloudera, Spark bénéficie d'une gestion des ressources unifiée (à travers YARN), d'une administration simple (à travers Cloudera Manager) et d'une sécurité et gouvernance partagées conformes aux normes (à travers Apache Sentry et Cloudera Navigator) — le tout étant indispensable pour une bonne exécution de la production.

En savoir plus


La différence Cloudera pour Apache Spark

The first integrated solution to support Apache Spark, Cloudera not only has the most experience — with production customers across industries — but also has built the deepest engineering integration between Spark and the rest of the ecosystem, including bringing Spark to YARN and adding necessary security and management integrations (500+ patches contributed, to date).

Cloudera compte aussi beaucoup de personnes qui contribuent à Spark parmi son personnel, pour que vous ayez un accès et puissiez influencer la feuille de route, en fonction de vos besoins et utilisations.

Témoignage client d'IQVIA

Vidéo : Spark dans l'entreprise, 2 ans après

Close up of man typing on laptop

Partenariat avec l'écosystème

Intégration fluide avec les outils que vos scientifiques de données et développeurs utilisent déjà en profitant de l'écosystème de plus de 1 700 partenaires de Cloudera. Avec un programme de certification partenaire solide et un programme Spark Partner Accelerator dédié, nous travaillons sans cesse pour développer des intégrations de production durables entre Spark et les outils tiers les plus connus.

En savoir plus sur nos partenaires

Assistance experte pour Apache Spark

Cloudera compte sur des expert·e·s Spark partout dans le monde, pour une assistance mondiale 24/24, 7/7. Avec plus d'expérience parmi plus de clients, pour plus d'utilisations, Cloudera est l'acteur principale de l’assistance Spark pour que vous puissiez vous concentrer sur les résultats.

Crew team rowing a boat

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.