Apache Spark™
An integrated part of CDH and supported with Cloudera Enterprise, Apache Spark is the open standard for flexible in-memory data processing that enables batch, real-time, and advanced analytics on the Apache Hadoop platform. Via the One Platform Initiative, Cloudera is committed to helping the ecosystem adopt Spark as the default data execution engine for analytic workloads.
Développement facile et productif
Des API simples mais riches pour Java, Scala et Python ouvrent les données à la découverte interactive et au développement itératif d'applications. Grâce à un code commun partagé, les scientifiques de données et développeurs peuvent augmenter la productivité avec un prototypage rapide des applications de lots et de flux, à l'aide du langage et des outils tiers sur lesquels ils s'appuient déjà.
Traitement rapide
Profitez du stockage intégré distribué de Spark pour un traitement de haute performance parmi une multitude d'utilisations, notamment, le traitement par lots, le chargement en temps réel et la modélisation et les analyses avancées. Avec d'excellentes améliorations sur la performance par rapport à MapReduce, Spark est un outil de choix pour que les scientifiques et analystes de données transforment leurs données et résultats concrets.
Demystifying Spark Jobs to Optimize for Cost and Performance
Intégrée sur l'ensemble de la plate-forme
En tant que partie intégrante de la plate-forme Cloudera, Spark bénéficie d'une gestion des ressources unifiée (à travers YARN), d'une administration simple (à travers Cloudera Manager) et d'une sécurité et gouvernance partagées conformes aux normes (à travers Apache Sentry et Cloudera Navigator) — le tout étant indispensable pour une bonne exécution de la production.
La différence Cloudera pour Apache Spark
The first integrated solution to support Apache Spark, Cloudera not only has the most experience — with production customers across industries — but also has built the deepest engineering integration between Spark and the rest of the ecosystem, including bringing Spark to YARN and adding necessary security and management integrations (500+ patches contributed, to date).
Cloudera compte aussi beaucoup de personnes qui contribuent à Spark parmi son personnel, pour que vous ayez un accès et puissiez influencer la feuille de route, en fonction de vos besoins et utilisations.
Partenariat avec l'écosystème
Intégration fluide avec les outils que vos scientifiques de données et développeurs utilisent déjà en profitant de l'écosystème de plus de 1 700 partenaires de Cloudera. Avec un programme de certification partenaire solide et un programme Spark Partner Accelerator dédié, nous travaillons sans cesse pour développer des intégrations de production durables entre Spark et les outils tiers les plus connus.
Assistance experte pour Apache Spark
Cloudera compte sur des expert·e·s Spark partout dans le monde, pour une assistance mondiale 24/24, 7/7. Avec plus d'expérience parmi plus de clients, pour plus d'utilisations, Cloudera est l'acteur principale de l’assistance Spark pour que vous puissiez vous concentrer sur les résultats.