Vue d'ensemble
Simplifiez et mettez en place des pipelines de données sécurisés à n'importe quelle échelle.
CDP Data Engineering est le seul service cloud-native conçu spécialement pour les équipes de data engineering. Basé sur Apache Spark, cet ensemble d'outils complet permet d'automatiser l'orchestration via Apache Airflow, de surveiller étroitement les pipelines, de visualiser les problèmes et de les résoudre, et de simplifier les processus ETL entre les différentes équipes d'analyse.
Grâce à l'intégration complète de Data Engineering avec Cloudera Data Platform, vous bénéficiez d'une visibilité et d'une sécurité de bout en bout avec SDX, mais aussi d'une intégration transparente avec les services de CDP tels que CDP Data Warehouse et CDP Machine Learning. Data Engineering vous permet de mettre en place des workflows d'ingénierie des données cohérents, répétables et automatisés sur une plateforme cloud hybride, où vous le souhaitez.
Cas d'utilisation de CDP Data Engineering
Automatiser les pipelines de données partout
Améliorer la visibilité et le contrôle des processus ETL
Préserver l'intégrité des données de bout en bout
Automatiser les pipelines de données partout
Transmettez des ensembles de données de qualité en toute sécurité à CDP Data Warehouse, à CDP Machine Learning ou à l'outil d'analyse de votre choix.
Data Engineering simplifie les pipelines de données pour les équipes d'analyse, du machine learning à l'entreposage de données et au-delà. Accélérez les délais de rentabilisation en orchestrant et en automatisant les pipelines afin de fournir des ensembles de données de qualité de manière sécurisée et transparente, où vous en avez besoin.
Améliorer la visibilité et le contrôle des processus ETL
Gérez le cycle de vie de vos données de manière globale et transparente.
La mise en œuvre de pipelines de données à l'échelle de l'entreprise complexifie la gestion du cycle de vie des données et le contrôle des coûts.
Pour cela, Data Engineering fournit aux entreprises les fonctions suivantes : planification de la capacité, automatisation des pipelines, dépannage et suivi automatique de la provenance des données.
Préserver l'intégrité des données de bout en bout
Visibilité totale des pipelines au service de la sécurité.
Avec l'augmentation de la quantité et de la complexité des données, dimensionner précisément et fidèlement les charges de travail analytiques au sein de l'entreprise peut se révéler difficile.
Data Engineering propose des fonctions natives de surveillance des pipelines de données et d'alerte afin de détecter les anomalies le plus tôt possible. Il permet en outre de visualiser les problèmes afin de pouvoir les résoudre avant qu'ils n'affectent vos activités.