Vue d'ensemble
Déployez rapidement et facilement un vaste éventail d'analyses dans le cloud public.
CDP Data Hub est un service performant d'analyse sur le cloud public de Cloudera Data Platform (CDP) qui permet d'obtenir plus facilement et rapidement des analyses avancées de l'Edge à l'IA dans un modèle de cluster familier dans le cloud. Grâce à la plus large gamme d'analyses des charges de travail, dont le streaming, l'ETL, les datamarts, les bases de données et le machine learning, CDP Data Hub vous permet de déplacer les charges de travail sur site vers le cloud ou de les intégrer directement au cloud en toute simplicité.
Cette solution complète et basée cloud est optimisée par Cloudera Runtime, une suite de technologies open source, et intégrée à SDX. Elle propose un grand choix de formes de clusters, de types de charges de travail, de modèles prédéfinis et d'options de configuration afin d'offrir une expérience intuitive et personnalisable aux utilisateurs qui sont à l'aise avec les architectures traditionnelles.
Cas d'utilisation de Data Hub
Simplifiez votre parcours vers le cloud
Déployez et faites évoluer les charges de travail Cloudera sur site vers le cloud public en toute simplicité grâce à une plateforme qui couvre les clouds publics comme privés et qui permet :
- Des performances améliorées, une gouvernance solide et une disponibilité du cloud public
- Une flexibilité pour l'optimisation de vos charges de travail dans les deux modèles de déploiement
- Une transition plus facile vers le cloud grâce aux avantages d'un facteur d'encombrement familier et d'un modèle de cluster traditionnel
- Un scénario de migration fluide vers les expériences conteneurisées de CDP
Déployez rapidement des charges de travail multi-analyses complexes
Accélérez le déploiement de charges de travail complexes dans le cloud public tout au long du cycle de vie des données grâce à :
- Une architecture basée cloud qui vous permet de déployer une large gamme de charges de travail d'analyse personnalisées et flexibles
- Une expérience intuitive à l'aide de clusters familiers basés sur les nœuds, que vous choisissiez une approche modélisée ou que vous créiez vos propres charges de travail
- Un haut niveau de personnalisation qui vous permet de déployer des charges de travail sur mesure pour répondre aux besoins particuliers de votre entreprise
Sélectionner des charges de travail
Datamart en temps réel
Ingénierie de données pour les pipelines complexes
Streaming sur cloud hybride
Base de données opérationnelle
Datamart en temps réel
Permettre l'analyse de grands volumes de données arrivant rapidement.
Le modèle de datamart en temps réel dans Data Hub vous permet d'ingérer des millions de dossiers par seconde, avec des mises à jour en place selon vos besoins. Les données sont disponibles immédiatement dans un format optimal pour les requêtes. Ce modèle est idéal pour les applications de série chronologique, les analyses d'événements, le rapprochement CDC et les pipelines de traitement des données en temps réel. Il comprend le moteur de stockage d'analyse Apache Kudu, Apache Impala pour une exécution SQL rapide, Hue pour le développement et l'analyse SQL et Apache Spark Streaming pour le traitement et l'analyse de flux.
Ingénierie de données pour les pipelines complexes
Enrichir, transformer et charger des données.
Data Hub vous permet d'enrichir, de transformer et de nettoyer des données afin de créer, d'exécuter et de gérer des pipelines de données de bout en bout à un degré élevé de flexibilité et de personnalisation. Le modèle d'ingénierie de données vous permet d'exécuter une large gamme de charges de travail de traitement de données, y compris le traitement par lots et de flux en temps réel, à l'aide d'Apache Spark et de Hive.
Streaming sur cloud hybride
Collecter, traiter et créer des analyses en temps réel
DataFlow pour CDP Data Hub est une plateforme complète de données en flux de la périphérie du réseau au cloud qui répond à certains des défis posés par les données en flux dans les environnements hybrides, avec Apache NiFi et Kafka. Il permet aux utilisateurs de prolonger leurs flux sur site de Cloudera DataFlow sur le cloud, sans nécessiter d'énormes ressources pour les développer, les configurer et les maintenir.
Base de données opérationnelle
Créez des applications de niveau professionnel extrêmement fiables.
Data Hub vous permet de faire fonctionner des bases de données NoSQL de haute performance, prenant en charge ANSI SQL. Il favorise une évolutivité et une performance incomparables pour les applications opérationnelles stratégiques avec Apache Hbase. Operational Database prend en charge un schéma évolutif qui permet aux développeurs de bénéficier de la puissance des données, tout en préservant la flexibilité dans la conception de l'application. Elle fournit également une adaptation automatique basée sur l'utilisation de la charge de travail du cluster pour optimiser l'utilisation et le coût de l'infrastructure.