Vue d'ensemble

Avec CDP, gérez les données en flux, facilement et en temps réel, sur AWS, Azure et GCP.

Cloudera Data Platform (CDP) simplifie la collecte et le streaming de données au moyen de services cloud intuitifs disponibles sur AWS, Azure et Google Cloud Platform (GCP). Les cas d'utilisation hybrides sont plus faciles à déployer en raison de la facilité de gestion des clusters CDP et du recours aux mêmes outils DataFlow sur site.

Le déploiement de clusters de gestion et de traitement des flux avec CDP, accessibles depuis un service Data Hub simple mais puissant, ne demande que quelques minutes dans le cloud et supprime les tâches complexes et chronophages de gestion et de planification des infrastructures.

DataFlow pour Data Hub offre aux entreprises sécurité et évolutivité, en associant l'aspect novateur et la puissance d'Apache NiFi, Kafka et Flink à Cloudera SDX, pour une sécurité et une gouvernance homogènes sur les clouds publics et hybrides.

Services cloud DataFlow pour Data Hub

  • Gestion des flux
  • Streams Messaging
  • Analyse de flux

Gestion des flux


Lancez des clusters NiFi pour rapidement procéder à la collecte, à la distribution et à la transformation des données.

Flow Management sur Data Hub propose une IU visuelle simple de construction d'exigences sophistiquées d'ingestion, de transformation et d'enrichissement de données provenant de différentes sources et cibles de données en flux. Vous pouvez ainsi rapidement ingérer les données en flux d'appareils, d'applications d'entreprise, de systèmes partenaires et d'applications cloud, à une vitesse supérieure à un million d'événements par seconde.

Streams Messaging


Migrez vos outils Kafka sur site vers le cloud public pour stocker et adapter d'importants volumes de flux de données.

Streams Messaging sur Data Hub permet aux entreprises d'ingérer, de stocker et d'adapter d'énormes volumes de données en temps réel afin d'alimenter les applications cloud et sur site. Principalement optimisée par Apache Kafka, la solution permet un accès en temps réel aux données de nombreuses applications, telles que des moteurs d'analyse, des data lakes et des bases de données de séries chronologiques.

Analyse de flux


Lancez des clusters Apache Flink pour traiter les flux Kafka et NiFi et fournir des analyses en temps réel sur le cloud.

La solution Streaming Analytics sur Data Hub exécute des moteurs d'analyse et de traitement des flux à faible latence de dernière génération répondant aux besoins en matière d'informations en temps réel et d'analyses prédictives. Alimentée par Apache Flink, elle démocratise les analyses de flux au sein de l'entreprise afin d'obtenir de meilleurs résultats en peu de temps.

Fonctionnalités clés

Renforcez vos capacités de streaming sur site avec Cloudera DataFlow sur le cloud public. Cloudera Data Hub simplifie et accélère le lancement de clusters NiFi, Kafka ou Flink sur AWS, Azure et GCP.

Accélérez le développement de pipelines de données grâce à Flow Management sur Data Hub. L'interface sans code et les quelque 300 processeurs prédéfinis d'Apache NiFi vous permettent de déplacer tout type de données vers et depuis le cloud. NiFi Registry suit les versions des flux de données pour la gouvernance et le déploiement.

Streams Messaging sur Data Hub offre une évolutivité maximale en stockant d'importants volumes de données entrantes auxquelles les autres clouds et applications d'entreprise peuvent s'abonner. Alimentée par Apache Kafka en tant que plateforme de messagerie, la solution est prise en charge par Schema Registry et Streams Messaging Manager.

Streaming Analytics sur Data Hub aide les entreprises à démocratiser les analyses de flux en interne et améliore les processus de détection et de réponse aux événements critiques, générateurs de meilleurs résultats opérationnels. Apache Flink permet le traitement à faible latence et avec état d'importants volumes de flux de données.

Grâce à Data Hub, gérez de vastes volumes de données à haute vitesse, de vos environnements sur site aux clouds publics, en toute simplicité. Les fonctionnalités exhaustives de DataFlow facilitent l'ingestion, le stockage et l'analyse des données en flux sur les architectures multicloud et de cloud hybride.

Les différents clusters DataFlow vous permettent de configurer une architecture de gestion des données distribuées, de l'edge au cloud. L'intégration avec Cloudera SDX donne à DataFlow l'avantage de sécuriser et de gouverner de façon homogène tous vos emplacements de données en mouvement et au repos.

Vous souhaitez approfondir le sujet ?


Faites un essai de DataFlow pour Data Hub

Datasheet

Cloudera DataFlow pour Data Hub

Ebook

Étendez vos capacités de streaming sur site jusqu'au cloud public

Demo

Comment connecter NiFi à Kafka dans Data Hub, depuis CDP

Solution Brief

Le principe des données en mouvement

Formation, assistance et services haut de gamme

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.