Vue d'ensemble
Une plateforme complète de flux de données en temps réel reliant l'edge et le cloud.
Cloudera DataFlow (CDF) est une plateforme évolutive de flux de données en temps réel qui ingère, organise et analyse les données afin de fournir des informations essentielles et immédiatement exploitables. Dataflow permet de relever les enjeux suivants :
- Traitement en temps réel d'importants flux de données à grande échelle ;
- suivi de la provenance des données et de la source des flux ;
- gestion et surveillance des applications périphériques et des sources de flux.
- Acquisition d'informations en temps réel et de renseignements exploitables grâce aux données en flux
Profitez de DataFlow sur Cloudera Data Platform
Les fonctionnalités de DataFlow sont disponibles dans CDP Public Cloud à travers deux options de déploiement : DataFlow pour Data Hub et DataFlow pour le cloud public (voir ci-dessous). Vous bénéficiez des principaux avantages de CDP Public Cloud, tels que le provisionnement, la gestion et le suivi rapide des clusters, ainsi que la couche de sécurité et de gouvernance unifiée de SDX tout au long du cycle de vie des données.
Options de déploiement
Une plateforme de flux de données reliant l'edge et le cloud dans les environnements de cloud public, de cloud hybride et sur site.
DataFlow pour Data Hub
- Lancez rapidement des clusters Apache NiFi pour ingérer des données à grande échelle avec Flow Management pour Data Hub
- Étendez les clusters Apache Kafka sur site au cloud public avec Streams Messaging pour Data Hub
- Accélérez le traitement des flux en temps réel avec Apache Flink en mode cloud hybride avec Streaming Analytics pour Data Hub
DataFlow pour le cloud public
- Réduisez les coûts d'infrastructure cloud en autorisant le dimensionnement automatique des flux cloud-native
- Gérez et suivez tous les flux NiFi sur plusieurs clusters cloud à partir d'un tableau de bord centralisé
- Accélérez le développement en utilisant des flux NiFi prédéfinis à partir d'une galerie de ReadyFlows
La plateforme Cloudera DataFlow
Edge et Flow Management
Gérez, contrôlez et surveillez l'edge dans le cadre de vos projets IoT et de streaming, et communiquez des flux de données en temps réel sans ingestion ni gestion de code.
Streams Messaging
Stockez temporairement d'importants volumes de données afin de permettre à d'autres applications cloud et d'entreprise d'y accéder en temps réel.
Stream Processing & Analytics
Analysez les données en temps réel afin d'améliorer la détection des principaux événements qui stimulent vos résultats opérationnels, de même que votre capacité de réaction.
Cas d'utilisation
Modernisation de la journalisation
Client 360
Analyses en temps réel
Modernisation de la journalisation
Libérez le potentiel des données générées automatiquement grâce à la modernisation de la journalisation sur CDF.
La modernisation de la journalisation est une approche holistique qui vise à valoriser les données générées automatiquement en réduisant les coûts de traitement et en étendant le champ d'application des analyses. Cette stratégie repose sur l'ingestion de données en temps réel, le traitement périphérique, la transformation et l'acheminement des données de journalisation vers des outils d'analyse descriptifs, prescriptifs et prédictifs.
Client 360
Obtenez une vision complète de votre client en recueillant toutes ses données auprès de diverses sources.
L'une des priorités des entreprises en matière de transformation numérique est d'obtenir une vision complète de leurs clients. Cependant, les données les concernant proviennent de sources très variées, notamment les bases de données d'entreprise traditionnelles, les data lakes, les banques de données cloud ou encore les flux de réseaux sociaux. Les fonctions d'ingestion de données et de messagerie de CDF vous permettent d'ingérer, de regrouper, d'enrichir et de traiter facilement les données issues de ces sources afin d'obtenir une vue à 360 degrés de chaque client.
Analyses en temps réel
Prévoyez les pannes et prenez des mesures correctives en temps réel.
La qualité de vos analyses IoT ou de flux dépend de votre capacité à exploiter les données que vous ingérez en temps réel. Dans le domaine de l'IoT par exemple, la maintenance prédictive ou le suivi des patients nécessitent que les données soient recueillies et traitées instantanément pour donner lieu à des analyses prédictives et prescriptives en temps réel. Dans certains cas, les informations ainsi obtenues peuvent réellement sauver des vies.
Mettez à jour vos tâches de traitement de flux vers CDP
Cloudera Data Platform (CDP) est le nouvel enterprise data cloud. Grâce à Cloudera DataFlow, intégré à CDP, les entreprises peuvent effectuer des charges de travail de streaming dans le cloud, depuis le recueil de données en périphérie jusqu'à l'analyse de flux.