Pour obtenir des informations à partir d'un flux de données, l'étape la plus difficile consiste à acquérir ces données — rapidement, de façon sécurisée, priorisée et traçable.
Cloudera DataFlow (CDF), anciennement Hortonworks DataFlow (HDF), est une plateforme évolutive d'analyse de flux de données en temps réel qui intègre, organise et analyse les données pour en extraire des informations clés et des renseignements utilisables immédiatement.
DataFlow résout les principales difficultés que les entreprises rencontrent avec leurs données en mouvement :
- Traitement en temps réel d'importants flux de données à grande échelle ;
- suivi de la provenance des données et de la source des flux ;
- gestion et surveillance des applications périphériques et des sources de flux.
La plateforme Cloudera DataFlow
Cloudera Edge Management, Cloudera Flow Management et Cloudera Stream Processing font désormais partie de la plateforme open-source de données en mouvement de Cloudera pour les données en flux.

Avantages clés
Réduction du temps de développement dédié à l'intégration des données
Imaginez une approche sans code qui permettrait de développer facilement des chaînes complexes de traitement de données. CDF propose une IU visuelle simple de construction de flux sophistiqués qui permet d'ingérer, transformer et enrichir les données provenant de diverses sources. Optimisé par Apache NiFi, CDF intègre des données issues d'appareils, d'applications d'entreprise, de systèmes partenaires et d'applications périphériques qui génèrent des flux de données en temps réel.
Gérer et protéger les données de votre entreprise, de sa périphérie à son cœur
CDF permet de recueillir de grands volumes de données à la périphérie du réseau, y compris depuis des périphériques utilisant la technologie Minifi. Vous pouvez désormais configurer des modèles de déploiement IoT largement distribués pour recueillir facilement des données régionales à l'aide de la technologie Minifi, afin de diffuser des données en continu depuis la périphérie. L'excellente intégration avec Apache Ranger donne à CDF l'avantage unique de sécuriser de façon homogène toutes vos données, en mouvement et au repos.
Obtenir des informations en temps réel plus vite que jamais
Vous agissez plus rapidement lorsque vous disposez d'informations en temps réel et de renseignements exploitables. À l'aide de la puissante plateforme de streaming Apache Kafka, CDF est capable de traiter plusieurs millions de transactions par seconde, d'identifier des comportements clés, d'effectuer des comparaisons avec des modèles de machine learning et de proposer des analyses prédictives ou prescriptives conçues pour aider les dirigeants à prendre des décisions clés et saisir les opportunités.
Conformité immédiate
CDF est le seul produit du secteur à permettre le suivi de la provenance des données d'une entreprise, de sa périphérie à son cœur, ainsi que de leur gestion. À l'heure du RGPD et autres réglementations, il est important de connaître l'origine des données, même celles reçues en flux continu. Au sein de CDF, NiFi suit la provenance des données sans configuration ni paramétrage supplémentaire. L'excellente intégration d'Apache Atlas vous permet de bénéficier d'une gouvernance complète des données de votre entreprise, de sa périphérie à son cœur.
Construire une architecture de données qui s'adapte à l'évolution de l'IoT
Capitaliser sur la richesse des informations issues des données de l'IoT
CDF est une technologie entièrement open source — vous pouvez donc concevoir une architecture prête pour l'avenir sans être bloqué par un fournisseur propriétaire. Mettez en œuvre des solutions IoT conçues pour des cas d'utilisation critiques dans des secteurs tels que l'automobile, la production industrielle, les transports, la distribution d'énergie, la vente au détail et le secteur public. Vous pouvez adopter une stratégie dédiée à la gestion de grands volumes de données très diverses à grande vitesse.