Vue d'ensemble
En quoi consistent Edge et Flow Management ?
Cloudera DataFlow (CDF) est une plateforme de flux de données en temps réel qui vous permet de gérer vos données entre l'edge et le cloud. Elle repose sur deux composants clés : Edge Management et Flow Management.
Optimisée par Apache NiFi, la fonction Flow Management de CDF permet aux entreprises d'ingérer, de transformer et de gérer des données à grande échelle entre n'importe quels environnements. Elle répond aux principaux cas d'utilisation d'entreprise et de cloud hybride tels que le déplacement de données, l'ingestion de données de log et l'acquisition de tout type de données diffusées en continu, dont celles issues des réseaux sociaux, appareils mobiles, flux de clics et de l'IoT.
La fonction Edge Management de CDF est composée d'agents edge (MiNiFi) et d'un centre de gestion edge appelé Edge Flow Manager. Elle gère, contrôle et surveille des agents edge pour recueillir des données à partir d'appareils périphériques et diffuser des informations à la périphérie du réseau. Cette fonction répond aux cas d'utilisation IoT tels que la maintenance prédictive, la gestion de flotte et le suivi des ressources.
Cas d'utilisation
Maintenance prédictive
Suivi des patients
Déplacement des données
Maintenance prédictive
Réduisez les coûts et les temps d'arrêt grâce à la maintenance prédictive.
La maintenance prédictive est une approche qui permet d'analyser les données provenant de l'IoT et des capteurs des équipements connectés afin de prévoir efficacement quand et comment une ressource risque de tomber en panne, de détecter les anomalies, de comprendre les signaux d'alerte et d'identifier rapidement les schémas susceptibles d'indiquer une panne éventuelle. Les fonctions Edge et Flow Management de Cloudera DataFlow améliorent la maintenance prédictive en modernisant et en simplifiant l'ingestion de données émanant de centaines d'équipements connectés.
Suivi des patients
Recueillez les flux en temps réel des appareils de surveillance des patients afin de détecter les anomalies.
Les appareils biométriques et télémétriques sont utilisés dans les établissements de santé pour surveiller les patients à haut risque ou ayant subi une opération. L'ingestion des données de ces dispositifs sur les fonctions vitales des patients permet de détecter des anomalies ou des tendances préoccupantes. Edge and Flow Management de Cloudera DataFlow permet de recueillir ces données et de les transmettre à des moteurs de traitement de flux pour en tirer des renseignements utiles.
Déplacement des données
Connectez, intégrez et déplacer d'importants volumes de données dans des environnements hybrides et multicloud.
Les processus ETL traditionnels servent à déplacer les données d'une base de données à une autre. Aujourd'hui, les entreprises transfèrent des données de leurs locaux vers le cloud ou de cloud à cloud, et déplacent ainsi des pétaoctets d'informations en quelques heures seulement. La fonction de gestion des flux de Cloudera DataFlow a été spécialement conçue pour répondre à ce type de besoin.
Fonctionnalités clés
Des centaines de processeurs prédéfinis sont disponibles pour se connecter à tout un éventail de sources de données, de dispositifs et de protocoles. L'interface utilisateur vous permet de créer des pipelines de flux de données avancés par simple glisser-déposer.
Comprendre l'origine et l'attribution des données à mesure de leur circulation au sein de l'entreprise permet à l'équipe de gouvernance d'expliquer la façon dont chaque point de données est affecté par un éventuel système. Des informations de traçabilité des données sont générées pour chaque action, aussi subtile soit-elle, même en cas de modification des enregistrements avant et après un événement.
Ingérez, recueillez et transmettez des données en temps réel à partir de n'importe quelle source, notamment les flux de clics, les réseaux sociaux, les appareils mobiles et l'IoT. Obtenez des informations exploitables en connectant, convertissant, gérant et suivant facilement les données à l'aide d'applications de flux de données complexes développées grâce aux plus de 450 processeurs NiFi, via un tableau de bord de surveillance personnalisé.
Gérez n'importe quel débit en déplaçant des pétaoctets de données d'un datacentre à un autre en quelques heures seulement ou transférez des données de vos locaux vers le cloud ou vice versa. Utilisez un modèle multicloud reposant sur une approche de gestion des données indépendante de tout fournisseur de services cloud.
Adoptez un cycle de développement de flux de données de type DevOps grâce à NiFi Registry afin de livrer vos applications de flux plus rapidement et de les déployer facilement d'un environnement à l'autre. Donnez à votre équipe de développement le pouvoir de créer plusieurs versions de leurs flux de données et de configurer des schémas de développement au sein des environnements.
Gérez la périphérie du réseau à grande échelle en ordonnant, contrôlant et surveillant des centaines de milliers d'agents avec une empreinte minimale pour collecter, filtrer et traiter les données. Utilisez des algorithmes ML de bout en bout à la périphérie par l'intermédiaire de boucles d'apprentissage automatisées.
Options de déploiement
Ingérez et diffusez des données de l'edge au cloud dans les environnements edge, de cloud public, de cloud hybride et sur site.
Flow Management pour Data Hub
- Déployez NiFi et NiFi Registry dans votre cloud public avec Flow Management pour Data Hub
- Choisissez la taille de votre cluster (S/M/L) et lancez-le sur AWS, Azure ou GCP
- Proposez la même expérience utilisateur, aussi bien dans le cloud public que sur site
DataFlow pour le cloud public
- Suivez tous vos flux NiFi sur plusieurs clusters cloud à partir d'un seul tableau de bord
- Accélérez le développement en utilisant des flux NiFi prédéfinis à partir d'une galerie de ReadyFlows
- Optimisez la taille de l'infrastructure en permettant à DataFlow de dimensionner automatiquement les flux NiFi
Pour commencer
Documentation
Vous trouverez ici les caractéristiques techniques d'Apache NiFi ainsi que des informations sur l'architecture, des tutoriels et des articles pratiques.
Tarifs de CDP Data Hub
Estimez les tarifs de CDP Public Cloud pour Data Hub en fonction de différents types d'instances et de fournisseurs de services cloud.
Modernisation de la journalisation
En savoir plus sur l'une des applications courantes de la gestion des flux : la modernisation de la journalisation.
NiFi dans le cloud
Étendez vos capacités de gestion des flux au cloud grâce à CDP Data Hub.
La communauté Cloudera sur NiFi
Entrez en contact avec vos homologues, posez des questions, réglez des problèmes et apprenez-en davantage sur Apache NiFi.
Formation
Réservez un cours de formation pratique de trois jours pour apprendre les bases d'Apache NiFi et plus encore.