Vue d'ensemble
Contrôlez la distribution des données tout en laissant la possibilité de les envoyer vers n'importe quelle destination.
CDF-PC repose sur un paradigme de développement low-code orienté flux qui correspond parfaitement à la manière dont les développeurs conçoivent, développent et testent les pipelines de distribution de données. Avec plus de 450 connecteurs et processeurs à travers l'écosystème de services de cloud hybride (data lakes, lakehouses, entrepôts cloud et sources sur site), CDF-PC permet de distribuer les données sans la moindre distinction. La version de ces flux de distribution peut ensuite être contrôlée par le biais d'un catalogue qui permet aux opérateurs d'effectuer des déploiements en libre-service vers différents environnements d'exécution.
CLOUDERA DATAFLOW FOR PUBLIC CLOUD
Distribution universelle de données, optimisée par Apache NiFi

Connectez-vous à n'importe quelle source de données, où qu'elle se trouve, traitez les données et envoyez-les vers n'importe quelle destination
Cas d'utilisation
Microservices no-code et sans serveur
Traitement des fichiers en temps quasi réel
Ingestion en data lakehouse
Cybersécurité et optimisation des journaux
Collecte de données IoT et en flux
Microservices no-code et sans serveur
DataFlow Fonctions est la première solution visuelle no-code capable de concevoir des microservices avec une évolutivité infinie.
En exécutant les flux NiFi dans AWS Lambda, Azure Functions et Google Cloud Functions, DataFlow Functions est la première solution à offrir une interface utilisateur no-code intuitive dédiée à la conception de microservices déclenchés par des requêtes HTTPS. Grâce à elle, concevez des points de terminaison d'API avec une évolutivité infinie dans un environnement sans serveur en un rien de temps.
Traitement des fichiers en temps quasi réel
DataFlow Functions facilite le traitement des fichiers en temps quasi réel dans une architecture sans serveur.
En exécutant les flux NiFi dans AWS Lambda, Azure Functions et Google Cloud Functions, DataFlow Functions permet un traitement des fichiers véritablement rentable, dès que des fichiers sont disponibles dans la base de données d'objets. Les ressources ne sont exécutées que lorsque les données sont traitées, et dès que le flux NiFi n'a plus besoin de fonctionner en continu. Cela fournit également une architecture entièrement sans serveur et n'impliquant aucun coût d'exploitation de l'infrastructure.
Ingestion en data lakehouse
Modernisez les pipelines de données à l'aide d'un seul outil compatible avec n'importe quel entrepôt ou data lakehouse.
Grâce à plus de 450 processeurs pris en charge, Cloudera DataFlow permet de collecter et de convertir facilement les données dans le format requis par votre lakehouse.
Cloudera DataFlow permet de traiter les données non structurées comme telles et d'atteindre un débit élevé en évitant de devoir appliquer un schéma ou de donner une structure aux données non structurées en appliquant un schéma. Au lieu de cela, vous pouvez facilement transformer vos données en utilisant le langage d'expression NiFi ou des requêtes SQL.
Cybersécurité et optimisation des journaux
Permettez aux analystes de données de détecter et d'analyser les événements plus rapidement et avec plus de précision via la curation des données SIEM.
Réduisez le coût de votre solution de cybersécurité en modernisant les pipelines de collecte de données afin de recueillir et filtrer les données en temps réel à partir de milliers de sources dans le monde entier.
Ingérer tous les journaux de périphériques et d'applications au sein de votre solution SIEM n'est pas une solution flexible, tant du point de vue des coûts que des performances. Cloudera DataFlow vous permet de recueillir des données de journaux, où qu'elles se trouvent, et d'éliminer le bruit, tout en conservant la possibilité de gérer les données stockées dans votre système SIEM.
Collecte de données IoT et en flux
Envoyez des données à partir de périphériques IoT vers un flux de données central dans le cloud qui s'adapte en fonction des besoins.
Cloudera DataFlow est prévu pour traiter les données en flux au besoin. Les entreprises peuvent ainsi démarrer par de petits projets IoT, tout en sachant que leur système est capable de gérer les pics de données provoqués par l'ajout de nouveaux appareils sources, de même que les problèmes de connectivité occasionnels.
L'environnement d'exécution de DataFlow Functions fournit un moyen efficace, rentable et évolutif d'exécuter des flux NiFi sans serveur pour les cas d'utilisation orientés événements.
Les déploiements DataFlow s'adaptent automatiquement aux flux NiFi en fonction de l'utilisation du processeur. Les coûts d'infrastructure peuvent être contrôlés en définissant des limites minimales et maximales pour le dimensionnement automatique.
Connectez-vous à n'importe quelle source ou cible de données à l'aide de la riche bibliothèque de processeurs de NiFi, dont des sources de données sur site, des sources de données de journaux, ainsi qu'un stockage, des entrepôts de données, des services d'analyse de données ou encore des services de processus métier dans le cloud. Les développeurs peuvent également déployer rapidement un ensemble prédéfini de flux de données avec une configuration minimale, appelé ReadyFlows, pour les applications courantes.
Surveillez tous vos déploiements de flux NiFi dans un seul tableau de bord, quel que soit le cloud dans lequel ils sont exécutés. Suivez les indicateurs clés de performance des flux en définissant des alertes pour chacun de vos déploiements.
Provisionnez facilement des points de terminaison sécurisés, stables et évolutifs, de sorte que toute application puisse facilement envoyer des données aux déploiements de flux.
Cloudera DataFlow a été pensé pour l'automatisation des tâches. Toute action effectuée dans l'interface peut être automatisée via une ligne de commande. Déployer un nouveau flux NiFi est donc aussi simple qu'exécuter une ligne de commande.
DÉVELOPPEZ DES FLUX NIFI EN TOUT LIEU ET DÉPLOYEZ-LES DANS N'IMPORTE QUEL CLOUD
en tant que clusters Kubernetes à dimensionnement automatique ou flux NiFi sans serveur

Options d'exécution dans le cloud public
Fonctionnalité | Déploiements DataFlow | DataFlow Functions |
Exécution dans le cloud |
Clusters NiFi utilisant Kubernetes/des conteneurs |
Flux NiFi exécutés sur les services de calcul sans serveur des fournisseurs de services cloud (AWS Lambda, Azure Functions et Google Cloud Functions) |
---|---|---|
Cas d'utilisation |
Cas d'utilisation nécessitant une faible latence pour les charges de travail à haut débit impliquant une exécution continue des flux NiFi | Cas d'utilisation en rafale orientés événements, sans exigence de latence inférieure à la seconde, n'impliquant pas une exécution continue des flux NiFi |
Avantages |
Clusters Kubernetes à dimensionnement automatique pour les workflows longue durée avec surveillance centralisée | Un moyen efficace, optimisé et évolutif d'exécuter des flux NiFi sans serveur pour permettre aux développeurs de se concentrer sur la logique métier |
Unité de mesure |
Unité de calcul Cloudera (CCU) | Nombre d'appels de méthode |
Collecter des données en périphérie
Gérez, contrôlez et surveillez l'edge dans le cadre de vos projets IoT et de streaming, et communiquez des flux de données en temps réel sans ingestion ni gestion de code grâce à Cloudera Edge Management.
Pour commencer
DOCUMENTATION PRODUIT
Vous trouverez ici les caractéristiques techniques de Cloudera DataFlow for the Public Cloud ainsi que des informations sur l'architecture et des tutoriels.
TARIFS DE CDF POUR LE CLOUD PUBLIC
Comparez les tarifs de Cloudera DataFlow for the Public Cloud sur différents types d'instances de cloud public.
PRÉSENTATION GUIDÉE DE DATAFLOW
Découvrez le fonctionnement de Cloudera DataFlow pour le cloud public.
LA COMMUNAUTÉ CLOUDERA AVEC NIFI
Entrez en contact avec vos homologues, posez des questions, réglez des problèmes et apprenez-en davantage sur Apache NiFi.
FORMATION NIFI
Réservez un cours de formation pratique de trois jours pour apprendre les bases d'Apache NiFi et plus encore.
DÉMONSTRATION DE PRODUIT
Regardez l'introduction et la démonstration de Cloudera DataFlow pour le cloud public.