Découvrez plus en détail la version Data-in-Motion de Kubernetes Regarder le webinaire
Vue d'ensemble
Qu'est-ce que Streaming ?
Cloudera Streaming (anciennement Cloudera Stream Processing) permet aux clients de transformer les flux en produits de données. Ses capacités d'analyse identifient des modèles complexes dans les flux de données et extraient des informations exploitables.
Optimisé par Apache Flink et Kafka, Streaming fournit une solution complète et professionnelle de gestion de flux et de traitement avec état. La combinaison de Kafka en tant que base de stockage de flux, de Flink en tant que moteur central de traitement en flux et de la prise en charge optimale des interfaces standard telles que SQL et REST, permet aux développeurs, aux analystes de données et aux data scientists de mettre facilement en place des pipelines de flux de données hybrides pour alimenter des produits de données en temps réel, des tableaux de bord, des applications de business intelligence, des microservices ou encore des notebooks dédiés à la data science.
En déplaçant les composants de traitement des données en amont, il est possible de répondre à de nombreux besoins : détection de la fraude, analyse des menaces sur les réseaux, fabrication intelligente, optimisation du commerce, approbation des prêts en temps réel, et plus encore.
Pipelines hybrides de flux de données optimisés par Cloudara Streaming

Cas d'utilisation de Cloudera Streaming
- Détection des fraudes
- Analyses client
- Surveillance du marché
- Analyse des journaux
Détection des fraudes
Évitez des millions d'euros de pertes en détectant la fraude financière en amont.
Dans les secteurs de la vente et des services financiers notamment, les entreprises luttent pour protéger les données de leurs clients et empêcher la fraude financière. La solution Cloudera Streaming permet de traiter les flux de transactions client en temps réel, d'identifier des tendances, de générer des alertes prédictives et de fournir des renseignements exploitables afin d'empêcher les fraudes éventuelles.
Analyses client
L'analyse des clients en temps réel améliore l'engagement, la fidélisation et la satisfaction
Toutes les entreprises ont besoin d'outils d'analyse en temps réel pour améliorer l'engagement des clients, mais éprouvent des difficultés à les mettre en œuvre en raison de la quantité excessive de données. Cloudera Streaming permet de traiter d'énormes quantités de données avec un temps de latence inférieur à la seconde tout en détectant les interactions client et en suggérant des offres plus intéressantes en temps réel.
Grande compagnie aérienne
Améliorer l'expérience client grâce à l'automatisation basée sur les données
Atteindre une réduction du volume des données de 50 % en ne payant que pour les flux de données à transmettre une seule fois.
Surveillance du marché
Traitez des millions de transactions par seconde, soit des pétaoctets d'informations financières.
Les places boursières éprouvent des difficultés à répondre à la demande des clients, qui exigent des rapports en temps réel et des services toujours plus rapides. Or, cela nécessite de traiter des pétaoctets de données. Cloudera Streams Messaging permet de diffuser facilement d'importants volumes de données afin que les places boursières puissent rapidement mettre en place des analyses de marché en temps réel et respecter des SLA de plus en plus exigeants.

Bourse de Bombay
La bourse la plus rapide du monde utilise des analyses en temps réel afin d'améliorer la gouvernance des données et les SLA du secteur
Réduction des coûts opérationnels de 95 %.
Analyse des journaux
Modernisez votre infrastructure de journalisation pour profiter des analyses en temps réel.
Les données de journalisation jouent un rôle de plus en plus important pour les entreprises. Mais les départements informatiques peinent à mettre en place des processus de collecte de journaux efficaces, à transmettre des informations pertinentes en amont et à générer des indicateurs clés. La solution Cloudera Streaming permet d'élargir le traitement des journaux, de fournir des informations en temps réel au sein de toute l'entreprise et de réduire considérablement les coûts d'exploitation.

Globe Telecom
Améliorer l'expérience numérique des utilisateurs mobiles grâce à un environnement d'analyse moderne
9 600 Po de données mobiles gérées
Fonctionnalités de Cloudera Streaming
-
Streaming Analytics optimisé par Apache Flink
-
Streams Messaging optimisé par Apache Kafka
Analyse de flux
Optimisé par Apache Flink avec SQL Stream Builder, Cloudera Streaming Analytics comprend :
- Un traitement des flux à faible temps de latence
- Un développement simplifié grâce à la possibilité de mettre au point des applications de flux avec les langages SQL et APIS standard via des points de terminaison REST
- Des techniques avancées de fenêtrage pour procéder à des analyses avancées orientées événements
- La prise en charge des modèles de cloud hybride et multicloud
Fonctionnalités clés
Streams Messaging
Optimisé par Apache Kafka, Cloudera Streams Messaging comprend :
- Streams Messaging Manager pour surveiller/exécuter les clusters
- Streams Replication Manager pour les déploiements haute disponibilité/de reprise après sinistre
- Schema Registry pour une gestion centralisée des schémas
- Kafka Connect pour faciliter le déplacement des données et la saisie des données de changement, et Cruise Control pour un rééquilibrage intelligent et une correction automatique
- La prise en charge des modèles de cloud hybride et multicloud
Fonctionnalités clés
N'importe quelles données, n'importe où, avec des options de déploiement flexibles.
Cloudera Streaming dans le cloud
Cloudera propose un ensemble complet de fonctionnalités intégrées de traitement des flux qui peuvent être déployées dans le cloud public pour s'adapter facilement.
Cloudera Streaming s'appuie sur les moteurs Apache Kafka et Apache Flink avec des outils professionnels pour simplifier le déploiement et la gestion.
Streams Messaging Manager étend Apache Kafka en proposant tout un ensemble de fonctionnalités : gouvernance et surveillance des schémas, reprise après sinistre, rééquilibrage intelligent, contrôle d'accès et audit.
SQL Stream Builder étend Apache Flink avec une puissante console SQL qui permet aux analystes SQL d'interroger les flux de données mais aussi de collaborer et de contrôler la logique de traitement des versions pour les applications en aval.
Cloudera Streaming sur site
Cloudera peut être déployé sur site avec des flux de données afin de contrôler les coûts et de minimiser les temps de latence pour les applications et les pipelines en temps réel. Cloudera Streaming intègre Apache Kafka et Apache Flink avec les outils professionnels nécessaires à la gestion de ces déploiements.
Cloudera Streaming – Opérateurs Kubernetes
Les fonctionnalités de Cloudera Streaming sont également disponibles en tant qu'opérateurs Kubernetes pouvant être déployés indépendamment via des clusters Kubernetes existants, ce qui facilite encore plus le déploiement et le dimensionnement de Kafka au sein de l'entreprise. L'opérateur Kubernetes est livré avec Kafka, Cruise Control et Zookeeper, permettant des cas d'utilisation de streaming sur Kubernetes avec un service de courtage de messages robuste, et Flink et SQL Stream Builder, fournissant un moteur de traitement de flux distribué moderne pour créer des applications de streaming en temps réel qui s'exécutent nativement sur des conteneurs.
Cloudera Streaming Community Edition
Cloudera Streaming Community Edition facilite le développement de processeurs de flux, et ce, directement depuis votre ordinateur de bureau ou tout autre nœud de développement.
Les analystes, les data scientists et les développeurs peuvent désormais évaluer les nouvelles fonctionnalités, développer localement des processeurs de flux en SQL, mais aussi des consommateurs/producteurs et des connecteurs Kafka, avant de passer en production.
Soyez opérationnel en 5 minutes grâce à Streaming Community Edition.
Pour aller plus loin
GigaOm Radar pour les plateformes de données en streaming
Cloudera nommé leader du marché des plateformes de streaming de données en 2024.
