Vue d'ensemble
La flexibilité d'un lac de données et les performances d'un entrepôt de données sur une plateforme unique.
Avec un data lakehouse ouvert, les organisations peuvent exécuter des analyses rapides sur toutes les données, structurées ou non, à grande échelle. Il remédie au cloisonnement des données et permet aux équipes de collaborer sur les mêmes données avec les outils de leur choix, sur n'importe quel cloud public ou privé.
Cette architecture de données moderne assure la fiabilité des données et la simplicité de leur gestion. Exécutez des analyses de BI, d'IA, de ML et de streaming sur les mêmes données sans les déplacer ni les verrouiller.

Cloudera offre le seul data lakehouse ouvert au monde doté des avantages suivants :
Architecture ouverte
Le data lakehouse de Cloudera, optimisé par Apache Iceberg, est 100 % open source, basé sur des normes ouvertes, et jouit d'une large adoption par la communauté. Il peut stocker plusieurs formats de données et permet à plusieurs moteurs de travailler sur les mêmes données.
Facilité d'adoption
En intégrant Iceberg directement dans Shared Data Experience (SDX), Cloudera offre le moyen le plus simple de déployer un lakehouse. Des fonctionnalités supplémentaires, telles que l'évolution des schémas, la partition cachée et plus encore, simplifient la gestion des données pour les ensembles de données volumineux.
Multicloud
Mettez en place un data lakehouse n'importe où, que ce soit sur un cloud public ou dans votre propre datacentre. Créez des applications une fois et exécutez-les n'importe où sans aucun problème. Cloudera offre les mêmes services de données et une portabilité totale sur tous les clouds.
Sécurisé et gouverné
Les tables Iceberg de Cloudera s'intègrent dans SDX, ce qui vous permet d'analyser vos données en toute sécurité, et d'unifier les politiques, la gouvernance, la traçabilité et la gestion des métadonnées sur plusieurs clouds.
Le data lakehouse ouvert de Cloudera est désormais disponible dans le cloud privé. Plus d'informations
Utiliser l'IA via un data lakehouse de bout en bout pour améliorer l'efficacité du cycle de vie des données
Composants clés
Boostez vos données avec un lakehouse ouvert
Analyses multifonctions
Cloudera fournit une gamme complète de services de données pour exécuter des analyses d'IA, de ML, de BI et de streaming, en procédant à l'ingénierie des données de votre data lakehouse. De l'ingestion au streaming, en passant par le traitement et la persistance, l'orchestration, la découverte et l'accès, les services de données puissants et évolutifs fournissent des fonctions analytiques clés. Vous pouvez également y intégrer les outils de votre choix.
Format Open Table, Apache Iceberg
Apache Iceberg est la pierre angulaire du lakehouse ouvert. Il s'agit d'un format de table ouvert haute performance pour les grandes tables analytiques qui associe la fiabilité des tables SQL au Big Data, tout en permettant à plusieurs moteurs de calcul de fonctionner simultanément. Il offre de riches fonctionnalités telles que le voyage dans le temps, l'isolation des snapshots, l'évolution des schémas, la partition caché, etc.
Expérience des données partagées (SDX)
Élément fondamental de Cloudera, SDX fournit des technologies unifiées de sécurité et de gouvernance basées sur les métadonnées. En permettant une gestion complète des données et des analyses sur toutes les infrastructures du monde entier, SDX réduit les risques et les coûts opérationnels. Les services informatiques peuvent alors déployer plus rapidement des data lakehouses entièrement sécurisés et contrôlés.
Catalogue de données robuste
Recherchez, triez et balisez vos données dans toutes les infrastructures et générez des analyses pertinentes avec Cloudera Data Catalog :
- Comprendre, documenter et surveiller les données et leur utilisation
- Respecter la réglementation et les normes en vigueur pour les données pertinentes
- Appliquer des mesures de protection vis-à-vis des données organisationnelles et techniques
- Collaborer et partager des données de manière responsable grâce à une visibilité totale
Client
Le data lakehouse aide le détaillant mondial NEW YORKER à anticiper les besoins des clients pour une meilleure expérience en magasin.




Ressources
Apprenez-en plus sur la gestion des données en tout lieu
GigaOm Radar consacré aux lacs de données et data lakehouses
Cloudera nommé parmi les leaders du marché des data lakehouses en 2024.