Il y a trois ans, les clients de Cloudera ont commencé à explorer l'IA générative pour transformer les interactions avec les données : créer des assistants intelligents, résumer des documents complexes et générer des informations à la demande. Aujourd’hui, nos clients gèrent plus de 25 exaoctets (soit 25 milliards de gigaoctets !) de données d’entreprise dans des environnements sur site et cloud.
La manière dont les organisations gèrent leurs données est cruciale : à l'ère de l'IA, le contexte n'est pas seulement utile — c'est la différence entre des décisions précises et des hallucinations. Les modèles d'IA ont besoin d'un accès fluide aux données propriétaires pour générer des insights, répondre à des questions ou automatiser des flux de travail. Pourtant, dans la plupart des organisations, ces données restent fragmentées dans des magasins d'objets cloisonnés, des tables Iceberg, des flux Kafka et des bases de données opérationnelles. Les développeurs perdent un temps précieux à écrire des connecteurs personnalisés et à maintenir des pipelines fragiles—une taxe sur l'innovation qui ralentit le délai de rentabilisation.
C'est là que les serveurs Model Context Protocol (MCP) de Cloudera entrent en jeu. Nos serveurs sont construits sur MCP et offrent une passerelle universelle pour gérer les données de l'entreprise. MCP est un standard ouvert qui vise à standardiser l'intégration de l'IA de la même manière que Microsoft Open Database Connectivity (ODBC) a standardisé les bases de données relationnelles (plus d'informations sur MCP dans la section suivante).
Pour soutenir cette mission, nous lançons Cloudera MCP Server pour Apache Iceberg via Impala. Apache Iceberg est l'épine dorsale des lacs modernes. Il propose une gestion à l'échelle du pétaoctet, la conformité ACID, le voyage dans le temps et une gouvernance granulaire. C'est le point de départ idéal pour combler le fossé entre les données et l'IA.
En commençant par Apache Iceberg, nous relevons un défi essentiel : les applications d'IA ont besoin d'un accès gouverné et en temps réel aux données analytiques sans code personnalisé supplémentaire. Notre serveur MCP permet aux développeurs d'interroger des tables Iceberg en langage naturel, de les intégrer parfaitement à des frameworks, tels que CrewAI, Microsoft AutoGen, LangChain ou LangGraph, LlamaIndex, et à des boîtes à outils d'IA agentique qui fonctionnent avec ces frameworks, comme la boîte à outils NVIDIA Agent Intelligence (AIQ), tout en maintenant une sécurité robuste grâce aux politiques Cloudera SDX. Et ce n’est que le début : les futurs serveurs Cloudera MCP étendront la prise en charge des données en flux, des bases de données opérationnelles et des magasins de fichiers/objets.
Figure 1 : Deux scénarios d'agents d'IA accédant aux données pour le contexte de l'IA :
Alors que les organisations s'empressent d'adopter des architectures agentiques, il est plus important que jamais d'avoir une couche d'intégration cohérente.
« La frénésie autour de l'adoption d'architectures agentiques pousse les organisations à lancer de multiples initiatives en parallèle. Bien que cette dynamique soit encourageante, elle risque également de créer l'équivalent moderne du code spaghetti, un phénomène que nous avons déjà observé aux débuts du génie logiciel. Ce dont les entreprises ont véritablement besoin, c'est d'une architecture simplifiée et fondée sur des normes, qui assure l'interopérabilité entre les divers systèmes participant à l'écosystème agentique. Le MCP d'Anthropic s'impose comme un standard prometteur dans ce domaine, déjà largement adopté par les fournisseurs d'IA. »
- Sanjeev Mohan, directeur de SanjMo et ancien analyste chez Gartner
MCP n’est pas un outil propriétaire de Cloudera—c’est une norme largement adoptée qui évite le verrouillage par un fournisseur tout en exploitant un écosystème d’outils en pleine expansion. L'approche de Cloudera vis-à-vis des serveurs MCP s'aligne avec la philosophie de MCP d'ouverture, de simplicité et de contrôle. Les serveurs Cloudera MCP fonctionnent nativement au sein de la plateforme unifiée de Cloudera, éliminant les mouvements de données risqués et permettant un déploiement transparent à la fois dans les environnements multi-cloud et sur site.
Le pouvoir transformateur de l'IA dépend de la qualité des données qui l'alimentent. Lorsque les systèmes de données et d'IA fonctionnent de manière isolée, les informations déconnectées retardent les analyses, créent des pipelines fragiles et laissent les modèles sans le contexte nécessaire pour des décisions précises.
Cloudera associe les données et l'IA dans un cycle de vie cohérent. Les data flows circulent sans problème dans les workflows d'IA, régis par des métadonnées partagées, des politiques de sécurité et des ressources de calcul optimisées. Cette approche élimine la duplication et le déplacement coûteux des données tout en rendant chaque prédiction traçable jusqu'à son origine, garantissant ainsi la transparence, la confiance et la conformité.
Prêts à éliminer les frictions d'intégration ? Découvrez Cloudera MCP Server for Apache Iceberg ici— actuellement disponible en avant-première — et découvrez comment vous pouvez doter vos applications d'IA du contexte dont elles ont besoin, là où se trouvent vos données. Pour mettre ceci en pratique dès aujourd'hui, essayez notre essai gratuit de 5 jours.
This may have been caused by one of the following: