Cloudera désignée leader dans The Forrester Wave™ : Plateformes de données, 4e trimestre 2025

Lire le rapport
  • Cloudera Cloudera
  • | Technique

    Apporter du contexte à GenAI avec les serveurs Cloudera MCP

    Navita Sood Headshot

    Il y a trois ans, les clients de Cloudera ont commencé à explorer l'IA générative pour transformer les interactions avec les données : créer des assistants intelligents, résumer des documents complexes et générer des informations à la demande. Aujourd’hui, nos clients gèrent plus de 25 exaoctets (soit 25 milliards de gigaoctets !) de données d’entreprise dans des environnements sur site et cloud.

    Le manque de contexte dans l'IA d'entreprise

    La manière dont les organisations gèrent leurs données est cruciale : à l'ère de l'IA, le contexte n'est pas seulement utile — c'est la différence entre des décisions précises et des hallucinations. Les modèles d'IA ont besoin d'un accès fluide aux données propriétaires pour générer des insights, répondre à des questions ou automatiser des flux de travail. Pourtant, dans la plupart des organisations, ces données restent fragmentées dans des magasins d'objets cloisonnés, des tables Iceberg, des flux Kafka et des bases de données opérationnelles. Les développeurs perdent un temps précieux à écrire des connecteurs personnalisés et à maintenir des pipelines fragiles—une taxe sur l'innovation qui ralentit le délai de rentabilisation.

    Présentation des serveurs Cloudera MCP : une passerelle universelle vers vos données

    C'est là que les serveurs Model Context Protocol (MCP) de Cloudera entrent en jeu. Nos serveurs sont construits sur MCP et offrent une passerelle universelle pour gérer les données de l'entreprise. MCP est un standard ouvert qui vise à standardiser l'intégration de l'IA de la même manière que Microsoft Open Database Connectivity (ODBC) a standardisé les bases de données relationnelles (plus d'informations sur MCP dans la section suivante).

    Pour soutenir cette mission, nous lançons Cloudera MCP Server pour Apache Iceberg via Impala. Apache Iceberg est l'épine dorsale des lacs modernes. Il propose une gestion à l'échelle du pétaoctet, la conformité ACID, le voyage dans le temps et une gouvernance granulaire. C'est le point de départ idéal pour combler le fossé entre les données et l'IA.

    En commençant par Apache Iceberg, nous relevons un défi essentiel : les applications d'IA ont besoin d'un accès gouverné et en temps réel aux données analytiques sans code personnalisé supplémentaire. Notre serveur MCP permet aux développeurs d'interroger des tables Iceberg en langage naturel, de les intégrer parfaitement à des frameworks, tels que CrewAI, Microsoft AutoGen, LangChain ou LangGraph, LlamaIndex, et à des boîtes à outils d'IA agentique qui fonctionnent avec ces frameworks, comme la boîte à outils NVIDIA Agent Intelligence (AIQ), tout en maintenant une sécurité robuste grâce aux politiques Cloudera SDX. Et ce n’est que le début : les futurs serveurs Cloudera MCP étendront la prise en charge des données en flux, des bases de données opérationnelles et des magasins de fichiers/objets.

    Évolution du produit Cloudera stream processing

    Figure 1 : Deux scénarios d'agents d'IA accédant aux données pour le contexte de l'IA :

    • À gauche : sans protocole commun, les agents d'intelligence artificielle doivent gérer plusieurs API uniques pour accéder au contexte de chaque source.
    • À droite : MCP unifie l'accès, permettant aux agents de récupérer le contexte via une interface unique, simplifiant l'intégration et améliorant l'évolutivité. 

    Les architectures agentiques nécessitent une couche d'intégration standard

    Alors que les organisations s'empressent d'adopter des architectures agentiques, il est plus important que jamais d'avoir une couche d'intégration cohérente. 

    « La frénésie autour de l'adoption d'architectures agentiques pousse les organisations à lancer de multiples initiatives en parallèle. Bien que cette dynamique soit encourageante, elle risque également de créer l'équivalent moderne du code spaghetti, un phénomène que nous avons déjà observé aux débuts du génie logiciel. Ce dont les entreprises ont véritablement besoin, c'est d'une architecture simplifiée et fondée sur des normes, qui assure l'interopérabilité entre les divers systèmes participant à l'écosystème agentique. Le MCP d'Anthropic s'impose comme un standard prometteur dans ce domaine, déjà largement adopté par les fournisseurs d'IA. »
    - Sanjeev Mohan, directeur de SanjMo et ancien analyste chez Gartner

    MCP n’est pas un outil propriétaire de Cloudera—c’est une norme largement adoptée qui évite le verrouillage par un fournisseur tout en exploitant un écosystème d’outils en pleine expansion. L'approche de Cloudera vis-à-vis des serveurs MCP s'aligne avec la philosophie de MCP d'ouverture, de simplicité et de contrôle. Les serveurs Cloudera MCP fonctionnent nativement au sein de la plateforme unifiée de Cloudera, éliminant les mouvements de données risqués et permettant un déploiement transparent à la fois dans les environnements multi-cloud et sur site.

    Un principe de l'IA privée : apporter le calcul de l'IA aux données

    Le pouvoir transformateur de l'IA dépend de la qualité des données qui l'alimentent. Lorsque les systèmes de données et d'IA fonctionnent de manière isolée, les informations déconnectées retardent les analyses, créent des pipelines fragiles et laissent les modèles sans le contexte nécessaire pour des décisions précises. 

    Cloudera associe les données et l'IA dans un cycle de vie cohérent. Les data flows circulent sans problème dans les workflows d'IA, régis par des métadonnées partagées, des politiques de sécurité et des ressources de calcul optimisées. Cette approche élimine la duplication et le déplacement coûteux des données tout en rendant chaque prédiction traçable jusqu'à son origine, garantissant ainsi la transparence, la confiance et la conformité.

    Passez à l'étape suivante

    Prêts à éliminer les frictions d'intégration ? Découvrez Cloudera MCP Server for Apache Iceberg ici— actuellement disponible en avant-première — et découvrez comment vous pouvez doter vos applications d'IA du contexte dont elles ont besoin, là où se trouvent vos données. Pour mettre ceci en pratique dès aujourd'hui, essayez notre essai gratuit de 5 jours.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.