ClouderaNOW Découvrez les agents d'IA, le cloud bursting et les data fabrics pour l'IA | 8 avril

S'inscrire

18 mars 2026 | Partenaires

Cloudera Agent Studio et NVIDIA apportent des agents de nouvelle génération à l'IA d'entreprise

10 minute de lecture • par Charu Anchlia , Suryakant Bhardwaj , et Pamela Pan

AI Enterprise Ai

Les agents autonomes agissent pour atteindre des objectifs complexes sans nécessiter de directives humaines à chaque étape. Dans les environnements d'entreprise, le déploiement de ces agents introduit un ensemble de défis plus exigeants : ils doivent naviguer dans des systèmes de données hétérogènes ; satisfaire aux exigences en matière de conformité, d'audit et de souveraineté des données ; et conserver toutes les données dans le périmètre opérationnel de l'organisation.

Les agents à long horizon représentent une nouvelle classe d'IA autonome, dépassant les tâches uniques pour atteindre des objectifs à travers des dizaines de décisions séquentielles, exécutant des flux de travail pendant des heures ou des jours tout en maintenant le contexte. À l'échelle de l'entreprise, chacun de ces défis est amplifié.

Une architecture conçue pour les agents d'IA d'entreprise

Cloudera a conçu Cloudera Agent Studio (faisant partie de Cloudera AI Studios) en collaboration avec NVIDIA pour répondre précisément à ces défis.

NVIDIA Nemotron fournit la base du modèle : il est spécialement conçu pour l'IA agentique et les besoins d'inférence à haut débit des flux de travail à horizon long.

Cloudera Agent Studio fournit la couche d’orchestration qui s’appuie sur cette base à travers quatre piliers architecturaux : la planification dynamique en plusieurs étapes, la collaboration multi-agents transparente, l’ingénierie du contexte pour la précision et l’exécution en mode bac à sable. Chaque pilier répond à une exigence spécifique qui apparaît lorsque des agents autonomes opèrent à l'échelle de l'entreprise.

Figure 1 : Cloudera Agent Studio orchestre des flux de travail autonomes grâce à une planification itérative en plusieurs étapes, une collaboration multi-agents avec des outils et des compétences, une ingénierie de contexte basée sur les artefacts, et une exécution en sandbox — construit sur la base du service de modèles avec Cloudera AI Inference, alimenté par NVIDIA NIM, et les modèles Nemotron pour l'IA agentique.

La Fondation : déploiement de modèles privés avec NVIDIA Nemotron

L'IA d'entreprise commence par la gouvernance des données. Les invites, les données propriétaires et les sorties des modèles doivent rester dans le périmètre opérationnel de l'organisation, en respectant les exigences de conformité sans compromis architectural. C'est l'exigence fondamentale de l'IA privée : la pile d'inférence complète fonctionne au sein de l'entreprise, et non en dehors de celle-ci.

Le service d’inférence IA Cloudera, propulsé par les microservices NIM de NVIDIA, permet un modèle haute performance et évolutif fonctionnant directement dans l’environnement d’entreprise, conservant les instructions, données et sorties à l’intérieur du périmètre de sécurité. Accéléré par la pile IA de NVIDIA, comprenant les GPU Blackwell et Dynamo-Triton, le service prend en charge une large gamme de modèles, dont la famille de modèles Nemotron de NVIDIA pour l'IA autonome avec un raisonnement avancé, l'utilisation d'outils et des flux de travail à long terme. Cette fondation permet aux organisations de construire et d'exécuter des agents d'IA d'entreprise directement sur leurs données, de manière sécurisée et à grande échelle.

Les quatre piliers de Cloudera Agent Studio

1. Planification dynamique, itérative et en plusieurs étapes

Les environnements de données d'entreprise ne sont pas toujours « propres ». Les déploiements réels impliquent des dizaines de bases de données avec des schémas incohérents, une documentation clairsemée et aucun cheminement garanti pour passer d'une question métier à la bonne source de données. L'agent doit construire ce cheminement à l'exécution.

L'orchestrateur d'Agent Studio considère l'exploration comme une partie intégrante de l'exécution. Il décompose les demandes complexes en plans en plusieurs étapes, les exécute de manière itérative et s'auto-évalue après chaque étape avant de s'engager sur une voie. Cette boucle de planification auto-correctrice rend les agents fiables dans des environnements qu'ils n'ont jamais rencontrés et soutient des flux de travail à long terme à travers de nombreuses étapes séquentielles.

2. Collaboration multi-agents : ré-utilisabilité et transparence

Les flux de travail d'entreprise complexes s'étendent sur plusieurs domaines, chacun nécessitant des stratégies de raisonnement distinctes et des outils spécialisés. Un seul agent qui essaie de les couvrir tous ne peut être optimisé pour aucun d'entre eux, et plus son champ d'action est large, plus il devient difficile de comprendre et de contrôler le comportement des agents.

Agent Studio est construit autour d'agents spécialisés, chacun dans un domaine spécifique et équipé des outils appropriés, coordonné par un orchestrateur qui sait déléguer. Ce qui rend cette collaboration transparente et réutilisable, c'est la manière dont les agents communiquent : chaque agent écrit des résultats structurés dans un contexte de projet partagé, et les agents suivants consomment ces résultats comme des entrées explicites et inspectables. La chaîne complète de raisonnement est traçable à chaque étape, offrant la vérifiabilité dont les entreprises ont besoin et la ré-utilisabilité pour s'appuyer sur les travaux antérieurs au fil des exécutions.

3. Ingénierie du contexte : précision, rapidité et coûts

À l'échelle de l'entreprise, il n'est pas possible de transmettre des données brutes directement au modèle. Les fenêtres de contexte sont finies, et à mesure que le contexte non structuré croît, la précision diminue bien avant que la limite de la fenêtre ne soit atteinte.

Agent Studio traite la fenêtre de contexte comme un instrument de précision : à chaque étape, seules les informations pertinentes pour la tâche spécifique de cet agent atteignent le modèle. Cette conception axée sur les artefacts réduit la consommation de jetons, le coût de l'inférence et la latence, tout en améliorant la précision. Cette combinaison est ce qui rend les flux de travail à long terme réalisables à l'échelle de l'entreprise.

4. Exécution en environnement isolé

Ce qui rend les agents autonomes vraiment puissants, c'est leur capacité à générer de manière dynamique des outils, des compétences et du code exécutable en fonction des flux de travail, des fonctionnalités qu'Agent Studio prend en charge de manière native. Mais sans isolation, le code et les outils générés par les agents et exécutés directement sur les systèmes d'entreprise présentent un risque inacceptable.

Nous avons conçu la couche d'exécution d'Agent Studio autour de l'isolation par défaut. Tout le code et l'exécution des outils générés par l'agent s'exécutent dans un environnement d'exécution isolé sans accès aux systèmes en dehors de leur portée définie. Les agents démarrent avec zéro autorisation, et chaque action est soumise à des règles au niveau de la couche d’infrastructure, et non dans le processus de l’agent lui-même. Cela donne aux industries réglementées l'auditabilité dont elles ont besoin, sans restreindre ce que les agents peuvent faire.

Témoignage client : L'IA agentique transforme l'analyse des données à l'échelle du pétaoctet

Cloudera gère plus de 30 exaoctets de données structurées à travers sa base de clients, faisant de l'analyse de données structurées un domaine où cette architecture a un impact immédiat. Une grande entreprise de médias et de divertissement l'a déployé pour offrir aux utilisateurs professionnels et aux analystes une interface en langage naturel avec leurs données opérationnelles. Leur patrimoine de données s'étendait sur des pétaoctets à travers des dizaines de bases de données, souvent avec des métadonnées conflictuelles et une documentation clairsemée.

Cloudera Agent Studio a orchestré des agents spécialisés soutenus par NVIDIA Nemotron qui fonctionnaient sur le réseau privé du client. La question analytique d'un utilisateur métier a déclenché une boucle de planification itérative : l'orchestrateur a exploré le patrimoine de données, navigué dans l'ambiguïté de schéma et identifié les bonnes sources de données de manière autonome. Lorsque l'analyse nécessitait des calculs statistiques au-delà de ce que SQL pouvait exprimer, l'orchestrateur a délégué à l'agent d'exécution de code approprié. Les sorties intermédiaires ont été écrites en tant qu'artefacts et transmises à travers le workflow à long horizon. Tout le code généré a été exécuté dans un environnement sandbox, tout en conservant une piste d'audit complète.

Les flux de travail qui nécessitaient auparavant l’intervention successive d’un ingénieur en données, d’un développeur et d’un analyste sont désormais accessibles à tout utilisateur professionnel. Les sorties des agents, y compris les commandes SQL, le code généré et les visualisations, étaient consignées dans un contexte de projet partagé, inspectable et auditable. Ces artefacts étaient également exportables comme pipelines de production. Comme le code généré par les agents est déterministe même si les modèles sous-jacents ne le sont pas, ces pipelines sont fiables et reproductibles sans ingénierie supplémentaire.

L’architecture comme avantage concurrentiel

Chaque pilier de cette architecture repose sur celui qui le précède. Une couche d'inférence privée constitue la base, prenant en charge les volumes d'appels et la fiabilité que requièrent les flux de travail à long terme. La planification itérative permet aux agents de naviguer dans des environnements qu'ils n'ont jamais vus. La collaboration multi-agents apporte une précision de domaine au raisonnement en plusieurs étapes. La gestion du contexte basée sur les artefacts améliore la précision tout en réduisant le coût d'inférence et la latence. L'exécution en sandbox garantit que les agents opèrent en toute sécurité dans des limites définies, avec chaque action gouvernée et auditable.

Cloudera et NVIDIA donnent vie à cette architecture grâce à Cloudera Agent Studio, Cloudera AI Inference optimisé par NVIDIA NIM et la famille de modèles NVIDIA Nemotron. Ensemble, ils jettent les bases de l'orchestration et du raisonnement agentique nécessaires pour gérer les agents d'IA des entreprises directement sur les données de l'entreprise, en toute sécurité, en privé et à grande échelle.

Pour en savoir plus, découvrez Cloudera Agent Studio en action.

Charu Anchlia

Principal Engineer II - ML

Plus d'articles de cet auteur ›

Suryakant Bhardwaj

Senior Software Engineer

Plus d'articles de cet auteur ›

Pamela Pan

Product Marketing Analyst

Plus d'articles de cet auteur ›

En relation

28 mai 2026 | Business

Maîtriser la souveraineté des données : l'avantage concurrentiel ultime

8 minute de lecture • Jessica Espinoza

Vous êtes prêt(e) à vous lancer ?

Your form submission has failed.

This may have been caused by one of the following:

Your request timed out
A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.