Les équipes des sciences de la vie travaillent avec plus de données, de modèles et de contrôles réglementaires que jamais auparavant. Et une grande partie de ces données — omics, imagerie, dossiers médicaux électroniques, protocoles d’essai, preuves réelles, et plus encore — est stockée dans des formats non structurés difficiles à rechercher et à gérer.
L’IA a le potentiel de redéfinir ce qui est possible dans les sciences de la vie, transformant d’immenses réserves déconnectées de données biologiques et cliniques en une intelligence exploitable qui accélère la découverte, affine la prise de décision et, en fin de compte, aide à apporter plus rapidement des innovations vitales aux patients. Mais d’abord, les organisations doivent prouver que les décisions pilotées par l’IA sont explicables, stables et conformes.
Dans cet environnement, les preuves de concept (POC) ponctuelles ne suffisent pas. Pour atteindre un niveau acceptable de gouvernance et de confiance dans les analyses pilotées par l'IA, les organisations des sciences de la vie doivent combiner une base de données et de calcul fiable avec une couche d'intelligence capable d'orchestrer des modèles et des flux de travail à grande échelle.
Cloudera et Salt AI s'associent pour offrir une combinaison de référence puissante aux équipes des sciences de la vie.
Cloudera propose une plateforme ouverte de data lakehouse et d'IA d'entreprise qui intègre les données en flux, l'ingénierie des données, l'entreposage des données et le ML/GenAI à grande échelle avec une couche unifiée de sécurité et de gouvernance grâce à SDX. Ce cadre propose des contrôles d'accès aux données basés sur les attributs, la traçabilité ainsi que l'enrichissement et le catalogage actifs des métadonnées.
Salt AI exploite ces mécanismes fondamentaux de sécurité et ajoute une couche d’orchestration pour les modèles et les données d’intelligence artificielle (IA). L'infrastructure évolutive capture continuellement le contexte — invites, invites système, conceptions de flux de travail, performances d'exécution, rôles utilisateurs et sources de données — permettant des cas d'utilisation complexes qui tirent pleinement parti des modèles d'intelligence artificielle (IA) spécialisés et généraux. Les appels d'outils pour les opérations agentiques peuvent être facilement lancés via l'assistant txt2 de Salt, et les pipelines prennent vie visuellement dans le canevas, illustrant exactement comment les données circulent.
Ce partenariat permet aux organisations des sciences de la vie d'appliquer des contrôles granulaires dans les environnements sur site, dans le cloud public et dans le cloud hybride ; d'utiliser n'importe quel modèle approprié à une tâche donnée ; et d'obtenir un enregistrement auditable et visuel de la façon dont les systèmes d'IA prennent des décisions.
En outre, Cloudera et Salt AI améliorent l'efficacité computationnelle et opérationnelle tout au long du cycle de vie des données. En s'appuyant sur les frameworks d'accélération GPU, Cloudera offre des améliorations sur les charges de travail d'ingénierie de données et d'inférence LLM allant jusqu'à 20x et 36x, respectivement. De même, Salt AI offre des optimisations telles qu'une architecture split-compute qui équilibre les processus CPU et GPU, un système de cache sophistiqué et la possibilité d'échanger, de mélanger et de combiner des modèles d'IA dans des flux de travail. Plus le pipeline est complexe et plus il est exécuté, plus les efficacités de calcul sont importantes lors de l'exécution sur Salt.
La solution d'intelligence artificielle de Cloudera et Salt est explicitement conçue pour fonctionner parfaitement au sein de l'écosystème de clouds, de plateformes de données et d'outils d'IA existant pour chaque client. Il peut être déployé dans le cloud privé virtuel (VPC) d'un client, sans sortie publique, et s'intègre à un large éventail de fournisseurs de modèles, de magasins de vecteurs et de systèmes de données.
Le lac de données ouvertes de Cloudera, construit sur Apache Iceberg, propose un format de table flexible et performant qui combine des analyses multifonctions et des capacités de gestion automatisée des données (par exemple : évolution des schémas et des partitions). Cette approche permet de normaliser les flux de travail de l'ingénierie des caractéristiques à travers des sources de données disparates et diverses, facilitant ainsi la conformité GxP dans le domaine des sciences de la vie.
De plus, le catalogue REST Cloudera Iceberg permet le partage de données avec d’autres plateformes de données cloud publiques (par exemple : Databricks, Snowflake) qui prennent en charge les tables Apache Iceberg. Salt AI propose un mécanisme qui transforme les requêtes textuelles en flux de travail de R&D orchestrant les LLM, les bases de données graphiques, les outils de modélisation et les systèmes internes. De plus, il permet aux chercheurs de convertir du code (par exemple, des scripts Python) en flux de travail visuels, améliorant ainsi la collaboration interfonctionnelle entre les équipes de recherche. Ces capacités accélèrent les cycles d’innovation en démocratisant les initiatives de recherche cloisonnées et en automatisant l’intégration de systèmes complexes sans l’effort laborieux nécessaire pour construire une logique d’intégration et d’orchestration personnalisée.
Pour les organisations qui standardisent sur Cloudera, ce partenariat offre une voie rapide : des données gouvernées combinées à une orchestration contextuelle, prêtes pour des cas d'utilisation tels que la conception de molécules, la réaffectation de médicaments, la médecine translationnelle, la rédaction de protocoles et les assistants aux affaires médicales. Pour d'autres, il sert de plan pour associer les plateformes de données existantes à une couche d'orchestration de l'IA axée sur le contexte.
Figure 1. Comment le partenariat entre Cloudera et Salt AI accélère l'innovation dans les sciences de la vie
En matière de déploiements en entreprise, la combinaison de Cloudera et de Salt AI a permis aux organisations d'atteindre une envergure sans précédent, avec un débit de milliers de tâches d'ingénierie des données par heure, un prototypage plus rapide de flux de travail complexes de R & D et des améliorations progressives des performances et des coûts pour les charges de travail de Machine learning comme AlphaFold2. Par exemple, Salt AI a obtenu des temps de traitement 22 fois plus rapides que les benchmarks précédents pour AlphaFold2. Tout aussi important, ces gains s'accompagnent d'une télémétrie complète, d'une héritage de gouvernance et d'une piste d'audit claire pour chaque exécution de workflow. En fin de compte, les équipes peuvent se concentrer sur les résultats scientifiques et non sur l'intégration des données existantes et des solutions technologiques.
Salt AI continuera d’investir dans l’interopérabilité avec un large écosystème de clouds, de plateformes de données et de modèles tout en collaborant avec des partenaires comme Cloudera pour publier des schémas concrets que les industries régulées pourront adopter et adapter. Pour les équipes des sciences de la vie, cela signifie plus de choix et des exemples plus clairs pour transformer les expériences d'IA en systèmes durables et fiables. En savoir plus sur les capacités de Cloudera et la plateforme Salt AI.
This may have been caused by one of the following: