Dans l’épisode 65 de The AI Forecast, « La responsabilité du Vibecoding : comment une IA non contrôlée peut tuer le RSI du cloud », David Linthicum rejoint l’animateur Paul Muller pour révéler les coûts cachés des environnements hybrides et multi-cloud et expliquer pourquoi la gouvernance et la résilience du cloud sont devenues des priorités dans les conseils d’administration.
Alors que des pannes cloud très médiatisées révèlent des dépendances cachées et des points uniques de défaillance, les responsables informatiques doivent repenser la résilience, la gestion des données et la responsabilité dans les environnements cloud hybrides.
Voici ce qui est ressorti de la conversation entre Paul et David :
Paul : résilience est un mot étrange parce que je pense que les gens associent souvent résilience à fiabilité, et il y a une énorme différence, n’est-ce pas ?
David : Il y en a une, effectivement. Je veux dire, la résilience est votre capacité à ne pas laisser ces désastres arrêter votre traitement et votre activité. En d'autres termes, quels sont les plans A, B et C ? Quel sera le degré de résilience et de tolérance aux pannes ? La fiabilité concerne essentiellement un composant : dans quelle mesure il se maintiendra et, s'il tombe en panne, comment s'en remettre. La résilience est de votre responsabilité, pas la fiabilité. Généralement, si c'est avec un fournisseur de cloud, c'est leur responsabilité, mais vous serez quand même affecté. Vous allez payer la facture. Vous n'obtiendrez aucun crédit de ces fournisseurs de cloud lorsqu'ils tombent en panne.
Paul: La résilience est un artefact architectural, pas une conséquence d'un composant, n'est-ce pas ? C'est comment vous concevez votre système. Cela remonte à cette architecture d'entreprise.
David : Tout est architecture, et cela concerne les couches applicatives et d'entreprise. Vous devez construire et planifier pour la résilience. Cela ne se produira pas automatiquement, et ce n’est pas contenu dans le cloud. C'est là que les gens ont été surpris. Ils pensaient être totalement résilients face à tous leurs problèmes, mais maintenant ils se rendent compte qu'ils sont faillibles, comme tout le monde. Une partie de la construction d'un système d'IA, d'une architecture d'entreprise ou de tout type de planification architecturale concerne la résilience. C'est aussi important, sinon plus important, que la sécurité, la gouvernance et les autres éléments que nous devons prendre en compte. Il doit être rendu opérationnel pour que vous puissiez réellement prouver, avec des métriques, que cela n'arrêtera pas le traitement de l'entreprise si le pire se produit. Et vous devez essentiellement dépenser de l'argent et du temps pour le découvrir.
Si vous manquez de résilience, vous ne pourrez pas vous remettre de ce genre de choses.
Paul : Beaucoup de gens parlent de clouds hybrides, mais il semble, à certains égards, qu'il s'agisse d'une combinaison des meilleurs et des pires attributs des mondes sur site et dans le cloud. Comment instaurer une responsabilisation et une observabilité claires dans ce qui sera finalement un monde hybride ?
David : Si vous construisez des solutions hybrides et multi-cloud, vous devez gérer la complexité inhérente à ces solutions, et la résilience sera un plan de contrôle commun qui les traverse. Les gens pensent : « Eh bien, je vais construire cette chose de manière hybride où je pourrai basculer vers mes systèmes sur site, ou même vers un autre cloud. » C'est tout à fait correct et cela fonctionne, mais cela vous coûtera de l'argent. Je pense que la capacité à comprendre ces coûts et ces ressources, et à savoir comment les gérer, devient le principal point de discorde.
Le multi-cloud est excellent car vous pouvez utiliser la meilleure technologie pour construire des systèmes plus efficaces, mais la résilience et la fiabilité seront des enjeux dans ces architectures. Je dis toujours que l'on peut avoir de la résilience et de l'efficacité, mais que l'on ne peut pas avoir les deux. Nous devons soit construire une architecture pour la résilience, soit nous devrons gérer des pannes trois ou quatre fois par an qui coûteront des milliards à l’entreprise.
Paul : En ce qui concerne les pannes catastrophiques, les dépassements de coûts et les responsabilités complexes, il n’est pas surprenant que de nombreuses entreprises envisagent de rapatrier des charges de travail. Quel est l’état des lieux et quels sont certains des défis auxquels les gens sont confrontés lorsqu’ils tentent de ramener certaines de ces charges de travail sur site ?
David : Le plus important serait le coût de l'opération. Il y a deux couches. Premièrement, vous avez déjà dépensé environ un demi-million de dollars en applications et en migration vers le cloud, et il vous faudrait maintenant dépenser une somme similaire pour tout remettre en place. Deuxièmement, vous devriez vous adresser au conseil de direction pour expliquer cette décision et la voie à suivre. C'est une conversation difficile, car cela implique de reconnaître que le passage au cloud, qui devait initialement être plus rentable et plus fiable, ne s'est pas déroulé comme prévu. Quelqu'un devra expliquer que, par conséquent, l'organisation doit revenir à un environnement dans lequel elle a davantage de contrôle sur le matériel.
Généralement, se tourner vers les fournisseurs de colocation et les fournisseurs de services d'infogérance est beaucoup plus efficace, mais ils sont ébranlés par le coût du cloud. Et maintenant qu'ils examinent les charges de travail de l'IA, ils essaient d'opérer cette transition encore plus rapidement parce qu'ils ne peuvent pas se permettre d'utiliser le cloud. Même si le cloud est la solution la plus facile pour l'IA, c'est la voie qui présente le moins de résistance pour créer ces systèmes. Vous obtenez tout un écosystème prêt à fonctionner à la demande, mais c'est trop coûteux pour la plupart des entreprises. Si nous y retournons pour des raisons économiques, nous devons mettre en place des ressources pour nous assurer que nous le faisons de manière efficace.
Paul : Combien d'autres développeurs, dans combien d'entreprises, ont lancé un petit projet secondaire dans une application de codage « vibe » qui a généré, vous savez, d'incroyables charges de travail de calcul ou de stockage, entraînant des dépassements de coûts ?
David : Vous codez en indiquant au système d'IA votre interprétation et ce qu'il doit coder. Et le problème, c'est qu'il n'en comprend pas les nuances. Il ne comprend pas comment gérer les gains d'efficacité et vous finissez par dépenser plus d'argent. Ce genre de choses, comme le codage vibratoire, c'est amusant d'y penser, mais le fait est que nous devons exercer un contrôle humain sur ces éléments. Et plus je vois ces systèmes de codage se répandre, et vous savez que la plupart de mes clients les essaient, ils échouent parce qu'ils ne parviennent pas à atteindre l'efficacité dont ils ont besoin.
Suivez la conversation complète avec David Linthicum sur The AI Forecast sur Spotify, Apple Podcasts et YouTube.
This may have been caused by one of the following: