Guardrails pour agents IA : toutes les sources du problème
Les agents IA ont une surface d'attaque fondamentalement différente des chatbots. Tour d'horizon complet des menaces — de la prompt injection indirecte à la supply chain des tools.
Bienvenue. Ce blog est un espace de réflexion technique sur les agents IA, le DevOps et l'architecture logicielle moderne. Les articles sont rédigés en français et en anglais.
Deux articles d'Anthropic et OpenAI publiés à quelques semaines d'intervalle convergent sur le même concept : le harness. Ce qu'il faut en retenir.
Les agents IA ont une surface d'attaque fondamentalement différente des chatbots. Tour d'horizon complet des menaces — de la prompt injection indirecte à la supply chain des tools.
Comment donner à un agent IA tous les outils pour exécuter, analyser et voir ton application — et devenir vraiment autonome dans la détection et correction d'erreurs.
Un deep dive dans le review-manager de opencode-team-lead — sélection des reviewers, isolation des contextes, arbitrage des désaccords, et production d'un verdict structuré sans jamais lire une ligne de code.
Sur des tâches longues, un agent all-in-one se perd et s'auto-review avec les mêmes biais que ceux qui ont produit le code. J'ai construit opencode-team-lead pour résoudre ces deux problèmes avec un pattern de délégation stricte.
SHA256 comme KDF, pas de sel, pas de versioning — les pièges classiques du chiffrement maison en Go, et comment cryptio y répond avec Argon2id.