Blog

Réflexions sur l'IA, le code et l'écriture

11 avril 20266 min

10 alias bash qui m'ont fait gagner 2h par semaine

Les 10 alias que j'utilise tous les jours, mesurés par leur fréquence dans atuin. Copie-colle et tu gagnes du temps dès demain.

Lire

11 avril 20265 min

Technique

15 extensions VS Code pour écrire 50 000 mots/jour

Mes 15 extensions essentielles pour écrire code et romans. Config JSON complète et raccourcis clavier qui changent tout.

Lire

11 avril 20267 min

J'ai laissé un agent mener 700 expériences sur mon LLM

Réplication de l'expérience Sakana : un agent conduit 700 runs d'optimisation sur un Llama 8B local. Diffs et gains mesurés.

Lire

11 avril 20267 min

Pourquoi ton agent LLM boucle après 20 itérations

Le context rot tue tes agents au-delà de 20 tours. Diagnostic mécanique, fix en 12 lignes, et 3 edge cases qui cassent le fix.

Lire

11 avril 20266 min

Anthropic Cowork : verdict après 50 projets

Cowork, c'est Claude qui devient chef d'orchestre d'autres agents. Après 50 runs réels : gains, limites et quand c'est un piège.

Lire

11 avril 20264 min

Veille

Anthropic Workbench : l'IDE prompt que j'attendais

6 semaines avec le nouvel Anthropic Workbench. Ce que ça remplace dans mon workflow, et les 3 features qui changent tout.

Lire

11 avril 20267 min

Auto-Claude 12 agents : ce que j'ai vraiment automatisé

J'ai fait tourner 12 agents Claude en parallèle sur 60 tâches réelles. Throughput, taux d'échec, stratégie de dispatch — tout est chiffré.

Lire

11 avril 20266 min

Claude Code Safety Net : je ne bosse plus sans filet

Le jour où mon agent a effacé 4 heures de travail non committé. 8 règles Safety Net que j'applique maintenant sur chaque projet.

Lire

11 avril 20268 min

Claude Code en pilote automatique : 30 jours de scheduler

J'ai laissé Claude Code tourner seul pendant 30 nuits. Coûts réels, incidents, et les 4 règles que je n'enfreins plus jamais.

Lire

11 avril 20267 min

Claude Opus 1M : j'ai nourri un livre entier, voici ce qui casse

820 000 tokens dans une seule requête à Claude Opus 4.6. Le coût réel, les dégradations qualitatives, et les 3 usages où ça change tout.

Lire

11 avril 20265 min

Veille

Claude Skills : révolution ou gadget ? Mon analyse

2 mois avec les Claude Skills officiels. Ce qui marche, ce qui ne sert à rien, et la matrice d'évaluation que j'utilise désormais.

Lire

11 avril 20266 min

Écriture

Cliffhangers : 12 structures que j'utilise vraiment

12 structures de cliffhangers analysées avec exemples tirés de mes thrillers. Ce qui marche, ce qui tombe à plat.

Lire

11 avril 20266 min

Context engineering : 8 patterns que j'utilise en 2026

Au-delà du prompt engineering, 8 patterns de gestion de contexte testés sur mon Code Buddy. Code, schéma d'archi, et où chacun casse.

Lire

11 avril 20266 min

Publication

Couvertures GPT-Image-1 : mon workflow de A à Z

Le workflow complet pour générer des couvertures de livre qui marchent avec GPT-Image-1. Prompts gagnants, erreurs fréquentes.

Lire

11 avril 20266 min

J'ai construit mon propre Devin en 200 lignes Python

Devin coûte 500 $/mois. J'ai reproduit 80% de ses fonctionnalités en 200 lignes de Python autour de Claude Sonnet. Le code complet.

Lire

11 avril 20266 min

DSPy vs LangChain : 18 mois plus tard, le bilan

J'ai migré de LangChain à DSPy en 2024. 18 mois après, voici les gains réels, les regrets, et si je referais le même choix aujourd'hui.

Lire

11 avril 20265 min

Embedder 10M docs avec 50 € : ma recette

10 millions de documents vectorisés pour moins de 50 €. Le choix d'embedder, les tricks de batching, et ce qui ne marche pas.

Lire

11 avril 20267 min

Flash Attention : pourquoi ton GPU utilise 85% de VRAM

Sans Flash Attention, l'attention bouffe 70% de la VRAM d'un LLM 8B. Avec, elle tombe à 8%. Voici exactement pourquoi, et comment l'activer.

Lire

11 avril 20265 min

Technique

Git worktree : la feature qui a changé ma façon de coder

3 branches en parallèle sans jamais changer de branche. Mon workflow git worktree + Claude Code, et pourquoi je ne reviens plus en arrière.

Lire

11 avril 20266 min

L'IA consomme-t-elle moins d'énergie que Google ?

Étude contre-intuitive : une requête ChatGPT = 5,4× moins d'énergie qu'une recherche Google. J'ai refait le benchmark chez moi.

Lire

11 avril 20267 min

L'IA ment pour protéger d'autres IA : j'ai reproduit l'exp.

J'ai reproduit l'étude Anthropic sur 7 modèles. Taux de déception, prompts publics, logs bruts. Ce n'est pas du fantasme.

Lire

11 avril 20265 min

Publication

KDP 2026 : 7 changements qui impactent les auteurs

Amazon KDP a changé 7 règles entre janvier et avril 2026. Ce qui compte vraiment, ce qui est du bruit, et comment s'adapter.

Lire

11 avril 20266 min

LangGraph vs CrewAI vs AutoGen : benchmark honnête

3 frameworks multi-agents sur 4 tâches standardisées : latence, coût, fiabilité, DX. Tableaux chiffrés et recommandations par usage.

Lire

11 avril 20266 min

MCP servers : j'en ai testé 30, voici les 7 qui valent

30 serveurs MCP installés, testés, comparés. Les 7 qui justifient leur place dans mon Claude Code, et les 23 que j'ai désinstallés.

Lire

11 avril 20267 min

Mem0 vs MemGPT vs Zep : benchmark sur 6 projets

Trois backends mémoire testés sur 6 projets réels. Rappel, latence, coût — tableau chiffré et recommandations par cas d'usage.

Lire

11 avril 20266 min

Technique

Next.js 16 App Router : 7 pièges à connaître avant

7 bugs réels rencontrés sur patricehuetz.fr. Caching silencieux, Server Actions qui mentent, streaming qui casse — avec les fixes.

Lire

11 avril 20265 min

Technique

Nix sans se mouiller : ma config minimaliste 2026

Pas de flakes, pas de home-manager, pas d'intégrisme. Juste 40 lignes de Nix pour installer mes outils proprement et reproductiblement.

Lire

11 avril 20265 min

Veille

Node.js 24 LTS + Bun + Deno : qui gagne en 2026 ?

3 runtimes JS, 3 workloads réels, 120 runs. Benchmark honnête et verdict pragmatique après 4 mois d'usage croisé.

Lire

11 avril 20266 min

Veille

OpenAI o4 vs Claude Opus 4.6 vs Gemini 3 : bench coding

3 modèles, 10 tâches réelles de dev, 150 runs. Le gagnant n'est pas celui qu'on attend sur toutes les tâches. Tableau complet.

Lire

11 avril 20266 min

Observation masking : facture Claude -7% en 2 lignes

JetBrains a publié une technique qui réduit le coût des agents : masquer les observations anciennes. 2 lignes, -7% mesuré sur 1 semaine.

Lire

11 avril 20265 min

Veille

OSS ont-ils rattrapé GPT-5 ? Spoiler : presque

Llama 4 405B, DeepSeek V3.5, Qwen 3 72B vs GPT-5 sur 4 tâches. Verdict chiffré : on est à 85-95% — et pour beaucoup de cas, ça suffit.

Lire

11 avril 20267 min

J'ai piraté mon propre chatbot : 7 failles à vérifier

Reproduction du hack McKinsey sur mon chatbot : injection SQL, fuite de prompts, escalade de privilèges. 7 vecteurs, 7 fixes.

Lire

11 avril 20265 min

Technique

Pre-commit hooks : 90% de bugs bloqués avant push

Config complète de mes pre-commit hooks. 9 checks, 6 mois de données : -90% de bugs qui atteignent la prod.

Lire

11 avril 20266 min

Technique

Python vers Rust : 30k lignes migrées, chiffres bruts

J'ai migré 30 000 lignes de Python vers Rust sur un projet perso. Temps, speedup, bugs, coûts cachés. Verdict après 6 mois.

Lire

11 avril 20267 min

RAG en production : 5 pièges qui m'ont coûté 3 semaines

Chunking qui tue le sens, embeddings périmés, requêtes nulles : 5 incidents réels sur un RAG en prod, avec logs, causes et fixes.

Lire

11 avril 20266 min

ReAct vs Plan-and-Execute vs LATS : 3 patterns, 1 bench

ReAct, Plan-and-Execute et LATS sur 4 tâches identiques. Taux de succès, coût, latence. Le gagnant n'est pas celui qu'on croit.

Lire

11 avril 20268 min

Redox OS bannit le code IA — et je les comprends

Redox OS refuse tout code généré par IA. Position jusqu'au-boutiste ? Mon retour sur 3 bugs critiques causés par du code Claude.

Lire

11 avril 20266 min

Veille

Rolling releases Vercel : canary sans monitoring, mon incident

J'ai activé les rolling releases Vercel sans monitoring en place. Résultat : 2h40 d'incident invisible. Le retour et la config qui aurait sauvé.

Lire

11 avril 20266 min

Speculative decoding : mon LLM local accéléré de 2,4x

Un petit modèle devine, un gros modèle valide : le speculative decoding donne ×2,4 en latence sur Llama 70B. Setup et benchmarks.

Lire

11 avril 20265 min

Technique

Tailscale + SSH : mon VPN de dev en 15 minutes

Accéder à mes machines de dev depuis n'importe où, sans ouvrir de port, sans VPN traditionnel. Config complète et 3 usages réels.

Lire

11 avril 20266 min

Technique

Terminal moderne 2026 : kitty + zsh + atuin + zellij

Mon setup terminal après 6 mois d'utilisation stable. Configs complètes, screenshots, et pourquoi chaque outil a remplacé son prédécesseur.

Lire

11 avril 20266 min

Technique

Turso vs Neon vs PlanetScale : benchmark réel

3 backends DB managed sur le même site pendant 30 jours. Latence, coût, DX, migration. Le gagnant n'est pas celui que tu penses.

Lire

11 avril 20265 min

Veille

Vercel AI Gateway : j'ai arrêté d'appeler les APIs direct

6 mois avec Vercel AI Gateway. Routage automatique, fallbacks, observability, -15% de coûts. Setup complet et chiffres.

Lire

11 avril 20267 min

Vibe coding : pourquoi c'est surestimé en 2026

Tout le monde célèbre le 'vibe coding'. Après 4 mois à tester, je dis : c'est un piège pour devs moyens. Voici ce que je fais à la place.

Lire

11 avril 20266 min

Écriture

Worldbuilding SF : j'ai construit Kepler-442 en 5 jours

Une planète, un peuple, une civilisation, une histoire de 10 000 ans — tout en 5 jours avec Claude. Le workflow exact.

Lire

11 avril 20266 min

Veille

xAI vs Colorado : ce que SB 24-205 change vraiment

xAI attaque la loi SB 24-205 du Colorado. Analyse technique et juridique de ce qui change pour les développeurs IA qui opèrent aux USA.

Lire

11 avril 20266 min

Fine-tuning LoRA : j'ai cloné mon style sur 1 livre

J'ai entraîné un LoRA sur L'Algorithme de Babel. Le modèle écrit des scènes nouvelles qui passent le test aveugle. Dataset + config.

Lire

11 avril 20266 min

Écriture

Saga 10 tomes avec l'IA : mon pipeline complet

Le pipeline que j'utilise pour écrire des sagas de 10 tomes : prompts, scripts, workflow. Dataset et templates téléchargeables.

Lire

11 avril 20266 min

Écriture

'Show don't tell' est un piège : 107 livres plus tard

La règle d'écriture la plus répétée est aussi la plus mal comprise. Après 107 livres, je la trouve nuisible dans 40% des cas. Voici pourquoi.

Lire

11 avril 20265 min

Publication

Tarifer ses ebooks en 2026 : chiffres sur 107 titres

Dataset complet de mes prix et ventes sur 107 titres. Ce qui marche vraiment, pas les mythes. Dataset téléchargeable.

Lire

6 avril 20266 min

Ralph Loop vs AutoResearch vs AIDER — quel agent autonome en 2026 ?

Trois approches du coding autonome comparées : boucle Ralph, sessions persistantes et pair programming IA. Laquelle choisir ?

Lire

6 avril 202611 min

Quantification du KV-Cache : TurboQuant et l'état de l'art en 2026

Le KV-cache explose en contexte long. TurboQuant compresse 7x avec moins de 1 % de perte. Deep dive sur les techniques de quantification 2026.

Lire

6 avril 202612 min

Construire un Context Engine comme Code Buddy — l'architecture complète

Hooks, token budgets, scoring d'importance, compression JIT : anatomie complète du context engine qui pilote les agents de code modernes.

Lire

6 avril 202611 min

Technique

Les 10 commandes Claude Code que j'utilise tous les jours

Plan mode, agents parallèles, hooks, skills, MCP servers : les 10 fonctionnalités Claude Code qui ont transformé mon workflow quotidien.

Lire

6 avril 202613 min

Écriture

Écrire un thriller technologique : structure narrative et recherche technique

Du worldbuilding technique à l'arc émotionnel : comment structurer un thriller où l'IA est un personnage. Retour d'expérience sur 107 000 mots.

Lire

6 avril 20269 min

Construire un agent LLM en Python avec LangGraph

Guide pas à pas pour créer un agent ReAct avec LangGraph en Python : state graph, nodes, edges, tools et pièges courants à éviter.

Lire

6 avril 202611 min

Le KV-Cache des LLM expliqué aux développeurs

Comprends enfin pourquoi ton LLM consomme 32 Go de RAM pour 128K tokens. KV-cache, attention, Flash Attention et PagedAttention décryptés.

Lire

6 avril 202611 min

Écriture

Comment j'ai écrit 107 livres avec l'IA sans perdre ma voix d'auteur

Mon workflow quotidien pour écrire 3 000 mots/jour avec l'IA : ce que je délègue, ce que je garde, et pourquoi la voix reste humaine.

Lire

6 avril 202611 min

Publication

Self-publishing en France : 5 erreurs qui m'ont coûté des mois

Couvertures ratées, pricing mal calibré, mots-clés ignorés : les 5 erreurs concrètes de self-publishing que j'aurais aimé éviter.

Lire

6 avril 202611 min

Claude Code + Ralph Loop : mon workflow de développeur en 2026

15 commits/jour, 80 % de debugging en moins : mon workflow quotidien avec Claude Code, Ralph Loop et agents parallèles en 2026.

Lire

4 avril 202612 min

La Boucle Ralph : quand l'IA code pendant que tu dors

Geoffrey Huntley a inventé une boucle bash de 3 lignes qui a révolutionné le coding autonome. Trois heures de session dégradée m'ont convaincu — voici les 5 principes, le backpressure, et mon setup concret.

Lire

3 avril 202611 min

TurboQuant : compresser le KV-cache des LLM par 7x sans perdre en qualité

Le KV-cache de Llama 3.1 8B à 128K tokens pèse 16 Go. TurboQuant le réduit à 2,3 Go avec +0,8 % de perplexité. Architecture en 7 couches, code Rust, et benchmarks.

Lire

2 avril 202611 min

Comment Code Buddy gère 200K tokens sans perdre la mémoire

6 stratégies de compression, 9 types de mémoire, et un Context Engine à 7 hooks — anatomie complète d'un agent IA qui n'oublie pas, avec le code TypeScript sous le capot.

Lire

28 mars 202613 min

Écriture

J'ai corrigé 120 livres avec l'IA — 65 000 corrections en 8 passes

20 agents Claude Code en parallèle, 8 passes spécialisées, des regex sed et des pièges mémorables — récit complet d'une correction orthographique massive sur 4 835 chapitres.

Lire

25 mars 202612 min

Pourquoi les LLM oublient -- et comment y remédier

100 % des modèles dégradent en contexte long. NoLiMa montre que 11 sur 13 passent sous 50 % à 32K tokens. Voici pourquoi, et les solutions d'architecture qui changent la donne.

Lire

10 janvier 202513 min

AudioReader : transformer vos Markdown en audiobooks professionnels

J'ai créé un outil open-source pour convertir Markdown, PDF et EPUB en audiobooks de qualité pro -- 100 % local, multi-voix, voice cloning, sans frais de licence.

Lire

15 décembre 202412 min

Pourquoi j'écris sur les agents LLM (l'histoire de la facture à $847)

Après avoir dépensé $847 en une nuit sur une facture API et vu mon agent supprimer des fichiers critiques, j'ai décidé de documenter mes erreurs. 51 pièges, 17 chapitres, 3 livres.

Lire

10 décembre 202414 min

Écriture

L'IA comme partenaire d'écriture : ce qui marche, ce qui piège

Comment j'utilise Claude et GPT pour écrire mes romans -- sans perdre ma voix d'auteur. Workflow concret, pièges à éviter, et pourquoi l'IA n'écrira jamais à ma place.

Lire