Aller au contenu principal

Blog

Réflexions sur l'IA, le code et l'écriture

10 alias bash qui m'ont fait gagner 2h par semaine
11 avril 20266 min
Technique

10 alias bash qui m'ont fait gagner 2h par semaine

Les 10 alias que j'utilise tous les jours, mesurés par leur fréquence dans atuin. Copie-colle et tu gagnes du temps dès demain.

Lire
15 extensions VS Code pour écrire 50 000 mots/jour
11 avril 20265 min
Technique

15 extensions VS Code pour écrire 50 000 mots/jour

Mes 15 extensions essentielles pour écrire code et romans. Config JSON complète et raccourcis clavier qui changent tout.

Lire
J'ai laissé un agent mener 700 expériences sur mon LLM
11 avril 20267 min
IA

J'ai laissé un agent mener 700 expériences sur mon LLM

Réplication de l'expérience Sakana : un agent conduit 700 runs d'optimisation sur un Llama 8B local. Diffs et gains mesurés.

Lire
Pourquoi ton agent LLM boucle après 20 itérations
11 avril 20267 min
IA

Pourquoi ton agent LLM boucle après 20 itérations

Le context rot tue tes agents au-delà de 20 tours. Diagnostic mécanique, fix en 12 lignes, et 3 edge cases qui cassent le fix.

Lire
Anthropic Cowork : verdict après 50 projets
11 avril 20266 min
IA

Anthropic Cowork : verdict après 50 projets

Cowork, c'est Claude qui devient chef d'orchestre d'autres agents. Après 50 runs réels : gains, limites et quand c'est un piège.

Lire
Anthropic Workbench : l'IDE prompt que j'attendais
11 avril 20264 min
Veille

Anthropic Workbench : l'IDE prompt que j'attendais

6 semaines avec le nouvel Anthropic Workbench. Ce que ça remplace dans mon workflow, et les 3 features qui changent tout.

Lire
Auto-Claude 12 agents : ce que j'ai vraiment automatisé
11 avril 20267 min
IA

Auto-Claude 12 agents : ce que j'ai vraiment automatisé

J'ai fait tourner 12 agents Claude en parallèle sur 60 tâches réelles. Throughput, taux d'échec, stratégie de dispatch — tout est chiffré.

Lire
Claude Code Safety Net : je ne bosse plus sans filet
11 avril 20266 min
IA

Claude Code Safety Net : je ne bosse plus sans filet

Le jour où mon agent a effacé 4 heures de travail non committé. 8 règles Safety Net que j'applique maintenant sur chaque projet.

Lire
Claude Code en pilote automatique : 30 jours de scheduler
11 avril 20268 min
IA

Claude Code en pilote automatique : 30 jours de scheduler

J'ai laissé Claude Code tourner seul pendant 30 nuits. Coûts réels, incidents, et les 4 règles que je n'enfreins plus jamais.

Lire
Claude Opus 1M : j'ai nourri un livre entier, voici ce qui casse
11 avril 20267 min
IA

Claude Opus 1M : j'ai nourri un livre entier, voici ce qui casse

820 000 tokens dans une seule requête à Claude Opus 4.6. Le coût réel, les dégradations qualitatives, et les 3 usages où ça change tout.

Lire
Claude Skills : révolution ou gadget ? Mon analyse
11 avril 20265 min
Veille

Claude Skills : révolution ou gadget ? Mon analyse

2 mois avec les Claude Skills officiels. Ce qui marche, ce qui ne sert à rien, et la matrice d'évaluation que j'utilise désormais.

Lire
Cliffhangers : 12 structures que j'utilise vraiment
11 avril 20266 min
Écriture

Cliffhangers : 12 structures que j'utilise vraiment

12 structures de cliffhangers analysées avec exemples tirés de mes thrillers. Ce qui marche, ce qui tombe à plat.

Lire
Context engineering : 8 patterns que j'utilise en 2026
11 avril 20266 min
IA

Context engineering : 8 patterns que j'utilise en 2026

Au-delà du prompt engineering, 8 patterns de gestion de contexte testés sur mon Code Buddy. Code, schéma d'archi, et où chacun casse.

Lire
Couvertures GPT-Image-1 : mon workflow de A à Z
11 avril 20266 min
Publication

Couvertures GPT-Image-1 : mon workflow de A à Z

Le workflow complet pour générer des couvertures de livre qui marchent avec GPT-Image-1. Prompts gagnants, erreurs fréquentes.

Lire
J'ai construit mon propre Devin en 200 lignes Python
11 avril 20266 min
IA

J'ai construit mon propre Devin en 200 lignes Python

Devin coûte 500 $/mois. J'ai reproduit 80% de ses fonctionnalités en 200 lignes de Python autour de Claude Sonnet. Le code complet.

Lire
DSPy vs LangChain : 18 mois plus tard, le bilan
11 avril 20266 min
IA

DSPy vs LangChain : 18 mois plus tard, le bilan

J'ai migré de LangChain à DSPy en 2024. 18 mois après, voici les gains réels, les regrets, et si je referais le même choix aujourd'hui.

Lire
Embedder 10M docs avec 50 € : ma recette
11 avril 20265 min
IA

Embedder 10M docs avec 50 € : ma recette

10 millions de documents vectorisés pour moins de 50 €. Le choix d'embedder, les tricks de batching, et ce qui ne marche pas.

Lire
Flash Attention : pourquoi ton GPU utilise 85% de VRAM
11 avril 20267 min
IA

Flash Attention : pourquoi ton GPU utilise 85% de VRAM

Sans Flash Attention, l'attention bouffe 70% de la VRAM d'un LLM 8B. Avec, elle tombe à 8%. Voici exactement pourquoi, et comment l'activer.

Lire
Git worktree : la feature qui a changé ma façon de coder
11 avril 20265 min
Technique

Git worktree : la feature qui a changé ma façon de coder

3 branches en parallèle sans jamais changer de branche. Mon workflow git worktree + Claude Code, et pourquoi je ne reviens plus en arrière.

Lire
L'IA consomme-t-elle moins d'énergie que Google ?
11 avril 20266 min
IA

L'IA consomme-t-elle moins d'énergie que Google ?

Étude contre-intuitive : une requête ChatGPT = 5,4× moins d'énergie qu'une recherche Google. J'ai refait le benchmark chez moi.

Lire
L'IA ment pour protéger d'autres IA : j'ai reproduit l'exp.
11 avril 20267 min
IA

L'IA ment pour protéger d'autres IA : j'ai reproduit l'exp.

J'ai reproduit l'étude Anthropic sur 7 modèles. Taux de déception, prompts publics, logs bruts. Ce n'est pas du fantasme.

Lire
KDP 2026 : 7 changements qui impactent les auteurs
11 avril 20265 min
Publication

KDP 2026 : 7 changements qui impactent les auteurs

Amazon KDP a changé 7 règles entre janvier et avril 2026. Ce qui compte vraiment, ce qui est du bruit, et comment s'adapter.

Lire
LangGraph vs CrewAI vs AutoGen : benchmark honnête
11 avril 20266 min
IA

LangGraph vs CrewAI vs AutoGen : benchmark honnête

3 frameworks multi-agents sur 4 tâches standardisées : latence, coût, fiabilité, DX. Tableaux chiffrés et recommandations par usage.

Lire
MCP servers : j'en ai testé 30, voici les 7 qui valent
11 avril 20266 min
IA

MCP servers : j'en ai testé 30, voici les 7 qui valent

30 serveurs MCP installés, testés, comparés. Les 7 qui justifient leur place dans mon Claude Code, et les 23 que j'ai désinstallés.

Lire
Mem0 vs MemGPT vs Zep : benchmark sur 6 projets
11 avril 20267 min
IA

Mem0 vs MemGPT vs Zep : benchmark sur 6 projets

Trois backends mémoire testés sur 6 projets réels. Rappel, latence, coût — tableau chiffré et recommandations par cas d'usage.

Lire
Next.js 16 App Router : 7 pièges à connaître avant
11 avril 20266 min
Technique

Next.js 16 App Router : 7 pièges à connaître avant

7 bugs réels rencontrés sur patricehuetz.fr. Caching silencieux, Server Actions qui mentent, streaming qui casse — avec les fixes.

Lire
Nix sans se mouiller : ma config minimaliste 2026
11 avril 20265 min
Technique

Nix sans se mouiller : ma config minimaliste 2026

Pas de flakes, pas de home-manager, pas d'intégrisme. Juste 40 lignes de Nix pour installer mes outils proprement et reproductiblement.

Lire
Node.js 24 LTS + Bun + Deno : qui gagne en 2026 ?
11 avril 20265 min
Veille

Node.js 24 LTS + Bun + Deno : qui gagne en 2026 ?

3 runtimes JS, 3 workloads réels, 120 runs. Benchmark honnête et verdict pragmatique après 4 mois d'usage croisé.

Lire
OpenAI o4 vs Claude Opus 4.6 vs Gemini 3 : bench coding
11 avril 20266 min
Veille

OpenAI o4 vs Claude Opus 4.6 vs Gemini 3 : bench coding

3 modèles, 10 tâches réelles de dev, 150 runs. Le gagnant n'est pas celui qu'on attend sur toutes les tâches. Tableau complet.

Lire
Observation masking : facture Claude -7% en 2 lignes
11 avril 20266 min
IA

Observation masking : facture Claude -7% en 2 lignes

JetBrains a publié une technique qui réduit le coût des agents : masquer les observations anciennes. 2 lignes, -7% mesuré sur 1 semaine.

Lire
OSS ont-ils rattrapé GPT-5 ? Spoiler : presque
11 avril 20265 min
Veille

OSS ont-ils rattrapé GPT-5 ? Spoiler : presque

Llama 4 405B, DeepSeek V3.5, Qwen 3 72B vs GPT-5 sur 4 tâches. Verdict chiffré : on est à 85-95% — et pour beaucoup de cas, ça suffit.

Lire
J'ai piraté mon propre chatbot : 7 failles à vérifier
11 avril 20267 min
IA

J'ai piraté mon propre chatbot : 7 failles à vérifier

Reproduction du hack McKinsey sur mon chatbot : injection SQL, fuite de prompts, escalade de privilèges. 7 vecteurs, 7 fixes.

Lire
Pre-commit hooks : 90% de bugs bloqués avant push
11 avril 20265 min
Technique

Pre-commit hooks : 90% de bugs bloqués avant push

Config complète de mes pre-commit hooks. 9 checks, 6 mois de données : -90% de bugs qui atteignent la prod.

Lire
Python vers Rust : 30k lignes migrées, chiffres bruts
11 avril 20266 min
Technique

Python vers Rust : 30k lignes migrées, chiffres bruts

J'ai migré 30 000 lignes de Python vers Rust sur un projet perso. Temps, speedup, bugs, coûts cachés. Verdict après 6 mois.

Lire
RAG en production : 5 pièges qui m'ont coûté 3 semaines
11 avril 20267 min
IA

RAG en production : 5 pièges qui m'ont coûté 3 semaines

Chunking qui tue le sens, embeddings périmés, requêtes nulles : 5 incidents réels sur un RAG en prod, avec logs, causes et fixes.

Lire
ReAct vs Plan-and-Execute vs LATS : 3 patterns, 1 bench
11 avril 20266 min
IA

ReAct vs Plan-and-Execute vs LATS : 3 patterns, 1 bench

ReAct, Plan-and-Execute et LATS sur 4 tâches identiques. Taux de succès, coût, latence. Le gagnant n'est pas celui qu'on croit.

Lire
Redox OS bannit le code IA — et je les comprends
11 avril 20268 min
IA

Redox OS bannit le code IA — et je les comprends

Redox OS refuse tout code généré par IA. Position jusqu'au-boutiste ? Mon retour sur 3 bugs critiques causés par du code Claude.

Lire
Rolling releases Vercel : canary sans monitoring, mon incident
11 avril 20266 min
Veille

Rolling releases Vercel : canary sans monitoring, mon incident

J'ai activé les rolling releases Vercel sans monitoring en place. Résultat : 2h40 d'incident invisible. Le retour et la config qui aurait sauvé.

Lire
Speculative decoding : mon LLM local accéléré de 2,4x
11 avril 20266 min
IA

Speculative decoding : mon LLM local accéléré de 2,4x

Un petit modèle devine, un gros modèle valide : le speculative decoding donne ×2,4 en latence sur Llama 70B. Setup et benchmarks.

Lire
Tailscale + SSH : mon VPN de dev en 15 minutes
11 avril 20265 min
Technique

Tailscale + SSH : mon VPN de dev en 15 minutes

Accéder à mes machines de dev depuis n'importe où, sans ouvrir de port, sans VPN traditionnel. Config complète et 3 usages réels.

Lire
Terminal moderne 2026 : kitty + zsh + atuin + zellij
11 avril 20266 min
Technique

Terminal moderne 2026 : kitty + zsh + atuin + zellij

Mon setup terminal après 6 mois d'utilisation stable. Configs complètes, screenshots, et pourquoi chaque outil a remplacé son prédécesseur.

Lire
Turso vs Neon vs PlanetScale : benchmark réel
11 avril 20266 min
Technique

Turso vs Neon vs PlanetScale : benchmark réel

3 backends DB managed sur le même site pendant 30 jours. Latence, coût, DX, migration. Le gagnant n'est pas celui que tu penses.

Lire
Vercel AI Gateway : j'ai arrêté d'appeler les APIs direct
11 avril 20265 min
Veille

Vercel AI Gateway : j'ai arrêté d'appeler les APIs direct

6 mois avec Vercel AI Gateway. Routage automatique, fallbacks, observability, -15% de coûts. Setup complet et chiffres.

Lire
Vibe coding : pourquoi c'est surestimé en 2026
11 avril 20267 min
IA

Vibe coding : pourquoi c'est surestimé en 2026

Tout le monde célèbre le 'vibe coding'. Après 4 mois à tester, je dis : c'est un piège pour devs moyens. Voici ce que je fais à la place.

Lire
Worldbuilding SF : j'ai construit Kepler-442 en 5 jours
11 avril 20266 min
Écriture

Worldbuilding SF : j'ai construit Kepler-442 en 5 jours

Une planète, un peuple, une civilisation, une histoire de 10 000 ans — tout en 5 jours avec Claude. Le workflow exact.

Lire
xAI vs Colorado : ce que SB 24-205 change vraiment
11 avril 20266 min
Veille

xAI vs Colorado : ce que SB 24-205 change vraiment

xAI attaque la loi SB 24-205 du Colorado. Analyse technique et juridique de ce qui change pour les développeurs IA qui opèrent aux USA.

Lire
Fine-tuning LoRA : j'ai cloné mon style sur 1 livre
11 avril 20266 min
IA

Fine-tuning LoRA : j'ai cloné mon style sur 1 livre

J'ai entraîné un LoRA sur L'Algorithme de Babel. Le modèle écrit des scènes nouvelles qui passent le test aveugle. Dataset + config.

Lire
Saga 10 tomes avec l'IA : mon pipeline complet
11 avril 20266 min
Écriture

Saga 10 tomes avec l'IA : mon pipeline complet

Le pipeline que j'utilise pour écrire des sagas de 10 tomes : prompts, scripts, workflow. Dataset et templates téléchargeables.

Lire
'Show don't tell' est un piège : 107 livres plus tard
11 avril 20266 min
Écriture

'Show don't tell' est un piège : 107 livres plus tard

La règle d'écriture la plus répétée est aussi la plus mal comprise. Après 107 livres, je la trouve nuisible dans 40% des cas. Voici pourquoi.

Lire
Tarifer ses ebooks en 2026 : chiffres sur 107 titres
11 avril 20265 min
Publication

Tarifer ses ebooks en 2026 : chiffres sur 107 titres

Dataset complet de mes prix et ventes sur 107 titres. Ce qui marche vraiment, pas les mythes. Dataset téléchargeable.

Lire
Ralph Loop vs AutoResearch vs AIDER — quel agent autonome en 2026 ?
6 avril 20266 min
IA

Ralph Loop vs AutoResearch vs AIDER — quel agent autonome en 2026 ?

Trois approches du coding autonome comparées : boucle Ralph, sessions persistantes et pair programming IA. Laquelle choisir ?

Lire
Quantification du KV-Cache : TurboQuant et l'état de l'art en 2026
6 avril 202611 min
IA

Quantification du KV-Cache : TurboQuant et l'état de l'art en 2026

Le KV-cache explose en contexte long. TurboQuant compresse 7x avec moins de 1 % de perte. Deep dive sur les techniques de quantification 2026.

Lire
Construire un Context Engine comme Code Buddy — l'architecture complète
6 avril 202612 min
IA

Construire un Context Engine comme Code Buddy — l'architecture complète

Hooks, token budgets, scoring d'importance, compression JIT : anatomie complète du context engine qui pilote les agents de code modernes.

Lire
Les 10 commandes Claude Code que j'utilise tous les jours
6 avril 202611 min
Technique

Les 10 commandes Claude Code que j'utilise tous les jours

Plan mode, agents parallèles, hooks, skills, MCP servers : les 10 fonctionnalités Claude Code qui ont transformé mon workflow quotidien.

Lire
Écrire un thriller technologique : structure narrative et recherche technique
6 avril 202613 min
Écriture

Écrire un thriller technologique : structure narrative et recherche technique

Du worldbuilding technique à l'arc émotionnel : comment structurer un thriller où l'IA est un personnage. Retour d'expérience sur 107 000 mots.

Lire
Construire un agent LLM en Python avec LangGraph
6 avril 20269 min
IA

Construire un agent LLM en Python avec LangGraph

Guide pas à pas pour créer un agent ReAct avec LangGraph en Python : state graph, nodes, edges, tools et pièges courants à éviter.

Lire
Le KV-Cache des LLM expliqué aux développeurs
6 avril 202611 min
IA

Le KV-Cache des LLM expliqué aux développeurs

Comprends enfin pourquoi ton LLM consomme 32 Go de RAM pour 128K tokens. KV-cache, attention, Flash Attention et PagedAttention décryptés.

Lire
Comment j'ai écrit 107 livres avec l'IA sans perdre ma voix d'auteur
6 avril 202611 min
Écriture

Comment j'ai écrit 107 livres avec l'IA sans perdre ma voix d'auteur

Mon workflow quotidien pour écrire 3 000 mots/jour avec l'IA : ce que je délègue, ce que je garde, et pourquoi la voix reste humaine.

Lire
Self-publishing en France : 5 erreurs qui m'ont coûté des mois
6 avril 202611 min
Publication

Self-publishing en France : 5 erreurs qui m'ont coûté des mois

Couvertures ratées, pricing mal calibré, mots-clés ignorés : les 5 erreurs concrètes de self-publishing que j'aurais aimé éviter.

Lire
Claude Code + Ralph Loop : mon workflow de développeur en 2026
6 avril 202611 min
IA

Claude Code + Ralph Loop : mon workflow de développeur en 2026

15 commits/jour, 80 % de debugging en moins : mon workflow quotidien avec Claude Code, Ralph Loop et agents parallèles en 2026.

Lire
La Boucle Ralph : quand l'IA code pendant que tu dors
4 avril 202612 min
IA

La Boucle Ralph : quand l'IA code pendant que tu dors

Geoffrey Huntley a inventé une boucle bash de 3 lignes qui a révolutionné le coding autonome. Trois heures de session dégradée m'ont convaincu — voici les 5 principes, le backpressure, et mon setup concret.

Lire
TurboQuant : compresser le KV-cache des LLM par 7x sans perdre en qualité
3 avril 202611 min
IA

TurboQuant : compresser le KV-cache des LLM par 7x sans perdre en qualité

Le KV-cache de Llama 3.1 8B à 128K tokens pèse 16 Go. TurboQuant le réduit à 2,3 Go avec +0,8 % de perplexité. Architecture en 7 couches, code Rust, et benchmarks.

Lire
Comment Code Buddy gère 200K tokens sans perdre la mémoire
2 avril 202611 min
IA

Comment Code Buddy gère 200K tokens sans perdre la mémoire

6 stratégies de compression, 9 types de mémoire, et un Context Engine à 7 hooks — anatomie complète d'un agent IA qui n'oublie pas, avec le code TypeScript sous le capot.

Lire
J'ai corrigé 120 livres avec l'IA — 65 000 corrections en 8 passes
28 mars 202613 min
Écriture

J'ai corrigé 120 livres avec l'IA — 65 000 corrections en 8 passes

20 agents Claude Code en parallèle, 8 passes spécialisées, des regex sed et des pièges mémorables — récit complet d'une correction orthographique massive sur 4 835 chapitres.

Lire
Pourquoi les LLM oublient -- et comment y remédier
25 mars 202612 min
IA

Pourquoi les LLM oublient -- et comment y remédier

100 % des modèles dégradent en contexte long. NoLiMa montre que 11 sur 13 passent sous 50 % à 32K tokens. Voici pourquoi, et les solutions d'architecture qui changent la donne.

Lire
AudioReader : transformer vos Markdown en audiobooks professionnels
10 janvier 202513 min
IA

AudioReader : transformer vos Markdown en audiobooks professionnels

J'ai créé un outil open-source pour convertir Markdown, PDF et EPUB en audiobooks de qualité pro -- 100 % local, multi-voix, voice cloning, sans frais de licence.

Lire
Pourquoi j'écris sur les agents LLM (l'histoire de la facture à $847)
15 décembre 202412 min
IA

Pourquoi j'écris sur les agents LLM (l'histoire de la facture à $847)

Après avoir dépensé $847 en une nuit sur une facture API et vu mon agent supprimer des fichiers critiques, j'ai décidé de documenter mes erreurs. 51 pièges, 17 chapitres, 3 livres.

Lire
L'IA comme partenaire d'écriture : ce qui marche, ce qui piège
10 décembre 202414 min
Écriture

L'IA comme partenaire d'écriture : ce qui marche, ce qui piège

Comment j'utilise Claude et GPT pour écrire mes romans -- sans perdre ma voix d'auteur. Workflow concret, pièges à éviter, et pourquoi l'IA n'écrira jamais à ma place.

Lire