10 alias bash qui m'ont fait gagner 2h par semaine
Les 10 alias que j'utilise tous les jours, mesurés par leur fréquence dans atuin. Copie-colle et tu gagnes du temps dès demain.
LireRéflexions sur l'IA, le code et l'écriture
Les 10 alias que j'utilise tous les jours, mesurés par leur fréquence dans atuin. Copie-colle et tu gagnes du temps dès demain.
LireMes 15 extensions essentielles pour écrire code et romans. Config JSON complète et raccourcis clavier qui changent tout.
LireRéplication de l'expérience Sakana : un agent conduit 700 runs d'optimisation sur un Llama 8B local. Diffs et gains mesurés.
LireLe context rot tue tes agents au-delà de 20 tours. Diagnostic mécanique, fix en 12 lignes, et 3 edge cases qui cassent le fix.
LireCowork, c'est Claude qui devient chef d'orchestre d'autres agents. Après 50 runs réels : gains, limites et quand c'est un piège.
Lire6 semaines avec le nouvel Anthropic Workbench. Ce que ça remplace dans mon workflow, et les 3 features qui changent tout.
LireJ'ai fait tourner 12 agents Claude en parallèle sur 60 tâches réelles. Throughput, taux d'échec, stratégie de dispatch — tout est chiffré.
LireLe jour où mon agent a effacé 4 heures de travail non committé. 8 règles Safety Net que j'applique maintenant sur chaque projet.
LireJ'ai laissé Claude Code tourner seul pendant 30 nuits. Coûts réels, incidents, et les 4 règles que je n'enfreins plus jamais.
Lire820 000 tokens dans une seule requête à Claude Opus 4.6. Le coût réel, les dégradations qualitatives, et les 3 usages où ça change tout.
Lire2 mois avec les Claude Skills officiels. Ce qui marche, ce qui ne sert à rien, et la matrice d'évaluation que j'utilise désormais.
Lire12 structures de cliffhangers analysées avec exemples tirés de mes thrillers. Ce qui marche, ce qui tombe à plat.
LireAu-delà du prompt engineering, 8 patterns de gestion de contexte testés sur mon Code Buddy. Code, schéma d'archi, et où chacun casse.
LireLe workflow complet pour générer des couvertures de livre qui marchent avec GPT-Image-1. Prompts gagnants, erreurs fréquentes.
LireDevin coûte 500 $/mois. J'ai reproduit 80% de ses fonctionnalités en 200 lignes de Python autour de Claude Sonnet. Le code complet.
LireJ'ai migré de LangChain à DSPy en 2024. 18 mois après, voici les gains réels, les regrets, et si je referais le même choix aujourd'hui.
Lire10 millions de documents vectorisés pour moins de 50 €. Le choix d'embedder, les tricks de batching, et ce qui ne marche pas.
LireSans Flash Attention, l'attention bouffe 70% de la VRAM d'un LLM 8B. Avec, elle tombe à 8%. Voici exactement pourquoi, et comment l'activer.
Lire3 branches en parallèle sans jamais changer de branche. Mon workflow git worktree + Claude Code, et pourquoi je ne reviens plus en arrière.
LireÉtude contre-intuitive : une requête ChatGPT = 5,4× moins d'énergie qu'une recherche Google. J'ai refait le benchmark chez moi.
LireJ'ai reproduit l'étude Anthropic sur 7 modèles. Taux de déception, prompts publics, logs bruts. Ce n'est pas du fantasme.
LireAmazon KDP a changé 7 règles entre janvier et avril 2026. Ce qui compte vraiment, ce qui est du bruit, et comment s'adapter.
Lire3 frameworks multi-agents sur 4 tâches standardisées : latence, coût, fiabilité, DX. Tableaux chiffrés et recommandations par usage.
Lire30 serveurs MCP installés, testés, comparés. Les 7 qui justifient leur place dans mon Claude Code, et les 23 que j'ai désinstallés.
LireTrois backends mémoire testés sur 6 projets réels. Rappel, latence, coût — tableau chiffré et recommandations par cas d'usage.
Lire7 bugs réels rencontrés sur patricehuetz.fr. Caching silencieux, Server Actions qui mentent, streaming qui casse — avec les fixes.
LirePas de flakes, pas de home-manager, pas d'intégrisme. Juste 40 lignes de Nix pour installer mes outils proprement et reproductiblement.
Lire3 runtimes JS, 3 workloads réels, 120 runs. Benchmark honnête et verdict pragmatique après 4 mois d'usage croisé.
Lire3 modèles, 10 tâches réelles de dev, 150 runs. Le gagnant n'est pas celui qu'on attend sur toutes les tâches. Tableau complet.
LireJetBrains a publié une technique qui réduit le coût des agents : masquer les observations anciennes. 2 lignes, -7% mesuré sur 1 semaine.
LireLlama 4 405B, DeepSeek V3.5, Qwen 3 72B vs GPT-5 sur 4 tâches. Verdict chiffré : on est à 85-95% — et pour beaucoup de cas, ça suffit.
LireReproduction du hack McKinsey sur mon chatbot : injection SQL, fuite de prompts, escalade de privilèges. 7 vecteurs, 7 fixes.
LireConfig complète de mes pre-commit hooks. 9 checks, 6 mois de données : -90% de bugs qui atteignent la prod.
LireJ'ai migré 30 000 lignes de Python vers Rust sur un projet perso. Temps, speedup, bugs, coûts cachés. Verdict après 6 mois.
LireChunking qui tue le sens, embeddings périmés, requêtes nulles : 5 incidents réels sur un RAG en prod, avec logs, causes et fixes.
LireReAct, Plan-and-Execute et LATS sur 4 tâches identiques. Taux de succès, coût, latence. Le gagnant n'est pas celui qu'on croit.
LireRedox OS refuse tout code généré par IA. Position jusqu'au-boutiste ? Mon retour sur 3 bugs critiques causés par du code Claude.
LireJ'ai activé les rolling releases Vercel sans monitoring en place. Résultat : 2h40 d'incident invisible. Le retour et la config qui aurait sauvé.
LireUn petit modèle devine, un gros modèle valide : le speculative decoding donne ×2,4 en latence sur Llama 70B. Setup et benchmarks.
LireAccéder à mes machines de dev depuis n'importe où, sans ouvrir de port, sans VPN traditionnel. Config complète et 3 usages réels.
LireMon setup terminal après 6 mois d'utilisation stable. Configs complètes, screenshots, et pourquoi chaque outil a remplacé son prédécesseur.
Lire3 backends DB managed sur le même site pendant 30 jours. Latence, coût, DX, migration. Le gagnant n'est pas celui que tu penses.
Lire6 mois avec Vercel AI Gateway. Routage automatique, fallbacks, observability, -15% de coûts. Setup complet et chiffres.
LireTout le monde célèbre le 'vibe coding'. Après 4 mois à tester, je dis : c'est un piège pour devs moyens. Voici ce que je fais à la place.
LireUne planète, un peuple, une civilisation, une histoire de 10 000 ans — tout en 5 jours avec Claude. Le workflow exact.
LirexAI attaque la loi SB 24-205 du Colorado. Analyse technique et juridique de ce qui change pour les développeurs IA qui opèrent aux USA.
LireJ'ai entraîné un LoRA sur L'Algorithme de Babel. Le modèle écrit des scènes nouvelles qui passent le test aveugle. Dataset + config.
LireLe pipeline que j'utilise pour écrire des sagas de 10 tomes : prompts, scripts, workflow. Dataset et templates téléchargeables.
LireLa règle d'écriture la plus répétée est aussi la plus mal comprise. Après 107 livres, je la trouve nuisible dans 40% des cas. Voici pourquoi.
LireDataset complet de mes prix et ventes sur 107 titres. Ce qui marche vraiment, pas les mythes. Dataset téléchargeable.
LireTrois approches du coding autonome comparées : boucle Ralph, sessions persistantes et pair programming IA. Laquelle choisir ?
LireLe KV-cache explose en contexte long. TurboQuant compresse 7x avec moins de 1 % de perte. Deep dive sur les techniques de quantification 2026.
LireHooks, token budgets, scoring d'importance, compression JIT : anatomie complète du context engine qui pilote les agents de code modernes.
LirePlan mode, agents parallèles, hooks, skills, MCP servers : les 10 fonctionnalités Claude Code qui ont transformé mon workflow quotidien.
LireDu worldbuilding technique à l'arc émotionnel : comment structurer un thriller où l'IA est un personnage. Retour d'expérience sur 107 000 mots.
LireGuide pas à pas pour créer un agent ReAct avec LangGraph en Python : state graph, nodes, edges, tools et pièges courants à éviter.
LireComprends enfin pourquoi ton LLM consomme 32 Go de RAM pour 128K tokens. KV-cache, attention, Flash Attention et PagedAttention décryptés.
LireMon workflow quotidien pour écrire 3 000 mots/jour avec l'IA : ce que je délègue, ce que je garde, et pourquoi la voix reste humaine.
LireCouvertures ratées, pricing mal calibré, mots-clés ignorés : les 5 erreurs concrètes de self-publishing que j'aurais aimé éviter.
Lire15 commits/jour, 80 % de debugging en moins : mon workflow quotidien avec Claude Code, Ralph Loop et agents parallèles en 2026.
LireGeoffrey Huntley a inventé une boucle bash de 3 lignes qui a révolutionné le coding autonome. Trois heures de session dégradée m'ont convaincu — voici les 5 principes, le backpressure, et mon setup concret.
LireLe KV-cache de Llama 3.1 8B à 128K tokens pèse 16 Go. TurboQuant le réduit à 2,3 Go avec +0,8 % de perplexité. Architecture en 7 couches, code Rust, et benchmarks.
Lire6 stratégies de compression, 9 types de mémoire, et un Context Engine à 7 hooks — anatomie complète d'un agent IA qui n'oublie pas, avec le code TypeScript sous le capot.
Lire20 agents Claude Code en parallèle, 8 passes spécialisées, des regex sed et des pièges mémorables — récit complet d'une correction orthographique massive sur 4 835 chapitres.
Lire100 % des modèles dégradent en contexte long. NoLiMa montre que 11 sur 13 passent sous 50 % à 32K tokens. Voici pourquoi, et les solutions d'architecture qui changent la donne.
LireJ'ai créé un outil open-source pour convertir Markdown, PDF et EPUB en audiobooks de qualité pro -- 100 % local, multi-voix, voice cloning, sans frais de licence.
LireAprès avoir dépensé $847 en une nuit sur une facture API et vu mon agent supprimer des fichiers critiques, j'ai décidé de documenter mes erreurs. 51 pièges, 17 chapitres, 3 livres.
LireComment j'utilise Claude et GPT pour écrire mes romans -- sans perdre ma voix d'auteur. Workflow concret, pièges à éviter, et pourquoi l'IA n'écrira jamais à ma place.
Lire