Anthropic Cowork : verdict après 50 projets
Cowork, lancé par Anthropic en janvier 2026, transforme Claude en délégateur : au lieu de traiter une tâche seul, Claude décide quels sous-agents invoquer, dans quel ordre, avec quels outils. Sur le papier, c'est la Ralph Loop automatisée. En pratique, après 50 projets réels menés avec Cowork sur 6 semaines, je peux dire : c'est un gain réel sur certains cas, un piège complet sur d'autres. Et la différence n'est pas celle à laquelle on s'attend.
Ce que Cowork fait vraiment
Cowork ajoute à Claude Desktop (macOS et Windows) un mode « orchestrator » : tu donnes une tâche de haut niveau (« refactore le module auth et ajoute les tests manquants »), Claude identifie les sous-tâches, dispatche chacune à un sous-agent spécialisé (un pour le refactoring, un pour les tests, un pour la doc), surveille l'avancement, et recompose le résultat final.
Concrètement, ça remplace les appels manuels à plusieurs agents distincts que tu ferais toi-même avant.
Le benchmark sur 50 projets
J'ai comparé Cowork à mon workflow classique (Claude Code + Ralph Loop manuelle) sur 50 tâches identiques. Types variés : refactoring, ajout de feature, debug, doc, tests.
| Métrique | Cowork | Ralph Loop manuelle | Delta |
|---|---|---|---|
| Taux de succès | 78% | 86% | -8 pts |
| Temps moyen (wall-clock) | 42 min | 68 min | -38% |
| Coût moyen par tâche | 1,80 $ | 0,95 $ | +89% |
| Qualité subjective (1-5) | 3,7 | 4,1 | -10% |
Le gain de Cowork est le temps. Mais c'est un gain plus cher (coût multiplié par 1,9) et légèrement moins qualitatif. Est-ce que ça vaut le coup ? Ça dépend.
Les 3 cas où Cowork gagne clairement
Cas 1 : les tâches parallélisables naturellement
Sur les tâches où les sous-étapes sont vraiment indépendantes (ex : « ajoute des tests pour ces 5 fonctions », « traduis ces 10 pages de doc »), Cowork distribue à 5 sous-agents et finit en 20% du temps. Gain de 80% en wall-clock.
Cas 2 : les pipelines Research → Plan → Execute
Pour une tâche type « comprends ce bug, propose un fix, applique-le, teste », Cowork utilise un agent « analyst » pour comprendre, un « planner » pour proposer, un « executor » pour appliquer. La séparation aide — chaque sous-agent a un prompt plus focus, et la qualité intermédiaire monte.
Cas 3 : quand tu ne connais pas la bonne stratégie
Si tu balances une tâche vague (« améliore les perfs de cette app »), Cowork explore plusieurs directions en parallèle (perfs DB, perfs front, caching, profiling) et te propose le gain le plus intéressant. C'est utile quand tu es coincé intellectuellement.
Les 3 cas où Cowork est un piège
Piège 1 : les tâches séquentielles serrées
Si chaque étape dépend du résultat de la précédente, Cowork simule la parallélisation en lançant plusieurs chemins en spéculatif, puis en jetant les mauvais. Résultat : tu payes plusieurs fois le coût pour le même gain. Sur ce type de tâche, Ralph Loop manuelle est plus rapide et plus fiable.
Piège 2 : le debugging profond
Debugging est un art qui demande de la continuité mentale. Un sous-agent qui reçoit un contexte partiel manque les signaux subtils. Sur mes 7 tâches de debug complexe, Cowork a un taux de succès de 43% contre 85% pour moi avec Ralph Loop. Moitié moins bon.
Piège 3 : les tâches créatives
Écrire un README, concevoir une API, nommer un module — ces tâches demandent de la cohérence sur la totalité du résultat. Un orchestrateur qui délègue à 3 sous-agents produit du frankenstein. J'ai abandonné Cowork pour toute tâche d'écriture créative.
Le coût caché : 89% de plus, pourquoi ?
Le coût monte parce que Cowork :
- 1.Fait tourner un agent meta (Claude Sonnet 4.5) qui orchestre — coût fixe par tâche
- 2.Lance en parallèle plusieurs sous-agents — coût multiplié
- 3.Fait de la recomposition à la fin — un autre appel LLM
- 4.Refait parfois des vérifications croisées — encore des appels
C'est la rançon de la parallélisation. Tu gagnes en temps ce que tu payes en tokens.
Ma matrice de décision
| Type de tâche | Cowork ? | Alternative |
|---|---|---|
| Ajout de tests multiples | ✅ | Ralph Loop séquentielle |
| Refactoring multi-fichiers | ✅ | Cursor bulk edit |
| Debug complexe | ❌ | Claude Code manuel |
| Écriture créative | ❌ | Un seul agent focused |
| Exploration perf | ✅ | Manuel + profiler |
| Migration de lib | ✅ | Scripts + tests |
| Revue d'architecture | ❌ | Discussion humaine |
| Génération de doc | ⚠️ | Dépend du niveau de cohérence requis |
Ce qu'il faut retenir
- 1.Cowork gagne 38% sur le temps wall-clock mais coûte 89% plus cher en tokens.
- 2.Il excelle sur les tâches parallélisables (tests, docs, migrations multi-fichiers).
- 3.Il échoue sur le debug complexe et l'écriture créative — à éviter là.
- 4.La qualité finale est 10% inférieure à une Ralph Loop manuelle sur les tâches moyennes.
- 5.La règle économique : oui si tu factures ton temps, non si tu codes par passion.
Pour la méthode Ralph Loop manuelle que j'utilise quand Cowork n'est pas pertinent, j'ai écrit un livre dédié :
Soutenez mon travail sur Patreon
Accès anticipé aux articles, contenu exclusif, et la satisfaction de soutenir un auteur indépendant.
Rejoindre — à partir de 3€/mois