Throughput vs utilisation : l'erreur de pilotage qui ralentit tes projets (et comment la corriger)
Par l'équipe Growth Loupe · 17 juin 2026 · 6 min
Rédigé avec l'assistance de l'IA · édité par Growth Loupe
En bref
En gestion de projet, optimiser le throughput ne passe pas par maximiser le taux d'utilisation de chaque ressource. Cela passe par identifier le goulot d'étranglement unique qui limite le débit global, puis subordonner toutes les autres activités à sa cadence. La Theory of Constraints d'Eliyahu Goldratt (The Goal, 1984) démontre qu'une équipe chargée à 100 % produit moins qu'une équipe qui protège délibérément de la capacité autour de sa contrainte. Les trois leviers opérationnels sont : les WIP limits (plafonds de tâches simultanées), l'identification explicite du goulot dans l'outil de gestion, et la centralisation des buffers de temps en fin de projet plutôt que tâche par tâche.
Le paradoxe qui coûte cher à presque toutes les équipes
Tu as une équipe. Tout le monde a des tâches. Tout le monde est occupé. Pourtant les projets prennent deux fois plus de temps que prévu.
Ce scénario, je le vois chez la majorité des freelances, startups et PMEs que j'accompagne. L'intuition courante : si les gens travaillent à 100 %, les projets avancent vite. C'est faux.
Ce n'est pas une opinion — c'est un résultat formalisé par Eliyahu Goldratt dans The Goal, publié en 1984. Ce livre est devenu l'une des références les plus citées en management opérationnel. Le raisonnement est simple mais contre-intuitif : dans tout système de production — une usine, une équipe produit, un freelance multitâche — il existe toujours une contrainte, un goulot d'étranglement, qui limite le débit global. Optimiser autre chose que ce goulot ne sert à rien. Pire : ça crée de la congestion et ralentit encore plus le système.
Throughput vs utilisation : deux métriques opposées au-delà d'un seuil
Deux définitions nettes d'abord.
Le throughput (ou débit), c'est le flux de valeur qui sort du système : fonctionnalités livrées, clients signés, commandes expédiées. C'est ce que le client reçoit et pour quoi il paie.
Le taux d'utilisation, c'est le pourcentage de temps où chaque ressource est occupée. C'est ce que les managers regardent en général, parce que ça rassure. Une ressource à 100 % semble productive.
Le problème : ces deux métriques évoluent en sens opposé au-delà d'un certain seuil. La théorie des files d'attente — formalisée par John Kingman dans les années 1960 — le montre mathématiquement : quand l'utilisation d'une ressource dépasse environ 80 à 85 %, les délais d'attente n'augmentent pas linéairement. Ils explosent de façon exponentielle. Une équipe à 95 % d'utilisation peut afficher des temps de cycle bien supérieurs à une équipe à 80 %.
Traduction concrète : si ton développeur, ton designer ou ton service client est en permanence à fond, chaque nouvelle demande attend. Plus elle attend, plus le contexte à gérer s'accumule, plus les erreurs apparaissent, plus les révisions s'enchaînent. Le projet avance moins vite, pas plus vite.
Identifier ton goulot : la première étape de la Theory of Constraints
La Theory of Constraints (ToC) de Goldratt propose cinq étapes. La première est la plus importante : trouver la contrainte. Pas optimiser tout le système — juste trouver où ça bloque.
Dans une startup ou une PME, le goulot n'est pas toujours évident. Ce n'est pas forcément la personne la plus occupée. C'est la ressource dont le débit plafonne tout ce qui vient après elle.
Deux questions pour l'identifier : d'abord, regarde où les tâches s'accumulent. Le goulot est juste avant la pile qui grossit. Si les demandes de validation attendent plusieurs jours sur le bureau du responsable produit, le responsable produit est ton goulot. Si les livraisons bloquent parce que la facturation prend du temps, la facturation est ton goulot. Ensuite, mesure le temps de cycle — de la demande entrante à la livraison — pas le taux d'occupation. Si une tâche passe 80 % de son temps à attendre et 20 % à être traitée, le problème n'est pas la vitesse d'exécution. C'est la file d'attente.
Une fois le goulot identifié, la règle est nette : exploite-le au maximum, protège-le de toute interruption, et subordonne tout le reste à son rythme. Produire plus vite en amont du goulot ne sert à rien — tu accumules du stock intermédiaire inutile qui crée de la congestion.
- →Observe où les tâches s'accumulent dans ton flux de travail
- →Mesure le temps de cycle de bout en bout, pas le taux d'occupation
- →Identifie la ressource dont le débit conditionne la sortie finale
- →Ne cherche pas à accélérer en amont du goulot — ça ne fait qu'aggraver la congestion
Trois leviers concrets pour augmenter le throughput
Une fois le goulot identifié, trois mécanismes permettent d'augmenter le débit réel sans nécessairement embaucher ou allonger les journées.
Levier 1 : les WIP limits. WIP signifie Work In Progress. Une WIP limit est un plafond sur le nombre de tâches qu'une personne ou une étape du flux peut avoir simultanément en cours. Si tu ne peux avoir que trois projets actifs à la fois, tu es forcé de finir avant de commencer. Ça semble contre-productif. En réalité ça réduit le multitasking, qui est documenté comme l'une des causes principales de baisse de productivité cognitive. Gerald Weinberg l'a formalisé dans Quality Software Management (1992) : chaque tâche supplémentaire en parallèle génère un surcoût de commutation de contexte. Des outils comme Kanban permettent de visualiser et d'appliquer ces limites simplement.
Levier 2 : rendre le goulot visible dans ton outil de gestion. Crée une colonne, un tag, une étiquette dédiée. Toute l'équipe doit savoir que cette étape est la priorité absolue. Aucune demande ad hoc ne vient perturber le goulot pour un travail de moindre valeur. Les urgences qui arrivent sont refusées ou planifiées.
Levier 3 : le buffer management. Goldratt distingue deux types de buffers. Le project buffer est un temps de sécurité centralisé en fin de projet. Le feeding buffer est un temps de sécurité placé avant le goulot, pour s'assurer qu'il ne reste jamais sans alimentation. L'erreur classique est d'ajouter du temps de sécurité à chaque tâche individuellement. Cela conduit à la loi de Parkinson — le travail s'étend pour remplir le temps disponible — et au syndrome de l'étudiant : on commence toujours à la dernière minute. Centralise le buffer. Pilote-le comme un indicateur en temps réel.
- →WIP limits : fixe un plafond de tâches simultanées par personne ou par étape
- →Rends le goulot visible dans ton outil de gestion et protège-le des interruptions
- →Centralise le buffer de temps plutôt que de le disperser tâche par tâche
- →Subordonne le rythme de tout le système à la cadence du goulot
Ce que ça change pour un freelance, une startup ou une PME
Pour un freelance : ton goulot, c'est souvent toi. Et ton goulot interne, c'est souvent la révision et la validation client — pas la production. Identifier ça change complètement la façon de gérer tes projets. Moins de démarrages simultanés, plus de finitions nettes, délais mieux tenus.
Pour une startup early stage : le goulot change selon la phase. En phase de construction, c'est souvent l'engineering. En phase de vente, c'est le closing ou l'onboarding. La Theory of Constraints t'oblige à recalibrer régulièrement et à ne pas optimiser au mauvais endroit.
Pour une PME : les goulots se cachent souvent dans les processus de validation hiérarchique et dans les dépendances inter-services. Un diagnostic ToC révèle des blocages que personne ne regardait parce que tout le monde était trop occupé pour observer le flux.
Ce que cette approche ne fait pas : elle ne te dit pas d'embaucher, d'acheter un outil ou de faire plus. Elle te dit de faire moins, mieux ciblé. C'est pour ça qu'elle est efficace dans des contextes contraints en ressources — exactement ceux des freelances, startups et PMEs.
Si tu veux aller plus loin sur la gestion de projet opérationnelle — planification, priorisation, pilotage du flux de travail au quotidien — c'est exactement ce qu'on couvre dans la formation Gestion de projet sur Growth Loupe. Les concepts sont là pour être appliqués, pas pour rester théoriques.
FAQ
Comment optimiser le throughput en gestion de projet ?
Optimiser le throughput en gestion de projet passe par trois étapes : identifier le goulot d'étranglement unique qui limite le débit global, appliquer des WIP limits pour réduire le multitasking, et centraliser les buffers de temps en fin de projet plutôt que de les disperser tâche par tâche. Augmenter l'utilisation de toutes les ressources à 100 % produit l'effet inverse : les files d'attente explosent et les délais s'allongent.
C'est quoi la Theory of Constraints de Goldratt ?
La Theory of Constraints (ToC) est une méthode de management développée par Eliyahu Goldratt et formalisée dans le livre The Goal (1984). Elle pose que tout système a une contrainte dominante — un goulot d'étranglement — qui limite son débit global. Améliorer toute autre partie du système est inefficace tant que cette contrainte n'est pas identifiée et exploitée en priorité. La méthode se déploie en cinq étapes : identifier la contrainte, l'exploiter au maximum, subordonner tout le reste à elle, l'élever si nécessaire, puis recommencer.
Qu'est-ce que les WIP limits et à quoi servent-elles ?
Les WIP limits (Work In Progress limits) sont des plafonds sur le nombre de tâches qu'une personne ou une équipe peut avoir simultanément en cours. Elles réduisent le multitasking — documenté comme coûteux cognitivement par Gerald Weinberg dans Quality Software Management (1992) — et forcent à terminer avant de commencer. Le résultat : moins de changements de contexte, moins d'erreurs, un débit réel plus élevé. Elles s'appliquent facilement via des outils Kanban.
La Theory of Constraints s'applique-t-elle aux petites équipes et aux freelances ?
Oui, et souvent avec plus d'impact qu'en grande entreprise, parce que les ressources sont plus contraintes. Pour un freelance, le goulot est souvent la validation client ou la phase de révision, pas la production. Pour une startup, il change selon la phase de croissance : engineering en phase de build, closing ou onboarding en phase de vente. Identifier le bon goulot permet de concentrer l'effort là où il produit un effet réel, sans ajouter de ressources.