Il segreto dell’efficienza di flusso: perché un sistema lavora meglio al 65% del carico massimo teorico

Nell’articolo precedente ho condiviso un’esperienza personale che mi ha confermato, sul campo, come un flusso di lavoro sia davvero efficiente solo quando funziona al 60-70% della sua capacità potenziale. Cercare di spingerlo fino al 100% significa, inevitabilmente, condurlo al collasso: il sistema si satura, rallenta e finisce per bloccarsi.

La spiegazione di questo fenomeno, apparentemente controintuitivo, risiede nella solida base scientifica di un caso particolare della Teoria delle Code, comunemente noto come Legge di Little. Prende il nome da John D. C. Little, professore alla MIT Sloan School of Management, che la ha formulata.

La teoria delle code applicata ai flussi di lavoro

Possiamo visualizzare il nostro sistema come un “tubo di flusso” che eroga un servizio, i cui clienti sono le richieste di lavoro, che chiameremo work item (rappresentati nell’immagine come post-it).

Per analizzare questo sistema, utilizziamo tre concetti chiave:

  1. Lambda (λ): la frequenza con cui arrivano i work item; ovvero, quanto viene caricato il sistema.
  2. Mu (μ): la capacità produttiva del sistema; ovvero, il numero medio di work item serviti dal sistema per unità di tempo.
  3. Work In Progress (Ls o WIP): il numero medio di work item in corso di lavorazione all’interno del sistema.

Nell’ipotesi che la frequenza di carico (λ) e la capacità produttiva (μ) siano costanti, entra in gioco la Legge di Little. Il modello semplificato che andiamo ad applicare si basa anche sulle seguenti ipotesi :

  • la coda segue una logica FIFO (first-in-first-out, il primo work item in coda è il primo servito)
  • i work item sono serviti su un unico canale, i tempi di servizio sono indipendenti gli uni dagli altri, seguendo una distribuzione tale per cui “μ” work item per unità di tempo possono essere serviti in media
  • i tempi di servizio sono indipendenti dal numero degli arrivi

La Legge di Little stabilisce che il WIP (Ls) è uguale alla frequenza di carico (λ) moltiplicata per il Tempo di Ciclo (Ws). Il Tempo di Ciclo è il tempo medio di permanenza di ciascun work item all’interno del sistema.

La Teoria delle Code ci fornisce anche la formula per calcolare il Tempo di Ciclo (Ws) del sistema, nell’ipotesi che la capacità produttiva (μ) sia maggiore della frequenza di carico (λ):

Quando il carico eccessivo blocca il flusso

Per comprendere l’importanza di mantenere non troppo elevato il carico, analizziamo cosa succede a un sistema che ha una capacità produttiva (μ) di 10 work item per ogni giornata lavorativa di 8 ore:

Carico
giornaliero (λ)
Tasso di
carico
Tempo di
Ciclo
medio (Ws)
Work In
Progress
(Ls)
Effetto
sul
sistema
5 work
item
50%1 ora e
36 minuti
1 work itemSistema
scarico
6 work
item
60%2 ore1,5 work
item
Sistema
quasi
carico
7 work
item
70%2 ore e
40 minuti
2,3 work
item
Ancora
accettabile
8 work
item
80%4 ore, quasi
raddoppia
4 work
item
Limite di
stallo
9 work
item
90%8 ore9 work
item
Sistema
quasi
bloccato
10 work
item
100%Impossibile
calcolare
Impossibile
calcolare
Sistema in
stallo
completo

Come si può notare, l’aumento del carico non produce un incremento lineare della produttività, ma una vera e propria impennata del Tempo di Ciclo e del WIP.

Se passiamo da 6 a 8 work item al giorno, il Tempo di Ciclo raddoppia, così come il Work in Progress, che schizza a 4 work item in media. Quando il carico raggiunge 9 work item, il Tempo di Ciclo raddoppia ancora, costringendoci ad aspettare essenzialmente un giorno intero per vedere evaso un singolo work item. Al 100% del carico, le formule indicano un Tempo di Ciclo infinito, ovvero che il sistema si blocca.

Il punto di equilibrio: il 65% circa del carico massimo

In pratica, affinché il sistema mantenga un flusso efficiente, il numero di work item con cui andrebbe caricato è tra 6 e 7. Un calcolo più raffinato ci dimostra che l’ottimale è all’incirca il 65% del carico massimo.

Questo significa che il nostro sistema raggiunge la sua massima efficienza quando lo carichiamo non più del 65% della sua capacità.

Il ruolo delle micro-interazioni

A questo punto potremmo porci una domanda legittima: perché un carico apparentemente basso — circa due terzi della capacità massima — garantisce la massima efficienza?

Questo accade perché, anche se spesso non ce ne accorgiamo, nei sistemi di flusso avvengono costantemente una miriade di micro-interazioni tra tutte le parti che li compongono. Queste interazioni, impercettibili prese singolarmente, nel loro insieme finiscono per rallentare in modo significativo il sistema.

Un esempio emblematico di questo fenomeno sono le code a tratti in autostrada. Quando il traffico raggiunge la saturazione, le auto iniziano a rallentare e fermarsi senza una causa apparente. Questa continua alternanza di frenate e ripartenze nasce da una moltitudine di micro-interazioni tra i veicoli, che, sommandosi, finiscono per bloccare l’intero sistema.

Lo stesso principio vale anche per i nostri flussi di lavoro. È proprio per questo che limitare il lavoro in corso (limit WIP) rappresenta una delle pratiche fondamentali del metodo Kanban.

Conclusione

Per garantire che un flusso di lavoro possa raggiungere la sua massima efficienza in modo sostenibile nel tempo, è di vitale importanza assicurarsi che non sia caricato troppo oltre la soglia del 65% della sua capacità. Ridurre il carico di lavoro non è segno di sottoutilizzo, ma la chiave per accelerare il flusso, ridurre drasticamente il Tempo di Ciclo e aumentare la produttività.

Bibliografia

  1. Paul Newbold, Principles of Management Science, Prentice-Hall, 1986
  2. David J. Anderson, Teodora Bozheva, Kanban Maturity Model: A Map to Organizational Agility, Resilience, and Reinvention – 2nd Edition, Kanban University Press, 2021

Ho pubblicato originariamente questo articolo per il portale Kanban Help, al quale collaboro insieme al collega Luca Gambetti.
Visita Kanban Help – www.kanban.help – per conoscere gli strumenti formativi e di coaching che ti possono aiutare a introdurre il metodo Kanban nella tua azienda.

Pillole di Kanban applicato: una soluzione controintuitiva per muoversi più velocemente nelle strettoie autostradali

La settimana scorsa ho parlato delle inefficienze e dei potenziali miglioramenti nella gestione del flusso autostradale. Chiunque viaggi in autostrada ha anche familiarità con il frustrante fenomeno delle strettoie dovute ai lavori: due corsie che convergono in una, creando code interminabili, ingorghi e il classico “stop-and-go”. Questo scenario, dove i veicoli si fermano e ripartono continuamente, è una delle esperienze più stressanti per gli automobilisti. Tuttavia, esiste un metodo controintuitivo che promette di migliorare significativamente l’efficienza del flusso e ridurre i tempi di attesa per tutti.

Il problema del comportamento comune

Il comportamento comune che si osserva in prossimità di una strettoia è il seguente: la corsia destinata a terminare si svuota progressivamente. Vedendo spazio libero, molti automobilisti in questa corsia accelerano per superare il maggior numero possibile di veicoli. Arrivati al punto di immissione, dove la corsia finisce, sono costretti a frenare bruscamente per inserirsi nell’altra. Questo inserimento improvviso obbliga anche i veicoli nella corsia con via libera a frenare, creando l’effetto domino che genera l’ingorgo e le continue fermate e ripartenze. Si ha l’illusione di guadagnare tempo accelerando e inserendosi all’ultimo, ma in realtà questo comportamento peggiora la situazione per tutti.

La soluzione controintuitiva: rallentare per andare più veloci

L’efficienza del traffico in queste situazioni può essere drasticamente migliorata adottando un approccio radicalmente diverso. Si tratta di applicare un concetto controintuitivo:

  • Scegliere la corsia giusta in anticipo: non appena si individua la corsia destinata a terminare, invece di usarla per superare la fila e cercare di inserirsi all’ultimo, oppure inserirsi da subito nella corsia che ha la via libera, restare o spostarsi nella corsia che terminerà.
  • Mantenere la stessa velocità: una volta che ci si trova nella corsia destinata a terminare, la chiave è procedere esattamente alla stessa velocità del veicolo che si trova nella corsia adiacente (quella con via libera).
  • Resistere alla tentazione: è fondamentale resistere alla tentazione di accelerare e di superare i veicoli della corsia adiacente per infilarsi nella strettoia prima di loro. Allo stesso modo, bisogna ignorare l’eventuale pressione degli automobilisti che seguono, che volendo superare potrebbero spazientirsi, suonare il clacson o lampeggiare con i fari.
  • L’effetto “svuotamento”: se questa strategia viene adottata con sufficiente anticipo, si noterà che lo spazio davanti a voi nella corsia destinata a terminare si svuoterà. Contemporaneamente, la corsia adiacente, non più intasata da continui inserimenti improvvisi, inizierà a scorrere più fluidamente e i veicoli ad accelerare.
  • Immissione fluida: mantenendo la stessa velocità del veicolo di fianco, quando si arriva al punto di immissione obbligatoria, i veicoli nella corsia con via libera avranno già guadagnato un po’ di velocità e si saranno distanziati. A quel punto, rallentando leggermente e spostandosi, sarà possibile inserirsi tra due veicoli in modo molto più agevole, permettendo a tutti di proseguire il viaggio più rapidamente.

L’origine della soluzione e la base teorica

Questa soluzione non nasce da studi accademici, ma dall’osservazione empirica. Personalmente la ho appresa osservando alcuni camionisti che la applicano, i quali, avendo una prospettiva più elevata della strada e probabilmente una maggiore esperienza osservando il flusso del traffico, hanno evidentemente compreso questa dinamica controintuitiva.

Come sempre in Svizzera, ho visto invece una soluzione simile applicata in modo sistematico: in ciascuna corsia è posto un semaforo e il verde si accende in alternanza, trasformando in una pratica governata la soluzione empirica che ho descritto più sopra.

In termini più tecnici, entrambe le soluzioni applicano una pratica comune al metodo Kanban e, più specificamente, il concetto di WIP limit (limite al lavoro in corso). Limitare l’accesso (ovvero, rallentare il flusso in entrata e impedire che le auto si ammassino all’ultimo secondo) serve a dare ordine al flusso stesso. Il risultato è un sistema che, una volta ordinato, inizia a scorrere più velocemente.

La prossima volta che incontrerete una strettoia in autostrada, provate questo esperimento (sempre rispettando il codice della strada). Potreste scoprire, con vostra sorpresa, che rallentare in questo modo non solo riduce lo stress, ma vi permette di attraversare l’ingorgo in modo significativamente più rapido ed efficiente per voi e per tutti gli altri.

Ho pubblicato originariamente questo articolo per il portale Kanban Help, al quale collaboro insieme al collega Luca Gambetti.
Visita Kanban Help – www.kanban.help – per conoscere gli strumenti formativi e di coaching che ti possono aiutare a introdurre il metodo Kanban nella tua azienda.