YOLO: l'algoritmo per chi osserva
In un mondo pieno di algoritmi, quelli che gravitano intorno al mondo dell’intelligenza artificiale crescono in maniera esponenziale: uno degli ultimi arrivati è YOLO, e riguarda il campo dell’image recognition.
Cosa vedrai
Cosa vuol dire YOLO
YOLO (alias di You Only Look Once) è un sistema di rilevamento degli oggetti in tempo reale che identifica e classifica gli oggetti in un singolo passaggio dell’immagine. È un algoritmo di rilevamento degli oggetti a singolo stadio che unifica i componenti della pipeline di rilevamento degli oggetti in un’unica rete neurale.
Come funziona
YOLO divide un’immagine di input in una griglia e prevede simultaneamente più bounding box e probabilità di classe per ogni cella della griglia. Questa architettura unificata gli consente di elaborare le immagini in modo notevolmente veloce, rendendolo particolarmente adatto per applicazioni in tempo reale.
Credits to TowardsDataScience Blog
Un bounding box, in italiano “scatola delimitatrice”, è un rettangolo immaginario che circonda un oggetto all’interno di un’immagine. Questo rettangolo è definito da quattro coordinate che rappresentano i punti estremi dell’oggetto: le coordinate del punto in alto a sinistra (x_min, y_min) e le coordinate del punto in basso a destra (x_max, y_max). Il bounding box viene utilizzato nell’ambito del rilevamento degli oggetti per indicare la posizione approssimativa di un oggetto all’interno di un’immagine. Questo rettangolo fornisce un modo standardizzato per rappresentare la posizione e le dimensioni di un oggetto, facilitando il processo di identificazione e classificazione degli oggetti all’interno di un’immagine.
Esempio di bounding box con due Corgie adorabili
Vantaggi di YOLO per il rilevamento degli oggetti
Elaborazione in tempo reale: YOLO è noto per la sua velocità, in grado di elaborare immagini a un alto ritmo, come 155 fotogrammi al secondo in YOLO v7, rendendolo ideale per applicazioni in tempo reale come la videosorveglianza e le auto a guida autonoma.
Efficienza: L’architettura a singolo stadio di YOLO semplifica il processo di rilevamento degli oggetti, prevedendo bounding box e probabilità di classe in un singolo passaggio attraverso l’immagine, il che è efficiente ed efficace per vari compiti.
Alta precisione: Nonostante la sua velocità, YOLO mantiene un’alta precisione nel rilevamento degli oggetti, raggiungendo risultati competitivi su benchmark come il dataset COCO, rendendolo una scelta affidabile per rilevamenti accurati.
Adattabilità alle dimensioni degli oggetti: La flessibilità di YOLO nel rilevare oggetti di varie dimensioni e forme, grazie al suo approccio basato su griglia e anchor box, gli consente di gestire ambienti e oggetti diversi in modo efficace.
Facilità di implementazione: La semplice architettura di YOLO e i requisiti minimi di dati di training lo rendono facile da implementare e adattare a nuovi compiti, riducendo la complessità della pipeline di rilevamento degli oggetti.
YOLO ha dimostrato di essere uno strumento prezioso per il rilevamento degli oggetti e ha aperto molte nuove possibilità per ricercatori e professionisti. Grazie alla sua combinazione di velocità, precisione, adattabilità ed efficienza, YOLO è una scelta ideale per chi cerca un algoritmo di rilevamento degli oggetti affidabile e performante.