Recensione de 'Big Data Analytics'
Se cerchi il manuale perfetto per coniugare la tua passione per la data analytics con argomenti come Big Data e prodotti che ti supportino in maniera pratica a lavorarci, sei nel posto giusto!
Ranking
Autore Andrea de Mauro Genere Tecnico Livello Per tutti Scorrevolezza 10 / 10 Originalità 10 / 10 Valutazione 10 / 10 Recensione
Comincio dicendo che questo manuale ha una struttura molto chiara: dopo una panoramica teorica -ma mai banale- sul tema, si passa subito all’azione: viene infatti introdotto KNIME, uno strumento molto completo -e open source- dotato di un’interfaccia che consente agli utenti meno “smanettoni” in termini di programmazione di sfruttare tutto il potenziale delle tecniche di machine learning e di creare dei workflow per l’analisi dei dati.
KNIME non è stato scelto a caso: si tratta infatti di una delle piattaforme leader nell’ambito dei Big Data Analytics ed è un competitor diretto di grosse multinazionali (tra le quali, IBM).
Attraverso i diversi capitoli, vengono analizzate diverse tecniche di gestione dei dati: esempi concreti di come importare i dati, ripulirli e utilizzare delle formule matematiche (sono elementari, giuro!) per eseguire un esempio di analisi. Non solo: attraverso un capitolo dedicato al machine learning, uno alle tecniche di classificazione e altri algoritmi, l’autore ha portato a un livello successivo il materiale, corredando ogni singolo esempio da un caso di studio pratico e reale.
In un manuale del genere si possono apprezzare aspetti come la semplicità del linguaggio, l’immediatezza degli esempi (predire un cliente che cambierà operatore o i prezzi degli immobili di una certa zona, per dirne due) e la linearità del testo. Non ci si perde in chiacchere e ogni singolo passaggio è curato nei minimi dettagli, proprio per rendere l’esperienza del lettore alla portata di una futura applicazione pratica.
E se questo non fosse abbastanza, l’ultimo capitolo è dedicato a chi di programmazione ne sa qualcosa.
KNIME permette infatti di utilizzare delle estensioni che consentano la programmazione in Python e R; si tratta di una funzionalità che personalmente ho adorato (le black-box non piacciono a nessuno, diciamocelo pure!) e che, anche in questo caso, l’autore ha trattato con estrema semplicità, senza mai avere troppa fretta nel concludere l’argomento.
Credo che parlare di temi non sempre semplici come questi in un modo così interessante sia una dote eccezionale: e questo non vale solo per una persona come Andrea De Mauro che ha un curriculum impressionante, ma è indicativo del fatto che non tutte le persone professionalmente valide sono davvero in grado di rendere in parole la propria conoscenza, mentre lui ci è riuscito alla perfezione.
Se per questo libro non bastasse, per fortuna ce ne sono altri due: “Big Data per il Business”, con un focus sulle imprese e le strategie che usano i dati per crescere, e “Data analytics per tutti”, che unisce le competenze per l’analisi e la gestione dei dati a un livello di praticità estremo.
Il sovraccarico informativo è una delle più grosse piaghe del XXI secolo;
La differenza tra clustering e classificazione è così sottile che a volte non viene compresa a pieno;
Il metodo del gomito è un’ottima tecnica euristica quando vorresti sbattere la testa nel decidere come gestire un cluster.
Quotes
“Una valutazione qualitativa deve necessariamente tradursi in qualcosa di riproducibile da una macchina in fase di apprendimento” “L’euforia legata alla loro [intelligenza artificiale, Big Data, machine learning] affermazione si è trovata spesso a superare la loro stessa comprensione”
Sapevi che…
“KNIME” è l’unione di “KN” (la sigla della città di Costanza, dove nasce il progetto), “IM” (Information Mining) e “E”, aggiunto per questioni di suono.
Disponibile su Amazon