
Il machine learning (ML) è utilizzato sempre più spesso per studiare e proteggere la natura. Tuttavia, tra gli svantaggi legati al suo impiego sorgono anche alcune criticità in merito alla sostenibilità ambientale. I benefici dell’applicazione del ML alla conservazione della natura superano la sua impronta ecologica e climatica? Un nuovo studio guidato dal CMCC analizza il ruolo del ML nell’ecologia terrestre. Esaminando 326 studi la ricerca conclude che gli algoritmi offrono grandi potenzialità nel fornire dati più accurati, scalabili e tempestivi, favorendo il monitoraggio in tempo reale e previsioni quasi istantanee, con applicazioni ad esempio nella previsione stagionale.
Dalla previsione della distribuzione delle specie alla comprensione delle dinamiche ecologiche, all’identificazione dei tratti e dei comportamenti delle specie e al rilevamento dei cambiamenti ambientali in modo più rapido e accurato, il ML può contribuire a generare risposte più tempestive alle sfide globali, tra cui i cambiamenti climatici, la perdita di biodiversità e il degrado del suolo.
“Poiché gli algoritmi di ML possono essere piuttosto complessi da navigare, in questo studio cerchiamo di demistificare la ‘giungla dell’AI’, offrendo una panoramica chiara dei diversi modi in cui i computer possono apprendere dai dati, con un focus sulle famiglie di algoritmi, i punti di forza, i limiti e le applicazioni reali in ecologia terrestre”, afferma Cristina Cipriano, ricercatrice del CMCC e autrice principale della review intitolata “Algorithms going wild – A review of machine learning techniques for terrestrial ecology”.
Il messaggio centrale dello studio è che, sebbene il ML offra nuove e potenti possibilità per l’ecologia, il suo pieno potenziale è ancora lontano dall’essere raggiunto a causa di diverse sfide, tra cui la complessità e la difficoltà di interpretazione di molti modelli, la necessità di grandi quantità di dati di alta qualità, e la tendenza a rafforzare i bias (ad esempio, sovra-rappresentando regioni o specie già ampiamente studiate). Inoltre, le tecniche avanzate di ML richiedono una notevole potenza computazionale, che comporta costi ambientali significativi.
“Queste barriere tecniche e ambientali possono limitare l’accesso al ML per molti ecologi e decisori politici, in particolare nelle regioni con risorse limitate, sollevando una serie di questioni etiche legate all’equità e alla trasparenza”, spiega Cipriano. “Esiste anche un chiaro paradosso. Il ML viene utilizzato per proteggere gli ecosistemi e affrontare i cambiamenti climatici, ma il suo uso può generare impatti ambientali e climatici significativi attraverso attività che contribuiscono alle emissioni e all’esaurimento delle risorse. Questo solleva una questione critica: i benefici dell’utilizzo del ML per la conservazione della natura superano la sua impronta ecologica e climatica? La risposta dipende da come, dove e perché viene utilizzato il ML, e il nostro studio sottolinea la necessità di applicazioni ponderate e orientate allo scopo, che massimizzino il valore ecologico minimizzando al contempo i danni ambientali”.

La figura presenta uno scatter plot che mappa visivamente i diversi algoritmi di ML sulla base di due criteri chiave: la complessità dell’algoritmo (che va da modelli più semplici e classici ad architetture più complesse di deep learning) e l’interpretabilità (quanto il modello è supervisionato o non supervisionato; i modelli supervisionati tendono ad essere più interpretabili poiché guidati da una struttura, mentre quelli non supervisionati mancano spesso di questa trasparenza, rendendo i loro risultati più difficili da spiegare). Fonte: Cipriano et al., 2025
La figura offre una comprensione intuitiva e immediata di dove si colloca ciascun algoritmo: se è più facile da interpretare ma meno flessibile, oppure molto potente ma difficile da comprendere. Ad esempio, i decision trees sono a bassa complessità e altamente interpretabili, mentre le deep neural networks sono più complesse e meno trasparenti. I modelli ibridi si collocano in una zona intermedia. Il posizionamento degli algoritmi nel grafico si basa su letteratura consolidata, modelli d’uso reali e giudizio esperto, garantendo rigore e usabilità. Sebbene l’articolo sia di natura qualitativa, questa figura è una guida pratica per supportare scelte più consapevoli nella modellazione ecologica, in particolare per chi non ha una formazione informatica.
Le comunità di ecologi ed esperti di machine learning stanno già adottando misure per migliorare la qualità e la standardizzazione dei dati ecologici, rendendo i dataset più completi, diversificati e utilizzabili per il ML. I ricercatori stanno esplorando il transfer learning e la data augmentation per sfruttare meglio i dati limitati, in particolare per specie rare o regioni poco rappresentate.
Cresce anche l’interesse per l’explainable AI, ovvero strumenti che rendono più comprensibili le previsioni dei modelli, e per l’integrazione dell’inference causale per svelare i processi ecologici reali. Particolare attenzione è rivolta alla progettazione etica, che include la riduzione dell’impronta ambientale dei modelli, l’identificazione e la correzione dei bias algoritmici, e la promozione di tecnologie aperte, inclusive e accessibili in contesti differenti. Questi sviluppi mostrano che il settore sta avanzando non solo dal punto di vista tecnico, ma anche nell’assunzione di responsabilità ecologiche e sociali più ampie.
“Il nostro studio sollecita anche una maggiore collaborazione tra ecologi e informatici, lo sviluppo di strumenti open-source e user-friendly, e una comunicazione più chiara su come funzionano i modelli e cosa significano i loro risultati”, afferma Cipriano. “Questo è cruciale, perché il ML potrebbe diventare uno strumento centrale per comprendere e tutelare la natura, ma solo se sarà accessibile, interpretabile, equo, radicato nella conoscenza ecologica reale, e se le sue implicazioni ambientali ed etiche verranno affrontate attivamente.”
Per ulteriori informazioni:
Cristina Cipriano, Sergio Noce, Simone Mereu, Monia Santini, Algorithms going wild – A review of machine learning techniques for terrestrial ecology, Ecological Modelling, Volume 506, 2025, 111164, ISSN 0304-3800, https://doi.org/10.1016/j.ecolmodel.2025.111164.