L'analisi strutturale delle popolazioni vegetali attraverso dati genetici è fondamentale per comprendere e preservare la biodiversità cioè la varietà di forme di vita sul nostro pianeta. Essa comprende la diversità genetica all'interno delle specie, tra le specie e tra gli ecosistemi. La conoscenza della struttura genetica delle popolazioni è importante perché ci permette di capire come la biodiversità è stata generata e mantenuta nel corso della storia evolutiva. L'analisi di clustering utilizza algoritmi matematici per identificare le relazioni genetiche tra le popolazioni, e questo ci aiuta a scoprire le popolazioni ancestrali e le loro relazioni evolutive. Queste informazioni ci permettono di valutare l'impatto delle attività umane sulla biodiversità e di sviluppare strategie per la sua conservazione. Ad esempio, possiamo identificare le popolazioni che sono particolarmente vulnerabili e che richiedono una maggiore attenzione e protezione. Inoltre, conoscere la struttura genetica delle popolazioni ci aiuta anche a sviluppare programmi di coltivazione e conservazione delle specie che sono importanti per la sicurezza alimentare e l'equilibrio ecologico. In sintesi, l'analisi strutturale delle popolazioni vegetali attraverso dati genetici è uno strumento essenziale per comprendere la biodiversità e per preservare la diversità genetica delle piante per le future generazioni. L'intelligenza artificiale (AI) è in rapida evoluzione e sta influenzando molte aree della scienza e della tecnologia, compresa la genetica vegetale. L'utilizzo dell'AI in questo campo e, in particolare, dei metodi basati sulle reti complesse, permette di analizzare grandi quantità di dati in modo efficiente e permette di modellizzare sistemi costituiti da molte parti interdipendenti il cui comportamento non può essere previsto o spiegato dall’analisi dei singoli componenti. Identificare e indagare le connessioni tra le parti che compongono il sistema è fondamentale per comprendere i comportamenti emergenti, cioè i comportamenti espressione dell’intero sistema e che non potrebbero essere spiegati analizzandone singolarmente i suoi componenti. In questo lavoro proponiamo la definizione di una rete complessa costruita utilizzando come matrice di adiacenza la matrice dei coefficienti di kinship ottenuti con il metodo IBS (identity by state). Questo metodo è stato utilizzato per descrivere il grado di parentela genetica tra diverse cultivar di mandorlo. La matrice di adiacenza basata sui coefficienti di kinship modellizza le connessioni genetiche all'interno del sistema. Come caso di studio, è stato scelto una popolazione di 98 cultivar di mandorli. L’algoritmo di community detection di Louvain è stato utilizzato per l’analisi di clustering. I risultati sono stati confrontati con altri metodi parametrici e non parametrici tra cui ADMIXTURE, k-means, hierarchical clustering. Questo confronto ha permesso di identificare eventuali punti di forza e di debolezza dei vari metodi e di valutare il loro contributo alla comprensione delle relazioni genetiche tra le diverse cultivar di mandorlo.
Analisi strutturale della genetica di popolazioni vegetali: approccio basato sull’intelligenza artifi ciale e le reti complesse
Pierfrancesco Novielli;Stefano Pavan;Donato Romano;Pasquale Losciale;Anna Maria Stellacci;Domenico Diacono;Roberto Bellotti;Tangaro
2023-01-01
Abstract
L'analisi strutturale delle popolazioni vegetali attraverso dati genetici è fondamentale per comprendere e preservare la biodiversità cioè la varietà di forme di vita sul nostro pianeta. Essa comprende la diversità genetica all'interno delle specie, tra le specie e tra gli ecosistemi. La conoscenza della struttura genetica delle popolazioni è importante perché ci permette di capire come la biodiversità è stata generata e mantenuta nel corso della storia evolutiva. L'analisi di clustering utilizza algoritmi matematici per identificare le relazioni genetiche tra le popolazioni, e questo ci aiuta a scoprire le popolazioni ancestrali e le loro relazioni evolutive. Queste informazioni ci permettono di valutare l'impatto delle attività umane sulla biodiversità e di sviluppare strategie per la sua conservazione. Ad esempio, possiamo identificare le popolazioni che sono particolarmente vulnerabili e che richiedono una maggiore attenzione e protezione. Inoltre, conoscere la struttura genetica delle popolazioni ci aiuta anche a sviluppare programmi di coltivazione e conservazione delle specie che sono importanti per la sicurezza alimentare e l'equilibrio ecologico. In sintesi, l'analisi strutturale delle popolazioni vegetali attraverso dati genetici è uno strumento essenziale per comprendere la biodiversità e per preservare la diversità genetica delle piante per le future generazioni. L'intelligenza artificiale (AI) è in rapida evoluzione e sta influenzando molte aree della scienza e della tecnologia, compresa la genetica vegetale. L'utilizzo dell'AI in questo campo e, in particolare, dei metodi basati sulle reti complesse, permette di analizzare grandi quantità di dati in modo efficiente e permette di modellizzare sistemi costituiti da molte parti interdipendenti il cui comportamento non può essere previsto o spiegato dall’analisi dei singoli componenti. Identificare e indagare le connessioni tra le parti che compongono il sistema è fondamentale per comprendere i comportamenti emergenti, cioè i comportamenti espressione dell’intero sistema e che non potrebbero essere spiegati analizzandone singolarmente i suoi componenti. In questo lavoro proponiamo la definizione di una rete complessa costruita utilizzando come matrice di adiacenza la matrice dei coefficienti di kinship ottenuti con il metodo IBS (identity by state). Questo metodo è stato utilizzato per descrivere il grado di parentela genetica tra diverse cultivar di mandorlo. La matrice di adiacenza basata sui coefficienti di kinship modellizza le connessioni genetiche all'interno del sistema. Come caso di studio, è stato scelto una popolazione di 98 cultivar di mandorli. L’algoritmo di community detection di Louvain è stato utilizzato per l’analisi di clustering. I risultati sono stati confrontati con altri metodi parametrici e non parametrici tra cui ADMIXTURE, k-means, hierarchical clustering. Questo confronto ha permesso di identificare eventuali punti di forza e di debolezza dei vari metodi e di valutare il loro contributo alla comprensione delle relazioni genetiche tra le diverse cultivar di mandorlo.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.