Introduzione alla Genomica e alla Bioinformatica - (1 Giorno?)
Introduction to Genomics and Galaxy → 2,5 ore // il titolo è fuorviante, l’esercizio rientra nella parte DNA RNA SEQ ANALYSIS. Il nuovo titolo potrebbe essere “Fom Quality Control to Variant Identification: A Hands-On Guide to Genomic Data Analysis in Galaxy”
Il tutorial che hai fornito sembra coprire diversi aspetti della bioinformatica applicata alla genomica. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Corrispondenza nel tutorial: "Get human data" potrebbe riguardare l'acquisizione di dati di sequenziamento. Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Corrispondenza nel tutorial: "Split the genes into forward and reverse datasets" e "Check for overlaps" potrebbero riguardare la comparazione e l'analisi di geni. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Corrispondenza nel tutorial: "Get data into Galaxy" e "Examine the data" riguardano l'importazione, l'esame e la gestione dei dati all'interno della piattaforma Galaxy. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: "Walk through the workflow tutorial" potrebbe riguardare l'apprendimento di come utilizzare e combinare diversi strumenti in Galaxy per creare un flusso di lavoro. In sintesi, il tutorial sembra concentrarsi principalmente sull'uso della piattaforma Galaxy per gestire e analizzare dati genetici, con un particolare focus sulla comparazione di geni e sulla creazione di flussi di lavoro. Si colloca quindi principalmente nei punti 6 e 11, con riferimenti anche al punto 12.
Analisi di sequenza di DNA e RNA → (2 giorni?)
Quality Control → 90 minuti Il tutorial che hai fornito si concentra principalmente sull'analisi della qualità delle sequenze e sul preprocessing dei dati di sequenziamento. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Corrispondenza nel tutorial: "Inspect a raw sequence file" riguarda l'esame dei dati grezzi provenienti da sequenziatori. Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Non menzionato direttamente nel tutorial. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: L'intero tutorial riguarda l'uso di diversi strumenti e software (come FASTQE, FastQC, Nanoplot, PycoQC) per analizzare e migliorare la qualità delle sequenze. Questo si riferisce all'uso di algoritmi e software specifici per analizzare i dati. In sintesi, il tutorial si colloca principalmente nel punto 1, con un forte focus sull'analisi della qualità delle sequenze e sul preprocessing dei dati di sequenziamento, e nel punto 12, poiché utilizza diversi strumenti software per eseguire queste analisi.
Il tutorial che hai fornito si concentra sull'analisi e la visualizzazione delle sequenze mappate su un genoma di riferimento. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Non menzionato direttamente nel tutorial, ma il processo di mappatura delle letture implica che siano stati sequenziati. Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial, ma i browser del genoma come IGV e JBrowse sono spesso utilizzati per visualizzare le annotazioni. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Corrispondenza nel tutorial: "Map reads on a reference genome" riguarda l'allineamento delle sequenze su un genoma di riferimento, che è una forma di comparazione. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial, ma l'ispezione di un file BAM e la visualizzazione con un browser del genoma potrebbero essere utilizzate in questo contesto. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Non menzionato direttamente nel tutorial. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: L'uso di strumenti specifici come IGV, JBrowse e il processo di mappatura delle letture su un genoma di riferimento implicano l'uso di algoritmi e software specifici. In sintesi, il tutorial si colloca principalmente nei punti 6 e 12, con un focus sull'allineamento delle sequenze su un genoma di riferimento e sulla visualizzazione dei risultati utilizzando specifici browser del genoma.
SARS-CoV-2 Viral Sample Alignment and Variant Visualization → 60 minuti Il tutorial che hai fornito si concentra sull'allineamento delle sequenze del virus SARS-CoV-2 e sulla visualizzazione delle varianti. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Corrispondenza nel tutorial: "The Sequencing Revolution" discute l'evoluzione e l'importanza del sequenziamento. Corrispondenza nel tutorial: "How do I put together my dataset of fragmented sequences into a full sequence?" suggerisce che ci potrebbe essere un'attività di assemblaggio, anche se non è esplicitamente menzionato. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Corrispondenza nel tutorial: "Alignment" e "Viewing aligned data" riguardano l'allineamento delle sequenze, che è una forma di comparazione. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Corrispondenza nel tutorial: "What is a Variant?" e l'obiettivo di esplorare visivamente le varianti nel campione di SARS-CoV-2 si riferiscono all'analisi delle varianti. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Corrispondenza nel tutorial: L'uso di Galaxy, una piattaforma bioinformatica, e l'importazione di dati in Galaxy. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: L'uso di Galaxy, un'interfaccia basata su software, per eseguire analisi bioinformatiche. In sintesi, il tutorial si colloca principalmente nei punti 1, 6, 9, 11 e 12, con un focus sull'allineamento delle sequenze del virus SARS-CoV-2, sulla visualizzazione delle varianti, sull'uso della piattaforma Galaxy e sulla comprensione dei concetti di base della bioinformatica e del sequenziamento.
NCBI BLAST+ against the MAdLand - 15 minuti
Il tutorial che hai fornito si concentra sull'uso di NCBI BLAST+ per eseguire analisi di similarità contro il database MAdLandDB. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Non menzionato direttamente nel tutorial, ma l'uso di sequenze FASTA suggerisce che ci sono dati sequenziati. Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Corrispondenza nel tutorial: "Perform NCBI Blast+ on Galaxy" e "Blast output" riguardano la comparazione di sequenze utilizzando BLAST, che è uno strumento di comparazione di sequenze. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial, ma BLAST può essere utilizzato in analisi filogenetiche. Database genetici e bioinformatici: Corrispondenza nel tutorial: "What is MAdLand DB?" e la descrizione di MAdLandDB indicano l'uso e la comprensione di un database bioinformatico specifico. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: L'uso di Galaxy e NCBI BLAST+ indica l'uso di software specifici per eseguire analisi bioinformatiche. In sintesi, il tutorial si colloca principalmente nei punti 1, 6, 11 e 12, con un focus sull'uso di BLAST per comparare sequenze, sulla comprensione e l'uso del database MAdLandDB e sull'uso della piattaforma Galaxy per eseguire analisi bioinformatiche.
Analisi di Espressioni Genica e RNA-seq: (4 Giorni?)
RNA-based RNA-Seq data analysis → 8 ore Il tutorial che hai fornito riguarda l'analisi dei dati RNA-Seq, che è una tecnica utilizzata per studiare l'espressione genica. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Corrispondenza nel tutorial: L'intero tutorial riguarda l'analisi dei dati RNA-Seq, che sono generati attraverso il sequenziamento dell'RNA. Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Corrispondenza nel tutorial: L'obiettivo principale del tutorial è identificare geni o percorsi molecolari che sono espressi in modo differenziale tra diverse condizioni biologiche. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Corrispondenza nel tutorial: L'analisi dei percorsi KEGG è una parte dell'analisi delle vie metaboliche. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Corrispondenza nel tutorial: Viene menzionato l'uso del NCBI Gene Expression Omnibus (GEO) e del Sequence Read Archive (SRA) per ottenere dati originali. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: Viene menzionato l'uso di vari strumenti e piattaforme, come DESeq2, per eseguire analisi bioinformatiche. In sintesi, il tutorial si colloca principalmente nei punti 1, 4, 8, 11 e 12, con un focus sull'analisi dell'espressione genica, l'analisi delle vie metaboliche, l'uso di database bioinformatici e l'uso di software specifici per eseguire analisi bioinformatiche.
RNA-seq Alignment with STAR → 90 min l tutorial che hai fornito riguarda l'analisi dei dati RNA-Seq, con un focus sull'allineamento delle sequenze RNA e sulla stima del numero di letture per gene. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Corrispondenza nel tutorial: L'intero tutorial riguarda l'analisi dei dati RNA-Seq, che sono generati attraverso il sequenziamento dell'RNA. Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Corrispondenza nel tutorial: L'obiettivo principale del tutorial è identificare geni o percorsi molecolari che sono espressi in modo differenziale tra diverse condizioni biologiche. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Corrispondenza nel tutorial: Viene menzionato l'uso del NCBI Gene Expression Omnibus (GEO) e del Sequence Read Archive (SRA) per ottenere dati originali. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: Viene menzionato l'uso di vari strumenti, come STAR, per eseguire analisi bioinformatiche. In sintesi, il tutorial si colloca principalmente nei punti 1, 4, 11 e 12, con un focus sull'analisi dell'espressione genica, l'uso di database bioinformatici e l'uso di software specifici per eseguire analisi bioinformatiche.
Elaborazione dei dati e Visualizzazione (6 giorni?)
Genomic Data Visualisation with JBrowse - 60 minuti
Il tutorial che hai fornito riguarda la visualizzazione di dati genomici utilizzando JBrowse, uno strumento di navigazione del genoma. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Corrispondenza nel tutorial: Viene menzionata la visualizzazione dei dati di sequenziamento. Non menzionato direttamente nel tutorial. Corrispondenza nel tutorial: JBrowse può visualizzare tracce di geni (Simple Gene Tracks e Complex Gene Tracks), che sono legate all'annotazione del genoma. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Corrispondenza nel tutorial: La sezione "Sequencing, Coverage, and Variation" potrebbe riguardare la visualizzazione di varianti genetiche. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Corrispondenza nel tutorial: Viene menzionato l'uso di JBrowse, uno strumento di navigazione del genoma, e vengono accettati dati in molti formati, tra cui GFF/GFF3, BED, GenBank, ecc. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: Viene menzionato l'uso di JBrowse e le sue diverse versioni, nonché le sue opzioni e funzionalità. In sintesi, il tutorial si colloca principalmente nei punti 1, 3, 9, 11 e 12, con un focus sulla visualizzazione di dati genomici, l'annotazione del genoma, la visualizzazione di varianti genetiche, l'uso di database bioinformatici e l'uso di software specifici per la visualizzazione.
Data Manipulation Olympics - 60 min
da verificare se funziona con Galaxy.org
Il tutorial che hai fornito riguarda la manipolazione dei dati in Galaxy, concentrandosi su operazioni di base come la conversione, la formattazione, il filtraggio, l'ordinamento e altre operazioni su dati basati su testo. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Corrispondenza nel tutorial: Il tutorial si concentra sulla manipolazione dei dati in Galaxy, un ambiente di analisi bioinformatica. Gli strumenti e le tecniche menzionati sono fondamentali per preparare e manipolare i dati prima di utilizzare database e altri strumenti bioinformatici. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: Anche se il tutorial non si concentra sullo sviluppo di software, presenta una serie di strumenti e tecniche disponibili in Galaxy per la manipolazione dei dati, che sono fondamentali per preparare i dati per analisi più complesse. In sintesi, il tutorial si colloca principalmente nei punti 11 e 12, con un focus sulla manipolazione dei dati in Galaxy, l'uso di strumenti per convertire, filtrare, ordinare e altre operazioni su dati basati su testo, e la preparazione dei dati per analisi più complesse in bioinformatica.
Assembly of metagenomic sequencing data - 2 ore
a verificare che funzioni su galaxy.org
Il tutorial che hai fornito riguarda l'assemblaggio dei dati di sequenziamento metagenomico. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:
Sequenziamento del DNA e RNA: Corrispondenza nel tutorial: Il tutorial menziona il sequenziamento metagenomico, che è una forma di sequenziamento del DNA. Corrispondenza diretta nel tutorial: L'obiettivo principale del tutorial è l'assemblaggio dei dati di sequenziamento metagenomico. Non menzionato direttamente nel tutorial. Analisi dell'espressione genica: Non menzionato direttamente nel tutorial. Studi di associazione genomica: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Predizione della struttura delle proteine: Non menzionato direttamente nel tutorial. Analisi delle vie metaboliche: Non menzionato direttamente nel tutorial. Analisi di varianti genetiche: Non menzionato direttamente nel tutorial. Non menzionato direttamente nel tutorial. Database genetici e bioinformatici: Corrispondenza nel tutorial: Viene menzionato l'uso di diversi assemblatori e strumenti, come metaSPAdes e MEGAHIT, e si fa riferimento a studi e iniziative come la Critical Assessment of Metagenome Interpretation. Sviluppo di software e algoritmi: Corrispondenza nel tutorial: Viene discussa la logica dietro gli strumenti basati sul grafo De Bruijn e come funzionano. In sintesi, il tutorial si colloca principalmente nei punti 1, 2, e 11, con un focus sull'assemblaggio dei dati di sequenziamento metagenomico, l'uso di diversi strumenti e assemblatori, e la valutazione della qualità degli assemblaggi generati.