ESERCIZI DEFINITIVI

Introduzione alla Genomica e alla Bioinformatica - (1 Giorno?)

⁠

Introduction to Genomics and Galaxy → 2,5 ore

@Luciano Marino

⁠

// il titolo è fuorviante, l’esercizio rientra nella parte DNA RNA SEQ ANALYSIS. Il nuovo titolo potrebbe essere “Fom Quality Control to Variant Identification: A Hands-On Guide to Genomic Data Analysis in Galaxy”

⁠

https://training.galaxyproject.org/training-material/topics/introduction/tutorials/galaxy-intro-strands/tutorial.html⁠

⁠

Il tutorial che hai fornito sembra coprire diversi aspetti della bioinformatica applicata alla genomica. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Corrispondenza nel tutorial: "Get human data" potrebbe riguardare l'acquisizione di dati di sequenziamento.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Non menzionato direttamente nel tutorial.

Analisi dell'espressione genica:

Non menzionato direttamente nel tutorial.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Corrispondenza nel tutorial: "Split the genes into forward and reverse datasets" e "Check for overlaps" potrebbero riguardare la comparazione e l'analisi di geni.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Non menzionato direttamente nel tutorial.

Analisi di varianti genetiche:

Non menzionato direttamente nel tutorial.

Filogenetica:

Non menzionato direttamente nel tutorial.

Database genetici e bioinformatici:

Corrispondenza nel tutorial: "Get data into Galaxy" e "Examine the data" riguardano l'importazione, l'esame e la gestione dei dati all'interno della piattaforma Galaxy.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: "Walk through the workflow tutorial" potrebbe riguardare l'apprendimento di come utilizzare e combinare diversi strumenti in Galaxy per creare un flusso di lavoro.

In sintesi, il tutorial sembra concentrarsi principalmente sull'uso della piattaforma Galaxy per gestire e analizzare dati genetici, con un particolare focus sulla comparazione di geni e sulla creazione di flussi di lavoro. Si colloca quindi principalmente nei punti 6 e 11, con riferimenti anche al punto 12.

⁠

Analisi di sequenza di DNA e RNA → (2 giorni?)

⁠

Quality Control → 90 minuti

@Claudio Miglionico

⁠

https://training.galaxyproject.org/training-material/topics/sequence-analysis/tutorials/quality-control/tutorial.html⁠

⁠

Il tutorial che hai fornito si concentra principalmente sull'analisi della qualità delle sequenze e sul preprocessing dei dati di sequenziamento. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Corrispondenza nel tutorial: "Inspect a raw sequence file" riguarda l'esame dei dati grezzi provenienti da sequenziatori.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Non menzionato direttamente nel tutorial.

Analisi dell'espressione genica:

Non menzionato direttamente nel tutorial.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Non menzionato direttamente nel tutorial.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Non menzionato direttamente nel tutorial.

Analisi di varianti genetiche:

Non menzionato direttamente nel tutorial.

Filogenetica:

Non menzionato direttamente nel tutorial.

Database genetici e bioinformatici:

Non menzionato direttamente nel tutorial.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: L'intero tutorial riguarda l'uso di diversi strumenti e software (come FASTQE, FastQC, Nanoplot, PycoQC) per analizzare e migliorare la qualità delle sequenze. Questo si riferisce all'uso di algoritmi e software specifici per analizzare i dati.

In sintesi, il tutorial si colloca principalmente nel punto 1, con un forte focus sull'analisi della qualità delle sequenze e sul preprocessing dei dati di sequenziamento, e nel punto 12, poiché utilizza diversi strumenti software per eseguire queste analisi.

⁠

Mapping → 60 minuti

@Mariassunta Telesca

⁠

https://training.galaxyproject.org/training-material/topics/sequence-analysis/tutorials/mapping/tutorial.html⁠

⁠

Il tutorial che hai fornito si concentra sull'analisi e la visualizzazione delle sequenze mappate su un genoma di riferimento. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Non menzionato direttamente nel tutorial, ma il processo di mappatura delle letture implica che siano stati sequenziati.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Non menzionato direttamente nel tutorial, ma i browser del genoma come IGV e JBrowse sono spesso utilizzati per visualizzare le annotazioni.

Analisi dell'espressione genica:

Non menzionato direttamente nel tutorial.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Corrispondenza nel tutorial: "Map reads on a reference genome" riguarda l'allineamento delle sequenze su un genoma di riferimento, che è una forma di comparazione.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Non menzionato direttamente nel tutorial.

Analisi di varianti genetiche:

Non menzionato direttamente nel tutorial, ma l'ispezione di un file BAM e la visualizzazione con un browser del genoma potrebbero essere utilizzate in questo contesto.

Filogenetica:

Non menzionato direttamente nel tutorial.

Database genetici e bioinformatici:

Non menzionato direttamente nel tutorial.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: L'uso di strumenti specifici come IGV, JBrowse e il processo di mappatura delle letture su un genoma di riferimento implicano l'uso di algoritmi e software specifici.

In sintesi, il tutorial si colloca principalmente nei punti 6 e 12, con un focus sull'allineamento delle sequenze su un genoma di riferimento e sulla visualizzazione dei risultati utilizzando specifici browser del genoma.

⁠

SARS-CoV-2 Viral Sample Alignment and Variant Visualization → 60 minuti

@Claudio Miglionico

⁠

https://training.galaxyproject.org/training-material/topics/sequence-analysis/tutorials/sars-with-galaxy-on-anvil/tutorial.html⁠

⁠

Il tutorial che hai fornito si concentra sull'allineamento delle sequenze del virus SARS-CoV-2 e sulla visualizzazione delle varianti. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Corrispondenza nel tutorial: "The Sequencing Revolution" discute l'evoluzione e l'importanza del sequenziamento.

Assemblaggio del genoma:

Corrispondenza nel tutorial: "How do I put together my dataset of fragmented sequences into a full sequence?" suggerisce che ci potrebbe essere un'attività di assemblaggio, anche se non è esplicitamente menzionato.

Annotazione del genoma:

Non menzionato direttamente nel tutorial.

Analisi dell'espressione genica:

Non menzionato direttamente nel tutorial.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Corrispondenza nel tutorial: "Alignment" e "Viewing aligned data" riguardano l'allineamento delle sequenze, che è una forma di comparazione.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Non menzionato direttamente nel tutorial.

Analisi di varianti genetiche:

Corrispondenza nel tutorial: "What is a Variant?" e l'obiettivo di esplorare visivamente le varianti nel campione di SARS-CoV-2 si riferiscono all'analisi delle varianti.

Filogenetica:

Non menzionato direttamente nel tutorial.

Database genetici e bioinformatici:

Corrispondenza nel tutorial: L'uso di Galaxy, una piattaforma bioinformatica, e l'importazione di dati in Galaxy.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: L'uso di Galaxy, un'interfaccia basata su software, per eseguire analisi bioinformatiche.

In sintesi, il tutorial si colloca principalmente nei punti 1, 6, 9, 11 e 12, con un focus sull'allineamento delle sequenze del virus SARS-CoV-2, sulla visualizzazione delle varianti, sull'uso della piattaforma Galaxy e sulla comprensione dei concetti di base della bioinformatica e del sequenziamento.

⁠

⁠
⁠
NCBI BLAST+ against the MAdLand - 15 minuti
`@Mariassunta Telesca`
⁠

⁠

https://training.galaxyproject.org/training-material/topics/sequence-analysis/tutorials/ncbi-blast-against-the-madland/tutorial.html⁠

⁠

sezione 2

Il tutorial che hai fornito si concentra sull'uso di NCBI BLAST+ per eseguire analisi di similarità contro il database MAdLandDB. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Non menzionato direttamente nel tutorial, ma l'uso di sequenze FASTA suggerisce che ci sono dati sequenziati.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Non menzionato direttamente nel tutorial.

Analisi dell'espressione genica:

Non menzionato direttamente nel tutorial.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Corrispondenza nel tutorial: "Perform NCBI Blast+ on Galaxy" e "Blast output" riguardano la comparazione di sequenze utilizzando BLAST, che è uno strumento di comparazione di sequenze.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Non menzionato direttamente nel tutorial.

Analisi di varianti genetiche:

Non menzionato direttamente nel tutorial.

Filogenetica:

Non menzionato direttamente nel tutorial, ma BLAST può essere utilizzato in analisi filogenetiche.

Database genetici e bioinformatici:

Corrispondenza nel tutorial: "What is MAdLand DB?" e la descrizione di MAdLandDB indicano l'uso e la comprensione di un database bioinformatico specifico.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: L'uso di Galaxy e NCBI BLAST+ indica l'uso di software specifici per eseguire analisi bioinformatiche.

In sintesi, il tutorial si colloca principalmente nei punti 1, 6, 11 e 12, con un focus sull'uso di BLAST per comparare sequenze, sulla comprensione e l'uso del database MAdLandDB e sull'uso della piattaforma Galaxy per eseguire analisi bioinformatiche.

⁠

Analisi di Espressioni Genica e RNA-seq: (4 Giorni?)

⁠

RNA-based RNA-Seq data analysis → 8 ore

@Mariassunta Telesca

⁠

https://training.galaxyproject.org/training-material/topics/transcriptomics/tutorials/ref-based/tutorial.html⁠

⁠

sezione 4

Il tutorial che hai fornito riguarda l'analisi dei dati RNA-Seq, che è una tecnica utilizzata per studiare l'espressione genica. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Corrispondenza nel tutorial: L'intero tutorial riguarda l'analisi dei dati RNA-Seq, che sono generati attraverso il sequenziamento dell'RNA.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Non menzionato direttamente nel tutorial.

Analisi dell'espressione genica:

Corrispondenza nel tutorial: L'obiettivo principale del tutorial è identificare geni o percorsi molecolari che sono espressi in modo differenziale tra diverse condizioni biologiche.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Non menzionato direttamente nel tutorial.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Corrispondenza nel tutorial: L'analisi dei percorsi KEGG è una parte dell'analisi delle vie metaboliche.

Analisi di varianti genetiche:

Non menzionato direttamente nel tutorial.

Filogenetica:

Non menzionato direttamente nel tutorial.

Database genetici e bioinformatici:

Corrispondenza nel tutorial: Viene menzionato l'uso del NCBI Gene Expression Omnibus (GEO) e del Sequence Read Archive (SRA) per ottenere dati originali.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: Viene menzionato l'uso di vari strumenti e piattaforme, come DESeq2, per eseguire analisi bioinformatiche.

In sintesi, il tutorial si colloca principalmente nei punti 1, 4, 8, 11 e 12, con un focus sull'analisi dell'espressione genica, l'analisi delle vie metaboliche, l'uso di database bioinformatici e l'uso di software specifici per eseguire analisi bioinformatiche.

⁠

RNA-seq Alignment with STAR → 90 min

@Mariassunta Telesca

⁠

https://training.galaxyproject.org/training-material//topics/transcriptomics/tutorials/rna-seq-bash-star-align/tutorial.html⁠

⁠

sezione 4

l tutorial che hai fornito riguarda l'analisi dei dati RNA-Seq, con un focus sull'allineamento delle sequenze RNA e sulla stima del numero di letture per gene. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Corrispondenza nel tutorial: L'intero tutorial riguarda l'analisi dei dati RNA-Seq, che sono generati attraverso il sequenziamento dell'RNA.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Non menzionato direttamente nel tutorial.

Analisi dell'espressione genica:

Corrispondenza nel tutorial: L'obiettivo principale del tutorial è identificare geni o percorsi molecolari che sono espressi in modo differenziale tra diverse condizioni biologiche.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Non menzionato direttamente nel tutorial.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Non menzionato direttamente nel tutorial.

Analisi di varianti genetiche:

Non menzionato direttamente nel tutorial.

Filogenetica:

Non menzionato direttamente nel tutorial.

Database genetici e bioinformatici:

Corrispondenza nel tutorial: Viene menzionato l'uso del NCBI Gene Expression Omnibus (GEO) e del Sequence Read Archive (SRA) per ottenere dati originali.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: Viene menzionato l'uso di vari strumenti, come STAR, per eseguire analisi bioinformatiche.

In sintesi, il tutorial si colloca principalmente nei punti 1, 4, 11 e 12, con un focus sull'analisi dell'espressione genica, l'uso di database bioinformatici e l'uso di software specifici per eseguire analisi bioinformatiche.

⁠

Elaborazione dei dati e Visualizzazione (6 giorni?)

⁠
⁠
Genomic Data Visualisation with JBrowse - 60 minuti
`@Luciano Marino`
⁠

⁠

https://training.galaxyproject.org/training-material/topics/visualisation/tutorials/jbrowse/tutorial.html⁠

⁠

Il tutorial che hai fornito riguarda la visualizzazione di dati genomici utilizzando JBrowse, uno strumento di navigazione del genoma. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Corrispondenza nel tutorial: Viene menzionata la visualizzazione dei dati di sequenziamento.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Corrispondenza nel tutorial: JBrowse può visualizzare tracce di geni (Simple Gene Tracks e Complex Gene Tracks), che sono legate all'annotazione del genoma.

Analisi dell'espressione genica:

Non menzionato direttamente nel tutorial.

Studi di associazione genomica:

Non menzionato direttamente nel tutorial.

Comparazione di genomi:

Non menzionato direttamente nel tutorial.

Predizione della struttura delle proteine:

Non menzionato direttamente nel tutorial.

Analisi delle vie metaboliche:

Non menzionato direttamente nel tutorial.

Analisi di varianti genetiche:

Corrispondenza nel tutorial: La sezione "Sequencing, Coverage, and Variation" potrebbe riguardare la visualizzazione di varianti genetiche.

Filogenetica:

Non menzionato direttamente nel tutorial.

Database genetici e bioinformatici:

Corrispondenza nel tutorial: Viene menzionato l'uso di JBrowse, uno strumento di navigazione del genoma, e vengono accettati dati in molti formati, tra cui GFF/GFF3, BED, GenBank, ecc.

Sviluppo di software e algoritmi:

Corrispondenza nel tutorial: Viene menzionato l'uso di JBrowse e le sue diverse versioni, nonché le sue opzioni e funzionalità.

In sintesi, il tutorial si colloca principalmente nei punti 1, 3, 9, 11 e 12, con un focus sulla visualizzazione di dati genomici, l'annotazione del genoma, la visualizzazione di varianti genetiche, l'uso di database bioinformatici e l'uso di software specifici per la visualizzazione.

⁠

⁠
⁠
Data Manipulation Olympics - 60 min
`@Mariassunta Telesca`
⁠

⁠

https://training.galaxyproject.org/training-material//topics/introduction/tutorials/data-manipulation-olympics/tutorial.html⁠

⁠

da verificare se funziona con Galaxy.org

Il tutorial che hai fornito riguarda la manipolazione dei dati in Galaxy, concentrandosi su operazioni di base come la conversione, la formattazione, il filtraggio, l'ordinamento e altre operazioni su dati basati su testo. Ecco come si potrebbe mappare il contenuto del tutorial ai 12 punti che abbiamo discusso:

Sequenziamento del DNA e RNA:

Non menzionato direttamente nel tutorial.

Assemblaggio del genoma:

Non menzionato direttamente nel tutorial.

Annotazione del genoma:

Want to print your doc?
This is not the way.

Try clicking the ··· in the right corner or using a keyboard shortcut (

CtrlP

) instead.

ESERCIZI DEFINITIVI

Introduzione alla Genomica e alla Bioinformatica - (1 Giorno?)

Analisi di sequenza di DNA e RNA → (2 giorni?)

⁠⁠ NCBI BLAST+ against the MAdLand - 15 minuti @Mariassunta Telesca⁠

sezione 2

Analisi di Espressioni Genica e RNA-seq: (4 Giorni?)

sezione 4

sezione 4

Elaborazione dei dati e Visualizzazione (6 giorni?)

⁠⁠ Genomic Data Visualisation with JBrowse - 60 minuti @Luciano Marino⁠

⁠⁠ Data Manipulation Olympics - 60 min @Mariassunta Telesca⁠

da verificare se funziona con Galaxy.org

⁠
⁠
NCBI BLAST+ against the MAdLand - 15 minuti
`@Mariassunta Telesca`
⁠

⁠
⁠
Genomic Data Visualisation with JBrowse - 60 minuti
`@Luciano Marino`
⁠

⁠
⁠
Data Manipulation Olympics - 60 min
`@Mariassunta Telesca`
⁠