Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

21
Bioinformatics Training Introduction to Perl Programming Andrea Telatin

description

Ripasso della shell, lancio di alcuni programmi bioinformatici (BWA, samtools), visualizzazione file con IGV. E primi passi in Perl.

Transcript of Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Page 1: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Bioinformatics TrainingIntroduction to Perl Programming

Andrea Telatin

Page 2: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

We started with…

1. Most bioinformatics file formats are text files!

2. There are quite a few robust programs

3. Our goal is often to create a pipeline

4. For most pipelines we need some glue

Page 3: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Re-loading…

Page 4: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Re-loading…

BASH COMMANDS

BIO TOOLS

PERL

Page 5: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

Playing with the BASH

• Example 1:

• Download 3 to 5 PNG images from the web

• Install the program “ImageMagik” using the repository (apt-get…)

BASH COMMANDS

BIO TOOLS

Page 6: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

Playing with the BASH

• Move to the download images directory

• Type “convert -resize 50% image1.png small1.png”

• How to automate the process to create a smaller version of all the images?

BASH COMMANDS

BIO TOOLS

Page 7: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

Playing with the BASH

• Remember of the “man command”

• Never forget about google

BASH COMMANDS

BIO TOOLS

Page 8: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

Playing with the BASH• Now you should create a directory for today’s tasks

• Then download into it (using wget):

• http://www.telatin.com/reads.tar.gz

• http://www.telatin.com/amplicon.tar.gz

• The human chromosome 2 (hg19)

BASH COMMANDS

BIO TOOLS

Page 9: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

Reads alignments• Extract the .tar.gz archives using tar. Check via

google how to do this (tar is a strange program)

• Now we have to install bwa to align reads. We can use the repository again.

BASH COMMANDS

BIO TOOLS

PERL

Page 10: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

Reads alignments• Create an index: bwa index genome.fa

• Align reads: bwa mem genome.fa reads.fastq > output.sam

BASH COMMANDS

BIO TOOLS

PERL

Page 11: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

SAMtools• Download them via the repository

• SAM to BAM pipeline: • samtools view -bS file.sam > file.bam • samtools sort file.bam sorted_file • samtools index sorted_file.bam

BASH COMMANDS

BIO TOOLS

PERL

Page 12: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

IGV• DON’T Download it via the repository. Download it

from the internet!

• Unzip it into a directory (eg: IGV in your home)

• Launch it with the terminal: “sh igv.sh”

BASH COMMANDS

BIO TOOLS

PERL

Page 13: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

IGV

• Load as genome the human chromosome 2

• Load as tracks both the BED and the BAM files

BASH COMMANDS

BIO TOOLS

PERL

Page 14: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Andrea TelatinBecoming a Bioinformatician

BASH COMMANDS

BIO TOOLS

PERL

BED/GFF

VCF

BAM

Page 15: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Programming:an introduction

BASH COMMANDS

BIO TOOLS

PERL

Page 16: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

INPUT (files, parameters) ELABORATION (steps to transform the input) !OUTPUT (files, text…)

Page 17: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

INPUT (files, parameters) ELABORATION (steps to transform the input) !OUTPUT (files, text…)

Try thinking about “grep” or “head”

Page 18: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Imitare i programmi della shell è un buon modo per farne!di validi.!I programmi della shell:

• Hanno una guida (documentazione) • Hanno dei comportamenti standardizzati (si imparano

in fretta una volta imparati questi standard) • Sono robusti (controllano l’input, danno errori che ci

aiutano a lanciarli correttamente)

Page 19: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Programmare significa saper scomporre il !nostro obiettivo in passaggi !che un computer possa effettuare.

Page 20: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

Programming:a live introduction

Page 21: Bioinformatica: introduzione (BMR Genomics) - Lezione 25 luglio 2014

http://www.codepad.org/

Possiamo usare per le piccole “prove” un sistema online per interpretare codice Perl