Pasa

Vytvoření modelů na základě EST alignmentů.

Zpracování dat

1. vyčištění transkritpů

seqclean transcripts.fasta -v /home/thorin/Bio/UniVec/UniVec

Vytvoří následující soubory (mimo další bordel):

transcripts.fasta.clean - obsahuje pouze čisté sekvence
transcripts.fasta.cln - obsahuje report o tom, jak která sekvence dopadla při čištění. U těch sekvencí, které neprošli filtrem, je uvedeno proč.

2. Nastavení konfigurace

Je třeba zkopírovat soubor /home/thorin/Bio/pasa/PASA-r2011_05_20/pasa_conf/asa.alignAssembly.Template.txt do pracovního adresáře jako soubor align.config. Tento soubor je třeba upravit:

MYSQLDB=??? - databáze v MySQL, kam bude Pasa ukládat jednotlivá mapování.
validate_alignments_in_db.dbi:–MIN_PERCENT_ALIGNED=80 - minimální délka alignmentu je 80%
validate_alignments_in_db.dbi:–MIN_AVG_PER_ID=95 - minimální podobnost?
subcluster_builder.dbi:-m=50 - ??? je to výchozí hodnota, asi netřeba upravovat

3. Spuštění anotační pipeline

../../../pasa/PASA-r2011_05_20/scripts/Launch_PASA_pipeline.pl -c align.config -C -R -g genome.fasta -t transcripts.fasta.clean -T -u transcripts.fasta

-c align.config - cesta ke konfiguračnímu souboru (viz. výše).
-C -
-R -
-g genome.fasta - cesta k souboru se scaffoldy
-t transcripts.fasta.clean - cesta k vyčištěným transkriptům

Biowiki

Table of Contents

Pasa

Zpracování dat

1. vyčištění transkritpů

2. Nastavení konfigurace

3. Spuštění anotační pipeline

Biowiki

User Tools

Site Tools

Table of Contents

Pasa

Zpracování dat

1. vyčištění transkritpů

2. Nastavení konfigurace

3. Spuštění anotační pipeline

Page Tools