User Tools

Site Tools


tools:pasa

Pasa

Vytvoření modelů na základě EST alignmentů.

Zpracování dat

1. vyčištění transkritpů

seqclean transcripts.fasta -v /home/thorin/Bio/UniVec/UniVec

Vytvoří následující soubory (mimo další bordel):

  • transcripts.fasta.clean - obsahuje pouze čisté sekvence
  • transcripts.fasta.cln - obsahuje report o tom, jak která sekvence dopadla při čištění. U těch sekvencí, které neprošli filtrem, je uvedeno proč.

2. Nastavení konfigurace

Je třeba zkopírovat soubor /home/thorin/Bio/pasa/PASA-r2011_05_20/pasa_conf/asa.alignAssembly.Template.txt do pracovního adresáře jako soubor align.config. Tento soubor je třeba upravit:

  • MYSQLDB=??? - databáze v MySQL, kam bude Pasa ukládat jednotlivá mapování.
  • validate_alignments_in_db.dbi:–MIN_PERCENT_ALIGNED=80 - minimální délka alignmentu je 80%
  • validate_alignments_in_db.dbi:–MIN_AVG_PER_ID=95 - minimální podobnost?
  • subcluster_builder.dbi:-m=50 - ??? je to výchozí hodnota, asi netřeba upravovat

3. Spuštění anotační pipeline

../../../pasa/PASA-r2011_05_20/scripts/Launch_PASA_pipeline.pl -c align.config -C -R -g genome.fasta -t transcripts.fasta.clean -T -u transcripts.fasta
  • -c align.config - cesta ke konfiguračnímu souboru (viz. výše).
  • -C -
  • -R -
  • -g genome.fasta - cesta k souboru se scaffoldy
  • -t transcripts.fasta.clean - cesta k vyčištěným transkriptům
tools/pasa.txt · Last modified: 2013/03/18 16:44 by thorin