Vytvoření modelů na základě EST alignmentů.
seqclean transcripts.fasta -v /home/thorin/Bio/UniVec/UniVec
Vytvoří následující soubory (mimo další bordel):
transcripts.fasta.clean
- obsahuje pouze čisté sekvencetranscripts.fasta.cln
- obsahuje report o tom, jak která sekvence dopadla při čištění. U těch sekvencí, které neprošli filtrem, je uvedeno proč.
Je třeba zkopírovat soubor /home/thorin/Bio/pasa/PASA-r2011_05_20/pasa_conf/asa.alignAssembly.Template.txt
do pracovního adresáře jako soubor align.config
. Tento soubor je třeba upravit:
MYSQLDB=???
- databáze v MySQL, kam bude Pasa ukládat jednotlivá mapování.validate_alignments_in_db.dbi:–MIN_PERCENT_ALIGNED=80
- minimální délka alignmentu je 80%validate_alignments_in_db.dbi:–MIN_AVG_PER_ID=95
- minimální podobnost?subcluster_builder.dbi:-m=50
- ??? je to výchozí hodnota, asi netřeba upravovat../../../pasa/PASA-r2011_05_20/scripts/Launch_PASA_pipeline.pl -c align.config -C -R -g genome.fasta -t transcripts.fasta.clean -T -u transcripts.fasta
-c align.config
- cesta ke konfiguračnímu souboru (viz. výše).-C
- -R
--g genome.fasta
- cesta k souboru se scaffoldy-t transcripts.fasta.clean
- cesta k vyčištěným transkriptům