Vytvoření modelů na základě EST alignmentů.
seqclean transcripts.fasta -v /home/thorin/Bio/UniVec/UniVec
Vytvoří následující soubory (mimo další bordel):
transcripts.fasta.clean - obsahuje pouze čisté sekvencetranscripts.fasta.cln - obsahuje report o tom, jak která sekvence dopadla při čištění. U těch sekvencí, které neprošli filtrem, je uvedeno proč.
Je třeba zkopírovat soubor /home/thorin/Bio/pasa/PASA-r2011_05_20/pasa_conf/asa.alignAssembly.Template.txt do pracovního adresáře jako soubor align.config. Tento soubor je třeba upravit:
MYSQLDB=??? - databáze v MySQL, kam bude Pasa ukládat jednotlivá mapování.validate_alignments_in_db.dbi:–MIN_PERCENT_ALIGNED=80 - minimální délka alignmentu je 80%validate_alignments_in_db.dbi:–MIN_AVG_PER_ID=95 - minimální podobnost?subcluster_builder.dbi:-m=50 - ??? je to výchozí hodnota, asi netřeba upravovat../../../pasa/PASA-r2011_05_20/scripts/Launch_PASA_pipeline.pl -c align.config -C -R -g genome.fasta -t transcripts.fasta.clean -T -u transcripts.fasta
-c align.config - cesta ke konfiguračnímu souboru (viz. výše).-C - -R --g genome.fasta - cesta k souboru se scaffoldy-t transcripts.fasta.clean - cesta k vyčištěným transkriptům