クラスタル"W"

Xではない。コマンドラインで走る方である。バージョンclustalw-2.1-macosxをもとにしている。
サイズの大きなファイルも読み込めるので重宝している。しかし、variableな領域においてはアライメントの精度は良くはないので、必ずアライメント後は目でチェックする事をお勧めする

読めるファイル→NBRF-PIR, EMBL-SWISSPROT, Pearson (Fasta), Clustal (*.aln), GCG-MSF (Pileup), GCG9-RSF and GDE flat file

アライメントする


 ./clustalw2 -INFILE=アライメントしたい配列の名前

で一応プログラムは走る。配列はクラスタルの実行ファイルと同じフォルダに入れる.
配列中のA,T,G,C,Nの割合が75%を超えない場合はタンパク質の配列であると認識されるらしい。

ちなみに配列の名前(>名前)の中にスペースがあるとそれより後ろの名前の文字列を認識しないので注意。
アライメント結果をfastaで吐き出したい時

 ./clustalw2 -INFILE=アライメントしたい配列の名前 -OUTFILE=アライメントされたファイルの名前(任意) -OUTPUT=FASTA

  • OUTPUTのオプションはCLUSTAL(default), GCG, GDE, PHYLIP, PIR, NEXUS, FASTAの中から選べる。指定しなかったらCLUSTALで出てくる。fasとclustalを同時に出したいんだけどどっちか1個しか出せない?わかったらまた更新する。一応

 ./clustalw2 -INFILE=アライメント後のファイル名 -CONVERT=フォーマット名
で、変換が可能である。-CONVERTのオプションはCLUSTAL, GCG, GDE, PHYLIP, PIR, NEXUS, FASTAが多分可能である。一応fasからクラスタルへの変更は確認した

treeをつくる

NJtreeもかける
 ./clustalw2 -INFILE=アライメント後のファイル名 -TREE
bootstrap treeをかきたいときは
 ./clustalw2 -INFILE=アライメント後のファイル名 -BOOTSTRAP
とコマンドラインに打ち込む。デフォルトでは繰り返し回数は1000回である。この回数を変えたい時には
 ./clustalw2 -INFILE=アライメント後のファイル名 -BOOTSTRAP=回数
とうちこむ。
最終更新:2014年09月12日 16:18