クラスタル"W"
Xではない。コマンドラインで走る方である。バージョンclustalw-2.1-macosxをもとにしている。
サイズの大きなファイルも読み込めるので重宝している。しかし、variableな領域においてはアライメントの精度は良くはないので、必ずアライメント後は目でチェックする事をお勧めする
読めるファイル→NBRF-PIR, EMBL-SWISSPROT, Pearson (Fasta), Clustal (*.aln), GCG-MSF (Pileup), GCG9-RSF and GDE flat file
アライメントする
./clustalw2 -INFILE=アライメントしたい配列の名前
で一応プログラムは走る。配列はクラスタルの実行ファイルと同じフォルダに入れる.
配列中のA,T,G,C,Nの割合が75%を超えない場合はタンパク質の配列であると認識されるらしい。
ちなみに配列の名前(>名前)の中にスペースがあるとそれより後ろの名前の文字列を認識しないので注意。
アライメント結果をfastaで吐き出したい時
./clustalw2 -INFILE=アライメントしたい配列の名前 -OUTFILE=アライメントされたファイルの名前(任意) -OUTPUT=FASTA
- OUTPUTのオプションはCLUSTAL(default), GCG, GDE, PHYLIP, PIR, NEXUS, FASTAの中から選べる。指定しなかったらCLUSTALで出てくる。fasとclustalを同時に出したいんだけどどっちか1個しか出せない?わかったらまた更新する。一応
./clustalw2 -INFILE=アライメント後のファイル名 -CONVERT=フォーマット名
で、変換が可能である。-CONVERTのオプションはCLUSTAL, GCG, GDE, PHYLIP, PIR, NEXUS, FASTAが多分可能である。一応fasからクラスタルへの変更は確認した
treeをつくる
NJtreeもかける
./clustalw2 -INFILE=アライメント後のファイル名 -TREE
bootstrap treeをかきたいときは
./clustalw2 -INFILE=アライメント後のファイル名 -BOOTSTRAP
とコマンドラインに打ち込む。デフォルトでは繰り返し回数は1000回である。この回数を変えたい時には
./clustalw2 -INFILE=アライメント後のファイル名 -BOOTSTRAP=回数
とうちこむ。
最終更新:2014年09月12日 16:18