※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

wgetでファイルを一括ダウンロード

今のマシン環境 mac OS10.5
wgetのバージョン wget-1.10.2

http://ftp.gnu.org/gnu/wget/からソースをゲット
フォルダを展開してそのフォルダ内に移動
①./configure
②make
③make installでOK
うまく行かない場合はsudoをつけてやってみて

④実行ファイルがsrcフォルダの中にあるから、新しいフォルダの中にコピーするなりそのまま使うなりする

データのダウンロード
NCBIからゲノムの情報を一括で取ってきたい場合とか
wget オプション URL
基本的なコマンドはこちらhttp://bioinfo-goto.seesaa.net/article/1733498.htmlを参照されたし

拡張子を指定して(fnaファイルだけとか)ファイルの取得を行いたい場合
wget -r -np --wait=10 --no-host-directories -A 取得したいファイルの拡張子1,取得したいファイルの拡張子2 ftp://ftp.ncbi.nih.gov/genomes/Bacteria/

wgetではURLで指定したフォルダ以下の階層にあるファイルを全部取ってくる
従って、例えばバクテリアの塩基配列(fnaファイル)とORF毎に区切った塩基配列(gffファイル)のみを落としたいときは
wget -r -np --wait=10 --no-host-directories -A fna,gff ftp://ftp.ncbi.nih.gov/genomes/Bacteria/
とする

フォルダの階層構造は、NCBIのデータベース上のものがそのまま復元される


参考にしたサイト
wgetの使い方 http://tech.bayashi.net/svr/doc/wget.html
それゆけバイオインフォマティクス http://bioinfo-goto.seesaa.net/