「wget」の編集履歴(バックアップ)一覧はこちら
「wget」(2011/10/29 (土) 15:41:24) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
wgetでファイルを一括ダウンロード
今のマシン環境 mac OS10.5
wgetのバージョン wget-1.10.2
http://ftp.gnu.org/gnu/wget/からソースをゲット
フォルダを展開してそのフォルダ内に移動
①./configure
②make
③make installでOK
うまく行かない場合はsudoをつけてやってみて
データのダウンロード
NCBIからゲノムの情報を一括で取ってきたい場合とか
>wget オプション URL
基本的なコマンドはこちらhttp://bioinfo-goto.seesaa.net/article/1733498.htmlを参照されたし
拡張子を指定して(fnaファイルだけとか)ファイルの取得を行いたい場合
>wget -r -np --wait=10 --no-host-directories -A 取得したいファイルの拡張子1,取得したいファイルの拡張子2 ftp://ftp.ncbi.nih.gov/genomes/Bacteria/
wgetではURLで指定したフォルダ以下の階層にあるファイルを全部取ってくる
従って、例えばバクテリアの塩基配列(fnaファイル)とORF毎に区切った塩基配列(gffファイル)のみを落としたいときは
>wget -r -np --wait=10 --no-host-directories -A fna,gff ftp://ftp.ncbi.nih.gov/genomes/Bacteria/
とする
フォルダの階層構造は、NCBIのデータベース上のものがそのまま復元される
参考にしたサイト
wgetの使い方 http://tech.bayashi.net/svr/doc/wget.html
それゆけバイオインフォマティクス http://bioinfo-goto.seesaa.net/
wgetでファイルを一括ダウンロード
今のマシン環境 mac OS10.5
wgetのバージョン wget-1.10.2
http://ftp.gnu.org/gnu/wget/からソースをゲット
フォルダを展開してそのフォルダ内に移動
①./configure
②make
③make installでOK
うまく行かない場合はsudoをつけてやってみて
④実行ファイルがsrcフォルダの中にあるから、新しいフォルダの中にコピーするなりそのまま使うなりする
データのダウンロード
NCBIからゲノムの情報を一括で取ってきたい場合とか
>wget オプション URL
基本的なコマンドはこちらhttp://bioinfo-goto.seesaa.net/article/1733498.htmlを参照されたし
拡張子を指定して(fnaファイルだけとか)ファイルの取得を行いたい場合
>wget -r -np --wait=10 --no-host-directories -A 取得したいファイルの拡張子1,取得したいファイルの拡張子2 ftp://ftp.ncbi.nih.gov/genomes/Bacteria/
wgetではURLで指定したフォルダ以下の階層にあるファイルを全部取ってくる
従って、例えばバクテリアの塩基配列(fnaファイル)とORF毎に区切った塩基配列(gffファイル)のみを落としたいときは
>wget -r -np --wait=10 --no-host-directories -A fna,gff ftp://ftp.ncbi.nih.gov/genomes/Bacteria/
とする
フォルダの階層構造は、NCBIのデータベース上のものがそのまま復元される
参考にしたサイト
wgetの使い方 http://tech.bayashi.net/svr/doc/wget.html
それゆけバイオインフォマティクス http://bioinfo-goto.seesaa.net/