Web制作で使えるLinuxコマンド vol.1

2011年3月2日 by Tomoya Yaguchi

最近ブログのネタに困ってる矢口です。

業務ではプログラミングの仕事も多いのですが、
本来個人としてはサーバエンジニアの仕事の方が好きなので、
今回からネタに困った時はWeb制作で使えそうなLinxコマンドを
紹介していきたいと思います。

今回ご紹介するのは

『wget』


wget とは、UNIXコマンドラインで HTTP や FTP 経由のファイル取得を行えるツールです。
Webサイトであれば、リンク先を階層で指定して一気に取得することができ、ローカルにミラーサイトを簡単に作ることが可能です。
また、ダウンロードが途中で止まってしまった場合は、途中からやり直すレジューム機能があり便利です。


【使い方1】
wget http://●●●●●.co.jp/index.html
http://●●●●●.co.jp/index.htmlのみをダウンロードする。

【使い方2】
wget -r http://●●●●●.co.jp/index.html
http://●●●●●.co.jp/index.htmlから再帰回収(-r)でファイルダウンロードする。
つまり、サイトをまるごと自分のローカルに持って来る。

【使い方3】
wget -r ftp://●●●●●.co.jp/
ftp://●●●●●.co.jp/を再帰回収(-r)する。
FTPの場合はこのやり方が一般的。 また、ある一つのサイト(HTTP)だけをまるごとダウンロードするのにも便利。
また、wgetには他のLinux系コマンド同様、多くのオプションが備わっています。

■全般オプション
コマンド名解説
-Vwget のバージョン表示
-hオプション一覧のヘルプ(困ったらコレ)
-bダウンロードをバックグラウンドで行います
-o FileNameログファイルを FileName に書き出します(上書き)
-a FileNameログファイルを FileName に書き出します(追記)
-qログファイルを書き出さない

■ファイル取得に関するオプション
コマンド名解説
-t Numberダウンロード試行回数
-O FileName取得内容をを FileName に書き出す
-nc既に取得済みのファイルは改めて取得しない
-cダウンロードが途中で終わったものを継続するレジューム機能
-w Numberダウンロードの間隔(秒)を指定する
-q Number取得ファイルの最大容量
(単位はバイト:kでキロバイト:mでメガバイト)

■再帰的取得に関するオプション
コマンド名解説
-r再帰的取得を行う
-l Numberリンクをたどる階層数
-k取得時に絶対指定のリンクを相対指定に書き換える
-mミラーリングする
-A EXTEXTで指定された拡張子ファイルのみ取得
-R EXTEXTで指定された拡張子のファイルは取得しない
-I DirList取得対象のディレクトリリスト
ex. # wget -I /a,/b URL
-X DirList取得対象外のディレクトリリスト
ex. # wget -I /c,/d URL
-np親ディレクトリは参照しない
-L相対リンクのみ辿る
-Hホストの壁を越えて再帰的取得を行う
-D DomainDomainを取得対象とする

■ローカル保存に関するオプション
コマンド名解説
-i FilepathFilepathで指定されたファイルに記述されたURLを取得
-ndローカルにディレクトリを作らない
-xローカルにディレクトリを作る
-nHローカルへ保管時にhost名の部分をはずしてディレクトリーを作成する
-p DirPathローカル保存の起点を DirPath にする
-q Number取得ファイルの最大容量
(単位はバイト:kでキロバイト:mでメガバイト)

wgetを使えば、ssh等が使えないサーバのデータの取得や、サイトのミラーリングなど簡単にできて、 サイト管理もし易くなります。 是非お試しください。

[関連記事]
Web制作で使えるLinuxコマンド vol.2
  • Index
  • Back
  • Index
  • Back

スタッフ

  • 平竹仁士
  • 河西裕一
  • 柳澤健一
  • 小林秀太郎
  • 丸山幸男