web-dev-qa-db-ja.com

piwigoベースのWebギャラリーからの一括画像ダウンロード

Piwigo CMに基づいて構築されたこのウェブサイトから元のサイズの画像をダウンロードしたいと思います http://mermaid.pink/

単一のイメージのダウンロードは許可されますが、それには時間がかかりますソフトウェア、拡張機能、スクリプト、またはこのタスクが可能な他の何かを提案してもらえますか?

2
ed0

次のようにwgetを使用できます here

Wgetを使用してWebサイト全体をダウンロードする

2008年9月5日HOW-TOのDashamir Hoxha著

おそらくオフラインで表示するためにWebサイト全体をダウンロードする必要がある場合、wgetがその仕事をすることができます。例えば:

$ wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains website.org \
     --no-parent \
         www.website.org/tutorials/html/

このコマンドは、Webサイトをダウンロードします http://www.website.org/tutorials/html/

オプションは次のとおりです。

  • --recursive:Webサイト全体をダウンロードします。
  • --domains website.org:website.org以外のリンクをたどらないでください。
  • --no-parent:ディレクトリtutorials/html /以外のリンクをたどらないでください。
  • --page-requisites:ページを構成するすべての要素(画像、CSSなど)を取得します。
  • --html-extension:.html拡張子でファイルを保存します。
  • --convert-links:リンクをローカルでオフラインで動作するように変換します。
  • --restrict-file-names=windows:Windowsでも機能するようにファイル名を変更します。
  • --no-clobber:既存のファイルを上書きしないでください(ダウンロードが中断されて再開される場合に使用されます)。

これらのうち--page-requisites--recursiveが必要になる可能性がありますが、--convert-linksまたは--no-clobberが役立つ場合があります。 wgetの使用の詳細については、man wgetを実行してください(または here をご覧ください)。

2
Wilf

あなたの質問が画像を取得するので、これは私の解決策です

最初に画像を保存するフォルダーを作成してから、そのフォルダーにcdします

#terminal
mkdir imagesFolder
cd imagesFolder/

# this one will take a long time but will download 
# every single image related to this website
wget -r -nd -H -p -A '*.jpg','*.jpeg','*.png' -e robots=off http://mermaid.pink/

#I recomend to use this one better as the images in this site are all jpg
# And recursion level is set to 1
wget -r -l 1 -nd -H -p -A '*.jpg' -e robots=off http://mermaid.pink/

Wget引数の説明:

  • -r | --recursive:

    • 再帰的な取得を有効にします。デフォルトの最大深度は5です。
  • -l深さ| --level = depth:

    • 再帰最大深度レベル深度を指定します。
  • -nd | --no-directories:

    • 再帰的に取得するときにディレクトリの階層を作成しないでください。このオプションをオンにすると、すべてのファイルが上書きされることなく、現在のディレクトリに保存されます(名前が複数表示される場合、ファイル名には拡張子.nが付きます)。
  • -H | --span-hosts:

    • 再帰的な取得を行う際に、ホスト間のスパニングを有効にします。
  • -p | --page-requisites:

    • このオプションにより、Wgetは特定のHTMLページを適切に表示するために必要なすべてのファイルをダウンロードします。これには、インライン画像、サウンド、参照スタイルシートなどが含まれます...
  • -A | --accept:

    • 受け入れるファイル名のサフィックスまたはパターンのコンマ区切りリストを指定します。 acclistの要素にワイルドカード文字、?、[または]が含まれている場合、接尾辞ではなくパターンとして扱われることに注意してください。この場合、-A "。mp3"または-A '* .mp3'のように、シェルがパターンを展開しないように、パターンを引用符で囲む必要があります。
  • -e | --execute:

    • コマンドを.wgetrcの一部であるかのように実行します。このように呼び出されたコマンドは、.wgetrc内のコマンドの後に実行されるため、それらよりも優先されます。複数のwgetrcコマンドを指定する必要がある場合は、-eの複数のインスタンスを使用します。
    • この場合、robots = off-e

ターミナルのwgetタイプの詳細については

man wget

またはチェック [〜#〜] this [〜#〜]

ありがとうT04435

1
T04435