HTML構造をEPUB(またはSony PRS-505リーダーに適した他の形式)に(ダウンロードして)変換するにはどうすればよいですか?
私の質問は、単一のHTMLファイルをEPUBファイルに変換する方法ではありません。これは簡単だからです。つまり、Sony PRS-505で読みたい本がいくつかあり、これらの本はほとんどの場合HTML形式でオンラインですが、多くの相互リンクされたページがあり、この例のように目次が1ページあります http://www.Edge.org/documents/ThirdCulture/d-Contents.html
...または、目次には章のみがリストされ、章の中には次の例のようにサブ章へのリンクがあるため、少し複雑になる場合があります:http:SLASHSLASHwww.hyw.com/Books/WargamesHandbook/ Contents.htm(ユーザー制限のb/cで投稿できるハイパーリンクは1つだけなので、//の代わりにSLASHSLASHがあるのはこのためです)
私はこれらの例と他のいくつかの例を正しい章、画像、いくつかの許容可能なフォーマットなどで変換したいので、基本的にはHTMLツリーから適切な電子ブックを作成したいと思います。
最も簡単な方法は何ですか?
私はwgetを使用してWebサイト(通常はオンラインのhtmlマニュアル)を再帰的にダウンロードし、すべてのhtmlをフォルダーに入れたら、 Calibre を使用して選択した形式に変換します。