web-dev-qa-db-ja.com

rubyでファイルを解凍(Zip、tar、tag.gz)します

たくさんのZipファイルを解凍したいのですが。 Zipファイルの形式を確認して解凍するモジュールまたはスクリプトはありますか?これはLinuxで動作するはずです。他のOSは気にしません。

31
gustavgans

.tar.gzファイルからファイルを抽出するには、Rubyで配布されたパッケージから次のメソッドを使用できます。

require 'rubygems/package'
require 'zlib'
tar_extract = Gem::Package::TarReader.new(Zlib::GzipReader.open('Path/To/myfile.tar.gz'))
tar_extract.rewind # The extract has to be rewinded after every iteration
tar_extract.each do |entry|
  puts entry.full_name
  puts entry.directory?
  puts entry.file?
  # puts entry.read
end
tar_extract.close

タイプ Gem :: Package :: TarReader :: Entry の各エントリは、.tar.gzファイル内のファイルまたはディレクトリを指します。

同様のコードを使用して(ReaderをWriterで置き換える)、ファイルを.tar.gzファイルに書き込むことができます。

31

最も簡単な方法は、おそらくZlibを使用することです

ZlibはRubyライブラリです。以下は、特定のURLからZippedファイルを取得し、解凍して、その内容を画面に貼り付ける簡単なプログラムです。

require 'zlib' 
require 'open-uri'

uri = "www.somedomain.com/filename.gz"
source = open(uri)
gz = Zlib::GzipReader.new(source) 
result = gz.read
puts result

これがお役に立てば幸いです。

29
user244854

フロリアンの答え は正しいですが、それは考慮されません tar LongLinks (抽出してみてください jdk-7u40-linux-i586.tar.gz からOracle:P)。次のコードはこれを行うことができるはずです:

require 'rubygems/package'
require 'zlib'

TAR_LONGLINK = '././@LongLink'
tar_gz_archive = '/path/to/archive.tar.gz'
destination = '/where/extract/to'

Gem::Package::TarReader.new( Zlib::GzipReader.open tar_gz_archive ) do |tar|
  dest = nil
  tar.each do |entry|
    if entry.full_name == TAR_LONGLINK
      dest = File.join destination, entry.read.strip
      next
    end
    dest ||= File.join destination, entry.full_name
    if entry.directory?
      File.delete dest if File.file? dest
      FileUtils.mkdir_p dest, :mode => entry.header.mode, :verbose => false
    elsif entry.file?
      FileUtils.rm_rf dest if File.directory? dest
      File.open dest, "wb" do |f|
        f.print entry.read
      end
      FileUtils.chmod entry.header.mode, dest, :verbose => false
    elsif entry.header.typeflag == '2' #Symlink!
      File.symlink entry.header.linkname, dest
    end
    dest = nil
  end
end
12
Draco Ater

Draco、thx for you snippet 。一部のTARは、ディレクトリを「/」で終わるパスとしてエンコードします- this Wikiを参照してください。たとえば、tarは Oracle Server JRE 7u80 for Windows です。これは彼らのために働くでしょう:

require 'fileutils'
require 'rubygems/package'
require 'zlib'

TAR_LONGLINK = '././@LongLink'

Gem::Package::TarReader.new( Zlib::GzipReader.open tar_gz_archive ) do |tar|
        dest = nil
        tar.each do |entry|
            if entry.full_name == TAR_LONGLINK
                dest = File.join destination, entry.read.strip
                next
            end
            dest ||= File.join destination, entry.full_name
            if entry.directory? || (entry.header.typeflag == '' && entry.full_name.end_with?('/'))
                File.delete dest if File.file? dest
                FileUtils.mkdir_p dest, :mode => entry.header.mode, :verbose => false
            elsif entry.file? || (entry.header.typeflag == '' && !entry.full_name.end_with?('/'))
                FileUtils.rm_rf dest if File.directory? dest
                File.open dest, "wb" do |f|
                    f.print entry.read
                end
                FileUtils.chmod entry.header.mode, dest, :verbose => false
            elsif entry.header.typeflag == '2' #Symlink!
                File.symlink entry.header.linkname, dest
            else
                puts "Unkown tar entry: #{entry.full_name} type: #{entry.header.typeflag}."
            end
            dest = nil
        end
    end
end
2
TomCZ