次のようなものがあるとしましょう:
new File("test").eachFile() { file->
println file.getName()
}
これにより、test
ディレクトリ内のすべてのファイルの完全なファイル名が出力されます。拡張子なしでファイル名を取得するGroovyの方法はありますか? (または、正規表現の土地に戻りましたか?)
私は最も汚い方法は次のようになると信じています:
file.name.lastIndexOf('.').with {it != -1 ? file.name[0..<it] : file.name}
または単純な正規表現で:
file.name.replaceFirst(~/\.[^\.]+$/, '')
また、Apache commons-io Java libというちょっとした目的のためのlibがあります。これは、mavenを使用する場合に簡単に依存できます。
org.Apache.commons.io.FilenameUtils.getBaseName(file.name)
最もクリーンな方法。
String fileWithoutExt = file.name.take(file.name.lastIndexOf('.'))
new File("test").eachFile() { file->
println file.getName().split("\\.")[0]
}
これは、foo、foo.barのようなファイル名に適しています。
ただし、ファイルfoo.bar.jarがある場合は、上記のコードが出力されます。foo代わりにfoo.barを出力する場合は、次のコードがそれを実現します。
new File("test").eachFile() { file->
def names = (file.name.split("\\.")
def name = names.size() > 1 ? (names - names[-1]).join('.') : names[0]
println name
}
Apache commons ioパッケージの一部であるFilenameUtilsクラスには、堅牢なソリューションがあります。使用例:
import org.Apache.commons.io.FilenameUtils
String filename = '/tmp/hello-world.txt'
def fileWithoutExt = FilenameUtils.removeExtension(filename)
これはグルーヴィな方法ではありませんが、多くのEdgeケースをサポートする必要がある場合に役立つかもしれません。
最も簡単な方法は次のとおりです。
'file.name.with.dots.tgz' - ~/\.\w+$/
結果は次のとおりです。
file.name.with.dots
期待したほど簡単ではないかもしれませんが、動作しています:
new File("test").eachFile {
println it.name.lastIndexOf('.') >= 0 ?
it.name[0 .. it.name.lastIndexOf('.')-1] :
it.name
}
コメントで述べたように、ファイル名の終わりと拡張子の始まりは状況によって異なります。 myの状況では、次のタイプのファイルのベース名(パスのないファイル、andの拡張子なし)を取得する必要がありました:{foo.Zip
、bar/foo.tgz
、foo.tar.gz
} =>すべてのファイル名の拡張子として「foo
」を生成する必要があります。 (ほとんどのソリューションは、foo.tar.gz
を指定するとfoo.tar
を生成します。)
最初の「。」まですべてを提供する1つの(明らかな)ソリューションがあります。オプションで、拡張子全体を分割して取得することも、この場合は単一の残りとして取得することもできます(ファイル名を2
部分に分割)。 (注:目の前のタスクとは関係ありませんが、file.name
を呼び出してパスも削除します。)
file=new File("temp/foo.tar.gz")
file.name.split("\\.", 2)[0] // => return "foo" at [0], and "tar.gz" at [1]
正規表現をより適切に使用できます。次のような関数がトリックを行います。
def getExtensionFromFilename(filename) {
def returned_value = ""
m = (filename =~ /(\.[^\.]*)$/)
if (m.size()>0) returned_value = ((m[0][0].size()>0) ? m[0][0].substring(1).trim().toLowerCase() : "");
return returned_value
}
注
import Java.io.File;
def fileNames = [ "/a/b.c/first.txt",
"/b/c/second",
"c:\\a\\b.c\\third...",
"c:\\a\b\\c\\.text"
]
def fileSeparator = "";
fileNames.each {
// You can keep the below code outside of this loop. Since my example
// contains both windows and unix file structure, I am doing this inside the loop.
fileSeparator= "\\" + File.separator;
if (!it.contains(File.separator)) {
fileSeparator = "\\/"
}
println "File extension is : ${it.find(/((?<=\.)[^\.${fileSeparator}]+)$/)}"
it = it.replaceAll(/(\.([^\.${fileSeparator}]+)?)$/,"")
println "Filename is ${it}"
}
以下のソリューションの一部(Apacheライブラリを使用するものを除く)は、この例では機能しません-c:/test.me/firstfile
上記のエントリの拡張子を見つけようとすると、「。me/firstfile」が表示されます-:(
より良い方法は、File.separatorが最後に存在する場合はそれを見つけてから、ファイル名または拡張子を探すことです。
注:(以下ではちょっとしたトリックがあります。Windowsの場合、ファイル区切り文字は\です。ただし、これは正規表現の特殊文字であるため、File.separatorを含む変数を正規表現、私はそれをエスケープする必要があります。
def fileSeparator= "\\" + File.separator;
それが理にかなっていることを望みます:)
これを試してください:
import Java.io.File;
String strFilename = "C:\\first.1\\second.txt";
// Few other flavors
// strFilename = "/dd/dddd/2.dd/dio/dkljlds.dd"
def fileSeparator= "\\" + File.separator;
if (!strFilename.contains(File.separator)) {
fileSeparator = "\\/"
}
def fileExtension = "";
(strFilename =~ /((?<=\.)[^\.${fileSeparator}]+)$/).each { match, extension -> fileExtension = extension }
println "Extension is:$fileExtension"