ffmpeg
の情報出力からビデオの高さと幅を取得するにはどうすればよいですか。たとえば、次の出力があります。
$ ffmpeg -i video.mp4
...
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'video.mp4':
Metadata:
major_brand : isom
minor_version : 1
compatible_brands: isomavc1
creation_time : 2010-01-24 00:55:16
Duration: 00:00:35.08, start: 0.000000, bitrate: 354 kb/s
Stream #0.0(und): Video: h264 (High), yuv420p, 640x360 [PAR 1:1 DAR 16:9], 597 kb/s, 25 fps, 25 tbr, 25k tbn, 50 tbc
Metadata:
creation_time : 2010-01-24 00:55:16
Stream #0.1(und): Audio: aac, 44100 Hz, stereo, s16, 109 kb/s
Metadata:
creation_time : 2010-01-24 00:55:17
At least one output file must be specified
どうすればheight = 640, width= 360
?
見てください mediainfo そこにあるほとんどのフォーマットを処理します。
Ffmpegからの出力を解析する方法を探している場合は、正規表現\d+x\d+
を使用してください
Perlの使用例:
$ ./ffmpeg -i test020.3gp 2>&1 | Perl -lane 'print $1 if /(\d+x\d+)/'
176x120
python(完全ではありません)を使用した例:
$ ./ffmpeg -i /nfshome/enilfre/pub/test020.3gp 2>&1 | python -c "import sys,re;[sys.stdout.write(str(re.findall(r'(\d+x\d+)', line))) for line in sys.stdin]"
[] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] ['176x120'] [] [] []
PythonのワンライナーはPerlのワンライナーほどキャッチーではありません:-)
ffprobe
を使用しますffprobe -v error -show_entries stream=width,height -of default=noprint_wrappers=1 input.mp4
width=1280
height=720
ffprobe -v error -show_entries stream=width,height -of csv=p=0:s=x input.m4v
1280x720
ffprobe -v error -show_entries stream=width,height -of json input.mkv
{
"programs": [
],
"streams": [
{
"width": 1280,
"height": 720
},
{
}
]
}
オプションの機能:
-v error
静かな出力を作成しますが、エラーが表示されることを許可します。バージョン、構成、入力の詳細など、通常の一般的なFFmpeg出力情報を除外します。
-show_entries stream=width,height
width
およびheight
ストリーム情報を表示するだけです。
-of
オプションは、出力形式(デフォルト、コンパクト、csv、フラット、ini、json、xml)を選択します。各フォーマットの説明と追加のフォーマットオプションを表示するには、 FFprobeドキュメント:ライター を参照してください。
-select_streams v:0
これは、入力に複数のビデオストリームが含まれている場合に追加できます。 v:0
は最初のビデオストリームのみを選択します。それ以外の場合は、ビデオストリームと同じ数のwidth
およびheight
出力を取得します。
詳細については、 FFprobeドキュメント および FFmpeg Wiki:FFprobeヒント を参照してください。
上記のFredrikのヒントから、MediaInfoを使用してそれを行った方法は次のとおりです( http://mediainfo.sourceforge.net/en ):
>>> p1 = subprocess.Popen(['mediainfo', '--Inform=Video;%Width%x%Height%',
'/Users/david/Desktop/10stest720p.mov'],stdout=PIPE)
>>> dimensions=p1.communicate()[0].strip('\n')
>>> dimensions
'1280x688'
このブログ投稿 Pythonには大まかな解決策があります:
import subprocess, re
pattern = re.compile(r'Stream.*Video.*([0-9]{3,})x([0-9]{3,})')
def get_size(pathtovideo):
p = subprocess.Popen(['ffmpeg', '-i', pathtovideo],
stdout=subprocess.PIPE,
stderr=subprocess.PIPE)
stdout, stderr = p.communicate()
match = pattern.search(stderr)
if match:
x, y = map(int, match.groups()[0:2])
else:
x = y = 0
return x, y
ただし、これは3桁x 3桁(つまり854x480)であると想定しているため、(1280x720)などの可能な寸法の長さをループする必要があります。
possible_patterns = [re.compile(r'Stream.*Video.*([0-9]{4,})x([0-9]{4,})'), \
re.compile(r'Stream.*Video.*([0-9]{4,})x([0-9]{3,})'), \
re.compile(r'Stream.*Video.*([0-9]{3,})x([0-9]{3,})')]
そして、各ステップで一致がNoneを返すかどうかを確認します。
for pattern in possible_patterns:
match = pattern.search(stderr)
if match!=None:
x, y = map(int, match.groups()[0:2])
break
if match == None:
print "COULD NOT GET VIDEO DIMENSIONS"
x = y = 0
return '%sx%s' % (x, y)
きれいかもしれませんが、動作します。
この質問に答える最良の方法は、ffmpeg開発者が、ffmpeg出力のフォーマットがどのようなものであるか、そしてサイズがその中の指定されたコンテキストにあると一貫して想定できるかどうかを正確に説明することです。それまでは、例から通常の形式を推測することしかできません。
これが私の試みです。これらの「ワンライナー」と比較すると冗長ですが、それは、最終的に失敗したときに失敗する理由を知りたいからです。
import subprocess
def get_video_size(video_filename):
"""Returns width, height of video using ffprobe"""
# Video duration and hence start time
proc = subprocess.Popen(['ffprobe', video_filename],
stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
res = proc.communicate()[0]
# Check if ffprobe failed, probably on a bad file
if 'Invalid data found when processing input' in res:
raise ValueError("Invalid data found by ffprobe in %s" % video_filename)
# Find the video stream
width_height_l = []
for line in res.split("\n"):
# Skip lines that aren't stream info
if not line.strip().startswith("Stream #"):
continue
# Check that this is a video stream
comma_split = line.split(',')
if " Video: " not in comma_split[0]:
continue
# The third group should contain the size and aspect ratio
if len(comma_split) < 3:
raise ValueError("malform video stream string:", line)
# The third group should contain the size and aspect, separated
# by spaces
size_and_aspect = comma_split[2].split()
if len(size_and_aspect) == 0:
raise ValueError("malformed size/aspect:", comma_split[2])
size_string = size_and_aspect[0]
# The size should be two numbers separated by x
width_height = size_string.split('x')
if len(width_height) != 2:
raise ValueError("malformed size string:", size_string)
# Cast to int
width_height_l.append(map(int, width_height))
if len(width_height_l) > 1:
print "warning: multiple video streams found, returning first"
return width_height_l[0]
ここで述べたように、ffprobe
はビデオファイルに関するデータを取得する方法を提供します。次のコマンドが便利だと思いましたffprobe -v quiet -print_format json -show_streams input-video.xxx
チェックアウトできるデータの種類を確認します。
次に、上記のコマンドを実行し、ビデオファイルの高さと幅を返す関数を作成しました。
import subprocess
import shlex
import json
# function to find the resolution of the input video file
def findVideoResolution(pathToInputVideo):
cmd = "ffprobe -v quiet -print_format json -show_streams"
args = shlex.split(cmd)
args.append(pathToInputVideo)
# run the ffprobe process, decode stdout into utf-8 & convert to JSON
ffprobeOutput = subprocess.check_output(args).decode('utf-8')
ffprobeOutput = json.loads(ffprobeOutput)
# find height and width
height = ffprobeOutput['streams'][0]['height']
width = ffprobeOutput['streams'][0]['width']
return height, width
悪い(\ d + x\d +)
$ echo 'Stream #0:0(eng): Video: mjpeg (jpeg / 0x6765706A), yuvj420p, 1280x720, 19939 kb/s, 30 fps, 30 tbr, 30 tbn, 30 tbc' | Perl -lane 'print $1 if /(\d+x\d+)/'
> 0x6765706
良い([0-9] {2、} x [0-9] +)
$ echo 'Stream #0:0(eng): Video: mjpeg (jpeg / 0x6765706A), yuvj420p, 1280x720, 19939 kb/s, 30 fps, 30 tbr, 30 tbn, 30 tbc' | Perl -lane 'print $1 if /([0-9]{2,}x[0-9]+)/'
> 1280x720
再モジュールなし
out = error_message.split() # make a list from resulting error string
out.reverse()
for index, item in enumerate(out): # extract the item before item= "[PAR"
if item == "[PAR": #
dimension_string = out[i+1] #
video_width, video_height = dimension_string.split("x")
編集:すべてのビデオがその「PAR」情報を持っているわけではないので、良い答えではありません:(