web-dev-qa-db-ja.com

ffmpegを使用してビデオを多数の小さなビデオに正確にカットする

私は約45分の範囲の大きなビデオを持っています。非常に正確である必要がある多くのカット(20分あたり約500)を実行したいと思います。このため、私が見つけたフレームパーフェクトなソリューションを使用するのは面倒です-それらは非常に遅いです。

なぜ私はビデオをそれほど多くのビデオにカットしたいのですか?私は沈黙がどこにあるかを認識するプログラムを持っています。沈黙があるときと話している人がいるときは、さまざまな速度でビデオの速度を上げたいと思います。だから私はビデオのどの部分が無音/大音量であるかを見つけ、それらの部分にそれを切り取り、それらをスピードアップし、そしてそれらを再び連結します。

現在、いくつかの反復の後、私はこれを使用しています:

ffmpeg -i [input_video] -ss [seconds_to_start_cut] -frames:v [number_of_frames] -f [input_video_extension] [output_name]

私のプログラムでは、開始フレームと終了フレームとして定義されたビデオのサイレント/ラウド部分があり、ffprobeから受信したFPSを介してカットを開始する秒数を計算します。

を使用すると、カットはかなり正確ですが、まだいくつかの作業が必要です(カットの遷移でオーディオが少し繰り返されます)-おそらくFPSはビデオによってわずかに異なりますか?

しかし問題は、このアプローチは非常に遅いということです。私がffmpegがどのように機能するかを理解している限り、これは私がそれを呼び出すたびに開始から秒を数え始め、以前に行われた作業を不必要に繰り返します。 1時間以上の長さのビデオは言うまでもなく、16秒の長さのビデオでは本当に悪いです。

大量のカットを正確に実行するための適度に速い方法はありますか?これらのカットは重ならないので、技術的にはビデオを多くの短いビデオに分割する必要があります。これがffmpegでできない場合は、別のツールを使用することをお勧めしますか?ありがとう。

編集:@ slhckによって提供されたリンクのおかげで、私は 複雑なフィルター を使用してそれを行いました。品質の点では最高の結果が得られますが、処理にはビデオの長さの約2倍(0.428x)かかります。たとえば、セグメントの場合[0-0.25, 2][0.25-0.75,1][0.75-0.1,2][time_from]-[time_to], [speed])、私はこのフィルターを使用します:

[0:v]trim=0:0.25,setpts=0.5*(PTS_STARTPTS)[v1];
[0:a]atrim=0:0.25,asetpts=PTS-STARTPTS,atempo=2[a1];
[0:v]trim=0.25:0.75,setpts=1*(PTS_STARTPTS)[v2];
[0:a]atrim=0.25:0.75,asetpts=PTS-STARTPTS,atempo=1[a3];
[0:v]trim=0.75:1,setpts=0.5*(PTS_STARTPTS)[v3];
[0:a]atrim=0.75:1,asetpts=PTS-STARTPTS,atempo=2[a3];
[v1][a1][v2][a2][v3][a3]concat=n=3:v=1:a=1

何百ものセグメントで面白く見え始めますが、実際には本当にうまく機能します!

私は現在、次のようにffmpegを実行しています:

ffmpeg -i madoka.mp4 -filter_complex "[filter]" -f mp4 -movflags frag_keyframe+empty_moov output.mp4

ログ:

ffmpeg version n4.2 Copyright (c) 2000-2019 the FFmpeg developers
  built with gcc 9.1.0 (GCC)
  configuration: --prefix=/usr --disable-debug --disable-static --disable-stripping --enable-fontconfig --enable-gmp --enable-gnutls --enable-gpl --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libdav1d --enable-libdrm --enable-libfreetype --enable-libfribidi --enable-libgsm --enable-libiec61883 --enable-libjack --enable-libmodplug --enable-libmp3lame --enable-libopencore_amrnb --enable-libopencore_amrwb --enable-libopenjpeg --enable-libopus --enable-libpulse --enable-libsoxr --enable-libspeex --enable-libssh --enable-libtheora --enable-libv4l2 --enable-libvidstab --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxcb --enable-libxml2 --enable-libxvid --enable-nvdec --enable-nvenc --enable-omx --enable-shared --enable-version3
  libavutil      56. 31.100 / 56. 31.100
  libavcodec     58. 54.100 / 58. 54.100
  libavformat    58. 29.100 / 58. 29.100
  libavdevice    58.  8.100 / 58.  8.100
  libavfilter     7. 57.100 /  7. 57.100
  libswscale      5.  5.100 /  5.  5.100
  libswresample   3.  5.100 /  3.  5.100
  libpostproc    55.  5.100 / 55.  5.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'madoka.mp4':
  Metadata:
    major_brand     : mp42
    minor_version   : 0
    compatible_brands: isommp42
    creation_time   : 2016-12-17T08:09:58.000000Z
  Duration: 00:24:09.99, start: 0.000000, bitrate: 1676 kb/s
    Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p(tv, bt709), 1280x720 [SAR 1:1 DAR 16:9], 1482 kb/s, 23.98 fps, 23.98 tbr, 24k tbn, 47.95 tbc (default)
    Metadata:
      handler_name    : VideoHandler
    Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 192 kb/s (default)
    Metadata:
      creation_time   : 2016-12-17T08:10:39.000000Z
      handler_name    : IsoMedia File Produced by Google, 5-11-2011
Stream mapping:
  Stream #0:0 (h264) -> trim
###### (523 more lines like this) #####
  Stream #0:1 (aac) -> atrim
###### (523 more lines like this) #####
  concat:out:v0 -> Stream #0:0 (libx264)
  concat:out:a0 -> Stream #0:1 (aac)
Press [q] to stop, [?] for help
[libx264 @ 0x5604a9dc2600] using SAR=1/1
[libx264 @ 0x5604a9dc2600] using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2
[libx264 @ 0x5604a9dc2600] profile High, level 3.1, 4:2:0, 8-bit
[libx264 @ 0x5604a9dc2600] 264 - core 157 r2945 72db437 - H.264/MPEG-4 AVC codec - Copyleft 2003-2018 - http://www.videolan.org/x264.html - options: cabac=1 ref=3 deblock=1:0:0 analyse=0x3:0x113 me=hex subme=7 psy=1 psy_rd=1.00:0.00 mixed_ref=1 me_range=16 chroma_me=1 trellis=1 8x8dct=1 cqm=0 deadzone=21,11 fast_pskip=1 chroma_qp_offset=-2 threads=12 lookahead_threads=2 sliced_threads=0 nr=0 decimate=1 interlaced=0 bluray_compat=0 constrained_intra=0 bframes=3 b_pyramid=2 b_adapt=1 b_bias=0 direct=1 weightb=1 open_gop=0 weightp=2 keyint=250 keyint_min=23 scenecut=40 intra_refresh=0 rc_lookahead=40 rc=crf mbtree=1 crf=23.0 qcomp=0.60 qpmin=0 qpmax=69 qpstep=4 ip_ratio=1.40 aq=1:1.00
Output #0, mp4, to 'madoka.new.mp4':
  Metadata:
    major_brand     : mp42
    minor_version   : 0
    compatible_brands: isommp42
    encoder         : Lavf58.29.100
    Stream #0:0: Video: h264 (libx264) (avc1 / 0x31637661), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], q=-1--1, 23.98 fps, 24k tbn, 23.98 tbc (default)
    Metadata:
      encoder         : Lavc58.54.100 libx264
    Side data:
      cpb: bitrate max/min/avg: 0/0/0 buffer size: 0 vbv_delay: -1
    Stream #0:1: Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 128 kb/s (default)
    Metadata:
      encoder         : Lavc58.54.100 aac
frame=    3 fps=0.0 q=0.0 size=       0kB time=00:00:00.00 bitrate=N/A speed=   0x    
frame=    5 fps=4.9 q=0.0 size=       0kB time=00:00:00.02 bitrate=  16.5kbits/s dup=0 drop=9 speed=0.0226x      
(...)
2
SoptikHa

まず第一に、ffmpeg -i [input_video] -ss [seconds_to_start_cut]でビデオをカットするのはかなり遅いです。代わりに、-ssオプションを-iの前に置くことができます。これは、ffmpegが最初にカットポイントをシークし、次にエンコードを開始することを意味します。これはまだ正確です。

とはいえ、個々のクリップを生成して連結することを含まないより良い解決策は、複雑なフィルターグラフを使用することです。この例を見ることができます ここ 。フィルタを使用すると、ビデオとオーディオをセグメントにトリミングし、これらのセグメントにスピードアップ/スローダウンフィルタを適用できます。

あなたが示したように、そのような複雑なフィルターチェーンの1つのインスタンス化は次のようになります:

[0:v]trim=0:0.25,setpts=0.5*(PTS_STARTPTS)[v1];
[0:a]atrim=0:0.25,asetpts=PTS-STARTPTS,atempo=2[a1];
[0:v]trim=0.25:0.75,setpts=1*(PTS_STARTPTS)[v2];
[0:a]atrim=0.25:0.75,asetpts=PTS-STARTPTS,atempo=1[a3];
[0:v]trim=0.75:1,setpts=0.5*(PTS_STARTPTS)[v3];
[0:a]atrim=0.75:1,asetpts=PTS-STARTPTS,atempo=2[a3];
[v1][a1][v2][a2][v3][a3]concat=n=3:v=1:a=1

これにより、1番目と3番目のセグメントが2倍高速化され、すべてが連結されます。

エンコードをできるだけ速くするには、-c:v libx264 -preset faster(またはultrafastの代わりにfaster)を使用できます。 H.264エンコードガイド を参照してください。 。品質(したがって、結果のファイルサイズ)は CRFパラメーター によって制御されます。

1
slhck