web-dev-qa-db-ja.com

YouTube / VimeoURLを解析するための正規表現の改善

YouTubeまたはVimeoからURLを取得する関数(JavaScript)を作成しました。その特定のビデオのプロバイダーとIDを把握します(デモ: http://jsfiddle.net/csjwf/ )。

function parseVideoURL(url) {

    var provider = url.match(/http:\/\/(:?www.)?(\w*)/)[2],
        id;

    if(provider == "youtube") {

        id = url.match(/http:\/\/(?:www.)?(\w*).com\/.*v=(\w*)/)[2];
    } else if (provider == "vimeo") {

        id = url.match(/http:\/\/(?:www.)?(\w*).com\/(\d*)/)[2];
    } else {
        throw new Error("parseVideoURL() takes a YouTube or Vimeo URL");    
    }
    return {
        provider : provider,
        id : id
    }
}

それは機能しますが、正規表現の初心者として、私はそれを改善する方法を探しています。私が扱っている入力は、通常、次のようになります。

http://vimeo.com/(id)
http://youtube.com/watch?v=(id)&blahblahblah.....

1)現在、3つの別々の試合を行っていますが、1つの表現ですべてを試してみるのは理にかなっていますか?もしそうなら、どのように?

2)既存の試合はもっと簡潔にできますか?それらは不必要に複雑ですか?またはおそらく不十分ですか?

3)解析に失敗するYouTubeまたはVimeoのURLはありますか?私はかなりの数を試しましたが、これまでのところかなりうまく機能しているようです。

要約すると:私は単に上記の機能を改善する方法を探しています。どんなアドバイスも大歓迎です。

16
Daniel

あなたの質問3)についてはよくわかりませんが、URLフォームでの誘導が正しい場合は、次のように正規表現を1つに組み合わせることができます。

/http:\/\/(?:www.)?(?:(vimeo).com\/(.*)|(youtube).com\/watch\?v=(.*?)&)/

さまざまな位置で試合が行われます(vimeoの場合は1番目と2番目の試合、youtubeの場合は3番目と4番目の試合)ので、それを処理する必要があります。

または、vimeoのIDに数字のみが含まれていることが確実な場合は、次の操作を実行できます。

/http:\/\/(?:www.)?(vimeo|youtube).com\/(?:watch\?v=)?(.*?)(?:\z|&)/

プロバイダーとIDは、それぞれ1回目と2回目の一致で表示されます。

11
sawa

これが、ほとんどの更新されたケースをカバーする正規表現での私の試みです。

function parseVideo(url) {
    // - Supported YouTube URL formats:
    //   - http://www.youtube.com/watch?v=My2FRPA3Gf8
    //   - http://youtu.be/My2FRPA3Gf8
    //   - https://youtube.googleapis.com/v/My2FRPA3Gf8
    // - Supported Vimeo URL formats:
    //   - http://vimeo.com/25451551
    //   - http://player.vimeo.com/video/25451551
    // - Also supports relative URLs:
    //   - //player.vimeo.com/video/25451551

    url.match(/(http:\/\/|https:\/\/|)(player.|www.)?(vimeo\.com|youtu(be\.com|\.be|be\.googleapis\.com))\/(video\/|embed\/|watch\?v=|v\/)?([A-Za-z0-9._%-]*)(\&\S+)?/);
    var type = null;
    if (RegExp.$3.indexOf('youtu') > -1) {
        type = 'youtube';
    } else if (RegExp.$3.indexOf('vimeo') > -1) {
        type = 'vimeo';
    }

    return {
        type: type,
        id: RegExp.$6
    };
}
22
Yangshun Tay

正規表現は素晴らしく簡潔ですが、すぐに複雑になる可能性があります。

http://jsfiddle.net/8nagx2sk/

function parseYouTube(str) {
    // link : //youtube.com/watch?v=Bo_deCOd1HU
    // share : //youtu.be/Bo_deCOd1HU
    // embed : //youtube.com/embed/Bo_deCOd1HU

    var re = /\/\/(?:www\.)?youtu(?:\.be|be\.com)\/(?:watch\?v=|embed\/)?([a-z0-9_\-]+)/i; 
    var matches = re.exec(str);
    return matches && matches[1];
}

function parseVimeo(str) {
    // embed & link: http://vimeo.com/86164897

    var re = /\/\/(?:www\.)?vimeo.com\/([0-9a-z\-_]+)/i;
    var matches = re.exec(str);
    return matches && matches[1];
}

単純なコードが他の開発者にとってより良い場合があります。

https://jsfiddle.net/1dzb5ag1/

// protocol and www neutral
function getVideoId(url, prefixes) {
  var cleaned = url.replace(/^(https?:)?\/\/(www\.)?/, '');
  for(var i = 0; i < prefixes.length; i++) {
    if (cleaned.indexOf(prefixes[i]) === 0)
      return cleaned.substr(prefixes[i].length)
  }
  return undefined;
}

function getYouTubeId(url) {
  return getVideoId(url, [
    'youtube.com/watch?v=',
    'youtu.be/',
    'youtube.com/embed/',
    'youtube.googleapis.com/v/'
  ]);
}

function getVimeoId(url) {
  return getVideoId(url, [
    'vimeo.com/',
    'player.vimeo.com/'
  ]);
}

どちらを更新しますか?

11
Jason Sebring

これが私の正規表現です

http://jsfiddle.net/csjwf/1/

7
Ming-Tang

さわの答えについて:

2番目の正規表現の小さな更新:

/http:\/\/(?:www\.)?(vimeo|youtube)\.com\/(?:watch\?v=)?(.*?)(?:\z|$|&)/

(ドットをエスケープすると、タイプwww_vimeo_com /…と$ added…のURLが一致しなくなります)

これは、埋め込みURLを一致させるための同じアイデアです:

/http:\/\/(?:www\.|player\.)?(vimeo|youtube)\.com\/(?:embed\/|video\/)?(.*?)(?:\z|$|\?)/
6
Romain

Vimeoの場合、しない依存するRegex VimeoはURLパターンを時々変更/更新する傾向があるため、 2017年10月2日の時点で、VimeoがサポートするURLスキームは全部で6つあります。

https://vimeo.com/*
https://vimeo.com/*/*/video/*
https://vimeo.com/album/*/video/*
https://vimeo.com/channels/*/*
https://vimeo.com/groups/*/videos/*
https://vimeo.com/ondemand/*/*

代わりに、APIを使用してvimeoURLを検証します。これがこのoEmbed( doc )APIで、URLを受け取り、その有効性をチェックして、一連のビデオ情報を含むオブジェクトを返します(開発ページをチェックしてください)。意図されていませんが、これを使用して、特定のURLがVimeoからのものであるかどうかを簡単に検証できます。

したがって、ajaxを使用すると、次のようになります。

var VIMEO_BASE_URL = "https://vimeo.com/api/oembed.json?url=";
var yourTestUrl = "https://vimeo.com/23374724";


$.ajax({
  url: VIMEO_BASE_URL + yourTestUrl,
  type: 'GET',
  success: function(data) {
    if (data != null && data.video_id > 0)
      // Valid Vimeo url
    else
      // not a valid Vimeo url
  },
  error: function(data) {
    // not a valid Vimeo url
  }
});
5
fluffyBatman

ここにphpバージョンがある場合に備えて

/*
* parseVideo
* @param (string) $url 
* mi-ca.ch 27.05.2016
* parse vimeo & youtube id
* format url for iframe embed 
* https://regex101.com/r/lA0fP4/1
*/

function parseVideo($url) {
  $re = "/(http:|https:|)\\/\\/(player.|www.)?(vimeo\\.com|youtu(be\\.com|\\.be|be\\.googleapis\\.com))\\/(video\\/|embed\\/|watch\\?v=|v\\/)?([A-Za-z0-9._%-]*)(\\&\\S+)?/"; 
preg_match($re, $url, $matches);

if(strrpos($matches[3],'youtu')>-1){
    $type='youtube';
    $src='https://www.youtube.com/embed/'.$matches[6];
}else if(strrpos($matches[3],'vimeo')>-1){
    $type="vimeo";
    $src='https://player.vimeo.com/video/'.$matches[6];
}else{
    return false;
}


return array(
         'type' =>  $type // return youtube or vimeo
        ,'id'   =>  $matches[6] // return the video id
        ,'src'  =>  $src // return the src for iframe embed
        );
} 
1
mica

3)正規表現がhttpsのURLと一致しません。テストはしていませんが、「http://」の部分は「http(s)?://」になると思います。これにより、プロバイダーとIDの一致する位置が変更されることに注意してください。

1
vrijdenker

以前の回答に基づいていますが、正規表現をさらに増やす必要がありました。

2011年には機能したかもしれませんが、2019年には構文が少し変更されました。だからこれはリフレッシュです。

正規表現を使用すると、URLがYoutubeまたはVimeoである天気を検出できます。 videoIDを簡単に取得できるようにキャプチャグループを追加しました。

大文字と小文字を区別しない設定で実行した場合は、(?i)を削除してください。

(?:(?i)(?:https:|http:)?\/\/)?(?:(?i)(?:www\.youtube\.com\/(?:embed\/|watch\?v=)|youtu\.be\/|youtube\.googleapis\.com\/v\/)(?<YoutubeID>[a-z0-9-_]{11,12})|(?:vimeo\.com\/|player\.vimeo\.com\/video\/)(?<VimeoID>[0-9]+))

https://regex101.com/r/PVdjg0/2

0
JM123