web-dev-qa-db-ja.com

ChromeのHTML5音声認識APIの実装の言語コードとは何ですか?

ChromeはHTML5音声認識APIを実装しました。多くの言語がサポートされています。サポートされている言語と、HTML要素のlang属性で使用されている各言語の対応するコードを知りたいです。

例えば:

  • ポーランド語(pl-PL)
  • トルコ語(tr-TR)

ありがとうございました!

31
weilou

それが公開されていない場合は、少なくともこれを把握することができます。このテーブルを最初に置いておきましょう。誰かがもっと情報を持っているなら、それを改良します。

サポートされている言語は音声検索でサポートされている言語と同様であり、Googleは標準の言語コードを使用し、サービス全体で一貫してそれを行うと仮定しています。

wikipedia で音声検索でサポートされている言語を調べました

言語コードを見つけました heregoogle言語設定ページ および here

EDIT:バックエンド音声認識サービスを試しました。同じ英語の音声サンプルをAPIに渡し、毎回異なる方言を指定する一連のテストを実行しました。次のようになります。

  • 言語がサポートされていない場合、認識はen-USにフォールバックします(サンプルが英語であることを認識するように見えます)
  • 方言がサポートされていない(または存在しない)場合、認識は主な方言またはen-USにフォールバックする場合があります
  • 主な方言は、識別子の最初の部分として指定できます。したがって、「en-US」と「en」は同じ結果になります。
  • 中国語や日本語などの一部の言語を認識すると、英語で結果が得られますが、奇妙なことにen-USとは異なります。おそらくサンプルは中国語とは大きく異なり、サービスはそれを理解するのに賢いでしょう。

認識がen-USおよび言語の主要な方言と異なる結果を与える場合、方言をサポート対象として扱います。それでも、100%検証するには、各言語のサンプルを実行する必要があります。

凡例

  • +テストの結果はen-USや主な方言とは異なるため、ほとんどすべてがサポートされています。
  • .+ウィキペディアにはありませんが、テストの結果はen-USや主要な方言とは異なるため、ほとんどすべてがサポートされています。
  • +? Wikipediaにリストされているため、ほとんどすべてがサポートされています。しかし、私のサンプルでテストすると、主な方言と同じ結果が得られます。したがって、これはコインシデンスか、言語コードが間違っています。
  • .+?ウィキペディアにはリストされていませんが、サポートされているように見えます。テストがen-USや主要な方言とは異なる結果を与えるためです。

言語

  • +アフリカーンス語af
  • +バスク語eu
  • +ブルガリア語bg
  • +カタロニア語ca
  • +アラビア語(エジプト)ar-EG
  • +?アラビア語(ヨルダン)ar-JO
  • +アラビア語(クウェート)ar-KW
  • +?アラビア語(レバノン)ar-LB
  • +アラビア語(カタール)ar-QA
  • +アラビア語(UAE)ar-AE
  • .+アラビア語(モロッコ)ar-MA
  • .+アラビア語(イラク)ar-IQ
  • .+アラビア語(アルジェリア)ar-DZ
  • .+アラビア語(バーレーン)ar-BH
  • .+アラビア語(リビア)ar-LY
  • .+アラビア語(オマーン)ar-OM
  • .+アラビア語(サウジアラビア)ar-SA
  • .+アラビア語(チュニジア)ar-TN
  • .+アラビア語(イエメン)ar-YE
  • +チェコ語cs
  • +オランダ語nl-NL
  • +英語(オーストラリア)en-AU
  • +?英語(カナダ)en-CA
  • +英語(インド)en-IN
  • +英語(ニュージーランド)en-NZ
  • +英語(南アフリカ)en-ZA
  • + English(UK)en-GB
  • + English(US)en-US
  • +フィンランド語fi
  • +フランス語fr-FR
  • +ガリシア語gl
  • +ドイツ語de-DE
  • +ヘブライ語he
  • +ハンガリー語hu
  • +アイスランド語is
  • +イタリア語it-IT
  • +インドネシア語id
  • +日本語ja
  • +韓国語ko
  • +ラテン語la
  • +中国語zh-CN
  • +伝統的な台湾zh-TW
  • +?簡体字中国zh-CN
  • +簡体字香港zh-HK
  • + Yue Chinese(Traditional Hong Kong)zh-yue
  • +マレーシア語ms-MY
  • +ノルウェー語no-NO
  • +ポーランド語pl
  • +?豚のラテン語xx-piglatin
  • +ポルトガル語pt-PT
  • .+ポルトガル語(ブラジル)pt-BR
  • +ルーマニア語ro-RO
  • +ロシア語ru
  • +セルビア語sr-SP
  • +スロバキア語sk
  • +スペイン語(アルゼンチン)es-AR
  • +スペイン語(ボリビア)es-BO
  • +?スペイン語(チリ)es-CL
  • +?スペイン語(コロンビア)es-CO
  • +?スペイン語(コスタリカ)es-CR
  • +スペイン語(ドミニカ共和国)es-DO
  • +スペイン語(エクアドル)es-EC
  • +スペイン語(エルサルバドル)es-SV
  • +スペイン語(グアテマラ)es-GT
  • +スペイン語(ホンジュラス)es-HN
  • +スペイン語(メキシコ)es-MX
  • +スペイン語(ニカラグア)es-NI
  • +スペイン語(パナマ)es-PA
  • +スペイン語(パラグアイ)es-PY
  • +スペイン語(ペルー)es-PE
  • +スペイン語(プエルトリコ)es-PR
  • +スペイン語(スペイン)es-ES
  • +スペイン語(米国)es-US
  • +スペイン語(ウルグアイ)es-UY
  • +スペイン語(ベネズエラ)es-VE
  • +スウェーデン語sv-SE
  • +トルコ語tr
  • +ズールー語zu
50
Sergey Zyuzin

私はこれが古い投稿であることを知っていますが、この情報はわずらわしく見つけにくいので、探しているかもしれない人のためにリストを投稿すると思いました。エラーや欠落を見つけた場合は、メモを残してください。

{
  "Afrikaans": [
    ["South Africa", "af-ZA"]
  ],
  "Arabic" : [
    ["Algeria","ar-DZ"],
    ["Bahrain","ar-BH"],
    ["Egypt","ar-EG"],
    ["Israel","ar-IL"],
    ["Iraq","ar-IQ"],
    ["Jordan","ar-JO"],
    ["Kuwait","ar-KW"],
    ["Lebanon","ar-LB"],
    ["Morocco","ar-MA"],
    ["Oman","ar-OM"],
    ["Palestinian Territory","ar-PS"],
    ["Qatar","ar-QA"],
    ["Saudi Arabia","ar-SA"],
    ["Tunisia","ar-TN"],
    ["UAE","ar-AE"]
  ],
  "Basque": [
    ["Spain", "eu-ES"]
  ],
  "Bulgarian": [
    ["Bulgaria", "bg-BG"]
  ],
  "Catalan": [
    ["Spain", "ca-ES"]
  ],
  "Chinese Mandarin": [
    ["China (Simp.)", "cmn-Hans-CN"],
    ["Hong Kong SAR (Trad.)", "cmn-Hans-HK"],
    ["Taiwan (Trad.)", "cmn-Hant-TW"]
  ],
  "Chinese Cantonese": [
    ["Hong Kong", "yue-Hant-HK"]
  ],
  "Croatian": [
    ["Croatia", "hr_HR"]
  ],
  "Czech": [
    ["Czech Republic", "cs-CZ"]
  ],
  "Danish": [
    ["Denmark", "da-DK"]
  ],
  "English": [
    ["Australia", "en-AU"],
    ["Canada", "en-CA"],
    ["India", "en-IN"],
    ["Ireland", "en-IE"],
    ["New Zealand", "en-NZ"],
    ["Philippines", "en-PH"],
    ["South Africa", "en-ZA"],
    ["United Kingdom", "en-GB"],
    ["United States", "en-US"]
  ],
  "Farsi": [
    ["Iran", "fa-IR"]
  ],
  "French": [
    ["France", "fr-FR"]
  ],
  "Filipino": [
    ["Philippines", "fil-PH"]
  ],
  "Galician": [
    ["Spain", "gl-ES"]
  ],
  "German": [
    ["Germany", "de-DE"]
  ],
  "Greek": [
    ["Greece", "el-GR"]
  ],
  "Finnish": [
    ["Finland", "fi-FI"]
  ],
  "Hebrew" :[
    ["Israel", "he-IL"]
  ],
  "Hindi": [
    ["India", "hi-IN"]
  ],
  "Hungarian": [
    ["Hungary", "hu-HU"]
  ],
  "Indonesian": [
    ["Indonesia", "id-ID"]
  ],
  "Icelandic": [
    ["Iceland", "is-IS"]
  ],
  "Italian": [
    ["Italy", "it-IT"],
    ["Switzerland", "it-CH"]
  ],
  "Japanese": [
    ["Japan", "ja-JP"]
  ],
  "Korean": [
    ["Korea", "ko-KR"]
  ],
  "Lithuanian": [
    ["Lithuania", "lt-LT"]
  ],
  "Malaysian": [
    ["Malaysia", "ms-MY"]
  ],
  "Dutch": [
    ["Netherlands", "nl-NL"]
  ],
  "Norwegian": [
    ["Norway", "nb-NO"]
  ],
  "Polish": [
    ["Poland", "pl-PL"]
  ],
  "Portuguese": [
    ["Brazil", "pt-BR"],
    ["Portugal", "pt-PT"]
  ],
  "Romanian": [
    ["Romania", "ro-RO"]
  ],
  "Russian": [
    ["Russia", "ru-RU"]
  ],
  "Serbian": [
    ["Serbia", "sr-RS"]
  ],
  "Slovak": [
    ["Slovakia", "sk-SK"]
  ],
  "Slovenian": [
    ["Slovenia", "sl-SI"]
  ],
  "Spanish": [
    ["Argentina", "es-AR"],
    ["Bolivia", "es-BO"],
    ["Chile", "es-CL"],
    ["Colombia", "es-CO"],
    ["Costa Rica", "es-CR"],
    ["Dominican Republic", "es-DO"],
    ["Ecuador", "es-EC"],
    ["El Salvador", "es-SV"],
    ["Guatemala", "es-GT"],
    ["Honduras", "es-HN"],
    ["México", "es-MX"],
    ["Nicaragua", "es-NI"],
    ["Panamá", "es-PA"],
    ["Paraguay", "es-PY"],
    ["Perú", "es-PE"],
    ["Puerto Rico", "es-PR"],
    ["Spain", "es-ES"],
    ["Uruguay", "es-UY"],
    ["United States", "es-US"],
    ["Venezuela", "es-VE"]
  ],
  "Swedish": [
    ["Sweden", "sv-SE"]
  ],
  "Thai": [
    ["Thailand", "th-TH"]
  ],
  "Turkish": [
    ["Turkey", "tr-TR"]
  ],
  "Ukrainian": [
    ["Ukraine", "uk-UA"]
  ],
  "Vietnamese": [
    ["Viet Nam", "vi-VN"]
  ],
  "Zulu": [
    ["South Africa", "zu-ZA"]
  ]
}

編集:私はこのリストも見つけました。これはおそらく最新のものです: https://cloud.google.com/speech-to-text/docs/languages

10
TimHayes

次のコードを使用して、ブラウザでSpeech APIで利用可能なすべての音声を取得します。

var voices = speechSynthesis.getVoices();
      for(var i = 0; i < voices.length; i++ ) {
        console.log("Voice " + i.toString() + ' ' + voices[i].name + ' ' + voices[i].uri);
      }

現時点ではChromeおよびSafariはWeb Speech APIをサポートしています(ただし、SafariはText to Speech機能のみをサポートしています)。

言語のリストは、ドキュメントとテスト(ユーザーエージェントに依存)の両方に従って、使用しているブラウザーによって異なります。

Safariでは、多くの言語も利用できます(40を超えると思います)。 Chromeでは、現時点では次のリストが表示されます。

Voice 0 Google US English未定義

Voice 1 Google UK英語男性未定義

Voice 2 Google UK英語女性未定義

Voice 3 GoogleEspañol未定義

Voice 4 GoogleFrançaisundefined

Voice 5 Google Italiano未定義

Voice 6 Google Deutsch undefined

Voice 7 Google日本人未定義

Voice 8 Google한국의undefined

Voice 9 Google中国的未定義

Voice 10ネイティブ未定義

4
mesosteros

ここでは、値を取得できるLinkedHashMapに@TimHayesがあります。 LinkedHashMapを使用して、マップの位置を取得できるようにします。

    LinkedHashMap<String,String> country = new LinkedHashMap<String,String>();


    country.put("South Africa", "af-ZA");
    country.put("Algeria", "ar-DZ");
    country.put("Bahrain", "ar-BH");
    country.put("Egypt", "ar-EG");
    country.put("Israel", "ar-IL");
    country.put("Iraq", "ar-IQ");
    country.put("Jordan", "ar-JO");
    country.put("Kuwait", "ar-KW");
    country.put("Lebanon", "ar-LB");
    country.put("Morocco", "ar-MA");
    country.put("Oman", "ar-OM");
    country.put("Palestinian Territory", "ar-PS");
    country.put("Qatar", "ar-QA");
    country.put("Saudi Arabia", "ar-SA");
    country.put("Tunisia", "ar-TN");
    country.put("UAE", "ar-AE");
    country.put("Spain", "eu-ES");
    country.put("Bulgaria", "bg-BG");
    country.put("Spain", "ca-ES");
    country.put("China (Simp.)", "cmn-Hans-CN");
    country.put("Hong Kong SAR (Trad.)", "cmn-Hans-HK");
    country.put("Taiwan (Trad.)", "cmn-Hant-TW");
    country.put("Hong Kong", "yue-Hant-HK");
    country.put("Croatia", "hr_HR");
    country.put("Czech Republic", "cs-CZ");
    country.put("Denmark", "da-DK");
    country.put("Australia", "en-AU");
    country.put("Canada", "en-CA");
    country.put("India", "en-IN");
    country.put("Ireland", "en-IE");
    country.put("New Zealand", "en-NZ");
    country.put("Philippines", "en-PH");
    country.put("South Africa", "en-ZA");
    country.put("United Kingdom", "en-GB");
    country.put("United States", "en-US");
    country.put("Iran", "fa-IR");
    country.put("France", "fr-FR");
    country.put("Philippines", "fil-PH");
    country.put("Spain", "gl-ES");
    country.put("Germany", "de-DE");
    country.put("Greece", "el-GR");
    country.put("Finland", "fi-FI");
    country.put("Israel", "he-IL");
    country.put("India", "hi-IN");
    country.put("Hungary", "hu-HU");
    country.put("Indonesia", "id-ID");
    country.put("Iceland", "is-IS");
    country.put("Italy", "it-IT");
    country.put("Switzerland", "it-CH");
    country.put("Japan", "ja-JP");
    country.put("Korea", "ko-KR");
    country.put("Lithuania", "lt-LT");
    country.put("Malaysia", "ms-MY");
    country.put("Netherlands", "nl-NL");
    country.put("Norway", "nb-NO");
    country.put("Poland", "pl-PL");
    country.put("Brazil", "pt-BR");
    country.put("Portugal", "pt-PT");
    country.put("Romania", "ro-RO");
    country.put("Russia", "ru-RU");
    country.put("Serbia", "sr-RS");
    country.put("Slovakia", "sk-SK");
    country.put("Slovenia", "sl-SI");
    country.put("Argentina", "es-AR");
    country.put("Bolivia", "es-BO");
    country.put("Chile", "es-CL");
    country.put("Colombia", "es-CO");
    country.put("Costa Rica", "es-CR");
    country.put("Dominican Republic", "es-DO");
    country.put("Ecuador", "es-EC");
    country.put("El Salvador", "es-SV");
    country.put("Guatemala", "es-GT");
    country.put("Honduras", "es-HN");
    country.put("México", "es-MX");
    country.put("Nicaragua", "es-NI");
    country.put("Panamá", "es-PA");
    country.put("Paraguay", "es-PY");
    country.put("Perú", "es-PE");
    country.put("Puerto Rico", "es-PR");
    country.put("Spain", "es-ES");
    country.put("Uruguay", "es-UY");
    country.put("United States", "es-US");
    country.put("Venezuela", "es-VE");
    country.put("Sweden", "sv-SE");
    country.put("Thailand", "th-TH");
    country.put("Turkey", "tr-TR");
    country.put("Ukraine", "uk-UA");
    country.put("Viet Nam", "vi-VN");
    country.put("South Africa", "zu-ZA");
0
Waffles.Inc