web-dev-qa-db-ja.com

Cloud Vision API-PDF OCR

Google Cloud Vision APIをテストして、画像にテキストが存在する場合はそれを読み取りました。

これまで、MavenサーバーとRedisサーバーをインストールしていました。このページの指示に従うだけです。

https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/Java/text

今まで.jpgファイルでテストできましたが、tiffファイルやpdfでテストできますか?

次のコマンドを使用しています。

Java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar     com.google.cloud.vision.samples.text.TextApp ../../data/text/

テキストディレクトリ内に、jpg形式のファイルがあります。

次に、変換されたファイルを読み取るために、それを行う方法がわかりません。次のコマンドを実行するだけです。

Java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp

そして、変換されたファイルを検索するための単語またはフレーズを入力するようにというメッセージが表示されます。ドキュメント全体が変換されていることを確認する方法はありますか?

ありがとう!

9

残念ながら、PDFおよびTIFF形式は現在CloudVisionではサポートされていません。

受け入れられる形式は次のとおりです:( doc から取得)

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • アニメーションGIF(最初のフレームのみ)
  • BMP
  • WEBP
  • ICO
8
uzerzero

2018年4月6日に、ドキュメントテキスト検出でのPDFおよびTIFFファイルのサポートがGoogleCloud Vision APIに追加されました( リリースノート を参照)。

ドキュメント によると:

  • Vision APIは、Google CloudStorageに保存されているPDFおよびTIFFファイルからテキストを検出して転記できます。

  • PDFおよびTIFFからのドキュメントテキストの検出は、asyncBatchAnnotate関数を使用して要求する必要があります。この関数は、非同期要求を実行し、操作を使用してそのステータスを提供します。リソース。

  • 出力 PDF/TIFFリクエストから指定されたGoogleCloudStorageバケットで作成されたJSONファイルに書き込まれます


例:

1)ファイルをGoogle CloudStorageにアップロードする

enter image description here

2)POST PDF/TIFFドキュメントテキスト検出を実行するように要求する

リクエスト:

POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>

{
  "requests":[
    {
      "inputConfig": {
        "gcsSource": {
          "uri": "gs://<your bucket name>/input.pdf"
        },
        "mimeType": "application/pdf"
      },
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "outputConfig": {
        "gcsDestination": {
          "uri": "gs://<your bucket name>/output/"
        },
        "batchSize": 1
      }
    }
  ]
}

応答:

{
  "name": "operations/9b1f9d773d216406"
}

)GETリクエストを作成して、ドキュメントテキストの検出が行われたかどうかを確認します

リクエスト:

GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>

応答:

{
    "name": "operations/9b1f9d773d216406",
    "metadata": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
        "state": "RUNNING",
        "updateTime": "2018-06-17T20:18:09.117787733Z"
    },
    "done": true,
    "response": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
        "responses": [
            {
                "outputConfig": {
                    "gcsDestination": {
                        "uri": "gs://<your bucket name>/output/"
                    },
                    "batchSize": 1
                }
            }
        ]
    }
}

4)指定されたGoogle CloudStorageフォルダの結果を確認します

enter image description here

16
Milan Hlinák

https://cloud.google.com/vision/docs/pdf

この質問は古いことは知っていますが、GoogleVisionがPDFのサポートをリリースしました。

8
vokuheila