現在、オブジェクト検出に「Yolov2」と呼ばれるディープリーニングモデルを使用しています。これを使用してテキストを抽出し、ディスクに保存して使用しますが、それを行う方法がわかりません。それ、私にアドバイスしてください
Tensorflowを使用します
ありがとう
事前学習済みのモデルを使用する場合、それらの出力を保存し、ニューラルネットまたは別のアプローチを使用している場合は、画像を文字認識ネットワークに入力する必要があります。
あなたがしているのは「シーンテキスト認識」です。畳み込みニューラルネットワークで野生の読書テキストを確認できます paper 、ここに demo および homepage があります。 Githubユーザーchongyangtaoには、トピックに関する list のリソースがあります。
同様の質問があり、svhnデータセットを使用して数字検出モデルを作成しています。まだ完成したプロジェクトではありませんが、うまく機能しているようです。コードは Yolo-digit-detector で確認できます。