Yomitokuでチラシを解析Colab

Yomitokuでチラシを解析Colab

Yomitokuで写真やレシートを解析してみる

Colab で行なってるのがあったので参考にする

出力形式によって得られる情報が異なるらしい

A100で実験する

https://github.com/kotaro-kinoshita/yomitoku
でライブラリが公開されているので
ドキュメントなどはこれを読む

基本的にGPUが必要

! pip install yomitoku

でライブラリインストール

最後にsession restartしろといわれたので、ダイアログボックスに促されるままrestartする

次に写真の用意

google colabなので、/content以下にimageフォルダを作成し、その中にJPGをいれ
フォルダをまるっと指定すると、その中の画像ファイルをすべて解析してくれます

!mkdir image

でフォルダ作成
ここに写真をアップロードする

/Users/snowpool/aw10s/gemini/step-1.png

をアップロード

! yomitoku /content/image/ -f md -o results -v --figure

で解析

結果は自動作成される results の中にある

ファイル名_p1.md
という感じで出力される

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です