Yomitokuでチラシを解析Colab
Yomitokuで写真やレシートを解析してみる
で
Colab で行なってるのがあったので参考にする
出力形式によって得られる情報が異なるらしい
A100で実験する
https://github.com/kotaro-kinoshita/yomitoku
でライブラリが公開されているので
ドキュメントなどはこれを読む
基本的にGPUが必要
! pip install yomitoku
でライブラリインストール
最後にsession restartしろといわれたので、ダイアログボックスに促されるままrestartする
次に写真の用意
google colabなので、/content以下にimageフォルダを作成し、その中にJPGをいれ
フォルダをまるっと指定すると、その中の画像ファイルをすべて解析してくれます
!mkdir image
でフォルダ作成
ここに写真をアップロードする
/Users/snowpool/aw10s/gemini/step-1.png
をアップロード
! yomitoku /content/image/ -f md -o results -v --figure
で解析
結果は自動作成される results の中にある
ファイル名_p1.md
という感じで出力される