■ NHocr に関連する必須ライブラリ
a) O2-toolshttp://www.imglab.org/p/O2/
b) FreeType2https://www.freetype.org/
ダウンロード
[[http://ftp.yzu.edu.tw/nongnu//freetype/?C=M;O=D]]
■ 手順
* OS : Debian
[0] 前準備
sudo apt-get install build-essential
[1] O2-tools をインストールする
# ホームに移動 cd ~/ # tarファイルをダウンロードする wget http://www.imglab.org/p/O2/archives/O2-tools-2.01.tar.gz # 解凍する tar xvzf O2-tools-2.01.tar.gz # インストールする cd O2-tools-2.01 ./configure --prefix /usr/local make sudo make install
[2] FreeType2 をインストールする
# ホームに移動 cd ~/ # tarファイルをダウンロードする wget http://ftp.yzu.edu.tw/nongnu//freetype/freetype-2.7.1.tar.gz # 解凍する tar xvzf freetype-2.7.1.tar.gz # インストールする cd freetype-2.7.1 ./configure --prefix /usr/local make sudo make install
[3] NHocr をインストールする
# ホームに移動 cd ~/ # tarファイルをダウンロードする wget https://ja.osdn.net/projects/nhocr/downloads/61902/nhocr-0.22.tar.gz # 解凍する tar xvzf nhocr-0.22.tar.gz # インストールする cd nhocr-0.22 ./configure --prefix=/usr/local CXXFLAGS="-I/usr/local/include/freetype2" make sudo make install # 確認 cd test ./run-test # 以下、出力結果 fs.pgm: ファイルシステム hello.pgm: ニんにちは、 tohoku.pgm: 東北 tohoku3.pgm: # Character candidates table # produced by: NHocr - Japanese OCR v0.22 (以下略)
■ 別の画像で確認する
手順
[1] GIMPなどで画像を作成する(今回はファイル名「sample.jpg」で「山田 太郎」と記載した画像) [2] convertコマンドで、PGMファイルに変換し、「~/nhocr-0.22/test」に保存する ~~~~ convert sample.jpg sample.pgm ~~~~ [3] 「~/nhocr-0.22/test/run-test」を参考に、実行できるファイルを作成し、 「~/nhocr-0.22/test」に保存する (今回はファイル名「run-sample」で、内容は以下の「run-sample」を参照) [4] [3]のファイルを実行する ~~~~ cd ~/nhocr-0.22/test ./run-sample # 実行結果 山田 太郎 ~~~~run-sample
#!/bin/bash NHOCR_DICDIR=../dic ../nhocr/nhocr -line -o - sample.pgm echo
■ メモ
* 「nhocr-0.22/nhocr/nhocr.cpp」にメイン関数がある
nhocr.cpp
・・・略・・・ //475行付近 /*---------------------------------------------- Main routine ----------------------------------------------*/ int main(int ac,char *av[]){ char *infile = NULL; char *outfile = NULL; FILE *fp_out = stdout; int width=0,height=0; int csize = 16; int i,k; int argn = 1; SIPImage *image, *bimage; NHrec NHrec;
参考文献
* 環境設定http://d.hatena.ne.jp/simpg/20120922/1348283995
http://diary.overlasting.net/2010-07-01-3.html
http://dsaku.hatenablog.com/entry/2014/01/03/120430
* 「別の画像で確認する」で参考にしたサイト
http://qiita.com/awakia/items/3e1c7eb7da39e64de3a6