【Java】 漢字からカタカナを取得する [1] ~ 日本語形態素解析ライブラリ 基本編 ~

漢字からカタカナを取得する

 * 日本語形態素解析(Morphological Analysis)ライブラリを使用する

形態素解析とは?

 * 文章を形態素(意味を持つ最小単位)に分割する技術

日本語形態素解析ライブラリ

[1] kuromoji
[2] MeCab 「和布蕪(めかぶ)」
[3] ChaSen「茶筌(ちゃせん)」
[4] lucene-gosen「ルシーン ゴセン」
[5] Igo

[1] kuromoji

公式サイト / デモサイト

http://www.atilika.com/ja/products/kuromoji.html

ダウンロードサイト

2017/01/08現在の最新は、v0.7.7 (2012-01-30) 
http://www.atilika.com/ja/downloads/

ライセンス

 * Apache License V2.0

 * ライセンスについては、以下の関連記事を参照のこと
http://blogs.yahoo.co.jp/dk521123/35506016.html

サンプル

 * 以下の関連記事を参照のこと。
http://blogs.yahoo.co.jp/dk521123/36627316.html



[4] lucene-gosen

公式サイト

https://code.google.com/archive/p/lucene-gosen/

ダウンロードサイト

2017/01/08現在の最新は、v4.6.0 (2013-10-25) 
https://code.google.com/archive/p/lucene-gosen/downloads

ライセンス

 * GNU / GPL

サンプル

 * 以下の関連記事を参照のこと。
http://blogs.yahoo.co.jp/dk521123/36627324.html

[5] Igo

公式サイト

http://igo.osdn.jp/

ライセンス

 * MIT


関連記事

漢字からカタカナを取得する [1] ~ 日本語形態素解析ライブラリ 基本編 ~

http://blogs.yahoo.co.jp/dk521123/36627267.html

漢字からカタカナを取得する [2] ~ kuromoji編 ~

http://blogs.yahoo.co.jp/dk521123/36627316.html

漢字からカタカナを取得する [3] ~ lucene-gosen編 ~

http://blogs.yahoo.co.jp/dk521123/36627324.html

画像から文字列を取得する (光学文字認識 / OCRライブラリ)

http://blogs.yahoo.co.jp/dk521123/36626927.html

ライセンスについて

http://blogs.yahoo.co.jp/dk521123/35506016.html