【AWS】人工知能サービス「Amazon AI」 ~ 知識編 ~

Amazon AI

以下は、あくまで、2017/03/29時点では情報
人工知能サービス「Amazon AI」として以下の3つのサービスがある

[1] Amazon Polly : テキスト読み上げ機能
[2] Amazon Rekognition : 画像解析 / 画像認識機能
[3] Amazon Lex : 会話型インタフェース機能

※ 上記のいずれのサービスについて、2017/03/29時点では、東京リージョンでは未サポート

[1] Amazon Polly

 * テキストを音声に変換するサービス
 => テキストを渡すと、MP3のストリームとして音声生成
 * 47の男女バリエーション
 * 日本語対応済 (26言語対応)

音声合成マークアップ言語(SSML)

 * 音声合成マークアップ言語(SSML; Speech Synthesis Markup Language)により、
   テキストを読み上げる際の声量や発音、音の高低、速さをXML形式で制御可能

レキシコン(Lexicon)

 * レキシコン(PLS; Pronunciation Lexicon Specification = 発音辞書仕様)により、
   指定した単語の読み上げをカスタマイズできる

参考文献

https://aws.amazon.com/jp/blogs/news/polly-text-to-speech-in-47-voices-and-24-languages/
https://aws.amazon.com/jp/polly/
http://docs.aws.amazon.com/ja_jp/polly/latest/dg/polly-dg.pdf
一般サイト
https://recipe.kc-cloud.jp/archives/9294
https://recipe.kc-cloud.jp/archives/8971

[2] Amazon Rekognition

 * 画像解析
  => 画像内の「物体識別(例:人、動物、物など)」や「シーン検出(例:夕焼け、ビーチなど)」を特定
 * 顔分析
  => 「性別」「表情」「感情」
 * 顔比較
  => 画像の顔が同一人物かどうか
 * 顔認識機能
  => 大量の画像から似た顔を検出可能

関連記事

https://blogs.yahoo.co.jp/dk521123/37095580.html

参考文献

https://aws.amazon.com/jp/blogs/news/amazon-rekognition-image-detection-and-recognition-powered-by-deep-learning/
https://aws.amazon.com/jp/rekognition/

[3] Amazon Lex

* 2017/03/29時点では、日本語未対応
 * 対話的なアプリケーション構築が可能

主要コンセプト

飛行機のチケットを例にするとわかりやすい
 * Bot : 会話の全てのコンポーネントを含む bot
 * Intent(意図) : ユーザーがやりたいこと/達成したいゴール (例:飛行機のチケットを買う)
 * Slot : Intentを満たすためにユーザーが提供しなければならないパラメータ(例:都市、州、空港)
 * Utterance(発話) : Intent実現のためのユーザーの発言(入力)文のサンプル (例:飛行機を予約したい)
 * Prompt : ユーザーに変数の提供をうながすための質問文

参考文献

https://aws.amazon.com/jp/blogs/news/amazon-lex-build-conversational-voice-text-interfaces/


関連記事

AWS】画像分析サービス「Amazon Rekognition」 ~ 知識編 ~

https://blogs.yahoo.co.jp/dk521123/37095580.html