Amazon AI
以下は、あくまで、2017/03/29時点では情報人工知能サービス「Amazon AI」として以下の3つのサービスがある [1] Amazon Polly : テキスト読み上げ機能 [2] Amazon Rekognition : 画像解析 / 画像認識機能 [3] Amazon Lex : 会話型インタフェース機能 ※ 上記のいずれのサービスについて、2017/03/29時点では、東京リージョンでは未サポート
[1] Amazon Polly
* テキストを音声に変換するサービス => テキストを渡すと、MP3のストリームとして音声生成 * 47の男女バリエーション * 日本語対応済 (26言語対応)
音声合成マークアップ言語(SSML)
* 音声合成マークアップ言語(SSML; Speech Synthesis Markup Language)により、 テキストを読み上げる際の声量や発音、音の高低、速さをXML形式で制御可能
レキシコン(Lexicon)
* レキシコン(PLS; Pronunciation Lexicon Specification = 発音辞書仕様)により、 指定した単語の読み上げをカスタマイズできる
参考文献
https://aws.amazon.com/jp/blogs/news/polly-text-to-speech-in-47-voices-and-24-languages/https://aws.amazon.com/jp/polly/
http://docs.aws.amazon.com/ja_jp/polly/latest/dg/polly-dg.pdf
一般サイト
https://recipe.kc-cloud.jp/archives/9294
https://recipe.kc-cloud.jp/archives/8971
[2] Amazon Rekognition
* 画像解析 => 画像内の「物体識別(例:人、動物、物など)」や「シーン検出(例:夕焼け、ビーチなど)」を特定 * 顔分析 => 「性別」「表情」「感情」 * 顔比較 => 画像の顔が同一人物かどうか * 顔認識機能 => 大量の画像から似た顔を検出可能
関連記事
https://blogs.yahoo.co.jp/dk521123/37095580.html参考文献
https://aws.amazon.com/jp/blogs/news/amazon-rekognition-image-detection-and-recognition-powered-by-deep-learning/https://aws.amazon.com/jp/rekognition/
[3] Amazon Lex
* 2017/03/29時点では、日本語未対応* 対話的なアプリケーション構築が可能
主要コンセプト
飛行機のチケットを例にするとわかりやすい* Bot : 会話の全てのコンポーネントを含む bot * Intent(意図) : ユーザーがやりたいこと/達成したいゴール (例:飛行機のチケットを買う) * Slot : Intentを満たすためにユーザーが提供しなければならないパラメータ(例:都市、州、空港) * Utterance(発話) : Intent実現のためのユーザーの発言(入力)文のサンプル (例:飛行機を予約したい) * Prompt : ユーザーに変数の提供をうながすための質問文
参考文献
https://aws.amazon.com/jp/blogs/news/amazon-lex-build-conversational-voice-text-interfaces/参考文献
http://www.itmedia.co.jp/news/articles/1612/01/news071.htmlhttp://www.atmarkit.co.jp/ait/articles/1612/01/news117.html