■ はじめに
https://blogs.yahoo.co.jp/dk521123/37139755.htmlで、認識率が高かった「Google Cloud Speech API」について、調べてみた
■ Google Cloud Speech API
* Google の音声認識クラウドサービス * 有料だが、無料枠もあるので、開発者にやさしい
入門ガイド
https://cloud.google.com/speech/docs/how-to?hl=ja使用制限
https://cloud.google.com/speech/limits料金
https://cloud.google.com/speech/pricing使用上の注意
* プロジェクトの課金を有効にする => クレジット カード番号か銀行口座情報を入力する必要がある...
■ 実行の種類
[1] 同期音声認識 => 1分未満の短い音声を認識する [2] 非同期音声認識 => 1分より長い音声を認識する [3] ストリーミング音声認識 => 音声を Cloud Speech API にストリーミングし、音声が処理されるとリアルタイムでストリーム音声認識の結果を受信
[1] 同期音声認識
https://cloud.google.com/speech/docs/sync-recognize?hl=ja* 音声コンテンツの指定方法は2つ 1-1) Cloud Speech API に直接送信 1-2) Google Cloud Storage に存在する音声コンテンツを処理
[2] 非同期音声認識
https://cloud.google.com/speech/docs/async-recognize?hl=ja[3] ストリーミング音声認識
https://cloud.google.com/speech/docs/streaming-recognize?hl=ja* 1分未満 * gRPC 経由でのみ利用
■ Google Cloud Speech APIを使用する当たって
* 以下を一読しておくといいかも。[[https://kiosk-dot-codelabs-site.appspot.com/codelabs/cloud-speech-intro-ja/index.html?index=..%2F..%2Fnext17-tok#0]]
https://cloud.google.com/speech/docs/getting-started?hl=ja
[1] Google Cloud Platform の プロジェクトを設定する [1-1] Cloud Platform Console で、プロジェクトを作成する [1-2] 課金を有効にする(クレジットカードを登録とかする必要がある) [1-3] Google Cloud Speech API を有効にする [1-4] 認証情報を設定 (以下は、認証情報の種類) * API キー * OAuth クライアント ID * サービス アカウント キー << Googleの推奨はこっち ※以降、調査中
参考文献
https://www.magellanic-clouds.com/blocks/guide/create-gcp-service-account-key/http://kmycode.hatenablog.jp/entry/2017/04/09/120203
http://www.atmarkit.co.jp/ait/articles/1706/16/news038.html