【Google Cloud】 音声認識 / Google Cloud Speech API ~ 入門編 ~

■ はじめに

https://blogs.yahoo.co.jp/dk521123/37139755.html
で、認識率が高かった「Google Cloud Speech API」について、調べてみた

Google Cloud Speech API

 * Google音声認識クラウドサービス
 * 有料だが、無料枠もあるので、開発者にやさしい 

入門ガイド

https://cloud.google.com/speech/docs/how-to?hl=ja

使用制限

https://cloud.google.com/speech/limits

料金

https://cloud.google.com/speech/pricing

使用上の注意

 * プロジェクトの課金を有効にする
   => クレジット カード番号か銀行口座情報を入力する必要がある...

■ 実行の種類

[1] 同期音声認識
 => 1分未満の短い音声を認識する
[2] 非同期音声認識
 => 1分より長い音声を認識する
[3] ストリーミング音声認識
 => 音声を Cloud Speech API にストリーミングし、音声が処理されるとリアルタイムでストリーム音声認識の結果を受信

[1] 同期音声認識

https://cloud.google.com/speech/docs/sync-recognize?hl=ja
 * 音声コンテンツの指定方法は2つ
  1-1) Cloud Speech API に直接送信
  1-2) Google Cloud Storage に存在する音声コンテンツを処理

[2] 非同期音声認識

https://cloud.google.com/speech/docs/async-recognize?hl=ja

[3] ストリーミング音声認識

https://cloud.google.com/speech/docs/streaming-recognize?hl=ja
 * 1分未満
 * gRPC 経由でのみ利用

Google Cloud Speech APIを使用する当たって

 * 以下を一読しておくといいかも。
[[https://kiosk-dot-codelabs-site.appspot.com/codelabs/cloud-speech-intro-ja/index.html?index=..%2F..%2Fnext17-tok#0]]
https://cloud.google.com/speech/docs/getting-started?hl=ja
[1] Google Cloud Platform の プロジェクトを設定する
 [1-1] Cloud Platform Console で、プロジェクトを作成する
 [1-2] 課金を有効にする(クレジットカードを登録とかする必要がある)
 [1-3] Google Cloud Speech API を有効にする
 [1-4] 認証情報を設定 (以下は、認証情報の種類)
  * API キー
  * OAuth クライアント ID
  * サービス アカウント キー << Googleの推奨はこっち

※以降、調査中


関連記事

日本語対応の音声認識サービス

https://blogs.yahoo.co.jp/dk521123/37139755.html