■ はじめに

https://blogs.yahoo.co.jp/dk521123/37139755.html

で、認識率が高かった「Google Cloud Speech API」について、調べてみた

■ Google Cloud Speech API

 * Google の音声認識クラウドサービス
 * 有料だが、無料枠もあるので、開発者にやさしい

入門ガイド

https://cloud.google.com/speech/docs/how-to?hl=ja

使用制限

https://cloud.google.com/speech/limits

料金

https://cloud.google.com/speech/pricing

使用上の注意

 * プロジェクトの課金を有効にする
   => クレジット カード番号か銀行口座情報を入力する必要がある...

■ 実行の種類

[1] 同期音声認識
 => 1分未満の短い音声を認識する
[2] 非同期音声認識
 => 1分より長い音声を認識する
[3] ストリーミング音声認識
 => 音声を Cloud Speech API にストリーミングし、音声が処理されるとリアルタイムでストリーム音声認識の結果を受信

[1] 同期音声認識

https://cloud.google.com/speech/docs/sync-recognize?hl=ja

 * 音声コンテンツの指定方法は2つ
  1-1) Cloud Speech API に直接送信
  1-2) Google Cloud Storage に存在する音声コンテンツを処理

[2] 非同期音声認識

https://cloud.google.com/speech/docs/async-recognize?hl=ja

[3] ストリーミング音声認識

https://cloud.google.com/speech/docs/streaming-recognize?hl=ja

 * 1分未満
 * gRPC 経由でのみ利用

■ Google Cloud Speech APIを使用する当たって

 * 以下を一読しておくといいかも。

[[https://kiosk-dot-codelabs-site.appspot.com/codelabs/cloud-speech-intro-ja/index.html?index=..%2F..%2Fnext17-tok#0]]
https://cloud.google.com/speech/docs/getting-started?hl=ja

[1] Google Cloud Platform の プロジェクトを設定する
 [1-1] Cloud Platform Console で、プロジェクトを作成する
 [1-2] 課金を有効にする（クレジットカードを登録とかする必要がある）
 [1-3] Google Cloud Speech API を有効にする
 [1-4] 認証情報を設定 (以下は、認証情報の種類)
  * API キー
  * OAuth クライアント ID
  * サービス アカウント キー << Googleの推奨はこっち

※以降、調査中

参考文献

https://www.magellanic-clouds.com/blocks/guide/create-gcp-service-account-key/
http://kmycode.hatenablog.jp/entry/2017/04/09/120203
http://www.atmarkit.co.jp/ait/articles/1706/16/news038.html

日本語対応の音声認識サービス

https://blogs.yahoo.co.jp/dk521123/37139755.html

プログラムの超個人的なメモ

Memo for Programming.

【Google Cloud】音声認識 / Google Cloud Speech API ～入門編～

■ はじめに

■ Google Cloud Speech API

入門ガイド

使用制限

料金

使用上の注意

■ 実行の種類

[1] 同期音声認識

[2] 非同期音声認識

[3] ストリーミング音声認識

■ Google Cloud Speech APIを使用する当たって

参考文献

関連記事

日本語対応の音声認識サービス