今更聞けないシリーズ#2 Azure Cognitive Services ~音声分野編~

前回の記事では、Azure Cognitive Services全般の内容を取り上げました。
今回はその中で音声分野サービスについて、そのサービスの内容と気になる課金体系について紹介したいと思います。

Azure Cognitive Services 音声分野とは

以前紹介した通り、音声分野では、主に”話す・聞く”といった機能をサービスに取り入れることができます。
用意したテキストを音声に変換して読みあげたり、ユーザーの音声をテキストファイルに書き起こすことができます。
例えば、音声分野を用いることで、プレゼンテーションにおいてプレゼンターが話した内容をそのままテキストデータに書き起こしたり、逆に用意した原稿をコンピュータに読みあげさせたりできます。
音声分野の公式HPはこちら

音声分野のサービス

音声分野のサービスは4つあります。

Speech to Text

Speech to Text は音声をテキストに変換します。いわゆる文字起こし・ディクテーションと呼ばれる機能です。
Speech to Text に音声データを入力すると、テキストデータが出力されます。音声データをクラウドにあげることはできないニーズにも対応できるオプションもあります。
また、工事現場や工場など環境音が大きいユースケースに対するチューニングもできます。
例えば、会議の発言ログの自動生成で利用できます。

Speech to Text の公式HPはこちら

課金体系

Speech to Text の課金体系は、使った分だけの従量課金です。
テキストに変換する音声データの時間に対して、1時間ごとに課金が発生します。

Text to Speech

Text to Speech はテキストを音声に変換します。いわゆるコンピュータによる読み上げ機能です。
Text to Speech にテキストデータを入力すると、音声データが出力されます。
音声はサービス側でプリセットが用意されていますが、独自に読み上げスピードや抑揚を調整することでより滑らかで自然な表現もできます。

例えば、音声チャットサービスの受け答えや受付の音声案内、動画のナレーションに利用できます。

Text to Speech の公式HPはこちら

課金体系

Text to Speech の課金体系は、使った分だけの従量課金です。
句読点も含めて読み上げる、1,000,000文字ごとに課金が発生します。

Speech Translation

Speech Translation は音声を翻訳した文字に変換します。音声を文字に変換する面ではSpeech to Text に似ていますが、Speech Translation では変換した文字を翻訳して出力します。
また、Speech to Text はリアルタイム翻訳に対応しているため、YouTubeの動画字幕のように話している内容をその場で翻訳することができます。
Speech Translation の公式HPはこちら

例えば、リアルタイム動画配信や会議の同時通訳に利用できます。

課金体系

Speech Translation の課金体系は、使った分だけの従量課金です。
翻訳する音声データの時間に対して、1時間ごとに課金が発生します。

Speaker Recognition

Speaker Recognition は音声話者の識別ができます。入力した音声データから誰が話しているのかを識別することができます。
事前に会議参加メンバーの音声を登録することで、会議中に誰が話しているのかを識別したり、未登録のメンバーを見つけることができます。
また、音声から話している人を認証する、音声認証機能もあります。
Speaker Recognition の公式HPはこちら

例えば、音声認証では音声だけでメンバーを認識したり、 Speech to Text と組み合わせて会議の発言ログに対して誰が話したかを自動振り分けたりすることができます。

課金体系

Speaker Recognition の課金体系は、使った分だけの従量課金です。

話者識別の回数に対して、1,000 回ごとに課金が発生します。また、識別対象話者は10,000ケースまで無料で登録でき、その後1,000ケースごとに課金が発生します。

次回

次回は、Azure Cognitive Servicesの言語分野について紹介します。

最後に

今回はAzure Cognitive Servicesの音声分野について紹介しました。各サービスの課金体系は従量課金ですが、利用するためのファイルをクラウドに保存する場合は別途保存のための料金などが発生します。ColorkrewではAzure Cognitive Servicesを活用したPoCから本開発まで、様々な形で支援させていただきます。
Azure Cognitive Servicesを利用した開発支援について、ご興味ある方は以下からお問い合わせください。

 

クラウド活用支援サービス | くらまね

 

くらまね

おすすめ記事