
Kazuya Hotta
今更聞けないシリーズ#4 Azure Cognitive Services ~視覚分野編~
...以前の記事では、Azure Cognitive Services全般の内容を取り上げました。 今回はその中で視覚分野サービスについて、そのサービスの内容と気になる課金体系について紹介したいと思います。
試してみたいサービスが以下のURLから試すことができるので、是非アクセスしてみてください。 Hands on with AI
Azure Cognitive Services 視覚分野とは
以前紹介した通り、視覚分野では、主に画像を理解(解析)することができます。 例えば次のようなことができます。 - 画像に写っているのは犬か猫かの判定 - レシート画像から何をいくらで買ったのかを検出 - 画像に写っている自社ログの検出
視覚分野のサービス
視覚分野のサービスは3つあります。
Computer Vision
Computer Vision では画像や動画の中から、文字や人、モノなど画像に何が写っているのかを自動判定することができます。 例えば、会議で利用したホワイトボードの画像を入力してボード上の文字を認識したり、オフィスの画像を入力してテーブルや椅子の位置、ラップトップコンピュータの位置や人の位置など画像内の人・モノを検出することができます。 Computer Vision の公式HPはこちら
課金体系
Computer Vision の課金体系は、使った分だけの従量課金と事前予約です。 1つの画像からの検出を1トランザクションと定義し、トランザクション数に応じて課金されます。 従量課金の場合は、1000トランザクションごとに課金が発生します。 事前予約の場合は、最低500,000トランザクションまで定額で、その後1,000トランザクションごとに追加料金が発生します。利用規模に応じて定額で利用できる枠を増やすことができます。
Custom Vision
Custom Vision は特定のモノが画像にあるないか、あるならどこにあるかを検出することができます。 Computer Vision と似ているのですが、大きな違いはCustom Vision では独自に検出したいモノを学習することができます。Computer Vision はMicrosoftが用意した検出用モデルを利用するのに対して、Custom Visionはユーザが独自に画像を学習させて検出用モデルを作り、利用することができます。 例えば、自社のロゴや製品を事前に登録して、画像から登録したロゴや製品を検出する用途に利用できます。また、製品を複数登録することで、画像に含まれている製品は何かの判別に利用することもできます。 加えて、Custom Visionでは、作成した検出モデルをダウンロードしてオフラインで利用することもできます。 Custom Visionの公式HPはこちら
今更聞けないシリーズ#3 Azure Cognitive Services ~言語分野編~
...以前の記事では、Azure Cognitive Services全般の内容を取り上げました。 今回はその中で言語分野サービスについて、そのサービスの内容と気になる課金体系について紹介したいと思います。
Azure Congnitive Services 言語分野とは
以前紹介した通り、言語分野では、主に文章の内容を理解(解析)する機能をサービスに取り入れることができます 言語分野ではその書き起こした文章の意味を理解し、次の行動につなげることができます。
以下のようなことができます。
- チャットボットにおいてユーザの入力したメッセージを理解して会話を続ける
- ある文章を入力してその中で重要な単語をピックアップする
- 大量のドキュメントの翻訳
言語分野の公式HPはこちら
言語分野のサービス
音声分野のサービスは5つあります。
Entity recognition(エンティティの認識)
Entity recognitionは文章から日付や製品に関する特定の情報といったキーワードを抽出できます。 例えば、日付を表す単語 ”明日”や”明後日”、”8月9日”、“8/9” など様々な言い方で表現される日付を文章から見つけることができます。 この機能を使って、例えばチャットのやりとりの中で会議召集を自動で作成したり、チャットを用いた予約システムで予約日を抽出することができます。 また、Entity recognitionはインターネットへの接続がない環境でも利用することができます(別途申請が必要)。
課金体系
Entity recognition の課金体系は、使った分だけの従量課金と事前予約です。 1文章(最大1000文字)を1テキストレコードを定義し、1テキストレコードあたりで課金されます。 従量課金の場合は、1000テキストレコードごとに課金が発生します。 事前予約の場合は、最低100万テキストレコードまで定額で、その後100テキストレコードごとに追加料金が発生します。利用規模に応じて定額で利用できる枠を増やすことができます。
Sentiment analysis(評判分析)
Sentiment analysisは文章から意見や感情を評価分析できるサービスです。 ソーシャルメディア(SNS)に投稿される自社製品や自社ブランドの評判やECサイトに投稿されるカスタマーレビューを分析し、その製品や自社に対して肯定的なのか否定的なのかを自動判断できます。 肯定的または否定的の指標は数字で表されるので、特に肯定的な意見や否定的な意見などを効率的に収集し次に活かすことができます。 先ほどのEntity recognitionと組み合わせることで、肯定的な中でも評判が良い機能をリストアップすることができます。 また、Sentiment analysisはインターネットへの接続がない環境でも利用することができます(別途申請が必要)。
課金体系
Sentiment analysis の課金体系は、使った分だけの従量課金と事前予約です。 1文章(最大1000文字)を1テキストレコードを定義し、1テキストレコードあたりで課金されます。 従量課金の場合は、1000テキストレコードごとに課金が発生します。 事前予約の場合は、最低100万テキストレコードまで定額で、その後100テキストレコードごとに追加料金が発生します。利用規模に応じて定額で利用できる枠を増やすことができます。
今更聞けないシリーズ#2 Azure Cognitive Services ~音声分野編~
...前回の記事では、Azure Cognitive Services全般の内容を取り上げました。 今回はその中で音声分野サービスについて、そのサービスの内容と気になる課金体系について紹介したいと思います。
Azure Cognitive Services 音声分野とは
以前紹介した通り、音声分野では、主に”話す・聞く”といった機能をサービスに取り入れることができます。 用意したテキストを音声に変換して読みあげたり、ユーザーの音声をテキストファイルに書き起こすことができます。 例えば、音声分野を用いることで、プレゼンテーションにおいてプレゼンターが話した内容をそのままテキストデータに書き起こしたり、逆に用意した原稿をコンピュータに読みあげさせたりできます。 音声分野の公式HPはこちら
音声分野のサービス
音声分野のサービスは4つあります。
Speech to Text
Speech to Text は音声をテキストに変換します。いわゆる文字起こし・ディクテーションと呼ばれる機能です。 Speech to Text に音声データを入力すると、テキストデータが出力されます。音声データをクラウドにあげることはできないニーズにも対応できるオプションもあります。 また、工事現場や工場など環境音が大きいユースケースに対するチューニングもできます。 例えば、会議の発言ログの自動生成で利用できます。
Speech to Text の公式HPはこちら
課金体系
Speech to Text の課金体系は、使った分だけの従量課金です。 テキストに変換する音声データの時間に対して、1時間ごとに課金が発生します。
Text to Speech
Text to Speech はテキストを音声に変換します。いわゆるコンピュータによる読み上げ機能です。 Text to Speech にテキストデータを入力すると、音声データが出力されます。 音声はサービス側でプリセットが用意されていますが、独自に読み上げスピードや抑揚を調整することでより滑らかで自然な表現もできます。
例えば、音声チャットサービスの受け答えや受付の音声案内、動画のナレーションに利用できます。
今更聞けないシリーズ#1 Azure Cognitive Servicesとは
...近年、世の中でDXが注目される中で、ColorkrewでもDXに関するお問い合わせを数多くいただいております。
その中でもお問い合わせの多いAzure Cognitive Servicesについて、どんなサービスなのか、どんな課金形態なのかをシリーズを通してご紹介したいと思います。 第一回目は、そもそもAzure Cognitive Servicesってなんなんだ?をテーマにお届けします。
Azure Cognitive Servicesとは
Azure Cognitive Servicesとは、AIの民主化を掲げるMicrosoft 社が提供するAIパーツのサービス群です。 機械学習で課題となる”データの蓄積”や”学習”のプロセスをなるべく簡略化し、サービスに対して簡単にアプリにAI機能を取り入れることができます。 Azure Cognitive Servicesの公式HPはこちら
Azure Cognitive Servicesってどんなことができるの?
Azure Cognitive Servicesは主に4つの分野に分かれています ・ 音声 ・ 言語 ・ 視覚 ・ 判断
音声分野
技術例:音声分析、音声生成 音声分野では、主に”話す・聞く”といった機能をサービスに取り入れることができます。 用意したテキストを音声に変換して読みあげたり、ユーザーの音声をテキストファイルに書き起こすことができます。 例えば、音声分野を用いることで、プレゼンテーションにおいてプレゼンターが話した内容をそのままテキストデータに書き起こしたり、逆に用意した原稿をコンピュータに読みあげさせたりできます。
言語分野
技術例:テキスト解析、自然言語処理、形態素解析 言語分野では、主に文章の内容を理解(解析)することができます。 音声分野では、単に音声を文字として書き起こすだけだったのに対して、言語分野ではその書き起こした文章の意味を理解し、次の行動につなげることができます。 例えば、言語分野を用いることで、社内のヘルプデスク窓口のチャットで質疑応答の自動化ができます。
視覚分野
技術例:画像解析、画像分析、物体検出、OCR 視覚分野では、主に画像を理解(解析)することができます。 画像に写っているのは猫か犬かの判定や、レシートの画像から何を買ったかなど画像の内容を理解(解析)することができます。 例えば、視覚分野を用いることで、画像に写っている自社のロゴを検出などに利用できます。
判断分野
技術例:異常検知、文章検出 判断分野では、主に監視や問題の早期検出をすることができます。 製品の異常を早期に発見したり、自社サイトの異常なアクセスの検出など、日々変化するデータを理解(解析)することができます。 例えば、判断分野を用いることで、特定の投稿に対して、不快または好ましくない文章を検出することができます。
SXSW 2019、体験レポート #4
...こんにちは。ISAOのアプリケーションエンジニアの堀田和也です。 SXSW(サウスバイサウスウェスト)に関して3回目投稿となります。 SXSWは本当に面白くて刺激を受けるイベントです。
今回の記事では、SXSWでVR・ARを展示・紹介していた Experience Bose AR-augmenting the world around you with sound
について、触れて見たいと思います。
題して ”SXSWでみたVR・ARの現在” です。
会場全体は、少し暗めでした。

展示されていたプロダクトについて
全体として、今回展示されていたプロダクトは主にコンテンツ勝負になっている印象を受けました。 OculusをはじめとするVR製品が広まってきていることもあり、新しいデバイスよりもそのプラットフォームでどんなコンテンツを生み出すのかに各社注力している印象です。
主なコンテンツは次の通りです。
ゲーム
VRといえば、すぐに思いつくものはゲームだと思います。 今回のSXSWでも、当然VRを活用したゲームが多数紹介されていました。
例えば、
ECLIPSE
宇宙船でトラブルにあった主人公がそのトラブルに対応するものです。 体験者が実際に歩き回りながら、VRの中でモノを掴んだり、置いたりの操作を繰り返して解決へ向けて前進します。
ポスターからの雰囲気が伝わってきます。

実際にプレイしている様子です。

MARS HOME PLANET
ECLIPSEと同じ宇宙モノですが、ECLIPSEが実際に歩き回りながら体験するのに対して、こちらは座りながら体験するVRです。 実際に椅子を動くことで、宇宙船に実際に乗ってる感覚が視覚からだけでなく全身から感じることができます。

ドキュメンタリー
次にドキュメンタリーのコンテンツに対してVRが活用されつつあるようです。 VRによる没入感によって、今まで以上に体験者の心を大きく動かす体験を目指しているようです。
SXSW 2019、体験レポート #3
...こんにちは。ISAOのアプリケーションエンジニアの堀田和也です。 SXSW(サウスバイサウスウェスト)に関して2回目の投稿となります。
今回はSXSWの目玉企画の1つ”Release It”で紹介されてサービスをいくつか紹介したいと思います。
Release It とは
Release It(リリースイット)とは先進的でかつイノベーティブな新しいサービスやプロダクトを紹介し競い合うイベントです。 紹介方法はプレゼンテーションと専門家からの質疑応答です。 プレゼンテーションでは、
- サービス概要
- 市場機会
- サービス・プロダクトチーム
などが紹介されていました。
質疑応答では、
- サービス・プロダクトの試験はどうやったのか?
- サービス・プロダクト作成にあたってのデータはどうやって収集したのか?
- サービス・プロダクトの今後のマーケティング方法は?
- 既存のサービス・プロダクトとの違いは?
などビジネス戦略の質問が多い印象を受けました。
SXSW 2019ではインタラクティブセッションの初日に開催されました。

会場はこのような雰囲気です。
見ていて面白かったもの
見てみて面白かったものを3つ紹介したと思います。
Lumos Helmet
自転車やスクーター、バイクのヘルメットにフロントライト、ウィンカー、ブレーキランプをつけた新しいヘルメットです。 自転車などの運転者の手信号を認識して、ランプを点灯してくれます。 開発当初はクラウドファンディングで資金を調達したそうです。
正面から

後ろから

Reviver Auto
125年変わっていない自動車のナンバープレートをデジタル化しようというプロダクトです。 既存のナンバープレートをディスプレイとと通信機能のもつIoTデバイスに置き換えるプロダクトです。 これによって、盗難時のジオフェンスやその他サービスとの連携することができるようになります。 また、ディスプレイに車のナンバー以外にイラストやメッセージなどをつけることができるようです。

SXSW 2019、体験レポート #2
...初めまして、アプリケーションエンジニアの堀田です。 今回は、私がSXSW(サウスバイサウスウェスト)のPitch(ピッチ)で興味を持ったカテゴリについて紹介したいと思います。
SXSW (サウスバイサウスウェスト) とは
Interactive・Film・Musicの3つで構成され、アメリカのテキサス州オースティンで毎年開催される世界的なカンファレンス&フェスティバルです。
有名なところだとTwitterやAirbnbがSXSWで賞を受賞し、現在に至っています。 この後の世界のトレンドをキャッチアップする上で、とても勉強になるイベントです。 世界のこれから流行るであろうサービスをいち早くキャッチできる、最高にわくわくするイベントです。

SXSW Pith(サウスバイサウスウェスト ピッチ)とは
世界で先進的な取り組みをおこなう企業が、専門家と観客の前でプレゼンテーションを行いテクノロジーやビジネス価値を競い合うイベントです。 優勝すると賞金がもらえます。 賞金だけでも十分参加する価値がありますが、それだけでは終わらないのがSXSWです。 観客の中には一般参加者だけでなく投資家や企業家が交じっており、そこでの発表することで更なるビジネスの発展が期待できます。
2019年の今年は次の10種類のカテゴリで構成されていました。 * 輸送と配送(Transportation & Deliver Technology) * 社会と文化(Social & Culture Technology) * エンタープライズとスマートデータ(Enterprise & Smart Data) * 拡張現実と仮想現実(Augmented & Virtual Reality Technology) * 強く繋がった社会(Hyper-Connected Communities Technology) * ブロックチェーン(Blockchain Technology) * 人工知能(Artificial IntelligenceTechnology) * スポーツとパフォーマンスデータ(Sports and Performance Data Technology) * エンターテイメントとコンテンツ(Entertainment & Content Technology) * ヘルスケアとウェアラブルデバイス(Health and Wearables Technology)