『Vlingo: Words to Action』音声認識~声でAndroidを操れ!~

2010年10月17日 13:08 by みろいど
図1. Vlingo: Words to Action 起動画面

図1. Vlingo: Words to Action:起動画面

『Vlingo: Words to Action』というアプリをご紹介します。


さて、このアプリはどんなアプリか?といいますと、自分の声でAndroid端末をコントロールすることができます。ただし、使える言語は英語だけなので、使い方には工夫が必要になります。

※このアプリはAndroid OS 2.0以上が必要です。



しかし、この際、英語喋ってみませんか?普段から喋ることで、英語に慣れることができるかも…それに、昔(今も?)、NECの携帯でも、音声で電話帳をひいて電話をかけてくれる機能があったりしたのですが、確か日本語でもできました。が、日本語で「電話」「山田太郎」って、携帯に向って独り言を言うのって気が引けました。


でも、英語ならどうでしょう?「Call」「John」とか、言えたらかっこいいかも・・・と思うのはみろいどだけでしょうか・・・


ということで、どういったことができるかを、ご紹介していきます。


図2. Vlingo: Words to Action どんなことができるの?

図2. Vlingo: Words to Action:どんなことができるの?

さて、図1の画面下の「What Can I Say?」を選ぶと、図2が出現します。


そして、できることですが…声を使って、

  • 電話帳を使って端末に電話をかけさせることができます
  • SMSへのメッセージを送信することができます
  • ググることができます
  • Googleマップで目的の場所を表示させることができます
  • Twitterに本当につぶやけます
  • Emailを送ることができます


図2のそれぞれの項目をタップすると、それぞれの例が表示されます。


SuperDialer


図3. Vlingo: Words to Action 電話をかける

図3. Vlingo: Words to Action:電話をかける

声で端末を操れる、と言ってもキーワードがあります。電話をかける場合は「Call」。図3の例の表記に「mobile」「work」と書かれているのが、電話番号を電話帳に登録する時の種別を表します。日本語だと「携帯」「勤務先」に相当します。



では、電話をかけるところをご覧ください。みろいどのメチャ悪い発音でも、一応認識してくれます。映像は撮れてませんが、「Mobile」「Work」と言ったキーワードを認識してくれて、登録した通りの番号へかけてくれます。また、「自宅」→「Home」で認識してくれます。



図4. Vlingo: Words to Action ニューヨークのピザ屋検索

図4. Vlingo: Words to Action:ニューヨークのピザ屋検索

あと、こんなことを・・・「Call Pizza New York」とか言ってみたところ、電話番号リストが画面に・・・



Text Message, Search, Open Apps


次に図5左ですが、電話と同様にSMSへメッセージを送ることができます。ここでのキーワード例は「Text」「Send message to」「Message」です。その他に、疑問符も「Question mark」と言うことで付けられます。


図4.Vlingo: Words to Action SMSと検索とアプリ起動

図5.Vlingo: Words to Action:SMSと検索とアプリ起動


図5中央は、ネットサーチをさせることができます。使えるキーワード例は「Search」「Define」「Google」などになっていて、サーチしたい内容を続けて言います。


図5右はアプリの起動ですが、いろいろやってみたのですが…起動できませんでした。もしかすると、日本版のものはアプリ名が違ったりするのでしょうか…単に、発音が悪いのかも…orz


Local Search&Maps, Twitter, Email


続いて、図6左はGoogleマップで場所を表示させることができます。Tokyoはできましたが、やはり日本の地名で的確に表示はできませんでした。でも、外国の知っている地名を検索してみて、地図を見て楽しむ、というのも良いかもしれません。


図5. Vlingo: Words to Action MapとTwitterとEmail

図6. Vlingo: Words to Action:MapとTwitterとEmai


図7. Vlingo: Words to Action 渋谷の地図を検索?!

図7. Vlingo: Words to Action:渋谷の地図を検索?!

でも、とりあえず検索して見ました!


「Map of Shibuya!」


Speak back(図12でご紹介します)を聴いてみたところ…「Shibuya」でなく「Seafood」と認識されたみたいで…


こんなの出ました。とりあえず、出たところへ行ってみる!っていうゲームに使ってもよいかもしれません…なんて、そんなことする人いないですね。


図6中央は、TwitterへのTweetが正しくつぶやけます。みろいどが、またまた、変な声で試している動画をご覧に入れます。実際には、アプリを選択する画面が現われますので、タッチ操作は必要となります。


Tweet!


更に図6右はEmailの送信です。Subject(題名)なども入力できます。これも、試してみた動画をご覧ください。やっぱり、みろいどの発音は変なのでしょう、面白い結果になった動画と2本続けてどうぞ!


You are sexy!!!


Emergency


「You are sexy!」といわれた方が「Emergency」よりも直ぐに電話をかけてきてくれるかもしれません!これ再現性あるんですよね…認識を間違うので、何度かやっていたところ、2回も「You are sexy」になったんです。1回目は吹き出してしまって…「あー失敗」(記事に使うには)と思っていたのですが、2回目は何とかこらえました(耳をすますとちょっと吹いてるみろいどの声が聞こえると思います)


図6 Vlingo: Words to Action このアプリの情報

図8. Vlingo: Words to Action:このアプリの情報

図1下の「Info]を選ぶと図8が出現します。ここでは、このアプリの使い方や情報、詳細設定へと進むことができます。


図9は、図8の上から3項目をそれぞれタッチしたときにそれぞれ現れる画面です。図9左は基本的な使い方の説明、声でAndroid端末のコントロールができること、Vlingoはキーボードアプリも持っていて、入力方法の選択をすることによって、ソフトキーボードをタップして入力する代わりに音声で入力できるボタン付きのキーボードが出現する、というわけです。また、SafeReaderというメッセージの読み上げ機能が使えるなどの説明が書かれています(SafeReaderは後ほど、ご紹介します)。図9中央は、キーボードの設定に飛べるページとなっています。ごめんなさい、ここはちょっと割愛します。


図7. Vlingo: Words to Action 使い方とキーボード設定

図9. Vlingo: Words to Action:使い方とキーボード設定


図9右は、サーチキーを長押しするとVlingo起動ができることや、Widgetを配置できることが書かれています。


図8.Vlingo: Words to Action Wedgetの配置

図10.Vlingo: Words to Action:Widgetの配置

図10は、その配置できる全てのWidgetを配置してみました。

音声認識を起動させるWidgetが3つ。大(Large)、中(Medium)、小(Small)と、音声読み上げ(SafeReader)を開始/停止するWidgetが1つあります。


詳細設定に関しては、最後に紹介しますので、先に残りの「Settings」以外の画面をご紹介します。


「Online Support」は単純にオフィシャルサイトに飛ばされました(図11左)。また、次のレーティングはマーケット(図11中央)に飛びましたので、この評価を付けてくれ!ということですね。最後にAboutは、利用許諾などアプリに付き物な文面が表示する画面へと移ります(図11右)。


図9. Vlingo: Words to Action サポートとRatingと約款など

図11. Vlingo: Words to Action:サポートとRatingと約款など


さて、いよいよ詳細な設定です。


Settings


図10. Vlingo: Words to Action 詳細設定

図12. Vlingo: Words to Action:詳細設定

設定内容としては、図12の上から順に


  • SafeReaderという読み上げ機能の設定
  • Vlingoが認識した言葉をオウム返しするか否か
  • ダイアルに関する動作の設定
  • よろしくない言葉をアスタリスクにするか否か
  • 自分の場所情報を使うか否か
  • 自動で区切りを認識するか否か


という項目があります。


SafeReader Settings


図11.Vlingo: Words to Action SafeReaderの設定画面

図13.Vlingo: Words to Action:SafeReaderの設定画面

SafeReaderの設定は更に階層があって、図13の画面が現われます。ここでできることは、「端末を振って、現在喋っているメッセージをスキップさせるか否か?」「着信したEmailの読み上げを行うか否か?」「SMSのメッセージを読み上げるか否か?」(「Play texts」がSMSです)。このEmailやSMSの読み上げは何気に便利かもしれません(英語ですが…)。実際に読み上げてくれる映像を後ほどご覧に入れますが、SMSも編集部のDesireを使っている方にお願いして、試してみたところ、SMS到着と同時に喋ってくれました。


Email accounts


さて、読み上げてくれるEmailのアカウントの設定についてご紹介します。このEmailを設定すると、定期的に新着メールを確認しに行って、それをちゃんと読み上げてくれます。Emailサーバの種類としては、図14右にある様に、主要なところの設定ができます。みろいどは一応いろいろメールアカウントを持っていましたので、Otherを含め試してみました(OtherはもちろんBIGLOBEメールで確認していまーす)。


図12. Vlingo Words to Acction Emailの設定1

図14. Vlingo Words to Acction:Emailの設定1


ところが、ちゃんと読み上げがうまく行ったのは…

  • Gmail:○
  • Windows Live:×
  • Yahoo!Mail:△
  • AOL:○
  • Other(BIGLOBE):△


という結果になりました。WindowsLiveは、みろいどが持っているのは.jpのドメイン。もしかすると、米国のものならうまくいくのかもしれません。また、Yahoo!は登録もだめでした(図14左が登録できたメール)。多分、IMAPやPOPアクセスの必要があるため、設定時の確認で応答がないとダメなのだと思います。ということで、POPアクセスを有効化しようと思ったのですが、yahoo.comドメインのYahoo!Mailは、POPを有効にするには有料になるため断念。図には出ていませんが、yahoo.co.jpのアカウントで試してみました。ただし。デフォルトのYahoo!Mailは自動で、yahoo.comになるため、Otherから手動設定をしました。が、メールのチェック間隔を2分に設定していたにも関わらず、2分間隔以上の時間がかかって読み上げが実行されました。この現象は、BIGLOBEメールでも同じでした。もしかすると、メールサーバがIMAPではなくPOPの場合にはそうなってしまうのかもしれません。


図13. Vlingo: Words to Action Emailの設定2

図15. Vlingo: Words to Action:Emailの設定2


図15左は、Gmailを選択して、アカウントの登録をする画面です。Other以外は、Emailアドレスとパスワードを入力するだけの簡単な設定で済みます。図15右は、メールをチェックする間隔の設定です。さて、では実際にメールが自動的に読まれるところを試した映像をご覧に入れます。



ご覧の様に、3通りのメールを試してみました。「英語」「日本語」「ローマ字(日本語)」。日本語はEmptyと扱われて、読み上げてくれませんが、読めるところは読んでくれました。また、ローマ字は、それなりに書くとそれなりに分かります。「下さい」は「Kudasai」でなく「Kuudasai」と書くとそれなりに聞こえました。


Auto-Dial


図14. Vlingo: Words to Action AutoDialの設定

図16. Vlingo: Words to Action:AutoDialの設定

最後に、Auto-Dialの設定です。これは、先にYoutubeでもご覧頂いた電話をかけるとき、自動でかけてしまうか、かけるアクションを手動で選択するか?を選ぶものです。似た名前や誤認識で勝手にかけられては困る場合、Auto Dialは「When confident」か「Never」にしておく必要があります

<総括>

このアプリ、基本的には英語にしか対応していませんが、なかなか面白いと思いました。

また、レビュー記事内にも書きましたが、英語を喋る機会をくれる気がします。そこで思ったのが、Bluetoothのヘッドセットとか欲しいなぁと…ただ、そのヘッドセット経由で試せていないので、使えるかはちょっとわかりません。もし、Desireを所持できたら(今回は編集部からお借りした端末だったので)、自腹でもヘッドセットを買ってしまうかも…

あと、言語は英語でも良いですが、日本語の地名とか、そんなのにも対応してもらうとまた良いなぁと感じました。本アプリ、こんなにできますが無料ですので、Android OS 2.0以上が動く端末をお持ちの方はぜひ試してみて下さい。

Vlingo: Words to Action
Vlingo Corp. Vlingo: Words to Action 無料

『Vlingo: Words to Action』音声認識~声でAndroidを操れ!~

上のQRコードを読み取ってAndroid端末でダウンロード

無料QRコードアプリ