AI関連

VUIの先にあるもの

機械に向かって話しかけたりすると、一昔前は「あいつヤバイ…」と白い目を向けられましたが、今では当たり前の光景になりました。

PCやスマホ、スマートスピーカー、家電やデジタルサイネージなど様々なところで音声ユーザーインタフェイス(VUI:Voice User Interface)が使われています。

我々ティファナ・ドットコムが、VUIのAIさくらさんを提供しはじめて、はや4年…。
VUI自体は結構古くからある技術ですが、昨今の事情も鑑みて今後更に普及してゆくことが予想されます。

そんなVUIの更にその先について考えて見たいと思います。

VUI苦難の歴史

今でこそ”使える”技術となりましたが、ちょっと前まではなかなか普及の難しい技術でした。

歴史は古く、国内でも1960年代から研究され始め、ほんの5、6年ほど前までは、ある一定の条件下でやっと使える状態になるかな…といったものでした。

例えば、話者の音声データ(音響モデル)を構築することで、やっとその話者個人が使う物として使えるレベルになるイメージです。

何がそんなに難しいのかというと、まず第一に人間の声とそれ以外の音を、コンピューターは区別できないんです。
人間であれば騒音の中でも、人の声とそれ以外を瞬間的に聞き分ける事が出来ます。

コンピューターの場合は、人間の声はどんな成分で出来ていて、どのあたりの周波数帯で構成されているか…と言った事をイチから教え込まないといけません。

また、2番目に難しいのが言語モデルの構築です。
当然ですが、言語ごとに文法も違えば、発音の仕方も違います。
いま、日本語で喋っていますよー、と言う事をあらかじめ設定することで、認識精度を上げているわけです。

例えば、「わたし」と言う単語の後には「は」「が」「に」「と」「を」「の」のどれかの音が来ることが多い…みたいな統計モデルを元に、音を判断して精度を上げるのです。
コレにものすごい費用と人材と時間が投下され、50年たっても普及にはまだ微妙…という状態だったんですね。
私も、ドラゴンスピーチというソフトを使って、自分の音響モデルを構築(様々な文章をソフトの指示通りに読み上げる)し、PCの操作を音声でできる様にしたことがあります。
それでも精度は少し怪しい感じだったのを覚えています。

ここに革命が起きます。
音声認識の精度が飛躍的にアップしたのです。

AIのニューラルネットワークと、それを幾重にも積み重ねて学習させるディープラーニング技術。
そして、そこに注ぎ込まれた膨大な数の音声データーが、それを実現させました。

個人の音響モデルを登録することなく、誰でもVUIが手軽に使える様になったのは、AIのおかげなのです。

VUIの先にあるもの

おかげさまでAIさくらさんは、ちょっとは名の知れた存在になりまして、今も様々な場所で活躍しています。
VUIを使うものとしては、店頭や駅に導入されているものですね。

AIですので、音声で直接操作すると言うよりは、認識した言葉を理解して最適な回答を出すと言う形になりますが、音声認識部分はVUIと一緒の概念ですし、音声認識とPCの操作を直接つなげることも可能になっています。

「さくらさん、今日の重要なメール表示して」と話しかければ、RPAと連携して一定条件のメールを検索して表示したり、「○○さんに電話繋いで」と言えば、直接電話をかける掛ける事だって可能になっています。

ただ、スマホやサイネージなどがそうですが、VUIだけで完結できないことがほとんどで、VUIで操作した後に必ず画面にタッチする操作が必要になってきます。
昨今の感染リスクを考えると、自分のスマホはともかく、誰が触ったかわからないようなものにはできるだけ触りたくないですよね。

そこで我々は、ジェスチャーUIというものも開発しAIさくらさんに実装しました。
画面にタッチすることなく、手をかざすだけで操作可能にした物です。
かざした手に合わせてカーソルを動かしたりすることはもちろん、ジェスチャーによる操作も可能です。

では、その先はどうなるのでしょうか。

声で操作できるようになり、触れずにジェスチャーで操作できるようになった更にその先のものがあるとすれば…

ピンと来た方もいるのではないでしょうか。

そう、脳波です。

こちらも研究自体はかなり前から進められており、特に医療分野での研究が盛んです。

四肢に麻痺がある方が、手を使わずにPCを操作したり、義手・義足をより直感的に動かすために日々開発が進められています。
義肢の場合は脳波と言うよりは、筋肉に送られる電気信号を読み取る方式の方が主流ですが…

脳自体、電気信号で情報伝達を行っているので、その信号が読み取れれば理論上はうまくいくはずなのですが、
脳波に個人差が大きいことと、ノイズが多いことで難航しているようです。

それでも上下左右のどこへ意識を集中しているか…くらいは読み取れるようになってきているので、このあたりもAIがディープラーニングでさらに最適化していって、実用に耐えうるレベルまで引き上げてほしいものです。

現状では、脳波による操作で1文字打つのに20秒かかります。これが現在最速らしいですよ。。。
頭に思い浮かべたものを瞬間的に文章化してくれたり、音声でやりとりする裏で、電脳による無音声コミュニケーションで…

なんてことはまだ夢ですね。

早く実現して欲しいなぁ。

攻殻機動隊ごっこしたいなぁ…

全部ここへつなげる。。。

ではまた。

日本のキャッシュレス決済化進展をAIが支える前のページ

AIとMR技術でデジタル変革するウィズコロナの世界次のページ

ピックアップ記事

  1. 新しい販売形態であるDtoCについて考えてみる
  2. 大手企業も注目するMaaS(Mobility as a Service)とは何か…
  3. AIに求められているものは、実は意外な物だった
  4. 新型コロナウイルスで日本の働き方改革が起こる

関連記事

  1. AIさくらさん

    人工知能(AI)を活用し、お客様の疑問を解決し顧客満足度向上できるサイト作り!

    【人工知能(AI)×顧客満足度】最近話題のAIを活用したWebサイトで…

  2. AI関連

    AIが作曲する時代が来るらしい

    AIが一般的になるにつれて、【事務的・機械的な業務はAIに取って替わら…

  3. AI関連

    RPAを導入する前に、見直すべき業務について

    RPAを導入の際の注意点RPAという言葉自体は人手不足の解消や…

  4. AI関連

    人工知能(AI)が不動産業界のワークスタイルを変える

    どの業界にも影響を与えている人材不足。今回はPRAと人工知能(AI)を…

  5. AI関連

    採用にもテクノロジーを!

    どんな企業も、毎年多くの時間と予算をかけて取り組む「採用活動」。い…

  6. AI関連

    着るコンピューター? ウェアラブルデバイス×人工知能(AI)で出来ること

    従来のパソコンの枠にとらわれないスマートなデバイス「ウェアラブルデバイ…

おすすめ記事

最近の記事

  1. デジタル化が旅行・観光業を救う!?ウィズコロナ・アフターコロ…
  2. 人が対応するのが正しいの?DX(デジタルトランスフォーメーシ…
  3. 人間拡張って聞いたことがありますか?デジタル化が背中を押して…
  4. テレワークだけでは足りない?デジタルシフトなど、アフターコロ…
  5. 【初心者向け】ここに注目!スマートフォン用バナーを作成しよう…

アーカイブ

  1. Web関連

    末恐ろしい。小学生が開発したスマホアプリ
  2. Web関連

    HTML5での動画再生が主流になってきた!
  3. AI関連

    RPAが解決する単純作業! ~ECサイト活用編~
  4. Web関連

    写真から情報漏洩!?セキュリティ対策とは?
  5. Web関連

    目指せ読書家!読書が苦手な人が習慣を付ける為に行いたい5つのステップ
PAGE TOP