コンテキスト広告

コンピュータビジョンの5つのユニークな活用例

コンピュータビジョンアプリケーションの図
GumGumチーム
GumGumチーム
10
公開日:
2020年8月16日
シェア

その名の通り、コンピュータビジョンとは、デジタルデバイスが視覚データ(写真、動画、さらにはライブ映像など)を取り込み、それを実際に理解する能力を指します。今日、コンピュータビジョンは現実の世界で、写真ライブラリの整理や半自動運転車から、スポーツ動画内のスポンサーロゴの分析、さらにはシリコンチップ工場の組立ラインにおける品質検査に至るまで、あらゆる分野で活用されています。


しかし、コンピュータビジョンの可能性は無限大であり、現在、あまり知られていない多くの革新的な技術が開発中であるか、あるいはすでに実社会で活用され始めている。そのほんの一例を以下に挙げる:


「ほら、ママ、カメラなしだよ:3Dマッピング」


Google Tangoなどの技術を搭載した次世代のスマートフォンには、周囲の世界を識別・計測し、3Dマップを作成できる3Dセンサーがますます搭載されるようになるでしょう。 サンタモニカに拠点を置くスタートアップ企業「Fantasmo」は、この新たな機能を活用し、クラウドソーシングによる3D空間マッピングを軸としたプラットフォームを構築しています。収集された情報はクラウドに保存され、新居を購入した人が家具の配置イメージを確認する手助けから、『ポケモンGO』の開発者が、プレイヤーの周囲の環境をリアルタイムで把握した上で、拡張現実(AR)コンテンツを作成することまで、幅広い用途に活用可能です。 しかし、Project Tangoの技術とライブカメラを組み合わせれば、ゲームは部屋全体を、その環境に特化したオーバーレイや、その環境に即座に反応する様々なポケモンによって一変させることになるでしょう。


Fantasmoにとって、価値は3Dスキャンそのものにあるのではなく、クラウドソーシングによって収集された3D空間のプラットフォームと、そのプラットフォームを制御する能力にある。「我々は、このデータが流れる『パイプ』になりたい」と、FantasmoのCEOであるジェイムソン・デトワイラー氏は、同社がスタートアップコンテストで優勝した「LDV Vision Summit」でのデモで語った。 「最終的な目標は、絶えず更新される世界のモデルを構築することです。そこでは、あらゆる人物を積極的に追跡し、そのデータをゲームエンジンや、ユーザーが利用したいあらゆるシステムにフィードバックします。これこそが、文字通りデジタル世界と現実世界を融合させる方法です。それがARのアウトレイヤーなのです。」


病理医の頼もしい味方:目、顔、そしてX線による診断


一般的な認識とは異なり、機械による診断は、医師やその他の医療専門家を置き換えることを目的としているのではなく、むしろ彼らの能力を強化することを目的としています。例えば、平均的な病理医は、1枚あたり数万から数十万個の細胞が載っているガラススライドを約500枚確認することになります。これらすべての細胞を適切に検査する必要がありますが、人間1人では事実上不可能です。


ここで、特定のものを探す限り、膨大な量の画像を処理できるコンピュータビジョン搭載のAIが、状況を一変させるのです。病理医の診断精度向上を支援するためにコンピュータビジョンモデルの構築と学習を行っているPathAIの研究によると、乳がんのリンパ節生検における正確率は、人間のみによる診断と人間とコンピュータを併用したアプローチを比較した場合、85%から99.5%へと向上したことが明らかになりました。


PathAIの機械学習システムは、基本的に約500枚のスライドの中からがんが認められる領域を特定する。「そして今や、病理医の仕事は、AIシステムが提示した診断を修正または確認し、次の症例に移ることにある」と、PathAIの共同創業者兼CEOは先ごろ開催されたLDV Vision Summitで述べた。「これにより、検査プロセスが劇的にスピードアップする。」


トラック、ドローン、ボート:その他あらゆるものの自律化


今日の交通関連のニュースの見出しの多くは、消費者向けの自動運転車に焦点を当てています。これらの車は、カメラ、センサー、LiDAR、レーダーなどを組み合わせて、前方や周囲の道路状況を「認識」しますが、自動運転トラックや船舶、さらにはレースカーにおいても、コンピュータビジョン機能の最適化に向けた研究開発が同様に進められています。


一部の専門家は、自動運転の乗用車よりも先に、自動運転の貨物車両が実用化段階に達すると見ている。将来的には、事故を起こさず、24時間365日休むことなく、おそらくは極めて高速で走行できる自動運転の電気トラックの車列が登場し、農産物や小包、あるいはさらに重要なこととして、2,000ケースのビールを数日で全米各地へ配送するようになるだろう。 一方、スタートアップ企業のSea Machinesは、ボストン港で自律航行ボートの試験運用をすでに開始している。同社は、消防艇から貨物船に至るまで、あらゆる種類の船舶向けの自律制御システムの開発に取り組んでいる。これは、油流出事故の終焉を意味するのだろうか?


しかし、実用性だけがすべてというわけではない。スポーツエンターテインメントの分野でも、自動運転化が進んでいる。スタートアップ企業のロボレース(Roborace)とフォーミュラE(EVレースシリーズ)は提携し、時速199マイルで走行できるだけでなく、コース上で実際に学習できる自動運転レースカーの開発に取り組んでいる。障害物コースのようなコースであればあるほど、その性能は発揮され、記録更新の可能性は、控えめに言っても飛躍的に高まるだろう。


千の顔を持つ機械:あなたを完全に読み解くコンピュータビジョン


AIには共感力や対人スキル、感情知能が欠けているかもしれないが、最近、顔認識ネットワークが学習してきたタスクの中には、基本的かつ具体的な感情の予測を可能にするものもある。 例えば、ディズニーは、観客の顔の写真を見るだけで、10分以内にその映画に対する観客の感情を見極めることができるネットワークを開発した。400席の映画館で観客の顔に焦点を合わせた4台の赤外線カメラを使用し、ディズニーの研究者たちは150回の上映会を通じて約1,600万件の表情データを収集した。


「因数分解型変分オートエンコーダー(FVAE)」と呼ばれる技術を活用し、ディズニーのプログラムは、例えば人物が適切な場面で笑っているか、怖がっているかといった点に基づいて計算を行います。この結果は、テスト上映から、ディズニーが今後開始予定のNetflixのようなストリーミング動画サービスにおけるレコメンデーションエンジンに至るまで、あらゆる用途に活用される可能性があります。


「機械の初歩的な感情認識」という分野で後れを取らないよう、もう一つのアメリカを代表する巨大ブランドであるウォルマートは、レジのカメラを通じて顧客の気分を分析する顔認識技術を開発している。もし買い物客がレジ係の対応が遅いことに苛立ちを感じている場合、システムは顔認識によってその不快感を検知し、即座に他の従業員に通知して助けを呼ぶ仕組みだ。


しかし、なぜ人間の読解力だけに留まる必要があるのでしょうか?動物にも顔があります。そこで、英国の研究者たちは、痛みを感じている羊と何の問題もない羊の写真を500枚用いて、ニューラルネットワークを学習させました。「耳が前方に折れ曲がっている」や「目を細めている」といった「痛み」を示す特徴的な兆候に着目し、「羊の痛み顔面表情尺度(Sheep Pain Facial Expression Scale)」は、羊の顔の写真を眺めるだけで、その羊が痛みを感じているかどうかを予測できるようになりました。


「良い」ターミネーター観:本当に役立つウェアラブルデバイス


Google Glassは大衆の心を掴むことはできなかったかもしれませんが、AR対応のウェアラブルデバイスへの夢は消えていません。Appleでさえ、AR対応メガネの開発を進めているとの噂があります。現時点では、Vuzixなどの企業が、トラクターの運転手がより効率的かつ安全に作業できるよう支援する、ARのようなオーバーレイ機能を備えたスマートグラスを提供しています。また、Orcamは、コンピュータビジョン技術を用いて、視覚障害者のためにテキストを読み上げたり、顔認識さえも行えるウェアラブルメガネを提供しています。 現時点では、これら両方のフレームはかさばるものですが、Warby Parkerのような眼鏡メーカーが、普通のメガネと見分けがつかないような同様のウェアラブル製品を発売するのは時間の問題でしょう。そしてもちろん、 コンタクトレンズでも こうした拡張現実のような体験が可能になるかもしれません


将来的には、周囲の環境に応じて変化するダイナミックなディスプレイが実現すれば、真に超人的な能力が可能になるでしょう。情報を呼び出す能力や、目の前の車や木、建物、芸術作品といった視覚情報を分析する能力、視界を望遠や顕微鏡のように拡大する機能、さらには数分前、数日前、あるいは数年前の出来事を再生する機能などが考えられます。 また、拡張現実(AR)とは、単にライブカメラ映像にクールなオーバーレイを表示することだけを意味するわけではないことも忘れてはなりません。例えば、多くのスマートフォンや携帯用カメラにすでに搭載されているサーマルイメージングカメラによって生成されるリアルタイムのヒートマップも、近い将来、ウェアラブルデバイスに搭載されるようになるでしょう。


イラスト:アンドルー・コリン・ベック

洞察、調査、そして現実的な考え方。