IT Insight

AI・IoTコンサルタント 伊本貴士の経営に役立つ最新技術解体新書「AIによる画像認識でできること」

レンテックインサイト編集部

 ディープラーニングと呼ばれる手法が登場したことによって、AI(人工知能)の実力は大きく進化し、第三次人工知能ブームが起こりました。
特に、画像認識の世界においては、人間にも難しいような判別もAIならできるような世界が実現しました。

例えば、レントゲン画像からの癌の発見率について、AIによる画像認識は人間を超えるような結果を出しています。
また、画像に映っているのが人間なのか車なのかも判別が可能で、それが人間の場合、男性か女性かといった性別まで高い精度で判別することができます。

このような結果を見ると、AIによる画像認識の技術がさまざまな所で利用できるのではないかという期待も高まります。
今後、AIによる画像認識によってさまざまな作業が自動化され、第四次産業革命におけるコア技術になることは間違いないでしょう。

AIによる画像認識の仕組みを理解し必要なデータを考える

画像認識においては、ディープラーニングという手法で対象を判別しますが、多くの場合「分類」と呼ばれる解析を行います。

例えば、画像に映っている被写体が犬と猫のどちらであるかを判別するとしましょう。
そのとき、AIを育てるための学習データとして、犬もしくは猫が映っている画像を1万枚用意します。
すべての画像に対して、その画像に映っているのが犬である確率と猫である確率をAIに予想させます。
用意した画像に映っているのが犬の場合、正解は犬が100%で猫が0%になるので、AIの予想と正解との誤差を計算し、AIの計算パラメータを変えます。
この行程を何百万回と繰り返せば、AIが犬に共通する特徴と、猫に共通する特徴を発見できるという仕組みです。

当然ですが、判別できる特徴が画像に映っていない場合は、AIであっても発見できません。
例えば、犬や猫の毛だけが映っている画像を学習させても、判別は難しいでしょう。
正確に言えば、AIであれば、毛だけでも犬と猫を判別してしまう可能性はあります。
しかし、犬や猫の全身が映っている画像よりは難易度は上がると思います。
このことは、AIに判定させる画像をどのように撮影するのかが、AIの性能に大きく影響することを示しています。

目的と目的に合った撮影方法

 一般論で言えば、色や模様などで判別できそうなものについてはカラー画像で撮影した方が良いでしょう。
また、被写体の形で判別したい場合は、モノクロ画像で輪郭をエッジ化した方が判別しやすい可能性があります。
また、通常のカメラでは、昼夜によって写り方が変わるうえ、太陽の位置によっては被写体がきちんと写らない可能性もあります。
そういった場合は、赤外線カメラが良いかもしれません。

もちろん、カメラの種類だけでなく、カメラの性能も影響します。
非常に小さな特徴を捉える場合は、解像度の高いもので撮影する必要があります。

一方で、大きな特徴で判別できる場合は、解像度が高いとデータ容量が大きくなり、学習に時間がかかってしまいます。

つまり、AIによる画像認識といっても、どのように撮影した画像を用意すれば良いのかを考えて、いろいろ試しながら利用しないといけません。

結局、実際にAIに学習をさせる前に、どのようなデータを集めればよいのかの予備調査を行った方が、確実に成果を出しやすいということです。
そのことを認識せずに計画をたてると、なかなか精度が出ず困ってしまうかもしれません。

画像認識より音声認識がよい場合がある。

 画像認識は人間で言えば見た目から判定できるものに向いています。しかし、何でも画像認識が良いというわけではありません。例えば、音から判別できるものには音声認識が向いています。また、対象の形から判別したい時にはLiDARと呼ばれるセンサを使いレーザー光の反射によってセンシングする手法が向いています。

実際に世の中のAIを使った事例を見てみると、亀裂などを探す場合は、音センサ(アコースティックエミッション)を使う事例が多くあります。高速道路のトンネル検査には音センサを使っています。

また、道路の劣化判定においては、画像認識とレーザー検査を行っています。

今後、自動運転自動車などにおいては、カメラによる画像認識で進行方向にある人間や車、標識といったものを判別し、進むことができるかどうかを判断します。
とはいえ、やはりカメラは逆光においては判別に誤りが出る可能性があります。
安全性を考えれば、LiDARも併用して使うことになるでしょう。

一方で、LiDARのレーザー光は水分で減衰しやすく、雨や霧に弱いという特徴があります。
カメラ映像も霧などには弱いですが、霧のような状態でも判別可能になるようなAIの研究は進んでいます。

画像・音・レーザー等のどれがより良い結果を導くのかは、実際にやってみないとわかりません。
また、どれか一つではなく、複数を組み合わせることで、判別の精度を大きく上げることができるかもしれません。

そのポイントを押さえつつ、どのような方法でAIに学習させるデータを集めるかを試行錯誤しないとAIの活用は難しいということを認識した方がよいでしょう。

IT Insightの他記事もご覧ください

Prev

Next