ホームITAI開発で力を発揮する「アノテーション」とは?

IT Insight

AI開発で力を発揮する「アノテーション」とは?

レンテックインサイト編集部

FA(ファクトリーオートメーション)の実現や、人手不足の解消、生産性の向上などに向けて、AIの活用に注目が集まっているのはご存じのとおりです。しかし、『令和3年通信利用動向調査』(総務省)によると、令和3年時点でIoT・AI等のシステム・サービスを「導入している」と回答した企業の割合は14.9%です。
なぜここまで導入が進まないのか、それは「導入後の効果・活用イメージがうまく描けない」という実情がその背景にあるのではないでしょうか。
そこで本記事で取り上げたいのが、「アノテーション」という言葉です。主にAIの開発・運用フェーズで耳にすることの多いこの用語の理解を通して、AI活用の扉を開きましょう。

「アノテーション」は“教師データを作成するための「注釈・注記」”

アノテーション(annotation)とは直訳で「注釈・注記」を意味する英単語であり、AI開発においては、テキスト、画像、音声、動画といったデータに注釈として情報を付加することで、教師データを作成することを意味します。教師データとは、AIが画像の認識やデータの計測、数値の分析・予測などを行う際にお手本とする「例題と正解」のデータを指します。

例えば、動画に人間が映った場合に四角形のバウンディングボックスで囲む物体検出を行わせたい場合には、映った人間を囲んだ教師データを事前に作成する、といった形でアノテーションは行われます。アノテーションを含むデータのタグ付け・分類作業をデータラベリングといい、AIの開発の約8割の時間がデータラベリングに費やされると言われることもあります。

それだけ時間や手間をかけてもアノテーションが行われるのは、教師データの品質がAIの精度に直結するからです。昨今は正解データなしにAI自身がデータからパターンを見出す教師なし学習や強化学習にも注目が集まっていますが、まず確実な結果を出したい場合には、利用用途を明確にし、精度の高い教師あり学習や半教師あり学習によるAI開発を行うのが基本でしょう。

アノテーションの具体的な手法と気を付けたいポイント

ここからは具体的なアノテーションの手法に踏み込んでまいりましょう。
といっても、実際のアノテーション自体は一定のルールに従ってデータに注釈を付与していく単純作業であり、それ自体はそれほど難しいものではありません。FastLabel、ANNOFAB、labelImg、ELAN、Automanなどアノテーション用に開発された有料・無料のツールが、これ以外にもさまざまにリリースされています。

実際のアノテーションにおいて問題となるのが、手間と集中力を必要とする膨大な作業をどのようにこなすかということです。とても一人でこなせる作業ではありませんが、人数が増えればアノテーションの対象や方法にゆらぎが生まれ、結果として品質が低下してしまう原因となるため、精度の高いガイドライン策定や複数回のチェックによる品質の担保が欠かせません。

そこで、まるごとアノテーションを外注できるサービスも昨今は多く提供されています。とはいえ、ここでも目的を達成できるようアノテーションサービスの担当者に過不足なく要件を伝え、適切なコミュニケーションを取り続けることが不可欠です。

また、昨今ではCVATといった自動アノテーションツールが公開される、脳波を利用したアノテーション技術の研究が発表されるなど、アノテーションの自動化・効率化の開発も進められています。

アノテーションによるAI開発の好事例と「MLOps」

アノテーションの効果と限界を具体的なイメージとして描く上で役立つ好事例が、宮城県の「令和元年度先進的AI・IoT活用ビジネス創出実証事業業務」を通じて報告されています。

『AIを用いた画像処理技術で製造現場における目視検査を省人化』と題した報告書では、2000~4000個/日の検査で、30~50個/日の不良が発生する自動車向け製品の検査工程におけるAI導入実験の結果とそこから見出された課題がまとめられています。

検査中のライブ撮影によって5日間、計145万枚の画像(製品数:2.2万個、内不良数:213個)が収集され、良品10ワーク分(388枚)、不良品32ワーク分(223枚)に対し、不良個所ごとにアノテーションを行った教師データが作成されました。それらを利用した教師あり学習により、少ない画像枚数で精度の高い判定が実現されたとのこと。同時に行われた教師なし学習では誤判定が多く精度の低さがあらわになったということで、教師あり学習のメリットが伝わります。
ただし、同実験の教師あり学習において過検出や学習対象外の異常への対応不可という問題は発生しており、「現時点で作業者とAIソフト検査の即入れ替えは困難である」という結論も述べられていました。

AIは一度開発すれば終わりではなく、運用を通じた継続的な学習が不可欠です。そのため、現在はAI/機械学習(ML:Machine Learning)と運用(Ops:Operations)という言葉をかけ合わせたMLOpsという概念も広まりつつあります。


参考:AIを用いた画像処理技術で製造現場における目視検査を省人化┃宮城県

アノテーションはAI開発における重要項目の一つ

アノテーションはAI開発における重要項目の一つであり、高い精度が実現できればAI導入の成果も得やすくなります。手間がかかり、地味な工程だからこそ、丁寧に基準を設け完成イメージを開発者全員と共有することに取り組みましょう。

IT Insightの他記事もご覧ください

Prev

Next