AIやIoTの活用推進に伴い、データ品質向上やデータマネジメントに関する知識・アプローチ法へのニーズは高まっています。情報の整理・連携などで押さえておきたい手法として、「オントロジー」や「オントロジー工学」について見聞きしたことがある方もいらっしゃるのではないでしょうか。
人間の脳内にある概念やその関係性を扱うオントロジー。その意味や使い方、セマンティックWebとの関係などについて詳しくご紹介します。
オントロジーとは、概念を情報化し、体系的に明示するための仕様の一種です。
例えば「赤」という概念を例にとって考えてみましょう。赤といえば当然色の一種です。しかし、赤信号や赤字、サイレンなど、危険や注意すべきポイントを指すこともあります。また、東京タワー、りんご、ハンコなど「赤」に紐付く要素は無数に存在し、その構成は人それぞれで異なります。
このように、人間はモノやコトといった概念を複雑かつ可変に意味・要素を関連付けて頭に入れていると考えるのがオントロジーであり、情報科学の世界ではコンピュータなどの機械が情報を整理する方法を考案するにあたってオントロジーが応用されています。
さて、オントロジーがなぜものづくりの現場に役に立つのか?
そう疑問に思った方へ向けて、つづいては製造現場における「工程」という概念について考えてみましょう。
工程は、材料を加工し製造した製品を、検査を経て顧客へ届けるまでの一連の流れです。しかし、そのための作業自体を工程と表現する場合もあります。さらに、「検査工程の点検を行う」「梱包工程でインシデントが見つかった」といったように個々の装置や手法、作業区域などを指すケースもあるでしょう。
例えば在庫や装置、生産性といった言葉にも同様に多義性が存在し、業界や企業、ラインによってもオントロジーは異なります。そこで、データを連携させ、共通して使える品質にするために、マスタデータといった形でオントロジーを開発することが求められるのです。
オントロジーをより深く理解するため、より実践的な内容に進みましょう。
データの管理手法として現在最もポピュラーなRDB(関係データベース)では、データを列と行、また表同士の関係性で定義します。それに対し、オントロジーがフォーカスするのは「is-a」「part-of」「attribute-of」といった概念同士の関係性です。
さらに、「ロール」「ドメイン」「継承」「タスク」等で、柔軟に関係性を定義します。
実際のオントロジー開発では、ツールを用い、このような情報がナレッジグラフといった形で表現されます。オントロジー用のソフトウエアとしては法造、protégé、FluentEditorなどが存在し、ISO、IECやW3Cといった国際団体によるオントロジーの規格化も行われています。
オントロジーはセマンティックWebの技術としてもよく言及されます。セマンティックWebとは、semantic(意味の・意味論)を名に冠するとおり、Webにメタデータ(直接には表示されない情報についての情報)を追加することで、意味を基盤にした検索や処理を可能にするWebのあり方です。WebサイトやWebコンテンツの作成においてメタデータの付与は日常的に行われており、すでにセマンティックWebは実践されているといえます。
オントロジーには「ヘビー・ウェイト」と「ライト・ウェイト」が存在します。前者は人間が概念同士の関係性をできる限り正確に記述します。最も正攻法に思えるアプローチですが、その開発にかかる労力はドメインが広大なほど膨大になります。そこで、情報の不足や間違いはある程度許容しつつ、自動でメタデータを付与するライト・ウェイトオントロジーが登場しました。
このように、オントロジーの実践にあたっては対象となるドメインの規模や複雑性も問題となることを押さえておきましょう。
オントロジーの意味やメリット、使い方についてご紹介してまいりました。哲学で用いられていた用語であり、抽象的な概念を扱うため、とっつきにくく感じられるオントロジーですが、人間が情報をどのように整理しているのかを考えれば意外と理解しやすいはずです。
データ品質向上やデータマネジメントにあたってぜひその存在を思い出してください。