昨今のAIブームの中で、「基盤モデル」というキーワードが注目されています。日本でも企業や公的研究機関が基盤モデルの開発に注力し、AI開発力を高めている状況です。本記事では、基盤モデルとは何なのか、また、日本における開発状況について解説します。
AIにおける基盤モデルとは、「大量かつ多様なデータを用いて訓練され、多様なタスクに適応できるモデル」のことを指します。基盤モデルはすでに膨大なデータによって訓練されているので、これを活用することで、一から開発するよりもコストを抑えつつ、効率的にAIモデルを構築することが可能です。基盤モデルは、目的に応じてファインチューニング(微調整)されるなどして、多様なタスクを処理するために利用されています。
基盤モデルの代表例として有名なのが、OpenAI社が開発したLLM(大規模言語モデル)の「GPT」です。同社のChatGPTは「GPT-3」や「GPT-4」といったLLMを使用したサービスであり、ユーザーが入力したプロンプト(指示)をもとにテキストや画像の生成、音声認識といったさまざまなタスクを処理できます。ほかにも、Google社の「BERT」、Meta社の「Llama」、Anthropic社の「Claude」などが多様なタスクに適応できる代表的な基盤モデルとして認知されています。
上述したように、2024年現在で有名な基盤モデルはほとんどが海外製であり、英語のテキストデータなどを中心に訓練されています。そのため、今でも日本語での処理能力が低かったり、日本語でのプロンプトに対応していなかったりするのが実情です。実際に、AIを使った時に日本語の細かいニュアンスを読み取ってもらえず、アウトプットに違和感を覚えたことがある人も多いのではないでしょうか。また、基盤モデルに海外製が多いことのデメリットは、実用面での課題があることだけではありません。国内の機密情報が国際的に流出するといったセキュリティ面でのリスクや、日本のAI開発力の低下なども懸念されています。
このような背景から、昨今では国産の基盤モデルの開発が活発化しています。ただし、日本の企業や公的研究機関には海外のメガテック企業のように潤沢な資金がなく、自力での開発が困難なケースも多いです。そのため、基盤モデル開発に必要な計算資源の支援や関係者間の連携を促すプロジェクト「GENIAC」や、NEDOが実施する「ポスト5G情報通信システム基盤強化研究開発事業」などを通じて、日本政府が国産の生成AI基盤モデル開発を支援しています。
ここでは、日本で基盤モデルの開発に取り組んでいることを公表している企業とその状況についてご紹介します。
大手IT企業であるNECは、日本語LLM「cotomi」を開発しています。「cotomi」は日本語の知識量や文書読解力を計測するベンチマーク JGLUEで世界トップクラス(2023年時点/NEC調べ)の日本語能力を実現しており、すでにNECの社内では資料や議事録作成などの大幅な工数削減につながっているようです。また、「cotomi」は独自の技術によってパラメータ(変数)をコンパクトに抑えているにもかかわらず高い性能を発揮でき、標準的なGPUサーバで動作します。そのため、消費電力を抑えられるだけでなく、軽量かつ高速な運用が可能な点が特長です。NECは「cotomi」を皮切りにLLMを活用した事業展開を進めており、顧客の業務課題の解決に貢献しているといえます。
メディア事業やインターネット広告事業などを展開するサイバーエージェントも日本語LLMを開発しています。同社は2017年からAIクリエイティブの部署を立ち上げ、AIを活用した広告クリエイティブの制作に取り組んでいました。その後、LLMの自社開発が加速し、2023年に68億パラメータの日本語LLMの公開、2024年7月に225億パラメータの日本語LLMの公開に至っています。このLLMの特徴は商用利用可能なライセンスで一般公開されていることであり、実際の利用者が活用方法を発信するなどして高い評価を得ているといえます。サイバーエージェントは自社だけでなく多くの企業や研究機関、国と連携しながらAI開発力の向上を目指しています。
AI技術に強みを持つスタートアップ企業のプリファードネットワークスの子会社のPreferred Elementsは、2024年2月に1000億パラメータのマルチモーダル基盤モデルの開発を開始すると公表し、2024年10月にGENIAC第1サイクルの開発成果として 大規模言語モデル PLaMo-100B-Pretrained を公開しました。同社はさらに、世界的にも大規模な1兆パラメータの言語モデルの開発に向けた事前学習の検証も開始しています。マルチモーダルはテキスト・音声・画像・映像・センサーなどのさまざまな種類のデータを扱って統合的に処理するAIであり、より複雑なタスクに適応できるものです。プリファードネットワークスは上述した「GENIAC」において基盤モデル開発に必要な計算資源の支援を受けており、成果物として1000 億パラメータモデルのウェイトやファインチューニング用コード、学習課題やノウハウをGENIAC のコミュニティなどを通じて公開する予定としています。
AIの基盤モデル開発において、残念ながら日本は大きく遅れています。しかし、今後本格的なAI社会が到来するのに向けて、着々と国産基盤モデルの開発が進められている状況です。AIを業務に活用したいと考えている企業の方などは、国産基盤モデルの開発に関するニュースなどに注目してみてはいかがでしょうか。