顧客や市場のニーズが変化しやすく、技術革新が加速度的に進む現代では、製品ライフサイクルの短縮が大きな課題となっています。特にエンジニアリングチェーンにおける効率化の余地はまだまだ残されており、DXによる改善が期待されています。そんな中、注目を集めるのが「サロゲートモデル」です。
本記事では、サロゲートモデルのメリットやデメリット、CAE・CFDとの関係性について基本をご紹介します。
サロゲートモデルとは、機械学習を用いてCAE(Computer Aided Engineering=計算機援用工学)やCFD(Computational Fluid Dynamics=計算流体力学)の数値シミュレーションを代替することで、計算の手間やコストを削減するための解析の手法です。サロゲート(surrogate:代理)という言葉の通り、サロゲートモデルは内容によって莫大な計算コストが必要になる物理モデルを代替する存在として活用されています。
サロゲートモデルは、CAEの入力・出力データを学習することで予測モデルを構築します。モデルが一度構築できれば、その後は入力データを与えれば高速で予測結果が導き出されます。CAEやCFDで都度計算する場合と比較して、その計算速度は100~1000倍にも達することがあると言われています。
一方、モデルの正確性は教師データの精度に左右されます。そのため、モデルの構築に対するデータサイエンティストやデータアナリストの知見は必要不可欠です。モデルの過学習(特定の教師データに特化したモデルを利用した結果、それ以外のデータに対する汎用性のないモデルが構築されてしまうこと)など機械学習で気を付けなくてはならない落とし穴は数多く、モデル構築・検証のフェーズで試行錯誤や手間が発生するケースは少なくありません。
サロゲートモデルは、データサイエンスに関する知見や、対象のシミュレーションがモデル化に適しているかどうかなど、事前に考慮した上で取り入れるべき手法であることは間違いないでしょう。ただし、サロゲートモデルとプロジェクトの相性が合致した場合の効果は大きく、またデータサイエンスの発展によりその適応できる範囲も広がってきています。
サロゲートモデルのメリットと、機械学習という要素が加わることで生じる注意点についてご紹介しました。機械学習モデルの開発にあたっては、どのようなパラメーターを設定するか、どう組み合わせるのかが重要であり、それらに絶対的な正解はありません。
構築したモデルは空間や物性、速度や温度、応力といったパラメーターを入力することで規定されるわけですが、ここで重要なのがシミュレーションを行う部品、製品を各入力値によっていかに、そしてどこまで規定するかということです。
例えば、部品によってサイズが異なる場合、それぞれどこまで扱うのかも含めて検討し、定義する必要があります。パラメーター数が増加すると複雑になりますが、対応できるモデルの範囲があまりに狭くては構築した意味がありません。
そのバランスを取るにあたっては、やはりデータサイエンスの知見・経験が必要不可欠といえるでしょう。そもそも、学習元となる教師データの品質が一定以上求められることは言うまでもありません。
近年は、パラメーターの組み合わせを探るにあたってAutoML(コンピュータによって自動化された機械学習)が活用されるのも一般的です。「モデルの構築→テスト→分析→パラメーターの調整」といったサイクルを繰り返し、モデルをブラッシュアップすることで、CAEの数値モデルにも負けない精度を得られる例も見られるようになってきました。
サロゲートモデルのメリットである計算時間の短縮や、消費電力の削減を達成するためには、応答曲面法や次元圧縮などの手法によりデータを最適化するプロセスが求められます。その結果得られるメリットは大きいものの、検証の段階においてどのような計算プロセスをたどったのか人間が理解しにくくなってしまうのはデメリットであるとも指摘されています。
サロゲートモデルのブラックボックス化対策としては、モデル構築にあたって決定木や線形回帰など解釈可能性の高いものを用いる、入力値と出力値の関係をチャートやグラフを用いて可視化する、仮想的なサンプルを用いる、といった手法が考えられます。
いずれにせよ、サロゲートモデルを導入するにあたって、単にモデルを構築するだけでなく、その解釈をいかに行うのかについて定めておくことは非常に重要です。
CAE×機械学習で実現される「サロゲートモデル」の概要やメリット、注意点についてご紹介してまいりました。「品質・コストの8割は設計で決まる」という言葉がある一方、CAE自体の普及はまだまだ発展途上にあります。日数・人手・コストが懸念となりCAEの導入を阻んでいる状況に、今後サロゲートモデルは大きな変化をもたらすかもしれません。