平成30年1月26日
国立研究開発法人日本原子力研究開発機構

自ら学習し複雑な現象の本質を抽出可能にするモンテカルロ法の開発
-機械学習による量子シミュレーションの高速化-

【発表のポイント】

国立研究開発法人日本原子力研究開発機構(理事長 児玉敏雄、以下「原子力機構」という。)システム計算科学センターの永井佑紀研究員は、マサチューセッツ工科大学Liang Fu博士との共同研究により、固体中の電子集団の振る舞いを計算する量子シミュレーションに対して、機械学習によってそこに潜むパターンを見つける1)モンテカルロ法(自己学習モンテカルロ法)の開発に成功し、計算量が膨大となる量子シミュレーションの劇的な高速化を達成しました。

物質を構成する原子は原子核と電子から構成されており、物質の性質の多くは電子集団の振る舞いの違いによって説明されます。これらの電子集団の振る舞いを正確に知るためには、電子集団の量子力学的性質を考慮する量子シミュレーションが必要となります。しかし、量子シミュレーションの多くは計算量が膨大であるため、計算が実質的に不可能となるケースが多く、物質の性質の理解に対する大きな障壁となっていました。例えば、電気抵抗がゼロになる超伝導状態においては、電子はペアを組んで運動することが知られていますが、液体窒素温度以上の高温で超伝導になる銅酸化物高温超伝導体に対しては、その電子集団の挙動を再現する量子シミュレーションの計算量は、膨大で実質的に計算不可能となることから、その超伝導発現のメカニズムは現代物理学の大きな謎の一つとなっています。このような複雑な現象を理解するために、固体物理学では、余分な複雑さをそぎ落とし、現象を再現できる最低限の“2)有効モデル”を作って解析することが行われてきました。その際、どのように本質のみを抽出するかという点においては、科学者の高度な分析力が求められ、現象を理解するための問題の抽出が必須となります。

本研究では、近年、情報科学の分野において盛んに研究が進められている”機械学習”に着目し、その技術を上記のような固体中の電子集団の性質を研究する量子シミュレーションの分野に適用しました。その際、注目する現象をより計算量の少ないモデルで再現する“有効モデル”を構築するといった科学者が行う高度な作業を、機械学習によって代替するという大胆な発想の下、モンテカルロ法を用いる量子シミュレーションに対して、機械学習を適用することで、従来の量子シミュレーション(オリジナルモデル)とほぼ同等の計算を、極めて少ない計算量でシミュレーション可能とする“有効モデル”の導出に成功し、計算の劇的な高速化(ある量子シミュレーションでは約1万倍の高速化)を達成しました。物理学では求めたい量の統計平均が重要であり、その統計平均を算出可能な有効モデルをいかに構築するかが現象を理解するための課題でした。今回、機械学習により導出した有効モデルは、シミュレーションの過程を学習することで、オリジナルモデルの統計平均を再現し、かつより簡単なモデルあることから、シミュレーションを大幅に高速化することが可能です。なお、固体中電子の量子モンテカルロ法に限らず、モンテカルロ法が用いられる問題では、本研究にて開発した機械学習法を用いることで高速化が可能になります。本研究成果によって、高温超伝導体や重元素化合物等、電子集団の複雑な挙動が鍵となる物質の量子シミュレーションの高速化が達成され、それらの物性の機構解明に繋がることが期待されます。

本研究成果は、2017年10月3日付で、米国物理学会誌「Physical Review B」の「Rapid Communication」セクションのオンライン版に掲載され、Physical Review B編集者が選ぶ注目論文”Editors’ Suggestion”に選ばれました。

【研究の背景】

物質の性質の多くは、その物質に含まれる電子集団の振る舞いの違いによって説明されます。特に、銅酸化物高温超伝導体やウラン等を含む重元素化合物などの物質は、電子同士が強く相互作用する3)強相関電子系と呼ばれており、これらの物質での電子集団の挙動の理解は現代物理学における重要な問題の一つとして位置づけられています。これまで、科学者は複雑な現象からその本質だけを抽出するモデルを作って解析することで電子集団の振る舞いの理解を進めてきました。例えば、電気抵抗がゼロになるという劇的な現象である超伝導現象は、格子振動を介して電子同士に引力が働くため、2つの電子がペアを作り、そのペアの集団が動くモデルを通して説明することができます。しかし、液体窒素温度以上で超伝導状態となる銅酸化物高温超伝導体の電子の振る舞いは、発見から30年以上経った現在においても、その本質がはっきりとわかっていません。つまり、現象の本質を抽出し、現象を説明するモデルの導出方法が分かっていないと言えます。そこで、上記のような強相関電子系を理解するため、複雑な物事から本質の抽出を行わずに、複雑なモデルを直接シミュレーションする計算手法が発展してきました。しかし、多数の電子集団の4)量子力学的性質を考慮するシミュレーション(量子シミュレーション)は、計算量が非常に大きくなるため、強相関電子系の電子集団の詳細な挙動を理解することは、現在の最新のスーパーコンピュータを用いたとしても困難です。これは、強相関電子系のモデルをシミュレーションする際、その必要な5)自由度が原子や電子を1つ増やす毎に指数関数的に増大することに起因します。この計算量の爆発的な増大を避け、充分に電子集団の振る舞いをシミュレーションにより明らかにするためには、抜本的な計算手法の研究開発が必須でした。

【研究の内容・成果】

本研究では、近年計算科学分野で急速に発展している”機械学習”に着目しました。機械学習とは、膨大な学習データからコンピュータが自ら学習することで最適な問題解決の方法を見出す手法です。最近では、機械学習によって学習した囲碁プログラムがプロ囲碁棋士にハンディキャップなしで勝利する等、非常に注目を集めています。その一方、科学の分野では、複雑な現象を理解するため、複雑な現象からその本質だけを抽出する方法がよく用いられていますが、問題によってはどのように本質を抽出すれば良いかわからず、その方法は個々の科学者達のセンスに依存していました。そこで、本研究では、複雑な現象からその本質だけを抽出するという科学者が行ってきた高度な作業に対して機械学習を適用することにしました。その結果、固体中の電子集団の挙動を解析する高精度な量子シミュレーション手法である量子モンテカルロ法において、その本質だけを抽出した有効モデルを機械学習の1つの手法である自己学習にて導き出し、高速にシミュレーションする手法(自己学習モンテカルロ法)を開発することに成功しました。

図1に概要を説明します。一般にモンテカルロ・シミュレーションにおいては、対象としているモデル(オリジナルモデル)が作る6)マルコフ連鎖と呼ばれる確率過程を用いて物理量を計算します。まず初めに、トライアルシミュレーションとしてマルコフ連鎖を実行し、そのステップ毎の情報を学習データとして蓄えていきます。そして、得られた膨大な学習データを用いて、オリジナルモデルと殆ど同じマルコフ連鎖となる計算量の小さい”有効モデル“を機械学習によって構築します。開発したシミュレーションでは、途中に機械学習で得られた”有効モデル“によるシミュレーションを挟むことによって、高速化を達成することができました。図2で見られるように、オリジナルモデルの確率分布と機械学習によって得られた”有効モデル“の確率分布はほとんど一致します。

図1 オリジナルモデルに対しトライアルシミュレーションを行い、学習データを集めたあと、機械学習によって”有効モデル”を構築します。オリジナルモデルに対し計算負荷の軽い”有効モデル”による計算をシミュレーションの途中に挟み込むことで、劇的な高速化を達成することができます。

図2 左:オリジナルモデルを使ったシミュレーションでのモンテカルロ重みの分布関数。右:機械学習で得られた“有効モデル”を使った場合の分布関数。両者は非常によく一致していることがわかります。

【今後の展開、及び波及効果】

今回、高速化を達成することができた量子モンテカルロ法に限らず、モンテカルロ法が用いられる問題では、本研究にて開発した機械学習法を用いることで高速化が可能になります。本研究成果によって、現実の物質の性質を反映させた複雑なモデルを取り扱い、現象を再現し且つ新たな結果を予測できる量子シミュレーションが可能となり、高温超伝導等が持つ多彩な物性の解明に繋がることが期待されます。

書籍情報

雑誌名:Physical Review B, Rapid communication

タイトル:Self-learning Monte Carlo method: Continuous-time algorithm

著者:Yuki Nagai1,2, Huitao Shen2, Yang Qi2, Junwei Liu2, and Liang Fu2

所属:1日本原子力研究開発機構、2マサチューセッツ工科大学

【用語説明】

1) モンテカルロ法

モンテカルロ法とは、シミュレーション及び数値計算において用いられる手法の1つであり、計算対象に従い、乱数を用いて統計サンプリングを行って計算結果を取得する手法の総称である。様々な体系に適用可能であり、シミュレーションの分野において必須の手法の1つである。計算結果は、統計平均を取るため、一般にサンプリング回数を増やすと精度が向上するが、一回のサンプリングに時間がかかる場合、十分な回数を取ることが実質的に不可能となる場合があり、効率的な手法改良が求められ、様々な研究開発が行われている。

2) 有効モデル

対象とする体系が複雑でモデルが複雑な場合や、モデルが単純でも計算量が膨大となり計算困難となる場合において、オリジナルモデルが持つ本質的性質を失わないように簡単化したモデルのこと。

3) 強相関電子系

強いクーロン相互作用を持つ電子が支配的な系。電子は、負の電荷を帯びており、電子同士はお互いに反発する。通常、固体中には、多数の電子や原子が存在するため、実効的な反発力は抑えられているが、銅酸化物高温超伝導体や重元素化合物等のある種の物質では実効的に強く作用することが知られている。この働きによって、超伝導状態、磁性状態、電荷密度波状態など様々な状態が生じると考えられている。

4) 量子力学

電子をはじめとする様々な素粒子(物質のもととなる粒子)は、粒子の性質と波の性質の両方を持つ量子と呼ばれるものであり、この量子の状態を記述する力学的体系を指す。原子スケールの非常に小さいスケールを考える場合には、量子力学を考慮した理論を考える必要がある。

5) 自由度

ある物理系の状態を記述するのに必要な変数の最小個数。力学では3次元の空間を運動する質点の自由度は 3で,その位置は3つの座標変数 x,y,z で表わされる。一方、固体中の電子は、その量子力学的性質から、座標変数の関数である波動関数により状態が記述され、固体中にて拡がった分布を示す。一般に量子力学的な自由度は、系のエネルギーを表す行列を対角化することで得られる基底関数の数により与えられ、その自由度は高く、電子の集団になると膨大な数となる。

6) マルコフ連鎖

未来の挙動が現在の状態のみで決定され、それまでの挙動とは無関係である確率過程。固体中電子集団の振る舞いを計算する量子シミュレーションでは、求める確率分布を均衡分布として持つマルコフ連鎖を作成することで、確率分布のサンプリングを行い、高精度に物理量を計算することができる。

参考部門・拠点: システム計算科学センター

戻る