メインコンテンツに移動

ガウス分布のミックスでGenAIを打ち負かすことが可能

合成データはAIモデルの専売特許。新しい論文は、古い手法がまだ有効であることを示しています。

合成市場データの生成は、生成的敵対ネットワーク(GAN)やオートエンコーダなどの洗練された人工知能モデルの最も有望なアプリケーションの1つとして広く見られています。

コンサルタント会社m|rigの定量的手法のディレクターであるJörg Kienitz氏の新しい論文は、これらの新しいモデルが旧来の方法を打ち負かすにはまだいくつかの方法があることを示唆しています。

キエニッツ氏の論文によると、ガウス混合モデル(GMM)は約半世紀にわたって複雑な金融分布のフィッティングに使われてきた機械学習手法で、最新のAIモデルよりもイールドカーブやボラティリティサーフェスの生成に適しています。

GMMは、ガウス分布の混合を用いて、ほぼすべての連続確率分布を捉えることができます。そのプロセスは緩やかです。モデルはまず、確率分布の最も密度の高い部分を特定し、その形状を可能な限り忠実に捉えるガウス分布を割り当てます。その後、分布全体が望ましい精度でキャプチャされるまで、分布のテールやその他の部分を順次埋めていきます。

ガウシアンの組み合わせには、扱いやすく、よく理解されているオブジェクトを使用できるという利点があります。
マルコ・ビアンケッティ、インテサ・サンパオロ

「基礎となるモデルは、現実世界のテンソル時系列や確率微分方程式に基づくモデルデータなど、何らかの統計的メカニズムに由来するデータで学習されます:[この場合、説明可能な量を含むシミュレートされたデータです。

モデルのトレーニングは、期待値最大化などのよく知られた統計的手法に基づいており、ほぼ瞬時に行われます。

「一旦トレーニングが終われば、シミュレーションは非常に簡単です。

初期の結果は印象的でした。「ユーロSTR、SOFR、ソニアなどのオーバーナイトレートを考えましたが、これらを適切に捉えるには7つの分布の混合が必要でした。「株式ボラティリティのサーフェスでは、3~5つの分布で済みました。

Kienitz氏は、彼のGMMベースの手法の結果を、より複雑な手法と比較しました。GANは、4年間の日々の市場価格のデータセットで満足のいく結果を出すのに苦労しました。オートエンコーダはより良い結果を出し、それなりの結果を出しましたが、GMMがトップになりました。

「ガウシアン混合モデルは常に本当に優れていました。「オートエンコーダやGANは補助変数を追加するだけで、真の条件分布を使用しないのに対し、ガウス混合モデルは多次元設定にも適合し、真の条件分布を使用できるため、モデリングやシミュレーションで依存性を考慮することができます。

Kienitz氏がデータセットを1年分の日次データだけに減らしたところ、GANモデルもオートエンコーダーモデルも、分布の顕著な特徴を捉えることができませんでしたが、GMMは引き続き捉えることができました。

IntesaSanpaolo社の市場リスクとカウンターパーティーリスクの内部モデルアプローチ手法の責任者であるMarco Bianchetti氏は、Kienitz氏のアプローチには、より複雑な手法よりも重要な利点があると述べています。

「ガウシアンの組み合わせは、より複雑な機械学習アルゴリズムのように、あらゆる分布を近似することができます。「しかし、それらの複雑なアルゴリズムとは異なり、扱いやすく、よく理解されている対象を使用するという利点があり、また、モデルパラメータの数を減らし、オーバーフィッティングの可能性のある問題を減らすことができます。

これにより、GANやオートエンコーダよりも説明しやすいモデルになります。「ネットワーク・ベースの手法は、その仕事の進め方が不透明なことが多いのです」とBianchetti氏。「この方法はそうではありません。この関数はガウシアンの混合物であり、そのパラメーターには明確な財務的解釈があります。これはモデルの検証にも明確な利点があります」。

Kienitz氏はその評価に同意します。「解釈は主成分分析に似ています。「しかし、この場合、ガウス主成分として確率論的に解釈され、重みは成分の重要性を示す固有ベクトルに相当します。

使用例として、Bianchettiは、Kienitzが説明した方法は、リスク測定を計算する際に、不完全または疎なデータセットを修正するために使用することができると述べています。「特に、FRTB(Fundamental Review of the Trading Book)においては、流動性の低いリスク要因を扱うためのツールを提供できるため、重要な貢献となるでしょう。

さらなる研究

キーニッツ氏は他の応用も模索しています。例えば、より安定させるためにアイロンをかけるなどです。

「既知の方法は最適輸送解に基づいています。GMM分布のクラスから離れることなく)あるGMMを別のGMMに非常に効率的に最適に輸送することが可能であるため、この手法のスピードと柔軟性を向上させる素晴らしい結果が期待できます」とKienitz氏。

Kienitz氏は、GMMがGANやオートエンコーダよりも常に望ましいとは限らないと強調します。GMMは日次の価格データではうまく機能しますが、大きなデータセットでは苦労します。例えば、膨大なティックデータにGMMを当てはめることは、ガウシアンが多すぎて実行不可能であり、扱いやすさが失われる可能性があります。

今のところ、キエニッツの研究は、金融の最先端で問題を解決することに関しては、伝統的なモデリング技術はまだ十分な足を持っていることを示しています。

「誰もがディープラーニングに熱中しているように見えますが、ガウス混合法のような伝統的なアルゴリズムを使い果たすのではなく、ディープラーニングを試してみる必要があるのです」と、生成モデルの専門家で研究会社Artificial Intelligence Finance Instituteの創設者であるMiquel Noguer i Alonso氏は言います。

おそらくKienitzの論文は、より多くのクオンツに、古いモデルをもう一度試してみる気にさせるでしょう」。

コンテンツを印刷またはコピーできるのは、有料の購読契約を結んでいるユーザー、または法人購読契約の一員であるユーザーのみです。

これらのオプションやその他の購読特典を利用するには、info@risk.net にお問い合わせいただくか、こちらの購読オプションをご覧ください: http://subscriptions.risk.net/subscribe

現在、このコンテンツをコピーすることはできません。詳しくはinfo@risk.netまでお問い合わせください。

Most read articles loading...

You need to sign in to use this feature. If you don’t have a Risk.net account, please register for a trial.

ログイン
You are currently on corporate access.

To use this feature you will need an individual account. If you have one already please sign in.

Sign in.

Alternatively you can request an individual account here