メインコンテンツに移動

クオンツは合成データに注意すべき - レハール

合成データは確実性の幻想を生み、ポートフォリオ構築を台無しにするリスクがあるとクオンツ氏

Data in steam rising from a cooking pot

機械学習モデルの訓練や戦略のバックテストに合成データを使用すること。

エコール・ポリテクニークの応用数学教授であるシャルル=アルベール・レハル氏は、パリ第1パンテオン・ソルボンヌ大学の研究者であるアディル・レンギム・セティンゴズ氏とともに、新しいワーキングペーパーで、合成データはモデルの不確実性を低減できないことを示しました。

多くの機械学習者は、多くのサンプルを合成すれば、そのサンプルを使って訓練されたモデルの信頼区間が短くなると間違って考えています。

100個のデータポイントがあれば、それらのデータポイントを好きなだけ再生できますが、信頼区間を狭くすることはできません」。シャルル=アルベール・レハール、理工科大学

「それは真実ではありません。より多くの合成標本を描いても、信頼区間がゼロになることはありません。「元の標本よりも多くの独立した標本を生成することはできません。

この論文では

コンテンツを印刷またはコピーできるのは、有料の購読契約を結んでいるユーザー、または法人購読契約の一員であるユーザーのみです。

これらのオプションやその他の購読特典を利用するには、info@risk.net にお問い合わせいただくか、こちらの購読オプションをご覧ください: http://subscriptions.risk.net/subscribe

現在、このコンテンツをコピーすることはできません。詳しくはinfo@risk.netまでお問い合わせください。

Sorry, our subscription options are not loading right now

Please try again later. Get in touch with our customer services team if this issue persists.

New to Risk.net? View our subscription options

無料メンバーシップの内容をお知りになりたいですか?ここをクリック

パスワードを表示
パスワードを非表示にする

Most read articles loading...

You need to sign in to use this feature. If you don’t have a Risk.net account, please register for a trial.

ログイン
You are currently on corporate access.

To use this feature you will need an individual account. If you have one already please sign in.

Sign in.

Alternatively you can request an individual account here