Fake data can help backtesters, up to a point
Synthetic data made with machine learning will struggle to capture the caprice of financial markets
Quant investors often complain they have only a single version of history against which to test their ideas.
One way to get round the problem has been to make history up. Quants have done that for a long time already – using bootstrapping or Monte Carlo simulations to create alternative time series data for the backtests they run.
A new idea, though, is to employ machine learning techniques to invent wholly artificial data. Quants are experimenting with these models and say they can produce data indistinguishable in some cases from the real thing.
The potential of the new ‘fake’ data gives cause for optimism. With it, quants can test strategies against scenarios that might have happened as well as those that did. There’s a caveat, though. Fake data may fix some of the shortcomings of conventional backtesting, but it can’t fix all of them.
The models the quants are using to generate the new data effectively learn the process by which past data was generated.
That’s worked impressively outside investing, where the models have been used to create anything from deep fake videos to so-called Ganimals – synthesised animals, like an elephant crossed with a cat – conjured up using generative adversarial networks (Gans).
Amazon used synthetic data to train its Alexa bot to understand instructions in Hindi. Rather than train the voice recognition software with millions of real commands, the tech firm generated fake samples from data on just a subset of recordings.
But applications in financial markets face a key difference from applications in other such fields. Markets are fast-changing systems, subject at times to sudden, unexpected regime shifts.
Backtesting with multiple versions of history may be better than backtesting with one. But the generative models still are recreating a version of events learnt from the past. And even a richer view of history could be a poor guide to the future.
One quant draws a parallel with forecasting climate change, a process in which what’s gone before – by definition – will be largely redundant. And in the case of equity markets, “even the most intimate knowledge of history isn’t going to tell you where Apple’s stock price is going to be,” he says.
In another way, too, historical data could prove a bad teacher.
The mechanics of the market are hugely complex, including the actions and motivations of thousands of investors, companies and intermediaries and the complex dynamics of market microstructure. That’s before accounting for the influence of the global macro environment, news events, and so on.
It’s never guaranteed the data will lead a model to a full understanding of those mechanics. That’s to say, the training set may provide only a patchy representation of the truth. “You could end up generating fake data that’s just too simplistic for what’s at stake,” says another quant. “It could be counterproductive.”
These are limitations the data-generation models have not faced outside finance. They also are limitations that apply to any form of backtesting, be it conventional or using fake data. But as investors proceed with the new techniques, they will need to keep sight of the problems that fake data cannot solve. A picture of an elephant or a cat looks like a picture of an elephant or a cat for ever. A picture of a market is always changing.
コンテンツを印刷またはコピーできるのは、有料の購読契約を結んでいるユーザー、または法人購読契約の一員であるユーザーのみです。
これらのオプションやその他の購読特典を利用するには、info@risk.net にお問い合わせいただくか、こちらの購読オプションをご覧ください: http://subscriptions.risk.net/subscribe
現在、このコンテンツを印刷することはできません。詳しくはinfo@risk.netまでお問い合わせください。
現在、このコンテンツをコピーすることはできません。詳しくはinfo@risk.netまでお問い合わせください。
Copyright インフォプロ・デジタル・リミテッド.無断複写・転載を禁じます。
当社の利用規約、https://www.infopro-digital.com/terms-and-conditions/subscriptions/(ポイント2.4)に記載されているように、印刷は1部のみです。
追加の権利を購入したい場合は、info@risk.netまで電子メールでご連絡ください。
Copyright インフォプロ・デジタル・リミテッド.無断複写・転載を禁じます。
このコンテンツは、当社の記事ツールを使用して共有することができます。当社の利用規約、https://www.infopro-digital.com/terms-and-conditions/subscriptions/(第2.4項)に概説されているように、認定ユーザーは、個人的な使用のために資料のコピーを1部のみ作成することができます。また、2.5項の制限にも従わなければなりません。
追加権利の購入をご希望の場合は、info@risk.netまで電子メールでご連絡ください。
詳細はこちら 我々の見解
イランをめぐる混乱は、因果モデル化の必要性を裏付けている
Claudeを用いて構築された新しい予測モデルによると、原油価格は再び100ドルを上回る可能性があると示唆されています
クレジット市場の計算が合わない様子である
今日の投資家にとっては、「リスクの高い」債券を購入するほうが得策であるように思われます
イラン情勢により、外国為替取引は不可能になってしまったのだろうか
コストの高さや機会の短さにもかかわらず、FXオプションの取引高が急増しています
Can AI be the great equaliser in e-FX?
FX market-makers see real benefits for agentic AI in code generation and data analysis
モデル・リスク・マネージャーの孤独
取締役会は、それらをイノベーションの足かせと見なすかもしれません。リスク管理部門は、効率性を重視していることを示す必要があります
複雑なボラティリティ曲面へのスムーズフィット
Quantは、オプティマイザーを用いたインプライド・ボラティリティの新たな捕捉手法を示しています。
マレックスの急成長を支える「中毒性のある」働き方
スタッフの皆様には、何が効果的で何がそうでないかを把握するため、数多くの小さな実験を積極的に行っていただくようお勧めしております。
トランプ氏の最新の「真実」が伝統的金融業界を不安にさせる理由
ウォール街はトランプ氏のクリプト映画の中の悪役となりつつあります