バックテスト戦略 - サンプリングと戻り値の型

私はRの戦略をテストして戻っています。テストの設計についていくつか質問があります。私は約500株の宇宙を持っており、流動性に基づいてフィルターをかけて試験しています。トレーディング戦略をテストするために、私は単純なサンプル内/サンプル外のテスト計画を実装しました。私は株式全体の完全なテストを実行する前に、株式の無作為なサンプルを使ってテストを実行していましたが、一般的なテストフレームワークを設計していました。

私は宇宙を2つの部分に分けていました。私は、訓練セットの最適化されたパラメータを使って、異なるストックのランダムサンプルを最適化し、テストセットからの異なるストックのランダム選択をテストしました。宇宙全体をテストするのではなく、これを行うことに何か問題はありますか?

私の他の質問は、価格vs返品(vsログ返品)を使うことです。私は信号を見つけるために価格ではなくリターンを使用する理由についてちょっと混乱しています。返品シリーズをより簡単に比較することができるので、返品シリーズを使用しますか?

2

1 答え

ランダムサンプリングにはいくつかの明確な利点があると思います。まず第一に、戦略のパラメータを特定の資産のサンプルに最適化することで、「あまりにもふさぎすぎる」というリスクを軽減します。第二に、このような大規模な資産宇宙では、有意義な長さの履歴データに対する戦略をテストするためには、明らかに時間と計算リソースが膨大なものになるため、長い歴史的な時間枠を使ってテストすることは避けてください。

つまり、あなたの目的が、500個の資産の戦略を具体的に取引することであれば、無作為に抽出された資産のサンプルを最適化するだけで何かを失うかもしれません。ランダムサンプルの大きさ、パラメータ空間の大きさなどについて、ここではいくつかの批判的思考があります。したがって、答えの少なくとも一部はあなたの最終目標に依存します。

価格対シグナルの使用に関しては、返品を使用するIMHOは実際には危険です 。どうして?あなたが取引するとき、取引は所定の価格で行われ、所与の収益は行われません(少なくとも会計に関する限り)。心に留めておく価値のあるもう一つのことは、リターンは以下に依存しているということです。

(a) What kind of return (simple, geometric, log, etc.)

(b) When the calculation starts (1-year return, 1-day return, etc.)

戦略が収益の計算に左右されない限り、代わりに価格データの使用を希望します。 (大量のデータセットを使用した場合、計算効率が懸念されるように見えるので、信号を得るためにリターンを計算する必要がないため、計算量がわずかしか必要ないという利点もあります)。

0
追加された