論文の概要: Quantifying Outlierness of Funds from their Categories using Supervised
Similarity
- arxiv url: http://arxiv.org/abs/2308.06882v1
- Date: Mon, 14 Aug 2023 01:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 14:58:15.502716
- Title: Quantifying Outlierness of Funds from their Categories using Supervised
Similarity
- Title(参考訳): 監督された類似性を用いたカテゴリーからの資金流出率の定量化
- Authors: Dhruv Desai, Ashmita Dhiman, Tushar Sharma, Deepika Sharma, Dhagash
Mehta, Stefano Pasquali
- Abstract要約: 本研究の目的は、機械学習に基づくアプローチを用いて、資金の誤分類の効果を定量化することである。
距離メトリック学習のランダムフォレスト(RF)に基づく手法を実装し,各データポイントに対するいわゆるクラスワイド・アウトリー測度を計算し,データのアウトリーを同定する。
本研究は, ファンドの外部方策と将来のリターンとの間には強い関係があることを示し, その影響について考察する。
- 参考スコア(独自算出の注目度): 6.060757543617328
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mutual fund categorization has become a standard tool for the investment
management industry and is extensively used by allocators for portfolio
construction and manager selection, as well as by fund managers for peer
analysis and competitive positioning. As a result, a (unintended)
miscategorization or lack of precision can significantly impact allocation
decisions and investment fund managers. Here, we aim to quantify the effect of
miscategorization of funds utilizing a machine learning based approach. We
formulate the problem of miscategorization of funds as a distance-based outlier
detection problem, where the outliers are the data-points that are far from the
rest of the data-points in the given feature space. We implement and employ a
Random Forest (RF) based method of distance metric learning, and compute the
so-called class-wise outlier measures for each data-point to identify outliers
in the data. We test our implementation on various publicly available data
sets, and then apply it to mutual fund data. We show that there is a strong
relationship between the outlier measures of the funds and their future returns
and discuss the implications of our findings.
- Abstract(参考訳): 相互ファンドの分類は、投資管理産業の標準ツールとなり、ポートフォリオ構築とマネジャー選択のアロケータや、ピア分析と競争力のあるポジションのためのファンドマネージャによって広く利用されている。
その結果、(意図しない)誤分類や精度の欠如は、配分決定や投資ファンドマネジャーに大きな影響を及ぼす可能性がある。
本稿では,機械学習に基づくアプローチを用いて,資金の誤分類の効果を定量化する。
我々は, 資金の誤分類問題を距離に基づく外れ値検出問題として定式化し, 外れ値が与えられた特徴空間内の他のデータポイントから遠く離れたデータポイントであることを示す。
距離メトリック学習のランダムフォレスト(RF)に基づく手法を実装し,各データポイントに対するいわゆるクラスワイド・アウトリー測度を計算し,データのアウトリーを同定する。
我々は、さまざまな公開データセット上で実装をテストし、それを相互資金データに適用する。
本研究は, ファンドの外部方策と将来のリターンとの間には強い関係があることを示し, その影響について考察する。
関連論文リスト
- Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - IT-RUDA: Information Theory Assisted Robust Unsupervised Domain
Adaptation [7.225445443960775]
トレイン(ソース)とテスト(ターゲット)データセット間の分散シフトは、マシンラーニングアプリケーションで発生する一般的な問題である。
UDA技術はラベル豊富なソースドメインからラベルのないターゲットドメインへの知識伝達を行う。
ソースまたはターゲットデータセットのいずれかに存在するアウトリーチは、実際にUDAを使用する場合、さらなる課題をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-10-24T04:33:52Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Cost-Based Budget Active Learning for Deep Learning [0.9732863739456035]
予算に制約のある集団における分類の不確実性やインスタンスの多様性を考慮したコストベースのバグデットアクティブラーニング(CBAL)を提案する。
min-maxに基づく原則的アプローチは、選択されたインスタンスのラベル付けと決定コストを最小化すると考えられる。
論文 参考訳(メタデータ) (2020-12-09T17:42:44Z) - Domain Adaptative Causality Encoder [52.779274858332656]
我々は,適応因果同定と局所化の課題に対処するために,依存木の特徴と敵対学習を活用する。
我々は、テキストにあらゆる種類の因果関係を統合する新しい因果関係データセット、MedCausを提案する。
論文 参考訳(メタデータ) (2020-11-27T04:14:55Z) - Dirichlet policies for reinforced factor portfolios [1.3706331473063877]
本稿では、要素投資と強化学習(RL)を組み合わせることを目的とする。
エージェントは、企業の特性に依存する逐次ランダムアロケーションを通じて学習する。
パラメトリックな選択肢の幅広い範囲において、我々の結果は、RLベースのポートフォリオが均等に重み付けられた(1/N)アロケーションに非常に近いことを示している。
論文 参考訳(メタデータ) (2020-11-10T20:25:41Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Deep Adversarial Domain Adaptation Based on Multi-layer Joint Kernelized
Distance [30.452492118887182]
ドメイン適応とは、ソースデータから学習したモデルを対象データに適用する学習シナリオを指す。
ソースデータとターゲットデータとの分布差は、適応性能に大きく影響する。
多層共役核距離測定値に基づく深層対向領域適応モデルを提案する。
論文 参考訳(メタデータ) (2020-10-09T02:32:48Z) - Learning Calibrated Uncertainties for Domain Shift: A Distributionally
Robust Learning Approach [150.8920602230832]
ドメインシフトの下で校正された不確実性を学習するためのフレームワークを提案する。
特に、密度比推定は、ターゲット(テスト)サンプルの近さをソース(トレーニング)分布に反映する。
提案手法は下流タスクに有利な校正不確実性を生成する。
論文 参考訳(メタデータ) (2020-10-08T02:10:54Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Machine Learning Fund Categorizations [2.7930955543692817]
我々は、機械学習を用いて学習可能であり、ほとんど再現可能であることを、業界全体でよく認識された分類システムを確立する。
我々は,この人造システム学習における知的課題とその意義について論じる。
論文 参考訳(メタデータ) (2020-05-29T23:26:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。