論文の概要: Quantifying Outlierness of Funds from their Categories using Supervised
Similarity
- arxiv url: http://arxiv.org/abs/2308.06882v1
- Date: Mon, 14 Aug 2023 01:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 14:58:15.502716
- Title: Quantifying Outlierness of Funds from their Categories using Supervised
Similarity
- Title(参考訳): 監督された類似性を用いたカテゴリーからの資金流出率の定量化
- Authors: Dhruv Desai, Ashmita Dhiman, Tushar Sharma, Deepika Sharma, Dhagash
Mehta, Stefano Pasquali
- Abstract要約: 本研究の目的は、機械学習に基づくアプローチを用いて、資金の誤分類の効果を定量化することである。
距離メトリック学習のランダムフォレスト(RF)に基づく手法を実装し,各データポイントに対するいわゆるクラスワイド・アウトリー測度を計算し,データのアウトリーを同定する。
本研究は, ファンドの外部方策と将来のリターンとの間には強い関係があることを示し, その影響について考察する。
- 参考スコア(独自算出の注目度): 6.060757543617328
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mutual fund categorization has become a standard tool for the investment
management industry and is extensively used by allocators for portfolio
construction and manager selection, as well as by fund managers for peer
analysis and competitive positioning. As a result, a (unintended)
miscategorization or lack of precision can significantly impact allocation
decisions and investment fund managers. Here, we aim to quantify the effect of
miscategorization of funds utilizing a machine learning based approach. We
formulate the problem of miscategorization of funds as a distance-based outlier
detection problem, where the outliers are the data-points that are far from the
rest of the data-points in the given feature space. We implement and employ a
Random Forest (RF) based method of distance metric learning, and compute the
so-called class-wise outlier measures for each data-point to identify outliers
in the data. We test our implementation on various publicly available data
sets, and then apply it to mutual fund data. We show that there is a strong
relationship between the outlier measures of the funds and their future returns
and discuss the implications of our findings.
- Abstract(参考訳): 相互ファンドの分類は、投資管理産業の標準ツールとなり、ポートフォリオ構築とマネジャー選択のアロケータや、ピア分析と競争力のあるポジションのためのファンドマネージャによって広く利用されている。
その結果、(意図しない)誤分類や精度の欠如は、配分決定や投資ファンドマネジャーに大きな影響を及ぼす可能性がある。
本稿では,機械学習に基づくアプローチを用いて,資金の誤分類の効果を定量化する。
我々は, 資金の誤分類問題を距離に基づく外れ値検出問題として定式化し, 外れ値が与えられた特徴空間内の他のデータポイントから遠く離れたデータポイントであることを示す。
距離メトリック学習のランダムフォレスト(RF)に基づく手法を実装し,各データポイントに対するいわゆるクラスワイド・アウトリー測度を計算し,データのアウトリーを同定する。
我々は、さまざまな公開データセット上で実装をテストし、それを相互資金データに適用する。
本研究は, ファンドの外部方策と将来のリターンとの間には強い関係があることを示し, その影響について考察する。
関連論文リスト
- The Mismeasure of Man and Models: Evaluating Allocational Harms in Large Language Models [22.75594773147521]
大規模言語モデル(LLM)におけるバイアスから生じる潜在的アロケーション障害を評価するモデル非依存バイアス指標であるランクアロケーションベースバイアス指標(RABBI)を導入する。
その結果, 平均性能差と分布距離に基づく偏差測定では, 割り当て結果の集団差を確実に把握できないことがわかった。
私たちの研究は、限られたリソース制約のあるコンテキストでモデルがどのように使用されるかを説明する必要性を強調しています。
論文 参考訳(メタデータ) (2024-08-02T14:13:06Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Data-Driven Knowledge Transfer in Batch $Q^*$ Learning [5.6665432569907646]
バッチ定常環境に集中して動的意思決定における知識伝達について検討する。
本稿では,一般関数近似を用いたTransferred Fitted $Q$-Iterationアルゴリズムのフレームワークを提案する。
Q*$関数の最終学習誤差は、単一のタスクレートから大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-04-01T02:20:09Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - IT-RUDA: Information Theory Assisted Robust Unsupervised Domain
Adaptation [7.225445443960775]
トレイン(ソース)とテスト(ターゲット)データセット間の分散シフトは、マシンラーニングアプリケーションで発生する一般的な問題である。
UDA技術はラベル豊富なソースドメインからラベルのないターゲットドメインへの知識伝達を行う。
ソースまたはターゲットデータセットのいずれかに存在するアウトリーチは、実際にUDAを使用する場合、さらなる課題をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-10-24T04:33:52Z) - Domain Adaptative Causality Encoder [52.779274858332656]
我々は,適応因果同定と局所化の課題に対処するために,依存木の特徴と敵対学習を活用する。
我々は、テキストにあらゆる種類の因果関係を統合する新しい因果関係データセット、MedCausを提案する。
論文 参考訳(メタデータ) (2020-11-27T04:14:55Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Deep Adversarial Domain Adaptation Based on Multi-layer Joint Kernelized
Distance [30.452492118887182]
ドメイン適応とは、ソースデータから学習したモデルを対象データに適用する学習シナリオを指す。
ソースデータとターゲットデータとの分布差は、適応性能に大きく影響する。
多層共役核距離測定値に基づく深層対向領域適応モデルを提案する。
論文 参考訳(メタデータ) (2020-10-09T02:32:48Z) - Learning Calibrated Uncertainties for Domain Shift: A Distributionally
Robust Learning Approach [150.8920602230832]
ドメインシフトの下で校正された不確実性を学習するためのフレームワークを提案する。
特に、密度比推定は、ターゲット(テスト)サンプルの近さをソース(トレーニング)分布に反映する。
提案手法は下流タスクに有利な校正不確実性を生成する。
論文 参考訳(メタデータ) (2020-10-08T02:10:54Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Machine Learning Fund Categorizations [2.7930955543692817]
我々は、機械学習を用いて学習可能であり、ほとんど再現可能であることを、業界全体でよく認識された分類システムを確立する。
我々は,この人造システム学習における知的課題とその意義について論じる。
論文 参考訳(メタデータ) (2020-05-29T23:26:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。