論文の概要: ROIDS: Robust Outlier-Aware Informed Down-Sampling
- arxiv url: http://arxiv.org/abs/2601.19477v1
- Date: Tue, 27 Jan 2026 11:07:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 13:48:54.623192
- Title: ROIDS: Robust Outlier-Aware Informed Down-Sampling
- Title(参考訳): ROIDS:ロバストなアウトリーア対応ダウンサンプリング
- Authors: Alina Geiger, Martin Briesch, Dominik Sobania, Franz Rothlauf,
- Abstract要約: Informed Down-Sampling (Robust Outlier-Aware Informed Down-Sampling) を導入した。
ROIDSは, 合成問題において, より複雑な実世界の問題だけでなく, 付加的なアウトレーヤを伴って, 常にIDSよりも優れた性能を示すことを示す。
- 参考スコア(独自算出の注目度): 1.8549313085249322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Informed down-sampling (IDS) is known to improve performance in symbolic regression when combined with various selection strategies, especially tournament selection. However, recent work found that IDS's gains are not consistent across all problems. Our analysis reveals that IDS performance is worse for problems containing outliers. IDS systematically favors including outliers in subsets which pushes GP towards finding solutions that overfit to outliers. To address this, we introduce ROIDS (Robust Outlier-Aware Informed Down-Sampling), which excludes potential outliers from the sampling process of IDS. With ROIDS it is possible to keep the advantages of IDS without overfitting to outliers and to compete on a wide range of benchmark problems. This is also reflected in our experiments in which ROIDS shows the desired behavior on all studied benchmark problems. ROIDS consistently outperforms IDS on synthetic problems with added outliers as well as on a wide range of complex real-world problems, surpassing IDS on over 80% of the real-world benchmark problems. Moreover, compared to all studied baseline approaches, ROIDS achieves the best average rank across all tested benchmark problems. This robust behavior makes ROIDS a reliable down-sampling method for selection in symbolic regression, especially when outliers may be included in the data set.
- Abstract(参考訳): Informed down-sampling (IDS) は、様々な選択戦略、特にトーナメント選択と組み合わせることで、シンボリックレグレッションのパフォーマンスを向上させることが知られている。
しかし、最近の研究により、IDSの利益はすべての問題で一致していないことが判明した。
解析の結果, 異常値を含む問題ではIDS性能が悪くなることが明らかとなった。
IDS は、GP をoutlier に過度に適合するソリューションを見つけるために、サブセットにoutlier を含めることを体系的に推奨している。
これを解決するために、IDSのサンプリングプロセスから潜在的外れ値を排除するROIDS(Robust Outlier-Aware Informed Down-Sampling)を導入する。
ROIDSでは、外れ値に過度に適合することなくIDSの利点を保ち、幅広いベンチマーク問題に競合することが可能になる。
これは、ROIDSが検討されたすべてのベンチマーク問題に対して望ましい振る舞いを示す実験にも反映される。
ROIDSは、既存のベンチマーク問題のうち80%以上でIDSを上回っている。
さらに、すべてのベースラインアプローチと比較して、ROIDSはテストされたすべてのベンチマーク問題で最高の平均ランクを達成している。
このロバストな振る舞いは、ROIDSをシンボリック回帰の選択のための信頼性の高いダウンサンプリング手法にします。
関連論文リスト
- Confident or Seek Stronger: Exploring Uncertainty-Based On-device LLM Routing From Benchmarking to Generalization [61.02719787737867]
大規模言語モデル(LLM)はますますエッジデバイスにデプロイされ、民主化されている。
1つの有望な解決策は不確実性に基づくSLMルーティングであり、SLM上での低信頼応答が発生すると、高い要求を強いLCMにオフロードする。
我々は1500以上の設定でSLMからLLMへの不確実性駆動型ルーティング戦略のベンチマークと一般化を包括的に調査する。
論文 参考訳(メタデータ) (2025-02-06T18:59:11Z) - Robust Offline Imitation Learning from Diverse Auxiliary Data [33.14745744587572]
オフラインの模倣学習は、専門家による一連のデモンストレーションからのみポリシーを学ぶことができる。
最近の研究には、専門家データとともに多数の補助的なデモンストレーションが組み込まれている。
逆補助データ(ROIDA)からのロバストオフライン模倣を提案する。
論文 参考訳(メタデータ) (2024-10-04T17:30:54Z) - Ward: Provable RAG Dataset Inference via LLM Watermarks [6.112273651406279]
RAGにより、LCMは外部データを容易に組み込むことができ、コンテンツの不正使用に関するデータ所有者の懸念が高まる。
我々はこの問題を(ブラックボックス)RAGデータセット推論(RAG-DI)として定式化する。
次に,RAG-DI手法の現実的なベンチマークのための新しいデータセットを,ベースラインのセットとともに導入する。
我々は,RAGコーパスにおけるデータセットの誤用に関する厳密な統計的保証をデータ所有者に提供するLLM透かしに基づくRAG-DI手法であるWardを提案する。
論文 参考訳(メタデータ) (2024-10-04T15:54:49Z) - Distributionally and Adversarially Robust Logistic Regression via Intersecting Wasserstein Balls [8.720733751119994]
提案手法は,提案手法が標準データセットのベンチマーク手法よりも優れていることを示す。
前者からインスピレーションを得て、ロジスティック回帰のためにAROのワッサーシュタイン DR について検討し、トラクタブル凸最適化の修正が認められることを示す。
論文 参考訳(メタデータ) (2024-07-18T15:59:37Z) - A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。
軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。
本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文 参考訳(メタデータ) (2024-06-25T07:45:00Z) - Contrastive Multiple Instance Learning for Weakly Supervised Person ReID [50.04900262181093]
本稿では、より効果的に教師付きされたReIDに適した新しいフレームワークであるContrastive Multiple Instance Learning (CMIL)を紹介する。
CMILは、対照的な損失を生かしながら、単一のモデルと擬似ラベルを必要とせず、自分自身を区別する。
PerformancePhoto.coの実際のアプリケーションから自然に発生する弱いラベルを特徴とするMUDDデータセットの拡張であるWL-MUDDデータセットをリリースする。
論文 参考訳(メタデータ) (2024-02-12T14:48:31Z) - Survival Analysis with Adversarial Regularization [3.9686445409447617]
生存分析(Survival Analysis、SA)は、医学、防衛学、金融学、航空宇宙学などの分野で応用されるイベントが起こるまでの時間をモデル化する。
最近の研究は、ニューラルネットワーク(NN)がSAの複雑なデータパターンを効果的にキャプチャできることを示唆している。
我々は、NN検証の進歩を活用して、堅牢で完全なパラメトリックSAモデルのためのトレーニング目標を開発する。
論文 参考訳(メタデータ) (2023-12-26T12:18:31Z) - Algorithmic Bias and Data Bias: Understanding the Relation between
Distributionally Robust Optimization and Data Curation [1.370633147306388]
平均誤差の最小化に基づく機械学習システムは、データの注目すべきサブセット間で矛盾なく動作することが示されている。
社会的、経済的な応用では、データが人を表す場合、差別が過小評価されている性別や民族集団につながる可能性がある。
論文 参考訳(メタデータ) (2021-06-17T13:18:03Z) - DORO: Distributional and Outlier Robust Optimization [98.44757325531631]
本稿では,分散ロバスト最適化のためのDOROのフレームワークを提案する。
このアプローチのコアとなるのは、DROがオーバーフィットして潜在的な外れ値に収まらないような、洗練されたリスク関数である。
提案手法の有効性を理論的に証明し, DOROがDROの性能と安定性を向上することを示す。
論文 参考訳(メタデータ) (2021-06-11T02:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。