論文の概要: ROIDS: Robust Outlier-Aware Informed Down-Sampling
- arxiv url: http://arxiv.org/abs/2601.19477v1
- Date: Tue, 27 Jan 2026 11:07:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 13:48:54.623192
- Title: ROIDS: Robust Outlier-Aware Informed Down-Sampling
- Title(参考訳): ROIDS:ロバストなアウトリーア対応ダウンサンプリング
- Authors: Alina Geiger, Martin Briesch, Dominik Sobania, Franz Rothlauf,
- Abstract要約: Informed Down-Sampling (Robust Outlier-Aware Informed Down-Sampling) を導入した。
ROIDSは, 合成問題において, より複雑な実世界の問題だけでなく, 付加的なアウトレーヤを伴って, 常にIDSよりも優れた性能を示すことを示す。
- 参考スコア(独自算出の注目度): 1.8549313085249322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Informed down-sampling (IDS) is known to improve performance in symbolic regression when combined with various selection strategies, especially tournament selection. However, recent work found that IDS's gains are not consistent across all problems. Our analysis reveals that IDS performance is worse for problems containing outliers. IDS systematically favors including outliers in subsets which pushes GP towards finding solutions that overfit to outliers. To address this, we introduce ROIDS (Robust Outlier-Aware Informed Down-Sampling), which excludes potential outliers from the sampling process of IDS. With ROIDS it is possible to keep the advantages of IDS without overfitting to outliers and to compete on a wide range of benchmark problems. This is also reflected in our experiments in which ROIDS shows the desired behavior on all studied benchmark problems. ROIDS consistently outperforms IDS on synthetic problems with added outliers as well as on a wide range of complex real-world problems, surpassing IDS on over 80% of the real-world benchmark problems. Moreover, compared to all studied baseline approaches, ROIDS achieves the best average rank across all tested benchmark problems. This robust behavior makes ROIDS a reliable down-sampling method for selection in symbolic regression, especially when outliers may be included in the data set.
- Abstract(参考訳): Informed down-sampling (IDS) は、様々な選択戦略、特にトーナメント選択と組み合わせることで、シンボリックレグレッションのパフォーマンスを向上させることが知られている。
しかし、最近の研究により、IDSの利益はすべての問題で一致していないことが判明した。
解析の結果, 異常値を含む問題ではIDS性能が悪くなることが明らかとなった。
IDS は、GP をoutlier に過度に適合するソリューションを見つけるために、サブセットにoutlier を含めることを体系的に推奨している。
これを解決するために、IDSのサンプリングプロセスから潜在的外れ値を排除するROIDS(Robust Outlier-Aware Informed Down-Sampling)を導入する。
ROIDSでは、外れ値に過度に適合することなくIDSの利点を保ち、幅広いベンチマーク問題に競合することが可能になる。
これは、ROIDSが検討されたすべてのベンチマーク問題に対して望ましい振る舞いを示す実験にも反映される。
ROIDSは、既存のベンチマーク問題のうち80%以上でIDSを上回っている。
さらに、すべてのベースラインアプローチと比較して、ROIDSはテストされたすべてのベンチマーク問題で最高の平均ランクを達成している。
このロバストな振る舞いは、ROIDSをシンボリック回帰の選択のための信頼性の高いダウンサンプリング手法にします。
関連論文リスト
- CausalCompass: Evaluating the Robustness of Time-Series Causal Discovery in Misspecified Scenarios [17.11442807888366]
Causalは、時系列因果発見法の堅牢性を評価するために設計されたベンチマークスイートである。
我々は8つの仮定違反シナリオにまたがる代表的なTSCDアルゴリズムの広範なベンチマークを行う。
様々なシナリオで優れた全体的なパフォーマンスを示す方法は、ほとんどディープラーニングベースのアプローチである。
論文 参考訳(メタデータ) (2026-02-08T11:27:06Z) - Investigating the Robustness of Retrieval-Augmented Generation at the Query Level [4.3028340012580975]
推論中に外部知識を動的に組み込むソリューションとして、検索拡張生成(RAG)が提案されている。
その約束にもかかわらず、RAGシステムは実際的な課題に直面し、特に、正確な検索のために入力クエリの品質に強く依存する。
論文 参考訳(メタデータ) (2025-07-09T15:39:17Z) - Towards Robust Universal Information Extraction: Benchmark, Evaluation, and Solution [66.11004226578771]
既存の堅牢なベンチマークデータセットには2つの重要な制限がある。
単一の情報抽出(IE)タスクに対して、限られた範囲の摂動しか生成しない。
LLM(Large Language Models)の強力な生成機能を考慮すると、ruIE-Benchと呼ばれるRobust UIEのための新しいベンチマークデータセットを導入する。
データのうち、 textbf15% しかトレーニングしない場合、3つの IE タスクに対して、平均 textbf7.5% の相対的なパフォーマンス改善につながることを示す。
論文 参考訳(メタデータ) (2025-03-05T05:39:29Z) - Confident or Seek Stronger: Exploring Uncertainty-Based On-device LLM Routing From Benchmarking to Generalization [61.02719787737867]
大規模言語モデル(LLM)はますますエッジデバイスにデプロイされ、民主化されている。
1つの有望な解決策は不確実性に基づくSLMルーティングであり、SLM上での低信頼応答が発生すると、高い要求を強いLCMにオフロードする。
我々は1500以上の設定でSLMからLLMへの不確実性駆動型ルーティング戦略のベンチマークと一般化を包括的に調査する。
論文 参考訳(メタデータ) (2025-02-06T18:59:11Z) - Robust Offline Imitation Learning from Diverse Auxiliary Data [33.14745744587572]
オフラインの模倣学習は、専門家による一連のデモンストレーションからのみポリシーを学ぶことができる。
最近の研究には、専門家データとともに多数の補助的なデモンストレーションが組み込まれている。
逆補助データ(ROIDA)からのロバストオフライン模倣を提案する。
論文 参考訳(メタデータ) (2024-10-04T17:30:54Z) - Ward: Provable RAG Dataset Inference via LLM Watermarks [6.112273651406279]
RAGにより、LCMは外部データを容易に組み込むことができ、コンテンツの不正使用に関するデータ所有者の懸念が高まる。
我々はこの問題を(ブラックボックス)RAGデータセット推論(RAG-DI)として定式化する。
次に,RAG-DI手法の現実的なベンチマークのための新しいデータセットを,ベースラインのセットとともに導入する。
我々は,RAGコーパスにおけるデータセットの誤用に関する厳密な統計的保証をデータ所有者に提供するLLM透かしに基づくRAG-DI手法であるWardを提案する。
論文 参考訳(メタデータ) (2024-10-04T15:54:49Z) - Distributionally and Adversarially Robust Logistic Regression via Intersecting Wasserstein Balls [8.720733751119994]
提案手法は,提案手法が標準データセットのベンチマーク手法よりも優れていることを示す。
前者からインスピレーションを得て、ロジスティック回帰のためにAROのワッサーシュタイン DR について検討し、トラクタブル凸最適化の修正が認められることを示す。
論文 参考訳(メタデータ) (2024-07-18T15:59:37Z) - A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。
軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。
本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文 参考訳(メタデータ) (2024-06-25T07:45:00Z) - Contrastive Multiple Instance Learning for Weakly Supervised Person ReID [50.04900262181093]
本稿では、より効果的に教師付きされたReIDに適した新しいフレームワークであるContrastive Multiple Instance Learning (CMIL)を紹介する。
CMILは、対照的な損失を生かしながら、単一のモデルと擬似ラベルを必要とせず、自分自身を区別する。
PerformancePhoto.coの実際のアプリケーションから自然に発生する弱いラベルを特徴とするMUDDデータセットの拡張であるWL-MUDDデータセットをリリースする。
論文 参考訳(メタデータ) (2024-02-12T14:48:31Z) - Survival Analysis with Adversarial Regularization [3.9686445409447617]
生存分析(Survival Analysis、SA)は、医学、防衛学、金融学、航空宇宙学などの分野で応用されるイベントが起こるまでの時間をモデル化する。
最近の研究は、ニューラルネットワーク(NN)がSAの複雑なデータパターンを効果的にキャプチャできることを示唆している。
我々は、NN検証の進歩を活用して、堅牢で完全なパラメトリックSAモデルのためのトレーニング目標を開発する。
論文 参考訳(メタデータ) (2023-12-26T12:18:31Z) - FEDIC: Federated Learning on Non-IID and Long-Tailed Data via Calibrated
Distillation [54.2658887073461]
非IIDデータの処理は、フェデレーション学習における最も難しい問題の1つである。
本稿では, フェデレート学習における非IIDデータとロングテールデータの結合問題について検討し, フェデレート・アンサンブル蒸留と不均衡(FEDIC)という対応ソリューションを提案する。
FEDICはモデルアンサンブルを使用して、非IIDデータでトレーニングされたモデルの多様性を活用する。
論文 参考訳(メタデータ) (2022-04-30T06:17:36Z) - Algorithmic Bias and Data Bias: Understanding the Relation between
Distributionally Robust Optimization and Data Curation [1.370633147306388]
平均誤差の最小化に基づく機械学習システムは、データの注目すべきサブセット間で矛盾なく動作することが示されている。
社会的、経済的な応用では、データが人を表す場合、差別が過小評価されている性別や民族集団につながる可能性がある。
論文 参考訳(メタデータ) (2021-06-17T13:18:03Z) - DORO: Distributional and Outlier Robust Optimization [98.44757325531631]
本稿では,分散ロバスト最適化のためのDOROのフレームワークを提案する。
このアプローチのコアとなるのは、DROがオーバーフィットして潜在的な外れ値に収まらないような、洗練されたリスク関数である。
提案手法の有効性を理論的に証明し, DOROがDROの性能と安定性を向上することを示す。
論文 参考訳(メタデータ) (2021-06-11T02:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。