Fugu-MT 論文翻訳(概要): Discovering environments with XRM

論文の概要: Discovering environments with XRM

arxiv url: http://arxiv.org/abs/2309.16748v1
Date: Thu, 28 Sep 2023 17:55:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-02 16:59:59.068130
Title: Discovering environments with XRM
Title（参考訳）: XRMによる環境発見
Authors: Mohammad Pezeshki, Diane Bouchacourt, Mark Ibrahim, Nicolas Ballas, Pascal Vincent, David Lopez-Paz
Abstract要約: アプリケーション間の堅牢なAIシステムを実現するために,クロスリスク最小化(XRM)を提案する。 XRMは2つの双子のネットワークを訓練し、それぞれがトレーニングデータのランダムな半分から学習する。 XRMはオラクル最悪のグループ精度を達成し、分配外一般化における長年の問題を解決する。
参考スコア（独自算出の注目度）: 33.56835111352877
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Successful out-of-distribution generalization requires environment annotations. Unfortunately, these are resource-intensive to obtain, and their relevance to model performance is limited by the expectations and perceptual biases of human annotators. Therefore, to enable robust AI systems across applications, we must develop algorithms to automatically discover environments inducing broad generalization. Current proposals, which divide examples based on their training error, suffer from one fundamental problem. These methods add hyper-parameters and early-stopping criteria that are impossible to tune without a validation set with human-annotated environments, the very information subject to discovery. In this paper, we propose Cross-Risk-Minimization (XRM) to address this issue. XRM trains two twin networks, each learning from one random half of the training data, while imitating confident held-out mistakes made by its sibling. XRM provides a recipe for hyper-parameter tuning, does not require early-stopping, and can discover environments for all training and validation data. Domain generalization algorithms built on top of XRM environments achieve oracle worst-group-accuracy, solving a long-standing problem in out-of-distribution generalization.
Abstract（参考訳）: アウト・オブ・ディストリビューションの一般化には環境アノテーションが必要である。残念ながら、これらは入手に資源集約的であり、人間のアノテータの期待と知覚バイアスによって、モデル性能との関係が制限される。したがって、アプリケーション間で堅牢なAIシステムを実現するためには、幅広い一般化をもたらす環境を自動的に発見するアルゴリズムを開発する必要がある。トレーニングエラーに基づいてサンプルを分割する現在の提案は、ひとつの根本的な問題に悩まされている。これらの手法は、人間の注釈付き環境の検証セットなしではチューニングが不可能なハイパーパラメータとアーリーストッピング基準を付加する。本稿では,この問題に対処するクロスリスク最小化(XRM)を提案する。 xrmは、2つのツインネットワークを訓練し、それぞれがトレーニングデータの1つのランダムな半分から学習し、兄弟姉妹が犯した自信のある保留ミスを模倣する。 XRMはハイパーパラメータチューニングのレシピを提供し、早期停止を必要としない。 XRM環境上に構築された領域一般化アルゴリズムはオラクル最悪のグループ精度を実現する。

関連論文リスト

Universal Adaptive Environment Discovery [9.289361622607453]
環境をインスタンス化するデータ変換の分散を学習する統合フレームワークを提案する。 UAEDは、事前に定義されたグループや手動の環境設計なしに、IRM、REx、GroupDRO、Coralの適応的なバリエーションを出力する。以上の結果から,環境適応化はアウト・オブ・ディストリビューションの一般化への実践的経路であることが示唆された。
論文参考訳（メタデータ） (2025-10-14T14:10:16Z)
Rethinking Reward Models for Multi-Domain Test-Time Scaling [91.76069784586149]
従来の作業では、プロセス報酬モデル(PRM)が最終回答のみを評価する結果報酬モデル(ORM)を上回っていると仮定しています。 14の異なる領域にまたがる4つの報酬モデル変種を統一的に評価する。 LLMの自動ラベル付けからラベルノイズを継承し,長い推論軌跡の評価に難渋するPRM方式の段階的スコアリングが原因と考えられる。
論文参考訳（メタデータ） (2025-10-01T04:21:14Z)
Failing Forward: Improving Generative Error Correction for ASR with Synthetic Data and Retrieval Augmentation [73.9145653659403]
生成誤差補正モデルは、トレーニング中に発生する特定の種類のエラーを超えて一般化することが困難であることを示す。 DARAGは、ドメイン内(ID)およびOODシナリオにおけるASRのためのGCCを改善するために設計された新しいアプローチである。私たちのアプローチはシンプルでスケーラブルで、ドメインと言語に依存しません。
論文参考訳（メタデータ） (2024-10-17T04:00:29Z)
Trained Models Tell Us How to Make Them Robust to Spurious Correlation without Group Annotation [3.894771553698554]
経験的リスク最小化(ERM)モデルは、ターゲットと高い刺激的な相関を持つ属性に依存する傾向がある。これにより、これらの属性を欠いた未表現(または'マイナー')グループのパフォーマンスを低下させることができる。本稿では,環境に基づく検証と損失に基づくサンプリング(EVaLS)を提案する。
論文参考訳（メタデータ） (2024-10-07T08:17:44Z)
No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.08822154199948]
非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文参考訳（メタデータ） (2024-08-27T14:31:54Z)
PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文参考訳（メタデータ） (2024-06-04T13:51:08Z)
Scalable Decentralized Algorithms for Online Personalized Mean Estimation [12.002609934938224]
本研究は,各エージェントが実数値分布からサンプルを収集し,その平均値を推定する,オーバーアーキシング問題の簡易版に焦点を当てた。 1つは信念の伝播からインスピレーションを得ており、もう1つはコンセンサスに基づくアプローチを採用している。
論文参考訳（メタデータ） (2024-02-20T08:30:46Z)
ERM++: An Improved Baseline for Domain Generalization [69.80606575323691]
経験的リスク最小化(ERM)は、適切に調整された場合、最も複雑なドメイン一般化(DG)手法より優れている。 ERM++は以前のEMMベースラインと比較してDGのパフォーマンスを5%以上改善している。
論文参考訳（メタデータ） (2023-04-04T17:31:15Z)
Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文参考訳（メタデータ） (2022-04-13T12:43:12Z)
Provable Domain Generalization via Invariant-Feature Subspace Recovery [18.25619572103648]
本稿では,不変部分空間回復(ISR)を用いた領域一般化を提案する。トレーニングIRMとは異なり、アルゴリズムは非変分問題をバイパスし、グローバルコンバージェンスを楽しむ。さらに、実世界の3つの画像データセットにおいて、ISR-は単純で効果的な後処理法として利用できることを示す。
論文参考訳（メタデータ） (2022-01-30T21:22:47Z)
Iterative Feature Matching: Toward Provable Domain Generalization with Logarithmic Environments [55.24895403089543]
ドメインの一般化は、限られた数のトレーニング環境からのデータで、目に見えないテスト環境でうまく機能することを目的としています。我々は,O(logd_s)$環境のみを見た後に一般化する予測器を高確率で生成することを保証する反復的特徴マッチングに基づく新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-06-18T04:39:19Z)
Algorithmic Bias and Data Bias: Understanding the Relation between Distributionally Robust Optimization and Data Curation [1.370633147306388]
平均誤差の最小化に基づく機械学習システムは、データの注目すべきサブセット間で矛盾なく動作することが示されている。社会的、経済的な応用では、データが人を表す場合、差別が過小評価されている性別や民族集団につながる可能性がある。
論文参考訳（メタデータ） (2021-06-17T13:18:03Z)
Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文参考訳（メタデータ） (2020-10-02T10:41:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。