論文の概要: A Survey on Evaluation of Out-of-Distribution Generalization
- arxiv url: http://arxiv.org/abs/2403.01874v1
- Date: Mon, 4 Mar 2024 09:30:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 19:14:35.040556
- Title: A Survey on Evaluation of Out-of-Distribution Generalization
- Title(参考訳): アウト・オブ・ディストリビューション・ジェネリゼーションの評価に関する調査
- Authors: Han Yu, Jiashuo Liu, Xingxuan Zhang, Jiayun Wu, Peng Cui
- Abstract要約: アウト・オブ・ディストリビューション(OOD)の一般化は複雑で基本的な問題である。
本報告は,OOD評価の総合的な評価を行うための最初の試みである。
我々は,OOD性能試験,OOD性能予測,OOD固有の特性評価という3つのパラダイムに分類した。
- 参考スコア(独自算出の注目度): 41.39827887375374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models, while progressively advanced, rely heavily on the
IID assumption, which is often unfulfilled in practice due to inevitable
distribution shifts. This renders them susceptible and untrustworthy for
deployment in risk-sensitive applications. Such a significant problem has
consequently spawned various branches of works dedicated to developing
algorithms capable of Out-of-Distribution (OOD) generalization. Despite these
efforts, much less attention has been paid to the evaluation of OOD
generalization, which is also a complex and fundamental problem. Its goal is
not only to assess whether a model's OOD generalization capability is strong or
not, but also to evaluate where a model generalizes well or poorly. This
entails characterizing the types of distribution shifts that a model can
effectively address, and identifying the safe and risky input regions given a
model. This paper serves as the first effort to conduct a comprehensive review
of OOD evaluation. We categorize existing research into three paradigms: OOD
performance testing, OOD performance prediction, and OOD intrinsic property
characterization, according to the availability of test data. Additionally, we
briefly discuss OOD evaluation in the context of pretrained models. In closing,
we propose several promising directions for future research in OOD evaluation.
- Abstract(参考訳): 機械学習モデルは、漸進的に進歩しているが、必然的な分散シフトのため、実際には満足できないことが多いiid仮定に大きく依存している。
これにより、リスクに敏感なアプリケーションへのデプロイに対して、感受性と信頼性が低下する。
このような重大な問題は、アウト・オブ・ディストリビューション(OOD)の一般化が可能なアルゴリズムを開発するための様々な分野の成果を生み出している。
これらの努力にもかかわらず、ood一般化の評価にはあまり注意が払われておらず、これは複雑で根本的な問題でもある。
その目標は、モデルのOOD一般化能力が強いかどうかを評価することだけでなく、モデルを適切に一般化するかどうかを評価することである。
これは、モデルが効果的に対処できる分散シフトのタイプを特徴づけ、モデルに与えられた安全でリスクの高い入力領域を特定します。
本報告は,OOD評価の総合的な評価を行うための最初の試みである。
本研究は,OOD性能評価,OOD性能予測,OOD固有の特性評価という3つのパラダイムに分類する。
さらに,事前学習モデルの文脈におけるOOD評価について概説する。
閉会にあたっては,OOD評価における今後の研究に向けて,いくつかの有望な方向性を提案する。
関連論文リスト
- The Best of Both Worlds: On the Dilemma of Out-of-distribution Detection [75.65876949930258]
アウト・オブ・ディストリビューション(OOD)検出はモデル信頼性に不可欠である。
我々は,OODの一般化能力を秘かに犠牲にすることで,最先端手法のOOD検出性能が向上することを示す。
論文 参考訳(メタデータ) (2024-10-12T07:02:04Z) - Out-of-Distribution Learning with Human Feedback [26.398598663165636]
本稿では,人的フィードバックによるOOD学習のための新しい枠組みを提案する。
当社のフレームワークは、無償で利用可能な未ラベルデータに便乗しています。
人間のフィードバックを利用して、機械学習モデルの堅牢性と信頼性を高める。
論文 参考訳(メタデータ) (2024-08-14T18:49:27Z) - Rethinking Out-of-distribution (OOD) Detection: Masked Image Modeling is
All You Need [52.88953913542445]
簡単な再構築手法を用いることで,OOD検出の性能が大幅に向上する可能性が示唆された。
我々は、OOD検出フレームワーク(MOOD)のプリテキストタスクとして、マスケ画像モデリング(Masked Image Modeling)を採用する。
論文 参考訳(メタデータ) (2023-02-06T08:24:41Z) - Towards Realistic Out-of-Distribution Detection: A Novel Evaluation
Framework for Improving Generalization in OOD Detection [14.541761912174799]
本稿では,OOD(Out-of-Distribution)検出のための新しい評価フレームワークを提案する。
より現実的な設定で機械学習モデルのパフォーマンスを評価することを目的としている。
論文 参考訳(メタデータ) (2022-11-20T07:30:15Z) - Pseudo-OOD training for robust language models [78.15712542481859]
OOD検出は、あらゆる産業規模のアプリケーションに対する信頼性の高い機械学習モデルの鍵となるコンポーネントである。
In-distribution(IND)データを用いて擬似OODサンプルを生成するPOORE-POORE-POSthoc pseudo-Ood Regularizationを提案する。
我々は3つの現実世界の対話システムに関する枠組みを広く評価し、OOD検出における新たな最先端技術を実現した。
論文 参考訳(メタデータ) (2022-10-17T14:32:02Z) - Understanding and Testing Generalization of Deep Networks on
Out-of-Distribution Data [30.471871571256198]
ディープネットワークモデルは、In-Distributionデータでは優れた性能を発揮するが、Out-Of-Distributionデータでは著しく失敗する可能性がある。
本研究は,実験的なIDテストの問題を分析し,OODテストパラダイムを設計することを目的とする。
論文 参考訳(メタデータ) (2021-11-17T15:29:07Z) - Improved OOD Generalization via Adversarial Training and Pre-training [49.08683910076778]
本稿では,入力摂動に頑健なモデルがOODデータによく一般化されることを理論的に示す。
従来, 対人訓練が入力難聴の改善に有効であったことが示唆され, 対人訓練モデルがOODデータに過剰なリスクを集中していることが示唆された。
論文 参考訳(メタデータ) (2021-05-24T08:06:35Z) - ATOM: Robustifying Out-of-distribution Detection Using Outlier Mining [51.19164318924997]
インフォメーション・アウトリエ・マイニングによるアドリアトレーニングは、OOD検出の堅牢性を向上させる。
ATOMは,古典的,敵対的なOOD評価タスクの幅広いファミリーの下で,最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-06-26T20:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。