論文の概要: BREEDS: Benchmarks for Subpopulation Shift
- arxiv url: http://arxiv.org/abs/2008.04859v1
- Date: Tue, 11 Aug 2020 17:04:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 10:36:15.302001
- Title: BREEDS: Benchmarks for Subpopulation Shift
- Title(参考訳): BREEDS: サブ人口シフトのベンチマーク
- Authors: Shibani Santurkar, Dimitris Tsipras, Aleksander Madry
- Abstract要約: 本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
- 参考スコア(独自算出の注目度): 98.90314444545204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a methodology for assessing the robustness of models to
subpopulation shift---specifically, their ability to generalize to novel data
subpopulations that were not observed during training. Our approach leverages
the class structure underlying existing datasets to control the data
subpopulations that comprise the training and test distributions. This enables
us to synthesize realistic distribution shifts whose sources can be precisely
controlled and characterized, within existing large-scale datasets. Applying
this methodology to the ImageNet dataset, we create a suite of subpopulation
shift benchmarks of varying granularity. We then validate that the
corresponding shifts are tractable by obtaining human baselines for them.
Finally, we utilize these benchmarks to measure the sensitivity of standard
model architectures as well as the effectiveness of off-the-shelf train-time
robustness interventions. Code and data available at
https://github.com/MadryLab/BREEDS-Benchmarks .
- Abstract(参考訳): 本研究では,学習中に観察されなかった新しいデータサブポピュレーションに一般化できるモデルの有効性を評価する手法を開発した。
我々のアプローチは、既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分布を構成するデータサブポピュレーションを制御する。
これにより、既存の大規模データセット内で、正確な制御と特徴付けが可能な現実的な分布シフトを合成することができる。
imagenetデータセットにこの手法を適用することで、様々な粒度のサブポピュレーションシフトベンチマークを作成します。
次に,人的ベースラインの獲得によって,対応するシフトがトラクタブルであることを検証する。
最後に、これらのベンチマークを用いて、標準モデルアーキテクチャの感度と、市販の列車時堅牢性介入の有効性を測定する。
コードとデータはhttps://github.com/madrylab/breeds-benchmarksで入手できる。
関連論文リスト
- Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。
本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文 参考訳(メタデータ) (2024-04-26T06:00:27Z) - Multiply Robust Estimation for Local Distribution Shifts with Multiple Domains [9.429772474335122]
我々は、全人口の複数のセグメントにまたがってデータ分布が変化するシナリオに焦点を当てる。
そこで本研究では,各セグメントのモデル性能を改善するために,二段階多重ロバスト推定法を提案する。
本手法は,市販の機械学習モデルを用いて実装されるように設計されている。
論文 参考訳(メタデータ) (2024-02-21T22:01:10Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Identifying the Context Shift between Test Benchmarks and Production
Data [1.2259552039796024]
データセットベンチマークにおける機械学習モデルの精度と実運用データの間には、パフォーマンスのギャップがある。
分布変化とモデル予測誤差につながる文脈変化を同定する2つの手法を概説する。
本研究は,機械学習モデルに基づく暗黙の仮定を強調するケーススタディを2つ提示する。
論文 参考訳(メタデータ) (2022-07-03T14:54:54Z) - Extending the WILDS Benchmark for Unsupervised Adaptation [186.90399201508953]
We present the WILDS 2.0 update, which extends 8 of the 10 datasets in the WILDS benchmark of distribution shifts to include curated unlabeled data。
これらのデータセットは、組織学から野生生物保護まで幅広い応用、タスク(分類、回帰、検出)、モダリティにまたがる。
ドメイン不変量や自己学習,自己管理など,ラベルのないデータを活用する最先端の手法を体系的にベンチマークする。
論文 参考訳(メタデータ) (2021-12-09T18:32:38Z) - WILDS: A Benchmark of in-the-Wild Distribution Shifts [157.53410583509924]
分散シフトは、ワイルドにデプロイされた機械学習システムの精度を実質的に低下させることができる。
分散シフトの多様な範囲を反映した8つのベンチマークデータセットのキュレーションコレクションであるWILDSを紹介します。
本研究は, 標準訓練の結果, 分布性能よりも, 分布域外性能が有意に低下することを示す。
論文 参考訳(メタデータ) (2020-12-14T11:14:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。