論文の概要: Multi-dimensional domain generalization with low-rank structures
- arxiv url: http://arxiv.org/abs/2309.09555v1
- Date: Mon, 18 Sep 2023 08:07:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 14:31:58.210522
- Title: Multi-dimensional domain generalization with low-rank structures
- Title(参考訳): 低ランク構造をもつ多次元領域一般化
- Authors: Sai Li and Linjun Zhang
- Abstract要約: 統計的および機械学習の手法では、テストデータがトレーニングデータと同一に分散されていると仮定されるのが一般的である。
この仮定は必ずしも成り立たないが、特にトレーニングデータに対象の個体群がよく表現されていないアプリケーションでは顕著である。
線形回帰モデルにおいて,この問題に対処するための新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 18.565189720128856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In conventional statistical and machine learning methods, it is typically
assumed that the test data are identically distributed with the training data.
However, this assumption does not always hold, especially in applications where
the target population are not well-represented in the training data. This is a
notable issue in health-related studies, where specific ethnic populations may
be underrepresented, posing a significant challenge for researchers aiming to
make statistical inferences about these minority groups. In this work, we
present a novel approach to addressing this challenge in linear regression
models. We organize the model parameters for all the sub-populations into a
tensor. By studying a structured tensor completion problem, we can achieve
robust domain generalization, i.e., learning about sub-populations with limited
or no available data. Our method novelly leverages the structure of group
labels and it can produce more reliable and interpretable generalization
results. We establish rigorous theoretical guarantees for the proposed method
and demonstrate its minimax optimality. To validate the effectiveness of our
approach, we conduct extensive numerical experiments and a real data study
focused on education level prediction for multiple ethnic groups, comparing our
results with those obtained using other existing methods.
- Abstract(参考訳): 従来の統計的および機械学習手法では、テストデータはトレーニングデータと同一に分散されていると仮定される。
しかし、特に訓練データで対象人口が十分に表現されていない場合に、この仮定が常に成り立つとは限らない。
これは、特定の民族が過小評価される可能性がある健康関連研究において顕著な問題であり、これらの少数民族について統計的に推測することを目指す研究者にとって大きな課題となっている。
本稿では,線形回帰モデルにおけるこの課題に対処するための新しいアプローチを提案する。
すべてのサブポピュレーションのモデルパラメータをテンソルに整理する。
構造的テンソル完備化問題を研究することによって、ロバストな領域の一般化、すなわち、限られたあるいは利用可能なデータを持たないサブポピュレーションについて学ぶことができる。
本手法はグループラベルの構造を新規に活用し,より信頼性が高く,解釈可能な一般化結果が得られる。
提案手法の厳密な理論的保証を確立し,その最小限の最適性を示す。
提案手法の有効性を検証するために,多民族集団の教育水準予測に着目した数値実験と実データ分析を行い,他の手法を用いた結果と比較した。
関連論文リスト
- A step towards the integration of machine learning and small area
estimation [0.0]
本稿では,機械学習アルゴリズムがサポートする予測器を提案する。
仮定モデルからわずかに逸脱しただけで、この場合も提案が良い代替手段であることを示す。
さらに,機械学習予測器の精度推定手法を提案し,従来の手法との比較を行った。
論文 参考訳(メタデータ) (2024-02-12T09:43:17Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Zero-shot meta-learning for small-scale data from human subjects [10.320654885121346]
我々は,サンプル外テストデータに対する限られたトレーニングデータを用いて,新しい予測タスクに迅速に適応するフレームワークを開発した。
本モデルでは, 介入による遅延処理効果を学習し, 設計上はマルチタスク予測を自然に処理できる。
我々のモデルは、より広い人口への小型人間研究の一般化を向上するために重要である。
論文 参考訳(メタデータ) (2022-03-29T17:42:04Z) - Distraction is All You Need for Fairness [0.0]
本稿では,Distractionモジュールと呼ばれる深層学習モデルの学習戦略を提案する。
この方法は、分類結果に影響を与えるバイアスを制御するのに有効であることが理論的に証明できる。
UCIアダルトおよびヘリテージヘルスデータセットを用いて,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-03-15T01:46:55Z) - Targeting Underrepresented Populations in Precision Medicine: A
Federated Transfer Learning Approach [7.467496975496821]
多様な人口と複数の医療機関の異種データを統合した双方向データ統合戦略を提案する。
提案手法は, 人口の予測精度と予測精度を向上し, 人口間のモデル性能のギャップを小さくすることを示す。
論文 参考訳(メタデータ) (2021-08-27T04:04:34Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Theoretical Analysis of Self-Training with Deep Networks on Unlabeled
Data [48.4779912667317]
自己学習アルゴリズムは、ニューラルネットワークを使ってラベルのないデータで学ぶことに成功している。
この研究は、半教師なし学習、教師なしドメイン適応、教師なし学習のための深層ネットワークによる自己学習の統一的理論的解析を提供する。
論文 参考訳(メタデータ) (2020-10-07T19:43:55Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - An Investigation of Why Overparameterization Exacerbates Spurious
Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。
モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文 参考訳(メタデータ) (2020-05-09T01:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。