論文の概要: IDANI: Inference-time Domain Adaptation via Neuron-level Interventions
- arxiv url: http://arxiv.org/abs/2206.00259v1
- Date: Wed, 1 Jun 2022 06:39:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 02:15:13.823390
- Title: IDANI: Inference-time Domain Adaptation via Neuron-level Interventions
- Title(参考訳): IDANI: ニューロンレベルの介入による推論時ドメイン適応
- Authors: Omer Antverg, Eyal Ben-David, Yonatan Belinkov
- Abstract要約: 本稿では,ニューロンレベルの介入を用いたドメイン適応(DA)の新しいアプローチを提案する。
特定のニューロンにおける各テスト例の表現を変更した結果、ソースドメインからの逆実例が得られます。
実験の結果,本手法は未確認領域の性能向上を図っている。
- 参考スコア(独自算出の注目度): 24.60778570114818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large pre-trained models are usually fine-tuned on downstream task data, and
tested on unseen data. When the train and test data come from different
domains, the model is likely to struggle, as it is not adapted to the test
domain. We propose a new approach for domain adaptation (DA), using
neuron-level interventions: We modify the representation of each test example
in specific neurons, resulting in a counterfactual example from the source
domain, which the model is more familiar with. The modified example is then fed
back into the model. While most other DA methods are applied during training
time, ours is applied during inference only, making it more efficient and
applicable. Our experiments show that our method improves performance on unseen
domains.
- Abstract(参考訳): 大規模な事前訓練されたモデルは、通常下流のタスクデータで微調整され、見えないデータでテストされる。
トレーニングデータとテストデータは異なるドメインから来る場合、テストドメインに適合しないため、モデルが苦労する可能性が高い。
我々は、ニューロンレベルの介入を用いて、ドメイン適応(DA)のための新しいアプローチを提案する: 特定のニューロンにおける各テスト例の表現を変更し、その結果、モデルがより親しみやすいソースドメインからの反実例をもたらす。
修正された例はモデルに返される。
他のほとんどのdaメソッドはトレーニング時間に適用されるが、推論時にのみ適用され、より効率的で適用可能である。
実験の結果,本手法は未確認領域の性能向上を図っている。
関連論文リスト
- DomainAdaptor: A Novel Approach to Test-time Adaptation [33.770970763959355]
DomainAdaptorは、テスト中に未確認のドメインにトレーニング済みのCNNモデルを適用することを目的としている。
AdaMixBNは、正規化層のトレーニングとテスト統計を適応的に融合することで、ドメインシフトに対処する。
実験によると、DomainAdaptorは4つのベンチマークで最先端のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2023-08-20T15:37:01Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - To Adapt or to Annotate: Challenges and Interventions for Domain
Adaptation in Open-Domain Question Answering [46.403929561360485]
オープンドメイン質問応答(ODQA)のエンドツーエンドモデルの性能について検討する。
モデルが一般化に失敗するだけでなく、高い検索スコアが解答予測の精度を低下させることもしばしばある。
終末回答F1のスコアを最大24ポイント改善するいくつかの介入手法を提案し,評価する。
論文 参考訳(メタデータ) (2022-12-20T16:06:09Z) - Back to the Source: Diffusion-Driven Test-Time Adaptation [77.4229736436935]
テスト時間適応はテスト入力を利用し、シフトしたターゲットデータ上でテストした場合、ソースデータに基づいてトレーニングされたモデルの精度を向上させる。
代わりに、生成拡散モデルを用いて、すべてのテスト入力をソース領域に向けて投影することで、ターゲットデータを更新する。
論文 参考訳(メタデータ) (2022-07-07T17:14:10Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - On-the-Fly Test-time Adaptation for Medical Image Segmentation [63.476899335138164]
ソースモデルをテスト時にターゲットデータに適応させることは、データシフト問題に対する効率的な解決策である。
本稿では、各畳み込みブロックに適応バッチ正規化層を設けるAdaptive UNetという新しいフレームワークを提案する。
テスト期間中、モデルは新しいテストイメージのみを取り込み、ドメインコードを生成して、テストデータに従ってソースモデルの特徴を適応させる。
論文 参考訳(メタデータ) (2022-03-10T18:51:29Z) - Learning to Generalize across Domains on Single Test Samples [126.9447368941314]
単体テストサンプルでドメインをまたいで一般化することを学ぶ。
変分ベイズ推論問題として単検体への適応を定式化する。
我々のモデルは、ドメインの一般化のための複数のベンチマークにおいて、最先端のメソッドよりも少なくとも同等で、より優れたパフォーマンスを達成します。
論文 参考訳(メタデータ) (2022-02-16T13:21:04Z) - Self-Domain Adaptation for Face Anti-Spoofing [31.441928816043536]
推論時にラベルのないテストドメインデータを利用するための自己ドメイン適応フレームワークを提案する。
トレーニングステップで複数のソースドメインのデータを用いて,メタラーニングに基づく適応学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-24T08:46:39Z) - Adaptive Risk Minimization: Learning to Adapt to Domain Shift [109.87561509436016]
ほとんどの機械学習アルゴリズムの基本的な前提は、トレーニングとテストデータは、同じ基礎となる分布から引き出されることである。
本研究では,学習データをドメインに構造化し,複数のテスト時間シフトが存在する場合の領域一般化の問題点について考察する。
本稿では、適応リスク最小化(ARM)の枠組みを紹介し、モデルがトレーニング領域に適応することを学ぶことで、効果的な適応のために直接最適化される。
論文 参考訳(メタデータ) (2020-07-06T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。