論文の概要: TILT: Target-induced loss tilting under covariate shift
- arxiv url: http://arxiv.org/abs/2605.14280v1
- Date: Thu, 14 May 2026 02:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.58428
- Title: TILT: Target-induced loss tilting under covariate shift
- Title(参考訳): TILT:共変量シフト下でのターゲットによる損失傾き
- Authors: Kakei Yamamoto, Martin J. Wainwright,
- Abstract要約: 我々は、教師なしドメイン適応のためのTarget-induced Loss Tilting(TILT)を紹介し、分析する。
ソース予測を$f+b$として分解する新しい客観的関数に基づいて、ラベル付きソースデータに$f+b$を適合させ、同時にラベルなしターゲット入力に補助コンポーネント$b$をペナル化する。
この標的側のペナルティは、人口レベルでの相対的な重み付けを暗黙的に引き起こすが、推定値として$b*_f$は、現在の誤差に自己局所化され、任意のソース・ターゲット対に対して均一に拘束される。
- 参考スコア(独自算出の注目度): 14.526961596109361
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce and analyze Target-Induced Loss Tilting (TILT) for unsupervised domain adaptation under covariate shift. It is based on a novel objective function that decomposes the source predictor as $f+b$, fits $f+b$ on labeled source data while simultaneously penalizing the auxiliary component $b$ on unlabeled target inputs. The resulting fit $f$ is deployed as the final target predictor. At the population level, we show that this target-side penalty implicitly induces relative importance weighting at the population level, but in terms of an estimand $b^*_f$ that is self-localized to the current error, and remains uniformly bounded for any source-target pair (even those with disjoint supports). We prove a general finite-sample oracle inequality on the excess risk, and use it to give an end-to-end guarantee for training with sparse ReLU networks. Experiments on controlled regression problems and shifted CIFAR-100 distillation show that TILT improves target-domain performance over source-only training, exact importance weighting, and relative density-ratio baselines, with a stable dependence on the regularization parameter.
- Abstract(参考訳): 共変量シフト下での教師なしドメイン適応のためのTarget-induced Loss Tilting(TILT)を導入,解析する。
これは、ソース予測子を$f+b$として分解し、ラベル付きソースデータに$f+b$を適合させ、同時にラベルなしターゲット入力に補助コンポーネント$b$をペナル化する新しい客観的関数に基づいている。
その結果の$f$は最終ターゲット予測器としてデプロイされる。
人口レベルでは、この標的側のペナルティは人口レベルでの相対的な重み付けを暗黙的に引き起こすが、推定値である$b^*_f$は、現在の誤差に自己局所化され、どのソース・ターゲット対に対しても均一に拘束される(非結合性のあるものであっても)。
我々は、余剰リスクに対して一般的な有限サンプルオラクルの不等式を証明し、それを、疎ReLUネットワークによるトレーニングのエンドツーエンド保証に利用する。
制御された回帰問題とシフトCIFAR-100蒸留実験により、TILTは正規化パラメータに安定して依存し、ソースのみのトレーニング、正確な重み付け、相対密度比のベースラインよりも目標ドメイン性能を向上させることが示された。
関連論文リスト
- When to Trust Confidence Thresholding: Calibration Diagnostics for Pseudo-Labelled Regression [1.14219428942199]
標準的なプラクティスは、信頼性カットオフで校正されたスコアをしきい値にし、ハードラベルを真実として扱うことである。
疑似ラベリングパイプラインのためのキャリブレーション対応診断装置を開発した。
我々は、下流回帰係数において信頼しきい値が誘導する減衰バイアスの閉形式式を導出する。
論文 参考訳(メタデータ) (2026-05-12T21:49:11Z) - Improving Search Agent with One Line of Code [68.58667107354253]
ツールベースのエージェント強化学習(TARL)は,検索エージェントが外部ツールと対話できるようにトレーニングするための,有望なパラダイムとして登場した。
textbfSearch textbfAgent textbfPolicy textbfOptimization (textbfSAPO)を提案する。
論文 参考訳(メタデータ) (2026-03-10T04:07:39Z) - Coverage Guarantees for Pseudo-Calibrated Conformal Prediction under Distribution Shift [1.5861469511290378]
コンフォーマル予測は、データ分散がシフトした場合の限界カバレッジを保証する。
この性能損失に対処するためのツールとして擬似校正を用いた場合の分析を行う。
ハードな擬似ラベルとランダムなラベルを補間するソース調整擬似校正アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-02-16T16:48:39Z) - Non-Stationary Online Structured Prediction with Surrogate Losses [22.848052937383244]
累積目標損失に対して$F_T + C (1 + P_T)$という形の有界性を証明する。
我々の中核となる考え方は、勾配オンライン降下(OGD)の動的後悔境界を代理ギャップを利用する手法で合成することである。
我々はまた、OGDのための新しいPolyakスタイルの学習率にも光を当てています。
論文 参考訳(メタデータ) (2025-10-08T14:43:44Z) - The Role of Baselines in Policy Gradient Optimization [83.42050606055822]
Emphstateのバリューベースラインが、オン・ポリティクスを可能にしていることを示す。
世界的な最適な政策勾配(NPG)に収束する。
O (1/t) レート勾配でのポリシー。
値ベースラインの主な効果は、その分散ではなく、更新のアグレッシブさをthabfreduceすることにある。
論文 参考訳(メタデータ) (2023-01-16T06:28:00Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - The Power and Limitation of Pretraining-Finetuning for Linear Regression
under Covariate Shift [127.21287240963859]
本研究では,対象データに基づく事前学習と微調整を併用した伝達学習手法について検討する。
大規模な線形回帰インスタンスの場合、$O(N2)$ソースデータによる転送学習は、$N$ターゲットデータによる教師あり学習と同じくらい効果的である。
論文 参考訳(メタデータ) (2022-08-03T05:59:49Z) - Test-time Batch Statistics Calibration for Covariate Shift [66.7044675981449]
我々は,推論中に深層モデルを新しい環境に適応させることを提案する。
バッチ統計の校正に$alpha$-BNの一般的な定式化を提案する。
また、統合テスト時間適応フレームワークCoreを形成するための新しい損失関数も提示する。
論文 参考訳(メタデータ) (2021-10-06T08:45:03Z) - KL Guided Domain Adaptation [88.19298405363452]
ドメイン適応は重要な問題であり、現実世界のアプリケーションにしばしば必要である。
ドメイン適応文学における一般的なアプローチは、ソースとターゲットドメインに同じ分布を持つ入力の表現を学ぶことである。
確率的表現ネットワークにより、KL項はミニバッチサンプルにより効率的に推定できることを示す。
論文 参考訳(メタデータ) (2021-06-14T22:24:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。