Fugu-MT 論文翻訳(概要): Efficient Transfer Learning via Causal Bounds

論文の概要: Efficient Transfer Learning via Causal Bounds

arxiv url: http://arxiv.org/abs/2308.03572v5
Date: Wed, 09 Jul 2025 05:37:07 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-10 15:30:51.859829
Title: Efficient Transfer Learning via Causal Bounds
Title（参考訳）: 因果境界を用いた効率的な伝達学習
Authors: Xueping Gong, Wei You, Jiheng Zhang,
Abstract要約: 我々は、因果側情報がどのようにオンライン学習を加速するかを分析し、データ削減の実験を行う。我々の分析は、因果側情報がどのようにオンライン学習を加速させるか、およびデータ削減の実験を正確に特徴付ける。
参考スコア（独自算出の注目度）: 8.981637739384674
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Transfer learning seeks to accelerate sequential decision-making by leveraging offline data from related agents. However, data from heterogeneous sources that differ in observed features, distributions, or unobserved confounders often render causal effects non-identifiable and bias naive estimators. We address this by forming ambiguity sets of structural causal models defined via integral constraints on their joint densities. Optimizing any causal effect over these sets leads to generally non-convex programs whose solutions tightly bound the range of possible effects under heterogeneity or confounding. To solve these programs efficiently, we develop a hit-and-run sampler that explores the entire ambiguity set and, when paired with a local optimization oracle, produces causal bound estimates that converge almost surely to the true limits. We further accommodate estimation error by relaxing the ambiguity set and exploit the Lipschitz continuity of causal effects to establish precise error propagation guarantees. These causal bounds are then embedded into bandit algorithms via arm elimination and truncated UCB indices, yielding optimal gap-dependent and minimax regret bounds. To handle estimation error, we also develop a safe algorithm for incorporating noisy causal bounds. In the contextual-bandit setting with function approximation, our method uses causal bounds to prune both the function class and the per-context action set, achieving matching upper and lower regret bounds with only logarithmic dependence on function-class complexity. Our analysis precisely characterizes when and how causal side-information accelerates online learning, and experiments on synthetic benchmarks confirm substantial regret reductions in data-scarce or confounded regimes.
Abstract（参考訳）: トランスファーラーニングは、関連するエージェントからのオフラインデータを活用することで、シーケンシャルな意思決定を加速しようとする。しかし、観測された特徴、分布、または観測されていない共同設立者が異なる異種源からのデータは、しばしば因果効果を非識別的、偏見的ネーブな推定器で表す。この問題に対処するために、結合密度の積分的制約によって定義される構造因果モデルのあいまいさ集合を形成する。これらの集合に対する因果効果を最適化すると、解が不均一性や相反する条件下での可能な効果の範囲を強く束縛する一般の非凸プログラムが導かれる。これらのプログラムを効率的に解くために,全あいまいさ集合を探索するヒット・アンド・ラン・サンプリング器を開発し,局所最適化オラクルと組み合わせると,ほぼ確実に真極限に収束する因果境界推定値を生成する。さらに、曖昧性集合を緩和し、因果効果のリプシッツ連続性を利用して推定誤差を補正し、正確な誤差伝搬を保証する。これらの因果境界は、腕の除去と脱落した UCB 指数によって帯域幅アルゴリズムに埋め込まれ、最適のギャップ依存と最小の後悔境界をもたらす。推定誤差に対処するため,ノイズのある因果境界を組み込むための安全なアルゴリズムも開発した。関数近似を用いた文脈帯域設定では、関数クラスとコンテキスト単位のアクションセットの両方に因果境界を適用し、関数クラスの複雑性にのみ対数的依存で一致した上と下のリセット境界を達成する。我々の分析は、因果側情報がどのようにオンライン学習を加速するかを正確に特徴付けており、合成ベンチマークによる実験は、データスカースやコンストラクドレジームの相当な後悔の軽減を証明している。

関連論文リスト

Asymptotically Optimal Linear Best Feasible Arm Identification with Fixed Budget [55.938644481736446]
本稿では,誤差確率の指数的減衰を保証し,最適な腕識別のための新しいアルゴリズムを提案する。我々は,複雑性のレベルが異なる様々な問題インスタンスに対する包括的経験的評価を通じて,アルゴリズムの有効性を検証する。
論文参考訳（メタデータ） (2025-06-03T02:56:26Z)
Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints [49.76332265680669]
本稿では、目的関数と制約関数の両方が弱凸である問題の重要な部分集合について検討する。既存の手法では、収束速度の遅さや二重ループ設計への依存など、しばしば制限に直面している。これらの課題を克服するために,新しい単一ループペナルティに基づくアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-04-21T17:15:48Z)
Bridging Internal Probability and Self-Consistency for Effective and Efficient LLM Reasoning [53.25336975467293]
パープレキシティや自己整合性などの手法の第一理論誤差分解解析について述べる。パープレキシティ法は、適切な整合関数が存在しないため、かなりのモデル誤差に悩まされる。本稿では、自己整合性とパープレキシティを統合したReasoning-Pruning Perplexity Consistency(RPC)と、低確率推論経路を排除したReasoning Pruningを提案する。
論文参考訳（メタデータ） (2025-02-01T18:09:49Z)
The Exploration of Error Bounds in Classification with Noisy Labels [7.657250843344973]
本稿では,ディープラーニングフレームワークにおけるノイズラベルによる分類問題に対する過大なリスクの誤差境界に着目した。過大なリスクに対して誤差境界を導出し、それを統計的誤差と近似誤差に分解する。低次元多様体仮説の下では、高次元入力空間の影響を軽減するために近似誤差をさらに洗練する。
論文参考訳（メタデータ） (2025-01-25T10:06:50Z)
Efficient Differentiable Discovery of Causal Order [14.980926991441342]
Intersortは、変数の因果順序を発見するためのスコアベースの方法である。我々は、差別化可能なソートとランキング技術を用いてインターソートを再構築する。我々の研究は、因果順の正規化を微分可能なモデルの訓練に効率的に組み込むための扉を開く。
論文参考訳（メタデータ） (2024-10-11T13:11:55Z)
LEARN: An Invex Loss for Outlier Oblivious Robust Online Optimization [56.67706781191521]
敵は、学習者に未知の任意の数kの損失関数を破損させることで、外れ値を導入することができる。我々は,任意の数kで損失関数を破損させることで,敵が外乱を発生させることができる,頑健なオンラインラウンド最適化フレームワークを提案する。
論文参考訳（メタデータ） (2024-08-12T17:08:31Z)
Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文参考訳（メタデータ） (2023-12-19T13:17:43Z)
Amortizing intractable inference in large language models [56.92471123778389]
難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文参考訳（メタデータ） (2023-10-06T16:36:08Z)
Doubly Robust Proximal Causal Learning for Continuous Treatments [56.05592840537398]
本稿では,カーネルベースの2倍頑健な因果学習推定器を提案する。オラクル形式は影響関数の一貫した近似であることを示す。次に、平均二乗誤差の観点から総合収束解析を行う。
論文参考訳（メタデータ） (2023-09-22T12:18:53Z)
Interactive Graph Convolutional Filtering [79.34979767405979]
インタラクティブ・レコメンダ・システム(IRS)は、パーソナライズされた記事レコメンデーション、ソーシャルメディア、オンライン広告など、さまざまな領域でますます利用されている。これらの問題は、コールドスタート問題とデータスポーサリティ問題によって悪化する。既存のMulti-Armed Bandit手法は、慎重に設計された探査戦略にもかかわらず、しばしば初期の段階で満足な結果を提供するのに苦労する。提案手法は,ユーザとアイテム間の協調フィルタリング性能を向上させるため,協調フィルタリングをグラフモデルに拡張する。
論文参考訳（メタデータ） (2023-09-04T09:02:31Z)
Non-stationary Delayed Combinatorial Semi-Bandit with Causally Related Rewards [7.0997346625024]
我々は、因果関係の報酬で非定常かつ遅延半帯域問題を定式化する。遅延したフィードバックから構造的依存関係を学習し、それを利用して意思決定を最適化する政策を開発する。イタリアにおけるCovid-19の拡散に最も寄与する地域を検出するために, 合成および実世界のデータセットを用いて数値解析により評価を行った。
論文参考訳（メタデータ） (2023-07-18T09:22:33Z)
Learning Prompt-Enhanced Context Features for Weakly-Supervised Video Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文参考訳（メタデータ） (2023-06-26T06:45:16Z)
Approximate Causal Effect Identification under Weak Confounding [13.552959043816482]
因果効果の上下境界を導出する効率的な線形プログラムを提案する。我々の境界は、観測されていない共同設立者のエントロピーがゼロになるにつれて、上界と下界の間のギャップが消えるという意味で一貫していることが示される。
論文参考訳（メタデータ） (2023-06-22T23:35:49Z)
dugMatting: Decomposed-Uncertainty-Guided Matting [83.71273621169404]
そこで本稿では, 明確に分解された不確かさを探索し, 効率よく効率よく改善する, 分解不確実性誘導型マッチングアルゴリズムを提案する。提案したマッチングフレームワークは,シンプルで効率的なラベリングを用いて対話領域を決定する必要性を緩和する。
論文参考訳（メタデータ） (2023-06-02T11:19:50Z)
Federated Learning for Heterogeneous Bandits with Unobserved Contexts [0.0]
我々は、未知のコンテキストを持つ多腕コンテキスト包帯のフェデレーション問題について検討する。線形パラメタライズされた報酬関数に対して,除去に基づくアルゴリズムを提案し,後悔の束縛を証明した。
論文参考訳（メタデータ） (2023-03-29T22:06:24Z)
Multivariate Systemic Risk Measures and Computation by Deep Learning Algorithms [63.03966552670014]
本稿では,主観的最適度と関連するリスク割り当ての公平性に着目し,重要な理論的側面について論じる。私たちが提供しているアルゴリズムは、予備項の学習、二重表現の最適化、およびそれに対応する公正なリスク割り当てを可能にします。
論文参考訳（メタデータ） (2023-02-02T22:16:49Z)
Data-Driven Influence Functions for Optimization-Based Causal Inference [105.5385525290466]
統計的汎関数に対するガトー微分を有限差分法で近似する構成的アルゴリズムについて検討する。本研究では,確率分布を事前知識がないが,データから推定する必要がある場合について検討する。
論文参考訳（メタデータ） (2022-08-29T16:16:22Z)
On data-driven chance constraint learning for mixed-integer optimization problems [0.0]
本稿では,混合整数線形最適化問題に着目したCCL手法を提案する。 CCLは線形化可能な機械学習モデルを使用して、学習変数の条件量子を推定する。実践者が使用するオープンアクセスソフトウェアが開発されている。
論文参考訳（メタデータ） (2022-07-08T11:54:39Z)
Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文参考訳（メタデータ） (2022-05-13T21:09:41Z)
Contextual Model Aggregation for Fast and Robust Federated Learning in Edge Computing [88.76112371510999]
フェデレーション学習は、ネットワークエッジにおける分散機械学習の第一候補である。既存のアルゴリズムは、性能の緩やかな収束や堅牢性の問題に直面している。そこで本稿では,損失低減に対する最適コンテキスト依存境界を実現するためのコンテキストアグリゲーション手法を提案する。
論文参考訳（メタデータ） (2022-03-23T21:42:31Z)
Partial Identification with Noisy Covariates: A Robust Optimization Approach [94.10051154390237]
観測データセットからの因果推論は、しばしば共変量の測定と調整に依存する。このロバストな最適化手法により、広範囲な因果調整法を拡張し、部分的同定を行うことができることを示す。合成および実データセット全体で、このアプローチは既存の手法よりも高いカバレッジ確率でATEバウンダリを提供する。
論文参考訳（メタデータ） (2022-02-22T04:24:26Z)
Fusion and Orthogonal Projection for Improved Face-Voice Association [15.938463726577128]
顔と声の関連性について検討する。両モードの相補的手がかりを利用して, リッチなフューズド埋め込みを形成する軽量なプラグアンドプレイ機構を提案する。
論文参考訳（メタデータ） (2021-12-20T12:33:33Z)
Convergence Rates for Learning Linear Operators from Noisy Data [6.4423565043274795]
本研究では,空間上の線形演算子を学習する逆問題について,ランダムな入力データに対する雑音の多い点評価から検討する。ボヒナーノルムの族に対する後部収縮速度は、推定誤差よりも無限小の傾向にあるため確立する。これらの収束速度は、有界あるいはコンパクトな作用素の学習と比較して線形作用素の学習の難しさを強調し、定量化する。
論文参考訳（メタデータ） (2021-08-27T22:09:53Z)
Minimum-Delay Adaptation in Non-Stationary Reinforcement Learning via Online High-Confidence Change-Point Detection [7.685002911021767]
非定常環境におけるポリシーを効率的に学習するアルゴリズムを導入する。これは、リアルタイム、高信頼な変更点検出統計において、潜在的に無限のデータストリームと計算を解析する。 i) このアルゴリズムは, 予期せぬ状況変化が検出されるまでの遅延を最小限に抑え, 迅速な応答を可能にする。
論文参考訳（メタデータ） (2021-05-20T01:57:52Z)
Experimental Design for Regret Minimization in Linear Bandits [19.8309784360219]
オンライン・リニア・バンドレットにおける後悔を最小限に抑える設計に基づく新しいアルゴリズムを提案する。我々は、現在最先端の有限時間後悔保証を提供し、このアルゴリズムが帯域幅と半帯域幅の両方のフィードバックシステムに適用可能であることを示す。
論文参考訳（メタデータ） (2020-11-01T17:59:19Z)
An Asymptotically Optimal Primal-Dual Incremental Algorithm for Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文参考訳（メタデータ） (2020-10-23T09:12:47Z)
Accurate and Robust Feature Importance Estimation under Distribution Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2020-09-30T05:29:01Z)
Differentiable Causal Discovery from Interventional Data [141.41931444927184]
本稿では、介入データを活用可能なニューラルネットワークに基づく理論的基盤化手法を提案する。提案手法は,様々な環境下での美術品の状態と良好に比較できることを示す。
論文参考訳（メタデータ） (2020-07-03T15:19:17Z)
Adaptive Discretization for Model-Based Reinforcement Learning [10.21634042036049]
本稿では,適応離散化手法を導入し,効率的なモデルに基づくエピソード強化学習アルゴリズムを設計する。我々のアルゴリズムは、空間の適応的な離散化を維持するために拡張された楽観的なワンステップ値反復に基づいている。
論文参考訳（メタデータ） (2020-07-01T19:36:46Z)
A Class of Algorithms for General Instrumental Variable Models [29.558215059892206]
因果治療効果の推定は、様々な現実世界で発生する重要な問題である。連続分布における因果効果のバウンディング法を提案する。
論文参考訳（メタデータ） (2020-06-11T12:32:24Z)
Task-Feature Collaborative Learning with Application to Personalized Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文参考訳（メタデータ） (2020-04-29T02:32:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。