Fugu-MT 論文翻訳(概要): Action-BED: Task-Driven Bayesian Experimental Design with Singly Intractable Objectives

論文の概要: Action-BED: Task-Driven Bayesian Experimental Design with Singly Intractable Objectives

arxiv url: http://arxiv.org/abs/2606.23662v1
Date: Mon, 22 Jun 2026 17:48:07 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-24 17:24:20.624823
Title: Action-BED: Task-Driven Bayesian Experimental Design with Singly Intractable Objectives
Title（参考訳）: Action-BED: 難解物体を用いたタスク駆動ベイズ実験設計
Authors: Tom Rossa, Angus Phillips, Tom Rainforth,
Abstract要約: ダウンストリームアクションにおける将来的な損失(EFL)が、設計ポリシーのためのシンプルで自然なタスク駆動のフレームワークを提供することを示す。次に、これらのEFLは、設計方針と下流アクションポリシーの両方に関して共同で最適化できる、単体で難解な目的に再構成可能であることを示す。
参考スコア（独自算出の注目度）: 12.963546988204875
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Bayesian experimental design (BED) has traditionally been based on maximising expected uncertainty reductions from prior to posterior. A major shortfall of this approach is that it leads to doubly intractable objectives that are difficult to optimise, while customising them to particular downstream tasks of interest can also be difficult. Following first principles decision theory, we demonstrate that BED can alternatively be formulated in terms of an expected future loss (EFL) on downstream actions, providing a simple and naturally task-driven framework. Critically, we then show that all such EFLs can be rearranged into singly intractable objectives that can be jointly optimised with respect to both the design policy and a downstream action policy using stochastic gradients, an approach we refer to as ACTION-BED. This formulation further sidesteps the need for any explicit posterior or marginal likelihood estimation and is naturally implicit, requiring only the ability to sample from the joint model over model parameters and data, and evaluate the downstream loss function. It thus allows design policies to be learned more effectively, efficiently, and simply than existing methods, while providing easy customisation to different downstream tasks and losses.
Abstract（参考訳）: ベイズの実験設計(BED)は伝統的に、後方から後方への予測された不確実性低減を最大化することに基づいている。このアプローチの大きな欠点は、最適化が難しい2つの難解な目標を導き出す一方で、特定の下流のタスクにカスタマイズすることが難しいことだ。第一原理決定理論に従えば、BEDは下流行動における将来的損失(EFL)の観点から定式化でき、単純で自然なタスク駆動型フレームワークを提供する。批判的に、これらのEFLは、設計方針と、確率勾配を用いた下流アクションポリシーの両方に関して共同で最適化できる、単独で難解な目的に再構成できることを示し、これは、私たちがACTION-BEDと呼ぶアプローチである。この定式化は、いかなる明示的な後縁推定や辺縁推定も必要とせず、自然に暗黙的であり、モデルパラメータやデータ上でのジョイントモデルからのサンプルのみを必要とし、下流の損失関数を評価する。これにより、デザインポリシーをより効果的に、効率的に、そして単に既存の方法よりも簡単に学習できると同時に、下流のさまざまなタスクや損失を簡単にカスタマイズできるようになります。

関連論文リスト

UBP2: Uncertainty-Balanced Preference Planning for Efficient Preference-based Reinforcement Learning [4.276809570692494]
我々は、報酬、ダイナミクス、価値関数の不確実性について共同で推論することで、探索を積極的に指示するモデルに基づくアプローチを導入する。提案手法であるUncertainty-Balanced Preference Planning (UBP2) では、報酬、ダイナミクス、値関数モデルのアンサンブルを用いて、候補軌道の評価を行う。標準的な仮定の下では、有限ホライズンと無限ホライズンの設定の両方に対するサブ線形後悔保証を確立する。
論文参考訳（メタデータ） (2026-06-17T17:54:32Z)
Possibilistic Predictive Uncertainty for Deep Learning [75.00607359322863]
Dirichlet-approximated possibilistic rear predictions (DAPPr)を紹介する。 DAPPrは可能性理論を利用した原則的なフレームワークである。この射影近似戦略は閉形式解を用いた単純な訓練目標を与える。
論文参考訳（メタデータ） (2026-05-01T12:14:01Z)
Goal-Oriented Influence-Maximizing Data Acquisition for Learning and Optimization [28.53710231018475]
逆曲率による不確実性認識を保ちながら、明示的な後部推論を回避する能動的取得アルゴリズムを提案する。 GOIMDAは、ユーザが指定したゴール関数に対する期待する影響を最大化し、入力を選択する。一般化線形モデルでは,GOIMDA はゴールアライメントと予測バイアスを考慮した補正項までの予測エントロピー最小化を近似する。
論文参考訳（メタデータ） (2026-02-23T07:57:11Z)
Flow Density Control: Generative Optimization Beyond Entropy-Regularized Fine-Tuning [59.11663802446183]
フローおよび拡散生成モデルは、事前情報を保持しながらタスク固有の目的を最適化するために適応することができる。本研究では,フロー密度制御(FDC)を導入し,複雑な問題をより単純な微調整タスクの特定のシーケンスに還元する。我々は,近年のミラーフローの理解を活用して,現実的な仮定の下で提案されたスキームの収束保証を導出する。
論文参考訳（メタデータ） (2025-11-27T17:19:01Z)
Aligning Latent Spaces with Flow Priors [72.24305287508474]
本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文参考訳（メタデータ） (2025-06-05T16:59:53Z)
Online Decision-Focused Learning [74.3205104323777]
意思決定中心学習(DFL)は、意思決定タスクで予測出力が使用されるモデルのトレーニングパラダイムとして、ますます人気が高まっている。本稿では,目的関数を規則化し,その相違を解消し,非最適関数を克服する方法を検討する。また、クナップサック実験におけるアルゴリズムの有効性を示し、2つの標準ベンチマークを上回りました。
論文参考訳（メタデータ） (2025-05-19T10:40:30Z)
Score Function Gradient Estimation to Widen the Applicability of Decision-Focused Learning [17.962860438133312]
決定中心学習(DFL)パラダイムは、例えば後悔など、タスク損失を直接最小化するためのトレーニングによって制限を克服する。そこで我々は,このような仮定をせずに,任意のタスク損失に作用するスコア関数推定とスムースに組み合わせた代替手法を提案する。実験の結果、一般的に多くのエポックを必要とするが、専門的な手法と同等であり、特にソリューションの品質、スケーラビリティ、あるいはその両方の観点から、制約の不確実性に悩む問題に対して、特にうまく機能していることが示されている。
論文参考訳（メタデータ） (2023-07-11T12:32:13Z)
Learning (Local) Surrogate Loss Functions for Predict-Then-Optimize Problems [58.954414264760956]
決定焦点学習(Decision-Focused Learning, DFL)は、予測モデルを下流の最適化タスクに調整するためのパラダイムである。本稿では,(a)最適化問題を解き,一般化可能なブラックボックスオラクルへのアクセスのみを必要とする忠実なタスク固有サロゲートを学習し,(b)勾配で凸し,容易に最適化できる手法を提案する。
論文参考訳（メタデータ） (2022-03-30T05:46:54Z)
Probabilistically Robust Recourse: Navigating the Trade-offs between Costs and Robustness in Algorithmic Recourse [34.39887495671287]
本稿では,達成された(反感)と所望のリコース無効率とのギャップを同時に最小化する目的関数を提案する。我々は,任意のインスタンスに対応するリコース無効化率を特徴付けるために,新しい理論的結果を開発した。複数の実世界のデータセットを用いた実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (2022-03-13T21:39:24Z)
An Information Bottleneck Approach for Controlling Conciseness in Rationale Extraction [84.49035467829819]
我々は,情報ボトルネック(IB)の目的を最適化することで,このトレードオフをよりよく管理できることを示す。我々の完全教師なしのアプローチは、文上のスパース二項マスクを予測する説明器と、抽出された合理性のみを考慮したエンドタスク予測器を共同で学習する。
論文参考訳（メタデータ） (2020-05-01T23:26:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。