論文の概要: Multi-Objective Multi-Fidelity Bayesian Optimization with Causal Priors
- arxiv url: http://arxiv.org/abs/2602.00788v1
- Date: Sat, 31 Jan 2026 15:53:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.401299
- Title: Multi-Objective Multi-Fidelity Bayesian Optimization with Causal Priors
- Title(参考訳): 因果前処理を用いた多目的多重忠実ベイズ最適化
- Authors: Md Abir Hossen, Mohammad Ali Javidian, Vignesh Narayanan, Jason M. O'Kane, Pooyan Jamshidi,
- Abstract要約: 本稿では,因果計算を取り入れた多目的MFBO手法であるRESCUEを提案する。
ロボット工学、機械学習(AutoML)、医療における合成および実世界の問題に対する最先端のMF最適化手法よりも、RESCUEはサンプル効率を向上することを示す。
- 参考スコア(独自算出の注目度): 13.649714557575178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-fidelity Bayesian optimization (MFBO) accelerates the search for the global optimum of black-box functions by integrating inexpensive, low-fidelity approximations. The central task of an MFBO policy is to balance the cost-efficiency of low-fidelity proxies against their reduced accuracy to ensure effective progression toward the high-fidelity optimum. Existing MFBO methods primarily capture associational dependencies between inputs, fidelities, and objectives, rather than causal mechanisms, and can perform poorly when lower-fidelity proxies are poorly aligned with the target fidelity. We propose RESCUE (REducing Sampling cost with Causal Understanding and Estimation), a multi-objective MFBO method that incorporates causal calculus to systematically address this challenge. RESCUE learns a structural causal model capturing causal relationships between inputs, fidelities, and objectives, and uses it to construct a probabilistic multi-fidelity (MF) surrogate that encodes intervention effects. Exploiting the causal structure, we introduce a causal hypervolume knowledge-gradient acquisition strategy to select input-fidelity pairs that balance expected multi-objective improvement and cost. We show that RESCUE improves sample efficiency over state-of-the-art MF optimization methods on synthetic and real-world problems in robotics, machine learning (AutoML), and healthcare.
- Abstract(参考訳): MFBO(Multi-fidelity Bayesian Optimization)は、安価で低忠実な近似を統合することで、ブラックボックス関数のグローバルな最適化を加速する。
MFBO政策の中心課題は、低忠実度プロキシのコスト効率と精度の低下をバランスさせ、高忠実度最適化に向けた効果的な進展を確保することである。
既存のMFBO法は、主に因果メカニズムではなく、入力、忠実度、目的間の関連性を取り込んでおり、低忠実度プロキシがターゲットの忠実度に不整合している場合、性能が低下する。
因果計算を組み込んだ多目的MFBO手法であるRESCUE(Reducing Sampling cost with Causal Understanding and Estimation)を提案する。
RESCUEは、入力、忠実度、目的間の因果関係をキャプチャする構造因果モデルを学び、介入効果を符号化する確率的多重忠実(MF)サロゲートを構築する。
因果構造をエクスプロイトし,多目的改善とコストのバランスをとる入力-忠実度ペアを選択するために,因果的多量知識-段階的獲得戦略を導入する。
ロボット工学、機械学習(AutoML)、医療における合成および実世界の問題に対する最先端のMF最適化手法よりも、RESCUEはサンプル効率を向上することを示す。
関連論文リスト
- Extending Multi-Source Bayesian Optimization With Causality Principles [0.0]
マルチソース領域におけるMSBOとCBOの方法論を原則的に統合する手法を提案する。
本稿では,マルチソース因果ベイズ最適化(MSCBO)アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2026-02-16T14:38:16Z) - FedLoDrop: Federated LoRA with Dropout for Generalized LLM Fine-tuning [65.26899091946417]
大規模言語モデル(LLM)は、特定のタスクに汎用モデルを適用するために不可欠である。
本稿では,FedLoDropを用いたFederated LoRAを提案する。FedLoDropは,Federated LoRAのトレーニング可能な行列の行と列にドロップアウトを適用する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-10-14T02:40:45Z) - TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making [75.29820290660065]
本稿では,効果的な具体的意思決定のための思考中心推論最適化(TCPO)を提案する。
モデルの中間的推論プロセスの整合性を強調し、モデル劣化の問題を緩和する。
ALFWorld環境での実験では、平均成功率は26.67%であり、RL4VLMよりも6%向上している。
論文 参考訳(メタデータ) (2025-09-10T11:16:21Z) - MOHAF: A Multi-Objective Hierarchical Auction Framework for Scalable and Fair Resource Allocation in IoT Ecosystems [0.565395466029518]
本稿では、コスト、QoS(Quality of Service)、エネルギー効率、公平性を共同で最適化する分散リソース割り当て機構を提案する。
3,553の要求と888のリソースからなるGoogle Cluster Dataトレースの実験では、完全な公正性(Jainのインデックス=1.000)を達成しつつ、MOHAFの優れたアロケーション効率(0.185)、First-Price(0.138)、Random(0.101)のオークションを実証した。
論文 参考訳(メタデータ) (2025-08-20T16:25:37Z) - Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:47:00Z) - A Multi-Fidelity Control Variate Approach for Policy Gradient Estimation [22.095132833345776]
強化学習アルゴリズムは、運用システムへの展開や高価な高忠実度シミュレーションによるトレーニングには実用的ではない。
低忠実度シミュレータは、ゼロショット転送には大きすぎるとしても、RLトレーニングに有用なデータを提供することができる。
ターゲット環境から少量のデータを混合する多要素ポリシーロボティクス(Gs)を提案する。
論文 参考訳(メタデータ) (2025-03-07T18:58:23Z) - A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning [61.403275660120606]
強化学習(Reinforcement Learning, RL)に基づく微調整は, 拡散モデルとブラックボックスの目的を整合させる強力なアプローチとして登場した。
拡散微調整のための新しいRLであるLOOP(Left-one-out PPO)を提案する。
以上の結果から, LOOPは様々なブラックボックス対象の拡散モデルを効果的に改善し, 計算効率と性能のバランスを良くすることを示す。
論文 参考訳(メタデータ) (2025-03-02T13:43:53Z) - Reward-Guided Speculative Decoding for Efficient LLM Reasoning [80.55186052123196]
Reward-Guided Speculative Decoding (RSD)は,大規模言語モデル(LLM)における推論の効率向上を目的とした新しいフレームワークである。
RSDは、厳密な偏りを強制する既存の投機的復号法とは対照的に、制御されたバイアスをハイリワード出力の優先順位付けに取り入れている。
RSDは,対象モデルのみでの復号化に対して,高い効率向上を実現し,並列復号法よりも高い精度を実現している。
論文 参考訳(メタデータ) (2025-01-31T17:19:57Z) - InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling [66.3072381478251]
Reward Hacking(報酬の過度な最適化)は依然として重要な課題だ。
本稿では,報奨モデル,すなわちInfoRMのためのフレームワークを提案する。
InfoRMの過度な最適化検出機構は、有効であるだけでなく、幅広いデータセットにわたって堅牢であることを示す。
論文 参考訳(メタデータ) (2024-02-14T17:49:07Z) - Multi-Fidelity Bayesian Optimization with Unreliable Information Sources [12.509709549771385]
GPベースのMFBOスキームを信頼性のない情報ソースの追加により堅牢にするためのrMFBO(robust MFBO)を提案する。
提案手法の有効性を,多数の数値ベンチマークで示す。
rMFBOは、BOプロセスに様々な知識を持つ人間の専門家を確実に含めるのに特に有用であると考えています。
論文 参考訳(メタデータ) (2022-10-25T11:47:33Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Multi-Fidelity Multi-Objective Bayesian Optimization: An Output Space
Entropy Search Approach [44.25245545568633]
複数目的のブラックボックス最適化の新たな課題を多要素関数評価を用いて検討する。
いくつかの総合的および実世界のベンチマーク問題に対する実験により、MF-OSEMOは両者の近似により、最先端の単一忠実度アルゴリズムよりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2020-11-02T06:59:04Z) - Multi-Fidelity Bayesian Optimization via Deep Neural Networks [19.699020509495437]
多くのアプリケーションでは、目的関数を複数の忠実度で評価することで、コストと精度のトレードオフを可能にする。
本稿では,DNN-MFBO(Deep Neural Network Multi-Fidelity Bayesian Optimization)を提案する。
本手法の利点は, 総合的なベンチマークデータセットと, 工学設計における実世界の応用の両方にある。
論文 参考訳(メタデータ) (2020-07-06T23:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。