Fugu-MT 論文翻訳(概要): Optimization-Driven Adaptive Experimentation

論文の概要: Optimization-Driven Adaptive Experimentation

arxiv url: http://arxiv.org/abs/2408.04570v2
Date: Thu, 07 Nov 2024 22:15:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:34.691027
Title: Optimization-Driven Adaptive Experimentation
Title（参考訳）: 最適化駆動型適応実験
Authors: Ethan Che, Daniel R. Jiang, Hongseok Namkoong, Jimmy Wang,
Abstract要約: 実世界の実験には、バッチで遅延したフィードバック、非定常性、複数の目的と制約、そして(時には)パーソナライゼーションが含まれる。これらの課題にプロブレム単位で対処するための適応的手法の調整は不可能であり、静的設計はデファクトスタンダードのままである。本稿では,多種多様な目的,制約,統計的手順を柔軟に組み込む数学的プログラミングの定式化について述べる。
参考スコア（独自算出の注目度）: 7.948144726705323
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Real-world experiments involve batched & delayed feedback, non-stationarity, multiple objectives & constraints, and (often some) personalization. Tailoring adaptive methods to address these challenges on a per-problem basis is infeasible, and static designs remain the de facto standard. Focusing on short-horizon ($\le 10$) adaptive experiments, we move away from bespoke algorithms and present a mathematical programming formulation that can flexibly incorporate a wide range of objectives, constraints, and statistical procedures. We formulating a dynamic program based on central limit approximations, which enables the use of scalable optimization methods based on auto-differentiation and GPU parallelization. To evaluate our framework, we implement a simple heuristic planning method ("solver") and benchmark it across hundreds of problem instances involving non-stationarity, personalization, and multiple objectives & constraints. Unlike bespoke methods (e.g., Thompson sampling variants), our mathematical programming framework provides consistent gains over static randomized control trials and exhibits robust performance across problem instances.
Abstract（参考訳）: 実世界の実験には、バッチで遅延したフィードバック、非定常性、複数の目的と制約、そして(時には)パーソナライゼーションが含まれる。これらの課題にプロブレム単位で対処するための適応的手法の調整は不可能であり、静的設計はデファクトスタンダードのままである。短期ホライズン ($\le 10$) 適応実験に焦点をあてて, 計算アルゴリズムから脱却し, 幅広い目的, 制約, 統計的手順を柔軟に組み込む数学的プログラミングの定式化を提案する。集中限界近似に基づく動的プログラムを定式化し、自動微分とGPU並列化に基づくスケーラブルな最適化手法の利用を可能にする。本フレームワークの評価には, 単純ヒューリスティックな計画手法(解法)を実装し, 非定常性, パーソナライゼーション, 複数目的, 制約を含む数百の問題事例をベンチマークする。ベスポーク法(例えばトンプソンサンプリング変種)とは異なり、我々の数学的プログラミングフレームワークは静的ランダム化制御試験よりも一貫した利得を提供し、問題インスタンス間で堅牢な性能を示す。

関連論文リスト

Multi-objective Portfolio Optimization Via Gradient Descent [0.0]
自動微分を用いた勾配勾配勾配を用いた多目的ポートフォリオ最適化(MPO)のためのベンチマークフレームワークを提案する。単目的のセットアップから複雑な多目的のケースまで,6つの実験シナリオでフレームワークを評価した。提案手法は,複数の目的と制約をモデル化する柔軟性を向上しつつ,競争性能を向上することを示す。
論文参考訳（メタデータ） (2025-07-22T15:55:00Z)
Policy Testing in Markov Decision Processes [48.642181362172906]
本研究では,不確実性条件下での割引決定プロセス(MDP)におけるポリシーテスト問題について検討する。目的は、与えられたポリシーの値が数値しきい値を超えるかどうかを決定することである。
論文参考訳（メタデータ） (2025-05-21T10:13:54Z)
Online Decision-Focused Learning [63.83903681295497]
意思決定中心学習(DFL)は、意思決定タスクで出力が使用される予測モデルを訓練するパラダイムとして、ますます人気が高まっている。対象関数が時間とともに進化しない動的環境におけるDFLについて検討する。決定空間が単純空間であるときと一般有界凸ポリトープであるときの両方において、期待される動的後悔の限界を確立する。
論文参考訳（メタデータ） (2025-05-19T10:40:30Z)
A Graphical Global Optimization Framework for Parameter Estimation of Statistical Models with Nonconvex Regularization Functions [0.0]
線形ノルムバウンド制約の問題は、ポートフォリオ最適化、機械学習、機能選択など、さまざまなアプリケーションで発生する。本稿では,これらの問題をグローバルに解決するための新しいグラフベース手法を提案する。
論文参考訳（メタデータ） (2025-05-06T18:09:54Z)
Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints [49.76332265680669]
本稿では、目的関数と制約関数の両方が弱凸である問題の重要な部分集合について検討する。既存の手法では、収束速度の遅さや二重ループ設計への依存など、しばしば制限に直面している。これらの課題を克服するために,新しい単一ループペナルティに基づくアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-04-21T17:15:48Z)
Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文参考訳（メタデータ） (2024-09-07T19:52:14Z)
Globally-Optimal Greedy Experiment Selection for Active Sequential Estimation [1.1530723302736279]
逐次的に収集したデータの実験を適応的に選択するアクティブシーケンシャル推定の問題について検討する。目標は、より正確なモデル推定のための実験選択ルールを設計することである。そこで本稿では,グリーディ実験の選択手法のクラスを提案し,最大可能性の統計的解析を行う。
論文参考訳（メタデータ） (2024-02-13T17:09:29Z)
Adaptive Experimentation at Scale: A Computational Framework for Flexible Batches [7.390918770007728]
結果がバッチで測定される少数の実測を含む実例によって動機付けられ,適応駆動型実験フレームワークを開発した。我々の主な観察は、統計的推論において普遍的な正規近似は適応アルゴリズムの設計を導くことができることである。
論文参考訳（メタデータ） (2023-03-21T04:17:03Z)
Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文参考訳（メタデータ） (2022-09-15T07:22:58Z)
An Adaptive Incremental Gradient Method With Support for Non-Euclidean Norms [19.41328109094503]
そこで本研究では,SAGAアルゴリズムの適応型を新たにいくつか提案し,解析する。一般的な設定の下で収束保証を確立する。我々は、非ユークリッドノルムをサポートするためにSAGAの分析を改善した。
論文参考訳（メタデータ） (2022-04-28T09:43:07Z)
Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文参考訳（メタデータ） (2022-01-28T05:53:28Z)
Constrained multi-objective optimization of process design parameters in settings with scarce data: an application to adhesive bonding [48.7576911714538]
接着プロセスに最適なプロセスパラメータを見つけることは困難である。遺伝的アルゴリズムのような伝統的な進化的アプローチは、その問題を解決するのに不適である。本研究では,目的関数と制約関数をエミュレートするために,特定の機械学習手法をうまく応用した。
論文参考訳（メタデータ） (2021-12-16T10:14:39Z)
A Surrogate Objective Framework for Prediction+Optimization with Soft Constraints [29.962390392493507]
SPO+や直接最適化のような決定に焦点をあてた予測手法が、このギャップを埋めるために提案されている。本稿では,実世界の線形および半定値負の二次計画問題に対して,解析的に微分可能な主観的フレームワークを提案する。
論文参考訳（メタデータ） (2021-11-22T17:09:57Z)
On Constraints in First-Order Optimization: A View from Non-Smooth Dynamical Systems [99.59934203759754]
本稿では,スムーズな制約付き最適化のための一階法について紹介する。提案手法の2つの特徴は、実現可能な集合全体の投影や最適化が避けられることである。結果として得られるアルゴリズムの手順は、制約が非線形であっても簡単に実装できる。
論文参考訳（メタデータ） (2021-07-17T11:45:13Z)
SUPER-ADAM: Faster and Universal Framework of Adaptive Gradients [99.13839450032408]
一般的な問題を解決するための適応アルゴリズムのための普遍的な枠組みを設計することが望まれる。特に,本フレームワークは,非収束的設定支援の下で適応的手法を提供する。
論文参考訳（メタデータ） (2021-06-15T15:16:28Z)
Multiple Plans are Better than One: Diverse Stochastic Planning [26.887796946596243]
計画上の問題では、望ましい仕様を完全にモデル化することはしばしば困難です。特に、人間とロボットの相互作用において、そのような困難は、プライベートまたはモデルに複雑である人間の好みによって生じる可能性がある。我々は、最適に近い代表行動の集合を生成することを目的とした、多種多様な計画と呼ばれる問題を定式化する。
論文参考訳（メタデータ） (2020-12-31T07:29:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。