Fugu-MT 論文翻訳(概要): Efficient Learning for Selecting Top-m Context-Dependent Designs

論文の概要: Efficient Learning for Selecting Top-m Context-Dependent Designs

arxiv url: http://arxiv.org/abs/2305.04086v2
Date: Fri, 9 Jun 2023 17:11:50 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-12 17:08:36.307992
Title: Efficient Learning for Selecting Top-m Context-Dependent Designs
Title（参考訳）: トップmコンテキスト依存型設計の効率的な学習
Authors: Gongbo Zhang, Sihua Chen, Kuihua Huang, Yijie Peng
Abstract要約: 文脈に依存した意思決定のためのシミュレーション最適化問題を考察する。本研究では,各デザインの性能を各コンテキスト下で効率的に学習するためのシーケンシャルサンプリングポリシーを開発する。数値実験により,提案手法はトップmの文脈依存設計の選択効率を向上することを示した。
参考スコア（独自算出の注目度）: 0.7646713951724012
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider a simulation optimization problem for a context-dependent decision-making, which aims to determine the top-m designs for all contexts. Under a Bayesian framework, we formulate the optimal dynamic sampling decision as a stochastic dynamic programming problem, and develop a sequential sampling policy to efficiently learn the performance of each design under each context. The asymptotically optimal sampling ratios are derived to attain the optimal large deviations rate of the worst-case of probability of false selection. The proposed sampling policy is proved to be consistent and its asymptotic sampling ratios are asymptotically optimal. Numerical experiments demonstrate that the proposed method improves the efficiency for selection of top-m context-dependent designs.
Abstract（参考訳）: 我々は,すべての文脈におけるトップm設計を決定することを目的とした,文脈依存意思決定のためのシミュレーション最適化問題を考える。ベイズ・フレームワークの下で, 最適動的サンプリング決定を確率的動的プログラミング問題として定式化し, 各文脈における各設計の性能を効率的に学習するための逐次サンプリング・ポリシーを開発する。漸近的に最適なサンプリング比を求め、偽選択確率の最悪の場合の最適大きな偏差率を求める。提案手法は,漸近的サンプリング比が漸近的に最適であることを示す。数値実験により,提案手法はトップmの文脈依存設計の選択効率を向上することを示した。

関連論文リスト

How Sampling Shapes LLM Alignment: From One-Shot Optima to Iterative Dynamics [65.67654005892469]
適切なインスタンス依存サンプリングは、より強力なランキング保証を得られる一方で、スキュードオン政治サンプリングは、構造化された嗜好の下で過剰な濃度を誘導できることを示す。次に、学習したポリシーが将来のサンプリングおよび参照ポリシーにフィードバックする反復的なアライメントダイナミクスを分析する。我々の理論的な洞察は直接選好最適化にまで拡張され、我々が捉えた現象はより広範な選好アライメント手法に共通していることを示している。
論文参考訳（メタデータ） (2026-02-12T17:11:08Z)
Contextual Strongly Convex Simulation Optimization: Optimize then Predict with Inexact Solutions [0.9303501974597549]
我々は,強い凸シミュレーションの最適化について検討し,リアルタイム意思決定に最適なOTP(Optimize then predict)アプローチを採用する。中心となる理論的課題は、シミュレーション最適化アルゴリズムが生成する解が最適性ギャップにどのように影響するかを理解することである。
論文参考訳（メタデータ） (2025-12-06T03:47:29Z)
Extensions of regret-minimization algorithm for optimal design [3.4245017707416148]
本稿では, 最適設計問題の解法として, サーボ設計を導入した, 後悔の最小化フレームワークの拡張と応用について検討する。我々はこのフレームワークにエントロピー正則化器を組み込み、新しいサンプル選択目標と証明可能なサンプル境界複雑性をもたらす。アプリケーションとして,ラベル情報に頼らずに画像分類データセットから少数の代表サンプルを選択するために,本アルゴリズムを用いる。
論文参考訳（メタデータ） (2025-03-25T17:37:09Z)
An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。 2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文参考訳（メタデータ） (2024-09-04T14:36:20Z)
Differentiating Policies for Non-Myopic Bayesian Optimization [5.793371273485735]
本稿では,ロールアウト関数とその勾配を効率的に推定し,サンプリングポリシを実現する方法を示す。本稿では,ロールアウト関数とその勾配を効率的に推定し,サンプリングポリシを実現する方法について述べる。
論文参考訳（メタデータ） (2024-08-14T21:00:58Z)
Analyzing and Enhancing the Backward-Pass Convergence of Unrolled Optimization [50.38518771642365]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。この設定における中心的な課題は最適化問題の解によるバックプロパゲーションであり、しばしば閉形式を欠いている。本稿では, 非線形最適化の後方通過に関する理論的知見を提供し, 特定の反復法による線形システムの解と等価であることを示す。 Folded Optimizationと呼ばれるシステムが提案され、非ローリングなソルバ実装からより効率的なバックプロパゲーションルールを構築する。
論文参考訳（メタデータ） (2023-12-28T23:15:18Z)
Dual-Directed Algorithm Design for Efficient Pure Exploration [9.728332815218181]
我々は、最良腕識別を超えたトップ2のアプローチを拡張する純粋探索問題のための新しい設計原理を開発する。情報指向選択と組み合わせて、トップ2のトンプソンサンプリングがベストアーム識別に最適であることを示す。また,しきい値と$varepsilon$-best-arm識別のための最適なアルゴリズムも作成する。
論文参考訳（メタデータ） (2023-10-30T07:29:17Z)
Federated Conditional Stochastic Optimization [110.513884892319]
条件付き最適化は、不変学習タスク、AUPRC、AMLなど、幅広い機械学習タスクで見られる。本稿では,分散フェデレーション学習のためのアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-10-04T01:47:37Z)
Optimize-via-Predict: Realizing out-of-sample optimality in data-driven optimization [0.0]
本稿では,データ駆動最適化の定式化について検討する。我々は、規範的なソリューションを、そのようなデータセットを意思決定にマッピングする意思決定者ルールとして定義する。本稿では,このようなサンプル外最適解に対して,サンプリングアルゴリズムと2分割探索アルゴリズムを組み合わせることで効率よく解ける最適化問題を提案する。
論文参考訳（メタデータ） (2023-09-20T08:48:50Z)
Selection of the Most Probable Best [2.1095005405219815]
予測値ランキングと選択(R&S)問題では,すべてのk解のシミュレーション出力が,分布によって不確実性をモデル化可能な共通パラメータに依存する。我々は、最も確率の高い最適解 (MPB) を、分布に関して最適である確率が最も大きい解と定義する。最適化条件における未知の手段をその推定値に置き換えるアルゴリズムを考案し,シミュレーション予算が増加するにつれて,アルゴリズムのサンプリング比が条件を満たすことを証明した。
論文参考訳（メタデータ） (2022-07-15T15:27:27Z)
Adaptive Sampling Quasi-Newton Methods for Zeroth-Order Stochastic Optimization [1.7513645771137178]
勾配情報のない制約のない最適化問題を考察する。適応的なサンプリング準ニュートン法を提案し、共通乱数フレームワーク内の有限差を用いてシミュレーション関数の勾配を推定する。そこで本研究では, 標準試験と内積準ニュートン試験の修正版を開発し, 近似に使用する試料サイズを制御し, 最適解の近傍に大域収束結果を与える。
論文参考訳（メタデータ） (2021-09-24T21:49:25Z)
Outlier-Robust Sparse Estimation via Non-Convex Optimization [73.18654719887205]
空間的制約が存在する場合の高次元統計量と非破壊的最適化の関連について検討する。これらの問題に対する新規で簡単な最適化法を開発した。結論として、効率よくステーションに収束する一階法は、これらのタスクに対して効率的なアルゴリズムを導出する。
論文参考訳（メタデータ） (2021-09-23T17:38:24Z)
Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。局所探索のための政策勾配は、しばしばランダムな摂動から得られる。目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文参考訳（メタデータ） (2021-06-22T16:07:02Z)
Stochastic Optimization Forests [60.523606291705214]
標準的なランダムな森林アルゴリズムのように予測精度を向上させるために分割するのではなく、分割を選択した木を栽培し、下流の意思決定品質を直接最適化することで、森林決定政策の訓練方法を示す。概略分割基準は、各候補分割に対して正確に最適化された森林アルゴリズムに近い性能を保ちながら、100倍のランニング時間を短縮できることを示す。
論文参考訳（メタデータ） (2020-08-17T16:56:06Z)
Reactive Sample Size for Heuristic Search in Simulation-based Optimization [2.9005223064604073]
本稿では,パラメトリックテストとインディファレンスゾーン選択に基づく新しい反応性サンプルサイズアルゴリズムを提案する。テストでは、人工的なノイズレベルが拡張されたベンチマーク機能と、ホテルの収益管理のためのシミュレーションベースの最適化ツールが採用されている。
論文参考訳（メタデータ） (2020-05-25T14:38:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。