Fugu-MT 論文翻訳(概要): Nested Elimination: A Simple Algorithm for Best-Item Identification from Choice-Based Feedback

論文の概要: Nested Elimination: A Simple Algorithm for Best-Item Identification from Choice-Based Feedback

arxiv url: http://arxiv.org/abs/2307.09295v1
Date: Thu, 13 Jul 2023 05:05:30 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-23 12:06:44.620134
Title: Nested Elimination: A Simple Algorithm for Best-Item Identification from Choice-Based Feedback
Title（参考訳）: Nested Elimination: 選択に基づくフィードバックからのベスト項目識別のための簡易アルゴリズム
Authors: Junwen Yang, Yifan Feng
Abstract要約: 選択に基づくフィードバックから最良項目識別の問題について検討する。この問題において、企業は、顧客集団に順次かつ適応的に表示セットを表示し、その選択を収集する。情報理論の下界にインスパイアされたネスト構造にインスパイアされた,除去に基づくアルゴリズムNested Elimination(NE)を提案する。
参考スコア（独自算出の注目度）: 8.043586007062858
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We study the problem of best-item identification from choice-based feedback. In this problem, a company sequentially and adaptively shows display sets to a population of customers and collects their choices. The objective is to identify the most preferred item with the least number of samples and at a high confidence level. We propose an elimination-based algorithm, namely Nested Elimination (NE), which is inspired by the nested structure implied by the information-theoretic lower bound. NE is simple in structure, easy to implement, and has a strong theoretical guarantee for sample complexity. Specifically, NE utilizes an innovative elimination criterion and circumvents the need to solve any complex combinatorial optimization problem. We provide an instance-specific and non-asymptotic bound on the expected sample complexity of NE. We also show NE achieves high-order worst-case asymptotic optimality. Finally, numerical experiments from both synthetic and real data corroborate our theoretical findings.
Abstract（参考訳）: 選択に基づくフィードバックから最良項目識別の問題を検討する。この問題において、企業は顧客集団に表示セットを順次かつ適応的に表示し、選択を収集する。その目的は、最少のサンプル数と高い信頼度で、最も好ましいアイテムを特定することである。本稿では,情報理論下界に暗示されるネスト構造に触発された除去に基づくアルゴリズムであるネスト除去(ne)を提案する。 NEは構造がシンプルで実装が容易で、サンプルの複雑さに対する理論的な保証が強い。具体的には、NEは革新的な除去基準を利用し、複雑な組合せ最適化問題の解決を回避している。 ne のサンプル複雑性に対するインスタンス固有かつ非漸近的境界を提供する。また、NEは高次最悪の漸近的最適性を達成することを示す。最後に、合成データと実データの両方による数値実験は、我々の理論的知見を裏付けるものである。

関連論文リスト

Neural Tractability via Structure: Learning-Augmented Algorithms for Graph Combinatorial Optimization [11.239052168345301]
本稿では,ニューラルネットワークの推論効率と探索力と,探索に基づくアルゴリズムの解品質保証とを組み合わせた新しいフレームワークを提案する。我々のフレームワークはニューラルモデルの選択に非依存であり、ニューラルソルバ単独よりも厳密に優れたソリューションを生成する。
論文参考訳（メタデータ） (2025-11-24T17:51:42Z)
Evaluation of Multi- and Single-objective Learning Algorithms for Imbalanced Data [0.0]
機械学習タスクは、単体ではなく、しばしば反対する一連の基準のためにうまく機能するモデルを見つけることを目的としている。 1つの解決策は、集合的学習基準を提案し、多目的学習課題を単一基準最適化問題に還元することである。本稿では,単一解を返す手法を用いた多目的アルゴリズムに基づく,新しい信頼性の高いアルゴリズム評価手法を提案する。
論文参考訳（メタデータ） (2025-11-15T12:54:17Z)
Greedy Selection under Independent Increments: A Toy Model Analysis [0.0]
独立増分を伴うN-d-離散時間過程に対する反復選択問題について検討する。最終値プロセスを選択するための最適戦略は,各段階で最大グリーディ選択を適用することである。
論文参考訳（メタデータ） (2025-06-22T08:21:23Z)
Optimal Decision Tree and Adaptive Submodular Ranking with Noisy Outcomes [9.321976218862542]
プールベースのアクティブラーニングでは、学習者にラベルのないデータセットが与えられ、データポイントのラベルをクエリすることで未知の仮説を効率的に学習することを目的としている。これは古典的最適決定木(ODT)問題として定式化できる: テストのセット、仮説のセット、各テストと仮説に対する結果が与えられた場合、我々の目標は、真の仮説を識別する低コストなテスト手順(すなわち決定木)を見つけることである。本研究では,ODT問題の基本的変種について検討し,実験結果がうるさい場合,さらに一般的な場合であっても検討する。
論文参考訳（メタデータ） (2023-12-23T21:47:50Z)
Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-12-08T16:06:29Z)
Dual-Directed Algorithm Design for Efficient Pure Exploration [9.728332815218181]
有限組の代替品を用いた逐次適応実験の文脈における純粋探索問題を考える。固定予算, 固定信頼度, 後収束率設定に対する最大最適化問題として問題複雑性尺度を定式化する。我々のアルゴリズムは、$varepsilon$-best-armの識別(または、良好な選択保証の確率でランク付けと選択)としきい値の帯域幅で最適性を得る。
論文参考訳（メタデータ） (2023-10-30T07:29:17Z)
Faster Stochastic Variance Reduction Methods for Compositional MiniMax Optimization [50.10952609321302]
合成ミニマックス最適化は、さまざまな機械学習領域において重要な課題である。構成最小最適化の現在の方法は、最適以下の複雑さや、大きなバッチサイズに大きく依存することによって悩まされている。本稿では,Nested STOchastic Recursive Momentum (NSTORM)と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2023-08-18T14:57:21Z)
Debiasing Conditional Stochastic Optimization [15.901623717313493]
本稿では,ポートフォリオ選択や強化学習,堅牢な学習など,さまざまな応用をカバーする条件因果最適化(CSO)問題について検討する。有限変量変量CSO問題に対する新しいアルゴリズムを開発し、既存の結果を大幅に改善する。我々は,本手法が他の最適化問題と同様の課題に対処するための有用なツールとなる可能性があると考えている。
論文参考訳（メタデータ） (2023-04-20T19:19:55Z)
Symmetric Tensor Networks for Generative Modeling and Constrained Combinatorial Optimization [72.41480594026815]
ポートフォリオ最適化からロジスティクスに至るまで、制約付き最適化問題は業界に多い。これらの問題の解決における主要な障害の1つは、有効な検索空間を制限する非自明なハード制約の存在である。本研究では、Ax=bという形の任意の整数値等式制約をU(1)対称ネットワーク(TN)に直接エンコードし、それらの適用性を量子に着想を得た生成モデルとして活用する。
論文参考訳（メタデータ） (2022-11-16T18:59:54Z)
Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文参考訳（メタデータ） (2022-02-09T06:05:05Z)
Recursive Causal Structure Learning in the Presence of Latent Variables and Selection Bias [27.06618125828978]
本稿では,潜伏変数と選択バイアスの存在下での観測データからシステムの因果MAGを学習する問題を考察する。本稿では,音と完全性を備えた計算効率のよい制約ベースの新しい手法を提案する。提案手法と人工と実世界の両方の構造に関する技術の現状を比較した実験結果を提供する。
論文参考訳（メタデータ） (2021-10-22T19:49:59Z)
Generalization of Neural Combinatorial Solvers Through the Lens of Adversarial Robustness [68.97830259849086]
ほとんどのデータセットは単純なサブプロブレムのみをキャプチャし、おそらくは突発的な特徴に悩まされる。本研究では, 局所的な一般化特性である対向ロバスト性について検討し, 厳密でモデル固有な例と突発的な特徴を明らかにする。他のアプリケーションとは異なり、摂動モデルは知覚できないという主観的な概念に基づいて設計されているため、摂動モデルは効率的かつ健全である。驚くべきことに、そのような摂動によって、十分に表現力のあるニューラルソルバは、教師あり学習で共通する正確さと悪質さのトレードオフの限界に悩まされない。
論文参考訳（メタデータ） (2021-10-21T07:28:11Z)
Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。局所探索のための政策勾配は、しばしばランダムな摂動から得られる。目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文参考訳（メタデータ） (2021-06-22T16:07:02Z)
Online Model Selection for Reinforcement Learning with Function Approximation [50.008542459050155]
我々は、$tildeO(L5/6 T2/3)$ regretで最適な複雑性に適応するメタアルゴリズムを提案する。また、メタアルゴリズムは、インスタンス依存の後悔境界を著しく改善することを示す。
論文参考訳（メタデータ） (2020-11-19T10:00:54Z)
Adaptive Sampling for Best Policy Identification in Markov Decision Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。最先端アルゴリズムの利点を論じ、解説する。
論文参考訳（メタデータ） (2020-09-28T15:22:24Z)
Bloom Origami Assays: Practical Group Testing [90.2899558237778]
グループテストは、いくつかの魅力的なソリューションでよく研究されている問題である。近年の生物学的研究は、従来の方法と相容れない新型コロナウイルスの実践的な制約を課している。我々は,Bloomフィルタと信条伝搬を組み合わせた新しい手法を開発し,n(100以上)の大きい値に拡張し,良好な経験的結果を得る。
論文参考訳（メタデータ） (2020-07-21T19:31:41Z)
Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文参考訳（メタデータ） (2020-02-26T16:19:09Z)
Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。最小クラスタ回復誤差率のアルゴリズムを考案する。適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文参考訳（メタデータ） (2019-10-14T09:18:26Z)
The Simulator: Understanding Adaptive Sampling in the Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文参考訳（メタデータ） (2017-02-16T23:42:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。