Fugu-MT 論文翻訳(概要): Active Learning in the Predict-then-Optimize Framework: A Margin-Based Approach

論文の概要: Active Learning in the Predict-then-Optimize Framework: A Margin-Based Approach

arxiv url: http://arxiv.org/abs/2305.06584v1
Date: Thu, 11 May 2023 05:44:36 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-12 15:48:20.031464
Title: Active Learning in the Predict-then-Optimize Framework: A Margin-Based Approach
Title（参考訳）: 予測最適化フレームワークにおけるアクティブラーニング:マージンに基づくアプローチ
Authors: Mo Liu, Paul Grigas, Heyuan Liu, Zuo-Jun Max Shen
Abstract要約: 本研究では,ラベルのないデータストリームから特徴サンプルのラベルを要求するかどうかを逐次決定する学習手法を開発した。我々の能動学習法は,予測パラメータによって引き起こされる決定誤差によって直接情報を得る最初の方法である。
参考スコア（独自算出の注目度）: 5.371816551086118
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We develop the first active learning method in the predict-then-optimize framework. Specifically, we develop a learning method that sequentially decides whether to request the "labels" of feature samples from an unlabeled data stream, where the labels correspond to the parameters of an optimization model for decision-making. Our active learning method is the first to be directly informed by the decision error induced by the predicted parameters, which is referred to as the Smart Predict-then-Optimize (SPO) loss. Motivated by the structure of the SPO loss, our algorithm adopts a margin-based criterion utilizing the concept of distance to degeneracy and minimizes a tractable surrogate of the SPO loss on the collected data. In particular, we develop an efficient active learning algorithm with both hard and soft rejection variants, each with theoretical excess risk (i.e., generalization) guarantees. We further derive bounds on the label complexity, which refers to the number of samples whose labels are acquired to achieve a desired small level of SPO risk. Under some natural low-noise conditions, we show that these bounds can be better than the naive supervised learning approach that labels all samples. Furthermore, when using the SPO+ loss function, a specialized surrogate of the SPO loss, we derive a significantly smaller label complexity under separability conditions. We also present numerical evidence showing the practical value of our proposed algorithms in the settings of personalized pricing and the shortest path problem.
Abstract（参考訳）: 予測最適化フレームワークにおいて,最初のアクティブラーニング手法を開発した。具体的には、ラベルのないデータストリームから特徴サンプルの「ラベル」を順次要求するかを判断する学習手法を開発し、ラベルは意思決定のための最適化モデルのパラメータに対応する。提案手法は, 予測パラメータによって引き起こされる決定誤差によって直接学習される最初の学習方法であり, spo(smart predict-then-optimize)損失と呼ばれる。提案アルゴリズムは,SPO損失の構造に触発され,縮退距離の概念を生かしたマージン基準を採用し,収集したデータに対するSPO損失のトラクタブルサロゲートを最小化する。特に、ハードとソフトの両方の拒絶変異を持つ効率的な能動学習アルゴリズムを開発し、それぞれが理論的過剰リスク(すなわち一般化)を保証する。さらに,SPOリスクの最小レベルを達成するためにラベルが取得されたサンプルの数を参照して,ラベル複雑性の限界を導出する。自然低雑音条件下では、これらの境界はすべてのサンプルをラベル付けするナイーブ教師付き学習アプローチよりも優れていることが示されている。さらに, SPO+損失関数(SPO+損失の特別なサロゲート)を用いると, 分離条件下でのラベルの複雑さが著しく小さくなる。また、パーソナライズされた価格設定と最短経路問題における提案アルゴリズムの実用的価値を示す数値的証拠を示す。

関連論文リスト

Probably Approximately Precision and Recall Learning [62.912015491907994]
精度とリコールは機械学習の基本的な指標である。一方的なフィードバック – トレーニング中にのみ肯定的な例が観察される – は,多くの実践的な問題に固有のものだ。 PAC学習フレームワークでは,各仮説をグラフで表現し,エッジは肯定的な相互作用を示す。
論文参考訳（メタデータ） (2024-11-20T04:21:07Z)
Offline RL via Feature-Occupancy Gradient Ascent [9.983014605039658]
大規模無限水平割引マルコフ決定過程(MDP)におけるオフライン強化学習の研究我々は,特徴占有空間における勾配上昇の形式を実行する新しいアルゴリズムを開発した。結果として得られた単純なアルゴリズムは、強い計算とサンプルの複雑さの保証を満たすことを示す。
論文参考訳（メタデータ） (2024-05-22T15:39:05Z)
Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文参考訳（メタデータ） (2024-01-18T08:12:23Z)
Easy Learning from Label Proportions [17.71834385754893]
Easyllpは、アグリゲーションラベルに基づいた、柔軟で簡単に実装可能なデバイアス方式である。我々の手法は、任意のモデルが個々のレベルで予想される損失を正確に見積もることができる。
論文参考訳（メタデータ） (2023-02-06T20:41:38Z)
Interpolation-based Contrastive Learning for Few-Label Semi-Supervised Learning [43.51182049644767]
半教師付き学習(SSL)は,ラベルが限定された強力なモデルを構築する上で,有効な手法であることが長年証明されてきた。摂動サンプルを元のものと類似した予測を強制する正規化に基づく手法が注目されている。本稿では,学習ネットワークの埋め込みを誘導し,サンプル間の線形変化を誘導する新たな対照的な損失を提案する。
論文参考訳（メタデータ） (2022-02-24T06:00:05Z)
Neural Active Learning with Performance Guarantees [37.16062387461106]
非パラメトリックなレシエーションにおけるストリーミング環境におけるアクティブラーニングの問題について検討する。我々は最近提案されたニューラル・タンジェント・カーネル(NTK)近似ツールを用いて、アルゴリズムが操作する特徴空間と学習したモデルを上から計算する適切なニューラル埋め込みを構築する。
論文参考訳（メタデータ） (2021-06-06T20:44:23Z)
Risk Minimization from Adaptively Collected Data: Guarantees for Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文参考訳（メタデータ） (2021-06-03T09:50:13Z)
RATT: Leveraging Unlabeled Data to Guarantee Generalization [96.08979093738024]
ラベルのないデータを利用して一般化境界を生成する手法を紹介します。境界が0-1経験的リスク最小化に有効であることを証明します。この作業は、見えないラベル付きデータが利用できない場合でも、ディープネットの一般化を証明するためのオプションを実践者に提供します。
論文参考訳（メタデータ） (2021-05-01T17:05:29Z)
Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文参考訳（メタデータ） (2020-12-18T19:03:40Z)
Adaptive Sampling for Best Policy Identification in Markov Decision Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。最先端アルゴリズムの利点を論じ、解説する。
論文参考訳（メタデータ） (2020-09-28T15:22:24Z)
Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文参考訳（メタデータ） (2020-07-08T08:48:56Z)
Gradient Descent in RKHS with Importance Labeling [58.79085525115987]
我々は重要ラベル付け問題について研究し、ラベルなしデータが多く与えられている。ラベルなしデータの情報サブセットを効果的に選択できる新しい重要ラベル方式を提案する。
論文参考訳（メタデータ） (2020-06-19T01:55:00Z)
Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文参考訳（メタデータ） (2020-02-19T08:35:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。