論文の概要: Consistent Structured Prediction with Max-Min Margin Markov Networks
- arxiv url: http://arxiv.org/abs/2007.01012v2
- Date: Mon, 27 Jul 2020 18:24:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 13:15:24.676649
- Title: Consistent Structured Prediction with Max-Min Margin Markov Networks
- Title(参考訳): 最大マージンマルコフネットワークを用いた一貫した構造化予測
- Authors: Alex Nowak-Vila, Francis Bach, Alessandro Rudi
- Abstract要約: 二項分類のためのマックスマージン法は、最大マージンマルコフネットワーク(M3N$)の名前で構造化予測設定まで拡張されている。
我々は、学習問題を"max-min"マージンの定式化で定義し、結果のメソッドmax-minマージンマルコフネットワーク(M4N$)を命名することで、そのような制限を克服する。
マルチクラス分類,順序回帰,シーケンス予測,ランキング実験により,提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 84.60515484036239
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Max-margin methods for binary classification such as the support vector
machine (SVM) have been extended to the structured prediction setting under the
name of max-margin Markov networks ($M^3N$), or more generally structural SVMs.
Unfortunately, these methods are statistically inconsistent when the
relationship between inputs and labels is far from deterministic. We overcome
such limitations by defining the learning problem in terms of a "max-min"
margin formulation, naming the resulting method max-min margin Markov networks
($M^4N$). We prove consistency and finite sample generalization bounds for
$M^4N$ and provide an explicit algorithm to compute the estimator. The
algorithm achieves a generalization error of $O(1/\sqrt{n})$ for a total cost
of $O(n)$ projection-oracle calls (which have at most the same cost as the
max-oracle from $M^3N$). Experiments on multi-class classification, ordinal
regression, sequence prediction and ranking demonstrate the effectiveness of
the proposed method.
- Abstract(参考訳): サポートベクトルマシン(SVM)のようなバイナリ分類のためのマックスマージン法は、最大マージンマルコフネットワーク(M^3N$)またはより一般に構造的なSVMの名前で構造化予測設定に拡張されている。
残念ながら、これらの手法は、入力とラベルの関係が決定論的ではない場合に統計的に矛盾する。
このような制限を克服するために、学習問題を"max-min"マージン定式化で定義し、max-min margin markov networks (m^4n$) と命名する。
我々は、m^4n$ に対する一貫性と有限サンプル一般化境界を証明し、推定値を計算するための明示的なアルゴリズムを提供する。
このアルゴリズムは、$o(1/\sqrt{n})$の一般化エラーを、$o(n)$のプロジェクションoracleコール(max-oracleと同じコストが$m^3n$である)の合計コストで達成する。
マルチクラス分類,順序回帰,シーケンス予測,ランキング実験により,提案手法の有効性が示された。
関連論文リスト
- Inverting the Leverage Score Gradient: An Efficient Approximate Newton Method [10.742859956268655]
本稿では,レバレッジスコア勾配から固有モデルパラメータを復元することを目的とする。
具体的には、レバレッジスコア勾配の逆転を$g(x)$として精査する。
論文 参考訳(メタデータ) (2024-08-21T01:39:42Z) - MGDA Converges under Generalized Smoothness, Provably [27.87166415148172]
多目的最適化(MOO)はマルチタスク学習など様々な分野で注目を集めている。
最近の研究は、理論解析を伴う効果的なアルゴリズムを提供しているが、それらは標準の$L$-smoothあるいは有界勾配仮定によって制限されている。
一般化された$ell$-smooth損失関数のより一般的で現実的なクラスについて研究し、$ell$は勾配ノルムの一般非減少関数である。
論文 参考訳(メタデータ) (2024-05-29T18:36:59Z) - Sample-efficient Learning of Infinite-horizon Average-reward MDPs with General Function Approximation [53.17668583030862]
一般関数近似の文脈において,無限水平平均逆マルコフ決定過程(AMDP)について検討する。
最適化最適化(LOOP)と呼ばれる新しいアルゴリズムフレームワークを提案する。
我々は LOOP がサブ線形 $tildemathcalO(mathrmpoly(d, mathrmsp(V*)) sqrtTbeta )$ regret を達成することを示す。
論文 参考訳(メタデータ) (2024-04-19T06:24:22Z) - Universality of max-margin classifiers [10.797131009370219]
非ガウス的特徴に対する誤分類誤差の高次元普遍性と大域化写像の役割について検討する。
特に、オーバーパラメトリゼーションしきい値と一般化誤差はより単純なモデルで計算できる。
論文 参考訳(メタデータ) (2023-09-29T22:45:56Z) - Kernel Support Vector Machine Classifiers with the $\ell_0$-Norm Hinge
Loss [3.007949058551534]
Support Vector Machine (SVM)は、バイナリ分類問題において最も成功した機械学習技術の1つである。
本論文は, ヒンジ損失を持つベクトル($ell$-KSVM)に集中し, ヒンジ損失と$ell_$normの複合関数である。
合成データセットと実データセットの実験は、$ell_$-KSVMが標準のKSVMと同等の精度を達成可能であることを示すために照らされている。
論文 参考訳(メタデータ) (2023-06-24T14:52:44Z) - Differentially-Private Hierarchical Clustering with Provable
Approximation Guarantees [79.59010418610625]
階層クラスタリングのための微分プライベート近似アルゴリズムについて検討する。
例えば、$epsilon$-DPアルゴリズムは入力データセットに対して$O(|V|2/epsilon)$-additiveエラーを示さなければならない。
本稿では,ブロックを正確に復元する1+o(1)$近似アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-31T19:14:30Z) - Best Policy Identification in Linear MDPs [70.57916977441262]
縮退した線形マルコフ+デルタ決定における最適同定問題について, 生成モデルに基づく固定信頼度設定における検討を行った。
複雑な非最適化プログラムの解としての下位境界は、そのようなアルゴリズムを考案する出発点として用いられる。
論文 参考訳(メタデータ) (2022-08-11T04:12:50Z) - Optimal and instance-dependent guarantees for Markovian linear stochastic approximation [47.912511426974376]
標準スキームの最後の繰り返しの2乗誤差に対して、$t_mathrmmix tfracdn$の非漸近境界を示す。
マルコフ雑音による政策評価について,これらの結果のまとめを導出する。
論文 参考訳(メタデータ) (2021-12-23T18:47:50Z) - Clustering Mixture Models in Almost-Linear Time via List-Decodable Mean
Estimation [58.24280149662003]
本稿では,データセットの大部分を敵が破壊できるリストデコタブル平均推定の問題について検討する。
我々は、ほぼ最適な統計的保証を達成するために、リストデコダブル平均推定のための新しいアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-16T03:34:14Z) - Byzantine-Resilient Non-Convex Stochastic Gradient Descent [61.6382287971982]
敵対的レジリエントな分散最適化。
機械は独立して勾配を計算し 協力することができます
私達のアルゴリズムは新しい集中の技術およびサンプル複雑性に基づいています。
それは非常に実用的です:それはないときすべての前の方法の性能を改善します。
セッティングマシンがあります。
論文 参考訳(メタデータ) (2020-12-28T17:19:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。