論文の概要: Unbiased and Efficient Sampling of Dependency Trees
- arxiv url: http://arxiv.org/abs/2205.12621v1
- Date: Wed, 25 May 2022 09:57:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-27 03:47:21.296170
- Title: Unbiased and Efficient Sampling of Dependency Trees
- Title(参考訳): 依存木の不偏性と効率的なサンプリング
- Authors: Milo\v{s} Stanojevi\'c
- Abstract要約: ほとんどのツリーバンクは、すべての有効な依存ツリーがROOTノードから出てくる単一のエッジを持つ必要がある。
Zmigrodらは最近、単一ルート依存ツリーの分布から置き換えることなくサンプリングするアルゴリズムを提案している。
我々は、Wilson-RCを置換したサンプリングアルゴリズムが実際にバイアスを受けていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distributions over spanning trees are the most common way of computational
modeling of dependency syntax. However, most treebanks require that every valid
dependency tree has a single edge coming out of the ROOT node, a constraint
that is not part of the definition of spanning trees. For this reason all
standard inference algorithms for spanning trees are sub-optimal for modeling
dependency trees.
Zmigrod et al. (2021b) have recently proposed algorithms for sampling with
and without replacement from the single-root dependency tree distribution. In
this paper we show that their fastest algorithm for sampling with replacement,
Wilson-RC, is in fact producing biased samples and we provide two alternatives
that are unbiased. Additionally, we propose two algorithms (one incremental,
one parallel) that reduce the asymptotic runtime of their algorithm for
sampling $k$ trees without replacement to $\mathcal{O}(kn^3)$. These algorithms
are both asymptotically and practically more efficient.
- Abstract(参考訳): ツリーにまたがる分布は、依存構文の計算モデリングの最も一般的な方法である。
しかし、ほとんどのツリーバンクは、すべての有効な依存ツリーがROOTノードから出てくる単一のエッジを持つ必要がある。
そのため、すべての標準推論アルゴリズムは依存木をモデリングするのに最適である。
zmigrod et al. (2021b) は、最近、単一ルート依存木分布の置き換えなしにサンプリングするアルゴリズムを提案した。
本稿では,Wilson-RCを用いたサンプリングアルゴリズムが,実際にバイアスのあるサンプルを生成しており,バイアスのない2つの代替手段を提案する。
さらに、$k$ツリーを$\mathcal{O}(kn^3)$に置き換えることなくサンプリングするために、アルゴリズムの漸近ランタイムを減少させる2つのアルゴリズム(インクリメンタル、並列)を提案する。
これらのアルゴリズムは漸近的にも実用的にも効率的である。
関連論文リスト
- On Computing Optimal Tree Ensembles [7.424944196676223]
ランダム林や、より一般的には(決定ノブレイクダッシュ-)ツリーアンサンブルは、分類と回帰の方法として広く使われている。
最近のアルゴリズムの進歩は、そのサイズや深さなどの様々な測定に最適な決定木を計算することができる。
2つの新しいアルゴリズムと対応する下位境界を提供する。
論文 参考訳(メタデータ) (2023-06-07T13:30:43Z) - SoftTreeMax: Policy Gradient with Tree Search [72.9513807133171]
我々は、ツリー検索をポリシー勾配に統合する最初のアプローチであるSoftTreeMaxを紹介します。
Atariでは、SoftTreeMaxが分散PPOと比較して、実行時のパフォーマンスを最大5倍向上させる。
論文 参考訳(メタデータ) (2022-09-28T09:55:47Z) - bsnsing: A decision tree induction method based on recursive optimal
boolean rule composition [2.28438857884398]
本稿では,決定木帰納過程における分割規則選択を最適化するMIP(Mixed-integer Programming)の定式化を提案する。
商用の解法よりも高速に実例を解くことができる効率的な探索解法を開発した。
論文 参考訳(メタデータ) (2022-05-30T17:13:57Z) - Active-LATHE: An Active Learning Algorithm for Boosting the Error
Exponent for Learning Homogeneous Ising Trees [75.93186954061943]
我々は、$rho$が少なくとも0.8$である場合に、エラー指数を少なくとも40%向上させるアルゴリズムを設計し、分析する。
我々の分析は、グラフの一部により多くのデータを割り当てるために、微小だが検出可能なサンプルの統計的変動を巧みに活用することに基づいている。
論文 参考訳(メタデータ) (2021-10-27T10:45:21Z) - Efficient Sampling of Dependency Structures [39.5549669100436]
ルート制約を受けるグラフから依存木を忠実にサンプリングするために、2つのスパンニングツリーサンプリングアルゴリズムを適用する。
我々はColbournのアルゴリズムに基づいて、$mathcalO(K N3 + K2 N)$ timeで置き換えることなく$K$木をサンプリングできる新しい拡張を示す。
論文 参考訳(メタデータ) (2021-09-14T08:33:12Z) - Robustifying Algorithms of Learning Latent Trees with Vector Variables [92.18777020401484]
Recursive Grouping (RG) と Chow-Liu Recursive Grouping (CLRG) のサンプル複雑性について述べる。
RG,CLRG,Neighbor Joining (NJ) およびSpectral NJ (SNJ) をトラッピングした内積を用いて強化する。
我々は、潜在木の構造学習において、最初の既知のインスタンス依存の不合理性の結果を導出する。
論文 参考訳(メタデータ) (2021-06-02T01:37:52Z) - On Finding the $K$-best Non-projective Dependency Trees [39.5549669100436]
我々はCamerini et al. (1980) の$K$-bestスパンニングツリーアルゴリズムを単純化する。
ルート制約を受けるグラフの$K$-best依存木を復号するアルゴリズムを新たに拡張する。
論文 参考訳(メタデータ) (2021-06-01T20:23:41Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - SGA: A Robust Algorithm for Partial Recovery of Tree-Structured
Graphical Models with Noisy Samples [75.32013242448151]
ノードからの観測が独立しているが非識別的に分散ノイズによって破損した場合、Ising Treeモデルの学習を検討する。
Katiyarら。
(2020) は, 正確な木構造は復元できないが, 部分木構造を復元できることを示した。
統計的に堅牢な部分木回復アルゴリズムであるSymmetrized Geometric Averaging(SGA)を提案する。
論文 参考訳(メタデータ) (2021-01-22T01:57:35Z) - An Efficient Adversarial Attack for Tree Ensembles [91.05779257472675]
傾斜促進決定木(DT)や無作為林(RF)などの木に基づくアンサンブルに対する敵対的攻撃
提案手法は,従来のMILP (Mixed-integer linear programming) よりも数千倍高速であることを示す。
私たちのコードはhttps://chong-z/tree-ensemble- attackで利用可能です。
論文 参考訳(メタデータ) (2020-10-22T10:59:49Z) - Efficient Computation of Expectations under Spanning Tree Distributions [67.71280539312536]
本稿では,エッジファクター,非プロジェクティブ・スパンニングツリーモデルにおいて,一階期待と二階期待の重要なケースに対する統一アルゴリズムを提案する。
我々のアルゴリズムは勾配と期待の基本的な関係を利用しており、効率的なアルゴリズムを導出することができる。
論文 参考訳(メタデータ) (2020-08-29T14:58:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。