論文の概要: The Fragility of Multi-Treebank Parsing Evaluation
- arxiv url: http://arxiv.org/abs/2209.06699v1
- Date: Wed, 14 Sep 2022 15:07:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:21:17.185111
- Title: The Fragility of Multi-Treebank Parsing Evaluation
- Title(参考訳): マルチツリーバンク解析評価のフレーバビリティ
- Authors: Iago Alonso-Alonso, David Vilares, Carlos G\'omez-Rodr\'iguez
- Abstract要約: 本稿では,木バンクの1つのサブセットを評価することで,弱い結論を導き出す方法について検討する。
優れた木バンク選択のためのガイドラインを確立することは難しいが、潜在的に有害な戦略を検出することは可能である。
- 参考スコア(独自算出の注目度): 10.355938901584567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Treebank selection for parsing evaluation and the spurious effects that might
arise from a biased choice have not been explored in detail. This paper studies
how evaluating on a single subset of treebanks can lead to weak conclusions.
First, we take a few contrasting parsers, and run them on subsets of treebanks
proposed in previous work, whose use was justified (or not) on criteria such as
typology or data scarcity. Second, we run a large-scale version of this
experiment, create vast amounts of random subsets of treebanks, and compare on
them many parsers whose scores are available. The results show substantial
variability across subsets and that although establishing guidelines for good
treebank selection is hard, it is possible to detect potentially harmful
strategies.
- Abstract(参考訳): パース評価のためのツリーバンクの選択と偏りのある選択から生じるスプリアス効果については、詳細は検討されていない。
本稿では,木々バンクの単一部分集合に対する評価が弱結論にどのようにつながるかを考察する。
まず、いくつかの対照的なパーサーを取り、それらを以前の研究で提案されたツリーバンクのサブセットで実行します。
第2に、この実験の大規模バージョンを実行し、大量の木バンクのランダムなサブセットを作成し、スコアが利用可能なパーサーを多く比較する。
その結果, 木バンク選択に関するガイドラインの確立は困難であるが, 潜在的に有害な戦略を検出することは可能であることがわかった。
関連論文リスト
- Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。
DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。
非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文 参考訳(メタデータ) (2024-08-21T05:09:53Z) - Boosting-Based Sequential Meta-Tree Ensemble Construction for Improved
Decision Trees [1.8749305679160366]
決定木は、機械学習分野における最も一般的なアプローチの1つである。
近年,過度に深化した木による過剰適合の問題を解決するために,メタツリーが提案されている。
メタツリーはベイズ決定理論に基づく統計的最適性を保証する。
論文 参考訳(メタデータ) (2024-02-09T13:08:21Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Why do Random Forests Work? Understanding Tree Ensembles as
Self-Regularizing Adaptive Smoothers [68.76846801719095]
統計学で広く普及している偏りと分散還元に対する現在の高次二分法は、木のアンサンブルを理解するには不十分である、と我々は主張する。
森林は、通常暗黙的に絡み合っている3つの異なるメカニズムによって、樹木を改良できることを示す。
論文 参考訳(メタデータ) (2024-02-02T15:36:43Z) - Bayesian Decision Trees via Tractable Priors and Probabilistic
Context-Free Grammars [7.259767735431625]
ベイズ決定木を学習するための新しい基準を提案する。
BCART-PCFGは、データから得られる木々間の後部分布から決定木を効率的にサンプリングすることができる。
BCART-PCFGで採取した木は、優雅に構築された決定木に匹敵する性能を示した。
論文 参考訳(メタデータ) (2023-02-15T00:17:41Z) - Subgroup Robustness Grows On Trees: An Empirical Baseline Investigation [13.458414200958797]
本稿は,最先端のツリーベース手法と並行して,公正で堅牢な学習手法を実証的に比較する。
木に基づく手法は, 頑健性および公正性向上法と比較して, 強い部分群ロバスト性を有することを示す。
論文 参考訳(メタデータ) (2022-11-23T04:49:18Z) - Regularized impurity reduction: Accurate decision trees with complexity
guarantees [20.170305081348328]
本稿では,木複雑性の対数近似を保証する木推論アルゴリズムを提案する。
改良されたアルゴリズムは予測精度と木の複雑さのバランスが良好である。
論文 参考訳(メタデータ) (2022-08-23T13:15:19Z) - Contextual Decision Trees [62.997667081978825]
学習アンサンブルの1つの浅い木を特徴量ベースで選択するための,マルチアームのコンテキスト付きバンドレコメンデーションフレームワークを提案する。
トレーニングされたシステムはランダムフォレスト上で動作し、最終的な出力を提供するためのベース予測器を動的に識別する。
論文 参考訳(メタデータ) (2022-07-13T17:05:08Z) - Connecting Interpretability and Robustness in Decision Trees through
Separation [24.718895656168144]
決定木とロバスト性を用いた解釈を$l_infty$-分離に焦点をあてる。
決定木におけるロバスト性,解釈可能性,精度の両立を保証できる最初のアルゴリズムを提供する。
実験により,本アルゴリズムは,解釈可能でロバストで高精度な分類器を生成できることを確認した。
論文 参考訳(メタデータ) (2021-02-14T02:08:01Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z) - Convolution-Weight-Distribution Assumption: Rethinking the Criteria of
Channel Pruning [90.2947802490534]
刈り取り基準の研究には2つの盲点がある。
フィルタのランク'Importance Score'はほぼ同じで、同様に刈り取られた構造になる。
いくつかのプルーニング基準で測定されたフィルタ'Importance Score'は、ネットワークの冗長性をよく区別するには近すぎる。
論文 参考訳(メタデータ) (2020-04-24T09:54:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。