論文の概要: The Impact of Edge Displacement Vaserstein Distance on UD Parsing
Performance
- arxiv url: http://arxiv.org/abs/2209.07139v1
- Date: Thu, 15 Sep 2022 08:37:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-16 12:41:07.579492
- Title: The Impact of Edge Displacement Vaserstein Distance on UD Parsing
Performance
- Title(参考訳): エッジ変位Vaserstein距離がUD解析性能に及ぼす影響
- Authors: Mark Anderson, Carlos G\'omez-Rodr\'iguez
- Abstract要約: 本研究では,トレーニングデータとテストデータにおけるエッジ変位分布の違いを評価する。
そして、多くの統計的手法を用いて、この仮説を偽造しようと試みる。
より広い意味では、ここで提示される方法論は、NLPにおける将来の相関に基づく探索研究のリファレンスとして機能することができる。
- 参考スコア(独自算出の注目度): 3.7311680121118345
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We contribute to the discussion on parsing performance in NLP by introducing
a measurement that evaluates the differences between the distributions of edge
displacement (the directed distance of edges) seen in training and test data.
We hypothesize that this measurement will be related to differences observed in
parsing performance across treebanks. We motivate this by building upon
previous work and then attempt to falsify this hypothesis by using a number of
statistical methods. We establish that there is a statistical correlation
between this measurement and parsing performance even when controlling for
potential covariants. We then use this to establish a sampling technique that
gives us an adversarial and complementary split. This gives an idea of the
lower and upper bounds of parsing systems for a given treebank in lieu of
freshly sampled data. In a broader sense, the methodology presented here can
act as a reference for future correlation-based exploratory work in NLP.
- Abstract(参考訳): 我々は,NLPにおける解析性能に関する議論に,トレーニングデータとテストデータで見られるエッジ変位(エッジの方向距離)の分布の差異を評価する尺度を導入して貢献する。
この測定は,木バンク間の解析性能の違いに関係していると考えられる。
我々は、過去の研究に基づいてこれを動機付け、その後、多くの統計的手法を用いてこの仮説を偽造しようと試みる。
この測定値と解析性能の間には,共変の可能性を制御しても統計的に相関があることが確認できた。
次に、これを使って、対角的かつ相補的な分割を与えるサンプリング手法を確立します。
これにより、サンプルデータの代わりに与えられた木々バンクに対する解析システムの下限と上限を考えることができる。
より広い意味では、ここで提示される方法論は、NLPにおける将来の相関に基づく探索研究の参考となることができる。
関連論文リスト
- Rethinking Distance Metrics for Counterfactual Explainability [53.436414009687]
本研究では, 反事実を参照領域から独立して引き出すのではなく, 基礎となるデータ分布からの参照と共同してサンプリングする, 反事実生成手法のフレーミングについて検討する。
我々は、幅広い設定に適用可能な、反ファクト的な類似性のために調整された距離メートル法を導出する。
論文 参考訳(メタデータ) (2024-10-18T15:06:50Z) - Combine and Conquer: A Meta-Analysis on Data Shift and Out-of-Distribution Detection [30.377446496559635]
本稿では,アウト・オブ・ディストリビューション(OOD)検出スコアをシームレスに組み合わせるための普遍的アプローチを提案する。
我々のフレームワークは、検出スコアにおける将来の発展にとって容易であり、この文脈で意思決定境界を結合する最初の手段である。
論文 参考訳(メタデータ) (2024-06-23T08:16:44Z) - Efficient Epistemic Uncertainty Estimation in Regression Ensemble Models
Using Pairwise-Distance Estimators [21.098866735156207]
ペアワイズ距離推定器(PaiDEs)はエントロピー上の境界を確立する。
サンプルベースのモンテカルロ推定器とは異なり、PaiDEは最大100倍の速度でてんかんの不確実性を推定する顕著な能力を示す。
我々は,既存の能動学習手法と比較し,高次元回帰タスクにおいて,我々のアプローチが優れていることを見出した。
論文 参考訳(メタデータ) (2023-08-25T17:13:42Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Efficient Data-Dependent Learnability [8.766022970635898]
予測正規化最大可能性(pNML)アプローチは、最近、バッチ学習問題に対する min-max 最適解として提案されている。
ニューラルネットワークに適用すると、この近似が分散外例を効果的に検出できることが示される。
論文 参考訳(メタデータ) (2020-11-20T10:44:55Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Almost-Matching-Exactly for Treatment Effect Estimation under Network
Interference [73.23326654892963]
本研究では,観測ネットワーク上でユニットが接続されたランダム化実験から直接処理効果を回復するマッチング手法を提案する。
本手法は, 近傍グラフ内の一意部分グラフの個数にほぼ一致する。
論文 参考訳(メタデータ) (2020-03-02T15:21:20Z) - An end-to-end approach for the verification problem: learning the right
distance [15.553424028461885]
パラメトリックな擬似距離を導入し、エンコーダと共同で学習することで、メトリック学習の設定を強化する。
まず、仮説テストに使用できる確率比を近似して示す。
提案手法では,実際の距離を持つメートル法学習に比べて,学習の簡易化が図られている。
論文 参考訳(メタデータ) (2020-02-21T18:46:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。