論文の概要: Better heads do not guarantee better binarized constituency parsing
- arxiv url: http://arxiv.org/abs/2605.28131v1
- Date: Wed, 27 May 2026 08:19:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.882362
- Title: Better heads do not guarantee better binarized constituency parsing
- Title(参考訳): より良い頭はより良い二項化選挙区解析を保証しない
- Authors: Zeyao Qi, Yige Chen, Eitan Klinger, Vivaan Wadhwa, Jungyeul Park,
- Abstract要約: 本稿では, 句読点を意識した二項化法について再検討する。
依存関係による重み付けがバイナリ固有の監視を改善するかどうかを問う。
- 参考スコア(独自算出の注目度): 6.168255793525906
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We revisit punctuation-aware tree binarization for constituency parsing and ask whether dependency-induced headedness improves binary parser supervision. Although learned heads substantially outperform rule-based heads in intrinsic head prediction, they do not yield consistent parsing gains after debinarization. In particular, punctuation-conditioned evaluation shows that learned headedness underperforms rule-based binarization in macro-average punctuation-sensitive $F_1$, despite a small overall gain on CTB. Similar instability appears under cross-treebank transfer. These results suggest that \ycc{linguistically grounded} headedness is not necessarily parser-optimal when used as a binarization control signal. The paper presents a negative result: better head prediction does not imply better punctuation-sensitive constituency parsing.
- Abstract(参考訳): 句読点を意識した木バイナライゼーションを再検討し,依存関係による重み付けがバイナリパーサの監督を改善するかどうかを問う。
学習した頭部は本質的な頭部予測において規則に基づく頭部よりもかなり優れているが、分枝後の一貫した解析利得は得られない。
特に, 句読点条件による評価では, CTBの全体的な増加は小さいものの, 平均句読点感度$F_1$では, 規則に基づく二項化が不十分であることが示唆された。
同様の不安定性はクロスツリーバンク・トランスファーに現れる。
これらの結果から,二項化制御信号として使用する場合, <ycc{linguistically grounded} headness は必ずしもパーサ最適とは限らないことが示唆された。
より優れた頭部予測は、句読取感度の高い選挙区解析を良くするものではない。
関連論文リスト
- Learning Constituent Headedness [9.025809029628247]
頭頂部は構文解析において組織化装置として広く用いられているが、選挙区のツリーバンクはそれを明示的に符号化することは滅多にない。
我々は、各構成元を依存関係スパンヘッドとして定義することにより、整列した構成元と依存性アノテーションに対する教師付き予測タスクとして学習し、監督を誘導する。
一致した英語と中国語のデータでは、結果のモデルは内在性に近い精度を達成し、コリンズ式規則に基づくパーコレーションを著しく上回る。
論文 参考訳(メタデータ) (2026-03-16T02:39:41Z) - CORE: Context-Robust Remasking for Diffusion Language Models [51.59514489363897]
我々は、推論時リビジョンのためのトレーニング不要フレームワークであるContext-Robust Remasking (CORE)を提案する。
静的トークンの確率を信頼するのではなく、COREは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Baseでは、COREは推論とコードベンチマークの間で一貫した改善を行い、計算に適合したベースラインを上回り、MBPPを最大9.2%改善した。
論文 参考訳(メタデータ) (2026-02-04T00:12:30Z) - Punctuation-aware treebank tree binarization [4.779196219827507]
句読点対応のツリーバンクバイナライゼーションパイプラインは、2ナライゼーションの前に兄弟ノードとして句読点を保存する。
ペン・ツリーバンクでは、句読点認識前処理により、頭部の予測精度が73.66%(コリンズ規則)から91.85%に向上した。
すべてのコード、構成ファイル、ドキュメントがリリースされ、他のコーパスへのレプリケーションと拡張が可能である。
論文 参考訳(メタデータ) (2025-10-13T03:02:38Z) - Cascading and Direct Approaches to Unsupervised Constituency Parsing on
Spoken Sentences [67.37544997614646]
本研究は,教師なし音声補聴における最初の研究である。
目的は, 音声文の階層的構文構造を, 選挙区解析木の形で決定することである。
正確なセグメンテーションだけでは、音声文を正確に解析するのに十分であることを示す。
論文 参考訳(メタデータ) (2023-03-15T17:57:22Z) - Pseudo Contrastive Learning for Graph-based Semi-supervised Learning [67.37572762925836]
Pseudo Labelingは、グラフニューラルネットワーク(GNN)の性能向上に使用されるテクニックである。
我々はPseudo Contrastive Learning(PCL)と呼ばれるGNNのための一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-19T10:34:08Z) - Unsupervised Full Constituency Parsing with Neighboring Distribution
Divergence [48.69930912510414]
本稿では,最近導入されたメトリクスの特性を利用して,教師なしかつトレーニング不要なラベル付け手法を提案する。
実装のために,NDD を Dual POS-NDD に実装し,文中の構成要素とそのラベルを検出する "モールド" を構築する。
DP-NDDは, 構成成分を正確にラベル付けするだけでなく, より単純なルールを持つ従来手法よりも, より正確なラベル付き選挙区木を誘導することを示す。
論文 参考訳(メタデータ) (2021-10-29T17:27:34Z) - Pointwise Binary Classification with Pairwise Confidence Comparisons [97.79518780631457]
ペアワイズ比較(Pcomp)分類を提案し、ラベルのないデータのペアしか持たない。
我々はPcomp分類をノイズラベル学習に結びつけて、進歩的UREを開発し、一貫性の正則化を課すことにより改善する。
論文 参考訳(メタデータ) (2020-10-05T09:23:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。