論文の概要: We can still parse using syntactic rules
- arxiv url: http://arxiv.org/abs/2602.14238v1
- Date: Sun, 15 Feb 2026 17:16:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:49.83198
- Title: We can still parse using syntactic rules
- Title(参考訳): 構文規則を使って解析できる
- Authors: Ghaly Hussein,
- Abstract要約: 本研究では,文脈自由文法 (CFG) と一般化句構造文法 (GPSG) に基づく構文解析手法を提案する。
このアプローチは、新しい構文解析アルゴリズムと、CFGの制限を克服する一連の構文規則と特徴からなる。
また、ノイズと不完全なパースを調節しながら、依存関係と選挙区のパースツリーの両方を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research introduces a new parsing approach, based on earlier syntactic work on context free grammar (CFG) and generalized phrase structure grammar (GPSG). The approach comprises both a new parsing algorithm and a set of syntactic rules and features that overcome the limitations of CFG. It also generates both dependency and constituency parse trees, while accommodating noise and incomplete parses. The system was tested on data from Universal Dependencies, showing a promising average Unlabeled Attachment Score (UAS) of 54.5% in the development dataset (7 corpora) and 53.8% in the test set (12 corpora). The system also provides multiple parse hypotheses, allowing further reranking to improve parsing accuracy. This approach also leverages much of the theoretical syntactic work since the 1950s to be used within a computational context. The application of this approach provides a transparent and interpretable NLP model to process language input.
- Abstract(参考訳): 本研究では,文脈自由文法(CFG)と一般化句構造文法(GPSG)に基づく構文解析手法を提案する。
このアプローチは、新しい構文解析アルゴリズムと、CFGの制限を克服する一連の構文規則と特徴からなる。
また、ノイズと不完全なパースを調節しながら、依存関係と選挙区のパースツリーの両方を生成する。
このシステムはUniversal Dependenciesのデータに基づいてテストされ、開発データセット(7コーパス)では54.5%、テストセット(12コーパス)では53.8%という有望な平均的なUnlabeled Attachment Score(UAS)が示された。
このシステムは複数のパース仮説も提供し、パース精度をさらに向上させることができる。
このアプローチはまた、1950年代以降の理論的構文的な作業の多くを計算コンテキスト内で使用するために利用している。
このアプローチの適用により、言語入力を処理するための透過的で解釈可能なNLPモデルが提供される。
関連論文リスト
- Deep networks learn to parse uniform-depth context-free languages from local statistics [12.183764229746926]
文だけで言語の構造がどのように学習できるかを理解することは、認知科学と機械学習の両方において中心的な問題である。
我々は,文脈自由文法(PCFG)のクラスを導入し,あいまいさの度合いとスケール間の相関構造を制御できる。
異なるスケールの相関関係が局所的曖昧性を持ち、データの階層的表現の出現を可能にする統一フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-31T17:35:06Z) - Syntactic Control of Language Models by Posterior Inference [53.823006836309695]
言語モデルによって生成されたテキストの構文構造を制御することは、明快さ、スタイリスティックな一貫性、解釈可能性を必要とするアプリケーションにとって重要である。
後部推論に基づくサンプリングアルゴリズムは、生成中に対象の選挙区構造を効果的に強制することができると論じる。
提案手法では,提案分布からのサンプリングにより後続分布を推定するモンテカルロ法と,各生成したトークンが所望の構文構造に整合することを保証する統語タグを併用する。
論文 参考訳(メタデータ) (2025-06-08T14:01:34Z) - EquiBench: Benchmarking Large Language Models' Reasoning about Program Semantics via Equivalence Checking [58.15568681219339]
大規模言語モデル(LLM)を評価するための新しいベンチマークであるEquiBenchを紹介する。
このタスクは、プログラムのセマンティクスについて推論するモデルの能力を直接テストする。
19の最先端LCMを評価し、最も難しいカテゴリでは、最高の精度は63.8%と76.2%であり、50%のランダムベースラインよりわずかに高い。
論文 参考訳(メタデータ) (2025-02-18T02:54:25Z) - Improving Unsupervised Constituency Parsing via Maximizing Semantic Information [35.63321102040579]
教師なしの選挙区は、文内のフレーズを木のような構文構成構造に整理する。
文ログ類似度を最大化する従来の目的は、構成構造と意味論の密接な関係を明示的に説明していない。
構成構造に符号化された意味情報であるSemInfoを最大化することで解析を訓練する新しい目的を導入する。
論文 参考訳(メタデータ) (2024-10-03T15:04:00Z) - Growing Trees on Sounds: Assessing Strategies for End-to-End Dependency Parsing of Speech [8.550564152063522]
音声解析における2つの解析パラダイムの性能評価を目的とした一連の実験について報告する。
我々はこの評価をフランス語の大きな木バンクで行い、現実的な自発的な会話を特徴とする。
その結果, (i) グラフに基づく手法は, (ii) パラメータが30%少ないにもかかわらず, (ii) 音声から直接解析することで, パイプライン手法よりも優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-06-18T13:46:10Z) - Cross-domain Chinese Sentence Pattern Parsing [67.1381983012038]
文パターン構造解析(SPS)は、主に言語教育に使用される構文解析法である。
既存のSPSは教科書のコーパスに大きく依存しており、クロスドメイン機能に欠ける。
本稿では,大規模言語モデル(LLM)を自己学習フレームワーク内で活用する革新的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T05:30:48Z) - Compositional Generalization for Data-to-Text Generation [86.79706513098104]
本稿では,群に述語をクラスタ化することで構成一般化に対処する新しいモデルを提案する。
本モデルでは,1つの述語を1度に1つのクラスタに依存して文単位でテキストを生成する。
すべての評価指標でT5ベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2023-12-05T13:23:15Z) - Compositional Program Generation for Few-Shot Systematic Generalization [59.57656559816271]
コンポジションプログラムジェネレータ(CPG)と呼ばれるニューロシンボリックアーキテクチャに関する研究
CPGには3つの重要な特徴がある: 文法規則の形で、テキストモジュラリティ、テキストコンポジション、テキストタストラクションである。
SCAN と COGS のベンチマークでは,SCAN の14例と COGS の22例を使用して,完全な一般化を実現している。
論文 参考訳(メタデータ) (2023-09-28T14:33:20Z) - Unsupervised Chunking with Hierarchical RNN [62.15060807493364]
本稿では,非階層的手法で単語をグループ化する構文的タスクであるチャンキングに対する教師なしアプローチを紹介する。
本稿では,単語-チャンク・チャンク-文合成をモデル化した2層階層型階層型リカレントニューラルネットワーク(HRNN)を提案する。
CoNLL-2000データセットの実験では、既存の教師なし手法よりも顕著な改善が見られ、フレーズF1スコアが最大6ポイント向上した。
論文 参考訳(メタデータ) (2023-09-10T02:55:12Z) - The Limitations of Limited Context for Constituency Parsing [27.271792317099045]
Shen et al., 2018a)の構文解析アーキテクチャは、教師なし構文解析を最初に行った。
現在の構文に対するニューラルアプローチはどのような構文構造を表現できるのか?
我々は確率論的自由文法(PCFG)のサンドボックスにこの疑問を解いた。
これらのアプローチの表現力の重要な側面は、予測者がアクセス可能なコンテキストの量と方向性である。
論文 参考訳(メタデータ) (2021-06-03T03:58:35Z) - Iterative Utterance Segmentation for Neural Semantic Parsing [38.344720207846905]
反復発話セグメンテーションによるニューラルセマンティクスドメインの促進のための新しいフレームワークを提案する。
重要な利点の1つは、このフレームワークがセグメンタのための手作業の発声やラベル付きデータを必要としないことである。
Geo 63.1 から 81.2, Formulas 59.7 から 72.7, ComplexWebQuestions 27.1 から 56.3 である。
論文 参考訳(メタデータ) (2020-12-13T09:46:24Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。