論文の概要: A Novel Dependency Framework for Enhancing Discourse Data Analysis
- arxiv url: http://arxiv.org/abs/2407.12473v1
- Date: Wed, 17 Jul 2024 10:55:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-18 17:27:45.621673
- Title: A Novel Dependency Framework for Enhancing Discourse Data Analysis
- Title(参考訳): 談話データ分析の強化のための新しい依存性フレームワーク
- Authors: Kun Sun, Rong Wang,
- Abstract要約: この研究はPDTBアノテーションを依存性構造に変換することに重点を置いている。
改良されたBERTベースの談話を用いて、英語、中国語、その他の言語でPDTBスタイルのコーパスから派生した依存性データの妥当性を検証している。
その結果,PDTB依存性データは有効であり,両者の依存関係距離には強い相関関係があることが示唆された。
- 参考スコア(独自算出の注目度): 27.152245569974678
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The development of different theories of discourse structure has led to the establishment of discourse corpora based on these theories. However, the existence of discourse corpora established on different theoretical bases creates challenges when it comes to exploring them in a consistent and cohesive way. This study has as its primary focus the conversion of PDTB annotations into dependency structures. It employs refined BERT-based discourse parsers to test the validity of the dependency data derived from the PDTB-style corpora in English, Chinese, and several other languages. By converting both PDTB and RST annotations for the same texts into dependencies, this study also applies ``dependency distance'' metrics to examine the correlation between RST dependencies and PDTB dependencies in English. The results show that the PDTB dependency data is valid and that there is a strong correlation between the two types of dependency distance. This study presents a comprehensive approach for analyzing and evaluating discourse corpora by employing discourse dependencies to achieve unified analysis. By applying dependency representations, we can extract data from PDTB, RST, and SDRT corpora in a coherent and unified manner. Moreover, the cross-linguistic validation establishes the framework's generalizability beyond English. The establishment of this comprehensive dependency framework overcomes limitations of existing discourse corpora, supporting a diverse range of algorithms and facilitating further studies in computational discourse analysis and language sciences.
- Abstract(参考訳): 談話構造の異なる理論の発展は、これらの理論に基づく談話コーパスの確立につながった。
しかし、異なる理論的基盤上に確立された談話コーパスの存在は、それらを一貫した結束的な方法で探索する上での課題を生み出している。
この研究はPDTBアノテーションを依存性構造に変換することに重点を置いている。
改良されたBERTベースの談話パーサを使用して、英語、中国語、その他の言語でPDTBスタイルのコーパスから派生した依存性データの妥当性をテストする。
本研究は,同じテキストに対するPDTBアノテーションとRTTアノテーションの両方を依存関係に変換することにより,英語におけるPDTBアノテーションとPDTBアノテーションの相関性を検討するための 'dependency distance'' メトリクスを適用した。
その結果,PDTB依存性データは有効であり,両者の依存関係距離には強い相関関係があることが示唆された。
本研究では,談話依存を用いて談話コーパスを分析し,評価するための総合的なアプローチを提案する。
依存関係表現を適用することで、PDTB、RTT、SDRTコーパスからデータのコヒーレントで統一的な方法で抽出することができる。
さらに、クロス言語による検証は、このフレームワークの英語以外の一般化可能性を確立している。
この包括的依存関係フレームワークの確立は、既存の談話コーパスの限界を克服し、多様なアルゴリズムをサポートし、計算談話分析や言語科学におけるさらなる研究を促進する。
関連論文リスト
- Automatic Alignment of Discourse Relations of Different Discourse Annotation Frameworks [5.439020425819001]
分類作業中にラベル埋め込みを学習するための完全自動アプローチを導入する。
これらの埋め込みは、異なるフレームワークの談話関係をマッピングするために使われる。
論文 参考訳(メタデータ) (2024-03-29T14:18:26Z) - eRST: A Signaled Graph Theory of Discourse Relations and Organization [14.074017875514787]
RST(Rhetorical Structure Theory)の拡張に基づく計算談話分析のための新しい理論枠組みを提案する。
このフレームワークは、木分割、非計画的、並行的な関係を持つ談話関係グラフと、分析に説明可能な有理性を与える暗黙的、明示的な信号を含む。
我々は,200K以上のトークンを持つ12の話し言葉および書き言葉のジャンルを含む,アノテートされた英語の無料コーパスを,我々の枠組みに従って提示し,評価する。
論文 参考訳(メタデータ) (2024-03-20T12:52:38Z) - Cross-domain Chinese Sentence Pattern Parsing [67.1381983012038]
文パターン構造解析(SPS)は、主に言語教育に使用される構文解析法である。
既存のSPSは教科書のコーパスに大きく依存しており、クロスドメイン機能に欠ける。
本稿では,大規模言語モデル(LLM)を自己学習フレームワーク内で活用する革新的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T05:30:48Z) - Enhancing Systematic Decompositional Natural Language Inference Using
Informal Logic [53.363888563647976]
我々は,分解包含データセットに注釈を付けるための一貫した理論的なアプローチを開発した。
得られたデータセットRDTEは,従来よりも内部整合性(+9%)が高いことがわかった。
また, 知識蒸留によるRDTE指向エンテーメント分類器の訓練や, 現代のニューロシンボリック推論エンジンへの導入により, 結果が大幅に向上することが確認された。
論文 参考訳(メタデータ) (2024-02-22T18:55:17Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - A Pilot Study on Dialogue-Level Dependency Parsing for Chinese [21.698966896156087]
850の対話と199,803の依存関係を含む高品質な人間注釈コーパスを開発する。
このようなタスクはアノテーションのコストが高いため、ゼロショットと少数ショットのシナリオを調査する。
既存のシンタクティックツリーバンクをベースとした信号ベースの手法により、目に見えないシンタクティック依存関係を非表示のツリーバンクに変換する。
論文 参考訳(メタデータ) (2023-05-21T12:20:13Z) - Learning Relation Alignment for Calibrated Cross-modal Retrieval [52.760541762871505]
言語的・視覚的関係のセマンティックな距離を計測し,関係の一貫性を定量化するための新しい指標ISD(Intra-modal Self-attention Distance)を提案する。
ISDを最適化し、モダル間アライメントを介してモダル内アライメントを相互に調整するための正規化訓練法である、モダル内アライメント(IAIS)について述べる。
論文 参考訳(メタデータ) (2021-05-28T14:25:49Z) - Linguistic dependencies and statistical dependence [76.89273585568084]
文脈における単語の確率を推定するために,事前学習した言語モデルを用いる。
最大CPMI木は非文脈PMI推定値から抽出した木よりも言語的依存関係によく対応していることがわかった。
論文 参考訳(メタデータ) (2021-04-18T02:43:37Z) - Unifying Discourse Resources with Dependency Framework [18.498060350460463]
異なるアノテーション・スキームで中国の談話コーパスを談話依存フレームワークで統一する。
ベンチマークの依存関係をいくつか実装し、統一されたデータをどのように活用してパフォーマンスを向上させるかの研究を行っています。
論文 参考訳(メタデータ) (2021-01-01T05:23:29Z) - A Dependency Syntactic Knowledge Augmented Interactive Architecture for
End-to-End Aspect-based Sentiment Analysis [73.74885246830611]
エンドツーエンドABSAのためのマルチタスク学習を用いた対話型アーキテクチャを新たに提案する。
このモデルは、よく設計された依存性関係埋め込みグラフ畳み込みネットワーク(DreGcn)を活用することで、構文知識(依存性関係と型)を完全に活用することができる。
3つのベンチマークデータセットの大規模な実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-04-04T14:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。