論文の概要: Rethinking the Relationship between the Power Law and Hierarchical Structures
- arxiv url: http://arxiv.org/abs/2505.04984v1
- Date: Thu, 08 May 2025 06:41:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.775306
- Title: Rethinking the Relationship between the Power Law and Hierarchical Structures
- Title(参考訳): 電力法則と階層構造の関係の再考
- Authors: Kai Nakaishi, Ryo Yoshida, Kohei Kajikawa, Koji Hukushima, Yohei Oseki,
- Abstract要約: 本研究では,英語コーパスを用いた構文構造の議論の有効性について検討した。
英文コーパスを用いて、相互情報、確率的文脈自由文法からの逸脱、およびパースツリーにおける他の特性を解析する。
以上の結果から, 仮説は構文構造を保たず, 子どもの言語や動物信号に適用することは困難であることが示唆された。
- 参考スコア(独自算出の注目度): 3.8063235092267993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Statistical analysis of corpora provides an approach to quantitatively investigate natural languages. This approach has revealed that several power laws consistently emerge across different corpora and languages, suggesting the universal principles underlying languages. Particularly, the power-law decay of correlation has been interpreted as evidence for underlying hierarchical structures in syntax, semantics, and discourse. This perspective has also been extended to child languages and animal signals. However, the argument supporting this interpretation has not been empirically tested. To address this problem, this study examines the validity of the argument for syntactic structures. Specifically, we test whether the statistical properties of parse trees align with the implicit assumptions in the argument. Using English corpora, we analyze the mutual information, deviations from probabilistic context-free grammars (PCFGs), and other properties in parse trees, as well as in the PCFG that approximates these trees. Our results indicate that the assumptions do not hold for syntactic structures and that it is difficult to apply the proposed argument to child languages and animal signals, highlighting the need to reconsider the relationship between the power law and hierarchical structures.
- Abstract(参考訳): コーパスの統計的分析は、自然言語を定量的に研究するためのアプローチを提供する。
このアプローチによって、異なるコーパスや言語にまたがるいくつかの権限法則が一貫して現れ、言語の基礎となる普遍的な原理が示唆されている。
特に、相関のパワー・ローの崩壊は、構文、意味論、言説の基盤となる階層構造の証拠として解釈されている。
この観点は、子供言語や動物信号にも拡張されている。
しかし、この解釈を支持する議論は実証的に検証されていない。
そこで本研究では,構文構造に対する議論の有効性について検討した。
具体的には、解析木の統計的性質が議論の暗黙の仮定と一致しているかを検証する。
英文コーパスを用いて、確率的文脈自由文法(PCFG)の相互情報、偏差、およびこれらの木を近似するPCFGの他の特性を解析する。
以上の結果から, 構文構造を前提とせず, 子どもの言語や動物信号に適用することは困難であることが示唆され, 権力法則と階層構造との関係を再考する必要性が浮き彫りにされている。
関連論文リスト
- SPAWNing Structural Priming Predictions from a Cognitively Motivated Parser [20.83447226847776]
我々は、SPAWNを用いて、英語の相対節の構造に関する2つの理論から、プライミング予測を生成する。
パルティシパル・パーゼ理論の予測は人間の行動と一致しているが、ウィズ・ディレティオン理論の予測には一致しなかった。
論文 参考訳(メタデータ) (2024-03-11T22:58:58Z) - Zero-shot Causal Graph Extrapolation from Text via LLMs [50.596179963913045]
我々は,自然言語から因果関係を推定する大規模言語モデル (LLM) の能力を評価する。
LLMは、(特別な)トレーニングサンプルを必要とせずにペア関係のベンチマークで競合性能を示す。
我々は、反復的なペアワイズクエリを通して因果グラフを外挿するアプローチを拡張した。
論文 参考訳(メタデータ) (2023-12-22T13:14:38Z) - Modeling Hierarchical Reasoning Chains by Linking Discourse Units and
Key Phrases for Reading Comprehension [80.99865844249106]
本稿では,論理的推論の基盤として,対話レベルと単語レベルの両方の文脈を扱う総合グラフネットワーク(HGN)を提案する。
具体的には、ノードレベルの関係とタイプレベルの関係は、推論過程におけるブリッジと解釈できるが、階層的な相互作用機構によってモデル化される。
論文 参考訳(メタデータ) (2023-06-21T07:34:27Z) - Structural Ambiguity and its Disambiguation in Language Model Based
Parsers: the Case of Dutch Clause Relativization [2.9950872478176627]
先行文の存在が相対的節の曖昧さをいかに解決するかを考察する。
その結果、証明ネットに基づくニューロシンボリックは、普遍的な依存関係に基づくアプローチよりも、データ偏差補正に対してよりオープンであることが示された。
論文 参考訳(メタデータ) (2023-05-24T09:04:18Z) - Natural Language Decompositions of Implicit Content Enable Better Text Representations [52.992875653864076]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - False perspectives on human language: why statistics needs linguistics [0.8699677835130408]
統計的測度は, 構造的モデルと非構造的モデルのいずれかに基づいて定義できることを示す。
構文構造を反映した仮定モデルのみが、言語の規則性を考慮できる。
論文 参考訳(メタデータ) (2023-02-17T11:40:32Z) - Exploring Discourse Structures for Argument Impact Classification [48.909640432326654]
本稿では、文脈経路に沿った2つの議論間の談話関係が、議論の説得力を特定する上で不可欠な要素であることを実証的に示す。
本研究では,文レベルの構造情報を大規模言語モデルから派生した文脈的特徴に注入・融合するDisCOCを提案する。
論文 参考訳(メタデータ) (2021-06-02T06:49:19Z) - Linguistic dependencies and statistical dependence [76.89273585568084]
文脈における単語の確率を推定するために,事前学習した言語モデルを用いる。
最大CPMI木は非文脈PMI推定値から抽出した木よりも言語的依存関係によく対応していることがわかった。
論文 参考訳(メタデータ) (2021-04-18T02:43:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。