Fugu-MT 論文翻訳(概要): False perspectives on human language: why statistics needs linguistics

論文の概要: False perspectives on human language: why statistics needs linguistics

arxiv url: http://arxiv.org/abs/2302.08822v1
Date: Fri, 17 Feb 2023 11:40:32 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-20 15:03:11.487104
Title: False perspectives on human language: why statistics needs linguistics
Title（参考訳）: 人間の言語に関する虚偽の視点--統計学が言語学を必要とする理由
Authors: Matteo Greco, Andrea Cometa, Fiorenzo Artoni, Robert Frank, Andrea Moro
Abstract要約: 統計的測度は, 構造的モデルと非構造的モデルのいずれかに基づいて定義できることを示す。構文構造を反映した仮定モデルのみが、言語の規則性を考慮できる。
参考スコア（独自算出の注目度）: 0.8699677835130408
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: A sharp tension exists about the nature of human language between two opposite parties: those who believe that statistical surface distributions, in particular using measures like surprisal, provide a better understanding of language processing, vs. those who believe that discrete hierarchical structures implementing linguistic information such as syntactic ones are a better tool. In this paper, we show that this dichotomy is a false one. Relying on the fact that statistical measures can be defined on the basis of either structural or non-structural models, we provide empirical evidence that only models of surprisal that reflect syntactic structure are able to account for language regularities.
Abstract（参考訳）: 統計的表面分布、特にsurprisalのような尺度を用いて、言語処理をよりよく理解していると信じている人々と、統語論的なもののような言語情報を実装する離散階層構造がより良いツールであると信じている人々である。本稿では,この二分法が誤りであることを示す。統計的測度は構造モデルか非構造モデルのいずれかに基づいて定義できるという事実に基づき、構文構造を反映する仮定モデルのみが言語規則性を考慮できるという経験的証拠を提供する。

関連論文リスト

Under the Shadow of Babel: How Language Shapes Reasoning in LLMs [27.48119976373105]
大規模言語モデルは,様々な言語に埋め込まれた習慣的論理構造を内部化することを示す。 1)LLMは,中国語の語源や文の初期接続性に注目しつつ,英語のバランスの取れた分布を示す。
論文参考訳（メタデータ） (2025-06-19T09:06:38Z)
Rethinking the Relationship between the Power Law and Hierarchical Structures [3.8063235092267993]
本研究では,英語コーパスを用いた構文構造の議論の有効性について検討した。英文コーパスを用いて、相互情報、確率的文脈自由文法からの逸脱、およびパースツリーにおける他の特性を解析する。以上の結果から, 仮説は構文構造を保たず, 子どもの言語や動物信号に適用することは困難であることが示唆された。
論文参考訳（メタデータ） (2025-05-08T06:41:46Z)
Large Language Models as Neurolinguistic Subjects: Discrepancy in Performance and Competence for Form and Meaning [49.60849499134362]
本研究では,大言語モデル(LLM)の記号化(形式)および記号化(意味)に関する言語的理解について検討する。ミニマルペアと診断プローブを組み合わせてモデル層間のアクティベーションパターンを解析する新しい手法を用いて,ニューロ言語学的アプローチを提案する。その結果,(1)心理言語学的・神経言語学的手法では,言語能力と能力が異なっていること,(2)直接確率測定では言語能力が正確に評価されないこと,(3)指導のチューニングでは能力が大きく変化しないが,性能は向上しないことがわかった。
論文参考訳（メタデータ） (2024-11-12T04:16:44Z)
Linguistic Structure from a Bottleneck on Sequential Information Processing [5.850665541267672]
予測情報によって制約されたコードに自然言語のような体系性が生じることを示す。人間の言語は、音韻学、形態学、構文学、意味論のレベルにおいて、低い予測情報を持つように構成されている。
論文参考訳（メタデータ） (2024-05-20T15:25:18Z)
Natural Language Decompositions of Implicit Content Enable Better Text Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文参考訳（メタデータ） (2023-05-23T23:45:20Z)
Evaluating statistical language models as pragmatic reasoners [39.72348730045737]
我々は,語学的な発話の意味を推測するために,大規模言語モデルの能力を評価する。 LLMは、複数の複雑な実用的発話の解釈に対して、文脈的、人間的な分布を導出することができる。結果は,統計的言語モデルの推論能力と,実践的・意味論的解析への応用について報告する。
論文参考訳（メタデータ） (2023-05-01T18:22:10Z)
Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文参考訳（メタデータ） (2022-10-14T02:35:19Z)
A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文参考訳（メタデータ） (2022-01-20T15:01:12Z)
Language Model Evaluation Beyond Perplexity [47.268323020210175]
我々は、言語モデルから生成されたテキストが、訓練された人為的なテキストに存在する統計的傾向を示すかどうかを分析する。ニューラルネットワークモデルは、考慮された傾向のサブセットのみを学習しているように見えるが、提案された理論分布よりも経験的傾向とより密接に一致している。
論文参考訳（メタデータ） (2021-05-31T20:13:44Z)
Linguistic dependencies and statistical dependence [76.89273585568084]
文脈における単語の確率を推定するために,事前学習した言語モデルを用いる。最大CPMI木は非文脈PMI推定値から抽出した木よりも言語的依存関係によく対応していることがわかった。
論文参考訳（メタデータ） (2021-04-18T02:43:37Z)
The Rediscovery Hypothesis: Language Models Need to Meet Linguistics [8.293055016429863]
現代言語モデルの性能向上に言語知識が必須条件であるかどうかを検討する。その結果, 言語構造を探索した場合, かなり圧縮されるが, 事前学習目的によく適合する言語モデルは, 良好なスコアを保っていることがわかった。この結果は再発見仮説を支持し,本論文の第2の貢献である言語モデル目標と言語情報との関連性に関する情報論的枠組みを導出する。
論文参考訳（メタデータ） (2021-03-02T15:57:39Z)
Statistical patterns of word frequency suggesting the probabilistic nature of human languages [5.059800023492045]
この研究は、言語的普遍性、ダイアクロニックドリフト、言語の変化といった重要な言語問題を、仮釈放の確率と頻度パターンに翻訳できることを示している。これらの結果から,人間の言語は自然の確率論的システムである可能性が示唆され,統計学が人間の言語の本質的特性を成す可能性が示唆された。
論文参考訳（メタデータ） (2020-12-01T00:48:27Z)
Where New Words Are Born: Distributional Semantic Analysis of Neologisms and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文参考訳（メタデータ） (2020-01-21T19:09:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。