論文の概要: France or Spain or Germany or France: A Neural Account of Non-Redundant Redundant Disjunctions
- arxiv url: http://arxiv.org/abs/2602.23547v1
- Date: Thu, 26 Feb 2026 23:02:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.164927
- Title: France or Spain or Germany or France: A Neural Account of Non-Redundant Redundant Disjunctions
- Title(参考訳): フランス、スペイン、ドイツ、フランス
- Authors: Sasha Boguraev, Qing Yao, Kyle Mahowald,
- Abstract要約: 我々は,人間と大規模言語モデルによる新たな行動証拠を提示し,この文脈にまたがる非冗長性の堅牢性を示す。
言語モデルでは、冗長性回避は2つの相互作用メカニズムから生じることを示す: モデルが文脈的に関連した情報を反復的な語彙項目に結び付けることを学習し、トランスフォーマー誘導ヘッドはこれらの文脈ライセンス表現に選択的に出席する。
- 参考スコア(独自算出の注目度): 11.570901623243813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sentences like "She will go to France or Spain, or perhaps to Germany or France." appear formally redundant, yet become acceptable in contexts such as "Mary will go to a philosophy program in France or Spain, or a mathematics program in Germany or France." While this phenomenon has typically been analyzed using symbolic formal representations, we aim to provide a complementary account grounded in artificial neural mechanisms. We first present new behavioral evidence from humans and large language models demonstrating the robustness of this apparent non-redundancy across contexts. We then show that, in language models, redundancy avoidance arises from two interacting mechanisms: models learn to bind contextually relevant information to repeated lexical items, and Transformer induction heads selectively attend to these context-licensed representations. We argue that this neural explanation sheds light on the mechanisms underlying context-sensitive semantic interpretation, and that it complements existing symbolic analyses.
- Abstract(参考訳): 「彼女はフランスやスペイン、おそらくドイツやフランスに行く」といった文言は、正式には冗長だが、「マリーはフランスやスペインの哲学プログラムに行くか、ドイツやフランスの数学プログラムに行く」といった文脈で受け入れられるようになる。
この現象は、典型的には記号的形式表現を用いて分析されてきたが、人工神経機構に基づく補完的な説明を提供することを目指している。
まず、人間と大規模言語モデルによる新しい行動証拠を提示し、この明らかな非冗長性の強靭性を示す。
次に、言語モデルにおいて、冗長性回避は2つの相互作用メカニズムから生じることを示す。
この神経的説明は、文脈依存的意味解釈の基礎となるメカニズムに光を当て、既存の象徴的分析を補完するものであると論じる。
関連論文リスト
- Modeling the language cortex with form-independent and enriched representations of sentence meaning reveals remarkable semantic abstractness [15.252451854183349]
文に対する神経応答をモデル化することにより,言語大脳皮質における意味の抽象表現を探索する。
複数の生成画像にまたがるアグリゲーションにより,言語野の反応の精度が向上することがわかった。
論文 参考訳(メタデータ) (2025-09-27T20:01:06Z) - Monitoring Latent World States in Language Models with Propositional Probes [33.790893543774736]
言語モデルは、バイアス、梅毒、バックドア、その他入力コンテキストに対する不誠実な応答につながる傾向に影響を受けやすい。
我々は、語彙情報のためのトークンを合成的にプローブし、それらを論理的命題に結合する「命題プローブ」を用いる。
言語モデルが入力コンテキストに不誠実に応答する3つの設定において、デコードされた命題が忠実であることに気付きました。
論文 参考訳(メタデータ) (2024-06-27T19:28:43Z) - From Word Models to World Models: Translating from Natural Language to
the Probabilistic Language of Thought [124.40905824051079]
言語インフォームド・シンキングのための計算フレームワークである「構成」を合理的に提案する。
我々は、自然言語から確率論的思考言語への文脈感応的なマッピングとして、言語の意味を定式化する。
LLMは、現実的に適切な言語的意味をキャプチャする文脈依存翻訳を生成することができることを示す。
認知的なモチベーションを持つシンボリックモジュールを統合するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2023-06-22T05:14:00Z) - Large Language Models are In-Context Semantic Reasoners rather than
Symbolic Reasoners [75.85554779782048]
大規模言語モデル(LLM)は、近年、自然言語と機械学習コミュニティを興奮させています。
多くの成功を収めたアプリケーションにもかかわらず、そのようなコンテキスト内機能の基盤となるメカニズムはまだ不明である。
本研究では,学習した言語トークンのテクストセマンティクスが推論過程において最も重い処理を行うと仮定する。
論文 参考訳(メタデータ) (2023-05-24T07:33:34Z) - Latent Topology Induction for Understanding Contextualized
Representations [84.7918739062235]
本研究では,文脈的埋め込みの表現空間について検討し,大規模言語モデルの隠れトポロジについて考察する。
文脈化表現の言語特性を要約した潜在状態のネットワークが存在することを示す。
論文 参考訳(メタデータ) (2022-06-03T11:22:48Z) - Emergence of Machine Language: Towards Symbolic Intelligence with Neural
Networks [73.94290462239061]
本稿では、ニューラルネットワークを用いてシンボルとコネクショナリズムの原理を組み合わせることで、離散表現を導出することを提案する。
対話型環境とタスクを設計することにより、機械が自発的で柔軟でセマンティックな言語を生成できることを実証した。
論文 参考訳(メタデータ) (2022-01-14T14:54:58Z) - Schr\"odinger's Tree -- On Syntax and Neural Language Models [10.296219074343785]
言語モデルは、NLPのワークホースとして登場し、ますます流動的な生成能力を示している。
我々は、多くの次元にまたがる明瞭さの欠如を観察し、研究者が形成する仮説に影響を及ぼす。
本稿では,構文研究における様々な研究課題の意義について概説する。
論文 参考訳(メタデータ) (2021-10-17T18:25:23Z) - Constructing a Family Tree of Ten Indo-European Languages with
Delexicalized Cross-linguistic Transfer Patterns [57.86480614673034]
我々は,デレクシカル化転送を,解釈可能なツリー・ツー・ストリングパターンとツリー・ツー・ツリーパターンとして定式化する。
これにより、言語間移動を定量的に探索し、第二言語習得の問い合わせを拡張することができる。
論文 参考訳(メタデータ) (2020-07-17T15:56:54Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z) - Sentiment Analysis with Contextual Embeddings and Self-Attention [3.0079490585515343]
自然言語では、単語や句の意図された意味はしばしば暗黙的であり、文脈に依存する。
本稿では,文脈埋め込みと自己認識機構を用いた感情分析の簡易かつ効果的な手法を提案する。
形態学的にリッチなポーランド語とドイツ語を含む3つの言語の実験結果から、我々のモデルは最先端のモデルに匹敵するか、さらに優れています。
論文 参考訳(メタデータ) (2020-03-12T02:19:51Z) - Semantic Holism and Word Representations in Artificial Neural Networks [0.0]
単語2vecモデルのSkip-gram変種からの単語表現は興味深い意味的特性を示す。
これは通常、一般分布仮説を参照して説明される。
本稿では,フレーゲの包括的,機能的アプローチに基づく,より具体的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-03-11T21:04:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。