論文の概要: A Dual-Task Paradigm to Investigate Sentence Comprehension Strategies in Language Models
- arxiv url: http://arxiv.org/abs/2604.26351v1
- Date: Wed, 29 Apr 2026 07:03:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.283929
- Title: A Dual-Task Paradigm to Investigate Sentence Comprehension Strategies in Language Models
- Title(参考訳): 言語モデルにおける文理解の2段階的パラダイム
- Authors: Rei Emura, Saku Sugawara,
- Abstract要約: 両タスク条件下では、可視性に基づく理解が人間の合理的推論を反映していることを示す。
これらの結果は,メモリと処理資源のバランスの制約が言語モデルにおける合理的推論を促進することを示唆している。
- 参考スコア(独自算出の注目度): 10.50113943900077
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Language models (LMs) behave more like humans when their cognitive resources are restricted, particularly in predicting sentence processing costs such as reading times. However, it remains unclear whether such constraints similarly affect sentence comprehension strategies. Besides, existing methods do not directly target the balance between memory storage and sentence processing, which is central to human working memory. To address this issue, we propose a dual-task paradigm that combines an arithmetic computation task with a sentence comprehension task, such as "The 2 cocktail + blended 3 =..." Our experiments show that under dual-task conditions, GPT-4o, o3-mini, and o4-mini shift toward plausibility-based comprehension, mirroring humans' rational inference. Specifically, these models show a greater accuracy gap between plausible sentences (e.g., "The cocktail was blended by the bartender") and implausible sentences (e.g., "The bartender was blended by the cocktail") in the dual-task condition compared to the single-task conditions. These findings suggest that constraints on the balance between memory and processing resources promote rational inference in LMs. More broadly, they support the view that human-like sentence comprehension fundamentally arises from the allocation of limited cognitive resources.
- Abstract(参考訳): 言語モデル(LM)は、認知資源が制限されているとき、特に読書時間などの文処理コストを予測する際に、人間のように振る舞う。
しかし、同様の制約が文理解戦略に影響を及ぼすかどうかは不明である。
さらに、既存の手法では、人間の作業記憶の中心となるメモリストレージと文処理のバランスを直接的に狙うことはできない。
この問題に対処するために、算術演算タスクと「2カクテル+ブレンド3 = ...」のような文理解タスクを組み合わせたデュアルタスクパラダイムを提案する。
両タスク条件下では, GPT-4o, o3-mini, o4-miniが可視性に基づく理解へとシフトし, 人間の合理的推論が反映された。
特に、これらのモデルでは、シングルタスク条件と比較して、可塑性文(例:「カクテルはバーテンダーでブレンドされた」)と不定形文(例:「バーテンダーはカクテルでブレンドされた」)の間に、より高精度なギャップが示される。
これらの結果は,メモリと処理資源のバランスの制約がLMの合理的推論を促進することを示唆している。
より広い意味では、人間のような文章の理解は、限られた認知資源の割り当てから根本的に生じるという見解を支持している。
関連論文リスト
- Leverage Laws: A Per-Task Framework for Human-Agent Collaboration [0.0]
本研究では,タスクごとのレバレッジ比を人間とエージェントのコラボレーションに提案する。
情報密度自体が、人対エージェントフローと人対エージェントフローの別々の天井で区切られていることを示す。
論文 参考訳(メタデータ) (2026-04-27T22:43:48Z) - Show, Don't Tell: Morphing Latent Reasoning into Image Generation [60.743575139661154]
テキスト・ツー・イメージ(T2I)生成は目覚ましい進歩を遂げているが、既存の手法では生成時に動的に推論や洗練を行う能力が欠如していることが多い。
T2I生成プロセスに暗黙の潜伏推論をシームレスに統合するフレームワークであるLatentMorphを導入する。
連続ラテント空間で完全に推論を行うことにより、ラテントマーフは明示的推論のボトルネックを避け、より適応的な自己精製を可能にする。
論文 参考訳(メタデータ) (2026-02-02T15:29:48Z) - Mind-Paced Speaking: A Dual-Brain Approach to Real-Time Reasoning in Spoken Language Models [81.9612057950385]
我々は、高忠実でリアルタイムな推論を可能にする脳に触発されたフレームワークであるMind-Paced Talk(MPS)を紹介する。
MPSは「フォーミュレーション・ブレイン(Formulation Brain)」をハイレベルな推論に使用し、流れのある音声生成のために別個の「アーティキュレーション・ブレイン(Articulation Brain)」を誘導する。
論文 参考訳(メタデータ) (2025-10-10T17:50:59Z) - Reasoning Scaffolding: Distilling the Flow of Thought from LLMs [30.569464420145163]
我々は、推論を構造化生成プロセスとして再編成するフレームワークであるReasoning Scaffoldingを紹介します。
本手法は, 精度と論理的整合性の両方において, 最先端の蒸留法よりも優れていた。
論文 参考訳(メタデータ) (2025-09-28T03:49:32Z) - Language Models Do Not Have Human-Like Working Memory [24.355006642653503]
我々は,Large Language Models (LLM) は人間の認知の基本的側面を欠いていることを示した。
人間の作業記憶は、一貫性のある推論と意思決定を可能にする活発な認知システムである。
我々の研究は、LLMにおけるワーキングメモリ評価のための新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2025-04-30T16:18:39Z) - A Theory for Token-Level Harmonization in Retrieval-Augmented Generation [76.75124161306795]
Retrieval-augmented Generation (RAG)は、検索したテキストを利用して大規模言語モデル(LLM)を強化する。
本稿では,RAGの利益と有害性を説明するための理論を提供する。
提案手法は,本理論に基づいて,純粋LLMとRAGの協調生成を実現する実用的手法であるTok-RAGを提案する。
論文 参考訳(メタデータ) (2024-06-03T02:56:14Z) - Clarify When Necessary: Resolving Ambiguity Through Interaction with LMs [58.620269228776294]
そこで本稿では,ユーザに対して,あいまいさを解消するためのタスク非依存のフレームワークを提案する。
我々は3つのNLPアプリケーション(質問応答、機械翻訳、自然言語推論)にまたがるシステムを評価する。
インテントシムは堅牢であり、幅広いNLPタスクやLMの改善を実証している。
論文 参考訳(メタデータ) (2023-11-16T00:18:50Z) - A Language Model with Limited Memory Capacity Captures Interference in
Human Sentence Processing [25.916625483405802]
我々は1つの自己注意頭を持つ反復型ニューラル言語モデルを開発する。
我々は,人間の実験で観察された意味的・統語的干渉効果を,モデルの単一注意頭部が捉えていることを示す。
論文 参考訳(メタデータ) (2023-10-24T19:33:27Z) - The Extraordinary Failure of Complement Coercion Crowdsourcing [50.599433903377374]
クラウドソーシングは近年,言語アノテーションの収集を緩和し,スケールアップしている。
本研究の目的は,この現象の注釈付きデータを2つの既知のタスク – 明示的補完と自然言語推論 – に還元することで収集することである。
どちらの場合も、クラウドソーシングは合意のスコアが低かった。
論文 参考訳(メタデータ) (2020-10-12T19:04:04Z) - An Information Bottleneck Approach for Controlling Conciseness in
Rationale Extraction [84.49035467829819]
我々は,情報ボトルネック(IB)の目的を最適化することで,このトレードオフをよりよく管理できることを示す。
我々の完全教師なしのアプローチは、文上のスパース二項マスクを予測する説明器と、抽出された合理性のみを考慮したエンドタスク予測器を共同で学習する。
論文 参考訳(メタデータ) (2020-05-01T23:26:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。