論文の概要: Meaning without reference in large language models
- arxiv url: http://arxiv.org/abs/2208.02957v1
- Date: Fri, 5 Aug 2022 02:48:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-08 12:13:15.647895
- Title: Meaning without reference in large language models
- Title(参考訳): 大言語モデルにおける参照なしの意味
- Authors: Steven T. Piantasodi and Felix Hill
- Abstract要約: 我々は、大きな言語モデル(LLM)が意味の重要な側面を捉えているのではないかと論じている。
概念的役割は、内部表現状態間の関係によって定義されるので、意味はモデルのアーキテクチャから決定できない。
- 参考スコア(独自算出の注目度): 14.26628686684198
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread success of large language models (LLMs) has been met with
skepticism that they possess anything like human concepts or meanings. Contrary
to claims that LLMs possess no meaning whatsoever, we argue that they likely
capture important aspects of meaning, and moreover work in a way that
approximates a compelling account of human cognition in which meaning arises
from conceptual role. Because conceptual role is defined by the relationships
between internal representational states, meaning cannot be determined from a
model's architecture, training data, or objective function, but only by
examination of how its internal states relate to each other. This approach may
clarify why and how LLMs are so successful and suggest how they can be made
more human-like.
- Abstract(参考訳): 大きな言語モデル(LLM)の成功は、それらが人間の概念や意味のようなものを持っていることに懐疑的だ。
LLMには何の意味も持たないという主張とは対照的に、意味の重要な側面を捉えている可能性があり、その上、意味が概念的な役割から生じる人間の認知の説得力のある説明を近似する作業を行っている。
概念的な役割は内部表現状態間の関係によって定義されるため、意味はモデルのアーキテクチャ、トレーニングデータ、客観的関数から決定することはできないが、内部状態が相互にどう関係しているかを調べることによってのみ決定される。
このアプローチは、LCMがなぜ、どのように成功しているかを明確にし、どのようにしてより人間らしくできるかを示唆する。
関連論文リスト
- Should We Fear Large Language Models? A Structural Analysis of the Human
Reasoning System for Elucidating LLM Capabilities and Risks Through the Lens
of Heidegger's Philosophy [0.0]
本研究では,Large Language Models(LLM)の能力とリスクについて検討する。
LLM内の単語関係の統計的パターンと、Martin Heidegger氏の概念である"ready-to-hand"と"present-at-hand"の間には、革新的な並列性がある。
以上の結果から, LLMには直接的説明推論と擬似論理推論の能力があるが, 真理的推論に乏しく, 創造的推論能力がないことが明らかとなった。
論文 参考訳(メタデータ) (2024-03-05T19:40:53Z) - Language Models Represent Beliefs of Self and Others [16.443525249852428]
本稿では,言語モデルのニューラルアクティベーションを通じて,様々なエージェントの観点から,信念の状態を線形に復号化できることを述べる。
我々は,モデルにおけるToMパフォーマンスの劇的な変化を観察し,社会的推論プロセスにおけるそれらの重要な役割を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-28T17:25:59Z) - Learning Interpretable Concepts: Unifying Causal Representation Learning
and Foundation Models [51.43538150982291]
人間の解釈可能な概念をデータから学習する方法を研究する。
両分野からアイデアをまとめ、多様なデータから概念を確実に回収できることを示す。
論文 参考訳(メタデータ) (2024-02-14T15:23:59Z) - Interpreting Pretrained Language Models via Concept Bottlenecks [55.47515772358389]
事前訓練された言語モデル(PLM)は、様々な自然言語処理タスクにおいて大きな進歩を遂げてきた。
ブラックボックスの性質による解釈可能性の欠如は、責任ある実装に課題をもたらす。
本研究では,人間にとって理解しやすい高レベルで有意義な概念を用いて,PLMを解釈する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T20:41:18Z) - Towards Concept-Aware Large Language Models [56.48016300758356]
概念は、学習、推論、コミュニケーションなど、様々な人間の認知機能において重要な役割を果たす。
概念を形作り、推論する能力を持つ機械を授けることは、ほとんどない。
本研究では,現代における大規模言語モデル(LLM)が,人間の概念とその構造をどのように捉えているかを分析する。
論文 参考訳(メタデータ) (2023-11-03T12:19:22Z) - Meaning and understanding in large language models [0.0]
人工知能の生成的大言語モデル(LLM)の最近の発展は、機械による言語理解に関する伝統的な哲学的仮定を改訂する必要があるという信念を導いた。
本稿では,機械語の性能を単なる統語的操作と見なす傾向と理解のシミュレーションを批判的に評価する。
論文 参考訳(メタデータ) (2023-10-26T14:06:14Z) - The Neuro-Symbolic Inverse Planning Engine (NIPE): Modeling
Probabilistic Social Inferences from Linguistic Inputs [50.32802502923367]
確率的目標推論領域における言語駆動の過程と社会的推論への影響について検討する。
本稿では,エージェントシナリオの言語入力から目標推定を行うニューロシンボリックモデルを提案する。
我々のモデルは人間の反応パターンと密に一致し、LLM単独の使用よりも人間の判断をより良く予測する。
論文 参考訳(メタデータ) (2023-06-25T19:38:01Z) - Large Language Models are In-Context Semantic Reasoners rather than
Symbolic Reasoners [75.85554779782048]
大規模言語モデル(LLM)は、近年、自然言語と機械学習コミュニティを興奮させています。
多くの成功を収めたアプリケーションにもかかわらず、そのようなコンテキスト内機能の基盤となるメカニズムはまだ不明である。
本研究では,学習した言語トークンのテクストセマンティクスが推論過程において最も重い処理を行うと仮定する。
論文 参考訳(メタデータ) (2023-05-24T07:33:34Z) - The Goldilocks of Pragmatic Understanding: Fine-Tuning Strategy Matters
for Implicature Resolution by LLMs [26.118193748582197]
我々は、広く使われている最先端モデルの4つのカテゴリを評価する。
2進推論を必要とする発話のみを評価するにもかかわらず、3つのカテゴリのモデルはランダムに近い性能を示す。
これらの結果は、特定の微調整戦略がモデルにおける実用的理解を誘導する上ではるかに優れていることを示唆している。
論文 参考訳(メタデータ) (2022-10-26T19:04:23Z) - Are Representations Built from the Ground Up? An Empirical Examination
of Local Composition in Language Models [91.3755431537592]
構成的・非構成的句を表現することは言語理解にとって重要である。
まず,より長いフレーズのLM-内部表現を,その構成成分から予測する問題を定式化する。
意味的構成性の人間の判断と相関する予測精度を期待するが、大部分はそうではない。
論文 参考訳(メタデータ) (2022-10-07T14:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。