論文の概要: Do LLMs have core beliefs?
- arxiv url: http://arxiv.org/abs/2605.03255v1
- Date: Tue, 05 May 2026 01:06:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.699359
- Title: Do LLMs have core beliefs?
- Title(参考訳): LLMは中核的な信念を持っているか?
- Authors: Anna Sokol, Marianna B. Ganapini, Nitesh V. Chawla,
- Abstract要約: ほとんどの大規模言語モデルは安定した世界観を維持することができません。
最近のモデルでは安定性が向上したが、会話のプレッシャーの下で重要なコミットメントを維持することはできなかった。
結果は、モデル世代間での議論的スキルの改善を文書化するが、現在のモデルにはすべて、人間レベルの認知の重要な要素が欠けていることを示している。
- 参考スコア(独自算出の注目度): 27.6114488899911
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of Large Language Models (LLMs) has sparked debate about whether these systems exhibit human-level cognition. In this debate, little attention has been paid to a structural component of human cognition: core beliefs, truths that provide a foundation around which we can build a worldview. These commitments usually resist debunking, as abandoning them would represent a fundamental shift in how we see reality. In this paper, we ask whether LLMs hold anything akin to core commitments. Using a probing framework we call Adversarial Dialogue Trees (ADTs) over five domains (science, history, geography, biology, and mathematics), we find that most LLMs fail to maintain a stable worldview. Though some recent models showed improved stability, they still eventually failed to maintain key commitments under conversational pressure. These results document an improvement in argumentative skills across model generations but indicate that all current models lack a key component of human-level cognition.
- Abstract(参考訳): LLM(Large Language Models)の台頭は、これらのシステムが人間レベルの認知を示すかどうかの議論を引き起こしている。
この議論では、人間の認知の構造的構成要素、すなわち、世界観を構築できる基盤を提供する信念、真実にはほとんど注意が払われていない。
これらのコミットメントは一般的に、現実の見方に根本的な変化をもたらすため、議論に抵抗する。
本稿では, LLM がコアコミットメントと何らかの関係を持つかどうかを問う。
探索フレームワークを用いて、5つの領域(科学、歴史、地理、生物学、数学)にまたがるAdversarial Dialogue Trees (ADTs) と呼ぶと、ほとんどのLLMは安定した世界観を維持することができません。
最近のモデルでは安定性が向上したが、結局は会話のプレッシャーの下で重要なコミットメントを維持することができなかった。
これらの結果は、モデル世代間での議論的スキルの改善を文書化するが、現在のモデルでは、人間レベルの認知の重要な要素が欠如していることを示している。
関連論文リスト
- Selective Deficits in LLM Mental Self-Modeling in a Behavior-Based Test of Theory of Mind [2.538209532048867]
心の理論は人類の普遍であり、社会世界をナビゲートし、操作することができる。
それは、私たち自身や他人のメンタルモデルを形成する能力によって支えられています。
我々は、被験者が自分自身や他人の精神状態を表現することを要求する実験パラダイムを開発する。
論文 参考訳(メタデータ) (2026-03-27T05:41:30Z) - Incoherent Beliefs & Inconsistent Actions in Large Language Models [33.54139088666698]
現実世界のタスクや環境は、大きな言語モデル(LLM)が一般的に評価される静的データセットとは異なる。
LLMのパフォーマンスの2つの重要な要素について検討する: LLMが彼らの信念を一貫性を持って更新する能力と、彼らが取っている行動がそれらの信念と整合している範囲である。
本結果は,複雑な実世界の環境下でのLCMの挙動を予測することの難しさを浮き彫りにする。
論文 参考訳(メタデータ) (2025-11-17T11:04:00Z) - What About the Scene with the Hitler Reference? HAUNT: A Framework to Probe LLMs' Self-consistency Via Adversarial Nudge [30.640398600941598]
幻覚は、大規模言語モデル(LLM)を高い領域に現実的に展開する上で重要な課題である。
本稿では, LLMにおける実力検査の枠組みについて述べる。
論文 参考訳(メタデータ) (2025-10-31T02:02:39Z) - BeHonest: Benchmarking Honesty in Large Language Models [23.192389530727713]
我々は、大規模言語モデルにおける誠実さを評価するために特別に設計された、先駆的なベンチマークであるBeHonestを紹介する。
BeHonest氏は、知識境界の認識、偽造の回避、応答の一貫性の3つの重要な側面を評価している。
以上の結果から,LSMの正直性には改善の余地がまだ残っていることが示唆された。
論文 参考訳(メタデータ) (2024-06-19T06:46:59Z) - "Understanding AI": Semantic Grounding in Large Language Models [0.0]
LLMを含む生成モデルが自己教師型学習の鍵となるため、私たちは最近、AIの世代的転換を目撃しました。
セマンティック・グラウンディングの課題を評価するために,5つの方法論を区別し,議論する。
論文 参考訳(メタデータ) (2024-02-16T14:23:55Z) - How should the advent of large language models affect the practice of
science? [51.62881233954798]
大規模言語モデルの出現は科学の実践にどのように影響を与えるべきか?
我々は4つの科学者グループを招待し、この質問を反映し、彼らの見解を共有し、議論をおこなった。
論文 参考訳(メタデータ) (2023-12-05T10:45:12Z) - The ART of LLM Refinement: Ask, Refine, and Trust [85.75059530612882]
ART: Ask, Refine, and Trust と呼ばれる改良目標を用いた推論を提案する。
LLMがいつその出力を洗練すべきかを決めるために必要な質問を尋ねる。
自己補充ベースラインよりも+5ポイントの性能向上を達成する。
論文 参考訳(メタデータ) (2023-11-14T07:26:32Z) - Mindstorms in Natural Language-Based Societies of Mind [110.05229611910478]
ミンスキーの「心の社会」とシュミットフーバーの「思考の学習」は、大規模なマルチモーダルニューラルネットワーク(NN)の多様な社会に刺激を与えた。
最近のNNベースの心の社会の実装は、大きな言語モデル(LLM)と、自然言語インタフェースを介してコミュニケーションする他のNNベースの専門家で構成されている。
これらの自然言語に基づく心の社会(NLSOMs)では、新しいエージェント(全員が同じ普遍的なシンボル言語を介して通信する)がモジュール化された方法で簡単に追加される。
論文 参考訳(メタデータ) (2023-05-26T16:21:25Z) - Language Models with Rationality [57.37201135072838]
大規模言語モデル(LLM)は質問応答(QA)に熟練している
答えが潜んでいる「信条」からどのように従うか(あるいはたとえも)は必ずしも明確ではない。
論文 参考訳(メタデータ) (2023-05-23T17:04:25Z) - Multimodal Chain-of-Thought Reasoning in Language Models [94.70184390935661]
言語(テキスト)と視覚(画像)のモダリティを2段階のフレームワークに組み込んだマルチモーダルCoTを提案する。
その結果,ScienceQA と A-OKVQA のベンチマークは,提案手法の有効性を示した。
論文 参考訳(メタデータ) (2023-02-02T07:51:19Z) - Event knowledge in large language models: the gap between the impossible
and the unlikely [46.540380831486125]
我々は,事前学習された大規模言語モデル (LLM) がイベント知識を持つことを示す。
彼らはほぼ常に、不可能な事象に対して高い確率を割り当てる。
しかし、おそらくは起こりそうもない出来事に対して、一貫性のない選好を示す。
論文 参考訳(メタデータ) (2022-12-02T23:43:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。