論文の概要: Human Adults and LLMs as Scientists: Who Benefits from Active Exploration?
- arxiv url: http://arxiv.org/abs/2606.06464v1
- Date: Thu, 04 Jun 2026 17:53:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:45.018364
- Title: Human Adults and LLMs as Scientists: Who Benefits from Active Exploration?
- Title(参考訳): 科学者としての大人とLLM : アクティブ・エクスプロレーションの恩恵は?
- Authors: Mandana Samiei, Eunice Yiu, Anthony GX-Chen, Dongyan Lin, Jocelyn Shen, Blake A. Richards, Alison Gopnik, Doina Precup,
- Abstract要約: 活発な探索が成人の結節性因果推論を大幅に改善することを示す。
いくつかの最先端モデルは仮説推定精度で人間レベルの性能にアプローチするが、より効率的な探索戦略や同様の共役的性能ギャップを示すことが多い。
- 参考スコア(独自算出の注目度): 27.982332448366183
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A long-standing finding in the causal learning literature is that adults struggle to identify conjunctive causal rules, where an effect requires the simultaneous presence of multiple causes, while performing better in disjunctive settings. However, most demonstrations of this ``conjunctive handicap'' rely on passive observation paradigms with limited evidence, where learners have no control over evidence generation. This paper asks whether this bias persists when adults are granted agency through active exploration. Using a modified ``blicket detector'' task, adult participants freely intervened to identify causal objects under conjunctive or disjunctive rule structures. We show that active exploration substantially improves adults' conjunctive causal reasoning, although conjunctive rules still require more tests to infer than disjunctive rules. We further compare human performance to a range of large language models in the same setting. While some state-of-the-art models approach human-level performance on hypothesis inference accuracy, they often exhibit less efficient exploration strategies and similar conjunctive-disjunctive performance gaps.
- Abstract(参考訳): 因果学習文学における長年の発見は、大人が共役因果規則の特定に苦慮していることである。
しかし,この「接続ハンディキャップ」の実証の多くは,学習者が証拠生成を制御できないような限られた証拠を持つ受動的観察パラダイムに依存している。
本稿では,このバイアスが,活動的な探索を通じて成人にエージェンシーが付与された場合に持続するかどうかを問う。
修正された'blicket detector'タスクを使用して、成体参加者は自由に介入し、結節的または解離的規則構造の下で因果的対象を識別した。
有意な探索は成人の結節的因果推論を著しく改善するが、結節的規則はいまだに結節的規則よりも推論により多くのテストを必要とする。
我々はさらに、人間のパフォーマンスを、同じ設定で様々な大きな言語モデルと比較する。
いくつかの最先端モデルは仮説推定精度で人間レベルの性能にアプローチするが、より効率的な探索戦略や同様の共役的性能ギャップを示すことが多い。
関連論文リスト
- Exploring Human Behavior During Abstract Rule Inference and Problem Solving with the Cognitive Abstraction and Reasoning Corpus [0.32834818175343855]
人間は抽象的推論において顕著な柔軟性を示し、緩やかな例から素早く学習し、規則を適用することができる。
抽象・推論コーパス(ARC)の多種多様な人間適応サブセットである認知抽象・推論コーパス(CogARC)を紹介する。
CogARCは、75の抽象的な視覚的推論問題に対する解を自由に生成する260人の参加者に投与された。
論文 参考訳(メタデータ) (2026-02-25T21:01:47Z) - Using AI to replicate human experimental results: a motion study [0.11838866556981258]
本稿では,言語研究における信頼性の高い解析ツールとして,大規模言語モデル(LLM)の可能性について検討する。
動作動詞の行儀を含む時間表現における感情的意味の出現に焦点を当てる。
論文 参考訳(メタデータ) (2025-07-14T14:47:01Z) - Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists? [42.29911505696807]
言語モデル(LM)エージェントは、自律的な意思決定者としてますます使われている。
LMの因果関係を探索・推測する能力について検討する。
LMは共通で直感的な因果関係を確実に推測するが、体系的には特異だが等しく、共役関係を証明している。
論文 参考訳(メタデータ) (2025-05-14T17:59:35Z) - UNcommonsense Reasoning: Abductive Reasoning about Uncommon Situations [62.71847873326847]
異常、予期せぬ、そしてありそうもない状況をモデル化する能力について検討する。
予期せぬ結果のコンテキストが与えられた場合、このタスクは説明を生成するために故意に推論する必要がある。
私たちはUNcommonsenseという新しい英語コーパスをリリースします。
論文 参考訳(メタデータ) (2023-11-14T19:00:55Z) - Sensitivity, Performance, Robustness: Deconstructing the Effect of
Sociodemographic Prompting [64.80538055623842]
社会デマトグラフィープロンプトは、特定の社会デマトグラフィープロファイルを持つ人間が与える答えに向けて、プロンプトベースのモデルの出力を操縦する技術である。
ソシオデマトグラフィー情報はモデル予測に影響を及ぼし、主観的NLPタスクにおけるゼロショット学習を改善するのに有用であることを示す。
論文 参考訳(メタデータ) (2023-09-13T15:42:06Z) - Causal Triplet: An Open Challenge for Intervention-centric Causal
Representation Learning [98.78136504619539]
Causal Tripletは、視覚的に複雑なシーンを特徴とする因果表現学習ベンチマークである。
この結果から,不整合表現やオブジェクト中心表現の知識によって構築されたモデルが,分散表現よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-01-12T17:43:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。