論文の概要: Not Yet AlphaFold for the Mind: Evaluating Centaur as a Synthetic Participant
- arxiv url: http://arxiv.org/abs/2508.07887v1
- Date: Mon, 11 Aug 2025 12:05:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.077833
- Title: Not Yet AlphaFold for the Mind: Evaluating Centaur as a Synthetic Participant
- Title(参考訳): AlphaFold for the Mind:Evaluating Centaur as a Synthetic Participant
- Authors: Sabrina Namazova, Alessandra Brondetta, Younes Strittmatter, Matthew Nassar, Sebastian Musslick,
- Abstract要約: 参加者シミュレータのコア基準を概観し,Centaurの適合性を評価する。
センターは強い予測精度を示すが、その生成行動は人間のデータから体系的に分岐する。
これは、Centaurが人間の行動を予測するための重要なステップである一方で、信頼性の高い参加者シミュレータや正確な認知モデルの標準を満たしていないことを示唆している。
- 参考スコア(独自算出の注目度): 40.2428948628001
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulators have revolutionized scientific practice across the natural sciences. By generating data that reliably approximate real-world phenomena, they enable scientists to accelerate hypothesis testing and optimize experimental designs. This is perhaps best illustrated by AlphaFold, a Nobel-prize winning simulator in chemistry that predicts protein structures from amino acid sequences, enabling rapid prototyping of molecular interactions, drug targets, and protein functions. In the behavioral sciences, a reliable participant simulator - a system capable of producing human-like behavior across cognitive tasks - would represent a similarly transformative advance. Recently, Binz et al. introduced Centaur, a large language model (LLM) fine-tuned on human data from 160 experiments, proposing its use not only as a model of cognition but also as a participant simulator for "in silico prototyping of experimental studies", e.g., to advance automated cognitive science. Here, we review the core criteria for a participant simulator and assess how well Centaur meets them. Although Centaur demonstrates strong predictive accuracy, its generative behavior - a critical criterion for a participant simulator - systematically diverges from human data. This suggests that, while Centaur is a significant step toward predicting human behavior, it does not yet meet the standards of a reliable participant simulator or an accurate model of cognition.
- Abstract(参考訳): シミュレーターは自然科学の科学実践に革命をもたらした。
現実世界の現象を確実に近似するデータを生成することで、仮説テストの加速と実験設計の最適化が可能になる。
アミノ酸配列からタンパク質構造を予測し、分子相互作用、薬物標的、タンパク質機能の迅速なプロトタイピングを可能にする。
行動科学では、認知的タスク全体にわたって人間のような振る舞いを生成できる、信頼できる参加者シミュレーターが、同様に変革的な進歩を表現している。
最近、BinzらはCentaurを紹介した。Centaurは160の実験から得られた人間のデータに基づいて微調整された大型言語モデル(LLM)であり、認知のモデルとしてだけでなく、自動認知科学の進歩のために「実験研究のシリコプロトタイプ」の参加者シミュレータとしての利用も提案している。
本稿では,参加者シミュレータのコア基準を概観し,Centaurの適合性を評価する。
Centaurは強い予測精度を示すが、その生成行動(参加者シミュレータにとって重要な基準)は、体系的に人間のデータから分岐する。
これは、Centaurが人間の行動を予測するための重要なステップである一方で、信頼性の高い参加者シミュレータや正確な認知モデルの標準を満たしていないことを示唆している。
関連論文リスト
- MOOSE-Chem3: Toward Experiment-Guided Hypothesis Ranking via Simulated Experimental Feedback [128.2992631982687]
本研究では,事前試験の結果に基づいて仮説を優先順位付けすることを目的とした,実験誘導ランキングの課題について紹介する。
本稿では,3つのドメインインフォームド仮定に基づいて,仮説性能を既知の基底的真理仮説に類似した関数としてモデル化するシミュレータを提案する。
実験結果を用いて,124の化学仮説のデータセットをキュレートし,シミュレーションの有効性を検証した。
論文 参考訳(メタデータ) (2025-05-23T13:24:50Z) - YuLan-OneSim: Towards the Next Generation of Social Simulator with Large Language Models [50.86336063222539]
本稿では,YuLan-OneSimというソーシャルシミュレータを紹介する。
ユーザは、シミュレータとの自然言語インタラクションを通じて、シミュレーションシナリオを記述し、洗練することができます。
我々は、経済学、社会学、政治、心理学、組織、人口統計学、法律、コミュニケーションを含む8つの領域にまたがる50のデフォルトシミュレーションシナリオを実装した。
論文 参考訳(メタデータ) (2025-05-12T14:05:17Z) - Centaur: a foundation model of human cognition [39.597528413316205]
本稿では,自然言語で表現可能な実験において,人間の行動を予測する計算モデルCentaurを紹介する。
我々は、サイコ-101と呼ばれる新しい大規模データセットに基づいて、最先端の言語モデルを微調整することでCentaurを導出した。
論文 参考訳(メタデータ) (2024-10-26T20:39:41Z) - LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。
本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。
法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文 参考訳(メタデータ) (2024-05-16T03:04:10Z) - Human Simulacra: Benchmarking the Personification of Large Language Models [38.21708264569801]
大規模言語モデル(LLM)は、人間の知性の側面を忠実に模倣するシステムとして認識されている。
本稿では,仮想キャラクタのライフストーリーをゼロから構築するためのフレームワークを提案する。
実験により, 構築したシミュラクラは, 対象キャラクタと一致した擬人化応答を生成できることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:11:14Z) - User Behavior Simulation with Large Language Model based Agents [116.74368915420065]
LLMベースのエージェントフレームワークを提案し,実際のユーザ動作をシミュレートするサンドボックス環境を設計する。
実験結果から,本手法のシミュレーション行動は実人の行動に非常に近いことが判明した。
論文 参考訳(メタデータ) (2023-06-05T02:58:35Z) - Predicting Real-time Scientific Experiments Using Transformer models and
Reinforcement Learning [0.0]
本稿では,リアルタイム科学実験をシミュレートするTransformerモデルに基づくエンコーダデコーダアーキテクチャを提案する。
概念実証として、このアーキテクチャは化学反応によって生じる振動に一連の機械的入力をマッピングするように訓練された。
本研究は, 学習者がリアルタイムな科学実験をモデル化し, ユーザが操作する時間によってどのように変化するかを示すものである。
論文 参考訳(メタデータ) (2022-04-25T15:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。