論文の概要: Machine Psychophysics: Cognitive Control in Vision-Language Models
- arxiv url: http://arxiv.org/abs/2505.18969v1
- Date: Sun, 25 May 2025 04:23:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.792407
- Title: Machine Psychophysics: Cognitive Control in Vision-Language Models
- Title(参考訳): 機械心理学 : 視覚・言語モデルにおける認知制御
- Authors: Dezhi Luo, Maijunxian Wang, Bingyang Wang, Tianwei Zhao, Yijiang Li, Hokin Deng,
- Abstract要約: 我々は,3つの古典的コンフリクトタスクと,2,220回のトライアルにおいて,より要求の大きい「二乗」変異に対して108の視覚言語モデルを評価する。
結果は、現在のマルチモーダル基盤モデルにおいて、ある種の人間のようなエグゼクティブ関数が出現したことを示唆している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cognitive control refers to the ability to flexibly coordinate thought and action in pursuit of internal goals. A standard method for assessing cognitive control involves conflict tasks that contrast congruent and incongruent trials, measuring the ability to prioritize relevant information while suppressing interference. We evaluate 108 vision-language models on three classic conflict tasks and their more demanding "squared" variants across 2,220 trials. Model performance corresponds closely to human behavior under resource constraints and reveals individual differences. These results indicate that some form of human-like executive function have emerged in current multi-modal foundational models.
- Abstract(参考訳): 認知制御とは、内的目標を追求する際の思考と行動を柔軟に調整する能力である。
認知的制御を評価する標準的な方法は、矛盾を抑えながら関連する情報を優先順位付けする能力を測定することで、矛盾と矛盾した試行を対比する競合タスクを含む。
我々は,3つの古典的コンフリクトタスクと,2,220回のトライアルにおいて,より要求の多い「二乗」変種について108の視覚言語モデルを評価する。
モデルの性能は、リソース制約の下での人間の振る舞いと密接に対応し、個人差を明らかにします。
これらの結果は、現在のマルチモーダル基盤モデルにおいて、ある種の人間のようなエグゼクティブ関数が出現したことを示している。
関連論文リスト
- Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering and Manipulating Human Perceptual Variability [8.068477554057475]
認知的タスクや日常生活における人間の意思決定は、タスクの難易度、個人の好み、個人的な経験などの要因によって形成される、かなりの多様性を示す。
本稿では、ANNにおける知覚境界サンプリングと人間の行動実験を組み合わせて、この現象を解明する計算フレームワークを提案する。
我々の知覚境界サンプリングアルゴリズムは、ANN決定境界に沿って刺激を生成し、本質的に重要な知覚変数を誘導する。
論文 参考訳(メタデータ) (2025-05-06T15:44:42Z) - Testing the limits of fine-tuning to improve reasoning in vision language models [51.58859621164201]
視覚認知タスクにおける視覚刺激と人間の判断を導入し,認知領域間でのパフォーマンスを評価する。
我々は、直感的な物理と因果推論のために、地上の真理データに基づいてモデルを微調整する。
微調整は、他の視覚的特徴を持つデータや、他の認知領域におけるタスクに対する人間のような堅牢な一般化に寄与しない。
論文 参考訳(メタデータ) (2025-02-21T18:58:30Z) - Mimicking Human Intuition: Cognitive Belief-Driven Q-Learning [5.960184723807347]
本稿では,主観的信念モデリングをQラーニングフレームワークに統合した認知的信念駆動型Qラーニング(CBDQ)を提案する。
CBDQは、人間のような学習能力と推論能力を持つエージェントを提供することで、意思決定の精度を高める。
各種複雑環境における離散制御ベンチマークタスクについて,提案手法の評価を行った。
論文 参考訳(メタデータ) (2024-10-02T16:50:29Z) - Benchmarking Continual Learning from Cognitive Perspectives [14.867136605254975]
継続的な学習は、古い概念を破滅的に忘れることなく、継続的に知識を取得し、伝達する問題に対処する。
連続学習モデルの認知特性と評価方法にはミスマッチがある。
本稿では,モデル認知能力と評価指標を統一評価パラダイムに統合することを提案する。
論文 参考訳(メタデータ) (2023-12-06T06:27:27Z) - Enhancing HOI Detection with Contextual Cues from Large Vision-Language Models [56.257840490146]
ConCueは、HOI検出における視覚的特徴抽出を改善するための新しいアプローチである。
コンテクストキューをインスタンスと相互作用検出器の両方に統合するマルチトウワーアーキテクチャを用いたトランスフォーマーベースの特徴抽出モジュールを開発した。
論文 参考訳(メタデータ) (2023-11-26T09:11:32Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - Explaining by Imitating: Understanding Decisions by Interpretable Policy
Learning [72.80902932543474]
観察されたデータから人間の行動を理解することは、意思決定における透明性と説明責任にとって重要である。
意思決定者の方針をモデル化することが困難である医療などの現実的な設定を考えてみましょう。
本稿では, 設計による透明性の向上, 部分観測可能性の確保, 完全にオフラインで動作可能なデータ駆動型意思決定行動の表現を提案する。
論文 参考訳(メタデータ) (2023-10-28T13:06:14Z) - Modeling Human Behavior Part II -- Cognitive approaches and Uncertainty [0.0]
第1部では,システムの探索から行動モデルを生成する手法と,提示された行動に基づくフィードバックについて論じる。
本研究は、人間の推論で示される認知能力、限界、偏見に焦点をあてる手法の観点から、引き続き議論を続ける。
論文 参考訳(メタデータ) (2022-05-13T07:29:15Z) - Empirical Estimates on Hand Manipulation are Recoverable: A Step Towards
Individualized and Explainable Robotic Support in Everyday Activities [80.37857025201036]
ロボットシステムの鍵となる課題は、他のエージェントの振る舞いを理解することである。
正しい推論の処理は、(衝突)因子が実験的に制御されない場合、特に困難である。
人に関する観察研究を行うために必要なツールをロボットに装備することを提案する。
論文 参考訳(メタデータ) (2022-01-27T22:15:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。