Fugu-MT 論文翻訳(概要): Language Aligned Visual Representations Predict Human Behavior in Naturalistic Learning Tasks

論文の概要: Language Aligned Visual Representations Predict Human Behavior in Naturalistic Learning Tasks

arxiv url: http://arxiv.org/abs/2306.09377v1
Date: Thu, 15 Jun 2023 08:18:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-19 16:35:08.500057
Title: Language Aligned Visual Representations Predict Human Behavior in Naturalistic Learning Tasks
Title（参考訳）: 自然主義的学習課題における人間の行動を予測する言語対応視覚表現
Authors: Can Demircan, Tankred Saanum, Leonardo Pettini, Marcel Binz, Blazej M Baczkowski, Paula Kaanders, Christian F Doeller, Mona M Garvert, Eric Schulz
Abstract要約: 人間は自然物の関連する特徴を識別し、一般化する能力を持っている。カテゴリー学習と報奨学習の2つの実験を行った。参加者は数回の臨床試験で関連する刺激の特徴を特定できた。本研究では,多様な深層学習モデルの試行錯誤精度を評価するため,広範囲なモデル比較を行った。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Humans possess the ability to identify and generalize relevant features of natural objects, which aids them in various situations. To investigate this phenomenon and determine the most effective representations for predicting human behavior, we conducted two experiments involving category learning and reward learning. Our experiments used realistic images as stimuli, and participants were tasked with making accurate decisions based on novel stimuli for all trials, thereby necessitating generalization. In both tasks, the underlying rules were generated as simple linear functions using stimulus dimensions extracted from human similarity judgments. Notably, participants successfully identified the relevant stimulus features within a few trials, demonstrating effective generalization. We performed an extensive model comparison, evaluating the trial-by-trial predictive accuracy of diverse deep learning models' representations of human choices. Intriguingly, representations from models trained on both text and image data consistently outperformed models trained solely on images, even surpassing models using the features that generated the task itself. These findings suggest that language-aligned visual representations possess sufficient richness to describe human generalization in naturalistic settings and emphasize the role of language in shaping human cognition.
Abstract（参考訳）: 人間は自然物の関連する特徴を識別し、一般化する能力を持っており、様々な状況でそれらを助ける。この現象を調査し,人間の行動予測に最も効果的な表現を決定するために,カテゴリー学習と報酬学習の2つの実験を行った。実験では写実的なイメージを刺激として使用し,すべての実験で新たな刺激に基づいて正確な判断を行うことを課題とし,一般化を要した。両課題において, 人間の類似性判定から抽出した刺激次元を用いて, 基本ルールを単純な線形関数として生成した。特に、参加者はいくつかの試行で関連する刺激の特徴を同定し、効果的な一般化を示した。本研究では,多種多様な深層学習モデルの人間選択表現の試行錯誤精度を評価するため,広範囲なモデル比較を行った。興味深いことに、テキストと画像データの両方でトレーニングされたモデルからの表現は、画像のみでトレーニングされたモデルよりも一貫して優れています。これらの結果から,言語対応の視覚表現は,自然主義的な環境下での人間の一般化を記述するのに十分な豊かさを持っていることが示唆された。

関連論文リスト

Concept Probing: Where to Find Human-Defined Concepts (Extended Version) [3.2443914909457594]
本研究では,ニューラルネットワークモデルにおけるどのレイヤの表現を,人が定義した関心を持つ概念を探索する際に考慮すべきかを自動的に識別する手法を提案する。我々は、異なるニューラルネットワークモデルとデータセットに対する徹底的な経験的分析を通じて、この結果を検証する。
論文参考訳（メタデータ） (2025-07-24T16:30:10Z)
Concept-Guided Interpretability via Neural Chunking [54.73787666584143]
ニューラルネットワークは、トレーニングデータの規則性を反映した生の集団活動のパターンを示す。本稿では,ラベルの可利用性と次元性に基づいて,これら新たな実体を抽出する3つの手法を提案する。私たちの研究は、認知原則と自然主義的データの構造の両方を活用する、解釈可能性の新しい方向性を指し示しています。
論文参考訳（メタデータ） (2025-05-16T13:49:43Z)
Aligning Machine and Human Visual Representations across Abstraction Levels [42.86478924838503]
深層ニューラルネットワークは、視覚タスクにおける人間の振る舞いのモデルなど、幅広いアプリケーションで成功している。しかしながら、ニューラルネットワークのトレーニングと人間の学習は基本的な方法で異なり、ニューラルネットワークは人間のように堅牢に一般化できないことが多い。人間の概念的知識は、きめ細かいものから粗いものまで階層的に構成されているが、モデル表現は、これらの抽象レベルをすべて正確に捉えているわけではない。このミスアライメントに対処するために、私たちはまず、人間の判断を模倣するために教師モデルを訓練し、その表現から事前訓練された状態に人間のような構造を移す。
論文参考訳（メタデータ） (2024-09-10T13:41:08Z)
Towards Scalable and Versatile Weight Space Learning [51.78426981947659]
本稿では,重み空間学習におけるSANEアプローチを紹介する。ニューラルネットワーク重みのサブセットの逐次処理に向けて,超表現の概念を拡張した。
論文参考訳（メタデータ） (2024-06-14T13:12:07Z)
Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.04145324152541]
本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文参考訳（メタデータ） (2024-03-18T18:01:01Z)
Human-Like Geometric Abstraction in Large Pre-trained Neural Networks [6.650735854030166]
幾何学的視覚処理の認知科学における経験的結果を再考する。幾何学的視覚処理における3つの重要なバイアスを同定する。我々は、人間のバイアスを調査する文献からタスクをテストし、AIで使用される大規模なトレーニング済みニューラルネットワークモデルにより、より人間的な抽象幾何学的処理が示されることを示した。
論文参考訳（メタデータ） (2024-02-06T17:59:46Z)
On Modifying a Neural Network's Perception [3.42658286826597]
本研究では,人間の定義した概念に対して,人工ニューラルネットワークが知覚しているものを修正する手法を提案する。提案手法を異なるモデルで検証し、実行された操作がモデルによって適切に解釈されているかどうかを評価し、それらに対してどのように反応するかを解析する。
論文参考訳（メタデータ） (2023-03-05T12:09:37Z)
Human alignment of neural network representations [22.671101285994013]
ニューラルネットワークで学習した表現と行動応答から推定される人間の心的表現のアライメントに影響を与える要因について検討する。モデルスケールとアーキテクチャは基本的に人間の行動応答に影響を与えないことがわかった。食物や動物などの人間の概念はニューラルネットワークによってよく表現されているのに対し、ロイヤルやスポーツ関連の物体はそうではない。
論文参考訳（メタデータ） (2022-11-02T15:23:16Z)
Neural Novel Actor: Learning a Generalized Animatable Neural Representation for Human Actors [98.24047528960406]
本稿では,複数の人物の多視点画像のスパース集合から,汎用的アニマタブルなニューラル表現を学習するための新しい手法を提案する。学習された表現は、カメラのスパースセットから任意の人の新しいビューイメージを合成し、さらにユーザのポーズ制御でアニメーション化することができる。
論文参考訳（メタデータ） (2022-08-25T07:36:46Z)
Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文参考訳（メタデータ） (2022-02-01T17:11:13Z)
Overcoming the Domain Gap in Neural Action Representations [60.47807856873544]
3Dポーズデータは、手動で介入することなく、マルチビュービデオシーケンスから確実に抽出できる。本稿では,ニューラルアクション表現の符号化を,ニューラルアクションと行動拡張のセットと共に導くために使用することを提案する。ドメインギャップを減らすために、トレーニングの間、同様の行動をしているように見える動物間で神経と行動のデータを取り替える。
論文参考訳（メタデータ） (2021-12-02T12:45:46Z)
Seeing eye-to-eye? A comparison of object recognition performance in humans and deep convolutional neural networks under image manipulation [0.0]
本研究では,ヒトとフィードフォワードニューラルネットワークの視覚コア物体認識性能の行動比較を目的とした。精度分析の結果、人間はDCNNを全ての条件で上回るだけでなく、形状や色の変化に対する強い堅牢性も示している。
論文参考訳（メタデータ） (2020-07-13T10:26:30Z)
Adversarially-Trained Deep Nets Transfer Better: Illustration on Image Classification [53.735029033681435]
トランスファーラーニングは、訓練済みのディープニューラルネットワークを画像認識タスクに新しいドメインに適用するための強力な方法論である。本研究では,非逆学習モデルよりも逆学習モデルの方が優れていることを示す。
論文参考訳（メタデータ） (2020-07-11T22:48:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。