論文の概要: MAME: Multidimensional Adaptive Metamer Exploration with Human Perceptual Feedback
- arxiv url: http://arxiv.org/abs/2503.13212v2
- Date: Wed, 24 Sep 2025 03:30:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 16:23:42.161193
- Title: MAME: Multidimensional Adaptive Metamer Exploration with Human Perceptual Feedback
- Title(参考訳): MAME:人間の知覚フィードバックを用いた多次元適応メタマー探索
- Authors: Mina Kamao, Hayato Ono, Ayumu Yamashita, Kaoru Amano, Masataka Sawayama,
- Abstract要約: 広く採用されているアプローチは、システム内で物理的に異なるが知覚的に等価である「金属」を識別することである。
本稿では,ヒトメタマー空間の直接的,高次元的な探索を可能にする多次元適応メタマー探索フレームワークを提案する。
MAMEを用いて,1つの心理物理学実験において,多次元のヒトメタマー空間の測定に成功した。
- 参考スコア(独自算出の注目度): 0.40078827278053847
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Alignment between human brain networks and artificial models has become an active research area in vision science and machine learning. A widely adopted approach is identifying "metamers," stimuli physically different yet perceptually equivalent within a system. However, conventional methods lack a direct approach to searching for the human metameric space. Instead, researchers first develop biologically inspired models and then infer about human metamers indirectly by testing whether model metamers also appear as metamers to humans. Here, we propose the Multidimensional Adaptive Metamer Exploration (MAME) framework, enabling direct, high-dimensional exploration of human metameric spaces through online image generation guided by human perceptual feedback. MAME modulates reference images across multiple dimensions based on hierarchical neural network responses, adaptively updating generation parameters according to participants' perceptual discriminability. Using MAME, we successfully measured multidimensional human metameric spaces within a single psychophysical experiment. Experimental results using a biologically plausible CNN model showed that human discrimination sensitivity was lower for metameric images based on low-level features compared to high-level features, which image contrast metrics could not explain. The finding suggests a relatively worse alignment between the metameric spaces of humans and the CNN model for low-level processing compared to high-level processing. Counterintuitively, given recent discussions on alignment at higher representational levels, our results highlight the importance of early visual computations in shaping biologically plausible models. Our MAME framework can serve as a future scientific tool for directly investigating the functional organization of human vision.
- Abstract(参考訳): 人間の脳ネットワークと人工モデルとのアライメントは、視覚科学と機械学習において活発な研究領域となっている。
広く採用されているアプローチは、システム内で物理的に異なるが知覚的に等価である「金属」を識別することである。
しかし,従来の手法では,ヒトのメタマー空間の探索には直接的なアプローチが欠如している。
その代わり、研究者たちはまず生物にインスパイアされたモデルを開発し、その後、モデルメタマーがヒトにメタマーとして現れるかどうかをテストすることによって、ヒトのメタマーについて間接的に推測する。
本稿では、人間の知覚フィードバックによって導かれるオンライン画像生成を通じて、ヒトのメタメトリ空間の直接的かつ高次元的な探索を可能にする多次元適応メタマー探索(MAME)フレームワークを提案する。
MAMEは階層型ニューラルネットワーク応答に基づいて複数の次元にわたる参照画像を変調し、参加者の知覚的識別性に応じて生成パラメータを適応的に更新する。
MAMEを用いて,1つの心理物理学実験において,多次元のヒトメタマー空間の測定に成功した。
生物学的に評価可能なCNNモデルを用いた実験の結果,画像コントラストの指標が説明できない高次特徴に比べて,低次特徴に基づくメタメトリクス画像に対する人間の識別感度が低いことがわかった。
この発見は、ヒトのメタマー空間と低レベル処理のためのCNNモデルとのアライメントが、高レベル処理と比較して比較的悪いことを示唆している。
近年の高次表現レベルでのアライメントに関する議論から,本研究は生物学的に妥当なモデルを形成する上での早期視覚計算の重要性を強調した。
我々のMAMEフレームワークは、人間の視覚の機能的組織を直接調査するための将来の科学的ツールとして機能する。
関連論文リスト
- Understanding Cross-Model Perceptual Invariances Through Ensemble Metamers [2.9687381456164004]
本稿では,ニューラルネットワークのアンサンブルを利用したメタマー生成手法を提案する。
我々は、意味的忠実度や自然性などの要因を評価するために、画像に基づく一連の指標を用いる。
我々の研究では、畳み込みニューラルネットワークはより認識されやすく、人間に似たメタマーを生成する一方、視覚トランスフォーマーは現実的だが伝達しにくいメタマーを生成する。
論文 参考訳(メタデータ) (2025-04-02T13:51:19Z) - Evaluating Multiview Object Consistency in Humans and Image Models [68.36073530804296]
我々は、物体の形状に関するゼロショット視覚的推論を必要とする認知科学の実験的設計を活用する。
我々は500人以上の参加者から行動データの35万件の試行を収集した。
次に、一般的な視覚モデルの性能を評価する。
論文 参考訳(メタデータ) (2024-09-09T17:59:13Z) - Teaching CORnet Human fMRI Representations for Enhanced Model-Brain Alignment [2.035627332992055]
認知神経科学において広く用いられる技術として機能的磁気共鳴イメージング(fMRI)は、視覚知覚の過程における人間の視覚野の神経活動を記録することができる。
本研究では,SOTAビジョンモデルCORnetに基づくモデルであるReAlnet-fMRIを提案する。
fMRIを最適化したReAlnet-fMRIは、CORnetと制御モデルの両方においてヒトの脳との類似性が高く、また、内・内・対モダリティモデル脳(fMRI、EEG)も高い類似性を示した。
論文 参考訳(メタデータ) (2024-07-15T03:31:42Z) - Brain3D: Generating 3D Objects from fMRI [76.41771117405973]
被験者のfMRIデータを入力として利用する新しい3Dオブジェクト表現学習手法であるBrain3Dを設計する。
我々は,人間の視覚系の各領域の異なる機能的特徴を,我々のモデルが捉えていることを示す。
予備評価は、Brain3Dがシミュレーションシナリオで障害した脳領域を正常に識別できることを示唆している。
論文 参考訳(メタデータ) (2024-05-24T06:06:11Z) - Psychometry: An Omnifit Model for Image Reconstruction from Human Brain Activity [60.983327742457995]
人間の脳活動から見るイメージを再構築することで、人間とコンピュータのビジョンをBrain-Computer Interfaceを通して橋渡しする。
異なる被験者から得られた機能的磁気共鳴イメージング(fMRI)による画像再構成のための全能モデルであるサイコメトリを考案した。
論文 参考訳(メタデータ) (2024-03-29T07:16:34Z) - Achieving More Human Brain-Like Vision via Human EEG Representational Alignment [1.811217832697894]
非侵襲脳波に基づく人間の脳活動に対応する視覚モデル「Re(presentational)Al(ignment)net」を提案する。
我々の革新的な画像から脳への多層符号化フレームワークは、複数のモデル層を最適化することにより、人間の神経のアライメントを向上する。
我々の発見は、ReAlnetが人工と人間の視覚のギャップを埋め、より脳に似た人工知能システムへの道を歩むブレークスルーを表していることを示唆している。
論文 参考訳(メタデータ) (2024-01-30T18:18:41Z) - Enhancing HOI Detection with Contextual Cues from Large Vision-Language Models [56.257840490146]
ConCueは、HOI検出における視覚的特徴抽出を改善するための新しいアプローチである。
コンテクストキューをインスタンスと相互作用検出器の両方に統合するマルチトウワーアーキテクチャを用いたトランスフォーマーベースの特徴抽出モジュールを開発した。
論文 参考訳(メタデータ) (2023-11-26T09:11:32Z) - Evaluating alignment between humans and neural network representations in image-based learning tasks [5.657101730705275]
トレーニング済みの860ドルのニューラルネットワークモデルの表現が、人間の学習軌跡にどのようにマッピングされているかテストしました。
トレーニングデータセットのサイズは人間の選択に沿った中核的な決定要因であるのに対し、マルチモーダルデータ(テキストと画像)による対照的なトレーニングは、人間の一般化を予測するために現在公開されているモデルの一般的な特徴であることがわかった。
結論として、事前訓練されたニューラルネットワークは、タスク間で伝達可能な認知の基本的な側面を捉えているように見えるため、認知モデルのための表現を抽出するのに役立つ。
論文 参考訳(メタデータ) (2023-06-15T08:18:29Z) - Semantic Brain Decoding: from fMRI to conceptually similar image
reconstruction of visual stimuli [0.29005223064604074]
本稿では,意味的・文脈的類似性にも依存する脳復号法を提案する。
我々は、自然視のfMRIデータセットを使用し、人間の視覚におけるボトムアップとトップダウンの両方のプロセスの存在にインスパイアされたディープラーニングデコードパイプラインを作成します。
視覚刺激の再現は, それまでの文献において, 本来の内容とセマンティックレベルで非常によく一致し, 芸術の状態を超越している。
論文 参考訳(メタデータ) (2022-12-13T16:54:08Z) - Overcoming the Domain Gap in Neural Action Representations [60.47807856873544]
3Dポーズデータは、手動で介入することなく、マルチビュービデオシーケンスから確実に抽出できる。
本稿では,ニューラルアクション表現の符号化を,ニューラルアクションと行動拡張のセットと共に導くために使用することを提案する。
ドメインギャップを減らすために、トレーニングの間、同様の行動をしているように見える動物間で神経と行動のデータを取り替える。
論文 参考訳(メタデータ) (2021-12-02T12:45:46Z) - Fooling the primate brain with minimal, targeted image manipulation [67.78919304747498]
本稿では、行動に反映される神経活動と知覚の両方の変化をもたらす、最小限の標的画像摂動を生成するための一連の手法を提案する。
我々の研究は、敵対的攻撃、すなわち最小限のターゲットノイズによる画像の操作で同じ目標を共有し、ANNモデルに画像の誤分類を誘導する。
論文 参考訳(メタデータ) (2020-11-11T08:30:54Z) - MELD: Meta-Reinforcement Learning from Images via Latent State Models [109.1664295663325]
我々は,遅延状態モデルで推論を行う画像からメタRLのアルゴリズムを開発し,新しいスキルを素早く獲得する。
MELDは、画像から現実のロボット制御設定でトレーニングされた最初のメタRLアルゴリズムである。
論文 参考訳(メタデータ) (2020-10-26T23:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。