論文の概要: Inducing Dyslexia in Vision Language Models
- arxiv url: http://arxiv.org/abs/2509.24597v2
- Date: Tue, 30 Sep 2025 09:36:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:44:59.882188
- Title: Inducing Dyslexia in Vision Language Models
- Title(参考訳): 視覚言語モデルにおけるDyslexiaの誘導
- Authors: Melika Honarmand, Ayati Sharma, Badr AlKhamissi, Johannes Mehrer, Martin Schrimpf,
- Abstract要約: 我々は、ディプレクシアをシミュレートするために、大規模な視覚言語モデルを使用する。
VLM内の視覚単語選択単位を同定し、これらの単位の目標アブレーションが読解タスクの選択的障害につながることを示す。
- 参考スコア(独自算出の注目度): 6.080220062810505
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Dyslexia, a neurodevelopmental disorder characterized by persistent reading difficulties, is often linked to reduced activity of the visual word form area in the ventral occipito-temporal cortex. Traditional approaches to studying dyslexia, such as behavioral and neuroimaging methods, have provided valuable insights but remain limited in their ability to test causal hypotheses about the underlying mechanisms of reading impairments. In this study, we use large-scale vision-language models (VLMs) to simulate dyslexia by functionally identifying and perturbing artificial analogues of word processing. Using stimuli from cognitive neuroscience, we identify visual-word-form-selective units within VLMs and demonstrate that targeted ablation of these units, unlike ablation of random units, leads to selective impairments in reading tasks while general visual and language comprehension abilities remain intact. In particular, the resulting model matches dyslexic humans' phonological deficits without a significant change in orthographic processing. Taken together, our modeling results replicate key characteristics of dyslexia and establish a computational framework for investigating reading disorders.
- Abstract(参考訳): 持続的な読解困難を特徴とする神経発達障害であるDyslexiaは、腹側頭葉側頭葉皮質における視覚的単語形成領域の活性の低下と関連していることが多い。
行動学や神経画像学などの従来の研究手法は、貴重な洞察を与えてきたが、読影障害の根底にあるメカニズムについて因果仮説をテストする能力には限界がある。
本研究では,大規模視覚言語モデル(VLM)を用いて,単語処理の人工的類似を機能的に同定し,摂動することで失語をシミュレートする。
認知神経科学からの刺激を用いて、VLM内の視覚ワード選択単位を特定し、これらの単位の標的アブレーションは、ランダム単位のアブレーションとは異なり、一般的な視覚的・言語的理解能力が保たれる一方で、読解作業において選択的な障害をもたらすことを示した。
特に、結果として得られるモデルは、正書法処理に大きな変化を伴わずに、ディプレクシックヒトの音韻障害と一致している。
そこで,本研究では,失読症の主要な特徴を再現し,読影障害を解析するための計算枠組みを構築した。
関連論文リスト
- Devising a Set of Compact and Explainable Spoken Language Feature for Screening Alzheimer's Disease [52.46922921214341]
アルツハイマー病(AD)は高齢化社会において最も重要な健康問題の一つとなっている。
我々は,大言語モデル(LLM)とTF-IDFモデルの視覚的機能を活用する,説明可能な効果的な機能セットを考案した。
当社の新機能は、自動ADスクリーニングの解釈可能性を高めるステップバイステップで説明し、解釈することができる。
論文 参考訳(メタデータ) (2024-11-28T05:23:22Z) - Generative causal testing to bridge data-driven models and scientific theories in language neuroscience [82.995061475971]
脳における言語選択性の簡潔な説明を生成するためのフレームワークである生成因果テスト(GCT)を提案する。
GCTは機能的選択性に類似した脳領域の細粒度の違いを識別できることを示す。
論文 参考訳(メタデータ) (2024-10-01T15:57:48Z) - Negation Blindness in Large Language Models: Unveiling the NO Syndrome in Image Generation [63.064204206220936]
基礎的な大規模言語モデル(LLM)は、私たちが技術を理解する方法を変えました。
詩の執筆からコーディング、エッセイ生成、パズルの解決まで、様々な課題に長けていることが示されている。
画像生成機能の導入により、より包括的で汎用的なAIツールとなった。
現在特定されている欠陥には、幻覚、偏見、有害なコンテンツを生成するために制限されたコマンドをバイパスすることが含まれる。
論文 参考訳(メタデータ) (2024-08-27T14:40:16Z) - Handwriting Anomalies and Learning Disabilities through Recurrent Neural Networks and Geometric Pattern Analysis [0.0]
本研究では、高度な幾何学的パターンとリカレントニューラルネットワーク(RNN)を用いて、失読と失読を示す手書き異常を同定する。
書き起こしはまず標準化され、次にベースラインのずれ、文字の接続性、ストロークの厚さ、その他の異常に焦点を当てた特徴抽出が続く。
最初の結果は、このRNNモデルが、ジストレキシーとジストニアを併用して、最先端の性能を達成する能力を示した。
論文 参考訳(メタデータ) (2024-05-12T10:10:13Z) - Integrating large language models and active inference to understand eye movements in reading and dyslexia [0.0]
本稿では,階層型能動推論を用いた新しい計算モデルを提案し,視線と視線の動きをシミュレートする。
我々のモデルは、不適応な予測処理が、失読症に関連する読解障害をいかに生み出すかを理解するのに役立つ可能性がある。
論文 参考訳(メタデータ) (2023-08-09T13:16:30Z) - Information-Restricted Neural Language Models Reveal Different Brain
Regions' Sensitivity to Semantics, Syntax and Context [87.31930367845125]
テキストコーパスを用いて語彙言語モデルGloveと超語彙言語モデルGPT-2を訓練した。
そして、これらの情報制限されたモデルが、自然主義的テキストを聴く人間のfMRI信号の時間軸を予測することができるかを評価した。
分析の結果、言語に関わるほとんどの脳領域は、構文変数と意味変数の両方に敏感であるが、これらの影響の相対的な大きさは、これらの領域で大きく異なることがわかった。
論文 参考訳(メタデータ) (2023-02-28T08:16:18Z) - Eye-tracking based classification of Mandarin Chinese readers with and
without dyslexia using neural sequence models [7.639036130018945]
文全体の特徴を集約することなく刺激全体の眼球運動を処理する2つの簡単なシーケンスモデルを提案する。
言語刺激を,文脈的単語埋め込みと手作業による言語的特徴抽出という2つの方法でモデルに組み込む。
以上の結果から, (i) 中国語などの書体であっても, シークエンスモデルでは視線上のディプレクシアを分類し, 最先端のパフォーマンスを達成できることがわかった。
論文 参考訳(メタデータ) (2022-10-18T12:57:30Z) - CogAlign: Learning to Align Textual Neural Representations to Cognitive
Language Processing Signals [60.921888445317705]
自然言語処理モデルに認知言語処理信号を統合するためのCogAlignアプローチを提案する。
我々は、CogAlignが、パブリックデータセット上の最先端モデルよりも、複数の認知機能で大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-06-10T07:10:25Z) - On-the-Fly Attention Modularization for Neural Generation [54.912042110885366]
生成したテキストは反復的であり,汎用的であり,自己矛盾であり,常識を欠いている。
本研究は,インダクティブバイアスを推論中に注入する簡易かつ効果的な手法である,オンザフライアテンション・モダナイゼーションを動機とする。
論文 参考訳(メタデータ) (2021-01-02T05:16:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。