論文の概要: Fair Cognitive Impairment Detection Through Unlearning
- arxiv url: http://arxiv.org/abs/2606.18571v1
- Date: Wed, 17 Jun 2026 00:44:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.946285
- Title: Fair Cognitive Impairment Detection Through Unlearning
- Title(参考訳): 未学習による公正な認知障害検出
- Authors: William Nguyen, Jiali Cheng, Hadi Amiri,
- Abstract要約: i) モーダル性(音声,テキスト,画像) と (ii) アンラーニングをグラデーション・リバーサルを用いて組み合わせたフレームワークを提案する。
提案手法は,MCI分類における最先端の多言語ベースラインおよび多モーダルベースラインより優れている。
さらに、データセット間の転送を分析し、人口統計学がMCI検出のためのより堅牢な表現の学習に役立つことを示す。
- 参考スコア(独自算出の注目度): 17.94428874004568
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Mild Cognitive Impairment (MCI) is a medical condition characterized by a noticeable decline in memory, language, or thinking abilities. MCI detection from spontaneous speech is promising for scalable screening. However, learned models often exploit demographic cues correlated with labels, resulting in a large performance gap across subgroups. We present a multimodal framework that combines (i) cross-model fusion between modalities (speech, text, and image), and (ii) unlearning using gradient reversal that discourages the shared embedding from encoding task-irrelevant demographic attributes. Evaluated on the multilingual benchmarks TAUKADIAL and PREPARE, our method outperforms the state-of-the-art multilingual and multimodal baseline in MCI classification while substantially reducing the performance gap across patient subgroups (sex and language). We further analyze transfer across datasets, showing that demographic unlearning helps learn more robust representations for MCI detection.
- Abstract(参考訳): 軽度認知障害 (MCI) は、記憶、言語、思考能力の顕著な低下を特徴とする医学的症状である。
自発音声からのMCI検出は、スケーラブルなスクリーニングに有効である。
しかし、学習モデルはしばしばラベルと相関する人口統計の手がかりを利用しており、結果としてサブグループ間で大きなパフォーマンスのギャップが生じる。
組み合わせたマルチモーダル・フレームワークを提案する。
(i)モダリティ(音声、テキスト、画像)とモデルの相互融合(音声、テキスト、画像)
(II)タスク非関連な階層属性の符号化から共有埋め込みを回避した勾配反転を用いたアンラーニング。
本手法は多言語ベンチマーク TAUKADIAL と PrePARE に基づいて,MCI 分類における最先端の多言語ベースライン,マルチモーダルベースラインよりも優れ,患者サブグループ(性と言語)間のパフォーマンスギャップを著しく低減する。
さらに、データセット間の転送を分析し、人口統計学がMCI検出のためのより堅牢な表現の学習に役立つことを示す。
関連論文リスト
- Multi-View Synergistic Learning with Vision-Language Adaption for Low-Resource Biomedical Image Classification [59.24009931000134]
MVSL(Multi-View Synergistic Learning)は、適応パラダイム、表現の粒度、疾患の意味的関係に対処する統合フレームワークである。
MVSLは、視覚的およびテキスト的エンコーダの適応を分離し、それぞれの表現特性を尊重する。
さらに、グローバルなイメージセマンティクスと局所的な病変レベルの証拠の両方を明示的にモデル化するために、多粒性コントラスト学習を導入する。
MVSLは、いくつかのショットとゼロショットの分類設定において、最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2026-04-27T02:41:27Z) - CFCML: A Coarse-to-Fine Crossmodal Learning Framework For Disease Diagnosis Using Multimodal Images and Tabular Data [54.816000602323726]
臨床診断にはクロスモーダル情報が必要である。
既存のクロスモーダル学習手法の多くは、主にハイレベルエンコーダ出力間の関係を探究することに焦点を当てている。
そこで本研究では,モダリティギャップを段階的に減少させるために,CFCML(coarse-to-fine crossmodal learning)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-20T15:01:33Z) - Tokenization and Morphological Fidelity in Uralic NLP: A Cross-Lingual Evaluation [9.23725598061561]
本研究は3つのサブワードパラダイムであるByte Pairを体系的に比較する。
BPE(Overlap BPE)、OBPE(Overlap BPE)、Unigram Language Model(Unigram Language Model)。
OBPEは従来手法よりも強い形態的アライメントとタグ付け精度を実現する。
論文 参考訳(メタデータ) (2026-02-04T05:59:25Z) - Linguistic and Audio Embedding-Based Machine Learning for Alzheimer's Dementia and Mild Cognitive Impairment Detection: Insights from the PROCESS Challenge [0.0]
音声は、音響的次元と言語的次元の両方を包含し、認知の低下に対して有望な非侵襲的バイオマーカーを提供する。
本稿では,自然発声音声からの音声埋め込みと言語的特徴を両立させるプロシージャチャレンジのための機械学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-02T06:54:55Z) - Frequency-domain Multi-modal Fusion for Language-guided Medical Image Segmentation [15.021321486871658]
臨床的テキストレポートをセマンティックガイダンスとして組み込むことにより、医用画像のセグメンテーションの精度を向上させることができる。
言語誘導型医用画像分割のための周波数領域マルチモーダルインタラクションモデル(FMISeg)を提案する。
論文 参考訳(メタデータ) (2025-09-24T03:02:38Z) - Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。
CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。
本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-01T01:51:31Z) - MulCogBench: A Multi-modal Cognitive Benchmark Dataset for Evaluating
Chinese and English Computational Language Models [44.74364661212373]
本稿では、中国語と英語のネイティブ参加者から収集した認知ベンチマークであるMulCogBenchを提案する。
主観的意味評価、視線追跡、機能的磁気共鳴画像(fMRI)、脳磁図(MEG)など、さまざまな認知データを含んでいる。
その結果、言語モデルは人間の認知データと大きな類似性を共有しており、類似性パターンはデータモダリティと刺激の複雑さによって変調されることがわかった。
論文 参考訳(メタデータ) (2024-03-02T07:49:57Z) - mCL-NER: Cross-Lingual Named Entity Recognition via Multi-view
Contrastive Learning [54.523172171533645]
CrossNERは多言語コーパスの不足により不均一な性能から生じる課題に直面している。
言語横断的名前付きエンティティ認識(mCL-NER)のためのマルチビューコントラスト学習を提案する。
40言語にまたがるXTREMEベンチマーク実験では、従来のデータ駆動型およびモデルベースアプローチよりもmCL-NERの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-08-17T16:02:29Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。