論文の概要: Resolving Domain Shift For Representations Of Speech In Non-Invasive Brain Recordings
- arxiv url: http://arxiv.org/abs/2410.19986v1
- Date: Fri, 25 Oct 2024 21:56:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:20:26.861400
- Title: Resolving Domain Shift For Representations Of Speech In Non-Invasive Brain Recordings
- Title(参考訳): 非侵襲的脳波記録における音声表現のためのドメインシフトの解決
- Authors: Jeremiah Ridge, Oiwi Parker Jones,
- Abstract要約: 脳磁図(MEG)を用いた非侵襲的データ収集に焦点を当てた。
私たちの知る限りでは、この研究はMEGニューロイメージングデータに基づく機能レベルの深層学習の初めての応用である。
- 参考スコア(独自算出の注目度): 3.5297361401370044
- License:
- Abstract: Machine learning techniques have enabled researchers to leverage neuroimaging data to decode speech from brain activity, with some amazing recent successes achieved by applications built using invasive devices. However, research requiring surgical implants has a number of practical limitations. Non-invasive neuroimaging techniques provide an alternative but come with their own set of challenges, the limited scale of individual studies being among them. Without the ability to pool the recordings from different non-invasive studies, data on the order of magnitude needed to leverage deep learning techniques to their full potential remains out of reach. In this work, we focus on non-invasive data collected using magnetoencephalography (MEG). We leverage two different, leading speech decoding models to investigate how an adversarial domain adaptation framework augments their ability to generalize across datasets. We successfully improve the performance of both models when training across multiple datasets. To the best of our knowledge, this study is the first ever application of feature-level, deep learning based harmonization for MEG neuroimaging data. Our analysis additionally offers further evidence of the impact of demographic features on neuroimaging data, demonstrating that participant age strongly affects how machine learning models solve speech decoding tasks using MEG data. Lastly, in the course of this study we produce a new open-source implementation of one of these models to the benefit of the broader scientific community.
- Abstract(参考訳): 機械学習の技術は、脳の活動から音声をデコードするために神経画像データを活用することができる。
しかし、外科的インプラントを必要とする研究には、いくつかの実用的な制限がある。
非侵襲的なニューロイメージング技術は代替手段を提供するが、個々の研究の規模が限られている、独自の課題が伴う。
異なる非侵襲的な研究から記録をプールする能力がなければ、深層学習のテクニックを最大限に活用するために必要な桁数のデータは、まだ手に入らないままだ。
本研究では,脳磁図(MEG)を用いて収集した非侵襲的データに着目した。
我々は、敵対的ドメイン適応フレームワークがデータセットをまたいで一般化する能力をいかに拡張するかを調べるために、2つの異なる主要な音声復号モデルを利用する。
複数のデータセットをまたいだトレーニングでは,両モデルのパフォーマンス向上に成功しています。
我々の知る限りでは、この研究はMEGニューロイメージングデータに対する特徴レベル、ディープラーニングに基づく調和化の初めての応用である。
我々の分析は、人口動態が神経画像データに与える影響をさらに証明し、参加者年齢がMEGデータを用いて機械学習モデルが音声復号タスクを解く方法に強く影響を与えることを示した。
最後に、この研究の過程で、より広い科学コミュニティの利益のために、これらのモデルの新たなオープンソース実装を作成します。
関連論文リスト
- Machine Learning on Dynamic Functional Connectivity: Promise, Pitfalls, and Interpretations [7.013079422694949]
機能神経画像の深部モデル設計のための実証的ガイドラインの確立を目指す。
fMRIを用いた認知的タスク認識と疾患診断におけるSOTA(State-of-the-arts)のパフォーマンスはどのようなものか?
以上の課題に対処するため,様々な場面で総合的な評価と統計的分析を行った。
論文 参考訳(メタデータ) (2024-09-17T17:24:17Z) - BrainSegFounder: Towards 3D Foundation Models for Neuroimage Segmentation [6.5388528484686885]
本研究は,医療基盤モデルの創出に向けた新しいアプローチを紹介する。
本稿では,視覚変換器を用いた2段階事前学習手法を提案する。
BrainFounderは、これまでの勝利ソリューションの成果を上回る、大幅なパフォーマンス向上を実演している。
論文 参考訳(メタデータ) (2024-06-14T19:49:45Z) - The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning [3.649801602551928]
我々は、異種録音からの学習を表現するために、神経科学にインスパイアされた自己教師対象のセットをニューラルネットワークとともに開発する。
その結果、これらの目的によって学習された表現は、データとともにスケールし、主題、データセット、タスクをまたいで一般化し、同等の自己監督的アプローチを上回ります。
論文 参考訳(メタデータ) (2024-06-06T17:59:09Z) - MindBridge: A Cross-Subject Brain Decoding Framework [60.58552697067837]
脳の復号化は、獲得した脳信号から刺激を再構築することを目的としている。
現在、脳の復号化はモデルごとのオブジェクトごとのパラダイムに限られている。
我々は,1つのモデルのみを用いることで,オブジェクト間脳デコーディングを実現するMindBridgeを提案する。
論文 参考訳(メタデータ) (2024-04-11T15:46:42Z) - UniBrain: Universal Brain MRI Diagnosis with Hierarchical
Knowledge-enhanced Pre-training [66.16134293168535]
我々はUniBrainと呼ばれるユニバーサル脳MRI診断のための階層的知識強化事前訓練フレームワークを提案する。
具体的には、UniBrainは、定期的な診断から24,770のイメージレポートペアの大規模なデータセットを活用する。
論文 参考訳(メタデータ) (2023-09-13T09:22:49Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - Domain Shift in Computer Vision models for MRI data analysis: An
Overview [64.69150970967524]
機械学習とコンピュータビジョン手法は、医用画像解析において優れた性能を示している。
しかし、現在臨床応用はごくわずかである。
異なるソースや取得ドメインのデータへのモデルの不適切な転送性は、その理由の1つです。
論文 参考訳(メタデータ) (2020-10-14T16:34:21Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Knowledge Distillation for Brain Tumor Segmentation [0.0]
本研究では,学習過程におけるモデルの性能とデータ量との関係について検討する。
追加データでトレーニングされた単一のモデルは、複数のモデルのアンサンブルに近いパフォーマンスを達成し、個々のメソッドより優れています。
論文 参考訳(メタデータ) (2020-02-10T12:44:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。