論文の概要: CAMEL-CLIP: Channel-aware Multimodal Electroencephalography-text Alignment for Generalizable Brain Foundation Models
- arxiv url: http://arxiv.org/abs/2603.13272v1
- Date: Fri, 27 Feb 2026 05:05:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.251428
- Title: CAMEL-CLIP: Channel-aware Multimodal Electroencephalography-text Alignment for Generalizable Brain Foundation Models
- Title(参考訳): CAMEL-CLIP:一般化可能な脳基礎モデルのためのチャネル対応多モード脳波テキストアライメント
- Authors: Hanseul Choi, Jinyeong Park, Seongwon Jin, Sungho Park, Jibum Kim,
- Abstract要約: マルチモーダルなEEGテキストアライメントコントラスト言語画像事前学習モデル(CAMEL-CLIP)を提案する。
我々は,CAMEL-CLIPが線形探索による最先端性能を実現し,フルファインタニングに依存した既存の基礎モデルより優れていることを示す。
- 参考スコア(独自算出の注目度): 5.527305245660595
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Electroencephalography (EEG) foundation models have shown promise for learning generalizable representations, yet they remain sensitive to channel heterogeneity, such as changes in channel composition or ordering. We propose channel-aware multimodal EEG-text alignment contrastive language-image pretraining (CAMEL-CLIP), a contrastive EEG-text multimodal foundation model designed to be robust to heterogeneous channel configurations and widely applicable to diverse downstream tasks. CAMEL-CLIP introduces three key components: (1) channel attribute-based positional encoding, which identifies channels through semantic information; (2) dynamic channel projection, which generates variable-length embeddings by independently projecting each channel without feature compression; and (3) dual-level contrastive learning, which jointly performs channel-level and sample-level contrastive learning to capture both channel-specific and global signal characteristics. Experimental results demonstrate that CAMEL-CLIP achieves state-of-the-art performance under linear-probing and outperforms existing foundation models that rely on full-finetuning.
- Abstract(参考訳): 脳波基礎モデル(EEG)では、一般化可能な表現の学習が約束されているが、チャネル構成の変化や順序付けなど、チャネルの不均一性に敏感である。
チャネル認識型マルチモーダルなEEG-テキストアライメント コントラッシブ言語-画像事前学習(CAMEL-CLIP)を提案する。
CAMEL-CLIPは,(1)チャネル属性に基づく位置符号化,(2)特徴圧縮を伴わずに各チャネルを独立に投影することで可変長の埋め込みを生成する動的チャネル投影,(3)チャネルレベルとサンプルレベルのコントラスト学習を併用してチャネル固有の信号特性とグローバルな信号特性の両方をキャプチャするデュアルレベルコントラスト学習,の3つの重要なコンポーネントを紹介する。
実験結果から, CAMEL-CLIPは線形探索による最先端性能を実現し, フルファインタニングに依存した既存基礎モデルより優れていた。
関連論文リスト
- DC-ViT: Modulating Spatial and Channel Interactions for Multi-Channel Images [9.507520646516719]
マルチチャネルイメージング(MCI)のトレーニングと評価は、異種チャネル構成のため、依然として困難である。
最近のMulti-Channel Vision Transformers (MC-ViTs)は、フレキシブルなチャネル入力を可能にすることでこの問題に対処している。
Decoupled Self-Attention (DSA)を用いて情報共有を明示的に制御するDecoupled Vision Transformer (DC-ViT)を提案する。
論文 参考訳(メタデータ) (2026-03-15T08:31:34Z) - EEGChaT: A Transformer-Based Modular Channel Selector for SEEG Analysis [33.75063804360241]
本稿では,SEEGデータ解析のための新しいトランスフォーマーベースのチャネル選択モジュールであるEEGChaTを提案する。
EEGChaTはデコード精度を継続的に改善し,最大17%の絶対ゲインを実現している。
その結果,EEGChaTは高次元SEEG解析におけるチャネル選択に有効で一般化可能な解であることが示唆された。
論文 参考訳(メタデータ) (2025-10-15T14:22:07Z) - Controllable diffusion-based generation for multi-channel biological data [66.44042377817074]
本研究では, 構造的および空間的生物学的データに対する制御可能生成のための統合拡散フレームワークを提案する。
空間的および非空間的予測タスクにまたがって,IMCにおけるタンパク質のインパルス化や単一セルデータセットにおける遺伝子対タンパク質の予測など,最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-06-24T00:56:21Z) - C3R: Channel Conditioned Cell Representations for unified evaluation in microscopy imaging [4.157406649742161]
本稿では,セルラー画像チャネルの構造的ビューを,コンテキストや概念にグループ化して紹介する。
IHCデータセットの統一評価を目的としたフレームワークであるChannel Conditioned Cell Representations (C3R) を開発した。
C3Rはチャネル適応型エンコーダアーキテクチャとマスク付き知識蒸留訓練戦略からなる2重フレームワークである。
論文 参考訳(メタデータ) (2025-05-24T15:24:05Z) - ChA-MAEViT: Unifying Channel-Aware Masked Autoencoders and Multi-Channel Vision Transformers for Improved Cross-Channel Learning [27.124745103676734]
ChA-MAEViTは、マルチチャネルイメージングチャネル間の特徴学習を強化するMAEベースの手法である。
我々はChA-MAEViTが最先端のMCI-ViTを3.0-21.5%上回っていることを示す。
論文 参考訳(メタデータ) (2025-03-25T03:45:59Z) - Interpreting Class Conditional GANs with Channel Awareness [57.01413866290279]
クラス条件生成器が複数のクラスの合成をどのように統合するかを検討する。
このような現象を説明するために、単一チャネルが最終合成にどのように貢献するかを定量的に特徴づけるチャネル認識を提案する。
我々のアルゴリズムは条件付きGANでいくつかの新しい応用を可能にする。
論文 参考訳(メタデータ) (2022-03-21T17:53:22Z) - Learning Signal Representations for EEG Cross-Subject Channel Selection
and Trial Classification [0.3553493344868413]
脳波記録の主観非依存チャネル選択のためのアルゴリズムを提案する。
チャネル固有の1D-畳み込みニューラルネットワーク(1D-CNN)を教師付き方法で特徴抽出器として利用し、クラス分離性を最大化する。
トレーニング後、選択されたチャネル固有の1D-CNNのパラメータ化されたサブグループのみを新しい被験者からの新たな信号に転送することで、アルゴリズムを活用できる。
論文 参考訳(メタデータ) (2021-06-20T06:22:16Z) - Learning from Heterogeneous EEG Signals with Differentiable Channel
Reordering [51.633889765162685]
CHARMは、一貫性のない入力チャネルをまたいだ単一のニューラルネットワークのトレーニング方法である。
我々は4つの脳波分類データセットの実験を行い、CHARMの有効性を実証した。
論文 参考訳(メタデータ) (2020-10-21T12:32:34Z) - Dual Attention GANs for Semantic Image Synthesis [101.36015877815537]
本稿では,写真リアリスティック・セマンティック・一貫性のあるイメージを合成するための新しいデュアルアテンションGAN(DAGAN)を提案する。
また,2つの新しいモジュール,すなわち位置対応空間アテンションモジュール(SAM)と規模対応チャネルアテンションモジュール(CAM)を提案する。
DAGANは、より少ないモデルパラメータを使用しながら、最先端のメソッドよりも驚くほど優れた結果が得られる。
論文 参考訳(メタデータ) (2020-08-29T17:49:01Z) - Channel Interaction Networks for Fine-Grained Image Categorization [61.095320862647476]
微妙なクラス間差のため、きめ細かい画像分類は困難である。
本稿では,チャネル・インタラクション・ネットワーク(CIN)を提案する。
我々のモデルは、多段階のトレーニングやテストを必要とせずに、エンドツーエンドで効率的にトレーニングすることができる。
論文 参考訳(メタデータ) (2020-03-11T11:51:51Z) - Channel Equilibrium Networks for Learning Deep Representation [63.76618960820138]
この研究は正規化と正則線型関数の組み合わせがチャネルを阻害することを示している。
阻害されたチャネルを単に取り除いた先行技術とは異なり、我々は、新しいニューラルネットワークビルディングブロックを設計することで、トレーニング中に「目を覚ます」ことを提案する。
Channel Equilibrium (CE) ブロックは、同じレイヤのチャネルが学習した表現に等しく寄与することを可能にする。
論文 参考訳(メタデータ) (2020-02-29T09:02:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。