論文の概要: A Survey on Bridging EEG Signals and Generative AI: From Image and Text to Beyond
- arxiv url: http://arxiv.org/abs/2502.12048v1
- Date: Mon, 17 Feb 2025 17:16:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:13:41.064828
- Title: A Survey on Bridging EEG Signals and Generative AI: From Image and Text to Beyond
- Title(参考訳): 脳波信号と生成AIの橋渡しに関する調査:画像からテキストまで
- Authors: Shreya Shukla, Jose Torres, Abhijit Mishra, Jacek Gwizdka, Shounak Roychowdhury,
- Abstract要約: Brain-Computer Interfaces (BCI) とGenerative Artificial Intelligence (GenAI) の統合により、脳信号復号における新たなフロンティアが開かれた。
近年、GAN(Generative Adversarial Networks)やLLM(Transformer-based Large Language Models)といったディープラーニングの進歩により、脳波による画像、テキスト、音声の生成が大幅に改善されている。
- 参考スコア(独自算出の注目度): 4.720913027054481
- License:
- Abstract: Integration of Brain-Computer Interfaces (BCIs) and Generative Artificial Intelligence (GenAI) has opened new frontiers in brain signal decoding, enabling assistive communication, neural representation learning, and multimodal integration. BCIs, particularly those leveraging Electroencephalography (EEG), provide a non-invasive means of translating neural activity into meaningful outputs. Recent advances in deep learning, including Generative Adversarial Networks (GANs) and Transformer-based Large Language Models (LLMs), have significantly improved EEG-based generation of images, text, and speech. This paper provides a literature review of the state-of-the-art in EEG-based multimodal generation, focusing on (i) EEG-to-image generation through GANs, Variational Autoencoders (VAEs), and Diffusion Models, and (ii) EEG-to-text generation leveraging Transformer based language models and contrastive learning methods. Additionally, we discuss the emerging domain of EEG-to-speech synthesis, an evolving multimodal frontier. We highlight key datasets, use cases, challenges, and EEG feature encoding methods that underpin generative approaches. By providing a structured overview of EEG-based generative AI, this survey aims to equip researchers and practitioners with insights to advance neural decoding, enhance assistive technologies, and expand the frontiers of brain-computer interaction.
- Abstract(参考訳): Brain-Computer Interfaces(BCI)とGenerative Artificial Intelligence(GenAI)の統合は、脳信号復号における新たなフロンティアを開放し、補助コミュニケーション、神経表現学習、マルチモーダル統合を可能にした。
脳波(EEG)を利用するBCIは、神経活動を意味のある出力に変換する非侵襲的な手段を提供する。
近年、GAN(Generative Adversarial Networks)やLLM(Transformer-based Large Language Models)といったディープラーニングの進歩により、脳波による画像、テキスト、音声の生成が大幅に改善されている。
本稿では,脳波を用いたマルチモーダル生成の現状と展望について述べる。
一 GAN、変分オートエンコーダ(VAE)及び拡散モデルによる脳波画像生成及び
(II)トランスフォーマーに基づく言語モデルとコントラスト学習手法を利用した脳波からテキストへの生成
さらに、進化するマルチモーダルフロンティアであるEEG-to-Speech合成の出現領域についても論じる。
我々は、生成的アプローチを支える主要なデータセット、ユースケース、課題、EEG機能エンコーディング方法を強調します。
脳波に基づく生成AIの構造的概要を提供することで、この調査は、神経復号の進歩、補助技術の向上、脳とコンピュータの相互作用のフロンティアの拡大に関する洞察を研究者や実践者に与えることを目的としている。
関連論文リスト
- A Survey of Spatio-Temporal EEG data Analysis: from Models to Applications [20.54846023209402]
本調査は,脳活動の理解と解釈を変革するための新しい手法と技術に焦点を当てる。
我々は、脳信号の堅牢な表現を可能にする自己教師あり学習手法を探求する。
また,グラフニューラルネットワーク(GNN)や基礎モデル,大規模言語モデル(LLM)に基づくアプローチなど,新たな差別的手法についても検討する。
この調査は、これらの最先端技術、その応用、そして彼らが将来の研究および臨床実践に持つ深い影響について、広範囲にわたる概要を提供している。
論文 参考訳(メタデータ) (2024-09-26T08:09:15Z) - EEG decoding with conditional identification information [7.873458431535408]
脳波信号を復号することは、人間の脳を解き放ち、脳とコンピュータのインターフェースを進化させるのに不可欠である。
従来の機械学習アルゴリズムは、高ノイズレベルと脳波信号の個人間変動によって妨げられている。
ディープニューラルネットワーク(DNN)の最近の進歩は、その高度な非線形モデリング能力のために、将来性を示している。
論文 参考訳(メタデータ) (2024-03-21T13:38:59Z) - BRIEDGE: EEG-Adaptive Edge AI for Multi-Brain to Multi-Robot Interaction [4.815698105652729]
BRIEDGEは、EEG適応型ニューラルネットワークと符号化復号通信フレームワークを通じて、マルチ脳からマルチロボットインタラクションのためのエンドツーエンドシステムである。
符号化復号通信フレームワークは、EEGベースのセマンティック情報をエンコードし、データ転送の過程でコマンドに復号する。
実験の結果,BRIEDGEは異種脳波データの最適分類精度と,雑音環境下でのより安定した性能を実現していることがわかった。
論文 参考訳(メタデータ) (2024-03-14T15:43:48Z) - Enhancing EEG-to-Text Decoding through Transferable Representations from Pre-trained Contrastive EEG-Text Masked Autoencoder [69.7813498468116]
コントラスト型脳波テキストマスケード自動エンコーダ(CET-MAE)を提案する。
また、E2T-PTR(Pretrained Transferable Representationsを用いたEEG-to-Text decoding)と呼ばれるフレームワークを開発し、EEGシーケンスからテキストをデコードする。
論文 参考訳(メタデータ) (2024-02-27T11:45:21Z) - A Knowledge-Driven Cross-view Contrastive Learning for EEG
Representation [48.85731427874065]
本稿では,限られたラベルを持つ脳波から効果的な表現を抽出する知識駆動型クロスビューコントラスト学習フレームワーク(KDC2)を提案する。
KDC2法は脳波信号の頭皮と神経のビューを生成し、脳活動の内部および外部の表現をシミュレートする。
ニューラル情報整合性理論に基づく事前のニューラル知識をモデル化することにより、提案手法は不変かつ相補的なニューラル知識を抽出し、複合表現を生成する。
論文 参考訳(メタデータ) (2023-09-21T08:53:51Z) - RenAIssance: A Survey into AI Text-to-Image Generation in the Era of
Large Model [93.8067369210696]
テキスト・ツー・イメージ生成(テキスト・トゥ・イメージ・ジェネレーション、英: Text-to-image Generation、TTI)とは、テキスト入力を処理し、テキスト記述に基づいて高忠実度画像を生成するモデルである。
拡散モデル (diffusion model) は、繰り返しステップによるノイズの体系的導入を通じて画像の生成に使用される顕著な生成モデルである。
大規模モデルの時代、モデルサイズを拡大し、大規模言語モデルとの統合により、TTIモデルの性能がさらに向上した。
論文 参考訳(メタデータ) (2023-09-02T03:27:20Z) - A Comprehensive Survey of AI-Generated Content (AIGC): A History of
Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。
AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文 参考訳(メタデータ) (2023-03-07T20:36:13Z) - The evolution of AI approaches for motor imagery EEG-based BCIs [2.294014185517203]
運動画像(MI)脳波(EEG)ベースの脳コンピュータインタフェース(BCI)は、人間と機械の直接通信を可能にする。
これらのシステムは、医療分野からエンターテイメント産業にまたがるアプリケーションを開発する可能性を開く。
人工知能(AI)アプローチは、特にBCIユーザに正しい一貫性のあるフィードバックを提供したい場合に、基本的な重要性を持つ。
論文 参考訳(メタデータ) (2022-10-11T07:42:54Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - EEG-based Brain-Computer Interfaces (BCIs): A Survey of Recent Studies
on Signal Sensing Technologies and Computational Intelligence Approaches and
their Applications [65.32004302942218]
Brain-Computer Interface (BCI) はユーザとシステム間の強力なコミュニケーションツールである。
近年の技術進歩は、脳波(EEG)に基づく翻訳医療用BCIへの関心が高まっている。
論文 参考訳(メタデータ) (2020-01-28T10:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。