論文の概要: Effect of Kernel Size on CNN-Vision-Transformer-Based Gaze Prediction Using Electroencephalography Data
- arxiv url: http://arxiv.org/abs/2408.03478v1
- Date: Tue, 6 Aug 2024 23:34:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-08 14:16:39.518267
- Title: Effect of Kernel Size on CNN-Vision-Transformer-Based Gaze Prediction Using Electroencephalography Data
- Title(参考訳): 脳波データを用いたCNN-Vision-Transformer-based Gaze予測におけるカーネルサイズの影響
- Authors: Chuhui Qiu, Bugao Liang, Matthew L Key,
- Abstract要約: EEGベースの視線予測は、従来のビデオベースの視線追跡の代替となる新しい研究トピックである。
従来のSOTA法と比較して,脳波による視線予測の根平均2乗誤差を53.06mmに改善した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present an algorithm of gaze prediction from Electroencephalography (EEG) data. EEG-based gaze prediction is a new research topic that can serve as an alternative to traditional video-based eye-tracking. Compared to the existing state-of-the-art (SOTA) method, we improved the root mean-squared-error of EEG-based gaze prediction to 53.06 millimeters, while reducing the training time to less than 33% of its original duration. Our source code can be found at https://github.com/AmCh-Q/CSCI6907Project
- Abstract(参考訳): 本稿では,脳波データを用いた視線予測アルゴリズムを提案する。
EEGベースの視線予測は、従来のビデオベースの視線追跡の代替となる新しい研究トピックである。
従来のSOTA法と比較して,脳波による視線予測の2乗平均誤差を53.06mmに改善し,トレーニング時間を33%以下に短縮した。
ソースコードはhttps://github.com/AmCh-Q/CSCI6907Projectで確認できます。
関連論文リスト
- CEReBrO: Compact Encoder for Representations of Brain Oscillations Using Efficient Alternating Attention [53.539020807256904]
交互注意(CEReBrO)を用いた脳振動の表現のための圧縮法について紹介する。
トークン化方式は、チャネルごとのパッチで脳波信号を表現します。
本研究では,チャネル内時間的ダイナミックスとチャネル間空間的相関を共同でモデル化し,通常の自己アテンションに比べて6倍少ないメモリで2倍の速度向上を実現するための注意機構を提案する。
論文 参考訳(メタデータ) (2025-01-18T21:44:38Z) - Advancing EEG-Based Gaze Prediction Using Depthwise Separable Convolution and Enhanced Pre-Processing [0.8192907805418583]
本稿では,脳深度分離可能な畳み込みニューラルネットワーク(CNN)と視覚変換器を組み合わせたEEG-DCViT(Deeper Clustered Vision Transformer)を提案する。
この新しいアプローチは優れたパフォーマンスを示し、51.6mmのRoot Mean Square Error(RMSE)で新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2024-08-06T23:43:03Z) - Pseudo Channel: Time Embedding for Motor Imagery Decoding [0.0]
運動画像(MI)に基づく脳波は、外部デバイスを直接神経制御し、神経リハビリテーションを進めるためのフロンティアである。
本研究は、MI-EEG信号の復号精度を高めるために擬似チャネルとして使用される、旅行波ベースの時間埋め込みと呼ばれる新しい時間埋め込み手法を提案する。
論文 参考訳(メタデータ) (2024-05-21T12:55:11Z) - One step closer to EEG based eye tracking [1.4469849628263638]
脳波データを用いて視線位置を直接決定できる新しいディープニューラルネットワーク(DNN)を提案する。
我々は,脳波信号から直接視線決定を3.5cm MAEで行う場合と比較して改善する。
論文 参考訳(メタデータ) (2023-03-03T07:55:57Z) - Electrode Clustering and Bandpass Analysis of EEG Data for Gaze
Estimation [7.305979446312822]
我々は、脳波による視線追跡のために、高密度で高価な脳波キャップは必要ないことを実証することによって、過去の研究を拡張した。
データ駆動型アプローチを用いて、どの電極クラスターが視線推定に影響を及ぼし、異なるタイプのEEGデータ前処理がモデルの性能にどのように影響するかを確立する。
論文 参考訳(メタデータ) (2023-02-19T18:42:57Z) - The Preliminary Results on Analysis of TAIGA-IACT Images Using
Convolutional Neural Networks [68.8204255655161]
本研究の目的は,AIGA-IACTに設定された課題を解決するための機械学習アプリケーションの可能性を検討することである。
The method of Convolutional Neural Networks (CNN) was applied to process and analysis Monte-Carlo eventssimulated with CORSIKA。
論文 参考訳(メタデータ) (2021-12-19T15:17:20Z) - Transformer-based Spatial-Temporal Feature Learning for EEG Decoding [4.8276709243429]
本稿では,主に注意機構に依存する新しい脳波復号法を提案する。
我々はより少ないパラメータで、脳波の多分類化における最先端のレベルに達しました。
脳-コンピュータインタフェース(BCI)の実用性を促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2021-06-11T00:48:18Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - Video-based Facial Expression Recognition using Graph Convolutional
Networks [57.980827038988735]
我々は、ビデオベースの表情認識のための共通のCNN-RNNモデルに、GCN(Graph Convolutional Network)層を導入する。
我々は、CK+、Oulu-CASIA、MMIの3つの広く使われているデータセットと、AFEW8.0の挑戦的なワイルドデータセットについて、本手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-26T07:31:51Z) - A Computationally Efficient Multiclass Time-Frequency Common Spatial
Pattern Analysis on EEG Motor Imagery [164.93739293097605]
共通空間パターン(CSP)は脳波(EEG)運動画像(MI)の一般的な特徴抽出法である
本研究では,従来のCSPアルゴリズムを改良し,マルチクラスMI分類精度を改善し,計算処理の効率化を図る。
論文 参考訳(メタデータ) (2020-08-25T18:23:50Z) - Deep Learning for Content-based Personalized Viewport Prediction of
360-Degree VR Videos [72.08072170033054]
本稿では、位置データとビデオフレームコンテンツを活用して、将来の頭部の動きを予測するためのディープラーニングネットワークを提案する。
このニューラルネットワークに入力されるデータを最適化するために、このモデルのために、データサンプル率、データ削減、長期予測長についても検討する。
論文 参考訳(メタデータ) (2020-03-01T07:31:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。