論文の概要: Omni-iEEG: A Large-Scale, Comprehensive iEEG Dataset and Benchmark for Epilepsy Research
- arxiv url: http://arxiv.org/abs/2602.16072v1
- Date: Tue, 17 Feb 2026 22:55:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.4619
- Title: Omni-iEEG: A Large-Scale, Comprehensive iEEG Dataset and Benchmark for Epilepsy Research
- Title(参考訳): Omni-iEEG: てんかん研究のための大規模総合的iEEGデータセットとベンチマーク
- Authors: Chenda Duan, Yipeng Zhang, Sotaro Kanai, Yuanyi Ding, Atsuro Daida, Pengyue Yu, Tiancheng Zheng, Naoto Kuroda, Shaun A. Hussain, Eishi Asano, Hiroki Nariai, Vwani Roychowdhury,
- Abstract要約: $textbf Omni-iEEG は $textbf302 患者$と $textbf178 時間高解像度記録を含む大規模で手術前の iEEG リソースである。
発作性発症ゾーン、切除、手術結果などの調和した臨床メタデータが含まれており、診断されたてんかん医によって検証されている。
臨床的に意味のあるタスクを定義し、臨床に関係のある環境でモデルの体系的な評価を可能にする。
- 参考スコア(独自算出の注目度): 4.4167069169736655
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Epilepsy affects over 50 million people worldwide, and one-third of patients suffer drug-resistant seizures where surgery offers the best chance of seizure freedom. Accurate localization of the epileptogenic zone (EZ) relies on intracranial EEG (iEEG). Clinical workflows, however, remain constrained by labor-intensive manual review. At the same time, existing data-driven approaches are typically developed on single-center datasets that are inconsistent in format and metadata, lack standardized benchmarks, and rarely release pathological event annotations, creating barriers to reproducibility, cross-center validation, and clinical relevance. With extensive efforts to reconcile heterogeneous iEEG formats, metadata, and recordings across publicly available sources, we present $\textbf{Omni-iEEG}$, a large-scale, pre-surgical iEEG resource comprising $\textbf{302 patients}$ and $\textbf{178 hours}$ of high-resolution recordings. The dataset includes harmonized clinical metadata such as seizure onset zones, resections, and surgical outcomes, all validated by board-certified epileptologists. In addition, Omni-iEEG provides over 36K expert-validated annotations of pathological events, enabling robust biomarker studies. Omni-iEEG serves as a bridge between machine learning and epilepsy research. It defines clinically meaningful tasks with unified evaluation metrics grounded in clinical priors, enabling systematic evaluation of models in clinically relevant settings. Beyond benchmarking, we demonstrate the potential of end-to-end modeling on long iEEG segments and highlight the transferability of representations pretrained on non-neurophysiological domains. Together, these contributions establish Omni-iEEG as a foundation for reproducible, generalizable, and clinically translatable epilepsy research. The project page with dataset and code links is available at omni-ieeg.github.io/omni-ieeg.
- Abstract(参考訳): てんかんは世界中で5000万人以上の患者に影響を与えており、患者の3分の1は薬剤耐性の発作を患っている。
てんかん原性領域(EZ)の正確な局在は頭蓋内脳波(iEEG)に依存する。
しかし、臨床ワークフローは労働集約的なマニュアルレビューによって制限されている。
それと同時に、既存のデータ駆動アプローチは、通常、フォーマットとメタデータに一貫性がなく、標準化されたベンチマークが欠如し、病理イベントアノテーションがリリースされることがほとんどない単一中心データセット上で開発される。
異種iEEGフォーマット,メタデータ,記録を公開ソース全体にわたって整合させる大規模な取り組みにより,大容量のiEEGリソースである$\textbf{Omni-iEEG}$, $\textbf{302 patients}$, $\textbf{178 hours}$の高分解能記録を提供する。
このデータセットには、発作性発症ゾーン、切除、手術結果などの調和した臨床メタデータが含まれており、すべて、ボード認定のてんかん医によって検証されている。
さらに、Omni-iEEGは、36K以上の専門家が検証した病理事象のアノテーションを提供し、堅牢なバイオマーカーの研究を可能にしている。
Omni-iEEGは、機械学習とてんかん研究の橋渡しとなる。
臨床的に意味のあるタスクを定義し、臨床に関係のある環境でモデルの体系的な評価を可能にする。
ベンチマーク以外にも、長いiEEGセグメント上でのエンド・ツー・エンド・モデリングの可能性を示し、非神経生理学的領域で事前訓練された表現の転送性を強調した。
これらの貢献により、Omni-iEEGは再現性、一般化性、臨床的に翻訳可能なてんかん研究の基礎として確立される。
データセットとコードリンクを備えたプロジェクトページは、omni-ieeg.github.io/omni-ieegで公開されている。
関連論文リスト
- LookAroundNet: Extending Temporal Context with Transformers for Clinically Viable EEG Seizure Detection [0.0]
LookAroundNetは、脳波データのより広い時間的ウィンドウを使用して発作活動をモデル化するトランスフォーマーベースの発作検出装置である。
様々な臨床環境にまたがる複数の脳波データセットについて,提案手法の評価を行った。
論文 参考訳(メタデータ) (2026-01-09T18:52:24Z) - Affordable EEG, Actionable Insights: An Open Dataset and Evaluation Framework for Epilepsy Patient Stratification [2.879398564096746]
てんかんのための単一チャネル・コンシューマグレード脳波の最初のオープンデータセットであるNEUROSKY-EPIを提示する。
その実用性を探るため、患者層化パイプラインであるEmbedClusterを紹介します。
その結果、低コストで単一チャネルのデータは有意義な成層化をサポートできることが示唆された。
論文 参考訳(メタデータ) (2025-10-22T15:25:05Z) - Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文 参考訳(メタデータ) (2025-10-21T18:10:45Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - TRIALSCOPE: A Unifying Causal Framework for Scaling Real-World Evidence Generation with Biomedical Language Models [21.437563965711004]
本稿では,大規模観測データから堅牢な実世界の証拠を生成するためのフレームワークであるTRIALSCOPEを提案する。
このフレームワークは、高品質な構造化された患者データを自動的にキュレートし、データセットを拡張し、非構造化形式でのみ利用可能な主要な患者属性を組み込む。
また,TriALSCOPEは,抽出した実世界のデータから,肺癌および膵癌の臨床試験の結果を再現できることを示した。
論文 参考訳(メタデータ) (2023-11-02T15:15:47Z) - Towards Unifying Anatomy Segmentation: Automated Generation of a
Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines [113.08940153125616]
我々は533巻のボクセルレベルのラベルを142ドル(約1万2000円)で、全身CTスキャンのデータセットを作成し、解剖学的包括的カバレッジを提供する。
提案手法はラベル集約段階において手作業によるアノテーションに依存しない。
我々はCTデータに142ドルの解剖学的構造を予測できる統一解剖学的セグメンテーションモデルをリリースする。
論文 参考訳(メタデータ) (2023-07-25T09:48:13Z) - From Isolation to Collaboration: Federated Class-Heterogeneous Learning for Chest X-Ray Classification [4.0907576027258985]
フェデレートラーニングは,グローバル胸部X線分類モデル(CXR)を協調的にトレーニングするための,有望なパラダイムである。
本研究では,選択的アグリゲーションを用いてグローバルモデルの協調学習を行うFL法である外科的アグリゲーションを提案する。
その結果,本手法は現在の手法よりも優れ,一般化性が高いことがわかった。
論文 参考訳(メタデータ) (2023-01-17T03:53:29Z) - DICE: Data-Efficient Clinical Event Extraction with Generative Models [93.49354508621232]
臨床領域のイベント抽出は、未調査の研究領域である。
臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
臨床およびニュース領域イベント抽出におけるDICEの最先端性能について実験を行った。
論文 参考訳(メタデータ) (2022-08-16T23:12:04Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。