論文の概要: CIPHER: Scalable Time Series Analysis for Physical Sciences with Application to Solar Wind Phenomena
- arxiv url: http://arxiv.org/abs/2510.21022v1
- Date: Thu, 23 Oct 2025 22:11:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.32978
- Title: CIPHER: Scalable Time Series Analysis for Physical Sciences with Application to Solar Wind Phenomena
- Title(参考訳): CIPHER:太陽風現象を応用した物理科学のためのスケーラブル時系列解析
- Authors: Jasmine R. Kobayashi, Daniela Martin, Valmir P Moraes Filho, Connor O'Brien, Jinsu Hong, Sudeshna Boro Saikia, Hala Lamdouar, Nathan D. Miles, Marcella Scoczynski, Mavis Stone, Sairam Sundaresan, Anna Jungbluth, Andrés Muñoz-Jaramillo, Evangelia Samara, Joseph Gallego,
- Abstract要約: 認識のための人間評価を用いたtextitClustering and Indexation Pipeline(CIPHER)を提案する。
CIPHERは物理学における複雑な時系列の大規模ラベリングを促進するために設計されたフレームワークである。
我々は、宇宙気象研究の中心的課題であるOMNIデータにおける太陽風現象の分類作業におけるCIPHERの評価を行った。
- 参考スコア(独自算出の注目度): 3.0717901664567857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Labeling or classifying time series is a persistent challenge in the physical sciences, where expert annotations are scarce, costly, and often inconsistent. Yet robust labeling is essential to enable machine learning models for understanding, prediction, and forecasting. We present the \textit{Clustering and Indexation Pipeline with Human Evaluation for Recognition} (CIPHER), a framework designed to accelerate large-scale labeling of complex time series in physics. CIPHER integrates \textit{indexable Symbolic Aggregate approXimation} (iSAX) for interpretable compression and indexing, density-based clustering (HDBSCAN) to group recurring phenomena, and a human-in-the-loop step for efficient expert validation. Representative samples are labeled by domain scientists, and these annotations are propagated across clusters to yield systematic, scalable classifications. We evaluate CIPHER on the task of classifying solar wind phenomena in OMNI data, a central challenge in space weather research, showing that the framework recovers meaningful phenomena such as coronal mass ejections and stream interaction regions. Beyond this case study, CIPHER highlights a general strategy for combining symbolic representations, unsupervised learning, and expert knowledge to address label scarcity in time series across the physical sciences. The code and configuration files used in this study are publicly available to support reproducibility.
- Abstract(参考訳): 時系列のラベル付けや分類は、専門家のアノテーションが不足し、コストがかかり、しばしば矛盾する物理科学において永続的な課題である。
しかし、堅牢なラベル付けは、理解、予測、予測のために機械学習モデルを可能にするために不可欠である。
本稿では,複雑な時系列の大規模ラベリングを加速するフレームワークCIPHER(textit{Clustering and Indexation Pipeline with Human Evaluation for Recognition)を提案する。
CIPHERは、解釈可能な圧縮とインデックス作成のために \textit{indexable Symbolic Aggregate approXimation} (iSAX) を統合し、密度ベースのクラスタリング(HDBSCAN) を繰り返し現象のグループ化に利用し、評価検証を効率よく行う。
代表的なサンプルはドメイン科学者によってラベル付けされ、これらのアノテーションはクラスタ全体に伝播して、体系的でスケーラブルな分類をもたらす。
我々は、宇宙気象研究の中心的課題であるOMNIデータにおける太陽風現象の分類作業におけるCIPHERの評価を行い、このフレームワークがコロナ質量放出やストリーム相互作用領域などの有意義な現象を回復することを示す。
このケーススタディの他に、CIPHERは、記号表現、教師なし学習、および専門知識を組み合わせて、物理科学全体にわたる時系列におけるラベル不足に対処するための一般的な戦略を強調している。
この研究で使用されるコードと設定ファイルは、再現性をサポートするために公開されている。
関連論文リスト
- Learning Representations of Event Time Series with Sparse Autoencoders for Anomaly Detection, Similarity Search, and Unsupervised Classification [0.005439329219803859]
イベント時系列は、不規則な時間間隔で発生する離散イベントのシーケンスである。
これらは高エネルギー天体物理学、計算社会科学、サイバーセキュリティ、金融、医療、神経科学、地震学などの領域でよく見られる。
本稿では,イベント時系列の2次元および3次元テンソル表現と,物理的に意味のある潜在表現を学習するスパースオートエンコーダを提案する。
論文 参考訳(メタデータ) (2025-07-15T18:01:03Z) - CRIA: A Cross-View Interaction and Instance-Adapted Pre-training Framework for Generalizable EEG Representations [52.251569042852815]
CRIAは、可変長および可変チャネルコーディングを使用して、異なるデータセット間でEEGデータの統一表現を実現する適応フレームワークである。
このモデルでは、時間的、スペクトル的、空間的特徴を効果的に融合させるクロスアテンション機構を採用している。
テンプル大学脳波コーパスとCHB-MITデータセットによる実験結果から、CRIAは既存の方法よりも、同じ事前学習条件で優れていることが示された。
論文 参考訳(メタデータ) (2025-06-19T06:31:08Z) - Hallucination Detection in LLMs with Topological Divergence on Attention Graphs [60.83579255387347]
幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文 参考訳(メタデータ) (2025-04-14T10:06:27Z) - TopoCL: Topological Contrastive Learning for Time Series [1.8434042562191815]
時系列のためのトポロジカルコントラスト学習(TopoCL)を提案する。
TopoCLは、永続的ホモロジーを組み込むことで、情報損失を軽減する。
下流タスク分類,異常検出,予測,伝達学習の4つの実験を行った。
論文 参考訳(メタデータ) (2025-02-05T06:37:35Z) - Deep Temporal Graph Clustering [77.02070768950145]
深部時間グラフクラスタリング(GC)のための汎用フレームワークを提案する。
GCは、時間グラフの相互作用シーケンスに基づくバッチ処理パターンに適合するディープクラスタリング技術を導入している。
我々のフレームワークは、既存の時間グラフ学習手法の性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2023-05-18T06:17:50Z) - Representation Learning for Person or Entity-centric Knowledge Graphs:
An Application in Healthcare [0.757843972001219]
本稿では、構造化データと非構造化データからエンティティ中心のKGを抽出するエンドツーエンド表現学習フレームワークを提案する。
我々は、人の複数の面を表す星型分類器を導入し、それをKG生成のガイドに利用する。
このアプローチにはいくつかの潜在的なアプリケーションがあり、オープンソースであることを強調します。
論文 参考訳(メタデータ) (2023-05-09T17:39:45Z) - Global Knowledge Calibration for Fast Open-Vocabulary Segmentation [124.74256749281625]
本稿では,各学習カテゴリの同義語群を生成するテキスト多様化戦略を提案する。
また,CLIPの汎用的な知識を維持するために,テキスト誘導型知識蒸留法を用いている。
提案手法は, 各種データセットに対して頑健な一般化性能を実現する。
論文 参考訳(メタデータ) (2023-03-16T09:51:41Z) - ShapeWordNet: An Interpretable Shapelet Neural Network for Physiological
Signal Classification [16.82411861562806]
生理的信号分類タスクに適した,より効果的で解釈可能なスキームを提案する。
時系列シェープレットを利用して、顕著な局所パターンを抽出し、解釈可能なシーケンスの離散化を行う。
本研究では,本手法をShapeWordNetと命名し,実世界の3つのデータセットに対する広範な実験を行い,その有効性について検討する。
論文 参考訳(メタデータ) (2023-02-10T02:30:31Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。