論文の概要: SEAnet: A Deep Learning Architecture for Data Series Similarity Search
- arxiv url: http://arxiv.org/abs/2603.01448v1
- Date: Mon, 02 Mar 2026 04:57:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.6832
- Title: SEAnet: A Deep Learning Architecture for Data Series Similarity Search
- Title(参考訳): SEAnet: データ系列類似検索のためのディープラーニングアーキテクチャ
- Authors: Qitong Wang, Themis Palpanas,
- Abstract要約: 本研究では,ディープニューラルネットワークに基づく新しいデータ系列要約手法であるDeep Embedding Approximation (DEA)を提案する。
また,特にDEA学習用に設計された新しいアーキテクチャであるSEAnetについて述べる。
SEAnetを用いて学習したDEAの利点を検証するため、7つの多様な合成および実データセットに関する総合的な実験を行った。
- 参考スコア(独自算出の注目度): 9.358507086216578
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A key operation for massive data series collection analysis is similarity search. According to recent studies, SAX-based indexes offer state-of-the-art performance for similarity search tasks. However, their performance lags under high-frequency, weakly correlated, excessively noisy, or other dataset-specific properties. In this work, we propose Deep Embedding Approximation (DEA), a novel family of data series summarization techniques based on deep neural networks. Moreover, we describe SEAnet, a novel architecture especially designed for learning DEA, that introduces the Sum of Squares preservation property into the deep network design. We further enhance SEAnet with SEAtrans encoder. Finally, we propose novel sampling strategies, SEAsam and SEAsamE, that allow SEAnet to effectively train on massive datasets. Comprehensive experiments on 7 diverse synthetic and real datasets verify the advantages of DEA learned using SEAnet in providing high-quality data series summarizations and similarity search results.
- Abstract(参考訳): 大規模データ系列収集解析の鍵となる操作は類似性探索である。
最近の研究によると、SAXベースのインデックスは類似検索タスクに最先端のパフォーマンスを提供する。
しかし、その性能遅延は、高周波、弱相関性、過度雑音性、その他のデータセット固有の特性で表される。
本研究では,ディープニューラルネットワークに基づく新しいデータ系列要約手法であるDeep Embedding Approximation (DEA)を提案する。
さらに,特にDEA学習用に設計された新しいアーキテクチャであるSEAnetについて述べる。
また、SEAtransエンコーダによりSEAnetをさらに強化する。
最後に、SEAsamとSEAsamEという新しいサンプリング戦略を提案し、SEAnetが大規模データセット上で効果的にトレーニングできるようにする。
7つの多様な合成および実データセットに関する総合的な実験は、SEAnetを用いて学習したDEAの利点を検証し、高品質なデータ系列の要約と類似性検索結果を提供する。
関連論文リスト
- Detecting High-Stakes Interactions with Activation Probes [10.421494494629421]
そこで本論文では,対話が大きな害をもたらす可能性を示唆する「ハイテイク」相互作用を検出するためのアクティベーションプローブについて検討する。
我々は、合成データに基づいて訓練された複数のプローブアーキテクチャを評価し、それらが多種多様な分布外の実世界のデータに対して堅牢な一般化を示すことを発見した。
また,資源を意識した階層型モニタリングシステムの構築の可能性についても検討した。
論文 参考訳(メタデータ) (2025-06-12T15:20:33Z) - SimpleDeepSearcher: Deep Information Seeking via Web-Powered Reasoning Trajectory Synthesis [94.33978856270268]
Retrieval-augmented Generation (RAG) システムは複雑なディープ検索シナリオにおいて高度な大規模言語モデル(LLM)を持つ。
既存のアプローチでは、高品質なトレーニングトラジェクトリが欠如し、分散ミスマッチに苦しむ、重要な制限に直面しています。
本稿では,複雑なトレーニングパラダイムではなく,戦略的データエンジニアリングによるギャップを埋めるフレームワークであるSimpleDeepSearcherを紹介する。
論文 参考訳(メタデータ) (2025-05-22T16:05:02Z) - DSAI: Unbiased and Interpretable Latent Feature Extraction for Data-Centric AI [24.349800949355465]
大規模言語モデル(LLM)は、大きなデータセットの潜在特性を客観的に識別するのにしばしば苦労する。
本研究では,非バイアスで解釈可能な特徴抽出を可能にするフレームワークであるData Scientist AI(DSAI)を提案する。
論文 参考訳(メタデータ) (2024-12-09T08:47:05Z) - Towards Robust Out-of-Distribution Generalization: Data Augmentation and Neural Architecture Search Approaches [4.577842191730992]
我々は、ディープラーニングのための堅牢なOoD一般化への道を探る。
まず,認識に必須でない特徴間の素早い相関を解消するための,新しい効果的なアプローチを提案する。
次に,OoDシナリオにおけるニューラルアーキテクチャ探索の強化問題について検討する。
論文 参考訳(メタデータ) (2024-10-25T20:50:32Z) - Dataset Distillation: A Comprehensive Review [76.26276286545284]
データセット蒸留(DD)は、トレーニングされたモデルが元のデータセットでトレーニングされたデータセットに匹敵するパフォーマンスを得るために、合成サンプルを含むはるかに小さなデータセットを導出することを目的としている。
本稿ではDDの最近の進歩とその応用について概説する。
論文 参考訳(メタデータ) (2023-01-17T17:03:28Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - SHORING: Design Provable Conditional High-Order Interaction Network via
Symbolic Testing [15.324528842034177]
我々は、ニューラルネットワークによってどのような専門家由来の機能が学べるかという疑問に答えるのに役立つシンボリックテスティングフレームワークを提案する。
このテストフレームワークに触発されて、SHORINGと呼ばれる効率的なアーキテクチャを導入しました。
SHORINGは,標準的なマルチヘッド自己認識ネットワークでは学習できない,標準的な記号表現を学習することができる,と我々は主張する。
論文 参考訳(メタデータ) (2021-07-03T02:33:32Z) - TDA-Net: Fusion of Persistent Homology and Deep Learning Features for
COVID-19 Detection in Chest X-Ray Images [0.7734726150561088]
トポロジカルデータ分析は、データセットの構造を抽出し比較するための堅牢なツールとして登場した。
両強力なツールの特徴を捉えるために,トポロジと深い特徴を融合した新しいアンサンブルネットワークである textitTDA-Net を提案する。
論文 参考訳(メタデータ) (2021-01-21T01:51:12Z) - CDEvalSumm: An Empirical Study of Cross-Dataset Evaluation for Neural
Summarization Systems [121.78477833009671]
データセット間設定下での様々な要約モデルの性能について検討する。
異なるドメインの5つのデータセットに対する11の代表的な要約システムに関する包括的な研究は、モデルアーキテクチャと生成方法の影響を明らかにしている。
論文 参考訳(メタデータ) (2020-10-11T02:19:15Z) - Recent Developments Combining Ensemble Smoother and Deep Generative
Networks for Facies History Matching [58.720142291102135]
本研究は、ファシズムモデルのための連続パラメータ化を構築するためのオートエンコーダネットワークの利用に焦点を当てる。
本稿では,VAE,GAN,Wasserstein GAN,変分自動符号化GAN,サイクルGANの主成分分析(PCA),転送スタイルネットワークのPCA,スタイル損失のVAEの7種類の定式化をベンチマークする。
論文 参考訳(メタデータ) (2020-05-08T21:32:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。