論文の概要: Extension OL-MDISF: Online Learning from Mix-Typed, Drifted, and Incomplete Streaming Features
- arxiv url: http://arxiv.org/abs/2507.10594v2
- Date: Wed, 16 Jul 2025 01:23:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 12:30:11.778424
- Title: Extension OL-MDISF: Online Learning from Mix-Typed, Drifted, and Incomplete Streaming Features
- Title(参考訳): Extension OL-MDISF: ミックスタイプ、ドリフト、不完全なストリーミング機能によるオンライン学習
- Authors: Shengda Zhuo, Di Wu, Yi He, Shuqiang Huang, Xindong Wu,
- Abstract要約: 混合特徴型を持つ実世界のデータストリームは、従来のパラメトリックモデリングの課題を示す。
時間とコストの制約により、教師付き設定ですべてのデータインスタンスをラベル付けすることは不可能になります。
Mix-typed, Drifted, Incomplete Streaming Features (OL-MDISF) によるオンライン学習は,機能タイプ,データ分散,および監視情報の制限を緩和することを目的としている。
- 参考スコア(独自算出の注目度): 13.987655062880089
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online learning, where feature spaces can change over time, offers a flexible learning paradigm that has attracted considerable attention. However, it still faces three significant challenges. First, the heterogeneity of real-world data streams with mixed feature types presents challenges for traditional parametric modeling. Second, data stream distributions can shift over time, causing an abrupt and substantial decline in model performance. Additionally, the time and cost constraints make it infeasible to label every data instance in a supervised setting. To overcome these challenges, we propose a new algorithm Online Learning from Mix-typed, Drifted, and Incomplete Streaming Features (OL-MDISF), which aims to relax restrictions on both feature types, data distribution, and supervision information. Our approach involves utilizing copula models to create a comprehensive latent space, employing an adaptive sliding window for detecting drift points to ensure model stability, and establishing label proximity information based on geometric structural relationships. To demonstrate the model's efficiency and effectiveness, we provide theoretical analysis and comprehensive experimental results. This extension serves as a standalone technical reference to the original OL-MDISF method. It provides (i) a contextual analysis of OL-MDISF within the broader landscape of online learning, covering recent advances in mixed-type feature modeling, concept drift adaptation, and weak supervision, and (ii) a comprehensive set of experiments across 14 real-world datasets under two types of drift scenarios. These include full CER trends, ablation studies, sensitivity analyses, and temporal ensemble dynamics. We hope this document can serve as a reproducible benchmark and technical resource for researchers working on nonstationary, heterogeneous, and weakly supervised data streams.
- Abstract(参考訳): 機能空間が時間とともに変化するオンライン学習は、フレキシブルな学習パラダイムを提供する。
しかし、これはまだ3つの大きな課題に直面している。
まず、混合特徴型を持つ実世界のデータストリームの不均一性は、従来のパラメトリックモデリングの課題を示す。
第二に、データストリームの分布は時間とともに変化し、突然のモデルパフォーマンスの低下を引き起こします。
さらに、時間とコストの制約により、教師付き設定ですべてのデータインスタンスをラベル付けすることは不可能になります。
これらの課題を克服するために、我々は、特徴タイプ、データ分散、および監視情報の両方の制約を緩和することを目的とした、ミックスタイプ、ドリフト、不完全ストリーミング機能(OL-MDISF)からのオンライン学習を提案する。
提案手法では,コプラモデルを用いて包括的潜在空間を創出し,ドリフト点の検出とモデル安定性の確保,および幾何学的構造関係に基づくラベル近接情報の設定を行う。
モデルの有効性と有効性を示すため,理論的解析と総合的な実験結果を提供する。
この拡張は、オリジナルのOL-MDISFメソッドのスタンドアロンの技術参照として機能する。
それは提供します
一 オンライン学習の広い視野におけるOL-MDISFの文脈分析で、混合型特徴モデリング、コンセプトドリフト適応、弱監督の最近の進歩を網羅する。
(II) 2種類のドリフトシナリオ下での14の実世界のデータセットを対象とした総合的な実験。
これには、完全なCERトレンド、アブレーション研究、感度分析、時間的アンサンブルダイナミクスが含まれる。
この文書は、非定常的で異質で弱い教師付きデータストリームに取り組んでいる研究者にとって、再現可能なベンチマークと技術資源として機能することを願っている。
関連論文リスト
- Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - A Hybrid Framework for Real-Time Data Drift and Anomaly Identification Using Hierarchical Temporal Memory and Statistical Tests [14.37149160708975]
本稿では,階層型テンポラルメモリ(HTM)と逐次確率比テスト(SPRT)を組み合わせた,リアルタイムデータドリフト検出と異常同定のためのハイブリッドフレームワークを提案する。
実験により,提案手法は,KS試験,ワッサーシュタイン距離,人口安定度指数(PSI)などの従来のドリフト検出手法よりも精度,適応性,計算効率の点で優れていた。
論文 参考訳(メタデータ) (2025-04-24T18:23:18Z) - Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning [93.58897637077001]
本稿では,オフラインからオンラインまでの潜水蒸留とフレキシブルなゆがみ制約を通したビデオから,セマンティックな違いを学習し,理解することを試みる。
動作自由なビデオ予測モデルを非干渉正規化によりオフラインでトレーニングし、注意をそらすビデオから意味的知識を抽出する。
オンライン環境での微調整には、事前学習されたモデルからの知識を活用し、世界モデルに絡み合った制約を導入する。
論文 参考訳(メタデータ) (2025-03-11T13:50:22Z) - Beyond Fixed Variables: Expanding-variate Time Series Forecasting via Flat Scheme and Spatio-temporal Focal Learning [9.205228068704141]
現実世界のアプリケーションでは、Cyber-Physical Systemsはしばしば新しいセンサーが登場するにつれて拡張され、MTSFの変数が増加する。
本課題は,(1)新しい変数の追加による不整合データ処理,(2)時間的不整合学習に対処する,というユニークな課題を提示する。
これらの課題に対処するため, フレキシブル時間予測フレームワークSTEVを提案する。
論文 参考訳(メタデータ) (2025-02-21T08:43:26Z) - Off-dynamics Conditional Diffusion Planners [15.321049697197447]
この研究は、オフラインRLにおけるデータ不足の課題に対処するために、より容易に利用できるオフダイナミックスデータセットの使用を探求する。
本研究では,DPMを用いた大規模オフダイナミックスデータセットと限定ターゲットデータセットの連成分布の学習手法を提案する。
論文 参考訳(メタデータ) (2024-10-16T04:56:43Z) - SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。
SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。
画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文 参考訳(メタデータ) (2024-08-19T17:32:15Z) - Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - Spatiotemporal Implicit Neural Representation as a Generalized Traffic Data Learner [46.866240648471894]
時空間交通データ(STTD)は、マルチスケール交通システムの複雑な動的挙動を測定する。
本稿では,STTDを暗黙的ニューラル表現としてパラメータ化することで,STTD学習問題に対処する新しいパラダイムを提案する。
実世界のシナリオにおける広範な実験を通じて,その有効性を検証し,廊下からネットワークスケールへの応用を示す。
論文 参考訳(メタデータ) (2024-05-06T06:23:06Z) - Robust Training of Federated Models with Extremely Label Deficiency [84.00832527512148]
フェデレーション半教師付き学習(FSSL)は、ラベル不足を伴う分散データを用いて機械学習モデルを協調訓練するための強力なパラダイムとして登場した。
我々は,ラベル付きおよびラベルなしデータの異なる視点から洞察を提供することにより相互指導を強化するために,ツインサイトと呼ばれる新しいツインモデルパラダイムを提案する。
4つのベンチマークデータセットに関する包括的な実験は、Twin-sightが様々な実験環境において最先端の手法を著しく上回っていることを示す重要な証拠となる。
論文 参考訳(メタデータ) (2024-02-22T10:19:34Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Continual Vision-Language Representation Learning with Off-Diagonal
Information [112.39419069447902]
CLIPのようなマルチモーダルなコントラスト学習フレームワークは通常、トレーニングに大量の画像テキストサンプルを必要とする。
本稿では,ストリーミングデータを用いた連続CLIPトレーニングの実現可能性について論じる。
論文 参考訳(メタデータ) (2023-05-11T08:04:46Z) - Continual Learning with Optimal Transport based Mixture Model [17.398605698033656]
成熟最適輸送理論(OT-MM)の優れた性質に基づくオンライン混合モデル学習手法を提案する。
提案手法は,現在の最先端のベースラインを大きく上回ることができる。
論文 参考訳(メタデータ) (2022-11-30T06:40:29Z) - Online Deep Learning from Doubly-Streaming Data [17.119725174036653]
本稿では,データストリームが常に進化する特徴空間によって記述される,二重ストリームデータによる新たなオンライン学習問題について検討する。
この課題を克服するもっともらしいアイデアは、進化する機能空間間の関係を確立することである。
従来の特徴空間と新しい特徴空間から情報を要約するために,共有潜在部分空間が発見された新しいOLD3Sパラダイムを提案する。
論文 参考訳(メタデータ) (2022-04-25T17:06:39Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。