論文の概要: A Probabilistic Framework for Adapting to Changing and Recurring Concepts in Data Streams
- arxiv url: http://arxiv.org/abs/2408.09324v1
- Date: Sun, 18 Aug 2024 01:53:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-20 21:19:42.086132
- Title: A Probabilistic Framework for Adapting to Changing and Recurring Concepts in Data Streams
- Title(参考訳): データストリームにおける概念の変更と再帰に適応するための確率的フレームワーク
- Authors: Ben Halstead, Yun Sing Koh, Patricia Riddle, Mykola Pechenizkiy, Albert Bifet,
- Abstract要約: ストリーミングデータから学習するシステムは、条件が変わった場合、どの最近の経験が無関係かを特定する必要がある。
既存のストリーミングアプローチは、時間とともに関連性を変える経験を考慮せず、コンセプトドリフトを処理できない。
過去の経験の関連性を連続的に評価するための確率的手法であるSELeCTを提案する。
- 参考スコア(独自算出の注目度): 25.713959434305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The distribution of streaming data often changes over time as conditions change, a phenomenon known as concept drift. Only a subset of previous experience, collected in similar conditions, is relevant to learning an accurate classifier for current data. Learning from irrelevant experience describing a different concept can degrade performance. A system learning from streaming data must identify which recent experience is irrelevant when conditions change and which past experience is relevant when concepts reoccur, \textit{e.g.,} when weather events or financial patterns repeat. Existing streaming approaches either do not consider experience to change in relevance over time and thus cannot handle concept drift, or only consider the recency of experience and thus cannot handle recurring concepts, or only sparsely evaluate relevance and thus fail when concept drift is missed. To enable learning in changing conditions, we propose SELeCT, a probabilistic method for continuously evaluating the relevance of past experience. SELeCT maintains a distinct internal state for each concept, representing relevant experience with a unique classifier. We propose a Bayesian algorithm for estimating state relevance, combining the likelihood of drawing recent observations from a given state with a transition pattern prior based on the system's current state.
- Abstract(参考訳): ストリーミングデータの分布は、コンセプトドリフトと呼ばれる現象である条件が変化するにつれて、時間とともに変化することが多い。
類似した条件で収集された過去の経験のサブセットのみが、現在のデータの正確な分類器の学習に関係している。
異なる概念を記述する無関係な経験から学ぶことは、パフォーマンスを低下させる可能性がある。
ストリーミングデータから学習するシステムは、状況が変化したときの最近の経験と、気象イベントや金融パターンが繰り返されるときに、概念が再起した場合の過去の経験とを区別しなければならない。
既存のストリーミングアプローチでは、時間とともに関連性を変更する経験を考慮せず、概念のドリフトを処理できないか、あるいは経験の正確さを考慮できないため、繰り返しコンセプトを処理できないか、あるいは、コンセプトドリフトが見逃された場合にのみ関連性を評価し、失敗する。
本研究では,過去の経験の関連性を継続的に評価する確率的手法であるSELeCTを提案する。
SELeCTは概念ごとに異なる内部状態を維持しており、ユニークな分類器で関連する経験を表現している。
状態関係を推定するためのベイジアンアルゴリズムを提案し、与えられた状態から最新の観測結果を引き出す可能性と、システムの現在の状態に基づく遷移パターンとを組み合わせる。
関連論文リスト
- A Remark on Concept Drift for Dependent Data [7.0072935721154614]
時間的依存関係がサンプリングプロセスに強く影響していることを示す。
特に、この設定には定常性の概念が適さないことを示し、代替案について議論する。
論文 参考訳(メタデータ) (2023-12-15T21:11:46Z) - Mitigating Catastrophic Forgetting in Task-Incremental Continual
Learning with Adaptive Classification Criterion [50.03041373044267]
本稿では,継続的学習のための適応型分類基準を用いた教師付きコントラスト学習フレームワークを提案する。
実験により, CFLは最先端の性能を達成し, 分類基準に比べて克服する能力が強いことが示された。
論文 参考訳(メタデータ) (2023-05-20T19:22:40Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Tracking changes using Kullback-Leibler divergence for the continual
learning [2.0305676256390934]
本稿では,多次元データストリームの確率分布の変化をモニタリングする新しい手法を提案する。
変化の速さの尺度として、人気のあるKulback-Leiblerの発散を分析する。
我々は,この指標を用いて,概念の漂流の発生を予測し,その性質を理解する方法を示す。
論文 参考訳(メタデータ) (2022-10-10T17:30:41Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - Agree to Disagree: Diversity through Disagreement for Better
Transferability [54.308327969778155]
本稿では,D-BAT(Diversity-By-dis-Agreement Training)を提案する。
我々は、D-BATが一般化された相違の概念から自然に現れることを示す。
論文 参考訳(メタデータ) (2022-02-09T12:03:02Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - DISSECT: Disentangled Simultaneous Explanations via Concept Traversals [33.65478845353047]
DISSECTは、ディープラーニングモデル推論を説明するための新しいアプローチである。
DISSECTは、分類器の信号から生成モデルを訓練することにより、異なる概念の分類器固有の「名詞」を発見する方法を提供する。
DISSECTは,複数の概念を分離し,共同訓練による推論と結合したCTを生成する。
論文 参考訳(メタデータ) (2021-05-31T17:11:56Z) - Reducing Representation Drift in Online Continual Learning [87.71558506591937]
私たちは、エージェントが制限されたメモリと計算で変化する分布から学ぶ必要があるオンライン連続学習パラダイムを研究します。
この作業では、入ってくるデータストリームに未観測のクラスサンプルが導入されることにより、事前に観測されたデータの表現の変化に焦点を合わせます。
論文 参考訳(メタデータ) (2021-04-11T15:19:30Z) - Model adaptation and unsupervised learning with non-stationary batch
data under smooth concept drift [8.068725688880772]
ほとんどの予測モデルは、トレーニングとテストデータは定常的なプロセスから生成されると仮定する。
我々は、データソースの非定常性に起因する段階的な概念の漂流のシナリオを考察する。
予測モデルの教師なし適応のための新しい反復アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-10T21:29:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。