論文の概要: Fingerprinting Concepts in Data Streams with Supervised and Unsupervised Meta-Information
- arxiv url: http://arxiv.org/abs/2603.11094v1
- Date: Wed, 11 Mar 2026 07:42:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.510341
- Title: Fingerprinting Concepts in Data Streams with Supervised and Unsupervised Meta-Information
- Title(参考訳): 教師なしメタ情報を用いたデータストリームにおけるフィンガープリンティングの概念
- Authors: Ben Halstead, Yun Sing Koh, Patricia Riddle, Mykola Pechenizkiy, Albert Bifet, Russel Pears,
- Abstract要約: 概念の漂流は、環境条件の変化による時間の経過とともにデータの分布の変化である。
指紋における概念の教師なし行動と教師なし行動の両方を表現するための枠組みを提案する。
FiCSUMは11の現実世界と合成データセットで最先端の手法より優れています。
- 参考スコア(独自算出の注目度): 31.52969462508665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Streaming sources of data are becoming more common as the ability to collect data in real-time grows. A major concern in dealing with data streams is concept drift, a change in the distribution of data over time, for example, due to changes in environmental conditions. Representing concepts (stationary periods featuring similar behaviour) is a key idea in adapting to concept drift. By testing the similarity of a concept representation to a window of observations, we can detect concept drift to a new or previously seen recurring concept. Concept representations are constructed using meta-information features, values describing aspects of concept behaviour. We find that previously proposed concept representations rely on small numbers of meta-information features. These representations often cannot distinguish concepts, leaving systems vulnerable to concept drift. We propose FiCSUM, a general framework to represent both supervised and unsupervised behaviours of a concept in a fingerprint, a vector of many distinct meta-information features able to uniquely identify more concepts. Our dynamic weighting strategy learns which meta-information features describe concept drift in a given dataset, allowing a diverse set of meta-information features to be used at once. FiCSUM outperforms state-of-the-art methods over a range of 11 real world and synthetic datasets in both accuracy and modeling underlying concept drift.
- Abstract(参考訳): データのストリーミングソースは、リアルタイムにデータを集める能力が成長するにつれて、ますます一般的になっています。
データストリームを扱う上で大きな関心事は、例えば環境条件の変化によるデータ分散の変化であるコンセプトドリフトである。
概念を表現する(同様の振る舞いを特徴とする静止期間)ことは、概念の漂流に適応する上で重要な考え方である。
概念表現と観測窓との類似性をテストすることで、新しい、あるいは以前にも見られた概念の漂流を検出することができる。
概念表現はメタ情報の特徴、概念行動の側面を記述する値を使って構築される。
これまでに提案されてきた概念表現は,少数のメタ情報機能に依存していることがわかった。
これらの表現はしばしば概念を区別できず、システムは概念の漂流に弱いままである。
本研究では,フィンガープリントにおける概念の教師付き動作と教師なし動作の両方を表現するための汎用フレームワークFiCSUMを提案する。
我々の動的重み付け戦略は、与えられたデータセットのどのメタ情報特徴がコンセプトドリフトを記述しているかを学習し、多様なメタ情報特徴を一度に使用できるようにします。
FiCSUMは、11の現実世界と合成データセットの精度と基礎となるコンセプトドリフトのモデル化において、最先端の手法よりも優れています。
関連論文リスト
- FaCT: Faithful Concept Traces for Explaining Neural Network Decisions [56.796533084868884]
ディープネットワークは、幅広いタスクで顕著なパフォーマンスを示しているが、それらの機能に関するグローバルな概念レベルの理解は、依然として重要な課題である。
本稿では,概念に基づく説明の忠実さを強調し,モデル独立な機械的概念説明を用いた新しいモデルを提案する。
私たちの概念はクラス間で共有され、あらゆるレイヤから、ロジットへの貢献と入力-視覚化を忠実にトレースすることができます。
論文 参考訳(メタデータ) (2025-10-29T13:35:46Z) - CoPA: Hierarchical Concept Prompting and Aggregating Network for Explainable Diagnosis [8.56688324078793]
Concept Prompting and Aggregating (CoPA)は、プロンプトガイダンスの下で多層概念をキャプチャするために設計された新しいフレームワークである。
各レイヤからの視覚表現は、テキストの概念表現と整合するように集約される。
CoPAは3つのパブリックデータセット上で最先端のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-10-04T10:29:15Z) - Continuous Evolution Pool: Taming Recurring Concept Drift in Online Time Series Forecasting [58.448663215248565]
継続的進化プール(Continuous Evolution Pool, CEP)は、異なる概念の予測器のインスタンスを格納するプール機構である。
CEPは、様々な概念の知識を効果的に保持する。
オンライン予測と繰り返し概念のシナリオでは,CEPは予測結果を著しく向上させる。
論文 参考訳(メタデータ) (2025-05-28T03:27:49Z) - Zero-shot Concept Bottleneck Models [17.70684428339905]
概念ボトルネックモデル(CBM)は本質的に解釈可能で、解釈可能なニューラルネットワークモデルである。
ニューラルネットワークを訓練することなく,概念やラベルをゼロショットで予測するテクスツケロ・ショット・コンセプト・ボトルネック・モデル(Z-CBM)を提案する。
論文 参考訳(メタデータ) (2025-02-13T07:11:07Z) - Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - Knowledge graphs for empirical concept retrieval [1.06378109904813]
概念に基づく説明可能なAIは、あるユーザの前提における複雑なモデルの理解を改善するツールとして期待されている。
本稿では,テキスト領域と画像領域の両方でユーザ主導のデータ収集を行うワークフローを提案する。
我々は,概念アクティベーションベクトル(CAV)と概念アクティベーション領域(CAR)の2つの概念ベース説明可能性手法を用いて,検索した概念データセットをテストする。
論文 参考訳(メタデータ) (2024-04-10T13:47:22Z) - A Remark on Concept Drift for Dependent Data [7.0072935721154614]
時間的依存関係がサンプリングプロセスに強く影響していることを示す。
特に、この設定には定常性の概念が適さないことを示し、代替案について議論する。
論文 参考訳(メタデータ) (2023-12-15T21:11:46Z) - Implicit Concept Removal of Diffusion Models [92.55152501707995]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。
幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文 参考訳(メタデータ) (2023-10-09T17:13:10Z) - Learning Parameter Distributions to Detect Concept Drift in Data Streams [13.20231558027132]
実コンセプトドリフト検出のための新しいフレームワークであるERICSを提案する。
予測モデルのパラメータをランダム変数として扱うことにより、最適パラメータの分布の変化に対応する概念ドリフトが示される。
ERICSはまた、既存のアプローチよりも大きな利点である入力レベルで概念ドリフトを検出することができる。
論文 参考訳(メタデータ) (2020-10-19T11:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。