論文の概要: Efficient Online Decision Tree Learning with Active Feature Acquisition
- arxiv url: http://arxiv.org/abs/2305.02093v1
- Date: Wed, 3 May 2023 12:56:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 14:56:11.117055
- Title: Efficient Online Decision Tree Learning with Active Feature Acquisition
- Title(参考訳): 能動的特徴獲得による効率的なオンライン決定木学習
- Authors: Arman Rahbar, Ziyu Ye, Yuxin Chen, Morteza Haghir Chehreghani
- Abstract要約: 医学診断では、医師は患者に対してどの検査を行うかを選択する必要がある。
私たちのフレームワークは、オンライン学習スキームに埋め込まれたアクティブプランニングオラクルで構成されています。
適応的部分モジュラリティに基づく代理情報取得関数を用いて,最小コストで特徴値の探索を行う。
- 参考スコア(独自算出の注目度): 15.62601444419354
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Constructing decision trees online is a classical machine learning problem.
Existing works often assume that features are readily available for each
incoming data point. However, in many real world applications, both feature
values and the labels are unknown a priori and can only be obtained at a cost.
For example, in medical diagnosis, doctors have to choose which tests to
perform (i.e., making costly feature queries) on a patient in order to make a
diagnosis decision (i.e., predicting labels). We provide a fresh perspective to
tackle this practical challenge. Our framework consists of an active planning
oracle embedded in an online learning scheme for which we investigate several
information acquisition functions. Specifically, we employ a surrogate
information acquisition function based on adaptive submodularity to actively
query feature values with a minimal cost, while using a posterior sampling
scheme to maintain a low regret for online prediction. We demonstrate the
efficiency and effectiveness of our framework via extensive experiments on
various real-world datasets. Our framework also naturally adapts to the
challenging setting of online learning with concept drift and is shown to be
competitive with baseline models while being more flexible.
- Abstract(参考訳): 決定木をオンラインで構築することは、古典的な機械学習の問題である。
既存の作業は、入ってくる各データポイントで機能を簡単に利用できると仮定することが多い。
しかし、多くの現実のアプリケーションでは、特徴値とラベルは前もって不明であり、1つのコストでしか取得できない。
例えば、診断において、医師は診断決定(ラベルの予測)を行うために、患者に対してどの検査を行うか(すなわち、高価な特徴クエリ)を選択する必要がある。
我々はこの実用的な課題に取り組むための新しい視点を提供する。
本フレームワークは,オンライン学習方式に埋め込まれたアクティブプランニングオラクルで構成され,いくつかの情報取得機能について検討する。
具体的には,アダプティブサブモジュラリティに基づくサロゲート情報取得機能を用いて,特徴値のクエリを最小限のコストで積極的に行うとともに,後続サンプリング方式を用いてオンライン予測に対する後悔度を低く抑えている。
我々は,様々な実世界のデータセットに対する広範な実験を通じて,フレームワークの効率性と有効性を示す。
当社のフレームワークは,コンセプトドリフトによるオンライン学習の難易度設定にも自然に適応し,より柔軟なベースラインモデルと競合することを示す。
関連論文リスト
- Dynamic feature selection in medical predictive monitoring by reinforcement learning [4.967941028121525]
多くの既存特徴選択手法は時系列情報を効果的に活用するには不十分である。
我々は、最大限のコスト制約の下でポリシーを最適化するために強化学習を採用する。
我々の手法は、微分不可能な予測モデルとシームレスに統合できる。
論文 参考訳(メタデータ) (2024-05-30T06:21:11Z) - Evaluating the Effectiveness of Video Anomaly Detection in the Wild: Online Learning and Inference for Real-world Deployment [2.1374208474242815]
Video Anomaly Detection (VAD) は、監視から医療まで幅広い応用の鍵となる、ビデオストリームにおける異常な活動を特定する。
実生活環境でのVADに取り組むことは、人間の行動の動的な性質、環境の変化、ドメインシフトによって大きな課題となる。
オンライン学習は、モデルを新しい情報に継続的に適応させることによって、この問題を軽減するための潜在的戦略である。
論文 参考訳(メタデータ) (2024-04-29T14:47:32Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - ALBench: A Framework for Evaluating Active Learning in Object Detection [102.81795062493536]
本稿では、オブジェクト検出におけるアクティブラーニングを評価するために、ALBenchという名前のアクティブラーニングベンチマークフレームワークをコントリビュートする。
自動深層モデルトレーニングシステム上で開発されたこのALBenchフレームワークは、使いやすく、さまざまなアクティブな学習アルゴリズムと互換性があり、同じトレーニングおよびテストプロトコルを保証する。
論文 参考訳(メタデータ) (2022-07-27T07:46:23Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Low-Regret Active learning [64.36270166907788]
トレーニングに最も有用なラベル付きデータポイントを識別するオンライン学習アルゴリズムを開発した。
私たちの仕事の中心は、予測可能な(簡単な)インスタンスの低い後悔を達成するために調整された睡眠専門家のための効率的なアルゴリズムです。
論文 参考訳(メタデータ) (2021-04-06T22:53:45Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Online Active Model Selection for Pre-trained Classifiers [72.84853880948894]
我々は,任意のラウンドにおいて高い確率で最良のモデルをラベル付けし,出力する情報的サンプルを積極的に選択するオンライン選択的サンプリング手法を設計する。
我々のアルゴリズムは、敵とストリームの両方のオンライン予測タスクに利用できる。
論文 参考訳(メタデータ) (2020-10-19T19:53:15Z) - On the Robustness of Active Learning [0.7340017786387767]
Active Learningは、機械学習アルゴリズムをトレーニングする上で最も有用なサンプルを特定する方法に関するものだ。
十分な注意とドメイン知識を持っていないことがよくあります。
そこで本研究では,Simpson の多様性指標に基づく新たな "Sum of Squared Logits" 手法を提案する。
論文 参考訳(メタデータ) (2020-06-18T09:07:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。