論文の概要: Efficient Human-in-the-Loop Active Learning: A Novel Framework for Data Labeling in AI Systems
- arxiv url: http://arxiv.org/abs/2501.00277v1
- Date: Tue, 31 Dec 2024 05:12:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:17:44.765293
- Title: Efficient Human-in-the-Loop Active Learning: A Novel Framework for Data Labeling in AI Systems
- Title(参考訳): AIシステムにおけるデータラベリングのための新しいフレームワーク「Human-in-the-Loop Active Learning」
- Authors: Yiran Huang, Jian-Feng Yang, Haoda Fu,
- Abstract要約: 本稿では,現代のAIシステムに適用可能な,新たなアクティブラーニングフレームワークを提案する。
従来のアクティブな学習手法とは違い、どのデータポイントにラベルを付けるべきかを判断することのみに重点を置いているのに対し、我々のフレームワークは異なるクエリスキームを組み込むという革新的な視点も導入しています。
提案する能動学習フレームワークは,他の手法と比較して精度が高く,損失も少ない。
- 参考スコア(独自算出の注目度): 0.6267574471145215
- License:
- Abstract: Modern AI algorithms require labeled data. In real world, majority of data are unlabeled. Labeling the data are costly. this is particularly true for some areas requiring special skills, such as reading radiology images by physicians. To most efficiently use expert's time for the data labeling, one promising approach is human-in-the-loop active learning algorithm. In this work, we propose a novel active learning framework with significant potential for application in modern AI systems. Unlike the traditional active learning methods, which only focus on determining which data point should be labeled, our framework also introduces an innovative perspective on incorporating different query scheme. We propose a model to integrate the information from different types of queries. Based on this model, our active learning frame can automatically determine how the next question is queried. We further developed a data driven exploration and exploitation framework into our active learning method. This method can be embedded in numerous active learning algorithms. Through simulations on five real-world datasets, including a highly complex real image task, our proposed active learning framework exhibits higher accuracy and lower loss compared to other methods.
- Abstract(参考訳): 現代のAIアルゴリズムはラベル付きデータを必要とする。
現実世界では、ほとんどのデータがラベル付けされていない。
データのラベル付けはコストがかかる。
これは、医師による放射線画像を読むなど、特別なスキルを必要とする領域で特に当てはまります。
データラベリングに専門家の時間を最大限に活用するためには、有望なアプローチとして、Human-in-the-loop Active Learningアルゴリズムがある。
本研究では,現代のAIシステムに適用可能な,新たなアクティブラーニングフレームワークを提案する。
従来のアクティブな学習手法とは違い、どのデータポイントにラベルを付けるべきかを判断することのみに重点を置いているのに対し、我々のフレームワークは異なるクエリスキームを組み込むという革新的な視点も導入しています。
異なるタイプのクエリからの情報を統合するモデルを提案する。
このモデルに基づいて、我々のアクティブラーニングフレームは、次の質問がどのようにクエリされるかを自動的に決定できる。
能動的学習手法にデータ駆動探索・活用の枠組みをさらに発展させた。
この方法は多数の能動学習アルゴリズムに組み込むことができる。
非常に複雑な実画像タスクを含む5つの実世界のデータセットのシミュレーションを通じて、提案するアクティブラーニングフレームワークは、他の手法と比較して精度が高く、損失も少ない。
関連論文リスト
- Image Classification with Deep Reinforcement Active Learning [28.924413229981827]
多くの実世界のシナリオでは、ラベル付きデータは不足しており、ハンドラベルは時間、労力、コストが要求される。
アクティブラーニング(英: Active Learning)は、専門家によって注釈付けされ、手作業によるデータのラベル付けを緩和する代替パラダイムである。
本研究では,マルコフ決定過程(MDP)に基づく適応型能動学習法を提案する。
論文 参考訳(メタデータ) (2024-12-27T18:37:51Z) - Batch Active Learning of Reward Functions from Human Preferences [33.39413552270375]
嗜好に基づく学習は、ユーザが好みの質問をすることで、信頼できるラベル付けを可能にする。
アクティブクエリ手法は、より情報性の高いデータを生成するために、好みに基づく学習で一般的に使用される。
我々は,データサンプルを極力少なくして,報酬関数の効率的な学習を可能にする,新しいアルゴリズムのセットを開発した。
論文 参考訳(メタデータ) (2024-02-24T08:07:48Z) - Learning from the Best: Active Learning for Wireless Communications [9.523381807291049]
アクティブな学習アルゴリズムは、ラベル付けされていないデータセットの中で最も重要で情報に富んだサンプルを特定し、完全なデータセットではなく、これらのサンプルのみをラベル付けする。
本稿では, ディープラーニングに基づくmmWaveビーム選択のケーススタディとして, 包括探索に基づく計算集約アルゴリズムを用いてラベル付けを行う。
この結果から,クラス不均衡データセットに対するアクティブな学習アルゴリズムを用いることで,データセットのラベル付けオーバーヘッドを最大50%削減できることがわかった。
論文 参考訳(メタデータ) (2024-01-23T12:21:57Z) - Learn to Explore: on Bootstrapping Interactive Data Exploration with
Meta-learning [8.92180350317399]
本稿ではメタ学習に基づく学習から発見までのフレームワークを提案し,メタタスクを自動生成した分類器の学習方法を学習する。
提案手法は,精度と効率の点で既存探索法よりも優れている。
論文 参考訳(メタデータ) (2022-12-07T03:12:41Z) - ALBench: A Framework for Evaluating Active Learning in Object Detection [102.81795062493536]
本稿では、オブジェクト検出におけるアクティブラーニングを評価するために、ALBenchという名前のアクティブラーニングベンチマークフレームワークをコントリビュートする。
自動深層モデルトレーニングシステム上で開発されたこのALBenchフレームワークは、使いやすく、さまざまなアクティブな学習アルゴリズムと互換性があり、同じトレーニングおよびテストプロトコルを保証する。
論文 参考訳(メタデータ) (2022-07-27T07:46:23Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Low-Regret Active learning [64.36270166907788]
トレーニングに最も有用なラベル付きデータポイントを識別するオンライン学習アルゴリズムを開発した。
私たちの仕事の中心は、予測可能な(簡単な)インスタンスの低い後悔を達成するために調整された睡眠専門家のための効率的なアルゴリズムです。
論文 参考訳(メタデータ) (2021-04-06T22:53:45Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Bayesian active learning for production, a systematic study and a
reusable library [85.32971950095742]
本稿では,現在のアクティブラーニング技術の主な欠点について分析する。
実世界のデータセットの最も一般的な課題が深層能動学習プロセスに与える影響について,系統的研究を行った。
部分的不確実性サンプリングやより大きいクエリサイズといった,アクティブな学習ループを高速化する2つの手法を導出する。
論文 参考訳(メタデータ) (2020-06-17T14:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。