論文の概要: ORIS: Online Active Learning Using Reinforcement Learning-based Inclusive Sampling for Robust Streaming Analytics System
- arxiv url: http://arxiv.org/abs/2411.18060v1
- Date: Wed, 27 Nov 2024 05:11:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 15:25:57.074592
- Title: ORIS: Online Active Learning Using Reinforcement Learning-based Inclusive Sampling for Robust Streaming Analytics System
- Title(参考訳): ORIS:ロバストストリーミング分析システムのための強化学習に基づく包括的サンプリングを用いたオンラインアクティブラーニング
- Authors: Rahul Pandey, Ziwei Zhu, Hemant Purohit,
- Abstract要約: ラベル付けのための文書のインクルーシブサンプリングを用いたオンライン能動学習手法であるORISを提案する。
ORISは、ラベル付けにおけるヒューマンエラーを最小限に抑えるために、入ってくる文書をサンプリングする、新しいQ-Networkベースの戦略を作成することを目的としている。
我々は、感情認識タスクにおけるORIS法の評価を行い、人間のラベル付け性能とMLモデル性能の両面で従来のベースラインを上回った。
- 参考スコア(独自算出の注目度): 2.985426781886815
- License:
- Abstract: Effective labeled data collection plays a critical role in developing and fine-tuning robust streaming analytics systems. However, continuously labeling documents to filter relevant information poses significant challenges like limited labeling budget or lack of high-quality labels. There is a need for efficient human-in-the-loop machine learning (HITL-ML) design to improve streaming analytics systems. One particular HITL- ML approach is online active learning, which involves iteratively selecting a small set of the most informative documents for labeling to enhance the ML model performance. The performance of such algorithms can get affected due to human errors in labeling. To address these challenges, we propose ORIS, a method to perform Online active learning using Reinforcement learning-based Inclusive Sampling of documents for labeling. ORIS aims to create a novel Deep Q-Network-based strategy to sample incoming documents that minimize human errors in labeling and enhance the ML model performance. We evaluate the ORIS method on emotion recognition tasks, and it outperforms traditional baselines in terms of both human labeling performance and the ML model performance.
- Abstract(参考訳): 効果的なラベル付きデータ収集は、堅牢なストリーミング分析システムの開発と微調整において重要な役割を果たす。
しかし、関連情報をフィルタリングするために文書を継続的にラベル付けすることは、ラベル付け予算の制限や高品質なラベルの欠如といった大きな課題を引き起こす。
ストリーミング分析システムを改善するために、効率的なHuman-in-the-loop Machine Learning (HITL-ML)設計が必要である。
特定のHITL-MLアプローチの1つは、オンラインアクティブラーニングであり、MLモデルのパフォーマンスを向上させるためにラベル付けのための最も情報性の高いドキュメントの小さなセットを反復的に選択する。
このようなアルゴリズムの性能は、ラベル付けにおけるヒューマンエラーによって影響を受ける可能性がある。
これらの課題に対処するため、我々は、ラベル付けのための文書の強化学習に基づくインクルーシブサンプリングを用いたオンラインアクティブな学習を行う方法であるORISを提案する。
ORISは、ラベル付けにおけるヒューマンエラーを最小限に抑え、MLモデルのパフォーマンスを向上する、新しいQ-Networkベースの戦略を構築することを目的としている。
我々は、感情認識タスクにおけるORIS法の評価を行い、人間のラベル付け性能とMLモデル性能の両面で従来のベースラインを上回った。
関連論文リスト
- From Selection to Generation: A Survey of LLM-based Active Learning [153.8110509961261]
大きな言語モデル(LLM)は、全く新しいデータインスタンスを生成し、よりコスト効率の良いアノテーションを提供するために使われています。
本調査は,LSMに基づくAL手法の直感的な理解を目指して,研究者や実践者の最新のリソースとして機能することを目的としている。
論文 参考訳(メタデータ) (2025-02-17T12:58:17Z) - GALOT: Generative Active Learning via Optimizable Zero-shot Text-to-image Generation [21.30138131496276]
本稿では,ゼロショットテキスト・トゥ・イメージ(T2I)合成とアクティブラーニングを統合した。
我々はAL基準を利用してテキスト入力を最適化し、より情報的で多様なデータサンプルを生成する。
このアプローチは、モデルトレーニングの効率を高めながら、データ収集とアノテーションのコストを削減します。
論文 参考訳(メタデータ) (2024-12-18T18:40:21Z) - Learning with Less: Knowledge Distillation from Large Language Models via Unlabeled Data [54.934578742209716]
現実世界のNLPアプリケーションでは、Large Language Models (LLMs) は巨大なデータセットの広範なトレーニングのために、有望なソリューションを提供する。
LLKDは、教師と学生の両方の信号を組み込んだ適応的なサンプル選択法である。
総合的な実験により,LLKDは高いデータ効率で,様々なデータセットで優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-11-12T18:57:59Z) - RED-CT: A Systems Design Methodology for Using LLM-labeled Data to Train and Deploy Edge Classifiers for Computational Social Science [0.46560775769914914]
大規模言語モデル(LLM)は、構造化されていない自然言語データを迅速に分析し分類する能力を向上した。
しかしながら、コスト、ネットワーク制限、セキュリティ上の制約に関する懸念は、彼らの作業プロセスへの統合に問題を引き起こしている。
本研究では,下流教師あり学習タスクにおいて,LLMを不完全なデータアノテータとして利用するシステム設計手法を採用する。
論文 参考訳(メタデータ) (2024-08-15T15:28:37Z) - Learning From Crowdsourced Noisy Labels: A Signal Processing Perspective [42.24248330317496]
本記事では,ノイズの多いクラウドソースラベルから学ぶことの進歩を紹介する。
その焦点は、古典的な統計モデルから最近のディープラーニングベースのアプローチまで、主要なクラウドソーシングモデルとその方法論的治療である。
特に、テンソルの識別可能性や非負行列分解など、信号処理(SP)理論と手法の関連性について概説する。
論文 参考訳(メタデータ) (2024-07-09T14:34:40Z) - Mean-AP Guided Reinforced Active Learning for Object Detection [31.304039641225504]
本稿では,オブジェクト検出のための平均APガイド型アクティブラーニングについて紹介する。
MGRALは、予測されたモデル出力変化の概念を深層検知ネットワークの情報性として活用する新しいアプローチである。
提案手法は,物体検出のための強化学習に基づく能動学習における新たなパラダイムを確立し,高い性能を示す。
論文 参考訳(メタデータ) (2023-10-12T14:59:22Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning [52.257422715393574]
本稿では,Large Language Models (LLMs) の自己誘導手法を導入し,オープンソースデータセットからサクラサンプルを自動識別し,選択する。
我々の重要な革新である命令追従困難度(IFD)メトリックは、モデルが期待する応答と本質的な生成能力の相違を識別するための重要な指標として現れます。
論文 参考訳(メタデータ) (2023-08-23T09:45:29Z) - Active Learning Framework to Automate NetworkTraffic Classification [0.0]
この話題に対処するための新しいActiveLearning Framework(ALF)を提案する。
ALFは、アクティブラーニングループのデプロイと、データセットとMLモデルを継続的に進化させるALFインスタンスのメンテナンスに使用できるコンポーネントを提供する。
その結果,高速(100Gb/s)ネットワークのIPフローに基づく解析が可能となった。
論文 参考訳(メタデータ) (2022-10-26T10:15:18Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Adaptive Self-training for Few-shot Neural Sequence Labeling [55.43109437200101]
ニューラルシークエンスラベリングモデルにおけるラベル不足問題に対処する手法を開発した。
自己学習は、大量のラベルのないデータから学ぶための効果的なメカニズムとして機能する。
メタラーニングは、適応的なサンプル再重み付けにおいて、ノイズのある擬似ラベルからのエラー伝播を軽減するのに役立つ。
論文 参考訳(メタデータ) (2020-10-07T22:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。