論文の概要: Autodiscover: A reinforcement learning recommendation system for the cold-start imbalance challenge in active learning, powered by graph-aware thompson sampling
- arxiv url: http://arxiv.org/abs/2602.05087v1
- Date: Wed, 04 Feb 2026 22:16:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.64325
- Title: Autodiscover: A reinforcement learning recommendation system for the cold-start imbalance challenge in active learning, powered by graph-aware thompson sampling
- Title(参考訳): AutoDiscover: グラフ対応トンプソンサンプリングによるアクティブラーニングにおける冷間開始不均衡問題に対する強化学習推薦システム
- Authors: Parsa Vares,
- Abstract要約: この論文では、適応エージェントによって駆動されるオンライン意思決定問題として、アクティブな学習を再構成するフレームワークであるAutoDiscoverを紹介している。
26-dataset SynERGYベンチマークでは、AutoDiscoverは静的ALベースラインよりも高いスクリーニング効率を実現している。
エージェントの決定を解釈し、検証し、診断するための、オープンソースのビジュアル分析ダッシュボードであるTS-Insightも導入しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Systematic literature reviews (SLRs) are fundamental to evidence-based research, but manual screening is an increasing bottleneck as scientific output grows. Screening features low prevalence of relevant studies and scarce, costly expert decisions. Traditional active learning (AL) systems help, yet typically rely on fixed query strategies for selecting the next unlabeled documents. These static strategies do not adapt over time and ignore the relational structure of scientific literature networks. This thesis introduces AutoDiscover, a framework that reframes AL as an online decision-making problem driven by an adaptive agent. Literature is modeled as a heterogeneous graph capturing relationships among documents, authors, and metadata. A Heterogeneous Graph Attention Network (HAN) learns node representations, which a Discounted Thompson Sampling (DTS) agent uses to dynamically manage a portfolio of query strategies. With real-time human-in-the-loop labels, the agent balances exploration and exploitation under non-stationary review dynamics, where strategy utility changes over time. On the 26-dataset SYNERGY benchmark, AutoDiscover achieves higher screening efficiency than static AL baselines. Crucially, the agent mitigates cold start by bootstrapping discovery from minimal initial labels where static approaches fail. We also introduce TS-Insight, an open-source visual analytics dashboard to interpret, verify, and diagnose the agent's decisions. Together, these contributions accelerate SLR screening under scarce expert labels and low prevalence of relevant studies.
- Abstract(参考訳): 体系的文献レビュー(SLR)はエビデンスに基づく研究の基本であるが、科学的な成果が増大するにつれて、手作業によるスクリーニングがボトルネックとして増大する。
スクリーニングは、関連する研究の頻度が低く、少ない、高価な専門家による決定が特徴である。
従来のアクティブラーニング(AL)システムは、通常、次のラベルのないドキュメントを選択するのに、固定されたクエリ戦略に依存する。
これらの静的戦略は時間とともに適応せず、科学文献ネットワークのリレーショナル構造を無視する。
この論文では、適応エージェントによって駆動されるオンライン意思決定問題としてALを再構成するフレームワークであるAutoDiscoverを紹介している。
文学は、文書、著者、メタデータ間の関係を捉える異種グラフとしてモデル化されている。
異種グラフ注意ネットワーク(HAN)はノード表現を学習し、DTS(Discounted Thompson Sampling)エージェントがクエリ戦略のポートフォリオを動的に管理する。
リアルタイムのHuman-in-the-loopラベルでは、エージェントは非定常的なレビューダイナミクスの下で探索とエクスプロイトのバランスをとり、戦略ユーティリティは時間とともに変化する。
26-dataset SynERGYベンチマークでは、AutoDiscoverは静的ALベースラインよりも高いスクリーニング効率を実現している。
重要なことに、エージェントは、静的アプローチが失敗する最小のイニシャルラベルからの発見をブートストラップすることで、コールドスタートを緩和する。
エージェントの決定を解釈し、検証し、診断するための、オープンソースのビジュアル分析ダッシュボードであるTS-Insightも導入しています。
これらの貢献により、専門家ラベルの不足によるSLRスクリーニングが促進され、関連する研究の頻度が低くなった。
関連論文リスト
- Strategic Opponent Modeling with Graph Neural Networks, Deep Reinforcement Learning and Probabilistic Topic Modeling [2.233215416354843]
本稿では,主にグラフニューラルネットワーク,深層強化学習,確率論的トピックモデリング手法について概説する。
我々は、現実世界のアプリケーションケースで非常によく見られる2つの特徴である不確実性と不均一性を扱う能力を分析します。
特定のオープンな課題、特に非定常環境に適合する必要性を特定します。
論文 参考訳(メタデータ) (2025-11-13T17:06:56Z) - Just-in-time Episodic Feedback Hinter: Leveraging Offline Knowledge to Improve LLM Agents Adaptation [77.90555621662345]
JEF Hinterは、オフライントレースをコンパクトでコンテキスト対応のヒントに蒸留するエージェントシステムである。
ズーム機構は、長い軌道における決定的なステップを強調し、戦略と落とし穴の両方をキャプチャする。
MiniWoB++、WorkArena-L1、WebArena-Liteの実験は、JSF Hinterが一貫して強力なベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-10-05T21:34:42Z) - CEGA: A Cost-Effective Approach for Graph-Based Model Extraction and Acquisition [12.65757526181259]
モデル抽出攻撃(MEA)に対するGNNの脆弱性を評価する。
本稿では,非常に実用的で未探索なシナリオに適したノードクエリ戦略を提案する。
本手法は,複数の学習サイクルにまたがるノード選択機構を反復的に改良する。
論文 参考訳(メタデータ) (2025-06-21T13:11:42Z) - GRAIL: A Benchmark for GRaph ActIve Learning in Dynamic Sensing Environments [1.9918773938716672]
グラフベースのアクティブラーニング(AL)はグラフの構造を利用してラベルクエリを効率的に優先順位付けする。
GRAILは、動的で現実世界の環境でグラフAL戦略を評価するために設計されたベンチマークフレームワークである。
論文 参考訳(メタデータ) (2025-06-11T19:04:18Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - ORIS: Online Active Learning Using Reinforcement Learning-based Inclusive Sampling for Robust Streaming Analytics System [2.985426781886815]
ラベル付けのための文書のインクルーシブサンプリングを用いたオンライン能動学習手法であるORISを提案する。
ORISは、ラベル付けにおけるヒューマンエラーを最小限に抑えるために、入ってくる文書をサンプリングする、新しいQ-Networkベースの戦略を作成することを目的としている。
我々は、感情認識タスクにおけるORIS法の評価を行い、人間のラベル付け性能とMLモデル性能の両面で従来のベースラインを上回った。
論文 参考訳(メタデータ) (2024-11-27T05:11:37Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。