論文の概要: SoQal: Selective Oracle Questioning in Active Learning
- arxiv url: http://arxiv.org/abs/2004.10468v1
- Date: Wed, 22 Apr 2020 09:53:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 17:20:22.468961
- Title: SoQal: Selective Oracle Questioning in Active Learning
- Title(参考訳): SoQal: アクティブラーニングにおけるOracleの選択的な質問
- Authors: Dani Kiyasseh, Tingting Zhu, David A. Clifton
- Abstract要約: オラクルからラベルをいつ要求すべきかを判断する質問戦略であるSoQalを提案する。
公開可能な5つのデータセットの実験を行い、ベースラインアプローチと比較してSoQalの優位性を示す。
- 参考スコア(独自算出の注目度): 17.58391771585294
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Large sets of unlabelled data within the healthcare domain remain
underutilized. Active learning offers a way to exploit these datasets by
iteratively requesting an oracle (e.g. medical professional) to label
instances. This process, which can be costly and time-consuming is
overly-dependent upon an oracle. To alleviate this burden, we propose SoQal, a
questioning strategy that dynamically determines when a label should be
requested from an oracle. We perform experiments on five publically-available
datasets and illustrate SoQal's superiority relative to baseline approaches,
including its ability to reduce oracle label requests by up to 35%. SoQal also
performs competitively in the presence of label noise: a scenario that
simulates clinicians' uncertain diagnoses when faced with difficult
classification tasks.
- Abstract(参考訳): 医療領域内の大量の未使用データは未利用のままである。
アクティブラーニングは、oracle(例えば医療専門家)にインスタンスをラベル付けするように繰り返し要求することで、これらのデータセットを悪用する方法を提供する。
コストと時間を要するこのプロセスは、オラクルに過度に依存します。
本稿では,この負担を軽減するために,オラクルからラベルを要求すべき時期を動的に決定する質問方法であるSoQalを提案する。
公開可能な5つのデータセットで実験を行い、SoQalのベースラインアプローチに対する優位性を示し、オラクルラベル要求を最大35%削減する機能を含む。
soqalはまた、難しい分類課題に直面した際に臨床医の不確実性診断をシミュレートするシナリオであるラベルノイズ(英語版)の存在下で競争的に機能する。
関連論文リスト
- Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Improve the efficiency of deep reinforcement learning through semantic
exploration guided by natural language [10.47685316733524]
本稿では,検索に基づく手法を用いて,神託との対話を選択的かつ効率的に行う方法を提案する。
ニューラルネットワークを用いてエージェントとオラクルの現在の状態を符号化し、コーパスから最も関連性の高い質問を検索してオラクルを問う。
提案手法は,特定のレベルの性能に達するために必要なインタラクション数を削減し,RLの効率を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2023-09-21T03:25:35Z) - Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。
ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。
本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:10:08Z) - Information Gain Propagation: a new way to Graph Active Learning with
Soft Labels [26.20597165750861]
グラフニューラルネットワーク(GNN)は様々なタスクで大きな成功を収めているが、その性能は多数のラベル付きノードに依存している。
GNNに基づくアクティブラーニング(AL)手法を提案し,ラベル付けに最も有用なノードを選択することにより,ラベル付け効率を向上させる。
提案手法は, 精度とラベル付けコストの両面から, 最先端のGNNベースのAL法よりも優れていた。
論文 参考訳(メタデータ) (2022-03-02T13:28:25Z) - QUEACO: Borrowing Treasures from Weakly-labeled Behavior Data for Query
Attribute Value Extraction [57.56700153507383]
本稿では,QUEACOというEコマース検索におけるクエリ属性値の統一抽出システムを提案する。
NER フェーズでは、QUEACO は教師-学生ネットワークを採用し、強くラベル付けされたデータに基づいてトレーニングされた教師ネットワークが擬似ラベルを生成する。
AVN フェーズでは、弱いラベル付けされたクエリ・ツー・アトリビュート・ビヘイビア・データを利用して、クエリーから表層属性値の正規化を行い、製品から標準形式へと変換する。
論文 参考訳(メタデータ) (2021-08-19T03:24:23Z) - KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization
for Relation Extraction [111.74812895391672]
シナジスティック最適化(KnowPrompt)を用いた知識認識型Promptチューニング手法を提案する。
関係ラベルに含まれる潜在知識をインジェクトして,学習可能な仮想型語と解答語で構築する。
論文 参考訳(メタデータ) (2021-04-15T17:57:43Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z) - PAL : Pretext-based Active Learning [2.869739951301252]
提案手法は,従来の提案手法よりも,誤ラベルに頑健な深層ニューラルネットワークの能動的学習手法を提案する。
ラベルのないサンプルを選別するために、別ネットワークを使用します。
その結果,ラベルノイズの欠如による競合精度も向上した。
論文 参考訳(メタデータ) (2020-10-29T21:16:37Z) - Deep Active Learning via Open Set Recognition [0.0]
多くのアプリケーションでは、データは簡単に取得できるが、顕著な例を示すのに高価で時間がかかる。
オープンセット認識問題として能動的学習を定式化する。
現在のアクティブな学習方法とは異なり、我々のアルゴリズムはタスクラベルを必要とせずにタスクを学習することができる。
論文 参考訳(メタデータ) (2020-07-04T22:09:17Z) - ClarQ: A large-scale and diverse dataset for Clarification Question
Generation [67.1162903046619]
そこで我々は,スタックエクスチェンジから抽出したポストコメンデーションに基づいて,多様な,大規模な明確化質問データセットの作成を支援する,新しいブートストラップフレームワークを考案した。
質問応答の下流タスクに適用することで,新たに作成したデータセットの有用性を定量的に示す。
我々はこのデータセットを公開し、ダイアログと質問応答システムの拡張という大きな目標を掲げて、質問生成の分野の研究を促進する。
論文 参考訳(メタデータ) (2020-06-10T17:56:50Z) - SoQal: Selective Oracle Questioning for Consistency Based Active
Learning of Cardiac Signals [17.58391771585294]
臨床設定はしばしば、豊富なラベル付きデータと限られたラベル付きデータによって特徴づけられる。
この負担を軽減する方法の1つは、(a)取得と(b)情報のないインスタンスのアノテーションを含むアクティブラーニング(AL)を通じてである。
BALCはBALDのような最先端の獲得機能より優れており,SoQalはノイズの多いオラクルの存在下でもベースライン法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-20T18:20:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。