論文の概要: Nonmyopic Multifidelity Active Search
- arxiv url: http://arxiv.org/abs/2106.06356v1
- Date: Fri, 11 Jun 2021 12:55:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-14 19:50:22.569335
- Title: Nonmyopic Multifidelity Active Search
- Title(参考訳): Nonmyopic Multifidelity Active Search
- Authors: Quan Nguyen, Arghavan Modiri, Roman Garnett
- Abstract要約: 本稿では,多要素能動探索のモデルと,この設定のための新しい,計算効率の良いポリシーを提案する。
実世界のデータセット上でのソリューションの性能を評価し,自然ベンチマークよりもはるかに優れた性能を示す。
- 参考スコア(独自算出の注目度): 15.689830609697685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active search is a learning paradigm where we seek to identify as many
members of a rare, valuable class as possible given a labeling budget. Previous
work on active search has assumed access to a faithful (and expensive) oracle
reporting experimental results. However, some settings offer access to cheaper
surrogates such as computational simulation that may aid in the search. We
propose a model of multifidelity active search, as well as a novel,
computationally efficient policy for this setting that is motivated by
state-of-the-art classical policies. Our policy is nonmyopic and budget aware,
allowing for a dynamic tradeoff between exploration and exploitation. We
evaluate the performance of our solution on real-world datasets and demonstrate
significantly better performance than natural benchmarks.
- Abstract(参考訳): アクティブ検索は学習パラダイムであり、ラベリング予算を考えると、希少で価値のあるクラスのメンバをできるだけ多く特定することを目指す。
以前のアクティブ検索に関する仕事は、オラクルが実験結果を報告する忠実な(かつ高価な)アクセスを想定していた。
しかし、いくつかの設定では、検索に役立つ計算シミュレーションのような安価なサロゲートにアクセスできる。
本稿では,多元的アクティブサーチのモデルと,最先端の古典的政策に動機づけられた,新しい計算効率の高い手法を提案する。
当社の方針は非自明で予算を意識しており、探索と搾取のダイナミックなトレードオフを可能にしています。
実世界のデータセット上でのソリューションの性能を評価し,自然ベンチマークよりも優れた性能を示す。
関連論文リスト
- Amortized nonmyopic active search via deep imitation learning [16.037812098340343]
アクティブ検索は、希少で価値のあるクラスのメンバを集めることを目標とする、特別なアクティブな学習環境を形式化する。
本稿では,ニューラルネットワークをトレーニングして検索学習を行うことにより,このポリシーの償却について検討する。
我々のネットワークは、合成データに基づいて訓練され、非神秘的な決定をもたらす有益な探索戦略を学習する。
論文 参考訳(メタデータ) (2024-05-23T20:10:29Z) - Endogenous Macrodynamics in Algorithmic Recourse [52.87956177581998]
対実説明(CE)とアルゴリズム・リコース(AR)に関する既存の研究は、静的環境における個人に主に焦点を当ててきた。
既存の方法論の多くは、一般化されたフレームワークによってまとめて記述できることを示す。
次に、既存のフレームワークは、グループレベルでの言論の内在的ダイナミクスを研究する際にのみ明らかとなるような、隠された対外的関係のコストを考慮に入れていないと論じる。
論文 参考訳(メタデータ) (2023-08-16T07:36:58Z) - Actively Discovering New Slots for Task-oriented Conversation [19.815466126158785]
本稿では,ループ内学習を実現するため,情報抽出方式で汎用的なスロットタスクを提案する。
我々は既存の言語ツールを活用し、対応するラベルが弱い監視信号として利用される値候補を抽出する。
いくつかの公開データセットに対して広範な実験を行い、競合するベースラインを多数比較して手法を実証する。
論文 参考訳(メタデータ) (2023-05-06T13:33:33Z) - A Visual Active Search Framework for Geospatial Exploration [36.31732056074638]
多くの問題は、航空画像によって支援された地理空間探索の形式と見なすことができる。
我々は3つの重要な入力を持つ視覚的能動探索(VAS)フレームワークでこの問題をモデル化する。
完全注釈付き検索タスクの集合からメタ検索ポリシーを学習するVASのための強化学習手法を提案する。
論文 参考訳(メタデータ) (2022-11-28T21:53:05Z) - Cost Aware Asynchronous Multi-Agent Active Search [6.587280549237275]
未知の環境でターゲットを検出するオンライン能動探索アルゴリズムを提案する。
我々のアルゴリズムは、トンプソンサンプリング、モンテカルロ木探索、最適信頼境界の原理を組み合わせる。
我々は,コストを考慮した能動探索において,アルゴリズムの性能をシミュレーションで解析し,その有効性を示す。
論文 参考訳(メタデータ) (2022-10-05T13:38:30Z) - Active Exploration for Inverse Reinforcement Learning [58.295273181096036]
Inverse Reinforcement Learning (AceIRL) のための新しいIRLアルゴリズムを提案する。
AceIRLは、専門家の報酬関数を素早く学習し、良い政策を特定するために、未知の環境と専門家のポリシーを積極的に探求する。
我々はシミュレーションにおいてAceIRLを実証的に評価し、より単純な探索戦略よりも著しく優れていることを発見した。
論文 参考訳(メタデータ) (2022-07-18T14:45:55Z) - Nonmyopic Multiclass Active Search for Diverse Discovery [23.752202199551572]
アクティブサーチは適応的な実験設計の舞台であり、予算制約を受ける希少で価値のあるクラスのメンバーを明らかにすることを目的としている。
本稿では,複数の対象クラスを対象とする能動探索の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-02-08T01:39:02Z) - Single-Modal Entropy based Active Learning for Visual Question Answering [75.1682163844354]
視覚質問応答(VQA)のマルチモーダル設定におけるアクティブラーニングに対処する
マルチモーダルな入力,画像,質問を考慮し,有効サンプル取得のための新しい手法を提案する。
私たちの新しいアイデアは、実装が簡単で、コスト効率が高く、他のマルチモーダルタスクにも容易に適応できます。
論文 参考訳(メタデータ) (2021-10-21T05:38:45Z) - Scaling up Search Engine Audits: Practical Insights for Algorithm
Auditing [68.8204255655161]
異なる地域に数百の仮想エージェントを配置した8つの検索エンジンの実験を行った。
複数のデータ収集にまたがる研究インフラの性能を実証する。
仮想エージェントは,アルゴリズムの性能を長時間にわたって監視するための,有望な場所である,と結論付けている。
論文 参考訳(メタデータ) (2021-06-10T15:49:58Z) - Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。
本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。
この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文 参考訳(メタデータ) (2020-11-02T08:46:27Z) - Provably Efficient Reward-Agnostic Navigation with Linear Value
Iteration [143.43658264904863]
我々は、最小二乗値スタイルのアルゴリズムで一般的に使用される、より標準的なベルマン誤差の概念の下での反復が、ほぼ最適値関数の学習において強力なPAC保証を提供することを示す。
そこで本稿では,任意の(線形な)報酬関数に対して,最適に近いポリシーを学習するためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2020-08-18T04:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。