論文の概要: A Partially Supervised Reinforcement Learning Framework for Visual
Active Search
- arxiv url: http://arxiv.org/abs/2310.09689v2
- Date: Wed, 8 Nov 2023 03:32:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-09 18:45:03.618956
- Title: A Partially Supervised Reinforcement Learning Framework for Visual
Active Search
- Title(参考訳): 視覚アクティブ検索のための部分教師あり強化学習フレームワーク
- Authors: Anindya Sarkar, Nathan Jacobs, Yevgeniy Vorobeychik
- Abstract要約: ビジュアルアクティブサーチ(VAS)は、探索のガイドとして視覚的手がかりを用いるモデリングフレームワークとして提案されている。
本稿では,DRLの長所と従来のアクティブ検索の長所を併用して,探索ポリシーを予測モジュールに分解する手法を提案する。
そこで我々は,学習時間と意思決定時間の両方で得られた教師付き情報を効果的に活用できる新しいメタラーニング手法を開発した。
- 参考スコア(独自算出の注目度): 36.966522001393734
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Visual active search (VAS) has been proposed as a modeling framework in which
visual cues are used to guide exploration, with the goal of identifying regions
of interest in a large geospatial area. Its potential applications include
identifying hot spots of rare wildlife poaching activity, search-and-rescue
scenarios, identifying illegal trafficking of weapons, drugs, or people, and
many others. State of the art approaches to VAS include applications of deep
reinforcement learning (DRL), which yield end-to-end search policies, and
traditional active search, which combines predictions with custom algorithmic
approaches. While the DRL framework has been shown to greatly outperform
traditional active search in such domains, its end-to-end nature does not make
full use of supervised information attained either during training, or during
actual search, a significant limitation if search tasks differ significantly
from those in the training distribution. We propose an approach that combines
the strength of both DRL and conventional active search by decomposing the
search policy into a prediction module, which produces a geospatial
distribution of regions of interest based on task embedding and search history,
and a search module, which takes the predictions and search history as input
and outputs the search distribution. We develop a novel meta-learning approach
for jointly learning the resulting combined policy that can make effective use
of supervised information obtained both at training and decision time. Our
extensive experiments demonstrate that the proposed representation and
meta-learning frameworks significantly outperform state of the art in visual
active search on several problem domains.
- Abstract(参考訳): ビジュアルアクティブサーチ(VAS)は,大規模な地理空間領域における関心領域を特定することを目的として,探索のガイドとして視覚的手がかりを用いたモデリングフレームワークとして提案されている。
その潜在的な用途は、希少な野生生物の密猟活動のホットスポットの特定、捜索と回収のシナリオ、武器、薬物、あるいは人々に対する違法な密輸の特定などである。
VASに対する最先端のアプローチには、エンドツーエンドの検索ポリシーを生成する深層強化学習(DRL)や、予測とカスタムアルゴリズムのアプローチを組み合わせた従来のアクティブ検索がある。
DRLフレームワークは、これらの領域において従来のアクティブ検索よりも大幅に優れていることが示されているが、そのエンドツーエンドの性質は、トレーニング中または実際の検索中において、教師付き情報を完全に活用するわけではない。
本稿では,DRLの長所と従来のアクティブ検索の長所を,タスク埋め込みと検索履歴に基づく関心領域の地理空間分布を生成する予測モジュールに分解することで組み合わせ,検索履歴を入力とし,検索分布を出力する探索モジュールを提案する。
そこで我々は,学習時間と意思決定時間の両方で得られた教師付き情報を効果的に活用できる新しいメタ学習手法を開発した。
提案した表現とメタラーニングのフレームワークは,いくつかの問題領域における視覚的能動探索において,その技術水準を大幅に上回っていることを示す。
関連論文リスト
- Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文 参考訳(メタデータ) (2024-11-18T16:15:17Z) - Semantic-Based Active Perception for Humanoid Visual Tasks with Foveal Sensors [49.99728312519117]
この研究の目的は、最近の意味に基づくアクティブな知覚モデルが、人間が定期的に行う視覚的なタスクをいかに正確に達成できるかを確立することである。
このモデルは、現在のオブジェクト検出器が多数のオブジェクトクラスをローカライズし、分類し、複数の固定にまたがるシーンのセマンティック記述を更新する能力を利用する。
シーン探索の課題では、セマンティック・ベースの手法は従来のサリエンシ・ベース・モデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T18:15:57Z) - A Survey on Deep Learning-based Spatio-temporal Action Detection [8.456482280676884]
STADは、ビデオに存在するアクションを分類し、空間と時間でローカライズすることを目的としている。
それは、爆発的に出現する現実世界の応用のために、コンピュータビジョンにおける特に活発な研究領域となっている。
本稿では,STADの最先端の深層学習手法について概観する。
論文 参考訳(メタデータ) (2023-08-03T08:48:14Z) - A Visual Active Search Framework for Geospatial Exploration [36.31732056074638]
多くの問題は、航空画像によって支援された地理空間探索の形式と見なすことができる。
我々は3つの重要な入力を持つ視覚的能動探索(VAS)フレームワークでこの問題をモデル化する。
完全注釈付き検索タスクの集合からメタ検索ポリシーを学習するVASのための強化学習手法を提案する。
論文 参考訳(メタデータ) (2022-11-28T21:53:05Z) - CrossBeam: Learning to Search in Bottom-Up Program Synthesis [51.37514793318815]
ボトムアップ合成のためのハンズオン検索ポリシーを学習するためのニューラルネットワークのトレーニングを提案する。
私たちのアプローチは、CrossBeamと呼ばれ、ニューラルモデルを使用して、以前に探索されたプログラムを新しいプログラムに組み合わせる方法を選択します。
我々はCrossBeamが効率的に検索することを学び、最先端技術と比較してプログラム空間のより小さな部分を探索する。
論文 参考訳(メタデータ) (2022-03-20T04:41:05Z) - Embodied Learning for Lifelong Visual Perception [33.02424587900808]
我々は、新しいモデルを開発し、建物内を航行する様々なエージェントを比較し、生涯の視覚知覚を具体化して研究する。
エージェントの目的は、探索とアクティブな視覚学習を組み合わせたプロセスの最後に、建物全体のオブジェクトやその他のセマンティッククラスを認識することである。
論文 参考訳(メタデータ) (2021-12-28T10:47:13Z) - Nonmyopic Multifidelity Active Search [15.689830609697685]
本稿では,多要素能動探索のモデルと,この設定のための新しい,計算効率の良いポリシーを提案する。
実世界のデータセット上でのソリューションの性能を評価し,自然ベンチマークよりもはるかに優れた性能を示す。
論文 参考訳(メタデータ) (2021-06-11T12:55:51Z) - Reannealing of Decaying Exploration Based On Heuristic Measure in Deep
Q-Network [82.20059754270302]
本稿では,再熱処理の概念に基づくアルゴリズムを提案し,必要なときにのみ探索を促進することを目的とする。
我々は、訓練を加速し、より良い政策を得る可能性を示す実証的なケーススタディを実施している。
論文 参考訳(メタデータ) (2020-09-29T20:40:00Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。