論文の概要: Mask Atari for Deep Reinforcement Learning as POMDP Benchmarks
- arxiv url: http://arxiv.org/abs/2203.16777v1
- Date: Thu, 31 Mar 2022 03:34:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-02 05:52:13.075580
- Title: Mask Atari for Deep Reinforcement Learning as POMDP Benchmarks
- Title(参考訳): POMDPベンチマークとしての深層強化学習のためのマスクアタリ
- Authors: Yang Shao, Quan Kong, Tadayuki Matsumura, Taiki Fuji, Kiyoto Ito and
Hiroyuki Mizuno
- Abstract要約: Mask Atariは、部分的に観測可能なマルコフ決定プロセス(POMDP)問題を解決するための新しいベンチマークである。
観測エリアとして、コントロール可能、移動可能、学習可能なマスクを備えたアタリ2600ゲームを基に構築されている。
我々はベンチマークの課題と特徴を説明し、Mask Atariでいくつかのベースラインを評価した。
- 参考スコア(独自算出の注目度): 3.549772411359722
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Mask Atari, a new benchmark to help solve partially observable
Markov decision process (POMDP) problems with Deep Reinforcement Learning
(DRL)-based approaches. To achieve a simulation environment for the POMDP
problems, Mask Atari is constructed based on Atari 2600 games with
controllable, moveable, and learnable masks as the observation area for the
target agent, especially with the active information gathering (AIG) setting in
POMDPs. Given that one does not yet exist, Mask Atari provides a challenging,
efficient benchmark for evaluating the methods that focus on the above problem.
Moreover, the mask operation is a trial for introducing the receptive field in
the human vision system into a simulation environment for an agent, which means
the evaluations are not biased from the sensing ability and purely focus on the
cognitive performance of the methods when compared with the human baseline. We
describe the challenges and features of our benchmark and evaluate several
baselines with Mask Atari.
- Abstract(参考訳): 我々は,部分可観測マルコフ決定過程(pomdp)問題を解決するために,深層強化学習(drl)に基づく手法を用いた新しいベンチマークであるmask atariを提案する。
POMDP問題に対するシミュレーション環境を実現するため、特にPOMDPのアクティブ情報収集(AIG)設定において、ターゲットエージェントの観察領域として、制御可能、移動可能、学習可能なマスクを備えたAtari 2600ゲームに基づいてMask Atariを構築する。
Mask Atariは、まだ存在していないので、上記の問題に焦点を当てたメソッドを評価するための、挑戦的で効率的なベンチマークを提供する。
また、マスク操作は、エージェントのシミュレーション環境に人間の視覚システムの受容野を導入する試みであり、これは、評価がセンシング能力から偏っておらず、人間のベースラインと比較した場合の方法の認知性能に純粋に焦点を合わせていることを意味する。
我々はベンチマークの課題と特徴を説明し、Mask Atariでいくつかのベースラインを評価する。
関連論文リスト
- ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - Variance-insensitive and Target-preserving Mask Refinement for
Interactive Image Segmentation [68.16510297109872]
ポイントベースのインタラクティブなイメージセグメンテーションは、セマンティックセグメンテーションや画像編集といったアプリケーションにおけるマスクアノテーションの負担を軽減することができる。
本稿では,ユーザ入力の少ないセグメンテーション品質を向上する新しい手法である可変無感・ターゲット保存マスクリファインメントを提案する。
GrabCut、バークレー、SBD、DAVISデータセットの実験は、インタラクティブな画像セグメンテーションにおける我々の手法の最先端性能を実証している。
論文 参考訳(メタデータ) (2023-12-22T02:31:31Z) - Understanding Masked Autoencoders From a Local Contrastive Perspective [80.57196495601826]
Masked AutoEncoder (MAE)は、シンプルだが効果的なマスキングと再構築戦略によって、自己指導型学習の分野に革命をもたらした。
そこで我々は,MaEの再構成的側面とコントラスト的側面の両方を解析するために,ローカルコントラストMAEと呼ばれる新しい経験的枠組みを導入する。
論文 参考訳(メタデータ) (2023-10-03T12:08:15Z) - GD-MAE: Generative Decoder for MAE Pre-training on LiDAR Point Clouds [72.60362979456035]
Masked Autoencoders (MAE)は、大規模な3Dポイントクラウドでの探索が難しい。
我々は,周囲のコンテキストを自動的にマージするためのtextbfGenerative textbfDecoder for MAE (GD-MAE)を提案する。
提案手法の有効性を, KITTI と ONCE の2つの大規模ベンチマークで実証した。
論文 参考訳(メタデータ) (2022-12-06T14:32:55Z) - MixMask: Revisiting Masking Strategy for Siamese ConvNets [23.946791390657875]
この研究は、textbfMixMaskと呼ばれる新しいフィリングベースのマスキング手法を導入している。
提案手法は,消去された領域を別の画像からのコンテンツに置き換えることにより,従来のマスキング手法で見られる情報の枯渇を効果的に解消する。
我々は,線形探索,半教師付きおよび教師付きファインタニング,オブジェクト検出,セグメンテーションなどの領域におけるフレームワークの性能向上を実証的に検証した。
論文 参考訳(メタデータ) (2022-10-20T17:54:03Z) - A Review for Deep Reinforcement Learning in Atari:Benchmarks,
Challenges, and Solutions [0.0]
Atari 2600ゲームにおけるエージェントの汎用性を実証的に評価するための評価プラットフォームとして,アーケード学習環境(Arcade Learning Environment, ALE)を提案する。
Deep Q-Networks (DQN) から Agent57 まで、RL エージェントは ALE において超人的性能を達成しているようだ。
本稿では,人間の世界記録(HWR)に基づく新しいAtariベンチマークを提案する。
論文 参考訳(メタデータ) (2021-12-08T06:52:23Z) - Box-Adapt: Domain-Adaptive Medical Image Segmentation using Bounding
BoxSupervision [52.45336255472669]
深層学習のための弱教師付きドメイン適応設定を提案する。
Box-Adaptは、ソースドメインのきめ細かいセグナオンマスクとターゲットドメインの弱いバウンディングボックスを完全に探索する。
肝セグメンテーションにおける本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-08-19T01:51:04Z) - Contrastive Context-Aware Learning for 3D High-Fidelity Mask Face
Presentation Attack Detection [103.7264459186552]
顔認識システムには、顔提示攻撃検出(PAD)が不可欠である。
ほとんどの既存の3DマスクPADベンチマークにはいくつかの欠点があります。
現実世界のアプリケーションとのギャップを埋めるために、大規模なハイファイアリティマスクデータセットを紹介します。
論文 参考訳(メタデータ) (2021-04-13T12:48:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。