論文の概要: SePaint: Semantic Map Inpainting via Multinomial Diffusion
- arxiv url: http://arxiv.org/abs/2303.02737v1
- Date: Sun, 5 Mar 2023 18:04:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 17:55:52.137489
- Title: SePaint: Semantic Map Inpainting via Multinomial Diffusion
- Title(参考訳): SePaint: 多項拡散による意味地図の描出
- Authors: Zheng Chen, Deepak Duggirala, David Crandall, Lei Jiang, Lantao Liu
- Abstract要約: 生成的多項拡散に基づく意味データに対する着色モデルであるSePaintを提案する。
本稿では,ワンステップのルックバック操作を行う新しい,効率的な条件戦略であるLook-Back Condition(LB-Con)を提案する。
提案手法は,様々なロボットアプリケーションでよく用いられる手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 12.217566404643033
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prediction beyond partial observations is crucial for robots to navigate in
unknown environments because it can provide extra information regarding the
surroundings beyond the current sensing range or resolution. In this work, we
consider the inpainting of semantic Bird's-Eye-View maps. We propose SePaint,
an inpainting model for semantic data based on generative multinomial
diffusion. To maintain semantic consistency, we need to condition the
prediction for the missing regions on the known regions. We propose a novel and
efficient condition strategy, Look-Back Condition (LB-Con), which performs
one-step look-back operations during the reverse diffusion process. By doing
so, we are able to strengthen the harmonization between unknown and known
parts, leading to better completion performance. We have conducted extensive
experiments on different datasets, showing our proposed model outperforms
commonly used interpolation methods in various robotic applications.
- Abstract(参考訳): 部分的観測を超える予測は、現在の感知範囲や解像度を超えて周囲について追加情報を提供できるため、未知の環境での移動には不可欠である。
本研究では,セマンティクス・バードズ・アイ・ビューマップのインペインティングについて考察する。
生成的多項拡散に基づく意味データに対する着色モデルであるSePaintを提案する。
セマンティック一貫性を維持するためには、既知の領域の欠落した領域の予測を条件にする必要がある。
逆拡散過程において一段階のルックバック操作を行う新しい,効率的な条件戦略であるLook-Back Condition(LB-Con)を提案する。
これにより、未知部分と既知の部分との調和を強化でき、完成性能が向上します。
提案手法は,様々なロボットアプリケーションで一般的に用いられている補間法よりも優れていることを示す。
関連論文リスト
- Diff-Mosaic: Augmenting Realistic Representations in Infrared Small Target Detection via Diffusion Prior [63.64088590653005]
本稿では拡散モデルに基づくデータ拡張手法であるDiff-Mosaicを提案する。
我々は,モザイク画像を高度に調整し,リアルな画像を生成するPixel-Priorという拡張ネットワークを導入する。
第2段階では,Diff-Prior という画像強調戦略を提案する。
論文 参考訳(メタデータ) (2024-06-02T06:23:05Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Cross-attention Spatio-temporal Context Transformer for Semantic
Segmentation of Historical Maps [18.016789471815855]
歴史的地図は、現代の地球観測技術が生まれる前に、地球表面の有用な時間的情報を提供する。
データ依存不確実性として知られるアレタリック不確実性は、元の地図シートの描画/フェーディング欠陥に固有のものである。
より広い範囲で情報を集約する地図と時間的シーケンスを融合するU-based networkを提案する。
論文 参考訳(メタデータ) (2023-10-19T09:49:58Z) - TempSAL -- Uncovering Temporal Information for Deep Saliency Prediction [64.63645677568384]
本稿では,逐次時間間隔でサリエンシマップを出力する新たなサリエンシ予測モデルを提案する。
提案手法は,学習した時間マップを組み合わせることで,サリエンシ予測を局所的に調整する。
私たちのコードはGitHubで公開されます。
論文 参考訳(メタデータ) (2023-01-05T22:10:16Z) - PRISM: Probabilistic Real-Time Inference in Spatial World Models [52.878769723544615]
PRISMはエージェントの動きと視覚知覚の確率的生成モデルにおけるリアルタイムフィルタリングの手法である。
提案手法は10Hzでリアルタイムに動作し,小型・中型屋内環境における最先端SLAMと同等に精度が高い。
論文 参考訳(メタデータ) (2022-12-06T13:59:06Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Latent World Models For Intrinsically Motivated Exploration [140.21871701134626]
画像に基づく観察のための自己教師付き表現学習法を提案する。
我々は、部分的に観測可能な環境の探索を導くために、エピソードおよび寿命の不確実性を考慮する。
論文 参考訳(メタデータ) (2020-10-05T19:47:04Z) - Domain Siamese CNNs for Sparse Multispectral Disparity Estimation [15.065764374430783]
そこで本研究では,異なるスペクトルの画像間の不均一性を推定できる新しいCNNアーキテクチャを提案する。
LITIV 2014およびLITIV 2018データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-04-30T20:29:59Z) - Learning Discrete State Abstractions With Deep Variational Inference [7.273663549650618]
状態抽象化の一種である近似バイシミュレーションを学習する手法を提案する。
我々はディープ・ニューラルエンコーダを使って状態を連続的な埋め込みにマッピングする。
我々はこれらの埋め込みを、アクション条件付き隠れマルコフモデルを用いて離散表現にマッピングする。
論文 参考訳(メタデータ) (2020-03-09T17:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。