論文の概要: Overcoming Obstructions via Bandwidth-Limited Multi-Agent Spatial
Handshaking
- arxiv url: http://arxiv.org/abs/2107.00771v1
- Date: Thu, 1 Jul 2021 22:56:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 03:01:40.893162
- Title: Overcoming Obstructions via Bandwidth-Limited Multi-Agent Spatial
Handshaking
- Title(参考訳): 帯域制限型マルチエージェント空間ハンドシェイクによる障害克服
- Authors: Nathaniel Glaser, Yen-Cheng Liu, Junjiao Tian, Zsolt Kira
- Abstract要約: 本稿では,ロボット群全体で視覚情報を処理し,圧縮し,伝達するための,エンドツーエンドの学習可能なマルチエージェント空間ハンドシェイキングネットワークを提案する。
本手法は,強いベースラインに対して絶対11%のIoU改善を実現する。
- 参考スコア(独自算出の注目度): 37.866254392010454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we address bandwidth-limited and obstruction-prone
collaborative perception, specifically in the context of multi-agent semantic
segmentation. This setting presents several key challenges, including
processing and exchanging unregistered robotic swarm imagery. To be successful,
solutions must effectively leverage multiple non-static and
intermittently-overlapping RGB perspectives, while heeding bandwidth
constraints and overcoming unwanted foreground obstructions. As such, we
propose an end-to-end learn-able Multi-Agent Spatial Handshaking network (MASH)
to process, compress, and propagate visual information across a robotic swarm.
Our distributed communication module operates directly (and exclusively) on raw
image data, without additional input requirements such as pose, depth, or
warping data. We demonstrate superior performance of our model compared against
several baselines in a photo-realistic multi-robot AirSim environment,
especially in the presence of image occlusions. Our method achieves an absolute
11% IoU improvement over strong baselines.
- Abstract(参考訳): 本稿では,帯域幅制限と障害物による協調認識,特にマルチエージェントセマンティックセマンティックセグメンテーションの文脈において扱う。
この設定では、未登録のロボット群画像の処理や交換など、いくつかの重要な課題が浮かび上がっている。
成功させるためには、複数の非静的かつ断続的に重複するRGBの視点を効果的に活用する必要がある。
そこで本研究では,ロボット群を横断する視覚情報を処理し,圧縮し,伝達するマルチエージェント空間ハンドシェイキングネットワーク(mash)を提案する。
私たちの分散通信モジュールは、ポーズ、深さ、ウォーピングデータなどの追加の入力要求なしに、生の画像データを直接(そして排他的に)操作します。
本研究では,写真実写型マルチロボットAirSim環境,特に画像閉塞の有無において,複数のベースラインと比較して優れた性能を示す。
本手法は,強いベースラインに対して絶対11%のIoU改善を実現する。
関連論文リスト
- Distributed NeRF Learning for Collaborative Multi-Robot Perception [16.353043979615496]
マルチエージェントシステムは、環境のより包括的なマッピング、より高速なカバレッジ、耐障害性の向上を提供することができる。
本稿では,RGB画像からニューラルレイディアンス場(NeRF)を総合的に学習してシーンを表現できる協調型マルチエージェント認識システムを提案する。
本手法の有効性は,挑戦的な実世界のシーンを含むデータセットに対する広範な実験を通して示す。
論文 参考訳(メタデータ) (2024-09-30T13:45:50Z) - Deep Generative Adversarial Network for Occlusion Removal from a Single Image [3.5639148953570845]
本稿では,完全自動2段階畳み込みニューラルネットワークを提案する。
我々は、GANを利用して、構造とテクスチャの両方を含む現実的なコンテンツを、インペイントのための単一ショットで合成する。
論文 参考訳(メタデータ) (2024-09-20T06:00:45Z) - Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring [25.36888929483233]
そこで本研究では,シングルインプットとマルチアウトプット(SIMO)に基づくマルチスケールネットワークを提案する。
実世界の軌道特性を学習可能なウェーブレット変換モジュールと組み合わせて、ぼやけた画像から鋭い画像へのステップバイステップ遷移の方向連続性と周波数特性に着目した。
論文 参考訳(メタデータ) (2023-12-29T02:59:40Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Unified Frequency-Assisted Transformer Framework for Detecting and
Grounding Multi-Modal Manipulation [109.1912721224697]
本稿では、DGM4問題に対処するため、UFAFormerという名前のUnified Frequency-Assisted TransFormerフレームワークを提案する。
離散ウェーブレット変換を利用して、画像を複数の周波数サブバンドに分解し、リッチな顔偽造品をキャプチャする。
提案する周波数エンコーダは、帯域内およびバンド間自己アテンションを組み込んだもので、多種多様なサブバンド内および多種多様なフォージェリー特徴を明示的に集約する。
論文 参考訳(メタデータ) (2023-09-18T11:06:42Z) - Enhancing Multi-Robot Perception via Learned Data Association [37.866254392010454]
本稿では,マルチロボット協調認識問題,特に分散セマンティックセグメンテーションにおけるマルチビューインフィル問題に対処する。
本稿では,ロボット群において各エージェントにデプロイ可能なニューラルネットワークであるMulti-Agent Infilling Networkを提案する。
具体的には、各ロボットが視覚情報を局所的に符号化・復号し、ニューラルメカニズムにより、不確実性を認識し、文脈に基づく中間特徴の交換を可能にする。
論文 参考訳(メタデータ) (2021-07-01T22:45:26Z) - Deep Burst Super-Resolution [165.90445859851448]
バースト超解像タスクのための新しいアーキテクチャを提案する。
我々のネットワークは複数のノイズRAW画像を入力として取り出し、出力として分解された超解像RGB画像を生成する。
実世界のデータのトレーニングと評価を可能にするため,BurstSRデータセットも導入する。
論文 参考訳(メタデータ) (2021-01-26T18:57:21Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。