Fugu-MT 論文翻訳(概要): Deformable-Heatmap-Segmentation for Automobile Visual Perception

論文の概要: Deformable-Heatmap-Segmentation for Automobile Visual Perception

arxiv url: http://arxiv.org/abs/2407.07493v1
Date: Wed, 10 Jul 2024 09:24:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-11 17:11:48.820369
Title: Deformable-Heatmap-Segmentation for Automobile Visual Perception
Title（参考訳）: 自動車の視覚知覚のためのデフォルマブル・ヒートマップ・セグメンテーション
Authors: Hongyu Jin,
Abstract要約: 本稿では,オブジェクトの特徴をエンド・ツー・エンドのアーキテクチャで抽出するDHSNetとヒートマップを提案する。 DHSNetは、アップサンプリング演算子とダウンサンプリング演算子をU字型にすることで、低レベル特徴写像と高レベル特徴写像を微調整する。また,ネットワーク上でのより正確なターゲットの提案点を検出するための提案ヒートマップも予測する。
参考スコア（独自算出の注目度）: 0.32634122554913997
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semantic segmentation of road elements in 2D images is a crucial task in the recognition of some static objects such as lane lines and free space. In this paper, we propose DHSNet,which extracts the objects features with a end-to-end architecture along with a heatmap proposal. Deformable convolutions are also utilized in the proposed network. The DHSNet finely combines low-level feature maps with high-level ones by using upsampling operators as well as downsampling operators in a U-shape manner. Besides, DHSNet also aims to capture static objects of various shapes and scales. We also predict a proposal heatmap to detect the proposal points for more accurate target aiming in the network.
Abstract（参考訳）: 2次元画像における道路要素のセマンティックセグメンテーションは,車線や自由空間などの静的物体の認識において重要な課題である。本稿では,オブジェクトの特徴をエンド・ツー・エンドのアーキテクチャで抽出するDHSNetとヒートマップを提案する。変形可能な畳み込みも提案ネットワークで利用される。 DHSNetは、アップサンプリング演算子とダウンサンプリング演算子をU字型にすることで、低レベル特徴写像と高レベル特徴写像を微調整する。さらにDHSNetは,さまざまな形状やスケールの静的オブジェクトのキャプチャも目指している。また,ネットワーク上でのより正確なターゲットの提案点を検出するための提案ヒートマップも予測する。

関連論文リスト

CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.75098349480014]
本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文参考訳（メタデータ） (2025-04-15T14:30:26Z)
LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion [79.22197702626542]
本稿では, 乱れ場面におけるロボットグルーピングのためのアモーダルセグメンテーションを探求する枠組みを提案する。線形融合注意誘導畳み込みネットワーク(LAC-Net)を提案する。その結果,本手法が最先端の性能を達成できることが示唆された。
論文参考訳（メタデータ） (2024-08-06T14:50:48Z)
SATR: Zero-Shot Semantic Segmentation of 3D Shapes [74.08209893396271]
大規模オフザシェルフ2次元画像認識モデルを用いて3次元形状のゼロショットセマンティックセマンティックセマンティックセグメンテーションの課題について検討する。本研究では、SATRアルゴリズムを開発し、ShapeNetPartと提案したFAUSTベンチマークを用いて評価する。 SATRは最先端のパフォーマンスを達成し、ベースラインアルゴリズムを平均mIoUの1.3%と4%で上回っている。
論文参考訳（メタデータ） (2023-04-11T00:43:16Z)
Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文参考訳（メタデータ） (2022-12-17T15:05:25Z)
Object-level 3D Semantic Mapping using a Network of Smart Edge Sensors [25.393382192511716]
我々は,分散エッジセンサのネットワークとオブジェクトレベルの情報からなる多視点3次元意味マッピングシステムを拡張した。提案手法は,数cm以内でのポーズ推定と,実験室環境におけるセンサネットワークを用いた実環境実験により,Behaveデータセットを用いて評価した。
論文参考訳（メタデータ） (2022-11-21T11:13:08Z)
Depth-aware Object Segmentation and Grasp Detection for Robotic Picking Tasks [13.337131101813934]
本稿では,ロボットピッキングタスクの協調型クラス非依存オブジェクト分割と把握検出のための新しいディープニューラルネットワークアーキテクチャを提案する。本稿では,ポイント提案に基づくオブジェクトインスタンスセグメンテーションの精度を高める手法であるDeep-Aware Coordinate Convolution(CoordConv)を紹介する。我々は,Sil'eane と OCID_grasp という,難易度の高いロボットピッキングデータセットに対して,把握検出とインスタンスセグメンテーションの精度を評価する。
論文参考訳（メタデータ） (2021-11-22T11:06:33Z)
Object-Augmented RGB-D SLAM for Wide-Disparity Relocalisation [3.888848425698769]
本稿では、一貫したオブジェクトマップを構築し、地図内のオブジェクトのセントロイドに基づいて再局在を行うことができるオブジェクト拡張RGB-D SLAMシステムを提案する。
論文参考訳（メタデータ） (2021-08-05T11:02:25Z)
ELLIPSDF: Joint Object Pose and Shape Optimization with a Bi-level Ellipsoid and Signed Distance Function Description [9.734266860544663]
本稿では,関節オブジェクトのポーズと形状最適化のための表現的かつコンパクトなモデルを提案する。多視点RGB-Dカメラ観測からオブジェクトレベルのマップを推論する。提案手法は,大規模実世界のScanNetデータセットを用いて評価し,最先端の手法と比較する。
論文参考訳（メタデータ） (2021-08-01T03:07:31Z)
A Novel Adaptive Deep Network for Building Footprint Segmentation [0.0]
衛星画像から地図へ変換することで得られる不正確な境界の問題を解くために,Pix2Pixを用いた新しいネットワーク手法を提案する。本フレームワークは,第1発生器が局所化特徴を抽出し,第2発生器から抽出した境界特徴とマージし,すべての詳細構造エッジを分割する2つの生成器を含む。提案したネットワークの結果の質を高めるために異なる戦略が実装され、提案ネットワークはセグメント化精度において最先端ネットワークよりも高い性能を示し、全ての評価指標に対する大きなマージンを達成している。
論文参考訳（メタデータ） (2021-02-27T18:13:48Z)
Learning Geometry-Disentangled Representation for Complementary Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。 GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。 3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文参考訳（メタデータ） (2020-12-20T13:35:00Z)
Geometry Constrained Weakly Supervised Object Localization [55.17224813345206]
弱教師付きオブジェクトローカライゼーションのための幾何制約付きネットワークであるGC-Netを提案する。検出器は、幾何学的形状を記述する係数の集合によって定義された物体の位置を予測する。ジェネレータは、得られたマスクされた画像を入力として、オブジェクトとバックグラウンドの2つの補完的な分類タスクを実行する。従来のアプローチとは対照的に、GC-Netはエンドツーエンドでトレーニングされ、後処理なしでオブジェクトの位置を予測する。
論文参考訳（メタデータ） (2020-07-19T17:33:42Z)
Gated Path Selection Network for Semantic Segmentation [72.44994579325822]
我々は,適応的な受容場を学習することを目的とした,GPSNetという新しいネットワークを開発した。 GPSNetにおいて、我々はまず2次元のマルチスケールネットワーク、SuperNetを設計する。望ましいセマンティックコンテキストを動的に選択するために、ゲート予測モジュールがさらに導入される。
論文参考訳（メタデータ） (2020-01-19T12:32:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。