論文の概要: AttDLNet: Attention-based DL Network for 3D LiDAR Place Recognition
- arxiv url: http://arxiv.org/abs/2106.09637v1
- Date: Thu, 17 Jun 2021 16:34:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 19:26:53.578145
- Title: AttDLNet: Attention-based DL Network for 3D LiDAR Place Recognition
- Title(参考訳): AttDLNet:3次元LiDAR位置認識のための注意型DLネットワーク
- Authors: Tiago Barros, Lu\'is Garrote, Ricardo Pereira, Cristiano Premebida,
Urbano J. Nunes
- Abstract要約: 本稿では,AttDLNetという3次元LiDARに基づくディープラーニングネットワークを提案する。
注意機構を利用して、長距離コンテキストと機能間関係に選択的にフォーカスする。
その結果、エンコーダネットワークの機能は、すでに非常に説明力があるが、ネットワークに注意を加えることで、パフォーマンスがさらに向上していることがわかった。
- 参考スコア(独自算出の注目度): 0.6352264764099531
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep networks have been progressively adapted to new sensor modalities,
namely to 3D LiDAR, which led to unprecedented achievements in autonomous
vehicle-related applications such as place recognition. One of the main
challenges of deep models in place recognition is to extract efficient and
descriptive feature representations that relate places based on their
similarity. To address the problem of place recognition using LiDAR data, this
paper proposes a novel 3D LiDAR-based deep learning network (named AttDLNet)
that comprises an encoder network and exploits an attention mechanism to
selectively focus on long-range context and interfeature relationships. The
proposed network is trained and validated on the KITTI dataset, using the
cosine loss for training and a retrieval-based place recognition pipeline for
validation. Additionally, an ablation study is presented to assess the best
network configuration. Results show that the encoder network features are
already very descriptive, but adding attention to the network further improves
performance. From the ablation study, results indicate that the middle encoder
layers have the highest mean performance, while deeper layers are more robust
to orientation change. The code is publicly available on the project website:
https://github.com/Cybonic/ AttDLNet
- Abstract(参考訳): 深層ネットワークは、3dlidarのような新しいセンサーモードに徐々に適応され、位置認識のような自動運転車関連のアプリケーションで前例のない成果をもたらした。
場所認識における深層モデルの主な課題の1つは、その類似性に基づいて場所を関連付ける効率的で記述的な特徴表現を抽出することである。
本稿では,LDARデータを用いた位置認識の課題に対処するため,エンコーダネットワークを含む新しい3次元LiDARベースのディープラーニングネットワーク(AttDLNet)を提案する。
提案するネットワークは,トレーニング用のコサイン損失と,検証のための検索ベースの位置認識パイプラインを用いて,KITTIデータセット上でトレーニングおよび検証を行う。
さらに,最善のネットワーク構成を評価するため,アブレーション研究を行った。
その結果、エンコーダネットワーク機能は、すでに非常に記述性が高いが、ネットワークに注意を向けることにより、パフォーマンスがさらに向上することがわかった。
アブレーション実験の結果,中間エンコーダ層は高い平均性能を示し,深い層は配向変化に対してより堅牢であることがわかった。
コードはプロジェクトのWebサイトで公開されている。 https://github.com/Cybonic/ AttDLNet
関連論文リスト
- Densely Decoded Networks with Adaptive Deep Supervision for Medical
Image Segmentation [19.302294715542175]
本稿では「クラッチ」ネットワーク接続を選択的に導入し、高密度デコードネットワーク(ddn)を提案する。
ネットワークデコーダの各アップサンプリングステージにおける「クラッチ」接続により、ターゲットのローカライゼーションが向上する。
また、適応的な深層監視(ads)に基づくトレーニング戦略を提案し、入力データセットの特定の属性を利用して適応する。
論文 参考訳(メタデータ) (2024-02-05T00:44:57Z) - SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks [0.0]
本研究では,一意に効率的な残差ネットワークであるEfficient-ResNetを用いたエンコーダデコーダアーキテクチャを提案する。
アテンションブーティングゲート(AbG)とアテンションブーイングモジュール(AbM)は、グローバルコンテキストの出力の等価サイズで同変および特徴に基づく意味情報を融合することを目的として展開される。
我々のネットワークは、挑戦的なCamVidとCityscapesのデータセットでテストされており、提案手法により、残余ネットワークに対する大幅な改善が示されている。
論文 参考訳(メタデータ) (2024-01-28T19:58:19Z) - Active search and coverage using point-cloud reinforcement learning [50.741409008225766]
本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。
RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。
また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
論文 参考訳(メタデータ) (2023-12-18T18:16:30Z) - HEDNet: A Hierarchical Encoder-Decoder Network for 3D Object Detection
in Point Clouds [19.1921315424192]
ポイントクラウドにおける3Dオブジェクト検出は、自律運転システムにとって重要である。
3Dオブジェクト検出における主な課題は、3Dシーン内の点のスパース分布に起因する。
本稿では3次元オブジェクト検出のための階層型エンコーダデコーダネットワークであるHEDNetを提案する。
論文 参考訳(メタデータ) (2023-10-31T07:32:08Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Paint and Distill: Boosting 3D Object Detection with Semantic Passing
Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。
本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T12:35:34Z) - Simplified Learning of CAD Features Leveraging a Deep Residual
Autoencoder [3.567248644184455]
コンピュータビジョンでは、EfficientNetのような深い残留ニューラルネットワークが、堅牢性と精度の点で新しい標準を設定している。
ディープニューラルネットワークのトレーニングの根底にある重要な問題は、十分な量のトレーニングデータがないことだ。
本稿では,3次元CADモデル評価に関連する学習タスクの伝達を目的としたEfficientNetアーキテクチャに基づく残差3次元オートエンコーダを提案する。
論文 参考訳(メタデータ) (2022-02-21T10:27:55Z) - Location-Sensitive Visual Recognition with Cross-IOU Loss [177.86369890708457]
本稿では,オブジェクト検出,インスタンスセグメンテーション,ポーズ推定のための位置感知ネットワーク (LSNet) という統合ソリューションを提案する。
ディープニューラルネットワークをバックボーンとして、LSNetは、ターゲットオブジェクトの形状を一緒に定義するアンカーポイントとランドマークのセットを予測します。
論文 参考訳(メタデータ) (2021-04-11T02:17:14Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - Attentional Local Contrast Networks for Infrared Small Target Detection [15.882749652217653]
赤外線小目標検出のための新しいモデル駆動深層ネットワークを提案する。
従来の局所コントラスト測定法を、エンドツーエンドネットワークにおける深さ自在なパラメータレス非線形特徴精製層としてモジュール化します。
ネットワークアーキテクチャの各コンポーネントの有効性と効率を実証的に検証するために,ネットワーク奥行きの異なる詳細なアブレーション研究を行う。
論文 参考訳(メタデータ) (2020-12-15T19:33:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。