Fugu-MT 論文翻訳(概要): TFNet: Exploiting Temporal Cues for Fast and Accurate LiDAR Semantic Segmentation

論文の概要: TFNet: Exploiting Temporal Cues for Fast and Accurate LiDAR Semantic Segmentation

arxiv url: http://arxiv.org/abs/2309.07849v2
Date: Sun, 17 Sep 2023 00:49:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-19 10:08:31.017042
Title: TFNet: Exploiting Temporal Cues for Fast and Accurate LiDAR Semantic Segmentation
Title（参考訳）: TFNet: 高速かつ正確なLiDARセマンティックセグメンテーションのための時間キューの爆発
Authors: Rong Li, ShiJie Li, Xieyuanli Chen, Teli Ma, Wang Hao, Juergen Gall, Junwei Liang
Abstract要約: 範囲画像に基づくLiDARセマンティックセマンティックセグメンテーション手法であるTFNetを提案する。従来のスキャンから有用な情報を抽出し,現在のスキャンと統合するために,時間融合層を組み込んだ。次に、誤り予測を正すために、最大投票に基づく後処理手法を設計する。
参考スコア（独自算出の注目度）: 22.992844146140563
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: LiDAR semantic segmentation plays a crucial role in enabling autonomous driving and robots to understand their surroundings accurately and robustly. There are different types of methods, such as point-based, range-image-based, polar-based, and hybrid methods. Among these, range-image-based methods are widely used due to their efficiency. However, they face a significant challenge known as the ``many-to-one'' problem caused by the range image's limited horizontal and vertical angular resolution. As a result, around 20\% of the 3D points can be occluded. In this paper, we present TFNet, a range-image-based LiDAR semantic segmentation method that utilizes temporal information to address this issue. Specifically, we incorporate a temporal fusion layer to extract useful information from previous scans and integrate it with the current scan. We then design a max-voting-based post-processing technique to correct false predictions, particularly those caused by the ``many-to-one'' issue. We evaluated the approach on two benchmarks and demonstrate that the post-processing technique is generic and can be applied to various networks. We will release our code and models.
Abstract（参考訳）: LiDARセマンティックセグメンテーションは、自律走行とロボットが周囲を正確かつ堅牢に理解できるようにする上で重要な役割を果たす。ポイントベース、レンジイメージベース、極ベース、ハイブリッドメソッドなど、さまざまなタイプの方法がある。これらのうち、範囲画像に基づく手法は、その効率性から広く用いられている。しかし、範囲画像の水平および垂直角分解能の制限によって生じる「many-to-one」問題として知られる重大な課題に直面している。その結果、3dポイントの約20\%をオクルードすることができる。本稿では,この問題を解決するために,時間情報を利用した範囲画像に基づくlidarセマンティクスセグメンテーション手法であるtfnetを提案する。具体的には,過去のスキャンから有用な情報を抽出し,現在のスキャンと統合するために,時間的融合層を組み込む。次に,誤りの予測,特に `many-to-one'' 問題に起因した予測を正すために,max-votingに基づく後処理手法を設計する。提案手法を2つのベンチマークで評価し,ポストプロセッシング手法が汎用的であり,様々なネットワークに適用可能であることを示す。コードとモデルをリリースします。

関連論文リスト

EdgeRegNet: Edge Feature-based Multimodal Registration Network between Images and LiDAR Point Clouds [10.324549723042338]
クロスモーダルなデータ登録は、長い間コンピュータビジョンにおいて重要な課題だった。本稿では,原点雲と画像からのエッジ情報を用いたクロスモーダル登録手法を提案する。提案手法をKITTIおよびnuScenesデータセット上で検証し,その最先端性能を実証した。
論文参考訳（メタデータ） (2025-03-19T15:03:41Z)
Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文参考訳（メタデータ） (2024-08-28T10:07:17Z)
SwIPE: Efficient and Robust Medical Image Segmentation with Implicit Patch Embeddings [12.79344668998054]
正確な局所境界線とグローバルな形状コヒーレンスを実現するために,SwIPE(Segmentation with Implicit Patch Embeddings)を提案する。その結果,最近の暗黙的アプローチよりもSwIPEは大幅に改善され,パラメータが10倍以上の最先端の離散手法よりも優れていた。
論文参考訳（メタデータ） (2023-07-23T20:55:11Z)
Two Approaches to Supervised Image Segmentation [55.616364225463066]
本研究は、深層学習とマルチセットニューロンのアプローチの比較実験を開発する。ディープラーニングアプローチは、画像セグメンテーションの実行の可能性を確認した。代替のマルチセット手法では、計算資源をほとんど必要とせずに精度を向上することができた。
論文参考訳（メタデータ） (2023-07-19T16:42:52Z)
AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。 AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文参考訳（メタデータ） (2022-02-18T10:14:45Z)
Adaptive Image Inpainting [43.02281823557039]
ディープニューラルネットワークを使用することで、塗装法は大幅に改善されている。この問題は、欠落した領域の完全かつ忠実な埋め込みを構築する際のエンコーダ層の非効率性に根ざしている。本稿では, エンコーダ層に対して, 直接的特徴レベルの監視を行う蒸留方式を提案する。
論文参考訳（メタデータ） (2022-01-01T12:16:01Z)
SemanticVoxels: Sequential Fusion for 3D Pedestrian Detection using LiDAR Point Cloud and Semantic Segmentation [4.350338899049983]
我々は、異なるレベルで融合を適用できるように、PointPaintingの一般化を提案する。本研究では,セマンティックボクセルが3次元および鳥の視線歩行者検出ベンチマークにおいて,最先端の性能を達成することを示す。
論文参考訳（メタデータ） (2020-09-25T14:52:32Z)
Rethinking of the Image Salient Object Detection: Object-level Semantic Saliency Re-ranking First, Pixel-wise Saliency Refinement Latter [62.26677215668959]
本稿では,意味的に有意な領域を粗い位置で特定する,軽量で教師付きの深層ネットワークを提案する。次に,これらセマンティック・サリエント領域の深層モデルを画素ワイド・サリエンシ改善として融合する。提案手法は単純だが有効であり,本手法は主眼をオブジェクトレベルのセマンティック・リグレード問題とみなすための最初の試みである。
論文参考訳（メタデータ） (2020-08-10T07:12:43Z)
Polarimetric SAR Image Semantic Segmentation with 3D Discrete Wavelet Transform and Markov Random Field [32.59900433812833]
本稿では,文脈的PolSAR画像セマンティックセグメンテーション手法を提案する。 3D-DWT手法は,新たに定義したチャネル的に一貫した特徴を入力として,スペックルノイズに頑健な識別的マルチスケール特徴を抽出する。 3D-DWT機能とMRFプリエントを同時に活用することにより、セグメンテーション中にコンテキスト情報が完全に統合され、正確かつスムーズなセグメンテーションが保証される。
論文参考訳（メタデータ） (2020-08-05T08:28:18Z)
MuCAN: Multi-Correspondence Aggregation Network for Video Super-Resolution [63.02785017714131]
ビデオ超解像(VSR)は、複数の低解像度フレームを使用して、各フレームに対して高解像度の予測を生成することを目的としている。フレーム間およびフレーム内は、時間的および空間的情報を利用するための鍵となるソースである。 VSRのための効果的なマルチ対応アグリゲーションネットワーク(MuCAN)を構築した。
論文参考訳（メタデータ） (2020-07-23T05:41:27Z)
Scan-based Semantic Segmentation of LiDAR Point Clouds: An Experimental Study [2.6205925938720833]
最先端の手法では、深いニューラルネットワークを使用して、LiDARスキャンの各点のセマンティッククラスを予測する。 LiDAR測定を処理するための強力で効率的な方法は、2次元の画像のような投影を使うことである。メモリの制約だけでなく、パフォーマンスの向上やランタイムの改善など、さまざまなテクニックを実証する。
論文参考訳（メタデータ） (2020-04-06T11:08:12Z)
Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。 SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文参考訳（メタデータ） (2020-02-11T14:04:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。