論文の概要: TFNet: Exploiting Temporal Cues for Fast and Accurate LiDAR Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2309.07849v2
- Date: Sun, 17 Sep 2023 00:49:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 10:08:31.017042
- Title: TFNet: Exploiting Temporal Cues for Fast and Accurate LiDAR Semantic
Segmentation
- Title(参考訳): TFNet: 高速かつ正確なLiDARセマンティックセグメンテーションのための時間キューの爆発
- Authors: Rong Li, ShiJie Li, Xieyuanli Chen, Teli Ma, Wang Hao, Juergen Gall,
Junwei Liang
- Abstract要約: 範囲画像に基づくLiDARセマンティックセマンティックセグメンテーション手法であるTFNetを提案する。
従来のスキャンから有用な情報を抽出し,現在のスキャンと統合するために,時間融合層を組み込んだ。
次に、誤り予測を正すために、最大投票に基づく後処理手法を設計する。
- 参考スコア(独自算出の注目度): 22.992844146140563
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LiDAR semantic segmentation plays a crucial role in enabling autonomous
driving and robots to understand their surroundings accurately and robustly.
There are different types of methods, such as point-based, range-image-based,
polar-based, and hybrid methods. Among these, range-image-based methods are
widely used due to their efficiency. However, they face a significant challenge
known as the ``many-to-one'' problem caused by the range image's limited
horizontal and vertical angular resolution. As a result, around 20\% of the 3D
points can be occluded. In this paper, we present TFNet, a range-image-based
LiDAR semantic segmentation method that utilizes temporal information to
address this issue. Specifically, we incorporate a temporal fusion layer to
extract useful information from previous scans and integrate it with the
current scan. We then design a max-voting-based post-processing technique to
correct false predictions, particularly those caused by the ``many-to-one''
issue. We evaluated the approach on two benchmarks and demonstrate that the
post-processing technique is generic and can be applied to various networks. We
will release our code and models.
- Abstract(参考訳): LiDARセマンティックセグメンテーションは、自律走行とロボットが周囲を正確かつ堅牢に理解できるようにする上で重要な役割を果たす。
ポイントベース、レンジイメージベース、極ベース、ハイブリッドメソッドなど、さまざまなタイプの方法がある。
これらのうち、範囲画像に基づく手法は、その効率性から広く用いられている。
しかし、範囲画像の水平および垂直角分解能の制限によって生じる「many-to-one」問題として知られる重大な課題に直面している。
その結果、3dポイントの約20\%をオクルードすることができる。
本稿では,この問題を解決するために,時間情報を利用した範囲画像に基づくlidarセマンティクスセグメンテーション手法であるtfnetを提案する。
具体的には,過去のスキャンから有用な情報を抽出し,現在のスキャンと統合するために,時間的融合層を組み込む。
次に,誤りの予測,特に `many-to-one'' 問題に起因した予測を正すために,max-votingに基づく後処理手法を設計する。
提案手法を2つのベンチマークで評価し,ポストプロセッシング手法が汎用的であり,様々なネットワークに適用可能であることを示す。
コードとモデルをリリースします。
関連論文リスト
- Learning from small data sets: Patch-based regularizers in inverse
problems for image reconstruction [1.1650821883155187]
機械学習の最近の進歩は、ネットワークを訓練するために大量のデータとコンピュータ能力を必要とする。
本稿は,ごく少数の画像のパッチを考慮に入れることで,小さなデータセットから学習する問題に対処する。
本稿では,Langevin Monte Carlo法を用いて後部を近似することにより,不確実な定量化を実現する方法を示す。
論文 参考訳(メタデータ) (2023-12-27T15:30:05Z) - OsmLocator: locating overlapping scatter marks with a non-training
generative perspective [48.50108853199417]
重複するマークの配置には、テクスチャの欠如、文脈の少ない情報、ハロー形状、小さなサイズなど、多くの困難がある。
ここでは、クラスタリングに基づく再視覚化の最適化問題として、非学習的生成の観点から定式化する。
特に,異なるマーカーと様々な重なり合いの重なり合いを持つ何百もの散乱画像を含む2023というデータセットを構築し,提案手法を既存の手法と比較した。
論文 参考訳(メタデータ) (2023-12-18T12:39:48Z) - Generalization of pixel-wise phase estimation by CNN and improvement of
phase-unwrapping by MRF optimization for one-shot 3D scan [0.621405559652172]
シングルパターンプロジェクション(ワンショット3Dスキャン)を用いたアクティブステレオ技術は、産業や医療目的などから広く注目を集めている。
ワンショット3Dスキャンの深刻な欠点はスパース再構成である。
パターンが正規かつ周期的であれば,任意のタイプの静的パターンに適用可能なワンショットスキャンのための画素ワイズ手法を提案する。
論文 参考訳(メタデータ) (2023-09-26T10:45:04Z) - 360$^\circ$ from a Single Camera: A Few-Shot Approach for LiDAR
Segmentation [0.0]
LiDARデータのディープラーニングアプリケーションは、異なるセンサーやタスクに適用する場合、強いドメインギャップに悩まされる。
実用的なアプリケーションでは、ラベル付きデータはコストがかかり、取得に時間がかかる。
我々は、ラベル効率のよいLiDARセグメンテーションに対する効果的で合理化された数ショットアプローチであるImageTo360を提案する。
論文 参考訳(メタデータ) (2023-09-12T13:04:41Z) - Two Approaches to Supervised Image Segmentation [55.616364225463066]
本研究は、深層学習とマルチセットニューロンのアプローチの比較実験を開発する。
ディープラーニングアプローチは、画像セグメンテーションの実行の可能性を確認した。
代替のマルチセット手法では、計算資源をほとんど必要とせずに精度を向上することができた。
論文 参考訳(メタデータ) (2023-07-19T16:42:52Z) - Embracing Compact and Robust Architectures for Multi-Exposure Image
Fusion [50.598654017728045]
本稿では,堅牢なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを含む探索型パラダイムを提案する。
シーンリライティングと変形可能な畳み込みを利用して、カメラの動きに拘わらず、画像を正確に調整することができる。
我々は、様々な競争方式と比較して最先端の性能を実現し、一般的なシナリオと不整合シナリオに対するPSNRの4.02%と29.34%の改善を実現した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Unsupervised Monocular Depth Estimation for Night-time Images using
Adversarial Domain Feature Adaptation [17.067988025947024]
我々は、制約のないRGB単眼の夜間画像から画素ごとの深度マップを推定する問題を考察する。
夜間画像でテストした場合、最先端の昼時間深度推定法は不幸にも失敗する。
そこで本稿では,昼夜画像で訓練されたネットワークを夜間画像に適応させるドメイン適応問題として取り上げ,この問題を解決することを提案する。
論文 参考訳(メタデータ) (2020-10-03T17:55:16Z) - SemanticVoxels: Sequential Fusion for 3D Pedestrian Detection using
LiDAR Point Cloud and Semantic Segmentation [4.350338899049983]
我々は、異なるレベルで融合を適用できるように、PointPaintingの一般化を提案する。
本研究では,セマンティックボクセルが3次元および鳥の視線歩行者検出ベンチマークにおいて,最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2020-09-25T14:52:32Z) - Multiple Video Frame Interpolation via Enhanced Deformable Separable
Convolution [67.83074893311218]
カーネルベースの手法は、ソースフレームと空間適応型ローカルカーネルを囲む単一の畳み込みプロセスでピクセルを予測する。
本稿では,適応カーネルだけでなく,オフセット,マスク,バイアスを推定するための拡張変形性分離畳み込み(EDSC)を提案する。
提案手法は,幅広いデータセットを対象とした最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-06-15T01:10:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。