Fugu-MT 論文翻訳(概要): A Preprocessing and Postprocessing Voxel-based Method for LiDAR Semantic Segmentation Improvement in Long Distance

論文の概要: A Preprocessing and Postprocessing Voxel-based Method for LiDAR Semantic Segmentation Improvement in Long Distance

arxiv url: http://arxiv.org/abs/2405.10046v1
Date: Thu, 16 May 2024 12:32:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-17 14:22:13.212050
Title: A Preprocessing and Postprocessing Voxel-based Method for LiDAR Semantic Segmentation Improvement in Long Distance
Title（参考訳）: 長距離におけるLiDARセマンティックセマンティックセグメンテーション改善のための前処理と後処理Voxel-based法
Authors: Andrea Matteazzi, Pascal Colling, Michael Arnold, Dietmar Tutsch,
Abstract要約: 本稿では,LiDARポイントクラウドの前処理および後処理手法を提案する。本手法の利点は, 与えられたモデルを用いた定量的評価により, シングルスキャン設定で示す。これは3Dセマンティックシーンを長距離で理解するだけでなく、オフライン処理が許容できるアプリケーションにも不可欠である。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In recent years considerable research in LiDAR semantic segmentation was conducted, introducing several new state of the art models. However, most research focuses on single-scan point clouds, limiting performance especially in long distance outdoor scenarios, by omitting time-sequential information. Moreover, varying-density and occlusions constitute significant challenges in single-scan approaches. In this paper we propose a LiDAR point cloud preprocessing and postprocessing method. This multi-stage approach, in conjunction with state of the art models in a multi-scan setting, aims to solve those challenges. We demonstrate the benefits of our method through quantitative evaluation with the given models in single-scan settings. In particular, we achieve significant improvements in mIoU performance of over 5 percentage point in medium range and over 10 percentage point in far range. This is essential for 3D semantic scene understanding in long distance as well as for applications where offline processing is permissible.
Abstract（参考訳）: 近年、LiDARセマンティックセマンティックセグメンテーションの研究が行われ、いくつかの新しい最先端モデルが導入された。しかし、ほとんどの研究は単一走査点雲に焦点をあてており、特に長距離屋外のシナリオでは、時系列情報を省略することで性能を制限している。さらに、異なる密度とオクルージョンは、シングルスキャンアプローチにおいて重要な課題となっている。本稿では,LiDARポイントクラウド前処理および後処理手法を提案する。このマルチステージアプローチは、最先端のモデルをマルチスキャン環境で組み合わせて、これらの課題を解決することを目的としている。本手法の利点は, 与えられたモデルを用いた定量的評価により, シングルスキャン設定で示す。特に,中距離においてmIoU性能が5ポイント以上,遠距離において10ポイント以上向上した。これは3Dセマンティックシーンを長距離で理解するだけでなく、オフライン処理が許容できるアプリケーションにも不可欠である。

関連論文リスト

UNSEEN: Enhancing Dataset Pruning from a Generalization Perspective [17.593940249922557]
本稿では,既存のデータセットプルーニング手法に統合可能な,プラグアンドプレイフレームワークUNSEENを提案する。我々はUNSEENを多段階シナリオに拡張し、様々なコアセットに基づいて訓練されたスコアリングモデルを用いて段階的選択手法を提案する。提案手法は,CIFAR-10,CIFAR-100,ImageNet-1Kにおいて既存のSOTA法よりも優れていた。
論文参考訳（メタデータ） (2025-11-17T05:17:39Z)
Capturing Fine-Grained Alignments Improves 3D Affordance Detection [0.46040036610482665]
本稿では,3次元点雲における空き地検出のための新しい手法であるLM-ADを提案する。また、Affordance Query Module (AQM)を導入し、ポイントクラウドとテキスト間の微粒なアライメントを効率的にキャプチャする。提案手法は,3次元AffordanceNetデータセット上でのUnion上での精度と平均断面積で既存手法よりも優れていた。
論文参考訳（メタデータ） (2025-06-24T04:58:55Z)
Intern-GS: Vision Model Guided Sparse-View 3D Gaussian Splatting [95.61137026932062]
Intern-GSはスパースビューガウススプラッティングのプロセスを強化する新しいアプローチである。 Intern-GSは多様なデータセットにまたがって最先端のレンダリング品質を実現する。
論文参考訳（メタデータ） (2025-05-27T05:17:49Z)
FLARES: Fast and Accurate LiDAR Multi-Range Semantic Segmentation [52.89847760590189]
3Dシーンの理解は、自動運転における重要な課題である。近年の手法では、レンジビュー表現を利用して処理効率を向上している。範囲ビューに基づくLiDARセマンティックセマンティックセグメンテーションのためのワークフローを再設計する。
論文参考訳（メタデータ） (2025-02-13T12:39:26Z)
MultiPull: Detailing Signed Distance Functions by Pulling Multi-Level Queries at Multi-Step [48.812388649469106]
粗いSDFを粗い値から細かい値に最適化することにより,原点雲から多スケール暗黙フィールドを学習する手法を提案する。広く使われているオブジェクトとシーンのベンチマーク実験により,この手法は表面再構成における最先端の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2024-11-02T10:50:22Z)
Enhancing Few-Shot Image Classification through Learnable Multi-Scale Embedding and Attention Mechanisms [1.1557852082644071]
少数の分類の文脈において、ゴールは、限られた数のサンプルを使用して分類器を訓練することである。伝統的なメートル法は、この目的を達成するための一定の限界を示す。提案手法では,サンプルを異なる特徴空間にマッピングするマルチ出力埋め込みネットワークを利用する。
論文参考訳（メタデータ） (2024-09-12T12:34:29Z)
Multi-modality Affinity Inference for Weakly Supervised 3D Semantic Segmentation [47.81638388980828]
本稿では,マルチモーダルポイント親和性推論モジュールを新たに導入した,シンプルで効果的なシーンレベルの弱教師付きポイントクラウドセグメンテーション法を提案する。 ScanNet と S3DIS のベンチマークでは,最先端の ScanNet と S3DIS のベンチマークでは 4% から 6% の mIoU を達成している。
論文参考訳（メタデータ） (2023-12-27T14:01:35Z)
Rethinking Range View Representation for LiDAR Segmentation [66.73116059734788]
「多対一」マッピング、意味的不整合、形状変形は、射程射影からの効果的な学習に対する障害となる可能性がある。 RangeFormerは、ネットワークアーキテクチャ、データ拡張、後処理を含む新しい設計を含む、フルサイクルのフレームワークである。比較対象のLiDARセマンティックスとパノプティックスセグメンテーションのベンチマークにおいて,初めてレンジビュー法が点,ボクセル,マルチビューフュージョンを越えられることを示す。
論文参考訳（メタデータ） (2023-03-09T16:13:27Z)
A Novel Long-term Iterative Mining Scheme for Video Salient Object Detection [54.53335983750033]
短期的方法論は視覚システムの実際のメカニズムと矛盾する。そこで本研究では,VSOD を長期にわたって実施する新しい VSOD アプローチを提案する。提案手法は、広く使用されている5つのベンチマークデータセットにおいて、ほぼ全てのSOTAモデルより優れている。
論文参考訳（メタデータ） (2022-06-20T04:27:47Z)
A Positive/Unlabeled Approach for the Segmentation of Medical Sequences using Point-Wise Supervision [3.883460584034766]
本稿では,ポイントワイズアノテーションのみを用いて,医用画像のボリュームや動画を効率的に分割する手法を提案する。提案手法は,ポイントワイドアノテーションを用いて,適切なポジティブ/アンラベル対象関数を用いてディープラーニングモデルを訓練する。提案手法は,同じ問題に適応した最先端手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-07-18T09:13:33Z)
Learning Semantic Segmentation of Large-Scale Point Clouds with Random Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文参考訳（メタデータ） (2021-07-06T05:08:34Z)
3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文参考訳（メタデータ） (2020-02-24T12:01:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。