Fugu-MT 論文翻訳(概要): Exploring Easy Boosts for Lidar Semantic Scene Completion

論文の概要: Exploring Easy Boosts for Lidar Semantic Scene Completion

arxiv url: http://arxiv.org/abs/2606.03992v1
Date: Tue, 02 Jun 2026 17:59:59 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-03 22:00:05.249434
Title: Exploring Easy Boosts for Lidar Semantic Scene Completion
Title（参考訳）: ライダーセマンティックシーンコンプリートのための簡易ブースト探索
Authors: Tetiana Martyniuk, Jonathan Seele, Alexandre Boulch, Gilles Puy, Renaud Marlet, Raoul de Charette,
Abstract要約: 複雑な設計設計を必要とせずに、ライダーセマンティックシーン補完(SSC)の性能を高める「フリーランチ」戦略。まず,市販セグメンタから意味的な擬似ラベルを付与することで,既存のアーキテクチャの性能が大幅に向上することが実証された。
参考スコア（独自算出の注目度）: 61.665449818739155
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper investigates "free lunch" strategies to boost the performance of lidar semantic scene completion (SSC) without requiring complex architectural redesigns. We first demonstrate that endowing input point clouds with semantic pseudo-labels from off-the-shelf segmentors significantly improves the performance of existing architectures. By evaluating these models against an oracle, we establish that high-quality semantic priors are a primary driver of mIoU gains. Furthermore, we equip the input lidar scan with visibility information that distinguishes between empty and unknown spaces, which provides a secondary performance boost across the tested architectures. Using these simple enhancements, we observe that older models remain competitive with state-of-the-art systems, and can even outperform them. Our code is available at https://github.com/astra-vision/SSC-Priors.
Abstract（参考訳）: 本稿では,複雑な設計設計を必要とせずに,ライダー・セマンティック・シーン・コンプリート(SSC)の性能を高める「フリーランチ」戦略について検討する。まず,市販セグメンタから意味的な擬似ラベルを付与することで,既存のアーキテクチャの性能が大幅に向上することが実証された。これらのモデルをオラクルに対して評価することにより、mIoUゲインの原動力として高品質なセマンティック・プリエントが確立される。さらに、入力ライダースキャンに空空間と未知空間を区別する可視性情報を設け、テストされたアーキテクチャ全体にわたって二次的な性能向上を提供する。これらの単純な拡張を用いることで、古いモデルは最先端システムと競合し続け、さらに性能を向上することができる。私たちのコードはhttps://github.com/astra-vision/SSC-Priors.comで利用可能です。

関連論文リスト

Semantic Generative Tuning for Unified Multimodal Models [62.18894352635965]
統一マルチモーダルモデル(UMM)は、単一のアーキテクチャ内で視覚的理解と視覚的生成を統合する。訓練パラダイムは独立してテキスト信号を通して理解を最適化する密集したピクセルの目的を通して生成する本研究は,UMMの分離を橋渡しするための生成プロキシとして階層的視覚タスクを定式化する,生成後学習に関する最初の体系的な研究である。
論文参考訳（メタデータ） (2026-05-18T17:46:46Z)
ReME: A Data-Centric Framework for Training-Free Open-Vocabulary Segmentation [18.666044903856363]
トレーニングフリーなオープン語彙セマンティックセマンティックセマンティクス(OVS)は、任意のテキストカテゴリのセットが与えられた画像を、コストのかかるモデル微調整なしで分割することを目的としている。本稿では,データパイプラインを組み込んだデータ品質指向フレームワークを提案する。本手法は既存のトレーニング不要なOVSアプローチよりも優れており,トレーニングなしでOVSを前進させるためのデータ中心設計の重要性を強調している。
論文参考訳（メタデータ） (2025-06-26T13:22:03Z)
Semi-supervised Semantic Segmentation with Multi-Constraint Consistency Learning [81.02648336552421]
本稿では,エンコーダとデコーダの段階的拡張を容易にするためのマルチ制約一貫性学習手法を提案する。自己適応型特徴マスキングとノイズ注入は、デコーダの堅牢な学習のための特徴を摂動させるために、インスタンス固有の方法で設計されている。 Pascal VOC2012およびCityscapesデータセットの実験結果から,提案したMCCLが新たな最先端性能を実現することを示す。
論文参考訳（メタデータ） (2025-03-23T03:21:33Z)
Learning and Evaluating Hierarchical Feature Representations [3.770103075126785]
我々は、直交部分空間の階層的構成(Hier-COS)という新しい枠組みを提案する。 Hier-COSは、与えられた分類木の構造と整合した設計により、深い特徴埋め込みをベクトル空間にマッピングすることを学ぶ。 Hier-COSはすべてのデータセットにまたがって最先端の階層的パフォーマンスを実現し,同時に1つのケースを除いてトップ1の精度を上回ります。
論文参考訳（メタデータ） (2025-03-10T20:59:41Z)
Pay Attention to Your Neighbours: Training-Free Open-Vocabulary Semantic Segmentation [19.20874993309959]
CLIPのような視覚言語基盤モデルは、多くのゼロショット画像レベルタスクにおいて顕著な効果を示した。我々は、Nighbour-Aware CLIP(NACLIP)と呼ばれる、トレーニング不要なOVSSのベースラインを提案する。 OVSSの文献では,高密度予測タスクに欠かせないCLIPの視覚変換器の自己アテンションにおけるパッチの局所化が過小評価されている。
論文参考訳（メタデータ） (2024-04-12T01:08:04Z)
OMH: Structured Sparsity via Optimally Matched Hierarchy for Unsupervised Semantic Segmentation [69.37484603556307]
Un Semantic segmenting (USS)は、事前に定義されたラベルに頼ることなく、イメージをセグメント化する。上記の問題を同時に解決するために,OMH (Optimally Matched Hierarchy) という新しいアプローチを導入する。我々のOMHは既存のUSS法と比較して教師なしセグメンテーション性能がよい。
論文参考訳（メタデータ） (2024-03-11T09:46:41Z)
CLIP Brings Better Features to Visual Aesthetics Learners [14.351572852317558]
Image Aesthetics Assessment (IAA) は主観的性格と高価な手作業による課題である。 Contrastive Language-Image Pre-Training (CLIP) のような近年の大規模視覚言語モデルでは、様々な下流タスクに期待できる表現能力を示している。本稿では,CLIPの強力な一般化能力を活用しつつ,軽量なIAAモデルを学習することを目的とした,2相CLIPに基づく半教師付き知識蒸留パラダイムを提案する。
論文参考訳（メタデータ） (2023-07-28T16:00:21Z)
ST++: Make Self-training Work Better for Semi-supervised Semantic Segmentation [23.207191521477654]
半教師付きセグメンテーションにおいて、自己学習 -- シンプルだが人気のあるフレームワーク -- がよりうまく機能できるかどうかを調査する。より信頼性の高い未ラベル画像の選択と優先順位付けにより選択的な再学習を行う高度自己学習フレームワーク(ST++)を提案する。その結果、提案したST++は、半教師付きモデルの性能を大幅に向上させ、Pascal VOC 2012とCityscapesベンチマークにおいて、既存のメソッドをはるかに上回っている。
論文参考訳（メタデータ） (2021-06-09T14:18:32Z)
Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文参考訳（メタデータ） (2020-08-04T10:41:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。