論文の概要: Input-Output Balanced Framework for Long-tailed LiDAR Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2103.14269v1
- Date: Fri, 26 Mar 2021 05:42:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:44:08.030264
- Title: Input-Output Balanced Framework for Long-tailed LiDAR Semantic
Segmentation
- Title(参考訳): ロングテールlidarセマンティクスセグメンテーションのための入出力バランスフレームワーク
- Authors: Peishan Cong, Xinge Zhu, Yuexin Ma
- Abstract要約: 本稿では,ロングテール分布の問題を扱うための入出力バランスフレームワークを提案する。
入力空間に対して、メッシュモデルからこれらのテールインスタンスを合成し、LiDARスキャンの位置と密度分布をうまくシミュレートする。
出力空間に対して, 形状と実例量に基づいて, 異なるカテゴリをグループ化するマルチヘッドブロックを提案する。
- 参考スコア(独自算出の注目度): 12.639524717464509
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A thorough and holistic scene understanding is crucial for autonomous
vehicles, where LiDAR semantic segmentation plays an indispensable role.
However, most existing methods focus on the network design while neglecting the
inherent difficulty, imbalanced data distribution in the realistic dataset
(also named long-tailed distribution), which narrows down the capability of
state-of-the-art methods. In this paper, we propose an input-output balanced
framework to handle the issue of long-tailed distribution. Specifically, for
the input space, we synthesize these tailed instances from mesh models and well
simulate the position and density distribution of LiDAR scan, which enhances
the input data balance and improves the data diversity. For the output space, a
multi-head block is proposed to group different categories based on their
shapes and instance amounts, which alleviates the biased representation of
dominating category during the feature learning. We evaluate the proposed model
on two large-scale datasets, SemanticKITTI and nuScenes, where state-of-the-art
results demonstrate its effectiveness. The proposed new modules can also be
used as a plug-and-play, and we apply them on various backbones and datasets,
showing its good generalization ability.
- Abstract(参考訳): LiDARセマンティックセグメンテーションが不可欠である自動運転車にとって、徹底的で全体的な状況理解は不可欠である。
しかし、既存のほとんどの手法は、固有の困難を無視しながらネットワーク設計に焦点を当てており、現実的なデータセット(ロングテール分布とも呼ばれる)における不均衡なデータ分散は、最先端の手法の能力を狭めている。
本稿では,ロングテール分布の問題を扱うための入出力バランスフレームワークを提案する。
具体的には、入力空間において、メッシュモデルからこれらのテールインスタンスを合成し、LiDARスキャンの位置と密度分布をうまくシミュレートし、入力データのバランスを高め、データの多様性を向上させる。
出力空間に対して,特徴学習における支配カテゴリの偏りを緩和する多頭部ブロックを提案し,その形状と実例量に基づいて異なるカテゴリをグループ化する。
本研究では,2つの大規模データセット,SemanticKITTI と nuScenes を用いて提案モデルの評価を行った。
提案する新しいモジュールは、プラグアンドプレイとしても使用でき、様々なバックボーンやデータセットに適用し、その優れた一般化能力を示しています。
関連論文リスト
- Theoretically Guaranteed Distribution Adaptable Learning [23.121014921407898]
分散適応学習(DAL)と呼ばれる新しいフレームワークを提案する。
DALは、進化するデータ分散を効果的に追跡することを可能にする。
進化する分布を調節する上で、DALの再利用性と進化性を高めることができる。
論文 参考訳(メタデータ) (2024-11-05T09:10:39Z) - Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax [73.03684002513218]
我々はDeep InfoMax(DIM)を拡張し、学習した表現を選択された事前分布に自動マッチングできるようにする。
このような修正により、一様かつ通常に分散した表現を学習できることを示す。
その結果,下流作業における性能とDMの品質の中間的なトレードオフが示唆された。
論文 参考訳(メタデータ) (2024-10-09T15:40:04Z) - FedUV: Uniformity and Variance for Heterogeneous Federated Learning [5.9330433627374815]
フェデレーション学習は、広く分散されたデータでニューラルネットワークをトレーニングするための有望なフレームワークである。
最近の研究によると、ネットワークの最終層が局所バイアスの傾向が最も大きいためである。
凍結重量が一定の特異値をもたらすという観測によって動機付けられた重みにSVDを適用して分類器の訓練力学を考察する。
論文 参考訳(メタデータ) (2024-02-27T15:53:15Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - ProtoVAE: Prototypical Networks for Unsupervised Disentanglement [1.6114012813668934]
本稿では,自己スーパービジョンを用いて学習した深層学習型プロトタイプネットワークを活用する,新しい深部生成型VAEモデルProtoVAEを提案する。
我々のモデルは、完全に教師なしであり、要素数を含むデータセットの事前知識を必要としない。
提案手法をベンチマークdSprites, 3DShapes, MPI3Dディジアングルメントデータセット上で評価した。
論文 参考訳(メタデータ) (2023-05-16T01:29:26Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - DANCE: DAta-Network Co-optimization for Efficient Segmentation Model
Training and Inference [85.02494022662505]
DANCEは、効率的なセグメンテーションモデルのトレーニングと推論のための自動データネットワーク協調最適化である。
入力イメージを適応的にダウンサンプル/ドロップする自動データスライミングを統合し、画像の空間的複雑さによって導かれるトレーニング損失に対するそれに対応するコントリビューションを制御する。
実験と非難研究により、DANCEは効率的なセグメンテーションに向けて「オールウィン」を達成できることを示した。
論文 参考訳(メタデータ) (2021-07-16T04:58:58Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。