論文の概要: Hyperspectral vs. RGB for Pedestrian Segmentation in Urban Driving Scenes: A Comparative Study
- arxiv url: http://arxiv.org/abs/2508.11301v1
- Date: Fri, 15 Aug 2025 08:10:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.794789
- Title: Hyperspectral vs. RGB for Pedestrian Segmentation in Urban Driving Scenes: A Comparative Study
- Title(参考訳): 都市運転シーンにおける歩行者セグメンテーションにおけるハイパースペクトル対RGB : 比較検討
- Authors: Jiarong Li, Imad Ali Shah, Enda Ward, Martin Glavin, Edward Jones, Brian Deegan,
- Abstract要約: 本研究では,都市交通シナリオにおける歩行者セグメンテーション向上のためのハイパースペクトルイメージング(HSI)の可能性について検討した。
U-Net、DeepLabV3+、SegFormerの3つのセマンティックセグメンテーションモデルが評価された。
CSNR-JMIMは、IoU(Intersection over Union)の1.44%、歩行者セグメンテーションのF1スコアの2.18%でRGBを一貫して上回った。
- 参考スコア(独自算出の注目度): 3.6096086024478775
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pedestrian segmentation in automotive perception systems faces critical safety challenges due to metamerism in RGB imaging, where pedestrians and backgrounds appear visually indistinguishable.. This study investigates the potential of hyperspectral imaging (HSI) for enhanced pedestrian segmentation in urban driving scenarios using the Hyperspectral City v2 (H-City) dataset. We compared standard RGB against two dimensionality-reduction approaches by converting 128-channel HSI data into three-channel representations: Principal Component Analysis (PCA) and optimal band selection using Contrast Signal-to-Noise Ratio with Joint Mutual Information Maximization (CSNR-JMIM). Three semantic segmentation models were evaluated: U-Net, DeepLabV3+, and SegFormer. CSNR-JMIM consistently outperformed RGB with an average improvements of 1.44% in Intersection over Union (IoU) and 2.18% in F1-score for pedestrian segmentation. Rider segmentation showed similar gains with 1.43% IoU and 2.25% F1-score improvements. These improved performance results from enhanced spectral discrimination of optimally selected HSI bands effectively reducing false positives. This study demonstrates robust pedestrian segmentation through optimal HSI band selection, showing significant potential for safety-critical automotive applications.
- Abstract(参考訳): 歩行者の認識システムにおける歩行者のセグメンテーションは、歩行者や背景が視覚的に区別できないように見えるRGB画像のメタメリズムによって、重要な安全上の課題に直面している。
と。
本研究では,ハイパースペクトルシティv2(H-City)データセットを用いた都市交通シナリオにおける歩行者セグメンテーション向上のためのハイパースペクトルイメージング(HSI)の可能性について検討した。
128チャンネルのHSIデータを主成分分析(PCA)とコントラスト信号対雑音比(CSNR-JMIM)を用いた最適帯域選択(CSNR-JMIM)の3チャンネル表現に変換することで、標準RGBを2次元のレダクション手法と比較した。
U-Net、DeepLabV3+、SegFormerの3つのセマンティックセグメンテーションモデルが評価された。
CSNR-JMIMは、IoU(Intersection over Union)の1.44%、歩行者セグメンテーションのF1スコアの2.18%でRGBを一貫して上回った。
ライダーセグメンテーションでは、1.43%のIoUと2.25%のF1スコアの改善が見られた。
これにより、最適選択したHSI帯域のスペクトル識別が向上し、偽陽性を効果的に低減する性能が向上した。
本研究は,HSI帯選択による頑健な歩行者セグメンテーションを実証し,安全上重要な自動車応用の可能性を示した。
関連論文リスト
- CSNR and JMIM Based Spectral Band Selection for Reducing Metamerism in Urban Driving [3.2953155328671038]
メタメリズム(Metamerism)は、RGB画像において異なる物質が類似している現象である。
本研究は、高スペクトルイメージング(HSI)を用いて、この制限を克服し、可視スペクトルを超えたユニークな物質シグネチャをキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T13:50:51Z) - Multi-Scale Spectral Attention Module-based Hyperspectral Segmentation in Autonomous Driving Scenarios [3.437245452211197]
本稿では,スペクトル特徴抽出を強化したマルチスケール分光アテンションモジュール(MSAM)を提案する。
MSAMをUNetのスキップ接続(UNet-SC)に統合することにより,提案したUNet-MSAMはセマンティックセグメンテーション性能を大幅に改善する。
論文 参考訳(メタデータ) (2025-06-23T14:24:20Z) - Heuristical Comparison of Vision Transformers Against Convolutional Neural Networks for Semantic Segmentation on Remote Sensing Imagery [0.0]
Vision Transformers (ViT) はコンピュータビジョンの分野で新たな研究の波をもたらした。
本稿では,航空画像のセマンティックセグメンテーションにViTを使用する(あるいは使用しない)3つの重要な要素の比較に焦点をあてる。
本稿では,新たな重み付き損失関数がCNNモデルの性能をViTを用いたトランスファー学習と比較して著しく向上させることを示す。
論文 参考訳(メタデータ) (2024-11-14T00:18:04Z) - HS3-Bench: A Benchmark and Strong Baseline for Hyperspectral Semantic Segmentation in Driving Scenarios [3.7498611358320733]
駆動シナリオにおけるセマンティックセグメンテーションの進捗を測定するための標準ベンチマークはない。
本稿では,HyperSpectral Semanticベンチマーク(HS3-Bench)を提案する。
3つの駆動シナリオデータセットからの注釈付きハイパースペクトル画像を組み合わせて、標準化されたメトリクス、実装、評価プロトコルを提供する。
論文 参考訳(メタデータ) (2024-09-17T14:00:49Z) - Superpixel Graph Contrastive Clustering with Semantic-Invariant
Augmentations for Hyperspectral Images [64.72242126879503]
ハイパースペクトル画像(HSI)クラスタリングは重要な課題だが難しい課題である。
まず3次元と2次元のハイブリッド畳み込みニューラルネットワークを用いてHSIの高次空間およびスペクトルの特徴を抽出する。
次に,超画素グラフの対比クラスタリングモデルを設計し,識別的超画素表現を学習する。
論文 参考訳(メタデータ) (2024-03-04T07:40:55Z) - Sub-token ViT Embedding via Stochastic Resonance Transformers [51.12001699637727]
Vision Transformer (ViT) アーキテクチャは、画像を高次元のベクトル化トークンの集合として表現し、それぞれが長方形の非重複パッチに対応する。
我々は「確率共鳴」にインスパイアされた無訓練法を提案する。
結果として得られるSRT(Stochastic Resonance Transformer)は、元の表現のリッチな意味情報を保持するが、空間的トークン化の粗い効果を軽減し、より微細な空間領域に基盤を置いている。
論文 参考訳(メタデータ) (2023-10-06T01:53:27Z) - Test-Time Adaptation for Nighttime Color-Thermal Semantic Segmentation [17.546960391700985]
夜間RGBTセマンティックセマンティックセグメンテーションの問題に対処するため,Night-TTAと呼ばれる最初のテスト時適応フレームワークを提案する。
提案手法は,mIoUが13.07%向上し,最先端(SoTA)性能を実現する。
論文 参考訳(メタデータ) (2023-07-10T10:40:44Z) - ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to
Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。
実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-02T10:39:29Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。