論文の概要: SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network
- arxiv url: http://arxiv.org/abs/2405.10148v1
- Date: Thu, 16 May 2024 14:45:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-17 13:52:46.364325
- Title: SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network
- Title(参考訳): SpecDETR: 変圧器を用いたハイパースペクトル点検出ネットワーク
- Authors: Zhaoxu Li, Wei An, Gaowei Guo, Longguang Wang, Yingqian Wang, Zaiping Lin,
- Abstract要約: ハイパースペクトル目標検出(HTD)は、ハイパースペクトル画像のスペクトル情報に基づいて材料を識別し、ポイントターゲットを検出することを目的としている。
既存のHTD法は画素単位のバイナリ分類に基づいて開発されており、ポイントターゲットの特徴表現能力を制限している。
ハイパースペクトル多クラス点オブジェクト検出のための最初の専用ネットワーク SpecDETR を提案する。
我々は、SPODと呼ばれるシミュレーションされたハイパースペクトル・ポイント・オブジェクト検出ベンチマークを開発し、ハイパースペクトル・マルチクラス・ポイント・オブジェクト検出における現在のオブジェクト検出ネットワークとHTD法の性能を初めて評価・比較した。
- 参考スコア(独自算出の注目度): 32.7318504162588
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hyperspectral target detection (HTD) aims to identify specific materials based on spectral information in hyperspectral imagery and can detect point targets, some of which occupy a smaller than one-pixel area. However, existing HTD methods are developed based on per-pixel binary classification, which limits the feature representation capability for point targets. In this paper, we rethink the hyperspectral point target detection from the object detection perspective, and focus more on the object-level prediction capability rather than the pixel classification capability. Inspired by the token-based processing flow of Detection Transformer (DETR), we propose the first specialized network for hyperspectral multi-class point object detection, SpecDETR. Without the backbone part of the current object detection framework, SpecDETR treats the spectral features of each pixel in hyperspectral images as a token and utilizes a multi-layer Transformer encoder with local and global coordination attention modules to extract deep spatial-spectral joint features. SpecDETR regards point object detection as a one-to-many set prediction problem, thereby achieving a concise and efficient DETR decoder that surpasses the current state-of-the-art DETR decoder in terms of parameters and accuracy in point object detection. We develop a simulated hyperSpectral Point Object Detection benchmark termed SPOD, and for the first time, evaluate and compare the performance of current object detection networks and HTD methods on hyperspectral multi-class point object detection. SpecDETR demonstrates superior performance as compared to current object detection networks and HTD methods on the SPOD dataset. Additionally, we validate on a public HTD dataset that by using data simulation instead of manual annotation, SpecDETR can detect real-world single-spectral point objects directly.
- Abstract(参考訳): ハイパースペクトル目標検出(HTD)は、ハイパースペクトル画像のスペクトル情報に基づいて特定の物質を識別し、ポイントターゲットを検出することを目的としている。
しかし、既存のHTD法は画素単位のバイナリ分類に基づいて開発されており、ポイントターゲットの特徴表現能力は制限されている。
本稿では,物体検出の観点からのハイパースペクトル点目標検出を再考し,画素分類能力よりも対象レベルの予測能力に着目した。
トークンベースの検出変換器(DETR)の処理フローに着想を得て,超スペクトル多値点検出のための最初の専用ネットワークSpecDETRを提案する。
現在のオブジェクト検出フレームワークのバックボーン部分なしで、SpecDETRは、ハイパースペクトル画像の各ピクセルのスペクトル特徴をトークンとして扱い、局所的および大域的な調整用アテンションモジュールを備えた多層トランスフォーマーエンコーダを使用して、深部空間分光関節特徴を抽出する。
SpecDETRは、ポイントオブジェクト検出を1対多のセット予測問題とみなし、ポイントオブジェクト検出におけるパラメータと精度の観点から、現在の最先端のDETRデコーダを超える簡潔で効率的なDETRデコーダを実現する。
我々は、SPODと呼ばれるシミュレーションされたハイパースペクトル・ポイント・オブジェクト検出ベンチマークを開発し、ハイパースペクトル・マルチクラス・ポイント・オブジェクト検出における現在のオブジェクト検出ネットワークとHTD法の性能を初めて評価・比較した。
SpecDETRは、現在のオブジェクト検出ネットワークやSPODデータセット上のHTD手法と比較して、優れた性能を示す。
さらに,手動アノテーションの代わりにデータシミュレーションを用いることで,実世界の単一スペクトル点オブジェクトを直接検出できる,公開HTDデータセットを検証した。
関連論文リスト
- OPEN: Object-wise Position Embedding for Multi-view 3D Object Detection [102.0744303467713]
OPENと呼ばれる新しい多視点3Dオブジェクト検出器を提案する。
我々の主目的は、提案したオブジェクト指向位置埋め込みを通して、オブジェクトワイド情報をネットワークに効果的に注入することである。
OPENは、nuScenesテストベンチマークで64.4%のNDSと56.7%のmAPで、最先端の新たなパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-07-15T14:29:15Z) - Learning Remote Sensing Object Detection with Single Point Supervision [17.12725535531483]
Pointly Supervised Object Detection (PSOD) は、ボックスレベルの監視対象検出と比較してラベリングコストが低いため、かなりの関心を集めている。
本研究では,RS画像に適したPSOD法を提案する。
提案手法は,最先端の画像レベルとポイントレベルの教師付き検出法と比較して性能が大幅に向上し,PSODとボックスレベルの教師付きオブジェクト検出の差を低減できる。
論文 参考訳(メタデータ) (2023-05-23T15:06:04Z) - D-Align: Dual Query Co-attention Network for 3D Object Detection Based
on Multi-frame Point Cloud Sequence [8.21339007493213]
従来の3Dオブジェクト検出器は一定期間に取得した一連の点を用いて物体を検出する。
近年の研究では、点雲列を利用して物体検出の性能をさらに向上できることが示されている。
D-Alignは,一連の点集合から得られる特徴を調整・集約することで,鳥眼視(BEV)の特徴を効果的に生み出すことができる。
論文 参考訳(メタデータ) (2022-09-30T20:41:25Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - A Versatile Multi-View Framework for LiDAR-based 3D Object Detection
with Guidance from Panoptic Segmentation [9.513467995188634]
LiDARデータを用いた3Dオブジェクト検出は、自律運転システムにとって必須のコンポーネントである。
本稿では,3次元物体検出とパノプティックセグメンテーションを共同で行う新しいマルチタスクフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-04T04:57:05Z) - Single-stage Rotate Object Detector via Two Points with Solar Corona
Heatmap [16.85421977235311]
太陽コロナ熱マップを用いた単段回転物体検出器を開発し,指向性物体を検出する。
ROTPはオブジェクトの一部を予測し、それらを集約して全体像を形成する。
論文 参考訳(メタデータ) (2022-02-14T09:07:21Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - LiDAR-based Online 3D Video Object Detection with Graph-based Message
Passing and Spatiotemporal Transformer Attention [100.52873557168637]
3Dオブジェクト検出器は、通常は単一フレームの検出にフォーカスするが、連続する点のクラウドフレームでは情報を無視する。
本稿では,ポイントシーケンスで動作するエンドツーエンドのオンライン3Dビデオオブジェクト検出器を提案する。
論文 参考訳(メタデータ) (2020-04-03T06:06:52Z) - Plug & Play Convolutional Regression Tracker for Video Object Detection [37.47222104272429]
ビデオオブジェクト検出ターゲットは、オブジェクトのバウンディングボックスを同時にローカライズし、所定のビデオ内のクラスを識別する。
ビデオオブジェクト検出の課題のひとつは、ビデオ全体にわたるすべてのオブジェクトを一貫して検出することだ。
ビデオオブジェクト検出タスクのためのPlug & Playスケール適応型畳み込みレグレッショントラッカーを提案する。
論文 参考訳(メタデータ) (2020-03-02T15:57:55Z) - PPDM: Parallel Point Detection and Matching for Real-time Human-Object
Interaction Detection [85.75935399090379]
本稿では,Human-Object Interaction (HOI) の単一段階検出手法を提案する。
これは、初めてのリアルタイムHOI検出方法である。
論文 参考訳(メタデータ) (2019-12-30T12:00:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。