論文の概要: FSMODNet: A Closer Look at Few-Shot Detection in Multispectral Data
- arxiv url: http://arxiv.org/abs/2509.20905v1
- Date: Thu, 25 Sep 2025 08:45:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.796975
- Title: FSMODNet: A Closer Look at Few-Shot Detection in Multispectral Data
- Title(参考訳): FSMODNet:マルチスペクトルデータにおけるFew-Shot検出
- Authors: Manuel Nkegoum, Minh-Tan Pham, Élisa Fromont, Bruno Avignon, Sébastien Lefèvre,
- Abstract要約: FSMOD (Few-shot Multispectral Object Detection) は、最小限のデータで可視・熱モードで物体を検出するという課題に対処する。
我々は,限定ラベルでも検出性能を向上させるために,クロスモーダル機能統合を利用するFSMODNetというフレームワークを導入する。
- 参考スコア(独自算出の注目度): 7.459632891054827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot multispectral object detection (FSMOD) addresses the challenge of detecting objects across visible and thermal modalities with minimal annotated data. In this paper, we explore this complex task and introduce a framework named "FSMODNet" that leverages cross-modality feature integration to improve detection performance even with limited labels. By effectively combining the unique strengths of visible and thermal imagery using deformable attention, the proposed method demonstrates robust adaptability in complex illumination and environmental conditions. Experimental results on two public datasets show effective object detection performance in challenging low-data regimes, outperforming several baselines we established from state-of-the-art models. All code, models, and experimental data splits can be found at https://anonymous.4open.science/r/Test-B48D.
- Abstract(参考訳): FSMOD (Few-shot Multispectral Object Detection) は、最小限のアノテートデータで可視・熱的モードで物体を検出するという課題に対処する。
本稿では,この複雑な課題を探求し,限定ラベルでも検出性能を向上させるために,クロスモダリティ機能統合を利用するFSMODNetというフレームワークを導入する。
可視・熱画像の特異な強度を変形可能な注意力で効果的に組み合わせることで,複雑な照明条件や環境条件下での堅牢な適応性を示す。
2つの公開データセットに対する実験結果から、最先端のモデルから確立したいくつかのベースラインを上回る、低データ体制に挑戦する上で効果的なオブジェクト検出性能が示された。
すべてのコード、モデル、実験データの分割はhttps://anonymous.4open.science/r/Test-B48Dで確認できる。
関連論文リスト
- HiddenObject: Modality-Agnostic Fusion for Multimodal Hidden Object Detection [2.482043295743758]
HiddenObjectは、Mambaベースのフュージョンメカニズムを使用して、RGB、熱、深度データを統合するフュージョンフレームワークである。
提案手法は、モダリティを横断する補完的な信号を捕捉し、不明瞭または偽装されたターゲットの検出を増強する。
論文 参考訳(メタデータ) (2025-08-28T18:09:22Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.85000884785013]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - WS-DETR: Robust Water Surface Object Detection through Vision-Radar Fusion with Detection Transformer [4.768265044725289]
水面オブジェクト検出は、ぼやけたエッジと多様なオブジェクトスケールの課題に直面します。
既存のアプローチは、モデルの堅牢性に悪影響を及ぼす、クロスモーダルな機能競合に悩まされている。
本稿では,SOTA(State-of-the-art)性能を実現する頑健なビジョンレーダ融合モデルWS-DETRを提案する。
論文 参考訳(メタデータ) (2025-04-10T04:16:46Z) - Efficient Multimodal 3D Object Detector via Instance-Level Contrastive Distillation [17.634678949648208]
提案したICDフレームワークとCLFM(Cross Linear Attention Fusion Module)を組み込んだ高速かつ効果的なマルチモーダル3Dオブジェクト検出器を提案する。
我々の3Dオブジェクト検出器は、より優れた効率を実現しつつ、最先端(SOTA)手法より優れています。
論文 参考訳(メタデータ) (2025-03-17T08:26:11Z) - Efficient Detection Framework Adaptation for Edge Computing: A Plug-and-play Neural Network Toolbox Enabling Edge Deployment [59.61554561979589]
エッジコンピューティングは、時間に敏感なシナリオでディープラーニングベースのオブジェクト検出をデプロイするための重要なパラダイムとして登場した。
既存のエッジ検出手法では、軽量モデルによる検出精度のバランスの難しさ、適応性の制限、現実の検証の不十分といった課題に直面している。
本稿では,汎用的なプラグイン・アンド・プレイコンポーネントを用いてエッジ環境にオブジェクト検出モデルを適用するエッジ検出ツールボックス(ED-TOOLBOX)を提案する。
論文 参考訳(メタデータ) (2024-12-24T07:28:10Z) - PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [76.95536611263356]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:18:39Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Multispectral Fusion for Object Detection with Cyclic Fuse-and-Refine
Blocks [3.6488662460683794]
本稿では,マルチスペクトル特徴量に存在する相補的/一貫性のバランスを利用するニューラルネットワークの中間機能融合法を提案する。
オブジェクト検出のための2つの挑戦的マルチスペクトルデータセットに対する融合法の有効性を評価する。
論文 参考訳(メタデータ) (2020-09-26T18:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。