論文の概要: Few-Shot Object Detection via Spatial-Channel State Space Model
- arxiv url: http://arxiv.org/abs/2507.15308v1
- Date: Mon, 21 Jul 2025 07:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.297857
- Title: Few-Shot Object Detection via Spatial-Channel State Space Model
- Title(参考訳): 空間チャネル状態空間モデルによるFew-Shot物体検出
- Authors: Zhimeng Xin, Tianxu Wu, Yixiong Zou, Shiming Chen, Dingjie Fu, Xinge You,
- Abstract要約: 現在の方法では、各チャンネルから有効な特徴を正確に抽出するのに苦労することがある。
本研究では,空間チャネル状態モデリングのための空間チャネル状態空間モデリング(SCSM)モジュールを提案する。
SCSMモジュールは、効果的なパターンを強調し、機能チャネルでそれらの非効率なパターンを修正します。
- 参考スコア(独自算出の注目度): 9.644454618045133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the limited training samples in few-shot object detection (FSOD), we observe that current methods may struggle to accurately extract effective features from each channel. Specifically, this issue manifests in two aspects: i) channels with high weights may not necessarily be effective, and ii) channels with low weights may still hold significant value. To handle this problem, we consider utilizing the inter-channel correlation to facilitate the novel model's adaptation process to novel conditions, ensuring the model can correctly highlight effective channels and rectify those incorrect ones. Since the channel sequence is also 1-dimensional, its similarity with the temporal sequence inspires us to take Mamba for modeling the correlation in the channel sequence. Based on this concept, we propose a Spatial-Channel State Space Modeling (SCSM) module for spatial-channel state modeling, which highlights the effective patterns and rectifies those ineffective ones in feature channels. In SCSM, we design the Spatial Feature Modeling (SFM) module to balance the learning of spatial relationships and channel relationships, and then introduce the Channel State Modeling (CSM) module based on Mamba to learn correlation in channels. Extensive experiments on the VOC and COCO datasets show that the SCSM module enables the novel detector to improve the quality of focused feature representation in channels and achieve state-of-the-art performance.
- Abstract(参考訳): 少ショット物体検出(FSOD: few-shot object detection)の訓練サンプルが限られているため、現在の手法では各チャンネルから有効な特徴を正確に抽出することが困難である。
具体的には、この問題は2つの側面に現れます。
一 重量が高いチャンネルが必ずしも有効であるとは限らないこと、及び
二 重量の低いチャンネルは、有意な価値を有することができる。
この問題に対処するため、我々はチャネル間相関を利用して、新しいモデルが新しい条件に適応する過程を容易にし、モデルが有効なチャネルを正しく強調し、正しいチャネルを修正できるようにする。
チャネル列も1次元であるため、時間列との類似性は、チャネル列の相関をモデル化するためにMambaを取るきっかけとなる。
本研究では,空間チャネル状態モデリングのための空間チャネル状態モデリング(SCSM)モジュールを提案する。
SCSMでは,空間的関係とチャネル関係の学習のバランスをとるために,空間的特徴モデリング(Spatial Feature Modeling,SFM)モジュールを設計し,その上で,Mambaに基づくチャネル状態モデリング(CSM)モジュールを導入し,チャネル間の相関関係を学習する。
VOCおよびCOCOデータセットの大規模な実験により、SCSMモジュールは、新しい検出器により、チャネルにおける焦点を絞った特徴表現の品質を改善し、最先端のパフォーマンスを達成することができることが示された。
関連論文リスト
- Controllable diffusion-based generation for multi-channel biological data [66.44042377817074]
本研究では, 構造的および空間的生物学的データに対する制御可能生成のための統合拡散フレームワークを提案する。
空間的および非空間的予測タスクにまたがって,IMCにおけるタンパク質のインパルス化や単一セルデータセットにおける遺伝子対タンパク質の予測など,最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-06-24T00:56:21Z) - A CGAN-LSTM-Based Framework for Time-Varying Non-Stationary Channel Modeling [18.899432402460565]
本稿では,非定常チャネル特性の進化を捉えるために,長期的動的チャネルの生成を強調した。
本研究では,条件付き生成逆数ネットワーク(CGAN)と長期記憶ネットワーク(LSTM)を組み合わせたハイブリッドディープラーニングフレームワークを提案する。
定常性に制約されたアプローチは、生成された時系列チャネルの時間的相関を保証するように設計されている。
論文 参考訳(メタデータ) (2025-03-03T03:27:45Z) - CFFormer: Cross CNN-Transformer Channel Attention and Spatial Feature Fusion for Improved Segmentation of Heterogeneous Medical Images [29.68616115427831]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
医用撮像装置の限界により、医用画像は大きな異質性を示し、セグメンテーションの課題を提起する。
本稿では,効果的なチャネル特徴抽出を利用するCFFormerと呼ばれるハイブリッドCNN-Transformerモデルを提案する。
論文 参考訳(メタデータ) (2025-01-07T08:59:20Z) - Channel-Aware Low-Rank Adaptation in Time Series Forecasting [43.684035409535696]
2つの代表的なチャネル戦略は、モデル表現性とロバスト性に密接に関連している。
本稿では,チャネル対応の低ランク適応手法を,アイデンティティ対応の個別コンポーネント上での条件付きCDモデルに適用する。
論文 参考訳(メタデータ) (2024-07-24T13:05:17Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - CU-Mamba: Selective State Space Models with Channel Learning for Image Restoration [7.292363114816646]
本稿では,二つの状態空間モデルフレームワークをU-Netアーキテクチャに組み込んだChannel-Aware U-Shaped Mambaモデルを紹介する。
実験は、CU-Mambaが既存の最先端手法よりも優れていることを検証する。
論文 参考訳(メタデータ) (2024-04-17T22:02:22Z) - From Similarity to Superiority: Channel Clustering for Time Series Forecasting [61.96777031937871]
CCM(Channel Clustering Module)を開発した。
CCMは、固有の類似性を特徴とするチャネルを動的にグループ化し、個々のチャネルのアイデンティティの代わりにクラスタ情報を活用する。
CCMは、CIモデルとCDモデルのパフォーマンスを、それぞれ長期および短期の予測において平均利率2.4%と7.2%で向上させることができる。
論文 参考訳(メタデータ) (2024-03-31T02:46:27Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - MIMO-GAN: Generative MIMO Channel Modeling [13.277946558463201]
チャネル入力出力の測定から統計的チャネルモデルを学習するための生成チャネルモデリングを提案する。
我々は、GANの進歩を活用し、観測された測定値からチャネル上の暗黙の分布を学習するのに役立つ。
論文 参考訳(メタデータ) (2022-03-16T12:36:38Z) - Dual Attention GANs for Semantic Image Synthesis [101.36015877815537]
本稿では,写真リアリスティック・セマンティック・一貫性のあるイメージを合成するための新しいデュアルアテンションGAN(DAGAN)を提案する。
また,2つの新しいモジュール,すなわち位置対応空間アテンションモジュール(SAM)と規模対応チャネルアテンションモジュール(CAM)を提案する。
DAGANは、より少ないモデルパラメータを使用しながら、最先端のメソッドよりも驚くほど優れた結果が得られる。
論文 参考訳(メタデータ) (2020-08-29T17:49:01Z) - Data-Driven Symbol Detection via Model-Based Machine Learning [117.58188185409904]
機械学習(ML)とモデルベースアルゴリズムを組み合わせた,検出設計のシンボル化を目的とした,データ駆動型フレームワークについてレビューする。
このハイブリッドアプローチでは、よく知られたチャネルモデルに基づくアルゴリズムをMLベースのアルゴリズムで拡張し、チャネルモデル依存性を除去する。
提案手法は, 正確なチャネル入出力統計関係を知らなくても, モデルベースアルゴリズムのほぼ最適性能が得られることを示す。
論文 参考訳(メタデータ) (2020-02-14T06:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。