論文の概要: Multi-Scale Correlation-Aware Transformer for Maritime Vessel Re-Identification
- arxiv url: http://arxiv.org/abs/2511.14203v1
- Date: Tue, 18 Nov 2025 07:16:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.985894
- Title: Multi-Scale Correlation-Aware Transformer for Maritime Vessel Re-Identification
- Title(参考訳): 船舶再識別のためのマルチスケール相関対応変圧器
- Authors: Yunhe Liu,
- Abstract要約: 海上船舶再識別(Re-ID)は海上監視と知的状況認識システムにおいて重要な役割を担っている。
既存の船体Re-ID法は、歩行者に焦点を絞ったアルゴリズムから直接適用されており、船体画像に現れる固有の問題を緩和するのに不適当である。
これらの課題に対処するために,マルチスケール相関対応トランスフォーマーネットワーク(MCFormer)を提案する。
MCFormerは、入力セット全体にわたるマルチスケールの相関を明示的にモデル化し、同一性内変異や局所的欠落を伴う外れ値サンプルの悪影響を抑制する。
- 参考スコア(独自算出の注目度): 1.5229257192293202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Maritime vessel re-identification (Re-ID) plays a crucial role in advancing maritime monitoring and intelligent situational awareness systems. However, some existing vessel Re-ID methods are directly adapted from pedestrian-focused algorithms, making them ill-suited for mitigating the unique problems present in vessel images, particularly the greater intra-identity variations and more severe missing of local parts, which lead to the emergence of outlier samples within the same identity. To address these challenges, we propose the Multi-scale Correlation-aware Transformer Network (MCFormer), which explicitly models multi-scale correlations across the entire input set to suppress the adverse effects of outlier samples with intra-identity variations or local missing, incorporating two novel modules, the Global Correlation Module (GCM), and the Local Correlation Module (LCM). Specifically, GCM constructs a global similarity affinity matrix across all input images to model global correlations through feature aggregation based on inter-image consistency, rather than solely learning features from individual images as in most existing approaches. Simultaneously, LCM mines and aligns local features of positive samples with contextual similarity to extract local correlations by maintaining a dynamic memory bank, effectively compensating for missing or occluded regions in individual images. To further enhance feature robustness, MCFormer integrates global and local features that have been respectively correlated across multiple scales, effectively capturing latent relationships among image features. Experiments on three benchmarks demonstrate that MCFormer achieves state-of-the-art performance.
- Abstract(参考訳): 海上船舶再識別(Re-ID)は海上監視と知的状況認識システムにおいて重要な役割を担っている。
しかし、既存の船体Re-ID法は歩行者に焦点を絞ったアルゴリズムから直接適応しており、船体画像に現れる特異な問題を緩和するのに不適当である。
これらの課題に対処するため,Multi-scale correlation-aware Transformer Network (MCFormer) を提案する。このネットワークは,グローバル相関モジュール (GCM) とローカル相関モジュール (LCM) という2つの新しいモジュールを組み込んだ,同一性内変異や局所欠落による外乱サンプルの悪影響を抑制するために,入力セット全体にわたるマルチスケール相関を明示的にモデル化する。
具体的には、GCMは、既存のほとんどのアプローチのように個々の画像からのみ特徴を学習するのではなく、画像間の整合性に基づく特徴集約により、すべての入力画像にまたがる大域的類似性親和性行列を構築し、大域的相関をモデル化する。
同時に、LCMは、動的メモリバンクを維持して局所的相関を抽出し、個々の画像の欠落した領域を効果的に補償するために、正のサンプルの局所的特徴と文脈的類似性をマイニングし整列する。
機能ロバスト性をさらに強化するため、MCFormerは、複数のスケールでそれぞれ相関したグローバル機能とローカル機能を統合し、画像特徴間の遅延関係を効果的にキャプチャする。
3つのベンチマークの実験は、MCFormerが最先端のパフォーマンスを達成することを示した。
関連論文リスト
- RelayFormer: A Unified Local-Global Attention Framework for Scalable Image and Video Manipulation Localization [50.75654397516163]
様々な解像度とモダリティに対応する統一フレームワークであるRelayFormerを提案する。
RelayFormerは、入力を固定サイズのサブイメージに分割し、Global-Local Relay(GLR)トークンを導入する。
これにより、セマンティックや時間的一貫性などのグローバルなキューを効率よく交換でき、きめ細かいアーティファクトを保存できる。
論文 参考訳(メタデータ) (2025-08-13T03:35:28Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - PS-ReID: Advancing Person Re-Identification and Precise Segmentation with Multimodal Retrieval [38.530536338075684]
人物再識別(ReID)は、セキュリティ監視や刑事捜査などの応用において重要な役割を果たす。
画像とテキストの入力を組み合わせたマルチモーダルモデルであるbf PS-ReIDを提案する。
実験の結果、PS-ReIDは、ReIDとセグメンテーションタスクの両方において、ユニモーダルクエリベースのモデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-03-27T15:14:03Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Global-and-Local Collaborative Learning for Co-Salient Object Detection [162.62642867056385]
Co-Salient Object Detection (CoSOD)の目標は、2つ以上の関連する画像を含むクエリグループに一般的に現れる有能なオブジェクトを見つけることである。
本稿では,グローバル対応モデリング(GCM)とローカル対応モデリング(LCM)を含む,グローバル・ローカル協調学習アーキテクチャを提案する。
提案したGLNetは3つの一般的なCoSODベンチマークデータセットに基づいて評価され、我々のモデルが小さなデータセット(約3k画像)でトレーニングされた場合、一部の大規模データセット(約8k-200k画像)でトレーニングされた11の最先端の競合製品(約8k-200k画像)を上回っていることを示す。
論文 参考訳(メタデータ) (2022-04-19T14:32:41Z) - DF^2AM: Dual-level Feature Fusion and Affinity Modeling for RGB-Infrared
Cross-modality Person Re-identification [18.152310122348393]
RGB-赤外線による人物再識別は、クラス内変異とモダリティの相違が原因で難しい課題である。
我々は,局所的・グローバル的特徴融合(df2)モジュールを,局所的特徴とグローバル的特徴の区別に着目して提案する。
人物画像からグローバルな特徴間の関係をさらに掘り下げるために,親和性モデリング(AM)モジュールを提案する。
論文 参考訳(メタデータ) (2021-04-01T03:12:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。