論文の概要: Local Perception-Aware Transformer for Aerial Tracking
- arxiv url: http://arxiv.org/abs/2208.00662v1
- Date: Mon, 1 Aug 2022 07:54:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:59:01.438678
- Title: Local Perception-Aware Transformer for Aerial Tracking
- Title(参考訳): 航空追跡のための局部知覚認識認識トランス
- Authors: Changhong Fu, Weiyu Peng, Sihang Li, Junjie Ye and Ziang Cao
- Abstract要約: 提案するトラッカーは,グローバルエンコーダを新しい局所認識エンコーダで置き換える。
後者は、詳細問合せ網を通して、航空ビューの下で正確に局所オブジェクトの詳細をモデル化することができる。
この手法は、316のシークエンスを持つ複数の権威ある航空ベンチマークにおいて、競争精度とロバスト性を達成する。
- 参考スコア(独自算出の注目度): 13.354630453781152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformer-based visual object tracking has been utilized extensively.
However, the Transformer structure is lack of enough inductive bias. In
addition, only focusing on encoding the global feature does harm to modeling
local details, which restricts the capability of tracking in aerial robots.
Specifically, with local-modeling to global-search mechanism, the proposed
tracker replaces the global encoder by a novel local-recognition encoder. In
the employed encoder, a local-recognition attention and a local element
correction network are carefully designed for reducing the global redundant
information interference and increasing local inductive bias. Meanwhile, the
latter can model local object details precisely under aerial view through
detail-inquiry net. The proposed method achieves competitive accuracy and
robustness in several authoritative aerial benchmarks with 316 sequences in
total. The proposed tracker's practicability and efficiency have been validated
by the real-world tests.
- Abstract(参考訳): トランスフォーマーベースのビジュアルオブジェクトトラッキングが広く利用されている。
しかし、トランスフォーマー構造には十分なインダクティブバイアスが欠けている。
さらに、グローバル機能のエンコーディングにのみ注目することは、航空ロボットの追跡能力を制限するローカルディテールのモデリングに悪影響を及ぼす。
具体的には、局所モデリングからグローバル検索機構により、提案されたトラッカーはグローバルエンコーダを新しいローカル認識エンコーダに置き換える。
使用済みエンコーダにおいて、グローバル冗長情報干渉を低減し、局所インダクティブバイアスを増大させるために、局所認識注意および局所要素補正ネットワークを慎重に設計する。
一方、後者は、詳細問合せ網を通して、航空ビューの下で正確に局所的な物体の詳細をモデル化することができる。
提案手法は, 合計316列の高信頼性航空ベンチマークにおいて, 競争精度とロバスト性を実現する。
提案したトラッカーの実用性と効率は実世界の試験によって検証されている。
関連論文リスト
- Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Can Transformer Attention Spread Give Insights Into Uncertainty of
Detected and Tracked Objects? [9.287964414592826]
トランスフォーマーは、最近、自律運転の文脈で物体の検出と追跡に利用されてきた。
これらのモデルのユニークな特徴の1つは、各前方通過で注意重みが計算されることである。
これらの注意重みがデコーダ層やトラックの寿命を通じてどのように変化するかを検討する。
論文 参考訳(メタデータ) (2022-10-26T00:05:16Z) - Focused Decoding Enables 3D Anatomical Detection by Transformers [64.36530874341666]
集束デコーダと呼ばれる3次元解剖学的構造検出のための新しい検出変換器を提案する。
Focused Decoderは、解剖学的領域のアトラスからの情報を活用して、クエリアンカーを同時にデプロイし、クロスアテンションの視野を制限する。
提案手法を利用可能な2つのCTデータセットに対して評価し、フォーカスドデコーダが強力な検出結果を提供するだけでなく、大量の注釈付きデータの必要性を軽減し、注意重みによる結果の例外的で直感的な説明性を示すことを示した。
論文 参考訳(メタデータ) (2022-07-21T22:17:21Z) - Defect Transformer: An Efficient Hybrid Transformer Architecture for
Surface Defect Detection [2.0999222360659604]
表面欠陥検出のための効率的なハイブリッドトランスアーキテクチャであるDefect Transformer (DefT)を提案する。
DefTはCNNとTransformerを統一モデルに組み込んで、局所的および非局所的関係を協調的にキャプチャする。
3つのデータセットの実験は、他のCNNやトランスフォーマーベースのネットワークと比較して、我々の手法の優位性と効率性を実証している。
論文 参考訳(メタデータ) (2022-07-17T23:37:48Z) - SelfReformer: Self-Refined Network with Transformer for Salient Object
Detection [46.72916268774309]
既存の手法は、詳細で完全な予測を生成するのに依然として苦労している。
我々はTransformerベースのネットワークを開発し、グローバルコンテキスト情報を明示的に学習するブランチのための教師付きタスクをフレーム化した。
さらに,グローバルなコンテキストを融合し,予測における局所的な詳細を自動的に特定・洗練する2段階のContext Refinement Moduleを開発した。
論文 参考訳(メタデータ) (2022-05-23T13:10:10Z) - Integral Migrating Pre-trained Transformer Encoder-decoders for Visual
Object Detection [78.2325219839805]
imTEDは、数発のオブジェクト検出の最先端を最大7.6%改善する。
MS COCOデータセットの実験は、imTEDが一貫してそのデータセットを2.8%上回っていることを示している。
論文 参考訳(メタデータ) (2022-05-19T15:11:20Z) - LCTR: On Awakening the Local Continuity of Transformer for Weakly
Supervised Object Localization [38.376238216214524]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルだけでオブジェクトローカライザを学習することを目的としている。
本稿では,グローバルな特徴の局所認識能力を高めることを目的とした,LCTRと呼ばれるトランスフォーマー上に構築された新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-10T01:48:40Z) - DAE : Discriminatory Auto-Encoder for multivariate time-series anomaly
detection in air transportation [68.8204255655161]
識別オートエンコーダ(DAE)と呼ばれる新しい異常検出モデルを提案する。
通常のLSTMベースのオートエンコーダのベースラインを使用するが、いくつかのデコーダがあり、それぞれ特定の飛行フェーズのデータを取得する。
その結果,DAEは精度と検出速度の両方で良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-09-08T14:07:55Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。