論文の概要: MFTIQ: Multi-Flow Tracker with Independent Matching Quality Estimation
- arxiv url: http://arxiv.org/abs/2411.09551v1
- Date: Thu, 14 Nov 2024 16:06:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-15 15:24:28.076606
- Title: MFTIQ: Multi-Flow Tracker with Independent Matching Quality Estimation
- Title(参考訳): MFTIQ:独立マッチング品質推定機能付きマルチフロートラッカー
- Authors: Jonas Serych, Michal Neoral, Jiri Matas,
- Abstract要約: MFTIQはMulti-Flow Tracker(MFT)フレームワークを進化させる新しい長期追跡モデルである。
MFTIQはMFTのフローチェインの概念に基づいており、光フロー計算から対応品質の推定を分離するインディペンデント品質(IQ)モジュールを統合している。
プラグアンドプレイ(plug-and-play)として設計されたMFTIQは、微調整やアーキテクチャの変更を必要とせずに、市販の光学フロー方式で使用することができる。
- 参考スコア(独自算出の注目度): 22.245299107036836
- License:
- Abstract: In this work, we present MFTIQ, a novel dense long-term tracking model that advances the Multi-Flow Tracker (MFT) framework to address challenges in point-level visual tracking in video sequences. MFTIQ builds upon the flow-chaining concepts of MFT, integrating an Independent Quality (IQ) module that separates correspondence quality estimation from optical flow computations. This decoupling significantly enhances the accuracy and flexibility of the tracking process, allowing MFTIQ to maintain reliable trajectory predictions even in scenarios of prolonged occlusions and complex dynamics. Designed to be "plug-and-play", MFTIQ can be employed with any off-the-shelf optical flow method without the need for fine-tuning or architectural modifications. Experimental validations on the TAP-Vid Davis dataset show that MFTIQ with RoMa optical flow not only surpasses MFT but also performs comparably to state-of-the-art trackers while having substantially faster processing speed. Code and models available at https://github.com/serycjon/MFTIQ .
- Abstract(参考訳): 本稿では,MFT(Multi-Flow Tracker)フレームワークを改良し,ビデオシーケンスにおけるポイントレベルの視覚的トラッキングの課題に対処する,新しい長期追跡モデルであるMFTIQを提案する。
MFTIQはMFTのフローチェインの概念に基づいており、光フロー計算から対応品質の推定を分離するインディペンデント品質(IQ)モジュールを統合している。
この分離により、追跡プロセスの精度と柔軟性が大幅に向上し、長い閉塞や複雑な力学のシナリオであっても、MFTIQは信頼性の高い軌道予測を維持できる。
プラグアンドプレイ(plug-and-play)として設計されたMFTIQは、微調整やアーキテクチャの変更を必要とせずに、市販の光学フロー方式で使用することができる。
TAP-Vid Davisデータセットの実験的検証によると、RoMa光流を用いたMFTIQはMFTを超えるだけでなく、最先端のトラッカーと互換性があり、処理速度は大幅に高速である。
コードとモデルはhttps://github.com/serycjon/MFTIQで入手できる。
関連論文リスト
- Boosting CLIP Adaptation for Image Quality Assessment via Meta-Prompt Learning and Gradient Regularization [55.09893295671917]
本稿では,Gdient-Regulated Meta-Prompt IQA Framework (GRMP-IQA)を紹介する。
GRMP-IQAはMeta-Prompt事前学習モジュールとQuality-Aware Gradient Regularizationの2つの主要なモジュールから構成されている。
5つの標準BIQAデータセットの実験は、限られたデータ設定下での最先端BIQA手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-09T07:26:21Z) - MADTP: Multimodal Alignment-Guided Dynamic Token Pruning for
Accelerating Vision-Language Transformer [66.71930982549028]
VLT(Vision-Language Transformer)は近年大きな成功を収めている。
各種VLTの高速化を目的としたマルチモーダルアライメント誘導動的トーケンプルーニング(MADTP)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-05T14:13:50Z) - Dense Matchers for Dense Tracking [0.0]
本稿では,MFT が提案する対数空間間隔における多重光流の結合の概念を拡張した。
我々は,MFTと異なる光フローネットワークとの整合性を実証し,個々の性能を上回る結果を得た。
このアプローチは、位置予測精度の観点から、より洗練された非因果的手法と競合することが証明されている。
論文 参考訳(メタデータ) (2024-02-17T14:16:14Z) - MFTCoder: Boosting Code LLMs with Multitask Fine-Tuning [28.12788291168137]
複数のタスクを同時に並列に微調整できるマルチタスクファインチューニングフレームワーク MFTcoder を提案する。
実験により、我々のマルチタスクファインチューニングアプローチは、単一タスクにおける個々のファインチューニングと、混合タスクにおけるファインチューニングの両方より優れていることが示された。
論文 参考訳(メタデータ) (2023-11-04T02:22:40Z) - GAFlow: Incorporating Gaussian Attention into Optical Flow [62.646389181507764]
我々はガウス的注意(GA)を光学フローモデルに押し込み、表現学習中に局所特性をアクセントする。
本稿では,既存の Transformer ブロックに簡単に接続可能な新しい Gaussian-Constrained Layer (GCL) を提案する。
動作解析のための新しいガウス誘導注意モジュール(GGAM)を提供する。
論文 参考訳(メタデータ) (2023-09-28T07:46:01Z) - Deformable Mixer Transformer with Gating for Multi-Task Learning of
Dense Prediction [126.34551436845133]
CNNとTransformerには独自の利点があり、MTL(Multi-task Learning)の高密度予測に広く使われている。
本稿では,変形可能なCNNと問合せベースのTransformerの長所を共用したMTLモデルを提案する。
論文 参考訳(メタデータ) (2023-08-10T17:37:49Z) - MFT: Long-Term Tracking of Every Pixel [0.36832029288386137]
Multi-Flow dense Tracker - 濃密でピクセルレベルの長期追跡のための新しい手法。
連続するフレーム間で推定される光フローを利用する。
追跡は最先端の点追跡法よりも桁違いに高速である。
論文 参考訳(メタデータ) (2023-05-22T13:02:46Z) - Automated Federated Learning in Mobile Edge Networks -- Fast Adaptation
and Convergence [83.58839320635956]
フェデレートラーニング(FL)は、モバイルエッジネットワークで機械学習モデルを分散的にトレーニングするために使用することができる。
最近のFLは、モデルに依存しないメタラーニング(MAML)フレームワークで解釈されている。
本稿は,MAMLがFLにもたらすメリットと,モバイルエッジネットワーク上でのメリットの最大化について論じる。
論文 参考訳(メタデータ) (2023-03-23T02:42:10Z) - A Mixed Quantization Network for Computationally Efficient Mobile
Inverse Tone Mapping [8.277567852741242]
深層ニューラルネットワークの効率的な演算と新しい混合量子化手法を組み合わせることで、高性能だが計算効率の良い混合量子化ネットワーク(MQN)を構築することを提案する。
MQNはレイテンシを最大10倍改善し、メモリ消費を25倍改善する。
論文 参考訳(メタデータ) (2022-03-12T19:40:01Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。