Fugu-MT 論文翻訳(概要): Representation Alignment Contrastive Regularization for Multi-Object Tracking

論文の概要: Representation Alignment Contrastive Regularization for Multi-Object Tracking

arxiv url: http://arxiv.org/abs/2404.02562v2
Date: Wed, 17 Apr 2024 07:13:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-18 18:31:46.752569
Title: Representation Alignment Contrastive Regularization for Multi-Object Tracking
Title（参考訳）: 複数物体追跡のための表現アライメントコントラスト規則化
Authors: Zhonglin Liu, Shujie Chen, Jianfeng Dong, Xun Wang, Di Zhou,
Abstract要約: 多目的追跡アルゴリズムのメインストリーム性能は、データアソシエーション段階における重時間関係のモデリングに依存する。この研究は、深層学習に基づく時間的関係モデルを単純化し、データアソシエーション設計に解釈可能性を導入することを目的としている。
参考スコア（独自算出の注目度）: 29.837560662395713
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Achieving high-performance in multi-object tracking algorithms heavily relies on modeling spatio-temporal relationships during the data association stage. Mainstream approaches encompass rule-based and deep learning-based methods for spatio-temporal relationship modeling. While the former relies on physical motion laws, offering wider applicability but yielding suboptimal results for complex object movements, the latter, though achieving high-performance, lacks interpretability and involves complex module designs. This work aims to simplify deep learning-based spatio-temporal relationship models and introduce interpretability into features for data association. Specifically, a lightweight single-layer transformer encoder is utilized to model spatio-temporal relationships. To make features more interpretative, two contrastive regularization losses based on representation alignment are proposed, derived from spatio-temporal consistency rules. By applying weighted summation to affinity matrices, the aligned features can seamlessly integrate into the data association stage of the original tracking workflow. Experimental results showcase that our model enhances the majority of existing tracking networks' performance without excessive complexity, with minimal increase in training overhead and nearly negligible computational and storage costs.
Abstract（参考訳）: 多目的追跡アルゴリズムの高性能化は,データアソシエーション段階における時空間関係のモデル化に大きく依存している。メインストリームアプローチは、時空間関係モデリングのためのルールベースおよびディープラーニングベースの手法を含む。前者は物理運動法則に依存し、より広い適用性を提供するが、複雑な物体の動きに対して最適な結果をもたらすが、後者は高い性能を達成するが、解釈性に欠け、複雑なモジュール設計を伴う。本研究の目的は、深層学習に基づく時空間関係モデルを簡単にし、データアソシエーションのための機能に解釈可能性を導入することである。具体的には、軽量な単層トランスエンコーダを用いて時空間関係をモデル化する。特徴をより解釈的にするために、時空間整合性規則から導かれる表現アライメントに基づく2つの対照的な正則化損失を提案する。アフィニティ行列に重み付け和を適用することで、アライメントされた機能は、元のトラッキングワークフローのデータアソシエーションステージにシームレスに統合できる。実験の結果,既存の追跡ネットワークの性能の大部分を過度に複雑にすることなく向上させ,トレーニングオーバーヘッドが最小限に増加し,ほぼ無視可能な計算・記憶コストが増大することがわかった。

関連論文リスト

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling [85.590774707406]
統一モデルは単一のアーキテクチャ内でマルチモーダル理解と生成の両方を扱うことができるが、通常は出力を反復的に書き換えることなく単一のパスで操作する。マルチモーダルなテストタイムスケーリングのためのフレームワークであるUniTを導入し、単一の統一モデルで複数のラウンドをまたいだ推論、検証、精査を可能にします。
論文参考訳（メタデータ） (2026-02-12T18:59:49Z)
TaoSearchEmb: A Multi-Objective Reinforcement Learning Framework for Dense Retrieval in Taobao Search [11.893855231479717]
Retrieval-GRPOは強化学習に基づく高密度検索フレームワークである。中国最大のeコマースプラットフォームに配備されている。
論文参考訳（メタデータ） (2025-11-17T20:16:52Z)
SCENT: Robust Spatiotemporal Learning for Continuous Scientific Data via Scalable Conditioned Neural Fields [11.872753517172555]
SCENTは、スケーラブルで連続性に富んだモデリング学習のための新しいフレームワークである。 SCENTは単一のアーキテクチャ内で表現、再構築、予測を統一する。我々はSCENTを広範囲なシミュレーションと実世界の実験により検証し、最先端の性能を実証した。
論文参考訳（メタデータ） (2025-04-16T17:17:31Z)
Model Utility Law: Evaluating LLMs beyond Performance through Mechanism Interpretable Metric [99.56567010306807]
大規模言語モデル(LLM)は、学術、産業、そして日々のアプリケーションに欠かせないものになっている。大規模言語モデル (LLM) 時代における評価の課題の1つは一般化問題である。従来の性能スコアを補完するメカニズムの解釈可能性向上指標であるモデル利用指数(MUI)を提案する。
論文参考訳（メタデータ） (2025-04-10T04:09:47Z)
EchoMamba4Rec: Harmonizing Bidirectional State Space Models with Spectral Filtering for Advanced Sequential Recommendation [0.0]
制御理論は、長期依存の管理に状態空間モデル(SSM)を使うことを強調している。本研究では,EchoMamba4Recを紹介した。 EchoMambaは既存のモデルよりも優れており、より正確でパーソナライズされたレコメンデーションを提供する。
論文参考訳（メタデータ） (2024-06-04T09:07:58Z)
Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery [62.43562856605473]
複雑な重み付き再帰的アーキテクチャの計算上の優位性について論じる。本稿では,反復的制約満足度を実現する完全畳み込みオートエンコーダSynCxを提案する。
論文参考訳（メタデータ） (2024-05-27T15:47:03Z)
ACTrack: Adding Spatio-Temporal Condition for Visual Object Tracking [0.5371337604556311]
視覚的物体追跡(VOT)において,物体の時間的関係を効果的にモデル化することが重要な課題である既存の手法は外観に基づく類似性や長期関係モデリングによって追跡され、連続するフレーム間の時間的コンテキストは容易に見過ごされてしまう。本稿では,大規模な記憶条件を持つ付加的前時間追跡フレームワークであるACTrackについて述べる。このフレームワークは,そのパラメータを凍結することにより,トレーニング済みバックボーンの品質と性能を保ち,トラッキングにおける時間関係をモデル化するためのトレーニング可能な軽量付加性ネットを作成する。我々は空間的特徴と時間的順序の整合性を確保するための付加的なシアム畳み込みネットワークを設計する。
論文参考訳（メタデータ） (2024-02-27T07:34:08Z)
A Simple Framework for Multi-mode Spatial-Temporal Data Modeling [4.855443906457102]
本稿では,マルチモード時空間データモデリングのための簡易なフレームワークを提案する。具体的には、複数のモード間の接続を適応的に確立するために、一般的なクロスモード空間関係学習コンポーネントを設計する。 3つの実世界のデータセットの実験により、我々のモデルは、空間と時間の複雑さの低いベースラインを一貫して上回ります。
論文参考訳（メタデータ） (2023-08-22T05:41:20Z)
OpenSTL: A Comprehensive Benchmark of Spatio-Temporal Predictive Learning [67.07363529640784]
提案するOpenSTLは,一般的なアプローチを再帰的モデルと再帰的モデルに分類する。我々は, 合成移動物体軌道, 人間の動き, 運転シーン, 交通流, 天気予報など, さまざまな領域にわたるデータセットの標準評価を行う。リカレントフリーモデルは、リカレントモデルよりも効率と性能のバランスが良いことがわかった。
論文参考訳（メタデータ） (2023-06-20T03:02:14Z)
Evolve Smoothly, Fit Consistently: Learning Smooth Latent Dynamics For Advection-Dominated Systems [14.553972457854517]
複雑な物理系のサロゲートモデルを学ぶための,データ駆動・時空連続フレームワークを提案する。ネットワークの表現力と特別に設計された整合性誘導正規化を利用して,低次元かつ滑らかな潜在軌道を得る。
論文参考訳（メタデータ） (2023-01-25T03:06:03Z)
OST: Efficient One-stream Network for 3D Single Object Tracking in Point Clouds [6.661881950861012]
本稿では,従来のシームズネットワークで発生した相関操作を回避するために,インスタンスレベルのエンコーディングの強みを活かした新しい一ストリームネットワークを提案する。提案手法は,クラス固有のトラッキングだけでなく,より少ない計算と高い効率でクラスに依存しないトラッキングを実現する。
論文参考訳（メタデータ） (2022-10-16T12:31:59Z)
HyperImpute: Generalized Iterative Imputation with Automatic Model Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文参考訳（メタデータ） (2022-06-15T19:10:35Z)
Multi-intersection Traffic Optimisation: A Benchmark Dataset and a Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文参考訳（メタデータ） (2021-01-24T03:55:39Z)
A Unified Object Motion and Affinity Model for Online Multi-Object Tracking [127.5229859255719]
オブジェクトの動きと親和性モデルを単一のネットワークに統一する新しいMOTフレームワークUMAを提案する。 UMAは、単一物体追跡とメートル法学習をマルチタスク学習により統合された三重項ネットワークに統合する。我々は,タスク認識機能学習を促進するために,タスク固有のアテンションモジュールを装備する。
論文参考訳（メタデータ） (2020-03-25T09:36:43Z)
Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2020-02-21T05:00:01Z)
Relational State-Space Model for Stochastic Multi-Object Systems [24.234120525358456]
本稿では、逐次階層型潜在変数モデルであるリレーショナル状態空間モデル(R-SSM)を紹介する。 R-SSMはグラフニューラルネットワーク(GNN)を用いて、複数の相関オブジェクトの結合状態遷移をシミュレートする。 R-SSMの実用性は、合成および実時間時系列データセットで実証的に評価される。
論文参考訳（メタデータ） (2020-01-13T03:45:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。