論文の概要: Multi-Scene Generalized Trajectory Global Graph Solver with Composite
Nodes for Multiple Object Tracking
- arxiv url: http://arxiv.org/abs/2312.08951v1
- Date: Thu, 14 Dec 2023 14:00:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-15 22:04:14.218235
- Title: Multi-Scene Generalized Trajectory Global Graph Solver with Composite
Nodes for Multiple Object Tracking
- Title(参考訳): 複数物体追跡のための複合ノードを用いた多段一般化軌道グラフ解法
- Authors: Yan Gao, Haojun Xu, Nannan Wang, Jie Li, Xinbo Gao
- Abstract要約: 複合ノードメッセージパッシングネットワーク(CoNo-Link)は、超長いフレーム情報を関連付けるためのフレームワークである。
オブジェクトをノードとして扱う従来の方法に加えて、このネットワークは情報インタラクションのためのノードとしてオブジェクトトラジェクトリを革新的に扱う。
我々のモデルは、合成ノードを追加することで、より長い時間スケールでより良い予測を学習することができる。
- 参考スコア(独自算出の注目度): 61.69892497726235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The global multi-object tracking (MOT) system can consider interaction,
occlusion, and other ``visual blur'' scenarios to ensure effective object
tracking in long videos. Among them, graph-based tracking-by-detection
paradigms achieve surprising performance. However, their fully-connected nature
poses storage space requirements that challenge algorithm handling long videos.
Currently, commonly used methods are still generated trajectories by building
one-forward associations across frames. Such matches produced under the
guidance of first-order similarity information may not be optimal from a
longer-time perspective. Moreover, they often lack an end-to-end scheme for
correcting mismatches. This paper proposes the Composite Node Message Passing
Network (CoNo-Link), a multi-scene generalized framework for modeling
ultra-long frames information for association. CoNo-Link's solution is a
low-storage overhead method for building constrained connected graphs. In
addition to the previous method of treating objects as nodes, the network
innovatively treats object trajectories as nodes for information interaction,
improving the graph neural network's feature representation capability.
Specifically, we formulate the graph-building problem as a top-k selection task
for some reliable objects or trajectories. Our model can learn better
predictions on longer-time scales by adding composite nodes. As a result, our
method outperforms the state-of-the-art in several commonly used datasets.
- Abstract(参考訳): global multi-object tracking (mot) システムは、長いビデオで効果的なオブジェクト追跡を確保するために、インタラクション、オクルージョン、その他の 'visual blur'' シナリオを考慮できる。
中でもグラフベースのトラッキング・バイ・検出パラダイムは驚くべきパフォーマンスを実現している。
しかし、その完全接続性は、長いビデオを扱うアルゴリズムに挑戦するストレージ空間要件をもたらす。
現在、一般的に使用される手法は、フレームにまたがって一方向の関連を構築することによって、まだ生成される軌道である。
一階類似情報の指導のもとに作成されたこのようなマッチは、長期的な観点からは最適ではない。
さらに、それらはしばしばミスマッチを修正するエンドツーエンドのスキームを欠いている。
本稿では,超長フレーム情報を関連付けるためのマルチシーン汎用フレームワークである複合ノードメッセージパッシングネットワーク(CoNo-Link)を提案する。
CoNo-Linkのソリューションは制約付き連結グラフを構築するための低ストレージオーバーヘッド手法である。
オブジェクトをノードとして扱う従来の方法に加えて、情報インタラクションのためのノードとしてオブジェクトトラジェクトリを革新的に扱うことにより、グラフニューラルネットワークの特徴表現能力が改善されている。
具体的には、いくつかの信頼できるオブジェクトや軌跡に対するトップk選択タスクとしてグラフ構築問題を定式化する。
我々のモデルは複合ノードを追加することで、より長いスケールでより良い予測を学べる。
その結果,本手法はいくつかの一般的なデータセットにおいて最先端の手法よりも優れていた。
関連論文リスト
- Learning Long Range Dependencies on Graphs via Random Walks [6.7864586321550595]
メッセージパッシンググラフニューラルネットワーク(GNN)は、局所的な関係を捉えるのに優れているが、グラフの長距離依存に苦慮している。
グラフ変換器(GT)はグローバルな情報交換を可能にするが、グラフを固定長ベクトルの集合として表現することでグラフ構造を単純化することが多い。
この研究は、ランダムウォークの長距離情報とローカルメッセージパッシングを組み合わせることによって、両方のアプローチの欠点を克服する新しいアーキテクチャを導入する。
論文 参考訳(メタデータ) (2024-06-05T15:36:57Z) - ReST: A Reconfigurable Spatial-Temporal Graph Model for Multi-Camera
Multi-Object Tracking [11.619493960418176]
Multi-Camera Multi-Object Tracking (MC-MOT)は、複数のビューからの情報を利用して、閉塞や混み合ったシーンの問題に対処する。
現在のグラフベースの手法では、空間的および時間的整合性に関する情報を効果的に利用しない。
本稿では,まず,検出対象を空間的に関連づけて時間グラフに再構成する,新しい再構成可能なグラフモデルを提案する。
論文 参考訳(メタデータ) (2023-08-25T08:02:04Z) - Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast
Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。
このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。
我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文 参考訳(メタデータ) (2023-06-07T17:57:45Z) - Learnable Graph Matching: A Practical Paradigm for Data Association [74.28753343714858]
これらの問題に対処するための一般的な学習可能なグラフマッチング法を提案する。
提案手法は,複数のMOTデータセット上での最先端性能を実現する。
画像マッチングでは,一般的な屋内データセットであるScanNetで最先端の手法より優れている。
論文 参考訳(メタデータ) (2023-03-27T17:39:00Z) - Unifying Short and Long-Term Tracking with Graph Hierarchies [0.0]
統合されたスケーラブルなマルチオブジェクトトラッカーであるSUSHIを紹介する。
我々のアプローチは、長いクリップをサブクリップの階層に分割することで処理し、高いスケーラビリティを実現する。
グラフニューラルネットワークを活用して階層のすべてのレベルを処理します。
論文 参考訳(メタデータ) (2022-12-06T15:12:53Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - TrackMPNN: A Message Passing Graph Neural Architecture for Multi-Object
Tracking [8.791710193028903]
本研究は,グラフに基づくデータ構造を用いて問題をモデル化する多目的追跡(MOT)への多くの従来のアプローチに従う。
複数のタイムステップにまたがるデータ関連問題を表す動的無方向性グラフに基づくフレームワークを作成する。
また、メモリ効率が高く、リアルタイムなオンラインアルゴリズムを作成するために対処する必要がある計算問題に対するソリューションと提案も提供します。
論文 参考訳(メタデータ) (2021-01-11T21:52:25Z) - GCNNMatch: Graph Convolutional Neural Networks for Multi-Object Tracking
via Sinkhorn Normalization [5.705895203925818]
本稿では、グラフ畳み込みニューラルネットワーク(GCNN)に基づく特徴抽出と、オブジェクトアソシエーションのためのエンドツーエンド特徴マッチングを用いた、オンライン多目的追跡(MOT)のための新しい手法を提案する。
グラフベースのアプローチでは、過去のフレームのオブジェクトの外観と幾何学だけでなく、現在のフレームも特徴学習のタスクに組み込まれている。
論文 参考訳(メタデータ) (2020-09-30T19:18:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。