論文の概要: Unified People Tracking with Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2507.08494v1
- Date: Fri, 11 Jul 2025 11:17:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-14 18:03:54.336061
- Title: Unified People Tracking with Graph Neural Networks
- Title(参考訳): グラフニューラルネットワークによる一元的人物追跡
- Authors: Martin Engilberge, Ivan Vrkic, Friedrich Wilke Grosche, Julien Pilet, Engin Turetken, Pascal Fua,
- Abstract要約: 我々は、検出を軌跡に関連付けることを学ぶ多人数追跡のための統一的で完全に差別化可能なモデルを提案する。
モデルは動的グラフを構築し、空間的、文脈的、時間的情報を集約する。
また,25の重なり合うビュー,詳細なシーン再構築,広範囲なオクルージョンを備えた新しいスケールデータセットも導入した。
- 参考スコア(独自算出の注目度): 39.22185669123208
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents a unified, fully differentiable model for multi-people tracking that learns to associate detections into trajectories without relying on pre-computed tracklets. The model builds a dynamic spatiotemporal graph that aggregates spatial, contextual, and temporal information, enabling seamless information propagation across entire sequences. To improve occlusion handling, the graph can also encode scene-specific information. We also introduce a new large-scale dataset with 25 partially overlapping views, detailed scene reconstructions, and extensive occlusions. Experiments show the model achieves state-of-the-art performance on public benchmarks and the new dataset, with flexibility across diverse conditions. Both the dataset and approach will be publicly released to advance research in multi-people tracking.
- Abstract(参考訳): この研究は、事前計算されたトラックレットに頼ることなく、検出を軌跡に関連付けることを学ぶマルチパーソン追跡のための統一的で完全な微分可能なモデルを示す。
モデルは動的時空間グラフを構築し、空間的、文脈的、時間的情報を集約し、シーケンス全体にわたってシームレスな情報伝達を可能にする。
閉塞処理を改善するために、グラフはシーン固有の情報をエンコードすることもできる。
また,25の重なり合うビュー,詳細なシーン再構築,広範囲なオクルージョンを含む大規模データセットも導入した。
実験により、モデルは様々な条件にまたがって柔軟性を持って、公開ベンチマークと新しいデータセット上で最先端のパフォーマンスを達成することが示された。
データセットとアプローチの両方が公開され、マルチパーソントラッキングの研究が進められる。
関連論文リスト
- TempoKGAT: A Novel Graph Attention Network Approach for Temporal Graph Analysis [3.5707423185282656]
本稿では,時間遅延重みと空間領域上の選択的な隣接集約機構を組み合わせた新しいタイプのグラフアテンションネットワークであるTempoKGATを提案する。
我々は、時間的データを含む交通、エネルギー、健康セクターから複数のデータセットに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-08-29T09:54:46Z) - Interactive dense pixel visualizations for time series and model attribution explanations [8.24039921933289]
DAVOTSは、生の時系列データ、ニューラルネットワークのアクティベーション、高密度ピクセル可視化における属性を探索する、インタラクティブなビジュアル分析アプローチである。
可視化されたデータドメインにクラスタリングアプローチを適用し、グループをハイライトし、個々のデータ探索と組み合わせたデータ探索のための順序付け戦略を示す。
論文 参考訳(メタデータ) (2024-08-27T14:02:21Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - Multi-Scene Generalized Trajectory Global Graph Solver with Composite
Nodes for Multiple Object Tracking [61.69892497726235]
複合ノードメッセージパッシングネットワーク(CoNo-Link)は、超長いフレーム情報を関連付けるためのフレームワークである。
オブジェクトをノードとして扱う従来の方法に加えて、このネットワークは情報インタラクションのためのノードとしてオブジェクトトラジェクトリを革新的に扱う。
我々のモデルは、合成ノードを追加することで、より長い時間スケールでより良い予測を学習することができる。
論文 参考訳(メタデータ) (2023-12-14T14:00:30Z) - ReST: A Reconfigurable Spatial-Temporal Graph Model for Multi-Camera
Multi-Object Tracking [11.619493960418176]
Multi-Camera Multi-Object Tracking (MC-MOT)は、複数のビューからの情報を利用して、閉塞や混み合ったシーンの問題に対処する。
現在のグラフベースの手法では、空間的および時間的整合性に関する情報を効果的に利用しない。
本稿では,まず,検出対象を空間的に関連づけて時間グラフに再構成する,新しい再構成可能なグラフモデルを提案する。
論文 参考訳(メタデータ) (2023-08-25T08:02:04Z) - Local-Global Information Interaction Debiasing for Dynamic Scene Graph
Generation [51.92419880088668]
マルチタスク学習に基づく新しいDynSGGモデルDynSGG-MTLを提案する。
長期的人間の行動は、大域的な制約に適合する複数のシーングラフを生成するためにモデルを監督し、尾の述語を学べないモデルを避ける。
論文 参考訳(メタデータ) (2023-08-10T01:24:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。