論文の概要: How many Observations are Enough? Knowledge Distillation for Trajectory
Forecasting
- arxiv url: http://arxiv.org/abs/2203.04781v1
- Date: Wed, 9 Mar 2022 15:05:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 14:22:07.380756
- Title: How many Observations are Enough? Knowledge Distillation for Trajectory
Forecasting
- Title(参考訳): どれくらいの観測が十分か?
軌跡予測のための知識蒸留
- Authors: Alessio Monti, Angelo Porrello, Simone Calderara, Pasquale Coscia,
Lamberto Ballan, Rita Cucchiara
- Abstract要約: 現在の最先端モデルは、通常、過去の追跡された場所の「歴史」に頼り、将来の位置の妥当なシーケンスを予測する。
我々は,教師ネットワークから学生ネットワークへの知識伝達を可能にする新しい蒸留戦略を考案した。
適切に定義された教師の監督により、学生ネットワークが最先端のアプローチと相容れないように実行できることが示される。
- 参考スコア(独自算出の注目度): 31.57539055861249
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate prediction of future human positions is an essential task for modern
video-surveillance systems. Current state-of-the-art models usually rely on a
"history" of past tracked locations (e.g., 3 to 5 seconds) to predict a
plausible sequence of future locations (e.g., up to the next 5 seconds). We
feel that this common schema neglects critical traits of realistic
applications: as the collection of input trajectories involves machine
perception (i.e., detection and tracking), incorrect detection and
fragmentation errors may accumulate in crowded scenes, leading to tracking
drifts. On this account, the model would be fed with corrupted and noisy input
data, thus fatally affecting its prediction performance.
In this regard, we focus on delivering accurate predictions when only few
input observations are used, thus potentially lowering the risks associated
with automatic perception. To this end, we conceive a novel distillation
strategy that allows a knowledge transfer from a teacher network to a student
one, the latter fed with fewer observations (just two ones). We show that a
properly defined teacher supervision allows a student network to perform
comparably to state-of-the-art approaches that demand more observations.
Besides, extensive experiments on common trajectory forecasting datasets
highlight that our student network better generalizes to unseen scenarios.
- Abstract(参考訳): 将来の人間の位置の正確な予測は、現代のビデオ監視システムにとって重要な課題である。
現在の最先端モデルは、通常、過去の追跡された場所(例えば3秒から5秒)の「歴史」に頼り、将来の位置(例えば、次の5秒まで)を予測できる。
この一般的なスキーマは現実的なアプリケーションの重要な特徴を無視していると感じている。入力軌跡の収集には機械の認識(検出と追跡)が含まれるため、誤った検出と断片化エラーが混み合ったシーンに蓄積され、ドリフトを追跡する。
この説明では、このモデルは腐敗したノイズの入力データによって供給されるため、予測性能に致命的な影響を及ぼす。
この点において、入力観察が少ない場合に正確な予測を行うことに注力し、自動認識に伴うリスクを低減させる可能性がある。
そこで,我々は,教師ネットワークから生徒への知識伝達を可能にする新たな蒸留戦略を考案する。
教師の監督によって、生徒ネットワークは、より多くの観察を必要とする最先端のアプローチと相性が良い結果が得られることを示す。
さらに、一般的な軌道予測データセットに関する広範な実験は、我々の学生ネットワークが目に見えないシナリオにより一般化することを強調している。
関連論文リスト
- Learning 3D Perception from Others' Predictions [64.09115694891679]
本研究では,3次元物体検出装置を構築するための新たなシナリオについて検討する。
例えば、自動運転車が新しいエリアに入ると、その領域に最適化された検出器を持つ他の交通参加者から学ぶことができる。
論文 参考訳(メタデータ) (2024-10-03T16:31:28Z) - EANet: Expert Attention Network for Online Trajectory Prediction [5.600280639034753]
Expert Attention Networkは、軌道予測のための完全なオンライン学習フレームワークである。
我々は,ネットワーク層の深さの異なる重みを調整し,勾配問題によるモデル更新が遅いことを回避し,専門家の注意を喚起する。
さらに,シナリオ変化に敏感な短期動作トレンドカーネル関数を提案する。
論文 参考訳(メタデータ) (2023-09-11T07:09:40Z) - Prior Knowledge Guided Network for Video Anomaly Detection [1.389970629097429]
ビデオ異常検出(VAD)は、ビデオ内の異常事象を検出する。
VADタスクのための事前知識誘導ネットワーク(PKG-Net)を提案する。
論文 参考訳(メタデータ) (2023-09-04T15:57:07Z) - Implicit Occupancy Flow Fields for Perception and Prediction in
Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。
既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。
これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文 参考訳(メタデータ) (2023-08-02T23:39:24Z) - Self-SuperFlow: Self-supervised Scene Flow Prediction in Stereo
Sequences [12.650574326251023]
本稿では,シーンフロー予測のための自己監督型損失の拡張について検討する。
KITTIのシーンフローベンチマークでは,本手法は同一ネットワークの教師付き事前学習よりも優れていた。
論文 参考訳(メタデータ) (2022-06-30T13:55:17Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - Attentional-GCNN: Adaptive Pedestrian Trajectory Prediction towards
Generic Autonomous Vehicle Use Cases [10.41902340952981]
本稿では,グラフのエッジに注目重みを割り当てることで,歩行者間の暗黙的相互作用に関する情報を集約する,GCNNに基づく新しいアプローチであるAttentional-GCNNを提案する。
提案手法は,10%平均変位誤差 (ADE) と12%最終変位誤差 (FDE) を高速な推論速度で向上することを示す。
論文 参考訳(メタデータ) (2020-11-23T03:13:26Z) - Predicting MOOCs Dropout Using Only Two Easily Obtainable Features from
the First Week's Activities [56.1344233010643]
いくつかの特徴は、学習者の誘惑や興味の欠如に寄与すると考えられており、そのことが解脱や総減退につながる可能性がある。
この研究は、いくつかの機械学習アプローチを比較して、最初の1週間から早期のドロップアウトを予測することを目的としている。
論文 参考訳(メタデータ) (2020-08-12T10:44:49Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z) - Value-driven Hindsight Modelling [68.658900923595]
値推定は強化学習(RL)パラダイムの重要な構成要素である。
モデル学習は、観測系列に存在する豊富な遷移構造を利用することができるが、このアプローチは通常、報酬関数に敏感ではない。
この2つの極点の間に位置するRLにおける表現学習のアプローチを開発する。
これにより、タスクに直接関連し、値関数の学習を加速できる、抽出可能な予測ターゲットが提供される。
論文 参考訳(メタデータ) (2020-02-19T18:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。