論文の概要: Long-Lived Accurate Keypoints in Event Streams
- arxiv url: http://arxiv.org/abs/2209.10385v1
- Date: Wed, 21 Sep 2022 14:25:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 16:35:00.892760
- Title: Long-Lived Accurate Keypoints in Event Streams
- Title(参考訳): イベントストリームにおける長時間の正確なキーポイント
- Authors: Philippe Chiberre, Etienne Perot, Amos Sironi and Vincent Lepetit
- Abstract要約: イベントストリームにおけるキーポイントの検出とトラッキングに対する,新たなエンドツーエンドアプローチを提案する。
その結果,従来の最先端手法の3倍近い精度のキーポイントトラックが得られた。
- 参考スコア(独自算出の注目度): 28.892653505044425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel end-to-end approach to keypoint detection and tracking in
an event stream that provides better precision and much longer keypoint tracks
than previous methods. This is made possible by two contributions working
together.
First, we propose a simple procedure to generate stable keypoint labels,
which we use to train a recurrent architecture. This training data results in
detections that are very consistent over time.
Moreover, we observe that previous methods for keypoint detection work on a
representation (such as the time surface) that integrates events over a period
of time. Since this integration is required, we claim it is better to predict
the keypoints' trajectories for the time period rather than single locations,
as done in previous approaches. We predict these trajectories in the form of a
series of heatmaps for the integration time period. This improves the keypoint
localization.
Our architecture can also be kept very simple, which results in very fast
inference times. We demonstrate our approach on the HVGA ATIS Corner dataset as
well as "The Event-Camera Dataset and Simulator" dataset, and show it results
in keypoint tracks that are three times longer and nearly twice as accurate as
the best previous state-of-the-art methods. We believe our approach can be
generalized to other event-based camera problems, and we release our source
code to encourage other authors to explore it.
- Abstract(参考訳): 本稿では,イベントストリームにおけるキーポイント検出と追跡に対する新たなエンドツーエンドアプローチを提案する。
これは、協力して働く2つの貢献によって実現される。
まず,リカレントアーキテクチャのトレーニングに使用する安定なキーポイントラベルを生成するための簡単な手順を提案する。
このトレーニングデータは、時間とともに非常に一貫した検出をもたらす。
さらに,従来のキーポイント検出手法は,ある期間にわたってイベントを統合する表現(時間表面など)に作用することを示した。
この統合が必要なので、従来のアプローチのように、単一の場所よりも、キーポイントの軌道を時間的に予測した方がよいと我々は主張する。
我々はこれらの軌道を積分時間に対する一連の熱マップの形で予測する。
これによりキーポイントのローカライズが向上する。
私たちのアーキテクチャは、非常にシンプルに保たれるので、非常に高速な推論時間になります。
我々は,HVGA ATIS Cornerデータセットと"The Event-Camera Dataset and Simulator"データセットに対するアプローチを実証し,従来の最先端手法の3倍の精度でキーポイントトラックが得られたことを示す。
当社のアプローチは他のイベントベースのカメラ問題に一般化できると考えています。
関連論文リスト
- Dense Optical Tracking: Connecting the Dots [82.79642869586587]
DOTは、ビデオにおけるポイントトラッキングの問題を解決するための、新しくてシンプルで効率的な方法である。
OmniMotionのような高度な"ユニバーサルトラッカー"を上回り、CoTrackerのような最良のポイントトラッキングアルゴリズムと同等か、あるいはそれ以上の精度で、DOTが現在の光フロー技術よりもはるかに正確であることを示す。
論文 参考訳(メタデータ) (2023-12-01T18:59:59Z) - TAPIR: Tracking Any Point with per-frame Initialization and temporal
Refinement [64.11385310305612]
本稿では,ビデオシーケンスを通して任意の物理面上の問合せ点を効果的に追跡する,TAP(Tracking Any Point)の新しいモデルを提案する。
提案手法では,(1)他のフレームの問合せ点に対する適切な候補点マッチングを独立に特定するマッチング段階と,(2)局所的相関に基づいてトラジェクトリと問合せの両方を更新する改良段階の2段階を用いる。
結果として得られたモデルは、DAVISにおける平均約20%の絶対平均ジャカード(AJ)改善によって示されるように、TAP-Vidベンチマークにおける大きなマージンで、すべてのベースライン手法を上回ります。
論文 参考訳(メタデータ) (2023-06-14T17:07:51Z) - KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired
True-Range Multilateration [28.96448680048584]
KeyPoint Positioning System (KeyPosS) は、関心点と完全な畳み込みネットワークによって予測されるアンカー点の距離を三角にして正確なランドマーク座標を導出する最初のフレームワークである。
4つのデータセットの実験では、計算オーバーヘッドが最小限であるにもかかわらず、KeyPosSは、解像度の低い設定で既存のメソッドを上回り、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-05-25T19:30:21Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Accurate Grid Keypoint Learning for Efficient Video Prediction [87.71109421608232]
キーポイントベースのビデオ予測手法は、トレーニングやデプロイメントにおいて、かなりの計算資源を消費することができる。
本稿では,長期的効率的な映像予測のための頑健で説明可能な中間キーポイント表現を目的とした,新しいグリッドキーポイント学習フレームワークを設計する。
提案手法は,計算資源の98%以上を節約しつつ,最先端のビデオ予測手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-28T05:04:30Z) - OpenPifPaf: Composite Fields for Semantic Keypoint Detection and
Spatio-Temporal Association [90.39247595214998]
イメージベースの知覚タスクは、例えば、検出、関連付け、セマンティックキーポイントとして定式化することができる。
人間の体は 推定と追跡をする
一つの段階における意味的および時間的キーポイント関連を共同で検出する一般的な枠組みを提案する。
また,本手法は車や動物などのキーポイントのクラスに一般化し,総合的な知覚の枠組みを提供することを示す。
論文 参考訳(メタデータ) (2021-03-03T14:44:14Z) - RetinaTrack: Online Single Stage Joint Detection and Tracking [22.351109024452462]
両タスクがミッションクリティカルな自律運転におけるトラッキング・バイ・検出パラダイムに注目した。
本稿では、一般的な単一ステージのRetinaNetアプローチを改良したRetinaTrackと呼ばれる、概念的にシンプルで効率的な検出と追跡のジョイントモデルを提案する。
論文 参考訳(メタデータ) (2020-03-30T23:46:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。