論文の概要: Heatmap-based Object Detection and Tracking with a Fully Convolutional
Neural Network
- arxiv url: http://arxiv.org/abs/2101.03541v1
- Date: Sun, 10 Jan 2021 13:13:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 08:25:57.358325
- Title: Heatmap-based Object Detection and Tracking with a Fully Convolutional
Neural Network
- Title(参考訳): 完全畳み込みニューラルネットワークによる熱マップに基づく物体検出と追跡
- Authors: Fabian Amherd, Elias Rodriguez
- Abstract要約: 本稿では,人工知能の分野について概観する。
本論文の核心は,物体の検出と追跡のためのアルゴリズムの実践的実装である。
高速に動く物体を検知し追跡する能力は、自動運転のような人工知能のさまざまな応用に不可欠である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The main topic of this paper is a brief overview of the field of Artificial
Intelligence. The core of this paper is a practical implementation of an
algorithm for object detection and tracking. The ability to detect and track
fast-moving objects is crucial for various applications of Artificial
Intelligence like autonomous driving, ball tracking in sports, robotics or
object counting. As part of this paper the Fully Convolutional Neural Network
"CueNet" was developed. It detects and tracks the cueball on a labyrinth game
robustly and reliably. While CueNet V1 has a single input image, the approach
with CueNet V2 was to take three consecutive 240 x 180-pixel images as an input
and transform them into a probability heatmap for the cueball's location. The
network was tested with a separate video that contained all sorts of
distractions to test its robustness. When confronted with our testing data,
CueNet V1 predicted the correct cueball location in 99.6% of all frames, while
CueNet V2 had 99.8% accuracy.
- Abstract(参考訳): 本稿では,人工知能の分野を概観する。
本稿では,オブジェクト検出と追跡のためのアルゴリズムの実践的実装について述べる。
高速に動く物体を検知し追跡する能力は、自動運転、スポーツにおけるボールトラッキング、ロボット工学、オブジェクトカウントなど、さまざまな人工知能の応用に不可欠である。
本論文では,完全畳み込みニューラルネットワークCueNetを開発した。
ラビリンスゲームのキューボールをロバストかつ確実に検出および追跡する。
CueNet V1は単一の入力画像を持つが、CueNet V2のアプローチは3つの240 x 180ピクセルの画像を入力として取り、それらをキューボールの位置の確率ヒートマップに変換することである。
ネットワークは別のビデオでテストされ、堅牢性をテストするためにあらゆる種類の注意をそらした。
テストデータと向き合うと、CueNet V1はすべてのフレームの99.6%で正しいキューボールの位置を予測し、CueNet V2は99.8%の精度を示した。
関連論文リスト
- Joint Neural Networks for One-shot Object Recognition and Detection [5.389851588398047]
本稿では,一発物体の認識と検出に難渋する課題に対処する,新しい結合ニューラルネットワーク手法を提案する。
Siameseのニューラルネットワークと最先端のマルチボックス検出アプローチにインスパイアされたジョイントニューラルネットワークは、トレーニングプロセス中に見つからないカテゴリのオブジェクト認識と検出を行うことができる。
提案手法は,MiniImageNetデータセット上での1ショットオブジェクト認識における61.41%の精度と,データセット上でトレーニングしてテストした場合の1ショットオブジェクト検出における47.1%のmAPを実現する。
論文 参考訳(メタデータ) (2024-08-01T16:48:03Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - FenceNet: Fine-grained Footwork Recognition in Fencing [84.19619219240859]
FenceNetは、フェンシングにおけるきめ細かいフットワークテクニックの分類を自動化する新しいアーキテクチャである。
入力として2Dポーズデータを取り込み、スケルトンベースのアクション認識アプローチを使用してアクションを分類する。
10倍のクロスバリデーションで85.4%の精度を達成し、各フェンスをテストセットとして残す。
論文 参考訳(メタデータ) (2022-04-20T12:54:31Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Detecting AutoAttack Perturbations in the Frequency Domain [18.91242463856906]
AutoAttackフレームワークによる画像分類ネットワークに対する敵対的な攻撃は、多くの注目を集めている。
本稿では,AutoAttackの空間及び周波数領域特性について検討し,代替防衛法を提案する。
ネットワークを強固にする代わりに、推論中の敵攻撃を検出し、操作された入力を拒否する。
論文 参考訳(メタデータ) (2021-11-16T21:20:37Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Single Object Tracking through a Fast and Effective Single-Multiple
Model Convolutional Neural Network [0.0]
最近の最先端の(SOTA)アプローチは、エリア内の他のオブジェクトとターゲットを区別するために重い構造を持つマッチングネットワークを取ることに基づいて提案されています。
本稿では,これまでのアプローチとは対照的に,一つのショットで物体の位置を識別できる特殊なアーキテクチャを提案する。
提示されたトラッカーは、1080tiで最大120 fps$の超高速で、挑戦的な状況でsomaと比較してパフォーマンスする。
論文 参考訳(メタデータ) (2021-03-28T11:02:14Z) - Towards Autonomous Driving: a Multi-Modal 360$^{\circ}$ Perception
Proposal [87.11988786121447]
本稿では,自動運転車の3次元物体検出と追跡のためのフレームワークを提案する。
このソリューションは、新しいセンサ融合構成に基づいて、正確で信頼性の高い道路環境検出を提供する。
自動運転車に搭載されたシステムの様々なテストは、提案された知覚スタックの適合性を評価することに成功している。
論文 参考訳(メタデータ) (2020-08-21T20:36:21Z) - TTNet: Real-time temporal and spatial video analysis of table tennis [5.156484100374058]
本稿では,高精細度卓球ビデオのリアルタイム処理を目的としたニューラルネットワークを提案する。
このアプローチは、自動参照システムによるスコア更新を推論するためのコア情報を提供する。
イベントをラベル付けした120fpsのテーブルテニスゲームのビデオ付きマルチタスクデータセットOpenTTGamesを公開している。
論文 参考訳(メタデータ) (2020-04-21T11:57:51Z) - R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。
我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文 参考訳(メタデータ) (2016-05-20T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。