論文の概要: SOTVerse: A User-defined Task Space of Single Object Tracking
- arxiv url: http://arxiv.org/abs/2204.07414v1
- Date: Fri, 15 Apr 2022 10:31:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 11:38:53.831318
- Title: SOTVerse: A User-defined Task Space of Single Object Tracking
- Title(参考訳): SOTVerse: 単一オブジェクト追跡のユーザ定義タスク空間
- Authors: Shiyu Hu, Xin Zhao, Kaiqi Huang
- Abstract要約: シングルオブジェクトトラッキング(SOT)研究はサイクルに陥る - トラッカーはほとんどのベンチマークでうまく機能するが、挑戦的なシナリオではすぐに失敗する。
タスクを3つのコンポーネント(環境,評価,実行子)で記述し,1256万フレームのSOTVerseを構築するための3Eパラダイムを提案する。
SOTVerseは自動的にフレームごとに挑戦的な要素をラベル付けし、ユーザが定義した空間を効率的に生成できるようにする。
- 参考スコア(独自算出の注目度): 45.43935674831749
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single object tracking (SOT) research falls into a cycle - trackers perform
well on most benchmarks but quickly fail in challenging scenarios, causing
researchers to doubt the insufficient data content and take more effort
constructing larger datasets with more challenging situations. However,
isolated experimental environments and limited evaluation methods more
seriously hinder the SOT research. The former causes existing datasets can not
be exploited comprehensively, while the latter neglects challenging factors in
the evaluation process. In this article, we systematize the representative
benchmarks and form a single object tracking metaverse (SOTVerse) - a
user-defined SOT task space to break through the bottleneck. We first propose a
3E Paradigm to describe tasks by three components (i.e., environment,
evaluation, and executor). Then, we summarize task characteristics, clarify the
organization standards, and construct SOTVerse with 12.56 million frames.
Specifically, SOTVerse automatically labels challenging factors per frame,
allowing users to generate user-defined spaces efficiently via construction
rules. Besides, SOTVerse provides two mechanisms with new indicators and
successfully evaluates trackers under various subtasks. Consequently, SOTVerse
firstly provides a strategy to improve resource utilization in the computer
vision area, making research more standardized and scientific. The SOTVerse,
toolkit, evaluation server, and results are available at
http://metaverse.aitestunion.com.
- Abstract(参考訳): 単一オブジェクトトラッキング(sot)の研究は、ほとんどのベンチマークでうまく機能するが、挑戦的なシナリオではすぐに失敗し、研究者はデータコンテンツの不足を疑い、より困難な状況でより大きなデータセットを構築するのにより多くの労力を費やすことになる。
しかし、孤立した実験環境と限られた評価方法がSOT研究を妨げている。
前者は既存のデータセットを総合的に利用できないが、後者は評価プロセスにおいて困難な要素を無視している。
本稿では、代表ベンチマークを体系化し、ボトルネックを突破するためにユーザ定義のSOTタスク空間である単一オブジェクト追跡メタバース(SOTVerse)を形成する。
まず,3つのコンポーネント(環境,評価,実行者)でタスクを記述する3Eパラダイムを提案する。
次に,タスクの特徴を要約し,組織基準を明確にし,1256万フレームのSOTVerseを構築した。
具体的には、SOTVerseは、フレーム毎に挑戦的な要素を自動的にラベル付けし、ユーザが構築ルールを通じて効率的にユーザ定義空間を生成することができる。
さらに、SOTVerseは新しい指標を持つ2つのメカニズムを提供し、様々なサブタスク下でトラッカーをうまく評価する。
その結果、SOTVerseはまず、コンピュータビジョン領域における資源利用を改善する戦略を提供し、研究をより標準化し科学的にする。
sotverse, toolkit, evaluation server, and resultsはhttp://metaverse.aitestunion.comで入手できる。
関連論文リスト
- DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Frequency-based Matcher for Long-tailed Semantic Segmentation [22.199174076366003]
我々は、比較的未探索なタスク設定、長い尾のセマンティックセマンティックセグメンテーション(LTSS)に焦点を当てる。
本稿では,セマンティックセグメンテーション手法と長鎖解の性能を示すために,二値評価システムを提案し,LTSSベンチマークを構築した。
また,1対1のマッチングによって過剰な圧縮問題を解決する周波数ベースのマーカであるLTSSを改善するトランスフォーマーベースのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-06T09:57:56Z) - Look, Listen, and Answer: Overcoming Biases for Audio-Visual Question Answering [25.577314828249897]
本稿では,公開データセット(MUSIC-AVQA)のテストスプリット内での質問の表現と,分割された質問に対する分散シフトの導入という,2つのステップで構築された新しいデータセットMUSIC-AVQA-Rを提案する。
実験の結果、このアーキテクチャはMUSIC-AVQA-Rの最先端性能を実現し、特に9.32%の大幅な改善が得られた。
論文 参考訳(メタデータ) (2024-04-18T09:16:02Z) - M3SOT: Multi-frame, Multi-field, Multi-space 3D Single Object Tracking [41.716532647616134]
3D Single Object Tracking (SOT)はコンピュータビジョンの最前線のタスクであり、自動運転のようなアプリケーションに不可欠なことを証明している。
本研究では、複数の入力フレーム(テンプレート集合)、複数の受容場(連続コンテキスト)、複数の解空間(離散タスク)をONEモデルで相乗化する新しい3D SOTフレームワークであるM3SOTを紹介する。
論文 参考訳(メタデータ) (2023-12-11T04:49:47Z) - End-to-end Tracking with a Multi-query Transformer [96.13468602635082]
マルチオブジェクトトラッキング(MOT)は、時間とともにシーン内のオブジェクトの位置、外観、アイデンティティを同時に推論する必要がある課題である。
本研究の目的は、トラッキング・バイ・ディテクト・アプローチを超えて、未知のオブジェクト・クラスに対してもよく機能するクラスに依存しないトラッキングへと移行することである。
論文 参考訳(メタデータ) (2022-10-26T10:19:37Z) - Multitask Network for Joint Object Detection, Semantic Segmentation and
Human Pose Estimation in Vehicle Occupancy Monitoring [0.0]
マルチタスク検出, ニューラルポーズと推定ネットワーク(DSPM)
我々は,マルチタスク検出,ニューラル・ポーズ・アンド・アセスメント・ネットワーク(DSPM)を提案する。
私たちのアーキテクチャは、単純なエンドツーエンドのトレーニングで、3つのタスクの柔軟な組み合わせを可能にします。
本研究では,公開データセットSVIROとTiCaMの総合評価を行い,優れた性能を示す。
論文 参考訳(メタデータ) (2022-05-03T14:11:18Z) - Unified Transformer Tracker for Object Tracking [58.65901124158068]
異なるシナリオにおけるトラッキング問題に1つのパラダイムで対処するために,UTT(Unified Transformer Tracker)を提案する。
SOT(Single Object Tracking)とMOT(Multiple Object Tracking)の両方を対象とするトラックトランスフォーマーを開発した。
論文 参考訳(メタデータ) (2022-03-29T01:38:49Z) - Benchmarking Off-The-Shelf Solutions to Robotic Assembly Tasks [9.125933436783681]
最新のパフォーマンスのベースラインとボトルネックの問題が何であるかは、しばしば不明です。
最近導入されたベンチマークであるNational Institute of Standards and Technology (NIST) Assembly Task Boardsで、オフ・ザ・シェルフ(OTS)産業ソリューションを評価します。
論文 参考訳(メタデータ) (2021-03-08T23:46:48Z) - Batch Exploration with Examples for Scalable Robotic Reinforcement
Learning [63.552788688544254]
BEE(Batch Exploration with Examples)は、重要状態の画像の少ない数の人間がガイドする状態空間の関連領域を探索する。
BEEは、シミュレーションと本物のフランカロボットの両方で、視覚ベースの操作に挑戦することができる。
論文 参考訳(メタデータ) (2020-10-22T17:49:25Z) - Benchmarking Unsupervised Object Representations for Video Sequences [111.81492107649889]
ViMON, OP3, TBA, SCALORの4つのオブジェクト中心アプローチの知覚能力を比較した。
この結果から,制約のない潜在表現を持つアーキテクチャは,オブジェクト検出やセグメンテーション,トラッキングといった観点から,より強力な表現を学習できる可能性が示唆された。
我々のベンチマークは、より堅牢なオブジェクト中心のビデオ表現を学習するための実りあるガイダンスを提供するかもしれない。
論文 参考訳(メタデータ) (2020-06-12T09:37:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。