論文の概要: T-Rex: Counting by Visual Prompting
- arxiv url: http://arxiv.org/abs/2311.13596v1
- Date: Wed, 22 Nov 2023 18:57:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 14:02:55.130968
- Title: T-Rex: Counting by Visual Prompting
- Title(参考訳): T-Rex: Visual Promptingによるカウント
- Authors: Qing Jiang, Feng Li, Tianhe Ren, Shilong Liu, Zhaoyang Zeng, Kent Yu,
Lei Zhang
- Abstract要約: T-Rexは対話型オブジェクトカウントモデルで、まず任意のオブジェクトを検出し、次にカウントするように設計されている。
ユーザは、参照イメージにポイントやボックスをマークすることで、関心のあるオブジェクトを指定することができ、T-Rexは、同じパターンですべてのオブジェクトを検出する。
T-Rexはいくつかのクラスに依存しないカウントベンチマークで最先端のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 19.847227079624716
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce T-Rex, an interactive object counting model designed to first
detect and then count any objects. We formulate object counting as an open-set
object detection task with the integration of visual prompts. Users can specify
the objects of interest by marking points or boxes on a reference image, and
T-Rex then detects all objects with a similar pattern. Guided by the visual
feedback from T-Rex, users can also interactively refine the counting results
by prompting on missing or falsely-detected objects. T-Rex has achieved
state-of-the-art performance on several class-agnostic counting benchmarks. To
further exploit its potential, we established a new counting benchmark
encompassing diverse scenarios and challenges. Both quantitative and
qualitative results show that T-Rex possesses exceptional zero-shot counting
capabilities. We also present various practical application scenarios for
T-Rex, illustrating its potential in the realm of visual prompting.
- Abstract(参考訳): t-rexは対話型オブジェクトカウントモデルで,まず任意のオブジェクトを検出し,その後にカウントするように設計されている。
視覚的プロンプトを統合したオープンセットオブジェクト検出タスクとしてオブジェクトカウントを定式化する。
ユーザは、参照イメージにポイントやボックスをマークすることで、関心のあるオブジェクトを指定することができ、T-Rexは、同じパターンですべてのオブジェクトを検出する。
T-Rexの視覚的フィードバックによってガイドされたユーザは、行方不明または誤検出されたオブジェクトをプッシュすることで、計測結果をインタラクティブに洗練することができる。
T-Rexはいくつかのクラスに依存しないカウントベンチマークで最先端のパフォーマンスを達成した。
その可能性をさらに活用するため,我々は様々なシナリオや課題を包含する新しい計数ベンチマークを確立した。
定量的および定性的な結果は、T-Rexが例外的なゼロショットカウント能力を持っていることを示している。
また,t-rexの様々な実用的応用シナリオを提示し,視覚的プロンプトの領域におけるその可能性を示す。
関連論文リスト
- CountGD: Multi-Modal Open-World Counting [54.88804890463491]
本稿では,画像中のオープン語彙オブジェクトの数値化の一般化と精度の向上を目的とする。
本稿では,最初のオープンワールドカウントモデルであるCountGDを紹介した。
論文 参考訳(メタデータ) (2024-07-05T16:20:48Z) - T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy [19.847227079624716]
T-Rex2は、オープンセットオブジェクト検出のための非常に実用的なモデルである。
対照的な学習を通じて、単一のモデル内でテキストと視覚的なプロンプトを相乗化します。
幅広いシナリオにまたがって、目覚ましいゼロショットオブジェクト検出機能を備えている。
論文 参考訳(メタデータ) (2024-03-21T17:57:03Z) - Zero-Shot Object Counting with Language-Vision Models [50.1159882903028]
クラスに依存しないオブジェクトカウントは、テスト時に任意のクラスのオブジェクトインスタンスをカウントすることを目的としている。
現在の手法では、新しいカテゴリではしばしば利用できない入力として、人間に注釈をつけた模範を必要とする。
テスト期間中にクラス名のみを利用できる新しい設定であるゼロショットオブジェクトカウント(ZSC)を提案する。
論文 参考訳(メタデータ) (2023-09-22T14:48:42Z) - Beyond SOT: Tracking Multiple Generic Objects at Once [141.36900362724975]
ジェネリックオブジェクト追跡(ジェネリックオブジェクト追跡、英: Generic Object Tracking、GOT)は、ビデオの最初のフレームでボックスをバウンディングすることによって指定されたターゲットオブジェクトを追跡する問題である。
大規模GOTベンチマークであるLaGOTを導入し,複数のアノテート対象オブジェクトをシーケンス毎に含む。
提案手法は単一オブジェクトのGOTデータセットに対して高い競合性を実現し,TrackingNet上での新たな技術状態が84.4%の成功率で設定されている。
論文 参考訳(メタデータ) (2022-12-22T17:59:19Z) - Few-shot Object Counting and Detection [25.61294147822642]
我々は、ターゲットオブジェクトクラスのいくつかの例のバウンディングボックスを考慮に入れ、ターゲットクラスのすべてのオブジェクトをカウントし、検出する新しいタスクに取り組む。
このタスクは、数ショットのオブジェクトカウントと同じ監督を共有しますが、オブジェクトのバウンディングボックスと総オブジェクトカウントを出力します。
本稿では,新しい2段階トレーニング戦略と,新しい不確実性に留意した小ショットオブジェクト検出器であるCounting-DETRを紹介する。
論文 参考訳(メタデータ) (2022-07-22T10:09:18Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z) - End-to-End Multi-Object Tracking with Global Response Map [23.755882375664875]
画像シーケンス/映像を入力とし、学習対象の位置と追跡対象を直接出力する、完全にエンドツーエンドのアプローチを提案する。
具体的には,提案した多目的表現戦略により,グローバル応答マップをフレーム上で正確に生成することができる。
MOT16 と MOT17 のベンチマークによる実験結果から,提案したオンライントラッカーは,いくつかのトラッキング指標において最先端の性能を達成した。
論文 参考訳(メタデータ) (2020-07-13T12:30:49Z) - ArTIST: Autoregressive Trajectory Inpainting and Scoring for Tracking [80.02322563402758]
オンラインマルチオブジェクトトラッキング(MOT)フレームワークの中核的なコンポーネントの1つは、既存のトラックレットと新しい検出を関連付けることである。
そこで我々は,トラックレットが自然運動を表す可能性を直接測定することにより,トラックレットの提案を評価する確率論的自己回帰生成モデルを提案する。
論文 参考訳(メタデータ) (2020-04-16T06:43:11Z) - Rethinking Object Detection in Retail Stores [55.359582952686175]
そこで我々はLocountと略される新しいタスク、同時にオブジェクトのローカライゼーションとカウントを提案する。
Locountは、関心のあるオブジェクトのグループをインスタンス数でローカライズするアルゴリズムを必要とする。
大規模オブジェクトのローカライズと数えるデータセットを小売店で収集する。
論文 参考訳(メタデータ) (2020-03-18T14:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。