論文の概要: What Are Expected Queries in End-to-End Object Detection?
- arxiv url: http://arxiv.org/abs/2206.01232v1
- Date: Thu, 2 Jun 2022 18:15:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-06 13:59:11.574385
- Title: What Are Expected Queries in End-to-End Object Detection?
- Title(参考訳): エンドツーエンドオブジェクト検出で期待できるクエリは何か?
- Authors: Shilong Zhang, Xinjiang Wang, Jiaqi Wang, Jiangmiao Pang and Kai Chen
- Abstract要約: 提案するクエリは COCO Distinct Queries (DDQ) でなければならない。
DDQはより強く、より堅牢で、従来の方法よりも早く収束する。
MSarity検出データセットでは、12エポックしか持たない44.5 APが得られている。
- 参考スコア(独自算出の注目度): 28.393693394478724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end object detection is rapidly progressed after the emergence of
DETR. DETRs use a set of sparse queries that replace the dense candidate boxes
in most traditional detectors. In comparison, the sparse queries cannot
guarantee a high recall as dense priors. However, making queries dense is not
trivial in current frameworks. It not only suffers from heavy computational
cost but also difficult optimization. As both sparse and dense queries are
imperfect, then \emph{what are expected queries in end-to-end object
detection}? This paper shows that the expected queries should be Dense Distinct
Queries (DDQ). Concretely, we introduce dense priors back to the framework to
generate dense queries. A duplicate query removal pre-process is applied to
these queries so that they are distinguishable from each other. The dense
distinct queries are then iteratively processed to obtain final sparse outputs.
We show that DDQ is stronger, more robust, and converges faster. It obtains
44.5 AP on the MS COCO detection dataset with only 12 epochs. DDQ is also
robust as it outperforms previous methods on both object detection and instance
segmentation tasks on various datasets. DDQ blends advantages from traditional
dense priors and recent end-to-end detectors. We hope it can serve as a new
baseline and inspires researchers to revisit the complementarity between
traditional methods and end-to-end detectors. The source code is publicly
available at \url{https://github.com/jshilong/DDQ}.
- Abstract(参考訳): DETRの出現後、エンドツーエンドのオブジェクト検出が急速に進行する。
detrは、多くの従来の検出器の濃密な候補ボックスを置き換える、スパースクエリのセットを使用する。
比較として、スパースクエリは、密度の高いプリエントとして高いリコールを保証することができない。
しかし、現在のフレームワークではクエリを密集させることは簡単ではない。
計算コストが大きいだけでなく、最適化も難しい。
スパースクエリと密接なクエリの両方が不完全であるので、\emph{end-to-endオブジェクト検出で期待クエリは何か?
本稿では,Dense Distinct Queries (DDQ) が期待されるクエリであることを示す。
具体的には、濃密なクエリを生成するために、フレームワークに濃密なプリエントを導入する。
これらのクエリには、重複したクエリ削除前プロセスを適用することで、互いに区別することができる。
密接な異なるクエリは、最後にスパース出力を得るために反復的に処理される。
DDQはより強く、より堅牢で、より早く収束することを示す。
MS COCO検出データセットでは、12エポックで44.5 APを得る。
ddqはまた、さまざまなデータセット上のオブジェクト検出とインスタンスセグメンテーションタスクの両方の以前のメソッドを上回っているため、堅牢である。
DDQは従来の高密度な先行と最近のエンドツーエンド検出器の利点をブレンドする。
新しいベースラインとして機能し、研究者に従来の方法とエンドツーエンド検出器の相補性を再検討するよう促すことを期待しています。
ソースコードは \url{https://github.com/jshilong/DDQ} で公開されている。
関連論文リスト
- Group Testing for Accurate and Efficient Range-Based Near Neighbor Search for Plagiarism Detection [2.3814052021083354]
本研究は, 近接探索問題に対する適応型群検定フレームワークを提案する。
本研究では,データベース内の各項目を問合せ点の隣人あるいは非隣人として,余剰距離閾値に基づいて効率よくマークする。
本研究では,ソフトマックスに基づく特徴量を用いて,完全探索よりも10倍以上の高速化を実現し,精度を損なわないことを示す。
論文 参考訳(メタデータ) (2023-11-05T06:12:03Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z) - Dense Distinct Query for End-to-End Object Detection [39.32011383066249]
オブジェクト検出における1対1の割り当ては、非最大抑制の必要性を回避した。
本稿では,Dense Distinct Queries (DDQ) の解法について述べる。
DDQは従来のエンドツーエンド検出器と最近のエンド・ツー・エンド検出器の利点をブレンドし、様々な検出器の性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-03-22T17:42:22Z) - CQE in OWL 2 QL: A "Longest Honeymoon" Approach (extended version) [13.169982133542266]
動的CQE法,すなわち,従来のクエリの評価に基づいて,現在のクエリに対する応答を変更することを提案する。
我々は、機密データを保護できるだけでなく、最大限に協力できるシステムを目指しています。
論文 参考訳(メタデータ) (2022-07-22T15:51:15Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Anchor DETR: Query Design for Transformer-Based Detector [24.925317590675203]
本稿では,トランスを用いた新しいクエリ設計を提案する。
オブジェクトクエリはアンカーポイントに基づいており、CNNベースの検出器で広く使われている。
我々の設計では「一つの領域、複数のオブジェクト」という難題を解決するために、一つの位置で複数のオブジェクトを予測できる。
論文 参考訳(メタデータ) (2021-09-15T06:31:55Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - The Sparse Vector Technique, Revisited [67.57692396665915]
我々は、微分プライバシーの文献において最も基礎的で広く適用可能なテクニックの1つを再考する。
この単純なアルゴリズムは、データベース上のあるクエリの値が、私たちが期待している値に近いかどうかをプライベートにテストします。
一つの個人が過剰なクエリの回答に寄与しない限り、クエリのテストを継続できる代替の、等しくシンプルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:50:52Z) - Progressively Pretrained Dense Corpus Index for Open-Domain Question
Answering [87.32442219333046]
本稿では,段落エンコーダを事前学習するための簡易かつ資源効率の高い手法を提案する。
本手法は,事前学習に7倍の計算資源を使用する既存の高密度検索法より優れている。
論文 参考訳(メタデータ) (2020-04-30T18:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。