論文の概要: Sparse MDOD: Training End-to-End Multi-Object Detector without Bipartite
Matching
- arxiv url: http://arxiv.org/abs/2205.08714v1
- Date: Wed, 18 May 2022 04:20:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 13:02:01.908401
- Title: Sparse MDOD: Training End-to-End Multi-Object Detector without Bipartite
Matching
- Title(参考訳): スパースmdd:2部マッチングのないエンドツーエンドマルチオブジェクト検出器のトレーニング
- Authors: Jaeyoung Yoo, Hojun Lee, Seunghyeon Seo, Inseop Chung, Nojun Kwak
- Abstract要約: 最近のエンドツーエンドのマルチオブジェクト検出器は推論パイプラインを単純化する。
これらは検出器の出力から損失を計算するために二部体マッチングを必要とする。
両部マッチングを使わずにエンドツーエンドの多対象検出器を訓練する手法を提案する。
- 参考スコア(独自算出の注目度): 26.19278003378703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent end-to-end multi-object detectors simplify the inference pipeline by
removing the hand-crafted process such as the duplicate bounding box removal
using non-maximum suppression (NMS). However, in the training, they require
bipartite matching to calculate the loss from the output of the detector.
Contrary to the directivity of the end-to-end method, the bipartite matching
makes the training of the end-to-end detector complex, heuristic, and reliant.
In this paper, we aim to propose a method to train the end-to-end multi-object
detector without bipartite matching. To this end, we approach end-to-end
multi-object detection as a density estimation using a mixture model. Our
proposed detector, called Sparse Mixture Density Object Detector (Sparse MDOD)
estimates the distribution of bounding boxes using a mixture model. Sparse MDOD
is trained by minimizing the negative log-likelihood and our proposed
regularization term, maximum component maximization (MCM) loss that prevents
duplicated predictions. During training, no additional procedure such as
bipartite matching is needed, and the loss is directly computed from the
network outputs. Moreover, our Sparse MDOD outperforms the existing detectors
on MS-COCO, a renowned multi-object detection benchmark.
- Abstract(参考訳): 最近のエンドツーエンドのマルチオブジェクト検出器は、非最大抑圧(NMS)を用いた重複境界ボックス除去などの手作りプロセスを取り除くことで、推論パイプラインを単純化している。
しかし、訓練では、検出器の出力から損失を計算するために二部マッチングが必要となる。
エンド・ツー・エンド法の指向性とは対照的に、2部マッチングは、エンド・ツー・エンド検出器の訓練を複雑でヒューリスティックで、依存させる。
本稿では,両部マッチングを伴わないエンドツーエンド多目的検出器の訓練手法を提案する。
この目的のために,混合モデルを用いた密度推定として,エンドツーエンドのマルチオブジェクト検出にアプローチする。
筆者らが提案するSparse Mixture Density Object Detector (Sparse MDOD) は,混合モデルを用いて境界箱の分布を推定する。
Sparse MDOD は正則化項,最大成分最大化(MCM)損失の最小化によって訓練され,重複予測が防止される。
トレーニング中は、二部マッチングのような追加の手順は不要であり、損失はネットワーク出力から直接計算される。
さらに、Sparse MDODは、MS-COCOの既存の検出器よりも優れています。
関連論文リスト
- Analytic Continual Test-Time Adaptation for Multi-Modality Corruption [23.545997349882857]
テスト時間適応(TTA)は、トレーニング済みのモデルがソースとターゲットデータセット間のギャップを埋めることを支援することを目的としている。
本稿では,MM-CTTAタスクのためのMDAA(Multi-modality Dynamic Analytic Adapter)を提案する。
MDAAはMM-CTTA上での最先端性能を実現し,信頼性の高いモデル適応を実現する。
論文 参考訳(メタデータ) (2024-10-29T01:21:24Z) - MOLA: Enhancing Industrial Process Monitoring Using Multi-Block Orthogonal Long Short-Term Memory Autoencoder [3.7028696448588487]
産業プロセスの高精度かつ信頼性の高い故障検出を行うために,MOLA: Multi-block Orthogonal Long short-term memory Autoencoder パラダイムを導入する。
本稿では,プロセス変数を専門的なプロセス知識を活用することで,複数のブロックに分類するマルチブロック監視構造を提案する。
テネシー・イーストマン・プロセスに適用することで,MOLAフレームワークの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-10-10T00:49:43Z) - Variational Density Propagation Continual Learning [0.0]
現実世界にデプロイされるディープニューラルネットワーク(DNN)は、定期的にオフ・オブ・ディストリビューション(OoD)データの対象となっている。
本稿では,ベンチマーク連続学習データセットによってモデル化されたデータ分散ドリフトに適応するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-22T21:51:39Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Threshold-Consistent Margin Loss for Open-World Deep Metric Learning [42.03620337000911]
画像検索にDeep Metric Learning (DML) で使われている既存の損失は、しばしば非均一なクラス内およびクラス間表現構造に繋がる。
不整合はしばしば、商用画像検索システムを展開する際のしきい値選択過程を複雑にする。
クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
論文 参考訳(メタデータ) (2023-07-08T21:16:41Z) - Training Normalizing Flows with the Precision-Recall Divergence [73.92251251511199]
特定精度リコールトレードオフを達成することは、em PR-divergencesと呼ぶ家族からの-divergencesの最小化に相当することを示す。
本稿では, 正規化フローをトレーニングして, 偏差を最小化し, 特に, 所与の高精度リコールトレードオフを実現する新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2023-02-01T17:46:47Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma
Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。
実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文 参考訳(メタデータ) (2021-11-11T14:28:12Z) - Multivariate Density Estimation with Deep Neural Mixture Models [0.0]
ディープニューラルネットワーク(DNN)は密度推定にはほとんど適用されていない。
本稿では,ニューラルミクチャー密度(NMM)に関するこれまでの研究を拡張した。
深部NMM(Deep NMM)を推定するための最大形アルゴリズム(ML)が配される。
DNMMを通して任意の精度でモデル化できる確率密度関数のクラスが正式に定義される。
論文 参考訳(メタデータ) (2020-12-06T23:03:48Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。