論文の概要: End-to-End Multi-Object Detection with a Regularized Mixture Model
- arxiv url: http://arxiv.org/abs/2205.08714v3
- Date: Fri, 28 Apr 2023 06:08:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-01 17:58:40.822592
- Title: End-to-End Multi-Object Detection with a Regularized Mixture Model
- Title(参考訳): 正規化混合モデルを用いたエンドツーエンドマルチオブジェクト検出
- Authors: Jaeyoung Yoo, Hojun Lee, Seunghyeon Seo, Inseop Chung, Nojun Kwak
- Abstract要約: 近年のエンド・ツー・エンド多目的検出器は手作りのプロセスを取り除き、推論パイプラインを単純化している。
本稿では,NLL(負対数類似度)と正規化項(正則化項)の2項のみからなるエンドツーエンドの多対象検出器を訓練するための新しい枠組みを提案する。
- 参考スコア(独自算出の注目度): 26.19278003378703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent end-to-end multi-object detectors simplify the inference pipeline by
removing hand-crafted processes such as non-maximum suppression (NMS). However,
during training, they still heavily rely on heuristics and hand-crafted
processes which deteriorate the reliability of the predicted confidence score.
In this paper, we propose a novel framework to train an end-to-end multi-object
detector consisting of only two terms: negative log-likelihood (NLL) and a
regularization term. In doing so, the multi-object detection problem is treated
as density estimation of the ground truth bounding boxes utilizing a
regularized mixture density model. The proposed \textit{end-to-end multi-object
Detection with a Regularized Mixture Model} (D-RMM) is trained by minimizing
the NLL with the proposed regularization term, maximum component maximization
(MCM) loss, preventing duplicate predictions. Our method reduces the heuristics
of the training process and improves the reliability of the predicted
confidence score. Moreover, our D-RMM outperforms the previous end-to-end
detectors on MS COCO dataset.
- Abstract(参考訳): 最近のエンドツーエンドのマルチオブジェクト検出器は、非最大抑圧(NMS)のような手作りのプロセスを取り除き、推論パイプラインを単純化している。
しかし、トレーニング中は、予測された信頼性スコアの信頼性を低下させるヒューリスティックや手作りのプロセスに大きく依存している。
本稿では,NLL(負対数類似度)と正規化項(正則化項)の2項のみからなるエンドツーエンドマルチオブジェクト検出器を訓練するための新しい枠組みを提案する。
これにより、正規化混合密度モデルを用いた地中真理境界箱の密度推定として多対象検出問題を扱う。
正規化混合モデル (d-rmm) を用いた多目的検出法である \textit{end-to-end multi-object detection は、nll を最大正規化項であるmaximum component maximization (mcm) loss で最小化し、重複予測を防止した。
本手法は,学習過程のヒューリスティックさを低減し,予測信頼度スコアの信頼性を向上させる。
さらに、我々のD-RMMは、MS COCOデータセット上で以前のエンドツーエンド検出器よりも優れている。
関連論文リスト
- R-MTLLMF: Resilient Multi-Task Large Language Model Fusion at the Wireless Edge [78.26352952957909]
マルチタスク大言語モデル(MTLLM)は、ユーザが複数のタスクを効率的に処理するための特殊なモデルを要求する無線エッジにおける多くのアプリケーションにとって重要である。
タスクベクトルによるモデル融合の概念は、MDLLMを生成するための微調整パラメータを組み合わせるための効率的なアプローチとして登場した。
本稿では,最悪の逆攻撃を前提として,エッジユーザがタスクベクトルを介して協調的にMTLMを作成できる問題について検討する。
論文 参考訳(メタデータ) (2024-11-27T10:57:06Z) - Analytic Continual Test-Time Adaptation for Multi-Modality Corruption [23.545997349882857]
テスト時間適応(TTA)は、トレーニング済みのモデルがソースとターゲットデータセット間のギャップを埋めることを支援することを目的としている。
本稿では,MM-CTTAタスクのためのMDAA(Multi-modality Dynamic Analytic Adapter)を提案する。
MDAAはMM-CTTA上での最先端性能を実現し,信頼性の高いモデル適応を実現する。
論文 参考訳(メタデータ) (2024-10-29T01:21:24Z) - MOLA: Enhancing Industrial Process Monitoring Using Multi-Block Orthogonal Long Short-Term Memory Autoencoder [3.7028696448588487]
産業プロセスの高精度かつ信頼性の高い故障検出を行うために,MOLA: Multi-block Orthogonal Long short-term memory Autoencoder パラダイムを導入する。
本稿では,プロセス変数を専門的なプロセス知識を活用することで,複数のブロックに分類するマルチブロック監視構造を提案する。
テネシー・イーストマン・プロセスに適用することで,MOLAフレームワークの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-10-10T00:49:43Z) - Variational Density Propagation Continual Learning [0.0]
現実世界にデプロイされるディープニューラルネットワーク(DNN)は、定期的にオフ・オブ・ディストリビューション(OoD)データの対象となっている。
本稿では,ベンチマーク連続学習データセットによってモデル化されたデータ分散ドリフトに適応するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-22T21:51:39Z) - Threshold-Consistent Margin Loss for Open-World Deep Metric Learning [42.03620337000911]
画像検索にDeep Metric Learning (DML) で使われている既存の損失は、しばしば非均一なクラス内およびクラス間表現構造に繋がる。
不整合はしばしば、商用画像検索システムを展開する際のしきい値選択過程を複雑にする。
クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
論文 参考訳(メタデータ) (2023-07-08T21:16:41Z) - Training Normalizing Flows with the Precision-Recall Divergence [73.92251251511199]
特定精度リコールトレードオフを達成することは、em PR-divergencesと呼ぶ家族からの-divergencesの最小化に相当することを示す。
本稿では, 正規化フローをトレーニングして, 偏差を最小化し, 特に, 所与の高精度リコールトレードオフを実現する新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2023-02-01T17:46:47Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma
Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。
実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文 参考訳(メタデータ) (2021-11-11T14:28:12Z) - Multivariate Density Estimation with Deep Neural Mixture Models [0.0]
ディープニューラルネットワーク(DNN)は密度推定にはほとんど適用されていない。
本稿では,ニューラルミクチャー密度(NMM)に関するこれまでの研究を拡張した。
深部NMM(Deep NMM)を推定するための最大形アルゴリズム(ML)が配される。
DNMMを通して任意の精度でモデル化できる確率密度関数のクラスが正式に定義される。
論文 参考訳(メタデータ) (2020-12-06T23:03:48Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。