Fugu-MT 論文翻訳(概要): End-to-End Multi-Object Detection with a Regularized Mixture Model

論文の概要: End-to-End Multi-Object Detection with a Regularized Mixture Model

arxiv url: http://arxiv.org/abs/2205.08714v3
Date: Fri, 28 Apr 2023 06:08:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-01 17:58:40.822592
Title: End-to-End Multi-Object Detection with a Regularized Mixture Model
Title（参考訳）: 正規化混合モデルを用いたエンドツーエンドマルチオブジェクト検出
Authors: Jaeyoung Yoo, Hojun Lee, Seunghyeon Seo, Inseop Chung, Nojun Kwak
Abstract要約: 近年のエンド・ツー・エンド多目的検出器は手作りのプロセスを取り除き、推論パイプラインを単純化している。本稿では,NLL(負対数類似度)と正規化項(正則化項)の2項のみからなるエンドツーエンドの多対象検出器を訓練するための新しい枠組みを提案する。
参考スコア（独自算出の注目度）: 26.19278003378703
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent end-to-end multi-object detectors simplify the inference pipeline by removing hand-crafted processes such as non-maximum suppression (NMS). However, during training, they still heavily rely on heuristics and hand-crafted processes which deteriorate the reliability of the predicted confidence score. In this paper, we propose a novel framework to train an end-to-end multi-object detector consisting of only two terms: negative log-likelihood (NLL) and a regularization term. In doing so, the multi-object detection problem is treated as density estimation of the ground truth bounding boxes utilizing a regularized mixture density model. The proposed \textit{end-to-end multi-object Detection with a Regularized Mixture Model} (D-RMM) is trained by minimizing the NLL with the proposed regularization term, maximum component maximization (MCM) loss, preventing duplicate predictions. Our method reduces the heuristics of the training process and improves the reliability of the predicted confidence score. Moreover, our D-RMM outperforms the previous end-to-end detectors on MS COCO dataset.
Abstract（参考訳）: 最近のエンドツーエンドのマルチオブジェクト検出器は、非最大抑圧(NMS)のような手作りのプロセスを取り除き、推論パイプラインを単純化している。しかし、トレーニング中は、予測された信頼性スコアの信頼性を低下させるヒューリスティックや手作りのプロセスに大きく依存している。本稿では,NLL(負対数類似度)と正規化項(正則化項)の2項のみからなるエンドツーエンドマルチオブジェクト検出器を訓練するための新しい枠組みを提案する。これにより、正規化混合密度モデルを用いた地中真理境界箱の密度推定として多対象検出問題を扱う。正規化混合モデル (d-rmm) を用いた多目的検出法である \textit{end-to-end multi-object detection は、nll を最大正規化項であるmaximum component maximization (mcm) loss で最小化し、重複予測を防止した。本手法は,学習過程のヒューリスティックさを低減し,予測信頼度スコアの信頼性を向上させる。さらに、我々のD-RMMは、MS COCOデータセット上で以前のエンドツーエンド検出器よりも優れている。

関連論文リスト

Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文参考訳（メタデータ） (2026-02-10T21:08:53Z)
Minimum Distance Summaries for Robust Neural Posterior Estimation [7.4716500353679685]
シミュレーションベース推論(SBI)は、前シミュレーションペア上で神経後部推定器(NPE)をトレーニングすることで、償却ベイズ推論を可能にする。プリミティブ・ディスタンス・サマリー(minimum-distance summaries)は,プレトレーニング済みのNPEとは独立に,クエリされたテスト時間サマリーを適応するプラグイン・ロバストなNPE手法である。
論文参考訳（メタデータ） (2026-02-09T20:06:15Z)
Fast Model Selection and Stable Optimization for Softmax-Gated Multinomial-Logistic Mixture of Experts Models [40.216463162163976]
我々は,ソフトマックスゲート型マルチミリ波観測用MoEのバッチ最小化最適化アルゴリズムを開発した。また,条件密度推定とパラメータ回復のための有限サンプル率も証明した。生物学的タンパク質-タンパク質相互作用予測実験は、完全なパイプラインを検証する。
論文参考訳（メタデータ） (2026-02-08T14:45:41Z)
Forward Consistency Learning with Gated Context Aggregation for Video Anomaly Detection [17.79982215633934]
ビデオ異常検出(VAD)は、リアルタイム監視システムにおける各種イベントの正常パターンからの偏差を測定することを目的としている。既存のVAD手法の多くは、リソース制限されたエッジデバイスへの実現可能性を制限するため、極端な精度を追求するために大規模なモデルに依存している。本稿では,Gatedコンテキストアグリゲーションを用いたフォワード整合学習を実現する軽量なVADモデルFoGAを紹介する。
論文参考訳（メタデータ） (2026-01-26T04:35:31Z)
Contamination Detection for VLMs using Multi-Modal Semantic Perturbation [73.76465227729818]
オープンソースのVision-Language Models (VLM)は、ベンチマークタスクで最先端のパフォーマンスを達成した。プレトレーニングコーパスは,テストセットリークによるパフォーマンスの低下という,実践者とユーザ双方にとって重要な懸念を提起する。既存の検出手法が不整合性を示すか,不整合性を示すかを示す。マルチモーダルなセマンティック摂動に基づく,新しい簡易かつ効果的な検出法を提案する。
論文参考訳（メタデータ） (2025-11-05T18:59:52Z)
MaP: A Unified Framework for Reliable Evaluation of Pre-training Dynamics [72.00014675808228]
大規模言語モデルの不安定性評価プロセスは、真の学習力学を曖昧にする。 textbfMaPは、アンダーラインMergingアンダーラインとアンダーラインPass@kメトリックを統合するフレームワークです。実験により、MaPはよりスムーズな性能曲線を示し、ラン間分散を低減し、より一貫性のあるランキングを保証する。
論文参考訳（メタデータ） (2025-10-10T11:40:27Z)
Discretization-free Multicalibration through Loss Minimization over Tree Ensembles [22.276913140687725]
深度2の決定木をアンサンブルする離散化のない多重校正法を提案する。本アルゴリズムは,データ分布が損失飽和と呼ばれる技術的条件を満たすことを前提として,マルチキャリブレーションを確実に達成する。
論文参考訳（メタデータ） (2025-05-23T03:29:58Z)
R-MTLLMF: Resilient Multi-Task Large Language Model Fusion at the Wireless Edge [78.26352952957909]
マルチタスク大言語モデル(MTLLM)は、ユーザが複数のタスクを効率的に処理するための特殊なモデルを要求する無線エッジにおける多くのアプリケーションにとって重要である。タスクベクトルによるモデル融合の概念は、MDLLMを生成するための微調整パラメータを組み合わせるための効率的なアプローチとして登場した。本稿では,最悪の逆攻撃を前提として,エッジユーザがタスクベクトルを介して協調的にMTLMを作成できる問題について検討する。
論文参考訳（メタデータ） (2024-11-27T10:57:06Z)
Analytic Continual Test-Time Adaptation for Multi-Modality Corruption [23.545997349882857]
テスト時間適応(TTA)は、トレーニング済みのモデルがソースとターゲットデータセット間のギャップを埋めることを支援することを目的としている。本稿では,MM-CTTAタスクのためのMDAA(Multi-modality Dynamic Analytic Adapter)を提案する。 MDAAはMM-CTTA上での最先端性能を実現し,信頼性の高いモデル適応を実現する。
論文参考訳（メタデータ） (2024-10-29T01:21:24Z)
MOLA: Enhancing Industrial Process Monitoring Using Multi-Block Orthogonal Long Short-Term Memory Autoencoder [3.7028696448588487]
産業プロセスの高精度かつ信頼性の高い故障検出を行うために,MOLA: Multi-block Orthogonal Long short-term memory Autoencoder パラダイムを導入する。本稿では,プロセス変数を専門的なプロセス知識を活用することで,複数のブロックに分類するマルチブロック監視構造を提案する。テネシー・イーストマン・プロセスに適用することで,MOLAフレームワークの有効性と有効性を示す。
論文参考訳（メタデータ） (2024-10-10T00:49:43Z)
Byzantine-tolerant distributed learning of finite mixture models [16.60734923697257]
本稿では、DFMR(Distance Filtered Mixture Reduction)を提案する。 DFMR(DFMR)は、Byzantine Tolerant adaptation of Mixture Reduction (MR)であり、計算効率が良く統計的に聞こえる。我々はDFMRの理論的正当性を示し、その最適収束率と大域的最大推定値との等価性を証明した。
論文参考訳（メタデータ） (2024-07-19T02:11:26Z)
Variational Density Propagation Continual Learning [0.0]
現実世界にデプロイされるディープニューラルネットワーク(DNN)は、定期的にオフ・オブ・ディストリビューション(OoD)データの対象となっている。本稿では,ベンチマーク連続学習データセットによってモデル化されたデータ分散ドリフトに適応するフレームワークを提案する。
論文参考訳（メタデータ） (2023-08-22T21:51:39Z)
Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。 CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文参考訳（メタデータ） (2023-08-18T13:13:09Z)
Threshold-Consistent Margin Loss for Open-World Deep Metric Learning [42.03620337000911]
画像検索にDeep Metric Learning (DML) で使われている既存の損失は、しばしば非均一なクラス内およびクラス間表現構造に繋がる。不整合はしばしば、商用画像検索システムを展開する際のしきい値選択過程を複雑にする。クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
論文参考訳（メタデータ） (2023-07-08T21:16:41Z)
Training Normalizing Flows with the Precision-Recall Divergence [73.92251251511199]
特定精度リコールトレードオフを達成することは、em PR-divergencesと呼ぶ家族からの-divergencesの最小化に相当することを示す。本稿では, 正規化フローをトレーニングして, 偏差を最小化し, 特に, 所与の高精度リコールトレードオフを実現する新しい生成モデルを提案する。
論文参考訳（メタデータ） (2023-02-01T17:46:47Z)
Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting [61.02295959343446]
この研究はまず、相互作用モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。我々は、回帰と不確実性推定の両方を行うために、元の置換同変不確かさ推定器を備えた一般的なCU対応回帰フレームワークを構築した。提案するフレームワークを,プラグインモジュールとして現在のSOTAマルチエージェント軌道予測システムに適用する。
論文参考訳（メタデータ） (2022-07-11T21:17:41Z)
Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文参考訳（メタデータ） (2022-04-13T12:43:12Z)
Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文参考訳（メタデータ） (2021-11-11T14:28:12Z)
Multivariate Density Estimation with Deep Neural Mixture Models [0.0]
ディープニューラルネットワーク(DNN)は密度推定にはほとんど適用されていない。本稿では,ニューラルミクチャー密度(NMM)に関するこれまでの研究を拡張した。深部NMM(Deep NMM)を推定するための最大形アルゴリズム(ML)が配される。 DNMMを通して任意の精度でモデル化できる確率密度関数のクラスが正式に定義される。
論文参考訳（メタデータ） (2020-12-06T23:03:48Z)
Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文参考訳（メタデータ） (2020-03-04T12:27:36Z)
Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。 4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文参考訳（メタデータ） (2020-02-27T10:22:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。