論文の概要: Localization with Sampling-Argmax
- arxiv url: http://arxiv.org/abs/2110.08825v1
- Date: Sun, 17 Oct 2021 13:56:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 14:31:42.637824
- Title: Localization with Sampling-Argmax
- Title(参考訳): サンプリングargmaxによる局在化
- Authors: Jiefeng Li, Tong Chen, Ruiqi Shi, Yujing Lou, Yong-Lu Li, Cewu Lu
- Abstract要約: 本稿では,確率マップの形状に暗黙の制約を課す識別可能な訓練法であるサンプリング-argmaxを提案する。
サンプリング・argmaxは,様々な局所化タスクにおける従来のソフト・argmax操作をシームレスに置き換えることができることを示す。
- 参考スコア(独自算出の注目度): 45.408767601013786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Soft-argmax operation is commonly adopted in detection-based methods to
localize the target position in a differentiable manner. However, training the
neural network with soft-argmax makes the shape of the probability map
unconstrained. Consequently, the model lacks pixel-wise supervision through the
map during training, leading to performance degradation. In this work, we
propose sampling-argmax, a differentiable training method that imposes implicit
constraints to the shape of the probability map by minimizing the expectation
of the localization error. To approximate the expectation, we introduce a
continuous formulation of the output distribution and develop a differentiable
sampling process. The expectation can be approximated by calculating the
average error of all samples drawn from the output distribution. We show that
sampling-argmax can seamlessly replace the conventional soft-argmax operation
on various localization tasks. Comprehensive experiments demonstrate the
effectiveness and flexibility of the proposed method. Code is available at
https://github.com/Jeff-sjtu/sampling-argmax
- Abstract(参考訳): Soft-argmax操作は、ターゲット位置を異なる方法でローカライズする検出ベースの手法で一般的に採用されている。
しかし、ソフトargmaxでニューラルネットワークをトレーニングすると、確率マップの形が拘束されない。
その結果、トレーニング中にマップを通してピクセル単位での監視が欠如し、パフォーマンスが低下する。
本研究では,局所化誤差の期待を最小化して,確率マップの形状に暗黙の制約を課す,微分可能な学習法であるサンプリング・argmaxを提案する。
そこで本研究では,出力分布を連続的に定式化し,微分可能なサンプリングプロセスを開発する。
予測は、出力分布から引き出された全てのサンプルの平均誤差を計算することで近似することができる。
サンプリング-argmaxは,従来のソフトargmax操作を様々な局所化タスクでシームレスに置き換えることができることを示す。
総合実験により,提案手法の有効性と柔軟性が実証された。
コードはhttps://github.com/Jeff-sjtu/sampling-argmaxで入手できる。
関連論文リスト
- Dirichlet-Based Prediction Calibration for Learning with Noisy Labels [40.78497779769083]
雑音ラベルによる学習はディープニューラルネットワーク(DNN)の一般化性能を著しく損なう
既存のアプローチでは、損失補正やサンプル選択手法によってこの問題に対処している。
そこで我々は,textitDirichlet-based Prediction (DPC) 法を解法として提案する。
論文 参考訳(メタデータ) (2024-01-13T12:33:04Z) - A Pseudo-Semantic Loss for Autoregressive Models with Logical
Constraints [87.08677547257733]
ニューロシンボリックAIは、純粋にシンボリックな学習とニューラルな学習のギャップを埋める。
本稿では,ニューラルネットワークの出力分布に対するシンボリック制約の可能性を最大化する方法を示す。
また,スドクと最短経路予測の手法を自己回帰世代として評価した。
論文 参考訳(メタデータ) (2023-12-06T20:58:07Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Efficient Multimodal Sampling via Tempered Distribution Flow [11.36635610546803]
我々はTemperFlowと呼ばれる新しいタイプのトランスポートベースサンプリング手法を開発した。
種々の実験により, 従来の手法と比較して, 新規サンプリング器の優れた性能が示された。
画像生成などの最新のディープラーニングタスクに応用例を示す。
論文 参考訳(メタデータ) (2023-04-08T06:40:06Z) - Generalized Differentiable RANSAC [95.95627475224231]
$nabla$-RANSACは、ランダム化された堅牢な推定パイプライン全体を学ぶことができる、微分可能なRANSACである。
$nabla$-RANSACは、精度という点では最先端のシステムよりも優れているが、精度は低い。
論文 参考訳(メタデータ) (2022-12-26T15:13:13Z) - Diverse Human Motion Prediction via Gumbel-Softmax Sampling from an
Auxiliary Space [34.83587750498361]
多様な人間の動き予測は、観測されたポーズのシーケンスから、複数の将来のポーズシーケンスを予測することを目的としている。
従来のアプローチでは、通常、データの条件分布をモデル化するために深い生成ネットワークを使用し、その後、分布からランダムにサンプル結果を得る。
不均衡なマルチモーダル分布から非常に多様な結果をサンプリングするための新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-07-15T09:03:57Z) - Adversarial sampling of unknown and high-dimensional conditional
distributions [0.0]
本稿では, GAN (Generative Adversarial Network) と呼ばれるデータ駆動方式を用いて, サンプリング法と基礎分布の推定を行う。
GANは、2つの競合するニューラルネットワークをトレーニングし、トレーニングセット分布からサンプルを効果的に生成できるネットワークを生成する。
提案アルゴリズムのすべてのバージョンは, 対象条件分布を, サンプルの品質に最小限の影響で効果的にサンプリングできることが示されている。
論文 参考訳(メタデータ) (2021-11-08T12:23:38Z) - Improving Maximum Likelihood Training for Text Generation with Density
Ratio Estimation [51.091890311312085]
本稿では,テキスト生成で遭遇する大規模なサンプル空間において,効率よく安定な自動回帰シーケンス生成モデルのトレーニング手法を提案する。
本手法は,品質と多様性の両面で,最大類似度推定や他の最先端シーケンス生成モデルよりも安定に優れている。
論文 参考訳(メタデータ) (2020-07-12T15:31:24Z) - Stacking for Non-mixing Bayesian Computations: The Curse and Blessing of
Multimodal Posteriors [8.11978827493967]
MCMCの並列実行, 変動型, モードベースの推論を用いて, できるだけ多くのモードをヒットさせる手法を提案する。
重み付き推論プロセスが真のデータを近似する例と理論的整合性を示す。
いくつかのモデルファミリで実践的な実装を示す。
論文 参考訳(メタデータ) (2020-06-22T15:26:59Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。