論文の概要: Localization with Sampling-Argmax
- arxiv url: http://arxiv.org/abs/2110.08825v1
- Date: Sun, 17 Oct 2021 13:56:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 14:31:42.637824
- Title: Localization with Sampling-Argmax
- Title(参考訳): サンプリングargmaxによる局在化
- Authors: Jiefeng Li, Tong Chen, Ruiqi Shi, Yujing Lou, Yong-Lu Li, Cewu Lu
- Abstract要約: 本稿では,確率マップの形状に暗黙の制約を課す識別可能な訓練法であるサンプリング-argmaxを提案する。
サンプリング・argmaxは,様々な局所化タスクにおける従来のソフト・argmax操作をシームレスに置き換えることができることを示す。
- 参考スコア(独自算出の注目度): 45.408767601013786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Soft-argmax operation is commonly adopted in detection-based methods to
localize the target position in a differentiable manner. However, training the
neural network with soft-argmax makes the shape of the probability map
unconstrained. Consequently, the model lacks pixel-wise supervision through the
map during training, leading to performance degradation. In this work, we
propose sampling-argmax, a differentiable training method that imposes implicit
constraints to the shape of the probability map by minimizing the expectation
of the localization error. To approximate the expectation, we introduce a
continuous formulation of the output distribution and develop a differentiable
sampling process. The expectation can be approximated by calculating the
average error of all samples drawn from the output distribution. We show that
sampling-argmax can seamlessly replace the conventional soft-argmax operation
on various localization tasks. Comprehensive experiments demonstrate the
effectiveness and flexibility of the proposed method. Code is available at
https://github.com/Jeff-sjtu/sampling-argmax
- Abstract(参考訳): Soft-argmax操作は、ターゲット位置を異なる方法でローカライズする検出ベースの手法で一般的に採用されている。
しかし、ソフトargmaxでニューラルネットワークをトレーニングすると、確率マップの形が拘束されない。
その結果、トレーニング中にマップを通してピクセル単位での監視が欠如し、パフォーマンスが低下する。
本研究では,局所化誤差の期待を最小化して,確率マップの形状に暗黙の制約を課す,微分可能な学習法であるサンプリング・argmaxを提案する。
そこで本研究では,出力分布を連続的に定式化し,微分可能なサンプリングプロセスを開発する。
予測は、出力分布から引き出された全てのサンプルの平均誤差を計算することで近似することができる。
サンプリング-argmaxは,従来のソフトargmax操作を様々な局所化タスクでシームレスに置き換えることができることを示す。
総合実験により,提案手法の有効性と柔軟性が実証された。
コードはhttps://github.com/Jeff-sjtu/sampling-argmaxで入手できる。
関連論文リスト
- Controllable Generation via Locally Constrained Resampling [77.48624621592523]
本研究では, ベイズ条件付けを行い, 制約条件下でサンプルを描画する, トラクタブルな確率的手法を提案する。
提案手法はシーケンス全体を考慮し,現行のグリード法よりも大域的に最適に制約された生成を導出する。
提案手法は, 有害な世代からモデル出力を分離し, 脱毒化に対する同様のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2024-10-17T00:49:53Z) - The Sampling-Gaussian for stereo matching [7.9898209414259425]
ソフトアルグマックス演算は、ニューラルネットワークベースのステレオマッチング法で広く採用されている。
従来の手法では精度を効果的に向上できず、ネットワークの効率を損なうこともあった。
本稿では,ステレオマッチングのための新しい監視手法,サンプリング・ガウシアンを提案する。
論文 参考訳(メタデータ) (2024-10-09T03:57:13Z) - DistPred: A Distribution-Free Probabilistic Inference Method for Regression and Forecasting [14.390842560217743]
本稿では、回帰予測タスクのためのDistPredという新しい手法を提案する。
予測分布と対象分布の差分を測定するための適切なスコアリングルールを、微分可能な離散形式に変換する。
これにより、モデルは単一のフォワードパスで多数のサンプルをサンプリングし、応答変数の潜在的分布を推定することができる。
論文 参考訳(メタデータ) (2024-06-17T10:33:00Z) - Dirichlet-Based Prediction Calibration for Learning with Noisy Labels [40.78497779769083]
雑音ラベルによる学習はディープニューラルネットワーク(DNN)の一般化性能を著しく損なう
既存のアプローチでは、損失補正やサンプル選択手法によってこの問題に対処している。
そこで我々は,textitDirichlet-based Prediction (DPC) 法を解法として提案する。
論文 参考訳(メタデータ) (2024-01-13T12:33:04Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Efficient Multimodal Sampling via Tempered Distribution Flow [11.36635610546803]
我々はTemperFlowと呼ばれる新しいタイプのトランスポートベースサンプリング手法を開発した。
種々の実験により, 従来の手法と比較して, 新規サンプリング器の優れた性能が示された。
画像生成などの最新のディープラーニングタスクに応用例を示す。
論文 参考訳(メタデータ) (2023-04-08T06:40:06Z) - Generalized Differentiable RANSAC [95.95627475224231]
$nabla$-RANSACは、ランダム化された堅牢な推定パイプライン全体を学ぶことができる、微分可能なRANSACである。
$nabla$-RANSACは、精度という点では最先端のシステムよりも優れているが、精度は低い。
論文 参考訳(メタデータ) (2022-12-26T15:13:13Z) - Diverse Human Motion Prediction via Gumbel-Softmax Sampling from an
Auxiliary Space [34.83587750498361]
多様な人間の動き予測は、観測されたポーズのシーケンスから、複数の将来のポーズシーケンスを予測することを目的としている。
従来のアプローチでは、通常、データの条件分布をモデル化するために深い生成ネットワークを使用し、その後、分布からランダムにサンプル結果を得る。
不均衡なマルチモーダル分布から非常に多様な結果をサンプリングするための新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-07-15T09:03:57Z) - Improving Maximum Likelihood Training for Text Generation with Density
Ratio Estimation [51.091890311312085]
本稿では,テキスト生成で遭遇する大規模なサンプル空間において,効率よく安定な自動回帰シーケンス生成モデルのトレーニング手法を提案する。
本手法は,品質と多様性の両面で,最大類似度推定や他の最先端シーケンス生成モデルよりも安定に優れている。
論文 参考訳(メタデータ) (2020-07-12T15:31:24Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。