論文の概要: Unveiling The Mask of Position-Information Pattern Through the Mist of
Image Features
- arxiv url: http://arxiv.org/abs/2206.01202v1
- Date: Thu, 2 Jun 2022 17:59:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 12:54:49.110596
- Title: Unveiling The Mask of Position-Information Pattern Through the Mist of
Image Features
- Title(参考訳): 画像特徴のマイストによる位置情報パターンのマスクの展開
- Authors: Chieh Hubert Lin, Hsin-Ying Lee, Hung-Yu Tseng, Maneesh Singh,
Ming-Hsuan Yang
- Abstract要約: 近年の研究では、畳み込みニューラルネットワークにおけるパディングが絶対位置情報を符号化していることが示されている。
位置情報の強度を定量化する既存の指標は信頼性が低いままである。
符号化された位置情報を計測(および可視化)するための新しい指標を提案する。
- 参考スコア(独自算出の注目度): 75.62755703738696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies show that paddings in convolutional neural networks encode
absolute position information which can negatively affect the model performance
for certain tasks. However, existing metrics for quantifying the strength of
positional information remain unreliable and frequently lead to erroneous
results. To address this issue, we propose novel metrics for measuring (and
visualizing) the encoded positional information. We formally define the encoded
information as PPP (Position-information Pattern from Padding) and conduct a
series of experiments to study its properties as well as its formation. The
proposed metrics measure the presence of positional information more reliably
than the existing metrics based on PosENet and a test in F-Conv. We also
demonstrate that for any extant (and proposed) padding schemes, PPP is
primarily a learning artifact and is less dependent on the characteristics of
the underlying padding schemes.
- Abstract(参考訳): 近年の研究では、畳み込みニューラルネットワークのパディングが絶対位置情報をエンコードし、特定のタスクのモデル性能に悪影響を及ぼすことが示されている。
しかし、位置情報の強度を定量化するための既存の指標は信頼性が低く、しばしば誤った結果につながる。
そこで本稿では,符号化位置情報の測定(可視化)のための新しい指標を提案する。
我々は、エンコードされた情報をPPP(Position-information Pattern from Padding)と定義し、その特性と形成を研究する一連の実験を行う。
提案手法は,PosENetに基づく既存の指標とF-Convにおけるテストに基づいて,位置情報の存在を確実に測定する。
また、現存する(そして提案された)パディングスキームに対して、PPPは学習成果物であり、基礎となるパディングスキームの特性に依存しないことを示す。
関連論文リスト
- SSPNet: Scale and Spatial Priors Guided Generalizable and Interpretable
Pedestrian Attribute Recognition [23.55622798950833]
Pedestrian Attribute Recognition(PAR)モデルに対して,SSPNet(Scale and Spatial Priors Guided Network)を提案する。
SSPNetは、異なる属性グループに対して適切なスケールの事前情報を提供することを学び、モデルが異なるレベルの機能マップに集中できるようにする。
Weakly-supervised Pedestrian Attribute Localization (WPAL) に対して, 属性応答マスクのGrad-CAMの改良に基づく新しいIoU属性ローカライゼーション指標を提案する。
論文 参考訳(メタデータ) (2023-12-11T00:41:40Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - PNI : Industrial Anomaly Detection using Position and Neighborhood
Information [6.316693022958221]
本研究では,条件付き近傍特徴量を用いて正規分布を推定する新しいアルゴリズム textbfPNI を提案する。
我々はMVTec ADベンチマークデータセットの実験を行い、異常検出と局所化におけるtextbf99.56%と textbf98.98%のAUROCスコアを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-11-22T23:45:27Z) - Toward Reliable Neural Specifications [3.2722498341029653]
既存のニューラルネットワークの仕様は、仕様としてデータのパラダイムにある。
本稿では,ニューラル表現を仕様とする新しい仕様群を提案する。
NAPを用いて入力空間全体の予測を検証でき、データの84%をリコールできることを示す。
論文 参考訳(メタデータ) (2022-10-28T13:21:28Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Transformers Can Do Bayesian Inference [56.99390658880008]
我々はPFN(Presideed Data Fitted Networks)を提案する。
PFNは、大規模機械学習技術におけるインコンテキスト学習を活用して、大規模な後部集合を近似する。
我々は、PFNがガウス過程をほぼ完璧に模倣し、難解問題に対する効率的なベイズ推定を可能にすることを示した。
論文 参考訳(メタデータ) (2021-12-20T13:07:39Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Quantifying point cloud realism through adversarially learned latent
representations [0.38233569758620056]
本稿では,LiDAR点雲における局所領域のリアリズムを定量化する新しい手法を提案する。
結果のメトリックは、タスク固有のアノテーションを必要とせずに、品質スコアをサンプルに割り当てることができる。
重要な応用の1つとして、局所リアリズムスコアが点雲における異常検出にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2021-09-24T07:17:27Z) - Layer-wise Characterization of Latent Information Leakage in Federated
Learning [9.397152006395174]
フェデレートされた学習を通じてディープニューラルネットワークをトレーニングすることで、クライアントは元のデータではなく、データに基づいてトレーニングされたモデルのみを共有することができる。
従来の研究は、クライアントのプライベート情報が、メインの学習タスクとは無関係に、モデルの勾配から発見できることを実証している。
共有された更新モデルや勾配を通じて、プライベート情報の漏洩を定量化するための公式なアプローチはまだ存在しない。
論文 参考訳(メタデータ) (2020-10-17T10:49:14Z) - Representation Learning for Sequence Data with Deep Autoencoding
Predictive Components [96.42805872177067]
本稿では,シーケンスデータの有用な表現が潜在空間における単純な構造を示すべきという直感に基づく,シーケンスデータの自己教師型表現学習法を提案する。
我々は,過去と将来のウィンドウ間の相互情報である潜在特徴系列の予測情報を最大化することにより,この潜時構造を奨励する。
提案手法は,ノイズの多い動的システムの潜時空間を復元し,タスク予測のための予測特徴を抽出し,エンコーダを大量の未ラベルデータで事前訓練する場合に音声認識を改善する。
論文 参考訳(メタデータ) (2020-10-07T03:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。