論文の概要: Learning for Open-World Calibration with Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2305.12039v1
- Date: Fri, 19 May 2023 23:52:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 01:17:57.094545
- Title: Learning for Open-World Calibration with Graph Neural Networks
- Title(参考訳): グラフニューラルネットワークを用いたオープンワールド校正の学習
- Authors: Qin Zhang, Dongsheng An, Tianjun Xiao, Tong He, Qingming Tang, Ying
Nian Wu, Joseph Tighe, Yifan Xing
- Abstract要約: 本研究では,クラスタリングにコンパクト化対策を取り入れたオープンワールド認識のためのしきい値校正問題に取り組む。
提案手法は, (i) 高次元視覚埋め込み空間における近傍画像間の表現構造は, オープンワールドへの移動性を促進するために活用できる, 強い自己相似性を有する。
そこで我々は,グラフニューラルネットワーク(GNN)を中心とした統一フレームワークを設計し,擬似ラベルと表現のコンパクトさを示すvMF濃度を共同で予測する。
- 参考スコア(独自算出の注目度): 57.7378260096861
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We tackle the problem of threshold calibration for open-world recognition by
incorporating representation compactness measures into clustering. Unlike the
open-set recognition which focuses on discovering and rejecting the unknown,
open-world recognition learns robust representations that are generalizable to
disjoint unknown classes at test time. Our proposed method is based on two key
observations: (i) representation structures among neighbouring images in high
dimensional visual embedding spaces have strong self-similarity which can be
leveraged to encourage transferability to the open world, (ii) intra-class
embedding structures can be modeled with the marginalized von Mises-Fisher
(vMF) probability, whose correlation with the true positive rate is
dataset-invariant. Motivated by these, we design a unified framework centered
around a graph neural network (GNN) to jointly predict the pseudo-labels and
the vMF concentrations which indicate the representation compactness. These
predictions can be converted into statistical estimations for recognition
accuracy, allowing more robust calibration of the distance threshold to achieve
target utility for the open-world classes. Results on a variety of visual
recognition benchmarks demonstrate the superiority of our method over
traditional posthoc calibration methods for the open world, especially under
distribution shift.
- Abstract(参考訳): 本稿では,クラスタリングに表現のコンパクト度を組み込んだオープンワールド認識のためのしきい値校正問題に取り組む。
未知のクラスの発見と拒否に焦点を当てたオープンセット認識とは異なり、オープンワールド認識はテスト時に未知のクラスを分離するために一般化された頑健な表現を学習する。
提案手法は2つの重要な観測結果に基づく。
(i)高次元視覚埋め込み空間における近傍画像間の表現構造は、オープンワールドへの移動性を促進するために活用できる強い自己相似性を有する。
(ii)クラス内埋め込み構造はマージン化フォン・ミセス・フィッシャー(vmf)確率でモデル化することができ、真の正の確率との相関はデータセット不変である。
そこで我々は,グラフニューラルネットワーク(GNN)を中心とした統一フレームワークを設計し,擬似ラベルと表現のコンパクトさを示すvMF濃度を共同で予測する。
これらの予測は、認識精度の統計的推定に変換でき、オープンワールドクラスの目標ユーティリティを達成するために、距離しきい値のより堅牢なキャリブレーションを可能にする。
様々な視覚認知ベンチマークの結果,特に分布シフト下では,従来のポストホックキャリブレーション法よりも優れた手法が得られた。
関連論文リスト
- Distill-SODA: Distilling Self-Supervised Vision Transformer for
Source-Free Open-Set Domain Adaptation in Computational Pathology [12.828728138651266]
スライド画像全体から手動の組織タイピングを減らすためには,計算病理モデルの開発が不可欠である。
本稿では,上記の課題に対処して,オープンソースフリーなオープンセットドメイン適応という現実的な設定を提案する。
提案手法は,事前学習したソースモデルをラベルなしのターゲットデータセットに適応させることに重点を置いている。
論文 参考訳(メタデータ) (2023-07-10T14:36:51Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - Visual Recognition with Deep Learning from Biased Image Datasets [6.10183951877597]
視覚認知の文脈において、バイアスモデルがどのように治療問題に適用できるかを示す。
作業中のバイアス機構に関する(近似的な)知識に基づいて、我々のアプローチは観察を再重み付けする。
本稿では,画像データベース間で共有される低次元画像表現を提案する。
論文 参考訳(メタデータ) (2021-09-06T10:56:58Z) - Opening Deep Neural Networks with Generative Models [2.0962464943252934]
本稿では,事前学習したDeep Neural Networksに付加して視覚認識を行うことのできる,シンプルでプラグアンドプレイなオープンセット認識モジュールGeMOSを提案する。
GeMOSフレームワークは、事前訓練された畳み込みニューラルネットワークと、オープンセット認識のための生成モデルを組み合わせて、サンプル毎にオープンセットスコアを抽出する。
提案手法を最先端のオープンセットアルゴリズムと比較して徹底的に評価し,GeMOSがより複雑でコストのかかるモデルよりも優れているか,あるいは統計的に区別できないかを見出した。
論文 参考訳(メタデータ) (2021-05-20T20:02:29Z) - Open Set Recognition with Conditional Probabilistic Generative Models [51.40872765917125]
オープンセット認識のための条件付き確率生成モデル(CPGM)を提案する。
CPGMは未知のサンプルを検出できるが、異なる潜在特徴を条件付きガウス分布に近似させることで、既知のクラスを分類できる。
複数のベンチマークデータセットの実験結果から,提案手法がベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-08-12T06:23:49Z) - Open-Set Recognition with Gaussian Mixture Variational Autoencoders [91.3247063132127]
推論において、オープンセット分類は、サンプルをトレーニングから既知のクラスに分類するか、未知のクラスとして拒絶するかのどちらかである。
我々は,協調的に再構築を学習し,潜在空間におけるクラスベースのクラスタリングを行うよう,我々のモデルを訓練する。
我々のモデルは、より正確で堅牢なオープンセット分類結果を実現し、平均的なF1改善率は29.5%である。
論文 参考訳(メタデータ) (2020-06-03T01:15:19Z) - Conditional Gaussian Distribution Learning for Open Set Recognition [10.90687687505665]
オープンセット認識のための条件付きガウス分布学習(CGDL)を提案する。
未知のサンプルを検出することに加えて、異なる潜伏特徴を異なるガウスモデルに近似させることにより、既知のサンプルを分類することもできる。
いくつかの標準画像に対する実験により,提案手法はベースライン法を著しく上回り,新たな最先端結果が得られることが明らかになった。
論文 参考訳(メタデータ) (2020-03-19T14:32:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。