論文の概要: Quaternion-valued Correlation Learning for Few-Shot Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2305.07283v1
- Date: Fri, 12 May 2023 06:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-15 13:57:25.484601
- Title: Quaternion-valued Correlation Learning for Few-Shot Semantic
Segmentation
- Title(参考訳): Few-Shot Semantic Segmentationのための4次相関学習
- Authors: Zewen Zheng, Guoheng Huang, Xiaochen Yuan, Chi-Man Pun, Hongrui Liu,
and Wing-Kuen Ling
- Abstract要約: Few-shot segmentation (FSS) は、いくつかの注釈付きサンプルのみを与えられた未確認クラスをセグメントすることを目的としている。
相関学習に関する四元数視点を導入し、新しい四元数評価相関学習ネットワーク(QCLNet)を提案する。
我々のQCLNetは超複素値ネットワークとして定式化され、四元数領域の相関テンソルを表す。
- 参考スコア(独自算出の注目度): 38.445158985732384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot segmentation (FSS) aims to segment unseen classes given only a few
annotated samples. Encouraging progress has been made for FSS by leveraging
semantic features learned from base classes with sufficient training samples to
represent novel classes. The correlation-based methods lack the ability to
consider interaction of the two subspace matching scores due to the inherent
nature of the real-valued 2D convolutions. In this paper, we introduce a
quaternion perspective on correlation learning and propose a novel
Quaternion-valued Correlation Learning Network (QCLNet), with the aim to
alleviate the computational burden of high-dimensional correlation tensor and
explore internal latent interaction between query and support images by
leveraging operations defined by the established quaternion algebra.
Specifically, our QCLNet is formulated as a hyper-complex valued network and
represents correlation tensors in the quaternion domain, which uses
quaternion-valued convolution to explore the external relations of query
subspace when considering the hidden relationship of the support sub-dimension
in the quaternion space. Extensive experiments on the PASCAL-5i and COCO-20i
datasets demonstrate that our method outperforms the existing state-of-the-art
methods effectively. Our code is available at
https://github.com/zwzheng98/QCLNet
- Abstract(参考訳): Few-shot segmentation (FSS) は、いくつかの注釈付きサンプルのみを与えられた未確認クラスをセグメントすることを目的としている。
ベースクラスから学んだセマンティックな特徴を、新しいクラスを表現するのに十分なトレーニングサンプルで活用することで、FSSの進歩を加速させた。
相関に基づく手法は、実数値化された2次元畳み込みの性質から、2つの部分空間マッチングスコアの相互作用を考慮できない。
本稿では,相関学習に関する四元数視点を提案し,高次元相関テンソルの計算負担を軽減し,確立された四元数代数によって定義された演算を活用して,クエリとサポート画像間の内部潜在相互作用を探索することを目的とした,新しい四元数値相関学習ネットワーク(qclnet)を提案する。
具体的には、qclnetは超複素値ネットワークとして定式化され、四元数領域における相関テンソルを表し、四元数値畳み込みを用いて四元数空間における支援部分次元の隠れた関係を考える際にクエリ部分空間の外部関係を探索する。
PASCAL-5i と COCO-20i データセットの大規模な実験により,本手法が既存の最先端手法を効果的に上回ることを示す。
私たちのコードはhttps://github.com/zwzheng98/QCLNetで利用可能です。
関連論文リスト
- Anchor-aware Deep Metric Learning for Audio-visual Retrieval [11.675472891647255]
Metric Learningは、基礎となるデータ構造を捕捉し、オーディオ・ビジュアル・クロスモーダル検索(AV-CMR)のようなタスクの性能を向上させることを目的としている。
近年の研究では、トレーニング中に埋め込み空間から影響のあるデータポイントを選択するためのサンプリング手法が採用されている。
しかし、トレーニングデータポイントの不足のため、モデルトレーニングはスペースを完全に探索することができない。
本稿では,この課題に対処するために,AADML(Anchor-aware Deep Metric Learning)手法を提案する。
論文 参考訳(メタデータ) (2024-04-21T22:44:44Z) - Time Series Compression using Quaternion Valued Neural Networks and Quaternion Backpropagation [3.8750364147156247]
本稿では,長い時系列をデータセグメントに分割する4元時間時系列圧縮手法を提案する。
我々は,これらのチャンクのミン,マックス,平均,標準偏差を代表的特徴として抽出し,四元数でカプセル化する。
この時系列は、四重項値ニューラルネットワーク層を用いて処理される。
論文 参考訳(メタデータ) (2024-03-18T12:22:11Z) - Spatial-Temporal Decoupling Contrastive Learning for Skeleton-based
Human Action Recognition [10.403751563214113]
STD-CLは、配列から識別的および意味的に異なる表現を得るためのフレームワークである。
STD-CLは、NTU60、NTU120、NW-UCLAベンチマークでしっかりと改善されている。
論文 参考訳(メタデータ) (2023-12-23T02:54:41Z) - Efficient Semantic Matching with Hypercolumn Correlation [58.92933923647451]
HCCNetは効率的で効果的なセマンティックマッチング手法である。
マルチスケール相関写像の完全なポテンシャルを利用する。
4D相関マップ上では、高価なマッチング関係のマイニングに頼っている。
論文 参考訳(メタデータ) (2023-11-07T20:40:07Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - An Entropy-guided Reinforced Partial Convolutional Network for Zero-Shot
Learning [77.72330187258498]
エントロピー誘導強化部分畳み込みネットワーク(ERPCNet)を提案する。
ERPCNetは、人間のアノテーションのない意味的関連性と視覚的相関に基づいて、局所性を抽出し、集約する。
グローバルな協力的局所性を動的に発見するだけでなく、ポリシー勾配最適化のためにより高速に収束する。
論文 参考訳(メタデータ) (2021-11-03T11:13:13Z) - Hypercorrelation Squeeze for Few-Shot Segmentation [33.45698767126036]
Few-shot semantic segmentationは、ターゲットクラスの注釈付きサポートイメージのみを使用して、クエリイメージからターゲットオブジェクトをセグメンテーションすることを目的としている。
この課題は、多様な視覚的手がかりを理解し、クエリとサポートイメージの微粒な対応関係を解析することである。
マルチレベル特徴相関と効率的な4D畳み込みを利用したハイパー相関スキーズネットワーク(HSNet)を提案する。
論文 参考訳(メタデータ) (2021-04-04T05:27:13Z) - A Quaternion-Valued Variational Autoencoder [15.153617649974263]
可変オートエンコーダ(VAE)は、入力の潜在表現を学習することで、生成過程をモデル化する能力を証明している。
四元数領域で定義された新しいVAEを提案し、四元数代数の特性を利用して性能を向上させる。
論文 参考訳(メタデータ) (2020-10-22T12:33:42Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。