論文の概要: Doubly Deformable Aggregation of Covariance Matrices for Few-shot
Segmentation
- arxiv url: http://arxiv.org/abs/2208.00306v1
- Date: Sat, 30 Jul 2022 20:41:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:47:41.499855
- Title: Doubly Deformable Aggregation of Covariance Matrices for Few-shot
Segmentation
- Title(参考訳): ファウショットセグメンテーションのための共分散行列の二重変形可能な凝集
- Authors: Zhitong Xiong, Haopeng Li, and Xiao Xiang Zhu
- Abstract要約: 注釈付きサンプルの少ないセマンティックセグメンテーションモデルを訓練することは、実世界の様々な応用に大きな可能性を持っている。
数ショットのセグメンテーションタスクでは、サポートとクエリサンプル間のセマンティック対応を正確に測定する方法が主な課題である。
本稿では,学習可能な共分散行列を変形可能な4次元変換器で集約し,セグメント化マップを効果的に予測する。
- 参考スコア(独自算出の注目度): 25.387090319723715
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training semantic segmentation models with few annotated samples has great
potential in various real-world applications. For the few-shot segmentation
task, the main challenge is how to accurately measure the semantic
correspondence between the support and query samples with limited training
data. To address this problem, we propose to aggregate the learnable covariance
matrices with a deformable 4D Transformer to effectively predict the
segmentation map. Specifically, in this work, we first devise a novel hard
example mining mechanism to learn covariance kernels for the Gaussian process.
The learned covariance kernel functions have great advantages over existing
cosine similarity-based methods in correspondence measurement. Based on the
learned covariance kernels, an efficient doubly deformable 4D Transformer
module is designed to adaptively aggregate feature similarity maps into
segmentation results. By combining these two designs, the proposed method can
not only set new state-of-the-art performance on public benchmarks, but also
converge extremely faster than existing methods. Experiments on three public
datasets have demonstrated the effectiveness of our method.
- Abstract(参考訳): 注釈付きサンプルの少ない意味セグメンテーションモデルのトレーニングは、現実世界の様々なアプリケーションにおいて大きな可能性を秘めている。
数ショットのセグメンテーションタスクでは、サポートとクエリサンプル間のセマンティック対応を、限られたトレーニングデータで正確に測定する方法が主な課題である。
この問題に対処するために,学習可能な共分散行列を変形可能な4次元トランスで集約し,セグメンテーションマップを効果的に予測する。
具体的には,まず,ガウス過程の共分散核を学ぶための,新しいハードサンプルマイニング機構を考案する。
学習された共分散カーネル関数は、対応測定における既存のコサイン類似性に基づく手法よりも大きな利点がある。
学習した共分散カーネルに基づいて,特徴類似性マップを適応的にセグメンテーション結果に集約する,効率の良い2倍変形可能な4Dトランスフォーマーモジュールを設計する。
これらの2つの設計を組み合わせることで、提案手法は、新しいパフォーマンスをパブリックベンチマークに設定できるだけでなく、既存の手法よりも非常に高速に収束できる。
3つの公開データセットの実験により,本手法の有効性が示された。
関連論文リスト
- Adaptive manifold for imbalanced transductive few-shot learning [16.627512688664513]
適応マニフォールド(Adaptive Manifold)という,不均衡なトランスダクティブ・ショット・ラーニングに対処する新しいアルゴリズムを提案する。
提案手法は,ラベル付きサポート例とラベルなしクエリの基盤となる多様体を利用して,クエリごとのクラス確率分布を予測する。
論文 参考訳(メタデータ) (2023-04-27T15:42:49Z) - Scalable Randomized Kernel Methods for Multiview Data Integration and
Prediction [4.801208484529834]
複数のソースからのデータを協調的に関連づけるスケーラブルなランダム化カーネル手法を開発し、同時に結果を予測するか、ユニットを2つ以上のクラスに分類する。
提案手法は,多視点データにおける非線形関係を,臨床結果の予測とともにモデル化し,ビュー間の関係に最も寄与する変数や変数群を同定する。
論文 参考訳(メタデータ) (2023-04-10T16:14:42Z) - Learning Context-aware Classifier for Semantic Segmentation [88.88198210948426]
本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文 参考訳(メタデータ) (2023-03-21T07:00:35Z) - Asymmetric Scalable Cross-modal Hashing [51.309905690367835]
クロスモーダルハッシュは、大規模なマルチメディア検索問題を解決する方法として成功している。
これらの問題に対処する新しい非対称スケーラブルクロスモーダルハッシュ(ASCMH)を提案する。
我々のASCMHは、最先端のクロスモーダルハッシュ法よりも精度と効率の点で優れています。
論文 参考訳(メタデータ) (2022-07-26T04:38:47Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Cost Aggregation Is All You Need for Few-Shot Segmentation [28.23753949369226]
本稿では,数発のセグメンテーションタスクに取り組むために,変圧器を用いたボリュームアグリゲーション(VAT)を提案する。
VATは畳み込みとトランスフォーマーの両方を使用して、クエリとサポートの間の高次元相関マップを効率的に処理する。
提案手法は,意味対応タスクにおける標準ベンチマークにおいても,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-12-22T06:18:51Z) - Dense Unsupervised Learning for Video Segmentation [49.46930315961636]
ビデオオブジェクトセグメンテーション(VOS)のための教師なし学習のための新しいアプローチを提案する。
これまでの研究とは異なり、我々の定式化によって、完全に畳み込みの仕組みで、密集した特徴表現を直接学習することができる。
我々の手法は、トレーニングデータや計算能力が大幅に少ないにもかかわらず、以前の作業のセグメンテーション精度を超える。
論文 参考訳(メタデータ) (2021-11-11T15:15:11Z) - Parameter Decoupling Strategy for Semi-supervised 3D Left Atrium
Segmentation [0.0]
本稿では,パラメータ分離戦略に基づく半教師付きセグメンテーションモデルを提案する。
提案手法は,Atrial Challengeデータセット上での最先端の半教師付き手法と競合する結果を得た。
論文 参考訳(メタデータ) (2021-09-20T14:51:42Z) - EiGLasso for Scalable Sparse Kronecker-Sum Inverse Covariance Estimation [1.370633147306388]
我々はKronecker-sum逆共分散推定のための高度にスケーラブルなKronecker-sum逆共分散推定法であるEeiGLassoを紹介する。
EiGLassoは既存の手法に比べて2~3桁の速度アップを実現していることを示す。
論文 参考訳(メタデータ) (2021-05-20T16:22:50Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - FDA: Fourier Domain Adaptation for Semantic Segmentation [82.4963423086097]
本稿では,教師なし領域適応の簡易な手法について述べる。一方の低周波スペクトルを他方と交換することにより,音源と対象分布の相違を低減できる。
本手法を意味的セグメンテーション(semantic segmentation, 意味的セグメンテーション, 意味的セグメンテーション)で説明する。
以上の結果から,より高度な手法が学習に苦しむデータにおいて,単純な手順であってもニュアンス変動を低減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-11T22:20:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。