論文の概要: CFNet: Learning Correlation Functions for One-Stage Panoptic
Segmentation
- arxiv url: http://arxiv.org/abs/2201.04796v1
- Date: Thu, 13 Jan 2022 05:31:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-14 13:56:48.507490
- Title: CFNet: Learning Correlation Functions for One-Stage Panoptic
Segmentation
- Title(参考訳): CFNet:ワンステージパノプティクスセグメンテーションのための相関関数の学習
- Authors: Yifeng Chen, Wenqing Chu, Fangfang Wang, Ying Tai, Ran Yi, Zhenye Gan,
Liang Yao, Chengjie Wang, Xi Li
- Abstract要約: バックボーンの特徴を高めるために,まず,異なる場所のセマンティックレベルとインスタンスレベルの相関関係を推定することを提案する。
次に,改良された識別特徴をそれぞれ対応するセグメンテーションヘッドに供給する。
PQは45.1ドル%、ADE20kは32.6ドル%である。
- 参考スコア(独自算出の注目度): 46.252118473248316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, there is growing attention on one-stage panoptic segmentation
methods which aim to segment instances and stuff jointly within a fully
convolutional pipeline efficiently. However, most of the existing works
directly feed the backbone features to various segmentation heads ignoring the
demands for semantic and instance segmentation are different: The former needs
semantic-level discriminative features, while the latter requires features to
be distinguishable across instances. To alleviate this, we propose to first
predict semantic-level and instance-level correlations among different
locations that are utilized to enhance the backbone features, and then feed the
improved discriminative features into the corresponding segmentation heads,
respectively. Specifically, we organize the correlations between a given
location and all locations as a continuous sequence and predict it as a whole.
Considering that such a sequence can be extremely complicated, we adopt
Discrete Fourier Transform (DFT), a tool that can approximate an arbitrary
sequence parameterized by amplitudes and phrases. For different tasks, we
generate these parameters from the backbone features in a fully convolutional
way which is optimized implicitly by corresponding tasks. As a result, these
accurate and consistent correlations contribute to producing plausible
discriminative features which meet the requirements of the complicated panoptic
segmentation task. To verify the effectiveness of our methods, we conduct
experiments on several challenging panoptic segmentation datasets and achieve
state-of-the-art performance on MS COCO with $45.1$\% PQ and ADE20k with
$32.6$\% PQ.
- Abstract(参考訳): 近年, 完全畳み込みパイプライン内において, インスタンスを分割することを目的とした一段分割方式に注目が集まっている。
しかし、既存の作品の多くは、セマンティクスとインスタンスセグメンテーションの要求を無視して、バックボーン機能を様々なセグメンテーションヘッドに直接供給している。
これを緩和するため,我々はまず,バックボーン機能の強化に使用される異なる場所間の意味レベルおよびインスタンスレベルの相関を予測し,改良された識別特徴を対応するセグメンテーションヘッドにそれぞれ与える。
具体的には,与えられた位置とすべての位置との相関を連続列として整理し,全体として予測する。
このようなシーケンスは非常に複雑であるので、振幅やフレーズによってパラメータ化された任意のシーケンスを近似できる離散フーリエ変換(DFT)を採用する。
異なるタスクに対して、対応するタスクによって暗黙的に最適化された完全な畳み込み方式で、バックボーン機能からこれらのパラメータを生成する。
結果として、これらの正確で一貫した相関関係は、複雑な汎視的セグメンテーションタスクの要求を満たす可塑性判別的特徴を生み出すことに寄与する。
提案手法の有効性を検証するため,MS COCOでは45.1$\%のPQ,ADE20kでは32.6$\%のPQを用いて,いくつかの挑戦的な汎視的セグメンテーションデータセットの実験を行った。
関連論文リスト
- CHASE: Learning Convex Hull Adaptive Shift for Skeleton-based Multi-Entity Action Recognition [10.045163723630159]
CHASEはサンプル適応正規化法として機能し、濃度間分布の相違を緩和する。
このアプローチはシングルエンタリティのバックボーンにシームレスに適応し、マルチエンタリティシナリオにおけるパフォーマンスを向上します。
論文 参考訳(メタデータ) (2024-10-09T17:55:43Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
また,モーザイクアーティファクトを緩和するのには単純だが有効であるHR特徴量に対して,きめ細かな近傍選択戦略を開発した。
提案するReSFUフレームワークは,異なるセグメンテーションアプリケーション上での良好な性能を一貫して達成する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Category Feature Transformer for Semantic Segmentation [34.812688388968525]
CFTは、各アグリゲーションプロセス中の高レベル特徴から、個々のセマンティックカテゴリのための統合された機能埋め込みを学習する。
一般的なセマンティックセグメンテーションベンチマークについて広範な実験を行う。
提案したCFTは、挑戦的なADE20Kデータセット上のモデルパラメータと計算を大幅に削減した、説得力のある55.1% mIoUを得る。
論文 参考訳(メタデータ) (2023-08-10T13:44:54Z) - Contrastive Conditional Neural Processes [45.70735205041254]
条件付きニューラル・プロセス(CNP)は、メタラーニング環境下でのプロセスの機能に近い確率的推論でニューラルネットワークをブリッジする。
2つの補助的コントラスト分岐が階層的に設定される。すなわち、インストラクテーション時間的コントラスト学習(tt TCL)とクロスストラクテーション関数コントラスト学習(tt FCL)である。
実験により、tt TCLは観測の高レベルの抽象化を捉えるのに対し、tt FCLは基底関数の同定に役立ち、より効率的な表現を提供することを示す。
論文 参考訳(メタデータ) (2022-03-08T10:08:45Z) - GaitStrip: Gait Recognition via Effective Strip-based Feature
Representations and Multi-Level Framework [34.397404430838286]
本稿では,様々なレベルの歩行情報を抽出するために,GaitStripという名前のストリップベースマルチレベル歩行認識ネットワークを提案する。
具体的には、私たちの高レベルブランチは歩行シーケンスのコンテキストを探求し、低レベルブランチは詳細な姿勢変化に焦点を当てています。
我々のGaitStripは、通常の歩行条件と複雑な歩行条件の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-03-08T09:49:48Z) - Assessing Data Efficiency in Task-Oriented Semantic Parsing [54.87705549021248]
我々は、ある品質バーを達成するのに、ドメイン内の「ターゲット」データがどれだけ必要であるかを近似した4段階のプロトコルを導入する。
我々は,タスク指向セマンティック解析の実践者に対して,その柔軟性と適用性を示す実世界の2つのケーススタディに適用する。
論文 参考訳(メタデータ) (2021-07-10T02:43:16Z) - Unsupervised segmentation via semantic-apparent feature fusion [21.75371777263847]
本研究では,意味親和性特徴融合(SAFF)に基づく教師なし前景セグメンテーション手法を提案する。
前景オブジェクトのキー領域はセマンティック機能によって正確に応答できる。
意味的特徴と明らかな特徴を融合させ、画像内適応的特徴量学習と画像間共通特徴学習のモジュールをカスケードすることにより、ベースラインをはるかに超える性能を達成する。
論文 参考訳(メタデータ) (2020-05-21T08:28:49Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z) - Supervised Learning for Non-Sequential Data: A Canonical Polyadic
Decomposition Approach [85.12934750565971]
特徴相互作用の効率的なモデリングは、非順序的タスクに対する教師あり学習の基盤となる。
この問題を緩和するため、モデルパラメータをテンソルとして暗黙的に表現することが提案されている。
表現性を向上するため,任意の高次元特徴ベクトルに特徴写像を適用できるようにフレームワークを一般化する。
論文 参考訳(メタデータ) (2020-01-27T22:38:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。