Fugu-MT 論文翻訳(概要): Few-shot Semantic Segmentation with Support-induced Graph Convolutional Network

論文の概要: Few-shot Semantic Segmentation with Support-induced Graph Convolutional Network

arxiv url: http://arxiv.org/abs/2301.03194v1
Date: Mon, 9 Jan 2023 08:00:01 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-10 17:07:58.918648
Title: Few-shot Semantic Segmentation with Support-induced Graph Convolutional Network
Title（参考訳）: グラフ畳み込みネットワークを用いた数ショットセマンティックセマンティックセグメンテーション
Authors: Jie Liu, Yanqi Bao, Wenzhe Ying, Haochen Wang, Yang Gao, Jan-Jakob Sonke, Efstratios Gavves
Abstract要約: Few-shot semantic segmentation (FSS) は、いくつかの注釈付きサンプルで新しいオブジェクトのセグメンテーションを実現することを目的としている。本稿では,クエリ画像中の遅延コンテキスト構造を明示的に抽出するために,Support-induced Graph Convolutional Network (SiGCN)を提案する。
参考スコア（独自算出の注目度）: 28.46908214462594
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Few-shot semantic segmentation (FSS) aims to achieve novel objects segmentation with only a few annotated samples and has made great progress recently. Most of the existing FSS models focus on the feature matching between support and query to tackle FSS. However, the appearance variations between objects from the same category could be extremely large, leading to unreliable feature matching and query mask prediction. To this end, we propose a Support-induced Graph Convolutional Network (SiGCN) to explicitly excavate latent context structure in query images. Specifically, we propose a Support-induced Graph Reasoning (SiGR) module to capture salient query object parts at different semantic levels with a Support-induced GCN. Furthermore, an instance association (IA) module is designed to capture high-order instance context from both support and query instances. By integrating the proposed two modules, SiGCN can learn rich query context representation, and thus being more robust to appearance variations. Extensive experiments on PASCAL-5i and COCO-20i demonstrate that our SiGCN achieves state-of-the-art performance.
Abstract（参考訳）: 少数ショットセマンティクスセグメンテーション(fss)は、少数の注釈付きサンプルで新しいオブジェクトセグメンテーションを達成することを目的としており、近年は大きな進歩を遂げている。既存のFSSモデルのほとんどは、FSSに取り組むためのサポートとクエリのマッチングに重点を置いている。しかし、同一カテゴリのオブジェクト間の外観の変化は非常に大きく、信頼性の低い特徴マッチングとクエリマスクの予測に繋がる可能性がある。そこで本稿では,問合せ画像の潜在コンテキスト構造を明示的に抽出する,SiGCN(Support-induced Graph Convolutional Network)を提案する。具体的には,サポートによって誘導されるgcnを用いて,異なる意味レベルでの問い合わせ対象部品をキャプチャするサポート駆動型グラフ推論(sigr)モジュールを提案する。さらに、インスタンスアソシエーション(IA)モジュールは、サポートインスタンスとクエリインスタンスの両方から高階インスタンスコンテキストをキャプチャするように設計されている。提案された2つのモジュールを統合することで、SiGCNはリッチなクエリコンテキスト表現を学習できる。 PASCAL-5i と COCO-20i の広範囲な実験により,SiGCN が最先端の性能を発揮することが示された。

関連論文リスト

Matching-Based Few-Shot Semantic Segmentation Models Are Interpretable by Design [8.993770750003673]
Few-Shot Semantic (FSS)モデルは、最小限のラベル付き例を持つ新規クラスのセグメンテーションにおいて強力な性能を達成する。本稿では、マッチングベースのFSSモデルを解釈するための最初の専用手法を提案する。 Affinity Explainer アプローチは,画像のどのピクセルがクエリセグメンテーション予測に最も寄与しているかを示す属性マップを抽出する。
論文参考訳（メタデータ） (2025-11-22T19:22:10Z)
QID: Efficient Query-Informed ViTs in Data-Scarce Regimes for OCR-free Visual Document Understanding [53.69841526266547]
トレーニング済みのVision-Language Modelを新しいデータセットで微調整することは、ビジョンエンコーダの最適化に不足することが多い。視覚エンコーダにクエリの埋め込みを統合する,新しい,合理化されたアーキテクチャ保存アプローチであるQIDを導入する。
論文参考訳（メタデータ） (2025-04-03T18:47:16Z)
DSV-LFS: Unifying LLM-Driven Semantic Cues with Visual Features for Robust Few-Shot Segmentation [2.7624021966289605]
Few-shot semantic segmentation (FSS) は、限定されたラベル付き例のみを使用して、モデルが新規/未使用のオブジェクトクラスをセグメンテーションできるようにすることを目的としている。本稿では,大規模言語モデル(LLM)を用いて,汎用クラス意味情報をクエリ画像に適用する新しいフレームワークを提案する。我々のフレームワークは、様々なシナリオにまたがって、新しいクラスへの高度な一般化と堅牢性を示す、最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-03-06T01:42:28Z)
Overcoming Support Dilution for Robust Few-shot Semantic Segmentation [97.87058176900179]
Few-shot Semantic(FSS)は、限定的なサポートイメージを使用してクエリイメージに関連のないオブジェクトをセグメントする難しいタスクである。近年のFSS法は, ショット数の増加にともなって, より悪化することが観察された。本研究は,サポートダイゾリューションと呼ばれるこの課題について検討し,本研究の目的は,生のサポートプールにおいて,これらの高分散サポートを認識し,選択し,保存し,強化することである。
論文参考訳（メタデータ） (2025-01-23T10:26:48Z)
Beyond Mask: Rethinking Guidance Types in Few-shot Segmentation [67.35274834837064]
我々は、テキスト、マスク、ボックス、画像からのプロンプトを統合するユニバーサルビジョン言語フレームワーク(UniFSS)を開発した。 UniFSSは最先端の手法よりも優れています。
論文参考訳（メタデータ） (2024-07-16T08:41:01Z)
Embedding Generalized Semantic Knowledge into Few-Shot Remote Sensing Segmentation [26.542268630980814]
リモートセンシング(RS)画像のためのFew-shot segmentation (FSS)は、限られた注釈付きサンプルからのサポート情報を活用して、新しいクラスのクエリセグメンテーションを実現する。従来の取り組みは、制約された支援サンプルの集合からセグメント化を導く視覚的手がかりをマイニングすることに集中している。本稿では,一般的な意味知識を効果的に活用する全体論的意味埋め込み(HSE)手法を提案する。
論文参考訳（メタデータ） (2024-05-22T14:26:04Z)
Boosting Few-Shot Segmentation via Instance-Aware Data Augmentation and Local Consensus Guided Cross Attention [7.939095881813804]
少ないショットセグメンテーションは、注釈付き画像のみを提供する新しいタスクに迅速に適応できるセグメンテーションモデルをトレーニングすることを目的としている。本稿では,対象オブジェクトの相対的サイズに基づいて,サポートイメージを拡大するIDA戦略を提案する。提案したIDAは,サポートセットの多様性を効果的に向上し,サポートイメージとクエリイメージ間の分散一貫性を促進する。
論文参考訳（メタデータ） (2024-01-18T10:29:10Z)
Few-shot Medical Image Segmentation via Cross-Reference Transformer [3.2634122554914]
Few-shot segmentation(FSS)は、少数のラベル付きサンプルから新しいカテゴリを学習することで、これらの課題に対処する可能性がある。そこで本研究では,クロス参照変換器を用いた画像分割ネットワークを提案する。実験の結果,CTデータセットとMRIデータセットの両方で良好な結果が得られた。
論文参考訳（メタデータ） (2023-04-19T13:05:18Z)
Multi-Content Interaction Network for Few-Shot Segmentation [37.80624074068096]
Few-Shot COCOは、サポート画像の制限とクラス内における大きな相違に挑戦している。この問題を解決するために,MCINet(Multi-Content Interaction Network)を提案する。 MCINetは、他のクエリブランチから低レベルの構造情報を高レベルのセマンティック機能に組み込むことで、FSSを改善している。
論文参考訳（メタデータ） (2023-03-11T04:21:59Z)
Support-set based Multi-modal Representation Enhancement for Video Captioning [121.70886789958799]
サンプル間で共有されるセマンティックサブ空間において、リッチな情報をマイニングするためのサポートセットベースのマルチモーダル表現拡張(SMRE)モデルを提案する。具体的には、サンプル間の基礎となる関係を学習し、意味的関連視覚要素を得るためのサポートセットを構築するためのサポートセット構築(SC)モジュールを提案する。本研究では,SST(Semantic Space Transformation)モジュールを設計し,相対距離を制約し,マルチモーダルインタラクションを自己管理的に管理する。
論文参考訳（メタデータ） (2022-05-19T03:40:29Z)
Graph Adaptive Semantic Transfer for Cross-domain Sentiment Classification [68.06496970320595]
クロスドメイン感情分類(CDSC)は、ソースドメインから学んだ伝達可能なセマンティクスを使用して、ラベルなしのターゲットドメインにおけるレビューの感情を予測することを目的としている。本稿では、単語列と構文グラフの両方からドメイン不変セマンティクスを学習できる適応型構文グラフ埋め込み法であるグラフ適応意味伝達(GAST)モデルを提案する。
論文参考訳（メタデータ） (2022-05-18T07:47:01Z)
Dynamic Prototype Convolution Network for Few-Shot Semantic Segmentation [33.93192093090601]
少数ショットセマンティックセグメンテーション(FSS)の鍵となる課題は、サポートとクエリ機能間の望ましいインタラクションをどのように調整するかである。そこで本研究では,FSSの精度を高めるために,本発明のプロトタイプコンボリューションネットワーク(DPCN)を提案する。当社のDPCNは、kショットFSS設定下でも柔軟で効率的です。
論文参考訳（メタデータ） (2022-04-22T11:12:37Z)
Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS) 我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文参考訳（メタデータ） (2021-08-04T20:09:21Z)
CoADNet: Collaborative Aggregation-and-Distribution Networks for Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文参考訳（メタデータ） (2020-11-10T04:28:11Z)
Generalized Few-shot Semantic Segmentation [68.69434831359669]
本稿では,GFS-Seg(Generalized Few-Shot Semantic)と呼ばれる新しいベンチマークを導入する。 GFS-セグにおいて、先行する最先端の一般化が不足していることを示す最初の研究である。本研究では,1)支援サンプルから共起前の知識を活用すること,2)各クエリ画像の内容に基づいて条件付き情報に動的に拡張することにより,性能を著しく向上するコンテキスト認識型プロトタイプ学習(CAPL)を提案する。
論文参考訳（メタデータ） (2020-10-11T10:13:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。