論文の概要: Semantic segmentation with reward
- arxiv url: http://arxiv.org/abs/2505.17905v1
- Date: Fri, 23 May 2025 13:52:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:34.118464
- Title: Semantic segmentation with reward
- Title(参考訳): 報酬を伴う意味的セグメンテーション
- Authors: Xie Ting, Ye Huang, Zhilin Liu, Lixin Duan,
- Abstract要約: RSS(Reward in Semantic)は、報酬に基づく強化学習を2つのレベルで提供する純粋意味セグメンテーションに応用する。
RSSは、プログレッシブスケール報酬(PSR)やペアワイドグラニュラルディファクト(PSD)など、様々な新しいテクノロジーを取り入れている。
ベンチマークデータセットの実験と視覚化により、提案したRSSがセマンティックセグメンテーションネットワークの2つのレベルにおける収束を確実にすることを示す。
- 参考スコア(独自算出の注目度): 15.096167151990626
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world scenarios, pixel-level labeling is not always available. Sometimes, we need a semantic segmentation network, and even a visual encoder can have a high compatibility, and can be trained using various types of feedback beyond traditional labels, such as feedback that indicates the quality of the parsing results. To tackle this issue, we proposed RSS (Reward in Semantic Segmentation), the first practical application of reward-based reinforcement learning on pure semantic segmentation offered in two granular levels (pixel-level and image-level). RSS incorporates various novel technologies, such as progressive scale rewards (PSR) and pair-wise spatial difference (PSD), to ensure that the reward facilitates the convergence of the semantic segmentation network, especially under image-level rewards. Experiments and visualizations on benchmark datasets demonstrate that the proposed RSS can successfully ensure the convergence of the semantic segmentation network on two levels of rewards. Additionally, the RSS, which utilizes an image-level reward, outperforms existing weakly supervised methods that also rely solely on image-level signals during training.
- Abstract(参考訳): 現実のシナリオでは、ピクセルレベルのラベリングは必ずしも利用できない。
セマンティックセグメンテーションネットワークが必要な場合もあり、ビジュアルエンコーダでさえ高い互換性を持ち、解析結果の品質を示すフィードバックなど、従来のラベル以外のさまざまなタイプのフィードバックを使ってトレーニングすることができる。
この問題に対処するため、私たちは2つの粒度レベル(ピクセルレベルと画像レベル)で提供される純粋セマンティックセグメンテーションに対する報酬ベース強化学習の最初の実践的応用であるRSS(Reward in Semantic Segmentation)を提案した。
RSSは、プログレッシブスケール報酬(PSR)やペアワイド空間差分(PSD)など、様々な新しい技術を導入し、特に画像レベルの報酬の下で、その報酬がセマンティックセグメンテーションネットワークの収束を促進することを保証する。
ベンチマークデータセットの実験と視覚化により、提案したRSSがセマンティックセグメンテーションネットワークの2つのレベルにおける収束を確実にすることを示す。
さらに、画像レベルの報酬を利用するRSSは、トレーニング中に画像レベルの信号にのみ依存する、既存の弱い教師付き手法よりも優れています。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment [112.45442468794658]
本稿では,RealignDiffという2段階の粗大なセマンティックアライメント手法を提案する。
粗いセマンティックリアライメントフェーズにおいて、生成された画像キャプションと与えられたテキストプロンプトとのセマンティックな相違を評価するために、新しいキャプション報酬を提案する。
微妙なセマンティックリアライメントステージは、局所的な密集キャプション生成モジュールと再重み付けアテンション変調モジュールを用いて、局所的なセマンティックビューから生成された画像を洗練する。
論文 参考訳(メタデータ) (2023-05-31T06:59:21Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - ISLE: A Framework for Image Level Semantic Segmentation Ensemble [5.137284292672375]
従来のセマンティックセグメンテーションネットワークは、最先端の予測品質に到達するために、大量のピクセル単位のアノテートラベルを必要とする。
クラスレベルで異なるセマンティックセグメンテーション手法のセットに「擬似ラベル」のアンサンブルを用いるISLEを提案する。
私たちはISLEの個々のコンポーネントよりも2.4%改善しています。
論文 参考訳(メタデータ) (2023-03-14T13:36:36Z) - SLLEN: Semantic-aware Low-light Image Enhancement Network [92.80325772199876]
LLEメインネットワーク(LLEmN)とSS補助ネットワーク(SSaN)からなる意味認識型LLEネットワーク(SSLEN)を開発する。
現在利用可能なアプローチとは異なり、提案されているSLLENは、LLEを支援するためにIEF、HSF、SSデータセットなどのセマンティック情報を完全に読み取ることができる。
提案したSLLENと他の最先端技術との比較により,LLEの品質に対するSLLENの優位性が示された。
論文 参考訳(メタデータ) (2022-11-21T15:29:38Z) - Open-world Semantic Segmentation via Contrasting and Clustering
Vision-Language Embedding [95.78002228538841]
本研究では,様々なオープンワールドカテゴリのセマンティックオブジェクトを高密度アノテーションを使わずにセマンティックオブジェクトのセマンティックオブジェクトのセマンティック化を学習するための,新しいオープンワールドセマンティックセマンティックセマンティックセマンティクスパイプラインを提案する。
提案手法は任意のカテゴリのオブジェクトを直接分割し、3つのベンチマークデータセット上でデータラベリングを必要とするゼロショットセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2022-07-18T09:20:04Z) - Hyperspectral Image Semantic Segmentation in Cityscapes [34.08657656710946]
本稿では,HSIを用いた都市景観におけるセマンティックセグメンテーションについて述べる。
都市シーンにおける高解像度のHSIには豊富なスペクトル情報が含まれているという考えに基づいており、手動ラベリングなしでセマンティクスと容易に関連付けることができる。
スペクトル情報を利用して粗いラベルをより細かく改善する半教師付きHSIセマンティックセグメンテーションネットワークを紹介します。
論文 参考訳(メタデータ) (2020-12-18T09:29:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。