論文の概要: ConceptSeg-R1: Segment Any Concept via Meta-Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.20385v1
- Date: Tue, 19 May 2026 18:35:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.322835
- Title: ConceptSeg-R1: Segment Any Concept via Meta-Reinforcement Learning
- Title(参考訳): ConceptSeg-R1: メタ強化学習による概念のセグメンテーション
- Authors: Yuan Zhao, Youwei Pang, Jiaming Zuo, Wei Ji, Kailai Zhou, Bin Fan, Yunkang Cao, Lihe Zhang, Xiaofeng Liu, Huchuan Lu, Weisi Lin, Dacheng Tao, Xiaoqi Zhao,
- Abstract要約: プロンプト可能なセグメンテーションの最近の進歩は、視覚知覚をオブジェクトレベルのローカライゼーションから概念レベルの理解へとシフトさせてきた。
我々は文脈非依存(CI)、文脈依存(CD)、文脈推論(CR)の概念からなる3段階の分類によって概念セグメンテーションを定式化する。
本稿では,概念セグメンテーションをルール誘発概念基盤として再構成する統合フレームワークであるConceptSeg-R1を提案する。
- 参考スコア(独自算出の注目度): 134.61875033137514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent progress in promptable segmentation has shifted visual perception from object-level localization toward concept-level understanding. However, the notion of a concept remains under-specified, making it unclear whether current methods truly generalize beyond category recognition. In this work, we formalize generalized concept segmentation through a three-level taxonomy consisting of context-independent (CI), context-dependent (CD), and context-reasoning (CR) concepts, which reveals a clear capability gap across increasing levels of cognitive complexity. To address this challenge, we propose ConceptSeg-R1, a unified framework that reformulates concept segmentation as rule-induced concept grounding. At the core of our method is Meta-GRPO, a meta-reinforcement learning mechanism that learns transferable task rules from visual demonstrations and verifies them through proxy reasoning. The inferred reasoning states are then translated into segmentation-ready concept prompts via a lightweight concept translation module, enabling deductive application to target images. A shortcut routing strategy further preserves the native efficiency of segmentation models on simple cases. To systematically evaluate generalized concept segmentation, we conduct extensive experiments across diverse CI, CD, and CR concept segmentation benchmarks spanning natural, industrial, medical and reasoning-intensive domains. Without bells and whistles, ConceptSeg-R1 achieves strong performance across the full concept hierarchy while maintaining the native capability of promptable segmentation backbones. As an initial step toward segmenting any concept, we hope ConceptSeg-R1 can serve as a practical baseline for advancing segmentation from object-level prediction toward concept-level understanding.
- Abstract(参考訳): プロンプト可能なセグメンテーションの最近の進歩は、視覚知覚をオブジェクトレベルのローカライゼーションから概念レベルの理解へとシフトさせてきた。
しかし、概念の概念は未定のままであり、現在の方法が圏認識を超えて真に一般化するかどうかは不明である。
本研究では、文脈非依存(CI)、文脈依存(CD)、文脈共振(CR)の概念からなる3段階の分類法を用いて、一般化された概念セグメンテーションを定式化する。
この課題に対処するために,概念セグメンテーションをルール誘発概念基盤として再構成する統合フレームワークであるConceptSeg-R1を提案する。
提案手法のコアとなるメタ強化学習機構であるMeta-GRPOは,視覚的デモンストレーションから伝達可能なタスクルールを学習し,プロキシ推論によって検証する。
推論された推論状態は、軽量な概念翻訳モジュールを通じてセグメンテーション対応の概念プロンプトに変換される。
ショートカットルーティング戦略は、単純なケースでのセグメンテーションモデルのネイティブ効率をさらに維持する。
一般化された概念セグメンテーションを体系的に評価するために,我々は,自然,産業,医療,推論集約領域にまたがる多様なCI,CD,CR概念セグメンテーションベンチマークを幅広く実施する。
ベルとホイッスルがなければ、ConceptSeg-R1は、プロンプト可能なセグメンテーションバックボーンのネイティブ機能を維持しながら、完全な概念階層にわたって強力なパフォーマンスを達成する。
概念のセグメンテーションに向けた最初のステップとして、概念Seg-R1が、概念レベルの理解に向けてオブジェクトレベルの予測からセグメンテーションを進めるための実践的なベースラインとして機能することを願っています。
関連論文リスト
- Explaining CLIP Zero-shot Predictions Through Concepts [54.05282304471016]
EZPCを導入し,CLIPのゼロショット予測を人間に理解可能な概念で説明する。
本手法は,言語記述から学習した概念空間にCLIPの合同画像テキスト埋め込みを投影する。
提案手法は,CLIPの強いゼロショット分類精度を維持しつつ,意味のある概念レベルの説明を提供する。
論文 参考訳(メタデータ) (2026-03-30T09:31:33Z) - SCoCCA: Multi-modal Sparse Concept Decomposition via Canonical Correlation Analysis [7.4746628878102195]
CCA(Concept CCA)は,解釈可能な概念分解を実現しつつ,クロスモーダルな埋め込みを整列するフレームワークである。
我々はスパースの概念CCA(ScoCCA)を提案する。
提案手法は, 概念に基づくマルチモーダル埋め込みの説明を一般化し, 概念発見における最先端の性能向上を促進する。
論文 参考訳(メタデータ) (2026-03-14T10:45:59Z) - FaCT: Faithful Concept Traces for Explaining Neural Network Decisions [56.796533084868884]
ディープネットワークは、幅広いタスクで顕著なパフォーマンスを示しているが、それらの機能に関するグローバルな概念レベルの理解は、依然として重要な課題である。
本稿では,概念に基づく説明の忠実さを強調し,モデル独立な機械的概念説明を用いた新しいモデルを提案する。
私たちの概念はクラス間で共有され、あらゆるレイヤから、ロジットへの貢献と入力-視覚化を忠実にトレースすることができます。
論文 参考訳(メタデータ) (2025-10-29T13:35:46Z) - SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction [65.15449703659772]
ビデオオブジェクト(VOS)はコンピュータビジョンにおける中核的なタスクであり、ターゲットオブジェクトの追跡とセグメント化をモデルに要求する。
本稿では,従来の特徴マッチングから,高レベルなオブジェクト中心表現のプログレッシブな構築と利用へ移行する概念駆動セグメンテーションフレームワークであるセグメンテーション概念(SeC)を提案する。
SeCはSAM SeCVOSよりも11.8ポイント改善され、最先端のコンセプトを意識したビデオオブジェクトセグメンテーションが新たに確立された。
論文 参考訳(メタデータ) (2025-07-21T17:59:02Z) - Local Concept Embeddings for Analysis of Concept Distributions in Vision DNN Feature Spaces [1.0923877073891446]
学習した潜伏表現に対する洞察は、コンピュータビジョンタスクのディープニューラルネットワーク(DNN)を検証する上で不可欠である。
本稿では,学習した概念分布の探索を可能にする新しいローカル概念分析フレームワークを提案する。
文脈感度にもかかわらず,提案手法のセグメンテーション性能はグローバルベースラインと競合する。
論文 参考訳(メタデータ) (2023-11-24T12:22:00Z) - Coarse-to-Fine Concept Bottleneck Models [9.910980079138206]
この研究は、アンテホック解釈可能性、特に概念ボトルネックモデル(CBM)をターゲットにしている。
我々のゴールは、人間の理解可能な概念を2段階の粒度で、高度に解釈可能な意思決定プロセスを認めるフレームワークを設計することである。
この枠組みでは、概念情報は全体像と一般的な非構造概念の類似性にのみ依存せず、画像シーンのパッチ固有の領域に存在するより粒度の細かい概念情報を発見・活用するために概念階層の概念を導入している。
論文 参考訳(メタデータ) (2023-10-03T14:57:31Z) - Concept Gradient: Concept-based Interpretation Without Linear Assumption [77.96338722483226]
概念活性化ベクトル(Concept Activation Vector, CAV)は、与えられたモデルと概念の潜在表現の間の線形関係を学習することに依存する。
我々は、線形概念関数を超えて概念に基づく解釈を拡張する概念グラディエント(CG)を提案した。
我々は、CGがおもちゃの例と実世界のデータセットの両方でCAVより優れていることを実証した。
論文 参考訳(メタデータ) (2022-08-31T17:06:46Z) - GlanceNets: Interpretabile, Leak-proof Concept-based Models [23.7625973884849]
概念ベースモデル(CBM)は、高レベルの概念の語彙の獲得と推論によって、ハイパフォーマンスと解釈可能性を組み合わせる。
我々は、モデル表現と基礎となるデータ生成プロセスとの整合性の観点から、解釈可能性を明確に定義する。
GlanceNetsは不整合表現学習とオープンセット認識の技法を利用してアライメントを実現する新しいCBMである。
論文 参考訳(メタデータ) (2022-05-31T08:53:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。