Fugu-MT 論文翻訳(概要): Weakly-Supervised Affordance Grounding Guided by Part-Level Semantic Priors

論文の概要: Weakly-Supervised Affordance Grounding Guided by Part-Level Semantic Priors

arxiv url: http://arxiv.org/abs/2505.24103v1
Date: Fri, 30 May 2025 01:12:39 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-02 19:47:52.719007
Title: Weakly-Supervised Affordance Grounding Guided by Part-Level Semantic Priors
Title（参考訳）: パートレベル・セマンティック・プライオリティが案内する弱めに監督された耐震グラウンド
Authors: Peiran Xu, Yadong Mu,
Abstract要約: 擬似ラベルに基づく教師あり学習パイプラインを開発した。擬似ラベルは、空き地から部品名へのマッピングによってガイドされる、既製の部品分割モデルから生成される。これらのテクニックは,既成の基盤モデルに埋め込まれた静的オブジェクトの意味的知識を活用して,手頃な学習を改善する。
参考スコア（独自算出の注目度）: 22.957096921873678
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this work, we focus on the task of weakly supervised affordance grounding, where a model is trained to identify affordance regions on objects using human-object interaction images and egocentric object images without dense labels. Previous works are mostly built upon class activation maps, which are effective for semantic segmentation but may not be suitable for locating actions and functions. Leveraging recent advanced foundation models, we develop a supervised training pipeline based on pseudo labels. The pseudo labels are generated from an off-the-shelf part segmentation model, guided by a mapping from affordance to part names. Furthermore, we introduce three key enhancements to the baseline model: a label refining stage, a fine-grained feature alignment process, and a lightweight reasoning module. These techniques harness the semantic knowledge of static objects embedded in off-the-shelf foundation models to improve affordance learning, effectively bridging the gap between objects and actions. Extensive experiments demonstrate that the performance of the proposed model has achieved a breakthrough improvement over existing methods. Our codes are available at https://github.com/woyut/WSAG-PLSP .
Abstract（参考訳）: 本研究では,人間と物体の相互作用画像と高密度ラベルのない自我中心の物体画像を用いて,物体の空き領域を特定するためのモデルを構築する。従来の作業は、主にクラスアクティベーションマップ上に構築されており、セマンティックセグメンテーションに有効であるが、アクションや関数の配置には適さない可能性がある。近年の先進的な基礎モデルを活用し,擬似ラベルに基づく教師付きトレーニングパイプラインを開発した。擬似ラベルは、空き地から部品名へのマッピングによってガイドされる、既製の部品分割モデルから生成される。さらに,ラベルリファインディングステージ,きめ細かい機能アライメントプロセス,軽量な推論モジュールの3つの改良点を紹介した。これらのテクニックは、既成の基盤モデルに埋め込まれた静的オブジェクトのセマンティック知識を利用して、手頃な学習を改善し、オブジェクトとアクションのギャップを効果的に埋める。大規模な実験により,提案モデルの性能が既存手法よりも飛躍的に向上したことが示された。私たちのコードはhttps://github.com/woyut/WSAG-PLSP で利用可能です。

関連論文リスト

ContextFusion and Bootstrap: An Effective Approach to Improve Slot Attention-Based Object-Centric Learning [53.19029595226767]
スロットアテンションに基づくフレームワークは、オブジェクト指向学習における主要なアプローチとして登場した。現在の手法では、スロットからの再構築を可能にするため、トレーニングを通して安定した特徴空間が必要である。本稿では,既存のスロットアテンションモデルにシームレスに統合可能な新しいContextFusionステージとBootstrapブランチを提案する。
論文参考訳（メタデータ） (2025-09-02T07:19:25Z)
Selective Contrastive Learning for Weakly Supervised Affordance Grounding [21.34662128701812]
厳格に監督された余裕基盤は、第三者によるデモンストレーションから人間の学習を模倣しようと試みている。本稿では,各部分と対象の双方で,可視性関連キューを適応的に学習する,選択的プロトタイプおよび画素コントラスト目的を提案する。
論文参考訳（メタデータ） (2025-08-11T11:49:37Z)
Efficient Exploration and Discriminative World Model Learning with an Object-Centric Abstraction [19.59151245929067]
エージェントにオブジェクト中心のマッピング(アイテムとその属性のセットを記述する)を与えることで、より効率的な学習が可能になるかどうかを検討する。この問題は、ピクセルへの高レベルの状態抽象化でアイテムをモデル化し、プリミティブアクションへの高レベルの時間抽象化で属性を変更することで、階層的に最もよく解決されている。我々は,識別的世界モデルを学ぶ完全モデルに基づくアルゴリズムを提案し,数に基づく本質的な報酬のみを用いて効率的に探索し,その後に発見された(抽象的な)状態に到達する計画を立てる。
論文参考訳（メタデータ） (2024-08-21T17:59:31Z)
Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文参考訳（メタデータ） (2024-03-02T10:03:21Z)
Labeling Indoor Scenes with Fusion of Out-of-the-Box Perception Models [4.157013247909771]
ボトムアップセグメンテーション(SAM)、オブジェクト検出(Detic)、セマンティックセグメンテーション(MaskFormer)の最先端モデルを活用することを提案する。室内環境におけるセマンティックセグメンテーションとオブジェクトインスタンス検出のための擬似ラベルを得るための,コスト効率の高いラベリング手法を開発することを目的とする。提案手法の有効性を,Active VisionデータセットとADE20Kデータセットに示す。
論文参考訳（メタデータ） (2023-11-17T21:58:26Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
RaSP: Relation-aware Semantic Prior for Weakly Supervised Incremental Segmentation [28.02204928717511]
本稿では,事前学習したクラスから新しいクラスにオブジェクトを移すための弱い教師付きアプローチを提案する。クラス間の単純なペアインタラクションでさえ、古いクラスと新しいクラスのセグメンテーションマスクの品質を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2023-05-31T14:14:21Z)
LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文参考訳（メタデータ） (2022-10-14T19:13:36Z)
Saliency Guided Inter- and Intra-Class Relation Constraints for Weakly Supervised Semantic Segmentation [66.87777732230884]
本稿では,活性化対象領域の拡大を支援するために,Salliency Guided Inter-およびIntra-Class Relation Constrained (I$2$CRC) フレームワークを提案する。また,オブジェクトガイド付きラベルリファインメントモジュールを導入し,セグメンテーション予測と初期ラベルをフル活用し,優れた擬似ラベルを得る。
論文参考訳（メタデータ） (2022-06-20T03:40:56Z)
Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文参考訳（メタデータ） (2021-02-16T17:58:57Z)
Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文参考訳（メタデータ） (2020-10-19T12:36:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。