論文の概要: Are standard Object Segmentation models sufficient for Learning
Affordance Segmentation?
- arxiv url: http://arxiv.org/abs/2107.02095v1
- Date: Mon, 5 Jul 2021 15:34:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 15:13:10.221195
- Title: Are standard Object Segmentation models sufficient for Learning
Affordance Segmentation?
- Title(参考訳): 標準のオブジェクトセグメンテーションモデルは、学習精度セグメンテーションに十分か?
- Authors: Hugo Caselles-Dupr\'e, Michael Garcia-Ortiz, David Filliat
- Abstract要約: 本研究は,現在最先端のPCS R-CNNを割当価格問題に適用することにより,現状の最先端よりも優れた性能を示すことを示す。
余剰学習のためのより良いベンチマークには、アクション能力を含めるべきである、と私たちは主張する。
- 参考スコア(独自算出の注目度): 3.845877724862319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Affordances are the possibilities of actions the environment offers to the
individual. Ordinary objects (hammer, knife) usually have many affordances
(grasping, pounding, cutting), and detecting these allow artificial agents to
understand what are their possibilities in the environment, with obvious
application in Robotics. Proposed benchmarks and state-of-the-art prediction
models for supervised affordance segmentation are usually modifications of
popular object segmentation models such as Mask R-CNN. We observe that
theoretically, these popular object segmentation methods should be sufficient
for detecting affordances masks. So we ask the question: is it necessary to
tailor new architectures to the problem of learning affordances? We show that
applying the out-of-the-box Mask R-CNN to the problem of affordances
segmentation outperforms the current state-of-the-art. We conclude that the
problem of supervised affordance segmentation is included in the problem of
object segmentation and argue that better benchmarks for affordance learning
should include action capacities.
- Abstract(参考訳): 費用は、環境が個人に提供する行動の可能性である。
通常の物体(ハンマー、ナイフ)は、通常、多くの余裕(彫刻、打製、切断)を持ち、これらを検出することで、ロボットに明らかな応用によって、人工エージェントが環境における彼らの可能性を理解することができる。
教師付きアフォーダンスセグメンテーションのための提案ベンチマークと最先端予測モデルは通常、マスクr-cnnのような一般的なオブジェクトセグメンテーションモデルの修正である。
理論的には、これらの人気オブジェクトセグメンテーション法は、余剰マスクを検出するのに十分である。
新しいアーキテクチャを学習代の問題に合わせる必要があるか?
既成のマスクr-cnnを手頃なセグメンテーション問題に適用することは,現在の最先端よりも優れていることを示す。
対象セグメンテーションの問題には教師付きアフォーアンスセグメンテーションの問題が含まれており、アフォーアンス学習のためのより良いベンチマークにはアクションキャパシティを含めるべきであると主張する。
関連論文リスト
- MaskUno: Switch-Split Block For Enhancing Instance Segmentation [0.0]
マスク予測を洗練されたROIを処理し、それらを分類し、特定のマスク予測者に割り当てるスイッチスプリットブロックに置き換えることを提案する。
平均平均精度(mAP)が2.03%上昇し,80クラスにおいて高い成績を示した。
論文 参考訳(メタデータ) (2024-07-31T10:12:14Z) - OoDIS: Anomaly Instance Segmentation Benchmark [57.89836988990543]
我々は、最もよく使われる異常セグメンテーションベンチマークを拡張して、インスタンスセグメンテーションタスクを含める。
この分野の開発は遅れており、主に専用のベンチマークがないためである。
異常なインスタンスセグメンテーション手法の評価は、この課題が未解決の問題のままであることを示している。
論文 参考訳(メタデータ) (2024-06-17T17:59:56Z) - Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Robotic Scene Segmentation with Memory Network for Runtime Surgical
Context Inference [8.600278838838163]
Space Time Cor correspondingence Network (STCN) は、二分セグメンテーションを行い、クラス不均衡の影響を最小限に抑えるメモリネットワークである。
針や糸などのセグメント化が困難なオブジェクトに対して,STCNが優れたセグメンテーション性能を実現することを示す。
また,性能を損なうことなく,実行時にセグメンテーションとコンテキスト推論を実行できることを示す。
論文 参考訳(メタデータ) (2023-08-24T13:44:55Z) - LISA: Reasoning Segmentation via Large Language Model [68.24075852136761]
そこで我々は,新たなセグメンテーションタスク,すなわち推論セグメンテーションを提案する。
このタスクは、複雑で暗黙的なクエリテキストを与えられたセグメンテーションマスクを出力するように設計されている。
提案するLISA: Large Language Instructed Assistantは,マルチモーダル大規模言語モデルの言語生成能力を継承する。
論文 参考訳(メタデータ) (2023-08-01T17:50:17Z) - Masked Supervised Learning for Semantic Segmentation [5.177947445379688]
Masked Supervised Learning (MaskSup)は、短いコンテキストと長距離コンテキストの両方をモデル化する効果的なシングルステージ学習パラダイムである。
提案手法は計算効率が良く,平均交叉和(mIoU)において10%向上することを示す。
論文 参考訳(メタデータ) (2022-10-03T13:30:19Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Target-Aware Object Discovery and Association for Unsupervised Video
Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。
より正確で効率的な時間区分のための新しいアプローチを紹介します。
DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-10T14:39:44Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - A Three-Stage Self-Training Framework for Semi-Supervised Semantic
Segmentation [0.9786690381850356]
本稿では,セマンティックセグメンテーションのための3段階の自己学習フレームワークとして,包括的解を提案する。
本手法の鍵となる考え方は擬似マスク統計情報の抽出である。
次に、一貫性を強制するマルチタスクモデルを用いて擬似マスクの不確実性を減少させる。
論文 参考訳(メタデータ) (2020-12-01T21:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。