論文の概要: COCO-OLAC: A Benchmark for Occluded Panoptic Segmentation and Image Understanding
- arxiv url: http://arxiv.org/abs/2409.12760v2
- Date: Sun, 12 Jan 2025 11:44:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:25:04.243699
- Title: COCO-OLAC: A Benchmark for Occluded Panoptic Segmentation and Image Understanding
- Title(参考訳): COCO-OLAC:Occluded Panoptic Segmentationと画像理解のためのベンチマーク
- Authors: Wenbo Wei, Jun Wang, Abhir Bhalerao,
- Abstract要約: 本稿では,COCO-OLAC (COCO Occlusion Labels for All Computer Vision Tasks) という大規模データセットを提案する。
COCO-OLACは、イメージを3つの知覚された閉塞レベルに手動でラベル付けすることで、COCOデータセットから派生した。
提案手法はベースラインモデルの性能を高め,COCO-OLACデータセット上でのSOTA性能を実現する。
- 参考スコア(独自算出の注目度): 8.261771972240778
- License:
- Abstract: To help address the occlusion problem in panoptic segmentation and image understanding, this paper proposes a new large-scale dataset named COCO-OLAC (COCO Occlusion Labels for All Computer Vision Tasks), which is derived from the COCO dataset by manually labelling images into three perceived occlusion levels. Using COCO-OLAC, we systematically assess and quantify the impact of occlusion on panoptic segmentation on samples having different levels of occlusion. Comparative experiments with SOTA panoptic models demonstrate that the presence of occlusion significantly affects performance, with higher occlusion levels resulting in notably poorer performance. Additionally, we propose a straightforward yet effective method as an initial attempt to leverage the occlusion annotation using contrastive learning to render a model that learns a more robust representation capturing different severities of occlusion. Experimental results demonstrate that the proposed approach boosts the performance of the baseline model and achieves SOTA performance on the proposed COCO-OLAC dataset.
- Abstract(参考訳): そこで本研究では,COCOデータセットから得られたCOCO-OLAC(COCO Occlusion Labels for All Computer Vision Tasks)と呼ばれる大規模データセットを提案する。
COCO-OLACを用いて, 閉塞レベルが異なる試料に対するパノプティカルセグメンテーションに対する閉塞の影響を系統的に評価し, 定量化する。
SOTAパノプティカルモデルとの比較実験により、閉塞の存在が性能に著しく影響を与え、高い閉塞レベルが顕著に性能を低下させることを示した。
さらに,異なるオクルージョンの重大さをキャプチャするより堅牢な表現を学習するモデルを描画するために,コントラッシブラーニングを用いてオクルージョンアノテーションを活用するための最初の試みとして,単純かつ効果的な手法を提案する。
実験により,提案手法はベースラインモデルの性能を向上し,COCO-OLACデータセット上でのSOTA性能を実現することを示す。
関連論文リスト
- CMU-Flownet: Exploring Point Cloud Scene Flow Estimation in Occluded Scenario [10.852258389804984]
閉塞はLiDARデータにおける点雲フレームのアライメントを妨げるが、シーンフローモデルでは不十分な課題である。
本稿では,CMU-Flownet(Relational Matrix Upsampling Flownet)を提案する。
CMU-Flownetは、隠されたFlyingthings3DとKITTYデータセットの領域内で、最先端のパフォーマンスを確立する。
論文 参考訳(メタデータ) (2024-04-16T13:47:21Z) - Discrepancy-based Active Learning for Weakly Supervised Bleeding
Segmentation in Wireless Capsule Endoscopy Images [36.39723547760312]
本稿では,CAMと地上の真理のギャップをいくつかのアノテーションで埋めるために,新たな離散型ベースEdアクティブラーニング手法を提案する。
具体的には、労働を解放するために、ノイズの多いCAMを正確なモデル予測といくつかの人間ラベルに置き換えるために、新しい離散デコーダとCAMPUS基準を設計する。
提案手法は最先端のアクティブラーニング手法より優れており,トレーニングデータの10%しかラベル付けされていない完全アノテートデータセットでトレーニングされたものと同等の性能を発揮する。
論文 参考訳(メタデータ) (2023-08-09T15:04:17Z) - Linking data separation, visual separation, and classifier performance
using pseudo-labeling by contrastive learning [125.99533416395765]
最終分類器の性能は、潜在空間に存在するデータ分離と、射影に存在する視覚的分離に依存すると論じる。
本研究は,ヒト腸管寄生虫の5つの現実的課題の画像データセットを1%の教師付きサンプルで分類し,その結果を実証する。
論文 参考訳(メタデータ) (2023-02-06T10:01:38Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - RCPS: Rectified Contrastive Pseudo Supervision for Semi-Supervised
Medical Image Segmentation [26.933651788004475]
我々は、RCPS(Rectified Contrastive Pseudo Supervision)という、新しい半教師付きセグメンテーション手法を提案する。
RCPSは、修正された疑似監督とボクセルレベルのコントラスト学習を組み合わせて、半教師付きセグメンテーションの有効性を向上させる。
実験結果から, 半教師付き医用画像分割における最先端手法と比較して, 高いセグメンテーション性能が得られた。
論文 参考訳(メタデータ) (2023-01-13T12:03:58Z) - Holistic Guidance for Occluded Person Re-Identification [7.662745552551165]
実世界のビデオ監視アプリケーションでは、人物の再識別(ReID)は、閉塞や検出エラーの影響に悩まされる。
個人識別ラベルにのみ依存するHG(Holistic Guidance)手法を提案する。
提案手法は, 包括的(非包括的)標本と, 包括的(非包括的)標本の包括的(包括的)な距離(DCD)分布を一致させることにより, この問題に対処する。
これに加えて、共同生成-識別的バックボーンは、デノナイジングオートエンコーダで訓練され、システムが制御される。
論文 参考訳(メタデータ) (2021-04-13T21:50:29Z) - Towards Unbiased COVID-19 Lesion Localisation and Segmentation via
Weakly Supervised Learning [66.36706284671291]
本研究では,画像レベルラベルのみに監視されたデータ駆動型フレームワークを提案する。
このフレームワークは、生成する対向ネットワークと病変特異的デコーダの助けを借りて、原画像から潜在的な病変を明示的に分離することができる。
論文 参考訳(メタデータ) (2021-03-01T06:05:49Z) - Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。
本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:40:55Z) - Peeking into occluded joints: A novel framework for crowd pose
estimation [88.56203133287865]
OPEC-NetはイメージガイドされたプログレッシブGCNモジュールで、推論の観点から見えない関節を推定する。
OCPoseは、隣接するインスタンス間の平均IoUに対して、最も複雑なOccluded Poseデータセットである。
論文 参考訳(メタデータ) (2020-03-23T19:32:40Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。