論文の概要: Chair Segments: A Compact Benchmark for the Study of Object Segmentation
- arxiv url: http://arxiv.org/abs/2012.01250v1
- Date: Wed, 2 Dec 2020 14:54:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 04:09:43.810372
- Title: Chair Segments: A Compact Benchmark for the Study of Object Segmentation
- Title(参考訳): 椅子セグメンテーション:オブジェクトセグメンテーション研究のためのコンパクトベンチマーク
- Authors: Leticia Pinto-Alva, Ian K. Torres, Rosangel Garcia, Ziyan Yang,
Vicente Ordonez
- Abstract要約: ChairSegmentsは、オブジェクトセグメンテーションのための、新しくてコンパクトな半合成データセットである。
画像分類における最近の知見を反映した転帰学習における経験的知見を示す。
- 参考スコア(独自算出の注目度): 12.16129964498819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the years, datasets and benchmarks have had an outsized influence on the
design of novel algorithms. In this paper, we introduce ChairSegments, a novel
and compact semi-synthetic dataset for object segmentation. We also show
empirical findings in transfer learning that mirror recent findings for image
classification. We particularly show that models that are fine-tuned from a
pretrained set of weights lie in the same basin of the optimization landscape.
ChairSegments consists of a diverse set of prototypical images of chairs with
transparent backgrounds composited into a diverse array of backgrounds. We aim
for ChairSegments to be the equivalent of the CIFAR-10 dataset but for quickly
designing and iterating over novel model architectures for segmentation. On
Chair Segments, a U-Net model can be trained to full convergence in only thirty
minutes using a single GPU. Finally, while this dataset is semi-synthetic, it
can be a useful proxy for real data, leading to state-of-the-art accuracy on
the Object Discovery dataset when used as a source of pretraining.
- Abstract(参考訳): 長年にわたり、データセットとベンチマークは、新しいアルゴリズムの設計に大きな影響を与えてきた。
本稿では,オブジェクトセグメンテーションのための新しいコンパクトな半合成データセットである chairsegments を紹介する。
また,画像分類の最近の知見を反映した転帰学習における経験的発見を示す。
特に,事前訓練された重みから微調整されたモデルが,最適化景観の同じ基盤にあることを示す。
椅子セグメンツは、透明な背景が様々な背景に合成された椅子の多様な原型的なイメージからなる。
CIFAR-10データセットと同等のChairSegmentsを目指しているが、セグメンテーションのための新しいモデルアーキテクチャを素早く設計し、反復する。
Chair Segmentsでは、単一のGPUを使用して、U-Netモデルを30分で完全に収束するようにトレーニングすることができる。
最後に、このデータセットは半合成であるが、実際のデータの有用なプロキシになり、事前トレーニングのソースとして使用する場合、Object Discoveryデータセットの最先端の精度につながる。
関連論文リスト
- Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation [4.02235104503587]
本稿では,3次元表現から得られる情報を利用して局所的な特徴を巧みにとらえる。
GPUベースのKDTreeは、素早いビルド、クエリ、プロジェクションの強化を、簡単な操作で実現している。
我々は,本モデルの縮小バージョンが,本格的な最先端モデルに対して強い競争力を示すだけでなく,リアルタイムに動作することを示す。
論文 参考訳(メタデータ) (2024-10-14T13:49:05Z) - Segmenting Object Affordances: Reproducibility and Sensitivity to Scale [27.277739855754447]
セマンティックセグメンテーションのための学習に基づくアーキテクチャを、アベイランスセグメンテーションタスクに再利用し、適応する手法。
2つの単一オブジェクトのシナリオで再現可能な設定でこれらのメソッドをベンチマークする。
我々の分析は、オブジェクトの解像度がトレーニングセットと異なる場合、モデルは変動をスケールするのに堅牢ではないことを示している。
論文 参考訳(メタデータ) (2024-09-03T11:54:36Z) - Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast
Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。
このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。
我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文 参考訳(メタデータ) (2023-06-07T17:57:45Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Object Pose Estimation using Mid-level Visual Representations [5.220940151628735]
本研究は,これまで見つからなかった環境に効果的に移動可能なオブジェクトカテゴリのポーズ推定モデルを提案する。
ポーズ推定のための深層畳み込みネットワークモデル(CNN)は、通常、オブジェクト検出、ポーズ推定、または3D再構成のために算出されたデータセットに基づいて訓練され評価される。
一般化と新しい環境への移動に関しては,この手法が好ましいことを示す。
論文 参考訳(メタデータ) (2022-03-02T22:49:17Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z) - Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。
これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。
異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文 参考訳(メタデータ) (2021-06-08T06:13:11Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Reviving Iterative Training with Mask Guidance for Interactive
Segmentation [8.271859911016719]
クリックに基づくインタラクティブセグメンテーションに関する最近の研究は、様々な推論時間最適化スキームを用いて最先端の結果を示している。
従来のステップのセグメンテーションマスクを用いた,クリックベースのインタラクティブセグメンテーションのための簡単なフィードフォワードモデルを提案する。
COCOとLVISの組み合わせで訓練されたモデルと、多様で高品質のアノテーションは、既存のすべてのモデルよりも優れたパフォーマンスを示しています。
論文 参考訳(メタデータ) (2021-02-12T15:44:31Z) - SVIRO: Synthetic Vehicle Interior Rear Seat Occupancy Dataset and
Benchmark [11.101588888002045]
SVIROは10台の異なる車両の旅客室におけるシーンの合成データセットである。
限られたバリエーションに基づいて学習した際の一般化能力と信頼性について、機械学習に基づくアプローチを解析する。
論文 参考訳(メタデータ) (2020-01-10T14:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。