論文の概要: Highly Accurate Dichotomous Image Segmentation
- arxiv url: http://arxiv.org/abs/2203.03041v2
- Date: Tue, 8 Mar 2022 19:13:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 12:20:49.049607
- Title: Highly Accurate Dichotomous Image Segmentation
- Title(参考訳): 高精度ジコトモウス画像分割法
- Authors: Xuebin Qin and Hang Dai and Xiaobin Hu and Deng-Ping Fan and Ling Shao
and and Luc Van Gool
- Abstract要約: Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。
私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。
また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
- 参考スコア(独自算出の注目度): 139.79513044546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a systematic study on a new task called dichotomous image
segmentation (DIS), which aims to segment highly accurate objects from natural
images. To this end, we collected the first large-scale dataset, called DIS5K,
which contains 5,470 high-resolution (e.g., 2K, 4K or larger) images covering
camouflaged, salient, or meticulous objects in various backgrounds. All images
are annotated with extremely fine-grained labels. In addition, we introduce a
simple intermediate supervision baseline (IS-Net) using both feature-level and
mask-level guidance for DIS model training. Without tricks, IS-Net outperforms
various cutting-edge baselines on the proposed DIS5K, making it a general
self-learned supervision network that can help facilitate future research in
DIS. Further, we design a new metric called human correction efforts (HCE)
which approximates the number of mouse clicking operations required to correct
the false positives and false negatives. HCE is utilized to measure the gap
between models and real-world applications and thus can complement existing
metrics. Finally, we conduct the largest-scale benchmark, evaluating 16
representative segmentation models, providing a more insightful discussion
regarding object complexities, and showing several potential applications
(e.g., background removal, art design, 3D reconstruction). Hoping these efforts
can open up promising directions for both academic and industries. We will
release our DIS5K dataset, IS-Net baseline, HCE metric, and the complete
benchmark results.
- Abstract(参考訳): 本稿では,自然画像から高精度な物体を分割することを目的とした,dichotomous image segmentation(dis)と呼ばれる新しいタスクに関する体系的な研究を行う。
この目的のために我々は,5,470個の高解像度画像(例えば,2K,4K以上の画像)を含むDisdis5Kと呼ばれる最初の大規模データセットを収集した。
すべての画像は、非常にきめ細かいラベルでアノテートされている。
さらに,Disdisモデルトレーニングのための特徴レベルとマスクレベルのガイダンスを併用した,シンプルな中間監視ベースライン(IS-Net)を導入する。
トリックなしでIS-Netは、提案されたdis5Kの様々な最先端ベースラインを上回り、Disdisにおける将来の研究を促進するための一般的な自己学習型の監視ネットワークとなる。
さらに、偽陽性と偽陰性を補正するために必要なマウスクリック操作数を近似するHCE(Human correct efforts)と呼ばれる新しい指標を設計する。
HCEはモデルと現実世界のアプリケーション間のギャップを測定するために使われ、既存のメトリクスを補完することができる。
最後に、最大規模のベンチマークを行い、16の代表的なセグメンテーションモデルを評価し、オブジェクトの複雑さについてより洞察力のある議論を行い、いくつかの潜在的な応用(背景除去、アートデザイン、3D再構成など)を示す。
これらの取り組みの推進は、学術と産業の両方に有望な方向性を開くことができる。
DIS5Kデータセット、IS-Netベースライン、HCEメトリック、そして完全なベンチマーク結果をリリースします。
関連論文リスト
- Semantic Segmentation in Satellite Hyperspectral Imagery by Deep Learning [54.094272065609815]
本稿では1D-Justo-LiuNetという軽量な1D-CNNモデルを提案する。
1D-Justo-LiuNetは、全てのテストモデルの中で最小のモデルサイズ (4,563 パラメータ) を持つ最大精度 (0.93) を達成する。
論文 参考訳(メタデータ) (2023-10-24T21:57:59Z) - Self-Supervised Masked Digital Elevation Models Encoding for
Low-Resource Downstream Tasks [0.6374763930914523]
GeoAIは、何十年にもわたって収集されてきたデータのために、自己管理の方法論を活用することができる。
提案されたアーキテクチャは、ImageNetで事前トレーニングされたMasked Autoencoderである。
論文 参考訳(メタデータ) (2023-09-06T21:20:10Z) - Dense Depth Distillation with Out-of-Distribution Simulated Images [30.79756881887895]
単分子深度推定(MDE)のためのデータフリー知識蒸留(KD)について検討する。
KDは、訓練された教師モデルからそれを圧縮し、対象領域でのトレーニングデータを欠くことにより、現実世界の深度知覚タスクの軽量モデルを学ぶ。
提案手法は, トレーニング画像の1/6に留まらず, ベースラインKDのマージンが良好であり, 性能も若干向上していることを示す。
論文 参考訳(メタデータ) (2022-08-26T07:10:01Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Re-thinking Co-Salient Object Detection [170.44471050548827]
Co-Salient Object Detection (CoSOD) は、画像群において共起するサルエントオブジェクトを検出することを目的としている。
既存のCoSODデータセットは、画像の各グループに類似した視覚的外観の有能なオブジェクトが含まれていると仮定して、深刻なデータバイアスを持つことが多い。
我々はCoSOD3kと呼ばれる新しいベンチマークを野生で導入し、大量の意味的コンテキストを必要とする。
論文 参考訳(メタデータ) (2020-07-07T12:20:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。