論文の概要: Getting to 99% Accuracy in Interactive Segmentation
- arxiv url: http://arxiv.org/abs/2003.07932v1
- Date: Tue, 17 Mar 2020 20:50:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 21:40:50.847471
- Title: Getting to 99% Accuracy in Interactive Segmentation
- Title(参考訳): インタラクティブセグメンテーションにおける99%の精度
- Authors: Marco Forte, Brian Price, Scott Cohen, Ning Xu, Fran\c{c}ois Piti\'e
- Abstract要約: 最近のディープラーニングに基づくインタラクティブセグメンテーションアルゴリズムは、複雑な画像の処理に大きな進歩をもたらした。
しかし、この荒削りな選択が達成されれば、深層学習技術は台頭する傾向にある。
ユーザ・ワークフローをよりうまく活用するための新しいインタラクティブ・アーキテクチャと新しいトレーニング・スキームを提案する。
- 参考スコア(独自算出の注目度): 18.207714624149595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive object cutout tools are the cornerstone of the image editing
workflow. Recent deep-learning based interactive segmentation algorithms have
made significant progress in handling complex images and rough binary
selections can typically be obtained with just a few clicks. Yet, deep learning
techniques tend to plateau once this rough selection has been reached. In this
work, we interpret this plateau as the inability of current algorithms to
sufficiently leverage each user interaction and also as the limitations of
current training/testing datasets.
We propose a novel interactive architecture and a novel training scheme that
are both tailored to better exploit the user workflow. We also show that
significant improvements can be further gained by introducing a synthetic
training dataset that is specifically designed for complex object boundaries.
Comprehensive experiments support our approach, and our network achieves state
of the art performance.
- Abstract(参考訳): インタラクティブなオブジェクトカットアウトツールは、画像編集ワークフローの基礎である。
最近のディープラーニングベースのインタラクティブセグメンテーションアルゴリズムは複雑な画像の処理において大きな進歩を遂げており、大雑把なバイナリ選択はほんの数クリックで得られる。
しかし、この荒削りな選択が達成されれば、深層学習技術は台頭する傾向にある。
本研究では,現在のアルゴリズムでは各ユーザのインタラクションを十分に活用できないことと,現在のトレーニング/テストデータセットの制限と解釈する。
本稿では,ユーザワークフローをより活用するために,新たなインタラクティブアーキテクチャと新たなトレーニングスキームを提案する。
また、複雑なオブジェクト境界に特化して設計された合成トレーニングデータセットを導入することで、さらに大きな改善が期待できることを示す。
総合的な実験は我々のアプローチをサポートし、ネットワークは芸術パフォーマンスの状態を達成します。
関連論文リスト
- Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Deep ContourFlow: Advancing Active Contours with Deep Learning [3.9948520633731026]
画像分割のための教師なしとワンショットの両方のアプローチのためのフレームワークを提案する。
広範なラベル付きトレーニングデータを必要とせずに、複雑なオブジェクト境界をキャプチャできる。
これは特に、注釈の不足に直面している分野である歴史学において必要である。
論文 参考訳(メタデータ) (2024-07-15T13:12:34Z) - Unsupervised Semantic Segmentation Through Depth-Guided Feature Correlation and Sampling [14.88236554564287]
本研究では,シーンの構造に関する情報を学習プロセスに組み込むことにより,教師なし学習の進歩を構築する。
本研究では,(1)特徴マップと深度マップを空間的に相関させて深度-特徴相関を学習し,シーンの構造に関する知識を誘導する。
次に,シーンの深度情報に対する3次元サンプリング技術を利用して,より効果的に特徴を抽出するために,最遠点サンプリングを実装した。
論文 参考訳(メタデータ) (2023-09-21T11:47:01Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - RAIS: Robust and Accurate Interactive Segmentation via Continual
Learning [16.382862088005087]
本稿では,対話型セグメンテーションと継続的学習のための堅牢で正確なアーキテクチャであるRAISを提案する。
テストセットを効率的に学習するために,グローバルパラメータとローカルパラメータを更新するための新しい最適化手法を提案する。
また,リモートセンシングと医用画像のデータセットにおけるロバスト性も示す。
論文 参考訳(メタデータ) (2022-10-20T03:05:44Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Context-based Deep Learning Architecture with Optimal Integration Layer
for Image Parsing [0.0]
提案した3層コンテキストベースディープアーキテクチャは、コンテキストを視覚情報と明示的に統合することができる。
ベンチマークデータセットで評価した場合の実験結果は有望である。
論文 参考訳(メタデータ) (2022-04-13T07:35:39Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - EdgeFlow: Achieving Practical Interactive Segmentation with Edge-Guided
Flow [5.696221390328458]
We propose EdgeFlow, a novel architecture that fully use a interactive information of user clicks with edge-guided flow。
提案手法は,後処理や反復最適化の手法を使わずに,最先端の性能を実現する。
提案手法により,実用的なデータアノテーションタスクのための効率的な対話型セグメンテーションツールを開発した。
論文 参考訳(メタデータ) (2021-09-20T10:07:07Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。