論文の概要: Interactive Object Segmentation with Dynamic Click Transform
- arxiv url: http://arxiv.org/abs/2106.10465v1
- Date: Sat, 19 Jun 2021 10:13:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:34:48.484615
- Title: Interactive Object Segmentation with Dynamic Click Transform
- Title(参考訳): 動的クリック変換を用いた対話型オブジェクトセグメンテーション
- Authors: Chun-Tse Lin, Wei-Chih Tu, Chih-Ting Liu, Shao-Yi Chien
- Abstract要約: 本研究では,ユーザインタラクションをよりよく表現するために,空間的DCTと特徴的DCTで構成される動的クリック変換ネットワーク(DCT-Net)を提案する。
提案手法の有効性を実証し、3つの標準ベンチマークデータセットの最先端技術と比較して良好な性能を示す。
- 参考スコア(独自算出の注目度): 27.709779682559883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the interactive segmentation, users initially click on the target object
to segment the main body and then provide corrections on mislabeled regions to
iteratively refine the segmentation masks. Most existing methods transform
these user-provided clicks into interaction maps and concatenate them with
image as the input tensor. Typically, the interaction maps are determined by
measuring the distance of each pixel to the clicked points, ignoring the
relation between clicks and mislabeled regions. We propose a Dynamic Click
Transform Network~(DCT-Net), consisting of Spatial-DCT and Feature-DCT, to
better represent user interactions. Spatial-DCT transforms each user-provided
click with individual diffusion distance according to the target scale, and
Feature-DCT normalizes the extracted feature map to a specific distribution
predicted from the clicked points. We demonstrate the effectiveness of our
proposed method and achieve favorable performance compared to the
state-of-the-art on three standard benchmark datasets.
- Abstract(参考訳): 対話的なセグメンテーションでは、ユーザはまずターゲットオブジェクトをクリックして本体をセグメンテーションし、次にラベルのつかない領域の修正を行い、セグメンテーションマスクを反復的に洗練する。
既存のほとんどのメソッドは、これらのユーザが提供するクリックをインタラクションマップに変換し、入力テンソルとしてイメージと結合する。
通常、インタラクションマップは、クリックと誤ラベル領域の関係を無視して、各ピクセルとクリック点の距離を測定することによって決定される。
本稿では,空間的dctと特徴的dctからなる動的クリック変換ネットワーク(dct-net)を提案する。
空間dctは、各ユーザ提供クリックを目標スケールに応じて個々の拡散距離で変換し、特徴dctは、抽出された特徴マップを、クリックされたポイントから予測された特定の分布に正規化する。
提案手法の有効性を実証し、3つの標準ベンチマークデータセットの最先端技術と比較して良好な性能を示す。
関連論文リスト
- KP-RED: Exploiting Semantic Keypoints for Joint 3D Shape Retrieval and Deformation [87.23575166061413]
KP-RED は KeyPoint 主導の Retrieval and deformation フレームワークである。
オブジェクトスキャンを入力として、最も幾何学的に類似したCADモデルを共同で検索し、変形させる。
論文 参考訳(メタデータ) (2024-03-15T08:44:56Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - AGILE3D: Attention Guided Interactive Multi-object 3D Segmentation [32.63772366307106]
我々は,複数の3Dオブジェクトの同時セグメンテーションをサポートする,効率的で注目度の高いモデルAGILE3Dを紹介する。
ユーザクリックを空間的時間的クエリとしてエンコードし、クリッククエリと3Dシーン間の明示的なインタラクションを可能にする。
4つの異なる3Dポイントクラウドデータセットによる実験では、AGILE3Dは新たな最先端技術を設定している。
論文 参考訳(メタデータ) (2023-06-01T17:59:10Z) - Contour-based Interactive Segmentation [4.164728134421114]
ユーザインタラクションの自然な形態をゆるい輪郭とみなし、輪郭に基づく対話的セグメンテーション手法を導入する。
一つの輪郭が複数のクリックと同じ精度で、ユーザインタラクションの必要量を減らすことを実証する。
論文 参考訳(メタデータ) (2023-02-13T13:35:26Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Masked Transformer for Neighhourhood-aware Click-Through Rate Prediction [74.52904110197004]
本稿では,近隣相互作用に基づくCTR予測を提案し,そのタスクを異種情報ネットワーク(HIN)設定に組み込む。
周辺地域の表現を高めるために,ノード間のトポロジカルな相互作用を4種類検討する。
本研究では,2つの実世界のデータセットに関する総合的な実験を行い,提案手法が最先端のCTRモデルを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2022-01-25T12:44:23Z) - Interactive segmentation using U-Net with weight map and dynamic user
interactions [0.0]
本稿では,現在のセグメンテーションマスクに基づいてユーザクリックを動的にサイズに適応させるインタラクティブセグメンテーションフレームワークを提案する。
クリックされた領域は重みマップを形成し、新しい重み付き損失関数としてディープニューラルネットワークに供給される。
動的なユーザクリックサイズを適用すると、それぞれ5.60%と10.39%の精度が向上する。
論文 参考訳(メタデータ) (2021-11-18T15:08:11Z) - Clicking Matters:Towards Interactive Human Parsing [60.35351491254932]
この研究は、対話的な環境下での人間の解析課題に取り組む最初の試みである。
ベンチマークLIPでは85% mIoU,PASCAL-Person-Partでは80% mIoU,Helenでは75% mIoU,クラス毎のクリック数は1.95,3.02,2.84,1.09であった。
論文 参考訳(メタデータ) (2021-11-11T11:47:53Z) - Localized Interactive Instance Segmentation [24.55415554455844]
本稿では,ユーザインタラクションがオブジェクトの近接に制限されるクリック方式を提案する。
提案手法の有効性を,詳細な実験により示す。
論文 参考訳(メタデータ) (2020-10-18T23:24:09Z) - FAIRS -- Soft Focus Generator and Attention for Robust Object
Segmentation from Extreme Points [70.65563691392987]
本稿では,ユーザ入力からオブジェクトのセグメンテーションを極端点と補正クリックの形で生成する手法を提案する。
提案手法は,エクストリームポイント,クリック誘導,修正クリックを原則として組み込んだ,高品質なトレーニングデータを生成する能力とスケーラビリティを実証する。
論文 参考訳(メタデータ) (2020-04-04T22:25:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。