論文の概要: Human Instance Matting via Mutual Guidance and Multi-Instance Refinement
- arxiv url: http://arxiv.org/abs/2205.10767v1
- Date: Sun, 22 May 2022 06:56:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 18:15:16.759301
- Title: Human Instance Matting via Mutual Guidance and Multi-Instance Refinement
- Title(参考訳): 相互誘導によるヒューマン・インスタンス・マッチングとマルチ・インスタンス・リファインメント
- Authors: Yanan Sun and Chi-Keung Tang and Yu-Wing Tai
- Abstract要約: 我々は、Human instance matting (HIM)と呼ばれる新しいマットタスクを導入する。
HIMは、人間のインスタンスごとに正確なアルファマットを自動的に予測するために、関連するモデルを必要とする。
予備結果は、一般的なインスタンス・マッティング(英語版)で示される。
- 参考スコア(独自算出の注目度): 70.06185123355249
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a new matting task called human instance matting (HIM),
which requires the pertinent model to automatically predict a precise alpha
matte for each human instance. Straightforward combination of closely related
techniques, namely, instance segmentation, soft segmentation and
human/conventional matting, will easily fail in complex cases requiring
disentangling mingled colors belonging to multiple instances along hairy and
thin boundary structures. To tackle these technical challenges, we propose a
human instance matting framework, called InstMatt, where a novel mutual
guidance strategy working in tandem with a multi-instance refinement module is
used, for delineating multi-instance relationship among humans with complex and
overlapping boundaries if present. A new instance matting metric called
instance matting quality (IMQ) is proposed, which addresses the absence of a
unified and fair means of evaluation emphasizing both instance recognition and
matting quality. Finally, we construct a HIM benchmark for evaluation, which
comprises of both synthetic and natural benchmark images. In addition to
thorough experimental results on complex cases with multiple and overlapping
human instances each has intricate boundaries, preliminary results are
presented on general instance matting. Code and benchmark are available in
https://github.com/nowsyn/InstMatt.
- Abstract(参考訳): 本稿では,ヒトのインスタンスごとの正確なα行列を自動的に予測するために,関連するモデルを必要とする,Human instance matting (HIM) と呼ばれる新しいマッチングタスクを提案する。
インスタンスセグメンテーション、ソフトセグメンテーション、ヒューマン/コンベンション・マットリングといった密接な関連技術の直接的な組み合わせは、毛むくじゃらの薄い境界構造に沿って複数のインスタンスに属する混ざった色を区別する必要のある複雑なケースでは容易に失敗する。
このような技術的課題に対処するために、我々はInstMattと呼ばれる人間のインスタンス・マッチング・フレームワークを提案し、多インスタンス・リファインメント・モジュールと連動する新しい相互ガイダンス・ストラテジーを用いて、複雑な境界と重複する境界を持つ人間間のマルチインスタンス・リファインメント関係を記述している。
インスタンス認識とマットング品質の両方を強調する統一的で公正な評価方法がないことに対処した、インスタンスマットング品質(imq)と呼ばれる新しいインスタンスマットングメトリックが提案されている。
最後に,合成および自然なベンチマーク画像からなる評価用HIMベンチマークを構築した。
複数および重複するヒトのインスタンスの複雑なケースに対する詳細な実験結果に加えて、各インスタンスは複雑な境界を持つ。
コードとベンチマークはhttps://github.com/nowsyn/InstMatt.comで公開されている。
関連論文リスト
- MaGGIe: Masked Guided Gradual Human Instance Matting [71.22209465934651]
我々は新しいフレームワークMaGGIe, Masked Guided Gradual Human Instance Mattingを提案する。
計算コスト、精度、一貫性を維持しながら、人間のインスタンスごとのアルファ行列を段階的に予測する。
論文 参考訳(メタデータ) (2024-04-24T17:59:53Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - End-to-End Human Instance Matting [27.96723058460764]
ヒューマン・インスタンス・マッティングは画像内の各人間のインスタンスのアルファ・マットを推定することを目的としている。
本稿では,複数インスタンスの同時マッチングのための新しいエンド・ツー・エンドヒューマン・インスタンス・マッティング(E2E-HIM)フレームワークを提案する。
E2E-HIMは、既存のメソッドよりも50%低いエラーと5倍速いスピードで、人間のインスタンスマッチングに優れています。
論文 参考訳(メタデータ) (2024-03-03T13:17:10Z) - Ins-HOI: Instance Aware Human-Object Interactions Recovery [44.02128629239429]
本稿では,エンド・ツー・エンドのインスタンス・アウェアなヒューマン・オブジェクト・インタラクション・リカバリ(Ins-HOI)フレームワークを提案する。
Ins-HOIはインスタンスレベルの再構築をサポートし、合理的で現実的な接触面を提供する。
我々は、現実世界の人間-椅子と手-物体の相互作用を伴う5.2kの高品質スキャンを含む、大規模で高忠実な3Dスキャンデータセットを収集します。
論文 参考訳(メタデータ) (2023-12-15T09:30:47Z) - Generalizable Implicit Neural Representations via Instance Pattern
Composers [40.04085054791994]
一般化可能な暗黙的ニューラル表現(INR)のためのシンプルで効果的なフレームワークを提案する。
私たちのフレームワークは、目に見えないインスタンスの重量を予測するために、既存のメタ学習やハイパーネットワークと完全に互換性があります。
本手法は,音声,画像,3次元オブジェクトなど,幅広い領域において高い性能を実現する。
論文 参考訳(メタデータ) (2022-11-23T18:58:59Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Text Recognition in Real Scenarios with a Few Labeled Samples [55.07859517380136]
Scene Text Recognition (STR) はコンピュータビジョン分野におけるホットな研究テーマである。
本稿では,数ショットの逆数列領域適応 (FASDA) を用いて構築シーケンスを適応する手法を提案する。
我々のアプローチは、ソースドメインとターゲットドメインの間の文字レベルの混乱を最大化することができる。
論文 参考訳(メタデータ) (2020-06-22T13:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。