Fugu-MT 論文翻訳(概要): Open-World Amodal Appearance Completion

論文の概要: Open-World Amodal Appearance Completion

arxiv url: http://arxiv.org/abs/2411.13019v1
Date: Wed, 20 Nov 2024 03:45:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:49.357207
Title: Open-World Amodal Appearance Completion
Title（参考訳）: オープンワールドアモーダル外観コンプリート
Authors: Jiayang Ao, Yanbei Jiang, Qiuhong Ke, Krista A. Ehinger,
Abstract要約: オープンワールド・アモーダル・アプライアンス・コンプリート(Open-World Amodal Appearance Completion)は、アモーダル・コンプリート機能を拡張するトレーニングフリーのフレームワークである。我々のアプローチは、直接項と抽象クエリの両方で指定された任意のオブジェクトに一般化する。
参考スコア（独自算出の注目度）: 14.398395372699207
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Understanding and reconstructing occluded objects is a challenging problem, especially in open-world scenarios where categories and contexts are diverse and unpredictable. Traditional methods, however, are typically restricted to closed sets of object categories, limiting their use in complex, open-world scenes. We introduce Open-World Amodal Appearance Completion, a training-free framework that expands amodal completion capabilities by accepting flexible text queries as input. Our approach generalizes to arbitrary objects specified by both direct terms and abstract queries. We term this capability reasoning amodal completion, where the system reconstructs the full appearance of the queried object based on the provided image and language query. Our framework unifies segmentation, occlusion analysis, and inpainting to handle complex occlusions and generates completed objects as RGBA elements, enabling seamless integration into applications such as 3D reconstruction and image editing. Extensive evaluations demonstrate the effectiveness of our approach in generalizing to novel objects and occlusions, establishing a new benchmark for amodal completion in open-world settings. The code and datasets will be released after paper acceptance.
Abstract（参考訳）: 隠されたオブジェクトを理解して再構築することは、特にカテゴリやコンテキストが多様で予測不可能なオープンワールドシナリオにおいて、難しい問題である。しかし、伝統的な方法は通常、閉じたオブジェクトカテゴリのセットに限定され、複雑なオープンワールドシーンでの使用を制限する。我々は、柔軟なテキストクエリを入力として受け入れることで、アモーダル補完機能を拡張したトレーニングフリーフレームワークであるOpen-World Amodal Appearance Completionを紹介する。我々のアプローチは、直接項と抽象クエリの両方で指定された任意のオブジェクトに一般化する。この能力は、提供された画像と言語クエリに基づいて、クエリ対象の完全な外観を再構築するアモーダル補完を推論するものである。本フレームワークは,複雑なオクルージョンを扱うためにセグメンテーション,オクルージョン解析,インペインティングを統合し,RGBA要素として完成オブジェクトを生成することで,3次元再構成や画像編集などのアプリケーションへのシームレスな統合を可能にする。広範に評価した結果,新しいオブジェクトやオクルージョンを一般化するためのアプローチの有効性が示され,オープンワールド環境におけるアモーダルコンプリートのための新しいベンチマークが確立された。コードとデータセットは、論文の受理後にリリースされる。

関連論文リスト

Unveiling the Invisible: Reasoning Complex Occlusions Amodally with AURA [49.10341970643037]
アモーダルセグメンテーションは、隠蔽された領域の外観が利用できない場合でも、隠蔽された物体の完全な形状を推測することを目的としている。現在のアモーダルセグメンテーション手法では、テキスト入力によってユーザと対話する能力が欠如している。本稿では,隠蔽対象物の完全な非モーダル形状を予測することを目的とした,非モーダル推論セグメンテーション(amodal reasoning segmentation)という新しいタスクを提案する。
論文参考訳（メタデータ） (2025-03-13T10:08:18Z)
Distilling Spectral Graph for Object-Context Aware Open-Vocabulary Semantic Segmentation [47.047267066525265]
画像にオブジェクトレベルの文脈知識を取り入れた新しいアプローチを導入する。提案手法は,多種多様なデータセットにまたがる高い一般化性を有する最先端性能を実現する。
論文参考訳（メタデータ） (2024-11-26T06:34:48Z)
OpenObj: Open-Vocabulary Object-Level Neural Radiance Fields with Fine-Grained Understanding [21.64446104872021]
オープンな語彙を持つオブジェクトレベルのニューラルフィールドを構築するための革新的なアプローチであるOpenを紹介します。本質的にOpenは、オブジェクトレベルでの効率的かつ水密なシーンモデリングと理解のための堅牢なフレームワークを確立します。複数のデータセットの結果から、Openはゼロショットセマンティクスおよび検索タスクにおいて優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2024-06-12T08:59:33Z)
Object-level Scene Deocclusion [92.39886029550286]
オブジェクトレベルのシーン・デクルージョンのためのPArallel可視・コミュールト拡散フレームワークPACOを提案する。 PACOをトレーニングするために、500kサンプルの大規模なデータセットを作成し、自己教師付き学習を可能にします。 COCOAと様々な現実世界のシーンの実験では、PACOがシーンの排除に優れた能力を示し、芸術の状態をはるかに上回っている。
論文参考訳（メタデータ） (2024-06-11T20:34:10Z)
LOSS-SLAM: Lightweight Open-Set Semantic Simultaneous Localization and Mapping [9.289001828243512]
オブジェクトを識別,ローカライズ,符号化するシステムは,オープンセットのセマンティックな同時ローカライゼーションとマッピングを行う確率的グラフィカルモデルと密結合していることを示す。提案した軽量オブジェクト符号化は,既存のオープンセット手法よりも高精度なオブジェクトベースSLAMを実現することができることを示す。
論文参考訳（メタデータ） (2024-04-05T19:42:55Z)
Object Detectors in the Open Environment: Challenges, Solutions, and Outlook [95.3317059617271]
オープン環境のダイナミックで複雑な性質は、オブジェクト検出器に新しくて恐ろしい挑戦をもたらす。本稿では,オープン環境におけるオブジェクト検出器の総合的なレビューと解析を行う。データ/ターゲットの変化の次元に基づいて、4つの四分法(ドメイン外、カテゴリ外、堅牢な学習、漸進的な学習)を含むフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-24T19:32:39Z)
Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文参考訳（メタデータ） (2023-11-19T06:00:39Z)
Neural Constraint Satisfaction: Hierarchical Abstraction for Combinatorial Generalization in Object Rearrangement [75.9289887536165]
基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文参考訳（メタデータ） (2023-03-20T18:19:36Z)
Self-Supervised Scene De-occlusion [186.89979151728636]
本稿では,隠蔽対象の隠蔽順序を復元し,隠蔽対象の見えない部分を完成させることを目的としたシーン非隠蔽問題について検討する。そこで本研究では,隠されたシーン構造を監視対象として指示やアモーダルアノテーションを使わずに復元する,新規で統一的なフレームワークを用いて,この問題に対処する試みを行う。そこで,PCNet-M と PCNet-C をベースとして,プログレッシブ・オーダリング・リカバリ,アモーダル・コンプリーメント,コンテント・コンプリートを通じてシーン・デオクルージョンを実現する新しい推論手法を考案した。
論文参考訳（メタデータ） (2020-04-06T16:31:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。