論文の概要: IntrinsicReal: Adapting IntrinsicAnything from Synthetic to Real Objects
- arxiv url: http://arxiv.org/abs/2509.00777v1
- Date: Sun, 31 Aug 2025 10:15:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.389126
- Title: IntrinsicReal: Adapting IntrinsicAnything from Synthetic to Real Objects
- Title(参考訳): IntrinsicReal:intrinsicAnythingを合成から実オブジェクトに適応させる
- Authors: Xiaokang Wei, Zizheng Yan, Zhangyang Xiong, Yiming Hao, Yipeng Qin, Xiaoguang Han,
- Abstract要約: 現実世界で撮影された単一のRGB画像からアルベド(内在画像分解)を推定することは大きな課題である。
IntrinsicRealは、現実世界の内在画像分解のための領域ギャップを橋渡しする新しいドメイン適応フレームワークである。
我々のIntrinsicRealは既存の手法よりも優れており、合成データセットと実世界のデータセットの両方でアルベド推定の最先端の結果が得られる。
- 参考スコア(独自算出の注目度): 26.907664563000257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating albedo (a.k.a., intrinsic image decomposition) from single RGB images captured in real-world environments (e.g., the MVImgNet dataset) presents a significant challenge due to the absence of paired images and their ground truth albedos. Therefore, while recent methods (e.g., IntrinsicAnything) have achieved breakthroughs by harnessing powerful diffusion priors, they remain predominantly trained on large-scale synthetic datasets (e.g., Objaverse) and applied directly to real-world RGB images, which ignores the large domain gap between synthetic and real-world data and leads to suboptimal generalization performance. In this work, we address this gap by proposing IntrinsicReal, a novel domain adaptation framework that bridges the above-mentioned domain gap for real-world intrinsic image decomposition. Specifically, our IntrinsicReal adapts IntrinsicAnything to the real domain by fine-tuning it using its high-quality output albedos selected by a novel dual pseudo-labeling strategy: i) pseudo-labeling with an absolute confidence threshold on classifier predictions, and ii) pseudo-labeling using the relative preference ranking of classifier predictions for individual input objects. This strategy is inspired by human evaluation, where identifying the highest-quality outputs is straightforward, but absolute scores become less reliable for sub-optimal cases. In these situations, relative comparisons of outputs become more accurate. To implement this, we propose a novel two-phase pipeline that sequentially applies these pseudo-labeling techniques to effectively adapt IntrinsicAnything to the real domain. Experimental results show that our IntrinsicReal significantly outperforms existing methods, achieving state-of-the-art results for albedo estimation on both synthetic and real-world datasets.
- Abstract(参考訳): 実環境(例えば、MVImgNetデータセット)で撮影された単一のRGB画像からアルベド(すなわち、本質的な画像分解)を推定することは、ペア画像が存在しないことと、それらの地上の真理アルベドが存在しないことによる重要な課題である。
したがって、近年の手法(例: IntrinsicAnything)は、強力な拡散前の手法を利用してブレークスルーを達成したが、それらは大規模な合成データセット(例: Objaverse)で主に訓練され、実世界のRGB画像に直接適用され、合成データと実世界のデータの大きな領域ギャップを無視し、最適な一般化性能をもたらす。
IntrinsicRealは、上記の領域ギャップを橋渡しして現実の内在画像分解を行う新しいドメイン適応フレームワークである。
具体的には、我々のIntrinsicRealは、新しい2つの擬似ラベル戦略によって選択された高品質な出力アルベドを微調整することで、IntrinsicAnythingを実際のドメインに適合させる。
一 分類器の予測に関する絶対的信頼しきい値を有する擬似ラベル
二 個々の入力対象に対する分類器予測の相対的選好ランクを用いた擬似ラベル
この戦略は人間の評価にインスパイアされ、高品質なアウトプットを特定することは簡単であるが、絶対スコアは準最適ケースでは信頼性が低下する。
これらの状況では、出力の相対比較がより正確になる。
そこで本研究では,IntrinsicAnythingを実領域に適用するために,これらの擬似ラベル手法を逐次適用した新しい2相パイプラインを提案する。
実験の結果,我々のIntrinsicRealは既存の手法よりも優れており,合成データセットと実世界のデータセットの両方でアルベド推定の最先端の結果が得られた。
関連論文リスト
- Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - Domain Adaptation for Underwater Image Enhancement [51.71570701102219]
本稿では,ドメイン間およびドメイン内ギャップを最小限に抑えるために,新しい2相水中ドメイン適応ネットワーク(TUDA)を提案する。
第1段階では、入力画像のリアリズムを強化する翻訳部と、拡張部とを含む新しい二重配向ネットワークを設計する。
第2フェーズでは、ランクベースの水中品質評価手法が組み込まれている強化画像の評価品質に応じて、実データを簡単に分類する。
論文 参考訳(メタデータ) (2021-08-22T06:38:19Z) - Content Disentanglement for Semantically Consistent
Synthetic-to-RealDomain Adaptation in Urban Traffic Scenes [39.38387505091648]
合成データ生成は、自動運転における新しい交通シナリオを生成する魅力的なアプローチです。
合成データだけで訓練されたディープラーニング技術は、実際のデータでテストされたときに劇的なパフォーマンス低下に遭遇します。
本稿では,合成データと実データの間で意味的に一貫性のあるドメイン適応を実現する,教師なしのエンドツーエンドドメイン適応ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-05-18T17:42:26Z) - Gradient Matching for Domain Generalization [93.04545793814486]
機械学習システムの重要な要件は、見えないドメインに一般化する能力です。
ドメインの一般化を目標とするドメイン間勾配マッチングの目的を提案する。
我々は、その最適化を近似する単純な一階アルゴリズムfishを導出する。
論文 参考訳(メタデータ) (2021-04-20T12:55:37Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z) - Domain Decluttering: Simplifying Images to Mitigate Synthetic-Real
Domain Shift and Improve Depth Estimation [16.153683223016973]
本研究では,実際の画像における領域外領域の特定と削除を学習するアテンションモジュールを開発する。
削除された領域を視覚化することで、合成と実際のドメインギャップに関する解釈可能な洞察が得られる。
論文 参考訳(メタデータ) (2020-02-27T14:28:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。