論文の概要: UniBioTransfer: A Unified Framework for Multiple Biometrics Transfer
- arxiv url: http://arxiv.org/abs/2603.19637v1
- Date: Fri, 20 Mar 2026 04:38:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.998673
- Title: UniBioTransfer: A Unified Framework for Multiple Biometrics Transfer
- Title(参考訳): UniBioTransfer: マルチバイオメトリックス転送のための統一フレームワーク
- Authors: Caiyi Sun, Yujing Sun, Xiangyu Li, Yuhang Zheng, Yiming Ren, Jiamin Wang, Yuexin Ma, Siu-Ming Yiu,
- Abstract要約: UniBioTransferは、従来のディープフェイスタスクと形状変化変換の両方を扱うことができるフレームワークである。
自然に、唇、目、眼鏡などの目に見えないタスクに、最小限の微調整で一般化する。
実験はUniBioTransferの有効性、一般化、拡張性を示す。
- 参考スコア(独自算出の注目度): 42.094622627873996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deepface generation has traditionally followed a task-driven paradigm, where distinct tasks (e.g., face transfer and hair transfer) are addressed by task-specific models. Nevertheless, this single-task setting severely limits model generalization and scalability. A unified model capable of solving multiple deepface generation tasks in a single pass represents a promising and practical direction, yet remains challenging due to data scarcity and cross-task conflicts arising from heterogeneous attribute transformations. To this end, we propose UniBioTransfer, the first unified framework capable of handling both conventional deepface tasks (e.g., face transfer and face reenactment) and shape-varying transformations (e.g., hair transfer and head transfer). Besides, UniBioTransfer naturally generalizes to unseen tasks, like lip, eye, and glasses transfer, with minimal fine-tuning. Generally, UniBioTransfer addresses data insufficiency in multi-task generation through a unified data construction strategy, including a swapping-based corruption mechanism designed for spatially dynamic attributes like hair. It further mitigates cross-task interference via an innovative BioMoE, a mixture-of-experts based model coupled with a novel two-stage training strategy that effectively disentangles task-specific knowledge. Extensive experiments demonstrate the effectiveness, generalization, and scalability of UniBioTransfer, outperforming both existing unified models and task-specific methods across a wide range of deepface generation tasks. Project page is at https://scy639.github.io/UniBioTransfer.github.io/
- Abstract(参考訳): ディープフェイス生成は伝統的にタスク駆動のパラダイムに従っており、タスク固有のモデルによって個別のタスク(例えば、顔の転送やヘア転送)が対処される。
しかし、このシングルタスク設定はモデルの一般化とスケーラビリティを著しく制限する。
1回のパスで複数のディープフェイス生成タスクを解くことができる統一モデルは、有望で実用的な方向を示すが、不均一な属性変換に起因するデータ不足とクロスタスク競合のため、依然として困難である。
そこで本研究では,従来の深層処理(例えば,顔の移動と顔の再現)と形状変化変換(例えば,髪の移動と頭部の移動)を両立できる最初の統合フレームワークであるUniBioTransferを提案する。
さらにUniBioTransferは、唇、目、眼鏡などの見えないタスクを最小限の微調整で自然に一般化する。
一般的に、UniBioTransferは、ヘアのような空間的ダイナミックな属性のために設計されたスワッピングベースの汚職機構を含む、統一されたデータ構築戦略を通じて、マルチタスク生成におけるデータ不足に対処する。
さらに、新しい2段階のトレーニング戦略と組み合わせることで、タスク固有の知識を効果的に解き放つ革新的なBioMoEを通じて、クロスタスク干渉を緩和する。
広範にわたる実験は、UniBioTransferの有効性、一般化、拡張性を実証し、既存の統一モデルとタスク固有の手法の両方を幅広い深層面生成タスクで上回っている。
プロジェクトページはhttps://scy639.github.io/UniBioTransfer.github.io/にある。
関連論文リスト
- UniLayDiff: A Unified Diffusion Transformer for Content-Aware Layout Generation [54.38636515750502]
コンテンツ対応レイアウト生成タスクのための統一拡散変換器UniLayDiffを提案する。
我々は、背景画像、レイアウト要素、および多様な制約の間の複雑な相互作用を捉えるために、マルチモード拡散トランスフォーマフレームワークを使用します。
実験により、UniLayDiffは条件のないタスクから様々な条件生成タスクにまたがって最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-12-09T18:38:44Z) - Merging without Forgetting: Continual Fusion of Task-Specific Models via Optimal Transport [29.006391770977796]
OTMFは最適輸送理論に根ざした新しいモデル統合フレームワークである。
従来のタスクを再考することなく、各タスクベクタを漸進的に統合する、連続的な融合パラダイムをサポートする。
我々は、複数の視覚と言語ベンチマークに関する総合的な実験を行い、OTMFが精度と効率の両面で最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2025-11-24T15:27:47Z) - UniFork: Exploring Modality Alignment for Unified Multimodal Understanding and Generation [39.921363034430875]
統一された画像理解と生成は、マルチモーダル人工知能において有望なパラダイムとして浮上している。
本研究では,タスク固有の専門家モデルの理解と生成のためのモダリティアライメント行動について検討する。
タスクの干渉を避けるため,タスク固有の分岐を深いレイヤに導入しながら,タスクのタスク表現学習のための浅いレイヤを共有する,新しいY字型アーキテクチャであるUniForkを紹介した。
論文 参考訳(メタデータ) (2025-06-20T17:52:31Z) - Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。
画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。
漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文 参考訳(メタデータ) (2024-06-28T10:05:58Z) - Cross-Task Multi-Branch Vision Transformer for Facial Expression and Mask Wearing Classification [13.995453649985732]
顔の表情認識とマスキングのための統合型マルチブランチ・ビジョン・トランスフォーマを提案する。
本手法では,両タスクの共有機能を二重ブランチアーキテクチャを用いて抽出する。
提案するフレームワークは,両タスクで別々のネットワークを使用する場合と比較して,全体的な複雑性を低減する。
論文 参考訳(メタデータ) (2024-04-22T22:02:19Z) - Multitasking Evolutionary Algorithm Based on Adaptive Seed Transfer for
Combinatorial Problem [2.869730777051168]
進化的マルチタスク最適化(EMTO)は、ECコミュニティで新たなトピックとなっている。
M TEA-ASTは、同じドメインとクロスドメインのマルチタスク環境の両方において、知識を適応的に転送することができる。
提案手法は,4つのCOPによる実験において,他の最先端EMTOと比較して競合性能を示す。
論文 参考訳(メタデータ) (2023-08-24T08:43:32Z) - Vision Transformer Adapters for Generalizable Multitask Learning [61.79647180647685]
一般化可能なタスク親和性を学習する最初のマルチタスク・ビジョン・トランスフォーマー・アダプタを提案する。
我々のアダプタはパラメータ効率の良い方法で複数の高密度視覚タスクを同時に解くことができる。
並行メソッドとは対照的に、新しいタスクやドメインが追加されるたびに、再トレーニングや微調整は不要です。
論文 参考訳(メタデータ) (2023-08-23T18:40:48Z) - An Efficient General-Purpose Modular Vision Model via Multi-Task
Heterogeneous Training [79.78201886156513]
本稿では、複数の視覚タスクを実行でき、他の下流タスクに効率的に適応できるモデルを提案する。
提案手法は,単一タスク状態モデルに匹敵する結果を達成し,下流タスクの強力な一般化を実証する。
論文 参考訳(メタデータ) (2023-06-29T17:59:57Z) - A Transformer Framework for Data Fusion and Multi-Task Learning in Smart
Cities [99.56635097352628]
本稿では,新興スマートシティを対象としたトランスフォーマーベースのAIシステムを提案する。
ほぼ全ての入力データと出力タスクタイプをサポートし、現在のS&CCをサポートする。
S&CC環境を代表する多様なタスクセットを学習して実演する。
論文 参考訳(メタデータ) (2022-11-18T20:43:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。