論文の概要: Morphology-Independent Facial Expression Imitation for Human-Face Robots
- arxiv url: http://arxiv.org/abs/2603.07068v1
- Date: Sat, 07 Mar 2026 06:57:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.03405
- Title: Morphology-Independent Facial Expression Imitation for Human-Face Robots
- Title(参考訳): ヒト顔ロボットにおける形態非依存の表情模倣
- Authors: Xu Chen, Rui Gao, Che Sun, Zhehang Liu, Yuwei Wu, Shuo Yang, Yunde Jia,
- Abstract要約: 表情を顔形態から切り離す形態素非依存的な表現模倣法を提案する。
本手法は,人間の表情を効果的に再現する。
- 参考スコア(独自算出の注目度): 31.41201394665696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate facial expression imitation on human-face robots is crucial for achieving natural human-robot interaction. Most existing methods have achieved photorealistic expression imitation through mapping 2D facial landmarks to a robot's actuator commands. Their imitation of landmark trajectories is susceptible to interference from facial morphology, which would lead to a performance drop. In this paper, we propose a morphology-independent expression imitation method that decouples expressions from facial morphology to eliminate morphological influence and produce more realistic expressions for human-face robots. Specifically, we construct an expression decoupling module to learn expression semantics by disentangling the expression representation from the morphology representation in a self-supervised manner. We devise an expression transfer module to map the representations to the robot's actuator commands through a learning objective of perceiving expression errors, producing accurate facial expressions based on the learned expression semantics. To support experimental validation, a custom-designed and highly expressive human-face robot, namely Pengrui, is developed to serve as an experimental platform for realistic expression imitation. Extensive experiments demonstrate that our method enables the human-face robot to reproduce a wide range of human-like expressions effectively. All code and implementation details of the robot will be released.
- Abstract(参考訳): 人間の顔ロボットにおける表情の正確な模倣は、自然な人間とロボットの相互作用を達成するために不可欠である。
既存のほとんどの方法は、2D顔のランドマークをロボットのアクチュエーターコマンドにマッピングすることで、写実的な表現の模倣を実現している。
ランドマークの軌跡の模倣は、顔形態学からの干渉を受けやすいため、性能低下につながる。
本稿では,表情を顔形態から切り離して形態的影響を排除し,よりリアルな表情を生成する形態素非依存表現模倣法を提案する。
具体的には,表現表現を形態表現から自己管理的に切り離して表現意味を学習する表現分離モジュールを構築する。
そこで我々は,ロボットのアクチュエータに表現をマッピングする表現伝達モジュールを考案し,表現の誤りを知覚し,学習した表現セマンティクスに基づいて正確な表情を生成する。
実験的な検証を支援するため,Pengruiというカスタムデザインで高度に表現力のあるヒューマンフェイスロボットが開発され,現実的な表現模倣のための実験プラットフォームとして機能する。
大規模な実験により,人間の顔の表情を効果的に再現できることが実証された。
ロボットのコードと実装の詳細はリリースされます。
関連論文リスト
- Facial Expression Generation Aligned with Human Preference for Natural Dyadic Interaction [53.12445980832305]
本稿では,人間の嗜好に合わせた表情生成手法を提案する。
本手法の鍵となるのは、行動学習プロセスとして、アイデンティティ非依存の表情の生成をフレーミングすることである。
2つのベンチマーク実験により,顔の表情と人の好みを効果的に一致させることが実証された。
論文 参考訳(メタデータ) (2026-03-07T08:03:21Z) - VividFace: Real-Time and Realistic Facial Expression Shadowing for Humanoid Robots [37.61907490582774]
ヒューマノイドロボットのためのリアルタイムかつリアルな表情陰影システムVividFaceを提案する。
VividFaceは、人間の表情を0.05秒以内に模倣することで、鮮やかなヒューマノイド顔を生成する。
論文 参考訳(メタデータ) (2026-02-07T11:51:50Z) - Towards Localized Fine-Grained Control for Facial Expression Generation [54.82883891478555]
人間、特にその顔は、豊かな表現と意図を伝える能力のために、コンテンツ生成の中心である。
現在の生成モデルは、主に平らな中立表現と文字なしの笑顔を認証なしで生成する。
顔生成における表情制御におけるAU(アクションユニット)の利用を提案する。
論文 参考訳(メタデータ) (2024-07-25T18:29:48Z) - DiffGen: Robot Demonstration Generation via Differentiable Physics Simulation, Differentiable Rendering, and Vision-Language Model [72.66465487508556]
DiffGenは、微分可能な物理シミュレーション、微分可能なレンダリング、ビジョン言語モデルを統合する新しいフレームワークである。
言語命令の埋め込みとシミュレートされた観察の埋め込みとの距離を最小化することにより、現実的なロボットデモを生成することができる。
実験によると、DiffGenを使えば、人間の努力やトレーニング時間を最小限に抑えて、ロボットデータを効率よく、効果的に生成できる。
論文 参考訳(メタデータ) (2024-05-12T15:38:17Z) - CSTalk: Correlation Supervised Speech-driven 3D Emotional Facial Animation Generation [13.27632316528572]
音声駆動の3D顔アニメーション技術は長年開発されてきたが、実用的応用には期待できない。
主な課題は、データ制限、唇のアライメント、表情の自然さである。
本稿では,顔の動きの異なる領域間の相関をモデル化し,生成モデルの訓練を監督し,現実的な表現を生成するCSTalkという手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T11:19:15Z) - Driving Animatronic Robot Facial Expression From Speech [7.8799497614708605]
本稿では,音声入力からアニマトロニクスロボットの表情を駆動する,新しいスキン中心のアプローチを提案する。
提案手法は線形スキン (LBS) を統一表現として用い, エンボディメント設計とモーション合成の両面での革新を導く。
このアプローチは、1台のNvidia GTX 4090上で4000fps以上のリアルタイムにアニマトロニクスの顔に非常にリアルな表情を生成する能力を示す。
論文 参考訳(メタデータ) (2024-03-19T12:11:57Z) - Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers [57.1091606948826]
我々はこれらの課題に対処するため,ポーカー・フェイス・ビジョン・トランスフォーマー (PF-ViT) と呼ばれる新しいFERモデルを提案する。
PF-ViTは、対応するポーカーフェースを生成して、乱れを認識できない感情を静的な顔画像から分離し、認識することを目的としている。
PF-ViTはバニラビジョントランスフォーマーを使用し、そのコンポーネントは大規模な表情データセット上でMasked Autoencodeerとして事前トレーニングされている。
論文 参考訳(メタデータ) (2022-07-22T13:39:06Z) - Data-driven emotional body language generation for social robotics [58.88028813371423]
社会ロボティクスでは、人間型ロボットに感情の身体的表現を生成する能力を与えることで、人間とロボットの相互作用とコラボレーションを改善することができる。
我々は、手作業で設計されたいくつかの身体表現から学習する深層学習データ駆動フレームワークを実装した。
評価実験の結果, 生成した表現の人間同型とアニマシーは手作りの表現と異なる認識が得られなかった。
論文 参考訳(メタデータ) (2022-05-02T09:21:39Z) - Facial Expression Editing with Continuous Emotion Labels [76.36392210528105]
深層生成モデルは、自動表情編集の分野で素晴らしい成果を上げている。
連続した2次元の感情ラベルに従って顔画像の表情を操作できるモデルを提案する。
論文 参考訳(メタデータ) (2020-06-22T13:03:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。