論文の概要: Fidelity-Aware Data Composition for Robust Robot Generalization
- arxiv url: http://arxiv.org/abs/2509.24797v1
- Date: Mon, 29 Sep 2025 13:48:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:20.022742
- Title: Fidelity-Aware Data Composition for Robust Robot Generalization
- Title(参考訳): ロバストロボット一般化のための忠実度を考慮したデータ構成
- Authors: Zizhao Tong, Di Chen, Sicheng Hu, Hongwei Fan, Liliang Chen, Guanghui Ren, Hao Tang, Hao Dong, Ling Shao,
- Abstract要約: 大規模で視覚的に均質なデータセットで訓練された汎用的なロボットポリシーは、学習のショートカットに影響を受けやすい。
本稿では、ロバストな一般化は、原理的、忠実なデータ構成に依存することを示唆する。
本稿では,データ合成を最適化問題として扱うフレームワークであるCoherent Information Fidelity Tuning(CIFT)を紹介する。
- 参考スコア(独自算出の注目度): 39.69070982795268
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalist robot policies trained on large-scale, visually homogeneous datasets can be susceptible to shortcut learning, which impairs their out-of-distribution (OOD) generalization. While generative data augmentation is a common approach to introduce diversity, it presents a subtle challenge: data composition. Naively mixing real and synthetic data can corrupt the learning signal, as this process often prioritizes visual diversity at the expense of information fidelity. This paper suggests that robust generalization depends on principled, fidelity-aware data composition. We introduce Coherent Information Fidelity Tuning (CIFT), a framework that treats data composition as an optimization problem. CIFT uses a practical proxy for Information Fidelity based on the feature-space geometry of a dataset. This enables the identification of a phase transition, termed the Decoherence Point, where training stability degrades. The framework includes a generative engine, Multi-View Video Augmentation (MVAug), to synthesize a causally disentangled data spectrum for this tuning process. Applying CIFT to policy architectures such as $\pi_0$ and Diffusion Policy improves OOD success rates by over 54\%. These results indicate that fidelity-aware composition, beyond data synthesis alone, is an important component for developing robust, general-purpose robots.
- Abstract(参考訳): 大規模で視覚的に均質なデータセットで訓練された汎用的なロボットポリシーは、そのアウト・オブ・ディストリビューション(OOD)の一般化を損なうショートカット学習に影響を受けやすい。
生成的データ拡張は多様性を導入するための一般的なアプローチであるが、データ合成という微妙な課題が提示されている。
実データと合成データを混在させることで学習信号を損なう恐れがあり、このプロセスは情報忠実性を犠牲にして視覚的多様性を優先することが多い。
本稿では、ロバストな一般化は、原理的、忠実なデータ構成に依存することを示唆する。
本稿では,データ合成を最適化問題として扱うフレームワークであるCoherent Information Fidelity Tuning(CIFT)を紹介する。
CIFTは、データセットの特徴空間幾何学に基づいて、情報フィデリティの実用的なプロキシを使用する。
これにより、訓練安定性が低下するデコヒーレンスポイントと呼ばれる相転移の同定が可能になる。
このフレームワークは生成エンジンであるMVAug(Multi-View Video Augmentation)を含んでおり、このチューニングプロセスのために因果非絡み合ったデータスペクトルを合成する。
CIFTを$\pi_0$やDiffusion Policyといったポリシーアーキテクチャに適用することで、OODの成功率が545%以上向上する。
これらの結果は、データ合成のみに留まらず、忠実性に配慮した構成が、堅牢で汎用的なロボットを開発する上で重要な要素であることを示唆している。
関連論文リスト
- CausalDiffTab: Mixed-Type Causal-Aware Diffusion for Tabular Data Generation [6.449839514410505]
混合データを扱うために特別に設計された拡散モデルに基づく生成モデルCausalDiffTabを紹介する。
階層型先行核融合の原理に基づくハイブリッド適応因果正則化法を提案する。
7つのデータセットで実施された実験は、CausalDiffTabがすべてのメトリクスでベースラインメソッドを上回っていることを示している。
論文 参考訳(メタデータ) (2025-06-17T05:48:44Z) - AIGC-assisted Federated Learning for Edge Intelligence: Architecture Design, Research Challenges and Future Directions [41.88981742448266]
フェデレートラーニング(FL)は、プライバシーとセキュリティを確保しながら、大規模な端末データを活用できる。
この課題に対処するために、革新的なデータ合成技術である人工知能生成コンテンツ(AIGC)が、潜在的な解決策の1つとして出現する。
論文 参考訳(メタデータ) (2025-03-26T02:45:19Z) - FLIGAN: Enhancing Federated Learning with Incomplete Data using GAN [1.5749416770494706]
Federated Learning (FL)は、ネットワークデバイス上での機械学習モデルの分散トレーニングのためのプライバシ保護メカニズムを提供する。
本稿では,FLにおけるデータ不完全性問題に対処する新しいアプローチであるFLIGANを提案する。
本手法はFLのプライバシ要件に則り,プロセス内の実際のデータを共有せずに合成データをフェデレートした方法で生成する。
論文 参考訳(メタデータ) (2024-03-25T16:49:38Z) - FLASH: Federated Learning Across Simultaneous Heterogeneities [55.0981921695672]
FLASH (Federated Learning Across Simultaneous Heterogeneities) は軽量かつ柔軟なクライアント選択アルゴリズムである。
ヘテロジニティの幅広い情報源の下で、最先端のFLフレームワークよりも優れています。
最先端のベースラインよりも大幅に、一貫性のある改善を実現している。
論文 参考訳(メタデータ) (2024-02-13T20:04:39Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - Feature Matching Data Synthesis for Non-IID Federated Learning [7.740333805796447]
フェデレーション学習(FL)は、中央サーバでデータを収集することなく、エッジデバイス上でニューラルネットワークをトレーニングする。
本稿では,局所モデル以外の補助データを共有するハード特徴マッチングデータ合成(HFMDS)手法を提案する。
プライバシーの保存性を向上するため,本研究では,実際の特徴を決定境界に向けて伝達する機能拡張手法を提案する。
論文 参考訳(メタデータ) (2023-08-09T07:49:39Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Rethinking Architecture Design for Tackling Data Heterogeneity in
Federated Learning [53.73083199055093]
注意に基づくアーキテクチャ(例えばTransformers)は、分散シフトに対してかなり堅牢であることを示す。
我々の実験は、畳み込みネットワークをトランスフォーマーに置き換えることによって、過去のデバイスを壊滅的に忘れることを大幅に減らせることを示した。
論文 参考訳(メタデータ) (2021-06-10T21:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。