論文の概要: RoboLineage: Agent-Native Data Lifecycle Governance Across Robot Policy Iterations
- arxiv url: http://arxiv.org/abs/2606.22142v1
- Date: Sat, 20 Jun 2026 16:48:51 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 14:43:22.851845
- Title: RoboLineage: Agent-Native Data Lifecycle Governance Across Robot Policy Iterations
- Title(参考訳): RoboLineage: ロボットポリシーイテレーション全体にわたるエージェント指向のデータライフサイクルガバナンス
- Authors: Qian Luo, Wentao Guo, Zhennan Qin, Nanchun Guo, Yunhan Zhao, Yi Ma, Yanchao Yang,
- Abstract要約: RoboLineageはロールアウト、レビュー、データセットの決定、トレーニング実行、ポリシーメタデータ、評価、デプロイメントレコメンデーション、次のコレクションプランをタイプされたアーティファクトとして表現する。
エージェントは、ロールアウトエビデンスを解釈し、受け入れたデータを既存のトレーニングスタックに適合させ、データの健全性を維持し、クロスイテレーション状態を要約する。
私たちはRoboLineageを、異なるロボットエボディメントとトレーニングファミリーのための軽量ライフサイクルレイヤとしてオープンソースにしています。
- 参考スコア(独自算出の注目度): 21.408315974761905
- License:
- Abstract: We present RoboLineage, an agent-native data lifecycle governance system for robot policy iteration. Modern robot policies improve through repeated data collection, review, retraining, evaluation, and release decisions, but the evidence connecting these steps is often scattered across local tools, scripts, and expert memory. RoboLineage makes this lifecycle explicit by representing rollouts, reviews, dataset decisions, training runs, policy metadata, evaluations, deployment recommendations, and next-collection plans as typed lineage artifacts. Agents interpret embodied rollout evidence, adapt accepted data to existing training stacks, maintain data health, and summarize cross-iteration state under explicit artifact boundaries. In real-robot manipulation workflows, RoboLineage makes routine policy iteration faster and more auditable while maintaining downstream policy performance. We open source RoboLineage as a lightweight lifecycle layer for different robot embodiments and training families. Project page: https://robolineage.github.io/
- Abstract(参考訳): 本稿では,ロボットポリシーイテレーションのためのエージェントネイティブデータライフサイクルガバナンスシステムであるRoboLineageを紹介する。
現代のロボットポリシーは、データ収集、レビュー、リトレーニング、評価、リリース決定を通じて改善されているが、これらのステップを接続する証拠は、ローカルツール、スクリプト、エキスパートメモリに分散していることが多い。
RoboLineageはこのライフサイクルを、ロールアウト、レビュー、データセットの決定、トレーニング実行、ポリシーメタデータ、評価、デプロイメントレコメンデーション、および次のコレクションプランを型付き継承アーティファクトとして表現することで明確にする。
エージェントは、ロールアウトエビデンスを解釈し、既存のトレーニングスタックに受け入れたデータを適用し、データの健全性を維持し、明示的なアーティファクト境界の下でクロスイテレーション状態を要約する。
実際のロボット操作ワークフローでは、RoboLineageは、下流ポリシーのパフォーマンスを維持しながら、定期的なポリシーイテレーションを迅速かつ監査可能にします。
私たちはRoboLineageを、異なるロボットエボディメントとトレーニングファミリーのための軽量ライフサイクルレイヤとしてオープンソースにしています。
プロジェクトページ: https://robolineage.github.io/
関連論文リスト
- RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks [28.827331437876452]
データ収集、ポリシー学習、タスク実行を単一のVLM駆動コントローラで統合するエージェントロボットフレームワークであるRoboClawを提案する。
ポリシーレベルでは、RoboClaw氏はEntangled Action Pairs(EAP)を紹介している。
デプロイ中、同じエージェントが高レベルの推論を行い、学習されたポリシープリミティブを動的にオーケストレーションして長期のタスクを遂行する。
論文 参考訳(メタデータ) (2026-03-12T05:22:59Z) - STRAP: Robot Sub-Trajectory Retrieval for Augmented Policy Learning [8.860366821983211]
STRAPは、トレーニング済みの視覚基盤モデルと動的時間ワープを利用して、大規模なトレーニングコーパスからトラジェクトリのサブシーケンスを堅牢に検索する技術である。
本研究では、事前学習された視覚基盤モデルと動的時間ワープを活用して、大規模学習コーパスからのトラジェクトリのサブシーケンスをロバストに検索するSTRAPを提案する。
論文 参考訳(メタデータ) (2024-12-19T18:54:06Z) - LLaRA: Supercharging Robot Learning Data for Vision-Language Policy [56.505551117094534]
我々はLLaRA: Large Language and Robotics Assistantを紹介した。
まず、既存の行動クローニングデータセットからロボットのための会話スタイルの指導データを生成する自動パイプラインを提案する。
このようなデータセットを限定的に微調整したVLMは、ロボット制御において有意義な行動決定を導出できることを示す。
論文 参考訳(メタデータ) (2024-06-28T17:59:12Z) - Efficient Data Collection for Robotic Manipulation via Compositional Generalization [70.76782930312746]
本研究では, 環境要因をデータから構成し, 未確認の要因の組み合わせに遭遇した場合に成功できることを示す。
コンポジションを利用したドメイン内データ収集手法を提案する。
ビデオはhttp://iliad.stanford.edu/robot-data-comp/で公開しています。
論文 参考訳(メタデータ) (2024-03-08T07:15:38Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Polybot: Training One Policy Across Robots While Embracing Variability [70.74462430582163]
複数のロボットプラットフォームにデプロイするための単一のポリシーをトレーニングするための重要な設計決定セットを提案する。
われわれのフレームワークは、まず、手首カメラを利用して、我々のポリシーの観察空間と行動空間を具体化して調整する。
6つのタスクと3つのロボットにまたがる60時間以上のデータセットを用いて,関節の形状や大きさの異なるデータセットの評価を行った。
論文 参考訳(メタデータ) (2023-07-07T17:21:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。