論文の概要: RealAppliance: Let High-fidelity Appliance Assets Controllable and Workable as Aligned Real Manuals
- arxiv url: http://arxiv.org/abs/2512.00287v1
- Date: Sat, 29 Nov 2025 02:55:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.149674
- Title: RealAppliance: Let High-fidelity Appliance Assets Controllable and Workable as Aligned Real Manuals
- Title(参考訳): リアルアプライアンス:高忠実度アプライアンス・アセットを制御可能、そして作業可能に
- Authors: Yuzheng Gao, Yuxing Long, Lei Kang, Yuchong Guo, Ziyan Yu, Shangqing Mao, Jiyao Zhang, Ruihai Wu, Dongjiang Li, Hui Shen, Hao Dong,
- Abstract要約: 既存のアプライアンス資産は、レンダリングの貧弱さ、不完全なメカニズム、マニュアルとのミスアライメントに悩まされている。
本稿では,100個の高忠実度アプライアンスと完全物理,電子機構,プログラムロジックからなるRealApplianceデータセットについて紹介する。
提案するRealAppliance-Benchベンチマークは,マルチモーダルな大規模言語モデルと具体的操作計画モデルを評価する。
- 参考スコア(独自算出の注目度): 20.527398082686833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing appliance assets suffer from poor rendering, incomplete mechanisms, and misalignment with manuals, leading to simulation-reality gaps that hinder appliance manipulation development. In this work, we introduce the RealAppliance dataset, comprising 100 high-fidelity appliances with complete physical, electronic mechanisms, and program logic aligned with their manuals. Based on these assets, we propose the RealAppliance-Bench benchmark, which evaluates multimodal large language models and embodied manipulation planning models across key tasks in appliance manipulation planning: manual page retrieval, appliance part grounding, open-loop manipulation planning, and closed-loop planning adjustment. Our analysis of model performances on RealAppliance-Bench provides insights for advancing appliance manipulation research
- Abstract(参考訳): 既存のアプライアンス資産は、レンダリングの貧弱、不完全なメカニズム、マニュアルとのミスアライメントに悩まされ、アプライアンス操作開発を妨げるシミュレーションと現実のギャップに繋がる。
本研究では,100個の高忠実度アプライアンスからなるRealApplianceデータセットについて紹介する。
これらの資産に基づいたRealAppliance-Benchベンチマークを提案する。このベンチマークは、アプライアンス操作計画における重要なタスクである、手動ページ検索、アプライアンス部分接地、オープンループ操作計画、クローズドループ計画調整において、マルチモーダルな大言語モデルと具体的操作計画モデルを評価する。
RealAppliance-Benchにおけるモデル性能の分析は、アプライアンス操作研究の進展に寄与する
関連論文リスト
- Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments [70.42705564227548]
大規模言語モデル(LLM)のための環境自動構築パイプラインを提案する。
これにより、外部ツールに頼ることなく、詳細な測定可能なフィードバックを提供する高品質なトレーニング環境の作成が可能になる。
また、ツール使用の精度とタスク実行の完全性の両方を評価する検証可能な報酬機構も導入する。
論文 参考訳(メタデータ) (2025-08-12T09:45:19Z) - Robot Operation of Home Appliances by Reading User Manuals [22.635290117482143]
ApBotは、ユーザーマニュアルを「読む」ことで家電を操作できるロボットシステムである。
これらの課題に対処するため、ApBotはそのマニュアルからアプライアンスの構造化された象徴的なモデルを構築している。
試行によると、ApBotはタスク成功率の一貫性と統計的に有意な改善を達成している。
論文 参考訳(メタデータ) (2025-05-26T18:17:07Z) - ToolACE-DEV: Self-Improving Tool Learning via Decomposition and EVolution [77.86222359025011]
ツール学習のための自己改善フレームワークであるToolACE-DEVを提案する。
まず、ツール学習の目的を、基本的なツール作成とツール利用能力を高めるサブタスクに分解する。
次に、軽量モデルによる自己改善を可能にする自己進化パラダイムを導入し、高度なLCMへの依存を減らす。
論文 参考訳(メタデータ) (2025-05-12T12:48:30Z) - MATNilm: Multi-appliance-task Non-intrusive Load Monitoring with Limited
Labeled Data [4.460954839118025]
既存のアプローチは主に、各アプライアンス用の個別モデルの開発に重点を置いている。
本稿では,トレーニング効率のよいサンプル拡張方式を用いたマルチアプライアンス・タスク・フレームワークを提案する。
相対誤差は平均で50%以上削減できる。
論文 参考訳(メタデータ) (2023-07-27T11:14:11Z) - A Control-Centric Benchmark for Video Prediction [69.22614362800692]
本稿では,アクション条件付きビデオ予測のベンチマークを,制御ベンチマークの形式で提案する。
私たちのベンチマークには、11のタスクカテゴリと310のタスクインスタンス定義を備えたシミュレーション環境が含まれています。
次に、ベンチマークを活用して、スケールするモデルサイズ、トレーニングデータの量、モデルアンサンブルの影響を調査します。
論文 参考訳(メタデータ) (2023-04-26T17:59:45Z) - Generating Executable Action Plans with Environmentally-Aware Language
Models [4.162663632560141]
大量のテキストデータセットを使用してトレーニングされた大規模言語モデル(LLM)は、最近、ロボットエージェントのアクションプランを生成することを約束している。
本稿では,環境に配慮したアクションプラン作成手法を提案する。
論文 参考訳(メタデータ) (2022-10-10T18:56:57Z) - Automated Machine Learning: A Case Study on Non-Intrusive Appliance Load Monitoring [81.06807079998117]
非侵入的機器負荷モニタリング(NIALM)のための自動機械学習(AutoML)を実現する新しい手法を提案する。
NIALMは、電子機器や家電のエネルギー消費を測定するためのスマートメーターに代わる費用対効果を提供する。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Predictive Maintenance for Edge-Based Sensor Networks: A Deep
Reinforcement Learning Approach [68.40429597811071]
未計画の設備停止のリスクは、収益発生資産の予測保守によって最小化することができる。
機器に基づくセンサネットワークのコンテキストから予測機器のメンテナンスを行うために,モデルフリーのDeep Reinforcement Learningアルゴリズムを提案する。
従来のブラックボックス回帰モデルとは異なり、提案アルゴリズムは最適なメンテナンスポリシーを自己学習し、各機器に対して実行可能なレコメンデーションを提供する。
論文 参考訳(メタデータ) (2020-07-07T10:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。