論文の概要: MistyPilot: An Agentic Fast-Slow Thinking LLM Framework for Misty Social Robots
- arxiv url: http://arxiv.org/abs/2603.03640v1
- Date: Wed, 04 Mar 2026 02:00:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.876306
- Title: MistyPilot: An Agentic Fast-Slow Thinking LLM Framework for Misty Social Robots
- Title(参考訳): MistyPilot: 汚い社会ロボットのためのエージェント高速思考LLMフレームワーク
- Authors: Xiao Wang, Lu Dong, Jingchen Sun, Ifeoma Nwogu, Srirangaraj Setlur, Venu Govindaraju,
- Abstract要約: MistyPilotは、自律的なツール選択、オーケストレーション、パラメータ設定のためのエージェントLLM駆動フレームワークである。
MistyPilotは、Physically Interactive Agent(PIA)とSocially Intelligent Agent(SIA)の2つのコアコンポーネントから構成される。
- 参考スコア(独自算出の注目度): 19.141461555104843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the availability of open APIs in social robots, it has become easier to customize general-purpose tools to meet users' needs. However, interpreting high-level user instructions, selecting and configuring appropriate tools, and executing them reliably remain challenging for users without programming experience. To address these challenges, we introduce MistyPilot, an agentic LLM-driven framework for autonomous tool selection, orchestration, and parameter configuration. MistyPilot comprises two core components: a Physically Interactive Agent (PIA) and a Socially Intelligent Agent (SIA). The PIA enables robust sensor-triggered and tool-driven task execution, while the SIA generates socially intelligent and emotionally aligned dialogue. MistyPilot further integrates a fast-slow thinking paradigm to capture user preferences, reduce latency, and improve task efficiency. To comprehensively evaluate MistyPilot, we contribute five benchmark datasets. Extensive experiments demonstrate the effectiveness of our framework in routing correctness, task completeness, fast-slow thinking retrieval efficiency, tool scalability,and emotion alignment. All code, datasets, and experimental videos will be made publicly available on the project webpage.
- Abstract(参考訳): ソーシャルロボットにおけるオープンAPIの利用により、ユーザのニーズを満たす汎用ツールのカスタマイズが容易になった。
しかし、ハイレベルなユーザ命令の解釈、適切なツールの選択と設定、そしてそれらを確実に実行することは、プログラミング経験のないユーザにとっては困難なままである。
これらの課題に対処するために、自動ツールの選択、オーケストレーション、パラメータ設定のためのエージェントLLM駆動フレームワークであるMistyPilotを紹介します。
MistyPilotは、Physically Interactive Agent(PIA)とSocially Intelligent Agent(SIA)の2つのコアコンポーネントで構成されている。
PIAは堅牢なセンサートリガーとツール駆動のタスク実行を可能にし、SIAは社会的に知的で感情的に整合した対話を生成する。
MistyPilotはさらに、高速スロー思考パラダイムを統合して、ユーザの好みをキャプチャし、レイテンシを低減し、タスク効率を向上させる。
MistyPilotを総合的に評価するため、5つのベンチマークデータセットをコントリビュートする。
広範にわたる実験は、ルーティングの正確性、タスクの完全性、高速な思考検索効率、ツールのスケーラビリティ、感情アライメントにおける我々のフレームワークの有効性を実証する。
すべてのコード、データセット、実験ビデオは、プロジェクトのWebページで公開されます。
関連論文リスト
- Jenius Agent: Towards Experience-Driven Accuracy Optimization in Real-World Scenarios [0.9069311779417014]
本稿では,実体験に基づくエージェントフレームワークを提案する。
Jenius-Agentという名前のエンドツーエンドフレームワークは、3つの重要な最適化と統合されている。
実験によると、タスクの精度が20%向上し、トークンコストが削減され、レスポンスレイテンシが低下し、起動障害が発生している。
論文 参考訳(メタデータ) (2026-01-05T07:35:12Z) - JSPLIT: A Taxonomy-based Solution for Prompt Bloating in Model Context Protocol [1.2166472806042592]
本稿では,分類学,ツール選択アルゴリズム,LITを評価するためのデータセットについて述べる。
その結果,LITはエージェントが効果的に反応する能力を著しく損なうことなく,プロンプトサイズを著しく減少させることがわかった。
論文 参考訳(メタデータ) (2025-10-16T10:28:23Z) - SPA-Bench: A Comprehensive Benchmark for SmartPhone Agent Evaluation [89.24729958546168]
スマートフォンエージェントは、ユーザーがデバイスを効率的に制御するのを助けるためにますます重要になっている。
We present SPA-Bench, a comprehensive SmartPhone Agent Benchmark designed to evaluate (M)LLM-based agent。
論文 参考訳(メタデータ) (2024-10-19T17:28:48Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - RS-Agent: Automating Remote Sensing Tasks through Intelligent Agent [15.836845304125436]
RS-Agentは、人間のユーザーと対話し、専門的なモデルを自律的に活用するように設計されたAIエージェントである。
RS-Agentは、大きな言語モデルに基づく中央コントローラ、ツール実行のための動的ツールキット、タスク固有のエキスパートガイダンスのためのソリューションスペース、ドメインレベルの推論のための知識スペースの4つの重要なコンポーネントを統合している。
9つのデータセットと18のリモートセンシングタスクにわたる大規模な実験により、RS-Agentは最先端のMLLMよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-06-11T09:30:02Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - ASSISTGUI: Task-Oriented Desktop Graphical User Interface Automation [30.693616802332745]
本稿では,ユーザが要求するタスクに応じて,Windowsプラットフォーム上でマウスとキーボードを操作することができるかどうかを評価するための新しいベンチマーク,AssistGUIを提案する。
本稿では,AIエージェントによって駆動される高度なGUIを組み込んだ高度なアクタ・クリティカル・フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-20T15:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。