論文の概要: Semantic Intelligence: Integrating GPT-4 with A Planning in Low-Cost Robotics
- arxiv url: http://arxiv.org/abs/2505.01931v1
- Date: Sat, 03 May 2025 21:49:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.334459
- Title: Semantic Intelligence: Integrating GPT-4 with A Planning in Low-Cost Robotics
- Title(参考訳): セマンティックインテリジェンス:低コストロボットにおけるGPT-4と計画の統合
- Authors: Jesse Barkley, Abraham George, Amir Barati Farimani,
- Abstract要約: 本稿では,ROS2 Humbleで動作する低コストロボットプラットフォーム上で,GPT-4のセマンティック推論をA*と統合するフレームワークを提案する。
本稿では,まず資源目標へのナビゲートを行い,次に最終目的地に安全に到達するなど,シーケンシャルなタスクの多段階推論を実証する。
その結果、A* は基本経路生成や障害物回避においてより高速で精度が高いが、GPT-4 統合システムは純粋幾何学的プランナーでは不可能なセマンティックタスクにおいて高い成功率 (96-100%) を達成することがわかった。
- 参考スコア(独自算出の注目度): 8.943924354248622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classical robot navigation often relies on hardcoded state machines and purely geometric path planners, limiting a robot's ability to interpret high-level semantic instructions. In this paper, we first assess GPT-4's ability to act as a path planner compared to the A* algorithm, then present a hybrid planning framework that integrates GPT-4's semantic reasoning with A* on a low-cost robot platform operating on ROS2 Humble. Our approach eliminates explicit finite state machine (FSM) coding by using prompt-based GPT-4 reasoning to handle task logic while maintaining the accurate paths computed by A*. The GPT-4 module provides semantic understanding of instructions and environmental cues (e.g., recognizing toxic obstacles or crowded areas to avoid, or understanding low-battery situations requiring alternate route selection), and dynamically adjusts the robot's occupancy grid via obstacle buffering to enforce semantic constraints. We demonstrate multi-step reasoning for sequential tasks, such as first navigating to a resource goal and then reaching a final destination safely. Experiments on a Petoi Bittle robot with an overhead camera and Raspberry Pi Zero 2W compare classical A* against GPT-4-assisted planning. Results show that while A* is faster and more accurate for basic route generation and obstacle avoidance, the GPT-4-integrated system achieves high success rates (96-100%) on semantic tasks that are infeasible for pure geometric planners. This work highlights how affordable robots can exhibit intelligent, context-aware behaviors by leveraging large language model reasoning with minimal hardware and no fine-tuning.
- Abstract(参考訳): 古典的なロボットナビゲーションは、しばしばハードコードされた状態マシンと純粋に幾何学的な経路プランナーに依存し、ロボットの高レベルの意味的指示を解釈する能力を制限する。
本稿では,まずGPT-4が経路プランナとして機能する能力をA*アルゴリズムと比較し,ROS2 Humbleで動作する低コストロボットプラットフォーム上で,GPT-4とA*のセマンティック推論を統合したハイブリッド計画フレームワークを提案する。
提案手法では,A*で計算された正確なパスを維持しつつ,プロンプトベースの GPT-4 推論を用いてタスク論理を処理することにより,有限状態機械(FSM)の符号を除去する。
GPT-4モジュールは、命令と環境の手がかり(例えば、避けるための有害な障害や混雑した地域を認識したり、代替経路の選択を必要とする低バッテリーの状況を理解する)を意味論的に理解し、障害バッファリングを介してロボットの占有グリッドを動的に調整し、意味的制約を強制する。
本稿では,まず資源目標へのナビゲートを行い,次に最終目的地に安全に到達するなど,シーケンシャルなタスクの多段階推論を実証する。
上部カメラとRaspberry Pi Zero 2Wを搭載したPetoi Bittleロボットの実験は、古典的なA*とGPT-4支援プランニングを比較した。
その結果、A* は基本経路生成や障害物回避においてより高速で精度が高いが、GPT-4 統合システムは純粋幾何学的プランナーでは不可能なセマンティックタスクにおいて高い成功率 (96-100%) を達成することがわかった。
この研究は、手頃な価格のロボットが、最小限のハードウェアと微調整なしで大きな言語モデル推論を活用することによって、知的でコンテキスト対応の振る舞いをいかに表現できるかを強調している。
関連論文リスト
- REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation [57.628771707989166]
本稿では,ReMACと呼ばれる適応型マルチエージェント計画フレームワークを提案する。
ReMACには2つの重要なモジュールが組み込まれており、ループ内で事前条件と後条件チェックを実行し、進捗と計画の洗練を評価する。
論文 参考訳(メタデータ) (2025-03-28T03:51:40Z) - QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds [51.05639500325598]
ペットに匹敵するアジリティで多様なコマンドに従うように設計されたQuadrupedGPTを紹介します。
エージェントは多種多様なタスクを処理し,複雑な指示を行う能力を示し,多種多様四重化エージェントの開発に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-06-24T12:14:24Z) - POA: Passable Obstacles Aware Path-planning Algorithm for Navigation of
a Two-wheeled Robot in Highly Cluttered Environments [53.41594627336511]
パッシブル障害物認識(Passable Obstacles Aware, POA)プランナーは, 乱雑な環境下での二輪ロボットのナビゲーション手法である。
我々のアルゴリズムは、二輪ロボットが通過可能な障害物を通り抜ける道を見つけることを可能にする。
論文 参考訳(メタデータ) (2023-07-16T19:44:27Z) - AlphaBlock: Embodied Finetuning for Vision-Language Reasoning in Robot
Manipulation [50.737355245505334]
本稿では,ロボット操作タスクにおける高レベル認知能力を学習するための新しいフレームワークを提案する。
得られたデータセットAlphaBlockは、多段階のテキストプランとペア観測による35の包括的なハイレベルタスクで構成されている。
論文 参考訳(メタデータ) (2023-05-30T09:54:20Z) - Towards Plug'n Play Task-Level Autonomy for Robotics Using POMDPs and
Generative Models [0.0]
ロボットのスキルを、特定のタスクを達成するためにそのスキルをスケジュールする作業自律型ロボットコントローラに統合するアプローチについて述べる。
私たちのジェネレーティブスキルドキュメンテーション言語(GSDL)は、コードドキュメンテーションをコンパクトで表現力のあるものにします。
抽象マッピング(AM)は、低レベルのロボットコードと抽象AI計画モデルとのギャップを埋める。
論文 参考訳(メタデータ) (2022-07-20T07:27:47Z) - Intelligent Trajectory Design for RIS-NOMA aided Multi-robot
Communications [59.34642007625687]
目的は,ロボットの軌道とNOMA復号命令を協調的に最適化することで,マルチロボットシステムにおける全軌道の総和率を最大化することである。
ARIMAモデルとDouble Deep Q-network (D$3$QN)アルゴリズムを組み合わせたML方式を提案する。
論文 参考訳(メタデータ) (2022-05-03T17:14:47Z) - Learning Forward Dynamics Model and Informed Trajectory Sampler for Safe
Quadruped Navigation [1.2783783498844021]
典型的なSOTAシステムは、マッパー、グローバルプランナー、ローカルプランナー、コマンドトラッキングコントローラの4つの主要モジュールで構成されている。
我々は,グローバルプランナから粗い計画経路を追跡するためのベロシティプランを生成するために,ロバストで安全なローカルプランナを構築している。
この枠組みを用いることで、四足歩行ロボットは衝突なしに様々な複雑な環境を自律的に移動でき、ベースライン法と比較してスムーズなコマンドプランを生成することができる。
論文 参考訳(メタデータ) (2022-04-19T04:01:44Z) - Hierarchical Path-planning from Speech Instructions with Spatial Concept-based Topometric Semantic Mapping [7.332652485849632]
本研究の目的は,位相的意味マップと経路計画を用いた階層的空間表現の実現である。
本研究では,SIGVerseシミュレータ上でのToyota Human Support Robotを用いた家庭環境実験と,実ロボットAlbertを用いた実験室環境実験を行った。
経路距離を用いた音声指示を用いたナビゲーション実験は,経路コストを基準とした階層的経路計画法よりもSpCoTMHPの性能向上を実証した。
論文 参考訳(メタデータ) (2022-03-21T09:15:25Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。