論文の概要: LLM-Foraging: Large Language Models for Decentralized Swarm Robot Foraging
- arxiv url: http://arxiv.org/abs/2605.01461v1
- Date: Sat, 02 May 2026 14:21:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.785998
- Title: LLM-Foraging: Large Language Models for Decentralized Swarm Robot Foraging
- Title(参考訳): LLM鍛造:分散Swarmロボット鍛造のための大規模言語モデル
- Authors: Peihan Li, Joanna Gutierrez, Fabian Hernandez, Qi Lu, Lifeng Zhou,
- Abstract要約: LLM-Foragingは、CPFAステートマシンを大規模言語モデル(LLM)で拡張する分散Swarmコントローラである。
各ロボットは独自のLLMクライアントを実行し、ローカルで観測可能な状態のみを使用してクエリし、既存のCPFAモーションとセンシングスタックは選択したアクションを実行する。
ガゼボのLLM-Foraging in Gazebo with TurtleBot3 Robots across 36 configurations of team size of 4 to 10 robots, arena sizes to 6 x6 to 10 x10meter, and three resource distributions。
- 参考スコア(独自算出の注目度): 13.56144018976383
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Swarm foraging algorithms, such as the central-place foraging algorithm (CPFA), typically rely on offline parameter optimization using genetic algorithms (GA) or reinforcement learning, yielding policies tightly coupled to a specific combination of team size, arena size, and resource distribution. When deployment conditions change, performance degrades, and retraining is computationally expensive. We propose LLM-Foraging, a decentralized swarm controller that augments the CPFA state machine with a large language model (LLM) tactical decision-maker at three structured decision points, namely post-deposit, central-zone arrival, and search starvation. Each robot runs its own LLM client and queries it using only locally observable state, while the existing CPFA motion and sensing stack executes the selected action. Because the LLM serves as a general decision policy rather than parameters fitted to a single configuration, the controller is training-free at deployment and transfers across configurations without re-optimization. We evaluate LLM-Foraging in Gazebo with TurtleBot3 robots across 36 configurations spanning team sizes of 4 to 10 robots, arena sizes from 6x6 to 10x10 meters, and three resource distributions (clustered, powerlaw, random). LLM-Foraging collects more resources than the GA-tuned CPFA baseline across the evaluated configurations and is more consistent, a property that the GA's single-configuration tuning does not transfer.
- Abstract(参考訳): 中央位置捕食アルゴリズム(CPFA)のような群れ捕食アルゴリズムは、通常、遺伝的アルゴリズム(GA)や強化学習を使ったオフラインパラメータ最適化に依存し、チームサイズ、アリーナサイズ、リソース分布の特定の組み合わせと密結合したポリシーを生成する。
デプロイメント条件が変更されると、パフォーマンスが低下し、再トレーニングは計算コストがかかる。
本稿では,大規模言語モデル(LLM)によるCPFA状態マシンを3つの構造化決定点,すなわちポスト・デポジット,セントラル・ゾーン到着,サーチ・飢餓で拡張する分散Swarmコントローラ LLM-Foragingを提案する。
各ロボットは独自のLLMクライアントを実行し、ローカルで観測可能な状態のみを使用してクエリし、既存のCPFAモーションとセンシングスタックは選択したアクションを実行する。
LLMは単一の構成に適合するパラメータではなく、一般的な決定ポリシーとして機能するため、コントローラはデプロイ時にトレーニング不要で、再最適化せずに構成間で転送される。
ガゼボのLLM-Foraging in Gazeboでは,TurtleBot3ロボットを用いて,チームサイズが4~10ロボット,アリーナサイズが6×6~10m,リソース分布が3つ(クラスタリング,パワーロー,ランダム)で評価した。
LLM-Foragingは、評価された構成にわたってGAチューニングされたCPFAベースラインよりも多くのリソースを収集し、より一貫性がある。
関連論文リスト
- AutoSiMP: Autonomous Topology Optimization from Natural Language via LLM-Driven Problem Configuration and Adaptive Solver Control [4.365822392824561]
AutoSiMPは、自然言語の構造的問題記述を手動で設定せずに検証されたバイナリトポロジーに変換する。
パイプラインは,(1)平易なプロンプトを幾何仕様に解析し,サポート,負荷,受動的領域,メッシュパラメータに解析するLLMベースのソルバ,(2)ソルバ対応DOFアレイ,力ベクトル,受動的要素マスクを生成する境界条件生成器,(3)3フィールドSIMPソルバ,およびHeavisideプロジェクションとプラグ可能な継続制御を備える。
論文 参考訳(メタデータ) (2026-03-27T21:23:44Z) - ChunkWise LoRA: Adaptive Sequence Partitioning for Memory-Efficient Low-Rank Adaptation and Accelerated LLM Inference [0.21064685964744576]
ChunkWise LoRAはトークンの複雑さに基づいてシーケンスを可変長のチャンクに分割し、各チャンクに調整されたローランク構成を割り当てる。
Wikitext-103やSQuADのようなベンチマークデータセットの実験では、ChunkWise LoRAは最大で34%のレイテンシと38%のメモリ削減を実現している。
論文 参考訳(メタデータ) (2026-01-28T22:58:28Z) - RollArt: Scaling Agentic RL Training via Disaggregated Infrastructure [49.88201789074532]
エージェント強化学習(RL)は、大規模言語モデル(LLM)が自律的な意思決定と長期計画を行うことを可能にする。
分散インフラストラクチャ上でマルチタスクエージェントRLのスループットを最大化する分散システムであるRollArcを提案する。
論文 参考訳(メタデータ) (2025-12-27T11:14:23Z) - PointLoRA: Low-Rank Adaptation with Token Selection for Point Cloud Learning [54.99373314906667]
ポイントクラウドのための自己教師付き表現学習は、様々なタスクで事前訓練されたモデルパフォーマンスを改善する効果を実証した。
事前訓練されたモデルは複雑さが増すにつれて、下流のアプリケーションに完全に微調整を施すには、かなりの計算資源とストレージ資源が必要である。
そこで我々は,低ランク適応(LoRA)とマルチスケールトークン選択を併用した簡易かつ効果的なPointLoRAを提案する。
論文 参考訳(メタデータ) (2025-04-22T16:41:21Z) - AutoHete: An Automatic and Efficient Heterogeneous Training System for LLMs [68.99086112477565]
トランスフォーマーベースの大規模言語モデル(LLM)は、シーケンスモデリングやテキスト生成において例外的な機能を示した。
既存の異種トレーニング手法は、トレーニング可能なモデルの規模を大幅に拡大するが、かなりの通信オーバーヘッドとCPUワークロードを導入している。
本稿では,シングルGPU環境とマルチGPU環境の両方に互換性のある,自動的で効率的なヘテロジニアストレーニングシステムであるAutoHeteを提案する。
論文 参考訳(メタデータ) (2025-02-27T14:46:22Z) - Decentralized Low-Rank Fine-Tuning of Large Language Models [12.270878920401948]
我々は,Low-Rank Adaptation (LoRA)に基づく大規模言語モデル(LLM)のための分散微調整アルゴリズムであるDec-LoRAを提案する。
BERT と LLaMA の実験により,Dec-LoRA は様々な条件下で集中型 LoRA に匹敵する性能を示した。
これらの結果は、分散環境におけるスケーラブルな微調整のためのDec-LoRAの可能性を強調している。
論文 参考訳(メタデータ) (2025-01-26T01:56:25Z) - A Local Information Aggregation based Multi-Agent Reinforcement Learning for Robot Swarm Dynamic Task Allocation [4.144893164317513]
分散化された部分観測可能なマルコフ決定プロセス(Dec_POMDP)を用いた新しいフレームワークを提案する。
我々の方法論の核心は、局所情報集約多元決定政策勾配(LIA_MADDPG)アルゴリズムである。
実験により,LIAモジュールは様々なCTDEベースのMARL法にシームレスに統合可能であることが示された。
論文 参考訳(メタデータ) (2024-11-29T07:53:05Z) - Octo-planner: On-device Language Model for Planner-Action Agents [19.627197141903505]
Planner-Actionフレームワークは、計画とアクションの実行を2つの異なるコンポーネントに分離する。
Agentはまず、タスクをサブステップのシーケンスに分解してユーザクエリに応答し、アクションエージェントによって実行される。
我々は、文脈内学習の代わりにモデル微調整を採用し、計算コストとエネルギー消費を削減した。
論文 参考訳(メタデータ) (2024-06-26T05:40:10Z) - Federated Full-Parameter Tuning of Billion-Sized Language Models with Communication Cost under 18 Kilobytes [53.4856038354195]
事前訓練された大規模言語モデル(LLM)は、自然言語命令に対する応答性を改善するために微調整が必要である。
FedKSeedは、ランダムシードの有限セットによるゼロ階最適化を採用している。
サーバとクライアント間の通信要求を大幅に減らし、ランダムなシードをわずかに減らします。
論文 参考訳(メタデータ) (2023-12-11T13:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。