論文の概要: When Large Language Models Meet UAVs: How Far Are We?
- arxiv url: http://arxiv.org/abs/2509.12795v1
- Date: Tue, 16 Sep 2025 08:14:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.960106
- Title: When Large Language Models Meet UAVs: How Far Are We?
- Title(参考訳): 大規模言語モデルがUAVと出会う時 - どこまであるのか?
- Authors: Yihua Chen, Xingle Que, Jiashuo Zhang, Ting Chen, Guangshun Li, Jiachi Chen,
- Abstract要約: 無人航空機(UAV)と大型言語モデル(LLM)の統合は、関心が高まる研究の方向として現れている。
我々は,74の論文と56のGitHubプロジェクトを対象とした実証的研究を行い,UAVシステムにおけるLLMの9つのタスクタイプを特定し,その分布を定量化した。
技術成熟度、パフォーマンス、安全性、コスト、その他の考慮事項を含む、現実世界の統合を妨げる要因を特定します。
- 参考スコア(独自算出の注目度): 15.133159607064059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The integration of unmanned aerial vehicles (UAVs) and large language models (LLMs) has emerged as a research direction of growing interest, with the potential to address challenges in autonomous decision-making, human-UAV interaction, and real-time adaptability. However, existing studies have remained largely in preliminary exploration with a limited understanding of real-world practice, risking a misalignment between academic research and practical needs and hindering the translation of results. To examine and address these potential challenges, we conducted an empirical study of 74 selected papers and 56 public GitHub projects, identified nine task types for LLMs in UAV systems, and quantified their distribution. Our findings show that academic research emphasizes theoretical modeling and task optimization with dispersed attention across tasks. In contrast, industrial projects focus on flight control, task planning, and human-machine interaction, prioritizing operability and efficiency. To further capture industry perspectives, we distributed an online questionnaire. We obtained 52 valid responses: 40.4% of practitioners have attempted to apply LLMs to UAV tasks. We further identify factors that impede real-world integration, including technological maturity, performance, safety, cost, and other considerations. Finally, we highlight challenges for future development and provide recommendations.
- Abstract(参考訳): 無人航空機(UAV)と大型言語モデル(LLM)の統合は、自律的な意思決定、人間とUAVの相互作用、リアルタイム適応性といった課題に対処する可能性を秘めている。
しかし、既存の研究は、現実の実践を限定的に理解し、学術研究と実践的ニーズの相違を危険にさらし、結果の翻訳を妨げながら、予備的な調査に留まっている。
これらの潜在的な課題を調査・解決するために,74の論文と56のGitHubプロジェクトを対象に,UAVシステムにおけるLLMの9つのタスクタイプを特定し,その分布を定量化した実証的研究を行った。
本研究は,課題間を分散した理論モデリングとタスク最適化を重視した学術研究である。
対照的に、産業プロジェクトは飛行制御、タスク計画、人間と機械の相互作用に重点を置いており、操作性と効率性を優先している。
産業の視点をさらに把握するため,オンラインアンケートを配布した。
52の有効な回答を得た。40.4%の実践者がUAVタスクにLLMを適用しようと試みている。
さらに、技術成熟度、パフォーマンス、安全性、コスト、その他の考慮事項を含む、現実世界の統合を妨げる要因を特定します。
最後に、今後の開発における課題を強調し、レコメンデーションを提供します。
関連論文リスト
- Software Engineering for Large Language Models: Research Status, Challenges and the Road Ahead [4.835306415626808]
大規模言語モデル(LLM)は人工知能(AI)を再定義している
LLMの開発は、ライフサイクルを通してますます複雑な課題に直面している。
ソフトウェア工学(SE)アプローチの観点から、これらの課題と解決策を体系的に探求する既存の研究はない。
論文 参考訳(メタデータ) (2025-06-30T12:09:29Z) - An Overview of Large Language Models for Statisticians [109.38601458831545]
大規模言語モデル(LLM)は人工知能(AI)の変換ツールとして登場した。
本稿では, 統計学者がLLMの開発に重要な貢献できる可能性について考察する。
我々は不確実性定量化、解釈可能性、公正性、プライバシー、透かし、モデル適応といった問題に焦点を当てる。
論文 参考訳(メタデータ) (2025-02-25T03:40:36Z) - SUPER: Evaluating Agents on Setting Up and Executing Tasks from Research Repositories [55.161075901665946]
Superは、機械学習(ML)と自然言語処理(NLP)の研究リポジトリを扱う研究者が直面する現実的な課題を捉えることを目的としている。
本ベンチマークでは,注釈付きエキスパートソリューションを用いたエンドツーエンド問題45,特定の課題に焦点をあてたエキスパートソリューションから導いた152,大規模開発のための602の問題を自動生成する。
我々は、最先端のアプローチが、最良のモデル(GPT-4o)でこれらの問題を解決するのに苦労していることを示し、エンド・ツー・エンドの16.3%と46.1%のシナリオを解決した。
論文 参考訳(メタデータ) (2024-09-11T17:37:48Z) - WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [85.95607119635102]
大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-07T07:15:49Z) - Large Language Models for UAVs: Current State and Pathways to the Future [6.85423435360359]
無人航空機(UAV)は様々な分野にまたがるトランスフォーメーション技術として登場した。
この研究は、自律システムの開発を促進するために、UAVとLarge Language Models(LLM)を統合する大きな可能性を探求する。
論文 参考訳(メタデータ) (2024-05-02T21:30:10Z) - Effectiveness Assessment of Recent Large Vision-Language Models [78.69439393646554]
本稿では,多言語多言語モデル(LVLM)の専門的および汎用的な課題における能力を評価する。
私たちは、自然、医療、産業という3つの異なるアプリケーションシナリオで6つの挑戦的なタスクを採用しています。
我々は,MiniGPT-v2,LLaVA-1.5,Shikraを含む最近の3つのオープンソースLVLMの視覚的認識および局所化性能について検討した。
論文 参考訳(メタデータ) (2024-03-07T08:25:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。