論文の概要: Geo-OLM: Enabling Sustainable Earth Observation Studies with Cost-Efficient Open Language Models & State-Driven Workflows
- arxiv url: http://arxiv.org/abs/2504.04319v1
- Date: Sun, 06 Apr 2025 01:31:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:14:05.993734
- Title: Geo-OLM: Enabling Sustainable Earth Observation Studies with Cost-Efficient Open Language Models & State-Driven Workflows
- Title(参考訳): Geo-OLM: コスト効率の良いオープン言語モデルとステート駆動ワークフローによる持続可能な地球観測研究を実現する
- Authors: Dimitrios Stamoulis, Diana Marculescu,
- Abstract要約: Geo-OLMは、ツール呼び出しからタスクの進行を分離するツール拡張された地理空間エージェントである。
提案手法は,GPT-4oの10%以内の精度で,プロプライエタリなモデルに適合して動作する。
- 参考スコア(独自算出の注目度): 9.453883041423468
- License:
- Abstract: Geospatial Copilots hold immense potential for automating Earth observation (EO) and climate monitoring workflows, yet their reliance on large-scale models such as GPT-4o introduces a paradox: tools intended for sustainability studies often incur unsustainable costs. Using agentic AI frameworks in geospatial applications can amass thousands of dollars in API charges or requires expensive, power-intensive GPUs for deployment, creating barriers for researchers, policymakers, and NGOs. Unfortunately, when geospatial Copilots are deployed with open language models (OLMs), performance often degrades due to their dependence on GPT-optimized logic. In this paper, we present Geo-OLM, a tool-augmented geospatial agent that leverages the novel paradigm of state-driven LLM reasoning to decouple task progression from tool calling. By alleviating the workflow reasoning burden, our approach enables low-resource OLMs to complete geospatial tasks more effectively. When downsizing to small models below 7B parameters, Geo-OLM outperforms the strongest prior geospatial baselines by 32.8% in successful query completion rates. Our method performs comparably to proprietary models achieving results within 10% of GPT-4o, while reducing inference costs by two orders of magnitude from \$500-\$1000 to under \$10. We present an in-depth analysis with geospatial downstream benchmarks, providing key insights to help practitioners effectively deploy OLMs for EO applications.
- Abstract(参考訳): 地理空間コパイロットは地球観測(EO)と気候モニタリングのワークフローを自動化する大きな可能性を秘めているが、GPT-4oのような大規模モデルへの依存はパラドックスを導入している。
地理空間アプリケーションでエージェントAIフレームワークを使用することで、何千ドルものAPI課金を処理したり、デプロイに高価な電力集約型GPUを必要としたり、研究者や政策立案者、NGOにとって障壁を生じる可能性がある。
残念なことに、地理空間コパイロットがオープン言語モデル(OLM)でデプロイされる場合、GPT最適化ロジックに依存するため、パフォーマンスは劣化することが多い。
本稿では,タスク進行をツール呼び出しから切り離すために,状態駆動型LLM推論の新たなパラダイムを活用するツール拡張型地理空間エージェントGeo-OLMを提案する。
ワークフロー推論の負担を軽減することで、低リソースのOLMがより効率的に地理空間的タスクを完了できるようにする。
7Bパラメータ以下の小さなモデルに縮小すると、Geo-OLMはクエリ完了率を32.8%向上させる。
提案手法は,GPT-4oの10%以内で結果が得られるプロプライエタリモデルに対して,500-\$1000から10以下の2桁の推論コストを削減できる。
我々は地理空間的な下流のベンチマークで詳細な分析を行い、実践者がEOアプリケーションにOLMを効果的にデプロイするのに役立つ重要な洞察を提供する。
関連論文リスト
- PEACE: Empowering Geologic Map Holistic Understanding with MLLMs [64.58959634712215]
地質図は地質学の基本的な図として、地球の地下と地表の構造と構成に関する重要な洞察を提供する。
その重要性にもかかわらず、現在のマルチモーダル大言語モデル(MLLM)は地質図の理解に乏しいことが多い。
このギャップを定量化するために、地質地図理解においてMLLMを評価するための最初のベンチマークであるGeoMap-Benchを構築した。
論文 参考訳(メタデータ) (2025-01-10T18:59:42Z) - An LLM Agent for Automatic Geospatial Data Analysis [5.842462214442362]
大規模言語モデル(LLM)は、データサイエンスコード生成タスクで使われている。
複雑なデータ構造と空間的制約を組み込むのが困難であるため,空間空間データ処理への応用は困難である。
ジオアジェント(GeoAgent)は,LLMが地理空間データ処理をより効率的に処理できるように設計された対話型フレームワークである。
論文 参考訳(メタデータ) (2024-10-24T14:47:25Z) - GeoLLM-Engine: A Realistic Environment for Building Geospatial Copilots [1.8434042562191815]
GeoLLM-Engineは、リモートセンシングプラットフォーム上でアナリストが日常的に実行する複雑なタスクを備えた、ツール拡張されたエージェントのための環境である。
我々は100GPT-4-Turboノードにまたがる巨大な並列エンジンを活用し、50万以上の多様なマルチツールタスクと1100万の衛星画像にスケールします。
論文 参考訳(メタデータ) (2024-04-23T20:23:37Z) - GeoGalactica: A Scientific Large Language Model in Geoscience [95.15911521220052]
大規模言語モデル(LLM)は、自然言語処理(NLP)における幅広いタスクを解く一般的な知識と能力で大きな成功を収めている。
我々は、LLMを地学に特化させ、さらに、地学の膨大なテキストでモデルを事前訓練し、また、カスタム収集した指導チューニングデータセットで得られたモデルを教師付き微調整(SFT)する。
我々はGeoGalacticaを65億のトークンを含む地球科学関連のテキストコーパスで訓練し、最大の地球科学固有のテキストコーパスとして保存する。
次に、100万対の命令チューニングでモデルを微調整する。
論文 参考訳(メタデータ) (2023-12-31T09:22:54Z) - Charting New Territories: Exploring the Geographic and Geospatial
Capabilities of Multimodal LLMs [35.86744469804952]
MLLM(Multimodal large language model)は、幅広いタスクにおいて顕著な能力を示しているが、地理的および地理空間領域におけるその知識と能力はまだ研究されていない。
我々はこれらの領域におけるMLLMの様々な視覚能力を探索する一連の実験を行い、特にフロンティアモデル GPT-4V に注目した。
我々の手法は、視覚的なタスクからなる小さなベンチマークでこれらのモデルに挑戦し、その能力を様々な複雑さでテストする。
論文 参考訳(メタデータ) (2023-11-24T18:46:02Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoGPT: Understanding and Processing Geospatial Tasks through An
Autonomous GPT [6.618846295332767]
GISの意思決定者は、空間的タスクを解決するために、一連の空間的アルゴリズムと演算を組み合わせる必要がある。
我々は,地理空間データ収集,処理,解析を自律的に行うことのできるGeoGPTと呼ばれる新しいフレームワークを開発した。
論文 参考訳(メタデータ) (2023-07-16T03:03:59Z) - K2: A Foundation Language Model for Geoscience Knowledge Understanding
and Utilization [105.89544876731942]
大規模言語モデル(LLM)は自然言語処理の一般分野において大きな成功を収めている。
我々は、地球科学におけるLLM研究をさらに促進するために開発された一連の資源とともに、地球科学における最初のLLMであるK2を提示する。
論文 参考訳(メタデータ) (2023-06-08T09:29:05Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z) - Applications of physics-informed scientific machine learning in
subsurface science: A survey [64.0476282000118]
地球系は、化石エネルギー探査、廃棄物処理、地質炭素隔離、再生可能エネルギー生成などの人間の活動によって変化した地質形成です。
したがって、ジオシステムの責任ある使用と探索は、効率的な監視、リスクアセスメント、および実用的な実装のための意思決定支援ツールに依存するジオシステムガバナンスにとって重要です。
近年の機械学習アルゴリズムと新しいセンシング技術の急速な進歩は、地下研究コミュニティがジオシステムガバナンスの有効性と透明性を向上させる新しい機会を提示しています。
論文 参考訳(メタデータ) (2021-04-10T13:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。