論文の概要: GeoGPT-RAG Technical Report
- arxiv url: http://arxiv.org/abs/2509.09686v2
- Date: Mon, 15 Sep 2025 01:00:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 15:23:16.425063
- Title: GeoGPT-RAG Technical Report
- Title(参考訳): GeoGPT-RAG技術報告
- Authors: Fei Huang, Fan Wu, Zeqing Zhang, Qihao Wang, Long Zhang, Grant Michael Boquet, Hongyang Chen,
- Abstract要約: GeoGPTは、地球科学の研究を進めるために開発されたオープンな大規模言語モデルシステムである。
RAGは、外部知識ソースから取得した関連情報を出力する。
RAGは、地質学的コンテンツ用にキュレーションされた特殊なコーパスであるGeoGPT Libraryから、RAGを使用して描画する。
- 参考スコア(独自算出の注目度): 48.23789135946953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: GeoGPT is an open large language model system built to advance research in the geosciences. To enhance its domain-specific capabilities, we integrated Retrieval Augmented Generation(RAG), which augments model outputs with relevant information retrieved from an external knowledge source. GeoGPT uses RAG to draw from the GeoGPT Library, a specialized corpus curated for geoscientific content, enabling it to generate accurate, context-specific answers. Users can also create personalized knowledge bases by uploading their own publication lists, allowing GeoGPT to retrieve and respond using user-provided materials. To further improve retrieval quality and domain alignment, we fine-tuned both the embedding model and a ranking model that scores retrieved passages by relevance to the query. These enhancements optimize RAG for geoscience applications and significantly improve the system's ability to deliver precise and trustworthy outputs. GeoGPT reflects a strong commitment to open science through its emphasis on collaboration, transparency, and community driven development. As part of this commitment, we have open-sourced two core RAG components-GeoEmbedding and GeoReranker-to support geoscientists, researchers, and professionals worldwide with powerful, accessible AI tools.
- Abstract(参考訳): GeoGPTは、地球科学の研究を進めるために開発されたオープンな大規模言語モデルシステムである。
ドメイン固有の機能を強化するために、モデル出力を外部知識ソースから取得した関連情報で拡張するRetrieval Augmented Generation(RAG)を統合した。
GeoGPTは、地質学的コンテンツ用にキュレーションされた特殊なコーパスであるGeoGPT LibraryからRAGを使っており、正確な文脈固有の回答を生成することができる。
ユーザは自身のパブリッシュリストをアップロードすることで、パーソナライズされたナレッジベースを作成することもできる。
検索品質とドメインアライメントをさらに向上するため,クエリに関連付けて検索されたパスをスコア付けする埋め込みモデルとランキングモデルの両方を微調整した。
これらの拡張は、地球科学の応用のためにRAGを最適化し、正確で信頼性の高い出力を提供するシステムの能力を大幅に改善した。
GeoGPTは、コラボレーション、透明性、コミュニティ主導の開発に重点を置いて、オープンサイエンスへの強いコミットメントを反映している。
このコミットメントの一環として、我々は2つのコアRAGコンポーネント、GeoEmbeddingとGeoRerankerをオープンソース化しました。
関連論文リスト
- Geo-Semantic-Parsing: AI-powered geoparsing by traversing semantic knowledge graphs [0.7422344184734279]
ジオ・セマンティック・パーシング(Geo-Semantic-Parsing, GSP)と呼ばれる新しいジオパーシングとジオタグ技術を導入する。
GSPは自由テキストで位置参照を特定し、対応する座標を抽出する。
我々は、約10kのイベント関連ツイートを含むよく知られた参照データセット上で、GSPを評価する。
論文 参考訳(メタデータ) (2025-03-03T10:30:23Z) - Geo-FuB: A Method for Constructing an Operator-Function Knowledge Base for Geospatial Code Generation Tasks Using Large Language Models [0.5242869847419834]
本研究では,地理空間記述のセマンティクスを活用して,そのような知識基盤を構築するためのフレームワークを提案する。
サンプルの知識ベースであるGeo-FuBは154,075のGoogle Earth Engineスクリプトで構築されており、GitHubで公開されている。
論文 参考訳(メタデータ) (2024-10-28T12:50:27Z) - Geometric Feature Enhanced Knowledge Graph Embedding and Spatial Reasoning [8.561588656662419]
Geospatial Knowledge Graphs (GeoKGs) は地理と空間関係を相互にモデル化する。
一般的な知識グラフ埋め込み(KGE)技術のような、GeoKGからの採掘と推論のための既存の手法は、認識を欠いている。
本研究の目的は,新しい戦略を開発し,空間関係の幾何学的特徴を統合することで汎用KGEを強化することである。
論文 参考訳(メタデータ) (2024-10-24T00:53:48Z) - GeoCode-GPT: A Large Language Model for Geospatial Code Generation Tasks [1.7687829461198472]
本稿ではGeoCode-PTとGeoCode-SFTコーパスとGeoCode-Eval評価データセットをオープンソースとして公開した。
プレトレーニングと微調整にQRAとLoRAを活用することで,地理空間コード生成にフォーカスした最初のLLMであるGeoCode-GPT-7Bを導入する。
実験の結果、GeoCode-GPTは他のモデルよりも9.1%から32.1%、コード要約能力は5.4%から21.7%、コード生成能力は1.2%から25.1%で優れていた。
論文 参考訳(メタデータ) (2024-10-22T13:57:55Z) - GeoGalactica: A Scientific Large Language Model in Geoscience [95.15911521220052]
大規模言語モデル(LLM)は、自然言語処理(NLP)における幅広いタスクを解く一般的な知識と能力で大きな成功を収めている。
我々は、LLMを地学に特化させ、さらに、地学の膨大なテキストでモデルを事前訓練し、また、カスタム収集した指導チューニングデータセットで得られたモデルを教師付き微調整(SFT)する。
我々はGeoGalacticaを65億のトークンを含む地球科学関連のテキストコーパスで訓練し、最大の地球科学固有のテキストコーパスとして保存する。
次に、100万対の命令チューニングでモデルを微調整する。
論文 参考訳(メタデータ) (2023-12-31T09:22:54Z) - GeoGPT: Understanding and Processing Geospatial Tasks through An
Autonomous GPT [6.618846295332767]
GISの意思決定者は、空間的タスクを解決するために、一連の空間的アルゴリズムと演算を組み合わせる必要がある。
我々は,地理空間データ収集,処理,解析を自律的に行うことのできるGeoGPTと呼ばれる新しいフレームワークを開発した。
論文 参考訳(メタデータ) (2023-07-16T03:03:59Z) - K2: A Foundation Language Model for Geoscience Knowledge Understanding
and Utilization [105.89544876731942]
大規模言語モデル(LLM)は自然言語処理の一般分野において大きな成功を収めている。
我々は、地球科学におけるLLM研究をさらに促進するために開発された一連の資源とともに、地球科学における最初のLLMであるK2を提示する。
論文 参考訳(メタデータ) (2023-06-08T09:29:05Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。