論文の概要: GRAIL: AI translation for scientists application workflow on satellite data
- arxiv url: http://arxiv.org/abs/2605.24784v1
- Date: Sat, 23 May 2026 23:58:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.435972
- Title: GRAIL: AI translation for scientists application workflow on satellite data
- Title(参考訳): GRAIL: 衛星データに基づく科学者のワークフローのためのAI翻訳
- Authors: Zhuocheng Shang, Ahmed Eldawy,
- Abstract要約: ドメイン科学者は、衛星画像を分析するためのPythonスクリプトの開発が増えているが、大規模データに対するスケーラビリティは欠如している。
本稿では,Pythonの地理空間変換を,科学者が新しいフレームワークを学ぶことなく,実行可能なSparkベースのプログラムに変換するエージェントシステムであるGRAILについて述べる。
- 参考スコア(独自算出の注目度): 2.528587018109353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain scientists increasingly develop Python scripts to analyze satellite imagery but they lack scalability to large-scale data. This paper demonstrates GRAIL, an agentic translation system that converts Python geospatial workflows into executable Spark-based programs without requiring scientists to learn a new framework. Rather than fine-tuning a specialized LLM model, GRAIL adapts RDPro, a Scala library for satellite data analysis, to make it LLM-ready using structured documentation, API alias functions, and repair-oriented error logs. Translation is structured as a LangGraph pipeline that decomposes code generation into explicit sections with guided inputs and outputs, enabling targeted repair without regenerating the full program. We demonstrate GRAIL on real-world geospatial workflows and showcase the correctness and scalability of the translated code.
- Abstract(参考訳): ドメイン科学者は、衛星画像を分析するためのPythonスクリプトの開発が増えているが、大規模データに対するスケーラビリティは欠如している。
本稿では,Pythonの地理空間ワークフローを科学者が新しいフレームワークを学ぶことなく,実行可能なSparkベースのプログラムに変換するエージェント翻訳システムであるGRAILについて述べる。
特殊なLLMモデルを微調整する代わりに、GRAILは、衛星データ分析用のScalaライブラリRDProを適用して、構造化ドキュメント、APIエイリアス関数、修正指向エラーログを使用してLLM対応にする。
翻訳はLangGraphパイプラインとして構成され、コード生成をガイドされた入力と出力で明示的なセクションに分解する。
実世界の地理空間のワークフローでGRAILを実演し、翻訳されたコードの正確性とスケーラビリティを示す。
関連論文リスト
- ARISE: A Repository-level Graph Representation and Toolset for Agentic Fault Localization and Program Repair [0.0]
ARISE (Agentic Repository-level Issue Solving Engine) は,マルチグラニュラリティプログラムグラフを用いたLLMエージェントを拡張したものである。
ARISEはこのグラフを3層ツールAPIを通じて公開し、データフロースライシングをファーストクラスのクエリ可能なエージェントプリミティブとして提供する。
我々は、Qwen2.5-Coder-32B-Instructをバックボーンとして、SWE-bench Lite(300の実際のGitHubイシュー、11のPythonレポジトリ)を評価した。
論文 参考訳(メタデータ) (2026-05-04T19:59:23Z) - GPT-4.1 Sets the Standard in Automated Experiment Design Using Novel Python Libraries [0.649540541957527]
大規模言語モデル(LLM)は、科学研究におけるコード生成を自動化するツールとして急速に進歩してきた。
本研究では,関数型Pythonコードを生成する上で,最先端のLLMの選択を体系的にベンチマークする。
結果は、モデルの小さなサブセットだけが一貫して正しい実行可能なコードを生成することを示している。
論文 参考訳(メタデータ) (2025-07-30T13:11:29Z) - Streamlining Knowledge Graph Creation with PyRML [0.0]
PyRMLは、宣言型マッピングを通じて知識グラフを構築するためのPythonネイティブライブラリである。
宣言的意味論と実践的知識グラフ工学のギャップを埋める。
論文 参考訳(メタデータ) (2025-05-27T09:40:29Z) - SweRank: Software Issue Localization with Code Ranking [109.3289316191729]
SweRankは、ソフトウェア問題ローカライゼーションのための効率的な検索と参照のためのフレームワークである。
パブリックなGitHubリポジトリからキュレートされた大規模なデータセットであるSweLocを構築します。
SweRankは最先端の性能を達成し、従来のランキングモデルとコストの高いエージェントベースシステムの両方より優れていることを示す。
論文 参考訳(メタデータ) (2025-05-07T19:44:09Z) - Evaluation of Code LLMs on Geospatial Code Generation [1.6834474847800562]
大規模言語モデル(LLM)は、データサイエンスと機械学習アプリケーションのためのPythonコードを生成することができる。
本稿では,空間的タスクの選択に基づいて,コード生成モデルの評価ベンチマークを構築した。
我々のデータセットは、地理空間的コーディングタスクを高精度に解決できる新しいモデルの開発に貢献することを期待している。
論文 参考訳(メタデータ) (2024-10-06T20:34:03Z) - Can Large Language Models Analyze Graphs like Professionals? A Benchmark, Datasets and Models [70.03602551880526]
グラフを処理するために,大規模言語モデル(LLM)のベンチマークであるProGraphを導入する。
その結果,現在のLCMの性能は不満足であり,最高のモデルでは36%の精度しか達成できないことがわかった。
本研究では,6つの広く使用されているグラフライブラリに基づいて,クローリングされたドキュメントと自動生成コードを含むLLM4Graphデータセットを提案する。
論文 参考訳(メタデータ) (2024-09-29T11:38:45Z) - LLaGA: Large Language and Graph Assistant [73.71990472543027]
大規模言語とグラフアシスタント(LLaGA)は、グラフ構造化データの複雑さを扱う革新的なモデルである。
LLaGAは汎用性、一般化性、解釈性に優れており、異なるデータセットやタスク間で一貫して動作する。
実験の結果,LLaGAは4つのデータセットと3つのタスクに1つの単一モデルを用いて優れた性能を提供することがわかった。
論文 参考訳(メタデータ) (2024-02-13T02:03:26Z) - PiVe: Prompting with Iterative Verification Improving Graph-based Generative Capability of LLMs [28.33598529903845]
大規模言語モデルの出力の検証モジュールとして機能するために,小言語モデルをいかに訓練するかを示す。
また,検証モジュールがテキスト・ツー・グラフ生成タスクに対して,よりコスト効率のよいソリューションのために,繰り返し修正をオフラインで適用できることを示す。
論文 参考訳(メタデータ) (2023-05-21T08:11:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。