論文の概要: GA-VisAgent: A Multi-Agent application for code generation and visualization in interactive learning
- arxiv url: http://arxiv.org/abs/2605.01299v1
- Date: Sat, 02 May 2026 07:15:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.692827
- Title: GA-VisAgent: A Multi-Agent application for code generation and visualization in interactive learning
- Title(参考訳): GA-VisAgent:対話型学習におけるコード生成と可視化のためのマルチエージェントアプリケーション
- Authors: Wang Jian, Zhou Jianbo, Xiong Yuhao, Liu Zhenxia, Luo Wen, Yuan LinWang, Yu ZhaoYuan,
- Abstract要約: 本研究では,Geometric Algebraコード生成と可視化のためのマルチエージェント対話型学習アプリケーションGA-VisAgentを提案する。
自然言語と数式を入力としてサポートし、自動的に実行可能なコードを生成する。
その結果、GA-VisAgentは40の典型的なコンフォーマルGAタスクに対して90%のコード生成成功率を達成し、GPT-4oよりも70%改善した。
- 参考スコア(独自算出の注目度): 0.41881145631816147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric Algebra (GA) presents challenges to learners due to its highly abstract mathematical structure and complex operational rules, as translating algebraic manipulations into concrete geometric interpretations is a non-intuitive process when developing related code. Currently, some existing GA software packages rely on manually written scripts for code generation and visualization, but their high learning curve hinders widespread adoption. Meanwhile, methods based on Large Language Models (LLMs) often produce logical errors when generating specific GA scripts, such as GAALOPScript, resulting in generally low accuracy. To address these issues, this study proposes GA-VisAgent -- a multi-agent interactive learning application for GA code generation and visualization -- building upon a Geometric algebra large language model (GAGPT). Integrating task planning mechanisms with ReAct reasoning strategies, GA-VisAgent can decompose complex operations into five standardized subtasks, including core operations like geometric products, rotations, and reflections. It supports natural language and mathematical formulas as input to automatically generate executable code, accompanied by interactive visualizations to aid user comprehension. Experimental results show that GA-VisAgent achieved a 90% code generation success rate across 40 typical Conformal GA tasks, representing a 70% improvement over GPT-4o. This application introduces an extensible new paradigm for teaching GA and developing visualization tools for related mathematical concepts. The online service for this project will be available at http://gagis.cn/gacrac.
- Abstract(参考訳): Geometric Algebra (GA)は、代数的操作を具体的な幾何学的解釈に変換することは、関連するコードを開発する際の非直感的なプロセスである。
現在、いくつかの既存のGAソフトウェアパッケージは、コード生成と視覚化のために手書きのスクリプトに依存しているが、そのハイラーニング曲線は広く採用を妨げている。
一方、Large Language Models (LLMs) に基づくメソッドはGAALOPScriptのような特定のGAスクリプトを生成する際に論理エラーを発生させることが多く、一般的には精度が低い。
GA-VisAgent(GAコード生成と可視化のためのマルチエージェント対話型学習アプリケーション)は、幾何学代数大言語モデル(GAGPT)に基づいて構築されている。
タスク計画機構とReAct推論戦略を統合することで、GA-VisAgentは複雑な操作を5つの標準化されたサブタスクに分解することができる。
自然言語と数式を入力としてサポートし、自動的に実行可能なコードを生成する。
実験の結果、GA-VisAgentは40の典型的なコンフォーマルGAタスクに対して90%のコード生成成功率を達成し、GPT-4oよりも70%改善した。
本アプリケーションは,GA教育のための拡張可能な新しいパラダイムを導入し,関連する数学的概念の可視化ツールを開発する。
このプロジェクトのオンラインサービスはhttp://gagis.cn/gacrac.comで提供される。
関連論文リスト
- Exploring Interaction Paradigms for LLM Agents in Scientific Visualization [7.22431217973039]
本稿では,大規模言語モデル(LLM)エージェントが科学的可視化(SciVis)タスクでどのように機能するかを検討する。
我々は、ドメイン固有のエージェントと構造化ツールの使用、コンピュータ利用エージェント、汎用コーディングエージェントの3つの主要な相互作用パラダイムを比較した。
論文 参考訳(メタデータ) (2026-04-30T15:22:28Z) - El Agente Gráfico: Structured Execution Graphs for Scientific Agents [7.47895130442454]
タイプセーフな実行環境内に,大規模言語モデル(LLM)による意思決定を組み込んだ単一エージェントフレームワークであるEl Agente Grficoを紹介する。
我々のアプローチの中心は、科学概念の構造化された抽象化と、型付きPythonオブジェクトとして計算状態を表すオブジェクトグラフマッパーである。
大学レベルの量子化学タスクのスイートにまたがって,自動ベンチマークフレームワークを開発することにより,システムの評価を行う。
論文 参考訳(メタデータ) (2026-02-19T23:47:05Z) - ThinkGen: Generalized Thinking for Visual Generation [97.19923474851987]
ThinkGenは、さまざまな世代のシナリオでChain-of-Thought(CoT)推論を明示的に活用する、思考駆動のビジュアル生成フレームワークである。
本稿では,MLLMとDiTモジュール間の強化学習を交互に行う,分離可能なGRPOベースのトレーニングパラダイムを提案する。
実験の結果、ThinkGenは複数の世代ベンチマークで堅牢で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-29T16:08:50Z) - From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.3696990310269]
大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文 参考訳(メタデータ) (2025-11-23T17:09:34Z) - Graph-Augmented Large Language Model Agents: Current Progress and Future Prospects [57.53024716739594]
グラフ拡張LDMエージェント(GLA)は複雑なエージェントシステムの構造、連続性、調整を強化する。
本稿では,最近の進歩の概要をタイムリーかつ包括的に紹介し,今後の研究の方向性を明らかにする。
本論文は,GLAにおける今後の研究のロードマップとして機能し,GLAエージェントシステムにおけるグラフの役割のより深い理解を促進することを願っている。
論文 参考訳(メタデータ) (2025-07-29T00:27:12Z) - AuraGenome: An LLM-Powered Framework for On-the-Fly Reusable and Scalable Circular Genome Visualizations [7.573142181205822]
AuraGenomeは、迅速で再利用可能な、スケーラブルな円形ゲノム視覚化のためのフレームワークである。
AuraGenomeは、セマンティック駆動のマルチエージェントワークフローとインタラクティブなビジュアル分析システムを組み合わせたものだ。
論文 参考訳(メタデータ) (2025-06-18T03:29:30Z) - GeoCoder: Solving Geometry Problems by Generating Modular Code through Vision-Language Models [10.443672399225983]
視覚パラメトリックモデル(VLM)は、様々なマルチモーダルタスクにおいて大きな進歩を遂げた。
彼らはいまだに幾何学的な問題に悩まされており、事前訓練中に見えない数学的操作を行うことができないため、著しく制限されている。
モジュール型コードファインタニングを利用して,事前に定義された幾何関数ライブラリを使用してコードの生成と実行を行うGeoCoderを提案する。
論文 参考訳(メタデータ) (2024-10-17T12:56:52Z) - Revisiting and Benchmarking Graph Autoencoders: A Contrastive Learning Perspective [28.152560472541143]
グラフオートエンコーダ(GAE)は、グラフ構造化データの意味のある表現を学習できる自己教師型学習モデルである。
コントラスト学習の原則を利用して意味のある表現を学習する汎用的で強力なGAEフレームワークであるlrGAEを紹介する。
論文 参考訳(メタデータ) (2024-10-14T07:59:30Z) - Semantic Tracklets: An Object-Centric Representation for Visual
Multi-Agent Reinforcement Learning [126.57680291438128]
本研究では,不整合表現によるスケーラビリティの実現について検討する。
視覚多エージェント粒子環境(VMPE)と視覚多エージェントGFootball環境における意味トラックレット'の評価を行った。
特に,この手法は視覚データのみを用いて,GFootball環境における5人のプレイヤーの戦略を学習した最初の方法である。
論文 参考訳(メタデータ) (2021-08-06T22:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。