論文の概要: Agri-R1: Empowering Generalizable Agricultural Reasoning in Vision-Language Models with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2601.04672v1
- Date: Thu, 08 Jan 2026 07:34:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.078886
- Title: Agri-R1: Empowering Generalizable Agricultural Reasoning in Vision-Language Models with Reinforcement Learning
- Title(参考訳): Agri-R1:強化学習型視覚言語モデルにおける汎用農業推論の活用
- Authors: Wentao Zhang, Lifei Wang, Lina Lu, MingKun Xu, Shangyang Li, Yanchao Yang, Tao Fang,
- Abstract要約: 我々は,農業用大規模モデルであるtextbfAgri-R1を提案する。
我々のフレームワークは、視覚言語合成とLLMに基づくフィルタリングによる高品質な推論データを生成する。
疾患認識の精度は+23.2%、農業知識のQAは+33.3%、クロスドメインの一般化は+26.10ポイント向上した。
- 参考スコア(独自算出の注目度): 22.34625628938106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agricultural disease diagnosis challenges VLMs, as conventional fine-tuning requires extensive labels, lacks interpretability, and generalizes poorly. While reasoning improves model robustness, existing methods rely on costly expert annotations and rarely address the open-ended, diverse nature of agricultural queries. To address these limitations, we propose \textbf{Agri-R1}, a reasoning-enhanced large model for agriculture. Our framework automates high-quality reasoning data generation via vision-language synthesis and LLM-based filtering, using only 19\% of available samples. Training employs Group Relative Policy Optimization (GRPO) with a novel proposed reward function that integrates domain-specific lexicons and fuzzy matching to assess both correctness and linguistic flexibility in open-ended responses. Evaluated on CDDMBench, our resulting 3B-parameter model achieves performance competitive with 7B- to 13B-parameter baselines, showing a +23.2\% relative gain in disease recognition accuracy, +33.3\% in agricultural knowledge QA, and a +26.10-point improvement in cross-domain generalization over standard fine-tuning. Ablation studies confirm that the synergy between structured reasoning data and GRPO-driven exploration underpins these gains, with benefits scaling as question complexity increases.
- Abstract(参考訳): 農業病の診断は、従来の微調整には広範囲なラベルが必要であり、解釈性に欠け、一般化が不十分であるため、VLMに挑戦する。
推論はモデルの堅牢性を改善するが、既存の手法は高価な専門家アノテーションに依存しており、農業用クエリのオープンで多様な性質にはほとんど対処しない。
これらの制約に対処するため,農業における推論強化型大規模モデルである「textbf{Agri-R1}」を提案する。
我々のフレームワークは、利用可能なサンプルの19.5%しか使用せず、視覚言語合成とLLMに基づくフィルタリングによる高品質な推論データ生成を自動化する。
トレーニングはグループ相対政策最適化(GRPO)を採用し、ドメイン固有の語彙とファジィマッチングを統合して、オープンな応答における正確性と言語的柔軟性の両方を評価する新しい報酬関数を提案する。
CDDMBenchで評価したところ, 得られた3Bパラメータモデルでは, 7B-から13B-パラメータのベースラインに対して, 疾患認識精度が+23.2\%, 農業知識QAが+33.3\%, 標準微調整によるクロスドメイン一般化が+26.10ポイント向上した。
アブレーション研究は、構造的推論データとGRPOによる探索の相乗効果がこれらの利益を支えており、問題の複雑性が増加するにつれてスケールする利点があることを確認した。
関連論文リスト
- Repurposing Synthetic Data for Fine-grained Search Agent Supervision [81.95597592711688]
LLMベースの検索エージェントは、エンティティ中心の合成データに基づいてますます訓練されている。
一般的なトレーニングメソッドは、このリッチなエンティティ情報を破棄し、代わりにスパースで結果に基づく報酬に依存します。
E-GRPO(Entity-Aware Group Relative Policy Optimization)は、高密度なエンティティ認識報酬関数を定式化する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-10-28T17:50:40Z) - Optimizing Agricultural Research: A RAG-Based Approach to Mycorrhizal Fungi Information [1.2349443032034277]
Retrieval-Augmented Generation (RAG)は自然言語処理における変換的アプローチである。
マイコフィトに適したRAG対応システムの設計と評価について述べる。
このフレームワークは、持続可能な農業システムにおける農業革新を加速し、意思決定を強化するために、AIによる知識発見の可能性を強調している。
論文 参考訳(メタデータ) (2025-09-16T20:21:55Z) - Non-Linear Model-Based Sequential Decision-Making in Agriculture [0.0]
連続的な意思決定は持続可能な農業管理と精密農業の中心である。
本研究では,探索-探索ループに直接ドメイン固有応答曲線を埋め込むモデルベースバンディットアルゴリズムのファミリーを提案する。
我々のアプローチは、持続可能な、包括的で透明な意思決定を、農業、環境管理、および同盟するアプリケーションでサポートします。
論文 参考訳(メタデータ) (2025-09-02T03:41:48Z) - AgriGPT: a Large Language Model Ecosystem for Agriculture [16.497060004913806]
AgriGPTは、農業利用のためのドメイン特化大規模言語モデルエコシステムである。
信頼性のあるデータソースを,高品質で標準化された質問応答データセットであるAgri-342Kにコンパイルする,スケーラブルなデータエンジンを設計する。
本稿では,高密度検索,スパース検索,マルチホップ知識グラフ推論を組み合わせた3チャンネル検索拡張フレームワークTri-RAGを用いる。
論文 参考訳(メタデータ) (2025-08-12T04:51:08Z) - Self-Consistency in Vision-Language Models for Precision Agriculture: Multi-Response Consensus for Crop Disease Management [0.0]
本研究は,プロンプトベースのエキスパート評価と自己整合性機構を組み合わせた,農業用画像処理のためのドメイン認識フレームワークを提案する。
本稿では,(1)画像解析出力のスケーラブルな評価のために,言語モデルを専門植物病理学者として構成するプロンプトベース評価プロトコル,(2)農業画像から複数の候補応答を生成するコサイン一貫性自己投票機構を紹介する。
診断精度は82.2%から87.8%,症状分析38.9%から52.2%,治療推奨27.8%から43.3に改善した。
論文 参考訳(メタデータ) (2025-07-08T18:32:21Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Federated In-Context Learning: Iterative Refinement for Improved Answer Quality [62.72381208029899]
In-context Learning (ICL) では、入力に提供される例を活用することで、パラメータを変更することなく、言語モデルで応答を生成することができる。
我々は,反復的協調プロセスを通じてICLを強化する汎用フレームワークであるFederated In-Context Learning (Fed-ICL)を提案する。
Fed-ICLは、クライアントと中央サーバ間のマルチラウンドインタラクションを活用することで、応答を徐々に洗練し、モデルパラメータを送信することなく、応答品質を向上させる。
論文 参考訳(メタデータ) (2025-06-09T05:33:28Z) - DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization [50.91849555841057]
グループ相対政策最適化は大規模推論モデル(LRM)の強化学習手法である
差別学習の原則を基礎として, LRMの強化のための新たな差別的制約付き最適化フレームワークを導入する。
DisCO は GRPO と DAPO などの改良型を著しく上回り、GRPO の7%、DAPO の6% を平均的に上回っている。
論文 参考訳(メタデータ) (2025-05-18T11:08:32Z) - SFR-RAG: Towards Contextually Faithful LLMs [57.666165819196486]
Retrieval Augmented Generation (RAG) は、外部コンテキスト情報を大言語モデル(LLM)と統合し、事実の精度と妥当性を高めるパラダイムである。
SFR-RAG(SFR-RAG)について述べる。
また、複数の人気かつ多様なRAGベンチマークをコンパイルする新しい評価フレームワークであるConBenchについても紹介する。
論文 参考訳(メタデータ) (2024-09-16T01:08:18Z) - Minimizing Factual Inconsistency and Hallucination in Large Language
Models [0.16417409087671928]
大規模言語モデル(LLM)は医療、教育、金融といった重要な分野で広く使われている。
本稿では,まず理性を生成する多段階フレームワークを提案する。
当社のフレームワークは,OpenAI GPT-3.5-turboの信頼性を14~25%向上し,2つのデータセットに対して16~22%向上させることで,従来の検索拡張生成(RAG)を改善する。
論文 参考訳(メタデータ) (2023-11-23T09:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。