Fugu-MT 論文翻訳(概要): AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning

論文の概要: AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning

arxiv url: http://arxiv.org/abs/2410.08405v1
Date: Thu, 10 Oct 2024 22:38:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-31 03:36:35.264037
Title: AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning
Title（参考訳）: AgroGPT:エキスパートチューニングによる効率的な農業ビジョンランゲージモデル
Authors: Muhammad Awais, Ali Husain Salem Abdulla Alharthi, Amandeep Kumar, Hisham Cholakkal, Rao Muhammad Anwer,
Abstract要約: 本稿では,農業領域における視覚のみのデータを活用した指導調整データの構築手法を提案する。我々は、複数のドメインにまたがる多様な農業データセットを利用し、クラス固有の情報をキュレートし、大規模言語モデル(LLM)を用いてエキスパートチューニングセットを構築する。 AgroGPTは、複雑な農業関連の会話を処理し、有用な洞察を提供する効率的なLMMである。
参考スコア（独自算出の注目度）: 30.034193330398292
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Significant progress has been made in advancing large multimodal conversational models (LMMs), capitalizing on vast repositories of image-text data available online. Despite this progress, these models often encounter substantial domain gaps, hindering their ability to engage in complex conversations across new domains. Recent efforts have aimed to mitigate this issue, albeit relying on domain-specific image-text data to curate instruction-tuning data. However, many domains, such as agriculture, lack such vision-language data. In this work, we propose an approach to construct instruction-tuning data that harnesses vision-only data for the agriculture domain. We utilize diverse agricultural datasets spanning multiple domains, curate class-specific information, and employ large language models (LLMs) to construct an expert-tuning set, resulting in a 70k expert-tuning dataset called AgroInstruct. Subsequently, we expert-tuned and created AgroGPT, an efficient LMM that can hold complex agriculture-related conversations and provide useful insights. We also develop AgroEvals for evaluation and compare {AgroGPT's} performance with large open and closed-source models. {AgroGPT} excels at identifying fine-grained agricultural concepts, can act as an agriculture expert, and provides helpful information for multimodal agriculture questions. The code, datasets, and models are available at https://github.com/awaisrauf/agroGPT.
Abstract（参考訳）: 大規模なマルチモーダル対話モデル (LMM) の進展は、画像テキストデータの膨大なリポジトリをオンラインで利用できるようにしている。このような進歩にもかかわらず、これらのモデルは多くの場合、大きなドメインギャップに遭遇し、新しいドメイン間で複雑な会話を行う能力を妨げている。近年の取り組みは、命令チューニングデータをキュレートするために、ドメイン固有の画像テキストデータに依存しているにもかかわらず、この問題を軽減することを目的としている。しかし、農業などの多くのドメインには、このような視覚言語データがない。本研究では,農業領域における視覚のみのデータを活用した指導調整データの構築手法を提案する。我々は、複数のドメインにまたがる多様な農業データセットを利用し、クラス固有の情報をキュレートし、大規模言語モデル(LLM)を使用してエキスパートチューニングセットを構築し、その結果、AgroInstructと呼ばれる70kのエキスパートチューニングデータセットを生成する。 AgroGPTは、複雑な農業関連の会話を処理し、有用な洞察を提供する効率的なLMMである。また、評価のためのAgroEvalsを開発し、大規模なオープンソースモデルとクローズドソースモデルを比較した。 AgroGPTは、細粒度の農業概念を識別し、農業の専門家として機能し、マルチモーダル農業問題に有用な情報を提供する。コード、データセット、モデルはhttps://github.com/awaisrauf/agroGPTで公開されている。

関連論文リスト

AgriDoctor: A Multimodal Intelligent Assistant for Agriculture [45.77373971125537]
AgriDoctorは、インテリジェントな作物病診断と農業知識の相互作用のために設計されたモジュラーでマルチモーダルなフレームワークである。効果的なトレーニングと評価を容易にするために,400000の注釈付き疾患画像,831のエキスパートによる知識エントリ,30000のバイリンガルプロンプトによるインテント駆動ツール選択のベンチマークであるAgriMMを構築した。実験により、AgriMMで訓練されたAgriDoctorは、細粒度の農業作業において最先端のLVLMを著しく上回っていることが示された。
論文参考訳（メタデータ） (2025-09-21T11:51:57Z)
AgriGPT: a Large Language Model Ecosystem for Agriculture [16.497060004913806]
AgriGPTは、農業利用のためのドメイン特化大規模言語モデルエコシステムである。信頼性のあるデータソースを,高品質で標準化された質問応答データセットであるAgri-342Kにコンパイルする,スケーラブルなデータエンジンを設計する。本稿では,高密度検索,スパース検索,マルチホップ知識グラフ推論を組み合わせた3チャンネル検索拡張フレームワークTri-RAGを用いる。
論文参考訳（メタデータ） (2025-08-12T04:51:08Z)
AI in Agriculture: A Survey of Deep Learning Techniques for Crops, Fisheries and Livestock [77.95897723270453]
作物、漁業、家畜が世界の食料生産のバックボーンを形成し、成長を続ける世界の人口を養うのに不可欠である。これらの問題に対処するには、効率的で正確でスケーラブルな技術ソリューションが必要であり、人工知能(AI)の重要性を強調している。本調査では,従来の機械学習アプローチ,高度なディープラーニング技術,最新のビジョン言語基礎モデルなど,200以上の研究成果を体系的かつ徹底的にレビューする。
論文参考訳（メタデータ） (2025-07-29T17:59:48Z)
AgroBench: Vision-Language Model Benchmark in Agriculture [25.52955831089068]
AgroBenchは、視覚言語モデル(VLM)を7つの農業トピックにわたって評価するためのベンチマークである。私たちのAgroBenchは、203の作物カテゴリと682の病気カテゴリを含む最先端のカテゴリをカバーし、VLM能力を徹底的に評価しています。
論文参考訳（メタデータ） (2025-07-28T04:58:29Z)
Improving Large Vision-Language Models' Understanding for Field Data [62.917026891829025]
本研究では、大規模ビジョン言語モデルのフィールドデータ理解を改善するためのフレームワークであるFieldLVLMを紹介する。 FieldLVLMは、フィールド対応言語生成戦略とデータ圧縮マルチモーダルモデルチューニングの2つの主要コンポーネントから構成される。新たに提案されたベンチマークデータセットの実験結果から、フィールドLVLMは、科学的なフィールドデータを含むタスクにおいて、既存の手法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2025-07-24T11:28:53Z)
Leveraging Synthetic Data for Question Answering with Multilingual LLMs in the Agricultural Domain [1.0144032120138065]
本研究は,インドの農業特化資料から多言語(ヒンディー語,パンジャービ語)の合成データセットを生成する。人為的データセットの評価は、事実性、関連性、農業コンセンサスにおいて著しく改善されている。
論文参考訳（メタデータ） (2025-07-22T19:25:10Z)
A Multimodal Benchmark Dataset and Model for Crop Disease Diagnosis [5.006697347461899]
本稿では,農学研究の分野を開拓するための先駆的資源である作物病領域マルチモーダルデータセットについて紹介する。このデータセットは、さまざまな作物の病気の画像13万7000枚と、幅広い農業知識にまたがる100万の質問と回答のペアで構成されている。我々は,最先端のマルチモーダルモデルを微調整し,作物病診断の大幅な改善を示すことにより,データセットの有用性を実証する。
論文参考訳（メタデータ） (2025-03-10T06:37:42Z)
Agri-LLaVA: Knowledge-Infused Large Multimodal Assistant on Agricultural Pests and Diseases [49.782064512495495]
農業分野における最初のマルチモーダル・インストラクション・フォロー・データセットを構築した。このデータセットは、約40万のデータエントリを持つ221種類以上の害虫と病気をカバーしている。本稿では,農業用マルチモーダル対話システムであるAgri-LLaVAを開発するための知識注入型学習手法を提案する。
論文参考訳（メタデータ） (2024-12-03T04:34:23Z)
AgriBench: A Hierarchical Agriculture Benchmark for Multimodal Large Language Models [4.12825661607328]
AgriBenchは農業用マルチモーダル言語モデル(MM-LLM)を評価するために設計された最初のベンチマークである。我々は,1,784の景観イメージ,セグメンテーションマスク,深度マップ,詳細なアノテーションを含むマルチモーダル農業データセットMM-LUCASを提案する。本研究は,農業におけるMM-LLMの進歩における画期的な視点を示し,現在進行中であり,専門知識に基づくMM-LLMの今後の発展と革新に価値ある洞察を提供する。
論文参考訳（メタデータ） (2024-11-30T12:59:03Z)
ShizishanGPT: An Agricultural Large Language Model Integrating Tools and Resources [1.1493479235601496]
シジシャンGPTはRetrieval Augmented Generationフレームワークとエージェントアーキテクチャに基づく農業のためのインテリジェントな質問応答システムである。 ShizishanGPTは5つの主要なモジュールから構成される: 一般的な質問に答えるための汎用的なGPT-4ベースのモジュール; 大きな言語モデルの知識をタイムリーに更新できない問題に補償する検索エンジンモジュール。
論文参考訳（メタデータ） (2024-09-20T14:30:45Z)
GenQA: Generating Millions of Instructions from a Handful of Prompts [67.54980063851605]
ほとんどの公開命令微調整データセットは、業界モデルをトレーニングするために使用されるクローズドソースデータセットと比較して比較的小さい。本研究では,1つのプロンプトから大規模命令データセットを生成する手法について検討する。我々のデータセットは、知識集約型リーダーボードタスクと会話評価の両方で、WizardLMとUltrachatの両方に遭遇または超過します。
論文参考訳（メタデータ） (2024-06-14T17:44:08Z)
Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文参考訳（メタデータ） (2024-03-27T08:42:47Z)
Self-Supervised Backbone Framework for Diverse Agricultural Vision Tasks [0.3683202928838613]
農業におけるコンピュータビジョンは、農業をデータ駆動で正確で持続可能な産業に変えるために、ゲームを変える。ディープラーニングは農業のビジョンに力を与えて、膨大な複雑な視覚データを分析するが、大きな注釈付きデータセットの可用性に大きく依存している。本研究では,ResNet-50のバックボーンを実世界の農地画像の大規模データセット上に事前学習するための,コントラスト学習手法であるSimCLRを用いた軽量フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-22T14:46:51Z)
Query of CC: Unearthing Large Scale Domain-Specific Knowledge from Public Corpora [104.16648246740543]
大規模言語モデルに基づく効率的なデータ収集手法を提案する。この方法は、大きな言語モデルを通してシード情報をブートストラップし、公開コーパスから関連データを検索する。特定のドメインに関する知識関連のデータを収集するだけでなく、潜在的な推論手順でデータを抽出する。
論文参考訳（メタデータ） (2024-01-26T03:38:23Z)
PhenoBench -- A Large Dataset and Benchmarks for Semantic Image Interpretation in the Agricultural Domain [29.395926321984565]
本稿では,実際の農業分野の意味論的解釈のための注釈付きデータセットとベンチマークを提案する。 UAVで記録したデータセットは、作物や雑草の高品質でピクセル単位のアノテーションを提供するだけでなく、作物の葉のインスタンスも同時に提供する。異なるフィールドで構成された隠れテストセット上で、さまざまなタスクのベンチマークを提供する。
論文参考訳（メタデータ） (2023-06-07T16:04:08Z)
AnnoLLM: Making Large Language Models to Be Better Crowdsourced Annotators [98.11286353828525]
GPT-3.5シリーズのモデルは、様々なNLPタスクにまたがる顕著な少数ショットとゼロショットの能力を示している。本稿では,2段階のアプローチを取り入れたAnnoLLMを提案する。我々はAnnoLLMを用いた対話型情報検索データセットを構築した。
論文参考訳（メタデータ） (2023-03-29T17:03:21Z)
Crop Knowledge Discovery Based on Agricultural Big Data Integration [2.597676155371155]
農業データは、IoT(Internet of Thing)、センサー、衛星、気象観測所、ロボット、農業機器、農業実験所、農家、政府機関、農業機関など、さまざまなソースを通じて生成される。本稿では,他のデータセットやビッグデータモデルを組み込むのに十分なフレキシブルなコンステレーションスキーマを用いた農業データ統合手法を提案する。
論文参考訳（メタデータ） (2020-03-11T00:13:17Z)
Data Warehouse and Decision Support on Integrated Crop Big Data [0.0]
我々は大陸レベルの農業データウェアハウス(ADW)を設計・実装した。 ADWは,(1)フレキシブルスキーマ,(2)農業用マルチデータセットからのデータ統合,(3)データサイエンスとビジネス用インテリジェントサポート,(4)ハイパフォーマンス,(5)高ストレージ,(6)セキュリティ,(7)ガバナンスと監視,(8)一貫性,可用性,パーティション耐性,(9)クラウド互換性によって特徴付けられる。
論文参考訳（メタデータ） (2020-03-10T00:10:22Z)
Agriculture-Vision: A Large Aerial Image Database for Agricultural Pattern Analysis [110.30849704592592]
本稿では,農業パターンのセマンティックセグメンテーションのための大規模空中農地画像データセットであるGarmry-Visionを提案する。各画像はRGBと近赤外線(NIR)チャンネルで構成され、解像度は1ピクセルあたり10cmである。農家にとって最も重要な9種類のフィールド異常パターンに注釈を付ける。
論文参考訳（メタデータ） (2020-01-05T20:19:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。