論文の概要: AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning
- arxiv url: http://arxiv.org/abs/2410.08405v1
- Date: Thu, 10 Oct 2024 22:38:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 03:36:35.264037
- Title: AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning
- Title(参考訳): AgroGPT:エキスパートチューニングによる効率的な農業ビジョンランゲージモデル
- Authors: Muhammad Awais, Ali Husain Salem Abdulla Alharthi, Amandeep Kumar, Hisham Cholakkal, Rao Muhammad Anwer,
- Abstract要約: 本稿では,農業領域における視覚のみのデータを活用した指導調整データの構築手法を提案する。
我々は、複数のドメインにまたがる多様な農業データセットを利用し、クラス固有の情報をキュレートし、大規模言語モデル(LLM)を用いてエキスパートチューニングセットを構築する。
AgroGPTは、複雑な農業関連の会話を処理し、有用な洞察を提供する効率的なLMMである。
- 参考スコア(独自算出の注目度): 30.034193330398292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Significant progress has been made in advancing large multimodal conversational models (LMMs), capitalizing on vast repositories of image-text data available online. Despite this progress, these models often encounter substantial domain gaps, hindering their ability to engage in complex conversations across new domains. Recent efforts have aimed to mitigate this issue, albeit relying on domain-specific image-text data to curate instruction-tuning data. However, many domains, such as agriculture, lack such vision-language data. In this work, we propose an approach to construct instruction-tuning data that harnesses vision-only data for the agriculture domain. We utilize diverse agricultural datasets spanning multiple domains, curate class-specific information, and employ large language models (LLMs) to construct an expert-tuning set, resulting in a 70k expert-tuning dataset called AgroInstruct. Subsequently, we expert-tuned and created AgroGPT, an efficient LMM that can hold complex agriculture-related conversations and provide useful insights. We also develop AgroEvals for evaluation and compare {AgroGPT's} performance with large open and closed-source models. {AgroGPT} excels at identifying fine-grained agricultural concepts, can act as an agriculture expert, and provides helpful information for multimodal agriculture questions. The code, datasets, and models are available at https://github.com/awaisrauf/agroGPT.
- Abstract(参考訳): 大規模なマルチモーダル対話モデル (LMM) の進展は、画像テキストデータの膨大なリポジトリをオンラインで利用できるようにしている。
このような進歩にもかかわらず、これらのモデルは多くの場合、大きなドメインギャップに遭遇し、新しいドメイン間で複雑な会話を行う能力を妨げている。
近年の取り組みは、命令チューニングデータをキュレートするために、ドメイン固有の画像テキストデータに依存しているにもかかわらず、この問題を軽減することを目的としている。
しかし、農業などの多くのドメインには、このような視覚言語データがない。
本研究では,農業領域における視覚のみのデータを活用した指導調整データの構築手法を提案する。
我々は、複数のドメインにまたがる多様な農業データセットを利用し、クラス固有の情報をキュレートし、大規模言語モデル(LLM)を使用してエキスパートチューニングセットを構築し、その結果、AgroInstructと呼ばれる70kのエキスパートチューニングデータセットを生成する。
AgroGPTは、複雑な農業関連の会話を処理し、有用な洞察を提供する効率的なLMMである。
また、評価のためのAgroEvalsを開発し、大規模なオープンソースモデルとクローズドソースモデルを比較した。
AgroGPTは、細粒度の農業概念を識別し、農業の専門家として機能し、マルチモーダル農業問題に有用な情報を提供する。
コード、データセット、モデルはhttps://github.com/awaisrauf/agroGPTで公開されている。
関連論文リスト
- ShizishanGPT: An Agricultural Large Language Model Integrating Tools and Resources [1.1493479235601496]
シジシャンGPTはRetrieval Augmented Generationフレームワークとエージェントアーキテクチャに基づく農業のためのインテリジェントな質問応答システムである。
ShizishanGPTは5つの主要なモジュールから構成される: 一般的な質問に答えるための汎用的なGPT-4ベースのモジュール; 大きな言語モデルの知識をタイムリーに更新できない問題に補償する検索エンジンモジュール。
論文 参考訳(メタデータ) (2024-09-20T14:30:45Z) - GenQA: Generating Millions of Instructions from a Handful of Prompts [67.54980063851605]
ほとんどの公開命令微調整データセットは、業界モデルをトレーニングするために使用されるクローズドソースデータセットと比較して比較的小さい。
本研究では,1つのプロンプトから大規模命令データセットを生成する手法について検討する。
我々のデータセットは、知識集約型リーダーボードタスクと会話評価の両方で、WizardLMとUltrachatの両方に遭遇または超過します。
論文 参考訳(メタデータ) (2024-06-14T17:44:08Z) - Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文 参考訳(メタデータ) (2024-03-27T08:42:47Z) - Self-Supervised Backbone Framework for Diverse Agricultural Vision Tasks [0.3683202928838613]
農業におけるコンピュータビジョンは、農業をデータ駆動で正確で持続可能な産業に変えるために、ゲームを変える。
ディープラーニングは農業のビジョンに力を与えて、膨大な複雑な視覚データを分析するが、大きな注釈付きデータセットの可用性に大きく依存している。
本研究では,ResNet-50のバックボーンを実世界の農地画像の大規模データセット上に事前学習するための,コントラスト学習手法であるSimCLRを用いた軽量フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-22T14:46:51Z) - Query of CC: Unearthing Large Scale Domain-Specific Knowledge from
Public Corpora [104.16648246740543]
大規模言語モデルに基づく効率的なデータ収集手法を提案する。
この方法は、大きな言語モデルを通してシード情報をブートストラップし、公開コーパスから関連データを検索する。
特定のドメインに関する知識関連のデータを収集するだけでなく、潜在的な推論手順でデータを抽出する。
論文 参考訳(メタデータ) (2024-01-26T03:38:23Z) - PhenoBench -- A Large Dataset and Benchmarks for Semantic Image Interpretation in the Agricultural Domain [29.395926321984565]
本稿では,実際の農業分野の意味論的解釈のための注釈付きデータセットとベンチマークを提案する。
UAVで記録したデータセットは、作物や雑草の高品質でピクセル単位のアノテーションを提供するだけでなく、作物の葉のインスタンスも同時に提供する。
異なるフィールドで構成された隠れテストセット上で、さまざまなタスクのベンチマークを提供する。
論文 参考訳(メタデータ) (2023-06-07T16:04:08Z) - AnnoLLM: Making Large Language Models to Be Better Crowdsourced Annotators [98.11286353828525]
GPT-3.5シリーズのモデルは、様々なNLPタスクにまたがる顕著な少数ショットとゼロショットの能力を示している。
本稿では,2段階のアプローチを取り入れたAnnoLLMを提案する。
我々はAnnoLLMを用いた対話型情報検索データセットを構築した。
論文 参考訳(メタデータ) (2023-03-29T17:03:21Z) - Crop Knowledge Discovery Based on Agricultural Big Data Integration [2.597676155371155]
農業データは、IoT(Internet of Thing)、センサー、衛星、気象観測所、ロボット、農業機器、農業実験所、農家、政府機関、農業機関など、さまざまなソースを通じて生成される。
本稿では,他のデータセットやビッグデータモデルを組み込むのに十分なフレキシブルなコンステレーションスキーマを用いた農業データ統合手法を提案する。
論文 参考訳(メタデータ) (2020-03-11T00:13:17Z) - Data Warehouse and Decision Support on Integrated Crop Big Data [0.0]
我々は大陸レベルの農業データウェアハウス(ADW)を設計・実装した。
ADWは,(1)フレキシブルスキーマ,(2)農業用マルチデータセットからのデータ統合,(3)データサイエンスとビジネス用インテリジェントサポート,(4)ハイパフォーマンス,(5)高ストレージ,(6)セキュリティ,(7)ガバナンスと監視,(8)一貫性,可用性,パーティション耐性,(9)クラウド互換性によって特徴付けられる。
論文 参考訳(メタデータ) (2020-03-10T00:10:22Z) - Agriculture-Vision: A Large Aerial Image Database for Agricultural
Pattern Analysis [110.30849704592592]
本稿では,農業パターンのセマンティックセグメンテーションのための大規模空中農地画像データセットであるGarmry-Visionを提案する。
各画像はRGBと近赤外線(NIR)チャンネルで構成され、解像度は1ピクセルあたり10cmである。
農家にとって最も重要な9種類のフィールド異常パターンに注釈を付ける。
論文 参考訳(メタデータ) (2020-01-05T20:19:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。