論文の概要: Advancing site-specific disease and pest management in precision agriculture: From reasoning-driven foundation models to adaptive, feedback-based learning
- arxiv url: http://arxiv.org/abs/2510.24650v1
- Date: Tue, 28 Oct 2025 17:16:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.300148
- Title: Advancing site-specific disease and pest management in precision agriculture: From reasoning-driven foundation models to adaptive, feedback-based learning
- Title(参考訳): 精密農業における現場特異的疾患と害虫管理の促進:推論による基礎モデルから適応的フィードバックに基づく学習へ
- Authors: Nitin Rai, Daeun, Choi, Nathan S. Boyd, Arnold W. Schumann,
- Abstract要約: 作物における部位特異的疾患管理(SSDM)は、リアルタイムコンピュータビジョンのための機械学習とディープラーニング(MLとDL)を通じて急速に進歩している。
本稿では,大規模言語モデル (LLMs) と視覚言語モデル (VLMs) に焦点を当てた,SSDM用FMアプリケーションに関する約40の論文を概説する。
適応学習(AL)、強化学習(RL)、ターゲット噴霧のためのデジタルツインフレームワークについて検討した。
- 参考スコア(独自算出の注目度): 3.1593244919496697
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Site-specific disease management (SSDM) in crops has advanced rapidly through machine and deep learning (ML and DL) for real-time computer vision. Research evolved from handcrafted feature extraction to large-scale automated feature learning. With foundation models (FMs), crop disease datasets are now processed in fundamentally new ways. Unlike traditional neural networks, FMs integrate visual and textual data, interpret symptoms in text, reason about symptom-management relationships, and support interactive QA for growers and educators. Adaptive and imitation learning in robotics further enables field-based disease management. This review screened approx. 40 articles on FM applications for SSDM, focusing on large-language models (LLMs) and vision-language models (VLMs), and discussing their role in adaptive learning (AL), reinforcement learning (RL), and digital twin frameworks for targeted spraying. Key findings: (a) FMs are gaining traction with surging literature in 2023-24; (b) VLMs outpace LLMs, with a 5-10x increase in publications; (c) RL and AL are still nascent for smart spraying; (d) digital twins with RL can simulate targeted spraying virtually; (e) addressing the sim-to-real gap is critical for real-world deployment; (f) human-robot collaboration remains limited, especially in human-in-the-loop approaches where robots detect early symptoms and humans validate uncertain cases; (g) multi-modal FMs with real-time feedback will drive next-gen SSDM. For updates, resources, and contributions, visit, https://github.com/nitin-dominic/AgriPathogenDatabase, to submit papers, code, or datasets.
- Abstract(参考訳): 作物における部位特異的疾患管理(SSDM)は、リアルタイムコンピュータビジョンのための機械学習とディープラーニング(MLとDL)を通じて急速に進歩している。
研究は手作りの特徴抽出から大規模自動特徴学習へと進化した。
基礎モデル(FM)により、作物病データセットは基本的に新しい方法で処理される。
従来のニューラルネットワークとは異なり、FMは視覚データとテキストデータを統合し、テキストで症状を解釈し、症状管理の関係を推論し、農家や教育者のための対話型QAをサポートする。
ロボット工学における適応的および模倣的学習は、さらにフィールドベースの疾患管理を可能にする。
このレビューは近似をスクリーニングした。
大規模言語モデル(LLM)とビジョン言語モデル(VLM)に焦点を当て、適応学習(AL)、強化学習(RL)、ターゲット噴霧のためのデジタルツインフレームワークについて論じる。
主な発見
(a)FMは、2023~24年に増加傾向にある文献で勢いを増している。
b) VLM は LLM を上回り,出版物が 5-10 倍増加する。
(c)RLとALは、まだスマートスプレーのためである。
d)RLを用いたデジタル双生児は、ターゲット噴霧を仮想的にシミュレートすることができる。
(e)sim-to-realのギャップに対処することは、現実世界のデプロイメントに不可欠です。
f) ロボットが早期の症状を検知し、不確実な事例を検証し、特に人間とロボットの連携が限定されていること。
(g) リアルタイムフィードバックを持つマルチモーダルFMは次世代SSDMを駆動する。
更新、リソース、コントリビューションについては、https://github.com/nitin-dominic/AgriPathogenDatabaseを訪れ、論文、コード、データセットを提出する。
関連論文リスト
- LSM-2: Learning from Incomplete Wearable Sensor Data [65.58595667477505]
本稿では,Adaptive and Inherited Masking (AIM)を用いた第2世代Large Sensor Model (LSM-2)を紹介する。
AIMは明示的な計算を必要とせず、不完全なデータから直接堅牢な表現を学習する。
AIMを用いた LSM-2 は, 分類, 回帰, 生成モデルなど, 多様なタスクにまたがる最高の性能を実現する。
論文 参考訳(メタデータ) (2025-06-05T17:57:11Z) - PIM: Physics-Informed Multi-task Pre-training for Improving Inertial Sensor-Based Human Activity Recognition [4.503003860563811]
IMUに基づくヒューマンアクティビティ認識(HAR)のための物理インフォームドマルチタスク事前学習(PIM)フレームワークを提案する。
PIMは、人間の動作の基本的物理的側面の理解に基づいて、プレテキストタスクを生成する。
マクロf1スコアの約10%の利得と,クラスごとのラベル付き例は2~8例に過ぎなかった。
論文 参考訳(メタデータ) (2025-03-23T08:16:01Z) - Scaling Large Vision-Language Models for Enhanced Multimodal Comprehension In Biomedical Image Analysis [0.1984949535188529]
ビジョン言語モデル(VLM)は、画像処理のための事前訓練されたビジョンバックボーンと、クロスモーダルプロジェクタを組み込むことによって、この問題に対処する。
低線量放射線治療におけるマルチモーダル理解を高めるため,LLaVAモデルから微調整されたインテリジェントアシスタントを開発した。
論文 参考訳(メタデータ) (2025-01-26T02:48:01Z) - The Duality of Generative AI and Reinforcement Learning in Robotics: A Review [0.818052289014297]
生成型AIと強化学習(RL)は、情報フローを入力として取り、インテリジェントな振る舞いを生成するAIエージェントに何ができるかを再定義してきた。
本稿では,ロボット工学の発展のために,生成型AIモデルとRLの統合について検討する。
論文 参考訳(メタデータ) (2024-10-21T18:27:48Z) - What is the Visual Cognition Gap between Humans and Multimodal LLMs? [63.81347276258992]
MLLM(Multimodal Large Language Models)の視覚認知能力を評価し,その性能を人間の視覚認知研究と比較した。
我々の比較実験では、MLLMと人間の知能のギャップが明らかになっている。
我々は,MaRs-VQAとQwen2-VCogベースラインモデルの公開が,人間の視覚認知能力を持つ次世代MLLMに向けて進展をもたらすと考えている。
論文 参考訳(メタデータ) (2024-06-14T22:02:21Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - Forging Vision Foundation Models for Autonomous Driving: Challenges,
Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。
総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。
本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文 参考訳(メタデータ) (2024-01-16T01:57:24Z) - User profile-driven large-scale multi-agent learning from demonstration
in federated human-robot collaborative environments [5.218882272051637]
本稿では,提示された人間の行動のきめ細かい表現を提供する,新しいユーザプロファイルの定式化について紹介する。
全体的な設計は、人間の行動の短期的および長期的分析/解釈を可能にする。
論文 参考訳(メタデータ) (2021-03-30T15:33:21Z) - Reprogramming Language Models for Molecular Representation Learning [65.00999660425731]
本稿では,分子学習タスクのための事前学習言語モデルに対して,辞書学習(R2DL)による表現再プログラミングを提案する。
対比プログラムは、k-SVDソルバを用いて、高密度ソースモデル入力空間(言語データ)とスパースターゲットモデル入力空間(例えば、化学および生物学的分子データ)との間の線形変換を学習する。
R2DLは、ドメイン固有のデータに基づいて訓練されたアート毒性予測モデルの状態によって確立されたベースラインを達成し、限られたトレーニングデータ設定でベースラインを上回る。
論文 参考訳(メタデータ) (2020-12-07T05:50:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。