論文の概要: AgriCHN: A Comprehensive Cross-domain Resource for Chinese Agricultural Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2506.17578v1
- Date: Sat, 21 Jun 2025 04:21:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.483152
- Title: AgriCHN: A Comprehensive Cross-domain Resource for Chinese Agricultural Named Entity Recognition
- Title(参考訳): AgriCHN:中国の農業用エンティティ認識のための総合的クロスドメインリソース
- Authors: Lingxiao Zeng, Yiqi Tong, Wei Guo, Huarui Wu, Lihao Ge, Yijun Ye, Fuzhen Zhuang, Deqing Wang, Wei Guo, Cheng Chen,
- Abstract要約: 本稿では,AgriCHNについて紹介する。AgriCHNは,自動化農業エンティティアノテーションの精度を高めるために設計された,包括的なオープンソース中国語リソースである。
データセットは、合計4,040件の文と15,799件の農業団体の言及をカプセル化した、豊富な農業記事から慎重に収集されている。
ベンチマークタスクは、いくつかの最先端のニューラルNERモデルを使用して構築されている。
- 参考スコア(独自算出の注目度): 30.51577375197722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agricultural named entity recognition is a specialized task focusing on identifying distinct agricultural entities within vast bodies of text, including crops, diseases, pests, and fertilizers. It plays a crucial role in enhancing information extraction from extensive agricultural text resources. However, the scarcity of high-quality agricultural datasets, particularly in Chinese, has resulted in suboptimal performance when employing mainstream methods for this purpose. Most earlier works only focus on annotating agricultural entities while overlook the profound correlation of agriculture with hydrology and meteorology. To fill this blank, we present AgriCHN, a comprehensive open-source Chinese resource designed to promote the accuracy of automated agricultural entity annotation. The AgriCHN dataset has been meticulously curated from a wealth of agricultural articles, comprising a total of 4,040 sentences and encapsulating 15,799 agricultural entity mentions spanning 27 diverse entity categories. Furthermore, it encompasses entities from hydrology to meteorology, thereby enriching the diversity of entities considered. Data validation reveals that, compared with relevant resources, AgriCHN demonstrates outstanding data quality, attributable to its richer agricultural entity types and more fine-grained entity divisions. A benchmark task has also been constructed using several state-of-the-art neural NER models. Extensive experimental results highlight the significant challenge posed by AgriCHN and its potential for further research.
- Abstract(参考訳): 農業名の実体認識は、農作物、病気、害虫、肥料を含む広大なテキストの体系の中で、異なる農業の実体を識別することに焦点を当てた専門的なタスクである。
広範な農業用テキスト資源からの情報抽出を促進する上で重要な役割を担っている。
しかし、高品質な農業データセットの不足、特に中国語は、この目的のために主流の手法を用いた場合、最適以下のパフォーマンスをもたらす。
ほとんどの初期の研究は、農業と水文学と気象学の深い相関を見落としながら、農業の実体に注釈を付けることにのみ焦点をあてていた。
この空白を埋めるために、自動化農業エンティティアノテーションの正確性を促進するために設計された、包括的なオープンソース中国語リソースであるAgriCHNを紹介する。
AgriCHNデータセットは、合計4,040の文と15,799の農業団体が27の多様な企業カテゴリにまたがる言及をカプセル化した、豊富な農業記事から慎重に収集されている。
さらに、水文学から気象学までの要素を包含し、考慮された物質の多様性を豊かにする。
データ検証は、関連するリソースと比較して、AgriCHNは、よりリッチな農業エンティティタイプとよりきめ細かいエンティティ分割に起因する、優れたデータ品質を示す。
ベンチマークタスクは、いくつかの最先端のニューラルNERモデルを使用して構築されている。
大規模な実験の結果は、AgriCHNがもたらす重要な課題と、さらなる研究の可能性を浮き彫りにしている。
関連論文リスト
- KG-FGNN: Knowledge-guided GNN Foundation Model for Fertilisation-oriented Soil GHG Flux Prediction [8.025242423352509]
精密土壌温室効果ガス(GHG)フラックス予測は, 環境影響の評価, 排出削減戦略の展開, 持続可能な農業の促進に不可欠である。
多くの農場で先進的なセンサーとネットワーク技術が不足しているため、包括的で多様な農業データを取得することは困難である。
本研究では、農業プロセスベースモデルとグラフニューラルネットワーク技術に埋め込まれた知識を統合することにより、上記の課題に対処する知識誘導グラフニューラルネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-18T21:40:24Z) - AgroLLM: Connecting Farmers and Agricultural Practices through Large Language Models for Enhanced Knowledge Transfer and Practical Application [1.9643850583333375]
AgroLLMは、Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)フレームワークを使用して、農業における知識共有と教育を強化するように設計されている。
4つの主要農業領域における性能評価のための3つの先進モデルの比較研究を行った。
RAGを用いたChatGPT-4o Miniの精度は93%であった。
論文 参考訳(メタデータ) (2025-02-28T04:13:18Z) - Agri-LLaVA: Knowledge-Infused Large Multimodal Assistant on Agricultural Pests and Diseases [49.782064512495495]
農業分野における最初のマルチモーダル・インストラクション・フォロー・データセットを構築した。
このデータセットは、約40万のデータエントリを持つ221種類以上の害虫と病気をカバーしている。
本稿では,農業用マルチモーダル対話システムであるAgri-LLaVAを開発するための知識注入型学習手法を提案する。
論文 参考訳(メタデータ) (2024-12-03T04:34:23Z) - Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文 参考訳(メタデータ) (2024-03-27T08:42:47Z) - HarvestNet: A Dataset for Detecting Smallholder Farming Activity Using
Harvest Piles and Remote Sensing [50.4506590177605]
HarvestNetは、2020-2023年のエチオピアのティグレイとアムハラの農場の存在をマッピングするためのデータセットである。
本研究は,多くの小作システムの特徴ある収穫杭の検出に基づく新しい手法を提案する。
本研究は, 農作物のリモートセンシングが, 食品の安全地帯において, よりタイムリーかつ正確な農地評価に寄与することが示唆された。
論文 参考訳(メタデータ) (2023-08-23T11:03:28Z) - Empowering Agrifood System with Artificial Intelligence: A Survey of the Progress, Challenges and Opportunities [86.89427012495457]
我々は、AI技術がアグリフードシステムをどう変え、現代のアグリフード産業に貢献するかをレビューする。
本稿では,農業,畜産,漁業において,アグリフードシステムにおけるAI手法の進歩について概説する。
我々は、AIで現代のアグリフードシステムを変革するための潜在的な課題と有望な研究機会を強調します。
論文 参考訳(メタデータ) (2023-05-03T05:16:54Z) - Crop Knowledge Discovery Based on Agricultural Big Data Integration [2.597676155371155]
農業データは、IoT(Internet of Thing)、センサー、衛星、気象観測所、ロボット、農業機器、農業実験所、農家、政府機関、農業機関など、さまざまなソースを通じて生成される。
本稿では,他のデータセットやビッグデータモデルを組み込むのに十分なフレキシブルなコンステレーションスキーマを用いた農業データ統合手法を提案する。
論文 参考訳(メタデータ) (2020-03-11T00:13:17Z) - Data Warehouse and Decision Support on Integrated Crop Big Data [0.0]
我々は大陸レベルの農業データウェアハウス(ADW)を設計・実装した。
ADWは,(1)フレキシブルスキーマ,(2)農業用マルチデータセットからのデータ統合,(3)データサイエンスとビジネス用インテリジェントサポート,(4)ハイパフォーマンス,(5)高ストレージ,(6)セキュリティ,(7)ガバナンスと監視,(8)一貫性,可用性,パーティション耐性,(9)クラウド互換性によって特徴付けられる。
論文 参考訳(メタデータ) (2020-03-10T00:10:22Z) - Agriculture-Vision: A Large Aerial Image Database for Agricultural
Pattern Analysis [110.30849704592592]
本稿では,農業パターンのセマンティックセグメンテーションのための大規模空中農地画像データセットであるGarmry-Visionを提案する。
各画像はRGBと近赤外線(NIR)チャンネルで構成され、解像度は1ピクセルあたり10cmである。
農家にとって最も重要な9種類のフィールド異常パターンに注釈を付ける。
論文 参考訳(メタデータ) (2020-01-05T20:19:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。