論文の概要: KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers
- arxiv url: http://arxiv.org/abs/2510.18355v1
- Date: Tue, 21 Oct 2025 07:24:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.123416
- Title: KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers
- Title(参考訳): KrishokBondhu: ベンガルの農家のための検索型音声ベースの農業アドバイザリーコールセンター
- Authors: Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman Rafat,
- Abstract要約: バングラデシュでは、多くの農家が、タイムリーで専門家レベルの農業指導にアクセスするための課題に直面し続けている。
本稿では,Retrieval-Augmented Generationフレームワーク上に構築された音声対応のコールセンタ統合アドバイザリプラットフォームであるKrishokBondhuについて述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Bangladesh, many farmers continue to face challenges in accessing timely, expert-level agricultural guidance. This paper presents KrishokBondhu, a voice-enabled, call-centre-integrated advisory platform built on a Retrieval-Augmented Generation (RAG) framework, designed specifically for Bengali-speaking farmers. The system aggregates authoritative agricultural handbooks, extension manuals, and NGO publications; applies Optical Character Recognition (OCR) and document-parsing pipelines to digitize and structure the content; and indexes this corpus in a vector database for efficient semantic retrieval. Through a simple phone-based interface, farmers can call the system to receive real-time, context-aware advice: speech-to-text converts the Bengali query, the RAG module retrieves relevant content, a large language model (Gemma 3-4B) generates a context-grounded response, and text-to-speech delivers the answer in natural spoken Bengali. In a pilot evaluation, KrishokBondhu produced high-quality responses for 72.7% of diverse agricultural queries covering crop management, disease control, and cultivation practices. Compared to the KisanQRS benchmark, the system achieved a composite score of 4.53 (vs. 3.13) on a 5-point scale, a 44.7% improvement, with especially large gains in contextual richness (+367%) and completeness (+100.4%), while maintaining comparable relevance and technical specificity. Semantic similarity analysis further revealed a strong correlation between retrieved context and answer quality, emphasizing the importance of grounding generative responses in curated documentation. KrishokBondhu demonstrates the feasibility of integrating call-centre accessibility, multilingual voice interaction, and modern RAG techniques to deliver expert-level agricultural guidance to remote Bangladeshi farmers, paving the way toward a fully AI-driven agricultural advisory ecosystem.
- Abstract(参考訳): バングラデシュでは、多くの農家が、タイムリーで専門家レベルの農業指導にアクセスするための課題に直面し続けている。
本稿では,ベンガル語話者に特化して設計されたRAG(Retrieval-Augmented Generation)フレームワーク上に構築された音声対応のコールセンタ統合アドバイザリープラットフォームであるKrishokBondhuについて述べる。
このシステムは、権威ある農業用ハンドブック、拡張マニュアル、NGO出版物を集約し、OCRと文書解析パイプラインを適用してコンテンツをデジタル化し、構造化し、このコーパスをベクトルデータベースにインデックスし、効率的な意味解析を行う。
音声からテキストへの変換はベンガルのクエリを変換し、RAGモジュールは関連するコンテンツを検索し、大きな言語モデル(Gemma 3-4B)はコンテキストグラウンドの応答を生成し、テキストから音声への応答はベンガルの自然言語で応答する。
試験的な評価では、クリショクボンドフは作物管理、疾病管理、栽培の慣行をカバーする多様な農業用クエリの72.7%の高品質な応答を生んだ。
KisanQRSベンチマークと比較すると、このシステムは5点スケールで4.53(vs.3.13)の総合スコアを達成し、44.7%の改善、特に文脈的豊かさ(+367%)と完全さ(+100.4%)が大きく向上した。
意味的類似性分析により、検索された文脈と回答の品質の間に強い相関関係が明らかとなり、キュレートドキュメンテーションにおける生成応答の基盤となることの重要性を強調した。
KrishokBondhu氏は、遠隔バングラデシュの農家に専門家レベルの農業指導を提供するために、コールセントレアクセシビリティ、多言語音声インタラクション、モダンなRAG技術を統合する可能性を示し、AIによる完全な農業アドバイザリーエコシステムへの道を歩む。
関連論文リスト
- A Multimodal Conversational Assistant for the Characterization of Agricultural Plots from Geospatial Open Data [0.0]
本研究では,多モーダル検索と大規模言語モデル(LLM)を統合したオープンソースの対話型アシスタントを提案する。
提案したアーキテクチャは, 検索拡張生成(RAG)によるオクトロフォト, セチネル-2植生指標, およびユーザ提供文書を組み合わせたものである。
予備的な結果は、農業用クエリに対して明確で、関連性があり、コンテキスト対応の応答を生成することができることを示している。
論文 参考訳(メタデータ) (2025-09-22T09:02:53Z) - AgriDoctor: A Multimodal Intelligent Assistant for Agriculture [45.77373971125537]
AgriDoctorは、インテリジェントな作物病診断と農業知識の相互作用のために設計されたモジュラーでマルチモーダルなフレームワークである。
効果的なトレーニングと評価を容易にするために,400000の注釈付き疾患画像,831のエキスパートによる知識エントリ,30000のバイリンガルプロンプトによるインテント駆動ツール選択のベンチマークであるAgriMMを構築した。
実験により、AgriMMで訓練されたAgriDoctorは、細粒度の農業作業において最先端のLVLMを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2025-09-21T11:51:57Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Intent Aware Context Retrieval for Multi-Turn Agricultural Question Answering [17.122839125789557]
インディアンの農夫は、特に識字率の低い田園部では、タイムリーで、アクセシビリティがあり、言語に優しい農業アドバイスを欠いている。
本稿では,AIを活用した新しい農業チャットボットKrishi Sathiについて述べる。
Krishi Sathi氏は、構造化されたマルチターンの会話フローに従って、ファーマーから必要な詳細を徐々に収集し、応答を生成する前にクエリが完全に理解されるようにする。
論文 参考訳(メタデータ) (2025-07-28T09:00:44Z) - AgriCHN: A Comprehensive Cross-domain Resource for Chinese Agricultural Named Entity Recognition [30.51577375197722]
本稿では,AgriCHNについて紹介する。AgriCHNは,自動化農業エンティティアノテーションの精度を高めるために設計された,包括的なオープンソース中国語リソースである。
データセットは、合計4,040件の文と15,799件の農業団体の言及をカプセル化した、豊富な農業記事から慎重に収集されている。
ベンチマークタスクは、いくつかの最先端のニューラルNERモデルを使用して構築されている。
論文 参考訳(メタデータ) (2025-06-21T04:21:11Z) - AgroLLM: Connecting Farmers and Agricultural Practices through Large Language Models for Enhanced Knowledge Transfer and Practical Application [1.9643850583333375]
AgroLLMは、Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)フレームワークを使用して、農業における知識共有と教育を強化するように設計されている。
4つの主要農業領域における性能評価のための3つの先進モデルの比較研究を行った。
RAGを用いたChatGPT-4o Miniの精度は93%であった。
論文 参考訳(メタデータ) (2025-02-28T04:13:18Z) - Evaluating Automatic Speech Recognition Systems for Korean Meteorological Experts [48.89527378273811]
本稿では,韓国の気象学者を対象とした自然言語クエリシステムへの自動音声認識の統合について検討する。
韓国の気象分野におけるASRシステム開発における課題に対処する。
論文 参考訳(メタデータ) (2024-10-24T05:40:07Z) - Scalable Frame-based Construction of Sociocultural NormBases for Socially-Aware Dialogues [66.69453609603875]
社会文化的規範は、社会的相互作用における個人的行為の指針となる。
大規模言語モデル(LLM)を用いた社会文化的ノルム(SCN)ベース構築のためのスケーラブルなアプローチを提案する。
我々は、包括的で広くアクセス可能な中国社会文化ノルムベースを構築した。
論文 参考訳(メタデータ) (2024-10-04T00:08:46Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - RHO ($\rho$): Reducing Hallucination in Open-domain Dialogues with
Knowledge Grounding [57.46495388734495]
本稿では、知識グラフ(KG)からリンクされたエンティティと関係述語を表現したRHO(rho$)を提案する。
本稿では,(1)テキスト埋め込みと対応するKG埋め込みを組み合わせるための局所知識基盤,(2)注目機構を介してRHOにマルチホップ推論能力を持たせるためのグローバル知識基盤を提案する。
論文 参考訳(メタデータ) (2022-12-03T10:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。