論文の概要: Improving Access to Trade and Investment Information in Thailand through Intelligent Document Retrieval
- arxiv url: http://arxiv.org/abs/2503.06489v1
- Date: Sun, 09 Mar 2025 07:21:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:44:59.560770
- Title: Improving Access to Trade and Investment Information in Thailand through Intelligent Document Retrieval
- Title(参考訳): 知的文書検索によるタイの貿易・投資情報へのアクセス改善
- Authors: Sirinda Palahan,
- Abstract要約: 本稿では,自然言語処理と情報検索技術を統合するシステムを提案する。
提案システムは,最も関連性の高いコンテンツを特定し,より効率的に海外貿易や投資の複雑な景観をナビゲートすることができる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Overseas investment and trade can be daunting for beginners due to the vast amount of complex information. This paper presents a chatbot system that integrates natural language processing and information retrieval techniques to simplify the document retrieval process. The proposed system identifies the most relevant content, enabling users to navigate the intricate landscape of foreign trade and investment more efficiently. Our methodology combines the BM25 model and a deep learning model to rank and retrieve documents, aiming to reduce noise in the document content and enhance the accuracy of the results. Experiments with Thai natural language queries have demonstrated the effectiveness of our system in retrieving pertinent documents. A user satisfaction survey further validated the system's effectiveness. Most respondents found the system helpful and agreed with the suggested documents, indicating its potential as a valuable tool for Thai entrepreneurs navigating foreign trade and investment.
- Abstract(参考訳): 海外の投資と貿易は、大量の複雑な情報のために初心者にとって大変だ。
本稿では,自然言語処理と情報検索技術を統合し,文書検索プロセスを簡素化するチャットボットシステムを提案する。
提案システムは,最も関連性の高いコンテンツを特定し,より効率的に海外貿易や投資の複雑な景観をナビゲートすることができる。
本手法は,BM25モデルとディープラーニングモデルを組み合わせて文書のランク付けと検索を行い,文書内容のノイズを低減し,その結果の精度を高めることを目的としている。
タイの自然言語クエリを用いた実験により,関連する文書を検索する際のシステムの有効性が実証された。
ユーザ満足度調査は、システムの有効性をさらに検証した。
ほとんどの回答者は、このシステムを参考にし、提案された文書に同意し、外国貿易と投資をナビゲートするタイの起業家にとって貴重なツールとしての可能性を示している。
関連論文リスト
- Conversational Text Extraction with Large Language Models Using Retrieval-Augmented Systems [0.20971479389679337]
本研究では,Large Language Models (LLMs) を利用した対話インタフェースを用いてPDF文書からテキストを抽出するシステムを提案する。
このシステムは、PDF内の関連するパスをハイライトしながら、ユーザからの問い合わせに対して情報的応答を提供する。
提案システムは,既存のテキスト抽出・要約技術と比較して,競争力のあるROUGE値を提供する。
論文 参考訳(メタデータ) (2025-01-16T19:12:25Z) - Retrieval-Augmented Machine Translation with Unstructured Knowledge [74.84236945680503]
Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を強化するために追加情報を導入する
機械翻訳(MT)では、従来の研究は通常、ペア化されたMTコーパスや知識グラフからコンテキスト内例を検索する。
本稿では,非構造化文書を用いた検索強化MTについて検討する。
論文 参考訳(メタデータ) (2024-12-05T17:00:32Z) - ProCIS: A Benchmark for Proactive Retrieval in Conversations [21.23826888841565]
本稿では,280万件以上の会話からなるプロアクティブな文書検索のための大規模データセットを提案する。
クラウドソーシング実験を行い、高品質で比較的完全な妥当性判定を行う。
また、各文書に関連する会話部分に関するアノテーションを収集し、前向きな検索システムの評価を可能にする。
論文 参考訳(メタデータ) (2024-05-10T13:11:07Z) - Give Me More Details: Improving Fact-Checking with Latent Retrieval [58.706972228039604]
証拠は、自動化された事実チェックにおいて重要な役割を果たす。
既存のファクトチェックシステムは、エビデンス文が与えられたと仮定するか、検索エンジンが返した検索スニペットを使用する。
資料から得られた全文を証拠として組み込んで,2つの豊富なデータセットを導入することを提案する。
論文 参考訳(メタデータ) (2023-05-25T15:01:19Z) - Coarse-to-Fine Knowledge Selection for Document Grounded Dialogs [11.63334863772068]
マルチドキュメント基盤対話システム(DGDS)は,文書の集合から支援された知識を見出すことで,ユーザの要求に答える。
本稿では,粒度の粗い知識検索と粒度の細かい知識抽出の両方を統一されたフレームワークで最適化することを目的としたRe3Gを提案する。
論文 参考訳(メタデータ) (2023-02-23T08:28:29Z) - Layout-Aware Information Extraction for Document-Grounded Dialogue:
Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。
LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。
実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文 参考訳(メタデータ) (2022-07-14T07:59:45Z) - Retrieval-Free Knowledge-Grounded Dialogue Response Generation with
Adapters [52.725200145600624]
軽量アダプタで事前学習した言語モデルに事前知識を注入し、検索プロセスをバイパスする KnowExpert を提案する。
実験結果から,KnowExpertは検索ベースラインと相容れない性能を示した。
論文 参考訳(メタデータ) (2021-05-13T12:33:23Z) - A PSO Strategy of Finding Relevant Web Documents using a New Similarity
Measure [0.0]
バイオインスパイアされたPSO法は、システムの応答時間を短縮する目的で用いられる。
本稿では,提案手法と既存手法との比較検討を行い,精度,感度,F測定,特異性について述べる。
論文 参考訳(メタデータ) (2021-03-26T10:19:38Z) - BERTese: Learning to Speak to BERT [50.76152500085082]
本論文では,より良い知識抽出に向けて直接最適化されたパラフレーズクエリ"BERTese"に自動書き換える手法を提案する。
私たちのアプローチが競合するベースラインを上回ることを実証的に示し、複雑なパイプラインの必要性を回避します。
論文 参考訳(メタデータ) (2021-03-09T10:17:22Z) - A Survey of Deep Learning Approaches for OCR and Document Understanding [68.65995739708525]
我々は、英語で書かれた文書の文書理解のための様々な手法をレビューする。
文献に現れる方法論を集約し,この領域を探索する研究者の跳躍点として機能させる。
論文 参考訳(メタデータ) (2020-11-27T03:05:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。