Fugu-MT 論文翻訳(概要): Natural language processing for word sense disambiguation and information extraction

論文の概要: Natural language processing for word sense disambiguation and information extraction

arxiv url: http://arxiv.org/abs/2004.02256v1
Date: Sun, 5 Apr 2020 17:13:43 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-16 12:08:22.416859
Title: Natural language processing for word sense disambiguation and information extraction
Title（参考訳）: 単語感覚の曖昧さと情報抽出のための自然言語処理
Authors: K. R. Chowdhary
Abstract要約: Thesaurus を用いた Word Sense Disambiguation の新しいアプローチを提案する。ファジィ論理に基づく文書検索手法について解説し,その応用例を示した。この戦略は、明らかな推論のデンプスター・シェーファー理論に基づく新しい戦略の提示で締めくくられる。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This research work deals with Natural Language Processing (NLP) and extraction of essential information in an explicit form. The most common among the information management strategies is Document Retrieval (DR) and Information Filtering. DR systems may work as combine harvesters, which bring back useful material from the vast fields of raw material. With large amount of potentially useful information in hand, an Information Extraction (IE) system can then transform the raw material by refining and reducing it to a germ of original text. A Document Retrieval system collects the relevant documents carrying the required information, from the repository of texts. An IE system then transforms them into information that is more readily digested and analyzed. It isolates relevant text fragments, extracts relevant information from the fragments, and then arranges together the targeted information in a coherent framework. The thesis presents a new approach for Word Sense Disambiguation using thesaurus. The illustrative examples supports the effectiveness of this approach for speedy and effective disambiguation. A Document Retrieval method, based on Fuzzy Logic has been described and its application is illustrated. A question-answering system describes the operation of information extraction from the retrieved text documents. The process of information extraction for answering a query is considerably simplified by using a Structured Description Language (SDL) which is based on cardinals of queries in the form of who, what, when, where and why. The thesis concludes with the presentation of a novel strategy based on Dempster-Shafer theory of evidential reasoning, for document retrieval and information extraction. This strategy permits relaxation of many limitations, which are inherent in Bayesian probabilistic approach.
Abstract（参考訳）: 本研究は、自然言語処理(NLP)と、明示的な形で必須情報の抽出を扱う。最も一般的な情報管理戦略はドキュメント検索(DR)と情報フィルタリングである。 DRシステムは、大量の原料から有用な材料を回収する収穫機として機能する。情報抽出システム(IE)は,大量の有用な情報を手元に持つことにより,原材料を精製し,原テキストの発芽に還元することにより,原材料を変換することができる。 Document Retrievalシステムは、テキストのリポジトリから、必要な情報を含む関連文書を収集する。 IEシステムはそれらを、消化されやすく分析される情報に変換する。関連するテキストフラグメントを分離し、フラグメントから関連する情報を抽出し、目的とする情報を一貫性のあるフレームワークにまとめる。 Thesaurus を用いた Word Sense Disambiguation の新しいアプローチを提案する。図示的な例は、このアプローチの迅速かつ効果的な曖昧さに対する効果を支持する。ファジィ論理に基づく文書検索手法について解説し,その応用例を示した。質問回答システムは、検索したテキスト文書から情報抽出の操作を記述する。クエリに応答する情報抽出のプロセスは、誰が、いつ、どこで、なぜ、という形式でクエリの基数に基づく構造化記述言語(Structured Description Language, SDL)を使用することで、大幅に単純化される。論文は、文書検索と情報抽出のための明らかな推論のデンプスター・シェーファー理論に基づく新しい戦略の提示で締めくくられる。この戦略はベイズ確率論的アプローチに固有の多くの制限の緩和を可能にする。

関連論文リスト

DISRetrieval: Harnessing Discourse Structure for Long Document Retrieval [51.89673002051528]
DISRetrievalは、言語談話構造を利用して長い文書理解を強化する新しい階層的検索フレームワークである。本研究は,談話構造が文書の長さや問合せの種類によって検索効率を著しく向上することを確認する。
論文参考訳（メタデータ） (2025-05-26T14:45:12Z)
Learning More Effective Representations for Dense Retrieval through Deliberate Thinking Before Search [65.53881294642451]
ディリベレート思考に基づくDense Retriever (DEBATER) DEBATERは、ステップバイステップの思考プロセスを通じて、より効果的な文書表現を学習できるようにすることにより、最近の密集型検索機能を強化している。実験の結果,DEBATERはいくつかのベンチマークで既存手法よりも優れていた。
論文参考訳（メタデータ） (2025-02-18T15:56:34Z)
Conversational Text Extraction with Large Language Models Using Retrieval-Augmented Systems [0.20971479389679337]
本研究では,Large Language Models (LLMs) を利用した対話インタフェースを用いてPDF文書からテキストを抽出するシステムを提案する。このシステムは、PDF内の関連するパスをハイライトしながら、ユーザからの問い合わせに対して情報的応答を提供する。提案システムは,既存のテキスト抽出・要約技術と比較して,競争力のあるROUGE値を提供する。
論文参考訳（メタデータ） (2025-01-16T19:12:25Z)
GeAR: Generation Augmented Retrieval [82.20696567697016]
文書検索技術は大規模情報システム開発の基礎となる。一般的な手法は、バイエンコーダを構築し、セマンティックな類似性を計算することである。我々は、よく設計された融合およびデコードモジュールを組み込んだ $textbfGe$neration という新しい手法を提案する。
論文参考訳（メタデータ） (2025-01-06T05:29:00Z)
Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文参考訳（メタデータ） (2024-10-03T17:49:09Z)
Enhanced document retrieval with topic embeddings [0.0]
文書検索システムは、検索強化世代(RAG)の出現にともなって、再活性化された関心を経験してきた。 RAGアーキテクチャはLLMのみのアプリケーションよりも幻覚率が低い。我々は文書の話題情報を考慮した新しいベクトル化手法を考案した。
論文参考訳（メタデータ） (2024-08-19T22:01:45Z)
Beyond Relevant Documents: A Knowledge-Intensive Approach for Query-Focused Summarization using Large Language Models [27.90653125902507]
本稿では,知識集約型タスク設定として,クエリ中心の要約を再構成する知識集約型アプローチを提案する。検索モジュールは、大規模知識コーパスから潜在的に関連のある文書を効率的に検索する。要約コントローラは、強力な大言語モデル(LLM)ベースの要約器を注意深く調整されたプロンプトとシームレスに統合する。
論文参考訳（メタデータ） (2024-08-19T18:54:20Z)
Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。本稿では,高密度検索のための新しい検索ユニット,命題を提案する。実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文参考訳（メタデータ） (2023-12-11T18:57:35Z)
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文参考訳（メタデータ） (2023-10-31T04:37:57Z)
Coarse-to-Fine Knowledge Selection for Document Grounded Dialogs [11.63334863772068]
マルチドキュメント基盤対話システム(DGDS)は,文書の集合から支援された知識を見出すことで,ユーザの要求に答える。本稿では,粒度の粗い知識検索と粒度の細かい知識抽出の両方を統一されたフレームワークで最適化することを目的としたRe3Gを提案する。
論文参考訳（メタデータ） (2023-02-23T08:28:29Z)
MORTY: Structured Summarization for Targeted Information Extraction from Scholarly Articles [0.0]
学術論文からテキストの構造化要約を生成する情報抽出手法MORTYを提案する。我々のアプローチは、構造化要約と呼ばれるセグメント化されたテキストスニペットとして、記事の全文とプロパティと値のペアを凝縮する。また,学術知識グラフから検索した構造化サマリーと,それに対応する公開可能な科学論文を組み合わせた,規模の高い学術データセットも提示する。
論文参考訳（メタデータ） (2022-12-11T06:49:29Z)
TRIE++: Towards End-to-End Information Extraction from Visually Rich Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文参考訳（メタデータ） (2022-07-14T08:52:07Z)
Layout-Aware Information Extraction for Document-Grounded Dialogue: Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。 LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文参考訳（メタデータ） (2022-07-14T07:59:45Z)
TRIE: End-to-End Text Reading and Information Extraction for Document Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文参考訳（メタデータ） (2020-05-27T01:47:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。