論文の概要: Natural language processing for word sense disambiguation and
information extraction
- arxiv url: http://arxiv.org/abs/2004.02256v1
- Date: Sun, 5 Apr 2020 17:13:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 12:08:22.416859
- Title: Natural language processing for word sense disambiguation and
information extraction
- Title(参考訳): 単語感覚の曖昧さと情報抽出のための自然言語処理
- Authors: K. R. Chowdhary
- Abstract要約: Thesaurus を用いた Word Sense Disambiguation の新しいアプローチを提案する。
ファジィ論理に基づく文書検索手法について解説し,その応用例を示した。
この戦略は、明らかな推論のデンプスター・シェーファー理論に基づく新しい戦略の提示で締めくくられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This research work deals with Natural Language Processing (NLP) and
extraction of essential information in an explicit form. The most common among
the information management strategies is Document Retrieval (DR) and
Information Filtering. DR systems may work as combine harvesters, which bring
back useful material from the vast fields of raw material. With large amount of
potentially useful information in hand, an Information Extraction (IE) system
can then transform the raw material by refining and reducing it to a germ of
original text. A Document Retrieval system collects the relevant documents
carrying the required information, from the repository of texts. An IE system
then transforms them into information that is more readily digested and
analyzed. It isolates relevant text fragments, extracts relevant information
from the fragments, and then arranges together the targeted information in a
coherent framework. The thesis presents a new approach for Word Sense
Disambiguation using thesaurus. The illustrative examples supports the
effectiveness of this approach for speedy and effective disambiguation. A
Document Retrieval method, based on Fuzzy Logic has been described and its
application is illustrated. A question-answering system describes the operation
of information extraction from the retrieved text documents. The process of
information extraction for answering a query is considerably simplified by
using a Structured Description Language (SDL) which is based on cardinals of
queries in the form of who, what, when, where and why. The thesis concludes
with the presentation of a novel strategy based on Dempster-Shafer theory of
evidential reasoning, for document retrieval and information extraction. This
strategy permits relaxation of many limitations, which are inherent in Bayesian
probabilistic approach.
- Abstract(参考訳): 本研究は、自然言語処理(NLP)と、明示的な形で必須情報の抽出を扱う。
最も一般的な情報管理戦略はドキュメント検索(DR)と情報フィルタリングである。
DRシステムは、大量の原料から有用な材料を回収する収穫機として機能する。
情報抽出システム(IE)は,大量の有用な情報を手元に持つことにより,原材料を精製し,原テキストの発芽に還元することにより,原材料を変換することができる。
Document Retrievalシステムは、テキストのリポジトリから、必要な情報を含む関連文書を収集する。
IEシステムはそれらを、消化されやすく分析される情報に変換する。
関連するテキストフラグメントを分離し、フラグメントから関連する情報を抽出し、目的とする情報を一貫性のあるフレームワークにまとめる。
Thesaurus を用いた Word Sense Disambiguation の新しいアプローチを提案する。
図示的な例は、このアプローチの迅速かつ効果的な曖昧さに対する効果を支持する。
ファジィ論理に基づく文書検索手法について解説し,その応用例を示した。
質問回答システムは、検索したテキスト文書から情報抽出の操作を記述する。
クエリに応答する情報抽出のプロセスは、誰が、いつ、どこで、なぜ、という形式でクエリの基数に基づく構造化記述言語(Structured Description Language, SDL)を使用することで、大幅に単純化される。
論文は、文書検索と情報抽出のための明らかな推論のデンプスター・シェーファー理論に基づく新しい戦略の提示で締めくくられる。
この戦略はベイズ確率論的アプローチに固有の多くの制限の緩和を可能にする。
関連論文リスト
- Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。
具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文 参考訳(メタデータ) (2024-10-03T17:49:09Z) - Enhanced document retrieval with topic embeddings [0.0]
文書検索システムは、検索強化世代(RAG)の出現にともなって、再活性化された関心を経験してきた。
RAGアーキテクチャはLLMのみのアプリケーションよりも幻覚率が低い。
我々は文書の話題情報を考慮した新しいベクトル化手法を考案した。
論文 参考訳(メタデータ) (2024-08-19T22:01:45Z) - Beyond Relevant Documents: A Knowledge-Intensive Approach for Query-Focused Summarization using Large Language Models [27.90653125902507]
本稿では,知識集約型タスク設定として,クエリ中心の要約を再構成する知識集約型アプローチを提案する。
検索モジュールは、大規模知識コーパスから潜在的に関連のある文書を効率的に検索する。
要約コントローラは、強力な大言語モデル(LLM)ベースの要約器を注意深く調整されたプロンプトとシームレスに統合する。
論文 参考訳(メタデータ) (2024-08-19T18:54:20Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Coarse-to-Fine Knowledge Selection for Document Grounded Dialogs [11.63334863772068]
マルチドキュメント基盤対話システム(DGDS)は,文書の集合から支援された知識を見出すことで,ユーザの要求に答える。
本稿では,粒度の粗い知識検索と粒度の細かい知識抽出の両方を統一されたフレームワークで最適化することを目的としたRe3Gを提案する。
論文 参考訳(メタデータ) (2023-02-23T08:28:29Z) - MORTY: Structured Summarization for Targeted Information Extraction from
Scholarly Articles [0.0]
学術論文からテキストの構造化要約を生成する情報抽出手法MORTYを提案する。
我々のアプローチは、構造化要約と呼ばれるセグメント化されたテキストスニペットとして、記事の全文とプロパティと値のペアを凝縮する。
また,学術知識グラフから検索した構造化サマリーと,それに対応する公開可能な科学論文を組み合わせた,規模の高い学術データセットも提示する。
論文 参考訳(メタデータ) (2022-12-11T06:49:29Z) - TRIE++: Towards End-to-End Information Extraction from Visually Rich
Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。
テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。
フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文 参考訳(メタデータ) (2022-07-14T08:52:07Z) - Layout-Aware Information Extraction for Document-Grounded Dialogue:
Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。
LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。
実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文 参考訳(メタデータ) (2022-07-14T07:59:45Z) - TRIE: End-to-End Text Reading and Information Extraction for Document
Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。
テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。
提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-27T01:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。