論文の概要: Mapping and Cleaning Open Commonsense Knowledge Bases with Generative
Translation
- arxiv url: http://arxiv.org/abs/2306.12766v1
- Date: Thu, 22 Jun 2023 09:42:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-23 14:56:11.302319
- Title: Mapping and Cleaning Open Commonsense Knowledge Bases with Generative
Translation
- Title(参考訳): 生成翻訳によるオープンコモンセンス知識基盤のマッピングとクリーニング
- Authors: Julien Romero, Simon Razniewski
- Abstract要約: 特にオープン情報抽出(OpenIE)は、テキストから構造を誘導するためにしばしば用いられる。
OpenIEには、オープンエンドで非標準化された関係が含まれており、抽出された知識の下流での搾取を困難にしている。
本稿では,言語モデルを訓練し,オープンな言語から固定的なアサーションを生成することによって,生成的翻訳による問題にアプローチすることを提案する。
- 参考スコア(独自算出の注目度): 14.678465723838599
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Structured knowledge bases (KBs) are the backbone of many
know\-ledge-intensive applications, and their automated construction has
received considerable attention. In particular, open information extraction
(OpenIE) is often used to induce structure from a text. However, although it
allows high recall, the extracted knowledge tends to inherit noise from the
sources and the OpenIE algorithm. Besides, OpenIE tuples contain an open-ended,
non-canonicalized set of relations, making the extracted knowledge's downstream
exploitation harder. In this paper, we study the problem of mapping an open KB
into the fixed schema of an existing KB, specifically for the case of
commonsense knowledge. We propose approaching the problem by generative
translation, i.e., by training a language model to generate fixed-schema
assertions from open ones. Experiments show that this approach occupies a sweet
spot between traditional manual, rule-based, or classification-based
canonicalization and purely generative KB construction like COMET. Moreover, it
produces higher mapping accuracy than the former while avoiding the
association-based noise of the latter.
- Abstract(参考訳): structured knowledge bases (kbs) は多くの know-ledge-intensive アプリケーションのバックボーンであり、自動化された構成が注目されている。
特にオープン情報抽出(OpenIE)は、テキストから構造を誘導するためにしばしば用いられる。
しかし、高いリコールを可能にするが、抽出された知識はソースとOpenIEアルゴリズムからノイズを継承する傾向がある。
さらに、OpenIEタプルにはオープンで非標準化された関係が含まれており、抽出された知識の下流への利用が困難になる。
本稿では,オープンKBを既存のKBの固定スキーマにマッピングする問題,特にコモンセンス知識の場合について検討する。
本稿では,言語モデルを訓練し,オープン言語から固定スキーマアサーションを生成することにより,ジェネレーティブ翻訳による問題へのアプローチを提案する。
実験により、このアプローチは従来のマニュアル、ルールベース、あるいは分類ベースの標準化とCOMETのような純粋に生成的なKB構造との間にスイートスポットを占めることが示された。
さらに,連想に基づく雑音を回避しつつ,前者よりも高いマッピング精度を実現する。
関連論文リスト
- STACKFEED: Structured Textual Actor-Critic Knowledge Base Editing with FeedBack [9.82445545347097]
本稿では, FEEDback を用いた構造化テキストアクタ・クリティカルな知識ベース編集手法である FEED を紹介する。
FEEDは、多要素集中型批判強化学習フレームワークを用いて、専門家のフィードバックに基づいてKBを反復的に洗練する。
実験の結果,FEEDは品質とRAGシステム性能を著しく向上し,ベースラインよりも最大8%精度が向上した。
論文 参考訳(メタデータ) (2024-10-14T14:56:01Z) - Knowledge Graph-Enhanced Large Language Models via Path Selection [58.228392005755026]
大規模言語モデル(LLM)は、様々な現実世界のアプリケーションで前例のない性能を示している。
LLMは実際に不正確な出力、すなわち幻覚の問題を発生させることが知られている。
上記の問題に対処する3段階の原理的フレームワークKELPを提案する。
論文 参考訳(メタデータ) (2024-06-19T21:45:20Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Open Knowledge Base Canonicalization with Multi-task Unlearning [19.130159457887]
MulCanonは、OKB標準化における機械学習問題に取り組むマルチタスクアンラーニングフレームワークである。
一般的なOKB標準化データセットに関する徹底的な実験的研究は、MulCanonが高度な機械学習効果を達成することを検証する。
論文 参考訳(メタデータ) (2023-10-25T07:13:06Z) - KnowledGPT: Enhancing Large Language Models with Retrieval and Storage
Access on Knowledge Bases [55.942342665806656]
KnowledGPTは、様々な知識ベースで大きな言語モデルをブリッジするための包括的なフレームワークである。
検索プロセスでは思考プロンプトプログラムを使用し,KBの検索言語をコード形式で生成する。
KnowledGPTは、個々のユーザ要求に合わせて、知識をパーソナライズされたKBに格納する機能を提供する。
論文 参考訳(メタデータ) (2023-08-17T13:07:00Z) - UNTER: A Unified Knowledge Interface for Enhancing Pre-trained Language
Models [100.4659557650775]
構造化知識と非構造化知識の両方を活用する統一的な視点を提供するために、統一知識インターフェイスUNTERを提案する。
どちらの形態の知識も注入され、UNTERは一連の知識駆動NLPタスクの継続的な改善を得る。
論文 参考訳(メタデータ) (2023-05-02T17:33:28Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Joint Reasoning on Hybrid-knowledge sources for Task-Oriented Dialog [12.081212540168055]
本稿では,SeKnow が作成した MutliWOZ ベースのデータセットの修正版について述べる。
事前訓練された言語モデルを利用する最近の作業に合わせて、知識ソースをクエリするタスクのプロンプトを使用してBARTベースのモデルを微調整する。
我々は,本モデルが知識モダリティ(情報源)の摂動に頑健であり,構造化知識と非構造化知識とを融合して応答を生成できることを実証した。
論文 参考訳(メタデータ) (2022-10-13T18:49:59Z) - BERT-based knowledge extraction method of unstructured domain text [0.6445605125467573]
本論文ではBERTに基づく知識抽出手法を提案する。
ドメインの知識ポイントを質問と回答のペアに変換し、文書の回答に関するテキストをコンテキストとして使用する。
より多くの保険条項から知識ポイントを直接抽出するために使用される。
論文 参考訳(メタデータ) (2021-03-01T03:24:35Z) - Reasoning Over Virtual Knowledge Bases With Open Predicate Relations [85.19305347984515]
Open Predicate Query Language (OPQL) を紹介します。
OPQLは、テキストから完全にトレーニングされた仮想知識ベース(VKB)を構築する方法である。
OPQLは2つの異なるKB推論タスクにおいて、以前のVKBメソッドよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-14T01:29:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。