論文の概要: FarsBase-KBP: A Knowledge Base Population System for the Persian
Knowledge Graph
- arxiv url: http://arxiv.org/abs/2005.01879v1
- Date: Mon, 4 May 2020 22:51:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 01:05:38.668846
- Title: FarsBase-KBP: A Knowledge Base Population System for the Persian
Knowledge Graph
- Title(参考訳): FarsBase-KBP:ペルシャ知識グラフのための知識ベース人口システム
- Authors: Majid Asgari-Bidhendi, Behrooz Janfada, Behrouz Minaei-Bidgoli
- Abstract要約: 本稿では,ペルシャ語を母語とするナレッジベース集団システムについて紹介し,Webからクロールした未ラベルの原文から知識を抽出する。
提案システムは,エンティティリンクモジュールなどの最先端モジュールと,FarsBase用に設計された情報および関係抽出モジュールから構成される。
提案した知識ベース人口システムの性能を評価するため,ペルシャ語における知識ベース人口のベンチマークを行うための最初のゴールドデータセットを提示する。
- 参考スコア(独自算出の注目度): 6.866104126509981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While most of the knowledge bases already support the English language, there
is only one knowledge base for the Persian language, known as FarsBase, which
is automatically created via semi-structured web information. Unlike English
knowledge bases such as Wikidata, which have tremendous community support, the
population of a knowledge base like FarsBase must rely on automatically
extracted knowledge. Knowledge base population can let FarsBase keep growing in
size, as the system continues working. In this paper, we present a knowledge
base population system for the Persian language, which extracts knowledge from
unlabeled raw text, crawled from the Web. The proposed system consists of a set
of state-of-the-art modules such as an entity linking module as well as
information and relation extraction modules designed for FarsBase. Moreover, a
canonicalization system is introduced to link extracted relations to FarsBase
properties. Then, the system uses knowledge fusion techniques with minimal
intervention of human experts to integrate and filter the proper knowledge
instances, extracted by each module. To evaluate the performance of the
presented knowledge base population system, we present the first gold dataset
for benchmarking knowledge base population in the Persian language, which
consisting of 22015 FarsBase triples and verified by human experts. The
evaluation results demonstrate the efficiency of the proposed system.
- Abstract(参考訳): ほとんどの知識ベースはすでに英語をサポートしているが、ペルシア語の知識ベースはfarsbaseと呼ばれるもので、半構造化されたweb情報によって自動的に生成される。
Wikidataのような英国の知識ベースと異なり、FarsBaseのような知識ベースの人口は自動的に抽出された知識に頼らなければならない。
知識ベース人口は、システムが機能し続けるにつれて、farsbaseを成長させ続けることができる。
本稿では,web からクロールされたラベルのない原文から知識を抽出する,ペルシャ語の知識ベース人口システムを提案する。
提案するシステムは,エンティティリンクモジュールなどの最先端モジュールと,farsbase用に設計された情報および関係抽出モジュールで構成される。
さらに、抽出された関係をFarsBaseプロパティにリンクする正準化システムを導入する。
そして,人間の介入を最小限に抑えた知識融合技術を用いて,各モジュールから抽出した適切な知識インスタンスの統合とフィルタリングを行う。
提案した知識ベース人口システムの性能を評価するため,22015 FarsBaseの3倍の知識ベース人口のベンチマークを行い,人間の専門家による検証を行った。
評価結果は,提案システムの有効性を示す。
関連論文リスト
- InfuserKI: Enhancing Large Language Models with Knowledge Graphs via
Infuser-Guided Knowledge Integration [61.554209059971576]
大規模言語モデル(LLM)は、様々な領域にまたがる顕著なオープンジェネレーション機能を示している。
新しい知識を注入すると、以前に獲得した知識を忘れるリスクが生じる。
Infuser-Guided Knowledge Integration フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-18T03:36:26Z) - Deep Learning-Empowered Semantic Communication Systems with a Shared
Knowledge Base [42.897527790808965]
テキスト送信において,共有知識ベースを用いたセマンティックコミュニケーションシステムを提案する。
提案システムは,共有知識ベースからのメッセージと対応する知識を統合し,残余情報を取得する。
提案手法は,送信データサイズと文類似度の観点から,既存のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-06T05:25:31Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - KnowledGPT: Enhancing Large Language Models with Retrieval and Storage
Access on Knowledge Bases [55.942342665806656]
KnowledGPTは、様々な知識ベースで大きな言語モデルをブリッジするための包括的なフレームワークである。
検索プロセスでは思考プロンプトプログラムを使用し,KBの検索言語をコード形式で生成する。
KnowledGPTは、個々のユーザ要求に合わせて、知識をパーソナライズされたKBに格納する機能を提供する。
論文 参考訳(メタデータ) (2023-08-17T13:07:00Z) - Query-Driven Knowledge Base Completion using Multimodal Path Fusion over
Multimodal Knowledge Graph [4.416484585765027]
本稿では,非構造化情報と構造化情報とのマルチモーダル融合を用いた問合せ型知識ベース補完システムを提案する。
本システムでは,質問応答とルール推論に基づくマルチモーダル知識グラフを構築している。
システム効率を向上させるため,クエリ駆動技術を用いてシステムの実行時間を削減する。
論文 参考訳(メタデータ) (2022-12-04T20:58:49Z) - Joint Language Semantic and Structure Embedding for Knowledge Graph
Completion [66.15933600765835]
本稿では,知識三重項の自然言語記述と構造情報とを共同で組み込むことを提案する。
本手法は,学習済み言語モデルを微調整することで,完了作業のための知識グラフを埋め込む。
各種知識グラフベンチマーク実験により,本手法の最先端性能を実証した。
論文 参考訳(メタデータ) (2022-09-19T02:41:02Z) - A Two-Stage Approach towards Generalization in Knowledge Base Question
Answering [4.802205743713997]
知識ベース相互作用から意味解析を明確に分離する2段階アーキテクチャに基づくKBQAフレームワークを提案する。
我々のアプローチはLC-QuAD(DBpedia)、WebQSP(Freebase)、SimpleQuestions(Wikidata)、MetaQA(Wikimovies-KG)の同等ないし最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-10T17:45:33Z) - Question Answering over Knowledge Base using Language Model Embeddings [0.0]
本稿では,知識ベース質問回答タスクにおける事前学習言語モデルの利用に焦点を当てる。
さらに,これらの埋め込みを知識ベースから質問まで,双方向の注意機構で微調整した。
提案手法は,質問事項を表現するためのマルチヘッドアテンション機構を備えた,単純な畳み込みニューラルネットワークアーキテクチャに基づいている。
論文 参考訳(メタデータ) (2020-10-17T22:59:34Z) - JAKET: Joint Pre-training of Knowledge Graph and Language Understanding [73.43768772121985]
本稿では,知識グラフと言語の両方をモデル化する新しい事前学習フレームワークであるJAKETを提案する。
知識モジュールと言語モジュールは相互に支援するための重要な情報を提供する。
我々の設計により、事前学習されたモデルは、新しいドメインの見知らぬ知識グラフに容易に適応できる。
論文 参考訳(メタデータ) (2020-10-02T05:53:36Z) - Exploiting Structured Knowledge in Text via Graph-Guided Representation
Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。
エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。
既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文 参考訳(メタデータ) (2020-04-29T14:22:42Z) - Data Augmentation for Personal Knowledge Base Population [4.864819846886142]
コールドスタート知識ベース人口(KBP)は、構造化されていない文書から知識ベースを投入する問題である。
本研究では,ルールベースのアノテータとグラフニューラルネットワークをリンク予測の欠如に用い,より完全で公平で多様な知識ベースを投入するシステムを提案する。
論文 参考訳(メタデータ) (2020-02-23T07:39:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。