論文の概要: Semantic Annotation and Querying Framework based on Semi-structured
Ayurvedic Text
- arxiv url: http://arxiv.org/abs/2202.00216v1
- Date: Tue, 1 Feb 2022 04:33:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-02 14:41:16.226462
- Title: Semantic Annotation and Querying Framework based on Semi-structured
Ayurvedic Text
- Title(参考訳): 半構造化Ayurvedicテキストに基づく意味アノテーションとクエリフレームワーク
- Authors: Hrishikesh Terdalkar, Arnab Bhattacharya, Madhulika Dubey, Ramamurthy
S, Bhavna Naneria Singh
- Abstract要約: 本稿では,知識グラフ(KG)作成を目的としたサンスクリット文字の手書きアノテーションについて述べる。
構築された知識グラフは、410のエンティティと764の関係を含んでいる。
データセットを含むシステム全体はhttps://sanskrit.iitk.ac.in/ayurveda/から入手可能だ。
- 参考スコア(独自算出の注目度): 4.154846138501937
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge bases (KB) are an important resource in a number of natural
language processing (NLP) and information retrieval (IR) tasks, such as
semantic search, automated question-answering etc. They are also useful for
researchers trying to gain information from a text. Unfortunately, however, the
state-of-the-art in Sanskrit NLP does not yet allow automated construction of
knowledge bases due to unavailability or lack of sufficient accuracy of tools
and methods. Thus, in this work, we describe our efforts on manual annotation
of Sanskrit text for the purpose of knowledge graph (KG) creation. We choose
the chapter Dhanyavarga from Bhavaprakashanighantu of the Ayurvedic text
Bhavaprakasha for annotation. The constructed knowledge graph contains 410
entities and 764 relationships. Since Bhavaprakashanighantu is a technical
glossary text that describes various properties of different substances, we
develop an elaborate ontology to capture the semantics of the entity and
relationship types present in the text. To query the knowledge graph, we design
31 query templates that cover most of the common question patterns. For both
manual annotation and querying, we customize the Sangrahaka framework
previously developed by us. The entire system including the dataset is
available from https://sanskrit.iitk.ac.in/ayurveda/ . We hope that the
knowledge graph that we have created through manual annotation and subsequent
curation will help in development and testing of NLP tools in future as well as
studying of the Bhavaprakasanighantu text.
- Abstract(参考訳): 知識ベース(KB)は多くの自然言語処理(NLP)や情報検索(IR)タスクにおいて重要なリソースである。
また、テキストから情報を得ようとする研究者にも役立ちます。
しかし残念なことに、sanskrit nlpの最先端技術では、ツールやメソッドの精度が不十分なため、知識ベースの自動構築は許可されていない。
そこで本研究では,知識グラフ(KG)作成を目的としたサンスクリットテキストのマニュアルアノテーションに関する取り組みについて述べる。
ayurvedic text bhavaprakasha の bhavaprakashanighantu から dhanyavarga の章を注釈として選択する。
構築された知識グラフは、410のエンティティと764の関係を含んでいる。
bhavaprakashanighantuは、異なる物質の様々な特性を記述する技術用語集であるので、テキストに存在するエンティティと関係型のセマンティクスを捉えるための精巧なオントロジーを開発する。
知識グラフを問合せするために、一般的な質問パターンのほとんどをカバーする31のクエリテンプレートを設計する。
手動のアノテーションとクエリについては、以前私たちが開発したSangrahakaフレームワークをカスタマイズします。
データセットを含むシステム全体は、https://sanskrit.iitk.ac.in/ayurveda/から利用できる。
手動のアノテーションやその後のキュレーションを通じて作成した知識グラフが,将来的にNLPツールの開発とテスト,さらにはBhavaprakasanighantuテキストの研究に役立ちたいと思っています。
関連論文リスト
- Building Tamil Treebanks [0.0]
ツリーバンクは重要な言語資源であり、豊富な言語アノテーションで構造化され注釈付けされたコーパスである。
本稿では,手動アノテーション,計算文法,機械学習の3つのアプローチを用いて,タミル木バンクの作成について論じる。
論文 参考訳(メタデータ) (2024-09-23T01:58:50Z) - Sanskrit Knowledge-based Systems: Annotation and Computational Tools [0.12086712057375555]
我々はサンスクリットの知識システム開発における課題と機会に対処する。
本研究はサンスクリット語文に具現化された豊かな言語情報の保存,理解,活用に寄与する。
論文 参考訳(メタデータ) (2024-06-26T12:00:10Z) - Dataset and Benchmark for Urdu Natural Scenes Text Detection, Recognition and Visual Question Answering [50.52792174648067]
このイニシアチブは、テキストと視覚的理解のギャップを埋めようとしている。
そこで本研究では,1000以上の自然シーン画像からなるマルチタスクUrduシーンテキストデータセットを提案する。
テキストインスタンスの細かいアノテーションを提供し、以前のデータセットの制限に対処します。
論文 参考訳(メタデータ) (2024-05-21T06:48:26Z) - Harnessing Explanations: LLM-to-LM Interpreter for Enhanced
Text-Attributed Graph Representation Learning [51.90524745663737]
重要なイノベーションは、機能として説明を使用することで、下流タスクにおけるGNNのパフォーマンス向上に利用できます。
提案手法は、確立されたTAGデータセットの最先端結果を実現する。
本手法はトレーニングを著しく高速化し,ogbn-arxivのベースラインに最も近い2.88倍の改善を実現した。
論文 参考訳(メタデータ) (2023-05-31T03:18:03Z) - SanskritShala: A Neural Sanskrit NLP Toolkit with Web-Based Interface
for Pedagogical and Annotation Purposes [13.585440544031584]
ニューラルサンスクリット自然言語処理(NLP)ツールキットであるSanskritShalaを提案する。
本システムでは,全タスクで利用可能なベンチマークデータセットについて,最先端のパフォーマンスを報告している。
SanskritShalaはWebベースのアプリケーションとしてデプロイされ、ユーザが入力に対してリアルタイムに分析することができる。
論文 参考訳(メタデータ) (2023-02-19T09:58:55Z) - Deep Bidirectional Language-Knowledge Graph Pretraining [159.9645181522436]
DRAGONは、テキストとKGを大規模に融合した言語知識基盤モデルを事前学習するための自己教師型アプローチである。
我々のモデルは、入力としてテキストセグメントと関連するKGサブグラフのペアを取り、両モードから情報を双方向に融合する。
論文 参考訳(メタデータ) (2022-10-17T18:02:52Z) - Joint Language Semantic and Structure Embedding for Knowledge Graph
Completion [66.15933600765835]
本稿では,知識三重項の自然言語記述と構造情報とを共同で組み込むことを提案する。
本手法は,学習済み言語モデルを微調整することで,完了作業のための知識グラフを埋め込む。
各種知識グラフベンチマーク実験により,本手法の最先端性能を実証した。
論文 参考訳(メタデータ) (2022-09-19T02:41:02Z) - FabKG: A Knowledge graph of Manufacturing Science domain utilizing
structured and unconventional unstructured knowledge source [1.2597961235465307]
我々は,商業・教育用両方の実体・関係データに基づく知識グラフを開発する。
学生ノートを活用したKG作成のための新しいクラウドソーシング手法を提案する。
私たちは、すべてのデータソースを使用して、65,000以上のトリプルを含む知識グラフを作成しました。
論文 参考訳(メタデータ) (2022-05-24T02:32:04Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z) - Dependently Typed Knowledge Graphs [4.157595789003928]
本稿では,標準セマンティックWeb技術(RDFとそのクエリ言語SPARQL)を依存型理論と統一的に再現する方法を示す。
知識グラフの基本機能を提供するのに加えて、依存型はエンティティとクエリの両方をエンコードする表現力を与えます。
論文 参考訳(メタデータ) (2020-03-08T14:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。