論文の概要: Knowledge Graph Anchored Information-Extraction for Domain-Specific
Insights
- arxiv url: http://arxiv.org/abs/2104.08936v2
- Date: Tue, 20 Apr 2021 02:44:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 11:28:47.159206
- Title: Knowledge Graph Anchored Information-Extraction for Domain-Specific
Insights
- Title(参考訳): ドメイン固有の洞察のための知識グラフアンカー情報抽出
- Authors: Vivek Khetan, Annervaz K M, Erin Wetherley, Elena Eneva, Shubhashis
Sengupta, and Andrew E. Fano
- Abstract要約: 新しいドメイン内で特定の情報ニーズを満たすためにタスクベースのアプローチを使用します。
美術NLP技術の状態を構成したパイプラインを使用して、インスタンスレベルのセマンティック構造を自動的に抽出する。
- 参考スコア(独自算出の注目度): 1.6308268213252761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing quantity and complexity of data pose challenges for humans to
consume information and respond in a timely manner. For businesses in domains
with rapidly changing rules and regulations, failure to identify changes can be
costly. In contrast to expert analysis or the development of domain-specific
ontology and taxonomies, we use a task-based approach for fulfilling specific
information needs within a new domain. Specifically, we propose to extract
task-based information from incoming instance data. A pipeline constructed of
state of the art NLP technologies, including a bi-LSTM-CRF model for entity
extraction, attention-based deep Semantic Role Labeling, and an automated
verb-based relationship extractor, is used to automatically extract an instance
level semantic structure. Each instance is then combined with a larger,
domain-specific knowledge graph to produce new and timely insights. Preliminary
results, validated manually, show the methodology to be effective for
extracting specific information to complete end use-cases.
- Abstract(参考訳): データの量と複雑さの増加は、人間が情報を消費し、タイムリーに応答することの困難をもたらす。
急速に変化するルールや規制を持つドメインのビジネスにとって、変更の特定に失敗するのはコストがかかる可能性がある。
専門的な分析やドメイン固有のオントロジーや分類学の発展とは対照的に、新しいドメイン内の特定の情報のニーズを満たすためにタスクベースのアプローチを用いる。
具体的には、入力したインスタンスデータからタスクベースの情報を抽出することを提案する。
エンティティ抽出のためのバイ・LSTM-CRFモデル、アテンションベースディープセマンティックロールラベルリング、および自動動詞ベース関係抽出器を含む技術NLP技術の状態を構成したパイプラインを用いて、インスタンスレベルのセマンティック構造を自動的に抽出する。
各インスタンスは、新しいタイムリーな洞察を生成するために、より大きなドメイン固有の知識グラフと結合される。
手動で検証した予備結果は、特定の情報をエンドユースケースに抽出するのに有効な方法論を示している。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Decoding Time Series with LLMs: A Multi-Agent Framework for Cross-Domain Annotation [56.78444462585225]
TESSAは、時系列データに対する一般的なアノテーションとドメイン固有のアノテーションの両方を自動的に生成するように設計されたマルチエージェントシステムである。
General Agentは複数のソースドメインにまたがる共通パターンと知識をキャプチャし、時系列とテキストの両方の機能を利用する。
ドメイン固有のエージェントは、ターゲットドメインからの限定アノテーションを使用して、ドメイン固有の用語を学び、ターゲットアノテーションを生成する。
論文 参考訳(メタデータ) (2024-10-22T22:43:14Z) - Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization [7.522493227357079]
大規模言語モデル(LLM)は大規模コーパスで事前訓練されている。
LLMは幻覚、知識の遮断、知識の帰属の欠如に悩まされる。
SMART-SLICはドメイン固有のLLMフレームワークである。
論文 参考訳(メタデータ) (2024-10-03T17:40:55Z) - Learning to Discover Knowledge: A Weakly-Supervised Partial Domain Adaptation Approach [20.899013563493202]
ドメイン適応は、リッチアノテーションでソースドメインからの知識を活用することで、魅力的なパフォーマンスを示している。
特定の目標タスクに対して、関連するおよび高品質なソースドメインを収集するのは煩雑である。
本稿では、自己ペースト転送分類器学習(SP-TCL)と呼ばれる、単純で効果的なドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2024-06-20T12:54:07Z) - A Continual Relation Extraction Approach for Knowledge Graph Completeness [0.0]
本論文は,実世界から来るデータストリーム内のエンティティ間の関係を識別する,新たな連続関係抽出手法を開発することを目的とする。
この論文のドメイン固有のデータは、ドイツやオーストリアの新聞のコロナニュースである。
論文 参考訳(メタデータ) (2024-04-20T18:15:52Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - Coarse-to-fine Knowledge Graph Domain Adaptation based on
Distantly-supervised Iterative Training [12.62127290494378]
知識グラフの適応と再学習のための統合フレームワークを提案する。
モデルをトレーニングするために手動のデータアノテーションは必要ない。
ドメイン固有の名前付きエンティティやトリプルの発見を容易にするための,新しい反復的トレーニング戦略を導入する。
論文 参考訳(メタデータ) (2022-11-05T08:16:38Z) - A Multi-Format Transfer Learning Model for Event Argument Extraction via
Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。
変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。
3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文 参考訳(メタデータ) (2022-08-27T13:52:01Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Coupling semantic and statistical techniques for dynamically enriching
web ontologies [0.0]
本稿では,World Wide Web から大規模ジェネリックを動的に強化するための,自動結合型統計・セマンティックフレームワークを提案する。
このアプローチの利点は, (i) 背景知識の欠如による大規模セマンティック・パターンのダイナミック・エンリッチメントを提案し, このような知識の再利用を可能にすることである。
論文 参考訳(メタデータ) (2020-04-23T11:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。