論文の概要: Knowledge Graph Anchored Information-Extraction for Domain-Specific
Insights
- arxiv url: http://arxiv.org/abs/2104.08936v2
- Date: Tue, 20 Apr 2021 02:44:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 11:28:47.159206
- Title: Knowledge Graph Anchored Information-Extraction for Domain-Specific
Insights
- Title(参考訳): ドメイン固有の洞察のための知識グラフアンカー情報抽出
- Authors: Vivek Khetan, Annervaz K M, Erin Wetherley, Elena Eneva, Shubhashis
Sengupta, and Andrew E. Fano
- Abstract要約: 新しいドメイン内で特定の情報ニーズを満たすためにタスクベースのアプローチを使用します。
美術NLP技術の状態を構成したパイプラインを使用して、インスタンスレベルのセマンティック構造を自動的に抽出する。
- 参考スコア(独自算出の注目度): 1.6308268213252761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing quantity and complexity of data pose challenges for humans to
consume information and respond in a timely manner. For businesses in domains
with rapidly changing rules and regulations, failure to identify changes can be
costly. In contrast to expert analysis or the development of domain-specific
ontology and taxonomies, we use a task-based approach for fulfilling specific
information needs within a new domain. Specifically, we propose to extract
task-based information from incoming instance data. A pipeline constructed of
state of the art NLP technologies, including a bi-LSTM-CRF model for entity
extraction, attention-based deep Semantic Role Labeling, and an automated
verb-based relationship extractor, is used to automatically extract an instance
level semantic structure. Each instance is then combined with a larger,
domain-specific knowledge graph to produce new and timely insights. Preliminary
results, validated manually, show the methodology to be effective for
extracting specific information to complete end use-cases.
- Abstract(参考訳): データの量と複雑さの増加は、人間が情報を消費し、タイムリーに応答することの困難をもたらす。
急速に変化するルールや規制を持つドメインのビジネスにとって、変更の特定に失敗するのはコストがかかる可能性がある。
専門的な分析やドメイン固有のオントロジーや分類学の発展とは対照的に、新しいドメイン内の特定の情報のニーズを満たすためにタスクベースのアプローチを用いる。
具体的には、入力したインスタンスデータからタスクベースの情報を抽出することを提案する。
エンティティ抽出のためのバイ・LSTM-CRFモデル、アテンションベースディープセマンティックロールラベルリング、および自動動詞ベース関係抽出器を含む技術NLP技術の状態を構成したパイプラインを用いて、インスタンスレベルのセマンティック構造を自動的に抽出する。
各インスタンスは、新しいタイムリーな洞察を生成するために、より大きなドメイン固有の知識グラフと結合される。
手動で検証した予備結果は、特定の情報をエンドユースケースに抽出するのに有効な方法論を示している。
関連論文リスト
- Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - Exploring In-Context Learning Capabilities of Foundation Models for
Generating Knowledge Graphs from Text [3.114960935006655]
本論文は,知識グラフの自動構築と完成の技術をテキストから改善することを目的としている。
この文脈では、新しいパラダイムの1つは、言語モデルがプロンプトとともにそのまま使われる、コンテキスト内学習である。
論文 参考訳(メタデータ) (2023-05-15T17:10:19Z) - Gradient Imitation Reinforcement Learning for General Low-Resource
Information Extraction [80.64518530825801]
本研究では,ラベル付きデータに対する勾配降下方向を模倣するために擬似ラベル付きデータを奨励するグラディエント強化学習法(GIRL)を開発した。
GIRLを利用して、低リソース設定ですべてのIEサブタスク(エンティティ認識、関係抽出、イベント抽出)を解決します。
論文 参考訳(メタデータ) (2022-11-11T05:37:19Z) - Coarse-to-fine Knowledge Graph Domain Adaptation based on
Distantly-supervised Iterative Training [12.62127290494378]
知識グラフの適応と再学習のための統合フレームワークを提案する。
モデルをトレーニングするために手動のデータアノテーションは必要ない。
ドメイン固有の名前付きエンティティやトリプルの発見を容易にするための,新しい反復的トレーニング戦略を導入する。
論文 参考訳(メタデータ) (2022-11-05T08:16:38Z) - A Multi-Format Transfer Learning Model for Event Argument Extraction via
Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。
変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。
3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文 参考訳(メタデータ) (2022-08-27T13:52:01Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Understood in Translation, Transformers for Domain Understanding [2.379911867541422]
本稿では,コーパスの領域定義のためのトランスフォーマーに基づく教師あり機械学習手法を提案する。
このようなドメイン構造の自動定義が、生成したグラフの構成時間と品質の両方において有益である理由を論じる。
PubMedから抽出した出版物に基づく新しい健康領域データセットを提案する。
論文 参考訳(メタデータ) (2020-12-18T14:47:47Z) - Domain-Transferable Method for Named Entity Recognition Task [0.6040938686276304]
本稿では、任意の名前付きエンティティの集合に対して、ドメイン固有のNERモデルを学習する方法について述べる。
我々は、人間の努力なしに監督が得られ、ニューラルモデルが互いに学習できると仮定する。
論文 参考訳(メタデータ) (2020-11-24T15:45:52Z) - Coupling semantic and statistical techniques for dynamically enriching
web ontologies [0.0]
本稿では,World Wide Web から大規模ジェネリックを動的に強化するための,自動結合型統計・セマンティックフレームワークを提案する。
このアプローチの利点は, (i) 背景知識の欠如による大規模セマンティック・パターンのダイナミック・エンリッチメントを提案し, このような知識の再利用を可能にすることである。
論文 参考訳(メタデータ) (2020-04-23T11:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。