Fugu-MT 論文翻訳(概要): Knowledge Graph Anchored Information-Extraction for Domain-Specific Insights

論文の概要: Knowledge Graph Anchored Information-Extraction for Domain-Specific Insights

arxiv url: http://arxiv.org/abs/2104.08936v2
Date: Tue, 20 Apr 2021 02:44:06 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-21 11:28:47.159206
Title: Knowledge Graph Anchored Information-Extraction for Domain-Specific Insights
Title（参考訳）: ドメイン固有の洞察のための知識グラフアンカー情報抽出
Authors: Vivek Khetan, Annervaz K M, Erin Wetherley, Elena Eneva, Shubhashis Sengupta, and Andrew E. Fano
Abstract要約: 新しいドメイン内で特定の情報ニーズを満たすためにタスクベースのアプローチを使用します。美術NLP技術の状態を構成したパイプラインを使用して、インスタンスレベルのセマンティック構造を自動的に抽出する。
参考スコア（独自算出の注目度）: 1.6308268213252761
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The growing quantity and complexity of data pose challenges for humans to consume information and respond in a timely manner. For businesses in domains with rapidly changing rules and regulations, failure to identify changes can be costly. In contrast to expert analysis or the development of domain-specific ontology and taxonomies, we use a task-based approach for fulfilling specific information needs within a new domain. Specifically, we propose to extract task-based information from incoming instance data. A pipeline constructed of state of the art NLP technologies, including a bi-LSTM-CRF model for entity extraction, attention-based deep Semantic Role Labeling, and an automated verb-based relationship extractor, is used to automatically extract an instance level semantic structure. Each instance is then combined with a larger, domain-specific knowledge graph to produce new and timely insights. Preliminary results, validated manually, show the methodology to be effective for extracting specific information to complete end use-cases.
Abstract（参考訳）: データの量と複雑さの増加は、人間が情報を消費し、タイムリーに応答することの困難をもたらす。急速に変化するルールや規制を持つドメインのビジネスにとって、変更の特定に失敗するのはコストがかかる可能性がある。専門的な分析やドメイン固有のオントロジーや分類学の発展とは対照的に、新しいドメイン内の特定の情報のニーズを満たすためにタスクベースのアプローチを用いる。具体的には、入力したインスタンスデータからタスクベースの情報を抽出することを提案する。エンティティ抽出のためのバイ・LSTM-CRFモデル、アテンションベースディープセマンティックロールラベルリング、および自動動詞ベース関係抽出器を含む技術NLP技術の状態を構成したパイプラインを用いて、インスタンスレベルのセマンティック構造を自動的に抽出する。各インスタンスは、新しいタイムリーな洞察を生成するために、より大きなドメイン固有の知識グラフと結合される。手動で検証した予備結果は、特定の情報をエンドユースケースに抽出するのに有効な方法論を示している。

関連論文リスト

Data Therapist: Eliciting Domain Knowledge from Subject Matter Experts Using Large Language Models [17.006423792670414]
我々は、ドメインの専門家が混在開始プロセスを通じて暗黙の知識を外部化するのに役立つWebベースのツールであるData Therapistを紹介します。得られた構造化知識ベースは、人間と自動化された可視化設計の両方に通知することができる。
論文参考訳（メタデータ） (2025-05-01T11:10:17Z)
Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2024-10-31T06:55:24Z)
Decoding Time Series with LLMs: A Multi-Agent Framework for Cross-Domain Annotation [56.78444462585225]
TESSAは、時系列データに対する一般的なアノテーションとドメイン固有のアノテーションの両方を自動的に生成するように設計されたマルチエージェントシステムである。 General Agentは複数のソースドメインにまたがる共通パターンと知識をキャプチャし、時系列とテキストの両方の機能を利用する。ドメイン固有のエージェントは、ターゲットドメインからの限定アノテーションを使用して、ドメイン固有の用語を学び、ターゲットアノテーションを生成する。
論文参考訳（メタデータ） (2024-10-22T22:43:14Z)
Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization [7.522493227357079]
大規模言語モデル(LLM)は大規模コーパスで事前訓練されている。 LLMは幻覚、知識の遮断、知識の帰属の欠如に悩まされる。 SMART-SLICはドメイン固有のLLMフレームワークである。
論文参考訳（メタデータ） (2024-10-03T17:40:55Z)
Learning to Discover Knowledge: A Weakly-Supervised Partial Domain Adaptation Approach [20.899013563493202]
ドメイン適応は、リッチアノテーションでソースドメインからの知識を活用することで、魅力的なパフォーマンスを示している。特定の目標タスクに対して、関連するおよび高品質なソースドメインを収集するのは煩雑である。本稿では、自己ペースト転送分類器学習(SP-TCL)と呼ばれる、単純で効果的なドメイン適応手法を提案する。
論文参考訳（メタデータ） (2024-06-20T12:54:07Z)
A Continual Relation Extraction Approach for Knowledge Graph Completeness [0.0]
本論文は,実世界から来るデータストリーム内のエンティティ間の関係を識別する,新たな連続関係抽出手法を開発することを目的とする。この論文のドメイン固有のデータは、ドイツやオーストリアの新聞のコロナニュースである。
論文参考訳（メタデータ） (2024-04-20T18:15:52Z)
Unearthing Large Scale Domain-Specific Knowledge from Public Corpora [103.0865116794534]
データ収集パイプラインに大規模なモデルを導入し、ドメイン固有の情報の生成をガイドします。このアプローチをRetrieve-from-CCと呼ぶ。ドメイン固有の知識に関するデータを収集するだけでなく、パブリックコーパスから潜在的推論手順を含むデータをマイニングする。
論文参考訳（メタデータ） (2024-01-26T03:38:23Z)
Instruct and Extract: Instruction Tuning for On-Demand Information Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。 InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。 InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文参考訳（メタデータ） (2023-10-24T17:54:25Z)
Coarse-to-fine Knowledge Graph Domain Adaptation based on Distantly-supervised Iterative Training [12.62127290494378]
知識グラフの適応と再学習のための統合フレームワークを提案する。モデルをトレーニングするために手動のデータアノテーションは必要ない。ドメイン固有の名前付きエンティティやトリプルの発見を容易にするための,新しい反復的トレーニング戦略を導入する。
論文参考訳（メタデータ） (2022-11-05T08:16:38Z)
A Multi-Format Transfer Learning Model for Event Argument Extraction via Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。 3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文参考訳（メタデータ） (2022-08-27T13:52:01Z)
Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。 SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文参考訳（メタデータ） (2021-04-07T17:58:39Z)
Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-03-25T14:33:33Z)
Coupling semantic and statistical techniques for dynamically enriching web ontologies [0.0]
本稿では,World Wide Web から大規模ジェネリックを動的に強化するための,自動結合型統計・セマンティックフレームワークを提案する。このアプローチの利点は, (i) 背景知識の欠如による大規模セマンティック・パターンのダイナミック・エンリッチメントを提案し, このような知識の再利用を可能にすることである。
論文参考訳（メタデータ） (2020-04-23T11:21:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。