論文の概要: CEntRE: A paragraph-level Chinese dataset for Relation Extraction among
Enterprises
- arxiv url: http://arxiv.org/abs/2210.10581v1
- Date: Wed, 19 Oct 2022 14:22:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 14:54:40.138218
- Title: CEntRE: A paragraph-level Chinese dataset for Relation Extraction among
Enterprises
- Title(参考訳): CEntRE:企業間の関係抽出のための段落レベルの中国語データセット
- Authors: Peipei Liu, Hong Li, Zhiyu Wang, Yimo Ren, Jie Liu, Fei Lyu, Hongsong
Zhu, Limin Sun
- Abstract要約: 企業関係抽出は、エンタープライズエンティティのペアを検出し、非構造化または半構造化されたテキストデータからそれらの間のビジネス関係を識別することを目的としている。
CEntREは、人間の注意深いアノテーションとインテリジェントなデータ処理を備えた、公開可能なビジネスニュースデータから構築された新しいデータセットである。
- 参考スコア(独自算出の注目度): 11.596083874633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enterprise relation extraction aims to detect pairs of enterprise entities
and identify the business relations between them from unstructured or
semi-structured text data, and it is crucial for several real-world
applications such as risk analysis, rating research and supply chain security.
However, previous work mainly focuses on getting attribute information about
enterprises like personnel and corporate business, and pays little attention to
enterprise relation extraction. To encourage further progress in the research,
we introduce the CEntRE, a new dataset constructed from publicly available
business news data with careful human annotation and intelligent data
processing. Extensive experiments on CEntRE with six excellent models
demonstrate the challenges of our proposed dataset.
- Abstract(参考訳): 企業関係抽出は、企業エンティティのペアを検出し、非構造化または半構造化テキストデータからそれらのビジネス関係を識別することを目的としており、リスク分析、レーティングリサーチ、サプライチェーンセキュリティなど、いくつかの現実のアプリケーションにとって重要である。
しかし、従来の研究は主に人事や企業事業などの企業属性情報を得ることに重点を置いており、企業関係の抽出にはほとんど注意を払っていない。
研究のさらなる進展を促すため、CEntREは、人間の注意深いアノテーションとインテリジェントなデータ処理を備えた、公開可能なビジネスニュースデータから構築された新しいデータセットである。
6つの優れたモデルを用いたセンターに関する広範な実験は、提案するデータセットの課題を実証する。
関連論文リスト
- SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - EnterpriseEM: Fine-tuned Embeddings for Enterprise Semantic Search [1.2097014193871654]
本稿では,事前学習した埋め込みモデルを企業環境に適応させる手法を提案する。
企業で普及している検索課題に適合するように埋め込みを適応させることで,AIによる情報検索ソリューションの性能向上を目指す。
論文 参考訳(メタデータ) (2024-05-18T14:06:53Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - Towards Avoiding the Data Mess: Industry Insights from Data Mesh Implementations [1.5029560229270191]
Data Meshは、企業データ管理のための、社会技術的、分散化されたコンセプトである。
業界の専門家との15の半構造化インタビューを行います。
本研究は,業界の専門家による知見を総合し,データメッシュの採用を成功させるための予備的ガイドラインを研究者や専門家に提供する。
論文 参考訳(メタデータ) (2023-02-03T13:09:57Z) - A Survey of Data Marketplaces and Their Business Models [0.0]
「データ」は、土地、インフラ、労働、資本と同様に、必要不可欠な生産要素になりつつある。
特定の機能を自動化することから、データ駆動型組織における意思決定を促進することに至るまで、タスクは、ますますサードパーティからのデータインプットを取得することの恩恵を受けています。
新しいエンティティや新しいビジネスモデルは、そのようなデータ要求を適切なプロバイダと一致させることを目的として現れています。
論文 参考訳(メタデータ) (2022-01-11T12:27:37Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Big Data Generated by Connected and Automated Vehicles for Safety
Monitoring, Assessment and Improvement, Final Report (Year 3) [0.654475763573891]
本報告は、コネクテッド・アンド・オートマチック・カー(CAV)の安全性に焦点をあてる。
目標は、安全監視と改善のために、ビッグデータに関する研究を体系的に合成することである。
論文 参考訳(メタデータ) (2021-01-09T20:00:26Z) - Improving Company Valuations with Automated Knowledge Discovery,
Extraction and Fusion [0.15293427903448023]
本稿では, 自動知識発見, 抽出, およびデータ融合を用いて, 新たな指標を得る方法について述べる。
本研究では,プロプライエタリな検索インタフェースの裏側に隠された臨床試験のデータを同定し,収集するために,深層Web知識取得手法を適用した。
論文 参考訳(メタデータ) (2020-10-19T06:33:12Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。