論文の概要: Methods for Knowledge Graph Construction from Text Collections: Development and Applications
- arxiv url: http://arxiv.org/abs/2603.25862v1
- Date: Thu, 26 Mar 2026 19:36:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.251504
- Title: Methods for Knowledge Graph Construction from Text Collections: Development and Applications
- Title(参考訳): テキストコレクションからの知識グラフ構築手法の開発とその応用
- Authors: Vanni Zavarella,
- Abstract要約: あらゆる領域にまたがるデータの量と多様性は、前例のない機会と、実行可能な知識を抽出するための課題を生み出している。
リッチなセマンティック知識の抽出は、テキストジャンルやスキーマ仕様にまたがるスケーラブルで柔軟な自動メソッドの展開を必要とする。
本稿では,セマンティックWebのベストプラクティスを活用した自然言語処理,機械学習,生成AIの手法を,大規模テキストコーパスから知識グラフの自動構築に適用する実験を行った。
- 参考スコア(独自算出の注目度): 0.18275108630751835
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Virtually every sector of society is experiencing a dramatic growth in the volume of unstructured textual data that is generated and published, from news and social media online interactions, through open access scholarly communications and observational data in the form of digital health records and online drug reviews. The volume and variety of data across all this range of domains has created both unprecedented opportunities and pressing challenges for extracting actionable knowledge for several application scenarios. However, the extraction of rich semantic knowledge demands the deployment of scalable and flexible automatic methods adaptable across text genres and schema specifications. Moreover, the full potential of these data can only be unlocked by coupling information extraction methods with Semantic Web techniques for the construction of full-fledged Knowledge Graphs, that are semantically transparent, explainable by design and interoperable. In this thesis, we experiment with the application of Natural Language Processing, Machine Learning and Generative AI methods, powered by Semantic Web best practices, to the automatic construction of Knowledge Graphs from large text corpora, in three use case applications: the analysis of the Digital Transformation discourse in the global news and social media platforms; the mapping and trend analysis of recent research in the Architecture, Engineering, Construction and Operations domain from a large corpus of publications; the generation of causal relation graphs of biomedical entities from electronic health records and patient-authored drug reviews. The contributions of this thesis to the research community are in terms of benchmark evaluation results, the design of customized algorithms and the creation of data resources in the form of Knowledge Graphs, together with data analysis results built on top of them.
- Abstract(参考訳): 事実上、社会のあらゆる分野は、ニュースやソーシャルメディアのオンラインインタラクションから、オープンアクセスの学術的なコミュニケーションや観察的なデータを通じて、デジタルヘルス記録やオンライン薬物レビューという形で、非構造化されたテキストデータのボリュームを劇的に増加させています。
これらすべての領域にまたがるデータの量と多様性は、前例のない機会と、いくつかのアプリケーションシナリオにおいて実行可能な知識を抽出する上での課題を生み出している。
しかし、リッチなセマンティック知識の抽出は、テキストジャンルやスキーマ仕様に適応可能なスケーラブルで柔軟な自動メソッドの配置を必要とする。
さらに、これらのデータの完全なポテンシャルは、セマンティックWeb技術と結合して、セマンティックな知識グラフを構築することでのみ解き放つことができ、それは意味的に透明で、設計によって説明可能であり、相互運用可能である。
本稿では,Semantic Webベストプラクティスを活用した自然言語処理,機械学習,生成AI手法の適用を,グローバルニュースおよびソーシャルメディアプラットフォームにおけるデジタルトランスフォーメーション談話の分析,出版物の大規模コーパスからのアーキテクチャ,エンジニアリング,構築,運用ドメインにおける最近の研究のマッピングと動向分析,電子健康記録からのバイオメディカルエンティティの因果関係グラフの生成,および患者が承認した薬物レビューの3つのユースケースで,大規模テキストコーパスからの知識グラフの自動構築に適用した。
研究コミュニティへのこの論文の貢献は、ベンチマーク評価結果、カスタマイズされたアルゴリズムの設計、知識グラフの形でのデータリソースの作成、そしてその上に構築されたデータ分析結果である。
関連論文リスト
- Decoding MIE: A Novel Dataset Approach Using Topic Extraction and Affiliation Parsing [0.0]
本研究は,医療情報学ヨーロッパ(MIE)会議の手続きから得られた新しいデータセットを紹介する。
我々は,「健康技術・情報学研究」誌の4,606論文からメタデータと要約を抽出し,分析した。
論文 参考訳(メタデータ) (2024-10-06T19:34:23Z) - Customized Information and Domain-centric Knowledge Graph Construction with Large Language Models [0.0]
本稿では,構造化情報へのタイムリーなアクセスを実現するための知識グラフに基づく新しいアプローチを提案する。
本フレームワークは,情報検索,キーフレーズ抽出,セマンティックネットワーク生成,トピックマップ可視化などを含むテキストマイニングプロセスを含む。
当社の方法論を自動車電気システムの領域に適用して,スケーラブルなアプローチを実証する。
論文 参考訳(メタデータ) (2024-09-30T07:08:28Z) - Bridging Local Details and Global Context in Text-Attributed Graphs [62.522550655068336]
GraphBridgeは、コンテキストテキスト情報を活用することで、ローカルおよびグローバルな視点をブリッジするフレームワークである。
提案手法は最先端性能を実現し,グラフ対応トークン削減モジュールは効率を大幅に向上し,スケーラビリティの問題を解消する。
論文 参考訳(メタデータ) (2024-06-18T13:35:25Z) - Enhancing Biomedical Lay Summarisation with External Knowledge Graphs [28.956500948255677]
そこで本研究では,知識グラフをレイ・サマリゼーション・モデルに組み込むための3つのアプローチの有効性について検討する。
この結果から,グラフベースのドメイン知識の統合は,生成したテキストの可読性を大幅に向上させることで,レイ・サマライズを著しく向上させることが可能であることが確認された。
論文 参考訳(メタデータ) (2023-10-24T10:25:21Z) - Iterative Zero-Shot LLM Prompting for Knowledge Graph Construction [104.29108668347727]
本稿では,最新の生成型大規模言語モデルの可能性を活用する,革新的な知識グラフ生成手法を提案する。
このアプローチは、新しい反復的なゼロショットと外部知識に依存しない戦略を含むパイプラインで伝達される。
我々は、我々の提案がスケーラブルで多目的な知識グラフ構築に適したソリューションであり、異なる新しい文脈に適用できると主張している。
論文 参考訳(メタデータ) (2023-07-03T16:01:45Z) - The Semantic Scholar Open Data Platform [92.2948743167744]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Vision+X: A Survey on Multimodal Learning in the Light of Data [64.03266872103835]
様々なソースからのデータを組み込んだマルチモーダル機械学習が,ますます普及している研究分野となっている。
我々は、視覚、音声、テキスト、動きなど、各データフォーマットの共通点と特異点を分析する。
本稿では,表現学習と下流アプリケーションレベルの両方から,マルチモーダル学習に関する既存の文献を考察する。
論文 参考訳(メタデータ) (2022-10-05T13:14:57Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z) - Visual Exploration and Knowledge Discovery from Biomedical Dark Data [0.0]
我々は、バイオメディカルダークデータから知識を発見するために、自然言語処理ベースのパイプラインを使用している。
我々は、膨大な量の情報を解析する問題を克服する潜在的な解決策を得ることを目的としている。
論文 参考訳(メタデータ) (2020-09-28T04:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。