論文の概要: Cyber-Security Knowledge Graph Generation by Hierarchical Nonnegative Matrix Factorization
- arxiv url: http://arxiv.org/abs/2403.16222v1
- Date: Sun, 24 Mar 2024 16:30:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:56:25.767780
- Title: Cyber-Security Knowledge Graph Generation by Hierarchical Nonnegative Matrix Factorization
- Title(参考訳): 階層的非負行列分解によるサイバーセキュリティ知識グラフ生成
- Authors: Ryan Barron, Maksim E. Eren, Manish Bhattarai, Nicholas Solovyev, Kim Rasmussen, Boian S. Alexandrov, Charles Nicholas, Cynthia Matuszek,
- Abstract要約: サイバーセキュリティに関する人間の知識の多くは、増え続ける科学論文の中にカプセル化されている。
知識グラフ(KG)は、事実情報を構造化された方法で保存する手段として機能する。
科学文献からKGを構築する際の課題の1つは、構造化されていないテキストからオントロジーを抽出することである。
- 参考スコア(独自算出の注目度): 8.43026360224429
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Much of human knowledge in cybersecurity is encapsulated within the ever-growing volume of scientific papers. As this textual data continues to expand, the importance of document organization methods becomes increasingly crucial for extracting actionable insights hidden within large text datasets. Knowledge Graphs (KGs) serve as a means to store factual information in a structured manner, providing explicit, interpretable knowledge that includes domain-specific information from the cybersecurity scientific literature. One of the challenges in constructing a KG from scientific literature is the extraction of ontology from unstructured text. In this paper, we address this topic and introduce a method for building a multi-modal KG by extracting structured ontology from scientific papers. We demonstrate this concept in the cybersecurity domain. One modality of the KG represents observable information from the papers, such as the categories in which they were published or the authors. The second modality uncovers latent (hidden) patterns of text extracted through hierarchical and semantic non-negative matrix factorization (NMF), such as named entities, topics or clusters, and keywords. We illustrate this concept by consolidating more than two million scientific papers uploaded to arXiv into the cyber-domain, using hierarchical and semantic NMF, and by building a cyber-domain-specific KG.
- Abstract(参考訳): サイバーセキュリティに関する人間の知識の多くは、増え続ける科学論文の中にカプセル化されている。
このテキストデータの拡大が進むにつれて、大規模なテキストデータセットに隠された実行可能な洞察を抽出する上で、ドキュメント組織手法の重要性がますます重要になっている。
知識グラフ(英: Knowledge Graphs、略称:KG)は、知識グラフ(英: Knowledge Graphs、略称:KG)は、知識グラフ(英: Knowledge Graphs、略称:KG)とは、知識グラフ(英: Knowledge Graphs、略称:KG)と、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG)、知識グラフ(英:KG
科学文献からKGを構築する際の課題の1つは、構造化されていないテキストからオントロジーを抽出することである。
本稿では, 論文から構造オントロジーを抽出し, マルチモーダルKGを構築する手法を提案する。
我々はこの概念をサイバーセキュリティ領域で実証する。
KGの1つのモダリティは、出版されたカテゴリや著者などの論文から得られる観測可能な情報を表している。
第2のモダリティは、名前付きエンティティ、トピック、クラスタ、キーワードなどの階層的および意味論的非負の行列分解(NMF)によって抽出されたテキストの潜在(隠れ)パターンを明らかにする。
我々は、arXivにアップロードされた200万件以上の科学論文をサイバードメインに集約し、階層的および意味的なNMFを使用して、サイバードメイン固有のKGを構築することで、この概念を説明する。
関連論文リスト
- Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文 参考訳(メタデータ) (2024-10-22T14:30:40Z) - Domain Adaptation for Large-Vocabulary Object Detectors [103.16365373806829]
本稿では,CLIPにおける暗黙的知識グラフ(KG)を利用した知識グラフ蒸留手法であるKGDについて述べる。
複数の広く採用されている検出ベンチマークに対する実験により、KGDは最先端技術よりも大きなマージンで一貫して優れていることが示された。
論文 参考訳(メタデータ) (2024-01-13T03:51:18Z) - Object Recognition from Scientific Document based on Compartment Refinement Framework [2.699900017799093]
膨大な資源から貴重な情報を効率的に抽出することがますます重要になっている。
科学文書の現在のデータ抽出方法は、ルールベース(RB)または機械学習(ML)アプローチを用いるのが一般的である。
我々はCTBR(Compartment & Text Blocks Refinement)と呼ばれる新しい文書レイアウト分析フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T15:36:49Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - SKG: A Versatile Information Retrieval and Analysis Framework for
Academic Papers with Semantic Knowledge Graphs [9.668240269886413]
本稿では,抽象概念やメタ情報から意味概念を統合してコーパスを表現するセマンティック知識グラフを提案する。
SKGは、高い多様性と豊富な情報コンテンツが格納されているため、学術文献における様々なセマンティッククエリをサポートすることができる。
論文 参考訳(メタデータ) (2023-06-07T20:16:08Z) - Semantic Similarity Measure of Natural Language Text through Machine
Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study
Using UCGIS GIS&T Body of Knowledge [2.4909170697740968]
GIS&T Body of Knowledge (BoK)は、地理空間的トピックを定義し、開発し、文書化するためのコミュニティ主導の取り組みである。
本研究は,テキストから意味を抽出する上で,複数自然言語処理(NLP)技術の有効性を評価する。
また、科学出版物を分析するための機械学習技術の使用について、新たな視点を提供する。
論文 参考訳(メタデータ) (2023-05-17T01:17:57Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Multi-Document Scientific Summarization from a Knowledge Graph-Centric
View [9.579482432715261]
符号化処理と復号処理の両方において知識グラフを中心としたMDSSモデルであるKGSumを提案する。
具体的には、2つのグラフベースのモジュールが、知識グラフ情報を紙のエンコーディングに組み込むように提案されている。
復号処理では,まず要約の知識グラフ情報を記述文形式で生成し,次に最終要約を生成する2段復号器を提案する。
論文 参考訳(メタデータ) (2022-09-09T14:20:59Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Knowledge Graph Augmented Network Towards Multiview Representation
Learning for Aspect-based Sentiment Analysis [96.53859361560505]
本稿では,知識グラフ拡張ネットワーク(KGAN)を提案する。
KGANは感情の特徴表現を、文脈、構文、知識に基づく複数の視点から捉えている。
3つの人気のあるABSAベンチマークの実験は、我々のKGANの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-01-13T08:25:53Z) - Relational Learning Analysis of Social Politics using Knowledge Graph
Embedding [11.978556412301975]
本稿では,新しい信頼性ドメインベースのKG埋め込みフレームワークを提案する。
ヘテロジニアスリソースから得られたデータの融合を、ドメインによって表現された正式なKG表現にキャプチャする。
このフレームワークは、データ品質と信頼性を保証するための信頼性モジュールも具体化している。
論文 参考訳(メタデータ) (2020-06-02T14:10:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。