論文の概要: Semantic Similarity Measure of Natural Language Text through Machine
Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study
Using UCGIS GIS&T Body of Knowledge
- arxiv url: http://arxiv.org/abs/2305.09877v1
- Date: Wed, 17 May 2023 01:17:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 18:04:15.367637
- Title: Semantic Similarity Measure of Natural Language Text through Machine
Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study
Using UCGIS GIS&T Body of Knowledge
- Title(参考訳): 機械学習とキーワード認識型クロスエンコーダ・ランキング要約器による自然言語テキストの意味的類似度測定 - UCGIS GIS&T知識を用いたケーススタディ
- Authors: Yuanyuan Tian, Wenwen Li, Sizhe Wang, Zhining Gu
- Abstract要約: GIS&T Body of Knowledge (BoK)は、地理空間的トピックを定義し、開発し、文書化するためのコミュニティ主導の取り組みである。
本研究は,テキストから意味を抽出する上で,複数自然言語処理(NLP)技術の有効性を評価する。
また、科学出版物を分析するための機械学習技術の使用について、新たな視点を提供する。
- 参考スコア(独自算出の注目度): 2.4909170697740968
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Initiated by the University Consortium of Geographic Information Science
(UCGIS), GIS&T Body of Knowledge (BoK) is a community-driven endeavor to
define, develop, and document geospatial topics related to geographic
information science and technologies (GIS&T). In recent years, GIS&T BoK has
undergone rigorous development in terms of its topic re-organization and
content updating, resulting in a new digital version of the project. While the
BoK topics provide useful materials for researchers and students to learn about
GIS, the semantic relationships among the topics, such as semantic similarity,
should also be identified so that a better and automated topic navigation can
be achieved. Currently, the related topics are either defined manually by
editors or authors, which may result in an incomplete assessment of topic
relationship. To address this challenge, our research evaluates the
effectiveness of multiple natural language processing (NLP) techniques in
extracting semantics from text, including both deep neural networks and
traditional machine learning approaches. Besides, a novel text summarization -
KACERS (Keyword-Aware Cross-Encoder-Ranking Summarizer) - is proposed to
generate a semantic summary of scientific publications. By identifying the
semantic linkages among key topics, this work provides guidance for future
development and content organization of the GIS&T BoK project. It also offers a
new perspective on the use of machine learning techniques for analyzing
scientific publications, and demonstrate the potential of KACERS summarizer in
semantic understanding of long text documents.
- Abstract(参考訳): 地理情報科学大学コンソーシアム(ucgis)によって始められたgis&t知識体(bok)は、地理情報科学および技術(gis&t)に関連する地理空間トピックを定義し、開発し、文書化するためのコミュニティ主導の取り組みである。
近年、GIS&T BoKは、トピックの再編成とコンテンツの更新に関して、厳格な発展を遂げており、プロジェクトの新しいデジタルバージョンを生み出している。
BoKトピックは、研究者や学生がGISについて学ぶ上で有用な資料を提供する一方で、意味的類似性などのトピック間の意味的関係も、より優れた自動トピックナビゲーションを実現するために識別する必要がある。
現在、関連するトピックは編集者または著者によって手動で定義されており、トピック間の関係を不完全に評価する可能性がある。
この課題に対処するため、本研究では、深層ニューラルネットワークと従来の機械学習アプローチを含むテキストから意味を抽出する上で、複数自然言語処理(NLP)技術の有効性を評価する。
また、科学出版物のセマンティック要約を生成するために、新しいテキスト要約KACERS(Keyword-Aware Cross-Encoder-Ranking Summarizer)を提案する。
主要なトピックのセマンティックリンクを識別することにより、GIS&T BoKプロジェクトの今後の開発とコンテンツ組織のためのガイダンスを提供する。
また、科学論文の分析における機械学習技術の利用に関する新たな視点を提供し、長いテキスト文書の意味理解におけるkacers summaryrの可能性を示す。
関連論文リスト
- AHAM: Adapt, Help, Ask, Model -- Harvesting LLMs for literature mining [3.8384235322772864]
本稿では、BERTopicトピックモデリングフレームワークのドメイン固有のテキストbfadaptationをガイドするAHAMの方法論とメトリクスについて述べる。
LLaMa2生成言語モデルを利用することで、ワンショット学習によるトピック定義を生成する。
トピック間の類似度評価には、言語生成および翻訳プロセスからのメトリクスを利用する。
論文 参考訳(メタデータ) (2023-12-25T18:23:03Z) - Knowledge Graphs and Pre-trained Language Models enhanced Representation Learning for Conversational Recommender Systems [58.561904356651276]
本稿では,対話型推薦システムのためのエンティティの意味理解を改善するために,知識強化型エンティティ表現学習(KERL)フレームワークを紹介する。
KERLは知識グラフと事前訓練された言語モデルを使用して、エンティティの意味的理解を改善する。
KERLはレコメンデーションとレスポンス生成の両方のタスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-12-18T06:41:23Z) - Semantic Communications for Artificial Intelligence Generated Content
(AIGC) Toward Effective Content Creation [75.73229320559996]
本稿では,AIGCとSemComの統合の概念モデルを開発する。
AIGC技術を利用した新しいフレームワークが,意味情報のためのエンコーダおよびデコーダとして提案されている。
このフレームワークは、生成されたさまざまなタイプのコンテンツ、要求される品質、活用される意味情報に適応することができる。
論文 参考訳(メタデータ) (2023-08-09T13:17:21Z) - SKG: A Versatile Information Retrieval and Analysis Framework for
Academic Papers with Semantic Knowledge Graphs [9.668240269886413]
本稿では,抽象概念やメタ情報から意味概念を統合してコーパスを表現するセマンティック知識グラフを提案する。
SKGは、高い多様性と豊富な情報コンテンツが格納されているため、学術文献における様々なセマンティッククエリをサポートすることができる。
論文 参考訳(メタデータ) (2023-06-07T20:16:08Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Knowledge Graph Augmented Network Towards Multiview Representation
Learning for Aspect-based Sentiment Analysis [96.53859361560505]
本稿では,知識グラフ拡張ネットワーク(KGAN)を提案する。
KGANは感情の特徴表現を、文脈、構文、知識に基づく複数の視点から捉えている。
3つの人気のあるABSAベンチマークの実験は、我々のKGANの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-01-13T08:25:53Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - A New Neural Search and Insights Platform for Navigating and Organizing
AI Research [56.65232007953311]
我々は、古典的なキーワード検索とニューラル検索を組み合わせた新しいプラットフォームであるAI Research Navigatorを導入し、関連する文献を発見し整理する。
本稿では,システム全体のアーキテクチャの概要と,文書分析,質問応答,検索,分析,専門家検索,レコメンデーションの構成要素について概説する。
論文 参考訳(メタデータ) (2020-10-30T19:12:25Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z) - A Sentiment-Controllable Topic-to-Essay Generator with Topic Knowledge
Graph [44.00244549852883]
トピック知識グラフ強化デコーダを用いた,新しい感性制御型トピック・ツー・エッセイ・ジェネレータを提案する。
まず、各文に対する感情を制御するために、感情情報をジェネレータに注入し、様々なエッセイを生み出す。
知識エンティティを別々に使用する既存のモデルとは異なり、我々のモデルは知識グラフ全体を扱い、より構造化され、連結されたセマンティック情報をグラフにエンコードし、より関連するエッセイを生成する。
論文 参考訳(メタデータ) (2020-10-12T08:06:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。