論文の概要: Automatic summarisation of Instagram social network posts Combining
semantic and statistical approaches
- arxiv url: http://arxiv.org/abs/2303.07957v1
- Date: Tue, 14 Mar 2023 14:59:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-15 14:33:14.880461
- Title: Automatic summarisation of Instagram social network posts Combining
semantic and statistical approaches
- Title(参考訳): 意味と統計的アプローチを組み合わせたInstagramソーシャルネットワーク投稿の自動要約
- Authors: Kazem Taghandiki, Mohammad Hassan Ahmadi, Elnaz Rezaei Ehsan
- Abstract要約: Instagramのソーシャルネットワークから人気のテキスト投稿を適切な前処理で抽出するクローラーが開発された。
Instagram上の820の人気のテキスト投稿の観察では、提案されたシステムの精度(80%)が示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The proliferation of data and text documents such as articles, web pages,
books, social network posts, etc. on the Internet has created a fundamental
challenge in various fields of text processing under the title of "automatic
text summarisation". Manual processing and summarisation of large volumes of
textual data is a very difficult, expensive, time-consuming and impossible
process for human users. Text summarisation systems are divided into extractive
and abstract categories. In the extractive summarisation method, the final
summary of a text document is extracted from the important sentences of the
same document without any modification. In this method, it is possible to
repeat a series of sentences and to interfere with pronouns. However, in the
abstract summarisation method, the final summary of a textual document is
extracted from the meaning and significance of the sentences and words of the
same document or other documents. Many of the works carried out have used
extraction methods or abstracts to summarise the collection of web documents,
each of which has advantages and disadvantages in the results obtained in terms
of similarity or size. In this work, a crawler has been developed to extract
popular text posts from the Instagram social network with appropriate
preprocessing, and a set of extraction and abstraction algorithms have been
combined to show how each of the abstraction algorithms can be used.
Observations made on 820 popular text posts on the social network Instagram
show the accuracy (80%) of the proposed system.
- Abstract(参考訳): インターネット上の記事、webページ、書籍、ソーシャルネットワーク投稿などのデータやテキストドキュメントの普及は、「自動テキスト要約」というタイトルでテキスト処理の様々な分野において根本的な課題を生み出した。
大量のテキストデータの手作業による処理と要約は、人間ユーザにとって非常に難しく、高価で、時間がかかり、不可能である。
テキスト要約システムは抽出カテゴリーと抽象カテゴリに分けられる。
抽出要約方式では、テキスト文書の最終要約を同一文書の重要な文から変更することなく抽出する。
この方法では、一連の文を繰り返して、代名詞を干渉することができる。
しかし、抽象要約法では、同一文書又は他の文書の文章及び単語の意味及び意義から、テキスト文書の最終要約を抽出する。
研究の多くは、ウェブ文書の収集を要約するために抽出方法や要約を用いており、それぞれが類似性や大きさの点で得られた結果に長所と短所がある。
本研究では,instagramのソーシャルネットワークから人気のあるテキスト投稿を適切な前処理で抽出するためにクローラが開発され,抽出・抽象化アルゴリズムが組み合わされ,それぞれの抽象化アルゴリズムの使用方法が示されている。
Instagram上の人気テキスト投稿820件の観察では、提案システムの精度(80%)が示されている。
関連論文リスト
- Lay Text Summarisation Using Natural Language Processing: A Narrative
Literature Review [1.8899300124593648]
本研究の目的は, テキスト要約の手法を記述し, 比較することである。
私たちは82の記事をスクリーニングし、同じデータセットを使用して2020年から2021年の間に8つの関連論文を公開しました。
ハイブリッドアプローチにおける抽出的および抽象的要約法の組み合わせが最も有効であることが判明した。
論文 参考訳(メタデータ) (2023-03-24T18:30:50Z) - Graph-based Semantical Extractive Text Analysis [0.0]
本研究では,テキストの部分間の意味的類似性を組み込むことで,TextRankアルゴリズムの結果を改善する。
キーワード抽出とテキスト要約とは別に,本フレームワークに基づくトピッククラスタリングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-12-19T18:30:26Z) - TRIE++: Towards End-to-End Information Extraction from Visually Rich
Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。
テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。
フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文 参考訳(メタデータ) (2022-07-14T08:52:07Z) - A Survey on Neural Abstractive Summarization Methods and Factual
Consistency of Summarization [18.763290930749235]
要約は、サブセット(要約)を作成するために、テキストデータの集合を計算的に短縮する過程である
既存の要約法は、抽出法と抽象法という2つのタイプに大別できる。
抽出要約器は、ソース文書からテキストスニペットを明示的に選択し、抽象要約器は、ソースで広く普及している最も健全な概念を伝えるために、新しいテキストスニペットを生成する。
論文 参考訳(メタデータ) (2022-04-20T14:56:36Z) - Topic Modeling Based Extractive Text Summarization [0.0]
本稿では,潜在トピックに基づいて内容をクラスタリングすることで,テキストを要約する新しい手法を提案する。
我々は、テキスト要約へのアプローチにおいて、より使用量が少なく挑戦的なWikiHowデータセットを活用している。
論文 参考訳(メタデータ) (2021-06-29T12:28:19Z) - Automated News Summarization Using Transformers [4.932130498861987]
我々は,テキスト要約のためのトランスフォーマーアーキテクチャに基づく事前学習モデルについて,包括的に比較する。
分析と比較のために,要約や人為的な要約に使用できるテキストデータを含むBBCニュースデータセットを用いた。
論文 参考訳(メタデータ) (2021-04-23T04:22:33Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - TRIE: End-to-End Text Reading and Information Extraction for Document
Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。
テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。
提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-27T01:47:26Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。