論文の概要: Extracting and Validating Explanatory Word Archipelagoes using Dual Entropy
- arxiv url: http://arxiv.org/abs/2002.09581v2
- Date: Sat, 28 Sep 2024 02:27:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-03 15:17:36.388983
- Title: Extracting and Validating Explanatory Word Archipelagoes using Dual Entropy
- Title(参考訳): 二重エントロピーを用いた説明語列の抽出と検証
- Authors: Yukio Ohsawa,
- Abstract要約: テキストの論理接続は、アーカイブを形成する単語の接続によって表現されます。
エントロピーAの共変分を用いて、対象テキストに匹敵する長さの列島を抽出する。
その結果, エントロピーAで抽出した単語を対象とするテキストの一部が, 学習や準備の必要なく, 文章の解説部分を形成していることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The logical connectivity of text is represented by the connectivity of words that form archipelagoes. Here, each archipelago is a sequence of islands of the occurrences of a certain word. An island here means the local sequence of sentences where the word is emphasized, and an archipelago of a length comparable to the target text is extracted using the co-variation of entropy A (the window-based entropy) on the distribution of the word's occurrences with the width of each time window. Then, the logical connectivity of text is evaluated on entropy B (the graph-based entropy) computed on the distribution of sentences to connected word-clusters obtained on the co-occurrence of words. The results show the parts of the target text with words forming archipelagoes extracted on entropy A, without learned or prepared knowledge, form an explanatory part of the text that is of smaller entropy B than the parts extracted by the baseline methods.
- Abstract(参考訳): テキストの論理接続は、列島を形成する単語の接続によって表される。
ここでは、各列島は特定の単語の発生の列島である。
ここでは、単語が強調される文の局所的な列を意味し、各時間ウィンドウの幅で単語の発生の分布に関するエントロピーA(ウィンドウベースのエントロピー)の共変分を用いて、対象テキストに匹敵する長さの列を抽出する。
そして、文の分布に基づいて計算されたエントロピーB(グラフベースのエントロピー)に基づいて、単語の共起に基づいて得られた連結語クラスタに対するテキストの論理接続性を評価する。
その結果, 対象のテキストの一部に, エントロピーAで抽出した単語と, 学習あるいは準備された知識を伴わずに, ベースライン法で抽出した単語よりも小さいエントロピーBの説明部分を形成することがわかった。
関連論文リスト
- EntropyRank: Unsupervised Keyphrase Extraction via Side-Information
Optimization for Language Model-based Text Compression [62.261476176242724]
本稿では,事前学習言語モデル(LM)とシャノンの情報に基づいて,テキストからキーワードやキーワードを抽出する教師なし手法を提案する。
具体的には,LMの条件エントロピーが最も高い句を抽出する。
論文 参考訳(メタデータ) (2023-08-25T14:23:40Z) - Unsupervised extraction of local and global keywords from a single text [0.0]
テキストからキーワードを抽出する非教師付きコーパス非依存手法を提案する。
それは、単語の空間分布と、単語のランダムな置換に対するこの分布の応答に基づいている。
論文 参考訳(メタデータ) (2023-07-26T07:36:25Z) - SPINDLE: Spinning Raw Text into Lambda Terms with Graph Attention [0.8379286663107844]
モジュールは、原文入力をラムダ項で表現された意味合成のためのプログラムに変換する。
その出力は多モーダル型論理文法の階層的導出から成り立っている。
論文 参考訳(メタデータ) (2023-02-23T14:22:45Z) - Customized determination of stop words using Random Matrix Theory
approach [0.0]
単語単位で計算された単語間の距離を研究し、ランダム行列理論(RMT)の分布と比較する。
一組のテキストで与えられた単語間の距離は混合ダイナミクスを示し、規則的およびカオス的体制が共存する。
我々は、単語に基づく任意の言語におけるテキストの停止単語のカスタマイズセットの作成に使用できる、完全に無依存なレシピを定式化する。
論文 参考訳(メタデータ) (2021-04-17T20:42:28Z) - Match-Ignition: Plugging PageRank into Transformer for Long-form Text
Matching [66.71886789848472]
実効性と効率性に対処する新しい階層型ノイズフィルタリングモデルであるMatch-Ignitionを提案する。
基本的なアイデアは、よく知られたPageRankアルゴリズムをTransformerに接続し、文と単語レベルの騒々しい情報を識別およびフィルタリングすることです。
文が長文の基本単位であるため、ノイズの多い文はたいてい簡単に検出できるので、PageRankを直接使用してそのような情報をフィルタリングする。
論文 参考訳(メタデータ) (2021-01-16T10:34:03Z) - SemGloVe: Semantic Co-occurrences for GloVe from BERT [55.420035541274444]
GloVeは単語共起行列からの統計情報を利用して単語埋め込みを学ぶ。
BERTから静的なGloVeワード埋め込みに意味的共起を蒸留するSemGloVeを提案します。
論文 参考訳(メタデータ) (2020-12-30T15:38:26Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。