論文の概要: Short Text Classification via Term Graph
- arxiv url: http://arxiv.org/abs/2001.10338v1
- Date: Mon, 20 Jan 2020 04:32:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 05:12:48.375954
- Title: Short Text Classification via Term Graph
- Title(参考訳): 項グラフによる短いテキストの分類
- Authors: Wei Pang
- Abstract要約: 短いテキストはテキスト長の短さに制限されており、スパース機能の問題につながる。
本稿では,グラフネットワークと短文の強みを組み合わせたPathWalkモデルを提案する。
- 参考スコア(独自算出の注目度): 6.47243430672461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Short text classi cation is a method for classifying short sentence with
prede ned labels. However, short text is limited in shortness in text length
that leads to a challenging problem of sparse features. Most of existing
methods treat each short sentences as independently and identically distributed
(IID), local context only in the sentence itself is focused and the relational
information between sentences are lost. To overcome these limitations, we
propose a PathWalk model that combine the strength of graph networks and short
sentences to solve the sparseness of short text. Experimental results on four
different available datasets show that our PathWalk method achieves the
state-of-the-art results, demonstrating the efficiency and robustness of graph
networks for short text classification.
- Abstract(参考訳): ショートテキストクラスのカチオン(Short Text Classi cation)は、先行ラベルで短い文を分類する方法である。
しかし、短いテキストはテキスト長の短さに制限されており、スパース機能の問題につながる。
既存の方法のほとんどは、各短文を独立して、同一の分散(iid)として扱い、文自体にのみ局所的な文脈が集中し、文間の関係情報が失われる。
そこで,これらの制約を克服するために,グラフネットワークの強みと短文を組み合わせて,短文のばらばらさを解消するパスウォークモデルを提案する。
4つの異なるデータセットに対する実験結果から,我々のPathWalk法は最先端の結果を達成し,グラフネットワークの短文分類における効率性と堅牢性を示す。
関連論文リスト
- LRANet: Towards Accurate and Efficient Scene Text Detection with
Low-Rank Approximation Network [63.554061288184165]
低ランク近似に基づく新しいパラメータ化テキスト形状法を提案する。
異なるテキストの輪郭間の形状相関を探索することにより, 形状表現における一貫性, コンパクト性, 単純性, 頑健性を実現する。
我々はLRANetという名前の正確で効率的な任意の形状のテキスト検出器を実装した。
論文 参考訳(メタデータ) (2023-06-27T02:03:46Z) - Integrating Bidirectional Long Short-Term Memory with Subword Embedding
for Authorship Attribution [2.3429306644730854]
マニフォールド語に基づくスタイリスティックマーカーは、著者帰属の本質的な問題に対処するために、ディープラーニング手法でうまく使われてきた。
提案手法は,CCAT50,IMDb62,Blog50,Twitter50の公営企業における最先端手法に対して実験的に評価された。
論文 参考訳(メタデータ) (2023-06-26T11:35:47Z) - Finding Dataset Shortcuts with Grammar Induction [85.47127659108637]
我々は,NLPデータセットのショートカットの特徴付けと発見に確率文法を用いることを提案する。
具体的には、文脈自由文法を用いて文分類データセットのパターンをモデル化し、同期文脈自由文法を用いて文ペアを含むデータセットをモデル化する。
その結果得られた文法は、単純かつ高レベルの機能を含む、多くのデータセットで興味深いショートカット機能を示す。
論文 参考訳(メタデータ) (2022-10-20T19:54:11Z) - Pruned Graph Neural Network for Short Story Ordering [0.7087237546722617]
コヒーレンスを最大化する順序に文を整理することは、文の順序付けとして知られている。
そこで本研究では,文章間のエッジを生成するために,短い物語の文中心グラフを構築する手法を提案する。
また,代名詞を代名詞の代名詞に置き換えることによって,文中心性グラフの文を効果的にエンコードすることが観察された。
論文 参考訳(メタデータ) (2022-03-13T22:25:17Z) - Hierarchical Heterogeneous Graph Representation Learning for Short Text
Classification [60.233529926965836]
短文分類のためのグラフニューラルネットワーク(GNN)に基づく ShiNE と呼ばれる新しい手法を提案する。
まず,短文データセットを単語レベル成分グラフからなる階層的不均一グラフとしてモデル化する。
そして、類似した短いテキスト間の効果的なラベル伝搬を容易にするショート文書グラフを動的に学習する。
論文 参考訳(メタデータ) (2021-10-30T05:33:05Z) - Clustering and Network Analysis for the Embedding Spaces of Sentences
and Sub-Sentences [69.3939291118954]
本稿では,文とサブ文の埋め込みを対象とする包括的クラスタリングとネットワーク解析について検討する。
その結果,1つの手法が最もクラスタリング可能な埋め込みを生成することがわかった。
一般に、スパン部分文の埋め込みは、原文よりもクラスタリング特性が優れている。
論文 参考訳(メタデータ) (2021-10-02T00:47:35Z) - Narrative Incoherence Detection [76.43894977558811]
本稿では,文間セマンティック理解のための新たなアリーナとして,物語不整合検出の課題を提案する。
複数文の物語を考えると、物語の流れに意味的な矛盾があるかどうかを決定します。
論文 参考訳(メタデータ) (2020-12-21T07:18:08Z) - Unsupervised Extractive Summarization by Pre-training Hierarchical
Transformers [107.12125265675483]
教師なし抽出文書要約は、訓練中にラベル付き要約を用いることなく、文書から重要な文章を選択することを目的としている。
既存の手法は主にグラフベースで、文をノードとして、エッジの重みは文の類似性によって測定される。
教師なし抽出要約のための文のランク付けにはトランスフォーマーの注意が利用できることがわかった。
論文 参考訳(メタデータ) (2020-10-16T08:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。