論文の概要: Using virtual edges to extract keywords from texts modeled as complex
networks
- arxiv url: http://arxiv.org/abs/2205.02172v1
- Date: Wed, 4 May 2022 16:43:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 14:49:24.580646
- Title: Using virtual edges to extract keywords from texts modeled as complex
networks
- Title(参考訳): 仮想エッジを用いて複雑なネットワークとしてモデル化されたテキストからキーワードを抽出する
- Authors: Jorge A. V. Tohalino and Thiago C. Silva and Diego R. Amancio
- Abstract要約: 我々は,単語とエッジが文脈的あるいは意味的類似性によって確立されるようなテキスト共起ネットワークをモデル化した。
実際、仮想エッジを使用することで、共起ネットワークの識別性が向上することがわかった。
- 参考スコア(独自算出の注目度): 0.1611401281366893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting keywords in texts is important for many text mining applications.
Graph-based methods have been commonly used to automatically find the key
concepts in texts, however, relevant information provided by embeddings has not
been widely used to enrich the graph structure. Here we modeled texts
co-occurrence networks, where nodes are words and edges are established either
by contextual or semantical similarity. We compared two embedding approaches --
Word2vec and BERT -- to check whether edges created via word embeddings can
improve the quality of the keyword extraction method. We found that, in fact,
the use of virtual edges can improve the discriminability of co-occurrence
networks. The best performance was obtained when we considered low percentages
of addition of virtual (embedding) edges. A comparative analysis of structural
and dynamical network metrics revealed the degree, PageRank, and accessibility
are the metrics displaying the best performance in the model enriched with
virtual edges.
- Abstract(参考訳): テキスト中のキーワードを検出することは、多くのテキストマイニングアプリケーションにとって重要である。
グラフベースの手法はテキスト中の重要な概念を自動的に見つけるために一般的に用いられてきたが、埋め込みによって提供される関連情報はグラフ構造を強化するために広く使われていない。
ここでは,ノードが単語であり,エッジが文脈的あるいは意味的類似性によって確立されるテキスト共起ネットワークをモデル化する。
単語埋め込みによって生成されたエッジがキーワード抽出法の品質を向上させるかどうかを確認するために,Word2vecとBERTの2つの埋め込み手法を比較した。
実際、仮想エッジを使用することで、共起ネットワークの識別性が向上することがわかった。
仮想(埋め込み)エッジの追加率の低さを考慮すると,最高の性能が得られる。
構造的および動的ネットワークメトリクスの比較分析により、仮想エッジに富んだモデルにおける最高のパフォーマンスを示す指標として、PageRank、アクセシビリティが明らかになった。
関連論文リスト
- Probing the statistical properties of enriched co-occurrence networks [0.0]
本研究では,テキストベースネットワークモデルの2つの重要な統計特性について検討する。
仮想エッジを組み込むと、特定のネットワークメトリックによって正および負の効果が得られることを示す。
私たちの結果は、特定のアプリケーションに最も適したネットワークメトリクスを決定するためのガイドラインとして役立ちます。
論文 参考訳(メタデータ) (2024-12-03T18:38:14Z) - Attention based End to end network for Offline Writer Identification on Word level data [3.5829161769306244]
注意駆動型畳み込みニューラルネットワーク(CNN)に基づく著者識別システムを提案する。
このシステムは、単語画像から抽出された断片として知られる画像セグメントを利用して、ピラミッドベースの戦略を用いて訓練されている。
提案アルゴリズムの有効性を3つのベンチマークデータベースで評価した。
論文 参考訳(メタデータ) (2024-04-11T09:41:14Z) - ESTextSpotter: Towards Better Scene Text Spotting with Explicit Synergy
in Transformer [88.61312640540902]
明示的な構文に基づくテキストスポッティング変換フレームワーク(ESTextSpotter)を紹介する。
本モデルは,1つのデコーダ内におけるテキスト検出と認識のための識別的,インタラクティブな特徴をモデル化することにより,明示的な相乗効果を実現する。
実験結果から,本モデルが従来の最先端手法よりも有意に優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-08-20T03:22:23Z) - Edgeformers: Graph-Empowered Transformers for Representation Learning on
Textual-Edge Networks [30.49672654211631]
Edgeformersは、エッジおよびノード表現学習を実行するグラフ強化トランスフォーマー上に構築されたフレームワークである。
エッジの分類とリンク予測において,Edgeformerは一貫して最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2023-02-21T23:09:17Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - Adversarial Context Aware Network Embeddings for Textual Networks [8.680676599607123]
既存のアプローチでは、接続ノードの埋め込みを同様のものにすることで、テキストとネットワーク構造の埋め込みを学習する。
これは、これらのアプローチが埋め込みを学ぶためにエッジ情報を必要としており、目に見えないノードの埋め込みを学ぶことができないことを意味している。
本稿では,モダリティ融合と未確認ノードの埋め込みを学習する能力の両方を実現するアプローチを提案する。
論文 参考訳(メタデータ) (2020-11-05T05:20:01Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Improving Image Captioning with Better Use of Captions [65.39641077768488]
本稿では,画像表現とキャプション生成の両方を強化するために,キャプションで利用可能なセマンティクスをよりよく探求するための新しい画像キャプションアーキテクチャを提案する。
我々のモデルはまず,弱教師付きマルチインスタンス学習を用いて,有益な帰納バイアスをもたらすキャプション誘導型視覚関係グラフを構築した。
生成期間中、このモデルは、単語とオブジェクト/述語タグのシーケンスを共同で予測するために、マルチタスク学習を用いた視覚関係をさらに取り入れる。
論文 参考訳(メタデータ) (2020-06-21T14:10:47Z) - Using word embeddings to improve the discriminability of co-occurrence
text networks [0.1611401281366893]
共起ネットワークにおける仮想リンク作成ツールとしての単語埋め込みの利用により,分類システムの品質が向上するかどうかを検討する。
その結果,Glove,Word2Vec,FastTextでは,スタイメトリータスクの識別性が向上していることがわかった。
論文 参考訳(メタデータ) (2020-03-13T13:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。