論文の概要: Inductive Document Network Embedding with Topic-Word Attention
- arxiv url: http://arxiv.org/abs/2001.03369v1
- Date: Fri, 10 Jan 2020 10:14:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 22:38:01.672658
- Title: Inductive Document Network Embedding with Topic-Word Attention
- Title(参考訳): トピックワードに着目したインダクティブ・ドキュメント・ネットワーク埋め込み
- Authors: Robin Brochier, Adrien Guille and Julien Velcin
- Abstract要約: 文書ネットワークの埋め込みは、文書が相互にリンクされているとき、構造化されたテキストコーパスの表現を学習することを目的としている。
近年のアルゴリズムでは、ノードに関連付けられたテキストコンテンツを定式化に組み込むことで、ネットワーク埋め込みアプローチを拡張している。
本稿では,解釈可能かつインダクティブな文書ネットワークの埋め込み手法を提案する。
- 参考スコア(独自算出の注目度): 5.8010446129208155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document network embedding aims at learning representations for a structured
text corpus i.e. when documents are linked to each other. Recent algorithms
extend network embedding approaches by incorporating the text content
associated with the nodes in their formulations. In most cases, it is hard to
interpret the learned representations. Moreover, little importance is given to
the generalization to new documents that are not observed within the network.
In this paper, we propose an interpretable and inductive document network
embedding method. We introduce a novel mechanism, the Topic-Word Attention
(TWA), that generates document representations based on the interplay between
word and topic representations. We train these word and topic vectors through
our general model, Inductive Document Network Embedding (IDNE), by leveraging
the connections in the document network. Quantitative evaluations show that our
approach achieves state-of-the-art performance on various networks and we
qualitatively show that our model produces meaningful and interpretable
representations of the words, topics and documents.
- Abstract(参考訳): document network embeddedは、構造化されたテキストコーパスの表現を学習することを目的としている。
最近のアルゴリズムは、ノードに関連付けられたテキストコンテンツを定式化することで、ネットワーク埋め込みアプローチを拡張する。
ほとんどの場合、学習した表現を解釈することは困難である。
また,ネットワーク内では観測されない新しい文書の一般化にはほとんど重要でない。
本稿では,解釈可能かつインダクティブな文書ネットワークの埋め込み手法を提案する。
本稿では,単語と話題表現の相互作用に基づいて文書表現を生成する新しいメカニズムであるトピックワード注意(TWA)を紹介する。
我々は、ドキュメントネットワークの接続を利用して、これらの単語とトピックベクトルを一般モデルであるインダクティブドキュメントネットワーク埋め込み(IDNE)を通して訓練する。
定量的評価により,提案手法は様々なネットワーク上での最先端性能を実現し,そのモデルが意味的かつ解釈可能な単語,話題,文書の表現を生成することを示す。
関連論文リスト
- Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。
具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文 参考訳(メタデータ) (2024-10-03T17:49:09Z) - Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。
UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。
UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文 参考訳(メタデータ) (2022-04-22T21:47:04Z) - NetReAct: Interactive Learning for Network Summarization [60.18513812680714]
本論文では,テキストコーポラによる感覚生成のネットワーク可視化を支援する,新しいインタラクティブネットワーク要約アルゴリズムであるNetReActを提案する。
netreactが、他の非自明なベースラインよりも、隠れたパターンを明らかにする高品質な要約や視覚化の生成に成功していることを示す。
論文 参考訳(メタデータ) (2020-12-22T03:56:26Z) - Adversarial Context Aware Network Embeddings for Textual Networks [8.680676599607123]
既存のアプローチでは、接続ノードの埋め込みを同様のものにすることで、テキストとネットワーク構造の埋め込みを学習する。
これは、これらのアプローチが埋め込みを学ぶためにエッジ情報を必要としており、目に見えないノードの埋め込みを学ぶことができないことを意味している。
本稿では,モダリティ融合と未確認ノードの埋め込みを学習する能力の両方を実現するアプローチを提案する。
論文 参考訳(メタデータ) (2020-11-05T05:20:01Z) - Multilevel Text Alignment with Cross-Document Attention [59.76351805607481]
既存のアライメントメソッドは、1つの事前定義されたレベルで動作します。
本稿では,文書を文書間注目要素で表現するための階層的アテンションエンコーダを予め確立した新しい学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-03T02:52:28Z) - Hierarchical Interaction Networks with Rethinking Mechanism for
Document-level Sentiment Analysis [37.20068256769269]
文書レベルの感性分析(DSA)は、あいまいなセマンティックリンクと感情情報の複雑化により、より困難である。
そこで本研究では,DSAにおける対象の明示的パターンと感情文脈を用いた識別表現を効果的に生成する方法について検討する。
感性に基づく再考機構(SR)を,感情ラベル情報を用いてHINを精製し,より感情に敏感な文書表現を学習することによって設計する。
論文 参考訳(メタデータ) (2020-07-16T16:27:38Z) - Improve Document Embedding for Text Categorization Through Deep Siamese
Neural Network [2.398608007786179]
テキストの低次元表現は、効率的な自然言語処理タスクにおける主要な課題の1つである。
ベクトル空間表現において、類似したトピックを持つ文書を類似した空間にマッピングするために、ディープ・シームズニューラルネットワークの利用を提案する。
提案した表現は,本データセットのテキスト分類タスクにおいて,従来型および最先端の表現よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-05-31T17:51:08Z) - Document Network Projection in Pretrained Word Embedding Space [7.455546102930911]
本稿では,リンクされた文書の集合を事前学習した単語埋め込み空間に投影する新しい手法である正規化線形埋め込み(RLE)を提案する。
我々は相補的な情報を提供するペアワイズ類似性の行列を利用する(例えば、引用グラフ内の2つの文書のネットワーク近接)。
ドキュメント表現は、レコメンデーション、分類、クラスタリングなど、多くの情報検索タスクを解決するのに役立つ。
論文 参考訳(メタデータ) (2020-01-16T10:16:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。