論文の概要: Using word embeddings to improve the discriminability of co-occurrence
text networks
- arxiv url: http://arxiv.org/abs/2003.06279v1
- Date: Fri, 13 Mar 2020 13:35:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 02:08:31.551478
- Title: Using word embeddings to improve the discriminability of co-occurrence
text networks
- Title(参考訳): 単語埋め込みを用いた共起テキストネットワークの識別性向上
- Authors: Laura V. C. Quispe and Jorge A. V. Tohalino and Diego R. Amancio
- Abstract要約: 共起ネットワークにおける仮想リンク作成ツールとしての単語埋め込みの利用により,分類システムの品質が向上するかどうかを検討する。
その結果,Glove,Word2Vec,FastTextでは,スタイメトリータスクの識別性が向上していることがわかった。
- 参考スコア(独自算出の注目度): 0.1611401281366893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Word co-occurrence networks have been employed to analyze texts both in the
practical and theoretical scenarios. Despite the relative success in several
applications, traditional co-occurrence networks fail in establishing links
between similar words whenever they appear distant in the text. Here we
investigate whether the use of word embeddings as a tool to create virtual
links in co-occurrence networks may improve the quality of classification
systems. Our results revealed that the discriminability in the stylometry task
is improved when using Glove, Word2Vec and FastText. In addition, we found that
optimized results are obtained when stopwords are not disregarded and a simple
global thresholding strategy is used to establish virtual links. Because the
proposed approach is able to improve the representation of texts as complex
networks, we believe that it could be extended to study other natural language
processing tasks. Likewise, theoretical languages studies could benefit from
the adopted enriched representation of word co-occurrence networks.
- Abstract(参考訳): 単語共起ネットワークは、実用シナリオと理論シナリオの両方でテキストを分析するために用いられてきた。
いくつかのアプリケーションで比較的成功したにもかかわらず、従来の共起ネットワークは、テキストに遠くに見えるたびに類似した単語間のリンクを確立することに失敗している。
本稿では,共起ネットワークにおける仮想リンク作成ツールとしての単語埋め込みの利用により,分類システムの品質が向上するかどうかを検討する。
その結果,glove,word2vec,fasttextを用いた場合,スティロメトリータスクの判別性が向上した。
さらに,ストップワードが無視されない場合に最適化された結果が得られ,仮想リンクを確立するための簡単なグローバルしきい値設定戦略が用いられている。
提案手法は複雑なネットワークとしてテキストの表現を改善することができるため,他の自然言語処理タスクの研究にも適用できると考えている。
同様に、理論的言語の研究は、単語共起ネットワークの強化表現の恩恵を受けるかもしれない。
関連論文リスト
- ESTextSpotter: Towards Better Scene Text Spotting with Explicit Synergy
in Transformer [88.61312640540902]
明示的な構文に基づくテキストスポッティング変換フレームワーク(ESTextSpotter)を紹介する。
本モデルは,1つのデコーダ内におけるテキスト検出と認識のための識別的,インタラクティブな特徴をモデル化することにより,明示的な相乗効果を実現する。
実験結果から,本モデルが従来の最先端手法よりも有意に優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-08-20T03:22:23Z) - Topological properties and organizing principles of semantic networks [3.8462776107938317]
本研究では,11言語から7つの意味関係によって定義されたConceptNetのセマンティックネットワークの特性について検討する。
セマンティック・ネットワークには普遍的な基本的特性があり、疎らで、クラスタ化され、多くは非合法な等級分布を示す。
一部のネットワークでは接続は類似性に基づくが、他のネットワークでは接続は相補性に基づくものである。
論文 参考訳(メタデータ) (2023-04-24T11:12:21Z) - Disentangling Learnable and Memorizable Data via Contrastive Learning
for Semantic Communications [81.10703519117465]
セマンティック・レディにするために、ソースデータをアンタングルする新しい機械推論フレームワークが提案されている。
特に、データ上でインスタンスとクラスタの識別を行う新しいコントラスト学習フレームワークが提案されている。
信頼度の高い深いセマンティッククラスタは、学習可能でセマンティックリッチなデータだと考えられている。
シミュレーションの結果は, セマンティック・インパクトとミニマリズムの観点から, コントラスト学習アプローチの優位性を示した。
論文 参考訳(メタデータ) (2022-12-18T12:00:12Z) - Less Data, More Knowledge: Building Next Generation Semantic
Communication Networks [180.82142885410238]
本稿では、スケーラブルなエンドツーエンドセマンティック通信ネットワークの最初の厳密なビジョンを示す。
まず、セマンティック・コミュニケーション・ネットワークの設計は、データ駆動型ネットワークから知識駆動型ネットワークへどのように移行する必要があるかについて議論する。
意味表現と言語を用いることで、従来の送信機と受信機が教師と見習いになることを示す。
論文 参考訳(メタデータ) (2022-11-25T19:03:25Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Using virtual edges to extract keywords from texts modeled as complex
networks [0.1611401281366893]
我々は,単語とエッジが文脈的あるいは意味的類似性によって確立されるようなテキスト共起ネットワークをモデル化した。
実際、仮想エッジを使用することで、共起ネットワークの識別性が向上することがわかった。
論文 参考訳(メタデータ) (2022-05-04T16:43:03Z) - Language Semantics Interpretation with an Interaction-based Recurrent
Neural Networks [0.0]
本稿では,新しいインフルエンススコア (I-score) と,BDA (Backward Dropping Algorithm) と呼ばれるグリージー検索アルゴリズムと,"Dagger Technique" と呼ばれる特徴工学的手法を提案する。
提案手法は,他の人気ピアと比較して81%の誤差削減率で予測性能を向上させるために適用された。
論文 参考訳(メタデータ) (2021-11-02T00:39:21Z) - Unsupervised Word Translation Pairing using Refinement based Point Set
Registration [8.568050813210823]
単語埋め込みの言語間アライメントは、言語間の知識伝達において重要な役割を果たす。
現在の教師なしのアプローチは、言語にまたがる単語埋め込み空間の幾何学的構造における類似性に依存している。
本稿では,バイリンガル単語の共有ベクトル空間への埋め込みを教師なしでマッピングするBioSpereを提案する。
論文 参考訳(メタデータ) (2020-11-26T09:51:29Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - On Vocabulary Reliance in Scene Text Recognition [79.21737876442253]
ボキャブラリ内の単語を持つ画像に対して、手法は良好に機能するが、ボキャブラリ外の単語を持つ画像にはあまり一般化しない。
私たちはこの現象を「語彙依存」と呼んでいる。
本研究では,2家族のモデルが協調的に学習できるようにするための,シンプルで効果的な相互学習戦略を提案する。
論文 参考訳(メタデータ) (2020-05-08T11:16:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。