論文の概要: Block-Segmentation Vectors for Arousal Prediction using Semi-supervised
Learning
- arxiv url: http://arxiv.org/abs/2204.05096v1
- Date: Mon, 11 Apr 2022 13:55:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 15:46:07.544667
- Title: Block-Segmentation Vectors for Arousal Prediction using Semi-supervised
Learning
- Title(参考訳): 半教師付き学習による覚醒予測のためのブロックセグメンテーションベクトル
- Authors: Yuki Odaka, Ken Kaneiwa
- Abstract要約: 少数のラベル付き単語から多くのシンセットの覚醒レベルを予測するブロック分割ベクトルを提案する。
本研究では,ブロック分割ベクトルによる覚醒予測の結果が,SentiWordNetの従来の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To handle emotional expressions in computer applications, Russell's circum-
plex model has been useful for representing emotions according to valence and
arousal. In SentiWordNet, the level of valence is automatically assigned to a
large number of synsets (groups of synonyms in WordNet) using semi-supervised
learning. However, when assigning the level of arousal, the existing method
proposed for SentiWordNet reduces the accuracy of sentiment prediction. In this
paper, we propose a block-segmentation vector for predicting the arousal levels
of many synsets from a small number of labeled words using semi-supervised
learning. We analyze the distribution of arousal and non-arousal words in a
corpus of sentences by comparing it with the distribution of valence words. We
address the problem that arousal level prediction fails when arousal and
non-arousal words are mixed together in some sentences. To capture the features
of such arousal and non-arousal words, we generate word vectors based on
inverted indexes by block IDs, where the corpus is divided into blocks in the
flow of sentences. In the evaluation experiment, we show that the results of
arousal prediction with the block-segmentation vectors outperform the results
of the previous method in SentiWordNet.
- Abstract(参考訳): コンピュータアプリケーションにおける感情表現を扱うため、ラッセルの周辺モデルは原子価や覚醒に応じて感情を表現するのに有用である。
SentiWordNetでは、価度は半教師付き学習を用いて多数のシンセセット(WordNetの同義語群)に自動的に割り当てられる。
しかし、刺激レベルを割り当てると、SentiWordNetに提案されている既存の手法は感情予測の精度を低下させる。
本稿では,半教師付き学習を用いて,少数のラベル付き単語から多数のシンセットの覚醒レベルを予測するブロック分割ベクトルを提案する。
文のコーパスにおける発声語と非発声語の分布をヴァレンス語の分布と比較して解析する。
発声語と非発声語が混ざり合わさった場合には発声レベル予測が失敗するという問題に対処する。
このような発声語と非発声語の特徴を捉えるために、コーパスを文の流れのブロックに分割するブロックidにより、逆インデックスに基づく単語ベクトルを生成する。
評価実験では,ブロックセグメンテーションベクトルを用いた覚醒予測の結果がSentiWordNetの従来の手法よりも優れていることを示す。
関連論文リスト
- An Evaluation of Sindhi Word Embedding in Semantic Analogies and Downstream Tasks [2.3624125155742064]
我々は,複数のWebリソースから6100万以上の単語をクロールする新しい単語埋め込み型コーパスを提案する。
クロールデータから不要なテキストをフィルタリングするための前処理パイプラインを設計する。
クリーニングされた語彙は、最先端の連続バグ・オブ・ワード、スキップグラム、GloVeワード埋め込みアルゴリズムに供給される。
論文 参考訳(メタデータ) (2024-08-28T11:36:29Z) - Tsetlin Machine Embedding: Representing Words Using Logical Expressions [10.825099126920028]
本稿では,論理節を自己教師する自動エンコーダについて紹介する。
節は、"black"、"cup"、"hot"のような文脈的な単語からなり、"coffee"のような他の単語を定義する。
我々は,GLoVeを6つの分類タスクで上回り,いくつかの内在的および外在的ベンチマークに対する埋め込み手法の評価を行った。
論文 参考訳(メタデータ) (2023-01-02T15:02:45Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Perturbing Inputs for Fragile Interpretations in Deep Natural Language
Processing [18.91129968022831]
解釈可能性の手法は、医療や金融などの高い分野における信頼できるNLPアプリケーションにとって堅牢である必要がある。
本稿では,入力テキスト上で単純な単語摂動を行うことで,解釈がどのように操作できるかを示す。
論文 参考訳(メタデータ) (2021-08-11T02:07:21Z) - Extracting Grammars from a Neural Network Parser for Anomaly Detection
in Unknown Formats [79.6676793507792]
強化学習は、ある未知のフォーマットで文を解析するために、人工知能を訓練する技術として、最近約束されている。
本稿では、ニューラルネットワークから生成規則を抽出し、これらの規則を用いて、ある文が名目か異常かを決定する手順を提案する。
論文 参考訳(メタデータ) (2021-07-30T23:10:24Z) - Enhanced Aspect-Based Sentiment Analysis Models with Progressive
Self-supervised Attention Learning [103.0064298630794]
アスペクトベース感情分析(absa)では、多くのニューラルモデルに感情予測に対する各文脈単語の寄与を定量化するための注意機構が備わっている。
注目ABSAモデルに対する自己監督型注意学習の進歩的アプローチを提案する。
提案手法を3つの最先端の神経ABSAモデルに統合する。
論文 参考訳(メタデータ) (2021-03-05T02:50:05Z) - Deep learning models for representing out-of-vocabulary words [1.4502611532302039]
本稿では,語彙外(OOV)単語を表現するためのディープラーニングモデルの性能評価を行う。
OOV単語を扱うための最善のテクニックはタスクごとに異なるが、OV単語のコンテキストと形態構造に基づいて埋め込みを推論する深層学習手法であるComickは、有望な結果を得た。
論文 参考訳(メタデータ) (2020-07-14T19:31:25Z) - Measuring Memorization Effect in Word-Level Neural Networks Probing [0.9156064716689833]
そこで,本研究では,学習における目に見える単語と見えない単語の対称選択に基づいて,記憶効果を簡易に測定する手法を提案する。
提案手法は, 探索装置で発生した記憶量の定量化に有効であり, 適切な設定が選択可能であり, 検証結果が信頼性推定値で解釈可能である。
論文 参考訳(メタデータ) (2020-06-29T14:35:42Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。