論文の概要: CompText: Visualizing, Comparing & Understanding Text Corpus
- arxiv url: http://arxiv.org/abs/2207.13771v1
- Date: Wed, 27 Jul 2022 20:04:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-29 12:23:38.364179
- Title: CompText: Visualizing, Comparing & Understanding Text Corpus
- Title(参考訳): CompText: テキストコーパスの可視化、比較、理解
- Authors: Suvi Varshney and Divjeet Singh Jas
- Abstract要約: 2つのコーパスに現れるすべての単語を比較するのではなく、感情に焦点を当てたコーパスを区別することを目的としている。
トピックのエントロピーや予期せぬ性質、偏在性も重要であると論じることができます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: A common practice in Natural Language Processing (NLP) is to visualize the
text corpus without reading through the entire literature, still grasping the
central idea and key points described. For a long time, researchers focused on
extracting topics from the text and visualizing them based on their relative
significance in the corpus. However, recently, researchers started coming up
with more complex systems that not only expose the topics of the corpus but
also word closely related to the topic to give users a holistic view. These
detailed visualizations spawned research on comparing text corpora based on
their visualization. Topics are often compared to idealize the difference
between corpora. However, to capture greater semantics from different corpora,
researchers have started to compare texts based on the sentiment of the topics
related to the text. Comparing the words carrying the most weightage, we can
get an idea about the important topics for corpus. There are multiple existing
texts comparing methods present that compare topics rather than sentiments but
we feel that focusing on sentiment-carrying words would better compare the two
corpora. Since only sentiments can explain the real feeling of the text and not
just the topic, topics without sentiments are just nouns. We aim to
differentiate the corpus with a focus on sentiment, as opposed to comparing all
the words appearing in the two corpora. The rationale behind this is, that the
two corpora do not many have identical words for side-by-side comparison, so
comparing the sentiment words gives us an idea of how the corpora are appealing
to the emotions of the reader. We can argue that the entropy or the
unexpectedness and divergence of topics should also be of importance and help
us to identify key pivot points and the importance of certain topics in the
corpus alongside relative sentiment.
- Abstract(参考訳): 自然言語処理(nlp)における一般的な実践は、文献全体を読み通さずにテキストコーパスを視覚化し、中心となる考えや要点を把握させることである。
長い間、研究者はテキストからトピックを抽出し、コーパスにおける相対的な重要性に基づいて視覚化することに重点を置いてきた。
しかし最近、研究者たちは、コーパスのトピックを公開するだけでなく、そのトピックと密接に関連する言葉をユーザに全体像を与える、より複雑なシステムを考案し始めた。
これらの詳細な可視化は、その可視化に基づいてテキストコーパスを比較する研究を生み出した。
トピックはしばしばコーパスの違いを理想化するために比較される。
しかし、異なるコーパスからより大きな意味を捉えるために、研究者はテキストに関連する話題の感情に基づいてテキストを比較し始めた。
最も重みを持つ単語を比較することで、コーパスの重要なトピックについてアイデアを得ることができます。
感情よりもトピックを比較できる既存のテキスト比較方法が複数存在するが、感情を伝達する単語に注目する方が、この2つのコーパスを比較する方がよいと感じている。
感情だけがテキストの実際の感覚を説明することができるので、感情のない話題は名詞にすぎない。
2つのコーパスに現れるすべての単語を比較するのではなく、感情に焦点を当ててコーパスを区別することを目指している。
この背景にある理屈は、両コーパスが左右比較で同じ単語を多く持たないため、感情語の比較によって、コーパスが読者の感情にどのように訴えているかがわかるということである。
トピックのエントロピーや予期しない点や相違点も重要であり、相対的な感情とともにコーパスにおける重要なピボットポイントと特定のトピックの重要性を特定するのに役立ちます。
関連論文リスト
- Entity-Level Sentiment: More than the Sum of Its Parts [13.829487868948686]
文レベルでの感情の算術的アグリゲーションとは,エンティティに対する読者の知覚的感情がしばしば異なることを示す。
我々のデータセットは、長いテキストでエンティティ固有の感情の複雑さを明らかにします。
論文 参考訳(メタデータ) (2024-07-04T13:21:07Z) - Predicting Text Preference Via Structured Comparative Reasoning [110.49560164568791]
我々は、構造化中間比較を生成することによって、テキストの嗜好を予測するプロンプト方式であるSCを導入する。
我々は、テキスト間の差異を明確に区別するためのペアワイズ整合コンパレータと一貫した比較を選択する。
要約,検索,自動評価など多種多様なNLPタスクに対する総合的な評価は,SCがテキスト優先予測における最先端性能を達成するためにLLMを装備していることを示す。
論文 参考訳(メタデータ) (2023-11-14T18:51:38Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Simple, Interpretable and Stable Method for Detecting Words with Usage
Change across Corpora [54.757845511368814]
2つの文体を比較し、その用法が異なる単語を探すという問題は、しばしばデジタル人文科学や計算社会科学において生じる。
これは一般に、各コーパスに単語の埋め込みを訓練し、ベクトル空間を整列させ、整列空間における余弦距離が大きい単語を探すことでアプローチされる。
本稿では,ベクトル空間アライメントを使わず,各単語の近傍を考慮した代替手法を提案する。
論文 参考訳(メタデータ) (2021-12-28T23:46:00Z) - Extractive and Abstractive Sentence Labelling of Sentiment-bearing
Topics [5.014332673843021]
本稿では,感傷的話題を自動的に記述文ラベルでラベル付けする問題に対処する。
この問題に対して,抽出法と抽象法という2つのアプローチを提案する。
抽象的手法は感情を含むトピックに含まれる豊富な情報を効果的に合成することができると結論付けている。
論文 参考訳(メタデータ) (2021-08-29T11:08:39Z) - TextEssence: A Tool for Interactive Analysis of Semantic Shifts Between
Corpora [14.844685568451833]
TextEssenceは、埋め込みを用いたコーポラの比較分析を可能にするインタラクティブなシステムです。
TextEssenceには、軽量なWebベースのインターフェイスに、ビジュアル、隣り合わせ、および類似性ベースの組み込み分析モードが含まれています。
論文 参考訳(メタデータ) (2021-03-19T21:26:28Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z) - BiERU: Bidirectional Emotional Recurrent Unit for Conversational
Sentiment Analysis [18.1320976106637]
会話感情分析と単文感情分析の主な違いは、文脈情報の存在である。
既存のアプローチでは、会話内の異なるパーティを区別し、コンテキスト情報をモデル化するために複雑なディープラーニング構造を採用している。
本稿では,会話感情分析のための双方向感情的反復単位という,高速でコンパクトでパラメータ効率のよい非依存フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-31T11:13:13Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z) - A Deep Neural Framework for Contextual Affect Detection [51.378225388679425]
感情を持たない短い単純なテキストは、その文脈と共に読むときに強い感情を表現することができる。
文中の単語の相互依存を学習する文脈影響検出フレームワークを提案する。
論文 参考訳(メタデータ) (2020-01-28T05:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。