論文の概要: The R package sentometrics to compute, aggregate and predict with
textual sentiment
- arxiv url: http://arxiv.org/abs/2110.10817v1
- Date: Wed, 20 Oct 2021 23:24:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 13:35:11.930562
- Title: The R package sentometrics to compute, aggregate and predict with
textual sentiment
- Title(参考訳): テキストの感情を計算、集約、予測するためのRパッケージセロメトリ
- Authors: David Ardia, Keven Bluteau, Samuel Borms, Kris Boudt
- Abstract要約: Rパッケージのセマンティックスを用いたテキスト感情指標の最適化について手動で紹介する。
sentometricsパッケージは、多数のテキストの感情スコアを効率的に計算し、スコアを複数の時系列に集約し、これらの時系列を使用して他の変数を予測するための直感的なフレームワークを実装している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We provide a hands-on introduction to optimized textual sentiment indexation
using the R package sentometrics. Textual sentiment analysis is increasingly
used to unlock the potential information value of textual data. The
sentometrics package implements an intuitive framework to efficiently compute
sentiment scores of numerous texts, to aggregate the scores into multiple time
series, and to use these time series to predict other variables. The workflow
of the package is illustrated with a built-in corpus of news articles from two
major U.S. journals to forecast the CBOE Volatility Index.
- Abstract(参考訳): Rパッケージのセマンティックスを用いたテキスト感情指標の最適化について手動で紹介する。
テキスト感情分析は、テキストデータの潜在的な情報価値を解き放つためにますます使われている。
sentometricsパッケージは直感的なフレームワークを実装し、多数のテキストの感情スコアを効率的に計算し、スコアを複数の時系列に集約し、これらの時系列を使って他の変数を予測する。
パッケージのワークフローは、CBOEのボラティリティ指数を予測するために、米国の主要2誌のニュース記事が組み込まれている。
関連論文リスト
- UFineBench: Towards Text-based Person Retrieval with Ultra-fine Granularity [50.91030850662369]
既存のテキストベースの人物検索データセットは、しばしば比較的粗い粒度のテキストアノテーションを持つ。
これにより、実際のシナリオにおけるクエリテキストのきめ細かいセマンティクスを理解するモデルが妨げられます。
我々は,超微細な人物検索のためにtextbfUFineBench という新しいベンチマークを作成した。
論文 参考訳(メタデータ) (2023-12-06T11:50:14Z) - Analyzing categorical time series with the R package ctsfeatures [0.0]
Rパッケージctsfeaturesは、カテゴリの時系列を分析するための便利なツールセットを提供する。
いくつかの関数の出力は、クラスタリング、分類、外れ値検出など、従来の機械学習タスクの実行に使用することができる。
論文 参考訳(メタデータ) (2023-04-24T16:16:56Z) - Text2Struct: A Machine Learning Pipeline for Mining Structured Data from
Text [4.709764624933227]
本稿では,エンドツーエンドの機械学習パイプラインであるText2Structを提案する。
テキストアノテーションスキーム、データ処理のトレーニング、機械学習の実装が含まれている。
データセットを拡張し、他の機械学習モデルを調べることで、パイプラインをさらに改善することが期待されている。
論文 参考訳(メタデータ) (2022-12-18T09:31:36Z) - SMART: Sentences as Basic Units for Text Evaluation [48.5999587529085]
本稿では,このような制約を緩和するSMARTと呼ばれる新しい指標を提案する。
文をトークンの代わりにマッチングの基本単位として扱い,ソフトマッチ候補と参照文に文マッチング関数を用いる。
この結果から,提案手法とモデルベースマッチング関数とのシステムレベルの相関は,全ての競合する指標よりも優れていた。
論文 参考訳(メタデータ) (2022-08-01T17:58:05Z) - HETFORMER: Heterogeneous Transformer with Sparse Attention for Long-Text
Extractive Summarization [57.798070356553936]
HETFORMERはトランスフォーマーをベースとした事前学習モデルであり、抽出要約のための多粒度スパースアテンションを持つ。
単一文書と複数文書の要約タスクの実験から,HETFORMERがルージュF1の最先端性能を達成することが示された。
論文 参考訳(メタデータ) (2021-10-12T22:42:31Z) - BASS: Boosting Abstractive Summarization with Unified Semantic Graph [49.48925904426591]
BASSは、統合されたセマンティックグラフに基づく抽象的な要約を促進するためのフレームワークである。
文書表現と要約生成の両方を改善するために,グラフベースのエンコーダデコーダモデルを提案する。
実験結果から,提案アーキテクチャは長期文書および複数文書要約タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2021-05-25T16:20:48Z) - On consistency scores in text data with an implementation in R [0.0]
pdfから抽出したテキストをn-gramモデルを用いて再現可能なクリーニング処理を行う。
提案手法は,従来のテキストを刺激として用いたこれらのモデルから生成された,あるいは予想されるテキストと比較する。
この過程を導くために、モデルによって期待されるテキストの割合を指す一貫性スコアの概念を紹介します。
論文 参考訳(メタデータ) (2021-01-13T17:37:07Z) - Graph-based Topic Extraction from Vector Embeddings of Text Documents:
Application to a Corpus of News Articles [0.0]
自然言語処理の強力なベクトル埋め込みと,マルチスケールグラフ分割のツールを組み合わせた,教師なしのフレームワークを提案する。
グラフベースのクラスタリングの利点を,他の一般的なクラスタリングやトピックモデリング手法とエンドツーエンド比較によって示す。
この研究は2016年の大統領選挙の際、アメリカのニュース記事のコーパスを分析して紹介された。
論文 参考訳(メタデータ) (2020-10-28T16:20:05Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。