論文の概要: SentimentArcs: A Novel Method for Self-Supervised Sentiment Analysis of
Time Series Shows SOTA Transformers Can Struggle Finding Narrative Arcs
- arxiv url: http://arxiv.org/abs/2110.09454v1
- Date: Mon, 18 Oct 2021 16:45:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 14:10:31.348779
- Title: SentimentArcs: A Novel Method for Self-Supervised Sentiment Analysis of
Time Series Shows SOTA Transformers Can Struggle Finding Narrative Arcs
- Title(参考訳): sentimentarcs: sotaトランスフォーマーがナラティブアークを見つけるのに苦労する時系列の自己教師付き感情分析法
- Authors: Jon Chun
- Abstract要約: 本稿では,新たな自己教師型時系列感情分析手法であるSentimentArcsを紹介する。
多様なモデルの大規模なアンサンブルは、自己教師付き学習のための合成基底真理を提供する。
単純な視覚化は物語の時間構造を利用するので、ドメインの専門家はすぐにトレンドを見つけることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SOTA Transformer and DNN short text sentiment classifiers report over 97%
accuracy on narrow domains like IMDB movie reviews. Real-world performance is
significantly lower because traditional models overfit benchmarks and
generalize poorly to different or more open domain texts. This paper introduces
SentimentArcs, a new self-supervised time series sentiment analysis methodology
that addresses the two main limitations of traditional supervised sentiment
analysis: limited labeled training datasets and poor generalization. A large
ensemble of diverse models provides a synthetic ground truth for
self-supervised learning. Novel metrics jointly optimize an exhaustive search
across every possible corpus:model combination. The joint optimization over
both the corpus and model solves the generalization problem. Simple
visualizations exploit the temporal structure in narratives so domain experts
can quickly spot trends, identify key features, and note anomalies over
hundreds of arcs and millions of data points. To our knowledge, this is the
first self-supervised method for time series sentiment analysis and the largest
survey directly comparing real-world model performance on long-form narratives.
- Abstract(参考訳): SOTA TransformerとDNNの短いテキスト感情分類器はIMDBの映画レビューのような狭い領域で97%の精度を報告している。
従来のモデルがベンチマークを過小評価し、異なるまたはそれ以上のオープンドメインテキストに一般化するため、実世界のパフォーマンスは大幅に低下する。
本稿では、従来の教師付き感情分析の主な2つの制約、限定ラベル付きトレーニングデータセットと低一般化に対処する、新しい自己教師付き時系列感情分析手法であるSentimentArcsを紹介する。
多様なモデルの大規模なアンサンブルは、自己教師付き学習のための合成基底真理を提供する。
新しいメトリクスは、すべての可能なコーパスをまたいで徹底的な検索を共同で最適化する:モデルの組み合わせ。
コーパスとモデルの両方に対する共同最適化は一般化問題を解く。
単純な視覚化は物語の時間構造を利用するので、ドメインの専門家はトレンドを素早く見つけ、重要な特徴を特定し、数百の弧と数百万のデータポイントの異常に注意する。
我々の知る限り、これは時系列感情分析のための初めての自己指導的手法であり、長文物語における実世界のモデルパフォーマンスを直接比較した最大の調査である。
関連論文リスト
- Long-Span Question-Answering: Automatic Question Generation and QA-System Ranking via Side-by-Side Evaluation [65.16137964758612]
大規模言語モデルにおける長文文の活用について検討し,本書全体の読解データを作成する。
我々の目的は、長いテキストの詳細な理解を必要とする問題を分析し、理解し、推論するLLMの能力をテストすることである。
論文 参考訳(メタデータ) (2024-05-31T20:15:10Z) - Time Series Representation Models [2.724184832774005]
時系列解析は、そのスパース特性、高次元性、一貫性のないデータ品質のため、依然として大きな課題である。
近年のトランス技術の発展により,予測や計算能力が向上している。
イントロスペクションに基づく時系列解析のための新しいアーキテクチャ概念を提案する。
論文 参考訳(メタデータ) (2024-05-28T13:25:31Z) - TOTEM: TOkenized Time Series EMbeddings for General Time Series Analysis [32.854449155765344]
本稿では,自己教師型で学習した離散ベクトル化表現を用いて,様々な領域からの時系列データを埋め込んだ簡易なトークン化アーキテクチャを提案する。
3つのタスクにわたる17のリアルタイム時系列データセットに対して,TOTEMの有効性を広範囲に評価して検討した。
論文 参考訳(メタデータ) (2024-02-26T09:11:12Z) - Towards Debiasing Frame Length Bias in Text-Video Retrieval via Causal
Intervention [72.12974259966592]
トリミングビデオクリップのトレーニングセットとテストセットのフレーム長差による時間偏差について,一意かつ体系的に検討した。
Epic-Kitchens-100, YouCook2, MSR-VTTデータセットについて, 因果脱バイアス法を提案し, 広範な実験およびアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-09-17T15:58:27Z) - Preserving Knowledge Invariance: Rethinking Robustness Evaluation of
Open Information Extraction [50.62245481416744]
実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。
我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。
さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文 参考訳(メタデータ) (2023-05-23T12:05:09Z) - When Neural Networks Fail to Generalize? A Model Sensitivity Perspective [82.36758565781153]
ドメイン一般化 (Domain Generalization, DG) は、異なる分布の下で見えないドメインでうまく機能するようにモデルを訓練することを目的としている。
本稿では,より現実的で,より困難なシナリオである単一領域一般化(Single-DG)について考察する。
我々は「モデル感度」と命名する一般化と強く相関するモデルの性質を経験的に確認する。
本稿では、高感度の周波数をターゲットとした拡張画像を生成するために、スペクトル逆データ拡張(SADA)の新たな戦略を提案する。
論文 参考訳(メタデータ) (2022-12-01T20:15:15Z) - Ensemble Creation via Anchored Regularization for Unsupervised Aspect
Extraction [1.8591803874887636]
教師なしのアスペクトベースの感情分析により、ラベルの生成に時間や資金を投資することなく洞察を生成できる。
我々が改善したモデルの1つは、文をその中に存在するアスペクト項の線形結合として再構成するABAEである。
本研究では、他の教師なしモデルからの情報をABAEの正規化に活用し、パフォーマンスを向上させる方法について検討する。
論文 参考訳(メタデータ) (2022-10-13T08:23:56Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Using Human Psychophysics to Evaluate Generalization in Scene Text
Recognition Models [7.294729862905325]
我々は2つの重要なシーンテキスト認識モデルを,その領域を計測することで特徴付ける。
ドメインは、読み手が様々な単語の長さ、フォント、閉塞量に一般化する能力を指定する。
論文 参考訳(メタデータ) (2020-06-30T19:51:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。