論文の概要: From Consensus to Split Decisions: ABC-Stratified Sentiment in Holocaust Oral Histories
- arxiv url: http://arxiv.org/abs/2603.28913v1
- Date: Mon, 30 Mar 2026 18:44:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.668077
- Title: From Consensus to Split Decisions: ABC-Stratified Sentiment in Holocaust Oral Histories
- Title(参考訳): コンセンサスからスプリット・ディシジョンへ: ホロコースト・オーラル・ヒストリーにおけるABC-Stratified Sentiment
- Authors: Daban Q. Jaff,
- Abstract要約: 極性検出はドメインシフトによってかなり困難になる。
本稿では,長期ホロコースト口腔組織における感情分類器のコーパススケール診断について述べる。
- 参考スコア(独自算出の注目度): 0.2538209532048867
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Polarity detection becomes substantially more challenging under domain shift, particularly in heterogeneous, long-form narratives with complex discourse structure, such as Holocaust oral histories. This paper presents a corpus-scale diagnostic study of off-the-shelf sentiment classifiers on long-form Holocaust oral histories, using three pretrained transformer-based polarity classifiers on a corpus of 107,305 utterances and 579,013 sentences. After assembling model outputs, we introduce an agreement-based stability taxonomy (ABC) to stratify inter-model output stability. We report pairwise percent agreement, Cohen kappa, Fleiss kappa, and row-normalized confusion matrices to localize systematic disagreement. As an auxiliary descriptive signal, a T5-based emotion classifier is applied to stratified samples from each agreement stratum to compare emotion distributions across strata. The combination of multi-model label triangulation and the ABC taxonomy provides a cautious, operational framework for characterizing where and how sentiment models diverge in sensitive historical narratives. Inter-model agreement is low to moderate overall and is driven primarily by boundary decisions around neutrality.
- Abstract(参考訳): 極性検出は、特にホロコースト口頭史のような複雑な談話構造を持つ異質で長い形態の物語において、領域シフトの下でかなり困難になる。
本稿では,長大なホロコースト口腔組織におけるオフ・ザ・シェルフ感情分類器のコーパススケール診断について,約107,305発のコーパスと579,013発の文を用いた3つの事前訓練されたトランスフォーマーベース極性分類器を用いて検討した。
モデル出力を組み立てた後、モデル間出力安定性を階層化する合意に基づく安定分類法(ABC)を導入する。
系統的不一致を局所化するために,コーエン・カッパ,フライス・カッパ,および行正規化混乱行列のペアワイズ・パーセンテージの合意を報告した。
補助記述信号として、T5ベースの感情分類器が、各合意層からの成層試料に適用され、成層間の感情分布を比較する。
マルチモデルラベルの三角測量とABC分類の組み合わせは、センシティブな歴史物語において感情モデルがどのように分岐するかを特徴付けるための慎重で操作的な枠組みを提供する。
モデル間合意は全体としては低く、中立性に関する境界決定によって推進される。
関連論文リスト
- Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation [23.545262620377887]
機械学習において、「基底真理」とは、モデルの訓練と評価に使用される正しいラベルを指す。
この体系的な文献レビューは、2020年から2025年の間に発行された研究を7つの主要な会場で分析する。
論文 参考訳(メタデータ) (2026-02-11T19:45:17Z) - Assessing the quality and coherence of word embeddings after SCM-based intersectional bias mitigation [0.0]
広く使われている3つの埋め込みファミリー(Word2Vec、GloVe、ConceptNet Numberbatch)について検討する。
本稿では, 減算, 線形投射, 部分投射の3つの脱バイアス戦略について検討する。
立体型コンテンツモデルとの交叉脱バイアスは, 静的埋め込みにおいて実用的であることを示す。
論文 参考訳(メタデータ) (2026-01-07T21:03:53Z) - TOPol: Capturing and Explaining Multidimensional Semantic Polarity Fields and Vectors [0.0]
ToPolは多次元の物語の極性場を再構成し、解釈するためのフレームワークである。
このフレームワークは、Transformer-based large language model (tLLM)を使用してドキュメントを埋め込む。
我々はTOPolを2つのコーパスで評価する: (i)米国中央銀行のマクロ経済的なブレークポイントに関するスピーチ、(ii)Amazonの製品レビュー。
論文 参考訳(メタデータ) (2025-10-29T01:14:21Z) - Enhancing the Robustness of Contextual ASR to Varying Biasing Information Volumes Through Purified Semantic Correlation Joint Modeling [63.755562174967274]
クロスアテンションはバイアス情報量の変化に影響される。
そこで本研究では,PSC-Jointを用いた意味相関結合モデリング手法を提案する。
PSC-JointはAISHELL-1では21.34%、KeSpeechでは28.46%の平均的なF1スコアの改善を達成した。
論文 参考訳(メタデータ) (2025-09-07T03:46:59Z) - BIPOLAR: Polarization-based granular framework for LLM bias evaluation [0.0]
本研究では,大規模言語モデルにおける偏光関連バイアスを評価するために,再利用性,粒度,トピックに依存しないフレームワークを提案する。
我々のアプローチは、偏極感性感情メトリクスと、競合関連文の合成的に生成されたバランスの取れたデータセットを組み合わせる。
ケーススタディでは、ロシアとウクライナの戦争に焦点を当てた合成データセットを作成し、いくつかのLSMのバイアスを評価した。
論文 参考訳(メタデータ) (2025-08-14T20:44:19Z) - Divide (Text) and Conquer (Sentiment): Improved Sentiment Classification by Constituent Conflict Resolution [0.0]
本研究の目的は、対立する感情を分離し、それらの感情を効果的に予測するための新しい手法を導入することである。
集約戦略の1つは、Amazon、Twitter、SSTなど、さまざまなデータセットでベースラインモデルを上回る、Multi-Layer Perceptron(MLP)モデルである。
論文 参考訳(メタデータ) (2025-05-08T21:54:49Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - A Contrastive Cross-Channel Data Augmentation Framework for Aspect-based
Sentiment Analysis [91.83895509731144]
本稿では,感情分析の多面的課題を軽減するための新しいトレーニングフレームワークを提案する。
ソース文は、ドメイン固有のジェネレータに入力され、いくつかの合成文を取得する。
生成装置はアスペクト特化文と極性増強(PAC)を生成し、極性反転文を生成する。
我々のフレームワークは、精度とマクロF1よりも約1%向上することなく、これらのベースラインを上回ります。
論文 参考訳(メタデータ) (2022-04-16T16:05:58Z) - Discrete Variational Attention Models for Language Generation [51.88612022940496]
本稿では,言語における離散性に起因する注意機構のカテゴリー分布を考慮した離散的変動注意モデルを提案する。
離散性の特質により,提案手法の訓練は後部崩壊に支障を来さない。
論文 参考訳(メタデータ) (2020-04-21T05:49:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。