論文の概要: Clash of the models: Comparing performance of BERT-based variants for generic news frame detection
- arxiv url: http://arxiv.org/abs/2603.26156v1
- Date: Fri, 27 Mar 2026 08:15:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.398856
- Title: Clash of the models: Comparing performance of BERT-based variants for generic news frame detection
- Title(参考訳): モデルのクラッシュ:汎用ニュースフレーム検出のためのBERTに基づく変種の性能の比較
- Authors: Vihang Jumle,
- Abstract要約: 本研究は,比較的汎用的なニュースフレーム検出を行い,BERTに基づく5つの変種の性能を比較する。
第二に、汎用ニュースフレーム検出を堅牢に行うことができる様々な微調整モデルを導入する。
第3に、スイスの選挙状況に基づいたラベル付き汎用ニュースフレームデータセットを学術コミュニティに提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Framing continues to remain one of the most extensively applied theories in political communication. Developments in computation, particularly with the introduction of transformer architecture and more so with large language models (LLMs), have naturally prompted scholars to explore various novel computational approaches, especially for deductive frame detection, in recent years. While many studies have shown that different transformer models outperform their preceding models that use bag-of-words features, the debate continues to evolve regarding how these models compare with each other on classification tasks. By placing itself at this juncture, this study makes three key contributions: First, it comparatively performs generic news frame detection and compares the performance of five BERT-based variants (BERT, RoBERTa, DeBERTa, DistilBERT and ALBERT) to add to the debate on best practices around employing computational text analysis for political communication studies. Second, it introduces various fine-tuned models capable of robustly performing generic news frame detection. Third, building upon numerous previous studies that work with US-centric data, this study provides the scholarly community with a labelled generic news frames dataset based on the Swiss electoral context that aids in testing the contextual robustness of these computational approaches to framing analysis.
- Abstract(参考訳): フレイミングは、政治的コミュニケーションにおいて最も広く適用された理論の1つであり続けている。
特にトランスフォーマーアーキテクチャの導入や大規模言語モデル(LLM)の導入により、研究者は自然に様々な新しい計算手法、特に誘引的フレーム検出を探求するようになった。
多くの研究は、異なるトランスフォーマーモデルは、単語のバッグ機能を使用する以前のモデルよりも優れていることを示したが、これらのモデルが分類タスクにおいてどのように比較されるかについては、議論が続いている。
第一に、BERTベースの5つの変種(BERT, RoBERTa, DeBERTa, DistilBERT, ALBERT)の性能を比較し、政治コミュニケーション研究に計算テキスト分析を用いる際のベストプラクティスを議論する。
第二に、汎用ニュースフレーム検出を堅牢に行うことができる様々な微調整モデルを導入する。
第三に、米国中心のデータを扱う多くの過去の研究に基づいて、この研究はスイスの選挙文脈に基づくラベル付き汎用ニュースフレームデータセットを提供し、これらの計算手法のフレーミング分析に対する文脈的堅牢性をテストするのに役立つ。
関連論文リスト
- Assessing Classical Machine Learning and Transformer-based Approaches for Detecting AI-Generated Research Text [0.0]
機械学習アプローチは、ChatGPT-3.5生成したテキストと人間のテキストを区別することができる。
DistilBERTは全体的な最高のパフォーマンスを達成し、Logistic RegressionとBERT-Customはしっかりとしたバランスの取れた代替手段を提供する。
論文 参考訳(メタデータ) (2025-09-20T04:36:21Z) - Limited Generalizability in Argument Mining: State-Of-The-Art Models Learn Datasets, Not Arguments [3.4163020595590106]
この研究は、このような最先端モデルの大規模な再評価を初めて提供する。
我々は,4つの変圧器,3つの標準,および1つの拡張を,より優れた一般化のためのコントラスト事前学習で評価した。
以上の結果から,これらのモデルは,内容語に結びついた語彙的ショートカットに依存する傾向が示唆された。
論文 参考訳(メタデータ) (2025-05-28T09:00:56Z) - BERTopic for Topic Modeling of Hindi Short Texts: A Comparative Study [1.1650821883155187]
本研究では,ヒンディー語短文のモデル化におけるBERTopicの性能について検討する。
コンテキスト埋め込みを使用することで、BERTopicはデータのセマンティックな関係をキャプチャし、従来のモデルよりも効果的になる可能性がある。
論文 参考訳(メタデータ) (2025-01-07T14:53:35Z) - Unveiling the Potential of BERTopic for Multilingual Fake News Analysis -- Use Case: Covid-19 [0.562479170374811]
BERTopicは文の埋め込み、次元の縮小、クラスタリング、トピック抽出で構成されている。
本稿では,BERTopicの技術応用を実際に分析することを目的とする。
また、実世界のデータに対するトピックモデリングの結果をユースケースとして分析することを目的とする。
論文 参考訳(メタデータ) (2024-07-11T11:47:43Z) - Explaining Text Similarity in Transformer Models [52.571158418102584]
説明可能なAIの最近の進歩により、トランスフォーマーの説明の改善を活用することで、制限を緩和できるようになった。
両線形類似性モデルにおける2次説明の計算のために開発された拡張であるBiLRPを用いて、NLPモデルにおいてどの特徴相互作用が類似性を促進するかを調べる。
我々の発見は、異なる意味的類似性タスクやモデルに対するより深い理解に寄与し、新しい説明可能なAIメソッドが、どのようにして深い分析とコーパスレベルの洞察を可能にするかを強調した。
論文 参考訳(メタデータ) (2024-05-10T17:11:31Z) - Continual Learning with Pre-Trained Models: A Survey [61.97613090666247]
継続的な学習は、新しい知識を学ぶ際に、かつての知識の破滅的な忘れを克服することを目的としている。
本稿では, PTM を用いた CL の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-01-29T18:27:52Z) - A quantitative study of NLP approaches to question difficulty estimation [0.30458514384586394]
この研究は、以前の研究で提案されたいくつかのアプローチを定量的に分析し、異なる教育領域のデータセットのパフォーマンスを比較した。
私たちは、Transformerベースのモデルが様々な教育領域で最高のパフォーマンスを示しており、DistilBERTはBERTとほぼ同等に機能していることに気付きました。
他のモデルでは、ハイブリットは単一のタイプの特徴に基づくものよりも優れており、言語的特徴に基づくものは理解された質問を読み取るのに優れ、周波数ベースの特徴(TF-IDF)と単語埋め込み(word2vec)はドメイン知識の評価において優れている。
論文 参考訳(メタデータ) (2023-05-17T14:26:00Z) - PAIR: Leveraging Passage-Centric Similarity Relation for Improving Dense
Passage Retrieval [87.68667887072324]
本稿では,クエリ中心とPAssage中心のsmilarity Relations(PAIR)を併用した新しい手法を提案する。
本稿では,2種類の類似性関係の形式的定式化を導入することにより,3つの主要な技術的貢献を行う。
MSMARCOとNatural Questionsの両方のデータセットにおいて、従来の最先端モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2021-08-13T02:07:43Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。