論文の概要: Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
- arxiv url: http://arxiv.org/abs/2410.12791v1
- Date: Wed, 16 Oct 2024 17:59:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:42:33.803056
- Title: Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
- Title(参考訳): コンテキスト・イズ・キー(NMF):中国ディアスポラメディアにおけるトピック情報ダイナミクスのモデル化
- Authors: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø,
- Abstract要約: KeyNMFは、トランスフォーマーベースのコンテキスト埋め込みモデルを使用した静的および動的トピックモデリングの新しいアプローチである。
我々は、5つのニュースサイトのデータにKeyNMFを適用し、2024年の欧州議会選挙までの期間に焦点を当てる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Does the People's Republic of China (PRC) interfere with European elections through ethnic Chinese diaspora media? This question forms the basis of an ongoing research project exploring how PRC narratives about European elections are represented in Chinese diaspora media, and thus the objectives of PRC news media manipulation. In order to study diaspora media efficiently and at scale, it is necessary to use techniques derived from quantitative text analysis, such as topic modelling. In this paper, we present a pipeline for studying information dynamics in Chinese media. Firstly, we present KeyNMF, a new approach to static and dynamic topic modelling using transformer-based contextual embedding models. We provide benchmark evaluations to demonstrate that our approach is competitive on a number of Chinese datasets and metrics. Secondly, we integrate KeyNMF with existing methods for describing information dynamics in complex systems. We apply this pipeline to data from five news sites, focusing on the period of time leading up to the 2024 European parliamentary elections. Our methods and results demonstrate the effectiveness of KeyNMF for studying information dynamics in Chinese media and lay groundwork for further work addressing the broader research questions.
- Abstract(参考訳): 中国人民共和国(PRC)は、民族的な中国の異種メディアを通じて欧州の選挙を妨害するのだろうか?
この疑問は、ヨーロッパの選挙に関するPRCの物語が中国のメディアでどのように表現されているか、また、PRCのニュースメディア操作の目的について、現在進行中の研究プロジェクトの基礎となっている。
ディアスポラメディアを効率的かつ大規模に研究するためには,トピックモデリングなどの定量的テキスト分析から得られた手法を用いる必要がある。
本稿では,中国メディアにおける情報力学研究のパイプラインについて述べる。
まず、トランスフォーマーに基づく文脈埋め込みモデルを用いた静的および動的トピックモデリングの新しいアプローチであるKeyNMFを提案する。
我々は、我々のアプローチがいくつかの中国のデータセットとメトリクスで競合していることを示すために、ベンチマーク評価を提供する。
第二に、複雑なシステムにおける情報力学を記述する既存の手法とKeyNMFを統合する。
我々はこのパイプラインを5つのニュースサイトのデータに適用し、2024年の欧州議会選挙までの期間に焦点を当てる。
我々は,中国メディアにおける情報力学研究におけるKeyNMFの有効性を実証し,より広範な研究課題に対処するための基礎研究を行った。
関連論文リスト
- Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions [0.7249731529275342]
本稿では,最近発表されたニュースメディアの信頼性評価手法の拡張を提案する。
大規模ニュースメディアハイパーリンクグラフ上での4つの強化学習戦略の分類性能を評価する。
本実験は,2つの難解なバイアス記述子,事実報告と政治的偏見を対象とし,情報源メディアレベルでの大幅な性能向上を示した。
論文 参考訳(メタデータ) (2024-10-23T08:18:26Z) - CVLUE: A New Benchmark Dataset for Chinese Vision-Language Understanding Evaluation [49.41531871253317]
我々は、新しい中国語ビジョン言語理解評価ベンチマークデータセットを提案する。
オブジェクトカテゴリとイメージの選択は、完全に中国のネイティブスピーカーによって駆動される。
中国文化関連VLデータセットの微調整により,VLMの中国文化理解が効果的に向上することが確認された。
論文 参考訳(メタデータ) (2024-07-01T08:35:37Z) - Data-Augmented and Retrieval-Augmented Context Enrichment in Chinese
Media Bias Detection [16.343223974292908]
我々は、新たに設計されたシステムによって注釈付けされた新型コロナウイルスに関する中国のニュースと共にデータセットを構築します。
データ拡張コンテキストエンリッチメント(DACE)では、トレーニングデータを拡大し、Retrieval-Augmentedコンテキストエンリッチメント(RACE)では、貴重な情報を選択するための情報検索方法を改善する。
以上の結果から, RACE法の方が効率が高く, 可能性も高いことがわかった。
論文 参考訳(メタデータ) (2023-11-02T16:29:49Z) - Information Screening whilst Exploiting! Multimodal Relation Extraction
with Feature Denoising and Multimodal Topic Modeling [96.75821232222201]
既存のマルチモーダル関係抽出(MRE)研究は、内部情報過剰利用と外部情報過多という2つの共存課題に直面している。
内部情報スクリーニングと外部情報活用を同時に実現する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-19T14:56:57Z) - Towards Corpus-Scale Discovery of Selection Biases in News Coverage:
Comparing What Sources Say About Entities as a Start [65.28355014154549]
本稿では,大規模ニュースコーパスにおけるニュースコンテンツから直接メディア選択バイアスのパターンを発見するために,スケーラブルなNLPシステムを構築する上での課題について検討する。
我々は,世界519のニュースソースから180万件のニュース記事のコーパスであるNELA-2020のケーススタディを通じて,フレームワークの能力を示す。
論文 参考訳(メタデータ) (2023-04-06T23:36:45Z) - Computational Assessment of Hyperpartisanship in News Titles [55.92100606666497]
われわれはまず、超党派ニュースタイトル検出のための新しいデータセットを開発するために、人間の誘導する機械学習フレームワークを採用する。
全体的に右派メディアは比例的に超党派的なタイトルを使う傾向にある。
我々は、外国問題、政治システム、ニュースタイトルにおける過党主義を示唆する社会問題を含む3つの主要なトピックを識別する。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - Inference of Media Bias and Content Quality Using Natural-Language
Processing [6.092956184948962]
本稿では、メディアの政治バイアスとコンテンツ品質の両方をテキストから推測する枠組みを提案する。
我々は,100万ツイート以上のデータセットに対して,双方向長短期記憶(LSTM)ニューラルネットワークを適用した。
この結果から,テキスト分析における単語順序の学習手法への活用の重要性が示唆された。
論文 参考訳(メタデータ) (2022-12-01T03:04:55Z) - Alibaba-Translate China's Submission for WMT 2022 Metrics Shared Task [61.34108034582074]
私たちはUNITE(Unified Translation Evaluation)のコアアイデアに基づいてシステムを構築します。
モデル事前学習の段階では、まず擬似ラベル付きデータ例をUNITEの継続事前訓練に適用する。
微調整の段階では、過去のWMTコンペティションの直接評価(DA)と多次元品質メトリクス(MQM)のデータの両方を使用します。
論文 参考訳(メタデータ) (2022-10-18T08:51:25Z) - Topic Modeling and Progression of American Digital News Media During the
Onset of the COVID-19 Pandemic [2.798697306330988]
現在、世界は深刻な世界的なパンデミックの真っ最中にあり、人々の生活のあらゆる側面に影響を与えている。
パンデミックの影響で、米国では新型コロナウイルス関連のデジタルメディア記事が大量に掲載されている。
本研究では, 各種デジタル物品を自動抽出して, 管理可能な情報に抽出する自然言語処理パイプラインを開発した。
論文 参考訳(メタデータ) (2021-05-25T14:27:47Z) - Topic modelling discourse dynamics in historical newspapers [2.978993130750125]
フィンランドの比較的大規模な歴史新聞に2種類のトピックモデル(LDAとDTM)を適用する。
ケーススタディは1854年から1917年にかけてフィンランドで発行された新聞や定期刊行物に焦点をあてるが、我々の手法はどんなダイアクロニックデータにも容易に適用できる。
論文 参考訳(メタデータ) (2020-11-20T14:51:07Z) - Dynamic Data Selection and Weighting for Iterative Back-Translation [116.14378571769045]
本稿では,反復的バックトランスレーションモデルのためのカリキュラム学習戦略を提案する。
我々は、ドメイン適応、低リソース、高リソースMT設定に関するモデルを評価する。
実験の結果,提案手法は競争基準値よりも最大1.8 BLEU点の改善を達成できた。
論文 参考訳(メタデータ) (2020-04-07T19:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。