論文の概要: Friend or Foe? Language as an ideological switch in open-weight LLMs under Russian disinformation stress
- arxiv url: http://arxiv.org/abs/2606.08512v1
- Date: Sun, 07 Jun 2026 08:33:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.178181
- Title: Friend or Foe? Language as an ideological switch in open-weight LLMs under Russian disinformation stress
- Title(参考訳): 友人」か「偽」か : ロシアの偽情報ストレス下におけるオープンウェイトLDMのイデオロギー的転換としての言語
- Authors: Anna Małgorzata Kamińska, Tetiana Klynina,
- Abstract要約: ソ連後の地方言語に適応した4つの大規模言語モデル(LLM)の制御監査を実行する。
ウクライナ指向のモデルは、ロシア語におけるロシアの偽情報に対する最も弱い抵抗を示す。
我々は、地域情報の主権に対する主要な脅威は、敵対的な微調整ではなく、文化的アライメントが弾力性を保証するという未証明の仮定であると主張している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As Russia's war against Ukraine extends into generative AI, large language models (LLMs) adapted for local post-Soviet languages are deployed in contested information environments. Policy and industry discourse assumes that culturally aligned adaptation encodes the political orientation of the target community: a Ukrainian-oriented model will resist Russian narratives, a Russian-oriented one will reinforce them. Does it? This article systematically disconfirms that assumption. We run a controlled audit of four openly available LLMs sharing a common base model but fine-tuned for different linguistic communities, querying them in Ukrainian, Russian and English across ten contested wartime narratives: Crimea, "denazification", the "one people" thesis, and atrocity denial at Bucha and Mariupol. The result is a Fine-Tuning Paradox: the Ukrainian-oriented model shows the weakest resistance to Russian disinformation in Russian, while the Russian-oriented one exhibits the strongest rejection. Corpus composition, language coverage and prompt format prove more decisive than nominal cultural provenance. We situate these findings within debates on hybrid warfare, digital sovereignty and post-imperial information orders, arguing that the principal threat to regional information sovereignty is not adversarial fine-tuning but the untested assumption that cultural alignment guarantees resilience.
- Abstract(参考訳): ロシアによるウクライナとの戦争が生成的AIに拡大するにつれて、ソ連後の地方言語に適応した大規模言語モデル(LLM)が競合する情報環境に展開される。
政策と産業の談話は、文化的に整合した適応が標的のコミュニティの政治的指向を符号化していると仮定している:ウクライナ指向のモデルがロシアの物語に抵抗し、ロシア指向のモデルがそれらを補強する。
そうなの?
この記事ではその仮定を体系的に断定する。
我々は、共通基盤モデルを共有するが、異なる言語コミュニティのために微調整された4つの LLM の統制された監査を実施し、ウクライナ語、ロシア語、英語で、戦時中の10の物語(クリミア、"デナゾフィケーション"、"一人の"テーゼ、ブチャとマリプオールにおける残虐行為の否定)に照会した。
ウクライナ指向のモデルはロシアにおけるロシアの偽情報に対する最も弱い抵抗を示す一方、ロシア指向のモデルは最も強い拒絶を示す。
コーパスの構成、言語カバレッジ、プロンプトフォーマットは、名目上の文化的証明よりも決定的なものである。
我々は、これらの知見をハイブリッド戦争、デジタル主権、ポストインペリアル情報命令に関する議論の中に位置づけ、地域情報の主権に対する主要な脅威は敵の微調整ではなく、文化的アライメントが弾力性を保証するという未証明の仮定であると主張した。
関連論文リスト
- A Longitudinal, Multinational, and Multilingual Corpus of News Coverage of the Russo-Ukrainian War [4.802758600019422]
DNIPROは、2022年2月から2024年8月までのロシア・ウクライナ戦争を記した246Kのニュース記事からなる、新しい縦断コーパスである。
5つの州(ロシア、ウクライナ、アメリカ合衆国、イギリス、中国)の11のメディアと3つの言語(英語、ロシア語、中国語)にまたがる。
論文 参考訳(メタデータ) (2026-01-22T20:37:42Z) - CrossNews-UA: A Cross-lingual News Semantic Similarity Benchmark for Ukrainian, Polish, Russian, and English [53.32175252285023]
言語間のニュース比較は、情報の検証に有望なアプローチを提供する。
既存の言語間ニュース分析用のデータセットは、ジャーナリストや専門家によって手作業でキュレートされた。
我々は、多言語間ニュース類似性評価のためのスケーラブルで説明可能なクラウドソーシングパイプラインを導入する。
論文 参考訳(メタデータ) (2025-10-22T14:23:50Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.94709351266557]
検索強化に関して,言語モデルの信頼性に焦点をあてる。
検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。
言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文 参考訳(メタデータ) (2024-10-22T09:25:21Z) - The Adaptive Strategies of Anti-Kremlin Digital Dissent in Telegram during the Russian Invasion of Ukraine [0.6178017970021517]
本研究では,Telegramにおけるアンチクレムリン含有量の7段階にわたる動態について検討した。
新興トピックに関するデータ駆動の計算分析により、ロシアの経済、戦闘の更新、国際政治、ロシアの内政が明らかになった。
クレムリンコントロールを脅かすこれらの出来事に対する視聴者の承認は、テレグラムが野党のオンラインプレーフィールドをレベル付けしていることを示唆している。
論文 参考訳(メタデータ) (2024-08-13T18:10:06Z) - Let Models Speak Ciphers: Multiagent Debate through Embeddings [84.20336971784495]
この問題を解決するためにCIPHER(Communicative Inter-Model Protocol Through Embedding Representation)を導入する。
自然言語から逸脱することで、CIPHERはモデルの重みを変更することなく、より広い範囲の情報を符号化する利点を提供する。
このことは、LLM間の通信における代替の"言語"としての埋め込みの優越性と堅牢性を示している。
論文 参考訳(メタデータ) (2023-10-10T03:06:38Z) - Automated multilingual detection of Pro-Kremlin propaganda in newspapers
and Telegram posts [5.886782001771578]
ロシア連邦とウクライナの大規模な紛争は、前例のない量のニュース記事やソーシャルメディアデータを生み出した。
本研究は、ウクライナ語、ロシア語、ルーマニア語、英語のニュース記事やテレグラムのニュースチャンネルを用いて、戦初月にメディアが世論にどう影響し、どのように反映したかを分析した。
我々はトランスフォーマーと言語特徴に基づく多言語自動プロパガンダ識別の2つの手法を提案し,比較する。
論文 参考訳(メタデータ) (2023-01-25T14:25:37Z) - "A Special Operation": A Quantitative Approach to Dissecting and
Comparing Different Media Ecosystems' Coverage of the Russo-Ukrainian War [5.567674129101803]
ロシアによるウクライナ侵攻の報道は、西欧、ロシア、中国のメディアのエコシステムで広範囲に及んでいる。
欧米の報道機関は戦争における軍事的・人道的な側面に重点を置いているのに対し、ロシアのメディアは「特別軍事作戦」の正当化に重点を置いている。
われわれは、ロシアのメディアが中国メディアのニュース記事、Weiboアカウント、Twitterアカウントの中国報道にどのような影響を与えたかを測定する。
論文 参考訳(メタデータ) (2022-10-06T16:04:19Z) - InfoBERT: Improving Robustness of Language Models from An Information
Theoretic Perspective [84.78604733927887]
BERTのような大規模言語モデルは、幅広いNLPタスクで最先端のパフォーマンスを実現している。
近年の研究では、このようなBERTベースのモデルが、テキストの敵対的攻撃の脅威に直面していることが示されている。
本稿では,事前学習した言語モデルの堅牢な微調整のための新しい学習フレームワークであるInfoBERTを提案する。
論文 参考訳(メタデータ) (2020-10-05T20:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。