論文の概要: DariMis: Harm-Aware Modeling for Dari Misinformation Detection on YouTube
- arxiv url: http://arxiv.org/abs/2603.22977v1
- Date: Tue, 24 Mar 2026 09:13:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.398104
- Title: DariMis: Harm-Aware Modeling for Dari Misinformation Detection on YouTube
- Title(参考訳): DariMis:YouTube上のDari誤情報検出のためのハームアウェアモデリング
- Authors: Jawid Ahmad Baktash, Mosa Ebrahimi, Mohammad Zarif Joya, Mursal Dawodi,
- Abstract要約: アフガニスタンの主要言語であるダリ語は、何千万人もの人々が話しているが、誤報検出の文献はほとんど欠落している。
DariMisは9,224のDari言語ビデオを手動でアノテートした最初のデータセットで、インフォメーションタイプ(誤情報、一部真、真)とハームレベル(低、中、高)の2つの次元にラベル付けしている。
本稿では,ビデオタイトルと記述を個別のBERTセグメント入力として表現し,見出しクレームと身体内容のセマンティックな関係を明示的にモデル化するペアインプット符号化手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dari, the primary language of Afghanistan, is spoken by tens of millions of people yet remains largely absent from the misinformation detection literature. We address this gap with DariMis, the first manually annotated dataset of 9,224 Dari-language YouTube videos, labeled across two dimensions: Information Type (Misinformation, Partly True, True) and Harm Level (Low, Medium, High). A central empirical finding is that these dimensions are structurally coupled, not independent: 55.9 percent of Misinformation carries at least Medium harm potential, compared with only 1.0 percent of True content. This enables Information Type classifiers to function as implicit harm-triage filters in content moderation pipelines. We further propose a pair-input encoding strategy that represents the video title and description as separate BERT segment inputs, explicitly modeling the semantic relationship between headline claims and body content, a key signal of misleading information. An ablation study against single-field concatenation shows that pair-input encoding yields a 7.0 percentage point gain in Misinformation recall (60.1 percent to 67.1 percent), the safety-critical minority class, despite modest overall macro F1 differences (0.09 percentage points). We benchmark a Dari/Farsi-specialized model (ParsBERT) against XLM-RoBERTa-base; ParsBERT achieves the best test performance with accuracy of 76.60 percent and macro F1 of 72.77 percent. Bootstrap 95 percent confidence intervals are reported for all metrics, and we discuss both the practical significance and statistical limitations of the results.
- Abstract(参考訳): アフガニスタンの主要言語であるダリ語は、何千万人もの人々が話しているが、誤報検出の文献はほとんど欠落している。
DariMisは9,224のDari言語によるYouTubeビデオを手動でアノテートした最初のデータセットで、インフォメーションタイプ(誤情報、一部真、真)とハームレベル(低、中、高)の2つの次元にラベル付けした。
中心的な実証的な発見は、これらの次元が構造的に結合されており、独立ではないことである: 55.9%の誤報は、真の内容の1.0パーセントしか持たないのに対して、少なくとも中程度の損傷ポテンシャルを持っている。
これにより、インフォメーションタイプ分類器は、コンテンツモデレーションパイプラインにおける暗黙のハーモディエイジフィルタとして機能する。
さらに,ビデオタイトルと記述を個別のBERTセグメント入力として表現するペアインプット符号化戦略を提案し,見出しクレームと身体内容のセマンティックな関係を明示的にモデル化する。
単一フィールド結合に対するアブレーション調査によると、ペアインプット符号化は、マクロF1の微妙な差(0.09ポイント)にもかかわらず、安全クリティカルなマイノリティクラスである誤情報リコール(60.1%から67.1%)において7.0ポイントの利得が得られる。
我々は、Dari/Farsi-specialized model (ParsBERT)をXLM-RoBERTa-baseと比較し、ParsBERTは76.60%、マクロF1は72.77パーセントの精度で最高のテスト性能を達成する。
ブートストラップでは,すべての指標に対して95%の信頼区間が報告され,結果の実用的意義と統計的限界が議論される。
関連論文リスト
- Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation [0.4349640169711269]
ビエリク・ガード(英語: Bielik Guard)は、ポーランド語の安全分類法である。
ポーランドの6,885のテキストからなるコミュニティアノテーション付きデータセットに基づいて、これらのモデルは、Hate/Aggression、Vulgarities、Sexual Content、Crith、Self-Harmという5つの安全カテゴリのコンテンツを分類する。
論文 参考訳(メタデータ) (2026-02-08T12:57:04Z) - GerAV: Towards New Heights in German Authorship Verification using Fine-Tuned LLMs on a New Benchmark [20.533795195003286]
オーサシップ検証 (AV) とは、2つのテキストが同じ著者によって書かれたかどうかを決定するタスクである。
GerAVは600k以上のラベル付きテキストペアからなるドイツのAVの総合ベンチマークである。
論文 参考訳(メタデータ) (2026-01-20T08:08:18Z) - HyFormer-Net: A Synergistic CNN-Transformer with Interpretable Multi-Scale Fusion for Breast Lesion Segmentation and Classification in Ultrasound Images [0.0]
HyFormer-Netは、本質的に解釈可能な同時セグメンテーションと分類のためのハイブリッドCNN変換器である。
BUSIデータセットでは、HyFormer-NetがDice Score 0.761 +/-0.072と精度93.2%を獲得し、U-Net、Attention U-Net、TransUNetを上回っている。
乳房超音波におけるハイブリッドCNN変換器のクロスデータセット一般化研究を初めて行った。
論文 参考訳(メタデータ) (2025-11-02T17:06:12Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - RideKE: Leveraging Low-Resource, User-Generated Twitter Content for Sentiment and Emotion Detection in Kenyan Code-Switched Dataset [4.142287865325998]
我々は、ケニアのコード変更データを分析し、感情分類と感情分類のための4つの最先端トランスフォーマー(SOTA)モデルを評価する。
感情分析では、XLM-Rは最高精度(69.2%)、F1スコア(66.1%)、XLM-R半教師(67.2%、64.1%)を達成する。
感情分析では、DistilBERTは精度59.8%、F1は31%、mBERTは半監督的(精度59%、F1は26.5)である。
論文 参考訳(メタデータ) (2025-02-10T06:18:07Z) - Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios [49.53589774730807]
マルチモーダル大規模言語モデル(MLLM)は近年,視覚的質問応答から映像理解に至るまでのタスクにおいて,最先端のパフォーマンスを実現している。
12件のオープンソースMLLMが, 単一の偽装キューを受けた65%の症例において, 既往の正解を覆した。
論文 参考訳(メタデータ) (2024-11-05T01:11:28Z) - When Does Monolingual Data Help Multilingual Translation: The Role of Domain and Model Scale [73.69252847606212]
自動符号化(DAE)と逆翻訳(BT)が機械翻訳(MMT)に与える影響について検討する。
モノリンガルデータは一般的にMTMに役立つが、モデルは驚くほどドメインミスマッチ、特により小さなモデルスケールでは不安定である。
スケールが大きくなるにつれて、DAEは並列のみのベースラインを90Mで過小評価することから、BTのパフォーマンスを1.6Bで収束させ、低リソースでそれを上回るものへと移行する。
論文 参考訳(メタデータ) (2023-05-23T14:48:42Z) - UATVR: Uncertainty-Adaptive Text-Video Retrieval [90.8952122146241]
一般的なプラクティスは、テキストとビデオのペアを同じ埋め込みスペースに転送し、特定のエンティティとのクロスモーダルなインタラクションを構築することである。
UATVRと呼ばれる不確実性言語によるテキスト・ビデオ検索手法を提案し、各ルックアップを分布マッチング手順としてモデル化する。
論文 参考訳(メタデータ) (2023-01-16T08:43:17Z) - HuBERT: Self-Supervised Speech Representation Learning by Masked
Prediction of Hidden Units [81.53783563025084]
本稿では、BERTのような予測損失に対して、アライメントされたターゲットラベルを提供するオフラインクラスタリングステップを提案する。
提案手法の重要な要素は,マスク領域にのみ予測損失を適用することである。
HuBERTは、より困難なdev-otherおよびtest-other評価サブセットに対して、最大19%と13%の相対的なWER削減を示す。
論文 参考訳(メタデータ) (2021-06-14T14:14:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。