論文の概要: Who Gets Flagged? The Pluralistic Evaluation Gap in AI Content Watermarking
- arxiv url: http://arxiv.org/abs/2604.13776v1
- Date: Wed, 15 Apr 2026 12:06:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.52086
- Title: Who Gets Flagged? The Pluralistic Evaluation Gap in AI Content Watermarking
- Title(参考訳): 誰がフラッグアップされるのか? AIコンテンツのウォーターマーキングにおける複数の評価ギャップ
- Authors: Alexander Nemecek, Osama Zafar, Yuqiao Xu, Wenbiao Li, Erman Ayday,
- Abstract要約: コンテンツ依存が偏見へのモダリティ固有の経路をどのように生み出すかを検討する。
モダリティ全体にわたる主要な透かしベンチマークをレビューすると、ある例外を除いて、言語、文化コンテンツタイプ、あるいは人口グループ間でのパフォーマンスは報告されていないことが分かりました。
電子透かしは、それが支配しようとする生成システムよりも低い公正度基準で保持されていることを示す。
- 参考スコア(独自算出の注目度): 39.76203258538667
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Watermarking is becoming the default mechanism for AI content authentication, with governance policies and frameworks referencing it as infrastructure for content provenance. Yet across text, image, and audio modalities, watermark signal strength, detectability, and robustness depend on statistical properties of the content itself, properties that vary systematically across languages, cultural visual traditions, and demographic groups. We examine how this content dependence creates modality-specific pathways to bias. Reviewing the major watermarking benchmarks across modalities, we find that, with one exception, none report performance across languages, cultural content types, or population groups. To address this, we propose three concrete evaluation dimensions for pluralistic watermark benchmarking: cross-lingual detection parity, culturally diverse content coverage, and demographic disaggregation of detection metrics. We connect these to the governance frameworks currently mandating watermarking deployment and show that watermarking is held to a lower fairness standard than the generative systems it is meant to govern. Our position is that evaluation must precede deployment, and that the same bias auditing requirements applied to AI models should extend to the verification layer.
- Abstract(参考訳): ウォーターマーキングは、AIコンテンツ認証のデフォルトメカニズムになりつつある。
しかし、テキスト、画像、オーディオのモダリティ、透かし信号の強さ、検出可能性、堅牢性は、コンテンツ自体の統計的特性、言語、文化的な視覚的伝統、人口統計学的グループによって異なる。
この内容依存が偏見へのモダリティ固有の経路をいかに生み出すかを検討する。
モダリティ全体にわたる主要な透かしベンチマークをレビューすると、ある例外を除いて、言語、文化コンテンツタイプ、あるいは人口グループ間でのパフォーマンスは報告されていないことが分かりました。
そこで本研究では,多言語型透かしベンチマークのための3つの具体的評価次元として,言語横断的検出パリティ,文化的に多様なコンテンツカバレッジ,および検出指標の人口集団化について提案する。
私たちはこれらを、現在ウォーターマーキングデプロイメントを義務付けているガバナンスフレームワークに接続し、ウォーターマーキングが、それが管理しようとするジェネレーティブシステムよりも低い公平性標準に保持されていることを示す。
我々の立場では、評価はデプロイメントに先立ち、AIモデルに適用されるのと同じバイアス監査要件が検証層に拡張されるべきである。
関連論文リスト
- In-Context Watermarks for Large Language Models [71.29952527565749]
In-Context Watermarking (ICW)は、インシデントエンジニアリングのみで生成されたテキストに透かしを埋め込む。
粒度の異なる4つのICW戦略について検討した。
本実験は,モデルに依存しない実用的な透かし手法としてのICWの実現可能性を検証するものである。
論文 参考訳(メタデータ) (2025-05-22T17:24:51Z) - Improved Unbiased Watermark for Large Language Models [59.00698153097887]
本稿では,非バイアスのマルチチャネル型透かしであるMCmarkを紹介する。
MCmarkは言語モデルの本来の分布を保存する。
既存の非バイアスの透かしよりも検出性と堅牢性を大幅に改善する。
論文 参考訳(メタデータ) (2025-02-16T21:02:36Z) - FarFetched: Entity-centric Reasoning and Claim Validation for the Greek Language based on Textually Represented Environments [0.3874856507026475]
複数のオンラインニュースソースから得られた集合的証拠に基づいて,自動クレーム検証の必要性に対処する。
イベント、アクション、ステートメント間の遅延接続を明らかにするエンティティ中心の推論フレームワークを導入します。
提案手法は,低リソース言語に対する自動クレーム検証のギャップを埋めようとしている。
論文 参考訳(メタデータ) (2024-07-13T13:30:20Z) - A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models [65.40460716619772]
本研究は,textbfDistribution-textbf Preserving (DiP)ウォーターマークの重要性に焦点をあてる。
現在の戦略とは対照的に,提案したDiPmarkは透かし中に元のトークン分布を同時に保存する。
言語モデルAPIにアクセスせずに検出可能で(アクセス可能)、トークンの適度な変更に対して確実に堅牢である。
論文 参考訳(メタデータ) (2023-10-11T17:57:35Z) - Deconstruct to Reconstruct a Configurable Evaluation Metric for
Open-Domain Dialogue Systems [36.73648357051916]
オープンドメイン対話では、全体的な品質は、関連性、特異性、共感など、さまざまな側面から成り立っている。
既存のメトリクスは、そのような柔軟性に対処するように設計されていません。
そこで本研究では,USL-Hと呼ばれる単一メトリクスを得るために,各アスペクトを合成する簡単な手法を提案する。
論文 参考訳(メタデータ) (2020-11-01T11:34:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。