論文の概要: VIGIL: An Extensible System for Real-Time Detection and Mitigation of Cognitive Bias Triggers
- arxiv url: http://arxiv.org/abs/2604.03261v1
- Date: Thu, 12 Mar 2026 16:09:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-12 18:41:08.565169
- Title: VIGIL: An Extensible System for Real-Time Detection and Mitigation of Cognitive Bias Triggers
- Title(参考訳): VIGIL:認知バイアストリガーのリアルタイム検出と緩和のための拡張システム
- Authors: Bo Kang, Sander Noels, Tijl De Bie,
- Abstract要約: 生成AIの台頭は、オンライン情報整合性や市民の言論にリスクが増している。
本稿では,リアルタイム認知バイアストリガ検出と緩和のためのブラウザエクステンションVIGILを提案する。
- 参考スコア(独自算出の注目度): 7.4945557963214435
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of generative AI is posing increasing risks to online information integrity and civic discourse. Most concretely, such risks can materialise in the form of mis- and disinformation. As a mitigation, media-literacy and transparency tools have been developed to address factuality of information and the reliability and ideological leaning of information sources. However, a subtler but possibly no less harmful threat to civic discourse is to use of persuasion or manipulation by exploiting human cognitive biases and related cognitive limitations. To the best of our knowledge, no tools exist to directly detect and mitigate the presence of triggers of such cognitive biases in online information. We present VIGIL (VIrtual GuardIan angeL), the first browser extension for real-time cognitive bias trigger detection and mitigation, providing in-situ scroll-synced detection, LLM-powered reformulation with full reversibility, and privacy-tiered inference from fully offline to cloud. VIGIL is built to be extensible with third-party plugins, with several plugins that are rigorously validated against NLP benchmarks are already included. It is open-sourced at https://github.com/aida-ugent/vigil.
- Abstract(参考訳): 生成AIの台頭は、オンライン情報整合性と市民の言論にリスクが増している。
最も具体的には、そのようなリスクは誤情報や偽情報の形で成立する可能性がある。
メディアリテラシーと透明性ツールは,情報ソースの事実性と信頼性,イデオロギー的傾向に対処するために開発された。
しかし、市民の言論に対するより微妙な脅威は、人間の認知バイアスと関連する認知的限界を活用することによって、説得または操作を使用することである。
私たちの知る限りでは、オンライン情報にそのような認知バイアスの引き金が直接検出され、緩和されるツールは存在しない。
VIGIL(VIrtual GuardIan angeL)は,リアルタイムな認知バイアストリガ検出と緩和のためのブラウザエクステンションで,スクロール同期検出,LLMによる完全可逆性向上,完全オフラインからクラウドへのプライバシ階層推論を提供する。
VIGILはサードパーティのプラグインで拡張可能で、NLPベンチマークに対して厳格に検証されているいくつかのプラグインがすでに含まれている。
https://github.com/aida-ugent/vigil.comで公開されている。
関連論文リスト
- Truth Sleuth and Trend Bender: AI Agents to fact-check YouTube videos and influence opinions [0.5261718469769449]
本稿では,YouTubeビデオのクレームをファクトチェックし,コメント欄にユーザを巻き込むAIシステムを開発する。
我々のシステムは、True SleuthとTrend Benderの2つの主要なエージェントで構成されている。
確立したベンチマークデータセットの実験と、YouTube上の実世界のデプロイを通じて、システムの能力を実証する。
論文 参考訳(メタデータ) (2025-07-11T10:08:05Z) - Information Retrieval Induced Safety Degradation in AI Agents [52.15553901577888]
本研究では,検索アクセスの拡大がモデル信頼性,バイアス伝搬,有害コンテンツ生成に与える影響について検討した。
整列 LLM 上に構築された検索可能なエージェントは、検索なしでの無検閲モデルよりも安全でない振る舞いをすることが多い。
これらの発見は、検索可能でますます自律的なAIシステムの公正性と信頼性を確保するための堅牢な緩和戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-05-20T11:21:40Z) - Susceptibility to Unreliable Information Sources: Swift Adoption with Minimal Exposure [9.417811179236683]
ユーザは、高クレーディビリティソースよりも露出が少ない低クレーディビリティソースを採用する傾向があります。
情報ソースの採用は、しばしば、同等の信頼性レベルを持つソースへのユーザーの事前の露出を反映している。
論文 参考訳(メタデータ) (2023-11-09T20:16:06Z) - Factuality Challenges in the Era of Large Language Models [113.3282633305118]
大規模言語モデル(LLM)は、誤った、誤った、あるいは誤解を招くコンテンツを生成する。
LLMは悪意のあるアプリケーションに利用することができる。
これは、ユーザーを欺く可能性があるという点で、社会に重大な課題をもたらす。
論文 参考訳(メタデータ) (2023-10-08T14:55:02Z) - TeD-SPAD: Temporal Distinctiveness for Self-supervised
Privacy-preservation for video Anomaly Detection [59.04634695294402]
人間の監視のないビデオ異常検出(VAD)は複雑なコンピュータビジョンタスクである。
VADのプライバシー漏洩により、モデルは人々の個人情報に関連する不必要なバイアスを拾い上げ、増幅することができる。
本稿では,視覚的プライベート情報を自己管理的に破壊する,プライバシーに配慮したビデオ異常検出フレームワークTeD-SPADを提案する。
論文 参考訳(メタデータ) (2023-08-21T22:42:55Z) - Detecting Cross-Modal Inconsistency to Defend Against Neural Fake News [57.9843300852526]
我々は、画像やキャプションを含む機械生成ニュースに対して、より現実的で挑戦的な対策を導入する。
敵が悪用できる可能性のある弱点を特定するために、4つの異なる種類の生成された記事からなるNeuralNewsデータセットを作成します。
ユーザ実験から得られた貴重な知見に加えて,視覚的意味的不整合の検出にもとづく比較的効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-16T14:13:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。