論文の概要: The Need for Benchmarks to Advance AI-Enabled Player Risk Detection in Gambling
- arxiv url: http://arxiv.org/abs/2511.21658v1
- Date: Wed, 26 Nov 2025 18:30:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.244924
- Title: The Need for Benchmarks to Advance AI-Enabled Player Risk Detection in Gambling
- Title(参考訳): ギャンブルにおけるAI対応プレーヤーのリスク検出のためのベンチマークの必要性
- Authors: Kasra Ghaharian, Simo Dragicevic, Chris Percy, Sarah E. Nelson, W. Spencer Murch, Robert M. Heirene, Kahlil Simeon-Rose, Tracy Schrans,
- Abstract要約: 本稿では,プレイヤーのリスク検知システムのシステム評価を支援するための,概念的ベンチマークフレームワークを提案する。
プレイヤーのリスク検出システムの客観的、比較的、縦断的な評価を可能にすることが目的である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Artificial intelligence-based systems for player risk detection have become central to harm prevention efforts in the gambling industry. However, growing concerns around transparency and effectiveness have highlighted the absence of standardized methods for evaluating the quality and impact of these tools. This makes it impossible to gauge true progress; even as new systems are developed, their comparative effectiveness remains unknown. We argue the critical next innovation is developing a framework to measure these systems. This paper proposes a conceptual benchmarking framework to support the systematic evaluation of player risk detection systems. Benchmarking, in this context, refers to the structured and repeatable assessment of artificial intelligence models using standardized datasets, clearly defined tasks, and agreed-upon performance metrics. The goal is to enable objective, comparable, and longitudinal evaluation of player risk detection systems. We present a domain-specific framework for benchmarking that addresses the unique challenges of player risk detection in gambling and supports key stakeholders, including researchers, operators, vendors, and regulators. By enhancing transparency and improving system effectiveness, this framework aims to advance innovation and promote responsible artificial intelligence adoption in gambling harm prevention.
- Abstract(参考訳): プレイヤーのリスク検出のための人工知能ベースのシステムは、ギャンブル業界における予防活動の害となる。
しかし、透明性と有効性に関する懸念が高まり、これらのツールの品質と影響を評価するための標準化された方法が欠如していることが浮き彫りになっている。
これにより、真の進歩を測ることは不可能であり、新しいシステムが開発されたとしても、その比較効果は未だ不明である。
次の重要なイノベーションは、これらのシステムを測定するためのフレームワークを開発することだ、と私たちは主張する。
本稿では,プレイヤーのリスク検知システムのシステム評価を支援するための,概念的ベンチマークフレームワークを提案する。
この文脈でベンチマークとは、標準化されたデータセット、明確に定義されたタスク、そして合意されたパフォーマンスメトリクスを使用して、人工知能モデルの構造化され繰り返し可能な評価を指す。
プレイヤーのリスク検出システムの客観的、比較的、縦断的な評価を可能にすることが目的である。
ギャンブルにおけるプレイヤーのリスク検出というユニークな課題に対処し、研究者、オペレーター、ベンダー、規制当局を含む主要な利害関係者をサポートする、ベンチマークのためのドメイン固有のフレームワークを提案する。
この枠組みは、透明性を高め、システムの有効性を向上させることにより、ギャンブルの害防止においてイノベーションを推進し、責任ある人工知能の採用を促進することを目的としている。
関連論文リスト
- Agentic AI for Commercial Insurance Underwriting with Adversarial Self-Critique [0.0]
本研究は, 対向的自己批判機構を組み込んだ意思決定陰性, ループ内エージェントシステムを提案する。
このシステム内では、批評家エージェントが、人間レビュアーに勧告を提出する前に、主エージェントの結論に異議を唱える。
この研究は、決定陰性エージェントによる潜在的なエラーを特徴付けるために、障害モードの正式な分類法を開発する。
論文 参考訳(メタデータ) (2026-01-21T05:51:27Z) - Perspectives on a Reliability Monitoring Framework for Agentic AI Systems [5.539407031861404]
エージェントAIシステムの動作時の信頼性の課題は,その特性に基づいて導出する。
本稿ではエージェントAIシステムのための2層信頼性監視フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-12T10:19:17Z) - RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.38705556267917]
大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。
リスク概念空間を再構築する理論的枠組みを導入する。
マルチエージェント協調評価フレームワークRADARを提案する。
論文 参考訳(メタデータ) (2025-09-28T09:35:32Z) - Never Compromise to Vulnerabilities: A Comprehensive Survey on AI Governance [211.5823259429128]
本研究は,本質的セキュリティ,デリバティブ・セキュリティ,社会倫理の3つの柱を中心に構築された,技術的・社会的次元を統合した包括的枠組みを提案する。
我々は,(1)防衛が進化する脅威に対して失敗する一般化ギャップ,(2)現実世界のリスクを無視する不適切な評価プロトコル,(3)矛盾する監視につながる断片的な規制,の3つの課題を特定する。
私たちのフレームワークは、研究者、エンジニア、政策立案者に対して、堅牢でセキュアなだけでなく、倫理的に整合性があり、公的な信頼に値するAIシステムを開発するための実用的なガイダンスを提供します。
論文 参考訳(メタデータ) (2025-08-12T09:42:56Z) - Adapting Probabilistic Risk Assessment for AI [0.0]
汎用人工知能(AI)システムは、緊急リスク管理の課題を示す。
現在の手法は、しばしば選択的なテストとリスク優先順位に関する未文書の仮定に依存します。
本稿では,AIフレームワークの確率的リスクアセスメント(PRA)を紹介する。
論文 参考訳(メタデータ) (2025-04-25T17:59:14Z) - Advancing Embodied Agent Security: From Safety Benchmarks to Input Moderation [52.83870601473094]
エンボディード・エージェントは、複数のドメインにまたがって大きな潜在能力を示す。
既存の研究は主に、一般的な大言語モデルのセキュリティに重点を置いている。
本稿では, エンボディエージェントの保護を目的とした新しい入力モデレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-22T08:34:35Z) - AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons [62.374792825813394]
本稿ではAI製品リスクと信頼性を評価するための業界標準ベンチマークとして,AIluminate v1.0を紹介する。
このベンチマークは、危険、違法、または望ましくない行動を12の危険カテゴリーで引き起こすように設計されたプロンプトに対するAIシステムの抵抗を評価する。
論文 参考訳(メタデータ) (2025-02-19T05:58:52Z) - Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey [92.36487127683053]
Retrieval-Augmented Generation (RAG)は、AIGC(AIGC)の課題に対処するために設計された高度な技術である。
RAGは信頼性と最新の外部知識を提供し、幻覚を減らし、幅広いタスクで関連するコンテキストを保証する。
RAGの成功と可能性にもかかわらず、最近の研究により、RAGパラダイムはプライバシーの懸念、敵対的攻撃、説明責任の問題など、新たなリスクももたらしていることが示されている。
論文 参考訳(メタデータ) (2025-02-08T06:50:47Z) - EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.717918131568936]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z) - The Invisible Game on the Internet: A Case Study of Decoding Deceptive Patterns [19.55209153462331]
認知パターンは、ユーザーを操作するためのデジタルプラットフォームに埋め込まれたデザインプラクティスである。
検出ツールの進歩にもかかわらず、偽りのパターンのリスクを評価する際に大きなギャップが存在する。
論文 参考訳(メタデータ) (2024-02-05T22:42:59Z) - Trustworthy Artificial Intelligence Framework for Proactive Detection
and Risk Explanation of Cyber Attacks in Smart Grid [11.122588110362706]
分散型エネルギー資源(DER)の急速な成長は、グリッドコントローラに重大なサイバーセキュリティと信頼の課題をもたらす。
信頼性の高いスマートグリッドコントローラを実現するために,DERの制御・統計メッセージによって引き起こされるサイバーリスクを積極的に識別し,説明するための,信頼できる人工知能(AI)機構について検討する。
論文 参考訳(メタデータ) (2023-06-12T02:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。