論文の概要: Ethics Testing: Proactive Identification of Generative AI System Harms
- arxiv url: http://arxiv.org/abs/2604.22089v1
- Date: Thu, 23 Apr 2026 21:41:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.276872
- Title: Ethics Testing: Proactive Identification of Generative AI System Harms
- Title(参考訳): 倫理テスト: 生成的AIシステムハームの積極的な同定
- Authors: Shin Hwei Tan, Haibo Wang, Heng Li,
- Abstract要約: 生成人工知能 (Generative Artificial Intelligence, GAI) システムは、ソースコードやその他の内容の形式で自動的にコンテンツを生成できる。
本稿では,ソフトウェア害を識別するテストの体系的生成を目的とした,新たな倫理テストのコンセプトを紹介する。
- 参考スコア(独自算出の注目度): 8.804229564335085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Artificial Intelligence (GAI) systems that can automatically generate content in the form of source code or other contents (e.g., images) has seen increasing popularity due to the emergence of tools such as ChatGPT which rely on Large Language Models (LLMs). Misuse of the automatically generated content can incur serious consequences due to potential harms in the generated content. Despite the importance of ensuring the quality of automatically generated content, there is little to no approach that can systematically generate tests for identifying software harms in the content generated by these GAI systems. In this article, we introduce the novel concept of ethics testing which aims to systematically generate tests for identifying software harms. Different from existing testing methodologies (e.g., fairness testing that aims to identifying software discrimination), ethics testing aims to systematically detect software harms that could be induced due to unethical behavior (e.g., harmful behavior or behavior that violates intellectual property rights) in automatically generated content. We introduced the concept of ethics testing, discussed the challenges therewithin, and conducted five case studies to show how ethics testing can be performed for generative AI systems.
- Abstract(参考訳): ソースコードやその他のコンテンツ(例えば画像)の形式で自動的にコンテンツを生成できる生成人工知能(GAI)システムは、大規模言語モデル(LLM)に依存するChatGPTのようなツールが出現し、人気が高まっている。
自動生成されたコンテンツの誤用は、生成されたコンテンツの潜在的な害により深刻な結果をもたらす可能性がある。
自動生成されたコンテンツの品質を保証することの重要性にもかかわらず、これらのGAIシステムによって生成されたコンテンツにおけるソフトウェア害を特定するためのテストを体系的に生成できるアプローチは、ほとんど、あるいは全くない。
本稿では,ソフトウェア障害を特定するためのテストの体系的生成を目的とした,新たな倫理テストのコンセプトを紹介する。
既存のテスト方法論(例えば、ソフトウェアの識別を目的とした公平性テスト)とは異なり、倫理テストは、自動生成されたコンテンツにおいて非倫理的行動(例えば、知的財産権に反する有害な行動や行動)によって引き起こされる可能性のあるソフトウェア害を、体系的に検出することを目的としている。
我々は倫理テストの概念を導入し、それに伴う課題について議論し、5つのケーススタディを行い、生成型AIシステムにおいて倫理テストがどのように実行できるかを示した。
関連論文リスト
- Safe and Certifiable AI Systems: Concepts, Challenges, and Lessons Learned [45.44933002008943]
この白書は、T"UV AUSTRIA Trusted AIフレームワークを提示する。
エンド・ツー・エンドの監査カタログであり、機械学習システムの評価と認定のための方法論である。
セキュアなソフトウェア開発、機能要件、倫理とデータプライバシという3つの柱の上に構築されているのは、EU AI Actの高レベルの義務を、特定かつテスト可能な基準に翻訳するものです。
論文 参考訳(メタデータ) (2025-09-08T17:52:08Z) - Learning from Few Samples: A Novel Approach for High-Quality Malcode Generation [47.76793060077816]
侵入検知システム(IDS)は,ネットワークセキュリティ防衛において重要な役割を担っている。
検出モデルのトレーニングにおけるIDSの重要な課題は、適切にラベル付けされた悪意のあるサンプルが不足していることである。
本稿では、GAN(Generative Adrial Networks)とLLM(Large Language Models)を統合した、新しい半教師付きフレームワーク textbfGANGRL-LLMを提案する。
論文 参考訳(メタデータ) (2025-08-25T15:55:17Z) - Computational Safety for Generative AI: A Signal Processing Perspective [65.268245109828]
計算安全性は、GenAIにおける安全性の定量的評価、定式化、研究を可能にする数学的枠組みである。
ジェイルブレイクによる悪意のあるプロンプトを検出するために, 感度解析と損失景観解析がいかに有効かを示す。
我々は、AIの安全性における信号処理の鍵となる研究課題、機会、そして重要な役割について論じる。
論文 参考訳(メタデータ) (2025-02-18T02:26:50Z) - A Conceptual Framework for Ethical Evaluation of Machine Learning Systems [12.887834116390358]
倫理的意味は、機械学習システムの評価を設計する際に現れる。
本稿では,倫理的評価における重要なトレードオフを,潜在的な倫理的害に対する情報ゲインのバランスとして特徴付けるユーティリティ・フレームワークを提案する。
我々の分析は、倫理的な複雑さを意図的に評価し、管理する開発チームにとって重要な必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-08-05T01:06:49Z) - Watermark-based Attribution of AI-Generated Content [34.913290430783185]
我々は,AI生成コンテンツの透かしに基づくユーザレベルの属性に関する最初の体系的研究を行う。
私たちのキーとなるアイデアは、GenAIサービスの各ユーザにユニークな透かしを割り当て、この透かしを、そのユーザが作成したAI生成コンテンツに埋め込むことです。
次に、アトリビューションは、与えられたコンテンツから抽出したユーザとベストマッチしたユーザを特定して実行される。
論文 参考訳(メタデータ) (2024-04-05T17:58:52Z) - Generative Artificial Intelligence in Healthcare: Ethical Considerations
and Assessment Checklist [10.980912140648648]
我々は医療における創造的人工知能(GenAI)に関する倫理的議論のスコーピングレビューを行う。
我々は,GenAI研究における倫理的議論の包括的評価と透明な文書化のためのチェックリストを開発することにより,ギャップを減らすことを提案する。
論文 参考訳(メタデータ) (2023-11-02T11:55:07Z) - Unpacking the Ethical Value Alignment in Big Models [46.560886177083084]
本稿では,ビッグモデルに関連するリスクと課題の概要,既存のAI倫理ガイドラインを調査し,これらのモデルの限界から生じる倫理的影響について考察する。
本稿では,大規模モデルの倫理的価値を整合させる新しい概念パラダイムを導入し,アライメント基準,評価,方法に関する有望な研究方向性について議論する。
論文 参考訳(メタデータ) (2023-10-26T16:45:40Z) - Software Testing of Generative AI Systems: Challenges and Opportunities [5.634825161148484]
生成的AIシステムによってもたらされる課題について検討し、テスト分野における将来の研究機会について論じる。
従来のテスト技術が不十分あるいは不十分なGenAIシステムの特徴について触れます。
論文 参考訳(メタデータ) (2023-09-07T08:35:49Z) - Ethics Sheets for AI Tasks [25.289525325790414]
私は、個々のモデルやデータセットのレベルだけでなく、AIタスクのレベルにおいても倫理的考慮事項について考えることにしました。
このような取り組みの新たな形態として、AIタスクのための倫理表(Ethics Sheets for AI Tasks)を紹介します。
論文 参考訳(メタデータ) (2021-07-02T16:45:40Z) - An interdisciplinary conceptual study of Artificial Intelligence (AI)
for helping benefit-risk assessment practices: Towards a comprehensive
qualification matrix of AI programs and devices (pre-print 2020) [55.41644538483948]
本稿では,インテリジェンスの概念に対処するさまざまな分野の既存の概念を包括的に分析する。
目的は、AIシステムを評価するための共有概念や相違点を特定することである。
論文 参考訳(メタデータ) (2021-05-07T12:01:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。