論文の概要: Product safety idioms: a method for building causal Bayesian networks
for product safety and risk assessment
- arxiv url: http://arxiv.org/abs/2206.02144v1
- Date: Sun, 5 Jun 2022 10:16:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-07 16:27:11.567480
- Title: Product safety idioms: a method for building causal Bayesian networks
for product safety and risk assessment
- Title(参考訳): 製品安全イディオム:製品安全性とリスク評価のための因果ベイズネットワーク構築方法
- Authors: Joshua Hunte, Martin Neil, Norman Fenton
- Abstract要約: 導入した特定の製品安全性イディオムは、幅広い製品の安全性とリスクを評価するために完全なBNモデルを構築するのに十分であることを示す。
結果のモデルは、限られた(あるいはない)製品テストデータがある場合でも、安全規制当局や製品メーカーによって使用することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Idioms are small, reusable Bayesian network (BN) fragments that represent
generic types of uncertain reasoning. This paper shows how idioms can be used
to build causal BNs for product safety and risk assessment that use a
combination of data and knowledge. We show that the specific product safety
idioms that we introduce are sufficient to build full BN models to evaluate
safety and risk for a wide range of products. The resulting models can be used
by safety regulators and product manufacturers even when there are limited (or
no) product testing data.
- Abstract(参考訳): イディオムは小さく再利用可能なベイズネットワーク(bn)フラグメントであり、不確定な推論のジェネリックタイプを表す。
本稿では,データと知識を組み合わせた製品安全性とリスク評価のための因果BNを構築するために,イディオムをどのように利用できるかを示す。
当社が導入する製品安全イディオムは、幅広い製品に対する安全性とリスクを評価するためのbnモデルを構築するのに十分であることを示す。
その結果得られたモデルは、限定された(あるいは全く)製品テストデータがある場合でも、安全規制当局や製品製造者が使用できる。
関連論文リスト
- Vulnerability Mitigation for Safety-Aligned Language Models via Debiasing [12.986006070964772]
安全性アライメントは、現実世界のAIアプリケーションにとって重要な研究トピックである。
本研究はまず,モデルの有用性を犠牲にすることなく,このような脆弱性を除去することの難しさを明らかにした。
本手法は,安全性を維持しつつモデルの有用性を高め,トレードオフを改善できる。
論文 参考訳(メタデータ) (2025-02-04T09:31:54Z) - Internal Activation as the Polar Star for Steering Unsafe LLM Behavior [50.463399903987245]
SafeSwitchは、モデルの内部状態を監視し、利用することによって、安全でない出力を動的に制御するフレームワークである。
実証実験の結果,SafeSwitchは安全性ベンチマークで80%以上の有害な出力を削減し,有効性を維持していることがわかった。
論文 参考訳(メタデータ) (2025-02-03T04:23:33Z) - OpenAI o1 System Card [274.83891368890977]
o1モデルシリーズは、思考の連鎖を用いて推論するために大規模な強化学習で訓練されている。
本報告では,OpenAI o1およびOpenAI o1-miniモデルに対して実施される安全作業の概要について述べる。
論文 参考訳(メタデータ) (2024-12-21T18:04:31Z) - Safety case template for frontier AI: A cyber inability argument [2.2628353000034065]
攻撃的サイバー能力のための安全ケーステンプレートを提案する。
リスクモデルを特定し、リスクモデルからプロキシタスクを導出し、プロキシタスクの評価設定を定義し、評価結果を結びつける。
論文 参考訳(メタデータ) (2024-11-12T18:45:08Z) - SafetyAnalyst: Interpretable, transparent, and steerable safety moderation for AI behavior [56.10557932893919]
我々は、新しいAI安全モデレーションフレームワークであるSafetyAnalystを紹介する。
AIの振る舞いを考えると、SafetyAnalystはチェーン・オブ・シークレット・推論を使用してその潜在的な結果を分析する。
あらゆる有害かつ有益な効果を、完全に解釈可能な重みパラメータを用いて有害度スコアに集約する。
論文 参考訳(メタデータ) (2024-10-22T03:38:37Z) - What Makes and Breaks Safety Fine-tuning? A Mechanistic Study [64.9691741899956]
安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。
安全でない入力の健全な側面をキャプチャする合成データ生成フレームワークを設計する。
これを用いて,3つのよく知られた安全微調整手法について検討する。
論文 参考訳(メタデータ) (2024-07-14T16:12:57Z) - Ring-A-Bell! How Reliable are Concept Removal Methods for Diffusion Models? [52.238883592674696]
Ring-A-Bellは、T2I拡散モデルのためのモデルに依存しないレッドチームツールである。
これは、不適切なコンテンツの生成に対応する拡散モデルに対する問題的プロンプトを特定する。
この結果から,安全プロンプトベンチマークの操作により,既存の安全メカニズムを回避できると考えられるプロンプトを変換できることが示唆された。
論文 参考訳(メタデータ) (2023-10-16T02:11:20Z) - Foveate, Attribute, and Rationalize: Towards Physically Safe and
Trustworthy AI [76.28956947107372]
包括的不安全テキストは、日常的なシナリオから生じる可能性のある特定の関心領域であり、有害なテキストを検出するのが困難である。
安全の文脈において、信頼に値する合理的な生成のために外部知識を活用する新しいフレームワークであるFARMを提案する。
実験の結果,FARMはSafeTextデータセットの最先端結果を得ることができ,安全性の分類精度が5.9%向上したことがわかった。
論文 参考訳(メタデータ) (2022-12-19T17:51:47Z) - Enhancing Product Safety in E-Commerce with NLP [2.895747769560711]
本稿では,大規模多国籍eコマースプラットフォームであるZalandoが自然言語処理技術をどのように利用するかを示す。
Zalandoの顧客に関する安全問題の種類を体系的に説明します。
我々は、この中核となるビジネス問題を、高度に不均衡でノイズの多い多言語データを持つ教師付きテキスト分類問題にどのようにマッピングするかを実証する。
論文 参考訳(メタデータ) (2022-10-25T22:10:30Z) - Product risk assessment: a Bayesian network approach [0.0]
RAPEX(英: RAPEX)は、イギリスとEUの規制当局が使用する主要な方法である。
我々は、不確実性を扱うための限定的なアプローチを含む、RAPEXのいくつかの制限を識別する。
本稿では,製品リスク評価のための体系的手法を改良したBNモデルを提案する。
論文 参考訳(メタデータ) (2020-10-09T16:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。