論文の概要: A Quantitative Account of Harm
- arxiv url: http://arxiv.org/abs/2209.15111v1
- Date: Thu, 29 Sep 2022 21:48:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 15:33:37.031209
- Title: A Quantitative Account of Harm
- Title(参考訳): Harmの定量的な説明
- Authors: Sander Beckers, Hana Chockler, Joseph Y. Halpern
- Abstract要約: まず、単一個人を含む決定論的文脈における害の定量的定義を示す。
次に、コンテキストに関する不確実性に対処する上での課題について考察する。
このような“明白な”方法が,直感的あるいは不適切な回答につながる可能性があることを,私たちは示しています。
- 参考スコア(独自算出の注目度): 18.7822411439221
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In a companion paper (Beckers et al. 2022), we defined a qualitative notion
of harm: either harm is caused, or it is not. For practical applications, we
often need to quantify harm; for example, we may want to choose the lest
harmful of a set of possible interventions. We first present a quantitative
definition of harm in a deterministic context involving a single individual,
then we consider the issues involved in dealing with uncertainty regarding the
context and going from a notion of harm for a single individual to a notion of
"societal harm", which involves aggregating the harm to individuals. We show
that the "obvious" way of doing this (just taking the expected harm for an
individual and then summing the expected harm over all individuals can lead to
counterintuitive or inappropriate answers, and discuss alternatives, drawing on
work from the decision-theory literature.
- Abstract(参考訳): 共用論文 (Beckers et al. 2022) において、我々は害の質的な概念を定義した。
実践的な応用では、しばしば害を定量化する必要があり、例えば、可能な介入の集合から有害なレストを選択したい場合もあります。
まず, 1 つの個人を含む決定論的文脈における害の定量的定義を提示する。次に, 一つの個人に対する危害の概念から, 個人に対する害を集約する「社会的危害」概念へと, 文脈に関する不確実性に対処する上での問題点を考える。
これを行うための「従順」な方法(単に個人に期待される損害を負わせ、すべての個人に期待される損害を和らげれば、直観的あるいは不適切な回答につながり、代替案を議論し、意思決定理論の文献から仕事を引き出すことができる。
関連論文リスト
- Towards Probing Speech-Specific Risks in Large Multimodal Models: A Taxonomy, Benchmark, and Insights [50.89022445197919]
本研究は,8つのリスクカテゴリーを敵意(悪意的皮肉と脅し),悪意的模倣(年齢,性別,民族),ステレオタイプ的バイアス(年齢,性別,民族)を対象とする音声特異的リスク分類法を提案する。
分類に基づいて,これらのリスクのカテゴリを検出するために,現在のLMM能力を評価するための小規模データセットを作成する。
論文 参考訳(メタデータ) (2024-06-25T10:08:45Z) - Fairness-Accuracy Trade-Offs: A Causal Perspective [58.06306331390586]
我々は、初めて因果レンズから公正性と正確性の間の張力を分析する。
因果的制約を強制することは、しばしば人口集団間の格差を減少させることを示す。
因果制約付きフェアラーニングのための新しいニューラルアプローチを導入する。
論文 参考訳(メタデータ) (2024-05-24T11:19:52Z) - Beyond Behaviorist Representational Harms: A Plan for Measurement and Mitigation [1.7355698649527407]
本研究は,現在定義されている表現的害の定義に焦点をあてて,含まないものと含まないものを識別する。
私たちの研究は、表現的害を繰り返すための大きな言語モデルのユニークな脆弱性を強調します。
本研究の目的は,表現的害の定義を拡大するための枠組みを確立することである。
論文 参考訳(メタデータ) (2024-01-25T00:54:10Z) - A Causal Analysis of Harm [18.7822411439221]
自律システムが誰かを傷つけるタイミングと方法に対処するための、法的および規制の枠組みの必要性はますます高まっている。
本稿では,因果モデルを用いた調和の定性的概念を定性的に定義し,実因果関係のよく知られた定義に基づく。
我々の定義は文献から例を扱えることを示し、自律システムに関わる状況についての推論において、その重要性を説明している。
論文 参考訳(メタデータ) (2022-10-11T10:36:24Z) - Handling and Presenting Harmful Text [10.359716317114815]
テキストデータは深刻な危害のリスクを引き起こす可能性がある。
これらの害は、誤情報、ヘイトスピーチ、人種的ステレオタイプという3つの軸に沿って分類することができる。
NLPでは、テキストの害がどのように扱われ、提示され、議論されるべきかという未解決の問題である。
我々は,テキスト害の研究を反映するリソースであるtextscHarmCheck を導入し,実践的なアドバイスを提供する。
論文 参考訳(メタデータ) (2022-04-29T17:34:12Z) - First do no harm: counterfactual objective functions for safe & ethical
AI [0.03683202928838612]
我々は、害の統計学的定義と、害をアルゴリズム決定に分解する枠組みを開発する。
以上の結果から,反実的推論は安全で倫理的なAIにとって重要な要素であることが示唆された。
論文 参考訳(メタデータ) (2022-04-27T15:03:43Z) - Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable
Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。
不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文 参考訳(メタデータ) (2022-03-04T15:59:06Z) - Detecting Inappropriate Messages on Sensitive Topics that Could Harm a
Company's Reputation [64.22895450493729]
カメや釣りの穏やかな議論は、政治や性的マイノリティの議論よりも不適切な有毒な対話を後押しします。
我々は,不適切で有害なメッセージを生み出す可能性のある,センシティブなトピックのセットを定義し,データセットの収集とラベル付けの方法論を記述した。
論文 参考訳(メタデータ) (2021-03-09T10:50:30Z) - Overcoming Failures of Imagination in AI Infused System Development and
Deployment [71.9309995623067]
NeurIPS 2020は研究論文に「潜在的な悪用と失敗の結果」に関するインパクトステートメントを含むよう要求した。
我々は、害の枠組みは文脈に適応し、潜在的な利害関係者、システム余裕、および最も広い意味での害を評価するための実行可能なプロキシを考える必要があると論じている。
論文 参考訳(メタデータ) (2020-11-26T18:09:52Z) - Aligning Faithful Interpretations with their Social Attribution [58.13152510843004]
モデル解釈が忠実であることの要件はあいまいで不完全であることに気付く。
因果的帰属(因果的帰属)と解釈(社会的帰属)に対する人間の行動の帰属(因果的帰属)の相違が問題であると認識する。
論文 参考訳(メタデータ) (2020-06-01T16:45:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。