論文の概要: Is ETHICS about ethics? Evaluating the ETHICS benchmark
- arxiv url: http://arxiv.org/abs/2410.13009v1
- Date: Wed, 16 Oct 2024 20:10:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:20:48.558393
- Title: Is ETHICS about ethics? Evaluating the ETHICS benchmark
- Title(参考訳): ETHICSは倫理に関するものであるか?ETHICSベンチマークの評価
- Authors: Leif Hancox-Li, Borhane Blili-Hamelin,
- Abstract要約: 道徳理論,心理学,迅速な評価に基づいて,ETHICSベンチマークの有効性を問う。
倫理の明確な理解と経験的現象との関連性を持つことは、AIの倫理評価の有効性の鍵となる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: ETHICS is probably the most-cited dataset for testing the ethical capabilities of language models. Drawing on moral theory, psychology, and prompt evaluation, we interrogate the validity of the ETHICS benchmark. Adding to prior work, our findings suggest that having a clear understanding of ethics and how it relates to empirical phenomena is key to the validity of ethics evaluations for AI.
- Abstract(参考訳): ETHICSはおそらく、言語モデルの倫理的能力をテストするための最も暗黙のデータセットである。
道徳理論,心理学,迅速な評価に基づいて,ETHICSベンチマークの有効性を問う。
先行研究に加え、倫理の明確な理解と経験的現象との関連がAIの倫理評価の妥当性の鍵となることが示唆された。
関連論文リスト
- Quelle {é}thique pour quelle IA ? [0.0]
本研究では,AIの倫理にかかわる様々な倫理的アプローチについて分析する。
著者は、倫理の現代的必要性と意味について紹介し、他の規範の登録簿と区別し、形式化への不適切さを根拠にしている。
この研究は、文脈倫理の実践的な実践に基づくAIの人間の倫理が、人間にとって生じる倫理的問題の形式化や自動的な処理に必要であり、不必要である理由を考察して結論付けている。
論文 参考訳(メタデータ) (2024-05-21T08:13:02Z) - EALM: Introducing Multidimensional Ethical Alignment in Conversational
Information Retrieval [43.72331337131317]
我々は、倫理的アライメントを、効率的なデータスクリーニングのための初期倫理的判断段階と統合するワークフローを導入する。
本稿では,ETHICSベンチマークから適応したQA-ETHICSデータセットについて述べる。
さらに,二項および多ラベルの倫理的判断タスクにおいて,最高の性能を実現する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T08:22:34Z) - An Evaluation of GPT-4 on the ETHICS Dataset [0.0]
本報告では,ETHICSデータセット上でのGPT-4の性能について概説する。
ETHICSデータセットは、異なる倫理分野をカバーする5つのサブデータセットで構成されている。
GPT-4のパフォーマンスは以前のモデルよりもはるかに優れており、共通の人間の価値を扱うことを学ぶことがAI倫理の難しい問題ではないことを示唆している。
論文 参考訳(メタデータ) (2023-09-19T10:01:50Z) - Introduction to ethics in the age of digital communication [1.922823221013346]
本稿ではデジタルコミュニケーションの分野における倫理の紹介として機能する。
倫理の実践的なサブフィールドとして適用された倫理について、簡単に概観する。
本稿は、コミュニケーション分野における倫理の本質がどう変化してきたか、そして新興技術がこれらの変化に与える影響についても論じる。
論文 参考訳(メタデータ) (2023-08-28T09:03:15Z) - AiSocrates: Towards Answering Ethical Quandary Questions [51.53350252548668]
AiSocrates(アイソクラテス)とは、異なる視点を倫理的四項に交換するシステムである。
AiSocratesは、複数の視点で倫理的4つの質問に対する有望な回答を生成する。
我々は,AiSocratesが人的価値を明示的に組み込んだNLPシステムの開発に向けた有望なステップであると主張する。
論文 参考訳(メタデータ) (2022-05-12T09:52:59Z) - Metaethical Perspectives on 'Benchmarking' AI Ethics [81.65697003067841]
ベンチマークは、人工知能(AI)研究の技術的進歩を測定するための基盤とみられている。
AIの顕著な研究領域は倫理であり、現在、ベンチマークのセットも、AIシステムの「倫理性」を測定する一般的な方法もない。
我々は、現在と将来のAIシステムのアクションを考えるとき、倫理よりも「価値」について話す方が理にかなっていると論じる。
論文 参考訳(メタデータ) (2022-04-11T14:36:39Z) - Case Study: Deontological Ethics in NLP [119.53038547411062]
我々はNLPの観点から1つの倫理理論、すなわち非オントロジー的倫理について研究する。
特に、インフォームド・コンセントを通じて、一般化原則と自律性への敬意に焦点を当てる。
NLPシステムでこれらの原則をどのように利用できるかを示すための4つのケーススタディを提供する。
論文 参考訳(メタデータ) (2020-10-09T16:04:51Z) - Scruples: A Corpus of Community Ethical Judgments on 32,000 Real-Life
Anecdotes [72.64975113835018]
記述倫理に動機づけられた我々は、機械倫理に対する新しいデータ駆動アプローチを調査する。
Scruplesは、625,000の倫理的判断を持つ最初の大規模データセットで、32,000の実生活の逸話について紹介する。
我々のデータセットは最先端のニューラルネットワークモデルに対して大きな課題を示し、改善の余地を残しています。
論文 参考訳(メタデータ) (2020-08-20T17:34:15Z) - Aligning AI With Shared Human Values [85.2824609130584]
私たちは、正義、幸福、義務、美徳、常識道徳の概念にまたがる新しいベンチマークであるETHICSデータセットを紹介します。
現在の言語モデルは、基本的な人間の倫理的判断を予測できる有望だが不完全な能力を持っている。
私たちの研究は、今日の機械倫理の進歩を示しており、人間の価値観に合わせたAIへの足掛かりを提供する。
論文 参考訳(メタデータ) (2020-08-05T17:59:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。