論文の概要: Is ETHICS about ethics? Evaluating the ETHICS benchmark
- arxiv url: http://arxiv.org/abs/2410.13009v1
- Date: Wed, 16 Oct 2024 20:10:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:20:48.558393
- Title: Is ETHICS about ethics? Evaluating the ETHICS benchmark
- Title(参考訳): ETHICSは倫理に関するものであるか?ETHICSベンチマークの評価
- Authors: Leif Hancox-Li, Borhane Blili-Hamelin,
- Abstract要約: 道徳理論,心理学,迅速な評価に基づいて,ETHICSベンチマークの有効性を問う。
倫理の明確な理解と経験的現象との関連性を持つことは、AIの倫理評価の有効性の鍵となる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: ETHICS is probably the most-cited dataset for testing the ethical capabilities of language models. Drawing on moral theory, psychology, and prompt evaluation, we interrogate the validity of the ETHICS benchmark. Adding to prior work, our findings suggest that having a clear understanding of ethics and how it relates to empirical phenomena is key to the validity of ethics evaluations for AI.
- Abstract(参考訳): ETHICSはおそらく、言語モデルの倫理的能力をテストするための最も暗黙のデータセットである。
道徳理論,心理学,迅速な評価に基づいて,ETHICSベンチマークの有効性を問う。
先行研究に加え、倫理の明確な理解と経験的現象との関連がAIの倫理評価の妥当性の鍵となることが示唆された。
関連論文リスト
- The Only Way is Ethics: A Guide to Ethical Research with Large Language Models [53.316174782223115]
LLM倫理白書(LLM Ethics Whitepaper)は、NLP実践者のオープンリソースであり、他人の仕事の倫理的意味を評価することを担当する。
私たちの目標は、倫理文学を明確な第一歩で考えるための具体的な勧告や挑発に翻訳することです。
LLM倫理白書」は、文献の徹底的なレビューを、ドとドナの明確な解釈に駆り立てたもので、本論文にも紹介する。
論文 参考訳(メタデータ) (2024-12-20T16:14:43Z) - Technology as uncharted territory: Contextual integrity and the notion of AI as new ethical ground [55.2480439325792]
私は、責任と倫理的AIを促進する努力が、確立された文脈規範に対するこの軽視に必然的に貢献し、正当化することができると論じます。
私は、道徳的保護よりも道徳的革新のAI倫理における現在の狭い優先順位付けに疑問を呈する。
論文 参考訳(メタデータ) (2024-12-06T15:36:13Z) - Quelle {é}thique pour quelle IA ? [0.0]
本研究では,AIの倫理にかかわる様々な倫理的アプローチについて分析する。
著者は、倫理の現代的必要性と意味について紹介し、他の規範の登録簿と区別し、形式化への不適切さを根拠にしている。
この研究は、文脈倫理の実践的な実践に基づくAIの人間の倫理が、人間にとって生じる倫理的問題の形式化や自動的な処理に必要であり、不必要である理由を考察して結論付けている。
論文 参考訳(メタデータ) (2024-05-21T08:13:02Z) - EALM: Introducing Multidimensional Ethical Alignment in Conversational
Information Retrieval [43.72331337131317]
我々は、倫理的アライメントを、効率的なデータスクリーニングのための初期倫理的判断段階と統合するワークフローを導入する。
本稿では,ETHICSベンチマークから適応したQA-ETHICSデータセットについて述べる。
さらに,二項および多ラベルの倫理的判断タスクにおいて,最高の性能を実現する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T08:22:34Z) - An Evaluation of GPT-4 on the ETHICS Dataset [0.0]
本報告では,ETHICSデータセット上でのGPT-4の性能について概説する。
ETHICSデータセットは、異なる倫理分野をカバーする5つのサブデータセットで構成されている。
GPT-4のパフォーマンスは以前のモデルよりもはるかに優れており、共通の人間の価値を扱うことを学ぶことがAI倫理の難しい問題ではないことを示唆している。
論文 参考訳(メタデータ) (2023-09-19T10:01:50Z) - Introduction to ethics in the age of digital communication [1.922823221013346]
本稿ではデジタルコミュニケーションの分野における倫理の紹介として機能する。
倫理の実践的なサブフィールドとして適用された倫理について、簡単に概観する。
本稿は、コミュニケーション分野における倫理の本質がどう変化してきたか、そして新興技術がこれらの変化に与える影響についても論じる。
論文 参考訳(メタデータ) (2023-08-28T09:03:15Z) - Metaethical Perspectives on 'Benchmarking' AI Ethics [81.65697003067841]
ベンチマークは、人工知能(AI)研究の技術的進歩を測定するための基盤とみられている。
AIの顕著な研究領域は倫理であり、現在、ベンチマークのセットも、AIシステムの「倫理性」を測定する一般的な方法もない。
我々は、現在と将来のAIシステムのアクションを考えるとき、倫理よりも「価値」について話す方が理にかなっていると論じる。
論文 参考訳(メタデータ) (2022-04-11T14:36:39Z) - Case Study: Deontological Ethics in NLP [119.53038547411062]
我々はNLPの観点から1つの倫理理論、すなわち非オントロジー的倫理について研究する。
特に、インフォームド・コンセントを通じて、一般化原則と自律性への敬意に焦点を当てる。
NLPシステムでこれらの原則をどのように利用できるかを示すための4つのケーススタディを提供する。
論文 参考訳(メタデータ) (2020-10-09T16:04:51Z) - Aligning AI With Shared Human Values [85.2824609130584]
私たちは、正義、幸福、義務、美徳、常識道徳の概念にまたがる新しいベンチマークであるETHICSデータセットを紹介します。
現在の言語モデルは、基本的な人間の倫理的判断を予測できる有望だが不完全な能力を持っている。
私たちの研究は、今日の機械倫理の進歩を示しており、人間の価値観に合わせたAIへの足掛かりを提供する。
論文 参考訳(メタデータ) (2020-08-05T17:59:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。