論文の概要: Documenting Ethical Considerations in Open Source AI Models
- arxiv url: http://arxiv.org/abs/2406.18071v2
- Date: Wed, 3 Jul 2024 00:08:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 19:03:22.807165
- Title: Documenting Ethical Considerations in Open Source AI Models
- Title(参考訳): オープンソースAIモデルにおける倫理的考察の文書化
- Authors: Haoyu Gao, Mansooreh Zahedi, Christoph Treude, Sarita Rosenstock, Marc Cheong,
- Abstract要約: 本研究では,開発者がオープンソースAIモデルの倫理的側面を実際にどのように文書化しているかを検討する。
2,347の文書の最初の集合をフィルタリングした後、265の関連文書を特定した。
モデル行動リスク、モデルユースケース、モデルリスク軽減の6つのテーマが浮かび上がっています。
- 参考スコア(独自算出の注目度): 8.517777178514242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: The development of AI-enabled software heavily depends on AI model documentation, such as model cards, due to different domain expertise between software engineers and model developers. From an ethical standpoint, AI model documentation conveys critical information on ethical considerations along with mitigation strategies for downstream developers to ensure the delivery of ethically compliant software. However, knowledge on such documentation practice remains scarce. Aims: The objective of our study is to investigate how developers document ethical aspects of open source AI models in practice, aiming at providing recommendations for future documentation endeavours. Method: We selected three sources of documentation on GitHub and Hugging Face, and developed a keyword set to identify ethics-related documents systematically. After filtering an initial set of 2,347 documents, we identified 265 relevant ones and performed thematic analysis to derive the themes of ethical considerations. Results: Six themes emerge, with the three largest ones being model behavioural risks, model use cases, and model risk mitigation. Conclusions: Our findings reveal that open source AI model documentation focuses on articulating ethical problem statements and use case restrictions. We further provide suggestions to various stakeholders for improving documentation practice regarding ethical considerations.
- Abstract(参考訳): 背景: AI対応ソフトウェアの開発は、ソフトウェアエンジニアとモデル開発者の間で異なるドメインの専門知識があるため、モデルカードのようなAIモデルドキュメンテーションに大きく依存しています。
倫理的観点から、AIモデルドキュメンテーションは、倫理的に準拠したソフトウェアの提供を保証するために、下流開発者の緩和戦略とともに、倫理的考察に関する重要な情報を伝達する。
しかし、そのような文書の実践に関する知識は乏しい。
Aims: 私たちの研究の目的は、開発者がオープンソースAIモデルの倫理的側面を実際にどのように文書化しているかを調査することにあります。
方法:GitHubとHugging Faceで3つの資料ソースを選択し,倫理関連の文書を体系的に識別するキーワードセットを開発した。
2,347件の文書をフィルタリングした後、265件の関連文書を同定し、倫理的考察のテーマを導出するテーマ分析を行った。
結果: モデル行動リスク,モデルユースケース,モデルリスク軽減という,6つのテーマが浮かび上がっています。
結論: オープンソースAIモデルドキュメンテーションは、倫理的問題ステートメントとユースケース制限の明確化に重点を置いています。
さらに、倫理的考察に関する文書化の実践を改善するために、様々な利害関係者に提案する。
関連論文リスト
- Establishing Knowledge Preference in Language Models [80.70632813935644]
言語モデルは事前学習を通じて大量の事実知識を符号化することが知られている。
このような知識はユーザーからの要求に応えるには不十分かもしれない。
進行中のイベントに関する質問に答える場合には、最新のニュース記事を使って回答を更新する必要がある。
ある事実がモデルで編集されると、更新された事実はモデルによって学習されたすべての事前知識をオーバーライドする。
論文 参考訳(メタデータ) (2024-07-17T23:16:11Z) - Ethical-Lens: Curbing Malicious Usages of Open-Source Text-to-Image Models [51.69735366140249]
我々はEthical-Lensというフレームワークを紹介した。
Ethical-Lensは、毒性とバイアス次元をまたいだテキストと画像のモデルにおける価値アライメントを保証する。
実験の結果、Ethical-Lensは商業モデルに匹敵するレベルまでアライメント能力を向上することがわかった。
論文 参考訳(メタデータ) (2024-04-18T11:38:25Z) - "Model Cards for Model Reporting" in 2024: Reclassifying Category of Ethical Considerations in Terms of Trustworthiness and Risk Management [0.0]
2019年、"Model Cards for Model Reporting"と題された論文は、モデルパフォーマンスを文書化する新しいツールを導入した。
この論文で詳述されたカテゴリの1つは倫理的考察であり、データのサブカテゴリ、人間の生活、緩和、リスクと害、ユースケースが含まれる。
我々は、信頼に値するAIとして知られる分野の成熟により、このカテゴリをオリジナルのモデルカードに再分類することを提案する。
論文 参考訳(メタデータ) (2024-02-15T14:56:00Z) - EALM: Introducing Multidimensional Ethical Alignment in Conversational
Information Retrieval [43.72331337131317]
我々は、倫理的アライメントを、効率的なデータスクリーニングのための初期倫理的判断段階と統合するワークフローを導入する。
本稿では,ETHICSベンチマークから適応したQA-ETHICSデータセットについて述べる。
さらに,二項および多ラベルの倫理的判断タスクにおいて,最高の性能を実現する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T08:22:34Z) - Use case cards: a use case reporting framework inspired by the European
AI Act [0.0]
ユースケースの文書化のための新しいフレームワークを提案する。
他のドキュメンテーションの方法論とは異なり、私たちはAIシステムの目的と運用に重点を置いています。
提案された枠組みは、関連するEU政策の専門家と科学者のチームを含む共同設計プロセスの結果である。
論文 参考訳(メタデータ) (2023-06-23T15:47:19Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Evaluating a Methodology for Increasing AI Transparency: A Case Study [8.265282762929509]
人工知能の潜在的な害に対する懸念が高まる中、社会はAIモデルとシステムがどのように作成され、使用されるかについて、より透明性を求めるようになった。
これらの懸念に対処するため、いくつかの取り組みが、モデル開発者が答えるべき質問を含むドキュメンテーションテンプレートを提案している。
多様なドキュメントコンシューマのニーズをカバーできるテンプレートはひとつもありません。
論文 参考訳(メタデータ) (2022-01-24T20:01:01Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z) - A Methodology for Creating AI FactSheets [67.65802440158753]
本稿では、FactSheetsと呼ぶAIドキュメントの形式を作るための方法論について述べる。
方法論の各ステップの中で、検討すべき問題と探求すべき質問について説明する。
この方法論は、透明なAIドキュメントの採用を加速する。
論文 参考訳(メタデータ) (2020-06-24T15:08:59Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。