論文の概要: Applications and Challenges of Fairness APIs in Machine Learning Software
- arxiv url: http://arxiv.org/abs/2508.16377v1
- Date: Fri, 22 Aug 2025 13:33:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.392597
- Title: Applications and Challenges of Fairness APIs in Machine Learning Software
- Title(参考訳): 機械学習ソフトウェアにおけるフェアネスAPIの適用と課題
- Authors: Ajoy Das, Gias Uddin, Shaiful Chowdhury, Mostafijur Rahman Akhond, Hadi Hemmati,
- Abstract要約: バイアス検出と緩和 オープンソースのソフトウェアライブラリ(別名APIライブラリ)が開発され、使用されている。
本稿では,これらのオープンソースフェアネスAPIがどのようなシナリオで利用されているかを理解するための質的研究を行う。
MLソフトウェアのバイアスに対処するために開発された13のAPIを使用した204のGitHubリポジトリを分析した。
- 参考スコア(独自算出の注目度): 3.3383488302533997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine Learning software systems are frequently used in our day-to-day lives. Some of these systems are used in various sensitive environments to make life-changing decisions. Therefore, it is crucial to ensure that these AI/ML systems do not make any discriminatory decisions for any specific groups or populations. In that vein, different bias detection and mitigation open-source software libraries (aka API libraries) are being developed and used. In this paper, we conduct a qualitative study to understand in what scenarios these open-source fairness APIs are used in the wild, how they are used, and what challenges the developers of these APIs face while developing and adopting these libraries. We have analyzed 204 GitHub repositories (from a list of 1885 candidate repositories) which used 13 APIs that are developed to address bias in ML software. We found that these APIs are used for two primary purposes (i.e., learning and solving real-world problems), targeting 17 unique use-cases. Our study suggests that developers are not well-versed in bias detection and mitigation; they face lots of troubleshooting issues, and frequently ask for opinions and resources. Our findings can be instrumental for future bias-related software engineering research, and for guiding educators in developing more state-of-the-art curricula.
- Abstract(参考訳): 機械学習ソフトウェアシステムは、日々の生活で頻繁に使われています。
これらのシステムの一部は、人生を変える決定を下すために、様々な敏感な環境で使われています。
したがって、これらのAI/MLシステムが特定のグループや集団に対して差別的な決定をしないことを保証することが不可欠である。
その流れの中で、異なるバイアス検出と緩和のオープンソースソフトウェアライブラリ(別名APIライブラリ)が開発され、使用されている。
本稿では、これらのオープンソースフェアネスAPIがどのようなシナリオで使われているのか、どのように使われているのか、そしてこれらのライブラリの開発と採用中に開発者が直面する課題について、質的研究を行う。
MLソフトウェアのバイアスに対処するために開発された13のAPIを使用した204のGitHubリポジトリ(1885年の候補リポジトリのリストから)を分析した。
これらのAPIは、2つの主要な目的(すなわち、現実世界の問題の学習と解決)に使用されており、17のユニークなユースケースをターゲットにしています。
私たちの研究は、開発者はバイアス検出と緩和に精通していないことを示唆している。
我々の発見は、将来のバイアス関連ソフトウェア工学の研究や、より最先端のカリキュラムを開発するための教育者の指導に役立てることができる。
関連論文リスト
- Identifying and Mitigating API Misuse in Large Language Models [26.4403427473915]
大規模言語モデル(LLM)が生成するコードのAPI誤用は、ソフトウェア開発において深刻な課題となっている。
本稿では LLM 生成コードにおける API の誤用パターンについて,Python および Java 間でのメソッド選択とパラメータ使用法の両方を解析し,総合的研究を行った。
上記の分類に基づくAPI誤用に対する新しいLCMベースの自動プログラム修復手法であるDr.Fixを提案する。
論文 参考訳(メタデータ) (2025-03-28T18:43:12Z) - Your Fix Is My Exploit: Enabling Comprehensive DL Library API Fuzzing with Large Language Models [49.214291813478695]
AIアプリケーションで広く使用されているディープラーニング(DL)ライブラリは、オーバーフローやバッファフリーエラーなどの脆弱性を含むことが多い。
従来のファジィングはDLライブラリの複雑さとAPIの多様性に悩まされている。
DLライブラリのためのLLM駆動ファジィ手法であるDFUZZを提案する。
論文 参考訳(メタデータ) (2025-01-08T07:07:22Z) - ExploraCoder: Advancing code generation for multiple unseen APIs via planning and chained exploration [70.26807758443675]
ExploraCoderはトレーニング不要のフレームワークで、大規模な言語モデルにコードソリューションで見えないAPIを呼び出す権限を与える。
実験の結果、ExploreaCoderは、事前のAPI知識に欠けるモデルのパフォーマンスを大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-12-06T19:00:15Z) - A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [14.665460257371164]
GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。
API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文 参考訳(メタデータ) (2024-09-23T17:22:09Z) - Retrieval-Augmented Test Generation: How Far Are We? [8.84734567720785]
Retrieval Augmented Generation (RAG)は、ソフトウェアエンジニアリングタスクの顕著な進歩を示している。
このギャップを埋めるために,テスト生成におけるRAGベースのLCMの有効性を検討する。
具体的には,1) APIドキュメント,2) GitHubイシュー,3) StackOverflow Q&Aの3種類のドメイン知識に基づいて構築されたRAGについて検討する。
論文 参考訳(メタデータ) (2024-09-19T11:48:29Z) - An Empirical Study of API Misuses of Data-Centric Libraries [9.667988837321943]
本稿では,データ処理,数値計算,機械学習,可視化などの分野をカバーする5つのデータ中心ライブラリのAPI誤用に関する実証的研究を行う。
Stack OverflowとGitHubのデータを分析することで、これらのライブラリの誤用を特定します。
論文 参考訳(メタデータ) (2024-08-28T15:15:52Z) - Private-Library-Oriented Code Generation with Large Language Models [52.73999698194344]
本稿では,大規模言語モデル(LLM)をプライベートライブラリのコード生成に活用することに焦点を当てる。
プログラマがプライベートコードを書く過程をエミュレートする新しいフレームワークを提案する。
TorchDataEval、TorchDataComplexEval、MonkeyEval、BeatNumEvalの4つのプライベートライブラリベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-07-28T07:43:13Z) - Do Not Take It for Granted: Comparing Open-Source Libraries for Software
Development Effort Estimation [9.224578642189023]
本稿では、ソフトウェア開発努力推定(SEE)に異なる機械学習(ML)ライブラリを使用する場合の差異に対する意識を高めることを目的とする。
各種言語(Scikit-Learn, Caret, Weka)で書かれた最も人気のあるMLオープンソースライブラリの3つで提供される決定論的機械学習について検討する。
本研究の結果,3つの図書館で提供される予測は,平均95%のケースで,合計105ケースで異なることがわかった。
論文 参考訳(メタデータ) (2022-07-04T20:06:40Z) - Federated and continual learning for classification tasks in a society
of devices [59.45414406974091]
Light Federated and Continual Consensus (LFedCon2)は、軽量で伝統的な学習者を用いた新しいフェデレーションおよび継続アーキテクチャである。
我々の方法では、スマートフォンやロボットのような無力デバイスが、リアルタイムで、ローカルで、継続的に、自律的に、そしてユーザーから学習することができる。
提案手法をスマートフォン利用者の異種コミュニティに適用し,歩行認識の課題を解決した。
論文 参考訳(メタデータ) (2020-06-12T12:37:03Z) - Interpreting Cloud Computer Vision Pain-Points: A Mining Study of Stack
Overflow [5.975695375814528]
本研究では,コンピュータビジョンサービスに対する開発者の不満について検討する。
モバイル開発のような成熟した分野とは違って、開発者が問う質問の種類は対照的である。
これらは、そのようなシステムを強化する技術について、浅い理解を示している。
論文 参考訳(メタデータ) (2020-01-28T00:56:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。