論文の概要: Studying the Transfer of Biases from Programmers to Programs
- arxiv url: http://arxiv.org/abs/2005.08231v2
- Date: Sun, 13 Dec 2020 17:06:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 05:51:04.121973
- Title: Studying the Transfer of Biases from Programmers to Programs
- Title(参考訳): プログラムからプログラムへのバイアスの移動に関する研究
- Authors: Johanna Johansen, Tore Pedersen, Christian Johansen
- Abstract要約: 文化的メタファと文脈的メタファの効果について検討し、それぞれがプログラマからプログラムへ移行するかどうかを検証し、機械バイアスを構成した。
その結果,文化的メタファがプログラマの選択に影響を及ぼし,文脈的メタファが文化的メタファの効果を中和あるいは増悪するために利用できることが示唆された。
これは、自動システムのバイアスが必ずしもマシンのトレーニングデータから発生するとは限らないという私たちの仮説を支持します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: It is generally agreed that one origin of machine bias is resulting from
characteristics within the dataset on which the algorithms are trained, i.e.,
the data does not warrant a generalized inference. We, however, hypothesize
that a different `mechanism', hitherto not articulated in the literature, may
also be responsible for machine's bias, namely that biases may originate from
(i) the programmers' cultural background, such as education or line of work, or
(ii) the contextual programming environment, such as software requirements or
developer tools. Combining an experimental and comparative design, we studied
the effects of cultural metaphors and contextual metaphors, and tested whether
each of these would `transfer' from the programmer to program, thus
constituting a machine bias. The results show (i) that cultural metaphors
influence the programmer's choices and (ii) that `induced' contextual metaphors
can be used to moderate or exacerbate the effects of the cultural metaphors.
This supports our hypothesis that biases in automated systems do not always
originate from within the machine's training data. Instead, machines may also
`replicate' and `reproduce' biases from the programmers' cultural background by
the transfer of cultural metaphors into the programming process. Implications
for academia and professional practice range from the micro programming-level
to the macro national-regulations or educational level, and span across all
societal domains where software-based systems are operating such as the popular
AI-based automated decision support systems.
- Abstract(参考訳): 一般に、機械バイアスの1つの起源は、アルゴリズムが訓練されたデータセット内の特性、すなわち、データは一般化された推論を保証していないことから生じる。
しかしながら、文献に記載されていない異なる「機械主義」は、機械のバイアス、すなわちバイアスが発する可能性があるという仮説を立てる。
(i)教育や作業の系統などプログラマーの文化的背景
(ii)ソフトウェア要件や開発ツールといった文脈プログラミング環境。
実験と比較設計を組み合わせることで,文化的メタファと文脈的メタファの効果を調べ,それぞれがプログラマからプログラムへ'転移'するかどうかを検証した。
結果が示します
(i)文化的なメタファーがプログラマの選択に影響を与え、
(二)文化的なメタファーの効果を中和又は増悪するために「引き起こされた」文脈メタファーを用いることができること。
これは、自動化システムのバイアスが必ずしもマシンのトレーニングデータ内にあるとは限らないという仮説を支持します。
代わりに、機械は、文化的メタファーをプログラミングプロセスに移すことによって、プログラマの文化的背景から'複製'や'再生産'バイアスを生じることもある。
アカデミアとプロのプラクティスの意義は、マイクロプログラミングレベルからマクロ国家規制や教育レベルまで、そして一般的なaiベースの自動意思決定支援システムのようなソフトウェアベースのシステムが動作するすべての社会ドメインにまたがる。
関連論文リスト
- NExT: Teaching Large Language Models to Reason about Code Execution [50.93581376646064]
大規模言語モデル(LLM)のコードは通常、プログラムの表面テキスト形式に基づいて訓練される。
NExTは,プログラムの実行トレースを検査し,実行時の動作を判断する手法である。
論文 参考訳(メタデータ) (2024-04-23T01:46:32Z) - Modelling Concurrency Bugs Using Machine Learning [0.0]
このプロジェクトは、一般的な機械学習アプローチと最近の機械学習アプローチを比較することを目的としている。
我々は、実生活(同時)プログラムをシミュレートする範囲で生成する合成データセットを定義する。
各種機械学習モデルモデルの基本的な限界に関する仮説を定式化する。
論文 参考訳(メタデータ) (2023-05-08T17:30:24Z) - On ML-Based Program Translation: Perils and Promises [17.818482089078028]
この研究は、教師なしのプログラム翻訳者とその失敗の理由を調査する。
入力が特定のパターンに従う場合、入力コードを前処理し、出力が特定のパターンに従う場合、出力を後処理するルールベースのプログラム突然変異エンジンを開発する。
将来的には、プログラムドメイン知識をMLベースの翻訳パイプラインに組み込むことができるエンドツーエンドのプログラム翻訳ツールを構想する。
論文 参考訳(メタデータ) (2023-02-21T16:42:20Z) - Using Document Similarity Methods to create Parallel Datasets for Code
Translation [60.36392618065203]
あるプログラミング言語から別のプログラミング言語へのソースコードの翻訳は、重要で時間を要する作業です。
本稿では、文書類似性手法を用いて、ノイズの多い並列データセットを作成することを提案する。
これらのモデルは、妥当なレベルのノイズに対して、地上の真実に基づいて訓練されたモデルと相容れない性能を示す。
論文 参考訳(メタデータ) (2021-10-11T17:07:58Z) - On the validity of pre-trained transformers for natural language
processing in the software engineering domain [78.32146765053318]
ソフトウェア工学データを用いて訓練されたBERT変換器モデルと一般領域データに基づく変換器との比較を行った。
ソフトウェアエンジニアリングのコンテキストを理解するために必要なタスクに対しては,ソフトウェアエンジニアリングデータの事前学習が重要であることを示す。
論文 参考訳(メタデータ) (2021-09-10T08:46:31Z) - Thinking Like Transformers [64.96770952820691]
本稿では,プログラミング言語の形式で変換器エンコーダの計算モデルを提案する。
RASPは、トランスフォーマーによって確実に学習できるタスクの解決策をプログラムするのにどのように使えるかを示す。
ヒストグラム、ソート、ダイク言語のためのRASPプログラムを提供する。
論文 参考訳(メタデータ) (2021-06-13T13:04:46Z) - Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。
私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。
当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文 参考訳(メタデータ) (2021-01-11T15:54:48Z) - Symbolic AI for XAI: Evaluating LFIT Inductive Programming for Fair and
Explainable Automatic Recruitment [11.460075612587591]
我々は,与えられたブラックボックスシステムと同等の命題論理理論を学習するICP手法を提案する。
本稿では,この問題に対するLFITの表現性を示し,他の領域に適用可能なスキームを提案する。
論文 参考訳(メタデータ) (2020-12-01T09:36:59Z) - Scenic: A Language for Scenario Specification and Data Generation [17.07493567658614]
本稿では,サイバー物理システムの設計と解析のための新しい確率型プログラミング言語を提案する。
本稿では,どの時点でも環境が「舞台」である自律走行車やロボットなどのシステムに焦点をあてる。
我々は、シーン上の分布とエージェントの振る舞いを時間とともに記述するドメイン固有言語、Scenicを設計する。
論文 参考訳(メタデータ) (2020-10-13T17:58:31Z) - Machine Learning for Software Engineering: A Systematic Mapping [73.30245214374027]
ソフトウェア開発業界は、現代のソフトウェアシステムを高度にインテリジェントで自己学習システムに移行するために、機械学習を急速に採用している。
ソフトウェアエンジニアリングライフサイクルの段階にわたって機械学習の採用について、現状を探求する包括的な研究は存在しない。
本研究は,機械学習によるソフトウェア工学(MLSE)分類を,ソフトウェア工学ライフサイクルのさまざまな段階に適用性に応じて,最先端の機械学習技術に分類するものである。
論文 参考訳(メタデータ) (2020-05-27T11:56:56Z) - Mitigating Gender Bias in Machine Learning Data Sets [5.075506385456811]
ジェンダーバイアスは雇用広告や採用ツールの文脈で特定されている。
本稿では,機械学習のためのトレーニングデータにおける性別バイアスの同定のための枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-14T12:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。