論文の概要: Machine Learning in the Wild: Early Evidence of Non-Compliant ML-Automation in Open-Source Software
- arxiv url: http://arxiv.org/abs/2603.29698v1
- Date: Tue, 31 Mar 2026 12:53:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.670045
- Title: Machine Learning in the Wild: Early Evidence of Non-Compliant ML-Automation in Open-Source Software
- Title(参考訳): 野における機械学習: オープンソースソフトウェアにおける非互換性ML自動化の早期証拠
- Authors: Zohaib Arshid, Daniele Bifolco, Fiorella Zampetti, Massimiliano Di Penta,
- Abstract要約: 本稿では,GitHub上の173のオープンソースプロジェクトによる機械学習モデルの使用に関する予備調査を行う。
我々は、モデルが意思決定に使用されるかどうか、これらの決定のスコープ、そして完全な自律システムに固有のリスクを減らすために後処理措置が取られているかどうかを評価する。
本研究は,開発者のガイドラインを定義し,ソフトウェアシステムにおけるMLモデルの使用に関する規制違反を自動的に検出する分析ツールを作成するための基礎となる。
- 参考スコア(独自算出の注目度): 6.407929369404772
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing availability of Machine Learning (ML) models, particularly foundation models, enables their use across a range of downstream applications, from scenarios with missing data to safety-critical contexts. This, in principle, may contravene not only the models' terms of use, but also governmental principles and regulations. This paper presents a preliminary investigation into the use of ML models by 173 open-source projects on GitHub, spanning 16 application domains. We evaluate whether models are used to make decisions, the scope of these decisions, and whether any post-processing measures are taken to reduce the risks inherent in fully autonomous systems. Lastly, we investigate the models' compliance with established terms of use. This study lays the groundwork for defining guidelines for developers and creating analysis tools that automatically identify potential regulatory violations in the use of ML models in software systems.
- Abstract(参考訳): 機械学習(ML)モデルの可用性の向上、特に基礎モデルにより、データ不足のシナリオから安全クリティカルなコンテキストに至るまで、さまざまなダウンストリームアプリケーションで使用できるようになる。
これは原則として、モデルの使用規約だけでなく、政府の原則や規則にも反する可能性がある。
本稿では,GitHub上の173のオープンソースプロジェクトによるMLモデルの使用について,16のアプリケーションドメインを対象とした予備調査を行う。
我々は、モデルが意思決定に使用されるかどうか、これらの決定のスコープ、そして完全な自律システムに固有のリスクを減らすために後処理措置が取られているかどうかを評価する。
最後に、確立された使用条件に対するモデルのコンプライアンスについて検討する。
本研究は,開発者のガイドラインを定義し,ソフトウェアシステムにおけるMLモデルの使用に関する規制違反を自動的に検出する分析ツールを作成するための基礎となる。
関連論文リスト
- On the Robustness of Fairness Practices: A Causal Framework for Systematic Evaluation [17.020173966728507]
機械学習アルゴリズムは、社会経済の応用において重要な決定を下すために、ますます普及している。
データ駆動とパターン探索の性質から、MLアルゴリズムは、異なる集団グループ間で機会、利益、資源、あるいは情報を不均等に分散する決定ロジックを開発することができる。
ソフトウェアエンジニアリングとMLコミュニティは、公正なMLソフトウェアを作成するためのベストプラクティスを確立するために、多大な努力をしています。
論文 参考訳(メタデータ) (2026-01-07T06:02:53Z) - Gradient-Based Model Fingerprinting for LLM Similarity Detection and Family Classification [6.008384763761687]
大規模言語モデル(LLM)は、現代のアプリケーションにおいて重要なソフトウェアコンポーネントである。
類似性検出と家族分類のための勾配型フィンガープリントフレームワークGuardを提示する。
本稿では,ランダムな入力摂動に対する応答を解析することにより,モデル固有の行動シグネチャを抽出する。
広く採用されているセーフテンソルフォーマットをサポートし、勾配特性の統計解析を通じて高次元指紋を構築する。
論文 参考訳(メタデータ) (2025-06-02T13:08:01Z) - Network Resource Optimization for ML-Based UAV Condition Monitoring with Vibration Analysis [54.550658461477106]
条件監視(CM)は機械学習(ML)モデルを使用して異常および異常な条件を識別する。
本研究では,MLベースのUAV CMフレームワークにおけるネットワークリソースの最適化について検討する。
次元削減技術を活用することで、ネットワークリソース消費の99.9%が削減される。
論文 参考訳(メタデータ) (2025-02-21T14:36:12Z) - Training Compute Thresholds: Features and Functions in AI Regulation [0.7234862895932991]
米国とEUのレギュレータは、トレーニング計算に基づくしきい値を使用して、大規模社会被害のリスクを引き起こす可能性のあるGPAIモデルを特定している。
現在、トレーニング計算は、規制の監視とさらなる精査に値するGPAIモデルを特定するのに最も適した指標である、と我々は主張する。
GPAI技術と市場構造が進化するにつれて、規制当局は計算しきい値を更新し、他のメトリクスを規制審査プロセスに補完する必要がある。
論文 参考訳(メタデータ) (2024-05-17T14:10:24Z) - Unveiling the Misuse Potential of Base Large Language Models via In-Context Learning [61.2224355547598]
大規模言語モデル(LLM)のオープンソース化は、アプリケーション開発、イノベーション、科学的進歩を加速させる。
我々の調査は、この信念に対する重大な監視を露呈している。
我々の研究は、慎重に設計されたデモを配置することにより、ベースLSMが悪意のある命令を効果的に解釈し実行できることを実証する。
論文 参考訳(メタデータ) (2024-04-16T13:22:54Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - Self-Destructing Models: Increasing the Costs of Harmful Dual Uses of
Foundation Models [103.71308117592963]
本稿ではメタラーニングと逆学習の技法を活用した自己破壊モデルの学習アルゴリズムを提案する。
小規模な実験では、MLACは、BERTスタイルのモデルが性別識別を行うために再目的化されることをほとんど防ぐことができることを示す。
論文 参考訳(メタデータ) (2022-11-27T21:43:45Z) - A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。
MLモデルは古いデータをよく記憶します。
機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文 参考訳(メタデータ) (2022-09-06T08:51:53Z) - A Model-Driven Engineering Approach to Machine Learning and Software
Modeling [0.5156484100374059]
モデルは、ソフトウェア工学(SE)と人工知能(AI)のコミュニティで使われている。
主な焦点はIoT(Internet of Things)とCPS(Smart Cyber-Physical Systems)のユースケースである。
論文 参考訳(メタデータ) (2021-07-06T15:50:50Z) - Practical Machine Learning Safety: A Survey and Primer [81.73857913779534]
自動運転車のような安全クリティカルなアプリケーションにおける機械学習アルゴリズムのオープンワールド展開は、さまざまなML脆弱性に対処する必要がある。
一般化エラーを低減し、ドメイン適応を実現し、外乱例や敵攻撃を検出するための新しいモデルと訓練技術。
我々の組織は、MLアルゴリズムの信頼性を異なる側面から向上するために、最先端のML技術を安全戦略にマッピングする。
論文 参考訳(メタデータ) (2021-06-09T05:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。