論文の概要: The Prevalence and Impact of Licenses in Open Software Projects
- arxiv url: http://arxiv.org/abs/2606.23445v1
- Date: Mon, 22 Jun 2026 15:01:02 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-24 20:39:12.231051
- Title: The Prevalence and Impact of Licenses in Open Software Projects
- Title(参考訳): オープンソースプロジェクトにおけるライセンスの状況と影響
- Authors: Mahmoud Jahanshahi, Bogdan Vasilescu, Audris Mockus,
- Abstract要約: 1億以上のソフトウェアプロジェクトのライセンスとライセンスタイプを特定します。
寛容なライセンスは、時間の経過とともにすべてのライセンスの比率が増加することを示している。
C言語エコシステムではアクティビティが減少し,Pythonでは制限的なライセンス移行と許容的なライセンス移行を比較すると,アクティビティが増加した。
- 参考スコア(独自算出の注目度): 11.111309839462814
- License:
- Abstract: The terms of how publicly available source code can be used are dictated by its license. The license (or its absence), in turn, affects what code the project may reuse and how its code can be (re)used and may also affect external participation and overall activity of the project. We aim to better understand the general state of license distribution overall and within language ecosystems and to investigate if license changes are associated with a noticeable variations of project output. To accomplish that we identify licenses and license types for over 100M software projects and find that most do not contain any license, that permissive licenses represent the bulk of most licenses, and that permissive licensing is representing an increasing proportion of all licenses over time. Restrictive licenses are more likely to be retained, however. There is a great variation among language ecosystems with C-language strongly favoring restrictive licenses. The analysis of license change impact comparing activity within one year of the adoption of the initial and final licenses shows that the change from restrictive to permissive license varies with the ecosystem. C-language ecosystems show reduced activity while Python shows increased activity when comparing restrictive to permissive license transition. Our results demonstrate dramatic changes in license type prevalence over time and find that the effects of license changes may have opposite effects depending on the language ecosystem.
- Abstract(参考訳): 公開されているソースコードの使用規約は、ライセンスによって規定されている。
ライセンス(あるいはその欠如)は、プロジェクトの再利用するコードやそのコードの再利用方法に影響を与え、プロジェクトの外部への参加や全体的な活動にも影響を与えます。
我々は,ライセンス配布の全体および言語エコシステムの一般的な状況をよりよく理解し,ライセンス変更がプロジェクトアウトプットの顕著なバリエーションと関連しているかどうかを検討することを目的としている。
1億以上のソフトウェアプロジェクトのライセンスとライセンスタイプを特定し、ほとんどのライセンスが一切含まれていないこと、許容ライセンスがほとんどのライセンスの大部分を表していること、許容ライセンスが時間の経過とともにすべてのライセンスの割合の増加を表していること、を確認します。
しかし、制限的なライセンスは保持される傾向にある。
言語エコシステムには大きなバリエーションがあり、C言語は制限的なライセンスを強く支持している。
最初のライセンスと最終ライセンスが採用されてから1年以内に活動を比較するライセンス変更の影響の分析は、制限的なライセンスから許容的なライセンスへの変更がエコシステムによって異なることを示している。
C言語エコシステムではアクティビティが減少し,Pythonでは制限的なライセンス移行と許容的なライセンス移行を比較すると,アクティビティが増加した。
以上の結果から,ライセンス形態の頻度が時間とともに劇的に変化していること,また,ライセンス変更の効果が言語エコシステムによっては逆の影響を及ぼす可能性が示唆された。
関連論文リスト
- CommonLID: Re-evaluating State-of-the-Art Language Identification Performance on Web Data [56.043078390377076]
我々はコミュニティ主導のウェブドメイン向けLIDベンチマークであるCommonLIDを紹介する。
我々は,他の5つの共通評価セットと合わせて,CommonLIDの価値を示し,8つのLIDモデルを検証した。
既存の評価では、Webドメイン内の多くの言語に対して、LIDの精度を過大評価している。
論文 参考訳(メタデータ) (2026-01-25T22:49:30Z) - How Do Semantically Equivalent Code Transformations Impact Membership Inference on LLMs for Code? [56.42119949944239]
意味論的に等価なコード変換規則がMI検出の回避に有効かどうかを検討する。
各ルールで最悪の場合、モデルの精度はわずか1.5%低下する。
コードのための大規模言語モデルをトレーニングするためのライセンスコンプライアンスの実施において,我々の結果は重大な欠陥を露呈する。
論文 参考訳(メタデータ) (2025-12-17T14:12:54Z) - Scaling Laws for Code: Every Programming Language Matters [73.6302896079007]
コード大言語モデル(Code LLM)は強力だが、トレーニングにはコストがかかる。
異なるプログラミング言語(PL)は、ベースモデルの性能に大きな影響を及ぼす事前トレーニングの間に様々な影響を与える。
本稿では,多言語コードの事前学習のためのスケーリング法則を初めて体系的に検討する。
論文 参考訳(メタデータ) (2025-12-15T16:07:34Z) - LiveCLKTBench: Towards Reliable Evaluation of Cross-Lingual Knowledge Transfer in Multilingual LLMs [67.09110757873142]
言語間知識伝達の分離と計測を目的とした自動生成パイプラインであるLiveCLKTBenchを提案する。
我々のパイプラインは、実世界のドメインから自己完結した、時間に敏感な知識エンティティを識別する。
これらの有効なエンティティのドキュメントは、複数の言語に翻訳される事実的な質問を生成するために使用される。
論文 参考訳(メタデータ) (2025-11-03T17:06:49Z) - Small Changes, Big Trouble: Demystifying and Parsing License Variants for Incompatibility Detection in the PyPI Ecosystem [25.857078417049035]
我々は,PyPIエコシステムにおけるライセンス変種に関する実証的研究を行った。
差分に基づく手法と大規模言語モデルを活用した,効率的なライセンス変種解析のための新しいアプローチであるLV-を導入する。
LV-は計算コストを30%削減しながら0.936の精度を達成し、LV-Compatは0.98の既存の方法よりも5.2倍互換性のないパッケージを識別する。
論文 参考訳(メタデータ) (2025-07-19T12:41:33Z) - Catch the Butterfly: Peeking into the Terms and Conflicts among SPDX
Licenses [16.948633594354412]
ソフトウェア開発におけるサードパーティライブラリ(TPL)は、モダンなソフトウェアの開発を加速している。
開発者は必然的にTPLのライセンスを侵害し、法的問題を引き起こす可能性がある。
幅広い主要なライセンスを含む高品質なライセンスデータセットが必要である。
論文 参考訳(メタデータ) (2024-01-19T11:27:34Z) - Detecting and Fixing Violations of Modification Terms in Open Source
Licenses during Forking [4.682961105225832]
まず、47のオープンソースライセンスで修正条項を実証的に特徴付けます。
この研究に触発されて、私たちはLiVoを設計し、フォーク中のオープンソースライセンスの修正条項の違反を自動的に検出し、修正します。
論文 参考訳(メタデータ) (2023-10-12T02:37:06Z) - QA-LoRA: Quantization-Aware Low-Rank Adaptation of Large Language Models [85.02796681773447]
量子化対応低ランク適応(QA-LoRA)アルゴリズムを提案する。
その動機は量子化と適応の自由の不均衡度にある。
QA-LoRAは数行のコードで簡単に実装できる。
論文 参考訳(メタデータ) (2023-09-26T07:22:23Z) - LiResolver: License Incompatibility Resolution for Open Source Software [13.28021004336228]
LiResolverは、オープンソースソフトウェアのライセンス不互換性問題を解決するための、きめ細かい、スケーラブルで柔軟なツールです。
総合的な実験ではLiResolverの有効性が示され、不整合問題の局所化には4.09%の偽陽性(FP)と0.02%の偽陰性(FN)が有効である。
論文 参考訳(メタデータ) (2023-06-26T13:16:09Z) - Lessons from Formally Verified Deployed Software Systems (Extended version) [65.69802414600832]
本稿は、正式に認証されたシステムを作成し、実際に使用するためにデプロイした各種のアプリケーション分野のプロジェクトについて検討する。
使用する技術、適用の形式、得られた結果、そしてソフトウェア産業が形式的な検証技術やツールの恩恵を受ける能力について示すべき教訓を考察する。
論文 参考訳(メタデータ) (2023-01-05T18:18:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。