論文の概要: CodeGenLink: A Tool to Find the Likely Origin and License of Automatically Generated Code
- arxiv url: http://arxiv.org/abs/2510.01077v1
- Date: Wed, 01 Oct 2025 16:21:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.665338
- Title: CodeGenLink: A Tool to Find the Likely Origin and License of Automatically Generated Code
- Title(参考訳): CodeGenLink: 自動生成されたコードの起源とライセンスを見つけるツール
- Authors: Daniele Bifolco, Guido Annicchiarico, Pierluigi Barbiero, Massimiliano Di Penta, Fiorella Zampetti,
- Abstract要約: CodeGenLinkは、Visual Studio Code用のGitHub CoPilotエクステンションである。
大規模言語モデルとWeb検索機能を組み合わせた候補リンクを検索する。
生成されたコードと検索されたコード間の類似性解析を行う。
- 参考スコア(独自算出の注目度): 5.97283267447245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are widely used in software development tasks nowadays. Unlike reusing code taken from the Web, for LLMs' generated code, developers are concerned about its lack of trustworthiness and possible copyright or licensing violations, due to the lack of code provenance information. This paper proposes CodeGenLink, a GitHub CoPilot extension for Visual Studio Code aimed at (i) suggesting links containing code very similar to automatically generated code, and (ii) whenever possible, indicating the license of the likely origin of the code. CodeGenLink retrieves candidate links by combining LLMs with their web search features and then performs similarity analysis between the generated and retrieved code. Preliminary results show that CodeGenLink effectively filters unrelated links via similarity analysis and provides licensing information when available. Tool URL: https://github.com/danielebifolco/CodeGenLink Tool Video: https://youtu.be/M6nqjBf9_pw
- Abstract(参考訳): 大規模言語モデル(LLM)はソフトウェア開発タスクで広く使われている。
LLMが生成したコードをWebから取得した再利用コードとは異なり、開発者はその信頼性の欠如と著作権やライセンス侵害の可能性があることを懸念している。
この記事では,Visual Studio Code用のGitHub CoPilotエクステンションであるCodeGenLinkを提案する。
二 自動生成されたコードと非常によく似たコードを含むリンクを提案すること。
(ii) 可能であればいつでも、コードの起源となる可能性のあるライセンスを示す。
CodeGenLink は LLM と Web 検索機能を組み合わせて候補リンクを検索し,生成したコードと検索したコード間の類似性解析を行う。
予備的な結果から、CodeGenLinkは、類似性分析によって非関連リンクを効果的にフィルタリングし、利用可能であればライセンス情報を提供する。
ツールURL: https://github.com/danielebifolco/CodeGenLink Tool Video: https://youtu.be/M6nqjBf9_pw
関連論文リスト
- IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - CodeRAG: Supportive Code Retrieval on Bigraph for Real-World Code Generation [69.684886175768]
大規模言語モデル(LLM)は、自動コード生成において有望なパフォーマンスを示している。
本稿では,検索拡張コード生成フレームワークであるCodeRAGを提案する。
実験によると、CodeRAGはRAGのシナリオと比較して大幅に改善されている。
論文 参考訳(メタデータ) (2025-04-14T09:51:23Z) - Do LLMs Provide Links to Code Similar to what they Generate? A Study with Gemini and Bing CoPilot [7.056819594470789]
大規模言語モデル(LLM)は現在、様々なソフトウェア開発タスクに使われている。
Webからの再利用とは異なり、LLMは生成されたコードに関する証明情報の提供に限られている。
本稿では,Bing CoPilot と Google Gemini のリンクから得られたと思われる6つのプログラミング言語で,243 と 194 のコードスニペットがどの程度の頻度で使われているかを評価する実験的な研究結果を示す。
論文 参考訳(メタデータ) (2025-01-21T13:47:22Z) - VersiCode: Towards Version-controllable Code Generation [58.82709231906735]
大規模言語モデル(LLM)は、コード生成において大きな進歩を遂げていますが、既存の研究は、ソフトウェア開発の動的な性質を説明できません。
バージョン別コード補完(VSCC)とバージョン別コードマイグレーション(VACM)の2つの新しいタスクを提案する。
VersiCodeについて広範な評価を行い、バージョン管理可能なコード生成が確かに重要な課題であることを示した。
論文 参考訳(メタデータ) (2024-06-11T16:15:06Z) - Assured LLM-Based Software Engineering [51.003878077888686]
この記事では,2024年4月15日にポルトガルのリスボンで開催された International Workshop on Interpretability, Robustness, and Benchmarking in Neural Software Engineering で,Mark Harman 氏による基調講演の内容の概要を紹介する。
論文 参考訳(メタデータ) (2024-02-06T20:38:46Z) - A^3-CodGen: A Repository-Level Code Generation Framework for Code Reuse with Local-Aware, Global-Aware, and Third-Party-Library-Aware [13.27883339389175]
本稿では,A3-CodGenと呼ばれる新しいコード生成フレームワークを提案する。
その結果、A3-CodGenフレームワークを採用することで、コードリポジトリ情報をLLMに抽出、ヒューズ、フィードし、より正確で、効率的で、再利用性の高いコードを生成します。
論文 参考訳(メタデータ) (2023-12-10T05:36:06Z) - InCoder: A Generative Model for Code Infilling and Synthesis [88.46061996766348]
InCoderは、プログラム合成(左から右への生成)と編集(埋め込み)が可能な統合生成モデルである。
InCoderは、許可されたコードの大きなコーパスからコードファイルを生成するように訓練されている。
私たちのモデルは、ゼロショットコードの埋め込みを直接実行できる最初の生成モデルです。
論文 参考訳(メタデータ) (2022-04-12T16:25:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。