Fugu-MT 論文翻訳(概要): An Empirical Study of Java Code Improvements Based on Stack Overflow Answer Edits

論文の概要: An Empirical Study of Java Code Improvements Based on Stack Overflow Answer Edits

arxiv url: http://arxiv.org/abs/2511.05813v1
Date: Sat, 08 Nov 2025 03:01:55 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-11 21:18:44.591356
Title: An Empirical Study of Java Code Improvements Based on Stack Overflow Answer Edits
Title（参考訳）: Stack Overflow Answer Editsに基づくJavaコードの改善に関する実証的研究
Authors: In-on Wiratsin, Chaiyong Ragkhitwetsagul, Matheus Paixao, Denis De Sousa, Pongpop Lapvikai, Peter Haddawy,
Abstract要約: 最適化コードはソフトウェアシステムで広く使われている。開発者は、技術知識のギャップ、不十分な経験、時間的プレッシャー、管理上の決定、個人的な要因などの要因によって、しばしば低品質のコードを書く。我々は,SO Javaの回答編集に関する実証的研究とそのオープンソースプロジェクトにおけるコード改善への応用について述べる。
参考スコア（独自算出の注目度）: 0.22166578153935793
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Suboptimal code is prevalent in software systems. Developers often write low-quality code due to factors like technical knowledge gaps, insufficient experience, time pressure, management decisions, or personal factors. Once integrated, the accumulation of this suboptimal code leads to significant maintenance costs and technical debt. Developers frequently consult external knowledge bases, such as API documentation and Q&A websites like Stack Overflow (SO), to aid their programming tasks. SO's crowdsourced, collaborative nature has created a vast repository of programming knowledge. Its community-curated content is constantly evolving, with new answers posted or existing ones edited. In this paper, we present an empirical study of SO Java answer edits and their application to improving code in open-source projects. We use a modified code clone search tool to analyze SO code snippets with version history and apply it to open-source Java projects. This identifies outdated or unoptimized code and suggests improved alternatives. Analyzing 140,840 Java accepted answers from SOTorrent and 10,668 GitHub Java projects, we manually categorized SO answer edits and created pull requests to open-source projects with the suggested code improvements. Our results show that 6.91% of SO Java accepted answers have more than one revision (average of 2.82). Moreover, 49.24% of the code snippets in the answer edits are applicable to open-source projects, and 11 out of 36 proposed bug fixes based on these edits were accepted by the GitHub project maintainers.
Abstract（参考訳）: 最適化コードはソフトウェアシステムで広く使われている。開発者は、技術知識のギャップ、不十分な経験、時間的プレッシャー、管理上の決定、個人的な要因などの要因によって、しばしば低品質のコードを書く。ひとたび統合されると、この準最適コードの蓄積は、大幅なメンテナンスコストと技術的負債につながる。開発者は、APIドキュメンテーションやStack Overflow(SO)のようなQ&AWebサイトといった外部の知識ベースを参照して、プログラミングタスクを支援します。 SOのクラウドソースで協調的な性質は、プログラミング知識の膨大なリポジトリを作成しました。コミュニティが編集したコンテンツは常に進化しており、新しい回答が投稿されたり、既存のコンテンツが編集されたりしている。本稿では,SO Java の回答編集に関する実証的研究とそのオープンソースプロジェクトにおけるコード改善への応用について述べる。修正されたコードクローン検索ツールを使用して、バージョン履歴を持つSOコードスニペットを分析し、それをオープンソースのJavaプロジェクトに応用します。これは時代遅れまたは最適化されていないコードを特定し、改善された代替案を提案する。 SOTorrentと10,668のGitHub Javaプロジェクトから140,840のJavaが受け入れられた回答を分析して、SOの回答編集を手作業で分類し、提案されたコード改善でオープンソースプロジェクトへのプルリクエストを作成しました。我々の結果は、SO Javaが受け入れた回答の6.91%が、複数のリビジョン(平均2.82件)を持っていることを示している。さらに、回答編集のコードスニペットの49.24%がオープンソースプロジェクトに適用され、これらの編集に基づいて提案された36のバグ修正のうち11がGitHubプロジェクトのメンテナによって受け入れられた。

関連論文リスト

Adoption and Evolution of Code Style and Best Programming Practices in Open-Source Projects [2.9439848714137447]
本稿では,GITHUB 上で人気の 1,036 のオープンソース JAVA プロジェクトを分析し,コードスタイルとプログラミングの実践が時間とともにどのように採用され,進化するかを考察する。 JavadocとNamingの違反が最も一般的です。また、GOOGLE Javaスタイルガイドには、最新の静的解析ツールが欠落することが多いカテゴリで、かなりの数の違反があったこともわかりました。
論文参考訳（メタデータ） (2026-01-14T19:48:47Z)
Does Editing Improve Answer Quality on Stack Overflow? A Data-Driven Investigation [5.176434782905268]
Stack Overflowのような技術Q&Aプラットフォームの低品質な回答には、非効率性、バグ、セキュリティ脆弱性が導入されている。コンテンツ品質を改善するために、SOは共同編集を可能にする。我々は,少なくとも1つの編集を受理したPython関連の94,994の回答を分析し,編集がセマンティック関連性,コード使用性,(3)コードの複雑さ,(4)セキュリティ脆弱性,(5)コードの最適化,(6)可読性を改善するかどうかを判定する。
論文参考訳（メタデータ） (2025-07-28T20:51:55Z)
SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文参考訳（メタデータ） (2025-05-29T18:28:02Z)
GBM Returns the Best Prediction Performance among Regression Approaches: A Case Study of Stack Overflow Code Quality [2.5515299924109858]
Stack Overflow(Java)コード品質を予測する変数と、最高の予測能力を提供する回帰アプローチを検討した。長いStack Overflowコードは、コード違反が多い傾向があり、より高いスコアを得た質問は、より多くのビューを惹きつけ、Stack Overflowの質問に追加される回答が増えるほど、提供されるコードには通常より多くのエラーが観測される。
論文参考訳（メタデータ） (2025-05-15T07:04:17Z)
Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文参考訳（メタデータ） (2024-10-29T12:21:23Z)
Towards Better Answers: Automated Stack Overflow Post Updating [11.85319691188159]
このタスクのために、Soup(Stack Overflow Updator for Post)という新しいフレームワークを紹介します。 Soup氏は、Valid Comment-Edit Prediction(VCP)とAutomatic Post Updating(APU)の2つの重要なタスクに対処している。
論文参考訳（メタデータ） (2024-08-17T04:48:53Z)
CodeRAG-Bench: Can Retrieval Augment Code Generation? [78.37076502395699]
検索拡張生成を用いたコード生成の系統的,大規模な解析を行う。まず、コード生成タスクの3つのカテゴリを含む総合的な評価ベンチマークであるCodeRAG-Benchをキュレートする。 CodeRAG-Bench上のトップパフォーマンスモデルについて、1つまたは複数のソースから検索したコンテキストを提供することにより検討する。
論文参考訳（メタデータ） (2024-06-20T16:59:52Z)
Long Code Arena: a Set of Benchmarks for Long-Context Code Models [75.70507534322336]
Long Code Arenaは、プロジェクト全体のコンテキストを必要とするコード処理タスクのための6つのベンチマークスイートである。これらのタスクは、ライブラリベースのコード生成、CIビルドの修復、プロジェクトレベルのコード補完、コミットメッセージ生成、バグローカライゼーション、モジュールの要約といった、コード処理のさまざまな側面をカバーする。各タスクに対して、テスト用の手作業によるデータセット、評価スイート、オープンソースのベースラインソリューションを提供しています。
論文参考訳（メタデータ） (2024-06-17T14:58:29Z)
How Do Java Developers Reuse StackOverflow Answers in Their GitHub Projects? [5.064338135936606]
StackOverflow (SO)は、ソフトウェア開発者およびコンピュータ科学者のための広く使われているQ&A(Q&A)ウェブサイトである。 GitHubは、ソフトウェアプロジェクトの保存、追跡、コラボレーションに使用されるオンライン開発プラットフォームである。私たちは、GitHubで利用可能なJavaプロジェクトで再利用されたSOの回答をマイニングして、実証的研究を行いました。
論文参考訳（メタデータ） (2023-08-18T14:04:59Z)
Coeditor: Leveraging Contextual Changes for Multi-round Code Auto-editing [57.776971051512234]
本研究では,複数ラウンドのコードの自動編集設定について検討し,その内部の最近の変更に基づいて,コード領域への編集を予測することを目的とした。我々のモデルであるCoeditorは、コード編集タスクに特化して設計された微調整言語モデルである。単純化されたシングルラウンドのシングル編集タスクでは、Coeditor は GPT-3.5 と SOTA のオープンソースコード補完モデルを大幅に上回っている。
論文参考訳（メタデータ） (2023-05-29T19:57:36Z)
RepoCoder: Repository-Level Code Completion Through Iterative Retrieval and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文参考訳（メタデータ） (2023-03-22T13:54:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。