論文の概要: Exploring Scientific Debt: Harnessing AI for SATD Identification in Scientific Software
- arxiv url: http://arxiv.org/abs/2511.17368v1
- Date: Fri, 21 Nov 2025 16:34:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.111557
- Title: Exploring Scientific Debt: Harnessing AI for SATD Identification in Scientific Software
- Title(参考訳): 科学的負債の探索:科学ソフトウェアにおけるSATD識別のためのハーネスングAI
- Authors: Eric L. Melin, Ahmed Musa Awon, Nasir U. Eisty, Neil A. Ernst, Shurui Zhou,
- Abstract要約: 本研究では,Scientific Software(SSW)におけるSATD(Self-Admitted Technical Debt)について検討する。
SATDを複数のドメインや言語にまたがる27の科学的および汎用リポジトリで分析した。
SSWは9.25倍のScientific Debtと4.93倍のSATDを含んでいる。
- 参考スコア(独自算出の注目度): 5.133973498885276
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developers often leave behind clues in their code, admitting where it falls short, known as Self-Admitted Technical Debt (SATD). In the world of Scientific Software (SSW), where innovation moves fast and collaboration is key, such debt is not just common but deeply impactful. As research relies on accurate and reproducible results, accumulating SATD can threaten the very foundations of scientific discovery. Yet, despite its significance, the relationship between SATD and SSW remains largely unexplored, leaving a crucial gap in understanding how to manage SATD in this critical domain. This study explores SATD in SSW repositories, comparing SATD in scientific versus general-purpose open-source software and evaluating transformer-based models for SATD identification. We analyzed SATD in 27 scientific and general-purpose repositories across multiple domains and languages. We fine-tuned and compared 10 transformer-based models (100M-7B parameters) on 67,066 labeled code comments. SSW contains 9.25x more Scientific Debt and 4.93x more SATD than general-purpose software due to complex computations, domain constraints, and evolving research needs. Furthermore, our best model outperforms existing ones. This study uncovers how SATD in SSW differs from general software, revealing its impact on quality and scientific validity. By recognizing these challenges, developers and researchers can adopt smarter strategies to manage debt and safeguard the integrity of scientific discovery.
- Abstract(参考訳): 開発者がコードに手掛かりを残して,自己承認技術的負債(SATD, Self-Admitted Technical Debt)と呼ばれる,短所を認めることがよくあります。
イノベーションが速く動き、コラボレーションが鍵となるScientific Software(SSW)の世界では、そのような負債は一般的ではなく、深く影響を受けています。
研究は正確で再現可能な結果に依存しているため、SATDの蓄積は科学的な発見の基盤を脅かす可能性がある。
しかし、SATDとSSWの関係はいまだに未解明であり、この重要な領域におけるSATDの管理方法を理解する上で重要なギャップを残している。
本研究では,SSWレポジトリにおけるSATDについて検討し,科学と汎用オープンソースソフトウェアにおけるSATDを比較し,SATD識別のためのトランスフォーマーモデルの評価を行った。
SATDを複数のドメインや言語にまたがる27の科学的および汎用リポジトリで分析した。
67,066個のラベル付きコードコメントに対して10個のトランスフォーマーベースモデル(100M-7Bパラメータ)を微調整し比較した。
SSWには9.25倍の科学的負債と4.93倍のSATDが含まれている。
さらに、私たちの最高のモデルは既存のモデルよりも優れています。
本研究は、SATDが一般ソフトウェアとどのように異なるかを明らかにし、品質と科学的妥当性に与える影響を明らかにした。
これらの課題を認識することで、開発者と研究者は、負債を管理し、科学的発見の完全性を保護するスマートな戦略を採用することができる。
関連論文リスト
- Hidden in Plain Sight: Where Developers Confess Self-Admitted Technical Debt [3.0178994719454564]
Self-Admitted Technical Debt (SATD)は、プロアクティブなソフトウェアのメンテナンスに不可欠である。
従来の研究は主にSATDの検出と優先順位付けを目標としており、SATDに係わるソースコードにはほとんど焦点を当てていない。
我々は、9000以上のJava Open Source Software (OSS)リポジトリからのコードコメントを含む広範なSATDデータセットであるPENTACETを活用している。
SATDが最も一般的に発生する場所と、最も頻繁に影響を受けるコード構成/ステートメントを定量的に推測する。
論文 参考訳(メタデータ) (2025-11-03T12:47:19Z) - A First Look at the Self-Admitted Technical Debt in Test Code: Taxonomy and Detection [7.475625941772781]
自己承認技術的負債(Self-admitted Technical debt,SATD)とは、開発者がコードの問題や回避策、あるいは準最適ソリューションを明確に認めるコメントのことである。
本研究では,1000のオープンソースJavaプロジェクトを対象に,160万件のコメントからランダムに5万件のコメントをランダムに分析することにより,SATDをテストコードで解析する。
論文 参考訳(メタデータ) (2025-10-25T19:09:18Z) - Understanding Self-Admitted Technical Debt in Test Code: An Empirical Study [2.1295493440485513]
開発者は、コードコメントで技術的負債を明示的に文書化しており、Set-Admitted Technical Debt (SATD)と呼ばれる。
本研究の目的は,テストコードにおけるSATDの性質を明らかにすることである。
また,テストコード中のSATDタイプを包括的に分類し,SATDコメントを自動的に分類する機械学習モデルを開発した。
論文 参考訳(メタデータ) (2025-10-25T11:00:48Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - Demystifying Scientific Problem-Solving in LLMs by Probing Knowledge and Reasoning [53.82037883518254]
SciReasは、科学的推論タスクのための様々なベンチマークスイートである。
次に、科学的タスクにおける推論と知識の異なる役割を研究するための探索フレームワークであるKRUXを提案する。
論文 参考訳(メタデータ) (2025-08-26T17:04:23Z) - HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights [72.82973609312178]
HiPerRAGは360万以上の科学論文から知識をインデクシングし取り出すワークフローである。
コアとなるのはマルチモーダル文書解析のための高スループットモデルであるOreoと、クエリ対応エンコーダの微調整アルゴリズムであるColTrastだ。
HiPerRAGは、既存の科学的質問応答ベンチマークと、この研究で導入された2つの新しいベンチマークで堅牢なパフォーマンスを提供する。
論文 参考訳(メタデータ) (2025-05-07T22:50:23Z) - SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models [78.06537464850538]
シミュレーションは,実画像に翻訳する空間的適性を与えるのに驚くほど効果的であることを示す。
シミュレーションにおける完全アノテーションは、擬似アノテーション実画像の既存のアプローチよりも効果的であることを示す。
論文 参考訳(メタデータ) (2024-12-10T18:52:45Z) - Evidence is All We Need: Do Self-Admitted Technical Debts Impact Method-Level Maintenance? [1.0377683220196874]
Self-Admitted Technical Debt (SATD)は、開発者がソースコードのコメントを通じて技術的負債を明示的に認める現象である。
本稿では,SATDがソフトウェア保守の様々な面に与える影響を,方法論レベルで実証的に検討することを目的とする。
論文 参考訳(メタデータ) (2024-11-21T01:21:35Z) - DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.74065769505137]
本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文 参考訳(メタデータ) (2024-06-10T20:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。