Fugu-MT 論文翻訳(概要): Exploring Code Comprehension in Scientific Programming: Preliminary Insights from Research Scientists

論文の概要: Exploring Code Comprehension in Scientific Programming: Preliminary Insights from Research Scientists

arxiv url: http://arxiv.org/abs/2501.10037v1
Date: Fri, 17 Jan 2025 08:47:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-20 17:59:09.697661
Title: Exploring Code Comprehension in Scientific Programming: Preliminary Insights from Research Scientists
Title（参考訳）: 科学プログラミングにおけるコード理解の探求--研究者による予備的考察
Authors: Alyssia Chen, Carol Wong, Bonita Sharif, Anthony Peruma,
Abstract要約: 本研究では、さまざまな分野の57人の科学者を対象に、コード可読性に関して直面するプログラミングの背景、実践、課題について調査する。科学者は主にPythonとRを使用し、可読性に関するドキュメントに依存している。以上の結果から,コード品質ツールの採用率の低下と,コード品質を改善するために大規模言語モデルを活用する傾向が示唆された。
参考スコア（独自算出の注目度）: 6.2329239454115415
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Scientific software-defined as computer programs, scripts, or code used in scientific research, data analysis, modeling, or simulation-has become central to modern research. However, there is limited research on the readability and understandability of scientific code, both of which are vital for effective collaboration and reproducibility in scientific research. This study surveys 57 research scientists from various disciplines to explore their programming backgrounds, practices, and the challenges they face regarding code readability. Our findings reveal that most participants learn programming through self-study or on the-job training, with 57.9% lacking formal instruction in writing readable code. Scientists mainly use Python and R, relying on comments and documentation for readability. While most consider code readability essential for scientific reproducibility, they often face issues with inadequate documentation and poor naming conventions, with challenges including cryptic names and inconsistent conventions. Our findings also show low adoption of code quality tools and a trend towards utilizing large language models to improve code quality. These findings offer practical insights into enhancing coding practices and supporting sustainable development in scientific software.
Abstract（参考訳）: コンピュータプログラム、スクリプト、または科学研究、データ分析、モデリング、シミュレーションに使用されるコードとして定義された科学ソフトウェアは、現代の研究の中心となっている。しかしながら、科学的コードの可読性と理解性についての研究は限られており、どちらも科学的研究において効果的な協調と再現性に不可欠である。本研究では,プログラミングの背景,実践,コード可読性に関する課題などについて,さまざまな分野から57人の科学者を対象に調査を行った。以上の結果から,ほとんどの参加者は,自己学習や手書き学習を通じてプログラミングを習得し,57.9%は読みやすいコードを書くための正式な指導を欠いていることがわかった。科学者は主にPythonとRを使用し、可読性に関するコメントとドキュメントに依存している。ほとんどの人は、科学的再現性に欠かせないコードの可読性を考えるが、文書の不十分さや命名規則の貧弱さに悩まされることが多い。また,コード品質向上のため,コード品質ツールの採用率の低下と,大規模言語モデルの利用傾向が示唆された。これらの発見は、コーディングプラクティスの強化と、科学ソフトウェアにおける持続可能な開発を支援するための実践的な洞察を提供する。

関連論文リスト

HiSciBench: A Hierarchical Multi-disciplinary Benchmark for Scientific Intelligence from Reading to Discovery [50.8841471967624]
HiSciBenchは、完全な科学的ワークフローを反映した5つのレベルにわたる基礎モデルを評価するために設計された階層的なベンチマークである。 HiSciBenchには、6つの主要な科学分野にまたがる8,735件の慎重に管理された事例が含まれている。
論文参考訳（メタデータ） (2025-12-28T12:08:05Z)
More code, less validation: Risk factors for over-reliance on AI coding tools among scientists [3.5398689122254763]
コード生成が可能な生成AIツールは、科学プログラマをサポートする可能性があるが、ユーザリサーチは、過度な信頼のリスクを示している。採用パターン,ツールの嗜好,生産性の認知に関連する要因をプログラムし,調査した868名の科学者を対象に調査を行った。
論文参考訳（メタデータ） (2025-12-22T18:17:54Z)
AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy [59.32718342798908]
AstroVisBenchは天文学領域における科学計算と可視化の両方のための最初のベンチマークである。本稿では,最先端言語モデルの評価を行い,天文学研究に有用なアシスタントとして携わる能力に大きなギャップがあることを示す。
論文参考訳（メタデータ） (2025-05-26T21:49:18Z)
HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights [72.82973609312178]
HiPerRAGは360万以上の科学論文から知識をインデクシングし取り出すワークフローである。コアとなるのはマルチモーダル文書解析のための高スループットモデルであるOreoと、クエリ対応エンコーダの微調整アルゴリズムであるColTrastだ。 HiPerRAGは、既存の科学的質問応答ベンチマークと、この研究で導入された2つの新しいベンチマークで堅牢なパフォーマンスを提供する。
論文参考訳（メタデータ） (2025-05-07T22:50:23Z)
An Empirical Study on the Effectiveness of Large Language Models for Binary Code Understanding [50.17907898478795]
本研究では,現実のリバースエンジニアリングシナリオにおけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文参考訳（メタデータ） (2025-04-30T17:02:06Z)
How Scientists Use Large Language Models to Program [0.0]
コード生成モデルの初期アドプタである科学者の特性について検討する。科学者たちは、よく知らないプログラミング言語やライブラリをナビゲートするための情報検索ツールとして、コード生成モデルを使っている。
論文参考訳（メタデータ） (2025-02-24T17:23:12Z)
DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery [61.02102713094486]
優れた意思決定を可能にするため、科学的推論において優れた解釈が重要である。本稿では,ニューラルネットワークをインターリーブする学習プログラムを用いて,そのような解釈可能な設計モデルを得るための自動手法を提案する。本稿では,大言語モデル (LLM) の常識と事前知識を活用する進化的アルゴリズムであるDiSciPLEを提案し,視覚データを説明するPythonプログラムを作成する。
論文参考訳（メタデータ） (2025-02-14T10:26:14Z)
SciCode: A Research Coding Benchmark Curated by Scientists [37.900374175754465]
言語モデル(LM)は、多くの挑戦的なタスクにおいて平均的な人間よりも優れており、挑戦的で高品質で現実的な評価を開発することはますます困難になっている。このベンチマークには数学、物理学、化学、生物学、材料科学といった問題が含まれています。クロード3.5-ソネット(Claude3.5-Sonnet)は、最も現実的な環境では、問題の4.6%しか解決できない。
論文参考訳（メタデータ） (2024-07-18T05:15:24Z)
MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。 MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文参考訳（メタデータ） (2024-06-10T15:19:09Z)
How Far Have We Gone in Binary Code Understanding Using Large Language Models [51.527805834378974]
バイナリコード理解におけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文参考訳（メタデータ） (2024-04-15T14:44:08Z)
ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、大規模言語モデルによる研究アイデア作成エージェントである。科学文献に基づいて繰り返し精製しながら、問題、方法、実験設計を生成する。我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文参考訳（メタデータ） (2024-04-11T13:36:29Z)
A Review of Neuroscience-Inspired Machine Learning [58.72729525961739]
バイオプルーシブル・クレジット・アサインメントは、事実上あらゆる学習条件と互換性があり、エネルギー効率が高い。本稿では,人工ニューラルネットワークにおける信用代入の生体評価可能なルールをモデル化する,いくつかの重要なアルゴリズムについて検討する。我々は,このようなアルゴリズムを実用アプリケーションでより有用にするためには,今後の課題に対処する必要があることを論じる。
論文参考訳（メタデータ） (2024-02-16T18:05:09Z)
Deep Learning for Code Intelligence: Survey, Benchmark and Toolkit [63.82016263181941]
コードインテリジェンスは、機械学習技術を活用して、広範なコードコーパスから知識を抽出する。現在、コードインテリジェンスに重点を置く研究コミュニティは活発です。
論文参考訳（メタデータ） (2023-12-30T17:48:37Z)
Framework and Methodology for Verification of a Complex Scientific Simulation Software, Flash-X [0.8437187555622163]
計算科学は科学的発見の主要な道具として科学ソフトウェアに依存している。科学的なソフトウェア検証は、ユーザーが科学的な研究の一環としてソフトウェアを変更する必要があるため、特に難しい。本稿では,複数の科学領域を対象としたコミュニティシミュレーションソフトウェアであるFlash-Xを開発した方法論について述べる。
論文参考訳（メタデータ） (2023-08-30T17:57:37Z)
CLAIMED -- the open source framework for building coarse-grained operators for accelerated discovery in science [0.0]
CLAIMEDは、科学者が科学演算子を再コンパイルすることによって以前の研究から引き出すのを支援することで、再利用可能な演算子とスケーラブルな科学的不可知性を構築するためのフレームワークである。 CLAIMEDはプログラミング言語、科学ライブラリ、実行環境である。
論文参考訳（メタデータ） (2023-07-12T11:54:39Z)
Many bioinformatics programming tasks can be automated with ChatGPT [3.2698789104455677]
人工知能の最近の進歩により、人間の言語によるプロンプトを関数コードに変換することが可能になった。我々は,そのようなモデルであるOpenAIのChatGPTが,基本的なプログラミングタスクから中程度のプログラミングタスクを完遂できる範囲を評価した。
論文参考訳（メタデータ） (2023-03-07T23:32:17Z)
Automated Creation and Human-assisted Curation of Computable Scientific Models from Code and Text [2.3746609573239756]
ドメインエキスパートは、コードに詳しくなければ、科学的モデルの実装を完全に理解することはできない。我々は,科学モデルの自動作成と人手によるキュレーションのためのシステムを開発した。本研究では,NASAのハイパーソニック・エアロダイナミックス(Hypersonic Aerodynamics)のウェブサイトから得られたコードと関連テキストのデータセットを用いて実験を行った。
論文参考訳（メタデータ） (2022-01-28T17:31:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。