論文の概要: How Scientists Use Large Language Models to Program
- arxiv url: http://arxiv.org/abs/2502.17348v1
- Date: Mon, 24 Feb 2025 17:23:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:55:44.959085
- Title: How Scientists Use Large Language Models to Program
- Title(参考訳): 科学者が大規模言語モデルを使ってプログラムする方法
- Authors: Gabrielle O'Brien,
- Abstract要約: コード生成モデルの初期アドプタである科学者の特性について検討する。
科学者たちは、よく知らないプログラミング言語やライブラリをナビゲートするための情報検索ツールとして、コード生成モデルを使っている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Scientists across disciplines write code for critical activities like data collection and generation, statistical modeling, and visualization. As large language models that can generate code have become widely available, scientists may increasingly use these models during research software development. We investigate the characteristics of scientists who are early-adopters of code generating models and conduct interviews with scientists at a public, research-focused university. Through interviews and reviews of user interaction logs, we see that scientists often use code generating models as an information retrieval tool for navigating unfamiliar programming languages and libraries. We present findings about their verification strategies and discuss potential vulnerabilities that may emerge from code generation practices unknowingly influencing the parameters of scientific analyses.
- Abstract(参考訳): 専門分野にわたる科学者は、データ収集や生成、統計モデリング、可視化といった重要な活動のためのコードを書く。
コードを生成する大きな言語モデルが広く利用できるようになったため、研究者は研究ソフトウェア開発において、これらのモデルをますます活用する可能性がある。
我々は,コード生成モデルの初期アドプタである科学者の特徴を考察し,公開研究大学における研究者へのインタビューを行う。
ユーザインタラクションログのインタビュやレビューを通じて、科学者たちは、よく知らないプログラミング言語やライブラリをナビゲートするための情報検索ツールとして、コード生成モデルを使用する。
本稿では,それらの検証戦略に関する知見を提示し,科学的分析のパラメータに無意識に影響を及ぼすようなコード生成プラクティスから生じる可能性のある潜在的な脆弱性について考察する。
関連論文リスト
- Exploring Code Comprehension in Scientific Programming: Preliminary Insights from Research Scientists [6.2329239454115415]
本研究では、さまざまな分野の57人の科学者を対象に、コード可読性に関して直面するプログラミングの背景、実践、課題について調査する。
科学者は主にPythonとRを使用し、可読性に関するドキュメントに依存している。
以上の結果から,コード品質ツールの採用率の低下と,コード品質を改善するために大規模言語モデルを活用する傾向が示唆された。
論文 参考訳(メタデータ) (2025-01-17T08:47:29Z) - Large Language Models: New Opportunities for Access to Science [0.0]
KM3NeTニュートリノ検出器のオープンサイエンス環境構築における検索型Augmented Generation-enhanced chatアプリケーションの取り込みは、我々の科学に大規模言語モデルが広く適用される可能性を探究するための焦点となる。
論文 参考訳(メタデータ) (2025-01-13T11:58:27Z) - Darkit: A User-Friendly Software Toolkit for Spiking Large Language Model [50.37090759139591]
大規模言語モデル(LLM)は、数十億のパラメータからなる様々な実践的応用に広く応用されている。
人間の脳は、生物工学的なスパイキング機構を使って、エネルギー消費を大幅に削減しながら、同じ仕事をこなすことができる。
私たちはDarwinKit(Darkit)という名のソフトウェアツールキットをリリースし、脳にインスパイアされた大きな言語モデルの採用を加速しています。
論文 参考訳(メタデータ) (2024-12-20T07:50:08Z) - Many Heads Are Better Than One: Improved Scientific Idea Generation by A LLM-Based Multi-Agent System [62.832818186789545]
Virtual Scientists (VirSci) は、科学研究に固有のチームワークを模倣するために設計されたマルチエージェントシステムである。
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新しい科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-12T07:16:22Z) - CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
我々は,LLMの性能を高めるため,グラフィカル検索拡張コード生成フレームワークであるCodeGRAGを提案する。
CodeGRAGは、制御フローとデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミング言語と自然言語のギャップを埋める。
ハードメタグラフプロンプト、ソフトプロンプト技術、事前訓練されたGNN専門家の目的の有効性を検証するために、C++言語とピソン言語の両方を含む4つのデータセットで様々な実験と改善が行われた。
論文 参考訳(メタデータ) (2024-05-03T02:48:55Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、新しい作品のアイデアと運用のためのAIベースのシステムである。
ResearchAgentは、新しい問題を自動で定義し、手法と設計実験を提案し、繰り返し修正する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z) - Large Language Models for Scientific Synthesis, Inference and
Explanation [56.41963802804953]
大規模言語モデルがどのように科学的合成、推論、説明を行うことができるかを示す。
我々は,この「知識」を科学的文献から合成することで,大きな言語モデルによって強化できることを示す。
このアプローチは、大きな言語モデルが機械学習システムの予測を説明することができるというさらなる利点を持っている。
論文 参考訳(メタデータ) (2023-10-12T02:17:59Z) - How Data Scientists Review the Scholarly Literature [4.406926847270567]
データサイエンティストの文献レビューの実践について検討する。
データサイエンスは、論文の指数的な増加を示す分野である。
これらの科学者が直面する具体的な実践や課題について、事前の研究は行われていない。
論文 参考訳(メタデータ) (2023-01-10T03:53:05Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - Automated Creation and Human-assisted Curation of Computable Scientific
Models from Code and Text [2.3746609573239756]
ドメインエキスパートは、コードに詳しくなければ、科学的モデルの実装を完全に理解することはできない。
我々は,科学モデルの自動作成と人手によるキュレーションのためのシステムを開発した。
本研究では,NASAのハイパーソニック・エアロダイナミックス(Hypersonic Aerodynamics)のウェブサイトから得られたコードと関連テキストのデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2022-01-28T17:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。