論文の概要: Reflecting on Empirical and Sustainability Aspects of Software Engineering Research in the Era of Large Language Models
- arxiv url: http://arxiv.org/abs/2510.26538v1
- Date: Thu, 30 Oct 2025 14:27:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.857369
- Title: Reflecting on Empirical and Sustainability Aspects of Software Engineering Research in the Era of Large Language Models
- Title(参考訳): 大規模言語モデルにおけるソフトウェア工学研究の実証的・持続的側面の考察
- Authors: David Williams, Max Hort, Maria Kechagia, Aldeida Aleti, Justyna Petke, Federica Sarro,
- Abstract要約: 大規模言語モデル(LLM)の使用に関するソフトウェア工学(SE)研究は、ベンチマーク、汚染、複製性、持続可能性に関するいくつかの新しい課題を提起した。
本研究は,現在のICSEにおけるLCMベースのSE研究の概要を構造化し,実践の奨励と持続的欠点の両面に注目した。
我々は,LLMベースのSEの財務・環境コストに対処するため,ベンチマークの厳格性を強化し,複製性を向上させることを推奨する。
- 参考スコア(独自算出の注目度): 13.459892241342589
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software Engineering (SE) research involving the use of Large Language Models (LLMs) has introduced several new challenges related to rigour in benchmarking, contamination, replicability, and sustainability. In this paper, we invite the research community to reflect on how these challenges are addressed in SE. Our results provide a structured overview of current LLM-based SE research at ICSE, highlighting both encouraging practices and persistent shortcomings. We conclude with recommendations to strengthen benchmarking rigour, improve replicability, and address the financial and environmental costs of LLM-based SE.
- Abstract(参考訳): 大規模言語モデル(LLM)の使用に関するソフトウェア工学(SE)研究は、ベンチマーク、汚染、複製性、持続可能性に関するいくつかの新しい課題を提起した。
本稿では,これらの課題がSEでどのように対処されているのかを考察するために,研究コミュニティを招待する。
本研究は,現在のICSEにおけるLCMベースのSE研究の概要を構造化し,実践の奨励と持続的欠点の両面に注目した。
我々は,LLMベースのSEの財務・環境コストに対処するため,ベンチマークの厳格性を強化し,複製性を向上させることを推奨する。
関連論文リスト
- Designing Empirical Studies on LLM-Based Code Generation: Towards a Reference Framework [0.3568466510804538]
大規模言語モデル(LLM)に基づくコード生成に関する経験的研究を設計・報告するための理論的枠組みを提案する。
このフレームワークは、そのような実験を行ったこれまでの経験と、最近の研究における重要な類似点と相違点の比較分析の両方に基礎を置いている。
問題ソース、品質属性、メトリクスなどのコアコンポーネントに関する評価を組織化し、構造化および体系的な実験をサポートする。
論文 参考訳(メタデータ) (2025-10-04T16:15:54Z) - Software Engineering for Large Language Models: Research Status, Challenges and the Road Ahead [4.835306415626808]
大規模言語モデル(LLM)は人工知能(AI)を再定義している
LLMの開発は、ライフサイクルを通してますます複雑な課題に直面している。
ソフトウェア工学(SE)アプローチの観点から、これらの課題と解決策を体系的に探求する既存の研究はない。
論文 参考訳(メタデータ) (2025-06-30T12:09:29Z) - Robustness in Large Language Models: A Survey of Mitigation Strategies and Evaluation Metrics [0.7481505949203433]
大規模言語モデル(LLM)は自然言語処理(NLP)と人工知能(AI)の発展のための有望な基盤として登場した。
この調査は、この領域における現在の研究の包括的概要を提供する。
論文 参考訳(メタデータ) (2025-05-24T11:50:52Z) - Disambiguation in Conversational Question Answering in the Era of LLMs and Agents: A Survey [54.90240495777929]
自然言語処理(NLP)におけるあいまいさは依然として根本的な課題である
LLM(Large Language Models)の出現により、あいまいさに対処することがさらに重要になった。
本稿では,言語駆動システムにおけるあいまいさの定義,形態,含意について考察する。
論文 参考訳(メタデータ) (2025-05-18T20:53:41Z) - Bridging Language Models and Financial Analysis [49.361943182322385]
大規模言語モデル(LLM)の急速な進歩は、自然言語処理における変換可能性の解放をもたらした。
財務データは、しばしばテキストコンテンツ、数値表、および視覚チャートの複雑な関係に埋め込まれる。
LLM研究における急速なイノベーションのペースにもかかわらず、金融業界における彼らの実践的採用には大きなギャップが残っている。
論文 参考訳(メタデータ) (2025-03-14T01:35:20Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Inadequacies of Large Language Model Benchmarks in the Era of Generative Artificial Intelligence [5.147767778946168]
我々は、23の最先端のLarge Language Models (LLMs)ベンチマークを批判的に評価する。
私たちの研究は、バイアス、真の推論、適応性、実装の不整合、エンジニアリングの複雑さ、多様性、文化的およびイデオロギー規範の見落としなど、重大な制限を明らかにしました。
論文 参考訳(メタデータ) (2024-02-15T11:08:10Z) - K-Level Reasoning: Establishing Higher Order Beliefs in Large Language Models for Strategic Reasoning [76.3114831562989]
マルチエージェント環境で戦略を動的に適応させるためには、LLM(Large Language Model)エージェントが必要である。
我々は,「K-Level Reasoning with Large Language Models (K-R)」という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-02T16:07:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。