論文の概要: Operationalizing Research Software for Supply Chain Security
- arxiv url: http://arxiv.org/abs/2601.20980v1
- Date: Wed, 28 Jan 2026 19:29:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.399592
- Title: Operationalizing Research Software for Supply Chain Security
- Title(参考訳): サプライチェーンセキュリティ研究ソフトの運用
- Authors: Kelechi G. Kalu, Soham Rattan, Taylor R. Schorlemmer, George K. Thiruvathukal, Jeffrey C. Carver, James C. Davis,
- Abstract要約: 我々は、経験的研究ソフトウェアセキュリティ研究のスコープと運用境界を明確にするRSSC指向の分類法を導入する。
我々は,Research Software Encyclopediaの大規模コミュニティ培養コーパスで分類を運用している。
- 参考スコア(独自算出の注目度): 6.965026200498251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Empirical studies of research software are hard to compare because the literature operationalizes ``research software'' inconsistently. Motivated by the research software supply chain (RSSC) and its security risks, we introduce an RSSC-oriented taxonomy that makes scope and operational boundaries explicit for empirical research software security studies. We conduct a targeted scoping review of recent repository mining and dataset construction studies, extracting each work's definition, inclusion criteria, unit of analysis, and identification heuristics. We synthesize these into a harmonized taxonomy and a mapping that translates prior approaches into shared taxonomy dimensions. We operationalize the taxonomy on a large community-curated corpus from the Research Software Encyclopedia (RSE), producing an annotated dataset, a labeling codebook, and a reproducible labeling pipeline. Finally, we apply OpenSSF Scorecard as a preliminary security analysis to show how repository-centric security signals differ across taxonomy-defined clusters and why taxonomy-aware stratification is necessary for interpreting RSSC security measurements.
- Abstract(参考訳): 研究ソフトウェアに関する実証研究は、文献が「研究ソフトウェア」を矛盾なく運用しているため、比較が難しい。
研究ソフトウェアサプライチェーン(RSSC)とそのセキュリティリスクに動機付けられ,実証研究ソフトウェアセキュリティ研究のスコープと運用境界を明確にするRSSC指向の分類法を導入する。
我々は,最近のレポジトリマイニングとデータセット構築研究を対象とし,各作業の定義,包括的基準,分析単位,識別ヒューリスティックスを抽出する。
我々はこれらを調和した分類学と、先行アプローチを共有分類学の次元に変換するマッピングに合成する。
我々は,Research Software Encyclopedia (RSE) による大規模コミュニティ培養コーパスの分類を運用し,注釈付きデータセット,ラベリングコードブック,再現可能なラベリングパイプラインを作成した。
最後に,OpenSSF Scorecardを予備セキュリティ解析として適用し,分類基準クラスタ間でリポジトリ中心のセキュリティ信号がどう異なるか,RSSCセキュリティ測定の解釈になぜ分類基準を意識した階層化が必要なのかを示す。
関連論文リスト
- OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment [63.662126457336534]
OpenNoveltyは、透明で証拠に基づく新規性分析のためのエージェントシステムである。
回収された実論文のすべての評価を根拠にし、検証可能な判断を確実にする。
OpenNoveltyは、公正で一貫性があり、エビデンスに支えられたピアレビューを促進するスケーラブルなツールで、研究コミュニティに力を与えることを目指している。
論文 参考訳(メタデータ) (2026-01-04T15:48:51Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - Context-Aware Hierarchical Taxonomy Generation for Scientific Papers via LLM-Guided Multi-Aspect Clustering [59.54662810933882]
既存の分類体系の構築手法は、教師なしクラスタリングや大きな言語モデルの直接的プロンプトを利用しており、コヒーレンスと粒度の欠如が多かった。
LLM誘導型マルチアスペクト符号化と動的クラスタリングを統合したコンテキスト対応階層型階層型分類生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-23T15:12:58Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - A Systematic Literature Review on Detecting Software Vulnerabilities with Large Language Models [2.518519330408713]
ソフトウェア工学における大規模言語モデル(LLM)は、ソフトウェア脆弱性検出への関心を喚起している。
この分野の急速な発展は、断片化された研究の風景を生み出した。
この断片化は、最先端技術の明確な概要を得るのを困難にし、研究を有意義に比較し分類する。
論文 参考訳(メタデータ) (2025-07-30T13:17:16Z) - An AI-Powered Research Assistant in the Lab: A Practical Guide for Text Analysis Through Iterative Collaboration with LLMs [0.7255608805275865]
本稿では,LLMを用いた非構造化データの効率的な開発,テスト,適用のためのステップバイステップチュートリアルを提案する。
我々は,データセットをレビューし,生命ドメインの分類を作成,即時かつ直接的な修正を通じて分類を評価・洗練し,分類を検証し,インターコーダ契約を評価し,データセット全体を高いインターコーダ信頼性で分類する手法を実証する。
論文 参考訳(メタデータ) (2025-05-14T18:32:18Z) - Automatic Bottom-Up Taxonomy Construction: A Software Application Domain Study [6.0158981171030685]
ソフトウェアアプリケーションドメイン分類に関するこれまでの研究は、適切な分類法が欠如しているため、課題に直面してきた。
本研究では,複数のデータソースを統合し,アンサンブル手法を活用することで,包括的ソフトウェアアプリケーション領域分類を開発することを目的とする。
論文 参考訳(メタデータ) (2024-09-24T08:55:07Z) - Improving Retrieval in Theme-specific Applications using a Corpus
Topical Taxonomy [52.426623750562335]
ToTER (Topical Taxonomy Enhanced Retrieval) フレームワークを紹介する。
ToTERは、クエリとドキュメントの中心的なトピックを分類学のガイダンスで識別し、そのトピックの関連性を利用して、欠落したコンテキストを補う。
プラグイン・アンド・プレイのフレームワークとして、ToTERは様々なPLMベースのレトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-03-07T02:34:54Z) - A Taxonomy for Requirements Engineering and Software Test Alignment [9.185784533862469]
本稿では,要求工学とソフトウェアテスト(REST)アライメントの定義,各領域をリンクする手法を特徴付ける分類,アライメントを評価するプロセスを提案する。
情報ダイアドの結果として生じる概念は、アライメントを行うために必要な情報の交換を特徴付ける。
我々は分類がさらに洗練されることを期待するが、情報ダイアドはアライメントを理解するのに有効で有用な構造であると信じている。
論文 参考訳(メタデータ) (2023-07-24T02:18:31Z) - Language Model Decoding as Likelihood-Utility Alignment [54.70547032876017]
モデルの有効性がタスク固有の実用性の概念とどのように一致しているかについて、暗黙の仮定に基づいて、デコード戦略をグループ化する分類法を導入する。
具体的には、様々なタスクの集合における予測の可能性と有用性の相関を解析することにより、提案された分類を裏付ける最初の実証的証拠を提供する。
論文 参考訳(メタデータ) (2022-10-13T17:55:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。