論文の概要: EVOSCAT: Exploring Software Change Dynamics in Large-Scale Historical Datasets
- arxiv url: http://arxiv.org/abs/2508.10852v1
- Date: Thu, 14 Aug 2025 17:20:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.429344
- Title: EVOSCAT: Exploring Software Change Dynamics in Large-Scale Historical Datasets
- Title(参考訳): EVOSCAT: 大規模履歴データセットにおけるソフトウェア変更のダイナミクスを探る
- Authors: Souhaila Serbout, Diana Carolina Muñoz Hurtado, Hassan Atwi, Edoardo Riggio, Cesare Pautasso,
- Abstract要約: 長く生きたソフトウェアプロジェクトは、多くのアーティファクトを含んでおり、その歴史を通じて多くの修正がなされている。
EvoScatは、研究者が進化データセットを探索し、特徴付けるのに役立つ、スケーラブルな可視化を作成する手段を提供することを目指している。
この論文は、ヒストリスケーリングとアライメントの柔軟な構成をサポートすることで、ツールを特定の分析ニーズに合わせる方法を示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long lived software projects encompass a large number of artifacts, which undergo many revisions throughout their history. Empirical software engineering researchers studying software evolution gather and collect datasets with millions of events, representing changes introduced to specific artifacts. In this paper, we propose EvoScat, a tool that attempts addressing temporal scalability through the usage of interactive density scatterplot to provide a global overview of large historical datasets mined from open source repositories in a single visualization. EvoScat intents to provide researchers with a mean to produce scalable visualizations that can help them explore and characterize evolution datasets, as well as comparing the histories of individual artifacts, both in terms of 1) observing how rapidly different artifacts age over multiple-year-long time spans 2) how often metrics associated with each artifacts tend towards an improvement or worsening. The paper shows how the tool can be tailored to specific analysis needs (pace of change comparison, clone detection, freshness assessment) thanks to its support for flexible configuration of history scaling and alignment along the time axis, artifacts sorting and interactive color mapping, enabling the analysis of millions of events obtained by mining the histories of tens of thousands of software artifacts. We include in this paper a gallery showcasing datasets gathering specific artifacts (OpenAPI descriptions, GitHub workflow definitions) across multiple repositories, as well as diving into the history of specific popular open source projects.
- Abstract(参考訳): 長く生きたソフトウェアプロジェクトは、多くのアーティファクトを含んでおり、その歴史を通じて多くの修正がなされている。
ソフトウェア進化を研究する経験豊かなソフトウェアエンジニアリング研究者は、特定のアーティファクトに導入された変化を表現して、数百万のイベントでデータセットを収集し、収集する。
本稿では,インタラクティブな密度スキャッタプロットを用いて時間的スケーラビリティに対処するツールであるEvoScatを提案する。
EvoScatは、進化データセットを探索し、特徴付けるのに役立つスケーラブルな視覚化を研究者に提供し、また、個々のアーティファクトの履歴を両面で比較する手段を提供することを目指している。
1【複数年にわたる異なる工芸品の経年変化の観察】
2) 各アーティファクトに関連するメトリクスが、改善や悪化の傾向にあること。
本論文は、時間軸に沿ったヒストリスケーリングとアライメントの柔軟な構成、アーティファクトソート、インタラクティブなカラーマッピングをサポートし、数万のソフトウェアアーティファクトの履歴をマイニングすることで得られる数百万のイベントの分析を可能にすることにより、特定の分析ニーズ(変更比較、クローン検出、鮮度評価)に合わせてツールをどのように調整できるかを示す。
この論文には、複数のリポジトリにまたがる特定のアーティファクト(OpenAPI記述、GitHubワークフロー定義)を収集するデータセットと、特定の人気のあるオープンソースプロジェクトの歴史を掘り下げるデータセットを展示するギャラリーが含まれている。
関連論文リスト
- PyPotteryLens: An Open-Source Deep Learning Framework for Automated Digitisation of Archaeological Pottery Documentation [0.0]
PyPotteryLensは、考古学的考古学的図面のデジタル化と処理を自動化するフレームワークである。
このフレームワークは、陶器検出および分類タスクにおいて97%以上の精度とリコールを達成する。
手作業に比べて処理時間を最大5倍から20倍に短縮する。
論文 参考訳(メタデータ) (2024-12-16T09:01:32Z) - CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation [51.2289822267563]
本稿では,実行すべきタスクを実演する少数のユーザ記述型少数ショットを前提として,合成データセットを生成する手法を提案する。
我々は, CRAFTが生物, 医学, 常識質問応答(QA)の4つのタスクに対して, 大規模タスク特化学習データセットを効率的に生成できることを実証した。
実験の結果, CRAFT を用いたモデルでは, 一般 LLM をQA タスクで上回ったり, 一致させたりしていることがわかった。
論文 参考訳(メタデータ) (2024-09-03T17:54:40Z) - Replication: Contrastive Learning and Data Augmentation in Traffic
Classification Using a Flowpic Input Representation [47.95762911696397]
同じデータセット上で[16]を再現し、3つの追加の公開データセット上で最も健全なアスペクト(データ拡張の重要性)を複製します。
元の結果のほとんどを確認できたが、元のデータセットにデータシフトがあったため、調査されたシナリオの20%の精度低下が判明した。
論文 参考訳(メタデータ) (2023-09-18T12:55:09Z) - DeepVATS: Deep Visual Analytics for Time Series [7.822594828788055]
私たちは、Deep Visual Analyticsの分野を時系列データにもたらすオープンソースのツールであるDeepVATSを紹介します。
DeepVATSは、自己監督的な方法で、時系列のパッチを再構築するマスク付き時系列自動エンコーダを訓練する。
本稿では,DeepVATSの有効性を検証する結果について報告する。
論文 参考訳(メタデータ) (2023-02-08T03:26:50Z) - Datasets: A Community Library for Natural Language Processing [55.48866401721244]
データセットは、現代のNLPのためのコミュニティライブラリである。
このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
論文 参考訳(メタデータ) (2021-09-07T03:59:22Z) - REGRAD: A Large-Scale Relational Grasp Dataset for Safe and
Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。
データセットは2D画像と3Dポイントクラウドの両方で収集されます。
ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文 参考訳(メタデータ) (2021-04-29T05:31:21Z) - Robust Image Retrieval-based Visual Localization using Kapture [10.249293519246478]
視覚的ローカライゼーションのための多用途パイプラインを提案する。
8つの公開データセットで評価し、それらが上位にランクされ、その多くが上位にランクされている。
今後の研究を促進するため、我々は、BSDライセンス下でオープンソースであるKaptureフォーマットで、コード、モデル、およびすべてのデータセットをリリースする。
論文 参考訳(メタデータ) (2020-07-27T21:10:35Z) - TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。
ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。
我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文 参考訳(メタデータ) (2020-05-20T21:07:28Z) - Combining Visual and Textual Features for Semantic Segmentation of
Historical Newspapers [2.5899040911480187]
本稿では,歴史新聞のセマンティックセマンティックセグメンテーションのためのマルチモーダルアプローチを提案する。
ダイアクロニックなスイスとルクセンブルクの新聞の実験に基づいて、視覚的特徴とテキスト的特徴の予測力について検討する。
その結果、強力な視覚ベースラインと比較して、マルチモーダルモデルの一貫した改善が見られた。
論文 参考訳(メタデータ) (2020-02-14T17:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。