Fugu-MT 論文翻訳(概要): An Empirical Study of Dotfiles Repositories Containing User-Specific Configuration Files

論文の概要: An Empirical Study of Dotfiles Repositories Containing User-Specific Configuration Files

arxiv url: http://arxiv.org/abs/2501.18555v1
Date: Thu, 30 Jan 2025 18:32:46 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-31 22:50:04.296109
Title: An Empirical Study of Dotfiles Repositories Containing User-Specific Configuration Files
Title（参考訳）: ユーザ固有の構成ファイルを含むDotfilesリポジトリの実証的研究
Authors: Wenhan Zhu, Michael W. Godfrey,
Abstract要約: 数十万がGitHubにリポジトリを公開している。 GitHubで公開ホストされているdotfilesリポジトリを収集、分析しました。トップ500のGitHubユーザのうち25.8%が、何らかの形で公開アクセス可能なdotfilesリポジトリを維持していることがわかった。
参考スコア（独自算出の注目度）: 1.7556600627464058
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Storing user-specific configuration files in a "dotfiles" repository is a common practice among software developers, with hundreds of thousands choosing to publicly host their repositories on GitHub. This practice not only provides developers with a simple backup mechanism for their essential configuration files, but also facilitates sharing ideas and learning from others on how best to configure applications that are key to their daily workflows. However, our current understanding of these repository sharing practices is limited and mostly anecdotal. To address this gap, we conducted a study to delve deeper into this phenomenon. Beginning with collecting and analyzing publicly-hosted dotfiles repositories on GitHub, we discovered that maintaining dotfiles is widespread among developers. Notably, we found that 25.8% of the top 500 most-starred GitHub users maintain some form of publicly accessible dotfiles repository. Among these, configurations for text editors like Vim and shells such as bash and zsh are the most commonly tracked. Our analysis reveals that updating dotfiles is primarily driven by the need to adjust configurations (63.3%) and project meta-management (25.4%). Surprisingly, we found no significant difference in the types of dotfiles observed across code churn history patterns, suggesting that the frequency of dotfile modifications depends more on the developer than the properties of the specific dotfile and its associated application. Finally, we discuss the challenges associated with managing dotfiles, including the necessity for a reliable and effective deployment mechanism, and how the insights gleaned from dotfiles can inform tool designers by offering real-world usage information.
Abstract（参考訳）: ユーザ固有の構成ファイルを“dotfiles”リポジトリに保存することは、ソフトウェア開発者にとって一般的なプラクティスであり、数十万人がGitHubにリポジトリを公開ホストすることを選択している。このプラクティスは、開発者が本質的な設定ファイルに単純なバックアップメカニズムを提供するだけでなく、日々のワークフローに欠かせないアプリケーションをどのように構成するかについて、アイデアや学習を共有するのにも役立ちます。しかしながら、これらのリポジトリ共有プラクティスに対する現在の理解は限定的で、ほとんどが逸話的です。このギャップに対処するため、我々はこの現象を深く掘り下げる研究を行った。 GitHub上で公開されているdotfilesリポジトリの収集と分析から始めて、dotfilesのメンテナンスが開発者の間で広く行われていることが分かりました。注目すべきなのは、トップ500のGitHubユーザの25.8%が、何らかの形で公開アクセス可能なdotfilesリポジトリを維持していることだ。中でも、Vimのようなテキストエディタや、bashやzshといったシェルの設定が最も一般的に追跡されている。我々の分析によると、ドットファイルの更新は、主に設定調整(63.3%)とプロジェクトメタ管理(25.4%)の必要性によって進められている。意外なことに、コードチャーン履歴パターン間で観察されるドットファイルの種類に顕著な違いは見つからず、ドットファイル修正の頻度は、特定のドットファイルとその関連アプリケーションの性質よりも開発者に依存していることを示唆している。最後に、dotfileの管理に関わる課題について論じ、信頼性と効果的なデプロイメントメカニズムの必要性、およびdotfileから得られた洞察が、実際の使用情報を提供することで、ツールデザイナにどのように通知するかについて論じる。

関連論文リスト

DRAGON: Robust Classification for Very Large Collections of Software Repositories [7.11989492494202]
DRAGONは,大規模かつ多様なソフトウェアコレクションを対象としたリポジトリである。 DRAGONは、バージョン管理システムに一般的に格納されている完全に軽量な信号を運用している。 DRAGONの開発副産物として,これまでで最大規模のオープンデータセットをリポジトリとして公開しています。
論文参考訳（メタデータ） (2026-02-09T10:27:24Z)
Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms [83.16077040470975]
Python Package Index(PyPI)上のライブラリのメタデータは、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。本稿は,5万PyPIの著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
論文参考訳（メタデータ） (2026-01-21T16:13:57Z)
Trace: Securing Smart Contract Repository Against Access Control Vulnerability [58.02691083789239]
GitHubはソースコード、ドキュメント、設定ファイルを含む多数のスマートコントラクトリポジトリをホストしている。サードパーティの開発者は、カスタム開発中にこれらのリポジトリからコードを参照、再利用、フォークすることが多い。スマートコントラクトの脆弱性を検出する既存のツールは、複雑なリポジトリを扱う能力に制限されている。
論文参考訳（メタデータ） (2025-10-22T05:18:28Z)
Improving Code Localization with Repository Memory [33.423769985220005]
本稿では,最近の過去のコミットや関連問題を含む非パラメトリックメモリからエージェントを検索するツールを紹介する。このようなメモリの拡張により,最先端のローカライゼーションフレームワークであるLocAgentが大幅に向上することを示す。
論文参考訳（メタデータ） (2025-10-01T15:10:15Z)
Build It Clean: Large-Scale Detection of Code Smells in Build Scripts [7.553917924788079]
セキュアでないURLはMavenビルドスクリプトで最も一般的なコードの臭いで、ハードコードパス/URLはGradleとCMakeスクリプトの両方でよく見られた。私たちの発見に基づいて、ソフトウェアプロジェクトの効率性、信頼性、保守性を改善するために、ビルドスクリプトにおけるコードの臭いを緩和する戦略を推奨します。
論文参考訳（メタデータ） (2025-06-22T09:01:42Z)
SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文参考訳（メタデータ） (2025-05-29T18:28:02Z)
The Design Space of Lockfiles Across Package Managers [10.405775369526006]
私たちは,npm, pnpm, Cargo, Poetry, Pipenv, Gradle, Goという,人気の高い7つのパッケージマネージャを対象とした,ロックファイルに関する初の包括的な調査を行っています。開発者がロックファイルで認識するメリットや、これらのファイルを管理する上で直面する課題について、私たちは直接的に洞察を得ています。
論文参考訳（メタデータ） (2025-05-07T22:18:40Z)
On the Prevalence and Usage of Commit Signing on GitHub: A Longitudinal and Cross-Domain Study [1.834753484317836]
5年以上にわたってGitHubリポジトリに確認されたコミットの存在を調査した。これらの60のリポジトリのコミットのうち、10%のみが検証されている。我々はGitHubのEvents APIに基づいてコミットオーナシップを特定する方法を提案する。
論文参考訳（メタデータ） (2025-04-27T12:39:50Z)
Repository-level Code Search with Neural Retrieval Methods [25.222964965449286]
我々は、リポジトリレベルのコード検索のタスクを、ユーザの質問やバグに対処するのに最も関係のある、コードリポジトリの現在の状態からファイルの集合を検索するものとして定義する。提案手法は,コミットメッセージに対するBM25ベースの検索と,CodeBERTを用いて関連するファイルを識別するニューラルリランクを組み合わせたものである。 7つの人気のあるオープンソースリポジトリから生成された新しいデータセットの実験では、MAP、MRR、P@1がBM25ベースラインに対して最大80%改善されている。
論文参考訳（メタデータ） (2025-02-10T21:59:01Z)
SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution [56.9361004704428]
大規模言語モデル(LLM)は、様々な複雑なタスクにまたがる顕著な習熟度を示している。 SWE-Fixerは、GitHubの問題を効果的かつ効率的に解決するために設計された、新しいオープンソースフレームワークである。我々は,SWE-Bench LiteとVerifiedベンチマークに対するアプローチを評価し,オープンソースモデル間の最先端性能を実現する。
論文参考訳（メタデータ） (2025-01-09T07:54:24Z)
How to Understand Whole Software Repository? [64.19431011897515]
リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文参考訳（メタデータ） (2024-06-03T15:20:06Z)
Collaborative, Code-Proximal Dynamic Software Visualization within Code Editors [55.57032418885258]
本稿では,コードエディタに組み込むソフトウェアビジュアライゼーション手法の設計と実装について紹介する。私たちのコントリビューションは、ソフトウェアシステムの実行時の動作の動的解析を使用するという点で、関連する作業と異なります。私たちの視覚化アプローチは、一般的なリモートペアプログラミングツールを強化し、共有コード都市を利用することで協調的に使用できます。
論文参考訳（メタデータ） (2023-08-30T06:35:40Z)
Exploring Security Practices in Infrastructure as Code: An Empirical Study [54.669404064111795]
クラウドコンピューティングは、Infrastructure as Code (IaC)ツールが広く使われていることで人気を博している。スクリプティングプロセスは、実践者が自動的に設定ミスや脆弱性、プライバシリスクを導入するのを防ぐものではない。セキュリティの確保は、実践者が明確な方針、ガイドライン、ベストプラクティスを理解し、採用することに依存する。
論文参考訳（メタデータ） (2023-08-07T23:43:32Z)
RepoFusion: Training Code Models to Understand Your Repository [12.621282610983592]
GitHub Copilotのようなコーディングアシスタントにおける大きな言語モデル(LLM)は、リポジトリに存在するコンテキストを理解するのに苦労している。最近の研究は、推論中にリポジトリからコンテキストを使用するという約束を示している。関連するリポジトリコンテキストを組み込むためのモデルをトレーニングするフレームワークであるRepoFusionを提案する。
論文参考訳（メタデータ） (2023-06-19T15:05:31Z)
On the Security Blind Spots of Software Composition Analysis [46.1389163921338]
Mavenリポジトリで脆弱性のあるクローンを検出するための新しいアプローチを提案する。 Maven Centralから53万以上の潜在的な脆弱性のあるクローンを検索します。検出された727個の脆弱なクローンを検出し、それぞれに検証可能な脆弱性証明プロジェクトを合成する。
論文参考訳（メタデータ） (2023-06-08T20:14:46Z)
Coeditor: Leveraging Contextual Changes for Multi-round Code Auto-editing [57.776971051512234]
本研究では,複数ラウンドのコードの自動編集設定について検討し,その内部の最近の変更に基づいて,コード領域への編集を予測することを目的とした。我々のモデルであるCoeditorは、コード編集タスクに特化して設計された微調整言語モデルである。単純化されたシングルラウンドのシングル編集タスクでは、Coeditor は GPT-3.5 と SOTA のオープンソースコード補完モデルを大幅に上回っている。
論文参考訳（メタデータ） (2023-05-29T19:57:36Z)
An Empirical Study on Workflows and Security Policies in Popular GitHub Repositories [9.048328480295224]
オープンソースプロジェクトでは、誰でもコントリビュートできるので、アクティブな継続的インテグレーションと継続的デリバリ(CI/CD)パイプラインを持つことが重要です。これらのプロジェクトの多くはGitHubにホストされており、メンテナが自動セキュリティポリシを作成することができる。私たちはスター数に基づいてGitHubとセキュリティポリシーを何千もの人気のあるリポジトリで測定します。
論文参考訳（メタデータ） (2023-05-25T14:52:23Z)
Automatically Categorising GitHub Repositories by Application Domain [14.265666415804025]
GitHubは、インターネット上で最大のオープンソースソフトウェアホストである。幅広いドメインにまたがるリポジトリの多さをナビゲートするのはますます困難になっている。過去の研究によると、アプリケーションドメインを考慮に入れることは、リポジトリの人気を予測するといったタスクに不可欠である。
論文参考訳（メタデータ） (2022-07-30T16:27:16Z)
DeepKE: A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population [95.0099875111663]
DeepKEは、名前付きエンティティ認識、関係抽出、属性抽出など、さまざまな情報抽出タスクを実装している。 DeepKEを使えば、開発者や研究者はデータセットやモデルをカスタマイズして、要求に応じて構造化されていないデータから情報を抽出できる。
論文参考訳（メタデータ） (2022-01-10T13:29:05Z)
Repo2Vec: A Comprehensive Embedding Approach for Determining Repository Similarity [2.095199622772379]
Repo2Vecは、リポジトリを分散ベクタとして表現するための包括的な埋め込みアプローチである。当社の手法をGitHubから2つの実際のデータセットで評価し、1013リポジトリを組み合わせて検討した。
論文参考訳（メタデータ） (2021-07-11T18:57:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。