論文の概要: Beyond the Grave: An Empirical Study of Dormancy and Revival in Scientific Open-Source Software
- arxiv url: http://arxiv.org/abs/2606.20966v1
- Date: Thu, 18 Jun 2026 22:06:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 11:33:03.632101
- Title: Beyond the Grave: An Empirical Study of Dormancy and Revival in Scientific Open-Source Software
- Title(参考訳): Beyond the Grave: 科学オープンソースソフトウェアにおける休眠と復活に関する実証的研究
- Authors: Addi Malviya Thakur, Bogdan Vasilescu, Audris Mockus,
- Abstract要約: 不活性閾値は、科学オープンソースソフトウェア(OSS)を放棄されたものとして分類するが、恒久的な放棄を区別することはできない。
カットオフを1ヶ月から36ヶ月に移動すると、SciCatコーパスの廃止数は18,030から8,010に変更された。
本研究は, 休眠原因, 回復機構, 回復耐久性, および休眠回復OSSのライフサイクルアーキタイプを特徴付ける。
- 参考スコア(独自算出の注目度): 10.040769886221453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background. Inactivity thresholds classify scientific open-source software (OSS) as abandoned but cannot distinguish permanent abandonment from temporary dormancy; moving the cutoff from 1 to 36 months changes the abandoned count in the SciCat corpus from 18,030 to 8,010. Aims. We characterize dormancy causes, revival mechanisms, recovery durability, and lifecycle archetypes in dormant-revived scientific OSS. Method. From 18,247 SciCat repositories we identify 2,984 dormant-revived candidates and field-code a stratified sample of 750 projects with 75 analyst-coders under a two-phase adjudication protocol (post-adjudication kappa 0.779-0.857). A rule-based classifier produces five dimensions: dormancy cause (T1), revival mechanism (T2), nature of revival work (T3), revival sustainability (T4), and lifecycle archetype (T5). Results. Dormancy cause is unresolvable from repository evidence for 52.5% of projects; among resolvable cases, feature/milestone freeze outnumbers research-output completion 5.4:1. Non-sustained recovery outnumbers sustained 2.14:1; 11.5% of apparent revivals are bot-only or single-spike artifacts. Lifecycle archetype is more strongly associated with sustainability than revival mechanism or work type (medium effect on the structurally-independent subset). Conclusions. A fixed inactivity threshold is insufficient to reliably classify scientific OSS abandonment. Gap duration, lifecycle archetype, and contributor continuity together provide more discriminating information than any single threshold.
- Abstract(参考訳): 背景。
不活性閾値は、科学オープンソースソフトウェア(OSS)を放棄されたものとして分類するが、一時的な休眠から永久的な放棄を区別することはできない。
エイムズ。
本研究は, 休眠原因, 回復機構, 回復耐久性, および休眠が回復した科学OSSのライフサイクルアーキタイプを特徴付ける。
方法。
18,247のSciCatレポジトリから2,984の休眠再開候補を特定し、75のアナリストコーダを持つ750のプロジェクトの成層化サンプルを2相適応プロトコル(post-adjudication kappa 0.779-0.857)の下でコード化する。
規則に基づく分類器は、休眠原因(T1)、回復機構(T2)、再生作業の性質(T3)、回復持続可能性(T4)、ライフサイクルアーキタイプ(T5)の5次元を生成する。
結果。
52.5%のプロジェクトのリポジトリの証拠から、休眠原因は解決不可能であり、解決可能なケースの中で、フィーチャー/マイルストーンの凍結は研究成果の5.4:1を上回っている。
非持続的回復率は2.14:1で、その11.5%はボットのみまたは単一スパイクの人工物である。
ライフサイクルアーチタイプは、再生機構やワークタイプ(構造的に非依存なサブセットに対するナトリウム効果)よりも持続可能性に強く関連している。
結論。
科学的OSS放棄を確実に分類するには、固定不活性しきい値が不十分である。
ギャップ持続時間、ライフサイクルアーキタイプ、コントリビュータ連続性は、どのしきい値よりも多くの識別情報を提供する。
関連論文リスト
- Template Collapse and Information-Theoretic Limits in Camera rPPG Pulse Morphology Restoration [0.0]
コンシューマー・フェイスカメラ リモート・フォトプレティス幻覚(r)は、受動的心血管モニタリングを可能にする。
しかし、動脈硬化度をコードする単一サイクル波形形態が、この測定から回復可能であるか否かは明らかになっていない。
16のエンコーダアーキテクチャを3つのデータセットで評価した。
論文 参考訳(メタデータ) (2026-06-02T15:50:07Z) - PrimeKG-CL: A Continual Graph Learning Benchmark on Evolving Biomedical Knowledge Graphs [19.859134741964805]
既存の連続グラフ学習は、ほとんど完全に合成ランダムな一般的なKGについて研究されている。
9つの信頼できるバイオメディカルデータベースから構築されたベンチマークを導入する。
我々は、4つのKGEデコーダ、LKGE、CK-hugging agent、CMKLの6つのCL戦略を評価した。
論文 参考訳(メタデータ) (2026-05-11T13:14:02Z) - Layer Collapse in Diffusion Language Models [54.880703002010144]
拡散言語モデル (DLM) は自己回帰言語モデル (AR) の代替として登場した。
DLMの層崩壊は, 過度なトレーニングによるものではなく, 過度なトレーニングによるものであることを示す。
私たちの発見は、非常に実践的な意味を持っている。
論文 参考訳(メタデータ) (2026-05-07T14:39:40Z) - Neuro-Oracle: A Trajectory-Aware Agentic RAG Framework for Interpretable Epilepsy Surgical Prognosis [4.726777092009554]
トラジェクトリベースの分類器は、シングルポイントのResNet-50ベースラインで0.793に対して0.834から0.905のAUC値を達成する。
i) 3Dシームスコントラストエンコーダを用いたコンパクトな512次元トラジェクトリベクトルへの術前MRI変化の除去、(ii)近辺探索による人口アーカイブからの歴史的に類似した外科的トラジェクトリの検索、(iii)定量化を用いて検索された証拠に基づいた自然言語的予後を合成する3段階のフレームワークであるEmphNeuro-Oracleを提案する。
論文 参考訳(メタデータ) (2026-04-10T21:47:25Z) - Learning to Forget: Sleep-Inspired Memory Consolidation for Resolving Proactive Interference in Large Language Models [0.11080037957254413]
大規模言語モデル (LLM) はプロアクティブ干渉 (PI) に悩まされ、コンテキストウィンドウの古い情報が現在の値の検索を妨害する。
キー値(KV)キャッシュ上で学習した睡眠サイクルでトランスフォーマーベースのLCMを増強するフレームワークであるSleepGateを提案する。
SleepGateは深さ5で99.5%、深さ10で97.0%、全ベースライン(フルKVキャッシュ、スライディングウインドウ、H2O、StreamingLLM、崩壊専用アブレーション)は18%以下である。
論文 参考訳(メタデータ) (2026-03-15T17:54:43Z) - Beyond Memorization: Reasoning-Driven Synthesis as a Mitigation Strategy Against Benchmark Contamination [77.69093448529455]
本稿では,arXiv論文から直接研究レベルのQAを合成するために,無限にスケーラブルなフレームワークを用いて実証的研究を行う。
各種サイズ,開発者,リリース日といったモデルについて,知識カットオフ日に近い性能劣化の欠如を評価した。
合成パイプラインで要求される多段階の推論は、浅い記憶よりも深い複雑さをもたらしたと仮定する。
論文 参考訳(メタデータ) (2025-08-26T16:41:37Z) - Temporal Vegetation Index-Based Unsupervised Crop Stress Detection via Eigenvector-Guided Contrastive Learning [0.0]
EigenCLは、時間的NDREダイナミクスによってガイドされる教師なしのコントラスト学習フレームワークである。
データスカース農業環境における実世界の展開に適している。
論文 参考訳(メタデータ) (2025-06-03T21:06:26Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - A Study of Posterior Stability for Time-Series Latent Diffusion [59.41969496514184]
まず,後部崩壊により可変オートエンコーダ(VAE)への潜伏拡散が減少し,表現性が低下することを示す。
次に、入力変数に対するリカレントデコーダの感度を定量化する、依存性測度という原則的手法を導入する。
理論的および実証的研究に基づいて,潜伏拡散を延長し,後部が安定な新しい枠組みを導入する。
論文 参考訳(メタデータ) (2024-05-22T21:54:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。