論文の概要: Launch-Day Diffusion: Tracking Hacker News Impact on GitHub Stars for AI Tools
- arxiv url: http://arxiv.org/abs/2511.04453v1
- Date: Thu, 06 Nov 2025 15:23:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.475508
- Title: Launch-Day Diffusion: Tracking Hacker News Impact on GitHub Stars for AI Tools
- Title(参考訳): Launch-Day Diffusion: ハッカーニュースの追跡とGitHub Stars for AIツール
- Authors: Obada Kraishan,
- Abstract要約: ソーシャルニュースプラットフォームは、オープンソースプロジェクト、特にHacker Newsの重要な出発点となっている。
本稿では,HN露光がGitHubのスター成長にどのように変換されるかを追跡する再現可能な実演システムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social news platforms have become key launch outlets for open-source projects, especially Hacker News (HN), though quantifying their immediate impact remains challenging. This paper presents a reproducible demonstration system that tracks how HN exposure translates into GitHub star growth for AI and LLM tools. Built entirely on public APIs, our pipeline analyzes 138 repository launches from 2024-2025 and reveals substantial launch effects: repositories gain an average of 121 stars within 24 hours, 189 stars within 48 hours, and 289 stars within a week of HN exposure. Through machine learning models (Elastic Net) and non-linear approaches (Gradient Boosting), we identify key predictors of viral growth. Posting timing appears as key factor--launching at optimal hours can mean hundreds of additional stars--while the "Show HN" tag shows no statistical advantage after controlling for other factors. The demonstration completes in under five minutes on standard hardware, automatically collecting data, training models, and generating visualizations through single-file scripts. This makes our findings immediately reproducible and the framework easily be extended to other platforms, providing both researchers and developers with actionable insights into launch dynamics.
- Abstract(参考訳): ソーシャルニュースプラットフォームは、オープンソースプロジェクト、特にHacker News(HN)の重要な出発点となっているが、その直接的な影響を定量化するのは難しい。
本稿では,HNの露光が,AIやLDMツールのGitHubスター成長にどのように変換されるかを追跡する再現可能なデモシステムを提案する。
リポジトリは24時間以内に平均121個の星を、48時間以内に189個の星を、HN暴露から1週間以内に289個の星を得る。
機械学習モデル(Elastic Net)と非線形アプローチ(Gradient Boosting)を通じて、バイラル成長の重要な予測因子を特定する。
投稿のタイミングは重要な要素として現れ、最適な時間帯に開始すると、数百の星が追加される可能性がある。
デモは標準ハードウェア上で5分以内で完了し、データを自動的に収集し、モデルをトレーニングし、単一ファイルスクリプトで視覚化を生成する。
これにより、すぐに再現でき、フレームワークは他のプラットフォームにも容易に拡張できます。
関連論文リスト
- Beneath the Mask: Can Contribution Data Unveil Malicious Personas in Open-Source Projects? [0.0]
本稿では、GitHubのコントリビューションから収集したオープンソースインテリジェンス(OSINT)データをグラフデータベースとグラフ理論を用いて分析し、他のオープンソースプロジェクト間で"JiaT75"ペルソナが示す異常な振る舞いを効率的に識別する方法を示す。
論文 参考訳(メタデータ) (2025-08-19T02:17:48Z) - VulGuard: An Unified Tool for Evaluating Just-In-Time Vulnerability Prediction Models [3.4299920908334673]
VulGuardは、脆弱性予測(JIT-VP)研究のためのGitHubリポジトリからのコミットの抽出、処理、分析を効率化する自動化ツールである。
コミット履歴を自動的にマイニングし、きめ細かいコード変更、コミットメッセージ、ソフトウェアエンジニアリングメトリクスを抽出し、下流分析のためにフォーマットします。
論文 参考訳(メタデータ) (2025-07-22T15:18:44Z) - Mercury: Ultra-Fast Language Models Based on Diffusion [58.52391675075641]
拡散に基づく新しい商用大規模言語モデル(LLM)であるMercuryを提示する。
Mercury CoderにはMiniとSmallの2つのサイズがある。
独立した評価に基づいて、マーキュリー・コーダ・ミニとマーキュリー・コーダ・スモールは、それぞれ1109トークン/秒と737トークン/秒の最先端のスループットを達成した。
論文 参考訳(メタデータ) (2025-06-17T17:06:18Z) - The TESS Ten Thousand Catalog: 10,001 uniformly-vetted and -validated Eclipsing Binary Stars detected in Full-Frame Image data by machine learning and analyzed by citizen scientists [0.5381115559554392]
我々は、全ての短命と光中心テストに合格した10001個の楕円型連星のカタログを提示する。
対象物の検出と分析について概説し、サンプルの特性について論じ、潜在的に興味深いシステムに焦点を当てる。
論文 参考訳(メタデータ) (2025-06-05T23:29:13Z) - Six Million (Suspected) Fake Stars in GitHub: A Growing Spiral of Popularity Contests, Spams, and Malware [52.84746696418136]
われわれは,GitHubにおける偽星の系統的,グローバル的,縦断的な測定を行った。
スケーラブルなツールであるStarScoutは、2019年から2024年の間に、すべてのGitHubメタデータにわたって、異常に主演する動作を検出することができる。
その結果,(1) 偽星関連活動は2024年に急速に急増し,(2) 偽星キャンペーンのアカウントやレポジトリは極めて自明な活動パターンを持ち,ほとんどの偽星は短命のフィッシングマルウェアレポジトリを促進するために使用されている。
論文 参考訳(メタデータ) (2024-12-18T03:03:58Z) - Generative AI for Software Metadata: Overview of the Information
Retrieval in Software Engineering Track at FIRE 2023 [18.616716369775883]
Information Retrieval in Software Engineering (IRSE)トラックは、コードコメントの自動評価ソリューションの開発を目的としている。
データセットは9048のコードコメントと、オープンソースCベースのプロジェクトから抽出されたコードスニペットペアで構成されている。
大きな言語モデルから生成されたラベルは、予測モデルのバイアスを増加させるが、過度に適合しない結果をもたらす。
論文 参考訳(メタデータ) (2023-10-27T14:13:23Z) - Follow Anything: Open-set detection, tracking, and following in
real-time [89.83421771766682]
我々は,物体をリアルタイムで検出,追跡,追跡するロボットシステムを提案する。
私たちのアプローチは、何でも従う"(FAn)と呼ばれ、オープンな語彙とマルチモーダルモデルです。
FAnは軽量(6~8GB)グラフィックカードでラップトップにデプロイでき、毎秒6~20フレームのスループットを実現する。
論文 参考訳(メタデータ) (2023-08-10T17:57:06Z) - SODA10M: Towards Large-Scale Object Detection Benchmark for Autonomous
Driving [94.11868795445798]
我々は,SODA10Mという名の自律走行用大規模物体検出ベンチマークをリリースし,1000万枚の未ラベル画像と6つの代表対象カテゴリをラベル付けした20K画像を含む。
多様性を向上させるために、画像は32の異なる都市で、1フレームあたり10秒毎に異なる気象条件、期間、場所のシーンで収集される。
我々は、既存の教師付き最先端検出モデル、一般的な自己監督型および半教師付きアプローチ、および将来のモデルの開発方法に関するいくつかの知見について、広範な実験と詳細な分析を行った。
論文 参考訳(メタデータ) (2021-06-21T13:55:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。