論文の概要: GitHub Proxy Server: A tool for supporting massive data collection on GitHub
- arxiv url: http://arxiv.org/abs/2505.18305v1
- Date: Fri, 23 May 2025 19:00:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-03 14:03:12.524296
- Title: GitHub Proxy Server: A tool for supporting massive data collection on GitHub
- Title(参考訳): GitHub Proxy Server: GitHubで大量のデータ収集をサポートするツール
- Authors: Hudson Silva Borges, Marco Tulio Valente,
- Abstract要約: GitHubは最も人気のあるソーシャルコーディングプラットフォームであり、開発者や組織が世界中のオープンソースプロジェクトをホストするために広く使用している。
プラットフォームにはWeb APIがあり、開発者がホストされている公開リポジトリから情報を収集することができる。
しかし、GitHubから大量のデータを集めることは、既存の制限と乱用検出メカニズムのために非常に難しい。
GitHub Proxy Serverと呼ばれるツールは、そのような複雑さを、運用システムやプログラミング言語に依存しないツールに抽象化します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: GitHub is the most popular social coding platform and widely used by developers and organizations to host their open-source projects around the world. Besides that, the platform has a web API that allow developers collect information from public repositories hosted on it. However, collecting massive amount of data from GitHub can be very challenging due to existing restrictions and abuse detection mechanisms. In this work, we present a tool, called GitHub Proxy Server, which abstracts such complexities into a tool that is independent on operational system and programming language. We show that, using the proposed tool, it is possible to improve the performance of GitHub mining tasks without any additional complexities.
- Abstract(参考訳): GitHubは最も人気のあるソーシャルコーディングプラットフォームであり、開発者や組織が世界中のオープンソースプロジェクトをホストするために広く使用している。
さらにこのプラットホームにはWeb APIがあり、デベロッパはそれをホストしている公開リポジトリから情報を収集できる。
しかし、GitHubから大量のデータを集めることは、既存の制限と乱用検出メカニズムのために非常に難しい。
この作業では、GitHub Proxy Serverと呼ばれるツールを紹介します。このような複雑さを、運用システムやプログラミング言語に依存しないツールに抽象化します。
提案ツールを使うことで、追加の複雑さを伴わずにGitHubマイニングタスクのパフォーマンスを向上させることができる。
関連論文リスト
- SocialED: A Python Library for Social Event Detection [53.928241775629566]
SocialEDは、ソーシャルイベント検出(SED)タスクをサポートするように設計された、包括的なオープンソースのPythonライブラリである。
詳細なドキュメンテーションを備えた統一APIを提供し、研究者や実践者がソーシャルメディアにおけるイベント検出の完全なソリューションを提供する。
SocialEDは、グラフ構築やトークン化など、幅広い事前処理技術をサポートし、モデルのトレーニングや予測のための標準化されたインターフェースを含んでいる。
論文 参考訳(メタデータ) (2024-12-18T03:37:47Z) - OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z) - GitAgent: Facilitating Autonomous Agent with GitHub by Tool Extension [81.44231422624055]
さまざまなタスクを実行できる外部ツールを備えた大規模言語モデル(LLM)に焦点が当てられている。
本稿では,GitHubから自動ツール拡張を実現するエージェントであるGitAgentを紹介する。
論文 参考訳(メタデータ) (2023-12-28T15:47:30Z) - Open Data on GitHub: Unlocking the Potential of AI [2.3324945410076685]
GitHubは、コラボレーションソフトウェア開発のための世界最大のプラットフォームであり、1億人以上のユーザーがいる。
この研究は、GitHub上のオープンデータの可能性を強調し、AI研究を加速する方法を実証する。
論文 参考訳(メタデータ) (2023-06-09T18:43:26Z) - TorchRL: A data-driven decision-making library for PyTorch [20.776851077664915]
PyTorchは、プレミア機械学習フレームワークとして昇格したが、決定および制御タスクのためのネイティブで包括的なライブラリが欠如している。
我々はPyTorchの汎用制御ライブラリであるTorchRLを提案する。
ビルディングブロックの詳細な説明と、ドメインやタスクにわたるライブラリの概要について説明する。
論文 参考訳(メタデータ) (2023-06-01T11:45:45Z) - Testing GitHub projects on custom resources using unprivileged
Kubernetes runners [1.137903861863692]
GitHubはソフトウェアプロジェクトをホスティングするための人気のあるリポジトリだ。
ネイティブなGitHub Actionsにより、ソフトウェア開発者が新しいコミットを検証するのが容易になり、新しいコードが大きなバグを導入しないという自信を持つことができる。
無償で利用可能なテスト環境は、いくつかの一般的な設定に限られるが、カスタムのAction Runnerで拡張できる。
論文 参考訳(メタデータ) (2023-05-17T16:31:41Z) - The GitHub Development Workflow Automation Ecosystems [47.818229204130596]
大規模なソフトウェア開発は、非常に協力的な取り組みになっています。
この章では、開発ボットとGitHub Actionsのエコシステムについて解説する。
この領域における最先端技術に関する広範な調査を提供する。
論文 参考訳(メタデータ) (2023-05-08T15:24:23Z) - GitHub Actions: The Impact on the Pull Request Process [7.047566396769727]
本研究では、プロジェクトがGitHub Actionsをどのように利用するか、開発者がGitHub Actionsについて何を議論しているか、プロジェクトアクティビティインジケータが採用後にどのように変化するかを調査する。
私たちの調査によると、5,000のリポジトリのうち1489がGitHub Actionsを採用しています。
また、GitHub Actionsの採用によってプルリクエスト(PR)の拒絶が増加し、受け入れられたPRでのコミュニケーションが増加し、拒否されたPRでのコミュニケーションが減少することが示唆された。
論文 参考訳(メタデータ) (2022-06-28T16:24:17Z) - The penumbra of open source: projects outside of centralized platforms
are longer maintained, more academic and more collaborative [0.0]
我々は、集中型プラットフォーム以外のオープンソースプロジェクトリポジトリの、新しくて広範なサンプルを開発しています。
我々のサンプルプロジェクトは、より多くの協力者を持ち、長期間維持され、学術的、科学的な問題に集中する傾向にある。
論文 参考訳(メタデータ) (2021-06-29T17:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。