論文の概要: Kaggle Chronicles: 15 Years of Competitions, Community and Data Science Innovation
- arxiv url: http://arxiv.org/abs/2511.06304v1
- Date: Sun, 09 Nov 2025 10:01:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.876522
- Title: Kaggle Chronicles: 15 Years of Competitions, Community and Data Science Innovation
- Title(参考訳): Kaggle Chronicles: 15年間のコンペティション,コミュニティ,データサイエンスのイノベーション
- Authors: Kevin Bönisch, Leandro Losaria,
- Abstract要約: 2010年以来、Kaggleはデータサイエンティストが競争し、協力し、データサイエンスの境界を押し進めるプラットフォームだった。
本研究では、メタデータ、共有コード、コミュニティの議論、競争そのものを通じて、Kaggleに関する15年間のデータサイエンスについて詳しく調べる。
我々は、縦方向トレンド分析と標準探索データ解析の両方を実行するために、数百万のカーネルと議論スレッドを分析してこれを行う。
- 参考スコア(独自算出の注目度): 0.19116784879310025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since 2010, Kaggle has been a platform where data scientists from around the world come together to compete, collaborate, and push the boundaries of Data Science. Over these 15 years, it has grown from a purely competition-focused site into a broader ecosystem with forums, notebooks, models, datasets, and more. With the release of the Kaggle Meta Code and Kaggle Meta Datasets, we now have a unique opportunity to explore these competitions, technologies, and real-world applications of Machine Learning and AI. And so in this study, we take a closer look at 15 years of data science on Kaggle - through metadata, shared code, community discussions, and the competitions themselves. We explore Kaggle's growth, its impact on the data science community, uncover hidden technological trends, analyze competition winners, how Kagglers approach problems in general, and more. We do this by analyzing millions of kernels and discussion threads to perform both longitudinal trend analysis and standard exploratory data analysis. Our findings show that Kaggle is a steadily growing platform with increasingly diverse use cases, and that Kagglers are quick to adapt to new trends and apply them to real-world challenges, while producing - on average - models with solid generalization capabilities. We also offer a snapshot of the platform as a whole, highlighting its history and technological evolution. Finally, this study is accompanied by a video (https://www.youtube.com/watch?v=YVOV9bIUNrM) and a Kaggle write-up (https://kaggle.com/competitions/meta-kaggle-hackathon/writeups/kaggle-chronicles-15-years-of-compet itions-communi) for your convenience.
- Abstract(参考訳): 2010年以降、Kaggleは世界中のデータサイエンティストが競争し、協力し、データサイエンスの境界を押し進めるプラットフォームとなっている。
この15年間で、純粋な競争に焦点を当てたサイトから、フォーラム、ノートブック、モデル、データセットなどを備えたより広範なエコシステムへと成長してきた。
Kaggle Meta CodeとKaggle Meta Datasetsのリリースにより、機械学習とAIの競争、技術、そして現実世界の応用を探求するユニークな機会が得られました。
そこで本研究では,メタデータや共有コード,コミュニティの議論,競争そのものを通じて,Kaggleに関する15年間のデータ科学について詳しく検討する。
私たちはKaggleの成長、データサイエンスコミュニティへの影響、隠された技術トレンドの解明、競争の勝者の分析、Kagglersが一般的な問題にどのようにアプローチするかなどについて調べる。
我々は、縦方向トレンド分析と標準探索データ解析の両方を実行するために、数百万のカーネルと議論スレッドを分析してこれを行う。
我々の調査によると、Kaggleはますます多様なユースケースを持つ着実に成長しているプラットフォームであり、Kagglersは新しいトレンドに素早く適応し、現実の課題に適用し、一方、平均して、強力な一般化機能を備えたモデルを生成しています。
プラットフォーム全体のスナップショットも提供し、その歴史と技術的な進化を強調しています。
最後に、この研究にはビデオ(https://www.youtube.com/watch?v=YVOV9bIUNrM)とKaggleの書き込み(https://kaggle.com/competitions/meta-kaggle-hackathon/writeups/kaggle-chronicles-15-years-of-compet itions-communi)が添付されている。
関連論文リスト
- Ensemble Learning to Assess Dynamics of Affective Experience Ratings and
Physiological Change [15.094086415816632]
理論的仮定とデータ駆動手法を組み合わせたデータ解析ソリューションを提案する。
この戦略により、テストセットにおけるRMSE全体の1.19が得られた。
論文 参考訳(メタデータ) (2023-12-26T12:53:57Z) - Contextualizing Emerging Trends in Financial News Articles [2.9483477138814287]
新型コロナウイルス(COVID-19)パンデミックの開始前後に収集された、Microsoftに関する金融ニュース記事の新興トレンド検出に焦点を当てる。
データセットをアクセス可能にし、キーワードのペア間の類似性のダイナミクスを探索するための強力なベースラインを提案する。
我々は、このパンデミックがMicrosoftに与える影響について、金の標準(Google Trends)と、注目すべき実世界のシナリオについて評価する。
論文 参考訳(メタデータ) (2023-01-20T12:56:52Z) - Big Data Meets Metaverse: A Survey [58.83882109159864]
Metaverseは、未来の新興技術だ。
ビッグデータ、AI(人工知能)、VR(Virtual Reality)、AR(Augmented Reality)、MR(mixed Reality)を組み合わせたものだ。
論文 参考訳(メタデータ) (2022-10-28T17:22:20Z) - Learning More May Not Be Better: Knowledge Transferability in Vision and
Language Tasks [38.114498708553874]
共通の目標を共有した場合でも,すべての知識の伝達が良好であったり,関連するタスクに肯定的な影響を与えている訳ではない。
4つのグループに分類される12の視覚・言語タスクにおいて、何百もの横断実験に基づいて徹底的な分析を行う。
データセットのサイズや事前学習ステージといった他の要因も、その知識の伝達方法に大きな影響を与えます。
論文 参考訳(メタデータ) (2022-08-23T06:39:18Z) - Knowledge Graph Question Answering Leaderboard: A Community Resource to
Prevent a Replication Crisis [61.740077541531726]
コミュニティの焦点として、KGQAベンチマークデータセットに対して、新たな中心的でオープンなリーダボードを提供しています。
本分析は,KGQAシステムの評価において,既存の問題点を浮き彫りにする。
論文 参考訳(メタデータ) (2022-01-20T13:46:01Z) - Streaming Social Event Detection and Evolution Discovery in
Heterogeneous Information Networks [90.3475746663728]
イベントは現実世界やリアルタイムで行われており、社会集会、祝祭、影響力のある会議、スポーツ活動などのイベントのために計画や組織化が可能である。
ソーシャルメディアプラットフォームは、トピックの異なる公開イベントに関する多くのリアルタイムテキスト情報を生成する。
しかし、異質なテクスチャやメタデータがあいまいであることが多いため、社会イベントの採掘は困難である。
論文 参考訳(メタデータ) (2021-04-02T02:13:10Z) - LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。
我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。
この技術的レポートは、課題のハイライトを要約している。
論文 参考訳(メタデータ) (2020-10-17T13:06:12Z) - What is More Likely to Happen Next? Video-and-Language Future Event
Prediction [111.93601253692165]
対話が整ったビデオの場合、人々は次に何が起こるかを見極めることができる。
本研究では,AIモデルがこのようなマルチモーダル・コモンセンスの次世代予測を学べるかどうかを考察する。
新しいデータセットであるVideo-and-Language Event Prediction(ビデオ・アンド・ランゲージ・イベント予測)を収集します。
論文 参考訳(メタデータ) (2020-10-15T19:56:47Z) - Biases in Data Science Lifecycle [0.0]
本研究の目的は,データ科学者の実践的ガイドラインを提供し,その意識を高めることである。
この研究では、さまざまなバイアス源をレビューし、データサイエンスライフサイクルの異なる段階の下でグループ化しました。
論文 参考訳(メタデータ) (2020-09-10T13:41:48Z) - StackOverflow vs Kaggle: A Study of Developer Discussions About Data
Science [0.0]
本稿では,StackOverflowとKaggleの197836ポストの特性について実験を行った。
主な発見は、StackOverflowで最も多いトピックに関するものだ。
どちらのコミュニティでも、DSに関する議論は劇的なペースで増えている。
アンサンブルアルゴリズムはKaggleで最も言及されているML/DLアルゴリズムであるが、StackOverflowではほとんど議論されていない。
論文 参考訳(メタデータ) (2020-06-06T06:51:11Z) - Comprehensive Instructional Video Analysis: The COIN Dataset and
Performance Evaluation [100.68317848808327]
包括的インストラクショナルビデオ解析のための大規模データセット「COIN」を提案する。
COINデータセットには、日々の生活に関連する12の領域で180のタスクの11,827の動画が含まれている。
新しい開発ツールボックスでは、すべてのビデオに一連のステップラベルと対応する時間境界がアノテートされる。
論文 参考訳(メタデータ) (2020-03-20T16:59:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。