論文の概要: Paper Espresso: From Paper Overload to Research Insight
- arxiv url: http://arxiv.org/abs/2604.04562v1
- Date: Mon, 06 Apr 2026 09:45:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.161241
- Title: Paper Espresso: From Paper Overload to Research Insight
- Title(参考訳): Paper Espresso: 紙の過負荷から研究インサイトへ
- Authors: Mingzhe Du, Luu Anh Tuan, Dong Huang, See-kiong Ng,
- Abstract要約: 本稿では,最新のarXiv論文を自動的に発見,要約,分析するオープンソースプラットフォームであるPaper Espressoを紹介する。
このシステムは、大きな言語モデル(LLM)を使用して、トピックラベルとキーワードで構造化された要約を生成する。
35ヶ月の継続的デプロイメントを経て、Paper Espressoは13,300以上の論文を処理し、構造化されたメタデータをすべて公開している。
- 参考スコア(独自算出の注目度): 53.45135239997754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The accelerating pace of scientific publishing makes it increasingly difficult for researchers to stay current. We present Paper Espresso, an open-source platform that automatically discovers, summarizes, and analyzes trending arXiv papers. The system uses large language models (LLMs) to generate structured summaries with topical labels and keywords, and provides multi-granularity trend analysis at daily, weekly, and monthly scales through LLM-driven topic consolidation. Over 35 months of continuous deployment, Paper Espresso has processed over 13,300 papers and publicly released all structured metadata, revealing rich dynamics in the AI research landscape: a mid-2025 surge in reinforcement learning for LLM reasoning, non-saturating topic emergence (6,673 unique topics), and a positive correlation between topic novelty and community engagement (2.0x median upvotes for the most novel papers). A live demo is available at https://huggingface.co/spaces/Elfsong/Paper_Espresso.
- Abstract(参考訳): 科学出版の加速は、研究者が現状を維持するのをますます困難にしている。
本稿では,最新のarXiv論文を自動的に発見,要約,分析するオープンソースプラットフォームであるPaper Espressoを紹介する。
このシステムは,大規模言語モデル (LLMs) を用いて,トピックラベルとキーワードを用いた構造化要約を生成する。
35ヶ月以上の継続的デプロイメントを経て、Paper Espressoは13300以上の論文を処理し、すべての構造化されたメタデータを公開し、AI研究の世界におけるリッチなダイナミクスを明らかにした。2025年半ばのLLM推論のための強化学習の急増、非飽和トピックの出現(6,673のユニークなトピック)、トピックの新規性とコミュニティの関与(最も新しい論文では2.0倍の上昇)。
ライブデモはhttps://huggingface.co/spaces/Elfsong/Paper_Espressoで公開されている。
関連論文リスト
- SciZoom: A Large-scale Benchmark for Hierarchical Scientific Summarization across the LLM Era [2.2090506971647144]
SciZoomは、2020年から2025年までの4つのトップレベルのML会場から44,946の論文からなるベンチマークである。
我々の言語学的分析は、句パターンの顕著な変化(式表現の最大10倍)と修辞スタイル(23%のヘッジ減少)を明らかにしている。
SciZoomは、生成AI時代の科学的談話の進化をマイニングするための、挑戦的なベンチマークとユニークなリソースとして機能する。
論文 参考訳(メタデータ) (2026-03-17T05:34:46Z) - Does GenAI Rewrite How We Write? An Empirical Study on Two-Million Preprints [15.070885964897734]
生成型大規模言語モデル(LLM)は、原稿の書き方を変えることによって、さらなる破壊をもたらす可能性がある。
本稿は、2016年から2025年(115ヶ月)にかけての2100万件以上のプレプリントを4つの主要なリポジトリで大規模に分析することで、このギャップを解消する。
以上の結果から,LSMは提出サイクルと修正サイクルを加速し,言語的複雑性が緩やかに増加し,AI関連トピックが不均等に拡大したことが明らかとなった。
論文 参考訳(メタデータ) (2025-10-18T01:37:40Z) - Let's Use ChatGPT To Write Our Paper! Benchmarking LLMs To Write the Introduction of a Research Paper [64.50822834679101]
SciIGは、タイトル、抽象、および関連する作品からコヒーレントな紹介を生成するLLMの能力を評価するタスクである。
オープンソース (DeepSeek-v3, Gemma-3-12B, LLaMA 4-Maverick, MistralAI Small 3.1) およびクローズドソース GPT-4o システムを含む5つの最先端モデルを評価する。
結果は、特に意味的類似性と忠実性において、ほとんどのメトリクスにおいて、LLaMA-4 Maverickの優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-08-19T21:11:11Z) - Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Position: AI/ML Influencers Have a Place in the Academic Process [82.2069685579588]
機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文 参考訳(メタデータ) (2024-01-24T20:05:49Z) - NLLG Quarterly arXiv Report 06/23: What are the most influential current
AI Papers? [15.830129136642755]
目的は、最も関連性があり広く議論されている研究のクイックガイドを提供することであり、新参者や確立された研究者が現在の傾向を振り返り続けるのを助けることである。
我々は2023年前半に,大規模言語モデル(LLM),特にChatGPTに関連する論文の優位性を観察した。
NLP関連の論文は、私たちのデータにはML関連の論文の2倍の数の論文があるにもかかわらず、最も影響力がある(トップ論文の約60%)。
論文 参考訳(メタデータ) (2023-07-31T11:53:52Z) - Topics, Authors, and Institutions in Large Language Model Research: Trends from 17K arXiv Papers [1.5362868418787874]
大規模言語モデル(LLM)がAI研究に劇的に影響を与えており、これまで何が変わったのか、どのようにフィールドの未来を形作るかについての議論が引き起こされている。
このような疑問を明らかにするために,我々は,2023年対2018-2022年の動向に着目し,16,979 LLM関連arXiv論文のデータセットを新たに分析した。
2023年に最初の著者の半数が、AIの非NLP分野から参入し、学際的な拡張を推進している。
驚いたことに、業界は2023年の出版シェアを減らした。
論文 参考訳(メタデータ) (2023-07-20T08:45:00Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。