論文の概要: Sci-Reasoning: A Dataset Decoding AI Innovation Patterns
- arxiv url: http://arxiv.org/abs/2601.04577v1
- Date: Thu, 08 Jan 2026 04:12:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.033178
- Title: Sci-Reasoning: A Dataset Decoding AI Innovation Patterns
- Title(参考訳): Sci-Reasoning: AIイノベーションパターンをデコードするデータセット
- Authors: Jiachen Liu, Maestro Harmon, Zechen Zhang,
- Abstract要約: Sci-Reasoningは、高品質なAI研究の背後にある知的合成をキャプチャする最初のデータセットである。
分析では15の異なる思考パターンを同定し,3つの戦略が52.7%を占めた。
このデータセットは、科学的進歩の定量的研究を可能にし、次世代AI研究エージェントを訓練するための構造化推論軌道を提供する。
- 参考スコア(独自算出の注目度): 14.720475159371361
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: While AI innovation accelerates rapidly, the intellectual process behind breakthroughs -- how researchers identify gaps, synthesize prior work, and generate insights -- remains poorly understood. The lack of structured data on scientific reasoning hinders systematic analysis and development of AI research agents. We introduce Sci-Reasoning, the first dataset capturing the intellectual synthesis behind high-quality AI research. Using community-validated quality signals and an LLM-accelerated, human-verified pipeline, we trace Oral and Spotlight papers across NeurIPS, ICML, and ICLR (2023-2025) to its key predecessors, articulating specific reasoning links in a structured format. Our analysis identifies 15 distinct thinking patterns, with three dominant strategies accounting for 52.7%: Gap-Driven Reframing (24.2%), Cross-Domain Synthesis (18.0%), and Representation Shift (10.5%). The most powerful innovation recipes combine multiple patterns: Gap-Driven Reframing + Representation Shift, Cross-Domain Synthesis + Representation Shift, and Gap-Driven Reframing + Cross-Domain Synthesis. This dataset enables quantitative studies of scientific progress and provides structured reasoning trajectories for training the next generation AI research agents.
- Abstract(参考訳): AIのイノベーションは急速に加速するが、ブレークスルーの背後にある知的なプロセス — ギャップを識別し、事前の作業を合成し、洞察を生成する — は、いまだに理解されていない。
科学的推論に関する構造化データの欠如は、AI研究エージェントの体系的な分析と開発を妨げる。
Sci-Reasoningは、高品質なAI研究の背後にある知的合成をキャプチャする最初のデータセットである。
コミュニティバリデーションされた品質信号とLLM加速された人間検証パイプラインを使用して、NeurIPS、ICML、ICLR(2023-2025)をまたいだOralとSpotlightの論文を、その主要な前駆体に追跡し、構造化されたフォーマットで特定の推論リンクを明示する。
分析では,ギャップ駆動リフレーミング(24.2%),クロスドメイン合成(18.0%),表現シフト(10.5%)の3つの主要な戦略が52.7%を占める15の異なる思考パターンを同定した。
最も強力なイノベーションレシピは、ギャップ駆動リフレーミング + 表現シフト、クロスドメイン合成 + 表現シフト、ギャップ駆動リフレーミング + クロスドメイン合成である。
このデータセットは、科学的進歩の定量的研究を可能にし、次世代AI研究エージェントを訓練するための構造化推論軌道を提供する。
関連論文リスト
- Cross-Disciplinary Knowledge Retrieval and Synthesis: A Compound AI Architecture for Scientific Discovery [1.5143261755366868]
BioSageは、LLMをRAGと統合した新しい複合AIアーキテクチャで、AI、データサイエンス、バイオメディカル、バイオセキュリティドメインにわたる発見を可能にするために、特殊なエージェントとツールを編成した。
本システムでは,クエリ計画と応答合成を備えた検索エージェントを含む,複数の特殊エージェントを特徴とし,引用支援型応答を持つドメイン間の知識検索を実現する。
我々の研究は、チャート、表、構造化された科学データに対するマルチモーダル検索と推論に重点を置いており、また、クロスディシプリナ発見のための総合的なマルチモーダルベンチマークも開発している。
論文 参考訳(メタデータ) (2025-11-23T05:33:11Z) - Neo-Grounded Theory: A Methodological Innovation Integrating High-Dimensional Vector Clustering and Multi-Agent Collaboration for Qualitative Research [5.848041907318412]
Neo Grounded Theory (NGT)は、定性的研究のスケール深さパラドックスを解決するために、ベクトルクラスタリングとマルチエージェントシステムを統合する。
NGTは168倍の速度向上(3時間対3週間)、優れた品質(0.904対0.883)、96%のコスト削減を達成した。
論文 参考訳(メタデータ) (2025-09-26T16:26:33Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery [108.1082357960201]
エージェントAIは仮説生成、実験設計、実行、分析、反復的洗練の能力を示す。
この調査は、生命科学、化学、材料科学、物理学にまたがる自律的な科学的発見のドメイン指向のレビューを提供する。
論文 参考訳(メタデータ) (2025-08-18T05:25:54Z) - AI-Driven Automation Can Become the Foundation of Next-Era Science of Science Research [58.944125758758936]
科学科学(Science of Science, SoS)は、科学的発見の基礎となるメカニズムを探求する。
人工知能(AI)の出現は、次世代のSoSに変革の機会をもたらす。
我々は、従来の手法よりもAIの利点を概説し、潜在的な制限について議論し、それらを克服するための経路を提案する。
論文 参考訳(メタデータ) (2025-05-17T15:01:33Z) - MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning? [51.85759493254735]
MindGYMは、質問合成のための構造化されスケーラブルなフレームワークである。
モデル合成の振る舞いを形作るために、高レベルの推論目的を注入する。
より深い推論のために、QAシードに基づいてより複雑なマルチホップ質問を構成する。
論文 参考訳(メタデータ) (2025-03-12T16:03:03Z) - CS-PaperSum: A Large-Scale Dataset of AI-Generated Summaries for Scientific Papers [3.929864777332447]
CS-PaperSumは、31の上位コンピュータサイエンスカンファレンスから91,919件の大規模データセットである。
我々のデータセットは、自動文献分析、研究トレンド予測、AIによる科学的発見を可能にする。
論文 参考訳(メタデータ) (2025-02-27T22:48:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。