論文の概要: Extending AI for Research to the Humanities: A Multi-Agent Framework for Evidence-Grounded Scholarship
- arxiv url: http://arxiv.org/abs/2605.30947v3
- Date: Wed, 03 Jun 2026 01:48:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 13:59:43.517236
- Title: Extending AI for Research to the Humanities: A Multi-Agent Framework for Evidence-Grounded Scholarship
- Title(参考訳): 人文科学研究のためのAIの拡張:エビデンス学習のためのマルチエージェントフレームワーク
- Authors: Yating Pan, Jiajun Zhang, Jun Wang, Qi Su,
- Abstract要約: SPIRE(Scholarly-Primitives-Inspired Research Engine)は、エビデンスに基づく人文科学研究のためのマルチエージェントフレームワークである。
複数スケールのクローズドリーダー基板上での協調エージェントの役割として、人文操作を繰り返す。
答えの正確性、深さ、カバレッジ、証拠の質について、より高いブラインド・ジャッジスコアが与えられる。
- 参考スコア(独自算出の注目度): 16.735903349022777
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: LLM-based research agents have advanced rapidly in science and engineering, where research is organized around executable experiments, code, and quantitative signals. Humanities scholarship, however, requires a different mode of reasoning: interpretive, evidence-grounded argument over primary sources, where scholarly value depends on faithful quotation, verifiable provenance, and close reading. Existing research agents remain largely optimized for execution and retrieval, not evidence-grounded interpretive reasoning. To address this gap, we introduce SPIRE (Scholarly-Primitives-Inspired Research Engine), a multi-agent framework for evidence-grounded humanities scholarship. Drawing on Scholarly Primitives theory, SPIRE casts recurring humanities operations as cooperating agent roles (source discovery, evidence annotation, comparison, provenance checking, sampling, citation binding, and argumentative synthesis) over a multi-scale close-reading substrate of passages, intra-context graph communities, and cross-context semantic clusters. On a peer-reviewed-paper benchmark over classical Chinese and Greco-Roman Latin scholarship, SPIRE recovers cited primary-source evidence more reliably than Naive LLM, Text RAG, and GraphRAG, and receives higher blind-judge scores on answer accuracy, depth, coverage, and evidence quality. Ablations show that both the scholarly-operation agents and close-reading retrieval contribute to evidence-grounded essays. Code, data catalogues, and reproduction scripts are released at https://github.com/YatingPan/SPIRE.
- Abstract(参考訳): LLMベースの研究エージェントは、科学と工学において急速に進歩し、実行可能な実験、コード、定量信号を中心に研究が組織されている。
しかし、人文科学の奨学金は、解釈的、エビデンスに根ざした第一の情報源についての議論、学術的価値は忠実な引用、検証可能な証明、そして密接な読書に依存する、異なる推論の方法を必要とする。
既存の研究エージェントは、証拠を根拠とした解釈的推論ではなく、実行と検索に大きく最適化されている。
このギャップに対処するために,実証的人文科学研究のためのマルチエージェントフレームワークであるSPIRE(Scholarly-Primitives-Inspired Research Engine)を紹介する。
SPIREはScholarly Primitives理論に基づいて、通路、コンテキスト内グラフのコミュニティ、およびコンテキスト間セマンティッククラスタの多スケールのクローズリーディング基板上で、人文操作を協調するエージェントの役割(ソース発見、エビデンスアノテーション、比較、証明チェック、サンプリング、引用結合、議論的合成)としてキャストする。
古典中国語とグレコ・ローマラテン語の学問に関する査読付き論文のベンチマークにおいて、SPIREは、Naive LLM、Text RAG、GraphRAGよりも確実な一次情報源の証拠を引用し、回答の正確性、深さ、カバレッジ、証拠の質について高いブラインド・ジャッジスコアを受け取った。
アブレーションは、学術操作エージェントと近読検索の両方がエッセイを根拠としたエッセイに寄与していることを示している。
コード、データカタログ、複製スクリプトはhttps://github.com/YatingPan/SPIRE.comで公開されている。
関連論文リスト
- Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation [70.92039951832591]
我々は、インターリーブレポート生成のためのマルチエージェントハーネスであるtextscPtahを提案する。
textscPtahは、ユーザクエリから、計画、研究、執筆段階を通じてレンダリングされたWebレポートまでのライフサイクルを編成する。
検証エージェントがハーネスの受け入れ機能として機能し、ワークフロー全体を通して事実的接地、引用の忠実性、相互の整合性を強制する。
論文 参考訳(メタデータ) (2026-05-28T12:40:34Z) - AwesomeLit: Towards Hypothesis Generation with Agent-Supported Literature Research [6.5171198649015265]
AwesomeLitは、人間とエージェントによる協調的な視覚化システムである。
ユーザーが馴染みのないトピックを探索し、有望な研究方向を特定し、研究結果の信頼性を向上させるのに役立つ。
論文 参考訳(メタデータ) (2026-03-23T23:51:14Z) - CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era [51.63024682584688]
大規模言語モデル (LLM) は新たなリスクを導入している。
本稿では,科学文献における幻覚的引用のための総合的なベンチマークおよび検出フレームワークについて紹介する。
我々のフレームワークは、精度と解釈可能性の両方において、先行手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-26T19:17:39Z) - FlyAOC: Evaluating Agentic Ontology Curation of Drosophila Scientific Knowledge Bases [10.00386797940562]
本研究では,FlyBenchを用いて,エンドツーエンドのエージェントキュレーションにおけるAIエージェントの評価を行う。
遺伝子記号のみが与えられた場合、エージェントは構造化アノテーションを生成するために16,898のフルテキスト文書のコーパスを検索して読み込まなければならない。
このベンチマークには、FlyBaseから引き出された100の遺伝子にまたがる、専門家による7,397のアノテーションが含まれている。
論文 参考訳(メタデータ) (2026-02-09T20:12:38Z) - Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards [60.0970117192627]
強化学習(Reinforcement Learning, RL)は, LLMに基づくディープサーチエージェントの強化に重要な手法である。
既存のアプローチは主にバイナリ結果の報酬に依存しており、エージェントの推論プロセスの包括性と事実性を捉えていない。
ディープサーチエージェントのための微粒化報酬フレームワークである textbfCitation-aware RL Rewards (CaRR) を提案する。
論文 参考訳(メタデータ) (2026-01-09T18:57:53Z) - SciNetBench: A Relation-Aware Benchmark for Scientific Literature Retrieval Agents [12.057215000080705]
本稿では,文献検索エージェントのためのSciNetBenchを提案する。
本ベンチマークでは,新しい知識構造を持つ論文のエゴ中心検索,学術的関係のペアワイド同定,科学的進化的軌道のパスワイド再構築の3つのレベルを体系的に評価した。
関係認識検索タスクの精度は20%以下に低下することが多く、現在の検索パラダイムの中核的な欠点が浮かび上がっている。
論文 参考訳(メタデータ) (2025-12-16T02:53:02Z) - SciRAG: Adaptive, Citation-Aware, and Outline-Guided Retrieval and Synthesis for Scientific Literature [52.36039386997026]
我々は科学文献探索のためのオープンソースのフレームワークであるSciRAGを紹介する。
1) 逐次的証拠収集と並列的証拠収集を柔軟に交互に交互に行う適応的検索,(2) 引用グラフを利用して文書を整理・フィルタリングする引用型記号推論,(3) 整合性と透過的帰属性を確保するために回答を計画・批評・洗練するアウトライン誘導合成,である。
論文 参考訳(メタデータ) (2025-11-18T11:09:19Z) - How Do LLM-Generated Texts Impact Term-Based Retrieval Models? [76.92519309816008]
本稿では,大規模言語モデル(LLM)が項ベース検索モデルに与える影響について検討する。
言語学的解析により,LLM生成テキストはよりスムーズで低周波なZipf勾配を示すことが明らかとなった。
本研究は,項分布がクエリと密接に一致した文書を優先して,項ベース検索モデルがソースバイアスを示すかどうかを考察する。
論文 参考訳(メタデータ) (2025-08-25T06:43:27Z) - Can AI Validate Science? Benchmarking LLMs for Accurate Scientific Claim $\rightarrow$ Evidence Reasoning [6.043212666944194]
CLAIM-BENCHは,科学的クレームエビデンス抽出と検証において,大規模言語モデルの能力を評価するためのベンチマークである。
GPT-4やClaudeのようなクローズドソースモデルは、精度とリコールにおいて、オープンソースモデルよりも一貫して優れています。
戦略的に設計された3つのパスと1対1のプロンプトアプローチは、分散した証拠とクレームを正確にリンクするLSMの能力を大幅に向上させた。
論文 参考訳(メタデータ) (2025-06-09T21:04:39Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、新しい作品のアイデアと運用のためのAIベースのシステムである。
ResearchAgentは、新しい問題を自動で定義し、手法と設計実験を提案し、繰り返し修正する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。