論文の概要: The Relic Condition: When Published Scholarship Becomes Material for Its Own Replacement
- arxiv url: http://arxiv.org/abs/2604.16116v1
- Date: Fri, 17 Apr 2026 14:52:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.962217
- Title: The Relic Condition: When Published Scholarship Becomes Material for Its Own Replacement
- Title(参考訳): ライセンス条件:出版された奨学金がそれ自身の代替材料になるとき
- Authors: Lin Deng, Chang-bo Liu,
- Abstract要約: 我々は,国際的に著名な2人の人文学者と社会科学研究者の学術的推論システムを,公刊のコーパスのみから抽出した。
その結果,学者ボットが,専門家評価品質で中核的な学習機能を発揮できるかどうかを検証した。
- 参考スコア(独自算出の注目度): 1.4438155481047366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We extracted the scholarly reasoning systems of two internationally prominent humanities and social science scholars from their published corpora alone, converted those systems into structured inference-time constraints for a large language model, and tested whether the resulting scholar-bots could perform core academic functions at expert-assessed quality. The distillation pipeline used an eight-layer extraction method and a nine-module skill architecture grounded in local, closed-corpus analysis. The scholar-bots were then deployed across doctoral supervision, peer review, lecturing and panel-style academic exchange. Expert assessment involved three senior academics producing reports and appointment-level syntheses. Across the preserved expert record, all review and supervision reports judged the outputs benchmark-attaining, appointment-level recommendations placed both bots at or above Senior Lecturer level in the Australian university system, and recovered panel scores placed Scholar A between 7.9 and 8.9/10 and Scholar B between 8.5 and 8.9/10 under multi-turn debate conditions. A research-degree-student survey showed high performance ratings across information reliability, theoretical depth and logical rigor, with pronounced ceiling effects on a 7-point scale, despite all participants already being frontier-model users. We term this the Relic condition: when publication systems make stable reasoning architectures legible, extractable and cheaply deployable, the public record of intellectual labor becomes raw material for its own functional replacement. Because the technical threshold for this transition is already crossed at modest engineering effort, we argue that the window for protective frameworks covering disclosure, consent, compensation and deployment restriction is the present, while deployment remains optional rather than infrastructural.
- Abstract(参考訳): 我々は,国際的に著名な2人の人文学者と社会科学研究者の学術的推論システムを,公開コーパスのみから抽出し,これらのシステムを大規模言語モデルに対する構造的推論時間制約に変換し,その結果の学者ボットが,専門家評価品質で中核的な研究機能を果たすことができるかどうかを検証した。
蒸留パイプラインは, 局所閉鎖コーパス解析に基づく8層抽出法と9モジュールスキルアーキテクチャを用いた。
学者-ボットはその後、博士の監督、査読、講義、パネルスタイルの学術交流に展開された。
専門家による評価では、3人の上級研究者がレポートを作成し、アポイントレベルの合成を行った。
保存された専門家記録全体を通じて、すべての審査・監督報告は、ベンチマークを含むアウトプットを判断し、オーストラリア大学の上級講師レベル以上にボットを配置し、マルチターンの議論条件下でScholar Aを7.9から8.9/10、Scholar Bを8.5から8.9/10に設定したパネルスコアを回収した。
調査対象者は,すでにフロンティアモデル利用者であるにもかかわらず,7点スケールの天井効果で情報信頼性,理論深度,論理厳密度に高い評価が得られた。
出版システムが安定的な推論アーキテクチャを合法的で、抽出可能で、安価に展開可能とすると、知的労働の公的な記録は、自身の機能的置き換えのための原材料となる。
この移行の技術的しきい値は、控えめなエンジニアリング努力ですでに達成されているため、情報開示、同意、補償、デプロイメント制限を含む保護フレームワークの窓が現在あるが、配置はインフラよりもオプションである、と我々は主張する。
関連論文リスト
- COMPOSITE-Stem [32.17652486099204]
COMPOSITE-STEMは、物理学、生物学、化学、数学における70の専門的なタスクのベンチマークである。
我々のベンチマークでは、正確なマッチンググレーティングとクレーターベースのルーリックとアズ・ア・ジャイグリーグレーディングプロトコルを組み合わせる。
トップパフォーマンスモデルは21%を実現し、ComposITE-STEMが現在のエージェントリーチを超える能力をキャプチャすることを示した。
論文 参考訳(メタデータ) (2026-04-10T19:08:50Z) - ScholarPeer: A Context-Aware Multi-Agent Framework for Automated Peer Review [48.60540055009675]
ScholarPeerは、上級研究者の認知過程をエミュレートするために設計された、検索可能なマルチエージェントフレームワークである。
We evaluate ScholarPeer on DeepReview-13K and the results showed that ScholarPeer achieve significant win-rates against state-of-the-art approach in side-side-side evaluations。
論文 参考訳(メタデータ) (2026-01-30T06:54:55Z) - ReviewerToo: Should AI Join The Program Committee? A Look At The Future of Peer Review [23.630458187587223]
ReviewerTooは、AI支援ピアレビューの研究とデプロイのためのフレームワークである。
専門的なレビュアー・ペルソナと構造化された評価基準による体系的な実験を支援する。
私たちは、複雑な評価判断をドメインの専門家に任せながら、AIが一貫性、カバレッジ、公平性を高める方法を示します。
論文 参考訳(メタデータ) (2025-10-09T23:53:19Z) - Automatic Reviewers Fail to Detect Faulty Reasoning in Research Papers: A New Counterfactual Evaluation Framework [55.078301794183496]
我々は、高品質なピアレビューを支えるコアレビュースキル、すなわち欠陥のある研究ロジックの検出に注力する。
これは、論文の結果、解釈、クレームの間の内部の一貫性を評価することを含む。
本稿では,このスキルを制御条件下で分離し,テストする,完全自動対物評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-29T08:48:00Z) - The AI Imperative: Scaling High-Quality Peer Review in Machine Learning [49.87236114682497]
AIによるピアレビューは、緊急の研究とインフラの優先事項になるべきだ、と私たちは主張する。
我々は、事実検証の強化、レビュアーのパフォーマンスの指導、品質改善における著者の支援、意思決定におけるAC支援におけるAIの具体的な役割を提案する。
論文 参考訳(メタデータ) (2025-06-09T18:37:14Z) - When AI Co-Scientists Fail: SPOT-a Benchmark for Automated Verification of Scientific Research [19.97666809905332]
大規模言語モデル(LLM)は、AIコサイシストと呼ばれる自動科学的発見のビジョンを加速させた。
大規模言語モデル(LLM)の最近の進歩は、しばしばAIコサイシストと呼ばれる自動科学的発見のビジョンを加速させた。
論文 参考訳(メタデータ) (2025-05-17T05:45:16Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。