論文の概要: From 50% to Mastery in 3 Days: A Low-Resource SOP for Localizing Graduate-Level AI Tutors via Shadow-RAG
- arxiv url: http://arxiv.org/abs/2603.20650v1
- Date: Sat, 21 Mar 2026 05:08:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.019058
- Title: From 50% to Mastery in 3 Days: A Low-Resource SOP for Localizing Graduate-Level AI Tutors via Shadow-RAG
- Title(参考訳): 50%から3日間の熟達:Shadow-RAGによる大学院レベルのAIチューターのローリソースSOP
- Authors: Zonglin Yang, J. -H. Xie, Lining Zhang, Jiyou Jia, Zhi-X. Chen,
- Abstract要約: そこで我々は、Vision-Language Modelデータクリーニング戦略と新しいShadow-RAGアーキテクチャを用いて、1つのコンシューマグレードGPU上にデプロイ可能な3人の非熟練労働者とオープンウェイト32Bモデルのみを使用して、大学院レベルの応用数学チューターをローカライズした。
ゼロショットベースラインと標準検索の両方がモデル世代間で50~60%の精度で停滞する一方で、構造化推論ガイダンスを提供するシャドウエージェントは、新しい32Bモデルの大幅な能力向上を誘発し、パフォーマンスを74%(Naive RAG)からマスターリーレベルへと向上させる。
- 参考スコア(独自算出の注目度): 4.912243686071899
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying high-fidelity AI tutors in schools is often blocked by the Resource Curse -- the need for expensive cloud GPUs and massive data engineering. In this practitioner report, we present a replicable Standard Operating Procedure that breaks this barrier. Using a Vision-Language Model data cleaning strategy and a novel Shadow-RAG architecture, we localized a graduate-level Applied Mathematics tutor using only 3 person-days of non-expert labor and open-weights 32B models deployable on a single consumer-grade GPU. Our pilot study on a full graduate-level final exam reveals a striking emergence phenomenon: while both zero-shot baselines and standard retrieval stagnate around 50-60% accuracy across model generations, the Shadow Agent, which provides structured reasoning guidance, triggers a massive capability surge in newer 32B models, boosting performance from 74% (Naive RAG) to mastery level (90%). In contrast, older models see only modest gains (~10%). This suggests that such guidance is the key to unlocking the latent power of modern small language models. This work offers a cost-effective, scientifically grounded blueprint for ubiquitous AI education.
- Abstract(参考訳): 高校に高忠実なAI家庭教師を配置することは、高価なクラウドGPUと大規模なデータエンジニアリングの必要性であるResource Curseによってしばしばブロックされる。
本稿では,この障壁を突破するレプリカブルスタンダードオペレーティング手順を提案する。
そこで我々は、Vision-Language Modelデータクリーニング戦略と新しいShadow-RAGアーキテクチャを用いて、1つのコンシューマグレードGPU上にデプロイ可能な3人の非熟練労働者とオープンウェイト32Bモデルのみを使用して、大学院レベルの応用数学チューターをローカライズした。
ゼロショットベースラインと標準検索の両方がモデル世代間で50~60%の精度で停滞する一方で、構造化推論ガイダンスを提供するシャドウエージェントは、新しい32Bモデルの大幅な能力向上を誘発し、パフォーマンスを74% (Naive RAG) からマスターリーレベル (90%) に向上させる。
対照的に、古いモデルはわずか10%の利得しか得られない。
これは、このようなガイダンスが、現代の小言語モデルの潜在能力を解き放つ鍵であることを示唆している。
この研究は、ユビキタスAI教育のための費用効率が高く、科学的に基礎付けられた青写真を提供する。
関連論文リスト
- EasyOcc: 3D Pseudo-Label Supervision for Fully Self-Supervised Semantic Occupancy Prediction Models [4.347156881555099]
自己監督モデルは最近、特に意味的占有率予測の領域において顕著な進歩を遂げている。
これらのモデルは、基底構造ラベルの欠如を補うために洗練された損失計算戦略を利用する。
基礎モデルである Grounded-SAM と Metric3Dv2 が生成する3次元擬似地下構造ラベルを提案し,時間情報を用いてラベルの密度化を行う。
論文 参考訳(メタデータ) (2025-09-30T11:01:32Z) - BLUR: A Bi-Level Optimization Approach for LLM Unlearning [100.90394814817965]
未学習問題の階層構造をモデル化することが重要であると論じる。
本稿では,より優れた性能を実現する新しいアルゴリズムであるBi-Level UnleaRning(textttBLUR)を提案する。
論文 参考訳(メタデータ) (2025-06-09T19:23:05Z) - SuperCorrect: Advancing Small LLM Reasoning with Thought Template Distillation and Self-Correction [89.56181323849512]
SuperCorrectは、大きな教師モデルを使用して、より小さな学生モデルの推論と反映の両方を監督し、修正する新しい2段階のフレームワークである。
第1段階では、教師モデルから階層的な高レベルかつ詳細な思考テンプレートを抽出し、よりきめ細かい推論思考を導き出す学生モデルを指導する。
第2段階では、学生モデルの自己補正能力を高めるために、クロスモデル協調直接選好最適化(DPO)を導入する。
論文 参考訳(メタデータ) (2024-10-11T17:25:52Z) - GenDistiller: Distilling Pre-trained Language Models based on an Autoregressive Generative Model [20.620589404103644]
本稿では,より小規模な学生ネットワークによって,教師モデルの隠蔽表現を生成する新しい知識蒸留フレームワークであるGenDistillerを紹介する。
提案手法は,従来の隠蔽層を履歴とみなし,教師モデルの層間予測を自己回帰的に実施する。
実験により、自動回帰フレームワークを使わずに、GenDistillerのベースライン蒸留法に対する利点が明らかとなった。
論文 参考訳(メタデータ) (2024-06-12T01:25:00Z) - On-device Self-supervised Learning of Visual Perception Tasks aboard
Hardware-limited Nano-quadrotors [53.59319391812798]
SI50グラム以下のナノドロンは、学術と産業の両方で勢いを増している。
彼らの最も魅力的なアプリケーションは、知覚のためのディープラーニングモデルに依存している。
未知の環境にデプロイする場合、これらのモデルはドメインシフトによってパフォーマンスが低下することが多い。
本研究では,ナノドローンを用いたデバイス上での学習を初めて提案する。
論文 参考訳(メタデータ) (2024-03-06T22:04:14Z) - Reusing Pretrained Models by Multi-linear Operators for Efficient
Training [65.64075958382034]
大規模なモデルをスクラッチからトレーニングすることは、通常、かなりの量のリソースを必要とする。
bert2BERT や LiGO といった最近の研究は、大規模なモデルを初期化するために、小さな事前訓練されたモデルを再利用している。
本稿では,対象モデルの各重みを事前学習モデルの全重みに線形に相関させる手法を提案する。
論文 参考訳(メタデータ) (2023-10-16T06:16:47Z) - Mastering the Unsupervised Reinforcement Learning Benchmark from Pixels [112.63440666617494]
強化学習アルゴリズムは成功するが、エージェントと環境の間の大量の相互作用を必要とする。
本稿では,教師なしモデルベースRLを用いてエージェントを事前学習する手法を提案する。
我々はReal-Word RLベンチマークにおいて、適応中の環境摂動に対する抵抗性を示唆し、堅牢な性能を示す。
論文 参考訳(メタデータ) (2022-09-24T14:22:29Z) - Risks of AI Foundation Models in Education [5.152565350059199]
創始モデル」は、AIと、それらが使用されると思われる分野(教育を含む)のパラダイムシフトを表す。
このような技術は広く語られる可能性があるが、教育分野での利用は特に薄れつつある。
エビデンスによれば、基礎モデルが学習者にとってのメリットを達成できないだけでなく、その使用によって新たなリスクがもたらされることが示唆されている。
論文 参考訳(メタデータ) (2021-10-19T14:44:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。