論文の概要: Creative Quality Alignment: Expert Tacit Knowledge Transfer via Chain-of-Thought Fine-Tuning
- arxiv url: http://arxiv.org/abs/2605.25977v1
- Date: Mon, 25 May 2026 15:52:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.451087
- Title: Creative Quality Alignment: Expert Tacit Knowledge Transfer via Chain-of-Thought Fine-Tuning
- Title(参考訳): 創造的品質アライメント: チェーン・オブ・ソートファインチューニングによる知識伝達の専門家
- Authors: Bo Zou, Chao Xu,
- Abstract要約: 本稿では,キャリブレートサプライズ(Zou & Xu, 2026a)における創造的品質指標の実証的実装について述べる。
トレーニングデータは、BCプロトコル(Zou & Xu, 2026b)によって作成された約100の専門家チェーン(CoT)アノテーションから得られる。
- 参考スコア(独自算出の注目度): 10.071691304378065
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper provides an empirical implementation of the creative quality metric proposed in Calibrated Surprise (Zou & Xu, 2026a). The question this paper addresses is: does this mathematical claim hold at the engineering level? To make the answer as general as possible, we deliberately choose the strictest engineering conditions: low data cost and a small base model. Training data comes from approximately 100 expert chain-of-thought (CoT) annotations produced by the BC Protocol (Zou & Xu, 2026b). We also identify a data bias: most publicly available alignment datasets are skewed toward craft-related knowledge, while audience modeling and reality-logic coverage are systematically weak. We use the term Creative Quality Alignment (CQA) to describe this class of engineering methods. We also offer a supporting theoretical observation: in an LLM with a single conditional distribution architecture, calibrating the appreciation side automatically transfers to the generation side via architectural duality. This is the structural reason why ~100 CoT examples are sufficient -- not a purely empirical observation like LIMA (Zhou et al., 2023).
- Abstract(参考訳): 本稿では,Calibrated Surprise(Zou & Xu, 2026a)で提案される創造的品質指標の実証的実装について述べる。
この数学的主張はエンジニアリングのレベルで成り立つのか?
解答をできるだけ一般的なものにするために、私たちは意図的に最も厳格なエンジニアリング条件、すなわちデータコストの低減と小さなベースモデルを選択します。
トレーニングデータは、BCプロトコル(Zou & Xu, 2026b)によって作成された約100の専門家チェーン(CoT)アノテーションから得られる。
もっとも一般公開されているアライメントデータセットは、クラフト関連の知識に結びついているが、オーディエンスモデリングと現実論理のカバレッジは、体系的に弱い。
我々は、CQA(Creative Quality Alignment)という用語を使って、この工学的手法のクラスを記述する。
単一の条件分布アーキテクチャを持つLLMでは、評価側がアーキテクチャの双対性を介して生成側へ自動的に転送される。
LIMA(Zhou et al , 2023)のような純粋に経験的な観測ではない。
関連論文リスト
- MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale [92.09717763663873]
我々は、データエンジニアリングとトレーニング戦略設計を通じて、純粋に最先端の技術を進化させるMinerU2.5-Proを提案する。
コアとなるのは、カバレッジ、情報性、アノテーションの正確性を中心に設計されたData Engineだ。
我々は,MinerU2.5-Pro が OmniDocBench v1.6 上で 95.69 を達成することを示す。
論文 参考訳(メタデータ) (2026-04-06T15:44:18Z) - RPC-Bench: A Fine-grained Benchmark for Research Paper Comprehension [65.81339691942757]
RPC-Bench(RPC-Bench)は、高品質なコンピュータサイエンス論文のレビュー・リビューの交換から構築された大規模質問応答ベンチマークである。
我々は、科学研究の流れに沿ったきめ細かい分類を設計し、モデルがなぜ、何、どのように学術的な文脈で質問するかを理解し、答える能力を評価する。
論文 参考訳(メタデータ) (2026-01-14T11:37:00Z) - Human-aligned AI Model Cards with Weighted Hierarchy Architecture [5.774549987076668]
LLM(Large Language Models)の普及は、専門的なドメイン特化モデルのエコシステムの肥大化につながった。
Model CardsやFactSheetsといった既存のドキュメントフレームワークは、レポートの標準化を試みるが、多くの場合は静的で、質的である。
我々は、静的開示からアクション可能な人間対応のドキュメントに移行する新しいアプローチである包括的責任AIモデルカードフレームワーク(CRAI-MCF)を紹介します。
論文 参考訳(メタデータ) (2025-10-08T13:13:18Z) - SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。
我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。
本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-21T03:39:04Z) - Investigating Graph Structure Information for Entity Alignment with
Dangling Cases [31.779386064600956]
エンティティアライメントは、異なる知識グラフ(KG)における等価なエンティティを見つけることを目的としている。
Weakly-optimal Graph Contrastive Learning (WOGCL) と呼ばれる新しいエンティティアライメントフレームワークを提案する。
We show that WOGCL are outperforms the current-of-the-art method with pure structure information in traditional (relaxed) and dangling settings。
論文 参考訳(メタデータ) (2023-04-10T17:24:43Z) - Understanding Dynamics of Nonlinear Representation Learning and Its
Application [12.697842097171119]
暗黙的非線形表現学習のダイナミクスについて検討する。
我々は,データ構造アライメント条件がグローバル収束に十分であることを示す。
我々はデータ構造アライメント条件を満たす新しいトレーニングフレームワークを作成した。
論文 参考訳(メタデータ) (2021-06-28T16:31:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。