論文の概要: AlphaContext: An Evolutionary Tree-based Psychometric Context Generator for Creativity Assessment
- arxiv url: http://arxiv.org/abs/2604.18398v2
- Date: Tue, 21 Apr 2026 14:53:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 14:04:47.94748
- Title: AlphaContext: An Evolutionary Tree-based Psychometric Context Generator for Creativity Assessment
- Title(参考訳): AlphaContext: 創造性評価のための進化的木に基づく心理的コンテキスト生成装置
- Authors: Yixuan Wang, Yue Huang, Hong Qian, Yunzhao Wei, Yifei Ding, Wenkai Wang, Zhi Liu, Zhongjing Huang, Aimin Zhou, Jiajun Guo,
- Abstract要約: 創造性評価のための進化的木に基づく心理測定コンテキストジェネレータであるAlphaContextを提案する。
まず、HyperTree Outline Plannerはルール誘導のハイパーツリーとして概説し、トップダウン階層的な計画を実行する。
Assessment-Guided Evolution Refinerは、様々なスタイルで仮想参加者をシミュレートし、さらなる進化のために弱いコンテキストをリサイクルする。
- 参考スコア(独自算出の注目度): 36.424187284273124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creativity has become a core competence in the era of LLMs and human-AI collaboration, underpinning innovation in real-world problem solving. Crucially, the systematic improvement of creativity necessitates scientifically valid assessment instruments. Psychometric research recognizes context-based assessment as an effective way to measure creative thinking. However, high-quality expert-designed contexts remain scarce. Existing LLM-based generators often struggle with insufficient assessment cues, weak narrative coherence, limited stylistic diversity, and poor support for creative thinking. To address these challenges, we propose AlphaContext, an evolutionary tree-based psychometric context generator for creativity assessment. First, the HyperTree Outline Planner formalizes expert-designed outlining as a rule-guided hypertree and performs top-down hierarchical planning. The MCTS-based Context Generator fills the outline via MCTS to balance global structure and local quality. Then, the Evolutionary Context Optimizer evolves contexts with MAP-Elites by repeatedly updating niche elites to jointly improve diversity and quality. Finally, the Assessment-Guided Evolution Refiner simulates virtual participants with diverse styles and recycles weak contexts for further evolution. Experiments show that AlphaContext yields an average improvement of 8% over competitive methods across 6 quality metrics.
- Abstract(参考訳): 創造性は、LLMと人間とAIのコラボレーションの時代において中心的な能力となり、現実世界の問題解決におけるイノベーションの基盤となっている。
重要なことに、創造性の体系的な改善は科学的に有効な評価機器を必要とする。
心理学的研究は、文脈に基づく評価を創造的思考を測定する効果的な方法として認識している。
しかし、高品質な専門家が設計した文脈は依然として乏しい。
既存のLCMベースのジェネレータは、評価方法の不足、物語のコヒーレンスの弱さ、スタイリスティックな多様性の制限、創造的思考への支援不足に悩まされることが多い。
これらの課題に対処するため、我々は、創造性評価のための進化的木に基づく心理測定コンテキストジェネレータであるAlphaContextを提案する。
まず、HyperTree Outline Plannerは、専門家が設計したアウトラインをルールガイダンスのハイパーツリーとして形式化し、トップダウン階層的な計画を実行する。
MCTSベースのContext Generatorは、グローバル構造とローカル品質のバランスをとるために、MCTS経由でアウトラインを埋める。
次に、進化的コンテキスト最適化器は、多様性と品質を共同で改善するために、ニッチなエリートを何度も更新することでMAP-Elitesでコンテキストを進化させる。
最後に、Audiment-Guided Evolution Refinerは、様々なスタイルで仮想参加者をシミュレートし、さらなる進化のために弱いコンテキストをリサイクルする。
実験によると、AlphaContextは6つの品質メトリクスで競合するメソッドよりも平均8%改善している。
関連論文リスト
- Self-evolving expertise in complex non-verifiable subject domains: dialogue as implicit meta-RL [0.0]
いわゆる「邪悪な問題」は、複雑な多次元の設定、検証不可能な結果、不均一な影響、客観的に正しい答えの欠如など、歴史を通じて人類を悩ませてきた。
現状の人工知能システム(特にLarge Language Modelベースのエージェント)は、そのような問題を解決するために人間と共同で研究されている。
この研究は、Dialecticaとのギャップに対処する。これは、エージェントが定義されたトピックに関する構造化された対話に従事し、メモリによる拡張、自己回帰、ポリシーに制約のあるコンテキスト編集を行うフレームワークである。
論文 参考訳(メタデータ) (2025-10-17T15:59:44Z) - Beyond Benchmark: LLMs Evaluation with an Anthropomorphic and Value-oriented Roadmap [44.608160256874726]
本調査では,人間の知能のレンズを通して人為的評価パラダイムを導入する。
実践的な価値を得るために、経済の生存可能性、社会的影響、倫理的整合性、環境持続可能性を評価する価値指向評価(VQ)フレームワークを開拓した。
論文 参考訳(メタデータ) (2025-08-26T03:43:05Z) - AlphaEval: A Comprehensive and Efficient Evaluation Framework for Formula Alpha Mining [6.167227740097627]
金融データから予測信号を生成するフォーミュラアルファマイニングは、量的投資に不可欠である。
既存の評価指標には、主にバックテストと相関ベースの測定が含まれている。
自動アルファマイニングモデルのための統一的で並列化可能なバックテストフリー評価フレームワークであるAlphaEvalを提案する。
論文 参考訳(メタデータ) (2025-08-10T11:19:24Z) - Creativity in LLM-based Multi-Agent Systems: A Survey [56.25583236738877]
大規模言語モデル(LLM)によるマルチエージェントシステム(MAS)は、人間とAIが協調してアイデアやアーティファクトを生成する方法を変えつつある。
これはMASにおける創造性に関する最初の調査である。
本研究では,(1)エージェントの能動性やペルソナ設計の分類,(2)分岐探索,反復改良,協調合成などの生成技術の概要,(3)不整合評価基準,不整合性バイアス緩和,協調競合,統一ベンチマークの欠如といった重要な課題について論じる。
論文 参考訳(メタデータ) (2025-05-27T12:36:14Z) - Evaluating Text Creativity across Diverse Domains: A Dataset and Large Language Model Evaluator [26.89750429841565]
大規模言語モデル(LLM)の創造性評価は依然として挑戦的なフロンティアである
本稿では,テキストの創造性を評価するためのペアワイズ比較フレームワークを提案する。
CreataSetのトレーニングを通じて, CrEvalというLCMに基づく評価器を開発した。
論文 参考訳(メタデータ) (2025-05-25T17:25:23Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Generate, Discriminate, Evolve: Enhancing Context Faithfulness via Fine-Grained Sentence-Level Self-Evolution [61.80716438091887]
GenDiE (Generate, Discriminate, Evolve) は、微粒な文レベルの最適化によって文脈忠実性を高める新しい自己進化フレームワークである。
応答中の各文を独立した最適化単位として扱うことで、GenDiEは以前のアプローチの限界に効果的に対処する。
ASQA(ドメイン内のLFQA)とConFiQAデータセットの実験は、GenDiEが忠実さと正しさの両方で様々なベースラインを超えることを示した。
論文 参考訳(メタデータ) (2025-03-03T16:08:33Z) - Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model Attribution [48.86322922826514]
本稿では,知識認識型言語モデル属性(KaLMA)の新たな課題について述べる。
まず、属性のソースを構造化されていないテキストから知識グラフ(KG)に拡張し、そのリッチな構造は属性のパフォーマンスと作業シナリオの両方に役立ちます。
第2に,不完全な知識リポジトリを考慮した「意識的非能力」の設定を提案する。
第3に,テキスト品質,引用品質,引用アライメントを含む総合的な自動評価指標を提案する。
論文 参考訳(メタデータ) (2023-10-09T11:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。