論文の概要: CHisAgent: A Multi-Agent Framework for Event Taxonomy Construction in Ancient Chinese Cultural Systems
- arxiv url: http://arxiv.org/abs/2601.05520v1
- Date: Fri, 09 Jan 2026 04:28:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.835153
- Title: CHisAgent: A Multi-Agent Framework for Event Taxonomy Construction in Ancient Chinese Cultural Systems
- Title(参考訳): CHisAgent: 古代中国文化システムにおけるイベント分類構築のためのマルチエージェントフレームワーク
- Authors: Xuemei Tang, Chengxi Yan, Jinghang Gu, Chu-Ren Huang,
- Abstract要約: 古代中国における歴史的分類学構築のためのマルチエージェントフレームワークである textbfCHisAgent を提案する。
ボトムアップのtextitInducerは生の歴史的コーパスから初期階層を派生し、トップダウンのtextitExpanderはLLMの世界知識を使って中間概念を欠いている。
- 参考スコア(独自算出の注目度): 6.846413131554734
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Despite strong performance on many tasks, large language models (LLMs) show limited ability in historical and cultural reasoning, particularly in non-English contexts such as Chinese history. Taxonomic structures offer an effective mechanism to organize historical knowledge and improve understanding. However, manual taxonomy construction is costly and difficult to scale. Therefore, we propose \textbf{CHisAgent}, a multi-agent LLM framework for historical taxonomy construction in ancient Chinese contexts. CHisAgent decomposes taxonomy construction into three role-specialized stages: a bottom-up \textit{Inducer} that derives an initial hierarchy from raw historical corpora, a top-down \textit{Expander} that introduces missing intermediate concepts using LLM world knowledge, and an evidence-guided \textit{Enricher} that integrates external structured historical resources to ensure faithfulness. Using the \textit{Twenty-Four Histories}, we construct a large-scale, domain-aware event taxonomy covering politics, military, diplomacy, and social life in ancient China. Extensive reference-free and reference-based evaluations demonstrate improved structural coherence and coverage, while further analysis shows that the resulting taxonomy supports cross-cultural alignment.
- Abstract(参考訳): 多くのタスクにおいて強いパフォーマンスを示したにもかかわらず、大きな言語モデル(LLM)は歴史的・文化的推論、特に中国史のような非英語の文脈において限られた能力を示している。
分類学的構造は、歴史的知識を整理し、理解を改善する効果的なメカニズムを提供する。
しかし、手動の分類学の構築は費用がかかり、スケールが難しい。
そこで, 古代中国における歴史的分類学構築のための多エージェント LLM フレームワークである \textbf{CHisAgent} を提案する。
CHisAgentは分類構築を3つの役割特殊化段階に分解する: 生の歴史的コーパスから初期階層を導出するボトムアップ \textit{Inducer} 、LLMの世界知識を用いた中間概念の欠如を紹介するトップダウン \textit{Expander} 、そして、外部構造された歴史的リソースを統合する証拠誘導 \textit{Enricher} である。
我々は,古代中国における政治・軍事・外交・社会生活を包括する大規模・ドメイン対応のイベント分類学を,<textit{Twenty-Four Histories>を用いて構築する。
広範囲な基準フリーおよび基準ベース評価は、構造的コヒーレンスと包括性の向上を示し、さらに分析により、結果として生じる分類は、異文化間の整合性を支持することが示されている。
関連論文リスト
- Context-Aware Hierarchical Taxonomy Generation for Scientific Papers via LLM-Guided Multi-Aspect Clustering [59.54662810933882]
既存の分類体系の構築手法は、教師なしクラスタリングや大きな言語モデルの直接的プロンプトを利用しており、コヒーレンスと粒度の欠如が多かった。
LLM誘導型マルチアスペクト符号化と動的クラスタリングを統合したコンテキスト対応階層型階層型分類生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-23T15:12:58Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - LLM Agents for Interactive Exploration of Historical Cadastre Data: Framework and Application to Venice [2.03659124799413]
カダストラルデータは、都市の歴史的組織に関する重要な情報を明らかにするが、多種多様なフォーマットや人間のアノテーションのために、しばしば標準化されていない。
我々は1740年から1808年までの臨界期におけるヴェネツィアの都市史を調査する。
この時代の複雑なカダストラルデータは、その体積と均一な構造が欠如していることが特徴であり、我々のアプローチが順応的にナビゲートする固有の課題を示している。
論文 参考訳(メタデータ) (2025-05-22T08:45:15Z) - Shared Heritage, Distinct Writing: Rethinking Resource Selection for East Asian Historical Documents [60.348103523743276]
古典中国語から漢語・漢文への言語間移動可能性の仮定を疑問視する。
実験の結果,漢文で書かれた古代朝鮮語文書の言語モデル性能に対する古典中国語データセットの影響は最小限であった。
論文 参考訳(メタデータ) (2024-11-07T15:59:54Z) - Taxonomy Tree Generation from Citation Graph [15.188580557890942]
HiGTLは、人為的な指示や好みのトピックによってガイドされる、新しいエンドツーエンドフレームワークである。
我々は,各クラスタに中心的な概念を反復的に生成する,新しい分類ノード言語化戦略を開発した。
実験により、HiGTLはコヒーレントで高品質な概念を効果的に生成することが示された。
論文 参考訳(メタデータ) (2024-10-02T13:02:03Z) - Michelangelo: Long Context Evaluations Beyond Haystacks via Latent Structure Queries [54.325172923155414]
ミケランジェロ(Michelangelo)は、大規模言語モデルに対する最小限の、合成的で、未学習の長文推論評価である。
この評価は、任意に長いコンテキストに対する評価のための、新しく統一された枠組みによって導出される。
論文 参考訳(メタデータ) (2024-09-19T10:38:01Z) - CHisIEC: An Information Extraction Corpus for Ancient Chinese History [12.41912979618724]
我々は,中国歴史情報抽出コーパス(CHis IEC)データセットを提示する。
CHis IECは、NERおよびREタスクの開発と評価のために設計された、精巧にキュレートされたデータセットである。
データセットは4つの異なるエンティティタイプと12のリレーショナルタイプを含み、慎重にラベル付けされたデータセットとなる。
論文 参考訳(メタデータ) (2024-03-22T10:12:10Z) - The Uncertainty-based Retrieval Framework for Ancient Chinese CWS and
POS [3.9227136203353865]
本稿では,古漢語と音声タグの枠組みを提案する。
一方,文節意味論を捉えようとする一方で,ベースラインモデルの不確実なサンプルを再予測する。
我々のアーキテクチャの性能は、CRFやJiayanのような既存のツールで事前訓練されたBERTよりも優れています。
論文 参考訳(メタデータ) (2023-10-12T16:55:44Z) - Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model Attribution [48.86322922826514]
本稿では,知識認識型言語モデル属性(KaLMA)の新たな課題について述べる。
まず、属性のソースを構造化されていないテキストから知識グラフ(KG)に拡張し、そのリッチな構造は属性のパフォーマンスと作業シナリオの両方に役立ちます。
第2に,不完全な知識リポジトリを考慮した「意識的非能力」の設定を提案する。
第3に,テキスト品質,引用品質,引用アライメントを含む総合的な自動評価指標を提案する。
論文 参考訳(メタデータ) (2023-10-09T11:45:59Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。