論文の概要: BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
- arxiv url: http://arxiv.org/abs/2412.20024v1
- Date: Sat, 28 Dec 2024 05:01:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:07:34.148112
- Title: BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
- Title(参考訳): BaiJia:中国の歴史的チャーターの大規模なロールプレイングエージェントコーパス
- Authors: Ting Bai, Jiazheng Kang, Jiayang Fan,
- Abstract要約: 各種の歴史的文字からなる大規模ロールプレイングエージェント「BaiJia」を包括的に紹介する。
BaiJiaは、大規模な言語モデル(LLM)でAI駆動の歴史的ロールプレイングエージェントに関わることのできる、低リソースデータのパイオニアとして注目に値する。
- 参考スコア(独自算出の注目度): 1.6890942257487032
- License:
- Abstract: We introduce a comprehensive large-scale role-playing agent corpus, termed BaiJia, that comprises various Chinese historical characters. This corpus is noteworthy for being the pioneering compilation of low-resource data that can be utilized in large language models (LLMs) to engage in AI-driven historical role-playing agents. BaiJia addresses the challenges in terms of fragmented historical textual records in different forms and modalities, integrating various characters' information, including their biographical, literary, family relations, historical events, and so on. We conduct extensive experiments to demonstrate the effectiveness of our BaiJia agent corpus in bolstering the role-playing abilities of various foundational LLMs, and promoting the development and assessment of LLMs in the context of historical role-playing tasks. The agent corpus is available at baijia.online.
- Abstract(参考訳): 各種の歴史的文字からなる大規模ロールプレイングエージェント「BaiJia」を包括的に紹介する。
このコーパスは、大規模な言語モデル(LLM)でAI駆動の歴史的ロールプレイングエージェントに携わることのできる、低リソースデータの先駆的なコンパイルである。
バイジアは、伝記、文学、家族関係、歴史的な出来事など、様々な形態やモダリティの断片化された史料記録の課題に対処している。
本研究では, バイジアエージェントコーパスの様々な基礎的LLMのロールプレイング能力向上効果を実証し, 歴史的役割プレイングタスクの文脈におけるLLMの開発と評価を促進するために, 広範囲にわたる実験を行った。
エージェントコーパスはbaijia.onlineで入手できる。
関連論文リスト
- OpenCharacter: Training Customizable Role-Playing LLMs with Large-Scale Synthetic Personas [65.83634577897564]
本研究では,文字一般化機能を備えた大規模言語モデルを実現するための大規模データ合成手法について検討する。
まず、ペルソナハブのペルソナを用いて、大規模な文字プロファイルを合成することから始める。
次に、応答書き換えと応答生成という2つの戦略を検討し、文字対応の命令応答を生成する。
論文 参考訳(メタデータ) (2025-01-26T07:07:01Z) - Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.26364649572237]
Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文 参考訳(メタデータ) (2024-06-05T07:34:39Z) - BattleAgent: Multi-modal Dynamic Emulation on Historical Battles to Complement Historical Analysis [62.60458710368311]
本稿では,大規模視覚言語モデルとマルチエージェントシステムを組み合わせたエミュレーションシステムであるBattleAgentを提案する。
複数のエージェント間の複雑な動的相互作用をシミュレートし、エージェントとその環境をシミュレートすることを目的としている。
指導者の意思決定プロセスと、兵士のような一般参加者の視点の両方をエミュレートする。
論文 参考訳(メタデータ) (2024-04-23T21:37:22Z) - CHisIEC: An Information Extraction Corpus for Ancient Chinese History [12.41912979618724]
我々は,中国歴史情報抽出コーパス(CHis IEC)データセットを提示する。
CHis IECは、NERおよびREタスクの開発と評価のために設計された、精巧にキュレートされたデータセットである。
データセットは4つの異なるエンティティタイプと12のリレーショナルタイプを含み、慎重にラベル付けされたデータセットとなる。
論文 参考訳(メタデータ) (2024-03-22T10:12:10Z) - Large Language Models are Superpositions of All Characters: Attaining
Arbitrary Role-play via Self-Alignment [62.898963074989766]
本稿では,ロールプレイのための自己アライメント手法であるDittoを紹介する。
この方法は4000文字からなるロールプレイトレーニングセットを生成し、現在利用可能なデータセットのスケールを10倍に超える。
本稿では,ロールプレイ領域におけるクロススーパービジョンアライメント実験について紹介する。
論文 参考訳(メタデータ) (2024-01-23T03:56:22Z) - RoleEval: A Bilingual Role Evaluation Benchmark for Large Language
Models [44.105939096171454]
本稿では,役割知識の記憶,利用,推論能力を評価するためのベンチマークであるRoleEvalを紹介する。
RoleEvalはRoleEval-GlobalとRoleEval-Chinaで構成される。
論文 参考訳(メタデータ) (2023-12-26T17:40:55Z) - GujiBERT and GujiGPT: Construction of Intelligent Information Processing
Foundation Language Models for Ancient Texts [11.289265479095956]
GujiBERTとGujiGPT言語モデルは、古代のテキストの知的情報処理に特化した基礎モデルである。
これらのモデルは、単純化された漢字と伝統的な漢字の両方を含む広範なデータセットで訓練されている。
これらのモデルは、公開データセットを使用して、さまざまなバリデーションタスクで例外的なパフォーマンスを示しています。
論文 参考訳(メタデータ) (2023-07-11T15:44:01Z) - Transfer Learning across Several Centuries: Machine and Historian
Integrated Method to Decipher Royal Secretary's Diary [1.105375732595832]
歴史的テキストにおけるNERは、注釈付きコーパスの不足、多言語多様さ、様々なノイズ、現代の言語モデルとは全く異なる慣習といった課題に直面している。
本稿では,何世紀にもわたって記録された韓国の歴史的コーパス(SeungJeongWonと名づけられた王立書記官日記)を紹介する。
論文 参考訳(メタデータ) (2023-06-26T11:00:35Z) - Large Language Models Meet Harry Potter: A Bilingual Dataset for
Aligning Dialogue Agents with Characters [70.84938803753062]
本稿では,対話エージェントと文字アライメントの研究を進めるために設計されたHarry Potter Dialogueデータセットを紹介する。
このデータセットはハリー・ポッターシリーズのすべての対話セッション(英語と中国語の両方)を含んでいる。
対話シーン、話者、人物関係、属性など、重要な背景情報とともに注釈付けされている。
論文 参考訳(メタデータ) (2022-11-13T10:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。