論文の概要: ICH-Qwen: A Large Language Model Towards Chinese Intangible Cultural Heritage
- arxiv url: http://arxiv.org/abs/2505.23831v1
- Date: Wed, 28 May 2025 09:02:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.547467
- Title: ICH-Qwen: A Large Language Model Towards Chinese Intangible Cultural Heritage
- Title(参考訳): ICH-Qwen:中国無形文化遺産に向けた大規模言語モデル
- Authors: Wenhao Ye, Tiansheng Zheng, Yue Qi, Wenhua Zhao, Xiyu Wang, Xue Zhao, Jiacheng He, Yaya Zheng, Dongbo Wang,
- Abstract要約: この研究は、オープンソースの中国語ICHデータのコーパスを用いて、ICHドメインのための大きな言語モデルであるICH-Qwenを開発する。
このモデルは、大きな言語モデルの自然言語理解と知識推論機能を使用し、合成データと微調整技術で強化される。
このモデルは、無形文化財の保護、継承、普及のためのインテリジェントなソリューションを提供するものと期待されている。
- 参考スコア(独自算出の注目度): 8.58469813632992
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The intangible cultural heritage (ICH) of China, a cultural asset transmitted across generations by various ethnic groups, serves as a significant testament to the evolution of human civilization and holds irreplaceable value for the preservation of historical lineage and the enhancement of cultural self-confidence. However, the rapid pace of modernization poses formidable challenges to ICH, including threats damage, disappearance and discontinuity of inheritance. China has the highest number of items on the UNESCO Intangible Cultural Heritage List, which is indicative of the nation's abundant cultural resources and emphasises the pressing need for ICH preservation. In recent years, the rapid advancements in large language modelling have provided a novel technological approach for the preservation and dissemination of ICH. This study utilises a substantial corpus of open-source Chinese ICH data to develop a large language model, ICH-Qwen, for the ICH domain. The model employs natural language understanding and knowledge reasoning capabilities of large language models, augmented with synthetic data and fine-tuning techniques. The experimental results demonstrate the efficacy of ICH-Qwen in executing tasks specific to the ICH domain. It is anticipated that the model will provide intelligent solutions for the protection, inheritance and dissemination of intangible cultural heritage, as well as new theoretical and practical references for the sustainable development of intangible cultural heritage. Furthermore, it is expected that the study will open up new paths for digital humanities research.
- Abstract(参考訳): 中国の無形文化財(ICH)は、様々な民族集団が代々受け継いだ文化財であり、人類文明の進化を裏付ける重要な証しであり、歴史遺産の保存や文化自尊心の強化に不定の価値がある。
しかし、急速な近代化のペースは、脅威の被害、消失、継承の不連続など、ICHに重大な課題をもたらす。
中国はユネスコ無形文化財リストに最も多く登録されており、これは国の豊富な文化資源の表れであり、ICH保存の必要性を強く強調している。
近年、大規模言語モデリングの急速な進歩は、ICHの保存と普及に新しい技術アプローチをもたらした。
本研究は,大規模な言語モデルであるICH-Qwenを開発するために,オープンソースの中国語ICHデータのコーパスを利用する。
このモデルは、大きな言語モデルの自然言語理解と知識推論機能を使用し、合成データと微調整技術で強化される。
実験結果は、ICHドメイン固有のタスクの実行におけるICH-Qwenの有効性を示した。
このモデルは、無形文化財の保護・継承・普及のためのインテリジェントなソリューションと、無形文化財の持続可能な発展のための新たな理論的・実践的な参照を提供するものと期待されている。
さらに、デジタル人文科学研究の新しい道を開くことが期待されている。
関連論文リスト
- Opportunities and Challenges of Large Language Models for Low-Resource Languages in Humanities Research [23.773194690783512]
低リソース言語は、文化進化と知的多様性を具現化した、人類の歴史の貴重なリポジトリとして機能する。
その重要性にもかかわらず、これらの言語はデータ不足や技術的な制限など、重要な課題に直面している。
大規模言語モデル(LLM)の最近の進歩は、これらの課題に対処するための変革的な機会を提供する。
論文 参考訳(メタデータ) (2024-11-30T00:10:56Z) - LIMBA: An Open-Source Framework for the Preservation and Valorization of Low-Resource Languages using Generative Models [62.47865866398233]
この白書は低リソース言語のための言語ツールを生成するためのフレームワークを提案する。
このような言語に対するインテリジェントな応用を妨げるデータ不足に対処することにより、言語多様性の促進に寄与する。
論文 参考訳(メタデータ) (2024-11-20T16:59:41Z) - Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文 参考訳(メタデータ) (2024-06-17T14:03:27Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Cultural Compass: Predicting Transfer Learning Success in Offensive Language Detection with Cultural Features [19.72091739119933]
本研究は,文化的特徴の交わりと伝達学習の有効性について考察する。
これらの結果に基づいて,文化情報のデータセットへの統合を提唱する。
我々の研究は、より包括的で文化的に敏感な言語技術の探求において、一歩前進していることを示している。
論文 参考訳(メタデータ) (2023-10-10T09:29:38Z) - Learning Robust Real-Time Cultural Transmission without Human Data [82.05222093231566]
人工知能エージェントにおけるゼロショット、高リコール文化伝達を生成する方法を提案する。
我々のエージェントは、事前に収集された人間のデータを使わずに、新しい文脈で人間からリアルタイムの文化的伝達に成功した。
これは、人工知能を開発するアルゴリズムとしての文化進化の道を開くものである。
論文 参考訳(メタデータ) (2022-03-01T19:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。