論文の概要: Who Wrote This Line? Evaluating the Detection of LLM-Generated Classical Chinese Poetry
- arxiv url: http://arxiv.org/abs/2604.10101v2
- Date: Thu, 16 Apr 2026 07:39:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 16:09:14.141957
- Title: Who Wrote This Line? Evaluating the Detection of LLM-Generated Classical Chinese Poetry
- Title(参考訳): 誰がこの線を盗んだのか : LLMによる古典漢詩の検出評価
- Authors: Jiang Li, Tian Lan, Shanshan Wang, Dongxing Zhang, Dianqing Lin, Guanglai Gao, Derek F. Wong, Xiangdong Su,
- Abstract要約: AIによる創作物は、文学界における創造的真正性と倫理に関する顕著な問題を提起している。
従来、AI生成テキストの検出には大きな進歩があったが、漢詩にはまだ対応していない。
LLM生成された漢詩を検出するためのベンチマークであるChangAnを紹介する。
- 参考スコア(独自算出の注目度): 45.27531384029669
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid development of large language models (LLMs) has extended text generation tasks into the literary domain. However, AI-generated literary creations has raised increasingly prominent issues of creative authenticity and ethics in literary world, making the detection of LLM-generated literary texts essential and urgent. While previous works have made significant progress in detecting AI-generated text, it has yet to address classical Chinese poetry. Due to the unique linguistic features of classical Chinese poetry, such as strict metrical regularity, a shared system of poetic imagery, and flexible syntax, distinguishing whether a poem is authored by AI presents a substantial challenge. To address these issues, we introduce ChangAn, a benchmark for detecting LLM-generated classical Chinese poetry that containing total 30,664 poems, 10,276 are human-written poems and 20,388 poems are generated by four popular LLMs. Based on ChangAn, we conducted a systematic evaluation of 12 AI detectors, investigating their performance variations across different text granularities and generation strategies. Our findings highlight the limitations of current Chinese text detectors, which fail to serve as reliable tools for detecting LLM-generated classical Chinese poetry. These results validate the effectiveness and necessity of our proposed ChangAn benchmark. Our dataset and code are available at https://github.com/VelikayaScarlet/ChangAn.
- Abstract(参考訳): 大規模言語モデル(LLM)の急速な発展により、文芸分野へのテキスト生成タスクが拡張された。
しかし、AI生成文芸創作は、文学界における創造的真正性や倫理に関する顕著な問題を提起し、LLM生成文芸文章の検出が不可欠かつ緊急に行われるようになった。
これまでの研究は、AI生成テキストの検出に大きな進歩を遂げてきたが、中国の古典詩にはまだ対応していない。
厳密なメートル法規則性、詩画像の共有システム、柔軟な構文など、古典漢詩の独特の言語的特徴により、ある詩がAIによって作成されているかどうかを区別することが大きな課題となっている。
これらの問題に対処するため,約30,664首,約10,276首,約20,388首の漢詩を4つのLLMで検出するベンチマークであるChangAnを紹介した。
ChangAnに基づいて,12個のAI検出器の系統的評価を行い,テキストの粒度や生成戦略の相違について検討した。
本研究は,LLM生成漢詩を検出するための信頼性の高いツールとして機能しない漢文検出装置の限界を浮き彫りにした。
これらの結果は,提案した ChangAn ベンチマークの有効性と必要性を検証した。
私たちのデータセットとコードはhttps://github.com/VelikayaScarlet/ChangAn.comで公開されています。
関連論文リスト
- Benchmarking the Detection of LLMs-Generated Modern Chinese Poetry [37.86155340473244]
詩が人間に由来するかAIに由来するかを特定することは困難である。
本稿では,AIによる現代漢詩の検出のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-09-01T17:01:45Z) - Picturized and Recited with Dialects: A Multimodal Chinese Representation Framework for Sentiment Analysis of Classical Chinese Poetry [7.374104697960381]
古典中国語詩の感情分析のための方言強化型マルチモーダルフレームワークを提案する。
詩から文レベルの音声特徴を抽出し、複数の方言から音声を取り入れる。
我々のフレームワークは2つの公開データセット上で最先端の手法より優れています。
論文 参考訳(メタデータ) (2025-05-19T14:58:44Z) - Understanding Literary Texts by LLMs: A Case Study of Ancient Chinese Poetry [9.970908656435066]
詩、ジョーク、短編小説などのジャンルにおいて、多くのAIツールが登場し、新たな視点を提供する。
文学作品を評価することは、しばしば複雑で、完全に定量化することは困難であり、AI創造のさらなる発展を妨げている。
本稿では,大規模言語モデルの観点から,文学テキストのミステリーを探究する。
論文 参考訳(メタデータ) (2024-08-22T04:25:06Z) - Large Language Models for Classical Chinese Poetry Translation: Benchmarking, Evaluating, and Improving [43.148203559785095]
印象的な多言語機能を持つ大規模言語モデル(LLM)は、この極端な翻訳要求を達成するための希望の光となるかもしれない。
本稿ではまず,各漢詩にエレガントな翻訳が認められた適切なベンチマーク(PoetMT)を紹介する。
本稿では,GPT-4に基づく新しい測定基準を提案し,現在のLCMがこれらの要求を満たす範囲を評価する。
論文 参考訳(メタデータ) (2024-08-19T12:34:31Z) - MAGE: Machine-generated Text Detection in the Wild [82.70561073277801]
大規模言語モデル(LLM)は人間レベルのテキスト生成を実現し、効果的なAI生成テキスト検出の必要性を強調している。
我々は、異なるLLMによって生成される多様な人文やテキストからテキストを収集することで、包括的なテストベッドを構築する。
問題にもかかわらず、トップパフォーマンス検出器は、新しいLCMによって生成された86.54%のドメイン外のテキストを識別することができ、アプリケーションシナリオの実現可能性を示している。
論文 参考訳(メタデータ) (2023-05-22T17:13:29Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - Generating Major Types of Chinese Classical Poetry in a Uniformed
Framework [88.57587722069239]
GPT-2に基づく漢詩の主要なタイプを生成するフレームワークを提案する。
予備的な結果は、この強化されたモデルが、形も内容も質の高い大型漢詩を生成できることを示している。
論文 参考訳(メタデータ) (2020-03-13T14:16:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。