論文の概要: A Reproducible Multi-Architecture Baseline for Token-Level Chinese Metaphor Identification under the MIPVU Framework
- arxiv url: http://arxiv.org/abs/2605.07170v1
- Date: Fri, 08 May 2026 03:07:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.765327
- Title: A Reproducible Multi-Architecture Baseline for Token-Level Chinese Metaphor Identification under the MIPVU Framework
- Title(参考訳): MIPVUフレームワークによるトークンレベル中国語メタファー識別のための再現可能な多構造ベースライン
- Authors: Yufeng Wu,
- Abstract要約: 本稿では, PSU Chinese Metaphor Corpus (PSU CMC) におけるトークンレベルのメタファ識別のための再現可能な多階層ベースラインを提案する。
エンコーダを中国語のRoBERTa-wwm-ext-largeと微調整し、(ii)MelBERTを現代中国語辞典第7版(MCD7)から新たに構築した基本的意味資源を用いて中国語に適合させる。
5種の固定種子のうち、MelBERT MIP-は0.7281+/-0.0050テスト陽性F1において、メルバートフル(0.7270+/-0.0069)よりわずかに高く、RoBERTa(0.7)よりも明らかに高いパフォーマンスを達成している。
- 参考スコア(独自算出の注目度): 2.545461559283292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Metaphor is pervasive in everyday language, yet token-level computational identification of metaphor-related words in Chinese under the MIPVU framework remains under-explored relative to English. This paper presents a reproducible multi-architecture baseline for token-level metaphor identification on the PSU Chinese Metaphor Corpus (PSU CMC), the only widely available MIPVU-annotated Chinese corpus. We systematically compare three model families: (i) encoder fine-tuning with Chinese RoBERTa-wwm-ext-large; (ii) MelBERT adapted to Chinese using a newly constructed basic-meaning resource derived from the Modern Chinese Dictionary, 7th edition (MCD7), comprising 74,823 entries with 71.51% PSU CMC vocabulary coverage; and (iii) Qwen3.5-9B fine-tuned with QLoRA as an instruction-tuned generative baseline. Across five fixed seeds, MelBERT MIP-only achieves the strongest performance at 0.7281 +/- 0.0050 test positive F1, marginally above MelBERT Full (0.7270 +/- 0.0069) and clearly above plain RoBERTa (0.7142 +/- 0.0121). The Qwen QLoRA generative configuration trails encoder baselines by approximately 11 F1 points (0.6157 +/- 0.0113). Three findings merit attention: (1) the SPV channel of MelBERT does not contribute reliable positive signal in Chinese, consistent with the dominance of conventional metaphor; (2) the Qwen-encoder gap is concentrated in recall, reflecting the discrete-commitment limitation of generative output; (3) several Qwen task formulations fail due to format design rather than model capacity. We release all split manifests, per-seed outputs, the MCD7 basic-meaning embedding pipeline, and training scripts to serve as a common reference for future Chinese metaphor identification research.
- Abstract(参考訳): メタファーは日常言語で広く使われているが、MIPVUフレームワークの下で中国語の比喩関連語のトークンレベルでの同定は、英語と比較して未探索のままである。
本稿では, PSU Chinese Metaphor Corpus (PSU CMC) におけるトークンレベルのメタファ識別のための再現可能な多階層ベースラインを提案する。
3つのモデルファミリーを体系的に比較する。
(i)中国語RoBERTa-wwm-ext-largeによるエンコーダの微調整
2 メルベルトは、近代中国語辞典第7版(MCD7)から作成され、74,823項目及び71.51%のPSU CMC語彙を含む、中国語に適合する。
(iii)Qwen3.5-9BはQLoRAを命令調整された生成ベースラインとして微調整する。
5つの固定種のうち、MelBERT MIP-は0.7281 +/- 0.0050テスト陽性F1において最も高い性能を達成し、MelBERT Full (0.7270 +/- 0.0069) よりわずかに高く、RoBERTa (0.7142 +/- 0.0121) よりも明らかに高い。
Qwen QLoRA 生成構成は、エンコーダベースラインを約11 F1 点 (0.6157 +/- 0.0113) にする。
3つの知見は,(1)MelBERTのSPVチャネルは,従来の比喩の優位性と整合して,中国語の信頼性の高い正のシグナルに寄与しない,(2)Qwen-encoderギャップは,生成出力の離散的制限を反映してリコールに集中している,(3)Qwenタスクの定式化は,モデルキャパシティではなくフォーマット設計によって失敗する,といった点に注目する。
今後の中国メタファー識別研究の共通資料として,すべての分割マニフェスト,シードごとのアウトプット,MCD7基本目的の埋め込みパイプライン,およびトレーニングスクリプトをリリースする。
関連論文リスト
- Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study [1.482489178857542]
4つの比喩識別プロトコルを運用するLLM支援パイプラインを提案する。
各プロトコルは、制御されたLLM呼び出しにインターリーブされた決定論的ステップのモジュラーチェーンである。
トークン、文、およびスパンレベルのアノテーションにまたがる7つの中国語メタファーデータセットを評価する。
論文 参考訳(メタデータ) (2026-03-11T13:55:34Z) - PolyFrame at MWE-2026 AdMIRe 2: When Words Are Not Enough: Multimodal Idiom Disambiguation [0.533024001730262]
PolyFrameは、画像+テキストランキング(Subtask A)とテキストのみのキャプションランキング(Subtask B)の両方のための統合パイプラインである。
全てのモデルでは、凍ったCLIPスタイルの視覚言語エンコーダと、軽量モジュールのみを訓練する多言語BGE M3エンコーダが保持されている。
マルチリンガルブラインドテストでは,Subtask Aは0.35/0.73,Subtask Bは0.32/0.71であった。
論文 参考訳(メタデータ) (2026-02-20T23:07:55Z) - Qwen3-ASR Technical Report [71.87071808763484]
2つの強力なオールインワン音声認識モデルと、新しい非自己回帰音声強制アライメントモデルを含むQwen3-ASRファミリを紹介する。
Qwen3-ASR-1.7BとQwen3-ASR-0.6Bは、言語識別と52の言語および方言のASRをサポートするASRモデルである。
論文 参考訳(メタデータ) (2026-01-29T06:58:13Z) - Comparative Study of Large Language Models on Chinese Film Script Continuation: An Empirical Analysis Based on GPT-5.2 and Qwen-Max [6.2773052078641385]
本研究は,53本の古典映画からなる中国初の映画脚本継続ベンチマークを構築した。
評価にはROUGE-L, 構造類似性, LLM-as-Judgeスコアが組み込まれている。
GPT-5.2は文字の一貫性、トーンスタイルのマッチング、フォーマットの保存に優れており、Qwen-Maxは生成安定性の欠如を示している。
論文 参考訳(メタデータ) (2026-01-21T09:55:26Z) - Chinese ModernBERT with Whole-Word Masking [15.633276132474316]
ハードウェア対応の32k BPE語彙である Chinese ModernBERT を紹介した。
我々は、CCI3-HQ、CCI4(中国語)、Cosmopedia- Chineseから1.2Tの中国トークンを事前訓練する。
CLUEでは、中国のModernBERTは、統一された微調整プロトコルの下で強力な中国のエンコーダと競合している。
論文 参考訳(メタデータ) (2025-10-14T08:41:22Z) - MobileLLM-R1: Exploring the Limits of Sub-Billion Language Model Reasoners with Open Training Recipes [60.57770396565211]
強い推論能力は、はるかに少ないデータで実現可能であることを示す。
MobileLLM-R50MのAIMEスコアは15.5であり、OLMo-2-1.48Bは0.6、SmolLM-2-1.7Bは0.3である。
論文 参考訳(メタデータ) (2025-09-29T15:43:59Z) - XplaiNLP at CheckThat! 2025: Multilingual Subjectivity Detection with Finetuned Transformers and Prompt-Based Inference with Large Language Models [2.749729059235755]
このノートには、XplaiがCheckThat!に提出されたことを報告しています。
単言語および機械翻訳によるトレーニングデータに基づいて,変換器エンコーダの教師付き微調整,EuroBERT,XLM-RoBERTa,ジャーマン-BERTの2つの手法を評価する。
ドイツ語の場合、タイポロジーに関連のある言語から翻訳されたトレーニングデータに基づいて微調整されたドイツ語-BERTモデルでは、ベースライン上での競争性能が向上する。
論文 参考訳(メタデータ) (2025-09-15T16:53:41Z) - HeQ: a Large and Diverse Hebrew Reading Comprehension Benchmark [54.73504952691398]
我々は,抽出質問としてヘブライ語機械読解データセットの提供に着手した。
ヘブライ語の形態学的に豊かな性質はこの努力に挑戦している。
我々は,新しいガイドラインのセット,制御されたクラウドソーシングプロトコル,評価基準の改訂を考案した。
論文 参考訳(メタデータ) (2025-08-03T15:53:01Z) - MonkeyOCR: Document Parsing with a Structure-Recognition-Relation Triplet Paradigm [60.14048367611333]
MonkeyOCRはドキュメント解析のためのビジョン言語モデルである。
SRR(Structure-Recognition-Relation)三重項パラダイムを活用することで、最先端の技術の進歩を図っている。
論文 参考訳(メタデータ) (2025-06-05T16:34:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。