論文の概要: Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study
- arxiv url: http://arxiv.org/abs/2603.10784v1
- Date: Wed, 11 Mar 2026 13:55:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.979594
- Title: Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study
- Title(参考訳): LLMを用いたMIPVUルールスクリプト生成による中国語メタファー識別:比較プロトコルによる検討
- Authors: Weihang Huang, Mengna Liu,
- Abstract要約: 4つの比喩識別プロトコルを運用するLLM支援パイプラインを提案する。
各プロトコルは、制御されたLLM呼び出しにインターリーブされた決定論的ステップのモジュラーチェーンである。
トークン、文、およびスパンレベルのアノテーションにまたがる7つの中国語メタファーデータセットを評価する。
- 参考スコア(独自算出の注目度): 1.482489178857542
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Metaphor identification is a foundational task in figurative language processing, yet most computational approaches operate as opaque classifiers offering no insight into why an expression is judged metaphorical. This interpretability gap is especially acute for Chinese, where rich figurative traditions, absent morphological cues, and limited annotated resources compound the challenge. We present an LLM-assisted pipeline that operationalises four metaphor identification protocols--MIP/MIPVU lexical analysis, CMDAG conceptual-mapping annotation, emotion-based detection, and simile-oriented identification--as executable, human-auditable rule scripts. Each protocol is a modular chain of deterministic steps interleaved with controlled LLM calls, producing structured rationales alongside every classification decision. We evaluate on seven Chinese metaphor datasets spanning token-, sentence-, and span-level annotation, establishing the first cross-protocol comparison for Chinese metaphor identification. Within-protocol evaluation shows Protocol A (MIP) achieves an F1 of 0.472 on token-level identification, while cross-protocol analysis reveals striking divergence: pairwise Cohen's kappa between Protocols A and D is merely 0.001, whereas Protocols B and C exhibit near-perfect agreement (kappa = 0.986). An interpretability audit shows all protocols achieve 100% deterministic reproducibility, with rationale correctness from 0.40 to 0.87 and editability from 0.80 to 1.00. Error analysis identifies conceptual-domain mismatch and register sensitivity as dominant failure modes. Our results demonstrate that protocol choice is the single largest source of variation in metaphor identification, exceeding model-level variation, and that rule-script architectures achieve competitive performance while maintaining full transparency.
- Abstract(参考訳): メタファー識別は比喩的言語処理の基本的なタスクであるが、ほとんどの計算手法は不透明な分類器として機能し、なぜ表現が比喩的に判断されるのかについての洞察を与えない。
この解釈可能性のギャップは、中国では特に深刻であり、豊かな比喩的伝統、形態的手がかりの欠如、限られたアノテート資源が課題を複雑にしている。
本稿では,MIP/MIPVU語彙解析,CMDAG概念マッピングアノテーション,感情に基づく検出,シミュラ指向の識別を実行可能な人間監査可能なルールスクリプトとして,4つのメタファ識別プロトコルを運用するLLM支援パイプラインを提案する。
それぞれのプロトコルは、制御されたLLM呼び出しにインターリーブされた決定論的ステップのモジュラー連鎖であり、すべての分類決定と共に構造的論理を生成する。
トークン,文,およびスパンレベルのアノテーションにまたがる7つの中国語メタファーデータセットを評価し,中国のメタファー識別に対する最初のクロスプロトコール比較を確立した。
プロトコルA(MIP)はトークン単位の識別において0.472のF1を達成する一方、クロスプロトコール分析では顕著なばらつきが明らかである: プロトコルAとDの間のCohenのカッパは0.001に過ぎず、ProtocolBとCはほぼ完全に一致している(kappa = 0.986)。
解釈可能性監査は、すべてのプロトコルが100%決定論的再現性、合理性は0.40から0.87、編集性は0.80から1.00であることを示す。
エラー解析は、概念ドメインミスマッチとレジスタ感度を支配的な障害モードとして識別する。
この結果から,プロトコル選択はメタファー識別における唯一の最大の変化源であり,モデルレベルの変動を超越したものであり,ルール記述アーキテクチャは完全な透明性を維持しながら競合性能を実現することが示唆された。
関連論文リスト
- MCP-Diag: A Deterministic, Protocol-Driven Architecture for AI-Native Network Diagnostics [0.08921166277011344]
本稿では,モデルコンテキストプロトコル(MCP)上に構築されたハイブリッド型ニューロシンボリックアーキテクチャであるMCP-Diagを紹介する。
本稿では,AI導入前の標準ユーティリティ(dig,ping,tratraroute)から厳密なスキーマに変換する決定論的翻訳層を提案する。
また,プロトコルレベルでのHuman-in-the-Loop(HITL)認証を強制する「Elicitation Loop」も導入する。
論文 参考訳(メタデータ) (2026-01-30T06:49:25Z) - Harmonic Token Projection (HTP): A Vocabulary-Free, Training-Free, Deterministic, and Reversible Embedding Methodology [0.0]
Harmonic Token Projection (HTP) は、訓練、語彙、パラメータなしでテキスト埋め込みを生成するための可逆的で決定論的フレームワークである。
HTPは英語でrho = 0.68のスピアマン相関を達成し、10言語で安定した性能を維持している。
これは有意義な意味関係が決定論的幾何学から出現し、データ駆動型埋め込みの透過的で効率的な代替手段を提供することを示している。
論文 参考訳(メタデータ) (2025-11-10T20:51:18Z) - MMSE-Calibrated Few-Shot Prompting for Alzheimer's Detection [4.176236534741941]
本研究では,Nested Interleaveと厳密なスキーマを用いたクラスバランスプロトコルによる数発のプロンプトについて検討する。
我々は、最先端のプロンプト結果を達成する2つの変種を評価する。
これは、MMSEに誘引された確率を固定し、多モード構造を用いて解釈性を改善するためのADReSS研究としては初めてのものである。
論文 参考訳(メタデータ) (2025-09-24T09:33:46Z) - SiLVERScore: Semantically-Aware Embeddings for Sign Language Generation Evaluation [29.960223851833785]
我々は手話生成のための意味論的埋め込みに基づく評価指標SiLVERScoreを提案する。
PHOENIX-14T と CSL-Daily のデータセットでは、SiLVERScore は正しいペアとランダムなペアのほぼ完全な識別を実現している。
論文 参考訳(メタデータ) (2025-09-04T00:58:43Z) - Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method [108.56493934296687]
本研究では,乱数から発散する概念に触発された偏差に基づくキャリブレーション手法を導入し,プリトレーニングデータ検出のためのトークン確率のキャリブレーションを行う。
我々は,中国語テキスト上でのLLMの検出手法の性能を評価するために,中国語のベンチマークであるPatentMIAを開発した。
論文 参考訳(メタデータ) (2024-09-23T07:55:35Z) - CPCL: Cross-Modal Prototypical Contrastive Learning for Weakly Supervised Text-based Person Retrieval [10.133031003977834]
弱教師付きテキストベースの人物検索は、テキスト記述を用いて対象者の画像を検索しようとする。
主な課題はクラス内の違いであり、モーダル内特徴のバリエーションとモーダル間のセマンティックギャップを含んでいる。
視覚とテキストのインスタンスを共有潜在空間にマッピングするクロスモーダル・プロトタイプ・コントラシティブ・ラーニング(CPCL)手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T14:27:01Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。