Fugu-MT 論文翻訳(概要): Logits-Constrained Framework with RoBERTa for Ancient Chinese NER

論文の概要: Logits-Constrained Framework with RoBERTa for Ancient Chinese NER

arxiv url: http://arxiv.org/abs/2505.02983v1
Date: Mon, 05 May 2025 19:23:16 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-07 18:50:11.112566
Title: Logits-Constrained Framework with RoBERTa for Ancient Chinese NER
Title（参考訳）: 古代中国NERのためのRoBERTaを用いたロバスト制約フレームワーク
Authors: Wenjie Hua, Shenghan Xu,
Abstract要約: 本稿では,古代中国の名前付きエンティティ認識(NER)のためのロジッツ制約フレームワークを提案する。我々の2段階モデルは、文脈符号化のためのGujiRoBERTaと、有効なBMESラベル遷移を強制するための識別可能な復号機構を統合している。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents a Logits-Constrained (LC) framework for Ancient Chinese Named Entity Recognition (NER), evaluated on the EvaHan 2025 benchmark. Our two-stage model integrates GujiRoBERTa for contextual encoding and a differentiable decoding mechanism to enforce valid BMES label transitions. Experiments demonstrate that LC improves performance over traditional CRF and BiLSTM-based approaches, especially in high-label or large-data settings. We also propose a model selection criterion balancing label complexity and dataset size, providing practical guidance for real-world Ancient Chinese NLP tasks.
Abstract（参考訳）: 本稿では,EvaHan 2025ベンチマークで評価した,古代中国の名前付きエンティティ認識(NER)のためのLC(Logits-Constrained)フレームワークを提案する。我々の2段階モデルは、文脈符号化のためのGujiRoBERTaと、有効なBMESラベル遷移を強制するための識別可能な復号機構を統合している。実験により、LCは従来のCRFやBiLSTMベースのアプローチ、特にハイラベルや大規模データ設定よりも性能が向上することが示された。また,ラベルの複雑さとデータセットサイズをバランスさせるモデル選択基準を提案する。

関連論文リスト

Reproducing and Comparing Distillation Techniques for Cross-Encoders [12.107932271370563]
我々は, ciptschlattRankDistiLLMClosingEffectiveness2025 LLMベースの蒸留戦略を再現し, citethofstatterImprovingEfficientNeural 2020アプローチと比較した。ドメイン内モデル(TREC-DL, MSMARCO dev)とドメイン外データセット(BEIR, LoTTE, Robust04)の両方ですべてのモデルを評価する。
論文参考訳（メタデータ） (2026-03-03T14:09:49Z)
Rethinking Label Consistency of In-Context Learning: An Implicit Transductive Label Propagation Perspective [34.36815585602357]
大規模言語モデル(LLM)は、最小限の教師付き例でコンテキスト内学習(ICL)を行う。現在のアプローチでは、通常、トップKで最も意味論的に類似した例をデモとして選択するために検索モデルを採用している。本研究では,意味情報とラベル情報の両方を活用するデータ合成手法を提案し,TopKサンプリングとSynthetic Data(TopK-SD)を用いて,一貫したラベルを用いたデモを取得する。
論文参考訳（メタデータ） (2025-12-13T04:41:31Z)
LLM Routing with Dueling Feedback [49.67815163970033]
ユーザの満足度,モデルの専門性,推論コストのバランスを保ちながら,クエリ毎に最適なモデルを選択するという課題について検討する。絶対的なスコアではなく、ペアの選好フィードバックから学習することで、ルーティングをコンテキストデュエルの帯域として定式化する。分類的重み付けを用いた対照的な微調整を用いて,オフラインデータからモデル埋め込みを導出する表現学習手法であるカテゴリーキャリブレーション・ファインタニング(CCFT)を導入する。
論文参考訳（メタデータ） (2025-10-01T12:52:25Z)
More Is Better: A MoE-Based Emotion Recognition Framework with Human Preference Alignment [24.56511209071154]
MER2025における半教師付き学習トラック(MER-SEMI)のソリューションを提案する。より優れた」という原則に基づく包括的枠組みを提案し,より堅牢なMixture of Experts (MoE)感情認識システムを構築する。我々のアプローチは、独立した専門家として多様な入力モダリティを統合する。
論文参考訳（メタデータ） (2025-08-08T05:44:26Z)
COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values [43.09443095372083]
高品質で大規模な中国の嗜好データセットであるCOIG-Pを紹介する。これは、Chat、Code、Math、Logic、Nove、Roleの6つの異なるドメインにまたがる1009万の中国の好みペアで構成されている。スコアリングにLLMを使用する場合のオーバーヘッドを軽減するため,COIG-Pを用いて8Bサイズの中国語リワードモデルを訓練した。
論文参考訳（メタデータ） (2025-04-07T22:15:51Z)
Large Language Models Meet Symbolic Provers for Logical Reasoning Evaluation [24.081573908824353]
一階述語論理(FOL)推論はインテリジェントシステムにおいて重要である。既存のベンチマークは、広範囲の人間のアノテーションや手作りテンプレートに依存していることが多い。本稿では,大言語モデルの生成強度を記号型プローサの厳密性と精度で相乗化するProverGenという新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-10T15:31:54Z)
When Box Meets Graph Neural Network in Tag-aware Recommendation [41.596515563108404]
論理演算の組み合わせによるメッセージ集約を実現するため,BoxGNNと呼ばれる新しいアルゴリズムを提案する。また,ボックスの表現を洗練させるために,Gumbelスムース化技術を用いたボリュームベースの学習目標も採用している。
論文参考訳（メタデータ） (2024-06-17T18:35:53Z)
Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。 LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文参考訳（メタデータ） (2024-05-12T15:49:38Z)
Bidirectional Trained Tree-Structured Decoder for Handwritten Mathematical Expression Recognition [51.66383337087724]
Handwriting Mathematical Expression Recognition (HMER) タスクは、OCRの分野における重要な分岐である。近年の研究では、双方向コンテキスト情報の導入により、HMERモデルの性能が大幅に向上することが示されている。本稿では,MF-SLT と双方向非同期トレーニング (BAT) 構造を提案する。
論文参考訳（メタデータ） (2023-12-31T09:24:21Z)
Make BERT-based Chinese Spelling Check Model Enhanced by Layerwise Attention and Gaussian Mixture Model [33.446533426654995]
我々は、BERTベースのCSCモデルを強化するために、異種知識注入フレームワークを設計する。複数層表現を生成するために,n-gram-based layerwise self-attention の新たな形式を提案する。実験の結果,提案手法は4つの強力なベースラインモデルに対して安定な性能向上をもたらすことがわかった。
論文参考訳（メタデータ） (2023-12-27T16:11:07Z)
How Many Validation Labels Do You Need? Exploring the Design Space of Label-Efficient Model Ranking [40.39898960460575]
本稿では,LEMR (Label-Efficient Model Ranking) を提案し,MoraBench Benchmarkを提案する。 LEMRは、未ラベルのバリデーションセットからインスタンスを戦略的にアノテートすることで、モデル選択におけるコストのかかるアノテーションの必要性を最小限にする新しいフレームワークである。
論文参考訳（メタデータ） (2023-12-04T04:20:38Z)
SSLCL: An Efficient Model-Agnostic Supervised Contrastive Learning Framework for Emotion Recognition in Conversations [20.856739541819056]
会話における感情認識(ERC)は、自然言語処理コミュニティの中で急速に進化している課題である。 We propose a efficient and model-agnostic SCL framework named Supervised Sample-Label Contrastive Learning with Soft-HGR Maximal correlation (SSLCL)。浅い多層パーセプトロンを通して、離散ラベルを密度の高い埋め込みに投影することで、ラベル表現を活用する新しい視点を導入する。
論文参考訳（メタデータ） (2023-10-25T14:41:14Z)
SemiReward: A General Reward Model for Semi-supervised Learning [58.47299780978101]
半教師付き学習(SSL)は、擬似ラベリングによる自己学習フレームワークの様々な改善により、大きな進歩をみせた。主な課題は、高品質な擬似ラベルを確認バイアスと区別する方法である。本稿では、報酬スコアを予測して高品質な擬似ラベルを評価・フィルタリングするセミ教師付きリワードフレームワーク(SemiReward)を提案する。
論文参考訳（メタデータ） (2023-10-04T17:56:41Z)
Dual-Alignment Pre-training for Cross-lingual Sentence Embedding [79.98111074307657]
本稿では,言語間文埋め込みのためのDAP(Dual-alignment pre-training)フレームワークを提案する。そこで本研究では,一方の文脈化トークン表現を用いて翻訳相手を再構成する,新しい表現翻訳学習(RTL)タスクを提案する。我々の手法は文の埋め込みを大幅に改善できる。
論文参考訳（メタデータ） (2023-05-16T03:53:30Z)
Creating Training Sets via Weak Indirect Supervision [66.77795318313372]
Weak Supervision (WS)フレームワークは、複数の潜在的にノイズの多い監督ソースからトレーニングラベルを合成する。 Weak Indirect Supervision (WIS) は、トレーニングラベルの自動合成のための新しい研究課題である。我々は,ユーザが提供するラベル関係を利用して間接的な監督源をモデル化し活用する確率論的モデリング手法PLRMを開発した。
論文参考訳（メタデータ） (2021-10-07T14:09:35Z)
Improving Label Quality by Jointly Modeling Items and Annotators [68.8204255655161]
雑音アノテータから基底真理ラベルを学習するための完全ベイズ的枠組みを提案する。我々のフレームワークは、ラベル分布上の生成的ベイズソフトクラスタリングモデルを古典的なDavidとSkeneのジョイントアノテータデータモデルに分解することでスケーラビリティを保証する。
論文参考訳（メタデータ） (2021-06-20T02:15:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。