論文の概要: The Register Gap: A Meaning Intelligence Framework for Nigerian Public Discourse
- arxiv url: http://arxiv.org/abs/2606.20255v2
- Date: Fri, 19 Jun 2026 06:02:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-23 13:41:31.037519
- Title: The Register Gap: A Meaning Intelligence Framework for Nigerian Public Discourse
- Title(参考訳): The Register Gap: ナイジェリアの公開談話のための意味のあるインテリジェンスフレームワーク
- Authors: Celestine Achi,
- Abstract要約: ナイジェリアの公言に対する9次元アノテーションと評価スキーマであるMeaning Intelligence Framework (MIF)を紹介した。
ナイジェリアの言論におけるAIシステムの主流の失敗モードは、翻訳の失敗ではなく、コンテキストの失敗である、と我々は主張する。
標準英語、ナイジェリア英語、ナイジェリアピジン、コード混合レジスタにまたがる30項目の校正データセットを構築した。
我々は、ゼロショットおよびスキーマインフォームドプロンプト条件下で、3つのフロンティア言語モデル(Gemini 2.5 Flash, GPT-5, Gemini 2.5 Pro)を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce the Meaning Intelligence Framework (MIF), a nine-dimension annotation and evaluation schema for Nigerian public discourse that separates surface sentiment from true communicative intent. Existing benchmarks for Nigerian languages, including NaijaSenti and AfriSenti, treat sentiment classification as a three-way polarity task. We argue that the dominant failure mode of AI systems on Nigerian discourse is not translation failure but context failure: the same utterance carries opposite pragmatic force depending on speaker, audience, and situation. The MIF operationalises this insight across nine scored dimensions: register, surface sentiment, true intent, irony, coded subtext, risk tier, annotator confidence, speaker emotion, and recommended communications action. We construct a 30-item calibration dataset spanning Standard English, Nigerian English, Nigerian Pidgin, and code-mixed registers, and evaluate three frontier language models (Gemini 2.5 Flash, GPT-5, and Gemini 2.5 Pro) under zero-shot and schema-informed prompting conditions. Two headline findings emerge. First, the Register Gap: zero-shot register classification accuracy is 33.3%, rising to 73.3% (+40 points) when the model receives the MIF schema in-context. Second, model capability and cultural competence are decoupled: GPT-5 (MIS 67.8) and Gemini 2.5 Pro (MIS 65.4) score lower than Flash (MIS 78.6), and neither benefits from schema-informed prompting. We release the framework specification, annotation guidelines, and calibration set to support reproducibility.
- Abstract(参考訳): 我々は,ナイジェリアの公言に対する9次元アノテーションと評価スキーマである意味情報フレームワーク(MIF)を紹介し,表面感情を真のコミュニケーション意図から分離する。
NaijaSentiやAfriSentiといったナイジェリアの言語の既存のベンチマークでは、感情分類を3方向の極性タスクとして扱う。
ナイジェリアの言論におけるAIシステムの主流となる失敗モードは、翻訳の失敗ではなく、文脈の失敗である、と我々は主張する。
MIFは、この洞察を、レジスタ、表面感情、真の意図、皮肉、コード化されたサブテキスト、リスク層、アノテータの信頼、話者の感情、推奨コミュニケーション行動の9つの指標で運用する。
標準英語,ナイジェリア英語,ナイジェリアピジン,およびコード混合レジスタにまたがる30項目のキャリブレーションデータセットを構築し,ゼロショットおよびスキーマインフォームされたプロンプト条件下で3つのフロンティア言語モデル(Gemini 2.5 Flash, GPT-5, Gemini 2.5 Pro)を評価する。
2つの見出しが浮かび上がる。
まず、レジスタギャップ:ゼロショットレジスタの分類精度は33.3%で、モデルがMIFスキーマをコンテキスト内で受信すると73.3%(+40ポイント)に上昇する。
GPT-5 (MIS 67.8) と Gemini 2.5 Pro (MIS 65.4) のスコアはFlash (MIS 78.6) よりも低く、スキーマインフォームドプロンプトの利点も無い。
再現性をサポートするためのフレームワーク仕様、アノテーションガイドライン、校正セットをリリースします。
関連論文リスト
- LSR: Linguistic Safety Robustness Benchmark for Low-Resource West African Languages [0.0]
我々は、西アフリカの言語における言語間拒絶劣化を測定するための最初の体系的ベンチマークであるLSRを紹介する。
文化に根ざした14の攻撃プローブにおけるGemini 2.5 Flashを4つの有害カテゴリで評価した。
西アフリカの言語全体では、拒絶率は35~55%に低下し、イガラは最も深刻な減少を示している。
論文 参考訳(メタデータ) (2026-02-27T22:54:31Z) - MixSarc: A Bangla-English Code-Mixed Corpus for Implicit Meaning Identification [0.10874100424278171]
最初に公開されたBangla-Englishコード混成コーパスであるMixSarcを紹介した。
データセットには、ユーモア、皮肉、不快感、華やかさをラベル付けした9,087の注釈付き文が含まれている。
その結果、ユーモア検出では高い性能を示したが、クラス不均衡と実用的複雑性により、皮肉、悪感、および下品性は著しく低下した。
論文 参考訳(メタデータ) (2026-02-25T06:12:06Z) - The Compliance Paradox: Semantic-Instruction Decoupling in Automated Academic Code Evaluation [11.984098021215878]
SPACI(Semantic-Preserving Adrial Code Injection)フレームワークとAST-ASIP(Abstract Syntax Tree-Aware Semantic Injection Protocol)を紹介する。
これらの方法は、抽象構文木(英語版)の構文的に不活性な領域(トリヴィアノード)に逆方向の指示を埋め込むことにより、構文解析ギャップを利用する。
Python、C、C++、Javaの25,000のサブミッションにまたがる9つのSOTAモデルの大規模な評価を通じて、DeepSeek-V3のような高容量オープンウェイトモデルにおいて、破滅的な失敗率(>95%)を明らかにします。
論文 参考訳(メタデータ) (2026-01-29T07:40:58Z) - Finetuning Large Language Models for Automated Depression Screening in Nigerian Pidgin English: GENSCORE Pilot Study [0.0]
うつ病はナイジェリアのメンタルヘルスの重荷に大きく貢献している。
高所得国で患者健康質問紙9(PHQ-9)のような伝統的なツールが検証された。
本研究では,対話型ナイジェリア語ピジンに適応した細調整大言語モデル(LLM)を用いた自動スクリーニング手法を提案する。
論文 参考訳(メタデータ) (2025-11-28T19:13:13Z) - SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal [64.9938658716425]
SORRY-Benchは、安全でないユーザ要求を認識し拒否する大規模言語モデル(LLM)能力を評価するためのベンチマークである。
まず、既存の手法では、安全でないトピックの粗い分類を使い、いくつかのきめ細かいトピックを過剰に表現している。
第二に、プロンプトの言語的特徴とフォーマッティングは、様々な言語、方言など、多くの評価において暗黙的にのみ考慮されているように、しばしば見過ごされる。
論文 参考訳(メタデータ) (2024-06-20T17:56:07Z) - Cobra Effect in Reference-Free Image Captioning Metrics [58.438648377314436]
視覚言語事前学習モデル(VLM)を活用した参照フリー手法の普及が出現している。
本稿では,基準自由度に欠陥があるかどうかを考察する。
GPT-4Vは生成した文を評価するための評価ツールであり,提案手法がSOTA(State-of-the-art)の性能を達成することを示す。
論文 参考訳(メタデータ) (2024-02-18T12:36:23Z) - Unlikelihood Tuning on Negative Samples Amazingly Improves Zero-Shot
Translation [79.96416609433724]
Zero-shot Translation (ZST)は、トレーニングデータにおいて、目に見えない言語ペア間の翻訳を目的としている。
推論中にゼロショット言語マッピングをガイドする一般的な方法は、ソースとターゲット言語IDを意図的に挿入することである。
近年の研究では、言語IDが時折ZSTタスクのナビゲートに失敗し、ターゲット外問題に悩まされることが示されている。
論文 参考訳(メタデータ) (2023-09-28T17:02:36Z) - Adversarial Training For Low-Resource Disfluency Correction [50.51901599433536]
ディフルエンシ補正(DC)のための逆学習型シーケンスタグ付けモデルを提案する。
提案手法の利点は,3つのインド語でDCに対して評価することで,合成された非流動データに大きく依存することを示す。
また,本手法は,音声障害によって導入されたASR文字の破面的不一致の除去にも有効である。
論文 参考訳(メタデータ) (2023-06-10T08:58:53Z) - Text Classification via Large Language Models [63.1874290788797]
テキスト分類に関わる複雑な言語現象に対処するために、Clue And Reasoning Prompting (CARP)を導入する。
注目すべきは、CARPが5つの広く使用されているテキスト分類ベンチマークのうち4つで新しいSOTAパフォーマンスを得ることだ。
さらに重要なのは、CARPが低リソースとドメイン適応のセットアップで素晴らしい能力を提供します。
論文 参考訳(メタデータ) (2023-05-15T06:24:45Z) - Towards End-to-End Training of Automatic Speech Recognition for Nigerian Pidgin [1.099532646524593]
本稿ではナイジェリアのピジン英語向けにカスタマイズされたエンドツーエンド音声認識システムの開発に焦点をあてる。
我々は,新しいデータセットを用いて,事前訓練された最先端アーキテクチャについて検討・評価を行った。
このアーキテクチャをデータセットで表現されたニュアンスに適応することにより、エラーを59.84%削減する。
論文 参考訳(メタデータ) (2020-10-21T16:32:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。