論文の概要: Efficient Multilingual Name Type Classification Using Convolutional Networks
- arxiv url: http://arxiv.org/abs/2601.11090v1
- Date: Fri, 16 Jan 2026 08:41:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.413496
- Title: Efficient Multilingual Name Type Classification Using Convolutional Networks
- Title(参考訳): 畳み込みネットワークを用いた効率的な多言語型分類
- Authors: Davor Lauc,
- Abstract要約: 本稿では,言語とエンティティタイプによる名前の分類のための畳み込みニューラルネットワーク手法を提案する。
我々のモデルであるOnomas-CNN Xは、並列畳み込み分岐と深度分離可能な演算と階層分類を組み合わせて、CPUハードウェア上で効率的に名前を処理する。
Onomas-CNN Xは92.1%の精度で、1つのCPUコアで毎秒2,813名が処理される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a convolutional neural network approach for classifying proper names by language and entity type. Our model, Onomas-CNN X, combines parallel convolution branches with depthwise-separable operations and hierarchical classification to process names efficiently on CPU hardware. We evaluate the architecture on a large multilingual dataset covering 104 languages and four entity types (person, organization, location, other). Onomas-CNN X achieves 92.1% accuracy while processing 2,813 names per second on a single CPU core - 46 times faster than fine-tuned XLM-RoBERTa with comparable accuracy. The model reduces energy consumption by a factor of 46 compared to transformer baselines. Our experiments demonstrate that specialized CNN architectures remain competitive with large pre-trained models for focused NLP tasks when sufficient training data exists.
- Abstract(参考訳): 言語と実体型で固有名を分類するための畳み込みニューラルネットワーク手法を提案する。
我々のモデルであるOnomas-CNN Xは、並列畳み込み分岐と深度分離可能な演算と階層分類を組み合わせて、CPUハードウェア上で効率的に名前を処理する。
104の言語と4つのエンティティタイプ(人、組織、場所など)をカバーする大規模な多言語データセット上でアーキテクチャを評価する。
Onomas-CNN Xは92.1%の精度で、1つのCPUコアで毎秒2,813名を処理する。
このモデルはトランスベースラインに比べてエネルギー消費を46倍に削減する。
我々の実験は、十分なトレーニングデータが存在する場合、集中型NLPタスクのための大規模な訓練済みモデルと、特別なCNNアーキテクチャが競合し続けることを示した。
関連論文リスト
- Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価する。
3つのニューラルアーキテクチャに対して、チョムスキー階層の様々な言語について結果を提供する。
我々の貢献は、将来の研究において、言語認識の主張を理論的に健全に検証するのに役立つだろう。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - Multi-Class Quantum Convolutional Neural Networks [2.6422127672474933]
古典データのマルチクラス分類のための量子畳み込みニューラルネットワーク(QCNN)を提案する。
QCNNは4, 6, 8, 10クラスのMNISTデータセットでテストされている。
論文 参考訳(メタデータ) (2024-04-19T09:36:48Z) - CompoundPiece: Evaluating and Improving Decompounding Performance of
Language Models [77.45934004406283]
複合語を構成語に分割する作業である「分解」を体系的に研究する。
We introduced a dataset of 255k compound and non-compound words across 56 various languages obtained from Wiktionary。
分割のための専用モデルを訓練するための新しい手法を導入する。
論文 参考訳(メタデータ) (2023-05-23T16:32:27Z) - A 4D Hybrid Algorithm to Scale Parallel Training to Thousands of GPUs [1.7481226034111275]
本稿では,並列訓練における通信を最適化するための4次元(4次元)アプローチを提案する。
AxoNNは最先端のフレームワークであるMegatron-LMを26%上回っている。
理論上のピークFLOP/sの57%、合計182 PFLOP/sを達成している。
論文 参考訳(メタデータ) (2023-05-22T22:41:49Z) - Automatic Machine Learning for Multi-Receiver CNN Technology Classifiers [16.244541005112747]
畳み込みニューラルネットワーク(CNN)は、信号分類のための最も研究されているディープラーニングモデルの1つである。
我々は、複数の同期受信機から収集した生のI/Qサンプルに基づく技術分類に焦点を当てた。
論文 参考訳(メタデータ) (2022-04-28T23:41:38Z) - Dynamic Multi-scale Convolution for Dialect Identification [18.132769601922682]
本稿では、動的カーネル畳み込み、局所的マルチスケール学習、グローバルなマルチスケールプールからなる動的マルチスケール畳み込みを提案する。
提案アーキテクチャは,言語認識のAP20-OLR-dialect-taskにおいて,最先端のシステムよりも優れていた。
論文 参考訳(メタデータ) (2021-08-02T03:37:15Z) - Adaptive Nearest Neighbor Machine Translation [60.97183408140499]
kNN-MTは、事前訓練されたニューラルネットワーク翻訳とトークンレベルのk-nearest-neighbor検索を組み合わせる。
従来のkNNアルゴリズムは、ターゲットトークンごとに同じ数の近傍を検索する。
ターゲットトークン毎のk個数を動的に決定する適応的kNN-MTを提案する。
論文 参考訳(メタデータ) (2021-05-27T09:27:42Z) - ACDC: Weight Sharing in Atom-Coefficient Decomposed Convolution [57.635467829558664]
我々は,CNNにおいて,畳み込みカーネル間の構造正則化を導入する。
我々はCNNがパラメータや計算量を劇的に減らして性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-09-04T20:41:47Z) - Binarizing MobileNet via Evolution-based Searching [66.94247681870125]
そこで本稿では,MobileNet をバイナライズする際の構築と訓練を容易にするための進化的探索手法を提案する。
ワンショットアーキテクチャ検索フレームワークに着想を得て、グループ畳み込みのアイデアを操り、効率的な1ビット畳み込みニューラルネットワーク(CNN)を設計する。
我々の目標は、グループ畳み込みの最良の候補を探索することで、小さなが効率的なバイナリニューラルアーキテクチャを考案することである。
論文 参考訳(メタデータ) (2020-05-13T13:25:51Z) - Inferring Convolutional Neural Networks' accuracies from their
architectural characterizations [0.0]
CNNのアーキテクチャと性能の関係について検討する。
本稿では,2つのコンピュータビジョンに基づく物理問題において,その特性がネットワークの性能を予測できることを示す。
我々は機械学習モデルを用いて、トレーニング前にネットワークが一定のしきい値精度よりも優れた性能を発揮できるかどうかを予測する。
論文 参考訳(メタデータ) (2020-01-07T16:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。