論文の概要: It's All in the Name: A Character Based Approach To Infer Religion
- arxiv url: http://arxiv.org/abs/2010.14479v1
- Date: Tue, 27 Oct 2020 17:38:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 10:55:20.218409
- Title: It's All in the Name: A Character Based Approach To Infer Religion
- Title(参考訳): 名前は「宗教を推論する 性格に基づくアプローチ」です
- Authors: Rochana Chaturvedi, Sugat Chaturvedi
- Abstract要約: 私たちは、南アジアの宗教を推測するために、個人名を使用します。
既存の研究は、辞書ベースの方法を用いて宗教を予測する。
文字パターンを学習する文字ベースモデルを使用する。
- 参考スコア(独自算出の注目度): 0.06768558752130312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Demographic inference from text has received a surge of attention in the
field of natural language processing in the last decade. In this paper, we use
personal names to infer religion in South Asia - where religion is a salient
social division, and yet, disaggregated data on it remains scarce. Existing
work predicts religion using dictionary based method, and therefore, can not
classify unseen names. We use character based models which learn character
patterns and, therefore, can classify unseen names as well with high accuracy.
These models are also much faster and can easily be scaled to large data sets.
We improve our classifier by combining the name of an individual with that of
their parent/spouse and achieve remarkably high accuracy. Finally, we trace the
classification decisions of a convolutional neural network model using
layer-wise relevance propagation which can explain the predictions of complex
non-linear classifiers and circumvent their purported black box nature. We show
how character patterns learned by the classifier are rooted in the linguistic
origins of names.
- Abstract(参考訳): 過去10年間、テキストからの人口統計学的推論は自然言語処理の分野で注目を集めている。
本稿では、宗教が健全な社会区分である南アジアの宗教を推測するために、個人名を用いるが、その非集約的なデータはほとんど残っていない。
既存の研究は辞書に基づく手法で宗教を予測するため、見当たらない名前の分類はできない。
文字パターンを学習する文字ベースモデルを用いて、未知の名前を高精度に分類できる。
これらのモデルはずっと高速で、簡単に大規模なデータセットにスケールできる。
個人の名前と親/親の名前を組み合わせることで分類器を改良し,精度を著しく向上させる。
最後に,複雑な非線形分類器の予測を説明できる階層関係伝播を用いた畳み込みニューラルネットワークモデルの分類決定をトレースし,それらのブラックボックスの性質を回避する。
分類器によって学習された文字パターンは,言語的起源に根ざしていることを示す。
関連論文リスト
- Multicultural Name Recognition For Previously Unseen Names [65.268245109828]
本論文は、人名の認識を改善することを目的としており、それは、誰かが生まれたり、名前を変えたりする際にも、成長できる多様なカテゴリーである。
私は103か国の名前を見て、モデルが異なる文化の名前でどれだけうまく機能するかを比較します。
文字入力と単語入力を組み合わせたモデルの方が単語のみのモデルより優れており,従来のNERモデルと比較して精度が向上する可能性がある。
論文 参考訳(メタデータ) (2024-01-23T17:58:38Z) - Evaluating Transformer Models and Human Behaviors on Chinese Character
Naming [0.0]
まず、未知の文字命名タスクに関する人間の話者の回答を収集し、その後、トランスフォーマーモデルのセットを評価する。
モデルと人間は同じような振る舞いをしており、各キャラクタに類似した精度分布を持ち、回答にかなりの重複があることが判明した。
論文 参考訳(メタデータ) (2023-03-22T03:58:38Z) - What artificial intelligence might teach us about the origin of human
language [91.3755431537592]
本研究は、人工知能と音の象徴性を組み合わせた研究から生まれたパターンを探索する。
機械学習アルゴリズムは、音のシンボリズムの効率的な学習者であるが、あるカテゴリーを他方に偏りがちである。
論文 参考訳(メタデータ) (2023-01-15T23:25:29Z) - Distance Based Image Classification: A solution to generative
classification's conundrum? [70.43638559782597]
差別的境界は、何によって意味論を定義するため、直観に反するものであると論じる。
本稿では,シェル理論の階層的生成過程によって意味的因子が許容される新しい生成モデルを提案する。
本モデルを用いて,意味的手がかりを保ちながら雑音の影響を抑える分類手法を開発した。
論文 参考訳(メタデータ) (2022-10-04T03:35:13Z) - Disentangled Action Recognition with Knowledge Bases [77.77482846456478]
本研究では,新規な動詞や新規な名詞に対する合成行動認識モデルの一般化能力の向上を目指す。
従来の作業では、知識グラフ内の動詞-名詞合成アクションノードを使用しており、スケールを非効率にしている。
本提案手法は, 行動の固有な構成性を活用する, 知識ベースを用いた不整合行動認識(DARK)である。
論文 参考訳(メタデータ) (2022-07-04T20:19:13Z) - Signal in Noise: Exploring Meaning Encoded in Random Character Sequences
with Character-Aware Language Models [0.7454831343436739]
ランダムな文字列からなる$n$-grams、または$garble$は、現在ある言語内外における単語の意味を研究するための新しい文脈を提供する。
characterBERT を用いて,巨大コーパス,既存言語,擬似単語の埋め込みを研究することにより,モデルの高次元埋め込み空間の軸を同定し,これらのクラスを$n$-gram で分離する。
論文 参考訳(メタデータ) (2022-03-15T13:48:38Z) - On Guiding Visual Attention with Language Specification [76.08326100891571]
注意をそらすのではなく,タスク関連機能に分類証拠を限定するためのアドバイスとして,ハイレベルな言語仕様を用いる。
この方法で空間的注意を監督することは、偏りのあるノイズのあるデータを用いた分類タスクの性能を向上させる。
論文 参考訳(メタデータ) (2022-02-17T22:40:19Z) - Predicting gender of Brazilian names using deep learning [0.0]
一部の機械学習アルゴリズムは、この予測を十分に実行することができる。
ブラジル名のデータセットを使用して、モデルをトレーニングし、評価する。
一部のモデルは、90%以上のケースで正確に性別を予測する。
論文 参考訳(メタデータ) (2021-06-18T14:45:59Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z) - Classification of Chinese Handwritten Numbers with Labeled Projective
Dictionary Pair Learning [1.8594711725515674]
我々は,識別可能性,空間性,分類誤差の3つの要因を取り入れたクラス固有辞書を設計する。
我々は、辞書原子を生成するために、新しい特徴空間、すなわち、向き付け勾配(HOG)のヒストグラムを採用する。
その結果,最先端のディープラーニング技術と比較して,分類性能が向上した(sim98%)。
論文 参考訳(メタデータ) (2020-03-26T01:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。