論文の概要: Self-organizing Pattern in Multilayer Network for Words and Syllables
- arxiv url: http://arxiv.org/abs/2005.02087v1
- Date: Tue, 5 May 2020 12:01:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-06 14:15:37.351370
- Title: Self-organizing Pattern in Multilayer Network for Words and Syllables
- Title(参考訳): 単語・音節多層ネットワークにおける自己組織化パターン
- Authors: Li-Min Wang, Sun-Ting Tsai, Shan-Jyun Wu, Meng-Xue Tsai, Daw-Wei Wang,
Yi-Ching Su, and Tzay-Ming Hong
- Abstract要約: 音節の等しく重要な役割を強調する新しい普遍法則を提案する。
英語と中国語のコーパスで単語と音節のランク頻度分布をプロットすることにより、目に見える線が出現し、マスターカーブに適合する。
- 参考スコア(独自算出の注目度): 17.69876273827734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the ultimate goals for linguists is to find universal properties in
human languages. Although words are generally considered as representing
arbitrary mapping between linguistic forms and meanings, we propose a new
universal law that highlights the equally important role of syllables, which is
complementary to Zipf's. By plotting rank-rank frequency distribution of word
and syllable for English and Chinese corpora, visible lines appear and can be
fit to a master curve. We discover the multi-layer network for words and
syllables based on this analysis exhibits the feature of self-organization
which relies heavily on the inclusion of syllables and their connections.
Analytic form for the scaling structure is derived and used to quantify how
Internet slang becomes fashionable, which demonstrates its usefulness as a new
tool to evolutionary linguistics.
- Abstract(参考訳): 言語学者の究極の目標の1つは、人間の言語に普遍的な性質を見つけることである。
単語は一般的には言語形態と意味の任意のマッピングを表すと考えられているが、zipf を補完する音節の等しく重要な役割を強調する新しい普遍法則を提案する。
英語と中国語のコーパスで単語と音節のランク頻度分布をプロットすることにより、目に見える線が出現し、マスターカーブに適合する。
この分析に基づいて単語と音節の多層ネットワークを探索し、音節とそれらの接続の包含に大きく依存する自己組織化の特徴を示す。
インターネットスラングがいかに流行するかを定量化するために、スケーリング構造の解析形式が導出され、進化言語学の新たなツールとして有用であることを示す。
関連論文リスト
- Topology of Syntax Networks across Languages [0.0]
本論文は,構文ネットワークの構造と特性について考察する。
同様のネットワーク機能を共有する言語のクラスタや系統を見つけようとしている。
異なる言語にわたる結果は、普遍的に保存された構造パターンを発見するために比較される。
論文 参考訳(メタデータ) (2025-03-09T18:47:17Z) - Revisiting Syllables in Language Modelling and their Application on
Low-Resource Machine Translation [1.2617078020344619]
シラブルは文字よりも短いシーケンスを提供し、モルヒムよりも特定の抽出規則を必要とせず、そのセグメンテーションはコーパスサイズの影響を受けない。
まず,21言語におけるオープン語彙言語モデリングにおける音節の可能性について検討する。
我々は6つの言語に対して規則に基づくシラビフィケーション手法を使用し、残りはシラビフィケーションプロキシとして機能するハイフン化で対処する。
論文 参考訳(メタデータ) (2022-10-05T18:55:52Z) - Latent Topology Induction for Understanding Contextualized
Representations [84.7918739062235]
本研究では,文脈的埋め込みの表現空間について検討し,大規模言語モデルの隠れトポロジについて考察する。
文脈化表現の言語特性を要約した潜在状態のネットワークが存在することを示す。
論文 参考訳(メタデータ) (2022-06-03T11:22:48Z) - Feature-rich multiplex lexical networks reveal mental strategies of
early language learning [0.7111443975103329]
FEature-Rich MUltiplex LEXical (FERMULEX) ネットワークについて述べる。
類似性は、知識のセマンティック/シンタクティック/音声学的側面にまたがる異種単語関連をモデル化する。
単語には、周波数、取得年齢、長さ、ポリセミーを含む多次元特徴埋め込みが組み込まれている。
論文 参考訳(メタデータ) (2022-01-13T16:44:51Z) - Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。
すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。
言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文 参考訳(メタデータ) (2021-09-01T09:32:06Z) - Metrical Tagging in the Wild: Building and Annotating Poetry Corpora
with Rhythmic Features [0.0]
英語とドイツ語に大規模な詩コーパスを提供し,コーパス駆動ニューラルモデルを訓練するためのコーパスを小型化した韻律的特徴をアノテートする。
音節埋め込みを用いた BiLSTM-CRF モデルは, CRF ベースラインと異なるBERT ベースアプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-17T16:38:57Z) - Seeing Both the Forest and the Trees: Multi-head Attention for Joint
Classification on Different Compositional Levels [15.453888735879525]
自然言語では、単語は関連して文を構成するために使用される。
より低い言語的コンポーネントと高い言語的コンポーネントを明確に結び付けるディープニューラルネットワークアーキテクチャを設計する。
我々のモデルであるMHALは、異なるレベルの粒度でそれらを同時に解くことを学習していることを示す。
論文 参考訳(メタデータ) (2020-11-01T10:44:46Z) - Revisiting Neural Language Modelling with Syllables [3.198144010381572]
我々は20言語でオープン語彙生成タスクのために音節を再考する。
ルールベースのシラビフィケーション手法を5つの言語で使用し,残りをハイフン化ツールで処理する。
同等の難易度で、音節は文字、注釈付き形態素、教師なしのサブワードよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:44:41Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z) - Linguistic Typology Features from Text: Inferring the Sparse Features of
World Atlas of Language Structures [73.06435180872293]
我々は、バイト埋め込みと畳み込み層に基づく繰り返しニューラルネットワーク予測器を構築する。
様々な言語型の特徴を確実に予測できることを示す。
論文 参考訳(メタデータ) (2020-04-30T21:00:53Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。