論文の概要: Mechanism of Evolution Shared by Gene and Language
- arxiv url: http://arxiv.org/abs/2012.14309v1
- Date: Mon, 28 Dec 2020 15:46:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 10:58:25.088216
- Title: Mechanism of Evolution Shared by Gene and Language
- Title(参考訳): 遺伝子と言語が共有する進化のメカニズム
- Authors: Li-Min Wang, Hsing-Yi Lai, Sun-Ting Tsai, Shan-Jyun Wu, Meng-Xue Tsai,
Daw-Wei Wang, Yi-Ching Su, Chen Siang Ng, and Tzay-Ming Hong
- Abstract要約: 遺伝子と言語の多様性を説明するための一般的な進化メカニズムを提案する。
古典的対応である「ドメインは遺伝子言語において単語の役割を担っている」ことは厳密ではない。
私たちは、話し言葉と書き言葉の特徴を含む新しい進化単位であるsyllgramを考案しました。
- 参考スコア(独自算出の注目度): 8.882751635947027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a general mechanism for evolution to explain the diversity of gene
and language. To quantify their common features and reveal the hidden
structures, several statistical properties and patterns are examined based on a
new method called the rank-rank analysis. We find that the classical
correspondence, "domain plays the role of word in gene language", is not
rigorous, and propose to replace domain by protein. In addition, we devise a
new evolution unit, syllgram, to include the characteristics of spoken and
written language. Based on the correspondence between (protein, domain) and
(word, syllgram), we discover that both gene and language shared a common
scaling structure and scale-free network. Like the Rosetta stone, this work may
help decipher the secret behind non-coding DNA and unknown languages.
- Abstract(参考訳): 遺伝子と言語の多様性を説明するための進化の一般的なメカニズムを提案する。
共通の特徴を定量化し, 隠蔽構造を明らかにするために, ランク解析と呼ばれる新しい手法を用いて, 統計特性とパターンについて検討した。
古典的対応である「ドメインは遺伝子言語において単語の役割を担う」は厳密ではなく、ドメインをタンパク質に置き換えることを提案している。
さらに,新たな進化単位であるsylgramを考案し,話し言葉と書き言葉の特徴を包含する。
タンパク質, ドメイン) と (単語, シルグラム) の対応から, 遺伝子と言語が共通のスケーリング構造とスケールフリーネットワークを共有していることが判明した。
ロゼッタ石と同様に、この研究は非コードDNAや未知の言語の背後にある秘密を解読するのに役立つかもしれない。
関連論文リスト
- Entropy and type-token ratio in gigaword corpora [0.0]
本研究では,英語,スペイン語,トルコ語の6つの大規模言語データセットにおいて,語彙の多様性を示す2つの指標であるエントロピーとテキストトケン比について検討した。
コーパスを横切るエントロピーとテキスト-トケン比の関数的関係が検討されている。
この結果は,テキスト構造の理論的理解に寄与し,自然言語処理などの分野に実践的な意味を与える。
論文 参考訳(メタデータ) (2024-11-15T14:40:59Z) - Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
形式言語理論は、特に認識者に関するものである。
代わりに、非公式な意味でのみ類似したプロキシタスクを使用するのが一般的である。
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価することで、このミスマッチを補正する。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - A single-cell gene expression language model [2.9112649816695213]
遺伝子間のコンテキスト依存を学習する機械学習システムを提案する。
我々のモデルであるExceiverは、自己教師型タスクを用いて、多様な細胞タイプで訓練されている。
生物学的アノテーションに関して,潜在サンプル表現の類似性プロファイルと学習された遺伝子埋め込みとの間に一致が認められた。
論文 参考訳(メタデータ) (2022-10-25T20:52:19Z) - Crosslinguistic word order variation reflects evolutionary pressures of
dependency and information locality [4.869029215261254]
世界の言語の約40%は主目的語順であり、約40%は主目的語順である。
単語順の変動は、依存関係の局所性と情報局所性の競合する圧力のバランスの異なる方法を反映していることを示す。
本研究は,言語間の統語構造と使用法が,限られた認知資源下での効率的なコミュニケーションを支援するのに相応しいことを示唆している。
論文 参考訳(メタデータ) (2022-06-09T02:56:53Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z) - Low-Dimensional Structure in the Space of Language Representations is
Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。
この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。
これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T22:59:12Z) - Self-organizing Pattern in Multilayer Network for Words and Syllables [17.69876273827734]
音節の等しく重要な役割を強調する新しい普遍法則を提案する。
英語と中国語のコーパスで単語と音節のランク頻度分布をプロットすることにより、目に見える線が出現し、マスターカーブに適合する。
論文 参考訳(メタデータ) (2020-05-05T12:01:47Z) - Linguistic Typology Features from Text: Inferring the Sparse Features of
World Atlas of Language Structures [73.06435180872293]
我々は、バイト埋め込みと畳み込み層に基づく繰り返しニューラルネットワーク予測器を構築する。
様々な言語型の特徴を確実に予測できることを示す。
論文 参考訳(メタデータ) (2020-04-30T21:00:53Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。
実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文 参考訳(メタデータ) (2020-04-29T03:34:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。