論文の概要: Mechanism of Evolution Shared by Gene and Language
- arxiv url: http://arxiv.org/abs/2012.14309v1
- Date: Mon, 28 Dec 2020 15:46:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 10:58:25.088216
- Title: Mechanism of Evolution Shared by Gene and Language
- Title(参考訳): 遺伝子と言語が共有する進化のメカニズム
- Authors: Li-Min Wang, Hsing-Yi Lai, Sun-Ting Tsai, Shan-Jyun Wu, Meng-Xue Tsai,
Daw-Wei Wang, Yi-Ching Su, Chen Siang Ng, and Tzay-Ming Hong
- Abstract要約: 遺伝子と言語の多様性を説明するための一般的な進化メカニズムを提案する。
古典的対応である「ドメインは遺伝子言語において単語の役割を担っている」ことは厳密ではない。
私たちは、話し言葉と書き言葉の特徴を含む新しい進化単位であるsyllgramを考案しました。
- 参考スコア(独自算出の注目度): 8.882751635947027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a general mechanism for evolution to explain the diversity of gene
and language. To quantify their common features and reveal the hidden
structures, several statistical properties and patterns are examined based on a
new method called the rank-rank analysis. We find that the classical
correspondence, "domain plays the role of word in gene language", is not
rigorous, and propose to replace domain by protein. In addition, we devise a
new evolution unit, syllgram, to include the characteristics of spoken and
written language. Based on the correspondence between (protein, domain) and
(word, syllgram), we discover that both gene and language shared a common
scaling structure and scale-free network. Like the Rosetta stone, this work may
help decipher the secret behind non-coding DNA and unknown languages.
- Abstract(参考訳): 遺伝子と言語の多様性を説明するための進化の一般的なメカニズムを提案する。
共通の特徴を定量化し, 隠蔽構造を明らかにするために, ランク解析と呼ばれる新しい手法を用いて, 統計特性とパターンについて検討した。
古典的対応である「ドメインは遺伝子言語において単語の役割を担う」は厳密ではなく、ドメインをタンパク質に置き換えることを提案している。
さらに,新たな進化単位であるsylgramを考案し,話し言葉と書き言葉の特徴を包含する。
タンパク質, ドメイン) と (単語, シルグラム) の対応から, 遺伝子と言語が共通のスケーリング構造とスケールフリーネットワークを共有していることが判明した。
ロゼッタ石と同様に、この研究は非コードDNAや未知の言語の背後にある秘密を解読するのに役立つかもしれない。
関連論文リスト
- Can linguists better understand DNA? [0.0]
本研究では,自然言語と遺伝子配列/言語間の能力伝達の存在を論じる。
DNA-ペア分類(DNA配列類似性)とDNA-タンパク質-ペア分類(遺伝子コーディング決定)の2つの類似タスクを構築した。
これらのタスクは、自然言語から遺伝子配列への能力の伝達可能性を検証するために設計された。
論文 参考訳(メタデータ) (2024-12-10T17:06:33Z) - Entropy and type-token ratio in gigaword corpora [0.0]
本研究では,英語,スペイン語,トルコ語の6つの大規模言語データセットにおいて,語彙の多様性を示す2つの指標であるエントロピーとテキストトケン比について検討した。
コーパスを横切るエントロピーとテキスト-トケン比の関数的関係が検討されている。
この結果は,テキスト構造の理論的理解に寄与し,自然言語処理などの分野に実践的な意味を与える。
論文 参考訳(メタデータ) (2024-11-15T14:40:59Z) - Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
形式言語理論は、特に認識者に関するものである。
代わりに、非公式な意味でのみ類似したプロキシタスクを使用するのが一般的である。
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価することで、このミスマッチを補正する。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Crosslinguistic word order variation reflects evolutionary pressures of
dependency and information locality [4.869029215261254]
世界の言語の約40%は主目的語順であり、約40%は主目的語順である。
単語順の変動は、依存関係の局所性と情報局所性の競合する圧力のバランスの異なる方法を反映していることを示す。
本研究は,言語間の統語構造と使用法が,限られた認知資源下での効率的なコミュニケーションを支援するのに相応しいことを示唆している。
論文 参考訳(メタデータ) (2022-06-09T02:56:53Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z) - Low-Dimensional Structure in the Space of Language Representations is
Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。
この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。
これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T22:59:12Z) - Linguistic Typology Features from Text: Inferring the Sparse Features of
World Atlas of Language Structures [73.06435180872293]
我々は、バイト埋め込みと畳み込み層に基づく繰り返しニューラルネットワーク予測器を構築する。
様々な言語型の特徴を確実に予測できることを示す。
論文 参考訳(メタデータ) (2020-04-30T21:00:53Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。
実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文 参考訳(メタデータ) (2020-04-29T03:34:53Z) - Geospatial distributions reflect rates of evolution of features of language [0.0]
本稿では,垂直降下,空間的相互作用,および両次元の突然変異を組み合わせたプロセスとして,言語変化の分析を通じて問題に対するモデルに基づくアプローチを提案する。
言語的温度の概念はこの分析から自然に、変化を起こすための言語的特徴の妥当性の無次元測度として現れる。
本研究では,現在の地理空間分布から言語的特徴の温度を推定できることを示す。
論文 参考訳(メタデータ) (2018-01-29T17:24:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。