Fugu-MT 論文翻訳(概要): Can the Language of the Collation be Translated into the Language of the Stemma? Using Machine Translation for Witness Localization

論文の概要: Can the Language of the Collation be Translated into the Language of the Stemma? Using Machine Translation for Witness Localization

arxiv url: http://arxiv.org/abs/2206.05603v1
Date: Sat, 11 Jun 2022 20:10:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-19 07:21:18.115404
Title: Can the Language of the Collation be Translated into the Language of the Stemma? Using Machine Translation for Witness Localization
Title（参考訳）: 衝突の言語はシュテマの言語に翻訳できるのか? 目撃者定位に機械翻訳を用いる
Authors: Armin Hoenen
Abstract要約: 計算方法は、系統学と幹細胞学の姉妹分野の間で部分的に共有されている。深層学習(DL)は系統学でわずかに成功した。幹細胞学では、現在までにDLアプローチは全く知られていない。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Stemmatology is a subfield of philology where one approach to understand the copy-history of textual variants of a text (witnesses of a tradition) is to generate an evolutionary tree. Computational methods are partly shared between the sister discipline of phylogenetics and stemmatology. In 2022, a surveypaper in nature communications found that Deep Learning (DL), which otherwise has brought about major improvements in many fields (Krohn et al 2020) has had only minor successes in phylogenetics and that "it is difficult to conceive of an end-to-end DL model to directly estimate phylogenetic trees from raw data in the near future"(Sapoval et al. 2022, p.8). In stemmatology, there is to date no known DL approach at all. In this paper, we present a new DL approach to placement of manuscripts on a stemma and demonstrate its potential. This could be extended to phylogenetics where the universal code of DNA might be an even better prerequisite for the method using sequence to sequence based neural networks in order to retrieve tree distances.
Abstract（参考訳）: ステムマトロジー(stemmatology)は文献学のサブ分野であり、テキストのテキスト変種(伝統のウィットネス)のコピーヒストリーを理解する一つのアプローチは進化木を生成することである。計算方法は、系統学と幹細胞学の姉妹分野の間で部分的に共有されている。 2022年、nature communicationsの調査によると、多くの分野で大きな改善をもたらしたディープラーニング(krohn et al 2020)は、系統解析において小さな成果しか得られておらず、「近未来の生データから系統樹を直接推定するエンドツーエンドのdlモデルを考えることは困難である」(sapoval et al. 2022, p.8)。幹細胞学では、現在までdlアプローチは知られていない。本稿では,幹細胞に原稿を配置するための新しいDLアプローチを提案し,その可能性を示す。これは系統学に拡張され、樹間距離を検索するために配列に基づくニューラルネットワークを用いる方法において、DNAの普遍的なコードの方がより良い前提条件となるかもしれない。

関連論文リスト

Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs [78.18336140706471]
Sci-LLMは、生物発見を加速するための有望なフロンティアとして登場した。現在の戦略では生の生体分子配列を処理する際にSci-LLMの推論能力を制限する。より効果的な戦略は、Sci-LLMに高レベルな構造化コンテキストを提供することである。
論文参考訳（メタデータ） (2025-10-27T09:03:21Z)
Beyond cognacy [0.21756081703275998]
2つの完全に自動化された手法を比較し、語彙データから直接系統情報を抽出する。以上の結果から,MSAに基づく推論は,より言語分類に整合し,タイプロジカルな変異を予測し,より明確な系統的シグナルを与えることがわかった。
論文参考訳（メタデータ） (2025-07-02T06:47:34Z)
From Sentences to Sequences: Rethinking Languages in Biological System [6.304152224988003]
生物系における言語の概念を再考し,NLPの成功を生物学的領域に効果的に翻訳する方法をよりよく理解する。生体分子の3次元構造を文の意味的内容として扱うことにより,構造評価の重要性を強調した。
論文参考訳（メタデータ） (2025-07-01T16:57:39Z)
The Cognate Data Bottleneck in Language Phylogenetics [49.1574468325115]
より大きなデータセットを必要とする系統データ分析アプローチは、コグネートデータには適用できない。これらの計算手法が歴史的言語学にどのように適用できるか、またどのように適用できるかは、まだ明らかな疑問である。
論文参考訳（メタデータ） (2025-07-01T16:14:20Z)
Life-Code: Central Dogma Modeling with Multi-Omics Sequence Unification [55.98854157265578]
Life-Codeは、様々な生物学的機能にまたがる包括的なフレームワークである。本稿では、RNAを逆転写し、アミノ酸をヌクレオチド配列に変換することで、マルチオミクスデータを統合する統一パイプラインを提案する。 Life-Codeは3つのオミクスにまたがる様々なタスクの最先端の結果を達成し、マルチオミクス分析と解釈の進歩の可能性を強調している。
論文参考訳（メタデータ） (2025-02-11T06:53:59Z)
PhyloVAE: Unsupervised Learning of Phylogenetic Trees via Variational Autoencoders [5.505257238864315]
PhyloVAEは、木トポロジーの表現学習と生成モデリングのために設計された教師なし学習フレームワークである。我々は,高速で並列化されたトポロジ生成を容易にする潜伏変数生成モデルを開発した。実験では、PhyloVAEの堅牢な表現学習能力と系統樹のトポロジーの高速生成が示されている。
論文参考訳（メタデータ） (2025-02-07T07:58:47Z)
PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation [50.80441546742053]
系統樹は種間の進化的関係を解明する。伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。我々は、事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
論文参考訳（メタデータ） (2024-12-25T08:33:05Z)
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文参考訳（メタデータ） (2024-05-13T20:15:03Z)
Efficient and Scalable Fine-Tune of Language Models for Genome Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。 DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。 textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文参考訳（メタデータ） (2024-02-12T21:40:45Z)
Patterns of Persistence and Diffusibility across the World's Languages [3.7055269158186874]
コレキシフィケーション(英: Colexification)は、複数の意味を伝えるために単一の語彙形式を用いる類似性の一種である。我々は,言語間の類似性の言語的原因について,比較と音韻学で明らかにした。我々は,1,966言語を対象とした意味,系譜,音韻,地理データを組み込んだ大規模グラフを構築した。
論文参考訳（メタデータ） (2024-01-03T12:05:38Z)
Can Large Language Models Augment a Biomedical Ontology with missing Concepts and Relations? [1.1060425537315088]
LLMとのセマンティックな相互作用を利用して臨床実践ガイドラインを解析する手法を提案する。プロンプトを使った最初の実験では、手動で生成された金の標準を与えられた有望な結果が得られました。
論文参考訳（メタデータ） (2023-11-12T14:20:55Z)
PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。 GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文参考訳（メタデータ） (2023-10-12T23:46:08Z)
Lattice-preserving $\mathcal{ALC}$ ontology embeddings with saturation [50.05281461410368]
OWL表現の埋め込みを生成するため,順序保存型埋め込み法を提案する。本手法は,いくつかの知識ベース完了タスクにおいて,最先端の組込み手法よりも優れていることを示す。
論文参考訳（メタデータ） (2023-05-11T22:27:51Z)
Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文参考訳（メタデータ） (2022-01-21T09:01:12Z)
Constructing a Family Tree of Ten Indo-European Languages with Delexicalized Cross-linguistic Transfer Patterns [57.86480614673034]
我々は,デレクシカル化転送を,解釈可能なツリー・ツー・ストリングパターンとツリー・ツー・ツリーパターンとして定式化する。これにより、言語間移動を定量的に探索し、第二言語習得の問い合わせを拡張することができる。
論文参考訳（メタデータ） (2020-07-17T15:56:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。