論文の概要: Can the Language of the Collation be Translated into the Language of the
Stemma? Using Machine Translation for Witness Localization
- arxiv url: http://arxiv.org/abs/2206.05603v1
- Date: Sat, 11 Jun 2022 20:10:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-19 07:21:18.115404
- Title: Can the Language of the Collation be Translated into the Language of the
Stemma? Using Machine Translation for Witness Localization
- Title(参考訳): 衝突の言語はシュテマの言語に翻訳できるのか?
目撃者定位に機械翻訳を用いる
- Authors: Armin Hoenen
- Abstract要約: 計算方法は、系統学と幹細胞学の姉妹分野の間で部分的に共有されている。
深層学習(DL)は系統学でわずかに成功した。
幹細胞学では、現在までにDLアプローチは全く知られていない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stemmatology is a subfield of philology where one approach to understand the
copy-history of textual variants of a text (witnesses of a tradition) is to
generate an evolutionary tree. Computational methods are partly shared between
the sister discipline of phylogenetics and stemmatology. In 2022, a surveypaper
in nature communications found that Deep Learning (DL), which otherwise has
brought about major improvements in many fields (Krohn et al 2020) has had only
minor successes in phylogenetics and that "it is difficult to conceive of an
end-to-end DL model to directly estimate phylogenetic trees from raw data in
the near future"(Sapoval et al. 2022, p.8). In stemmatology, there is to date
no known DL approach at all. In this paper, we present a new DL approach to
placement of manuscripts on a stemma and demonstrate its potential. This could
be extended to phylogenetics where the universal code of DNA might be an even
better prerequisite for the method using sequence to sequence based neural
networks in order to retrieve tree distances.
- Abstract(参考訳): ステムマトロジー(stemmatology)は文献学のサブ分野であり、テキストのテキスト変種(伝統のウィットネス)のコピーヒストリーを理解する一つのアプローチは進化木を生成することである。
計算方法は、系統学と幹細胞学の姉妹分野の間で部分的に共有されている。
2022年、nature communicationsの調査によると、多くの分野で大きな改善をもたらしたディープラーニング(krohn et al 2020)は、系統解析において小さな成果しか得られておらず、「近未来の生データから系統樹を直接推定するエンドツーエンドのdlモデルを考えることは困難である」(sapoval et al. 2022, p.8)。
幹細胞学では、現在までdlアプローチは知られていない。
本稿では,幹細胞に原稿を配置するための新しいDLアプローチを提案し,その可能性を示す。
これは系統学に拡張され、樹間距離を検索するために配列に基づくニューラルネットワークを用いる方法において、DNAの普遍的なコードの方がより良い前提条件となるかもしれない。
関連論文リスト
- Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - Patterns of Persistence and Diffusibility across the World's Languages [3.7055269158186874]
コレキシフィケーション(英: Colexification)は、複数の意味を伝えるために単一の語彙形式を用いる類似性の一種である。
我々は,言語間の類似性の言語的原因について,比較と音韻学で明らかにした。
我々は,1,966言語を対象とした意味,系譜,音韻,地理データを組み込んだ大規模グラフを構築した。
論文 参考訳(メタデータ) (2024-01-03T12:05:38Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Can Large Language Models Augment a Biomedical Ontology with missing
Concepts and Relations? [1.1060425537315088]
LLMとのセマンティックな相互作用を利用して臨床実践ガイドラインを解析する手法を提案する。
プロンプトを使った最初の実験では、手動で生成された金の標準を与えられた有望な結果が得られました。
論文 参考訳(メタデータ) (2023-11-12T14:20:55Z) - PhyloGFN: Phylogenetic inference with generative flow networks [59.56365488043478]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - Spanish Resource Grammar version 2023 [0.7614628596146599]
スペイン資源文法(SRG)の最新バージョンについて紹介する。
新しいSRGは、最近のFreeling形態解析器とタグガーを使用している。
手動で検証されたツリーバンクと文書化された問題のリストが付属している。
論文 参考訳(メタデータ) (2023-09-23T09:24:05Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - Constructing a Family Tree of Ten Indo-European Languages with
Delexicalized Cross-linguistic Transfer Patterns [57.86480614673034]
我々は,デレクシカル化転送を,解釈可能なツリー・ツー・ストリングパターンとツリー・ツー・ツリーパターンとして定式化する。
これにより、言語間移動を定量的に探索し、第二言語習得の問い合わせを拡張することができる。
論文 参考訳(メタデータ) (2020-07-17T15:56:54Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z) - CBAG: Conditional Biomedical Abstract Generation [1.2633386045916442]
浅層エンコーダ"条件"スタックと,マルチヘッドアテンションブロックの深層"言語モデル"スタックを備えたトランスフォーマーベースの条件言語モデルを提案する。
提案したタイトル,意図した出版年,キーワードのセットのみをバイオメディカルな要約として生成する。
論文 参考訳(メタデータ) (2020-02-13T17:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。