論文の概要: Smotrom tvoja pa ander drogoj verden! Resurrecting Dead Pidgin with Generative Models: Russenorsk Case Study
- arxiv url: http://arxiv.org/abs/2506.11065v1
- Date: Sat, 31 May 2025 11:26:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.537319
- Title: Smotrom tvoja pa ander drogoj verden! Resurrecting Dead Pidgin with Generative Models: Russenorsk Case Study
- Title(参考訳): Smotrom tvoja pa Ander drogoj verden!
- Authors: Alexey Tikhonov, Sergei Shteiner, Anna Bykova, Ivan P. Yamshchikov,
- Abstract要約: ルセノルスク語(Russenorsk)は、ロシア語とノルウェー語との貿易で使われるピジン語である。
我々は同義語と語源によってグループ化された言語の構造化辞書を構築した。
- 参考スコア(独自算出の注目度): 16.649383443094404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Russenorsk, a pidgin language historically used in trade interactions between Russian and Norwegian speakers, represents a unique linguistic phenomenon. In this paper, we attempt to analyze its lexicon using modern large language models (LLMs), based on surviving literary sources. We construct a structured dictionary of the language, grouped by synonyms and word origins. Subsequently, we use this dictionary to formulate hypotheses about the core principles of word formation and grammatical structure in Russenorsk and show which hypotheses generated by large language models correspond to the hypotheses previously proposed ones in the academic literature. We also develop a "reconstruction" translation agent that generates hypothetical Russenorsk renderings of contemporary Russian and Norwegian texts.
- Abstract(参考訳): 歴史的にロシア語とノルウェー語との貿易に使われたピジン語であるRussenorskは、独特の言語現象を表している。
本稿では,現代大言語モデル (LLM) を用いた辞書の分析を試みた。
我々は同義語と語源によってグループ化された言語の構造化辞書を構築した。
その後、この辞書を用いて、ルセノルスクにおける単語形成の根本原理と文法構造に関する仮説を定式化し、どの仮説を大きな言語モデルで生成するかを学術文献でこれまで提案されていた仮説と一致することを示す。
また、現代ロシアやノルウェーのテキストの仮説的なルセノルスクの描画を生成する「再構成」翻訳エージェントも開発している。
関連論文リスト
- Unsupervised Classification of English Words Based on Phonological Information: Discovery of Germanic and Latinate Clusters [9.220284665192663]
言語横断的に、母語と借用語は異なる音韻規則に従う。
英語の語彙におけるゲルマン語とラテン語の区別は、個々の単語の音韻情報から学べる。
論文 参考訳(メタデータ) (2025-04-16T05:20:08Z) - Finding Structure in Language Models [3.882018118763685]
この論文は、言語モデルが人間のものと似た文法構造を深く理解しているかどうかに関するものである。
我々は,大規模言語モデルの複雑な性質の理解を深める新しい解釈可能性技術を開発する。
論文 参考訳(メタデータ) (2024-11-25T14:37:24Z) - Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.94709351266557]
検索強化に関して,言語モデルの信頼性に焦点をあてる。
検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。
言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文 参考訳(メタデータ) (2024-10-22T09:25:21Z) - Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages [55.157295899188476]
ニューラルマシン翻訳システムは、異なる言語の文を共通の表現空間にマッピングすることを学ぶ。
本研究では、この仮説を未知の言語からのゼロショット翻訳により検証する。
この設定により、全く見えない言語からのゼロショット翻訳が可能になることを実証する。
論文 参考訳(メタデータ) (2024-08-05T07:58:58Z) - It's not Rocket Science : Interpreting Figurative Language in Narratives [48.84507467131819]
我々は2つの非構成的図形言語(イディオムとシミュラ)の解釈を研究する。
実験の結果、事前学習された言語モデルのみに基づくモデルは、これらのタスクにおいて人間よりもはるかにひどい性能を示すことがわかった。
また, 知識強化モデルを提案し, 具体的言語を解釈するための人的戦略を採用した。
論文 参考訳(メタデータ) (2021-08-31T21:46:35Z) - A Computational Framework for Slang Generation [2.1813490315521773]
我々は、スラングコンテキストにおける話者の単語選択をモデル化するフレームワークを開発することにより、スラングの機械生成に向けた最初の一歩を踏み出した。
本フレームワークは,従来の単語のスラング感覚とスラング感覚を関連付けることで,新しいスラングの意味を符号化する。
我々は3つのスラング辞書に対して厳密な評価を行い、我々のアプローチが最先端の言語モデルより優れていることを示す。
論文 参考訳(メタデータ) (2021-02-03T01:19:07Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z) - In search of isoglosses: continuous and discrete language embeddings in
Slavic historical phonology [0.0]
私たちは3種類の言語埋め込み(dense, sigmoid, ストレートスルー)を採用しています。
Sigmoid モデルの言語埋め込みは,従来のスラヴ語のサブグループ化と最強の一致を示している。
論文 参考訳(メタデータ) (2020-05-27T18:10:46Z) - APo-VAE: Text Generation in Hyperbolic Space [116.11974607497986]
本稿では,双曲型潜在空間におけるテキスト生成について検討し,連続的な階層表現を学習する。
適応型ポインケア可変オートエンコーダ (APo-VAE) を提示し, ポインケア球上における潜伏変数の事前および変動後部の両方を包み込み正規分布により定義する。
言語モデリングと対話応答生成における実験は,提案したAPo-VAEモデルの有効性を示す。
論文 参考訳(メタデータ) (2020-04-30T19:05:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。