論文の概要: Measuring cross-language intelligibility between Romance languages with computational tools
- arxiv url: http://arxiv.org/abs/2602.07447v1
- Date: Sat, 07 Feb 2026 08:54:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.627865
- Title: Measuring cross-language intelligibility between Romance languages with computational tools
- Title(参考訳): 計算ツールを用いたロマンス語間の言語間インテリジェンスの測定
- Authors: Liviu P Dinu, Ana Sabina Uban, Bogdan Iordache, Anca Dinu, Simona Georgescu,
- Abstract要約: 本稿では,関係する単語の表面的類似度と意味的類似度を用いて,語彙的類似度に基づいて不明瞭度を推定する新しい指標を提案する。
単語の正書法と音韻法の両方の形式と、異なるパラレルコーパスと単語の意味表現のベクトルモデルを用いて結果を比較する。
得られたインテリジェンススコアは、言語間でのインテリジェンス非対称性に関連する直感を確認し、人間の実験におけるクローゼテストの結果と大きく相関した。
- 参考スコア(独自算出の注目度): 4.999600686499554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an analysis of mutual intelligibility in related languages applied for languages in the Romance family. We introduce a novel computational metric for estimating intelligibility based on lexical similarity using surface and semantic similarity of related words, and use it to measure mutual intelligibility for the five main Romance languages (French, Italian, Portuguese, Spanish, and Romanian), and compare results using both the orthographic and phonetic forms of words as well as different parallel corpora and vectorial models of word meaning representation. The obtained intelligibility scores confirm intuitions related to intelligibility asymmetry across languages and significantly correlate with results of cloze tests in human experiments.
- Abstract(参考訳): ロマンス語族における言語に適用される関連言語における相互の知性の分析について述べる。
関係語の表面的・意味的類似性を用いた語彙的類似性に基づく理解度を推定するための新しい計算基準を導入し,それを用いて,5つの主要なロマンス語(フランス語,イタリア語,ポルトガル語,スペイン語,ルーマニア語)の相互信頼度を測定し,単語の正書法および音声的形式と,異なるパラレルコーパスおよびベクトル的表現モデルを用いて結果を比較する。
得られたインテリジェンススコアは、言語間でのインテリジェンス非対称性に関連する直感を確認し、人間の実験におけるクローゼテストの結果と大きく相関した。
関連論文リスト
- Exploring language relations through syntactic distances and geographic proximity [0.4369550829556578]
ユニバーサル依存データセットから抽出した音声の一連の部分(POS)を用いて言語間距離を探索する。
特定の形態的類型によって説明される例外を除いて、よく知られた言語族やグループに対応する定型クラスタが見つかる。
論文 参考訳(メタデータ) (2024-03-27T10:36:17Z) - A Computational Model for the Assessment of Mutual Intelligibility Among
Closely Related Languages [1.5773159234875098]
密接に関連する言語は、ある言語の話者が積極的に学習することなく他の言語の話者を理解することができる言語類似性を示す。
相互の知性は程度によって異なり、典型的には精神言語実験でテストされる。
本稿では,人間による言語学習の認知過程を近似するために,線形識別学習システムを用いたコンピュータ支援手法を提案する。
論文 参考訳(メタデータ) (2024-02-05T11:32:13Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Utilizing Wordnets for Cognate Detection among Indian Languages [50.83320088758705]
ヒンディー語と10のインド諸語間の単語対を検出する。
深層学習手法を用いて単語対が共生か否かを予測する。
性能は最大26%向上した。
論文 参考訳(メタデータ) (2021-12-30T16:46:28Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Discrete representations in neural models of spoken language [56.29049879393466]
音声言語の弱教師付きモデルの文脈における4つの一般的なメトリクスの利点を比較した。
異なる評価指標が矛盾する結果をもたらすことが分かりました。
論文 参考訳(メタデータ) (2021-05-12T11:02:02Z) - Exploiting Non-Taxonomic Relations for Measuring Semantic Similarity and
Relatedness in WordNet [0.0]
本稿では,WordNetナレッジグラフなどの大規模リンクデータにおいて,あらゆる種類の非トキソノミック関係を利用する利点について検討する。
本稿では,新しい関係に基づく情報内容と非タキソノミックな重み付き経路に基づく総合的多関係手法を提案する。
論文 参考訳(メタデータ) (2020-06-22T09:59:39Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。
実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文 参考訳(メタデータ) (2020-04-29T03:34:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。