論文の概要: Media of Langue: The dictionary that visualizes Inter-Lingual Semantic
Network/Space
- arxiv url: http://arxiv.org/abs/2309.08609v3
- Date: Sat, 27 Jan 2024 09:08:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 22:10:55.400382
- Title: Media of Langue: The dictionary that visualizes Inter-Lingual Semantic
Network/Space
- Title(参考訳): Media of Langue: 言語間セマンティックネットワーク/空間を視覚化する辞書
- Authors: Goki Muramoto, Atsuki Sato, Takayoshi Koyama
- Abstract要約: メディア・オブ・ラング(Media of Langue)は、言語間セマンティック・ネットワーク/空間を可視化する新しい辞書である。
このネットワーク/空間を可視化することにより、言語間辞書を一度に多くの単語の意味的な場所を指し示すことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces "Media of Langue," a novel dictionary visualizing
Inter-lingual semantic network/space. Our proposed Inter-lingual semantic
network/space is formed solely from the accumulation of translation practices
between two or more language systems, in contrast to existing semantic
networks/spaces that explicitly use "intra"-lingual relations. By visualizing
this network/space for humans, an Inter-lingual dictionary can be realized that
points to the semantic place of many words at once with a chain of mutual
translation, which also contains the functions of existing dictionaries such as
bilingual and synonym dictionaries. We implemented and published this interface
as a web application, focusing on seven language pairs. In this paper, we first
describe Inter-lingual semantic network/space with its basic features and the
way to develop it from bilingual corpora, then details the design of "Media of
Langue," with a quick analysis and illustrative examples of use cases. Our
website is www.media-of-langue.org. A demonstration video is available at
https://youtu.be/98lXuX4yjsU.
- Abstract(参考訳): 本稿では,言語間セマンティックネットワーク/空間を可視化する新しい辞書である"Media of Langue"を紹介する。
提案する言語間セマンティックネットワーク/空間は、2つ以上の言語システム間の翻訳の慣行の蓄積からのみ形成され、既存の意味ネットワーク/空間は「イントラ」-言語関係を明示的に用いている。
このネットワーク/空間を可視化することにより、バイリンガルや同義語辞書などの既存の辞書の機能を含む相互翻訳の連鎖によって、複数の単語が同時に意味的位置を示す言語間辞書を実現することができる。
私たちはこのインターフェースを7つの言語ペアに焦点を当てたWebアプリケーションとして実装し公開しました。
本稿では,まず言語間意味ネットワークと空間について,その基本的な特徴と,バイリンガルコーパスからそれを開発する方法について述べるとともに,ユースケースの素早い分析と説明例を用いて,"ラングのメディア"の設計を詳述する。
私たちのウェブサイトはwww.media-of-langue.orgです。
デモビデオはhttps://youtu.be/98lXuX4yjsUで公開されている。
関連論文リスト
- Deep Emotions Across Languages: A Novel Approach for Sentiment
Propagation in Multilingual WordNets [4.532887563053358]
本稿では,感傷アノテーションを一部注釈付きWordNetからその全体へ,異なる言語でWordNetへ自動的に伝達する2つの新しい手法を紹介する。
言語間関係の大きい Princeton WordNet と Polish WordNet を用いて,提案した MSSE+CLDNS 法を広範囲に評価した。
以上の結果から,MSSE+CLDNS法は既存の伝搬法よりも優れており,複数の言語にまたがる感情的メタデータを用いたWordNetの強化の有効性が示唆された。
論文 参考訳(メタデータ) (2023-12-07T21:44:14Z) - Beyond Shared Vocabulary: Increasing Representational Word Similarities
across Languages for Multilingual Machine Translation [9.794506112999823]
本稿では,単語等価クラスによる単語レベルの情報伝達経路を定義し,言語間の単語埋め込みを融合するグラフネットワークに依存する。
1) 類似した意味を持つ単語の埋め込みは言語間で整合性がよいこと,2) 提案手法は高・低リソースのMNMTに対して最大2.3ポイントのBLEU改善を実現すること,3) 計算コストの制限により1.0%未満のトレーニング可能なパラメータを必要とすること,である。
論文 参考訳(メタデータ) (2023-05-23T16:11:00Z) - Discovering Language-neutral Sub-networks in Multilingual Language
Models [15.94622051535847]
多言語モデルの言語中立性は、これらのモデルの言語エンコードサブネットワーク間の重なり合いの関数である。
mBERTを基礎として、様々な言語やタスクに個別に最適化されたサブネットワークを見つけるために、宝くじの仮説を用いる。
我々は,mBERTは言語ニュートラルなサブネットワークと,複数の補助言語固有のサブネットワークで構成されていると結論付けた。
論文 参考訳(メタデータ) (2022-05-25T11:35:41Z) - Examining Cross-lingual Contextual Embeddings with Orthogonal Structural
Probes [0.2538209532048867]
オルソゴン構造プローブ(Limisiewicz and Marevcek, 2021)では、特定の言語的特徴についてこの疑問に答えることができる。
InmBERTの文脈表現を符号化した構文(UD)と語彙(WordNet)構造情報を9つの多言語で評価した。
ゼロショットと少数ショットのクロスランガル構文解析にこの結果を適用した。
論文 参考訳(メタデータ) (2021-09-10T15:03:11Z) - Transferring Knowledge Distillation for Multilingual Social Event
Detection [42.663309895263666]
最近発表されたグラフニューラルネットワーク(GNN)は、ソーシャルイベント検出タスクにおける有望なパフォーマンスを示している。
本稿では,多言語データストリーム中の事象を検出するために,言語間単語埋め込みを組み込んだGNNを提案する。
合成データセットと実世界のデータセットの両方の実験では、多言語データとトレーニングサンプルが不足している言語の両方において、検出に非常に効果的なフレームワークが示されている。
論文 参考訳(メタデータ) (2021-08-06T12:38:42Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - Vokenization: Improving Language Understanding with Contextualized,
Visual-Grounded Supervision [110.66085917826648]
我々は,言語トークンを関連画像に文脈的にマッピングすることで,言語のみのデータに対するマルチモーダルアライメントを補間する手法を開発した。
語彙化」は比較的小さな画像キャプションデータセットに基づいて訓練され、それを大規模言語コーパスのための語彙生成に適用する。
これらの文脈的に生成された語彙を用いて学習し、視覚的に制御された言語モデルにより、複数の純粋言語タスクにおいて、自己教師による代替よりも一貫した改善が示される。
論文 参考訳(メタデータ) (2020-10-14T02:11:51Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - On the Language Neutrality of Pre-trained Multilingual Representations [70.93503607755055]
語彙意味論に関して,多言語文脈埋め込みの言語中立性を直接的に検討する。
その結果、文脈埋め込みは言語ニュートラルであり、概して静的な単語型埋め込みよりも情報的であることがわかった。
本稿では,言語識別における最先端の精度に到達し,並列文の単語アライメントのための統計的手法の性能を一致させる方法について述べる。
論文 参考訳(メタデータ) (2020-04-09T19:50:32Z) - Visual Grounding in Video for Unsupervised Word Translation [91.47607488740647]
我々は、言語間の教師なし単語マッピングを改善するために、視覚的接地を用いる。
ネイティブ言語でナレーションされた無人の教育ビデオから埋め込みを学習する。
これらの手法を英語からフランス語、韓国語、日本語への翻訳に適用する。
論文 参考訳(メタデータ) (2020-03-11T02:03:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。