論文の概要: Media of Langue: The Interface for Exploring Word Translation Network/Space
- arxiv url: http://arxiv.org/abs/2309.08609v4
- Date: Sat, 26 Oct 2024 08:57:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:13:37.253079
- Title: Media of Langue: The Interface for Exploring Word Translation Network/Space
- Title(参考訳): Media of Langue: 単語翻訳ネットワーク/空間探索のためのインタフェース
- Authors: Goki Muramoto, Atsuki Sato, Takayoshi Koyama,
- Abstract要約: 我々は、これらの相互翻訳の連鎖によって形成される巨大なネットワークを、ワード翻訳ネットワーク(Word Translation Network)として発見する。
本稿では,このネットワークを探索するための新しいインタフェースであるMedia of Langueを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In the human activity of word translation, two languages face each other, mutually searching their own language system for the semantic place of words in the other language. We discover the huge network formed by the chain of these mutual translations as Word Translation Network, a network where words are nodes, and translation volume is represented as edges, and propose Media of Langue, a novel interface for exploring this network. Media of Langue points to the semantic configurations of many words in multiple languages at once, containing the information of existing dictionaries such as bilingual and synonym dictionaries. We have also implemented and published this interface as a web application, focusing on seven language pairs. This paper first defines the Word Translation Network and describes how to actually construct the network from bilingual corpora, followed by an analysis of the properties of the network. Next, we explain how to design a Media of Langue using the Word Translation Network, and finally, we analyze the features of the Media of Langue as a dictionary. Our website is https://www.media-of-langue.org .
- Abstract(参考訳): 単語翻訳の人間的活動では、2つの言語が互いに向かい合って、他言語における単語の意味的な場所をそれぞれ独自の言語システムで検索する。
我々は、これらの相互翻訳の連鎖によって形成される巨大なネットワークを、単語がノードであるネットワークであるWord Translation Networkとして発見し、翻訳ボリュームをエッジとして表現し、このネットワークを探索するための新しいインターフェースであるMedia of Langueを提案する。
ラングのメディアは、バイリンガル辞書や同義辞書のような既存の辞書の情報を含む複数の言語における多くの単語の意味的な構成を一度に指している。
また、このインターフェースを7つの言語ペアに焦点を当てたWebアプリケーションとして実装し、公開しています。
本稿ではまず,Word Translation Networkを定義し,バイリンガルコーパスから実際にネットワークを構築する方法について述べる。
次に、Word Translation Networkを用いてラングのメディアを設計する方法を説明し、最後に、ラングのメディアの特徴を辞書として分析する。
私たちのウェブサイトはhttps://www.media-of-langue.orgです。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages [55.157295899188476]
ニューラルマシン翻訳システムは、異なる言語の文を共通の表現空間にマッピングすることを学ぶ。
本研究では、この仮説を未知の言語からのゼロショット翻訳により検証する。
この設定により、全く見えない言語からのゼロショット翻訳が可能になることを実証する。
論文 参考訳(メタデータ) (2024-08-05T07:58:58Z) - Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.64412090339044]
音声から4つの言語アノテーションを自動抽出するタスクであるWav2Glossを提案する。
音声からのインターリニア・グロッシド・テキスト・ジェネレーションの今後の研究の基盤となる基盤となるものについて述べる。
論文 参考訳(メタデータ) (2024-03-19T21:45:29Z) - Deep Emotions Across Languages: A Novel Approach for Sentiment
Propagation in Multilingual WordNets [4.532887563053358]
本稿では,感傷アノテーションを一部注釈付きWordNetからその全体へ,異なる言語でWordNetへ自動的に伝達する2つの新しい手法を紹介する。
言語間関係の大きい Princeton WordNet と Polish WordNet を用いて,提案した MSSE+CLDNS 法を広範囲に評価した。
以上の結果から,MSSE+CLDNS法は既存の伝搬法よりも優れており,複数の言語にまたがる感情的メタデータを用いたWordNetの強化の有効性が示唆された。
論文 参考訳(メタデータ) (2023-12-07T21:44:14Z) - Automatically constructing Wordnet synsets [2.363388546004777]
本稿では,資源に富む言語と資源に乏しい言語に対して,Wordnetシンセセットを生成する手法を提案する。
提案アルゴリズムは,既存のWordnetの構文を対象言語Tに翻訳し,翻訳候補にランク付け手法を適用してTで最良の翻訳を見つける。
論文 参考訳(メタデータ) (2022-08-08T02:02:18Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Discovering Language-neutral Sub-networks in Multilingual Language
Models [15.94622051535847]
多言語モデルの言語中立性は、これらのモデルの言語エンコードサブネットワーク間の重なり合いの関数である。
mBERTを基礎として、様々な言語やタスクに個別に最適化されたサブネットワークを見つけるために、宝くじの仮説を用いる。
我々は,mBERTは言語ニュートラルなサブネットワークと,複数の補助言語固有のサブネットワークで構成されていると結論付けた。
論文 参考訳(メタデータ) (2022-05-25T11:35:41Z) - Building the Language Resource for a Cebuano-Filipino Neural Machine
Translation System [0.0]
本稿では,CebuanoとFilipinoの平行コーパスを,聖書テキストとWebという2つの異なるドメインから構築する取り組みについて述べる。
聖書資料では、動詞のサブワード単位翻訳と名詞のコピー可能なアプローチが翻訳の不整合を正すために適用された。
Wikipediaでは、ソースとターゲット言語の両方から、一般的に発生するトピックセグメントが抽出された。
論文 参考訳(メタデータ) (2021-10-05T23:03:09Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - On the Effects of Using word2vec Representations in Neural Networks for
Dialogue Act Recognition [0.6767885381740952]
文中の単語列をキャプチャする再帰モデルを探索するディープニューラルネットワークを提案する。
このモデルを英語、フランス語、チェコ語という3つの言語で検証する。
論文 参考訳(メタデータ) (2020-10-22T07:21:17Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。