論文の概要: Multidimensional scaling and linguistic theory
- arxiv url: http://arxiv.org/abs/2012.04946v2
- Date: Sat, 13 Mar 2021 14:20:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 11:28:28.964299
- Title: Multidimensional scaling and linguistic theory
- Title(参考訳): 多次元スケーリングと言語理論
- Authors: Martijn van der Klis and Jos Tellings
- Abstract要約: 本稿では,多次元スケーリング(MDS)技術の言語研究における意味地図作成への応用について述べる。
MDSは、オブジェクトを空間内の点として表現する統計的手法であり、オブジェクト間の近接類似性は、表現内の対応するポイント間の近接距離に対応する。
- 参考スコア(独自算出の注目度): 0.10152838128195464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper reports on the state-of-the-art in the application of
multidimensional scaling (MDS) techniques to create semantic maps in linguistic
research. MDS refers to a statistical technique that represents objects
(lexical items, linguistic contexts, languages, etc.) as points in a space so
that close similarity between the objects corresponds to close distances
between the corresponding points in the representation. We focus on the recent
trend to apply MDS to parallel corpus data in order to investigate a certain
linguistic phenomenon from a cross-linguistic perspective.
We first introduce the mathematical foundations of MDS, intended for
non-experts, so that readers understand notions such as 'eigenvalues',
'dimensionality reduction', 'stress values', etc. as they appear in linguistic
MDS writing.
We then give an exhaustive overview of past research that employs MDS
techniques in combination with parallel corpus data, and propose a set of
terminology to succinctly describe the key parameters of a particular MDS
application. We go over various research questions that have been answered with
the aid of MDS maps, showing that the methodology covers topics in a spectrum
ranging from classic typology (e.g. language classification) to formal
linguistics (e.g. study of a phenomenon in a single language).
We finally identify two lines of future research that build on the insights
of earlier MDS research described in the paper. First, we envisage the use of
MDS in the investigation of cross-linguistic variation of compositional
structures, an important area in variation research that has not been
approached by parallel corpus work yet. Second, we discuss how MDS can be
complemented and compared with other dimensionality reduction techniques that
have seen little use in the linguistic domain so far.
- Abstract(参考訳): 本稿では,多次元スケーリング(MDS)技術の言語研究における意味地図作成への応用について述べる。
MDSは、オブジェクト(語彙項目、言語コンテキスト、言語など)を表す統計技術を指す。
空間内の点として、オブジェクト間の密接な類似性は、表現中の対応する点間の近接距離に対応する。
言語横断的な視点から特定の言語現象を研究するために,MDSを並列コーパスデータに適用する最近の傾向に注目した。
まず,非専門家を対象としたMDSの数学的基礎を紹介し,「固有値」,「次元化」,「ストレス値」などの概念を読者が理解できるようにする。
言語 MDS の文章に現れる。
次に, 並列コーパスデータと組み合わせたMDS技術を用いた過去の研究の概要を概観し, 特定のMDSアプリケーションのキーパラメータを簡潔に記述するための用語セットを提案する。
我々はMDSマップの助けを借りて回答された様々な研究課題について検討し、この方法論が古典型学(例)から幅広い分野のトピックをカバーしていることを示す。
言語分類) 形式言語学(例えば、英語)
一つの言語における現象の研究)。
論文で紹介されたMDS研究の知見に基づいて、今後2つの研究の行を最終的に特定する。
まず, 並列コーパス研究にはまだアプローチされていない変分研究における重要な領域である構成構造の言語間差異の調査におけるMDSの利用を検討する。
第2に,これまでの言語領域ではほとんど使われていない他の次元縮小手法と比較して,mdsの補完方法について考察する。
関連論文リスト
- Large Language Models as Neurolinguistic Subjects: Identifying Internal Representations for Form and Meaning [49.60849499134362]
本研究では,大言語モデル(LLM)の記号化(形式)および記号化(意味)に関する言語的理解について検討する。
伝統的な精神言語学的評価は、しばしばLSMの真の言語能力を誤って表現する統計バイアスを反映している。
ミニマルペアと診断プローブを組み合わせてモデル層間のアクティベーションパターンを解析する新しい手法を用いて,ニューロ言語学的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-12T04:16:44Z) - Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Moving beyond word lists: towards abstractive topic labels for
human-like topics of scientific documents [0.0]
抽象的多文書要約(MDS)を用いたヒューマンライクなトピックラベル生成手法を提案する。
我々は、トピックラベリングのためのMDSを完全に運用するために、どのような研究が必要なのかを理解するために、引用文でトピックをモデル化する。
論文 参考訳(メタデータ) (2022-10-28T17:47:12Z) - Integrating Language Guidance into Vision-based Deep Metric Learning [78.18860829585182]
埋め込み空間として意味的類似性を符号化した距離空間を学習することを提案する。
これらの空間は、トレーニング中に見られるもの以外のクラスに転送可能であるべきである。
これにより、学習された埋め込み空間は不完全な意味的コンテキストを符号化し、クラス間の意味的関係を誤って表現する。
論文 参考訳(メタデータ) (2022-03-16T11:06:50Z) - A cognitively driven weighted-entropy model for embedding semantic
categories in hyperbolic geometry [0.0]
双曲幾何学に意味圏を埋め込むための教師なしおよび認知駆動型重み付きエントロピー法を提案する。
以上の結果から,この手法は,英語における基本色と血統語の大部分に対して,人気と類似性のセマンティックな関係をモデル化し,マッピングすることが可能であることが示唆された。
論文 参考訳(メタデータ) (2021-12-13T18:33:45Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - EDS-MEMBED: Multi-sense embeddings based on enhanced distributional
semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。
M-SEの新たな分布意味類似度測定法を先行して導出する。
WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文 参考訳(メタデータ) (2021-02-27T14:36:55Z) - Filtered Inner Product Projection for Crosslingual Embedding Alignment [28.72288652451881]
フィルタ内積投影(FIPP)は、埋め込みを共通表現空間にマッピングする手法である。
FIPPは、ソースとターゲットの埋め込みが異なる次元である場合でも適用可能である。
提案手法は,MUSEデータセット上の既存の手法よりも,様々な言語ペアに対して優れていることを示す。
論文 参考訳(メタデータ) (2020-06-05T19:53:30Z) - A Matter of Framing: The Impact of Linguistic Formalism on Probing
Results [69.36678873492373]
BERT (Delvin et al.) のような事前訓練されたコンテキスト化エンコーダは、下流タスクで顕著なパフォーマンスを示す。
調査における最近の研究は、事前学習中にこれらのモデルによって暗黙的に学習された言語知識について調査している。
形式主義の選択は調査結果に影響を及ぼすか?
BERTによる意味的役割情報とプロトロール情報のエンコーディングにおける言語学的意義の相違は,形式主義に依存している。
論文 参考訳(メタデータ) (2020-04-30T17:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。