論文の概要: DECO-MWE: building a linguistic resource of Korean multiword expressions for feature-based sentiment analysis
- arxiv url: http://arxiv.org/abs/2605.10295v1
- Date: Mon, 11 May 2026 09:54:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.712962
- Title: DECO-MWE: building a linguistic resource of Korean multiword expressions for feature-based sentiment analysis
- Title(参考訳): DECO-MWE:特徴に基づく感情分析のための韓国語多語表現の言語資源の構築
- Authors: Jaeho Han, Changhoe Hwang, Seongyong Choi, Gwanghoon Yoo, Eric Laporte, Jeesun Nam,
- Abstract要約: 本稿では,韓国語多語表現の言語資源をFBSA(FBSA: DECO-MWE)に構築することを目的とする。
DECO-MWEは有限状態変換器として形式化され、MWEの語彙とシンタクティックの制約を表す。
DECO-MWEの回収性能はテストコーパスで0.806fであった。
- 参考スコア(独自算出の注目度): 0.34891835983047065
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper aims to construct a linguistic resource of Korean Multiword Expressions for Feature-Based Sentiment Analysis (FBSA): DECO-MWE. Dealing with multiword expressions (MWEs) has been a critical issue in FBSA since many constructs reveal lexical idiosyncrasy. To construct linguistic resources of sentiment MWEs efficiently, we utilize the Local Grammar Graph (LGG) methodology: DECO-MWE is formalized as a Finite-State Transducer that represents lexical-syntactic restrictions on MWEs. In this study, we built a corpus of cosmetics review texts, which show particularly frequent occurrences of MWEs. Based on an empirical examination of the corpus, four types of MWEs have been distinguished. The DECO-MWE thus covers the following four categories: Standard Polarity MWEs (SMWEs), Domain-Dependent Polarity MWEs (DMWEs), Compound Named Entity MWEs (EMWEs) and Compound Feature MWEs (FMWEs). The retrieval performance of the DECO-MWE shows 0.806 f-measure in the test corpus. This study brings a twofold outcome: first, a sizeable general-purpose polarity MWE lexicon, which may be broadly used in FBSA; second, a finite-state methodology adopted in this study to treat domain-dependent MWEs such as idiosyncratic polarity expressions, named entity expressions or feature expressions, and which may be reused in describing linguistic properties of other corpus domains.
- Abstract(参考訳): 本稿では,韓国語多語表現の言語資源をFBSA(FBSA: DECO-MWE)に構築することを目的とする。
マルチワード表現 (MWEs) を用いたディーリングは、多くの構文が語彙的慣用性を明らかにするため、FBSAにおいて重要な問題となっている。
感情MWEの言語資源を効率的に構築するために,我々はローカル文法グラフ (LGG) 手法を利用する: DECO-MWE はMWEの語彙・シンタクティック制約を表す有限状態変換器として形式化される。
本研究では化粧品レビューテキストのコーパスを構築し,特にMWEの発生頻度が高いことを示した。
コーパスを実証的に検討した結果,4種類のMWEが同定された。
DECO-MWEは、標準極性MWE(SMWEs)、ドメイン依存極性MWE(DMWEs)、複合名前エンティティMWE(EMWEs)、複合特徴MWE(FMWEs)の4つのカテゴリをカバーしている。
DECO-MWEの回収性能はテストコーパスで0.806fであった。
第一に、FBSAで広く用いられる可能性がある汎用極性MWEレキシコン、第二に、イディオシントラティック極性表現、名前付きエンティティ表現、特徴表現などのドメイン依存MWEを扱い、他のコーパスドメインの言語特性を記述する際に再利用できる有限状態方法論である。
関連論文リスト
- Revisiting a Pain in the Neck: A Semantic Reasoning Benchmark for Language Models [13.378248521935191]
本稿ではセマンティックQAを提案する。セマンティックQAは意味句処理タスクにおいて言語モデル(LM)を評価するために設計された評価スイートである。
このベンチマークは、既存のマルチワード表現リソースを統合し、それらを統合テストベッドに再編成する。
語彙的コロケーションのような一般的な語彙的現象と、慣用的な表現、名詞的な化合物、動詞的な構成の3つのきめ細かいカテゴリをカバーしている。
論文 参考訳(メタデータ) (2026-04-17T17:56:21Z) - CoAM: Corpus of All-Type Multiword Expressions [21.451123924562598]
CoAMは、データ品質を向上させるために多段階プロセスを通じて構築された1.3K文のデータセットである。
MWE識別のデータセットで初めて、CoAMのMWEはNounやVerbといった型でタグ付けされ、きめ細かいエラー解析を可能にする。
論文 参考訳(メタデータ) (2024-12-24T04:09:33Z) - A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - "You Are An Expert Linguistic Annotator": Limits of LLMs as Analyzers of
Abstract Meaning Representation [60.863629647985526]
文意味構造の解析において, GPT-3, ChatGPT, および GPT-4 モデルの成功と限界について検討した。
モデルはAMRの基本形式を確実に再現でき、しばしばコアイベント、引数、修飾子構造をキャプチャできる。
全体としては,これらのモデルではセマンティック構造の側面を捉えることができるが,完全に正確なセマンティック解析や解析をサポートする能力には重要な制限が残されている。
論文 参考訳(メタデータ) (2023-10-26T21:47:59Z) - Retrofitting Multilingual Sentence Embeddings with Abstract Meaning
Representation [70.58243648754507]
抽象的意味表現(AMR)を用いた既存の多言語文の埋め込みを改善する新しい手法を提案する。
原文入力と比較すると、AMRは文の中核概念と関係を明確かつ曖昧に表す構造的意味表現である。
実験結果から,多言語文をAMRで埋め込むと,意味的類似性と伝達タスクの両方において,最先端の性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-10-18T11:37:36Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Extracting Headless MWEs from Dependency Parse Trees: Parsing, Tagging,
and Joint Modeling Approaches [25.981620411958602]
興味深い、頻繁なマルチワード式(MWE)は、ヘッドレスMWEである。
現在の依存性アノテーション方式では、内部ヘッドのように平らな構造を扱わなければならない。
我々は、フラットなMWEを予測するために、これらの2つの一般的な戦略、パーシングとタグ付けを経験的に比較した。
論文 参考訳(メタデータ) (2020-05-06T18:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。