論文の概要: Developing a Comprehensive Framework for Sentiment Analysis in Turkish
- arxiv url: http://arxiv.org/abs/2512.00515v1
- Date: Sat, 29 Nov 2025 15:14:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.273571
- Title: Developing a Comprehensive Framework for Sentiment Analysis in Turkish
- Title(参考訳): トルコにおける総合的感性分析フレームワークの開発
- Authors: Cem Rifki Aydin,
- Abstract要約: この論文は、2020年7月時点でトルコの感情分析に関する最も詳細に総合的な研究であると考えられる。
我々は、トルコを中心に多くの側面を考慮に入れた感情分析のための包括的枠組みを開発した。
トルコ語と英語の両方の感情、構文、意味、語彙的特徴を利用する新しい単語埋め込みを構築しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this thesis, we developed a comprehensive framework for sentiment analysis that takes its many aspects into account mainly for Turkish. We have also proposed several approaches specific to sentiment analysis in English only. We have accordingly made five major and three minor contributions. We generated a novel and effective feature set by combining unsupervised, semi-supervised, and supervised metrics. We then fed them as input into classical machine learning methods, and outperformed neural network models for datasets of different genres in both Turkish and English. We created a polarity lexicon with a semi-supervised domain-specific method, which has been the first approach applied for corpora in Turkish. We performed a fine morphological analysis for the sentiment classification task in Turkish by determining the polarities of morphemes. This can be adapted to other morphologically-rich or agglutinative languages as well. We have built a novel neural network architecture, which combines recurrent and recursive neural network models for English. We built novel word embeddings that exploit sentiment, syntactic, semantic, and lexical characteristics for both Turkish and English. We also redefined context windows as subclauses in modelling word representations in English. This can also be applied to other linguistic fields and natural language processing tasks. We have achieved state-of-the-art and significant results for all these original approaches. Our minor contributions include methods related to aspect-based sentiment in Turkish, parameter redefinition in the semi-supervised approach, and aspect term extraction techniques for English. This thesis can be considered the most detailed and comprehensive study made on sentiment analysis in Turkish as of July, 2020. Our work has also contributed to the opinion classification problem in English.
- Abstract(参考訳): 本論文では、トルコ語を中心に多くの側面を考慮に入れた感情分析のための包括的枠組みを開発した。
また、英語のみの感情分析に特有ないくつかのアプローチを提案している。
5つの主要な貢献と3つの小さな貢献をした。
我々は、教師なし、半教師なし、および教師なしのメトリクスを組み合わせることで、新しく効果的な特徴セットを生成した。
そして、それらを古典的な機械学習手法への入力として与え、トルコ語と英語の異なるジャンルのデータセットのニューラルネットワークモデルよりも優れています。
我々は、トルコで初めてコーパスに適用された半教師付きドメイン固有手法による極性レキシコンを作成した。
トルコ語における感情分類課題について,形態素の極性を決定することによって詳細な形態素解析を行った。
これは他の形態学的に豊かな言語や凝集性言語にも適用できる。
我々は、再帰的ニューラルネットワークモデルと再帰的ニューラルネットワークモデルを組み合わせた、新しいニューラルネットワークアーキテクチャを構築した。
トルコ語と英語の両方の感情、構文、意味、語彙的特徴を利用する新しい単語埋め込みを構築しました。
また、文脈ウィンドウを、英語で単語表現をモデル化する際のサブクラスとして再定義した。
これは他の言語分野や自然言語処理にも応用できる。
これらのアプローチのすべてに対して、最先端で重要な成果を上げました。
トルコ語におけるアスペクトベース感情に関連する手法,半教師付きアプローチにおけるパラメータ再定義,および英語のアスペクト項抽出技術などについて検討した。
この論文は、2020年7月時点でトルコの感情分析に関する最も詳細に総合的な研究であると考えられる。
私たちの研究は、英語の意見分類問題にも貢献しています。
関連論文リスト
- Cetvel: A Unified Benchmark for Evaluating Language Understanding, Generation and Cultural Capacity of LLMs for Turkish [9.111556632499472]
Cetvelはトルコの大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
トルコ語の言語的・文化的豊かさを反映したコンテンツを確保するための差別的・生成的なタスクを幅広く組み合わせている。
論文 参考訳(メタデータ) (2025-08-22T14:42:50Z) - Evaluating Contextualized Representations of (Spanish) Ambiguous Words: A New Lexical Resource and Empirical Analysis [2.2530496464901106]
スペイン語の単言語モデルと多言語BERTモデルを用いて、文脈におけるスペイン語のあいまいな名詞の意味表現を評価する。
様々な BERT ベースの LM の文脈的意味表現は、人間の判断に多少の違いがあるが、ヒトのベンチマークには及ばない。
論文 参考訳(メタデータ) (2024-06-20T18:58:11Z) - A Comprehensive Analysis of Static Word Embeddings for Turkish [0.058520770038704165]
基本的には、非文脈的(静的)モデルと文脈的モデルである2種類の単語埋め込みモデルが存在する。
トルコ語における内在的・外在的評価設定における文脈的・非文脈的モデルの性能の比較と評価を行った。
分析の結果は、異なるタイプのNLPタスクにおける異なる埋め込みモデルの適合性に関する洞察を与える。
論文 参考訳(メタデータ) (2024-05-13T14:23:37Z) - Holmes: A Benchmark to Assess the Linguistic Competence of Language Models [59.627729608055006]
言語モデル(LM)の言語能力を評価するための新しいベンチマークであるHolmesを紹介する。
我々は、計算に基づく探索を用いて、異なる言語現象に関するLMの内部表現を調べる。
その結果,近年,他の認知能力からLMの言語能力を引き離す声が上がっている。
論文 参考訳(メタデータ) (2024-04-29T17:58:36Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Sentiment Analysis with Contextual Embeddings and Self-Attention [3.0079490585515343]
自然言語では、単語や句の意図された意味はしばしば暗黙的であり、文脈に依存する。
本稿では,文脈埋め込みと自己認識機構を用いた感情分析の簡易かつ効果的な手法を提案する。
形態学的にリッチなポーランド語とドイツ語を含む3つの言語の実験結果から、我々のモデルは最先端のモデルに匹敵するか、さらに優れています。
論文 参考訳(メタデータ) (2020-03-12T02:19:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。