論文の概要: Deception detection in text and its relation to the cultural dimension
of individualism/collectivism
- arxiv url: http://arxiv.org/abs/2105.12530v1
- Date: Wed, 26 May 2021 13:09:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:31:46.880848
- Title: Deception detection in text and its relation to the cultural dimension
of individualism/collectivism
- Title(参考訳): テキストにおける騙し検出と個人主義・集団主義の文化的次元との関係
- Authors: Katerina Papantoniou, Panagiotis Papadakos, Theodore Patkos, Giorgos
Flouris, Ion Androutsopoulos, Dimitris Plexousakis
- Abstract要約: 本研究は,文化における特定の言語的特徴の活用の相違が,個性主義/選択主義の分断に関して,規範に起因しているかどうかを考察する。
我々は、音韻学、形態学、構文に基づく幅広いn-gram特徴を実験することにより、カルチャー/言語対応分類器を作成する。
我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)から11のデータセットを用いて実験を行った。
- 参考スコア(独自算出の注目度): 6.17866386107486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deception detection is a task with many applications both in direct physical
and in computer-mediated communication. Our focus is on automatic deception
detection in text across cultures. We view culture through the prism of the
individualism/collectivism dimension and we approximate culture by using
country as a proxy. Having as a starting point recent conclusions drawn from
the social psychology discipline, we explore if differences in the usage of
specific linguistic features of deception across cultures can be confirmed and
attributed to norms in respect to the individualism/collectivism divide. We
also investigate if a universal feature set for cross-cultural text deception
detection tasks exists. We evaluate the predictive power of different feature
sets and approaches. We create culture/language-aware classifiers by
experimenting with a wide range of n-gram features based on phonology,
morphology and syntax, other linguistic cues like word and phoneme counts,
pronouns use, etc., and token embeddings. We conducted our experiments over 11
datasets from 5 languages i.e., English, Dutch, Russian, Spanish and Romanian,
from six countries (US, Belgium, India, Russia, Mexico and Romania), and we
applied two classification methods i.e, logistic regression and fine-tuned BERT
models. The results showed that our task is fairly complex and demanding. There
are indications that some linguistic cues of deception have cultural origins,
and are consistent in the context of diverse domains and dataset settings for
the same language. This is more evident for the usage of pronouns and the
expression of sentiment in deceptive language. The results of this work show
that the automatic deception detection across cultures and languages cannot be
handled in a unified manner, and that such approaches should be augmented with
knowledge about cultural differences and the domains of interest.
- Abstract(参考訳): 誤認検出は、直接的物理的およびコンピュータによる通信の両方において多くの応用のタスクである。
私たちの焦点は、文化をまたがるテキストの自動誤認検出です。
我々は文化を個人主義/集団主義の次元のプリズムを通して捉え、国を代理として使うことで文化を近似する。
社会心理学の分野から最近導かれた結論を出発点として,文化をまたがるデセプションの特定の言語的特徴の用法の違いが確認でき,個人主義・集団主義の分断に関して規範に帰着できるかどうかを考察する。
また,異文化間テキストの誤読検出タスクのための普遍的特徴集合が存在するかどうかについても検討する。
我々は,様々な特徴集合とアプローチの予測能力を評価する。
我々は、音韻、形態、構文に基づく幅広いn-gram特徴、単語・音素数、代名詞使用、トークン埋め込みなど他の言語的手がかりを実験することにより、文化・言語認識分類器を作成する。
我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)の11のデータセットを用いて実験を行い、ロジスティック回帰と細調整されたBERTモデルという2つの分類手法を適用した。
その結果,タスクはかなり複雑で,要求も高いことがわかった。
いくつかの言語は文化的な起源を持ち、多様なドメインや同じ言語のデータセット設定の文脈で一致している。
これは代名詞の用法や知覚言語における感情表現においてより顕著である。
本研究の結果,文化と言語をまたいだ誤認の自動検出は,統一的な方法では処理できず,文化の違いや関心領域に関する知識も加えるべきであることが示された。
関連論文リスト
- Investigating Cultural Alignment of Large Language Models [11.730822193746826]
LLM(Large Language Models)は,異なる文化で採用されている多様な知識を真にカプセル化していることを示す。
社会学的調査をシミュレートし、実際の調査参加者のモデル応答を参考として、文化的アライメントの定量化を行う。
本稿では,人類学的推論を活用し,文化的アライメントを高める新しい手法である人類学的プロンプティングを紹介する。
論文 参考訳(メタデータ) (2024-02-20T18:47:28Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Computer Vision Datasets and Models Exhibit Cultural and Linguistic
Diversity in Perception [28.716435050743957]
異なる文化的背景を持つ人々が、同じ視覚刺激を視る場合でも、いかに異なる概念を観察するかを考察する。
同じ画像に対して7つの言語で生成されたテキスト記述を比較することで,意味内容と言語表現に有意な差が認められた。
私たちの研究は、コンピュータビジョンコミュニティにおける人間の知覚の多様性を考慮し、受け入れる必要性に注目しています。
論文 参考訳(メタデータ) (2023-10-22T16:51:42Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Assessing Cross-Cultural Alignment between ChatGPT and Human Societies:
An Empirical Study [9.919972416590124]
ChatGPTは、対話で人間のような反応を生成できるという異常な能力で広く認知されている。
そこで我々は,ChatGPTの文化的背景を,人間の文化的差異を定量化するための質問に対する応答の分析によって検討した。
論文 参考訳(メタデータ) (2023-03-30T15:43:39Z) - EnCBP: A New Benchmark Dataset for Finer-Grained Cultural Background
Prediction in English [25.38572483508948]
文化的背景を持つ自然言語処理モデルを拡張した。
英語を話す5カ国と米国の4州で、言語表現に顕著な違いがあることが示されている。
本研究は,多種多様なNLPタスクに対する文化的背景モデリングの重要性を裏付け,文化関連研究におけるEnCBPの適用性を示すものである。
論文 参考訳(メタデータ) (2022-03-28T04:57:17Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Identifying Distributional Perspective Differences from Colingual Groups [41.58939666949895]
特定の価値観や出来事に対する視点に関する異なるグループ間での相互理解の欠如は、インフォームドな決定や偏見のない意見につながる可能性がある。
本研究では,コリンガル群を研究対象とし,言語コーパスをプロキシとして用いて分布的視点を同定する。
本稿では,共通理解を学習するための新しい計算手法を提案し,その手法を英語,中国語,日本語の文化的認識モデルの構築によって評価する。
論文 参考訳(メタデータ) (2020-04-10T08:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。