Fugu-MT 論文翻訳(概要): Deception detection in text and its relation to the cultural dimension of individualism/collectivism

論文の概要: Deception detection in text and its relation to the cultural dimension of individualism/collectivism

arxiv url: http://arxiv.org/abs/2105.12530v1
Date: Wed, 26 May 2021 13:09:47 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-27 13:31:46.880848
Title: Deception detection in text and its relation to the cultural dimension of individualism/collectivism
Title（参考訳）: テキストにおける騙し検出と個人主義・集団主義の文化的次元との関係
Authors: Katerina Papantoniou, Panagiotis Papadakos, Theodore Patkos, Giorgos Flouris, Ion Androutsopoulos, Dimitris Plexousakis
Abstract要約: 本研究は,文化における特定の言語的特徴の活用の相違が,個性主義/選択主義の分断に関して,規範に起因しているかどうかを考察する。我々は、音韻学、形態学、構文に基づく幅広いn-gram特徴を実験することにより、カルチャー/言語対応分類器を作成する。我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)から11のデータセットを用いて実験を行った。
参考スコア（独自算出の注目度）: 6.17866386107486
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deception detection is a task with many applications both in direct physical and in computer-mediated communication. Our focus is on automatic deception detection in text across cultures. We view culture through the prism of the individualism/collectivism dimension and we approximate culture by using country as a proxy. Having as a starting point recent conclusions drawn from the social psychology discipline, we explore if differences in the usage of specific linguistic features of deception across cultures can be confirmed and attributed to norms in respect to the individualism/collectivism divide. We also investigate if a universal feature set for cross-cultural text deception detection tasks exists. We evaluate the predictive power of different feature sets and approaches. We create culture/language-aware classifiers by experimenting with a wide range of n-gram features based on phonology, morphology and syntax, other linguistic cues like word and phoneme counts, pronouns use, etc., and token embeddings. We conducted our experiments over 11 datasets from 5 languages i.e., English, Dutch, Russian, Spanish and Romanian, from six countries (US, Belgium, India, Russia, Mexico and Romania), and we applied two classification methods i.e, logistic regression and fine-tuned BERT models. The results showed that our task is fairly complex and demanding. There are indications that some linguistic cues of deception have cultural origins, and are consistent in the context of diverse domains and dataset settings for the same language. This is more evident for the usage of pronouns and the expression of sentiment in deceptive language. The results of this work show that the automatic deception detection across cultures and languages cannot be handled in a unified manner, and that such approaches should be augmented with knowledge about cultural differences and the domains of interest.
Abstract（参考訳）: 誤認検出は、直接的物理的およびコンピュータによる通信の両方において多くの応用のタスクである。私たちの焦点は、文化をまたがるテキストの自動誤認検出です。我々は文化を個人主義/集団主義の次元のプリズムを通して捉え、国を代理として使うことで文化を近似する。社会心理学の分野から最近導かれた結論を出発点として,文化をまたがるデセプションの特定の言語的特徴の用法の違いが確認でき,個人主義・集団主義の分断に関して規範に帰着できるかどうかを考察する。また,異文化間テキストの誤読検出タスクのための普遍的特徴集合が存在するかどうかについても検討する。我々は,様々な特徴集合とアプローチの予測能力を評価する。我々は、音韻、形態、構文に基づく幅広いn-gram特徴、単語・音素数、代名詞使用、トークン埋め込みなど他の言語的手がかりを実験することにより、文化・言語認識分類器を作成する。我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)の11のデータセットを用いて実験を行い、ロジスティック回帰と細調整されたBERTモデルという2つの分類手法を適用した。その結果,タスクはかなり複雑で,要求も高いことがわかった。いくつかの言語は文化的な起源を持ち、多様なドメインや同じ言語のデータセット設定の文脈で一致している。これは代名詞の用法や知覚言語における感情表現においてより顕著である。本研究の結果,文化と言語をまたいだ誤認の自動検出は,統一的な方法では処理できず,文化の違いや関心領域に関する知識も加えるべきであることが示された。

関連論文リスト

Do Large Language Models Truly Understand Cross-cultural Differences? [53.481048019144644]
我々は,大規模言語モデルの異文化間理解と推論を評価するシナリオベースのベンチマークを開発した。文化理論を基礎として、異文化の能力を9次元に分類する。データセットは連続的な拡張をサポートし、実験は他の言語への転送可能性を確認する。
論文参考訳（メタデータ） (2025-12-08T01:21:58Z)
Where Culture Fades: Revealing the Cultural Gap in Text-to-Image Generation [43.352493955825736]
現在のT2Iモデルは、多言語的なプロンプトの下で、文化的に中立な結果や英語に偏った結果をもたらすことが多い。本稿では,培養感受性シグナルを少数の固定層内の小さなニューロン群に局在させる探索法を提案する。
論文参考訳（メタデータ） (2025-11-21T14:40:50Z)
Language over Content: Tracing Cultural Understanding in Multilingual Large Language Models [10.798925500517823]
内部パスは、異国語、異国語、異国語、異国語、異国語で重複する。その結果,同言語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,異国語,
論文参考訳（メタデータ） (2025-10-18T16:19:45Z)
MAKIEval: A Multilingual Automatic WiKidata-based Framework for Cultural Awareness Evaluation for LLMs [26.806566827956875]
MAKIEvalは、大規模言語モデルにおける文化的認識を評価するための自動多言語フレームワークである。モデル出力における文化的実体を自動的に識別し、構造化された知識にリンクする。オープンソースのシステムとプロプライエタリシステムの両方を対象とする,世界のさまざまな場所で開発された7つのLLMを評価した。
論文参考訳（メタデータ） (2025-05-27T19:29:40Z)
GlobalMood: A cross-cultural benchmark for music emotion recognition [10.490374578193773]
「GlobalMood」は59か国から1180曲をサンプリングした異文化間ベンチマークデータセットである。文化的に特定の音楽関連感情用語を抽出するためのボトムアップ・参加者主導のアプローチを実装した。
論文参考訳（メタデータ） (2025-05-14T16:32:45Z)
Crossing Boundaries: Leveraging Semantic Divergences to Explore Cultural Novelty in Cooking Recipes [4.276697874428501]
社会的要因、特に文化的背景は、新規性と革新に対する認識に大きな影響を及ぼす。文化的ノベルティは、異なるコミュニティ間の距離によって形成されたサリエンスとノベルティの相違から生じる。本稿では,社会学と経営学の知識を統合する学際的枠組みを提案する。
論文参考訳（メタデータ） (2025-03-31T12:52:52Z)
JiraiBench: A Bilingual Benchmark for Evaluating Large Language Models' Detection of Human Self-Destructive Behavior Content in Jirai Community [9.492476871323763]
本稿では,大規模言語モデルによる自己破壊的コンテンツ検出の有効性を評価するための,最初のバイリンガルベンチマークである JiraiBench を紹介する。我々は,薬物過剰摂取,摂食障害,自傷など多種の自己破壊行動を含む,全国的な地雷オンラインサブカルチャーに注目した。本データセットは,3つの行動カテゴリーに沿って,多次元アノテーションを用いた10,419の中国語投稿と5000の日本語投稿からなる。
論文参考訳（メタデータ） (2025-03-27T16:48:58Z)
Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文参考訳（メタデータ） (2024-06-17T14:03:27Z)
CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark [68.21939124278065]
言語と文化の豊富なセットをカバーするために設計された、文化的に多言語なビジュアル質問回答ベンチマーク。 CVQAには文化的に駆動されたイメージと、4大陸30カ国の質問が含まれ、31の言語と13のスクリプトをカバーし、合計10万の質問を提供する。 CVQA上で複数のマルチモーダル大言語モデル (MLLM) をベンチマークし、現在の最先端モデルではデータセットが困難であることを示す。
論文参考訳（メタデータ） (2024-06-10T01:59:00Z)
CIVICS: Building a Dataset for Examining Culturally-Informed Values in Large Language Models [59.22460740026037]
大規模言語モデル(LLM)の社会的・文化的変動を評価するためのデータセット「CIVICS:文化インフォームド・バリュース・インクルーシブ・コーパス・フォー・ソシエティ・インパクト」我々は、LGBTQIの権利、社会福祉、移民、障害権利、代理など、特定の社会的に敏感なトピックに対処する、手作りの多言語プロンプトのデータセットを作成します。
論文参考訳（メタデータ） (2024-05-22T20:19:10Z)
The Echoes of Multilinguality: Tracing Cultural Value Shifts during LM Fine-tuning [23.418656688405605]
本研究では, 異なるテスト言語で符号化された文化的価値に言語がどのように影響するかを, 微調整時にどのように修正されるかを検討する。最後に、トレーニングデータ属性法を用いて、微調整の例やそれらが生み出す言語にパターンを見つける。
論文参考訳（メタデータ） (2024-05-21T12:55:15Z)
Investigating Cultural Alignment of Large Language Models [10.738300803676655]
LLM(Large Language Models)は,異なる文化で採用されている多様な知識を真にカプセル化していることを示す。社会学的調査をシミュレートし、実際の調査参加者のモデル応答を参考として、文化的アライメントの定量化を行う。本稿では,人類学的推論を活用し,文化的アライメントを高める新しい手法である人類学的プロンプティングを紹介する。
論文参考訳（メタデータ） (2024-02-20T18:47:28Z)
Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文参考訳（メタデータ） (2024-02-14T18:16:54Z)
Computer Vision Datasets and Models Exhibit Cultural and Linguistic Diversity in Perception [28.716435050743957]
異なる文化的背景を持つ人々が、同じ視覚刺激を視る場合でも、いかに異なる概念を観察するかを考察する。同じ画像に対して7つの言語で生成されたテキスト記述を比較することで,意味内容と言語表現に有意な差が認められた。私たちの研究は、コンピュータビジョンコミュニティにおける人間の知覚の多様性を考慮し、受け入れる必要性に注目しています。
論文参考訳（メタデータ） (2023-10-22T16:51:42Z)
Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。 Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文参考訳（メタデータ） (2023-05-25T15:30:31Z)
Assessing Cross-Cultural Alignment between ChatGPT and Human Societies: An Empirical Study [9.919972416590124]
ChatGPTは、対話で人間のような反応を生成できるという異常な能力で広く認知されている。そこで我々は,ChatGPTの文化的背景を,人間の文化的差異を定量化するための質問に対する応答の分析によって検討した。
論文参考訳（メタデータ） (2023-03-30T15:43:39Z)
AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文参考訳（メタデータ） (2021-04-17T20:23:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。