論文の概要: Can Deception Detection Go Deeper? Dataset, Evaluation, and Benchmark for Deception Reasoning
- arxiv url: http://arxiv.org/abs/2402.11432v2
- Date: Mon, 17 Jun 2024 02:57:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-19 06:06:06.658705
- Title: Can Deception Detection Go Deeper? Dataset, Evaluation, and Benchmark for Deception Reasoning
- Title(参考訳): 偽装検出はより深くなるか? 偽装推論のためのデータセット, 評価, ベンチマーク
- Authors: Kang Chen, Zheng Lian, Haiyang Sun, Bin Liu, Jianhua Tao,
- Abstract要約: 偽装検出を偽装推論に拡張する。
具体的には、潜在的な嘘と基本的な事実を提供し、この文がなぜ嘘なのかを分析する。
本稿では,データセットの構築や評価指標の定義など,この課題に対する最初の試みについて述べる。
- 参考スコア(独自算出の注目度): 39.14036589839115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deception detection has attracted increasing attention due to its importance in real-world scenarios. Its main goal is to detect deceptive behaviors from multimodal clues such as gestures, facial expressions, prosody, etc. However, these bases are usually subjective and related to personal habits. Therefore, we extend deception detection to deception reasoning, further providing objective evidence to support subjective judgment. Specifically, we provide potential lies and basic facts and then analyze why this sentence may be a lie by combining factual inconsistencies and intent behind them. Compared with deception detection, this task is more applicable to real-world scenarios. For example, in interrogation, the police should judge whether a person is lying based on solid evidence. This paper presents our initial attempts at this task, including constructing a dataset and defining evaluation metrics. Meanwhile, this task can serve as a benchmark for evaluating the complex reasoning capability of large language models. Code and data will be made publicly available.
- Abstract(参考訳): 虚偽検出は、現実のシナリオにおける重要性から注目を集めている。
その主な目的は、ジェスチャー、表情、韻律など、マルチモーダルな手がかりから欺く行動を検出することである。
しかしながら、これらの基盤は通常主観的であり、個人の習慣に関係している。
そこで我々は, 虚偽検出を虚偽推論に拡張し, さらに主観的判断を支持する客観的な証拠を提供する。
具体的には、潜在的な嘘と基本的な事実を提供し、その背景にある事実の矛盾と意図を組み合わせることによって、この文が嘘である可能性がある理由を分析する。
偽造検出と比較すると、このタスクは現実世界のシナリオにもより適用可能である。
例えば、尋問においては、警察は確固たる証拠に基づいて嘘をついているかどうかを判断すべきである。
本稿では,データセットの構築や評価指標の定義など,この課題に対する最初の試みについて述べる。
一方、このタスクは、大規模言語モデルの複雑な推論能力を評価するためのベンチマークとして機能する。
コードとデータは公開されます。
関連論文リスト
- On the Robustness of Language Guidance for Low-Level Vision Tasks: Findings from Depth Estimation [71.72465617754553]
対象中心の3次元空間関係を伝達する低レベルな文を生成し,これらを追加言語として組み込んで,深度推定における下流の影響を評価する。
我々の重要な発見は、現在の言語誘導深度推定器がシーンレベルの記述のみを最適に実行することである。
追加データを活用するにもかかわらず、これらの手法は敵の直接攻撃や分散シフトの増加に伴う性能低下に対して堅牢ではない。
論文 参考訳(メタデータ) (2024-04-12T15:35:20Z) - To Tell The Truth: Language of Deception and Language Models [6.80186731352488]
我々は,ハイテイク環境における会話が嘘をつくような,新しいテレビ番組データを分析する。
客観的な真理の存在下での偽りの潜在的な検証可能な言語手がかりの顕在化について検討する。
人間の被験者と同じような真理検出性能を持つ検出器群(アルゴリズム)が存在することを示す。
論文 参考訳(メタデータ) (2023-11-13T05:40:11Z) - UNIDECOR: A Unified Deception Corpus for Cross-Corpus Deception
Detection [17.016156702855604]
我々は,その違いを理解するために,データセット間での誤読の言語的手がかりの相関分析を行う。
クロス・コーパス・モデリング実験を行い、クロス・ドメインの一般化が困難であることを示す。
統一偽装コーパス(UNIDECOR)はhttps://www.ims.uni-stuttgart.de/data/unidecorから得ることができる。
論文 参考訳(メタデータ) (2023-06-05T12:23:04Z) - Guiding Computational Stance Detection with Expanded Stance Triangle
Framework [25.2980607215715]
スタンス検出は、テキストの著者が指定されたターゲットに対して有利か、反対か、中立かを決定する。
本稿では,言語的観点からスタンス検出タスクを分解し,このタスクにおける重要な構成要素と推論経路について検討する。
論文 参考訳(メタデータ) (2023-05-31T13:33:29Z) - ROSCOE: A Suite of Metrics for Scoring Step-by-Step Reasoning [63.77667876176978]
大規模言語モデルでは、最終回答を正当化するためにステップバイステップの推論を生成するように促された場合、ダウンストリームタスクの解釈可能性が改善されている。
これらの推論ステップは、モデルの解釈可能性と検証を大幅に改善するが、客観的にそれらの正確性を研究することは困難である。
本稿では、従来のテキスト生成評価指標を改善し拡張する、解釈可能な教師なし自動スコアのスイートであるROSを提案する。
論文 参考訳(メタデータ) (2022-12-15T15:52:39Z) - Untargeted Backdoor Attack against Object Detection [69.63097724439886]
我々は,タスク特性に基づいて,無目標で毒のみのバックドア攻撃を設計する。
攻撃によって、バックドアがターゲットモデルに埋め込まれると、トリガーパターンでスタンプされたオブジェクトの検出を失う可能性があることを示す。
論文 参考訳(メタデータ) (2022-11-02T17:05:45Z) - Fact-Saboteurs: A Taxonomy of Evidence Manipulation Attacks against
Fact-Verification Systems [80.3811072650087]
証拠のクレームサレントスニペットを微調整し,多様かつクレームアラインな証拠を生成することが可能であることを示す。
この攻撃は、主張のポストホックな修正に対しても堅牢である。
これらの攻撃は、インスペクタブルとヒューマン・イン・ザ・ループの使用シナリオに有害な影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2022-09-07T13:39:24Z) - Rethinking Offensive Text Detection as a Multi-Hop Reasoning Problem [15.476899850339395]
対話における暗黙的な攻撃的テキスト検出の課題について紹介する。
我々は、このより広い種類の攻撃的発話を理解するためには、推論が不可欠であると主張する。
このタスクの研究を支援するデータセットであるSLIGHTをリリースする。
論文 参考訳(メタデータ) (2022-04-22T06:20:15Z) - The Abduction of Sherlock Holmes: A Dataset for Visual Abductive
Reasoning [113.25016899663191]
人間は、画像のリテラルの内容を超えるものについて、誘惑的に推論し仮説を立てる能力がある。
本稿では,103K画像の注釈付きコーパスであるSherlockについて述べる。
論文 参考訳(メタデータ) (2022-02-10T02:26:45Z) - Generalized Zero-shot Intent Detection via Commonsense Knowledge [5.398580049917152]
学習データ不足の問題を克服するために,教師なしの方法でコモンセンス知識を活用する意図検出モデル RIDE を提案する。
RIDEは、発話と意図ラベルの間の深い意味的関係をキャプチャする、堅牢で一般化可能な関係メタ機能を計算する。
広範に使用されている3つのインテント検出ベンチマークに関する広範囲な実験的分析により、関係メタ機能により、目に見えないインテントと見えないインテントの両方を検出する精度が著しく向上することが示された。
論文 参考訳(メタデータ) (2021-02-04T23:36:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。