論文の概要: A Dataset for Physical and Abstract Plausibility and Sources of Human Disagreement
- arxiv url: http://arxiv.org/abs/2404.04035v1
- Date: Fri, 5 Apr 2024 11:37:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-08 16:14:58.186238
- Title: A Dataset for Physical and Abstract Plausibility and Sources of Human Disagreement
- Title(参考訳): 身体的・抽象的プラウザビリティのデータセットと人体識別の源泉
- Authors: Annerose Eichel, Sabine Schulte im Walde,
- Abstract要約: 本稿では,英語における事象の物理的および抽象的妥当性を示す新しいデータセットを提案する。
ウィキペディアから抽出された自然発生文に基づいて、抽象度を浸透させ、摂動型擬似表現可能なイベントを自動生成する。
- 参考スコア(独自算出の注目度): 7.685616778176573
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel dataset for physical and abstract plausibility of events in English. Based on naturally occurring sentences extracted from Wikipedia, we infiltrate degrees of abstractness, and automatically generate perturbed pseudo-implausible events. We annotate a filtered and balanced subset for plausibility using crowd-sourcing, and perform extensive cleansing to ensure annotation quality. In-depth quantitative analyses indicate that annotators favor plausibility over implausibility and disagree more on implausible events. Furthermore, our plausibility dataset is the first to capture abstractness in events to the same extent as concreteness, and we find that event abstractness has an impact on plausibility ratings: more concrete event participants trigger a perception of implausibility.
- Abstract(参考訳): 本稿では,英語における事象の物理的および抽象的妥当性を示す新しいデータセットを提案する。
ウィキペディアから抽出された自然発生文に基づいて、抽象度を浸透させ、摂動型擬似表現可能なイベントを自動生成する。
クラウドソーシングを用いて,フィルタとバランスの取れたサブセットをアノテートし,アノテーションの品質を確保するために広範囲のクリーン化を行う。
詳細な定量的分析では、アノテーションは不到達性よりも妥当性を優先し、不到達性事象についてより意見が一致しないことが示されている。
さらに、我々の可視性データセットは、具体性と同じ程度にイベントの抽象性をキャプチャする最初のものであり、イベントの抽象性は可視性評価に影響を及ぼす。
関連論文リスト
- Are Triggers Needed for Document-Level Event Extraction? [16.944314894087075]
我々は,文書レベルのイベント抽出において,より困難で研究の少ない作業に対するトリガーの役割を初めて調査する。
3つの文書レベルのイベント抽出データセットに対して、複数のエンドツーエンドおよびパイプライン化されたニューラルイベント抽出モデルでそれらの有用性を分析する。
我々の研究では、トリガーの有効性は、抽出タスクの特徴とデータ品質によって異なり、基本的で自動生成トリガーは、人間のアノテーションに代えて実行可能な代替品として機能することを示している。
論文 参考訳(メタデータ) (2024-11-13T15:50:38Z) - Plausible-Parrots @ MSP2023: Enhancing Semantic Plausibility Modeling using Entity and Event Knowledge [1.6233244703352492]
外部知識ベースから抽出した詳細なエンティティタイプ、イベントタイプおよびそれらの定義を用いて、大型言語モデル(LLM)を強化する。
実験結果から,事象の意味的妥当性のモデル化におけるインジェクト知識の有効性が示された。
論文 参考訳(メタデータ) (2024-08-29T23:13:45Z) - Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation [59.138470433237615]
本稿では,関係学習用データセットの言語的スキューと視覚的スクリューの両方を定量化する統計指標を提案する。
系統的に制御されたメトリクスは、一般化性能を強く予測できることを示す。
この研究は、データの多様性やバランスを向上し、絶対的なサイズをスケールアップするための重要な方向を示します。
論文 参考訳(メタデータ) (2024-03-25T03:18:39Z) - CASA: Causality-driven Argument Sufficiency Assessment [79.13496878681309]
ゼロショット因果関係に基づく議論十分性評価フレームワークであるCASAを提案する。
PSは前提イベントの導入が前提イベントと結論イベントの両方が欠落した場合の結論につながる可能性を測っている。
2つの論理的誤り検出データセットの実験により、CASAは不十分な議論を正確に識別することを示した。
論文 参考訳(メタデータ) (2024-01-10T16:21:18Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Adversarial Examples Might be Avoidable: The Role of Data Concentration in Adversarial Robustness [39.883465335244594]
入力空間の小体積部分集合に対する濃度は、ロバストな分類器が存在するかどうかを決定する。
さらに、低次元線形部分空間の結合に集中したデータ分布に対して、データの構造を生かして、データ依存多面体保証を享受する分類器が自然に現れることを示した。
論文 参考訳(メタデータ) (2023-09-28T01:39:47Z) - Improving Faithfulness of Abstractive Summarization by Controlling
Confounding Effect of Irrelevant Sentences [38.919090721583075]
事実整合性は、共同創設者として機能する入力テキストの無関係な部分によって引き起こされる可能性があることを示す。
そこで我々は,人間が記述した関連文を利用できる場合に利用することにより,そのような欠点を抑えるためのシンプルなマルチタスクモデルを設計する。
提案手法は,AnswerSumm citepfabbri 2021answersummデータセットの強いベースラインに対して,忠実度スコアを20%向上させる。
論文 参考訳(メタデータ) (2022-12-19T18:51:06Z) - Mutual Information Alleviates Hallucinations in Abstractive
Summarization [73.48162198041884]
モデルが生成中の幻覚コンテンツにより多くの確率を割り当てる可能性が著しく高いという単純な基準を見いだす。
この発見は幻覚の潜在的な説明を提供する:モデルは、継続について不確実な場合には、高い限界確率のテキストを好むことをデフォルトとする。
そこで本研究では,ターゲットトークンの正当性ではなく,ソースとターゲットトークンのポイントワイドな相互情報の最適化に切り替える復号手法を提案する。
論文 参考訳(メタデータ) (2022-10-24T13:30:54Z) - An Ordinal Latent Variable Model of Conflict Intensity [59.49424978353101]
ゴールドスタインスケール(Goldstein scale)は、紛争・協力的なスケールでイベントをスコアする、広く使われている専門家ベースの尺度である。
本稿では、競合強度を測定するために、潜伏変数に基づくアプローチをとる。
論文 参考訳(メタデータ) (2022-10-08T08:59:17Z) - Compressive Summarization with Plausibility and Salience Modeling [54.37665950633147]
本稿では,候補空間に対する厳密な構文的制約を緩和し,その代わりに圧縮決定を2つのデータ駆動基準,すなわち妥当性とサリエンスに委ねることを提案する。
提案手法は,ベンチマーク要約データセット上で強いドメイン内結果を得るとともに,人間による評価により,文法的および事実的削除に対して,可算性モデルが一般的に選択されることを示す。
論文 参考訳(メタデータ) (2020-10-15T17:07:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。