論文の概要: Extracting Cultural Commonsense Knowledge at Scale
- arxiv url: http://arxiv.org/abs/2210.07763v1
- Date: Fri, 14 Oct 2022 12:53:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 15:07:10.343156
- Title: Extracting Cultural Commonsense Knowledge at Scale
- Title(参考訳): 文化的コモンセンス知識の抽出
- Authors: Tuan-Phong Nguyen, Simon Razniewski, Aparna Varde, Gerhard Weikum
- Abstract要約: CANDLEは、高品質な文化的常識知識を大規模に抽出するためのエンドツーエンドの方法論である。
3つの領域(地理学、宗教、職業)といくつかの文化的側面の集合体にアサーションをまとめる。
CanDLEには、分類に基づくフィルタリングと興味深いスコア付けのための司法手法が含まれている。
- 参考スコア(独自算出の注目度): 28.856786775318486
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Structured knowledge is important for many AI applications. Commonsense
knowledge, which is crucial for robust human-centric AI, is covered by a small
number of structured knowledge projects. However, they lack knowledge about
human traits and behaviors conditioned on socio-cultural contexts, which is
crucial for situative AI. This paper presents CANDLE, an end-to-end methodology
for extracting high-quality cultural commonsense knowledge (CCSK) at scale.
CANDLE extracts CCSK assertions from a huge web corpus and organizes them into
coherent clusters, for 3 domains of subjects (geography, religion, occupation)
and several cultural facets (food, drinks, clothing, traditions, rituals,
behaviors). CANDLE includes judicious techniques for classification-based
filtering and scoring of interestingness. Experimental evaluations show the
superiority of the CANDLE CCSK collection over prior works, and an extrinsic
use case demonstrates the benefits of CCSK for the GPT-3 language model. Code
and data can be accessed at https://cultural-csk.herokuapp.com/.
- Abstract(参考訳): 構造化知識は多くのAIアプリケーションにとって重要である。
堅牢な人間中心のaiに不可欠な常識知識は、少数の構造化知識プロジェクトによってカバーされている。
しかし、それらは社会文化的文脈に基づく人間の特性や行動に関する知識を欠いている。
本稿では,高品質な文化常識知識(CCSK)を大規模に抽出するためのエンドツーエンド手法であるCANDLEを提案する。
CANDLEは巨大なウェブコーパスからCSKアサーションを抽出し、これらを3つの領域の主題(地理学、宗教、職業)といくつかの文化的ファセット(食品、飲み物、衣服、伝統、儀式、行動)の一貫性のあるクラスタにまとめる。
CANDLEは、分類に基づくフィルタリングと興味深いスコア付けのための司法手法を含んでいる。
実験により, CANDLE CCSKコレクションは先行研究よりも優れており, GPT-3言語モデルに対する CCSK の利点が実証されている。
コードとデータはhttps://cultural-csk.herokuapp.com/でアクセスできる。
関連論文リスト
- Multi-Cultural Commonsense Knowledge Distillation [34.93079501464277]
本稿では,文化知識の高精度・高精度な主張を蒸留する方法であるMANGOについて述べる。
GPT-3.5でMANGO法を実行すると、30Kのコンセプトと11Kのカルチャーに対して167Kの高精度なアサーションが得られる。
MANGOから知識を追加することで、対話応答の全体的な品質、特異性、文化的感受性が向上することがわかった。
論文 参考訳(メタデータ) (2024-02-16T13:46:38Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - CANDLE: Iterative Conceptualization and Instantiation Distillation from
Large Language Models for Commonsense Reasoning [46.84711485390993]
CANDLEは、コモンセンス知識ベースに対する概念化とインスタンス化を反復的に行うフレームワークである。
CANDLEをATOMICに適用することにより、600万の概念化と三重項のインスタンス化を含む総合的な知識基盤を構築する。
論文 参考訳(メタデータ) (2024-01-14T13:24:30Z) - Visually Grounded Commonsense Knowledge Acquisition [132.42003872906062]
大規模なコモンセンス知識ベースは、幅広いAIアプリケーションを促進する。
視覚知覚には、現実世界の実体に関する豊富な常識知識が含まれる。
本稿では,遠隔教師付きマルチインスタンス学習問題としてCKEを定式化するCLEVERを提案する。
論文 参考訳(メタデータ) (2022-11-22T07:00:16Z) - Refined Commonsense Knowledge from Large-Scale Web Contents [24.10708502359049]
概念とその特性に関する常識知識(CSK)は、AIアプリケーションに有用である。
本稿では,CSKアサーションの大規模知識ベース(KB)を自動構築するASCENT++を提案する。
論文 参考訳(メタデータ) (2021-11-30T20:26:09Z) - Advanced Semantics for Commonsense Knowledge Extraction [32.43213645631101]
概念とその特性に関する常識知識(CSK)は、堅牢なチャットボットのようなAIアプリケーションに有用である。
本稿では,CSKアサーションの大規模知識ベース(KB)を自動構築するAscentという手法を提案する。
Ascent は部分群とアスペクトで合成概念をキャプチャし、セマンティック・ファセットでアサーションを精製することで三重項を超えていく。
論文 参考訳(メタデータ) (2020-11-02T11:37:17Z) - CoLAKE: Contextualized Language and Knowledge Embedding [81.90416952762803]
文脈型言語と知識埋め込み(CoLAKE)を提案する。
CoLAKEは、言語と知識の両方の文脈化された表現を、拡張された目的によって共同で学習する。
知識駆動タスク、知識探索タスク、言語理解タスクについて実験を行う。
論文 参考訳(メタデータ) (2020-10-01T11:39:32Z) - TransOMCS: From Linguistic Graphs to Commonsense Knowledge [109.36596335148091]
従来のコモンセンス知識を取得するには、手間と費用のかかる人間のアノテーションが必要である。
我々は,言語パターンから得られた安価な知識を高価なコモンセンス知識に移行することを目的として,言語グラフからコモンセンス知識をマイニングする実践的な方法を探究する。
実験により,言語知識のコモンセンス知識への伝達可能性や,量,新規性,品質の観点から提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-05-01T04:03:58Z) - KACC: A Multi-task Benchmark for Knowledge Abstraction, Concretization
and Completion [99.47414073164656]
包括的知識グラフ(KG)は、インスタンスレベルのエンティティグラフとオントロジーレベルの概念グラフを含む。
2ビューのKGは、知識の抽象化、包括化、完成に関する人間の能力を「シミュレーション」するためのモデルのためのテストベッドを提供する。
我々は,データセットのスケール,タスクカバレッジ,難易度の観点から,既存のベンチマークを改善した統一KGベンチマークを提案する。
論文 参考訳(メタデータ) (2020-04-28T16:21:57Z) - Joint Reasoning for Multi-Faceted Commonsense Knowledge [28.856786775318486]
Commonsense Knowledge(CSK)は、視覚的理解からチャットボットまで、さまざまなAIアプリケーションをサポートする。
CSKの買収に関する以前の研究は、日常的なオブジェクトやアクティビティのような概念と、概念のほとんどまたは一部のインスタンスを保持するプロパティを関連付けるステートメントをまとめたものだった。
本稿では,CSK文の多面的モデルと,関連文の集合に対する共同推論手法を提案する。
論文 参考訳(メタデータ) (2020-01-13T11:34:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。