論文の概要: Extracting Cultural Commonsense Knowledge at Scale
- arxiv url: http://arxiv.org/abs/2210.07763v1
- Date: Fri, 14 Oct 2022 12:53:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 15:07:10.343156
- Title: Extracting Cultural Commonsense Knowledge at Scale
- Title(参考訳): 文化的コモンセンス知識の抽出
- Authors: Tuan-Phong Nguyen, Simon Razniewski, Aparna Varde, Gerhard Weikum
- Abstract要約: CANDLEは、高品質な文化的常識知識を大規模に抽出するためのエンドツーエンドの方法論である。
3つの領域(地理学、宗教、職業)といくつかの文化的側面の集合体にアサーションをまとめる。
CanDLEには、分類に基づくフィルタリングと興味深いスコア付けのための司法手法が含まれている。
- 参考スコア(独自算出の注目度): 28.856786775318486
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Structured knowledge is important for many AI applications. Commonsense
knowledge, which is crucial for robust human-centric AI, is covered by a small
number of structured knowledge projects. However, they lack knowledge about
human traits and behaviors conditioned on socio-cultural contexts, which is
crucial for situative AI. This paper presents CANDLE, an end-to-end methodology
for extracting high-quality cultural commonsense knowledge (CCSK) at scale.
CANDLE extracts CCSK assertions from a huge web corpus and organizes them into
coherent clusters, for 3 domains of subjects (geography, religion, occupation)
and several cultural facets (food, drinks, clothing, traditions, rituals,
behaviors). CANDLE includes judicious techniques for classification-based
filtering and scoring of interestingness. Experimental evaluations show the
superiority of the CANDLE CCSK collection over prior works, and an extrinsic
use case demonstrates the benefits of CCSK for the GPT-3 language model. Code
and data can be accessed at https://cultural-csk.herokuapp.com/.
- Abstract(参考訳): 構造化知識は多くのAIアプリケーションにとって重要である。
堅牢な人間中心のaiに不可欠な常識知識は、少数の構造化知識プロジェクトによってカバーされている。
しかし、それらは社会文化的文脈に基づく人間の特性や行動に関する知識を欠いている。
本稿では,高品質な文化常識知識(CCSK)を大規模に抽出するためのエンドツーエンド手法であるCANDLEを提案する。
CANDLEは巨大なウェブコーパスからCSKアサーションを抽出し、これらを3つの領域の主題(地理学、宗教、職業)といくつかの文化的ファセット(食品、飲み物、衣服、伝統、儀式、行動)の一貫性のあるクラスタにまとめる。
CANDLEは、分類に基づくフィルタリングと興味深いスコア付けのための司法手法を含んでいる。
実験により, CANDLE CCSKコレクションは先行研究よりも優れており, GPT-3言語モデルに対する CCSK の利点が実証されている。
コードとデータはhttps://cultural-csk.herokuapp.com/でアクセスできる。
関連論文リスト
- A Knowledge-Injected Curriculum Pretraining Framework for Question Answering [70.13026036388794]
本稿では,知識に基づく質問応答タスクの総合的なKG学習と活用を実現するための一般知識注入型カリキュラム事前学習フレームワーク(KICP)を提案する。
KIモジュールはまずKG中心の事前学習コーパスを生成してLMに知識を注入し、プロセスを3つの重要なステップに一般化する。
KAモジュールは、アダプタを備えたLMで生成されたコーパスから知識を学習し、元の自然言語理解能力を維持できる。
CRモジュールは人間の推論パターンに従って3つのコーパスを構築する。
論文 参考訳(メタデータ) (2024-03-11T03:42:03Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - CANDLE: Iterative Conceptualization and Instantiation Distillation from Large Language Models for Commonsense Reasoning [45.62134354858683]
CANDLEは、コモンセンス知識ベースに対する概念化とインスタンス化を反復的に行うフレームワークである。
CANDLEをATOMICに適用することにより、600万の概念化と三重項のインスタンス化を含む総合的な知識基盤を構築する。
論文 参考訳(メタデータ) (2024-01-14T13:24:30Z) - Visually Grounded Commonsense Knowledge Acquisition [132.42003872906062]
大規模なコモンセンス知識ベースは、幅広いAIアプリケーションを促進する。
視覚知覚には、現実世界の実体に関する豊富な常識知識が含まれる。
本稿では,遠隔教師付きマルチインスタンス学習問題としてCKEを定式化するCLEVERを提案する。
論文 参考訳(メタデータ) (2022-11-22T07:00:16Z) - Refined Commonsense Knowledge from Large-Scale Web Contents [24.10708502359049]
概念とその特性に関する常識知識(CSK)は、AIアプリケーションに有用である。
本稿では,CSKアサーションの大規模知識ベース(KB)を自動構築するASCENT++を提案する。
論文 参考訳(メタデータ) (2021-11-30T20:26:09Z) - A Data-Driven Study of Commonsense Knowledge using the ConceptNet
Knowledge Base [8.591839265985412]
汎用人工知能(AI)の実現における重要なフロンティアとして,コモンセンス知識と推論の獲得が認められている。
本稿では,コンセプションネットの知識基盤を実証的かつ構造的に分析することにより,コモンセンス知識のより深い理解を可能にする体系的な研究を提案し,実施する。
最先端の教師なしグラフ表現学習(「埋め込み」)とクラスタリング技術を用いて、慎重に設計された3つの研究課題に関する詳細な実験結果から、ConceptNet関係の深いサブ構造を明らかにする。
論文 参考訳(メタデータ) (2020-11-28T08:08:25Z) - Advanced Semantics for Commonsense Knowledge Extraction [32.43213645631101]
概念とその特性に関する常識知識(CSK)は、堅牢なチャットボットのようなAIアプリケーションに有用である。
本稿では,CSKアサーションの大規模知識ベース(KB)を自動構築するAscentという手法を提案する。
Ascent は部分群とアスペクトで合成概念をキャプチャし、セマンティック・ファセットでアサーションを精製することで三重項を超えていく。
論文 参考訳(メタデータ) (2020-11-02T11:37:17Z) - CoLAKE: Contextualized Language and Knowledge Embedding [81.90416952762803]
文脈型言語と知識埋め込み(CoLAKE)を提案する。
CoLAKEは、言語と知識の両方の文脈化された表現を、拡張された目的によって共同で学習する。
知識駆動タスク、知識探索タスク、言語理解タスクについて実験を行う。
論文 参考訳(メタデータ) (2020-10-01T11:39:32Z) - TransOMCS: From Linguistic Graphs to Commonsense Knowledge [109.36596335148091]
従来のコモンセンス知識を取得するには、手間と費用のかかる人間のアノテーションが必要である。
我々は,言語パターンから得られた安価な知識を高価なコモンセンス知識に移行することを目的として,言語グラフからコモンセンス知識をマイニングする実践的な方法を探究する。
実験により,言語知識のコモンセンス知識への伝達可能性や,量,新規性,品質の観点から提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-05-01T04:03:58Z) - Joint Reasoning for Multi-Faceted Commonsense Knowledge [28.856786775318486]
Commonsense Knowledge(CSK)は、視覚的理解からチャットボットまで、さまざまなAIアプリケーションをサポートする。
CSKの買収に関する以前の研究は、日常的なオブジェクトやアクティビティのような概念と、概念のほとんどまたは一部のインスタンスを保持するプロパティを関連付けるステートメントをまとめたものだった。
本稿では,CSK文の多面的モデルと,関連文の集合に対する共同推論手法を提案する。
論文 参考訳(メタデータ) (2020-01-13T11:34:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。