論文の概要: Refined Commonsense Knowledge from Large-Scale Web Contents
- arxiv url: http://arxiv.org/abs/2112.04596v1
- Date: Tue, 30 Nov 2021 20:26:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-12 14:54:54.099144
- Title: Refined Commonsense Knowledge from Large-Scale Web Contents
- Title(参考訳): 大規模WebコンテンツからのRefined Commonsense知識
- Authors: Tuan-Phong Nguyen, Simon Razniewski, Julien Romero, Gerhard Weikum
- Abstract要約: 概念とその特性に関する常識知識(CSK)は、AIアプリケーションに有用である。
本稿では,CSKアサーションの大規模知識ベース(KB)を自動構築するASCENT++を提案する。
- 参考スコア(独自算出の注目度): 24.10708502359049
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Commonsense knowledge (CSK) about concepts and their properties is useful for
AI applications. Prior works like ConceptNet, COMET and others compiled large
CSK collections, but are restricted in their expressiveness to
subject-predicate-object (SPO) triples with simple concepts for S and strings
for P and O. This paper presents a method, called ASCENT++, to automatically
build a large-scale knowledge base (KB) of CSK assertions, with refined
expressiveness and both better precision and recall than prior works. ASCENT++
goes beyond SPO triples by capturing composite concepts with subgroups and
aspects, and by refining assertions with semantic facets. The latter is
important to express the temporal and spatial validity of assertions and
further qualifiers. ASCENT++ combines open information extraction with
judicious cleaning and ranking by typicality and saliency scores. For high
coverage, our method taps into the large-scale crawl C4 with broad web
contents. The evaluation with human judgements shows the superior quality of
the ASCENT++ KB, and an extrinsic evaluation for QA-support tasks underlines
the benefits of ASCENT++. A web interface, data and code can be accessed at
https://www.mpi-inf.mpg.de/ascentpp.
- Abstract(参考訳): 概念とその特性に関する常識知識(CSK)は、AIアプリケーションに有用である。
conceptnetやcometなどの先行研究は大規模なcskコレクションをコンパイルしているが、その表現性は、pとoのためのsと文字列の単純な概念でspo(subject-predicate-object)トリプルに制限されている。この記事では、cskアサーションの大規模知識ベース(kb)を自動的に構築するascent++という手法を提案する。
ASCENT++は、サブグループとアスペクトで複合概念をキャプチャし、セマンティックファセットでアサーションを洗練することによって、SPOのトリプルを越えている。
後者は、アサーションの時間的および空間的妥当性とさらなる等式を表現することが重要である。
ASCENT++は、オープン情報抽出と司法的クリーニングと、典型と唾液度スコアによるランク付けを組み合わせたものだ。
高精細化のために,本手法は大規模crawl c4を広範囲のwebコンテンツで活用する。
人間の判断による評価は、ASCENT++ KBの優れた品質を示し、QAサポートタスクの外部評価は、ASCENT++の利点を裏付けるものである。
Webインターフェース、データ、コードはhttps://www.mpi-inf.mpg.de/ascentpp.comでアクセスできる。
関連論文リスト
- Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - EWEK-QA: Enhanced Web and Efficient Knowledge Graph Retrieval for Citation-based Question Answering Systems [103.91826112815384]
引用ベースのQAシステムは2つの欠点に悩まされている。
彼らは通常、抽出された知識の源としてWebにのみ依存し、外部の知識ソースを追加することで、システムの効率を損なう。
システムに供給された知識の内容を充実させるため,Web と 効率的な知識グラフ (KG) 検索ソリューション (EWEK-QA) を提案する。
論文 参考訳(メタデータ) (2024-06-14T19:40:38Z) - CSCNET: Class-Specified Cascaded Network for Compositional Zero-Shot
Learning [62.090051975043544]
属性とオブジェクト(A-O)の絡み合いは、合成ゼロショット学習(CZSL)の基本的かつ重要な問題である
CZSL(Class-specified Cascaded Network, CSCNet)のための新しいA-O不整合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-09T14:18:41Z) - Semantic Communications for Artificial Intelligence Generated Content
(AIGC) Toward Effective Content Creation [75.73229320559996]
本稿では,AIGCとSemComの統合の概念モデルを開発する。
AIGC技術を利用した新しいフレームワークが,意味情報のためのエンコーダおよびデコーダとして提案されている。
このフレームワークは、生成されたさまざまなタイプのコンテンツ、要求される品質、活用される意味情報に適応することができる。
論文 参考訳(メタデータ) (2023-08-09T13:17:21Z) - CAR: Conceptualization-Augmented Reasoner for Zero-Shot Commonsense
Question Answering [56.592385613002584]
ゼロショットコモンセンス質問応答の課題に対処するために,概念化強化推論器(CAR)を提案する。
CARは、CommonSenseの知識を多くの高レベルなインスタンスに抽象化し、CommonSenseの知識ベースの範囲を拡大する。
CARは、既存のメソッドよりも、ゼロショットのコモンセンスシナリオに関する質問に答えることにより、より堅牢に一般化する。
論文 参考訳(メタデータ) (2023-05-24T08:21:31Z) - Extracting Cultural Commonsense Knowledge at Scale [28.856786775318486]
CANDLEは、高品質な文化的常識知識を大規模に抽出するためのエンドツーエンドの方法論である。
3つの領域(地理学、宗教、職業)といくつかの文化的側面の集合体にアサーションをまとめる。
分類に基づくフィルタリングと面白さのスコア付けのための司法手法を含む。
論文 参考訳(メタデータ) (2022-10-14T12:53:57Z) - Supporting Vision-Language Model Inference with Confounder-pruning Knowledge Prompt [71.77504700496004]
視覚言語モデルは、オープンセットの視覚概念を扱うために、画像とテキストのペアを共通の空間に整列させることで事前訓練される。
事前訓練されたモデルの転送可能性を高めるため、最近の研究では、固定または学習可能なプロンプトが採用されている。
しかし、どのようにして、どのプロンプトが推論性能を改善するのかは、まだ不明である。
論文 参考訳(メタデータ) (2022-05-23T07:51:15Z) - Augmenting Pre-trained Language Models with QA-Memory for Open-Domain
Question Answering [38.071375112873675]
質問応答型エンコーダデコーダモデルの提案と事前学習戦略について述べる。
これにより、シングルホップのQAタスクにおいて、以前のQA検索方法よりも優れたエンドツーエンドシステムが得られる。
論文 参考訳(メタデータ) (2022-04-10T02:33:00Z) - Advanced Semantics for Commonsense Knowledge Extraction [32.43213645631101]
概念とその特性に関する常識知識(CSK)は、堅牢なチャットボットのようなAIアプリケーションに有用である。
本稿では,CSKアサーションの大規模知識ベース(KB)を自動構築するAscentという手法を提案する。
Ascent は部分群とアスペクトで合成概念をキャプチャし、セマンティック・ファセットでアサーションを精製することで三重項を超えていく。
論文 参考訳(メタデータ) (2020-11-02T11:37:17Z) - Joint Reasoning for Multi-Faceted Commonsense Knowledge [28.856786775318486]
Commonsense Knowledge(CSK)は、視覚的理解からチャットボットまで、さまざまなAIアプリケーションをサポートする。
CSKの買収に関する以前の研究は、日常的なオブジェクトやアクティビティのような概念と、概念のほとんどまたは一部のインスタンスを保持するプロパティを関連付けるステートメントをまとめたものだった。
本稿では,CSK文の多面的モデルと,関連文の集合に対する共同推論手法を提案する。
論文 参考訳(メタデータ) (2020-01-13T11:34:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。