論文の概要: From chocolate bunny to chocolate crocodile: Do Language Models
Understand Noun Compounds?
- arxiv url: http://arxiv.org/abs/2305.10568v1
- Date: Wed, 17 May 2023 21:05:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 17:57:40.265970
- Title: From chocolate bunny to chocolate crocodile: Do Language Models
Understand Noun Compounds?
- Title(参考訳): チョコレートバニーからチョコレートワニ:言語モデルは名詞の化合物を理解するか?
- Authors: Jordan Coil and Vered Shwartz
- Abstract要約: 名詞複体解釈は、自由文パラフレーズで名詞複体を表現するタスクである。
GPT-3が標準課題をほぼ完璧に解くことを示す。
次に,名詞複合概念化の課題について検討する。
- 参考スコア(独自算出の注目度): 11.188548484391978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noun compound interpretation is the task of expressing a noun compound (e.g.
chocolate bunny) in a free-text paraphrase that makes the relationship between
the constituent nouns explicit (e.g. bunny-shaped chocolate). We propose
modifications to the data and evaluation setup of the standard task (Hendrickx
et al., 2013), and show that GPT-3 solves it almost perfectly. We then
investigate the task of noun compound conceptualization, i.e. paraphrasing a
novel or rare noun compound. E.g., chocolate crocodile is a crocodile-shaped
chocolate. This task requires creativity, commonsense, and the ability to
generalize knowledge about similar concepts. While GPT-3's performance is not
perfect, it is better than that of humans -- likely thanks to its access to
vast amounts of knowledge, and because conceptual processing is effortful for
people (Connell and Lynott, 2012). Finally, we estimate the extent to which
GPT-3 is reasoning about the world vs. parroting its training data. We find
that the outputs from GPT-3 often have significant overlap with a large web
corpus, but that the parroting strategy is less beneficial for novel noun
compounds.
- Abstract(参考訳): 名詞複合解釈は、構成名詞間の関係(例えば、バニー型チョコレート)を明示する自由文パラフローゼにおいて、名詞化合物(例えば、チョコレートバニー)を表現するタスクである。
我々は、標準タスク(hendrickx et al., 2013)のデータおよび評価設定の変更を提案し、gpt-3がほぼ完全に解決することを示す。
次に、名詞複合概念化の課題、すなわち、新規または稀な名詞化合物のパラフレーズ化について検討する。
例えば、チョコレート・クロコダイルはクロコダイル型のチョコレートである。
このタスクには創造性、常識、同様の概念に関する知識を一般化する能力が必要です。
GPT-3のパフォーマンスは完璧ではないが、人間よりも優れている - 膨大な量の知識へのアクセスと、概念処理が人々にとって難しいためだろう(Connell and Lynott, 2012)。
最後に, GPT-3 が世界とトレーニングデータにどのような影響を与えるのかを推定する。
GPT-3のアウトプットは大きなウェブコーパスと重なり合うことが多いが, 新規な名詞化合物にはオウム化戦略が有用でないことが判明した。
関連論文リスト
- EntailE: Introducing Textual Entailment in Commonsense Knowledge Graph
Completion [54.12709176438264]
Commonsense knowledge graph(CSKG)は、名前付きエンティティ、短いフレーズ、イベントをノードとして表現するために自由形式のテキストを使用する。
現在の手法では意味的類似性を利用してグラフ密度を増大させるが、ノードとその関係のセマンティックな妥当性は未探索である。
そこで本研究では,CSKGノード間の暗黙的な包絡関係を見つけるために,テキストエンテーメントを導入し,同じ概念クラス内のサブグラフ接続ノードを効果的に密度化することを提案する。
論文 参考訳(メタデータ) (2024-02-15T02:27:23Z) - NestE: Modeling Nested Relational Structures for Knowledge Graph
Reasoning [80.27794055245444]
我々は、原子とネストされた事実知識の両方の意味をキャプチャする新しいKG埋め込みアプローチであるNestEを紹介する。
NestEは、ネストした事実に対する多様な論理パターンをキャプチャし、一階述語論理のような表現を超越する。
実験結果から,NestEは三重予測と条件付きリンク予測において,現在のベースラインよりも顕著な性能向上を示した。
論文 参考訳(メタデータ) (2023-12-14T18:49:30Z) - Linking Surface Facts to Large-Scale Knowledge Graphs [23.380979397966286]
Open Information extract (OIE)メソッドは、自然言語のテキストから、"subject"、"relation"、"object"の三重項の形で事実を抽出する。
知識グラフ(KG)は、正準形式(すなわち曖昧な形式)の事実を含むが、そのカバレッジは静的スキーマによって制限される。
本稿では,例えば,ファクトリンク性能を粒度三重スロットレベルで測定できる新しい評価プロトコルを用いたベンチマークを提案する。
論文 参考訳(メタデータ) (2023-10-23T13:18:49Z) - Joint Open Knowledge Base Canonicalization and Linking [24.160755953937763]
オープンナレッジベースにおける名詞句(NP)と関係句(RP)は正規化されていない。
本稿では,因子グラフモデルに基づく新しいフレームワークJOCLを提案する。
論文 参考訳(メタデータ) (2022-12-02T14:38:58Z) - Systematicity in GPT-3's Interpretation of Novel English Noun Compounds [7.039267642892591]
我々は、Levinらの実験データをGPT-3世代と比較し、高い類似性を見出した。
我々は、GPT-3が個々の語彙項目以上のことを推論しているという証拠を見つけることができない。
これらの結果は,大規模言語モデルが潜時的により深い理論を符号化するかどうかを評価する際に,低レベルの分布正則性を制御することの重要性を強調した。
論文 参考訳(メタデータ) (2022-10-18T00:25:24Z) - PiC: A Phrase-in-Context Dataset for Phrase Understanding and Semantic
Search [25.801066428860242]
文脈ウィキペディアのページを伴って28Kの名詞句のデータセットであるPiCを提案する。
データセットのトレーニングによってランキングモデルの精度が向上し、質問回答モデル(QA)がほぼ人間に近い精度に大幅に向上することがわかった。
論文 参考訳(メタデータ) (2022-07-19T04:45:41Z) - Collaborative Knowledge Graph Fusion by Exploiting the Open Corpus [59.20235923987045]
知識表現の質を維持しながら、新たに収穫した3倍の知識グラフを豊かにすることは困難である。
本稿では,付加コーパスから得られる情報を用いてKGを精製するシステムを提案する。
論文 参考訳(メタデータ) (2022-06-15T12:16:10Z) - Grounding 'Grounding' in NLP [59.28887479119075]
コミュニティとして、この用語は、テキストをデータや非テキストのモダリティにリンクするために広く使われます。
認知科学(Cognitive Science)は、コミュニケーションの成功に必要な相互情報を確立するプロセスとして「接地」を正式に定義している。
論文 参考訳(メタデータ) (2021-06-04T00:40:59Z) - Do Dogs have Whiskers? A New Knowledge Base of hasPart Relations [27.361653414949615]
本稿では,大規模な汎用文コーパスから抽出したhasPart関係の知識ベースについて述べる。
正確(90%の正確さ)、健全(人が言及する可能性のある関係を包含する)、そして一般的な用語を高い範囲でカバーする。
論文 参考訳(メタデータ) (2020-06-12T23:34:05Z) - Graph Structured Network for Image-Text Matching [127.68148793548116]
微粒化対応学習のためのグラフ構造化マッチングネットワークを提案する。
GSMNは、明示的にオブジェクト、関係、属性を構造化されたフレーズとしてモデル化する。
実験により、GSMNはベンチマークで最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-04-01T08:20:42Z) - A Benchmark for Systematic Generalization in Grounded Language
Understanding [61.432407738682635]
人間は慣れ親しんだ部分から成り立つ不慣れな状況を記述する表現を容易に解釈する。
対照的に、現代のニューラルネットワークは、新しい構成を理解するのに苦労している。
位置言語理解における合成一般化を評価するための新しいベンチマークであるgSCANを導入する。
論文 参考訳(メタデータ) (2020-03-11T08:40:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。