論文の概要: Patent Documents to Engineering Design Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2307.06985v4
- Date: Tue, 28 Nov 2023 12:59:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 15:36:00.857971
- Title: Patent Documents to Engineering Design Knowledge Graphs
- Title(参考訳): エンジニアリングデザインナレッジグラフへの特許書類
- Authors: L Siddharth, Jianxi Luo
- Abstract要約: 本稿では,特許文書中の文から事実(h :: r :: t)を特定し,説明するためのデータ駆動型アプローチを提案する。
1) すべてのエンティティ(h)と関係(r)を識別し、2)一対のエンティティ(h :: ___ :: t)に対する特定の関係(r)を識別する。
- 参考スコア(独自算出の注目度): 2.06682776181122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aimed at supporting knowledge-intensive tasks in the design process,
populating design knowledge from text documents involves the extraction of
triples - head entity :: relationship :: tail entity or h :: r :: t that could
be combined into a knowledge graph representation. As relationships are largely
chosen from ontological or common-sense alternatives, knowledge graphs built
using these depict an approximation or restricted view of design knowledge,
rather than what is explicated in text document. In this article, we present a
data-driven approach to identify and explicate facts (h :: r :: t) from
sentences in patent documents. We create a dataset of 44,227 sentences and
facts, encompassing all patent classifications while also capturing the
variations among patent document sections. Using this dataset, we train taggers
that classify tokens to: 1) identify all entities (h) and relationships (r) and
2) specific relationships (r) for a pair of entities (h :: ___ :: t). While
these taggers are built upon transformer-based sequence classification models,
we evaluate our proposed method against edge classification approaches that use
linear classifiers and graph neural networks, incorporating transformer-based
token embeddings and linguistic features. The simplicity and coverage of the
proposed method enable its application to patent documents at any scale and
variety. Upon deploying an open-source python package, we apply our method to
patent documents related to fan systems. From the knowledge graphs thus
extracted, we explain how facts could be generalised to domain ontologies as
well as be specified to subsystem levels. We also highlight the importance of
knowledge graph representations by retrieving and explicating the knowledge of
key issues in fan systems, while holding a comparative discussion against
opinions from ChatGPT.
- Abstract(参考訳): 設計プロセスにおいて知識集約的なタスクをサポートすることを目的として、テキスト文書から設計知識を投入することは、三重項(head entity :: relationship :: tail entity or h :: r :: t)の抽出を伴う。
関係性は、主に存在論的あるいは常識的な代替物から選択されるため、これらを用いて構築された知識グラフは、テキスト文書に記述されたものよりも、設計知識の近似あるいは制限された視点を描いている。
本稿では,特許文書中の文から事実(h :: r :: t)を識別・説明するためのデータ駆動アプローチを提案する。
我々は44,227の文と事実のデータセットを作成し、すべての特許分類を包含するとともに、特許文書セクションのバリエーションを捉える。
このデータセットを使用して、トークンを分類するタグをトレーニングします。
1)すべての実体(h)と関係(r)を識別し、
2)一対の実体(h :: ___ :: t)に対する特定の関係(r)。
これらのタガーはトランスフォーマティブに基づくシーケンス分類モデルに基づいて構築されているが,線形分類器とグラフニューラルネットワークを用いたエッジ分類アプローチに対する提案手法を評価し,トランスフォーマティブに基づくトークン埋め込みと言語的特徴を取り入れている。
提案手法の単純さと包括性により,任意の規模および多種多様な文書を特許出願することができる。
オープンソースのpythonパッケージをデプロイする際,本手法をファンシステムに関する文書の特許に適用する。
このように抽出した知識グラフから、事実をドメインオントロジーに一般化し、サブシステムレベルに指定する方法を説明する。
また,ChatGPTの意見に反する議論をしながら,ファンシステムにおける重要な課題の知識を検索・抽出することで,知識グラフ表現の重要性を強調した。
関連論文リスト
- Retrieval-Enhanced Named Entity Recognition [1.2187048691454239]
RENERは、In-Context Learningと情報検索技術に基づく自己回帰言語モデルを用いたエンティティ認識手法である。
実験の結果,CrossNERコレクションでは,提案手法を用いて最先端の性能を実現することができた。
論文 参考訳(メタデータ) (2024-10-17T01:12:48Z) - Establishing Knowledge Preference in Language Models [80.70632813935644]
言語モデルは事前学習を通じて大量の事実知識を符号化することが知られている。
このような知識はユーザーからの要求に応えるには不十分かもしれない。
進行中のイベントに関する質問に答える場合には、最新のニュース記事を使って回答を更新する必要がある。
ある事実がモデルで編集されると、更新された事実はモデルによって学習されたすべての事前知識をオーバーライドする。
論文 参考訳(メタデータ) (2024-07-17T23:16:11Z) - CANDLE: Iterative Conceptualization and Instantiation Distillation from Large Language Models for Commonsense Reasoning [45.62134354858683]
CANDLEは、コモンセンス知識ベースに対する概念化とインスタンス化を反復的に行うフレームワークである。
CANDLEをATOMICに適用することにより、600万の概念化と三重項のインスタンス化を含む総合的な知識基盤を構築する。
論文 参考訳(メタデータ) (2024-01-14T13:24:30Z) - Linguistic and Structural Basis of Engineering Design Knowledge [1.7495213911983414]
技術クラスによって階層化された特許のサンプルから,33,881個の知識グラフを収集した。
言語学的には、ユニークな実体と関係の周波数に基づいてZipf分布解析を行う。
構造的基盤として,生物・生態ネットワークの研究からインスピレーションを得て,特許知識グラフからモチーフを発見する。
論文 参考訳(メタデータ) (2023-12-11T13:03:39Z) - Automated Few-shot Classification with Instruction-Finetuned Language
Models [76.69064714392165]
我々は、AuT-Fewが最先端の数ショット学習方法より優れていることを示す。
AuT-Few は RAFT few-shot ベンチマークにおいて,データセット間で最高のランク付け手法であることを示す。
論文 参考訳(メタデータ) (2023-05-21T21:50:27Z) - Crawling the Internal Knowledge-Base of Language Models [53.95793060766248]
本稿では,言語モデルの内部知識ベースである「クローリング」の手順について述べる。
我々は、数十のシードエンティティから始まるグラフのクローリングに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-01-30T12:03:36Z) - KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization
for Relation Extraction [111.74812895391672]
シナジスティック最適化(KnowPrompt)を用いた知識認識型Promptチューニング手法を提案する。
関係ラベルに含まれる潜在知識をインジェクトして,学習可能な仮想型語と解答語で構築する。
論文 参考訳(メタデータ) (2021-04-15T17:57:43Z) - Exploiting Structured Knowledge in Text via Graph-Guided Representation
Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。
エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。
既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文 参考訳(メタデータ) (2020-04-29T14:22:42Z) - Probing Linguistic Features of Sentence-Level Representations in Neural
Relation Extraction [80.38130122127882]
ニューラルリレーション抽出(RE)に関連する言語特性を対象とした14の探索タスクを導入する。
私たちは、40以上の異なるエンコーダアーキテクチャと2つのデータセットでトレーニングされた言語的特徴の組み合わせによって学習された表現を研究するためにそれらを使用します。
アーキテクチャによって引き起こされるバイアスと言語的特徴の含意は、探索タスクのパフォーマンスにおいて明らかに表現されている。
論文 参考訳(メタデータ) (2020-04-17T09:17:40Z) - Common-Knowledge Concept Recognition for SEVA [15.124939896007472]
我々はシステムエンジニアの仮想アシスタント(SEVA)のための共通知識概念認識システムを構築した。
この問題は、名前付きエンティティ抽出と同様のトークン分類タスクとして定式化される。
システム工学の概念を認識するためにシーケンスモデルをトレーニングするためのラベル付けスキームを慎重に定義することにより、単語レベルで注釈付けされたデータセットを構築する。
論文 参考訳(メタデータ) (2020-03-26T00:30:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。