論文の概要: Introduction of a novel word embedding approach based on technology
labels extracted from patent data
- arxiv url: http://arxiv.org/abs/2102.00425v1
- Date: Sun, 31 Jan 2021 10:37:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 16:49:47.675246
- Title: Introduction of a novel word embedding approach based on technology
labels extracted from patent data
- Title(参考訳): 特許データから抽出した技術ラベルに基づく新しい単語埋め込み手法の導入
- Authors: Mark Standke, Abdullah Kiwan, Annalena Lange, Dr. Silvan Berg
- Abstract要約: 本稿では,人間のラベル付きデータの統計的解析を用いた単語埋め込み手法を提案する。
このアルゴリズムは以前のEQMania UG(eqmania.com)の開発であり、2021年4月までeqalice.comでテストできる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Diversity in patent language is growing and makes finding synonyms for
conducting patent searches more and more challenging. In addition to that, most
approaches for dealing with diverse patent language are based on manual search
and human intuition. In this paper, a word embedding approach using statistical
analysis of human labeled data to produce accurate and language independent
word vectors for technical terms is introduced. This paper focuses on the
explanation of the idea behind the statistical analysis and shows first
qualitative results. The resulting algorithm is a development of the former
EQMania UG (eqmania.com) and can be tested under eqalice.com until April 2021.
- Abstract(参考訳): 特許言語の多様性が高まり、特許検索を行うための同義語を見つけることはますます困難になっている。
それに加えて、多様な特許言語を扱うためのほとんどのアプローチは、手動検索と人間の直感に基づいている。
本稿では,人間のラベル付きデータの統計的解析を用いて,技術用語に対して正確かつ言語に依存しない単語ベクトルを生成する単語埋め込み手法を提案する。
本稿では,統計解析の背後にある概念の説明に注目し,最初の定性的結果を示す。
このアルゴリズムは以前のEQMania UG(eqmania.com)の開発であり、2021年4月までeqalice.comでテストできる。
関連論文リスト
- Connecting the Dots: Inferring Patent Phrase Similarity with Retrieved Phrase Graphs [18.86788223751979]
本稿では,2つの特許句間の意味的類似度を測定する特許フレーズ類似性推論タスクについて検討する。
本稿では,特許用語のグローバルな文脈情報を増幅するためのグラフ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-03-24T18:59:38Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Large-Scale Text Analysis Using Generative Language Models: A Case Study
in Discovering Public Value Expressions in AI Patents [2.246222223318928]
本稿では,生成言語モデル(GPT-4)を用いて,大規模テキスト解析のためのラベルと論理式を生成する手法を提案する。
InnovationQ+に送信された高度なBooleanクエリを用いて、154,934件の特許文書からなるデータベースを収集する。
我々は、これらのAI特許文中の公開価値表現を識別し、ラベル付けするためのフレームワークを設計する。
論文 参考訳(メタデータ) (2023-05-17T17:18:26Z) - New Product Development (NPD) through Social Media-based Analysis by
Comparing Word2Vec and BERT Word Embeddings [0.0]
Word2Vec と BERT という2つの単語埋め込み技術を評価し,感情分析と意見検出における最も優れた手法を同定した。
BERT単語の埋め込みと平衡ランダムフォレストを組み合わせることで、感情分析と意見検出の両方において最も正確な単一モデルが得られた。
論文 参考訳(メタデータ) (2023-04-17T15:32:11Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。
手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。
この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-06T13:28:29Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Commonsense Evidence Generation and Injection in Reading Comprehension [57.31927095547153]
本稿では,CEGI と命名された理解を読み取るためのコモンセンス・エビデンス・ジェネレーション・インジェクション・フレームワークを提案する。
この枠組みは、2種類の補助的コモンセンス証拠を包括的読解に注入し、機械に合理的思考能力を持たせる。
CosmosQAデータセットの実験では、提案されたCEGIモデルが現在の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-11T16:31:08Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。