論文の概要: Technical Progress Analysis Using a Dynamic Topic Model for Technical
Terms to Revise Patent Classification Codes
- arxiv url: http://arxiv.org/abs/2012.10120v1
- Date: Fri, 18 Dec 2020 09:24:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:18:41.939184
- Title: Technical Progress Analysis Using a Dynamic Topic Model for Technical
Terms to Revise Patent Classification Codes
- Title(参考訳): 動的トピックモデルを用いた特許分類法改正のための技術用語の技術進歩分析
- Authors: Mana Iwata, Yoshiro Matsuda, Yoshimasa Utsumi, Yoshitoshi Tanaka,
Kazuhide Nakata
- Abstract要約: 日本の特許には、日本独自の特許分類コードFI(File Index)が割り当てられています。
2006年以来、リビジョンはすでに30,000以上の新しいFIを確立しています。
機械学習を用いて特許分類コードの改訂を支援することで、精度と効率が向上する。
- 参考スコア(独自算出の注目度): 0.41998444721319217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Japanese patents are assigned a patent classification code, FI (File Index),
that is unique to Japan. FI is a subdivision of the IPC, an international
patent classification code, that is related to Japanese technology. FIs are
revised to keep up with technological developments. These revisions have
already established more than 30,000 new FIs since 2006. However, these
revisions require a lot of time and workload. Moreover, these revisions are not
automated and are thus inefficient. Therefore, using machine learning to assist
in the revision of patent classification codes (FI) will lead to improved
accuracy and efficiency. This study analyzes patent documents from this new
perspective of assisting in the revision of patent classification codes with
machine learning. To analyze time-series changes in patents, we used the
dynamic topic model (DTM), which is an extension of the latent Dirichlet
allocation (LDA). Also, unlike English, the Japanese language requires
morphological analysis. Patents contain many technical words that are not used
in everyday life, so morphological analysis using a common dictionary is not
sufficient. Therefore, we used a technique for extracting technical terms from
text. After extracting technical terms, we applied them to DTM. In this study,
we determined the technological progress of the lighting class F21 for 14 years
and compared it with the actual revision of patent classification codes. In
other words, we extracted technical terms from Japanese patents and applied DTM
to determine the progress of Japanese technology. Then, we analyzed the results
from the new perspective of revising patent classification codes with machine
learning. As a result, it was found that those whose topics were on the rise
were judged to be new technologies.
- Abstract(参考訳): 日本の特許には、日本独自の特許分類コードFI(File Index)が割り当てられている。
fiは、日本の技術に関連する国際特許分類コード(ipc)のサブディビジョンである。
FIは技術開発に合わせて改訂される。
これらの改訂は2006年以来すでに30,000以上の新しいfisを確立している。
しかしながら、これらのリビジョンには多くの時間と作業負荷が必要です。
さらに、これらのリビジョンは自動化されておらず、非効率である。
したがって、機械学習を用いて特許分類コード(FI)の改訂を支援することにより、精度と効率が向上する。
本研究は,機械学習による特許分類コードの改訂を支援する新たな視点から,特許文書の分析を行う。
特許の時系列変化を分析するために,潜在ディリクレ割り当て(LDA)の拡張である動的トピックモデル(DTM)を用いた。
また、英語とは異なり、日本語は形態素解析を必要とする。
特許には日常生活で使われない多くの技術用語が含まれているため、共通辞書を用いた形態解析は不十分である。
そこで,テキストから専門用語を抽出する手法を用いた。
技術的用語を抽出した後,DTMに応用した。
本研究では,14年間の照明クラスF21の技術的進歩を,特許分類コードの実際の改訂と比較した。
言い換えれば、日本の特許から技術用語を抽出し、日本の技術の進歩を判断するためにDTMを適用した。
そこで我々は,機械学習による特許分類コードの変更という新たな視点から,その結果を分析した。
その結果,話題が高まりつつあるものが新技術であると判断された。
関連論文リスト
- Quality-Aware Decoding for Neural Machine Translation [64.24934199944875]
ニューラルネットワーク翻訳(NMT)のための品質認識復号法を提案する。
参照フリーおよび参照ベースMT評価における最近のブレークスルーを,様々な推論手法を用いて活用する。
品質認識復号化は、最先端の自動測定値と人的評価値の両方で、MAPベースの復号化を一貫して上回ります。
論文 参考訳(メタデータ) (2022-05-02T15:26:28Z) - Exploring Dimensionality Reduction Techniques in Multilingual
Transformers [64.78260098263489]
本稿では,多言語シームス変圧器の性能に及ぼす次元還元法の影響を包括的に考察する。
これは、それぞれ91.58% pm 2.59%$と54.65% pm 32.20%$の次元を平均で減少させることが可能であることを示している。
論文 参考訳(メタデータ) (2022-04-18T17:20:55Z) - Automated Single-Label Patent Classification using Ensemble Classifiers [0.0]
特許文書の異なる部分で訓練されたアンサンブル分類器の革新的な方法を提案する。
我々の知る限りでは、特許分類問題に対してアンサンブル法が提案されたのはこれが初めてである。
論文 参考訳(メタデータ) (2022-03-03T08:47:15Z) - Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。
手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。
この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-06T13:28:29Z) - Using Document Similarity Methods to create Parallel Datasets for Code
Translation [60.36392618065203]
あるプログラミング言語から別のプログラミング言語へのソースコードの翻訳は、重要で時間を要する作業です。
本稿では、文書類似性手法を用いて、ノイズの多い並列データセットを作成することを提案する。
これらのモデルは、妥当なレベルのノイズに対して、地上の真実に基づいて訓練されたモデルと相容れない性能を示す。
論文 参考訳(メタデータ) (2021-10-11T17:07:58Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [64.5726087590283]
我々は,文脈を体系的に要求する翻訳を識別する新しい指標であるP-CXMIを提案する。
次に、14の異なる言語対でこれらの現象の一連のタグであるMultilingual Discourse-Aware(MuDA)ベンチマークを開発する。
我々のベンチマークでは、最先端の文脈認識型MTモデルは文脈認識型モデルよりも限界的な改善が見られ、現在のモデルではこれらの曖昧さを効果的に扱えないことが示唆されている。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z) - Linguistically Informed Masking for Representation Learning in the
Patent Domain [7.911344873839031]
本稿では、特許の言語パターンにドメイン適応型事前学習を集中させる、経験的動機付け言語情報マスキング(LIM)手法を提案する。
我々は、特許、科学および汎用言語間の関連する相違を定量化する。
特許ドメインのドメイン適応において、異なる情報ソースからの学習のバランスをとることが及ぼす影響を実証する。
論文 参考訳(メタデータ) (2021-06-10T14:20:57Z) - An interdisciplinary conceptual study of Artificial Intelligence (AI)
for helping benefit-risk assessment practices: Towards a comprehensive
qualification matrix of AI programs and devices (pre-print 2020) [55.41644538483948]
本稿では,インテリジェンスの概念に対処するさまざまな分野の既存の概念を包括的に分析する。
目的は、AIシステムを評価するための共有概念や相違点を特定することである。
論文 参考訳(メタデータ) (2021-05-07T12:01:31Z) - Hybrid Model for Patent Classification using Augmented SBERT and KNN [0.0]
本研究は、Sentence-BERT (SBERT) と K Nearest Neighbours (KNN) による特許クレーム分類のハイブリッドアプローチを提供することを目的とする。
提案フレームワークは,トップkのセマンティック類似性特許の検索に基づいて,個々の入力特許クラスとサブクラスを予測する。
論文 参考訳(メタデータ) (2021-03-22T15:23:19Z) - White Paper Machine Learning in Certified Systems [70.24215483154184]
DEEL Project set-up the ML Certification 3 Workgroup (WG) set-up by the Institut de Recherche Technologique Saint Exup'ery de Toulouse (IRT)
論文 参考訳(メタデータ) (2021-03-18T21:14:30Z) - Introduction of a novel word embedding approach based on technology
labels extracted from patent data [0.0]
本稿では,人間のラベル付きデータの統計的解析を用いた単語埋め込み手法を提案する。
このアルゴリズムは以前のEQMania UG(eqmania.com)の開発であり、2021年4月までeqalice.comでテストできる。
論文 参考訳(メタデータ) (2021-01-31T10:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。