論文の概要: Gendered Words and Grant Rates: A Textual Analysis of Disparate Outcomes in the Patent System
- arxiv url: http://arxiv.org/abs/2411.08526v2
- Date: Wed, 18 Dec 2024 17:24:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 16:47:13.551570
- Title: Gendered Words and Grant Rates: A Textual Analysis of Disparate Outcomes in the Patent System
- Title(参考訳): ジェンダードワードとグラントレート:特許制度における異なる成果のテキスト分析
- Authors: Deborah Gerhardt, Miriam Marcowitz-Bitton, W. Michael Schuster, Avshalom Elmalech, Omri Suissa, Moshe Mash,
- Abstract要約: この記事では、機械学習と自然言語処理を使用して、特許出願から隠れた情報を抽出する。
発明者の性別は、発明者の名前を知ることなく、しばしばテキストの属性から識別できる。
また,特許出願の客観的特徴が付与されるかどうかを予測できるかどうかについても検討した。
- 参考スコア(独自算出の注目度): 1.53934570513443
- License:
- Abstract: Text is a vehicle to convey information that reflects the writer's linguistic style and communicative patterns. By studying these attributes, we can discover latent insights about the author and their underlying message. This article uses such an approach to better understand patent applications and their inventors. While prior research focuses on patent metadata, we employ machine learning and natural language processing to extract hidden information from the words in patent applications. Through these methods, we find that inventor gender can often be identified from textual attributes - even without knowing the inventor's name. This ability to discern gender through text suggests that anonymized patent examination - often proposed as a solution to mitigate disparities in patent grant rates - may not fully address gendered outcomes in securing a patent. Our study also investigates whether objective features of a patent application can predict if it will be granted. Using a classifier algorithm, we correctly predicted whether a patent was granted over 60% of the time. Further analysis emphasized that writing style - like vocabulary and sentence complexity - disproportionately influenced grant predictions relative to other attributes such as inventor gender and subject matter keywords. Lastly, we examine whether women disproportionately invent in technological areas with higher rejection rates. Using a clustering algorithm, applications were allocated into groups with related subject matter. We found that 85% of female-dominated clusters have abnormally high rejection rates, compared to only 45% for male-dominated groupings. These findings highlight complex interactions between textual choices, gender, and success in securing a patent. They also raise questions about whether current proposals will be sufficient to achieve gender equity and efficiency in the patent system.
- Abstract(参考訳): テキストは、著者の言語スタイルとコミュニケーションパターンを反映した情報を伝える手段である。
これらの属性を研究することで、著者とその基盤となるメッセージに関する潜伏した洞察を発見することができる。
この記事では、特許出願とその発明者をよりよく理解するために、そのようなアプローチを使用します。
従来の研究は特許メタデータに重点を置いていたが、我々は機械学習と自然言語処理を用いて特許出願中の単語から隠れた情報を抽出している。
これらの手法により、発明者の性別は、発明者の名前を知ることなく、しばしばテキストの属性から識別できることがわかった。
テキストを通じて性別を識別するこの能力は、匿名化された特許審査(しばしば特許付与率の格差を軽減するソリューションとして提案される)が、特許の確保における性別による結果を完全に解決することができないことを示唆している。
また,特許出願の客観的特徴が付与されるかどうかを予測できるかどうかについても検討した。
分類アルゴリズムを用いて、特許が60%以上付与されたかどうかを正確に予測した。
さらに分析では、語彙や文の複雑さなど、文章のスタイルが、発明者の性別や主題のキーワードといった他の属性と比較して、助成金の予測に不相応に影響を与えていることを強調した。
最後に,女性が拒絶率の高い技術分野で不均等に発明するかどうかを検討する。
クラスタリングアルゴリズムを用いて、アプリケーションは関連する主題を持つグループに割り当てられた。
その結果,女性支配群では85%が拒絶率が高く,男性支配群では45%に過ぎなかった。
これらの発見は、テキストの選択、性別、特許の確保の成功の間の複雑な相互作用を浮き彫りにしている。
彼らはまた、現在提案されている提案が、特許システムにおけるジェンダーエクイティと効率を達成するのに十分かどうかという疑問も提起している。
関連論文リスト
- ExaGPT: Example-Based Machine-Generated Text Detection for Human Interpretability [62.285407189502216]
LLM(Large Language Models)によって生成されたテキストの検出は、誤った判断によって致命的な誤りを引き起こす可能性がある。
本稿では,人間の意思決定プロセスに根ざした解釈可能な検出手法であるExaGPTを紹介する。
以上の結果から,ExaGPTは従来の強力な検出器よりも最大で40.9ポイントの精度を1%の偽陽性率で大きく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2025-02-17T01:15:07Z) - PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。
我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。
引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文 参考訳(メタデータ) (2024-11-20T17:23:40Z) - Comparing Complex Concepts with Transformers: Matching Patent Claims Against Natural Language Text [0.0]
特許出願や特許ポートフォリオを管理する重要な能力は、請求書を他のテキスト、例えば特許仕様と比較することである。
2つの新しいLCMベースのアプローチをテストし、両者が以前公表した値よりもかなり優れたパフォーマンスを提供することを示した。
あるドメインからの密集した情報を、異なる語彙で表されるはるかに多くの分散情報とマッチングする能力は、知的財産空間を超えても有用である。
論文 参考訳(メタデータ) (2024-07-14T22:31:07Z) - Connecting the Dots: Inferring Patent Phrase Similarity with Retrieved Phrase Graphs [18.86788223751979]
本稿では,2つの特許句間の意味的類似度を測定する特許フレーズ類似性推論タスクについて検討する。
本稿では,特許用語のグローバルな文脈情報を増幅するためのグラフ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-03-24T18:59:38Z) - Natural Language Processing in Patents: A Survey [0.0]
重要な技術的および法的情報をカプセル化した特許は、自然言語処理(NLP)アプリケーションのための豊富なドメインを提供する。
NLP技術が発展するにつれて、大規模言語モデル(LLM)は一般的なテキスト処理や生成タスクにおいて優れた能力を示してきた。
本稿は,NLP研究者に,この複雑な領域を効率的にナビゲートするために必要な知識を付与することを目的とする。
論文 参考訳(メタデータ) (2024-03-06T23:17:16Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - A Novel Patent Similarity Measurement Methodology: Semantic Distance and
Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。
自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。
本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T07:55:31Z) - Auditing Gender Presentation Differences in Text-to-Image Models [54.16959473093973]
我々は、テキスト・ツー・イメージ・モデルにおいて、ジェンダーがどのように異なる形で提示されるかを研究する。
入力テキスト中の性指標を探索することにより、プレゼンテーション中心属性の周波数差を定量化する。
このような違いを推定する自動手法を提案する。
論文 参考訳(メタデータ) (2023-02-07T18:52:22Z) - A Survey on Sentence Embedding Models Performance for Patent Analysis [0.0]
本稿では,PatentSBERTaアプローチに基づく埋め込みモデルの精度を評価するための標準ライブラリとデータセットを提案する。
patentSBERTa, Bert-for-patents, and TF-IDF Weighted Word Embeddings is the most accuracy for computing sentence embeddeds at the subclass level。
論文 参考訳(メタデータ) (2022-04-28T12:04:42Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - Gender Stereotype Reinforcement: Measuring the Gender Bias Conveyed by
Ranking Algorithms [68.85295025020942]
本稿では,性別ステレオタイプをサポートする検索エンジンの傾向を定量化するジェンダーステレオタイプ強化(GSR)尺度を提案する。
GSRは、表現上の害を定量化できる情報検索のための、最初の特別に調整された尺度である。
論文 参考訳(メタデータ) (2020-09-02T20:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。