論文の概要: Classifying Organizations for Food System Ontologies using Natural
Language Processing
- arxiv url: http://arxiv.org/abs/2309.10880v1
- Date: Tue, 19 Sep 2023 19:07:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-21 18:04:13.374660
- Title: Classifying Organizations for Food System Ontologies using Natural
Language Processing
- Title(参考訳): 自然言語処理を用いた食品システムオントロジーの分類機構
- Authors: Tianyu Jiang, Sonia Vinogradova, Nathan Stringham, E. Louise Earl,
Allan D. Hollander, Patrick R. Huber, Ellen Riloff, R. Sandra Schillo,
Giorgio A. Ubbiali, Matthew Lange
- Abstract要約: 環境問題に関連する組織を自動的に分類できるNLPモデルを開発した。
入力として、NLPモデルは、組織ごとにGoogle検索エンジンによって検索されるテキストスニペットが提供される。
我々はNLPモデルが知識グラフを蓄積するための情報収集に有望なアプローチであると信じている。
- 参考スコア(独自算出の注目度): 9.462188694526134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our research explores the use of natural language processing (NLP) methods to
automatically classify entities for the purpose of knowledge graph population
and integration with food system ontologies. We have created NLP models that
can automatically classify organizations with respect to categories associated
with environmental issues as well as Standard Industrial Classification (SIC)
codes, which are used by the U.S. government to characterize business
activities. As input, the NLP models are provided with text snippets retrieved
by the Google search engine for each organization, which serves as a textual
description of the organization that is used for learning. Our experimental
results show that NLP models can achieve reasonably good performance for these
two classification tasks, and they rely on a general framework that could be
applied to many other classification problems as well. We believe that NLP
models represent a promising approach for automatically harvesting information
to populate knowledge graphs and aligning the information with existing
ontologies through shared categories and concepts.
- Abstract(参考訳): 本研究は,ナレッジグラフの集団化と食品システムオントロジーの統合を目的としたエンティティの自動分類のための自然言語処理(NLP)手法について検討する。
我々は,NLPモデルを作成し,環境問題に関連するカテゴリや,米国政府がビジネス活動の特徴付けに使用している標準産業分類(SIC)コードに関して,組織を自動的に分類することができる。
入力として、NLPモデルは、各組織のためのGoogle検索エンジンによって検索されるテキストスニペットを備え、学習に使用される組織のテキスト記述として機能する。
実験の結果、NLPモデルはこれらの2つの分類タスクに対して合理的に優れた性能を達成でき、他の多くの分類問題にも適用可能な一般的なフレームワークに依存していることがわかった。
我々は,NLPモデルが知識グラフを自動的に収集し,共有カテゴリや概念を通じて既存のオントロジーと情報を整合させる,有望なアプローチであると信じている。
関連論文リスト
- Automated Extraction and Creation of FBS Design Reasoning Knowledge Graphs from Structured Data in Product Catalogues Lacking Contextual Information [0.10840985826142427]
オントロジーに基づく知識グラフ(KG)は,様々な意思決定シナリオにおいて,効果的な知識管理と再利用が望ましい。
KGの自動抽出と生成に関するほとんどの研究は、広範囲な非構造化データセットに基づいている。
本研究は,このギャップに対処するために開発された手法とデジタルワークフローについて報告する。
論文 参考訳(メタデータ) (2024-12-08T09:20:25Z) - Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - NLP-KG: A System for Exploratory Search of Scientific Literature in Natural Language Processing [3.3916160303055567]
NLP-KGは、未知の自然言語処理分野の研究文献の探索を支援するために設計された機能豊富なシステムである。
セマンティック検索に加えて、NLP-KGは興味のある分野への簡単な紹介を提供する調査論文を簡単に見つけることができる。
フィールド・オブ・スタディ(Fields of Study)階層グラフにより、ユーザーはフィールドとその関連領域に慣れることができる。
論文 参考訳(メタデータ) (2024-06-21T16:38:22Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットにおけるNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - To Classify is to Interpret: Building Taxonomies from Heterogeneous Data
through Human-AI Collaboration [0.39160947065896795]
機械学習(ML)を統合したシステムで分類学の構築を支援する方法について検討する。
本稿では,ユーザが複数のモデルのアウトプットを反復的に考慮できるアプローチを提案する。
論文 参考訳(メタデータ) (2023-07-31T08:24:29Z) - Company classification using zero-shot learning [0.0]
NLPとゼロショット学習を用いた企業分類手法を提案する。
Wharton Research Data Services(WRDS)を用いて得られたデータセットに対する我々のアプローチを評価する。
論文 参考訳(メタデータ) (2023-05-01T18:36:06Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - Learning Mutual Fund Categorization using Natural Language Processing [0.5249805590164901]
自然言語処理(NLP)を用いて,非構造化データから分類システムを直接学習する。
分類システムを高精度に学習できることが示される。
論文 参考訳(メタデータ) (2022-07-11T15:40:18Z) - A Unified Understanding of Deep NLP Models for Text Classification [88.35418976241057]
我々は、テキスト分類のためのNLPモデルの統一的な理解を可能にする視覚解析ツールDeepNLPVisを開発した。
主要なアイデアは相互情報に基づく尺度であり、モデルの各レイヤがサンプル内の入力語の情報をどのように保持するかを定量的に説明する。
コーパスレベル、サンプルレベル、単語レベルビジュアライゼーションで構成されるマルチレベルビジュアライゼーションは、全体トレーニングセットから個々のサンプルまでの分析をサポートする。
論文 参考訳(メタデータ) (2022-06-19T08:55:07Z) - Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。
ディープラーニングには多くのラベル付きデータが必要です。
メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文 参考訳(メタデータ) (2022-05-03T13:58:38Z) - FedNLP: A Research Platform for Federated Learning in Natural Language
Processing [55.01246123092445]
NLPのフェデレーションラーニングのための研究プラットフォームであるFedNLPを紹介します。
FedNLPは、テキスト分類、シーケンスタグ付け、質問応答、Seq2seq生成、言語モデリングなど、NLPで一般的なタスクの定式化をサポートしている。
FedNLPによる予備実験では、分散型データセットと集中型データセットの学習には大きなパフォーマンスギャップが存在することが明らかになった。
論文 参考訳(メタデータ) (2021-04-18T11:04:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。