論文の概要: Vocab-Expander: A System for Creating Domain-Specific Vocabularies Based
on Word Embeddings
- arxiv url: http://arxiv.org/abs/2308.03519v1
- Date: Mon, 7 Aug 2023 12:13:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 13:52:37.141104
- Title: Vocab-Expander: A System for Creating Domain-Specific Vocabularies Based
on Word Embeddings
- Title(参考訳): Vocab-Expander: 単語埋め込みに基づくドメイン特化語彙作成システム
- Authors: Michael F\"arber, Nicholas Popovic
- Abstract要約: Vocab-Expanderは、エンドユーザ(例えば技術スカウト)が自身の関心領域の語彙を作成し拡張できるオンラインツールである。
それは、Webテキストと常識知識ベースであるConceptNetに基づいて、最先端の単語埋め込みテクニックのアンサンブルを利用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose Vocab-Expander at https://vocab-expander.com, an
online tool that enables end-users (e.g., technology scouts) to create and
expand a vocabulary of their domain of interest. It utilizes an ensemble of
state-of-the-art word embedding techniques based on web text and ConceptNet, a
common-sense knowledge base, to suggest related terms for already given terms.
The system has an easy-to-use interface that allows users to quickly confirm or
reject term suggestions. Vocab-Expander offers a variety of potential use
cases, such as improving concept-based information retrieval in technology and
innovation management, enhancing communication and collaboration within
organizations or interdisciplinary projects, and creating vocabularies for
specific courses in education.
- Abstract(参考訳): 本稿では、エンドユーザー(例えば技術スカウト)が関心領域の語彙を作成し拡張できるオンラインツールである、https://vocab-expander.comでvocab-expanderを提案する。
それは、Webテキストと常識知識ベースであるConceptNetに基づく最先端の単語埋め込み技法のアンサンブルを利用して、すでに与えられた用語に関する関連用語を提案する。
このシステムには使いやすいインタフェースがあり、ユーザーは用語の提案を素早く確認したり拒否したりできる。
Vocab-Expanderは、テクノロジーとイノベーションマネジメントにおける概念ベースの情報検索の改善、組織内や学際プロジェクトにおけるコミュニケーションとコラボレーションの強化、教育の特定のコースのための語彙の作成など、さまざまなユースケースを提供している。
関連論文リスト
- LLMs Meet VLMs: Boost Open Vocabulary Object Detection with Fine-grained
Descriptors [58.75140338866403]
DVDetはディスクリプタ強化オープン語彙検出器である。
局所埋め込みをイメージライクな表現に変換することで、一般的なオープンな語彙検出トレーニングに直接統合することができる。
複数の大規模ベンチマークに対する大規模な実験により、DVDetは最先端技術よりも大きなマージンで一貫して優れていたことが示されている。
論文 参考訳(メタデータ) (2024-02-07T07:26:49Z) - DiscoverPath: A Knowledge Refinement and Retrieval System for
Interdisciplinarity on Biomedical Research [96.10765714077208]
従来のキーワードベースの検索エンジンは、特定の用語に慣れていないユーザーを支援するのに不足している。
本稿では, バイオメディカル研究のための知識グラフに基づく紙検索エンジンを提案し, ユーザエクスペリエンスの向上を図る。
DiscoverPathと呼ばれるこのシステムは、名前付きエンティティ認識(NER)とPOSタグを使って、記事の要約から用語や関係を抽出し、KGを作成する。
論文 参考訳(メタデータ) (2023-09-04T20:52:33Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for
Open-world Detection [118.36746273425354]
本稿では,デザインされた概念辞書から知識の豊かさを生かして,オープンワールド検出のための並列視覚概念事前学習手法を提案する。
概念をそれらの記述で豊かにすることにより、オープンドメイン学習を促進するために、さまざまな概念間の関係を明確に構築する。
提案フレームワークは、例えばLVISデータセット上で、強力なゼロショット検出性能を示し、私たちのDetCLIP-TはGLIP-Tを9.9%向上させ、レアカテゴリで13.5%改善した。
論文 参考訳(メタデータ) (2022-09-20T02:01:01Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - RetroGAN: A Cyclic Post-Specialization System for Improving
Out-of-Knowledge and Rare Word Representations [9.260444813514948]
RetroGANは、概念とその再適合した概念を1対1でマッピングすることを学ぶ。
元々の知識ベースにない概念を扱うためのマッピングが適用される。
3つの単語類似性ベンチマークと下流文単純化タスクで本システムをテストする。
論文 参考訳(メタデータ) (2021-08-30T00:34:23Z) - Enhancing Word Embeddings with Knowledge Extracted from Lexical
Resources [3.7814216736076434]
従来の単語埋め込みと特殊化手法を用いて、単語間の意味的関係をよりよく把握する。
提案手法では,BabelNetのようなリッチな語彙資源から外部知識を活用する。
論文 参考訳(メタデータ) (2020-05-20T13:45:49Z) - Best Practices for Implementing FAIR Vocabularies and Ontologies on the
Web [0.26107298043931193]
本稿では,セマンティックWeb語彙の作成,理解,再利用のためのガイドラインとベストプラクティスについて述べる。
このガイドラインを具体例で説明し、研究者がこれらの実践を語彙で実施するのを手助けする。
論文 参考訳(メタデータ) (2020-03-29T17:40:04Z) - Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。
OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。
本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文 参考訳(メタデータ) (2020-03-19T21:24:45Z) - Distributional semantic modeling: a revised technique to train term/word
vector space models applying the ontology-related approach [36.248702416150124]
ニューラルネットワークを用いた分散項表現(あるいは項埋め込み)学習による分布意味モデリングのための新しい手法を設計する。
Vec2graphは、動的かつインタラクティブなグラフとして単語埋め込み(私たちの場合の長期埋め込み)を視覚化するためのPythonライブラリである。
論文 参考訳(メタデータ) (2020-03-06T18:27:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。