論文の概要: Knowledge Elicitation using Deep Metric Learning and Psychometric
Testing
- arxiv url: http://arxiv.org/abs/2004.06353v1
- Date: Tue, 14 Apr 2020 08:33:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 08:57:08.597578
- Title: Knowledge Elicitation using Deep Metric Learning and Psychometric
Testing
- Title(参考訳): ディープメトリック学習と心理計測テストを用いた知識誘発
- Authors: Lu Yin, Vlado Menkovski, Mykola Pechenizkiy
- Abstract要約: 画像やビデオなどの高次元データを扱う専門家から,効率的な階層的知識の抽出方法を提案する。
開発されたモデルは、距離が意味論的に意味のある距離空間に高次元データを埋め込み、データは階層構造で整理することができる。
- 参考スコア(独自算出の注目度): 15.989397781243225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge present in a domain is well expressed as relationships between
corresponding concepts. For example, in zoology, animal species form complex
hierarchies; in genomics, the different (parts of) molecules are organized in
groups and subgroups based on their functions; plants, molecules, and
astronomical objects all form complex taxonomies. Nevertheless, when applying
supervised machine learning (ML) in such domains, we commonly reduce the
complex and rich knowledge to a fixed set of labels, and induce a model shows
good generalization performance with respect to these labels. The main reason
for such a reductionist approach is the difficulty in eliciting the domain
knowledge from the experts. Developing a label structure with sufficient
fidelity and providing comprehensive multi-label annotation can be exceedingly
labor-intensive in many real-world applications. In this paper, we provide a
method for efficient hierarchical knowledge elicitation (HKE) from experts
working with high-dimensional data such as images or videos. Our method is
based on psychometric testing and active deep metric learning. The developed
models embed the high-dimensional data in a metric space where distances are
semantically meaningful, and the data can be organized in a hierarchical
structure. We provide empirical evidence with a series of experiments on a
synthetically generated dataset of simple shapes, and Cifar 10 and
Fashion-MNIST benchmarks that our method is indeed successful in uncovering
hierarchical structures.
- Abstract(参考訳): ドメインに存在する知識は、対応する概念間の関係としてよく表される。
例えば動物学では、動物種は複雑な階層を形成し、ゲノム学では、異なる(部分的な)分子はそれらの機能に基づいてグループとサブグループに分けられる。
それにもかかわらず、そのような領域に教師付き機械学習(ML)を適用する場合、一般に、固定されたラベル集合に複雑で豊富な知識を還元し、それらのラベルに対して優れた一般化性能を示すモデルを誘導する。
このような還元主義的アプローチの主な理由は、専門家からドメイン知識を引き出すことが難しいことである。
十分な忠実さと包括的マルチラベルアノテーションを提供するラベル構造を開発することは、現実世界の多くのアプリケーションにおいて非常に労力がかかる。
本稿では,画像や映像などの高次元データを扱う専門家による効率的な階層的知識誘発手法(hke)を提案する。
本手法は,心理計測テストとアクティブ深層メトリクス学習に基づいている。
開発したモデルは、距離が意味的に意味のある距離空間に高次元データを埋め込み、データを階層構造にまとめることができる。
簡単な形状の合成データセットについて実験を行った結果,Cifar 10 と Fashion-MNIST のベンチマークにより,本手法が階層構造を明らかにすることに成功していることを示す。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - End-to-End Ontology Learning with Large Language Models [11.755755139228219]
大規模言語モデル(LLM)は、オントロジー学習の様々なサブタスクを解決するために応用されている。
我々は、オントロジーの分類学的バックボーンをスクラッチから構築する汎用的でスケーラブルな方法であるOLLMによって、このギャップに対処する。
標準的なメトリクスとは対照的に、私たちのメトリクスは、グラフ間のより堅牢な構造的距離測定を定義するためにディープラーニング技術を使用します。
私たちのモデルは、arXivのような新しいドメインに効果的に適用できます。
論文 参考訳(メタデータ) (2024-10-31T02:52:39Z) - Tree-based variational inference for Poisson log-normal models [47.82745603191512]
階層木は、しばしば近接基準に基づいてエンティティを組織するために使用される。
現在のカウントデータモデルは、この構造化情報を利用していない。
本稿では,PLNモデルの拡張としてPLN-Treeモデルを導入し,階層的カウントデータをモデル化する。
論文 参考訳(メタデータ) (2024-06-25T08:24:35Z) - Recognizing Unseen Objects via Multimodal Intensive Knowledge Graph
Propagation [68.13453771001522]
画像の領域と対応するセマンティック埋め込みとをマッチングする多モード集中型ZSLフレームワークを提案する。
我々は、大規模な実世界のデータに基づいて、広範囲な実験を行い、そのモデルを評価する。
論文 参考訳(メタデータ) (2023-06-14T13:07:48Z) - Unsupervised hierarchical clustering using the learning dynamics of RBMs [0.0]
Restricted Boltzmann Machine (RBM) の学習力学を利用した関係データツリー構築のための新しい汎用的手法を提案する。
提案手法は,Plefka拡張から派生した平均場アプローチに基づいて,無秩序なシステムの文脈で開発された。
人工的に階層的なデータセットと3つの異なる実世界のデータセット(桁のイメージ、ヒトゲノムの突然変異、タンパク質のファミリー)でテストした。
論文 参考訳(メタデータ) (2023-02-03T16:53:32Z) - Classification of Consumer Belief Statements From Social Media [0.0]
複雑な専門家アノテーションがいかにして分類に有効に活用できるかを考察する。
自動クラス抽象化アプローチは、テキスト分類タスクのドメインエキスパートベースラインに対して極めてよく機能することがわかった。
論文 参考訳(メタデータ) (2021-06-29T15:25:33Z) - Joint Geometric and Topological Analysis of Hierarchical Datasets [7.098759778181621]
本稿では,複数の階層的データセットに整理された高次元データに注目する。
この研究の主な新規性は、トポロジカルデータ分析と幾何多様体学習という、2つの強力なデータ分析アプローチの組み合わせにある。
本手法は, 最新手法と比較して優れた分類結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-04-03T13:02:00Z) - Latent Feature Representation via Unsupervised Learning for Pattern
Discovery in Massive Electron Microscopy Image Volumes [4.278591555984395]
特に,データセットにおける意味的類似性を捉える潜在表現を学ぶための教師なしのディープラーニングアプローチを提案する。
動物脳の比較的小さな部分でもテラバイトの画像を要求できるナノスケールの電子顕微鏡データに適用する手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-12-22T17:14:19Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。