論文の概要: TaBIIC2: Interactive Building of Ontological Taxonomies using Weighted Self-Organizing Maps
- arxiv url: http://arxiv.org/abs/2605.24899v1
- Date: Sun, 24 May 2026 06:55:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.497452
- Title: TaBIIC2: Interactive Building of Ontological Taxonomies using Weighted Self-Organizing Maps
- Title(参考訳): TaBIIC2:軽量自己組織化マップを用いたオントロジー分類学の対話的構築
- Authors: Mathieu d'Aquin,
- Abstract要約: 本稿では,概念分類の進歩的かつインタラクティブな構築を可能にするツールについて述べる。
我々はクラスタリング手法として重み付けされた自己組織化マップに依存している。
この機構と他の機構を統合することで、このツールは純粋に手作業による分析と自動手法の中間的な位置を表現していることを示す。
- 参考スコア(独自算出の注目度): 1.5533842336139063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ontologies represent the conceptual knowledge of a domain. At the core of an ontology is the taxonomy of concepts and subconcepts that represent specific entities, which can be complex to build. In many cases, information is available in the form of records describing the characteristics of relevant entities, i.e., tabular data. Identifying patterns and similarities in such data can serve as a basis for identifying concepts and organizing them. However, doing so manually can be challenging, and purely automatic approaches, such as agglomerative clustering or relying on a large language model to analyze the data, can leave the user with overwhelming results and little control. In this paper, we describe a tool that enables the progressive and interactive construction of a taxonomy of concepts by identifying clusters as well as their intentional definitions. To do so, we rely on weighted self-organizing maps as a clustering method because they enable the creation of an arbitrary number of clusters that are distinct with respect to the distributions of values of specific characteristics of the clustered entities. We show that, by integrating this mechanism and others for rapidly creating concepts that group together instances from tabular data, this tool represents a middle ground between purely manual analysis and automatic methods for building ontological taxonomies.
- Abstract(参考訳): オントロジーはドメインの概念的知識を表す。
オントロジーの核心は、特定の実体を表す概念やサブ概念の分類である。
多くの場合、情報は関連するエンティティ、すなわち表データの特徴を記述するレコードの形式で利用可能である。
このようなデータのパターンや類似性を識別することは、概念を特定し、それらを整理する基盤となる。
しかし、それを手動で行うのは困難であり、集約的なクラスタリングや、データ分析に大規模な言語モデルに頼るといった、純粋に自動的なアプローチは、圧倒的な結果とほとんどコントロールできなくなる。
本稿では,クラスタやその意図的定義を識別することで,概念の分類の段階的かつインタラクティブな構築を可能にするツールについて述べる。
そこで我々は,クラスタリング手法として重み付けされた自己組織化マップを頼りにしており,クラスタ化されたエンティティの特定の特性の値の分布に関して異なる任意の数のクラスタを作成できる。
本手法は, 図表データからインスタンスをグループ化する概念を迅速に作成する機構と組み合わせることで, 純粋に手動解析と自動分類手法の中間地点を表現している。
関連論文リスト
- Cluster-R1: Large Reasoning Models Are Instruction-following Clustering Agents [81.79110139097297]
汎用埋め込みモデルは意味的類似性を認識するのに優れているが、ユーザ命令で指定されたテキストの特徴を捉えることができない。
我々は、命令追従クラスタリングを生成タスクとして再編成し、大規模推論モデルを自律的なクラスタリングエージェントとして訓練する。
我々の推論駆動学習パイプラインは、LEMがハイレベルクラスタリング命令を解釈し、対応する潜在グループを推測することを可能にする。
論文 参考訳(メタデータ) (2026-03-06T10:15:54Z) - Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering [60.05209293008078]
クラスタ分析のための異種属性再構成と表現(HARR)学習パラダイム
HarR はパラメータフリーで収束保証され、異なる要求されたクラスタ数 $k$ に対してより効果的に自己適応することができる。
論文 参考訳(メタデータ) (2026-03-03T08:13:16Z) - Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models [64.58262227709842]
ARISE(Attention-weighted Representation with Integrated Semantic Embeddings)が紹介される。
正確なクラスタリングのためにカテゴリデータのメトリック空間を補完するセマンティックアウェア表現を構築する。
8つのベンチマークデータセットの実験では、7つの代表的なデータセットよりも一貫した改善が示されている。
論文 参考訳(メタデータ) (2026-01-03T11:37:46Z) - ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts [54.60525564599342]
ConceptScopeは、ビジュアルデータセットを分析するためのスケーラブルで自動化されたフレームワークである。
概念を、その意味的関連性とクラスラベルとの統計的相関に基づいて、ターゲット、コンテキスト、バイアスタイプに分類する。
既知のバイアスを確実に検出し、未発表のバイアスを発見できる。
論文 参考訳(メタデータ) (2025-10-30T06:46:17Z) - Question-Driven Analysis and Synthesis: Building Interpretable Thematic Trees with LLMs for Text Clustering and Controllable Generation [1.3750624267664158]
二分木を対話的に構築するための再帰的テーマ分割(RTP)を導入する。
ツリーの各ノードは、データを意味的に分割する自然言語の質問であり、完全に解釈可能な分類である。
RTPの質問駆動階層はBERTopicのような強力なベースラインからのキーワードベースのトピックよりも解釈可能であることを示す。
論文 参考訳(メタデータ) (2025-09-26T11:27:22Z) - TaBIIC: Taxonomy Building through Iterative and Interactive Clustering [2.817412580574242]
本稿では,反復的かつインタラクティブなプロセスにおいて,両方のアプローチからインスピレーションを得る方法を検討する。
本稿では,本手法が様々なデータソースに適用可能であることを示し,オントロジーにより直接的に組み込むことができることを示す。
論文 参考訳(メタデータ) (2023-12-10T12:17:43Z) - Recognizing Entity Types via Properties [5.622134113488239]
プロパティ定義に使用するプロパティに基づいて,etypeを認識可能なプロパティベースのアプローチを導入する。
主なコントリビューションは、etypeとエンティティ間の類似度を測定するプロパティベースのメトリクスセットと、提案した類似度メトリクスを利用する機械学習アルゴリズムである。
論文 参考訳(メタデータ) (2023-04-16T22:42:30Z) - Adaptive Attribute and Structure Subspace Clustering Network [49.040136530379094]
自己表現型サブスペースクラスタリングネットワークを提案する。
まず、入力データサンプルを表現する自動エンコーダについて検討する。
そこで我々は, 局所的な幾何学的構造を捉えるために, 混合符号と対称構造行列を構築した。
構築された属性構造と行列に対して自己表現を行い、親和性グラフを学習する。
論文 参考訳(メタデータ) (2021-09-28T14:00:57Z) - Quantifying Learnability and Describability of Visual Concepts Emerging
in Representation Learning [91.58529629419135]
我々は、ディープニューラルネットワークによって自動的に発見された視覚的なグルーピングを特徴付ける方法を検討する。
本稿では、任意の画像グループ化の解釈可能性の定量化に使用できる視覚的学習可能性と記述可能性という2つの概念を紹介する。
論文 参考訳(メタデータ) (2020-10-27T18:41:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。