論文の概要: Interactive Ontology Matching with Cost-Efficient Learning
- arxiv url: http://arxiv.org/abs/2404.07663v1
- Date: Thu, 11 Apr 2024 11:53:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 14:09:30.863942
- Title: Interactive Ontology Matching with Cost-Efficient Learning
- Title(参考訳): コスト効率のよい学習と対話型オントロジーマッチング
- Authors: Bin Cheng, Jonathan Fürst, Tobias Jacobs, Celia Garrido-Hidalgo,
- Abstract要約: この研究は、マッチングに適したアクティブな学習方法であるDualLoopを紹介している。
既存のアクティブラーニング手法と比較すると,F1のスコアとリコールは一貫して向上した。
本稿では,建築,工学,建設(AEC)産業部門における運用実績について報告する。
- 参考スコア(独自算出の注目度): 2.006461411375746
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The creation of high-quality ontologies is crucial for data integration and knowledge-based reasoning, specifically in the context of the rising data economy. However, automatic ontology matchers are often bound to the heuristics they are based on, leaving many matches unidentified. Interactive ontology matching systems involving human experts have been introduced, but they do not solve the fundamental issue of flexibly finding additional matches outside the scope of the implemented heuristics, even though this is highly demanded in industrial settings. Active machine learning methods appear to be a promising path towards a flexible interactive ontology matcher. However, off-the-shelf active learning mechanisms suffer from low query efficiency due to extreme class imbalance, resulting in a last-mile problem where high human effort is required to identify the remaining matches. To address the last-mile problem, this work introduces DualLoop, an active learning method tailored to ontology matching. DualLoop offers three main contributions: (1) an ensemble of tunable heuristic matchers, (2) a short-term learner with a novel query strategy adapted to highly imbalanced data, and (3) long-term learners to explore potential matches by creating and tuning new heuristics. We evaluated DualLoop on three datasets of varying sizes and domains. Compared to existing active learning methods, we consistently achieved better F1 scores and recall, reducing the expected query cost spent on finding 90% of all matches by over 50%. Compared to traditional interactive ontology matchers, we are able to find additional, last-mile matches. Finally, we detail the successful deployment of our approach within an actual product and report its operational performance results within the Architecture, Engineering, and Construction (AEC) industry sector, showcasing its practical value and efficiency.
- Abstract(参考訳): 高品質なオントロジの作成は、データ統合と知識に基づく推論、特にデータ経済の上昇という文脈において不可欠である。
しかし、自動オントロジーマッチは、しばしばそれらがベースとしているヒューリスティックに結びついており、多くのマッチは未同定のままである。
人間の専門家を巻き込んだ対話型オントロジーマッチングシステムが導入されたが、産業環境では高い需要があるにもかかわらず、実装されたヒューリスティックスの範囲外の追加のマッチを柔軟に見つけるという根本的な問題は解決していない。
アクティブな機械学習手法は、フレキシブルな対話型オントロジーマーカへの有望な道のようだ。
しかし、既成のアクティブ学習メカニズムは、極端なクラス不均衡によるクエリ効率の低下に悩まされ、残余の一致を識別するために高い人的労力を要するラストマイル問題が発生する。
最後のマイル問題に対処するため,本研究では,オントロジーマッチングに適したアクティブ学習手法であるDualLoopを導入する。
デュアルループは,(1)調整可能なヒューリスティック・マーカのアンサンブル,(2)高度に不均衡なデータに適応した新しいクエリ・ストラテジーを持つ短期学習者,(3)新しいヒューリスティックを作成・調整することで潜在的なマッチングを探索する長期学習者,の3つの主な貢献を行う。
異なるサイズと領域の3つのデータセットでDualLoopを評価した。
既存のアクティブラーニング手法と比較して、我々は一貫してF1スコアとリコールを達成し、すべてのマッチの90%を50%以上減らした。
従来のインタラクティブなオントロジーマッチングと比較して、私たちはさらにラストマイルのマッチを見つけることができます。
最後に、実際の製品への私たちのアプローチの展開を成功させ、アーキテクチャ、エンジニアリング、建設(AEC)業界における運用実績を報告し、その実用的価値と効率を示す。
関連論文リスト
- Complexity Matters: Dynamics of Feature Learning in the Presence of Spurious Correlations [13.119576365743624]
突発的な相関の下で特徴学習のダイナミクスを考察する。
以上の結果から, 最終層の再トレーニングの成功を正当化し, 急激な相関を除去できることが示唆された。
また、突発的特徴の早期学習を利用する一般的なデバイアスアルゴリズムの限界も特定する。
論文 参考訳(メタデータ) (2024-03-05T23:54:00Z) - Beyond Two-Tower Matching: Learning Sparse Retrievable
Cross-Interactions for Recommendation [80.19762472699814]
2-towerモデルは、産業アプリケーションに広くデプロイされている推奨のための一般的なマッチングフレームワークである。
機能間相互作用の制限と、オンラインサービスにおける精度の低下など、主な課題が2つある。
我々は,高度な機能相互作用だけでなく,効率的な検索もサポートするSparCodeという新しいマッチングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-11-30T03:13:36Z) - The Battleship Approach to the Low Resource Entity Matching Problem [0.0]
本稿では,エンティティマッチング問題に対する新しいアクティブな学習手法を提案する。
我々は、エンティティマッチングのユニークな特性を利用する選択メカニズムに焦点を当てる。
実験により,提案アルゴリズムは,最先端のアクティブ・ラーニング・ソリューションより低リソース・エンティティ・マッチングに優れることを示した。
論文 参考訳(メタデータ) (2023-11-27T10:18:17Z) - Unveiling the Limits of Learned Local Search Heuristics: Are You the
Mightiest of the Meek? [14.195843311387591]
Tabu Searchに基づく単純な学習は、パフォーマンスと一般化性の点で最先端の学習を超越していることが示される。
今後の研究に向けて,本研究は仮定に挑戦し,エキサイティングな道を開いた。
論文 参考訳(メタデータ) (2023-10-30T20:16:42Z) - Actively Discovering New Slots for Task-oriented Conversation [19.815466126158785]
本稿では,ループ内学習を実現するため,情報抽出方式で汎用的なスロットタスクを提案する。
我々は既存の言語ツールを活用し、対応するラベルが弱い監視信号として利用される値候補を抽出する。
いくつかの公開データセットに対して広範な実験を行い、競合するベースラインを多数比較して手法を実証する。
論文 参考訳(メタデータ) (2023-05-06T13:33:33Z) - Causal Triplet: An Open Challenge for Intervention-centric Causal
Representation Learning [98.78136504619539]
Causal Tripletは、視覚的に複雑なシーンを特徴とする因果表現学習ベンチマークである。
この結果から,不整合表現やオブジェクト中心表現の知識によって構築されたモデルが,分散表現よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-01-12T17:43:38Z) - NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research [96.53307645791179]
我々は,100以上の視覚的分類タスクのストリームからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
NEVIS'22は、タスクの規模と多様性のために、現在のシーケンシャルな学習アプローチに対して前例のない課題を提起している。
論文 参考訳(メタデータ) (2022-11-15T18:57:46Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - BUSTLE: Bottom-Up Program Synthesis Through Learning-Guided Exploration [72.88493072196094]
プログラムのボトムアップ検索に学習を活用する新しい合成手法を提案する。
特に、入力出力例のセットに基づいて、探索条件中の中間値の合成を優先順位付けするようにモデルを訓練する。
単純な教師付き学習アプローチであっても,学習とボトムアップ検索の組み合わせは極めて効果的であることを示す。
論文 参考訳(メタデータ) (2020-07-28T17:46:18Z) - Symbiotic Adversarial Learning for Attribute-based Person Search [86.7506832053208]
本稿では,共生学習の枠組みとして,共生学習の基盤に2つのGANを配置する。
具体的には、2種類の生成的敵ネットワークがトレーニングプロセスを通して協調的に学習する。
論文 参考訳(メタデータ) (2020-07-19T07:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。