論文の概要: OAEI Machine Learning Dataset for Online Model Generation
- arxiv url: http://arxiv.org/abs/2404.18542v1
- Date: Mon, 29 Apr 2024 09:33:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 01:28:17.489873
- Title: OAEI Machine Learning Dataset for Online Model Generation
- Title(参考訳): オンラインモデル生成のためのOAEI機械学習データセット
- Authors: Sven Hertling, Ebrahim Norouzi, Harald Sack,
- Abstract要約: オントロジーアライメント評価イニシアチブ(OAEI)によるオントロジーと知識グラフマッチングシステムの評価
OAEIトラックのほとんどに対して、トレーニング、検証、テストセットを含むデータセットを導入します。
- 参考スコア(独自算出の注目度): 0.6472397166280683
- License:
- Abstract: Ontology and knowledge graph matching systems are evaluated annually by the Ontology Alignment Evaluation Initiative (OAEI). More and more systems use machine learning-based approaches, including large language models. The training and validation datasets are usually determined by the system developer and often a subset of the reference alignments are used. This sampling is against the OAEI rules and makes a fair comparison impossible. Furthermore, those models are trained offline (a trained and optimized model is packaged into the matcher) and therefore the systems are specifically trained for those tasks. In this paper, we introduce a dataset that contains training, validation, and test sets for most of the OAEI tracks. Thus, online model learning (the systems must adapt to the given input alignment without human intervention) is made possible to enable a fair comparison for ML-based systems. We showcase the usefulness of the dataset by fine-tuning the confidence thresholds of popular systems.
- Abstract(参考訳): オントロジーと知識グラフマッチングシステムは、オントロジーアライメント評価イニシアチブ(OAEI)によって毎年評価される。
大規模言語モデルを含む、ますます多くのシステムが機械学習ベースのアプローチを使用している。
トレーニングと検証のデータセットは通常、システム開発者によって決定され、しばしば参照アライメントのサブセットが使用される。
このサンプリングはOAEI規則に反し、公正な比較は不可能である。
さらに、これらのモデルはオフラインでトレーニングされている(トレーニングされた最適化されたモデルは、マッチングにパッケージ化されている)。
本稿では,OAEIトラックのほとんどに対するトレーニング,検証,テストセットを含むデータセットを提案する。
このように、オンラインモデル学習(システムは人間の介入なしに入力アライメントに適応しなければならない)は、MLベースのシステムに対して公正な比較を可能にする。
一般的なシステムの信頼性閾値を微調整することで,データセットの有用性を示す。
関連論文リスト
- Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - Synthetic data generation for system identification: leveraging
knowledge transfer from similar systems [0.3749861135832073]
本稿では,データ不足を特徴とするシナリオにおけるモデル一般化とロバスト性の向上を目的とした,新しい合成データ生成手法を提案する。
合成データは、興味あるシステムが属すると考えられる幅広い種類のシステムを記述する、事前訓練されたメタモデルによって生成される。
この手法の有効性は,システム識別プロセスに合成データを組み込むことの利点を強調する数値的な例を通して示される。
論文 参考訳(メタデータ) (2024-03-08T09:09:15Z) - Deep active learning for nonlinear system identification [0.4485566425014746]
我々は非線形システム同定のための新しい深層能動学習手法を開発した。
グローバル探索は、最も情報に富む状態-行動軌道に対応する初期状態のバッチを取得する。
局所的な探索は最適な制御問題を解き、情報の測度を最大化する制御軌道を見つける。
論文 参考訳(メタデータ) (2023-02-24T14:46:36Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Manifold for Machine Learning Assurance [9.594432031144716]
本稿では,機械学習(ML)システムにおいて,要求システムを暗黙的に記述した高次元学習データから抽出する機械学習手法を提案する。
その後、テストの精度測定、テスト入力生成、ターゲットのMLシステムの実行時の監視など、さまざまな品質保証タスクに利用されます。
予備実験により, 提案手法により, 試験精度が試験データの多様性を推し進めるとともに, テスト生成手法が故障を防止し, 現実的なテストケースを生み出すことが確認され, 実行時モニタリングは, 対象システムの出力の信頼性を独立的に評価する手段を提供する。
論文 参考訳(メタデータ) (2020-02-08T11:39:01Z) - From Learning to Meta-Learning: Reduced Training Overhead and Complexity
for Communication Systems [40.427909614453526]
機械学習手法は、データやアクティブな観察に基づいて、一定の学習手順を用いて、与えられたモデルクラスに置かれるように制約されたモデルのパラメータを適応する。
メタトレーニングによる帰納バイアスでは、トレーニングデータと/または時間の複雑さを減らして、マシンラーニングモデルのトレーニングを実行することができる。
本稿では,メタラーニングの高度導入と通信システムへの応用について述べる。
論文 参考訳(メタデータ) (2020-01-05T12:54:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。