論文の概要: BOLD: A Benchmark for Linked Data User Agents and a Simulation Framework
for Dynamic Linked Data Environments
- arxiv url: http://arxiv.org/abs/2307.09114v1
- Date: Tue, 18 Jul 2023 10:03:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 15:35:01.470186
- Title: BOLD: A Benchmark for Linked Data User Agents and a Simulation Framework
for Dynamic Linked Data Environments
- Title(参考訳): bold:linked data user agentのベンチマークと動的linked data environmentのシミュレーションフレームワーク
- Authors: Tobias K\"afer, Victor Charpenay, Andreas Harth
- Abstract要約: BOLDベンチマークは、スマートなビルディングに読み取り書きのLinked Dataインターフェースを提供することで、BOLDフレームワークをインスタンス化する。
シミュレーション環境は、タスクの正しい実行をチェックし、エージェントのパフォーマンスを測定する手段を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The paper presents the BOLD (Buildings on Linked Data) benchmark for Linked
Data agents, next to the framework to simulate dynamic Linked Data
environments, using which we built BOLD. The BOLD benchmark instantiates the
BOLD framework by providing a read-write Linked Data interface to a smart
building with simulated time, occupancy movement and sensors and actuators
around lighting. On the Linked Data representation of this environment, agents
carry out several specified tasks, such as controlling illumination. The
simulation environment provides means to check for the correct execution of the
tasks and to measure the performance of agents. We conduct measurements on
Linked Data agents based on condition-action rules.
- Abstract(参考訳): 本稿では,動的linked data環境をシミュレートするフレームワークの横に,linked data agentのためのbold(buildings on linked data)ベンチマークを示す。
BOLDベンチマークはBOLDフレームワークをインスタンス化し、読み書き型Linked Dataインターフェースをスマートな建物に提供し、照明周辺の時間、占有状況、センサー、アクチュエーターをシミュレートする。
この環境のLinked Data表現では、エージェントは照明を制御するなど、いくつかの特定のタスクを実行する。
シミュレーション環境は、タスクの正しい実行をチェックし、エージェントのパフォーマンスを測定する手段を提供する。
条件-作用則に基づくリンクデータエージェントの測定を行う。
関連論文リスト
- BENCHAGENTS: Automated Benchmark Creation with Agent Interaction [16.4783894348333]
BENCHAGENTSは,大規模言語モデル(LLM)を体系的に活用し,複雑な機能のためのベンチマーク作成を自動化するフレームワークである。
我々は、BENCHAGENTSを用いて、テキスト生成時の計画と制約満足度に関連する機能を評価するベンチマークを作成する。
次に、これらのベンチマークを使用して、7つの最先端モデルを調査し、共通の障害モードとモデルの違いに関する新たな洞察を抽出する。
論文 参考訳(メタデータ) (2024-10-29T22:56:18Z) - DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback [62.235925602004535]
データ生成エージェントのための教師環境のテストベッドであるDataEnvGymを紹介する。
DataEnvGymはシーケンシャルな意思決定タスクとしてデータ生成をフレーム化する。
エージェントの目標は、生徒のパフォーマンスを改善することです。
我々は3つの多様なタスク(数学、コード、VQA)をサポートし、複数の学生と教師をテストする。
論文 参考訳(メタデータ) (2024-10-08T17:20:37Z) - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [98.26836657967162]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - ConstScene: Dataset and Model for Advancing Robust Semantic Segmentation
in Construction Environments [1.4070907500169874]
本稿では,建設現場に適したセマンティックセグメンテーションデータセットを提案する。
このデータセットは、オブジェクト検出モデルのトレーニングと評価を強化するように設計されている。
論文 参考訳(メタデータ) (2023-12-27T10:49:19Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - A multi-sourced data and agent-based approach for complementing Time Use
Surveys in the context of residential human activity and load curve
simulation [0.0]
本稿では,定性的・定量的なデータとエージェントベースシミュレーションを組み合わせたSMACH手法を提案する。
その結果、平日や週末の表現が良くなり、アプライアンスとのタスクの柔軟性が向上し、実際のデータと比較して負荷曲線のシミュレーションが改善された。
論文 参考訳(メタデータ) (2023-12-13T08:28:55Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - HandoverSim: A Simulation Framework and Benchmark for Human-to-Robot
Object Handovers [60.45158007016316]
HandoverSimは、人間からロボットへのオブジェクトハンドオーバのシミュレーションベンチマークである。
我々は、物体の手でのつかみの最近のモーションキャプチャーデータセットを活用する。
標準化されたプロトコルとメトリクスを使って受信機のトレーニングと評価環境を作成します。
論文 参考訳(メタデータ) (2022-05-19T17:59:00Z) - Sim-to-Real Domain Adaptation for Lane Detection and Classification in
Autonomous Driving [0.0]
教師なしのドメイン適応(UDA)アプローチは低コストで時間を要すると考えられている。
自動走行における車線検出と分類のための逆判別および生成手法を用いたUDAスキームを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:10:14Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。