論文の概要: Human in the Loop Novelty Generation
- arxiv url: http://arxiv.org/abs/2306.04813v2
- Date: Mon, 12 Jun 2023 23:09:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 16:35:04.528425
- Title: Human in the Loop Novelty Generation
- Title(参考訳): ループノベルティ世代における人間
- Authors: Mark Bercasio, Allison Wong, Dustin Dannenhauer
- Abstract要約: 新規性を生成するためにドメイン依存の人間指導を必要としない環境の抽象モデルを用いた新規性生成の新しいアプローチを導入する。
本稿では,オープンソースノベルティ生成ライブラリを用いたHuman-in-the-Loopのノベルティ生成プロセスについて述べる。
以上の結果から,モノポリードメインとビズドゥームドメインの両方において,新規性を4時間以内で開発,実装,テスト,修正できるHuman-in-the-Loop方式が得られた。
- 参考スコア(独自算出の注目度): 2.320417845168326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing artificial intelligence approaches to overcome novel, unexpected
circumstances is a difficult, unsolved problem. One challenge to advancing the
state of the art in novelty accommodation is the availability of testing
frameworks for evaluating performance against novel situations. Recent novelty
generation approaches in domains such as Science Birds and Monopoly leverage
human domain expertise during the search to discover new novelties. Such
approaches introduce human guidance before novelty generation occurs and yield
novelties that can be directly loaded into a simulated environment. We
introduce a new approach to novelty generation that uses abstract models of
environments (including simulation domains) that do not require
domain-dependent human guidance to generate novelties. A key result is a
larger, often infinite space of novelties capable of being generated, with the
trade-off being a requirement to involve human guidance to select and filter
novelties post generation. We describe our Human-in-the-Loop novelty generation
process using our open-source novelty generation library to test baseline
agents in two domains: Monopoly and VizDoom. Our results shows the
Human-in-the-Loop method enables users to develop, implement, test, and revise
novelties within 4 hours for both Monopoly and VizDoom domains.
- Abstract(参考訳): 新たな予期せぬ状況を克服するための人工知能アプローチの開発は、難しい未解決の問題である。
斬新な宿泊施設における最先端技術への挑戦の1つは、新しい状況に対するパフォーマンスを評価するためのテストフレームワークが利用可能であることである。
近年のScience BirdsやMonopolyのようなドメインにおける新規性生成アプローチは、検索中に人間のドメインの専門知識を活用して新しい新規性を発見する。
このようなアプローチは、ノベルティ生成が起こる前に人間の指導を導入し、シミュレーション環境に直接ロードできるノベルティを生み出す。
本稿では,ドメイン依存型人間指導を必要としない環境(シミュレーション領域を含む)の抽象モデルを用いた新規性生成手法を提案する。
鍵となる結果は、生成可能なノベルティのより大きな無限の空間であり、トレードオフは、生成後のノベルティの選択とフィルタリングに人間のガイダンスを必要とする要件である。
当社のオープンソースノベルティジェネレーションライブラリを使用して,モノポリーとvisdoomという2つのドメインのベースラインエージェントをテストしています。
提案手法は,モノポリードメインとビズドゥームドメインの両方において,新規性を4時間以内に開発,実装,テスト,修正できることを示す。
関連論文リスト
- Conserving Human Creativity with Evolutionary Generative Algorithms: A Case Study in Music Generation [0.0]
本研究では,音楽制作における進化的生成アルゴリズムの適用について検討し,人間の創造性を保ち,向上させる。
人間のフィードバックを微分進化アルゴリズムに組み込むことで、国際レコードレーベルに提出された6曲を制作しました。
論文 参考訳(メタデータ) (2024-06-09T18:11:05Z) - On the Resurgence of Recurrent Models for Long Sequences -- Survey and
Research Opportunities in the Transformer Era [59.279784235147254]
この調査は、Recurrenceの統一の傘の下に構築されたこれらのトレンドの概要を提供することを目的としている。
長いシーケンスを処理するという考え方を捨てる際に顕著になる新しい研究機会を強調している。
論文 参考訳(メタデータ) (2024-02-12T23:55:55Z) - Human Motion Generation: A Survey [67.38982546213371]
人間の動き生成は、自然の人間のポーズシーケンスを生成し、現実世界の応用に大きな可能性を示すことを目的としている。
この分野のほとんどの研究は、テキスト、オーディオ、シーンコンテキストなどの条件信号に基づいて人間の動きを生成することに焦点を当てている。
本稿では,人間の動作生成に関する総合的な文献レビューを紹介する。
論文 参考訳(メタデータ) (2023-07-20T14:15:20Z) - Novelty Accommodating Multi-Agent Planning in High Fidelity Simulated
Open World [0.0]
ノベルティ(英: Novelty)は、環境のコア特性、組成、力学を変化させる予期せぬ現象である。
これまでの研究では、新規性はエージェントのパフォーマンスに破滅的な影響を及ぼすことが示されている。
本研究では、軍事領域の現実的な高忠実度シミュレータにおいて、ドメイン非依存のAIエージェントが、斬新な動作と推論を成功させるために適応できることを実証する。
論文 参考訳(メタデータ) (2023-06-22T03:44:04Z) - SciMON: Scientific Inspiration Machines Optimized for Novelty [68.46036589035539]
文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。
モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。
本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文 参考訳(メタデータ) (2023-05-23T17:12:08Z) - Continuous Trajectory Generation Based on Two-Stage GAN [50.55181727145379]
本稿では,道路網上の連続軌道を生成するために,新たな2段階生成対向フレームワークを提案する。
具体的には、A*アルゴリズムの人間の移動性仮説に基づいてジェネレータを構築し、人間の移動性について学習する。
判別器では, 逐次報酬と移動ヤウ報酬を組み合わせることで, 発電機の有効性を高める。
論文 参考訳(メタデータ) (2023-01-16T09:54:02Z) - Maximum entropy exploration in contextual bandits with neural networks
and energy based models [63.872634680339644]
モデルには2つのクラスがあり、1つはニューラルネットワークを報酬推定器とし、もう1つはエネルギーベースモデルを示す。
両手法は、エネルギーベースモデルが最も優れた性能を持つ、よく知られた標準アルゴリズムより優れていることを示す。
これは、静的および動的設定でよく機能する新しいテクニックを提供し、特に連続的なアクション空間を持つ非線形シナリオに適している。
論文 参考訳(メタデータ) (2022-10-12T15:09:45Z) - NovGrid: A Flexible Grid World for Evaluating Agent Response to Novelty [8.705624336757461]
我々はMiniGrid上に構築されたノベルティ生成フレームワークであるNovGridを紹介する。
コアであるNovGridとともに、オントロジーと整合した模範的なノベルティを提供し、ノベルティテンプレートとしてインスタンス化する。
本稿では,新しい適応型機械学習技術の評価のために,フレームワークに組み込まれた指標について述べる。
論文 参考訳(メタデータ) (2022-03-23T01:06:04Z) - A Unifying Framework for Formal Theories of Novelty:Framework, Examples
and Discussion [0.0]
エージェントがラボからオープンワールドに移動するとき、新規、未知、または分散しない入力を管理することは重要です。
ノベルティの形式的理論のための最初の統一フレームワークを提示し、このフレームワークを使用してノベルティタイプのファミリーを公式に定義する。
当社のフレームワークは、象徴的なAIから強化学習、さらにはオープンワールドイメージ認識まで、幅広い領域に適用できます。
論文 参考訳(メタデータ) (2020-12-08T05:24:51Z) - Novel Policy Seeking with Constrained Optimization [131.67409598529287]
本稿では,強化学習課題における新しい政策作成の問題を再考する。
まず、政策間の差異を評価するための新しい指標を導入し、2つの実用的な政策生成手法を設計する。
The Constrained Task Novel Bisector (CTNB) and the internal Policy Differentiation (IPD) is derived from the fiable direction method and the interior point method known in the constrained optimization literature。
論文 参考訳(メタデータ) (2020-05-21T14:39:14Z) - Domain Independent Unsupervised Learning to grasp the Novel Objects [14.667956818920738]
本稿では,学習領域選択のための教師なし学習に基づく新しいアルゴリズムを提案する。
画像平面上での最高の把握ポーズを選択するために,GDI(Grasp Decide Index)という新しい概念を定義した。
我々は、Amazon Robotics Challenge 2017とAmazon Picking Challenge 2016の標準オブジェクト上で、乱雑な、あるいは孤立した環境でいくつかの実験を行った。
論文 参考訳(メタデータ) (2020-01-09T12:05:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。