論文の概要: MetaAID 2.0: An Extensible Framework for Developing Metaverse
Applications via Human-controllable Pre-trained Models
- arxiv url: http://arxiv.org/abs/2302.13173v1
- Date: Sat, 25 Feb 2023 21:42:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 18:30:52.469548
- Title: MetaAID 2.0: An Extensible Framework for Developing Metaverse
Applications via Human-controllable Pre-trained Models
- Title(参考訳): MetaAID 2.0: 人間の制御可能な事前学習モデルによるメタバースアプリケーション開発のための拡張可能なフレームワーク
- Authors: Hongyin Zhu
- Abstract要約: 本稿では,人間の制御可能なPM情報フローに特化したMetaAID 2.0フレームワークを提案する。
私たちのフレームワークには、マルチモーダルデータを扱うモジュールと、変換と生成をサポートするモジュールが含まれています。
この枠組みに基づき,PM情報流および埋め込み実験を行い,システムの性能を実証した。
- 参考スコア(独自算出の注目度): 0.2741266294612776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-trained models (PM) have achieved promising results in content
generation. However, the space for human creativity and imagination is endless,
and it is still unclear whether the existing models can meet the needs.
Model-generated content faces uncontrollable responsibility and potential
unethical problems. This paper presents the MetaAID 2.0 framework, dedicated to
human-controllable PM information flow. Through the PM information flow, humans
can autonomously control their creativity. Through the Universal Resource
Identifier extension (URI-extension), the responsibility of the model outputs
can be controlled. Our framework includes modules for handling multimodal data
and supporting transformation and generation. The URI-extension consists of
URI, detailed description, and URI embeddings, and supports fuzzy retrieval of
model outputs. Based on this framework, we conduct experiments on PM
information flow and URI embeddings, and the results demonstrate the good
performance of our system.
- Abstract(参考訳): 事前学習モデル(PM)は、コンテンツ生成において有望な結果を得た。
しかし、人間の創造性と想像力の空間は無限であり、既存のモデルがニーズを満たすかどうかはまだ不明である。
モデル生成コンテンツはコントロール不能な責任と潜在的な非倫理的な問題に直面します。
本稿では,人間の制御可能なPM情報フローに特化したMetaAID 2.0フレームワークを提案する。
PM情報の流れによって、人間は創造性を自律的に制御できる。
Universal Resource Identifier拡張(URI拡張)を通じて、モデルの出力の責任を制御することができる。
当社のフレームワークには、マルチモーダルデータを処理し、変換と生成をサポートするモジュールが含まれています。
URI拡張は、URI、詳細な記述、URI埋め込みで構成され、モデル出力のファジィ検索をサポートする。
この枠組みに基づいて,PM情報フローとURI埋め込みの実験を行い,システムの性能を実証した。
関連論文リスト
- Distribution Guided Active Feature Acquisition [14.279123976398926]
本研究では,環境と対話して新たな情報を得るための能動的特徴獲得フレームワークを開発する。
データに存在する情報と条件依存を理解するバックボーン上に、AFAフレームワークを構築します。
生成モデルから得られた副作用および補助報酬を用いて,AFAに対するRLエージェントのトレーニングを指導することが可能であることが示唆された。
論文 参考訳(メタデータ) (2024-10-04T20:38:30Z) - ShieldGemma: Generative AI Content Moderation Based on Gemma [49.91147965876678]
ShieldGemmaは、Gemma2上に構築された安全コンテンツモデレーションモデルのスイートである。
モデルは、主要な危険タイプにわたる安全リスクの堅牢で最先端の予測を提供する。
論文 参考訳(メタデータ) (2024-07-31T17:48:14Z) - "Glue pizza and eat rocks" -- Exploiting Vulnerabilities in Retrieval-Augmented Generative Models [74.05368440735468]
Retrieval-Augmented Generative (RAG)モデルにより大規模言語モデル(LLM)が強化される
本稿では,これらの知識基盤の開放性を敵が活用できるセキュリティ上の脅威を示す。
論文 参考訳(メタデータ) (2024-06-26T05:36:23Z) - Safety and Fairness for Content Moderation in Generative Models [0.7992463811844456]
テキスト・ツー・イメージ生成技術の責任あるコンテンツモデレーションを概念化する理論的枠組みを提供する。
我々は、安全、公正、およびメートル法エクイティの概念を定義し、区別し、各ドメインで起こりうる害を列挙する。
我々は、データ駆動型コンテンツのモデレーション決定を可能にするハーネスのスタイルについて、まとめて結論付けている。
論文 参考訳(メタデータ) (2023-06-09T01:37:32Z) - FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing [88.6654909354382]
本稿では,顔のアンチ・スプーフィングのためのフレキシブル・モーダル・ビジョン・トランス (FM-ViT) と呼ばれる,純粋なトランスフォーマーベースのフレームワークを提案する。
FM-ViTは、利用可能なマルチモーダルデータの助けを借りて、任意の単一モーダル(すなわちRGB)攻撃シナリオを柔軟にターゲットすることができる。
実験により、FM-ViTに基づいてトレーニングされた単一モデルは、異なるモーダルサンプルを柔軟に評価できるだけでなく、既存のシングルモーダルフレームワークよりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-05-05T04:28:48Z) - Named Entity and Relation Extraction with Multi-Modal Retrieval [51.660650522630526]
マルチモーダルな名前付きエンティティ認識(NER)と関係抽出(RE)は、関連画像情報を活用してNERとREの性能を向上させることを目的としている。
新たなマルチモーダル検索フレームワーク(MoRe)を提案する。
MoReはテキスト検索モジュールと画像ベースの検索モジュールを含み、入力されたテキストと画像の関連知識をそれぞれ知識コーパスで検索する。
論文 参考訳(メタデータ) (2022-12-03T13:11:32Z) - MuRAG: Multimodal Retrieval-Augmented Generator for Open Question
Answering over Images and Text [58.655375327681774]
我々は,Multimodal Retrieval-Augmented Transformer (MuRAG)を提案する。
MuRAGは外部の非パラメトリックマルチモーダルメモリにアクセスして言語生成を増強する。
以上の結果から, MuRAGは最先端の精度を達成し, 既存のモデルよりも10~20%精度が高いことがわかった。
論文 参考訳(メタデータ) (2022-10-06T13:58:03Z) - Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文 参考訳(メタデータ) (2022-06-30T17:59:49Z) - Scanflow: A multi-graph framework for Machine Learning workflow
management, supervision, and debugging [0.0]
本稿では,エンドツーエンドの機械学習ワークフロー管理を支援するコンテナ化指向グラフフレームワークを提案する。
このフレームワークは、コンテナ内でMLを定義してデプロイし、メタデータを追跡し、本番環境での振る舞いを確認し、学習された知識と人為的な知識を使用してモデルを改善する。
論文 参考訳(メタデータ) (2021-11-04T17:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。