論文の概要: MetaAID 2.0: An Extensible Framework for Developing Metaverse
Applications via Human-controllable Pre-trained Models
- arxiv url: http://arxiv.org/abs/2302.13173v1
- Date: Sat, 25 Feb 2023 21:42:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 18:30:52.469548
- Title: MetaAID 2.0: An Extensible Framework for Developing Metaverse
Applications via Human-controllable Pre-trained Models
- Title(参考訳): MetaAID 2.0: 人間の制御可能な事前学習モデルによるメタバースアプリケーション開発のための拡張可能なフレームワーク
- Authors: Hongyin Zhu
- Abstract要約: 本稿では,人間の制御可能なPM情報フローに特化したMetaAID 2.0フレームワークを提案する。
私たちのフレームワークには、マルチモーダルデータを扱うモジュールと、変換と生成をサポートするモジュールが含まれています。
この枠組みに基づき,PM情報流および埋め込み実験を行い,システムの性能を実証した。
- 参考スコア(独自算出の注目度): 0.2741266294612776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-trained models (PM) have achieved promising results in content
generation. However, the space for human creativity and imagination is endless,
and it is still unclear whether the existing models can meet the needs.
Model-generated content faces uncontrollable responsibility and potential
unethical problems. This paper presents the MetaAID 2.0 framework, dedicated to
human-controllable PM information flow. Through the PM information flow, humans
can autonomously control their creativity. Through the Universal Resource
Identifier extension (URI-extension), the responsibility of the model outputs
can be controlled. Our framework includes modules for handling multimodal data
and supporting transformation and generation. The URI-extension consists of
URI, detailed description, and URI embeddings, and supports fuzzy retrieval of
model outputs. Based on this framework, we conduct experiments on PM
information flow and URI embeddings, and the results demonstrate the good
performance of our system.
- Abstract(参考訳): 事前学習モデル(PM)は、コンテンツ生成において有望な結果を得た。
しかし、人間の創造性と想像力の空間は無限であり、既存のモデルがニーズを満たすかどうかはまだ不明である。
モデル生成コンテンツはコントロール不能な責任と潜在的な非倫理的な問題に直面します。
本稿では,人間の制御可能なPM情報フローに特化したMetaAID 2.0フレームワークを提案する。
PM情報の流れによって、人間は創造性を自律的に制御できる。
Universal Resource Identifier拡張(URI拡張)を通じて、モデルの出力の責任を制御することができる。
当社のフレームワークには、マルチモーダルデータを処理し、変換と生成をサポートするモジュールが含まれています。
URI拡張は、URI、詳細な記述、URI埋め込みで構成され、モデル出力のファジィ検索をサポートする。
この枠組みに基づいて,PM情報フローとURI埋め込みの実験を行い,システムの性能を実証した。
関連論文リスト
- Retrieval-Augmented Generation for Large Language Models: A Survey [19.139461618363605]
大きな言語モデル(LLM)は重要な能力を示すが、幻覚、時代遅れの知識、不透明で追跡不能な推論プロセスといった課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2023-12-18T07:47:33Z) - Safety and Fairness for Content Moderation in Generative Models [0.7992463811844456]
テキスト・ツー・イメージ生成技術の責任あるコンテンツモデレーションを概念化する理論的枠組みを提供する。
我々は、安全、公正、およびメートル法エクイティの概念を定義し、区別し、各ドメインで起こりうる害を列挙する。
我々は、データ駆動型コンテンツのモデレーション決定を可能にするハーネスのスタイルについて、まとめて結論付けている。
論文 参考訳(メタデータ) (2023-06-09T01:37:32Z) - An Adversarial Non-Autoregressive Model for Text Generation with
Incomplete Information [13.676683551271015]
本稿では,非自己回帰変換器(ANT)の非完全情報シナリオ(IIS)を提案する。
ANTには2つの特徴がある。1) より合理的な隠蔽表現を提供する位置対応の自己変調、2) 依存性フィードフォワードネットワークは依存性モデリングの能力を強化する。
潜在学習や半教師あり学習など,様々な応用にその可能性を示す。
論文 参考訳(メタデータ) (2023-05-06T08:43:33Z) - FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing [88.6654909354382]
本稿では,顔のアンチ・スプーフィングのためのフレキシブル・モーダル・ビジョン・トランス (FM-ViT) と呼ばれる,純粋なトランスフォーマーベースのフレームワークを提案する。
FM-ViTは、利用可能なマルチモーダルデータの助けを借りて、任意の単一モーダル(すなわちRGB)攻撃シナリオを柔軟にターゲットすることができる。
実験により、FM-ViTに基づいてトレーニングされた単一モデルは、異なるモーダルサンプルを柔軟に評価できるだけでなく、既存のシングルモーダルフレームワークよりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-05-05T04:28:48Z) - A Comprehensive Survey of AI-Generated Content (AIGC): A History of
Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。
AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文 参考訳(メタデータ) (2023-03-07T20:36:13Z) - Named Entity and Relation Extraction with Multi-Modal Retrieval [51.660650522630526]
マルチモーダルな名前付きエンティティ認識(NER)と関係抽出(RE)は、関連画像情報を活用してNERとREの性能を向上させることを目的としている。
新たなマルチモーダル検索フレームワーク(MoRe)を提案する。
MoReはテキスト検索モジュールと画像ベースの検索モジュールを含み、入力されたテキストと画像の関連知識をそれぞれ知識コーパスで検索する。
論文 参考訳(メタデータ) (2022-12-03T13:11:32Z) - MuRAG: Multimodal Retrieval-Augmented Generator for Open Question
Answering over Images and Text [58.655375327681774]
我々は,Multimodal Retrieval-Augmented Transformer (MuRAG)を提案する。
MuRAGは外部の非パラメトリックマルチモーダルメモリにアクセスして言語生成を増強する。
以上の結果から, MuRAGは最先端の精度を達成し, 既存のモデルよりも10~20%精度が高いことがわかった。
論文 参考訳(メタデータ) (2022-10-06T13:58:03Z) - Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文 参考訳(メタデータ) (2022-06-30T17:59:49Z) - Fashionformer: A simple, Effective and Unified Baseline for Human
Fashion Segmentation and Recognition [80.74495836502919]
本研究では,共同ファッションセグメンテーションと属性認識に着目した。
本稿では,セグメンテーションのためのオブジェクトクエリと属性予測のための属性クエリを紹介する。
属性ストリームのために,よりきめ細かい特徴を探索する新しいマルチレイヤレンダリングモジュールを設計する。
論文 参考訳(メタデータ) (2022-04-10T11:11:10Z) - Scanflow: A multi-graph framework for Machine Learning workflow
management, supervision, and debugging [0.0]
本稿では,エンドツーエンドの機械学習ワークフロー管理を支援するコンテナ化指向グラフフレームワークを提案する。
このフレームワークは、コンテナ内でMLを定義してデプロイし、メタデータを追跡し、本番環境での振る舞いを確認し、学習された知識と人為的な知識を使用してモデルを改善する。
論文 参考訳(メタデータ) (2021-11-04T17:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。