Fugu-MT 論文翻訳(概要): MetaAID 2.0: An Extensible Framework for Developing Metaverse Applications via Human-controllable Pre-trained Models

論文の概要: MetaAID 2.0: An Extensible Framework for Developing Metaverse Applications via Human-controllable Pre-trained Models

arxiv url: http://arxiv.org/abs/2302.13173v1
Date: Sat, 25 Feb 2023 21:42:31 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-28 18:30:52.469548
Title: MetaAID 2.0: An Extensible Framework for Developing Metaverse Applications via Human-controllable Pre-trained Models
Title（参考訳）: MetaAID 2.0: 人間の制御可能な事前学習モデルによるメタバースアプリケーション開発のための拡張可能なフレームワーク
Authors: Hongyin Zhu
Abstract要約: 本稿では,人間の制御可能なPM情報フローに特化したMetaAID 2.0フレームワークを提案する。私たちのフレームワークには、マルチモーダルデータを扱うモジュールと、変換と生成をサポートするモジュールが含まれています。この枠組みに基づき,PM情報流および埋め込み実験を行い,システムの性能を実証した。
参考スコア（独自算出の注目度）: 0.2741266294612776
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Pre-trained models (PM) have achieved promising results in content generation. However, the space for human creativity and imagination is endless, and it is still unclear whether the existing models can meet the needs. Model-generated content faces uncontrollable responsibility and potential unethical problems. This paper presents the MetaAID 2.0 framework, dedicated to human-controllable PM information flow. Through the PM information flow, humans can autonomously control their creativity. Through the Universal Resource Identifier extension (URI-extension), the responsibility of the model outputs can be controlled. Our framework includes modules for handling multimodal data and supporting transformation and generation. The URI-extension consists of URI, detailed description, and URI embeddings, and supports fuzzy retrieval of model outputs. Based on this framework, we conduct experiments on PM information flow and URI embeddings, and the results demonstrate the good performance of our system.
Abstract（参考訳）: 事前学習モデル(PM)は、コンテンツ生成において有望な結果を得た。しかし、人間の創造性と想像力の空間は無限であり、既存のモデルがニーズを満たすかどうかはまだ不明である。モデル生成コンテンツはコントロール不能な責任と潜在的な非倫理的な問題に直面します。本稿では,人間の制御可能なPM情報フローに特化したMetaAID 2.0フレームワークを提案する。 PM情報の流れによって、人間は創造性を自律的に制御できる。 Universal Resource Identifier拡張(URI拡張)を通じて、モデルの出力の責任を制御することができる。当社のフレームワークには、マルチモーダルデータを処理し、変換と生成をサポートするモジュールが含まれています。 URI拡張は、URI、詳細な記述、URI埋め込みで構成され、モデル出力のファジィ検索をサポートする。この枠組みに基づいて,PM情報フローとURI埋め込みの実験を行い,システムの性能を実証した。

関連論文リスト

A Survey on MLLM-based Visually Rich Document Understanding: Methods, Challenges, and Emerging Trends [11.428017294202162]
Visually-Rich Document Understanding (VRDU)は、複雑なビジュアル、テキスト、レイアウト情報を含む文書を自動的に処理する必要があるため、重要な分野として登場した。この調査はMLLMベースのVRDUの最近の進歩をレビューし、3つのコアコンポーネントを強調した。
論文参考訳（メタデータ） (2025-07-14T02:10:31Z)
T2VShield: Model-Agnostic Jailbreak Defense for Text-to-Video Models [88.63040835652902]
テキストからビデオモデルへの攻撃はジェイルブレイク攻撃に弱いため、特別な方法で安全メカニズムをバイパスし、有害または安全でないコンテンツの生成につながる。我々は、ジェイルブレイクの脅威からテキストからビデオモデルを守るために設計された包括的でモデルに依存しない防衛フレームワークであるT2VShieldを提案する。本手法は,既存の防御の限界を特定するために,入力,モデル,出力の段階を体系的に解析する。
論文参考訳（メタデータ） (2025-04-22T01:18:42Z)
Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation [10.402456492958457]
本研究の目的は、意味的に制御可能な生成ネットワークが、デジタル顔モデリングプロセスの制御を強化できることを実証することである。本稿では,事前学習した拡散モデルを用いて,高品質な3次元顔データベースを作成する新しいデータ生成パイプラインを提案する。高品質な顔アセットを作成・編集するための包括的システムを導入する。
論文参考訳（メタデータ） (2025-04-21T17:38:50Z)
Distribution Guided Active Feature Acquisition [14.279123976398926]
本研究では,環境と対話して新たな情報を得るための能動的特徴獲得フレームワークを開発する。データに存在する情報と条件依存を理解するバックボーン上に、AFAフレームワークを構築します。生成モデルから得られた副作用および補助報酬を用いて,AFAに対するRLエージェントのトレーニングを指導することが可能であることが示唆された。
論文参考訳（メタデータ） (2024-10-04T20:38:30Z)
ShieldGemma: Generative AI Content Moderation Based on Gemma [49.91147965876678]
ShieldGemmaは、Gemma2上に構築された安全コンテンツモデレーションモデルのスイートである。モデルは、主要な危険タイプにわたる安全リスクの堅牢で最先端の予測を提供する。
論文参考訳（メタデータ） (2024-07-31T17:48:14Z)
"Glue pizza and eat rocks" -- Exploiting Vulnerabilities in Retrieval-Augmented Generative Models [74.05368440735468]
Retrieval-Augmented Generative (RAG)モデルにより大規模言語モデル(LLM)が強化される本稿では,これらの知識基盤の開放性を敵が活用できるセキュリティ上の脅威を示す。
論文参考訳（メタデータ） (2024-06-26T05:36:23Z)
Safety and Fairness for Content Moderation in Generative Models [0.7992463811844456]
テキスト・ツー・イメージ生成技術の責任あるコンテンツモデレーションを概念化する理論的枠組みを提供する。我々は、安全、公正、およびメートル法エクイティの概念を定義し、区別し、各ドメインで起こりうる害を列挙する。我々は、データ駆動型コンテンツのモデレーション決定を可能にするハーネスのスタイルについて、まとめて結論付けている。
論文参考訳（メタデータ） (2023-06-09T01:37:32Z)
FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing [88.6654909354382]
本稿では,顔のアンチ・スプーフィングのためのフレキシブル・モーダル・ビジョン・トランス (FM-ViT) と呼ばれる,純粋なトランスフォーマーベースのフレームワークを提案する。 FM-ViTは、利用可能なマルチモーダルデータの助けを借りて、任意の単一モーダル(すなわちRGB)攻撃シナリオを柔軟にターゲットすることができる。実験により、FM-ViTに基づいてトレーニングされた単一モデルは、異なるモーダルサンプルを柔軟に評価できるだけでなく、既存のシングルモーダルフレームワークよりも大きなマージンで優れていることが示された。
論文参考訳（メタデータ） (2023-05-05T04:28:48Z)
Named Entity and Relation Extraction with Multi-Modal Retrieval [51.660650522630526]
マルチモーダルな名前付きエンティティ認識(NER)と関係抽出(RE)は、関連画像情報を活用してNERとREの性能を向上させることを目的としている。新たなマルチモーダル検索フレームワーク(MoRe)を提案する。 MoReはテキスト検索モジュールと画像ベースの検索モジュールを含み、入力されたテキストと画像の関連知識をそれぞれ知識コーパスで検索する。
論文参考訳（メタデータ） (2022-12-03T13:11:32Z)
MuRAG: Multimodal Retrieval-Augmented Generator for Open Question Answering over Images and Text [58.655375327681774]
我々は,Multimodal Retrieval-Augmented Transformer (MuRAG)を提案する。 MuRAGは外部の非パラメトリックマルチモーダルメモリにアクセスして言語生成を増強する。以上の結果から, MuRAGは最先端の精度を達成し, 既存のモデルよりも10～20%精度が高いことがわかった。
論文参考訳（メタデータ） (2022-10-06T13:58:03Z)
Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。 DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文参考訳（メタデータ） (2022-06-30T17:59:49Z)
Scanflow: A multi-graph framework for Machine Learning workflow management, supervision, and debugging [0.0]
本稿では,エンドツーエンドの機械学習ワークフロー管理を支援するコンテナ化指向グラフフレームワークを提案する。このフレームワークは、コンテナ内でMLを定義してデプロイし、メタデータを追跡し、本番環境での振る舞いを確認し、学習された知識と人為的な知識を使用してモデルを改善する。
論文参考訳（メタデータ） (2021-11-04T17:01:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。