GPT-4o System Card [211.9] GPT-4oは自動回帰オムニモデルであり、テキスト、オーディオ、画像、ビデオの組み合わせを入力として受け入れる。
テキスト、ビジョン、オーディオでエンドツーエンドにトレーニングされており、すべての入力と出力は同じニューラルネットワークで処理される。
GPT-4は、英語とコードのテキスト上でのTurboのパフォーマンスと一致し、非英語のテキストでは大幅に改善された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:43:01 GMT)
Two are better than one: Context window extension with multi-grained self-injection [111.1] SharedLLMは、多粒度コンテキスト圧縮とクエリ対応情報検索の設計哲学に基づく新しいアプローチである。
本研究では,テキストチャンクの多粒度コンテキスト情報を効率的にエンコードし,保存し,検索するための木構造データ構造を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:08:59 GMT)
A Survey of Small Language Models [104.8] 小言語モデル (SLM) は, 計算資源の最小化による言語タスクの効率化と性能の向上により, ますます重要になってきている。
本稿では,SLMのアーキテクチャ,トレーニング技術,モデル圧縮技術に着目した総合的な調査を行う。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:52:28 GMT)
MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.6] 本稿では,車載メタバースにおける拡張現実(AR)サービスの学習モデルを支援するために,メタバースユーザ(MU)にインセンティブを与える新しい没入型モデルトレーディングフレームワークを提案する。
動的ネットワーク条件とプライバシの懸念を考慮して、マルチエージェントマルコフ決定プロセスとしてMSPの報酬決定を定式化する。
実験により,提案フレームワークは,実AR関連車両データセット上でのARサービスにおいて,オブジェクト検出と分類のための高価値モデルを効果的に提供できることが示されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:20:46 GMT)
StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.3] Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。
本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。
実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:18:37 GMT)
StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.3] Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。
本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。
実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:18:37 GMT)
AMOR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback [91.8] オープンソースの大規模言語モデル(LLM)に基づくエージェントフレームワークAMORを提案する。
AMORは有限状態マシン(FSM)上に推論ロジックを構築し、自律的な実行と非絡み合ったモジュールの遷移によって問題を解決する。
この推論とフィードバックの枠組みに基づき、2段階の微調整(ウォームアップと適応)によりAMORを開発する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:30:32 GMT)
Gradient Rewiring for Editable Graph Neural Network Training [84.8] underlineGradient underlineRewiringメソッドは、textbfGREという、アンダーライン編集可能なグラフニューラルネットワークトレーニングのためのものだ。
そこで本稿では,textbfGRE という名前のアンダーライン編集可能なグラフニューラルネットワークトレーニングのための,シンプルで効果的なアンダーライングラディエントアンダーラインリスイッチ法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:37:43 GMT)
Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding [84.3] 拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然なデザイン空間を捉えるのに優れている。
これらの設計空間の自然性を保ちながら、下流の報酬関数を最適化することを目指している。
提案アルゴリズムは,中間雑音状態が将来高い報酬をもたらすことの先駆けとして,ソフトバリュー関数を統合する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:50:44 GMT)
Revealing and Reducing Gender Biases in Vision and Language Assistants (VLAs) [82.6] 画像・テキスト・ビジョン言語アシスタント(VLA)22種における性別バイアスの検討
以上の結果から,VLAは実世界の作業不均衡など,データ中の人間のバイアスを再現する可能性が示唆された。
これらのモデルにおける性別バイアスを排除するため、微調整に基づくデバイアス法は、下流タスクにおけるデバイアスとパフォーマンスの最良のトレードオフを実現する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:59:44 GMT)
AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting [82.5] ストロークベースのレンダリング(SBR)は、入力画像をパラメータ化されたストロークのシーケンスに分解することを目的としており、入力画像に似た絵に描画することができる。
単一ステップのニューラルペイントのための効率よく適応的なモデルであるAttentionPainterを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:39:43 GMT)
OneRef: Unified One-tower Expression Grounding and Segmentation with Mask Referring Modeling [80.9] モダリティ共有型1-tower変換器上に構築された最小限の参照フレームワークであるOneRefを提案する。
参照関係をモデル化するために,マスク参照モデリング(MRefM)と呼ばれる新しいMVLMパラダイムを導入する。
MRefM内では,参照型動的画像マスキング戦略を提案し,参照領域を認識した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:25:26 GMT)
OneRef: Unified One-tower Expression Grounding and Segmentation with Mask Referring Modeling [80.9] モダリティ共有型1-tower変換器上に構築された最小限の参照フレームワークであるOneRefを提案する。
参照関係をモデル化するために,マスク参照モデリング(MRefM)と呼ばれる新しいMVLMパラダイムを導入する。
MRefM内では,参照型動的画像マスキング戦略を提案し,参照領域を認識した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:25:26 GMT)
CloserMusicDB: A Modern Multipurpose Dataset of High Quality Music [79.2] 人間のチームによって注釈付けされた完全長のスタジオ品質トラックのコレクションであるCloserMusicDBを紹介します。
このデータセットを使用して実行可能な3つのサンプルタスクとともに、データセットの選択した品質について説明する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:11:19 GMT)
ShifCon: Enhancing Non-Dominant Language Capabilities with a Shift-based Contrastive Framework [78.1] ShifConはShiftベースのContrastiveフレームワークで、他の言語の内部の前進プロセスを支配的な言語に合わせる。
非支配的な言語の表現を支配的な言語サブスペースに移行し、モデルパラメータにエンコードされた比較的リッチな情報にアクセスできるようにする。
実験により、我々のShifConフレームワークは、非支配言語の性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:28:59 GMT)
LoCoCo: Dropping In Convolutions for Long Context Compression [77.3] 本稿では,Long Context Compression(LoCoCo)のための新しいアプローチであるDropping In Convolutionsを提案する。
LoCoCoは、固定サイズキーバリュー(KV)キャッシュのみを使用し、推論と微調整の両方のステージで効率を向上させることができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:09:59 GMT)
Less is More: Extreme Gradient Boost Rank-1 Adaption for Efficient Finetuning of LLMs [75.1] 微調整型大規模言語モデル(LLM)は、訓練済みモデルを下流タスクに適応させる上で重要な技術となっている。
Low-Rank Adaptation (LoRA) は有望な解決法として登場したが、低ランク適応の実用性能と理論的最適性の間にはギャップがある。
本稿では,このギャップを埋める新しいフレームワークであるeXtreme Gradient Boosting LoRAを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:07:13 GMT)
Paint Bucket Colorization Using Anime Character Color Design Sheets [72.7] ネットワークがセグメント間の関係を理解することができる包摂的マッチングを導入する。
ネットワークのトレーニングパイプラインは、カラー化と連続フレームカラー化の両方のパフォーマンスを著しく向上させる。
ネットワークのトレーニングをサポートするために、PaintBucket-Characterというユニークなデータセットを開発しました。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:33:27 GMT)
Probing Multimodal LLMs as World Models for Driving [72.2] 自律運転におけるMLLM(Multimodal Large Language Models)の適用について検討する。
GPT-4oのようなモデルの開発は進んでいるが、複雑な運転環境における性能は未解明のままである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:31:37 GMT)
Bayesian scaling laws for in-context learning [72.2] In-context Learning(ICL)は、言語モデルをトレーニング更新なしで複雑なタスクを実行するための強力なテクニックである。
我々は、ICCがベイズ学習者を近似し、ICCのための新しいベイズスケーリング法則のファミリーを開発することを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:08:06 GMT)
LLaVA-KD: A Framework of Distilling Multimodal Large Language Models [70.2] 本稿では,l-MLLMからs-MLLMへ知識を伝達する新しいフレームワークを提案する。
具体的には,l-MLLMとs-MLLMの視覚的テキスト出力分布のばらつきを最小限に抑えるために,MDist(Multimodal Distillation)を導入する。
また,S-MLLMの可能性を完全に活用するための3段階学習手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:19:13 GMT)
Decoding Diffusion: A Scalable Framework for Unsupervised Analysis of Latent Space Biases and Representations Using Natural Language Prompts [68.5] 本稿では拡散潜在空間の教師なし探索のための新しい枠組みを提案する。
我々は、自然言語のプロンプトと画像キャプションを直接利用して、遅延方向をマップする。
本手法は,拡散モデルに符号化された意味的知識をよりスケーラブルで解釈可能な理解を提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:44:51 GMT)
Expose Before You Defend: Unifying and Enhancing Backdoor Defenses via Exposed Models [68.4] 本稿では,Expose Before You Defendという新しい2段階防衛フレームワークを紹介する。
EBYDは既存のバックドア防御手法を総合防衛システムに統合し、性能を向上する。
2つの視覚データセットと4つの言語データセットにまたがる10のイメージアタックと6つのテキストアタックに関する広範な実験を行います。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:36:04 GMT)
KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization [67.7] LLMは、大きなコンテキストウィンドウを必要とするアプリケーションでの利用が増えており、この大きなコンテキストウィンドウでは、KVキャッシュのアクティベーションが推論時のメモリ消費の主要な要因として表面化している。
量子化はKVキャッシュのアクティベーションを圧縮する上で有望な手法であるが、既存のソリューションは4ビット以下の精度でアクティベーションを正確に表現できない。
我々の研究であるKVQuantは、いくつかの新しい手法を取り入れることで、低精度のKVキャッシュ量子化を容易にする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:29:43 GMT)
MMDocBench: Benchmarking Large Vision-Language Models for Fine-Grained Visual Document Understanding [66.2] LVLM(Large Vision-Language Models)は多くの視覚言語タスクにおいて顕著な性能を発揮している。
既存のベンチマークには、他のデータと混合された詳細な評価サンプルが限られているか、あるいは自然画像のオブジェクトレベルの評価に限られている。
自然画像の補足に多粒度および多モード情報を用いた文書画像を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:00:55 GMT)
OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization [66.2] マルチモーダルWebエージェントの開発を容易にするために設計されたオープンソースフレームワークを紹介する。
まず、基本モデルを模倣学習で訓練し、基礎能力を得る。
次に、エージェントにオープンウェブを探索させ、その軌道に関するフィードバックを収集する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:01:27 GMT)
LLMRefine: Pinpointing and Refining Large Language Models via Fine-Grained Actionable Feedback [65.8] 最近の大規模言語モデル(LLM)は、世代品質を改善するために人間のフィードバックを活用している。
LLMの出力を最適化する推論時間最適化手法であるLLMRefineを提案する。
機械翻訳、長文質問応答(QA)、話題要約を含む3つのテキスト生成タスクについて実験を行った。
LLMRefineは、すべてのベースラインアプローチを一貫して上回り、翻訳タスクの1.7 MetricXポイント、ASQAの8.1 ROUGE-L、トピックの要約の2.2 ROUGE-Lの改善を実現している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:28:06 GMT)
Block and Detail: Scaffolding Sketch-to-Image Generation [65.6] アーティストの反復的な洗練プロセスと整合する新しいスケッチ・ツー・イメージ・ツールを提案する。
私たちのツールは、ブロックされたストロークをスケッチして、オブジェクトの配置や形を粗く表現し、詳細なストロークを表現して、形やシルエットを洗練します。
反復過程の任意の点において、そのようなスケッチから高忠実度画像を生成するための2パスアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:35:05 GMT)
REBAR: Retrieval-Based Reconstruction for Time-series Contrastive Learning [64.1] 正の対を識別する学習尺度を新たに提案する。
検索ベースレコンストラクションは2つのシーケンス間の類似度を測定する。
本稿では,REBAR誤差が相互クラスメンバシップの予測因子であることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:56:20 GMT)
Iterative Self-Tuning LLMs for Enhanced Jailbreaking Capabilities [63.6] 本稿では,対戦型LDMをジェイルブレイク能力に富んだ反復的自己調整プロセスであるADV-LLMを紹介する。
我々のフレームワークは,様々なオープンソース LLM 上で ASR を100% 近く達成しながら,逆接接尾辞を生成する計算コストを大幅に削減する。
Llama3のみに最適化されているにもかかわらず、GPT-3.5では99%のASR、GPT-4では49%のASRを達成している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:05:59 GMT)
Rethinking Visual Dependency in Long-Context Reasoning for Large Vision-Language Models [62.7] LVLM(Large Vision-Language Models)は、クロスモデルタスクでは優れているが、長文推論ではパフォーマンスが低下する。
そこで本研究では,重要でないテキスト情報を選択的に除去する,学習不要なコンテキストプルーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:59:09 GMT)
Chain of Ideas: Revolutionizing Research Via Novel Idea Development with LLM Agents [62.4] 科学文献の急激な増加は、研究者が最近の進歩と意義ある研究方向を見極めるのを困難にしている。
大規模言語モデル(LLM)の最近の発展は、新しい研究のアイデアを自動生成するための有望な道のりを示唆している。
本研究では, チェーン構造に関連文献を整理し, 研究領域の進展を効果的に反映する, LLMベースのエージェントであるChain-of-Ideas(CoI)エージェントを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:34:36 GMT)
Contrastive-Signal-Dependent Plasticity: Self-Supervised Learning in Spiking Neural Circuits [61.9] この研究は、スパイキングネットワークのシナプスを調整するための神経生物学的に動機づけられたスキームを設計することの課題に対処する。
我々の実験シミュレーションは、繰り返しスパイクネットワークを訓練する際、他の生物学的に証明可能なアプローチに対して一貫した優位性を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:41:17 GMT)
LFME: A Simple Framework for Learning from Multiple Experts in Domain Generalization [61.2] ドメイン一般化(Domain Generalization, DG)手法は、複数のソースドメインからのトレーニングデータを使用することで、目に見えないターゲットドメインにおける優れたパフォーマンスを維持することを目的としている。
この作業では、DGを改善するために、ターゲットモデルをすべてのソースドメインの専門家にすることを目的とした、複数の専門家(LFME)からの学習と呼ばれる、シンプルだが効果的なフレームワークを導入している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:02:49 GMT)
A Survey of Deep Graph Learning under Distribution Shifts: from Graph Out-of-Distribution Generalization to Adaptation [59.1] 我々は,分散シフト下での深層グラフ学習について,最新かつ先見的なレビューを行う。
具体的には,グラフ OOD 一般化,トレーニング時グラフ OOD 適応,テスト時グラフ OOD 適応の3つのシナリオについて述べる。
文献の理解を深めるために,提案した分類に基づく既存モデルを体系的に分類した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:39:56 GMT)
Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation [59.1] 本稿では,関係学習用データセットの言語的スキューと視覚的スクリューの両方を定量化する統計指標を提案する。
系統的に制御されたメトリクスは、一般化性能を強く予測できることを示す。
この研究は、データの多様性やバランスを向上し、絶対的なサイズをスケールアップするための重要な方向を示します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:56:36 GMT)
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality [58.8] FasterCacheは、高品質な生成を伴うビデオ拡散モデルの推論を高速化するために設計された、トレーニング不要の戦略である。
我々は、FasterCacheがビデオの質をベースラインと同等に保ちながら、ビデオ生成を著しく加速できることを示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:24:38 GMT)
Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.6] 本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:08:45 GMT)
ArxivDIGESTables: Synthesizing Scientific Literature into Tables using Language Models [58.3] 本稿では,言語モデル(LM)を利用して文献レビュー表を生成するフレームワークを提案する。
ArXiv論文から抽出された2,228の文献レビューテーブルの新しいデータセットは、合計で7,542の論文を合成する。
我々は、LMが参照テーブルを再構築する能力を評価し、追加のコンテキストからこのタスクの利点を見出す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:31:50 GMT)
Collaborative Inference over Wireless Channels with Feature Differential Privacy [57.7] 複数の無線エッジデバイス間の協調推論は、人工知能(AI)アプリケーションを大幅に強化する可能性がある。
抽出された特徴を抽出することは、プロセス中に機密性の高い個人情報が暴露されるため、重大なプライバシーリスクをもたらす。
本稿では,ネットワーク内の各エッジデバイスが抽出された機能のプライバシを保護し,それらを中央サーバに送信して推論を行う,新たなプライバシ保存協調推論機構を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:11:02 GMT)
On the Robustness of Editing Large Language Models [57.5] 大型言語モデル(LLM)はコミュニケーションAIの構築において重要な役割を担っているが、効率的な更新の課題に直面している。
この研究は、編集方法の長所と短所を理解し、コミュニケーション型AIの実践的応用を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:24:58 GMT)
Towards End-to-End Open Conversational Machine Reading [57.2] オープン検索型会話機械読解(OR-CMR)タスクでは,機械は対話履歴とテキスト知識ベースに応答するマルチターン質問を行う必要がある。
OR-CMRを完全エンドツーエンドで統一されたテキスト・ツー・テキスト・タスクとしてモデル化し、ShARCおよびOR-ShARCデータセットを用いた実験により、提案したエンドツーエンド・フレームワークの有効性を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:11:17 GMT)
Enhancing Zero-Shot Vision Models by Label-Free Prompt Distribution Learning and Bias Correcting [55.4] CLIPのようなヴィジュアル言語モデルは、適切なテキスト記述を使用する際に、顕著な一般化能力を示している。
本稿では,ラベル付きデータを必要としないゼロショット性能を向上する,**Frolic**と呼ばれるラベルフリーな分布学習とバイアス補正フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:00:45 GMT)
Ensembling Finetuned Language Models for Text Classification [55.2] ファインタニング(英: Finetuning)は、特定のタスクに事前訓練されたモデルを適用するために、様々なコミュニティで一般的なプラクティスである。
ニューラルネットワークのアンサンブルは、通常、パフォーマンスを高め、信頼性の高い不確実性推定を提供するために使用される。
6つのデータセット上の5つの大きめのモデルから予測されたメタデータセットを提示し、異なるアンサンブル戦略の結果を報告する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:15:54 GMT)
Vript: A Video Is Worth Thousands of Words [54.8] Vriptは12Kの高解像度ビデオの注釈付きコーパスで、420Kのクリップで詳細な、密度の高い、スクリプトのようなキャプションを提供する。
各クリップには145ワードのキャプションがあり、ほとんどのビデオテキストデータセットの10倍以上の長さである。
Vriptは、長いビデオのための高密度で詳細なキャプションをエンドツーエンドに生成できる強力なモデルである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:32:09 GMT)
Global Graph Counterfactual Explanation: A Subgraph Mapping Approach [54.4] グラフニューラルネットワーク(GNN)は、様々な現実世界のアプリケーションに広くデプロイされている。
対実的説明は、GNN予測を変える入力グラフ上で最小の摂動を見つけることを目的としている。
我々は,グローバルレベルのグラフ対実的説明法であるGlobalGCEを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:39:05 GMT)
Tex4D: Zero-shot 4D Scene Texturing with Video Diffusion Models [54.4] 3Dメッシュはコンピュータビジョンとグラフィックスにおいて、アニメーションの効率と映画、ゲーム、AR、VRにおける最小限のメモリ使用のために広く利用されている。
しかし、メッシュのための時間的一貫性と現実的なテクスチャを作成することは、プロのアーティストにとって労働集約的だ。
本稿では、メッシュ配列から固有の幾何学とビデオ拡散モデルを統合することで、一貫したテクスチャを生成する3Dテクスチャシーケンスを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:13:13 GMT)
Tex4D: Zero-shot 4D Scene Texturing with Video Diffusion Models [54.4] 3Dメッシュはコンピュータビジョンとグラフィックスにおいて、アニメーションの効率と映画、ゲーム、AR、VRにおける最小限のメモリ使用のために広く利用されている。
しかし、メッシュのための時間的一貫性と現実的なテクスチャを作成することは、プロのアーティストにとって労働集約的だ。
本稿では、メッシュ配列から固有の幾何学とビデオ拡散モデルを統合することで、一貫したテクスチャを生成する3Dテクスチャシーケンスを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:13:13 GMT)
Semantic Segmentation in Satellite Hyperspectral Imagery by Deep Learning [54.1] 本稿では1D-Justo-LiuNetという軽量な1D-CNNモデルを提案する。
1D-Justo-LiuNetは、全てのテストモデルの中で最小のモデルサイズ (4,563 パラメータ) を持つ最大精度 (0.93) を達成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:51:37 GMT)
Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding [54.0] 拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然なデザイン空間を捉えるのに優れている。
これらの設計空間の自然性を保ちながら、下流の報酬関数を最適化することを目指している。
提案アルゴリズムは,中間雑音状態が将来高い報酬をもたらすことの先駆けとして,ソフトバリュー関数を統合する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:50:44 GMT)
Engineering Trustworthy AI: A Developer Guide for Empirical Risk Minimization [53.8] 信頼できるAIのための重要な要件は、経験的リスク最小化のコンポーネントの設計選択に変換できる。
私たちは、AIの信頼性の新たな標準を満たすAIシステムを構築するための実用的なガイダンスを提供したいと思っています。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:53:32 GMT)
Inferring Neural Signed Distance Functions by Overfitting on Single Noisy Point Clouds through Finetuning Data-Driven based Priors [53.6] 本稿では,データ駆動型およびオーバーフィット型手法のプロースを推進し,より一般化し,高速な推論を行い,より高精度なニューラルネットワークSDFを学習する手法を提案する。
そこで本研究では,距離管理やクリーンポイントクラウド,あるいは点正規化を伴わずに,データ駆動型プリエントを微調整できる新しい統計的推論アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:48:44 GMT)
AGENT-CQ: Automatic Generation and Evaluation of Clarifying Questions for Conversational Search with LLMs [53.6] エージェント-CQは、世代ステージと評価ステージの2つのステージから構成される。
CrowdLLMは、人間のクラウドソーシング判断をシミュレートして、生成された質問や回答を評価する。
ClariQデータセットの実験では、質問と回答の品質を評価するCrowdLLMの有効性が示されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:06:27 GMT)
ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization [52.6] 因果関係を考慮したエントロピー(entropy)という用語を導入し,効率的な探索を行うための潜在的影響の高いアクションを効果的に識別し,優先順位付けする。
提案アルゴリズムであるACE:Off-policy Actor-critic with Causality-aware Entropy regularizationは,29種類の連続制御タスクに対して,大幅な性能上の優位性を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:56:38 GMT)
Automatically Generating UI Code from Screenshot: A Divide-and-Conquer-Based Approach [51.5] ウェブページデザインのUIコードへの変換を自動化するための分割型アプローチであるDCGenを提案する。
DCGenはまず、スクリーンショットを管理可能なセグメントに分割し、各セグメントについて記述を生成し、その後、スクリーンショット全体のUIコードに再組み立てする。
実世界のWebサイトとさまざまなMLLMで構成されたデータセットを用いて広範囲なテストを行い、DCGenが競合するメソッドに比べて最大14%の視覚的類似性を実現していることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:22:53 GMT)
Taxonomy-guided Semantic Indexing for Academic Paper Search [51.1] TaxoIndexは学術論文検索のためのセマンティックインデックスフレームワークである。
学術分類学によって導かれる意味指標として、論文から重要な概念を整理する。
既存の高密度レトリバーを強化するために柔軟に使用できる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:00:17 GMT)
A distributional simplicity bias in the learning dynamics of transformers [50.9] 自然言語データに基づいてトレーニングされたトランスフォーマーは、単純さのバイアスも示している。
具体的には、入力トークン間の多体相互作用を逐次学習し、低次相互作用の予測誤差において飽和点に達する。
このアプローチは、自然言語処理などにおいて、データ内の異なる順序の相互作用が学習にどのように影響するかを研究する可能性を開く。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:39:34 GMT)
Language Agents Meet Causality -- Bridging LLMs and Causal World Models [50.8] 因果表現学習を大規模言語モデルと統合する枠組みを提案する。
このフレームワークは、自然言語表現に関連付けられた因果変数を持つ因果世界モデルを学ぶ。
本研究では,時間的スケールと環境の複雑さを考慮した因果推論と計画課題の枠組みを評価する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:36:37 GMT)
Integration of Communication and Computational Imaging [49.2] 遠隔認識のためのコミュニケーション・計算画像(ICCI)を統合した新しいフレームワークを提案する。
ICCIフレームワークは、情報ソースの生成から最終ビジョンタスクの実行までの情報損失を最小限に抑えるために、全リンク情報転送最適化を行う。
80km27バンドのハイパースペクトル映像の知覚速度は30fpsである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:19:59 GMT)
GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning [48.7] PEFT法を改良型Retrieval-Enhanced Transformer (RETRO) およびベースラインGPTモデルに適用する。
本稿では、RETROモデルが、独自の事前学習プロセスにより、ゼロショット設定でGPTモデルより優れていることを示す。
本研究は, GPTモデルとRETROモデルの両方に適用された各種PEFT法をRAGと統合した最初の包括的比較である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:33:23 GMT)
GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning [48.7] PEFT法を改良型Retrieval-Enhanced Transformer (RETRO) およびベースラインGPTモデルに適用する。
本稿では、RETROモデルが、独自の事前学習プロセスにより、ゼロショット設定でGPTモデルより優れていることを示す。
本研究は, GPTモデルとRETROモデルの両方に適用された各種PEFT法をRAGと統合した最初の包括的比較である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:33:23 GMT)
GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning [48.7] PEFT法を改良型Retrieval-Enhanced Transformer (RETRO) およびベースラインGPTモデルに適用する。
本稿では、RETROモデルが、独自の事前学習プロセスにより、ゼロショット設定でGPTモデルより優れていることを示す。
本研究は, GPTモデルとRETROモデルの両方に適用された各種PEFT法をRAGと統合した最初の包括的比較である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:33:23 GMT)
Corpus Poisoning via Approximate Greedy Gradient Descent [48.6] 本稿では,HotFlip法をベースとした高密度検索システムに対する新たな攻撃手法として,近似グレディ・グラディエント・Descentを提案する。
提案手法は,複数のデータセットと複数のレトリバーを用いて高い攻撃成功率を達成し,未知のクエリや新しいドメインに一般化可能であることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:57:07 GMT)
Play to the Score: Stage-Guided Dynamic Multi-Sensory Fusion for Robotic Manipulation [48.4] 人間は、環境と対話する際に異なる感覚に柔軟に交互に変化する優れた才能を持っている。
そこで我々は,段階誘導型動的多感覚融合法であるMS-Botを提案する。
我々は、視覚、聴覚、触覚センサーを備えたロボットシステムを訓練し、困難なロボット操作タスクを達成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:36:44 GMT)
Limit Theorems for Stochastic Gradient Descent with Infinite Variance [47.9] この勾配降下アルゴリズムは、適切なL'evy過程によって駆動されるオルンシュタイン-ルンシュタイン過程の定常分布として特徴付けられることを示す。
また、これらの結果の線形回帰モデルおよびロジスティック回帰モデルへの応用についても検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:32:38 GMT)
Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling [47.8] 仮面拡散モデル (MDM) は離散データの生成モデルとして人気がある。
我々はMDMのトレーニングとサンプリングの両方が理論的に時間変数から解放されていることを示す。
一般に使用されている32ビット浮動小数点精度においても,まず基礎となる数値問題を同定した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:54:34 GMT)
Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling [47.8] 仮面拡散モデル (MDM) は離散データの生成モデルとして人気がある。
我々はMDMのトレーニングとサンプリングの両方が理論的に時間変数から解放されていることを示す。
一般に使用されている32ビット浮動小数点精度においても,まず基礎となる数値問題を同定した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:54:34 GMT)
Automated Rewards via LLM-Generated Progress Functions [47.5] 大きな言語モデル(LLM)は、様々なタスクにまたがる広いドメイン知識を活用することで、報酬工学を自動化する可能性がある。
本稿では,挑戦的なBi-DexHandsベンチマーク上で,最先端のポリシーを生成可能なLLM駆動の報酬生成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:37:59 GMT)
Automated Rewards via LLM-Generated Progress Functions [47.5] 大きな言語モデル(LLM)は、様々なタスクにまたがる広いドメイン知識を活用することで、報酬工学を自動化する可能性がある。
本稿では,挑戦的なBi-DexHandsベンチマーク上で,最先端のポリシーを生成可能なLLM駆動の報酬生成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:37:59 GMT)
DMT-HI: MOE-based Hyperbolic Interpretable Deep Manifold Transformation for Unspervised Dimensionality Reduction [47.4] データ工学や可視化など,さまざまな分野において,次元性低減(DR)が重要な役割を担っている。
DR精度と解釈可能性のバランスをとるという課題は、特に高次元データを扱うユーザにとって依然として重要である。
本研究は,MOEに基づくハイパーボリック・インタプリタブル・ディープ・マニフォールド変換(DMT-HI)を紹介する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:11:32 GMT)
Frozen-DETR: Enhancing DETR with Image Understanding from Frozen Foundation Models [47.2] 近年のビジョン基礎モデルでは、普遍的な表現を抽出し、様々なタスクにおいて印象的な能力を示すことができる。
凍結基礎モデルは, 物体検出のための事前訓練を受けなくても, 汎用的特徴増強器として利用できることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:38:24 GMT)
COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training [47.1] COAT(States and Activations for FP8 Training)は、大規模なモデルをトレーニングする際のメモリフットプリントを大幅に削減するために設計された、新しいFP8トレーニングフレームワークである。
COATは、BF16と比較して、エンドツーエンドのトレーニングメモリフットプリントを1.54倍に効果的に削減する。
COATはまた、BF16と比較して1.43倍のエンドツーエンドのトレーニング速度を達成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:59:30 GMT)
SPRIG: Improving Large Language Model Performance by System Prompt Optimization [46.0] 大きな言語モデル(LLM)は多くのシナリオで印象的な機能を示しているが、そのパフォーマンスはプロンプトの選択に依存している。
本研究では,モデルの性能を最大化するために,既定成分からのプロンプトを反復的に構築する編集に基づく遺伝的アルゴリズムであるSPRIGを提案する。
47種類のタスクの集合に対して,システムプロンプトの性能を評価し,一般化性を確保する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:43:16 GMT)
Decision-Making Frameworks for Network Resilience -- Managing and Mitigating Systemic (Cyber) Risk [45.0] 本稿では,ネットワークにおけるシステム的リスク管理に適した意思決定フレームワークを提案する。
本枠組みは,(1)許容可能なネットワーク構成のセット,(2)リスク軽減を目的とした介入のセット,(3)コスト関数の3つの基本的構成要素に基づいて構成される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:00:30 GMT)
Offline Reinforcement Learning with OOD State Correction and OOD Action Suppression [44.1] オフライン強化学習(RL)では、アウト・オブ・ディストリビューション(OOD)のアクション問題に対処することが焦点となっている。
我々は、OOD状態がパフォーマンスを損なう問題もまだ過小評価されていないと論じている。
オフライン RL における OOD 状態修正と OOD 動作抑制を統一する,シンプルで効果的な SCAS を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:01:37 GMT)
Coordinated Reply Attacks in Influence Operations: Characterization and Detection [44.0] 我々はTwitter上でのインフルエンス操作の文脈において、協調応答攻撃を特徴付ける。
我々の分析によると、これらの攻撃の主なターゲットは、ジャーナリスト、ニュースメディア、州役人、政治家などの影響力のある人々である。
本稿では,2つの教師付き機械学習モデルを提案する。ひとつはツイートを分類し,それらが応答攻撃の対象であるか否かを判断し,もうひとつはターゲットとするツイートに応答するアカウントを分類し,それらが協調攻撃の一部であるかどうかを判断する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:57:08 GMT)
Hierarchical Mixture of Experts: Generalizable Learning for High-Level Synthesis [43.6] 高レベル合成(HLS)は、FPGA(Field Programmable Gate Array)の設計において広く使われているツールである。
よりドメイン一般化可能なモデル構造として, 2段階の階層的エキスパート混合(MoE)を提案する。
低レベル MoE では、プログラムの3つの自然な粒度(ノード、基本ブロック、グラフ)に MoE を適用する。
ハイレベルなMoEは、最終決定のために3つの粒度を集約することを学ぶ。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:27:53 GMT)
Lightweight, Secure and Stateful Serverless Computing with PSL [43.0] 信頼された実行環境(TEE)のためのF-as-a-Serivce(F)フレームワークを提案する。
このフレームワークは、静的にコンパイルされたバイナリおよび/またはWebAssembly(WASM)バイトコードのための異種TEEハードウェアでリッチなプログラミング言語をサポートする。
Intel SGX2の動的メモリマッピング機能を利用することで、ネイティブに近い実行速度を実現する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:17:56 GMT)
TimeSuite: Improving MLLMs for Long Video Understanding via Grounded Tuning [42.9] 本稿では,従来のショートフォームビデオMLLMを長大なビデオ理解に適用するための新デザインであるTimeSuiteを提案する。
TimeSuiteは、ショートフォームMLLMの長いビデオ理解能力を向上するための、成功したソリューションを提供する。
さらに,9つのタスクと349kの高品質な接地アノテーションからなる総合的な接地中心の命令データセットであるTimeProを紹介する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:19:55 GMT)
Schedule Your Edit: A Simple yet Effective Diffusion Noise Schedule for Image Editing [42.5] 効率的な編集では、ソースイメージを潜在空間に反転させる必要があり、このプロセスはDDIMの反転に固有の予測エラーによってしばしば妨げられる。
特異性を排除し、インバージョン安定性を改善し、画像編集のためのより良いノイズ空間を提供する新しいノイズスケジュールであるロジスティックスケジュールを導入する。
提案手法では追加のトレーニングは必要とせず,既存の編集手法と互換性がある。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:11:21 GMT)
Comprehensive Evaluation of Matrix Factorization Models for Collaborative Filtering Recommender Systems [42.4] 行列分解モデルは、現在の商用共同フィルタリングRecommender Systemsの中核である。
テストでは、予測、順序付きリストと順序なしリストの推薦、新規性、多様性など、さまざまな精度と精度の高い品質対策がテストされている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:42:42 GMT)
LoLCATs: On Low-Rank Linearizing of Large Language Models [41.6] Low-rank Linear Conversion via Attention Transfer (LoLCATs) は、メモリと計算量を大幅に削減して線形化品質を向上させる単純な2段階法である。
LoLCATsは、線形化品質、トレーニング効率、スケーラビリティを大幅に改善する。
我々はLlama 3 8B と Mistral 7B v0.1 から最先端のサブクアッドラティック LLM を作成し、5ショット MMLU に対して20以上の改善点を得た。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:59:04 GMT)
LoLCATs: On Low-Rank Linearizing of Large Language Models [41.6] Low-rank Linear Conversion via Attention Transfer (LoLCATs) は、メモリと計算量を大幅に削減して線形化品質を向上させる単純な2段階法である。
LoLCATsは、線形化品質、トレーニング効率、スケーラビリティを大幅に改善する。
我々はLlama 3 8B と Mistral 7B v0.1 から最先端のサブクアッドラティック LLM を作成し、5ショット MMLU に対して20以上の改善点を得た。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:59:04 GMT)
Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead [41.3] 低ランク適応(LoRA)を用いた微調整型大規模言語モデルが一般的となっている。
本稿では,LoRA固有のスケーリング行列と組み合わせた共有ベースにLoRAを共同圧縮する手法を提案する。
最大500台のLoRAによる実験では、圧縮されたLoRAは大きなスループット向上を提供しながら性能を保っていることが示されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:57:10 GMT)
Reinforcement Learning for Aligning Large Language Models Agents with Interactive Environments: Quantifying and Mitigating Prompt Overfitting [40.8] 強化学習(Reinforcement Learning、RL)は、大規模言語モデル(LLM)知識を逐次意思決定タスクと整合させるための有望なアプローチである。
テキスト環境下でのRL学習後の定式化を促進するために,LLMの感度を解析するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:25:35 GMT)
Offline-to-Online Multi-Agent Reinforcement Learning with Offline Value Function Memory and Sequential Exploration [40.3] 逐次探索を用いたオフライン値関数メモリ(OVMSE)と呼ばれる新しいO2O MARLフレームワークを提案する。
まず、ターゲットQ値を計算するためのオフライン値関数メモリ(OVM)機構を導入し、オフライントレーニング中に得られた知識を保存する。
第2に,O2O MARLに適した分散型シークエンシャル・エクスプロレーション(SE)戦略を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:24:19 GMT)
MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction [40.1] High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。
オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:28:05 GMT)
DiffuserLite: Towards Real-time Diffusion Planning [39.9] 超高速で軽量な拡散計画フレームワークを導入し,計画修正プロセス(PRP)を用いて粗粒度軌道を生成する。
実験により、diffuserLiteは122.2Hzの判定周波数を実現し、D4RL, Robomimic, FinRLベンチマークで最先端の性能を達成した。
さらにdiffuserLiteは、他の拡散計画アルゴリズムの意思決定頻度を高めるための柔軟なプラグインとしても機能する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:36:07 GMT)
AgentSense: Benchmarking Social Intelligence of Language Agents through Interactive Scenarios [38.9] 本稿では,対話型シナリオを通して言語エージェントのソーシャルインテリジェンスをベンチマークするAgensSenseを紹介する。
ドラマティック理論に基づいて、エージェントセンスは、広範なスクリプトから構築された1,225の多様な社会的シナリオを作成するためにボトムアップアプローチを採用している。
目的達成と暗黙的推論の両方を強調し,マルチターンインタラクションによるLCM駆動エージェントの評価を行った。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:04:16 GMT)
Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions [38.5] PRCと呼ばれる新しい2段階学習手法を開発した。
我々は,ロボット制御環境における各種データセットの学習効率を実証的に検証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:31:50 GMT)
Unified Cross-Modal Image Synthesis with Hierarchical Mixture of Product-of-Experts [38.4] MMHVAEと呼ばれるマルチモーダル階層的変分自動エンコーダの深層混合を行い、異なるモードで観察された画像から欠落した画像を合成する。
MMHVAEの設計は、4つの課題に取り組むことに焦点を当てている: (i) 高解像度画像を生成するために複雑なマルチモーダルデータの潜在表現を作成すること、 (ii) 変分分布を奨励し、クロスモーダル画像合成に必要な欠落情報を推定すること、 (iii) 欠落したデータのコンテキストでマルチモーダル情報を融合すること、 (iv) トレーニング時に不完全なデータセットを扱うためにデータセットレベルの情報を活用すること。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:30:29 GMT)
DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents [38.0] DistRLは、モバイルデバイス制御エージェントのオンラインRLファインチューニングの効率を高めるために設計された、新しいフレームワークである。
平均して、DistRLはトレーニング効率を3倍改善し、主要な同期マルチマシンメソッドよりも2.4倍高速なトレーニングデータ収集を可能にする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:12:11 GMT)
DeMuVGN: Effective Software Defect Prediction Model by Learning Multi-view Software Dependency via Graph Neural Networks [37.9] DeMuVGNは、グラフニューラルネットワークを介してマルチビューソフトウェア依存を学習する欠陥予測モデルである。
データ、呼び出し、開発者の依存関係を統合するマルチビューソフトウェア依存性グラフを導入します。
20バージョンにわたる8つのオープンソースプロジェクトのケーススタディでは、DeMuVGNが大幅に改善されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:24:04 GMT)
Cooperative Strategic Planning Enhances Reasoning Capabilities in Large Language Models [37.9] 本稿では,新しい協調型マルチエージェント推論フレームワーク(CoPlanner)を提案する。
コプラナーは2つのLSMエージェント(計画エージェントと推論エージェント)から構成される。
以上の結果から,計画エージェントからの指導とエージェント間の効果的な協力が,CoPlannerの優れた性能に寄与することが示唆された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:32:48 GMT)
Flipped Classroom: Aligning Teacher Attention with Student in Generalized Category Discovery [37.8] GCD(Generalized Category Discovery)は、教師が生徒に知識を与えてカテゴリーを分類する、教師/学生の枠組みである。
GCDは独特な課題、特に新しい授業の事前の欠如を示しており、教師の誤認と学生との非同期学習に繋がる可能性がある。
静的な教師参照を維持するのではなく,教師の注意に合わせるように動的に更新するFlipClassを導入する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:31:53 GMT)
Flipped Classroom: Aligning Teacher Attention with Student in Generalized Category Discovery [37.8] GCD(Generalized Category Discovery)は、教師が生徒に知識を与えてカテゴリーを分類する、教師/学生の枠組みである。
GCDは独特な課題、特に新しい授業の事前の欠如を示しており、教師の誤認と学生との非同期学習に繋がる可能性がある。
静的な教師参照を維持するのではなく,教師の注意に合わせるように動的に更新するFlipClassを導入する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:31:53 GMT)
Improving Stochastic Cubic Newton with Momentum [37.2] モーメントが推定値の分散を確実に安定化させることを示す。
グローバリゼーション手法を用いて収束点を証明した。
また、運動量を持つ凸ニュートン法を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:49:16 GMT)
$C^2$: Scalable Auto-Feedback for LLM-based Chart Generation [36.9] 参照不要な自動フィードバックジェネレータを導入し,人的介入のコストを削減した。
最初の実験では、回答者の74%が強く好んでおり、10%がフィードバック後の結果を好んだ。
ChartUIE-8Kは、クエリ、データセット、チャートタイプを増やすことで、データの多様性を大幅に改善する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:23:54 GMT)
Generative AI meets 3D: A Survey on Text-to-3D in AIGC Era [36.7] 近年、ジェネレーティブAIは大きな進歩を遂げており、テキスト誘導コンテンツ生成が最も実用的になっている。
ニューラルレイディアンス・フィールド(NeRF)のようなテキスト・ツー・イメージ技術や3Dモデリング技術の進歩により、テキスト・トゥ・3Dは生まれながら非常に活発な研究分野として現れてきた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:30:30 GMT)
Comparing Neighbors Together Makes it Easy: Jointly Comparing Multiple Candidates for Efficient and Effective Retrieval [36.4] 一般的な検索と参照のパラダイムは、高速なバイエンコーダ(BE)を使用して、幅広い集合から関連する候補を検索することである。
本稿では,クエリと類似候補の複数の埋め込みを,浅い自己認識層を通じて比較する比較多重候補フレームワークを提案する。
ZeSHELデータセットの実験結果は、バイエンコーダとクロスエンコーダをシームレスな中間リランカとして接続した場合、MCCはリコール@kを効果的に改善できることを示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:45:44 GMT)
Rethinking Disclosure Prevention with Pointwise Maximal Leakage [36.4] 本稿では,秘密の$X$の低エントロピー機能の価値を開示し,実用性を実現するユーティリティとプライバシの一般モデルを提案する。
我々は、大衆の意見に反して、有意義な推論によるプライバシー保証を提供することを証明している。
PMLベースのプライバシは互換性があることを示し、差分プライバシーのような既存の概念に対する洞察を提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:57:47 GMT)
HYDRA: Model Factorization Framework for Black-Box LLM Personalization [36.2] パーソナライゼーションは現代のインテリジェントシステムにおいて重要な研究領域として現れてきた。
ブラックボックスの大規模言語モデル(LLM)が示した驚くべき数ショットの能力にもかかわらず、それらのモデルパラメータの本質的な不透明さは、生成された出力を個々の期待と整合させる上で大きな課題である。
本研究では,履歴データからユーザ固有の行動パターンを抽出し,パーソナライズされた生成を提供するモデル因子化フレームワークHYDRAを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:01:05 GMT)
A Review of Deep Learning Approaches for Non-Invasive Cognitive Impairment Detection [35.3] 本稿では,非侵襲的認知障害検出のためのディープラーニング手法の最近の進歩を概説する。
音声や言語,顔,運動運動など,認知低下の非侵襲的指標について検討した。
著しい進歩にもかかわらず、データ標準化とアクセシビリティ、モデル説明可能性、縦断解析の限界、臨床適応などいくつかの課題が残っている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:44:59 GMT)
Q-Adapter: Customizing Pre-trained LLMs to New Preferences with Forgetting Mitigation [35.0] 我々は、事前訓練された大規模言語モデル(LLM)を新しい人間の好みでカスタマイズすることを検討する。
新しい好みをカスタマイズするための残差Q-関数を近似するアダプタモジュールを導入したので、我々のメソッド Q-Adapter を命名する。
DSPデータセットとHH-RLHFデータセットのLlama-3.1モデルに基づく実験は、Q-Adapterの優れた効果を示している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:12:49 GMT)
Neural Graphics Texture Compression Supporting Random Access [35.0] 本稿では,従来のGPUテクスチャ表現とNIC技術を統合したテクスチャセット圧縮手法を提案する。
本稿では、畳み込みエンコーダを用いた非対称自動エンコーダフレームワークを提案する。
実験により,従来のテクスチャ圧縮よりも優れた結果が得られた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:13:23 GMT)
Calibrating Long-form Generations from Large Language Models [34.7] 大きな言語モデル(LLM)の信頼性スコアは、その応答が正しいという実際の可能性と一致すべきである。
現在の信頼性評価手法とキャリブレーション基準は、応答の正しさを2値の真/偽評価に頼っている。
本稿では,LLMの応答の正しさと関連する信頼度の両方を,様々なスコアの分布として扱う統一校正フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:29:37 GMT)
Simpler Diffusion (SiD2): 1.5 FID on ImageNet512 with pixel-space diffusion [34.7] 画素空間モデルは、実際、品質と効率の両面において、潜在的なアプローチと非常に競合する可能性があることを示す。
エンド・ツー・エンドのピクセル空間拡散モデルを高分解能に拡張するための簡単なレシピを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:20:06 GMT)
A Flow-based Truncated Denoising Diffusion Model for Super-resolution Magnetic Resonance Spectroscopic Imaging [34.3] 本研究は,超高分解能MRSIのためのフローベースTrncated Denoising Diffusion Modelを導入する。
拡散鎖を切断することで拡散過程を短縮し, 正規化フローベースネットワークを用いて切断工程を推定する。
FTDDMは既存の生成モデルよりも優れており、サンプリングプロセスを9倍以上高速化している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:42:35 GMT)
Crosstalk-Robust Quantum Control in Multimode Bosonic Systems [34.0] 高コヒーレンス超伝導キャビティは、量子情報処理のためのハードウェア効率の良いプラットフォームを提供する。
ボゾンモードの普遍的な操作を実現するために、それらをトランスモンアンシラに結合することにより、所望の非線形性を実現する。
我々は、周波数シフトに頑健なアシラパルスを設計するために、量子最適制御を用いる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:07:27 GMT)
IPPON: Common Sense Guided Informative Path Planning for Object Goal Navigation [34.0] 本稿では,新しい情報経路計画法と3次元オブジェクト確率マッピング手法を提案する。
マッピングモジュールはセマンティックセグメンテーションとベイズフィルタによって関心対象の確率を計算する。
我々のプランナーはゼロショットアプローチに従っているが、2023年のHabitat ObjectNav Challengeにおいて、Path Length(SPL)とSoft SPLが重み付けしたSuccessによって測定された最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:11:33 GMT)
Grasping the Essentials: Tailoring Large Language Models for Zero-Shot Relation Extraction [33.5] 関係抽出(RE)は、テキスト内のエンティティ間の意味的関係を識別することを目的としている。
アノテーションの要求を減らすことを目的とした、ほとんどショットの学習は、通常、ターゲット関係に対する不完全で偏見のある監視を提供する。
1)大言語モデル(LLM)を利用して,関係定義とラベルなしコーパスから初期シードインスタンスを生成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:37:12 GMT)
Continuously Learning, Adapting, and Improving: A Dual-Process Approach to Autonomous Driving [33.5] 本稿では,人間の認知プロセスに触発された自律運転の新しいパラダイムである LeapADを紹介する。
特に LeapADは、意思決定に関連する重要なオブジェクトを選択することで、人間の注意をエミュレートする。
システムは、徹底的な分析と推論のための分析プロセス(System-II)と、迅速な経験的処理のためのヒューリスティックプロセス(System-I)から構成される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:00:54 GMT)
Improving Inverse Folding for Peptide Design with Diversity-regularized Direct Preference Optimization [33.1] 逆折り畳みモデルは、望ましい参照構造に折り畳むアミノ酸配列を予測する。
メッセージパッシングエンコーダデコーダモデルであるProteinMPNNは、参照構造から新しいシーケンスを確実に生成するように訓練されている。
しかし、ペプチドに適用すると、これらのモデルは参照構造に折りたたみしない反復配列を生成する傾向がある。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:04:02 GMT)
DiffGS: Functional Gaussian Splatting Diffusion [33.1] 3D Gaussian Splatting (3DGS) はレンダリング速度と忠実度において説得力のある性能を示した。
しかし、ガウススプラッティングの生成は、その離散性と非構造的な性質のため、依然として課題である。
本稿では,潜在拡散モデルに基づく一般ガウス生成器DiffGSを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:08:08 GMT)
Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification [33.0] Wildlife ReIDは視覚技術を利用して、異なるシナリオで野生動物の特定の個人を特定する。
野生生物ReIDのための統合された多種多種汎用フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:13:28 GMT)
Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification [33.0] Wildlife ReIDは視覚技術を利用して、異なるシナリオで野生動物の特定の個人を特定する。
野生生物ReIDのための統合された多種多種汎用フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:13:28 GMT)
FastPCI: Motion-Structure Guided Fast Point Cloud Frame Interpolation [33.0] この研究は、ポイントクラウドフレームのためのPraamid Convolution-Transformerアーキテクチャを導入したFast PCIを示す。
我々のハイブリッドConvolution-Transformerは、局所的および長距離的な特徴学習を改善し、ピラミッドネットワークはマルチレベル機能を提供し、計算量を削減する。
この設計は,(1)正確なシーンフローが3次元構造を保存すること,(2)前の時刻の点雲が将来の時刻からの逆運動で再構成可能であること,の2つの事実によって動機付けられている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:10:17 GMT)
Fictitious Synthetic Data Can Improve LLM Factuality via Prerequisite Learning [32.9] 我々は,この知識の不整合に対処し,幻覚を減らすために,Prereq-Tuneと呼ばれる新しい微調整戦略を提案する。
Prereq-Tuneはスキルと知識の学習を混乱させるので、モデルは知識の不整合の影響を受けずにタスクスキルのみを学習する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:48:51 GMT)
Understanding Adam Requires Better Rotation Dependent Assumptions [32.8] グラディエント・Descent (SGD) に対するアダムの優位性は、包括的な理論的な説明を欠いている。
トレーニング変圧器におけるアダムの性能はパラメータ空間のランダムな回転の下で劣化することを示す。
これは、従来の回転不変仮定がアダムの利点を理論的に捉えるには不十分であることを示している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:53:03 GMT)
Free-Rider and Conflict Aware Collaboration Formation for Cross-Silo Federated Learning [32.4] Federated Learning(FL)は、複数のFL参加者がプライベートデータを共有せずにトレーニングモデル上でコラボレーションできる機械学習パラダイムである。
我々は、FL-PTがFLエコシステムの恩恵を受ける場合に限り、FL-PTがFLの恩恵を受けることを確実にする最適なFLコラボレーション形成戦略であるFedEgoistsを提案する。
FL-PT連立が最適であることは理論的に証明する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:13:26 GMT)
TinyAgent: Function Calling at the Edge [32.2] 本稿では,エッジ上でエージェントシステムを駆動するための関数呼び出しが可能なタスク固有小言語モデルエージェントの訓練とデプロイのためのエンドツーエンドフレームワークを提案する。
駆動アプリケーションとして、テキストや音声入力によるユーザコマンドの実行が可能な、AppleのMacBook用のローカルSiriライクなシステムをデモする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:16:55 GMT)
TinyAgent: Function Calling at the Edge [32.2] 本稿では,エッジ上でエージェントシステムを駆動するための関数呼び出しが可能なタスク固有小言語モデルエージェントの訓練とデプロイのためのエンドツーエンドフレームワークを提案する。
駆動アプリケーションとして、テキストや音声入力によるユーザコマンドの実行が可能な、AppleのMacBook用のローカルSiriライクなシステムをデモする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:16:55 GMT)
Marked Temporal Bayesian Flow Point Processes [32.0] マーク付きイベントデータは、連続値のイベントタイムスタンプと対応する離散値の型を記録して、イベントをキャプチャする。
本稿では,BMTPPと呼ばれる新しいMTPPモデルを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:32:43 GMT)
Self-planning Code Generation with Large Language Models [32.0] 本稿では,大規模言語モデルを用いた自己計画型コード生成手法を提案する。
計画段階では、モデルは意図から簡潔な解決手順と数発のプロンプトを組み合わせることを計画している。
実装フェーズでは、モデルが前のソリューションステップでガイドされたステップごとにコードを生成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:08:03 GMT)
Language Models Need Inductive Biases to Count Inductively [31.3] カウントは一般化の基本的な例であり、ペアノの公理の数学的レンズを通して見るか、数えることを学ぶ子供たちのための認知科学文献を見るかのどちらかである。
この研究は、数えられるようなトレーニング言語モデルに関する広範な経験的な結果を提供する。
従来のRNNは帰納的カウントを自明に達成するが、トランスフォーマーはドメイン外カウントに位置埋め込みを頼らなければならない。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:50:45 GMT)
Humanizing the Machine: Proxy Attacks to Mislead LLM Detectors [31.2] 我々は、大規模言語モデル(LLM)を懸命に妥協するプロキシ・アタック戦略を導入する。
提案手法は, 復号相における強化学習 (RL) の微調整による小型言語モデル (SLM) を活用することで, 情報源モデルを攻撃する。
以上の結果から,プロキシアタック戦略は主要な検出器を効果的に騙し,複数のデータセットで平均70.4%のAUROC低下を招いた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:35:00 GMT)
Multi-Swap $k$-Means++ [31.0] Arthur and Vassilvitskii (SODA 2007)の$k$-means++アルゴリズムは、人気のある$k$-meansクラスタリングの目的を最適化するための実践者の選択アルゴリズムであることが多い。
Lattanzi氏とSohler氏(ICML)は、$k$-means++を$O(k log log k)$で拡張して、$k$-meansクラスタリング問題に$c$-approximationをもたらすよう提案した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:14:44 GMT)
Quantum Algorithm for Online Exp-concave Optimization [31.0] 本稿では,量子オンライン準ニュートン法を提案する。
提案手法は, 量子推定不正確な勾配によりヘシアンを近似する。
このような後悔は、最適古典アルゴリズムを$T2/3$の係数で改善する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:58:44 GMT)
The Reopening of Pandora's Box: Analyzing the Role of LLMs in the Evolving Battle Against AI-Generated Fake News [30.8] 大規模言語モデル(LLM)は、大規模な偽ニュースを生成する。
LLMは実際のニュースを検出するのに人間よりも68%効果的である。
偽ニュース検出では、LLMと人間のパフォーマンスはいまだに同等である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:58:29 GMT)
Content-Aware Radiance Fields: Aligning Model Complexity with Scene Intricacy Through Learned Bitwidth Quantization [30.7] ラディアンスフィールドモデルは、各シーンのトレーニングモデルによって、3Dコンテンツを表現するように設計されています。
このシーン表現とシーンごとのトレーニングのユニークな特徴は、他のニューラルモデルと放射場モデルを区別する。
我々は、A-CAQ(Adversarial Content-Aware Quantization)を通して、シーンの複雑さとシーンの複雑度を整合する認識放射場を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:39:55 GMT)
Counting statistics of ultra-broadband microwave photons [30.4] 未定義周波数のマイクロ波光子の計数統計,平均および分散の測定結果について報告する。
トンネル接合による量子ステアリングの観測を報告し、ブロードバンドモードのスクイーズの存在が、それが含む2つのモード間の絡み合いの存在を示唆していることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:58:51 GMT)
Hybrid Memetic Search for Electric Vehicle Routing with Time Windows, Simultaneous Pickup-Delivery, and Partial Recharges [30.0] 本研究は電気自動車ルーティング問題(EVRP)の新興かつ重要な拡張に対処する。
EVRP-TW-SPDを解くためのハイブリッドメメティックアルゴリズム(HMA)を提案する。
既存のベンチマークと実世界のシナリオのギャップを埋めるために、我々は、新しい大規模EVRP-TW-SPDベンチマークセットを導入する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:18:24 GMT)
A Decision-Language Model (DLM) for Dynamic Restless Multi-Armed Bandit Tasks in Public Health [29.9] 大規模言語モデル(LLM)は、ロボット制御とナビゲーションの領域にまたがる包括的な自動プランナーとして登場した。
本稿では,RMAB ポリシーを動的に微調整する RMAB のための決定言語モデル (DLM) を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:34:14 GMT)
Knowledge Graph Enhanced Language Agents for Recommendation [29.2] 本稿では,レコメンデーションシステムのための言語エージェントと知識グラフを統合するフレームワークを提案する。
シミュレーションされたレコメンデーションシナリオでは、ユーザとアイテムをKG内に配置し、KGパスを自然言語記述として統合する。
これにより、言語エージェントは相互に相互作用し、相互作用の背後にある十分な根拠を発見することができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:25:36 GMT)
NeuroClips: Towards High-fidelity and Smooth fMRI-to-Video Reconstruction [29.0] 我々は,fMRIから高忠実度・スムーズな映像をデコードする革新的なフレームワークであるNeuroClipsを提案する。
NeuroClipsは、ビデオの再構成にセマンティックサクタを使用し、セマンティックの精度と一貫性を誘導し、低レベルの知覚の詳細を捉えるために知覚再構成器を使用する。
NeuroClipsは8FPSで最大6秒のスムーズな高忠実度ビデオ再構成を実現する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:28:26 GMT)
2D-DPO: Scaling Direct Preference Optimization with 2-Dimensional Supervision [28.7] 我々はDPOの嗜好を2次元(セグメントとアスペクト)に拡張することを提案する。
我々は2D-DPOフレームワークを開発し、その全体的目的をマルチセグメントとマルチアスペクトの目的に分解する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:47:35 GMT)
An Auditing Test To Detect Behavioral Shift in Language Models [28.5] 本稿では,言語モデルにおける連続的行動シフト監査(BSA)手法を提案する。
BSAはモデル世代のみを通して行動シフトを検出する。
このテストは、数百の例を使って、行動分布の有意義な変化を検出することができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:09:31 GMT)
Few Exemplar-Based General Medical Image Segmentation via Domain-Aware Selective Adaptation [28.2] 医用画像のセグメンテーションは、ドメインのギャップ、データモダリティの変化、ドメインの知識や専門家への依存による課題を引き起こす。
本稿では,自然画像で訓練した大規模モデルから学習した一般知識を,対応する医療領域・モダリティに適応させるための,ドメイン対応選択的適応手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:45:19 GMT)
Few Exemplar-Based General Medical Image Segmentation via Domain-Aware Selective Adaptation [28.2] 医用画像のセグメンテーションは、ドメインのギャップ、データモダリティの変化、ドメインの知識や専門家への依存による課題を引き起こす。
本稿では,自然画像で訓練した大規模モデルから学習した一般知識を,対応する医療領域・モダリティに適応させるための,ドメイン対応選択的適応手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:45:19 GMT)
Fusion-then-Distillation: Toward Cross-modal Positive Distillation for Domain Adaptive 3D Semantic Segmentation [27.9] クロスモーダルな非教師付きドメイン適応では、ソースドメインデータ(例:合成)に基づいて訓練されたモデルは、ターゲットアノテーションにアクセスすることなく、ターゲットドメインデータ(例:現実世界)に適応する。
従来の手法では、異なる領域で一致可能なクラス確率分布を強制する、各領域における相互に相互にモダル出力を模倣しようとする。
そこで本研究では,3次元セマンティックセグメンテーションのためのソースとターゲットドメインの相互正の蒸留を探索する,新しい核融合式蒸留法(FtD++)を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:14:48 GMT)
Improving Object Detection via Local-global Contrastive Learning [27.7] 本稿では,クロスドメインオブジェクト検出を対象とする画像から画像への変換手法を提案する。
ローカル・グローバル情報と対比することでオブジェクトを表現することを学ぶ。
これにより、ドメインシフトの下で、パフォーマンス検出(Performant detection)の取得という、未調査の課題の調査が可能になる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:53:55 GMT)
Improving Object Detection via Local-global Contrastive Learning [27.7] 本稿では,クロスドメインオブジェクト検出を対象とする画像から画像への変換手法を提案する。
ローカル・グローバル情報と対比することでオブジェクトを表現することを学ぶ。
これにより、ドメインシフトの下で、パフォーマンス検出(Performant detection)の取得という、未調査の課題の調査が可能になる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:53:55 GMT)
Diverse Sign Language Translation [27.5] 本稿では,手話ビデオの多種多様かつ正確な翻訳を実現するために,DivSLT(Diverse Sign Language Translation)タスクを導入する。
我々は大規模言語モデル(LLM)を用いて、広く使われているCSL-DailyとPHOENIX14T SLTデータセットの複数の参照を生成する。
具体的には、DivSLTモデルが多様な翻訳を実現するためのマルチ参照トレーニング戦略について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:28:20 GMT)
As Simple as Fine-tuning: LLM Alignment via Bidirectional Negative Feedback Loss [26.9] 本稿では、最適化中に安定な双方向負のフィードバック(BNF)を確立する新しいアライメント損失を提案する。
提案するBNF損失は, 対意に対照的な損失が不要となる。
我々は、2つの挑戦的なQAベンチマークと4つの推論ベンチマークにまたがる広範な実験を行っている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:41:45 GMT)
As Simple as Fine-tuning: LLM Alignment via Bidirectional Negative Feedback Loss [26.9] 本稿では、最適化中に安定な双方向負のフィードバック(BNF)を確立する新しいアライメント損失を提案する。
提案するBNF損失は, 対意に対照的な損失が不要となる。
我々は、2つの挑戦的なQAベンチマークと4つの推論ベンチマークにまたがる広範な実験を行っている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:41:45 GMT)
Learning ID-free Item Representation with Token Crossing for Multimodal Recommendation [26.7] 我々はMOTORというIDのないマルチモーダルトークン表現方式を提案する。
まず、各項目のマルチモーダル特徴を離散トークンIDに識別するために、製品量子化を用いる。
次に、これらのトークンIDに対応するトークン埋め込みを暗黙のアイテム機能として解釈する。
結果として得られた表現は、元のID埋め込みを置き換え、元のマルチモーダルレコメンデータをIDフリーシステムに変換することができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:06:10 GMT)
Air Quality Prediction with Physics-Informed Dual Neural ODEs in Open Systems [26.7] 大気汚染は人間の健康と生態系を著しく脅かし、公共政策を知らせるために効果的な大気質予測を必要とする。
伝統的なアプローチは一般に物理学に基づくモデルとデータ駆動モデルに分類される。
本稿では,ニューラルネットワークの2つの枝を統合した新しい物理インフォームドアプローチであるAirDualODEを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:56:13 GMT)
Editing the Mind of Giants: An In-Depth Exploration of Pitfalls of Knowledge Editing in Large Language Models [26.5] 近年の研究では、知識の歪みや一般的な能力の劣化など、編集後に現れた副作用が特定されている。
本調査では,これらの側面を包括的に研究し,大規模言語モデルにおける知識編集の課題を統一的に考察する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:20:16 GMT)
Are Data Augmentation Methods in Named Entity Recognition Applicable for Uncertainty Estimation? [26.3] 名前付きエンティティ認識(NER)タスクにおけるデータの増大が信頼度校正と不確実性評価に与える影響について検討する。
また,データ拡張により,言語間および言語間におけるキャリブレーションや不確実性が向上することを示す。
また,増量によりキャリブレーションや不確実性がさらに向上することが示唆された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:07:18 GMT)
AutoRD: An Automatic and End-to-End System for Rare Disease Knowledge Graph Construction Based on Ontologies-enhanced Large Language Models [26.0] 希少な病気は世界中で数百万人に影響を与えるが、その頻度が低いため研究の焦点が限られていることが多い。
近年のLarge Language Models (LLMs) の進歩は, 医療情報の抽出を自動化することを約束している。
本稿では,まれな疾患に関する医療用テキストから情報を自動的に抽出するAutoRDというエンドツーエンドシステムを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:20:32 GMT)
Improving Low-Resource Knowledge Tracing Tasks by Supervised Pre-training and Importance Mechanism Fine-tuning [25.6] 上記の課題に対処するため,低リソースのKTフレームワークであるLoReKTを提案する。
一般的な"事前学習と微調整"パラダイムにインスパイアされた我々は、リッチリソースのKTデータセットから転送可能なパラメータと表現を学習することを目指している。
複数のKTデータソースからの学生のインタラクションを組み込むエンコーディング機構を設計する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:20:22 GMT)
Graph Linearization Methods for Reasoning on Graphs with Large Language Models [25.4] グラフは、ローカル依存やグローバルアライメントなど、自然言語テキストの特定の特性を反映するように線形化されるべきである。
本稿では,グラフの中央性,縮退性,ノードの可逆性に基づくグラフ線形化手法を提案する。
本研究は,LLMに適した新しいグラフ表現を導入し,マルチモーダル処理のトレンドとグラフ機械学習の潜在的な統合に寄与する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:51:37 GMT)
MonoDGP: Monocular 3D Object Detection with Decoupled-Query and Geometry-Error Priors [24.8] 本稿では,MonoDGPと呼ばれるトランスフォーマーを用いたモノクロ3Dオブジェクト検出手法を提案する。
射影公式を変更するために、パースペクティブ不変幾何誤差を採用する。
提案手法は, 余分なデータを必要としないKITTIベンチマークにおいて, 最先端の性能を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:31:43 GMT)
FaceChain-FACT: Face Adapter with Decoupled Training for Identity-preserved Personalization [24.6] アダプタベースの手法は、顔データに対するテキスト・ツー・イメージのトレーニングによって、肖像画をカスタマイズし、生成する能力を得る。
ベースモデルと比較して、テスト後の能力、制御性、生成した顔の多様性が著しく低下することが多い。
我々は、モデルアーキテクチャとトレーニング戦略の両方に焦点を当てた、非結合トレーニング(FACT)フレームワークによるFace Adapterを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:56:54 GMT)
On-Robot Reinforcement Learning with Goal-Contrastive Rewards [24.4] 強化学習(Reinforcement Learning, RL)は、ロボットが現実世界で自身の行動から学ぶことができる能力を持つ。
我々は、受動的ビデオデモでトレーニング可能な高密度報酬関数学習法であるGCR(Goal-intensiveive Rewards)を提案する。
GCRは2つの損失関数、成功軌跡を走行する際の報酬の増大をモデル化する暗黙値損失関数、そして成功軌跡と失敗軌跡を区別する目標コントラスト損失を組み合わせた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:11:54 GMT)
Learning Neural Strategy-Proof Matching Mechanism from Examples [24.2] 我々は,人為的なデータセットから戦略防御機構を学習するニューラルネットワークであるNeuralSDを開発した。
エージェント数の違いによるマッチング例から,ストラテジブルマッチングを学習するための実験を行った。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:34:25 GMT)
Watermarking Makes Language Models Radioactive [24.1] 言語モデルが合成データに基づいて訓練されたかどうかを、透かしのLLMによって出力された場合、確実に判断することが可能である。
放射能を専門とする我々の新しい手法は、透かし信号の弱い残差を証明可能な信頼性で検出する。
例えば、被疑者モデルがオープンウェイトであれば、透かしによる訓練を高い信頼性で検出できることが示される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:12:01 GMT)
Model merging with SVD to tie the Knots [24.1] また,LoRAの微調整モデルの重み付けは,完全微調整モデルに比べてアライメントの程度が低いことを示す。
SVDを用いて、異なるLoRAモデルの重み付けを、既存のマージ手法を適用可能な整合空間に変換する。
本稿では,統合モデルが一般モデルであるかどうかを明示的に評価する新しいベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:59:55 GMT)
Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering [24.0] 大規模言語モデル(LLM)は、そのパラメータに大量の事実知識を格納することができる。
LLMは、中間層における知識衝突のシグナルを内部的に登録することができる。
我々は,事前訓練されたスパースオートエンコーダを用いた表現工学手法であるtextscSpAREを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:17:28 GMT)
AgentForge: A Flexible Low-Code Platform for Reinforcement Learning Agent Design [23.5] 我々は、強化学習システムにまたがるパラメータを最適化するフレキシブルなローコードフレームワークであるAgentForgeを提案する。
最適化問題は数行のコードで定義することができ、インターフェースドのいずれかに渡される。
我々は、視覚に基づくRL問題において、その性能を評価する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:53:33 GMT)
Conditional Hallucinations for Image Compression [23.3] 画像圧縮の損失では、モデルは詳細を幻覚させるか、配布外サンプルを生成するという課題に直面します。
本稿では,コンテンツに基づく幻覚の度合いを動的にバランスさせる新しい圧縮手法を提案する。
本研究では,最先端画像圧縮法より優れた条件付き幻覚圧縮モデル(ConHa)を開発した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:51:10 GMT)
Ripple: Accelerating LLM Inference on Smartphones with Correlation-Aware Neuron Management [22.9] 大規模言語モデル(LLM)は、さまざまな領域で大きな成功を収めていますが、モバイルデバイスにデプロイすることは難しい課題です。
我々は、フラッシュメモリにおけるニューロン配置を最適化することにより、スマートフォン上でのLSM推論を高速化する新しいアプローチであるRippleを提案する。
私たちは、Rippleが最先端と比較して最大5.93倍のI/Oレイテンシ改善を実現していることを実証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:01:19 GMT)
Layer by Layer: Uncovering Where Multi-Task Learning Happens in Instruction-Tuned Large Language Models [22.7] タスクの多種多様な配列で訓練済みの大規模言語モデル(LLM)を微調整することが、モデル構築の一般的なアプローチとなっている。
本研究では,事前学習したLLMに符号化されたタスク固有情報と,その表現に対する指導指導の効果について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:38:28 GMT)
FutureFill: Fast Generation from Convolutional Sequence Models [22.4] 本稿では,畳み込み演算子に基づく任意のシーケンス予測アルゴリズムに適用可能な高速生成法であるFutureFillを紹介する。
提案手法では, 生成時間要件を文脈長に対して線形から正方形に短縮する。
本研究は, 合成生成タスクにおける正当性と効率向上を示す実験的証拠を用いて, 理論的知見を検証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:45:33 GMT)
FutureFill: Fast Generation from Convolutional Sequence Models [22.4] FutureFillは畳み込み演算子に基づく任意のシーケンス予測アルゴリズムに適用可能な高速生成法である。
提案手法は, 文脈長に対して, 生成時間を2次から4次へと短縮する。
本研究は, 合成生成タスクにおける正当性と効率向上を示す実験的証拠を用いて, 理論的知見を検証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:45:33 GMT)
Diffusion Attribution Score: Evaluating Training Data Influence in Diffusion Model [22.4] 拡散モデルに対する既存のデータ帰属法は、典型的にはトレーニングサンプルの寄与を定量化する。
拡散損失の直接的利用は,拡散損失の計算により,そのような貢献を正確に表すことはできない。
本研究の目的は, 予測分布と属性スコアとの直接比較を計測し, トレーニングサンプルの重要性を分析することである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:12:47 GMT)
MotionCraft: Physics-based Zero-Shot Video Generation [22.3] MotionCraftは物理ベースのリアルなビデオを作るためのゼロショットビデオジェネレータだ。
安定拡散のような画像拡散モデルのノイズ潜時空間を光学的流れを適用することにより、MotionCraftがワープできることが示される。
我々は,この手法を最先端のText2Video-Zeroレポートと比較し,質的,定量的に改善した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:01:22 GMT)
Representational Analysis of Binding in Language Models [21.6] 言語モデル(LM)は、あるエンティティのリコール属性に対してエンティティをその属性にバインドしなければならない。
LMの活性化には低ランク部分空間が存在し、主にエンティティと属性の順序(すなわち OI)を符号化する。
また、OIエンコーディング方向に沿って表現を編集する場合、LMは与えられた実体を他の属性に結合する傾向にあるような結合に対するOIの因果効果も発見する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:14:01 GMT)
Backdoor in Seconds: Unlocking Vulnerabilities in Large Pre-trained Models via Model Editing [21.5] ある種の敵攻撃は、トレーニングデータセットを汚染することで、機械学習モデルの振る舞いを操作できる。
EDTモデル, textbfEfficient, textbfData-free, textbfTraining-free バックドアアタック手法を導入する。
モデル編集技術にインスパイアされたEDTは、編集ベースの軽量コードブックを、大規模な事前訓練されたモデルのバックドアに注入する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:13:32 GMT)
Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight [20.9] 本稿では,Reinforcement Learning(RL)とImitation Learning(IL)のサンプル効率を組み合わせた新しいアプローチを提案する。
本フレームワークは,特権状態情報を用いたRLを用いた教師政策の訓練,ILによる学生政策への蒸留,RLによる適応微調整の3段階を含む。
シミュレーションシナリオと実世界のシナリオの両方でテストすると、我々のアプローチは、スクラッチからRLが失敗するシナリオだけでなく、ロバストさとパフォーマンスの両方で既存のILメソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:10:58 GMT)
Sparse Decomposition of Graph Neural Networks [20.8] 本稿では,集約中に含まれるノード数を削減する手法を提案する。
線形変換された特徴の重み付け和を用いてノード表現の近似を学習し、スパース分解によりこれを実現できる。
提案手法は推論高速化のために設計された他のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:52:16 GMT)
West-of-N: Synthetic Preferences for Self-Improving Reward Models [20.6] 合成選好データを生成することによって報酬モデルの品質を向上させる新しい手法を提案する。
提案手法は,同量の人選好データの追加に匹敵する効果で,報酬モデルの性能向上を図っている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:04:26 GMT)
DualMAR: Medical-Augmented Representation from Dual-Expertise Perspectives [20.4] 本研究では,個人観測データと公開知識ベースによる予測タスクを強化するフレームワークであるDualMARを提案する。
極空間上の座標の取得と角化により、DualMARはKGからのリッチな階層的およびセマンティックな埋め込みに基づく正確な予測を可能にする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:25:22 GMT)
Bongard in Wonderland: Visual Puzzles that Still Make AI Go Mad? [20.3] 近年、VLM(Vision-Language Models)が登場し、テキストと画像のモダリティの高度な推論能力を示している。
本研究は,従来の視覚的推論パズルの集合であるボナード問題(Bongard problem)のワンダーランドに進入する。
驚くべきことに、単純なスパイラルのような人間にとって自明な基本的な概念でさえ、重大な課題を生んでいる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:19:26 GMT)
Uncertainty Voting Ensemble for Imbalanced Deep Regression [20.2] 本稿では,不均衡なデータから学習するUVOTEを紹介する。
従来の回帰損失を負の対数類似度に置き換え、サンプルワイドのアレタリックな不確実性も予測する。
UVOTEは先行技術より一貫して優れており、同時に精度のよい不確実性評価が得られている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:54:15 GMT)
Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection [20.1] 可視光(RGB)と熱赤外(IR)画像の両方を利用した物体検出が注目されている。
既存の多くのマルチモーダルオブジェクト検出手法は、RGBとIR画像をディープニューラルネットワークに直接入力する。
両モダリティから特徴を浄化・融合する新しい粗大な視点を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:08:04 GMT)
Large-Scale Multi-Center CT and MRI Segmentation of Pancreas with Deep Learning [20.0] 膵疾患の診断と経過観察には膵の容積分画の自動化が必要である。
そこで我々は,nnUNetとTransformerネットワークの長所と,ボリューム計算が可能な新しい線形アテンションモジュールを組み合わせたPanSegNetを開発した。
T1W MRIは85.0% (std: 7.9%) , T2W MRIは86.3% (std: 6.4%) であった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:48:38 GMT)
Not All Heads Matter: A Head-Level KV Cache Compression Method with Integrated Retrieval and Reasoning [19.9] キーバリューキャッシング(キーバリューキャッシング、英: Key-Value cache)は、大規模言語モデル(LLM)の計算効率を高めるための一般的な手法である。
本稿では,新たな文脈推論能力推定手法であるヘッドレベルのKVキャッシュ圧縮手法であるヘッドKVとヘッドKV-R2を提案する。
本手法は,文脈質問応答ベンチマークにおいて,全KVキャッシュの性能の97%を達成しつつ,KVキャッシュの1.5%しか保持しない。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:22:00 GMT)
Computational Bottlenecks of Training Small-scale Large Language Models [19.7] 小型の大規模言語モデル(SLM)は、消費者のコストと効率性の要求により注目されている。
本研究では,SLMの学習における計算的ボトルネックについて検討する。
私たちは、ドル当たりの損失や秒単位のトークンといったメトリクスを使用して、ポピュラーなクラウドサービス上のこれらの要因を評価します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:30:21 GMT)
GraphLSS: Integrating Lexical, Structural, and Semantic Features for Long Document Extractive Summarization [19.5] 長い文書抽出要約のための異種グラフ構造であるGraphLSSを提案する。
補助学習モデルを必要としない2種類の情報(単語と文)と4種類のエッジ(文の意味的類似性、文発生順序、文中の単語、単語の意味的類似性)を定義する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:48:59 GMT)
Measuring memorization through probabilistic discoverable extraction [19.5] 大規模言語モデル(LLM)は、トレーニングデータを記憶する可能性がある。
LLMの記憶率を測定するための現在の手法は、単一系列のグレディサンプリングに依存している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:37:04 GMT)
Transferring Knowledge from High-Quality to Low-Quality MRI for Adult Glioma Diagnosis [19.2] 本稿では,SSAアダルトグリオーマにおけるBraTS Challengeについて述べる。
我々は、BraTS-GLI 2021の勝利ソリューションからモデルを採用し、3つのトレーニング戦略で活用する。
結果は、BraTS-GLI 2021データセットの初期トレーニングに続いて、BraTS-Africaデータセットの微調整が最高の結果となったことを示している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:01:58 GMT)
FLAC: Fairness-Aware Representation Learning by Suppressing Attribute-Class Associations [19.1] 本研究は,属性ラベルを使わずに,モデルが抽出した特徴と保護属性との間の相互情報を最小化する手法を導入する。
FLACは、保護された属性とは独立な公正な表現につながることが理論的に示されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:53:36 GMT)
Measuring memorization in RLHF for code completion [18.4] 人間のフィードバックによる強化学習(RLHF)が,大規模モデルをユーザの好みに合わせる主要な手法となっている。
我々は、RLHFの各フェーズと直接選好学習を通じて、トレーニングデータの記憶がどのように表出し、伝播するかを分析する。
我々の研究は、RLHFが直接選好学習とは対照的に、大きな言語モデルを調整する際に、センシティブな選好データを抽出するリスクを軽減するための、より安全な方法であることを示唆している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:40:25 GMT)
RAD: A Dataset and Benchmark for Real-Life Anomaly Detection with Robotic Observations [18.2] Realistic Anomaly Detection データセット(RAD)は、実際のロボットアームを使用して特別に収集された最初のマルチビューRGBベースの異常検出データセットである。
RADは、13のカテゴリにわたる4765のイメージと、50以上の視点から収集された4つの欠陥タイプで構成されている。
ポーズ推定の精度を向上し、3次元点雲の再構成を容易にするためのデータ拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:42:38 GMT)
RAD: A Dataset and Benchmark for Real-Life Anomaly Detection with Robotic Observations [18.2] Realistic Anomaly Detection データセット(RAD)は、実際のロボットアームを使用して特別に収集された最初のマルチビューRGBベースの異常検出データセットである。
RADは、13のカテゴリにわたる4765のイメージと、50以上の視点から収集された4つの欠陥タイプで構成されている。
ポーズ推定の精度を向上し、3次元点雲の再構成を容易にするためのデータ拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:42:38 GMT)
On the Benefits of Active Data Collection in Operator Learning [18.0] アクティブなデータ収集戦略により、共分散カーネルの固有値の減衰率の観点から誤差収束率を確立する。
これは、$sim n-1$よりも収束率が速くないパッシブ(d.d.)データ収集戦略とは対照的である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:52:53 GMT)
FASTER: A Font-Agnostic Scene Text Editing and Rendering framework [17.7] STE(Scene Text Editing)は、画像中の既存のテキストの変更を主な目的とする、難しい研究課題である。
既存のスタイル変換ベースのアプローチでは、複雑な画像背景、多様なフォント属性、テキスト内の様々な単語長によるサブパー編集性能が示されている。
フォントに依存しない新しいシーンテキスト編集・レンダリングフレームワークであるFASTERを提案し,任意のスタイルや場所のテキストを同時に生成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:36:33 GMT)
RobustKV: Defending Large Language Models against Jailbreak Attacks via KV Eviction [17.6] 本稿では,脱獄プロンプトの効果を緩和するための新しいアプローチを提案する。
キーバリューキャッシュから有害なクエリのクリティカルトークンを選択的に削除する。
LLMの良質なクエリに対する一般的なパフォーマンスを維持しながら、最先端のjailbreak攻撃を効果的に阻止する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:18:22 GMT)
$\texttt{PatentAgent}$: Intelligent Agent for Automated Pharmaceutical Patent Analysis [17.6] 我々は、このドメインに$textbffirst$ Intelgent Agent、$texttPatentAgent$を導入し、薬学研究の展望を前進させ、潜在的に変革する可能性がある。
$textitPA-QA$、$textitPA-Img2Mol$、$textitPA-CoreId$の3つの主要なエンドツーエンドモジュールは、それぞれ(1)特許の問合せ、(2)画像から分子構造への変換、(3)コアの化学構造識別を実行する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:15:08 GMT)
Counting Ability of Large Language Models and Impact of Tokenization [17.5] 大規模言語モデル(LLM)の数え上げ能力に及ぼすトークン化の影響について検討する。
本研究は, LLMのカウント能力に及ぼすトークン化の影響について検討し, 入力トークン化差に基づく性能変化を明らかにする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:56:24 GMT)
MM-WLAuslan: Multi-View Multi-Modal Word-Level Australian Sign Language Recognition Dataset [17.4] 独立した手話認識は、個々の手話群を特定することに焦点を当てている。
オーストラリア特有の手話として、AuslanにはISLRタスク用の大規模な単語レベルのデータセットがまだ欠けている。
MM-WLAuslanは,(1)最大のデータ量,(2)最も広範な語彙,(3)最も多様なマルチモーダルカメラビューの3つの大きな利点を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:45:38 GMT)
Fully First-Order Methods for Decentralized Bilevel Optimization [17.2] 本稿では,エージェントが隣人とのみ通信する分散二段階最適化(DSBO)に焦点を当てる。
本稿では,既存の作品に広く採用されている2次オラクルよりもはるかに安価な1次オラクルのみを必要とする新しいアルゴリズムである,分散グラディエントDescent and Ascent with Gradient Tracking (DSGDA-GT)を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:11:43 GMT)
CLR-Bench: Evaluating Large Language Models in College-level Reasoning [17.1] 大規模言語モデル(LLM)は、様々な言語理解タスクで顕著な性能を示した。
複雑な大学レベルの推論において,LLMを包括的に評価するためにCLR-Benchを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:21:59 GMT)
Generative Retrieval with Preference Optimization for E-commerce Search [16.8] 我々は、好みを最適化した生成検索という、Eコマース検索のための革新的なフレームワークを開発する。
生の項目のタイトルを表すためにマルチスパン識別子を使用し、クエリからタイトルを生成するタスクを、クエリからマルチスパン識別子を生成するタスクに変換する。
実験の結果,本フレームワークは実世界のデータセット上での競合性能を実現し,オンラインA/Bテストはコンバージョンゲインの改善における優位性と有効性を示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:30:45 GMT)
ST-NeRP: Spatial-Temporal Neural Representation Learning with Prior Embedding for Patient-specific Imaging Study [16.4] 患者固有の画像研究のための先行埋め込み(ST-NeRP)を用いた時空間ニューラル表現学習の戦略を提案する。
我々の戦略は、インプシットニューラル表現(INR)ネットワークを利用して参照時点の画像を事前の埋め込みにエンコードすることである。
このネットワークは、患者固有の画像シーケンス全体を用いてトレーニングされ、様々な目標時点における変形場の予測を可能にする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:33:17 GMT)
Hierarchical Structured Neural Network for Retrieval [16.4] 本稿では,階層的クラスタリングとニューラルネットワークモデルを共同で最適化した階層構造ニューラルネットワーク(HSNN)を提案する。
HSNNはAds Recommendationシステムにうまくデプロイされ、現在トラフィックの大部分を処理しています。
本稿では,新鮮度,ボラティリティ,コールドスタートレコメンデーション,クラスタ崩壊,大規模検索生産システムにおけるモデル展開の教訓といった課題に対処し,本システムの開発経験を公開する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:11:56 GMT)
Enhancing Safety in Reinforcement Learning with Human Feedback via Rectified Policy Optimization [16.4] 我々は、平均的な安全制約をより厳密な(即時)安全制約に置き換える、textbfRectified Policy Optimization (RePO)を提案する。
RePOの中核は、すべてのプロンプトの厳格な安全違反を罰する修正されたポリシー勾配によって駆動されるポリシー更新メカニズムである。
我々のAlpaca-7B実験は,RePOが安全アライメントを改善し,基準法に比べて安全性の干渉を低減することを実証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:08:23 GMT)
Improving Multimodal Large Language Models Using Continual Learning [16.3] 生成型大規模言語モデル(LLM)は、事前学習された視覚モデルを元のLLMに統合することにより、さらに拡張できる印象的な能力を示す。
本研究では,この問題をLLaVA MLLMを用いて検討し,統合を継続学習問題として扱う。
言語能力の損失を最小限に抑えながら視覚的理解を高める手法を,5つの連続学習手法を用いて検討した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:50:40 GMT)
SWITCH: Studying with Teacher for Knowledge Distillation of Large Language Models [16.1] SWITCH (Studying WIth TeaCHer for Knowledge Distillation) は、学生のシーケンス生成中に教師モデルを戦略的に組み込む新しいアプローチである。
本稿では,SWITCHが従来の知識蒸留法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:10:49 GMT)
EDGE: Enhanced Grounded GUI Understanding with Enriched Multi-Granularity Synthetic Data [15.8] 本稿では,大規模視覚言語モデル(LVLM)のGUI理解と対話能力を,データ駆動型アプローチにより向上することを目的とする。
本稿では,Web上のWebページから大規模で粒度の高いトレーニングデータを自動的に生成する汎用データ合成フレームワークEDGEを提案する。
提案手法は,手動アノテーションへの依存を著しく低減し,研究者がWeb上で利用可能な膨大な公開リソースを活用して作業を進めることを可能にする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:46:17 GMT)
Demonstration-based learning for few-shot biomedical named entity recognition under machine reading comprehension [15.3] 本研究は, 数発の学習シナリオにおいて, バイオメディカルな実体を認識する能力を向上させる戦略を考案した。
数ショットの学習の領域では、MRCベースの言語モデルは、シーケンスラベリングアプローチと比較して、生物医学的な実体を認識するのにはるかに熟練している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:17:49 GMT)
Multi-view biomedical foundation models for molecule-target and property prediction [15.1] グラフ,画像,テキストの分子ビューを統合する多視点基礎モデルアプローチを開発した。
マルチビューモデルが頑健に動作し、特定のビューの長所と短所のバランスをとることができることを示す。
次に、このモデルを用いて、Gタンパク質結合受容体(GPCR)の大きな(>100ターゲット)セットに対する化合物のスクリーニングを行う。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:22:33 GMT)
What Variables Affect Out-of-Distribution Generalization in Pretrained Models? [15.0] トレーニング済みのディープニューラルネットワーク(DNN)によって生成された埋め込みは広く使用されているが、下流タスクに対する効果は様々である。
プレトレーニングDNN埋め込みの伝達性および分布外一般化に影響を与える要因について検討した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:14:39 GMT)
A-MFST: Adaptive Multi-Flow Sparse Tracker for Real-Time Tissue Tracking Under Occlusion [14.9] 我々は,A-MFST (Adaptive Multi-Flow Sparse Tracker) を用いて,前向きの整合性指標を用いてSENDDを開発・統合する。
A-MFSTは平均トラッキングエラーを平均エラーで12%削減する。
平均精度は4,8,16,32,64ピクセルに対して6%向上した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:42:36 GMT)
Connecting Joint-Embedding Predictive Architecture with Contrastive Self-supervised Learning [14.9] Contrastive-JEPAは、画像ベースのジョイントエンベッドディング予測アーキテクチャと可変不変共分散正規化(VICReg)戦略を統合している。
C-JEPAは視覚表現学習の安定性と品質を大幅に向上させる。
ImageNet-1Kデータセットで事前トレーニングされた場合、C-JEPAは線形プローブと微調整パフォーマンスメトリクスの両方において、迅速で改善された収束を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:48:12 GMT)
Nebula: Self-Attention for Dynamic Malware Analysis [14.7] 我々は、多様な行動表現とフォーマットをまたいで一般化する、汎用的で自己注意型トランスフォーマーベースのニューラルアーキテクチャであるNebulaを紹介する。
我々は,異なる動的解析プラットフォームから取得した3つのデータセットを用いて,マルウェア検出と分類作業の両方について実験を行った。
自己教師付き学習事前学習は、トレーニングデータの20%しか持たない完全教師付きモデルの性能とどのように一致しているかを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:22:04 GMT)
On Occlusions in Video Action Detection: Benchmark Datasets And Training Recipes [14.5] 本稿では,映像行動検出におけるオクルージョンの影響について検討する。
我々は,O-UCF,O-JHMDB,OVIS-UCF,OVIS-JHMDB,Real-OUCFの5つのベンチマークデータセットを紹介する。
これらのレシピを利用するモデルは、O-UCFでは32.3%、O-JHMDBでは32.7%、Real-OUCFでは2.6%で、既存のビデオアクション検出器よりも優れている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:27:55 GMT)
Large Language Models Still Exhibit Bias in Long Text [14.3] 大規模言語モデルにおけるバイアスを評価するフレームワークであるLong Text Fairness Test (LTF-TEST)を紹介する。
LTF-TESTはモデル応答とそれらの背後にある推論の両方を評価することで、単純な応答では検出が難しい微妙なバイアスを明らかにする。
FT-REGARD(FT-REGARD)を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:14:25 GMT)
PerSEval: Assessing Personalization in Text Summarizers [14.2] パーソナライズされたテキスト要約のパーソナライゼーションの度合いを評価するには,精度の指標が不十分である。
本稿では,必要な充足条件を満たす新しい尺度であるPerSEvalを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:36:23 GMT)
Artificial Intelligence of Things: A Survey [14.2] IoT(Internet of Things)とAI(Modern Artificial Intelligence)の統合により、AIoT(Artificial Intelligence of Things)と呼ばれる新しいパラダイムが生まれました。
我々は,センサ,コンピューティング,ネットワークおよび通信に関連するAIoT文献について検討する。
これらの分野での進歩に加えて、さまざまな重要なアプリケーションドメイン用に設計されたドメイン固有のAIoTシステムについてもレビューする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:45:58 GMT)
Fast Inference for Augmented Large Language Models [14.2] Augmented Large Language Models (LLM)は、APIコールを通じて外部データソースを統合することで、スタンドアロンのLLMの機能を強化する。
SJF(Shortest Job First)のような従来のサイズベースのスケジューリングアルゴリズムは、完了時間の最小化にはあまり効果がない。
拡張LLMのための新しいLLM推論フレームワークであるLAMPSを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:18:00 GMT)
On Designing Effective RL Reward at Training Time for LLM Reasoning [14.0] 我々は,Reward Model(ORM)やProcess-supervised Reward Model(PRM)など,RLトレーニングの一般的な報酬モデルを評価する。
驚くべきことに、これらの学習された報酬モデルは推論時のパフォーマンスが強いにもかかわらず、RLトレーニングを助けたり、傷つけたりしないかもしれない。
Clipping と Delta の2つの新しい報酬改善手法を紹介した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:34:22 GMT)
Mask-Weighted Spatial Likelihood Coding for Speaker-Independent Joint Localization and Mask Estimation [14.0] 固定空間格子に関する話者の時間周波数マスクと相対方向を用いて、ビームフォーマのパラメータを推定することができる。
マスクと位置の両方をグリッドにエンコードして,両量の同時推定を可能にする方法について分析する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:43:32 GMT)
CoRA: Collaborative Information Perception by Large Language Model's Weights for Recommendation [13.9] LLM(Large Language Models)における協調情報の導入は,LLMを推奨に適応させる上で有望な手法である。
既存の手法では、テキストトークンと協調的な特徴を統一シーケンス入力に結合することでこれを実現する。
我々は、協調重み生成器を備えた新しいパラダイム、CoRA(Collaborative LoRAの頭字語)を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:23:02 GMT)
CoRA: Collaborative Information Perception by Large Language Model's Weights for Recommendation [13.9] LLM(Large Language Models)における協調情報の導入は,LLMを推奨に適応させる上で有望な手法である。
既存の手法では、テキストトークンと協調的な特徴を統一シーケンス入力に結合することでこれを実現する。
協調的なクエリジェネレータを備えた新しいパラダイムである textbfCollaborative textbfLoRA を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:23:02 GMT)
Prompting Continual Person Search [13.7] 既存の人物検索モデルには、現実世界のデータの増加から継続的に学習する能力がない。
本研究は,複数のドメインで連続的に学習し,すべてのドメインで人物検索を行う連続的な人物探索タスクを導入する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:19:23 GMT)
Adversarial Environment Design via Regret-Guided Diffusion Models [13.7] 環境変化に頑健な訓練エージェントは、深層強化学習(RL)において重要な課題である。
非教師なし環境設計(UED)は、エージェントの能力に合わせた一連のトレーニング環境を生成することで、この問題に対処するために最近登場した。
後悔誘導拡散モデル(ADD)を用いた新しいUEDアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:35:03 GMT)
Looks Too Good To Be True: An Information-Theoretic Analysis of Hallucinations in Generative Restoration Models [13.6] 生成モデルは、しばしば実際のデータと視覚的に区別できない結果を生み出すことができる。
また、彼らは幻覚を生み出す傾向が強まっている。
本稿では,この現象を情報理論のレンズを通して検討し,不確実性と知覚の根本的なトレードオフを明らかにする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:40:30 GMT)
LOCAL: Learning with Orientation Matrix to Infer Causal Structure from Time Series Data [13.4] LOCALは動的因果構造を復元するための効率的で実装が容易で制約のない手法である。
ACMLは学習可能な優先度ベクトルとGumbel-Sigmoid関数を用いて因果マスクを生成する。
DGPLは因果学習を分解された行列生成物に変換し、高次元データの動的因果構造をキャプチャする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:48:41 GMT)
Human-AI Collaborative Multi-modal Multi-rater Learning for Endometriosis Diagnosis [13.4] 子宮内膜症は、出生時に女性に割り当てられた患者の約10%に影響を及ぼし、診断と管理が困難である。
診断は通常、腹腔鏡下手術またはT1/T2MRI画像の解析を用いて、疾患の様々な徴候を同定する。
子宮内膜症の重要な診断的徴候は、ダグラスポウチ(POD)の消失である
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:46:43 GMT)
KAHANI: Culturally-Nuanced Visual Storytelling Pipeline for Non-Western Cultures [13.3] 我々は、西洋文化以外の文化に対して、文化的基盤を持つビジュアルストーリーを生成する「カハニ」と呼ばれるビジュアルストーリーテリングパイプラインを開発する。
思考の連鎖(CoT)とT2Iプロンプト技術を用いて、ユーザのプロンプトから文化的文脈を捉え、キャラクターやシーン構成の鮮明な記述を生成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:23:24 GMT)
Human-like Episodic Memory for Infinite Context LLMs [13.2] 大きな言語モデル(LLM)は目覚ましい能力を示しているが、それでも広範なコンテキストの処理に苦戦している。
本研究では,人間のエピソード記憶と事象認知をLLMに組み込む新しいアプローチであるEM-LLMを紹介する。
EM-LLMは、ベイジアン・サプライズとグラフ理論境界修正の組み合わせを用いて、トークンの列をコヒーレントなエピソード事象に整理する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:27:23 GMT)
Do Discrete Self-Supervised Representations of Speech Capture Tone Distinctions? [13.2] 我々は,マンダリンとヨルバの2つの例言語において,離散記号が声調を適切に捉えているかどうかを評価する。
離散シンボルを使用すると、言語仕様のSSLモデルであっても、トーン情報が著しく失われることがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:13:25 GMT)
Interpretable Bilingual Multimodal Large Language Model for Diverse Biomedical Tasks [13.0] 本研究の目的は,医学的MLLMの解剖学的領域全体を理解する能力を高めることである。
本稿では,最初のバイリンガル・ジェネリスト医療用AIシステムである領域認識型医療用MLLM MedRegAを提案する。
我々のモデルは、バイリンガル設定における様々な医療ビジョン言語タスクにおける強力なパフォーマンスを達成するだけでなく、マルチモーダル・メディカルスキャンにおける構造を認識し、検出することができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:14:24 GMT)
Multi-modal Motion Prediction using Temporal Ensembling with Learning-based Aggregation [12.7] 本稿では,軌跡予測における欠落行動の問題を緩和するメタアルゴリズムである,学習ベースアグリゲーションを用いたテンポラルアグリゲーションを提案する。
複数のフレームから予測を確認することで、時間的アンサンブルは、個々のフレームの予測において時々エラーを補償する。
提案手法はArgoverse 2データセットで検証され,顕著な改善が見られた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:59:07 GMT)
Robust teleportation of a surface code and cascade of topological quantum phase transitions [12.4] 本研究では,小ベル計測を用いた長距離絡み合った表面コード状態の伝送プロトコルについて検討する。
無限に弱い絡み合いは、自己双対位相曲面コードをテレポートするのに十分である。
我々のプロトコルは、動的にRydberg原子配列で容易に実装でき、量子測定のパワーを実演するためのガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:55:04 GMT)
MILES: Making Imitation Learning Easy with Self-Supervision [12.3] MILESは完全に自律的で自己管理型のデータ収集パラダイムである。
MILESは,1つの実演と1つの環境リセットから,効率的なポリシー学習を可能にする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:06:50 GMT)
Explaining Probabilistic Models with Distributional Values [12.3] 研究によると、ゲーム理論的な説明は誤解を招くか、解釈が難しい可能性がある。
SHAPのような現在の方法と説明したいものの間には、しばしば重大なミスマッチがある、と我々は主張する。
本稿では、協調ゲームや値演算子を一般化することで確率モデルに対するそのようなギャップを解消する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:53:54 GMT)
A Rainbow in Deep Network Black Boxes [12.1] ディープラーニングにおける中心的な疑問は、ディープネットワークによって学習された機能を理解することである。
このようなランダムな特徴モデルの深い拡張を提供し、レインボーモデルと呼ぶ。
レインボーネットワークは無限幅極限において決定論的(階層的)カーネルを定義することを証明している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:25:18 GMT)
Multi-Agent Reinforcement Learning-Based UAV Pathfinding for Obstacle Avoidance in Stochastic Environment [12.1] マルチエージェント強化学習に基づく分散実行手法を用いた新しい集中型学習法を提案する。
このアプローチでは、エージェントは集中型プランナーとのみ通信し、オンラインで分散的な決定を行う。
訓練効率を高めるため,多段階強化学習において多段階値収束を行う。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:56:21 GMT)
Hierarchical Reinforcement Learning for Swarm Confrontation with High Uncertainty [12.1] 未知の相手の戦略、動的な障害、不十分な訓練によって引き起こされる高い不確実性は、アクション空間をハイブリッドな決定プロセスに複雑化する。
本稿では,目標配置層,経路計画層,基礎となる動的相互作用機構からなる新しい階層型強化学習手法を提案する。
両層が導入した不安定なトレーニングプロセスを克服するために,事前学習とクロストレーニングを含む統合トレーニング手法を設計する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:35:19 GMT)
Rationale-Aware Answer Verification by Pairwise Self-Evaluation [11.8] 信頼性のある検証器の訓練には,最終回答の正しさに加えて,有理数の有効性の確保が必要であることを示す。
本結果から, 信頼性検証には, 正解の正確性に加えて, 有理数の有効性の確保が必要であることが示唆された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:11:41 GMT)
Rationale-Aware Answer Verification by Pairwise Self-Evaluation [11.8] 信頼性のある検証器の訓練には,最終回答の正しさに加えて,有理数の有効性の確保が必要であることを示す。
本結果から, 信頼性検証には, 正解の正確性に加えて, 有理数の有効性の確保が必要であることが示唆された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:11:41 GMT)
Beyond Model Collapse: Scaling Up with Synthesized Data Requires Verification [11.6] モデル崩壊防止のための合成データに対する検証手法について検討する。
検証器は、たとえ不完全なものであっても、モデル崩壊を防ぐために実際に活用できることが示される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:38:41 GMT)
Design nearly optimal quantum algorithm for linear differential equations via Lindbladians [11.5] オープン量子システムを用いたODEの新しい量子アルゴリズムを提案する。
我々は、非対角密度行列符号化と呼ばれる新しい手法の助けを借りて、リンドブレディアンの自然な非単位力学を用いる。
我々のアルゴリズムは、既存の量子ODEアルゴリズムを全て上回り、全てのパラメータにほぼ最適に依存することができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:27:41 GMT)
Cobblestone: Iterative Automation for Formal Verification [11.4] Coqのような証明アシスタントを用いた形式的検証は、ソフトウェア品質を改善する効果的な方法であるが、高価である。
最近の研究では、機械学習を使って証明を自動的に合成し、検証の労力を削減しているが、これらのツールは、望まれるソフトウェアプロパティのほんの一部しか証明できない。
我々は, 証明合成における部分的な進歩を生かして, 技術状況を改善する新しい証明合成手法であるCobblestoneを紹介した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:25:00 GMT)
FreeStyle: Free Lunch for Text-guided Style Transfer using Diffusion Models [11.4] 我々は,事前学習した大拡散モデルに基づいて構築された,革新的なスタイル転送手法であるFreeStyleを紹介する。
本手法では,所望のスタイルのテキスト記述のみでスタイル転送が可能であり,スタイル画像の必要がなくなる。
実験の結果,様々なコンテンツ画像とスタイルのテキストプロンプトにまたがって,提案手法の高品質な合成と忠実さを実証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:11:48 GMT)
In-Simulation Testing of Deep Learning Vision Models in Autonomous Robotic Manipulators [11.4] 自律型ロボットマニピュレータのテストは、ビジョンとコントロールコンポーネント間の複雑なソフトウェアインタラクションのために難しい。
現代のロボットマニピュレータの重要な要素は、ディープラーニングに基づく物体検出モデルである。
本稿では,写真リアリスティックなNVIDIA Isaac Simシミュレータと進化探索を統合し,重要なシナリオを識別するMARTENSフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:10:42 GMT)
PAM: A Propagation-Based Model for Segmenting Any 3D Objects across Multi-Modal Medical Images [11.4] PAM(Propagating Anything Model)は、境界ボックスやスケッチのような2Dプロンプトを使用して、医療画像ボリュームの完全な3Dセグメンテーションを作成するセグメンテーションアプローチである。
MedSAMやSegVolのような既存のモデルでは、44の医療データセットと様々な種類のオブジェクトに対して平均18.1%以上のダイス類似度係数(DSC)が向上した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:31:33 GMT)
FeBiM: Efficient and Compact Bayesian Inference Engine Empowered with Ferroelectric In-Memory Computing [11.3] マルチビット強誘電体電界効果トランジスタ(FeFET)を用いた高速かつコンパクトなベイズ推論エンジンFeBiMを提案する。
FeBiMは、コンパクトFeFETベースのクロスバー内でベイズ推論モデルの訓練された確率を効果的に符号化する。
FeFETベースの最初のインメモリベイズ推論エンジンとして、FeBiMは26.32 Mb/mm$2$で、計算効率は581.40 TOPS/Wである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:24:49 GMT)
CCI3.0-HQ: a large-scale Chinese dataset of high quality designed for pre-training large language models [11.3] CCI3.0-HQは、中国企業インターネット 3.0(CCI3.0)の高品質500GBサブセットであり、新しい2段階ハイブリッドフィルタリングパイプラインを用いて開発されている。
我々は、さまざまなデータセットにまたがる100Bトークンのスクラッチから0.5Bパラメータモデルをトレーニングし、ゼロショット設定で10のベンチマークで優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:52:59 GMT)
SSA-Seg: Semantic and Spatial Adaptive Pixel-level Classifier for Semantic Segmentation [11.2] 本稿ではセマンティック・空間適応(SSA-Seg)を提案し,セマンティックセグメンテーションの課題に対処する。
具体的には、固定されたプロトタイプから得られた粗いマスクを用いて、テスト画像のセマンティック領域と空間領域の中心に向けて固定されたプロトタイプを調整する。
その結果,提案したSSA-Segは,計算コストを最小限に抑えながら,ベースラインモデルのセグメンテーション性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:40:47 GMT)
Non-rigid Relative Placement through 3D Dense Diffusion [11.1] 相対配置」とは、ある物体が別の物体に配置されていることを予測することである。
近年の相対配置法は,ロボット操作のためのデータ効率学習に大きく進歩している。
これらは、現実の環境では非剛体が多用されているにもかかわらず、まだ変形可能な変換を表現していない。
本研究では,高密度拡散による異方性学習のための視覚に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:54:17 GMT)
A Robust Anchor-based Method for Multi-Camera Pedestrian Localization [10.9] 視覚に基づく歩行者位置推定は、画像とカメラパラメータを用いて歩行者の位置を推定する。
キャリブレーションされた カメラのパラメータは しばしば 真実から逸脱する ローカライゼーションの不正確さに 繋がる
固定位置アンカーを利用してカメラパラメータの誤差の影響を低減するアンカー方式を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:26:22 GMT)
Can Stories Help LLMs Reason? Curating Information Space Through Narrative [10.8] 本稿では,物語要素を組み込むことで,複雑な問題をより効果的に解く上で,Large Language Models (LLM) を支援することができるかどうかを検討する。
本稿では,物語構造を問題解決に役立てる新しい手法,SoT(Story of Thought)を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:13:15 GMT)
Multi-Task Dynamic Pricing in Credit Market with Contextual Information [10.4] 我々は、信用市場において多数の金融証券を購入し販売するブローカーが直面する動的価格問題について検討する。
これらの証券の価格設定の課題の1つは、頻度の低い取引であり、個別の価格設定に不十分なデータをもたらす。
本稿では、これらの共有構造を証券間で活用し、学習による価格の精度を高めるマルチタスク動的価格設定フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:45:39 GMT)
Considerations for Distribution Shift Robustness of Diagnostic Models in Healthcare [10.4] 健康のための応用MLの分野では、患者に関する情報を考慮せずに$X$から$Y$を予測することが一般的である。
本研究では,医療環境に共通するデータ生成機構を強調し,因果関係の文献による最近の理論的結果を用いて,堅牢な予測モデルを構築する方法について論じる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:13:09 GMT)
Spatial Shortcuts in Graph Neural Controlled Differential Equations [10.4] 我々は,従来のグラフトポロジ情報をニューラル微分方程式(NCDE)に組み込んで,グラフ上に定義された力学系の将来状態を予測する。
モデルアーキテクチャにおける異なる位置について検討し、NCDEにグラフ情報を与え、隠れ状態と制御の間の外的位置を理論的かつ経験的に好ましいものとして識別する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:25:49 GMT)
The Potential and Value of AI Chatbot in Personalized Cognitive Training [10.3] ReMeは、認知トレーニング研究を促進するAIチャットボットを作成するために設計されたWebベースのフレームワークである。
大きな言語モデルを活用することで、ReMeはユーザーフレンドリでインタラクティブでパーソナライズされたトレーニングエクスペリエンスを提供する。
ケーススタディでは、ライフリコールとオープンエンド言語パズルを通じてReMeがユーザをエンゲージする効果を実証している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:59:36 GMT)
Learning Mathematical Rules with Large Language Models [10.3] 本研究では,分散性や方程式の単純化など,特定の数学的規則を学習する大規模言語モデルの能力について検討する。
本稿では、これらのルールを一般化する能力と、単語問題を文脈で再利用する能力を実証的に分析する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:28:52 GMT)
Learning Unlabeled Clients Divergence for Federated Semi-Supervised Learning via Anchor Model Aggregation [10.3] SemiAnAggはアンカーモデルを通じて未ラベルのクライアントコントリビューションを学習する。
SemiAnAggは4つの広く使用されているFedSemiベンチマークにおいて、最先端の新たな結果を達成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:39:37 GMT)
Privacy without Noisy Gradients: Slicing Mechanism for Generative Model Training [10.2] 差分プライバシ(DP)を持つ生成モデルを訓練するには、通常、勾配更新にノイズを注入するか、判別器の訓練手順を適用する必要がある。
プライベートデータのランダムな低次元投影にノイズを注入するスライシングプライバシ機構について考察する。
本稿では,この分散性を考慮したカーネルベース推定器を提案し,対角訓練の必要性を回避した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:32:58 GMT)
Contrast Sets for Evaluating Language-Guided Robot Policies [10.1] 我々は、ロボット工学のコントラストセットを導入して、独立で同一の分散テストインスタンスに対して、小さく、しかし特異な摂動を発生させる。
評価を行おうとする実験者の努力と得られた評価結果との関係について検討する。
我々は、異なるコントラストセットの摂動の相対的な性能変化を利用して、シミュレーション操作タスクと物理ロボット視覚・言語ナビゲーションタスクの両方において、実験者の努力を減らし、ポリシーを特徴づける。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:23:07 GMT)
Can We Trust AI Agents? An Experimental Study Towards Trustworthy LLM-Based Multi-Agent Systems for AI Ethics [10.1] 本研究では,信頼度向上技術が倫理的AI出力生成に与える影響について検討する。
我々はLLM-BMASのプロトタイプを設計し、エージェントは現実世界の倫理的AI問題に関する構造化された議論を行う。
議論では、バイアス検出、透明性、説明責任、ユーザの同意、コンプライアンス、公正性評価、EU AI Actコンプライアンスといった用語が明らかにされている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:17:59 GMT)
UbiHR: Resource-efficient Long-range Heart Rate Sensing on Ubiquitous Devices [10.0] ユビキタスデバイスを用いた心拍センサシステムUbiHRを提案する。
UbiHRの鍵は、ノイズ非依存の心拍認識と、コモディティモバイルデバイスでの表示を可能にするリアルタイムの長距離時間モデルである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:28:19 GMT)
Link, Synthesize, Retrieve: Universal Document Linking for Zero-Shot Information Retrieval [9.8] 本稿では,複数のデータセットにまたがる合成クエリ生成を促進するために,類似文書をリンクするUniversal Document Linking (UDL)アルゴリズムを提案する。
我々の実証研究は、多種多様なデータセットとIRモデルにまたがるUDLの有効性と普遍性を実証し、ゼロショットの場合の最先端手法を超越した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:20:12 GMT)
FLiP: Privacy-Preserving Federated Learning based on the Principle of Least Privileg [9.6] フェデレートラーニング(FL)では、生のデータの代わりに知識を共有することで、モデルのトレーニングを高精度に行うことができる。
トレーニング中、ユーザーは共有されている知識をコントロールできなくなり、データプライバシの深刻な問題を引き起こす。
FLトレーニングに最小特権(PoLP)の原則を導入することを目的としたFLiPを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:20:40 GMT)
Development and Validation of a Dynamic-Template-Constrained Large Language Model for Generating Fully-Structured Radiology Reports [9.5] 完全に構造化されたレポートを作成するための現在のLLMは、外部サーバにデータをアップロードする際のエラー、コンテンツ幻覚、プライバシー漏洩といった問題に直面している。
我々は,各機関の様々な自由テキストレポートから完全に構造化され,標準化されたLCSレポートを作成するための,オープンソースで正確なLCMを開発することを目的としている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:17:24 GMT)
Cross-Institutional Structured Radiology Reporting for Lung Cancer Screening Using a Dynamic Template-Constrained Large Language Model [9.5] 我々は,自由テキスト記述から構造化および標準化されたLCSレポートを作成するための拡張されたオープンソースLCMを開発することを目的とする。
LLAMA-3.1 405Bを最大10.42%改善し, GPT-4oを17.19%向上させた。
大規模マルチモーダルデータベース上で,新しい結節検索システムを試作し,実演した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:17:24 GMT)
EVOTER: Evolution of Transparent Explainable Rule-sets [9.4] 本稿では,まずモデルが透明で説明しやすいアプローチを提唱する。
このアプローチは、いくつかの予測/分類と処方/政治検索ドメインで評価される。
ブラックボックスモデルと同様に機能する有意義なルールセットを発見することが示されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:27:18 GMT)
README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.4] 医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:30:28 GMT)
Do LLMs estimate uncertainty well in instruction-following? [9.1] 大規模言語モデル(LLM)は、ユーザ指示に従うことができるため、さまざまなドメインにわたるパーソナルAIエージェントとして価値のあるものになり得る。
命令追従の文脈におけるLCMの不確実性推定能力の最初の体系的評価について述べる。
以上の結果から,既存の不確実性手法は,特にモデルが後続の命令で微妙な誤りを犯した場合に困難であることがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:59:50 GMT)
Analyzing Generative Models by Manifold Entropic Metrics [8.5] 抽出可能な情報理論評価指標を新たに導入する。
EMNISTデータセット上の各種正規化フローアーキテクチャと$beta$-VAEを比較した。
私たちの実験で最も興味深い発見は、トレーニング中に整列および非整合表現に収束する誘導バイアスの観点から、モデルアーキテクチャとトレーニング手順のランク付けです。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:35:00 GMT)
VisionCoder: Empowering Multi-Agent Auto-Programming for Image Processing with Hybrid LLMs [8.4] 本稿では,自動プログラミングタスクを協調的に完了するマルチエージェントフレームワークを提案する。
各エージェントは、仮想組織をまとめて形成する、ソフトウェア開発サイクルにおいて、明確な役割を担います。
このフレームワークは、プロジェクト、モジュール、ファンクションレベルにまたがるツリー構造化の思考分布と開発メカニズムを確立することで、コスト効率と効率的なソリューションを提供します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:52:15 GMT)
FairMT-Bench: Benchmarking Fairness for Multi-turn Dialogue in Conversational LLMs [8.4] マルチターン対話シナリオである textbfFairMT-Bench における大規模言語モデル(LLM)ベースのチャットボットの公平性ベンチマークを提案する。
多様なバイアスタイプや属性のカバレッジを確保するため,マルチターン対話データセットである texttFairMT-10K を構築した。
textttFairMT-10Kの実験と分析により、マルチターン対話シナリオでは、現在のLLMは偏りのある応答を生成する傾向があり、様々なタスクやモデルのパフォーマンスに顕著なばらつきがあることが明らかになった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:06:31 GMT)
SE(3)-bi-equivariant Transformers for Point Cloud Assembly [8.3] 一対の点雲が与えられた場合、アセンブリの目標は、一方の点雲ともう一方の点雲を整合させる厳密な変換を回復することである。
このタスクは、点雲がオーバーラップされない可能性があり、任意の初期位置を持つため、難しい。
BITR (SE(3)-bi-equivariant transformer) という手法を提案する。
入力が厳格に摂動されると、出力がそれに従って変換されることを保証する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:05:08 GMT)
Benchmarking and Building Zero-Shot Hindi Retrieval Model with Hindi-BEIR and NLLB-E5 [8.2] Hindi-BEIRベンチマークを導入し,7つのタスクにまたがる15のデータセットについて検討した。
我々は,Hindi-BEIRベンチマークを用いた最先端多言語検索モデルの評価を行い,課題とドメイン固有の課題を特定する。
我々は,ヒンディー語学習データを必要とせずにヒンディー語をサポートするため,ゼロショットアプローチを利用する多言語検索モデルであるNLLB-E5を紹介する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:41:17 GMT)
Robust Thompson Sampling Algorithms Against Reward Poisoning Attacks [8.2] トンプソンサンプリングは、オンラインのシーケンシャルな意思決定問題に対する最も人気のある学習アルゴリズムの1つである。
現在のトンプソンサンプリングアルゴリズムは、受け取った報酬が破壊されないという仮定によって制限されており、敵の報酬中毒が存在する現実世界の応用には当てはまらないかもしれない。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:27:58 GMT)
Beyond Point Annotation: A Weakly Supervised Network Guided by Multi-Level Labels Generated from Four-Point Annotation for Thyroid Nodule Segmentation in Ultrasound Image [8.1] 微妙な結節セグメンテーションの制約を洗練するために、4点アノテーションから多レベルラベルを生成する弱教師付きネットワークを提案する。
提案するネットワークは,2つの公開データセットにおいて,精度とロバスト性に関して,既存の弱教師付き手法よりも優れている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:34:53 GMT)
A Stock Price Prediction Approach Based on Time Series Decomposition and Multi-Scale CNN using OHLCT Images [8.1] 本稿では,中国Aシェア市場の株価変動を予測するために,Sequence-based Multiscale Fusion Regression Convolutional Neural Network (SMSFR-CNN) という新しい手法を提案する。
提案モデルでは, 正の予測値が61.15%, 負の予測値が63.37%, 続く5日間の株価トレンドが63.37%となる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:50:54 GMT)
Not (yet) the whole story: Evaluating Visual Storytelling Requires More than Measuring Coherence, Grounding, and Repetition [8.1] 人間の類似性の観点から,物語の質を計測する新しい手法を提案する。
次に、この手法を用いて、複数のモデルによって生成されたストーリーを評価する。
TAPMのビジュアルコンポーネントと言語コンポーネントをアップグレードすると、競合するパフォーマンスをもたらすモデルが得られる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:47:11 GMT)
Not (yet) the whole story: Evaluating Visual Storytelling Requires More than Measuring Coherence, Grounding, and Repetition [8.1] 人間の類似性の観点から,物語の質を計測する新しい手法を提案する。
次に、この手法を用いて、複数のモデルによって生成されたストーリーを評価する。
TAPMのビジュアルコンポーネントと言語コンポーネントをアップグレードすると、競合するパフォーマンスをもたらすモデルが得られる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:47:11 GMT)
TEARS: Textual Representations for Scrutable Recommendations [8.0] TEARS(TExtuAl Representations for Scrutable Representations)について紹介する。
TEARSは、潜伏した埋め込みを通じてユーザの興味を表す代わりに、それらを自然なテキストでエンコードし、透明性を提供し、ユーザーが編集できるようにする。
TEARSは、ユーザ制御可能なレコメンデーションを提供しながら、一般的な3つのVAEモデルの性能を上回ることができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:26:00 GMT)
TRADE: Transfer of Distributions between External Conditions with Normalizing Flows [8.0] 本稿では,境界値問題として学習過程を定式化することで限界を克服するTRADEを提案する。
ベイズ推定や分子シミュレーションから物理格子モデルまで,幅広い応用において優れた結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:49:40 GMT)
Generative Diffusion Models for Sequential Recommendations [7.9] 変分オートエンコーダ(VAE)やGAN(Generative Adversarial Networks)のような生成モデルは、逐次レコメンデーションタスクにおいて有望であることを示している。
本研究では、ロバスト性を改善するためにDiffuRecアーキテクチャの拡張を導入し、関連するユーザとイテムのインタラクションをよりよく捉えるために、Approximatorにクロスアテンション機構を組み込んだ。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:39:05 GMT)
Do LLMs "know" internally when they follow instructions? [7.9] この次元に沿った表現の修正は、ランダムな変化に比べて、命令追従の成功率を改善することを示す。
また、この次元は、タスクや命令の固有の困難さよりも、プロンプトの表現に密接に関連していることも判明した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:00:55 GMT)
A Debate-Driven Experiment on LLM Hallucinations and Accuracy [7.8] 本研究では,大規模言語モデル(LLM)における幻覚現象について検討する。
GPT-4o-Miniモデルの複数のインスタンスは、TrathfulQAデータセットからの質問によって引き起こされた議論のような相互作用に関与している。
1つのモデルは、もっともらしいが偽の答えを生成するように故意に指示され、他のモデルは真に応答するように要求される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:41:27 GMT)
Analysis of Financial Risk Behavior Prediction Using Deep Learning and Big Data Algorithms [7.7] 本稿では,金融リスク予測のためのディープラーニングとビッグデータアルゴリズムの有効性と有効性について検討する。
ディープラーニングベースのビッグデータリスク予測フレームワークを設計し、実際の財務データセット上で実験的に検証する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:52:04 GMT)
The Double-Edged Sword of Behavioral Responses in Strategic Classification: Theory and User Studies [7.7] 本稿では,アルゴリズムに対する人間の反応の行動バイアスを考慮した戦略的分類モデルを提案する。
分類器の誤認が、偏りのあるエージェントと合理的なエージェントの反応の異なるタイプの相違をもたらすことを示す。
行動バイアスのある戦略的エージェントは、完全に合理的な戦略エージェントと比較して、会社に利益をもたらすか、または(予想外の)害を与える可能性があることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:48:34 GMT)
Learning Heuristics for Transit Network Design and Improvement with Deep Reinforcement Learning [7.7] グラフニューラルネットを用いた深層強化学習を用いて,進化的アルゴリズムの低レベル学習を行う。
これらの学習は、70ノード以上のベンチマーク合成都市におけるアルゴリズムの結果を改善する。
また、市内の既存の交通網で最大12%のコスト削減を提供している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:05:49 GMT)
Robot Behavior Personalization from Sparse User Feedback [7.5] 抽象概念(TAACo)フレームワークを用いたタスク適応を作成する。
TAACoは、任意のタスクでユーザの望ましい支援方法を予測することができる。
予測精度において,TAACoはGPT-4の16%,ルールベースシステムでは54%を上回った。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:08:38 GMT)
Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers [7.4] RoPE(Rotary Positional Embeddings)は、Transformerモデルにおける位置符号化を強化する。
本稿では,RoPEが位置依存回転を導入し,トークン埋め込みにおける位相シフトを引き起こす方法について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:27:05 GMT)
Peptide-GPT: Generative Design of Peptides using Generative Pre-trained Transformers and Bio-informatic Supervision [7.3] 異なる性質を持つタンパク質配列を生成するのに適したタンパク質言語モデルを導入する。
生成した配列をそれらの難易度スコアに基づいてランク付けし、タンパク質の許容凸殻の外にある配列をフィルタリングする。
溶血率76.26%, 非溶血率72.46%, 非溶血率78.84%, 溶血率68.06%であった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:15:39 GMT)
Neural-Rendezvous: Provably Robust Guidance and Control to Encounter Interstellar Objects [7.2] 本稿では、高速移動物体に遭遇するためのディープラーニングに基づくガイダンスおよび制御フレームワークであるNeural-Rendezvousを提案する。
スペクトル正規化ディープニューラルネットワークによってモデル化されたガイダンスポリシの上に、ポイントワイズで最小限のノルムトラッキング制御を使用する。
ニューラルレンデブースは、期待される宇宙船の配送誤差に比例して高い確率指数を与えることを示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:03:04 GMT)
Utilizing Image Transforms and Diffusion Models for Generative Modeling of Short and Long Time Series [7.2] 可変長時系列の統一生成モデルを提案する。
遅延埋め込みや短時間フーリエ変換などの可逆変換を用いる。
提案手法は,強いベースラインに対して常に最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:06:18 GMT)
Take Caution in Using LLMs as Human Surrogates: Scylla Ex Machina [7.2] 研究は、大規模言語モデル(LLM)が、経済実験、調査、政治談話において、人間の行動と整合した人間的な推論を示す可能性があることを示唆している。
このことから、LLMは社会科学研究において人間のサロゲートとして使用できると多くの人が提案している。
11~20のマネーリクエストゲームを用いてLCMの推論深度を評価する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:46:07 GMT)
The Impact of Train-Test Leakage on Machine Learning-based Android Malware Detection [6.9] 同一またはほぼ同一のアプリ表現を持つ異なるAndroidアプリを特定します。
これは、機械学習モデルのパフォーマンスを膨らませるデータリークの問題につながる。
機械学習ベースのAndroidマルウェア検知器を構築するためのリーク認識方式を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:04:01 GMT)
CHESTNUT: A QoS Dataset for Mobile Edge Environments [6.8] QoS(Quality of Service)は、ネットワークサービスのパフォーマンスを測定する重要な指標である。
収集過程におけるサービス品質の時間的・地理的な位置情報を正確に記録する新しいデータセットを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:56:08 GMT)
PMM-Net: Single-stage Multi-agent Trajectory Prediction with Patching-based Embedding and Explicit Modal Modulation [6.8] 本稿では,マルチエージェント軌道予測フレームワークの定式化について検討する。
本稿では,パッチベースの時間的特徴抽出モジュールとグラフベースのソーシャル特徴抽出モジュールを提案する。
本稿では,時間的特徴と社会的特徴を統合し,効率的な単一ステージ推論パイプラインを構築するための,明示的なモダリティ変調に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:16:27 GMT)
Knowledge-aware Text-Image Retrieval for Remote Sensing Images [6.5] クロスモーダルテキストイメージ検索は、しばしばテキストと画像の間の情報非対称性に悩まされる。
外部知識グラフから関連情報をマイニングすることにより,知識を考慮したテキスト画像検索手法を提案する。
提案手法は, 知識認識手法により多様かつ一貫した検索が実現され, 最先端の検索方法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:31:37 GMT)
Towards Interpretable End-Stage Renal Disease (ESRD) Prediction: Utilizing Administrative Claims Data with Explainable AI Techniques [6.4] 本研究は,慢性腎臓病(CKD)から末期腎疾患(ESRD)への進行を予測するために,高度な機械学習とディープラーニング技術を組み合わせた管理クレームデータを活用する可能性を検討する。
我々は、ランダムフォレストやXGBoostといった従来の機械学習手法とLong Short-Term Memory(LSTM)ネットワークのようなディープラーニングアプローチを用いて、大手医療保険会社が提供した包括的10年間のデータセットを分析し、複数の観測窓の予測モデルを開発する。
以上の結果から,LSTMモデル,特に24ヶ月の観測窓を用いた場合,ESRD進行予測において優れた性能を示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:33:42 GMT)
Towards Interpretable End-Stage Renal Disease (ESRD) Prediction: Utilizing Administrative Claims Data with Explainable AI Techniques [6.4] 本研究は,慢性腎臓病(CKD)から末期腎疾患(ESRD)への進行を予測するために,高度な機械学習とディープラーニング技術を組み合わせた管理クレームデータを活用する可能性を検討する。
我々は、ランダムフォレストやXGBoostといった従来の機械学習手法とLong Short-Term Memory(LSTM)ネットワークのようなディープラーニングアプローチを用いて、大手医療保険会社が提供した包括的10年間のデータセットを分析し、複数の観測窓の予測モデルを開発する。
以上の結果から,LSTMモデル,特に24ヶ月の観測窓を用いた場合,ESRD進行予測において優れた性能を示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:33:42 GMT)
Electromechanical Dynamics of the Heart: A Study of Cardiac Hysteresis During Physical Stress Test [6.4] 運動中の電気機械間隔(RR, QT, シストリック, ジアストリック)とその相互作用について検討した。
深層学習モデルは、RRデータからQT, systolic, diastolic intervalを推定し、RRと他の区間の非線形関係を確認する。
発見は、心電図とPCGの形態と心拍数履歴のタイミングをリンクすることで、重要な心臓記憶効果を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:23:19 GMT)
Neuromorphic IoT Architecture for Efficient Water Management: A Smart Village Case Study [6.3] 従来のIoTシステムは、高い通信オーバーヘッドとかなりのエネルギー消費に悩まされることが多い。
本研究は生物学的システムにインスパイアされたニューロモルフィックアーキテクチャを提案する。
我々は,ノイハウスのカリンチア地域の水管理に焦点をあてた事例研究を行った。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:51:34 GMT)
Doing Experiments and Revising Rules with Natural Language and Probabilistic Reasoning [6.2] 実験によって自然言語規則を推論する方法のモデルを提供する。
このモデルは、確率的推論のためにLarge Language Models (LLM)とMonte Carloアルゴリズムを統合する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:26:41 GMT)
Integrating Large Language Models with Internet of Things Applications [6.2] 本稿では,大規模言語モデル(LLM)がモノのインターネット(IoT)ネットワークをよりインテリジェントで応答性の高いものにするアプリケーションを特定し,解析する。
その結果,数ショット学習時のGPTモデルでは検出精度が87.6%,微調整のGPTでは94.9%に向上した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:21:45 GMT)
Golden Ratio-Based Sufficient Dimension Reduction [6.2] 本稿では,ニューラルネットワークを用いた十分次元削減手法を提案する。
構造次元を効果的に特定し、中心空間をうまく推定する。
これは、バロンクラスの関数に対するニューラルネットワークの近似能力の利点を生かし、計算コストの削減につながる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:15:15 GMT)
Finite Temperature Casimir Effect of Scalar Field: Revisit and New Results [6.1] 我々はギブス自由エネルギー、カシミール力、カシミールエントロピーの分析式を求める。
以上の結果から,カシミール力の熱補正の低温近似法である$piTe-pivhbar/aT/2a3$は,正確な解法で大きな誤差を有することがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:02:28 GMT)
Assessing Quantum Extreme Learning Machines for Software Testing in Practice [6.1] 量子ノイズが3つの産業的および実世界の古典的ソフトウェアテストケーススタディにおいてQELMに与える影響について検討する。
その結果,QELMは量子ノイズの影響が大きく,回帰タスクは250%,分類タスクは50%であった。
誤差軽減技術は耐雑音性を高めることができるが、平均3.0%の性能低下を達成することはできるが、その効果は文脈によって異なる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:45:13 GMT)
Topology-aware Mamba for Crack Segmentation in Structures [5.9] マンバをベースとしたモデルであるCrackMambaは、インフラストラクチャの構造的健全性を監視するために、効率的で正確なクラックセグメンテーションのために設計されている。
CrackMambaは、VMambaV2をエンコーダと新しいデコーダとして、トレーニング済みのImageNet-1k重みで利用することで、これらの課題に対処している。
実験により、CrackMambaはCrackSeg9kおよびSwerCrackデータセット上での最先端(SOTA)パフォーマンスを実現し、網膜血管セグメンテーションデータセットCHASEunderlineDB1上での競合性能を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:17:52 GMT)
An LLM Agent for Automatic Geospatial Data Analysis [5.8] 大規模言語モデル(LLM)は、データサイエンスコード生成タスクで使われている。
複雑なデータ構造と空間的制約を組み込むのが困難であるため,空間空間データ処理への応用は困難である。
ジオアジェント(GeoAgent)は,LLMが地理空間データ処理をより効率的に処理できるように設計された対話型フレームワークである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:00:07 GMT)
Balancing the Scales: Enhancing Fairness in Facial Expression Recognition with Latent Alignment [5.8] このワークル平均は、表情認識システムにおけるバイアスを軽減するために、潜在空間に基づく表現学習を行う。
また、ディープラーニングモデルの公平性と全体的な正確性も向上する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:03:10 GMT)
BitPipe: Bidirectional Interleaved Pipeline Parallelism for Accelerating Large Models Training [5.7] BitPipeは、大規模なモデルのトレーニングを加速するための双方向のインターリーブパイプライン並列処理である。
最新の同期手法と比較して,BitPipeはGPTスタイルとBERTスタイルのモデルのトレーニングスループットを1.05x-1.28倍向上することを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:08:51 GMT)
UnCLe: Unsupervised Continual Learning of Depth Completion [5.7] UnCLeはマルチモーダル深度推定タスクの教師なし連続学習のための標準ベンチマークである。
連続したデータストリーム上の教師なし学習の実践シナリオ下で、深度補完モデルをベンチマークする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:37:29 GMT)
Performance advantage of discriminating one-versus-two incoherent sources based on quantum hypothesis testing [5.6] 対称なシナリオと非対称なシナリオにおける1対2の点状非コヒーレントなソースの識別について研究した。
単発・多発テスト後に決定を下す誤差確率の量子的下界を計算した。
我々の結果は、顕微鏡や天文学のような現実世界の量子イメージングに寄与するかもしれない。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:26:50 GMT)
Robust Time Series Causal Discovery for Agent-Based Model Validation [5.4] 本研究では、ABM検証のための因果構造学習を強化するために、ロバストクロスバリデーション(RCV)アプローチを提案する。
RCV-VarLiNGAM と RCV-PCMCI を開発した。
提案手法は、拡張されたABM検証フレームワークに統合される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:13:26 GMT)
DECADE: Towards Designing Efficient-yet-Accurate Distance Estimation Modules for Collision Avoidance in Mobile Advanced Driver Assistance Systems [5.4] 本稿では,距離推定モデルであるDECADEについて述べる。
これらのモジュールを任意の検出器にアタッチして物体検出を高速な距離推定で拡張できることを実証する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:40:42 GMT)
Enabling Efficient and Flexible Interpretability of Data-driven Anomaly Detection in Industrial Processes with AcME-AD [5.3] 本稿では,AcME-ADの産業応用について述べる。
AcME-ADはモデルに依存しない柔軟性を提供し、リアルタイム効率を優先する。
これらのテストは、産業環境におけるADと特徴に基づく根本原因分析に有用なツールとして、AcME-ADの可能性を実証している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:59:22 GMT)
Pseudorandomness in the (Inverseless) Haar Random Oracle Model [5.3] ランダムオラクルモデルの量子アナログにおいて、量子擬似ランダムの概念の実現可能性について検討する。
このモデルでは、敵対者を含むすべての当事者は、同じハールランダムなユニタリにアクセスすることができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:13:01 GMT)
LatentQGAN: A Hybrid QGAN with Classical Convolutional Autoencoder [5.3] 量子機械学習の潜在的な応用は、古典的なデータを生成するために量子コンピュータのパワーを利用することである。
本稿では,自己エンコーダと結合したハイブリッド量子古典的GANを用いた新しい量子モデルであるLatntQGANを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:34:45 GMT)
LatentQGAN: A Hybrid QGAN with Classical Convolutional Autoencoder [5.3] 量子機械学習の潜在的な応用は、古典的なデータを生成するために量子コンピュータのパワーを利用することである。
本稿では,自己エンコーダと結合したハイブリッド量子古典的GANを用いた新しい量子モデルであるLatntQGANを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:34:45 GMT)
LatentQGAN: A Hybrid QGAN with Classical Convolutional Autoencoder [5.3] 量子機械学習の潜在的な応用は、古典的なデータを生成するために量子コンピュータのパワーを利用することである。
本稿では,自己エンコーダと結合したハイブリッド量子古典的GANを用いた新しい量子モデルであるLatntQGANを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:34:45 GMT)
Gradient-free online learning of subgrid-scale dynamics with neural emulators [5.3] 機械学習に基づくサブグリッドパラメトリゼーションをオンラインでトレーニングするための汎用アルゴリズムを提案する。
我々は、元の解法の勾配を計算することなく、オンライン戦略の利点のほとんどを回復するパラメトリゼーションを訓練することができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:07:19 GMT)
Analyzing Neural Network Robustness Using Graph Curvature [5.2] 本稿では,グラフ理論解析の観点から,ニューラルネットワーク(NN)のロバスト性問題に対する新たな考察を示す。
我々は、ニューラルネットワークのリッチ曲率の概念を定義し、それをNN出力に"データ転送に頻繁に使用されるボトルネックNNエッジを特定するために使用します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:59:58 GMT)
COMSPLIT: A Communication-Aware Split Learning Design for Heterogeneous IoT Platforms [5.1] COMSPLITは、スプリットラーニング(SL)とIoTネットワークにおける時系列データ処理に適した推論パラダイムのための通信対応設計である。
その結果, COMSPLIT はバニラSL 法に比べて優れた性能を示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:27:38 GMT)
PatternPaint: Generating Layout Patterns Using Generative AI and Inpainting Techniques [5.1] 既存のトレーニングベースのMLパターン生成アプローチでは、技術ノード開発の初期段階において、法的レイアウトパターンの生成に苦労している。
DRCクリーントレーニングサンプルを限定した法的なパターンを生成可能な,トレーニングフリーなフレームワークであるPatternPaintを提案する。
PatternPaintは、20デザインルールのきれいなレイアウトパターンを入力として使用して、複雑な2Dレイアウトパターンライブラリを生成する最初のフレームワークである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:24:03 GMT)
Learning Diffusion Policies from Demonstrations For Compliant Contact-rich Manipulation [5.1] 本稿では,DIPCOM(Diffusion Policies for Compliant Manipulation)を提案する。
生成拡散モデルを活用することで、カルト効果のポーズを予測し、腕の硬さを調整し、必要な力を維持できる政策を開発する。
提案手法は,マルチモーダル分布モデリングによる力制御を強化し,コンプライアンス制御における拡散ポリシの統合を改善し,実世界のタスクにおいてその効果を示すことによって,これまでの作業を拡張する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:56:15 GMT)
Artificial intelligence inspired freeform optics design: a review [5.1] この記事では、フリーフォーム光学設計におけるAIアプリケーションの最新開発についてレビューする。
これは、データ要求、モデル解釈可能性、計算複雑性といった課題と共に、精度とパフォーマンスの改善など、AIの利点に対処する。
フリーフォーム光学設計におけるAIの未来は、ハイブリッドデザイン手法、解釈可能なAI、AI駆動製造、特定のアプリケーションを対象とした研究の潜在的な進歩とともに、有望に思われる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:42:55 GMT)
Artificial intelligence inspired freeform optics design: a review [5.1] この記事では、フリーフォーム光学設計におけるAIアプリケーションの最新開発についてレビューする。
これは、データ要求、モデル解釈可能性、計算複雑性といった課題と共に、精度とパフォーマンスの改善など、AIの利点に対処する。
フリーフォーム光学設計におけるAIの未来は、ハイブリッドデザイン手法、解釈可能なAI、AI駆動製造、特定のアプリケーションを対象とした研究の潜在的な進歩とともに、有望に思われる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:42:55 GMT)
Any Other Thoughts, Hedgehog? Linking Deliberation Chains in Collaborative Dialogues [5.1] 我々は,対話の早い段階での発話から探究的質問の出現に至る因果関係をモデル化することに注力する。
我々はこれらの関係を、新しいグラフに基づく検討連鎖の枠組みを用いてモデル化し、コア参照型クラスタリング問題としてそのような連鎖を構築する際の問題を再検討する。
本研究は,ベースラインおよびより強力なコア参照アプローチと比較して,理論的に基礎となるアプローチの有効性を示すものである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:15:56 GMT)
Topological bosonic Bogoliubov excitations with sublattice symmetry [5.0] 非消滅粒子数保存項を持つ熱力学的に安定な自由ボソン系のボソニックボゴリューボフ励起について検討する。
ボソニックなBogoliubov-de Gennes Hamiltonianによってよく説明されるような系は、一般に粒子数保存(単粒子)に還元できることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:32:47 GMT)
Hierarchical Upper Confidence Bounds for Constrained Online Learning [4.9] 階層的制約付き帯域幅(HCB)フレームワークを導入し、コンテキスト的帯域幅問題を拡張して階層的決定構造とマルチレベル制約を組み込む。
我々の理論的解析はHC-UCBのサブ線形後悔境界を確立し、すべての階層レベルでの制約満足度を高い確率で保証する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:01:22 GMT)
pEBR: A Probabilistic Approach to Embedding Based Retrieval [4.8] 埋め込み検索は、クエリとアイテムの両方の共有セマンティック表現空間を学習することを目的としている。
現在の産業実践では、検索システムは典型的には、異なるクエリに対して一定数のアイテムを検索する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:14:12 GMT)
Data Efficiency for Large Recommendation Models [4.8] 大規模なレコメンデーションモデル(LRMs)は、数十億ドル規模のオンライン広告業界にとって基本である。
膨大なデータのスケールは、計算コストと新しい手法を評価できる速度の両方に直接的な影響を及ぼす。
本稿では,データ要件を最適化する実践者を支援するための実行可能な原則と高レベルフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:26:35 GMT)
ArCSEM: Artistic Colorization of SEM Images via Gaussian Splatting [4.8] 本稿では,顕微鏡シーンの3次元構造を用いて,スキャン対象の複数画像のカラー化を容易にすることを提案する。
以前の作業とは対照的に、3D表現の取得に手動による介入やラベル付けは存在しない。
これにより、アーティストはシーケンスの単一または少数のビューを色付けし、完全に色の付いたシーンやビデオを自動的に取り出すことができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:07:19 GMT)
Context-Based Visual-Language Place Recognition [4.7] 視覚に基づく位置認識に対する一般的なアプローチは、低レベルの視覚的特徴に依存している。
シーン変更に対して堅牢で,追加のトレーニングを必要としない,新しいVPRアプローチを導入する。
ゼロショット・言語駆動セマンティックセグメンテーションモデルを用いて画素レベルの埋め込みを抽出し,セマンティックイメージ記述子を構築する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:59:11 GMT)
Towards Robust Out-of-Distribution Generalization: Data Augmentation and Neural Architecture Search Approaches [4.6] 我々は、ディープラーニングのための堅牢なOoD一般化への道を探る。
まず,認識に必須でない特徴間の素早い相関を解消するための,新しい効果的なアプローチを提案する。
次に,OoDシナリオにおけるニューラルアーキテクチャ探索の強化問題について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:50:32 GMT)
Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges [4.5] 自然言語処理は、法律専門家や法務担当者の法務分野における活動の仕方に革命をもたらしている。
本調査では,手動フィルタリング後の127項目を最終選択として,システムレビューとメタアナライズフレームワークの優先報告項目に従って,148の研究をレビューした。
法律分野における自然言語処理に関する基礎概念を探求する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:17:02 GMT)
Learning the Regularization Strength for Deep Fine-Tuning via a Data-Emphasized Variational Objective [4.5] グリッド検索は計算コストが高く、検証セットを彫り出す必要があり、実践者は候補値を指定する必要がある。
提案手法はグリッド探索の3つの欠点をすべて克服する。
いくつかのデータセットにおける画像分類タスクの有効性を実証し,既存の手法に匹敵するホールドアウト精度を得た。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:32:11 GMT)
Edge-preserving noise for diffusion models [4.4] 本稿では,拡散確率モデル(DDPM)を一般化した新しいエッジ保存拡散モデルを提案する。
特に、エッジ保存と等方性ガウスノイズの間で異なるエッジ対応ノイズスケジューラを導入する。
モデルの生成過程はより高速に収束し, 対象の分布とより密に一致していることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:44:10 GMT)
Edge-preserving noise for diffusion models [4.4] 本稿では,拡散確率モデル(DDPM)を一般化した新しいエッジ保存拡散モデルを提案する。
特に、エッジ保存と等方性ガウスノイズの間で異なるエッジ対応ノイズスケジューラを導入する。
モデルの生成過程はより高速に収束し, 対象の分布とより密に一致していることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:44:10 GMT)
Imputation using training labels and classification via label imputation [4.4] 欠落したデータを扱うために,ミスフォレスト計算に基づく分類を提案する。
CBMIは予測されたテストラベルを欠落した値で積み上げ、インプットでラベルを積み重ねる。
CBMIは、入力データのみに基づいて、命令よりもはるかに優れた結果を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:44:08 GMT)
Unsupervised Machine Learning for Detecting and Locating Human-Made Objects in 3D Point Cloud [4.3] 本研究は,自然木構造中の人工物の検出と同定という,新しい課題を紹介する。
提案手法は, 地中フィルタリング, 局所情報抽出, クラスタリングの3段階からなる。
実験により,提案手法は従来の手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:20:57 GMT)
Augmenting Interpolation-Based Model Checking with Auxiliary Invariants (Extended Version) [4.3] モデル検査に外部不変量を注入する拡張型検証アルゴリズムを提案する。
インジェクション不変により安全性の証明に必要なクエリ数が削減され,実行時の効率が向上することがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:10:42 GMT)
LArctan-SKAN: Simple and Efficient Single-Parameterized Kolmogorov-Arnold Networks using Learnable Trigonometric Function [4.2] LSin-SKAN、LCos-SKAN、LArctan-SKANの3つの新しい派生型が開発されている。
LArctan-SKANは精度と計算効率の両面で優れている。
その結果,三角関数で構築したSKANの有効性と可能性が確認された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:41:56 GMT)
Does Diffusion Beat GAN in Image Super Resolution? [4.2] 多くの研究において、拡散型ISRモデルはより大きなネットワークを使用し、GANベースラインよりも長く訓練されている。
本稿では,GANモデルが拡散モデルに匹敵する,あるいは優れた結果が得られることを示す。
スケールしたGANの推論コードと重みを公開します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:04:01 GMT)
Evaluation of strategies for efficient rate-distortion NeRF streaming [4.1] ニューラル・ラジアンス・フィールド(NeRF)は、スパース画像から高度に現実的で詳細なシーン再構成を可能にすることで、3次元視覚表現の分野に革命をもたらした。
その進歩にもかかわらず、大量のデータを含むため、NeRFコンテンツの効率的なストリーミングは依然として大きな課題である。
本稿では,2つのNeRFストリーミング戦略である画素ベースとニューラルネットワーク(NN)パラメータベースのストリーミングの速度歪み特性について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:40:03 GMT)
Class-Discriminative Attention Maps for Vision Transformers [4.1] 我々は,下流タスクに敏感な説明を生成するために,クラス識別アテンションマップ(CDAM)を開発した。
CDAMは既知のクラスや潜在概念に関して特徴的重要性を推定する。
特に,既存の重要度推定器では十分なクラス感度が得られないことが示唆された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:27:37 GMT)
Intelligent Understanding of Large Language Models in Traditional Chinese Medicine Based on Prompt Engineering Framework [4.0] 本稿では,事前学習型言語モデル(PLM)やテンプレート,トークン化,動詞化などを統合するフレームワークであるTCM-Promptを提案する。
疾患分類,シンドローム同定,ハーブ・メディカル・レコメンデーション,一般NLPタスクについて実験を行った。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:24:30 GMT)
A Pre-trained Sequential Recommendation Framework: Popularity Dynamics for Zero-shot Transfer [4.0] オンラインアプリケーションの成功には、シーケンシャルなレコメンデーターが不可欠だ。
本稿では,事前学習型シーケンシャルレコメンデーションフレームワークPrepRecを提案する。
PrepRecは、最先端のシーケンシャルレコメンデータモデルと比較して、競争性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:43:57 GMT)
A Bi-consolidating Model for Joint Relational Triple Extraction [4.0] リレーショナルトリプルを抽出する現在の手法は、エンティティ認識に依存することなく、生文の可能なエンティティペアに基づいて直接予測を行う。
このタスクは、複数の関係三重項が文中に1つまたは2つの実体を共有するという深刻な意味的重なり合う問題に悩まされる。
関係三重関係に関連する局所的・大域的意味的特徴を同時に強化することにより、この問題に対処するバイコンソリデーションモデルを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:15:08 GMT)
Efficient Biological Data Acquisition through Inference Set Design [4.0] 本研究は,システム全体としての所望の精度を実現するため,最小の候補群を選択することを目的とする。
このメカニズムを推論セット設計と呼び,不確実性に基づくアクティブラーニングソリューションを用いて,挑戦的な事例を抽出する手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:34:03 GMT)
Assessing the societal influence of academic research with ChatGPT: Impact case study evaluations [3.9] 本研究は,ChatGPTが社会的影響の主張を評価できるかどうかを検討する。
その結果を、公表された部門平均ICSスコアと比較する。
このアプローチにより得られたスコアは,全34単位の部門平均スコアと正の相関を示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:51:10 GMT)
Floquet Engineering of Hilbert Space Fragmentation in Stark Lattices [3.9] HSF(Hilbert space fragmentation)の概念は、最近量子エルゴード性を破壊するルーチンとして提案されている。
本研究では、スピンレスフェルミオンと周期的に駆動されるトンネルの相互作用する1次元傾斜格子でHSFをチューニングする手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:25:08 GMT)
On Differentially Private Subspace Estimation in a Distribution-Free Setting [3.9] 入力データセットにおける乗法的特異値ギャップの関数として「容易性」を定量化する最初の尺度を提供する。
特に、この結果は、部分空間を推定するのに十分かつ必要となる、最初のタイプのギャップを決定する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:05:43 GMT)
Fault-Tolerant Spectrum Usage Consensus for Low-Earth-Orbit Satellite Constellations [3.8] 本稿では,複数の演算子による可視性を考慮したスペクトル共有を容易にするためのコンセンサス機構を提案する。
分散台帳は、スペクトル使用に関するコンセンサス状態のセキュアな記録と追跡に使用される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:46:10 GMT)
ReLU's Revival: On the Entropic Overload in Normalization-Free Large Language Models [3.8] LayerNormは、現代の大規模言語モデル(LLM)において重要なコンポーネントである。
本研究は、正規化自由デコーダのみのLLMにおける望ましいアクティベーション関数について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:16:30 GMT)
ReLU's Revival: On the Entropic Overload in Normalization-Free Large Language Models [3.8] LayerNormは、現代の大規模言語モデル(LLM)において重要なコンポーネントである。
本研究は、正規化自由デコーダのみのLLMにおける望ましいアクティベーション関数について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:16:30 GMT)
One Stone, Four Birds: A Comprehensive Solution for QA System Using Supervised Contrastive Learning [3.7] 本稿では,教師付きコントラスト学習(SCL)による質問応答システム(QA)の堅牢性と効率を高めるための,新しい総合的ソリューションを提案する。
ユーザ入力意図分類、ドメイン外入力検出、新しい意図発見、継続学習の4つの重要なタスクを定義した。
下流タスクに最小限のチューニングを加えることで、モデル効率を大幅に改善し、すべてのタスクにまたがる新しい最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:10:08 GMT)
Multi-Class Abnormality Classification Task in Video Capsule Endoscopy [3.7] ビデオカプセル内視鏡(VCE)における多クラス異常分類の課題に,様々なディープラーニングモデルを用いて対処する。
本研究の目的は,さまざまな消化管疾患を正しく分類することであり,臨床現場での診断効率の向上に重要である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:22:52 GMT)
Data-Driven Filter Design in FBP: Transforming CT Reconstruction with Trainable Fourier Series [3.7] 本稿では,FBPフレームワーク内にCT再構成のためのトレーニング可能なフィルタを導入する。
この方法は、フーリエ級数係数を最適化してフィルタを構成することにより、ノイズ低減の限界を克服する。
本フィルタは既存のCT再構成モデルに容易に組み込めるので,幅広い応用に適応できるツールである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:18:00 GMT)
Deep Learning and NLP in Cryptocurrency Forecasting: Integrating Financial, Blockchain, and Social Media Data [3.6] 本稿では,機械学習(ML)と自然言語処理(NLP)技術を活用した暗号通貨価格予測の新しい手法を提案する。
ニュースやソーシャルメディアのコンテンツを分析することで、仮想通貨市場に対する大衆の感情の影響を評価する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:48:22 GMT)
CLAP. I. Resolving miscalibration for deep learning-based galaxy photometric redshift estimation [3.6] 我々は、光赤方偏移(CLAP)のためのContrastive Learning and Adaptive KNNと呼ばれる新しい手法を開発した。
教師付きコントラスト学習(SCL)とk-アネレスト近隣(KNN)を利用して、生の確率密度推定を構築し、校正する。
ハーモニック平均は、精度を向上させるために複数の実現からの推定値のアンサンブルを組み合わせるために用いられる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:46:55 GMT)
Resolving Domain Shift For Representations Of Speech In Non-Invasive Brain Recordings [3.5] 脳磁図(MEG)を用いた非侵襲的データ収集に焦点を当てた。
私たちの知る限りでは、この研究はMEGニューロイメージングデータに基づく機能レベルの深層学習の初めての応用である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:56:23 GMT)
High Resolution Seismic Waveform Generation using Denoising Diffusion [3.5] 本研究では, 高周波波形生成のための新しい, 効率的, スケーラブルな生成モデルを提案する。
地震波形データのスペクトログラム表現を、オートエンコーダを介して低次元のサブ多様体に還元する。
最先端拡散モデルを用いて、キー入力パラメータを条件に、この潜伏表現を生成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:01:48 GMT)
Selective Test-Time Adaptation for Unsupervised Anomaly Detection using Neural Implicit Representations [3.4] 未確認領域からの任意のテスト画像に対して,ゼロショット方式でエフェクト選択的に適応するための,エフェクト選択テストタイム適応という新しい概念を導入する。
このアプローチでは、モデルに依存しない軽量な多層パーセプトロンをニューラルネットワークの暗黙表現に適用し、ソース学習モデルを変更することなく、任意の再構成ベースの異常検出方法からの出力の適応を可能にする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:23:55 GMT)
Selective Test-Time Adaptation for Unsupervised Anomaly Detection using Neural Implicit Representations [3.4] テスト時間適応は、目に見えないドメインに対するディープラーニングモデルを最適化するための有望なアプローチを提供する。
本稿では, 事前学習した深部特徴の特徴を生かした, 選択的テスト時間適応の概念を提案する。
我々の戦略は、複数の条件と異なる目標分布に対する検出精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:23:55 GMT)
Deep Learning for Classification of Inflammatory Bowel Disease Activity in Whole Slide Images of Colonic Histopathology [3.3] ヘマトキシリンおよびエオシン含有スライド画像中の活性度を分類する深層学習モデルを開発した。
2018年と2019年にダートマス・ヒッチコック医療センターで治療を受けた636例のうち,2,077例のWSIを使用した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:00:31 GMT)
Prediction of Final Phosphorus Content of Steel in a Scrap-Based Electric Arc Furnace Using Artificial Neural Networks [3.3] スクラップをベースとした電気アーク炉プロセスは、将来的には鉄鋼市場のかなりのシェアを獲得することが期待されている。
しかし、不純物、特にリンの管理は依然として課題である。
本研究の目的は, 入力パラメータに基づいて, プロセス終了時のスチールリン含有量を推定する機械学習モデルを開発することである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:37:44 GMT)
Shared Control with Black Box Agents using Oracle Queries [3.2] 共有制御問題を、協調エージェントに直接問い合わせる機能を含むように拡張する。
クエリに対する2つの潜在的な応答、すなわちオラクルと有界知識について検討する。
これらはシステム全体の学習コストを削減することを目的としている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:04:37 GMT)
Enhancing Battery Storage Energy Arbitrage with Deep Reinforcement Learning and Time-Series Forecasting [3.0] カナダ・アルバータ州の価格データを用いたケーススタディを行い、不規則な価格スパイクと極めて非定常な価格変動を特徴とする。
このデータは、最先端のディープラーニングモデルがデプロイされたとしても予測することは難しい。
以上の結果から, DRLによる電池制御によるエネルギー仲裁は, これらの不完全な予測の恩恵を被ることがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:18:43 GMT)
Spatioformer: A Geo-encoded Transformer for Large-Scale Plant Species Richness Prediction [3.0] 本研究では,位置情報エンコーダを変換器モデルと結合して位置情報コンテキストをリモートセンシング画像に符号化するSpatioformerを提案する。
以上の結果から,大規模な空間スケールでの衛星観測から種多様性を予測する上で,位置情報が有利であることが示唆された。
本研究で得られた豊かさマップは, オーストラリアにおける植物種の豊かさの時間的動態を明らかにし, 植物多様性保全のための効果的な計画と政策開発を示唆する証拠を提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:21:01 GMT)
The Endoscapes Dataset for Surgical Scene Segmentation, Object Detection, and Critical View of Safety Assessment: Official Splits and Benchmark [3.0] 本報告では,CVS(Critical View of Safety)の自動評価を目的とした内視鏡的胆嚢摘出術(LC)ビデオのデータセットであるEndoscapesの概要について概説する。
内臓は201本のLCビデオからなり、フレームはわずかだが定期的にセグメンテーションマスク、バウンディングボックス、そして3つの異なる臨床専門家によるCVSアセスメントを備える。
また、CVS 1933にアノテートされた11090フレームと、201ビデオのツールと解剖学的バウンディングボックスでアノテートされたフレームと、ツールと解剖学的セグメンテーションマスクでアノテートされた201ビデオの50から追加の422フレームがある。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:28:43 GMT)
Distributionally robust self-supervised learning for tabular data [2.9] エラースライスの存在下での堅牢な表現の学習は、高い濃度特徴とエラーセットの構築の複雑さのために困難である。
従来の堅牢な表現学習手法は、コンピュータビジョンにおける教師付き設定における最悪のグループパフォーマンスの改善に主に焦点をあてている。
提案手法は,Masked Language Modeling (MLM) の損失を学習したエンコーダ・デコーダモデルを用いて,頑健な潜在表現を学習する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:45:34 GMT)
Distributionally robust self-supervised learning for tabular data [2.9] エラースライスの存在下での堅牢な表現の学習は、高い濃度特徴とエラーセットの構築の複雑さのために困難である。
従来の堅牢な表現学習手法は、コンピュータビジョンにおける教師付き設定における最悪のグループパフォーマンスの改善に主に焦点をあてている。
提案手法は,Masked Language Modeling (MLM) の損失を学習したエンコーダ・デコーダモデルを用いて,頑健な潜在表現を学習する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:45:34 GMT)
Provable optimal transport with transformers: The essence of depth and prompt engineering [2.9] 固定パラメータを持つ変圧器は任意の点数のエントロピー正則化でワッサーシュタイン2の最適輸送問題を効果的に解くことができることを示す。
提案手法は, 変圧器が双対最適輸送に適応的な段差で勾配降下を実現できるように設計したプロンプトに頼っている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:07:29 GMT)
Atomic clock locking with Bayesian quantum parameter estimation: scheme and experiment [2.8] 原子時計は科学と技術にとって不可欠であるが、その感度は標準量子限界によって制限されることが多い。
我々はハイゼンベルクスケーリングにアプローチした適応ベイズ量子周波数推定プロトコルを設計する。
我々はコールド原子CPTクロックのロバストで高精度なクローズドループロックを実現する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:16:32 GMT)
Software Frugality in an Accelerating World: the Case of Continuous Integration [2.7] 私たちは、GitHubで実装された継続的インテグレーションパイプラインのエネルギーフットプリントを、初めて大規模に分析します。
パイプラインの平均単位エネルギーコストは10Whで比較的低い。
地域Wh-to-CO2推定値に基づくCO2排出量の評価では, 平均CO2排出量は10.5kgである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:11:37 GMT)
Efficient charging of multiple open quantum batteries through dissipation and pumping [2.7] このプロトコルは、充電器とバッテリの集合結合を介して、同じ蓄熱器に超過大な充電を示す。
充電器に散逸と無コヒーレントな集団ポンピングの両方を組み込むことによって、多くの量子電池を効率よく並列充電できることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:43:26 GMT)
FISHNET: Financial Intelligence from Sub-querying, Harmonizing, Neural-Conditioning, Expert Swarms, and Task Planning [2.6] FISHNETはエージェントアーキテクチャであり、98,000件以上の規制申請に対して非常に複雑な分析処理を行う。
FISHNETは、金融インサイト生成において顕著なパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:53:47 GMT)
How high dimensional neural dynamics are confined in phase space [2.6] 高次元力学は脳機能、生態システム、機械学習において重要な役割を果たす。
これらのダイナミクスが相空間にどのように閉じ込められているかはいまだに解決が難しい。
ここでは,2つの鋭い境界と平らな低密度領域を挟んで,ニューラルダイナミクスが多様性を示すとき,閉じ込め領域がM字型であることを解析的に議論する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:12:56 GMT)
VIEWER: an extensible visual analytics framework for enhancing mental healthcare [2.5] VIEWERはオープンソースのツールキットで、分散自然言語処理とインタラクティブな可視化技術を利用している。
VIEWERは、医療提供のさまざまな側面におけるデータアクセシビリティと表現を改善するために開発された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:01:13 GMT)
SAD: State-Action Distillation for In-Context Reinforcement Learning under Random Policies [2.5] State-Action Distillation (SAD) は、ランダムなポリシーのみによってガイドされる顕著な事前学習データセットを生成する。
SADはオフライン評価では180.86%、オンライン評価では172.8%で最高のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 21:46:25 GMT)
Deep learning-based identification of patients at increased risk of cancer using routine laboratory markers [2.5] がんスクリーニングは、スクリーニング方法と頻度を決定するために、最初のリスク階層化ステップを含む。
ほとんどのスクリーニングプログラムでは、年齢や家族歴などの臨床リスク要因は、最初のリスク階層化アルゴリズムの一部である。
本研究は, 大腸癌, 肝癌, 肺癌のリスクのある患者を鑑別するために, 血液計数や完全代謝パネルなどの簡便な血液検査を併用できることを実証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:50:27 GMT)
Identifying non-Hermitian critical points with quantum metric [2.5] 量子状態の幾何学的性質は、量子幾何学テンソルによって符号化される。
従来のエルミート量子系では、量子メートル法は忠実度感受性に対応する。
我々はこの知恵を非エルミート系に拡張し、非エルミート臨界点を明らかにする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:42:30 GMT)
Applying sparse autoencoders to unlearn knowledge in language models [2.4] 本研究では,スパースオートエンコーダ(SAE)を用いて言語モデルから知識を除去する方法について検討する。
本研究は, 生物学関連SAEの個々の特徴が, 副作用を最小限に抑えることで, 生物学関連知識を未学習に活用できることを実証する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:21:14 GMT)
Semi-supervised Chinese Poem-to-Painting Generation via Cycle-consistent Adversarial Networks [2.3] 本稿では,周期整合型対数ネットワークを用いた半教師付き手法を提案する。
生成した詩や絵画の品質,多様性,一貫性を評価するために,新しい評価指標を導入する。
提案手法は従来の手法よりも優れており,芸術表現の象徴的本質をとらえる可能性を示唆している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:57:44 GMT)
Enhanced Anomaly Detection in Industrial Control Systems aided by Machine Learning [2.2] 本研究は,ICS環境におけるネットワークデータとプロセスデータの組み合わせによる攻撃検出の改善について検討する。
この結果から,ネットワークトラフィックと運用プロセスデータの統合により,検出能力が向上することが示唆された。
結果は有望だが、彼らは予備的であり、さらなる研究の必要性を強調している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:41:33 GMT)
Can GPT Improve the State of Prior Authorization via Guideline Based Automated Question Answering? [2.1] 我々は、GPTが多くの重要な要因を検証できるかどうかを評価し、その結果、健康計画が決定を極めて早く下すのを助ける。
我々は,従来のプロンプト技術を試行するとともに,新しいプロンプト技術を導入する。
その結果,本手法はF1平均スコアが0.61であるのに対して,標準スコアに比べて優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:19:18 GMT)
Learned Reference-based Diffusion Sampling for multi-modal distributions [2.1] 本稿では,学習参照に基づく拡散サンプリング(LRDS)について紹介する。
LRDSは、高密度空間領域にあるサンプルの参照拡散モデルを学ぶことによって、2段階で進行する。
LRDSは、様々な難解な分布上の競合するアルゴリズムと比較して、目標分布に関する事前知識を最大限に活用することが実験的に実証された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:23:34 GMT)
An Optimal Tightness Bound for the Simulation Lemma [2.1] 定数要素を含む厳密なモデル不特定性に対する値予測誤差の有界性を示す。
これは、強化学習の基本的な結果である「シミュレーション補題」の直接的な改善である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:39:04 GMT)
Accelerating AI Performance using Anderson Extrapolation on GPUs [2.1] Anderson外挿を利用したAI性能向上のための新しい手法を提案する。
混合ペナルティが生じるクロスオーバー点を特定することにより、反復を収束に還元することに焦点を当てる。
高速コンピューティングの領域におけるスケーラビリティと効率性の拡張を動機とした,トレーニングと推論の両面での大幅な改善を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:45:17 GMT)
Towards Understanding the Link Between Modularity and Performance in Neural Networks for Reinforcement Learning [2.0] 最適性能のためのネットワークモジュラリティの量は、ネットワークの他の多くの特徴と問題環境の間の複雑な関係に絡み合っている可能性が高い。
我々は、ニューラルネットワークアーキテクチャのリッチで自動最適化と探索を可能にする古典的な神経進化アルゴリズムを使用した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:37:46 GMT)
XEdgeAI: A Human-centered Industrial Inspection Framework with Data-centric Explainable Edge AI Approach [2.0] 本稿では,新しいXAI統合視覚品質検査フレームワークを提案する。
我々のフレームワークはXAIとLarge Vision Language Modelを組み込んで人間中心の解釈可能性を提供する。
このアプローチは、重要な産業アプリケーションに信頼性と解釈可能なAIツールを広く採用する道を開くものだ。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:34:18 GMT)
Detection of Human and Machine-Authored Fake News in Urdu [2.0] ソーシャルメディアは偽ニュースの拡散を増幅した。
従来の偽ニュース検出手法は、言語的手がかりに依存しているため、効果が低くなる。
精度とロバスト性を改善するため,階層的検出手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:42:07 GMT)
Genetic Motifs as a Blueprint for Mismatch-Tolerant Neuromorphic Computing [1.8] SNNの混合信号実装はエッジコンピューティングアプリケーションに有望なソリューションを提供する。
これらのニューロモルフィックプロセッサのアナログ回路におけるデバイスミスマッチは、堅牢な処理の展開に重大な課題をもたらす。
この問題に対処するために,生物開発に触発された新しいアーキテクチャソリューションを導入する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:04:50 GMT)
ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems [1.8] Retrieval-Augmented Generation (RAG) システムは、無関係またはゆるい関連情報の検索によって不正確な応答を生成する。
チャンクレベルで取得した情報を評価・フィルタリングすることでRAGシステムを強化するフレームワークであるChunkRAGを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:07:53 GMT)
Detection of Emerging Infectious Diseases in Lung CT based on Spatial Anomaly Patterns [1.8] 局所的な異常は関連しているが、しばしば新しい病気は、新しい空間分布に慣れ親しんだ病気パターンを伴っている。
本稿では,病変の空間分布の異なるパターンを示す新しい疾患表現型の出現を検出するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:02:46 GMT)
Quantum Simulation of Spin-Boson Models with Structured Bath [1.7] トラップされたイオンは、オープン量子系の量子力学をシミュレートするための自然なプラットフォームを提供する。
完全プログラム可能な制御パラメータにランダム性を加えることにより,浴槽温度と連続スペクトル密度を調整する能力を示す。
実験結果は理論的な予測と密接に一致し、トラップイオン系を用いたオープン量子系のシミュレーションが成功したことを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:07:58 GMT)
A Photonic Crystal Receiver for Rydberg Atom-Based Sensing [1.6] ライドバーグ原子をベースとしたセンサーは、レーザーにdressした原子を用いて電波電磁場を検出し測定する。
最も優れた無線周波数センサは、感度に関して、いまだにライドバーグ原子ベースのセンサーを上回っている。
我々は、Rydberg原子をベースとしたセンサ蒸気セルに統合された受動全誘電増幅器を導入する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:37:19 GMT)
Causal Inference for Genomic Data with Multiple Heterogeneous Outcomes [1.6] 複数の導出結果を持つ2つのロバストな推定のための一般的な半パラメトリックフレームワークを提案する。
分析を標準化された平均処理効果と量子処理効果に専門化する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:55:21 GMT)
A Transformer Based Generative Chemical Language AI Model for Structural Elucidation of Organic Compounds [1.6] 本稿では,概念変換器を用いた生成化学言語人工知能(AI)モデルを提案する。
我々のモデルはエンコーダ・デコーダアーキテクチャと自己保持機構を用いて、最も可能性の高い化学構造を直接生成する。
現代のCPUでは、29個の原子を持つ分子をわずか数秒で構造解明し、83%の精度でトップ15を達成している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:01:00 GMT)
Enhancing Exchange Rate Forecasting with Explainable Deep Learning Models [1.5] 伝統的な予測モデルは、交換レートデータの本質的な複雑さと非線形性に対処する際にしばしば混乱する。
本研究では,RSM/USD交換率の予測精度を高めるため,LSTM,CNN,トランスフォーマーベースアーキテクチャなどの高度なディープラーニングモデルの適用について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:29:54 GMT)
Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations [1.5] 消化管の異常は患者の健康に大きく影響を与え、タイムリーな診断が必要である。
この研究は、ビデオフレームから消化管の異常を分類するために設計された新しいモデルの開発と評価のプロセスを示す。
Omni次元のGated Attention(OGA)機構とWavelet変換技術をモデルアーキテクチャに統合することで、モデルは最も重要な領域に集中することができた。
このモデルの性能は、VGG16とResNet50の2つのベースモデルに対してベンチマークされ、胃腸の異常範囲を正確に識別し分類する能力の強化が示されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:01:35 GMT)
MC-QDSNN: Quantized Deep evolutionary SNN with Multi-Dendritic Compartment Neurons for Stress Detection using Physiological Signals [1.5] 本研究では,時系列データの効率的な処理の代替手段として,MCLeaky(Multi-Compartment Leaky)ニューロンを提案する。
提案したMCLeakyニューロンに基づくスパイキングニューラルネットワークモデルとその量子化モデルは、最先端(SOTA)スパイキングLSTMに対してベンチマークされた。
その結果、MCLeaky活性化ニューロンを持つネットワークは、98.8%の精度でストレスを検出することができた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:25:00 GMT)
MC-QDSNN: Quantized Deep evolutionary SNN with Multi-Dendritic Compartment Neurons for Stress Detection using Physiological Signals [1.5] 本研究では,時系列データの効率的な処理の代替手段として,MCLeaky(Multi-Compartment Leaky)ニューロンを提案する。
提案したMCLeakyニューロンに基づくスパイキングニューラルネットワークモデルとその量子化モデルは、最先端(SOTA)スパイキングLSTMに対してベンチマークされた。
その結果、MCLeaky活性化ニューロンを持つネットワークは、98.8%の精度でストレスを検出することができた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:25:00 GMT)
MC-QDSNN: Quantized Deep evolutionary SNN with Multi-Dendritic Compartment Neurons for Stress Detection using Physiological Signals [1.5] 本研究では,時系列データの効率的な処理の代替手段として,MCLeaky(Multi-Compartment Leaky)ニューロンを提案する。
提案したMCLeakyニューロンに基づくスパイキングニューラルネットワークモデルとその量子化モデルは、最先端(SOTA)スパイキングLSTMに対してベンチマークされた。
その結果、MCLeaky活性化ニューロンを持つネットワークは、98.8%の精度でストレスを検出することができた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:25:00 GMT)
Arabic Music Classification and Generation using Deep Learning [1.5] 本稿では,古典・新エジプト音楽の作曲家による分類と類似音楽の生成のための機械学習手法を提案する。
提案システムは,畳み込みニューラルネットワーク(CNN)を分類に用い,CNNオートエンコーダを生成に用いた。
81.4%の精度で作曲者による楽曲の分類を行い,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:47:08 GMT)
Towards Automated Penetration Testing: Introducing LLM Benchmark, Analysis, and Improvements [1.4] 大規模言語モデル(LLM)は、サイバーセキュリティなど、さまざまな分野に可能性を示している。
現在、包括的で、オープンで、エンドツーエンドの自動浸透テストベンチマークはありません。
本稿では,LLMを用いた自動貫入試験のための新しいオープンベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:58:37 GMT)
VARS: Vision-based Assessment of Risk in Security Systems [1.4] 本研究では、さまざまな機械学習モデルとディープラーニングモデルの比較分析を行い、100ビデオのカスタムデータセットで危険度を予測する。
危険度は3つのカテゴリに分類される: 警告なし (7未満) と高い警告なし (7以上) である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:47:13 GMT)
Harnessing Room-Temperature Ferroelectricity in Metal Oxide Monolayers for Advanced Logic Devices [1.2] 二次元強誘電体材料は、電力効率の高いメモリデバイスやトランジスタ用途に有用である。
我々は, 自発分極が顕著な金属酸化物単分子膜の新しいファミリーにおける面外強誘電率を予測した。
我々の研究は、先進的で高性能なメモリおよびロジックデバイスを開発するためのMO単層層のさらなる探索を動機付けている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:21:56 GMT)
Statistical Inference in Classification of High-dimensional Gaussian Mixture [1.2] 高次元極限における正規化凸分類器の一般クラスの挙動について検討する。
我々の焦点は、推定器の一般化誤差と変数選択性である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:58:36 GMT)
A constrained optimization approach to improve robustness of neural networks [1.2] クリーンなデータに対する精度を維持しつつ、敵攻撃に対する堅牢性を向上させるために、ファインチューン事前学習ニューラルネットワークに対する非線形プログラミングに基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:01:18 GMT)
A constrained optimization approach to improve robustness of neural networks [1.2] クリーンなデータに対する精度を維持しつつ、敵攻撃に対する堅牢性を向上させるために、ファインチューン事前学習ニューラルネットワークに対する非線形プログラミングに基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:01:18 GMT)
Unified Causality Analysis Based on the Degrees of Freedom [1.2] 本稿では,システム間の因果関係を同定する統一手法を提案する。
システムの自由度を分析することで、私たちのアプローチは因果的影響と隠れた共同設立者の両方についてより包括的な理解を提供する。
この統合されたフレームワークは、理論モデルとシミュレーションを通じて検証され、その堅牢性とより広範な応用の可能性を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:57:35 GMT)
Developing a Tutoring Dialog Dataset to Optimize LLMs for Educational Use [1.2] 大規模言語モデル(LLM)は、スケーラブルな教育アプリケーションへの期待を示している。
本研究は,読解問題における1対1の指導に,より小型で手頃なLPMを用いることを検討した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:40:21 GMT)
From human-centered to social-centered artificial intelligence: Assessing ChatGPT's impact through disruptive events [1.2] 機械学習研究コミュニティにおけるChatGPTの影響に対する批判は、そのパフォーマンスや、バイアス、毒性、"ハロシン化"に関連する従来の安全性評価に結びついている、と我々は主張する。
社会中心のフレームワークを通じてChatGPTの社会的影響を分析することで、AI開発における個人主義的アプローチに挑戦し、AIシステムの倫理的かつ責任ある展開に関する継続的な議論に貢献する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 04:18:30 GMT)
Parametric model reduction of mean-field and stochastic systems via higher-order action matching [1.2] 我々は、勾配と平均場効果を特徴とする物理系の人口動態のモデルを学ぶ。
提案手法は,幅広いパラメータの集団動態を正確に予測し,最先端拡散モデルおよびフローベースモデルより優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:05:14 GMT)
Disentangling Genotype and Environment Specific Latent Features for Improved Trait Prediction using a Compositional Autoencoder [1.1] 本研究では,植物育種および遺伝学プログラムにおける形質予測を改善するための合成オートエンコーダフレームワークを提案する。
潜伏する特徴を遠ざけることで、CAEは精密な育種と遺伝的研究のための強力なツールを提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:30:27 GMT)
On the Application of Deep Learning for Precise Indoor Positioning in 6G [1.1] Indoor Factory(InF)シナリオにおける精度向上のためのAI/ML技術の利用について検討する。
LocNetと呼ばれる提案されたニューラルネットワークは、複数の送信受信点(TRP)からのチャネルインパルス応答(CIR)と参照信号受信電力(RSRP)の測定に基づいて訓練されている。
シミュレーションの結果、LocNetは18個のTRPの測定値を用いて9cmの位置決め精度を90分の1で達成している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:55:21 GMT)
Computing the Bias of Constant-step Stochastic Approximation with Markovian Noise [1.1] マルコフ雑音と定数ステップサイズ$alpha$の近似アルゴリズムについて検討する。
時間平均バイアスが$alpha V + O(alpha2)$に等しいことを示し、ここでは$V$はリアプノフ方程式によって特徴づけられる定数である。
また、$bartheta_n$ は $theta*+alpha V$ 付近で高い確率で収束することを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:25:02 GMT)
Enhancing Resilience and Scalability in Travel Booking Systems: A Microservices Approach to Fault Tolerance, Load Balancing, and Service Discovery [1.0] 本稿では,スケーラブルで信頼性の高い航空会社予約システムの開発におけるモノリシックアーキテクチャの導入について検討する。
従来の予約システムは非常に厳格で集中的であり、ボトルネックや単一障害点の傾向があります。
マイクロサービスは、サービスが互いに依存せず、独立してデプロイできるため、レジリエンスとスケーラビリティが向上します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:19:42 GMT)
Cavity-Magnon-Polariton spectroscopy of strongly hybridized electro-nuclear spin excitations in LiHoF4 [1.0] まず、入出力形式と線形応答理論を組み込んで、キャビティ-マグノン-ポラリトン結合を分光ツールとして利用する形式論を示す。
強いハイブリッド化キャビティ-マグノン-ポラリトン系における一般化された感受性と散乱パラメータ |S11| の微視的関係が導出された。
この手法は、LiHoF4の量子相転移のさらなる研究だけでなく、幅広い複雑な磁気システムにも新たな道を開く可能性がある。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:27:09 GMT)
Comparative study of quantum methods in the resolution of track findings instances [1.0] トラック探索は、粒子物理学で最初に導入された複雑な最適化問題である。
本稿では,その影響と有効性の両方を評価するために,様々なモデリング手法について検討する。
本稿では,CPLEXと実D-Wave量子コンピュータで動作する2つの量子モデル,D-Waveシミュレータ上の1つの量子モデルについて述べる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:58:46 GMT)
Dimension reduction via score ratio matching [0.9] スコアマッチングから派生したフレームワークを提案し、勾配を利用できない問題に勾配に基づく次元の減少を拡大する。
提案手法は,低次元構造を有する問題に対して,標準的なスコアマッチングよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:21:03 GMT)
Phonon-induced contrast in a matter-wave interferometer [0.8] 本研究では,内部自由度の問題,特にフォノン変動とコントラスト低減について検討する。
本研究は, フォノン占有レベルにおけるスピン磁場および反磁性相互作用によるコントラスト低減について検討する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:13:12 GMT)
Pushing the Boundaries: Interferometric Mass Photometry at the Quantum Limit of Sensitivity [0.8] 従来の共焦点干渉散乱(iSCAT)法と比較して、我々はミッチェルソン干渉計を形成するために第2のアームを付加する。
我々は、単一モードコヒーレント状態、多周波コヒーレント状態、位相平均コヒーレント状態を含む異なる量子状態に対する量子クラム・ラオ境界(QCRB)を評価する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:21:01 GMT)
Advanced deep-reinforcement-learning methods for flow control: group-invariant and positional-encoding networks improve learning speed and quality [0.7] 本研究は,流路制御のための深部強化学習法(DRL)の進歩である。
グループ不変ネットワークと位置エンコーディングをDRLアーキテクチャに統合することに注力する。
提案手法はRayleigh-B'enard対流のケーススタディを用いて検証した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:27:40 GMT)
A Practical Approach to Combinatorial Test Design [0.7] Combinatorial Test Design (CTD)は、テストスペースの削減と高品質で効率的なテストを提供するために使用できる。
本書ではCTDテスト設計手法とCTDモデリングについて詳述する。
また、テストを直接集中するためのカバレッジ要件を最も適切に定義する方法も説明します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:43:50 GMT)
How Critical is Site-Specific RAN Optimization? 5G Open-RAN Uplink Air Interface Performance Test and Optimization from Macro-Cell CIR Data [0.7] 我々は,特定の地点からのチャネル計測データの重要性と,その空気界面の最適化と試験への影響を考察する。
我々は, NR PUSCHアップリンクシミュレーションにOmniPHY-5Gニューラルレシーバを利用する。
提案手法は、事前学習と比較して1.85dBの低信号-雑音比(SNR)で10%のブロック誤り率(BLER)を達成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:57:48 GMT)
A Multimodal Approach For Endoscopic VCE Image Classification Using BiomedCLIP-PubMedBERT [0.6] 本稿では,マルチモーダルモデルであるBiomedCLIP PubMedBERTの微細調整によるビデオカプセル内視鏡フレームの異常の分類について述べる。
本手法では, 血管拡張症, 出血, エロージョン, エリテマ, 異物, リンパ管拡張症, ポリープ, 潰瘍, ワーム, 正常の10種類の画像に分類する。
分類、精度、リコール、F1スコアなどのパフォーマンス指標は、内視鏡フレームの異常を正確に識別する強力な能力を示している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:42:57 GMT)
Floralens: a Deep Learning Model for the Portuguese Native Flora [0.6] 本稿では,ポルトガル原生植物群を対象とした,公開可能な研究グレードデータセットに基づくデータセットの構築について述べる。
既成の深層畳み込みニューラルネットワークを用いて高精度モデルを導出する。
最も優れたモデルであるFloralensは、Project Biolensの公開ウェブサイトに統合されました。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:00:15 GMT)
Coherent and incoherent light scattering by single-atom wavepackets [0.5] 自由空間における単一原子の光散乱について検討し、原子-光子絡み合いと両方向情報の観点から結果について議論する。
光格子から放出される超低温原子を用いて、ハイゼンベルクの不確かさに制限された波束から散乱する単一光子を干渉するゲダンケン実験を実現する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:24:54 GMT)
The product structure of MPS-under-permutations [0.5] この性質を持つ変換不変(TI)行列積状態(MPS)は自明であることを示す。
この結果は非TIジェネリックMPSにも当てはまり、W状態やディック状態を含むMPSのより関連する例にも近似的に適用できる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:13:23 GMT)
Designing LLM-Agents with Personalities: A Psychometric Approach [0.5] 本研究は, 定量的, 制御可能, 心理的に検証された個人性をエージェントに割り当てる新しい手法を提案する。
人体研究の制約を克服し、エージェントを社会科学調査のためのアクセス可能なツールとして提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 01:05:04 GMT)
OReole-FM: successes and challenges toward billion-parameter foundation models for high-resolution satellite imagery [0.4] 数十億のパラメータにモデルをスケールすることは、創発的能力を含む前例のない利益をもたらすことが示されている。
我々は、Frontierスーパーコンピュータ、アメリカ初のエクサスケールシステム、および10億スケールのFMを事前トレーニングするために高解像度の光学RSデータを含む高性能コンピューティングリソースをペアリングする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:55:12 GMT)
ProvocationProbe: Instigating Hate Speech Dataset from Twitter [0.4] textitProvocationProbeは、ヘイトスピーチを一般的なヘイトスピーチと区別するためのデータセットである。
本研究では、Twitterから約2万件のツイートを収集し、全世界で9件の論争を巻き起こした。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:57:59 GMT)
Encrypted Dynamic Control exploiting Limited Number of Multiplications and a Method using RLWE-based Cryptosystem [0.4] 本稿では,ほとんどの同型暗号方式で実装可能な動的コントローラを暗号化する手法を提案する。
結果として、暗号化されたコントローラは、暗号化されたデータごとに、限られた数の同型乗算しか必要としない。
本稿では,Ring Learning With Errors(RLWE)ベースの暗号システムにおいて,メッセージのベクトルを1つの暗号文に暗号化する手法のカスタマイズを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:55:01 GMT)
Runtime Reduction in Linear Quantum Charge-Coupled Devices using the Parity Flow Formalism [0.3] 2ビット演算の総数を増やすことなく、線形ハードウェアアーキテクチャにおいて物理SWAPゲートを除去できることを示す。
これは線形量子電荷結合デバイスにおける量子回路の実行時間に大きな影響を与える。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:44:45 GMT)
SHAP zero Explains All-order Feature Interactions in Black-box Genomic Models with Near-zero Query Cost [0.3] SHAP 0は,全順序Shapley特徴量間相互作用を,クエリ毎にほぼゼロコストで推定するアルゴリズムである。
SHAP 0は、最先端のアルゴリズムと比較して、償却計算コストの桁違いの削減を実現していることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:58:31 GMT)
A 300 mm foundry silicon spin qubit unit cell exceeding 99% fidelity in all operations [0.2] 先進的な300mmウエハスケールの金属-酸化物-半導体ファクトリー(CMOS)ファクトリーにおける量子プロセッサの製作は、商業的に実現可能な量子コンピューティングへのユニークなスケーリング経路を提供する。
そこで本研究では,300mm半導体プロセスラインで作製したシリコン2量子デバイスの正確な量子ビット演算について述べる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:11:14 GMT)
Impact of Leakage on Data Harmonization in Machine Learning Pipelines in Class Imbalance Across Sites [0.2] 我々は,クラスバランスがサイト間で等しくないシナリオにおいて,ComBatベースのデータ調和手法の有効性について検討した。
ターゲットラベルを装いながらデータを調和させる新しいアプローチであるPrettYharmonizeを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:49:04 GMT)
Late Breaking Results: Fast System Technology Co-Optimization Framework for Emerging Technology Based on Graph Neural Networks [0.2] 本稿では,次世代IC設計のための高速システム技術協調最適化(STCO)フレームワークを提案する。
我々は、TCADシミュレーションとセルライブラリー評価の両方にグラフニューラルネットワーク(GNN)ベースのアプローチを用いることで、AI技術を用いたSTCOの技術レベルの向上に重点を置いている。
これらの進歩は1.9Xから14.1Xまでのランタイムスピードアップを伴う包括的なSTCOイテレーションを可能にし、新興技術と従来の技術の両方をサポートする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:42:05 GMT)
Halving the Cost of Quantum Algorithms with Randomization [0.1] 量子信号処理(QSP)は、線形演算子の変換を実装するための体系的なフレームワークを提供する。
近年の研究では、量子チャネルへのユニタリゲートを促進する技術であるランダム化コンパイルが開発されている。
提案アルゴリズムは, 平均進化が対象関数に収束するように戦略的に選択されたランダム化の確率的混合を実装し, 誤差は等価個体よりも2次的に小さい。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:41:21 GMT)
Microplastic Identification Using AI-Driven Image Segmentation and GAN-Generated Ecological Context [0.1] 試料中のマイクロプラスチックの同定法は費用がかかり、専門家による分析が必要である。
顕微鏡画像中のマイクロプラスチックを自動的に識別する深層学習セグメンテーションモデルを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:57:09 GMT)
iCost: A Novel Instance Complexity Based Cost-Sensitive Learning Framework for Imbalanced Classification [0.0] データにおけるクラス不均衡は、分類タスクにとって重要な課題である。
伝統的な分類アルゴリズムは多数派に偏っている。
本研究では, 複雑性に基づく新たなコスト感性アプローチを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:29:44 GMT)
iCost: A Novel Instance Complexity Based Cost-Sensitive Learning Framework [0.0] データにおけるクラス不均衡は、分類タスクにとって重要な課題である。
伝統的な分類アルゴリズムは多数派に偏っている。
本研究では, 複雑性に基づく新たなコスト感性アプローチ(「iCost」と呼ぶ)を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:29:44 GMT)
cymyc -- Calabi-Yau Metrics, Yukawas, and Curvature [0.0] textttcymycには、このアンサッツを組み込んだ機械学習コンポーネントが含まれており、これらの空間におけるテンソル場をモデル化している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:55:01 GMT)
Water and Electricity Consumption Forecasting at an Educational Institution using Machine Learning models with Metaheuristic Optimization [0.0] 本研究では、ランダムフォレスト(RF)とサポートベクトル回帰(SVR)の2つの機械学習モデルの比較を提案する。
データは過去5年間、連邦パラナ・カンプスパルマス研究所で収集された。
その結果,12ステップの地平線上での水と電力消費を予測する場合,ランダムフォレストモデルが最も優れた性能を示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:30:12 GMT)
Vacuum polarization in a one-dimensional effective quantum-electrodynamics model [0.0] デルタポテンシャル相互作用を持つ水素様原子の一次元有効QEDモデルについて検討した。
このモデルはクーロン相互作用を持つ3次元実効QED理論に似ており、かなり単純である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:34:36 GMT)
Urban Mobility: AI, ODE-Based Modeling, and Scenario Planning [0.0] 我々は、自動運転車やインテリジェントな交通管理といったAIイノベーションが、異なる規制条件下での交通渋滞軽減に与える影響を定量化する。
我々のODEモデルは、AI導入率と交通渋滞のダイナミックな関係を捉え、将来のシナリオをどのように展開するかについての定量的な洞察を提供する。
この研究は、予測、シナリオ計画、ODEモデリングが、AIの採用を通じてより効率的で持続可能で、生き生きとした都市を作るための戦略にどのように役立つかを理解するのに寄与する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:09:02 GMT)
Turn-by-Turn Indoor Navigation for the Visually Impaired [0.0] 室内環境のナビゲーションは視覚障害者にとって重要な課題である。
本稿では,カメラを搭載したスマートフォンのみを用いた建物内部のターンバイターンナビゲーションシステムを提案する。
複雑な屋内空間を利用者に正確に案内するシステムの有効性について予備評価を行った。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:16:38 GMT)
Turbine location-aware multi-decadal wind power predictions for Germany using CMIP6 [0.0] 気候モデルは洞察を与え、長期の電力計画に使用されるべきである。
この研究では、地球規模の気候モデルから風速が与えられたとき、ガウス過程を用いて出力を予測する。
この結果から,風力エネルギーは今後も信頼性の高いエネルギー源となる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:50:18 GMT)
Transductive Learning for Near-Duplicate Image Detection in Scanned Photo Collections [0.0] 本稿では,実世界のユースケースシナリオにおける近距離画像検出技術の比較研究について述べる。
本稿では、畳み込みニューラルネットワーク(CNN)や視覚変換器(ViT)といった最先端のディープラーニングアーキテクチャを活用するトランスダクティブ学習手法を提案する。
提案手法は,UKBenchと社内のプライベートデータセットにおいて,ほぼ重複画像検出のタスクにおいて,ベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:56:15 GMT)
Tracking and triangulating firefly flashes in field recordings [0.0] 私は、信頼できるフラッシュ分類のためのトレーニングデータセットとトレーニングニューラルネットワークを提供します。
このロバストトラッキングにより、立体360度ビデオから3次元のフラッシュ発生を再現する新たなキャリブレーションフリーな手法が実現される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:07:55 GMT)
Topological fingerprints in Liouvillian gaps [0.0] 多体物理学の位相は通常、平衡量子状態の特徴として現れる。
開量子系の緩和速度にもトポロジカルフィンガーが現れることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:41:25 GMT)
TinyEmo: Scaling down Emotional Reasoning via Metric Projection [0.0] TinyEmoは、感情的推論と分類のための小さなマルチモーダル言語モデルのファミリーである。
TinyEmoは感情の分類と感情の推論を行うことができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:11:50 GMT)
TinyEmo: Scaling down Emotional Reasoning via Metric Projection [0.0] TinyEmoは、感情的推論と分類のための小さなマルチモーダル言語モデルのファミリーである。
TinyEmoは感情の分類と感情の推論を行うことができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:11:50 GMT)
Thermal cycling -- evidence for a generalized tunneling model and a tool to distinguish noise sources in quantum circuits [0.0] 非晶質固体中に存在する構造的二層構造系 (TLS) は熱サイクルに敏感であり, 約20ドルである。
量子回路の他のノイズ源とTLSノイズを区別するためのユニークなプロトコルとしてサーマルサイクリングを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 19:04:04 GMT)
The probabilistic world [0.0] セルオートマトンは離散時間ステップと実波関数を持つ量子系であることを示す。
古典統計学の量子形式論は、一般化したイジングモデルに対して運動量観測可能な実装を可能にする強力なツールである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:48:56 GMT)
The game of metaphysics [0.0] 我々は、メタ物理に対する架空のアプローチは、この規律が現実と自然主義の方法論の基本的特徴に問うという考え方と相容れないと論じる。
我々は、メタ物理に対する架空のアプローチは、この規律が現実と自然主義の方法論の基本的特徴に問うという考え方と相容れないと主張する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:21:25 GMT)
The complexity of Gottesman-Kitaev-Preskill states [0.0] 我々は,その状態に対するL1$-norm近似を準備する回路の最小サイズでボソニック状態の複雑性を定義する。
回路が一定の確率で受理し、受け入れに応じて出力状態が $(kappa,Delta)$ の状態を $|mathsfGKP_kappa,Deltarangle$ に近いことを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:02:29 GMT)
The Representation of Meaningful Precision, and Accuracy [0.0] 精度の概念と精度は、領域依存と問題依存である。
統計学習の分野、多くの種類の機械学習、二進的・多進的分類問題において用いられる単純化された数値的ハードとソフトな尺度は、モデルの有意義性やそれらの関連性を理解するのに限られていることが知られている。
本研究では,重要な課題を考察し,問題文脈に対して,最小主義的全般的粗悪な枠組みにおける構成的知識表現アプローチを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:58:27 GMT)
The Many-Worlds Calculus [0.0] このフレームワークで計算をモデル化するための色付きPROPを提案する。
このモデルは、通常のテスト、確率的および非決定論的分岐、および量子分岐をサポートすることができる。
我々は、言語が普遍的であることを証明し、方程式理論は、この意味論に関して完備であるべきである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:57:24 GMT)
The Fast Mode-Fourier-Transform and the bands of the Bethe chain [0.0] このプロトコルは、翻訳不変系のプロトタイプとしてBethe鎖の研究に応用される。
結果として生じるバンド図は、相互作用機構と非常に相関する平坦なパターンを特徴としている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:44:40 GMT)
The Bose-Marletto-Vedral experiment with nanodiamond interferometers: an insight on entanglement detection [0.0] 窒素-原子価欠陥を持つ2つのナノダイアモンド間の重力絡みを磁気的に閉じ込められた状態で発生させることにより、量子重力効果を検出する新しい手法が提案されている。
ここでは、重力によって引き起こされる絡みの検知を実装することに焦点を当て、提案した実験装置について詳細に分析する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:49:00 GMT)
Temporal Convolution-based Hybrid Model Approach with Representation Learning for Real-Time Acoustic Anomaly Detection [0.0] 本研究は, 実時間音響異常検出への革新的アプローチを導入する。
我々の手法は、半教師付き時間的畳み込みと表現学習と、時間的畳み込みネットワーク(TCN)によるハイブリッドモデル戦略を組み合わせたものである。
提案モデルでは,本手法の有効性を実証し,現場で確立された研究よりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:50:48 GMT)
TBBC: Predict True Bacteraemia in Blood Cultures via Deep Learning [0.0] バクテリア血症(Bacteraemia)は、高い死亡率と死亡率を持つ血流感染症であり、重要な診断上の課題である。
この論文は、細菌性貧血を予測するための最適な機械学習技術を特定し、セント・アントニウス病院の救急部門のデータを用いて予測モデルを開発することを目的としている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:25:01 GMT)
System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam [0.0] OpenAIはシステム2のような推論を扱うために設計されたo1モデルシリーズを導入した。
本研究では,オランダの「B」最終試験において,o1-previewモデルを2回試験した。
その結果,o1-previewは強い効果(9位パーセンタイル)を示し,汚染は要因ではないことが示された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:57:44 GMT)
System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam [0.0] OpenAIはシステム2のような推論を扱うために設計されたo1モデルシリーズを導入した。
本研究では,オランダの「B」最終試験において,o1-previewモデルを2回試験した。
その結果,o1-previewは強い効果(9位パーセンタイル)を示し,汚染は要因ではないことが示された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:57:44 GMT)
System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam [0.0] OpenAIはシステム2のような推論を扱うために設計されたo1モデルシリーズを導入した。
オランダの直観的Bの最終試験では,o1-previewモデルを2回試験した。
その結果、o1-previewは強く(97.8パーセント)、汚染は要因ではないことが示された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:57:44 GMT)
System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam [0.0] OpenAIはシステム2のような推論を扱うために設計されたo1モデルシリーズを導入した。
オランダの直観的Bの最終試験では,o1-previewモデルを2回試験した。
その結果、o1-previewは強く(97.8パーセント)、汚染は要因ではないことが示された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:57:44 GMT)
System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam [0.0] OpenAIは、システム2のような推論を扱うために特別に設計されたO1モデルシリーズを導入した。
本研究では,オランダの「B」最終試験において,O1-previewモデルを2回試験した。
76点中76点、73点がオランダ平均の40.63点を大きく上回った。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:57:44 GMT)
Symmetry-informed transferability of optimal parameters in the Quantum Approximate Optimization Algorithm [0.0] 最適パラメータの任意の集合を、対称性を用いて適切な領域に変換する方法を示す。
これらの結果は、関連する物理モデルに対してIsatzing Hamiltonian variational ansatzによって記述された一般的な古典的最適化問題に拡張する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:55:10 GMT)
Super Gradient Descent: Global Optimization requires Global Gradient [0.0] 本稿では,閉区間上で定義される任意のk-Lipschitz関数に対して,大域最小値への収束を保証する新しい最適化手法を提案する。
従来の最適化アルゴリズムの限界に対処するアプローチは、しばしばローカルなミニマに閉じ込められる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:28:39 GMT)
Simulating thermodynamic properties of dinuclear metal complexes using Variational Quantum Algorithms [0.0] 二核金属錯体の熱力学特性をシミュレーションするための変分量子アルゴリズムの利用について検討する。
この結果は,低次元分子磁気系の熱状態のシミュレーションと熱力学特性の探索における変分量子アルゴリズムの有効性を実証するものである。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:25:20 GMT)
Simmering: Sufficient is better than optimal for training neural networks [0.0] これは、ニューラルネットワークをトレーニングして、十分十分な重みとバイアスを生成する物理ベースの方法です。
我々は、SimmeringがAdamが過剰に適合するニューラルネットワークを修正していることを示し、Simmeringが最初からデプロイされた場合、過適合を避けることを示す。
本稿では,ニューラルネットワーク学習のパラダイムとして最適化を問うとともに,情報幾何学的議論を活用し,十分な学習アルゴリズムのクラスの存在を示唆する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:02:08 GMT)
Shortcut-to-adiabaticity for coupled harmonic oscillators [0.0] 断熱法へのショートカットは、断熱力学の望ましい状態を得ることを可能にする。
この手法を2結合ボソニックモードに適用する問題に対処する。
この手法を2結合ボソニックモードに適用する問題に対処する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:20:29 GMT)
Semantics in Robotics: Environmental Data Can't Yield Conventions of Human Behaviour [0.0] 私は、これがなぜそうなるのかを明確にし、いわゆる意味論は人間の行動の慣習で構成されたデータとして最もよく理解されている、と論じます。
オブジェクトの余裕は、環境データにない意味だけでなく、特に問題となる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:38:23 GMT)
Resonances, mobility edges and gap-protected Anderson localization in generalized disordered mosaic lattices [0.0] そこで本研究では,モザイク格子のより広範なクラスを導入し,モザイクエッジの表現を導出し,副鼻腔疾患に対する局在長を推定した。
不規則性障害と非相関性障害の両方に対して、アンダーソン局在化が障害のない格子の開隙によって保護されていることを証明する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:43:17 GMT)
Residual Random Neural Networks [0.0] ランダムな重みを持つ単層フィードフォワードニューラルネットワークは、ニューラルネットワークの文献の中で繰り返されるモチーフである。
隠れたニューロンの数がデータサンプルの次元と等しくない場合でも,優れた分類結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:00:11 GMT)
Reply to Comment on "Neutrino oscillations originate from virtual excitation of Z bosons" and "Neutrinos produced from $β$ decays of neutrons cannot be in coherent superpositions of different mass eigenstates" [0.0] この反応では、ニュートリノの質量と他の自由度の間の量子的絡み合いが質量固有状態の間の量子的コヒーレンスを破壊することを指摘した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:34:24 GMT)
Relative descriptors for quantum agents [0.0] 我々は、エベレット量子力学のハイゼンベルク図を用いて、フラウチャー=レンナーの思考実験の相対的な記述子を探索する。
エベレット力学は思考実験においてパラドックスを示さないが、デコヒーレンスのないセットアップは指示的分岐木を提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:18:02 GMT)
Quantum optimization for Nonlinear Model Predictive Control [0.0] NMPC最適化問題の解に対する量子コンピューティング手法を提案する。
このアプローチは計算時間を著しく削減し、ソリューションの品質を向上する可能性がある。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:56:42 GMT)
Quantum electrometry of non-volatile space charges in diamond [0.0] ダイヤモンド内に埋め込まれた量子欠陥の電気測定を用いて、安定でミクロンスケールの空間電荷分布を観測する。
これらの空間電荷場は、広く分散した窒素電荷の空間配置に由来すると考えられる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:39:19 GMT)
Quantum Uncertainty Equalities and Inequalities for Unitary Operators [0.0] ユニタリ作用素に対する2つの不確実性は、任意の純状態によって最小化される。
我々は、ユニタリ作用素の不確実性の領域内で階層構造を明らかにする不確かさの2つの集合を導出する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:39:53 GMT)
Quantum Graph-State Synthesis with SAT [0.0] 局所および非局所グラフ状態演算のためのCNF符号化法を提案する。
所望の変換を合成するために、このエンコーディングを有界モデルチェックセットで使用する。
このアプローチは、最大17キュービットまでのグラフの変換を30分以内で合成できる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:50:27 GMT)
Probing spontaneously symmetry-broken phases with spin-charge separation through noise correlation measurements [0.0] 自発的に対称性を破る相は局所的に秩序づけられた物質の状態である。
本稿では,原子雲の弾道膨張後の雑音の統計的相関に基づく代替手法を提案する。
数値解析により,これらのSSB相の存在を正確に把握できることが示された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:44:54 GMT)
Prediction of microstructural representativity from a single image [0.0] 本稿では、材料の単一画像(2Dまたは3D)で観測された位相分率の表現率を予測する方法を提案する。
提案手法は2点相関関数を用いて1つの画像(2Dまたは3D)から直接分散を推定する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:59:22 GMT)
Planning-Aware Diffusion Networks for Enhanced Motion Forecasting in Autonomous Driving [0.0] Planning-Integrated Forecasting Model (PIFM)は、脳における意思決定とマルチエージェント協調を管理する神経機構にインスパイアされた新しいフレームワークである。
PIFMはシナリオ内の全てのエージェントの将来の軌跡を予測することができる。
このアーキテクチャは、外部刺激やその他のエージェントの行動に基づいた予測を動的に調整する脳の手法と平行して、モデルの透明性を高める。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:44:51 GMT)
Peter Parker or Spiderman? Disambiguating Multiple Class Labels [0.0] ディープネットワークは通常、推論中に複数の予測を行う。
本稿では,現代のセグメンテーションと入力属性技術を活用したフレームワークと手法を提案する。
提案手法は,ImageNetバリデーションセットおよび複数のモデル上で,多数のサンプルに対して良好に動作することを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:16:28 GMT)
Parametric Nonlinear Volterra Series via Machine Learning: Transonic Aerodynamics [0.0] 本研究では、パラメトリック空間内での非定常超音速空力のモデリング手法を提案する。
1階と2階のVolterraカーネルは、空力応答から導かれる。
結果は、強い非線形性に対処する2階のカーネルを含めることの利点を裏付けている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:40:10 GMT)
Optimizing Unitary Coupled Cluster Wave Functions on Quantum Hardware: Error Bound and Resource-Efficient Optimizer [0.0] 本稿では、量子ハードウェア上でのユニタリ結合クラスタ波関数の最適化のための射影量子固有解法(PQE)アプローチについて検討する。
このアルゴリズムはシュル・オーディンガー方程式の射影を用いて、試行状態をハミルトニアンの固有状態に効率的に近づける。
我々は,BFGS法を用いて最適化されたarXiv:2102.00345とVQEの両方で導入された最適化よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:04:44 GMT)
Optimizing Hearthstone Agents using an Evolutionary Algorithm [0.0] 本稿では,カードゲーム『Harthstone』をプレイするエージェントの開発に進化的アルゴリズム(EA)を用いることを提案する。
エージェントは競争力のある共進化的トレーニングアプローチによって自己学習を特徴とする。
提案されたアプローチによって開発されたエージェントの1つは、国際ヘースストーン人工知能(AI)コンペティションにおけるランナーアップ(6%)であった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:49:11 GMT)
On Model-Free Re-ranking for Visual Place Recognition with Deep Learned Local Features [0.0] 記事は、標準的なローカルな視覚的特徴に基づいて、モデルフリーで再ランク付けすることに焦点を当てている。
これは、主に深層学習された局所的な視覚的特徴のために設計された3つの新しいモデルフリーなリグレード手法を導入している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:59:36 GMT)
On Biases in a UK Biobank-based Retinal Image Classification Model [0.0] 本研究は,イギリスバイオバンクの眼底網膜画像に違いが存在するかどうかを,これらの画像上での疾患分類モデルの評価とトレーニングにより検討する。
モデル全体の性能は高いが、大きな違いがある。
これらの手法は, 偏見に適応したより良い偏見緩和法の必要性を浮き彫りにして, 公平性を高めることができないことが判明した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:51:19 GMT)
Observation of quantum thermalization restricted to Hilbert space fragments [0.0] 平衡外量子系は、初期状態の記憶を熱化または保持することが長年理解されてきたが、両方ではない。
ここでは、量子系における熱化とメモリの最初の共存を実現する。
結果は量子プロセッサや量子センサーにおける絡み合いのダイナミクスを制御するために応用できる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:18:21 GMT)
Notes on the Mathematical Structure of GPT LLM Architectures [0.0] GPT-3型LLMのニューラルネットワークアーキテクチャを支える数学の解説
GPT-3スタイルのLCMの例。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:16:19 GMT)
Neutrinos produced from $β$ decays of neutrons cannot be in coherent superpositions of different mass eigenstates [0.0] 反ニュートリノ-プロトン-電子系の波動関数全体を解析する。
反ニュートリノは、異なる質量固有状態のコヒーレントな重ね合わせでは存在できないことが証明されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:07:40 GMT)
Navigating AI in Social Work and Beyond: A Multidisciplinary Review [0.0] このレビューは、2025年の夜明けとして、より広い社会的、学術的な会話にAIを集中させる、包括的でアクセスしやすい概要を提供することを目的としている。
これはAIの現実世界への影響、倫理的課題、社会労働への影響を簡潔に分析する。
高度なパーソナライズド・シミュレーショントレーニングを通じて、ソーシャルワーク教育を変革できるAIファシリテート・シミュレーションのビジョンを提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:51:23 GMT)
NIDS Neural Networks Using Sliding Time Window Data Processing with Trainable Activations and its Generalization Capability [0.0] 本稿では,ネットワーク侵入検知システム(NIDS)のためのニューラルネットワークについて述べる。
ディープパケットインスペクションに頼らず、ほとんどのNIDSデータセットで見つからず、従来のフローコレクタから簡単に取得できる11の機能しか必要としない。
報告されたトレーニング精度は、提案手法の99%を超え、ニューラルネットワークの入力特性は20に満たない。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:05:17 GMT)
Monte Carlo particle transport on quantum computers [0.0] モンテカルロ粒子輸送コードは、古典的なハードウェア上でよく確立されており、核応用の基準ツールと考えられている。
これらの領域のいくつかでは、モンテカルロ法はすでに量子コンピューティングフレンドリーな設定に変換されており、複雑性の期待と観測の利得は二次的である。
本研究では,離散時間量子ウォークに基づく粒子輸送の数値計算法を提案し,振幅増幅ルーチンと組み合わせた。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:45:39 GMT)
Mirror Matrix on the Wall: coding and vector notation as tools for introspection [0.0] 我々はオクタベにおけるベクトル表記の使用について、演算子と関数の解析を通して検討する。
ベクトル表記を採用することで、オクタベは数学者、科学者、技術者にとって強力なツールとなる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:22:38 GMT)
Microwave-Induced Cooling in Double Quantum Dots: Achieving Millikelvin Temperatures to Reduce Thermal Noise around Spin Qubits [0.0] ゲート定義量子ドット(QD)におけるスピン量子ビットは、そのスケーラビリティと長いコヒーレンス時間のために、主要な技術として出現している。
本稿では,DQDが冷媒として機能し,計算量子ビット周辺の局所フォノン環境を低減できる新しいゲート定義二重量子ドット (DQD) 冷却システムを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:20:14 GMT)
Microwave-Induced Cooling in Double Quantum Dots: Achieving Millikelvin Temperatures to Reduce Thermal Noise around Spin Qubits [0.0] ゲート定義量子ドット(QD)におけるスピン量子ビットは、そのスケーラビリティと長いコヒーレンス時間のために、主要な技術として出現している。
本稿では,DQDが冷媒として機能し,計算量子ビット周辺の局所フォノン環境を低減できる新しいゲート定義二重量子ドット (DQD) 冷却システムを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:20:14 GMT)
Method for noise-induced regularization in quantum neural networks [0.0] 量子ハードウェアにおけるノイズレベルを効果的に調整することで、量子ニューラルネットワークがデータを一般化する能力を高めることができることを示す。
例えば,回路のノイズレベルを調整することで,平均2乗誤差損失を8%改善する医療レグレッションタスクを考える。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 18:29:42 GMT)
Legal Theory for Pluralistic Alignment [0.0] 法理論は、多元性と仕様という2つの関連するアライメントの問題に対処することができる。
先行する法理論は、法が規則と事件の相互作用を通じてこれらの問題を解決することを示唆している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:38:51 GMT)
Investigating the Role of Prompting and External Tools in Hallucination Rates of Large Language Models [0.0] LLM(Large Language Models)は、人間の可読テキストの広範なコーパスに基づいて訓練された強力な計算モデルであり、汎用的な言語理解と生成を可能にする。
これらの成功にもかかわらず、LLMは幻覚と呼ばれる不正確さをしばしば生み出す。
本稿では,LLMにおける幻覚の低減を目的とした,異なるプロンプト戦略とフレームワークの実証評価を行う。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:34:53 GMT)
Inverse magneto-conductance design by automatic differentiation [0.0] 所望の磁気伝導パターンを示す顕微鏡構造を自動生成する逆設計法を提案する。
本稿では,ワイヤの欠陥位置を正確に生成し,様々な複雑なパターンに効果的に適用できることを数値的に示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:40:32 GMT)
Interpreting Neural Networks through Mahalanobis Distance [0.0] 本稿では,ニューラルネットワークの線形層とマハラノビス距離を結合する理論的枠組みを提案する。
この研究は理論的であり、経験的データを含んでいないが、提案された距離に基づく解釈は、モデルロバスト性を高め、一般化を改善し、ニューラルネットワークの決定をより直観的な説明を提供する可能性がある。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:21:44 GMT)
Interleaving Text and Number Embeddings to Solve Mathemathics Problems [0.0] 我々は、より表現力のある数値埋め込みを導入することで、近年のアプローチを構築している。
本手法は, 数値アーチファクトの除去, クリッピングを伴わずに広範囲のマグニチュードを扱う能力など, 重要な欠点に対処する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:21:57 GMT)
Institutional Review Boards as Soft Governance Mechanisms of R&D: Governing the R&D of AI-based Medical Products [0.0] Institutional Review Boards (IRBs) は、一般的な研究から具体的な製品開発へのステップに対処できるユニークなガバナンスメカニズムである。
この記事では、変化を起こすのに使用できる4つのガバナンスレバー、製品のライフサイクル全体にわたる4つのガバナンスエントリポイント、AIベースの医療プロジェクトの研究開発段階の効果的なガバナンスを保証するためにIRBが前進すべき5つの異なる行動について説明する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:12:58 GMT)
Improved Electron-Nuclear Quantum Gates for Spin Sensing and Control [0.0] 我々はスピンセンシングと制御に重要な意味を持つ汎用DDRFフレームワークを開発した。
弱い結合スピンを検出するためのポテンシャル60倍感度向上を示す。
これらの結果は、幅広い種類のゲートの理解を促進し、アプリケーション固有の設計のためのツールボックスを提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:07:50 GMT)
Improved Electron-Nuclear Quantum Gates for Spin Sensing and Control [0.0] 我々はスピンセンシングと制御に重要な意味を持つ汎用DDRFフレームワークを開発した。
ダイヤモンド中の1つのNV中心での実験によって相関する分析モデルは、ゲートの選択性を管理するメカニズムを明らかにする。
これらの知見を応用して、弱い結合スピンを検出するための60倍感度向上を数値的に示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:07:50 GMT)
Hyperfine rovibrational states of H$_3^+$ in a weak external magnetic field [0.0] H$_3+$分子イオンの最低エネルギー状態に対して、回転エネルギー、波動関数、ラマン遷移モーメントが報告される。
開発された手法は、高エネルギーのH$_3+$および他の多原子分子の高エネルギー偏光励起にも用いられる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 20:47:29 GMT)
High-impedance resonators for strong coupling to an electron on helium [0.0] 我々は、ヘリウム上の電子との強い結合に適合する高インピーダンス超伝導マイクロ波共振器の設計を導入する。
内部品質の中央値が3.9times 105$、平均インピーダンスが2.5k$Omega$の窒化チタン共振器を作製・測定した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:37:23 GMT)
Hierarchy of approximations for describing quantum light from high-harmonic generation: A Fermi-Hubbard model study [0.0] フォトニック状態の運動方程式に対する近似の階層を示す。
弱い量子化光物質結合定数と損傷閾値よりかなり低い強度の典型的な実験状況において、生成した量子光の明示的な表現は高調波スペクトルを定量的にキャプチャする。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:59:29 GMT)
Hate speech detection in algerian dialect using deep learning [0.0] オンラインアルジェリアメッセージ上でヘイトスピーチを検出するための完全なアプローチを提案する。
このコーパスにはアラビア語で書かれたアルジェ語方言の13.5K以上の文書が含まれており、憎しみや非憎しみが込められている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:32:08 GMT)
Gradient Descent Efficiency Index [0.0] 本研究では,各イテレーションの有効性を定量化するために,新しい効率指標Ekを導入する。
提案した測定基準は、誤差の相対的変化と繰り返し間の損失関数の安定性の両方を考慮に入れている。
Ekは、機械学習アプリケーションにおける最適化アルゴリズムの選択とチューニングにおいて、より詳細な決定を導く可能性がある。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:22:22 GMT)
Good Parenting is all you need -- Multi-agentic LLM Hallucination Mitigation [0.0] 本研究では,大規模言語モデル(LLM)エージェントによるAI生成コンテンツの幻覚の検出と修正能力について検討する。
各種のプライマリエージェントとレビューエージェントの組み合わせを含む4900回のテスト実行では、高度なAIモデルは幻覚を識別する上でほぼ完璧に正確であることを示した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:24:16 GMT)
Goetterfunke: Creativity in Machinae Sapiens. About the Qualitative Shift in Generative AI with a Focus of Text-To-Image [0.0] 人間とAIのコラボレーションでは、コンピューターはツール以上のものになったようだ。
この記事では、現在の機械学習パラダイムにおけるコンピュータにおける創造性の可能性について述べる。
技術の背後にある重要な概念と、この質的な変化に寄与したイノベーションについて概説している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:04:11 GMT)
Generalized Wigner-Smith analysis of resonance perturbations in low $Q$ non-Hermitian systems [0.0] 摂動共振系は、複素平面における関連する散乱極の変化を引き起こす。
我々は、Wigner-Smith形式と標準電磁摂動理論の結果を結びつけることによってこのアプローチを拡張した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:27:41 GMT)
Four-parameter Mittag-Leffler functions and their associated coherent states [0.0] この論文は、量子力学(コヒーレントステートフォーマリズム)における数学的実体(ミッタ・レフラー関数)の適用例である。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 10:46:21 GMT)
Fermion and Boson Pairs in Beamsplitters and MZIs [0.0] 我々は、ビームスプリッターにおける最初の多重フェルミオンの挙動を考察し、これから、マッハ・ツェンダー干渉計(MZIs)における多重フェルミオンと多重ボソンの挙動を延長する。
このレビューは、数学的に単純だが直観的でない量子場理論から現象論的記述へ進む方法を示すことで、この分野の研究者や学生が量子粒子の振る舞いに対するより強い直観を構築するのに役立つことを願っている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:45:20 GMT)
Fermion and Boson Pairs in Beamsplitters and MZIs [0.0] ビームスプリッターにおいて、最初の多重フェルミオン、次に複数のボゾンの挙動を考察する。
次に、マッハ・ツェンダー干渉計における多重フェルミオンと多重ボソンの挙動を述べる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:45:20 GMT)
Federated Anomaly Detection for Early-Stage Diagnosis of Autism Spectrum Disorders using Serious Game Data [0.0] 本研究では,AutoEncoder-based Machine Learning (ML) 手法を用いて,ASD検出のための新しい半教師付きアプローチを提案する。
この目的に特化して設計された真剣なゲームを通じて手作業で収集したデータを利用する。
ゲーミフィケーションされたアプリケーションによって収集されたセンシティブなデータは、プライバシー漏洩の影響を受けやすいため、フェデレートラーニングフレームワークを開発した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:00:12 GMT)
Fast Scrambling in Classically Simulable Quantum Circuits [0.0] スーパークリフォードゲートから構築された量子回路の演算子スクランブルについて検討する。
作用素の絡み合いに加えて、ある時間外順序相関関数 (OTOCs) は古典的に同じ形式でシミュレートできる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:05:35 GMT)
Extracting Dynamical Maps of Non-Markovian Open Quantum Systems [0.0] Lambda(tau)$は、システムと1つ以上の熱浴を、弱くも強くもない強度で突然結合することによって生じることを示す。
我々はChoi-Jamiolkowski同型を使い、$hatLambda(tau)$を完全に再構成することができる。
スピンレスフェルミ連鎖と単一不純物アンダーソンモデルとの相互作用の数値的な例は、我々のアプローチが大きなスピードアップをもたらす状態を示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:29:55 GMT)
Exploring Self-Supervised Learning with U-Net Masked Autoencoders and EfficientNet B7 for Improved Classification [0.0] 自己教師型U-Netマスク付きオートエンコーダとノイズ除去モデル
我々はAdamを0.0001の学習率で採用し、検証セットの最高精度は0.94に達した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:53:15 GMT)
Evolving choice hysteresis in reinforcement learning: comparing the adaptive value of positivity bias and gradual perseveration [0.0] 多くの状況において, 肯定バイアスは進化的安定であり, 漸進的摂動の出現は体系的でなく, 頑健であることを示す。
以上の結果から, 環境特異的な方法で, バイアスが適応し, 進化によって選択できることが示唆された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:47:31 GMT)
Entanglement dynamics for SCTS in the Jaynes-Cummings model with atoms in Werner state [0.0] 本研究では, 絡み合い突然死(ESD)現象, 原子インバージョン, 様々な相互作用がこれらの力学に与える影響について検討する。
この研究は、これらの相互作用と光子が原子と磁場のサブシステムに与える影響を比較し、これらの系における熱的および量子的ノイズが絡み合いにどのように影響するかについての洞察を与える。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:38:03 GMT)
Entanglement Entropy of a Scalar Field in a Squeezed State [0.0] 3+1次元の自由スカラー場に対する球面領域内の絡み合いエントロピーについて検討する。
小さいスクイーズであっても体積項が出現し、その係数は本質的に場の質量とは独立であることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 08:53:50 GMT)
Entanglement Criteria Based on Quantum Fisher Information [0.0] 典型的局所可観測(英語版)の2つのクラス、すなわち局所正規直交可観測(英語版)と対称情報完備な正の作用素値測度(英語版)を考える。
その結果, 交絡検出において, 対称的情報完全正定値測度は局所正規直交観測値よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 17:17:45 GMT)
Ensemble architecture in polyp segmentation [0.0] 本研究では,意味的セグメンテーションのアーキテクチャを再検討し,ポリプセグメンテーションに優れたモデルを評価する。
最適な結果を得るために、異なるモデルの利点を利用する統合フレームワークを導入します。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:00:22 GMT)
Ensemble architecture in polyp segmentation [0.0] 本研究では, 意味的セグメンテーションのアーキテクチャと, ポリープセグメンテーションに優れた評価モデルについて検討する。
最適な結果を得るために,異なるモデルの利点を利用する統合フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:00:22 GMT)
Enhancing Quantum Key Distribution with Entanglement Distillation and Classical Advantage Distillation [0.0] 本稿では,古典的有利蒸留と絡み合い蒸留を連結した2段階蒸留方式を提案する。
提案手法は高雑音状態においても有限鍵レートを達成する。
提案手法は、短期量子鍵分布タスクに適している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:40:09 GMT)
Enhanced strong interaction effect in synthetic spin-orbit coupling with mixed spin symmetry [0.0] 2つの擬スピン次数の系では、2つの粒子は対称状態と反対称状態を含むが、スピン対称性はより多くの粒子に対して混合することができる。
スピン軌道カップリングの存在下での混合スピン対称性の役割について検討する。
2粒子系とは対照的に、基底状態の対の相関は比較的小さな接触相互作用であってもトンクス・ジラルドー気体と類似している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:39:11 GMT)
EQB: Synthesizing Permutative Quantum Gates and Circuits Using Rotation-Based Group Decomposition [0.0] ササオとサラヴァノフの群論に基づく方法からの分解は、二項量子カスケードを設計するために拡張される。
局所変換のクラスも、最終標準カスケード回路を単純化するために提示される。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:34:14 GMT)
Dynamics and Geometry of Entanglement in Many-Body Quantum Systems [0.0] 新しい枠組みは、多体量子系における絡み合いのダイナミクスを研究するために定式化されている。
量子相関伝達関数(QCTF)は孤立特異点を持つ複素関数の新しい空間に変換される。
QCTFに基づく幾何学的記述は、多体絡みの理論的に明らかな側面を提供する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:35:57 GMT)
Development of a high-power ultraviolet laser system and observation of fast coherent Rydberg excitation of ytterbium [0.0] 本稿では,Yytterbiumの3mathrmP$状態からRydberg励起のために325nmの波長で動作する高出力紫外レーザーシステムを提案する。
このシステムは、ハイリドベルク忠実度を達成するために重要なMHz範囲の周波数ノイズを効果的に抑制する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:38:01 GMT)
CoqPilot, a plugin for LLM-based generation of proofs [0.0] CoqPilotは、Coq証明の記述を自動化するために設計されたVS Codeエクステンションである。
プラグインは、Coqファイルの許容戦術でマークされた証明の一部を収集する。
LLMと非機械学習法を組み合わせて、ホールの証明候補を生成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 14:57:29 GMT)
Controlling dephasing of coupled qubits via shared-bath coherence [0.0] 結合した量子ビット系のデコヒーレンスを、浴自体の量子コヒーレンスを利用して最小化あるいは最小化することができることを示す。
音響フォノンと相互作用する半導体量子ドット間のF"オースターまたは空洞介在結合を取り扱う。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:52:05 GMT)
Controlled dissipation for Rydberg atom experiments [0.0] 我々は、磁気光学トラップ中の冷ルビジウム原子を70ドルSのリドベルク状態に励起する。
我々は同時に、Rydberg状態と短命6$-P状態の超微細レベルを共振的に結合することで強制散逸を誘導する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:08:44 GMT)
Conformal Prediction for Multimodal Regression [0.0] コンフォメーション予測は 今や 方法論を通して マルチモーダルな文脈に拡張されています
本研究は,マルチモーダル情報を組み合わせた収束点から抽出した内部ニューラルネットワーク機能の可能性を明らかにする。
この機能は、マルチモーダルデータに富んだ領域にコンフォメーション予測を展開するための新しい経路を舗装する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:56:39 GMT)
Completeness of FSM Test Suites Reconsidered [0.0] 有限状態機械(FSM)に対するテストスイートのemph$k$-$A$完全性の条件を示す。
予備的な証拠は、これらの障害ドメインがネットワークプロトコルのテストに実用的であることを示唆している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 09:08:47 GMT)
Collisional thermometry for Gaussian systems [0.0] ガウス系を用いた量子温度測定に基づく衝突モデルについて検討する。
これらのスキームの鍵となる疑問は、量子フィッシャー情報(QFI)のスケーリングとアンシラの数に関するものである。
ここでは、QFIのスケーリングを任意の大きさで評価できるガウス衝突モデルに焦点を当てる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 15:01:16 GMT)
Coherent spectroscopy of a single Mn-doped InGaAs quantum dot [0.0] 自己集合したInGaAs/GaAs量子ドットを1つのMn原子でドーピングすると、離散エネルギーレベルとスピン依存光学選択規則を持つ量子系が得られる。
我々は、V様系における量子干渉の証拠を示し、対応するスピン状態間の純粋な劣化速度を評価する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:03:40 GMT)
Characterizations of Strongly Entanglement Breaking channels for infinite-dimensional quantum systems [0.0] エンタングルメント・ブレーカー(EB)チャンネルは、完全に正かつトレース保存された線形演算子として、入力システムと他のシステムの間の絡みを断ち切る。
本稿では,SEBチャネルのキャラクタリゼーションを考察し,SEBチャネルをSEBとして分類するための必要かつ十分な条件について述べる。
トレースゼロ作用素の閉自己随伴部分空間は、トレースノルムとともに、SEBチャネルのヌル空間であることを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:46:55 GMT)
CarSpeedNet: A Deep Neural Network-based Car Speed Estimation from Smartphone Accelerometer [0.0] スマートフォンの3軸加速度計データを用いた車速推定モデルであるCarSpeedNetを導入する。
CarSpeedNetは、スマートフォンから収集した13時間のデータを使って、スマートフォンの加速度と車の速度の関係を正確にモデル化する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 07:32:42 GMT)
Can Alice do science and have friends, in a relational quantum world? Solipsism and Relational Quantum Mechanics [0.0] 量子物理学のリレーショナル理解が科学の信頼性を損なうという最近の主張について論じる。
量子物理学のリレーショナル理解が科学の信頼性を損なうという最近の主張について論じる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:58:03 GMT)
Brain-like Functional Organization within Large Language Models [0.0] 人間の脳は長い間人工知能(AI)の追求にインスピレーションを与えてきた
最近のニューロイメージング研究は、人工ニューラルネットワーク(ANN)の計算的表現と、人間の脳の刺激に対する神経反応との整合性の説得力のある証拠を提供する。
本研究では、人工ニューロンのサブグループと機能的脳ネットワーク(FBN)を直接結合することで、このギャップを埋める。
このフレームワークはANサブグループをFBNにリンクし、大きな言語モデル(LLM)内で脳に似た機能的組織を記述できる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 13:15:17 GMT)
Autonomous Building Cyber-Physical Systems Using Decentralized Autonomous Organizations, Digital Twins, and Large Language Model [0.0] 本稿では,分散型自律型サイバー物理システムフレームワークについて紹介する。
分散自律型組織、大規模言語モデル、デジタルツインを統合して、スマートで自己管理型、運用型、財務的に自律的な建築インフラを構築する。
人工知能アシスタントは、ブロックチェーンのための直感的なヒューマンビルディングインタラクションを提供し、運用管理関連のタスクを構築するために開発された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 02:34:54 GMT)
Automated generation of photonic circuits for Bell tests with homodyne measurements [0.0] 非局所量子化は、デバイスに依存しない量子情報処理のコアリソースである。
非局所的実現のフォトニック実装を設計するためのフレームワークを提案する。
我々は、実験的なセットアップで、損失に対して堅牢であり、CHSH違反の太字記号$2.068$と太字記号$3.9$dBと太字記号$0.008$dBと2つのビームスプリッターを生じる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 16:24:29 GMT)
Antineutrinos produced from $β$ decays of neutrons cannot be in coherent superpositions of different mass eigenstates [0.0] 反ニュートリノ-プロトン-電子系の波動関数全体を解析する。
反ニュートリノは、異なる質量固有状態のコヒーレントな重ね合わせでは存在できないことが証明されている。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:07:40 GMT)
An Undeniable Signature Scheme Utilizing Module Lattices [0.0] 識別不能シグネチャスキーム(英: Undeniable signature scheme)は、シグネチャがシグネチャの検証可能性を制御するデジタルシグネチャの一種である。
モジュール格子を用いたポスト量子不確定シグネチャシステムを開発した。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 00:09:29 GMT)
An Improved Multi-State Constraint Kalman Filter for Visual-Inertial Odometry [0.0] 本稿では,Multi-State Constraint Kalman Filter(MSCKF)の強化版を提案する。
提案したFast-MSCKF (FMSCKF) は標準MSCKFアルゴリズムよりも約6倍高速で、最終位置推定において少なくとも20%精度が高いことが実証された。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 22:14:42 GMT)
An Evidence of Addressing Coherence Errors in VQE Observables by Pulse-level VQE Approach [0.0] 本研究は、ノイズ中間スケール量子(NISQ)時代の変分量子固有解法(VQE)に焦点を当てる。
我々は,ハミルトンの正確な期待値を得るために重要な測定プロセスにおいて,過回転および過回転誤差を導入し,評価する。
以上の結果から,パルスレベルのVQEアルゴリズムは精度で量子エラーに対するレジリエンスを示すことがわかった。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 03:41:48 GMT)
Aliasing and Label-Independent Decomposition of Risk: Beyond the bias-variance trade-off [0.0] データサイエンスの中心的な問題は、潜在的にノイズの多いサンプルを使用して、目に見えない入力の関数値を予測することである。
一般化エイリアス分解(GAD)と呼ばれる代替パラダイムを導入する。
GADは、データラベルを見ることなく、モデルクラスとサンプルの関係から明示的に計算することができる。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:17:54 GMT)
Advancing Gasoline Consumption Forecasting: A Novel Hybrid Model Integrating Transformers, LSTM, and CNN [0.0] イランには豊富な炭化水素資源が供給されており、世界のエネルギー環境において重要な役割を担っている。
ガソリンは重要な燃料であり、国の交通セクターを大いに支えている。
本研究では,ハイブリッドトランスフォーマーLSTM-CNNモデルを用いて,毎月のガソリン消費量を予測する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 23:30:16 GMT)
Acting for the Right Reasons: Creating Reason-Sensitive Artificial Moral Agents [0.0] 道徳的意思決定を可能にする強化学習アーキテクチャの拡張を提案する。
理由に基づくシールドジェネレータは、認識された規範的理由に従う行動にエージェントを結合する道徳的シールドを生成する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 12:28:13 GMT)
AFU: Actor-Free critic Updates in off-policy RL for continuous control [0.0] AFUは、Qラーニングにおける挑戦的な「マックスQ問題」に対処する、非政治的なディープRLアルゴリズムである。
AFUには俳優がいるが、批評家の更新は完全に独立している。
アクター更新がローカルオプティマに閉じ込められにくくするため、AFUをどのように修正できるかを示す。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:32:56 GMT)
A prescriptive theory for brain-like inference [0.0] Evidence Lower Bound (ELBO) の最大化はベイズ後部推論を行うスパイクニューラルネットワークに繋がることを示す。
結果のモデルである反復型Poisson VAEは、以前の脳にインスパイアされた予測モデルよりも生物学的ニューロンと密接な関係を持つ。
これらの結果は,ELBOの最適化とPoissonの仮定が相まって,NeuroAIにおける規範的理論の確立の基盤となることを示唆している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 06:00:18 GMT)
A neural network approach for solving the Monge-Ampère equation with transport boundary condition [0.0] 本稿では,輸送境界条件でモンジュ・アンペア方程式を解くためのニューラルネットワークに基づく新しい手法を提案する。
我々は、方程式の残差、境界条件、凸性制約を含む損失関数を最小化することにより、多層パーセプトロンネットワークを利用して近似解を学習する。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 11:54:00 GMT)
A Tutorial on Teaching Data Analytics with Generative AI [0.0] このチュートリアルは、大規模言語モデル(LLM)をデータ分析クラスに組み込むという課題に対処する。
それは、AIによって実現されたいくつかの新しいクラス内およびクラス外教育技術について詳述している。
論文参考訳(メタデータ) (Fri, 25 Oct 2024 05:27:48 GMT)