Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models [146.9] Molmoは視覚言語モデル(VLM)の新たなファミリーであり、オープンネスのクラスにおける最先端技術である。
我々の最高のクラス72Bモデルは、オープンウェイトとデータモデルのクラスで他よりも優れています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:28:40 GMT)
Establishing Task Scaling Laws via Compute-Efficient Model Ladders [123.8] 我々は,事前訓練された言語モデル(LM)のタスク性能を予測するために,タスクスケーリング法則とモデルはしごを開発する。
まず、タスク固有の損失を予測するためにモデルとデータサイズを使用し、次にタスクの損失を使ってタスクパフォーマンスを予測する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:21:49 GMT)
LoRA of Change: Learning to Generate LoRA for the Editing Instruction from A Single Before-After Image Pair [116.5] 視覚的指示を用いた画像編集のためのLoRA of Change (LoC) フレームワークを提案する。
我々は、命令固有のLoRAを学習し、事前のイメージペアで「変更」を符号化し、モデルの解釈可能性と再利用性を高める。
本モデルでは,ユーザ意図に整合した高品質な画像を生成し,現実世界の視覚的指示の幅広い範囲をサポートする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:39:53 GMT)
VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization [115.6] VimTSは、異なるタスク間のより良い相乗効果を達成することにより、モデルの一般化能力を高める。
本研究では,コンテンツ変形場(CoDeF)アルゴリズムを利用した合成ビデオテキストデータセット(VTD-368k)を提案する。
ICDAR2015ビデオとDSText v2では,ビデオレベルのクロスドメイン適応に対して,従来のエンドツーエンドビデオスポッティング手法を超越している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:13:51 GMT)
DRS: Deep Question Reformulation With Structured Output [114.1] 大規模言語モデル(LLM)は、解決不可能な質問を検知できるが、これらの質問の修正をユーザーが支援するのに苦労する。
DRS:Deep Question Reformulation with Structured Output, a novel zero-shot method for enhance to LLMs ability to help users in reformulation Question。
DRS は GPT-3.5 の改定精度を 23.03% から 70.42% に改善するとともに,Gemma2-9B などのオープンソースモデルの性能を 26.35% から 56.75% に向上させた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:53:40 GMT)
Liquid: Language Models are Scalable Multi-modal Generators [112.7] Liquidは視覚的理解と生成をシームレスに統合する自動回帰生成パラダイムである。
従来のマルチモーダルな大言語モデル(MLLM)とは異なり、Liquidは単一の大言語モデルを用いてこの統合を実現する。
初めてLiquidは、ビジュアルタスクと言語タスクの統一トレーニングによって必然的にパフォーマンスが低下する、スケーリングの法則を明らかにした。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:48:16 GMT)
MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos [104.1] 本研究では,ダイナミックシーンのカジュアルモノクラー映像から,カメラパラメータと奥行きマップの精度,高速,堅牢な推定を可能にするシステムを提案する。
本システムは,先行作業や同時作業と比較して,カメラポーズや深度推定において有意に精度が高く,頑健である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:42 GMT)
Diffusion of Thoughts: Chain-of-Thought Reasoning in Diffusion Language Models [100.5] Diffusion-of-Thought (DoT) は、拡散モデルとChain-of-Thoughtを統合する新しいアプローチである。
DoTは、拡散言語モデルを通じて、時間とともに推論ステップが拡散することを可能にする。
本研究は,多桁乗算,論理学,小学校数学におけるDoTの有効性を示すものである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:49:06 GMT)
From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.4] グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:26:13 GMT)
C2P-CLIP: Injecting Category Common Prompt in CLIP to Enhance Generalization in Deepfake Detection [98.3] 本稿では、カテゴリ共通プロンプトCLIPを紹介し、カテゴリ共通プロンプトをテキストエンコーダに統合し、カテゴリ関連概念をイメージエンコーダに注入する。
提案手法は,テスト中に追加パラメータを導入することなく,元のCLIPと比較して検出精度が12.41%向上した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:06:14 GMT)
Large Language Models Must Be Taught to Know What They Don't Know [97.9] 正解と誤解の小さなデータセットを微調整すると、高い一般化と計算オーバーヘッドの少ない不確実性推定が得られることを示す。
また,確実な不確実性推定を可能にする機構についても検討し,多くのモデルを汎用的不確実性推定器として利用することができることを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:48:19 GMT)
HumanEdit: A High-Quality Human-Rewarded Dataset for Instruction-based Image Editing [93.1] HumanEditは5,751枚の画像で構成され、4段階にわたる2500時間以上の人的作業を必要とする。
データセットには、Action、Add、Counting、Relation、Remove、Replaceの6つの異なるタイプの編集命令が含まれている。
HumanEditは、さまざまなドメインから提供された、包括的な多様性と高解像度の1024倍の1024ドルのコンテンツを提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:00:59 GMT)
ALMA: Alignment with Minimal Annotation [91.2] ALMA: 最小限のアライメント。
ALMAは様々なアライメントベンチマークでLlama3-Instructに近いパフォーマンスを実現している。
結果は、ベースモデルはすでに効果的なアライメントのための十分な知識を持っていることを示唆している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:26:31 GMT)
MageBench: Bridging Large Multimodal Models to Agents [90.6] LMMは印象的な視覚的理解能力を示しており、エージェントに適用される可能性がある。
既存のベンチマークは、主に言語部分における推論能力を評価する。
MageBenchは推論機能指向のマルチモーダルエージェントベンチマークである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:08:19 GMT)
NVILA: Efficient Frontier Visual Language Models [90.4] 我々は、効率と精度の両方を最適化するために設計されたオープンビジュアル言語モデル(VLM)のファミリであるNVILAを紹介する。
VILA上に構築したモデルアーキテクチャは,まず空間分解能と時間分解能をスケールアップし,次に視覚トークンを圧縮することによって改善する。
我々は、NVILAのライフサイクル全体を通して、トレーニングや微調整から展開までの効率を高めるための体系的な調査を行っている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:55 GMT)
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy [88.1] CC-OCRは、マルチシーンテキスト読取、多言語テキスト読取、文書解析、キー情報抽出の4つのOCR中心のトラックで構成されている。
CC-OCRは、OCR中心のタスクにおけるLMMの能力を総合的に評価し、LMMの進歩を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:51:57 GMT)
Towards Real-Time Open-Vocabulary Video Instance Segmentation [88.0] オープン語彙ビデオインスタンス分割(OV-VIS)をリアルタイムに実行するための新しい手法を提案する。
TROY-VISは2つの大規模OV-VISベンチマークで精度と速度の最良のトレードオフを達成する。
これらの結果は,モバイルロボティクスや拡張現実といった動的環境におけるTROY-VISのリアルタイム応用の可能性を示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:53:13 GMT)
Model-GLUE: Democratized LLM Scaling for A Large Model Zoo in the Wild [84.6] 本稿では,全体論的な大規模言語モデルスケーリングガイドラインであるModel-GLUEを紹介する。
既存のスケーリングテクニック,特に選択的マージ,および混合の変種をベンチマークする。
次に、異種モデル動物園の選択と集約のための最適な戦略を定式化する。
我々の手法は、マージ可能なモデルのクラスタリング、最適なマージ戦略選択、クラスタの統合を含む。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:08:56 GMT)
Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion [83.6] 本稿では,Floence-2で生成したリッチな視覚表現を備えたマルチモーダル大規模言語モデル(MLLM)のファミリーであるFloence-VLを紹介する。
本研究では,フローレンス2の視覚的特徴を予め訓練されたLLMに効果的に統合する,新しい特徴融合アーキテクチャと革新的な学習レシピを提案する。
Florence-VLは、様々なマルチモーダルおよびビジョン中心のベンチマークにおいて、最先端のMLLMよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:50:39 GMT)
4Real-Video: Learning Generalizable Photo-Realistic 4D Video Diffusion [81.0] 時間軸と視点軸の両方でビデオフレームのグリッドとして整理された4Dビデオを生成するためのフレームワークである4Real-Videoを提案する。
このグリッドでは、各行は、同じタイムステップを共有するフレームを含み、各列は、同じ視点からフレームを含む。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:41 GMT)
R-MTLLMF: Resilient Multi-Task Large Language Model Fusion at the Wireless Edge [78.3] マルチタスク大言語モデル(MTLLM)は、ユーザが複数のタスクを効率的に処理するための特殊なモデルを要求する無線エッジにおける多くのアプリケーションにとって重要である。
タスクベクトルによるモデル融合の概念は、MDLLMを生成するための微調整パラメータを組み合わせるための効率的なアプローチとして登場した。
本稿では,最悪の逆攻撃を前提として,エッジユーザがタスクベクトルを介して協調的にMTLMを作成できる問題について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:57:30 GMT)
Deep-Unrolling Multidimensional Harmonic Retrieval Algorithms on Neuromorphic Hardware [78.2] 本稿では,高精度かつエネルギー効率の高い単発多次元高調波検索のための変換に基づくニューロモルフィックアルゴリズムの可能性について検討する。
複雑な値の畳み込み層と活性化をスパイクニューラルネットワーク(SNN)に変換する新しい手法を開発した。
変換されたSNNは、元のCNNに比べて性能が低下し、ほぼ5倍の電力効率を実現している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:41:33 GMT)
DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model [77.8] 本稿では,LCM(Latent Consistency Model)を組み込んだDreamLCMを提案する。
提案手法は, 対象3次元モデルの最適化のために, 高精度かつ詳細な勾配を与えることができる。
DreamLCMは、生成品質とトレーニング効率の両面で最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:59:27 GMT)
FlashSloth: Lightning Multimodal Large Language Models via Embedded Visual Compression [76.0] マルチモーダルな大言語モデル(MLLM)は、実用的な用途において、スロットのように振る舞う。
近年の取り組みは、より効率よく小さなMLLMを構築することに集中しているが、視覚トークンの多さは、実際のスピードアップを制限している。
本稿ではFlashSlothと呼ばれる強力で高速な小型MLLMを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:34:07 GMT)
Densing Law of LLMs [75.1] 大規模言語モデル(LLM)は人工知能のマイルストーンとして登場し、モデルのサイズが大きくなるにつれてその性能が向上する。
本稿では,異なるスケールでLLMの品質を評価するための新しい指標として,「テクトキャパシティ密度」の概念を紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:31:13 GMT)
InfiniCube: Unbounded and Controllable Dynamic 3D Driving Scene Generation with World-Guided Video Models [75.0] InfiniCubeはダイナミックな3次元駆動シーンを高忠実かつ制御性で生成するスケーラブルな方法である。
制御可能でリアルな3Dドライビングシーンを生成でき、モデルの有効性と優越性を広範囲にわたる実験により検証できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:32:20 GMT)
Retrieval-Augmented Machine Translation with Unstructured Knowledge [74.8] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を強化するために追加情報を導入する
機械翻訳(MT)では、従来の研究は通常、ペア化されたMTコーパスや知識グラフからコンテキスト内例を検索する。
本稿では,非構造化文書を用いた検索強化MTについて検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:00:32 GMT)
Evaluating Large Vision-and-Language Models on Children's Mathematical Olympiads [74.5] ジョイントビジョンとテキスト推論のためのAI能力の体系的分析は、現在の科学文献に欠けている。
我々は,子どものオリンピアードからのビジュオ言語問題を用いて,その数学的およびアルゴリズム的推論能力に基づいて,最先端のLVLMを評価した。
以上の結果から,近代のLVLMは,高学年の問題解決において,より強力な推論能力を示す一方で,幼児向けの問題に正しく答える基盤が欠如していることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:59:06 GMT)
Aya Expanse: Combining Research Breakthroughs for a New Multilingual Frontier [72.6] 8Bおよび32Bパラメータ多言語モデルの新世代であるAya Expanseモデルファミリを導入する。
Cohere For AIとCohereでの数年間の研究を活用することで、Aya Expanseは多言語パフォーマンスにおける新たな最先端技術を確立している。
Aya Expanse 8B と 32B が主要なオープンウェイトモデルより優れていることを示すために,23言語に翻訳された Arena-Hard-Auto データセットの評価を行った。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:41:06 GMT)
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think [72.5] 生成のための大規模拡散モデルの訓練における主要なボトルネックは、これらの表現を効果的に学習することにある。
本稿では,RePresentation Alignment (REPA) と呼ばれる単純な正規化を導入し,ノイズの多い入力隠れ状態の投影を,外部の事前学習された視覚エンコーダから得られるクリーンな画像表現と整合させる手法を提案する。
我々の単純な戦略は、一般的な拡散やDiTsやSiTsといったフローベースのトランスフォーマーに適用した場合、トレーニング効率と生成品質の両方に大きな改善をもたらす。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:39:22 GMT)
DiCoDe: Diffusion-Compressed Deep Tokens for Autoregressive Video Generation with Language Models [72.2] 自動回帰方式で言語モデルでビデオを生成する新しいアプローチであるDiCoDeを紹介する。
ビデオを時間的シーケンスとして扱うことで、DiCoDeは自動回帰生成のための言語モデルの能力を完全に活用する。
我々は,DiCoDeを定量的かつ質的に評価し,既存の手法と品質の両立性を実証した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:57:06 GMT)
AIpparel: A Large Multimodal Generative Model for Digital Garments [71.1] 縫製パターンの生成と編集のための大規模なマルチモーダルモデルであるAIpparelを紹介する。
当社のモデルでは,12万以上のユニークな衣服をカスタマイズした大規模データセット上で,最先端の大規模マルチモーダルモデルを微調整する。
本稿では,これらの複雑な縫製パターンを簡潔に符号化し,LLMが効率的に予測できる新しいトークン化手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:35:19 GMT)
Finding Transformer Circuits with Edge Pruning [71.1] 自動回路発見の効率的かつスケーラブルなソリューションとしてエッジプルーニングを提案する。
本手法は,従来の手法に比べてエッジ数の半分未満のGPT-2の回路を探索する。
その効率のおかげで、Edge PruningをCodeLlama-13Bにスケールしました。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:38:11 GMT)
Aguvis: Unified Pure Vision Agents for Autonomous GUI Interaction [69.6] 自律型GUIエージェントのための統合視覚ベースのフレームワークであるAguvisを紹介する。
提案手法は,画像に基づく観察と,自然言語の接地命令を視覚要素に活用する。
これまでの作業の限界に対処するため、モデル内に明確な計画と推論を統合する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:58:26 GMT)
LIME: Localized Image Editing via Attention Regularization in Diffusion Models [69.3] 本稿では拡散モデルにおける局所化画像編集のためのLIMEを提案する。
LIMEは、ユーザが指定した関心領域(RoI)や追加のテキスト入力を必要としない。
そこで本研究では,RoIにおける非関係なクロスアテンションスコアをデノナイジングステップ中にペナライズし,局所的な編集を確実にする新しいクロスアテンション正規化手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:05:55 GMT)
Enhancing Novel Object Detection via Cooperative Foundational Models [68.9] 本稿では,既存のクローズドセット検出器をオープンセット検出器に変換する新しい手法を提案する。
私たちは、新しいクラスに対して7.2$ textAP_50 のマージンで現在の最先端を越えています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:34:21 GMT)
Discriminative Fine-tuning of LVLMs [67.1] CLIPのような対照的に訓練された視覚言語モデル(VLM)は、識別的視覚言語表現学習の事実上のアプローチとなっている。
我々は,LVLMの識別的微調整のための新たな訓練手法である「両世界のベスト」を組み合わせることを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:54:27 GMT)
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction [67.1] そこで,Dual Point Maps (DualPM) では,同じ画像から一対の点マップを抽出し,一対の点マップをオブジェクト上の3D位置と関連付け,一対の点マップを静止時の標準バージョンに関連付ける。
3次元再構成と3次元ポーズ推定がDualPMの予測に比例することを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:48 GMT)
ActFusion: a Unified Diffusion Model for Action Segmentation and Anticipation [66.9] 時間的アクションセグメンテーションと長期的アクション予測は、ビデオにおけるアクションの時間的分析のための一般的なビジョンタスクである。
本稿では,アクトフュージョンと呼ばれる統合拡散モデルを用いて,アクションセグメンテーションとアクション予測という2つの課題に取り組む。
我々は,映像フレームの後半部分を見えないものとして隠蔽し,学習可能なトークンをこれらのフレームに置き換えて,目に見えない未来を予測する,新たな予測マスク戦略を導入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:12:35 GMT)
Moto: Latent Motion Token as the Bridging Language for Robot Manipulation [66.2] 我々はMotoを紹介する。Motoは、映像コンテンツをラテントモーションTokenizerでラテントモーションTokenシーケンスに変換する。
我々は、モーショントークンによるMoto-GPTの事前学習を行い、多様な視覚的動きの知識を捉えることができる。
実際のロボット動作に先立って学習した動きを転送するために、潜伏した動きのトークン予測と実際のロボット制御をシームレスにブリッジするコファインチューニング戦略を実装した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:57:04 GMT)
Enhancing and Accelerating Diffusion-Based Inverse Problem Solving through Measurements Optimization [66.2] textbfMeasurements textbfOptimization (MO)は,逆問題解決プロセスの各ステップで計測情報を統合するための,より効率的なプラグイン・アンド・プレイモジュールである。
MOを使用することで、複数のタスクにまたがる最新技術(SOTA)のパフォーマンスを確立することができ、大きな利点があります。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:44:18 GMT)
Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery [65.2] Generalized Category Discovery (GCD)は、既知のカテゴリと未知のカテゴリの両方からラベルのないデータをクラスタすることを目的としている。
現在のGCD法は、新しい視覚カテゴリーを発見する際に、人間の認知過程の多様性知覚性を無視する視覚的手がかりのみに依存している。
マルチモーダルなGCDを実現するための2段階のTextGCDフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:03:36 GMT)
A Stitch in Time Saves Nine: Small VLM is a Precise Guidance for Accelerating Large VLMs [65.0] 大規模視覚言語モデル(VLM)を加速するための有望なアプローチは、特定のレイヤからの注意マップのような部分的な情報を使用してトークンの重要性を評価し、重要度を低く抑えることである。
i) 重要な視覚的トークンを正確に識別するには,部分的注意情報は不十分であり,特に低トークン保持率において,最適なパフォーマンスをもたらす。 (ii) 全層に集約された注目マップのようなグローバルな注意情報は,より効果的に重要なトークンを保存し,攻撃的プルーニングの下で同等のパフォーマンスを維持する。 (iii) 小さなVLMから集約されたグローバルな注意マップは,大きなVLMとよく似ている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:52:31 GMT)
EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding [64.0] 3D占有予測は周囲のシーンを包括的に記述する。
既存のほとんどのメソッドは、1つか数つのビューからのオフラインの認識に焦点を当てている。
具体化された3次元占有予測タスクを定式化し,ガウスをベースとしたEmbodiedOccフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:57:09 GMT)
Facility Location Games with Scaling Effects [63.4] 古典的な施設配置問題を考慮し、各エージェントの個々のコスト関数が、スケーリング係数によって乗算された施設からの距離と等しくなる変動を考察する。
我々は,最適解の計算を記述し,総コストと最大コストの目標に焦点をあてる。
エージェントが単一話者の好みを持つことを保証するスケーリング関数の条件を特徴付ける。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:05:48 GMT)
MegaCOIN: Enhancing Medium-Grained Color Perception for Vision-Language Models [60.2] MegaCOINは、さまざまなコンテキスト属性を持つEmphrealイメージに基づいた、高品質な人間ラベル付きデータセットである。
MegaCOIN-Instructはビジョン言語モデルの教師付き微調整データセットとして機能し、MegaCOIN-BenchはスタンドアロンのQAデータセットとして使用できる注釈付きテストセットである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:06:17 GMT)
Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.5] 我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。
グループサンプリングを提案し、同じクラスのサンプルをグループに集める。
Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:33:52 GMT)
Towards Zero-shot 3D Anomaly Localization [58.6] 3DzALは3D異常検出とローカライゼーションのためのパッチレベルの新しいコントラスト学習フレームワークである。
3DzALは最先端の異常検出および局所化性能より優れていることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:25:27 GMT)
CREMA: Generalizable and Efficient Video-Language Reasoning via Multimodal Modular Fusion [58.2] CREMAは、ビデオ推論のための一般化可能、高効率、モジュラリティ融合フレームワークである。
本稿では,軽量核融合モジュールとモーダリティ・シークエンシャル・トレーニング・ストラテジーによって支援された,新しいプログレッシブ・マルチモーダル・フュージョン設計を提案する。
ビデオQA や Video-Audio/3D/Touch/Thermal QA を含む7つのビデオ言語推論タスクについて検証を行った。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:16:54 GMT)
3D Part Segmentation via Geometric Aggregation of 2D Visual Features [57.2] 監督された3D部分分割モデルは、固定されたオブジェクトと部品のセットに合わせて調整されており、それらの転送可能性は、オープンセットの現実世界のシナリオに制限される。
近年、視覚言語モデル(VLM)を多視点レンダリングとテキストプロンプトを用いてオブジェクト部品の識別に活用する研究が進められている。
これらの制約に対処するために,視覚概念から抽出した意味論と3次元幾何学をブレンドし,対象部品を効果的に同定するCOPSを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:27:58 GMT)
Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.7] オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:58:27 GMT)
MEMO: Memory-Guided Diffusion for Expressive Talking Video Generation [56.0] メモリ誘導EMO (Memory-guided EMOtion-aware diffusion) は、音声による映像を生成するエンドツーエンドのポートレートアニメーション手法である。
MEMOは、多様な画像とオーディオタイプ、全体的な品質、オーディオ-リップ同期、アイデンティティの整合性、表現-感情アライメントにおいて、よりリアルな会話ビデオを生成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:57:26 GMT)
BigDocs: An Open and Permissively-Licensed Dataset for Training Multimodal Models on Document and Code Tasks [55.6] 我々は,30タスクにわたる750万のマルチモーダルドキュメントからなる高品質なオープンアクセスデータセットであるBigDocs-7.5Mを紹介した。
BigDocs-Benchも導入しています。
実験の結果,BigDocs-Bench を用いたトレーニングでは,クローズドソース GPT-4o よりも平均性能が 25.8% 向上していることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:41:20 GMT)
Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction [55.6] 3Dセマンティック占有予測は、堅牢な視覚中心の自律運転において重要な課題である。
既存のほとんどの手法は、密度の高いグリッドベースのシーン表現を利用しており、運転シーンの空間的空間性を見渡している。
本稿では,各ガウス分布をその周辺領域の確率分布として解釈する確率論的ガウス重ね合わせモデルを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:59:58 GMT)
Learnable Infinite Taylor Gaussian for Dynamic View Rendering [55.4] 本稿では,ガウスの時間的進化をモデル化するための学習可能なテイラー式に基づく新しいアプローチを提案する。
提案手法は,本領域における最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:03:37 GMT)
Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding [55.3] Calib3Dは3Dシーン理解モデルの信頼性をベンチマークし精査する先駆的な試みである。
10の異なる3Dデータセットにまたがる28の最先端モデルを総合的に評価する。
本稿では,3次元モデルのキャリブレーション向上を目的とした,深度対応のスケーリング手法であるDeptSを紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:33:29 GMT)
Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation [54.2] Divotは拡散駆動型ビデオトケナイザである。
我々は、ビデオからテキストへの自己回帰とテキストからビデオへの生成を通じてDivot-unaVicを提示する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:53:04 GMT)
INRetouch: Context Aware Implicit Neural Representation for Photography Retouching [54.2] 本稿では、プロの編集から前後のイメージペアを通して学習する新しいリタッチ転送手法を提案する。
我々は,画像の内容とコンテキストに基づいて,適応的に編集を適用することを学習する文脈認識型インプシットニューラル表現を開発した。
提案手法は,写真再構成における既存の手法を超越するだけでなく,画像再構成タスクの性能向上にも寄与する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:31:48 GMT)
Unsupervised Denoising for Signal-Dependent and Row-Correlated Imaging Noise [54.0] 本稿では,行関連や信号依存の撮像ノイズを処理できる,教師なしのディープラーニングベースデノイザについて紹介する。
提案手法では,特殊設計の自己回帰デコーダを備えた変分オートエンコーダを用いる。
本手法では,事前学習した雑音モデルを必要としないため,雑音のないデータを用いてスクラッチから訓練することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:04:59 GMT)
EgoPlan-Bench2: A Benchmark for Multimodal Large Language Model Planning in Real-World Scenarios [53.3] EgoPlan-Bench2は,MLLMの計画能力を評価するためのベンチマークである。
我々は,21の競争的MLLMを評価し,その限界を詳細に分析した結果,実世界の計画において大きな課題に直面していることが明らかとなった。
EgoPlan-Bench2におけるGPT-4Vの10.24倍の性能向上を図る。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:57:23 GMT)
VisionZip: Longer is Better but Not Necessary in Vision Language Models [53.2] 近年の視覚言語モデルの進歩は、視覚トークンの長さを増大させることで性能を向上している。
CLIPやSigLIPのような一般的なビジョンエンコーダによって生成されるビジュアルトークンには、かなりの冗長性が含まれている。
言語モデルに入力するための情報トークンのセットを選択する方法であるVisionZipを紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:53 GMT)
A Complexity-Based Theory of Compositionality [53.0] AIでは、構成表現は配布外一般化の強力な形式を可能にすることができる。
ここでは、構成性に関する直観を考慮し、拡張する構成性の公式な定義を提案する。
この定義は概念的には単純で量的であり、アルゴリズム情報理論に基礎を置いており、あらゆる表現に適用できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:20:28 GMT)
VMGuard: Reputation-Based Incentive Mechanism for Poisoning Attack Detection in Vehicular Metaverse [52.6] 車両メタバースガード(VMGuard)は、車両メタバースシステムをデータ中毒攻撃から保護する。
VMGuardは、参加するSIoTデバイスの信頼性を評価するために、評判に基づくインセンティブメカニズムを実装している。
当社のシステムは,従来は誤分類されていた信頼性の高いSIoTデバイスが,今後の市場ラウンドへの参加を禁止していないことを保証します。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:08:20 GMT)
LoRA-Ensemble: Efficient Uncertainty Modelling for Self-attention Networks [52.5] 本稿では,自己注意ネットワークのためのパラメータ効率の高いディープアンサンブル手法であるLoRA-Ensembleを紹介する。
全メンバー間で重みを共有できる1つの事前学習型自己注意ネットワークを利用することで、注意投影のために、メンバー固有の低ランク行列を訓練する。
提案手法は明示的なアンサンブルよりも優れたキャリブレーションを示し,様々な予測タスクやデータセットに対して類似あるいは良好な精度を実現する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:23:13 GMT)
GP-FL: Model-Based Hessian Estimation for Second-Order Over-the-Air Federated Learning [52.3] 2次法は学習アルゴリズムの収束率を改善するために広く採用されている。
本稿では,無線チャネルに適した新しい2次FLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:27:41 GMT)
Identity-Preserving Text-to-Video Generation by Frequency Decomposition [52.2] アイデンティティ保存型テキスト・ツー・ビデオ(IPT2V)生成は、一貫した人間のアイデンティティを持つ高忠実度ビデオを作成することを目的としている。
本稿では,PT2Vの技術フロンティアを,文献で未解決の2つの方向に推し進める。
本研究では,DiTをベースとした制御可能なPT2VモデルであるConsisIDを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:54:00 GMT)
Graph-Sequential Alignment and Uniformity: Toward Enhanced Recommendation Systems [51.7] 我々のフレームワークはグラフニューラルネットワーク(GNN)ベースのシーケンシャルレコメンデータを別個のサブモジュールとして使用し、同時に最適化された統合埋め込み空間を共同で共有する。
3つの実世界のデータセットの実験により、提案手法はどちらのアプローチも単独で大幅に性能が向上することを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:59:05 GMT)
Hipandas: Hyperspectral Image Joint Denoising and Super-Resolution by Image Fusion with the Panchromatic Image [51.3] 最近打ち上げられた衛星は、HSIとパンクロマティック(PAN)画像の同時取得が可能になった。
Hipandasは、ノイズの多い低分解能HSIと高分解能PAN画像からHRHS画像を再構成する新しい学習パラダイムである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:39:29 GMT)
Align3R: Aligned Monocular Depth Estimation for Dynamic Videos [50.3] 動的ビデオの時間的一貫した深度マップを推定するために,Align3Rと呼ばれる新しいビデオ深度推定法を提案する。
我々のキーとなる考え方は、最近のDUSt3Rモデルを用いて、異なる時間ステップの単分子深度マップを整列させることである。
実験により、Align3Rは一貫したビデオ深度を推定し、カメラはベースライン法よりも優れた性能を持つ単眼ビデオのポーズを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:16:07 GMT)
SciFIBench: Benchmarking Large Multimodal Models for Scientific Figure Interpretation [50.1] SciFIBenchは、2000の質問を8つのカテゴリに分けた科学的図形解釈ベンチマークである。
質問はarXiv紙のフィギュアとキャプションからキュレートされ、相手のフィルターを使ってハードネガティブを見つけ、品質管理のための人間による検証を行う。
我々はSciFIBench上で28LMMを評価し、これは挑戦的なベンチマークであることが判明した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:52:49 GMT)
EditScout: Locating Forged Regions from Diffusion-based Edited Images with Multimodal LLM [50.1] 本稿では,多モーダル大規模言語モデルを統合した新しいフレームワークを提案する。
我々のフレームワークはMagicBrush、AutoSplice、PerfBrushデータセットの有望な結果を達成する。
特に,本手法は,これまで目に見えなかった種類の編集を特徴とする自己構築型テストセットであるPerfBrushデータセットを最適化する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:05:33 GMT)
Decoupling of External and Internal Dynamics in Driven Two-level Systems [50.0] レーザー駆動の2レベル系を、各状態の外部自由度にのみ作用する方程式の集合に分解する方法を示す。
我々は、時間依存減衰を持つ古典振動子に訴えることにより、この問題の解法を特徴づける方法を提供する。
運動場位相のチャープは、デチューニング演算子の力学のエレンフェスト/平均値部分を補償する手段として自然に現れることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:42:56 GMT)
ToolEyes: Fine-Grained Evaluation for Tool Learning Capabilities of Large Language Models in Real-world Scenarios [49.3] 本稿では,大規模言語モデルのツール学習能力を評価するためのシステムであるToolEyesを提案する。
このシステムは7つの現実シナリオを慎重に分析し、ツール学習においてLLMに不可欠な5次元を解析する。
ToolEyesには,約600のツールを備えたツールライブラリが組み込まれている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:05:59 GMT)
Third quantization with Hartree approximation for open-system bosonic transport [49.2] 定常状態における弱い相互作用を持つ開系ボソニックリンドブラッド方程式を解くための自己整合形式論を提案する。
本手法により, コールド原子実験に関連する相互作用ボゾン系における量子輸送の大規模系の挙動を解析し, 予測することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:50:17 GMT)
Pathwise optimization for bridge-type estimators and its applications [49.2] パスワイズ法は、ペナライズされた推定器の完全な経路を効率的に計算することができる。
これらのアルゴリズムを離散時間で観測されたプロセスのペナル化推定に適用する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:38:29 GMT)
If You Can't Use Them, Recycle Them: Optimizing Merging at Scale Mitigates Performance Tradeoffs [49.0] さまざまなタスク間のトレードオフを示すチェックポイントをテキスト化することで、大規模な(sim100$B)モデルをマージすることを検討します。
我々のアルゴリズムは各チェックポイントの重みを線形結合で調整し、その結果パレート最適モデルが得られる。
さらに分析したところ、良いマージはゼロでない重みを持つほぼ全てのチェックポイントを含む傾向を示し、一見して悪い初期チェックポイントでさえ良い最終マージに寄与することを示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:12:51 GMT)
Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers [48.7] 直接画像からグラフへの変換は、1つのモデルで物体の検出と関係予測を解くことを伴う課題である。
このタスクの複雑さのため、多くのドメインで大規模なトレーニングデータセットはまれであり、ディープラーニングメソッドのトレーニングを困難にしている。
画像-グラフ変換器のクロスドメインおよびクロス次元学習を可能にする一連の手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:19:47 GMT)
SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model [48.5] ソーシャルメディア上で共有される合成画像は、広範囲の聴衆を誤解させ、デジタルコンテンツに対する信頼を損なう可能性がある。
ソーシャルメディア画像検出データセット(SID-Set)を紹介する。
本稿では,SIDA という画像深度検出,局所化,説明の枠組みを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:12:25 GMT)
What Do Machine Learning Researchers Mean by "Reproducible"? [47.9] 我々は,コミュニティ全体で示される「再現性」の範囲を明確にしようとする。
これらの領域には「再現性」を自称しない作品が多数含まれている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:04:39 GMT)
Limit Theorems for Stochastic Gradient Descent with Infinite Variance [47.9] この勾配降下アルゴリズムは、適切なL'evy過程によって駆動されるオルンシュタイン-ルンシュタイン過程の定常分布として特徴付けられることを示す。
また、これらの結果の線形回帰モデルおよびロジスティック回帰モデルへの応用についても検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:03:34 GMT)
HybridGS: Decoupling Transients and Statics with 2D and 3D Gaussian Splatting [47.7] 画像ごとの過渡的対象に対して2次元ガウスアンを用いて,ハイブリッドGSと呼ばれる新しいハイブリッド表現を提案する。
また、ロバストなトレーニングと高品質なビュー合成を実現するために、単純かつ効果的なマルチステージトレーニング戦略を提案する。
ベンチマークデータセットを用いた実験は、室内および屋外の両方のシーンにおいて、新しいビュー合成の最先端性能を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:20:35 GMT)
Grounding Descriptions in Images informs Zero-Shot Visual Recognition [47.7] 我々は,表現を細かなレベルと粗いレベルの両方で同時に調整することを目的とした,新しい事前学習戦略であるGRAINを提案する。
我々は,現在の最先端技術と比較して,モデルのゼロショット性能の向上を実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:52:00 GMT)
Exploring Real&Synthetic Dataset and Linear Attention in Image Restoration [47.3] Image Restorationは、特にCNNやTransformersなどのディープラーニングによって、劣化したイメージを復元し、パフォーマンスを向上させることを目的としている。
トレーニングとテストデータセット間の画像複雑性のバイアスを特定し、復元品質に影響を及ぼした。
我々はReSynを作った。ReSynは、リアル画像や合成画像を含む、複雑さのバランスのとれた大規模なIRデータセットだ。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:11:51 GMT)
Hierarchical Multi-Agent DRL Based Dynamic Cluster Reconfiguration for UAV Mobility Management [46.8] マルチコネクション性には、分散アクセスポイント(AP)間の動的クラスタ形成と、これらのAPからのリソース割り当ての調整が含まれる。
本研究では,エネルギー効率のよい動的クラスタ再構成を用いた無人航空機(UAV)の移動性管理手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:20:42 GMT)
Learning Symmetries via Weight-Sharing with Doubly Stochastic Tensors [46.6] グループ平等は、ディープラーニングにおいて価値ある帰納的バイアスとして現れてきた。
群同変法は、利害の群を事前に知る必要がある。
データセットが強い対称性を示すと、置換行列は正規群表現に収束することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:15:34 GMT)
Marco-LLM: Bridging Languages via Massive Multilingual Training for Cross-Lingual Enhancement [45.7] Marco-LLM:多言語多言語学習による多言語化
我々は、複数の低リソース言語に対して、かなりの量の多言語データを収集した。
Marco-LLMは最先端のLLMよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:26:58 GMT)
Evolutionary Pre-Prompt Optimization for Mathematical Reasoning [45.5] 本稿では,実効的なチェーン・オブ・フォー・プレプロンプトの設計におけるサンプル選択の最適化について検討する。
アルゴリズムの選択は、通常、進化的計算のような比較に基づく手法に有利であり、有効性と実現可能性を大幅に向上させることを示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:12:06 GMT)
Transferring self-supervised pre-trained models for SHM data anomaly detection with scarce labeled data [45.0] 自己指導型学習(SSL)は、教師なしの事前学習と教師なしの微調整を組み合わせた新興パラダイムである。
SSL技術によりデータ異常検出性能が向上し、従来の教師付きトレーニングに比べてF1スコアが向上した。
本研究は、大規模SHMデータに対するSSL技術の有効性と優位性を示し、ラベル情報の少ない予備異常検出のための効率的なツールを提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:25:30 GMT)
Mixture of Latent Experts Using Tensor Products [44.8] マルチタスク学習では、従来の手法では複数のタスクでモデルを同時にトレーニングする。
モジュール型言語モデルが肯定的伝達と体系的一般化を促進できるかどうかを検討する。
具体的には、パラメータ効率とニュアンス付きルーティング手法のバランスをとる新しいモジュラー言語モデル(textttTensorPoly)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:03:06 GMT)
Using Diffusion Priors for Video Amodal Segmentation [44.4] 本稿では,映像生成モデルにおける基礎知識を活かして,条件生成タスクとして定式化することで,ビデオアモーダルセグメンテーションに取り組むことを提案する。
提案手法は単純で,対象物のモーダルマスクフレームの列と文脈的擬似深度マップを条件にこれらのモデルを再構成する。
続いてコンテントコンプリートステージが、オブジェクトの隠された領域にペンキを塗ることができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:30:40 GMT)
MC-LLaVA: Multi-Concept Personalized Vision-Language Model [44.3] 現在の視覚言語モデル(VLM)は、視覚的質問応答を含む様々なタスクにまたがる例外的な能力を示している。
本稿では,MC-LLaVA と呼ばれるマルチコンセプトパーソナライズ手法と高品質なマルチコンセプトパーソナライズデータセットを提案する。
我々は、MC-LLaVAが印象的なマルチコンセプトパーソナライズされた応答を達成できることを実証するために、総合的な質的、定量的な実験を行う。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:27:22 GMT)
A Survey on Large Language Model-Based Social Agents in Game-Theoretic Scenarios [44.0] ゲーム理論のシナリオは、Large Language Model(LLM)ベースのソーシャルエージェントの社会的インテリジェンスを評価する上で重要なものとなっている。
本調査では,研究成果をゲームフレームワーク,ソーシャルエージェント,評価プロトコルの3つのコアコンポーネントにまとめる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:46:46 GMT)
Four-Plane Factorized Video Autoencoders [44.0] 本稿では,入力サイズと直交的に成長する4平面の因数分解潜在空間にデータを投影するオートエンコーダを提案する。
提案した4面ラテント空間は高忠実度再構成に必要なリッチな表現を保っていることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:58:17 GMT)
The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities [43.6] 異なる言語における意味論的に等価な入力に対するモデル表現は中間層で類似していることを示す。
この空間は、ロジットレンズを介してモデルの主要な事前学習言語を使って解釈することができる。
1つのデータ型における共有表現空間の介入は、他のデータ型におけるモデル出力にも予測可能に影響を与える。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:57:50 GMT)
Solving High-dimensional Inverse Problems Using Amortized Likelihood-free Inference with Noisy and Incomplete Data [43.4] 本研究では,高次元逆問題に対する正規化フローに基づく新しい確率確率逆転法を提案する。
提案手法は,データ圧縮のための要約ネットワークとパラメータ推定のための推論ネットワークの2つの補完ネットワークから構成される。
提案手法を地下水水文学における逆問題に適用し, 系の対流電界の後方分布を推定する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:13:17 GMT)
Sharper Guarantees for Learning Neural Network Classifiers with Gradient Methods [43.3] 本研究では,スムーズなアクティベーションを有するニューラルネットワークに対する勾配法におけるデータ依存収束と一般化挙動について検討する。
我々の結果は、よく確立されたRadecher複雑性に基づく境界の欠点を改善した。
XOR分布の分類において、NTK体制の結果に対して大きなステップサイズが大幅に改善されることが示されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:14:47 GMT)
SCMM: Calibrating Cross-modal Representations for Text-Based Person Search [43.2] テキスト・ベース・パーソナリティ・サーチ(TBPS)は,大規模ギャラリーから対象人物の正確な検索を可能にする重要なタスクである。
クロスモーダルTBPSタスクでは、共通埋め込み空間において、よく分散された表現を得ることが重要である。
本稿では,Sew and Masked Modeling (SCMM) という手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:55:34 GMT)
AL-QASIDA: Analyzing LLM Quality and Accuracy Systematically in Dialectal Arabic [43.0] 方言アラビア(DA)の品種は、言語技術、特に大きな言語モデル(LLM)によって不足している。
モデリングDAにおけるLCMの忠実度, 理解, 品質, 地質学を包括的に評価する手法を提案する。
評価の結果, LLMはDAを生成せず, 品質劣化を示唆しないことがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:33:00 GMT)
(Blind) Users Really Do Heed Aural Telephone Scam Warnings [42.9] 本研究は,視覚障害者(n=36)と視覚障害者(n=36)の2つの集団が,自然主義的環境下での聴覚的電話詐欺警告にどのように反応するかを考察する。
我々は,電話詐欺警告の音声版を開発し,その内容に先行するベースライン(警告なし),ショート警告,コンテキスト警告の3つの条件でテストした。
法的に盲目と視力のある参加者の両方が、文脈上の警告を強力な使用可能なセキュリティ手段として見出した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:47:38 GMT)
Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models [42.9] デコーダのみの変換器をベースとした大規模言語モデル(LLM)は、優れたテキスト理解能力を示している。
LLMの能力をフル活用するための新しいフレームワークを提案する。
さらに, LLM-Infused Diffusion Transformer (LI-DiT) を設計した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:06:09 GMT)
LocalSR: Image Super-Resolution in Local Region [42.9] 低解像度画像の局所領域のみを復元する新しいタスクであるLocalSRを提案する。
当社のアプローチは、低複雑性を減らし、この地域にのみ焦点を絞った変種よりも優れています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:30:54 GMT)
QUEEN: QUantized Efficient ENcoding of Dynamic Gaussians for Streaming Free-viewpoint Videos [42.6] オンライン無料視点ビデオ(FVV)ストリーミングは、比較的未調査の課題である。
本稿では,3次元ガウス演算を用いたFVVストリーミングのためのQUantized and Efficient ENcodingのための新しいフレームワークを提案する。
さらに,ガウス位置以外の残差を効果的に定量化するための学習された潜在復号器を含む量子化スパーリティフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:55 GMT)
Jointly Modeling Inter- & Intra-Modality Dependencies for Multi-modal Learning [42.2] 我々は、モーダリティ間の依存にのみ依存する従来のアプローチは、一般的に最適ではないかもしれないと論じる。
モーダリティ間の依存を捕捉・統合する言語間・モダリティ間モデリング(I2M2)フレームワークを提案する。
現実の医療と最先端のモデルを用いたビジョン・アンド・ザ・アーティカルなデータセットを用いて、我々のアプローチを評価する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:41:27 GMT)
Interacting Dirac fields in an expanding universe: dynamical condensates and particle production [41.9] この研究は、拡大するフリードマン・ロバートソン・ウォーカー宇宙におけるディラックフェルミオンの自己相互作用場理論に焦点を当てている。
我々は、非自明な凝縮がどのように発生し、さらに重要なことは、そのリアルタイム進化が粒子生成に与える影響について研究する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:11:32 GMT)
Scaling Laws for Post Training Quantized Large Language Models [41.8] 良く訓練された大言語モデル(LLM)の一般化能力は、モデルサイズの関数として予測可能であることが知られている。
後処理後圧縮後のLCMの品質は予測不可能であり,ケースバイケースの検証が必要となることが多い。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:22:33 GMT)
Style-Friendly SNR Sampler for Style-Driven Generation [41.6] 参照画像による微調整は最も有望な手法であるが、しばしば事前訓練に使用する目標と雑音レベルの分布を盲目的に利用する。
本研究では,SNR分布を微調整時に高雑音レベルに積極的にシフトさせるSNRサンプリング器を提案する。
これにより、モデルは独自のスタイルをキャプチャし、より高いスタイルアライメントで画像を生成することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:19:59 GMT)
What should a neuron aim for? Designing local objective functions based on information theory [41.4] バイオインスパイアされた局所学習目標を設計することで、自己組織化された人工ニューロンをどのように達成できるかを示す。
これらの目標は、情報理論の最近の拡張である部分情報分解を用いてパラメータ化される。
我々の研究は、地域学習戦略の原則的情報理論の基礎を推進している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:50:40 GMT)
Semantic Retrieval at Walmart [41.2] 本稿では,従来の逆インデックスと埋め込み型ニューラル検索を組み合わせた,ウォルマートに展開するEコマース検索のハイブリッドシステムを提案する。
本システムは,オフライン・オンライン両方の評価によって,検索エンジンの関連性を大幅に改善した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:10:58 GMT)
Multi-Subject Image Synthesis as a Generative Prior for Single-Subject PET Image Reconstruction [40.3] 信号対雑音比を改良した多彩でリアルな擬似PET画像の合成法を提案する。
単目的PET画像再構成において, 擬似PET画像が生成前駆体としてどのように利用されるかを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:40:33 GMT)
Likelihood-Scheduled Score-Based Generative Modeling for Fully 3D PET Image Reconstruction [40.3] 提案手法は, 再現を加速し, 臨界ハイパーパラメータの数を減少させる3次元再構成の実践的手法である。
本手法は既存のSGMによるPET再構成のNAMSEとSSIMに適合または改善可能であることを示す。
実3次元PETデータ、具体的には[18$F]DPA-714データに対するSGMベースの再構成の実装を初めて紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:58:45 GMT)
Generative-Model-Based Fully 3D PET Image Reconstruction by Conditional Diffusion Sampling [40.3] 我々は、全数参照脳画像に基づいてSGMを訓練し、SGMベースの再構成を極めて少ない回数で行えるように方法論を拡張した。
次に、1%カウントデータの複数の独立実現のための再構成を行い、その手法のバイアス特性と分散特性を分析する。
我々は,本手法の性能を実測値と実測値のPETデータで評価し,従来のOSEMおよびMAP-EMベースラインと比較した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:35:43 GMT)
IF-MDM: Implicit Face Motion Diffusion Model for High-Fidelity Realtime Talking Head Generation [40.3] Implicit Face Motion Diffusion Model (IF-MDM) は、人間の顔を顔にエンコードする暗黙の動作を用いて、顔の表情を圧縮した顔にエンコードする。
IF-MDMは、毎秒45フレーム(fps)の512x512解像度ビデオのリアルタイム生成をサポートする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:20:48 GMT)
Methodology for Online Estimation of Rheological Parameters in Polymer Melts Using Deep Learning and Microfluidics [40.1] 本研究では, 深層学習, モデリング, シミュレーションを統合し, マイクロ流体システムの設計を強化する。
シミュレーションから生成された合成データを用いて,高分子溶融のレオロジーパラメータを同定する深層学習モデルを訓練する。
マイクロ流体のレオロジー推定の精度と柔軟性を向上させることにより,マイクロ流体デバイスの設計と試験を高速化する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:11:04 GMT)
Learning on Model Weights using Tree Experts [39.9] 入力として他のネットワークを使用するニューラルネットワークのトレーニング方法を示す。
ProbeXは、単一のモデル層の重みから学ぶために特別に設計された最初のプローブ手法である。
本稿では,モデルのトレーニングデータセットのカテゴリを重みのみに基づいて予測することで,ProbeXの有効性を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:50:24 GMT)
A minimal tensor network beyond free fermions [39.8] この研究は、古典統計スピン系とフェルミオン系の間の双対性を拡張する最小モデルを提案する。
二次元テンソルネットワークに適用されたジョルダン・ウィグナー変換は、古典的な統計力学モデルの分割和をグラスマン変数積分に写す。
結果として得られるモデルは単純で、スピンスピン相互作用を規定するパラメータと、自由フェルミオン極限からの偏差を測定するパラメータの2つのみを特徴とする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:49:39 GMT)
Reconstruction of boosted and resolved multi-Higgs-boson events with symmetry-preserving attention networks [39.8] 我々はSPA-Netアプローチに一般化を導入し、強化と解決された再構築可能性の両方を同時に検討する。
SPA-Net法によりヒッグス粒子再構築の純度は57~62%向上した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:24:52 GMT)
Mask-Adapter: The Devil is in the Masks for Open-Vocabulary Segmentation [39.7] オープン語彙セグメンテーションにおいてこれらの課題に対処するための単純かつ効果的な手法であるMask-Adapterを導入する。
提案手法では,提案マスクを直接使用するのに対し,提案マスクから意味的アクティベーションマップを抽出する。
Mask-Adapterは、マスクプーリングをプラグ・アンド・プレイ方式で、オープン語彙セグメンテーション手法にシームレスに統合する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:42:37 GMT)
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes [39.7] 本研究では,3次元ガウス・スプラッティングシーンに2次元画像特徴をアップリフトする新しい手法を提案する。
本手法は,グラフ拡散機構により拡張された,よりシンプルで効率的な特徴集約手法を用いる。
CLIP機能に適用すると、オープン語彙、言語に基づくオブジェクト検出タスクにおいて、強い性能を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:34:11 GMT)
Data-Driven, Parameterized Reduced-order Models for Predicting Distortion in Metal 3D Printing [39.6] 本研究では, レーザ粉層融合(LPBF)における歪み予測のためのデータ駆動型パラメータ化低次モデル(ROM)を提案する。
本稿では,正規直交分解(POD)とガウスプロセス回帰(GPR)を組み合わせたROMフレームワークを提案し,その性能をディープラーニングに基づくパラメータ化グラフ畳み込みオートエンコーダ(GCA)と比較する。
POD-GPRモデルは高い精度を示し、pm0.001mm$以内の歪みを予測し、約1800倍の計算速度を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:47:25 GMT)
Unified Framework for Open-World Compositional Zero-shot Learning [39.5] Open-World Composal Zero-Shot Learning (OW-CZSL)は、既知のプリミティブやエンティティの新規な構成を認識するという課題に対処する。
推論段階における全ての可能な構成の徹底的な探索に伴う計算負担を軽減することを目的とした,新しいモジュールを提案する。
提案モデルでは、3つのデータセットでOW-CZSLの最先端性を達成し、2つのデータセットでLLVM(Large Vision Language Models)を上回ります。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:36:37 GMT)
Dual-Branch Subpixel-Guided Network for Hyperspectral Image Classification [39.1] 本稿では、高スペクトル画像(HSI)分類のための新しいデュアルブランチサブピクセル誘導ネットワークDSNetを提案する。
ディープオートエンコーダアンミックスアーキテクチャを導入することで、サブピクセル情報と畳み込みクラス機能を自動的に統合する。
3つのベンチマークデータセットの実験結果は、最先端のDLベースのHSI分類手法と比較してDSNetの有効性と優位性を示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:03:09 GMT)
Modeling Eye Gaze Velocity Trajectories using GANs with Spectral Loss for Enhanced Fidelity [39.0] 本研究では、LSTMおよびCNNジェネレータを用いたGANフレームワークを導入し、高忠実な合成視線速度軌道を生成する。
スペクトル正則化の導入は、眼球運動のスペクトル特性を再現するGANの能力を著しく向上させる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:23:40 GMT)
A Little Goes a Long Way: Efficient Long Context Training and Inference with Partial Contexts [38.9] LongGenは、事前訓練されたLLMを、長さ拡張中に効率的なアーキテクチャに微調整する。
LongGenはトレーニングのスピードアップを1.55倍にし、フルアテンションベースラインに比べてウォールタイム時間を36%短縮する。
推論中、LongGenはKVキャッシュメモリを62%削減し、1.67倍のプリフィルスピードアップと1.41倍のデコードスピードアップを達成した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:52:42 GMT)
VersaTune: An Efficient Data Composition Framework for Training Multi-Capability LLMs [38.7] VersaTuneは、トレーニング中の大規模言語モデルのマルチビリティパフォーマンスを向上させるために設計された、新しいデータ合成フレームワークである。
我々は、知識を法律、医学、金融、科学、法典など、異なる領域に分類する。
VersaTuneは、包括的なマルチドメインタスクの35.21%の強化により、マルチドメインパフォーマンスの大幅な改善を実現している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:48:32 GMT)
Training MLPs on Graphs without Supervision [38.6] グラフ学習のための自己教師型フレームワークであるSimMLPを紹介する。
SimMLPは、最適の場合において、GNNと等価性を達成できる最初の学習方法である。
我々は、相互情報と帰納バイアスに基づいて、SimMLPとGNNの等価性を示す包括的な理論的分析を行う。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:20:54 GMT)
AI4EF: Artificial Intelligence for Energy Efficiency in the Building Sector [38.5] AI4EFは、エネルギーの適合性と効率の最適化を構築するための意思決定をサポートするために設計された、高度なユーザー中心のツールである。
AI4EFは機械学習(ML)とデータ駆動の洞察を活用し、利害関係者がエネルギー消費、再適合コスト、環境影響をモデル化し、分析し、予測することを可能にする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:36:39 GMT)
LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors [38.5] 階層化されたコンテンツ生成はグラフィックデザイン、アニメーション、デジタルアートといった創造的な分野に不可欠である。
本稿では,2層画像を生成する遅延拡散モデル(LDM)に基づく新しい画像生成パイプラインを提案する。
ベースライン法と比較して,視覚的コヒーレンス,画像品質,レイヤの整合性に大きな改善が見られた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:18 GMT)
ONER: Online Experience Replay for Incremental Anomaly Detection [38.3] エンド・ツー・エンドのオンライン体験再生手法であるONERを提案する。
ONERは、最小のコストで新しいタスクに適応しながら、破滅的な忘れを効果的に軽減する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:26:32 GMT)
Communication Compression for Distributed Learning without Control Variates [38.2] Compressed Aggregate Feedback (CAFe)は、高度に圧縮可能なクライアント更新を可能にする、分散学習フレームワークである。
CAFeは直接圧縮で分散学習を一貫して上回り、CAFeによるクライアント更新の圧縮性を強調している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:46:20 GMT)
Pre-train, Align, and Disentangle: Empowering Sequential Recommendation with Large Language Models [38.2] シーケンシャルレコメンデーション(SR)は、ユーザの歴史的インタラクションにおけるシーケンシャルな依存関係をモデル化して、その進化する関心をよりよく捉えることを目的としている。
既存のSRアプローチはコラボレーティブデータに依存しており、コールドスタート問題や準最適性能などの制限につながる。
我々は,大規模言語モデルを用いた推薦モデルを強化するために,新しい事前訓練,アライン,ディケンタングル(PAD)パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:17:56 GMT)
Stereo Anywhere: Robust Zero-Shot Deep Stereo Matching Even Where Either Stereo or Mono Fail [37.9] 我々はStereo Anywhereを紹介した。これは、幾何学的制約と単眼深度視覚基礎モデル(VFM)の頑健な先行性を組み合わせた新しいステレオマッチングフレームワークである。
合成専用学習モデルでは, ゼロショットの一般化が実現し, 既存の解よりも優れていた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:58 GMT)
From Code to Play: Benchmarking Program Search for Games Using Large Language Models [37.6] 大規模言語モデル(LLM)は、プログラムコードを生成するのに素晴らしい能力を示している。
本研究は,多種多様なゲームアプリケーションにおいて,使用可能なコードを直接合成するLLMの可能性を探るものである。
我々は、初期プログラムの突然変異と種子がLSMによって制御される進化的ヒルクライミングアルゴリズムを用いる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:50:58 GMT)
Designing LLM Chains by Adapting Techniques from Crowdsourcing Workflows [37.6] LLMチェインは、作業を一連のサブタスクに分解することで複雑なタスクを可能にする。
クラウドソーシングは、ヒューマンエラーに対するクラウドソーシングと同様のエラーに対処する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:03:37 GMT)
Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering [37.5] ニューラルネットワークや3Dガウスアンを使わずにスパースボクセル上に放射化処理を組み込んだ効率的な放射場レンダリングアルゴリズムを提案する。
我々は、シーン内の様々な詳細レベルにスパースボクセルを適応的に適合させ、高いレンダリングフレームレートを達成しながら詳細を忠実に再現する。
提案手法は,4db以上のPSNRと10倍以上のFPS高速化により,従来の神経フリーなボクセルグリッド表現を改善した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:11 GMT)
Efficiently Learning at Test-Time: Active Fine-Tuning of LLMs [37.0] 本稿では,モデル応答の不確実性を低減するために設計されたデータ選択アルゴリズムSIFTを紹介する。
SIFTは計算オーバーヘッドを最小限に抑えながら、常に最近傍の検索より優れていることを示す。
我々は、Nearest Neighbor検索のドロップイン代替として使用できる$textttactiveft$ライブラリを提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:40:16 GMT)
Text-Tuple-Table: Towards Information Integration in Text-to-Table Generation via Global Tuple Extraction [36.9] リアルタイムのコメンタリーテキストに基づいたコンペの要約表を生成するためのベンチマークデータセットであるLiveSumを紹介する。
我々は,このタスクにおける最先端の大規模言語モデルの性能を,微調整とゼロショットの両方で評価する。
さらに、パフォーマンスを改善するために、$T3$(Text-Tuple-Table)と呼ばれる新しいパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:02:59 GMT)
A Noise is Worth Diffusion Guidance [36.9] 現在の拡散モデルは、ガイダンスなしで信頼できる画像を生成するのに苦労している。
本稿では,誘導手法を初期雑音の1つの改善に置き換える新しい手法を提案する。
我々のノイズ除去モデルは、効率的なノイズ空間学習を活用し、50Kのテキストイメージペアで高速収束と強力な性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:09:56 GMT)
M$^{3}$D: A Multimodal, Multilingual and Multitask Dataset for Grounded Document-level Information Extraction [36.5] 我々はM$3$Dというマルチモーダル多言語マルチタスクデータセットを構築した。
ペア化された文書レベルのテキストとビデオを含み、マルチモーダル情報を豊かにする。
広く使われている2つの言語、すなわち英語と中国語をサポートしている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:00:58 GMT)
Enhancing Mathematical Reasoning in LLMs with Background Operators [36.1] 問題固有の述語と、背景演算子から派生した中間述語を含むPrologソリューションを開発した。
効率的なデータ拡張のために、K-foldクロスバリデード自己学習を適用する。
実験の結果,5倍の自己学習が新しい正確なProlog解を効果的に同定できることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:24:54 GMT)
Quantized Hall drift in a frequency-encoded photonic Chern insulator [36.1] 時間的変調によって時間反転が明確に破られるHaldaneモデルから着想を得たフォトニックチャーン絶縁体を実験的に実現した。
その結果、周波数多重光システムにおいて、位相的に保護された光の一方向輸送を利用するための扉が開かれた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:07:40 GMT)
Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis [35.8] Infinity(インフィニティ)は、高解像度のフォトリアリスティック画像を生成することができるビットワイズビジュアルオートレグレッシブ・モデリングである。
我々は、無限語彙トークン化器と分類器とビットワイズ自己補正機構を用いて、ビットワイズトークン予測フレームワークの下で視覚自己回帰モデルを再定義する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:53:02 GMT)
Harmonic Mobile Manipulation [35.8] HarmonicMMはナビゲーションと操作の両方を最適化するエンドツーエンドの学習手法である。
私たちのコントリビューションには、モバイル操作のための新しいベンチマークと、RGBの視覚的観察のみによるデプロイメントの成功が含まれています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:36:32 GMT)
Versatile Optical Ground Station for Satellite-based Quantum Key Distribution in Abu Dhabi [34.8] TIIは、自由空間光通信のためのアブダビ量子地上局(ADQOGS)の開発を行っている。
このシステムは、ダウンリンクビーコンは600nmから1560nm、アップリンクビーコンは1530nmから1610nmまで、複数の波長を扱うことができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:59:24 GMT)
Adversarial Attacks on Large Language Models in Medicine [34.2] 医療アプリケーションへの大型言語モデルの統合により、医療診断、治療勧告、患者医療の進歩が期待できる。
LLMの敵対的攻撃に対する感受性は重大な脅威となり、繊細な医学的文脈で有害な結果をもたらす可能性がある。
本研究では,3つの医療課題における2種類の敵攻撃に対するLDMの脆弱性について検討した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:47:30 GMT)
Monet: Mixture of Monosemantic Experts for Transformers [33.8] トランスフォーマー(Monet)アーキテクチャのためのモノセマンティックエキスパート(Mixture of Monosemantic Experts)を紹介する。
Monetはスパース辞書学習を直接エンドツーエンドのMixture-of-Expertsプリトレーニングに組み込む。
本分析は,専門家間の知識の相互排他性を示し,各専門家にカプセル化されたパラメトリック知識を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:06:03 GMT)
Extractive Structures Learned in Pretraining Enable Generalization on Finetuned Facts [33.8] 事前訓練された言語モデル(LM)は、それらが微調整されている事実の含意を一般化することができる。
本稿では、この一般化を実現するために、LMのコンポーネントがどのように協調するかを記述するためのフレームワークとして、抽出構造を紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:00:46 GMT)
Cybench: A Framework for Evaluating Cybersecurity Capabilities and Risks of Language Models [33.2] Cybenchは、サイバーセキュリティタスクを特定し、それらのタスク上でエージェントを評価するためのフレームワークである。
4つの異なるCTFコンペティションから、40のプロフェッショナルレベルのCapture the Flag(CTF)タスクが含まれています。
GPT-4o, OpenAI o1-preview, Claude 3 Opus, Claude 3.5 Sonnet, Mixtral 8x22b Instruct, Gemini 1.5 Pro, Llama 3 70B Chat, Llama 3.1 405B Instruct。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:46:36 GMT)
Reducing Tool Hallucination via Reliability Alignment [32.7] 大きな言語モデル(LLM)は、ツールコールを通じて外部システムと対話する言語生成を超えて、その能力を拡張した。
本稿では,信頼度の高いツールコールの概念を考察し,ツールの幻覚に対処する必要性を強調した。
本稿では,信頼性を重視したアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:10:54 GMT)
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation [32.6] Swift KVは、プロンプトトークン処理の時間とコストを削減するために設計されたモデル変換および蒸留手順である。
これはプリフィルの計算要求を50%削減し、KVキャッシュのメモリ要求を62.5%削減する。
16ビット精度でLlama-3.1-70Bの16Kトークン/sに変換する通常の推論スループットの560 TFlops/GPUを実現することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:56:56 GMT)
How language models extrapolate outside the training data: A case study in Textualized Gridworld [32.5] 我々は、次のトークン予測や思考の微調整を含む従来の手法は、より大きな、目に見えない環境では外挿できないことを示す。
人間の心的表現をシミュレートする新しいCoTフレームワークであるパス計画のための認知マップを提案する。
言語モデルにおける汎用認知地図の開発について,これらの認知地図が専門的な学習手法を必要とすることを知ると,重要な疑問が浮き彫りになる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:50:25 GMT)
Closed-Loop Supervised Fine-Tuning of Tokenized Traffic Models [32.5] トークン化されたマルチエージェントポリシーは、最近、交通シミュレーションの最先端となっている。
それらは通常、オープンループのビヘイビアクローンによって訓練される。
簡単なクローズドループ微調整戦略であるTop-K(CAT-K)のロールアウトについて述べる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:00:21 GMT)
Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis [32.5] 大規模言語モデルのアンラーニングは、セキュリティとプライバシの懸念に対処する可能性から、注目を集めている。
この研究の多くは、機密コンテンツを含む事前定義されたインスタンスの削除を対象とする、インスタンスレベルの未学習に集中している。
本稿では,対象モデルからエンティティ関連知識を完全に消去することを目的とした,エンティティレベルのアンラーニングという新しいタスクを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:13:09 GMT)
Pinco: Position-induced Consistent Adapter for Diffusion Transformer in Foreground-conditioned Inpainting [32.0] ピンコ (Pinco) は、テキストアライメントの優れた高品質な背景を生成する、前景条件の塗装アダプターである。
本手法は, 前景塗装における優れた性能と効率性を実現する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:08:19 GMT)
Image Privacy Protection: A Survey [32.0] 画像は、重要なコミュニケーション媒体として機能し、キーポイントの迅速な理解を容易にする視覚的に係わるフォーマットで情報を提示する。
適切に管理されていない場合、この情報は個人的利益のために搾取に脆弱であり、プライバシー権やその他の法的権利を侵害する可能性がある。
既存のレビューは特定のシナリオによって分類されるか、特定のプライバシー目的によって分類される傾向がある。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:09:25 GMT)
SEAL: Semantic Attention Learning for Long Video Representation [32.0] 本稿では,長編ビデオの新たな統一表現であるセマンティック・アテンション・ラーニング(SEAL)を紹介する。
計算複雑性を低減するために、長いビデオは3つの異なるタイプのセマンティックエンティティに分解される。
私たちの表現は多目的であり、様々な長いビデオ理解タスクにまたがるアプリケーションを可能にします。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:39:06 GMT)
DynMF: Neural Motion Factorization for Real-time Dynamic View Synthesis with 3D Gaussian Splatting [31.8] 動的シーンの点当たりの運動は、明示的あるいは学習的な軌跡の小さなセットに分解することができると論じる。
我々の表現は解釈可能であり、効率的であり、複雑な動的シーンの動きのリアルタイムなビュー合成を提供するのに十分な表現力を持っている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:09:46 GMT)
Disentangled Representation Learning for Causal Inference with Instruments [31.7] 既存のIVに基づく推定器は、システム内に2つ以上のIVが存在するなど、既知のIVまたは他の強い仮定を必要とする。
本稿では,変数がプロキシであるかを知らずに,システム内にIVプロキシが存在すると仮定する緩和要求について考察する。
本稿では,変分オートエンコーダ(VAE)を用いた不整合表現学習手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:18:48 GMT)
RMD: A Simple Baseline for More General Human Motion Generation via Training-free Retrieval-Augmented Motion Diffuse [31.5] モーション生成はデータセットの多様性とスケールによって制約され、配布外のシナリオを扱う能力を制限する。
本稿では,検索拡張技術による動き生成の一般化を促進させる,シンプルで効果的なベースライン RMD を提案する。
トレーニングなしでは、RDDは最先端のパフォーマンスを達成でき、アウト・オブ・ディストリビューションデータに顕著な利点がある。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:01:09 GMT)
Final-Model-Only Data Attribution with a Unifying View of Gradient-Based Methods [30.8] トレーニングデータ属性(TDA)は、トレーニングデータの要素にモデルの振る舞いを帰属させるタスクである。
本稿では,最終学習モデルにのみアクセス可能な共通環境に注目した。
本稿では,適切な調整と平均化を施したさらなるトレーニングを提案し,トレーニングインスタンスに対する与えられたモデルの感度を計測する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:24:26 GMT)
ControlFace: Harnessing Facial Parametric Control for Face Rigging [30.4] フレキシブルで高忠実な制御を可能にする3DMMレンダリングに条件付けされた新しい顔リグ手法であるControlFaceを導入する。
ひとつはFaceNetと呼ばれ、アイデンティティと詳細をキャプチャし、もうひとつは生成に焦点を当てています。
顔ビデオデータセットをトレーニングすることで、FaceNetのリッチな表現を完全に活用し、コントロールの順守を確保します。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:35:16 GMT)
SceneDiffuser: Efficient and Controllable Driving Simulation Initialization and Rollout [30.1] 現実的でインタラクティブなシーンシミュレーションは、自動運転車(AV)開発の鍵となる前提条件である。
本稿では,交通シミュレーションに先立って設計されたシーンレベルの拡散であるSceneDiffuserを紹介する。
新たな拡散復調パラダイムは、将来のシミュレーションステップに対して復調する計算コストを補正する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:06:53 GMT)
Dockformer: A transformer-based molecular docking paradigm for large-scale virtual screening [29.9] ディープラーニングアルゴリズムは、ドッキングプロセスのスピードを高めるために、データ駆動リサーチと開発モデルを提供することができる。
本研究では,Dockformerという,ディープラーニングに基づくドッキング手法を紹介する。
実験の結果、DockformerはPDBbindコアセットとPoseBustersベンチマークでそれぞれ90.53%と82.71%の成功率を達成した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:56:30 GMT)
Dynamic Graph Transformer with Correlated Spatial-Temporal Positional Encoding [29.8] ポアソンポイントの弱い仮定の下でパラメータフリーな個人化された相互作用強度推定を符号化する。
7つの大規模データセットと2つの大規模データセットの実験は、提案したCorDGTの優れた性能とスケーラビリティを示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:15:01 GMT)
Memories are One-to-Many Mapping Alleviators in Talking Face Generation [29.4] 対話型顔生成は、入力音声によって駆動される対象者の写実的映像像を生成することを目的としている。
本稿では,失われた情報を暗黙記憶と明示記憶で補完するMemFaceを提案する。
実験結果から,提案したMemFaceは,複数のシナリオにまたがる最先端のすべての結果を上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:52:25 GMT)
Safeguarding Text-to-Image Generation via Inference-Time Prompt-Noise Optimization [29.4] テキスト・ツー・イメージ(T2I)拡散モデルはテキスト・プロンプトに基づいて高品質で多様な画像を生成する能力で広く認識されている。
T2Iモデルの不適切な画像生成を防ぐための現在の取り組みは、バイパスが容易であり、敵の攻撃に対して脆弱である。
本稿では,PNO(Prompt-Noise Optimization)と呼ばれる,安全でない画像生成を緩和する新しい学習不要手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:12:30 GMT)
GRAM: Generalization in Deep RL with a Robust Adaptation Module [29.3] 本研究では,深層強化学習における動的一般化の枠組みを提案する。
本稿では,分散環境と分散環境の両方を識別・反応する機構を提供するロバスト適応モジュールを提案する。
我々のアルゴリズムであるGRAMは,展開時の分布内および分布外シナリオにまたがる強力な一般化性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:39:01 GMT)
Differentially Private Synthetic Data via Foundation Model APIs 1: Images [29.3] この問題を解決するために,PE(Private Evolution)と呼ばれる新しいフレームワークを提案する。
PEは、モデルトレーニングなしで、最先端のSOTA(State-of-the-art)メソッドと一致させることができる。
例えば、CIFAR10では、プライバシコストのエプシロン=0.67でFID = 7.9を達成し、以前のSOTAをエプシロン=32から大幅に改善します。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:43:25 GMT)
Linear Causal Representation Learning from Unknown Multi-node Interventions [29.2] 十分に多様な介入環境が与えられれば、祖先への識別はソフトな介入だけで可能であることが確立された。
注目すべきは、これらの保証はより制限的な単一ノードの介入において最もよく知られた結果と一致することである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:16:26 GMT)
A Context-aware Framework for Translation-mediated Conversations [29.2] 本稿では,バイリンガルな会話設定に文脈情報を組み込むことで,大規模言語モデルに基づく翻訳システムを改善する枠組みを提案する。
当社のフレームワークの両コンポーネントを,2つのタスク指向ドメイン – ユーザチャットとユーザ-アシストインタラクション – で検証する。
我々のフレームワークは、GPT-4o や TowerInstruct のような最先端のシステムよりも優れた翻訳結果をもたらす。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:41:05 GMT)
PaintScene4D: Consistent 4D Scene Generation from Text Prompts [29.1] PaintScene4Dは、新しいテキストから4Dのシーン生成フレームワークである。
さまざまな現実世界のデータセットでトレーニングされたビデオ生成モデルを活用する。
任意の軌道から見ることができるリアルな4Dシーンを生成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:57 GMT)
UniVAD: A Training-free Unified Model for Few-shot Visual Anomaly Detection [29.0] 本稿では,様々な領域にまたがる異常を検出できるVAD法であるUniVADを提案する。
UniVADは、これまで見つからなかったオブジェクトの異常を検出するために、テスト中の参照として通常のサンプルをほとんど必要としない。
産業、論理、医療の分野にまたがる9つのデータセットの実験を行い、UniVADが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:31:40 GMT)
DEIM: DETR with Improved Matching for Fast Convergence [28.2] 我々は,Transformer-based architectures (DETR) を用いたリアルタイムオブジェクト検出における収束の促進を目的としたトレーニングフレームワークDEIMを紹介する。
DETRモデルにおける1対1(O2O)マッチングに固有のスパース監督を緩和するため、DEIMはDense O2Oマッチング戦略を採用している。
Dense O2Oマッチングはコンバージェンスを高速化する一方、パフォーマンスに影響を与える可能性のある低品質のマッチも多数導入されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:10:13 GMT)
Complexity of Vector-valued Prediction: From Linear Models to Stochastic Convex Optimization [27.3] 凸とリプシッツ損失関数の基本的な場合に焦点を当てる。
本稿では,この問題の複雑さと関連する学習モデルとの関連性に光を当てた,いくつかの新たな理論的結果を示す。
結果は,ベクトル値線形予測の設定を,広範に研究されている2つの異なる学習モデル間のブリッジングとして表現した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:56:54 GMT)
Samudra: An AI Global Ocean Emulator for Climate [27.2] 我々は、最先端の気候モデルにおける海洋成分の巧妙なグローバルエミュレータを構築した。
マルチディープスレベルの海洋データに基づいてトレーニングされた改良型ConvXNet UNetアーキテクチャを使用する。
海洋エミュレータ - Samudra は, 海洋変数の深さ構造と年次変動を再現できることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:25:34 GMT)
Quantum Circuits for partial differential equations via Schrödingerisation [26.7] 一般PDEのための量子アルゴリズムをSchr"オーダライゼーション手法を用いて実装する。
本稿では, 熱方程式の例と, 風上スキームで近似した対流方程式について述べる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:40:24 GMT)
Learning for Layered Safety-Critical Control with Predictive Control Barrier Functions [26.7] 制御障壁関数(CBF)を利用する安全フィルタは、複雑なシステム上での安全な動作を強制するのに非常に効果的である。
RoMとFoMのギャップは、安全違反を引き起こす可能性がある。
本稿では,FoMのロールアウトを活用して予測ロバスト性項を定義することで,このギャップに対処する固有CBFを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:05:25 GMT)
HyperFLINT: Hypernetwork-based Flow Estimation and Temporal Interpolation for Scientific Ensemble Visualization [26.5] HyperFLINTは、流れ場を推定し、時間的に補間し、アンサンブルデータにおけるパラメータ空間探索を容易にする、新しいディープラーニングベースのアプローチである。
一連の実験では、HyperFLINTのフロー場推定性能が大幅に向上し、パラメータ空間探索が可能になった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:01:20 GMT)
DeiSAM: Segment Anything with Deictic Prompting [26.4] DeiSAMは、大きなトレーニング済みニューラルネットワークと微分可能な論理推論器の組み合わせである。
オブジェクトを論理的に推論された画像領域にマッチングすることで、オブジェクトをセグメント化する。
実験の結果,DeiSAMは純粋にデータ駆動ベースラインよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:15:34 GMT)
Online Adversarial Knowledge Distillation for Graph Neural Networks [25.9] 畳み込みニューラルネットワーク(CNN)におけるモデルの一般化を促進するための知識蒸留
本稿では,一群のグラフニューラルネットワークを学習するためのオンライン逆蒸留手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:35:33 GMT)
Action-based image editing guided by human instructions [25.7] 本稿では,アクションテキストの指示に敏感な新しいモデルを提案する。
アクションベースのテキスト命令と高い推論機能を用いた画像編集の大幅な改善を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:01:41 GMT)
Hidden in the Noise: Two-Stage Robust Watermarking for Images [25.7] 拡散モデルの初期雑音に基づく画像の歪みのない透かし手法を提案する。
透かしを検出するには、画像のために再構成された初期ノイズと、以前に使用した初期ノイズとを比較する必要がある。
本稿では,効率的な検出を行うための2段階の透かしフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:50:42 GMT)
Bayes-Nash Generative Privacy Protection Against Membership Inference Attacks [24.3] 本稿では,プライバシ保護をディフェンダーとアタッカーのベイズゲームとしてモデル化するゲーム理論フレームワークを提案する。
ベイズ・ナッシュ生成プライバシ(BNGP)戦略は、被告の好みに合わせて最適なプライバシーユーティリティトレードオフを実現する。
バイナリデータセット要約統計学のケーススタディでは、BNGPがLRTベースの攻撃よりも優れていることが示されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:14:04 GMT)
Assessing and Learning Alignment of Unimodal Vision and Language Models [24.3] 本稿では,線形探索にインスパイアされた直接評価手法を提案し,視覚言語アライメントの評価を行う。
次に、下流の視覚言語タスクのために、トレーニング済みのアンモダルビジョンと言語モデルを調整する効率的なトランスファー学習フレームワークであるSwift Alignment of Image and Language(SAIL)を紹介します。
SAILはImageNet(vs.CLIPの72.7%)で73.4%のゼロショット精度を実現し、ゼロショット検索、複雑な推論、セマンティックセグメンテーションに優れる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:04:58 GMT)
Frequency-Adaptive Low-Latency Object Detection Using Events and Frames [23.8] オブジェクト検出のためのFusing EventsとRGBイメージは、悪環境におけるEvent Cameraの堅牢性を活用する。
2つの重要なミスマッチ:低遅延イベント textitvs.high-latency RGB frame と時間的にスパースなラベル。
textbfFrequency-textbfAdaptive Low-Latency textbfObject textbfDetector (FAOD)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:23:06 GMT)
LL-ICM: Image Compression for Low-level Machine Vision via Large Vision-Language Model [23.6] 画像復元モデルのような低レベル(LL)マシンビジョンモデルは、そのような品質を改善するのに役立つ。
LLマシンビジョンタスク,すなわちLL-ICMのための先駆的なICMフレームワークを提案する。
LL-ICMは最先端手法よりも22.65%のBDレート削減が可能である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:12:45 GMT)
Improving LLM Group Fairness on Tabular Data via In-Context Learning [23.5] 大規模言語モデル(LLM)は、グループフェアネスを満たす予測、すなわち、グループ間で平等な結果を生成するのに失敗する。
本研究では,グループフェアネスを改善するための4つの経験的アプローチについて検討する。
本研究では,これらの手法が全体の性能を高く保ちながら,人口密度の向上に有効であることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:23:30 GMT)
CrossSDF: 3D Reconstruction of Thin Structures From Cross-Sections [23.4] 方法とは,平面輪郭から発生する2次元符号距離から3次元符号距離場を抽出する手法である。
提案手法は, 従来の手法よりも大幅に改善され, 薄型構造を効果的に再構築し, 正確な3次元モデルを生成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:38:18 GMT)
SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small Models [23.2] 教師付き微調整のための効率的でスケーラブルなデータ選択手法を提案する。
S2Lは数学的な問題解決のために,SFTのデータ効率を著しく向上させることを示した。
また,S2Lは対象モデルよりも40倍小さい参照モデルを用いてデータ選択を行うことができることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:47:47 GMT)
Efficient Task Grouping Through Samplewise Optimisation Landscape Analysis [23.2] 本稿では,既存の手法の圧倒的な計算要求を削減するための効率的なタスクグループ化フレームワークを提案する。
グラフベースのクラスタリングアルゴリズムを用いて、最適タスク群をピンポイントする。
8つの異なるデータセットで実施された実証的な評価は、提案フレームワークの有効性を強調している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:33:59 GMT)
CLIP-FSAC++: Few-Shot Anomaly Classification with Anomaly Descriptor Based on CLIP [22.9] 筆者らは,CLIP-FSAC++と呼ばれる一段階の訓練を施した効果的な数ショット異常分類フレームワークを提案する。
異常記述子では、画像からテキストへのクロスアテンションモジュールを使用して、画像固有のテキスト埋め込みを得る。
その結果,VisAおよびMVTEC-ADを1, 2, 4, 8ショット設定で非正規ショット異常分類し,本手法の総合的な評価実験を行った。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:44:45 GMT)
Early Dementia Detection Using Multiple Spontaneous Speech Prompts: The PROCESS Challenge [22.8] 自発音声(PROCESS)信号処理グランドチャレンジによる認知低下の予測と認識は、参加者が早期認知症検出に集中するよう促す。
我々は,この課題に対する新たな自然発話コーパスを提供する。
ベースラインモデルでは, 分類タスクのF1スコア55.0%, 回帰タスクのRMSE2.98が達成された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:05:46 GMT)
Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation [22.7] Hunyuan3D-1.0はテキストおよび画像条件生成をサポートする2段階のアプローチである。
最初の段階では、約4秒で効率よくマルチビューRGBを生成するマルチビュー拡散モデルを用いる。
第2段階では、3Dアセットを迅速かつ忠実に再構築するフィードフォワード再構築モデルを導入する。
我々のフレームワークは、Hunyuan-DiTというテキスト・ツー・イメージ・モデルで、テキスト・コンディショニングとイメージ・コンディショニングの両方をサポートする統一的なフレームワークである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:29:51 GMT)
SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation [22.7] 画像からビデオへ生成する方法は、印象的な、写真リアリスティックな品質を実現した。
オブジェクトの動きやカメラの動きなど、生成されたビデオの特定の要素を調整することは、しばしば試行錯誤の面倒なプロセスである。
本稿では,自己誘導画像生成のためのフレームワークを提案する。
我々のゼロショット法は教師なしベースラインよりも優れており、教師付きモデルでパフォーマンスギャップを狭めている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:08:20 GMT)
ELSA: Evaluating Localization of Social Activities in Urban Streets using Open-Vocabulary Detection [22.4] 本稿では,社会活動のローカライゼーションを評価するELSAについて紹介する。
重なり合う予測における意味的一貫性を評価するため,新しい信頼度スコア計算手法であるNLSEと,新しい動的ボックス集約(DBA)アルゴリズムを導入する。
我々は,広く使用されているSOTAモデルであるGrounding DINO, Detic, OWL, MDETRについて報告する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:25:56 GMT)
Remaining-data-free Machine Unlearning by Suppressing Sample Contribution [22.3] 非学習モデルは、トレーニングプロセスに忘れたデータが関与せず、したがって再学習されたモデルに寄与しない、再学習されたモデルにアプローチすべきである。
本稿では, MU-Mis (Machine Unlearning by Minimize input sensitivity) を提案する。
残余データのない手法が、残余データを利用する最先端の未学習手法より優れているのは、これが初めてである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:45:32 GMT)
MIND: Effective Incorrect Assignment Detection through a Multi-Modal Structure-Enhanced Language Model [22.1] 百万規模のWhoIsWhoベンチマークを構築する際に、10%以上の論文著者の割り当てが修正される。
誤った代入を検出する既存の取り組みは、セマンティックベースまたはグラフベースのアプローチである。
本稿では,グラフベースの手法から重要な構造的特徴と,リッチペーパー属性からのきめ細かい意味的特徴を組み合わせ,不正確な代入を検出する構造強化言語モデルを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:12:53 GMT)
Quest: Query-centric Data Synthesis Approach for Long-context Scaling of Large Language Model [22.1] Questはクエリ中心のデータメソッドで、セマンティックに関連があるが多様なドキュメントを集約する。
生成モデルを使用して、ドキュメント毎の潜在的なクエリを予測し、同様のクエリとキーワードでドキュメントをグループ化する。
実験では、Questの長文タスクにおける優れたパフォーマンスを示し、最大100万トークンのコンテキスト長で顕著な結果が得られる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:56:35 GMT)
ELEMENT: Episodic and Lifelong Exploration via Maximum Entropy [21.6] EmphEpisodic and Lifelong Exploration via ENTropy (ELement)は、多スケールで本質的に動機付けられた強化学習フレームワークである。
本稿では, 理論上界に対する最適解を提供する, エピソードエントロピーの固有報酬として, エピソード状態エントロピーを提案する。
我々は、エピソードと生涯のセットアップの両方において、最先端の内在的な報酬を著しく上回っている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:42:13 GMT)
Socially-Informed Reconstruction for Pedestrian Trajectory Forecasting [21.4] 条件付き変分オートエンコーダに基づく軌道予測モジュールとともに再構成器を用いるモデルを提案する。
このモジュールは擬似トラジェクトリを生成し、トレーニングプロセス全体を通して拡張として使用します。
このモデルをさらに社会意識に導くために,より安定した軌道予測を支援する新たな社会的損失を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:54:06 GMT)
The Effect of Personalization in FedProx: A Fine-grained Analysis on Statistical Accuracy and Communication Efficiency [21.2] FedProxは正規化によるパーソナライズを可能にする計算学習手法である。
我々は、FedProxが純粋なローカルトレーニングを上回り、イミニマックス最適統計率を達成する方法を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:58:20 GMT)
Elements of Sequential Monte Carlo [21.1] 統計学と機械学習の主な問題は、確率分布と予測を計算することである。
主な課題は、これらの難解な期待を近似することである。
シーケンシャルモンテカルロ (Sequence Monte Carlo, SMC) は、近似推論のためのランダムサンプリングに基づく手法のクラスである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:41:31 GMT)
GenMAC: Compositional Text-to-Video Generation with Multi-Agent Collaboration [21.0] コンポジションテキスト・ビデオ生成を可能にする反復型マルチエージェントフレームワークであるGenMACを提案する。
コラボレーションワークフローには、Design、Generation、Redesignの3つのステージが含まれている。
コンポジションテキスト・ビデオ生成の多様なシナリオに対処するために,各シナリオに特化している修正エージェントのコレクションから適切な修正エージェントを適応的に選択するセルフルーティング機構を設計する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:56:05 GMT)
SAT-HMR: Real-Time Multi-Person 3D Mesh Estimation via Scale-Adaptive Tokens [20.7] 一つのRGB画像からリアルタイムなマルチパーソン3次元メッシュ推定を行うための一段階フレームワークを提案する。
画像中の個々の相対スケールに基づいて動的に調整されるスケール適応トークンを導入する。
実験の結果,提案手法は計算コストを大幅に削減しつつ,高分解能処理の精度を保っていることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:18:04 GMT)
REL: Working out is all you need [20.7] 我々はOpenAIのO1モデルが、明らかに人間的な方法で問題解決にアプローチしていることを観察する。
これらの洗練された推論機能は、他の最先端の言語モデルでは特に欠落している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:32:01 GMT)
PEMF-VVTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm [20.4] Video Virtual Try-onは、ソースパーソンビデオ内のセマンティックに整列した試着領域に衣料イメージを流用することを目的としている。
以前の手法では、インペイントマスクを利用して、元のビデオの原着を除去していた。
新たなPEMF-VVTO(PEMF-VVTO)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:57:24 GMT)
Marrying Causal Representation Learning with Dynamical Systems for Science [20.4] 因果表現学習は、生の絡み合った測定から隠れた因果変数に因果モデルを拡張することを約束する。
本稿では,2つの仮定とそれらの重要な仮定との間に明確な関係を描いている。
我々は、より下流のタスクに対して、軌跡固有のパラメータを分離する制御可能なモデルを明示的に学習する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:03:55 GMT)
Integrated Sensing and Communications for Low-Altitude Economy: A Deep Reinforcement Learning Approach [20.4] 低高度経済(LAE)のための統合センシング・通信(ISAC)システムについて検討する。
所定の飛行期間における通信総和レートは、GBSとUAVの軌道でのビームフォーミングを共同最適化することにより最大化する。
本稿では, 深部強化学習(DRL)技術を活用して, 深部LAE-ISAC(Deep LAE-ISAC)と呼ばれる新しいLEE指向ISAC方式を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:12:46 GMT)
Deep Implicit Optimization enables Robust Learnable Features for Deformable Image Registration [20.3] 既存のDLIR(Deep Learning in Image Registration)メソッドは、最適化をディープネットワークの層として明示的に組み込むものではない。
提案手法は,ディープネットワークの層として最適化を明示的に取り入れることで,統計的学習と最適化のギャップを埋めることを示す。
我々のフレームワークは、ドメイン内のデータセットで優れたパフォーマンスを示し、ドメインシフトに依存しない。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:26:30 GMT)
4D SlingBAG: spatial-temporal coupled Gaussian ball for large-scale dynamic 3D photoacoustic iterative reconstruction [20.3] 本研究では,ガウス球適応成長(4D SlingBAG)アルゴリズムという新しい手法を提案する。
本手法は点雲の各ガウス球面に時空間結合変形関数を適用し,動的3次元PAシーンの変形特性を明示的に学習する。
フレーム毎にSlingBAGアルゴリズムを個別に使用することにより再構成を行うのに比べ,計算時間を大幅に削減し,メモリ消費を極端に低減する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:15:26 GMT)
Semantic Consistency-Based Uncertainty Quantification for Factuality in Radiology Report Generation [20.2] 生成医療ビジョン大言語モデル(VLLM)は幻覚を起こしやすく、不正確な診断情報を生成できる。
報告レベルと文レベルの不確実性の両方を提供するセマンティック一貫性に基づく不確実性定量化フレームワークを新たに導入する。
高不確実性レポートを控えることで、私たちのアプローチは事実性スコアを10ドル%改善し、20ドル%のレポートを拒否します。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:43:39 GMT)
Graph Neural Networks Need Cluster-Normalize-Activate Modules [19.9] グラフニューラルネットワーク(GNN)は、グラフ構造化データの非ユークリッドディープラーニングモデルである。
本稿では,CNA(Cluster-Normalize-Activate)という3つのステップからなるプラグアンドプレイモジュールを提案する。
CNAはノード分類とプロパティ予測タスクにおける最先端の精度を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:59:20 GMT)
Intriguing Properties of Robust Classification [19.9] 非現実的な大量のデータでのみ、ロバストな一般化が可能であることを示す。
CIFAR-10のようなデータセット上で,ロバストな分類器がいかに一般化するかを考察する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:27:39 GMT)
Show, Don't Tell: Uncovering Implicit Character Portrayal using LLMs [19.8] LIIPA(LIIPA)は,大きな言語モデルに暗黙的文字の描写を明らかにするためのフレームワークである。
LIIPAは既存の手法よりも優れており,文字数の増加に対してより堅牢であることがわかった。
我々の研究は、複雑な文字を解析するためにLLMを使うことの潜在的な利点を実証している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:46:53 GMT)
FG-MDM: Towards Zero-Shot Human Motion Generation via ChatGPT-Refined Descriptions [19.7] ゼロショットモーション生成のためのFG-MDM(Fin-Grained Human Motion Diffusion Model)という新しいフレームワークを提案する。
具体的には、まず従来の曖昧なテキストアノテーションを、異なる身体部分のきめ細かい記述にパースする。
FG-MDMは、動きの本質に近い記述のため、オリジナルのデータセットの範囲を超えて人間の動きを生成することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:19:26 GMT)
ShapeCraft: Body-Aware and Semantics-Aware 3D Object Design [19.5] 本稿では,ベースメッシュから身体を意識した3Dオブジェクトを合成する手法を提案する。
生成されたオブジェクトは、仮想文字でシミュレートしたり、現実世界での使用のために製造することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:41:34 GMT)
ZipAR: Accelerating Autoregressive Image Generation through Spatial Locality [19.5] ZipARは、自動回帰(AR)ビジュアル生成のためのトレーニング不要でプラグ&プレイの並列デコーディングフレームワークである。
ZipARは、追加の再トレーニングを必要とせずに、Emu3-Genモデルでモデル転送回数を最大91%削減できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:57:08 GMT)
Exploring RAG-based Vulnerability Augmentation with LLMs [19.5] VulScribeRは、慎重にキュレートされたプロンプトテンプレートを利用して脆弱なデータセットを拡張する新しいソリューションである。
我々のアプローチでは、VulgenとVGXの2つのSOTAメソッドを破り、Random Oversampling(ROS)を27.48%、27.93%、f1スコアで15.41%、平均5Kで弱いサンプルを生成した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 00:00:18 GMT)
HoPE: A Novel Positional Encoding Without Long-Term Decay for Enhanced Context Awareness and Extrapolation [19.4] 位置符号化(PE)は、長く続く帰納的意見に基づいて、長期的な腐敗を示すように設計されている。
我々は、LLMがコンテキスト内情報の正確な検索を要求するタスクに適用されるようになったため、LLMの時代において長期の崩壊は時代遅れであると主張している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:09:27 GMT)
Providing Differential Privacy for Federated Learning Over Wireless: A Cross-layer Framework [19.4] Federated Learning(FL)は、エッジデバイスがローカルなトレーニングデータを維持することができる分散機械学習フレームワークである。
本稿では,分散化された動的電力制御により差分プライバシ(DP)を改善するOTA-FLの無線物理層(PHY)設計を提案する。
この適応は、異なる学習アルゴリズム間で設計の柔軟性と有効性を示しながら、プライバシに強く重点を置いています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:27:09 GMT)
Instructional Video Generation [19.3] 本稿では,命令型ビデオ生成のための新しい手法を提案する。
まず,視覚的コンテキストとアクションテキストの両方でガイドされる動き領域の自動生成手法を提案する。
第二に、拡散モデルがスムーズで一貫したポーズに焦点を合わせるために、臨界手構造損失を導入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:29:10 GMT)
HeatFormer: A Neural Optimizer for Multiview Human Mesh Recovery [19.2] 本稿では,複数の静的なビューをフル活用可能な,人間の形状とポーズの復元手法を提案する。
マルチビュー画像のSMPLパラメータを反復的に洗練するニューラルパラメータであるHeatFormerでこれを実現する。
HeatFormerは、このSMPL推定を、新しいトランスフォーマーエンコーダとデコーダとのアライメントとして実現している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:00 GMT)
Educational-Psychological Dialogue Robot Based on Multi-Agent Collaboration [19.2] 本稿では,教育的・心理的カウンセリング機能を組み合わせたインテリジェントな対話システムを提案する。
このシステムは、セキュリティ検出エージェント、意図識別エージェント、教育用LLMエージェント、心理的LLMエージェントを含む複数のAIエージェントから構成される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:27:02 GMT)
Privacy-Preserving in Medical Image Analysis: A Review of Methods and Applications [19.1] レビューでは、医療画像分析におけるプライバシー保護技術の概要を概観している。
暗号化、差分プライバシー、同型暗号化、フェデレーション学習、および生成的敵ネットワークが含まれる。
診断,病理学,遠隔医療など,様々な医療画像解析タスクにおけるこれらの手法の適用について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:56:06 GMT)
Adaptive Optimizers with Sparse Group Lasso for Neural Networks in CTR Prediction [19.1] 深層学習における適応の族にスパース群ラッソの正規化子を追加する新しいフレームワークを開発する。
理論的に凸な設定では,収束保証が確立される。
提案手法は, 極めて優れた性能, 高い競争性能を達成できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:11:50 GMT)
p-MoD: Building Mixture-of-Depths MLLMs via Progressive Ratio Decay [19.0] そこで我々は,Mixture-of-Depths (MoD) 機構を利用して,効率的なマルチモーダル大言語モデル(MLLM)を構築することを提案する。
我々は、Tanh-gateweight normalization (TanhNorm) と symmetric token reweighting (STRing) の2つの新しい設計でMoDモジュールを適応する。
我々のモデルであるp-MoDは、ベースラインモデルの性能にマッチまたは超え、推論時に55.6%のTFLOPと53.8%のKVキャッシュストレージ、トレーニング時に77.7%のGPU時間しか持たない。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:58:03 GMT)
Concept Based Continuous Prompts for Interpretable Text Classification [18.8] 本稿では、連続的なプロンプトを人間可読な概念に分解して解釈する枠組みを提案する。
我々は、GPT-4oを用いて概念プールを生成し、差別的で代表的な潜在的候補概念を選択する。
実験により,本フレームワークは従来のPチューニングや単語ベースアプローチと同じような結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:49:37 GMT)
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts [18.7] T2I-FactualBench - 知識集約型概念生成の事実性を評価するために設計された概念とプロンプトの数で、これまでで最大のベンチマークである。
T2I-FactualBenchは、個々の知識概念の基本記憶から、複数の知識概念のより複雑な構成まで、三段階の知識集約型テキスト・画像生成フレームワークで構成されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:21:01 GMT)
VGGHeads: 3D Multi Head Alignment with a Large-Scale Synthetic Dataset [18.6] 本稿では,人間の頭部検出と3次元メッシュ推定のための拡散モデルを用いた大規模合成データセットを提案する。
私たちのデータセットは100万以上の高解像度画像で構成されており、それぞれに詳細な3Dヘッドメッシュ、顔のランドマーク、バウンディングボックスがアノテートされている。
このデータセットを用いて、1ステップで1つの画像から頭部検出と頭部メッシュ再構築を同時に行うことができる新しいモデルアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:29:56 GMT)
Diffusion-Augmented Coreset Expansion for Scalable Dataset Distillation [18.5] そこで本研究では,データセット蒸留のための2段階の解法を提案する。
まず、最も情報性の高いパッチのみを選択して、コアセットを形成することでデータセットを圧縮する。
次に、この圧縮された集合をリアルタイムで動的に拡張するために、生成基礎モデルを活用する。
いくつかの大規模データセット蒸留ベンチマークでは,最先端技術と比較して10%以上の顕著な改善がみられた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:40:27 GMT)
Graph Classification Gaussian Processes via Hodgelet Spectral Features [18.4] 本稿では,グラフの分類のためのプロセスベース分類アルゴリズムを提案する。
私たちはHodge分解を利用して、頂点とエッジの複雑なリッチさをよりよく捉えます。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:50:27 GMT)
Calibrating Reasoning in Language Models with Internal Consistency [18.2] 大規模言語モデル(LLM)は、様々な推論タスクにおいて印象的な機能を示している。
LLMは、しばしば明らかな誤りと矛盾のあるテキストを生成する。
本研究では,LLMにおける内部表現のレンズによる推論について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:01:28 GMT)
ScribeAgent: Towards Specialized Web Agents Using Production-Scale Workflow Data [18.1] 大規模言語モデル(LLM)エージェントは、ますます複雑なWebベースのタスクを処理するために急速に改善されている。
汎用 LLM は、HTML のような特別な Web コンテキストを理解するために特別に訓練されていない。
我々は、60億のトークンに対応する250以上のドメインから収集された実運用規模のワークフローデータを用いて、オープンソースLLMを微調整する別のアプローチを探る。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:00:07 GMT)
PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars [18.1] 本稿では,マルチビューRGBビデオから学習可能な,新しいヒューマンモデルを提案する。
本手法は, 物理シミュレーションにより, 動きに依存した布の変形を実現する。
実験により,本手法は外観を正確に再現するだけでなく,高度に変形可能な衣服を装着したアバターの復元も可能であることが示された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:53:06 GMT)
On the Benefits of Active Data Collection in Operator Learning [18.0] アクティブなデータ収集戦略により、共分散カーネルの固有値の減衰率の観点から誤差収束率を確立する。
これは、$sim n-1$よりも収束率が速くないパッシブ(d.d.)データ収集戦略とは対照的である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:34:08 GMT)
Customize Segment Anything Model for Multi-Modal Semantic Segmentation with Mixture of LoRA Experts [17.7] マルチモーダルなセマンティックセマンティックセマンティクスにセマンティクスモデル(SAM)を適用するための最初の試みを行う。
SAMの重量を凍結させながらMoE-LoRA層のみをトレーニングすることにより、SAMの強力な一般化とセグメンテーション能力は下流タスクに保存できる。
具体的には、モーダル間の不整合に対処するために、モーダル間の重み付き特徴を適応的に生成する新しいMoEルーティング戦略を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:54:31 GMT)
VASCAR: Content-Aware Layout Generation via Visual-Aware Self-Correction [17.5] 大規模言語モデル(LLM)は、構造記述言語を生成できるため、レイアウト生成に有効であることが証明されている。
近年,LLMプロバイダはこれらのモデルを大規模視覚言語モデル (LVLM) へと進化させ,多モーダル理解能力の顕著な向上を図っている。
LVLMに基づくレイアウト生成のためのビジュアル・アウェア・セルフコレクション・レイアウト・ジェネレーション(VASCAR)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:17:06 GMT)
DGNS: Deformable Gaussian Splatting and Dynamic Neural Surface for Monocular Dynamic 3D Reconstruction [17.3] 本稿では,動的ノベルビュー合成と3次元再構成の2つの課題に取り組む。
変形可能なガウススプラッティングと動的ニューラルサーフェスというハイブリッドフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:28:08 GMT)
Representation Purification for End-to-End Speech Translation [17.0] 音声からテキストへの変換(英語: Speech-to-text translation, ST)とは、音声を別の言語でテキストに変換する作業である。
我々は,コンテンツに依存しない要素とコンテンツ関連要因の組み合わせとして,音声表現を概念化する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:50:44 GMT)
UnZipLoRA: Separating Content and Style from a Single Image [16.6] UnZipLoRAは、イメージを構成対象とスタイルに分解する方法である。
UnZipLoRAは、両方のLoRAを同時にトレーニングすることで、これらの要素を単一のイメージから切り離す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:50 GMT)
Analyzing Challenges in Deployment of the SLSA Framework for Software Supply Chain Security [16.6] この調査は、233のGitHubリポジトリから抽出された1,523のSLSA関連問題を分析した。
4つの重要な課題と5つの採用戦略を特定しました。
提案されている戦略には、生成プロセスの合理化、SLSA検証プロセスの改善、具体的で詳細なドキュメントの提供が含まれる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:12:04 GMT)
Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignment [16.6] 本稿では,入力に対する単純なランダムな拡張が,最先端のLCMにおける安全アライメントの有効性にどのように影響するかを検討する。
低リソース・無知な攻撃者は1プロンプト当たり25のランダムな拡張でアライメントを回避できる可能性を大幅に改善できることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:58:44 GMT)
LossAgent: Towards Any Optimization Objectives for Image Processing with LLM Agents [16.5] LossAgentは、低レベル画像処理の最適化目的を、異なる実用アプリケーションで実現することを目的としている。
本稿では,損失エージェントとして強力な大規模言語モデル (LLM) を導入する。
特に,低レベル画像処理におけるエンドツーエンドの最適化をサポートする既存のロス関数を組み込むことで,ロスレポジトリを確立する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:52:20 GMT)
Stabilizer bootstrapping: A recipe for efficient agnostic tomography and magic estimation [16.5] 未知の$n$-qubit state $rho$のコピーが与えられたとき、与えられたクラス$C$の何らかの状態を持つフィデリティ$tau$を持ち、そのフィデリティ$ge tau - epsilon$と$rho$を持つ状態を見つける。
我々は,このタスクのための計算効率の良いプロトコルを設計するための新しいフレームワークである安定化器ブートストラッピングを提供し,これを用いて,安定化器状態と離散積状態という,次のクラスに対する新しい非依存トモグラフィープロトコルを得る。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:01:48 GMT)
SWEPO: Simultaneous Weighted Preference Optimization for Group Contrastive Alignment [16.2] 我々は、DPO(Direct Preference Optimization)の新たな拡張であるSWEPO(Sultaneous Weighted Preference Optimization)を導入する。
SWEPOは、クエリ毎に複数の動的に選択された正と負の応答に対応する。
複数の選好を同時に考えると、アライメントバイアスが減少し、アライメントがより堅牢になることを示す。
UltraFeedbackデータセットの実証検証は、SWEPOを最先端として確立し、下流評価において優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:50:22 GMT)
Demonstration Selection for In-Context Learning via Reinforcement Learning [16.1] Relevance-Diversity Enhanced Selection (RDES)は、テキスト分類タスクにおける多様な参照デモの選択を最適化するための革新的なアプローチである。
RDESはQラーニングフレームワークを使用して、多様性と分類目標との関連性を最大化するデモを動的に識別する。
RDESは,確立された10のベースラインと比較して,分類精度を著しく向上することを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:33:52 GMT)
GigaHands: A Massive Annotated Dataset of Bimanual Hand Activities [16.1] GigaHandsは56人の被験者と417のオブジェクトから34時間の両手の動きを捉えた巨大な注釈付きデータセットである。
マーカレスキャプチャのセットアップとデータ取得プロトコルにより,完全自動3Dハンドとオブジェクト推定が可能となる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:26:51 GMT)
Evaluating Numerical Reasoning in Text-to-Image Models [16.0] 難易度が異なる数値推論課題におけるテキスト・ツー・イメージ・モデルの評価を行った。
もっとも先進的なモデルでさえ、初歩的な数値スキルしか持たないことを示す。
数値推論評価のための新しいベンチマークであるGeckoNumにプロンプト、生成された画像、人間のアノテーションをバンドルする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:50:22 GMT)
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis [15.9] Swittiは、テキスト・ツー・イメージ生成のためのスケールワイズ・トランスフォーマーである。
我々は、スケールワイドトランスフォーマーは因果関係を必要としないと主張し、非因果関係を提案する。
Swittiは既存のT2I ARモデルより優れており、最先端のT2I拡散モデルと競合することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:58:43 GMT)
The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation [15.9] 本稿では,非常に小さなデータセット上で事前学習した大規模言語モデルに過度に適合する反直感的な一般化結果を紹介する。
これらのモデルをさらに微調整して、少数のサンプルに対してほぼゼロに近いトレーニング損失を達成することによって、長いシーケンス生成能力が大幅に向上することがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:34:20 GMT)
When Stability meets Sufficiency: Informative Explanations that do not Overwhelm [15.9] 入力の分類を正当化するためには、何が最小限に必要かを強調する特徴に基づく属性法を考える。
最小限の充足性は理解性に類似した魅力的な性質であるが、結果として生じる説明は、人間がモデルの局所的な振る舞いを理解して評価するには不十分であることが多い。
本稿では,与えられた入力に対して,安定かつ十分な説明のシーケンスを出力するPSEM(Path-Sufficient Explanations Method)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:50:59 GMT)
RANSAC Back to SOTA: A Two-stage Consensus Filtering for Real-time 3D Registration [15.8] 対応ベースのポイントクラウド登録(PCR)は、ロボット工学とコンピュータビジョンにおいて重要な役割を果たす。
我々は、RANSACを最先端(SOTA)の速度と精度に高める2段階のコンセンサスフィルタリング(TCF)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:45:41 GMT)
MTMT: Consolidating Multiple Thinking Modes to Form a Thought Tree for Strengthening LLM [15.7] 大規模言語モデル(LLM)は、複雑な論理的推論と多段階の問題解決を必要とするタスクの制限を示している。
MTMT(Multi-thinking Modes Tree)は,LLMと対話して思考木を構築する手法である。
GPT-4o miniをベースモデルとして,パラメータ設定の違いによるMTMTの性能評価を行った。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:05:30 GMT)
Resolving Lexical Bias in Edit Scoping with Projector Editor Networks [15.7] PenMEは、対照的な学習目的を通じて訓練されたプロジェクションネットワークを備えたコンパクトなアダプタを利用するモデル編集アプローチである。
我々は,PENMEが優れた結果を得る上で有効でありながら,モデルアーキテクチャ全体に適用可能な計算効率と柔軟性を実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:28:35 GMT)
Towards Generalizable Autonomous Penetration Testing via Domain Randomization and Meta-Reinforcement Learning [15.6] 本稿では,GAP(Generalizable Autonomous Pentesting)フレームワークを提案する。
GAPでは、ドメインのランダム化とメタRL学習という、2つの重要な方法を備えたReal-to-Sim-to-Realパイプラインを導入している。
その結果, (a) 未知の環境における政策学習が可能であり, (b) 類似環境におけるゼロショット政策伝達を実現でき, (c) 異種環境における迅速な政策適応を実現することができることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:24:27 GMT)
Beyond the Binary: Capturing Diverse Preferences With Reward Regularization [15.5] この二項選択への依存は、現実のタスクにおいて対象ユーザのより広範囲で集約的な嗜好を捉えるものではない、と我々は主張する。
本稿では、既存の二分選好データセットを合成選好判断で拡張し、潜在的なユーザ不一致を推定する、シンプルで効果的な方法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:35:46 GMT)
Directed Structural Adaptation to Overcome Statistical Conflicts and Enable Continual Learning [15.4] 本稿では、データセット内の統計的衝突に制限されることなく、必要に応じて、かつ指示された方法で複雑な構造適応法DIRADを提案する。
次に,この手法を拡張し,継続学習における「破滅的忘れ」を防止するために設計されたPreVALフレームワークを提案する。
固定トポロジネットワークよりも高い性能とオーダーオブマグニチュードを持つネットワークを成長させる上でのDIRADの信頼性を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:30:18 GMT)
StarVector: Generating Scalable Vector Graphics Code from Images and Text [15.3] 本稿では,SVG生成のための多モーダル大言語モデルであるStarを紹介する。
画像のセマンティクスを理解し、SVGプリミティブをコンパクトで正確な出力に使用することにより、画像ベクトル化を行う。
ベクトル化タスク間の一般化を可能にする2Mサンプルの多種多様なデータセットであるStarStackをトレーニングする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:32:50 GMT)
Sometimes I am a Tree: Data Drives Unstable Hierarchical Generalization [15.0] トレーニングデータにおける潜在構造が、分散の一般化を改善するためにモデルをどのように駆動するかを考察する。
その結果, モデルがOODの挙動を安定させるのは, 表面レベル線形規則か階層規則かのいずれかに完全にコミットした場合に限られることがわかった。
本研究は, 一般化パターン形成におけるトレーニングデータの重要性を強調した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:12:37 GMT)
Pan-cancer Histopathology WSI Pre-training with Position-aware Masked Autoencoder [14.6] 設計した位置認識マスク付きオートエンコーダ(PAMA)を用いたパンカンサーWSIレベルの事前学習のための新しい自己教師型学習フレームワークを提案する。
その結果, PAMAがWSI表現学習の一般化と差別化に有効であること, パン・カンサーWSI事前学習の有効性が示された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:28:17 GMT)
FedDW: Distilling Weights through Consistency Optimization in Heterogeneous Federated Learning [14.5] Federated Learning(FL)は、データの集中化なしにデバイス間でのニューラルネットワークトレーニングを可能にする、革新的な分散機械学習パラダイムである。
従来の研究では、IID環境では、モデルのパラメータ構造が特定の一貫性の原則に従うことが期待されている。
本稿では,両者の整合性を識別し,FedDWフレームワークの基盤となるトレーニングの調整に活用する。
実験結果から,FedDWは10種類の最先端FL法より優れ,高度不均一条件下では平均3%精度が向上した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:32:40 GMT)
Monocular Dynamic Gaussian Splatting is Fast and Brittle but Smooth Motion Helps [14.4] 我々は多くのガウススプティングに基づく手法を組織化し、ベンチマークし、分析する。
その違いがパフォーマンスに与える影響を定量化します。
ガウス法に基づく手法の高速なレンダリング速度は、最適化の脆さを犠牲にしている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:08 GMT)
An Efficient Model Maintenance Approach for MLOps [14.2] 既存の機械学習モデルメンテナンスアプローチは、しばしば計算資源集約、コスト、時間消費、モデル依存である。
我々は、MLOpsパイプラインの改善、新しいモデルメンテナンスアプローチ、およびMLモデルメンテナンスの課題に対処するためのSim sameity Based Model Reuse(SimReuse)ツールを提案する。
4つの時系列データセットに対する評価結果から,モデル再利用手法がモデルの性能を維持できることを示すとともに,メンテナンス時間とコストを大幅に削減できることを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:02:02 GMT)
A Framework For Image Synthesis Using Supervised Contrastive Learning [14.0] テキスト・ツー・イメージ(T2I)生成は、テキスト記述に対応する現実的な画像を作成することを目的としている。
本稿では,ラベルガイド付き教師付きコントラスト学習による内部モーダル対応と内部モーダル対応の両面を活用したフレームワークを提案する。
我々は、単一オブジェクトデータセットCUBと多オブジェクトデータセットCOCOの2つの新しいT2I GANのフレームワークを実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:15:37 GMT)
NLTS Hamiltonians from good quantum codes [14.0] NLTS(No Low-Energy Trivial State)予想は、非自明な複雑性を持つすべての低エネルギー状態を持つハミルトニアンの族が存在することを示唆している。
我々は、最近発見された定数レートおよび線形距離QLDPC符号の族がNLTS局所ハミルトニアンに対応することを示すことによって、この予想を証明した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:57:02 GMT)
On the Lack of Robustness of Binary Function Similarity Systems [13.8] 我々は、最先端の機械学習モデルの敵攻撃に対するレジリエンスを評価する。
我々は、この攻撃が全てのモデルの妥協に成功し、問題設定に応じて57.06%と95.81%の平均的な攻撃成功率を達成することを実証した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:54:53 GMT)
PoTable: Programming Standardly on Table-based Reasoning Like a Human Analyst [13.8] 本稿では,人間アナリストをシミュレートするテーブルベースの推論手法として,PoTableを提案する。
PoTableは、人間のような論理的なステージを分割し、操作プールをオープンワールド空間に拡張する。
PoTableは標準的な推論プロセス全体を完了し、優れた推論結果を生成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:54:16 GMT)
Thermal and RGB Images Work Better Together in Wind Turbine Damage Detection [13.8] 風力タービンブレード(WTB)の検査は、その構造的整合性と運用効率の確保に不可欠である。
従来の検査手法は危険で非効率であり、無人航空機(UAV)の使用が困難な地域へのアクセスを促す。
空間座標変換による熱画像とRGB画像を組み合わせたマルチスペクトル画像合成法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:32:45 GMT)
Less Training, More Repairing Please: Revisiting Automated Program Repair via Zero-shot Learning [13.6] 近年のCodeBERTモデルに基づく実用的な多言語APRツールとしてAlphaRepairを提案する。
広く使われているDefects4Jベンチマークの結果から、AlphaRepairは最先端のAPRツールを大幅に上回っていることが分かる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 00:53:15 GMT)
The Market Consequences of Perceived Strategic Generosity: An Empirical Examination of NFT Charity Fundraisers [13.6] 非Fungible token (NFT) 慈善基金は、芸術作品のNFTの販売と、慈善事業に寄付された収益を含んでいる。
チャリティー募金者内のNFT購入が、後発のドナーの市場成果に及ぼす影響について検討する。
我々は、NFTが他のNFTに対して課せられる価格について、市場におけるチャリティー・NFTの登録者の重大な罰則を提示する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:03:28 GMT)
RARE: Retrieval-Augmented Reasoning Enhancement for Large Language Models [13.5] RARE(Retrieval-Augmented Reasoning Enhancement)は相互推論フレームワーク(rStar)の汎用的拡張である
これは、コモンセンスや医学的推論といった複雑な知識集約的なタスクに対して、大規模言語モデル(LLM)の推論精度と事実整合性を高めることを目的としている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:51:35 GMT)
Give me Some Hard Questions: Synthetic Data Generation for Clinical QA [13.4] 本稿では,ゼロショット環境での大規模言語モデル(LLM)を用いた臨床QAデータの生成について検討する。
ナイーブなプロンプトが臨床シナリオの複雑さを反映しない簡単な質問をもたらすことがよくあります。
2つの臨床QAデータセットを用いた実験により,本手法はより難解な質問を発生し,ベースライン上での微調整性能を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:35:41 GMT)
Practical Operator Sketching Framework for Accelerating Iterative Data-Driven Solutions in Inverse Problems [13.3] 本稿では,効率的な反復型データ駆動型再構成手法のための演算子・スケッチパラダイムを提案する。
これらのIDRスキームは現在、逆問題の画像化のための最先端のソリューションである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:07:54 GMT)
Quantifying the Limits of Segment Anything Model: Analyzing Challenges in Segmenting Tree-Like and Low-Contrast Structures [13.3] Segment Anything Model (SAM)は、さまざまなドメインをまたいだインタラクティブかつゼロショットセグメンテーションにおいて、素晴らしいパフォーマンスを示している。
SAMは特定の種類のオブジェクト、特に密度の高い木のような構造と低テクスチャコントラストを特徴とするオブジェクトと競合する。
本研究では,木状性とテクスチャ分離性という2つの重要なオブジェクト特性を定量化する指標を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:25:51 GMT)
JANUS: A Difference-Oriented Analyzer For Financial Centralization Risks in Smart Contracts [13.3] JANUSは、Solidityスマートコントラクトの自動アナライザで、特定の振る舞いとは独立して、金融集中化リスクを検出する。
Janus氏は行動よりもリスクの影響に注目し、未知のパターンで集中化リスクを明らかにする。
我々は、JANUSを33,151の契約からなる実世界のデータセットで評価し、他のツールが検出できない2種類のリスクを特定した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:35:56 GMT)
Fourier Boundary Features Network with Wider Catchers for Glass Segmentation [12.5] 反射面と透過ガラスのセグメンテーションを制約する新しい手法を提案する。
提案手法はガラス画像分割における最先端技術 (SOTA) 法と比較して, セグメンテーション性能が向上する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:37:23 GMT)
Learning to Hash for Recommendation: A Survey [12.5] L2H for RS(略してHashRec)は、最近、大規模なレコメンデーションをサポートするために広く注目を集めている。
本稿では、リコール段階でよく使われる2-towerモデルを紹介し、L2Hでよく使用される2つの探索戦略を同定する。
また、HashRecアルゴリズムの性能を測定するためによく使われる評価指標についても紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:07:19 GMT)
PriorMotion: Generative Class-Agnostic Motion Prediction with Raster-Vector Motion Field Priors [12.3] クラスに依存しないメソッドはエンコーダの設計に重点を置いており、しばしば剛性や時間的一貫性といった重要な先例を見落としている。
これらの問題に対処するために、生成およびベクトル化されたシーン表現を抽出するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:56:24 GMT)
FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning [12.3] フェデレートラーニング(FL)は、様々なクライアントからローカルに最適化されたモデルと、統一されたグローバルモデルを組み合わせる。
FLは、性能劣化、収束の遅さ、グローバルモデルの堅牢性低下など、重大な課題に直面している。
これらの問題を効果的に解決するために、革新的なデュアルストラテジーアプローチを導入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:42:29 GMT)
Weak-to-Strong Generalization Through the Data-Centric Lens [12.2] 重なり密度という弱強一般化を特徴付ける単純なデータ中心機構を提案する。
一般化の利点は重なり合う密度の関数であり、データ選択アルゴリズムに対する後悔の束縛であることを示す理論的結果を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:29:19 GMT)
OMEGA: Efficient Occlusion-Aware Navigation for Air-Ground Robot in Dynamic Environments via State Space Model [12.1] 地上ロボット(AGR)は、監視や災害対応に広く利用されている。
現在のAGRナビゲーションシステムは、静的環境においてよく機能する。
しかし、これらのシステムは動的で厳しい閉塞シーンの課題に直面している。
これらの問題に対処するために,効率的なAGR-Plannerを用いたOccMambaを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:54:29 GMT)
Reachable Polyhedral Marching (RPM): An Exact Analysis Tool for Deep-Learned Control Systems [11.9] 我々は、rerectified Unit (ReLU) アクティベーションを備えたフィードフォワードニューラルネットワークに注目した。
本稿では,アフィン領域の増分および連結を利用したROA計算アルゴリズムを提案する。
最後に,航空機の滑走路制御問題に対する画像ベース制御器によって安定化された状態の集合を見つけるために,本手法を適用した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:23:20 GMT)
Reinforcement Learning from Wild Animal Videos [11.9] 私たちは、インターネットから何千もの野生動物ビデオを見て、足のついたロボットのロコモーションスキルを学びます。
本稿では,野生動物ビデオからの強化学習(RLWAV)について紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:55:23 GMT)
CNNSum: Exploring Long-Conext Summarization with Large Language Models in Chinese Novels [11.6] CNNSumは、中国のマルチスケールの長文小説要約ベンチマークである。
我々は、CNNSum上で商用およびオープンソースモデルを評価し、詳細な分析を行う。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:51:20 GMT)
Benchmarking Foundation Models on Exceptional Cases: Dataset Creation and Validation [11.6] 本稿では, グラフィックノベル, 書道, ニュース記事, 歌詞など, 複数のモダリティにまたがるFM評価のための新しいデータセットを開発する。
これには、例えば分類、文字認識、トークン予測、テキスト生成といったタスクが含まれる。
また,性能向上のため,Chain-of-Few(CoT)やCoT+Thought-Shotといった迅速な技術も提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:58:07 GMT)
Can Targeted Clean-Label Poisoning Attacks Generalize? [11.5] 標的の毒殺攻撃が、それらの標的の未知のバリエーションに一般化できるかどうかを検討する。
特に、異なる視点を持つ物体や、異なる外観を持つ動物種など、多様な標的変異を探索する。
本手法はコサイン類似性に基づく攻撃を20.95%の精度で達成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:27:14 GMT)
TGMM: Combining Parse Tree with GPU for Scalable Multilingual and Multi-Granularity Code Clone Detection [11.3] TGMMは、多言語および多言語コードクローン検出のためのツリーおよびGPUベースのツールである。
ユーザが提供する文法ファイルに基づいてパースツリーを生成することで、TGMMは特定の粒度でコードブロックを抽出し、Type-3クローンを効率的に検出することができる。
TGMMは最初に実行時間と精度でランク付けし、リコールは他のものと同等である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:37:54 GMT)
Fixed-Mean Gaussian Processes for Post-hoc Bayesian Deep Learning [11.2] 普遍カーネルを用いた場合、後続平均を任意の連続関数に固定する、スパース変分ガウス過程(GP)の新たなファミリを導入する。
具体的には、このGPの平均値を事前学習したDNNの出力に固定し、GPの予測分散を効果的に適合させて予測の不確かさを推定する。
実験の結果,FMGPは最先端手法と比較して不確実性評価と計算効率を両立させることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:17:16 GMT)
Exact: Exploring Space-Time Perceptive Clues for Weakly Supervised Satellite Image Time Series Semantic Segmentation [11.2] 本論文は,作物マッピングタスクを総括的アノテーション負担から解放する,弱教師付きパラダイム(画像レベルのカテゴリのみ使用可能な)を取り入れたものである。
本稿では,時空知覚的手がかりを探索する新しい手法を提案する。
本手法は,様々なSITSベンチマークにおいて顕著な性能を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:37:56 GMT)
Looking at Model Debiasing through the Lens of Anomaly Detection [11.1] ディープニューラルネットワークはデータのバイアスに敏感である。
本研究は,偏りと偏りの一致したサンプルを正確に予測することの重要性を示す。
本稿では,異常検出に基づく新しいバイアス同定手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:37:51 GMT)
INFP: Audio-Driven Interactive Head Generation in Dyadic Conversations [11.1] 本稿では,Dyadic インタラクションのための新しい音声駆動型ヘッド生成フレームワーク INFP を提案する。
INFPは、モーションベースヘッドイミテーションステージとオーディオガイドモーションジェネレーションステージで構成される。
このような研究を円滑に進めるために,インターネットから収集したリッチな対話の大規模データセットであるDyConvを紹介した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:20:34 GMT)
TANGO: Training-free Embodied AI Agents for Open-world Tasks [11.0] 本稿では,すでに観測されているLCMを用いてプログラム構成を拡張するTANGOを提案する。
追加のトレーニングを必要とせずに、単一のモデルが多様なタスクにどのように対処できるかを示す。
我々は,オープンセットオブジェクトゴールナビゲーション,マルチモーダルライフロングナビゲーション,オープンエンボディード質問回答という3つの重要なAIタスクに対するアプローチを評価した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:52:20 GMT)
One Communication Round is All It Needs for Federated Fine-Tuning Foundation Models [11.0] 1ラウンドの通信で、複数の通信で達成したのと同等のグローバルモデルの性能が得られることを示す。
実験の結果,単発ファインチューニングは通信コストを削減するだけでなく,アグリゲーションを実現し,プライバシを高め,パフォーマンスの整合性を維持することができることがわかった。
我々の発見は、ファインチューニングの実践に革命をもたらす可能性があり、効率を向上し、コストを削減し、大規模モデルのアクセシビリティを拡大する可能性がある。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:45:35 GMT)
Mechanistic Unlearning: Robust Knowledge Unlearning and Editing via Mechanistic Localization [10.9] 大規模言語モデルにおける知識編集と未学習の方法は、性能を損なうことなく、望ましくない知識の編集や削除を試みている。
異なる手法でローカライズされたトレーニングコンポーネントでは、学習の非学習と編集の堅牢性に大きな違いがある。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:55:35 GMT)
The Tile: A 2D Map of Ranking Scores for Two-Class Classification [10.9] 2クラス分類器のための1つの2次元マップにおいて、ランキングスコアの無限度を整理する新しい多目的ツールTileを提案する。
本研究では,前者の影響やROC空間との対応など,基礎となるランキングスコアの特性について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:27:59 GMT)
Foundations of the Theory of Performance-Based Ranking [10.9] 本稿では,パフォーマンスに基づくランク付けのための普遍理論の基礎を確立する。
確率理論と順序理論の両方の上に構築された厳密な枠組みを導入する。
2クラス分類の場合、ランキングスコアのファミリーは、よく知られたパフォーマンススコアを含んでいることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:05:25 GMT)
SeeGround: See and Ground for Zero-Shot Open-Vocabulary 3D Visual Grounding [10.8] 3Dビジュアルグラウンディングは、テキスト記述に基づいて3Dシーン内のオブジェクトを見つけることを目的としている。
大規模2次元データに基づいて訓練された2次元視覚言語モデル(VLM)を活用したゼロショット3DVGフレームワークであるSeeeGroundを紹介する。
本稿では,クエリ関連画像レンダリングの視点を動的に選択するパースペクティブ適応モジュールと,2次元画像と3次元空間記述を統合するFusion Alignmentモジュールの2つのモジュールを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:58:43 GMT)
MOANA: Multi-Radar Dataset for Maritime Odometry and Autonomous Navigation Application [10.8] 海洋環境検知には、厳しい天候、プラットフォーム摂動、大きな動的物体、長い検知範囲の要求といった課題を克服する必要がある。
レーダーセンサーは、天候や塩分からの物理的汚染に対する堅牢な長距離検知機能とレジリエンスを提供する。
このデータセットは、短距離LiDARデータ、中距離Wバンドレーダデータ、長距離Xバンドレーダデータを統一されたフレームワークに統合する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:40:40 GMT)
Structure-Aware Stylized Image Synthesis for Robust Medical Image Segmentation [10.8] 本稿では,拡散モデルと構造保存ネットワークを組み合わせた新しい医用画像分割手法を提案する。
本手法は, 病変の位置, サイズ, 形状を維持しつつ, 様々なソースからの画像を一貫したスタイルに変換することで, 領域シフトを効果的に軽減する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:15:32 GMT)
FPANet: Frequency-based Video Demoireing using Frame-level Post Alignment [10.6] FPANetは、周波数領域と空間領域の両方でフィルタを学習する画像-ビデオ復調ネットワークである。
提案手法の有効性を,一般公開された大規模データセットを用いて実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:03:41 GMT)
Sharpness-Aware Minimization Revisited: Weighted Sharpness as a Regularization Term [10.4] 正規化項としてシャープネスを組み込んだWSAMという,より一般的な手法を提案する。
PACとBayes-PACの併用による一般化を実証する。
その結果、WSAMは、バニラやSAMとその変種と比較して、より改良された一般化を達成するか、少なくとも高い競争力を持つことを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:31:10 GMT)
SPIN: Spacecraft Imagery for Navigation [10.3] 実際の宇宙運用条件下で取得されるデータの不足は、学習ベースのビジュアルナビゲーションアルゴリズムを開発する上で大きな課題となる。
宇宙空間における幅広い視覚的ナビゲーションシナリオをサポートするために設計されたオープンソースツールであるSPINを提案する。
SPINは複数の地上データを提供し、研究者は衛星のカスタム3Dモデルを使用することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:23:27 GMT)
KV Shifting Attention Enhances Language Modeling [10.3] 現在の大規模言語モデルは、主に、文脈内学習能力の優れたデコードのみの構造変換器に基づいている。
モデル誘導の能力をより効率的に実装するために、KVシフト注意を提案する。
実験結果から,KVシフト注意が学習誘導ヘッドや言語モデリングに有用であることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:19:38 GMT)
A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces [10.0] 無限水平エントロピー規則化マルコフ決定過程に対するフィッシャー・ラオ政策勾配流のポーランド状態と行動空間による大域収束について検討する。
勾配流の大域的健全性を確立し,その指数収束性を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:35:46 GMT)
An In-Depth Examination of Risk Assessment in Multi-Class Classification Algorithms [10.0] リスク評価問題の解法における各種手法の性能を数値的に解析する。
我々の共形予測に基づくアプローチは、モデルとデータ分散非依存であり、実装が簡単であり、合理的な結果を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:03:16 GMT)
Exploring the Influence of Label Aggregation on Minority Voices: Implications for Dataset Bias and Model Training [10.0] 性差別検出における標準ラベル集約戦略が少数意見表現に与える影響について検討した。
マイノリティアノテーションの品質と価値を調べた上で,ゴールドラベルのクラス分布に与える影響について検討した。
本稿では,各手法が導入する潜在的なバイアスとそのモデルによる増幅方法について論じる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:00:49 GMT)
HyperMARL: Adaptive Hypernetworks for Multi-Agent RL [10.0] HyperMARLは、ハイパーネットワークを使って効率と特殊性のバランスをとる新しいアプローチである。
エージェント固有のアクターおよび批評家パラメータを生成し、エージェントは多様な、あるいは均質な振る舞いを適応的に表現することができる。
一貫してFuPS、NoPS、多様性を重視した手法に適合し、共有アーキテクチャでNoPSレベルの多様性を達成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:09:51 GMT)
Intrinsic Quantum Mpemba Effect in Markovian Systems and Quantum Circuits [10.0] 量子Mpemba効果(QME)は、平衡から遠く離れた系が平衡に近い状態に達する反直観現象を記述している。
本稿では、量子状態によって追跡される軌道長を距離のより適切な尺度として用いた固有量子Mpemba効果(IQME)を提案する。
この研究は、量子状態の進化についての理解を深め、新しい量子力学の振る舞いを正確に捉えるための基礎を築いた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:09:23 GMT)
Linear Discriminant Analysis in Credit Scoring: A Transparent Hybrid Model Approach [9.9] 特徴量削減手法として線形判別分析 (LDA) を実装し, モデルの複雑さの軽減を図る。
我々のハイブリッドモデルであるXG-DNNは、99.45%の精度と99%のF1スコアでLDAを上回りました。
モデル決定を解釈するために、LIME (local) と Morris Sensitivity Analysis (global) という2つの異なる説明可能なAI技術を適用した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:21:18 GMT)
BodyMetric: Evaluating the Realism of HumanBodies in Text-to-Image Generation [9.9] BodyMetricは、画像の身体リアリズムを予測する学習可能なメトリックである。
BodyMetricは、これまで大規模に利用できなかったアプリケーションを通じてデモします。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:48:54 GMT)
Don't Be So Positive: Negative Step Sizes in Second-Order Methods [9.8] 負のステップサイズを用いることは、一般的なヘッセン変換法よりも効果的であることが示される。
負のステップサイズを用いることは、一般的なヘッセン変換法よりも効果的であることが実験的に実証された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:44:09 GMT)
MetricGold: Leveraging Text-To-Image Latent Diffusion Models for Metric Depth Estimation [9.6] MetricGoldは、生成拡散モデルの豊富な先行値を利用して、メートル法深さ推定を改善する新しいアプローチである。
我々の実験は、多様なデータセットをまたいだ堅牢な一般化を実証し、よりシャープで高品質なメートル法深さ推定を導出する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:51:55 GMT)
Targeted Hard Sample Synthesis Based on Estimated Pose and Occlusion Error for Improved Object Pose Estimation [9.6] モデルに依存しない新しいハードサンプル合成法を提案する。
本研究では,最先端ポーズ推定モデルを用いて,複数のROBIデータセットオブジェクトに対して最大20%の精度で検出率を向上することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:00:55 GMT)
MetaFormer: High-fidelity Metalens Imaging via Aberration Correcting Transformers [9.6] メタレンス(Metalens)は、超薄型でコンパクトなサイズで製造できる新しい光学系である。
それまでの芸術は様々な種類の収差に対処しようと試みてきたが、そのほとんどは伝統的なかさばるレンズのために設計されている。
本稿ではメタフォーマーを提案する。メタフォーマーはメタレン捕獲画像の収差補正フレームワークである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:11:48 GMT)
LAA-Net: A Physical-prior-knowledge Based Network for Robust Nighttime Depth Estimation [9.5] 既存の教師付き単眼深度推定モデルでは、GANを用いて夜間画像を昼時間版に転送する。
これは、現実の昼の照明の複雑さのために矛盾をもたらす可能性がある。
夜間の光波長と光減衰について, 物理的事前知識を活用する。
当社のモデルであるLAA-Netは、レイリー散乱理論の物理的洞察を強固に夜間深度推定に取り入れている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:33:03 GMT)
DiffQRCoder: Diffusion-based Aesthetic QR Code Generation with Scanning Robustness Guided Iterative Refinement [9.4] 本研究では,QRコードをスキャン可能かつ視覚的に楽しむためのトレーニングフリーなDiffusionベースのQRコード生成器(DiffQRCoder)を提案する。
提案手法では,拡散モデルのための新しい拡散誘導であるSRPG(Scanning-Robust Perceptual Guidance)を導入する。
我々のアプローチは95%以上のSSRを強力に達成し、実世界のアプリケーションにその能力を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:51:49 GMT)
Missing Melodies: AI Music Generation and its "Nearly" Complete Omission of the Global South [9.2] 我々はAI音楽生成研究に使用される100万時間以上の音声データセットの分析を行った。
我々は,AI研究において,グローバル・サウスの音楽ジャンルの公平な表現と包括性において重要なギャップを見出した。
これらのデータセットの約40%には、西洋音楽以外の形態が含まれており、グローバル・サウスのジャンルは14.6%に過ぎない。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:10:42 GMT)
A Hitchhiker's Guide to Understanding Performances of Two-Class Classifiers [9.1] 4つのシナリオを提示することにより、2クラス分類器の性能を理解するための最初のヒッチハイカーガイドを提示する。
新たに導入されたTileツールと異なるフレーバーを利用して、74の最先端セマンティックセグメンテーションモデルの性能をランク付けし分析する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:52:35 GMT)
Transient Multi-Agent Path Finding for Lifelong Navigation in Dense Environments [9.0] ライフロングMAPF(英: Lifelong MAPF、LMAPF)は、エージェントが現在のターゲットに到達すると新たなターゲットを受信するMAPFのオンライン版である。
そこで本研究では,LMAPF問題に対して,各エージェントが最終的にターゲットを訪問することを目的とした修正MAPF問題の系列を解くことで,LMAPF問題を解くことを提案する。
本稿では、このMAPF変種をTransient MAPF (TMAPF) と呼び、既存のMAPFアルゴリズムに基づいたいくつかのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:37:29 GMT)
Measuring and Forecasting Conversation Incivility: the Role of Antisocial and Prosocial Behaviors [9.0] 本研究では,ヘイトスピーチに対する回答に続いて,会話の非現実性を測定するための新しい指標を提案する。
ヘイトスピーチに対する回答の後に会話の非現実性レベルを予測することは難しい課題であることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:19:40 GMT)
LuxEmbedder: A Cross-Lingual Approach to Enhanced Luxembourgish Sentence Embeddings [8.8] 文の埋め込みモデルは並列データに大きく依存しており、Luxembourgishを含む多くの低リソース言語では不十分である。
この不足は、これらの言語に対する単言語および言語間文埋め込みモデルの最適部分性能をもたらす。
我々は、並列トレーニングデータセットに低リソース言語を含めることが、他の低リソース言語よりも有利であることを示す証拠を提示する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:05:57 GMT)
Chain-of-Thought in Large Language Models: Decoding, Projection, and Activation [8.8] Chain-of-Thoughtプロンプトは、大規模言語モデルの推論能力を著しく向上させた。
本研究は,Chainof-Thoughtを用いたモデル内で発生する変化の解明を目的とした,デコーディング,プロジェクション,アクティベーションの3つの重要な側面について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:47:29 GMT)
Relax and Merge: A Simple Yet Effective Framework for Solving Fair $k$-Means and $k$-sparse Wasserstein Barycenter Problems [8.7] 複数のグループからなるデータセットが与えられた場合、公正性制約は各クラスタに各グループからのポイントの割合を含む必要がある。
我々はRelax と Merge' のフレームワークを提案し、$rho$ は既製のvanilla $k$-means アルゴリズムの近似比である。
PTASが$k$-meansである場合、我々の解は、フェアネス制約にわずかに違反するだけで、$(5+O(epsilon))$の近似比を達成できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:45:55 GMT)
Dissipation-assisted preparation of topological boundary states [8.6] 本研究では, 定常密度行列を計算し, 実験的に実現可能な結合散逸がトポロジカルシステムに与える影響について検討した。
この研究は、特にマヨラナ零モードの文脈において、位相的エッジ状態の準備に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:28:05 GMT)
Specification-Driven Code Translation Powered by Large Language Models: How Far Are We? [8.5] コード翻訳の中間表現としてNL-specificationを用いる。
以上の結果から,NL特異化だけでは性能改善には至らないことが明らかとなった。
コード翻訳の性能解析に加えて,翻訳コードの品質についても検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:10:21 GMT)
CCxTrust: Confidential Computing Platform Based on TEE and TPM Collaborative Trust [8.5] 単一のハードウェアルートの信頼(RoT)への依存は、クラウドプラットフォームに対するユーザの信頼を制限します。
マルチクラウド環境での相互運用性の欠如と統一された信頼モデルにより、クロスプラットフォームでクロスクラウドな信頼チェーンが確立できない。
本稿では,TEE と TPM の相互信頼の根源を活用した秘密計算プラットフォームである CCxTrust を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:12:49 GMT)
A Multi-agent Simulation for the Mass School Shootings [8.5] 米国での銃乱射事件の頻度は、重大な懸念として高まっている。
本研究は,マルチエージェントシミュレーションモデルの構築により,潜在的な緩和対策のシミュレーションと評価の課題に対処することを目的とする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:29:57 GMT)
Accelerating Proximal Policy Optimization Learning Using Task Prediction for Solving Environments with Delayed Rewards [8.5] オフラインポリシとオンラインPPOポリシを組み合わせたハイブリッドポリシアーキテクチャと,TWTL(Time Window Temporal Logic)を用いた報酬形成機構の2つを導入する。
我々は,逆振り子と月面着陸機環境に関する広範囲な実験を通じて,我々のアプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:30:43 GMT)
Aligned Music Notation and Lyrics Transcription [8.4] 本稿では,Aligned Music Notation and Lyrics Transcription (AMNLT) の課題を紹介する。
音楽記号、歌詞、それらの同期を共同で検討することで、声楽の完全な書き起こしに対処する。
我々は、音楽と歌詞を別々に扱う従来の分詞法から、新しいエンドツーエンドソリューションまで、この課題に対処するための様々なアプローチを評価する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:50:11 GMT)
Group Distributionally Robust Optimization can Suppress Class Imbalance Effect in Network Traffic Classification [8.4] 本稿では,クラス不均衡の存在下でのネットワークトラフィックの分類に焦点をあてる。
本稿では,群分布的ロバスト最適化のレンズを用いて,クラス不均衡を緩和する手法を提案する。
その結果,本手法はクラス不均衡の負の効果を抑えるだけでなく,予測における総合的な性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:45:09 GMT)
Learning Artistic Signatures: Symmetry Discovery and Style Transfer [8.3] 芸術様式の明確な定義はない。
スタイルは、局所的なテクスチャの配置を規定するグローバルな対称性のセットと考えるべきである。
局所的特徴とグローバル的特徴の両方を考慮し、リージェネレータと従来のテクスチャ尺度の両方を用いて、どちらの特徴セットよりもアーティスト間のスタイル的類似性を定量的に捉えることができることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:56:23 GMT)
Analyzing the Generalization and Reliability of Steering Vectors [8.3] ステアリングベクトルは分布内および分布外の両方にかなりの制限があることを示す。
分散において、ステアビリティは異なる入力間で高度に変動する。
アウト・オブ・ディストリビューション(out-of-distribution)、ステアリングベクトル(steering vector)はよく一般化されるが、いくつかの概念はプロンプトの合理的な変化に対して脆弱である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:26:35 GMT)
A Data-Driven Framework for Discovering Fractional Differential Equations in Complex Systems [8.2] 本研究では、データから直接分数微分方程式(FDE)を発見するための段階的なデータ駆動フレームワークを提案する。
我々のフレームワークは、スパース観測とノイズ観測の分離と再構成のための代理モデルとしてディープニューラルネットワークを適用している。
本研究は, 凍結土壌のクリープ挙動に関する, 合成異常拡散データおよび実験データを含む, 各種データセットにわたるフレームワークの検証を行った。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:38:30 GMT)
Nl2Hltl2Plan: Scaling Up Natural Language Understanding for Multi-Robots Through Hierarchical Temporal Logic Task Representation [8.2] Nl2Hltl2Planは自然言語コマンドを階層線形時間論理(LTL)に変換するフレームワーク
まず、LLMは命令を階層的なタスクツリーに変換し、論理的および時間的関係をキャプチャする。
次に、微調整されたLLMは、サブタスクをフラットな公式に変換し、階層的な仕様に集約する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:37:46 GMT)
Train a Real-world Local Path Planner in One Hour via Partially Decoupled Reinforcement Learning and Vectorized Diversity [8.1] 深層強化学習(DRL)は局所経路計画(LPP)問題の解決に有効である。
実世界におけるそのような応用は、DRLの訓練効率と一般化能力の不足により、非常に制限されている。
アクター・シャーラーラーナー(ASL)トレーニングフレームワークと移動ロボット指向シミュレータSparrowで構成されたColorというソリューションが提案されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:01:33 GMT)
A Confidential Computing Transparency Framework for a Comprehensive Trust Chain [8.0] Confidential Computingは、ハードウェアベースのTrusted Execution Environmentを通じて、使用中のデータのプライバシを高める。
TEEは脆弱性やバックドアの欠如を保証できないため、ユーザの信頼を必要とします。
機密情報処理の透明性を漸進的に向上するための実践的な経路を組織に提供する3段階の概念フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:06:35 GMT)
Unsupervised Modality-Transferable Video Highlight Detection with Representation Activation Sequence Learning [7.9] 教師なしハイライト検出のためのクロスモーダル認識を用いた新しいモデルを提案する。
提案モデルでは,自己再構成タスクを通じて,画像と音声のペアデータから視覚レベルのセマンティクスを用いて表現を学習する。
実験結果から,提案手法は,他の最先端手法と比較して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:09:37 GMT)
Maximizing Information Gain in Privacy-Aware Active Learning of Email Anomalies [7.8] 我々は情報ゲイン最大化データを用いた能動学習の強化手法を開発した。
提案手法の有効性は,人間アナリストによる電子メールの再実行のみをラベル付けできる現実的な環境で評価する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:26:16 GMT)
Boundary-Guided Learning for Gene Expression Prediction in Spatial Transcriptomics [7.8] 本稿では,病理画像から抽出した境界情報を手がかりとして,BG-TRIPLEXというフレームワークを提案する。
我々のフレームワークはピアソン相関係数(PCC)で既存の手法を一貫して上回っている
本手法は,WSIと遺伝子発現の複雑な相互作用を理解する上で,境界機能の重要性を強調している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:09:11 GMT)
Social Life Simulation for Non-Cognitive Skills Learning [7.7] 大型言語モデル(LLM)によって実現された対話型プラットフォームであるSimulife++を紹介する。
このシステムでは、ユーザーは主人公として行動し、1つまたは複数のAIベースのキャラクターをさまざまな社会的シナリオで作り出すことができる。
特に,人間-AIインタラクションを,傍観者として行動するSage Agentを含む人間-AI-AIコラボレーションに拡張した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:19:45 GMT)
Divide, Ensemble and Conquer: The Last Mile on Unsupervised Domain Adaptation for Semantic Segmentation [7.7] マルチソースデータセットのためのフレキシブルなUDAフレームワークであるDECを提案する。
分割・分散戦略に従うと、DECはセマンティッククラスを分類し、各カテゴリのトレーニングモデルを作成し、合成データセットにのみ訓練されたアンサンブルモデルでそれらの出力を融合して最終セグメンテーションマスクを取得することでタスクを単純化する。
DECは既存のUDAメソッドと統合することができ、Cityscapes、BDD100K、Mapillary Vistasで最先端のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:47:16 GMT)
AnyDressing: Customizable Multi-Garment Virtual Dressing via Latent Diffusion Models [7.5] 衣服とパーソナライズされたテキストプロンプトの組み合わせで条件付き文字をカスタマイズする新しいAnyDressing法を提案する。
AnyDressingはGarmentsNetとDressingNetという2つの主要なネットワークで構成されており、それぞれが詳細な衣料品の特徴を抽出することを目的としている。
衣服のきめ細かいテクスチャの詳細を改善するため,ガーメント強化テクスチャ学習戦略を導入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:16:47 GMT)
Using Cooperative Co-evolutionary Search to Generate Metamorphic Test Cases for Autonomous Driving Systems [7.5] 本稿では,自律運転システム(ADS)のシステムレベルの安全性評価を進めることを目的とした,新しい自動テストフレームワークCoCoMEGAを紹介する。
CoCoMEGAは、望ましくないシステム動作を示すテストシナリオの識別を強調し、最終的には、メタモルフィックリレーショナル(MR)によって取得される安全違反につながる可能性がある。
将来の研究の方向性には、さらなるシミュレーションプラットフォームへのアプローチの拡張、他の複雑なシステムに適用すること、サロゲートモデリングのようなテスト効率をさらに改善するための方法を模索することが含まれる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:17:31 GMT)
Argumentative Experience: Reducing Confirmation Bias on Controversial Issues through LLM-Generated Multi-Persona Debates [7.4] 大きな言語モデル(LLM)は、デザイナーが情報アクセスのためのエキサイティングな新しいユーザーエクスペリエンスに命を吹き込むことを可能にする。
本研究は, 異論を呈する諸問題に対して, 混合方法論, 対象内研究を通じて複数の視点を呈する。
ベースライン検索システムと比較すると、より創造的な相互作用と多様な情報検索が、我々の多人数討論システムと比較される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:51:05 GMT)
MISR: Measuring Instrumental Self-Reasoning in Frontier Models [7.4] 大規模言語モデル(LLM)エージェントの楽器的自己推論能力を評価する。
インストゥルメンタルな自己推論能力は、最も有能なフロンティアモデルにのみ現れる。
我々の評価は,将来のモデルにおける楽器の自己推論能力の増大を測定するのに有効である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:20:47 GMT)
ProPLIKS: Probablistic 3D human body pose estimation [7.4] 本稿では,確率論的モデルを用いた3次元人間のポーズ推定手法を提案する。
具体的には,SO(3)回転群に配向した流れを正規化し,M"オビウス変換に基づく結合機構を組み込む。
また,これらの入力を様々なポーズにマッピングする作業として,2次元画素配列の入力から3次元人物を再構成する課題を再解釈する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:21:05 GMT)
Enhancing Topological Dependencies in Spatio-Temporal Graphs with Cycle Message Passing Blocks [7.4] 本稿では,グラフのトポロジ的非時間表現に基づく新しいGNNであるCy2Mixerを紹介する。
我々は,Cy2Mixerの有効性を,我々のサイクルメッセージパスブロックが深層学習モデルに識別情報を提供できることを強調した数学的証拠で補強する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:59:15 GMT)
GV-Rep: A Large-Scale Dataset for Genetic Variant Representation Learning [7.4] 可変長コンテキストと詳細なアノテーションを特徴とするGV-Repという大規模遺伝的バリアントデータセットを提案する。
GV-Repは、さまざまな特性、疾患、組織タイプ、実験コンテキストにわたるGV表現を学習するためのディープラーニングモデルのために設計されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:30:16 GMT)
FedMetaMed: Federated Meta-Learning for Personalized Medication in Distributed Healthcare Systems [7.3] パーソナライズドメディケーションのためのフェデレーションメタラーニング(FedMetaMed)について紹介する。
FedMetaMedは、フェデレーションラーニングとメタラーニングを組み合わせて、医療システム全体にわたる多様な患者データに適応するモデルを作成する。
我々は、FedMetaMedが最先端のFL法より優れ、最先端のコホートでも優れた一般化を示すことを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:36:55 GMT)
Enhancing Scene Graph Generation with Hierarchical Relationships and Commonsense Knowledge [7.3] この研究は、関係階層とコモンセンス知識の両方によってシーングラフを生成するための拡張されたアプローチを導入する。
我々は,シーングラフ予測システムから結果を批判するために基礎モデルを活用する,堅牢なコモンセンス検証パイプラインを実装した。
Visual GenomeとOpenImage V6データセットの実験では、既存のシーングラフ生成アルゴリズムのプラグインとプレイの拡張として、提案されたモジュールをシームレスに統合できることが示されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:27:59 GMT)
WACANA: A Concolic Analyzer for Detecting On-chain Data Vulnerabilities in WASM Smart Contracts [7.2] WACANAはWASMコントラクトのアナライザで、オンチェーンデータAPIの詳細なエミュレーションを通じて、脆弱性を正確に検出する。
WACANAはオンチェーンデータテーブルの構造と対応するAPI関数の両方を正確にシミュレートする。
133のコントラクトによる脆弱性データセットの評価は、WACANAが最先端のツールを正確性で上回っていることを示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:51:17 GMT)
SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization [7.2] 大きな言語モデル(LLM)は、様々なタスクにまたがって素晴らしいパフォーマンスを示すが、推論のためにそれらをデプロイすることは、課題を引き起こす。
SKIM: Scaled K-means clustering wIth Mixed precisionを提案する。
モデルパープレキシティの観点からは、3ビット量子化LLaMAモデルとそれらの完全精度モデルとのギャップを平均16.3%縮小する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:19:59 GMT)
ProtDAT: A Unified Framework for Protein Sequence Design from Any Protein Text Description [7.2] 記述型テキスト入力からタンパク質を設計できるde novo微細化フレームワークを提案する。
Prot DATは、タンパク質データの本質的な特性に基づいて、配列とテキストを分離されたエンティティではなく、結合的な全体として統一する。
実験の結果,Prot DATはタンパク質配列生成の最先端性能を実現し,有理性,機能,構造的類似性,妥当性に優れていた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:05:46 GMT)
Masked Autoencoders are PDE Learners [7.1] 仮面事前学習は、リッチな潜在表現を学ぶために異種物理学を統合することができる。
学習された表現は、未知の方程式やパラメータの限られた集合に一般化できることを示す。
マスク付きプレトレーニングは、大規模でラベルなし、異質なデータセットにまたがる統一的な方法として現れることを願っている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:55:44 GMT)
RGB2Point: 3D Point Cloud Generation from Single RGB Images [7.0] RGB2Pointは、Transformerをベースにした3Dポイントクラウド生成のための、未提示のシングルビューRGBイメージである。
本実装では,SOTA拡散モデルよりも15,133倍高速に結果を生成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:38:38 GMT)
Tight PAC-Bayesian Risk Certificates for Contrastive Learning [6.9] コントラスト表現学習のための非空白のPACベイズリスク証明書を開発した。
我々は、データ拡張や温度スケーリングを含むSimCLR固有の要因を取り入れ、対照的なゼロワンリスクのリスク証明書を導出する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:26:26 GMT)
Coordinate In and Value Out: Training Flow Transformers in Ambient Space [6.9] Ambient Space Flow Transformers (ASFT) は、周辺空間におけるフローマッチング変換を学習するためのドメインに依存しないアプローチである。
我々は、ASFTが座標空間で連続的に予測できる条件独立なポイントワイドトレーニング目標を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:00:07 GMT)
Combining Stochastic Defenses to Resist Gradient Inversion: An Ablation Study [6.8] 差分プライバシー(DP)やプライバシモジュール(PM)のような一般的な防御メカニズムは、そのような攻撃を防ぐために計算中にランダム性を導入する。
本稿では,この原理を応用し,共通防御機構をバイパスするターゲットGI攻撃について紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:07:23 GMT)
Compositional Generative Multiphysics and Multi-component Simulation [6.8] 本稿では,これらの課題を克服するために,拡散モデルを用いた構成的多物理・多成分シミュレーション(MultiSimDiff)を提案する。
拡散に基づくトレーニング中、MultiSimDiffは、他のプロセス/コンポーネント上で条件付けられた1つの物理プロセス/コンポーネントの条件確率をモデル化したエネルギー関数を学ぶ。
推測において、MultiSimDiffは、結合確率分布からサンプリングすることで、結合した多重物理解と多成分構造を生成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:58:30 GMT)
A Deep RL Approach on Task Placement and Scaling of Edge Resources for Cellular Vehicle-to-Network Service Provisioning [6.8] エッジリソースのサービスタスク配置とスケーリングの相互依存問題に対処する。
本稿では,ハイブリッド行動空間で動作する新しいDeep Reinforcement Learning (DRL) アプローチを提案する。
実世界のC-V2Nトラフィックデータセットを用いたシミュレーションによりDHPGの性能を評価する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:23:14 GMT)
LMDM:Latent Molecular Diffusion Model For 3D Molecule Generation [6.7] 本稿では,3次元分子を多様性に富み,リッチな幾何学的特徴を維持できる潜在分子拡散モデルを提案する。
このモデルは、原子間の力と局所的な制約の情報を取り込んで、生成した分子がユークリッド変換を維持する。
実験では, 生成した試料の品質とモデル収束速度を大幅に改善した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:25:18 GMT)
Unpaired Optical Coherence Tomography Angiography Image Super-Resolution via Frequency-Aware Inverse-Consistency GAN [6.7] 本稿では,GANに基づくOCTA画像の非ペア化超解像法を提案する。
また,再構成画像の正確なスペクトル化を容易にするため,識別器の周波数認識による逆方向の損失も提案する。
実験により,本手法は,他の最先端の未経験手法よりも定量的,視覚的に優れていることが示された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:56:23 GMT)
A Survey on Point-of-Interest Recommendations Leveraging Heterogeneous Data [6.7] 観光はレコメンデーションシステムにとって重要な分野である。
しかし、観光客にPOIレコメンデーションを提供することは、ユーザの状況の変化のため、特に困難である。
我々は,2021年から2023年にかけてのPOI勧告問題に関する調査結果を公表した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:04:14 GMT)
On-Chip Enhanced Biphoton Generation with Incoherent Light [6.5] 標準シリコンナノワイヤの時間的非コヒーレント光によって励起される自発4波混合により光子対光源を作製する。
コヒーレントレーザーと比較すると、非コヒーレンスによりポンプ利用効率が向上し、光源輝度が向上する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:45:27 GMT)
MUSE-VL: Modeling Unified VLM through Semantic Discrete Encoding [6.5] マルチモーダル理解と生成のための離散言語を通して、統一視覚言語モデルセマンティックであるMUSE-VLを紹介する。
提案手法は,様々な視覚言語ベンチマークにおいて,従来の最先端モデルを大幅に上回り,専用の理解モデルよりも優れた性能を実現している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:54:29 GMT)
PePR: Performance Per Resource Unit as a Metric to Promote Small-Scale Deep Learning in Medical Image Analysis [6.5] 大規模リソースは、徐々に大きなディープラーニングモデルを訓練するために使われてきた。
これらのコストは、そのような規模のリソースへのアクセスが限られている研究者や実践者にとって、新たなタイプの参入障壁になりつつある。
医療画像解析タスクにおける既存のDLモデルの展望を概観し,資源が限られている環境での有用性を実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:57:19 GMT)
SwiftEdit: Lightning Fast Text-Guided Image Editing via One-Step Diffusion [6.4] 我々は,テキスト誘導画像編集を実現するシンプルな,かつ高効率な編集ツールであるSwiftEditを紹介した。
SwiftEditの進歩には、2つの新しいコントリビューションがある。
特にSwiftEditは、従来のマルチステップメソッドよりもはるかに高速な、インスタントテキストガイドの画像編集を可能にする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:23:11 GMT)
From Models to Systems: A Comprehensive Fairness Framework for Compositional Recommender Systems [6.3] 現実のレコメンデーションシステムは、複数のモデルや複数のステージ上に構築されている。
本稿では,システムレベルの公平性をモデル化するための総合的な枠組みを提案する。
提案手法が合成データセットおよび実データセットに与える影響を実証的に実証した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:59:26 GMT)
Bench-CoE: a Framework for Collaboration of Experts from Benchmark [6.3] 大規模言語モデル(LLM)は、知的システムを複数のタスクを処理するために駆動する重要な技術である。
本稿では,ベンチマーク評価を効果的に活用し,専門家コラボレーション(CoE)を可能にするBench-CoEフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:03:41 GMT)
HEAL: Hierarchical Embedding Alignment Loss for Improved Retrieval and Representation Learning [6.3] RAGは、外部文書検索を統合して、ドメイン固有のまたは最新の知識を提供することで、LLM(Large Language Models)を強化する。
RAGの有効性は、取得した文書の関連性に依存し、ドメインの専門コンテンツと埋め込みのセマンティックアライメントに影響される。
本稿では,階層的ファジィクラスタリングと行列分解を併用した新しい手法である階層的エンベディング・アライメント・ロス(HEAL)を紹介する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:10:56 GMT)
SoRA: Singular Value Decomposed Low-Rank Adaptation for Domain Generalizable Representation Learning [6.3] ドメインの一般化は、1つまたは複数のソースドメインを使用してモデルを適応し、目に見えないターゲットドメインで堅牢なパフォーマンスを保証することを目的としています。
既存のPEFT手法は、事前訓練されたモデルの一般化可能なコンポーネントと学習タスク固有の特徴のバランスをとるのに苦労する。
Singular Value Decomposed Low-Rank Adaptation (SoRA)を導入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:17:57 GMT)
Separate, Dynamic and Differentiable (SMART) Pruner for Block/Output Channel Pruning on Computer Vision Tasks [6.2] ブロックプルーニング(Block pruning)は、重みの連続ブロックを除去する構造的プルーニング法である。
既存のブロックプルーニングアルゴリズムは、3つの要求を同時に満たさない。
本稿では,このギャップに対処する新しいアルゴリズムSMARTプルーニングを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:29:07 GMT)
Knowledge Transfer based Evolutionary Deep Neural Network for Intelligent Fault Diagnosis [6.2] 本稿では,ラベル付きデータサンプルの可用性を制限したDNNアーキテクチャを最適とする進化的Net2Net変換(EvoN2N)を提案する。
提案フレームワークは,時間を要する探索処理を伴わずに,インテリジェントな故障診断のための最良のモデルを得ることができる。
得られた最良のモデルは、ほとんどの操作条件に対して、優れた診断性能と分類精度をほぼ100%まで示すことができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:50:39 GMT)
Magnetic Resonance Imaging Feature-Based Subtyping and Model Ensemble for Enhanced Brain Tumor Segmentation [6.1] 本稿では,最先端セグメンテーションモデルを統合する深層学習に基づくアンサンブル手法を提案する。
BraTSデータセットに存在する腫瘍の不均一性を考えると、この手法はセグメンテーションモデルの精度と一般化性を高める。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:00:00 GMT)
Adult Glioma Segmentation in Sub-Saharan Africa using Transfer Learning on Stratified Finetuning Data [6.1] グリオーマは低所得国、中所得国、特にサハラ以南のアフリカで診断上の課題を呈している。
本稿では、最小限のMRIデータと低品質のMRIデータを用いて、リソース制限領域の課題に対処するために、トランスファーラーニングを用いたグリオーマセグメンテーションの新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:29:12 GMT)
Loss Terms and Operator Forms of Koopman Autoencoders [6.0] クープマンオートエンコーダは演算子学習において一般的なアーキテクチャである。
損失関数と演算子の形式は文献によって大きく異なる。
本稿では,これらの選択肢について,公正かつ体系的な研究を行う。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:48:13 GMT)
Dynamic Graph Representation with Contrastive Learning for Financial Market Prediction: Integrating Temporal Evolution and Static Relations [5.9] 時間グラフ学習(TGL)は、株式市場の進化する性質を捉えるために不可欠である。
伝統的な手法は、動的時間的変化とストック間の静的構造の間の相互作用を無視することが多い。
動的グラフ関係と静的グラフ関係を統合するコントラスト学習フレームワークによる動的グラフ表現を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:15:56 GMT)
LaserGuider: A Laser Based Physical Backdoor Attack against Deep Neural Networks [5.9] バックドア攻撃はディープニューラルネットワーク(DNN)にトリガーとターゲットの間の隠れた関連を埋め込む
物理的物体をトリガーとして使用する物理的バックドア攻撃は実現可能であるが、遠隔操作、時間的ステルスネス、柔軟性、移動性が欠如している。
本稿では,長距離伝送特性とインスタントイメージング特性を特徴とするレーザを利用した新しいバックドアトリガを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:14:50 GMT)
Memory-efficient Continual Learning with Neural Collapse Contrastive [5.8] コントラスト学習は表現品質を大幅に改善し、連続学習(CL)におけるタスク間の知識伝達を高めた
しかし、対照的な手法は主にサンプル間の「ソフトな関係」や「ソフトな関係」に焦点を当てているため、破滅的な忘れは依然として重要な課題である。
本稿では,ソフトな関係とハードな関係を効果的にバランスさせる新しい表現学習損失であるFNC2を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:38:58 GMT)
Network Formation and Dynamics Among Multi-LLMs [5.8] GPT、Claude、Llamaのような大規模言語モデル(LLM)は、ますます社会的および専門的な設定に統合されるようになっている。
本研究では、複数のLLMのネットワーク形成挙動が人間のネットワーク力学の特定の側面に近似するかどうかを検討する枠組みを開発する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:35:22 GMT)
OffensiveLang: A Community Based Implicit Offensive Language Dataset [5.8] ヘイトスピーチや攻撃的な言語は、明示的な形と暗黙的な形の両方に存在する。
OffensiveLangはコミュニティベースの暗黙的な攻撃的な言語データセットである。
本稿では、暗黙の攻撃的言語を効果的に生成するプロンプトベースのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:43:34 GMT)
RILQ: Rank-Insensitive LoRA-based Quantization Error Compensation for Boosting 2-bit Large Language Model Accuracy [5.8] 低ランク適応(LoRA)がパラメータ効率のLLM微調整の主流となっている。
LoRAベースの量子化誤差補償(LQEC)は圧縮LDMの精度を回復するための強力なツールである。
RILQ(Rank-Insensitive LoRA-based Quantization Error Compensation)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:05:01 GMT)
Safe Adaptive Cruise Control Under Perception Uncertainty: A Deep Ensemble and Conformal Tube Model Predictive Control Approach [5.7] 本稿では、不確実性を予測・定量化するために、コンフォーマル予測と統合されたディープニューラルネットワーク回帰器のディープアンサンブルについて考察する。
コンフォーマルチューブモデル予測制御を用いた適応型クルーズ制御装置は、確率論的安全性を確保するために設計されている。
高忠実度シミュレータによる評価は、速度トラッキングと安全な距離維持におけるアルゴリズムの有効性を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:01:53 GMT)
Motion-Guided Deep Image Prior for Cardiac MRI [5.7] Motion-Guided Deep Image priorは、リアルタイム心磁図の高速化のための新しい教師なし再建フレームワークである。
M-DIPは、生理的動きとフレーム間コンテンツの変化を同時にキャプチャする。
M-DIPは、ファントムデータにおける画像品質の指標と、生存中の患者データに対する高い読取スコアを達成した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:15:18 GMT)
CoSy: Evaluating Textual Explanations of Neurons [5.7] 我々は、潜伏ニューロンのテキスト説明を評価するためのフレームワークであるCoSyを紹介する。
生成したデータポイントと制御データポイントとのニューロンの応答を比較することで、説明の質を推定できる。
我々は、コンピュータビジョンタスクの健全性チェックと様々なニューロン記述手法のベンチマークにより、我々のフレームワークを検証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:48:24 GMT)
ARTeFACT: Benchmarking Segmentation Models on Diverse Analogue Media Damage [5.7] ARTeFACTは各種アナログ媒体の損傷検出のためのデータセットである。
11,000以上の注釈は、様々な主題、メディア、歴史に残る15種類の損害をカバーしている。
我々は、ゼロショット、教師なし、教師なし、テキスト誘導設定において、CNN、トランスフォーマー、拡散ベースセグメンテーションモデルおよび基礎視覚モデルを評価する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:52:25 GMT)
Un-evaluated Solutions May Be Valuable in Expensive Optimization [5.7] 本稿では,選択段階における代理モデルによって予測される高品質で未評価なソリューションを取り入れた戦略的アプローチを提案する。
このアプローチは評価された解の分布を改善することを目的としており、それによってより優れた次世代の解を生成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:06:30 GMT)
PDNNet: PDN-Aware GNN-CNN Heterogeneous Network for Dynamic IR Drop Prediction [5.5] 電力供給ネットワーク(PDN)上のIRドロップは、PDNの構成とセル電流消費と密接に関連している。
PDN構造と微細な細胞-PDN関係の表現を統一する新しいグラフ構造PDNGraphを提案する。
我々は、深層学習に基づく動的IRドロップ予測法にグラフ構造を適用した最初の研究である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:02:11 GMT)
Reflective Teacher: Semi-Supervised Multimodal 3D Object Detection in Bird's-Eye-View via Uncertainty Measure [5.5] そこで我々は,学生がラベル付きデータと擬似ラベル付きデータの両方で訓練される,反射型教員という新しい概念を紹介した。
また,マルチモーダルなBEV特徴の効率的なアライメントのためのGeometry Aware BEV Fusion (GA-BEV)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:54:39 GMT)
Practical Considerations for Agentic LLM Systems [5.5] 本稿では、確立されたアプリケーションパラダイムの文脈における研究コミュニティからの実行可能な洞察と考察について述べる。
すなわち、アプリケーション中心の文献における一般的な実践に基づいて、関連する研究成果を4つの幅広いカテゴリ – プランニング、メモリツール、コントロールフロー – に位置づける。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:57:49 GMT)
Scalable Early Childhood Reading Performance Prediction [5.4] 将来の読み出し性能をモデル化し予測するための適切な教育データセットは存在しない。
本稿では,拡張コア読み取り命令ECRIデータセットを紹介する。
我々は、このデータセットを活用して、幼児期の教育パターンを認識する最先端の機械学習モデルの有効性を実証的に評価する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:50 GMT)
HCC: A Language-Independent Hardening Contract Compiler for Smart Contracts [5.4] 我々は,HCCと呼ばれる,最初の実用的なスマートコントラクトコンパイラを提案する。
HCCは、新しい言語に依存しないコードプロパティグラフ(CPG)の表記に基づいて、ソースコードレベルでのセキュリティ強化チェックを挿入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:24:22 GMT)
Deformation-Aware Segmentation Network Robust to Motion Artifacts for Brain Tissue Segmentation using Disentanglement Learning [5.4] 磁気共鳴画像(MRI)における運動アーティファクトの意義
本研究では,動作補正と頑健な脳組織分割の両面で優れた性能を示す新しいディープラーニングフレームワークを提案する。
In-vivo experiment on pediatric Motion data, we proposed on the-of-the-art method in segmenting motion-corrupted MRI scans。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:52:42 GMT)
Building an Explainable Graph-based Biomedical Paper Recommendation System (Technical Report) [5.2] XGPRecはグラフベースで説明可能な方法である。
我々は,XGPRecがバイオメディカルドメインから3700万の文書を収集し,実際のデジタルライブラリを管理可能であることを示す。
ユーザライブラリがXGPRec上に構築できるように、コードを共有しています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:20:35 GMT)
Understanding Memorization in Generative Models via Sharpness in Probability Landscapes [5.1] 対数確率密度のHessianの固有値を用いて拡散モデルのメモリ化を解析する。
提案手法は,拡散モデルにおける記憶の明確な理解を提供し,セキュアで信頼性の高い生成モデルを実現するための戦略開発の基礎となる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:07:24 GMT)
PBP: Post-training Backdoor Purification for Malware Classifiers [5.1] 近年、サイバーセキュリティにおける機械学習(ML)の台頭は、バックドア中毒の脅威の増加など、新たな課題をもたらしている。
ここでは,特定のバックドア埋め込み機構を仮定することなく,様々な種類のバックドア埋め込みを緩和するマルウェア分類器の訓練後防御であるPBPを紹介する。
提案手法は,2つのデータセット,2種類のバックドア手法,各種攻撃構成の実験により実証された,最先端の手法に対する大きな優位性を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:03:26 GMT)
Non-Asymptotic Bounds for Closed-Loop Identification of Unstable Nonlinear Stochastic Systems [5.1] 単軌道データから最小2乗パラメータを推定する問題を考える。
我々は,この領域で状態軌跡が進化する際の推定誤差について,漸近的でない保証を確立する。
状態空間全体が情報的であれば、エラーホールドが常に高い確率で保証される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:45:35 GMT)
Multi-View Pose-Agnostic Change Localization with Zero Labels [5.0] 複数の視点から情報を統合したラベルのないポーズに依存しない変化検出手法を提案する。
ポストチェンジシーンの5つの画像で、我々のアプローチは3DGSで追加の変更チャンネルを学習できる。
変更対応の3Dシーン表現により、見当たらない視点の正確な変更マスクの生成が可能となる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:28:54 GMT)
Approximation Algorithms for D-optimal Design [4.9] 実験設計は古典的な統計問題であり、その目的は線形測定から未知の$m$次元ベクトル$beta$を推定することである。
実験的な設計問題に対しては、与えられた$n$実験から$k$を選び、未知のパラメータの最も正確な推定を行うことが目的である。
誤差推定の最も堅牢な尺度の1つとして、推定誤差に対する信頼楕円体の体積を最小化する$D$-optimality criterionについて検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:29:42 GMT)
Deep priors for satellite image restoration with accurate uncertainties [4.9] 本稿では,複数のセンサからの画像を復元する1つのネットワークを包含する汎用手法を提案する。
VBLE-xzは、現実的な後続サンプルと正確な不確実性を得るためのスケーラブルな方法である。
SatDPIRは、不確実性を必要としない場合、直接反転法に代わる魅力的な代替手段である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:56:03 GMT)
Improving Fine-Grained Control via Aggregation of Multiple Diffusion Models [4.7] 本稿では,AMDM(Aggregation of Multiple Diffusion Models)という新しいアルゴリズムを提案する。
AMDMは複数の拡散モデルから特定のモデルに特徴を合成し、きめ細かい制御のために特定の特徴を活性化する。
実験結果から,AMDMはトレーニング無しで微粒化制御を著しく改善し,その効果が証明された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:44:53 GMT)
Neural Two-Level Monte Carlo Real-Time Rendering [4.6] グローバル照明によるシーンのリアルタイムレンダリングのための効率的な2レベルモンテカルロ推定器を提案する。
まず、完全に融合した小さなニューラルネットワークのパワーを活用して、NIRC(Neural Incident Radiance Cache)を開発した。
残差積分については、NIRC予測と非バイアス経路追跡シミュレーションの差を計算する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:06:23 GMT)
MultiTASC++: A Continuously Adaptive Scheduler for Edge-Based Multi-Device Cascade Inference [4.6] 分散推論のための連続適応型マルチテナンシ対応スケジューラであるMultiTASC++を紹介する。
我々は、スケジューラが目標満足度を継続的に維持する上で有効であり、最大100台のデバイスで、さまざまなデバイス層とワークロードで最高の可用性を提供していることを実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:19:34 GMT)
Action Mapping for Reinforcement Learning in Continuous Environments with Constraints [4.5] 本稿では,アクションマッピングを利用した新しいDRL学習手法を提案し,学習プロセスの合理化を図る。
動作マッピングは制約のある環境でのトレーニング性能を大幅に向上させる実験を通して実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:42:45 GMT)
MVUDA: Unsupervised Domain Adaptation for Multi-view Pedestrian Detection [4.5] 我々は、ラベル付きデータをテストで使用するものと異なるマルチカメラ設定を用いて収集する環境で、多視点歩行者検出に対処する。
ラベル付きデータを追加することなく新しいリグにモデルを適応させる,教師なしドメイン適応(UDA)手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:36:12 GMT)
Data-driven Piecewise Affine Decision Rules for Stochastic Programming with Covariate Information [4.5] 非部分的決定(PADR)に埋め込まれた経験的リスク(M)手法を提案する。
提案手法は理論的整合性を持つ広範で非クラスな非制約問題に適用可能であることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:50:52 GMT)
TiM4Rec: An Efficient Sequential Recommendation Model Based on Time-Aware Structured State Space Duality Model [4.4] 状態空間双対性(SSD)に基づくMamba1とMamba2の2世代からなるTransformerからMambaアーキテクチャへ、シーケンスレコメンデーションモデリングが移行している。
SSDはSSMに比べて計算効率が優れているが、シーケンシャルなレコメンデーションタスクでは性能が低下する。
我々は,低次元SSD環境での性能劣化を軽減し,計算効率を保ちながら,Tim4Rec(Time-Aware Mamba for Recommendation)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:28:42 GMT)
Augmenting Minds or Automating Skills: The Differential Role of Human Capital in Generative AI's Impact on Creative Tasks [4.4] ジェネレーティブAIは、創造的な仕事を急速に作り直し、その受益者や社会的意味について批判的な疑問を提起している。
この研究は、創造的タスクにおいて、生成的AIが様々な形態の人的資本とどのように相互作用するかを探求することによって、一般的な仮定に挑戦する。
AIはクリエイティブツールへのアクセスを民主化するが、同時に認知的不平等を増幅する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:27:14 GMT)
Physics-informed Deep Learning for Muscle Force Prediction with Unlabeled sEMG Signals [4.4] 本稿では,モデルトレーニング中にラベル情報なしで筋力を予測する物理インフォームドディープラーニング手法を提案する。
また,提案手法は筋腱パラメータの同定にも有効である。
筋力の予測結果は,根平均二乗誤差(RMSE)と基準法に比べて高い判定係数を示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:47:38 GMT)
Cubify Anything: Scaling Indoor 3D Object Detection [4.3] 本研究では,コモディティハンドヘルドデバイスから取得した1つのRGB(-D)フレームについて,屋内3次元物体検出について考察する。
このデータセットは、1K以上の高精度のレーザースキャンシーンに400K以上の3Dオブジェクトを徹底的にラベル付けする。
次に,RGB(-D)入力から得られる2D特徴から直接3Dボックスを予測し,3Dを点数やボクセルベース表現で操作する代わりに,完全なトランスフォーマー3Dオブジェクト検出ベースラインであるCuTRを確立する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:09 GMT)
Traffic Co-Simulation Framework Empowered by Infrastructure Camera Sensing and Reinforcement Learning [4.3] マルチエージェント強化学習(MARL)は、反復シミュレーションを用いて、ネットワーク内の信号機の制御戦略の学習に特に有効である。
本研究では,高忠実度3次元モデリングと大規模交通流シミュレーションを組み合わせたCARLAとSUMOを統合したシミュレーションフレームワークを提案する。
テストベッドでの実験では、リアルタイムカメラを用いた交通状況検出におけるMARLアプローチの有効性が実証された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:01:56 GMT)
Gaussians on their Way: Wasserstein-Constrained 4D Gaussian Splatting with State-Space Modeling [4.3] 現実世界と同じように自然に3Dガウスを移動させる方法を紹介します。
先行予測と現在の観測とを融合した状態整合フィルタを提案する。
また、ワッサーシュタイン距離正規化を用いて、ガウスパラメータのスムーズで一貫した更新を保証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:42:59 GMT)
Fab-ME: A Vision State-Space and Attention-Enhanced Framework for Fabric Defect Detection [4.3] YOLOv8sをベースとした先進的なフレームワークであるFab-MEを提案し,20種類のファブリック欠陥を正確に検出する。
コントリビューションには2つのコンボリューション(C2F)ビジョン状態空間(C2F-VMamba)モジュールによるクロスステージ部分ボトルネックの導入が含まれている。
Tianchiファブリック欠陥検出データセットの実験結果から、Fab-MEは元のYOLOv8と比べてmAP@0.5で3.5%改善していることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:02:22 GMT)
Targeting the Core: A Simple and Effective Method to Attack RAG-based Agents via Direct LLM Manipulation [4.2] 大規模言語モデル(LLM)を駆使したAIエージェントは、シームレスで自然な、コンテキスト対応のコミュニケーションを可能にすることによって、人間とコンピュータのインタラクションを変革した。
本稿では,AIエージェント内のLLMコアを標的とした敵攻撃という,重大な脆弱性について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:38:30 GMT)
Agent-OM: Leveraging LLM Agents for Ontology Matching [4.2] 本研究では,オントロジーマッチングシステムのための新しいエージェント駆動設計パラダイムを提案する。
本稿では,検索とマッチングのための2つのシームズエージェントからなるAgent-OM (Agent for Ontology Matching) フレームワークを提案する。
本システムは,OMタスクにおける長年の最高性能に非常に近い結果が得られる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:45:05 GMT)
BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages [4.1] 本稿では,36言語を対象とした翻訳モデルとその関連アプリケーションの開発に焦点をあてる。
スクリプトのバリエーション、音声の違い、構文の多様性といった課題に対処する。
既存の資源を活用し、並列データセットを開発し、ドメイン固有のコーパスを生成し、合成データ技術を利用するコーパス作成戦略を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:10:19 GMT)
Leveraging Multimodal Protein Representations to Predict Protein Melting Temperatures [4.1] 我々はESM-2、ESM-3、SaProt、AlphaFoldといった強力なタンパク質言語モデルに基づくモデルを開発する。
我々は、s571テストデータセット上で新しい最先端性能を求め、ピアソン相関係数(PCC)0.50を得る。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:03:09 GMT)
Context-Informed Machine Translation of Manga using Multimodal Large Language Models [4.1] マルチモーダル大言語モデル(LLM)がマンガの翻訳に有効かを検討した。
具体的には,マルチモーダルLLMの視覚成分を利用して翻訳品質を向上させる手法を提案する。
本稿では,日本語とポーランド語を同時翻訳する新たな評価データセットを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:41:48 GMT)
Expanding Deep Learning-based Sensing Systems with Multi-Source Knowledge Transfer [3.9] 本稿では,センサシステムを拡張するための効率的な知識伝達フレームワークであるHaKTを提案する。
まず、低コストでシステムから複数の高品質モデルを選択し、次に、サンプルワイドの重みを予測に割り当てることで知識を融合させる。
実験によると、HaKTは最先端のベースラインを少なくとも16.5%上回り、通信トラフィックを最大39%削減している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:55:54 GMT)
PANGAEA: A Global and Inclusive Benchmark for Geospatial Foundation Models [3.9] PANGAEAは標準化された評価プロトコルであり、さまざまなデータセット、タスク、解像度、センサーのモダリティ、時間性をカバーする。
我々は、このベンチマークで利用可能な最も人気のあるGFMを評価し、その性能を複数のドメインで分析する。
本研究は, GFMの限界を, 異なるシナリオ下で強調し, 教師付きモデルよりも常に優れていないことを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:40:41 GMT)
Mathematical Frameworks of All-Quantum Mode Adaptable Communication Processors [3.9] 全量子モード適応は、異なる量子ノードを共通のネットワークに適応させるのに不可欠である。
本稿では、異なる量子信号間の整合性を管理する上で重要な3つの重要な要素であるモード展開、モード縮小、モードマッピングに焦点を当てる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:36:31 GMT)
Finite-sample performance of the maximum likelihood estimator in logistic regression [3.8] 本稿では,ロジスティック回帰に対する最大極大推定器(MLE)の予測性能について考察する。
我々は,MLEの存在と過剰なロジスティックリスクについて,急激な非漸近的保証を得る。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:46:44 GMT)
Kernel-Based Optimal Control: An Infinitesimal Generator Approach [3.7] 無限次元再生ヒルベルト核空間内での無限小生成学習を用いた非線形システムの最適制御手法を提案する。
我々の学習フレームワークは、システム力学とステージコスト関数のデータサンプルを利用しており、制御のペナルティと制約しか提供されていない。
このアプローチが現代的な凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを示し、最適制御問題に対するデータ駆動解を可能にする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:22:00 GMT)
SocialMind: LLM-based Proactive AR Social Assistive System with Human-like Perception for In-situ Live Interactions [3.7] SocialMindは、ユーザーがその場でソーシャル・アシストを提供する最初のアクティブなARソーシャル・アシスト・システムだ。
SocialMindは、多モードセンサーを活用して、言語と非言語の両方の手がかり、社会的要因、暗黙のペルソナを抽出する。
我々は,SocialMindがベースラインよりも38.3%高いエンゲージメントを達成し,95%の参加者が生のソーシャルインタラクションにSocialMindを積極的に利用していることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:19:36 GMT)
Geometry of the Space of Partitioned Networks: A Unified Theoretical and Computational Framework [3.7] ネットワークの空間」は、従来の統計ツールでは適切に記述できない複雑な構造を持つ。
本稿では,グラフやハイパーグラフ,あるいはノードが分類クラスに分割されたグラフなどの一般化されたネットワーク構造をモデル化するための測度理論形式について紹介する。
我々は、我々の計量が非負曲率のアレクサンドロフ空間であることを示し、この構造を利用して、幾何データ解析タスクで一般的に生じる特定の関数の勾配を定義する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:59:57 GMT)
Neural Network-Based Frequency Optimization for Superconducting Quantum Chips [3.7] 超伝導量子チップのためのニューラルネットワークに基づく周波数構成手法を提案する。
トレーニングされたニューラルネットワークモデルは、周波数設定エラーを推定し、中間最適化戦略は、チップのローカライズされた領域内の最適な構成を特定する。
また、変動量子固有解法のためのクロストーク対応ハードウェア効率アンサッツを設計し、改良されたエネルギー計算を実現する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:54:29 GMT)
Topological Aspects of Dirac Fermions in a Kagomé Lattice [3.7] ディラックフェルミオン(英: Dirac fermion)は、六角形のブリルアンゾーンの2つの同値な角で異なる谷の低エネルギー物理学を統治する。
ホロウ・オブ・ダビデ相は、ディラック質量のサインチェンジと異なる$mathbbZ_6$ベリー相を持つ。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:44:25 GMT)
Exploring Transformer-Based Music Overpainting for Jazz Piano Variations [3.7] 音楽のオーバーペイントは、入力の旋律構造と調和構造を保持しながら、新しいバリエーションを生成する。
既存のアプローチは小さなデータセットによって制限されており、スケーラビリティと多様性が制限されている。
VAR4000は,4,352組のトレーニングペアからなる,より大きなジャズピアノ演奏データセットのサブセットである。
予備的な結果は、より大きなデータセット構成による一般化とパフォーマンスの有望な改善を示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:48:23 GMT)
UNCOVER: Unknown Class Object Detection for Autonomous Vehicles in Real-time [3.6] トレーニング中に見たオブジェクトからクラス固有のオブジェクトではなく、ジェネリックを導入する。
実際の対象が占める予測領域の比率を計算することにより、対象性を評価することを学ぶ。
我々のソリューションであるUNCOVERは、非未知のクラスオブジェクトをリアルタイムに検出するために、リアルタイム検出と未知のオブジェクトの高速リコールを両立させるのに優れています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:04:11 GMT)
Safe and Efficient Online Convex Optimization with Linear Budget Constraints and Partial Feedback [3.6] 本稿では,未知の線形予算制約を伴うオンライン凸最適化について検討する。
本稿では,安全かつ効率的なLyapunov-Optimizationアルゴリズム(SELO)を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:58:41 GMT)
Marginal Causal Flows for Validation and Inference [3.5] 複雑なデータから得られる結果に対する介入の限界因果効果を調べることは依然として困難である。
Frugal Flowsは、正規化フローを使用してデータ生成過程を柔軟に学習する新しい確率ベース機械学習モデルである。
シミュレーションと実世界の両方のデータセットで実験を行った。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:49:36 GMT)
The EU AI Act is a good start but falls short [3.5] EU AI Actは、倫理的かつ安全なAI開発とEU全体の展開を保証するために設立された。
本研究は,企業の資源集中を効果的に支援するための重要な課題と戦略を明らかにすることを目的とする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:15:07 GMT)
Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream [3.5] 霊長類視覚腹側流(VVS)のモデリングにおけるスケーリング法則の評価を行った。
行動アライメントはより大きなモデルでスケールし続けるが、ニューラルアライメントは飽和する。
スケーリングの増加は、少数のサンプルでトレーニングされた小さなモデルでは、アライメントが不十分である、高レベルの視覚領域において特に有益である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:39:07 GMT)
Local Curvature Smoothing with Stein's Identity for Efficient Score Matching [3.4] 本稿では,Stein's Identity (LCSS) を用いた局所曲率スムースなスコアマッチング変種を提案する。
LCSSは、スタインのアイデンティティを適用してジャコビアントレースをバイパスし、正規化の有効性と効率的な計算を可能にした。
LCSSは,サンプル生成性能において既存の手法を上回り,スコアマッチングの性能と一致することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:26:13 GMT)
Hostility Detection in UK Politics: A Dataset on Online Abuse Targeting MPs [3.4] 政治家は通常、政府の役割に関連しているが、コメントは個人のアイデンティティを攻撃する傾向がある。
英国議会議員に対する敵意を手動で注釈付けした2年間の英語ツイート3,320件のデータセットを構築した。
我々は、英国政治データのユニークな内容を調べるために、言語学的および話題的分析を行う。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:37:38 GMT)
Electronic Health Records-Based Data-Driven Diabetes Knowledge Unveiling and Risk Prognosis [3.3] 本研究は, 双方向長期記憶ネットワーク(BiLSTM-CRF)の機能と, XGBoost と Logistic Regression を融合した革新的モデルを提案する。
このモデルは、電子カルテデータの詳細な分析を行うことにより、糖尿病リスク予測の精度を高めるように設計されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:26:07 GMT)
Map It Anywhere (MIA): Empowering Bird's Eye View Mapping using Large-scale Public Data [3.2] トップダウンのBird's Eye View (BEV)マップは地上ロボットナビゲーションの一般的な表現である。
最近の手法では、ファーストパーソンビュー(FPV)画像からBEVマップを予測することが約束されているが、その一般化可能性は、現在の自動運転車ベースのデータセットによってキャプチャされた小さな領域に限られている。
2つの大規模クラウドソースマッピングプラットフォームを利用することで,よりスケーラブルなマップ予測手法が実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:54:08 GMT)
Adaptive Circuit Behavior and Generalization in Mechanistic Interpretability [3.1] GPT-2小領域における間接物体識別(IOI)回路の汎用性について検討する。
その結果、回路は驚くほどよく一般化し、全ての部品と機構を再利用し、入力エッジを追加するだけでよいことがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:16:57 GMT)
Synergizing LLMs and Knowledge Graphs: A Novel Approach to Software Repository-Related Question Answering [3.1] ソフトウェアリポジトリには、開発プロセスに関する洞察を得るための貴重な情報が含まれている。
これらのレポジトリデータから洞察を抽出するのには時間がかかり、技術的な専門知識が必要です。
本研究では,レポジトリ関連の質問に知識グラフを付加することにより,LLMベースのチャットボットの精度を向上させることを目的とする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:18:03 GMT)
DeepFEA: Deep Learning for Prediction of Transient Finite Element Analysis Solutions [3.0] 有限要素解析(英: Finite Element Analysis, FEA)は、物理現象をシミュレーションする強力な計算集約手法である。
機械学習の最近の進歩は、FEAを加速できるサロゲートモデルにつながっている。
この研究ギャップに触発された本研究では,ディープラーニングベースのフレームワークであるDeepFEAを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:46:18 GMT)
Context Matters: Leveraging Contextual Features for Time Series Forecasting [3.0] 既存の予測モデルにマルチモーダルなコンテキスト情報を外科的に統合する新しいプラグイン・アンド・プレイ手法であるContextFormerを導入する。
ContextFormerは、カテゴリ、連続、時間変化、さらにはテキスト情報を含む、リッチなマルチモーダルコンテキストから予測固有の情報を効果的に蒸留する。
エネルギー、交通、環境、金融ドメインにまたがるさまざまな実世界のデータセットにおいて、SOTA予測モデルを最大30%上回ります。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:27:31 GMT)
DistB-VNET: Distributed Cluster-based Blockchain Vehicular Ad-Hoc Networks through SDN-NFV for Smart City [3.0] 本研究では、スマートシティにおける安全でスケーラブルで信頼性の高い車両ネットワークを実現するために、分散ベースのVehicular Ad-hoc Network(DistB-VNET)アーキテクチャを提案する。
提案されているフレームワークは、安全なデータ管理のための分散ブロックチェーンと、動的ネットワーク管理とリソース効率のためのFunction-NFVである。
DistB-VNET"は二重層ブロックチェーンシステムを提供し、分散ブロックチェーンは車両間の安全な通信を提供し、クラウド内の集中型ブロックチェーンはデータの検証とストレージを担当する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:55:05 GMT)
Integrating Various Software Artifacts for Better LLM-based Bug Localization and Program Repair [2.9] 本稿では,問題コンテンツ(記述とメッセージ)とスタックエラートレースを用いてバグギーメソッドをローカライズするDevLoReを提案する。
異なるアーティファクトを組み込むことで、DevLoReはシングルとノンシングルのバグギーメソッドの49.3%と47.6%をうまく見つけることができた。
これは現在の最先端のAPRメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:21:31 GMT)
Learning to Reconstruct Accelerated MRI Through K-space Cold Diffusion without Noise [2.8] ガウス雑音を伴わずにk空間における画像劣化と復元を行うk空間冷拡散モデルを提案する。
以上の結果から, この新たな劣化処理により, 高速MRIのための高品質な再構成画像が生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:16:10 GMT)
CLINICSUM: Utilizing Language Models for Generating Clinical Summaries from Patient-Doctor Conversations [2.8] クリニックサムは、患者と医師の会話から臨床要約を自動的に生成するように設計されたフレームワークである。
自動測定(ROUGE、BERTScoreなど)と専門家による評価によって評価される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:34:02 GMT)
LossVal: Efficient Data Valuation for Neural Networks [2.8] LossValは、ニューラルネットワークトレーニング中の重要度を計算する効率的なデータ評価手法である。
LossValは計算コストを削減し、大規模なデータセットと実用的なアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:46:55 GMT)
Speech Recognition-based Feature Extraction for Enhanced Automatic Severity Classification in Dysarthric Speech [2.7] 本稿では,新しい特徴抽出源としてASR転写を導入する。
変形性音声のASRモデルを微調整し、このモデルを用いて変形性音声を転写し、単語セグメント境界情報を抽出する。
これらの特徴は、83.72%のバランスの取れた精度で、既存の特徴に対する重大さ予測性能を改善した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 00:12:53 GMT)
BEFL: Balancing Energy Consumption in Federated Learning for Mobile Edge IoT [2.7] Mobile Edge IoT(MEIoT)では、トレーニングと通信プロセスはデバイスの限られたバッテリーリソースを著しく減らすことができる。
我々は,グローバルモデル精度の向上,全エネルギー消費の最小化,デバイス間のエネルギー利用格差の低減という,3つの目標のバランスを図るための共同最適化フレームワークであるBEFLを提案する。
実験の結果、BEFLはグローバルモデル精度を1.6%改善し、エネルギー消費のばらつきを72.7%低減し、既存の方法と比較して総エネルギー消費を28.2%低減することがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:58:32 GMT)
Federated Learning in Mobile Networks: A Comprehensive Case Study on Traffic Forecasting [2.7] Federated Learning(FL)は、さまざまなサイト間のコラボレーションを促進するための、分散されたプライバシ保護ソリューションである。
本稿では,バルセロナ(スペイン)の基地局(BS)からの実世界データを用いたフェデレーション交通予測のケーススタディを通じて,電気通信におけるFLの潜在的なメリットについて検討する。
評価は予測精度と持続可能性の両方に基づいており,様々な環境でのFLアルゴリズムの環境影響を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:32:14 GMT)
Developing a Thailand solar irradiance map using Himawari-8 satellite imageries and deep learning models [2.6] 本稿では,タイの太陽放射マップを30分毎に表示し,https://www.cusolarforecast.comで公開する。
タイにおけるグローバル水平照度(GHI)の推定手法は,ヒマワリ8号衛星画像から抽出した雲指数に依存する。
本手法は, GHI推定モデルの入力として, クリアスキー光, クラウドインデックス, GHIの再解析, MERRA-2データベースからの温度データ, および日付データを用いる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:14:52 GMT)
Lexicalization Is All You Need: Examining the Impact of Lexical Knowledge in a Compositional QALD System [2.6] 単語の潜在的な解釈に関する明示的な知識である語彙化は、タスクを著しく緩和し、QAシステムの性能を高めます。
このようなシステムは、語彙的知識を前提として、現在のQAシステムよりはるかにパフォーマンスが高いことを示す。
対照的に、LLMは語彙知識を活用できる能力が限られており、語彙知識のないバージョンに比べて限界的な改善しかできないことを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:56:40 GMT)
Noise2Image: Noise-Enabled Static Scene Recovery for Event Cameras [2.6] イベントカメラは「イベント」のストリームとして時間とともにログ強度の変化を捉えます
ランダムな光子到着による ゆらぎは 必然的に ノイズイベントを 引き起こす
本研究では,照明に依存したノイズ特性を利用してシーンの静的な部分を復元するノイズ2画像を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:21:33 GMT)
Demonstration of quantum computation and error correction with a tesseract code [2.6] テッセラクトのサブシステムカラーコードは、16の物理量子ビットの4つの論理量子ビットを距離4まで保護する。
最大12個の論理量子ビット上に高忠実な符号化グラフ状態を作成し、フォールトトレラントな誤り訂正と計算を初めて有益に組み合わせる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:22:15 GMT)
Deep learning empowered sensor fusion boosts infant movement classification [2.5] FM(Fidgety Movement)評価のためのセンサ融合手法を提案する。
様々な組み合わせと2つのセンサ融合法を用いて、マルチセンサシステムが単一モードアセスメントよりも優れた性能を発揮するかどうかを検証した。
三感融合(94.5%の分類精度)の性能は、評価されたどの単一モダリティよりも著しく高かった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:57:12 GMT)
Embed-Search-Align: DNA Sequence Alignment using Transformer Models [2.5] 我々はTransformerモデルのシーケンスアライメントタスクを"Embed-Search-Align"タスクとしてフレーミングすることでギャップを埋める。
新規なレファレンスフリーDNA埋め込みモデルは、共有ベクトル空間に投影される読み取りおよび参照フラグメントの埋め込みを生成する。
DNA-ESAは、BowtieやBWA-Memといった従来の手法に匹敵する、ヒトゲノム(3gb)に250長の読み書きを合わせると99%正確である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:21:03 GMT)
The Hatching-Box: A Novel System for Automated Monitoring and Quantification of \textit{Drosophila melanogaster} Developmental Behavior [2.5] Hatching-Boxはショウジョウバエの生長行動を自動的に監視し定量化する新しい画像解析システムである。
我々は,ハッチボックスが集団行動に関する追加情報を抽出し,個々の標本のライフサイクル全体を再構築できることを示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:46:40 GMT)
Learning-by-teaching with ChatGPT: The effect of teachable ChatGPT agent on programming education [2.5] 本研究では,ChatGPTを教材として利用し,学習過程,特にプログラミング教育における生徒の学習を支援する可能性について検討する。
この結果から,ChatGPTと対話することで,学習者の知識向上とプログラミング能力,特に可読性および論理的音声コードの記述が向上することが明らかとなった。
学習者の自己統制学習能力は向上し、ChatGPTの教育が学習者の自己効力向上とSRL戦略のより良い実施を促進することが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:12:03 GMT)
UniPoll: A Unified Social Media Poll Generation Framework via Multi-Objective Optimization [2.3] 我々は,高度自然言語生成(NLG)技術を用いてソーシャルメディア投稿からポーリングを自動的に生成するフレームワークUniPollを紹介する。
ソーシャルメディアの非公式で文脈に敏感な性質に苦しむ従来の方法とは異なり、UniPollはユーザーコメントから豊富なコンテキストを活用する。
ソーシャルメディアデータの本質的なノイズに対処するため、UniPollはRetrieval-Augmented Generation (RAG)と合成データ生成を取り入れている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:43:36 GMT)
Expressivity of Representation Learning on Continuous-Time Dynamic Graphs: An Information-Flow Centric Review [2.3] 本稿では,連続時間動的グラフ(CTDG)モデルにおけるグラフ表現学習(GRL)について概観する。
本稿では,情報フロー(IF)レンズを用いてCTDGモデルの表現性を解析する新しい理論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 00:12:50 GMT)
Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data [2.3] ニューラルスタイル転送(RNST)による正規化は、様々な画像スタイルにわたるノイズの多い低品質入力から高品質なイメージを再構成する。
臨床MRIにおけるRNSTの有効性を検証し,画像品質を著しく向上させる能力を示した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:07:33 GMT)
Deep Causal Inference for Point-referenced Spatial Data with Continuous Treatments [2.2] 本稿では,空間干渉と観測不能なコンバウンディングを管理するために,近似ガウス過程と統合されたニューラルネットワーク(NN)ベースのフレームワークを提案する。
衛星画像から推定した合成,半合成,実世界のデータを用いて,我々の枠組みを評価する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:06:23 GMT)
Leveraging Large Language Models to Generate Course-specific Semantically Annotated Learning Objects [2.2] 生成自然言語モデルの最近の進歩は、教育コンテンツの生成に新たな可能性をもたらしている。
本稿では,自動学習者モデル更新に十分な注釈を付けたコンピュータサイエンス質問を生成するための,大規模言語モデルの可能性について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:24:07 GMT)
Space to Policy: Scalable Brick Kiln Detection and Automatic Compliance Monitoring with Geospatial Data [2.1] れんがはインドの大気汚染の8-14%に寄与している。
エミッション・インベントリは、大気の質のモデリングと源泉の調整研究に不可欠である。
我々は5つの州で30638個のレンガキルンを検出し分類するスケーラブルな機械学習パイプラインを開発した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:59:54 GMT)
A Unified Framework for Evaluating the Effectiveness and Enhancing the Transparency of Explainable AI Methods in Real-World Applications [2.1] AIモデルの特徴である"ブラックボックス"は、解釈可能性、透明性、信頼性を制約する。
本研究では,AIモデルによる説明の正確性,解釈可能性,堅牢性,公正性,完全性を評価するための統合XAI評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:30:10 GMT)
Polylog-time- and constant-space-overhead fault-tolerant quantum computation with quantum low-density parity-check codes [2.0] フォールトトレラント量子計算における大きな課題は、空間オーバーヘッドと時間オーバーヘッドの両方を削減することである。
本研究では, 量子低密度パリティチェック符号を用いたプロトコルが, 一定の空間オーバーヘッドと多対数時間オーバーヘッドを実現することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:49:53 GMT)
AyutthayaAlpha: A Thai-Latin Script Transliteration Transformer [2.0] 本研究では,タイ語の固有名称をラテン文字に翻訳するために設計された,高度なトランスフォーマーベース機械学習モデルであるAyutthayaAlphaを紹介する。
本システムでは,文字誤り率0.0047を維持しながら,82.32%,95.24%の精度で最先端性能を実現している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:18:09 GMT)
Robustness of Practical Perceptual Hashing Algorithms to Hash-Evasion and Hash-Inversion Attacks [1.9] 本稿では、広く利用されている3つのPHA(PhotoDNA、PDQ、NeuralHash)のハッシュ回避およびハッシュ反転攻撃に対する安全性を評価する。
これらの異なる結果について説明し、本質的なロバスト性は、PHAのランダムなハッシュ変動特性に部分的に起因していることを強調する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:19:37 GMT)
Does your model understand genes? A benchmark of gene properties for biological and text models [1.9] 専門的な生物情報学データベースから収集した遺伝子特性に着目した。
これらのデータベースに基づいて、バイナリ、マルチラベル、マルチクラス分類タスクを含む数百のタスクを定義します。
本研究は, テキストベースモデルとタンパク質言語モデルが, ゲノム特性および制御機能タスクにおいて, 表現ベースモデルよりも優れていたことを示唆する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:14:01 GMT)
Exploring Fully Convolutional Networks for the Segmentation of Hyperspectral Imaging Applied to Advanced Driver Assistance Systems [1.9] 高度運転支援システム(ADAS)におけるハイパースペクトルイメージング(HSI)の利用について検討する。
本稿では,完全な畳み込みネットワーク(FCN)をADAS用HSIの画像セグメント化に適用した実験結果について述べる。
我々はHSI-Drive v1.1データセットを使用し、実際の運転条件で記録されたラベル付き画像のセットを、小型のNIR-HSIカメラで提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:58:25 GMT)
Emergent unitary designs for encoded qubits from coherent errors and syndrome measurements [1.9] 曲面符号における符号化量子ビットのユニタリ設計を効率よく生成する手法を提案する。
論理的ユニタリのアンサンブルが熱力学限界におけるユニタリ設計に収束することを数値的に示す。
本結果は,符号化量子ビット上のユニタリ設計を実現するための実用的な方法を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:36:14 GMT)
GeoConformal prediction: a model-agnostic framework of measuring the uncertainty of spatial prediction [1.8] ジオコンフォーマル予測(GeoConformal Prediction)と呼ばれるモデルに依存しない不確実性評価手法を提案する。
その結果,GeoConformalのカバレッジ率は93.67%,Bootstrapのメソッドは2000年のランニングで68.33%に留まった。
この結果から,GeoConformalは地理知識探索だけでなく,将来的なGeoAIモデルの設計の指導にも有用であることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:40:06 GMT)
Enhancing Whole Slide Image Classification through Supervised Contrastive Domain Adaptation [1.8] ドメインシフトは、染色およびデジタル化プロトコルのホスピタル内およびホスピタル間変動に起因する一般的な現象である。
この変動に対処する新しいドメイン適応法を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:39:54 GMT)
MAGMA: Manifold Regularization for MAEs [1.7] Masked Autoencoders(MAE)は、自己教師型学習(SSL)において重要な分断である
異なるトランスフォーマー層の表現に適用される新しいバッチワイド層単位の正規化損失であるMAGMAを紹介する。
提案した正規化損失をプラグインすることで,MAEモデルの性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:12:43 GMT)
Performance Bounds for Quantum Feedback Control [1.7] 量子フィルタリング理論と2乗のモーメント・サム・オブ・二乗法を組み合わせて凸最適化問題の階層を構築する。
技術的条件下での最適制御性能に対する境界の収束性を証明する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:38:49 GMT)
Spectroscopic Investigations of Multiple Environments in Er:CaWO4 through Charge Imbalance [1.7] 本稿では,Er:CaWO$_4$の4mathrmI_13/2$および4mathrmI_15/2$倍数について詳細な分光学的研究を行った。
光ルミネッセンスと光ルミネッセンス励起測定を用いて、エルビウムイオンを結晶中に組み込む複数の環境を発見した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:52:44 GMT)
DiffSign: AI-Assisted Generation of Customizable Sign Language Videos With Enhanced Realism [1.7] 私たちは、リアルで表現力のある合成シグナーで手話ビデオを作成します。
提案手法はパラメトリックモデリングと生成モデリングを組み合わせて,現実的な合成シグナを生成する。
提案手法を用いて生成した手話ビデオは,テキストプロンプトにのみ条件付き拡散モデルで生成したビデオよりも時間的一貫性とリアリズムに優れていた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:18:28 GMT)
Pruning qLDPC codes: Towards bivariate bicycle codes with open boundary conditions [1.6] 量子密度の低いパリティチェック符号は、量子エラー訂正符号の候補として有望である。
量子符号のプルーニングの概念を紹介する。
フォールド・トランスバーサルゲートを記述することにより,構成されたプルーニング符号を用いたフォールト・トレラント量子計算について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:20:44 GMT)
Robust double Bragg diffraction via detuning control [1.6] 二重ブラッグ回折の理論モデルと数値最適化を提案する。
いわゆる「準ブラッグ政権」におけるマグナス展開に基づく効果的な2レベルハミルトニアンを導出する。
我々は、偏極誤差とドップラー効果の両方に対して頑健性を示す人工知能支援の最適デチューニング制御プロトコルを開発した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:13:46 GMT)
Predicting Machining Stability with a Quantum Regression Model [1.6] 本稿では,Real-Part Quantum SVMを拡張した新しい量子回帰モデルを提案する。
その結果, 物理装置で観測される安定性の限界を正確に予測できることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:38:57 GMT)
Experimental certification of high-dimensional entanglement with randomized measurements [1.6] 高次元絡み合った状態は、2次元システムと比較して高い情報容量と強いノイズ耐性を提供する。
ここでは, 800 Haar-random 測定を10面プログラマブル光コンバータを用いて行うことにより, 5次元2光子状態における3次元絡みを実験的に証明する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:27:38 GMT)
Blindfold: Confidential Memory Management by Untrusted Operating System [1.5] 既存の Confidential Computing (CC) ソリューションは、OSから機密メモリを隠蔽し、秘密性を達成するために暗号化する。
本稿では,Blindfold というCC設計で合成したこれらの制限を克服するための実験結果について述べる。
Blindfoldは、Guardianと呼ばれるカーネルよりも高い特権レベルで実行される、小さな信頼できるソフトウェアコンポーネントに依存している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:38:03 GMT)
Agent AI with LangGraph: A Modular Framework for Enhancing Machine Translation Using Large Language Models [1.5] 本稿では,機械翻訳(MT)の自動化と有効性向上におけるエージェントAIとLangGraphの転換的役割について考察する。
Agentは、特定の言語間の翻訳など、特定のタスクを実行するために設計されたモジュールコンポーネントである。
LangChain上に構築されたグラフベースのフレームワークであるLangGraphは、これらのエージェントの作成と管理を簡単にする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:45:12 GMT)
ELEMENTAL: Interactive Learning from Demonstrations and Vision-Language Models for Reward Design in Robotics [1.5] 本稿では,自然言語指導と視覚的ユーザデモを組み合わせることで,ロボットの動作とユーザ意図の整合性を向上する新しいフレームワークを提案する。
実験の結果, ELementalはタスク成功率42.3%で先行作業より優れ, アウト・オブ・ディストリビューションタスクにおいて41.3%の高速化を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:27:08 GMT)
AI-based Attacker Models for Enhancing Multi-Stage Cyberattack Simulations in Smart Grids Using Co-Simulation Environments [1.5] スマートグリッドへの移行により、高度なサイバー脅威に対する電力システムの脆弱性が増大した。
本稿では,モジュール型サイバーアタックの実行に自律エージェントを用いたシミュレーションフレームワークを提案する。
当社のアプローチは、データ生成のための柔軟で汎用的なソースを提供し、より高速なプロトタイピングと開発リソースと時間の削減を支援します。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:56:38 GMT)
A History of Philosophy in Colombia through Topic Modelling [1.4] 本研究では,コロンビアとラテンアメリカの哲学史を探求するために,動的トピックモデリング技術を適用した。
本稿は、1951年に創刊されたコロンビアの哲学雑誌『Ideans y Valores』を調査し、現在、この地域で最も影響力のある学術哲学雑誌の1つである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:14:16 GMT)
A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks [1.4] 歩行認識に関わる課題に対処し、その精度と信頼性を改善するための新しいアプローチを提案する。
提案手法は,Mediapipeのポーズ推定モデルを用いて得られた連続歩行ランドマークを含む高度な手法を利用する。
大規模なクロスビューデータセットを用いて,アプローチの有効性を示す実験を行った。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:47:49 GMT)
Learning Semantic Association Rules from Internet of Things Data [1.4] アソシエーションルールマイニング(アソシエーションルールマイニング、ARM)は、データ中の共通点を論理的な意味として発見するタスクである。
ARMはIoT(Internet of Things)において、監視や意思決定などさまざまなタスクに使用されている。
動的センサデータと静的IoTシステムメタデータの両方を利用した,IoTデータのための新しいARMパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:22:28 GMT)
Dimension Reduction via Random Projection for Privacy in Multi-Agent Systems [1.4] マルチエージェントシステム(MAS)では、エージェントはシステムについて観測を行い、その情報を融合センターに送信する。
融合センターは情報を集約し、可能な限り精度でシステムパラメータについて結論付けます。
システム全体の効率性を改善するために、エージェントは観測データにいくつかのプライベートパラメータを追加する必要がある。
このシナリオでは、フュージョンセンターに送信されたデータは、プライバシー上のリスクに直面します。
フュージョンセンタに通信するデータは、データプライバシ侵害や推論攻撃に対して、分散的に保護されなければならない。
コサイン類似度を用いたシステムの実用性とプライバシの定量化
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:09:13 GMT)
Artificial intelligence and the internal processes of creativity [1.4] 本稿では,創造性の内部過程の基盤となる神経生物学的機構について考察する。
人工と人間の創造性の産物は似ているが、内部プロセスは異なると結論付けている。
この論文は、AIが人間の創造性の内部プロセス、例えばスキルの発展、知識の統合、アイデアの多様性にどのように悪影響を及ぼすかについても論じている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:33:12 GMT)
Towards Comprehensive Legislative Requirements for Cyber Physical Systems Testing in the European Union [1.3] 本稿では,適用法則に関して,CPSの構築とテストに関する課題を明らかにする。
CPSのコンプライアンステストを考えるときの総合的文脈の分析は、より効果的な意思決定を可能にする概要を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:56:48 GMT)
Approximate Top-$k$ for Increased Parallelism [1.3] そこで本研究では,バケット付き近似式をk$のアルゴリズムで評価する。
上位$が正確であるという要件を緩和することで、バケット付きアルゴリズムは利用可能な並列性を劇的に向上させることができる。
PyTorch用の高速なバケット付きトップ$実装もリリースしています。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:17:28 GMT)
Multi-Layer Privacy-Preserving Record Linkage with Clerical Review based on gradual information disclosure [1.2] プライバシ保護レコードリンク(PPRL)は機密情報のデータ統合タスクにおいて不可欠なコンポーネントである。
本稿では,多層能動学習プロセスを用いて,PPRLに聖職者レビューを統合する新しいプライバシ保護プロトコルを提案する。
実世界のデータセットに対する実験的な評価は、ラベル付けの労力の制限とプライバシーリスクによるリンク品質の大幅な改善を示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:18:50 GMT)
WaveletGPT: Wavelets Meet Large Language Models [1.2] 大規模言語モデル(LLM)は、人工知能の新たな進歩の波を支えている。
本稿では,従来の信号処理のアイデアであるウェーブレットを事前学習中にLLMに注入し,その利点を生かした。
我々は、テキスト、生のオーディオ、シンボリック音楽において、ほぼ2倍の速さで事前学習を行う。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:35:26 GMT)
Privacy-Preserving Gesture Tracking System Utilizing Frequency-Hopping RFID Signals [1.2] 本研究では,RFID信号の周波数ホッピングに基づくジェスチャー追跡システムの開発を目的とする。
周波数ホッピング技術を導入することにより、盗聴者による生RFID信号の取得を防止する機構を設計した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:51:02 GMT)
Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers [1.2] トランスフォーマーベースのモデルは、解釈が難しい隠された状態を生成する。
我々は線形プローブを用いて、隠れ状態における解釈可能な運動特徴に対する神経崩壊を測定する。
提案手法は, 機械的解釈可能性とゼロショットの一般化により, 未知のデータセット特性を実現する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:47:49 GMT)
GRAF: Graph Retrieval Augmented by Facts for Legal Question Answering [1.1] この研究は、低リソース言語のための法的ドメインであるMultiple-Choice QA(MCQA)を探求する。
JuROは3つの異なる試験と合計10,836の質問からなるルーマニア初の公開法的MCQAデータセットである。
我々はルーマニア語のための知識グラフであるLaw-RoGを最初に提案し、このKGは前述のコーパスから派生したものである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:37:27 GMT)
Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification [1.1] ニューラルネットワーク(NN)を用いた画像分類は、産業プロセスで広く使われている。
NNは、アウト・オブ・ディストリビューション(OOD)データに直面すると、確実だが誤った予測をする傾向がある。
複数の独立したNNで構成されたディープアンサンブルは、強い性能を示すことが示されているが、計算コストが高い。
本研究では,産業プロセスの画像分類における効率的なNNアンサンブルの予測と不確実性について検討した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:30:41 GMT)
Combining Autoregressive and Autoencoder Language Models for Text Classification [1.1] CAALM-TCは、自動回帰言語モデルと自動エンコーダ言語モデルを統合することで、テキスト分類を強化する新しい手法である。
4つのベンチマークデータセットの実験結果は、CAALMが既存の手法より一貫して優れていることを示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:42:50 GMT)
Benchmarking and Enhancing Surgical Phase Recognition Models for Robotic-Assisted Esophagectomy [1.1] 食道癌に対する低侵襲食道切除術(RAMIE)を施行した。
我々の目標は, 外科的位相認識に深層学習を活用することであり, 術中支援を外科医に提供することである。
この複雑な手順の時間的ダイナミクスをより効果的に捉えるために,エンコーダ・デコーダ構造を特徴とする新しいディープラーニングモデルを開発した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:23:16 GMT)
Transferring disentangled representations: bridging the gap between synthetic and real images [1.1] 実データに適用可能な汎用的不整合表現を学習するために,合成データを活用する可能性を検討する。
本稿では,表現中の因子の質を測定するために,新しい解釈可能な介入基準を提案する。
以上の結果から, 合成データから実データへの表現の変換が可能であること, 有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:21:16 GMT)
SynFinTabs: A Dataset of Synthetic Financial Tables for Information and Table Extraction [1.1] 既存のデータセットは、大量の学術論文のために科学的な表にフォーカスすることが多い。
現在のデータセットは、しばしば表に含まれる単語とその位置を欠いている。
SynFinTabsは、大規模にラベル付けされた合成財務表のデータセットである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:42:59 GMT)
Using SlowFast Networks for Near-Miss Incident Analysis in Dashcam Videos [1.0] 本稿では、脳内の2つの異なるストリームによって処理される遅くて速い視覚情報の特徴を模倣するSlowFastディープニューラルネットワークを用いて、近距離トラフィックビデオの分類を行う。
この手法は交通の近距離映像解析の精度を大幅に向上させ,交通シナリオにおける人間の視覚知覚に対する洞察を与える。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:20:19 GMT)
Automated Multi-Label Annotation for Mental Health Illnesses Using Large Language Models [1.0] うつ病や不安などの精神疾患はしばしば共起する。
ソーシャルメディアのデータセットは通常、シングルディオーダーラベルに重点を置いている。
本稿では,多言語多言語データセットを作成するために,データのクリーニング,サンプリング,ラベル付け,組み合わせを行う新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:33:03 GMT)
Mask of truth: model sensitivity to unexpected regions of medical images [1.0] 我々は、胸部X線と眼底画像の分類に畳み込みニューラルネットワーク(CNN)の能力に挑戦する。
マスク戦略に関わらず、PadデータセットでトレーニングされたすべてのモデルがランダムにAUC(Area Under the Curve)を得ることができることを示す。
また,Chaksuデータセットでは,非バイアスモデルに対する期待値に一致した結果が得られた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:06:58 GMT)
Text Change Detection in Multilingual Documents Using Image Comparison [0.9] 多言語文書に適した画像比較モデルを用いてテキスト変化検出(TCD)を提案する。
本モデルでは,ソースとターゲット文書間の双方向な変更セグメンテーションマップを生成する。
我々は、我々のベンチマークデータセットと公開ベンチマークを用いて、Distorted Document ImagesとLRDE Document Binarizationデータセットを用いてアプローチを検証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:04:10 GMT)
How Good is ChatGPT in Giving Adaptive Guidance Using Knowledge Graphs in E-Learning Environments? [0.9] 本研究では,動的知識グラフを大規模言語モデル (LLM) と統合し,学習者を支援する手法を提案する。
この手法の中心は、学生がトピックの前提条件を理解する上での知識グラフの役割である。
予備的な知見から, 学生はこの連携支援の恩恵を受け, 理解の向上と課題成果の向上が期待できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:05:43 GMT)
A purified input-output pseudomode model for structured open quantum systems [0.9] 本研究では,非ガウス初期状態で調製されたボソニック浴における環境観測可能量の動態を,システムの特性とともに記述するために,浄化された補助ボソニックモードからなるモデルを提案する。
共振器導波路系における非マルコフ多光子移動過程を大時間遅延状態下でシミュレーションすることにより,この手法を数値的に実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:47:10 GMT)
Learning in Wilson-Cowan model for metapopulation [0.9] メタポピュレーションのためのWilson-Cowanモデルは、脳の異なる皮質下領域を連結ノードとして扱う。
このようなメタポピュレーションモデルのダイナミクスに安定したアトラクタを組み込むことで、高い画像とテキストの分類精度を達成できる学習アルゴリズムに変換する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:39:32 GMT)
Two-detector reconstruction of multiphoton states in linear optical networks [0.9] 本稿では,2つのバケット光子数分解(PNR)検出器のみを用いた線形光ネットワーク(LON)における多光子状態の部分的状態再構成法を提案する。
再構成されたハイゼンベルク・ワイル還元密度行列は、HW作用素に関する量子コヒーレンスと対称性を捉える。
この方法は、大規模LONにおける状態評価のための資源効率の高いソリューションを提供し、フォトニック量子技術の進歩を図っている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:54:02 GMT)
Movie Gen: SWOT Analysis of Meta's Generative AI Foundation Model for Transforming Media Generation, Advertising, and Entertainment Industries [0.8] 本稿では,最先端な生成AI基盤モデルであるMetas Movie GenのSWOT解析を包括的に行う。
我々は、高解像度のビデオ生成、正確な編集、シームレスなオーディオ統合など、その強みを探求する。
生成AIを取り巻く規制的・倫理的考察を,コンテンツ信頼性,文化的表現,責任ある利用といった問題に焦点をあてて検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:01:53 GMT)
Quantum-limited superresolution of two arbitrary incoherent point sources: beating the resurgence of Rayleigh's curse [0.8] 超解像はレイリーの基準の限界を克服することが示されている。
近年では、2つの非コヒーレントな光源の光子数が未知の場合、超解像の精度は消滅することが判明した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:36:18 GMT)
Quantum simulation of time-dependent Hamiltonians via commutator-free quasi-Magnus operators [0.8] マグナス作用素(Magnus operator)は、計算数学における時間依存ハミルトニアンシミュレーションの一般的な方法である。
可換準マグヌス作用素(CFQM)の開発は、この障害を回避する。
CFQMは、しばしば1桁以上のオーダーで利用できる最も効率的な製品-フォーミュラ技術であることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:27:29 GMT)
User-item fairness tradeoffs in recommendations [0.7] ユーザとアイテムの公平度を目標としたリコメンデーションのモデルを構築した。
a) ユーザの嗜好が多様である場合, 「自由」な項目とユーザフェアネスが存在する場合, および, (b) 好ましくない利用者は, 項目フェアネスの制約によって特に不利になる可能性がある。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:59:51 GMT)
Exploring Kolmogorov-Arnold networks for realistic image sharpness assessment [0.7] Kolmogorov-Arnoldネットワーク(KAN)が開発され、データフィッティングにおいて顕著な成功を収めた。
そこで本研究では,TaylorKAN(TaylorKAN)を用いて15の中間レベル特徴と2048の高レベル特徴を用いてスコアを予測する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:59:02 GMT)
Multipartite entanglement distribution in Bell-pair networks without Steiner trees and with reduced gate cost [0.7] 本稿では,任意のベルペアネットワーク上でGHZ状態を生成するプロトコルを提案する。
実世界のネットワークモデルにおいて,本プロトコルがゲートコストを低減させることを示す数値的な証拠を提示する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:33:03 GMT)
A large language model-type architecture for high-dimensional molecular potential energy surfaces [0.7] 我々は、生成AIや自然言語処理において、大規模言語モデルと類似したアルゴリズムを設計し、議論する。
分子系をノード,エッジ,顔などの集合を含むグラフとして表現する。
分子サブシステムを表すこれらの集合間の相互作用は、ポテンシャルエネルギー表面を構築するために用いられる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:48:49 GMT)
Is uniform expressivity too restrictive? Towards efficient expressivity of graph neural networks [0.6] グラフニューラルネットワーク(GNN)は、入力グラフのサイズによってパラメータなしでクエリを表現できる。
入力グラフの最大次数に対してパラメータの数が対数的であるように,多くのGNNがGC2クエリを効率的に表現できることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:22:21 GMT)
Nonlinear Operator Learning Using Energy Minimization and MLPs [0.6] 偏微分方程式による非線形問題に対する解演算子学習法を開発し,評価する。
アプローチは有限要素の離散化に基づいており、潜伏変数を入力とする反復によって解演算子を表現することを目的としている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:19:16 GMT)
MixDiff: Mixing Natural and Synthetic Images for Robust Self-Supervised Representations [0.5] MixDiffは、実画像と合成画像を組み合わせた、新たな自己教師型学習(SSL)事前トレーニングフレームワークである。
私たちの重要な洞察は、合成画像のみに訓練されたモデルでは、実際のデータと合成データを組み合わせれば、より堅牢で適応可能な表現が得られるということです。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:31:06 GMT)
WinTSR: A Windowed Temporal Saliency Rescaling Method for Interpreting Time Series Deep Learning Models [0.5] 我々はWinTSR(Windowed Temporal Saliency Rescaling)と呼ばれる新しい解釈手法を導入する。
我々は、異なるアーキテクチャの5つの最先端ディープラーニングモデルを用いて、WinTSRを10の最近の解釈手法と比較した。
総括分析の結果,WinTSRは他の局所解釈手法よりも性能が大幅に向上していることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:15:07 GMT)
Global anomalies of Green's function zeros [0.5] 対称性を保ったルッティンガー曲面を持つ系における大域的異常について検討する。
我々は、グリーン関数 0 のディラック型で可能な位相上の制約を考える。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:14:37 GMT)
Deep Learning Modeling Method for RF Devices Based on Uniform Noise Training Set [0.5] 本稿では,一様雑音学習セットを用いたRFデバイスの深層学習に基づくモデリング手法を提案する。
この仮説に基づいて,測定データに基づく完全集積回路モデリングプロセスの設計を行う。
実験結果から, RF装置の非線形特性を均一に捉えることができることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:34:04 GMT)
Introducing the Large Medical Model: State of the art healthcare cost and risk prediction with transformers trained on patient event sequences [0.5] 大規模医療モデル(Large Medical Model, LMM)は、患者医療と医療管理の幅広い側面をガイドし、予測するために設計された、GPT(Generative Pre-trained Transformer)である。
このモデルは、医療用語システムから構築された特別な語彙を用いて、1億4000万件以上の患者の主張記録から医療イベントシーケンスに基づいて訓練されている。
LMMは、最高の商用モデルよりも14.1%のコスト予測と、幅広い条件を予測する研究において最高のトランスフォーマーモデルよりも1.9%の慢性的な条件予測の両方を改善できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:19:12 GMT)
Squeezing and Entanglement Dynamics in Phase-Sensitive Non-Hermitian Systems [0.5] 本研究では,単モードAPT対称性を本質的に有する位相感受性非エルミタン波混合モデルを構築した。
ポンプ場の位相を調整することにより、このモデルは同時に2モードの二次PT対称性を示す。
本研究は, 2モード量子絡み合いとポンプ磁場の位相の関係をさらに探求し, 対応する非線形系における絡み合いの発生と進化について深い知見を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:04:45 GMT)
Dissociating Artificial Intelligence from Artificial Consciousness [0.5] 機械学習と計算能力の発展は、人工知能が手の届くところにあることを示唆している。
コンピューターが人間と機能的に同等なら、私たちが意識しているように、視覚、音、思考を体験するだろうか?
我々は統合情報理論(IIT)を用いて、システムが意識的かどうかを判断するための原則的ツールを提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:28:35 GMT)
HydraViT: Stacking Heads for a Scalable ViT [0.4] 本稿では,拡張性のあるViTを実現するために,注目ヘッドを積み重ねることで制限に対処する新しいアプローチであるHydraViTを紹介する。
実験の結果,HydraViTは最大10ワークスで拡張性のあるViTを実現し,幅広いリソース制約をカバーできることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:24:15 GMT)
Bayesian Networks for Causal Analysis in Socioecological Systems [0.3] 因果推論と反事実推論は、データサイエンスにおいて新たな方向に向かっている。
本研究の主な貢献は,社会生態学システムの変数間の必要性と満足度の関係を分析することである。
特に,スペイン南部における社会経済的要因と土地利用に関する事例研究について考察する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:06:43 GMT)
Iterative Reweighted Framework Based Algorithms for Sparse Linear Regression with Generalized Elastic Net Penalty [0.3] 弾性ネットペナルティはパラメータ回帰と変数選択のための高次元統計学においてしばしば用いられる。
経験的証拠は、$ell_q$-norm のペナルティが $ell_r$-norm のペナルティよりもよく退行することを示している。
局所的なLipschitz連続$epsilon$-approximation to $ell_q$-norm に基づく2つの効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:40:41 GMT)
Techniques for Measuring the Inferential Strength of Forgetting Policies [0.3] 本稿では,モデルカウントと確率論からの直感に基づく推論強度の変化を測定するための損失関数を定義する。
忘れることに重点を置いているが、結果はずっと一般的であり、他の分野にも広く適用されるべきである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:38:13 GMT)
Quality In / Quality Out: Data quality more relevant than model choice in anomaly detection with the UGR'16 [0.3] ベンチマークデータセットの比較的小さな変更は、考慮された特定のML手法よりも、モデルパフォーマンスに著しく影響することを示します。
また、不正確なラベル付けの結果、測定されたモデル性能が不確かであることも示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:46:11 GMT)
Detecting Redundant Health Survey Questions Using Language-agnostic BERT Sentence Embedding (LaBSE) [0.3] 我々はNIH CDEリポジトリ, PROMIS, 韓国の公衆衛生機関, 学術出版物から, 英語と韓国語の両方で書かれた様々な健康調査質問をまとめた。
1758の質問ペアからなるセマンティックテキスト類似性データセットを生成するためにランダム化された質問ペア方式が用いられた。
各質問のペア間の類似度スコアは2人の人間専門家によって割り当てられた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:18:35 GMT)
Techniques for learning sparse Pauli-Lindblad noise models [0.3] パウリ回転に基づくツイリングを導入し、単一量子学習訂正シーケンスを自動生成する。
また,グラフカラー化と一様被覆配列を利用して学習基地数を最小限に抑える基底選択手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:59:06 GMT)
Generating graph states with a single quantum emitter and the minimum number of fusions [0.2] グラフ状態は、光子を用いた計測および融合に基づく量子コンピューティングの鍵となる資源である。
単一量子エミッタと線形光学ベル状態測定を用いたハイブリッドグラフ状態生成方式を最適化する。
選択したグラフ状態の構成プロトコルとルックアップテーブルを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:03:21 GMT)
Fine-Grained Sentiment Analysis of Electric Vehicle User Reviews: A Bidirectional LSTM Approach to Capturing Emotional Intensity in Chinese Text [0.1] 本研究では,二方向性長短期記憶(Bidirectional Long Short-Term Memory, Bi-LSTM)ネットワークを用いた感情評価モデルを提案し,EV充電インフラのユーザレビューを分析した。
0から5までの感情スコアを割り当てることで、モデルが感情表現のきめ細かい理解を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:04:29 GMT)
Tower of Structured Excited States from Measurements [0.1] 量子位相推定を利用して大域観測可能度を測定する対数深度プロトコルを提案する。
量子力学において有用な構造励起状態の塔を作る能力を示す。
本研究は,量子多体系における高絡み合い状態へのアクセスに対する測定に基づくアプローチの有用性を拡大するものである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:44:19 GMT)
Mixed Delay/Nondelay Embeddings Based Neuromorphic Computing with Patterned Nanomagnet Arrays [0.0] 混合遅延/非遅延埋め込み型PNA貯水池システムを提案する。
本システムでは, 単一のPNA貯水池ノードを用いて, 単一のPNA貯水池ノードの入力に印加された時系列データの動的情報の遅延/非遅延埋め込みを混合する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:28:04 GMT)
Vanishing performance of the parity-encoded quantum approximate optimization algorithm applied to spin-glass models [0.0] パリティマッピングは、量子近似最適化アルゴリズム(QAOA)の幾何学的に局所的な符号化を提供する
パリティ符号化されたQAOA層が一定個ある場合、その性能や出力エネルギーはゼロになる。
その結果,パリティエンコードされたQAOAは,QAOAの標準バージョンと比較して,有望なスケーリングを行なわないことが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:17:08 GMT)
Utilizing redundancies in Qubit Hilbert Space to reduce entangling gate counts in the Unitary Vibrational Coupled-Cluster Method [0.0] 単振動結合クラスター法による新しい状態調製法を提案する。
トロッター化UVCCアンサッツで必要とされる量子ビット制御の半分を除去することにより,エンタングゲート数の50%を理論的に削減できる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:07:31 GMT)
Using Platt's scaling for calibration after undersampling -- limitations and how to address them [0.0] シミュレーション研究やケーススタディを通じて解析的にPlattのスケーリングはアンダーサンプリング後のキャリブレーションには使用すべきでないことを示した。
我々は、ベースモデルの予測のロジットに、ロジスティックな一般化された加算モデルに適合する、プラットのスケーリングの修正版を推奨する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 00:00:18 GMT)
Uniform Discretized Integrated Gradients: An effective attribution based method for explaining large language models [0.0] 統合グラディエンス(Integrated Gradients)は、ディープラーニングモデルを説明するテクニックとしてよく知られている。
本稿では,UDIG(Uniform Discretized Integrated Gradients)と呼ばれる手法を提案する。
本手法は,2種類のNLPタスクに対して,3つのメトリクスビズログオッズ,包括性,十分性に対する感性分類と質問応答について検討した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:39:03 GMT)
Understanding Hidden Computations in Chain-of-Thought Reasoning [0.0] CoT(Chain-of-Thought)の促進により、大規模言語モデルの推論能力が大幅に向上した。
近年の研究では、CoTをフィラー(隠れた)文字に置き換えた場合でも、モデルが複雑な推論タスクを実行できることが示されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:43:11 GMT)
Towards scalable active steering protocols for genuinely entangled state manifolds [0.0] マルチパーティの絡み合った状態をターゲットにしたアクティブステアリングプロトコルを導入・解析する。
最大20キュービットのシステムに対する数値シミュレーションでは、このプロトコルはスケーラブルであり、システム間の高マルチパーティントの絡み合いを可能にすることが示唆されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:04:14 GMT)
Towards Data Governance of Frontier AI Models [0.0] 私たちは、フロンティアAIモデルに対して、データが新たなガバナンス能力を実現する方法について検討する。
データは非リバルで、しばしば非排除可能で、容易に複製可能で、ますます合成可能になっている。
データサプライチェーンに沿ってキーアクターをターゲットにした一連のポリシー機構を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:37:51 GMT)
Toward Routing River Water in Land Surface Models with Recurrent Neural Networks [0.0] 陸面モデル(LSM)における河川ルーティングのためのリカレントニューラルネットワーク(RNN)の性能について検討する。
観測された降水の代わりに、LSM-RNNは物理モデルから計算された瞬時流出を入力として使用する。
我々は、地球にまたがる河川流域のデータを用いてモデルを訓練し、過去の流れの測定を用いて検証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:19:01 GMT)
The SYK charging advantage as a random walk on graphs [0.0] 本稿では,Sachdev-Ye-Kitaevモデル(SYK)の充電力学を量子電池として検討する。
この利点の根底にある2つの主要なメカニズムは、システムサイズが$N$で広範囲にスケールする演算子の使用と、特定のグラフ構造による演算子非局在化の促進である。
これらの知見をグラフベースのSYKモデルに拡張し,エネルギー貯蔵と量子力学への広範な影響を明らかにすることで,SYK電池の量子優位性に関する厳密な条件を確立した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:03:11 GMT)
The Mpemba effect in quantum oscillating and two-level systems [0.0] エンペムバ効果(ME)は、ユビキタス量子発振と2レベル系の文脈で研究される。
その結果,ME効果が出現し,その実現と実験観測の可能性について考察した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:45:31 GMT)
The Influence and Relationship between Computational Thinking, Learning Motivation, Attitude, and Achievement of Code.org in K-12 Programming Education [0.0] 本研究では,Code.orgのブロックベースコーディングカリキュラムが小学校の計算思考,モチベーション,態度,学業成績に及ぼす影響について検討した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 00:12:26 GMT)
Superposition through Active Learning lens [0.0] 重ね合わせ(英: superposition)またはニューロン多意味性(英: neuron polysemanticity)は、解釈可能性の分野において重要な概念である。
本稿では,能動学習法を用いて重ね合わせを復号化できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:02:24 GMT)
Superconductor-Insulator Transition in Weakly Monitored Josephson Junction Arrays [0.0] オープン量子系における測定と浴槽工学による量子状態の制御と操作は、多体物理学における新しいパラダイムとして登場した。
繰り返しモニタリングによって, 絶縁状態が超伝導体に変換され, その逆も可能であることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:00:17 GMT)
Super-Poissonian Squeezed Light in the Deep Strong Regime of the Quantum Rabi Model [0.0] 結合強度$g$がモード周波数$omega$を超える深い結合状態において、フォトニック状態は、その二次状態の1つで効果的に圧縮される。
既存のトラップされたイオンプラットフォームで実験的にテスト可能な$g/omegaapprox 3$の場合、達成可能なスクイーズパラメータは約$rapprox 0.8$に達する。
言い換えれば、量子ラビモデルの基底状態は超ポアソン量子スクリュッド光子を含む。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:48:08 GMT)
Stabilizing and Solving Inverse Problems using Data and Machine Learning [0.0] 境界条件が不明な非線形偏微分方程式 (PDE) に対する解の再構成を含む逆問題を考える。
この集合データを活用するために、まず、線形展開において適切な分解(POD)を用いて境界データを圧縮する。
次に,低次元潜在空間におけるデータセットのパラメトリゼーションを提供するオートエンコーダを用いて,拡張係数の非線形低次元構造を同定する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:31:14 GMT)
Spin squeezing: Thermal behavior and distribution on excited states [0.0] スピン1/2を有する一次元横磁場XYモデルにおける熱的効果下でのスピンスクイーズ挙動について検討した。
熱分解場では、コヒーレント温度と呼ばれる特定の温度で熱硬化状態から非定常状態への遷移が起こる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:12:43 GMT)
Spiking representation learning for associative memories [0.0] 本稿では、教師なし表現学習と連想記憶操作を行う新しい人工スパイクニューラルネットワーク(SNN)を提案する。
モデルの構造は新皮質列状構造から派生し,隠れた表現を学習するためのフィードフォワードプロジェクションと,連想記憶を形成するための繰り返しプロジェクションを組み合わせたものである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:03:27 GMT)
Spatially resolved photon statistics of general nanophotonic systems [0.0] 本稿では、任意の電磁環境において、空間と周波数で解決された光子統計情報にアクセスする新しい方法を提案する。
マクロなQEDフレームワーク内では,複雑な量子系に対する電場相関を計算するための実用的なツールが開発されている。
本研究では, プラズモンナノ粒子に近接した1および2個のエミッタの光子相関について検討し, 提案手法の有効性とロバスト性を実証した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:16:02 GMT)
Spatial Wavefunctions of Spin [0.0] 量子力学的角運動量の別の定式化を提案する。
波動関数は、Wigner D-functions, $D_n ms (phi,theta,chi)$である。
D_sqrts(s+1),ms(phi,theta,chi)$ が角運動量に対する空間波動関数として有用であるとする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:50:07 GMT)
Sinkhorn Algorithm for Sequentially Composed Optimal Transports [0.0] Sinkhornアルゴリズムは最適な輸送のためのデファクト標準近似アルゴリズムである。
本稿では,効率的な近似アルゴリズム,すなわち,逐次的に合成された最適輸送のためのシンクホーンアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:06:08 GMT)
Single-qubit gates with errors at the $10^{-7}$ level [0.0] サブパート・パー・ミリオン・エラー率を持つ単一量子ビットゲートの達成を,43ドルCa$+超微細クロックキュービットで報告した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:45:29 GMT)
Simulating matrix models with tensor networks [0.0] 行列モデルは、空間依存を持たない量子力学系として、ゲージ理論と重力理論に関する貴重な洞察を与える。
これらのモデルをシミュレートすることで、キネマティックおよび動的性質の探索が可能になる。
本研究では,行列積状態として基底状態を構築し,その絡み合い構造などの特徴を解析する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:57:58 GMT)
Simulating Vibrational Dynamics on Bosonic Quantum Devices [0.0] 従来の量子ビットベースの量子デバイスに代わる有望な代替手段としてボソニック量子デバイスが登場しつつある。
これらのボソニックデバイス上での非調和ポテンシャル下での振動力学のディジタル量子シミュレーションの枠組みを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 02:10:26 GMT)
SRAM-Based PUF Reliability Prediction Using Cell-Imbalance Characterization in the State Space Diagram [0.0] 本研究では,PUF アプリケーションにおいて 6T ビットセルが与えられた論理値に達する確率の統計的分布を推定する手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:49:22 GMT)
Relationships between Keywords and Strong Beats in Lyrical Music [0.0] 本研究では,歌唱における強拍などの韻律的強調特徴とキーワードの関係について検討した。
キーワードの80.8%は強いビートに着地するが、非キーワードの62%は弱いビートに落ちている。
強いビートと一貫して一致したキーワードは、歌詞とリズムの関連性の信頼性の高い指標である、と結論付けている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:40:27 GMT)
Quench dynamics of entanglement from crosscap states [0.0] 長距離絡みを持つ初期状態からの両部絡み合いエントロピーと相互情報のダイナミクスについて検討する。
ダイナミクスの種類やシステムが統合可能かカオスかによって、振る舞いのパターンが異なることが分かりました。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:27:13 GMT)
Qubit encoding for a mixture of localized functions [0.0] 我々は、局所化複素関数の任意の線形結合を生成する、適度に特殊化された符号化技術を開発した。
また,本手法の有効性を確認するために,実際の超伝導量子コンピュータ上で結果を示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 00:37:14 GMT)
Quasiperiodicity protects quantized transport in disordered systems without gaps [0.0] 我々は、Aubry-Andr'e-Harper鎖に有界局所障害を付加して生き残る量子化された電流を観察する。
寒冷原子やフォトニック実験などにおいて直接実現可能なプロトコルを提案し,この安定性を活用して,高チャーン数で位相多体状態を作成する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:12:29 GMT)
Quantum-dot-based Kitaev chains: Majorana quality measures and scaling with increasing chain length [0.0] マヨラナ境界状態 (Majorana bound state,MBSs) は、結合した量子ドットの、短くよく制御可能な鎖であり、障害の問題を後押しする。
短鎖の微細なMBSの位相的保護の密接度を定量化する新しい品質指標を提案する。
異なる長さの量子ドット鎖の局所的識別性について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:56:56 GMT)
Quantum trails and memory effects in the phase space of chaotic quantum systems [0.0] 位相空間における局所波束の弱い分散力学が固有状態に「量子軌跡」を残すことを示す。
量子トレイルは、局所的なウェーブパケットの系において、短時間の軌道に沿って長時間の位相空間分布が増強される、顕著な力学効果を支えている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:28:10 GMT)
Quantum Interference of Force with Entangled Photons [0.0] 一対の絡み合った光子を用いた力効果の量子干渉を実験的に実証した。
実験により, 零運動量移動による正の運動量移動の量子重ね合わせは, 量子粒子のアンサンブルに負の運動量移動をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:59:39 GMT)
Quantum Cherenkov transition of finite momentum Bose polarons [0.0] 超低温原子の弱い相互作用を持つボース・アインシュタイン凝縮体(BEC)に浸漬した有限モーメント不純物の挙動について検討した。
短距離不純物-ボソン相互作用が保たれた後、系の遠方平衡力学における遷移を同定する。
遷移は、超低温原子系の様々な共通プロトコルを介して実験的に観測可能であるべきである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:35:35 GMT)
Quantized and Interpretable Learning Scheme for Deep Neural Networks in Classification Task [0.0] 本稿では,サリエンシ誘導学習と量子化技術を組み合わせて,解釈可能かつ資源効率のよいモデルを構築するアプローチを提案する。
以上の結果から,Saliency-Guided Training と PACT-based Quantization の併用は,分類性能を維持するだけでなく,より効率的かつ解釈可能なモデルを生成することが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:34:06 GMT)
Prompt Engineering Guidance for Conceptual Agent-based Model Extraction using Large Language Models [0.0] 本稿では,エージェント・ベース・モデリング(ABM)を実装するために必要な情報抽出にQAモデルを活用することを目的とする。
抽出された情報は、人間とコンピュータの両方で読み取れるフォーマット(例えば、JavaScript Object Notation (JSON))で表示され、人間が手動で使うことができ、Large Language Models (LLM) による自動コード生成が可能である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:49:02 GMT)
Probing quantum entanglement using Higgs to ZZ* to 4 leptons at ATLAS [0.0] 我々は,ATLAS実験におけるヒッグスとZZ* (HZZ*) 相互作用の量子絡み合いの存在について検討した。
我々の研究は、HZZ*相互作用における絡み合いの性質に光を当て、量子特性に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:33:23 GMT)
Precarity and Solidarity: Preliminary results on a study of queer and disabled fiction writers' experiences with generative AI [0.0] クイアや障害のあるライターは、AIが業界に与える影響について、非クイアや障害のないライターよりも明らかに悲観的であることが分かりました。
我々は、生成AIが出版業界における既存の不安定性と不毛の源を悪化させる方法を探る。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:41:30 GMT)
Phase diagram and crystal melting of helium-4 in two dimensions [0.0] ニューラル量子状態を用いた2次元ヘリウム4の零温度相図について検討した。
N=30$の原子のシミュレーションは液体から固体へ連続的に遷移し、六位数は小さな凝縮分数と共存する。
また,R'enyi-2エンタングルメントエントロピーを液体-固体相転移で計算し,凍結に伴う急激な減少を見出した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:34:11 GMT)
Parrondo's paradox in quantum walks with inhomogeneous coins [0.0] パロンドのパラドックス(英: Parrondo's paradox)は、2つの敗戦戦略が組み合わさって勝利をもたらす反直感的な現象である。
本研究では,離散時間量子ウォークにおけるパロンドのパラドックスの出現について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:07:08 GMT)
Orbital Optical Raman Lattice [0.0] 我々はラマン誘導型SOCとエキゾチックな高軌道ボース凝縮体を正方格子で研究した。
SOCとp軌道相互作用がボソンの凝縮状態に影響を与えることが判明した。
我々の発見は、光学格子におけるエキゾチックSOCと高軌道物理学の新たな道のりを刺激するかもしれない。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:43:58 GMT)
Open fermionic string theory in a non commutative target phase-space [0.0] 非可換対象位相空間における開フェルミオン弦理論について検討する。
修正された超ビラソロ代数はラモンド・シュワルツセクターとノイヴェウ・シュワルツセクターで得られる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:09:31 GMT)
Online SLA Decomposition: Enabling Real-Time Adaptation to Evolving Systems [0.0] 本研究では,実世界のシステムの動的性質を考察し,その動的性に対処するオンライン学習分解フレームワークを提案する。
最新のフィードバックに基づいてリスクモデルを定期的に更新するフレームワークを提案する。
解析モデルに基づくシミュレータに関する実証研究により,提案手法が最先端の静的アプローチより優れていることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:01:30 GMT)
On the role of the unitary transformations in Bell inequalities [0.0] 本稿では,ベル-CHSHの不等式違反を,ベルの観測値の基準セットに作用するユニタリ変換に符号化する方法を示す。
我々は、ユニタリ変換を用いることで、以前の数値アルゴリズムを大幅に改善できることを示し、違反の規模を増大させる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:11:29 GMT)
On Functional Dimension and Persistent Pseudodimension [0.0] 本稿では,ReLUネットワーククラスに対する局所的に適用可能な2つの複雑性尺度と,それらの関係について知る。
前者は有限個の点のバッチで計算しやすく、後者はギャップに局所的な境界を与え、二重降下現象の力学の理解を知らせる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:27:57 GMT)
Objective Features Extracted from Motor Activity Time Series for Food Addiction Analysis Using Machine Learning [0.0] 本研究は、食品依存症(FA)を診断し、確認された症状(SC)を評価するための機械学習アルゴリズムについて検討する。
FAおよびSCをYale Food Addiction Scale(YFAS)を用いて測定した参加者81名(平均年齢:21.5歳、範囲:18-61歳、女性77.8%)のデータを収集した。
本研究は, FAおよびSCに関連する生理指標のリアルタイムモニタリングと分析を行う健康デジタル支援機能を備えた,IoTデバイスとMLセンサからなるヒトバイオニックスイートのコンセプトをサポートする。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:28:11 GMT)
Near-optimal pure state estimation with adaptive Fisher-symmetric measurements [0.0] 本稿では,$d$次元純量子状態の3段階適応法を提案する。
測定結果の総数は7d-3$と直線的にスケールし、未知の状態の複数のコピーの集合的な測定は不要である。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:00:12 GMT)
Multiclass Post-Earthquake Building Assessment Integrating Optical and SAR Satellite Imagery, Ground Motion, and Soil Data with Transformers [0.0] 本研究では,地震後の高分解能衛星画像と構造物の耐震性能に関連する建築固有のメタデータを組み合わせたフレームワークを提案する。
2023年2月6日トルコ・シリア地震の建物群を対象とした多層地震後の被害同定において, 現状の成果が得られた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:19:51 GMT)
Multi-Screen Entanglement in Tensorial Quantum Mechanics [0.0] 本稿では、量子力学(TQM)に基づくマルチスクリーンエンタングルメントの不変形式化を示す。
量子論の新しいテンソル的定式化は、現在のマルチパーティエンタングルメント(英語版)における多くの問題から逃れることができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:12:09 GMT)
Multi-Scale Node Embeddings for Graph Modeling and Generation [0.0] ノード埋め込みアルゴリズムはグラフを入力として取り、その構造を幾何学空間内のノードを表す出力ベクトルにエンコードする。
関係のない2つの制限がこれらのアルゴリズムに影響を及ぼす。
本稿では,ブロックノードの埋め込みベクトルと,その構成ノードの埋め込みベクトルの和との統計的整合性を保証するマルチスケールノード埋め込み法を定義する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:12:45 GMT)
Mogo: RQ Hierarchical Causal Transformer for High-Quality 3D Human Motion Generation [0.0] ベルト型マスケモデル(MoMask, MMM)は現在、GPT型自己回帰モデル(T2M-GPT)と比較して高品質な出力を生成する。
本研究では,1つのトランスモデルをトレーニングすることにより,高品質な3D動作を実現する新しいアーキテクチャであるMogoを提案する。
Mogoは、HumanML3Dのような既存のデータセットの196フレーム(10秒)を超える、最大260フレーム (13秒)の連続的かつ循環的なモーションシーケンスを生成することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:30:43 GMT)
Mixing thermal coherent states for precision and range enhancement in quantum thermometry [0.0] 共振器に縦に結合した2レベルシステムと熱浴を結合させることにより, 熱コヒーレント状態の特別な混合を実現することを提案する。
共振器の状態は、逆転した2つの熱コヒーレント状態の特別な混合であるのに対して、2レベルの系は熱のままである。
この文脈では、共振器は2レベルシステムによって媒介される入浴の未知の温度を測定するプローブとして機能する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:05:31 GMT)
Minimality in Finite-Dimensional ZW-Calculi [0.0] ZW-計算(ZW-calculus)は、2次元量子系(量子ビット)を図形で表すことができるグラフィカル言語である。
形式主義を拡張して、有限次元ヒルベルト空間を qubit 系を超えて取り込む。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:19:43 GMT)
Machine learning approach for mapping the stable orbits around planets [0.0] 本研究では,機械学習技術を用いて仮説惑星を取り巻く安定領域の予測地図を作成することを目的とする。
このアプローチは、惑星・衛星系、惑星環系、その他の同様の構成にも拡張することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:23:05 GMT)
Machine Theory of Mind for Autonomous Cyber-Defence [0.0] 自律型サイバー作戦における精神理論(ToM)のアプローチを評価する。
ToMモデルはエージェントの目標、行動、文脈的信念を予測することができる。
本稿では,サイバー防御に適した新しいグラフニューラルネットワーク(GNN)ベースのToMアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:35:29 GMT)
Machine Learning-based Android Intrusion Detection System [0.0] 本稿では,アンドロイドAPKファイルのセキュリティに対する機械学習分類アルゴリズムの適用について述べる。
機械学習の分類技術は、新しくインストールされたアプリケーションのシグネチャが悪意のあるドメインか非悪意のあるドメインに該当するかを分類するために使用される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:05:12 GMT)
MT3DNet: Multi-Task learning Network for 3D Surgical Scene Reconstruction [0.0] 画像支援最小侵襲手術(MIS)では,手術シーンの理解が外科医へのリアルタイムフィードバックに不可欠である。
この課題は、高解像度の画像で描かれた手術シーンの深さを正確に検出し、セグメンテーションし、推定することにある。
これらのタスクを同時に実行するために,Multi-Task Learning (MTL) ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:07:35 GMT)
Learning Speed-Adaptive Walking Agent Using Imitation Learning with Physics-Informed Simulation [0.0] 生体力学的に現実的な動作を維持しつつ、様々な歩行速度に適応できる骨格型ヒューマノイド剤を開発した。
このフレームワークは、オープンソースのバイオメカニクスデータから生体力学的に妥当な歩行運動を生産する合成データジェネレータと、エージェントの歩行ポリシーを訓練するために逆模倣学習を使用する訓練システムとを組み合わせる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:55:58 GMT)
Lack of near-sightedness principle in non-Hermitian systems [0.0] 非エルミート皮膚効果は、トポロジカル絶縁体よりもバルクエッジ対応が弱いことを示す。
単一の非エルミート不純物は、エルミートバルクの地域から州を枯渇させる可能性がある。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 13:59:22 GMT)
LRSAA: Large-scale Remote Sensing Image Target Recognition and Automatic Annotation [0.0] LRSAAと呼ばれる大面積リモートセンシング画像におけるオブジェクト認識と自動ラベリングの手法を提案する。
YOLOv11とMobileNetV3-SSDオブジェクト検出アルゴリズムをアンサンブル学習により統合し,モデル性能を向上させる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:08:01 GMT)
LLM-Mirror: A Generated-Persona Approach for Survey Pre-Testing [0.0] 統計的分布と個別意思決定パターンの両方を再現できるかどうかを検討する。
また,LLMに応答性固有の情報を供給することによって生成されるユーザペルソナであるLLM-Mirrorの概念についても紹介する。
PLS-SEM分析の結果, LLMはヒトの反応に一致し, LLMはヒトの反応を再現し, LLM-Mirror反応はヒトの反応に密接に従っていることがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:21:16 GMT)
Impact of spatial curvature on quantum Otto engines [0.0] 量子熱機関の特性に対する物理空間の曲率効果について検討する。
熱湯の位置間の曲率差を調整することにより, 熱機関の効率がカルノット限界に達することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 04:43:05 GMT)
Hubbard Model on the Honeycomb Lattice with an Indefinite Long-Range Interaction [0.0] 我々は、相互作用行列を正負定値成分に分解し、管理可能な符号特性を持つQMC計算を可能にする。
我々はGross-Neveu臨界クラス内の半金属から電荷への密度波位相遷移を同定する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:15:25 GMT)
How well behaved is finite dimensional Diffusion Maps? [0.0] 有限次元およびほぼ等距離拡散写像(DM)の後に有効である一連の性質を導出する。
DMアルゴリズムで導入された埋め込み誤差の厳密な境界は$Oleft(fraclog nn)frac18d+16right$である。
これらの結果は,実践的応用におけるDMの性能と信頼性を理解するための確固たる理論的基盤を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:12:25 GMT)
How to design a Public Key Infrastructure for a Central Bank Digital Currency [0.0] 中央銀行デジタル通貨(Central Bank Digital Currency、CBDC)は、各国の中央銀行が発行する新たな通貨で、様々な支払いシナリオに使用できる。
システム内のすべてのエンティティの継続的な信頼を保証するため、CBDCには堅牢でスケーラブルなパブリックキーインフラストラクチャ(PKI)が必要である。
本稿では,PKIの設計に流入すべき基準について論じ,システムの継続的な運用を保証するロールオーバー概念とともに証明書階層を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:41:38 GMT)
How Large Language Models (LLMs) Extrapolate: From Guided Missiles to Guided Prompts [0.0] 補間(英: extrapolation)とは、系列の次の値を予測する統計関数である。
外挿はGPTの成功と幻覚を取り巻く論争に寄与する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:54:47 GMT)
HERO: Hint-Based Efficient and Reliable Query Optimizer [0.0] 本稿では,より優れた実行計画を実現するためのクエリヒントを提供する,学習クエリ最適化のための新しいモデルを提案する。
このモデルは、学習したヒントベースのクエリ最適化において、信頼できるヒントレコメンデーション、効率的なヒント探索、高速推論という3つの課題に対処する。
私たちのモデルは解釈可能でデバッグが容易です。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 06:00:34 GMT)
Guidance is All You Need: Temperature-Guided Reasoning in Large Language Models [0.0] 大規模言語モデルに温度誘導推論を導入する新しいアーキテクチャである Quasar-1 を提案する。
我々の手法はホットトークンとコールドトークンの概念を活用し、ホットトークンは文脈的関連性に優先され、コールドトークンは補足的な情報を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:05:41 GMT)
GeoPos: A Minimal Positional Encoding for Enhanced Fine-Grained Details in Image Synthesis Using Convolutional Neural Networks [0.0] 複雑な幾何学的特徴を再現する画像生成モデルの永続的不備は、ほぼ10年間にわたって進行中の問題であった。
本稿では,この問題を幾何的能力の畳み込み層を拡大することにより緩和する方法について述べる。
本研究では,拡散モデル,GAN,変分オートエンコーダ(VAE)によって生成された画像の品質を大幅に向上させることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:31:43 GMT)
Generalized coherent states for the harmonic oscillator by the J-matrix method with an extension to the Morse potential [0.0] 複素平面 C の点 z でラベル付けされたペレロモフ型の一般化コヒーレント状態 (GCS) の集合を再現する。
我々はこのプロシージャをMorse型に拡張し、Glauber型の新しいGCSを構築する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 05:27:50 GMT)
GEITje 7B Ultra: A Conversational Model for Dutch [0.0] GEITjeはイギリスのMistral 7Bから派生したモデルである。
この研究は、新しく作成された高品質な合成会話データセットの微調整を監督することでGEITjeの能力を拡張する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:56:48 GMT)
From interpretability to inference: an estimation framework for universal approximators [0.0] 広義の普遍近似器を用いた推定と推定のための新しいフレームワークを提案する。
推論は個々のシェープ成分のバイアスと分散特性の分析に依存する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:32:37 GMT)
From Magic State Distillation to Dynamical Systems [0.0] そこで本研究では,MSDプロトコルを安定化化の枠組みの下で反復力学系にマッピングする方法を提案する。
マッピングにより、動的システム理論の手法を用いてMSDプロトコルの性能を解析できる。
また、異なる符号を連結して生成された新しいMSDプロトコルについて検討し、様々なマジック状態のMSDプロトコルを生成することを数値的に示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:20:01 GMT)
Frequency-tunable biphoton generation via spontaneous four-wave mixing [0.0] 自発4光波混合(SFWM)におけるデチューテッドカップリング場の導入によるバイフォトン周波数のチューニングに関する実験結果を示す。
このチューニング性は、固有電磁誘導透過(EIT)効果をダブル・ロンバダ$スキームで操作することで達成される。
青と赤の2光子周波数は位相ミスマッチによる2光子ウェーブパケットの時間的プロファイルが異なることが観察された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:50:10 GMT)
Formulation of probability theory problem with subtle condition [0.0] 第一言語が英語ではない1~4年生を対象に,確率論における4つの問題について議論した。
そこで我々は,これらの問題の解を詳細に議論し,数値的な推定で補うとともに,問題の条件をPythonプログラミング言語の論理文に関連付ける。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:32:23 GMT)
Flexible Mesh Segmentation through Integration of Geometric andTopological Features of Reeb Graphs [0.0] 本稿では,Reebグラフに基づくメッシュセグメンテーション手法を提案する。
幾何学的および位相的特徴をシームレスに統合し、フレキシブルかつロバストなセグメンテーション結果を達成する。
その汎用性と有効性は、局所幾何学的セグメンテーションと部分的分解の両方に適用することで検証される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 23:04:45 GMT)
Finite-frequency noise, Fano factor, $ΔT$-noise and cross-correlations in double quantum dots [0.0] 電子貯水池に接続された二重量子ドットにおける電流変動について検討する。
有限周波数雑音、ファノ因子、および$Delta T$-ノイズを導出する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:49:22 GMT)
Exploring AI Text Generation, Retrieval-Augmented Generation, and Detection Technologies: a Comprehensive Overview [0.0] 独創性、偏見、誤情報、説明責任などの問題を含む、AI生成コンテンツを取り巻く懸念が顕在化している。
本稿では、AIテキストジェネレータ(AITG)の進化、能力、倫理的意味を概観する。
本稿では,検出精度の向上,倫理的AI開発支援,アクセシビリティ向上に向けた今後の方向性について検討する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:23:14 GMT)
Exited-state quantum phase transitions in constrained systems [0.0] 我々は、励起状態量子相転移(ESQPT)の標準理論を拡張する。
我々はラグランジュ乗算法の手法を採用し、運動の任意の数の積分によって制約されたハミルトニアンからすべての定常点とそれらの性質を直接見つける。
また、保存された励起数で制約されたボゾン系の1次自由度を除去するために使われるホルシュタイン・プリマコフ写像を詳しく述べる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:23:08 GMT)
Excretion Detection in Pigsties Using Convolutional and Transformerbased Deep Neural Networks [0.0] 水たまりや糞のような動物の排ガスは家畜の農業において重要な排出源である。
水たまり領域を決定するための従来の研究手法では、納屋内の水たまりを手動で検出する必要がある。
本研究は,豚の排ガス検出における各種深層学習モデルの適合性について検討した最初のものである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:24:39 GMT)
Evaluating an Effective Ransomware Infection Vector in Low Earth Orbit Satellites [0.0] 本稿では、攻撃者が軌道上のNASA Core Flight System (cFS) ベースの衛星をランサムウェアで感染させ、衛星オペレーターに通信するシナリオを概説する。
本論文は,サプライチェーン攻撃や不正な認証を必要とせず,ランサムウェア感染につながるエンドツーエンドのエクスプロイトパスを最初に示すものである。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:30:26 GMT)
Ethical and Scalable Automation: A Governance and Compliance Framework for Business Applications [0.0] 本稿では、AIが倫理的で、制御可能で、実行可能で、望ましいものであることを保証するフレームワークを紹介する。
異なるケーススタディは、学術と実践の両方の環境でAIを統合することで、このフレームワークを検証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 20:51:04 GMT)
Epoch-based Application of Problem-Aware Operators in a Multiobjective Memetic Algorithm for Portfolio Optimization [0.0] 基準制約付き投資ポートフォリオの多目的最適化のためのメメティックアルゴリズムの文脈において、インテンシフィケーション/多様性バランスの問題を考える。
我々は,これらの演算子の探索のどの段階がより良い結果をもたらすかを決定するために,感性解析を行った。
この結果から,本アルゴリズムはパラメータ化の点で非常に頑健であることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:57:42 GMT)
Effects of non-integrability in a non-Hermitian time crystal [0.0] 非可積分相互作用項を非エルミート時間結晶モデルに導入する効果について検討する。
十分に強い相互作用は予期せぬ対称性を破る遷移を引き起こす。
以上の結果から,非エルミート力学と多体相互作用の相互作用は,新しい対称性の破れにつながる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:58:09 GMT)
Double-bracket quantum algorithms for quantum imaginary-time evolution [0.0] 我々は,2重ブラケット量子イマジナリー・タイム・エボリューション(DB-QITE)アルゴリズムが,仮想時間進化の冷却保証を継承していることを証明する。
DB-QITEは浅い回路を用いて基底状態の近似を体系的に改善する手段を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 19:00:09 GMT)
Distribution Function for $n \ge g$ Quantum Particles [0.0] ボース・アインシュタイン凝縮(BEC)を予防する$nI(varepsilon)$の異常挙動
識別可能かつ識別不能な粒子とエネルギーレベルの両方に対して、徹底的な分類スキームが提示される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:43:19 GMT)
Dissipative variational quantum algorithms for Gibbs state preparation [0.0] 本稿では、変分量子回路の本質的な部分として、qubit RESETやゲートなどの散逸演算を組み込むことにより、散逸型変分量子アルゴリズム(D-VQA)を導入する。
このようなアルゴリズムは、広範囲の量子多体ハミルトンと温度でギブス状態を作ることができ、コヒーレントノイズと非コヒーレントノイズの両方による誤差を著しく低減することができる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:58:54 GMT)
Digital Twin for Evaluating Detective Countermeasures in Smart Grid Cybersecurity [0.0] この研究は、スマートグリッドのサイバー物理実験環境を複製し、デジタル双生児の可能性を掘り下げる。
ハードウェア・イン・ザ・ループ評価のためのフレキシブルで包括的なディジタルツインモデルを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:41:08 GMT)
Dichotomy in the effect of chaos on ergotropy [0.0] エルゴトロピー(ergotropy)は量子力学において有用な概念である。
この研究は、カオス力学から生じる影響を説明するために、量子カオスシステムで研究されている。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:59:01 GMT)
Demonstration of weighted graph optimization on a Rydberg atom array using local light-shifts [0.0] Rydberg 原子アレイ上での最大重み付き独立集合問題の解法を示す。
重み付きグラフを1次元および2次元配列で作成する能力を検証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:20:58 GMT)
Demonstration of Enhanced Qubit Readout via Reinforcement Learning [0.0] モデルフリー強化学習(RL)と調整された学習環境を併用し、この多目的最適化タスクを実現する。
我々は、RLエージェントが取得した測定パルスが最先端の性能を達成することを、IBM量子デバイス上で実証する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:43:36 GMT)
Deep Learning and Hybrid Approaches for Dynamic Scene Analysis, Object Detection and Motion Tracking [0.0] 本研究の目的は,活動の検出に基づいて映像を小さなクリップに分割する,堅牢な映像監視システムを開発することである。
例えば、CCTVの映像を使って、人や泥棒の外観のような主要なイベントのみを記録し、ストレージを最適化し、デジタル検索がより簡単になる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:44:40 GMT)
Coordinate- and spacetime-independent quantum physics [0.0] 粒子の概念は場の量子論において曖昧である。
我々の1人は、量子粒子の座標フレームに依存しないモデルを提案した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:01:32 GMT)
Contextuality of the probability current in quantum mechanics [0.0] 我々は、局所現実理論についてハーディが提唱した議論を再考するが、標準量子力学の確率電流の観点から考える。
我々は、構成空間における軌跡の驚くべき性質、特に文脈(実験装置)が変更されたときの(準)不連続な変動を強調した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:16:19 GMT)
Considerations Influencing Offense-Defense Dynamics From Artificial Intelligence [0.0] AIは防御能力を向上するだけでなく、悪意ある搾取と大規模な社会的危害のための道も提示する。
本稿では、AIシステムが主に脅威を生じているか、社会に保護的利益をもたらすかに影響を及ぼす主要な要因をマップし、検証するための分類法を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:05:53 GMT)
Compression of Higher Order Ambisonics with Multichannel RVQGAN [0.0] RVQGANニューラルコーディング手法のマルチチャネル拡張を提案し,3次Ambisonics音声のデータ駆動圧縮を実現する。
ジェネレータと判別器モデルの入力層と出力層は、モデルを増大させることなく複数のチャネルを受け入れるように修正される。
また,入射再生における空間知覚を考慮した損失関数を提案し,単一チャネルモデルからの伝達学習を行う。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 21:50:27 GMT)
Compliant Self Service Access to Secondary Use Clinical Data at Stanford Medicine [0.0] STARR (STAnford Research Repository) は、スタンフォード大学における基礎科学研究、人口健康研究、翻訳研究を支援する臨床研究支援エコシステムである。
STARRは、生データと分析可能なマルチモーダルデータと、コホート分析とセルフサービスデータアクセスのためのツールで構成される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:29:29 GMT)
Colour and Brush Stroke Pattern Recognition in Abstract Art using Modified Deep Convolutional Generative Adversarial Networks [0.0] 本稿では,GAN(Generative Adrial Neural Networks)を用いた抽象絵画の広範な分布について述べる。
課題は、一般的なトレーニングの落とし穴を克服する効率的なGANアーキテクチャを開発することだ。
本稿では,高品質なアートワーク生成のための改良型DCGAN (mDCGAN) を提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:11:22 GMT)
Clustering-induced localization of quantum walks on networks [0.0] 量子ウォークは量子情報理論におけるパラダイムモデルである。
トライアングルをアタッチすることで、高度にクラスタ化されたネットワークでローカライゼーションがどのように現れるかを示す。
次に、Kleinbergの小規模ネットワークやHolme-Kimのパワーロークラスタネットワークにもローカライゼーションが存在することを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 16:40:57 GMT)
COOL: Efficient and Reliable Chain-Oriented Objective Logic with Neural Networks Feedback Control for Program Synthesis [0.0] Logicのチェーン(CoL)は、合成プロセスをアクティビティフローに編成し、プロセスを導くための制御を提供する。
我々のアプローチは、合成をモジュール化し、ニューラルネットワークの誤予測の影響を軽減します。
リレーショナルおよびシンボリック合成タスクの実験は、CoLがDSLプログラム合成の効率と信頼性を著しく向上させることを示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 08:10:55 GMT)
CNN-based Labelled Crack Detection for Image Annotation [0.0] 本稿では,深部畳み込みニューラルネットワーク(CNN)を用いたAM表面のき裂検出手法を提案する。
訓練されたCNNは、14,982の注釈付き画像の解像度が1536 x 1103ピクセルのデータセットで99.54%の精度を達成した。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 01:09:23 GMT)
Bound of Casimir Effect by Holography [0.0] ゴーストフリーホログラフィックモデルはカシミール効果の普遍的な下界を課す。
注目すべきは、ホログラフィック境界は共形対称性を持たない場の量子論の一般クラスによって従うことである。
カシミール効果のホログラフィック境界に対する場の理論的な証明や反例を見つけることは興味深い。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 12:46:18 GMT)
Boosting quantum annealing performance through direct polynomial unconstrained binary optimization [0.0] 多くの最適化問題は、高次の非制約二項最適化関数の観点からより自然に定式化されている。
PUBOの定式化により,必要量子ビット数の点でかなりの節約が期待できることを示す。
以上の結果から, 量子アニールの資源効率とスイーピング速度を向上させるための有望な経路が示唆された。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:12:20 GMT)
Beyond case studies: Teaching data science critique and ethics through sociotechnical surveillance studies [0.0] 倫理は、それらが構造的抑圧を強化することを示すアルゴリズムやシステムの批判が増大する中で、データサイエンスの研究、実践、教育にとって緊急の関心事となっている。
我々は、社会技術システムである監視システムの分析を通じて、重要なデータ研究の根底にある社会現象に言及するデータサイエンス倫理コースを設計した。
学生は、彼ら自身の監視システムを調査し、彼らの利益、害、主要な支持者、抵抗する人々を特定するために、批判的な分析スキルを開発しました。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 17:44:02 GMT)
Bayesian evidence estimation from posterior samples with normalizing flows [0.0] 本研究では,非正規化後分布から得られたサンプル群からベイズ証拠(およびその数値的不確実性)を推定する新しい手法を提案する。
解析的に証拠が知られている分布において最大15個のパラメータ空間次元を検証し、2つの最先端技術と比較する。
$floZ$は、例えば変分推論、マルコフ・チェイン・モンテカルロのサンプル、あるいは非正規化後密度からサンプルとそれらの可能性を提供する他の方法から証拠を推定するために幅広い適用性を持つ。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:27:14 GMT)
Automated Medical Report Generation for ECG Data: Bridging Medical Text and Signal Processing with Deep Learning [0.0] 本稿では,自由テキストレポートを用いてECGエピソードの詳細な記述を生成するエンコーダ・デコーダ方式を提案する。
これは、ゼロショット分類と自動臨床決定支援の潜在的な応用として、ECG分析自動化の大幅な進歩を示している。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 11:05:12 GMT)
Automated LaTeX Code Generation from Handwritten Math Expressions Using Vision Transformer [0.0] 本稿では,手書き/デジタルの数学的表現画像を等価コードに変換するために,より新しいトランスフォーマーベースのアーキテクチャを提案する。
我々はCNNエンコーダとRNNデコーダの現状を,実験のベースラインとして利用している。
実験の結果, トランスフォーマーアーキテクチャは, CNN/RNNアーキテクチャと比較すると, BLEUスコアとLevenschteinスコアとが一致し, 全体的な精度が向上することがわかった。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 03:58:13 GMT)
Asynchronous Batch Bayesian Optimization with Pipelining Evaluations for Experimental Resource$\unicode{x2013}$constrained Conditions [0.0] PipeBOは実験の様々なプロセスに重なり合うことで実験の並列化を実現するように設計された。
最適化の平均処理時間は2つのプロセスからなる実験で約56%、24の関数のうち20のプロセスでさらに少ない。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:06:09 GMT)
Addressing Hallucinations with RAG and NMISS in Italian Healthcare LLM Chatbots [0.0] 大規模言語モデル(LLM)の幻覚に対する検出と緩和を併用する
NMISS(Negative Missing Information Scoring System)を導入して検出を行う間、質問応答型検索拡張生成(RAG)フレームワークで緩和を実現する。
この組み合わせアプローチは、LLMにおける幻覚の低減とより正確な評価に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 15:11:12 GMT)
AdamMCMC: Combining Metropolis Adjusted Langevin with Momentum-based Optimization [0.0] 科学と工学におけるディープニューラルネットワーク手法の適用を考える場合、不確実性推定は重要な問題である。
本稿では,モンテカルロ法を用いて後部分布から不確かさを定量化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 10:49:37 GMT)
Achieving Heisenberg scaling by probe-ancilla interaction in quantum metrology [0.0] ハイゼンベルクスケーリング(Heisenberg Scaling)は、量子力学の原理によって許容されるパラメータ推定の最終的な精度限界である。
本稿では,プローブと補助システムとの相互作用が,パラメータ推定の精度を高め,標準量子限界を超える可能性があることを示す。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 14:27:33 GMT)
A robust quantum nonlinear solver based on the asymptotic numerical method [0.0] 本稿では,新しい量子非線形解法である量子数値法を紹介する。
テイラー級数を用いて非線形問題を線形化することにより、量子アルゴリズムで解ける線形方程式の列に変換する。
クァフの超伝導量子プロセッサの実験を行い, 得られた非線形解路において最大98%の精度を達成できた。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 07:39:29 GMT)
A practical guide to feedback control for Pound-Drever-Hall laser linewidth narrowing [0.0] レーザー線幅狭帯域化のためのPund-Drever-Hall(PDH)技術は、AMOの実験者によって広く用いられている。
フィードバック制御の原則を基礎として,多面的工学的考察を体系的に整理する。
提案手法は1650nmのECDLに対するロックのステップバイステップ最適化によって説明される。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 22:07:31 GMT)
A method to benchmark high-dimensional process drift detection [0.0] 本稿では,プロセス曲線データセットのドリフトを検出する機械学習について検討する。
制御された方法でプロセス曲線を合成的に生成する理論的枠組みを導入する。
曲線下の時間領域と呼ばれる評価スコアを導入する。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 18:56:04 GMT)
A Note on Spectral Map [0.0] 状態間の遷移は、しばしば熱温度を超えるエネルギー障壁によって稀な出来事である。
この問題に対する一般的なアプローチは、単純化された表現によってこのプロセスを記述する集合変数(CV)を提案することである。
本稿では、遅い変数と速い変数の時間スケールの分離を最大化することでCVを構成するスペクトルマップと呼ばれる最近の教師なしML手法について述べる。
論文参考訳(メタデータ) (Thu, 05 Dec 2024 09:45:21 GMT)