Dream-VL & Dream-VLA: Open Vision-Language and Vision-Language-Action Models with Diffusion Language Model Backbone [93.0] 拡散型大規模言語モデルに基づく視覚言語モデルの構築の可能性について検討する。
本稿では,最先端の性能を実現するオープン拡散型VLMであるDream-VLを紹介する。
我々はDream-VLAというdLLMベースのビジョン・ランゲージ・アクション・モデルを構築し、オープンなロボットデータセット上で連続的な事前トレーニングによって開発する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:46:24 GMT)
Emergence of Human to Robot Transfer in Vision-Language-Action Models [88.8] VLA(Vision-Language-action)モデルは、幅広いオープンワールドの一般化を可能にするが、大規模で多様なデータセットを必要とする。
VLAが十分なシーン、タスク、実施状況で事前訓練された後に、人間とロボットの移動が出現することを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 00:13:11 GMT)
FinPercep-RM: A Fine-grained Reward Model and Co-evolutionary Curriculum for RL-based Real-world Super-Resolution [87.6] 人間のフィードバックによる強化学習は、人間の好みを調整する報酬モデルによって導かれる画像生成分野で有効であることが証明されている。
本稿では, アンコーダ・デコーダアーキテクチャに基づく細粒度パーセプ・リワードモデル(FinPercep-RM)を提案する。
グローバルな品質スコアを提供する一方で、局所的な欠陥を空間的に局所化し定量化する知覚的劣化マップも生成する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:55:21 GMT)
AgentMath: Empowering Mathematical Reasoning for Large Language Models via Tool-Augmented Agent [80.8] o3やDeepSeek-R1のようなLarge Reasoning Models (LRM)は、長いチェーン・オブ・シークレットを持つ自然言語推論において顕著な進歩を遂げている。
しかし、計算的に非効率であり、複雑な数学的操作を必要とする問題を解く際には精度に苦しむ。
本稿では,言語モデルの推論能力とコードインタプリタの計算精度をシームレスに統合するエージェントフレームワークであるAgentMathを紹介する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:10:54 GMT)
DreamOmni3: Scribble-based Editing and Generation [72.5] 私たちはDream Omni3を紹介し、データ生成とフレームワーク設計という2つの課題に取り組みます。
スクリブル・インストラクション・ベースの編集、スクリブル・マルチモーダル・インストラクション・ベース・ジェネレーション、およびドゥードル生成の4つのタスクを定義する。
フレームワークでは,バイナリマスクの代わりに,オリジナル画像とスクリブル画像の両方をモデルに入力するジョイント入力方式を提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:07:12 GMT)
On the Role of Discreteness in Diffusion LLMs [69.6] 拡散過程と言語モデリングの観点を再考し、拡散力学と言語固有の要件を分離する5つの特性を概説する。
i) 均一な汚職は、どのように情報を配置するかを尊重せず、 (ii) トークンワイドの辺縁トレーニングは、並列デコーディング中にマルチトークンの依存関係をキャプチャできない。
これらの観察は、テキストの構造とより密接に一致した拡散過程を動機付け、より一貫性のある拡散言語モデルに向けた将来の研究を促進する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:03:08 GMT)
Visual Autoregressive Modelling for Monocular Depth Estimation [69.0] 本稿では,視覚的自己回帰(VAR)に基づく単眼深度推定手法を提案する。
提案手法は,大規模テキスト・画像VARモデルに適応し,スケールワイド・コンディショナル・アップサンプリング機構を導入する。
本研究では,屋内ベンチマークにおける制約付きトレーニング条件下での最先端性能と,屋外データセットに適用した場合の強い性能について報告する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:08:03 GMT)
Envision: Embodied Visual Planning via Goal-Imagery Video Diffusion [61.6] Embodied Visual Planningは、シーンが望ましい目標に向かってどのように進化するかを想像することで、操作タスクを可能にすることを目的としている。
ビデオ拡散モデルは、このような視覚的想像力の有望な基盤を提供する。
エージェントの視覚的計画を行う拡散型フレームワークであるEnvisionを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:46:41 GMT)
Communication Compression for Distributed Learning with Aggregate and Server-Guided Feedback [43.7] 分散学習、特にフェデレートラーニング(FL)は、通信コストにおいて重大なボトルネックに直面します。
本稿ではクライアント側の状態や制御変数を使わずにバイアス圧縮を可能にする2つの新しいフレームワークを提案する。
FLシナリオにおける実験結果は、我々のアプローチを検証する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:29:42 GMT)
Beg to Differ: Understanding Reasoning-Answer Misalignment Across Languages [43.4] 我々はGlobalMMLUの6つの言語と6つのフロンティアモデルにおける65kの推論トレースを分析した。
非ラテン文字における推論の痕跡は、少なくともラテン文字よりも推論と結論の2倍のミスアライメントを示している。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 21:55:21 GMT)
Raven: Mining Defensive Patterns in Ethereum via Semantic Transaction Revert Invariants Categories [42.7] invariants-require(invariant>)/ assert(invariant>)/ifで返されるトランザクションをフレーム化する。
その価値にもかかわらず、これらの取引の防御パターンは未発見のままであり、セキュリティ研究では使われていない。
スマートコントラクトソースコードの逆変換を引き起こす不変量に変換されたトランザクションをアライメントするフレームワークであるRavenを提示する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:47:38 GMT)
CFIghter: Automated Control-Flow Integrity Enablement and Evaluation for Legacy C/C++ Systems [42.7] Control-Flow Integrity (CFI)は、強力なフォワードエッジ保護を提供するが、大規模なC/C++ソフトウェアでのデプロイは依然として困難である。
CFIghterは、現実世界のプロジェクトで厳密な型ベースのCFIを可能にする最初の完全自動化システムである。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 20:38:08 GMT)
M2G-Eval: Enhancing and Evaluating Multi-granularity Multilingual Code Generation [42.2] M2G-Evalは,大規模言語モデル(LLM)において,クラス,関数,ブロック,ラインの4段階にわたるコード生成を評価するフレームワークである。
M2G-Evalには17K以上のトレーニングタスクと1,286の人手による汚染制御テストインスタンスが含まれている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:00:46 GMT)
SANet: A Semantic-aware Agentic AI Networking Framework for Cross-layer Optimization in 6G [41.9] Agentic AI Network(AgentNet)は、多数の専門的AIエージェントが協力して自律的な意思決定、動的環境適応、複雑なミッションを実行する、新しいAIネイティブネットワーキングパラダイムである。
本稿では,ユーザのセマンティックな目標を推測し,ネットワークの異なるレイヤに関連付けられたエージェントを自動アサインして推定目標を達成する,無線ネットワークのための新しいセマンティック・アウェア・エージェントネットアーキテクチャであるSANetを提案する。
AgentNetは、一般的に協力するエージェントが異なる、さらには矛盾する目的を持つ分散化フレームワークであるという事実に動機付けられ、我々は、SANetの分散最適化をマルチエージェントマルチエージェントとして定式化する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 12:42:47 GMT)
Rethinking Memory Design in SAM-Based Visual Object Tracking [41.9] 本稿では,SAMに基づく視覚的物体追跡のメモリ中心的な研究について述べる。
本稿では,メモリを短期的外見記憶と長期的外見記憶に明示的に分解するハイブリッドメモリフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:33:50 GMT)
GraphLocator: Graph-guided Causal Reasoning for Issue Localization [40.3] 問題ローカライゼーションタスクは、自然言語の問題記述の修正を必要とするソフトウェアリポジトリ内の場所を特定することを目的としている。
このタスクは、問題記述とソースコード実装のセマンティックなギャップのために、自動化されたソフトウェアエンジニアリングにおいて基本的なものであるが、難しい。
本稿では,症状から原因へのミスマッチを因果構造によって緩和し,動的問題分離によって一対多のミスマッチを発見・解決するアプローチであるGraphLocatorを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:02:53 GMT)
Unified Review and Benchmark of Deep Segmentation Architectures for Cardiac Ultrasound on CAMUS [40.0] 心臓超音波セグメンテーションの文献的考察と,3つの重要なアーキテクチャの比較を行った。
ベンチマークでは,NIfTIボリューム,16ビットPNGエクスポート,GPT支援多角形擬似ラベル,自己教師付き事前学習など,複数の前処理経路にまたがる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:07:57 GMT)
A Global Atlas of Digital Dermatology to Map Innovation and Disparities [38.7] SkinMapは、フィールドの全データベースを総合的に監査するための、マルチモーダルなフレームワークである。
我々は、利用可能な皮膚科学データセットを、1100万枚以上の皮膚状態の画像からなる単一のクエリ可能なセマンティックアトラスに統一する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:22:36 GMT)
Tracking by Predicting 3-D Gaussians Over Time [36.7] Video-GMAEは、画像列を時間とともに移動するガウススプラッターのセットにエンコードする。
このアーキテクチャでネットワークを事前訓練すると、トラッキングが出現する。
小型の微調整により、我々のモデルはKineeticsで34.6%、Kubricデータセットで13.1%向上した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:16:54 GMT)
VLA-Arena: An Open-Source Framework for Benchmarking Vision-Language-Action Models [33.1] 本稿では,3つの軸にまたがる難易度を定量化するための新しい構造化タスク設計フレームワークを提案する。
タスク構造では、VLA-Arenaの170のタスクは、安全性、ディトラクタ、外挿、ロングホライゾンの4つの次元に分けられる。
タスク定義から自動評価までのエンドツーエンドツールチェーンと、微調整のためのVLA-Arena-S/M/Lデータセットを提供する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:40:54 GMT)
HINTS: Extraction of Human Insights from Time-Series Without External Sources [32.6] 人間の意思決定、感情、集団心理学は、金融・経済システムで観察される時間的ダイナミクスを形成する複雑な要素である。
外部データのない時系列残差から不均一にこれらの潜伏要因を抽出する自己教師型学習フレームワークであるHINTSを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:13:12 GMT)
KV-Tracker: Real-Time Pose Tracking with Transformers [30.3] マルチビュー3D幾何ネットワークは強力だが、リアルタイムアプリケーションでは極めて遅い。
モノラルなRGBビデオからオブジェクトやシーンをリアルタイムに6-DoFのポーズトラッキングとオンライン再構築を可能にする新しい方法を提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 13:02:30 GMT)
GLUE: Gradient-free Learning to Unify Experts [29.7] 専門家を統一するためのグラディエントフリーラーニングであるGLUEを提案する。
ターゲットモデルを固定専門家の凸結合として初期化する。
勾配のない2点更新により、この組み合わせの混合係数を学習する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:59:17 GMT)
Scaling Unverifiable Rewards: A Case Study on Visual Insights [29.5] 大規模言語モデル(LLM)エージェントは、テスト時間スケーリング(TTS)を通じて複雑な推論を自動化することができる。
Selective TTSは、マルチエージェントパイプラインの異なるステージにまたがって推論をスケールするプロセスベースの精錬フレームワークである。
提案した選択的TSは,計算予算の固定化により洞察品質を向上し,平均スコアを61.64から65.86に向上し,分散を低減した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:01:38 GMT)
Towards Robust Optical-SAR Object Detection under Missing Modalities: A Dynamic Quality-Aware Fusion Framework [27.7] 光・合成開口レーダ(SAR)融合による物体検出はリモートセンシングに大きな研究関心を集めている。
本稿では,光SARオブジェクト検出のためのQDFNet(Quality-Aware Dynamic Fusion Network)を提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 03:16:48 GMT)
Learning with the $p$-adics [26.4] 我々は、$mathbbR$, $mathbbQ_p$, $mathbbQ_p$の超測度および非アルキメデス空間の代替として、根本的に異なる分野の適合性について研究する。
p$-adicsの階層構造と無限文字列としての解釈は、コード理論と階層的表現学習にとって魅力的なツールである。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 19:40:42 GMT)
The Quest for Winning Tickets in Low-Rank Adapters [24.6] Lottery Ticket仮説がパラメータ効率の良い微調整に拡張されるかどうかを検討する。
我々の重要な発見は、LTHがLoRA(Lo-Rank Adaptation)メソッド内に保持されていることです。
そこで本研究では,課題関連部分空間に適合する低ランクアダプタを訓練し,サロワークを識別する手法であるPartial-LoRAを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:39:08 GMT)
Role-Based Fault Tolerance System for LLM RL Post-Training [24.2] トレーニング後のRLはトレーニングと推論のワークロードをインターリーブし、システムを両側の障害に晒す。
私たちの重要な洞察は、ロールベースの障害分離です。
本稿では,RL後トレーニング時間比改善のためのGPUマシンエラーを処理する,初の総合的ロバストシステムであるRobustRLを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:30:18 GMT)
What Matters in Deep Learning for Time Series Forecasting? [23.5] 我々は、しばしば予期せぬ、観察された結果を説明することができる設計の次元とトレードオフについて議論する。
本稿では,時系列群予測の原理に基づくモデル設計の必要性について論じる。
これらの側面を考慮に入れることは、特定のシーケンス・モデリング・レイヤを採用するよりも正確な結果を得るのに有効であることを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 20:50:28 GMT)
Chain-of-thought Reviewing and Correction for Time Series Question Answering [22.9] 本稿では,時系列質問応答の明示的な補正機構を備えた多段階推論を行うT3LLMを提案する。
このフレームワーク内では、作業者は構造化されたプロンプトの下で段階的思考連鎖(CoT)を生成し、レビュアーは推論を検査し、誤ったステップを特定し、修正的なコメントを提供する。
複数の実世界のTSQAベンチマークの実験により、T3LLMは強力なLLMベースのベースラインに対して最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:54:18 GMT)
TravelBench: A Real-World Benchmark for Multi-Turn and Tool-Augmented Travel Planning [22.3] 大規模言語モデル(LLM)エージェントは、計画とツールの使用において強力な能力を示している。
旅行プランニングは、これらの機能に対する自然かつ高インパクトなテストベッドを提供する。
本稿では,マルチターンインタラクションとツール利用を特徴とする実世界の旅行計画ベンチマークであるTravelBenchを紹介する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:25:14 GMT)
AFA-LoRA: Enabling Non-Linear Adaptations in LoRA with Activation Function Annealing [22.0] AFA-LoRAは、シームレスなマージ性を維持しながら、非線形表現性をLoRAにもたらす新しいトレーニング戦略である。
教師付き微調整,強化学習,投機的復号化に本手法を適用した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:12:40 GMT)
Decomposing Task Vectors for Refined Model Editing [21.8] 本稿では,各タスクベクトルを2つのコンポーネントに分割する原理的分解法を提案する。
射影にまたがる不変部分空間を同定することにより、我々の手法は概念操作をより正確に制御できる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 07:53:44 GMT)
SCyTAG: Scalable Cyber-Twin for Threat-Assessment Based on Attack Graphs [20.5] SCyTAGは、攻撃シナリオの影響を評価するのに必要な最小限のサイバーツインを生成するマルチステップフレームワークである。
SCyTAGを実物と実物の両方の組織ネットワーク上で評価する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:04:29 GMT)
Nightjar: Dynamic Adaptive Speculative Decoding for Large Language Models Serving [20.4] Nightjarは適応的投機推論のための新しい学習ベースのアルゴリズムである。
Nightjarは最大14.8%のスループットと20.2%のレイテンシを実現している。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 00:57:55 GMT)
Generalized Regularized Evidential Deep Learning Models: Theory and Comprehensive Evaluation [20.2] 証拠深層学習モデルは、学習された証拠を用いてきめ細かい不確実性を定量化することができる。
我々は、一貫したエビデンス更新のための代替経路を提供するために、アクティベーション関数の一般ファミリーとそれに対応する顕在正則化器を開発する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 11:26:18 GMT)
Exploring the Vertical-Domain Reasoning Capabilities of Large Language Models [19.8] 本研究では,垂直領域会計推論の概念を導入し,評価基準を確立する。
本稿では, GLM-6B, GLM-130B, GLM-4, OpenAI GPT-4 などの代表モデルについて, 会計推論タスクのセットを用いて評価する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 02:39:34 GMT)
PTalker: Personalized Speech-Driven 3D Talking Head Animation via Style Disentanglement and Modality Alignment [19.3] PTalkerは、パーソナライズされた3Dトーキングヘッドアニメーションのための新しいフレームワークである。
音声と顔の動きシーケンスからのスタイルの切り離しを通じて、話し方を保存する。
オーディオとメッシュの3レベルアライメント機構によって、リップ同期の精度を向上させる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:14:14 GMT)
Learning When Not to Attend Globally [19.3] トークン毎に全注目と局所的スライディングウィンドウアテンションを切り替えるオール・オア・ヘア・アテンション(AHA)を提案する。
AHAは、完全な注意は大部分が冗長であり、効率的な推論はグローバルコンテキストへのオンデマンドアクセスのみを必要とすることを明らかにしている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 11:21:40 GMT)
Entanglement protection induced by mixed noise [19.2] 混合雑音は2原子空洞系における絡み合いを防ぎうることを示す。
原子空洞結合における高周波(HF)ノイズは、キャビティリークによるデコヒーレンスを抑制することができるため、絡み合い保護機構が明らかにされる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:59:47 GMT)
Quantum Noise Spectroscopy of Nanoscale Charge Defects in Silicon Carbide at Room Temperature [19.0] 室温での商用半導体における単電荷トンネル力学の最初の実時間ナノスケール観察を報告する。
我々は、MHz-GHzノイズを探索し、T1緩和分光法によりその起源を同定し、SiCの電荷欠陥の初めてのナノスケール電子常磁性共鳴(EPR)分光指紋を得る。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 08:40:12 GMT)
SCAFusion: A Multimodal 3D Detection Framework for Small Object Detection in Lunar Surface Exploration [18.9] 本稿では,月面ロボット探査に適したマルチモーダル3次元物体検出モデルであるSCAFusionを提案する。
パラメータの無視的増加により,本モデルは nuScenes 検証セット上で69.7% mAP と72.1% NDS を達成する。
アイザック・シム (Isaac Sim) で作られた模擬月面環境では、SCAFusion は 90.93% mAP に達し、ベースラインを 11.5% 上回っている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 07:08:03 GMT)
Scalpel-SAM: A Semi-Supervised Paradigm for Adapting SAM to Infrared Small Object Detection [18.8] 赤外線小物体検出は、アノテーションのコストが高いため、緊急に半教師付きパラダイムを必要とする。
SAMのような既存のメソッドは、ドメインギャップ、物理的プリエントをエンコードできないこと、そして固有のアーキテクチャの複雑さという重大な課題に直面している。
本研究では,(1)知識の蒸留と伝達のための2段階のパラダイムを提案する。(1)MoEアダプタと10%の完全教師付きデータを用いてSAMを専門教師(Scalpel-SAM)に蒸留し,(2)Scalpel-SAMを用いて疑似ラベルを生成し,軽量で効率的な下流モデルのトレーニングを行う。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:59:46 GMT)
Unleashing Foundation Vision Models: Adaptive Transfer for Diverse Data-Limited Scientific Domains [18.6] 本稿では,Cluster Attention Adapter (CLAdapter)を提案する。
CLAdapterは、大規模データから学んだリッチな表現を、さまざまなデータ制限されたダウンストリームタスクに洗練し、適応する。
CLAdapterは、様々なデータ制限された科学領域で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:32:59 GMT)
Structured Prompting and LLM Ensembling for Multimodal Conversational Aspect-based Sentiment Analysis [18.6] TheMCABSA Challengeでは,(1)複数話者対話から主観的,対象的,側面,意見,感情,理性を含む包括的感情のセクシュタプルを抽出し,(2)動的感情変化とその引き金となる感情のフリップを検出する。
本システムでは,Subtask-Iの平均スコアが47.38%,Subtask-IIで74.12%,リッチマルチモーダル感情分析におけるステップワイド改善とアンサンブル戦略の有効性が示された。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:14:16 GMT)
ParaMaP: Parallel Mapping and Collision-free Motion Planning for Reactive Robot Manipulation [17.3] 未知の環境でのロボット操作には、リアルタイムおよび衝突のないモーションプランニングが依然として困難である。
本研究では,Euclidean Distance Transform(EDT)に基づく環境表現をサンプリングベースモデル予測制御(SMPC)プランナと密に統合する並列マッピングと動作計画フレームワークを提案する。
提案手法の有効性は, 7-DoFロボットマニピュレータを用いた広範囲なシミュレーションと実世界の実験により検証した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 12:24:10 GMT)
SPECTRE: Spectral Pre-training Embeddings with Cylindrical Temporal Rotary Position Encoding for Fine-Grained sEMG-Based Movement Decoding [17.0] 非侵襲的表面筋電図(sEMG)からの微細な運動の復号は、信号非定常性と低信号-雑音比による補綴制御の課題である。
これらの制限を克服するために、ドメイン固有のSSLフレームワークであるSPECTREを紹介します。
SPECTREは動作復号化のための新しい最先端技術を確立し、教師付きベースラインと汎用SSLアプローチの両方を著しく上回っていることを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:55:06 GMT)
Event-based high temporal resolution measurement of shock wave motion field [16.9] 高分解能衝撃波動パラメータの高精度測定は、電界試験や損傷評価などの応用に不可欠である。
これらの課題に対処するために、複数のイベントカメラを用いて衝撃波の非対称性を推定する新しい枠組みを提案する。
実験により, 空間分解能と時間分解能の両方で衝撃波運動場を高精度に測定できることが実証された。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:37:18 GMT)
Self-Rewarded Multimodal Coherent Reasoning Across Diverse Visual Domains [16.4] マルチモーダルLSMは、流動的で信頼性の低い推論を生成する。
SR-MCRは軽量でラベルのないフレームワークであり、推論を整合させる。
SR-MCRは、幅広いビジュアルベンチマークで解答精度と推論コヒーレンスを改善する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 10:14:14 GMT)
Tyee: A Unified, Modular, and Fully-Integrated Configurable Toolkit for Intelligent Physiological Health Care [16.2] 我々は、インテリジェントな生理的医療のための統一的でモジュラーで完全に統合されたツールキットであるTyeeを紹介します。
Tyee氏は、(1)12種類の信号モダリティのための統一されたデータインターフェースと前処理パイプライン、(2)柔軟な統合とタスク間の迅速なプロトタイピングを可能にするモジュール型でスケーラブルなアーキテクチャ、(3)再現性とスケーラブルな実験を促進するエンドツーエンドのワークフロー構成という3つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:14:01 GMT)
Relational Mediators: LLM Chatbots as Boundary Objects in Psychotherapy [15.9] 施設の障壁の中で信頼を構築することの難しさ、負担クライアントがセラピストに辺境的なアイデンティティを教育すること、そして日々のセラピー全体にわたって真正な自己開示を維持することの難しさを識別する。
これらの課題に対処するには、基礎となる知識ギャップを積極的に仲介できるAIシステムが必要である、と我々は主張する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:35:52 GMT)
Building Software by Rolling the Dice: A Qualitative Study of Vibe Coding [15.1] ビブ・コーダ"は、主にコードを書くのではなく、プロンプトを通じてソフトウェアを構築する。
ライブ・ストリーミング・コーディング・セッション7本と意見ビデオ13本を含む20本のバイブ・コーディング・ビデオについて理論的研究を行った。
ビブコーダーの中にはAIにほぼ完全に依存する者もいれば、生成された出力を調べて適応する者もいる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 00:38:37 GMT)
Autoregressive Flow Matching for Motion Prediction [14.9] 自己回帰フローマッチング(ARFM)は逐次連続データの確率論的モデリングのための新しい手法である。
本研究では,人間とロボットの動作を予測する動作予測モデルの能力を評価するためのベンチマークを開発する。
我々のモデルは複雑な動作を予測することができ、予測された将来のトラック上での条件付きロボットの動作予測と人間の動作予測が下流タスク性能を大幅に改善できることを実証する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 19:35:45 GMT)
Clutter-Resistant Vision-Language-Action Models through Object-Centric and Geometry Grounding [14.3] 本稿では,行動推論から知覚的グラウンドを遠ざける枠組みであるOBEYED-VLAを提案する。
OBEYED-VLAは、タスク条件付き、オブジェクト中心、幾何学的認識の観察に入力を基礎付ける知覚モジュールを備えたビジョン・ランゲージ・アクションモデルを強化する。
現実世界のUR10eテーブルトップ設定では、OBEYED-VLAは強力なVLAベースラインよりもロバスト性を大幅に向上する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 08:31:25 GMT)
Collaborative Optimization of Multiclass Imbalanced Learning: Density-Aware and Region-Guided Boosting [14.1] 本研究では,不均衡学習のための協調最適化ブースティングモデルを提案する。
20の公開不均衡データセットの実験では、提案されたモデルが8つの最先端ベースラインを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:50:20 GMT)
Isolating Compiler Faults via Multiple Pairs of Adversarial Compilation Configurations [13.8] MultiConfは、複数の対の逆コンパイル構成を構築することで、コンパイラの障害を自動的に分離する新しいアプローチである。
実世界のGCCコンパイラ60のバグのベンチマークでMultiConfを評価した。
特に、MultiConfはTop-1ファイルレベルで60のバグのうち27をローカライズし、2つの最先端アプローチよりも35.0%と28.6%改善した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:40:35 GMT)
JParc: Joint cortical surface parcellation with registration [13.4] 皮質表面のパーセレーションは基礎神経科学研究および臨床応用における基本的な課題である。
自動パーセレーションのためのモデルベースおよび学習ベースのアプローチにより、手動ラベリングの必要性が軽減される。
我々は,既存の最先端のパーセレーション手法よりも優れた,関節皮質登録とパーセレーションの枠組みであるJParcを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:04:51 GMT)
AnalogSAGE: Self-evolving Analog Design Multi-Agents with Stratified Memory and Grounded Experience [13.4] 我々は,4つの階層化メモリ層を通して3段階のエージェント探索をコーディネートするオープンソースのマルチエージェントフレームワークであるAnalogSAGEを提案する。
本ベンチマークでは,10の仕様駆動型動作増幅器設計問題に対して,定量的およびクロスタスク比較が可能となる。
AnalogSAGEは10$times$総合パスレート、48$times$ Pass@1、および4$times$パラメータ検索スペースを既存のフレームワークと比較して削減する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 02:06:05 GMT)
LLM Agents as VC investors: Predicting Startup Success via RolePlay-Based Collective Simulation [13.2] SimVC-CASは、ベンチャーキャピタルの意思決定をマルチエージェントインタラクションプロセスとしてシミュレートする、新しい総合エージェントシステムである。
我々は,SimVC-CASが解釈可能な多パースペクティブ推論を提供しながら,予測精度を著しく向上することを示した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:34:44 GMT)
Towards Reliable Evaluation of Adversarial Robustness for Spiking Neural Networks [12.9] スパイキングニューラルネットワーク(SNN)は、スパイクベースの活性化を利用して、脳のエネルギー効率の高い情報処理を模倣する。
より信頼性の高いSNN対逆ロバスト性評価フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 08:43:06 GMT)
Enhanced separability criteria based on symmetric measurements [11.9] 局所対称性測定に基づく分離性基準を提案する。
両部系から任意の多部系への分離性基準を一般化する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 08:05:59 GMT)
Tree Meets Transformer: A Hybrid Architecture for Scalable Power Allocation in Cell-Free Networks [11.5] 本稿では,ユーザ毎の電力割り当てをスケーラブルにするためのハイブリッドなツリートランスフォーマーアーキテクチャを提案する。
我々のモデルは、バイナリツリーを介してユーザ機能をグローバルなルート表現に圧縮し、このルートのみにTransformerエンコーダを適用し、共有デコーダを介してユーザごとのアップリンクとダウンリンクのパワーをデコードする。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:23:18 GMT)
Multi-AI Agent Framework Reveals the "Oxide Gatekeeper" in Aluminum Nanoparticle Oxidation [10.4] アルミニウムナノ粒子(ANP)は、最もエネルギー密度の高い固体燃料の1つであるが、その原子機構は、気化粒子から爆発物への遷移である。
ここでは、自己監査型AIエージェントが機械学習の可能性の進化を検証する「人間のループ」クローズドループフレームワークを採用する。
人間の意思決定のために隠されたモデルアーティファクトを視覚化する科学的センチネルとして機能することにより、この協調サイクルは量子力学的精度を保証する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:21:21 GMT)
A Real-Time System to Populate FRA Form 57 from News [9.9] 本稿では,ハイウェイ・レール・グレード・クロス・インシデントデータ(Form 57)をニュースからリアルタイムに収集するデモシステムを提案する。
形態は視覚的に不規則であり、意味的に密集しており、ニュースはうるさい。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:22:08 GMT)
CoAgent: Collaborative Planning and Consistency Agent for Coherent Video Generation [9.9] CoAgentは、コヒーレントなビデオ生成のためのフレームワークで、プラン合成の検証パイプラインとしてプロセスを定式化している。
Storyboard Plannerは、入力を明示的な実体、空間的関係、時間的手がかりで構造化されたショットレベルのプランに分解する。
Global Context Managerは、エンティティレベルのメモリを維持して、ショット間の外観とアイデンティティの整合性を維持する。
ペーシング対応エディタは、所望の物語の流れに合わせて時間リズムと遷移を洗練する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:38:34 GMT)
Differentiable Inverse Modeling with Physics-Constrained Latent Diffusion for Heterogeneous Subsurface Parameter Fields [9.4] 高次元空間分布係数を含むPDE制約逆問題に対する潜在拡散型微分可能逆変換法(LD-DIM)を提案する。
LD-DIMは、低次元非線形多様体における未知の不均一パラメータ場を再構成するために、終端から終端までの微分可能な数値解法と事前訓練された潜在拡散を結合する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 01:01:19 GMT)
MEGA-PCC: A Mamba-based Efficient Approach for Joint Geometry and Attribute Point Cloud Compression [9.4] MEGA-PCCは、完全エンドツーエンドの学習ベースのフレームワークで、ジョイント圧縮のための2つの特別なモデルを備えている。
従来のベースラインと学習ベースのベースラインの両方と比較して、速度歪み性能と実行効率が優れている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:43:36 GMT)
TimePerceiver: An Encoder-Decoder Framework for Generalized Time-Series Forecasting [8.3] 我々は,統一型エンコーダデコーダ予測フレームワークであるTimePerceiverを提案する。
まず,予測タスクを多種多様な時間的予測目標を含むように一般化する。
符号化には、すべての入力セグメントと対話できる潜在ボトルネック表現のセットを導入する。
復号には、対象のタイムスタンプに対応する学習可能なクエリを活用して、関連情報を効率的に検索する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 10:34:22 GMT)
Enhancing Noise Resilience in Face Clustering via Sparse Differential Transformer [7.9] 隣接ノードの純度を高める予測駆動型Top-K Jaccard類似係数を提案する。
隣人の最適な数(Top-K)を正確に予測することは依然として困難であり、最適なクラスタリング結果をもたらす。
我々は,Top-K付近の中央ノードと隣接ノードの関係を検証し,類似度推定の信頼性を高めるトランスフォーマーベースの予測モデルを開発した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:39:43 GMT)
On The Computational Complexity of Minimum Aerial Photographs for Planar Region Coverage [7.7] 本研究は、正方形と円を使って単純な平面多角形を被覆する計算複雑性について検討する。
このアルゴリズムは2.828$-optimal approximationアルゴリズムを開発し、これらの問題を計算によって近似することができることを示した。
この研究の直感は、航空写真だけでなく、殺虫剤の散布や戦略的センサー配置といった幅広い用途にも及んでいる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:12:30 GMT)
LECalib: Line-Based Event Camera Calibration [7.4] 現在のイベントカメラキャリブレーション手法は、点滅パターンの使用、強度画像の再構成、イベントから抽出した特徴の活用を含む。
人為環境における一般的な被写体の幾何学線を利用したラインベースイベントカメラキャリブレーションフレームワークを提案する。
提案手法は,イベントストリームから直接線を検知し,イベントラインキャリブレーションモデルを用いてカメラパラメータの初期推定を生成する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 02:30:51 GMT)
ManchuTTS: Towards High-Quality Manchu Speech Synthesis via Flow Matching and Hierarchical Text Representation [7.4] 本稿では,満洲の言語的特徴に合わせた新しいアプローチである満州TTSを提案する。
ManchuTTSは6.24時間の注釈付きコーパスから派生した5.2時間のトレーニングサブセットを使用して4.52のMOSを得る。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:21:35 GMT)
Modeling Noise in Quantum Computing of Scalar Convection [7.3] 一次元対流の量子シミュレーションにおけるゲートノイズの影響について検討する。
我々は、スペクトル減衰を予測するために、計算基底状態間のハミング距離に基づく理論遷移行列を導出する。
データ駆動スパース回帰を用いて、実効偏微分方程式における量子ノイズは、主に人工拡散や非線形ソース項として現れることを示した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 11:13:43 GMT)
Beyond Centralization: Provable Communication Efficient Decentralized Multi-Task Learning [7.1] 特徴が低ランク構造を共有する分散マルチタスク表現学習について検討する。
分散環境では、タスクデータは複数のノードに分散され、ノード間の情報交換は通信ネットワークによって制限される。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:44:43 GMT)
Clinically Calibrated Machine Learning Benchmarks for Large-Scale Multi-Disorder EEG Classification [6.9] 本研究は,脳波による脳波自動分類を臨床関連神経疾患11カテゴリーに分けて検討した。
マシンラーニングモデルは、厳格なクラス不均衡の下でトレーニングされ、診断感度の優先順位を決定するための決定しきい値が明示的に調整される。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:11:17 GMT)
Causality-Inspired Safe Residual Correction for Multivariate Time Series [6.9] 我々はCRC(Causality-inspired Safe Residual Correction)を提案する。
因果性にインスパイアされたエンコーダを用いて、自己および相互変数のダイナミクスを分離することで方向認識構造を公開する。
実験の結果、CRCは精度を継続的に改善する一方、深部アブレーションの研究は、そのコアセーフティメカニズムが例外的に高い非劣化速度(NDR)を保証していることを確認した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 01:34:14 GMT)
PhononBench:A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation [6.1] 我々は,AI生成結晶の動的安定性に関する最初の大規模ベンチマークであるPhononBenchを紹介する。
フォノンベンチは、108,843個の結晶構造に対する効率的な大規模フォノン計算と動的安定性解析を可能にする。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 00:48:56 GMT)
Constituency Structure over Eojeol in Korean Treebanks [6.0] 韓国語の単語は形態学的に複雑であり、形態素を構成端末として扱い、単語の内部形態とフレーズレベルの構文構造を融合させる。
本稿では,非構成層に符号化された音声情報の形態的セグメンテーションと微細なきめ細かな部分を有するオエオール系選挙区表現について論じる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:12:26 GMT)
Rethinking the Capability of Fine-Tuned Language Models for Automated Vulnerability Repair [5.8] 微調整された言語モデルを利用する学習ベースの自動脆弱性修正(AVR)技術は、脆弱性パッチの生成を約束している。
私たちの経験的研究は、最先端のモデルはトレーニングセットに過度に適合し、相互に排他的でないトレーニング、検証、テストセットを用いて評価されることを明らかにします。
学習ベースに適したテストベースベンチマークであるL-AVRBenchを導入し、マッチングベースのメトリクスの限界を克服し、モデルの真の修復能力を検証した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:12:43 GMT)
SagaScale: A Realistic, Scalable, and High-Quality Long-Context Benchmark Built from Full-Length Novels [5.8] SagaScaleは、フル長の小説から作られた、現実的でスケーラブルで高品質な長文のベンチマークである。
このベンチマークは、外部リソース(例えばウィキペディアページ)を使用して質問と回答のペアをキュレートする自動データ収集パイプラインを使用して構築されている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 12:19:55 GMT)
NOWA: Null-space Optical Watermark for Invisible Capture Fingerprinting and Tamper Localization [4.9] 画像形成中に物理認証手段を組み込んだハイブリッド光デジタルフレームワークを提案する。
カメラ開口部の位相マスクは、撮像オペレーターのNull空間に位置するNull-space Optical Watermark(NOWA)を生成する。
Null-Space Network (NSN)は、高品質な保護された画像を提供する計測一貫性のある再構成を行う。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:57:20 GMT)
Bright 4B: Scaling Hyperspherical Learning for Segmentation in 3D Brightfield Microscopy [4.9] Bright-4Bは、単位超球面上で学習し、3次元の光場体積から直接細胞内構造を分割する。
プラグアンドプレイ異方性パッチは、さらに共焦点点スプレッドと軸スライニングを尊重し、幾何学的に忠実な3Dトークン化を可能にする。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 01:10:47 GMT)
Memento-II: Learning by Stateful Reflective Memory [4.7] 大規模言語モデルエージェントにおける連続的および経験的学習のための理論的枠組みを提案する。
このフレームワークはリフレクションを、バックプロパゲーションやモデルファインチューニングを使わずに、インタラクションを通じてエージェントを適応させるキーメカニズムとして特定する。
このプロセスは、拡張された状態メモリ表現に対して、等価なマルコフ決定プロセスを誘導することを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 22:15:03 GMT)
Predicting LLM Correctness in Prosthodontics Using Metadata and Hallucination Signals [4.7] 大規模言語モデル (LLM) は、医療や医学教育などの高度な領域で採用されている。
本研究では, 汎用モデル (GPT-4o) と推論中心モデル (OSS-120B) を多症例補綴学試験で解析し, 正当性予測の可能性を検討した。
以上の結果から, このメタデータベースのアプローチは, 解答の正解を前提として, 最大で+7.14%の精度向上と83.12%の精度向上を達成できることが示唆された。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 07:51:50 GMT)
Asymmetric Friction in Geometric Locomotion [4.6] そのような運動性マップのキークラスは、システムの個々の身体部分に作用する(おそらく異方性のある)線形ドラッグから生じる。
我々は、ドラッグが異方性だけでなく非対称であるようなより一般的なシステムのクラスを考える。
システム運動性マップを構築するためのサブリーマン的アプローチが、自然にフィンスラー的アプローチに拡張されることを実証する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:02:34 GMT)
ReFRM3D: A Radiomics-enhanced Fused Residual Multiparametric 3D Network with Multi-Scale Feature Fusion for Glioma Characterization [4.5] グリオーマは、高い死亡率と複雑な診断過程を特徴とする最も攻撃的ながんの一つである。
グリオーマの診断と分類に関する既存の研究は、画像データの高可変性などの問題をしばしば記述している。
腫瘍のセグメンテーションと分類効率を向上させるために, マルチパラメトリックMRIデータを用いた新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 12:12:53 GMT)
SuperiorGAT: Graph Attention Networks for Sparse LiDAR Point Cloud Reconstruction in Autonomous Systems [4.4] SuperiorGATはグラフベースのフレームワークで、疎いLiDAR点雲の行方不明な標高情報を再構築するように設計されている。
Person、Road、Campus、Cityといった様々なKITTI環境における実験は、SuperiorGATが一貫して低い再構成誤差を達成し、幾何的整合性を向上させることを実証している。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 02:25:00 GMT)
FluenceFormer: Transformer-Driven Multi-Beam Fluence Map Regression for Radiotherapy Planning [4.1] textbfFluenceFormerは、直接的かつ幾何学的に認識されるフレンス回帰のための、バックボーンに依存しないトランスフォーマーフレームワークである。
Swin UNETRを使用したFluenceFormerは、評価されたモデルの中で最強のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 01:12:15 GMT)
Variational quantum eigensolver for chemical molecules [4.0] 本研究では,He-H+およびH2O分子の基底状態と基底状態エネルギーの計算について検討する。
我々は、量子コンピュータシミュレータとIBM量子デバイスの両方に実装された変分量子固有解器(VQE)を用いる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 12:17:41 GMT)
SAM 3D for 3D Object Reconstruction from Remote Sensing Images [3.9] 本稿では,汎用画像から3D基礎モデルであるSAM 3Dを初めて体系的に評価する。
実験により, SAM 3DはTRELLISに比べて, よりコヒーレントな屋根形状とシャープな境界を生じることが示された。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 03:47:39 GMT)
Mitigating Social Desirability Bias in Random Silicon Sampling [3.7] 大規模言語モデル (LLMs) において, 最小, 心理的に基礎を置き, SDB (Social Desirability Bias) を緩和できるかどうかを検討する。
我々は,米国選挙研究会(ANES)のデータを用いて,2つのモデルファミリーの3つのLDMについて調査を行った。
以上の結果から,社会に受け入れられる回答の分布集中を減らし,アライメントを効果的に改善することが示唆された。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 23:21:32 GMT)
SCPainter: A Unified Framework for Realistic 3D Asset Insertion and Novel View Synthesis [3.6] 3Dアセット挿入と新しいビュー合成(NVS)は、自律運転シミュレーションの鍵となる要素であり、トレーニングデータの多様性を高める。
本稿では3次元Splat(GS)カーアセット表現と3次元シーンポイントクラウドを拡散ベース生成と統合した統合フレームワークSCPainterを提案する。
3D GSアセットと3D シーンポイントクラウドは、新しいビューに投影され、これらのプロジェクションを使用して、拡散モデルを用いて高品質な画像を生成する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 21:28:48 GMT)
Quasi-harmonic spectra from branched Hamiltonians [3.2] 修正式 Emden 方程式 $ddotx + kxdotx + 2 x + frack29x3 = 0$ のスペクトルを評価するために正準量子化を再検討する。
小さな$k に対して、得られたエネルギースペクトルはもはや完全調和ではなく、ほぼ同値であることを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 07:53:11 GMT)
INTERACT-CMIL: Multi-Task Shared Learning and Inter-Task Consistency for Conjunctival Melanocytic Intraepithelial Lesion Grading [3.0] 本研究は,5つの組織軸,WHO4,WHO5,水平展開,垂直展開,サイトメガロジカルアトピーを共同で予測する多面的深層学習フレームワークであるInterACT-CMILを紹介する。
3つの大学病院から486名の専門医による結膜生検を行った。
CNNとファンデーションモデル(FM)ベースラインに対して一貫した改善が達成され、相対マクロF1は55.1%(WHO4)と25.0%(垂直展開)まで上昇する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:37:34 GMT)
Investigating Deep Learning Models for Ejection Fraction Estimation from Echocardiography Videos [2.9] 左室放出分画(LVEF)は心機能の指標である。
ディープラーニングアプローチは、経験豊富な人間の専門家に匹敵するパフォーマンスを達成する可能性を提供します。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:11:17 GMT)
Experimental Joint Estimation of Phase and Phase Diffusion via Deterministic Bell Measurements [2.8] 本研究は, 2量子系における決定論的ベル測定を用いて, 接合相と位相拡散推定を実験的に実証する。
線形光学ネットワークを用いてパラメータエンコーディングと決定論的ベル測定の両方を実装し、任意の分離可能な測定戦略と比較して推定精度を向上させる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 11:12:08 GMT)
Nonadiabatic Self-Healing of Trotter Errors in Digitized Counterdiabatic Dynamics [2.6] デジタル化された量子力学におけるトロッター誤差は、積公式を持つ非可換なハミルトン項の下で時間順進化を近似することによって生じる。
断熱的な体制では、そのような誤りは長年の自己修復を示すことが知られている。
有限速ランプによる非断熱誤差が補償されると, 自己修復は有限進化時間で持続することを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:16:29 GMT)
Toward Real-World IoT Security: Concept Drift-Resilient IoT Botnet Detection via Latent Space Representation Learning and Alignment [2.6] 本稿では,適応型IoT脅威検出のためのスケーラブルなフレームワークを提案する。
アライメントモデルは、入力したトラフィックを、分類の前に学習された歴史的潜在空間にマッピングする。
攻撃サンプル間のインスタンス間関係をキャプチャするために、低次元の潜在表現をグラフ構造化形式に変換する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:13:19 GMT)
DICE: Discrete Interpretable Comparative Evaluation with Probabilistic Scoring for Retrieval-Augmented Generation [2.2] 我々は、RAG評価における説明可能性と堅牢性を向上させる2段階のエビデンス結合フレームワークであるDICEを紹介する。
DICEは、深い分析的推論と確率論的$A, B, Tie$スコアを組み合わせることで、透明で信頼性に配慮した判断を生成する。
本研究は,信頼性の高いRAGシステム評価のための責任,説明性,効率的なパラダイムとしてDICEを確立した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:02:00 GMT)
Canonical correlation regression with noisy data [1.9] スペクトル正則化を用いた2段最小二乗に基づく推定器群の解析を行う。
理論的貢献として,推定誤差の上限と下限を導出し,ノイズデータを用いた手法の最適性を示す。
実践的な貢献として、異なる体制で使用するスペクトル正則化のタイプについてガイダンスを提供する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 20:08:15 GMT)
Verifiable Dropout: Turning Randomness into a Verifiable Claim [1.7] ゼロ知識証明に基づくプライバシー保護機構であるVerifiable Dropoutを導入する。
提案手法は, ドロップアウトマスクを決定論的, 暗号的にシードに結合し, ドロップアウト動作の正しい実行を証明している。
この設計は、ユーザーがトレーニング手順の整合性を監査し、ランダムさがバイアスでもチェリーピックでもないことを保証します。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:14:35 GMT)
Quantum-Circuit Framework for Two-Stage Stochastic Programming via QAOA Integrated with a Quantum Generative Neural Network [1.7] 2段階プログラミングは、しばしば不確実性をシナリオに識別するが、シナリオはシナリオ数において少なくとも線形にrecourse予測評価尺度を作成する。
本稿では,事前学習した逆数ネットワークがシナリオ分布を符号化する量子回路統合ワークフローを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 02:03:33 GMT)
Operational entanglement of collective quantum modes at room temperature [1.6] 集合量子モードの絡み合いは、微視的な熱平衡ではなく、開系チャネルの縮小によって制御されることを示す。
本研究は,群集モードのダイナミックス,ノイズ注入,距離,およびマクロエンタングルメントの運用証明を結合する,最小限のプラットフォームに依存しないフレームワークを構築した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:27:46 GMT)
Gold Price Prediction Using Long Short-Term Memory and Multi-Layer Perceptron with Gray Wolf Optimizer [1.4] 生市場取引のための貿易戦略が開発され、提案されたモデルは3ヶ月で171%のリターンを得た。
提案したLSTM-MLPモデルでは,平均絶対誤差(MAE)が0.21ドル,翌月価格が22.23ドルであった。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:32:31 GMT)
Cryptocurrency Price Prediction Using Parallel Gated Recurrent Units [1.4] 本稿では,暗号通貨価格予測のための新しいディープモデルであるemphParallel Gated Recurrent Units(PGRU)を提案する。
提案モデルでは,平均絶対パーセンテージ誤差(MAPE)が3.243%,ウィンドウ長が2.641%,ウィンドウ長が20,15。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:04:21 GMT)
Computing Pure-Strategy Nash Equilibria in a Two-Party Policy Competition: Existence and Algorithmic Approaches [1.3] 我々は、二者間政策競争を二者間非協力ゲームとして定式化する。
政策の勝利確率は、全有権者にまたがって単調に増大する。
プレイヤーのペイオフは、サポーターが期待するユーティリティとして定義される。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 10:44:32 GMT)
CritiFusion: Semantic Critique and Spectral Alignment for Faithful Text-to-Image Generation [1.1] CritiFusionは、マルチモーダルなセマンティックな批判機構と周波数領域の改良を統合し、テキスト間の一貫性と詳細性を改善する。
CritiCoreモジュールは、視覚言語モデルと複数の大きな言語モデルを活用して、プロンプトコンテキストを強化する。
CritiFusionは、人間の嗜好スコアと美的評価を継続的に向上させる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 19:08:18 GMT)
Syntactic Framing Fragility: An Audit of Robustness in LLM Ethical Decisions [1.1] 大規模言語モデル(LLM)は、逐次的な意思決定設定に徐々にデプロイされている。
LLMが論理的に等価だが構文的に異なるプロンプトに対して一貫した倫理的判断を維持できるかどうかを考察する。
SFF(Syntactic Framing Fragility)は、純粋に構文効果を分離するロバストネス評価フレームワークである。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:09:34 GMT)
Lessons from Neuroscience for AI: How integrating Actions, Compositional Structure and Episodic Memory could enable Safe, Interpretable and Human-Like AI [0.8] ファンデーションモデルは、複数の抽象化スケールのアクションと、合成生成アーキテクチャとエピソディックメモリを統合するべきだ、と我々は主張する。
ファンデーションモデルにこれらの欠落したコンポーネントを追加することで、現在の障害に対処する方法について説明する。
私たちは、歴史的に実りある脳科学とAIのアイデアの交換が、安全で解釈可能な人間中心のAIへの道を開くのに役立ちます。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 11:54:54 GMT)
Evaluating GRPO and DPO for Faithful Chain-of-Thought Reasoning in LLMs [0.7] 大型言語モデル(LLM)の問題解決能力向上のための強力な手法として、チェーン・オブ・シント推論(CoT)が登場している。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:07:00 GMT)
SonoVision: A Computer Vision Approach for Helping Visually Challenged Individuals Locate Objects with the Help of Sound Cues [0.6] SonoVision(ソノビジョン)は、聴覚障害者がイヤホンやヘッドホンを通じて、日常的な物体を見つけるのを助けるスマートフォンアプリケーションだ。
つまり、あるオブジェクトがユーザの左右の側にある場合、アプリは耳やヘッドホンを通してユーザーの耳に正弦波の音を出す。
正面に直立する物体を示すために、左右のイヤホンを同時に走行させる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 03:32:26 GMT)
Evolutionary Algorithms for Computing Nash Equilibria in Dynamic Games [0.5] 古典的なナッシュ平衡の計算法、特に線形二次的な設定では、強い構造的仮定に依存している。
比較的小さなゲームであっても、そのような手法が真のグローバルなナッシュ均衡に到達できないことを示す。
線形あるいは非線形のダイナミックスと任意の目的関数を持つ一般動的ゲームに対して、2つの集団ベースの進化的アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:00:27 GMT)
Democratizing GraphRAG: Linear, CPU-Only Graph Retrieval for Multi-Hop QA [0.5] GraphRAGシステムはモデリング構造によるマルチホップ検索を改善する。
多くのアプローチは、高価なLLMベースのグラフ構築とGPU重み推論に依存している。
我々は、LLMグラフ構築を軽量なNER駆動の共起グラフに置き換える、CPUのみ、線形時間、トークンフリーなGraphRAGパイプラインであるSPRIGを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:25:06 GMT)
AMBIT: Augmenting Mobility Baselines with Interpretable Trees [0.5] 本稿では,解釈可能な木モデルで物理運動量ベースラインを向上するフレームワークであるABBITを開発する。
まず、1時間に1回のNYCタクシーODデータセット上で、古典的な空間的相互作用モデルの包括的な監査から始める。
次に, 勾配ブースト木とSHAP解析を用いて物理ベースライン上に残差学習器を構築し, (i) 物理接地残差が, 解釈可能な構造を維持しながら強い木に基づく予測器の精度に近づき, (ii) POI アンカレッド残差は一貫して競争力を持ち, 空間一般化において最も頑健であることを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:59:16 GMT)
Mesquite MoCap: Democratizing Real-Time Motion Capture with Affordable, Bodyworn IoT Sensors and WebXR SLAM [0.5] Mesquiteはオープンソースの低コストな慣性モーションキャプチャシステムである。
15のIMUセンサーノードと、位置追跡用のヒップウーンのAndroidスマートフォンを組み合わせたものだ。
我々は,オープンソースライセンス(GNU)の下でハードウェア設計,ファームウェア,ソフトウェアをリリースする。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 19:39:51 GMT)
GHaLIB: A Multilingual Framework for Hope Speech Detection in Low-Resource Languages [0.5] 本稿では,Urduに着目した希望音声検出のための多言語フレームワークを提案する。
我々は,XLM-RoBERTa,mBERT,EuroBERT,UrduBERTなどの事前学習型トランスフォーマモデルを用いて,単純な前処理と列車分類器を適用して結果を改善する。
PolyHope-M 2025ベンチマークの評価は強い性能を示し、Urduのバイナリ分類では95.2%、Urduのマルチクラス分類では65.2%、スペイン語、ドイツ語、英語では同様の結果が得られた。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 21:23:17 GMT)
The Bayesian Geometry of Transformer Attention [0.5] 我々は,真の後部が閉じた形で認識され,記憶化が不可能な制御環境を構築する。
小さな変圧器はmbox$10-3$--10-4$ビットの精度でベイズの後部を再現するが、容量整合幾何は桁違いに失敗する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:28:58 GMT)
Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds [0.5] 本研究では,トランスフォーマーアテンションヘッドにおいて,クロスエントロピートレーニングがアテンションスコアとバリューベクターをいかに再帰させるかを示す。
私たちの中核的な成果は、注目スコアに対する強調に基づくルーティング法です。
この結合された特殊化は、2時間規模のEMプロシージャのように振る舞うことを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:31:44 GMT)
Geometric Scaling of Bayesian Inference in LLMs [0.5] 近年の研究では、制御された「風洞」設定で訓練された小さな変圧器がベイズ推定を正確に実装できることが示されている。
この幾何学的シグネチャが生産段階の言語モデルに持続するかどうかを検討する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:29:55 GMT)
Predictive Modeling of Power Outages during Extreme Events: Integrating Weather and Socio-Economic Factors [0.5] 本稿では,極端な事象による停電を予測するための新しい学習基盤を提案する。
低確率、高頻度の停止シナリオをターゲットとし、公開データソースから派生した包括的な機能セットを活用する。
4つの機械学習モデル(Random Forest (RF), Support Vector Machine (SVM), Adaptive Boosting (AdaBoost), Long Short-Term Memory (LSTM))を評価した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 20:30:07 GMT)
HiFi-RAG: Hierarchical Content Filtering and Two-Pass Generation for Open-Domain RAG [0.3] HiFi-RAGは、MMU-RAGent NeurIPS 2025コンペティションのテキストからテキストへの静的評価において勝利したクローズドソースシステムである。
我々は、クエリの定式化、階層的コンテンツフィルタリング、引用属性にGemini 2.5 Flashの速度とコスト効率を活用し、最終回答生成のためにGemini 2.5 Proの推論能力を保っている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 02:37:40 GMT)
Hallucination Detection and Evaluation of Large Language Model [0.3] LLM(Large Language Models)における幻覚は、誤解を招くか、検証不能なコンテンツを生成するという大きな課題を引き起こす。
KnowHaluのような既存の評価手法では、マルチステージ検証を採用しているが、高い計算コストに悩まされている。
これを解決するために,Hughes Hallucination Evaluation Model (HHEM) を統合した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 00:17:03 GMT)
On Admissible Rank-based Input Normalization Operators [0.2] ランクベースの入力正規化は、スケールへの堅牢性、モノトーン変換、バッチ・ツー・バッチのばらつきによって評価される。
微分可能なソートとランキング演算子が構造条件を根本的に満たさないことを示す。
ランクベース入力正規化に必要な最小不変性と安定性特性を定式化する3つの公理を提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 13:28:55 GMT)
Data-Driven Analysis of Crash Patterns in SAE Level 2 and Level 4 Automated Vehicles Using K-means Clustering and Association Rule Mining [0.2] 自動走行車(AV)は、人間の運転ミスを低減または排除し、交通安全を高め、持続可能な移動性をサポートする。
近年、衝突データにより、AVの挙動が予測される安全結果から逸脱し、混在する交通環境における技術の安全性と運用上の信頼性への懸念が高まっている。
本研究は、米国高速道路交通安全局(NHTSA)による2500以上のAV事故記録を分析し、SAEレベル2と4をカバーし、基礎となるクラッシュのダイナミクスを明らかにする。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 13:30:07 GMT)
Asymmetry effects in homodyne and heterodyne measurements: Positive operator-valued measures and asymptotic security of Gaussian continuous variable quantum key distribution [0.1] ビームスプリッタの不均衡と光検出器の量子効率の変動から生じる非対称性効果について検討した。
二重ホモダイン検出では、ノイズのない測定は一般的にプロジェクターから圧縮状態に表現されるべきであることが判明した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 13:36:34 GMT)
When RSA Fails: Exploiting Prime Selection Vulnerabilities in Public Key Cryptography [0.0] 本稿では鍵生成時に不適切な素数選択から生じるRSA暗号システムの脆弱性について検討する。
2つの主要な攻撃ベクトルについて検討する:フェルマーの因数分解法は、素数に近すぎる素数で生成されたRSA鍵と、共通素数を共有する鍵を利用する最大共通因子(GCD)攻撃である。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 22:58:35 GMT)
Variational quantum algorithm for solving Helmholtz problems with high order finite elements [0.0] ヘルムホルツ問題を有限要素で離散化すると、その効率的な解が古典計算の大きな課題である線形系が得られる。
まず、正規メッシュに対して、ヘルムホルツ問題の高階有限要素離散化から生じる演算子$A$と$Adagger A$のブロック符号化を設計できることを示す。
このアルゴリズムをディリクレとノイマンの境界条件を持つ1次元ヘルムホルツ問題に適用する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:34:43 GMT)
Urban Food Self-Production in the Perspective of Social Learning Theory: Empowering Self-Sustainability [0.0] モノグラフは、持続可能な食品生産と消費のための革新的な社会技術ソリューションを開発するプロジェクト研究の結果を提示する。
このユニークなプロジェクトの背後にあるアイデアは、住民が食用植物を栽培する、選択されたフラットの廊下に20のハイドロポニックキャビネットを設置することであった。
この研究は、ポーランドのワルシャワとポーランドのワルシャワの住民コミュニティから42人の参加者を集めた。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 13:45:03 GMT)
Uncertainty-Aware Flow Field Reconstruction Using SVGP Kolmogorov-Arnold Networks [0.0] スパース変分ガウス過程を用いた不確実性を考慮したフロー再構成のための機械学習フレームワークを提案する。
パルス衝突噴流からの合成データを用いて,0.5%から10%のPIVサンプリング速度での性能を評価する。
SVGP-KAN法は,確立された手法に匹敵する再現精度を実現するとともに,精度の高い不確実性推定も提供する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 01:16:13 GMT)
Topology-Preserving Scalar Field Optimization for Boundary-Conforming Spiral Toolpaths on Multiply Connected Freeform Surfaces [0.0] 自動車および航空宇宙製造における部品の高品質かつ効率的な加工には, 複数接続された自由形表面上でのボールエンド加工経路の計画が重要である。
アイソ曲線の分岐や終了を引き起こすゼロ勾配特異点を強固に強制し、多重連結曲面上でのツールパス連続性を阻害する効率的な戦略を提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 07:05:51 GMT)
Topic Segmentation Using Generative Language Models [0.0] 生成型Large Language Models (LLMs) を用いたトピックセグメンテーションは, いまだに未検討である。
従来の手法では文間の意味的類似性を使用していたが、そのようなモデルは LLM に見られる長い範囲の依存や膨大な知識を欠いている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:58:35 GMT)
The Wisdom of Deliberating AI Crowds: Does Deliberation Improve LLM-Based Forecasting? [0.0] 本研究は,LLMが相互に予測をレビューできるようになれば,大規模言語モデルの精度が向上するかどうかを考察する。
Metaculus Q2 2025 AI Forecasting Tournamentから202の解決されたバイナリ質問を使用して、精度を4つのシナリオで評価した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:45:21 GMT)
Spin Response of a Magnetic Monopole and Quantum Hall Response in Topological Lattice Models through Local Invariants and Light [0.0] 我々は、z方向に沿って追加のソースフィールドを適用する際に、モノポールに対して効果的な磁気モーメントを導入する。
実空間におけるハニカム・ハルダンモデルのような二次元トポロジカル格子モデルとの関係を示す。
この理論を開発し、ディラック点から導入された運動量空間における局所不変量の間の数値解析を行う。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:54:09 GMT)
SLO-Conditioned Action Routing for Retrieval-Augmented Generation: Objective Ablation and Failure Modes [0.0] この作業では、クエリ毎の制御を、検索深さと生成モード(ガードされている対auto)を選択する、あるいは拒否する、小さな個別アクションとしてモデル化する。
オフラインログデータセットは、それぞれのアクションと記録精度、トークンコスト、幻覚/拒絶指標、SLO重み付き報酬を実行することにより、SQuAD 2.0から構築される。
2つのシンプルな政策学習目標が評価され、国家ごとの最良の行動の教師付き分類と報酬重み付き変種が評価される。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:37:53 GMT)
Quantum Generative Models for Computational Fluid Dynamics: A First Exploration of Latent Space Learning in Lattice Boltzmann Simulations [0.0] 本稿では,計算流体力学(CFD)データの潜在空間表現を学習するための量子生成モデルの最初の応用について述べる。
中心的な貢献は、この物理学に由来する潜在分布をモデル化するための量子的および古典的生成的アプローチの比較分析である。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:21:09 GMT)
Pose-Guided Residual Refinement for Interpretable Text-to-Motion Generation and Editing [0.0] 本稿では、残差ベクトル量子化(RVQ)によって学習された残差符号で解釈可能なポーズコードを拡張するハイブリッド表現であるPGR$2$Mを導入する。
ベーストランスフォーマーはテキストからポーズコードを自動的に予測し、洗練されたトランスフォーマーはテキスト、ポーズコード、量子化ステージで条件付けられた残留コードを予測する。
HumanML3DとKIT-MLの実験では、PGR$2$Mは、CoMoと比べて生成と編集の両方においてフレシェ距離と再構成の指標を改善する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 04:45:31 GMT)
Multimodal Diffeomorphic Registration with Neural ODEs and Structural Descriptors [0.0] ニューラル正規微分方程式を用いた多モード微分型登録法(ニューラルモード)
非剛性登録アルゴリズムは、その精度、変形モデルの計算複雑性、および適切な正規化の間のトレードオフを示す。
本稿では,トレーニングにおいて高いスキャン要求を満たさず,トレーニング中に見つからないモダリティの推測時に劣化することのない,インスタンス固有のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 19:38:37 GMT)
Measuring out-of-time-order correlators on a quantum computer based on an irreversibility-susceptibility method [0.0] 量子コンピュータ上でのOTOC(Out-of-time-ordered correlator)の実験的検討を行った。
熱ギブス状態で作製したXXZスピン1/2鎖の量子力学について検討した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:33:19 GMT)
Making AI Philosophical Again: On Philip E. Agre's Legacy [0.0] この論文は、人工知能、哲学、批判理論の交差点におけるフィリップ・アグレの研究を分析している。
オープンで自己開示的な人間の存在の性格は、完全に捕えられ、プログラムされることができない。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:31:03 GMT)
Machine learning models for predicting catastrophe bond coupons using climate data [0.0] カタストロフィ(CAT)社債は、このリスクの一部を投資家に譲渡することを可能にし、伝統的な再保証に代わる手段を提供する。
本稿では,CAT結合価格における気候変動の役割について検討し,各種機械学習モデルの予測性能を評価する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 17:19:52 GMT)
Likelihood-Preserving Embeddings for Statistical Inference [0.0] 現代の機械学習の埋め込みは、高次元データの強力な圧縮を提供する。
本稿では,確率保存型埋め込みの理論を考案する。
ガウス分布とコーシー分布の実験は指数族理論によって予測される鋭い相転移を検証する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:21:55 GMT)
Leveraging Machine Learning for Early Detection of Lung Diseases [0.0] この研究は、迅速で正確で非侵襲的な診断ソリューションを提供し、患者の結果に大きな影響を及ぼす可能性がある。
本研究は,胸部X線から新型コロナウイルス,肺癌,肺炎などの呼吸器疾患の診断を促進するための深層学習手法である。
CNN、VGG16、InceptionV3、EfficientNetB0など、さまざまなニューラルネットワークモデルを高精度、精度、リコール、F1スコアでトレーニングし、検証した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:50:23 GMT)
Landauer cost in a continuous vacuum/no-vacuum measurement [0.0] 真空または非真空測定の連続したバイナリレコードの維持コストについて検討した。
我々は粗粒化の役割を議論し、分析を多くの監視モードに拡張し、回路QED光子モニタリングのパラメータ推定を行う。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 02:20:22 GMT)
InDRiVE: Reward-Free World-Model Pretraining for Autonomous Driving via Latent Disagreement [0.0] 本稿では,DreamerV3スタイルのモデルベース強化学習エージェントであるInDRiVEについて述べる。
差別に基づく事前訓練は、町のシフトと一致する相互作用予算の下で、より強いゼロショットと堅牢な数ショット衝突回避をもたらす。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:30:36 GMT)
Hierarchical Pedagogical Oversight: A Multi-Agent Adversarial Framework for Reliable AI Tutoring [0.0] 本稿では,構造化された対人合成を教育評価に適用する枠組みである階層的教育監督(HPO)を紹介する。
表面的なコンセンサスに向かって漂う協調的なマルチエージェントシステムとは異なり、HPOは関心事の弁証的分離を強制する。
1,214の中学校数学対話のMRBenchデータセットを用いて,この枠組みを評価する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 06:42:07 GMT)
Geometry-Aware Optimization for Respiratory Sound Classification: Enhancing Sensitivity with SAM-Optimized Audio Spectrogram Transformers [0.0] シャープネス認識最小化(SAM)を用いたAST(Audio Spectrogram Transformer)の拡張フレームワークを提案する。
ICBHI 2017データセットの最先端スコアは68.10%に達し、既存のCNNとハイブリッドベースラインを上回っている。
t-SNEとアテンションマップを用いたさらなる解析により、背景雑音を記憶するのではなく、頑健で差別的な特徴を学習することを確認した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 11:39:36 GMT)
Fragile Knowledge, Robust Instruction-Following: The Width Pruning Dichotomy in Llama-3.2 [0.0] 我々は,MAW誘導幅の刈り取りが選択フィルタとして機能し,行動アライメントを保ちつつパラメトリック知識を減少させることを示す。
プルーニングされた構成は、エネルギー消費(J/Token)を最大で23%削減するが、単一要求レイテンシで罰則が生じる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 18:09:57 GMT)
Fast collisional $\sqrt{\mathrm{SWAP}}$ gate for fermionic atoms in an optical superlattice [0.0] 光学超格子の衝突ゲートは近年、記録的な忠実さを達成しているが、その動作時間は通常トンネルによって制限されている。
ここでは、光学超格子中の2つのフェルミオン原子に対する高速な$sqrtmathrmSWAP$ゲートの代替経路を提案し、解析する。
この結果から,超格子における高速で衝突を媒介するエンタングリングゲートを,スケーラブルな中原子量子計算のための有望なビルディングブロックとして確立した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 11:58:44 GMT)
Determinism and Indeterminism as Model Artefacts: Toward a Model-Invariant Ontology of Physics [0.0] 私は、物理学における決定論と非決定論の間の伝統的な反対は、存在論よりも表現論的であると論じる。
私はこのモデル等価性を使って、オントロジ的なコミットメントのためのモデル不変の基準を動機付けます。
私は、経験的オープンネスとメタ物理オーバーリーチに対する抵抗を組み合わせた現代物理学のリアリストを提供しています。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 09:41:03 GMT)
DarkPatterns-LLM: A Multi-Layer Benchmark for Detecting Manipulative and Harmful AI Behavior [0.0] textbfDarkPatterns-LLMは,操作内容の詳細な評価を行うための総合的なベンチマークデータセットと診断フレームワークである。
本フレームワークでは,多階層検出(MGD),多スケールインテント分析(MSIAN),Threat Harmonization Protocol(THP),Deep Contextual Risk Alignment(DCRA)の4層解析パイプラインを実装している。
データセットには、インストラクション-レスポンスペアとエキスパートアノテーションを備えた401の厳密にキュレートされた例が含まれている。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 05:05:46 GMT)
Conformal Prediction Sets for Next-Token Prediction in Large Language Models: Balancing Coverage Guarantees with Set Efficiency [0.0] 本稿では,大きな語彙を持つ変圧器モデルにおいて,適応予測集合(APS)を次トーケン予測に適用する体系的な研究を行う。
本稿では,語彙認識型コンフォーマル予測(VACP)を提案する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 19:08:54 GMT)
Chord Recognition with Deep Learning [0.0] 生成モデルにおける最近の発展によって実現された既存の手法と仮説に関する実験を行う。
私は、ビート検出によるモデル出力の解釈性を改善することで結論付ける。
自動コード認識の解決にはまだ多くの作業が残っていますが、この論文は他の人が試すための道筋を図示してくれることを願っています。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 15:20:16 GMT)
Bugs with Features: Vision-Based Fault-Tolerant Collective Motion Inspired by Nature [0.0] 集団運動では、知覚的に制限された個人は、集中的な制御なしに順序づけられた動きをする。
本稿では,ロカストの研究から着想を得たロバスト集団運動のメカニズムについて述べる。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 03:29:50 GMT)
Affine Symmetry and the Group-Theoretic Basis of the Unruh Effect [0.0] 加速オブザーバにより観測されたリンドラー粒子の熱スペクトルを導出する。
翻訳および拡張固有状態の実現を認める任意の量子系において、類似現象が生じる可能性があることを示す。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:58:50 GMT)
AdaFRUGAL: Adaptive Memory-Efficient Training with Dynamic Control [0.0] 大規模言語モデル(LLM)のトレーニングは、状態オーバーヘッドのため、メモリ集約性が高い。
AdaFRUGALは2つの動的制御を導入している: (i) メモリを徐々に削減するために$$の線形減衰、(ii) 計算オーバーヘッドを減らすために$T$の損失認識スケジュール。
また、AdamWや静的FRUGALと競合する性能を維持しつつ、GPUメモリとトレーニング時間を著しく削減している。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 14:11:08 GMT)
ADMEDTAGGER: an annotation framework for distillation of expert knowledge for the Polish medical language [0.0] この作業は、ADMEDVOICEと呼ばれるより大きなプロジェクトの一部です。
5つの臨床カテゴリを表す医療用テキストの広範なコーパスを収集した。
我々はこのコーパスに注釈をつけるために多言語Llama3.1モデルを使用した。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 10:00:52 GMT)
1d-qt-ideal-solver: 1D Idealized Quantum Tunneling Solver with Absorbing Boundaries [0.0] 1d-qt-ideal-solverは、量子トンネル力学をシミュレートするオープンソースのPythonライブラリである。
Numbaのジャスト・イン・タイムコンパイルはコンパイル言語に匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 27 Dec 2025 16:13:44 GMT)