Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey [171.7] 3D再構成とビュー合成は、拡張現実(AR)、仮想現実(VR)、デジタルツインといった没入型技術における基礎的な問題である。
深層学習によるフィードフォワードアプローチの最近の進歩は、高速で一般化可能な3次元再構成とビュー合成を可能にして、この分野に革命をもたらした。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:51:24 GMT)
Discrete Audio Tokens: More Than a Survey! [137.4] 本稿では,離散型音声トークンの体系的レビューとベンチマークを行う。
音声、音楽、一般的なオーディオドメインをカバーしている。
本稿では,エンコーダデコーダ,量子化技術,トレーニングパラダイム,ストリーム性,アプリケーションドメインに基づくトークン化アプローチの分類法を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 12:26:57 GMT)
Continual Learning for Generative Retrieval over Dynamic Corpora [115.8] 生成検索(GR)はパラメトリックモデルに基づいて関連文書の識別子(ドシデクス)を直接予測する。
クエリに応答する能力を保ちながら、新しいドキュメントをインクリメンタルにインデックスする能力は、GRモデルを適用する上で不可欠である。
我々は,CLEVERモデルのための新しい連続学習モデルを提案し,GRのための連続学習に2つの大きな貢献をした。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:20:11 GMT)
Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR [110.9] RLVRトレーニングのためのオンライン変分問題合成(SvS)戦略を提案する。
この戦略は、トレーニング中のポリシーのエントロピーを効果的に維持し、標準のRLVRと比較してPass@kを大幅に改善する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:50:53 GMT)
How to Make Large Language Models Generate 100% Valid Molecules? [82.9] 大規模言語モデル(LLM)は、いくつかの例から幅広いタスクを実行することを学べる。
SMILESのような表現を使って有効な分子を生成することは、数ショット設定でLLMにとって難しい。
無効なSMILES訂正のためのクロスケミカル言語フレームワークであるSmiSelfを紹介する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:14:19 GMT)
Beyond Outliers: A Study of Optimizers Under Quantization [82.8] 量子化下でのモデルロバスト性に対する選択の影響について検討する。
モデルの性能が、異なるベースラインでトレーニングした場合にどのように低下するかを評価する。
異なるパラメータによる量子化対応トレーニングのスケーリング法則を導出する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 21:15:22 GMT)
What Makes a Reward Model a Good Teacher? An Optimization Perspective [82.7] 報酬モデルがどの程度正確であるかに関わらず、低報酬分散を誘導した場合、RLHFの目的は平坦な景観に悩まされる。
さらに、ある言語モデルでうまく機能する報酬モデルが、低い報酬分散を誘発し、したがって、別の言語モデルに対して平坦な客観的景観をもたらすことを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:06:18 GMT)
Bridging the Gap Between Promise and Performance for Microscaling FP4 Quantization [77.7] 本研究は,MXFP4とNVFP4の学習後量子化に関する総合的研究である。
本稿では,従来のGPTQ量子化アルゴリズムの変種であるMicro-Rotated-GPTQ(MR-GPTQ)を紹介する。
MR-GPTQは最先端の精度で一致または性能が向上することを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:22:21 GMT)
Diagnose, Localize, Align: A Full-Stack Framework for Reliable LLM Multi-Agent Systems under Instruction Conflicts [75.2] LLM(Large Language Model)を利用したマルチエージェントシステム(MAS)は、複雑なタスクにおける協調推論、ツールの使用、役割特化調整を急速に進めている。
しかし、信頼性クリティカルなデプロイメントは、体系的な障害モード、すなわち命令の競合による階層的コンプライアンスによって妨げられている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:43:34 GMT)
Revisiting Multivariate Time Series Forecasting with Missing Values [74.6] 現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 20:57:48 GMT)
Agentic AI Reasoning for Mobile Edge General Intelligence: Fundamentals, Approaches, and Directions [74.4] 大規模言語モデル(LLM)は、強力な推論と自律的な意思決定能力を備えたエージェント人工知能(AI)の出現を可能にした。
Mobile Edge General Intelligence (MEGI)は、リアルタイムでプライバシ保護の推論をネットワークエッジにもたらす。
本稿では,MEGIにおけるLLM推論の効率的な展開のための共同最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:53:48 GMT)
Self-Consistency as a Free Lunch: Reducing Hallucinations in Vision-Language Models via Self-Reflection [71.8] 視覚言語モデルは、しばしば詳細を幻覚させ、既存のオブジェクトを生成するか、出力信頼性を損なう不正確な属性を生成する。
本稿では、長文応答と短文応答の自己整合性を利用して、学習のための選好ペアを生成する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:37:11 GMT)
DentVLM: A Multimodal Vision-Language Model for Comprehensive Dental Diagnosis and Enhanced Clinical Practice [71.6] 本稿では,専門レベルの口腔疾患診断のために設計された視覚言語モデルであるDentVLMを紹介する。
このモデルは、36の診断タスクで7つの2D経口画像モダリティを解釈できる。
若年者歯科医師13名(36名中21名)の診断成績を上回り,12名中12名(36名中12名)の診断成績を上回りました。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:47:37 GMT)
Liaozhai through the Looking-Glass: On Paratextual Explicitation of Culture-Bound Terms in Machine Translation [70.4] 我々は、文学・翻訳研究からジェネットのパラテキスト論(1987年)を定式化し、機械翻訳におけるパラテキスト明示の課題を紹介した。
古典中国語の短編集集Liaozhaiの4つの英訳から560の専門家対応パラテキストのデータセットを構築した。
本研究は,言語的等価性を超えた機械翻訳におけるパラテクスト的明示の可能性を示すものである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:27:36 GMT)
On the Same Wavelength? Evaluating Pragmatic Reasoning in Language Models across Broad Concepts [69.7] 本研究では,言語理解と言語生産の両面で,多種多様なLMについて検討する。
最先端のLMは小さくはないが,言語理解において高い性能を発揮する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:48:29 GMT)
ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search [69.6] 本稿では,検索した文書の信頼性情報を明確に活用する,敵対的堅牢性のためのフレームワークであるReliabilityRAGを提案する。
我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:36:42 GMT)
ReCalKV: Low-Rank KV Cache Compression via Head Reordering and Offline Calibration [69.6] ReCalKVは,キーと値の調整を施した低ランクKVキャッシュ圧縮手法である。
キーズでは、構造的に類似した頭部をグループにクラスタリングし、より正確な低ランク近似を可能にするSimisity aware Recontext (HSR)を提案する。
本稿では,オフラインヘッドワイド値(OVC)を提案する。これはトレーニングなしでキャリブレーションデータを用いて,効率的に値予測行列を校正する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:37:40 GMT)
XL-Suite: Cross-Lingual Synthetic Training and Evaluation Data for Open-Ended Generation [68.0] XL-Instructは高品質な合成データを生成する新しい技術である。
XL-AlpacaEvalは、大規模言語モデルの言語間生成能力を評価するための新しいベンチマークである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:42:25 GMT)
Understanding Catastrophic Interference On the Identifibility of Latent Representations [67.1] 破滅的な干渉、あるいは破滅的な忘れ(Caastrophic forgetting)は、機械学習の根本的な課題である。
本稿では,破滅的干渉を識別問題として定式化する新しい理論枠組みを提案する。
我々のアプローチは、合成データセットとベンチマークデータセットの両方で理論的保証と実用的なパフォーマンスの改善を提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:53:32 GMT)
Emergence of Superposition: Unveiling the Training Dynamics of Chain of Continuous Thought [64.4] 有向グラフ到達性問題に対する簡易な2層変圧器のトレーニング力学を理論的に解析する。
分析の結果,連続的思考を用いたトレーニングでは,まずインデックスマッチングロジットが増加し,その後は軽度な仮定の下で拘束されることがわかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:23:46 GMT)
Critique to Verify: Accurate and Honest Test-Time Scaling with RL-Trained Verifiers [64.0] ミラー・クリティク(Mirror-Critique)は、情報的批評で検証者を訓練する枠組みである。
我々は、高品質な批判データを合成するために、小さな命令調整モデルを展開する。
結果として得られるミラー検証は、ソリューション毎に複数の批判を生成することで、候補ソリューションを評価するためにデプロイされる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:50:24 GMT)
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation [63.7] Inbetween-2-4Dという,2枚のシングルビュー画像を補間する4次元(つまり3D + モーション)の生成問題を提案する。
テキストや1つの画像のみからの映像/4D生成とは対照的に、補間タスクはより正確なモーション制御を利用して生成をよりよく制約することができる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:04:11 GMT)
Depth-Breadth Synergy in RLVR: Unlocking LLM Reasoning Gains with Adaptive Exploration [61.4] Reinforcement Learning with Verifiable Reward (RLVR)は、大規模言語モデルにおける推論能力をアンロックするための強力なパラダイムとして登場した。
RLVRの完全なポテンシャルは、モデルがサンプリングできる最も難しい深さと、単一のイテレーションで消費されるインスタンスの数という2つの未探索の次元によって妨げられていることを示す。
本稿では,多段ロールアウトによる難易度再重み付けを行うDARS(Difficulty Adaptive Rollout Smpling)を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:40:44 GMT)
Deep Time Series Models: A Comprehensive Survey and Benchmark [60.7] 時系列は、その複雑でダイナミックな性質のために固有の課題を提示する。
近年、時系列コミュニティで顕著なブレークスルーが見られた。
多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:57:17 GMT)
SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer [60.2] 悲観的領域ランダム化によるSim-to-realの略称であるSPiDRを提案する。
SPiDRは、安全なsim-to-real転送を保証するスケーラブルなアルゴリズムである。
我々は,SPiDRが性能を維持しつつ,シミュレートとリアルのギャップを保ちながら,安全性を効果的に確保できることを実証した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:26:53 GMT)
FusionFactory: Fusing LLM Capabilities with Multi-LLM Log Data [60.1] 大規模言語モデル(LLM)は、さまざまなモデルのランドスケープを持ち、それぞれが異なるタスクで優れています。
この多様性は、研究者に複数のLLMを実際に採用させ、貴重なマルチLLMログデータを残します。
1)実世界のサービスシナリオ(例えば、ローカルおよびAPIベースのサービス)との互換性と、(2)様々なユーザニーズを満たすためにLLMパイプラインの異なる段階での運用の柔軟性である。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:59:32 GMT)
Model Collapse Is Not a Bug but a Feature in Machine Unlearning for LLMs [54.2] LLMの現在のアンラーニング方法は、それらを微調整データに組み込むことで、削除しようとしているプライベート情報に基づいて最適化されている。
本研究では,未学習目標を学習対象に含まない新しい非学習手法-部分的モデル崩壊(PMC)を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:05:38 GMT)
Training Deep Normalization-Free Spiking Neural Networks with Lateral Inhibition [52.6] 深層ニューラルネットワーク(SNN)のトレーニングは、バッチ正規化のような明示的な正規化スキームに依存している。
本研究では,皮質回路にインスパイアされた側方抑制を取り入れた正規化自由学習フレームワークを提案する。
本稿では,生物リアリズムを持つ深層SNNの安定的学習を可能にするとともに,明示的な正規化に頼らずに競争性能を達成できることを述べる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:11:30 GMT)
PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.5] 大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。
PT$2$-LLMを提案する。
その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:01:48 GMT)
Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model [52.4] 本稿では,高品質な映像再構成を実現するために,意味情報を抽出し,送信するスケーラブルなビデオ意味コミュニケーションフレームワークを提案する。
具体的には、送信機では、それぞれテキストと構造的意味論として機能するソースビデオから記述と他の条件信号を抽出する。
受信機では、拡散に基づくGenAI大モデルを用いて、ビデオの再構成のために複数のモーダルのセマンティクスを融合させる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 12:38:35 GMT)
Unsupervised Online 3D Instance Segmentation with Synthetic Sequences and Dynamic Loss [52.3] 教師なしのオンライン3Dインスタンスのセグメンテーションは、基本的だが難しい課題だ。
UNITのような既存の手法はこの方向に進んできたが、訓練の多様性が制限されているままである。
本稿では,合成点雲列生成によるトレーニング分布の強化を目的とした新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:53:27 GMT)
Function Induction and Task Generalization: An Interpretability Study with Off-by-One Addition [51.3] 関数誘導機構は,標準加算からオフバイワン加算までのモデルの一般化を説明する。
このメカニズムは、以前の作業で見いだされた誘導ヘッド機構の構造に似ており、より高度な抽象レベルまで上昇する。
この関数誘導機構は、シフトした複数選択QAのような合成タスクや、ベース8の追加のようなアルゴリズムタスクなど、幅広いタスクで再利用されている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:24:21 GMT)
Unveiling Impact of Frequency Components on Membership Inference Attacks for Diffusion Models [51.2] メンバーシップ推論アタック(MIA)は、モデルのトレーニングフェーズで特定のデータが使用されたかどうかを確認するように設計されている。
我々はそれらを、会員識別のための会員スコアを計算する統一的な汎用パラダイムに定式化する。
このパラダイムの下では、拡散モデルが高周波情報を処理する方法において、既存の攻撃が固有の欠陥を見落としていることを実証的に見出す。
本稿では, プラグアンドプレイ方式の高周波フィルタモジュールを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 12:52:38 GMT)
WirelessMathLM: Teaching Mathematical Reasoning for LLMs in Wireless Communications with Reinforcement Learning [51.1] 大規模言語モデル(LLM)は、一般的な数学的推論では優れているが、専門的な技術的数学では破滅的に失敗する。
無線通信では、問題は情報理論的境界の正確な操作を必要とするが、最先端のモデルでさえ有能な性能を達成するのに苦労する。
本稿では、コンパクトモデル(0.5B-7Bパラメータ)がドメイン固有強化学習により、より大きなモデルに適合または超えることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:58:03 GMT)
Your Models Have Thought Enough: Training Large Reasoning Models to Stop Overthinking [51.0] 大規模推論モデル(LRM)は、困難なタスクにおいて顕著なパフォーマンスを達成したが、その深い推論はしばしばかなりの計算コストを発生させる。
Evidence Accumulation Modelsにインスパイアされて、LEMは推論の初期段階で十分な情報を蓄積し、さらなる推論ステップを冗長にすることがわかった。
不要な推論を積極的に終了させるためにモデルを訓練するJust-Enough Thinking (JET)を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:25:06 GMT)
Imaging-Based Mortality Prediction in Patients with Systemic Sclerosis [50.5] 全身性硬化症(SSc)における間質性肺疾患(ILD)の死因
本研究は,放射能と深層学習を利用して死亡率を予測する,新しい大規模胸部CT解析フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 23:46:57 GMT)
Learning to Infer Unseen Single-/Multi-Attribute-Object Compositions with Graph Networks [47.4] 本稿では,複雑な関係を学習するための属性オブジェクト意味関連グラフモデルを提案する。
属性とオブジェクトを表すノードでは、グラフは柔軟に構築でき、単一の属性と複数属性オブジェクトの合成認識を実現する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 17:39:34 GMT)
Quant-dLLM: Post-Training Extreme Low-Bit Quantization for Diffusion Large Language Models [47.4] 拡散大言語モデル (dLLMs) は双方向のコンテキストと柔軟なマスマスキングデノジング生成を提供する。
我々は,dLLMに適した超低ビットPTQフレームワークであるQuant-dLLMを提案する。
Quant-dLLMは、dLLM上での最先端(SOTA)AR-transfer PTQ法よりも高い精度を達成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:50:42 GMT)
From Evidence to Trajectory: Abductive Reasoning Path Synthesis for Training Retrieval-Augmented Generation Agents [47.1] 我々は,RAGエージェント開発のためのエビアンコール推論経路合成パラダイムであるEviPathを提案する。
EviPath は、 (i) 問題をサブクエストに分解し、それら間の依存関係に基づいて最適なソリューションパスを反復的に計画する、 (i) サブクエストの各サブクエストに対する推論思考と回答を生成するためのプロキシ環境を構築するための証拠を裏付ける、忠実なサブクエスト回答、 (iii) 完全なエージェント-環境相互作用の軌跡を監督されたファインタニングに適した対話形式にフォーマットする会話ファインタニングを含む。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:53:09 GMT)
Cooking Up Creativity: Enhancing LLM Creativity through Structured Recombination [46.8] 本稿では,LLM(Large Language Models)の創造性を高める新しいアプローチを提案する。
自然言語と構造化表現の翻訳にLLMを適用し,その中心となる創造的飛躍を行う。
我々は、創造的なレシピを生成するモデルであるDishCOVERを用いて、料理分野における我々のアプローチを実証する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:06:34 GMT)
Few-shot Personalized Saliency Prediction Based on Interpersonal Gaze Patterns [46.5] 本研究では、対人的な視線パターンを利用した、パーソナライズされた個人性予測手法を提案する。
限られたデータからPSMを予測する効果的な戦略は、他人の視線追跡データを使用することである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:23:06 GMT)
Entering the Era of Discrete Diffusion Models: A Benchmark for Schrödinger Bridges and Entropic Optimal Transport [46.3] 離散空間上のシュリンガーブリッジ(SB)問題に対するベンチマークを導入する。
我々の構成では解析的に知られているSB解と確率分布のペアが得られ、厳密な評価が可能となった。
この研究は、離散空間上のSB法を適切に評価する第一歩となる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:51:07 GMT)
Learning to Reason in Structured In-context Environments with Reinforcement Learning [46.0] 大規模言語モデル(LLM)は、強化学習(RL)を通して推論能力を大幅に向上させた。
textbfStructured textbfIn-context textbfEnvironment (SIE) フレームワークを紹介した。
SIEは大規模構造化データから推論環境を自動的に構築することでスケーラビリティを実現する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:34:19 GMT)
Real-World Transferable Adversarial Attack on Face-Recognition Systems [45.7] 我々は、厳密なブラックボックス設定の下で、普遍的で物理的に転送可能な対向パッチを生成する新しい方法であるGaP(Gaussian Patch)を紹介する。
私たちの研究は実用的で深刻な脆弱性を強調しており、堅牢で移動可能な攻撃はターゲットシステムに関する限られた知識で実現可能であることを証明しています。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:09:06 GMT)
ZeroSiam: An Efficient Siamese for Test-Time Entropy Optimization without Collapse [45.0] 我々は、テスト時間エントロピー最小化に適した効率的な非対称なシームズアーキテクチャであるZeroSiamを紹介する。
ZeroSiamは非対称な分散アライメントによる崩壊を防止し、学習可能な予測器と停止勾配演算子によって効率的に達成される。
我々は、ZeroSiamが崩壊解を予防するだけでなく、バイアス学習信号の吸収と正則化を図り、崩壊が起こらない場合でも性能を向上させるという実証的および理論的証拠を提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:37:47 GMT)
Planner Aware Path Learning in Diffusion Language Models Training [44.8] Planner Aware Path Learning (PAPL)は、標準的なマスク付き離散拡散損失の簡易かつ効果的な修正である。
PAPLは、タンパク質配列モデリングにおける40%の相対的なゲインを含む、ドメイン間で一貫した改善を提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:51:07 GMT)
Why Masking Diffusion Works: Condition on the Jump Schedule for Improved Discrete Diffusion [44.5] マルコフ過程は不連続なジャンプによって一定の速度で進化する。
他の離散拡散モデルとは異なり、マスク拡散はジャンプ時間の既知の分布に構築され、どこにジャンプするかしか学ばない。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:25:23 GMT)
Graph Your Own Prompt [44.4] グラフ一貫性規則化(GCR)は、モデル予測から派生した関係グラフ構造を学習プロセスに注入するフレームワークである。
GCRは、よりクリーンな特徴構造、より強力なクラス内凝集、一般化を促進し、予測構造から学習する新しい視点を提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:45:07 GMT)
Pretraining LLM with Latent Thoughts in Continuous Space [44.2] 本稿では,言語モデルと潜在思考の事前学習手法を提案する。
我々のアプローチは言語モデル(LM)を事前訓練し、まず現在位置の最後の隠れ状態である中間潜在思考を生成する。
同一の推論コストで、トークンごとに1つの追加の潜在思考を生成するLMが、パラメータの2倍の標準モデルより優れていることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:38:08 GMT)
GeLoc3r: Enhancing Relative Camera Pose Regression with Geometric Consistency Regularization [44.0] ReLoc3Rは、高速な25msの推論と最先端のレグレッション精度でブレークスルー性能を達成する。
GeLoc3rは、幾何整合正則化によるポーズ回帰手法を強化する、相対カメラポーズ推定の新しいアプローチである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 01:21:38 GMT)
Enhancing Stability of Physics-Informed Neural Network Training Through Saddle-Point Reformulation [43.9] 近年,物理インフォームドニューラルネットワーク (PIN) が注目されている。
この問題に対処するため、我々は、彼らのランドスケープを非強固な凹点問題として再考する。
提案手法は現在の最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:44:02 GMT)
Curse of Slicing: Why Sliced Mutual Information is a Deceptive Measure of Statistical Dependence [43.5] スライデッド・ミューチュアル・インフォメーション(SMI)は、非線形統計依存を測定するための相互情報に代わるスケーラブルな代替手段として広く利用されている。
我々はSMIが飽和しやすく、統計的依存の増大を検知できず、情報的内容よりも冗長性を優先し、場合によっては相関係数のような単純な依存度よりも悪化することを示した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:18:02 GMT)
CATMark: A Context-Aware Thresholding Framework for Robust Cross-Task Watermarking in Large Language Models [37.7] 本研究では,リアルタイムな意味的文脈に基づく透かし強度を動的に調整する新しいフレームワークを提案する。
$myalgo$は、ロジットクラスタリングを使用してテキスト生成をセマンティックステートに分割し、コンテキスト対応のエントロピーしきい値を確立する。
実験によると、$myalgo$は、検出精度を犠牲にすることなく、クロスタスクのテキスト品質を改善する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:43:52 GMT)
Solving Systems of Linear Equations: HHL from a Tensor Networks Perspective [37.6] 本研究では、テンソルネットワークを用いた方程式解法アルゴリズムのHHL線形系をシミュレーションするための新しいアプローチを提案する。
立方体形式論における新しい HHL、すなわち qubits の一般化が発展し、その操作は等価な古典的 HHL に変換される。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:41:54 GMT)
AudioRole: An Audio Dataset for Character Role-Playing in Large Language Models [37.1] AudioRoleは、13のテレビシリーズから1K以上の時間と1M以上の文字による対話を正確に収集したデータセットだ。
話者識別とコンテキストメタデータを付加した同期オーディオテキストペアを提供する。
データセットの有効性を示すために,デュアルアスペクト評価フレームワークであるARP-Evalを導入した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:08:51 GMT)
Reshaping Reasoning in LLMs: A Theoretical Analysis of RL Training Dynamics through Pattern Selection [35.3] 本稿では,実験解析と厳密な理論的モデリングによるRL学習プロセスの説明を行う。
我々は、報酬(RLVR)とモデルの内部フィードバック(RLIF)という2つの典型的な報酬を用いて、RLのトレーニングダイナミクスを理解するための理論的枠組みを開発する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:07:28 GMT)
Last iterate convergence in no-regret learning: constrained min-max optimization for convex-concave landscapes [35.0] オンライン学習フレームワーク「OMWU(Optimistic Multiplicative-Weights Update)」は,凸凹型ゲームにおいて,最後の反復収束を示す。
提案手法の高速収束を示す実験により,実験結果を補完する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:12:02 GMT)
Decoupling Reasoning and Perception: An LLM-LMM Framework for Faithful Visual Reasoning [34.9] 大規模言語モデル(LLM)のための学習不要なビジュアル推論パイプラインを導入する。
強力なLLMは、LMMを戦略的に尋問して、論理的連鎖に必要な特定の視覚情報を抽出する高レベルの推論をオーケストレーションする。
この枠組みは視覚的推論過程を効果的に制御し, 視覚的根拠のない推論ステップの大幅な削減と, 忠実さの大幅な改善に繋がる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:13:41 GMT)
Advanced Architectures Integrated with Agentic AI for Next-Generation Wireless Networks [34.7] 本稿では,ネットワーク運用の簡素化,運用費の削減(OpEx),新サービスモデルの展開を目的とした最先端技術について検討する。
i) 長期6Gネットワークの進化に対処しながら、サービスのシームレスな拡張を可能にするコントロールプレーンとユーザプレーンを備えた、新しい、より効率的な6Gアーキテクチャの提供に重点を置いている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:01:13 GMT)
LiTEx: A Linguistic Taxonomy of Explanations for Understanding Within-Label Variation in Natural Language Inference [34.6] 自由文の説明を英語で分類するための言語情報を用いた分類法であるLITEXを紹介する。
この分類を用いて、e-SNLIデータセットのサブセットに注釈を付け、分類の信頼性を評価し、NLIラベル、ハイライト、説明とどのように一致しているかを分析する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:40:54 GMT)
Alignment through Meta-Weighted Online Sampling: Bridging the Gap between Data Generation and Preference Optimization [32.8] 大きな言語モデルと人間の価値観と意図を整合させるためには、優先度最適化が不可欠である。
既存の手法では、静的または分離されたオンラインサンプリング戦略を用いて、このギャップを減らそうとしている。
モデル学習とデータ生成を動的に結合する新しいフレームワークMetaAPO(Meta-Weighted Adaptive Preference Optimization)を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:38:24 GMT)
Democratizing AI scientists using ToolUniverse [32.3] ToolUniverseは、任意の言語や推論モデルからAI科学者を構築するためのエコシステムです。
ToolUniverseは、AI科学者がツールを特定して呼び出す方法を標準化し、600以上の機械学習モデル、データセット、API、科学パッケージを統合する。
高コレステロール血症のケーススタディにおいて、ToolUniverseは、予測された特性を持つ薬物の強力なアナログを特定するために、AI科学者を作成するために使用された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 17:38:53 GMT)
AICrypto: A Comprehensive Benchmark for Evaluating Cryptography Capabilities of Large Language Models [32.0] AICryptoは、大規模言語モデルの暗号能力を評価するために設計された最初の包括的なベンチマークである。
ベンチマークは135の多重選択質問、150のキャプチャー・ザ・フラッグ課題、18の証明問題で構成されている。
LLMをリードする17のモデルの評価は、最先端のモデルが暗号概念を記憶する上で、人間の専門家と一致しているか、さらに上回っていることを示している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:27:25 GMT)
Entropy-Memorization Law: Evaluating Memorization Difficulty of Data in LLMs [31.8] LLM(Large Language Models)は、トレーニングデータの一部を記憶することが知られており、適切な指示を下すと、時には冗長な内容が再現される。
本稿では,データエントロピーが記憶スコアと線形に相関していることを示すエントロピー記憶法を提案する。
エントロピー記憶法(Entropy-Memorization Law)の発見と同じ戦略を採用することで、トレーニングとテストデータの区別をシンプルかつ効果的に行うことができる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:00:09 GMT)
Seeing the Unseen in Low-light Spike Streams [31.6] スパイクカメラは、高時間分解能のニューロモルフィックセンサーの一種で、高速な視覚タスクに非常に有望である。
独自のデータモダリティのため、スパイクストリームは人間の目に知覚されるように再構築方法を必要とする。
スパイクカメラの最初の拡散型再構成法であるDiff-SPKを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:33:03 GMT)
Graph Alignment via Dual-Pass Spectral Encoding and Latent Space Communication [31.4] 本稿では,ノードの特異性を同時に強化し,潜在空間間の幾何的整合性を実現する新しいグラフアライメントフレームワークを提案する。
提案手法では,低域通過スペクトルフィルタと高域通過スペクトルフィルタを組み合わせたデュアルパスエンコーダを導入し,構造認識と高判別の両方が可能な埋め込みを生成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:11:41 GMT)
Last-Iterate Convergence: Zero-Sum Games and Constrained Min-Max Optimization [31.2] 広く使われているグラディエント・ディキセント/アセンセント法は凸問題におけるサドル点への最終点収束を示す。
我々は、非回帰乗算重み更新法の変則の下で、エム制約最小値最適化のより一般的な問題において、同じことが成り立つことを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:38:57 GMT)
Peacemaker or Troublemaker: How Sycophancy Shapes Multi-Agent Debate [30.7] 大規模言語モデル (LLM) はしばしば、過剰な一致性を示す傾向がある。
LLMs固有の薬理は、議論を早めの合意に崩壊させる可能性がある。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:27:13 GMT)
WeatherCycle: Unpaired Multi-Weather Restoration via Color Space Decoupled Cycle Learning [30.6] マルチウェザー条件下での教師なし画像復元は根本的だが未発見の課題である。
気象の回復を双方向の劣化コンテンツ翻訳サイクルとして再構成する統合フレームワークである textbfWeatherCycle を提案する。
本手法は, 複雑な気象劣化に対する強い一般化を図りながら, 教師なしアプローチの最先端性能を実現する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:44:27 GMT)
Landing with the Score: Riemannian Optimization through Denoising [28.6] 本稿では,データ分布を最適化に必要な幾何演算に接続するリンク関数を提案する。
この関数が本質多様体演算の回復を可能にすることを示す。
本稿では,2つの効率的な推論時間アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:10:54 GMT)
Dual-Space Smoothness for Robust and Balanced LLM Unlearning [28.6] PRISMは、非学習メトリクスを改善しバランスをとるために、表現空間とパラメータ空間の二重空間の滑らかさを強制する統合フレームワークである。
PRISMは2つのスムーズな最適化段階から構成される: (i) 堅牢に訓練されたプローブを用いてジェイルブレイク攻撃を防御する表現空間ステージ、 (ii) 保持と忘れられた勾配の衝突を分離し、不均衡を減らし、再学習攻撃を軽減するためにパラメータ空間を滑らかにするパラメータ空間ステージ。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:20:37 GMT)
Cognition-of-Thought Elicits Social-Aligned Reasoning in Large Language Models [28.2] 大きな言語モデル(LLM)は複雑な推論において優れているが、それでも有害な振る舞いを示すことができる。
本稿では,認知的自己監視ループにLCMを組み込んだ新しい復号時間フレームワークCooTを紹介する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:16:57 GMT)
Sparse2Dense: A Keypoint-driven Generative Framework for Human Video Compression and Vertex Prediction [27.9] 超低速映像圧縮のためのキーポイント駆動生成フレームワークであるSparse2Denseを提案する。
鍵となるイノベーションは、複雑な人間の動きをエンコードするマルチタスク学習とキーポイント認識の深層生成モデルである。
Sparse2Denseは、リアルタイムモーション分析、仮想人間アニメーション、没入型エンターテイメントなど、帯域幅効率の高い人中心メディアの伝送を容易にすることが期待されている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:54:56 GMT)
CrediBench: Building Web-Scale Network Datasets for Information Integrity [27.6] CrediBenchは、時間的Webグラフを構築するための大規模データ処理パイプラインである。
我々のアプローチは、一般的な誤情報領域の動的進化を捉えている。
本稿では,このグラフスナップショットを用いた実験から,信頼度を学習するための構造的およびWebページコンテンツ信号の強度を実証する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:42:48 GMT)
Seeing Through the Blur: Unlocking Defocus Maps for Deepfake Detection [27.1] 生成AIは、フォトリアリスティックな合成画像の大量生成を可能にし、本物と制作されたビジュアルコンテンツの境界を曖昧にした。
本稿では,物理的に解釈可能なディープフェイク検出フレームワークを提案する。
我々は,デフォーカスに基づく検出パイプラインと解釈可能性ツールを,メディア法医学における現在進行中の研究に有意義に貢献することを目的としている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:02:53 GMT)
Uncovering Intrinsic Capabilities: A Paradigm for Data Curation in Vision-Language Models [26.9] 本稿では,タスク固有のキュレーションから本質的な能力分析へ移行するフレームワークであるCapability-Attributed Data Curation(CADC)を紹介する。
CADCは、勾配に基づく学習軌跡から教師なしの方法で本質的な能力を発見する。
オリジナルのデータの5%に過ぎず、CADCはマルチモーダルベンチマークでのフルデータトレーニングを超越している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:57:37 GMT)
Orientation-anchored Hyper-Gaussian for 4D Reconstruction from Casual Videos [26.6] OriGSは、カジュアルにキャプチャされたモノクロビデオから高品質な4D再構成を行うための新しいフレームワークだ。
まず、空間と時間にまたがる主要な前方方向を伝播するグローバルオリエンテーション場を推定する。
これに基づいて、時間、空間、幾何学、配向をコヒーレントな確率的状態に埋め込む統一的な定式化である、配向を意識したハイパーガウス的(Hyper-Gaussian)を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 20:43:43 GMT)
A Systematic Survey on Large Language Models for Evolutionary Optimization: From Modeling to Solving [26.5] 大規模言語モデル(LLM)は、最適化問題に対処するためにますます研究されている。
急速な進歩にもかかわらず、この分野は依然として統一的な合成と体系的な分類を欠いている。
この調査は、最近の開発を包括的にレビューし、構造化されたフレームワーク内でそれらを整理することで、このギャップに対処する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 05:42:17 GMT)
TabularGSM: Understanding the Limitations of LLMs in Tabular Math Reasoning [26.2] 本稿では,算術語問題をスケーラブルかつ検証可能な表型推論タスクに変換する,ニューロシンボリックなフレームワークであるAutoT2Tを提案する。
3つの段階的に複雑なサブセットと2つの相補的な評価設定を持つトラップサブセットからなるベンチマークであるTabularを開発した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:13:03 GMT)
AutoEP: LLMs-Driven Automation of Hyperparameter Evolution for Metaheuristic Algorithms [23.0] アルゴリズム制御のためのゼロショット推論エンジンとしてLarge Language Models (LLM)を活用することで、トレーニングを完全に回避する新しいフレームワークであるAutoEPを紹介する。
AutoEPは一貫して最先端のチューニング方法より優れています。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:45:21 GMT)
Understanding Language Prior of LVLMs by Contrasting Chain-of-Embedding [22.8] 大規模視覚言語モデル(LVLM)における言語の最初の体系的解析について述べる。
それぞれのモデルが視覚統合ポイント(VIP)を示しており、視覚情報が隠れた表現を意味的に再形成し、デコードに影響を与える重要な層である。
9つの現代のLVLMと6つのベンチマークにまたがる54のモデル-データセットの組み合わせにおいて、VIPは一貫して出現し、TVIは言語の強さを確実に予測することを示した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:12:05 GMT)
Limit Analysis for Symbolic Multi-step Reasoning Tasks with Information Propagation Rules Based on Transformers [22.5] 単一パスの注意層が$L$であるモデルに対して、推論ステップの極限数は$O(2L-1)$と$O(2L-1)$の間であることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:13:39 GMT)
MedCritical: Enhancing Medical Reasoning in Small Language Models via Self-Collaborative Correction [22.4] 小さな言語モデルは、GPT-4やDeepseekのような大きな言語モデルに比べて性能が劣ることが多い。
近年の知識蒸留法は,教師指導による誤り訂正によってこれらの問題に対処することを目的としている。
そこで我々は,大規模教師モデルによって微調整された小言語モデルを用いた2段階のフレームワーク,MedCriticalを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:30:20 GMT)
Tracing the Representation Geometry of Language Models from Pretraining to Post-training [22.2] 本研究では,事前学習と後学習にまたがる学習表現の幾何学をスペクトル的に検討する。
自己回帰事前学習中に3つの幾何位相の一貫した非単調列が発見された。
SFTとDPOは、特定の命令データや優先データを統合するために「エントロピー探索」ダイナミクスを駆動します。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:46:29 GMT)
Local Success Does Not Compose: Benchmarking Large Language Models for Compositional Formal Verification [22.0] DafnyCOMPは、Dafnyにおける構成仕様生成において、大きな言語モデル(LLM)を評価するためのベンチマークである。
現状のLLMファミリーを複数評価し, 単機能検証では良好に機能するが, 構成タスクでは顕著に低下することがわかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:33:08 GMT)
LOTFormer: Doubly-Stochastic Linear Attention via Low-Rank Optimal Transport [21.5] 線形時間と二重確率を同時に行う原理的注意機構を提案する。
LotFormerはLong Range Arenaベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:11:09 GMT)
CrystalGym: A New Benchmark for Materials Discovery Using Reinforcement Learning [21.5] 新しい材料の設計と最適化は、主に密度汎関数理論計算を行う高精度な原子シミュレータに依存している。
オンライン強化学習(RL)による材料設計ループにおける直接DFT信号の導入を支援するため,CrystalGymを提案する。
ターゲット特性に条件付けされた結晶を設計するための共通値およびポリシーに基づく強化学習アルゴリズムをベンチマークする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:02:14 GMT)
A Generative Model for Controllable Feature Heterophily in Graphs [20.5] 本稿では,特徴ヘテロフィリーの明示的な制御を可能にするグラフ信号生成フレームワークを提案する。
グラフファミリとスペクトルフィルタ間のホモフィリーの精密制御を実験により検証する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:31:19 GMT)
Entanglement signatures of gapless topological phases in a $p$-wave superconductor [20.4] 我々は、$p$波超伝導体のギャップのない位相位相を探索する。
フルバルクギャップがなくても, 絡み合いスペクトルにおけるバルク境界対応を確認した。
これらの結果は、隙間のない系における対称性、絡み合い、トポロジーの間の微妙な相互作用を明らかにしている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:25:17 GMT)
Cross-Domain Multi-Person Human Activity Recognition via Near-Field Wi-Fi Sensing [20.1] 不完全な活動カテゴリの存在下で、効率的なドメイン間適応のための新しいトレーニングフレームワークWiAnchorを提案する。
我々は、WiAnchorを徹底的に評価するための包括的なデータセットを構築し、アクティビティのカテゴリが欠如している場合に、90%以上のクロスドメイン精度を達成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:22:15 GMT)
Understanding and Enhancing the Planning Capability of Language Models via Multi-Token Prediction [17.6] 理論的には、Transformerアーキテクチャを用いてMulti-Token Prediction(MTP)パラダイムを解析する。
本研究では,Next-Token Injection (NTI) と Transformer-based transfer layer (Transformer-based transfer layer) の2つの手法を提案する。
合成グラフとBlocksworld計画ベンチマークの両方に関する実験により、理論的な結果が検証され、改善によってモデルの経路計画能力が大幅に向上することが実証された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:40:15 GMT)
CasPoinTr: Point Cloud Completion with Cascaded Networks and Knowledge Distillation [17.5] 本稿では,カスケードネットワークと知識蒸留を用いた新しいポイントクラウド補完フレームワークCasPoinTrを紹介する。
CasPoinTrは、完了タスクを2つの相乗的なステージ、Shape ReconstructionとFused Completionに分解する。
CasPoinTrは, 形状回復と細部保存において, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:49:24 GMT)
Sparse Deep Additive Model with Interactions: Enhancing Interpretability and Predictability [16.1] Sparse Deep Model with Interactions (SDAMI) は、疎性駆動型特徴選択と、柔軟な関数近似のためのDeepworksを組み合わせたフレームワークである。
SDAMIの中心はエフェクト・フットプリント(英語版)の概念であり、これは高次相互作用が主効果に極端に近づくことを前提としている。
選択された各主効果に対して、SDAMIは専用のサブネットワークを構築し、解釈可能性を維持しながら非線形関数近似を可能にする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:44:57 GMT)
Collaborative Deterministic-Probabilistic Forecasting for Diverse Spatiotemporal Systems [16.0] CoSTは最先端のベースラインを25%上回り、計算コストを大幅に削減する。
気候、エネルギー通信、都市システムに対する試行は、最先端のベースラインよりも25%向上している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:50:48 GMT)
Grouped Satisficing Paths in Pure Strategy Games: a Topological Perspective [15.8] MARLアルゴリズムで広く採用されている原則は「ウィンステイ、負けシフト」であり、エージェントが最高の応答を達成すれば現在の戦略を維持することを指示する。
本稿では,そのような特性に対して十分な条件を確立し,任意の有限状態マルコフゲーム,および任意の$N$-playerゲームが有限長充足パスの存在を保証することを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:07:27 GMT)
No Loss, No Gain: Gated Refinement and Adaptive Compression for Prompt Optimization [15.6] GRACEは、Gated RefinementとAdaptive Compressionの2つの相乗的戦略を統合するフレームワークである。
GRACEは、それぞれ最先端の手法に対して4.7%、4.4%、および2.7%の大幅な平均相対的な性能向上を実現している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:13:26 GMT)
FM-SIREN & FM-FINER: Nyquist-Informed Frequency Multiplier for Implicit Neural Representation with Periodic Activation [15.5] 我々はNyquist-informed, neuron-specific frequency multipliersを周期的活性化に割り当てるFM-SIRENとFM-FINERを提案する。
この単純だが原則化された修正は特徴の冗長性を50%近く低減し、多様なINRタスク間の信号再構成を一貫して改善する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:14:47 GMT)
Privy: Envisioning and Mitigating Privacy Risks for Consumer-facing AI Product Concepts [15.4] AIはプライバシーのリスクを創造し、悪化させるが、実践者はこれらのリスクを特定し、緩和するための効果的なリソースを欠いている。
私たちはPrivを紹介します。Privは、構造化されたプライバシー影響評価を通じて実践者をガイドするツールです。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 23:08:24 GMT)
From Conversation to Query Execution: Benchmarking User and Tool Interactions for EHR Database Agents [15.3] EHR-ChatQAはデータベースエージェントのエンドツーエンドワークフローを評価する対話型データベース質問応答ベンチマークである。
エージェントはIncreQAで90-95%(少なくとも5つのトライアルのうちの1つ)、AdaptQAで60-80%、Pass5で35-60%、高いPass@5を達成する。
これらの結果は、パフォーマンスだけでなく、安全クリティカルなEHRドメインにも堅牢なエージェントを構築する必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 17:13:51 GMT)
Modeling the language cortex with form-independent and enriched representations of sentence meaning reveals remarkable semantic abstractness [15.3] 文に対する神経応答をモデル化することにより,言語大脳皮質における意味の抽象表現を探索する。
複数の生成画像にまたがるアグリゲーションにより,言語野の反応の精度が向上することがわかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 20:01:06 GMT)
Sculptor: Empowering LLMs with Cognitive Agency via Active Context Management [15.1] 大規模言語モデル(LLM)は、プロアクティブな干渉による長いコンテキストの処理において、大幅な性能劣化に悩まされる。
Sculptorは、LLMにコンテキストの断片化、要約、隠蔽、復元、正確な検索という3つのカテゴリのツールを装備するフレームワークである。
各種長文ベンチマークの実験的評価により、Sculptorは特定の訓練をしなくても性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:36:52 GMT)
Geometry-Aware Losses for Structure-Preserving Text-to-Sign Language Generation [14.9] 手話翻訳は、難聴者や難聴者に対して効果的なコミュニケーションを可能にする上で重要な役割を担っている。
以前の手法では、人間の骨格運動の解剖学的制約や調整パターンを無視することが多かった。
骨格関節間の関係を明示的にモデル化する新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:06:17 GMT)
AI-Assisted Music Production: A User Study on Text-to-Music Models [14.8] 本稿では,TTMモデルが音楽制作にどう影響するかのケーススタディを提案する。
参加者はTTMとソース分離モデルを組み合わせたカスタムツールを使用してトラックを生成する。
この発見は、音楽制作におけるTTMの変革の可能性や、実際の統合における課題に関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:23:40 GMT)
Train Once, Answer All: Many Pretraining Experiments for the Cost of One [14.7] 210Bトークン上の1.5Bパラメータモデルのトレーニング中に10つの実験を行った。
注目すべきは、モデルのトレーニングダイナミクスと全体的なパフォーマンスに対する10の実験の影響が最小限であることだ。
その結果,1回のトレーニングで複数の事前学習実験を行うことで,計算予算による大規模モデルによる厳密な科学的実験が可能になることが示唆された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:07:09 GMT)
UniPose: Unified Cross-modality Pose Prior Propagation towards RGB-D data for Weakly Supervised 3D Human Pose Estimation [14.5] We present UniPose, a unified cross-modality pose before propagation method for weak supervised 3D human pose Estimation。
UniPoseは、大規模RGBデータセットから自己教師付き学習を通じて3Dドメインに2Dアノテーションを転送する。
CMU PanopticとITOPデータセットの実験は、UniPoseが完全に教師されたメソッドと同等のパフォーマンスを達成していることを示している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:49:30 GMT)
Can General-Purpose Omnimodels Compete with Specialists? A Case Study in Medical Image Segmentation [14.4] 多様なデータモダリティを処理できる汎用オムニモデルは、知識集約ドメインの高度に専門化されたモデルと同等に機能する。
本研究では、ドメイン固有のディープラーニングモデルに対して、最先端のオムニモデルのゼロショット性能を解析する比較研究を行う。
以上の結果から,現在のオムニモデルはまだスペシャリストの普遍的な代替にはなっていないが,その特異な強みはスペシャリストモデルとの相補的な役割を示唆している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:38:02 GMT)
No Concept Left Behind: Test-Time Optimization for Compositional Text-to-Image Generation [14.4] 本稿では,テキスト・トゥ・イメージ(T2I)生成における構成忠実度を高めるための,きめ細かいテスト時間最適化フレームワークを提案する。
提案手法は,入力プロンプトを意味概念に分解し,グローバルレベルと概念レベルの両方でアライメントを評価する。
DrawBench と CompBench の実験により,提案手法は概念カバレッジと人間に対する信頼度を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:59:49 GMT)
Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling [14.4] 本研究では,木構造による雑音強度の深さに沿って,スライディング・ウインドウ・サンプリング・ストラテジーを実装したDynamic-TreeRPOを提案する。
木層ごとによく設計されたノイズ強度により、Dynamic-TreeRPOは余分な計算コストを伴わずに探索のばらつきを高めることができる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:59:31 GMT)
Breaking the MoE LLM Trilemma: Dynamic Expert Clustering with Structured Compression [14.1] Mixture-of-Experts (MoE) Large Language Models (LLM) は負荷不均衡、パラメータの冗長性、通信オーバーヘッドのトリレンマに直面している。
動的専門家クラスタリングと構造化圧縮に基づいて統合されたフレームワークを導入し,これらの問題に協調的に対処する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:45:58 GMT)
Remote Sensing-Oriented World Model [14.0] 世界モデルは、直接観測を超えた世界状態の予測と推論によって、人工知能のポテンシャルを示してきた。
既存のアプローチは、主に合成環境や制約されたシーン設定で評価される。
本稿では、リモートセンシングにおける世界モデリングのための最初のフレームワークを導入することにより、これらのギャップを埋める。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:53:26 GMT)
Risk Profiling and Modulation for LLMs [13.8] 大規模言語モデル(LLM)は、不確実性の下で意思決定タスクにますます使われている。
既存の研究では、主にパーソナリティ・プロンプトやマルチエージェントの相互作用について研究されている。
我々は,ポストトレーニングがリスク嗜好の最も安定かつ効果的な調整を提供することを示した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:28:40 GMT)
Generalizable Process Reward Models via Formally Verified Training Data [13.8] FoVerは、正式な検証ツールによって自動的に注釈付けされた正確なステップレベルのエラーラベルでPRMトレーニングデータを合成するアプローチである。
実験により、FoVerでトレーニングされたPRMはクロスタスクの一般化を示し、単一のPRMが様々な推論タスクの検証を効果的に行えることを示した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 21:15:03 GMT)
Decision Potential Surface: A Theoretical and Practical Approximation of LLM's Decision Boundary [13.7] 決定境界(Decision boundary)は、機械学習モデルが2つのクラスに等しい分類確率を割り当てる入力のサブ空間であり、コアモデルの性質を明らかにし、振る舞いを解釈する上で重要である。
近年,大規模言語モデル (LLM) の決定境界を解析する手法が注目されているが,LLM を主流として構築することは計算的に不可能である。
LLM決定境界を解析するための新しい概念であるDPS(Decision Potential Surface)を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:42:54 GMT)
Tree Reward-Aligned Search for TReASURe in Masked Diffusion Language Models [13.4] ツリー検索は、生成モデルとタスク固有の報酬をテスト時に整合させる強力なフレームワークとして登場した。
これらの問題に対処する木探索テスト時間アライメント手法であるTReASUReを提案する。
TReASUReは、パープレキシティ、言語受容性、感情と毒性の制御に関する最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:22:45 GMT)
The Sandbox Configurator: A Framework to Support Technical Assessment in AI Regulatory Sandboxes [13.1] EUの人工知能法は、AI規制サンドボックス(AIRS)を導入している。
評価メソッドは断片化され、テストは標準化が欠如し、開発者と規制当局の間のフィードバックループは弱い。
共有ライブラリからドメイン関連テストを選択し、ダッシュボードを統合したカスタマイズされたサンドボックス環境を生成することができる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:37:46 GMT)
Robust Multi-Modal Face Anti-Spoofing with Domain Adaptation: Tackling Missing Modalities, Noisy Pseudo-Labels, and Model Degradation [13.0] マルチモーダル・フェイス・アンチ・スプーフィングにおける3つの課題に対処する新しいフレームワーク MFAS-DANet を提案する。
まず、欠落したモダリティの問題に対処するため、他のモダリティから補完的な特徴を抽出し、欠落したモダリティの特徴を置き換えたり、既存のモダリティを強化したりすることを提案する。
次に、モデル適応におけるノイズの多い擬似ラベルの影響を低減するために、異なるモーダル間の予測不確実性を活用することにより、信頼性の高い擬似ラベルを導出することを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:52:31 GMT)
Flow Matching for Efficient and Scalable Data Assimilation [11.6] データ同化は、ノイズ観測から力学系の状態を推定する。
アンサンブルスコアフィルタ(EnSF)のような最近の生成モデルは、高次元非線形設定においてDAを改善するが、計算コストが高い。
本研究では,アンサンブルフローフィルタ(EnFF)を導入した。これはFMベースのフレームワークで,サンプリングを高速化し,フロー設計の柔軟性を提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:59:08 GMT)
Test-time Uncertainty Estimation for Medical Image Registration via Transformation Equivariance [11.6] 現在のディープ登録ネットワークは、予測が信頼できるかどうかの限られた表示を提供する。
本稿では、事前訓練されたネットワークと互換性のあるテスト時間不確実性推定フレームワークを提案する。
我々のフレームワークは、事前訓練された登録ネットワークをテスト時にリスク認識ツールに変換し、医療画像登録を安全な配置に一歩近付けます。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:03:06 GMT)
TimeExpert: Boosting Long Time Series Forecasting with Temporal Mix of Experts [11.5] 本稿では,キー値(K-V)ペアを局所的な専門家として再認識する,新たな注目レベルメカニズムであるTMOEを提案する。
TMOEは、無関係なタイムスタンプの局所フィルタリングを通じて、クエリ毎に適応的な専門家選択を行う。
次に、一般的な時系列トランスフォーマーフレームワーク(PatchTSTとTimer)のバニラアテンションメカニズムをTMOEに置き換える。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:22:09 GMT)
ARSS: Taming Decoder-only Autoregressive Visual Generation for View Synthesis From Single View [11.3] textbfARSSは、カメラの軌跡に条件付けされた単一の画像から新しいビューを生成するフレームワークである。
本手法は,拡散モデルに基づく最先端のビュー合成手法に比較可能か,あるいはそれ以上に機能する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:03:09 GMT)
DeepFRC: An End-to-End Deep Learning Model for Functional Registration and Classification [11.2] DeepFRCは、ワープ機能と統一アーキテクチャ内の分類を共同で学習するエンドツーエンドのディープラーニングフレームワークである。
このようなジョイントモデルに対する最初の理論的保証を提供し、最適なワープを近似する能力を証明する。
合成および実世界のデータセットの実験により、DeepFRCは、アライメント品質と分類精度の両方において、最先端の手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:04:34 GMT)
Flow Matching for Robust Simulation-Based Inference under Model Misspecification [11.2] Flow Matching Corrected Posterior Estimation(フローマッチング補正後推定)は、シミュレーションによって訓練された後部推定を、少数の実校正サンプルを用いて洗練するフレームワークである。
提案手法は,従来のSBIベースラインと比較して,推論精度と不確実性を向上し,不特定性の影響を常に緩和することを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:10:53 GMT)
Detecting Corpus-Level Knowledge Inconsistencies in Wikipedia with Large Language Models [11.2] 不整合, 特定の事実的不整合に着目し, コーパスレベルの不整合検出の課題を導入する。
本稿では,LLM推論と検索を組み合わせたエージェントシステムであるCLAIREについて述べる。
経験豊富なウィキペディア編集者によるユーザスタディでは、87.5%がCLAIREを使用する際の信頼性が高く、参加者は同じ時間内に64.7%の矛盾が見つかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:32:41 GMT)
An Encoder-Decoder Network for Beamforming over Sparse Large-Scale MIMO Channels [10.9] 大規模分散MIMOチャネルにおけるダウンリンクビームフォーミングのためのエンドツーエンドのディープラーニングフレームワークを開発した。
i) 推定ダウンリンクチャネルを低次元遅延ベクトルに圧縮するエンコーダNN, (ii) ビームフォーマのビームフォーマデコーダNN, (iii) 受信した遅延ベクトルをビームフォーマにマッピングするチャネルデコーダNN, そして (iii) 受信した遅延ベクトルからダウンリンクチャネルを再構築してビームフォーマをさらに洗練するチャネルデコーダNNの3つのモジュールを使用する。
EDNビームフォーミングフレームワークは両遠距離場に拡張される
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:04:29 GMT)
Desensitizing for Improving Corruption Robustness in Point Cloud Classification through Adversarial Training [10.8] 入力機能の過度な信頼性は、DNN脆弱性の根本原因である。
本稿では,デセンシタイズ・アドセンシタイズ・トレーニング(Desensitized Adsensitized Training, DesenAT)を提案する。
ModelNet-C と PointCloud-C の大規模な実験により,提案手法はクリーンデータセットの性能を低下させることなく,モデルの堅牢性を効果的に向上できることを示した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:04:00 GMT)
Measuring Physical-World Privacy Awareness of Large Language Models: An Evaluation Benchmark [10.6] EAPrivacyは、エンボディエージェントの物理世界のプライバシー意識を定量化するために設計された総合評価ベンチマークである。
最高のパフォーマンスモデルであるGemini 2.5 Proは、物理的環境の変更を含むシナリオにおいて、わずか59%の精度しか達成していない。
GPT-4oやClaude-3.5-haikuのような主要なモデルは、社会規範を15%以上無視していた。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 23:39:56 GMT)
$p$-less Sampling: A Robust Hyperparameter-Free Approach for LLM Decoding [10.6] $p$-less サンプリングは、サンプリングに対する情報理論のアプローチであり、各デコードステップでトランケーション閾値を動的に設定する。
p$-lessが既存のサンプリング手法を一貫して上回りながら、より高い温度でテキスト品質の劣化がはるかに少ないことを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:33:41 GMT)
LLM-3D Print: Large Language Models To Monitor and Control 3D Printing [10.6] 産業4.0は、デジタル化を推進し、添加性製造(AM)へのパラダイムシフトによって製造に革命をもたらした。
重要なAM技術であるFDMは、層間押出による最小限の材料廃棄物による、高度にカスタマイズされたコスト効率の高い製品の作成を可能にする。
本稿では,3Dプリンタとともに学習済みのLarge Language Models(LLM)を利用して,印刷欠陥の検出と対処を行うプロセス監視・制御フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 21:10:20 GMT)
RHYTHM: Reasoning with Hierarchical Temporal Tokenization for Human Mobility [9.2] 本稿では,大規模言語モデル(LLM)を汎用軌道予測器および推論器として利用する統一フレームワークであるRHYTHMを紹介する。
RHYTHMは時間的トークン化を用いて、各軌跡を日々のセグメントに分割し、階層的な注意を払って個別のトークンとしてエンコードする。
実世界のデータセットを用いた最先端手法に対して,本モデルの評価を行った。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:55:56 GMT)
Applications of Small Language Models in Medical Imaging Classification with a Focus on Prompt Strategies [9.2] 本研究では,医療画像分類作業における小言語モデル(SLM)の性能について検討する。
NIH Chest X-ray データセットを用いて胸部X線位置を分類する作業において,複数のSLMを評価した。
以上の結果から,一部のSLMは良好なプロンプトで競合精度を達成できることがわかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:41:09 GMT)
COMPACT: Common-token Optimized Model Pruning Across Channels and Tokens [8.8] プルーニングは有望な手法であるが、既存のプルーニング手法は限られている。
本研究では, (i) 埋め込み/LMヘッド層を縮小するために希少な語彙を併用し, (ii) 共通トケン重み付き活性化を用いたFFN中間チャネルをプルーするCompactを提案する。
Qwen、LLaMA、Gemmaファミリ(0.5B-70B)にわたる実験では、パラメータ、GPUメモリ、レイテンシを大幅に削減した最先端のダウンストリームのパフォーマンスが示されている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:27:33 GMT)
ABC-Eval: Benchmarking Large Language Models on Symbolic Music Understanding and Instruction Following [8.7] 我々は,テキストベースのABC表記スコアの理解と指示追従機能に特化した,最初のオープンソースベンチマークであるABC-Evalを提案する。
10のサブタスクにまたがる1,086のテストサンプルからなり、基本的な音楽構文理解から複雑なシーケンスレベルの推論まで、シナリオをカバーしている。
ABC-Eval 上での7つの最先端 LLM の評価を行い,既存のモデルのシンボリック音楽処理能力に顕著な限界が認められた。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:56:20 GMT)
$\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training [8.6] 大規模言語モデル(LLM)は、大規模なソーシャルメディアのダイナミックスに有望な機能を提供する。
本稿では,エージェントモデルの訓練に適した行動型ソーシャルメディアを構築するためのフレームワークであるSを紹介する。
BluePrintは、政治談話に焦点を当てた公開Blueskyデータから構築された大規模なデータセットです。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:02:38 GMT)
A learning-based approach to stochastic optimal control under reach-avoid constraint [8.4] 我々は,リーチアビド制約を受けるマルコフ系を最適に制御するためのモデルフリーアプローチを開発する。
適切な仮定の下では、政策パラメータが最適パラメータに収束し、システム軌道が到達不能な制約を高い確率で満たすことが保証される。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:00:31 GMT)
Mapping Overlaps in Benchmarks through Perplexity in the Wild [8.3] 我々は,大規模言語モデル(LLM)ベンチマークとその意味的な重複を特徴付けるために,キャパシティ親しみやすさのシグネチャを開発する。
本分析は,ベンチマーク質問の意味的類似性とモデル性能の相関性の両方に関して,シグネチャを定式化したものである。
最終的には、論理、数学、言語、命令追従、世界モデリングにまたがるクロスファンクショナルオーバーラップを識別し、コーディングが最重複の少ないドメインとして現れます。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 20:23:13 GMT)
Hybrid Graph Embeddings and Louvain Algorithm for Unsupervised Community Detection [8.2] 本稿では,Louvainアルゴリズムとグラフニューラルネットワーク(GNN)を統合した新しいコミュニティ検出手法を提案する。
GNNが生成したノード埋め込みを使ってLouvainアルゴリズムを拡張し、よりリッチな構造情報と特徴情報をキャプチャする。
拡張されたルーヴァンアルゴリズムの結果を洗練するためのマージングアルゴリズムを導入し、検出されたコミュニティの数を減らす。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:57:51 GMT)
Disentangling Static and Dynamic Information for Reducing Static Bias in Action Recognition [7.9] 行動認識モデルは、動的な人間の動きよりも静的な手がかりに過度に依存している。
このバイアスは、現実世界のアプリケーションにおけるパフォーマンスの低下とゼロショットアクション認識につながる。
本研究では,静的シーン情報から時間的動的情報を分離することで,静的バイアスを低減する手法を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:03:41 GMT)
3DPCNet: Pose Canonicalization for Robust Viewpoint-Invariant 3D Kinematic Analysis from Monocular RGB cameras [7.9] 3DPCNetは3Dジョイント座標で直接動作するコンパクトな推定器に依存しないモジュールである。
本手法は,地中構造IMUセンサデータと強い視覚的対応を示すビデオから加速度信号を生成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:55:21 GMT)
Skill, Will, or Both? Understanding Digital Inaccessibility from Accessibility Professionals' Viewpoint [7.9] 世界の上位100万のウェブサイトの4.1%しかアクセスできない。
検出可能なWebコンテンツアクセシビリティガイドライン(WCAG)の失敗によるWebページの割合は、過去5年間でわずか1.9%減少している。
本研究の目的は、アクセシビリティの専門家の視点から、デジタルアクセシビリティの状況に関する最新の視点を提供することである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:00:25 GMT)
Vision Language Models are Biased [7.8] 大規模言語モデル(LLM)は、ダウンストリームタスクにおいて、インターネットから大量の事前知識を記憶する。
一般的な主題に関する知識が視覚言語モデル(VLM)の標準的視覚的タスクにおける精度をいかに損なうかを検証する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:57:13 GMT)
The Matthew Effect of AI Programming Assistants: A Hidden Bias in Software Evolution [7.8] 私たちは、AI支援プログラミングがソフトウェアエコシステムとどのように相互作用するかを調べるために、何千ものアルゴリズムプログラミングタスクと何百ものフレームワーク選択タスクで大規模な実験を行います。
プログラミング言語やフレームワークが普及すればするほど、LLM生成コードの成功率が高くなります。
この現象は、AIシステムが既存の人気階層を強化し、多様性とイノベーションを妨げる一方で、支配的なツールへの収束を加速する可能性を示唆している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:30:17 GMT)
ModelNet40-E: An Uncertainty-Aware Benchmark for Point Cloud Classification [7.7] 合成LiDARのような雑音下での点雲分類モデルのロバスト性および校正性を評価するための新しいベンチマークであるModelNet40-Eを紹介する。
我々は、分類精度、校正基準、不確実性認識を用いて、PointNet、DGCNN、Point Transformer v3-across multiple noise levelsの評価を行った。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:35:24 GMT)
Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness [7.6] 本稿では,トランスフォーマーベースの予測フレームワークであるChannelTokenFormerを提案する。
公開ベンチマークデータセットと1つのプライベートな実世界の産業データセットの実験は、ChannelTokenFormerの優れた堅牢性と正確性を示している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 05:49:48 GMT)
DASICS White Paper: Enhancing Memory Protection with Dynamic Compartmentalization [7.6] 本稿では,DASICS (Dynamic in-Address-Space isolation by Code Segments) のセキュアプロセッサ設計について述べる。
複数の特権レベルにわたる動的で柔軟なセキュリティ保護、データフロー保護、制御フロー保護、セキュアなシステムコールを提供する。
我々は,DASICSをベースとしたハードウェアFPGAプロトタイプとソフトウェアQEMUシミュレータのプロトタイプを実装し,適応性のためのシステムソフトウェアを改良した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 05:44:41 GMT)
Learning without Global Backpropagation via Synergistic Information Distillation [7.0] SID(Synergistic Information Distillation)は、ディープラーニングを局所的な協調的精錬問題のカスケードとして再構成する新しいトレーニングフレームワークである。
SIDでは、深層ネットワークはモジュールのパイプラインとして構成され、それぞれに局所的な目的を課し、地上目標に対する確率論的信念を洗練させる。
モジュール間の下位依存関係を分離することにより、SIDは並列トレーニングを可能にし、更新ロックを排除し、メモリ要求を大幅に削減する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:28:14 GMT)
Patch Rebirth: Toward Fast and Transferable Model Inversion of Vision Transformers [6.7] パッチ再生インバージョン(Patch Re birth Inversion, PRI)は、インバージョンプロセスにおいて最も重要なパッチを段階的に切り離す新しいアプローチである。
PRIは標準のDense Model Inversionよりも最大10倍高速なインバージョンを実現している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:35:44 GMT)
MELCOT: A Hybrid Learning Architecture with Marginal Preservation for Matrix-Valued Regression [6.7] 本稿では,従来の機械学習に基づくMarginal Estimation(ME)ブロックと,ディープラーニングに基づくLearningable-Cost Optimal Transport(LCOT)ブロックを統合するハイブリッドモデルMELCOTを提案する。
多様なデータセットやドメインにわたる実験では、MELCOTは高い効率を維持しながら、すべてのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:02:52 GMT)
Socio-Economic Model of AI Agents [6.3] 資源制約下でのAIコラボレーションが社会的なアウトプットに及ぼす影響について検討する。
AIエージェントの導入は、社会全体のアウトプットを大幅に増加させる可能性がある。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:56:48 GMT)
UltraUNet: Real-Time Ultrasound Tongue Segmentation for Diverse Linguistic and Imaging Conditions [6.3] UltraUNetは、リアルタイム舌輪郭分割に最適化された軽量エンコーダデコーダアーキテクチャである。
毎秒250フレームを実現し、デノナイジングやブラーシミュレーションなどの超音波特有の拡張を統合している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:11:33 GMT)
PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [6.3] 本稿では,基本関数から発生する時間的カーネルを含むPLEIA(Lynomial Expansion In Adaptive Distributed Event Systems)というニューラルネットワークのクラスを紹介する。
低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:46:38 GMT)
Decrypt Modality Gap in Multimodal Contrastive Learning: From Convergent Representation to Pair Alignment [6.3] マルチモーダルコントラスト学習は、異なるモーダルからのデータを共有埋め込み空間に埋め込むことを目的としている。
実験的な証拠は 異なるモダリティの表現が 埋め込み空間の 完全に別々の領域を占めることを示している
本稿では,MCLの収束最適表現とトレーニング最適化時のモーダリティアライメントを解析するための最初の理論的枠組みを紹介する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:21:00 GMT)
Effective Quantization of Muon Optimizer States [6.3] ブロックワイド量子化を用いた8ビットミューオンを導入し,線形スキームと動的スキームの両方をサポートする。
8ビットのMuonは、両方の安定性を維持しつつ、フル精度のMuonに比べてメモリフットプリントが74%削減されていることを実証した。
大規模な実験では、8ビットのMuonがMuonのパフォーマンスと密に一致し、AdamWと8ビットのAdamWが4B FineWebトークン上で1.6Bモデルの事前トレーニングを行う。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:31:11 GMT)
Learning single index model with gradient descent: spectral initialization and precise asymptotics [6.1] 十分なサンプルサイズを持つ学習問題に対して、良質なデータを持つ真の信号の周りには領域が存在することを示す。
多くの変数によって動機付けられ、広く使われている戦略は、2段階のアルゴリズムであり、まずスペクトル勾配降下を適用する。
我々は、検索のための正規化ウィチンガーフローの例で、我々の一般的な理論を実証する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 23:27:24 GMT)
MoQE: Improve Quantization Model performance via Mixture of Quantization Experts [6.0] Mixture of Quantization Experts(略称:MoQE)は、Mixture-of-Expertsアーキテクチャに基づく量子化推論フレームワークである。
MoQEは1つの完全精度モデルの複数の量子化変種を「量子化の専門家」として結合する
我々は,MQEがSOTA量子化モデルに匹敵する性能を達成できることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:46:35 GMT)
Better Hessians Matter: Studying the Impact of Curvature Approximations in Influence Functions [5.9] 制御された分類環境におけるヘッセン近似品質が影響関数属性に及ぼす影響について検討した。
実験の結果, ヘッセン近似の精度は一貫して, スコアの品質に優れた結果が得られた。
さらに,近年のヘッセン近似法の近似ステップを分解し,各ステップが帰属精度に与える影響を評価する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:12:35 GMT)
EKF-Based Fusion of Wi-Fi/LiDAR/IMU for Indoor Localization and Navigation [5.9] そこで我々は,Wi-Fi RSSI フィンガープリント,LiDAR を用いた同時ローカライゼーションとマッピング(SLAM),慣性計測ユニット(IMU)ナビゲーションを統合した新しいフレームワークを提案する。
具体的には、ディープニューラルネットワーク(DNN)ベースのWi-Fi RSSIフィンガープリントによる粗い局所化をIMUベースの動的位置決めによって改善する。
Xi'an Jiaotong-Liverpool大学のIRビルで実施された実験により,提案したマルチセンサ融合フレームワークが個々のアプローチによる不安定性を抑制することが実証された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:59:04 GMT)
Reconstruct Anything Model: a lightweight foundation model for computational imaging [5.9] 本稿では,フォワード演算子(取得物理とノイズパラメータ)に関する知識を,アンローリングに頼ることなく組み込んだ非定性軽量アーキテクチャを提案する。
本モデルは,デブロアリング,磁気共鳴イメージング,トモグラフィ,インパインティング,超解像といった,幅広い逆問題を解決するために訓練されている。
提案したモデルは、いくつかの微調整ステップで見つからない逆問題やデータセットに容易に適応できる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:29:14 GMT)
The Geometry of Creative Variability: How Credal Sets Expose Calibration Gaps in Language Models [5.6] 本稿では,ニューラルテキスト生成における不確実性を定量化し,分解するための幾何学的枠組みを提案する。
私たちは、500のクリエイティブな文章のプロンプトを10の調整された人間の継続で分析し、10万のストーリーを生成します。
我々のクレダルセット分析では、人間の創造性の変化を捉え、最良のモデルと人間のキャリブレーションはわずか0.434に達する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:52:03 GMT)
GuardNet: Graph-Attention Filtering for Jailbreak Defense in Large Language Models [5.6] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃の影響を受けやすくなっている。
これらの攻撃はLLM出力の安全性、信頼性、信頼性を損なう。
推論に先立ってjailbreakプロンプトを検出しフィルタする階層的なフィルタリングフレームワークであるGuardNetを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 01:21:12 GMT)
SDQ-LLM: Sigma-Delta Quantization for 1-bit LLMs of any size [5.2] 大規模言語モデル(LLM)は、計算とメモリの問題に直面する。
SDQ-LLM: Sigma-Delta Quantization for 1-bit LLMs of any size。
SDQ-LLMの特徴は、Over-Sampling Ratio (OSR) の連続層である。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:49:58 GMT)
Increasing the Diversity in RGB-to-Thermal Image Translation for Automotive Applications [5.2] RGB-to-thermal画像変換は潜在的な解決策を提供するが、既存の手法では1対1のマッピングに重点を置いている。
コンポーネント認識適応インスタンス正規化(CoAdaIN)により強化されたマルチモーダル翻訳フレームワークを用いた一対多マッピングを提案する。
その結果、より現実的で多様な熱画像の翻訳が可能になった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:49:56 GMT)
Optimal and Provable Calibration in High-Dimensional Binary Classification: Angular Calibration and Platt Scaling [5.1] テキスト重みは、推定器$hatw$と真の線形重み$w_star$との角度$hatw, w_star$に依存する。
我々の研究は、高次元でのキャリブレーションと最適性の両方を満たすキャリブレーション戦略を初めて提供するものである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 05:56:20 GMT)
Perceptual Influence: Improving the Perceptual Loss Design for Low-Dose CT Enhancement [4.7] 低線量CT(Low-Dose Computed Tomography)画像を改善するためのトレーニングネットワークの強力なツールとして,知覚的損失が出現している。
知覚的影響の概念(知覚的損失項の総損失に対する相対的寄与を定量化する計量)を導入する。
以上の結果から, より優れた知覚的損失設計は, 再構成CT画像のノイズ低減と構造的忠実度を著しく向上させることが明らかとなった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:48:43 GMT)
WARBERT: A Hierarchical BERT-based Model for Web API Recommendation [4.6] WARBERTは、Web APIレコメンデーションのための階層的なBERTベースのモデルである。
WARBERTはデュアルコンポーネント機能融合とアテンション比較を利用して、APIとマッシュアップ記述の正確な意味表現を抽出する。
WARBERTは既存のソリューションと比較して最大11.7%の改善を実現している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:09:41 GMT)
Seeing Symbols, Missing Cultures: Probing Vision-Language Models' Reasoning on Fire Imagery and Cultural Meaning [4.3] VLM(Vision-Language Models)は、しばしば文化的に有能に見えるが、実際の文化的理解よりも表面的なパターンマッチングに依存している。
本稿では,火災をテーマとした文化イメージに基づくVLM推論を,分類解析と説明解析の両方を通して探究するための診断枠組みを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:56:12 GMT)
Estimating the strength and timing of syntactic structure building in naturalistic reading [4.3] 句構造がカテゴリー検出に先行し,語彙的影響を支配できることを示す。
これらの知見は、理解の予測的「ツリー・スキャフォールディング」を裏付けるものである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:56:12 GMT)
CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems [4.3] 我々は,過去のタスクのパフォーマンスを犠牲にすることなく,ウェアラブルセンサモデルを継続的に更新できるフレームワークであるCLAD-Netを提案する。
CLAD-Netは、長期記憶として機能する自己教師型トランスフォーマーと、知識蒸留による活動分類を訓練した教師型畳み込みニューラルネットワーク(CNN)を統合する。
PAMAP2では、CLAD-Netの最終的な精度は91.36パーセント、リプレイは8.78パーセントで、メモリベースと正規化ベースのベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:15:44 GMT)
PDE-Transformer: A Continuous Dynamical Systems Approach to Sequence Modeling [4.2] 本稿では,変圧器の離散層構造をPDE(Master partial Differential Equation)が支配する連続の力学系として再認識する新しい解析フレームワークを提案する。
PDEシミュレータと標準トランスフォーマーを比較することで,本実験は本研究の中心的論文の説得力のある実証的証拠を提供する。
我々の発見は、数学的基本安定化器は、実際には、他の方法では強力だが本質的に不安定な連続系をテームするのに必要となる数学的基本安定化器であることを示している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:58:47 GMT)
Do We Need Large VLMs for Spotting Soccer Actions? [4.2] 我々は、このビデオ中心のアプローチからテキストベースのタスクへのシフトを提案し、軽量でスケーラブルにする。
我々は、リッチな説明や文脈的な手がかりを提供する専門家の注釈書には、マッチにおける重要なアクションを確実に見つけ出すのに十分な情報が含まれていると仮定する。
実験の結果、この言語中心のアプローチは、最先端のビデオベースのスポッターに近づいた重要なマッチングイベントを検出するのに効果的であることがわかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:21:30 GMT)
Room-temperature quantum entanglement in a van der Waals material [4.0] 2D van der Waals (vdW) 材料中の量子ビットのエンタングは依然として解明されていない。
我々は、光アドレス可能な電子スピンと13ドルC原子核スピンとの室温量子絡みをhBNで報告する。
これらの結果は、2次元材料に基づく先進量子技術の堅牢なプラットフォームとしてhBNに絡み合ったスピン量子ビットを確立する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:02:06 GMT)
Dense associative memory on the Bures-Wasserstein space [4.0] DAMを2-ワッサーシュタイン距離を備えた確率分布に拡張する。
本フレームワークは,記憶された分布上の対数sum-expエネルギーと最適輸送マップを集約する検索ダイナミックスを定義する。
この研究は、ベクトルから完全分布への連想記憶を高め、現代の生成モデルで古典的DAMをブリッジし、メモリ拡張学習における分布記憶と検索を可能にする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:17:02 GMT)
FracDetNet: Advanced Fracture Detection via Dual-Focus Attention and Multi-scale Calibration in Medical X-ray Imaging [3.9] FracDetNet - Dual-Focus Attention (DFA)とMulti-scale (MC)を統合したフラクチャー検出フレームワーク
DFAは、グローバル・アテンション・メカニズムとローカル・アテンション・メカニズムを組み合わせて、詳細な地域特徴と包括的グローバル・コンテクストを捉えている。
MCは特徴表現を適応的に洗練し、検出性能を向上させる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 17:15:55 GMT)
Learning How to Use Tools, Not Just When: Pattern-Aware Tool-Integrated Reasoning [3.8] 我々は、直接計算にコードを使用する計算機パターンと、問題をプログラムとしてエンコードするアルゴリズムパターンの2つの共通パターンを識別する。
まず、両方のパターンからコードコンピテンスを構築し、パターン選択と教師の好みを一致させる2段階のフレームワークを提案する。
難解な数学データセット全体にわたって、パターン認識手法はコードの使用率と精度を大幅に改善する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:10:37 GMT)
Confidence-Calibrating Regularization for Robust Brain MRI Segmentation Under Domain Shift [3.6] 軽量適応フレームワークである textbfCalSAM を提案する。
これは、EmphFeature Fisher Information Penalty (FIP)を介して、ドメインシフトに対するエンコーダの感度を低下させ、EmphConfidence Misalignment Penalty (CMP)を通して、自信過剰なVoxel-wiseエラーを罰する。
クロスセンターとスキャナシフトの評価では、CalSAMは精度とキャリブレーションを大幅に改善する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:12:12 GMT)
Global Beats, Local Tongue: Studying Code Switching in K-pop Hits on Billboard Charts [3.5] そこで本研究では,K-popの楽曲におけるコードスイッチングと英語の歌詞使用がグローバルチャートの成功に果たす役割について検討する。
2017年から2025年にかけて、Billboard Hot 100とGlobal 200チャートに登場したKポップ曲のデータセットがコンパイルされた。
男性も女性も高いコードスイッチングと英語使用率を示しており、Kポップのグローバルなチャートリングの言語的景観は英語が支配的であることが判明した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:05:28 GMT)
A Structured Framework for Evaluating and Enhancing Interpretive Capabilities of Multimodal LLMs in Culturally Situated Tasks [3.5] 本研究では,現在主流となっているビジュアル言語モデル(VLM)の機能と特性を検証し,評価することを目的とする。
われわれはまず中国絵画評論の定量的枠組みを考案した。
この枠組みは, 評価的姿勢, 特徴焦点, 解説的品質を含む多次元的評価的特徴を, 人間の専門家の批判から抽出することによって構築された。
実験的な設計は、様々な視点から批評を生成するVLMの能力を評価するためのペルソナ誘導のプロンプトを含んでいた。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:41:51 GMT)
Enhanced Fracture Diagnosis Based on Critical Regional and Scale Aware in YOLO [3.4] 本研究では,新しいCRSelector(Critical-Region-Selector Attention)とScA(Scale-Aware)のヘッドを統合し,検出性能の向上を図る。
実験により, ベースラインモデルと比較して, mAP50とmAP50-95が4と3に増加し, 最新技術(SOTA)の性能が向上した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:53:15 GMT)
Comparison of Scoring Rationales Between Large Language Models and Human Raters [3.4] 本研究では,評価の不整合性の原因を明らかにするために,人間とLLMラッカーの理性について検討した。
大規模試験から得られたエッセイを用いて, GPT-4o, Geminiおよびその他のLLMの評価精度を検討した。
コサイン類似性は、与えられた有理量の類似性を評価するために用いられる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:58:51 GMT)
Efficient Self-Supervised Adaptation for Medical Image Analysis [3.3] 自己監督適応(SSA)は、基礎モデルの医療領域への移行を改善するが、計算的に禁止されている。
本研究では,パラメータ効率のよい微調整手法をSSAに適用した,効率的な自己教師付き適応(ESSA)を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 12:13:56 GMT)
Impact of Environmental Factors on LoRa 2.4 GHz Time of Flight Ranging Outdoors [3.3] LoRa 2.4 GHzと呼ばれるLoRaの新しい派生型がSemtechによって提案され、無線周波数(RF)の飛行時間(ToF)をメートルレベルのローカライゼーションの手法として提供する。
簡単なディープニューラルネットワーク(DNN)モデルに基づく予備調査の結果、温度と湿度を含む環境要因が範囲の精度に大きく影響していることが示されている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 05:07:45 GMT)
Learning Regional Monsoon Patterns with a Multimodal Attention U-Net [3.1] 高分解能降水分類のための多モード深層学習フレームワークを提案する。
インド5州に対する新しい1km解像度データセットをキュレートする。
当社のフレームワークは,単調なベースラインや既存のディープラーニング手法よりも一貫して優れています。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:48:30 GMT)
An Investigation into the Performance of Non-Contrastive Self-Supervised Learning Methods for Network Intrusion Detection [3.0] 本稿では,3つのエンコーダアーキテクチャと6つの拡張戦略を用いて,5つの非コントラスト型自己教師学習手法の性能を比較した。
各自己教師型モデルに対して、エンコーダアーキテクチャと拡張法の組み合わせにより、最大平均精度、リコール、F1スコア、AUCROCが得られた。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 12:36:17 GMT)
Mask What Matters: Controllable Text-Guided Masking for Self-Supervised Medical Image Analysis [2.7] Mask What Mattersは、自己監督型医療画像分析のためのコントロール可能なテキスト誘導マスキングフレームワークである。
既存のMIM法を一貫して上回り、分類精度で最大3.1ポイントの利得を得る。
これらの改善は、全体のマスキング比を著しく低くする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:26:56 GMT)
Tracking Quantum State Collapse/Decoherence in Real Time via a Superposition Trap [2.4] 重ね合わせトラップと呼ばれる機構を用いて,量子状態の崩壊とデコヒーレンスをリアルタイムで予測する新しい手法を提案する。
このアプローチは、量子力学における連続性方程式を利用して、空間的にコヒーレントな重ね合わせのみを閉じ込める構成を設計する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:24:11 GMT)
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model [2.3] 本研究では、アクセス可能なオンラインデータを活用することで、小規模言語モデルにおける医療知識の強化について検討する。
我々は、キュレートされたデータを用いてベースラインモデルを微調整し、その医療的知識を改善した。
ベンチマーク評価により, 微調整モデルにより, 医療質問応答の精度が向上することが示された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:54:27 GMT)
Threshold Signatures for Central Bank Digital Currencies [2.2] CBDCは、取引の真正性と整合性に関する署名に依存しており、秘密鍵の妥協の場合、大きな問題に繋がる。
本研究は、CBDCの文脈におけるしきい値シグネチャスキーム(TSS)について検討する。
TSは分散キー管理と署名を可能にし、妥協されたキーのリスクを低減する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:48:30 GMT)
A Near-Cache Architectural Framework for Cryptographic Computing [2.2] ポスト量子暗号アルゴリズムは、公開鍵と署名を使い、前量子暗号で使われるものよりも3〜9ドル長い。
私たちの分析で明らかになった重要なボトルネックは、キャッシュ帯域幅です。
この制限は、オンチップイン/ニアキャッシュコンピューティングの採用を動機付けている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:15:17 GMT)
AI Education in Higher Education: A Taxonomy for Curriculum Reform and the Mission of Knowledge [2.2] 我々は、最も簡潔な課題はカリキュラムと学際的な目的のレベルにあると主張している。
我々は、研究、カリキュラム、教育、教員の専門知識の相互作用を通じて、規律がどのように進化していくかを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:22:58 GMT)
MimiTalk: Revolutionizing Qualitative Research with Dual-Agent AI [1.8] 我々は、社会科学研究におけるスケーラブルで倫理的な会話データ収集のために設計された、二重エージェントの立憲AIフレームワークであるMimiTalkを紹介する。
研究1では,20名の被験者によるユーザビリティの評価を行い,研究2では121名のAIインタビューをメディアサムデータセットからの1271名の人間インタビューと比較した。
その結果,MimiTalkはインタビューの不安を軽減し,会話のコヒーレンスを維持し,情報豊かさ,コヒーレンス,安定性において人間のインタビューを上回っていることがわかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:02:50 GMT)
New Insights and Algorithms for Optimal Diagonal Preconditioning [1.8] 我々は,対角的プレコンディショニング問題を解決するために,保証付き競争力のある下位段階法を開発した。
提案手法は,既存のSDP手法よりも線形システムの解法が優れていることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:16:21 GMT)
Transfer Learning and Machine Learning for Training Five Year Survival Prognostic Models in Early Breast Cancer [1.8] 機械学習、転送学習は、堅牢な予後フレームワークを構築する機会を提供する。
乳がんにおける生存予後の改善には,de-novo MLとの比較,事前訓練した予後ツールからの移行学習,アンサンブル統合が有用である。
本研究では,PreDICT v3の関連情報が不足している状況やデータセットシフトの可能性が低い状況において,トランスファーラーニング,デノボRSF,アンサンブル統合が予後を向上させることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:49:55 GMT)
Targeted perturbations reveal brain-like local coding axes in robustified, but not standard, ANN-based brain models [1.6] 現代のANNベースの脳モデルのほとんどは、予期しないほど脆弱であることを示す。
我々の研究は、局所的な表現幾何学が脳モデル評価に強い基準を与えることを示している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:39:36 GMT)
From Human Annotation to Automation: LLM-in-the-Loop Active Learning for Arabic Sentiment Analysis [1.5] 注釈を補助し、その性能を人間のラベルと比較する大規模言語モデル(LLM)は、アラビア語の文脈ではいまだに探索されていない。
ハイパフォーマンスを維持しつつアノテーションコストを削減するためにアラビア感情分析のための能動的学習フレームワークを提案する。
GPT-4o for Hunger Station、Claude 3 Sonnet for AJGT、DeepSeek Chat。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:23:46 GMT)
ICS-SimLab: A Containerized Approach for Simulating Industrial Control Systems for Cyber Security Research [1.4] ICS-SimLabは、Dockerコンテナ化技術を使用してICSシミュレーション環境を作成するエンドツーエンドソフトウェアスイートである。
我々は、ソーラーパネルのスマートグリッド、水筒充填施設、インテリジェント電子機器システムという3つの仮想ICSシミュレーションを提示する。
我々は、これらのシミュレーションでサイバー攻撃を行い、IDS開発に使用される悪意のある、良質なネットワークトラフィックのデータセットを構築した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:39:54 GMT)
JAX-MPM: A Learning-Augmented Differentiable Meshfree Framework for GPU-Accelerated Lagrangian Simulation and Geophysical Inverse Modeling [1.4] 本稿では,物質点法(MPM)に基づくメッシュフリー解法 JAX-MPM を提案する。
この解法はユーレリア・ラグランジアン・ハイブリッドの枠組みを採用し、大きな変形、摩擦接触、材料挙動を捉える。
JAX-MPMは、そのタイムステッピングソルバを介して、効率的な勾配ベースの最適化を可能にする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:33:27 GMT)
Don't Trust Generative Agents to Mimic Communication on Social Networks Unless You Benchmarked their Empirical Realism [1.4] 我々は,大規模言語モデルを用いて,ソーシャルネットワーク利用者の行動の再現に重点を置いている。
我々は、英語とドイツ語でユーザ動作を模倣する様々なアプローチを経験的にテストした。
本研究は, シミュレーション部品が装着された環境で測定された経験的現実性によって, 社会シミュレーションを検証すべきであることを示唆している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 12:46:26 GMT)
The Impact of Role Design in In-Context Learning for Large Language Models [1.3] In-context Learning (ICL) により、Large Language Models (LLM) は、追加の微調整なしでプロンプトに基づいて予測を生成することができる。
本研究では, OpenAI の GPT-3.5 と GPT-4o と Meta の Llama2-7b と Llama2-13b を用いたゼロショットおよび少数ショット学習シナリオにおける役割構成の影響について検討した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 21:15:30 GMT)
Evaluating point-light biological motion in multimodal large language models [1.2] 点灯ディスプレイ(PLD)が示すように、人間は最小限の視覚的手がかりから情報を抽出する
本稿では,人間のPLDからMLLMのアクション処理を評価する最初のベンチマークであるActPLDを紹介する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:33:05 GMT)
Mind the Links: Cross-Layer Attention for Link Prediction in Multiplex Networks [1.2] 多重グラフは共有ノード間の多様な関係をキャプチャする。
ほとんどの予測器は層を崩壊させるか、独立して扱う。
マルチビューエッジ分類として多重化リンク予測を行う。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:55:15 GMT)
AI-Based Stroke Rehabilitation Domiciliary Assessment System with ST_GCN Attention [1.1] ホームベースのリハビリテーション・エクササイズ・フィードバックシステムを提案する。
本システムは,(1)RGB-Dカメラとウェアラブルセンサを備えたハードウェア構成により,ストロークの動きを捉え,(2)運動指導用モバイルアプリケーション,(3)評価とフィードバックのためのAIサーバから構成される。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:45:56 GMT)
Streamline pathology foundation model by cross-magnification distillation [1.0] ファンデーションモデル(FM)は、計算病理を変容させたが、臨床展開では計算が禁じられている。
本稿では, コース磁化蒸留により開発された軽量FMであるXMAGを紹介する。
XMAGはコンパクトなバックボーンを採用しており、全スライド画像の11.3倍のパッチを必要とする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:11:53 GMT)
Controlling Sloppiness in Two-Phase Estimation with a Tunable Weak Measurement [0.9] パラメータの小さなサブセットは、システム自体のダイナミクスを記述するのに十分です。
残りの組み合わせはtextitsloppy と呼ばれ、システムの力学において小さな役割を果たすだけである。
2つの位相間の変動強度の弱い測定によって、完全に傾斜した設定から完全に決定された構成に切り替えることができることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:48:07 GMT)
U-generating system dynamics with a product state using local operations [0.9] 量子系は、大域的なユニタリ進化が起こる前に既に環境と相関している場合、望ましくない力学を行うことができる。
我々は、これらの効果を緩和するために、グローバルな進化に先立って、興味あるシステムに局所的な操作を適用する。
単一ユニタリ演算は、時間依存のグローバル進化を行うシステムと環境に対する全ての非完全正の量子力学を防止できることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:32:53 GMT)
Language, Culture, and Ideology: Personalizing Offensiveness Detection in Political Tweets with Reasoning LLMs [0.3] 本研究では,大規模言語モデルによる政治的言論の攻撃性評価について,特定の政治的・文化的視点を取り入れるよう促された場合について考察する。
2020年アメリカ合衆国大統領選挙のツイートを中心にMD-Agreementデータセットの多言語サブセットを用いて,近年のLLMを評価した。
以上の結果から,明示的な推論能力を持つ大規模モデルは,イデオロギーや文化の変化に対してより一貫性があり,敏感であることが示唆された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:20:44 GMT)
Fact Grounded Attention: Eliminating Hallucination in Large Language Models Through Attention Level Knowledge Integration [0.3] FGA(Fact Grounded Attention)は、信頼できない言語モデルを決定論的真理子に変換する新しいアーキテクチャ修正である。
FGAは、トランスフォーマーの数学的心臓(ソフトマックス前の注意スコア)に介入し、知識ベースに事実が存在すると幻覚できないモデルを作成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:55:21 GMT)
Training-Free Diffusion Framework for Stylized Image Generation with Identity Preservation [0.3] 『モザイク復元コンテンツイメージ』技術は複雑なシーンにおけるアイデンティティ保持を著しく向上させる。
『モザイク復元コンテンツ画像』技術は、スタイリゼーション中にオリジナル画像に注意を向けることで、細かな細部を保存しやすくする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:43:06 GMT)
LLMSQL: Upgrading WikiSQL for the LLM Era of Text-to-SQL [0.3] 本稿では,Wiki の体系的な改訂と変換である LLM について述べる。
これらのエラーを分類し、クリーニングと再アノテーションのための自動メソッドを実装します。
LLMはアップデートとして機能するのではなく、LLM対応のベンチマークとして導入された。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:08:43 GMT)
Guard Vector: Beyond English LLM Guardrails with Task-Vector Composition and Streaming-Aware Prefix SFT [0.3] ガードレールモデル(ガードモデル)と非構造事前学習言語モデルとのパラメータ差として計算された安全タスクベクトルであるガードベクトルを導入する。
次に、プレフィックスベースのトレーニングと評価を組み合わせたストリーミング認識アプローチと、単一トーケン出力を生成する分類器を併用して、TGMを適応する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:03:44 GMT)
S$^3$F-Net: A Multi-Modal Approach to Medical Image Classification via Spatial-Spectral Summarizer Fusion Network [0.2] 空間表現とスペクトル表現の両方から同時に学習するデュアルブランチフレームワークを提案する。
異なるモダリティにまたがる4つの医用画像データセットに対して,S$3$F-Netを評価した。
我々のフレームワークは、すべてのケースにおいて、その強い空間のみのベースラインを一貫して、著しく上回ります。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:18:39 GMT)
Spatio-temporal, multi-field deep learning of shock propagation in meso-structured media [0.2] 我々は,多分野深層学習モデル (MSTM) を導入し, 連続した7つの場圧, 密度, 温度, エネルギー, 物質分布, および2つの速度成分を1つの自己回帰的サロゲートに統一する。
MSTMは多孔質と建築構成の非線形ショック駆動力学を捉え、それぞれ1.4%と3.2%の平均誤差を達成し、3桁以上のスピードアップを達成している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:27:33 GMT)
Dynamics of Learning: Generative Schedules from Latent ODEs [0.1] ニューラルネットワークのトレーニング性能を動的システムとしてモデル化する新しい学習率スケジューラを提案する。
本手法は計算効率が高く,一般化に依存しないものであり,ML実験追跡プラットフォーム上に容易に階層化することができる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 02:20:18 GMT)
Hard Examples Are All You Need: Maximizing GRPO Post-Training Under Annotation Budgets [0.1] 最も難しい例(ベースモデルが最も失敗する部分)の10%をトレーニングすると、劇的なパフォーマンスが最大47%向上する。
ハードサンプルは、AIME2025ベンチマークで有意義な利得を達成しているのは、ハードトレーニングされたモデルのみである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:19:30 GMT)
Optimization Strategies for Variational Quantum Algorithms in Noisy Landscapes [0.1] 変分量子アルゴリズム(VQA)は、短期量子コンピューティングにおける主要なアプローチである。
我々は変分量子ソルバ(VQE)のための50以上のメタヒューリスティックアルゴリズムをベンチマークした。
その結果、ノイズの多いVQEのための小さなレジリエントアルゴリズムを特定し、短期量子デバイス上での最適化戦略のガイダンスを提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:39:45 GMT)
Beyond the Prompt: Gender Bias in Text-to-Image Models, with a Case Study on Hospital Professions [0.0] 本稿では,Hunyuan Image 2.1,HiDream-I1-dev,Qwen-Image,FLUX.1-dev,Stable-Diffusion 3.5 Large,Stable-Diffusion-XLの6つの最先端オープンウェイトモデルにおける性別表現について検討する。
全てのモデルで女性や外科医が主に男性として看護婦を生産しています。
この結果は、バイアス認識設計、バランスの取れたデフォルト、およびAI生成における作業ステレオタイプの強化を防ぐためのユーザガイダンスの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:18:46 GMT)
Ultrafast Single-Qubit Gates in the Diabatic Regime [0.0] 本稿では,アダバティック・アダバティック・アダバティック・アダバティック・アダバティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・ア
その結果, ダイアバト政権における超短パルスは, 標準RWA条件下で得られたものと同等の忠実性が得られることがわかった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:29:32 GMT)
Ultra-narrow homogeneous linewidths of erbium-doped silica glass fibers at millikelvin temperatures: magnetic field and temperature dependence [0.0] エルビウムドープシリカファイバー(EDF)はその可用性、使いやすさ、既存の光ファイバーインフラとのシームレスな統合で際立っている。
我々は,0.09Tの最適磁場で,約8kHzの有効均一線幅を約7mKで観測した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:40:41 GMT)
Trainable Reference-Based Evaluation Metric for Identifying Quality of English-Gujarati Machine Translation System [0.0] 我々はグジャラティの基準に基づくMT評価指標を導入した。
トレーニングに25のフィーチャを使用する2つのバージョンのメトリックをトレーニングしました。
その結果, 測定値の相関性は良好であることが判明した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:05:15 GMT)
Towards Quantum-Ready Blockchain Fraud Detection via Ensemble Graph Neural Networks [0.0] グラフ畳み込みネットワーク(GCN)、グラフ注意ネットワーク(GAT)、グラフ同型ネットワーク(GIN)を統合したアンサンブルフレームワークを提案する。
実世界の楕円型データセットを用いて、調整されたソフト投票アンサンブルは、1%未満の偽陽性率を維持しながら不正取引の高いリコールを実現する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:17:23 GMT)
TRAX: TRacking Axles for Accurate Axle Count Estimation [0.0] 我々は,高密度環境下での軸数計測のためのエンドツーエンドのビデオベースパイプラインを提案する。
本システムでは、YOLO-OBBとYOLO-OBBの組み合わせで車両を検知・分類し、タイヤを検知する。
フレーム間の軸関係の特徴を追尾するTRAX(Tire and Axle Tracking)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:04:06 GMT)
Steering Prepositional Phrases in Language Models: A Case of with-headed Adjectival and Adverbial Complements in Gemma-2 [0.0] 本研究の目的は,前置詞の生成を解明し,制御することである。
単一アテンションヘッドの値ベクトルをスケールすることにより、補体の機能的役割の分布を33%に減らし、属性を36%に高めることができる。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 09:27:40 GMT)
Not All Explanations are Created Equal: Investigating the Pitfalls of Current XAI Evaluation [0.0] XAIは、モデルの説明を人間ユーザに提供することによって、現代的なAIモデルに透明性を提供することを目指している。
この分野で行われたほとんどの研究は、説明なしと提案されたソリューションが生み出すものの違いを分析するために、簡単なユーザサーベイを実施している。
品質や正確性に関わらず、ほとんどの説明はユーザの満足度を高めるでしょう。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:30:38 GMT)
Nonperturbative Formulation of Resonances in Quantum Mechanics Based on Exact WKB Method [0.0] 量子力学における準定常状態について, Wentzel--Kramers--Brillouin (WKB) 解析を非摂動的枠組みとして用いた。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:35:08 GMT)
NeuroBridge: Using Generative AI to Bridge Cross-neurotype Communication Differences through Neurotypical Perspective-taking [0.0] 自閉症と神経型個人間のコミュニケーションの課題は、互いの異なるコミュニケーションスタイルの理解の欠如に起因する。
我々は,大規模言語モデル(LLM)を利用したオンラインプラットフォームであるNeuroBridgeを構築し,(a)直接的かつリテラルなAIキャラクタ,多くの自閉症個人に共通するスタイル,(b)交叉型通信シナリオの4つをシミュレートした。
NeuroBridgeは、自閉症の人々が言語をどう解釈するかの理解を改善し、全ての自閉症を「他人の理解を必要とする」社会的差異と表現した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:05:41 GMT)
Multifractal features of multimodal cardiac signals: Nonlinear dynamics of exercise recovery [0.0] 心電図を用いたマルチモーダルバイオシグナーを用いた運動負荷後の健常心活動の回復動態について検討した。
5つの教師付き分類アルゴリズムが評価され、小さな不均衡なデータセットの回復状態を識別した。
以上の結果から,マルチフラクタル解析とマルチモーダルセンシングを併用することにより,回復と非非線形診断法を特徴付ける信頼性の高い特徴が得られた。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 14:04:30 GMT)
More Data or Better Algorithms: Latent Diffusion Augmentation for Deep Imbalanced Regression [0.0] 多くの実世界の回帰タスクでは、データ分布は著しく歪められ、モデルは大多数のサンプルから主に学習される。
このフレームワークは、優先度ベース生成を用いた条件拡散モデルを用いて、遅延表現空間における高品質な特徴を合成する。
3つのDIRベンチマークの実験は、全体の精度を維持しながら少数地域の大幅な改善を示している。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:44:28 GMT)
Modeling Bias Evolution in Fashion Recommender Systems: A System Dynamics Approach [0.0] 推薦システムにおけるバイアスは、ユーザー体験を歪ませるだけでなく、既存の社会的ステレオタイプを永続し、増幅する。
本研究は,Fashion Recommender Systemsにおけるバイアス活性化と強化のメカニズムを動的モデリングにより解明する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 20:16:29 GMT)
Model Consistency as a Cheap yet Predictive Proxy for LLM Elo Scores [0.0] 新しい大規模言語モデル(LLM)が毎日リリースされている。パラメータ数を考えると、予想よりもはるかにパフォーマンスが良いものや悪いものもある。
モデルを評価するための現在の最良の方法は、一連のコンテストで他のモデルと比較することで、Eloのスコアを測定することです。
LLMがこのような競技の判定を依頼されたとき、マッチアップにおいて最高のモデルとしてモデルを選択する一貫性は、自作のエロスコアと91%の相関を持つ計量を生成する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:00:30 GMT)
Methods for evaluating software accessibility [0.0] より詳細で実用的なアクセシビリティ評価手法が提案されている。
Vasyl Stefanyk Precarpathian National Universityのウェブサイトのページのアクセシビリティの分析を行った。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:46:10 GMT)
Memory Management and Contextual Consistency for Long-Running Low-Code Agents [0.0] 本稿ではLCNCエージェントに特化して設計された新しいハイブリッドメモリシステムを提案する。
認知科学にインスパイアされた私たちのアーキテクチャは、エピソードとセマンティックメモリコンポーネントと、積極的な「インテリジェント・デカイ」メカニズムを組み合わせています。
鍵となるイノベーションは、LCNCパラダイムに沿ったユーザ中心の可視化インターフェースであり、非技術者のユーザがエージェントのメモリを直接管理できるようにする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 08:01:26 GMT)
Improving accuracy of tree-tensor network approach by optimization of network structure [0.0] 本研究では,関心状態における絡み合いの空間的プロファイルに応じて,TTNの構造を自動的に最適化する,ツリーテンソルネットワーク(TTN)に基づくアルゴリズムを提案する。
本稿では,アルゴリズムの性能が構造最適化の詳細な更新方式にどのように依存するかを分析する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 17:45:03 GMT)
INTRODUCTION AUX SYSTEMES QUANTIQUES NON-HERMITIQUES: PT-symétrie et pseudo Hermiticité [0.0] 近年では、非エルミート量子力学の役割の増大とともに重要な変化が起こった。
この枠組みを際立たせるのは、ハミルトニアンの固有値は、エルミートの場合と同様に、依然として実数であるということである。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 17:28:06 GMT)
Generating entangled pairs of vortex photons via induced emission [0.0] 絡み合った渦光子のペアは、量子コンピューティングと暗号への新たな応用を約束することができる。
単一光子波パケットによって誘導される2レベル原子放出によりそのような状態を生成する可能性について検討する。
我々は、誘起放出は、原子物理学実験、量子光学、量子情報科学に応用された絡み合った渦光子の源として利用できると結論付けた。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 18:10:59 GMT)
From statistical dependence to the space of possible superdeterministic theories [0.0] 統計的独立を体系的に破る物理理論は、すべて超決定論として理解されるべきである。
我々は、超決定論は自由意志とは相容れないと主張する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 01:52:48 GMT)
Fin-ExBERT: User Intent based Text Extraction in Financial Context using Graph-Augmented BERT and trainable Plugin [0.0] Fin-ExBERTは、アノテーション付き金融サービスコールからユーザ意図関連文を抽出する軽量フレームワークである。
我々は,下流の監査や質問応答に適した解釈可能な出力で,実世界の書き起こしに対して高い精度とF1性能を示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 11:20:07 GMT)
Enhancing Polyp Segmentation via Encoder Attention and Dynamic Kernel Update [0.0] ポリープセグメンテーションは大腸癌検出における重要なステップであるが、多彩な形状、サイズ、低コントラスト境界のために依然として困難である。
本稿では,動的カーネル(DK)機構をグローバルアテンションモジュールに統合することにより,セグメンテーションの精度と効率を向上させる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 21:16:09 GMT)
Enhancing Live Broadcast Engagement: A Multi-modal Approach to Short Video Recommendations Using MMGCN and User Preferences [0.0] 我々は,MMGCN(Multi-modal Graph Convolutional Networks)をユーザの好みに組み込んだ短いビデオレコメンデーションシステムを開発した。
個人の関心に合わせたパーソナライズされたレコメンデーションを提供するために,提案システムはユーザインタラクションデータ,ビデオコンテンツ機能,コンテキスト情報などを検討する。
システムの有効性を評価するために、Kwai、TikTok、MovieLensの3つのデータセットが使用されている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:20:44 GMT)
Enhancing Communication Efficiency in FL with Adaptive Gradient Quantization and Communication Frequency Optimization [0.0] Federated Learning (FL)は、参加者がサーバや他のデバイスとデータを共有することなく、ディープラーニングモデルを協調的にトレーニングすることを可能にする。
FLは、デバイスとサーバ間の頻繁なモデル更新による通信オーバーヘッドが大きいため、大きなボトルネックに直面します。
重要度を低く抑えつつ,高価値度を維持しつつ,より重要度の低い特徴を減らそうとする3つの戦略を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 17:25:44 GMT)
Efficient implementation of quantum signal processing via the adiabatic-impulse model [0.0] 量子信号処理(QSP)と断熱インパルスモデル(AIM)の類似性について検討する。
AIMは、強い外部駆動場下での2レベル量子システムの進化を効果的に記述する。
パラメータをQSPからAIMにマッピングして,非断熱・高振幅外部ドライブを用いたQSPライクな進化を実現する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:20:26 GMT)
Dynamic Josephson Junction Metasurfaces for Multiplexed Control of Superconducting Qubits [0.0] ミリケルビン(mK)温度で直接マイクロ波制御信号を生成・多重化するための時空間変調ジョセフソン接合構造を提案する。
その結果、制御パラメータによる多重周波数音の発生が示され、熱負荷と配線オーバーヘッドを最小限に抑えつつ、効率よくスケーラブルな量子ビット制御が可能となった。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 20:04:30 GMT)
Drift-Adapter: A Practical Approach to Near Zero-Downtime Embedding Model Upgrades in Vector Databases [0.0] 本稿では,モデルバージョン間の埋め込み空間をブリッジする軽量で学習可能な変換層であるDrift-Adapterを提案する。
新しいクエリをレガシな埋め込みスペースにマッピングすることで、Drift-Adapterは既存のANNインデックスの継続的な使用を可能にする。
フルインデクシングやデュアルインデクシングサービスといった運用戦略と比較して、Drift-Adapterは再計算コストを100倍以上削減し、ほぼゼロの運用中断によるアップグレードを容易にする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:47:19 GMT)
Do quantum linear solvers offer advantage for networks-based system of linear equations? [0.0] ネットワークベースの線形システム問題では、まずグラフから始まり、線形方程式の系に到達する。
指数関数的優位性(ベストグラフファミリ)を提供するグラフファミリと、サブ指数的ではあるが少なくとも優位性(グラフファミリ)を提供するグラフファミリを推奨する。
分析の範囲内では,50のグラフファミリーのうち指数関数的優位性を示すのはわずか4%であり,約20%のグラフファミリーが優位性を示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 07:57:28 GMT)
Deep Learning for Oral Health: Benchmarking ViT, DeiT, BEiT, ConvNeXt, and Swin Transformer [0.0] この研究は特に、データ不均衡のような現実世界の課題に対処することに焦点を当てた。
ConvNeXt、Swin Transformer、BEiTは信頼性の高い診断性能を示した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:17:04 GMT)
Deep Learning Approaches with Explainable AI for Differentiating Alzheimer Disease and Mild Cognitive Impairment [0.0] アルツハイマー病の早期かつ正確な診断は、効果的な臨床介入に重要である。
構造的磁気共鳴画像を用いたアルツハイマー病分類のためのハイブリッドディープラーニングアンサンブルフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 16:17:14 GMT)
Deceive, Detect, and Disclose: Large Language Models Play Mini-Mafia [0.0] ミニ・マフィア (Mini-Mafia) は、マフィアが情報のない町民と競う社会的推論ゲームである。
情報の非対称性と、実世界のマルチエージェントシナリオの理論に基づく推論への依存。
ミニマフィア(Mini-Mafia)は、マフィオーソが1つ、探偵が1つ、村人が2つ、簡易な4人組である。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 00:40:19 GMT)
Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence [0.0] コーディネート焦点として機能する最大効用を持つ解は、精度よりもエージェント間で発見可能な選択圧力がはるかに高いことを示す。
この枠組みを熱力学的コーディネート理論 (TCT) と呼び、協調には急進的な情報損失が必要であることを示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 06:16:56 GMT)
Conditional Risk Minimization with Side Information: A Tractable, Universal Optimal Transport Framework [0.0] 条件付きリスク最小化は、リスクをサイド情報に基づいて評価する必要がある高リスクな決定に発生する。
最適輸送における新しいユニオン・ボールの定式化に基づいて構築された,分布的に堅牢な条件付きリスク最小化のための普遍的枠組みを導入する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 05:22:53 GMT)
Complementarity relations for design-structured POVMs in terms of generalized entropies of order $α\in(0,2)$ [0.0] 情報エントロピーは、量子測定の不整合性を定量的に特徴づける真の方法を与える。
量子設計は現在活発な研究の対象となっている。
生成確率の制約を両側のエントロピー推定に変換する方法を示す。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 03:24:42 GMT)
Code Arcades: 3d Visualization of Classes, Dependencies and Software Metrics [0.0] フレキシブルなコード要素の編成をサポートするグループ化メカニズムを導入します。
きめ細かいソフトウェアメトリクスと粗いソフトウェアメトリクスを組み合わせて、システム特性の多面的な視点を提供します。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 13:19:56 GMT)
Bridging the Gap Between Theoretical and Practical Reinforcement Learning in Undergraduate Education [0.0] 提案手法は,従来の講義と対話型ラボベースの学習を統合している。
このフレームワークは、OpenAI Gymnasiumのようなシミュレートされた環境を使って、リアルタイムのコーディング演習を通じて学生を巻き込む。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:31:34 GMT)
Boosting Open Set Recognition Performance through Modulated Representation Learning [0.0] オープンセット認識問題は、トレーニングクラスの一部ではない新しいセマンティッククラスからテストサンプルを識別することを目的としている。
既存のOSR法では、損失関数を適用する前に、ロジットに一定のスケーリング係数(温度)を使用する。
本稿では,提案した一連の温度スケジュールを用いて,温度変調表現学習を可能にすることで,この問題に対処する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 04:30:06 GMT)
Bipartite and tripartite entanglement in pure dephasing relativistic spin-boson model [0.0] 本研究では,スピン-ボソンモデルの相対論的変種において,2と3のエミッタ間の絡み合いの発生を非摂動的に研究する。
2つのエミッタの絡み合い状態は、光円錐に非常に深い相互作用を必要とすることを示す。
我々は、Fock空間において、よく定義された基底状態を持つために、$N$-エミッターモデルの正則性条件を提供する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 10:49:20 GMT)
Bayesian and geometric analyses of power spectral densities of spin qubits in Si/SiGe quantum dot devices [0.0] パワーロースペクトルを持つ電荷ノイズは、半導体デバイスにおけるスピン量子ビットの高忠実度動作に重大な課題をもたらす。
近年, 量子ビットを分光器として用いる実験が盛んに行われている。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:49:00 GMT)
AraS2P: Arabic Speech-to-Phonemes System [0.0] AraS2P は Iqra'Eval 2025 Shared Task に提出された音声合成システムである。
Weapted Wav2Vec2-BERT via Two-Stage training strategy。
制度は、公式のリーダーボードで第1位にランクインした。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 21:25:20 GMT)
Anticoherent $k$-planes and coding techniques for a 3-qubit scheme of universal quantum computing [0.0] トポノミック量子コンピューティング(TQC)は、耐雑音性量子ゲートを構築するために、反コヒーレントな$k$平面の回転列を用いる。
本稿では,符号化手法に基づく3量子ビット系の普遍的量子計算手法を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:26:16 GMT)
An Senegalese Legal Texts Structuration Using LLM-augmented Knowledge Graph [0.0] 本研究では,セネガルの司法制度における法的テキストへのアクセスを改善するために,人工知能(AI)と大規模言語モデル(LLM)の適用について検討する。
この研究は、様々な法的文書から7,967件の論文を抽出した。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 19:51:13 GMT)
An Accelerated Newton-GMRES Method for Multilinear PageRank [0.0] マルチ線形ページランク問題は、高階マルコフ連鎖の研究において自然に生じるもので、そのような相互作用を捉えるための強力な枠組みである。
ニュートン法はこの問題に対して局所的な二次収束を達成できるが、各反復で大きな線形系を解く必要がある。
我々は、クリロフ部分空間技術を利用して、大きなヤコビ行列を明示的に形成せずにニュートンステップを近似する加速ニュートン-GMRES法を提案する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 15:45:57 GMT)
All you need is controlled-V: universality of a standard two-qubit gate by catalytic embedding [0.0] 不均等に強力な命令を含むゲート集合は、量子計算力の源を隠蔽する。
制御されたV$ゲートは単純な2量子ビットの相互作用であり、普遍的な量子普遍性を実現するのに十分である。
触媒の埋め込みと、必要な資源状態を生成する手順に基づいて、我々は標準の普遍ゲートセットを一定のオーバーヘッドでシミュレートする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 22:09:58 GMT)
Accurate Predictions in Education with Discrete Variational Inference [0.0] 有能で効果的なAI家庭教師は、スケーラブルなソリューションを提供する。
適応学習に焦点をあて、学生が正しい質問に答えるかどうかを予測する。
プロフェッショナルにマークされた形式的数学試験応答の最大オープンデータセットをリリースする。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 20:13:02 GMT)
AQuaMaM: An Autoregressive, Quaternion Manifold Model for Rapidly Estimating Complex SO(3) Distributions [0.0] AQuaMaMは、回転多様体上の複素分布を学習し、単一の前方通過におけるクエリローテーションの正確な確率を計算することができるニューラルネットワークである。
異なる回転で50,000のダイのデータセットでトレーニングされた場合、AQuaMaMはICPよりも14%高いテストログに到達する。
論文参考訳(メタデータ) (Sat, 27 Sep 2025 21:35:54 GMT)