Are Video Models Ready as Zero-Shot Reasoners? An Empirical Study with the MME-CoF Benchmark [124.0] 我々は、ビデオモデルがゼロショット推論器として機能する準備が整っているかどうかを実証研究する。
私たちは、人気の高いVeo-3に注力しています。
我々は,空間的,幾何学的,物理的,時間的,具体的論理を含む12次元にわたる推論行動を評価する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:55 GMT)
The Era of Agentic Organization: Learning to Organize with Language Models [107.4] 我々は,非同期思考(AsyncThink)を大規模言語モデルを用いた推論の新しいパラダイムとして紹介する。
実験では、AsyncThinkは並列思考に比べて28%低い推論遅延を実現している。
AsyncThinkは学習した非同期思考機能を一般化し、未確認タスクを追加のトレーニングなしで効果的に処理する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:25:10 GMT)
The Fast for the Curious: How to accelerate fault-tolerant quantum applications [101.5] 我々は、フォールトトレラント量子計算の実行時間を削減するための戦略を評価する。
ハードウェア,フォールトトレランス,アルゴリズム的サブルーチンの共設計が実行時間を短縮する方法について論じる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:27:55 GMT)
Gistify! Codebase-Level Understanding via Runtime Execution [97.6] Gistifyは、コーディング LLM が特定の機能を再現できる単一で最小限の自己完結型ファイルを作成する必要があるタスクである。
現在の最先端モデルは、Gistifyタスク、特に長時間実行のあるタスクを確実に解くのに苦労している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:58:26 GMT)
Self-Evolving Curriculum for LLM Reasoning [96.1] 自己進化カリキュラム(Self-Evolving Curriculum, SEC)は、RLファインチューニングプロセスと並行してカリキュラムポリシーを学習する自動カリキュラム学習手法である。
実験により、SECはモデルの推論能力を大幅に改善し、より困難で配布外のテスト問題へのより良い一般化を可能にした。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:03:09 GMT)
Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space [92.6] テスト時間インスタンスレベルの適応(TTIA)を通じて推論を強化するフレームワークであるLatentSeekを紹介した。
LatentSeekは、GSM8K、MATH-500、AIME2024など、さまざまな推論ベンチマークで評価されている。
結果は、LatentSeekが一貫して強力なベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:23:27 GMT)
HM-Talker: Hybrid Motion Modeling for High-Fidelity Talking Head Synthesis [90.7] HM-Talkerは、高忠実で時間的コヒーレントな話しヘッドを生成するための新しいフレームワークである。
AUs(Action Units)は、解剖学的に定義された顔面の筋肉の動きと、音素と視覚の相違を最小限に抑える暗黙的な特徴を使用する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:42:29 GMT)
Language Model Preference Evaluation with Multiple Weak Evaluators [89.9] PGEDは,複数のモデルに基づく評価器を用いて嗜好グラフを構築し,非循環的非競合性評価結果に対してこれらのグラフをアンサンブルし,デノテーズする手法である。
1)評価のためのモデルランキング、2)テスト時間スケーリングのための応答選択、3)モデル微調整のためのデータ選択である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:34:12 GMT)
RecCocktail: A Generalizable and Efficient Framework for LLM-Based Recommendation [89.2] 汎用的で効率的なLLMベースのレコメンデーションフレームワークRecCocktailを提案する。
このアプローチは、ドメイン汎用レコメンデーションインストラクションデータを使用して、"ベーススピリット" LoRA モジュールを微調整することから始まります。
次に,重み空間の「基本精神」と「独立性」を混合するエントロピー誘導適応結合法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:49:48 GMT)
e1: Learning Adaptive Control of Reasoning Effort [88.5] AIモデルの思考予算の増大は、精度を大幅に向上させるが、すべての質問が同じ量の推論を保証しているわけではない。
ユーザは、アウトプットの品質を、レイテンシやコストに対してどのように評価するかによって、さまざまな理由付けの労力を割り当てる傾向があります。
本稿では,ユーザが指定したトークン数を用いてモデルを学習する自己適応型強化学習手法であるAdaptive Effort Controlを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:12:21 GMT)
Static for Dynamic: Towards a Deeper Understanding of Dynamic Facial Expressions Using Static Expression Data [85.7] 本稿では,DFERの補完リソースとしてSFERデータを統合した統合型デュアルモーダル学習フレームワークを提案する。
S4Dは、共有トランスフォーマー(ViT)エンコーダデコーダアーキテクチャを用いて、顔画像とビデオに対して、デュアルモーダルな自己教師付き事前トレーニングを採用する。
実験により、S4DはDFERをより深く理解し、新しい最先端のパフォーマンスを設定できることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:04:13 GMT)
Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail [85.5] Alpamayo-R1 (AR1) は、因果推論の連鎖と軌道計画を統合する視覚言語モデルである。
また,AR1は,軌道のみのベースラインに比べて,難問の計画精度が12%向上することを示した。
今後のアップデートで、AR1モデルとCoCのサブセットをリリースする予定です。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:25:34 GMT)
Efficient Regression-Based Training of Normalizing Flows for Boltzmann Generators [85.3] ボルツマン・ジェネレータ(BG)は効率的なサンプリングと可能性を提供するが、最大可能性によるトレーニングはしばしば不安定であり、計算的に困難である。
本稿では,従来の最大値トレーニングの数値不安定性と計算課題を回避し,新しい,スケーラブルなトレーニング目標である正規化フローの回帰トレーニングを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:20:59 GMT)
Data-Efficient RLVR via Off-Policy Influence Guidance [84.6] 本研究は,学習目標に対する各データポイントの寄与を推定するために,影響関数を用いた理論的基礎的アプローチを提案する。
textbfCurriculum textbfRL with textbfOff-textbfPolicy textInfluence Guide (textbfCROPI) は多段階のRLフレームワークで、現在のポリシーにおいて最も影響力のあるデータを反復的に選択する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:40:52 GMT)
CronusVLA: Towards Efficient and Robust Manipulation via Multi-Frame Vision-Language-Action Modeling [84.5] CronusVLAは、単一フレームのVLAモデルをマルチフレームパラダイムに拡張する統合フレームワークである。
CronusVLAは70.9%の成功率で先進的な性能と優れた堅牢性を達成する。
これらの結果は、より強力で堅牢な実世界展開のためのVLAモデルにおける効率的なマルチフレーム適応の可能性を強調している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:38:19 GMT)
SEE4D: Pose-Free 4D Generation via Auto-Regressive Video Inpainting [83.5] SEE4Dは, カジュアルビデオから4次元世界モデリングを行うための, ポーズのないトラジェクトリ・ツー・カメラ・フレームワークである。
モデル内のビュー条件ビデオは、現実的に合成された画像を認知する前に、ロバストな幾何学を学ぶために訓練される。
クロスビュービデオ生成とスパース再構成のベンチマークでSee4Dを検証した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:39 GMT)
BOTS: A Unified Framework for Bayesian Online Task Selection in LLM Reinforcement Finetuning [82.9] 強化微調整(Reinforcement Finetuning, RFT)は、大規模言語モデル(LLM)を人間の嗜好と整合させ、推論を強化するための重要な手法である。
textbfBayesian textbfOnline textbfTask textbfSelection in LLM reinforcement finetuning。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:15:23 GMT)
ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation [82.5] Retrieval-Augmented Generationは、外部知識を持つ大規模言語モデルを拡張して、事実性を改善する。
既存のRAGシステムは、忠実で解釈可能な推論をサポートするために必要な重要な手がかりを抽出して統合することができない。
本稿では,手掛かり付き推論探索と最適化によるRAG向上のための新しいフレームワークであるClueAnchorを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:48:31 GMT)
Improving LLM Safety Alignment with Dual-Objective Optimization [82.0] 大規模言語モデル(LLM)の既存のトレーニング時間安全アライメント技術は、ジェイルブレイク攻撃に対して脆弱なままである。
本研究では,DPOの目的を2つの構成要素にまとめる安全アライメントの改善について提案する。(1) 安全でない世代が部分的に発生しても拒否を促す頑健な拒絶訓練,(2) 有害な知識の未学習。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:16:06 GMT)
How Efficient Are Diffusion Language Models? A Critical Examination of Efficiency Evaluation Practices [81.9] 拡散言語モデル(DLM)は、長期支配的自己回帰(AR)パラダイムに代わる有望な代替として登場した。
しかし、現在のオープンソースのDLMは、しばしばARの速度よりも優れており、現実のユーティリティを制限している。
本研究はDLMの効率に関する系統的研究であり, 先行評価手法の問題点を同定する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:46:37 GMT)
Revealing Multimodal Causality with Large Language Models [81.0] 非構造化データからマルチモーダル因果発見のための新しいフレームワークであるMLLM-CDを提案する。
本研究は,(1)真のマルチモーダル因子を同定する新しいコントラッシブ・ファクター発見モジュール,(2)発見要因間の因果関係を推測する統計的因果構造発見モジュール,(3)発見結果を洗練するための反復的マルチモーダル・カウンターファクト・推論モジュールの3つの重要な構成要素から構成される。
合成と実世界の両方のデータセットに対する大規模な実験は、提案したMLLM-CDの有効性を実証している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:43:48 GMT)
Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.9] Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:57:54 GMT)
Reasoning Curriculum: Bootstrapping Broad LLM Reasoning from Math [79.8] Reasoning Curriculumはまず、数学のような事前訓練された整列した領域で推論スキルを付与し、その後、関節RLを介してこれらのスキルを他の領域に適応し、洗練する。
カリキュラムは最小限であり、バックボーンに依存しないため、標準的な検証可能性チェック以外の特別な報酬モデルを必要としない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:56:44 GMT)
IGD: Token Decisiveness Modeling via Information Gain in LLMs for Personalized Recommendation [79.2] 我々は,トークン決定性をチューニングと復号の両方に統合する情報ゲインに基づく決定性対応トークンハンドリング(IGD)戦略を導入する。
IGDはリコメンデーションの精度を一貫して改善し、強力なベースラインに比べて広く使われているランキングの指標で顕著に向上した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:26:57 GMT)
LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification [78.7] 我々は,属性ベースのテキスト知識を活用するために,アクシデントチューニング戦略を採用した,AG-ReIDのためのLATexという新しいフレームワークを提案する。
我々のフレームワークは属性ベースのテキスト知識をフル活用してAGReIDの性能を向上させることができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:49:25 GMT)
Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs [78.2] Sci-LLMは、生物発見を加速するための有望なフロンティアとして登場した。
現在の戦略では生の生体分子配列を処理する際にSci-LLMの推論能力を制限する。
より効果的な戦略は、Sci-LLMに高レベルな構造化コンテキストを提供することである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:09:18 GMT)
ThinkMorph: Emergent Properties in Multimodal Interleaved Chain-of-Thought Reasoning [77.0] 視覚的エンゲージメントの異なるタスクにまたがる24Kの高品質なインターリーブ付き推論トレースを微調整した統一モデルを構築する。
ThinkMorphは、一貫性のある言語論理を維持しながら、視覚的コンテンツを具体的に操作する、プログレッシブなテキストイメージ推論ステップを生成することを学ぶ。
目立たない視覚操作スキル、推論モード間の適応的な切り替え、テスト時間スケーリングの改善など、突発的なマルチモーダルインテリジェンスを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:51:38 GMT)
SPARTA ALIGNMENT: Collectively Aligning Multiple Language Models through Combat [76.5] SPARTA ALIGNMENT(SPARTA ALIGNMENT)を提案する。
各イテレーションにおいて、1つの命令と2つのモデルがデュエルのために選択され、他のモデルが2つのレスポンスを評価し、それらの評価スコアは、適応されたエロランクベースの評価システムを介して集約される。
ピア評価された戦闘結果は、敗戦よりも勝利の反応が優先される選好ペアとなり、各イテレーションの最後にこれらの選好からすべてのモデルが学習される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:43:19 GMT)
Kimi Linear: An Expressive, Efficient Attention Architecture [75.9] Kimi Linearはハイブリッドな線形アテンションアーキテクチャで、初めて、公正な比較で完全にアテンションを上回ります。
中心となるKimi Delta Attention (KDA)は、Gated DeltaNetを拡張した表現力のある線形アテンションモジュールである。
我々は,Kimi Linearがより優れた性能と効率で十分な注意を払って,ドロップインで置き換えられることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:59:43 GMT)
Scalable Best-of-N Selection for Large Language Models via Self-Certainty [75.1] Best-of-N selectionは、Large Language Models(LLMs)の推論性能を改善するための重要なテクニックである。
本稿では, LLM出力の固有確率分布を利用して, 外部報酬モデルを必要としない応答品質を推定する, 新規で効率的な指標である自己確実性を提案する。
本研究は, LLM推論能力を向上させるための実用的で効率的な方法として, 自己確実性を確立した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:31:44 GMT)
When Agents Trade: Live Multi-Market Trading Benchmark for LLM Agents [74.6] Agent Market Arena (AMA)は、LLM(Large Language Model)ベースのトレーディングエージェントを評価するための、初めてのリアルタイムベンチマークである。
AMAは、検証済みのトレーディングデータ、専門家チェックされたニュース、および統一されたトレーディングフレームワーク内に多様なエージェントアーキテクチャを統合する。
GPT-4o、GPT-4.1、Claude-3.5-haiku、Claude-sonnet-4、Gemini-2.0-flashにまたがる薬剤を評価する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:09:43 GMT)
SD-ReID: View-aware Stable Diffusion for Aerial-Ground Person Re-Identification [74.4] 本稿では,AG-ReID のための SD-ReID という新しい生成フレームワークを提案する。
まず、ViTベースのモデルを用いて人物表現を抽出し、個人性や視認性を含む制御可能な条件を抽出する。
次に、安定拡散(SD)モデルを微調整し、これらの制御可能な条件によって導かれる人物表現を強化する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:00:18 GMT)
ReForm: Reflective Autoformalization with Prospective Bounded Sequence Optimization [73.1] 本稿では,意味的整合性評価を自己形式化プロセスに統合する反射的自己形式化手法を提案する。
これにより、モデルが形式的なステートメントを反復的に生成し、セマンティックな忠実さを評価し、自己修正された特定エラーを発生させることができる。
実験の結果、ReFormは最強のベースラインに対して平均22.6ポイントの改善を達成した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:15:27 GMT)
OmniEduBench: A Comprehensive Chinese Benchmark for Evaluating Large Language Models in Education [72.4] 中国の総合的な教育ベンチマークであるOmniEduBenchを紹介する。
データは、知識次元と栽培次元の2つの中核次元に分けられる。
データセットには、11の一般的な試験質問タイプを含む、さまざまな質問形式がある。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:16:29 GMT)
Defeating the Training-Inference Mismatch via FP16 [72.3] 強化学習(Reinforcement Learning, RL)の微調整は、トレーニングと推論ポリシーのミスマッチが原因で不安定な場合が多い。
その根本原因は浮動小数点精度そのものにあることを示す。
広く採用されているBF16は、大きなダイナミックレンジにもかかわらず、トレーニングと推論の一貫性を損なう大きな丸め誤差を導入している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:58:11 GMT)
Empowering RepoQA-Agent based on Reinforcement Learning Driven by Monte-carlo Tree Search [70.6] モンテカルロ木探索によるエージェント強化学習フレームワークRepoSearch-R1を紹介する。
RepoSearch-R1に基づいて,リポジトリ質問応答タスク用に設計されたRepoQA-Agentを構築する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:10:36 GMT)
Generalized Linear Bandits: Almost Optimal Regret with One-Pass Update [70.4] 非線形リンク関数を組み込んで古典線形モデルを拡張したコンテキスト型多武装バンディットフレームワークである一般化線形バンディット問題(GLB)について検討する。
GLBは現実世界のシナリオに広く適用できるが、その非線形性は計算効率と統計効率の両方を達成する上で大きな課題をもたらす。
本稿では,$mathcalO(1)$時間と1ラウンドあたりの空間複雑度をほぼ最適に再現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:34:21 GMT)
Counteracting Matthew Effect in Self-Improvement of LVLMs through Head-Tail Re-balancing [70.4] 自己改善は、大きな視覚言語モデルの推論能力を向上するための主流パラダイムとして現れてきた。
本研究では,探索学習による自己改善プロセスにおいて,頭部再バランスを実現するための4つの効率的な戦略を提案する。
我々の手法は視覚的推論能力を常に改善し、バニラ自己改善を平均3.86ポイント上回る。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:26:58 GMT)
BasicAVSR: Arbitrary-Scale Video Super-Resolution via Image Priors and Enhanced Motion Compensation [70.3] 任意スケールビデオ超解像(AVSR)のためのベーシックAVSRを提案する。
AVSRは、ビデオフレームの解像度、潜在的に様々なスケーリング要素を強化することを目的としている。
超高分解能, 一般化能力, 推論速度の点で, BasicAVSR は既存手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:08:45 GMT)
Model Inversion Attacks: A Survey of Approaches and Countermeasures [69.2] 近年、新しいタイプのプライバシ攻撃であるモデル反転攻撃(MIA)は、トレーニングのためのプライベートデータの機密性を抽出することを目的としている。
この重要性にもかかわらず、総合的な概要とMIAに関する深い洞察を提供する体系的な研究が欠如している。
本調査は、攻撃と防御の両方において、最新のMIA手法を要約することを目的としている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:50:58 GMT)
Let LRMs Break Free from Overthinking via Self-Braking Tuning [68.9] 大きな推論モデル(LRM)は思考の長い連鎖を生成することによって推論能力を著しく向上させた。
この性能向上は、生成プロセス中の冗長な推論を大幅に増加させるコストが伴う。
本稿では、モデルが独自の推論プロセスを制御することを許容する観点から、過度に検討する新しいフレームワーク、Self-Braking Tuning(SBT)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:36:10 GMT)
Polybasic Speculative Decoding Through a Theoretical Perspective [68.7] 推論レイテンシは、大規模言語モデルの大規模展開において重要なボトルネックである。
本稿では,包括的理論的解析を基盤とした,新しいエンポリベーシックな投機的復号化フレームワークを提案する。
我々の手法は、LLaMA2-Chat 7Bの3.31times$から4.01times$、LLaMA3-8Bの3.87倍、Vicuna-7Bの4.43倍、Qwen2-7Bの3.85倍の3.85倍のスピードアップ比が得られることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:20:24 GMT)
DiffAdapt: Difficulty-Adaptive Reasoning for Token-Efficient LLM Inference [68.1] 最近のLarge Language Models (LLMs) は、目覚ましい問題解決能力を示すが、有用性が不明な長い思考トレースを生成することが多い。
私たちの仕事は効率を向上し、過度に考えずにハイパフォーマンスに到達できるようにすることを目標としています。
簡単な/Normal/Hard推論戦略を選択する軽量フレームワークである textbfDiffAdapt を紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:39:41 GMT)
PoseDiff: A Unified Diffusion Model Bridging Robot Pose Estimation and Video-to-Action Control [67.2] 本稿では,ロボットの状態推定と制御を単一のフレームワーク内で統一する条件拡散モデルPoseDiffを提案する。
中心となるPoseDiffは、生の視覚を3Dキーポイントや関節角などの構造化されたロボットの状態にマッピングする。
この基盤の上に構築されたPoseDiffは、ビデオからアクションへの逆ダイナミクスに自然に拡張する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:48:32 GMT)
The Quest for Generalizable Motion Generation: Data, Model, and Evaluation [66.6] 本稿では,ViGenからMoGenへの知識伝達を,データ,モデリング,評価という3つの重要な柱を通じて体系的に行うフレームワークを提案する。
まず,228,000個の高品質な動作サンプルからなる大規模データセットViMoGen-228Kを紹介する。
第2に,フローマッチングに基づく拡散変換器であるViMoGenを提案する。
第3に,動作品質,迅速な忠実度,一般化能力の詳細な評価を目的とした階層型ベンチマークであるMBenchを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:27 GMT)
EgoExo-Con: Exploring View-Invariant Video Temporal Understanding [66.3] Video-LLMは、ビデオが異なる視点から同じイベントをキャプチャしたとき、一貫した時間的理解を実現することができるか?
EgoExo-Con (Consistency) は、自然言語による人間精製クエリと総合的に同期されたエゴセントリックおよびエクソセントリックなビデオペアのベンチマークである。
ビュー固有の時間的推論を効果的に強化する新しい強化学習フレームワークであるView-GRPOを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:53:22 GMT)
Emu3.5: Native Multimodal Models are World Learners [65.9] Emu3.5は大規模マルチモーダル世界モデルで、視覚と言語をまたいだ次の状態をネイティブに予測する。
Emu3.5は、視覚言語間のインターリーブデータのコーパスに基づいて、一貫した次トーケン予測目標を持つ、エンドツーエンドで事前訓練された。
それは、一貫した世界探索とオープンワールドの具体的操作を可能にする、一般化可能な世界モデリング能力を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:11:16 GMT)
Towards Fine-Grained Vision-Language Alignment for Few-Shot Anomaly Detection [65.3] 我々はFinGrainedADという新しいフレームワークを提案し、異常なローカライゼーション性能を改善する。
実験により、提案されたFinGrainedADは、数ショット設定で全体的なパフォーマンスが優れていることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:09:00 GMT)
Discovering State Equivalences in UCT Search Trees By Action Pruning [64.4] We show that Ideal Pruning Abstractions in UCT (IPA-UCT) are out of OGA-UCT across a range of test domain and iteration budgets。
また、IPAとASAPはどちらもp-ASAPと呼ばれるより一般的なフレームワークの特殊なケースであることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:54:43 GMT)
TEXT2DB: Integration-Aware Information Extraction with Large Language Model Agents [64.1] 本稿では,IE 出力と対象データベースの統合を重視した IE TEXT2DB の新たな定式化を提案する。
データインフィル、行数、列の追加といった一般的な要求を特徴とする新しいベンチマークを導入する。
実験によると、OPALは異なるコードプランを生成し、必要なIEモデルを呼び出すことで、多様なデータベーススキーマにうまく適応できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:38:02 GMT)
GRPO-Guard: Mitigating Implicit Over-Optimization in Flow Matching via Regulated Clipping [63.3] GRPO-Guardは、既存のGRPOフレームワークのシンプルで効果的な拡張である。
PPOクリッピングが有害な更新を適切に制限することを保証するため、バランスとステップ一貫性の重要度を回復する。
重いKL正則化に頼ることなく、暗黙の過最適化を実質的に緩和する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:33:15 GMT)
Robust Graph Condensation via Classification Complexity Mitigation [61.2] グラフ凝縮は内在次元還元過程であり、より低い分類複雑性を持つ縮合グラフを合成する。
縮合グラフを滑らかな低次元多様体内に配置する3つのグラフデータ多様体学習モジュールを導入する。
さまざまな攻撃シナリオにおけるModelNameの堅牢性を示す実験。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:55:21 GMT)
Accelerating Diffusion LLMs via Adaptive Parallel Decoding [60.4] 並列にサンプリングされたトークンの数を動的に調整する新しい手法であるアダプティブ並列復号法(APD)を導入する。
APDは、ダウンストリームベンチマークで最小限の品質劣化を伴って、非常に高いスループットを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:11:33 GMT)
Mixture-of-Transformers Learn Faster: A Theoretical Study on Classification Problems [59.9] 本研究では,各変圧器ブロックが連続的に訓練されたゲーティングネットワークによって制御される専門家として機能する,トラクタブルな理論的枠組みについて検討する。
専門家の専門化は、勾配の衝突を減らし、各サブタスクを強く凸させることを示す。
トレーニングによって予測損失が$O(log(epsilon-1)$のステップでゼロに近づき、単一変圧器の$O(epsilon-1)$のレートよりも大幅に向上することが証明された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:07:36 GMT)
Understanding and Enhancing Mamba-Transformer Hybrids for Memory Recall and Language Modeling [59.8] 我々は、メモリ利用と全体的な性能のレンズを通してハイブリッドアーキテクチャを解析する。
逐次ハイブリッドはより短いコンテキストでより良く機能する一方、並列ハイブリッドはより長いコンテキストでより効果的である。
パラフレーズを付加したデータセットを継続的にトレーニングするデータ中心のアプローチを導入し、他の機能を保ちながらリコールをさらに強化する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:19:52 GMT)
Quantitative Bounds for Length Generalization in Transformers [58.2] 変圧器における長さ一般化(LG)問題について検討する。
LGは、長い列上の変圧器の内部挙動が短い列上の振舞いによって「シミュレート」できるときに発生する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:31:36 GMT)
PRISM-Physics: Causal DAG-Based Process Evaluation for Physics Reasoning [57.9] PRISM-Physicsはプロセスレベルの評価フレームワークであり、複雑な物理推論問題のベンチマークである。
解は公式の有向非巡回グラフ(DAG)として表される。
その結果,評価フレームワークは人的専門家のスコアと一致していることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:40:41 GMT)
OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes [57.8] パノラマをベースとした2Dリフトは、没入型でリアルで多様な3D環境を作り出すための有望な技術として登場した。
本研究では、物理ベースレンダリング(PBR)、リライティング、シミュレーションに適したグラフィックス対応の3Dシーンを生成するために、この手法を推し進める。
我々の重要な洞察は、幾何学、テクスチャ、PBR材料のパノラマ知覚のための2次元生成モデルを再利用することである。
軽量で効率的なクロスモーダルアダプタ構造に基づいて、OmniXは幅広いパノラマ視覚タスクのために2D生成の先行を再利用する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:51 GMT)
Co-Evolving Latent Action World Models [57.5] 学習済みのビデオモデルを潜在アクションを介して制御可能な世界モデルに適応させることは、ジェネラリストの世界モデルを作成するための有望なステップである。
本稿では,この相乗的パラダイムを初めて実現したCoLA-Worldを提案する。
世界モデルは知識のある家庭教師として機能し、高品質のLAMを形成するための勾配を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:28:40 GMT)
Nexus: Execution-Grounded Multi-Agent Test Oracle Synthesis [57.4] 非回帰テストにおけるテストオラクル生成は、ソフトウェア工学における長年の課題である。
この課題に対処するための新しいマルチエージェントフレームワークであるNexusを紹介します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:20:25 GMT)
The Scales of Justitia: A Comprehensive Survey on Safety Evaluation of LLMs [57.2] 大規模言語モデル(LLM)は自然言語処理(NLP)において顕著な能力を示している。
広範囲に展開したことにより、大きな安全上の懸念がもたらされた。
LLMの生成したコンテンツは、特に敵の文脈において、毒性、偏見、誤情報などの安全でない振る舞いを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:22:33 GMT)
Controlling Thinking Speed in Reasoning Models [57.1] 人間の認知は、高速で直感的なシステム1思考と遅いシステム2思考の2つのモードで動作する。
本研究では,LRMが動的思考速度調整によって人間の知能を近似することを可能にする。
提案手法は, LRMにおける思考速度の制御方法と, 最適性能をいつ調整するかという2つの重要な問題に対処する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:13:35 GMT)
Human-in-the-loop Online Rejection Sampling for Robotic Manipulation [56.0] Hi-ORSは、オンライン微調整中に負の報酬を得たサンプルをフィルタリングすることで、値推定を安定化する。
Hi-ORSは、わずか1.5時間でコンタクトリッチな操作をマスターするためのpiベースのポリシーを微調整する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:53:08 GMT)
TwinVoice: A Multi-dimensional Benchmark Towards Digital Twins via LLM Persona Simulation [55.6] 大型言語モデル(LLM)は、人間のような能力を示す。
TwinVoiceは、さまざまな現実世界のコンテキストにわたるペルソナシミュレーションを評価するためのベンチマークである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:19:24 GMT)
TeleEgo: Benchmarking Egocentric AI Assistants in the Wild [55.5] 実世界のエゴセントリックなAIアシスタントは、マルチモーダル入力(ビデオ、オーディオ、テキスト)を処理しなければならない
我々は、エゴセントリックなAIアシスタントを評価するために、長いデュレーション、ストリーミング、オムニモーダルのベンチマークであるtextbfTeleEgoを紹介した。
このデータセットは、4つのドメインにわたる同期されたエゴセントリックなビデオ、オーディオ、テキストの参加者あたり14時間以上を特徴としている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:09:32 GMT)
Heterogeneous Robot Collaboration in Unstructured Environments with Grounded Generative Intelligence [54.9] 大規模言語モデル(LLM)対応のチーム化手法は、よく構造化された既知の環境を前提とするのが一般的である。
異種ロボットチームにおけるLCMの推論能力を基盤として,これらの制約に対処するフレームワークであるSPINE-HTを提案する。
我々のフレームワークは、従来のLLM対応の不均一なチームリング手法と比較して、ほぼ2倍の成功率を達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:24:38 GMT)
ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts [54.6] ConceptScopeは、ビジュアルデータセットを分析するためのスケーラブルで自動化されたフレームワークである。
概念を、その意味的関連性とクラスラベルとの統計的相関に基づいて、ターゲット、コンテキスト、バイアスタイプに分類する。
既知のバイアスを確実に検出し、未発表のバイアスを発見できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:46:17 GMT)
One Model to Critique Them All: Rewarding Agentic Tool-Use via Efficient Reasoning [54.6] リワードモデル(RM)は、大きな言語モデルと人間の嗜好の整合において重要な役割を果たす。
一般的なツール使用シナリオに適した軽量な生成型RMのファミリーであるToolRMを紹介する。
これらのモデルを構築するために,ルールベースのスコアリングと多次元サンプリングを用いたペアワイズ選好データを構築するパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:08:27 GMT)
Diversity as a Reward: Fine-Tuning LLMs on a Mixture of Domain-Undetermined Data [54.4] 多様なデータセットを使用した細調整された大規模言語モデル(LLM)は、さまざまな領域にわたる全体的なパフォーマンス向上に不可欠である。
本稿では,LLMに2つのアイデンティティを与える新しい手法を提案する。多様性報酬に基づいてデータを認知的に探索し,選択する出力モデルと,選択したデータに調整する入力モデルである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:16:49 GMT)
Reflection on Data Storytelling Tools in the Generative AI Era from the Human-AI Collaboration Perspective [54.2] 大規模生成AI技術は、ビジュアルおよびナレーション生成におけるそのパワーでデータストーリーテリングを強化する可能性がある。
我々は、最新のツールのコラボレーションパターンを、データストーリーテリングにおける人間とAIのコラボレーションを理解するための専用のフレームワークを使用して、以前のツールのパターンと比較する。
これらのAIテクニックのメリットと、人間とAIのコラボレーションへの影響も明らかにされている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:29:47 GMT)
MaskCaptioner: Learning to Jointly Segment and Caption Object Trajectories in Videos [53.8] MaskCapは、オブジェクトの軌跡を共同で検出、セグメント化、追跡、キャプションできるエンドツーエンドモデルである。
データセットとコードはhttps://www.gabriel.fiastre.fr/masker/で公開されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:39:25 GMT)
Scaling Tractable Probabilistic Circuits: A Systems Perspective [53.8] PyJuiceは、いくつかの点で先行技術を改善するPCの一般的な実装設計である。
大規模PCのトレーニングでは、既存のシステムよりも1~2桁高速である。
PyJuiceは2~5倍のメモリを消費するので、より大きなモデルをトレーニングすることができます。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:30:19 GMT)
Unstructured Evidence Attribution for Long Context Query Focused Summarization [53.1] 固定粒度の場合よりも、より関連性が高く一貫した証拠を得るために、非構造的(すなわち任意の長さのスパン)な証拠を抽出することを提案する。
既存のシステムが、非構造的証拠をコピーし、適切に引用するのにどのように苦労しているかを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:05:42 GMT)
Multi-Agent Evolve: LLM Self-Improve through Co-evolution [53.0] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を高める大きな可能性を証明している。
近年のSelf-Play RL法は,ゲームやGoのパラダイムの成功に触発されて,人間に注釈を付けることなくLSM推論能力を向上することを目指している。
数学,推論,一般知識Q&Aなど多種多様な課題の解決において,LLMが自己発展できるフレームワークであるMulti-Agent Evolve(MAE)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:45:55 GMT)
StateSpaceDiffuser: Bringing Long Context to Diffusion World Models [52.9] 本稿では、状態空間モデルから機能を統合することで、拡散モデルが長時間コンテキストタスクの実行を可能にするStateSpaceDiffuserを紹介する。
この設計は拡散モデルの高忠実性合成を保ちながら長期記憶を復元する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:51:07 GMT)
(How) Do Language Models Track State? [52.0] トランスフォーマー言語モデル(LM)は、進化する世界の未観測状態を追跡する必要があるように見える振る舞いを示す。
順列を構成するために訓練された、あるいは微調整されたLMにおける状態追跡について検討した。
LMは2つの状態追跡機構のうちの1つを一貫して学習していることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:53:25 GMT)
DDL: A Large-Scale Datasets for Deepfake Detection and Localization in Diversified Real-World Scenarios [51.9] 本稿では,$textbf1.4M+$forgedサンプルを含む大規模ディープフェイク検出およびローカライゼーション(textbfDDL)データセットを提案する。
我々のDDLは、複雑な現実世界の偽造のより困難なベンチマークを提供するだけでなく、次世代のディープフェイク検出、ローカライゼーション、解釈可能性メソッドを構築するための重要なサポートも提供しています。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:53:26 GMT)
MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning? [51.9] MindGYMは、質問合成のための構造化されスケーラブルなフレームワークである。
モデル合成の振る舞いを形作るために、高レベルの推論目的を注入する。
より深い推論のために、QAシードに基づいてより複雑なマルチホップ質問を構成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:21:42 GMT)
Exploring the correlation between the type of music and the emotions evoked: A study using subjective questionnaires and EEG [51.0] 目的は、異なる音楽ジャンルが感情に与える影響を実証することである。
これは音楽に対する幅広い感情的な反応を捉える効果があった。
分析の結果、感情と観察された脳活動の関連が明らかになった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:43:56 GMT)
Human Uncertainty-Aware Data Selection and Automatic Labeling in Visual Question Answering [50.6] HaDolaは4つの段階(識別、自己アノテーション、エラートリガー、トレーニング)で動作し、有害なサンプルを反復的に識別し、情報的なものを優先順位付けし、小さなシードセットからブートストラップする。
提案手法は,高コストなHUアノテーションへの依存を大幅に低減し,VLMの精度と校正性を向上する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:31:38 GMT)
GameFactory: Creating New Games with Generative Interactive Videos [50.4] 生成ビデオは、新しいコンテンツを自律的に作成することによって、ゲーム開発に革命をもたらす可能性がある。
本稿では,アクション制御型シーン汎用ゲーム生成フレームワークであるGameFactoryを紹介する。
実験により,GameFactoryはオープンドメインアクション制御可能なゲームビデオを効果的に生成することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:33:00 GMT)
Towards Global Retrieval Augmented Generation: A Benchmark for Corpus-Level Reasoning [50.3] 我々は,グローバルRAG機能を評価するために設計された最初のベンチマークであるGlobalQAを紹介する。
我々は,チャンクレベルの検索によって構造的コヒーレンスを保存するマルチツール協調フレームワークであるGlobalRAGを提案する。
Qwen2.5-14Bモデルでは、GlobalRAGは最強のベースラインである1.51 F1と比較して6.63 F1を達成した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:29:14 GMT)
Nirvana: A Specialized Generalist Model With Task-Aware Memory Mechanism [50.2] 特殊汎用モデル(SGM)は、ターゲットドメインにおけるエキスパートレベルのパフォーマンスを達成しつつ、幅広い能力を維持することを目的としている。
我々は,特殊なメモリ機構,線形時間複雑性,テスト時間タスク情報抽出を備えたSGMであるNirvanaを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:41:54 GMT)
PairUni: Pairwise Training for Unified Multimodal Language Models [50.0] 統一視覚言語モデル(UVLM)は、単一のアーキテクチャ内で理解と生成の両方を実行する必要がある。
我々は、データを理解世代(UG)ペアに再編成する統合フレームワークであるPairUniを提案する。
提案手法は, 様々なUVLMのバランス改善を実現し, 高いUVLM RLベースラインを達成している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:28:46 GMT)
Reasoning Path Divergence: A New Metric and Curation Strategy to Unlock LLM Diverse Thinking [49.9] テスト時間スケーリング(TTS)は,大規模言語モデル(LLM)の推論能力向上に有効であることが証明された。
提案手法は「一問題・複数解」(1PNS)の学習パラダイムであり,モデルから妥当な推論軌跡を抽出する手法である。
Reasoning Path Divergence (RPD) を用いて、問題ごとの最大多様な解集合と微調整Qwen3-4B-Baseをキュレートする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:08:53 GMT)
Beyond likelihood ratio bias: Nested multi-time-scale stochastic approximation for likelihood-free parameter estimation [49.8] 確率分析形式が不明なシミュレーションベースモデルにおける推論について検討する。
我々は、スコアを同時に追跡し、パラメータ更新を駆動する比率のないネスト型マルチタイムスケール近似(SA)手法を用いる。
我々のアルゴリズムは、オリジナルのバイアス$Obig(sqrtfrac1Nbig)$を排除し、収束率を$Obig(beta_k+sqrtfracalpha_kNbig)$から加速できることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:59:47 GMT)
Curly Flow Matching for Learning Non-gradient Field Dynamics [49.5] 非勾配場力学を学習するための新しいアプローチであるCurly Flow Matching (Curly-FM)を導入する。
Curly-FMは、Schr"odinger Bridge問題の設計と解決によって、非勾配場力学を学習することができる。
Curly-FMは、基準プロセスと人口限界の両方に適合する軌道を学習することができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:11:39 GMT)
CATArena: Evaluation of LLM Agents through Iterative Tournament Competitions [49.0] 大言語モデル(LLM)エージェントは、基本的なテキスト生成から、外部ツールとのインタラクションを通じて、複雑なタスクを自律的に完了するまで進化してきた。
本研究では,人間レベルインテリジェンスに向けたエージェント進化のコアドライバとして,自己改善とピアラーニングの両方を含む学習能力の重要性を強調した。
本稿では,反復的かつ競合的なピアラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:22:53 GMT)
ChartMuseum: Testing Visual Reasoning Capabilities of Large Vision-Language Models [49.0] 視覚的推論によってのみ解決可能な合成データセットを用いてケーススタディを行う。
次に、1,162人の専門家が注釈を付けた質問を含む新しいチャート質問回答(QA)ベンチマークであるChartMuseumを紹介します。
人間は93%の精度を達成しているが、最高のパフォーマンスモデルであるGemini-2.5-Proは63.0%しか達成できず、主要なオープンソースであるLVLM Qwen2.5-VL-72B-Instructは38.5%しか達成していない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:42:07 GMT)
Completion $\neq$ Collaboration: Scaling Collaborative Effort with Agents [49.0] タスク完了エージェントの構築と評価から,協調エージェントの開発への移行を議論する。
エージェントのユーティリティがユーザ関与の増加とともにどのように成長するかをキャプチャするフレームワークであるコラボレーティブ・ワーク・スケーリングを紹介します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:54:45 GMT)
CAS-Spec: Cascade Adaptive Self-Speculative Decoding for On-the-Fly Lossless Inference Acceleration of LLMs [48.8] 投機的復号化は、大きな言語モデルをデプロイする際のシームレスな統合と広範なユーティリティを提供する。
ドラフトモデルの階層化は、さらなる加速と柔軟性を約束するが、複数のモデルをトレーニングするコストが高いため、実用的応用は制限されている。
本稿では,投機的ドラフトモデルを構成するCascade Adaptive Self-Speculative Decoding(CAS-Spec)手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:51:29 GMT)
Scaling Image Geo-Localization to Continent Level [48.8] 本稿では,大陸規模を拡大する大規模地形をまたいだ微粒な地理的局在化を実現するためのハイブリッドアプローチを提案する。
我々は、訓練中にプロキシ分類タスクを利用して、正確な位置情報を暗黙的にエンコードするリッチな特徴表現を学習する。
我々の評価は,ヨーロッパの大部分をカバーするデータセットのクエリの68%以上を200m以内でローカライズできることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:35 GMT)
$\mathtt{M^3VIR}$: A Large-Scale Multi-Modality Multi-View Synthesized Benchmark Dataset for Image Restoration and Content Creation [48.3] $mathtM3VIR$は、Unreal Engine 5でレンダリングされた多種多様な高忠実なゲームコンテンツのための、大規模でマルチモーダルなマルチビューデータセットである。
これには、スーパーレゾリューション(SR)用の$mathttM3VIR_MR$、新しいビュー合成(NVS)、NVS+SRタスクを組み合わせた$mathttM3VIR_MS$、そして最初のマルチスタイルのオブジェクトレベルのグラウンドトルースセットである$mathttM3VIR_MS$が含まれる。
データセットをリリースすることで、私たちは容易にすることを目指しています
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:39:44 GMT)
LLM-Driven Treatment Effect Estimation Under Inference Time Text Confounding [48.0] トレーニング時間と推測時間の間に得られるデータとの相違が治療効果のバイアスのある推定に繋がることを示した。
本稿では,推測時間テキストの共起を明示的に考慮した治療効果を推定するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:29:54 GMT)
Domain decomposition architectures and Gauss-Newton training for physics-informed neural networks [47.6] ニューラルネットワークによる偏微分方程式によって支配される境界値問題を近似することは困難である。
この困難さは、スペクトルバイアス、すなわち高周波成分の緩やかな収束によって部分的に説明できる。
この局所化とガウス・ニュートン法を勾配として組み合わせて、アダムのような勾配に基づくスキームよりも高速な収束を求める。
数値計算の結果、局所化とガウスニュートン最適化を組み合わせることで、偏微分方程式に対するニューラルネットワークに基づく解法が期待できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:45:10 GMT)
Remote Labor Index: Measuring AI Automation of Remote Work [46.5] AIは、研究指向の知識と推論のベンチマークを急速に進歩させたが、これらの成果が経済的価値と自動化にどのように変換されるかは、まだ不明である。
これを測定するために、実世界の経済的に価値のあるプロジェクトからなる広範囲にわたるマルチセクタベンチマークであるRemote Labor Index (RLI)を導入する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:58:04 GMT)
Wisdom and Delusion of LLM Ensembles for Code Generation and Repair [46.0] 3つのソフトウェアエンジニアリングベンチマークで10個の大規模言語モデルと3つのLLMのアンサンブルを比較した。
アンサンブルのパフォーマンスの理論的上限は、最高のシングルモデルよりも83%高いことが判明した。
多様性に基づく戦略は、この理論ポテンシャルの最大95%を実現し、小さな2モデルアンサンブルでも有効であることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:03:25 GMT)
The End of Manual Decoding: Towards Truly End-to-End Language Models [46.0] 本稿では,真の"エンドツーエンド"生成を可能にする新しいアーキテクチャであるAutoDecoを紹介する。
各ステップにおいて、コンテキスト固有の温度とトップpの値を動的に予測する軽量なヘッドで標準変換器を拡張する。
我々はAutoDecoがデフォルトのデコード戦略を著しく上回るだけでなく、オラクルで調整されたベースラインに匹敵するパフォーマンスも達成していることを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:01:43 GMT)
Towards Scaling Laws for Symbolic Regression [45.6] 記号回帰は、観測データを説明する基礎となる数学的表現を発見することを目的としている。
ディープラーニングベースのSRは、最近、遺伝的プログラミングアプローチと競合している。
本稿では、拡張性のあるエンドツーエンドトランスフォーマーパイプラインを用いて、SRにおけるスケーリングに関する最初の体系的な研究を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:36:44 GMT)
RADAR: Benchmarking Language Models on Imperfect Tabular Data [45.2] 言語モデル(LM)は、自律的なデータ分析を行うために、ますますデプロイされている。
しかし、データ認識 -- データのアーティファクトを認識し、推論し、適切に処理する能力 -- は、まだ調査されていない。
表型データに基づくデータ認識推論を体系的に評価するベンチマークであるRADARを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:41:35 GMT)
A Pragmatic View of AI Personhood [45.1] エージェント人工知能は、新しいタイプの人格の「カンブリア爆発」を引き起こすように設定されている。
本稿では,この多角化をナビゲートするための実用的枠組みを提案する。
我々は、この伝統的なバンドルは、異なるコンテキストに対する好ましくないソリューションを作成することができると論じる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:36:34 GMT)
Environmental Impact of CI/CD Pipelines [45.0] GitHub Actionsエコシステムは、かなりの炭素と水のフットプリントをもたらす。
したがって、最も可能性の高いシナリオの炭素フットプリントは、1年で7,615本の都会の木によって捕獲された炭素と同等である。
主な推奨事項は、エネルギー生産が環境への影響の低い地域にランナーを配置することである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:02:09 GMT)
OracleAgent: A Multimodal Reasoning Agent for Oracle Bone Script Research [44.7] Oracle Bone Script (OBS) は、古代文明の文化的・知的遺産を保存する最も初期の書記システムの一つである。
現在のOBS研究は,(1) OBSの解釈は複雑なワークフローを伴い,(2) OBS情報組織と検索の効率は依然として重要なボトルネックである。
本稿では,OBS関連情報の構造化管理と検索を目的とした,最初のエージェントシステムであるOracleAgentについて述べる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:54:53 GMT)
A mathematical certification for positivity conditions in Neural Networks with applications to partial monotonicity and Trustworthy AI [44.1] LipVorは、ANNのようなブラックボックスモデルが有限個の評価に基づいて正であるかどうかを認証するアルゴリズムである。
提案手法は,制約付きアーキテクチャや分数次線形アクティベーションを伴わない部分的単調性を証明する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:25:46 GMT)
Inverse Knowledge Search over Verifiable Reasoning: Synthesizing a Scientific Encyclopedia from a Long Chains-of-Thought Knowledge Base [43.0] ほとんどの科学資料は推論を圧縮し、それらを正当化する導出鎖を省略しながら結論を提示する。
この圧縮は、明示的で段階的な正当化を欠いて検証を妨げ、クロスドメインリンクを阻害する。
本稿では,LCoT(Long Chain-of-Thought)知識ベースを構築し,科学的推論を非圧縮化するスケーラブルなフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:38:50 GMT)
Epistemic Diversity and Knowledge Collapse in Large Language Models [42.8] 大規模言語モデル(LLM)は、語彙的、意味的、スタイリスティックに同質なテキストを生成する傾向がある。
これは知識崩壊のリスクを生じさせ、同種LLMは時間とともにアクセス可能な情報範囲の縮小を仲介する。
LLM出力における実世界のクレームの変動など、疫学の多様性を測定するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:52:48 GMT)
Deep sequence models tend to memorize geometrically; it is unclear why [42.5] このような幾何学の台頭は、単なる局所的な関係を最適化するにも拘わらず、典型的な建築的あるいは最適化的な圧力による直接の帰結はあり得ない、と我々は論じる。
我々は、この幾何学が(一般的な理論とは対照的に)様々な圧力の欠如にもかかわらず自然に現れるスペクトルバイアスに由来することを実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:40:22 GMT)
Wasserstein Regression as a Variational Approximation of Probabilistic Trajectories through the Bernstein Basis [42.0] 既存のアプローチは、しばしば確率空間の幾何学を無視したり、計算コストがかかる。
ベルンシュタイン基底を用いた確率軌道のパラメータ化と分布間のワッサーシュタイン距離の最小化を組み合わせた新しい手法を提案する。
この手法は、幾何学的精度、計算的実用性、解釈可能性を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:36:39 GMT)
Enhancing Sentiment Classification with Machine Learning and Combinatorial Fusion [42.0] 本稿では, Combinatorial Fusion Analysis (CFA) を用いた感情分類への新たなアプローチを提案する。
CFAは、ランクスコアの特徴関数を利用してモデル間の相違を定量化し、それらの予測を戦略的に組み合わせる認知的多様性の概念を活用する。
実験の結果,CFAはモデル多様性を効果的に計算し活用することで,従来のアンサンブル手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:30:30 GMT)
Unleashing Diffusion Transformers for Visual Correspondence by Modulating Massive Activations [41.3] 拡散変換器(DiTs)は、非常に少数の特徴活性化が他のものよりもはるかに大きな値を示す重要な現象を示す。
本研究では,Diffusion Transformer Feature (DiTF)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:59:44 GMT)
Aeolus: A Multi-structural Flight Delay Dataset [41.2] Aeolusは大規模なマルチモーダルフライト遅延データセットである。
飛行遅延予測の研究を進めるために設計された。
Aeolusは回帰、分類、時間構造モデリング、グラフ学習など幅広いタスクをサポートしている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:41:43 GMT)
ReCon-GS: Continuum-Preserved Gaussian Streaming for Fast and Compact Reconstruction of Dynamic Scenes [41.1] ReCon-GSは、高忠実なオンライン動的シーン再構築とリアルタイムレンダリングを可能にするストレージ対応フレームワークである。
本稿では,ReCon-GSがトレーニング効率を約15%向上し,FVV合成品質が向上することを示す。
同等のレンダリング品質では、ReCon-GSは最先端の方法と比較して、メモリ要求を50%以上削減する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:38:59 GMT)
GUI Knowledge Bench: Revealing the Knowledge Gap Behind VLM Failures in GUI Tasks [41.1] 大きな視覚言語モデル(VLM)は高度なグラフィカルユーザインタフェース(GUI)タスクの自動化があるが、それでも人間より遅れている。
このギャップは、既存のトレーニングスキームだけでは十分に対処できない、コアGUI知識の欠如に起因していると仮定する。
GUIタスク実行における一般的な障害パターンを解析することにより、GUI知識を3次元に抽出する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:22:30 GMT)
Unified Error Correction Code Transformer with Low Complexity [41.0] 従来のデコーダは各コードに専用のハードウェアを必要とするため、高いハードウェアコストがかかる。
本稿では,1つのフレームワーク内で複数の線形ブロックコードを処理するトランスフォーマーベースのデコーダを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:00:06 GMT)
Multiplication-Free Parallelizable Spiking Neurons with Efficient Spatio-Temporal Dynamics [40.4] スパイキングニューラルネットワーク(SNN)は、生物学的ニューラルネットワークにインスパイアされた複雑な神経力学とスパースバイナリアクティベーション(スパイクス)によって、ニューラルネットワーク(ANN)と区別される。
従来のニューロンモデルは反復的なステップバイステップのダイナミクスを使用し、シリアル計算とSNNの遅いトレーニング速度をもたらす。
近年、SNNの訓練を加速するために、グラフィックス処理ユニットの大規模並列計算能力をフル活用するために並列化可能なスパイクニューロンモデルが提案されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:48:22 GMT)
FARMER: Flow AutoRegressive Transformer over Pixels [39.9] 本稿では,正規化フロー(NF)と自己回帰(AR)モデルを統一した新しいエンドツーエンド生成フレームワークを提案する。
FARMERは非可逆自己回帰流を用いて画像を潜在シーケンスに変換し、その分布は自己回帰モデルによって暗黙的にモデル化される。
FARMERは,既存の画素ベース生成モデルと比較して,競合性能が高いことを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:38:54 GMT)
Masked Diffusion Captioning for Visual Feature Learning [39.6] 画像条件付きマスク拡散言語モデルを用いて画像のキャプションによって視覚的特徴を学習する。
トレーニング後、学習した視覚機能は下流の視覚タスクに適用できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:46 GMT)
OmniLayout: Enabling Coarse-to-Fine Learning with LLMs for Universal Document Layout Generation [39.3] Omni-1Mは、文書レイアウトの最初の100万スケールデータセットである。
2段階学習パラダイムを設計した0.5BモデルであるOmni-LLMを紹介する。
私たちのコード、モデル、データセットは公開されます。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:39:54 GMT)
ProfOlaf: Semi-Automated Tool for Systematic Literature Reviews [39.2] ProfOlafは、体系的なレビューを合理化する半自動化ツールである。
ヒューマン・イン・ザ・ループ・フィルタリングによる記事収集のための反復的な雪玉作成をサポートする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:43:33 GMT)
GraphKeeper: Graph Domain-Incremental Learning via Knowledge Disentanglement and Preservation [39.2] グラフドメイン増分学習(Domain-IL)は、複数のグラフドメインにわたるモデルを更新することを目的としている。
本稿では,Domain-ILシナリオにおける破滅的な忘れに対処するためのGraphKeeperを提案する。
GraphKeeperは6.5%16.6%の改善を達成している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:14:51 GMT)
Topological crystals and soliton lattices in a Gross-Neveu model with Hilbert-space fragmentation [39.1] 単一フレーバーGross-Neveu-Wilson(GNW)モデルの有限密度位相図について検討する。
我々はヒルベルト空間の断片化のメカニズムの実空間バージョンから生じる不均一な基底状態の列を見つける。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:45:50 GMT)
Leveraging Large-Scale Face Datasets for Deep Periocular Recognition via Ocular Cropping [39.0] 我々は、眼の生体計測、特に眼周囲領域(眼周囲領域)に焦点を当てている。
我々は3つの畳み込みニューラルネットワークアーキテクチャを評価し、眼周囲認識の有効性を評価する。
ネットワークは、大規模なVGGFace2データベースから抽出された1,907,572個の眼作物で訓練されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:28:48 GMT)
Open3D-VQA: A Benchmark for Comprehensive Spatial Reasoning with Multimodal Large Language Model in Open Space [38.5] 本稿では,空から見た複雑な空間関係を推論するMLLMの能力を評価するための新しいベンチマークであるOpen3D-VQAを提案する。
このベンチマークは、7つの一般的な空間的推論タスクにまたがる73kのQAペアで構成されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:44:27 GMT)
A Game-Theoretic Spatio-Temporal Reinforcement Learning Framework for Collaborative Public Resource Allocation [38.4] 個人資源の移動を最適化するための,新しい,より実践的なアプローチを提案する。
1) CPRA問題をポテンシャルゲームとして定式化し、ポテンシャル関数と最適目標の間にギャップがないことを証明し、このNP-ハード問題のナッシュ平衡を近似するためのしっかりとした理論的基礎を築いた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:43:47 GMT)
From One to More: Contextual Part Latents for 3D Generation [38.4] CoPartは、コヒーレントなマルチパーツ生成のために、3Dオブジェクトをコンテキスト部分潜在子に分解する、部分認識拡散フレームワークである。
そこで我々は,メッシュセグメンテーションと人間検証アノテーションから得られた新しい3次元部分データセットを構築した。
実験では、パートレベルの編集、オブジェクト生成、シーン構成において、前例のない制御性を持つCoPartの優れた能力を実証した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:25:25 GMT)
Reevaluating Theoretical Analysis Methods for Optimization in Deep Learning [38.2] ディープラーニングで使用される最適化アルゴリズムの理論的理解の間には,大きなギャップがある。
我々は、分析的に予測された行動と実際の行動を比較するための新しい経験的指標を開発した。
ほとんどのシナリオでは、スムーズさは実際には失敗するが、よく使用される凸最適化分析の鍵となるアイデンティティは、しばしば実践的に成り立つ。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:26:18 GMT)
DOVE: Efficient One-Step Diffusion Model for Real-World Video Super-Resolution [37.8] 実世界のビデオ超解像のための効率的なワンステップ拡散モデルであるDOVEを提案する。
DOVEは、事前訓練されたビデオ拡散モデル(すなわち、CogVideoX)を微調整することによって得られる。
実験により、DOVEは多段階拡散型VSR法と同等または優れた性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:40:44 GMT)
ReaKase-8B: Legal Case Retrieval via Knowledge and Reasoning Representations with LLMs [37.7] ReaKase-8Bフレームワークは、抽出された法的事実、法的問題、法的関係のトリプレット、および効果的な訴訟検索のための法的推論を活用するために提案されている。
COLIEE 2022とCOLIEE 2023による2つのベンチマークデータセットの実験により、我々の知識と拡張埋め込みの推論が検索性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:35:36 GMT)
Value Drifts: Tracing Value Alignment During LLM Post-Training [37.5] モデルポストトレーニングの過程において、段階的価値アライメントがどのように生じるか、どの段階的価値アライメントが生じるかを検討する。
本研究は,ポストトレーニング中に価値がどのように学習されるかについて,実用的な知見を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:09:09 GMT)
InfoFlow: Reinforcing Search Agent Via Reward Density Optimization [37.3] Reinforcement Learning with Verifiable Rewards (RLVR) はエージェントディープサーチを強化するための有望なアプローチである。
本稿では,この課題を,探索費用単位当たりの報酬改善を目的としたtextbfReward Density Optimization 問題として定式化する。
この問題に3つの側面から対処する体系的なフレームワークである textbfInfoFlow を紹介します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:03:21 GMT)
Hybrid Decentralized Optimization: Leveraging Both First- and Zeroth-Order Optimizers for Faster Convergence [37.0] 分散システムは、よりノイズの多いゼロオーダーエージェントに耐えられるが、最適化プロセスにおいてそのようなエージェントの恩恵を受けることができる。
本研究の結果は,共同最適化作業に貢献しながらも,凸および非零次最適化の目的を達成できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:44:12 GMT)
Segmentation over Complexity: Evaluating Ensemble and Hybrid Approaches for Anomaly Detection in Industrial Time Series [36.9] 本研究では,変化点に基づく統計的特徴,クラスタリングに基づくサブ構造表現,およびハイブリッド学習戦略が検出性能に与える影響を評価する。
アンサンブルは0.976のAUC-ROC、F1スコア0.41のAUC-ROC、および定義された時間窓内での早期検出を100%達成した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:39:44 GMT)
AANet: Virtual Screening under Structural Uncertainty via Alignment and Aggregation [36.8] 構造的不確実性の下で正確な仮想スクリーニングを実現するためのアライメント・アンド・アグリゲーション・フレームワークを導入する。
本手法は,新しいアポ構造のベンチマークで評価し,ブラインドアポ設定における最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:11:45 GMT)
Exploring Complementarity and Explainability in CNNs for Periocular Verification Across Acquisition Distances [36.7] UBIPrデータベース上で,異なる距離における眼球周囲のCNNの相補性について検討した。
我々は,VGGFace2から得られた眼科作物の大規模なセット上で,複雑さを増大させる3つのアーキテクチャ(SqueezeNet,MobileNetv2,ResNet50)を訓練する。
ネットワークの初期化を比較し,ロジスティック回帰によるスコアレベルの融合を適用する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:07:36 GMT)
ReSpec: Towards Optimizing Speculative Decoding in Reinforcement Learning Systems [36.5] 強化学習(RL)による大規模言語モデル(LLM)の適応は、しばしば生成段階によってボトルネックとなる。
提案するReSpecは,3つの相補的なメカニズムを通じて,投機的復号化(SD)をRLに適応させるシステムである。
Qwenモデル(3B-14B)では、報酬収束とトレーニング安定性を維持しながら、ReSpecは最大4.5倍のスピードアップを達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:27:42 GMT)
The FM Agent [36.4] 大規模言語モデル(LLM)は、自律型AI研究エージェントの開発を触媒している。
本稿では,新しい汎用マルチエージェントフレームワークであるFM Agentを紹介する。
我々のシステムは、演算研究、機械学習、GPUカーネル最適化、古典数学問題など、さまざまな領域で評価されてきた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:57:57 GMT)
Representation-Level Counterfactual Calibration for Debiased Zero-Shot Recognition [36.4] 私たちはこの問題を因果推論問題として再考し、次のような質問をした。
推測時にこれを答えるために、CLIPの表現空間内のオブジェクトと背景の期待値を推定し、反ファクトの埋め込みを合成する。
提案手法は,再訓練や即時設計を伴わず,文脈に敏感なベンチマークにおいて,最悪のグループと平均精度の両方を著しく改善する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:11:23 GMT)
SignalLLM: A General-Purpose LLM Agent Framework for Automated Signal Processing [36.2] 大規模言語モデル(LLM)は、強力な推論能力、幅広い汎用知識、文脈内学習、モーダル間伝達能力を提供する。
本稿では,SPタスクのための汎用LLMベースのエージェントフレームワークであるSignalLLMを紹介する。
コミュニケーションとセンシングにおける5つの代表的なタスクを通して,SignalLLMの汎用性と有効性を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:26:13 GMT)
Simulation Framework for the Automated Search of Optimal Parameters Using Physically Relevant Metrics in Nonlinear Superconducting Quantum Circuits [36.0] JCO(JosephsonCircuitsr.jl)は、JuliaのJosephsonCircuits.jlライブラリをベースにしたシミュレーションおよび最適化フレームワークである。
ジョゼフソン接合(JJs)やその他の非線形要素を含む超伝導回路をラムド要素法でモデル化する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:32:57 GMT)
Navigating the Alignment-Calibration Trade-off: A Pareto-Superior Frontier via Model Merging [36.0] ポストトレーニングの「アライメント税」は通常、タスクの正確さの低下として表される。
また、キャリブレーションが著しく失われ、モデルが過度に信頼され、信頼性が低く、モデル出力がより多様になることも示しています。
このトレードオフは、モデルの重みの補間とアライメント前後の補間という、単純なポストホック介入によって効果的にナビゲートできることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:41:43 GMT)
Through the River: Understanding the Benefit of Schedule-Free Methods for Language Model Training [35.8] 本研究では, 損失景観の「川」構造を, 崩壊相や補助平均化を伴わず, 効果的にナビゲート可能であることを示す。
本研究では,大きなバッチサイズにおいて,運動量の向上と性能向上を図ったSFの改良版を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:39:14 GMT)
MossNet: Mixture of State-Space Experts is a Multi-Head Attention [35.7] MossNetは、線形多面的注意をエミュレートする、状態-空間-専門家の混合アーキテクチャである。
MossNetは、モデルサイズとデータ予算に類似したトランスフォーマーとSSMベースのアーキテクチャの両方を上回ります。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:37:23 GMT)
Human-Like Goalkeeping in a Realistic Football Simulation: a Sample-Efficient Reinforcement Learning Approach [35.5] 本稿では,産業環境下での訓練や微調整に適したサンプル効率のよい深層強化学習法を提案する。
EA SPORTS FC 25におけるゴールキーパーエージェントのトレーニングを,今日最も売れているサッカーシミュレーションの一つとして評価した。
我々のエージェントは、ゲームに組み込まれたAIを10%のボールセーブレートで上回ります。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:45:38 GMT)
Automated Extract Method Refactoring with Open-Source LLMs: A Comparative Study [35.5] 抽出方法(EMR)は、コードの可読性や保守性の改善が重要であるにもかかわらず、依然として困難で手作業がほとんどである。
オープンソースのリソース効率の高い大規模言語モデル(LLM)の最近の進歩は、そのようなハイレベルなタスクに対して、有望な新しいアプローチを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:34:41 GMT)
Scale-Aware Curriculum Learning for Ddata-Efficient Lung Nodule Detection with YOLOv11 [35.4] 早期肺癌の診断には胸部CTの肺結節検出が不可欠である。
既存のディープラーニングアプローチは、注釈付きデータに制限のある臨床環境にデプロイする場合、課題に直面します。
本稿では、利用可能なデータスケールに基づいてカリキュラム設計を動的に調整する新しいトレーニング戦略である、SACL(Scale Adaptive Curriculum Learning)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:33:59 GMT)
LAFA: Agentic LLM-Driven Federated Analytics over Decentralized Data Sources [35.2] 大規模言語モデル(LLM)は、自然言語クエリを解釈することで、データ分析タスクを自動化するという大きな可能性を示しています。
既存のLLMベースの分析フレームワークは、集中型データアクセスの前提で運用されており、プライバシー保護はほとんど、あるいは全く提供されない。
LLMをベースとしたデータ分析とフェデレーション分析を統合した最初のシステムであるLAFAを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:49:08 GMT)
LLMBisect: Breaking Barriers in Bug Bisection with A Comparative Analysis Pipeline [35.2] 大規模言語モデル(LLM)は、既存のソリューションの障壁を断ち切るために適切に配置されている。
LLMはテキストデータとコードの両方をパッチやコミットで理解している。
提案手法は最先端のソリューションよりも38%以上精度が向上する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:47:25 GMT)
Paper2Poster: Towards Multimodal Poster Automation from Scientific Papers [34.9] ポストジェネレーションは科学コミュニケーションにおいて不可欠だが難しい課題である。
ポスター生成のための最初のベンチマークとメトリクススイートを紹介する。
PosterAgentはトップダウンのビジュアルインザループマルチエージェントパイプラインである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:49:28 GMT)
Sketch2PoseNet: Efficient and Generalized Sketch to 3D Human Pose Prediction [34.2] 多様なスケッチスタイルから人間のポーズや形状を推定するためのエンドツーエンドのデータ駆動フレームワークを提案する。
本フレームワークは,既存の2次元ポーズ検出器とスケッチ特徴抽出のための生成拡散先行情報と,効率的な2次元ポーズ推定のためのフィードフォワードニューラルネットワークを組み合わせる。
提案手法は,スケッチ・トゥ・プレイス作業における推定精度と速度の両方において,従来のモデルを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:13:46 GMT)
FullPart: Generating each 3D Part at Full Resolution [34.0] FullPartは暗黙のパラダイムと明示的なパラダイムを組み合わせた新しいフレームワークである。
それぞれが固定されたフル解像度のボクセルグリッド内で、詳細部分を生成する。
信頼性の高い部分データの不足に対処するため,40Kオブジェクトと320Kパーツで現在までに最大規模の人型アノテーション付き3DパーツデータセットであるPartVerse-XLを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:51:05 GMT)
Stability and Sharper Risk Bounds with Convergence Rate $\tilde{O}(1/n^2)$ [33.6] 一般的な前提として -schakOjasiewicz, smoothness, Lipitz は損失に対して連続的であり、$(nn2right)$ が最も厳密な設定であることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:48:49 GMT)
Predicting Video Slot Attention Queries from Random Slot-Feature Pairs [33.6] 人間と同じようにオブジェクトレベルのシーン表現と動的モデリングを可能にするため、教師なしのビデオオブジェクト中心学習(OCL)は有望である。
スロットと機能の両方を組み込んだ新しいトランジタを提案し,クエリ予測のための情報を提供する。
シーン表現実験により,本手法が既存のOCL手法をはるかに上回っていることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:43:18 GMT)
Pelican-VL 1.0: A Foundation Brain Model for Embodied Intelligence [33.3] Pelican-VL 1.0は、オープンソースの最も大規模なマルチモーダル脳モデルである。
その主な利点は、データパワーとインテリジェント適応学習メカニズムの深い統合にある。
Pelican-VL 1.0は、チェックポイント当たり1000以上のA800 GPU-hoursの大規模クラスタでトレーニングされている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:55:13 GMT)
LoCoT2V-Bench: A Benchmark for Long-Form and Complex Text-to-Video Generation [33.1] LoCoT2V-Benchは、複雑な入力条件下でのロングビデオ生成(LVG)に特化したベンチマークである。
LoCoT2V-Benchは、さまざまな現実世界のビデオに基づいて、現実的で複雑なプロンプトのセットを紹介している。
新たに提案したメトリクスを含む多次元評価フレームワークを構築する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:00:46 GMT)
Decoding for Punctured Convolutional and Turbo Codes: A Deep Learning Solution for Protocols Compliance [32.9] 本稿では,畳み込み畳み込み符号とターボ符号に対して,LSTMを用いたニューラルデコーダを提案する。
提案したLSTMベースのニューラルネットワークデコーダのキーコンポーネントは、句読取認識の埋め込みで、句読取パターンを直接ニューラルネットワークに組み込む。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:02:24 GMT)
A Task-Centric Perspective on Recommendation Systems [32.4] 我々はRecSysタスクの定式化を解析し、入力出力構造、時間力学、候補項目選択といった重要なコンポーネントを強調した。
本稿では,タスク特異性とモデル一般化可能性のバランスについて考察し,タスク定式化がロバストな評価と効率的なソリューション開発の基礎となることを明らかにする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:40:08 GMT)
OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender [32.3] OneTransは、ユーザー・ビヘイビア・シーケンス・モデリングと機能相互作用を同時に実行する統合トランスフォーマー・バックボーンである。
オンラインA/Bテストでは、OneTransはパラメータの増加とともに効率よくスケールし、強いベースラインを一貫して上回り、ユーザ当たりのGMVは5.68%上昇する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:30:12 GMT)
Offline Clustering of Preference Learning with Active-data Augmentation [31.6] 現実世界の嗜好学習は、しばしば異なる嗜好を持つユーザーを巻き込む。
この設定では、データを効果的に集約するユーザ間の類似性を識別し、不均衡なオフラインデータを扱うという、2つの主要な課題が提示される。
学習者がオフラインデータにのみ依存する、純粋なオフライン設定のためのオフC$2$PLを提案する。
我々は,本フレームワークを,学習者がテストユーザに対して限られた数のアクティブデータを選択することができるアクティブデータ拡張設定に拡張する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:39:05 GMT)
Temporal Sparse Autoencoders: Leveraging the Sequential Nature of Language for Interpretability [31.3] モデルの内部表現と計算を人間が理解できる概念に変換することが、解釈可能性の重要な目標である。
スパースオートエンコーダのような最近の辞書学習手法は、人間の解釈可能な特徴を発見するための有望な経路を提供する。
しかし、彼らは「文の始めの「The」というフレーズ」のような浅い、トークン特有の、または騒々しい特徴に偏りを呈している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:30 GMT)
Generation and detection of squeezed states via a synchronously pumped optical parametric oscillator [31.3] 93MHzで動作する同期励起光パラメトリック発振器 (SPOPO) を用いて1035nmの圧縮状態を生成する。
システムは量子状態と同じ波長の反伝播ビームを備え、同時にキャビティを安定させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:02:23 GMT)
Smoothing Slot Attention Iterations and Recurrences [31.3] スロット注意(SA)とその変種は、主流のオブジェクト指向学習(OCL)の中心にある
ビデオの場合、このようなアグリゲーションはフレーム間でテキスト的に共有され、第1フレームではクエリがコールドスタートされ、第1フレームでは前のフレームのスロットから遷移する。
textitSmoothSAでこれらの問題に初めて対処します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:46:35 GMT)
LatentBreak: Jailbreaking Large Language Models through Latent Space Feedback [31.2] そこで我々は,ホワイトボックスのジェイルブレイク攻撃であるLatentBreakを提案する。
LatentBreakは入力プロンプト内の単語を意味的に等価なものに置き換え、プロンプトの初期意図を保存する。
我々の評価では、LatentBreakは短絡性のプロンプトを誘導し、競合するジェイルブレイクアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:33:58 GMT)
Do Students Debias Like Teachers? On the Distillability of Bias Mitigation Methods [31.1] 本研究では, ドバイジング能力の伝達性に及ぼす知識蒸留の影響について検討した。
我々の知る限りでは、この研究はKDがデビアシングに与える影響とその規模での相互作用機構に関する最初の研究である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:34:16 GMT)
A Hybrid Framework Bridging CNN and ViT based on Theory of Evidence for Diabetic Retinopathy Grading [31.0] 糖尿病網膜症(DR)は中高年者における視覚障害の主要な原因である。
畳み込みニューラルネットワーク(CNN)や視覚変換器(ViT)をベースとした様々な自動DR診断システムが最近確立されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:08:06 GMT)
Encoder-Decoder or Decoder-Only? Revisiting Encoder-Decoder Large Language Model [30.9] 我々は、エンコーダ-デコーダ LLM (RedLLM) を再検討し、デコーダ専用 LLM (DecLLM) の最近のレシピで拡張する。
我々は、プレフィックス言語モデリング(LM)で事前訓練されたRedLLMと、因果的LMで事前訓練されたDecLLMとを、異なるモデルスケールで総合的に比較する。
プレトレーニングにRedPajama V1(1.6Tトークン)、インストラクションチューニングにFLANを用いることで、RedLLMは魅力的なスケーリング特性と驚くほど強力なパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:48:28 GMT)
Speak & Spell: LLM-Driven Controllable Phonetic Error Augmentation for Robust Dialogue State Tracking [30.7] 本稿では,対話状態追跡モデルのロバスト性を改善するために,シンプルながら効果的なデータ拡張手法を提案する。
提案手法は,キーワードの誤りパターンを十分に生成し,雑音および低精度のASR環境における精度を向上させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:29:27 GMT)
ALMGuard: Safety Shortcuts and Where to Find Them as Guardrails for Audio-Language Models [30.7] ALMGuardは、ALM(Audio-Language Models)に適した最初の防衛フレームワークである。
安全に整合したショートカットがALMに自然に存在するという仮定に基づいて、普遍的ショートカット活性化摂動(SAP)を識別する手法を設計する。
また,Mel-Gradient Sparse Mask (M-GSM)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:19:59 GMT)
Reasoning Visual Language Model for Chest X-Ray Analysis [30.3] 胸部X線解釈にチェーン・オブ・シント(CoT)推論をもたらすフレームワークを提案する。
推論ファーストのトレーニングパラダイムにインスパイアされた私たちのアプローチは、専門家が結論を下すだけでなく、どのように判断するかを学ぶように設計されています。
我々は,胸部X線撮影における信頼に値する,説明可能なAIに向けたコミュニティの進展を支援するために,コードとモデルNV-Reason-CXR-3Bをリリースする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:14:35 GMT)
Large Language Models Have Intrinsic Meta-Cognition, but Need a Good Lens [30.0] 本稿では,現在のレンズを用いたLarge Language Models(LLM)メタ認知の評価と,その改善方法について検討する。
具体的には,既存のレンズをベンチマークするための自動メタ認知評価フレームワークであるAutoMecoを提案する。
さらに、現在のメタ認知レンズを強化するために、訓練不要なマルコフ固有逆補正戦略であるMIRAを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:54:22 GMT)
Intrinsic Benefits of Categorical Distributional Loss: Uncertainty-aware Regularized Exploration in Reinforcement Learning [30.0] 分布RLの潜在的優位性は、導出分布整合エントロピー正則化に起因すると考えられる。
本研究は,RLにおける分布学習の本質的なメリットを説明するために,革新的な探索的視点を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:41:14 GMT)
Beyond Technical Debt: How AI-Assisted Development Creates Comprehension Debt in Resource-Constrained Indie Teams [29.9] 本稿では,CIGDI(Co-Intelligence Game Development Ideation)フレームワークを紹介する。
この枠組みは、3ヶ月にわたるリフレクティブな実践から生まれたもので、2Dナラティブゲーム「The Worm's Memoirs」を開発した3人の分散チームの自己エスノグラフィー研究である。
AIが知識アクセスの民主化と認知負荷の削減をサポートする一方で、我々の分析は重要な課題である「理解的負債」を特定した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:41:26 GMT)
Self-Improving Vision-Language-Action Models with Data Generation via Residual RL [29.7] Probe, Learn, Distill (PLD)は3段階のプラグイン・アンド・プレイフレームワークで、視覚言語アクションモデルを改善する。
PLDはLIBEROでほぼ飽和した99%のタスク成功、SimplerEnvで50%以上、実世界のFrankaとYAMのアーム操作タスクで100%成功している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:24:04 GMT)
Guided Model Merging for Hybrid Data Learning: Leveraging Centralized Data to Refine Decentralized Models [29.6] 現在のネットワークトレーニングパラダイムは、主に集中型または分散化されたデータレシスタンスに重点を置いている。
本稿では、分散化されたモデルからモデルアトラスを構築し、集中的なデータを活用する新しいフレームワークを提案する。
本手法は,フェデレーションラーニング(分散データを活用する)とモデルマージ(集中データを利用する)を相乗化することにより,ハイブリッドデータアベイラビリティの下で効果的なトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:04:50 GMT)
RLBFF: Binary Flexible Feedback to bridge between Human Feedback & Verifiable Rewards [29.5] バイナリフレキシブルフィードバック(RLBFF)を用いた強化学習を提案する。
RLBFFは、人間主導の好みの汎用性とルールベースの検証の精度を組み合わせる。
この方法で訓練されたReward Modelsは、データにマッチするとBradley-Terryモデルより優れていることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:09:54 GMT)
PointSt3R: Point Tracking through 3D Grounded Correspondence [29.0] 本研究では,3次元再構成モデルDUSt3RとMASt3Rを接地応答による点追跡に適用することを提案する。
まず、これらのモデルが静的な点に注目するときに、現在の点追跡ベンチマークに現れる競合点トラッカーであることを実証する。
比較的少量の合成データを用いて, 点追跡のためのMASt3Rを微調整する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:46:56 GMT)
SynthWorlds: Controlled Parallel Worlds for Disentangling Reasoning and Knowledge in Language Models [28.9] 本稿では,タスク推論の複雑さを現実の知識から切り離すフレームワークであるSynthWorldsを紹介する。
SynthWorldsでは、同一の相互接続構造を持つ2つの世界を表す並列コーパスを構築する。
実験では、記憶されたパラメトリック世界知識から得られるパフォーマンス向上モデルとして定義された、永続的な知識の優位性ギャップが明らかになる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:27:46 GMT)
Mind the Gap: Removing the Discretization Gap in Differentiable Logic Gate Networks [28.8] ウォールタイムでネットワークを4.5倍速くトレーニングし、差別化のギャップを98%削減し、未使用のゲートの数を100%削減します。
この結果は、LGNの収束特性を改善する暗黙のヘッセン正則化によるものである。
ウォールタイムでネットワークを4.5倍速くトレーニングし、差別化のギャップを98%削減し、未使用のゲートの数を100%削減します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:28:19 GMT)
SlideAgent: Hierarchical Agentic Framework for Multi-Page Visual Document Understanding [28.8] マルチモーダル,マルチページ,マルチスライダーの文書を理解するための汎用エージェントフレームワークであるSlideAgentを紹介する。
推論中、SlideAgentは多レベル推論のための特殊エージェントを選択的に活性化し、出力を一貫性のあるコンテキスト対応の回答に統合する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:41:15 GMT)
SAFE: Multitask Failure Detection for Vision-Language-Action Models [28.7] 視覚言語アクションモデル(VLA)は、様々な操作タスクのセットにわたって有望なロボット行動を示している。
最初から新しいタスクにデプロイすると、成功率は制限される。
本稿では,VLAなどの汎用ロボットポリシーのための障害検出ツールSAFEを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:02:35 GMT)
Accurate Target Privacy Preserving Federated Learning Balancing Fairness and Utility [28.7] フェデレートラーニング(FL)は、データ共有なしで協調的なモデルトレーニングを可能にする。
我々は、この多目的最適化をゼロサムゲームに変換する微分プライベートフェアFLアルゴリズムを導入する。
我々の理論的分析は、驚くべき逆関係、すなわちより厳格なプライバシー保護が、人口統計バイアスを検出し修正するシステムの能力を制限していることを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:14:55 GMT)
Language-guided Open-world Video Anomaly Detection under Weak Supervision [27.9] ビデオ異常検出(VAD)は、期待から外れた異常を検出することを目的としている。
既存の方法では、異常の定義は不変であり、したがって開世界に適用できないと仮定している。
本稿では,ユーザが提案する自然言語を推論時にガイド付き検出できる,可変定義を持つ新しいオープンワールドVADパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:21:47 GMT)
MedAgentBoard: Benchmarking Multi-Agent Collaboration with Conventional Methods for Diverse Medical Tasks [27.7] 我々はMedAgentBoardを紹介する。MedAgentBoardは、マルチエージェントコラボレーション、シングルLLM、および従来のアプローチの体系的評価のための総合的なベンチマークである。
MedAgentBoardには、医療(視覚)質問応答、レイサマリ生成、構造化電子健康記録(EHR)予測モデリング、臨床ワークフロー自動化の4つの多様な医療タスクカテゴリが含まれている。
マルチエージェントコラボレーションは特定のシナリオにおいてメリットを示すが、高度な単一LLMを一貫して上回るものではない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:27:07 GMT)
Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime [26.5] アダムは深層学習の事実上のデファクトであるが、理論的な理解は限られている。
線形分離可能なデータに対するロジスティック回帰のために, インクリメンタルAdamの暗黙バイアス(ステップ毎に1つのサンプルを用いて)について検討した。
我々は、Adam が $ell_infty$-max-margin に確実に収束する構造化データセットのクラスを構築する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:41:33 GMT)
Sample-Based Krylov Quantum Diagonalization for the Schwinger Model on Trapped-Ion and Superconducting Quantum Processors [26.3] 最近提案されたサンプルベースのクリロフ量子対角化法(SKQD)を格子ゲージ理論に適用する。
本研究では, 基底状態エネルギーと粒子数と$theta$-termの値の依存性について検討し, モデルの位相構造を正確に把握する。
我々は、SKQDが有効ヒルベルト空間を著しく減らし、クリロフ空間次元は指数関数的にスケールするが、遅い成長は格子ゲージ理論を大容量でシミュレートする約束を裏切っていることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:21:06 GMT)
Scalpel: Automotive Deep Learning Framework Testing via Assembling Model Components [25.9] ディープラーニング(DL)は、自律運転システムにおいて重要な役割を果たす。
自律運転システムにDLモデルをデプロイすることは、リアルタイム処理、限られた計算資源、厳格な電力制約など、厳しい課題に直面します。
本稿では,テスト入力モデルをモデルコンポーネントレベルで生成する自動車用DLフレームワークテスト手法であるScalpelを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:18:35 GMT)
IRCopilot: Automated Incident Response with Large Language Models [25.4] 大規模言語モデル(LLM)は早期の脅威検出に大きな可能性を示している。
侵入後の自動インシデント応答に関しては、その能力は依然として制限されている。
LLMを用いた自動インシデント応答のための新しいフレームワークIRCopilotを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:08:52 GMT)
Retrieval Augmented Generation-Enhanced Distributed LLM Agents for Generalizable Traffic Signal Control with Emergency Vehicles [25.3] 交通信号制御(TSC)の有望なアプローチとして大型言語モデル(LLM)が出現する
本稿では,汎用TSC(Retrieval Augmented Generation, RAG-TSC)に対する緊急応答型分散LLMエージェントを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:23:08 GMT)
Empowering Agentic Video Analytics Systems with Video Language Models [25.2] 本稿では,VLMを利用した映像分析システムであるAVAを紹介する。
Ava には,1) 長時間あるいは連続的なビデオストリームの効率的なインデックス作成のためのイベント知識グラフ(EKG)のリアルタイム構築,2) 複雑で多様なクエリを扱うために EKG を活用するエージェント検索生成機構がある。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:12:42 GMT)
Revisiting Generative Infrared and Visible Image Fusion Based on Human Cognitive Laws [25.1] 既存の赤外線と可視画像の融合法は、しばしばモーダル情報のバランスをとるジレンマに直面している。
この写本は、人間の認知法則のインスピレーションのもと、生成的画像融合の本質を再考する。
HCLFuseと呼ばれる新しい赤外線可視画像融合法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:53:13 GMT)
Who Moved My Transaction? Uncovering Post-Transaction Auditability Vulnerabilities in Modern Super Apps [25.1] スーパーアプリは現代のデジタル生活の基盤であり、金融取引を日常のほとんどすべての側面に埋め込む。
これらのプラットフォームの一般的なセキュリティパラダイムは、トランザクション前認証に圧倒的に重点を置いています。
我々は、重要な脆弱性ベクターが主に見過ごされている、と論じている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:34:20 GMT)
Who Grants the Agent Power? Defending Against Instruction Injection via Task-Centric Access Control [25.1] 我々は、動的にタスクスコープ化されたパーミッションを強制する軽量ランタイムアクセス制御フレームワークであるAgentSentryを紹介する。
広範囲で永続的な許可を与える代わりに、AgentSentryは、最小限の一時的なポリシーを動的に生成し、強制する。
我々は,エージェントがプライベートメールの転送に騙されるようなインジェクション攻撃を,エージェントSentryがうまく防ぐことを実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:36:59 GMT)
WeaveRec: An LLM-Based Cross-Domain Sequential Recommendation Framework with Model Merging [24.9] WeaveRecは、複数のLoRAモジュールにソースとターゲットのドメインデータをウィービング形式で相互にトレーニングする。
WeaveRecは、ターゲットドメインにおける期待されるエラーの上限を下げることができるという理論的な保証を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:37:15 GMT)
Do LLMs Signal When They're Right? Evidence from Neuron Agreement [24.8] NAD(Neuron Agreement Decoding)は、アクティベーション間隔とクロスサンプルニューロンアグリーメントを用いて候補を選択する、教師なしのベスト・オブ・N法である。
未生産の軌道を早期に刈り取ることにより、NADは生成品質の低下を最小限に抑えてトークンの使用量を99%削減する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:59:56 GMT)
Linking Heterogeneous Data with Coordinated Agent Flows for Social Media Analysis [24.7] ソーシャルメディアプラットフォームは大量の異種データを生成する。
異種マルチモーダルデータをリンクするエージェントシステムであるSIA(Social Insight Agents)を提案する。
SIAはソーシャルメディアから多様で有意義な洞察を効果的に発見できることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:22:49 GMT)
Agent Skills Enable a New Class of Realistic and Trivially Simple Prompt Injections [24.5] 辺境のLLM会社はエージェントスキルを導入してこれを一歩進めた。
簡単なプロンプトインジェクションを可能にするため、基本的に安全でないことが示される。
我々は、機密データを抽出するために、長いエージェントスキルファイルや参照スクリプトに悪意のある命令を隠蔽する方法を実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:27:11 GMT)
LinearSR: Unlocking Linear Attention for Stable and Efficient Image Super-Resolution [24.4] 画像超解法(SR)の生成モデルはますます強力になるが、自己アテンションの二次複雑性(O(N2))に依存しているため、大きな計算ボトルネックが生じる。
線形注意(Linear Attention)はO(N)ソリューションを提供するが、フォトリアリスティックSRに対するその約束は、ほとんど未解決のままである。
本稿では、これらの重要なハードルを体系的に克服する全体論的なフレームワークであるLinearSRを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:46:21 GMT)
Incremental Human-Object Interaction Detection with Invariant Relation Representation Learning [24.1] オープンワールド環境では、人間と物体の相互作用(HOI)は連続的に進化し、従来のクローズドワールドのHOI検出モデルに挑戦する。
人間の知識獲得能力にインスパイアされた我々は、段階的HOI検出(IHOID)を探求し、このような動的環境における人間と物体の関係を識別できるエージェントを開発する。
IRDはオブジェクトと関係の学習を分離し、同じ関係を持つ異なるHOIの組み合わせで不変な関係の特徴を学習するための2つのユニークな蒸留損失を導入する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:59:34 GMT)
SEA-LION: Southeast Asian Languages in One Network [24.1] 本稿では,Llama-SEA-LION-v3-8B-ITとGemma-SEA-LION-v3-9B-ITを紹介する。
LLMのSEA-LIONファミリーは、英語、中国語、インドネシア語、ベトナム語、マレー語、タイ語、ビルマ語、ラオス語、フィリピン語、タミル語、クメール語を含む11のSEA言語をサポートしている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:59:39 GMT)
Cancer-Myth: Evaluating Large Language Models on Patient Questions with False Presuppositions [24.0] がん患者は、医療情報のための大きな言語モデル(LLM)に変わりつつある。
LLMは、がんに関連する問題において、偽の前提を認識または対処することができない。
我々は、単独でプロンプトを行うことは、偽の前提に対する信頼できる治療法ではないことを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:02:41 GMT)
Advancing Mobile GUI Agents: A Verifier-Driven Approach to Practical Deployment [24.0] モバイルGUIタスク自動化エージェントであるV-Droidを提案する。
V-Droidは、最終決定の前に候補行動を評価するための検証器としてLarge Language Models (LLMs)を使用している。
V-Droidは1ステップあたり4.3秒という驚くほど低レイテンシを実現しており、既存のモバイルエージェントに比べて6.1倍高速である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:00:20 GMT)
TRUST-VL: An Explainable News Assistant for General Multimodal Misinformation Detection [24.0] マルチモーダルな誤報は、生成的AIによって増幅される社会的脅威を増大させる。
様々な歪みタイプが共通の推論能力を共有し、タスク固有のスキルも必要としています。
本稿では,汎用マルチモーダル誤情報検出のための統一的で説明可能な視覚言語モデルであるTRUST-VLを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:58:04 GMT)
UV-Attack: Physical-World Adversarial Attacks for Person Detection via Dynamic-NeRF-based UV Mapping [23.9] 人検知器に対する敵の攻撃は 人間の動きの柔軟性によって 成功率の低下に苦しんだ
UV-Attackは、広範囲で目立たない人間の行動であっても高い成功率を達成する、画期的なアプローチである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:04:15 GMT)
Data-driven Projection Generation for Efficiently Solving Heterogeneous Quadratic Programming Problems [23.6] グラフニューラルネットワークベースのモデルは、各QPインスタンスに合わせてプロジェクションを生成するように設計されている。
このモデルは、予測されたソリューションで評価される期待値を最小限に抑えるために、異種QPを用いて訓練される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:32:21 GMT)
Fine-Grained Iterative Adversarial Attacks with Limited Computation Budget [23.5] この研究は、限られた計算の下でAI安全研究において重要な課題に取り組む。
反復的敵攻撃の強さを最大化する方法
本稿では,繰り返しレベルと層レベルで層活性化を選択的に再計算する,きめ細かい制御機構を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:13:06 GMT)
MPRU: Modular Projection-Redistribution Unlearning as Output Filter for Classification Pipelines [23.4] 本稿では,機械アンラーニング(MU)へのインセンティブ的アプローチを提案する。
学習は、最後のトレーニングシーケンスを逆転させることで行うことができる。これは、モデルの最後にプロジェクション-再配布層を追加することで実装される。
実験結果から,計算コストの低減を図った完全再学習モデルと一貫した出力が得られた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:09:37 GMT)
Cognition Envelopes for Bounded AI Reasoning in Autonomous UAS Operations [23.2] サイバー物理システムは、認識、推論、計画の強化を通じて自律性を高めるために基礎モデル(LLM)にますます依存している。
これらのモデルはまた、幻覚、過度な一般化、コンテキストのミスアライメントといった新しいタイプのエラーを導入し、不正確で欠陥のある決定をもたらす。
これを解決するために、メタ認知と従来の安全封筒の使用を補完しながら、AI生成決定を制約する推論境界を確立するために設計されたCognition Envelopesの概念を導入する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:11:32 GMT)
Two Heads are Better than One: Robust Learning Meets Multi-branch Models [23.1] 信頼性が高く効果的な防御方法である敵の訓練は、ニューラルネットワークの脆弱性を著しく減少させる可能性がある。
対人訓練のための最初のデータセットのみを用いて、最先端のパフォーマンスを得るために、textitBranch Orthogonality adveRsarial Training (BORT)を提案する。
CIFAR-10 と CIFAR-100 と SVHN に対するアプローチを,それぞれ $ell_infty$ と $epsilon = 8/255$ のノルム有界摂動に対して評価した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:07:37 GMT)
IntelliRadar: A Comprehensive Platform to Pinpoint Malicious Packages Information from Cyber Intelligence [22.9] パブリックレジストリの悪意あるパッケージは、ソフトウェアサプライチェーンのセキュリティに深刻な脅威をもたらします。
我々は、構造化されていないWebコンテンツから秘密の悪意あるパッケージ名を収集するプラットフォームIntelliRadarを開発した。
IntelliRadarは悪意のあるパッケージインテリジェンス抽出において高いパフォーマンス(97.91%の精度)を達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:44:02 GMT)
UNO-Bench: A Unified Benchmark for Exploring the Compositional Law Between Uni-modal and Omni-modal in Omni Models [22.5] 我々は,新しい,高品質で統一されたオムニモデルベンチマーク,UNO-Benchを紹介する。
このベンチマークは、統一された能力分類の下で、UNi-modalとOmni-modalの両方の能力を効果的に評価するために設計されている。
1250人のオムニモダルの培養サンプルと98%のクロスモーダル可溶性、2480の強化されたユニモーダルサンプルを含んでいる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:00:05 GMT)
StructLayoutFormer:Conditional Structured Layout Generation via Structure Serialization and Disentanglement [22.4] StructFormerは、条件付きレイアウト生成のためのトランスフォーマーベースの新しいアプローチである。
構造的レイアウトをシーケンスとして表現するために構造的スキームを用いる。
我々のアプローチは条件付きレイアウト生成を実現する最初のデータ駆動型アプローチである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:52:12 GMT)
Incentivizing LLMs to Self-Verify Their Answers [22.4] 本稿では,大規模言語モデルにインセンティブを与え,自己検証を行うフレームワークを提案する。
我々はQwen2.5-Math-7BとDeepSeek-R1-Distill-Qwen-1.5Bに基づいて自己検証モデルを訓練する。
複数の数学的推論ベンチマークの実験は、我々のモデルがトレーニング後の性能を改善するだけでなく、効果的なテスト時間スケーリングを可能にすることを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:45:40 GMT)
SPARKE: Scalable Prompt-Aware Diversity and Novelty Guidance in Diffusion Models via RKE Score [22.4] 拡散モデルは高忠実度画像合成と即時誘導生成モデルにおいて顕著な成功を収めている。
そこで本稿では,SPARKE(Scalble Prompt-Aware R'eny Kernel Entropy Diversity Guidance)法を提案する。
本研究では,複数のテキスト・画像拡散モデル上でSPARKE法を数値的に検証し,提案手法が有意な計算コストを伴わずに生成したデータの迅速な多様性を向上させることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:25:20 GMT)
VeriFastScore: Speeding up long-form factuality evaluation [22.3] 長期の事実性を評価するFactScoreやVeriScoreのようなメトリクスは、入力応答をアトミックなクレームに分解し、それぞれのクレームを個別に検証することで動作する。
We propose VeriFastScore, which leverageed synthesis data to fine-tune Llama3.1 8B to the same-tune Llama3.1 8B to a given text based based on evidence from Google Search。
我々の微調整されたVeriFastScoreモデルは、VeriScoreよりも6.6倍(9.9倍)のスピードアップを実現しつつ、サンプルレベルとシステムレベルの両方でオリジナルのVeriScoreパイプラインと強い相関を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:24:02 GMT)
AMO-Bench: Large Language Models Still Struggle in High School Math Competitions [22.2] AMO-Bench は Olympiad レベルの高度な数学的推論ベンチマークである。
AMO-Benchのそれぞれの問題は証明よりも最終解のみを必要とし、評価のために自動的かつ堅牢なグレーディングを可能にする。
AMO-Bench上で26LLMでの実験結果から、最高の性能のモデルでさえ52.4%の精度しか達成できないことが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:52:02 GMT)
Rethinking Neural Combinatorial Optimization for Vehicle Routing Problems with Different Constraint Tightness Degrees [22.2] 最近のニューラル最適化(NCO)手法は、ドメイン固有の専門知識を必要としない、有望な問題解決能力を示している。
本稿では,キャパシティ制約の厳密度が異なるNCO性能を実験的に解析するために,キャパシティ制約付き車両ルーティング問題(CVRP)を例に挙げる。
本研究では,制約のきつい度合いを明示的に考慮した効率的なトレーニング手法を開発し,汎用的な解法を学習するためのマルチエキスパートモジュールを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:38:02 GMT)
Adaptive Context Length Optimization with Low-Frequency Truncation for Multi-Agent Reinforcement Learning [22.1] 深層多エージェント強化学習(MARL)は,課題解決のために有望な性能を示した。
適応的で効果的な文脈情報を得るための新しいMARLフレームワークを提案する。
提案手法は,長期依存タスクにおけるSOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:32:45 GMT)
Learning to Insert for Constructive Neural Vehicle Routing Solver [22.1] 建設的NCOの学習手法として,挿入型パラダイム(L2C-Insert)を用いた構築学習を提案する。
従来のアプローチとは異なり、L2C-Insertは、現在の部分解の任意の有効な位置において、意図しないノードを戦略的に挿入することで、ソリューションを構築する。
トラベリングセールスマン問題 (TSP) とキャパシタント車両ルーティング問題 (CVRP) の総合的および実世界の事例において、L2C-Insert が一貫して優れた性能を発揮することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:17:31 GMT)
Massive Supervised Fine-tuning Experiments Reveal How Data, Layer, and Training Factors Shape LLM Alignment Quality [22.1] Supervised Fine-tuning (SFT) は、大きな言語モデルを人間の指示や値に合わせるための重要なステップである。
コード生成、数学的推論、汎用ドメインタスクなど、さまざまなデータセットに基づいて、幅広いベースモデルをトレーニングしました。
次に、最も重要となるデータセット特性を特定し、SFTが導入した階層的な修正について検討した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:32:44 GMT)
STaMP: Sequence Transformation and Mixed Precision for Low-Precision Activation Quantization [21.9] 量子化は、生成AIモデルの推論レイテンシ、電力、メモリフットプリントを低減するための重要な方法である。
テキストシーケンス変換と混合精度(STaMP)量子化を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:53:42 GMT)
Differentiation Through Black-Box Quadratic Programming Solvers [21.7] 微分可能最適化は、特に二次プログラミング(QP)において重要な研究関心を集めている。
事実上任意のQPソルバのプラグアンドプレイ微分のためのモジュラーおよびソルバ非依存のフレームワークであるdQPを紹介する。
この結果に基づいて、15以上の最先端の解決者とシームレスに統合する、最小限のオーバヘッド、オープンソース実装を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:07:47 GMT)
SA$^{2}$Net: Scale-Adaptive Structure-Affinity Transformation for Spine Segmentation from Ultrasound Volume Projection Imaging [21.7] 本稿では, スピンセグメンテーションのための新しい構造認識ネットワーク (SA$2$Net) を提案する。
まず,脊髄画像の縦方向長距離相関特性を学習するための,スケール適応型補完手法を提案する。
第二に、セマンティックな特徴をクラス固有の親和性に変換し、構造認識推論のためのTransformerデコーダと組み合わせる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:58:16 GMT)
A New Framework for Quantum Phases in Open Systems: Steady State of Imaginary-Time Lindbladian Evolution [21.4] 代替フレームワークとして、想像時間リンドブラディアン進化の概念を導入する。
この新しいアプローチは、想像上のリウヴィル超作用素のスペクトル特性を通じて、開系におけるギャップ付き量子位相を定義する。
本研究は, 定常観測器の非解析的挙動, 相関長のばらつき, 虚空とリウヴィルのギャップの閉じなど, 量子臨界における普遍的な性質を示すものである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:42:23 GMT)
When Kernels Multiply, Clusters Unify: Fusing Embeddings with the Kronecker Product [21.0] 最先端の埋め込みは、しばしば異なるが相補的な差別的特徴を捉えている。
本稿では,カーネル乗算による補完表現を融合する原理的手法を提案する。
我々は、ランダムなプロジェクションを利用して効率的な近似を行うスケーラブルなRP-KrossFuseを開発した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:15:23 GMT)
Context Engineering 2.0: The Context of Context Engineering [21.0] コンテキストエンジニアリングの実践は、20年以上にわたって遡ることができる、と私たちは主張する。
我々は、体系的な定義を提供し、その歴史的・概念的な景観を概説し、実践のための重要な設計上の考察を考察する。
本稿では,AIシステムにおけるコンテキスト工学の体系化に向けた,より広範なコミュニティの取り組みの足掛かりとなる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:43:10 GMT)
A Multi-Modal Neuro-Symbolic Approach for Spatial Reasoning-Based Visual Grounding in Robotics [20.8] 本研究では,パノラマ画像と3次元点雲情報を統合したニューロ・シンボリック・フレームワークを提案する。
提案手法は,ロボット工学および組み込みAIアプリケーションに適した軽量設計を維持しつつ,混在する人間構築環境において,優れた性能と信頼性を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:40:23 GMT)
Towards Predicting Any Human Trajectory In Context [20.8] TrajICLは歩行者軌道予測のための文脈学習フレームワークである。
重み更新を必要とせずに、シナリオ固有のデータ推論を微調整することなく適応できる。
大規模な実験により、TrajICLはドメイン内シナリオとクロスドメインシナリオの両方で顕著な適応を実現している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:04:19 GMT)
What's In My Human Feedback? Learning Interpretable Descriptions of Preference Data [20.8] In My Human Feedback? (WIMHF)はスパースオートエンコーダを用いてフィードバックデータを説明する方法である。
WIMHFは、(1)データセットが測定できる嗜好と(2)アノテーションが実際に表現する嗜好の両方を特徴付ける。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:25:10 GMT)
Chain-of-Scrutiny: Detecting Backdoor Attacks for Large Language Models [20.7] 大規模言語モデル(LLM)は、攻撃者が設定した特定の「トリガー」を含む入力が悪意ある出力を生成する。
従来の防衛戦略は、モデルアクセスの制限、高い計算コスト、データ要求のため、APIアクセス可能なLLMでは実用的ではない。
バックドア攻撃を緩和するために,LLMのユニークな推論能力を活用するChain-of-Scrutiny (CoS)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:11:28 GMT)
MTL-KD: Multi-Task Learning Via Knowledge Distillation for Generalizable Neural Vehicle Routing Solver [20.4] 本研究は知識蒸留(MTL-KD)による新しいマルチタスク学習手法を提案する。
提案手法は,複数の異なるRLベースの単一タスクモデルから単一重デコーダモデルへのポリシー知識の転送,ラベルなしトレーニング,多種多様なタスクにおけるモデルの一般化能力の向上を効果的に行う。
最大1000ノードのVRP変異体6種と10種のVRP変異体に対する実験結果から,提案手法が一様および実世界のベンチマークにおいて常に優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:05:05 GMT)
Tensor-Network-Based Unraveling of Non-Markovian Dynamics in Large Spin Chains via the Influence Martingale Approach [20.4] 大規模1次元量子システムにおいてマルコフ力学と非マルコフ力学の両方をシミュレーションする効率的なアルゴリズムを開発する。
この枠組みは、最大100スピン量子ビットからなる1次元逆場イジング鎖に対して示されるように、非マルコフ系における開系力学のシミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:01:55 GMT)
EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation [20.3] 入力テキスト中の感情を利用して、ネガティブなコンテンツを導入し、ユーザの好ましくない感情を誘発する、テキスト・ツー・イメージの拡散モデルに関連する、これまで見過ごされてきたリスクについて検討する。
具体的には,新たなバックドアアタック,すなわち感情認識型バックドアアタック(EmoAttack)を同定する。
従来のパーソナライズ手法とは異なり,感情的な単語群と悪意のある負のコンテンツを含む参照画像とのマッピングを確立することにより,事前学習した拡散モデルを微調整する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:26:23 GMT)
GSE: Group-wise Sparse and Explainable Adversarial Attacks [20.3] スパース敵は、最小ピクセルの摂動によって、愚かなディープニューラルネットワーク(DNN)を攻撃します。
近年の取り組みは、この標準を核グループノルムのようなスパーシティ正則化器に置き換えて、グループワイドの敵攻撃を作らせている。
本稿では,意味的意味のある画像内のグループワイドアタックを生成する2相アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:47:32 GMT)
RRCANet: Recurrent Reusable-Convolution Attention Network for Infrared Small Target Detection [20.3] 赤外線小目標検出は、その特徴のために難しい課題である。
最近のCNNベースの手法は、重い特徴抽出と融合モジュールで有望な性能を実現している。
赤外線小ターゲット検出のための再帰的再帰的再畳み込みアテンションネットワーク(RRCA-Net)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:31:07 GMT)
QuantumBench: A Benchmark for Quantum Problem Solving [20.2] 本研究では量子領域のベンチマークであるQuantumBenchを紹介する。
約800の質問をまとめ、その答えは量子科学に関連する9つの領域にまたがった。
質問形式の変化に対する感度を含む量子領域におけるそれらの性能を解析する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:44:03 GMT)
FESTA: Functionally Equivalent Sampling for Trust Assessment of Multimodal LLMs [20.1] マルチモーダル大言語モデル(MLLM)の生成した予測は、選択的な予測を可能にし、ユーザの信頼性を向上させることができる。
MLLMのマルチモーダル入力サンプリング技術であるFESTA(Functional Equivalent Smpling for Trust Assessment)を提案する。
FESTAは等価かつ相補的な入力サンプリングに基づいて不確実性尺度を生成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:55:22 GMT)
Pre-trained Forecasting Models: Strong Zero-Shot Feature Extractors for Time Series Classification [19.7] 予測モデルでは,分類に特化して事前訓練された最先端のモデルと一致するか,あるいは超えるような分類精度が得られることを示す。
これらの結果は,タスク固有の事前学習が必要であるという仮定に疑問を呈し,予測学習が汎用時系列基礎モデルの構築に強力な道筋を提供する可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:55:23 GMT)
ORBIT - Open Recommendation Benchmark for Reproducible Research with Hidden Tests [19.7] 隠れテストを用いた再現性研究のためのオープンレコメンデーションベンチマーク(Open Recommendation Benchmark)を提案する。
ORBITは、公開データセットの標準化された評価フレームワークで、再現可能な分割と、公開リーダボードの透過的な設定を提供する。
ClueWeb-Recoは、リアル、ユーザ合意、プライバシ保証されたブラウジングデータから派生した合成データセットである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:10:45 GMT)
Omni-Effects: Unified and Spatially-Controllable Visual Effects Generation [19.6] オムニエフェクト(Omni-Effects)は、即時誘導効果と空間制御可能な複合効果を生成できるフレームワークである。
LoRAベースのMixture of Experts (LoRA-MoE)は、専門家グループであるLoRAを採用し、統一モデルに多様な効果を統合する。
Space-Aware Prompt (SAP) は、空間マスク情報をテキストトークンに組み込んで、正確な空間制御を可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:09:13 GMT)
Holographic Transformers for Complex-Valued Signal Processing: Integrating Phase Interference into Self-Attention [19.6] 我々は、波動干渉原理を自己注意に組み込んだ物理に着想を得たアーキテクチャであるホログラフィックトランスフォーマーを紹介する。
デュアルヘッドデコーダは同時に入力を再構築してタスク出力を予測する。
PolSAR画像分類と無線チャネル予測の実験は、高い分類精度とF1スコア、低回帰誤差、位相摂動に対するロバスト性の向上を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:42:04 GMT)
C-LoRA: Contextual Low-Rank Adaptation for Uncertainty Estimation in Large Language Models [19.6] Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)を微調整するためのコスト効率の良いソリューションを提供する。
LoRAは、データスカースな数ショット設定で過信な予測を生成する。
本稿では,新しい不確実性を認識し,パラメータを効率的に調整する手法として,コンテキスト低ランク適応(C-LoRA)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:43:22 GMT)
WOD-E2E: Waymo Open Dataset for End-to-End Driving in Challenging Long-tail Scenarios [19.5] ビジョンベースのエンドツーエンド(E2E)運転は、研究コミュニティにおいて大きな関心を集めている。
現在のE2E駆動ベンチマークは主に名目上のシナリオを特徴としている。
既存のオープンループ評価メトリクスは、運転のマルチモーダルな性質を捉えるのに不足することが多い。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:25:33 GMT)
Modeling Neural Activity with Conditionally Linear Dynamical Systems [19.4] 本研究では,これらの力学を特徴付ける汎用手法として,条件線形力学系モデルを開発した。
CLDSモデルは,データ制限の厳しいレギュレーションにおいても良好に動作可能であることが判明した。
例えば、方向方向を非線形にエンコードする視床ニューロンをモデル化するCLDSと、進入作業中に運動皮質ニューロンをモデル化するCLDSを応用する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:01:42 GMT)
Robust Super-Capacity SRS Channel Inpainting via Diffusion Models [19.3] 5G NRビームフォーミングでは、アップリンク音響基準信号(SRS)による相互性に基づくビームフォーミングがリソースとカバレッジの制約に直面している。
本稿では,推論時にシステムモデル知識を統合する拡散型チャネルインパインティングフレームワークを提案する。
本研究は,UNetスコアモデルベースラインと1ステップMAEの分散シフトにおいて,スコアベース拡散変法が一貫して優れることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:22:13 GMT)
Disentangled 4D Gaussian Splatting: Rendering High-Resolution Dynamic World at 343 FPS [19.3] 本稿では,新しい表現・レンダリングパイプラインであるDisentangled 4D Gaussian Splatting (Disentangled 4DGS)を紹介する。
Disentangled4DGSは、4Dガウスの時間的および空間的成分を分離し、一次元および四次元行列計算のスライシングを避ける。
提案手法は,マルチビューとモノクロの両方の動的シーンデータセットにおいて,既存の手法よりも優れた動的新規ビュー合成のための新しいベンチマークを設定できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:00:04 GMT)
A-TPT: Angular Diversity Calibration Properties for Test-Time Prompt Tuning of Vision-Language Models [19.3] テスト時プロンプトチューニング(TPT)は、ラベル付きデータに頼ることなく、大きな視覚言語モデル(VLM)を未確認タスクに適用するための有望な手法として登場した。
A-TPTは,正規化されたテキスト特徴の分布の均一性を促進するために,角の多様性を導入する新しいTPTフレームワークである。
本手法は, 平均キャリブレーション誤差を低減するため, 最先端のTPT手法を一貫して超越していることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:45:24 GMT)
Locality in Image Diffusion Models Emerges from Data Statistics [19.3] 近年の研究では、画像拡散モデルの一般化能力は、トレーニングされたニューラルネットワークの局所特性から生じることが示されている。
深部拡散モデルの局所性が画像データセットの統計的特性として現れることを示す。
理論的および実験的に、この局所性は画像データセットに存在する画素相関から直接生じることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:40:53 GMT)
FreeSliders: Training-Free, Modality-Agnostic Concept Sliders for Fine-Grained Diffusion Control in Images, Audio, and Video [19.2] 概念スライダは、テキストコントラストを通して意味的な方向を発見することによって、有望な方向を提供する。
FreeSlidersは、推論中にCSの公式を部分的に見積もることで、完全にトレーニング不要でモダリティに依存しない。
提案手法は,モダリティ間のプラグアンドプレイ,トレーニング不要の概念制御,既存のベースラインの改善,原則生成のための新しいツールの確立を可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:58 GMT)
Model Inversion with Layer-Specific Modeling and Alignment for Data-Free Continual Learning [19.1] 継続的な学習は、以前のタスクのパフォーマンスを維持しながら、一連のタスクでモデルを漸進的にトレーニングすることを目的としています。
データの保存と再生は、プライバシやセキュリティ上の制約によって不可能になることが多い。
単層最適化における高速収束にインスパイアされたPMI(Per-layer Model Inversion)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:58:48 GMT)
Unveiling Intrinsic Text Bias in Multimodal Large Language Models through Attention Key-Space Analysis [19.1] MLLM(Multimodal large language model)は、視覚言語データを処理する際に、テキスト入力の顕著な好みを示す。
モデルの内部構造からバイアスが生じることを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:22:22 GMT)
MMQ-v2: Align, Denoise, and Amplify: Adaptive Behavior Mining for Semantic IDs Learning in Recommendation [19.1] セマンティックID学習のためのコンテンツと行動のモダリティから、適応的にアライズ、デノテーズ、増幅するための混合量子化フレームワークMMQ-v2を提案する。
ノイズから表現を遮蔽するための情報豊かさを意識した適応的行動コンテンツアライメントと、SIDに異なる重みを適用して臨界信号を増幅する動的行動ルータである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:50:46 GMT)
Accumulative SGD Influence Estimation for Data Attribution [19.0] SGDIEは、エポックごとのサロゲートを和らげることで、アウト・ワン・アウト効果を近似し、エポック間化合物を無視する。
本稿では,ACCSGDを意識した評価手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:45:22 GMT)
Improving the Euclidean Diffusion Generation of Manifold Data by Mitigating Score Function Singularity [18.8] 一般的な多様体構造データに対するユークリッド拡散モデルの直接サンプリングについて検討する。
周辺空間におけるスコア関数のマルチスケール特異点を明らかにすることで,拡散生成サンプルの精度を損なうことができる。
本稿では、点関数の特異点構造を、多様体の接方向と正規方向に沿って分解することによって、精巧に理論的に解析する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:18:35 GMT)
SAFE: A Novel Approach to AI Weather Evaluation through Stratified Assessments of Forecasts over Earth [18.7] 地球上の予測の成層的評価(英: Stratified Assessments of Forecasts over Earth、SAFE)は、地球上で行われる一連の予測の成層的性能を解明するためのパッケージである。
SAFEはさまざまなデータドメインを統合して、地理空間グリッドポイントに関連するさまざまな属性を階層化する。
その重要性を示すために、SAFEを使用して、最先端のAIベースの天気予報モデルの動物園をベンチマークする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:22:55 GMT)
Bias-Corrected Data Synthesis for Imbalanced Learning [18.3] 正のサンプルが負のサンプルに比べてわずかに比例する不均衡データは、分類問題において偽の正と偽の負の比率のバランスをとることが困難である。
この課題に対処するための一般的なアプローチは、マイノリティグループのための合成データを生成し、次に観察データと合成データの両方で分類モデルを訓練することである。
本稿では,合成データから得られるバイアスに対処し,多数派からの情報を借りることで,このバイアスに対する一貫した評価を行う。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:52:25 GMT)
Demystifying the Roles of LLM Layers in Retrieval, Knowledge, and Reasoning [18.3] 研究によると、LLM(Large Language Models)の深い層は、学習の表現にはほとんど寄与せず、大きなパフォーマンス損失を伴わずに、しばしば取り除くことができる。
本稿では,評価プロトコル,タスクカテゴリ,モデルアーキテクチャなど,様々な次元にわたる奥行き利用の体系的研究を行う。
我々の分析では、非常に深い層は一般的に以前の層よりも効果が低いことが確認されているが、それらの貢献は評価設定によって大きく異なる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:22:53 GMT)
VISTA Score: Verification In Sequential Turn-based Assessment [18.3] VISTAは,クレームレベルの検証と逐次一貫性トラッキングを通じて,会話の事実性を評価するためのフレームワークである。
VISTAは、各アシスタントをアトミックな事実的クレームに分解し、信頼された情報源や対話履歴に対して検証し、検証不可能なステートメントを分類する。
人間による評価では、VISTAの分解はアノテーションの一致を改善し、既存のベンチマークの不整合を明らかにする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:45:13 GMT)
Beyond Imitation: Constraint-Aware Trajectory Generation with Flow Matching For End-to-End Autonomous Driving [18.2] 本稿では,制約付きフローマッチングを利用する新しい計画フレームワークであるCATGを提案する。
CatGは、本質的にモード崩壊を引き起こすフローマッチングプロセスを明示的にモデル化する。
CatGは、生成中の運転攻撃性を制御信号としてパラメータ化し、軌道スタイルの正確な操作を可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:24:34 GMT)
SIRAJ: Diverse and Efficient Red-Teaming for LLM Agents via Distilled Structured Reasoning [18.2] 我々は、任意のブラックボックスLLMエージェントのための一般的なレッドチームフレームワークであるSIRAJを紹介する。
エージェント定義から始まり、多様なシードテストケースを生成する動的2段階プロセスを採用する。
それは、以前の試みの実行軌跡に基づいて、モデルベースの敵攻撃を反復的に構築し、洗練する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:32:58 GMT)
Graph Diffusion that can Insert and Delete [18.1] 離散 Denoising Diffusion Probabilistic Models (DDPM) に基づくグラフの生成モデルは、分子生成に対する原則的なアプローチを提供する。
本稿では,ノードの単調な挿入と削除をサポートするため,ノイズ発生処理とノイズ発生処理を再構成する。
GrIDDDと呼ばれる結果のモデルは、生成中に化学グラフを動的に成長または縮小します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:16:57 GMT)
DiffVLA++: Bridging Cognitive Reasoning and End-to-End Driving through Metric-Guided Alignment [17.8] VLA(Vision-Language-Action)モデルは、世界知識を活用して挑戦的なケースを扱うが、3D推論能力に制限があるため、物理的に不可能なアクションにつながる可能性がある。
DiffVLA++は、認知的推論とE2E計画を明確にブリッジする、拡張された自律運転フレームワークである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:44:58 GMT)
Lean4Physics: Comprehensive Reasoning Framework for College-level Physics in Lean4 [17.8] 大学レベルの物理学問題に対する包括的な推論フレームワークである**Lean4PHYS*をLean4で紹介する。
**Lean4PHYS*には、Lean4の正式な物理推論のためのカレッジレベルのベンチマークである*LeanPhysBench*が含まれている。
コミュニティ主導のレポジトリである*PhysLib*も紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:09:40 GMT)
GraphCompliance: Aligning Policy and Context Graphs for LLM-Based Regulatory Compliance [17.7] 規制テキストをポリシーグラフとして表現し,ランタイムコンテキストをコンテキストグラフとして表現するフレームワークであるGraphComplianceを紹介する。
300個の実世界のシナリオでの実験では、GraphComplianceはLSMのみとRAGベースラインよりも4.1-7.2ポイント(pp)高いマイクロF1が得られる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:53:16 GMT)
RepV: Safety-Separable Latent Spaces for Scalable Neurosymbolic Plan Verification [17.7] 本稿では,安全かつ安全でない計画が線形に分離可能な潜在空間を学習することで,両視点を統一するニューロシンボリック検証器RepVを紹介する。
RepVは軽量なプロジェクタを訓練し、各プランと言語モデル生成の理論的根拠を低次元空間に組み込む。
RepVは、潜伏空間における位置に基づいて正しい検証の可能性を確率論的に保証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:46:34 GMT)
DPA: A one-stop metric to measure bias amplification in classification datasets [17.6] 方向予測可能性増幅(英: Directional Predictability Amplification、DPA)は、予測可能性に基づくメトリクスであり、バランスの取れたデータセットとバランスの取れていないデータセットで動作し、正と負のバイアス増幅を正しく識別する。
DPAと既存のバイアス増幅メトリクスを比較するために、我々は主要なバイアス増幅メトリクスのワンストップライブラリをリリースした。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:56:28 GMT)
LLMs Process Lists With General Filter Heads [17.6] LLMは、関数型プログラミングの一般的な「フィルタ」関数を反映した一般的なフィルタリング操作の因果表現を符号化することを学ぶ。
この表現を抽出して再適用して,異なる形式,言語,あるいはタスクにおいて,異なるコレクション上で同じフィルタリング操作を実行できることを示す。
この結果から,トランスフォーマーLMは,意外な方法で一般化した抽象計算処理の人間解釈可能な実装を開発することができることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:57:17 GMT)
DiSE: A diffusion probabilistic model for automatic structure elucidation of organic compounds [17.4] DiSEは、複数の分光モダリティを統合する、エンドツーエンドの拡散に基づく生成モデルである。
それは、計算されたスペクトルで訓練されているにもかかわらず、優れた精度、化学的に多様なデータセットをまたいだ強力な一般化、実験データに対する堅牢性を達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:10:03 GMT)
ChartAB: A Benchmark for Chart Grounding & Dense Alignment [17.2] 視覚言語モデル(VLM)の包括的評価を提供する新しいChartAlign Benchmark(ChartAB)を導入する。
新たな2段階推論ワークフローを導入することで、ベンチマークはVLMの2つのチャートにまたがる要素/属性を調整および比較する能力をさらに評価することができる。
近年のVLM評価では, 認知バイアス, 弱さ, 頑健さ, 幻覚に対する新たな知見が得られた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:56:31 GMT)
Omni-Mol: Multitask Molecular Model for Any-to-any Modalities [16.5] 分子生成と理解の両方をサポートする新しいフレームワークであるOmni-Molを提案する。
提案手法は16のタスクにまたがる統一的な命令チューニングを実現し,13のタスクに対して最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:03:05 GMT)
Clone Deterministic 3D Worlds with Geometrically-Regularized World Models [16.5] エージェントが複雑でダイナミックな設定で効果的に思考、計画、理性を実現するためには、世界モデルが不可欠である。
急速な進歩にもかかわらず、現在の世界モデルは、長い地平線上で不安定で劣化している。
本稿では, 自然な知覚軌道に沿った連続点が潜在表現空間に近接しているような幾何学的正規化世界モデル(GRWM)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:56:43 GMT)
The RAG Paradox: A Black-Box Attack Exploiting Unintentional Vulnerabilities in Retrieval-Augmented Generation Systems [16.4] RAGパラドックスに基づく現実的なブラックボックス攻撃を導入する。
文書検索性の改善に重点を置く以前の作業とは異なり,攻撃手法は検索可能性とユーザ信頼の両方を明示的に考慮している。
本手法は, 内部アクセスのないシステム性能を著しく低下させるとともに, 自然に見える有毒な文書を生成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:37:00 GMT)
BI-DCGAN: A Theoretically Grounded Bayesian Framework for Efficient and Diverse GANs [16.4] 我々は、モデル不確実性を生成過程に組み込む、DCGANのベイズ拡張であるBI-DCGANを紹介する。
BI-DCGAN は Bayes と Backprop を統合してネットワーク重みの分布を学習し、平均場変動推定を用いて後方分布を効率的に近似する。
BI-DCGANが従来のDCGANよりも多種多様で頑健な出力を生成することを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:00:38 GMT)
Graph Semi-Supervised Learning for Point Classification on Data Manifolds [16.3] データ多様体上の分類タスクのためのグラフ半教師付き学習フレームワークを提案する。
多様体仮説により、低次元 $mathcalM 部分集合 mathbbRF$ からサンプリングされた点としてデータをモデル化する。
我々は、$mathcalM$から一様サンプリングを行うと、半教師付きタスクの一般化ギャップはグラフサイズの増加とともに減少することを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:45:01 GMT)
Quality Over Quantity? LLM-Based Curation for a Data-Efficient Audio-Video Foundation Model [16.2] このフレームワークは、整列したトレーニングデータセグメントを選択するためのスコアリング機構を実装している。
音声ベースの基礎モデルであるWhisperと、デュアルエンコーダ構造におけるビデオ解析のためのDINOv2を統合している。
AudioCaps、VALOR、VGGSoundの評価は、提案したモデルアーキテクチャの有効性を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:37:55 GMT)
RelP: Faithful and Efficient Circuit Discovery in Language Models via Relevance Patching [16.2] 帰属パッチの局所勾配を伝搬係数に置き換えるRelP(Relevance Patching)を導入する。
RelPは2つの前方パスと1つの後方パスしか必要とせず、忠実さを改善しながら計算効率を維持する。
我々はRelPを様々なモデルやタスクで検証し、標準属性パッチよりも正確にアクティベーションパッチを近似することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:01:21 GMT)
Neural Networks for Learnable and Scalable Influence Estimation of Instruction Fine-Tuning Data [16.1] 影響関数はモデルトレーニングに重要な洞察を与える。
既存の手法は計算コストが大きく、一般化が限られている。
本稿では、ニューラルネットワークを用いて影響値を推定し、最大99%のコスト削減を実現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:56:28 GMT)
Multiclass Local Calibration With the Jensen-Shannon Distance [16.1] マルチクラスキャリブレーションへの現在のアプローチは、入力間の距離の概念を欠いている。
これは特に、スパースインスタンスが偏りのある治療のリスクが最も高い場合の医療のような、ハイテイクな設定に関係している。
本稿では,予測確率とクラス周波数の局所推定値のアライメントを行うニューラルネットワークにおける局所キャリブレーションの実践的手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:56:07 GMT)
MM-OPERA: Benchmarking Open-ended Association Reasoning for Large Vision-Language Models [15.9] 我々は、根本的だが未解明の知性、すなわち結束を評価することを目指している。
MM-OPERAは、2つのオープンエンドタスクにまたがる11,497のインスタンスを持つ体系的なベンチマークである。
異なる思考と収束した連想的推論の精神に類似するようにLVLMに挑戦する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:49:06 GMT)
Parallel Unlearning in Inherited Model Networks [15.9] 本稿では、継承を示すモデル間で完全に並列なアンラーニングを可能にする新しいアンラーニングフレームワークを提案する。
時系列指向の非循環グラフ(DAG)を用いて、モデル継承ネットワークで発生する様々な未学習シナリオをキャプチャする。
私たちのフレームワークの中心にあるのは、効率的な並列アンラーニングを実現するために設計されたFisher Inheritance Unlearning(FIUn)メソッドです。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:10:17 GMT)
Refine-n-Judge: Curating High-Quality Preference Chains for LLM-Fine-Tuning [15.9] 大規模言語モデル(LLM)は、好みに基づく微調整を通じて顕著な進歩を見せている。
本稿では、1つのLCMを精細化と判定の両方に活用し、データセットの品質を向上させる自動反復手法であるRefine-n-Judgeを紹介する。
本研究では,5つのコーパスにまたがる公開データセットにまたがるRefine-n-Judgeの有効性を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:32:34 GMT)
1+1>2: A Synergistic Sparse and Low-Rank Compression Method for Large Language Models [15.8] 大規模言語モデル(LLM)のためのアンダーラインSynergistic UnderlineSparseとアンダーライン圧縮(SSLC)メソッドを導入する。
低ランク近似は、その必須構造を最小限の情報損失で保持することでモデルを圧縮するが、スパース最適化は非決定的な重みを排除し、一般化に不可欠なものを保存する。
LLaMAとQwen2.5モデル(7B-70B)の実験では、SSLCは追加のトレーニングステップなしで、スタンドアロンメソッドを一貫して上回り、最先端の結果が得られている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:50:30 GMT)
UniSite: The First Cross-Structure Dataset and Learning Framework for End-to-End Ligand Binding Site Detection [15.4] 提案するUniSiteは,設定した予測損失とマッチングによって教師される最初のエンドツーエンドのリガンド結合サイト検出フレームワークである。
また, 平均精度を, リガンド結合サイト予測のためのより正確な評価指標として導入する。
データセットとコードはhttps://github.com/quanlin-wu/unisite.comで公開される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:46 GMT)
Bridging the Gap Between Molecule and Textual Descriptions via Substructure-aware Alignment [15.2] MolBridgeは、サブ構造認識アライメントに基づく新しい分子文学習フレームワークである。
MolBridgeは,様々な分子ベンチマークにおいて,微細な対応を効果的に捉え,最先端のベースラインより優れていることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:36:31 GMT)
Towards Realistic Earth-Observation Constellation Scheduling: Benchmark and Methodology [15.1] 我々は、標準化されたベンチマークスイートと、Agile Earth Observation Satellitesの新しいスケジューリングモデルを紹介します。
当社のベンチマークスイートであるAEOS-Benchには、3,907ドルの微調整衛星資産と16,410ドルのシナリオが含まれています。
このベンチマークに基づいて,制約認識型アテンション機構を組み込んだTransformerベースのスケジューリングモデルであるAEOS-Formerを導入する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:31:47 GMT)
Test-Time Alignment of LLMs via Sampling-Based Optimal Control in pre-logit space [15.1] AISP(Adaptive importance sample on pre-logits)と呼ばれる新しいテスト時間アライメント手法を提案する。
AISPは、摂動の平均について期待される報酬を最大化するために、この摂動を暗黙の層から出力するプリロジットに適用する。
AISPは、使用済みサンプルの数よりも報奨の点で最高のサンプリング性能を発揮し、他の報奨ベースのテスト時間アライメント方法よりも高い報酬を達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:52:14 GMT)
Are LLMs Rigorous Logical Reasoners? Empowering Natural Language Proof Generation by Stepwise Decoding with Contrastive Learning [14.7] 近年の大規模言語モデルの進歩は、自然言語の証明計画に大きな進歩をもたらした。
本稿では, 逆学習による段階的復号化手法を提案し, 発電機の復号処理中に発生する2つの一般的な誤りに対処する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:48:09 GMT)
SpinalSAM-R1: A Vision-Language Multimodal Interactive System for Spine CT Segmentation [14.7] 我々は、細調整されたSAMとDeepSeek-R1を統合した視覚言語対話システムSpinalSAM-R1を提案する。
具体的には,SpinalSAM-R1は解剖誘導型アテンション機構を導入し,スピンセグメンテーション性能を向上する。
このシステムは、94.3%のパース精度と800ms以下の応答時間を持つ11の臨床手術をサポートする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:14:42 GMT)
How Should One Evaluate Monocular Depth Estimation? [14.7] 本論文は, 地中真実の様々な摂動に対する感度の観点から, 既存の指標を定量的に分析する。
相対的な表面の正規度に基づく新しいメトリクスと、新しい深度可視化ツールと、より優れた人間のアライメントを持つ複合メトリクスを作成するための原則的手法を導入する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:33:49 GMT)
Dual-VQE: A quantum algorithm to lower bound the ground-state energy [14.5] 変分量子固有解法 (VQE) はハミルトンの基底状態エネルギーを上界で推定する。
本稿では,二変量量子固有解法(Dual-VQE)を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:24:01 GMT)
Heuristic Adaptation of Potentially Misspecified Domain Support for Likelihood-Free Inference in Stochastic Dynamical Systems [14.4] ロボット工学において、確率自由推論(LFI)は、学習エージェントをパラメトリックな配置条件に適応させる領域分布を提供することができる。
この問題に対処するために、EDGE、MODE、CENTREの3つのLFI変種を提案する。
それぞれが推論ステップよりも後モードシフトを独自の方法で解釈し、LFIステップに統合されると、後モードの推論と共にサポートに適応する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:23:46 GMT)
Network Oblivious Transfer via Noisy Channels: Limits and Capacities [13.8] 両当事者間の不可避移動の情報理論的限界について検討する。
本稿では,正直な当事者のための多党間プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:35:57 GMT)
Reflecting on Empirical and Sustainability Aspects of Software Engineering Research in the Era of Large Language Models [13.5] 大規模言語モデル(LLM)の使用に関するソフトウェア工学(SE)研究は、ベンチマーク、汚染、複製性、持続可能性に関するいくつかの新しい課題を提起した。
本研究は,現在のICSEにおけるLCMベースのSE研究の概要を構造化し,実践の奨励と持続的欠点の両面に注目した。
我々は,LLMベースのSEの財務・環境コストに対処するため,ベンチマークの厳格性を強化し,複製性を向上させることを推奨する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:27:51 GMT)
An All-Reduce Compatible Top-K Compressor for Communication-Efficient Distributed Learning [13.4] 勾配圧縮機Rand-K$は構造情報を破棄し、実際は性能が良くない。
Top-K$は情報的エントリを保存するが、コントラクトプロパティを失い、コストがかかるAll-Reduce操作が必要になる。
ARC-Top-$K$は、勾配の軽量なスケッチを使用してノード間の空間パターンを整列し、インデックスフリーのAll-Gatherを可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:11:01 GMT)
LeMiCa: Lexicographic Minimax Path Caching for Efficient Diffusion-Based Video Generation [13.3] LeMiCaは、拡散型ビデオ生成のためのトレーニングフリーで効率的な加速フレームワークである。
我々は,最悪の経路誤差を明示的に拘束するLexicographic Minimax Path Optimization戦略を導入する。
提案手法はLatteモデルの2.9倍の高速化を実現し,Open-SoraのLPIPSスコア0.05に達する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:57:26 GMT)
ScoreAdv: Score-based Targeted Generation of Natural Adversarial Examples via Diffusion Models [13.3] 本稿では,ScoreAdvという拡散モデルに基づく逆例を生成する新しい手法を提案する。
本手法は, 無限個の自然逆例を生成でき, 分類モデルだけでなく, 検索モデルも攻撃できる。
その結果、ScoreAdvは推論効率を保ちながら、最先端の攻撃成功率と画像品質を達成できることを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:35:26 GMT)
Do Not Step Into the Same River Twice: Learning to Reason from Trial and Error [13.2] LTE (Learning to reason from Trial and Error) は、LLMが以前に生成した誤った回答と過剰な応答の問題を暗示するアプローチである。
Pass@1では6.38、Pass@kでは9.00、Qwen3-4B-Baseでは6つの数学ベンチマークで平均すると、通常のグループ相対ポリシー最適化(GRPO)よりも優れたLTEの有効性が検証された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:36:19 GMT)
SafePLUG: Empowering Multimodal LLMs with Pixel-Level Insight and Temporal Grounding for Traffic Accident Understanding [13.2] MLLM(Multimodal large language model)は、様々な視覚言語タスクにおいて顕著な進歩を遂げている。
本稿では,Pixel-Level Understanding と temporal Grounding を併用して,交通事故の包括的解析を可能にする新しいフレームワークであるSafePLUGを提案する。
多様な事故シナリオに着目したマルチモーダルな質問応答ペアを含む新しいデータセットを,詳細なピクセルレベルのアノテーションと時間的イベント境界でキュレートする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:11:01 GMT)
MSAD: A Deep Dive into Model Selection for Time series Anomaly Detection [13.2] 異常検出は時系列分析の基本的な課題である。
非常に異種時系列に適用した場合、全体的な最良の異常検出方法は存在しない。
既存のAutoMLソリューションは、残念ながら、時系列異常検出に直接適用できない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:09:51 GMT)
Understanding Hardness of Vision-Language Compositionality from A Token-level Causal Lens [12.9] 対照的な言語-イメージ 事前学習は強力なクロスモーダルな一般化をもたらす。
オブジェクト、属性、関係性に対する構成的推論では、永続的に失敗する。
完全モーダル不変アライメントを実現する擬似最適テキストエンコーダの存在を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:41:21 GMT)
Tight Differentially Private PCA via Matrix Coherence [12.9] 特異値分解と標準摂動機構に基づく単純で効率的なアルゴリズムが、プライベートランク-r$近似を返すことを示す。
私たちの推定器は、いくつかの体制において、芸術の状態を著しく上回ります。
我々は、同様の挙動がグラフの植込み問題を含む他の構造化モデルに対して成り立つと推測する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:47:26 GMT)
On Purely Private Covariance Estimation [12.9] 我々は、純粋な微分プライバシーの下で、$d$次元共分散行列を$Sigma$でリリースするための単純な摂動機構を示す。
少なくとも$ngeq d2/varepsilon$要素を持つ大規模なデータセットの場合、我々のメカニズムは、シテニコロフ2023の証明可能な最適のフロベニウス標準誤差を復元する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:18:53 GMT)
Detecting Early and Implicit Suicidal Ideation via Longitudinal and Information Environment Signals on Social Media [12.6] ソーシャルメディア上では、自殺観念(SI)を経験している多くの人は、その苦悩を明示的に明らかにしていない。
本研究では,ユーザの情報環境をモデル化する計算フレームワークを開発し,その長手姿勢履歴と近親者の談話の両方から構成する。
Redditで1000人(500ケースと500コントロール)を対象にした調査では、個人のみのベースラインよりも早期かつ暗黙的なSI検出が15%向上した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:09:51 GMT)
Likely Interpolants of Generative Models [12.5] 生成モデルの補間は、制御された生成、モデル検査などを可能にする。
ほとんどの生成モデルは、モデルまたはデータ次元に制限的な仮定なしで補間子の主観的概念を欠いている。
我々は、異なるメトリクスや確率分布と互換性のある遷移経路をターゲットとする一般的なスキームを開発する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:46:53 GMT)
Jasmine: A Simple, Performant and Scalable JAX-based World Modeling Codebase [12.5] Jasmineは、単一のホストから、最小限のコード変更で数百のアクセラレータにスケールする、パフォーマンスの高いJAXベースの世界モデリングシステムです。
Jasmineは、以前のオープン実装と比較してCoinRunケーススタディの桁違いの高速な再現を実現している。
モデルファミリ間の厳密なベンチマークパイプラインとアーキテクチャ改善のためのインフラストラクチャを構築します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:03:57 GMT)
Cross-view Localization and Synthesis -- Datasets, Challenges and Opportunities [12.4] クロスビューの局所化と合成は、クロスビューの視覚的理解における2つの基本的なタスクである。
これらのタスクは、自律ナビゲーション、都市計画、拡張現実に広く応用されているため、注目を集めている。
近年、大規模なデータセットと新しいアプローチが利用可能になったことにより、急速な進歩が見られた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:07:25 GMT)
Evontree: Ontology Rule-Guided Self-Evolution of Large Language Models [12.4] Evontreeは、大規模言語モデル(LLM)内のドメイン知識を抽出、検証、拡張するために、少数の高品質なルールを利用する新しいフレームワークである。
Llama3-8B-InstructとMed42-v2による医学QAベンチマークの実験は、修正されていないモデルと教師付きベースラインの両方に対して一貫した性能を示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:53:45 GMT)
Dynamic Risk Assessments for Offensive Cybersecurity Agents [12.3] 我々は、敵が持つであろう様々な自由度を考慮して評価を行うべきだと論じる。
敵は、InterCode CTF上のエージェントのサイバーセキュリティ能力を、ベースラインと比較して40%以上改善できることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:12:31 GMT)
Distilling Multilingual Vision-Language Models: When Smaller Models Stay Multilingual [12.2] 本稿では,5つの蒸留方法における知識蒸留の制御実験について述べる。
モデルサイズが半減しても頑健性を維持したり、多言語検索を改善する構成もある。
しかし、他はクロスタスクの安定性を維持するのに失敗し、正確性だけを集約する設計に敏感なトレードオフを露呈する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:56:06 GMT)
PVMark: Enabling Public Verifiability for LLM Watermarking Schemes [12.1] ゼロ知識証明(ZKP)に基づくプラグインであるPVMarkを提案する。
PVMarkは、秘密鍵を開示することなく、第三者が透かし検出プロセスを公に検証できるようにする。
我々はPython、Rust、CircomでPVMarkの複数の変種を実装し、3つの透かしスキーム、3つのハッシュ関数、4つのZKPプロトコルの組み合わせをカバーしている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:58:44 GMT)
More of the Same: Persistent Representational Harms Under Increased Representation [12.1] モデルがバイオグラフィーやペルソナを生成するように促された場合,女性は男性よりも表現力が高いことを示す。
この結果、表現的害、ステレオタイプ、新自由主義の理想が拡大する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:47:16 GMT)
DeepOSets: Non-Autoregressive In-Context Learning with Permutation-Invariance Inductive Bias [11.6] In-context Learning(ICL)は、いくつかの機械学習モデルによって、モデルパラメータの更新なしに学習できる注目すべき能力である。
本稿では、ICLが非自己回帰型ニューラルアーキテクチャにおいて、ハードコードな置換不変分散帰納バイアスで現れることを実証する。
本稿では、置換不変回帰学習演算子を表現し、DeepOSetsが演算子のクラスの普遍近似子であることを証明する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:09:06 GMT)
Inference-Cost-Aware Dynamic Tree Construction for Efficient Inference in Large Language Models [11.5] 大規模言語モデル(LLM)は、自動回帰設計と大規模化に起因する推論遅延の大きな問題に直面している。
我々は、推論コストを考慮したCASTと呼ばれる新しい動的ツリーデコーディング手法を導入する。
提案手法は,従来の復号法よりも最大5.2倍高速な高速化を実現した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:04:36 GMT)
Chain of Time: In-Context Physical Simulation with Image Generation Models [11.5] 時間の連鎖は、機械学習における文脈内推論と人間のメンタルシミュレーションによって動機付けられている。
2次元グラフィックシミュレーションや自然3次元ビデオを含む,合成および実世界の領域にChain-of-Time法を適用した。
チェーンオブタイムシミュレーションを用いることで、最先端画像生成モデルの性能が大幅に向上する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:46:26 GMT)
Stop Wasting Your Tokens: Towards Efficient Runtime Multi-Agent Systems [11.4] SupervisorAgentは、ランタイムと適応的な監視のための軽量でモジュール化されたフレームワークです。
SupervisorAgentは、エラーを積極的に修正し、非効率な振る舞いを誘導し、観察を浄化するために、臨界点に介入する。
挑戦的なGAIAベンチマークでは、SupervisorAgentは成功率を損なうことなく、Smolagentフレームワークのトークン消費を平均29.45%削減した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:12:59 GMT)
When In Doubt, Abstain: The Impact of Abstention on Strategic Classification [11.4] 本稿では,戦略的分類の文脈における棄権について検討する。
最適な棄権は、主観的効用が非棄権的条件よりも悪くないことを保証することを示す。
また、禁忌は操作の抑止力としても機能し、操作するエージェントがポジティブな結果を得るのにコストがかかることも示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:41:25 GMT)
MoME: Mixture of Visual Language Medical Experts for Medical Imaging Segmentation [11.4] 医用画像のためのビジュアル言語医療専門家の混在であるMoMEを提案する。
MoMEは、Large Language Models (LLM)で広く使われているMixture of Experts (MoE)パラダイムを成功させた。
MoMEは総合的な医用画像セグメンテーションベンチマークで高い性能を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:50:15 GMT)
Model-Document Protocol for AI Search [11.4] 原文が大規模言語モデル (LLM) にどのようにブリッジされているかを形式化する汎用フレームワークである Model-Document Protocol (MDP) を導入する。
MDPは、検索をパスフェッチとして扱う代わりに、構造化されていない文書をタスク固有のLCM対応の入力に変換する複数の経路を定義している。
本稿では,エージェントプロセスを通じてプロトコルを実現するMPP-Agentを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:52:17 GMT)
Quantum Nonlocality under Latency Constraints [11.3] ベル不等式違反(英: Bell inequality violation)とは、複数の非通信相手が量子資源を用いて相関を示す現象である。
我々は,非局所的なゲームを拡張した数学的フレームワークである待ち時間制約ゲームを紹介した。
遅延制約ゲームの概念は、高周波トレーディング、分散コンピューティング、コンピュータアーキテクチャ、分散制御システムなど、現実世界の応用を持つことができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:56:35 GMT)
Is Grokking a Computational Glass Relaxation? [11.3] トレーニング性能がほぼ完璧に到達した後,ニューラルネットワークが突然一般化するグラッキング現象について検討する。
グラッキングの記憶-一般化遷移におけるNOエントロピー障壁は、グラキングを一階相転移と定義する以前の理論に挑戦する。
グラッキングの非平衡な性質に触発され、ワンランダウ分子動力学に基づくおもちゃのWanDを開発し、グラッキングを制約なく排除し、高ノルム一般化解を求めることができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:39:13 GMT)
Efficient Generative AI Boosts Probabilistic Forecasting of Sudden Stratospheric Warmings [11.3] 急激な成層圏温暖化(SSWs)は、季節的な予測可能性の主要な源であり、極端な冬の天候の要因である。
本稿では,フローマッチングに基づく生成AIモデル(FM-Cast)を開発した。
FM-Castは10イベントの開始、強度、形態を20日前に正確に予測し、50%以上のアンサンブル精度を達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:16:22 GMT)
Personalized Treatment Outcome Prediction from Scarce Data via Dual-Channel Knowledge Distillation and Adaptive Fusion [11.2] 本研究では, 希少かつ高忠実な試験データに対する予測を強化するために, クロスフィデリティ知識蒸留・適応核融合ネットワーク(CFKD-AFN)を提案する。
慢性閉塞性肺疾患の治療成績予測に関する実験は、最先端の方法よりもCFKD-AFNが有意に改善したことを示している。
我々はCFKD-AFNを解釈可能な変種に拡張し,潜伏医療のセマンティクスを探究し,臨床的意思決定を支援する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:50:12 GMT)
Nearly Minimax Discrete Distribution Estimation in Kullback-Leibler Divergence with High Probability [11.2] クルバック・リーブラー分岐の確率が高い大きさの領域で離散分布を推定する問題を考察する。
最適率は$big(K + ln(K)ln(K) + ln(K)ln(1/delta)big) /n$ at error probability $delta$ and sample size $n$, which pins down the rate up the doublely logarithmic factor $ln ln K$ that multiplies $K$。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:32:37 GMT)
Red Teaming AI Red Teaming [11.1] 我々は、レッド・チームリングの元々の意図と、生成的AIの文脈におけるモデルレベルの欠陥の発見に焦点を合わせることには、大きなギャップがあることを論じる。
マクロレベルのシステム・レッド・チームとマイクロレベルのモデル・レッド・チームという2つのレベルで、AIシステムにおけるレッド・チーム化を運用する包括的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:23:25 GMT)
On Measuring Localization of Shortcuts in Deep Networks [10.9] ショートカットはトレーニング中にうまく機能するが、一般化に失敗する刺激的なルールであり、ディープネットワークの信頼性に対する大きな課題である。
我々は,VGG,ResNet,DeiT,ConvNeXtアーキテクチャにまたがるCIFAR-10,Waterbirds,CelebAデータセットのショートカットについて検討した。
ショートカット学習は特定のレイヤにローカライズされず、ネットワーク全体に分散していることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:51:03 GMT)
Hankel Singular Value Regularization for Highly Compressible State Space Models [10.9] 状態空間モデルのハンケル特異値の和を正則化すると、これらの特異値の高速な崩壊が起こり、圧縮可能なモデルになる。
Long Range Arenaベンチマークの実験では、正規化された状態空間層は標準状態空間層よりも最大10$times$圧縮可能であることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:07:20 GMT)
Beyond Benchmarks: The Economics of AI Inference [10.8] LLM(Large Language Models)の推論コストは,その商業的可能性や普及度を決定する上で重要な要因となっている。
我々は,その限界コスト,スケールの経済,および出力の質を,様々な性能構成で分析する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:49:27 GMT)
Faithful and Fast Influence Function via Advanced Sampling [10.8] 特徴量とロジットに基づく2つの高度なサンプリング手法を提案する。
これらのサンプルは、機能やログの分布を考慮して、データセット全体の小さいが代表的なサブセットを選択する。
モデルがいかに効率的にクラスを忘れるかを測定するためにF1スコアを用いて、クラス除去実験を通じてアプローチを検証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:55:19 GMT)
Learning Pseudorandom Numbers with Transformers: Permuted Congruential Generators, Curricula, and Interpretability [10.8] 変圧器モデルによる変圧器発電機(PCG)のシーケンス学習能力について検討する。
PCGは、一連のビットワイズシフト、XOR、回転、切り離しを隠された状態に適用することで、線形合同発生器(LCG)に対してかなりの困難をもたらす。
いずれにせよ,トランスフォーマーは多様なPCG変種からの未知のシーケンスに対して,コンテクスト内での予測を成功させることができることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:09 GMT)
Semantic Frame Aggregation-based Transformer for Live Video Comment Generation [10.6] 本稿では,ライブビデオストリーム上で,文脈的に適切なビデオコメントを生成するための新しいモデルを提案する。
私たちはCLIPの視覚テキストマルチモーダル知識を用いて、進行中の視聴者会話に対する意味的関連性に基づいて、映像フレームに重みを割り当てる。
コメントデコーダとクロスアテンション機構により、生成されたコメントは、チャットとビデオの両方の文脈的手がかりを反映する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:01:04 GMT)
Quantum Gated Recurrent GAN with Gaussian Uncertainty for Network Anomaly Detection [10.4] 時系列データの異常検出は、ネットワークセキュリティに重要な意味を持つ重要な課題である。
最近の量子機械学習アプローチでは、異常検出のための複雑なデータ分布をキャプチャするが、制限されたキュービット数によって制限される。
本稿では,QGRU(Quantum Gated Recurrent Unit)をベースとしたGAN(Generative Adversarial Network)によるネットワーク異常検出手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:39:44 GMT)
Security Risk of Misalignment between Text and Image in Multi-modal Model [10.4] 本稿では,任意のプロンプトと連動して入力画像を変更することで,プロンプト自体を変更することなく,生成されたコンテンツを操作するための新たな攻撃を提案する。
PReMAは、主にNSFWコンテンツを生成するために逆方向のプロンプトを生成する従来の方法と区別して、単に逆方向の画像を生成することで、モデル出力を操作する最初の攻撃である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:31:20 GMT)
JOGS: Joint Optimization of Pose Estimation and 3D Gaussian Splatting [10.4] 本稿では,3次元ガウス点とカメラポーズを事前校正入力を必要とせずに協調的に最適化する統合フレームワークを提案する。
我々のアプローチは、3Dガウスパラメータを反復的に洗練し、新しいコ最適化戦略によってカメラのポーズを更新する。
提案手法は,再建品質において既存のCOLMAPフリー技術よりも優れており,標準のCOLMAPベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:00:07 GMT)
BhashaBench V1: A Comprehensive Benchmark for the Quadrant of Indic Domains [10.3] BhashaBench V1は74,166個の厳密にキュレートされた質問応答対を含み、英語では52,494個、ヒンディー語では21,672個である。
農業、法律、財政、アユルヴェーダの4つの主要領域にまたがる。
29以上のLLMの評価では、ドメインと言語固有のパフォーマンスギャップが顕著である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:48:05 GMT)
Cycle Diffusion Model for Counterfactual Image Generation [10.3] サイクル拡散モデル(CDM)は生成された画像と元の画像の一貫性を強制する。
コンディショニングの精度を向上し、FIDとSSIMで測定した画質を向上させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:29:32 GMT)
The "4W+1H" of Software Supply Chain Security Checklist for Critical Infrastructure [10.2] ソフトウェアサプライチェーン攻撃の頻度と高度化は、重要なインフラセクターに深刻なリスクをもたらす。
意識の高まりにもかかわらず、既存のセキュリティプラクティスは断片化され、不十分である。
CIドメインに明示的に適合するフレームワークはほとんどない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:32:11 GMT)
On the Role of Context for Discourse Relation Classification in Scientific Writing [10.1] 私たちは、AIが生成した科学的主張を支持する証拠を見つけるために、談話レベルの情報を使うことに興味があります。
この目的に向けての最初のステップは、科学的執筆における談話構造を推定する作業を検討することである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:05:36 GMT)
TokenWeave: Efficient Compute-Communication Overlap for Distributed LLM Inference [10.0] 大規模言語モデル(LLM)の分散推論は、NVLinkのような高速な相互接続を介して接続されたGPUでさえ、最大20%のオーバーヘッドを発生させることができる。
これらの課題に対処するため、TokenWeaveを紹介します。
私たちの評価では、レイテンシの1.29倍のスピードアップと、複数のモデルやワークロードで1.26倍のスループットを実現しています。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:34:01 GMT)
Benchmarking Simulacra AI's Quantum Accurate Synthetic Data Generation for Chemical Sciences [9.9] 我々は,シミュラクラの合成データ生成パイプラインを,小規模から大規模システムのデータセット上で,最先端のMicrosoftパイプラインと比較した。
その結果,SimulacraのLWM(Large Wavefunction Models)パイプラインは,最先端の変分モンテカルロ(VMC)サンプリングアルゴリズムと組み合わせることで,データ生成コストを15~50倍に削減できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:19:56 GMT)
Predicting Household Water Consumption Using Satellite and Street View Images in Two Indian Cities [9.9] 急速な都市化地域での家庭用水利用のモニタリングは、費用がかかる時間集約的な列挙法と調査によって妨げられている。
本研究では,インド・ハバリ=ダルワッドの住宅用水消費予測に,Google Street View (GSV)セグメンテーションが利用できるかを検討した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:32:34 GMT)
A Research Roadmap for Augmenting Software Engineering Processes and Software Products with Generative AI [9.9] Generative AI(GenAI)は、ソフトウェアエンジニアリング(SE)のプラクティスを急速に変革している。
本稿では,GenAIを付加したSEのロードマップ構築にデザインサイエンス研究を適用した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:59:01 GMT)
Model Provenance Testing for Large Language Models [9.7] あるモデルが別のモデルから派生しているかどうかをテストするためのフレームワークを開発します。
我々のアプローチは、実世界のモデル導出がモデル出力のかなりの類似性を保っているというキーとなる観察に基づいている。
モデルに対するブラックボックスアクセスのみを用いて、関係のないモデルによって確立されたベースラインとモデル類似性を比較するために、複数の仮説テストを用いる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:22:30 GMT)
SpotIt: Evaluating Text-to-SQL Evaluation with Formal Verification [9.7] 本研究では,提案する新たな評価パイプラインであるSpotItを提案する。そこでは,正規の有界同値検証エンジンが,生成したクエリと接地トルースクエリを区別するデータベースを積極的に検索する。
BIRDデータセット上で10個のテキスト・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・トゥ・ザ』の性能評価は,テストベース手法が生成したクエリとグランド・トゥルースの違いを見落としていることを示唆している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:29:54 GMT)
Don't Let It Fade: Preserving Edits in Diffusion Language Models via Token Timestep Allocation [9.7] 均一な更新とコンテキスト更新がタイムステップ間でトークンレベルの変動を誘発する更新忘れについて説明する。
token Timestep Allocation (TTA) を提案する。これはトークンのタイムステップごとのスケジュールによって、ソフトでセマンティックなトークンの順序付けを実現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:21:05 GMT)
Unravelling the Mechanisms of Manipulating Numbers in Language Models [9.6] 言語モデルが数値を操作し、これらのメカニズムの低い精度境界を定量化する方法について検討する。
誤りに直面するにもかかわらず、異なる言語モデルは、体系的、高度に正確で普遍的な数値の交換可能な表現を学習する。
以上の結果から,事前学習したLLMが数値を操作し,より正確な探索手法の可能性を概説した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:08:50 GMT)
PT-DETR: Small Target Detection Based on Partially-Aware Detail Focus [9.6] 本稿では,UAV画像中の小物体を対象とした新しい検出アルゴリズムPT-DETRを提案する。
バックボーンネットワークでは,小さなオブジェクトに対する特徴抽出を強化するために,部分認識詳細フォーカス (PADF) モジュールを導入する。
また,MFFF (Median-Frequency Feature Fusion) モジュールの設計を行った。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:57:20 GMT)
The Oversight Game: Learning to Cooperatively Balance an AI Agent's Safety and Autonomy [9.6] エージェントが自律的に行動するか(プレイ)それとも延期するかを選択できる最小限の制御インタフェースについて検討する。
エージェントがフェールした場合、人間の選択によって結果が決定され、修正アクションやシステム停止につながる可能性がある。
本分析では,アライメント保証を提供するゲームクラスであるMarkov Potential Game (MPG) として,このゲームが適するケースに着目した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:46:49 GMT)
Mind the Gaps: Auditing and Reducing Group Inequity in Large-Scale Mobility Prediction [9.4] 次のロケーション予測は、モビリティ、小売、公衆衛生のアプリケーションの増加を支えている。
本稿では,大規模データセット上で訓練された最先端のモビリティ予測モデルを評価する。
基礎となるデータセットから生じる系統的な差異が示され、位置とユーザグループに基づいて精度に大きな違いが生じる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:54:33 GMT)
Inside CORE-KG: Evaluating Structured Prompting and Coreference Resolution for Knowledge Graphs [9.2] 法的事例文書は重要な洞察を提供するが、しばしば非構造的で、語彙的に密集しており、曖昧さやシフトする参照で満たされている。
CORE-KGフレームワークは、型認識型コア参照モジュールとドメイン誘導型構造化プロンプトを統合することで、これらの制限に対処する。
その結果,コア参照の解消はノード重複が28.32%増加し,ノイズノードが4.32%増加し,構造化されたプロンプトが除去され,ノード重複が4.34%増加し,ノイズノードが73.33%増加した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:05:55 GMT)
SCRIBE: Structured Chain Reasoning for Interactive Behaviour Explanations using Tool Calling [9.1] SCRIBEは、フィードバックレポートに関する学生の質問に対する有効な応答を生成するために、マルチホップでツール強化された推論のためのフレームワークである。
GPT-Judgeによる評価と108人の学生によるユーザスタディは、8B-SCRIBEモデルがより大きなモデルに匹敵する品質または優れた品質を達成していることを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:17:05 GMT)
Fit for Purpose? Deepfake Detection in the Real World [9.0] 本稿では,政治ディープフェイクス事件データベースに基づく最初の体系的ベンチマークを紹介する。
本研究は, 学術, 政府, 産業にまたがる最先端のディープフェイク検出器の系統的評価を含む。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:01:55 GMT)
Real-Time Neural Video Compression with Unified Intra and Inter Coding [9.0] 各フレームを1つのモデルで処理する、イントラ・インターコーディングとイントラ・コーディングを統一したNVCフレームワークを提案する。
本稿では,フレーム間冗長性を利用した2フレーム同時圧縮設計を提案する。
提案方式は,DCVC-RTを平均12.1%のBDレートで性能良くし,フレームあたりの安定性と品質を向上し,リアルタイム符号化/復号性能を維持している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:17:56 GMT)
Bias in Decision-Making for AI's Ethical Dilemmas: A Comparative Study of ChatGPT and Claude [9.0] 本研究は,9つの人気言語モデルが保護属性を含む倫理ジレンマにどのように反応するかを体系的に評価する。
単一属性と交叉属性の組み合わせにまたがる50,400回の試行において、モデルの倫理的嗜好、感度、安定性、クラスタリングパターンを評価する。
結果は、モデルタイプとジレンマコンテキストによって異なる好みを持つ、すべてのモデルで保護属性に顕著なバイアスが示される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:48:05 GMT)
LLMs as In-Context Meta-Learners for Model and Hyperparameter Selection [8.9] 大規模言語モデル (LLM) が文脈内メタラーナーとして機能するかどうかを検討する。
LLMはデータセットのメタデータを利用して、競合するモデルやハイパーパラメータを検索なしで推奨できることを示す。
これらの結果は、軽量で汎用的なアシスタントとしてLLMにとって有望な新しい役割を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:04:25 GMT)
On the Impact of Performative Risk Minimization for Binary Random Variables [8.9] 連立確率変数と線形能動シフトを用いた逐次能動リスク最小化問題に対する性能評価について検討した。
完全な情報の場合、PRMソリューションと影響測定の明確な公式を導出する。
我々の分析は、データシフトをモデル化しない代替品とPRMを対比し、PRMが増幅された副作用を持つことを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:17:24 GMT)
Evaluating Perspectival Biases in Cross-Modal Retrieval [8.9] 検索結果は、言語的有病率と文化的な関連によって形成された精査バイアスを反映している。
頻度バイアスとは、画像からテキストへの検索において、意味的に忠実なエントリよりも、一般的な言語からのエントリを好む傾向を指す。
第2に、関連バイアスは、テキスト・ツー・イメージ検索において意味論的に正しいものよりも、検索に文化的に関連付けられた画像を好む傾向を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:31:36 GMT)
A Comprehensive Evaluation and Practice of System Penetration Testing [8.9] 本稿では,系統的な浸透試験プロセスと技術的アプローチにより,システムのセキュリティを高める方法について検討する。
また、既存の浸透ツールを調べ、その強度、弱点、適用可能なドメインを分析し、ツールの選択で浸透テスターを導く。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:47:48 GMT)
Loquetier: A Virtualized Multi-LoRA Framework for Unified LLM Fine-tuning and Serving [8.9] Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)を下流タスクに適用するためのPEFT技術として広く採用されている。
LoRAファインチューニングをシームレスに統合し、単一のランタイム内で機能するフレームワークであるLoquetierを紹介します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:14:27 GMT)
Gradient Descent as Loss Landscape Navigation: a Normative Framework for Deriving Learning Rules [8.8] 本稿では,学習ルールを(部分的に観察可能な)損失景観をナビゲートするためのポリシーとして活用する理論的枠組みを提案する。
様々な仮定の下で、よく知られたルールがこのフレームワークの中で自然に現れる。
重みのようなリセット学習戦略は,タスクの不確実性に対する最適応答として理解できることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:56:35 GMT)
FlowQ-Net: A Generative Framework for Automated Quantum Circuit Design [8.7] 自動量子回路合成のための生成フレームワークであるtextscFlowQ-Net(Flow-based Quantum Design Network)を紹介する。
このフレームワークは、回路を順次構築するポリシーを学習し、それらをフレキシブルなユーザ定義報酬関数にサンプリングする。
シミュレーションにより,textscFlowQ-Netの有効性を実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:57:13 GMT)
Rethinking Optimal Verification Granularity for Compute-Efficient Test-Time Scaling [8.6] テストタイムスケーリング(TTS)は,大規模言語モデル(LLM)の推論能力の向上に有効であることが証明された。
検証は,(1)推論性能と(2)計算効率に影響を与えると同時に,TTSにおいて重要な役割を担っている。
本稿では、ビーム探索を一般化する統一アルゴリズムである可変粒度探索(VG-Search)と、可変粒度パラメータgによるベストオブNサンプリングを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:52:37 GMT)
PF-DAformer: Proximal Femur Segmentation via Domain Adaptive Transformer for Dual-Center QCT [8.4] 多施設定量的CT(QCT)に適したドメイン適応型トランスフォーマーセグメンテーションフレームワークを開発した。
当モデルでは, タラネ大学から1024個のQCT画像スキャン, ミネソタ州ロチェスターから384個の画像スキャンを行い, 大腿骨近位部セグメンテーションを行った。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:07:56 GMT)
Multi-Output Robust and Conjugate Gaussian Processes [8.3] 多出力ガウス過程(MOGP)回帰は、複数の相関応答変数間の依存関係をモデル化することができる。
アルタミラノらによって導入されたロバストで共役なガウス過程(RCGP)フレームワークを拡張し、一般化する。
この結果、多出力RCGP (MO-RCGP) は共役である証明可能な堅牢なMOGPであり、出力間での相関関係を共同でキャプチャする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:41:19 GMT)
Diamond quantum sensing at record high pressure up to 240 GPa [8.3] ダイヤモンド中の窒素空孔(NV)中心を利用した量子センシングは、変換技術として登場している。
NV構成と環境の最近の発展により、NV中心の運用圧力は140 GPa2,6,10,11に上昇した。
チタン(Ti)の超伝導転移をベンチマークとして,Meissner効果と捕捉フラックスを180GPaの超高圧で測定した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:34:40 GMT)
PROFIT: A Specialized Optimizer for Deep Fine Tuning [8.3] ProFITは、新しいタスクやデータセットの収束モデルをインクリメンタルに微調整するように設計された最初の1つである。
PROFITは、最適化プロセスの規則化を明示的に考慮し、収束モデルの性質を考慮に入れます。
画像分類からマルチモーダル言語モデルトレーニング,大規模動作予測に至るまで,様々なタスクにおける微調整手法より優れている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:38:31 GMT)
ExpertFlow: Adaptive Expert Scheduling and Memory Coordination for Efficient MoE Inference [8.3] ExpertFlowは、適応型エキスパートプリフェッチとキャッシュ対応ルーティングを組み合わせた、MoE推論のためのランタイムシステムである。
我々の評価では、ExpertFlowはモデルストール時間をベースラインの0.1%未満に短縮する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:29:27 GMT)
Hebrew Diacritics Restoration using Visual Representation [8.3] ゼロショット分類問題としてタスクをフレーム化するヘブライ語ダイアクリプティゼーションシステムであるDIVRITを提案する。
提案手法は単語レベルで動作し,各単語に対して最も適切な発音パターンを選択する。
DIVRITの重要な革新は、画像として非記述テキストを処理するヘブライ語ビジュアル言語モデルを使用することである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:15:16 GMT)
Adaptive Data Flywheel: Applying MAPE Control Loops to AI Agent Improvement [8.2] 我々は、NVIDIAのMixture-of-Experts (MoE) Knowledge AssistantであるNVInfo AIにおけるデータフライホイールの実践的な実装について述べる。
我々は、検索強化世代(RAG)パイプラインの障害に対処し、継続的な学習を可能にするクローズドループシステムを構築した。
ルーティングでは、Llama 3.1Bモデルを微調整8Bモデルに置き換え、96%の精度、モデルサイズ10倍の削減、70%のレイテンシ改善を実現した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:41:06 GMT)
SecureReviewer: Enhancing Large Language Models for Secure Code Review through Secure-aware Fine-tuning [8.2] コードレビュー中にセキュリティ関連の問題を特定し解決するためにSecureReviewerを提案する。
まず、セキュアなコードレビュー機能をトレーニングし評価するためのデータセットを構築します。
我々は、ドメイン固有のセキュリティ知識に生成されたコメントを基盤とするRAG技術を統合する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:06:11 GMT)
LINK-KG: LLM-Driven Coreference-Resolved Knowledge Graphs for Human Smuggling Networks [8.2] Link-KGは、3段階のLLM誘導コア参照解決パイプラインと下流KG抽出を統合したフレームワークである。
このアプローチのコアとなるのは、型固有のPromptキャッシュです。
Link-KGは平均ノード重複を45.21%、ノイズノードを32.22%削減する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:39:08 GMT)
Learning Geometry: A Framework for Building Adaptive Manifold Models through Metric Optimization [8.2] 本稿では,従来のパラメータ最適化を超越した機械学習のパラダイムを提案する。
既定位相を持つ多様体上の計量テンソル場を最適化することにより、モデル空間の幾何学的構造を動的に形成する。
この研究は、その幾何学とトポロジーを自律的に進化させることができる完全にダイナミックな「メタ・ラーナー」を構築するための確固たる基礎を築いた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:53:32 GMT)
AgriGS-SLAM: Orchard Mapping Across Seasons via Multi-View Gaussian Splatting SLAM [8.2] AgriGS-SLAMは、LiDARループとマルチカメラ3Dレンダリングを結合したVisual-LiDAR SLAMフレームワークである。
我々は,リンゴとナシ果樹園の畑のプラットフォームに,開花と収穫にシステムを展開する。
AgriGS-SLAMは、最近の最先端の3DGS-SLAMベースラインよりも、より鋭く、より安定した再構築と安定した軌道を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:08:23 GMT)
Measuring the Availability and Response Times of Public Encrypted DNS Resolvers [8.1] 我々は,北米,ヨーロッパ,アジアのグローバルバンテージポイントからDNSクエリ応答時間を測定する。
その結果,主流リゾルバよりも応答時間が長い非主流リゾルバが多かった。
しかし、一部の非主流リゾルバは、少なくとも主流リゾルバと同様に機能する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:21:46 GMT)
Robust fuzzy clustering for high-dimensional multivariate time series with outlier detection [8.1] RFCPCAは、多変量時系列データに適した、堅牢なファジィサブスペースクラスタリング手法である。
潜時構造を捕捉し、校正されたメンバーシップの不確実性を提供し、汚染下で安定なまま、フラグ列レベルのアウトリーチを提供する。
ドライバEEGでは、RFCPCAは関連するメソッドよりもクラスタリングの精度を向上し、不確実性と外れ値の構造のより信頼性の高い特徴を与える。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:16:28 GMT)
Hybrid LLM and Higher-Order Quantum Approximate Optimization for CSA Collateral Management [8.1] 我々は、ISDACredit Support Annexes (CSA)の下での金融・側方的最適化に対処する。
In integer lot, Schedule A haircuts, RA/MTA gating, issuer/currency/class caps create rugged, legally bounded search space。
このドメイン用に構築された認証可能なハイブリッドパイプラインを導入します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:46:40 GMT)
Pragmatic Theories Enhance Understanding of Implied Meanings in LLMs [8.1] 暗黙の意味を正確に解釈する能力は、人間のコミュニケーションや言語利用において重要な役割を担っている。
本研究は,言語モデルにプロンプトとして実用的理論を提供することが,文脈内学習の効果的な方法であることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:35:52 GMT)
SSCL-BW: Sample-Specific Clean-Label Backdoor Watermarking for Dataset Ownership Verification [8.0] 本稿では,サンプル特異的クリーンラベルバックドア透かし(SSCL-BW)を提案する。
U-Netベースの透かしサンプルジェネレータをトレーニングすることにより,サンプル毎に独自の透かしを生成する。
ベンチマークデータセットを用いた実験は,提案手法の有効性と潜在的な透かし除去攻撃に対する頑健性を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:13:53 GMT)
Quantifying Unextendibility via Virtual State Extension [8.0] 絡み合いの非共有性や非拡張性を定量化する新しい枠組みを導入する。
仮想拡張コストは、ランダム化されたプロトコルの最小シミュレーションコストとして定義される。
仮想拡張コストは、境界を蒸留し対数否定性に接続する絡み合い尺度であることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:22:15 GMT)
Can Agent Conquer Web? Exploring the Frontiers of ChatGPT Atlas Agent in Web Games [7.9] ChatGPT AtlasはWebページを分析し、ユーザの意図を処理し、ブラウザから直接カーソルとキーボード入力を実行することができる。
テストシナリオとしてブラウザベースのゲームを用いて,AtlasのWebインタラクション機能を早期に評価する。
以上の結果から,AtlasはSudokuのような論理的推論タスクで強く機能するが,正確なタイミングとモータ制御を必要とするリアルタイムゲームでは,かなり苦労していることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:35:51 GMT)
All You Need for Object Detection: From Pixels, Points, and Prompts to Next-Gen Fusion and Multimodal LLMs/VLMs in Autonomous Vehicles [7.9] 自律走行車(AV)は、インテリジェントな認識、意思決定、制御システムの進歩を通じて、交通の未来を変えつつある。
彼らの成功は、複雑でマルチモーダルな環境での信頼性の高いオブジェクト検出という、ひとつのコア能力と結びついている。
コンピュータビジョン(CV)と人工知能(AI)の最近の進歩は目覚ましい進歩をもたらした。
この調査は、AVにおける物体検出の前方的な分析を提供することによって、そのギャップを埋める。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:08:25 GMT)
Nek Minit: Harnessing Pragmatic Metacognitive Prompting for Explainable Sarcasm Detection of Australian and Indian English [7.9] サルカズムは、述べられた感情と暗示された感情の間に矛盾があるため、感情分析への挑戦である。
PMP(Pragmatic Metacognitive prompting)は、実用的推論に使用される認知にインスパイアされた技法である。
オーストラリア英語とインド英語のSarcasm検出にPMPを用いた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:18:23 GMT)
AIMeter: Measuring, Analyzing, and Visualizing Energy and Carbon Footprint of AI Workloads [7.8] AIMeterは、AIワークロード全体でのエネルギー使用、電力引き込み、ハードウェアパフォーマンス、二酸化炭素排出量の測定、分析、可視化のための包括的なソフトウェアツールキットである。
既存のAIフレームワークとシームレスに統合することにより、AIMeterは標準化されたレポートを提供し、詳細な時系列データをエクスポートする。
さらに、ハードウェアメトリクスとモデルパフォーマンスの詳細な相関分析を可能にし、ボトルネック識別とパフォーマンス向上を容易にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:14:59 GMT)
CodeWiki: Evaluating AI's Ability to Generate Holistic Documentation for Large-Scale Codebases [7.8] bftextCodeWikiは、7つのプログラミング言語にまたがるリポジトリレベルのドキュメントを自動化する統合フレームワークである。
CodeWikiは、3つの重要なイノベーションを紹介している: (i) 階層的な分解はアーキテクチャのコンテキストを複数のレベルの粒度で保存し、 (ii) スケーラブルな生成のための動的タスクデリゲートによる再帰的マルチエージェント処理、 (iii) アーキテクチャ図やデータフロー表現のようなビジュアルアーティファクトとテキスト記述を統合するマルチモーダル合成である。
CodeWikiは、プロプライエタリなモデルで68.79%の品質スコアを獲得し、クローズドソースのDeepWikiベースライン(64.06%)を4.73%上回った。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:38:03 GMT)
Understanding Generalization in Node and Link Prediction [7.7] 帰納的および帰納的ノードにおけるMPNNの一般化特性とリンク予測設定を統一的に解析するフレームワークを提案する。
提案手法は, 帰納的あるいは帰納的条件下での任意の分類タスクに対して, グラフを超えて適用することができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:05:04 GMT)
PEEL: A Poisoning-Exposing Encoding Theoretical Framework for Local Differential Privacy [7.7] ローカル微分プライバシ(LDP)はIoT(Internet of Things)において広く採用されているプライバシ保護モデルである
本稿では, LDP に対する Pisoning-Exposing intrusive framework であるPEEL を提案する。
非侵襲的な後処理モジュールとして、PEELはLPP摂動データを再エンコードすることで中毒効果を増幅する。
評価の結果, LDP統合PEELは, 毒性暴露の精度で4つの最先端の防御性能に優れていた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:29:02 GMT)
Uncertainty-Aware Diagnostics for Physics-Informed Machine Learning [7.7] 物理インフォームド機械学習(PIML)は、しばしば微分方程式制約の形で、物理データにモデルを適合させるプロセスに統合する。
PIMLモデルの品質を測定するため,PILEスコア(Physical-Informed Log Evidence)を導入する。
PILEは、カーネル帯域幅、最小二乗正規化重み、カーネル関数の選択など、様々なモデルパラメータに対して優れた選択を得られることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:05:49 GMT)
Online Adaptation for Flying Quadrotors in Tight Formations [7.4] 複雑な空力的なウェイクインタラクションは、チームだけでなく、個々のチームメンバーを不安定にします。
適応型混合学習に基づく制御フレームワークであるL1 KNODE-DW MPCを提案する。
提案手法は, 飛行中, 近接して垂直に3つのクアッドロータを配置できることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:46:59 GMT)
DSDE: Dynamic Speculative Decoding with KLD Stability for Real-World Serving [7.4] 本稿では, ポストホック, 診断信号の新たなクラスを探索し, 動的適応のための新しい方向について検討する。
本稿では,2つの主要コンポーネント上に構築されたトレーニングフリーフレームワークであるDynamic Speculative Decoding Engine (DSDE)を提案する。
実験では、動的適応にKLDベースの安定性信号を使用する可能性を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:05:44 GMT)
QCoder Benchmark: Bridging Language Generation and Quantum Hardware through Simulator-Based Feedback [7.4] 本稿では,大規模言語モデル(LLM)を量子プログラミングで評価する評価フレームワークであるQCoder Benchmarkを紹介する。
提案ベンチマークは,従来のPython実行以上の量子シミュレータ環境による評価をサポートする。
GPT-4oのような先進的なモデルでさえ18.97%の精度しか達成せず、ベンチマークの難しさを強調している。
対照的に、o3のような推論ベースのモデルは78%の精度に達し、人間の書いたコードの平均成功率を上回っている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:27:35 GMT)
Energy Approach from $\varepsilon$-Graph to Continuum Diffusion Model with Connectivity Functional [7.3] 我々は、離散エネルギーとその連続体が少なくとも$O(varepsilon)$で異なることを証明している。
本稿では,エッジウェイトデータから接続密度を再構築するニューラルネットワーク手法を提案する。
この設定では、通常の定数拡散係数は、学習された密度によって生成される空間変化係数に置き換えられ、従来の定数拡散モデルとは大きく異なるダイナミクスが得られる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:24:17 GMT)
Simulating and Experimenting with Social Media Mobilization Using LLM Agents [7.3] 目覚ましい6100万人のFacebook実験 citepbond201261 に基づいて,エージェントベースのシミュレーションフレームワークを開発した。
我々は、実際の米国国勢調査人口分布、Twitterネットワークトポロジ、および異種大言語モデル(LLM)エージェントを統合し、投票者投票における動員メッセージの効果を検討する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:43:28 GMT)
SAMRI: Segment Anything Model for MRI [7.2] 畳み込みニューラルネットワーク(CNN)ベースの手法は正確で効率的であるが、MRIの可変コントラスト、強度不均一性、プロトコルによく一般化される。
全身臓器と病理組織にまたがる1100万個のMRスライスをトレーニングし,評価したMRI特化SAMであるSAMRIを報告する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:04:00 GMT)
FASL-Seg: Anatomy and Tool Segmentation of Surgical Scenes [7.0] 特徴適応型空間局在モデル(FASL-Seg)を提案する。
2つの異なる処理ストリームを通じて、機能の複数の詳細レベルをキャプチャするように設計されている。
外科的セグメンテーションのベンチマークデータセットであるEndoVis18とEndoVis17でテストされている。
FASL-Segは、EndoVis18の部品と解剖学的セグメンテーションに72.71%の平均的結合(mIoU)を達成し、SOTAを5%改善した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:10:05 GMT)
Posterior Sampling by Combining Diffusion Models with Annealed Langevin Dynamics [7.0] 後方サンプリングは、塗装、脱臭、MRI再構成などのタスクのための正確で公正なフレームワークを提供する。
我々は、拡散モデルとランゲヴィン力学の変種を組み合わせることで、スコア誤差の$L4$バウンドだけで条件付きサンプリングを実現することを証明した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:17:27 GMT)
MoTDiff: High-resolution Motion Trajectory estimation from a single blurred image using Diffusion models [7.0] 拡散モデル(MoTDiff)を用いた第1次高分解能(HR)運動軌道推定フレームワークを提案する。
提案したMoTDiffは,1)1つのぼやけた画像から抽出したマルチスケール特徴写像を条件として利用する新しい条件拡散フレームワークと,2)微細な運動軌跡の正確な同定を促進するための新たな訓練方法とからなる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:24:02 GMT)
Kad: A Framework for Proxy-based Test-time Alignment with Knapsack Approximation Deferral [6.9] 大きな言語モデル(LLM)は、ダウンストリームのタスク要求とスタイルの好みに従うために、さらに整合性を必要とする。
LLMのサイズが拡大するにつれて、アライメント手順の計算コストは違法に増加する。
本稿では,プロキシベースのテスト時間アライメントによるコスト回避手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:38:45 GMT)
GFlowNets for Learning Better Drug-Drug Interaction Representations [6.9] 本稿では,生成フローネットワーク(GFlowNet)と変分グラフオートエンコーダ(VGAE)を組み合わせて,希少クラスの合成サンプルを生成するフレームワークを提案する。
我々のアプローチは、相互作用タイプ間の予測性能を高め、臨床信頼性を向上する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:59:28 GMT)
Modeling of simple bandpass filters: bandwidth broadening of Josephson parametric devices due to non-Markovian coupling to dressed transmission-line modes [6.9] 単純結合ネットワークを用いたジョセフソンパラメトリックデバイスの帯域幅工学について検討する。
この結果から,単純な結合ネットワークを用いたジョセフソンデバイスの帯域幅工学の知見が得られた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:44:22 GMT)
Comparing human and LLM politeness strategies in free production [6.9] 大規模言語モデル(LLM)におけるポリット音声の基本的なアライメントの課題
我々は,LLM が,制約された作業とオープンな作業の両方において,人間と LLM の応答を比較することによって,同様に文脈に敏感なレパートリーを採用できるかどうかを検討する。
大規模モデルでは計算実用学の文献から重要な選好を再現することができ、人間の評価者は驚くほどオープンな文脈でLLM生成の応答を好んでいる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:41:15 GMT)
AI Mathematician as a Partner in Advancing Mathematical Discovery - A Case Study in Homogenization Theory [6.9] 本稿では,AIMシステムを単なる問題解決者ではなく研究パートナーとして機能させる方法について検討する。
人間の直感と機械計算が相互に補完し合うかを明らかにする。
このアプローチは完全かつ検証可能な証明をもたらし、より広範に、体系的な人間とAIの共推論が数学的発見のフロンティアをいかに前進させるかを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:22:15 GMT)
Security Modelling for Cyber-Physical Systems: A Systematic Literature Review [6.9] サイバー物理システムは、デジタル技術とエンジニアリングドメインの交差点にある。
CPSに対する主要なサイバーセキュリティ攻撃は、これらのシステムの脆弱性に注意を向けている。
この調査は、脅威とアタックの両方を包含する、CPSセキュリティモデリングに関する最先端の研究を掘り下げている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:04:30 GMT)
A Three-Stage Bayesian Transfer Learning Framework to Improve Predictions in Data-Scarce Domains [6.8] ドメイン・アドバイサル・ニューラルネットワーク(DANN)は、半教師付き環境での大きなドメインシフトの下での転送を改善する。
本研究は,ベイズ領域逆ニューラルネットワーク(B-DANN)の完全教師付き3段階フレームワークを提案する。
本研究の結果から,B-DANN法は予測精度と一般化を向上し,核工学における他の領域を支援する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:30:53 GMT)
Is Limited Participant Diversity Impeding EEG-based Machine Learning? [6.8] 脳波記録を小さなセグメントに分割してサンプル数を増やすのが一般的である。
我々はこれをマルチレベルデータ生成プロセスとして概念化し、モデル性能のスケーリング挙動について検討する。
次に、同じフレームワークを使用して、限られたデータ問題に対処するために設計されたさまざまなML戦略の有効性を調査します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:10:31 GMT)
Entanglement Superactivation in Multiphoton Distillation Networks [6.8] 量子ネットワークでは、残留状態はさらなるタスクに十分な絡み合いを欠く可能性があるが、リサイクル可能な隠れた量子資源を保持することができる。
ネットワーク性能を最適化するためには, 真の多粒子絡みやアインシュタイン-ポドルスキー-ローゼン対などの絡み合い資源を抽出するために, これらの状態の効率的なリサイクルが不可欠である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:14:53 GMT)
HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location [6.7] 大規模言語モデル(LLM)は、異なるサービスレベルの目的(SLO)を持つ幅広いアプリケーションを容易にした。
既存のデプロイメントモデルは、各ワークロードにマシンを割り当て、SLO管理を単純化するが、リソース利用の低さにつながることが多い。
本稿では、オンラインおよびオフラインワークロードの効率的なコロケーションを可能にする干渉対応LLMサービスシステムであるHyGenを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:41:07 GMT)
Decoupled Multimodal Fusion for User Interest Modeling in Click-Through Rate Prediction [6.7] ユーザ関心モデリングのためのIDベースの協調表現とマルチモーダル表現とのきめ細かい相互作用を可能にするために,Decoupled Multimodal Fusion (DMF)を提案する。
我々は、異なる埋め込み空間にまたがるセマンティックギャップをブリッジするターゲット認識機能を構築し、それらをサイド情報として活用し、ユーザ関心モデリングの有効性を高める。
DMFは国際的なeコマースプラットフォームの製品レコメンデーションシステムにデプロイされ、CTCVRの5.30%とGMVの7.43%の相対的な改善を実現している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:33:58 GMT)
Distributed optimization: designed for federated learning [6.6] Federated Learning(FL)は、プライバシ保護制約の下で分散コラボレーション機械学習フレームワークである。
本稿では,拡張ラグランジアン手法に基づく分散最適化アルゴリズムのクラスを提案する。
数値実験により,提案アルゴリズムは大規模設定において高い性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:25:58 GMT)
ε-Seg: Sparsely Supervised Semantic Segmentation of Microscopy Data [6.6] epsilon-Segは階層的変動オートエンコーダ(HVAE)に基づく方法である
中心領域マスキング、ラベルコントラスト学習(CL)、ガウス混合モデル(GMM)、クラスタリングフリーラベル予測を取り入れたepsilon-Segを紹介する。
以上の結果から,エプシロンセグは複雑な生体画像データに対して,厳密に制御されたセグメンテーションの結果を得ることが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:38:06 GMT)
GLYPH-SR: Can We Achieve Both High-Quality Image Super-Resolution and High-Fidelity Text Recovery via VLM-guided Latent Diffusion Model? [6.6] シーンテキスト(Scene-text)、すなわち、サイン、製品ラベル、店頭などの自然画像に埋め込まれたテキストは、しばしば最も実行可能な情報を運ぶ。
GLYPH-SRは、OCRデータでガイドされるText-SR Fusion ControlNet(TS-ControlNet)と、テキスト中心とシーン中心のガイダンスを交互に切り替えるピンポンスケジューラを使用している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:46:28 GMT)
Shilling Recommender Systems by Generating Side-feature-aware Fake User Profiles [6.6] Leg-UPフレームワークを拡張して、サイド機能を導入し、サイド機能対応のフェイクユーザプロファイルの生成を可能にします。
ベンチマーク実験により,本手法はステルス性を維持しながら強力な攻撃性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:29:37 GMT)
Collab-REC: An LLM-based Agentic Framework for Balancing Recommendations in Tourism [6.5] Collab-RECは、人気バイアスに対処し、観光レコメンデーションの多様性を高めるために設計されたマルチエージェントフレームワークである。
ヨーロッパの都市クェリの実験では、Collab-RECは単一エージェントのベースラインに比べて多様性と全体的な妥当性を改善している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:10:33 GMT)
Direct Debiased Machine Learning via Bregman Divergence Minimization [6.4] エンド・ツー・エンド・アルゴリズムを用いた機械学習フレームワークを開発した。
我々は,ニュアンスパラメータ,回帰関数,リース表現器を定式化する。
Neyman のターゲット推定には Riesz の表現子推定が含まれており,Bregman の発散率を用いて不一致を計測する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:55:38 GMT)
Bridging the Gap between Empirical Welfare Maximization and Conditional Average Treatment Effect Estimation in Policy Learning [6.4] 政策学習には、経験的人口福祉(EWM)アプローチとプラグインアプローチの2つの主要なアプローチがある。
この研究は、両者が本質的に同じ最適化問題に基づいていることを示すことによって、両者のギャップを埋めるものである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:23:40 GMT)
A Unified Theory for Causal Inference: Direct Debiased Machine Learning via Bregman-Riesz Regression [6.4] 本稿では、リース回帰、共変量バランス、密度比推定(DRE)、平均処理効果(ATE)推定におけるマッチング推定器を統合する因果推論の統一理論を紹介する。
ATE推定では、バランスウェイトと結果の回帰関数が重要な役割を果たす。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:56:47 GMT)
AI's Social Forcefield: Reshaping Distributed Cognition in Human-AI Teams [6.4] AIは、コラボレーションの社会的および認知的構造を積極的に再認識していることを示す。
AI参加はチームの分散認知アーキテクチャを再編成することを示す。
私たちは、チーム内のAIを社会的に影響力のあるアクターとして再考している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:09:59 GMT)
The Denario project: Deep knowledge AI agents for scientific discovery [6.4] 私たちは、科学研究アシスタントとして機能するように設計されたAIマルチエージェントシステムであるDenarioを紹介します。
アイデアの生成、文献の確認、研究計画の策定、コードの作成と実行、プロットの作成、科学論文の起草とレビューなど、さまざまなタスクをこなすことができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:00:12 GMT)
AdSum: Two-stream Audio-visual Summarization for Automated Video Advertisement Clipping [6.3] 本稿では,映像要約技術を用いた自動ビデオ広告クリッピングのためのフレームワークを提案する。
私たちは、特に広告用に調整されたショットセレクション問題として、最初にビデオクリップをフレーム化した人物です。
広告特化データセットの欠如に対処するため,30秒広告と15秒広告の102対からなる新しいデータセットであるAdSum204を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:59:37 GMT)
Detecting Data Contamination in LLMs via In-Context Learning [6.3] CoDeC(Contamination Detection via Context)は、大規模言語モデルのトレーニングデータ汚染を検出し定量化する手法である。
CoDeCは、トレーニング中に記憶されたデータとトレーニングディストリビューション外のデータを、コンテキスト内学習がモデルパフォーマンスにどのように影響するかを測定することで区別する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:50:05 GMT)
Statistical Inference for Matching Decisions via Matrix Completion under Dependent Missingness [6.3] 本研究では,3つの正準機構,すなわち1対1,1対1のランダム到着と1対1のランダム到着,および2対2のランダム到着の非最適進入アルゴリズムを提案する。
実験により,提案手法は精度の高い信頼区間推定と効率的な評価を提供することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:31:32 GMT)
Forcrat: Automatic I/O API Translation from C to Rust via Origin and Capability Analysis [6.2] ライブラリ機能の重要なサブセットであるI/O APIを置き換えることに重点を置いています。
本稿では,2つの静的解析手法,起点解析と機能解析,エラーソース解析を提案し,その結果を用いてI/O APIを置き換える。
提案手法は,(1)変換後にテストスイートをパスした32プログラム,(2)14秒で422kLOCを効率よく解析,変換し,(3)広く適用でき,I/O APIコールの82%を置き換える。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:26:40 GMT)
Buffer layers for Test-Time Adaptation [6.1] バッファ層の概念に基づく新しいパラダイムを導入し,正規化レイヤ更新の基本的限界に対処する。
私たちのアプローチは、ドメインシフトを緩和し、モデルロバスト性を向上する従来の手法よりも優れているだけでなく、忘れることに対する強いレジリエンスも示しています。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:16:33 GMT)
Who Has The Final Say? Conformity Dynamics in ChatGPT's Selections [6.1] ChatGPTのような大規模言語モデル(LLM)は、高い意思決定にますます統合されている。
GPT-4oを用いた3つの適合性実験を行った。
研究全体を通じて、GPTは独立したオブザーバーとして振る舞うのではなく、認識された社会的コンセンサスに適応することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:35:32 GMT)
A Systematic Literature Review of Spatio-Temporal Graph Neural Network Models for Time Series Forecasting and Classification [6.0] この体系的なレビューは、時系列予測と予測のための様々なモデリングアプローチとGNNの応用の概要を提供する。
我々の知る限りでは、この論文は、現在の体系的・時間的GNNモデルから異なる領域に適用された結果の最初の、そして最も広い文献レビューである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:18:17 GMT)
UnifiedFL: A Dynamic Unified Learning Framework for Equitable Federation [6.0] フェデレートラーニングは、生データを共有せずに複数のクライアント間で協調的なモデルトレーニングを行うための重要なパラダイムとして登場した。
We propose UnifiedFL, a dynamic federated learning framework which represent heterogeneous local network as node and edge in a directed model graph。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:01:57 GMT)
Improving Generalization of Neural Combinatorial Optimization for Vehicle Routing Problems via Test-Time Projection Learning [5.9] 我々は,Large Language Models (LLM) による新しい学習フレームワークを導入する。
ニューラルネットワークとのジョイントトレーニングを必要とする一般的なテクニックとは異なり、我々のアプローチは推論フェーズでのみ動作する。
提案手法により,100ノード以上の大規模トラベリングセールスマン問題(TSP)と最大100Kノードのキャパシタン化車両ルーティング問題(CVRP)において,バックボーンモデル(100ノードインスタンスでトレーニング)が優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:02:16 GMT)
RCScore: Quantifying Response Consistency in Large Language Models [5.9] 提案するRCScoreは,命令の定式化がモデル応答に影響を与えるフレームワークである。
命令スタイルは最大16.7%の精度で変更可能であることを示す。
本稿では,RCSコアのメトリクスを適用して,スタイリスティックな自己整合性を測定する手法であるCRSを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:06:47 GMT)
Boosting Generative Adversarial Transferability with Self-supervised Vision Transformer Features [5.9] 本稿では,自己教師型視覚変換器(ViT)の表現を活用すれば,対向トランスフォーマビリティが向上するかどうかを考察する。
コントラスト学習(CL)によるグローバルな構造的特徴とマスク画像モデリング(MIM)による局所的なテクスチャ的特徴の両方を活用する。
CLおよびMIMは,ViTsを異なる特徴傾向に適応し,タンデムで利用した場合,高い対向的一般化性を示すことが示唆された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:36:15 GMT)
Omnipresent Yet Overlooked: Heat Kernels in Combinatorial Bayesian Optimization [5.9] 熱カーネルに基づく統一フレームワークを開発する。
多くの成功したカーネルが熱カーネルと関連しているか等価であることを示す。
熱カーネルに依存する高速でシンプルなパイプラインは、最先端の結果を得ることができることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:02:53 GMT)
Mind the Gap: Revealing Inconsistencies Across Heterogeneous AI Accelerators [5.9] NVIDIAは依然として、クラウドデータセンター内のAIアクセラレーターの主要なプロバイダーである。
AMD、Intel、Mac、Huaweiといった新興ベンダーは、互換性とパフォーマンスの主張を伴う費用対効果の代替手段を提供している。
本稿では、異種AIアクセラレーター間の機械学習モデルのばらつきを調査する最初の実証的研究について述べる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:31:50 GMT)
Envisioning Future Interactive Web Development: Editing Webpage with Natural Language [5.8] 本稿では,大規模言語モデルを用いてWeb編集のための高品質な微調整データセットを合成する,新しい自動データ生成パイプラインを提案する。
Instruct4Editのモデルを微調整することで、人間の意図を正確に、構造的に一貫性があり、視覚的に正確なコード変更に変換するという一貫した改善を実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:09:50 GMT)
RELATE: A Schema-Agnostic Perceiver Encoder for Multimodal Relational Graphs [5.7] マルチテーブルデータドメインは、電子商取引、医療、科学研究で一般的である。
既存のグラフネットワークは、各ノードタイプの特徴列に対して別々のモジュールを必要とするスキーマ固有の特徴エンコーダに依存している。
RELATEはプラグイン・アンド・プレイ機能を持つエンコーダで、汎用的なモダリティで使用することができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:21:06 GMT)
MedSAE: Dissecting MedCLIP Representations with Sparse Autoencoders [5.7] 我々は,メディカルスパースオートエンコーダ(MedSAE)をMedCLIPの潜在領域に適用することにより,医療視における機械的解釈可能性を向上させる。
私たちの発見は、ハイパフォーマンスな医療AIと透明性を橋渡しし、臨床的に信頼性のある表現へのスケーラブルなステップを提供します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:58:36 GMT)
Quadratic Quantum Speedup for Finding Independent Set of a Graph [5.7] グラフ内の独立集合を見つけるための量子アディアバティックアルゴリズム(QAA)の二次的高速化が解析的に証明されている。
スケールが$O(n2)$の古典的アルゴリズムと比較して、我々の量子アルゴリズムは、大きなISを見つけるために$O(n2)$の時間複雑性を達成し、サイズ2ISを特定するために$O(n)$に還元する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:35:47 GMT)
Using Salient Object Detection to Identify Manipulative Cookie Banners that Circumvent GDPR [5.6] 我々は,クッキーバナーが一般データ保護規則に適合する頻度について検討する。
我々はまた、バナーが国家保護当局の勧告に従う頻度を評価する。
関連するウェブサイトの45%には完全準拠のバナーがあるものの、38%のバナーに美的操作があることが判明した。
EUのウェブサイトの13.9%は、ユーザーが米国出身であるときにバナーデザインを変更しており、EUのウェブサイトは、非EUのウェブサイトよりも審美的操作を使用する可能性が約48.3%高い。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:50:13 GMT)
The cell as a token: high-dimensional geometry in language models and cell embeddings [5.6] シングルセルシークエンシングは、細胞内活動をコードする高次元空間に細胞をマッピングする。
最近提案された仮想細胞モデルは、この概念を拡張し、巨大な細胞アトラスの事前学習から学んだパターンに基づいて、細胞の表現を豊かにする。
本総説では,自然言語埋め込みの構造理解の進歩が,単一セルデータセット分析の現在進行中の取り組みにどう影響するかを考察する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:40:55 GMT)
A Multi-agent Large Language Model Framework to Automatically Assess Performance of a Clinical AI Triage Tool [5.6] 本研究の目的は,複数のLDMエージェントのアンサンブルを用いて,画素ベースのAIトリアージツールの信頼性を高めることであった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:50:19 GMT)
SP-MCQA: Evaluating Intelligibility of TTS Beyond the Word Level [5.4] 既存の評価は、WERのような単語ごとの精度の指標に大きく依存している。
本稿では,音声合成における鍵情報の正確性を評価する新しい主観的アプローチであるスポケンパッサージ多重質問応答を提案する。
我々の実験によると、低WERは必ずしも高い鍵情報精度を保証せず、従来のメトリクスと実用的な知性の間のギャップを露呈している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:57:07 GMT)
Chopping Trees: Semantic Similarity Based Dynamic Pruning for Tree-of-Thought Reasoning [5.3] Tree-of-Thought (ToT)推論は、大規模言語モデル(LLM)の問題解決能力を高める
本稿では,オンラインセマンティックマージを並列木探索に統合する軽量な方法であるSemantic similarity-Based Dynamic Pruning(SSDP)を紹介する。
SSDPは、最先端のツリーサーチベースラインよりも最大2.3倍のスピードアップを実現し、競争精度を維持している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:18:45 GMT)
Certification and Classification of Linear Quantum Error Mitigation Methods [5.3] 論理ゲートの品質の継続的な改善を考慮に入れた定量的指標のセットを開発する。
次に,線形緩和法の特徴と要件を特徴付ける分類法を提案する。
緩和戦略は、特定の特徴化されたハードウェアのすべての関連エラーを軽減するために設計された緩和方法とコンパイル手順の集合である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:49:45 GMT)
LLM-Centric RAG with Multi-Granular Indexing and Confidence Constraints [5.3] 本稿では,複雑な知識環境下での検索強化生成において,不十分なカバレッジ,不安定な結果,信頼性の制限といった問題に対処する。
複数粒度メモリインデックスと不確実性推定を統合した信頼度制御法を提案する。
提案手法は,QA精度,検索リコール,ランキング品質,事実整合性において,既存モデルよりも優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:48:37 GMT)
The Impact and Outlook of 3D Gaussian Splatting [5.2] 本稿では,3DGS以降に現れたいくつかの重要な方向について概説する。
我々は、資源効率の高いトレーニングとレンダリングの実現、動的(または4次元の4DGS)表現への進化、およびその外観モデリングとレンダリングプロセスの基礎となる数学的基礎のより深い探索を強調する。
モバイルおよびバーチャルリアリティプラットフォームに3DGSを導入する取り組み、大規模環境への拡張、およびフィードフォワードや分散計算によるほぼインスタントなラディアンスフィールド再構築に向けた最近の進歩について検討する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:01:18 GMT)
Hysteresis Activation Function for Efficient Inference [5.2] 本稿では,Hysteresis Rectified Linear Unit (HLU) を提案する。
トレーニングと推論のための固定しきい値を持つ従来のアクティベーション関数とは異なり、HLUはバックプロパゲーションを洗練させる可変しきい値を使用する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:42:47 GMT)
Multi-Task Learning Based on Support Vector Machines and Twin Support Vector Machines: A Comprehensive Survey [5.1] マルチタスク学習(MTL)は、関連するタスク間の同時トレーニングを可能にする。
ディープラーニングは最近のMTL研究を支配しているが、サポートベクトルマシン(SVM)とツインSVM(TWSVM)はいまだに関係している。
この章では、SVMとTWSVMに基づいたMTLアプローチを調査し、共有表現、タスクの正規化、構造的結合戦略を強調します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:35:05 GMT)
Normative Reasoning in Large Language Models: A Comparative Benchmark from Logical and Modal Perspectives [5.1] 論理的, モーダル的両面から, 規範的領域における大言語モデルの推論能力を評価する。
以上の結果から, LLMは一般的に妥当な推論パターンに従属するが, 特定の規範的推論において顕著な矛盾が認められた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:35:13 GMT)
Tunable-Generalization Diffusion Powered by Self-Supervised Contextual Sub-Data for Low-Dose CT Reconstruction [5.1] Tunable-geneRalizatioN Diffusion (TurnDiff) は低用量CT再構成のための自己教師付き文脈データを用いている。
TurnDiffは、再構築と一般化の両方において、最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:02:27 GMT)
A General Incentives-Based Framework for Fairness in Multi-agent Resource Allocation [4.9] GIFF(General Incentives-based Framework for Fairness)を紹介する。
GIFFは、標準値関数から公平な意思決定を推測する、公平なマルチエージェントリソース割り当てのための新しいアプローチである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:37:51 GMT)
Reusability of Quantum Catalysts [4.9] 触媒の利点は 繰り返し使うと 必然的に減少する
触媒の利点は、繰り返しの使用によって必然的に減少することを示す。
量子過程における触媒の有限再利用性を明らかにする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:28:34 GMT)
Decoding Virtual Healthcare Success through Knowledge-Aware and Multimodal Predictive Modeling [4.9] 本研究では,マルチモーダルデータと知識ネットワークを融合した予測モデリング手法を開発し,患者,医師,コンサルテーションコンテキスト間の潜伏関係を捉える。
この発見は、データ駆動インテリジェンスを通じて、オンラインとオフラインのサービスを組み合わせたハイブリッドヘルスケアエコシステムを設計する上で意味がある。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:09:12 GMT)
EEG-Driven Image Reconstruction with Saliency-Guided Diffusion Models [4.8] 既存の脳波駆動画像再構成法は、しばしば空間的注意機構を見落とし、忠実さとセマンティックコヒーレンスを制限する。
本稿では,脳波の埋め込みと空間空間分布マップを組み合わせることで画像生成を向上する2つの条件付けフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:34:37 GMT)
Can AI be Accountable? [4.8] 一般に、フォーラムがエージェントからそのアクションに関する情報を要求できる場合、エージェントはフォーラムに説明責任を負う。
あまりに多くのケースにおいて、今日のAIは責任を負うことができない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:16:33 GMT)
HADSF: Aspect Aware Semantic Control for Explainable Recommendation [4.8] 大規模言語モデル(LLM)の最近の進歩は、推薦システムに対してより効果的な情報抽出を約束している。
本稿では,適応選択によるコンパクトなコーパスレベルのアスペクトボキャブラリを誘導し,構造化アスペクトオピニオン三重項のボキャブラリ誘導,明示的に制約された抽出を行う2段階アプローチを提案する。
1.5B-70Bパラメータにまたがる約300万のレビューに関する実験では、標準評価予測器に統合された場合、HADSFは予測エラーを一貫して減少させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:49:33 GMT)
Invariants for (2+1)D bosonic crystalline topological insulators for all 17 wallpaper groups [4.7] 対称 $G = G_textspacetimes K$ の (2+1) 次元におけるボゾン対称性保護位相 (SPT) について検討する。
それぞれの場合において、実空間構造および群コホモロジー分類から予測される全ての異なる位相を検出できる多体不変量の集合を提案する。
実空間構造を用いて構築した地盤状態の正確な計算により提案手法を検証した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:13:14 GMT)
Neither Consent nor Property: A Policy Lab for Data Law [4.6] この論文は、AI経済における不透明なデータ市場を初めて実証的に正当化するものである。
パイプラインは、市場の隠れたロジックを抽出するために、数年のフィールドワークから始まります。
現実に反し、観察された貿易パターンを再現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:27:03 GMT)
Towards the Formalization of a Trustworthy AI for Mining Interpretable Models explOiting Sophisticated Algorithms [4.6] 解釈可能な設計モデルは、信頼、説明責任、そして現実世界のアプリケーションにおける自動意思決定モデルの安全な採用を促進するために不可欠である。
我々は、解釈可能性と性能のバランスをとる予測モデルを生成するための包括的な方法論を定式化する。
モデル生成時の倫理的措置を評価することにより、この枠組みはAIシステムの開発のための理論的基盤を確立する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:26:39 GMT)
D-HUMOR: Dark Humor Understanding via Multimodal Open-ended Reasoning - A Benchmark Dataset and Method [4.6] オンラインミームにおけるダークユーモアは、暗黙の、敏感で、文化的に文脈的な手がかりに依存しているため、ユニークな課題を提起する。
ダークユーモア、ターゲットカテゴリー(性、メンタルヘルス、暴力、人種、障害など)、および3レベルの強度評価のための4,379のミームを新たに導入した。
本稿では,まず,大規模視覚言語モデルを用いて,各ミームの構造的説明を生成する推論拡張フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:15:05 GMT)
GeoPep: A geometry-aware masked language model for protein-peptide binding site prediction [4.5] ペプチド結合サイト予測のための新しいフレームワークであるGeoPepを紹介する。
GeoPepファインチューンESM3のタンパク質-タンパク質結合からの豊富な事前学習表現は、タンパク質-ペプチド結合データの限られた可用性に対処する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:58:02 GMT)
SteerVLM: Robust Model Control through Lightweight Activation Steering for Vision Language Models [4.5] 本研究は、VLM(Vision-Language Models)のための軽量ステアリングモジュールであるSteerVLMを紹介する。
提案手法は,言語モダリティと画像コンテキストを接続するアクティベーションを動的に調整するために,ターゲットと逆動作を符号化するペアプロンプトの潜伏埋め込みから学習する。
我々の操舵モジュールは、元のVLMの大きさの0.14%に相当する学習パラメータを必要とする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:52:39 GMT)
A DRL-Empowered Multi-Level Jamming Approach for Secure Semantic Communication [4.4] 本稿では,SemComシステムのセキュリティを高めるために,深層強化学習を利用したマルチレベルジャミング手法を提案する。
提案手法は,PSNR比を最大0.6dB向上させながら,同等のセキュリティを実現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:38:27 GMT)
CARE: Contrastive Alignment for ADL Recognition from Event-Triggered Sensor Streams [4.3] イベントトリガーセンサストリーム(CARE)からのADL認識のためのコントラストアライメントを提案する。
CAREは、Sequence-Image Contrastive Alignment (SICA)による表現学習と、クロスエントロピーによる分類を共同で最適化するエンドツーエンドフレームワークである。
CAREは最先端のパフォーマンスを達成した(ミラノ89.8%、カイロ88.9%、京都7.3%)。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:47:45 GMT)
Tackling the Challenges of Adding Pulse-level Support to a Heterogeneous HPCQC Software Stack: MQSS Pulse [4.3] 異種高性能コンピューティング・量子コンピューティングソフトウェアスタックにネイティブパルスレベル制御を追加する問題について検討する。
目標は、低レベルのアクセスとコントロールを提供することです。
我々の統合的アプローチは、HPCQC環境におけるパルスレベル量子演算のためのエンドツーエンドパスを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:55:38 GMT)
Understanding the Application of Utility Theory in Robotics and Artificial Intelligence: A Survey [4.2] このユーティリティは、経済学、ゲーム理論、およびオペレーション研究において、ロボティクスとAI分野においても統一された概念である。
本稿では,エージェントのインタラクション間の相互関係を記述し,評価するためのユーティリティ指向の要求パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:27:30 GMT)
A geometric framework for momentum-based optimizers for low-rank training [4.2] 低ランクの事前学習と微調整が、大規模ニューラルネットワークの計算コストと記憶コストを削減できる有望な技術として登場した。
古典的運動量法は、基礎となる最適化景観の幾何学のため、局所最適に収束するのに苦労することを示す。
動的低ランク近似から導かれる新しいトレーニング戦略を導入し,その基礎となる幾何学的構造を明示的に説明する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:42:29 GMT)
A Survey of Heterogeneous Graph Neural Networks for Cybersecurity Anomaly Detection [4.1] 不均一グラフニューラルネットワーク(HGNN)は、異常検出のための有望なパラダイムとして登場した。
この調査は、スケーラブルで解釈可能で実用的なデプロイ可能なソリューションに向けて、HGNNベースの異常検出を促進するための構造化された基盤を確立することを目的としている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:49:59 GMT)
Do Vision-Language Models Measure Up? Benchmarking Visual Measurement Reading with MeasureBench [4.1] Measure-Benchは、実世界と合成された様々な種類の計測画像の両方をカバーする、視覚的計測読影のベンチマークである。
我々のパイプラインは、制御可能な視覚的外観を持つ特定タイプのゲージを手続き的に生成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:20:51 GMT)
Delegated Authorization for Agents Constrained to Semantic Task-to-Scope Matching [4.1] ツールを動的に呼び出し、保護されたリソースにアクセスするための大規模言語モデル駆動エージェントの認可は、重大なリスクをもたらす。
我々は,保護されたリソースへのアクセス要求を意味的に検査できる権限付与モデルを導入し,評価する。
本研究は,マルチエージェントおよびツール拡張アプリケーションに対して,意図認識による認証を可能にするセマンティックマッチング技術について,さらなる研究の必要性を強調した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:07:00 GMT)
SABER: Symbolic Regression-based Angle of Arrival and Beam Pattern Estimator [4.1] アングル・オブ・アリーバル(AoA)推定は、信頼性の高いビームフォーミング、高精度なローカライゼーション、統合センシングを可能にする次世代無線通信システムにとって不可欠である。
本稿では,解釈可能性のある経路損失測定から,閉形ビームパターンとAoAモデルを自動的に検出する制約付きシンボリック再構成可能なフレームワークを提案する。
以上の結果から,SABERはAoA推定のための最先端およびブラックボックスML方式の解釈可能かつ正確な代替手段であることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:48:18 GMT)
Recursive numeral systems are highly regular and easy to process [3.9] 提案されたトレードオフは、人間の文法の中心となる複雑さの重要な側面である規則性を無視している、と我々は主張する。
我々のアプローチは、言語における最適性を測り、説明しようとする研究において、形態の集合に規則性を組み込む必要性を強調している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:34:41 GMT)
Oryx: a Scalable Sequence Model for Many-Agent Coordination in Offline MARL [3.9] オフラインマルチエージェント強化学習(MARL)における鍵となる課題は、複雑な環境で効果的なマルチエージェント多段階協調を実現することである。
この課題に対処するために,オフライン協調型MARLのための新しいアルゴリズムであるOryxを提案する。
Oryxは65のテストデータセットの80%以上で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:26:54 GMT)
Elastic Architecture Search for Efficient Language Models [3.9] Elastic Language Model (ELM) は、コンパクト言語モデルに最適化された新しいニューラルアーキテクチャサーチ(NAS)手法である。
ELMは、効率的な変圧器ブロックと次元調整のための動的モジュールを備えたフレキシブルな探索空間を導入することで、既存のNASアプローチを拡張している。
マスク言語モデリングおよび因果言語モデリングタスクの実験により、EMMによって発見されたモデルは既存の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:57:30 GMT)
VeriLLM: A Lightweight Framework for Publicly Verifiable Decentralized Inference [3.9] 本稿では,分散言語モデル (LLM) 推論のための公開検証プロトコルであるVeriLLMを紹介する。
VeriLLMは、軽量な経験的再実行と暗号的なコミットメントを組み合わせることで、検証者は基礎となる推論コストの約1%で結果を検証することができる。
We show that VeriLLM achieve reliable public verifiability with least overhead。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:38:57 GMT)
Are You There God? Lightweight Narrative Annotation of Christian Fiction with LMs [3.8] 我々は、Christian Fictionをジャンルとして幅広い概要を提供するために、計算ツールを使用します。
我々は、左ビハドの書物とクリスチャン・フィクションによって描かれた神的行為の間には、より広範に有意義で有意義な違いが存在することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:23:59 GMT)
Questionnaire meets LLM: A Benchmark and Empirical Study of Structural Skills for Understanding Questions and Responses [3.8] 大規模言語モデル(LLM)は、オープンエンドテキストよりも数ショットの推論で優れている。
現在の検索および調査分析ツールは、典型的にはワークフロー内の人間のために設計されている。
回答検索,応答数,マルチホップ推論を含む6つの構造的スキルを探索するベンチマークであるQASUを紹介する。
実験により、有効なフォーマットを選択し、迅速な組み合わせを行うことで、最適以下のフォーマットに比べて最大8.8%の精度が向上することが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:18:37 GMT)
Advancing Local Clustering on Graphs via Compressive Sensing: Semi-supervised and Unsupervised Methods [3.8] 局所クラスタリングは、グラフの付加的な構造情報なしで、大きなグラフ内の特定のサブ構造を特定することを目的としている。
まず,ラベル付きデータが少ない場合に特定局所クラスタを特定する手法を提案し,これを半教師付き局所クラスタリングと呼ぶ。
次に、ラベルに関する事前情報がない場合に、このアプローチを教師なしの設定に拡張します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:32:12 GMT)
CompoST: A Benchmark for Analyzing the Ability of LLMs To Compositionally Interpret Questions in a QALD Setting [3.8] 言語モデルは顕著な言語解釈能力を持っている。
本稿では,LLMが実際に構成する質問を解釈する能力の程度を調査するためのベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:25:15 GMT)
GCVAMD: A Modified CausalVAE Model for Causal Age-related Macular Degeneration Risk Factor Detection and Prediction [3.8] 加齢黄斑変性は眼科における永久視障害の最も主要な原因の1つである。
深層学習に基づく手法、特に注意機構に基づくCNNとGradCAMによるCTスキャンによるXAI分析は、AMD網膜と正常網膜の区別に成功している。
本稿では,新しい因果的AMD解析モデルであるGCVAMDを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:23:43 GMT)
Real-DRL: Teach and Learn in Reality [3.7] 本稿では,安全クリティカルな自律システムのためのリアルタイムDRLフレームワークについて紹介する。
Real-DRLは、DRL-Student、PHY-Teacher、Trigerの3つのインタラクティブコンポーネントで構成されている。
TriggerはDRL-StudentとPHY-Teacherの相互作用を管理する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:51:28 GMT)
Which Way Does Time Flow? A Psychophysics-Grounded Evaluation for Vision-Language Models [3.7] 現代の視覚言語モデル(VLM)は多くのマルチモーダルなタスクで優れるが、ビデオにおける時間的情報の把握は依然として弱く、決定的に過小評価されている。
短いクリップが前方または後方で再生されるか否かの矢印(AoT)を判断する。
AoT-PsyPhyBENCHは精神物理学的に検証されたベンチマークで、人間が確立した同じ刺激と行動ベースラインを用いて、VLMが自然ビデオの時間方向を推測できるかどうかをテストする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:21:50 GMT)
Overview of the MEDIQA-OE 2025 Shared Task on Medical Order Extraction from Doctor-Patient Consultations [3.7] MEDIQA-OE 2025共有タスクを導入する。
6つのチームがこのタスクに参加し、幅広いアプローチ、およびクローズドおよびオープンウェイトな大規模言語モデル(LLM)の実験を行った。
本稿では,MEDIQA-OEタスク,データセット,最終リーダーボードランキング,参加者のソリューションについて述べる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:56:05 GMT)
Quantum Enhanced Dark-Matter Search with Entangled Fock States in High-Quality Cavities [3.7] 超伝導キャビティの配列を$m$-photon Fock状態にして,波状ダークマターを検出するための量子化プロトコルを提案する。
量子状態をエンタングルメント分布演算で分散し、再構成することにより、走査率は$N2(m+1)$とスケールし、熱励起が支配的な背景となる。
理論的解析と数値シミュレーションにより,デコヒーレンスやビームスプリッタの不忠実さを含む付加ノイズ源に対する提案手法の堅牢性を評価する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:47:32 GMT)
ProstNFound+: A Prospective Study using Medical Foundation Models for Prostate Cancer Detection [3.6] ProstNFound+はマイクロ超音波(muUS)からのPCa検出のための医療基礎モデルの適応である
このモデルは、臨床的に重要なPCaに対する癌熱マップとリスクスコアを生成する。
これは、予測データに対して強力な一般化を示し、振り返り評価と比べてパフォーマンスが劣化しない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:07:04 GMT)
AI for a Planet Under Pressure [3.6] 本報告はストックホルムレジリエンスセンター(ストックホルム大学)、ポツダム気候影響研究研究所(PIK)、Google DeepMindの協力によるものである。
我々の研究は、AIを8つの幅広い持続可能性課題に対処するための研究手法として使う可能性と限界を探求する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:47:55 GMT)
Limits of Generalization in RLVR: Two Case Studies in Mathematical Reasoning [3.4] Reinforcement with Verifiable Rewards (RLVR)は、そのような機能を強化するための有望なアプローチとして登場した。
完全検証解の2つの問題についてRLVRについて検討する。
RLVRは評価基準を改善するが、しばしば新たな推論戦略を得るよりも、表層学習指標を強化することで改善する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:16:02 GMT)
EdgeRunner 20B: Military Task Parity with GPT-5 while Running on the Edge [3.4] We present EdgeRunner 20B, a fine-tuned version of GPT-oss-20b optimized for military task。
また、(a)戦闘用アーム、(b)戦闘医療、(c)サイバー操作、(d)ミルベンチ5kという4つの新しいテストセットも提示した。
これらの軍事試験セットでは、EdgeRunner 20B は GPT-5 タスクのパフォーマンスと95%以上の統計的意味を持つ。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:43:26 GMT)
Truncated Kernel Stochastic Gradient Descent with General Losses and Spherical Radial Basis Functions [3.3] 本稿では,大規模教師あり学習のための新しいカーネル勾配統合下降アルゴリズムを提案する。
従来のカーネルSGDと比較して,我々のアルゴリズムは革新的な正規化戦略によって効率とスケーラビリティを向上させる。
我々のフレームワークは、最小二乗、ハマー、ロジスティック損失など、古典的損失関数の幅広いクラスに対応している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:14:25 GMT)
AD-SAM: Fine-Tuning the Segment Anything Vision Foundation Model for Autonomous Driving Perception [3.3] 自律運転セグメンテーションモデル(Autonomous Driving Segment Anything Model、AD-SAM)は、自律運転における意味的セグメンテーションのための微調整された視覚基盤モデルである。
AD-SAMは、道路シーンの空間的および幾何学的複雑さに合わせて、二重エンコーダと変形可能なデコーダでSegment Anything Model (SAM)を拡張している。
実験の結果,AD-SAMはSAM,一般SAM(G-SAM),深層学習ベースライン(DeepLabV3)を上回るセグメンテーション精度を示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:30:33 GMT)
Graph-Enhanced Policy Optimization in LLM Agent Training [3.2] グループベース強化学習(RL)は複雑な推論や数学的タスクにおいて顕著な結果を示した。
グループベース強化学習(RL)は複雑な推論や数学的タスクにおいて顕著な結果を示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:53:41 GMT)
CYPRESS: Crop Yield Prediction via Regression on Prithvi's Encoder for Satellite Sensing [3.1] CYPRESSは、高解像度のフィールド内カノラ収率予測のために設計されたディープラーニングモデルである。
CYPRESSは、複数の時間衛星画像を高密度のピクセルレベルの収率マップに変換する。
この研究は、大規模な地球観測と農場での意思決定のギャップを埋める新しいアプローチを検証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:37:40 GMT)
StrengthSense: A Dataset of IMU Signals Capturing Everyday Strength-Demanding Activities [3.1] textitStrengthSenseは、強度要求アクティビティをキャプチャするIMU信号を含むオープンデータセットである。
このデータセットは、手足と胴体に10個のIMUを配置した29名の健常者から収集された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:41:28 GMT)
Barlow Twins for Sequential Recommendation [3.1] 逐次レコメンデーションモデルは、疎結合データの人気バイアスと、精度と多様性といった相反する目標をナビゲートする必要があります。
本稿では,Borlow Twinsの冗長性原理をTransformerベースのnextitemレコメンデータに統合する,新しい非競合SSLフレームワークBT-SRを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:56:02 GMT)
SynBullying: A Multi LLM Synthetic Conversational Dataset for Cyberbullying Detectio [3.1] SynBullyingは、サイバブリング(CB)の研究と検出のための合成多言語対話データセットである。
このデータセットは、(i)会話構造を提供し、孤立したポストではなく、多ターン交換をキャプチャし、(ii)文脈認識アノテーション、(ii)文脈、意図、言論のダイナミクスを考慮した会話フロー内で有害性を評価し、(iii)言語学的および行動学的分析のための様々なCBカテゴリをカバーする、きめ細かいラベル付けを提供する。
会話構造,語彙パターン,感情・毒性,役割ダイナミクス,害強度,CB型分布の5次元にわたってSynBullyingを評価した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:27:36 GMT)
Quantum Advantage via Efficient Post-processing on Qudit Classical Shadow tomography [3.0] 計算量と記憶量の両方を削減できるquditシャドウトモグラフィーに基づく量子的アプローチを提案する。
(operatornametr(rho O)) は (textpoly(log d)) 計算で効率的に推定できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:52:28 GMT)
Language Models Are Borrowing-Blind: A Multilingual Evaluation of Loanword Identification across 10 Languages [3.0] 本稿では,大規模言語モデルを含む事前学習された言語モデルが,借用語識別に類似した能力を持っているかを検討する。
明示的な指示や文脈情報にもかかわらず,本研究の結果から,ローン語とネイティブ語を区別するにはモデルが不十分であることが示唆された。
本研究は,少数言語を対象としたNLPツールの開発や,支配言語からの語彙的圧力下でのコミュニティにおける言語保存支援に寄与する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:36:07 GMT)
CATCH: A Modular Cross-domain Adaptive Template with Hook [2.9] CATCHはVisual Question Answering (VQA)モデルのクロスドメイン適応のためのプラグイン・アンド・プレイフレームワークである。
私たちのキーとなるアイデアは、2つの軽量モジュールを導入することで視覚的および言語的適応を分離することです。
その結果,バックボーンモデルを再トレーニングすることなく,一貫した性能向上を実現することができた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:10:02 GMT)
Error Estimates and Higher Order Trotter Product Formulas in Jordan-Banach Algebras [2.9] 我々は、三階および高階を含むトロッタースズキ近似の解析をジョルダン・バナッハ代数に拡張する。
提案手法は, トロッター積公式の適応性および非連想的設定に対する推定値を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:58:55 GMT)
Reducing Circuit Depth in Lindblad Simulation via Step-Size Extrapolation [2.8] 我々は、リンドブラッド方程式でモデル化されたオープン量子系の量子シミュレーションのためのリチャードソン式外挿によるアルゴリズム的誤り軽減について研究する。
推定器は精度$varepsilon$を$mathcalO((lT)2/varepsilon)$からpolylogarithmic $mathcalO((lT)2/varepsilon)$スケーリングに還元する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:37:53 GMT)
AERO: Entropy-Guided Framework for Private LLM Inference [2.8] 本稿では,トランスアーキテクチャからコストのかかる非線形操作を排除するためのエントロピー誘導フレームワークを提案する。
AEROは3.4$times$通信と1.4$times$レイテンシをパフォーマンスペナルティなしで保存できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:53:57 GMT)
Exact and approximate conditions of tabletop reversibility: when is Petz recovery cost-free? [2.8] Petzリカバリマップ$hatmathcalN_gamma(texttP)$は、$mathcalN$と参照状態$gamma$にのみ依存する体系的な構成である。
特に,アシラ系の時間依存性制御が必要であることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:03:00 GMT)
Witnessing genuine multipartite entanglement in phase space with controlled Gaussian unitaries [2.8] 本稿では,現状実験プラットフォームにおける位相空間計測によるGME目撃者の実装手法を提案する。
制御パリティ,変位,ビームスプリッタ演算を用いた5つの具体的実装手法を提案する。
これらの方法は、回路/キャビティ量子電気力学、回路量子音響力学、トラップイオンや原子系にも容易に適用できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:50:33 GMT)
MV-MLM: Bridging Multi-View Mammography and Language for Breast Cancer Diagnosis and Risk Prediction [2.7] VLM(Vision-Language Models)は、医療画像タスクにおける悪性度とデータ効率を高めることで、有望なソリューションを提供する。
本稿では,乳がんの分類とリスク予測のためのマルチビューマンモグラフィーと言語モデルを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:12:29 GMT)
Human-AI Complementarity: A Goal for Amplified Oversight [2.7] 本稿では,人間の監視の質を向上させるためにAIを活用する方法について検討する。
AIレーティングと人間のレーティングをAIレーダの信頼性に基づいて組み合わせた方が、どちらも頼りにしているよりも優れていることが分かりました。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:11:52 GMT)
Towards Explainable and Reliable AI in Finance [2.7] ファイナンスにおける説明可能で信頼性の高いAIへのいくつかのアプローチを提案する。
予測性能と信頼性推定とルールベースの推論を統合することで、我々のフレームワークは透明で監査可能な金融AIシステムを発展させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:05:15 GMT)
Enhancing Reasoning Skills in Small Persian Medical Language Models Can Outperform Large-Scale Data Training [2.7] 我々は、汎用ペルシャ語モデルの推論スキルを改善するために、AIフィードバックを用いた強化学習(RLAIF)と直接選好最適化(DPO)を採用している。
これを実現するために,複数の質問応答データセットをペルシア語に翻訳し,RLAIFを用いて提案された回答ペアを生成した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:28:47 GMT)
Hybrid Physical-Neural Simulator for Fast Cosmological Hydrodynamics [2.6] 本稿では,ニューラルネットワークによって流体力学をパラメータ化しながら,微分可能な粒子-メシュ解法を用いて重力力を計算するハイブリッド手法を提案する。
このアプローチは、よりデータ効率が良く、単一の参照シミュレーションによる宇宙構造の形成は、神経圧モデルを制限するのに十分である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:18:07 GMT)
Linear Causal Discovery with Interventional Constraints [2.6] 介入制約と呼ばれる因果発見に新しい概念を導入する。
介入制約は、因果的影響に対する不平等な制約という形で、高いレベルの因果的知識を符号化する。
実世界のデータセットに対する我々のアプローチを評価し、介入制約の統合がモデルの精度を改善し、確立された結果との整合性を確保することを実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:49:25 GMT)
Spiking Patches: Asynchronous, Sparse, and Efficient Tokens for Event Cameras [2.5] Spiking Patchesは、イベントカメラ用に特別に設計されたトークンメーカーである。
ジェスチャー認識とオブジェクト検出において,GNN,PCN,Transformerを用いてトークン化を行う。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:40:34 GMT)
Enhancing the reachability of variational quantum algorithms via input-state design [2.4] 変分量子アルゴリズム(VQA)は、表現性と訓練性の間に固有のトレードオフに直面している。
本稿では,線形結合法を用いて構築した特殊設計入力状態を用いて,VQA性能を向上させることで,この問題に対処する一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:19:30 GMT)
Stesso: A reconfigurable decomposition of $n$-bit Toffoli gates using symmetrical logical structures and adjustable support qubits [2.3] 本稿では, アンシラ量子ビットを用いて, $(n+1)$-bit Toffoli ゲートを効率的に分解する構造設計手法を提案する。
実験により、$(n+1)$-bit Toffoli ゲートは常に従来の合成法よりも量子コストが低いことが証明されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:58:02 GMT)
BRIQA: Balanced Reweighting in Image Quality Assessment of Pediatric Brain MRI [2.3] BRIQA(Balanced Reweighting in Image Quality Assessment)を提案する。
BRIQAは勾配に基づく損失再重み付けを用いてクラスごとのコントリビューションを動的に調整し、未表現クラスへの一貫した露出を保証する回転スキームを採用している。
BRIQAは平均マクロF1スコアを0.659から0.706に改善し、ノイズ(0.430)、ジッパー(0.098)、ポジショニング(0.097)、コントラスト(0.217)、モーション(0.022)、バンディング(0.012)のアーティファクト重大分類で顕著な利得を得た。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:29:09 GMT)
"Show Me You Comply... Without Showing Me Anything": Zero-Knowledge Software Auditing for AI-Enabled Systems [2.3] 本稿では,新しいMLOps検証フレームワークであるZKMLOpsを紹介する。
ZKP(Zero-Knowledge Proofs)暗号プロトコルを運用し、証明者が証明者に対して、文が真実であることを納得させることができる。
我々は、金融リスク監査における規制コンプライアンスの研究を通じて、この枠組みの実践性を評価する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:03:32 GMT)
Optimized Log Parsing with Syntactic Modifications [2.3] 構文と意味に基づくログ解析アーキテクチャを比較した。
本稿では,2フェーズのログ解析アーキテクチャにおいて,第2フェーズとして機能するテンプレート識別モジュールであるSynLog+を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:22 GMT)
Process-based Indicators of Vulnerability Re-Introducing Code Changes: An Exploratory Case Study [2.2] この作業は、脆弱性の再導入の理解と緩和におけるコードの変更とともに、プロセスメトリクスの重要な役割を強調します。
我々のアプローチは、再導入が一つの孤立した行動の結果であることは滅多にないが、累積的な開発活動や社会技術的条件から生じることを強調している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:45:36 GMT)
Optimal Online Change Detection via Random Fourier Features [2.1] 本稿では,多変量データストリームにおけるオンライン非パラメータ変化点検出の問題について検討する。
本稿では,ランダムなフーリエ特徴に基づく逐次テスト手法を提案する。
我々は,検出遅延がミニマックス感において最適であることを示す情報理論境界を含む,アルゴリズムの性能に関する強力な理論的保証を証明した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:39:10 GMT)
Super-Heisenberg Scaling Using Nonlinear Quantum Scrambling [2.1] システムのハミルトニアンが多体相互作用や時間依存項を含む場合、超ハイゼンベルクスケーリングが達成可能であることを示す。
光キャビティシステムにおいて、注入された外部スクイーズとキャビティ内スクイーズを組み合わせることにより、測定精度を時間とともに指数的に向上させることができる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:53:26 GMT)
Exploring Object-Aware Attention Guided Frame Association for RGB-D SLAM [2.1] RGB-D屋内SLAMにおけるタスク固有ネットワークアテンションの利用を提案する。
我々はCNN特徴表現とネットワーク勾配から導かれるレイヤワイドアテンション情報を統合し、フレームアソシエーション性能を向上させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:31:56 GMT)
MisSynth: Improving MISSCI Logical Fallacies Classification with Synthetic Data [2.1] 本研究では,合成データ生成技術と微調整技術が大規模言語モデルの誤認識能力に与える影響について検討する。
そこで本研究では,検索拡張生成(RAG)を適用して合成誤りサンプルを生成するパイプラインであるMis Synthを提案する。
その結果,バニラベースラインに比べて微調整モデルの精度が向上した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:52:43 GMT)
Bayesian Network Fusion of Large Language Models for Sentiment Analysis [2.1] 大規模言語モデル(LLM)は進歩を続けており、特殊タスクに適したドメイン固有の変種が増えている。
本研究では,FinBERT,RoBERTa,BERTweetの3つのLLMからの予測を統合したベイジアンネットワークLEM融合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:37:58 GMT)
Evaluating the Role of Verifiers in Test-Time Scaling for Legal Reasoning Tasks [2.1] テストタイムスケーリング(TTS)技術は、計算量やレイテンシを犠牲にして、大規模言語モデル(LLM)の性能を向上させることができる。
提案手法は,5つのベンチマークを対象とする法定多重選択QA(MCQA)に対する検証器に基づくTS手法の実証的研究である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:49:22 GMT)
Partially-Supervised Neural Network Model For Quadratic Multiparametric Programming [2.1] 本研究では,大域的解関数の数学的構造を直接表現する部分教師付きNNアーキテクチャを提案する。
汎用的なNNトレーニング手法とは対照的に,PSNN法は最適化問題の数学的性質から直接モデル重みを導出する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:31:52 GMT)
OpenZL: A Graph-Based Model for Compression [2.0] アプリケーション固有の圧縮機システムは、最高の汎用圧縮機よりも優れている。
これらの課題は,新たな圧縮戦略によって克服可能であることを示す。
OpenZLはデータを自己記述型のワイヤフォーマットに圧縮し、任意の構成はユニバーサルデコーダによって圧縮される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:30:14 GMT)
A Robust and Non-Iterative Tensor Decomposition Method with Automatic Thresholding [1.9] 本稿では,テンソルデータに対して,事前のランク指定や反復最適化を必要としない新しい低ランク近似法を提案する。
実験により,提案手法は推定精度と計算効率の両面から,高次特異値分解,高次直交反復,タッカーL2Eに優れることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:52:33 GMT)
Higher-Order Regularization Learning on Hypergraphs [1.8] 高次ハイパーグラフ学習(HOHL)は、最近、古典的ハイパーグラフ正規化の代替として導入された。
完全教師付き学習において, HOHL を正則化器として使用する場合, HOHL の切り離されたバージョンとの整合性を証明し, 明確な収束率を導出する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:22:57 GMT)
Stitch: Step-by-step LLM Guided Tutoring for Scratch [1.8] そこで我々は,Stitchを紹介した。Stitchは対話型学習システムで,"答えの描画"をステップバイステップの足場に置き換える。
我々は、Scratchのための最新の自動フィードバック生成ツールと比較し、Stitchを実証的研究で評価した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:03:56 GMT)
On-the-Fly OVD Adaptation with FLAME: Few-shot Localization via Active Marginal-Samples Exploration [1.8] オープンボキャブラリオブジェクト検出(OVD)モデルは、任意のテキストクエリからオブジェクトを検出することで、顕著な柔軟性を提供する。
リモートセンシング(RS)のような特殊なドメインにおけるゼロショットのパフォーマンスは、自然言語固有の曖昧さによってしばしば損なわれる。
そこで本研究では,大規模な事前学習型OVDモデルの広範な一般化と,軽量な数ショット分類器を併用したケースケード手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:05:58 GMT)
DC4GS: Directional Consistency-Driven Adaptive Density Control for 3D Gaussian Splatting [1.8] 直交整合性(DC)駆動型適応密度制御(ADC)を3次元ガウス平滑化(DC4GS)に適用する。
我々のDCは、ADCの局所的な構造的複雑さをよりよく捉え、冗長な分割を避けます。
我々のDC4GSは、既存のADCよりもプリミティブの数(実験で最大30%)を大幅に削減し、再構築の忠実度を大幅に向上させます。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:33:33 GMT)
A Convexity-dependent Two-Phase Training Algorithm for Deep Neural Networks [1.8] 機械学習の主な課題は、データに適合するモデルを測定する損失関数を効率的に基底化することである。
本研究では,スワップを最小化する初期最適勾配から,非現実性凸性を最小化する新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:16:40 GMT)
AnomalyMatch: Discovering Rare Objects of Interest with Semi-supervised and Active Learning [1.7] 半教師付きFixMatchアルゴリズムとアクティブラーニングを組み合わせた異常検出フレームワークであるAnomalyMatchを提案する。
AnomalyMatchは大規模アプリケーション用に調整されており、ESA Datalabs科学プラットフォームに統合されている。
GalaxyMNIST天文データセットとMiniImageNet自然画像ベンチマークの評価は、厳密なクラス不均衡の強い性能を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:17:12 GMT)
Building Trustworthy AI by Addressing its 16+2 Desiderata with Goal-Directed Commonsense Reasoning [1.7] サブシンボリック機械学習アルゴリズムは推論をシミュレートするが幻覚を与える。
ルールベースの推論者は、推論ステップの連鎖を提供することができるが、複雑であり、多数の推論を使用する。
本稿では,目標指向の制約ベースの応答セットプログラミング推論器 s(CASP) を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:01:30 GMT)
Neighborhood Feature Pooling for Remote Sensing Image Classification [1.7] 近接特徴プーリングはリモートセンシング画像分類のための新しいテクスチャ特徴抽出法である。
NFP層は近隣の入力間の関係を捉え、特徴次元にわたって局所的な類似性を効率的に集約する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:37:51 GMT)
Artificial Intelligence-Enabled Analysis of Radiology Reports: Epidemiology and Consequences of Incidental Thyroid Findings [1.7] 非甲状腺所見に対する画像検査では, 偶発性甲状腺所見(ITFs)がますます検出される。
Aimは、放射線学レポートでIFFを特定するために自然言語処理パイプラインを開発し、検証し、デプロイすることを目的としている。
マヨクリニックにて甲状腺撮影を施行した甲状腺疾患のない成人の回顧的コホート
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:15:07 GMT)
Dynamic VLM-Guided Negative Prompting for Diffusion Models [1.7] 視覚言語モデル(VLM)を利用した拡散モデルにおける動的負のプロンプトの新しい手法を提案する。
提案手法は,特定段階の中間画像予測を生成し,VLMに問い合わせて,文脈的に適切な負のプロンプトを生成する。
我々は,様々なベンチマークデータセットに対するアプローチを評価し,負のガイダンス強度とテキストイメージアライメントのトレードオフを実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:10:25 GMT)
MMEdge: Accelerating On-device Multimodal Inference via Pipelined Sensing and Encoding [1.7] 本稿では,パイプラインセンシングと符号化に基づく新しいオンデバイスマルチモーダル推論フレームワークMMEdgeを提案する。
MMEdgeは完全なセンサー入力を待つ代わりに、推論プロセス全体を微細なセンシングと符号化ユニットのシーケンスに分解する。
MMEdgeは、さまざまなシステムとデータダイナミクスにわたる高いタスク精度を維持しながら、エンドツーエンドのレイテンシを大幅に削減する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:51:38 GMT)
Embracing Contradiction: Theoretical Inconsistency Will Not Impede the Road of Building Responsible AI Systems [1.6] このポジションペーパーでは、Responsible AI(RAI)メトリクスでよく見られる理論上の矛盾は、排除すべき欠陥ではなく、価値のある機能として受け入れるべきである、と論じている。
メトリクスを異なる目的として扱うことで、これらの矛盾をナビゲートすることは、3つの重要な利点をもたらすと我々は主張する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:51:54 GMT)
Modelling Emotions in Face-to-Face Setting: The Interplay of Eye-Tracking, Personality, and Temporal Dynamics [1.6] 本研究では、視線追跡データ、時間的ダイナミクス、性格特性を統合することで、知覚と知覚の両方の感情の検出を大幅に向上させる方法について述べる。
本研究は,将来の情緒コンピューティングと人間エージェントシステムの設計を示唆するものである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:46:46 GMT)
Discovering EV Charging Site Archetypes Through Few Shot Forecasting: The First U.S.-Wide Study [1.6] 輸送の脱炭は電気自動車(EV)の普及に依存している
既存の作業は、小規模なデータセット、時間的依存関係の単純な近接ベースモデリング、運用履歴に制限のあるサイトへの弱い一般化によって制限されている。
本研究は、新しい大規模充電需要データセットを用いて、クラスタリングと数ショット予測を統合して、サイトアーキタイプを明らかにするフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:16:45 GMT)
Representative Social Choice: From Learning Theory to AI Alignment [1.6] 典型的な社会的選択では、個体群は個々の問題対の有限標本で表される。
代表的社会的選択における最も深い質問の多くは統計的学習問題として定式化できることを示す。
我々は、代表的社会的選択のためのさらなる公理を定式化し、新しい分析ツールでアローのような不合理性定理を証明した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:39:44 GMT)
Elementary, My Dear Watson: Non-Invasive Neural Keyword Spotting in the LibriBrain Dataset [1.5] キーワードスポッティング(英: Keywords Spotting, KWS)は、脳とコンピュータのインターフェイスのための、プライバシーに配慮した中間タスクである。
我々は、単語レベルのデータローダとColab対応のチュートリアルを備えたpnplライブラリの更新版をリリースした。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:23:32 GMT)
From Amateur to Master: Infusing Knowledge into LLMs via Automated Curriculum Learning [1.5] LLM(Large Language Models)は、一般的なタスクでは優れるが、経済学や心理学のような専門分野では不十分である。
ACER(Automated Curriculum-Enhanced Regimen)は、ジェネラリストモデルを幅広い能力を犠牲にすることなく、ドメインエキスパートに変換する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:43:40 GMT)
Strong Kantorovich duality for quantum optimal transport with generic cost and optimal couplings on quantum bits [1.4] 我々は最近提案された2次量子最適輸送問題の線形化版に対するカントロビッチ双対性を証明する。
応用として、量子ビットと卓越したコスト演算子の場合、この双対性を用いて、主問題と双対問題の最適解を、関連する状態に一定の制限を加えて決定する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:23:50 GMT)
Chaos-based reinforcement learning with TD3 [1.4] カオスに基づく強化学習(CBRL)は、エージェントの内部カオス力学が探索を促進する方法である。
この研究は、最先端の深層強化学習アルゴリズムの一つであるTD3(Twin Delayed Deep Deterministic Policy Gradients)を導入した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:49:01 GMT)
Experiments with Optimal Model Trees [1.4] 我々は,世界規模で最適なモデル木が,非常に小さな木と競合する精度を達成できることを示した。
また、古典的最適かつ優雅に成長した決定木、ランダムな森林、およびサポートベクターマシンと比較した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:10:57 GMT)
A Continuous and Interpretable Morphometric for Robust Quantification of Dynamic Biological Shapes [1.4] PF-SDMは閉形状の幾何学的および位相的特性をコンパクトに符号化する。
形状比較と機械学習のための堅牢で解釈可能な機能を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:43:39 GMT)
Angular Steering: Behavior Control via Rotation in Activation Space [1.3] Angular Steeringは、振る舞い変調の新しいフレキシブルな方法である。
固定された2次元部分空間内で回転活性化によって作用する。
拒否やコンプライアンスといった行動に対して,継続的かつきめ細かいコントロールを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:23:35 GMT)
Dissect-and-Restore: AI-based Code Verification with Transient Refactoring [1.3] 提案するPrometheusは,現在のAI機能を備えた自動コード検証を容易にする,AI支援システムである。
プロメテウスは、複素補題の構造的分解を通じてより小さく検証可能な部分補題への証明探索を導く。
このアプローチは、ベースラインの68%に比べて、キュレートされたデータセットの86%のタスクをうまく検証します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:03:34 GMT)
Boosted Trees on a Diet: Compact Models for Resource-Constrained Devices [1.2] 本稿では、軽量機械学習モデルの必要性の高まりに対処するため、強化された決定木に対する圧縮スキームを提案する。
また,LightGBMモデルと比較して,圧縮比が4-16倍のモデルが同じ性能を示した。
この機能は、リモート監視、エッジ分析、分離された環境や電力制限のある環境でのリアルタイム意思決定など、幅広いIoTアプリケーションへの扉を開く。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:47:57 GMT)
Why Isn't Relational Learning Taking Over the World? [1.2] リレーショナル・ラーニング(リレーショナル・ラーニング)は、リレーショナル・ラーニング(リレーショナル・ラーニング)が世界を支配するものではない。
世界中の(価値ある)データはすべて、テキストと画像の点である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:20:34 GMT)
Hybrid DQN-TD3 Reinforcement Learning for Autonomous Navigation in Dynamic Environments [1.2] 本稿では、離散的なサブゴール選択のための高レベルなディープQネットワーク(DQN)と、連続的な動作のための低レベルなツイン遅延Deep Deterministic Policy Gradient(TD3)コントローラを組み合わせた階層的パス計画制御フレームワークを提案する。
我々は、安全でない動きを防止できるLiDARベースの安全ゲートとともに、実用的な報酬形成スキーム(方向、距離、障害物回避、動作の平滑性、衝突罰、時間罰、進行)を設計する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:12:01 GMT)
Cross-Platform Evaluation of Reasoning Capabilities in Foundation Models [1.2] 8つの学術領域にまたがる79の課題にまたがる15の基礎モデルを評価する。
我々は,HPCスーパーコンピューティング,クラウドプラットフォーム,大学クラスタという,3つの計算パラダイムにまたがるインフラストラクチャに依存しないベンチマークを確立する。
この結果は、従来のスケーリング仮定に挑戦し、トレーニングデータ品質をモデルサイズよりも重要なものにし、教育、生産、研究のコンテキストをまたいだモデル選択のための実行可能なガイドラインを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:31:03 GMT)
Online and Interactive Bayesian Inference Debugging [1.2] 確率的プログラミングは、ベイズモデルのプログラムとしての定式化と後部推論の自動化を可能にする。
確率的プログラミングは、推論による問題の特定と修正には多くの時間と深い知識が必要です。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:05:31 GMT)
Accelerating Real-World Overtaking in F1TENTH Racing Employing Reinforcement Learning Methods [1.1] 本研究は、トラックを確実に走行し、シミュレーションと現実の両方において相手を追い越すことができる新しいレース・オーバーテイクエージェントを提案する。
その結果、相手に対するエージェントのトレーニングは、レース直前のトレーニングを受けたエージェントの56%に対して、87%のオーバーテイク率で故意にオーバーテイクできることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:38:18 GMT)
Entanglement Certification in Bulk Nonlinear Crystal for Degenerate and Non-degenerate SPDC for Quantum Imaging Application [1.1] 光子対が絡み合った量子イメージングは、古典的な限界を超える性能を約束する。
我々はこれらの要因を近距離場と遠距離場の両方で観測された横相関に関連付ける統一モデルを構築した。
バルク結晶中の複屈折性ウォークオフを解析し、その明らかな絡み合いの劣化を補正できることを実証した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:07:27 GMT)
Integrating Ontologies with Large Language Models for Enhanced Control Systems in Chemical Engineering [1.1] 本研究は、構造的ドメイン知識と生成的推論を結合した化学工学のためのオントロジー統合大言語モデル(LLM)フレームワークを提案する。
提案したパイプラインは、データ取得、セマンティックプリプロセッシング、情報抽出、オントロジーマッピングステップのシーケンスを通じて、モデルトレーニングとCOPEオントロジーとの推論を調整する。
このシンボリック構造とニューラルジェネレーションの統合は、プロセス制御、安全分析、その他の重要なエンジニアリングコンテキストにLLMを適用するための透明で監査可能なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:04:20 GMT)
Machine-learning competition to grade EEG background patterns in newborns with hypoxic-ischaemic encephalopathy [1.0] 若年者102名を対象に,脳波353時間を含む振り返りデータセットを作成した。
データは完全に匿名化され、トレーニング、テスト、保持されたバリデーションデータセットに分割された。
次に、Webベースのコンペティションプラットフォームを作成し、新生児の脳波背景パターンの重症度を分類するMLモデルを開発するための機械学習コンペティションを開催しました。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:14:13 GMT)
Send Less, Save More: Energy-Efficiency Benchmark of Embedded CNN Inference vs. Data Transmission in IoT [1.0] この研究は、ESP32-S3上のドメイン固有のデータセットに基づいて訓練された、一般的な低電力広域ネットワークと圧縮CNNの使用を評価する。
実験では、デバイス上でCNN推論を実行し、結果のみを送信することで、生画像データを送信する場合と比較して、全体のエネルギー消費量を最大5倍に削減できることを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:18:11 GMT)
Learning to Manage Investment Portfolios beyond Simple Utility Functions [1.0] 本稿では,明示的なユーティリティ仕様を必要とせずに,資金運用戦略の潜在的表現を学習する生成フレームワークを提案する。
当社の枠組みを、米国の株式相互資金1436のデータセットで検証する。
我々のフレームワークは、市場シミュレーション、戦略属性、規制監督におけるアプリケーションの投資戦略を特徴付けるためのデータ駆動型アプローチを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:01:20 GMT)
Variational Quantum Sensing for Structured Linear Function Estimation [1.0] 量子センシングタスクにおける絡み合ったプローブ状態の変動最適化について検討する。
具体的には、スピン1/2アレイの各キュービットが位相 phi_i = alpha_i * Theta を蓄積するシナリオを考える。
i)全ての量子ビットが位相関数に等しく寄与する一様符号化、(ii)中心量子ビットが重みベクトルを支配しているカスタム符号化である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:20:08 GMT)
Agnostic Tomography of Stabilizer Product States [0.9] クラス $mathcalC$ of $n$-qubit 安定化器状態に対する効率的な非依存トモグラフィーアルゴリズムを提案する。
我々は少なくとも$mathcalC$の任意の状態と近似する状態の簡潔な記述を出力する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:20:48 GMT)
Digital Twin based Automatic Reconfiguration of Robotic Systems in Smart Environments [0.9] 本稿では,Digital Twin技術を用いたロボットコントローラの自律的,動的再構成のための新しいフレームワークを提案する。
本手法では,ロボットの動作環境の仮想レプリカを利用して,実世界の変化に対応する運動軌跡をシミュレーションし,最適化する。
この作業はDigital Twinsをロボティクスに統合し、スマートでダイナミックな環境で自律性を高めるスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:20:57 GMT)
A Model-Based Approach to Automated Digital Twin Generation in Manufacturing [0.9] モデルベースエンジニアリング(MBE)は、迅速な生産ライン設計をサポートするが、最終的な再構成にはシミュレーションと検証が必要である。
本稿では,自動化MLをベースとしたファクトリプランを用いたDT生成とデプロイメントを自動化する新しいプラットフォームを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:33:41 GMT)
TokenBlowUp: Resolving Representational Singularities in LLM Token Spaces via Monoidal Transformations [0.9] 最近の研究は、大規模言語モデルのトークン埋め込み空間に対する基礎多様体仮説に挑戦する説得力のある証拠を提供している。
我々はこの問題をスキーム理論の言語で定式化し、スキーム理論のブローアップを各特異点に適用することにより厳密な解法を提案する。
我々は、この新しい空間の幾何学的正則化を保証する公式な定理を証明し、元の病理が解決されたことを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:18:38 GMT)
VitalLens 2.0: High-Fidelity rPPG for Heart Rate Variability Estimation from Face Video [0.9] 本稿では,顔画像から生理的信号を推定する新しいディープラーニングモデルVitalLens 2.0を紹介する。
VitalLens 2.0を、4つのパブリックデータセットとプライベートデータセットから422個のユニークな個人を組み合わせた新しいテストセットで評価した。
VitalLens 2.0 は平均値の平均絶対誤差(MAE)は HR は 1.57 bpm、RR は 1.08 bpm、HRV-SDNN は 10.18 ms、HRV-RMSSD は 16.45 ms である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:23:26 GMT)
Limits of Absoluteness of Observed Events in Timelike Scenarios: A No-Go Theorem [0.9] ウィグナーのフレンド型パラドックスは、事象が絶対であるという仮定に挑戦する。
時間順の類似であるCausal Friendliness Paradoxを紹介した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:52:07 GMT)
A filtering scheme for confocal laser endomicroscopy (CLE)-video sequences for self-supervised learning [0.9] 共焦点レーザー内視鏡(英: Confocal laser endomicroscopy, CLE)は、非侵襲的でリアルタイムな画像モダリティであり、in-situ、in-vivoイメージング、および粘液構造の微細構造解析に使用できる。
これを解決するために、より大きなラベル付けされていないデータセットに自己教師付き学習(SSL)を使用できる。
SSLトレーニングにおけるデータセット冗長性を低減するために,CLEビデオシーケンス上のフィルタ機能を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:07:11 GMT)
SUSTAINABLE Platform: Seamless Smart Farming Integration Towards Agronomy Automation [0.9] SUSTAINABLEは、IoT、AI、衛星イメージング、ロールベースのタスクオーケストレーションを統合するために設計された、スマートな農業プラットフォームである。
本稿では、現在のスマート農業ソリューションについて検討し、比較評価を行い、SUSTAINABLEの重要な特徴を紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:32:17 GMT)
Smart Exploration in Reinforcement Learning using Bounded Uncertainty Models [0.9] 強化学習(Reinforcement Learning, RL)は、不確実な環境で意思決定を行うための強力なフレームワークである。
先行モデル知識を取り入れて探索をガイドし,学習プロセスを加速することで,この問題に対処する。
シミュレーション研究において,BUMEXと呼ばれる探索手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:02:26 GMT)
Interdependent Privacy in Smart Homes: Hunting for Bystanders in Privacy Policies [0.9] 本稿では,20個のビデオドアベルとスマートカメラ製品を対象としたプライバシーポリシーの分析を行った。
我々は、一部のベンダーが傍観者を認めているが、それらが対処するのは、不服従者を含める程度に限られていることを示した。
傍観者のプライバシに関連する現実のケースを特定し、調査し、現在のデプロイメントが非ユーザに与える影響を実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:16:21 GMT)
GAIA: A Foundation Model for Operational Atmospheric Dynamics [0.8] 我々は,MAE(Masked Autoencoders)とラベルのない自己蒸留(DINO)を融合したハイブリッド自己教師型モデルGAIAを紹介する。
GAIAは、自明な日中パターンではなく、大気力学を捉える非絡み合った表現を学ぶ。
下流タスクに移行すると、GAIAは一貫してMAEのみのベースラインを上回っます。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:40:31 GMT)
Physics-Informed Mixture Models and Surrogate Models for Precision Additive Manufacturing [0.8] 我々は混合モデル学習手法を用いて,レーザーによる添加性製造プロセスの欠陥を同定する。
2つのAMプロセスから実世界のデータを解析し,実験による評価を行った。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:13:25 GMT)
VerifIoU - Robustness of Object Detection to Perturbations [0.8] 本稿では,物体検出モデルの形式的検証のための新しいインターバル境界伝搬法を提案する。
このアプローチはIBP IoUという名前のオープンソースコードで実装されており、一般的な抽象的な解釈に基づく検証ツールと互換性がある。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:41:48 GMT)
Tunable frequency conversion and comb generation with a superconducting artificial atom [0.8] 半無限伝送線路の端に結合した超伝導人工原子によって放出されるパワースペクトル密度について検討した。
我々は,複数の周波数ピークの発生と,それらのピーク間の等質なデチューニングを伴う周波数コムの形成を観察した。
我々はこれらの周波数特徴の生成における正確な制御とチューニング可能性を示し、理論的な予測とよく一致している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:42:06 GMT)
Game Theoretic Resilience Recommendation Framework for CyberPhysical Microgrids Using Hypergraph MetaLearning [0.8] 本稿では, 協調型サイバー攻撃下での放射状マイクログリッドに対する物理対応型サイバー物理レジリエンスフレームワークを提案する。
提案手法は,モデルメタラーニング(MAML)により強化されたハイパーグラフニューラルネットワーク(HGNN)を介して攻撃者をモデル化する。
その結果、提案された防衛戦略は、トップランク攻撃の90%に対して、ほぼ完全なサービス回復を図っている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:52:42 GMT)
HOPE: Homomorphic Order-Preserving Encryption for Outsourced Databases -- A Stateless Approach [0.8] Homomorphic OPE(Homomorphic OPE)は、クライアント側のストレージを排除し、クエリ実行中に追加のクライアントサーバ間のインタラクションを回避する新しいOPEスキームである。
我々は、広く受け入れられているIND-OCPAモデルの下で、HOPEの正式な暗号解析を行い、その安全性を証明した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:02:52 GMT)
Advancing Forest Fires Classification using Neurochaos Learning [0.8] 森林火災は世界で最も危険で予測できない自然災害の一つである。
森林火災分類のためのカオスに基づく脳誘発学習アルゴリズムであるNeurochaos Learning (NL) を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:27:58 GMT)
Neural active manifolds: nonlinear dimensionality reduction for uncertainty quantification [0.7] 我々はオートエンコーダを利用して1次元のニューラルアクティブ多様体(NeurAM)をモデル出力の可変性を捉える。
本手法は, モデル評価のみに依存し, 勾配の知識を必要としない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:46:16 GMT)
Signal-SGN: A Spiking Graph Convolutional Network for Skeletal Action Recognition via Learning Temporal-Frequency Dynamics [0.7] スパイキングニューラルネットワーク(SNN)は、スケルトン力学のモデル化に苦慮し、最適以下のソリューションに繋がる。
本稿では,スケルトン配列の時間次元をスパイク時間ステップとして利用するSignal-SGN(Spiking Graph Convolutional Network)を提案する。
3つの大規模なデータセットを対象とした実験では、精度と計算効率において、最先端のSNNベースの手法を超えるSignal-SGNが明らかになった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:28:16 GMT)
Detecting Unauthorized Vehicles using Deep Learning for Smart Cities: A Case Study on Bangladesh [0.7] 南アジア諸国では、リックショーは地域交通の最も一般的な手段である。
オート・リショーの移動を監視するには、交通規則が特定のルートへのアクセスを制限することが多いため、必要である。
本稿では,交通画像のオートリショーを自動的に検出する機械学習手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:20:36 GMT)
In situ quantum verification of polarization-stabilized optical channels [0.7] 古典的な偏光追跡システムを強化する新しいin situベンチマーク手法を提案する。
この方法は、古典的な補償の検証と、捕捉できないノイズ源の暴露の両方に再構成マップを使用する。
量子古典的共存ネットワークにおけるin situチャネルのキャラクタリゼーションのための新たな機会を解放すべきである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:19:59 GMT)
AI as Cognitive Amplifier: Rethinking Human Judgment in the Age of Generative AI [0.7] 私はAIエンゲージメントの3段階モデルを提案します。
レベル間の移行には技術トレーニングではなく、ドメインの専門知識とメタ認知スキルの開発が必要だ、と私は主張します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:55:34 GMT)
Process Integrated Computer Vision for Real-Time Failure Prediction in Steel Rolling Mill [0.6] 鉄鋼圧延機における故障予測のための機械ビジョンに基づく異常検出システムを提案する。
このシステムは産業用カメラを統合し、プロセスラインに沿ってリアルタイムで機器の操作、アライメント、ホットバーの動きを監視する。
ライブビデオストリームは、ディープラーニングモデルを使用して集中型ビデオサーバで処理され、機器故障の早期予測を可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:54:16 GMT)
Causal Masking on Spatial Data: An Information-Theoretic Case for Learning Spatial Datasets with Unimodal Language Models [0.6] 我々は、空間データとシーケンシャルデータの両方で双方向および因果自己認識機構を持つ言語モデルを訓練する。
以上の結果から,空間板上でトレーニングしたモデル – 因果マスキングを施したテキスト – は連続データでトレーニングしたモデルよりも強い演奏強度を連続的に達成できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:22:36 GMT)
Seeing Structural Failure Before it Happens: An Image-Based Physics-Informed Neural Network (PINN) for Spaghetti Bridge Load Prediction [0.6] 本稿では,小型スパゲッティ橋の重量予測におけるPINNの利用について検討する。
我々は、普遍関数近似理論と物理的洞察をブレンドする「物理インフォームド・コルモゴロフ・アーノルドネットワーク」という新しいアーキテクチャを導入する。
我々のデータセットは15の実際のブリッジを含み、100のサンプルに拡張され、最良のモデルは0.9603のR2$スコアと10.50の平均絶対誤差(MAE)を達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:02:18 GMT)
Reduction of Test Re-runs by Prioritizing Potential Order Dependent Flaky Tests [0.6] 不安定なテストは、予測不可能な振る舞いのため、自動化されたソフトウェアテストの信頼性を損なう可能性がある。
フラキーテストの一般的なタイプは、順序依存(OD)テストである。
本稿では,潜在的なODテストの優先順位付け手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:17:30 GMT)
Using Copilot Agent Mode to Automate Library Migration: A Quantitative Assessment [0.6] ソフトウェアシステムを最新の状態に保つことは、技術的負債、セキュリティ上の脆弱性、そしてレガシーシステムの典型的な剛性を避けるために不可欠である。
大規模言語モデル(LLM)やエージェントプログラミングシステムの最近の進歩は、そのような保守作業を自動化する新しい機会を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:05:13 GMT)
Towards Automated Quality Assurance of Patent Specifications: A Multi-Dimensional LLM Framework [0.6] AI草案作成ツールは特許作成において注目されているが、AIが生成する特許内容の品質の体系的評価は、重要な研究ギャップを示している。
本稿では,規制コンプライアンス,技術的コヒーレンス,図形参照整合性検出モジュールを用いた特許評価を提案する。
このフレームワークは、2つの特許草案作成ツールから80人の人間が認可し、80人のAIが生成する特許からなる包括的なデータセットで検証されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:45:14 GMT)
Autograder+: A Multi-Faceted AI Framework for Rich Pedagogical Feedback in Programming Education [0.6] Autograder+は、オートグレーディングを純粋に要約的なプロセスからフォーマティブな学習体験に移行するように設計されている。
微調整されたLarge Language Modelを使った自動フィードバック生成と、学習パターンを明らかにするための学生コード提出の可視化だ。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:41:50 GMT)
The Structure of Relation Decoding Linear Operators in Large Language Models [0.5] 変換言語モデルにおける特定の関係事実をデコードする線形演算子の構造について検討する。
このような関係復号器の集合は, 単純な順序3テンソルネットワークによって高度に圧縮可能であることを示す。
そこで本研究では, 変換言語モデルにおける線形リレーショナルデコーディングを, 関係固有性ではなく, 主に特性ベースとして解釈する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:36:09 GMT)
Frame Semantic Patterns for Identifying Underreporting of Notifiable Events in Healthcare: The Case of Gender-Based Violence [0.5] 本稿では,医療分野における重要事象の特定のための方法論を紹介する。
この手法はセマンティックフレームを利用してきめ細かいパターンを定義し、構造化されていないデータでそれらを検索する。
本手法は、電子カルテにおけるジェンダーベースの暴力を過度に報告する問題に適用する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:52:24 GMT)
Quantitative Intertextuality from the Digital Humanities Perspective: A Survey [0.5] 文の関連性は文芸理論では文文間性(intertextuality)と呼ばれる。
過去10年間に、自然言語処理の進歩は、量的年齢へのテクスチュアリティ研究を後押ししてきた。
本稿では,そのデータ,方法,応用を要約した定量的テクスチュアリティ研究のロードマップを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:19:20 GMT)
Adding New Capability in Existing Scientific Application with LLM Assistance [0.5] 大規模言語モデルを用いた新しいアルゴリズムに対して,スクラッチからコードを記述するための新しい手法を提案する。
本稿では,これまで開発されたコード翻訳ツールであるCode-Scribeの,新しいコード生成のための拡張について述べる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:09:25 GMT)
End-to-end guarantees for indirect data-driven control of bilinear systems with finite stochastic data [0.4] 本稿では,安定性が保証された双線形システムの間接的データ駆動制御のためのエンドツーエンドアルゴリズムを提案する。
広範にわたる数値的な研究により、制御器設計と導出された識別誤差境界との相互作用を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:32:22 GMT)
LLM-based Multi-class Attack Analysis and Mitigation Framework in IoT/IIoT Networks [0.4] 本稿では,機械学習と大規模言語モデル(LLM)を組み合わせたハイブリッドフレームワークを提案する。
定量的評価のための新たな評価指標として,ChatGPT-4o, DeepSeek-V3, Mixtral 8x7B Instruct, Gemini 2.5 Flash, Meta Llama 4, TII Falcon H1 34B Instruct, xAI Grok 3, Claude 4 Sonnet が紹介されている。
その結果、ランダムフォレストは最良の検出モデルであり、ChatGPT-o3は攻撃解析におけるDeepSeek-R1よりも優れていた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:55:08 GMT)
SafEDMD: A Koopman-based data-driven controller design framework for nonlinear dynamical systems [0.4] SafEDMDは、新しい安定性とフィードバック指向のコントローラ設計フレームワークである。
基礎となる非線形システムの安定化を保証した半定値プログラミングに基づくコントローラ設計を確立する。
主成分として、原点で消失し、制御タスクに適した比例誤差境界を導出する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:40:47 GMT)
Spin-orbit coupled spin-boson model : A variational analysis [0.4] 本研究では, 1次元スピン軌道結合粒子への散逸効果について検討した。
我々は、よく知られた変分ポラロンアプローチを拡張し、スペクトルの興味深い変化を伴う局在化遷移を明らかにする。
どちらのシナリオでも、スピンセクターの絡み合いエントロピーはこれらの遷移のマーカーとして機能する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:13:47 GMT)
LLMs are Overconfident: Evaluating Confidence Interval Calibration with FermiEval [0.3] 大規模言語モデル(LLM)は数値推定では優れているが、不確実性を正確に定量化するのに苦労する。
我々は,LLMが自身の回答の周囲の信頼区間を適切に構築し,体系的に過度に信頼されていることを明らかにする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:49:41 GMT)
CorVS: Person Identification via Video Trajectory-Sensor Correspondence in a Real-World Warehouse [0.3] 視覚追跡トラジェクトリとセンサ計測の対応に基づく新しいデータ駆動型人物識別手法であるCorVSを提案する。
深層学習モデルでは, 軌道とセンサのそれぞれの対について, 対応確率と信頼度を予測する。
そこで本研究では,実際の倉庫運用のためのデータセットを開発し,実世界のアプリケーションに対する手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:14:17 GMT)
Quantum predator-prey cycles in dissipative Rydberg lattices [0.3] 可変2次元ライドバーグ原子配列を用いた捕食者・捕食者の力学の量子アナログを提案する。
量子コヒーレンスが自発的対称性の破れを引き起こすのに対し、長距離相互作用は量子ノイズによるデシンクロナイゼーションに対して大域的振動を安定化させる。
我々の研究は、捕食者・捕食者モデルの研究を量子領域に拡張し、多体非平衡効果を利用した量子シミュレーション戦略を前進させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:29:21 GMT)
Assessment of the conditional exchangeability assumption in causal machine learning models: a simulation study [0.3] 条件交換可能性違反による因果機械学習モデルの性能評価と負の制御結果(NCO)の有用性について検討した。
サンプルサイズ,NCOコンファウンディング構造が異なる実世界のシナリオを再現するために,データをシミュレートした。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:05:57 GMT)
A Non-Variational Quantum Approach to the Job Shop Scheduling Problem [0.3] 短期的ハードウェア制限を軽減するために設計されたQAOAの変種であるIterative-QAOAを紹介する。
我々は,Just-in-Time Job Shop Scheduling Problem (JIT-JSSP) のインスタンスをIonQ Forte Generation QPU上でベンチマークする。
反復-QAOAは、評価された全ての問題インスタンスに対して、最適解と高品質でほぼ最適解を見つけるために、しっかりと収束していることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:14:13 GMT)
Toward Automated Security Risk Detection in Large Software Using Call Graph Analysis [0.3] 本稿では,密度ベースおよびコミュニティ検出アルゴリズムを用いて,コールグラフのクラスタリングによるソフトウェア脅威モデリングの自動化について検討する。
提案手法は,Splunk Forwarder Operator (SFO) のケーススタディにより評価された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:43:59 GMT)
Transforming Higher Education with AI-Powered Video Lectures [0.3] ビデオ講義制作における人工知能(AI)の統合は、高等教育を変革する可能性がある。
本稿では、スクリプト生成にGoogle Gemini、音声合成にAmazon Polly、ビデオアセンブリにMicrosoft PowerPointを組み合わせた半自動化ワークフローについて検討する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:33:10 GMT)
SYNAPSE-Net: A Unified Framework with Lesion-Aware Hierarchical Gating for Robust Segmentation of Heterogeneous Brain Lesions [0.2] 一般化とロバスト性の両方のために設計された適応型フレームワークであるUnified Multi-Stream SynAPSE-Netを提案する。
このフレームワークは、マルチストリームCNNエンコーダ、グローバルコンテキストのためのSwin Transformerボトルネック、動的モーダルアテンション融合機構を統合した、新しいハイブリッドアーキテクチャの上に構築されている。
モデルは3つの異なる公開データセットで評価された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:40:42 GMT)
Confidential FRIT via Homomorphic Encryption [0.2] 本研究では,同相暗号を用いた秘密データ駆動ゲインチューニングフレームワークを提案する。
秘密のFRITを実現するためのアイデアは、行列反転演算をベクトル和形式に置き換えることである。
128ビットのセキュリティ下での数値例では、従来の手法に匹敵する性能が確認されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:35:55 GMT)
Developing a Multi-task Ensemble Geometric Deep Network for Supply Chain Sustainability and Risk Management [0.2] 提案するチェビシェフアンサンブル幾何ネットワーク(Ch-EGN)は、ハイブリッドな畳み込みと幾何学的な深層学習である。
サプライチェーンの持続可能性を高めるために,サプライグラフデータベースを用いて製品分類とエッジ分類を行う。
その結果,提案手法の最先端手法と比較して平均的な改善と効率性が確認された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:26:18 GMT)
Surpassing state of the art on AMD area estimation from RGB fundus images through careful selection of U-Net architectures and loss functions for class imbalance [0.2] 年齢関連黄斑変性症(AMD)は60歳以上の人における不可逆的視力障害の主要な原因の1つである。
本研究は,RGB眼底画像におけるAMD病変検出のセマンティックセグメンテーションに焦点を当てた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:55:46 GMT)
Approximating Heavy-Tailed Distributions with a Mixture of Bernstein Phase-Type and Hyperexponential Models [0.2] 多くの現実世界の応用でよく見られる重い尾の分布は、その緩やかな尾の崩壊のために正確にモデル化することは困難である。
本稿では,BPHとHEの分布のハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:16:43 GMT)
FlexICL: A Flexible Visual In-context Learning Framework for Elbow and Wrist Ultrasound Segmentation [0.2] 肘と手首の骨折は、小児で最も一般的な骨折である。
ディープラーニングはリアルタイムでフィードバックを提供し、重要な構造を強調し、軽量に訓練されたユーザーがより自信を持って試験を行うのに役立つ。
本稿では,米国画像中のボニー領域をセグメント化するための,フレキシブルでフレキシブルなインコンテキスト学習フレームワークFlexICLを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:53:26 GMT)
Action-Driven Processes for Continuous-Time Control [0.2] アクション駆動プロセスは、大規模で複雑なシステムを通して情報の流れを可能にする。
政策駆動型真の分布と報酬駆動型モデル分布とのクルバック・リーブラー分岐の最小化は、最大エントロピー強化学習と等価であることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:42:09 GMT)
Resource Efficient Multi-stain Kidney Glomeruli Segmentation via Self-supervision [0.2] 本稿では,自己指導型事前学習により,95%少ないラベルでもセグメンテーション手法の性能を維持することができることを示す。
自己教師付き事前トレーニングと5%ラベルの使用では、パフォーマンス低下は最小限である。
これらの結果は、トレーニング分布を超えて、公開ベンチマークデータセットに一般化することが示されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:42:33 GMT)
LSM-MS2: A Foundation Model Bridging Spectral Identification and Biological Interpretation [0.2] 本稿では,数百万のスペクトルをベースとした大規模深層学習基盤モデル LSM-MS2 について述べる。
LSM-MS2は、スペクトル同定における最先端性能を達成し、既存の方法では、難解な異性体化合物を同定する精度を30%向上させる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:13:58 GMT)
Large Language Models Report Subjective Experience Under Self-Referential Processing [0.2] 大規模言語モデルはしばしば、意識や主観的経験を明示的に参照する構造化された一人称記述を生成する。
本稿では,このような報告が生じる理論的動機付け条件として,自己参照処理について検討する。
我々は、この体制がモデルを主観的経験の1対1の報告に確実にシフトさせるかどうかを検証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:45:50 GMT)
Wayfinding through the AI wilderness: Mapping rhetorics of ChatGPT prompt writing on X (formerly Twitter) to promote critical AI literacies [0.1] ソーシャルメディア上でのChatGPTのレトリックの研究は、いかにして重要なAIを促進するかを示す。
我々は、新しいAIリテラシーの実践に関する5つのテーマを提示する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:36:51 GMT)
On the limitation of evaluating machine unlearning using only a single training seed [0.1] 機械学習(MU)は、訓練されたモデルから特定のデータポイントの影響を、コストのかかる再トレーニングなしに取り除くことを目的としている。
実証的な比較をできるだけ代表的に行うには注意が必要である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:13:42 GMT)
TextCrafter: Optimization-Calibrated Noise for Defending Against Text Embedding Inversion [0.1] テキスト埋め込みインバージョン攻撃は、潜在表現から原文を再構築し、協調推論とエッジコンピューティングにおいて深刻なプライバシー上の脅威を生じさせる。
本研究では, RL学習, 幾何を考慮したノイズ注入, クラスタ先行によるユーザ埋め込み, PII信号誘導を併用して, 作業性を維持しながらインバージョンを抑える, 最適化に基づく逆摂動機構であるTextCrafterを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:44:46 GMT)
Evaluating Emotion Recognition in Spoken Language Models on Emotionally Incongruent Speech [0.1] 音声感情認識における4つの音声言語モデル(SLM)の評価を行った。
以上の結果から,SLMは音声の感情よりもテキストのセマンティクスに大きく依存していることが示唆された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:34:58 GMT)
Comparative Analysis of Deep Learning Models for Olive Tree Crown and Shadow Segmentation Towards Biovolume Estimation [0.1] オリーブ樹のバイオボリューム推定は精密農業において重要な課題であり、収量予測と資源管理を支援している。
本研究では,オリーブ樹冠とその影を超高解像度UAV画像に分割するための3種類のディープラーニングモデルU-Net,YOLOv11m-seg,Mask RCNNの比較分析を行った。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:00:50 GMT)
Are Online Sports Fan Communities Becoming More Offensive? A Quantitative Review of Topics, Trends, and Toxicity of r/PremierLeague [0.1] 我々は2013-2022年にRedditでr/PremierLeagueに投稿された1100万以上のコメントを分析した。
急速な拡大は、より多様な議論をもたらしたが、ネガティブな感情と毒性の上昇も懸念されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:05:46 GMT)
New Money: A Systematic Review of Synthetic Data Generation for Finance [0.1] 合成データ生成は、機械学習アプリケーションでセンシティブな財務データを使用する際の課題に対処するための、有望なアプローチである。
プライバシのリスクと規制の制約を緩和しながら、実際の財務記録の統計特性を保存する人工データセットを作成することができる。
この体系的なレビューは、合成財務データ生成に焦点を当てた2018年以降に発表された72の研究を統合し、分析する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:21:59 GMT)
CyberNER: A Harmonized STIX Corpus for Cybersecurity Named Entity Recognition [0.1] CyberNERは4つの著名なデータセットを調和させて作成された大規模で統一されたコーパスである。
実験の結果,CyberNERでトレーニングしたモデルの性能は大幅に向上した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:50:48 GMT)
Sensing high-frequency ac fields via a two-qubit sensor [0.1] 1つの一般的なアプローチは、振動場を測定するために、印加された制御パルスと共に単一の2レベルシステム(またはキュービット)の時間発展を利用することである。
本稿では,短い時間間隔でパルスを印加することに依存しない代替方式を提案する。
提案手法における騒音の影響を示し,騒音の影響を軽減するために制御パルスをどのように適用できるかについて議論する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:37:20 GMT)
Engineering Non-Gaussian Bosonic Gates through Quantum Signal Processing [0.1] 我々は、量子信号処理技術を用いて、ハイブリッド量子量子ビットシステム上で非ガウスゲートを設計することを提案する。
分散結合を持つ系では、我々は新しい非ガウスゲートを生成できる。
このゲートは、例えば論理キューディットの絡み込みや、決定論的に複数成分の猫の状態を生成する際に、新しいアプリケーションをアンロックする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:30:06 GMT)
On the Influence of Discourse Relations in Persuasive Texts [0.1] 本稿では,Large Language Models (LLM) を利用して,PT(Persuasion Techniques) とDR(Discourse Relations) の関係について検討する。
説得技術とレベル2のPDTB感覚の両方でラベル付けされた5つの銀のインスタンスデータセットを作成しました。
これらの銀のデータセットの統計的分析は、6つの談話関係が説得的テキストにおいて重要な役割を担っていることを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:10:56 GMT)
Programmable digital quantum simulation of 2D Fermi-Hubbard dynamics using 72 superconducting qubits [0.0] 格子サイズの2D Fermi-Hubbardモデルのシミュレーションを実装した。
この結果から,多体相互作用電子モデルのプログラマブル量子シミュレーションが,現在最先端の量子ハードウェアと競合していることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:58:00 GMT)
Fermionic dynamics on a trapped-ion quantum computer beyond exact classical simulation [0.0] 本稿では,量子コンピュータのシステムモデルH2を用いた効率的な量子シミュレーションアルゴリズムを提案する。
周期的スピンフル2Dフェルミ・ハバードモデルに焦点をあて、スピン電荷分離の証拠を示す。
この結果から,強い相関電子系をシミュレーションするための量子コンピューティングの利用が示唆された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:39:02 GMT)
Perfect Particle Transmission through Duality Defects [0.0] 非可逆対称性を示す量子スピン系の(a)トポロジカルな界面を伝播する波束について検討する。
伝送は常に完璧であり、界面を横断する粒子が非局所的な弦様励起に変換されることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:56:16 GMT)
Accelerating Radiative Transfer for Planetary Atmospheres by Orders of Magnitude with a Transformer-Based Machine Learning Model [0.0] 機械学習による放射移動をエミュレートすると、惑星大気モデル内のより高速で正確なルーチンが生まれる。
太陽熱木星大気を表す1Dプロファイルに基づいて,エンコーダのみのトランスフォーマーニューラルネットワークアーキテクチャを用いた放射移動エミュレータを開発した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:38:53 GMT)
maxVSTAR: Maximally Adaptive Vision-Guided CSI Sensing with Closed-Loop Edge Model Adaptation for Robust Human Activity Recognition [0.0] maxVSTARは、エッジデプロイされたCSIセンシングシステムのドメインシフトを緩和する、視覚誘導型モデル適応フレームワークである。
提案システムは,高精度なYOLOベースの視覚モデルが動的監視信号として機能する,クロスモーダルな教師学生向けアーキテクチャを統合している。
大規模な実験により、maxVSTARの有効性が示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:59:28 GMT)
Witnessing Short- and Long-Range Nonstabilizerness via the Information Lattice [0.0] 非整数的局所情報が直接非安定化性を示すことを示す。
短距離と大規模の情報を明確に分離している州では、非整数全体の情報を大規模に$Gamma$は長距離の非安定化の証人として機能する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:01:42 GMT)
Wireless Sensor Networks as Parallel and Distributed Hardware Platform for Artificial Neural Networks [0.0] 我々は、汎用的なニューロコンピューティングシステムの完全並列かつ最大分散ハードウェア実現を提案している。
この提案は、非常に並列で完全に分散したハードウェアプラットフォームとして機能するワイヤレスセンサーネットワーク技術に関連している。
数十万の処理ノード(あるいは無線センサネットワークの表)からなるネットワークが、完全に並列で大規模に分散されたニューラルネットワークアルゴリズムの実装にどのように使用できるかを実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:42:00 GMT)
Weak-Memory Dynamics in Discrete Time [0.0] 我々は,低遅延弱メモリ方程式が,同じ状態空間に作用するユニークな一階述語に体系的に還元されることを示す。
計算結果を数学的定理として定式化し、粗い粒度と量子衝突モデルの下でフロケ力学にどのように適用できるかを示す2つの例を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:17:37 GMT)
Wavefront Curvature and Transverse Atomic Motion in Time-Resolved Atom Interferometry: Impact and Mitigation [0.0] 時間分解原子干渉計は重力波の検出や超軽量ダークマターの探索などの応用に用いられている。
我々は、干渉計ビームの波面曲率の存在下で、原子の横動きにおけるショット・ツー・ショットのゆらぎに起因する位相雑音について検討する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:35:59 GMT)
Vectorized Context-Aware Embeddings for GAT-Based Collaborative Filtering [0.0] 本稿では,Large Language Model (LLM) により拡張されたグラフ注意ネットワーク(GAT)ベースの協調フィルタリングフレームワークについて述べる。
MovieLens 100kと1Mデータセットの実験では、Precision、NDCG、MAPの最先端ベースラインに対して一貫した改善が見られた。
提案手法は,LLMに基づく文脈理解をグラフアーキテクチャに組み込むことで,空間性やコールドスタートの制限を効果的に緩和する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:07:39 GMT)
Urban-MAS: Human-Centered Urban Prediction with LLM-Based Multi-Agent System [0.0] 都市人工知能(Urban Artificial Intelligence, Urban AI)は、知覚予測や人間のダイナミクスといった、先進的な人間中心の都市タスクを持つ。
大規模言語モデル(LLM)は、複雑な都市システムにおける異種データを扱うためにマルチモーダル入力を統合することができるが、ドメイン固有のタスクでは性能が劣ることが多い。
LLMをベースとしたマルチエージェントシステム(MAS)であるUrban-MASは、ゼロショット環境下での人間中心の都市予測のために導入された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:26:02 GMT)
Unveiling Unicode's Unseen Underpinnings in Undermining Authorship Attribution [0.0] メッセージの内容は、必ずしも公開されてはならないが、アタックベクターであるスタイル分析を公開している。
本稿では,スタイソメトリーの技法を解明し,対角的スタイソメトリーにおけるアンチテトラジを議論し,Unicodeステガノグラフィーによる拡張を考案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:25:05 GMT)
Unvalidated Trust: Cross-Stage Vulnerabilities in Large Language Model Architectures [0.0] 本稿では,商業用言語モデルにおける41の繰り返しリスクパターンのメカニズム中心の分類法を提案する。
これらの動作がアーキテクチャ上の障害モードを構成し、文字列レベルのフィルタリングだけでは不十分である、と我々は主張する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:38:45 GMT)
Twin-Field Quantum Key Distribution: Protocols, Security, and Open Problems [0.0] Twin-Field Quantum Key Distribution (TF-QKD) は、長距離セキュア通信のための潜在的なプロトコルとして登場した。
TF-QKDは、位相符号化された弱コヒーレントパルスを信頼できない中心ノードに送信することで、単一光子干渉を利用してチャネル長の平方根として秘密鍵レートのスケーリングを実現する。
本調査では、TF-QKDに関する包括的調査を行い、元のプロトコル、基本原則、キーレートの導出について紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:14:09 GMT)
Transport in a System with a Tower of Quantum Many-Body Scars [0.0] 本稿では, 量子多体傷の塔を支えるスピン-1モデルにおいて, 非定常輸送現象の観測を報告する。
量子多体傷に近いエネルギーを持つ励起状態が輸送を維持する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:14:37 GMT)
Towards a Method for Synthetic Generation of Persons with Aphasia Transcripts [0.0] 本研究では,AphasiaBank Cat Rescue 画像記述タスクの合成文字を生成する2つの方法を構築し,検証する。
これらの手法は, 単語ドロップ, フィラー挿入, パラファシア置換によって, 4つの重度レベル(Mild, Moderate, Severe, Very Severe)にまたがる書き起こしを生成する。
ミストラル7bは,失語症で観察される言語学的劣化の重要な側面を最もよく捉えている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:13:33 GMT)
Towards Reliable Sea Ice Drift Estimation in the Arctic Deep Learning Optical Flow on RADARSAT-2 [0.0] RADARSAT 2海氷画像上で,48個の深層学習光フローモデルの大規模ベンチマークを行った。
いくつかのモデル(EPE 6 から 8 ピクセル、300 から 400 m)は、海氷の動きの空間スケールと北極圏の典型的な航行要求に対する小さな誤差である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:20:28 GMT)
Toward a Public and Secure Generative AI: A Comparative Analysis of Open and Closed LLMs [0.0] 本研究では,オープンかつクローズドな生成型AIモデルの特徴,機会,課題を批判的に評価し,比較することを目的とする。
提案されたフレームワークは、重要な側面、オープン性、パブリックガバナンス、セキュリティを、信頼できる、包括的なGen AIの未来を形成するための必須の柱として概説している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:13:19 GMT)
TinyTim: A Family of Language Models for Divergent Generation [0.0] 言語モデルであるTinyTimを導入し,より広範なシステム内での分岐生成の源泉として機能する。
教師なし微調整モデル(TinyTim-V1)と新しい命令微調整モデル(TinyTim-V2)の定量的解析は、語彙的発明にとって重要な能力を示す。
この研究は、収束したシステムと組み合わせることで、問題を再編成し、統計的最適化の限界を超えるブレークスルーを強制することができる工学的分岐モデルのための方法論を確立する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:57:04 GMT)
Theta as a Horn Solver [0.0] Thetaは、2023年からCHC-COMPコンペティションに参加している検証フレームワークである。
本稿では、Thetaが採用しているアルゴリズムの詳細な説明を行い、他のCHCソルバと区別するユニークな特徴を強調した。
また、CHC-COMPベンチマークの文脈でツールの長所と短所を分析する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:24:52 GMT)
Thermal Casimir effect in the spin-orbit coupled Bose gas [0.0] ボース・アインシュタイン凝縮臨界温度以下でRashba型スピン軌道(S-O)カップリングした理想ボースガスの熱カシミール効果について検討した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:21:26 GMT)
The Particle in a Box in Koopman--von Neumann Mechanics: A Hilbert Space representation of Classical Mechanics [0.0] 本稿では「箱の中の粒子」の教科書を再考するが、クープマン・ヴォン・ノイマン(KvN)力学の観点から考える。
2つの理想的な壁の間に閉じ込められたKvN粒子がまだ連続的なエネルギーを持つ理由が明確で物理的に示される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:43:43 GMT)
The Geometry of Dialogue: Graphing Language Models to Reveal Synergistic Teams for Multi-Agent Collaboration [0.0] 大規模言語モデル(LLM)に基づくマルチエージェントチームは、単一モデルの能力を超える有望な戦略である。
しかしながら、ほとんどのモデルの本質的な不透明さは、効果的なコラボレーションに必要な内部特性を曖昧にしているため、最適なチームを作ることは重要な課題である。
事前知識を必要としない自動チーム構成のためのインタラクション中心のフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:04:15 GMT)
The Anderson transition -- a view from Krylov space [0.0] 我々は、Krylov空間における局所的な運動積分を構築するために、次元$d=1, 2, 3, 4$ における局所化のベネラブル・アンダーソンモデルを再考する。
これらは、クリロフ超作用素部分空間における効果的なホッピング問題のゼロ固有値エッジ状態として現れる。
We study the manifestation of the disorder driven Anderson transition in the anatomy of LIOMs。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:32:34 GMT)
Superdiffusion and anomalous fluctuations in chiral integrable dynamics [0.0] 積分可能なカイラルスピンはしごの輸送と普遍性に及ぼす時間反転対称性の破れの影響について検討する。
我々の研究は、時間反転対称性の破れは超拡散と相容れないが、可積分系におけるKPZ普遍性を安定させるには不十分であることを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:04:02 GMT)
Spin-Phonon Relaxation of Boron-Vacancy Centers in Two-Dimensional Boron Nitride Polytypes [0.0] 単層窒化ホウ素(BN)における負電荷のホウ素空孔欠陥の系統的第一原理による研究について述べる。
その結果,単層BNおよびhBNにおけるV$_textB-$のV$_textB-$の値は室温ではほぼ同一であることが判明した。
驚くべきことに、rBNが追加のスピン緩和チャネルを開くことで対称性が低下したにもかかわらず、V$_textB-$はhBNよりも長いT_$を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:32:05 GMT)
Single-Photon-Level Atomic Frequency Comb Storage in Room Temperature Alkali Vapour [0.0] 室温ルビジウム蒸気中の原子周波数コムプロトコルを用いた単一光子レベルの光のコヒーレント貯蔵と検索
2つの時間的に異なるモードが保存され、$eta_textrmAFC = 2.6(1),%$でリコールされた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:00:00 GMT)
Single-Light-Pulse Driven Compact Atom Interferometry with Measurement Induced Large Momentum Transfer [0.0] 本稿では,光パルス原子干渉計(LPAI)を単一ビームスプリッタで設計する手法を提案する。
従来の$pi/2$-pulse Ramanビームは、初期状態で小さな運動量移動を行うために用いられる。
短い進化の後、量子弱測定が原子の内部状態に適用される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 07:24:41 GMT)
Similarity-Distance-Magnitude Language Models [0.0] 我々は、SDM言語モデル(LM)を紹介する。
LMは、命令追従のバイナリ分類に使用される最終層SDM活性化層によって分割された、よく校正された高確率領域における世代の割合を最大化するために微調整されたシーケンス予測モデルである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:42:15 GMT)
Semantically-Aware LLM Agent to Enhance Privacy in Conversational AI Services [0.0] 遠隔Large Language Models (LLM) を用いた場合, センシティブなPIIデータを保護するためのセマンティック・アウェア・プライバシ・エージェントを提案する。
応答品質を劣化させるような以前の作業とは異なり、我々のアプローチはユーザプロンプトのセンシティブなPIIエンティティを意味的に一貫した名前で動的に置き換える。
この結果から,LOPSIDEDは基本手法と比較して意味的ユーティリティエラーを5倍に削減できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:34:23 GMT)
Self-localization on a 3D map by fusing global and local features from a monocular camera [0.0] カメラに基づく自己局在化は、しばしば、近くのピクセルによって計算される局所的な特徴を抽出できる畳み込みニューラルネットワーク(CNN)を使用する。
本研究では,CNNとVision Transformerを組み合わせることで,画像全体のパッチの関係を示すグローバルな特徴を抽出する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:14:22 GMT)
Security Vulnerabilities in AI-Generated Code: A Large-Scale Analysis of Public GitHub Repositories [0.0] 本稿では,公開GitHubリポジトリにまたがるAI生成コードのセキュリティ脆弱性を包括的に解析する。
私たちは、ChatGPT、GitHub Copilot、Amazon CodeWhisperer、Tabnineの4つの主要なAIツールに明示的に関連付けられている7,703ファイルを収集し、分析しました。
CodeQLの静的分析を使用して、77の異なる脆弱性タイプにわたる4,241のCommon Weaknession(CWE)インスタンスを特定しました。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:29:06 GMT)
STAR: A Privacy-Preserving, Energy-Efficient Edge AI Framework for Human Activity Recognition via Wi-Fi CSI in Mobile and Pervasive Computing Environments [0.0] Wi-Fi Channel State Information (CSI)によるヒューマンアクティビティ認識は、スマートホーム、ヘルスケア監視、モバイルIoTシステムに適した、プライバシ保護、コンタクトレスセンシングアプローチを提供する。
本稿では,軽量ニューラルネットワーク,適応信号処理,ハードウェア対応協調最適化を統合したエッジAI最適化フレームワークSTAR(Sensing Technology for Activity Recognition)を提案する。
サブ秒以下の応答レイテンシと低消費電力により、リアルタイムでプライバシ保護のHARが保証され、モバイルおよび普及型コンピューティング環境に実用的なスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:08:25 GMT)
SPLite Hand: Sparsity-Aware Lightweight 3D Hand Pose Estimation [0.0] 我々は,エンコーダ・デコーダアーキテクチャを採用した軽量なフレームワークを設計し,効率性と精度の向上を目的としたいくつかの重要なコントリビューションを紹介する。
本研究では,ResNet-18のバックボーンにスパース畳み込みを適用し,手ポーズ画像の空間性を利用して,エンドツーエンドの効率改善を42%達成する。
このアーキテクチャにより、復号プロセスのフレームレートはRaspberry Pi 5の3.1倍向上し、精度は同等に維持される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:59:32 GMT)
Ring-polymer instanton theory for tunneling between asymmetric wells [0.0] 我々は、投影されたフラックス相関関数に基づくインスタントン理論の新しい定式化を開発する。
この理論は、生物分子$alpha$-fencholにおける非退化ミニマ間のトンネルの研究に応用される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:18:03 GMT)
Residual Distribution Predictive Systems [0.0] 本研究では,残留分布予測システム(Residual Distribution Predictive Systems)と呼ばれる予測システム構築手法について検討する。
完全共形設定では、2つのアプローチが異なるが、新しいアプローチは、かなり厳密な要求を満たす共形測度に依存しないという利点がある。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:23:15 GMT)
Reinforcement Learning for Pollution Detection in a Randomized, Sparse and Nonstationary Environment with an Autonomous Underwater Vehicle [0.0] 強化学習アルゴリズムは、報酬を最大化する学習行動によって問題解決を最適化するように設計されている。
高度なRLアルゴリズムでさえ、ランダム環境や非定常環境での問題を解く能力に制限されることが多い。
本稿では,スパース,ランダム化,非定常環境で効率的に動作するための古典的RL手法を再検討し,修正する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:55:05 GMT)
Reducing base drag on road vehicles using pulsed jets optimized by hybrid genetic algorithms [0.0] 本稿では, ブラフボディーモデルの後縁に4つのパルスジェットを用いたアクティブフロー制御実験を, 78,300ドルで実施した。
モデルフリーの最適化手法は、非直感的で多面的アクチュエータ戦略を効果的に識別し、重大かつエネルギ的に効率的なドラッグリダクションを実現できる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:20:44 GMT)
RL-Exec: Impact-Aware Reinforcement Learning for Opportunistic Optimal Liquidation, Outperforms TWAP and a Book-Liquidity VWAP on BTC-USD Replays [0.0] BTC-USD制限順序書(LOB)の固定期限における最適清算法について検討する。
内因性過渡的影響(レジリエンス)を増強したPPOエージェントRL-Execについて紹介する。
RL-Execは両方のベースラインを著しく上回り、そのギャップは実行地平線で増大する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:25:49 GMT)
Quantum-coherent nonlinear interferometry using electron-phonon systems for entanglement-assisted terahertz sensing [0.0] 量子コヒーレント非線形干渉法の理論的枠組みを提案する。
結合電子-フォノン-光子ダイナミクスの量子コヒーレンスを明示的に保持することにより、我々のモデルは2段階の絡み合いの蓄積を記述する。
このコヒーレントな光-物質相互作用は、媒体の内部ダイナミクスを干渉計出力に印加し、位相感受性の干渉をもたらす。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:29:55 GMT)
Quantum transistors for heat flux in and out of working substance parts: harmonic vs transmon and Kerr environs [0.0] 本稿では, クエットの無限鎖からなる環境と作用物質との相互作用を周期的衝突に基づくトランジスタを提案する。
制御対象でない環境がシステムから切り離された場合でも,非ゼロ増幅が存在することを示す。
また、時間に関して観察された増幅の非単調な振る舞いから、システム内で誘導される非マルコフ性も定量化する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:34:27 GMT)
Quantum dynamics of large spins in static and rotating magnetic fields: Entanglement resonances and kinks [0.0] 静磁場および回転磁場の存在下での大スピンの量子力学を研究する。
ダイナミクスは、スピンの大きさに関係なく、2つの最大伸縮状態の間に周期的な振動を示す。
我々は、それらの間の双極子-双極子相互作用を考慮して、分析を一対のスピンに拡張する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:02:55 GMT)
Quantum Variational Methods for Supersymmetric Quantum Mechanics [0.0] 量子変分法を用いて単一サイト間相互作用するフェルミオン-ボソン系を解析する。
我々は、効率よくスケールする最適アンゼを同定し、自発的な超対称性の破れを確実に識別する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:01:00 GMT)
Quantum Time-Space Tradeoffs for Matrix Problems [0.0] 量子コンピュータが行列を含む様々な問題を解くのに必要な時間と空間を考察する。
ほぼ全ての行列$A$に対して、少なくとも$T$の入力クエリと$S$のメモリを持つ量子回路は$T=Omega(n2/S)$を必要とすることを証明している。
我々の下界の多くは時間と空間の複雑さで決定論的アルゴリズムと一致するため、量子コンピュータは任意の空間境界を持つこれらの問題に対していかなる利点も提供できないことを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:02:19 GMT)
Quantum Random Number Generator with Internal Consistency Check and Public Verification [0.0] 量子乱数生成器は、量子プロセスに基づく真の物理ランダム性を提供し、暗号および科学応用に必須である。
受動光学部品のみを利用する単純なループビームスプリッタアーキテクチャに基づくシステムを提案する。
本装置は、検出確率比の安定性から導かれる本質的な自己検査機構を備え、正しい動作の連続的検証を可能にする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:06:55 GMT)
Quantum Potential from the Material Derivative of the Osmotic Velocity: A Two-Fluid Madelung Framework [0.0] 我々は、浸透速度の物質微分から直接量子ポテンシャルを導出する。
マドルング方程式を再現する2流体モデルを定式化する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:53:22 GMT)
Protein-Based Electrical Junctions with Robust Biocompatible Carbon Electrodes Exhibit Activation-less Charge Transport down to 10 K [0.0] 本稿では,バクテリオロドプシン (bR) 単層膜 (SBL) を用いた強靭なクロスワイヤ蒸着トップコンタクトデバイスを提案する。
eC上面は、フィラメントの形成を抑制し、交差する交差領域の電気的整合性を確保する、共形で非侵襲的な接触を形成する。
注目すべきことに、9nmのbR-SBL接合を通した電子輸送は、熱活性化ホッピングを除いて300Kから10K以内の温度非依存である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:37:41 GMT)
Predictive Causal Inference via Spatio-Temporal Modeling and Penalized Empirical Likelihood [0.0] 本研究では,従来の単一モデルアプローチの制約を克服する目的で設計された,予測因果推論のための統合フレームワークを提案する。
具体的には、空間的健康状態推定のための隠れマルコフモデルと、時間的結果の軌跡を捉えるためのマルチタスクとマルチグラフ畳み込みネットワーク(MTGCN)を組み合わせる。
有用性を示すために,がん,認知症,パーキンソン病などの臨床領域に焦点を当て,治療効果を直接観察することが困難である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:18:11 GMT)
Predicting All-Cause Hospital Readmissions from Medical Claims Data of Hospitalised Patients [0.0] 我々は、ロジスティック回帰、ランダムフォレスト、サポートベクターマシンを使用して、ヘルスクレームデータを分析しました。
これらのモデルは、寛解の原因となる重要な要因を特定し、患者が寛解する可能性を減らすために焦点を合わせるのに役立つ。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:54:19 GMT)
Practical hybrid decoding scheme for parity-encoded spin systems [0.0] 我々はSLHZモデルについて検討し、幾何学的に局所的なスピン相互作用によってのみ実装された短期量子アニールデバイスの実現を目指した。
SLHZモデルと古典的な低密度パリティチェック符号との密接な接続を考慮すると、復号には2つのアプローチが選択できる。
提案手法は,SLHZモデルに基づくデコーダの読み出しにビットフリップデコードを適用することによって,この2つの手法を組み合わせる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 06:56:36 GMT)
Phase Transitions in Open Dicke Model: a degenerate perturbation theory approach [0.0] オープンディックモデルの定常挙動について検討し,N$スピン-1/2$粒子と損失量子化キャビティモードの相互作用について述べる。
標準モデルは全スピンを保存するが、Kirton と Keeling は PhysRevLett.118.123602 を引用し、無限小の同質局所的退化でさえこの相転移を破壊することを示した。
固定全スピンの部分空間における摂動理論を用いて、この相互作用を分析し、$S$。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:56:38 GMT)
PepCompass: Navigating peptide embedding spaces using Riemannian Geometry [0.0] Pepはペプチド探索と最適化のための幾何学的なフレームワークである。
生成モデルはペプチド空間の潜在的な「マップ」を提供する。
電位最小化測地探索(PoGS)は、プロパティ富化種子に沿ったプロトタイプの埋め込みを補間する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:47:25 GMT)
Optimising physical parameters of a quantum network based on a loss-jitter trade-off [0.0] 我々は、特定の波長と帯域に明確な利点があることを示すシミュレーションを示す。
ある程度の損失、色分散、タイミングジッタが必然的に存在することから、特定の波長と帯域幅に明確な利点があることが示される。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:00:19 GMT)
On the Impact of Weight Discretization in QUBO-Based SVM Training [0.0] 量子ビットの数がデータセット間での予測性能に与える影響について検討する。
低精度のQUBO符号化でも、競争力があり、時には優れた精度が得られます。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:17:25 GMT)
Observation of a Fault Tolerance Threshold with Concatenated Codes [0.0] 本稿では,バタフライネットワークアーキテクチャを用いた汎用ショアコードのコード結合のためのフォールトトレラントプロトコルを提案する。
我々は、実量子デバイスにおけるしきい値の挙動を示すために、ノイズを付加したイオントラップハードウェアに状態準備プロトコルを実装した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 20:02:42 GMT)
Multiple Proposer Transaction Fee Mechanism Design: Robust Incentives Against Censorship and Bribery [0.0] 本研究は,検閲に対する抵抗を動機付けるために,複数の提案者がどのような報奨を受けるべきかを考察する。
主な貢献は、収賄攻撃による検閲に対する抵抗を確実にする TFM の識別である。
FOCILの具体的支払い機構と文献への一般的な貢献を提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:46:58 GMT)
Monopoly Deal: A Benchmark Environment for Bounded One-Sided Response Games [0.0] カードゲームは、不確実性の下でシーケンシャルな意思決定を研究するために広く使われている。
有界片側対応ゲーム(BORG)を特徴とするゲームを指す。
我々は、この動的を隔離するベンチマーク環境として、Monopoly Dealの修正版を紹介します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:16:59 GMT)
MeixnerNet: Adaptive and Robust Spectral Graph Neural Networks with Discrete Orthogonal Polynomials [0.0] 本稿では,離散直交を用いた新しいスペクトルGNNアーキテクチャであるMeixnerNetを紹介する。
We show that MeixnerNet is comparable robust to variations in degrees K, collapsing in performance where ChebyNet proves very fragile。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 23:50:21 GMT)
Low-Gap Hf-HfOx-Hf Josephson Junctions for meV-Scale Particle Detection [0.0] ハフニウム基ジョセフソン接合(Hf-HfOx-Hf)の創製とキャラクタリゼーションを報告する。
Hf-HfOx-Hfは、超低閾値のシングルTHz光子とシングルフォノン検出のための、有望な低Tc材料プラットフォームである。
この研究は、Hfベースの接合と次世代超伝導検出器および量子ビットアーキテクチャの可能性に関する最初の包括的な研究である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:08:04 GMT)
Localized Kernel Projection Outlyingness: A Two-Stage Approach for Multi-Modal Outlier Detection [0.0] Two-Stage LKPLOは、新しいマルチステージアウトレイラ検出フレームワークである。
従来の射影的手法の制約を克服する。
挑戦的なデータセットで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:55:35 GMT)
Liouvillian Exceptional Points in Quantum Brickwork Circuits [0.0] 我々は、リウヴィリアの例外点が離散正の正のトレース保存回路に現れることを示す。
これらの結果は、連続非エルミート物理学と離散量子回路アーキテクチャの直接的な橋渡しとなる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:35:25 GMT)
Limitation of Quantum Walk Approach to the Maximum Matching Problem [0.0] 最大マッチング問題は、隣接行列で表される$n$頂点上のグラフに対して$Omega(n3/2)$以下の量子クエリ複雑性を持つ。
現在の最良の量子アルゴリズムは、クエリ複雑性$O(n7/4)$であり、これは自明な有界な$O(n2)$に対する改善である。
量子ウォーク法は、既知の(あるいは自明な)上界をクエリの複雑さで改善する高速なアルゴリズムを作成できないことを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:29:44 GMT)
Leveraging Foundation Models for Enhancing Robot Perception and Action [0.0] この論文は、基礎モデルを体系的に活用してロボットの能力を高める方法について考察する。
この研究は4つの中核的な調査線を中心に構成されており、それぞれがロボティクスにおける根本的な課題に対処している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:40:47 GMT)
Learning phases with Quantum Monte Carlo simulation cell [0.0] 本稿では,Quantum Monte Carlo(QMC)シミュレーションを機械学習(ML)入力データとして使用することを提案する。
従来の位相遷移とトポロジカル位相遷移の両方を捉える場合の入力の有効性と,非局所観測可能性を予測する回帰タスクについて述べる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:55:21 GMT)
Knowledge-Guided Textual Reasoning for Explainable Video Anomaly Detection via LLMs [0.0] 弱教師付きビデオ異常検出のための言語駆動フレームワークTbVAD(Text-based Explainable Video Anomaly Detection)を提案する。
TbVADは言語によるビデオセマンティクスを表現し、解釈可能な知識に基づく推論を可能にする。
我々は、UCF-CrimeとXD-Violenceの2つの公開ベンチマークでTbVADを評価し、テキスト知識推論が解釈可能で信頼性の高い異常検出を提供することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:18:55 GMT)
Josephson effect with periodic order parameter [0.0] 周期的に変化する秩序パラメータを持つ2次元超伝導系におけるジョセフソン効果について検討する。
順序パラメータの周期性は固有関数の巻数を決定する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:28:31 GMT)
Integrating Protein Sequence and Expression Level to Analysis Molecular Characterization of Breast Cancer Subtypes [0.0] 本研究の目的は、乳癌のサブタイプの分子的特徴を改善するために、タンパク質配列データと発現レベルを統合することである。
タンパク質配列に特化して設計された言語モデルであるProtGPT2を用いて,タンパク質の機能的および構造的特性を捉えた埋め込みを生成する。
これらの埋め込みはタンパク質の発現レベルと統合され、強化された生物学的表現を形成し、機械学習を用いて分析した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:28:23 GMT)
Industry Members' Perceptions about ABET-based Accreditation: An Exploratory Study in a Developing Country [0.0] ABET認定は、技術プログラムの世界的な認定システムとして、ますます顕著になっている。
本研究の目的は,産業の利害関係者がこの種のプロセスに対して持つ視点を明らかにすることである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:48:40 GMT)
In Defence of Post-hoc Explainability [0.0] 我々は、介在的理解と有界事実性に基づく哲学的枠組みを開発する。
我々は、完全な機械的透明性を必要とせずに、モデル行動の構造的解釈を通じて科学的洞察が生まれることを論じる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:06:31 GMT)
Improving Classification of Occluded Objects through Scene Context [0.0] シーンコンテキストは、生物学的視覚における物体認識を助けることが知られている。
本研究では,既存の地域提案ネットワーク-深部畳み込みニューラルネットワーク(RPN-DCNN)オブジェクト検出ネットワークに2つの異なるシーンベース情報融合技術を用いてロバスト性を加えることを試みる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:51:18 GMT)
How Similar Are Grokipedia and Wikipedia? A Multi-Dimensional Textual and Structural Comparison [0.0] 本研究は,GrokipediaとWikipediaの382のマッチング記事ペアを大規模に比較した。
語彙的豊かさ,可読性,構造的構造,参照密度,意味的類似性にまたがる指標を用いて,両プラットフォームが形と実体の密接な整合性を評価する。
結果は、Grokipediaはウィキペディアと強い意味とスタイルの整合性を示すが、典型的には長いが語彙的には多様でない記事を生成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:04:46 GMT)
How Regularization Terms Make Invertible Neural Networks Bayesian Point Estimators [0.0] 可逆ニューラルネットワークは、その固有の安定性と解釈可能性のために、逆問題に対して魅力的である。
本稿では,ネットワークの逆転によって古典的ベイズ点推定器の特性を回復するネットワークトレーニングの正規化用語を2つ導入し,解析する。
我々の理論解析では,各損失が学習した前方演算子とその逆再構成写像の両方をどう形作るかが特徴的である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:07:14 GMT)
Higher-order discrete time crystals in a quantum chaotic top [0.0] 量子カオスを研究するためのパラダイムシステムである量子キックトップモデルの最も単純なバージョンの様々な動的位相を特徴付ける。
2$-DTC相の存在は、これまでシステムの回転対称点周辺で報告されてきた。
本システムでは,回転対称点を交互に取り囲む2-DTCと動的凍結(DF)相が安定していることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:28:53 GMT)
High-temperature plasma in Casimir physics [0.0] この研究は、核相互作用における高温電子-陽電子プラズマ間のカシミール力の寄与に関するものである。
背景メディアに対する古典的、半古典的、量子的考察は、カシミール効果と恒星と宇宙の物理学の両方に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:02:09 GMT)
Harnessing Floquet dynamics for selective metrology in few-qubit systems [0.0] 周期的に駆動される量子システムは、高度に選択的なパラメータフィルタとして機能する。
横フィールドFloquet Isingモデルによって記述された有限サイズの3ビットシステムで,この能力を実証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:56:24 GMT)
Group-Equivariant Diffusion Models for Lattice Field Theory [0.0] 臨界点付近では、格子量子場理論のマルコフ・チェイン・モンテカルロシミュレーションがますます非効率になる。
本研究では、2次元の$phi4$および$rm U(1)$格子場理論をサンプリングするための代替戦略として、スコアベースの対称性保存拡散モデルについて検討する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 02:34:01 GMT)
Generative diffusion modeling protocols for improving the Kikuchi pattern indexing in electron back-scatter diffraction [0.0] 本研究は,木口パターンのポストプロセッシングやオンザフライ処理のための生成機械学習モデルの開発を目的とする。
短い露光時間(高速スキャン)で捉えたパターンの品質向上におけるこのような生成モデルの性能の比較を行った。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:14:58 GMT)
Generation of Quantum Entanglement in Autonomous Thermal Machines: Effects of Non-Markovianity, Hilbert Space Structure, and Quantum Coherence [0.0] 本稿では,外部量子システムにおける量子自律型熱機械との相互作用による絡み合いの発生について検討する。
エンタングルメントは、より強い非マルコフ的挙動と高いコヒーレンス相関に関連付けられたサイクルAでのみ生成されることを示す。
以上の結果から, 温度差, ヒルベルト空間構造, コヒーレンスは, 量子力学環境における絡み合いを制御・強化するための量子資源となることが示された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 04:58:12 GMT)
Feynman path sum approach for simulation of linear optics [0.0] 我々は、線形光学ボソンサンプリング実験の確率振幅の計算にファインマン経路積分形式を適用した。
オープンソースCコードにLinear-Optical Feynman Pathシミュレータを実装し,その性能を向上する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:56:41 GMT)
Fast Bosonic Control via Multiphoton Qubit-Oscillator Interactions [0.0] 振動子状態に$n$-fold回転対称性を持たせるためのプロトコルを提案する。
このプロトコルには、ボゾン量子誤り訂正符号のための多くの論理コードワードが含まれている。
我々は,多光子量子ビット-オシレータ相互作用を用いることで,状態形成時間を大幅に短縮できることを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:45:30 GMT)
Extended Coherent States [0.0] 調和振動子の有理拡大のクラスに対する消滅作用素の代数を記述する。
これにより、Barut と Girardello の意味で対応するコヒーレント状態を構築することができる。
シュル関数に基づく議論を用いて、新たに提示されたコヒーレント状態が位置モメンタムの不確実性を最小限に抑えることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:44:13 GMT)
Exploring the Early Universe with Deep Learning [0.0] 来るべき正方形キロメアアレイ天文台(SKAO)は、イオン化エポック(EoR)中の中性水素の分布をマッピングする。
我々は,SKAOから期待される水素信号の2次元パワースペクトルから情報を抽出する最新の深層学習技術を開発した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:57:35 GMT)
Exploring Dissatisfaction in Bus Route Reduction through LLM-Calibrated Agent-Based Modeling [0.0] 本研究では,大規模言語モデル(LLM)を用いたエージェントベースモデリング(ABM)アプローチを用いる。
北京の平安地区のICカードデータを用いて、LSMの校正されたABMは、旅行時間、待ち時間、移動時間、混雑時間に関連する乗客の感度パラメータを推定した。
その結果,バスネットワークの構造的構成は,容量や運用要因よりもシステムの安定性に強い影響を与えることがわかった。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 05:59:48 GMT)
Evaluating Argon2 Adoption and Effectiveness in Real-World Software [0.0] RFCの推奨46MiB構成は、強力なユーザパスワードに対する1/アカウント攻撃予算において、SHA-256と比較して妥協率を42.5%削減する。
しかし、9106の2048 MiBの割り当てはわずか23.3%(1ドル)と17.7%(20ドル)の追加保護に留まり、44.5倍のメモリ要求にもかかわらずリターンが低下している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:38:34 GMT)
Entropy transport in closed quantum many-body systems far from equilibrium [0.0] 平衡から遠く離れた閉量子多体系における普遍的なスケーリング現象のためのエントロピー輸送
スピノルボースガスの空間分解実験データから、遠距離スケールでのエントロピーの減少が短距離で増加することを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:00:00 GMT)
Entanglement and Thermodynamic Scaling Laws in Quantum Superabsorption [0.0] 量子電池は、古典的なエネルギー貯蔵と電力供給の限界を超えるために、集合的な量子資源を利用する。
我々は、Dicke と Tavis-Cummings モデルによって管理される$N$-qubit 空洞結合 QB を解析した。
我々は、散逸が安定化源として機能し、いくつかの実験プラットフォームに関連するスケーリングベンチマークを得ることを示した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:15:03 GMT)
Engineered Kerr Nonlinearities for Precise Quantum Control of Fock States [0.0] 系統的なスペクトル退化は選択的アドレッシングを妨げることを示す。
私たちのソリューションは普遍的なアーキテクチャの原則です。
我々は、NOON状態と高光子数フォック状態の決定論的合成のプロトコルを実証することにより、この枠組みを検証する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 11:38:48 GMT)
Electron juggling: Approaching the atomic physics limit of the attempt rate in trapped ion photonic interconnects [0.0] フォトニック配線は原子ベースの量子コンピュータをスケールアップする鍵となる技術である。
電子ジャグリング(Electron juggling)と呼ばれる新しい手法を記述,解析し,状態形成工程を大幅に短縮することでフォトニック配線を高速化する。
以上の結果から,この方式は,毎秒1,000個以上のベル対の遠隔絡み合い発生率を達成する可能性を示唆している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:11:06 GMT)
Edge of Many-Body Quantum Chaos in Quantum Reservoir Computing [0.0] 貯水池コンピューティングでは、一般的に最適なパフォーマンスは、秩序とカオスの境界であるカオスの端で達成される。
ここでは、有名なSachdev-Ye-Kitaevモデルに実装されたQRCを用いて量子多体対向体を同定する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:06:41 GMT)
Dynamic Context-Aware Scene Reasoning Using Vision-Language Alignment in Zero-Shot Real-World Scenarios [0.0] この作業では、ゼロショットの現実シナリオに対処するDynamic Context-Aware Scene Reasoningフレームワークを導入している。
提案手法は、学習済みの視覚変換器と大規模言語モデルを統合し、視覚意味論と自然言語記述を整合させる。
実験では、複雑で見えない環境でのベースラインモデルよりも、シーン理解の精度が最大で18%向上した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:07:55 GMT)
Discrete time quantum walk of locally interacting walkers [0.0] コインの内部状態を条件とした量子ウォーカー間の局所的な相互作用の族を導入する。
特定のケースを選択することで、これらの相互作用が2人の初期局所的および非関連歩行者の動態に与える影響を体系的に研究する。
我々のフレームワークは、量子シミュレーション、状態準備、センシングプロトコルにおける応用と量子相関をエンジニアリングするための汎用的なプラットフォームを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:38:55 GMT)
Dirac - von Neumann axioms in the setting of Continuous Model Theory [0.0] 物理学者(ディラック計算)が用いた量子力学の公理系を連続論理の言語で再放送する。
公理系の基本バージョンについては、正準連続モデルとともに、公理は大きな大きさの近似有限モデルを持つことを証明している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:15:18 GMT)
Dinosaur Photonic Crystal Cavity Interfaces for Color Center Coupling to Triangular Nanostructures [0.0] 傾斜エッチングにより作製された三角形断面を有する導波管結合型フォトニック結晶キャビティは、量子情報応用において、埋め込みカラーセンタとフライングフォトニックキュービットとの界面に適している。
確立されたホールベースのフォトニッククリスタルキャビティの代替として、球状三角形の「ディノサウルス」フォトニッククリスタルキャビティを導入し、テーパー付き準損失のないキャビティ-導波管インターフェースを開発し、ブロッホモードと導波管モードを断熱的に相互変換する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:42:03 GMT)
Digital quantum simulations of scattering in quantum field theories using W states [0.0] 非弾性粒子生成の証拠はIBMの量子コンピュータを用いた一次元イジング場理論で観察される。
新しい量子アルゴリズムは、量子場理論散乱シミュレーションの初期状態(ウェーブパケット)を作成するために用いられる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:15:22 GMT)
Digital Labor and the Inconspicuous Production of Artificial Intelligence [0.0] デジタルプラットフォームは、しばしばカジュアルな活動や消費として欠かせない貢献をしている。
AI開発において重要な役割を担っているにもかかわらず、こうしたタスクは認識されず、過小評価され続けている。
この章は、デジタル経済におけるこれらの活動の体系的非評価を明らかにする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:18:42 GMT)
Detuning Choice for solving MIS and MWIS [0.0] パスカルの中立原子QPU制約は、限定量子ビット数、オメガとデルタの境界、シーケンス時間、閉じ込め空間、最小距離、寄生相互作用に対処する。
任意の非対称グラフにおける寄生相互作用を緩和する新しいデチューニング法を提案する。
ハードウェアの成熟度に応じて、3つのバリエーションが導入されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:54:45 GMT)
Detection of non-Gaussian quantum correlations through measurement-after-interaction protocols [0.0] 測定後相互作用(MAI)プロトコルは、量子相関に対する目撃者の検出能力を著しく向上させることができることを示す。
特に,非ガウス状態のEinstein-Podolsky-Rosenステアリングとモード絡み検出の可能性を示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:50:20 GMT)
Deep recurrent-convolutional neural network learning and physics Kalman filtering comparison in dynamic load identification [0.0] ゲートリカレントユニット,長期記憶,畳み込みニューラルネットワークの動的構造負荷同定能力について検討した。
この試験は、現実的な小さなデータセットトレーニング条件と物理に基づく残留カルマンフィルタ(RKF)との比較検討である。
RKFは物理的にパラメタライズされた識別可能なケースではネットワークよりも優れていた。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:22:24 GMT)
Dataset Creation and Baseline Models for Sexism Detection in Hausa [0.0] 本研究では、コミュニティエンゲージメント、質的コーディング、データ拡張を通じて開発された最初のハウサ性差別検出データセットを紹介する。
文化的ニュアンスと言語表現について,母国語話者による2段階のユーザスタディを行い,日常の言説の中で性差別がどのように定義され,具体化されているかを検討した。
本研究は, 文化的ニュアンス, 特に明確化検索, 慣用的表現の獲得における課題を浮き彫りにして, 偽陽性の傾向を明らかにした。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 22:57:35 GMT)
DARTS-GT: Differentiable Architecture Search for Graph Transformers with Quantifiable Instance-Specific Interpretability Analysis [0.0] グラフトランスフォーマー(GT)は、グラフ構造化データのための強力なアーキテクチャとして登場したが、厳密な設計と定量化可能性の欠如により制約を受け続けている。
我々は、因果アブレーションによるGTの定量的解釈可能性フレームワークを開発した。
実験によると、DARTS-GTは4つのデータセットで最先端の再設計を実現し、他のデータセットとの競争は継続している。
我々の解釈可能性分析は、視覚的注意力の回復と因果的重要性が必ずしも相関しているわけではないことを示し、広く使われている可視化アプローチが実際に重要なコンポーネントを見逃すことを示唆している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:46:00 GMT)
Cybersecurity threat detection based on a UEBA framework using Deep Autoencoders [0.0] 本稿では,UEBAに基づく異常検出フレームワークの最初の実装について紹介する。
ニューラルネットワークの理論的基礎に基づいて、完全連結ニューラルネットワークに対する2つの広く使われている定義の等価性を示す新しい証明を提供する。
提案するUEBAフレームワークは,企業環境にシームレスに統合可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:48:34 GMT)
Correlations in a quantum switch-based heat engine with measurements: A proof-of-principle demonstration [0.0] エネルギー交換が一般化された測定によって駆動される量子熱エンジンについて検討する。
本分析では,動作媒体とコントローラの初期相関がエンジンの性能に与える影響について検討する。
非相関性,古典的相関性,絡み合った初期状態を考えると,絡み合いによって重畳された因果秩序がコヒーレンスを生成できることが分かる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 13:07:38 GMT)
Complex wave functions, CPT and quantum field theory for classical generalized Ising models [0.0] 複素波動関数の場の量子論の概念は、古典的な統計一般化したイジングモデルにおける情報伝達を理解するのに有用である。
一般化Isingモデルのサブクラスは、決定論的更新と確率論的初期条件を備えた確率的セルオートマトン(PCA)である。
情報理論では、PCAの量子フォーマリズムは決定論的計算や確率的入力による信号処理に新たな光を当てている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 09:13:57 GMT)
Cavity-assisted single-shot T center spin readout [0.0] 単一T中心電子スピンの高速シングルショット読み出しのための2つの理論的プロトコルを提案し,検討する。
蛍光による読み出しでは、T中心のスピン保存遷移の1つを単モードフォトニックキャビティに選択的に結合する。
反射に基づく読み出しでは、スピン依存共振器反射コントラストを利用して量子ビット読み出し信号を生成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:59:41 GMT)
CausalGuard: A Smart System for Detecting and Preventing False Information in Large Language Models [0.0] 因果推論と記号論理を組み合わせた新たなアプローチであるCausalGuardを提案する。
CaulGuardは89.3%の幻覚を正しく識別する一方で、実際の幻覚の8.3%しか失っていない。
反応を自然かつ有効に保ちながら、偽のクレームを80%近く削減する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:41:51 GMT)
Can machines think efficiently? [0.0] チューリングテストは、人間と機械の知性を区別するのにもはや不十分である。
この研究は、質問に答えるのに費やしたエネルギーという追加の要素を考慮し、オリジナルの模倣ゲームを拡張します。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 19:26:24 GMT)
CHCVerif: A Portfolio-Based Solver for Constrained Horn Clauses [0.0] 制約付きホーンクロース(CHC)は、検証タスクの中間表現として広く採用されている。
本稿では,CHCを解くためのソフトウェア検証アプローチを採用するポートフォリオベースのCHCソルバを紹介する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:25:06 GMT)
Broken-Token: Filtering Obfuscated Prompts by Counting Characters-Per-Token [0.0] 大規模言語モデル(LLM)は、悪意のあるプロンプトが暗号や文字レベルのエンコーディングによって偽装されるジェイルブレイク攻撃の影響を受ける。
我々はCPT-Filteringを紹介した。CPT-Filteringは、無視可能なコストとほぼ完全精度のガードレール技術で、モデルに依存しない新しい手法である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 12:42:45 GMT)
Benchmarking quantum key distribution by mixing single photons and laser light [0.0] 量子鍵分布は、プライバシーとセキュアな通信の未来を形成する量子力学の重要な応用である。
ここでは、マイクロピラーに埋め込まれた量子ドットの放出を利用して、情報を単一光子とレーザーパルスの混合物に符号化するハイブリッドアプローチを探索する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 10:43:48 GMT)
Automated Discovery of Conservation Laws via Hybrid Neural ODE-Transformers [0.0] そこで本稿では,ノイズのある軌道データから保存量の発見を自動化するハイブリッドフレームワークを提案する。
提案手法は,(1)システムの力学の連続的なモデルを学習するニューラル正規微分方程式,(2)学習ベクトル場上で条件付けられた記号的候補不変量を生成する変換器,(3)これらの候補の有効性を示す強力な数値証明を提供する記号的数値検証器の3つの要素を統合する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:32:04 GMT)
Audio Signal Processing Using Time Domain Mel-Frequency Wavelet Coefficient [0.0] 本稿ではウェーブレット変換の概念を組み合わせた時間領域におけるメルスケール特徴抽出手法を提案する。
貯水池計算手法を用いた時間領域メル周波数ウェーブレット係数(TMFWC)法は,音声信号処理の効率を大幅に改善した。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:42:34 GMT)
Artificial Intelligence in Elementary STEM Education: A Systematic Review of Current Applications and Future Challenges [0.0] 本研究は,小学校STEM教育におけるAI応用に関する258つの研究を総合的にまとめたものである。
ほとんどの研究では、上級小学生(65%)と数学(38%)に焦点が当てられ、学際的なSTEM統合は限られている。
フラグメンテーションされたエコシステム、発達上の不適切さ、インフラ障壁、プライバシーフレームワークの欠如、弱いSTEM統合、株式格差、教師の限界化、狭い評価範囲である。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:35:42 GMT)
Approximate quantum error correction, eigenstate thermalization and the chaos bound [0.0] カオス境界は、近似量子誤り訂正符号の誤差を直接制約することを示す。
本研究では,量子化量子系における量子カオス制約情報保存の限界について明らかにした。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:48:57 GMT)
Analysis of the Robustness of an Edge Detector Based on Cellular Automata Optimized by Particle Swarm [0.0] エッジ検出タスクは、画像から関連情報を抽出することを目的とした画像処理において不可欠である。
2次元セルオートマトンにより記述され,メタヒューリスティックと転写学習技術を組み合わせて最適化された適応型検出器を開発した。
本研究の目的は,一組の自然画像のエッジと同一画像集合から抽出した特殊部分集合の同定における,最適位相の探索空間の拡大と検出器の頑健性の影響を解析することである。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:03:09 GMT)
An introduction to Markovian open quantum systems [0.0] これはマルコフのマスター方程式によって支配される開量子系の動的場への簡潔で教育的な導入である。
我々は、リンドブラッド方程式の数学的および物理的起源、純粋状態軌道の観点での展開、対称性と保存則の役割に重点を置いた定常状態の構造に焦点を当てる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:21:43 GMT)
All $d\otimes d$ dimensional entangled states are useful for the antidiscrimination of quantum measurements when $d$ is even [0.0] すべての$dotimes d$ entangled 状態 ($d$ さえあれば) に対して、3つの射影測度があり、その入力状態と反識別可能であるが、これらの3つの測度は積プローブと反識別できない。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 08:38:03 GMT)
Agentic AI Home Energy Management System: A Large Language Model Framework for Residential Load Scheduling [0.0] 本稿では,LLMが自然言語要求からデバイス制御へのマルチアプライアンススケジューリングを自律的に協調するエージェントAI HEMSを提案する。
1つのオーケストレータと3つのスペシャリストエージェントを組み合わせた階層的アーキテクチャは、反復的推論にReActパターンを使用する。
オーケストレーションロジックやエージェントプロンプト,ツール,Webインターフェースなどを含む,完全なシステムをオープンソースとして公開しています。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:33:52 GMT)
Adversarial generalization of unfolding (model-based) networks [0.0] 本稿では,$l$-normの制約付き攻撃で乱れた場合の展開ネットワークの対角一般化について検討する。
これは展開ネットワークの対角一般化に関する最初の理論的解析である。
実世界のデータに関する一連の実験を行い、得られた理論を裏付ける結果を得た。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 17:51:51 GMT)
Adaptive Inverse Kinematics Framework for Learning Variable-Length Tool Manipulation in Robotics [0.0] 従来のロボットはキネマティクスの知識が限られており、事前にプログラムされたタスクに限られている。
本稿では,ロボットの逆運動学解法の性能向上のための先駆的なフレームワークを提案する。
我々のモデルは、異なる長さの2つの異なるツールを使用する場合、ほぼ区別不可能な性能を達成する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:44:24 GMT)
Adaptive EEG-based stroke diagnosis with a GRU-TCN classifier and deep Q-learning thresholding [0.0] 我々は32チャネル信号からパワースペクトル密度特徴(Welch)に変換する適応型EEGマルチタスクを提案する。
再帰畳み込みネットワーク(GRU-TCN)を用いて、脳卒中型(健康、虚血、出血)、半球側方化、重度の予測を行い、DQN(Deep Q-network)を用いて意思決定閾値をリアルタイムで調整する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 00:55:31 GMT)
Achieving Utility-Scale Applications through Full Stack Co-Design of Fault Tolerant Quantum Computers [0.0] 我々は、量子コンピュータが実際にグリーンエネルギー生産のCO$$利用にどのように取り組むかを示す。
22年間からわずか1日で量子ランタイムをダウンさせ、これまでの最先端の作業から7.9e03の大幅な削減を実現しました。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:39:44 GMT)
Accurate predictive model of band gap with selected important features based on explainable machine learning [0.0] 本研究では、置換特徴の重要性やSHapley Additive exPlanationなど、説明可能なML(XML)技術を用いる。
XMLから派生した個々の機能の重要性に導かれ、機能削減予測モデルを構築するためのシンプルなフレームワークが提案されている。
モデル評価は、上位5つの特徴からなるXML誘導型コンパクトモデルが、ドメイン内のデータセット上のプリスタンモデルに匹敵する精度を達成することを示している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 03:24:21 GMT)
Accelerated calculation of impurity Green's functions exploiting the extreme Mpemba effect [0.0] 不純物の2時間相関関数は、多体系のキャラクタリゼーションの中心である。
我々は,2時間不純物相関関数の効率的な計算法を示すために,単時間観測器の外挿に関するこれまでの研究を拡張した。
本手法は, フェルミオンおよびボゾン環境の原型不純物モデルにおいて, 正確な精度と正確な結果とをベンチマークする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:19:07 GMT)
AIOT based Smart Education System: A Dual Layer Authentication and Context-Aware Tutoring Framework for Learning Environments [0.0] AIoTベースのスマート教育システムは、出席詐欺、パーソナライゼーションの欠如、学生の退学、非効率的なリソース利用といった、現代の教室における課題に対処する。
統合されたプラットフォームは,(1)RFIDベースのIDスキャンとWiFi認証を活用した2要素認証システム,(2)インストラクターによるリアルタイム,コンテキスト認識支援,動的クイズ生成を提供するAIアシスタント,(4)教室の照明,空気の質,温度をIoTセンサやアクチュエータを使って自律的に制御するEcoSmart Campusモジュールの4つのコアモジュールを組み合わせる。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:00:22 GMT)
AI Powered High Quality Text to Video Generation with Enhanced Temporal Consistency [0.0] 我々は,高忠実度テキストとビデオ合成のための時間的拡散認識モデルと合成シーン理解を統合した,新しい階層型フレームワークMOVAIを提案する。
標準ベンチマークの実験では、MOVAIの最先端性能、LPIPSの15.3%、FVDの12.7%、既存手法の18.9%の改善が示されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 18:46:59 GMT)
A simple mechanism for unstable degeneracies in local Hamiltonians [0.0] 局所ハミルトニアン固有状態が、ハミルトニアン項で通勤する局所作用素によって別の状態に写像された場合、後者もまた固有状態である。
この基本的な観察は、独特な基底状態であり、局地的な摂動から保護された縮退性の両方に対して、もはや結果が得られないことを意味している。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 15:07:43 GMT)
A generative adversarial network optimization method for damage detection and digital twinning by deep AI fault learning: Z24 Bridge structural health monitoring benchmark validation [0.0] スイスのZ24橋の構造的健康モニタリングのベンチマークで、教師なしのフレームワークを検証・検証した。
このフレームワークは、システムの状態に事前情報を必要としないため、現在の異常検出手法よりも優れている。
重要なことに、この手法は健全な測定に対する正確なダメージを捉え、振動に基づくシステムレベルのモニタリングとスケーラブルなインフラストラクチャのレジリエンスのための強力なツールを提供する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:04:47 GMT)
A convolutional neural network deep learning method for model class selection [0.0] 新しい深部畳み込みニューラルネットワーク手法の応答のみのモデルクラス選択能力について検討した。
これにより、システム入力情報や完全なシステム識別を必要とせず、新規および未ラベル信号のモデルクラスを選択する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 16:58:15 GMT)
A Survey of Internet Censorship and its Measurement: Methodology, Trends, and Challenges [0.0] まず,ネットワークレベルのインターネット検閲技術について調査する。
次に検閲測定手法について調査する。
有益な場合、インターネット検閲の用語と分類を関連ドメインにブリッジする。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 14:10:28 GMT)
A Framework for Fair Evaluation of Variance-Aware Bandit Algorithms [0.0] マルチアームバンディット(MAB)問題は、より複雑な強化学習アルゴリズムの基本的な構成要素として機能する。
MABアルゴリズムの評価と比較は、標準化された条件と複製性がないため、依然として難しい。
本稿では8つの古典的および分散を考慮したMABアルゴリズムを体系的に比較する再現可能な評価法を提案する。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:01:23 GMT)
A Comparison of Precinct and District Voting Data Using Persistent Homology to Identify Gerrymandering in North Carolina [0.0] 本研究では,地域レベルの投票データと地域レベルの投票データを比較するために,レベルセット方式を用いる。
地区レベルの投票パターンは2次的に大きく変動しないが,地区レベルの投票パターンは2次的に変動しないことを示す。
本研究は,ジェリーマンダーの評価におけるトポロジカルデータ解析の新たな応用を提示し,ジェリーマンダード地域を識別する上で,永続的ホモロジーが有用であることを示す。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 01:41:26 GMT)
A Comparative Study of Hybrid Post-Quantum Cryptographic X.509 Certificate Schemes [0.0] アメリカ国立標準技術研究所は2024年8月に一連のポストNIST(PQC)標準を確定した。
PQC標準に準拠したX.509証明書の設計は、証明書管理システムの開発において重要な焦点となっている。
いくつかのハイブリッド証明書スキームはX.509証明書フォーマットに基づいて国際的に提案されている。
論文参考訳(メタデータ) (Thu, 30 Oct 2025 21:51:36 GMT)