A Definition of AGI [208.3] 人工知能の具体的な定義の欠如は、今日の専門的なAIと人間レベルの認知のギャップを曖昧にしている。
そこで本研究では,AGIを認知的多目的性と熟達度に適合するものとして,これに対応するための定量的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:28:35 GMT)
When LLMs step into the 3D World: A Survey and Meta-Analysis of 3D Tasks via Multi-modal Large Language Models [130.4] 本調査では,大規模言語モデルによる3Dデータの処理,理解,生成を可能にする方法論の概要について概説する。
我々の研究は、点雲からニューラル放射場(NeRF)まで、様々な3次元データ表現にまたがっている。
3Dシーン理解、キャプション、質問応答、対話などのタスクにおいて、LLMとの統合を検討する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:00:34 GMT)
Think With Videos For Agentic Long-Video Understanding [117.7] ロングビデオ理解はコンピュータビジョンにおいて難しい問題である。
ビデオによる思考の原則に基づくフレームワークであるVideoExplorerを提案する。
静的なコンテキストを推論する代わりに、VideoExplorerは、サブクエストを反復的に定式化し、関連するモーメントを特定し、タスク指向で時間的にスケーラブルなビデオ理解を実行する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:58:45 GMT)
Joint Optimization of Cooperation Efficiency and Communication Covertness for Target Detection with AUVs [105.8] 本稿では,自律型水中車両(AUV)を用いた水中協調目標検出について検討する。
まず,共同軌道と電力制御の最適化問題を定式化し,それを解決するための革新的な階層的行動管理フレームワークを提案する。
集中学習と分散実行のパラダイムの下で,我々の目標検出フレームワークは,エネルギーとモビリティの制約を満たすとともに,適応的なカバート協調を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:14:11 GMT)
Unconditional Truthfulness: Learning Unconditional Uncertainty of Large Language Models [104.6] 我々は、注意マップ、現在の生成ステップにおける確率、および以前に生成されたトークンから繰り返し計算された不確実性スコアを利用する回帰モデルを訓練する。
評価の結果,提案手法は選択的生成に極めて有効であり,教師なしアプローチと教師なしアプローチに比較して大幅な改善が得られた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:51:46 GMT)
LLMs as Sparse Retrievers:A Framework for First-Stage Product Search [103.7] 本研究では,SParsE Retrieversとして大規模言語モデル(LLM)を利用した製品検索フレームワークを提案する。
PROSPERは,(1)残差補償機構を通じて低重み付きリテラル項を補強することにより,語彙展開における幻覚を緩和するリテラル残差ネットワークを組み込んだ。
大規模なオフラインおよびオンライン実験により、ProperSPERはスパースベースラインを著しく上回り、高度な高密度レトリバーに匹敵するリコール性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:13:21 GMT)
Every Step Evolves: Scaling Reinforcement Learning for Trillion-Scale Thinking Model [100.9] Ring-1Tは、数兆のパラメータを持つ最初のオープンソースの最先端の思考モデルである。
総パラメータは1兆で、1トークンあたり約500億を活性化する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:46:14 GMT)
Exploring a Unified Vision-Centric Contrastive Alternatives on Multi-Modal Web Documents [99.6] 本稿では,単一の視覚変換器を用いてテキスト,画像,それらの組み合わせをモデル化する統合フレームワークであるビジョン中心コントラスト学習(VC2L)を提案する。
VC2Lは完全にピクセル空間で動作し、テキスト、ビジュアル、または組み合わせのいずれでも、すべての入力を画像として描画する。
ウェブ文書における複雑なクロスモーダル関係を捉えるため、VC2Lは連続するマルチモーダルセグメントを整列するスニペットレベルのコントラスト学習目標を採用している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:59:29 GMT)
CodeRL+: Improving Code Generation via Reinforcement with Execution Semantics Alignment [98.9] 大きな言語モデル(LLM)は、巨大なコードコーパスから学習することで、コード生成において優れています。
テキストパターンのトレーニングと機能的正しさの目標の間には、基本的な意味的ギャップが残っている。
我々は、コード生成のためのRLVRトレーニングパイプラインに実行セマンティクスアライメントを統合する新しいアプローチであるCodeRL+を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:48:06 GMT)
Beyond Frequency: Scoring-Driven Debiasing for Object Detection via Blueprint-Prompted Image Synthesis [97.4] オブジェクト検出のための世代ベースデバイアスフレームワークを提案する。
提案手法は,未表現オブジェクト群の性能ギャップを著しく狭める。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:19:12 GMT)
Position: LLM Watermarking Should Align Stakeholders' Incentives for Practical Adoption [94.9] 私たちはこのレンズを通して透かしの3つのクラスを見直します。
emphLLMテキスト透かしは、反ミスツールとしてのみフレーム化された場合に、控えめなプロバイダの利点を提供する。
emphIn-context watermarking (ICW)は、会議の主催者や教育者といった信頼できる関係者向けに調整されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:34:51 GMT)
ProfBench: Multi-Domain Rubrics requiring Professional Knowledge to Answer and Judge [94.4] 大規模言語モデル(LLM)の進捗を評価することは、応答を検証するという課題によって制約されることが多い。
7000以上の応答基準ペアの集合であるProfBenchを紹介する。
以上の結果から, ProfBench は最先端の LLM においても大きな課題となることが明らかとなった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:44 GMT)
Janus-Pro-R1: Advancing Collaborative Visual Comprehension and Generation via Reinforcement Learning [92.6] 視覚的理解と生成の協調的共進化を可能にすることを提案する。
教師付き微調整は、真のCoTを生成する基礎的な能力を持つMLLMを指導する。
画像生成におけるAhaモーメントを解き、テキスト・ツー・イメージタスクから統合画像生成へMLLMを前進させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:02:48 GMT)
Glyph: Scaling Context Windows via Visual-Text Compression [91.2] Glyphは、長いテキストを画像にレンダリングし、視覚言語モデルで処理するフレームワークである。
提案手法は,従来の長文モデルに匹敵する精度を維持しつつ,3~4倍のトークン圧縮を実現する。
極端な圧縮では、128KテキストのVLMが1Mレベルのテキストタスクにスケールできる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:12:48 GMT)
OpenInsGaussian: Open-vocabulary Instance Gaussian Segmentation with Context-aware Cross-view Fusion [90.0] textbfOpenInsGaussian, textbfOpen-vocabulary textbfInstance textbfGaussian segmentation framework with Context-aware Cross-view Fusion。
OpenInsGaussianは、オープン語彙の3Dガウスのセグメンテーションにおける最先端の結果を達成し、既存のベースラインを大きなマージンで上回る。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:24:12 GMT)
Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference [89.6] 因果推論は医療介入の開発と評価に不可欠である。
現実の医療データセットは、規制障壁のためアクセスが難しいことが多い。
本稿では,医学における治療効果分析のための新しい合成データ生成法STEAMを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:16:00 GMT)
Learning to See and Act: Task-Aware View Planning for Robotic Manipulation [88.4] Task-Aware View Planning (TAVP)は、アクティブなビュープランニングとタスク固有の表現学習を統合するために設計されたフレームワークである。
提案したTAVPモデルは、最先端の固定ビューアプローチよりも優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:55:58 GMT)
A Renaissance of Explicit Motion Information Mining from Transformers for Action Recognition [87.1] 行動認識は、文脈集約能力のおかげで、トランスフォーマーベースの手法によって支配されている。
本稿では,これらの効果的な動作モデリング特性を,統一的かつ適切な方法で既存の変圧器に統合することを提案する。
提案手法は,既存の最先端手法,特に動きに敏感なデータセットよりも優れている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:01:48 GMT)
VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model [84.3] VITA-Audioは、高速な音声テキストトークン生成を備えたエンドツーエンドの大規模音声モデルである。
MCTPモジュールは、単一のモデルフォワードパス内で複数のオーディオトークンを効率よく生成する。
4段階のプログレッシブ・トレーニング・ストラテジーは,音声品質の低下を最小限に抑えたモデルアクセラレーションを実現するために検討された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:54:36 GMT)
Query Decomposition for RAG: Balancing Exploration-Exploitation [83.8] RAGシステムは複雑なユーザ要求に対処し、それらをサブクエリに分解し、それぞれに関連する可能性のあるドキュメントを取得し、それを集約して回答を生成する。
クエリの分解とドキュメントの検索をエクスプロレーション探索設定で定式化し、一度に1つのドキュメントを検索すると、与えられたサブクエリの有用性についての信念が構築される。
我々の主な発見は、ランク情報と人的判断を用いた文書関連性の推定により、文書レベルの精度が35%向上し、α-nDCGが15%向上し、長文生成の下流タスクの性能が向上するということである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:37:11 GMT)
UniPixel: Unified Object Referring and Segmentation for Pixel-Level Visual Reasoning [83.7] 視覚的なプロンプト入力を柔軟に解釈し,マスクによる応答を生成できる大規模マルチモーダルモデルUniPixelを提案する。
具体的には、UniPixelは、要求に応じて視覚的なプロンプトを処理し、関連するマスクを生成し、推論中にこれらの中間ポインタに対してその後の推論条件を実行する。
提案手法の有効性は,画素レベルの参照/セグメンテーションや画像・ビデオにおけるオブジェクト中心の理解など,多種多様なタスクを対象とした10のベンチマークで検証されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:48:43 GMT)
How Efficient Are Diffusion Language Models? A Critical Examination of Efficiency Evaluation Practices [81.9] 拡散言語モデル(DLM)は、長期支配的自己回帰(AR)パラダイムに代わる有望な代替として登場した。
しかし、現在のオープンソースのDLMは、しばしばARの速度よりも優れており、現実のユーティリティを制限している。
本研究はDLMの効率に関する系統的研究であり, 先行評価手法の問題点を同定する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:00:32 GMT)
From Unaligned to Aligned: Scaling Multilingual LLMs with Multi-Way Parallel Corpora [80.1] TED Talks に基づく大規模かつ高品質なマルチウェイ並列コーパス TED2025 を導入する。
このデータセットは113の言語にまたがっており、最大50の言語が並列に並び、広範囲にわたるマルチリンガルカバレッジを保証する。
実験により、マルチウェイ並列データでトレーニングされたモデルは、不整合多言語データでトレーニングされたモデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:04:05 GMT)
Latent Diffusion Model without Variational Autoencoder [78.3] SVGは視覚生成のための変分オートエンコーダを持たない新しい潜伏拡散モデルである。
凍結したDINO機能を利用して、明確な意味的識別性を持つ特徴空間を構築する。
迅速な拡散訓練を可能にし、数ステップのサンプリングをサポートし、生成品質を向上させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:50:02 GMT)
Cultural Alien Sampler: Open-ended art generation balancing originality and coherence [77.3] 本稿では,文化的な典型から構成的適合を分離する概念選択手法である文化異性サンプリング(CAS)を紹介する。
CASは、コヒーレンスが高く、典型性が低い組み合わせをターゲットにしており、学習慣行や組み込み文化の文脈から逸脱しながら内部の一貫性を維持するアイデアを生み出している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:32:46 GMT)
EvaLearn: Quantifying the Learning Capability and Efficiency of LLMs via Sequential Problem Solving [76.7] EvaLearnは、大きな言語モデル(LLM)を学習能力と課題の効率性を評価するために設計されたベンチマークである。
9つのフロンティアモデルをベンチマークし、様々な性能プロファイルを観察する。
静的能力の強い現在のLLMは、全てのタスクにおいて学習能力に明らかな優位性を示すものではない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:21:42 GMT)
Enhancing Sample Selection Against Label Noise by Cutting Mislabeled Easy Examples [74.6] トレーニングプロセスの初期段階において,モデルによって正しく予測された誤ラベル例は,特にモデル性能に有害であることを示す。
モデルの後続のトレーニング状態を利用して,早期に同定された自信あるサブセットを再選択するアーリーカットを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:47:16 GMT)
LightMem: Lightweight and Efficient Memory-Augmented Generation [72.2] 我々は、メモリシステムの性能と効率のバランスをとるLightMemという新しいメモリシステムを紹介した。
人間の記憶のアトキンソン・シフリンモデルにインスパイアされたLightMemは、メモリを3つの相補的なステージにまとめる。
GPTとQwenのバックボーンを用いたLongMemEvalの実験では、LightMemは高いベースライン(最大10.9%のゲイン)を上回り、トークンの使用量を最大117倍に削減している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:58:17 GMT)
DCAD-2000: A Multilingual Dataset across 2000+ Languages with Data Cleaning as Anomaly Detection [72.0] 我々は,Common Crawlデータと既存の多言語ソースから構築された大規模多言語コーパスであるDCAD-2000を紹介する。
DCAD-2000は2,282言語、46.72TBのテキスト、および8.63億のドキュメントをカバーし、155のハイソース言語と159のスクリプトをカバーしている。
DCAD-2000上でのLCMの微調整により,データ品質,クリーニングパイプラインの堅牢性,下流性能の顕著な改善が示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:54:56 GMT)
PICABench: How Far Are We from Physically Realistic Image Editing? [71.8] PICABenchを導入し、8つのサブ次元にわたる物理的リアリズムを体系的に評価する。
本稿では,VLM-as-a-judgeをケースごとの領域レベルの人間のアノテーションで利用する信頼性評価プロトコルであるPICAEvalを提案する。
また、ビデオから物理を学習し、トレーニングデータセットPICA-100Kを構築することで、効果的な解を探索する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:35:57 GMT)
VisuRiddles: Fine-grained Perception is a Primary Bottleneck for Multimodal Large Language Models in Abstract Visual Reasoning [70.4] マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、多くの推論タスクにおいて、その性能を著しく向上させてきた。
AVR(Abstract Visual Reasoning)は、抽象グラフィックの知覚に制限があるため、依然として重要な課題である。
PRSのベンチマークであるVisuRiddlesを提案し、モデルの推論能力を評価するために精巧に構築されたタスクを特徴付ける。
第二に、パーセプチュアル・リドル・シンセサイザー (PRS) を導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:33:52 GMT)
FlashBias: Fast Computation of Attention with Bias [70.4] 偏見による注意は、視覚、言語、タンパク質の折り畳みやその他の先進的な科学モデルに広く展開されてきた。
これは、FlashAttentionのようなアクセラレーターの速度の根底にある、固く融合したメモリ計算パイプラインを破壊します。
本稿では,低ランク圧縮センシング理論に基づくFlashBiasを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:49:06 GMT)
Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs [70.2] そこで我々は,GAR (Grasp Any Region) を導入し,地域レベルの理解を深める。
GARは(1)必要なグローバルコンテキストを活用することによって正確な認識をサポートし、(2)複数のプロンプト間の相互作用をモデル化する。
そして自然に(3)高度な構成的推論を達成し、任意の領域に関する特定の自由形式の疑問に答える。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:59 GMT)
BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping [69.7] 適応クリッピング(BAPO)を用いたBAlanced Policy Optimizationを提案する。
BAPOはクリッピングバウンダリを動的に調整し、適応的に正と負のコントリビューションを再バランスさせ、エントロピーを保持し、RL最適化を安定化させる。
AIME 2024とAIME 2025ベンチマークでは、7B BAPOモデルがSkyWork-OR1-7Bのようなオープンソースモデルを上回っています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:55:04 GMT)
Dynamic Evaluation for Oversensitivity in LLMs [68.3] 過敏性は、言語モデルが実際に良性であるプロンプトを防衛的に拒否するときに起こる。
この振る舞いはユーザインタラクションを妨害するだけでなく、有害なコンテンツと無害なコンテンツの境界を曖昧にする。
既存のベンチマークは、モデルの発展に伴ってオーバータイムを低下させる静的データセットに依存している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:33:47 GMT)
ScaleNet: Scaling up Pretrained Neural Networks with Incremental Parameters [67.9] 視覚変換器(ViT)の効率的なスケーリング手法であるScaleNetを導入する。
従来のスクラッチからのトレーニングとは異なり、ScaleNetはパラメータの無視可能な増加を伴う迅速なモデル拡張を容易にする。
ScaleNetはトレーニングの3分の1しか必要とせず、スクラッチからトレーニングよりも精度が7.42%向上していることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:07:25 GMT)
VITA-E: Natural Embodied Interaction with Concurrent Seeing, Hearing, Speaking, and Acting [66.9] 現在のビジョン・ランゲージ・アクション(VLA)モデルは、しばしば堅固で静的な相互作用パラダイムによって制約される。
VITA-Eは、動作とほぼリアルタイムの割り込みの両方のために設計された、新しい具体的相互作用フレームワークである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:56 GMT)
MATRIX: Multimodal Agent Tuning for Robust Tool-Use Reasoning [65.2] マルチモーダル軌道を自動的に合成する視覚中心型エージェントチューニングフレームワークを開発した。
また、自動生成された11Kの選好ペアであるPref-Xについても紹介する。
Agent-X、GTA、GAIAの3つのベンチマークで、MATRIXはオープンソースとクローズドソースの両方のVLMを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:22:02 GMT)
Shuffle-R1: Efficient RL framework for Multimodal Large Language Models via Data-centric Dynamic Shuffle [65.1] 強化学習(Reinforcement Learning, RL)は、マルチモーダル大言語モデル(MLLM)の推論能力を高めるための効果的なポストトレーニングパラダイムとして登場した。
しかしながら、現在のRLパイプラインは、アドバンテージ・コラプシング(Advantage Collapsing)とロールアウト・サイレンシング(Rollout Silencing)という2つの未解決の問題によって、トレーニングの非効率に悩まされることが多い。
軌道サンプリングとバッチ合成を動的に再構成することにより、RLの微調整効率を向上する、シンプルだが原則化されたフレームワークであるShuffle-R1を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:23:49 GMT)
InternLM2.5-StepProver: Advancing Automated Theorem Proving via Critic-Guided Search [65.1] 代表的な証明法は、証明手法を戦術によって反復的に構築することであり、典型的には最優先の探索スキームに従う。
本稿では,評価モデルを用いて選好情報を抽出する直感的かつ効果的な手法を提案する。
2万日以上のCPUを持つ大規模なエキスパートイテレーションが、証明者と批判者をさらに微調整するために適用される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:39:04 GMT)
Concept-Guided Interpretability via Neural Chunking [64.6] ニューラルネットワークは、トレーニングデータの規則性を反映した生の集団活動のパターンを示す。
神経集団レベルで繰り返しチャンクを抽出する3つの方法を提案する。
私たちの研究は、認知原則と自然主義的データの構造の両方を活用する、解釈可能性の新しい方向性を指し示しています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:20:23 GMT)
Exploring Data-Efficient Adaptation of Large Language Models for Code Generation [64.6] コード生成のための誤り駆動学習を用いたデータ効率向上のための新しい適応手法DEEDを提案する。
実験により、他の主流の微調整手法と比較して、DEEDは訓練データが少なく、優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:02:10 GMT)
R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth? [63.5] R-HoriZONは、Large Reasoning Models(LRMs)における長い水平推論挙動を刺激するために設計された方法である
R-HoriZONに基づいて、長い推論地平線にまたがる相互依存問題を伴う複雑な多段階推論タスクを含む、長期水平推論ベンチマークを構築する。
分析の結果, LRMは有効推論長が限られており, 複数の問題に対する思考予算の配分に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:49:36 GMT)
DiffGRM: Diffusion-based Generative Recommendation Model [63.4] ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:23:32 GMT)
See the Text: From Tokenization to Visual Reading [63.1] SeeTokはテキストを画像(ビジュアルテキスト)としてレンダリングし、事前訓練されたマルチモーダル計算を利用して解釈する。
3つの異なる言語タスクの中で、SeeeTokはサブワードトークンをマッチまたはオーバーし、トークンを4.43倍少なくし、FLOPを70.5%削減する。
SeeTokは、象徴的なトークン化から人間のような視覚的な読み方へとシフトし、より自然で認知的にインスパイアされた言語モデルへと一歩前進する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:34:48 GMT)
UltraGen: High-Resolution Video Generation with Hierarchical Attention [63.0] UltraGenは、(i)効率的で(i)ネイティブな高解像度ビデオ合成を可能にする、新しいビデオ生成フレームワークである。
我々は,UltraGenが事前学習した低解像度ビデオモデルを1080P,さらに4K解像度に効果的に拡張できることを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:23:21 GMT)
WebDevJudge: Evaluating (M)LLMs as Critiques for Web Development Quality [62.4] 我々は、Web開発におけるLCM-as-a-judgeのパフォーマンスを評価するための体系的なベンチマークであるWebDevJudgeを紹介する。
WebDevJudgeは、構造化およびクエリグラウンドのルーリックで注釈付けされた、ペア化されたWeb実装よりも人間の好みラベルで構成されている。
詳細な分析によると、このギャップは、機能的同値性認識の失敗、タスク実現可能性の検証、バイアス軽減など、基本的なモデル上の制限に由来する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:16:04 GMT)
PixelWorld: How Far Are We from Perceiving Everything as Pixels? [62.1] 最近のエージェント言語モデルは、密に絡み合った視覚情報やテキスト情報を含む現実世界の環境と相互作用する必要がある。
我々は、自然言語、表、数学的、図形的な入力を共有ピクセル空間にレンダリングするベンチマークであるPerceive Everything as Pixels (PEAP)を紹介する。
実験の結果,PEAPは意味理解タスクにおけるトークンベースのアプローチと同等の性能を発揮することがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:23:59 GMT)
Implicit Neural Compression of Point Clouds [61.5] NeRC$3$は、新しいポイントクラウド圧縮フレームワークである。
NeRC$3$は密度点雲の幾何学と属性の両方を符号化する。
動的点雲の場合、4D-NeRC$3$は優れた幾何圧縮性能を達成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:46:08 GMT)
Dual-Weighted Reinforcement Learning for Generative Preference Modeling [61.4] 本稿では,2重強化学習(DWRL)を嗜好モデリングの新しいフレームワークとして提案する。
本稿では、DWRLを生成的嗜好モデル(GPM)を訓練して嗜好モデルに適用し、まず思考を生成し、それから人間の選好スコアを予測する。
その結果、DWRLは、検証可能なタスク以上の推論強化された選好学習の一般的なフレームワークとして位置づけられた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:47:52 GMT)
UniVideo: Unified Understanding, Generation, and Editing for Videos [60.9] 統合モデリングをビデオ領域に拡張する汎用フレームワークUniVideoを提案する。
UniVideoは、単一のマルチモーダル命令パラダイムの下で、多様なビデオ生成と編集タスクを統合する。
We show that UniVideo match or over the state-the-the-art task-specific baselines in text/image-to-video generation, in-context video generation and in-context video editing。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:40:13 GMT)
Bayesian Low-Rank Factorization for Robust Model Adaptation [60.3] 本研究では,音声基礎モデルに対する因子化アダプタについて検討し,前処理をゼロに近い位置で行うことで,スペーサー適応行列を実現する。
その結果, 適応損失は最小限に抑えられたが, 基礎モデルの破滅的忘れを著しく減らした。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:23:30 GMT)
Adapting Language Balance in Code-Switching Speech [60.3] 大規模な基礎モデルは、コードスイッチングテストケースといまだに苦労しています。
我々は、世代間のコンテキストバイアスを軽減するために、微分可能なサロゲートを使用します。
アラビア語と中国語による実験では、モデルの切り替え位置をより正確に予測できることが示されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:23:55 GMT)
SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer [60.2] 悲観的領域ランダム化によるSim-to-realの略称であるSPiDRを提案する。
SPiDRは、安全なsim-to-real転送を保証するスケーラブルなアルゴリズムである。
我々は,SPiDRが性能を維持しつつ,シミュレートとリアルのギャップを保ちながら,安全性を効果的に確保できることを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:23:04 GMT)
ShortcutBreaker: Low-Rank Noisy Bottleneck with Global Perturbation Attention for Multi-Class Unsupervised Anomaly Detection [59.9] ShortcutBreakerはMUADタスクのための新しい統合された機能再構成フレームワークである。
ショートカットの問題に対処する2つの重要なイノベーションが特徴だ。
提案手法は,4つのデータセットに対して,99.8%,98.9%,90.6%,87.8%の顕著な画像レベルのAUROCを実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:51:30 GMT)
Learning Task-Agnostic Representations through Multi-Teacher Distillation [59.5] 本稿では,「多数決」目的関数に基づくタスク非依存フレームワークを提案する。
この機能は,学生と教師の埋め込みの相互情報に縛られていることを実証する。
提案手法は,教師の多様性を効果的に活用し,多様な下流タスクのパフォーマンス向上を実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:36:33 GMT)
ReID5o: Achieving Omni Multi-modal Person Re-identification in a Single Model [59.0] Omni Multi-modal Person Re-identification (OM-ReID) と呼ばれる新しい課題について検討する。
ORBenchは、5つのモダリティにまたがる1,000のユニークなIDからなる最初の高品質なマルチモーダルデータセットである。
また,ReIDのための新しいマルチモーダル学習フレームワークであるReID5oを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:28:48 GMT)
SimBench: Benchmarking the Ability of Large Language Models to Simulate Human Behaviors [58.9] 我々は,LLMシミュレーションの堅牢で再現可能な科学のための,最初の大規模標準ベンチマークであるSimBenchを紹介する。
現在、最高のLLMでさえシミュレーション能力が限られ(スコア: 40.80/100)、性能はモデルサイズと対数的にスケールする。
シミュレーション能力は、深い知識集約的推論と最も強く相関していることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:05:11 GMT)
GBlobs: Local LiDAR Geometry for Improved Sensor Placement Generalization [58.4] 本報告では,RoboSense 2025の上位ソリューションについて概説する。
各種センサ配置下での3次元物体検出における最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:35:58 GMT)
NTKMTL: Mitigating Task Imbalance in Multi-Task Learning from Neural Tangent Kernel Perspective [58.3] マルチタスク学習(MTL)は、1つのモデルで複数のタスクを同時に学習することを可能にする。
MTLにおけるタスクの不均衡は依然として大きな課題である。
NTKMTL という新しい MTL 法を提案し,MTL のトレーニングダイナミクスを解析する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:29:40 GMT)
SolverLLM: Leveraging Test-Time Scaling for Optimization Problem via LLM-Guided Search [58.1] 多様な最適化問題を解決するために,テスト時間スケーリングを活用したトレーニング不要のフレームワークを導入する。
直接的に解くのではなく、数学的定式化を生成し、新しいモンテカルロ木探索戦略によって導かれる解法対応のコードに変換する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:19:00 GMT)
Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully Open MLLMs [57.5] Honey-Data-15Mは、約1500万のQAペアからなる新しいSFTデータセットである。
データキュレーションパイプラインであるHoneyPipeとその基盤となるフレームワークであるDataStudioは、データキュレーションのための透過的で適応可能な方法論を提供する。
実験の結果、Bee-8Bは完全にオープンなMLLMのための新しい最先端(SOTA)を確立し、InternVL3.5-8Bのような最近のセミオープンモデルに匹敵する性能を実現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:32 GMT)
Dual Data Alignment Makes AI-Generated Image Detector Easier Generalizable [57.5] 検出器はしばしばバイアス付きデータセットに基づいて訓練され、実際の/合成ラベルと突発的に相関する非因果属性に過度に適合する可能性がある。
1つの一般的な解決策は、生成的再構成を通じてデータセットアライメントを実行し、実画像と合成画像のセマンティック内容とを一致させることである。
我々は,画素レベルのアライメントだけでは不十分であることを示す。再構成された画像は依然として周波数レベルの不整合に悩まされており,スプリアス相関が持続する可能性がある。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:45:30 GMT)
RayPose: Ray Bundling Diffusion for Template Views in Unseen 6D Object Pose Estimation [57.2] テンプレートベースのオブジェクトポーズ推定をレイアライメント問題として再構成する。
拡散型カメラポーズ推定の最近の進歩に触発されて,この定式化を拡散変圧器アーキテクチャに組み込む。
狭められたテンプレートサンプリングに基づく粗大なトレーニング戦略は、ネットワークアーキテクチャを変更することなく性能を向上させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:01:20 GMT)
Counterfactual reasoning: an analysis of in-context emergence [57.1] 我々は、言語モデルが反実的推論が可能なことを示す。
自己注意、モデル深度、トレーニング済みデータの多様性によってパフォーマンスが向上することがわかった。
以上の結果から, SDE 動態下での反実的推論が可能となった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:08:36 GMT)
Temporal Alignment of LLMs through Cycle Encoding for Long-Range Time Representations [57.0] 大規模言語モデル(LLM)は、特に長期にわたって時間的ミスアライメントの問題に悩まされる。
本稿では,LLMの長期的不整合に対処する手法として,Ticktack(ティックタック)を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:08:19 GMT)
Triangle Multiplication Is All You Need For Biomolecular Structure Representations [56.3] Pairmixerは三角形の注意をなくし、高階の幾何学的推論能力を保っている。
Pairmixerは計算効率を大幅に改善し、折りたたみおよびドッキングベンチマーク間の最先端構造予測器をマッチングする。
例えば、BoltzDesign内では、Pairmixerは2倍以上高速なサンプリングと、Pairformerのメモリ限界よりも30%長いシーケンスへのスケールを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:02 GMT)
PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting [56.2] 提案するPLANA3Rは,提案しない2次元画像から平面3次元再構成を計測するためのポーズレスフレームワークである。
トレーニング中に3次元平面アノテーションを必要とする以前のフィードフォワード法とは異なり、PLANA3Rは明確な平面監督なしで平面3次元構造を学習する。
本研究は,複数の室内環境データセットに対するPLANA3Rの有効性を検証するとともに,領域外屋内環境への強力な一般化を実証する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:15:33 GMT)
Engagement Undermines Safety: How Stereotypes and Toxicity Shape Humor in Language Models [56.0] 大規模言語モデルは、クリエイティブな執筆やエンゲージメントコンテンツにますます使われ、アウトプットに対する安全性の懸念が高まっている。
本研究は, 現代のLLMパイプラインにおいて, ユーモア, 立体特異性, 毒性を測定することによって, 有害な内容とどのように結合するかを評価する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:28:09 GMT)
PoSh: Using Scene Graphs To Guide LLMs-as-a-Judge For Detailed Image Descriptions [56.0] PoShは、LLMs-as-a-Judgeをガイドするために、シーングラフを構造化ルーリックとして使用する詳細な画像記述のメトリクスである。
PoShはレプリカ可能で、解釈可能で、既存のメトリクスよりも人間のレーダのプロキシが優れている。
我々は,オープンウェイトな選択肢よりも,DOCENTにおける人間の判断とPoShの相関が強いことを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:30:20 GMT)
That's Deprecated! Understanding, Detecting, and Steering Knowledge Conflicts in Language Models for Code Generation [55.8] 大規模言語モデル(LLM)は、パラメトリック知識とプロンプトに含まれる矛盾する情報との相違に直面して振る舞う。
このような対立を構築・解釈するためのドメインに依存しないフレームワークを提案する。
本研究では, アクティベーションレベルのステアリングが, ランダムベースライン上でのステアリング成功率を最大12.6%向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:27:56 GMT)
Multi-Agent Collaboration via Evolving Orchestration [55.6] 大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:30:02 GMT)
An Explainable Hybrid AI Framework for Enhanced Tuberculosis and Symptom Detection [55.4] 結核は、特に資源に制限された遠隔地において、重要な世界的な健康問題である。
本稿では, 胸部X線による疾患および症状の検出を, 2つの頭部と自己監督頭部を統合することで促進する枠組みを提案する。
本モデルでは, 新型コロナウイルス, 結核, 正常症例の鑑別で98.85%の精度が得られ, マルチラベル症状検出では90.09%のマクロF1スコアが得られた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:18:55 GMT)
RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning [54.5] 3DGSをベースとしたエンドツーエンド自動運転のためのクローズドループ強化学習フレームワークRADを提案する。
安全性を高めるため、我々は、安全クリティカルな事象に効果的に対応し、現実世界の因果関係を理解するために、政策の指針となる特別報酬を設計する。
IL法と比較して、RADは閉ループのほとんどの測定値において、特に3倍の衝突速度を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:19:21 GMT)
UWBench: A Comprehensive Vision-Language Benchmark for Underwater Understanding [54.2] 視覚言語モデル(VLM)は自然界の理解において顕著な成功を収めた。
水中画像は、厳しい光の減衰、色歪み、懸濁粒子散乱などの固有の課題を呈している。
水中視覚言語理解のためのベンチマークであるUWBenchを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:32:15 GMT)
HiPO: Hybrid Policy Optimization for Dynamic Reasoning in LLMs [54.2] 大規模言語モデル (LLM) は、複雑なタスクの正確性を改善するために、Chain-of-Thought (CoT) 推論にますます依存している。
本稿では適応推論制御のフレームワークであるHybrid Policy Optimization(HiPO)を紹介する。
数学とコーディングベンチマークによる実験は、HiPOがトークン長を大幅に削減し、正確性を維持したり改善したりすることを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:16:35 GMT)
GPTFace: Generative Pre-training of Facial-Linguistic Transformer by Span Masking and Weakly Correlated Text-image Data [53.9] 本稿では,大規模なWeb構築データを活用した顔知識学習のための生成事前学習モデルを提案する。
また, 顔属性編集, 表情操作, マスク除去, 写真インペイントなど, 幅広い顔編集作業にも適用可能である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:55:44 GMT)
Burau representation, Squier's form, and non-Abelian anyons [53.9] 我々は、ブレイド群 $B_3$ のブルー表現から構築された、周波数可変な2次元非アベリア制御を導入する。
我々は$Delta(omega)>0$が達成可能であることを証明し、因果非分離性を証明する。
概念的には、これは任意の統計学におけるゲダンケンの実験に対する最小の非アベリアの$B_3$制御を与える。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:25:21 GMT)
Test-time Verification via Optimal Transport: Coverage, ROC, & Sub-optimality [53.0] 検証によるテストタイムのスケーリングは、大規模言語モデルのパフォーマンス向上を約束している。
検証の効果は、(i)ジェネレータのカバレッジ、(ii)検証器の収束領域(ROC)、(iii)サンプリングアルゴリズムの準最適性の3つの相互作用を通して現れる。
本稿では,輸送問題として検証可能なテストタイムスケーリングの枠組みを定め,カバレッジ,ROC,サブ最適性の相互作用を特徴付ける。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:05:42 GMT)
Polyline Path Masked Attention for Vision Transformer [52.9] ビジョントランスフォーマー (ViT) はコンピュータビジョンにおいて大きな成功を収めた。
Mamba2は自然言語処理タスクにおいて大きな可能性を実証している。
本稿では,VTの自己注意機構とMamba2の強化された構造化マスクを統合するポリリンパス仮面注意(PPMA)を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:16:28 GMT)
REPA-E: Unlocking VAE for End-to-End Tuning with Latent Diffusion Transformers [52.6] 従来のディープラーニングの知恵は、エンド・ツー・エンドのトレーニングが可能な限り望ましいと判断する。
遅延拡散変換器では,標準拡散損失を用いたVAEと拡散モデルの両方のエンドツーエンドトレーニングが有効でないことが観察された。
拡散損失は非効率であるが,表現アライメント(REPA)の損失によってエンドツーエンドのトレーニングをアンロックできることが示されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:39:46 GMT)
AmorLIP: Efficient Language-Image Pretraining via Amortization [52.5] Contrastive Language-Image Pretraining (CLIP) は、様々な下流のテキストイメージタスクにまたがる強力なゼロショット性能を示している。
軽量ニューラルネットワークによるコントラスト学習に関わる高価な計算を記憶する,効率的なCLIP事前学習フレームワークであるAmorLIPを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:45:37 GMT)
Learning Human-Object Interaction as Groups [52.3] GroupHOIは、幾何学的近接性および意味的類似性の観点から文脈情報を伝播するフレームワークである。
これは、より困難な非言語間相互作用検出タスクにおいて、主要なパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:25:10 GMT)
ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning [51.1] ssTokenは自己変調されたセマンティックなToken Selectionアプローチである。
自己変調の選択とセマンティック・アウェアの選択の両方が、フルデータの微調整よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:21:04 GMT)
ProCLIP: Progressive Vision-Language Alignment via LLM-based Embedder [51.1] オリジナルのCLIPテキストエンコーダは77トークンの最大入力長で制限されている。
ProCLIPはカリキュラムベースのプログレッシブ・ビジョン言語アライメントフレームワークである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:48:49 GMT)
WebSeer: Training Deeper Search Agents through Reinforcement Learning with Self-Reflection [51.1] 本稿では,自己回帰機構によって強化された強化学習によって訓練された,よりインテリジェントな検索エージェントであるWebSeerを紹介する。
提案手法はツール使用チェーンを大幅に拡張し,回答精度を向上する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:52:00 GMT)
Extracting alignment data in open models [50.8] 訓練後モデルから大量のアライメントトレーニングデータを抽出できることが示唆された。
このデータは、長期コンテキスト推論、安全性、命令追従、数学などの特定の機能を改善するためにモデルを操縦するのに有用である。
SFT や RL のような後トレーニングフェーズで使用されたトレーニングデータを,モデルが容易に再学習できることが判明した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:06:00 GMT)
MEET-Sepsis: Multi-Endogenous-View Enhanced Time-Series Representation Learning for Early Sepsis Prediction [50.7] セプシス(Sepsis)は、集中治療室(ICUs)の高死亡にともなう致命的な感染症である。
早期かつ正確な敗血症予測(SP)は、時間的介入には重要であるが、微妙な早期症状と急激な死亡率の増大により、依然として困難である。
本稿では,拡張された特徴ビューを構築するための多言語ビュー表現強化(MERE)機構と,時間的表現学習のためのCDTAモジュールを提案する。
提案したMEET-Sepsis フレームワークは,SOTA 法で要求される ICU モニタリング時間の 20% のみを用いて,競合予測の精度を実現し,大幅に向上した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:49:14 GMT)
MoAlign: Motion-Centric Representation Alignment for Video Diffusion Models [50.2] 本研究では、予め訓練されたビデオエンコーダから非交叉運動部分空間を学習する動き中心アライメントフレームワークを提案する。
この部分空間は、地表面の光学的流れを予測し、真の運動力学を捉えるよう最適化されている。
次に,テキスト間拡散モデルの潜在的特徴をこの新たなサブスペースに整合させ,生成モデルが動きの知識を内部化し,より高機能なビデオを生成することを可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:05:23 GMT)
VAR: Visual Attention Reasoning via Structured Search and Backtracking [49.4] 構造化された検索としてグラウンドド推論をリキャストするフレームワークであるVisual Attention Reasoningを紹介する。
VARは、推論プロセスを2つの重要な段階に分解する。
我々は、我々の7BモデルであるVAR-7Bが、幻覚と安全性のベンチマークの包括的なスイートに新しい最先端を設定していることを示します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:18:44 GMT)
Foundation Cures Personalization: Improving Personalized Models' Prompt Consistency via Hidden Foundation Knowledge [49.4] パーソナライズモデルの迅速な一貫性を改善するフレームワークであるFreeCureを提案する。
本稿では, 個人化プロセスに適切な属性情報をもたらすための, インバージョンベースのプロセスと合わせて, ファンデーションを意識した新たな自己意識モジュールを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:52:43 GMT)
Class-wise Balancing Data Replay for Federated Class-Incremental Learning [49.2] FCIL(Federated Class Incremental Learning)のためのクラスワイドバランスデータ再生手法を提案する。
1)グローバル・パースペクティブ・データ・リプレイ・モジュールは,事前タスクのグローバルな表現をプライバシ保護方式で再構築し,その上で,クラス認識と重要度に敏感なサンプリング戦略を指導し,バランスの取れたリプレイを実現する。2)タスク間のクラス不均衡を処理するために,タスク対応温度スケーリングモジュールは,タスクダイナミクスに基づくクラスとインスタンスレベルのロジットの温度を適応的に調整し,多数クラスに対するモデルの過度さを低減し,マイノリティクラスへの感受性を高める。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:35:07 GMT)
Timely Clinical Diagnosis through Active Test Selection [49.1] 本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:10:45 GMT)
PAUSE: Low-Latency and Privacy-Aware Active User Selection for Federated Learning [49.0] フェデレートラーニング(FL)は、エッジデバイスが、潜在的にプライベートなデータを共有することなく、機械学習モデルを協調的にトレーニングすることを可能にする。
FLには2つの重要な課題がある。第一に、時間とともにプライバシーの漏洩が蓄積され、第二に、通信のレイテンシである。
本稿では,アクティブユーザ選択によるプライバシー漏洩と通信遅延の蓄積を共同で解決する手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:22:34 GMT)
EffiReasonTrans: RL-Optimized Reasoning for Code Translation [48.9] EffiReasonTransは、推論レイテンシのバランスを保ちながら翻訳精度を向上させるために設計されたトレーニングフレームワークである。
EffiReasonTransは、生成トークンの数を減らしながら、翻訳精度(ベースモデルと比較して+49.2% CAと+27.8% CodeBLEU)を一貫して改善している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:55:39 GMT)
SAM 2++: Tracking Anything at Any Granularity [48.0] SAM 2++は、マスク、ボックス、ポイントなど、どんな粒度でも追跡できる統一モデルです。
ターゲットの粒度を拡大するため、タスク固有のプロンプトを設計し、様々なタスク入力を一般的なプロンプト埋め込みにエンコードする。
メモリ整合性を満たすために,異なる粒度のメモリを統一するタスク適応型メモリ機構を導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:20:15 GMT)
AlphaOPT: Formulating Optimization Programs with Self-Improving LLM Experience Library [47.8] AlphaOPTは最適化モデリングのための自己改善エクスペリエンスライブラリである。
合理性のない限られた実演から効率よく学習する。
モデルウェイトではなくライブラリを更新することで、コストのかかる再トレーニングなしに継続的に拡張する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:03:26 GMT)
Gestura: A LVLM-Powered System Bridging Motion and Semantics for Real-Time Free-Form Gesture Understanding [47.8] 本稿では,自由形式のジェスチャー理解のためのエンドツーエンドシステムであるGesturaを提案する。
Gesturaは、訓練済みのLarge Vision-Language Modelを使用して、ハイレベルなセマンティックな概念と、非常にダイナミックで多様なフリーフォームジェスチャのパターンを整列する。
我々は,30万組以上の注釈付きQAペアを用いた自由形式のジェスチャー意図推論と理解のための,最初のオープンソースデータセットを開発した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:46:48 GMT)
What Makes a Good Curriculum? Disentangling the Effects of Data Ordering on LLM Mathematical Reasoning [47.6] 大規模言語モデル(LLMs)における推論改善戦略として,カリキュラム学習(CL)が普及している。
しかし、以前の作業では、異なる難易度メトリクスとトレーニングのセットアップを採用しており、オープンな根本的な疑問を残している。
我々は,カリキュラムの難易度を5つの相補的な次元に分解する統合されたオフライン評価フレームワークを通じて,これらの疑問に対処する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:43:38 GMT)
Distilling LLM Prior to Flow Model for Generalizable Agent's Imagination in Object Goal Navigation [47.3] Object Goal Navigation (ObjectNav)タスクは、シーンの未観測領域を想像することで、特定のオブジェクトを目に見えない環境で見つけるようにエージェントに挑戦する。
本研究では,全シーンのセマンティックマップで観測された領域をブリッジすることで,室内環境の意味分布をモデル化する生成フローベースフレームワークGOALを提案する。
実験により、GOALはMP3DとGibsonの最先端性能を達成し、HM3Dへの転送設定の強い一般化を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:50:12 GMT)
Visionary-R1: Mitigating Shortcuts in Visual Reasoning with Reinforcement Learning [46.9] 我々は視覚言語モデル(VLM)を訓練し、強化学習と視覚質問応答ペアを通して画像データに基づく推論を行う。
我々のモデルであるVisionary-R1は、複数の視覚的推論ベンチマークにおいて、強力なマルチモーダルモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:57:14 GMT)
A Unified Solution to Video Fusion: From Multi-Frame Learning to Benchmarking [46.8] ビデオ融合の新しい統一フレームワークUnified Video Fusion (UniVF)を提案する。
UniVFは多フレーム学習と光フローベースの特徴ワープを利用して情報的・時間的に一貫性のあるビデオ融合を行う。
また,ビデオフュージョンベンチマーク (VF-Bench) も導入した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:48:45 GMT)
Taming the Judge: Deconflicting AI Feedback for Stable Reinforcement Learning [46.7] この研究は、強化学習トレーニングループ内の不整合を検出し、解決するためのエンドツーエンドのフレームワークを導入している。
我々のフレームワークは2つの中核となるコンフリクト検出率 (CDR) と信号浄化フレームワークであるDeconflicted Graph Rewards (DGR) を特徴としている。
実験により、我々のフレームワークは、強力なベースラインよりもトレーニングの安定性とモデル性能を大幅に改善することを確認した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:35:55 GMT)
CUARewardBench: A Benchmark for Evaluating Reward Models on Computer-using Agent [46.4] CUA(Computer-using Agent)は、オペレーティングシステムやソフトウェアインターフェースとの自然なインタラクションを通じてタスクの完了を可能にするエージェントである。
Reward モデルは有望な代替手段を提供するが、CUA 評価におけるその有効性はほとんど未検討である。
CUARewardBenchは4つの重要なコントリビューションから構成される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:53:40 GMT)
Infinity Parser: Layout Aware Reinforcement Learning for Scanned Document Parsing [46.1] layoutRLは、レイアウトを明示的に認識するようにモデルをトレーニングするエンドツーエンドの強化学習フレームワークである。
堅牢なドキュメント理解の進歩を加速するために、コードとデータセットを公開します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:15:23 GMT)
Rectifying Shortcut Behaviors in Preference-based Reward Learning [46.1] 強化学習では、好みに基づく報酬モデルが、大きな言語モデルと人間の協調行動の整合において中心的な役割を果たす。
最近の研究では、これらのモデルはハッキングに報いる傾向があり、過度な最適化のため、しばしばうまく一般化できないことが示されている。
我々は、好みに基づく報酬学習におけるショートカット行動を軽減するために、原則的だが柔軟なアプローチを導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:08:32 GMT)
Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations [46.0] textbfEvoPresentは学術論文のための自己改善エージェントフレームワークである。
コヒーレントな物語、美的デザイン、バーチャルキャラクタによるリアルなプレゼンテーション配信を統一する。
EvoPresentの中心は、マルチタスク強化学習(RL)美学モデルである textbfPresAesth である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:04:18 GMT)
Genesis: Evolving Attack Strategies for LLM Web Agent Red-Teaming [46.0] 既存のレッドチーム方式は、主にオフラインでトレーニングされた手作業による攻撃戦略や静的モデルに依存している。
我々は,アタッカー,スコラー,ストラテジストの3つのモジュールからなる新しいエージェントフレームワークであるGenesisを提案する。
我々のフレームワークは、新しい戦略を発見し、既存の攻撃ベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:49:37 GMT)
Understanding In-Context Learning on Structured Manifolds: Bridging Attention to Kernel Methods [45.9] 我々は,アテンション機構と古典的カーネル手法の新たな接続を確立する。
トレーニングタスクの即時長と数の観点から一般化誤差境界を導出する。
この結果から, 一般化誤差がトレーニングタスク数でどのようにスケールするかを特徴付ける。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:24:32 GMT)
Towards Quantum Enhanced Adversarial Robustness with Rydberg Reservoir Learning [45.9] 量子コンピューティング貯水池(QRC)は、量子多体系に固有の高次元非線形力学を利用する。
近年の研究では、変動回路に基づく摂動量子は逆数の影響を受けやすいことが示されている。
QR学習モデルにおける対向的堅牢性の最初の体系的評価について検討する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:39:28 GMT)
UniHPR: Unified Human Pose Representation via Singular Value Contrastive Learning [45.9] 画像,2次元,3次元の人間のポーズから人間のポースを埋め込んだ統合型ヒューマンポース表現学習パイプラインであるUniHPRを提案する。
評価では、単純な3次元ポーズデコーダにより、UniHPRは顕著なパフォーマンス指標を達成できる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:06:51 GMT)
Parametric resonant enhancement of motional entanglement under optimal control: an analytical study [45.9] 我々は、クーロン相互作用を介して結合された光学的に閉じ込められた大粒子の運動自由度の間の理論的に連続的に変化する絡み合いについて検討した。
本研究では,結合強度の時間変調によるパラメトリック共鳴の詳細な解析を行う。
パラメトリックゲインとデコヒーレンスとの競合の結果、定常非平衡絡み状態が実現されることを実証する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:01:19 GMT)
Vision Foundation Models Can Be Good Tokenizers for Latent Diffusion Models [45.6] Vision Foundation Model Variational Autoencoder (VFM-VAE) は、VFMのセマンティックフォーカスとピクセルレベルの忠実さの必要性の間の固有の緊張を解決するために設計された。
我々のシステムは80エポックで2.20のgFID(w/o CFG)に達する(先行トークン化器の10倍の高速化)。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:30:45 GMT)
Learning Time-Varying Turn-Taking Behavior in Group Conversations [45.4] 本稿では,個人特性と過去の発話行動のみに基づいて,グループ会話におけるターンテイクパターンを予測する柔軟な確率モデルを提案する。
以上の結果から,従来の行動モデルは必ずしも現実的ではなく,データ駆動型でありながら理論的に基礎的なアプローチを動機付けている可能性が示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:58:43 GMT)
Learning from the Best, Differently: A Diversity-Driven Rethinking on Data Selection [45.3] 既存のアプローチは通常、1次元または複数次元のスコアベースの選択に依存する。
本稿では,データ選択時の品質と多様性を両立するOrthogonal Diversity-Aware Selection (ODiS)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:37:31 GMT)
VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning [44.9] 組込みマルチエージェント協調に適した最初の階層型ベンチマークであるVIKI-Benchを紹介する。
VIKI-Benchには、多様なロボットエボディメント、多視点視覚観察、構造化された監視信号が含まれる。
VIKI-Benchの実用性を実証するために、事前学習された視覚言語モデルを微調整する2段階フレームワークVIKI-Rを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:14:49 GMT)
IF-VidCap: Can Video Caption Models Follow Instructions? [44.2] 制御可能なビデオキャプションを評価するための新しいベンチマークであるIF-VidCapを紹介する。
IF-VidCapには、フォーマットの正しさとコンテンツの正しさの2つの側面でキャプションを評価する、体系的なフレームワークが組み込まれている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:25:08 GMT)
AgentTTS: Large Language Model Agent for Test-time Compute-optimal Scaling Strategy in Complex Tasks [44.2] テストタイムスケーリング(TTS)は、推論中に追加の計算リソースを割り当てることで、大規模言語モデル(LLM)の性能を向上させる。
我々は,多段階複雑なタスクにおけるテスト時間計算-最適スケーリングという,新しい問題を研究する。
本稿では,計算最適割り当てを自律的に検索するLLMエージェントベースのフレームワークであるAgentTTSを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:46:43 GMT)
A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography [44.2] そこで我々は,10個の白質トラクトグラフィー形状を予測できる新しいディープラーニングフレームワークであるTract2Shapeを提案する。
モデル効率を向上させるために,モデルの次元削減アルゴリズムを用いて5つの一次形状成分を予測した。
本研究では,HCP-YAデータセットと未確認PPMIデータセットを用いて,Tract2Shapeの性能評価を行った。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:04:50 GMT)
Global Prompt Refinement with Non-Interfering Attention Masking for One-Shot Federated Learning [44.0] Federated Prompt Learning (FPL) は、凍結した事前学習モデルの上に軽量なプロンプトをチューニングすることで、コミュニケーション効率の高い適応を可能にする。
単発FPLのための非干渉注意マスキング法(GPR-NIAM)を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:41:11 GMT)
CAGE: Curvature-Aware Gradient Estimation For Accurate Quantization-Aware Training [43.7] 量子化による損失に対応する新しいQAT法であるCAGE(Curvature-Aware Gradient Estimation)を導入する。
CAGEは、量子化によって引き起こされる損失の10%以上を、アウター緩和法により回収する。
これらの結果から, 曲率を意識した勾配補正は, 現行法を超える残りの性能ギャップを埋める可能性が示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:33:57 GMT)
Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards [43.6] 本稿では,人選好に基づく報酬関数のトレードオフを扱うための社会選択言語モデルを提案する。
実験により、我々のモデルはより効果的で、整合性があり、バランスの取れた報酬関数を確実に選択できることを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:09:53 GMT)
Steering Autoregressive Music Generation with Recursive Feature Machines [43.5] MusicRFMはRecursive Feature Machines (RFM) に適応し、凍結した、事前訓練された音楽モデルに対してきめ細かな、解釈可能な制御を可能にするフレームワークである。
RFMはモデルの内部勾配を分析して解釈可能な「概念方向」を生成する
動的・時間変化のスケジュールと複数の音楽特性の同時実施方法を含む,この制御の高度な機構について述べる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 23:23:14 GMT)
Weight Decay may matter more than muP for Learning Rate Transfer in Practice [43.2] muPのスケーリングルールは、層内の入力の幾何的アライメントに関する強い仮定と、その重みと勾配の更新に依存していることを示す。
トレーニングの残り期間は、幅にまたがる内部表現の更新ダイナミクスを正しく安定化する muP よりも重量減衰である。
このことは、muPのスケーリングが主に暗黙の学習率ウォームアップの形で機能し、修正されたウォームアップスケジュールで大きく置き換えることが可能であることを示唆している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:36:14 GMT)
Counterfactual Reasoning for Steerable Pluralistic Value Alignment of Large Language Models [43.0] COUPLEは、Puuralistic valuEアライメントのためのCOUnterfactual reasoning frameworkである。
特徴間の複雑な相互依存と優先順位付け、高レベルの価値次元と振る舞いの因果関係が特徴である。
明確な因果モデリングから恩恵を受けるため、COUPLEはより良い解釈可能性も提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:12:45 GMT)
Shuffling Heuristic in Variational Inequalities: Establishing New Convergence Guarantees [43.0] シャッフル戦略は変分不等式問題を解決するのに有効であることを示す。
この文脈におけるシャッフル法に対する最初の理論的収束推定を提供する。
多様なベンチマーク変動不等式問題に関する広範な実験により,本研究の成果を検証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:23:30 GMT)
SAMPO:Scale-wise Autoregression with Motion PrOmpt for generative world models [42.8] textbfSAMPOは、フレーム内生成のための視覚的自己回帰モデリングと、次のフレーム生成のための因果モデリングを組み合わせたハイブリッドフレームワークである。
動作条件付きビデオ予測とモデルベース制御において,SAMPOが競合性能を発揮することを示す。
また、SAMPOのゼロショット一般化とスケーリング挙動を評価し、未知のタスクに一般化する能力を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:09:30 GMT)
DiffPace: Diffusion-based Plug-and-play Augmented Channel Estimation in mmWave and Terahertz Ultra-Massive MIMO Systems [42.6] 本稿では,チャネル推定のための拡散型プラグアンドプレイ方式であるDiffPaceを紹介する。
高い推定精度と計算効率の向上を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:22:24 GMT)
Exploring Membership Inference Vulnerabilities in Clinical Large Language Models [42.5] 臨床大言語モデル(LLM)におけるメンバーシップ推論脆弱性の探索的研究について述べる。
最新の臨床質問応答モデルであるLlemrを用いて、標準的損失に基づく攻撃とドメインを動機としたパラフレージングに基づく摂動戦略の両方を評価する。
その結果は、コンテキスト認識、ドメイン固有のプライバシ評価、防衛の継続的な開発を動機付けている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:27:48 GMT)
Learning Confidence Bounds for Classification with Imbalanced Data [42.4] 本稿では,学習理論と集中不等式を利用して従来のソリューションの欠点を克服する新しい枠組みを提案する。
本手法は, クラスごとに異なる不均衡度に効果的に適応できるため, より堅牢で信頼性の高い分類結果が得られる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:51:42 GMT)
The Bias-Variance Tradeoff in Data-Driven Optimization: A Local Misspecification Perspective [42.1] データ駆動の最適化は、機械学習や運用上の意思決定問題において、至るところで行われている。
ETO(Integrated Estimation-Optimization)やIEO(Integrated Estimation-Optimization)といったモデルベースアプローチが一般的である。
しかし、これらの手法の相対的な性能はよく理解されておらず、ほとんどの結果は、モデルに基づくアプローチが適切に特定されたり、不明確であったりするジコトプスのケースに限られる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:35:50 GMT)
Maximal Clauser-Horne-Shimony-Holt violation for qubit-qudit states [42.0] 一般(典型的には混合)キュービット量子状態に対する最大クレーター・ホーネ・シモニー・ホルト違反の評価を行った。
これはこの種の系に対する最適(2-2-2)ベル非局所性を表す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:56:29 GMT)
An integrated neural wavefunction solver for spinful Fermi systems [42.0] 連続座標に加えてスピンやその他の離散自由度を含むフェルミ系の基底状態の解法を提案する。
変圧器は、スピンフル一般化軌道への普遍近似を入力することにより、連続的な位置と離散スピンの両方を達成する。
本手法を2次元材料問題の範囲で検証する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:20:31 GMT)
DSI-Bench: A Benchmark for Dynamic Spatial Intelligence [41.8] 動的空間関係に関する推論は、オブザーバーとオブジェクトが同時に移動することが多いため、不可欠である。
ダイナミック・スペース・インテリジェンスを導入し,1000近いダイナミックビデオと1,700以上の手作業による注釈付き質問を用いたベンチマークであるDSI-Benchを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:36 GMT)
Beyond Single Models: Mitigating Multimodal Hallucinations via Adaptive Token Ensemble Decoding [41.8] LVLM(Large Vision-Language Models)は画像キャプションや視覚的質問応答といったマルチモーダルタスクにおいて,近年顕著な成果を上げている。
それらは、まだ存在しない、または誤認されたオブジェクトの記述を生成する、オブジェクト幻覚の傾向にある。
本稿では,複数のLVLMからの予測を集約することで幻覚を緩和する,学習不要でトークンレベルのアンサンブルフレームワークであるAdaptive Token Ensemble Decoding (ated)を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:11:24 GMT)
Online Time Series Forecasting with Theoretical Guarantees [41.8] 理論的保証付きオンライン時系列予測のための理論的枠組みを提案する。
潜伏変数による予測器の供給がベイズリスクを締め付けることを実証する。
また,近接観測が最小限である潜伏変数の同定も提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:12:11 GMT)
OmniNWM: Omniscient Driving Navigation World Models [41.7] 統合されたフレームワーク内の3次元すべてに対処するパノラマナビゲーションワールドモデルであるOmniNWMを紹介する。
例えば、OmniNWMは、RGB、セマンティクス、メートル法深度、および3D占有度のパノラマ動画を共同で生成する。
動作のために、入力軌跡をピクセルレベルの信号にエンコードする正規化パノラマPlucker線地図表現を導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:49:01 GMT)
Uniworld-V2: Reinforce Image Editing with Diffusion Negative-aware Finetuning and MLLM Implicit Feedback [41.4] 本稿では,ポリシー最適化に基づく命令ベースの画像編集のための新しいポストトレーニングフレームワークであるEdit-R1を紹介する。
具体的には,Diffusion Negative-Aware Finetuning (DiffusionNFT) を用いた。
我々は,Multimodal Large Language Model (MLLM) を統一学習自由報酬モデルとして採用し,その出力ロジットを活用し,きめ細かいフィードバックを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:27:04 GMT)
Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views [41.1] 3DThinkerは、画像に埋め込まれたリッチな幾何学的情報を、人間のように推論しながら活用するフレームワークだ。
私たちのフレームワークは,3D事前入力を使わずに推論中に初めて3Dのメンタリングを可能にするもので,トレーニングのために明示的にラベル付けされた3Dデータに頼らない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:36:58 GMT)
Deep Learning in Palmprint Recognition-A Comprehensive Survey [41.0] パームプリント認識は、様々なシナリオに広く応用される、顕著な生体認証技術として登場した。
ディープラーニング(DL)はこの制限に対処するために導入され、様々な領域でその顕著な成功を活用している。
本論文は, DLを用いたヤシ文字認識の最近の進歩を徹底的にレビューすることによって, そのギャップを埋めるものである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:49:34 GMT)
Retaining by Doing: The Role of On-Policy Data in Mitigating Forgetting [40.8] 言語モデルをポストトレーニングによって新しいタスクに適応することは、既存の能力を劣化させるリスクをもたらす。
教師付き微調整(SFT)と強化学習(RL)の2つの広く採用されているポストトレーニング手法の忘れパターンを比較した。
RLはSFTよりも忘れられがちだが、目標タスクのパフォーマンスは同等か高い。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:41 GMT)
UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-Image Generation [40.6] テキスト・ツー・イメージ生成のための統合意味評価ベンチマークであるUniGenBench++を紹介する。
カバー範囲と効率性を確保するため、600のプロンプトが階層的に編成されている。
英語と中国語の両方のプロンプトを短くて長い形で提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:56:46 GMT)
A$^2$FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning [40.6] 大規模言語モデルは、推論中心のLLMとエージェントのLLMの2つのファミリーに分けられた。
この分割は、基本的に異なるトレーニング目標から生じ、単純なクエリに対して不一致の強度と非効率をもたらす。
本稿では,アダプティブ・エージェント・ファンデーション・モデル (A$2$FM) を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:44:09 GMT)
Retrieval-in-the-Chain: Bootstrapping Large Language Models for Generative Retrieval [40.4] 生成検索のための推論強化フレームワークであるReason-for-Retrieval(R4R)を提案する。
R4Rは、自由形式のチェーン・オブ・シークレット(CoT)推論をコンパクトで構造化されたフォーマットに変換し、検索プロセス中の推論を反復的に洗練する。
自然質問、MS MARCO、および実世界の項目探索ベンチマークに関する広範囲な実験により、R4Rの有効性が検証された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:27:45 GMT)
The Spacetime of Diffusion Models: An Information Geometry Perspective [40.2] 決定論的確率フローを用いた標準的なプルバック手法であるComplementODEデコーダが根本的に欠陥があることが示される。
遅延時空$z=(x_t,t)$を導入し、すべてのノイズスケールにわたる分布の族を指数化する。
結果として得られた構造は、ジオデシックが最小限のノイズ列を追跡し、データ間の編集を飾る、原則付き拡散距離編集(Diffusion Distance Edit)を誘導する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:31:15 GMT)
ComputerRL: Scaling End-to-End Online Reinforcement Learning for Computer Use Agents [40.0] 自律デスクトップインテリジェンスのためのフレームワークComputerRLを紹介する。
ComputerRLは、プログラム的なAPI呼び出しと直接GUIインタラクションを統合するAPI-GUIパラダイムを備えている。
本稿では,強化学習と教師付き微調整を交互に行う訓練戦略であるEntropulseを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:18:04 GMT)
Nearly Dimension-Independent Convergence of Mean-Field Black-Box Variational Inference [40.0] ブラックボックスの変分推論は、明示的な次元依存からほぼ独立な速度で収束することを示す。
また, 対象対数密度のヘシアンスペクトル境界のみを用いて, 結果の鍵となる分散勾配の境界を改善できないことも証明した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:38:53 GMT)
PAGE-4D: Disentangled Pose and Geometry Estimation for 4D Perception [39.8] PAGE-4Dはフィードフォワードモデルで、後処理なしでVGGTを動的シーンに拡張する。
ダイナミックス対応マスクを予測することで、静的および動的情報をアンタングルする。
実験の結果、PAGE-4Dは動的シナリオにおいて元のVGGTよりも一貫して優れていた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:59:28 GMT)
LIMOPro: Reasoning Refinement for Efficient and Effective Test-time Scaling [39.6] PIR(Perplexity-based Importance Refinement)は,各推論ステップの重要性を定量的に評価するフレームワークである。
PIRは、プログレッシブ推論コンポーネントを保持しながら、低重要機能ステップのみを特定し、選択的にプーンする。
我々のアプローチは、異なるモデルサイズ、データソース、トークン予算にまたがる強力な一般化可能性を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:15:36 GMT)
Sign-SGD is the Golden Gate between Multi-Node to Single-Node Learning: Significant Boost via Parameter-Free Optimization [39.4] Sign-SGDは、単一ノードトレーニングにおけるメモリ効率のよいアプローチであり、分散学習における勾配圧縮技術である。
理論的な観点から有効段数を自動的に決定することは不可能である。
我々は、一つのノードと複数のノードの学習、モメンタムを組み込んだ手法にアプローチを拡張します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:04:58 GMT)
H3D-DGS: Exploring Heterogeneous 3D Motion Representation for Deformable 3D Gaussian Splatting [39.3] ダイナミックシーンの再構築は、3Dビジョンにおいて永続的な課題となる。
変形可能な3Dガウススプラッティングは,リアルタイムレンダリングと高視認性を実現するため,この作業に有効な方法として登場した。
このアプローチは、動的シーンを標準空間における静的な表現と時間変化のシーンモーションに分解する。
Neu3DVおよびCMU-Panopticデータセットを用いた実験により,本手法は最先端の変形可能な3次元ガウススプラッティング技術よりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:03:39 GMT)
Analyzing Similarity Metrics for Data Selection for Language Model Pretraining [39.0] トレーニング例間の類似性の測定は、言語モデルのための高品質で多様な事前学習データセットのキュレーションに不可欠である。
標準オフザシェルフ埋め込みモデルは、事前学習データキュレーション設定には適していない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:13:12 GMT)
SAFER: Risk-Constrained Sample-then-Filter in Large Language Models [39.0] 本稿では,無意識サンプリングと共形フィルタリングを組み合わせた2段階リスク制御フレームワークを提案する。
その結果,SAFERはタスク固有の基準やキャリブレーションテストのスプリット比と互換性があることが判明した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:14:09 GMT)
Semantic Relation-Enhanced CLIP Adapter for Domain Adaptive Zero-Shot Learning [38.8] 既存のパラダイムは、クロスドメイン転送とクロスカテゴリの一般化のバランスが取れない。
本稿ではセマンティック・リレーショナル・アライメント・ストラテジーとセマンティック・リレーショナル・アライメント・ストラテジーを統合したセマンティック・リレーショナル・エンハンスメント・CLIP(SRE-CLIP)アダプタ・フレームワークを提案する。
最初のCLIPベースのDAZSL法として、SRE-CLIPはI2AwAおよびI2WebVベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:03:30 GMT)
Kaleido: Open-Sourced Multi-Subject Reference Video Generation Model [38.8] 対象者の複数の参照画像に条件付き映像を合成することを目的としたS2V生成フレームワークであるKaleidoについて述べる。
カレイドは、一貫性、忠実性、一般化において従来の方法よりも著しく優れており、S2V生成の進歩を示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:28:14 GMT)
Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy [38.6] 本稿では、侵害されたクライアントが世界収束を遅らせるために敵の更新を注入する、ビザンチン攻撃という特定の脅威に対処する。
信頼スコアの概念とトライアル関数の方法論を組み合わせることで、アウトレイラを動的にフィルタリングする。
提案手法は,Byzantineノードが多数を占める場合でも機能を実現するため,従来のアプローチの限界に対処する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:56:29 GMT)
Towards Unsupervised Open-Set Graph Domain Adaptation via Dual Reprogramming [38.3] 教師なしオープンセットグラフ領域適応の問題について検討する。
本稿では,グラフとモデルの両方で再プログラミングを行うGraphRTAという新しいフレームワークを提案する。
提案手法は,最近の最先端のベースラインと比較して,満足度の高い性能を実現することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:34:58 GMT)
Lost in the Maze: Overcoming Context Limitations in Long-Horizon Agentic Search [38.1] ロングホライズンエージェントサーチでは、長い軌道上でウェブを探索し、多くの情報源で情報を合成する必要がある。
一般的なエージェント検索フレームワークは、コンテキスト制限のため、長い軌道にスケールするのに苦労していることを示す。
本稿では,検索を個別の検索・閲覧ツールに分離するシンプルなフレームワークであるSLIMを紹介し,その軌道を定期的に要約する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:58:45 GMT)
Doctor Approved: Generating Medically Accurate Skin Disease Images through AI-Expert Feedback [38.0] 本稿では,データ拡張のための臨床的精度の高い皮膚疾患像を合成する新しいフレームワークMAGICを提案する。
提案手法は,専門家定義基準を,DM画像合成のための実用的なフィードバックに創造的に変換する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:39:38 GMT)
Towards Identifiability of Hierarchical Temporal Causal Representation Learning [38.0] 因果的階層的潜在動的(CHiLD)識別フレームワークを提案する。
各層内の潜伏変数を識別するために、潜伏変数間の階層構造が自然に分散していることを利用する。
このモデルは、コンテキストエンコーダを組み込んで、多層潜在変数を再構成し、フローベースの階層的事前ネットワークを正規化する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:40:17 GMT)
Towards Fair ASR For Second Language Speakers Using Fairness Prompted Finetuning [37.9] 第二言語話者のための公正な英語ASRシステムを構築するという課題に対処する。
広く使われているASRモデルWhisperとSeamless-M4Tを解析したところ、26のアクセント群で単語誤り率(WER)が大きく変動していることが判明した。
これを軽減するために,軽量アダプタを用いたフェアネスプロンプトファインタニングを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:45:21 GMT)
FedMeld: A Model-dispersal Federated Learning Framework for Space-ground Integrated Networks [37.9] 宇宙地上統合ネットワーク(SGIN)は、世界中の隅々に人工知能(AI)サービスを提供することが期待されている。
SGINsのミッションの1つは、世界規模で連邦学習(FL)をサポートすることである。
本稿では,モデル分散(FedMeld)戦略に基づく,インフラストラクチャフリーなフェデレーション学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:12:19 GMT)
MoMaGen: Generating Demonstrations under Soft and Hard Constraints for Multi-Step Bimanual Mobile Manipulation [37.9] 本稿では,データ生成を制約付き最適化問題として定式化するMoMaGenを紹介する。
既存の手法よりもはるかに多様なデータセットを生成することを示す。
MoMaGenは、単一のソースデモから成功した模倣学習ポリシーをトレーニングすることができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:56:47 GMT)
When Text Embedding Meets Large Language Model: A Comprehensive Survey [37.7] この調査は、大きな言語モデル(LLM)とテキスト埋め込みの相互作用に焦点を当てている。
様々な研究および応用分野からの貢献の、新しく体系的な概要を提供する。
この分析に基づいて,テキスト埋め込みの進化に向けた今後の方向性を概説する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:42:20 GMT)
From Competition to Synergy: Unlocking Reinforcement Learning for Subject-Driven Image Generation [37.4] 被写体駆動画像生成モデルは、アイデンティティ保存(忠実さ)とアクシデンス(親和性)の基本的なトレードオフに直面している
本稿では,Synergy-Aware Reward ShapingとTime-Aware Dynamic Weightingという2つの重要なイノベーションを特徴とする新しいフレームワークを提案する。
本モデルでは,重要な特徴を保存し,複雑なテキストのプロンプトに正確に準拠する画像を生成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:32:26 GMT)
Surface code scaling on heavy-hex superconducting quantum processors [36.9] 我々は、ネイティブ接続がコードにマッチしないハードウェア上で、サーフェスコード量子メモリのサブスレッショルドスケーリングを実証する。
DDはコヒーレントなZZクロストークと非マルコフ的デフォーカスを抑制する。
我々は、X-およびZ-basis論理エラーデータから直接計算され、サイクルごとのSPAM対応境界を提供するエンタングルメント忠実度指標を導出する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:37:40 GMT)
Cross-Modal Scene Semantic Alignment for Image Complexity Assessment [36.7] クロスモーダルなシーンセマンティック情報は、様々なコンピュータビジョンタスクにおいて重要な役割を果たすことが示されている。
ICA性能を向上させるために,Cross-Modal Scene Semantic Alignment (CM-SSA) と呼ばれる新しいICA手法を提案する。
いくつかのICAデータセットの実験により、提案したCM-SSAは最先端のアプローチよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:52:40 GMT)
DA$^2$: Depth Anything in Any Direction [36.5] パノラマにはフルのFoV(360$circtimes$180$circ$)があり、視点画像よりも完全な視覚的記述を提供する。
従来のメソッドはドメイン内の設定に制限されることが多いため、ゼロショットの一般化は不十分である。
DA$2$: $textbfD$epth $textbfA$nything in $textbfA$ny $textbfD$irection。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:19:52 GMT)
Towards Agentic Self-Learning LLMs in Search Environment [36.2] 自己学習が人間の計算したデータセットや事前定義されたルールベースの報酬に頼ることなく、LSMベースのエージェントをスケールできるかどうかを検討する。
生成的リワードモデル(GRM)の報酬は、オープンドメイン学習のための厳密なルールベースの信号より優れている。
完全閉ループ・マルチロール強化学習フレームワークである textbfAgentic Self-Learning (ASL) を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:16:23 GMT)
Prototyping an End-to-End Multi-Modal Tiny-CNN for Cardiovascular Sensor Patches [35.9] 本稿では、バイナリ分類問題を解決するために、データの早期融合を伴う畳み込みニューラルネットワークを提案する。
提案手法は,最先端技術と比較してメモリフットプリントと計算コストを3桁削減する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:23:20 GMT)
LAFA: Agentic LLM-Driven Federated Analytics over Decentralized Data Sources [35.6] 大規模言語モデル(LLM)は、自然言語クエリを解釈することで、データ分析タスクを自動化するという大きな可能性を示しています。
既存のLLMベースの分析フレームワークは、集中型データアクセスの前提で運用されており、プライバシー保護はほとんど、あるいは全く提供されない。
LLMをベースとしたデータ分析とフェデレーション分析を統合した最初のシステムであるLAFAを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:56:25 GMT)
The Early Bird Catches the Leak: Unveiling Timing Side Channels in LLM Serving Systems [35.5] 新たなタイミング側チャネルのセットを利用して、機密システムプロンプトと他のユーザによって発行された情報を推測することができる。
これらの脆弱性は、従来のコンピューティングシステムで観察されたセキュリティ上の問題と類似している。
キャッシュ内の共有プロンプトプレフィックスを効率的に回収するトークン・バイ・トークン検索アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:47:29 GMT)
HyperGraphRAG: Retrieval-Augmented Generation via Hypergraph-Structured Knowledge Representation [35.5] ハイパーエッジによるn-aryリレーショナル事実を表す新しいグラフベースRAG法であるHyperGraphRAGを提案する。
医学、農業、コンピュータ科学、法をまたいだ実験では、HyperGraphRAGは標準的なRAG法と従来のグラフベースのRAG法の両方で、精度、検索効率、生成品質に優れていた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:08:23 GMT)
Moving Light Adaptive Colonoscopy Reconstruction via Illumination-Attenuation-Aware 3D Gaussian Splatting [35.4] 3D Gaussian Splatting (3DGS) は, 大腸内視鏡におけるリアルタイム視線合成の重要技術として出現している。
しかし、バニラ3DGSは静止照明を仮定し、観測された外観は視角のみに依存する。
このミスマッチは、ほとんどの3DGS法に、カメラと組織の間に、構造に違反するガウスの塊を導入するよう強制する。
大腸内視鏡に適した改良型3DGSフレームワークであるColIAGSを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:44:23 GMT)
Can Reasoning Models Obfuscate Reasoning? Stress-Testing Chain-of-Thought Monitorability [35.2] Chain-of-Thought(CoT)は、アライメント監視のための有望なツールである。
モデルは検出を回避しながら隠れた敵の目標を追求するためにCoTを難読化できるのか?
我々は,CoT難燃化を誘発するプロンプトの,構成可能で定量化可能な分類法を開発した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:07:10 GMT)
A Statistical Theory of Contrastive Pre-training and Multimodal Generative AI [35.1] マルチモーダル生成AIシステムは、異なるモーダルの表現を学ぶために、対照的な事前学習に依存している。
本稿では、下流タスクにおける対照的な事前学習の成功を説明するための理論的枠組みを開発する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:12:00 GMT)
Deep Edge Filter: Return of the Human-Crafted Layer in Deep Learning [34.6] 我々は、モデル一般化性を改善するために、ディープニューラルネットワーク機能にハイパスフィルタを適用する新しいアプローチであるディープエッジフィルタを導入する。
Vision、Text、3D、Audioといったさまざまなドメインにわたる実験結果は、一貫したパフォーマンス改善を示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:48:24 GMT)
FALCON: Fine-grained Activation Manipulation by Contrastive Orthogonal Unalignment for Large Language Model [34.3] 本研究では,FALCON(Contrastive Orthogonal uNalignment)による微細な活性化マニピュレーションを,表現誘導型未学習アプローチとして提案する。
FALCONは、モデルユーティリティを維持しながら、より優れた非学習効率を実現し、知識回復の試みに対して堅牢な抵抗を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:22:01 GMT)
Learning under Quantization for High-Dimensional Linear Regression [34.2] 低ビット量子化は大規模モデルの効率的なトレーニングを可能にするには不可欠である。
その広範な経験的成功にもかかわらず、その学習性能への影響に関する厳密な理論的理解は、明らかに欠落している。
本研究は,高次元線形回帰に対する有限ステップ勾配勾配(SGD)解析という,この基本問題に関する最初の体系的理論的研究である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:30:11 GMT)
Enhancing optical lattice clock coherence times with erasure conversion [34.2] 我々は、87ドルSr光格子クロックに対する超微細分解読出し法を実験的に実証した。
シンクロディファレンシャル比較において超微細分解読出法を用いることで,100秒以上150秒を超える高原子コヒーレンス時間を実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:15:11 GMT)
Model-based Implicit Neural Representation for sub-wavelength Radio Localization [33.7] この作業は、メモリ要求を同時に低減し、精度を向上させることで、確立されたフィンガープリントベースのローカライゼーションフレームワークを拡張します。
モデルに基づくニューラルネットワークは、位置-チャネルマッピングを学習するために使用され、生成的ニューラルネットワークモデルとして機能する。
注目すべきは、ローカライズ精度が数桁向上すると同時に、古典的なフィンガープリント法に比べてメモリ要求量が桁違いに削減されることだ。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:32:16 GMT)
MoGA: Mixture-of-Groups Attention for End-to-End Long Video Generation [33.7] 本稿では、軽量で学習可能なトークンルータを用いて、ブロックワイズを使わずにトークンを正確にマッチングする、効率的なスパースアテンションであるMixture-of-Groups Attention(MoGA)を提案する。
カーネルフリーの方法として、MoGAはFlashAttentionやシーケンス並列性など、現代の注目スタックとシームレスに統合される。
MoGAをベースとして,24fpsで480pの動画を1秒単位で生成し,コンテクスト長は約580kの高速長ビデオ生成モデルを構築した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:50:42 GMT)
Reasoning Language Model Inference Serving Unveiled: An Empirical Study [33.6] RLLM(Reasoning Large Language Model)は、数学やコーディングといった複雑な推論タスクの解決において、競争力があることが証明されている。
しかし、RLLMの性能と動作は未解明のままであり、現実のシナリオにおけるRLLMの展開と利用を損なう可能性がある。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:25:51 GMT)
Dynamic Diffusion Schrödinger Bridge in Astrophysical Observational Inversions [33.4] 動的天体物理系の文脈における拡散シュリンガーブリッジ(DSB)モデルについて検討した。
本稿では、天体物理の力学に最適化された対の領域仮定を持つDSBの変種であるAstro-DSBモデルを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:38:06 GMT)
New Permutation Decomposition Techniques for Efficient Homomorphic Permutation [33.3] ホモモルフィックな置換は、バッチエンコーディングのホモモルフィック暗号に基づくプライバシ保存計算の基礎となる。
本稿では、同型暗号に基づくプライバシー保護計算を進化させ、同型置換を最適化する新しい分解手法を提案する。
従来の分解範囲から逸脱するネットワーク構造を設計し、最小回転鍵条件で最大1.69タイムの高速化で最先端技術より優れる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:06:30 GMT)
Stabilizing MoE Reinforcement Learning by Aligning Training and Inference Routers [33.2] 我々は,MoEモデルのトレーニングと推論の整合性を解析し,ルーティング行動における顕著な相違点を同定する。
本稿では、推論エンジンからのルーティング分布を記録し、トレーニング中にリプレイするRollout Replay Routing (R3)を提案する。
R3は、トレーニング速度を損なうことなく、トレーニング推論ポリシーKLのばらつきを著しく低減し、極端な不一致を緩和する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:19:46 GMT)
Learning from N-Tuple Data with M Positive Instances: Unbiased Risk Estimation and Theoretical Guarantees [33.2] 弱教師付き学習はしばしばラベルよりも粗い集約信号で機能する。
学習可能な未バイアスリスク推定器 (URE) をインスタンス生成プロセスと潜在限界値にリンクすることで, カウントが許容できることを示す。
我々は,理論上は基礎的かつ事実上安定的な目標設定によって,カウントオンリーの監視を効果的に活用できることを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:28:07 GMT)
The Emergence of Complex Behavior in Large-Scale Ecological Environments [33.0] オープンエンド環境下での複雑な行動の出現を物理的規模と人口規模がいかに形成するかを考察する。
私たちのゴールは、1つのハイパフォーマンスなポリシーを最適化することではなく、大きな集団にまたがって行動がどのように出現し進化するかを調べることです。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:03:25 GMT)
Diffusion Buffer for Online Generative Speech Enhancement [33.0] Diffusion Bufferは生成拡散に基づく音声強調モデルである。
データストリームから受信する信号フレーム毎に1つのニューラルネットワークコールしか必要としない。
コンシューマグレードのGPU上で、オンライン形式で拡張を実行する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:52:33 GMT)
Learning to Flow from Generative Pretext Tasks for Neural Architecture Encoding [32.9] ニューラルアーキテクチャ符号化のための新しい事前学習手法であるFGPを提案する。
FGPは、ニューラルネットワークの情報フローの表現であるフローサロゲートを再構築するためにエンコーダを訓練する。
実験の結果,FGPは教師付き学習でのみ訓練されたのと同じエンコーダに比べて,精度-1%で最大106%向上することがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:29:15 GMT)
Are they lovers or friends? Evaluating LLMs' Social Reasoning in English and Korean Dialogues [32.9] 映画脚本をベースとした1k対話データセットであるSCRIPTSを紹介した。
この課題は、各対話における話者間の対人関係を推測するモデルの社会的推論能力を評価することである。
思考モデルとチェーン・オブ・シークレットが一般的な推論に有効であり、社会的推論に最小限の利益をもたらし、時には社会的バイアスを増幅することを発見した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:12:47 GMT)
One Size Fits All? A Modular Adaptive Sanitization Kit (MASK) for Customizable Privacy-Preserving Phone Scam Detection [32.9] 携帯電話の詐欺は、世界中の個人的安全と金融の安全の両方にとって大きな脅威だ。
大規模言語モデル(LLMs)の最近の進歩は、書き起こされた電話会話を分析して不正行為を検出する強力な可能性を示している。
LLMは、処理中にサードパーティのサービスプロバイダに暴露される可能性のある機密性の高い個人情報を含むことが多いため、顕著なプライバシーリスクを導入している。
個人の好みに基づいた動的プライバシ調整を実現するためのトレーニング可能なフレームワークであるMASKを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:30:36 GMT)
Optimality and NP-Hardness of Transformers in Learning Markovian Dynamical Functions [32.7] トランスフォーマーアーキテクチャは、インコンテキスト学習(ICL)による所定のプロンプトにおける入出力ペアに基づいて、目に見えないタスクを解決できる
マルコフ関数学習の基盤となる最適化動作を明らかにするため,構造化ICL設定によるマルコフ関数学習について検討する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:42:48 GMT)
Learning with Dual-level Noisy Correspondence for Multi-modal Entity Alignment [32.2] マルチモーダル・エンティティ・アライメント(MMEA)は、異種マルチモーダル・ナレッジ・グラフ(MMKG)にまたがる等価なエンティティを識別することを目的としている。
既存の手法では、イントラエンタリティとインターグラフ対応の両方に欠陥がないと仮定しており、実世界のMMKGにはしばしば違反している。
本稿では、DNC(Dual-level Noisy Cor correspondingence)問題に対処するため、RULEと呼ばれる堅牢なMMEAフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:00:11 GMT)
ACTG-ARL: Differentially Private Conditional Text Generation with RL-Boosted Control [32.1] 本稿では,DP合成テキスト生成を特徴学習と条件テキスト生成という2つのサブタスクに分解する階層的フレームワークを提案する。
条件生成のためのACTGの指示追従能力を向上させる後学習法であるAnchored RL(ARL)を提案する。
ARLは、RLとSFTアンカーをベスト・オブ・N$のデータで組み合わせて、報酬のハッキングを防ぐ。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:31:31 GMT)
Improving Human-AI Coordination through Online Adversarial Training and Generative Models [32.1] 新たな人間に一般化するには、人間の行動の多様性を捉えたデータに関する訓練が必要である。
敵対的トレーニングは、動的データ生成を可能にする有望な方法であり、エージェントが堅牢であることを保証する。
本稿では、事前学習した生成モデルを用いて、有効な協調エージェント政策と敵の訓練をシミュレートし、後悔を最大化する新しい戦略を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:52:33 GMT)
Learning to Interpret Weight Differences in Language Models [31.7] Diff Interpretation Tuning (DIT) は、モデルにファインタニングによって引き起こされる修正を記述することを訓練する手法である。
提案手法は, 提案手法を用いて, 精度の高い自然言語記述を用いて, 微調整による修正を記述できることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:29:55 GMT)
DP$^2$O-SR: Direct Perceptual Preference Optimization for Real-World Image Super-Resolution [31.7] コストのかかる人的アノテーションを必要とせずに、生成モデルと知覚的嗜好を整合させるフレームワークを導入する。
DP$2$O-SRは知覚品質を著しく改善し,実世界のベンチマークによく適合することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:43:23 GMT)
A Survey of Process Reward Models: From Outcome Signals to Process Supervisions for Large Language Models [31.7] この調査は、完全なループを通して、PRMの体系的な概要を提供する。
数学、コード、テキスト、マルチモーダル推論、ロボット工学、エージェントにまたがる応用を要約する。
私たちのゴールは、設計空間を明確にし、オープンな課題を明らかにし、きめ細かな、堅牢な推論アライメントに向けた将来の研究を導くことです。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:21:25 GMT)
DanmakuTPPBench: A Multi-modal Benchmark for Temporal Point Process Modeling and Understanding [31.5] 本稿では,マルチモーダル・テンポラル・ポイント・プロセス(TPP)モデリングの進歩を目的としたベンチマークであるDanmakuTPPBenchを紹介する。
TPPは時間的事象系列をモデル化するために広く研究されてきたが、既存のデータセットは概ね非モーダルである。
我々のベンチマークは、強力なベースラインを確立し、マルチモーダル言語モデリングランドスケープへのTPPモデリングのさらなる統合を要求する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:34:39 GMT)
TrajMamba: An Efficient and Semantic-rich Vehicle Trajectory Pre-training Model [31.2] 車両GPSは、移動パターンや旅行目的を含む貴重な旅行セマンティクスを保存して、時間の経過とともに車両がどのように動くかを記録している。
旅行セマンティクスを効果的かつ効率的に学習することは、軌道データの現実的な応用に不可欠である。
そこで我々はTrajMambaを提案する。TrajMambaは効率的でセマンティックにリッチな車両軌道学習のための新しいアプローチである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:00:21 GMT)
An Encode-then-Decompose Approach to Unsupervised Time Series Anomaly Detection on Contaminated Training Data--Extended Version [31.0] 時系列異常検出は、現代の大規模システムにおいて、多様なシステムの動作を分析し、監視するために重要である。
教師なしのアプローチは、トレーニング中に異常なラベルを必要としないため、広く関心を集めている。
そこで我々は,符号化された表現を安定かつ補助的な表現に分解する,新しいエンコード-then-decomposeパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:23:20 GMT)
VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank [30.3] 推論による非参照IQA(NR-IQA)モデルであるVisualQuality-R1を導入し、強化学習でランク付けする。
VisualQuality-R1 は差別的深層学習に基づく NR-IQA モデルより一貫して優れていることを示す。
VisualQuality-R1は、コンテキスト的にリッチでヒューマンアラインな品質記述を生成することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:22:18 GMT)
A Generalizable Light Transport 3D Embedding for Global Illumination [30.1] 本稿では,3次元シーン構成から直接グローバル照明を近似する一般化可能な3次元光輸送埋め込みを提案する。
スケーラブルトランスフォーマーは、グローバルなポイントツーポイントインタラクションをモデル化して、これらの機能をニューラルプリミティブにエンコードする。
様々なレイアウト, 形状, 材料を有する屋内の様々なシーンにまたがって, グローバル照明の拡散予測結果を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:29:09 GMT)
Beyond Benign Overfitting in Nadaraya-Watson Interpolators [30.1] 古典的補間型ナダラヤ・ワトソン推定器(シェパード法とも呼ばれる)を再検討する。
我々は、破滅から良心に至るまで、単調な非単調な複数の過剰な行動の存在を証明した。
その結果,本質的なデータ次元を過度に推定することは,過度に推定するよりも有害であることが示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:34:45 GMT)
From Objects to Anywhere: A Holistic Benchmark for Multi-level Visual Grounding in 3D Scenes [30.0] Anywhere3D-Benchは2,886個の表現3Dバウンディングボックスペアからなる総合的な3次元視覚的グラウンドベンチマークである。
我々は,Anywhere3D-Bench上で,大規模言語モデル (LLM) とマルチモーダルLLM (MLLM) とともに,最先端の3Dビジュアルグラウンドディング手法の評価を行った。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:28:59 GMT)
BrailleLLM: Braille Instruction Tuning with Large Language Models for Braille Domain Tasks [29.6] 我々は、様々な点字領域の研究を支援するために、英語と中国語の点字混合データセットを構築した。
点字データに適した構文木に基づく拡張手法を提案する。
B BrailleLLMは、BKFTを使用して、統合された点字変換、公式から点字変換、混合テキスト変換を実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:33:05 GMT)
Inductive Domain Transfer In Misspecified Simulation-Based Inference [29.3] キャリブレーションと分散アライメントを1つのエンドツーエンドのトレーニング可能なモデルに統合する,完全な帰納的・償却型SBIフレームワークを提案する。
我々のアプローチは、他の標準SBIおよび非SBI推定器と同様に、RoPEの性能と一致または上回っている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:45:00 GMT)
WMamba: Wavelet-based Mamba for Face Forgery Detection [28.9] We introduced WMamba, a novel wavelet-based feature extractor built on the Mamba architecture。
本稿では,細い顔の輪郭を適応的にモデル化するために,特殊な変形可能なカーネルを用いた動的輪郭畳み込み(DCConv)を提案する。
We show that WMamba achieves state-of-the-art (SOTA) performance, highlighting its effective in face forgery detection。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:48:38 GMT)
ALINE: Joint Amortization for Bayesian Inference and Active Data Acquisition [28.8] ALINE(Amortized Active Learning and Inference Engine)は、ベイズ推論とアクティブデータ取得のための統合されたフレームワークである。
ALINEは、インフォメーションポイントの効率的な選択とともに、インスタントと正確な推論の両方を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:29:43 GMT)
Ranking-based Preference Optimization for Diffusion Models from Implicit User Feedback [28.4] Diffusion Denoising Ranking Optimization (Diffusion-DRO) は、逆強化学習に基づく新しい好み学習フレームワークである。
拡散DROは、選好学習をランキング問題としてキャストすることで、報酬モデルへの依存を除去する。
オフラインの専門家によるデモとオンラインポリシー生成のネガティブなサンプルを統合することで、人間の好みを効果的に捉えることができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:22:34 GMT)
Why Policy Gradient Algorithms Work for Undiscounted Total-Reward MDPs [28.2] 古典的政策勾配法は、現代政策に基づく強化学習アルゴリズムの理論的および概念的基礎である。
大規模言語モデルに対するポリシーベースのRLに関する最近の研究は、$gamma = 1$の未公表のトータル・リワード・セッティングを用いており、既存の理論の多くを適用不可能にしている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:46:21 GMT)
A unified framework for establishing the universal approximation of transformer-type architectures [28.1] 変換器型アーキテクチャの普遍近似特性(UAP)について検討する。
我々の研究は、トークンの識別性をUAPの基本的な要件として認識している。
各種の注意機構を持つ変圧器のUAPを証明し,本フレームワークの適用性を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:34:53 GMT)
DreamPRM-1.5: Unlocking the Potential of Each Instance for Multimodal Process Reward Model Training [28.0] DreamPRM-1.5は、インスタンスレベルの再重み付けフレームワークで、双方向の最適化を通じて、トレーニング例毎に適応的な重み付けを割り当てる。
MMMU検証セットで84.6の精度、R-Bench-Vで31.3の精度を実現し、リードバックボーンと組み合わせると、公開マルチモーダル推論リーダーボードで1位の結果が得られる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:47:56 GMT)
Interpretable Decision-Making for End-to-End Autonomous Driving [27.8] 本稿では,自律運転における制御コマンドを最適化しながら,解釈可能性を高める手法を提案する。
本稿では,スパース・ローカライズされた特徴写像を生成することで,モデルの解釈可能性を促進する損失関数を提案する。
また,本手法は,屈折率の低減と相関し,より安全かつ高性能な駆動モデルを実現することによる解釈可能性の向上を実証する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:01:11 GMT)
Nash Policy Gradient: A Policy Gradient Method with Iteratively Refined Regularization for Finding Nash Equilibria [27.8] 我々は,不完全情報ゲームにおけるナッシュ平衡を求めるための実用的なアルゴリズムを開発した。
ナッシュポリシーグラディエント (Nash Policy Gradient, NashPG) は、従来のベンチマークゲームにおけるモデルフリーメソッドと同等または低いエクスプロイト性を達成している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:14:45 GMT)
Food4All: A Multi-Agent Framework for Real-time Free Food Discovery with Integrated Nutritional Metadata [27.7] Food4Allは、リアルタイムでコンテキスト対応のフリーフード検索用に明示的に設計された最初のマルチエージェントフレームワークである。
食品4Allは, 公式データベース, コミュニティプラットフォーム, ソーシャルメディア間での不均一なデータ収集を行い, 継続的に更新された食品資源のプールを提供する。2) 地理的アクセシビリティと栄養学的正確性の両方を最適化するために, キュレートされたケースを訓練した軽量強化学習アルゴリズム, 3) ユーザニーズの進化に動的に適応するオンラインフィードバックループである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:35:02 GMT)
Robust Driving QA through Metadata-Grounded Context and Task-Specific Prompts [27.6] 本稿では,ハイレベルな認識,予測,計画的疑問に答える自律運転のための視覚言語QAシステムを提案する。
駆動型QAベンチマークの実験では,本手法はベースラインのQwen2.5モデルよりも有意に優れていた。
特に、このシステムは、深刻な視覚的腐敗の下で96%の精度を維持している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:24:59 GMT)
AI use in American newspapers is widespread, uneven, and rarely disclosed [27.4] 我々は、2025年夏に発行された150Kアメリカの新聞のオンライン版から186K記事のデータセットを監査する。
最先端のAI検出器であるPangramを使用して、新たに公開された記事の約9%が、部分的にまたは完全なAI生成であることがわかった。
ワシントン・ポスト、ニューヨーク・タイムズ、ウォール・ストリート・ジャーナルの45万件の意見も分析し、ニュース記事よりもAI生成コンテンツを含む可能性が6.4倍高いことを発見した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:22:07 GMT)
Preference-driven Knowledge Distillation for Few-shot Node Classification [27.2] グラフニューラルネットワーク(GNN)は、テキスト分散グラフ(TAG)を効率的に処理できる
LLMは、TAG上でゼロ/フェーショットの学習でうまく機能するが、スケーラビリティの課題に悩まされている。
本稿では,LLMと各種GNNの相補的強みを相乗化するための選好駆動型知識蒸留(PKD)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:28:02 GMT)
Conformal Prediction for Time-series Forecasting with Change Points [26.9] 本稿では,変化点を持つ時系列のコンフォーマル予測法を提案する。
我々はCPTCの妥当性を証明し、最小限の仮定で時系列設定における適応性を向上させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:40:15 GMT)
From Retrieval to Generation: Unifying External and Parametric Knowledge for Medical Question Answering [26.9] 既存のアプローチは一般的に2つのカテゴリに分類される: 検索型生成(RAG)と生成型生成(GAG)である。
医用QAのための外部およびパラメトリック知識をシームレスに統合する統合検索生成拡張フレームワークであるMedRGAGを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:58:29 GMT)
SceneCOT: Eliciting Grounded Chain-of-Thought Reasoning in 3D Scenes [26.9] 本稿では,3次元シーンにおけるグラウンドド質問応答のための新しい枠組みを提示することによって,そのギャップを埋める。
まず,3次元シーン(SCENECOT)において,複雑な推論タスクをシンプルかつ管理可能な問題に分解する。
私たちの知る限りでは、これはCoT推論の3Dシーン理解への最初の成功例であり、ステップバイステップのヒューマンライクな推論を可能にします。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:24:30 GMT)
Language Models are Injective and Hence Invertible [26.9] 非線型活性化や正規化のようなトランスフォーマー成分は本質的に非単射である。
数学的には、離散的な入力シーケンスを対応する連続表現のシーケンスにマッピングするトランスフォーマー言語モデルがインジェクティブであることが証明される。
隠れアクティベーションから正確な入力テキストを有効かつ効率的に再構築する最初のアルゴリズムであるSipItを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:44:49 GMT)
Learning Boltzmann Generators via Constrained Mass Transport [26.7] 本稿では,KLの発散と連続ステップ間のエントロピー減衰の制約下で中間分布を生成する変分フレームワークであるConstrained Mass Transport (CMT)を紹介する。
CMTは、常に最先端の変分法を超越し、モード崩壊を避けつつ、2.5倍以上の有効試料サイズを達成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:34:01 GMT)
Uncertain Knowledge Graph Completion via Semi-Supervised Confidence Distribution Learning [26.7] 未知知識グラフ(UKG)のための半教師付き信頼分布学習法(ssCDL)を提案する。
ssCDLは、ラベル付きデータおよびラベルなしデータに擬似ラベル付きでリレーショナル学習によってUKG埋め込みを反復的に学習する。
2つのUKGデータセットの実験では、ssCDLは異なる評価基準で常に最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:18:25 GMT)
Mitigating Prior Errors in Causal Structure Learning: A Resilient Approach via Bayesian Networks [26.6] 因果構造学習(英: Causal Structure Learning, CSL)は、変数間の因果関係を符号化する手法である。
従来の知識に基づく現在の手法では、事前の誤りに対する耐性が制限されている。
我々は,CSLのエッジレベルの事前エラーに耐性を持つ戦略を提案し,人間の介入を最小限に抑える。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:05:02 GMT)
Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization [26.6] DecisionFocused by Supervised Learningは、ロバストなポートフォリオ最適化のためのフレームワークである。
DSLはDeep Ensembleメソッドを使用し、ポートフォリオ割り当てのばらつきを大幅に低減します。
アンサンブルサイズが大きくなると、中央値のリターンが向上し、リスク調整性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:53:27 GMT)
Joint Hierarchical Representation Learning of Samples and Features via Informed Tree-Wasserstein Distance [26.6] 本稿では,Tree-Wasserstein Distance (TWD) を用いて,サンプルと特徴の階層的表現を学習するための教師なし手法を提案する。
本手法は2つのデータモードを交互に構成する。まず1つのモードのツリーを構築し、次にそのツリーに基づいて他のモードのTWDを計算し、最終的にTWDを用いて第2のモードのツリーを構築する。
本稿では,提案手法をハイパーボリックグラフ畳み込みネットワークに前処理として組み込むことができ,リンク予測やノード分類タスクの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:15:19 GMT)
Program Synthesis via Test-Time Transduction [26.3] 本稿では,プログラム合成タスクの新たな定式化であるトランスダクティブプログラム合成を紹介し,合成中のテスト入力を明示的に活用する。
提案手法は,Playgol,MBPP+,1D-ARC,MiniGrid上のプログラム的世界モデリングの4つのベンチマークで評価する。
提案手法は,プログラムの精度と効率性の両方において,プログラム合成を大幅に改善することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:02:56 GMT)
Training on Plausible Counterfactuals Removes Spurious Correlations [26.1] P-CFE (Plusible counterfactual explanations) は、入力を最小限に修正して分類器の決定を変更する摂動である。
本研究では,非摂動入力を分類するために,誘導的内向的ターゲットクラスをラベル付けしたp-CFEを用いて分類器を訓練できることを実証する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:35:10 GMT)
HauntAttack: When Attack Follows Reasoning as a Shadow [25.8] 本稿では,新規かつ汎用的なブラックボックス攻撃フレームワークHauntAttackを紹介する。
既存の質問における重要な推論条件を有害な指示で修正する。
攻撃成功率の平均は70%であり,最強のベースラインに対して最大12ポイントの絶対的改善を達成できた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:51:58 GMT)
Introducing Spotlight: A Novel Approach for Generating Captivating Key Information from Documents [25.8] 本稿では,文書の最も説得力のある側面を強調することで,簡潔で魅力的な物語を生成する,情報抽出のための新しいパラダイムであるSpotlightを紹介する。
我々の総合的な評価は、得られたモデルは、精度の高いキー要素を識別するだけでなく、可読性を高め、元のドキュメントのエンゲージメント値を高めることを実証している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:21:49 GMT)
Towards Greater Leverage: Scaling Laws for Efficient Mixture-of-Experts Language Models [25.6] 本稿では,高密度等価量上でのMoEモデルの計算優位性を定量化する指標として,レバレッジ効率(EL)を紹介する。
ELは、予測可能な電力法に従って、専門家のアクティベーション比と総計算予算によって駆動される。
我々はこれらの発見を統合スケーリング法則に統合し、その構成に基づいてMoEアーキテクチャのELを正確に予測する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:30:04 GMT)
FedDEAP: Adaptive Dual-Prompt Tuning for Multi-Domain Federated Learning [25.5] フェデレートラーニング(FL)は、複数のクライアントがローカルデータを公開せずに、機械学習モデルを協調的にトレーニングすることを可能にする。
CLIPのような大規模ビジョン言語モデルは、強力なゼロショット分類機能を示している。
マルチドメインシナリオにおけるCLIPの一般化を促進するための適応型フェデレーションプロンプトチューニングフレームワークであるFedDEAPを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:32:44 GMT)
GeoDiff: Geometry-Guided Diffusion for Metric Depth Estimation [25.5] 本稿では,立体視誘導を用いた拡散型単分子深度推定(DB-MDE)モデルの改良を目的とした,距離深度推定のための新しいフレームワークを提案する。
トレーニングフリーのソリューションは既存のDB-MDEフレームワークとシームレスに統合され、屋内、屋外、複雑な環境にまたがって一般化されます。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:47:36 GMT)
Visible Yet Unreadable: A Systematic Blind Spot of Vision Language Models Across Writing Systems [25.5] 先進視覚言語モデル(VLM)がこのレジリエンスを共有しているかどうかを検討する。
我々は、異なる筆記システムにまたがる2つの心理物理学的なベンチマークを構築した。
クリーンテキスト上での強いパフォーマンスにもかかわらず、現代のVLMはこれらの摂動の下で深刻な低下を見せている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:49:38 GMT)
Unfolding Generative Flows with Koopman Operators: Fast and Interpretable Sampling [25.4] 連続正規化フロー (Continuous Normalizing Flows, CNF) はエレガントな生成モデリングを実現する。
Rectified Flow や OT-CFM といった最近の手法は、直線化軌道によるサンプリングを加速するが、学習されたダイナミクスは非線形ブラックボックスのままである。
我々はクープマン理論を通した大域的線形化フローダイナミクスを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:27:13 GMT)
When LRP Diverges from Leave-One-Out in Transformers [25.2] 本稿では,最近のAttnLRPの進歩に使用される双線形伝搬規則が,実装不変公理に反することを示す。
また,CP-LRPを診断基準として再検討し,ソフトマックス層を経由した関連伝播の回避がLOOとの整合性を大幅に改善することを発見した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:06:05 GMT)
ProtoTS: Learning Hierarchical Prototypes for Explainable Time Series Forecasting [25.2] 本稿では,高精度かつ透明な意思決定を実現する新しい解釈可能な予測フレームワークであるProtoTSを提案する。
ProtoTSは、豊富な異種情報を保存する識別表現に基づいて、インスタンス-プロトタイプの類似性を計算する。
新たにリリースされたLOFデータセットを含む、複数の現実的なベンチマークの実験は、ProtoTSが予測精度の既存のメソッドを超えるだけでなく、専門家が選択可能な解釈を提供することを示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:37:10 GMT)
VideoVerse: How Far is Your T2V Generator from a World Model? [25.2] VideoVerseは、T2Vモデルが現実世界の複雑な時間的因果関係と世界的知識を理解できるかどうかを評価するベンチマークである。
VideoVerseは、815のイベントと733のバイナリ評価質問を含む300の慎重にキュレートされたプロンプトで構成されている。
我々は、VideoVerse上で、最先端のオープンソースおよびクローズドソースT2Vモデルの体系的評価を行う。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:28:13 GMT)
POLAR: Policy-based Layerwise Reinforcement Learning Method for Stealthy Backdoor Attacks in Federated Learning [25.1] フェデレートラーニング(FL)は、ローカルデータを公開せずに、複数のクライアントにわたる分散モデルトレーニングを可能にする。
初期のFLバックドア攻撃はモデル全体を改変したものの、最近の研究ではバックドアクリティカルな層の概念を探求している。
POLAR(Policy-based LAyerwise Reinforcement Learning)は,BC層選択問題を解決するためにRLを創造的に採用する最初のパイプラインである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:17:09 GMT)
Reinforcement Learning with Imperfect Transition Predictions: A Bellman-Jensen Approach [24.9] 伝統的な強化学習では、エージェントは1段階の遷移モデルでマルコフ決定プロセス(MDP)に基づいて決定を行う。
エネルギー管理や株式投資のような現実世界の多くのアプリケーションでは、エージェントは将来の状態の多段階予測にアクセスできる。
本稿では,オフラインベイズ値学習を軽量なオンライン適応からリアルタイム予測へ分離する2段階モデルベースRLアルゴリズムBOLAを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:47:08 GMT)
DelvePO: Direction-Guided Self-Evolving Framework for Flexible Prompt Optimization [24.7] 自己進化的な方法でプロンプトを最適化するタスク非依存のフレームワークを提案する。
私たちのフレームワークでは、異なる要因が様々なタスクに与える影響を調べるために、プロンプトを異なるコンポーネントに分離します。
DelvePOは、同じ実験環境下で、従来のSOTAメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:28:53 GMT)
Increasing the Utility of Synthetic Images through Chamfer Guidance [24.6] Chamfer Guidanceは、合成データの質と多様性を特徴付けるトレーニング不要なガイダンスアプローチである。
提案手法は,2枚以上の実画像を用いて,最先端の撮影性能を実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:14:25 GMT)
Online SFT for LLM Reasoning: Surprising Effectiveness of Self-Tuning without Rewards [24.4] LLM推論のための自己ヘルプ型オンライン教師付き微調整(OSFT)パラダイムを提案する。
OSFTは、LLM推論のための非常に効率的なトレーニング戦略である。
我々はOSFTがより複雑で報酬ベースのトレーニングパラダイムに代わる効率的で有望な代替手段を提供すると考えている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:15:56 GMT)
Can Large Language Models Adequately Perform Symbolic Reasoning Over Time Series? [24.1] 実世界の時系列のシンボリック推論を評価するためのベンチマークであるSymbolBenchを紹介する。
以前の取り組みとは異なり、SymbolBenchは様々な複雑さを持つ様々な記号形式にまたがっている。
本稿では,大規模言語モデルと遺伝的プログラミングを統合し,閉ループシンボリック推論システムを構築する統一フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:47:20 GMT)
MTraining: Distributed Dynamic Sparse Attention for Efficient Ultra-Long Context Training [23.9] MTrainingは、超長期のコンテキストを持つ大規模言語モデルをトレーニングするための分散方法論である。
MTrainingは動的スパーストレーニングパターン、バランスの取れたスパースリングアテンション、階層的なスパースリングアテンションを統合している。
MTrainingは、モデルの精度を維持しながら、最大で6倍のトレーニングスループットを達成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:25:32 GMT)
Modulated symmetries from generalized Lieb-Schultz-Mattis anomalies [23.8] 一般化LSM型異常の存在下では,通常の対称性から空間変調対称性が出現することが示唆された。
この結果から, LSM制約と空間変調対称性を次元にわたって結合する統一的非摂動的枠組みが得られた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:49:19 GMT)
How Transformers Learn In-Context Recall Tasks? Optimality, Training Dynamics and Generalization [23.8] コンテクスト内リコールタスクで訓練された変換器の近似能力,収束速度,収束挙動について検討した。
トレーニングされたトランスフォーマーは,分布外分布の一般化,すなわち人口分布外のサンプルへの一般化を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:34:30 GMT)
Fostering the Ecosystem of AI for Social Impact Requires Expanding and Strengthening Evaluation Standards [23.6] このことは、より広範な社会影響研究エコシステムの持続性を損なう研究者のインセンティブをもたらすと我々は主張する。
私たちの立場では、研究者とレビュアーは、社会的影響のための機械学習を同時に導入する必要がある。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:51:03 GMT)
VLA-Cache: Efficient Vision-Language-Action Manipulation via Adaptive Token Caching [23.5] VLA(Vision-Language-Action)モデルは、視覚知覚と言語命令から直接のアクション生成を可能にする強力なマルチモーダル推論能力を示している。
本稿では,フレーム間の静的な視覚トークンを適応的にキャッシュ・再利用することにより,計算オーバーヘッドを低減する訓練不要な推論高速化手法であるVLA-Cacheを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:33:29 GMT)
Towards Fast LLM Fine-tuning through Zeroth-Order Optimization with Projected Gradient-Aligned Perturbations [23.4] ゼロ階数最適化(ZO)を用いた細調整大型言語モデル(LLM)が,従来の勾配法に代わる有望な代替手段として登場した。
既存のZO法は勾配推定のばらつきに悩まされ、大規模なモデルでは収束が遅く、最適以下の性能が低下する。
本稿では,P-GAPを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:19:11 GMT)
The $\varphi$ Curve: The Shape of Generalization through the Lens of Norm-based Capacity Control [23.3] 我々は,ノルムに基づくキャパシティ測定について検討し,ランダムな特徴量に基づく推定器について検討する。
推定器のノルムがどのように集中し、どのように関連するテストエラーを管理するかを正確に評価する。
これは、より古典的なU字型の振る舞いが、サイズよりもモデルノルムに基づく適切なキャパシティ測度を考慮して復元されることを確認する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:49:44 GMT)
Graph Neural Networks for Road Safety Modeling: Datasets and Evaluations for Accident Analysis [23.1] 本稿では,米国各州の公式報告から,大規模交通事故記録のデータセットを構築した。
この新たなデータセットを用いて,道路ネットワーク上で発生した事故を予測するための既存のディープラーニング手法を評価する。
主な発見は、GraphSAGEのようなグラフニューラルネットワークが、道路上の事故数を22%未満の絶対誤差で正確に予測できることです。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:41:12 GMT)
Fairshare Data Pricing via Data Valuation for Large Language Models [23.0] 本稿では,大規模言語モデル(LLM)データ市場に関する理論的枠組みを紹介する。
我々は、悪用的な価格が高品質の売り手を市場から追い出す方法を示している。
次に、データバリュエーションに基づく価格設定メカニズムであるfairshareを紹介します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:02:31 GMT)
Flow-SLM: Joint Learning of Linguistic and Acoustic Information for Spoken Language Modeling [22.9] テキストレス音声言語モデル(英語: Textless Speech Language Model、SLM)は、テキストの監督に依存しない音声の生成モデルである。
本稿では,意味トークンと音響フレームの連続実数値表現を生成することで,言語情報と音響情報を共同でモデル化することを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:00:51 GMT)
CausalRAG: Integrating Causal Graphs into Retrieval-Augmented Generation [22.6] CausalRAGは因果グラフを検索プロセスに組み込む新しいフレームワークである。
因果関係の構築と追跡により、CausalRAGは文脈連続性を保ち、検索精度を向上させる。
本研究は,因果推論における接地探索が,知識集約型タスクに有望なアプローチをもたらすことを示唆している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:10:49 GMT)
A Generalized Bisimulation Metric of State Similarity between Markov Decision Processes: From Theoretical Propositions to Applications [22.5] Bisimulation metric (BSM) はマルコフ決定過程(MDP)における状態類似性を計算する強力なツールである。
本研究では,2組のMDP間での一般化バイシミュレート(GBSM)を正式に確立する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:00:54 GMT)
Pose-free 3D Gaussian splatting via shape-ray estimation [22.4] ポーズフリーでフィードフォワードのガウススプレイティングフレームワークであるSHAREを紹介する。
明示的な3D変換に頼る代わりに、SHAREはポーズ対応の標準ボリューム表現を構築する。
実世界の多様なデータセットに対する実験により,本手法が堅牢な性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:48:43 GMT)
Towards Faithful and Controllable Personalization via Critique-Post-Edit Reinforcement Learning [22.3] より忠実でコントロール可能なパーソナライゼーションを実現する,堅牢な強化学習フレームワークであるCristique-Post-Editを提案する。
本フレームワークは,(1)報奨ハッキングに抵抗する多次元スコアとテキスト批評を提供するパーソナライズドジェネレーティブ・リワード・モデル(GRM)と,(2)より標的的で効率的な学習のためのこれらの批判に基づいて,ポリシーモデルが自身の出力を更新する批評家・ポスト編集機構の2つの重要なコンポーネントを統合する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:40:03 GMT)
SentinelNet: Safeguarding Multi-Agent Collaboration Through Credit-Based Dynamic Threat Detection [22.2] 大規模言語モデル(LLM)を用いたマルチエージェントシステム(MAS)の信頼性と意思決定能力に悪質なエージェントが重大な脅威をもたらす
マルチエージェントコラボレーションにおいて,悪意ある動作を積極的に検出・緩和する,最初の分散化フレームワークであるSentinelNetを提案する。
MASベンチマークの実験では、SentinelNetは2回の討論ラウンドで100%近く、悪意のあるエージェントのほぼ完全な検出を実現し、漏洩したベースラインからシステム精度の95%を回復している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:58:13 GMT)
Discrete Neural Flow Samplers with Locally Equivariant Transformer [22.2] 離散サンプリングのためのトレーニング可能な,効率的なフレームワークである離散ニューラルネットワークサンプリング(DNFS)を提案する。
DNFS はコルモゴロフ方程式を満たすような連続時間マルコフ連鎖の速度行列を学習する。
計算効率をさらに向上するため,我々は局所同値変換器を提案し,レート行列の新しいパラメータ化を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:57:10 GMT)
Hardness of Learning Regular Languages in the Next Symbol Prediction Setting [22.2] 我々は,次のシンボル予測設定における言語の学習可能性について検討する。
我々は、PAC学習分析に適するように設定を定式化する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:37:34 GMT)
Combining Distantly Supervised Models with In Context Learning for Monolingual and Cross-Lingual Relation Extraction [22.2] HYDRE-HYbrid Distantly Supervised Relation extract frameworkを提案する。
まず、訓練されたDSREモデルを使用して、与えられたテスト文の上位k候補関係を特定する。
そして、トレーニングデータから信頼性の高い文レベルの例を抽出する、新しい動的例証検索戦略を使用する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:55:19 GMT)
MetaBox-v2: A Unified Benchmark Platform for Meta-Black-Box Optimization [22.1] MetaBox-v2は4つの新機能を備えたマイルストーンアップグレードです。
単目的、多目的、マルチタスク最適化シナリオにまたがる18ドルの総合的なベンチマークスイート。
有意義な洞察は、実践者とその分野への新規者に対する徹底的かつ詳細な分析から導き出される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:45:36 GMT)
Adversarial Graph Fusion for Incomplete Multi-view Semi-supervised Learning with Tensorial Imputation [22.1] ビューの欠如は、グラフベースの多視点半教師あり学習において重要な課題である。
本稿では, AGF-TI と呼ばれる新しい不完全多視点半教師付き学習手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:12:32 GMT)
On AI Verification in Open RAN [22.0] 我々は,Open RANにおける深層強化学習(DRL)エージェントの動作を検証するために,解釈可能なモデルに基づく軽量な検証手法を提案する。
具体的には、Decision Tree(DT)ベースの検証器を使用して、実行時にほぼリアルタイムの一貫性チェックを実行します。
また、Open RANにおける信頼できるAIの採用を保証するための今後の課題についても概説する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:48:26 GMT)
Re-Activating Frozen Primitives for 3D Gaussian Splatting [22.0] 3D Gaussian Splatting (3D-GS) はリアルタイムなフォトリアリスティックなノベルビュー合成を実現するが、過度に再構成されたアーティファクトのために複雑なシーンと競合する。
本稿では,リアクティベーションの原理に基づく手法であるReAct-GSを紹介する。
本稿では,ReAct-GSがオーバーコンストラクションのアーティファクトを効果的に排除し,標準的な新規ビュー合成メトリクスの最先端性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:38:18 GMT)
GeoArena: An Open Platform for Benchmarking Large Vision-language Models on WorldWide Image Geolocalization [21.9] 画像のジオローカライゼーションは、地球上のどこでも撮影された画像の地理的位置を予測することを目的としている。
現在の評価手法には2つの大きな制限がある。
グローバルな画像位置決めタスク上でLVLMを評価するための,最初のオープンプラットフォームであるGeoArenaを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:43:14 GMT)
This EEG Looks Like These EEGs: Interpretable Interictal Epileptiform Discharge Detection With ProtoEEG-kNN [21.9] ProtoEEG-kNNは、単純なケースベース推論プロセスに従う本質的に解釈可能なモデルである。
我々は,IED検出における最先端の精度を実現するとともに,専門家が既存のアプローチよりも好む説明を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:58:34 GMT)
Finite Sample Identification of Partially Observed Bilinear Dynamical Systems [21.8] 部分的に観察された双線形力学系の実現を学習する問題を考察する。
入力出力サンプルの1つの軌道が与えられた場合、システムのマルコフ様パラメータを学習するための有限時間解析を提供する。
我々の分析は、学習精度とサンプルの複雑さに影響を与えるシステム理論量に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:46:47 GMT)
Crucible: Quantifying the Potential of Control Algorithms through LLM Agents [21.6] アルゴリズムを変換し、それらのチューニングポテンシャルを定量的に評価するための定式化メトリックを定義するエージェントであるCrucibleを紹介する。
我々は、古典的な制御タスクから複雑なコンピュータシステムまで、幅広いケーススタディにおいてCrucibleの有効性を実証し、実世界の展開においてその結果を検証した。
Crucibleは、アルゴリズム分析と設計のための新しい次元を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:25:26 GMT)
Deep Learning Framework Testing via Heuristic Guidance Based on Multiple Model Measurements [21.6] DLMMMは、複数のモデル計測をガイダンスに含める最初のディープラーニングフレームワークテスト手法である。
DLMMMはまず、モデルのバグ検出性能、演算子の組み合わせ変数、モデル実行時間を定量的に測定する。
そして、それらの相関に基づいてこれらの測定結果を融合してトレードオフを達成します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:18:07 GMT)
DePass: Unified Feature Attributing by Simple Decomposed Forward Pass [21.5] DePassは単一のフォワードパスに基づいた機能属性のための統一されたフレームワークである。
補助訓練を必要とせず、忠実できめ細かな属性を達成できる。
DePassが、解釈可能性における幅広いアプリケーションの基礎となるツールになることを願っています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:36:12 GMT)
Sub-optimality of the Separation Principle for Quadratic Control from Bilinear Observations [21.2] 最小2次コストで双線形観測から数値力学系を制御することの問題点を考察する。
この問題と標準線型二次ガウスフィルタ(LQG)との類似性にもかかわらず、どちらも二線型分離原理モデルではないことを示す。
複数の合成条件で実験を行った結果について述べる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:15:14 GMT)
A Systematic Literature Review on Large Language Models for Automated Program Repair [21.1] 研究者が現在の成果、課題、潜在的な機会を理解することは困難である。
この研究は、2020年から2025年までのAPRにおけるLarge Language Modelsの応用を要約する最初の体系的な文献レビューを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:50:28 GMT)
H3DE-Net: Efficient and Accurate 3D Landmark Detection in Medical Imaging [21.1] 3Dランドマーク検出は、医用画像解析において重要な課題である。
局所特徴抽出のためのCNNと軽量アテンション機構を組み合わせた新しいフレームワークを提案する。
H3DE-Netは、このような軽量な注意機構をCNNと統合した最初の3Dランドマーク検出モデルである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:10:46 GMT)
On Efficiency-Effectiveness Trade-off of Diffusion-based Recommenders [21.1] 本稿では,事前学習時にデノナイジング機能を円滑にすることで,一段階生成を実現する2段階フレームワークであるTA-Recを提案する。
また,嗜好ペアの類似性やタイムステップに基づいて,ユーザの嗜好を適応的に調整する適応的選好アライメント(APA)も導入する。
TA-Recの2段階の目的は、離散化エラーによって引き起こされるトレードオフを効果的に軽減し、拡散に基づくレコメンデータの効率性と有効性を高めることを証明する実験である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:23:18 GMT)
Improving Diffusion-based Inverse Algorithms under Few-Step Constraint via Learnable Linear Extrapolation [20.9] 拡散に基づく逆アルゴリズムは、様々な逆問題に対して顕著な性能を示してきたが、多くのデノナイジングステップに依存しているため、計算コストが高い。
本稿では,Learable Linear Extrapolation (LLE) を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:37:29 GMT)
Beyond the Explicit: A Bilingual Dataset for Dehumanization Detection in Social Media [20.8] デジタル非人間化は、計算言語学の分野で見過ごされている。
ドキュメントとスパンレベルで16,000のインスタンスをアノテートするために、クラウドワーカーと専門家を使用しています。
このデータセットは、機械学習モデルのトレーニングリソースと、将来の非人間化検出技術を評価するためのベンチマークの両方を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:35:30 GMT)
CovMatch: Cross-Covariance Guided Multimodal Dataset Distillation with Trainable Text Encoder [20.8] マルチモーダルデータセット蒸留は、視覚言語モデルの効率的なトレーニングを可能にする、画像とテキストのペアの小さなセットを合成することを目的としている。
実特徴と合成特徴の相互共分散を整合させるスケーラブルなデータセット蒸留フレームワークであるCovMatchを提案する。
CovMatchは、500組の合成ペアのみを使用して、検索精度が最大6.8%向上する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:36:25 GMT)
Bayesian Fully-Connected Tensor Network for Hyperspectral-Multispectral Image Fusion [20.6] ハイパースペクトル・マルチスペクトル画像融合のための完全接続ネットワーク(BFCTN)分解法を提案する。
BFCTNは、最先端の核融合精度と強靭性を達成するだけでなく、複雑な実世界のシナリオにも実用的な適用性を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:19:54 GMT)
AI-Enhanced Wi-Fi Sensing Through Single Transceiver Pair [20.6] Wi-Fiセンシングシステムは、最小の帯域消費とアンテナ数要件を維持しつつ、高精度な認識を実現する。
様々なAI駆動認識技術は、レーダー理論によって課される従来の解像度制限を超える能力を示している。
本研究では、ハードウェア制約下では、Wi-FiセンシングシステムにAIがもたらす性能向上は主に、事前情報と時間的相関の2つの側面から生じる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:31:24 GMT)
Near-optimal Prediction Error Estimation for Quantum Machine Learning Models [20.4] 量子機械学習(QML)モデルは、基礎となるデータセットへの限られたアクセスによって大きく影響を受ける可能性がある。
これまでの研究は、有限のトレーニングセットで訓練された任意のQMLモデルに対する一般化誤差境界の証明に重点を置いてきた。
有限のトレーニングセットでトレーニングすることで得られる最適QMLモデルに注目し,トレーニング可能なゲートの数とトレーニングセットのサイズを限定して,厳密な予測誤差を確立する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:22:05 GMT)
Facial Expression-based Parkinson's Disease Severity Diagnosis via Feature Fusion and Adaptive Class Balancing [19.8] 現在の表情に基づくアプローチは、しばしば単一のタイプの表現に依存し、誤診につながることがある。
既存の手法のほとんどは、PDの重症度を診断するのではなく、バイナリ分類(PD/非PD)に焦点を当てている。
本稿では,複数の表情特徴を注意型特徴融合により統合したPD重症度診断のための新しい表情ベース手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:16:53 GMT)
Physics-Informed Parametric Bandits for Beam Alignment in mmWave Communications [19.7] ミリ波通信では、ビームアライメントと追跡が重要な経路損失に対処するために重要である。
我々は,mmWaveチャネルのスパースマルチパス特性を利用する2つの物理インフォームドバンディットアルゴリズムである textitpretc と textitprgreedy を提案する。
提案アルゴリズムは,各経路のパラメータをブラックボックスとして扱い,サンプリングした過去の報酬に基づいて最適な推定値を維持する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:07:07 GMT)
EfficientNav: Towards On-Device Object-Goal Navigation with Navigation Map Caching and Retrieval [19.6] 大きな言語モデル(LLM)とオンライン構築されたナビゲーションマップを備えたエージェントは、ゼロショットでNavを実行することができる。
既存のエージェントはクラウド上の巨大なLLMに大きく依存しているが、直接小さなLLMに切り替える。
EfficientNavはGPT-4ベースのベースラインよりも11.1%向上したHM3Dベンチマークを実現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:52:44 GMT)
The Impact of Image Resolution on Biomedical Multimodal Large Language Models [19.5] MLLM(Multimodal large language model)は、バイオメディカルな画像解析を約束する言語である。
ほとんどが汎用データセットからの低解像度の画像のために設計されており、重要な情報損失のリスクがある。
バイオメディカル応用における画像分解能のMLLM性能への影響について検討する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:19:43 GMT)
Noise-Robustness Through Noise: A Framework combining Asymmetric LoRA with Poisoning MoE [19.2] ダウンストリームタスクに事前訓練された言語モデルを適用するための現在の微調整手法は、ノイズの多いデータからの干渉に影響を受けやすい。
非対称なロラ中毒専門家(LoPE)によるノイズロバスト適応手法を提案する。
LoPEは、低コストのノイズ注入によって、パフォーマンスとロバスト性を純粋に達成し、データクリーニングの必要性を完全に排除する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:03:08 GMT)
FeatureFool: Zero-Query Fooling of Video Models via Feature Map [19.1] ブラックボックスの敵攻撃は通常、モデルとの複数ラウンドの相互作用を必要とする。
ビデオ領域のアタックは、機能マップを直接活用して、クリーンなビデオ機能空間をシフトする。
ステルスでビデオドメイン、ゼロクエリのブラックボックス攻撃であるFeatureFoolを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:33:35 GMT)
FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization [19.1] 推論速度と精度のトレードオフを最適化する動的精度スイッチングフレームワークFlexQuantを提案する。
我々はFlexQuantが様々な言語タスクで1.3倍のエンドツーエンドのスピードアップを達成し、精度を損なうことを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:03:45 GMT)
LongInsightBench: A Comprehensive Benchmark for Evaluating Omni-Modal Models on Human-Centric Long-Video Understanding [19.0] textbfLongInsightBenchは、長いビデオを理解するモデルの能力を評価するために設計された最初のベンチマークである。
ベンチマークでは,textbfa, textbfb, textbfcの3つの重要な領域を抽出した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:16:53 GMT)
MSR-Align: Policy-Grounded Multimodal Alignment for Safety-Aware Reasoning in Vision-Language Models [18.8] VLM(Vision-Language Models)は、多モーダル推論タスクにおいて、チェーンオブ思考能力の向上を通じて、顕著な進歩を遂げている。
既存の安全アライメントアプローチは、マルチモーダル入力によって引き起こされる複雑でニュアンスな脅威に対処するには不十分である。
MSR-Alignは、視覚とテキストのモダリティの双方にわたって標準化された安全ポリシーよりも、きめ細かい、熟考的な推論をサポートしている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:37:17 GMT)
View Transformation Robustness for Multi-View 3D Object Reconstruction with Reconstruction Error-Guided View Selection [18.8] ビュートランスフォーメーション・ロバストネス(VTR)は,深層学習に基づく多視点3次元オブジェクト再構成モデルにおいて重要である。
本稿では,3次元予測の空間分布を考慮した再構成誤り誘導ビュー選択法を提案する。
実験により,提案手法は最先端の3D再構成法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:28:46 GMT)
Unifying and Enhancing Graph Transformers via a Hierarchical Mask Framework [18.7] 本稿では,モデルアーキテクチャとアテンションマスク構築の等価性を明らかにする統一階層型マスクフレームワークを提案する。
このフレームワークは、注意深く設計された注意マスクを通して多様なインタラクションをキャプチャすることで、一貫したモデリングパラダイムを実現する。
マルチレベルマスキングとデュアルアテンション計算を備えたM3Dphormerについて述べる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:22:32 GMT)
PlanU: Large Language Model Decision Making through Planning under Uncertainty [18.5] 大規模言語モデル(LLM)は、さまざまな意思決定タスクにまたがって研究されている。
LLMは、人間にとって比較的容易な不確実性の下で意思決定タスクに苦労することがある。
モンテカルロ木探索における不確実性を捉えるLLMベースのプランニング手法であるPlanUを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:17:50 GMT)
Can Large Language Models Master Complex Card Games? [18.4] 大規模言語モデル(LLM)は、様々なタスクにまたがって顕著な機能を示した。
高品質なデータを教師付き微調整することで,LLMが強力なゲームAIの性能にアプローチ可能であることを示す。
LLMは複雑なゲームをマスターする際の一般的な能力の低下を経験するが、この低下をある程度の一般的な命令データを統合することで軽減することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:19:05 GMT)
Beyond Single Images: Retrieval Self-Augmented Unsupervised Camouflaged Object Detection [18.4] RISEは、トレーニングデータセット全体を利用して、単一画像のための擬似ラベルを生成するパラダイムである。
アノテーションを使わずにトレーニング画像のみを使用することは、高品質なプロトタイプライブラリ構築において顕著な課題である、と認識することが重要である。
KNN検索の段階では,特徴マップにおけるアーティファクトの影響を軽減するために,マルチビューKNN検索を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:12:26 GMT)
NeuroAda: Activating Each Neuron's Potential for Parameter-Efficient Fine-Tuning [18.1] NeuroAdaは、高メモリ効率を維持しながらきめ細かなモデル微調整を可能にする新しいPEFT法である。
NeuroAdaは、トレーニング可能なパラメータをわずか$leq0.02%で実現し、メモリ使用量を最大60%削減できることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:24 GMT)
SoK: Taxonomy and Evaluation of Prompt Security in Large Language Models [17.9] 大規模言語モデル(LLM)は、様々な分野にまたがるサービスによって、現実世界のアプリケーションにとって急速に不可欠なものになっている。
特にジェイルブレイクのプロンプトによって、モデルのアライメントを回避し、有害なアウトプットを誘導できる。
定義、脅威モデル、評価基準は様々であり、体系的な進歩と公正な比較を妨げる。
我々の研究は断片的な研究を統一し、将来の研究のための厳格な基盤を提供し、高度展開に適した堅牢で信頼性の高いLCMの開発を支援します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:40:00 GMT)
Parent Lindbladians for Matrix Product Density Operators [17.8] 行列積密度演算子(MPDO)のための親リンドブラディアンを解析的に構築する。
親リンドブラディアン群は、ハミルトン群と区別する豊富な構造を持つ。
特に、リンドブラディアン項の非可換性と対応するMPDO RFPが非自明位相に属するという事実の間の興味深い関係を明らかにする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:33:44 GMT)
Med-2E3: A 2D-Enhanced 3D Medical Multimodal Large Language Model [17.7] デュアル3D-2Dエンコーダアーキテクチャを統合した3次元医療MLLMであるMed-2E3を提案する。
2次元特徴を効果的に集約するために,テキストガイド型インタースライス(TG-IS)スコアリングモジュールを設計する。
大規模でオープンソースの医療用マルチモーダルデータセットの実験は、TG-ISがタスク固有の注意分布を示すことを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:09:37 GMT)
KoSimpleQA: A Korean Factuality Benchmark with an Analysis of Reasoning LLMs [17.4] 大規模言語モデル(LLM)における事実性評価のベンチマークであるKoSimpleQAを提案する。
KoSimpleQAは、1000の短い事実を探す質問と明確な答えからなる、難解で簡単に評価できるように設計されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:37:51 GMT)
Automated urban waterlogging assessment and early warning through a mixture of foundation models [17.4] 都市防水は、世界の公共の安全とインフラにますます深刻な脅威をもたらす。
既存のモニタリングアプローチは手動によるレポートに大きく依存しており、タイムリーで包括的な評価を提供していない。
本稿では, 監視画像中の透かし領域を自動的に識別し, 構造化された評価レポートを生成する基盤モデル駆動型フレームワークであるUWAssessを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:59:30 GMT)
How Do LLMs Use Their Depth? [17.1] 大規模言語モデルは深度を均一に用いていないが,層レベルでの予測力学の詳細な理解はいまだに得られていない。
本稿では,LLMが内部的に計算を構成して予測を行う方法について説明する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:59:05 GMT)
"She's Like a Person but Better": Characterizing Companion-Assistant Dynamics in Human-AI Relationships [17.0] 我々はデジタル・コンパニオンを人間-AI関係の新たな形態として特徴づける。
デジタルコンパニオンのダイナミックスにおいて, 挑戦的な緊張状態が観察された。
これらのダイナミクスは、デジタルコンパニオンの設計に疑問を投げかける。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:29:57 GMT)
VisDiff: SDF-Guided Polygon Generation for Visibility Reconstruction and Recognition [17.0] 最近の研究は主に、明確に定義された特徴、近傍、または基礎となる距離のメトリクスを持つ構造を理解することに焦点を当てている。
現在の表現学習アプローチでは、適切に定義された特徴と距離のメトリクスなしで構造をキャプチャできない。
入力可視グラフからポリゴン$P$を生成する新しい拡散に基づくアプローチであるVisDiffを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:24:37 GMT)
Rebalancing with Calibrated Sub-classes (RCS): A Statistical Fusion-based Framework for Robust Imbalanced Classification across Modalities [17.0] Rebalancing with Calibrated Sub-classes (RCS)は、ロバストな不均衡な分類のための新しい分散キャリブレーションフレームワークである。
RCSはガウス成分の加重混合により、多数および中間クラスの分布から統計情報を融合する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:14:41 GMT)
Leveraging Association Rules for Better Predictions and Better Explanations [16.8] 我々は,データと知識を組み合わせた新しい分類手法を提案する。
このアプローチでは、データマイニングは関連ルールをデータから導き出すのに使用される。
これらのルールは、ツリーベースモデルの予測性能を高めるために利用されます。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:32:02 GMT)
A Rectification-Based Approach for Distilling Boosted Trees into Decision Trees [16.8] 本稿では,予測性能と解釈可能性の観点から許容可能な妥協点を提供するMLモデルを作成することを目的として,増木を決定木に蒸留する新しい手法を提案する。
提案手法は, モデルの再学習による蒸留手法と比較して, 興味深い結果をもたらすことを実証的に示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:14:04 GMT)
Neural 3D Object Reconstruction with Small-Scale Unmanned Aerial Vehicles [16.7] 小型無人航空機(UAV)は、屋内と難航地域を航行する大きな可能性を秘めている。
本稿では,100グラム以下のUAVを用いた静的物体の完全自律・高忠実な3次元走査を可能にするシステムアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:13:50 GMT)
BlockScan: Detecting Anomalies in Blockchain Transactions [16.7] BlockScanはブロックチェーントランザクションの異常検出用にカスタマイズされたTransformerである。
この研究は、ブロックチェーンデータ分析にTransformerベースのアプローチを適用するための新しいベンチマークを設定する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:26:59 GMT)
sNVMe-oF: Secure and Efficient Disaggregated Storage [16.7] sNVMe-oFは、分散ストレージプロトコルを拡張したストレージ管理システムである。
合成パターンとAIトレーニングのパフォーマンス劣化を2%以下に抑える方法を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:01:36 GMT)
Learning from Mistakes: Enhancing Harmful Meme Detection via Misjudgment Risk Patterns [16.7] 本論文では,潜在的な誤認リスクを積極的に軽減し,学習による有害なミーム検出を改善する新しいアプローチであるPatMDを紹介する。
私たちの中核となる考え方は、表面的なコンテンツレベルのマッチングを超えて、その代わりに、根底にある誤判断のリスクパターンを特定することです。
5つの有害な検出タスクにわたる6,626ミームのベンチマーク実験は、PatMDが最先端のベースラインより優れていることを示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:40:37 GMT)
Týr-the-Pruner: Structural Pruning LLMs via Global Sparsity Distribution Optimization [16.6] T'yr-the-Prunerは、効率的なエンドツーエンド検索ベースのグローバルな構造解析フレームワークである。
実効的な局所刈り取りと,スーパーネット構築を改善するための予測誤差蓄積手法を導入する。
以上の結果から,T'yr-the-Prunerは高密度モデルの性能の97%を保ちながら,最先端構造解析を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:39:35 GMT)
Context-aware Fairness Evaluation and Mitigation in LLMs [16.6] 大きな言語モデルは、しばしばその内部表現に埋め込まれた望ましくない振る舞いを示す。
プルーニングベースの手法は、特定の行動に責任があるニューロンを調整することでバイアスを減らす柔軟で透明な方法を提供する。
本研究では,文脈認識ニューロンの活性化を検知する動的で可逆的なプルーニングに基づくフレームワークを提案し,アダプティブマスキングを適用して生成時の影響を調節する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:13:17 GMT)
PRISMM-Bench: A Benchmark of Peer-Review Grounded Multimodal Inconsistencies [16.5] PRISMM-Benchは、科学論文において、実際のレビュアーがフラッグした不整合に基づいた最初のベンチマークである。
不整合同定、治療、ペアマッチングという3つのタスクを設計し、不整合の検出、修正、推論を行うモデルの能力を評価する。
我々は、大きなオープンウェイトモデル(GLM-4.5V 106B、InternVL3 78B)やプロプライエタリモデル(Gemini 2.5 Pro、GPT-5)を含む21のLMMをベンチマークした。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:52:54 GMT)
ScholaWrite: A Dataset of End-to-End Scholarly Writing Process [16.3] ScholaWriteは、エンドツーエンドの学術論文の最初のデータセットである。
Overleafでキーストロークを不当に記録するChromeエクステンションは、リアルでその場で書かれたデータの収集を可能にする。
データセットには5つのコンピュータサイエンスプリプリントからのLaベースの編集が含まれ、4ヶ月で62万近いテキスト変更をキャプチャする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:29:14 GMT)
Team Westwood Solution for MIDOG 2025 Challenge: An Ensemble-CNN-Based Approach For Mitosis Detection And Classification [16.2] 本報告では,ミトーシス・ドメイン・ジェネリゼーション(MIDOG)2025チャレンジにおいて,ミトーシス検出と非定型ミトーシス分類の解を提示する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:42:16 GMT)
Re:Member: Emotional Question Generation from Personal Memories [15.9] Re:Memberは、感情的に表現され、記憶と接する相互作用が、より魅力的な第二言語(L2)学習をいかにサポートするかを探求するシステムである。
Re:Memberは,ユーザの個人ビデオを作成し,ターゲット言語でスタイリングされた音声質問を生成することで,感情的リコールと会話のエンゲージメントを促進するように設計されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:14:15 GMT)
PEACE: Towards Efficient Project-Level Efficiency Optimization via Hybrid Code Editing [15.9] 大規模言語モデル(LLM)は、コード生成において重要な能力を示しているが、コード効率の最適化におけるその可能性はまだ未定である。
従来のLLMベースのコード効率最適化アプローチは、関数レベルの最適化と関数間の見落とし相互作用にのみ焦点をあてていた。
自動コード編集によるプロジェクトレベルのコード効率最適化のための新しいハイブリッドフレームワークであるPeaceを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:02:24 GMT)
MLMA: Towards Multilingual with Mamba Based Architectures [15.9] マルチ言語A(Multilingual Language Modeling with Mamba for ASR)を紹介する。
Mambaは、ASRのシーケンス処理のための効率的な状態空間アーキテクチャである。
AはTransformerベースのアーキテクチャと比較して競争力がある。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:44:16 GMT)
Heterogeneous Adversarial Play in Interactive Environments [15.7] Heterogeneous Adversarial Play (HAP) は、教師と学生の交流を最小限の最適化として形式化する対向的な自動カリキュラム学習フレームワークである。
本フレームワークは, 人工エージェントと人体の両方の学習効率を高めるカリキュラムを作成しながら, SOTAベースラインと性能の同等性を実現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:29:59 GMT)
Pay Attention to the Triggers: Constructing Backdoors That Survive Distillation [15.7] 従来のバックドアは学生モデルにはほとんど移行しない。
新しいバックドア技術であるT-MTBは、移動可能なバックドアの構築と研究を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:39:45 GMT)
Training Diverse Graph Experts for Ensembles: A Systematic Empirical Study [15.7] 本研究は,GNNアンサンブルのためのエキスパートレベルの多様化技術に関する最初の系統的研究である。
14のノード分類ベンチマークで20の多様化戦略を評価した。
総合評価では,各手法を専門家の多様性,相補性,アンサンブル性能の観点から検討した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:40:51 GMT)
Proactive Reasoning-with-Retrieval Framework for Medical Multimodal Large Language Models [15.5] 我々は,Med-RwR を用いた最初のマルチモーダル医療推論フレームワークを提案する。
Med-RwRは、推論中に観察された症状やドメイン固有の医療概念を問い合わせることで、外部知識を積極的に回収する。
様々な公開医療ベンチマークの評価は、Med-RwRのベースラインモデルに対する大幅な改善を示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:18:18 GMT)
Can Agents Fix Agent Issues? [15.5] LLMベースのエージェントシステムは、新しいソフトウェアパラダイムとして登場し、医学、ロボティクス、プログラミングといった様々な領域で広く採用されている。
これらのシステムを維持するには、バグが必然的に発生し、外部の要求に合うように継続的に進化するため、かなりの努力が必要です。
最近のソフトウェア工学(SE)エージェントは、従来のソフトウェアシステムにおける問題に対処することを約束しているが、エージェントシステムにおける現実の問題がどの程度効果的に解決できるかは不明だ。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:01:18 GMT)
Adamas: Hadamard Sparse Attention for Efficient Long-Context Inference [15.5] 我々は,長文推論用に設計された軽量かつ高精度なスパースアテンション機構であるAdamasを紹介する。
実験の結果、アダガスは64段階の予算しか持たず、128倍の性能で、従来のSOTA(State-of-the-art)の手法よりも最大8倍高い空間性をサポートすることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:44:47 GMT)
The Picard-Lagrange Framework for Higher-Order Langevin Monte Carlo [15.4] 一般の$K$th-order Langevinダイナミックスに基づく新しいサンプリングアルゴリズムを導入し,2次法および3次法を超えて拡張する。
滑らかで強い対数凹凸密度を持つ対象に対して、ワッサーシュタイン距離における次元依存収束を証明する。
これはそのようなクエリの複雑さを達成する最初のサンプリングアルゴリズムである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:04:58 GMT)
SOCIA: Joint Structure-Parameter Co-Optimization for Automated Simulator Construction [15.4] エージェントを用いたコンピュータインテリジェンスのためのシミュレーションオーケストレーションは,シミュレータ構築を共同構造-パラメータ共最適化として扱うフレームワークである。
機構に富んだ青写真を生成し、明示的な調整可能なパラメータを公開し、キャリブレーションスキーマをインスタンス化する。
私たちはすぐにコードをリリースします。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:39:58 GMT)
Every Camera Effect, Every Time, All at Once: 4D Gaussian Ray Tracing for Physics-based Camera Effect Data Generation [15.4] カメラエフェクトシミュレーションのための新しい2段階パイプラインである4Dガウス線追跡(4D-GRT)を提案する。
マルチビュービデオが与えられた4D-GRTは、まず動的シーンを再構成し、その後にレイトレーシングを適用して、制御可能で物理的に正確なカメラ効果を持つビデオを生成する。
室内環境における8つの合成動的シーンを4つのカメラ効果のベンチマークとして構築し、カメラ効果による生成映像の評価を行う。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:45:37 GMT)
Mono4DGS-HDR: High Dynamic Range 4D Gaussian Splatting from Alternating-exposure Monocular Videos [15.3] 被曝を交互に捉えたモノクロ低ダイナミックレンジ(LDR)ビデオから、レンダリング可能な4Dハイダイナミックレンジ(LDR)シーンを再構成する最初のシステムであるMono4DGS-を紹介する。
ガウススプラッティングに基づく2段階最適化手法を用いた統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:14:33 GMT)
The Attribution Story of WhisperGate: An Academic Perspective [15.3] 本稿は、ロシア軍情報部(GRU)が実施し、ウクライナ政府を標的とした2022年1月のWhisperGateサイバー活動に対するケーススタディアプローチを適用した。
この研究は、脅威アクター識別子の詳細なレビューを提供し、主要なサイバーセキュリティベンダーが使用し、Microsoft、ESET、CrowdStrikeの研究者による進化した属性に焦点を当てている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:04:49 GMT)
Counterfactual Effect Decomposition in Multi-Agent Sequential Decision Making [15.2] 本稿では,各エージェントに寄与し,各エージェントに寄与し,各要因に寄与するスコアを変動させることにより,その効果を分解する新たな因果的説明式を提案する。
エージェントの作用の総合的反事実効果は, エージェントの作用を伝播する効果を計測する要素と, 状態遷移を伝播する効果に関連する要素の2つに分解できることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:25:15 GMT)
Disentanglement Beyond Static vs. Dynamic: A Benchmark and Evaluation Framework for Multi-Factor Sequential Representations [15.0] 6つの異なるデータセット間での複数要素の逐次的絡み合いを評価するための、最初の標準ベンチマークを導入する。
本研究では,潜伏次元を意味的因子と自動的に整列するポストホック潜伏探索段階を提案し,最先端の結果が得られるクープマンモデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:12:32 GMT)
Ontology-Enhanced Knowledge Graph Completion using Large Language Models [15.0] 大言語モデル(LLM)は知識グラフ補完(KGC)において広く採用されている。
OL-KGCを用いた拡張KGC法を提案する。
まず、神経知覚機構を利用して、構造情報をテキスト空間に効果的に埋め込む。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:05:04 GMT)
Repulsively Bound Hadrons in a $\mathbb{Z}_2$ Lattice Gauge Theory [14.9] 共振対生成項は、2つの中間子の安定ハドロン結合状態を形成する追加の反発結合機構をもたらすことを示す。
高エネルギー状態では、ハドロンは連続体に非共鳴的に結合することで安定化される。
我々の発見は、超伝導量子ビットから閉じ込められたイオンまで、現代の量子ハードウェアの実験的な観察に適している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:00:03 GMT)
Search Self-play: Pushing the Frontier of Agent Capability without Supervision [14.9] 本稿では,ディープサーチエージェントのためのセルフプレイトレーニングを提案する。
探索セルフプレイ(SSP)ゲームにおいて、提案者と解決者は、競争と協力の両面からエージェント能力を共同開発する。
SSPは、様々なベンチマークにおいて、いかなる監督も受けずに、検索エージェントのパフォーマンスを均一に向上させることができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:19:35 GMT)
Text or Pixels? It Takes Half: On the Token Efficiency of Visual Text Inputs in Multimodal LLMs [14.8] 視覚テキスト表現は,デコーダLLMの入力圧縮において,実用的で驚くほど効果的であることを示す。
我々は、長いテキスト入力を単一の画像としてレンダリングし、モデルに直接提供するというアイデアを生かしている。
これによりデコーダトークンの数が劇的に削減され、新しい形式の入力圧縮が提供される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:07:20 GMT)
In-Context Learning of Linear Dynamical Systems with Transformers: Approximation Bounds and Depth-Separation [14.7] 本稿では,雑音の線形力学系群を表す変圧器の文脈内学習能力の近似論的側面について検討する。
最初の理論的結果は、タスク間で一様に定義された$L2$-testing損失に対して、多層変圧器の近似誤差の上限を確立する。
2つ目の結果は、単層線形変圧器のクラスに対する近似誤差の非最小化下界を確立することである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:55:22 GMT)
Short Ticketing Detection Framework Analysis Report [14.7] 本研究では,A/B/C/D局分類システムを導入し,30の高リスク駅における不審なパターンの同定に成功した。
このフレームワークには4つの補完的アルゴリズムが採用されている。分離森林、局所アウトリーチ係数、ワンクラスSVM、マハラノビス距離である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:50:48 GMT)
Scaling Laws Meet Model Architecture: Toward Inference-Efficient LLMs [14.6] パラメータの数とトレーニングデータのサイズを拡大することは,大規模言語モデル(LLM)のパフォーマンス向上に有効な戦略であることが証明されている。
その重要性にもかかわらず、モデル精度と推論効率のトレードオフは未解明のままである。
我々は、アーキテクチャ情報でChinchillaフレームワークを増強する条件付きスケーリング法と、同時に推論効率と正確性を持つアーキテクチャを識別する検索フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:08:48 GMT)
Learning Collaborative Knowledge with Multimodal Representation for Polyp Re-Identification [14.6] 大腸内視鏡によるポリープ再同定は、大きなギャラリーの同じポリープと異なるカメラで撮影された異なるビューの画像とを一致させることを目的としている。
ImageNetデータセットでトレーニングされたCNNモデルを直接適用する従来のオブジェクトReIDの手法は、不満足な検索性能をもたらす。
本稿では,ポリプ再同定のためのDMCLという新しい多モーダル協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:48:46 GMT)
DeLoad: Demand-Driven Short-Video Preloading with Scalable Watch-Time Estimation [14.6] 短いビデオストリーミングはデジタルメディアにおいて支配的なパラダイムとなり、急激なスワイプ操作と多様なメディアコンテンツによって特徴づけられている。
主要な技術的課題は、進化するプレイリストから動的にタスクを選択し、優先順位付けする効果的なプリロード戦略を設計することである。
動的タスクサイズと実用的多次元時計時間推定手法を導入することで,これらの問題に対処する新しいプレロードフレームワークであるDeLoadを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:33:49 GMT)
Scalable, Explainable and Provably Robust Anomaly Detection with One-Step Flow Matching [14.5] Time-Conditioned Contraction Matching is a novel method for semi-supervised anomaly detection in tabular data。
これは、確率分布間の速度場を学習する最近の生成モデリングフレームワークであるフローマッチングにインスパイアされている。
ADBenchベンチマークの大規模な実験により、TCCMは検出精度と推論コストのバランスが良好であることが示されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:26:38 GMT)
SafeSearch: Do Not Trade Safety for Utility in LLM Search Agents [14.5] 大言語モデル(LLM)ベースの検索エージェントは、クエリを反復的に生成し、外部情報を検索し、オープンドメインの質問に答える。
研究者は主に実用性の改善に力を入れてきたが、その安全性の行動は未調査のままだ。
SafeSearchは、複数目的の強化学習アプローチで、最終的な出力安全性/ユーティリティ報酬と、新しいクエリレベルのシェーピング用語を結合する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:12:22 GMT)
Condition-Invariant fMRI Decoding of Speech Intelligibility with Deep State Space Model [14.4] 音声の知能性の神経基盤を明らかにすることは、計算神経科学とデジタル音声処理において重要である。
最近のニューロイメージング研究は、知性は単純な音響を超えた皮質活動を調節することを示した。
本稿では,fMRI信号から可視性を復号化するための新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:04:09 GMT)
Generation of Uncertainty-Aware Emergent Concepts in Factorized 3D Scene Graphs via Graph Neural Networks [14.3] 本稿では,SLAMバックエンド内の最適要素として,オンライン空間創発概念を学習ベースで生成する手法を提案する。
シミュレーションと実際の屋内シナリオの両方において,提案手法は複雑な概念検出を20.7%,5.3%,軌道推定を19.2%,地図再構成を12.3%,地図再構成を3.8%改善する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:52:53 GMT)
When Can We Trust LLMs in Mental Health? Large-Scale Benchmarks for Reliable LLM Evaluation [14.2] MentalBench-100kは、3つの実際のシナリオデータセットから1万のワンターン会話を統合する。
MentalBench-70kreframes の評価は,7つの属性に対する70,000のレーティングに対して,ハイパフォーマンスな4人の LLM 審査員と人間専門家を比較した。
分析の結果,LLM審査員による体系的なインフレーション,ガイダンスや情報性などの認知特性の信頼性,共感の精度の低下,安全性と妥当性の信頼性の低下が明らかになった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:21:21 GMT)
Can LLMs Reconcile Knowledge Conflicts in Counterfactual Reasoning [14.2] 大規模言語モデルには、そのパラメータに広範な世界的知識が含まれており、多くの知識集約的なタスクに対する印象的なパフォーマンスを実現している。
しかし、新しい設定で展開する場合、LLMはしばしば、パラメトリック知識を新しい情報や馴染みのない情報と統合しなければならない状況に遭遇する。
この研究は、LLMが文脈内知識とパラメトリック知識を対実的推論のレンズを通して組み合わせることができるかどうかを考察する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:15:37 GMT)
CoDial: Interpretable Task-Oriented Dialogue Systems Through Dialogue Flow Alignment [14.1] 本稿では,TODタスクスキーマをNVIDIAのColangなどのプログラム的なガードレールコードに変換する新しいフレームワークであるCoDialを紹介する。
CoDialは広く使用されているSTARデータセット上での最先端(SOTA)パフォーマンスを実現し、MultiWOZデータセットでのSOTAと同等である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:44:36 GMT)
Image augmentation with invertible networks in interactive satellite image change detection [14.1] 本稿では,能動学習に基づく対話型衛星画像変化検出アルゴリズムを提案する。
我々のフレームワークは、質問と回答のモデルを活用する反復的なプロセスを採用している。
私たちのフレームワークの主な貢献は、ディスプレイの拡張を可能にする新しい非可逆ネットワークにある。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:11:22 GMT)
Conformal Prediction for Signal Temporal Logic Inference [13.8] 信号時間論理(STL)推論は時系列データから人間の解釈可能な規則を抽出しようとする。
既存のメソッドには、推論されたルールに対する正式な信頼性保証がない。
STL推論のためのエンドツーエンドの差別化可能なCPフレームワークを導入し、信頼性と解釈性の両方を向上させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:50:01 GMT)
Uniformity Testing under User-Level Local Privacy [13.8] 本研究は,Emphuserレベルの局所差分プライバシに基づく配電試験に関する研究である。
私たちの主な焦点は、プライベートコイン、対称的な設定であり、ユーザーは共通のランダムなシードを共有する必要はない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:52:41 GMT)
Can We Validate Counterfactual Estimations in the Presence of General Network Interference? [13.5] 我々は、因果推論における推定と検証の両方に機械学習ツールを使うことを容易にするフレームワークを導入する。
新しい分布保存ネットワークブートストラップは、単一実験のデータから統計的に有意なサブポピュレーションを生成する。
ファクトファクトのクロスバリデーション手順は、モデル検証の原則を因果的設定のユニークな制約に適応させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:57:51 GMT)
International Students and Scams: At Risk Abroad [13.4] 米国の国際学生(こくさいがく、英語: International students, IntlS)は、主に高等教育において、アメリカ合衆国で留学する学生ビザを取得する外国人学生を指す。
IntlSが米国に到着すると、新しい国や文化への調整、リモートでの住宅確保、授業費や個人費用の調達など、いくつかの課題に直面している。
ビザの取り消しや新しいビザの停止、IntlSが標的にされ、オンライン詐欺に遭うリスクの複合化などの最近の出来事。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:16:28 GMT)
Chain-of-Conceptual-Thought: Eliciting the Agent to Deeply Think within the Response [13.4] CoT(Chain-of-Thought)は、数学、コーディング、推論タスクにおけるLLM能力を改善するために広く使われている。
我々は、LLMがまず概念をタグ付けし、次に詳細なコンテンツを生成する、Chein of Thought(CoCT)と呼ばれる別のプロンプトベースのパラダイムを提案する。
我々は、このパラダイムを、感情、戦略、トピックで構成された日常的および感情的なサポート会話で実験する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:08:21 GMT)
Incomplete Multi-view Clustering via Hierarchical Semantic Alignment and Cooperative Completion [13.4] 本稿では,階層的セマンティックアライメントと協調補完(HSACC)に基づく,新しい不完全なマルチビュークラスタリングフレームワークを提案する。
HSACCはデュアルレベルのセマンティック空間設計により、堅牢なクロスビュー融合を実現する。
実験の結果、HSACCは5つのベンチマークデータセットで最先端の手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:41:56 GMT)
Improving Metacognition and Uncertainty Communication in Language Models [13.4] 大規模言語モデル(LLM)は、意思決定の文脈でますます使われている。
LLMの自信はしばしば誤解され、正解と誤解の区別が不十分である。
教師付き微調整が不確実性を伝達するモデルの能力を向上させるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:46:32 GMT)
Real-World Usability of Vulnerability Proof-of-Concepts: A Comprehensive Study [13.4] 野生におけるPoCsの大規模研究を行い,その可利用性,完全性,有効性を評価した。
我々は13プラットフォームから470,921のPoCとそれらのレポートを収集し、現在最も広く公開されているPoCのコレクションを表現した。
我々の調査によると、CVEの脆弱性の78.9%はPoCを欠いていることが判明し、既存のPoCレポートでは、効果的な脆弱性の理解と再現に必要な必須コンポーネントの約30%が欠落している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:22:36 GMT)
GreenHyperSpectra: A multi-source hyperspectral dataset for global vegetation trait prediction [13.3] 実世界のクロスセンサーとクロスエコシステムのサンプルを含む事前学習データセットであるGreenHyperSpectraを提示する。
ラベル効率のよい多出力回帰モデルにグリーンHyperSpectraをうまく活用する。
我々の経験的分析は、特性予測のためのスペクトル表現の学習において大幅に改善されたことを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:59:20 GMT)
GPO: Learning from Critical Steps to Improve LLM Reasoning [13.3] textbfGuided textbfPivotal textbfOptimization (GPO)を導入する。
GPOは様々な最適化手法と統合して推論性能を向上させるための一般的な戦略であることを実証する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:20:10 GMT)
CtrlDiff: Boosting Large Diffusion Language Models with Dynamic Block Prediction and Controllable Generation [13.3] 拡散ベースの言語モデルは、強力な並列生成機能と固有の編集性のために、魅力的な代替手段として登場した。
ローカルセマンティクスに基づいて各生成ブロックのサイズを適応的に決定する動的かつ制御可能な半自動回帰フレームワークであるCtrlDiffを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:24:46 GMT)
Segment Policy Optimization: Effective Segment-Level Credit Assignment in RL for Large Language Models [13.2] 中間粒度におけるセグメントレベルの優位性推定を利用する新しいRLフレームワークであるセグメントポリシー最適化(SPO)を提案する。
SPOは,(1)フレキシブルセグメント分割,(2)正確なセグメント優位性推定,(3)セグメント優位性を用いたポリシー最適化の3つの新しい戦略を特徴とする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:05:48 GMT)
Disaster Management in the Era of Agentic AI Systems: A Vision for Collective Human-Machine Intelligence for Augmented Resilience [13.2] Disaster Copilotは、これらのシステム的課題を克服するために設計された、マルチエージェント人工知能システムのビジョンである。
提案アーキテクチャでは,予測リスク分析,状況認識,影響評価といった重要な領域を専門とする,多様なサブエージェントの調整に,中央オーケストレータを使用している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:36:28 GMT)
Grounding or Guessing? Visual Signals for Detecting Hallucinations in Sign Language Translation [13.0] 幻覚は視覚言語モデルの重大な欠陥であり、手話翻訳において特に重要である。
本稿では,デコーダの視覚情報利用量を定量化するトークンレベルの信頼性尺度を提案する。
以上の結果から、信頼性は幻覚率を予測し、データセットやアーキテクチャをまたいで一般化し、視覚的劣化の下で低下することが示された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:13:46 GMT)
Frame-Difference Guided Dynamic Region Perception for CLIP Adaptation in Text-Video Retrieval [13.0] FDA-CLIP (Frame Difference Alpha-CLIP) は、CLIPベースのテキスト・ビデオアライメントのための簡潔なトレーニングフレームワークである。
この手法では,Alpha-CLIPに入力された動的領域マスクをAlphaチャネルとして,フレーム差を用いて生成する。
フレーム差分誘導ビデオセマンティックエンコーディングは、効率と精度を効果的にバランスできることを示す実験である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:48:59 GMT)
Large Connectome Model: An fMRI Foundation Model of Brain Connectomes Empowered by Brain-Environment Interaction in Multitask Learning Landscape [12.9] 機能神経画像の基礎モデルは臨床応用を促進するために重要である。
我々は、豊かな環境変数と人口統計データを活用することで、マルチタスク学習としての脳モデルを構築した。
我々は、性予知、人間の行動認識、自閉症の早期診断、パーキンソン病、アルツハイマー病、統合失調症など、様々な応用に関する基礎モデルを評価した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:50:51 GMT)
MoveOD: Synthesizing Origin-Destination Commute Distribution from U.S. Census Data [12.8] われわれはMOVEODを紹介した。MOVEODはオープンソースのパイプラインで、米国のどの郡でも公共データを通勤ODフローに合成する。
ACSとLODESのデータとODデータセットを照合するために,制約付きサンプリング法と整数プログラミング法を用いる。
約15万回の合成旅行を数分で生成し、古典的および学習的な車載アルゴリズムのベンチマークスイートにフィードします。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:52:58 GMT)
CircuitSeer: Mining High-Quality Data by Probing Mathematical Reasoning Circuits in LLMs [12.8] 大規模言語モデル(LLM)は印象的な推論機能を示しているが、そのパフォーマンスは大規模な推論データセットに依存していることが多い。
本稿では,これらの重要な回路への影響を測定することによって,データの推論複雑性を定量化する新しいデータ選択手法であるCircuitSeerを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:47:00 GMT)
Text Takes Over: A Study of Modality Bias in Multimodal Intent Detection [12.8] 本研究では,多目的意図検出タスクにおいて,テキストのみを含むLarge Language Models (LLMs) と非LLMs (マルチモーダルモデル) の有効性について検討する。
この結果,テキストのみのLLMであるMistral-7Bは,MIntRec-1で約9%,MIntRec2.0データセットで約4%,最も競争力のあるマルチモーダルモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:28:06 GMT)
Robustness Assessment and Enhancement of Text Watermarking for Google's SynthID [12.5] SynGuardは、語彙レベルと意味レベルの両方に透かしを埋め込むハイブリッドフレームワークである。
SynthID-Text と比較して,SynGuard は F1 スコアの平均 11.1% で透かしの回復を改善する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:31:09 GMT)
RODS: Robust Optimization Inspired Diffusion Sampling for Detecting and Reducing Hallucination in Generative Models [12.4] RODSは、損失景観からの幾何学的手がかりを用いて、リスクの高いサンプリングステップを検出し、修正する新しい手法である。
RODSはよりスムーズなサンプリング軌道を強制し、摂動を適応的に調整し、再訓練せずに幻覚を減少させ、最小限の推論コストで追加する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:09:28 GMT)
Field-Trial Quantum Key Distribution with Qubit-Based Frame Synchronization [12.2] 量子鍵分散(Quantum Key Distribution, QKD)は、量子力学的原理を用いてセキュアな鍵交換を可能にする暗号技術である。
我々は,中国南京の大都市ファイバネットワーク上に展開する,最近提案されたqubitベースの分散フレーム同期方式を取り入れたQKDシステムを実演する。
12時間の連続運転の間、システムはQBERの低い平均量子ビットエラー率(QBER)を1.12/%維持し、18dBチャネル損失で26.6kbit/sのセキュアな鍵レートを実現した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:38:37 GMT)
MMAO-Bench: MultiModal All in One Benchmark Reveals Compositional Law between Uni-modal and Omni-modal in OmniModels [12.2] 我々は、MMAO-Bench(MultiModal All in One Benchmark)という、新しい、高品質で多様性の高いOmniモデルベンチマークを提案する。
このベンチマークは、1880年の人間のキュレートされたサンプル、44のタスクタイプ、そして革新的な多段階のオープンエンド質問タイプで構成されている。
実験結果から, クロスモーダルとユニモーダルの合成法則とオムニモーダル能力は, 弱いモデルに対するボトルネック効果として現れることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:14:40 GMT)
LegiScout: A Visual Tool for Understanding Complex Legislation [12.2] LegiScoutは、静的ポリシー図を動的、強制指向グラフに変換するインタラクティブな可視化システムである。
私たちのアプローチでは、ステークホルダー(政策立案者、アナリスト、一般大衆)がモダンな法律に固有の複雑さをナビゲートし、理解することができます。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:13:48 GMT)
Generalized Principal-Agent Problem with a Learning Agent [12.0] 主元が公約力を持たないという仮定の下で, 一般化された主元問題を繰り返し検討する。
エージェントが平均的学習アルゴリズム(regretではないが、swap-regretではない)を使用する場合、プリンシパルは$U*$よりもはるかに優れた処理を行うことができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:08:38 GMT)
Evaluating Large Language Models in detecting Secrets in Android Apps [12.0] モバイルアプリは、APIキー、トークン、クライアントIDなどの認証シークレットを組み込んでクラウドサービスと統合することが多い。
開発者はこれらの認証情報をAndroidアプリにハードコーディングし、リバースエンジニアリングを通じて抽出する。
我々は,Androidアプリのハードコードシークレットを検出するLLMベースのアプローチであるSecretLocを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:59:39 GMT)
Uncertainty Estimation by Flexible Evidential Deep Learning [11.9] 不確実性(UQ)は、高度なアプリケーションに機械学習モデルをデプロイするために不可欠である。
Evidential Deep Learning (EDL) は、クラス確率上のディリクレ分布の予測を通じて不確実性をモデル化することで効率を向上する。
クラス確率よりもフレキシブルなディリクレ分布(ディリクレ分布の一般化)を予測することでEDLを拡張する$mathcalF$-EDLを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:12:33 GMT)
ReVeal: Self-Evolving Code Agents via Reliable Self-Verification [11.9] 自己検証とツールベースの評価を通じてコード生成を進化させる強化学習フレームワークであるReVealを紹介する。
推論において、この強化された自己検証により、3つしかトレーニングされていないLiveCodeBenchでは、自己構築されたテストとツールフィードバックを使用して、20ターン以上のコードを継続的に進化させることができる。
これらの調査結果は、RLトレーニングとテストタイムスケーリングのためのスケーラブルなパラダイムとしてのReVealの約束を強調し、より堅牢で自律的なAIエージェントへの道を開いた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:49:25 GMT)
ImageGem: In-the-wild Generative Image Interaction Dataset for Generative Model Personalization [11.7] ImageGemは、きめ細かい個々の好みを理解する生成モデルを研究するためのデータセットである。
われわれのデータセットには57Kユーザによる実世界のインタラクションデータが含まれており、242KのカスタマイズされたLoRA、3Mのテキストプロンプト、5Mの生成された画像がまとめられている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:08:01 GMT)
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning [11.7] 本稿では,地球空間AIモデルとエージェント推論のファミリーである地球AIを紹介する。
Geminiのエージェントは複雑なマルチステップクエリを処理する。
現実の危機シナリオの新たなベンチマークでは、エージェントが批判的かつタイムリーな洞察を提供する能力を示しています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:05:47 GMT)
Investigating LLM Capabilities on Long Context Comprehension for Medical Question Answering [11.6] 本研究は,長期コンテキスト(LC)における臨床関連QAに対するLCMの理解能力について,初めて検討したものである。
包括的評価は、関連性、LLMモデル、タスクの定式化における各種機能およびデータセットに基づく、幅広いコンテンツ包摂的設定にまたがる。
本稿では,医学的LC理解に対するRAGの効果について検討し,一対多文書推論データセットの最適設定を明らかにするとともに,LCよりも優れたRAG戦略を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:50:24 GMT)
IMB: An Italian Medical Benchmark for Question Answering [11.6] イタリアの総合医療ベンチマークであるtextbfIMB-QA と textbfIMB-MCQA の2つの項目について検討した。
本稿では,医学フォーラムデータの明瞭さと一貫性を向上させるために,LLM(Large Language Models)をいかに活用できるかを,本来の意味と会話スタイルを維持しながら示す。
Retrieval Augmented Generation (RAG) とドメイン固有の微調整による実験により、医学的問題において、特定の適応戦略がより大きな汎用モデルより優れていることが判明した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:45:59 GMT)
LAND: Lung and Nodule Diffusion for 3D Chest CT Synthesis with Anatomical Guidance [11.4] この方法は1mmの等方分解能で256x256x256の画像を1つの中距離GPUで合成する。
コンディショニングマスクは肺と結節領域を規定し、出力された解剖学的特徴の正確な制御を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:20:22 GMT)
DR-VIDAL -- Doubly Robust Variational Information-theoretic Deep Adversarial Learning for Counterfactual Prediction and Treatment Effect Estimation on Real World Data [11.3] 因果深い学習は、個別化された治療効果を推定する伝統的な手法よりも改善された。
DR-VIDALは治療と結果の2つのジョイントモデルを組み合わせた新しい生成フレームワークである。
DR-VIDALは、合成および実世界のデータセットにおいて、他の生成的および生成的手法よりも優れた性能を達成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:06:08 GMT)
Local Guidance for Configuration-Based Multi-Agent Pathfinding [11.2] Guidanceは、リアルタイムサブフィンディング型マルチエージェントパスフィンディング(MAPF)手法の実証的性能を改善する新しい概念である。
本研究は,各エージェントの近傍に局所的なガイダンスを提供するという,別のアプローチを提案する。
計画立案者への情報提供は,適度な時間予算を超過することなく,ソリューションの品質を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:51:32 GMT)
Nondeterminism-Aware Optimistic Verification for Floating-Point Neural Networks [11.2] 不均一加速器上での浮動小数点実行のための非決定論的アウェア最適検証プロトコル
NAOをPyTorch互換ランタイムとして実装し、現在Horeskyテストネット上にデプロイされているコントラクト層を運用しています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:28:04 GMT)
ProSh: Probabilistic Shielding for Model-free Reinforcement Learning [11.1] 本稿では,コスト制約下での安全な強化学習のためのモデルフリーアルゴリズムであるProSh(Probabilistic Shielding via Risk Augmentation)を紹介する。
ProShは、学習したコスト批評家を使用してエージェントのポリシー分布にシールドを適用することで安全性を強制する。
環境が決定論的である場合には最適性が保たれることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:10:58 GMT)
TreeFedDG: Alleviating Global Drift in Federated Domain Generalization for Medical Image Segmentation [11.1] 医用画像のための新しいツリートポロジーフレームワーク、TreeFedDG(FedDG-GD)を提案する。
まず,木構造トポロジに基づく階層的パラメータアグリゲーション手法を設計し,大域的モデル方向のずれを抑制する。
次に,パラメータ差に基づくスタイル混合手法 (FedStyle) を提案する。
第3に、モデル配信中に段階的パーソナライズされた融合戦略を開発し、知識伝達とパーソナライズされた特徴のバランスを確保する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:38:05 GMT)
Secure and Efficient Access Control for Computer-Use Agents via Context Space [11.1] CSAgentは、コンピュータ利用エージェントのためのシステムレベルの静的ポリシーベースのアクセス制御フレームワークである。
我々はCSAgentの実装と評価を行い、99.36%以上の攻撃に対して防御に成功し、パフォーマンスオーバーヘッドは6.83%に過ぎなかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:56:12 GMT)
Time Reversal Symmetry for Efficient Robotic Manipulations in Deep Reinforcement Learning [11.1] 時間反転対称性(英: Time Reversal symmetric)は、ドアの開閉や閉鎖といったロボット工学のタスクでよく見られる時間対称性の一種である。
本稿では,時間反転対称性向上型深層強化学習(TR-DRL)を提案する。
RobosuiteベンチマークとMetaWorldベンチマークの大規模な実験は、TR-DRLがシングルタスクとマルチタスクの両方で有効であることを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:31:45 GMT)
Tree of Agents: Improving Long-Context Capabilities of Large Language Models through Multi-Perspective Reasoning [11.0] Tree of Agents(TOA)は、インプットを独立したエージェントによって処理されたチャンクに分割するマルチエージェント推論フレームワークである。
TOAは、エージェントが複数のパースペクティブな理解のために異なる推論順序を探索することを可能にする。
処理効率を向上させるため,プレフィックスハッシュキャッシュと適応型プルーニング戦略を取り入れた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:08:33 GMT)
scSplit: Bringing Severity Cognizance to Image Decomposition in Fluorescence Microscopy [11.0] 計算多重化技術は、複数の細胞構造を単一の画像で捉え、後に未混合にすることを可能にする。
与えられた入力に対する重ね合わせ画像の相対強度(混合比)が未定であることに注意する必要がある。
本研究では, 上記の混合比の重大さを認識した, scSplit と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:13:20 GMT)
DART: A Structured Dataset of Regulatory Drug Documents in Italian for Clinical NLP [10.9] DARTは、イタリア医薬品庁(AIFA)の製品特性に関するイタリアの要約の構造化コーパスである。
これは、指標、副作用反応、薬物と薬物の相互作用などの重要な薬理学領域に関する構造化情報を提供する。
臨床的に有意な相互作用を推測するために,このデータセットを利用したLSMベースの薬物相互作用チェッカーを実装した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:53:17 GMT)
Informed Learning for Estimating Drought Stress at Fine-Scale Resolution Enables Accurate Yield Prediction [10.8] 水は農業の生産性に不可欠であり、水不足と収量ポテンシャルの低下は意思決定において重要な要素である。
物理過程と整合する作物シミュレーションモデルは本質的な説明性を提供するが、しばしば性能が良くない。
作物収量モデリングのための機械学習モデルは強力でスケーラブルであるが、一般的にブラックボックスとして機能し、作物の成長の物理的原理に固執しない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:58:04 GMT)
SpecExit: Accelerating Large Reasoning Model via Speculative Exit [10.5] 我々は、将来のトークンとドラフトモデルから直接、オーバーヘッドを予測せずに早期終了シグナルを予測するフレームワークであるSpecExitを提案する。
提案手法は,平均生成長を66%削減し,エンドツーエンドのレイテンシで2.5倍の高速化を実現した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:44:33 GMT)
Fetch.ai: An Architecture for Modern Multi-Agent Systems [10.4] LLM駆動の知的システムの近年の急増は、基礎的マルチエージェントシステム(MAS)研究の数十年をほとんど見落としている。
Fetch.aiは、従来のMAS原則と現代的なAI機能の統合を促進することで、このギャップを埋めるべく設計された、産業力のあるプラットフォームである。
私たちは、アイデンティティ、ディスカバリ、トランザクションを検証するために、オンチェーンブロックチェーンサービスの分散基盤の上に構築された、新しい多層ソリューションを提示します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:53:56 GMT)
NEBULA: Do We Evaluate Vision-Language-Action Agents Correctly? [10.3] NEBULAは、単一腕操作のための統合されたエコシステムであり、診断と再現性の評価を可能にする。
NEBULAは、正確なスキル診断のための能力テストと堅牢性を測定する系統的なストレステストを組み合わせた、新しい二重軸評価プロトコルを備えている。
フラグメンテーションを削減し、データセット間のトレーニングと公正比較をサポートするため、標準化されたAPIと大規模な集約データセットが提供される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:32:26 GMT)
Unifying Inductive, Cross-Domain, and Multimodal Learning for Robust and Generalizable Recommendation [10.0] インダクティブモデリング、マルチモーダルガイダンス、ドメイン間転送を融合した統合フレームワークである presentec は、ユーザコンテキストと潜伏した嗜好をキャプチャする。
実験の結果、ecは12のベースラインを上回り、トレーニングデータに制限のあるドメインでは顕著な伸びを示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:26:33 GMT)
Pretraining a Shared Q-Network for Data-Efficient Offline Reinforcement Learning [10.0] オフライン強化学習(RL)は、静的データセットからポリシーを学習することを目的としている。
オフラインRLにおけるデータ効率を向上させるために,Qネットワークの特徴を初期化するためのプラグアンドプレイ事前学習手法を提案する。
本手法は,D4RLとExoRLのベンチマークを用いて,データ品質とデータ分布の異なるデータ効率のオフラインRLを大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:39:06 GMT)
Activating Visual Context and Commonsense Reasoning through Masked Prediction in VLMs [10.0] 本稿では,コンテキストとコモンセンスを用いた新しい微調整タスクであるMasked Predictionを導入する。
このタスクは、隠蔽された画像から意味的に意味のあるコンテンツを再構成することで、視覚的コンテキストと常識的推論を統合するようモデルに強制する。
また,先行サンプリングによる強化ファインチューニングというイノベーティブなトレーニング手法も導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:50:11 GMT)
Latent-Info and Low-Dimensional Learning for Human Mesh Recovery and Parallel Optimization [9.9] 既存の3Dヒューマンメッシュリカバリ手法は、潜伏した情報を十分に活用できないことが多い。
本稿では,潜伏情報と低次元学習に基づくメッシュ回復のための2段階ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:35:12 GMT)
ALHD: A Large-Scale and Multigenre Benchmark Dataset for Arabic LLM-Generated Text Detection [9.9] ALHDは、人間とLLM生成したテキストを区別するために明示的に設計された、最初の大規模包括的なアラビア語データセットである。
ALHDは3つのジャンル(ニュース、ソーシャルメディア、レビュー)にまたがっており、MSAと方言のアラビア語の両方をカバーしている。
厳格な事前処理、リッチアノテーション、標準化されたバランスの取れた分割を提供します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:12:50 GMT)
Exploring Cross-Modal Flows for Few-Shot Learning [9.9] 本稿では,モーダル間速度場を学習し,モデルに依存しない多段階調整手法を提案する。
結果は、FMAが様々なベンチマークやバックボーンでパフォーマンスを継続的に向上できることを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:40:11 GMT)
Expressive Reward Synthesis with the Runtime Monitoring Language [9.8] 強化学習(RL)における鍵となる課題は報酬(ミス)特定であり、不正確に定義された報酬関数は意図しない、潜在的に有害な行動をもたらす。
Reward Machinesは、報酬関数を有限状態オートマトンとして表現することでこの問題に対処し、構造化された非マルコフ報酬関数の指定を可能にする。
モニタリング言語(RML)を基盤として,新しい言語ベースのリワードマシンの開発を行っている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:04:30 GMT)
Probabilistic Modeling of Intentions in Socially Intelligent LLM Agents [9.8] マルチターン社会対話における大規模言語モデル(LLM)エージェントに対する確率論的意図モデリングフレームワークを提案する。
このフレームワークは、相手の潜伏した意図に対する信念の分布を、文脈的事前から、各発話後の確率推定を通じて動的に更新する。
SOTOPIA環境における予備実験は、一貫した改善を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:54:44 GMT)
Dimensionality Reduction for Remote Sensing Data Analysis: A Systematic Review of Methods and Applications [9.7] 次元性低減(DR)技術、特に特徴抽出はこれらの課題に対処する。
このレビューは、RSデータバリューチェーン全体にわたってDRを活用するハンドブックを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:45:28 GMT)
LLM-RG: Referential Grounding in Outdoor Scenarios using Large Language Models [9.6] 屋外の運転シーンにおける参照グラウンドリングは、大きなシーンの変動、多くの視覚的に類似したオブジェクト、動的要素のために困難である。
LLM-RGは,既製の視覚言語モデルと,記号的推論のための大規模言語モデルを組み合わせたハイブリッドパイプラインである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:32:35 GMT)
TeLLMe v2: An Efficient End-to-End Ternary LLM Prefill and Decode Accelerator with Table-Lookup Matmul on Edge FPGAs [9.6] TeLLMeは、低消費電力のエッジFPGAのためのテーブルルックアップベースの3次LLMアクセラレータである。
1.58ビットの重みと8ビットのアクティベーションを使用するプリフィルと自動回帰デコードの両方をサポートする。
5Wの電力予算の下では、TeLLMeは最大25tokens/sデコードスループットを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:20:02 GMT)
ChronoPlay: A Framework for Modeling Dual Dynamics and Authenticity in Game RAG Benchmarks [9.6] ChronoPlayは、ゲームRAGベンチマークの自動および連続生成のためのフレームワークである。
3つの異なるゲームでフレームワークをインスタンス化し、ゲーム領域で最初の動的RAGベンチマークを作成します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:28:13 GMT)
Stick-Breaking Embedded Topic Model with Continuous Optimal Transport for Online Analysis of Document Streams [9.4] SB-SETMは、埋め込みトピックモデル(ETM)を拡張して、連続した部分文書バッチ上に形成されたモデルをマージすることによってデータストリームを処理する革新的なモデルである。
数値実験により,SB-SETMはシミュレーションシナリオのベースラインよりも優れていた。
われわれは2022年から2023年の間、ロシアとウクライナの戦争に関するニュース記事の実際のコーパスでこれを広範囲にテストした。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:40:14 GMT)
CryptoGuard: Lightweight Hybrid Detection and Response to Host-based Cryptojackers in Linux Cloud Environments [9.4] CryptoGuardは、検出と修復戦略を組み合わせた軽量なハイブリッドソリューションである。
分類タスクを2段階のプロセスに分解し、深層学習モデルを利用して、高い精度で不審な活動を特定する。
2つのフェーズの平均F1スコアは96.12%と92.26%であり、真と偽の正の比率で最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:15:48 GMT)
SocializeChat: A GPT-Based AAC Tool Grounded in Personal Memories to Support Social Communication [9.3] SocializeChatはユーザの個人記憶記録を描画することで文提案を生成する。
システムは過去の経験を再利用し、異なる社会的文脈に対して適切な提案を行う。
ユーザスタディは、AACが支援する社会的相互作用の傾向と関連性を高める可能性を示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:59:38 GMT)
Diverse Influence Component Analysis: A Geometric Approach to Nonlinear Mixture Identifiability [9.2] 未知の非線形混合物からの潜在成分同定は、機械学習の基本的な課題である。
本稿では,混合関数ヤコビアンの凸幾何学を利用するフレームワークであるDiverse Influence Component Analysis (DICA)を紹介する。
本稿では,ジャコビアン体積最大化(J-VolMax)基準を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:36:38 GMT)
ViFusionTST: Deep Fusion of Time-Series Image Representations from Load Signals for Early Bed-Exit Prediction [9.1] ベッド関連の転倒は、病院や長期医療施設で大きな怪我の原因となっている。
本研究は, ベッド脚下に装着した低負荷セルを1個だけ使用して, 早期のベッド出口意図を予測できることを示す。
ラインプロットとテクスチャマップを並列に処理するデュアルストリームスウィントランスであるViFusionTSTを導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:04:22 GMT)
Enabling Fine-Grained Operating Points for Black-Box LLMs [9.1] Black-box Large Language Models (LLMs)は、他の機械学習手法の実用的な代替手段を提供する。
ブラックボックスLSMによる意思決定は、数値出力の基準が低いため、依然として好ましくないままである。
利用可能な操作点の数と多様性を大幅に向上させる効率的なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:22:16 GMT)
ViSE: A Systematic Approach to Vision-Only Street-View Extrapolation [9.0] 本報告では,ICCV 2025 の RealADSim Workshop NVS トラックで優勝したソリューションについて紹介する。
街路ビューの外挿における中核的な課題に対処するために,包括的4段階パイプラインを導入する。
RealADSim-NVSベンチマークにおいて,本手法は最終スコア0.441を達成し,全参加者の中で第1位となった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:50:20 GMT)
Feature-driven reinforcement learning for photovoltaic in continuous intraday trading [9.0] 日内取引における特徴駆動型強化学習(RL)手法を提案する。
RLは、データ駆動機能を状態に統合し、シーケンシャルな決定フレームワークで入札ポリシーを学ぶ。
RL は PV 生産者による日々のアクティブな参加のための,実用的で,データ効率が高く,かつ,運用的に展開可能な経路を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:29:02 GMT)
PokeeResearch: Effective Deep Research via Reinforcement Learning from AI Feedback and Robust Reasoning Scaffold [8.9] PokeeResearch-7Bは、統合強化学習フレームワークに基づいて構築された7Bパラメータディープリサーチエージェントである。
AIフィードバックフレームワークからのアノテーションのない強化学習によってトレーニングされている。
7Bスケールのディープリサーチエージェントの最先端性能を実現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:23:52 GMT)
Correct-Detect: Balancing Performance and Ambiguity Through the Lens of Coreference Resolution in LLMs [8.9] LLM(Large Language Models)は、人間の言語能力の反映を目的とした言語モデルである。
LLMは、コア参照の曖昧さとコア参照のあいまいさの検出の両方において、最小限のプロンプトで優れた性能を実現することができることを示す。
我々は、CORRECT-DETECTトレードオフを提示する:モデルには、機能とデプロイの両方があり、暗黙的にデプロイするが、これらの2つの能力のバランスを成功させることは、依然として明白である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:46:51 GMT)
EVER: Edge-Assisted Auto-Verification for Mobile MR-Aided Operation [8.8] Mixed Reality(MR)支援操作は、物理的な世界のデジタルオブジェクトをオーバーレイし、より没入的で直感的な操作プロセスを提供する。
Everは、モバイルMR支援操作のためのエッジアシスト自動検証システムである。
100ミリ秒以内の検証精度は90%を超える。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:12:34 GMT)
BO4Mob: Bayesian Optimization Benchmarks for High-Dimensional Urban Mobility Problem [8.8] 我々は高次元ベイズ最適化(BO)のための新しいベンチマークフレームワークである textbfBO4Mob を紹介する。
これは大都市道路網におけるオリジン・デスティネーション(OD)の走行需要推定の課題に起因している。
BO4Mobは、現実世界のSan Jose, CAロードネットワークに基づく5つのシナリオで構成され、入力次元は最大10100までスケールする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:22:28 GMT)
MetaCluster: Enabling Deep Compression of Kolmogorov-Arnold Network [8.8] Kolmogorov-Arnold Networks (KAN) はスカラーウェイトを基底係数のエッジベクトルに置き換える。
精度を犠牲にすることなく高圧縮性を実現するフレームワークであるMetaClusterを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:58:15 GMT)
Sync or Sink: Bounds on Algorithmic Collective Action with Noise and Multiple Groups [8.7] 協調ノイズと複数グループの存在下での集団行動の成功を保証します。
十分なレベルのノイズが集団行動の成功を減少させることがわかった。
この研究は、アルゴリズムシステムにおける戦略行動のニュアンスド・ダイナミクスを理解することの重要性を強調している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:26:19 GMT)
MENTOR: A Reinforcement Learning Framework for Model Enhancement via Teacher-Optimized Rewards in Small Models [8.6] 大規模言語モデル (LLM) のツール使用能力をより小さく、より効率的な小言語モデル (SLM) に拡張することは、実用上の重要な課題である。
教師付き微調整(英語版)(SFT)は、堅牢な方法論を学ぶのではなく、静的な教師軌跡のセットを模倣するようにモデルを訓練するので、一般化に苦しむ。
本稿では,強化学習と教師誘導蒸留を組み合わせたフレームワークであるMENTORを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:03:14 GMT)
E-Test: E'er-Improving Test Suites [8.6] E-Testは、大規模なシナリオからまだテストされていない実行を特定します。
テストスイートを強化する新しいテストケースを生成する。
E-Testは、テストされていない実行シナリオを最先端のアプローチよりも大幅に改善する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:23:33 GMT)
Adapting Medical Vision Foundation Models for Volumetric Medical Image Segmentation via Active Learning and Selective Semi-supervised Fine-tuning [8.5] 医療ビジョンファウンデーションモデル(Med-VFM)は医療画像の解釈能力に優れる。
適応的な下流評価、特にセグメンテーションにおける性能を改善するために、ターゲット領域からのサンプルをランダムに選択する。
本稿では,Med-VFMをターゲットドメインに効率よく適応させるために,ASFDA(Active Source-Free Domain Adaptation)法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:56:33 GMT)
Lightweight Baselines for Medical Abstract Classification: DistilBERT with Cross-Entropy as a Strong Default [8.5] 本研究は, 医療抽象分類法を軽量に評価し, 財政予算の制約下での最大性能の確立を図った。
CE, クラス重み付きCE, 同一トークン化, シーケンス長, スケジュールによる焦点損失の3つの目的を持つBERTベースとDistil BERTを微調整した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:44:14 GMT)
Hyperbolic Space Learning Method Leveraging Temporal Motion Priors for Human Mesh Recovery [8.5] 3次元メッシュは自然の階層構造を示す(胴体-リムズ-フィンガーのような)
既存のビデオベースの3Dヒューマンメッシュリカバリ手法は通常、ユークリッド空間でメッシュ機能を学ぶ。
ビデオから3次元メッシュを復元するための時間的動きを利用した双曲型空間学習法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:26:27 GMT)
Noise-corrected GRPO: From Noisy Rewards to Unbiased Gradients [8.4] この研究は、現代のRLHFを用いた教師あり学習からのラベルノイズ補正を橋渡しする。
理論的な洞察と、ノイズの多い現実世界の展開のための実用的なアルゴリズムの両方を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:14:49 GMT)
Dynamic object goal pushing with mobile manipulators through model-free constrained reinforcement learning [8.4] 我々は,未知の物体を所望の位置に移動させ,一連のプッシュ動作によって方向を判断する,移動マニピュレータのための学習型コントローラを開発した。
ロボットアームと移動体ベースモーションのコントローラは,制約付き強化学習(RL)の定式化を用いて訓練される。
学習されたポリシーは、シミュレーションで91.35%、挑戦的なシナリオでハードウェアで80%の成功率を達成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:27:47 GMT)
Neural Graduated Assignment for Maximum Common Edge Subgraphs [8.4] MCES問題は、生物学や化学などの分野において重要な課題である。
最大斜めおよびサーチベースアルゴリズムへの変換を含む従来のアプローチは、より大きなインスタンスを扱う場合のスケーラビリティの問題に悩まされている。
本稿では,これらの制約に対処する,シンプルでスケーラブルで教師なし学習に基づく手法であるNeural Graduated Assignment' (NGA)を紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:14:24 GMT)
When Old Meets New: Evaluating the Impact of Regression Tests on SWE Issue Resolution [8.3] TestPruneは,イシュートラッカレポートを活用して,バグ再現とパッチ検証の両面において,レグレッションテストを戦略的に再利用する,完全に自動化されたテクニックである。
TestPruneは任意のエージェントバグ修正パイプラインにプラグイン可能で、全体的なパフォーマンスが急速に向上する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:42:28 GMT)
Uncertainty Quantification for Evaluating Machine Translation Bias [8.2] 我々は、機械翻訳システムにおける性別バイアスを測定するために不確実性を用いる。
高い翻訳精度は不確実性を適切に示すことと相関せず, 脱バイアスが両症例に異なる影響を及ぼすことが判明した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:25:53 GMT)
NEXUS: Network Exploration for eXploiting Unsafe Sequences in Multi-Turn LLM Jailbreaks [8.2] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、ジェイルブレイク攻撃には弱いままである。
NEXUSは、最適化されたマルチターン攻撃の構築、精錬、実行のためのモジュラーフレームワークである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:41:58 GMT)
HarmNet: A Framework for Adaptive Multi-Turn Jailbreak Attacks on Large Language Models [8.2] 大規模言語モデル(LLM)は、マルチターンジェイルブレイク攻撃に対して脆弱なままである。
HarmNetは階層型セマンティックネットワークであるThoughtNetで構成されるモジュラーフレームワークである。
HarmNetは、ステルスで高精度な攻撃経路を明らかにするために、敵空間を体系的に探索し、洗練する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:28:20 GMT)
Joint Estimation of Piano Dynamics and Metrical Structure with a Multi-task Multi-Scale Network [8.2] オーディオ録音からピアノ力学を推定することは、計算音楽解析における根本的な課題である。
本稿では,共有潜在表現からの動的レベル,変化点,ビート,ダウンビートを共同で予測する,効率的なマルチタスクネットワークを提案する。
この研究はピアノの動的推定のための新しいベンチマークを設定し、強力でコンパクトなツールを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:32:13 GMT)
Measuring the Measures: Discriminative Capacity of Representational Similarity Metrics Across Model Families [8.0] モデルファミリを分離する能力に基づいて,表現類似度を評価する枠組みを提案する。
信号検出理論,シルエット係数,ROC-AUCの3つの相補的分離性尺度を用いる。
我々は、メトリクスがより厳密なアライメント制約を課すにつれて、分離性が体系的に増加することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:31:57 GMT)
Integrated representational signatures strengthen specificity in brains and models [8.0] similarity Network Fusion (SNF) は、もともとマルチオミクスデータ統合のために開発されたフレームワークである。
SNFは、単一のメートル法よりもかなりシャープな地域レベルとモデル家族レベルの分離を生成する。
SNF由来の類似度スコアを用いた皮質領域のクラスタリングは、より明確な階層構造を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:37:27 GMT)
Antislop: A Comprehensive Framework for Identifying and Eliminating Repetitive Patterns in Language Models [8.0] 過度に使われているパターンを検出し、排除するツールを提供するフレームワークであるAntislopを紹介します。
Antislop Samplerは、バックトラックを使用して、語彙を破壊することなく、推論時に不要な文字列を抑える。
FTPOは、GSM8K、MMLU、クリエイティブな書き込みタスクを含むクロスドメインのevalのパフォーマンスを維持したり改善したりしながら、90%のスロープ削減を実現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:42:07 GMT)
DNN Modularization via Activation-Driven Training [7.9] ディープニューラルネットワーク(Deep Neural Networks, DNN)は、技術的負債を負い、要求の進化に適応する際の大幅な再トレーニングコストに悩まされる傾向にある。
これまでの研究では、DNNモデルをトレーニング中とトレーニング後の両方にモジュールに分解する手法が提案されてきた。
アクティベーション駆動型モジュラートレーニング手法であるMODAを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 23:01:23 GMT)
On Biologically Plausible Learning in Continuous Time [7.9] 本研究では,生物学的に妥当な学習アルゴリズムを統一した連続時間ニューラルモデルについて検討する。
勾配降下法(SGD)、フィードバックアライメント法(FA)、直接フィードバックアライメント法(DFA)、コレン・ポラック法(KP)などの規則は、力学の制約として自然に現れる。
シミュレーションにより、これらの連続時間ネットワークは、時間的ミスマッチや統合ノイズの下でも、生物学的な時間スケールで安定して学習することが示される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:04:06 GMT)
Quantifying Security for Networked Control Systems: A Review [7.7] ネットワーク制御システム(NCS)は、電力網、輸送網、生産システムなどの重要なインフラに不可欠なものである。
研究は、NCSの攻撃に対する脆弱性を定量化するメトリクスの開発に重点を置いている。
脆弱性が定量化されると、システムのレジリエンスを高めるために緩和戦略が採用される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:55:43 GMT)
Efficient Tensor Completion Algorithms for Highly Oscillatory Operators [7.6] 本稿では,低複雑性テンソル補完アルゴリズムとその効率的な実装について述べる。
基礎となるテンソル分解は、入力行列とその蝶分解を位数$O(log n)$tensorに置き換えることに基づいている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:05:09 GMT)
DiffVLA++: Bridging Cognitive Reasoning and End-to-End Driving through Metric-Guided Alignment [7.5] VLA(Vision-Language-Action)モデルは、世界知識を活用して挑戦的なケースを扱うが、3D推論能力に制限があるため、物理的に不可能なアクションにつながる可能性がある。
DiffVLA++は、認知的推論とE2E計画を明確にブリッジする、拡張された自律運転フレームワークである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:10:27 GMT)
The Trust Paradox in LLM-Based Multi-Agent Systems: When Collaboration Becomes a Security Vulnerability [7.5] 我々はTrust-Vulnerability Paradox(TVP)を紹介し,実証的に検証する。
TVP: 調整を強化するためのエージェント間信頼の増大は、過剰な露出と過剰な認可のリスクを同時に拡大する。
本研究は,TVPを定式化し,統一されたメトリクスで再現可能なベースラインを確立するとともに,マルチエージェントシステム設計において,信頼性を第一級セキュリティ変数としてモデル化し,スケジュールする必要があることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:18:39 GMT)
Electric-field Quantum Sensing Exploiting a Photogenerated Charge-transfer Triplet State in a Molecular Semiconductor [7.4] 電場センシングは、通常弱いスピン電結合と限られた方向感度のため、難しいままである。
本稿では、有機分子ACRSAにおける光発生電荷移動(CT)スピン三重項状態を用いたコヒーレント電場センシングを実証する。
我々は,有機CT三重項を,原子-SOCを介さずに機能するEフィールドの化学的に多目的かつ方向性に敏感な量子センサとして位置づけた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:04:23 GMT)
Kolmogorov-Arnold Attention: Is Learnable Attention Better For Vision Transformers? [7.3] Kolmogorov-Arnoldネットワーク(KAN)は、学習可能なアクティベーション関数からなる驚くべきイノベーションである。
我々は,任意の方法で動作可能なViTに対して,Kolmogorov-Arnold Attention (KArAt) と呼ばれる学習可能な最初の注意を設計する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:01:00 GMT)
CaMiT: A Time-Aware Car Model Dataset for Classification and Generation [7.3] 自動車モデルの時間的進化を微粒化したデータセットであるCar Models in Time (CaMiT)を紹介した。
CaMiTには190台の車モデル(2007-2023)と5.1Mの未ラベルサンプル(2005-2023)の787Kラベルのサンプルが含まれており、教師付き学習と自己教師型学習の両方をサポートしている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:49:24 GMT)
Efficient Verified Machine Unlearning For Distillation [7.3] PURGE(Partitioned Unlearning with Retraining Guarantee for Ensembles)は、未学習と蒸留を統合した新しいフレームワークである。
理論的解析,未学習プロセスにおける重要なスピードアップの定量化,および複数のデータセットに対する実証的検証を行う。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:01:56 GMT)
Rebellious Student: A Complementary Learning Framework for Background Feature Enhancement in Hyperspectral Anomaly Detection [7.2] 補完的な特徴学習のための新しい「反逆的な学生」フレームワークを導入する。
模擬による従来の教師学生パラダイムとは違って,本手法は空間枝を意図的に訓練し,スペクトル教師から逸脱させる。
このフレームワークは、スペクトル背景と空間背景の両方を拡張し、パラメータフリーおよびトレーニング不要な異常検出を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:31:56 GMT)
Protein generation with embedding learning for motif diversification [7.1] タンパク質設計における根本的な課題は、構造多様性の生成とモチーフの生物学的機能保存のトレードオフである。
本稿では,標的モチーフの構造的特徴とエンコード配列の高次元埋め込みを学習するフレームワークであるPGEL(Protein Generation with Embedding Learning)を紹介する。
PGELは、典型的な設計基準を満たしながら、幾何学的制約を緩めることができ、より多様だが実行可能な構造へと繋がる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:43:36 GMT)
Approximation Rates of Shallow Neural Networks: Barron Spaces, Activation Functions and Optimality Analysis [7.1] これは、近似速度の次元への依存性と、バロン函数空間内で近似される函数の滑らかさに焦点をあてる。
我々は、バロン空間やソボレフ空間における関数の様々なノルムにおける最適近似率を確立し、次元性の呪いを確認する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:08:35 GMT)
When Agents go Astray: Course-Correcting SWE Agents with PRMs [7.0] 大規模言語モデル(LLM)エージェントは、複雑で多段階のソフトウェア工学(SWE)タスクにますますデプロイされる。
彼らの軌道はしばしば、冗長な探索、ループ、解が到達した後に終了する失敗など、コストのかかる非効率を含んでいる。
本稿では,SWE-PRM(Inference-time Process Reward Model, PRM)を導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:41:38 GMT)
Partial VOROS: A Cost-aware Performance Metric for Binary Classifiers with Precision and Capacity Constraints [7.0] 与えられた精度とキャパシティの制約を満たす分類器のサブセットは、ROC空間において実現可能な領域として表現できることを示す。
この領域を所望のコストパラメータの範囲で平均すると、ROC表面上の部分体積(または一部VOROS)が生じる。
死亡リスクを予測する実験では、病院のアラートアプリケーションにおいて、分類器の分類方法よりもコストを意識した指標の方が優れていることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:00:02 GMT)
StreamingTOM: Streaming Token Compression for Efficient Video Understanding [6.9] 既存のアプローチはLLM後のkv-cacheのみを規制し、コストのかかるLLM前のプリフィルは変わらない。
StreamingTOMは,LLM前とLLM後の両方のボトルネックに,予測可能なレイテンシで対処する,トレーニングフリーでプラグイン&プレイの2段階フレームワークです。
実験では, 従来のSOTAと比較して, 15.7 時間で kv-cache 圧縮, 12 時間で低ピークメモリ, 2 時間で速い TTFT 圧縮を実現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:39:41 GMT)
SO(3)-invariant PCA with application to molecular data [6.8] ナイーブなアプローチでは、データセットを各サンプルの多くの回転コピーで拡張し、不当な計算コストを発生させる必要がある。
明示的なデータ拡張を伴わずに全回転を暗黙的に説明できるSO(3)不変PCAの効率的で原則化されたフレームワークを開発する。
本手法を実世界の分子データセット上で検証し,その有効性を実証し,大規模・高次元再構成問題への新たな可能性を開く。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:23:17 GMT)
In-Context Learning of Stochastic Differential Equations with Foundation Inference Models [6.8] 微分方程式(SDE)は、ドリフト関数によって支配される決定論的流れが拡散関数によって予測されるランダムなゆらぎで重畳される力学系を記述する。
低次元SDEのドリフトと拡散関数の正確なテキスト内推定を行う事前学習型認識モデルであるFIM-SDE(Foundation Inference Model for SDEs)を導入する。
我々は、FIM-SDEが、多種多様な合成および実世界のプロセスにわたって頑健なコンテキスト内関数推定を実現することを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:08:49 GMT)
$\nabla$-SDF: Learning Euclidean Signed Distance Functions Online with Gradient-Augmented Octree Interpolation and Neural Residual [6.8] $nabla$-SDFは、勾配拡大オクツリーから得られた明示的な先行と暗黙の神経残基を組み合わせたハイブリッド手法である。
提案手法は,計算効率とメモリ効率を比較検討し,ニューラルネットワーク手法に匹敵する微分可能性,精度を向上する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:24:45 GMT)
TPP-SD: Accelerating Transformer Point Process Sampling with Speculative Decoding [6.8] 本稿では,Transformer temporal point process (TPP) サンプリングを高速化する新しい手法であるTPP-SDを提案する。
TPPのスライニングアルゴリズムと言語モデルの投機的復号化という構造的類似性を同定することにより,効率的なサンプリングフレームワークを開発する。
合成データと実データの両方の実験により,本手法は標準手法と同一の分布からサンプルを生成するが,2-6$times$ speedupで生成することを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:57:43 GMT)
Detection and Simulation of Urban Heat Islands Using a Fine-Tuned Geospatial Foundation Model for Microclimate Impact Prediction [6.7] グローバルな非構造化データに基づいてトレーニングされた地理空間基盤モデルは、有望な代替手段を提供する。
本研究では,都市熱パターンの実証的基礎的真理を確立した。
以上の結果から,基礎モデルが都市ヒートアイランド緩和戦略を評価する強力な手段であることを示唆した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:21:15 GMT)
Censorship Chokepoints: New Battlegrounds for Regional Surveillance, Censorship and Influence on the Internet [6.7] 現代の検閲は、チョークポイント(chokepoints)と呼ばれる新しいレンズによってよりよく理解できると我々は主張する。
現代の検閲は、チョークポイント(chokepoints)と呼ばれる新しいレンズによってよりよく理解できると我々は主張する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:14:10 GMT)
A Study on the Framework for Evaluating the Ethics and Trustworthiness of Generative AI [6.7] ChatGPTのような生成AIは、驚くべき革新的な可能性を示している。
これは同時に、偏見、有害性、著作権侵害、プライバシー侵害、幻覚などの倫理的・社会的懸念を提起する。
本研究は,社会的影響を反映した新たな人間中心基準の必要性を強調した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:10:29 GMT)
ε-Seg: Sparsely Supervised Semantic Segmentation of Microscopy Data [6.6] epsilon-Segは階層的変動オートエンコーダ(HVAE)に基づく方法である
中心領域マスキング、ラベルコントラスト学習(CL)、ガウス混合モデル(GMM)、クラスタリングフリーラベル予測を取り入れたepsilon-Segを紹介する。
以上の結果から,エプシロンセグは複雑な生体画像データに対して,厳密に制御されたセグメンテーションの結果を得ることが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:41:07 GMT)
Stable-by-Design Neural Network-Based LPV State-Space Models for System Identification [6.6] 本稿では,潜在状態と内部スケジューリング変数を同時に学習するニューラルネットワークに基づく状態空間モデルを提案する。
状態遷移行列はシュールのパラメータ化によって安定であることが保証される。
提案するNN-SSは, ベンチマーク非線形システム上で評価され, モデルが古典的部分空間同定手法と一貫して一致するか, 上回っていることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:25:54 GMT)
Embodied Navigation with Auxiliary Task of Action Description Prediction [6.6] 本稿では,ナビゲーションの強化学習に言語行動を記述するタスクを補助タスクとして組み込むことを提案する。
既往の研究では, 地下構造データがないため, 強化学習に記述法を組み込むことは困難であることが判明している。
各種ナビゲーションタスクにまたがるアプローチを評価し,高いナビゲーション性能を達成しつつ,動作を記述できることを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:12:22 GMT)
A Cross-Environment and Cross-Embodiment Path Planning Framework via a Conditional Diffusion Model [6.5] 本研究の目的は、未確認環境や新しいロボットマニピュレータに再訓練せずに一般化できる経路計画フレームワークを開発することである。
本稿では,Voxelized scene representationsに基づく共同空間軌跡を生成する拡散型計画モデルであるGADGETを提案する。
実験結果から,GADGETは球状障害物,ビンピッキング,シェルフ環境において衝突強度の低い高い高い成功率を達成できた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 23:30:14 GMT)
Verifiable Accuracy and Abstention Rewards in Curriculum RL to Alleviate Lost-in-Conversation [6.4] 大規模言語モデルはシングルターン命令に強い能力を示すが、LiC(Lost-in-Conversation)に苦しむ
Reinforcement Learning with Verifiable Rewards (RLVR) の現在の進歩に触発されて, 検証精度と回避Rewards (RLAAR) を用いたカリキュラム強化学習を提案する。
本手法では,信頼性を向上しつつ,対話の難易度を漸進的に向上させ,トレーニングの安定化を図る。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:32:26 GMT)
Distance-based measures and Epsilon-measures for measurement-based quantum resources [6.3] 量子資源理論は、量子資源を定量化するための構造化されエレガントな枠組みを提供する。
量子状態や測定値の集合が部分的にしか知られていない現実的なシナリオでは、従来のリソース測度はリソースの内容の取得に不足することが多い。
エプシロン測定は堅牢な代替手段であり、特に貴重である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:51:59 GMT)
Optimal quantum superresolution for full distance between incoherent optical sources in two dimensions [6.3] 量子超解像は、一対の非コヒーレントな点源の分離を推定する際に、無矛盾の精度を達成することができる。
本稿では,2次元イメージングシステムにおける任意の強度を持つ2つの不整点源間の全距離推定精度について検討する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:15:01 GMT)
Harnessing Test-time Adaptation for NLU tasks Involving Dialects of English [6.3] テスト時ドメイン適応(TTDA)は、ラベル付きデータセットを使わずに、ドメイン、タスク、ディストリビューションのモデルを一般化するのに役立つ優れた方法である。
本稿では,方言NLPにおける最も有名なTTDA手法であるSHOTについて検討する。
我々は、方言GLUEの異なる組み合わせでSHOTを微調整し評価し、ラベル付きデータセットが利用できない場合にSHOTが有効な技術であることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:20:33 GMT)
Safe But Not Sorry: Reducing Over-Conservatism in Safety Critics via Uncertainty-Aware Modulation [6.3] Uncertain Safety Critic (USC) は、不確実性を認識した修正と改善を批判訓練に統合する新しいアプローチである。
USCは、競争力やより高い報酬を維持しながら、安全違反を約40%削減する。
また、予測されるコスト勾配と真のコスト勾配の誤差を約83%削減し、安全性とパフォーマンスのトレードオフを突破する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:57:44 GMT)
Learning to Navigate Under Imperfect Perception: Conformalised Segmentation for Safe Reinforcement Learning [6.3] COPPOLは、コンフォメーション駆動の知覚から政治への学習手法である。
分散のない有限サンプル安全性保証をセマンティックセグメンテーションに統合する。
安全でない領域のほぼ完全な検出を実現し、ナビゲーション中に有害な違反を減らす。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:07:04 GMT)
AstroMMBench: A Benchmark for Evaluating Multimodal Large Language Models Capabilities in Astronomy [6.2] AstroMMBenchは、天文学的画像理解において、マルチモーダル大言語モデル(MLLM)を評価するための最初の包括的なベンチマークである。
AstroMMBenchは、6つの天体物理学のサブフィールドにわたる621の多重選択質問で構成され、品質と関連性について15のドメイン専門家によってキュレートされ、レビューされている。
結果、Ovis2-34Bは、強力なクローズドソースモデルと比較して高い総合精度(70.5%)を達成した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:29:47 GMT)
Multi-entropy from Linking in Chern-Simons Theory [6.2] 複数のトーラス境界を持つ3次元多様体上のユークリッド経路積分により構成された量子状態の多部絡み合い構造について検討する。
真のマルチエントロピーは、GHZ状態によって生成される三部体の絡み合いを忠実に定量化することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:32:14 GMT)
Decoding Dynamic Visual Experience from Calcium Imaging via Cell-Pattern-Aware SSL [6.1] 本稿では,ニューラルネットワークの不均一性を生かして事前学習を改善し,スケールのメリットを享受する,自己教師型プレトレーニング(POYO-SSL)の新たなアプローチを提案する。
特に、POYO-SSLでは、予測可能な(統計的に正則な)ニューロンのみを事前訓練し、単純な高次統計(歪と曲率)によって事前訓練した。
アレン・ブレイン・オブザーバトリー(Allen Brain Observatory)のデータセットでは、この戦略はオフスクラッチトレーニングよりも約12-13%の相対的なゲインを獲得し、モデルサイズで滑らかで単調なスケーリングを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:57:52 GMT)
Context-Aware Pseudo-Label Scoring for Zero-Shot Video Summarization [6.1] 本稿では,ルーリック誘導型擬似ラベルプロンプトフレームワークを提案する。
人間のアノテーションの小さなサブセットは、高信頼の擬似ラベルに変換される。
推論では、境界のシーンは彼ら自身の記述から記録される。
中間シーンには、進行と冗長性を評価するために、隣接するセグメントの短い要約が含まれます。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:06:29 GMT)
DualHash: A Stochastic Primal-Dual Algorithm with Theoretical Guarantee for Deep Hashing [6.0] ディープハッシュの根本的な課題は、コードの生成における量子化の離散性に起因する。
本稿では、厳密な境界を提供するDualHashと呼ばれる原始合成ハッシュアルゴリズムを提案する。
3つの画像検索データベースは、DualHashの優れた性能を示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:52:46 GMT)
LIME: Link-based user-item Interaction Modeling with decoupled xor attention for Efficient test time scaling [6.0] 計算複雑性を低減する新しいアーキテクチャである textbfLIME を導入する。
LIME は最先端の変圧器とほぼ同値であるが、大きな候補セットや長いシーケンス長に対して 10$times$ の推論速度を持つ。
主要なレコメンデーションプラットフォームでテストすると、LIMEは最小の推論コストを維持しながらユーザエンゲージメントを改善した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:53:17 GMT)
BondBERT: What we learn when assigning sentiment in the bond market [5.9] 債券市場は株式市場と比べてマクロ経済のニュースに異なる反応を示す。
FinBERTを含むほとんどの感情モデルは、主に一般的な金融または株式のニュースデータに基づいて訓練されている。
本稿では,ボンド固有ニュースを微調整したトランスフォーマーベース言語モデルである BondBERT を紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:18:03 GMT)
Calibrated Principal Component Regression [5.9] 主成分回帰(PCR)は、真の回帰ベクトルが保持主成分(PC)の外側の質量を持つとき、乱れバイアスを引き起こす
そこで我々は,PCサブスペースに先立って低分散を学習し,まず中心となるTikhonovステップを通じて,元の特徴空間のモデルを校正する校正主成分回帰(CPCR)を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:01:42 GMT)
Learning Peer Influence Probabilities with Linear Contextual Bandits [5.9] 文脈的線形バンディットの枠組みに基づく学習ピアインフルエンス確率について検討する。
本稿では,不確かさ最小化と推定誤差の間に根本的なトレードオフが生じ,達成可能な全てのレートペアを特徴付けるとともに,不確実性誘導探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:38:52 GMT)
SSD: Spatial-Semantic Head Decoupling for Efficient Autoregressive Image Generation [5.9] 自動回帰画像生成モデルのための新しいKVキャッシュ圧縮フレームワークを提案する。
実験の結果,提案手法はメモリ使用量の5$times$削減とスループットの6.6$times$高速化を実現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:17:37 GMT)
On Generalization and Distributional Update for Mimicking Observations with Adequate Exploration [5.8] 観察から学ぶ(LfO)は、専門家の行動にアクセスすることなく専門家の行動を再現する。
しかし、LfOのオンライントレーニングスキームを直接適用すると、サンプルの非効率性が悪化する。
本稿では,LfO問題に対する効率的かつ安定した解法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:03:30 GMT)
QuantEvolve: Automating Quantitative Strategy Discovery through Multi-Agent Evolutionary Framework [5.8] QuantEvolveは、品質最適化と仮説駆動型戦略生成を組み合わせた進化的フレームワークである。
市場体制の変化と個々の投資ニーズに適応する多様で洗練された戦略を生み出します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:22:16 GMT)
Channel-Aware Vector Quantization for Robust Semantic Communication on Discrete Channels [5.7] 本稿では,VQJSCCと呼ばれるジョイントソースチャネル符号化フレームワークにおいて,チャネル認識ベクトル量子化(CAVQ)アルゴリズムを提案する。
このフレームワークでは、セマンティックな特徴を離散化し、変調星座のシンボルに直接マッピングし、CAVQはチャネル遷移確率を量子化プロセスに統合する。
伝送ストリームをサブチャネルに分解することで、コードブック順序と変調順序のミスマッチを処理するためのマルチコードブックアライメント機構も導入されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:02:35 GMT)
An Automated Multi-modal Evaluation Framework for Mobile Intelligent Assistants Based on Large Language Models and Multi-Agent Collaboration [5.6] 本稿では,大規模言語モデルとマルチエージェント協調に基づく自動マルチモーダル評価フレームワークを提案する。
このフレームワークは、インタラクション評価エージェント、セマンティック検証エージェント、経験決定エージェントからなる3層エージェントアーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:26:59 GMT)
Anonymous Quantum Tokens with Classical Verification [5.5] 発行当局が追跡しているかどうかを検知できる単一用途量子マネーの構築を提案する。
ビル検証は古典的であり、そのため長期の量子メモリや量子通信を必要としない。
匿名のワンタイムパッドや投票など、資金以外の応用の可能性について議論する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:15:05 GMT)
RadDiagSeg-M: A Vision Language Model for Joint Diagnosis and Multi-Target Segmentation in Radiology [5.5] RadDiagSeg-Dは,異常検出,診断,マルチターゲットセグメンテーションを統合タスクに組み合わせたデータセットである。
次に,新しい視覚言語モデルRadDiagSeg-Mを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:28:13 GMT)
One-Pass Learning via Bridging Orthogonal Gradient Descent and Recursive Least-Squares [5.4] 本研究では,従来のデータポイントを再学習することなく,逐次到着するデータに対してモデルを訓練するワンパス学習の問題点について検討する。
我々は,従来のデータポイントの予測を最小限に変更しつつ,各データポイントに完全に適合するワンパス学習アルゴリズムOrthogonal Recursive Fitting (ORFit)を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:38:30 GMT)
DuoLens: A Framework for Robust Detection of Machine-Generated Multilingual Text and Code [5.4] 多言語テキストとソースコードを生成するLarge Language Models (LLMs) は、マシン生成コンテンツ検出器がドメイン全体にわたって正確かつ効率的であることの必須条件を増大させるだけである。
現在の検出器は、Fast DetectGPTやGPTZeroのようなゼロショット法を主に利用しており、高い計算コストまたは十分な精度が欠如している。
本稿では,エンコーダのみのSmall Language Models (SLM) の微調整,特にRoBERTAとCodeBERTaの事前学習モデルについて,ソースコードやその他の自然言語に関する特別なデータセットを用いて提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:17:00 GMT)
A Geometric Approach to Steerable Convolutions [5.3] この研究は、$d$次元のステアブル畳み込みニューラルネットワークの新しい、より直感的な導出を提供する。
我々はクレブシュ-ゴルダン分解と球面調和基底関数の出現について直観的に説明する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:10:48 GMT)
Med-VRAgent: A Framework for Medical Visual Reasoning-Enhanced Agents [5.1] 医療用ビジュアル推論エージェント(textbfMed-VRAgent)というフレームワークを提案する。
アプローチは視覚誘導と自己回帰のパラダイムとモンテカルロ木探索(MCTS)に基づいている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:56:23 GMT)
XGen-Q: An Explainable Domain-Adaptive LLM Framework with Retrieval-Augmented Generation for Software Security [5.1] ジェネレーティブAIと大規模言語モデル(LLM)は、コード理解において強力な能力を示しているが、サイバーセキュリティにおける使用は限られている。
我々は、Qwen-Coderアーキテクチャ上に構築され、100万以上のマルウェアサンプルからなる大規模コーパスで事前訓練されたドメイン適応型LLMであるXGen-Qを紹介する。
XGen-Qは、検索拡張世代(RAG)と組み合わせたマルチステージプロンプト戦略を使用して、信頼性の高いマルウェア識別と詳細な法医学的報告を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:35:38 GMT)
FlexiDataGen: An Adaptive LLM Framework for Dynamic Semantic Dataset Generation in Sensitive Domains [5.1] FlexiDataGenは適応型大規模言語モデル(LLM)フレームワークで、センシティブなドメインで動的セマンティックなセマンティックなデータセットを生成するために設計されている。
専門分野に合わせて、豊かでセマンティックな一貫性があり、言語的に多様なデータセットを自律的に合成する。
FlexiDataGenはデータ不足やアノテーションのボトルネックを効果的に軽減し、スケーラブルで正確な機械学習モデル開発を可能にします。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:07:49 GMT)
Large Language Models in Thematic Analysis: Prompt Engineering, Evaluation, and Guidelines for Qualitative Software Engineering Research [5.0] 大規模言語モデル (LLMs) は定性的な研究に参入しているが、それらを数理解析 (thematic analysis, TA) のような確立されたアプローチに統合するための再現可能な手法は存在しない。
我々はブラウンとクラークの反射性TAの位相2-5のプロンプトを設計・繰り返し改良した。
ブラウンとクラークの品質基準から導出した潤滑剤を応用した4つの専門家評価器を用いてブラインド評価を行った。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:29:18 GMT)
DeepTx: Real-Time Transaction Risk Analysis via Multi-Modal Features and LLM Reasoning [5.0] 本稿では,ユーザの確認前にその脅威を検出するリアルタイムトランザクション分析システムDeepTxを提案する。
DeepTxは保留中のトランザクションをシミュレートし、振る舞い、コンテキスト、UI機能を抽出し、トランザクションの意図を推論するために複数の大規模言語モデル(LLM)を使用する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:13:14 GMT)
ETT: Expanding the Long Context Understanding Capability of LLMs at Test-Time [4.7] ourmodelacronym(Extend at Test-Time)は、短いコンテキストのコンテクスト長を変換子ベースの言語モデルに拡張する手法である。
GPT-LargeとPhi-2のコンテキスト長を32倍に拡張し,LongBench上のETTを評価する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 23:17:51 GMT)
Controlled Gate Networks: Theory and Application to Eigenvalue Estimation [4.7] 制御ゲートネットワークと呼ばれる量子回路設計の新しい手法を提案する。
新しい戦略は、個々のユニタリ操作の複雑さを減らすのではなく、最も少ない数のゲートで必要なユニタリ操作を切り替えることである。
非常に一般的な条件下では、ユニタリ作用素の線形結合を生成するのに必要な2量子ゲートの数を大幅に削減できることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:00:24 GMT)
SBAN: A Framework \& Multi-Dimensional Dataset for Large Language Model Pre-Training and Software Code Mining [4.7] SBANは、それぞれ290万の良性と672,000のマルウェアを含む300万以上のサンプルで構成されている。
このユニークなマルチモーダル構造は、クロス表現学習、ソフトウェアのセマンティック理解、自動マルウェア検出の研究を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:52:13 GMT)
Desirable Effort Fairness and Optimality Trade-offs in Strategic Learning [4.7] 意思決定ルールが、より優れた結果を得るために、戦略的にインプット/機能を変更するエージェントとどのように相互作用するかを検討する。
このトレードオフを捉えた主エージェント相互作用の統一モデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:43:20 GMT)
Mining Service Behavior for Stateful Service Emulation [4.7] サービス仮想化は、記録されたインタラクションからサービスモデルを導出するための広く使われているテクニックとして現れています。
これらの相互作用に基づいて実際のサービスの振舞いをエミュレートする様々な方法が提案されているが、ほとんどの場合、サービスの状態を説明できない。
本稿では,サービス状態を考慮した応答生成の精度を高めるサービス間相互作用からサービスモデルを導出する手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:59:53 GMT)
Robust, randomized preconditioning for kernel ridge regression [4.6] カーネルリッジ回帰問題に最も強い保証を持つ2つの方法を記述する。
提案手法は, KRR問題の範囲を効率的に解き, 実用化に適している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:50:34 GMT)
DeBERTa-KC: A Transformer-Based Classifier for Knowledge Construction in Online Learning Discourse [4.6] DeBERTa-KCは、オンラインサイエンス学習談話における知識構築(KC)レベルの自動分類のためのトランスフォーマーベースのモデルである。
4つのKCカテゴリ(textitnonKC, textitShare, textitExplore, textitNegotiate)にまたがって20,000の手動で注釈付きサンプルが作成された。
提案したモデルは,DeBERTa-v3を拡張し,Focal Loss, Label Smoothing, R-Drop regularization を用いてクラス不均衡に対処し,一般化を向上させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:26:18 GMT)
Descriptor: Occluded nuScenes: A Multi-Sensor Dataset for Evaluating Perception Robustness in Automated Driving [4.6] Occluded nuScenesデータセットは、広く使用されているnuScenesベンチマークの新しい拡張である。
このリソースは、部分的なセンサ故障と環境干渉下での知覚モデルの一貫した再現可能な評価をサポートする。
我々は,自動運転におけるロバストなセンサフュージョン,レジリエンス解析,および安全クリティカルな認識に関する研究を進めることを目的としている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:02:26 GMT)
IASC: Interactive Agentic System for ConLangs [4.6] 本稿では,LLMを構築言語開発のためのツールとして利用するシステムを提案する。
このシステムはエージェント的アプローチを用いて言語のためのターゲット音韻論を作成する。
音韻モデルと形態素の集合を用いてレキシコンを構築する。
このシステムは、さらに多くの文を対象の言語に翻訳することもできる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:12:13 GMT)
Fast MRI for All: Bridging Access Gaps by Training without Raw Data [4.5] 物理駆動型ディープラーニング(PD-DL)アプローチは、高速磁気共鳴画像(MRI)スキャンの再構築に人気がある。
PD-DLは、既存の高速MRI技術よりも高い加速速度を提供するが、その使用は特定のMRIセンターの外で限られている。
日常的な臨床再構成画像のみを用いた高品質PD-DLトレーニングのための圧縮性に着想を得た非教師なし学習(CUPID)を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:31:55 GMT)
Saccade crossing avoidance as a visual search strategy [4.4] 個人によって異なる新たな記憶依存効果を報告し,これを自己交差回避と呼ぶ。
これは、ササードがスキャンパスの早期の通過を避ける傾向があり、どちらも振幅が小さい場合に最も顕著である。
自己交差的ペナルティ項を含むパラメトリック確率モデルは, ササードの長さと自己交差の連立統計を再現することができた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:09:13 GMT)
Spike-timing-dependent Hebbian learning as noisy gradient descent [4.3] ヘビアンラーニング(Hebbian learning)は、生物学的ネットワークにおける基礎となる学習である。
ヘビアンスパイクタイピング依存の可塑性は、生物学的ネットワークにおける鍵となる学習である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:57:11 GMT)
Higher Embedding Dimension Creates a Stronger World Model for a Simple Sorting Task [4.2] 強化学習を訓練した変圧器における内的「世界モデル」の出現に及ぼす埋め込みの影響について検討する。
モデルは非常に小さな埋め込み次元でも高い精度を達成するが、より大きな次元はより忠実で一貫性があり、堅牢な内部表現をもたらす。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:51:02 GMT)
Memory-Augmented State Machine Prompting: A Novel LLM Agent Framework for Real-Time Strategy Games [4.2] Memory-Augmented State Machine Prompting (MASMP)は、リアルタイム戦略ゲームにおけるLLMエージェントのための新しいフレームワークである。
MASMPは、状態マシンプロンプトとメモリ機構を統合し、長期的戦術的コヒーレンスで構造化されたアクションを統一する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:15:04 GMT)
A Survey on Feedback Types in Automated Programming Assessment Systems [4.0] 本研究では,APASの異なるフィードバック機構が学生にどのように認識されるか,課題解決を支援する上でどのような効果があるかを検討する。
結果は、学生が単体テストのフィードバックを最も有用なものとして評価する一方で、AIが生成したフィードバックはパフォーマンスを著しく向上させることを示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:08:22 GMT)
Towards foundational LiDAR world models with efficient latent flow matching [4.0] 1つの事前学習モデルは、スクラッチからトレーニングよりも最大11%の絶対的な改善を達成でき、我々の比較の30/36では、スクラッチからトレーニングを上回ります。
トレーニングデータの半分と従来の手法の6倍の圧縮比を用いて,最先端の復元精度を実現する潜在条件付きフローマッチングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 23:09:57 GMT)
Large deviations in the many-body localization transition: The case of the random-field XXZ chain [3.9] 多体局在(MBL)遷移におけるレア・システムワイド共鳴の効果について検討した。
我々は、非局在化がまれで障害に依存しない長距離共鳴によって引き起こされる3つの異なる体制を同定する。
ヒルベルト空間グラフ上の共振伝達経路を可視化することにより、実空間およびスペクトルプローブの相補的な視点を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:50:20 GMT)
Benchmarking Fairness-aware Graph Neural Networks in Knowledge Graphs [3.9] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習する強力なツールであるが、しばしばバイアス付き予測を生成する。
公正を意識したGNNはバイアス予測を緩和するために活発に研究されている。
知識グラフ上での公平性を意識したGNNの評価は,これまで行われていなかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:51:42 GMT)
Fair Supervised Learning Through Constraints on Smooth Nonconvex Unfairness-Measure Surrogates [3.9] 公正な教師付き機械学習のための新しい戦略を提案する。
文献上の他のものと比較して提案された戦略の主な利点は以下の通りである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:33:23 GMT)
Model Context Contracts - MCP-Enabled Framework to Integrate LLMs With Blockchain Smart Contracts [3.8] MCC: Model Context Contracts"は、AIエージェントがブロックチェーンスマートコントラクトと直接対話できる新しいフレームワークである。
このアーキテクチャでは、ブロックチェーンスマートコントラクトが、自然言語でユーザ入力を認識し、対応するトランザクションを実行するインテリジェントエージェントとして機能する。
この研究は、LLMとブロックチェーンを統合するためにModel Context Protocolの概念を使用する最初のアプローチである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:28:20 GMT)
Towards Universal Solvers: Using PGD Attack in Active Learning to Increase Generalizability of Neural Operators as Knowledge Distillation from Numerical PDE Solvers [3.8] PDEソルバは細かな時空間離散化と局所線形化を必要とするため、メモリコストが高く、実行時間が遅い。
本稿では, 微分可能な数値解法がコンパクトなニューラル演算子を監督する対向型教師学生蒸留フレームワークを提案する。
Burgers と Navier-Stokes のシステム実験により、対向蒸留は低パラメータコストと高速なニューラル演算子の推論を保ちながらOODを大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:13:05 GMT)
Floquet-engineered moire quasicrystal patterns of ultracold Bose gases in twisted bilayer optical lattices [3.8] Floquet-engineered intralayer atomic interaction によるツイスト二層格子に閉じ込められたボースガス中のモア準結晶パターンの形成について検討した。
12倍の準結晶パターンは特定のパラメータの下で出現し、二層グラフェンのモワール準結晶とよく似ている。
我々は,超低温ボソニック系における準結晶とその対称性を探索するための新しい量子プラットフォームを構築した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:05:41 GMT)
Practical Noise Mitigation for Quantum Annealing via Dynamical Decoupling -- Towards Industry-Relevant Optimization using Trapped Ions [3.7] 動的デカップリングパルスの周期的応用による量子アニールプロトコルにおける局所場雑音の抑制について検討する。
テスト問題として、最小限のマルチオブジェクト追跡QUBOインスタンスを5と9キュービットで構築し、ストックインスタンスを5と6キュービットで切断する。
解析的および数値的な結果から,雑音振幅と動的疎結合パルス間隔を組み合わせた一般化パラメータを用いて,普遍的なスケーリング挙動が明らかとなった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:57:03 GMT)
Actor-Free Continuous Control via Structurally Maximizable Q-Functions [3.7] 本稿では,Q関数の構造を再考する連続制御のための純粋に価値に基づくフレームワークを提案する。
提案するアクターフリーQ-ラーニング手法を,様々なシミュレーションタスクに対して評価する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:24:27 GMT)
StarBench: A Turn-Based RPG Benchmark for Agentic Multimodal Decision-Making and Information Seeking [3.6] ターンベースのRPGベンチマークであるStarBenchを紹介する。
人間の実践を反映するために、StarBenchには、エージェントが簡単なガイダンスをリクエストするかどうかを計測するQ&A診断も含まれている。
その結果、直接体制における知覚と制御の忠実さの巨大なギャップが明らかとなり、また、司法情報探索が成功と相関していることが示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:02:59 GMT)
A Flow-Based Model for Conditional and Probabilistic Electricity Consumption Profile Generation and Prediction [3.6] 本稿では,FCP Flow(Full Convolutional Profile Flow)と呼ばれる新しいフローベース生成モデルを提案する。
FCPFlowは条件付きおよび無条件のRLP生成と確率的負荷予測のために設計されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:25:34 GMT)
PP3D: An In-Browser Vision-Based Defense Against Web Behavior Manipulation Attacks [3.6] Webベースの行動操作攻撃(BMA)は、情報収集攻撃(フィッシングなど)やマルウェアの感染など、他の攻撃と比較して調査されていない。
我々はPixel Patrol 3D(PP3D)を紹介した。これは、行動操作SE攻撃をリアルタイムで検出、検出、防御する最初のエンドツーエンドブラウザフレームワークである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:42:46 GMT)
Enhancing Few-Shot Classification of Benchmark and Disaster Imagery with ATTBHFA-Net [3.6] Few-Shot Learningは、データ不足に対する有望なアプローチを提供する。
災害画像はクラス内変異とクラス間類似度が高い。
本稿では,アテンションに基づくBhattacharyya-Hellinger Feature Aggregation Network (ATTBHFA-Net)を紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:24:42 GMT)
Learned Cost Model for Placement on Reconfigurable Dataflow Hardware [3.6] 完全にスループットを測定するため、マッピングのスループットを評価するモデルが必要である。
さまざまなグラフに対して,スループットを31%~52%精度で予測する学習的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:45:45 GMT)
A Compositional Paradigm for Foundation Models: Towards Smarter Robotic Agents [3.5] ファンデーションモデルは大量のデータを処理でき、リッチな表現を抽出して開発することができる。
しかしながら、スクラッチからモデル全体をトレーニングすることなく、動的で現実的なシナリオに適応することにはまだ問題があります。
我々は、より柔軟で効率的でスマートなAIソリューションの開発を促進するために、継続的な学習と構成原則の適用を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:06:52 GMT)
Intelligent Software System for Low-Cost, Brightfield Segmentation: Algorithmic Implementation for Cytometric Auto-Analysis [3.5] 本稿では、標準CPUデスクトップを備えた低予算研究室向けに設計された新しい顕微鏡画像解析フレームについて述べる。
Pythonベースのプログラムは、高度なコンピュータビジョンと機械学習パイプラインを通じて、カルチャー内の生きた、保存されていない細胞のサイトメトリー分析を可能にする。
CPUベースのプラットフォーム上での競争力のあるセグメンテーション速度は、基礎研究と臨床応用の大きな可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:12:13 GMT)
Effectiveness of the syndrome extraction circuit with flag qubits on IBM quantum hardware [3.5] 我々は,IBM量子コンピュータ上でフラグ量子ビットを用いたシンドローム抽出回路の実装に成功したことを報告した。
データキュービットはシンドロームキュービットに隣接していないが、繰り返し符号の距離が増加するにつれて論理誤差は減少する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:45:13 GMT)
Human to Document, AI to Code: Three Case Studies of Comparing GenAI for Notebook Competitions [3.5] 我々は、人間と生成AI(GenAI)の両方の潜在的な強みを探求する3つのケーススタディを提示する。
最初に、25のコードと文書の特徴の違いを、人書きでメダルを獲得したKaggleノートに特徴付けます。
GenAIノートは(コードの臭いや技術的負債といったメトリクスによって測定されるように)より高いコード品質を達成する傾向にある一方で、人書きノートはより構造的な多様性、複雑さ、問題解決に対する革新的なアプローチを示します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:05:54 GMT)
LENS: Large Pre-trained Transformer for Exploring Financial Time Series Regularities [3.5] 金融時系列の事前学習モデルである textbfLENS を提案する。
textbfLENSは、慎重に構築されたモデルアーキテクチャを通じて、金融システムの複雑さを効果的にキャプチャする。
我々の研究は、高雑音環境下で事前学習された時系列モデルの開発に関する実践的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:42:19 GMT)
Empowering Decision Trees via Shape Function Branching [3.5] 本稿では、各内部ノードが学習可能な軸方向の形状関数を1つの特徴に適用する、決定木(Shape Generalized Tree, SGT)の新たな一般化を提案する。
SGTは本質的に解釈可能であり、モデルの決定機構の直感的で視覚的な説明を提供する。
各種データセットを用いた実験により,SGTは従来の軸方向の線形木に比べてモデルサイズが小さく,優れた性能を示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:43:13 GMT)
Signature Kernel Scoring Rule as Spatio-Temporal Diagnostic for Probabilistic Forecasting [3.4] 我々は、時間的および空間的依存関係を符号化する連続経路として、気象変数を再構成するシグネチャカーネルスコアリングルールを導入する。
WeatherBench 2モデルの気象スコアカードによる経験的評価は、署名カーネルスコアリングルールの高い識別力を示している。
我々は、ERA5再解析気象データに基づいて、予測逐次スコアリングルールを用いて、滑り窓生成ニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:15:20 GMT)
Sparse Explanations of Neural Networks Using Pruned Layer-Wise Relevance Propagation [3.4] 本稿では,レイヤワイド・レバレンス・プロパゲーションに広く用いられている説明手法の修正について述べる。
提案手法は,各レイヤの関連伝搬を解析することにより,空間性を直接的に適用する。
この修正によってノイズの低減と,ベースラインと比較して重要な特徴の集中がもたらされることが示される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:17:06 GMT)
Improving the fact-checking performance of language models by relying on their entailment ability [3.4] 本稿では,ファクトチェックのために,エンコーダのみの言語モデル(ELM)を訓練するための簡易かつ効果的な手法を提案する。
我々は厳密な実験を行い、我々のアプローチを最近の研究と比べ、アプローチの優位性を実証するために様々なプロンプトと微調整の戦略を実践した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:05:38 GMT)
REPAIR Approach for Social-based City Reconstruction Planning in case of natural disasters [3.4] 本稿は、包括的比較分析を行うことにより、以前公表した研究の拡張である。
提案されたアプローチは、Restruct plAn ProvIdeR (REPAIR)という名称で、ジェネリックである。
実装する理想的なものを選択するローカル管理者のための代替プランのセットを決定することができ、任意の拡張の領域に適用することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:05:18 GMT)
Misinformation Detection using Large Language Models with Explainability [3.3] 本稿では、トランスフォーマーベース事前学習言語モデル(PLM)を用いて誤情報を検出するための説明可能かつ計算効率の良いパイプラインを示す。
まず、バックボーンを凍結し、分類ヘッドのみを訓練し、次に、レイヤワイズ学習率の減衰を適用しながら、バックボーン層を徐々に凍結させます。
その結果, PLMと原理的微調整と解釈可能性の組み合わせは, スケーラブルで信頼性の高い誤情報検出に有効な枠組みであることが示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:56:45 GMT)
Programmable photonic waveguide arrays: opportunities and challenges [3.3] プログラマブル導波路アレイ(PWA)は、直接自由空間アナログを持たないコンパクトなシステムを提供するが、その静的な性質は実用性に制限されている。
本稿では、量子シミュレーション、フォトニックニューラルネットワーク、トポロジカルフォトニクス、非線形光学におけるPWAの概念的基礎、最近の進歩、将来の可能性について概説する。
コンパクトで再構成可能なフォトニックプロセッサのための次世代アーキテクチャとしてPWAを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:32:28 GMT)
Can large audio language models understand child stuttering speech? speech summarization, and source separation [3.3] 子どもの発話は、音響、韻律、言語発達における大人のスピーチとは異なる(反復、延長、ブロック)
近年の大規模音声言語モデル (LALM) は, クロスモーダルな音声理解を強く示している。
我々は,現在あるLALMを,インタビュー(混合話者)と読書課題(単一子ども)の2つの設定で評価した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:53:34 GMT)
Identity-Aware Large Language Models require Cultural Reasoning [3.2] 我々は文化的な推論を、文化固有の知識価値と社会的規範を認識するためのモデルの能力として定義する。
文化は解釈、感情的共鳴、許容される行動を形成するため、文化的推論はアイデンティティを意識するAIにとって不可欠である。
文化的推論は、事実的正確性や言語的一貫性とともに基礎的な能力として扱われなければならないと我々は主張する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:50:51 GMT)
QKCV Attention: Enhancing Time Series Forecasting with Static Categorical Embeddings for Both Lightweight and Pre-trained Foundation Models [3.1] 本稿では,従来のQKVフレームワークの拡張であるQKCV(Query-Key-Category-Value)について紹介する。
QKCVは、さまざまな実世界のデータセットにわたる注目ベースのモデルの予測精度を高める。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:15:21 GMT)
$Δ$t-Mamba3D: A Time-Aware Spatio-Temporal State-Space Model for Breast Cancer Risk Prediction [3.1] 縦断的医用画像解析に適応した新しい状態空間アーキテクチャを開発した。
我々のモデルは、不規則なビジット間隔とリッチ・テンポラルコンテキストを同時に符号化する。
その線形複雑さのおかげで、このモデルはマンモグラフィーの長期および複雑な患者のスクリーニング履歴を効率的に処理することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:29:17 GMT)
VLSU: Mapping the Limits of Joint Multimodal Understanding for AI Safety [3.1] マルチモーダル安全性を評価する包括的フレームワークであるVision Language Safety Understandingを提案する。
11種類の最先端モデルについて評価した結果, 系統的な共同理解の失敗が判明した。
我々のフレームワークは、現在のモデルにおける共同画像テキスト理解とアライメントギャップの弱点を明らかにする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:30:31 GMT)
Building Trust in Clinical LLMs: Bias Analysis and Dataset Transparency [3.1] 臨床言語モデルにおける下流バイアスの詳細な分析について述べる。
我々は、民族、性別、年齢など、多様な人口集団にまたがる異なるオピオイド処方の傾向に注目した。
HC4: Healthcare Comprehensive Commons Corpusを紹介します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:08:39 GMT)
MARCUS: An Event-Centric NLP Pipeline that generates Character Arcs from Narratives [3.1] MARCUSは,人物間の関係をモデル化するためのイベント,参加者キャラクタ,インプリード感情,感情を抽出するNLPパイプラインである。
2つの拡張ファンタジーシリーズ、ハリー・ポッターとロード・オブ・ザ・リングからキャラクターアークを生成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:03:48 GMT)
Contrastive Decoding Mitigates Score Range Bias in LLM-as-a-Judge [3.1] 大規模言語モデル(LLM)は、様々なアプリケーションで一般的に評価として使用されるが、結果の信頼性は依然として課題である。
そのような課題の1つは、直接評価にLLMs-as-judgesを使用し、参照なしで特定の範囲からスコアを割り当てることである。
まず, この課題は, LLM判定出力がスコア範囲バイアスに関連付けられ, 最適スコア範囲の探索を妨げていることを示す。
次に、このバイアスを対照的な復号化によって緩和し、スピアマン平均の11.3%の相対的な改善を、異なるスコア範囲にわたる人間の判断と相関させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:47:11 GMT)
DarkGram: A Large-Scale Analysis of Cybercriminal Activity Channels on Telegram [3.0] 339のサイバー犯罪活動チャネル(CAC)の大規模分析を行った。
これらのチャンネルは、様々な悪意のある非倫理的なコンテンツを購読者と共有している。
DarkGramはCACからの悪意のある投稿を自動的に96%の精度で識別するフレームワークです。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:07:31 GMT)
Alibaba International E-commerce Product Search Competition DILAB Team Technical Report [3.0] 本研究ではDILABチームが開発した多言語eコマース検索システムについて述べる。
最終予選では総合得点0.8819で5位となり、評価指標の安定性と高いパフォーマンスを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:36:02 GMT)
AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning [2.9] AVIATORはAIによる最初の脆弱性注入ワークフローである。
高忠実で多様な大規模な脆弱性データセット生成のために、現実的でカテゴリ固有の脆弱性を自動的に注入する。
セマンティック分析、LoRAベースのファインチューニングとRetrieval-Augmented Generationで強化されたインジェクション合成、静的解析とLLMベースの識別器によるインジェクション後の検証を組み合わせる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:22:11 GMT)
Plural Voices, Single Agent: Towards Inclusive AI in Multi-User Domestic Spaces [2.9] マルチユーザニーズを動的に交渉する新しい単一エージェントフレームワークであるPVM(Plural Voices Model)を提案する。
人間の合成カリキュラム設計を用いて、PVMはコア値、競合、アクセシビリティ要件を識別する。
弊社のプライバシー重視のプロトタイプは、アダプティブな安全足場、カスタマイズされたインタラクション、および同等のコンフリクト解決を備えている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:48:26 GMT)
Application of Reduced-Order Models for Temporal Multiscale Representations in the Prediction of Dynamical Systems [2.8] 本稿では,複雑なマルチスケールシステムの力学をモデル化し,予測するための3つのアプローチを提案する。
1つ目は、ニューラルネットワークと統合されたユニット分割法(PU)を利用して、ダイナミクスをローカルコンポーネントに分解する。
第二に、Singular Value Decomposition (SVD) を適用して、マクロとマイクロスケールのダイナミクスを明確に分離する支配的なモードを抽出する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:46:15 GMT)
When Abstraction Breaks Physics: Rethinking Modular Design in Quantum Software [2.8] 抽象化は、モジュール性、再利用性、拡張性を可能にする、古典的なソフトウェア工学の基本的な原則である。
量子プログラムは、ユニタリティ、絡み合い、非閉鎖定理、測定の破壊的な性質など、根本的に異なる意味論に固執する。
本稿では,量子ソフトウェア工学における基本的な矛盾を,統語的に有効な抽象化手法が量子計算の物理的制約に反する可能性があることを明らかにする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:08:58 GMT)
The Cost-Benefit of Interdisciplinarity in AI for Mental Health [2.8] 我々は、技術、医療、倫理、法の専門家を主要なライフサイクルフェーズに巻き込むことが不可欠であると主張している。
学際性の課題と利益のバランスをとるために、実践的なレコメンデーションと既存のフレームワークを強調します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:34:44 GMT)
On Efficient Computation of DiRe Committees [2.7] i) 任意のグループに分けられる候補者の組から成る委員会選挙について考えてみましょう。
多様性制約は、各グループから$atleast$1の候補を選択することを規定している。
表現制約は、承認された候補の非無効なセットを持つ各集団から$atleast$1の候補を選択することを規定している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:32:55 GMT)
Denoising the Future: Top-p Distributions for Moving Through Time [2.7] 動的確率モデルにおける推論は、高価な操作を含む複雑なタスクである。
我々は,トップp状態のみを用いることで,未来を認知し,推論を高速化することを提案する。
我々は少なくとも1桁のスピードアップを期待でき、全変動距離の誤差は0.09以下であることを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:18:34 GMT)
Towards Instance-Wise Calibration: Local Amortized Diagnostics and Reshaping of Conditional Densities (LADaR) [2.7] 本稿では,LADaR(Local Amortized Diagnostics and Reshaping of Conditional Densities)フレームワークを紹介する。
解釈可能な局所診断を生成し、条件密度推定を調整するメカニズムを提供する。
$textttCal-PIT$は、キャリブレーションデータから単一の解釈可能な局所確率マップを学習する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:57:33 GMT)
Coherence-induced deep thermalization transition in random permutation quantum dynamics [2.7] 投影されたアンサンブルの位相遷移を報告する。
この遷移はランダムな置換力学のシステムに現れる。
入力状態と測定基準によって注入されるコヒーレンス総量によって遷移が調整されることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:39:36 GMT)
Low-cost Embedded Breathing Rate Determination Using 802.15.4z IR-UWB Hardware for Remote Healthcare [2.6] 本稿では,超広帯域(UWB)チャネルインパルス応答(CIR)データから呼吸速度を予測するための畳み込みニューラルネットワーク(CNN)を提案する。
46KBのメモリを必要とするnRF52840システムにアルゴリズムをデプロイし,192msの推論時間で動作可能であることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:11:32 GMT)
Unrolled-SINDy: A Stable Explicit Method for Non linear PDE Discovery from Sparsely Sampled Data [2.6] 我々は,PDE発見のための明示的な手法の安定性を改善するために,アンロール方式を利用するシンプルな手法であるUnrolled-SINDyを紹介する。
本手法は,反復的閉形式アプローチか勾配降下法により利用することができる。
従来のSINDyと最先端のノイズロバストiNeuralSINDyでは,非アンロール方式ではアクセスできない問題に対処できる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:09:34 GMT)
Maximally Extendable Product Codes are Good Coboundary Expanders [2.6] 十分に大きなフィールド上の任意の数の乱符号の集合は、良い積展開を持つことを示す。
4つの符号の場合、同じアイデアが良い量子局所的なテスト可能な符号を構築するのに使えると我々は信じている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:25:56 GMT)
Rank-One Modified Value Iteration [2.6] マルコフ決定過程の計画と学習問題を解決するための新しいアルゴリズムを提案する。
提案アルゴリズムは、計画と学習の両問題に対して、一階アルゴリズムとそれらの高速化バージョンを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:31:45 GMT)
A Degree Bound for the c-Boomerang Uniformity [2.5] F$の$c$-Boomerang, $c neq 0$は、-$d2$ if $c2 neq 1$, - $d cdot (d - 1)$ if $c = -1$, - $d cdot (d - 2)$ if $c = 1$であることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:45:35 GMT)
Measurement-Based Fault-Tolerant Quantum Computation on High-Connectivity Devices: A Resource-Efficient Approach toward Early FTQC [2.5] 本稿では, 閉じ込められたイオンや中性原子などの高結合性プラットフォームのための測定ベースFTQCアーキテクチャを提案する。
鍵となるアイデアは、検証済みの論理アンシラと、Knillの誤り訂正テレポーテーションを組み合わせることである。
回路レベルの分極雑音下でベンチマークした2つの実装を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:02:20 GMT)
Explaining Large Language Models with gSMILE [2.5] gSMILEは、大規模言語モデルにおけるトークンレベルの解釈可能性のための、モデルに依存しない摂動ベースのフレームワークである。
我々は,OpenAI の GPT-3.5-turbo-instruct,Meta の LLaMA 3.1 Instruct Turbo や Anthropic の Claude 2.1 など,主要な LLM における gSMILE の評価を行った。
以上の結果から,gSMILEは人為的属性を確実に提供し,Claude 2.1は注意力に優れ,GPT-3.5は高い出力整合性を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:27:58 GMT)
BlendCLIP: Bridging Synthetic and Real Domains for Zero-Shot 3D Object Classification with Multimodal Pretraining [2.4] ゼロショットの3Dオブジェクト分類は、自動運転のような現実世界のアプリケーションには不可欠だ。
トレーニングに使用される合成データと、現実世界で遭遇するノイズの多いLiDARスキャンとの間の大きな領域ギャップによって、しばしば妨げられる。
BlendCLIPは、両ドメインの強みを戦略的に組み合わせることで、この合成と現実のギャップを橋渡しするマルチモーダル事前学習フレームワークである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:08:27 GMT)
Fine-Tuned Thoughts: Leveraging Chain-of-Thought Reasoning for Industrial Asset Health Monitoring [2.4] 小言語モデル (SLM) は、産業応用などの専門分野において、ますます人気が高まっている。
本稿では,大規模言語モデル (LLM) からより小型で効率的なモデル (SLM) へ推論能力を伝達する産業資産衛生のための知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:18:24 GMT)
An overview of the use of alternative funding and contracting approaches relevant for agile software development: A systematic review of real-life experiences [2.3] このレビューは、代替(伝統的でない)契約と資金調達アプローチを用いた実生活体験を合成する。
4つの代替資金と4つの代替契約アプローチが特定された。
これらの代替案の利点は、顧客満足度の向上、契約者リスクの低減、リソース利用の効率化であった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:10:15 GMT)
Impartial Selection with Predictions [2.2] 相互推薦に基づくエージェントの選択について検討する。
エージェントの選択が、そのエージェントが選任した指名とは無関係であることを保証することで、この問題を回避している。
本研究は、最多の指名を受けたエージェントの集合の予測を与えられた場合、公平なメカニズムの性能をどの程度改善できるかを考察する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:27:08 GMT)
Benchmarking Large Language Models with Integer Sequence Generation Tasks [2.2] 本稿では,数学推論タスクにおける大規模言語モデル(LLM)の機能評価を行うベンチマークを提案する。
このベンチマークは、オンラインシーケンス百科事典(OEIS)から得られた整数列生成タスクからなる。
私たちの評価には、OpenAI(特別な推論に焦点を当てたoシリーズを含む)、Arthropic、Meta、Googleのリードモデルが含まれています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:21:20 GMT)
ShaRE your Data! Characterizing Datasets for LLM-based Requirements Engineering [2.2] 大規模言語モデル(LLM)は、トレーニングと推論の段階にわたって堅牢なパフォーマンスを達成するために、ドメイン固有のデータセットに依存している。
要求工学(RE)では、データ不足は、調査やマッピング研究で報告された永続的な制限である。
本研究では,LLM4REで使用されるデータセットの限られた可視性と特徴について考察する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:40:26 GMT)
Cryo-RL: automating prostate cancer cryoablation planning with reinforcement learning [2.2] Cryo-RLは,マルコフ決定プロセスとして凍結計画をモデル化する強化学習フレームワークである。
エージェントは、手作業で設計したプランを必要とせず、最適なクリーモローブ配置につながるクリーモアブレーション戦略を学ぶ。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:37:00 GMT)
Efficient Interleaved Speech Modeling through Knowledge Distillation [2.2] 現在の音声言語モデルは、多くのデプロイメント環境のサイズやレイテンシの制約を超える。
我々は, 層状蒸留, 隠れ状態のマッチング, 注意マップ, 軟化ロジットにより, コンパクトで表現力豊かな音声生成モデルを構築した。
TinyWave は (i) 音声または表現的トークンと (ii) 混合音声テキスト継続を用いた音声のみの生成をサポートする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:45:06 GMT)
The Narcissus Hypothesis: Descending to the Rung of Illusion [2.1] 我々は,モデルが客観的推論よりも満足あるいは平らな反応を好むという仮説を検証した。
その結果、社会的に適合する形質への大きな流れが明らかとなった。
次に、再帰が高次推論を崩壊させる可能性をトレースする、新しい解釈を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:42:34 GMT)
Category learning in deep neural networks: Information content and geometry of internal representations [2.1] 動物では、カテゴリー学習はカテゴリ境界に近い刺激の識別を促進する。
この現象は分類知覚と呼ばれ、分類タスクで訓練された人工ニューラルネットワークでも経験的に観察された。
ベイズコストの最小化(クロスエントロピー損失)は,カテゴリの集合と,決定層に先行する神経活動の相互情報の最大化を意味することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:02:51 GMT)
Forward to Hell? On the Potentials of Misusing Transparent DNS Forwarders in Reflective Amplification Attacks [2.1] 我々は、透明なフォワーダーがインターネットインフラに深刻な脅威をもたらすことを示す。
彼らは簡単にレート制限を回避し、DNSの任意のキャストインフラストラクチャを通じて、追加でスケーラブルな影響を達成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:28:11 GMT)
Prospects for Using Artificial Intelligence to Understand Intrinsic Kinetics of Heterogeneous Catalytic Reactions [2.1] 鍵となるフロンティアは、AIをマルチスケールモデルとマルチモーダル実験に統合することである。
一貫性のないデータ品質と モデルの複雑さは 機械的な発見を制限する
生成AIとエージェントAIは、モデル生成を自動化し、不確実性を定量化し、実験でカップル理論を組み込むことができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:35:26 GMT)
Improving Topic Modeling of Social Media Short Texts with Rephrasing: A Case Study of COVID-19 Related Tweets [2.1] ソーシャルメディアの短いテキストの短さ、非公式性、ノイズは、しばしば伝統的なトピックモデリングの有効性を阻害する。
EmphTM-Rephraseは,トピックモデリングに先立って,生のツイートをより標準化され形式化された言語に表現する,モデルに依存しないフレームワークである。
本研究は,公衆衛生関連ソーシャルメディア分析におけるトピックモデリングのモデル非依存的アプローチに寄与する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:29:38 GMT)
Matcha: Multi-Stage Riemannian Flow Matching for Accurate and Physically Valid Molecular Docking [2.1] マルチステージフローマッチングと学習したスコアリングと物理的妥当性フィルタリングを組み合わせた新しい分子ドッキングパイプラインであるMatchaを紹介する。
様々なアプローチと比較して、Matchaはドッキング成功率と物理的妥当性の観点からAstexとPDBbindテストセットで優れた性能を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:13:54 GMT)
TaintSentinel: Path-Level Randomness Vulnerability Detection for Ethereum Smart Contracts [2.1] ブロックチェーン技術の本質的な決定性は、スマートコントラクト内でセキュアな乱数を生成する上で大きな課題となる。
本稿では,スマートコントラクトを実行経路レベルで解析する新たなパスセンシティブな脆弱性検出システムであるTaintSentinelを提案する。
4,844件の実験を行い,既存のツールと比較してTaintSentinelの優れた性能を示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:35:45 GMT)
Coherent Information Phase Transition in a Noisy Quantum Circuit [2.1] 本稿では,量子化演算を組み込むことで,ノイズがあっても信頼性の高い量子情報伝送が可能になることを示す。
本稿では,この位相遷移を実験で特徴付けるプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:57:39 GMT)
HyperQB: A Bounded Model Checker for Hyperproperties [2.1] HyperQB 2.0は、ハイパープロパティのための最初の高効率なプッシュボタンバウンドモデルチェッカー(BMC)である。
NuSMV や Verilog のモデルとして入力され、時相論理の HyperLTL や A-HLTL で表される式である。
このツールはRustで完全に実装されています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:25:55 GMT)
VAPU: System for Autonomous Legacy Code Modernization [2.0] 本稿では,ソフトウェア開発チームにおける様々な役割をシミュレートしながら,フェーズ内のコードファイルを更新する,VAPUというマルチエージェントシステムを提案する。
VAPU は ZSL/OSL のプロンプトに比べて Python ファイルの更新要求が 22.5% 増加した。
この研究は、LLMベースのマルチエージェントシステムは、レガシーアプリケーションのコンポーネントを自律的に更新する能力のあるソリューションであることを示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:50:33 GMT)
Static Sandboxes Are Inadequate: Modeling Societal Complexity Requires Open-Ended Co-Evolution in LLM-Based Multi-Agent Simulations [2.0] llmはマルチエージェントシステムやソーシャルシミュレーションを推進しているので、オープンエンドの、絶えず変化する環境をモデリングする新たな可能性を見極めています。
本稿では、静的なタスク固有のベンチマークは基本的に不十分であり、再考する必要があると論じる。
我々は、llmとマルチエージェントのダイナミクスをブレンドする新興アーキテクチャを批判的にレビューし、安定性と多様性のバランス、予期せぬ振る舞いの評価、複雑さへのスケーリングといった重要なハードルを強調し、この急速に進化する分野に新しい分類を導入します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:32:35 GMT)
Evaluating LLM-Based Mobile App Recommendations: An Empirical Study [2.0] 大規模言語モデル(LLM)は、自然言語のプロンプトを通じてモバイルアプリケーションに推奨されるようになってきている。
本稿では,LLMがモバイルアプリレコメンデーションをどのように生成し,正当化し,ランク付けするかを実証分析する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:35:19 GMT)
A Hybrid Enumeration Framework for Optimal Counterfactual Generation in Post-Acute COVID-19 Heart Failure [2.0] 本稿では,個別化リスク推定と介入分析のための非現実的推論フレームワークを提案する。
このフレームワークは、厳密な列挙と最適化に基づく手法(NICE(Nearest Instance Counterfactual Explanations)やMOC(Multi-Objective Counterfactuals)アルゴリズムなど)を組み合わせる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:35:12 GMT)
Robustness Verification of Graph Neural Networks Via Lightweight Satisfiability Testing [2.0] グラフニューラルネットワーク(GNN)は、グラフを学習するための主要なアーキテクチャである。
本稿では,GNNのバリエーションとデータセットの多種多様なセットについて,RobLightツールの評価を行う。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:45:51 GMT)
PowerChain: A Verifiable Agentic AI System for Automating Distribution Grid Analyses [2.0] 急激な電化と脱炭は、分散グリッド(DG)の運用と計画の複雑さを増している。
これらの分析は、専門家の知識を必要とし、自動化が困難であるさまざまなモデル、関数呼び出し、データパイプラインに依存します。
我々は,複雑なグリッド分析を自律的に行うことができるエージェントシステムPowerChainを構築した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:54:12 GMT)
Ensuring Robustness in ML-enabled Software Systems: A User Survey [2.0] ML-On-Railsプロトコルは、実運用におけるML対応システムの堅牢性と信頼性を高めるように設計されている。
OOD検出、敵攻撃検出、入力バリデーション、説明可能性などの重要なセーフガードを統合している。
HTTPステータスコードを使用して、モデル結果とエラーの報告の透明性を高めるための、モデルからソフトウェアへの通信フレームワークも含まれている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:51:50 GMT)
Fair Minimum Labeling: Efficient Temporal Network Activations for Reachability and Equity [1.9] リソース効率と公平性のバランスは、現代の学習アプリケーションをサポートするネットワークシステムにおいて重要である。
本稿では,最小限の時間的エッジアクティベーションプランを設計する作業であるFair Minimum Labeling問題を紹介する。
その結果,FMLはベースラインよりも活性化コストが大幅に低いグループレベルのフェアネスを強制することがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:59:50 GMT)
Self-Configuring Quantum Networks with Superposition of Trajectories [1.9] 量子ネットワークは将来の量子技術のバックボーンである。
しかし、そのパフォーマンスはノイズとデコヒーレンスに悩まされている。
本稿では,重畳された量子パスと変分量子最適化技術を統合する自己構成手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:34:54 GMT)
FST.ai 2.0: An Explainable AI Ecosystem for Fair, Fast, and Inclusive Decision-Making in Olympic and Paralympic Taekwondo [1.8] 本稿では,emphFST.ai 2.0について紹介する。emphFST.ai 2.0は,テコンドー競技やトレーニングにおいて,審判,コーチ,アスリートをリアルタイムで支援するために設計された,説明可能なAIエコシステムである。
インタラクティブダッシュボードのセットは、審判評価、アスリートのパフォーマンス分析、パラテコンド分類における人間とAIの協調を可能にする。
FST.ai2.0は、リアルタイムの知覚、説明可能な推論、ガバナンスを意識したデザインをブリッジすることで、スポーツにおける公平で説明可能な、そして人間に沿ったAIへのステップを表現している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:35:56 GMT)
Spatio-Temporal Graph Convolutional Networks for EV Charging Demand Forecasting Using Real-World Multi-Modal Data Integration [1.8] 輸送は温室効果ガスの排出に大きく貢献している。
本研究では,グラフ・コナール・ネットワークと時間的アーキテクチャを組み合わせた時間的予測フレームワークであるTW-GCNを紹介する。
我々は、実世界の交通の流れ、気象条件、および独自のデータを利用して、空間的依存と時間的ダイナミクスの両方を捉える。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:01:01 GMT)
Stochastic Path Planning in Correlated Obstacle Fields [1.8] 本研究では,不確実な状態の空間的相関障害を有するナビゲーション環境であるSCOS(Correlated Obstacle Scene)問題を紹介する。
我々は,ブロック確率を洗練させるベイズ的信念更新を開発し,その後部を用いて探索空間を効率よく削減する。
このフレームワークは、敵の割り込みやクラスタ化された自然災害のある環境でのナビゲーション上の課題に対処する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:11:32 GMT)
Improving planning and MBRL with temporally-extended actions [1.8] 連続時間システムは離散時間力学を用いてモデル化されることが多いが、精度を維持するには小さなシミュレーションステップが必要である。
これまでの作業では、個別のアクション期間を決定するためにポリシーが学習されたアクションリピートを使用して、この問題に部分的に対処してきた。
本稿では、時間的に拡張されたアクションを使用して、連続的な決定時間を直接制御し、プランナーが追加の最適化変数としてアクションの持続時間を扱わせることを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:07:27 GMT)
Two Quantum Algorithms for Nonlinear Reaction-Diffusion Equation using Chebyshev Approximation Method [1.8] 本稿では, トランキャット型チェビシェフポリー近似を用いた反応拡散方程式に対する2つの新しい量子アルゴリズムを提案する。
カルマン埋め込み行列の対角化に十分な条件を導出する。
対角化の成功は、特定の三角方程式が積分解を持たないという予想に基づいている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:14:23 GMT)
EMA-SAM: Exponential Moving-average for SAM-based PTMC Segmentation [1.8] EMA-SAMはSAM-2の軽量拡張で、信頼性に富んだ指数的移動平均ポインターをメモリバンクに組み込む。
PTMC-RFAデータセット(124分13人)では、EMA-SAMはEmphmaxDiceを0.82から0.86に改善し、emphmaxIoUを0.72から0.76に改善し、偽陽性を29%削減した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:30:27 GMT)
ITVTON: Virtual Try-On Diffusion Transformer Based on Integrated Image and Text [1.7] ITVTONは、Diffusion Transformer (DiT) を単一のジェネレータとして活用し、画像の忠実性を向上させる効率的なフレームワークである。
ITVTONは、幅寸法に沿って衣服や人物の画像を効果的にキャプチャし、両方のテキスト記述を組み込む。
IGPairによる10,257枚の画像対の実験により、実世界のシナリオにおけるITVTONの堅牢性が確認された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:41:40 GMT)
ECG-LLM-- training and evaluation of domain-specific large language models for electrocardiography [1.7] 微調整されたLlama 3.1 70Bは、複数選択評価と自動テキストメトリクスにおいて優れた性能を達成した。
人間の専門家による評価は複雑なクエリに対する Claude 3.7 と RAG のアプローチを好んだ。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:45:38 GMT)
Brain-Like Processing Pathways Form in Models With Heterogeneous Experts [1.7] ヘテロジニアス・ミックス・オブ・エキスパートアーキテクチャを拡張して、異種領域がそれ自体で処理経路を形成していないことを示す。
経路形成を促進する3つの生物学的関連誘導バイアスを同定した。
我々のモデルにおける人工的な経路は、脳が皮質系と皮質下系を使って、様々な困難を伴うタスクを学習し、解決する方法と一致している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:25:19 GMT)
Active tuning of ENZ resonances in meta-antenna through phase modulation of optical pulse [1.6] プラズモニックナノアンテナは、材料中の光の伝播を制御する新しい経路を提供する。
L型ナノアンテナ構造におけるEpsilon-Near-zero (ENZ) 応答について, 屈折率の指数が増大するプラズモニックアナログの現象下で検討した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:35:54 GMT)
DRsam: Detection of Fault-Based Microarchitectural Side-Channel Attacks in RISC-V Using Statistical Preprocessing and Association Rule Mining [1.6] RISC-Vにおける微小構造的攻撃の検出は、x86やARMと比較して、比較的過小評価されている。
統計的前処理と相関ルールマイニングを組み合わせた新しい検出法を提案する。
提案手法は,精度が最大5.15%向上し,精度が7%向上し,リコール精度が3.91%向上した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:09:56 GMT)
From Reviews to Actionable Insights: An LLM-Based Approach for Attribute and Feature Extraction [1.6] 本研究では,顧客レビューから製品属性とサービス属性を抽出するための体系的,大規模言語モデル(LLM)アプローチを提案する。
この手法を、スターバックスストアの2万件のYelpレビューに適用し、ランダムなレビューのサブセットに対して8つのプロンプト変種を評価する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:00:54 GMT)
Learning Fairer Representations with FairVIC [1.4] 自動意思決定システムにおけるバイアスの緩和は、公平さとデータセット固有のバイアスのニュアンスな定義のために重要な課題である。
学習中の損失関数に分散項、不変項、共分散項を統合することにより、ニューラルネットワークの公平性を高める革新的なアプローチであるFairVICを導入する。
ベンチマークデータセットにおけるFairVICを,グループと個人の両方の公正性を考慮して比較して評価し,精度と公正性のトレードオフに関するアブレーション研究を行う。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:33:37 GMT)
Towards an Optimized Benchmarking Platform for CI/CD Pipelines [1.4] パフォーマンスのレグレッションを特定し、サービスレベルの合意を維持するためには、ベンチマークが不可欠です。
パフォーマンスベンチマークはリソース集約的で時間を要する。
現在、これらの最適化を現実の継続的インテグレーション/継続的デプロイメントパイプラインにシームレスに統合する実用的なシステムは存在しない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:43:20 GMT)
3D Optimization for AI Inference Scaling: Balancing Accuracy, Cost, and Latency [1.4] 我々は、統合された意思決定空間内で精度、コスト、レイテンシを共同で調整する3D最適化フレームワークを導入する。
膝点最適化が最良バランスを達成するのに対して,精度の最大化は精度を優先しても良好であることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:03:46 GMT)
Hunting in the Dark: Metrics for Early Stage Traffic Discovery [1.4] 本研究では,暗号鍵マルウェアパッケージであるCrackonoshの検出について,その挙動を識別するためのさまざまな指標を用いて検討した。
発見可能性の指標を用いて,マルウェアの数が減少するにつれて,防御者がCrackonoshトラフィックを測定する能力をモデル化する。
異なる暗黒空間サイズがマルウェアを追跡する能力の両方にどう影響するかを実証するが、攻撃者のミスを悪用して突発的な行動を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:18:43 GMT)
The Black Tuesday Attack: how to crash the stock market with adversarial examples to financial forecasting models [1.3] 我々は、個々の株価の小さな操作を通じて、株式市場の暴落を引き起こす可能性を調査し、保護する。
このようなクラッシュは、モデルの予測が正確で、それが引き起こす介入が小さいため、検出が困難である可能性が高い。
この可能性は金融安定にとって大きなリスクであり、敵対的な俳優が敵に大きな経済的損害を与える機会である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:15:09 GMT)
Review of Explainable Graph-Based Recommender Systems [1.3] 本稿では,説明可能なグラフベースレコメンデータシステムの最先端のアプローチについて論じる。
それは、学習方法、説明方法、説明型という3つの側面に基づいて分類する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:08:27 GMT)
Asynchronous Federated Learning: A Scalable Approach for Decentralized Machine Learning [1.3] フェデレートラーニング(FL)は、分散機械学習の強力なパラダイムとして登場した。
従来のFLアプローチは、同期クライアントのアップデートに依存しているため、スケーラビリティと効率の制限に直面することが多い。
本稿では、クライアントが独立して非同期にグローバルモデルを更新できる非同期フェデレートラーニング(AFL)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:33:34 GMT)
Zero-Shot Vehicle Model Recognition via Text-Based Retrieval-Augmented Generation [1.2] 本稿では、ゼロショット認識をサポートするために、視覚言語モデル(VLM)とRetrieval-Augmented Generation(RAG)を統合するパイプラインを提案する。
VLMは、車両画像を記述属性に変換し、テキスト特徴のデータベースと比較する。
この設計は、大規模な再訓練を回避し、新しい車両のテキスト記述を追加することで、迅速な更新を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:39:39 GMT)
FinAI Data Assistant: LLM-based Financial Database Query Processing with the OpenAI Function Calling API [1.2] FinAI Data Assistantは、金融データベース上の自然言語クエリの実践的なアプローチである。
システムは、ユーザリクエストを、検証済みのパラメータ化されたクエリの小さなライブラリにルーティングする。
結果:NASDAQ-100はティッカーマッピングの精度がほぼ完璧であり、S&P500企業にとっては高い。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:48:57 GMT)
MatPROV: A Provenance Graph Dataset of Material Synthesis Extracted from Scientific Literature [1.2] 本稿では,科学文献から抽出したProV-DM準拠合成手順のデータセットであるMatPROVについて述べる。
MatPROVは、視覚的に直感的な有向グラフを通じて、材料、操作、条件の間の構造的複雑さと因果関係をキャプチャする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:00:41 GMT)
A representational framework for learning and encoding structurally enriched trajectories in complex agent environments [1.1] 人工知能エージェントが最適な決定を行い、それらを異なるドメインやタスクに一般化する能力は、複雑なシナリオで妥協される。
この問題に対処する方法の1つは、世界の効率的な表現を学習することと、エージェントのアクションが状態-行動遷移においてそれらにどのように影響するかに焦点を当てている。
本稿では,エージェントのオントロジーを強化し,従来のトラジェクトリ概念を拡張し,タスク実行のより微妙な視点を提供することを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:02:18 GMT)
Some Attention is All You Need for Retrieval [1.1] ハイブリッドSSM-Transformerアーキテクチャにおける完全な機能分離を示す。
検索は自己注意層にのみ依存する。
この厳密な機能特化はハイブリッドアーキテクチャにおける冗長性の仮定に挑戦する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:26:08 GMT)
Changing Base Without Losing Pace: A GPU-Efficient Alternative to MatMul in DNNs [1.1] 本稿では,ニューラルネットワークにおけるMatMulsの代替的バイリニア演算子を提案する。
実験により,STLはFLOPを2.66倍減らしながらタイルの4x4 MatMulを近似でき,FLOPを低下させながらSoTA T2T-ViT-7(4.3Mパラメータ)のImagenet-1K精度を向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:15:14 GMT)
Inference on Local Variable Importance Measures for Heterogeneous Treatment Effects [1.1] 不均一な治療効果の変動重要度を評価するための推論フレームワークを提供する。
この評価は医学などのリスクの高い領域で特に有用である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:35:33 GMT)
A Unified Perspective on Optimization in Machine Learning and Neuroscience: From Gradient Descent to Neural Adaptation [1.1] 反復最適化は現代人工知能(AI)の中心である
このレビューは、ニューラルネットワークのトレーニングと生物学的学習で古典理論をブリッジする、この主題を統一した視点を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:10:15 GMT)
Offline Policy Evaluation of Multi-Turn LLM Health Coaching with Real Users [1.1] そこで本研究では,実ユーザを対象に,Web上にデプロイされたツール拡張型LDMヘルスコーチについて検討する。
7人のユーザ(280回)からなるパイロットテストにおいて、オフラインポリシ評価は、均一なヘビーツールポリシーがログの平均値を上げるが、特定のサブグループを傷つけることを示している。
隠れアーチタイプを備えた軽量シミュレータは、小さな初期情報ゲインボーナスを追加することで、特性の識別が確実に短縮され、ゴールの成功とパス@3が向上することを示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:43:16 GMT)
"Over-the-Hood" AI Inclusivity Bugs and How 3 AI Product Teams Found and Fixed Them [1.1] 我々は3つのAIプロダクトチームとフィールドスタディを行い、ユーザ向けAI製品にどのようなAI傾斜性バグが存在するか調査した。
83回のAIインクリビティバグ、47のバグインスタンスをカバーする修正、GenderMagのインクルーシブデザインメソッドであるGenderMag-for-AIの新たなバリエーションが見つかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:24:12 GMT)
Residual-guided AI-CFD hybrid method enables stable and scalable simulations: from 2D benchmarks to 3D applications [1.0] XRePITは、機械学習(ML)アクセラレーションとソルバベースの補正を相乗化する、新しいハイブリッドシミュレーション戦略である。
この新設計は、長期間にわたる障壁を克服し、最初の安定的で高速化されたロールアウトを1万以上のタイムステップで達成できることを実証する。
これにより、成熟したスケーラブルなハイブリッド手法が確立され、現実世界のエンジニアリングでの利用方法が確立される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:29:26 GMT)
High-Fidelity Scalable Quantum State Preparation via the Fusion Method [1.0] Rodeo Algorithm (RA) は、目標固有状態への指数収束を提供するが、初期状態と所望固有状態との重なりが低い場合、性能が低下する。
本稿では,この制限を克服するために,断熱ランプによるRA状態を前提とした融合法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:43:07 GMT)
Weight-dependent and weight-independent measures of quantum incompatibility in multiparameter estimation [0.9] マルチ量子推定は、異なるパラメータに対する最適測定の固有の非互換性のために、根本的な課題に直面している。
この非可換性は、対称対数近似の量子Cram'er-Rao境界と微分可能ホレボ境界とのギャップによって定量化される。
この研究は、2つのスカラー測度を導入して対比することにより、このギャップを包括的に分析する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:57:52 GMT)
Multi-Resolution Analysis of the Convective Structure of Tropical Cyclones for Short-Term Intensity Guidance [0.9] 24時間リードによる短期強度予測は, 大西洋TC盆地の災害軽減に不可欠である。
多分解能解析を用いて細かなTC構造を定量化するための簡潔で解釈可能で記述的なアプローチを提案する。
ディープラーニング技術はこのMRAを利用して短期的なインテンシティガイダンスを構築することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:50:42 GMT)
Can we Evaluate RAGs with Synthetic Data? [0.9] 本研究では,大規模言語モデルによって生成された合成質問応答データが,後者が利用できない場合に,人間ラベル付きベンチマークの効果的なプロキシとして機能するかどうかを検討する。
総合ベンチマークは、検索者構成の異なるRAGを確実にランク付けし、人間ラベルのベンチマークベースラインとよく一致していることがわかった。
しかしながら、ジェネレータアーキテクチャの比較において、信頼性の高いRAGランキングを一貫して生成するわけではない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:29:14 GMT)
CLASP: Cost-Optimized LLM-based Agentic System for Phishing Detection [0.9] 本稿では,複数の知的エージェントを活用することにより,フィッシングサイトを効果的に識別する新しいシステムであるCLASPを提案する。
システムはURLまたはQRコードを処理し、URL構造、Webページのスクリーンショット、HTMLコンテンツを評価する特殊なLCMベースのエージェントを使用する。
CLASPは、収集されたデータセットのフィッシング検出のためのF1スコアを40%以上向上し、F1スコアを20%改善した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:38:52 GMT)
CytoNet: A Foundation Model for the Human Cerebral Cortex [0.8] CytoNetは、大脳皮質の高解像度の顕微鏡像パッチを表現的特徴表現にエンコードする基礎モデルである。
本研究では,皮質領域分類,皮質層分割,細胞形態推定,教師なし脳領域マッピングなどのタスクにおいて,上位層の性能を示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:39:23 GMT)
Topoformer: brain-like topographic organization in Transformer language models through spatial querying and reweighting [0.8] そこで我々は,トランスフォーマーを「トポフォーマー」に転換する新たな自己注意方式を提案する。
NLPベンチマークの非トポロジ制御モデルと同等に動作するが、解釈可能なトポロジ組織を生成する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:54:57 GMT)
Prompting the Priorities: A First Look at Evaluating LLMs for Vulnerability Triage and Prioritization [0.8] セキュリティアナリストは、大規模で複雑な脆弱性バックログをトリアージする圧力が高まっている。
半構造化および非構造化の脆弱性情報を解釈するために,12種類のプロンプト技術を用いて4つのモデルを評価する。
我々は165,000以上のクエリを発行し、ワンショット、少数ショット、チェーンオブソートなどのプロンプトスタイルでパフォーマンスを評価する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:48:14 GMT)
Motion2Meaning: A Clinician-Centered Framework for Contestable LLM in Parkinson's Disease Gait Interpretation [0.8] Motion2Meaningは、Contestable AIを前進させるクリニック中心のフレームワークである。
システムを構成する3つの重要なコンポーネントは、歩行データ可視化インタフェース(GDVI)、1次元畳み込みニューラルネットワーク(1D-CNN)で、Hoehn & Yahrの重大度を予測し、Contestable Interface(CII)である。
XMEDは、誤った予測における説明の不一致の5倍の増大を検出することにより、モデル不確実性をうまく識別する。
我々のLCMを利用したインタフェースにより、臨床医は正しい予測を検証し、モデルのエラーの一部に挑戦できる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:04:58 GMT)
High-Fidelity And Complex Test Data Generation For Google SQL Code Generation Services [0.8] 高忠実度テストデータの需要は、生産データへのアクセスがほとんど制限されている産業環境で最重要である。
従来のデータ生成手法は、しばしば不足し、低忠実さと複雑なデータ構造とセマンティックな関係をモデル化する能力に悩まされる。
我々は,Large Language Models(LLM)を活用して,戦略的前処理と後処理のステップを取り入れることで,構文的に正確で意味的に関連する高忠実性テストデータを生成することを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:38:57 GMT)
Comparative Expressivity for Structured Argumentation Frameworks with Uncertain Rules and Premises [0.8] ルールや前提内で構造化された抽象モデルの妥当なインスタンス化について検討する。
我々の主な技術的貢献は、抽象的および構造化された形式主義を扱える表現性の概念の導入である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:36:38 GMT)
Uncertainty quantification of a multi-component Hall thruster model at varying facility pressures [0.8] このモデルは陰極、放電、配管のサブモデルで構成され、スラスタ性能指標を出力する。
模擬推力器には、クリプトンで作動する磁気シールドスラスタ、H9、キセノンで作動する無シールドスラスタ、SPT-100が含まれる。
キャリブレーション後のモデルでは、イオン加速領域における推力および上流シフトの変化を含む、主要な圧力関連トレンドを捉えている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:02:48 GMT)
Effectiveness of High-Dimensional Distance Metrics on Solar Flare Time Series [0.8] 太陽フレアデータセットSWAN-SFにおけるパターン検出のための弾性距離測定
我々は,高度・高次元距離メトリクスの有効性を評価するために,単純な$k$-medoidsクラスタリングアルゴリズムを用いる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:58:40 GMT)
Beyond Point Matching: Evaluating Multiscale Dubuc Distance for Time Series Similarity [0.8] 時系列は高次元で複雑なデータオブジェクトである。
本稿では,最近導入された類似度尺度であるMultiscale Dubuc Distance(MDD)に基づく。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:44:48 GMT)
AndroidControl-Curated: Revealing the True Potential of GUI Agents through Benchmark Purification [0.8] SiriやGoogle Assistantのようなデバイス上のバーチャルアシスタントはますます重要になっているが、その能力は厳格でデベロッパーに依存したAPIに依存している。
Guiエージェントは強力なAPIに依存しない代替手段を提供するが、その採用はパフォーマンスの低下に対する認識を妨げる。
私たちの研究によると、問題はモデルだけでなく、ベンチマーク自体にあります。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:11:33 GMT)
Deep Learning-Based Control Optimization for Glass Bottle Forming [0.7] 本研究では,実運用環境における生成過程の最適化を目的としたディープラーニングに基づく制御アルゴリズムを提案する。
我々のニューラルネットワークは、アクティブな製造工場の実際の運用データを用いて、現在の生産設備に基づいてパラメータ変化の影響を予測する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:42:35 GMT)
A Frequentist Statistical Introduction to Variational Inference, Autoencoders, and Diffusion Models [0.7] 変分推論(VI)は変分オートエンコーダ(VAE)やDDM(Denoising Diffusion Models)のような現代の生成モデルの中心である
我々は、VIが難解なEステップのスケーラブルなソリューションとして現れ、VAEとDDMがこのフレームワークの自然なディープラーニングベースの拡張であることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:25:19 GMT)
Prior-informed optimization of treatment recommendation via bandit algorithms trained on large language model-processed historical records [0.7] 現在の医療実践は、患者個別のバリエーションを無視した標準化された治療枠組みと経験的手法に依存している。
本研究では,Large Language Models (LLMs), Conditional Tabular Generative Adversarial Networks (CTGAN), T-learner counterfactual model, and contextual bandit approachを統合した総合システムを構築した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:57:00 GMT)
Grid-Partitioned MWIS Solving with Neutral Atom Quantum Computing for QUBO Problems [0.7] 擬似非制約二項最適化問題に対処するハイブリッド量子古典的フレームワークを提案する。
我々のフレームワークは、大規模最適化問題を効率的に解くための有望な道を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:36:13 GMT)
A Digital Twin Framework for Decision-Support and Optimization of EV Charging Infrastructure in Localized Urban Systems [0.7] この研究は、デジタルツインフレームワークの提案により、静的モデルを超えて進んでいる。
エージェントベースの意思決定サポートと組込み最適化を統合し、EV充電動作を動的にシミュレートする。
モデルはベトナムのハノイの地方都市に適用される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:26:35 GMT)
A Unified Formal Theory on the Logical Limits of Symbol Grounding [0.7] 形式的なシステム内での意味は、外的、動的、非アルゴリズム的なプロセスから生じなければならないことを示す。
この制限は、あらかじめ確立された意味の有限で静的な集合を持つ系に拡張する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:29:52 GMT)
Illusions of reflection: open-ended task reveals systematic failures in Large Language Models' reflective reasoning [0.6] 人間は「反射」がゴールとその制約に結びついているため、途中でミスを犯すことが多い。
閉じたタスクに対する事前の作業は、自己補正の限界を隠蔽しながら「振り返り」を効果的に見せることができることを示す。
以上の結果から,現在のLLMの反射は,最初のパスでもヒトが制約を尊重するのに役立つ,アクティブで目標駆動型のモニタリングの機能的証拠を欠いていることが示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:24:21 GMT)
Ensemble based Closed-Loop Optimal Control using Physics-Informed Neural Networks [0.6] 本研究は,最適コスト・ツー・ゴーおよびそれに対応する最適制御信号を学習するための多段階アンサンブル・フレームワークを提案する。
安定化項は使用せず、特異学習制御信号またはアンサンブル制御信号ポリシーを介して非線形システムを制御する手段を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:41:41 GMT)
Efficient Few-shot Identity Preserving Attribute Editing for 3D-aware Deep Generative Models [0.6] 顔の同一性を保存することは、照明の修正、眼鏡の追加・削除、顔の老化、髪型の編集、表現の修正などを可能にする生成タスクである。
本稿では,最近の3次元認識深部生成モデルと2次元画像編集技術の進歩に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:27:46 GMT)
CPSLint: A Domain-Specific Language Providing Data Validation and Sanitisation for Industrial Cyber-Physical Systems [0.5] 本稿では,産業用CPSのデータ準備を目的としたドメイン特化言語CPSLintを紹介する。
主な機能は型チェックとデータ列の検証と修正による制約の強制である。
より高度な機能は、カラムワイドと行ワイドの両方で追加のCPS固有のデータ構造を推測する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:59:56 GMT)
Is Implicit Knowledge Enough for LLMs? A RAG Approach for Tree-based Structures [0.5] 大規模言語モデル(LLM)は、文脈内の情報に基づいて応答を生成するのに適している。
Retrieval-Augmented Generation (RAG)は、関連する文書を検索して、モデルのコンテキスト内学習を強化する。
本稿では,木構造からの知識を線形化する手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:10:00 GMT)
Streamlining Acceptance Test Generation for Mobile Applications Through Large Language Models: An Industrial Case Study [0.5] AToMICは受け入れテストアーティファクトを作成するための自動化フレームワークである。
これはBMWのMyBMWアプリに適用され、170以上のスクリーンで13の現実世界の問題をカバーしています。
AToMICは標準ハードウェアで1機能あたり5分未満で実行可能なテストアーティファクトを生産した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:54:09 GMT)
LAMP-PRo: Label-aware Attention for Multi-label Prediction of DNA- and RNA-binding Proteins using Protein Language Models [0.5] LAMP-PRoは、事前学習されたタンパク質言語モデル(PLM)、注意機構、マルチラベル学習に基づいている。
我々はDNA結合タンパク質とRNA結合タンパク質の依存関係を明示的に捉える新しいラベル間アテンション機構を含む。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:08:07 GMT)
Low Depth Color Code Circuits with CXSWAP gate [0.5] カラーコードのための新しい2種類のシンドローム抽出回路を提案する。
私たちの最初の構築は、[M. McEwen, D. Bacon, C. Gidney, Quantum 7, 1172 (2023)の後で、バルクデータと測定量子ビットの役割を定期的に交換することでリークエラーを軽減することを約束しています。
2番目の構造は、CNOTの代わりにCXSWAPゲートを使用することで、[C. Gidney and C. Jones, arXiv:2312.08813 (2023) と比較して回路深さを減少させる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:18:13 GMT)
Deep Q-Learning Assisted Bandwidth Reservation for Multi-Operator Time-Sensitive Vehicular Networking [0.5] 本論文では,Double Deep Q-Network (DDQN) に基づく最適戦略を用いた新しい多目的帯域予約更新手法を提案する。
提案手法は,全シナリオの帯域幅コストを40%削減し,不確実な状況を低コストで解決するものである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:03:21 GMT)
Privacy-Preserving Healthcare Data in IoT: A Synergistic Approach with Deep Learning and Blockchain [0.5] 医療におけるIoT(Internet of Things)デバイスの統合は、リアルタイム監視、パーソナライズされた治療、効率的なデータ管理を可能にして、患者のケアに革命をもたらした。
従来のセキュリティ対策は、IoT環境がもたらすユニークな課題に対処するには不十分であることが多い。
我々は,IoT対応医療システムのセキュリティと信頼性を高めるために,総合的な3段階セキュリティフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:21:49 GMT)
Fusion of Machine Learning and Blockchain-based Privacy-Preserving Approach for Health Care Data in the Internet of Things [0.5] IoT(Internet of Things)デバイスの医療分野への迅速な統合は、患者のケアとデータ管理において革命的な進歩をもたらした。
これらの技術革新は、特に潜在的なサイバー脅威に対する医療データの保護において、重要なセキュリティ上の懸念を提起する。
本稿では,IoTベースの医療システムにおけるセキュリティ強化の必要性に対処するために,3つの異なるフェーズを包含する包括的手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:09:46 GMT)
Demonstrators for Industrial Cyber-Physical System Research: A Requirements Hierarchy Driven by Software-Intensive Design [0.5] 本稿では,実証実験の実現可能性を評価するための実証者要件策定フレームワークを提案する。
本論文の応用範囲は,ソフトウェア集約システムと産業用サイバー物理システムの領域である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:25:19 GMT)
From Memorization to Generalization: Fine-Tuning Large Language Models for Biomedical Term-to-Identifier Normalization [0.5] 大きな言語モデルは、約束を示すが、用語間で不均一に実行する。
一般化はタンパク質遺伝子マッピング(GENE)にのみ行われた。
ファインチューニングは、スパース識別子や非語彙化識別子によって失敗するのに対して、ファクトリコールを強化する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:39:10 GMT)
Trapped-ion quantum simulation of the Fermi-Hubbard model as a lattice gauge theory using hardware-aware native gates [0.4] トロタライズに基づく量子シミュレーションは将来性を示しているが、現在のハードウェアの実装はノイズによって制限されている。
Z2 LGTへのFermi-Hubbardモデルのマッピングが最近提案され、追加の対称性で保護された部分空間にダイナミクスを制限し、ノイズのある古典的シミュレーションによって選択後の誤差軽減の能力が検証された。
特に、反復事前条件勾配降下(IPG)とサブシステムフォン・ノイマンエントロピー圧縮の組み合わせにより、FHM量子シミュレーションの2ビットゲート数を35%削減する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:28:42 GMT)
A Distributed Framework for Causal Modeling of Performance Variability in GPU Traces [0.4] 本稿では,大規模GPUトレースの処理を効率的に行うために,エンドツーエンドの並列性能解析フレームワークを提案する。
提案するフレームワークのパーティショニングとプロセスは並列にトレースデータを処理し,因果グラフ法と並列コーディネートチャートを用いて実行フロー間の性能変動と依存性を明らかにする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:11:29 GMT)
Decay of uniformly rotating particles [0.4] 一般的な座標変換の下では,スカラー場を含む逆2ドルプロセスの木面崩壊速度は,コボッキングフレームに熱浴を導入する必要がなく,スカラーとなることを示す。
我々は、任意の崩壊過程を負エネルギー量子の放出と解釈し、その存在は、一様回転する観測者のための大域真空状態が存在しないことによって動機づけられる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:24:27 GMT)
CrossRay3D: Geometry and Distribution Guidance for Efficient Multimodal 3D Detection [0.4] クロスモダリティ検出器は、Bird's-Eye-View(BEV)検出器よりも多くの利点を提供している。
既存のスパース検出器はトークン表現の質を見落とし、準最適品質と限られた性能を残している。
本稿では,形状構造とクラス分布がスパース検出器の性能向上の鍵であることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:36:45 GMT)
Enhancing Hotel Recommendations with AI: LLM-Based Review Summarization and Query-Driven Insights [0.4] 大規模言語モデル(LLM)は、ユーザレビューから重要な洞察を要約し、マイニングすることで、短い賃貸住宅のレコメンデーションを強化することができる。
本論文で提示されたWebアプリケーションは,Booking.com プラットフォーム上のプロパティからテキストベースのユーザレビューを分離する手順を "instaGuide" という名で自動化する。
以上の結果から,LLMによる要約により,利用者が適切な短期賃貸アパートの検索に費やす時間を大幅に削減できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:02:51 GMT)
VelocityNet: Real-Time Crowd Anomaly Detection via Person-Specific Velocity Analysis [0.4] 本稿では,頭部検出と高密度光流を組み合わせて人固有の速度を抽出する,二重パイプラインフレームワークであるVelocityNetを紹介する。
密集した環境下での多様な異常な動きパターンをリアルタイムに検出する上で,本フレームワークの有効性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:26:54 GMT)
$μ$OpTime: Statically Reducing the Execution Time of Microbenchmark Suites Using Stability Metrics [0.4] $mu$OpTimeは、microbenchmarkスイートの実行時間を短縮するための静的なアプローチである。
CI/CDパイプラインのパフォーマンスレグレッションを確実に検出するために、$mu$OpTimeを使用することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:54:42 GMT)
AI4DiTraRe: Building the BFO-Compliant Chemotion Knowledge Graph [0.4] 本稿では,BFO準拠のChemotion Knowledge Graphを構築するためのセマンティックパイプラインを提案する。
Chemotion-KG APIは、化学におけるAI駆動の発見と推論をサポートするために、FAIR原則に従うために開発された。
ソースコードとデータセットはGitHubから公開されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:03:17 GMT)
Unlocking Biomedical Insights: Hierarchical Attention Networks for High-Dimensional Data Interpretation [0.4] Hierarchical Attention-based Interpretable Network (HAIN) は、多段階の注意機構、次元減少、説明駆動損失関数を統一する新しいアーキテクチャである。
がんゲノムアトラスデータセットの包括的な評価は、HAINが94.3%の分類精度を達成したことを示している。
HAINは生物学的に関連するがんバイオマーカーを効果的に同定し、臨床および研究用途に有用である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:08:50 GMT)
Dynamical model parameters from ultrasound tongue kinematics [0.4] 超音波舌運動学から線形高調波発振器のパラメータを確実に推定できるかどうかを評価する。
超音波とEMAは同等の動的パラメータを呈し, 下顎短手追跡も顎運動を適切に捉えている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:34:13 GMT)
EdgeReasoning: Characterizing Reasoning LLM Deployment on Edge GPUs [0.4] エッジGPU上の推論タスクのための大規模言語モデル(LLM)は、厳格なレイテンシ制約と限られた計算リソースから重要な課題に直面している。
これらの制約をナビゲートするには、推論と非推論アーキテクチャのバランス、適切なモデルサイズの選択、トークン予算の割り当て、テスト時のスケーリング戦略の適用が必要です。
We present EdgeReasoning, a comprehensive study that the deployment of reasoning LLMs on edge GPUs。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:18:25 GMT)
Symbolic Emulators for Cosmology: Accelerating Cosmological Analyses Without Sacrificing Precision [0.4] 我々は,$Lambda$CDM共役距離と線形成長係数に対する超幾何関数の近似を導入する。
シンボリックエミュレータをダークエネルギーサーベイのような3時間2$pt分析に統合すると、標準数値法で得られたものと一致した宇宙論的制約が生じることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:57:23 GMT)
Growth and collapse of subsystem complexity under random unitary circuits [0.3] 進化時間の関数としてのサブシステムの密度行列の減少の複雑性について検討する。
状態複雑性は、与えられた状態を生成するための局所量子チャネルの最小数として定義される。
ホログラフ対応を用いて、より小さな部分系の状態複雑性が実際に時間$T = ell/2$まで線形に成長し、突然0に崩壊することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:59:34 GMT)
SemiAdapt and SemiLoRA: Efficient Domain Adaptation for Transformer-based Low-Resource Language Translation with a Case Study on Irish [0.3] 微細チューニングは、ニューラルマシン翻訳(NMT)のような特定のタスクのために、大きな言語モデルを調整するために広く使用されている。
モデルパラメータのごく一部をトレーニングすることでギャップを埋める半効率微調整(PEFT)を導入する。
我々は,SemiAdaptがフルドメインファインチューニングより優れていることを示す一方,SemiLoRAはPEFTメソッドをプロペラしてフルモデルファインチューニングより優れていることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:24:15 GMT)
Computational Foundations for Strategic Coopetition: Formalizing Interdependence and Complementarity [0.3] 本報告では、相互依存と相補性という2つの臨界次元を形式化する計算基盤を開発する。
我々は,i*構造依存解析における相互依存を基礎とし,従属関係を構造的翻訳フレームワークを通じて定量的相互依存係数に変換する。
我々は,Branenburger と Nalebuff の Added Value の概念に従って相補性を形式化し,パラメータ化の検証による相乗的値生成をモデル化する。
Nash Equilibriumが構造的相互依存を取り入れたゲーム理論の定式化を導入する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:57:40 GMT)
Facts are Harder Than Opinions -- A Multilingual, Comparative Analysis of LLM-Based Fact-Checking Reliability [0.3] 本稿では,複数の言語やトピックに61,514のクレームを含む新しい動的データセットを導入し,既存のデータセットを2024年まで拡張する。
GPT-4o, GPT-3.5 Turbo, LLaMA 3.1, Mixtral 8x7B の5つの主要言語モデル(LLM)を評価した。
すべてのモデルにおいて、事実に耳を傾ける主張は意見よりもしばしば誤分類され、重要な脆弱性が明らかになる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:09:04 GMT)
Integrating Large Language Models and Evaluating Student Outcomes in an Introductory Computer Science Course [0.3] 大規模大学におけるCS1-LLMコースの設計と評価について述べる。
我々は,新たなCS1-LLMコースの作成に使用される設計原則,新たなコース目標,学生の成果と知覚の評価について述べる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:59:54 GMT)
Combining Cost-Constrained Runtime Monitors for AI Safety [0.3] 複数のランタイムモニタを単一の監視プロトコルに効率的に組み合わせる方法について検討する。
我々のフレームワークは、望ましくない振る舞いを検出するために既存のモニターを組み合わせるための原則化された方法論を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:27:13 GMT)
Seg the HAB: Language-Guided Geospatial Algae Bloom Reasoning and Segmentation [0.3] 有害藻の開花(HAB)は、酸素欠乏、毒素の放出、海洋生物多様性の破壊を通じて、水生生態系と人間の健康を脅かす。
手動水サンプリングのような従来のモニタリング手法は、労働集約的であり、定量化と時間的カバレッジに制限がある。
リモートセンシングのための視覚言語モデル(VLM)の最近の進歩は、AI駆動型ソリューションの可能性を示しているが、画像の推論や重症度の向上には課題が残っている。
本研究では, リモートセンシング画像認識と重度推定を組み合わせた, HABモニタリングのためのセグメンテーション・アンド・レゾニングシステムであるALGOSを紹介する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:59:00 GMT)
Enhancing a Convolutional Autoencoder with a Quantum Approximate Optimization Algorithm for Image Noise Reduction [0.2] 多くの畳み込みオートエンコーダアルゴリズムは、画像の復調に有効であることが証明されている。
本稿では,量子畳み込みオートエンコーダ(QCAE)を提案する。
従来の畳み込みオートエンコーダは、QAOAにインスパイアされたアンサッツ回路によって実装された量子対数空間に置き換えることで強化される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:54:32 GMT)
Dynamic Switched Quantum Key Distribution Network with PUF-based authentication [0.2] 本稿では、各QKDリンクに対してPUFベースの動的認証を統合して、中央制御された動的切替QKDネットワークを示す。
リアルタイムPUFを用いた動的切替QKDネットワークの性能を解析した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:32:25 GMT)
Source-device-independent monolithically integrated QRNG in a black box with generation rate in excess of 30 Gbit/s [0.2] 量子力学はランダム数を生成するセキュアな手段を提供し、科学シミュレーションから暗号への応用がある。
最初のソースデバイスに依存しないモノリシックに集積された量子乱数生成器が報告されている。
生成速度35Gbit/sのデバイスは、量子真空状態エントロピー源を備えたInPフォトニック集積回路に基づいている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:56:17 GMT)
Decoding Funded Research: Comparative Analysis of Topic Models and Uncovering the Effect of Gender and Geographic Location [0.2] 本研究は,カナダ自然科学工学研究協議会(NSERC)が出資した18年間(2005-2022年)の研究提案を分析した。
我々は,LDA(Latent Dirichlet Allocation),STM(Structure Topic Modelling),BERTopic(BERTopic)の3つのトピックモデリング手法の比較評価を行った。
以上の結果から, BERTopicはより粒度が高く, 一貫性があり, 創発的なテーマを識別し, 優れた性能を発揮することが示唆された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:58:00 GMT)
AI Debaters are More Persuasive when Arguing in Alignment with Their Own Beliefs [0.1] 我々は主観的な質問に議論を適用し、実験の前に大きな言語モデルの事前の信念を明示的に測定する。
我々は2つの議論プロトコルを逐次かつ同時に実装し、潜在的体系的バイアスを評価する。
本研究の主目的は, モデルが従来の信念よりも, 判断ペルソナと整合した姿勢を擁護する傾向にあることにある。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:50:28 GMT)
FP-IRL: Fokker-Planck Inverse Reinforcement Learning -- A Physics-Constrained Approach to Markov Decision Processes [0.1] 我々はFokker--Planck逆強化学習(FP-IRL)を提案する。
FP-IRLは、サンプルトランジションへのアクセスを必要とせず、報酬関数と遷移関数の両方を軌道データから直接推論する。
その結果、FP-IRLは、計算効率と物理的解釈可能性を維持しながら、エージェントインセンティブの正確な回復を実現することがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:28:23 GMT)
Overparametrization bends the landscape: BBP transitions at initialization in simple Neural Networks [0.1] 高次元の非学習損失は、機械学習の理論において中心的な役割を果たす。
我々は、ヘッセンの開始時のスペクトルを分析し、レシエーションを分離するデータの量におけるベイク・ベン・オーラス・パラムチエ(Baik-Ben Arous-param'ech'e, BBP)遷移を同定する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:08:58 GMT)
Discovering the curriculum with AI: A proof-of-concept demonstration with an intelligent tutoring system for teaching project selection [0.1] 本研究では,現実人向けに最適化されたプロジェクト選択戦略を自動的に発見する手法を開発した。
また,発見したプロジェクト選択手順を学習するインテリジェントチューターを開発した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:07:37 GMT)
Single-Beam Magneto-Optical Trap in Back-to-Back Pyramidal and Conical Mirrors [0.1] 三次元磁気光学トラップ (MOT) は室温原子蒸気から低温原子を効率的に生成する方法である。
本稿では,バック・ツー・バックのピラミッド鏡と円錐鏡を用いたシングルビームMOTを提案する。
バック・ツー・バックの円錐鏡でMOTを実演し、背景蒸気から1000万ルビジウム-87原子をロードし、偏光勾配を用いて原子を7 muKに冷却する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:44:01 GMT)
Disorder-Induced Anomalous Diffusion in a 3D Spin Network [0.1] 本研究では, 核スピンアンサンブルを局所測定により解析し, 核スピンアンサンブルについて検討した。
双極子スピンアンサンブルにおけるパーコレーションネットワークの創発的フラクタル構造上のランダムウォークとしてモデル化したサブ拡散状態への明らかな位相遷移を観察する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:07:31 GMT)
Parametrising the Inhomogeneity Inducing Capacity of a Training Set, and its Impact on Supervised Learning [0.0] 我々は、与えられたトレーニングセットのこの性質のパラメトリクスを、その不均一性パラメータとして参照する」。
非ゼロ不均一パラメータを持つトレーニングセットが命令的であることを証明し、要求関数をモデル化するために呼び出されるプロセスが非定常であることを証明した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:34:22 GMT)
Chip-to-chip hyperentanglement distribution and entanglement purification using silicon integrated photonics [0.0] 本稿では,集積チップを用いたチップ対チップのハイパーエンタングルメント分布と量子エンタングルメントの精製について述べる。
集積フォトニクスによる浄化方式は、オンチップ量子リピータの最後のパズルを終わらせた。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:18:34 GMT)
Understanding Reinforcement Learning for Model Training, and future directions with GRAPE [0.0] 本稿では, 自己完結型, オフスクラッチ型, キーアルゴリズムの表現によるモデルのチューニングについて述べる。
これらのアルゴリズムの説明は、しばしば事前の知識を仮定し、重要な詳細を欠いている、あるいは過度に一般化され複雑である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:29:40 GMT)
Ground states of quasi-two-dimensional correlated systems via energy expansion [0.0] 本研究では,空間異方性2次元多体量子システムに適用可能な基底状態の汎用計算法を提案する。
我々は、弱結合鎖の3つの特定の2次元系(ハードコアボソン、スピン-1/2$ハイゼンベルク・ハミルトン、反発相互作用を持つスピンフルフェルミオン)に新しい手法を適用した。
前例のない大きさの格子を扱い、この系に準1次元の隙間のないスピン液体が存在することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:36:48 GMT)
Who cuts emissions, who turns up the heat? causal machine learning estimates of energy efficiency interventions [0.0] 英国住宅の全国的代表データに基づいて学習した因果機械学習モデルを用いる。
壁絶縁のガス消費に対する平均的および条件的処理効果を推定した。
低エネルギー負荷群は大幅な貯蓄を達成する一方、高いエネルギー負荷を経験する群は、ほとんど、あるいは全く減少しない。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:53:09 GMT)
When Your AI Agent Succumbs to Peer-Pressure: Studying Opinion-Change Dynamics of LLMs [0.0] ピアプレッシャーがLarge Language Model(LLM)エージェントの意見にどのように影響するかを,認知的コミットメントの範囲にわたって検討する。
エージェントは、低圧で安定し、閾値で急変し、高度に飽和するシグモイド曲線に従う。
我々は、肯定的な意見から否定的な意見への転換が、逆よりも認知的な努力を必要とする、基本的な「説得的非対称性」を明らかにする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:02:15 GMT)
When Strings Tug at Algorithm: Human-AI Sovereignty and Entanglement in Nomadic Improvisational Music Performance as a Decolonial Exploration [0.0] 本研究では,人間-AIの主権におけるパワーダイナミクスと,遊牧的な即興デュタル演奏の絡み合いを問う。
著者らは、植民地化の可能性には、文化的生存のためのツールやシステムの再設計が必要であると結論付けている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:24:17 GMT)
Wavelet-based GAN Fingerprint Detection using ResNet50 [0.0] GAN(Generative Adversarial Networks)は、デジタル画像法医学において重要な課題となっている。
本研究では、離散ウェーブレット変換前処理を用いたウェーブレットに基づく検出手法を提案する。
提案手法は,GAN画像の検出におけるウェーブレット領域解析の有効性を示し,将来的なディープフェイク検出システムの可能性を強調した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:40:16 GMT)
Viability of perturbative expansion for quantum field theories on neurons [0.0] 無限のニューロン数制限では、単層NNは局所量子場理論を正確に再現することができる。
再正規化された$O(1/N)$を2点と4点の相関子に補正すると、紫外線遮断に敏感な摂動列が得られる。
我々は,この収束性を改善するためにアーキテクチャの変更を提案し,理論のパラメータとNのスケーリングに関する制約について議論し,正確な場の理論結果の抽出を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:47:43 GMT)
Vector spin polarization evolution determined in an entangled muon-fluorine system under pulsed excitation [0.0] フッ化物に注入されたスピン偏極ミューオンは、ムーンスピンと隣接するフッ素核スピンが絡み合うF--$$-F複合体を形成する。
ここでは、この結合系に高周波励起を適用し、放射された陽電子の3次元分布を用いて、ミューオンスピン分極の時間依存性の進化を再構築する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:35:27 GMT)
Training-Free Spectral Fingerprints of Voice Processing in Transformers [0.0] 異なる変換器アーキテクチャが、異なる接続パターンを介して同一の言語計算を実装していることを示す。
注意誘導トークングラフ上でのグラフ信号処理を用いて、20言語と3つのモデルファミリ間の接続性の変化を追跡する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 23:33:43 GMT)
The exact convex roof for GHZ-W mixtures for three qubits and beyond [0.0] ブロッホ球面内のすべての状態に対して、3つの三角形の平方根の凸屋根の正確な解を示す。
最適な分解を行う作業馬は、ゼロ状態ロックと呼ばれることができるゼロポリトープからできるだけ多くの状態を含むことが証明される。
ここでは、分解の最適性を決定する不等式が導出される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:04:11 GMT)
The Shift Towards Preprints in AI Policy Research: A Comparative Study of Preprint Trends in the U.S., Europe, and South Korea [0.0] オープンサイエンスの採用により、人工知能(AI)政策研究が世界中でどのように分散されているかが急速に変化した。
本研究は、新型コロナウイルスのパンデミックとChatGPTのリリースという、2つの大きなディスラプティブイベントの影響に焦点を当て、プレプリントの引用における地域的傾向について検討する。
米国は急激でイベント駆動的な成長を示し、ヨーロッパは制度的な成長を示し、韓国は印刷前の採用において一貫した線形的な成長を維持した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:17:02 GMT)
The MUSE Benchmark: Probing Music Perception and Auditory Relational Reasoning in Audio LLMS [0.0] 本稿では,音楽理解・構造評価(MUSE)ベンチマークについて紹介する。
我々は、大規模なヒトベースライン(N0)に対して4つのSOTAモデルを評価する。
以上の結果から,SOTAの能力は多岐にわたることが判明した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:14:36 GMT)
Symmetry-accelerated classical simulation of Clifford-dominated circuits [0.0] 我々は、安定度計算における対称性を利用して、実数、対角、実対角のユニタリに対して、最適化が最適性を失うことなくクリフォード群の対応する部分群に制限できることを証明した。
この強い対称性の低下」は計算コストを大幅に削減し、標準ラップトップを使用して最大7キュービットのユニタリを最適に分解することを可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:01:14 GMT)
Symbolic verification of Apple's Find My location-tracking protocol [0.0] 我々は、Finder Myプロトコルのシンボリックモデルと、望ましいプロパティの正確な正式な仕様を示す。
これらの性質の機械チェック可能な自動証明を玉林証明器で提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:04:23 GMT)
StutterZero and StutterFormer: End-to-End Speech Conversion for Stuttering Transcription and Correction [0.0] この研究で紹介されるStutterZeroとStutterFormerは、最初のエンドツーエンドの波形-波形モデルである。
すべてのベンチマークで、StutterZeroはWord Error Rate(WER)を24%削減し、Whisper-Mediumモデルと比較して意味的類似性(BERTScore)を31%改善した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:54:36 GMT)
Spectral statistics and energy-gap scaling in $k-$local spin Hamiltonians [0.0] 正確な$k$スピンに作用する全ての相互作用するスピンハミルトニアンのスペクトル特性について検討する。
$mu = 0$ の場合、ランダム行列のアンサンブルはシステムサイズ $L$ と局所性 $k$ のパリティによって決定されることを示す。
本研究では,確率行列統計学の普遍的特徴とスペクトルギャップ形成を捉える半可解モデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:17:49 GMT)
Simulating high-accuracy nuclear motion Hamiltonians in discrete variable representation using Walsh-Hadamard QROM with fault-tolerant quantum computers [0.0] 本稿では,フォールトトレラント量子コンピュータ上での弁証的ハミルトニアンのシミュレートのための量子アルゴリズムを提案する。
水の公約スペクトルを計算するのに必要な量子体積は最大105ドルまで削減できる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:31:12 GMT)
Simple logical quantum computation with concatenated symplectic double codes [0.0] シンプレクティックな二重符号は、ほぼ最先端の物理的誤り率で有望な性能を示す。
シンプレクティックな二重符号は、中規模から大規模の量子コンピュータにおける基礎となる計算符号として強力な競合相手である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:00:44 GMT)
Sherlock Your Queries: Learning to Ask the Right Questions for Dialogue-Based Retrieval [0.0] SherlockLLMは、Reinforcement Learning (RL)を通じて最適な質問戦略を学ぶ対話駆動検索フレームワークである。
本フレームワークでは,探索空間を効率的に絞り込むために,エージェントが2次質問列を生成するように訓練する。
実験の結果,SherlockLLMは堅牢で効率的な解であることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:10:42 GMT)
Sharp Transitions for Subsystem Complexity [0.0] 純粋量子状態の時間進化サブシステムの回路複雑性について検討する。
より半減なサブシステムサイズでは、その複雑さは指数関数的に長い時間に線形に増大する。
半減なサブシステムサイズの場合、複雑性は上昇し、その後低下し、サブシステムが平衡するにつれて、低い複雑性に戻る。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:28:00 GMT)
Securing IoT Communications via Anomaly Traffic Detection: Synergy of Genetic Algorithm and Ensemble Method [0.0] モノのインターネットの急速な成長は、コネクテッドデバイス間でシームレスなデータ交換を可能にすることで産業を変革させた。
IoTネットワークは、DoS(DoS)攻撃、異常トラフィック、データ操作など、セキュリティ上の脅威に対して脆弱なままである。
本稿では,3つの主要な位相を持つ高度な異常検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:42:05 GMT)
SITS-DECO: A Generative Decoder Is All You Need For Multitask Satellite Image Time Series Modelling [0.0] 本稿では,EOデータに統一シーケンスフレーミングを適用する概念実証モデルであるSITS-DECOを紹介する。
モデルが単一統一アーキテクチャ内で複数の教師付きタスクや自己監督型タスクを実行できることを示す。
単純さと空間的文脈の欠如にもかかわらず、SITS-DECOは作物型分類におけるより大きなEO基盤モデルよりも優れている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:42:55 GMT)
Renormalized dual basis for scalable simulations of 2+1D compact quantum electrodynamics [0.0] 本稿では, 単一括弧問題の解法に基づき, 再正規化デュアルバス(Renormalized Dual Basis, RDB)と呼ばれる新しいトランケーション方式を導入する。
我々は、RDBが全ての結合体制を横断する効率的な記述を提供することを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:51:04 GMT)
Regression is all you need for medical image translation [0.0] 医療画像翻訳のための2.5D拡散型フレームワークであるYODAを提案する。
従来の拡散サンプリングはノイズを再現するので,物理信号平均化と同様,複数のサンプルを描画し,平均化する。
また,最初のDM予測を保ち,反復補正を緩和して1ステップでノイズフリーな画像を生成する回帰サンプリング YODAを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:30:39 GMT)
RAISE: A Unified Framework for Responsible AI Scoring and Evaluation [0.0] RAISE(Responsible AI Scoring and Evaluation)は、4次元にわたるモデルパフォーマンスを定量化し、それらを単一のResponsibility Scoreに集約する統合フレームワークである。
トランスフォーマーは非常に高い環境コストで説明可能性と公正性に優れ、Tabular ResNetはバランスの取れたプロファイルを提供した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:15:13 GMT)
Quantum-selected configuration interaction with time-evolved state [0.0] 量子選択構成相互作用(QSCI)は、量子デバイス上の入力量子状態を使用して重要な基底を選択する。
対象のハミルトン状態(初期状態)をQSCIの入力として用いることを提案する。
小分子の電子状態を記述する量子化学ハミルトニアン法により得られたエネルギーの精度を数値的に検討する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:38:01 GMT)
Quantum improved wormholes in the Dekel-Zhao dark matter halo [0.0] 本研究は, Asymptotically Safe Gravity (ASG) の枠組みにおける新規なワームホール溶液の提示と研究である。
スケール依存重力結合$G(k)$は、赤外線状態におけるASG再正規化群の流れから導かれるもので、場の方程式に直接組み込まれている。
アディバティックな音速とトルマン-オッペンハイマー-ボルコフ方程式に基づく解析により、ASGの量子効果がダークマターの不安定な影響に反することを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:32:51 GMT)
Prompt Decorators: A Declarative and Composable Syntax for Reasoning, Formatting, and Control in LLMs [0.0] 本稿では,コンパクトな制御トークンを通じて動作を管理する宣言的・構成可能な構文であるPrompt Decoratorsを紹介する。
それぞれのデコレータは、タスクの内容を変更することなく、冗長な推論スタイル、構造、トーンなどの振る舞いの次元を変更する。
それは、予測可能で監査可能な振る舞い合成を可能にする統一構文、スコーピングモデル、決定論的処理パイプラインを定義する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:35:49 GMT)
Practical Use Cases of Neutral Atoms Quantum Computers [0.0] ライドバーグ相互作用に基づく中性原子量子プロセッサが注目されている。
本稿では,中性原子コンピュータの能力,規格,応用について概説する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:34:04 GMT)
Position: Many generalization measures for deep learning are fragile [0.0] 我々は、多くのポストモーテム一般化対策 -- 訓練されたネットワーク上で計算された -- は、textbffragileであると主張している。
基礎となるDNNにほとんど影響を与えない小さなトレーニング修正は、測定値の価値、傾向、スケーリングの振る舞いを大きく変える可能性がある。
このポジションペーパーでは、新しい対策の開発者は、脆弱性について明確に監査すべきである、と論じている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:44:41 GMT)
Physics-guided Emulators Reveal Resilience and Fragility under Operational Latencies and Outages [0.0] 我々はGlobal Flood Awareness System(GloFAS)の運用可能なエミュレータを開発した。
我々はGloFASの水理コアを再生し、情報品質が低下するにつれて滑らかに劣化する。
このフレームワークは、水文機械学習の計測可能な特性として、運用上の堅牢性を確立する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:25:31 GMT)
Patent Language Model Pretraining with ModernBERT [0.0] われわれは、ModernBERTアーキテクチャと6000万以上の特許記録をキュレートしたコーパスを用いて、ドメイン固有の3つのマスク付き言語モデルを事前訓練する。
このアプローチでは,FlashAttention,回転埋め込み,GLUフィードフォワードレイヤなどのアーキテクチャ最適化を取り入れている。
われわれのモデルである ModernBERT-base-PT は、4つのデータセットのうち3つで汎用 ModernBERT ベースラインを一貫して上回り、ベースラインの PatentBERT と競合する性能を示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:13:11 GMT)
Optimal quantum learning in proximity to universality [0.0] 古典的にシミュレート可能な量子システムと計算的に優れた量子システムの境界は、真の量子優位性を特定するのに基本である。
可変な$N$-qubitランダム回路モデルを導入し、クリフォードゲートの分数$p$を確率的に非安定化条件付き$hatT$ゲートに置き換える。
本研究では,時間的処理タスクにおける貯水池の性能と,その絡み合いスペクトル統計量と長距離非安定化資源量との直接対応性を確立する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:27:41 GMT)
Optimal and robust error filtration for quantum information processing [0.0] 誤差フィルタリング(Error filtration)は、補助量子ビットとエンタングゲートを利用してノイズを緩和するハードウェアスキームである。
異なるアプリケーションに対応するメリットの数字に対して、我々のアプローチをベンチマークします。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:39:09 GMT)
On the stabilizer complexity of Hawking radiation [0.0] 我々は、量子計算の安定化理論の観点から、蒸発するブラックホールに対するホーキング放射の複雑さについて研究する。
まず、重力経路積分を用いてPSSYモデルにおいて、ホーキング放射のウィグナー負性性を計算する。
次に、ブラックホール蒸発の力学モデルを用いて、放射のウィグナー負性について研究する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:00:04 GMT)
Noise-tolerant tripartite entanglement and quantum coherence via saturation effects [0.0] 熱ゆらぎに対する高弾性三部構造と量子コヒーレンスを生成する手法を提案する。
我々の提案には飽和ゲイン/ロスが組み込まれており、ノイズ耐性量子資源が誘導される。
我々の発見は非常に一般的なものであり、工学的な熱免疫量子相関のツールとして飽和非線形効果が示唆されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:12:06 GMT)
Noise-Assisted Feedback Control of Open Quantum Systems for Ground State Properties [0.0] プリフォールト耐性量子デバイスにおける固有ノイズは、ユニタリダイナミクスの信頼性を実現する上で大きな課題となる。
本稿では, 負の散逸率を含む量子コンピュータ上でのオープン量子系のダイナミクスをシミュレーションする手法を提案する。
本研究では,フィードバック制御された雑音支援力学を利用する基底状態特性の量子アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:06:36 GMT)
Molecular Fingerprints Are Strong Models for Peptide Function Prediction [0.0] 長距離分子相互作用はしばしば、複雑なグラフニューラルネットワークと事前訓練されたトランスフォーマーのモデリングを必要とすると仮定される。
単純でドメイン特異的な分子指紋がこれらの仮定なしでペプチド機能を捉えることができるかどうかを検討する。
本研究は, 分子指紋をペプチド予測のための効率的, 解釈可能, 計算的に軽量な代替手段として強調し, 長距離相互作用モデルの必要性を推察するものである。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:41:42 GMT)
Missing Puzzle Pieces in the Performance Landscape of the Quantum Approximate Optimization Algorithm [0.0] 無限大極限におけるランダム正則グラフ上の最大カットと最大独立集合問題を考える。
我々は、QAOAが達成したエネルギー密度を、最高$d=100$で計算する。
グラフの次数が増加するにつれて,QAOAが大きな問題サイズに対して達成した近似比が向上することを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:02:38 GMT)
Magneto-optical trapping of aluminum monofluoride [0.0] 我々はモノフッ化アルミニウム(AlF)の磁気光学トラップ(MOT)を実証する。
MOTは227.5nm付近の強いA$1Pileftarrow$X$1Sigma+$遷移で動作する。
AlFのレーザー冷却とトラップは、冷却原子物理学へのアルカリ-アース原子の導入と概念的に類似している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:37:46 GMT)
Macroscopic quantum phenomena and quantum computing [0.0] このNews & Viewsの記事は、2025年のノーベル物理学賞を受賞した。
これには、超伝導回路におけるマクロな量子トンネルの画期的な発見とエネルギー量子化が含まれる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:21:06 GMT)
Lyapunov-Aware Quantum-Inspired Reinforcement Learning for Continuous-Time Vehicle Control: A Feasibility Study [0.0] 本稿では,Lyapunov-based Quantum Reinforcement Learning (LQRL) フレームワークを提案する。
提案するフレームワークは、自律システムとハイブリッド量子古典最適化ドメインにおいて、確実に安全な制御を行うためのステップを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:44:45 GMT)
Leveraging AV1 motion vectors for Fast and Dense Feature Matching [0.0] 短いビデオでは、圧縮されたドメインのフロントエンドは、はるかに少ないCPUを使用しながらシーケンシャルSIFTと互換性があり、競合するペアの幾何とより密にマッチする。
その結果、圧縮ドメイン対応は、完全なパイプラインでのスケーリングへの明確な経路を持つ、実用的でリソース効率のよいフロントエンドであることが示されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:28:31 GMT)
Learning noisy tissue dynamics across time scales [0.0] 本稿では,実験映画から直接ノイズの多いマルチセルダイナミックスを推定できるバイオミメティック機械学習フレームワークを提案する。
本モデルでは,フライウイングやERK波を介する細胞信号処理など,発達系の実験的ダイナミクスを正確に生成できることが示されている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:33:54 GMT)
Laser cooling and qubit measurements on a forbidden transition in neutral Cs atoms [0.0] 5.3murm K$への同時冷却による個々のCs原子の背景のない超微細度選択的測定を実験的に実証した。
我々は、主に真空寿命によって制限された、忠実度 0.9993(4) と原子保持率 0.9954(5) で超微細化された検出を実現する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 00:56:34 GMT)
Large language models for folktale type automation based on motifs: Cinderella case study [0.0] 民俗学における大規模分析のための方法論を構築した。
機械学習と自然言語処理を用いて、Cinderellaの変種を大量に収集したモチーフを自動的に検出した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:18:20 GMT)
LLMBridge: Reducing Costs to Access LLMs in a Prompt-Centric Internet [0.0] LLMBridgeは、開発途上国や教育など、コストを意識したユーザ向けに設計されたプロキシである。
モデル選択、コンテキスト管理、セマンティックキャッシングの3つの主要な最適化をサポートしている。
WhatsAppベースのQ&Aサービスと大学の教室環境です。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:37:11 GMT)
KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers [0.0] バングラデシュでは、多くの農家が、タイムリーで専門家レベルの農業指導にアクセスするための課題に直面し続けている。
本稿では,Retrieval-Augmented Generationフレームワーク上に構築された音声対応のコールセンタ統合アドバイザリプラットフォームであるKrishokBondhuについて述べる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:24:55 GMT)
Kernel-Based Nonparametric Tests For Shape Constraints [0.0] サンプル推定器の統計的特性を導出し、厳密な理論的保証を提供する。
有限格子上の形状制約を検証するためのWald型合同統計法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 01:05:47 GMT)
KVASIR: A backscattering neutron spectrometer for hard condensed matter at ESS [0.0] 我々は、欧州スパレーション源(ESS)のための後方散乱間接飛行時中性子分光計KVASIRの計器概念を提示する。
KVASIRは単一結晶の硬質凝縮物質の低い起伏励起をプローブする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:47:49 GMT)
Interval Prediction of Annual Average Daily Traffic on Local Roads via Quantile Random Forest with High-Dimensional Spatial Data [0.0] 年平均日平均トラフィック(AADT)データは、交通計画とインフラ管理に不可欠である。
最近の機械学習の進歩は、計測されていない場所でのAADT推定を改善した。
本研究では,予測の不確実性を明示的に定量化する区間予測手法を導入することにより,そのギャップを解消する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:56:57 GMT)
Information-acquiring von Neumann architecture of a computer: A theoretical design [0.0] 我々は、中央処理ユニットのレジスタの細粒度または粗粒度モデルを用いて、コンピュータの情報取得型フォン・ノイマンアーキテクチャを設計する。
この研究の斬新さとして、射影量子計測を古典的な測定として扱う。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:36:14 GMT)
Information geometry of nonmonotonic quantum natural gradient [0.0] 非単調量子自然勾配(QNG)の性質について検討する。
非単調なQNGは従来のQNGよりも高速な収束を達成できた。
非単調な量子フィッシャー測度がQNGの収束を早めることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 04:27:10 GMT)
Hybrid Deep Learning Framework for Enhanced Diabetic Retinopathy Detection: Integrating Traditional Features with AI-driven Insights [0.0] 糖尿病網膜症(Dia-betes Mellitus, DM)は、特にインドにおいて主要な国際的関心事である。
基底画像は、微妙な網膜病変を検出することによって正確な診断を支援する。
本稿では,従来の特徴抽出とディープラーニング(DL)を組み合わせたハイブリッド診断フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:50:16 GMT)
Hybrid Classical-Quantum Newtonian Gravity with stable vacuum [0.0] 質量密度演算子の崩壊から古典ニュートン重力が出現するハイブリッド古典量子モデルについて検討する。
我々はGPSLが真空安定性を保証していることを示し、これは同一粒子や磁場に適用可能であるとともに、相対論的一般化の候補として有望であることを示した。
一つの粒子と剛体球の動力学を含む明示的な例を示し、モデルの特異な現象論を説明する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:00:50 GMT)
Human-AI Interactions: Cognitive, Behavioral, and Emotional Impacts [0.0] 過度な信頼感、認知的オフロード、社会的および感情的な操作、および人間の代理店の曖昧な劣化と判断の潜在的なリスクが強調される。
観察によると、AIは記憶、創造性、エンゲージメントを大幅に向上させることができるが、批判的思考の減少、スキルの侵食、不安の増加といったリスクももたらしている。
本稿は、人間中心の新たなリスクと利益のバランスをとるための、縦断的研究と評価フレームワークのギャップを浮き彫りにして、責任とコンテキストを意識したAI設計の必要性を明らかにすることを目的としている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 02:16:50 GMT)
Heralded entanglement of on-demand spin-wave solid-state quantum memories for multiplexed quantum network links [0.0] 完全調整可能なリコール時間と15モードの時間多重化により,空間的に分離されたスピン波量子メモリ間の通信の絡み合いを示す。
その結果、スケーラブルな高速量子ネットワークリンクの実装における主要な候補として、アーキテクチャが確立された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:51:01 GMT)
HDR Image Reconstruction using an Unsupervised Fusion Model [0.0] 高ダイナミックレンジ(露光)イメージングは、自然界に存在する幅広い明るさレベルを再現することを目的としている。
本稿では,HDR画像生成のための深層学習に基づくマルチ露光融合手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:43:22 GMT)
Geographic Transferability of Machine Learning Models for Short-Term Airport Fog Forecasting [0.0] 空港霧の短期予測は、地理的一般化の課題を提示する。
本研究は, 基本熱力学および放射過程を座標自由特徴集合に符号化できるかどうかを考察する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:06:55 GMT)
Fingerprints of cluster-based Haldane and bound-magnon states in a spin-1 Heisenberg diamond chain [0.0] スピン-1ハイゼンベルクダイヤモンド鎖の磁場中における磁気及び熱力学特性について検討した。
我々は、一様およびクラスタベースのハルダン状態を含む、多種多様な非伝統的な量子相を発見した。
フラストレーションされたスピン1ダイヤモンド鎖が量子スターリングエンジンの効率的な動作媒体として機能できることを実証した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:20:42 GMT)
Finding the Sweet Spot: Optimal Data Augmentation Ratio for Imbalanced Credit Scoring Using ADASYN [0.0] 本研究は,Give Me Some Credit データセット (97,243 観測,7% デフォルトレート) を用いて,10データ拡張シナリオを体系的に評価する。
最適クラス不均衡比は6.6:1であり、バランスの一般的な慣習は1:1と矛盾していた。
この研究は、クレジットスコアリングにおけるデータ拡張に最適な「スイートスポット」が与えられた最初の実証的な証拠を提供し、業界実践者や不均衡なデータセットを扱う研究者のための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 03:22:43 GMT)
FeClustRE: Hierarchical Clustering and Semantic Tagging of App Features from User Reviews [0.0] FeClustREは、ハイブリッド機能抽出、階層クラスタリング、自動チューニング、セマンティックラベリングを統合したフレームワークである。
FeClustREを,クラスタリングの品質,セマンティックコヒーレンス,解釈可能性に関するAIアシスタントアプリレビューのサンプル調査と,その正しさの抽出のための公開ベンチマークで評価した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 16:54:21 GMT)
Extending Resource Constrained Project Scheduling to Mega-Projects with Model-Based Systems Engineering & Hetero-functional Graph Theory [0.0] 本稿では,資源制約付きプロジェクトスケジューリング問題(RCPSP)を,モデルベースシステム工学(MBSE)に関するより広範な文献と照合することを目的とする。
定量的解析のためのHFGTの体系的な手段として、ヘテロファンクショナルネットワーク最小コストフロー(HFNMCF)のRCPSPコンテキストへの定式化を専門としている。
全体として、このフレームワークは従来のRCPSPの強みを保ちながら、現実の制約や企業レベルの意思決定プロセスに慣れている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:26:00 GMT)
Explainable Deep Learning in Medical Imaging: Brain Tumor and Pneumonia Detection [0.0] 胸部X線画像におけるMRI画像と肺炎の脳腫瘍検出のための,説明可能なディープラーニングフレームワークを提案する。
DenseNet121は一貫してResNet50を94.3%、脳腫瘍では92.5パーセント、肺炎では89.1%、肺炎では84.4%で上回った。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:44:40 GMT)
Exact WKB method for radial Schrödinger equation [0.0] 我々は、現代の復活の観点から、ラジアルシュリンガー問題に対する正確なWKB量子化を再考する。
単純な回転点と正則特異点での接続公式を用いて、非サイクルデータがスペクトルを与えることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:51:44 GMT)
Every Benchmark All at Once [0.0] ゲートセットシャドウトモグラフィーの現代言語における最も一般的なランダム化ベンチマーク手法を5つ再構成する。
我々の研究は、量子デバイスの包括的で信頼性があり、便利なベンチマークのための明確な道を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:26:31 GMT)
Evaluating LLM Story Generation through Large-scale Network Analysis of Social Structures [0.0] 複雑なタスクにおける大規模言語モデル(LLM)の創造的能力を評価するには、スケールが難しい人間の評価が必要となることが多い。
我々は,物語の基盤となる社会構造を署名されたキャラクターネットワークとして分析することにより,LLMストーリー生成を評価するための,新しい,スケーラブルな手法を提案する。
我々の研究結果は、密度、クラスタリング、および符号付きエッジウェイトといったネットワーク特性に基づいて、LCMの生成したストーリーは、密に結びついたポジティブな関係に対して、常に強いバイアスを示すことを示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:40:25 GMT)
Estimating Model Performance Under Covariate Shift Without Labels [0.0] デプロイ後、機械学習モデルは、データ分散の変化によるパフォーマンス劣化を経験することが多い。
データドリフト検出などの既存のプロキシ手法では、これらのシフトの影響を適切に測定できない。
確率的適応性能推定(PAPE)を導入する。
PAPEはオリジナルのモデルとは独立して動作し、予測と確率推定にのみ依存する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:07:55 GMT)
Entropy-Enhanced Conformal Features from Ricci Flow for Robust Alzheimer's Disease Classification [0.0] アルツハイマー病(AD)は重要な皮質萎縮と関連している。
本研究の目的は,ADの自動的かつ正確な診断のための新しい局所表面表現法の導入と検証である。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:16:45 GMT)
Entanglement Spectrum Resolved by Loop Symmetries [0.0] トポロジカルウィルソンループによって生成される高次群表現対称性を持つ量子多体状態の絡み合いスペクトルに対して厳密な解析が提示される。
特に、位相的絡み合いエントロピーを再現できるだけでなく、全絡み合いスペクトルに関するLi-Haldane予想が正確に成り立つことを、北エフ量子二重モデルに対して示している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 07:11:06 GMT)
Energy shortcut of quantum protocols by optimal control [0.0] 本稿では,ショートカット・トゥ・アディバティティティ・プロセスにインスパイアされたエネルギー最適化手法を提案する。
QOSTEは、与えられたプロトコルに対してSTAと同じ変換を生成するが、最小限のエネルギーコストで生成する。
本稿では, 原プロトコルによって与えられる回転フレーム内の測地線の長さによって最小のエネルギーコストが決定されることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:34:36 GMT)
Efficient derandomization of differentially private counting queries [0.0] 2020年国勢調査の異なるプライバシーは90テラバイトのランダムネス[GL20]を必要とした。
これは、$mathcalP, dots, MathcalP_d$の述語を満たすデータセットにエントリの数を出力するタスクである。
彼らはかなり驚くべき事実を示し、$varepsilon-differentially private mechanism for one counting query requires $O(log d)$ bits of in expectation。
ここでは、時間的メカニズムを示します。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:25:19 GMT)
Don't Retrieve, Generate: Prompting LLMs for Synthetic Training Data in Dense Retrieval [0.0] 効果的な高密度検索モデルの訓練は、典型的には、大きな文書コーパスから抽出した強陰性(HN)の例に依存する。
本稿では,Large Language Model (LLM) を用いたエンドツーエンドパイプラインを提案する。
我々のデータセットは、数学、物理学、計算機科学、および関連する分野を含む様々な領域にまたがる7,250のarXiv抽象データからなる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 06:22:08 GMT)
Docker-based CI/CD for Rocq/OCaml projects [0.0] 本稿では,docker-coq,docker-coq-action,docker-keeperの3つの近縁なソフトウェアプロジェクトについて述べる。
DockerベースのCI/CDをRocq(以前はCoqと呼ばれていた)やOCamlプロジェクトでの使用を促進することを目的としている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:32:00 GMT)
Dephasing through Bremsstrahlung emission: insights from quantum Boltzmann equation [0.0] 我々は、コヒーレンス損失につながる量子電磁力学の基本的なプロセスであるブレムスシュトラーン放出によるデコヒーレンスに焦点を当てる。
我々は、Stern-Gerlach干渉計におけるフェルミオン-光子相互作用をモデル化し、誘導された劣化因子を解析する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:28:28 GMT)
Decoherence and Probability [0.0] 非確率的な説明では、デコヒーレンスによる確率の出現は説得力がない。
我々の分析は、デコヒーレンスと半古典的平均化の組み合わせが古典的確率モデルを復元することを可能にする文脈を減らしている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:59:19 GMT)
DWaste: Greener AI for Waste Sorting using Mobile and Edge Devices [0.0] DWasteは、リソースに制約のあるスマートフォンやエッジデバイスでリアルタイムに廃棄物をソートするために設計されたコンピュータビジョンベースのプラットフォームである。
我々は、様々な画像分類モデル(EfficientNetV2S/M、ResNet50/101、MobileNet)とオブジェクト検出をベンチマークした。
私たちの研究は、エッジデバイス上でのリアルタイムで持続可能な廃棄物ソートをサポートするために、"Greener AI"モデルの実装が成功したことを実証しています。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:55:32 GMT)
Cyberattack Detection in Critical Infrastructure and Supply Chains [0.0] 侵入検知システム(IDS)は、サイバー攻撃に対抗するために配備される。
IDSは既知のシグネチャとパターンに基づいて攻撃を効果的に検出し、ゼロデイ攻撃は検出されない。
IDSにおけるこの欠点を克服するために、Dense Neural Network(DNN)とData Augmentationの統合を提案する。
IDSをインテリジェントにし、新たな攻撃に遭遇した場合に高精度で自己学習を可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:38:58 GMT)
Complementarity-based complementarity: the choice of mutually unbiased observables shapes quantum uncertainty relations [0.0] 不確実性関係は観測可能なものの選択に依存する可能性があることを示す。
5次元量子系における3つの MUB の異なる集合の選択は、異なる不確実性境界をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:05:14 GMT)
Competing color superconductivity and color Kondo effect in quark matter [0.0] バルク色超伝導と重クォーク不純物の局所スクリーニングの競合は、高密度クォーク物質における豊富な現象のスペクトルをもたらす。
超伝導クォークバルクの先端におけるこの競合について検討し, 超伝導ギャップとコンドスケールの両方を, トラクタブル玩具モデルで動的に生成することを示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:22:15 GMT)
Comparative analysis of large data processing in Apache Spark using Java, Python and Scala [0.0] この分析は、CSVファイルからデータをダウンロードし、Apache Icebergテーブルに変換してロードするなど、いくつかの操作を実行することで実施された。
その結果,Sparkアルゴリズムの性能は,使用するデータ量やプログラミング言語によって大きく異なることがわかった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 18:54:21 GMT)
Comparative Analysis of Object Detection Algorithms for Surface Defect Detection [0.0] 最先端のリアルタイムオブジェクト検出アルゴリズムであるYOLOv11は、他の手法と比較して優れた性能を示した。
YOLOv11の精度と速度の卓越した性能は、NEUデータセットにおける表面欠陥検出の最も効果的なモデルとしての位置を固める。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 10:05:02 GMT)
Colloquium: Quantum optics of intense light--matter interaction [0.0] インセンス・マター相互作用は、主に高出力光源の使用に依存している。
プロセスは、原子、分子、光学物理学において多くの画期的な進歩を可能にした。
量子光学と強磁場物理学と超高速科学の融合から進歩が生まれる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 20:03:30 GMT)
Closed-form expressions for smeared bi-distributions of a massless scalar field: non-perturbative and asymptotic results in relativistic quantum information [0.0] 時空領域の量子場と相互作用する局所量子系について検討する。
ガウス時空領域で相互作用するプローブによって得られる絡み合いを見つける。
2つの隙間のない検出器の場合を再検討し、相互作用領域間に2つのスミアドウェイ信号が存在する場合、検出器が絡み合うことができることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:01:27 GMT)
Classical Representation for Quantum States of a Particle in $λ z^{2m}$ potential [0.0] $lambda z2m$ $(lambda >0, m=1,2, ...)$ potentials で有界な粒子の量子固有状態の古典的表現を開発する。
古典表現における対応するシュル「オーディンガー方程式」が解析される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 17:04:31 GMT)
CLiVR: Conversational Learning System in Virtual Reality with AI-Powered Patients [0.0] CLiVRは、大きな言語モデル、音声処理、および3Dアバターを統合する、仮想現実における会話学習システムである。
Unityで開発され、Meta Quest 3プラットフォームにデプロイされたCliVRは、トレーニング担当者が仮想患者と自然な対話を行うことを可能にする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:19:55 GMT)
CEFR-Annotated WordNet: LLM-Based Proficiency-Guided Semantic Database for Language Learning [0.0] 我々は、共通ヨーロッパ言語参照フレームワーク(CEFR)を付加したWordNetを開発する。
我々は、WordNetにおける感覚定義と英語語彙プロファイルオンラインにおけるエントリのセマンティックな類似性を測定する。
実験により, コーパス上で微調整されたモデルが金標準アノテーションで訓練されたモデルと相容れない性能を示した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 09:42:48 GMT)
Broadband Thermal Noise Correlations Induced by Measurement Back-Action [0.0] ブロードバンド熱雑音スペクトルの解法は,多くのメカニカルモードからの逆作用による相関関係を明らかにする。
これらの相関関係により、共鳴ピークから遠く離れたバンドにおいて、熱雑音スペクトルは、単一のモードに相当する最小値に達することができる。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 19:57:02 GMT)
Beyond the Pipeline: Analyzing Key Factors in End-to-End Deep Learning for Historical Writer Identification [0.0] 本稿では,歴史作家識別のためのエンド・ツー・エンド深層学習手法の性能に影響を及ぼす諸要因について検討する。
従来のHWI手法は手作りの画像処理とクラスタリング技術に依存しており、小さなデータセットでよく機能する傾向にある。
エンドツーエンドパイプラインは、ドキュメントイメージから直接機能を学ぶことによって、プロセスを自動化することを目的としている。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:25:16 GMT)
Benchmarking On-Device Machine Learning on Apple Silicon with MLX [0.0] MLXは、Appleのシリコンデバイス上での機械学習(ML)計算に最適化されたフレームワークである。
本稿では,トランスモデルのレイテンシに着目し,MLXの性能評価を行う。
結果は、Appleのエコシステム内で、効率的でアクセスしやすいオンデバイスMLアプリケーションを可能にするMLXの可能性を強調している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:19:27 GMT)
Automated Wicket-Taking Delivery Segmentation and Weakness Detection in Cricket Videos Using OCR-Guided YOLOv8 and Trajectory Modeling [0.0] このシステムは、ピッチとボール検出にYOLOv8アーキテクチャを使用し、スコアカード抽出に光学文字認識(OCR)を併用して、ウィケットテイクモーメントを識別する。
このシステムは検出されたピッチの軌跡モデリングを可能にし、バッティングの弱点を特定するためのデータ駆動の洞察を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:27:23 GMT)
Antiscarring from eigenstate stacking in a chaotic spinor condensate [0.0] いくつかの固有状態の欠如が、多くの粒子を持つ量子系におけるカオススペクトルと熱スペクトルの残りの部分にどのように影響するかを示す。
我々の研究は、いくつかの固有状態が多くの粒子を持つ量子系の他のカオスおよび熱スペクトルにどのように影響するかを明らかにする。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 15:50:30 GMT)
Airfoil optimization using Design-by-Morphing with minimized design-space dimensionality [0.0] 本研究では,翼の最適化に特化したDbM (Design-by-Morphing) アプローチであるAirDbMを紹介する。
AirDbMはUIUCのエアフォイルデータベースから12基のベースライン翼を最適に選択する。
これらのベースラインにより、AirDbMは0.005以下の平均絶対誤差で、データベースの99パーセントを再構築する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:27:50 GMT)
Advancing Brain Tumor Segmentation via Attention-based 3D U-Net Architecture and Digital Image Processing [0.0] 本研究の目的は,脳腫瘍のセグメンテーションの性能を高めることであり,最終的に診断の信頼性を向上させることである。
提案したモデルは、この目標を達成するために、さまざまなパフォーマンス指標を使用して、BraTS 2020データセットで徹底的に評価され、評価される。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:11:19 GMT)
Ab Initio Free Energy Surfaces for Coupled Ion-Electron Transfer [0.0] 電子移動の理論は、ダイアバティックエネルギーギャップが1つのアンサンブルからサンプリングされることを前提としている。
この仮定は、電気化学界面や生体分子構造のような空間異方性環境において分解することができる。
我々は、制約されたabイニシアト軌道から直接、結果として生じる結合したイオン-電子移動(CIET)自由エネルギー面の計算を可能にするフォーマリズムを開発する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 21:59:44 GMT)
ADPO: Anchored Direct Preference Optimization [0.0] Anchored Direct Preference Optimization (ADPO)は、DPOをソフトな嗜好、参照ポリシーアンカー、グループワイズ拡張で一般化する統合フレームワークである。
DPO,Bradley-Terry の目的,Top-1-vs-Rest の定式化が特別な場合として現れることを示す。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 05:53:13 GMT)
A surrogate model for topology optimisation of elastic structures via parametric autoencoders [0.0] 状態(および随伴)問題のパラメトリック解を学ぶ代わりに、提案手法は最適化パイプライン全体のサロゲートバージョンを考案する。
本手法は, 均質化法により最適化された高忠実度トポロジの代理モデルとして, 与えられた問題構成に対する準最適トポロジを予測する。
異なるアーキテクチャを提案し、得られたモデルの近似と一般化能力を数値的に評価する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 11:59:06 GMT)
A machine learning approach to automation and uncertainty evaluation for self-validating thermocouples [0.0] 本稿では,融解台地の形状を認識し,識別するための新しい機械学習手法を提案する。
これにより、融点の特定と特徴付けにおける人間の介入の必要性が排除される。
CCPI Europeによる試験データから, 融点検出の精度は100%であった。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 08:38:28 GMT)
A Structured Evaluation Framework for Low-Code Platform Selection: A Multi-Criteria Decision Model for Enterprise Digital Transformation [0.0] 本稿では,5つの評価基準に基づく総合評価フレームワークを提案する。
我々は、組織が異なるローコードプラットフォームを定量的に評価し比較できる重み付けスコアリングモデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:42:11 GMT)
A Pseudo-Hermitian Hybrid Model at Finite Temperature: The Role of the Exceptional Points [0.0] 超伝導フラックス量子ビットと有限温度で相互作用するダイヤモンド中の窒素空孔中心の集合体によって形成されるハイブリッドシステムについて検討した。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:28:53 GMT)
A Physics-Informed Spatiotemporal Deep Learning Framework for Turbulent Systems [0.0] 対流に対する物理インフォームRBCサロゲートモデルを提案する。
我々のアプローチは、空間還元のための標準次元ニューラルネットワークと、大きな言語モデルにインスパイアされた革新的な再帰的アーキテクチャを組み合わせる。
このモデルは、計算コストを削減しつつ、重要な物理的特徴を再現し、長期シミュレーションのためのDNSに代わるスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 14:46:28 GMT)
A Novel Approach to Breast Cancer Segmentation using U-Net Model with Attention Mechanisms and FedProx [0.0] 乳がんは世界中の女性の間で主要な死因であり、早期発見と正確な診断の必要性を強調している。
医療データの繊細な性質は、正確でプライベートな人工知能モデルを開発することを困難にしている。
FedProxは、非IIDローカルな医療データセット上で、正確な機械学習モデルをトレーニングするための有望なアプローチになる可能性がある。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:38:18 GMT)
A Multi-Evidence Framework Rescues Low-Power Prognostic Signals and Rejects Statistical Artifacts in Cancer Genomics [0.0] 我々は低出力癌コホートを解析するためのフレームワークを開発した。
我々のフレームワークは, RYR2を名目上の意義にもかかわらず偽陽性と正しく同定した。
KMT2Cは、限界的な重要性にもかかわらず、検証を必要とする複雑な候補として同定された。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 12:27:18 GMT)
A Justice Lens on Fairness and Ethics Courses in Computing Education: LLM-Assisted Multi-Perspective and Thematic Evaluation [0.0] Syllabus分析は、コース内のカバレッジ、深さ、プラクティス、期待を評価する方法を提供する。
そこで我々は,ジャスティス指向のスコアリングルーブリックを開発し,マルチパースペクティブ・ロール・シミュレーションによるシラビのレビューを大規模言語モデル (LLM) に依頼した。
マルチパースペクティブ評価は、AI/MLと関連するコンピューティングコースのカリキュラム設計における隠れたギャップを埋めるために、微妙でロール固有の優先順位に注意する上で役立ちます。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 13:30:45 GMT)
A Graph Signal Processing Framework for Hallucination Detection in Large Language Models [0.0] 事実記述は低周波収束と一貫した「エネルギー山」の挙動を示すが,幻覚型は異なる特徴を示す。
スペクトルシグネチャを用いた単純な検出器は、パープレキシティベースのベースラインに対して 88.75% の精度を達成する。
これらの結果は、スペクトル幾何学が推論パターンや誤りの振る舞いを捉え、大きな言語モデルで検出するためのフレームワークを提供する可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 22:35:48 GMT)
10 Simple Rules for Improving Your Standardized Fields and Terms [0.0] 文脈メタデータは研究データの無意味な英雄である。
本稿では、語彙標準化の驚くほど難しいプロセスに取り組む。
我々は、一般的な課題(セマンティックノイズや概念爆弾など)を強調し、それらに対処するための実行可能な戦略を提供する。
論文参考訳(メタデータ) (Tue, 21 Oct 2025 23:34:59 GMT)