World-in-World: World Models in a Closed-Loop World [123.9] 我々は,実エージェントと環境の相互作用を反映したクローズドループの世界において,世界モデルをベンチマークする最初のオープンプラットフォームであるWorld-in-Worldを紹介した。
多様なWMを厳格に評価し、タスク成功を主要な指標として優先順位付けし、視覚的品質に重点を置く4つのクローズドループ環境をキュレートする。
1)視覚的品質だけではタスクの成功は保証されないが、制御可能性の方が重要であること、2) 行動観測データによる後トレーニングのスケーリングは、事前訓練されたビデオジェネレータをアップグレードするよりも効果的であること、3) 推論時計算の割り当てにより、WMsは大幅にクローズドな改善が可能であること、の3つのサプライズを明らかにした。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:09:15 GMT)
GAS: Improving Discretization of Diffusion ODEs via Generalized Adversarial Solver [120.7] ODEサンプルの単純なパラメータ化を導入し、追加のトレーニングトリックを必要とせず、既存のアプローチよりも品質が向上する。
さらに, 本来の蒸留損失と逆行訓練を組み合わせることで, 人工物が軽減され, 細部忠実度が向上する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:14:38 GMT)
VimoRAG: Video-based Retrieval-augmented 3D Motion Generation for Motion Language Models [110.3] VimoRAG(ヴィモラグ)は、動画に基づく大規模言語モデルのためのモーション生成フレームワークである。
動作中心の効果的なビデオ検索モデルを開発し、最適下検索結果による誤り伝播の問題を緩和する。
実験結果から,VimoRAGはテキストのみの入力に制約された動きLLMの性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:52:28 GMT)
From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery [108.1] エージェントAIは仮説生成、実験設計、実行、分析、反復的洗練の能力を示す。
この調査は、生命科学、化学、材料科学、物理学にまたがる自律的な科学的発見のドメイン指向のレビューを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:07:37 GMT)
Train for Truth, Keep the Skills: Binary Retrieval-Augmented Reward Mitigates Hallucinations [103.2] 新たな二分探索強化報酬(RAR)を用いたオンライン強化学習手法を提案する。
オープンエンド世代では、バイナリRARは幻覚率を39.3%減少させる。
短い形式の質問応答では、モデルは、パラメトリック知識の不足に直面した時に、戦略的に"I don't know"を出力して、控えめに学習する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:45:43 GMT)
LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation [102.2] LangTrajは、トラフィックシナリオにおけるすべてのエージェントの共同動作をシミュレートする、言語条件のシーン拡散モデルである。
自然言語入力を条件付けすることで、LangTrajはインタラクティブな振る舞いを柔軟かつ直感的に制御できる。
LangTraj氏は、リアリズム、言語制御性、言語条件の安全クリティカルなシミュレーションにおいて、強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:39:32 GMT)
BLUR: A Bi-Level Optimization Approach for LLM Unlearning [100.9] 未学習問題の階層構造をモデル化することが重要であると論じる。
本稿では,より優れた性能を実現する新しいアルゴリズムであるBi-Level UnleaRning(textttBLUR)を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:46:48 GMT)
Saber: An Efficient Sampling with Adaptive Acceleration and Backtracking Enhanced Remasking for Diffusion Language Model [98.4] 拡散言語モデル(DLM)は、支配的な自己回帰パラダイムに代わる強力で有望な選択肢として現れています。
コード生成における推論速度と出力品質の向上を実現するために,適応加速度を用いた効率的なサンプリングとバックトラック強化リマッシング(セイバー)を導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:38:12 GMT)
Foundational Automatic Evaluators: Scaling Multi-Task Generative Evaluator Training for Reasoning-Centric Domains [97.6] 自動推論評価器(FARE)のファミリーを,簡易な反復的リジェクションサンプリング制御による微調整手法で訓練する。
FARE-8Bはより大型のRL訓練評価器に挑戦し、FARE-20Bはオープンソース評価器の新しい標準となる。
推論時リランカとして、FARE-20BはMATH上でのニアオークル性能を達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:52:06 GMT)
Reasoning-Aligned Perception Decoupling for Scalable Multi-modal Reasoning [95.4] MLLM(Multi-modal large language model)は、テキストベースの推論に遅れを取っている。
本稿では,MLLMの推論コンポーネントをモジュール化し,容易に置き換え可能なパーセプション推論デカップリングを提案する。
本稿では,視覚知覚最適化(VPO)と呼ばれる新しい強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:48:22 GMT)
Glyph: Scaling Context Windows via Visual-Text Compression [91.2] Glyphは、長いテキストを画像にレンダリングし、視覚言語モデルで処理するフレームワークである。
提案手法は,従来の長文モデルに匹敵する精度を維持しつつ,3~4倍のトークン圧縮を実現する。
極端な圧縮では、128KテキストのVLMが1Mレベルのテキストタスクにスケールできる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:58:56 GMT)
Streaming Drag-Oriented Interactive Video Manipulation: Drag Anything, Anytime! [88.1] textbfstReaming drag-oriEnted interactiVe vidEo manipulation (REVEL)を提案する。
提案手法は,既存の自己回帰ビデオ拡散モデルにシームレスに統合できる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:47:32 GMT)
LLM as GNN: Graph Vocabulary Learning for Text-Attributed Graph Foundation Models [87.7] Text-Attributed Graphs (TAG) は、現実のシナリオにおいてユビキタスである。
大規模言語モデル(LLMs)とグラフニューラルネットワーク(GNNs)をTAGsに統合する努力にもかかわらず、既存のアプローチは分離されたアーキテクチャに悩まされている。
本稿では,グラフ語彙学習に基づくTAGのための汎用GFMであるPromptGFMを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:58:05 GMT)
Convergence of Regret Matching in Potential Games and Constrained Optimization [85.6] RM$+$の交互収束は、$O_epsilon (1/epsilon4)$の後に$Epsilon$-KKT点に収束し、それが音で高速な一階数であることを示す。
我々の下界は、ポテンシャルゲームにおける粗相関平衡への収束が、ナッシュ平衡への収束よりも指数関数的に速いことを示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:45:47 GMT)
Exploring Structural Degradation in Dense Representations for Self-supervised Learning [84.5] 自己教師付き学習(SSL)における直感的な現象を観察する。
我々は、この現象を自己教師付きDense Degradation(SDD)と呼び、16の最先端SSLメソッドに一貫した存在を示す。
本稿では,クラス関連尺度と有効次元尺度からなるDense Expression Structure Estimator (DSE)を紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:40:16 GMT)
GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [83.7] 本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:31:15 GMT)
Nexus: An Omni-Perceptive And -Interactive Model for Language, Audio, And Vision [83.1] 本研究は, 聴覚, 視覚, 言語的モダリティを統合した, 産業レベルのOmni-Modal Large Language Model (LLM) パイプラインを提案する。
まず、様々なエンコーダ-LLM-デコーダアーキテクチャの柔軟な構成を可能にするモジュラーフレームワークです。
第二に、最先端のビジョン言語モデルであるQwen2.5-VLのオーディオ言語アライメントを事前訓練する軽量なトレーニング戦略である。
第三に、様々な現実世界のシナリオから高品質な音声テキストデータを生成するオーディオ合成パイプライン。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:05:19 GMT)
Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and Aligning [81.4] 言語やモダリティ間のアライメントを学習するための双方向命令関係推論およびアライニングフレームワークBi-IRRAを提案する。
Bi-IRRA内において、双方向暗黙的関係推論モジュールは、マスクされた画像とテキストの双方向予測を可能にする。
提案手法は,すべての多言語TIPRデータセットに対して,新しい最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:01:11 GMT)
HouseTour: A Virtual Real Estate A(I)gent [80.4] 本研究では,空間認識型3次元カメラ軌道と自然言語要約生成手法であるHouseTourを紹介する。
提案手法は,カメラのポーズに制約された拡散過程によってスムーズな映像トラジェクトリを生成する。
我々は3Dガウススプラッティングを用いて最終映像を合成し、軌道に沿って新しいビューを描画する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:47:35 GMT)
CLIMB: Class-imbalanced Learning Benchmark on Tabular Data [78.7] クラス不均衡学習(クラス不均衡学習、class-imbalanced learning、CIL)は、マイノリティクラスが重要な結果を持っている多くの実世界のアプリケーションにおいて重要である。
本稿では,クラス不均衡学習のための総合的なベンチマークであるCLIMBを提案する。
CLIMBには、さまざまなドメインと不均衡レベルにわたる73の現実世界データセットと、29の代表的なCILアルゴリズムの統一実装が含まれている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:25:08 GMT)
Latent Diffusion Model without Variational Autoencoder [78.3] SVGは視覚生成のための変分オートエンコーダを持たない新しい潜伏拡散モデルである。
凍結したDINO機能を利用して、明確な意味的識別性を持つ特徴空間を構築する。
迅速な拡散訓練を可能にし、数ステップのサンプリングをサポートし、生成品質を向上させる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:08:17 GMT)
How Does Label Noise Gradient Descent Improve Generalization in the Low SNR Regime? [78.0] 我々は、勾配更新にラベルノイズを導入することで、ニューラルネットワーク(NN)のテスト性能が向上するかどうか検討する。
学習中のラベルノイズの付加は,学習過程を支配することを防止し,雑音の記憶を抑制することを実証する。
対照的に、標準GDで訓練されたNNは、同じ低SNR環境でのノイズに過度に適応する傾向にある。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:28:13 GMT)
QueST: Incentivizing LLMs to Generate Difficult Problems [77.8] 大規模言語モデルは、推論タスク、競合レベルのコーディングと数学の問題を解く上で、強力なパフォーマンスを達成した。
既存の競合するコーディングデータセットには、数千から数万の問題しか含まれていない。
本稿では,難解なグラフサンプリングと難解な拒否の微調整を組み合わせた新しいフレームワークであるQueSTを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:29:53 GMT)
UltraCUA: A Foundation Model for Computer Use Agents with Hybrid Action [77.6] 本稿では,GUIプリミティブと高レベルのプログラムツールコールのギャップを埋める基盤モデルであるUltraCUAを提案する。
7Bおよび32Bモデルによる実験は、最先端のエージェントよりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:48:26 GMT)
When Words Smile: Generating Diverse Emotional Facial Expressions from Text [77.2] 本稿では,感情動態に着目したエンドツーエンドのテキスト対表現モデルを提案する。
我々のモデルは連続的な潜伏空間における表情の変動を学習し、多様な、流動的で、感情的に一貫性のある表現を生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:51:27 GMT)
Expose Camouflage in the Water: Underwater Camouflaged Instance Segmentation and Dataset [76.9] カモフラージュされたインスタンスセグメンテーション(CIS)は、周囲と密接に融合したオブジェクトを正確にセグメンテーションする際の大きな課題に直面します。
従来のカモフラージュされたインスタンスセグメンテーション法は、水中のサンプルが限られている地球上で支配的なデータセットに基づいて訓練されており、水中のシーンでは不十分な性能を示す可能性がある。
本研究は,海中カモフラージュされた海洋生物の3,953枚の画像とインスタンスレベルのアノテーションを含む,最初の水中カモフラージュされたインスタンスセグメンテーションデータセットUCIS4Kを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:34:51 GMT)
Enterprise Deep Research: Steerable Multi-Agent Deep Research for Enterprise Analytics [75.5] Enterprise Deep Research (EDR)は、適応的なクエリ分解のためのマスタープランニングエージェントを統合するマルチエージェントシステムである。
4つの専門的な検索エージェント(General, Academic, GitHub, LinkedIn)と、データ駆動インサイトのための可視化エージェントも含まれている。
EDRは、オプショナル・イン・ザ・ループ・ステアリング・ガイダンスによる研究の方向性を反映する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:55:11 GMT)
Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning [75.3] 幅広いタスクからなる20以上のオープンウェイト推論チューニングモデルを評価した。
数学で成功するほとんどのモデルは、利得を他の領域に移すことができない。
以上の結果から,標準のポストトレーニングレシピを再考する必要性が示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:27:09 GMT)
Elastic ViTs from Pretrained Models without Retraining [74.5] ビジョンファウンデーションモデルは優れたパフォーマンスを達成するが、事前決定されたサイズの限られたセットでしか利用できない。
本稿では, プルーニングされた視覚変換器のためのシングルショットネットワーク近似であるSnapViTを紹介する。
提案手法は,進化的アルゴリズムを用いて近似した勾配情報とクロスネットワーク構造相関を効率的に結合する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:15:03 GMT)
Enabling Automatic Differentiation with Mollified Graph Neural Operators [73.5] 本稿では,自動微分と任意のジオメトリの正確な勾配を求める最初の手法であるモリファイドグラフニューラル演算子(m$GNO)を提案する。
正規格子上のPDEの例では、$m$GNOとオートグレードの組み合わせにより、L2相対データの誤差は有限差に比べて20倍減少した。
また、物理損失のみを使用し、有限差分に必要な分解能よりもはるかに低い精度で、非構造化点雲上のPDEをシームレスに解くことができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:07:32 GMT)
Seeing but Not Believing: Probing the Disconnect Between Visual Attention and Answer Correctness in VLMs [72.8] VLM(Vision-Language Models)は、視覚的質問応答などのマルチモーダルなタスクにおいて強力な結果を得るが、正しい視覚的証拠が存在する場合でも失敗する。
浅層は主にテキストに焦点が当てられているのに対し、深層はわずかながら確実に局所化されたエビデンス領域に寄与していることを示す。
我々は,選択的注意に基づくマスキングによる深層エビデンス領域の強調を行う推論時間介入を導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:31:09 GMT)
Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation [72.3] Retrieval-Augmented Generation (RAG) は、外部コーパスから関連文書を取得することで、大規模言語モデル(LLM)を強化するための強力なパラダイムとして登場した。
既存のRAGシステムは、主に平凡なテキスト文書に焦点を当てており、クエリとドキュメントの両方が(テキストや画像のような)混合モダリティを含む実世界のシナリオでは、しばしば不足している。
我々は,Universal Retrieval-Augmented Generationシナリオに適した混合モーダル-混合モーダルレトリバーであるNyxを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:56:43 GMT)
PICABench: How Far Are We from Physically Realistic Image Editing? [71.8] PICABenchを導入し、8つのサブ次元にわたる物理的リアリズムを体系的に評価する。
本稿では,VLM-as-a-judgeをケースごとの領域レベルの人間のアノテーションで利用する信頼性評価プロトコルであるPICAEvalを提案する。
また、ビデオから物理を学習し、トレーニングデータセットPICA-100Kを構築することで、効果的な解を探索する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:53:57 GMT)
RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation [70.8] 本稿では,RWKV構造をU-Netアーキテクチャに統合する新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、コンテキスト理解を改善するモデルの能力が向上する。
11のベンチマークデータセットの実験により、RWKV-UNetは様々なタイプの医用画像セグメンテーションタスクで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:34:37 GMT)
VisuRiddles: Fine-grained Perception is a Primary Bottleneck for Multimodal Large Language Models in Abstract Visual Reasoning [70.4] マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、多くの推論タスクにおいて、その性能を著しく向上させてきた。
AVR(Abstract Visual Reasoning)は、抽象グラフィックの知覚に制限があるため、依然として重要な課題である。
PRSのベンチマークであるVisuRiddlesを提案し、モデルの推論能力を評価するために精巧に構築されたタスクを特徴付ける。
第二に、パーセプチュアル・リドル・シンセサイザー (PRS) を導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:00:57 GMT)
From Preferences to Prejudice: The Role of Alignment Tuning in Shaping Social Bias in Video Diffusion Models [69.4] 本稿では,ビデオ生成における社会的表現を評価するためのフレームワークであるVideoBiasEvalを紹介する。
VideoBiasEvalでは、アクター属性からセマンティックコンテンツをアンタングルするために、イベントベースのプロンプト戦略を採用している。
我々は、人間の嗜好データセットにおけるバイアス、報酬モデルにおける増幅、アライメント調整されたビデオ拡散モデルによる伝播を結合する最初のエンドツーエンド分析を行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:37:43 GMT)
DeepSeek-Inspired Exploration of RL-based LLMs and Synergy with Wireless Networks: A Survey [68.7] 強化学習(RL)に基づく大規模言語モデル(LLM)は,マルチモーダルデータ理解においてその能力に注目が集まっている。
オープンソースのDeepSeekモデルは、大規模な純粋なRLやコスト効率のトレーニングといった革新的な設計で有名である。
本調査では,無線ネットワークの文脈において,RLをベースとしたLLMを包括的に探索する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:44:00 GMT)
Extracting Rule-based Descriptions of Attention Features in Transformers [68.3] 注意層出力に基づいて学習したSAE特徴の規則に基づく記述について検討した。
ほとんどの機能は、約100のスキップグラムルールでうまく記述されているかもしれません。
本稿では,ルールに基づく特徴記述の今後の研究の基盤となる課題について述べる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:52:40 GMT)
DELULU: Discriminative Embedding Learning Using Latent Units for Speaker-Aware Self-Supervised Speech Foundational Model [65.9] DELULUは、話者を意識した、検証、ダイアリゼーション、プロファイリングのための基礎モデルである。
マスク付き予測と妄想を組み合わせ、堅牢性と一般化をさらに強化する2つの目的を用いて訓練される。
以上の結果から,DELULUは話者認識音声処理の強力なユニバーサルエンコーダであり,タスク固有の微調整がなくても優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:35:55 GMT)
Executable Knowledge Graphs for Replicating AI Research [65.4] Executable Knowledge Graphs (xKG) は、科学文献から抽出された技術的洞察、コードスニペット、ドメイン固有の知識を自動的に統合するモジュラーでプラグイン可能な知識基盤である。
コードはhttps://github.com/zjunlp/xKGでリリースされる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:53:23 GMT)
ARMOR: Aligning Secure and Safe Large Language Models via Meticulous Reasoning [64.3] ARMORは、jailbreak戦略を分析し、コアインテントを抽出する、大規模な言語モデルである。
ARMORは最先端の安全性能を達成し、平均有害率は0.002であり、高度な最適化ベースのジェイルブレイクに対する攻撃成功率は0.06である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:44:11 GMT)
Boosting Fidelity for Pre-Trained-Diffusion-Based Low-Light Image Enhancement via Condition Refinement [63.5] 事前学習拡散ベース(PTDB)法は、しばしばコンテンツ忠実さを犠牲にして知覚的リアリズムを高める。
本稿では,事前学習した拡散モデルにおける条件付けのための新しい最適化手法を提案する。
我々のアプローチはプラグアンドプレイであり、より効率的な制御を提供するために既存の拡散ネットワークにシームレスに統合される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:40:06 GMT)
Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation [63.5] 視覚言語ナビゲーション(VLN)のためのリライト駆動型AugMentation(RAM)パラダイムを提案する。
書き換え機構から, シミュレータフリー, 省力両面において, 新たな観察・指導ペアを得ることができた。
離散環境(R2R,REVERIE,R4Rデータセット)と連続環境(R2R-CEデータセット)の両方における実験は,本手法の優れた性能と優れた一般化能力を示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:19:21 GMT)
EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning [63.0] 我々は、進化的、タスクに依存しない、戦略を導いた、実行可能検証可能なデータ合成フレームワークを紹介します。
問題、多様な候補解、検証成果物を共同で合成する。
これは、人間による注釈付きチェックと戦略によるチェックの合意を強制する一貫性に基づく評価器を通じて戦略を反復的に発見する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:56:35 GMT)
Empowering Real-World: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents [63.0] 本稿では,大規模言語モデル(LLM)に基づく産業エージェントの技術,応用,評価手法を体系的にレビューする。
エージェント能力の進歩を支える3つの重要な技術柱として,記憶,計画,ツール利用について検討する。
本稿では,デジタル工学,科学的発見,具体的インテリジェンス,協調ビジネス実行,複雑なシステムシミュレーションといった実世界の領域における産業エージェントの応用の概要について述べる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:46:55 GMT)
PICT -- A Differentiable, GPU-Accelerated Multi-Block PISO Solver for Simulation-Coupled Learning Tasks in Fluid Dynamics [62.9] 我々はPyTorchで符号化された可変圧単純化解器であるPICTをGPU(Graphics-Processing-unit)をサポートした流体シミュレータとして提案する。
まず,様々なベンチマークにおいて,フォワードシミュレーションと導出した勾配の精度を検証した。
2次元, 3次元の複雑な乱流モデルの学習には, 解法によって得られる勾配が有効であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:07:52 GMT)
BokehDiff: Neural Lens Blur with One-Step Diffusion [62.6] ボケフディフ(BokehDiff)は、物理的に正確で視覚的に魅力的な結果が得られるレンズボウ描画法である。
提案手法では, 画像形成プロセスと整合する自己認識モジュールを物理に着想を得た。
付加雑音を導入することなく1ステップの推論方式に拡散モデルを適応させ,高品質で忠実な結果を得る。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:52:13 GMT)
Robobench: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models as Embodied Brain [62.0] 動的で非構造的な環境で知覚、理性、行動できるロボットを構築することは、依然として中核的な課題である。
システム2は高レベルの推論を処理し、システム1は低レベルの制御を実行する。
本稿では,マルチモーダル大言語モデル(MLLM)を具体的脳として体系的に評価するベンチマークであるRoboBenchを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:59:03 GMT)
GOOD: Training-Free Guided Diffusion Sampling for Out-of-Distribution Detection [62.0] GOODは,オフザシェルフ内分布(ID)分類器を用いて,OOD領域へのサンプリングトラジェクトリを誘導する新しいフレームワークである。
入力可能性を減らすためにログパーティションの勾配に基づいた画像レベルのガイダンスは、ピクセル空間内の低密度領域に向けてサンプルを駆動する。
我々は、画像と特徴の相違を適応的に組み合わせ、検出の堅牢性を向上する統一OODスコアを導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:58:46 GMT)
Adapting to Stochastic and Adversarial Losses in Episodic MDPs with Aggregate Bandit Feedback [61.5] 本研究では,有限水平マルコフ決定過程(MDP)におけるオンライン学習について,包括的包括的包括的フィードバックモデルを用いて検討する。
本研究は, オンライン最短経路問題の近年の進展に触発された, 占領対策, 自己拘束技術, 新たな損失推定器の組合せに依拠する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:28:08 GMT)
AtlasKV: Augmenting LLMs with Billion-Scale Knowledge Graphs in 20GB VRAM [60.6] 数十億の知識グラフを持つ大規模言語モデルを拡張するための,スケーラブルで効果的で汎用的な方法を提案する。
KG2KVとHiKVPはKGトリプルをLLMに統合し、サブ線形時間とメモリの複雑さを持つ。
LLM固有の注意機構を用いて、強力な知識基盤と一般化性能を維持している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:40:14 GMT)
AutoGraph-R1: End-to-End Reinforcement Learning for Knowledge Graph Construction [60.5] 強化学習(RL)を用いたタスクパフォーマンスのKG構築を直接最適化する最初のフレームワークであるAutoGraph-R1を紹介する。
我々は2つの新しいタスク対応報酬関数を設計し、1つは知識担体としてのグラフと、もう1つは知識指標としてのグラフを設計する。
私たちの研究は、構築とアプリケーションの間のループを閉じることが可能であることを示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:13:06 GMT)
Generalization Below the Edge of Stability: The Role of Data Geometry [60.1] 安定性の限界以下で訓練されたReLUネットワークにおいて,データ幾何が一般化を制御するかを示す。
低次元球の混合に支持されるデータ分布について、本質的な次元に確実に適応する一般化境界を導出する。
文献に現れる異種の経験的所見を総合的に検討した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:40:36 GMT)
SimBench: Benchmarking the Ability of Large Language Models to Simulate Human Behaviors [58.9] 我々は,LLMシミュレーションの堅牢で再現可能な科学のための,最初の大規模標準ベンチマークであるSimBenchを紹介する。
現在、最高のLLMでさえシミュレーション能力が限られ(スコア: 40.80/100)、性能はモデルサイズと対数的にスケールする。
シミュレーション能力は、深い知識集約的推論と最も強く相関していることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:14:38 GMT)
REOrdering Patches Improves Vision Models [58.8] パッチ順序がそのような設定におけるモデル性能に大きく影響していることが示される。
本稿では,タスク最適パッチ順序を見つけるためのフレームワークであるREOrderを提案する。
Re Orderは、ImageNet-1K上の行マジョールの順序を最大3.01%改善し、世界の関数マップを13.35%改善した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:02:56 GMT)
Accelerating Vision Transformers with Adaptive Patch Sizes [58.5] Vision Transformerは、入力画像をコンテンツに関係なく一様サイズのパッチに分割する。
適応パッチ変換器(APT)は,複数の異なるパッチサイズを同一画像内で使用することで,この問題に対処する。
APTはViT推論とトレーニングの大幅な高速化を実現し、ViT-Lでは40%、ViT-Hでは50%のスループット向上を実現している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:37:11 GMT)
Token-Level Inference-Time Alignment for Vision-Language Models [58.4] VLM(Vision-Language Models)は、現代のマルチモーダルインテリジェンスの重要なバックボーンとなっている。
本稿では,基本VLMを凍結し,その分布を近似する報酬モデルをトレーニングする軽量フレームワークTITAを提案する。
推測中、暗黙の選好信号は報酬モデルと目標VLMの対数確率比として抽出され、密集した自己回帰フィードバックが得られる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:58:03 GMT)
Physical Layer Deception based on Semantic Distortion [58.4] 物理層 deception (PLD) は、物理層セキュリティ(PLS)と偽造技術を統合するフレームワークである。
我々は,この枠組みを意味的コミュニケーションモデルに拡張し,性能指標として意味的歪みを用いた理論的解析を行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:12:05 GMT)
Foundation Models for Discovery and Exploration in Chemical Space [58.0] MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:56:01 GMT)
The 1st Solution for 7th LSVOS RVOS Track: SaSaSa2VA [57.3] ビデオオブジェクトのセグメンテーション(RVOS)を参照するには、自然言語で表現されたビデオ内のオブジェクトのセグメンテーションと追跡が必要である。
これらの問題に対処するために、Augmented and Selective Averaged Sa2VA (SaSa2VA)を提案する。
SaSa2VA は mathcalJ&F$ 67.45 を獲得し、ランキング1位で2.80ポイントを突破した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:36:14 GMT)
Neural Network Reprogrammability: A Unified Theme on Model Reprogramming, Prompt Tuning, and Prompt Instruction [57.2] モデル適応のための統一フレームワークとして,ニューラルネットワークの再プログラム可能性を導入する。
本稿では,4つの重要な側面にまたがる情報操作アプローチを分類する分類法を提案する。
残る技術的課題や倫理的考察も分析する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:15:14 GMT)
MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [57.0] 病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:35:13 GMT)
Morpheus: Benchmarking Physical Reasoning of Video Generative Models with Real Physical Experiments [55.6] 物理推論に基づく映像生成モデル評価のためのベンチマークであるMorpheusを紹介する。
物理現象を捉えた80の現実世界のビデオが保存法によってガイドされている。
我々の研究結果によると、プロンプトやビデオコンディショニングが進んだとしても、現在のモデルは物理原理をエンコードするのに苦労している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:16:12 GMT)
Knowledge-based Visual Question Answer with Multimodal Processing, Retrieval and Filtering [55.5] 知識に基づく視覚的質問応答(KB-VQA)は、視覚的理解と外部知識検索を統合するために視覚言語モデル(VLM)を必要とする。
本稿では,処理,検索,フィルタリングといった3段階の手法をWiki-PRFと呼ぶ。
ベンチマークデータセット(E-VQAとInfoSeek)の実験では、回答の品質が大幅に向上し、最先端のパフォーマンスが達成された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:23:12 GMT)
From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors [54.8] 既存の視覚言語アクション(VLA)モデルは3Dの現実世界で機能するが、通常は2Dエンコーダ上に構築される。
本研究では,アクションヘッドにリッチな3次元空間トークンを注入する新しいパラダイムであるFALCONを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:26:45 GMT)
Self-planning Code Generation with Large Language Models [54.4] 本稿では,大規模言語モデルを用いた自己計画型コード生成手法を提案する。
計画段階では、モデルは意図から簡潔で形式化された計画手順を概説する。
実装フェーズでは、モデルが前回の計画ステップでガイドされたステップごとにコードを生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:41:09 GMT)
UniCTokens: Boosting Personalized Understanding and Generation via Unified Concept Tokens [54.4] 我々は、パーソナライズされた情報を統合された視覚言語モデル(VLM)に統合し、理解と生成を行うUniCTokensを提案する。
UniCTokensは、補完的なセマンティクスを活用するために統一された概念トークンのセットをトレーニングし、2つのパーソナライズされたタスクを強化した。
我々の研究は、理解の向上が生成を改善することを示し、生成プロセスは理解に価値ある洞察を与えることができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:56:39 GMT)
Evolving LLMs' Self-Refinement Capability via Iterative Preference Optimization [53.9] 自己精製(Self-Refinement)とは、モデルが自身のレスポンスを改訂し、改善された出力を生成する能力を指す。
EVOLVEは、反復的なトレーニングを通じて自己精製の進化を導き、追跡するためのフレームワークである。
固有モデル能力のより広範な自己改善を実現するために自己改善を活用する可能性を実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:35:34 GMT)
AdapTrack: Constrained Decoding without Distorting LLM's Output Intent [53.8] 言語モデルに基づくコード生成と補完ツールは、時には必要な制約を満たさないコードを生成することがある。
制約に固執するコードを生成するために、制約付き復号法が開発された。
AdapTrackは、モデルの出力インテントを歪めるのを避けるため、制約に準拠するだけでなく、モデルの出力インテントと意味的に一致した結果を生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:11:34 GMT)
JT-Safe: Intrinsically Enhancing the Safety and Trustworthiness of LLMs [53.6] 大規模な言語モデルの不安全と幻覚は、本質的には事前学習に由来すると広く合意されている。
データは広大なので、事実の誤り、論理的不整合、あるいは分布バイアスのデータを完全に浄化することはほとんど不可能です。
産業シナリオを反映した大量のデータ量を増やすことを目的として, プレトレーニングデータを世界規模で拡張する手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:12:49 GMT)
Weak-to-Strong Generalization Even in Random Feature Networks, Provably [52.6] GPT-4のような強力な学習者を必要としないことを示す。
我々は、弱い教師によってラベル付けされたデータにのみ訓練されたにもかかわらず、学生がいかに教師より優れているかを実証し、証明し、理解する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:33:32 GMT)
3D Audio-Visual Segmentation [52.3] ロボット工学やAR/VR/MRに様々な応用がある。
本稿では,事前学習した2次元オーディオ視覚基盤モデルから,使用可能な知識を統合することで特徴付ける新しいアプローチであるEchoSegnetを提案する。
実験により、EchoSegnetは、私たちの新しいベンチマークで、3D空間の音声オブジェクトを効果的にセグメント化できることが実証された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:40:55 GMT)
Grounded Reinforcement Learning for Visual Reasoning [51.9] 我々は、強化学習で訓練された視覚言語モデルViGoRL(Visually Grounded Reinforcement Learning)を紹介する。
人間の視覚的意思決定にインスパイアされたViGoRLは、空間的に根拠のある推論トレースを生成することを学ぶ。
この結果から,RLは汎用的な視覚的推論を用いたモデル入力の強力なパラダイムであることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:54:22 GMT)
Leveraging Robust Optimization for LLM Alignment under Distribution Shifts [51.7] 人間の値に整合した出力を生成するために、大規模言語モデルを操る上で、優先順位アライメント手法はますます重要になっている。
このようなシフトに拘わらず、好みのアライメントを改善する新しい分布対応最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:27:16 GMT)
The Existence and Role of Quantum-State Noise [51.6] 量子現実に関する重要な観察は、ある瞬間に量子事象の確率が私たちにとって明確な結果になるかのようにしばしば現れることである。
しかし、注意深く分析すると、量子実験の観測結果である明確な状態として知覚されるものは厳密には定かではないことが示唆される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:24:57 GMT)
Subject-Event Ontology Without Global Time: Foundations and Execution Semantics [51.6] 形式化は9つの公理(A1-A9)を含み、実行可能性の正しさを保証する:履歴の単調性(I1)、因果性の非巡回性(I2)、トレーサビリティ(I3)である。
フォーマル化は、分散システム、マイクロサービスアーキテクチャ、DLTプラットフォーム、およびマルチパースペクティビティシナリオ(異なる主題から事実を分解する)に適用できる。
モデルに基づくアプローチ(A9): スキーマによるイベント検証、アクター認可、グローバル時間なしで因果連鎖の自動構築(W3)。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:26:44 GMT)
Grounding Language with Vision: A Conditional Mutual Information Calibrated Decoding Strategy for Reducing Hallucinations in LVLMs [51.3] LVLM(Large Vision-Language Models)は幻覚の影響を受けやすいモデルである。
本稿では,条件付きポイントワイド・ミューチュアル・インフォメーション(C-PMI)キャリブレーション・デコーディング・ストラテジーを導入する。
提案手法は,復号効率を保ちながら,LVLMの幻覚を著しく低減することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:44:03 GMT)
Language Confusion Gate: Language-Aware Decoding Through Model Self-Distillation [50.9] 本稿では,デコード時にトークンをフィルタリングする軽量なプラグインソリューションであるLanguage Confusion Gate (LCG)を紹介する。
LCGは、標準調整自己蒸留を用いて訓練され、適切な言語ファミリーを予測し、必要に応じてマスクを適用する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:02:37 GMT)
Fully Autonomous AI Agents Should Not be Developed [50.6] 本稿では,完全自律型AIエージェントを開発すべきではないと主張している。
この立場を支持するために、我々は、従来の科学文献と現在の製品マーケティングから、異なるAIエージェントレベルを規定するために構築する。
分析の結果,システムの自律性によって人へのリスクが増大することが明らかとなった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:24:44 GMT)
SPACeR: Self-Play Anchoring with Centralized Reference Models [50.6] Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。
大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。
本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:53:02 GMT)
Auto-Prompt Generation is Not Robust: Prompt Optimization Driven by Pseudo Gradient [50.2] PertBenchは、幅広い入力摂動を含む包括的なベンチマークデータセットである。
我々の分析は、既存の即時生成戦略における重大な脆弱性を明らかにしている。
PGOは、摂動型を擬似次数次信号として活用する、勾配のないプロンプト生成フレームワークである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:16:38 GMT)
Progressive Tempering Sampler with Diffusion [50.1] 本研究では, 拡散モデルを温度にわたって逐次訓練するニューラルサンプリング器を提案する。
また, 高温拡散モデルを組み合わせて低温試料を近似的に生成する手法を提案する。
本手法は,拡散型ニューラルサンプリングよりも高い精度で目標評価効率を向上する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:43:29 GMT)
$\boldsymbolλ$-Orthogonality Regularization for Compatible Representation Learning [48.3] 検索システムは、ますます強力なモデルによって学習される表現に依存している。
学習表現における学習コストと不整合のため、表現間のコミュニケーションを促進することには大きな関心がある。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:17:23 GMT)
DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection [48.3] 効率的な適応モジュールのライブラリの構築とメンテナンスを目的としたフレームワークであるDitHubを紹介した。
Version Control SystemsにインスパイアされたDitHubは、専門家モジュールを必要に応じてフェッチしてマージ可能なブランチとして管理する。
本手法は,ODinW-13ベンチマークとODinW-Oを用いて,クラス再出現の評価を行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:09:57 GMT)
Leveraging Importance Sampling to Detach Alignment Modules from Large Language Models [48.2] 伝統的なアライメント手法では、しばしば大きな事前訓練されたモデルを再訓練する必要がある。
本稿では,アライメント処理を重要サンプリングの一種として形式化する新しいtextitResidual Alignment Model (textitRAM) を提案する。
本稿では,トークンレベルの復号化を反復的に行う再サンプリングアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:29:40 GMT)
Rethinking LLM Uncertainty: A Multi-Agent Approach to Estimating Black-Box Model Uncertainty [48.0] ブラックボックスLSMの不確実性の定量化は、信頼性の高い応答とスケーラブルな監視に不可欠である。
本研究では,不確実性推定にマルチエージェント相互作用を用いた新しい理論的基礎手法であるDiverseAgentEntropyを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:25:27 GMT)
MILES: Modality-Informed Learning Rate Scheduler for Balancing Multimodal Learning [47.5] MILES (Modality-Informed Learning RatE Scheduler) を多モード関節融合モデルの訓練用として提案する。
MILESは、マルチモーダル学習を効果的にバランスさせるために、トレーニング中のモダリティワイド条件付き利用率のバランスをとる。
MILESは,本研究で検討した全タスクおよび融合法において,すべてのベースラインに優れることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:34:59 GMT)
NFIG: Multi-Scale Autoregressive Image Generation via Frequency Ordering [47.4] NextFrequency Image Generation (NFIG)は、画像生成プロセスを複数の周波数誘導段階に分解する新しいフレームワークである。
NFIGは生成過程を自然な画像構造と整合させる。
これは最初に低周波成分を生成し、トークンを著しく少なくして効率的にグローバル構造を捉え、その後、徐々に高周波の細部を付加することで実現している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:31:52 GMT)
MARS-M: When Variance Reduction Meets Matrices [47.4] マトリックスベースのプレコンディショニングは、大規模なニューラルネットワークのためのスカラーベースのプレコンディショニングよりも効率的であることが示されている。
我々は,MARSにおける分散低減手法をMuonと統合する新しい手法であるMARS-Mを紹介する。
言語モデリングとコンピュータビジョンタスクによる結果から,MARS-M はダウンストリームベンチマークにおいて連続的に損失を低減し,性能を向上することが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:49:22 GMT)
The Translation Barrier Hypothesis: Multilingual Generation with Large Language Models Suffers from Implicit Translation Failure [47.4] 課題解決に成功しているにもかかわらず、翻訳段階の失敗は最終結果の低品質化にとって重要な要因であることを示す。
108言語対にわたる単語翻訳タスクにおいて,いずれの段階も最終失敗の原因となる範囲を定量化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:16:48 GMT)
Deeper with Riemannian Geometry: Overcoming Oversmoothing and Oversquashing for Graph Foundation Models [47.2] メッセージパッシングニューラルネットワーク(MPNN)は、グラフ基盤モデルのブロックを構築している。
MPNNは過密と過密に悩まされている。
ローカル構造に基づくメッセージパッシングを調整するためのtextbflocalアプローチを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:41:45 GMT)
C-SEO Bench: Does Conversational SEO Work? [46.9] 大規模言語モデル (LLM) は,検索エンジンを会話型検索エンジン (CSE) に変換する。
C-SEO Benchは、複数のタスク、ドメイン、アクター数にまたがるC-SEOメソッドを評価するために設計された最初のベンチマークである。
実験の結果,現行のC-SEO法の大部分は非効率であるだけでなく,文書のランク付けに悪影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:13:09 GMT)
CEReBrO: Compact Encoder for Representations of Brain Oscillations Using Efficient Alternating Attention [46.5] 交互注意(CEReBrO)を用いた脳振動の表現のための圧縮法について紹介する。
トークン化方式は、チャネルごとのパッチで脳波信号を表現します。
本研究では,チャネル内時間的ダイナミックスとチャネル間空間的相関を共同でモデル化し,通常の自己アテンションに比べて6倍少ないメモリで2倍の速度向上を実現するための注意機構を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:42:46 GMT)
Infinity Parser: Layout Aware Reinforcement Learning for Scanned Document Parsing [46.1] layoutRLは、レイアウトを明示的に認識するようにモデルをトレーニングするエンドツーエンドの強化学習フレームワークである。
堅牢なドキュメント理解の進歩を加速するために、コードとデータセットを公開します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:09:33 GMT)
Ineq-Comp: Benchmarking Human-Intuitive Compositional Reasoning in Automated Theorem Proving on Inequalities [46.1] 本研究では,AM/GMのような既知の不等式を適用することにより,与えられた問題が単純化されることを認識するプロバーの能力について検討する。
これらの問題は人間にとって容易なままだが、Goedel、書き直し、Kimina-7Bを含むほとんどのプローバーは、かなり苦労している。
我々の結果は、現在のAIプロデューサの行動と人間の直感の間に持続的なギャップを露呈する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:36:02 GMT)
Local properties of neural networks through the lens of layer-wise Hessians [45.9] 本稿では,階層型ヘッセン行列のレンズを用いたニューラルネットワーク解析手法を提案する。
この概念はパラメータ空間の局所幾何学を特徴づけるための公式なツールを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:34:31 GMT)
Transaction Capacity, Security and Latency in Blockchains [45.8] 我々は,ブロックが$k$-deepになった後のブロックがいかにセキュアか,すなわちセキュリティレイテンシを中本合意のために分析する。
我々は、セキュリティレイテンシ分析を待ち行列システムの持続的なトランザクションレートに接続する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:27:45 GMT)
Navigating the Latent Space Dynamics of Neural Models [45.5] 我々は、潜在多様体に作用する力学系として、ニューラルモデルの別の解釈を示す。
オートエンコーダモデルは、符号化復号写像を反復的に適用することによって導かれる、多様体上の潜在ベクトル場を暗黙的に定義することを示す。
本稿では,ベクトル場をネットワークの表現として活用し,モデルとデータの特性を解析するための新しいツールを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:59:10 GMT)
The Curious Case of Curiosity across Human Cultures and LLMs [45.4] 多様なトピックにまたがる実世界の多国間データセットであるAnswersを用いて,好奇心の文化的変動を調査した。
大規模言語モデルは異文化間の多様性をフラットにし、西洋諸国における好奇心の表現方法とより密接に一致している。
次に、LLMの好奇心を誘導する微調整戦略を検討し、人間モデルアライメントギャップを最大50%狭める。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:55:28 GMT)
Video-SafetyBench: A Benchmark for Safety Evaluation of Video LVLMs [45.3] Video-SafetyBenchは、ビデオテキスト攻撃下でのLVLMの安全性を評価するために設計された最初のベンチマークである。
ビデオテキストのペアは2,264で、48のきめ細かいアンセーフなカテゴリにまたがっている。
安全性評価のためのセマンティックなビデオを生成するために,ビデオ意味論を主題画像とモーションテキストに分解する制御可能なパイプラインを設計する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:29:43 GMT)
ShapeCraft: LLM Agents for Structured, Textured and Interactive 3D Modeling [45.2] ShapeCraftはテキストから3D生成のための新しいマルチエージェントフレームワークである。
ShapeCraftは複雑な自然言語をサブタスクの構造化グラフに分解する。
エージェントはユーザの入力をGPSに解析し、手続き的モデリングと絵を反復的に洗練して3Dアセットを生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:51:14 GMT)
UniRL-Zero: Reinforcement Learning on Unified Models with Joint Language Model and Diffusion Model Experts [44.8] 統合強化学習(RL)フレームワークであるUniRL-Zeroについて述べる。
本研究は、統合モデル強化学習のための6つのシナリオを定義し、統合理解と生成モデルの強化学習のための体系的ベースラインを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:02:16 GMT)
RepIt: Steering Language Models with Concept-Specific Refusal Vectors [44.5] RepItは概念固有の表現を分離するためのフレームワークである。
目的概念に対する拒絶を選択的に抑制し、他所での拒絶を抑える。
WMD関連の問題に答えるモデルを生成するが、標準ベンチマークでは安全と評価されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:21:12 GMT)
CAPO: Towards Enhancing LLM Reasoning through Generative Credit Assignment [44.3] RLVR(Reinforcement Learning with Verifiable Rewards)は、ルールベースのバイナリフィードバックを使用することで、LLM(Large Language Models)の推論能力を改善した。
現在のRLVRメソッドは、通常、すべてのトークンに同じ報酬を割り当てる。
この粗い粒度のフィードバックは、正確なクレジット割り当てを妨げ、モデルがどの推論ステップが成功または失敗につながるかを特定するのが難しくなる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:32:37 GMT)
Investigating Thinking Behaviours of Reasoning-Based Language Models for Social Bias Mitigation [44.0] 社会的偏見凝集の背景にある思考過程のメカニズムを考察する。
社会的偏見の凝集を促進する2つの失敗パターンを発見しました。
我々のアプローチは、正確性を維持したり改善したりしながら、バイアスを効果的に軽減します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:33:44 GMT)
Stochastic Difference-of-Convex Optimization with Momentum [43.8] 滑らかさの下での運動量収束は任意の大きさに対してバッチ収束仮定(凹部)を可能にすることを示す。
我々の運動量に基づくアルゴリズムは、証明可能な収束ステップを段階的に達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:00:32 GMT)
ParaVul: A Parallel Large Language Model and Retrieval-Augmented Framework for Smart Contract Vulnerability Detection [43.4] ParaVulは、スマートコントラクト脆弱性検出の信頼性と精度を向上させるための、検索強化フレームワークである。
LLM微調整のためのスパースローランド適応(SLoRA)を開発した。
脆弱性契約データセットを構築し,RAG(Retrieval-Augmented Generation)システムを開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:23:41 GMT)
Discovering Causal Relationships using Proxy Variables under Unmeasured Confounding [42.7] 観測研究における変数ペア間の因果関係の推測は極めて重要であるが,困難である。
我々は,不測の共同設立者の下で因果仮説をテストするために,離散的かつ連続的な設定を両立する一般的な非パラメトリックアプローチを開発する。
Intensive Care Data and World Values Surveyの広範囲なシミュレーションと実世界データによるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:13:12 GMT)
Quantum Rewinding for IOP-Based Succinct Arguments [42.1] 我々は、ベクトルコミットメントスキームが崩壊しているとき、BCS変換のインタラクティブな変種が量子敵に対する標準モデルで安全であることを証明した。
その結果、量子後安全な簡潔な議論の標準モデルを得ることができ、その複雑さを最もよく知ることができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:02:29 GMT)
A deep solver for backward stochastic Volterra integral equations [42.0] 本稿では、Volterra積分方程式(BSVIE)に対する最初のディープラーニング解法とその完全結合前方変種について述べる。
この方法は、ニューラルネットワークを訓練して、2つの解場を1段階で近似し、古典的なアルゴリズムを制限するネスト時間サイクルの使用を避ける。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:00:30 GMT)
SEER: Enhancing Chain-of-Thought Code Generation through Self-Exploring Deep Reasoning [41.8] CoT(Chain-of-Thought)推論により、LLM(Large Language Models)は、コードを書く前に高いレベルの推論計画を開発することができる。
コード生成の正確かつ適応的な推論を可能にするSelf-Exploring Deep ReasoningフレームワークであるSEERを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:51:17 GMT)
When LLM Agents Meet Graph Optimization: An Automated Data Quality Improvement Approach [41.6] テキスト分散グラフ(TAG)は、現代のデータ管理と分析において、グラフ構造化データの鍵となる形式となっている。
我々の実証分析は、従来のLLM強化グラフニューラルネットワーク(GNN)とLLM強化グラフニューラルネットワーク(GNN)の両方が、テキスト、構造、ラベルの不完全性の下で顕著に劣化していることを示している。
このギャップに対処するため,総合的なTAG品質最適化のための統合マルチエージェントフレームワークであるLAGAを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:17:41 GMT)
Do LLMs Recognize Your Latent Preferences? A Benchmark for Latent Information Discovery in Personalized Interaction [40.9] パーソナライズされたインタラクションにおける潜伏情報発見を評価するためのベンチマークを導入する。
このベンチマークは、古典的な20の質問ゲーム、パーソナライズされた質問回答、パーソナライズされたテキスト要約という3つの段階的な現実的な設定にまたがっている。
以上の結果から,LLMは対話を通して潜時情報を提示できるが,その成功は文脈によって劇的に変化することが明らかとなった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:58:49 GMT)
On the Universal Near Optimality of Hedge in Combinatorial Settings [40.8] 任意の$X 部分集合 0,1d$ に対して、Hedge は、最大$sqrtlog d$ factor まで、ほぼ最適であり、$Omegabig(sqrtT log(|X|/log dbig)$ の下位境界を確立することによって示される。
また,DAGにおける最短パス問題に対する準最適正規化器も確立した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:05:22 GMT)
HUMAP: Hierarchical Uniform Manifold Approximation and Projection [40.8] HUMAPは、局所的・大域的構造の保存に柔軟であるように設計された、新しい階層的次元削減技術である。
提案手法の優位性を示す実証的証拠を現在の階層的アプローチと比較し,データセットラベリングにHUMAPを適用したケーススタディを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:04:17 GMT)
Aesthetics is Cheap, Show me the Text: An Empirical Evaluation of State-of-the-Art Generative Models for OCR [40.7] 我々は,テキスト画像の生成と編集の観点から,最先端の生成モデルの能力を評価する。
我々は、33の代表的なタスクを選択し、それらを文書、手書きテキスト、シーンテキスト、芸術テキスト、複雑でレイアウトに富んだテキストの5つのカテゴリに分類する。
包括的評価のために,クローズド・ソース領域とオープンソース領域の2つの領域にまたがる6つのモデルについて,画像入力とプロンプトを用いて検討した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:28:07 GMT)
ScreenCoder: Advancing Visual-to-Code Generation for Front-End Automation via Modular Multimodal Agents [40.7] ScreenCoderはモジュール型のマルチエージェントフレームワークで、タスクを3つの解釈可能なステージ(グラウンド、プランニング、生成)に分解する。
特殊エージェントにこれらの異なる責任を割り当てることで、我々のフレームワークはエンド・ツー・エンドのアプローチよりもはるかに高い堅牢性と忠実性を達成する。
提案手法は, レイアウト精度, 構造コヒーレンス, コード正確性において, 最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:13:43 GMT)
Planner and Executor: Collaboration between Discrete Diffusion And Autoregressive Models in Reasoning [40.7] 現在の自己回帰言語モデル(ARM)は精度が高いが、長いトークンシーケンスを必要とするため、コストがかかる。
DDLMは一定数のステップで並列かつ柔軟な生成を可能にする。
本稿では, DDLMとARMを結合したハイブリッドアーキテクチャについて検討し, 協調が相補的利益をもたらすかどうかを検証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:20:30 GMT)
Byzantine-Eavesdropper Alliance: How to Achieve Symmetric Privacy in Quantum $X$-Secure $B$-Byzantine $E$-Eavesdropped $U$-Unresponsive $T$-Colluding PIR? [40.2] 我々は、$N$データベースと$K$メッセージを持つシステムにおいて、量子非対称なプライベート情報検索問題を考える。
最初のモデルでは、アップリンク方向(ユーザから$N$サーバへの方向)に$mathcalE$eavesdropedリンクがある。
第2のモデルでは、静的な盗聴器とともにシステムのプライバシとセキュリティを害する計画を考案し、コーディネートできるビザンティンサーバについて検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:31:12 GMT)
Enhanced Motion Forecasting with Plug-and-Play Multimodal Large Language Models [40.2] PnF(Plug-and-Forecast)は,マルチモーダル大言語モデル(MLLM)を用いた既存の動き予測モデルを強化するプラグイン・アンド・プレイ方式である。
PnFは、自然言語が複雑なシナリオを記述し、処理するためのより効果的な方法を提供するという洞察に基づいて構築されている。
本手法はMLLMのゼロショット推論機能を利用して,微調整を必要とせず,動作予測性能を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:01:29 GMT)
Efficient Long-context Language Model Training by Core Attention Disaggregation [40.1] 本稿では,コアアテンション計算,ソフトマックス(QKT)Vをモデルの他の部分から分離することにより,長文大言語モデルの訓練を改善する手法を提案する。
本研究では,DistCAと呼ばれるシステムにCADを実装し,Ping-pong実行方式を用いて,計算処理と通信を重複させ,アテンションサーバ上でのインプレース実行によりメモリ使用量の削減を図る。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:40:51 GMT)
PAGE-4D: Disentangled Pose and Geometry Estimation for 4D Perception [39.8] PAGE-4Dはフィードフォワードモデルで、後処理なしでVGGTを動的シーンに拡張する。
ダイナミックス対応マスクを予測することで、静的および動的情報をアンタングルする。
実験の結果、PAGE-4Dは動的シナリオにおいて元のVGGTよりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:17:16 GMT)
OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [39.7] 事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。
我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
実験により、OSCARは量的および視覚的品質の指標において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:42:47 GMT)
Diffusion Models as Dataset Distillation Priors [39.5] 本稿では,特徴空間における合成データと実データとの類似性を定量化し,代表性を定式化するAs Diffusion Priors (DAP)を提案する。
DAPは、高忠実度データセットを生成する上で、最先端の手法よりも優れています。
我々の研究は、拡散先行とデータセット蒸留の目的との理論的関係を確立する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:04:09 GMT)
Towards Evaluating Proactive Risk Awareness of Multimodal Language Models [39.4] プロアクティブな安全人工知能(AI)システムは、リアクティブシステムよりもうまく機能する。
PaSBenchは416のマルチモーダルシナリオを通じてこの機能を評価する。
Gemini-2.5-proのようなトップパフォーマーは、71%のイメージと64%のテキスト精度を達成したが、繰り返しトライアルで45-55%のリスクを逃した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:51:16 GMT)
Universal Spectral Tokenization via Self-Supervised Panchromatic Representation Learning [39.1] 連続した科学的データは、多くの解像度と領域にまたがり、それらを共通の表現に統一することは、科学の基礎モデルを開発するための重要なステップである。
ヘテロジニアススペクトルを自己監督的に学習する深層学習モデルを提案する。
初めて、単一のモデルが、解像度と領域をまたいだスペクトルデータを統一できることを実証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:00:00 GMT)
Accurate and Efficient Low-Rank Model Merging in Core Space [39.1] コアスペースのマージフレームワークは、共通アライメントベースでLoRA対応モデルのマージを可能にする。
Core Spaceは既存のマージ技術を大幅に改善し、ビジョンと言語タスクの両面で最先端の結果が得られます。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:33:14 GMT)
Re-ttention: Ultra Sparse Visual Generation via Attention Statistical Reshape [38.8] 大きなボトルネックは、複雑性が解像度とビデオ長で2倍にスケールする注意機構である。
既存の技術は、非常に高い空間レベルにおける視覚的品質の維持に失敗し、無視できない計算オーバーヘッドを発生させる可能性がある。
本稿では,視覚生成モデルに非常に注意を払わせるRe-ttentionを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:39:49 GMT)
Identity-Preserving Image-to-Video Generation via Reward-Guided Optimization [38.7] 画像間(I2V)生成のためのIPRO(Identity-Preserving Reward-guided Optimization)を提案する。
IPROは、アイデンティティ保護を強化するための強化学習に基づく、新しいビデオ拡散フレームワークである。
提案手法は,サンプリングチェーンの最後のステップを通じて報酬信号をバックプロパゲートし,よりリッチなフィードバックを可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:00:01 GMT)
MT-Video-Bench: A Holistic Video Understanding Benchmark for Evaluating Multimodal LLMs in Multi-Turn Dialogues [38.6] マルチターン対話におけるMLLM評価のための総合的ビデオ理解ベンチマークMT-Video-Benchを紹介する。
具体的には、MT-Video-Benchは、主に知覚力と対話性に焦点を当てた6つのコア能力を評価し、987個の微調整されたマルチターン対話を包含する。
これらの機能は、インタラクティブスポーツ分析やマルチターンビデオベースのインテリジェントチューリングなど、現実世界のアプリケーションと厳格に一致している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:38:40 GMT)
What should a neuron aim for? Designing local objective functions based on information theory [38.3] バイオインスパイアされた局所学習目標を設計することで、自己組織化された人工ニューロンをどのように達成できるかを示す。
これらの目標は、情報理論の最近の拡張である部分情報分解を用いてパラメータ化される。
我々の研究は、地域学習戦略の原則的情報理論の基礎を推進している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:20:00 GMT)
Error Broadcast and Decorrelation as a Potential Artificial and Natural Learning Mechanism [38.2] 本稿では,ニューラルネットワークの新しい学習フレームワークであるError Broadcast and Decorrelation(EBD)を紹介する。
EBDは個々のレイヤに直接出力エラーを送信することで、クレジットの割り当てに対処する。
我々の研究は、EBDをニューラルネットワークトレーニングの効率よく、生物学的に妥当で、原則的に代替するものとして確立した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:39:52 GMT)
NanoHTNet: Nano Human Topology Network for Efficient 3D Human Pose Estimation [38.1] 3次元人間のポーズ推定(HPE)は、リソース制約されたエッジデバイスによって制限される。
そこで我々は,NanoHTNet(Nano Human Topology Network)を提案する。
また、プロキシタスクにおける多様な視点から2Dのポーズを調整するためにPoseCLRを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:53:26 GMT)
Rethinking Nighttime Image Deraining via Learnable Color Space Transformation [38.0] 我々は、既存のデータセットよりも高調和とリアリズムを提供する新しい高品質のベンチマークHQ-NightRainを開発した。
また,夜間からの複雑な雨の除去に有効なカラー空間変換ネットワーク(CST-Net)を開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:28:43 GMT)
Chimera: Compositional Image Generation using Part-based Concepting [37.7] 我々は、異なるソース画像から特定部分を組み合わせることで、新しいオブジェクトを生成するパーソナライズされた画像生成モデルであるChimeraを紹介する。
我々は,イメージコンディショニング機能を活用し,セマンティック・アイデンティティと空間的レイアウトの両方を強制する,部分条件誘導を用いたカスタム拡散事前モデルを訓練する。
人間の評価と測定値から,キメラは他の基準線を14%上回り,構成精度は21%,視力は21%向上した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:20:47 GMT)
Hyperspectral Anomaly Detection Fused Unified Nonconvex Tensor Ring Factors Regularization [37.5] 本稿では、統合された非スペクトルフレームワーク(TR)正規化因子を組み込んだHAD-EUNTRFRを提案する。
提案手法は,既存のSOTA(State-of-the-art)アプローチを項項の精度で上回る。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:36:23 GMT)
One Dinomaly2 Detect Them All: A Unified Framework for Full-Spectrum Unsupervised Anomaly Detection [37.4] 教師なし異常検出(UAD)は、特殊な単一クラスモデルの構築から、統一された多クラスモデルへと進化してきた。
Dinomaly2はフルスペクトル像UADのための最初の統一されたフレームワークである。
MVTec-AD と VisA では,前例のない 99.9% と 99.3% の画像レベル (I-) AUROC をそれぞれ達成している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:57:52 GMT)
Auto-Rubric: Learning to Extract Generalizable Criteria for Reward Modeling [37.2] リワードモデルは、大規模言語モデルと人間の価値の整合に不可欠であるが、その開発はコストのかかる選好データセットと低い解釈可能性によって妨げられている。
検証誘導型 textbfPropose-Evaluate-Revise パイプラインを用いて,高品質でクエリ固有のルーリックを推論する,トレーニング不要のフレームワークを構築した。
わずか70の選好ペア(ソースデータの1.5%)を使用することで、Qwen3-8Bのようなより小型のモデルでも、専門的で完全に訓練されたモデルよりも優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:01:37 GMT)
Benchmarking Probabilistic Time Series Forecasting Models on Neural Activity [37.2] 神経活動予測は、ニューラルネットワークを理解し、クローズドループ制御を可能にするために重要である。
ディープラーニングは最近、文学を予測する時系列において最先端の技術を進歩させたが、その神経活動予測への応用はまだ限られている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:19:29 GMT)
TREAT: A Code LLMs Trustworthiness / Reliability Evaluation and Testing Framework [37.1] 本稿では,コードインテリジェンスタスクにおけるモデル性能の総合評価を行う評価フレームワークを提案する。
評価フレームワークは、既存のアプローチにおける重要な制限に対処し、主な改善点を4つ挙げた。
この評価枠組みに基づき,26の最先端モデルを評価し,その強度と限界を明らかにする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:05:00 GMT)
DisasterM3: A Remote Sensing Vision-Language Dataset for Disaster Damage Assessment and Response [36.8] DisasterM3は、世界規模の災害評価と対応のためのビジョン言語データセットである。
災害M3には、26,988のバイテンポラル衛星画像と5大陸にまたがる123kの命令対が含まれる。
現実世界のシナリオに基づいて、DeramM3は9つの災害関連視覚認識と推論タスクを含んでいる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:18:13 GMT)
FineVision: Open Data Is All You Need [36.7] FineVisionは、ビジョン言語モデルのための、その種の最大のオープンリソースである。
200以上のソースを185のサブセットに,半自動化された,ループ内人間パイプラインを通じて統合しています。
FineVisionでトレーニングされたモデルは、既存のオープンミックスでトレーニングされたモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:54:46 GMT)
DARIL: When Imitation Learning outperforms Reinforcement Learning in Surgical Action Planning [36.3] 今回,CholecT50の手術行動計画において,ILとRLの総合的な比較を行った。
我々のデュアルタスク自動回帰学習(DARIL)ベースラインは、34.6%のアクショントリプレット認識mAP、33.6%の次のフレーム予測mAPを達成する。
我々は3つのRL変種(ワールドモデルベースRL,ダイレクトビデオRL,逆RL拡張)を評価した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:07:47 GMT)
Conformal online model aggregation [36.2] コンフォーマル予測は、強い分布仮定を行うことなく、不確実性定量化の合理的な概念を機械学習モデルに装備する。
本稿では,複数の共形予測セットを取り込み,適応的に組み合わされた1つの予測セットを出力するラッパーを提案する。
共形オンラインモデルアグリゲーション (COMA) と呼ばれる本手法は, 重み付け投票による複数のアルゴリズムからの予測セットの組み合わせに基づいている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:47:21 GMT)
The Graphon Limit Hypothesis: Understanding Neural Network Pruning via Infinite Width Analysis [36.2] 無限幅限界におけるスパースネットワークのトレーニング力学について検討する。
我々のフレームワークは、様々なスパースネットワークアーキテクチャのトレーニング性に対する接続パターンの影響に関する理論的知見を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:13:35 GMT)
Navigating the Alignment-Calibration Trade-off: A Pareto-Superior Frontier via Model Merging [36.0] ポストトレーニングの「アライメント税」は通常、タスクの正確さの低下として表される。
また、キャリブレーションが著しく失われ、モデルが過度に信頼され、信頼性が低く、モデル出力がより多様になることも示しています。
このトレードオフは、モデルの重みの補間とアライメント前後の補間という、単純なポストホック介入によって効果的にナビゲートできることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:12:41 GMT)
Verification-Aware Planning for Multi-Agent Systems [35.8] We present VeriMAP, a framework for multi-agent collaboration with verification-aware planning。
プランナーはタスクを分解し、サブタスクの依存関係をモデル化し、プランナー定義のパス基準をエンコードする。
検証対応計画がマルチエージェントシステムにおける信頼性の高い協調と反復的改善を実現する方法を示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:54:29 GMT)
I-RAVEN-X: Benchmarking Generalization and Robustness of Analogical and Mathematical Reasoning in Large Language and Reasoning Models [35.8] I-RAVEN-X(I-RAVEN-X)は、アナログおよび数学的推論における一般化とロバスト性を評価するために設計されたシンボリックベンチマークである。
その結果, LRMは, より長い推論関係とより広い属性範囲において, 生産性と体系性を向上できることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:51:13 GMT)
Every Rollout Counts: Optimal Resource Allocation for Efficient Test-Time Scaling [35.5] テスト時間スケーリング(TTS)による大規模言語モデル(LLM)の性能向上
探索中に最も効果的にロールアウト予算を割り当てる方法はまだ探索されていないが、多くの場合、テスト時に計算の効率が悪くなる。
本稿では,このバイアスを緩和する最適手法として,指向性資源割当(DORA)を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:29:40 GMT)
Xihe: Scalable Zero-Shot Time Series Learner Via Hierarchical Interleaved Block Attention [35.3] 階層型インターリーブドブロック注意(HIBA)を提案する。
超効率な9.5Mパラメータ構成から高容量1.5Bまで、スケーラブルなTSFMファミリーであるXiheを紹介する。
Xihe-maxは、最先端のゼロショットのパフォーマンスを新たに確立し、以前の最高の結果を実質的なマージンで上回っている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:10:11 GMT)
Closed-Loop Transfer for Weakly-supervised Affordance Grounding [35.3] LoopTransは、知識をエキソセントリックからエゴセントリックに移行する、新しいクローズドループフレームワークである。
LoopTrans内では、クロスモーダルな局所化や知識蒸留の認知など、いくつかの革新的なメカニズムが導入されている。
実験によると、LoopTransは画像とビデオのベンチマークですべてのメトリクスで一貫した改善を実現している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:21:35 GMT)
Soft-Masked Diffusion Language Models [35.2] マスクトークンの埋め込みと,上位k$の予測トークンの埋め込みを動的にブレンドする新しい手法であるソフトマスキング(SM)を導入する。
SMを用いた169Mパラメータモデルの事前学習を継続すると、パープレキシティとMAUVEスコアが向上することを示した。
最新の拡散モデルDream-7BとDream-Coder-7BをSMで微調整する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:42:03 GMT)
RESample: A Robust Data Augmentation Framework via Exploratory Sampling for Robotic Manipulation [35.0] VLA(Vision-Language-Action Model)は、模倣学習を通じて複雑なロボット操作タスクにおいて顕著な性能を示す。
探索サンプリングにより,RESample という自動 OOD データ拡張フレームワークを提案する。
LIBEROベンチマークと実世界のロボット操作タスクについて広範な実験を行い、resampleがVLAモデルの安定性と一般化能力を一貫して改善することを実証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:21:12 GMT)
ALPINE: A Lightweight and Adaptive Privacy-Decision Agent Framework for Dynamic Edge Crowdsensing [34.8] ALPINEは軽量で適応的なフレームワークで、端末デバイスがリアルタイムに差分プライバシーレベルを調整できるようにする。
環境リスク評価に基づいて、プライバシゲイン、データユーティリティ、エネルギーコストのバランスをとる報酬関数を設計する。
協調リスクモデルと事前訓練されたTD3ベースのエージェントの両方が、低オーバーヘッドデプロイメント用に設計されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:03:25 GMT)
GeoRecon: Graph-Level Representation Learning for 3D Molecules via Reconstruction-Based Pretraining [34.2] グラフレベルの事前学習フレームワークであるGeoReconを紹介する。
GeoReconは、より滑らかで移動可能な潜在空間を誘導しながら、幾何再構成をガイドするグラフレベルの再構築タスクを定式化する。
外部の監視を頼らずに、GeoReconは一般的に、複数の分子ベンチマークのバックボーンベースラインを改善している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:21:40 GMT)
Robustness in Text-Attributed Graph Learning: Insights, Trade-offs, and New Defenses [34.0] 我々は,TAG学習における堅牢性を評価するために,統一的で包括的な枠組みを導入する。
我々のフレームワークは、4つのドメインから10データセットにわたる古典的なGNN、堅牢なGNN(RGNN)、グラフLLMを評価する。
本研究は,TAGのセキュリティに関する今後の研究の基盤を確立し,対戦環境におけるTAG学習のための実践的ソリューションを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:57:54 GMT)
Understanding and Improving Length Generalization in Hierarchical Sparse Attention Models [34.0] チャンクに基づくスパースアテンションは、極端な長さの一般化のための有望なパラダイムとして現れている。
本稿では,これらのモデルを体系的に分解し,その性能を駆動するコアコンポーネントを同定する。
我々は、4KコンテキストでトレーニングされたモデルをRULERとBABILongで3200万トークンに一般化し、トレーニング不要な長さ外挿のための新しい最先端技術を確立した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:17:57 GMT)
Multimodal Safety Is Asymmetric: Cross-Modal Exploits Unlock Black-Box MLLMs Jailbreaks [33.8] MLLM(Multimodal large language model)は、様々な現実世界のアプリケーションにまたがって大きな有用性を示している。
しかしMLLMは、敵の入力が安全上の制約を崩壊させ、非倫理的な反応を引き起こす可能性があるジェイルブレイクに弱いままです。
強化学習に基づくブラックボックスジェイルブレイク手法であるPolyJailbreakを開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:03:39 GMT)
Convergence Rates for Gradient Descent on the Edge of Stability in Overparametrised Least Squares [33.6] ニューラルネットワーク上の勾配降下は、安定性の端と呼ばれる大きなステップサイズで頻繁に実行される。
過度にパラメータ化された最小二乗の設定において、学習率の高い勾配降下に対する収束率を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:02:41 GMT)
Fighter: Unveiling the Graph Convolutional Nature of Transformers in Time Series Modeling [33.6] この研究は、Graph Convolutional Network (GCN) にその基本的な等価性を確立することで、Transformerエンコーダをデミステレーションする。
textbfFighter (Flexible Graph Convolutional Transformer) は、冗長な線形射影を除去し、マルチホップグラフアグリゲーションを組み込んだ合理化アーキテクチャである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:42:14 GMT)
Predicting Video Slot Attention Queries from Random Slot-Feature Pairs [33.6] 人間と同じようにオブジェクトレベルのシーン表現と動的モデリングを可能にするため、教師なしのビデオオブジェクト中心学習(OCL)は有望である。
スロットと機能の両方を組み込んだ新しいトランジタを提案し,クエリ予測のための情報を提供する。
シーン表現実験により,本手法が既存のOCL手法をはるかに上回っていることが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:54:06 GMT)
Exploration via Feature Perturbation in Contextual Bandits [33.5] 未知のパラメータをランダムにしたり、報酬に雑音を加える代わりに、特徴入力に直接ランダム性を注入する手法を提案する。
このアルゴリズムは、一般化された線形包帯に対して$tildemathcalO(dsqrtT)$ worst-case regret boundを達成し、既存のランダム化された包帯アルゴリズムでは$tildemathcalO(d3/2sqrtT)$ regretを回避している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:32:48 GMT)
Demystifying Transition Matching: When and Why It Can Beat Flow Matching [32.9] Flow Matching (FM)は多くの最先端の生成モデルを支える。
近年の結果, 遷移マッチング (TM) はより少ないサンプリングステップで高い品質を達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:11:29 GMT)
DISCOVER: Automated Curricula for Sparse-Reward Reinforcement Learning [32.8] 目標条件付き超長距離RL(DISCOVER)の指向性スパース・リワード法を提案する。
我々は、DiscoVERを盗賊の原理的な探索に結びつけ、ターゲットタスクがターゲットへの初期距離で達成可能になるまでの時間を正式に制限する。
そこで,DiscoVERの方向性選択は,従来のRLにおける最先端探査手法の到達範囲を超えている探索問題を解く。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:58:20 GMT)
Tag-Enriched Multi-Attention with Large Language Models for Cross-Domain Sequential Recommendation [32.7] クロスドメインシークエンシャルレコメンデーション(CDSR)は、現代の消費者電子製品や電子商取引プラットフォームにおいて重要な役割を担っている。
我々はtextitLarge Language Models (LLMs) を統合した textbfTEMA-LLM を提案する。
4つの大規模なeコマースデータセットに関する大規模な実験は、TEMA-LLMが最先端のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:01:44 GMT)
A Standardized Benchmark for Machine-Learned Molecular Dynamics using Weighted Ensemble Sampling [32.5] 本稿では,タンパク質MD法を体系的に評価するモジュール型ベンチマークフレームワークを提案する。
このフレームワークには、任意のシミュレーションエンジンをサポートするフレキシブルで軽量なプロパゲータインターフェースが含まれている。
10から224個の残基から、様々な折りたたみ複合体にまたがる9種類のタンパク質のデータセットをコントリビュートする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:02:36 GMT)
HyperSearch: Prediction of New Hyperedges through Unconstrained yet Efficient Search [32.1] ハイパーグラフが与えられた場合、ハイパーエッジ予測は、将来、欠けているか、あるいは形成される可能性が高いハイパーエッジを特定することを目的としている。
既存のアプローチは、制約付き候補集合を得るためのサンプリングと、有望なハイパーエッジを選択するためのハイパーグラフ構造に関する根拠のない仮定のいずれかに依存している。
本稿では,制約のない候補集合を効率的に評価するハイパーエッジ予測アルゴリズムHyperSearchを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:55:40 GMT)
Initialize to Generalize: A Stronger Initialization Pipeline for Sparse-View 3DGS [31.8] Sparse-view 3D Gaussian Splatting (3DGS)はトレーニングビューによく適しており、新しいビューレンダリングのぼやけのようなアーティファクトにつながります。
以前の作業では、Structure-from-Motion(SfM)からポイントクラウドを拡張するか、3DGS最適化にトレーニング時間制限(正規化)を追加することで対処していた。
我々は、低周波ビュー拡張と緩和されたマルチビュー対応により、低テクスチャカバレッジを改善する周波数対応SfMを設計する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:23:19 GMT)
Adaptive Divergence Regularized Policy Optimization for Fine-tuning Generative Models [31.5] Adaptive Divergence Regularized Policy Optimization (Adaptive Divergence Regularized Policy Optimization) は、有利な推定値に基づいて正規化強度を自動的に調整する。
We implementation with Wasserstein-2 regularization for flow matching generative model is achieved great results on text-to-image generation。
ADRPOはテキストのみのLLMとマルチモーダル推論モデルの両方をKL規則化された微調整に一般化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:46:02 GMT)
The Integration of Artificial Intelligence in Undergraduate Medical Education in Spain: Descriptive Analysis and International Perspectives [31.5] AIは医療の実践を変革し、将来の医療専門家が習得しなければならない能力を再定義している。
ジャイアン大学はAIコンテンツによる義務コースを提供する唯一の機関である。
スペインにおけるAIの医学的学位への統合は、アンダルシアでは低重量であり、先進的で断片化され、不均一である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:22:54 GMT)
CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.3] 本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:16:50 GMT)
TrajMamba: An Efficient and Semantic-rich Vehicle Trajectory Pre-training Model [31.2] 車両GPSは、移動パターンや旅行目的を含む貴重な旅行セマンティクスを保存して、時間の経過とともに車両がどのように動くかを記録している。
旅行セマンティクスを効果的かつ効率的に学習することは、軌道データの現実的な応用に不可欠である。
そこで我々はTrajMambaを提案する。TrajMambaは効率的でセマンティックにリッチな車両軌道学習のための新しいアプローチである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:54:50 GMT)
OmniCast: A Masked Latent Diffusion Model for Weather Forecasting Across Time Scales [31.2] OmniCastはスケーラブルで熟練した確率モデルで、時間スケールで天気予報を統一する。
中距離の時間スケールで10倍から20倍高速に動作します。
これは、精度、物理ベース、確率的メトリクスにわたって、サブシーズンとシーズンのスケールで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:48:27 GMT)
Reflections from Research Roundtables at the Conference on Health, Inference, and Learning (CHIL) 2025 [31.1] 第6回保健・推論・学習年次会議(CHIL 2025)は2025年6月25日から27日にかけてアメリカ合衆国カリフォルニア州バークレーのカリフォルニア大学バークレー校で開催された。
今年のプログラムの一環として、私たちはResearch Roundtablesを開催し、機械学習とヘルスケアの交差点で重要な、タイムリーなトピックに関する、共同で小さなグループの対話を触媒しました。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:51:30 GMT)
Diffusion Transformers as Open-World Spatiotemporal Foundation Models [31.0] UrbanDiTは、オープンワールドの都市時間学習の基礎モデルである。
その重要なイノベーションは、データ駆動とタスク固有のプロンプトの両方を適応的に生成する、精巧なプロンプト学習フレームワークにある。
UrbanDiTは、都市時間領域の基礎モデルのための新しいベンチマークをセットアップする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:24:19 GMT)
CARDIUM: Congenital Anomaly Recognition with Diagnostic Images and Unified Medical records [31.0] 先天性心疾患(CHD)の出生前診断は、人工知能(AI)による解決策に大きな可能性を秘めている。
心臓データセットは、胎児超音波と心エコー画像と、出生前CHD検出のための母体臨床記録を統合した、初めて公開されたマルチモーダルデータセットである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:19:34 GMT)
Reliable Inference in Edge-Cloud Model Cascades via Conformal Alignment [30.8] 条件付きカバレッジを維持する必要があるエッジクラウドカスケードについて検討する。
リスクレベルに対するユーザ制御でこの特性を認証するコンフォーマルアライメントに基づくカスケード機構を導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:52:58 GMT)
Consistent Zero-Shot Imitation with Contrastive Goal Inference [30.7] 現実世界のインタラクションに展開されるエンボディエージェントの前提条件は、インタラクションによるトレーニングであるべきだ。
本研究の主な貢献は,対話型エージェントを自己指導型で事前学習する方法である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:28:03 GMT)
GSPlane: Concise and Accurate Planar Reconstruction via Structured Representation [30.1] GSPlaneは正確な形状を復元し、平面領域に対してクリーンでよく構造化されたメッシュ接続を生成する。
また、支持平面上のオブジェクトの分離と柔軟な操作を可能にする構造化平面表現の応用についても検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:59:21 GMT)
Identification and Adaptive Control of Markov Jump Systems: Sample Complexity and Regret Bounds [30.0] 本稿では,未知のマルコフジャンプ線形系 (MJS) を2次目的に最適化する問題を考える。
まず,MJSが各モードの力学を学習するためのシステム識別アルゴリズムを提案する。
そこで本研究では,システム識別と等価な制御を併用した適応制御方式を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:42:17 GMT)
WHAT-IF: Exploring Branching Narratives by Meta-Prompting Large Language Models [29.9] WHAT-IFは、ゼロショットメタプロンプティングを使用して、事前に書かれたストーリーから分岐物語を作成するシステムである。
このシステムはコヒーレントでよく構造化された代替ストーリーラインを生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:09:33 GMT)
EduAdapt: A Question Answer Benchmark Dataset for Evaluating Grade-Level Adaptability in LLMs [29.7] 大規模言語モデル(LLM)は、質問に答え、複雑な概念を説明し、幅広い主題にまたがるコンテンツを生成することによって、教育を変革している。
学術ベンチマークのパフォーマンスは高いが、学生の成績に反応しないことが多い。
これは、年齢に適した語彙と説明が効果的な学習に不可欠であるK-12教育において重要なニーズである。
エドゥアダプ(EduAdapt)は、9つの科学科目を対象に、48k近いグレードラベル付きQAペアのベンチマークであり、グレード1-12にまたがって4つのグレードにグループ化されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:30:40 GMT)
Optimizing Energy Management of Smart Grid using Reinforcement Learning aided by Surrogate models built using Physics-informed Neural Networks [29.5] Reinforcement Learning (RL)は、スマートグリッドにおける最適電力フローの課題に対処するソリューションとして注目されている。
本稿では,Physics-informed Neural Networks (PINN) を用いて構築したサロゲートモデルを用いて,コストのかかるスマートグリッドシミュレータを置換することで,この問題に対処する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:17:42 GMT)
MemoryBench: A Benchmark for Memory and Continual Learning in LLM Systems [29.5] LLMsysの継続的な学習能力を評価するために,ユーザフィードバックシミュレーションフレームワークとベンチマークを提案する。
実験により、最先端のベースラインの有効性と効率は、満足には程遠いことが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:16:12 GMT)
DICE: Structured Reasoning in LLMs through SLM-Guided Chain-of-Thought Correction [29.2] 大規模言語モデル(LLM)は、しばしば詳細な命令の遵守よりも推論を優先する。
これに対応するための教師付きデータセットの微調整 LLM は、高い計算コストと限られたパラメータアクセスのために実用的ではない。
我々は,小型言語モデル(SLM)をガイドする軽量フレームワークであるDICEを提案し,LLMの出力をチェーン・オブ・シンク(CoT)補正により改善する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:57:20 GMT)
Rewarding the Journey, Not Just the Destination: A Composite Path and Answer Self-Scoring Reward Mechanism for Test-Time Reinforcement Learning [29.2] 大規模言語モデル(LLM)の進化のための強力なパラダイムとして強化学習(RL)が登場した。
外部の監督なしに動作する新しいテストタイム報酬機構を開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:53:51 GMT)
Reliable Wireless Indoor Localization via Cross-Validated Prediction-Powered Calibration [29.2] 本稿では,限られたキャリブレーションデータを用いて予測器を同時に微調整し,合成ラベルのバイアスを推定する手法を提案する。
フィンガープリントデータセットの実験により,提案手法の有効性が検証された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:55:53 GMT)
KineDiff3D: Kinematic-Aware Diffusion for Category-Level Articulated Object Shape Reconstruction and Generation [28.8] ノートパソコンや引き出しなどのアーティキュレートオブジェクトは、3D再構成とポーズ推定において重要な課題を示す。
そこで我々は, KineDiff3D: Kinematic-Aware Diffusion for Category-Level Articulated Object Shape Reconstruction and Generationを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:15:40 GMT)
A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning [28.7] 上記の問題に対処するためのグラフィカルフレームワークとして,マルチエージェント・インフルエンス・ダイアグラム(MAID)を採用している。
まず、MAIDを利用してMARLの既存のアプローチを分析し視覚化する相互作用パラダイムを導入する。
そして,MAIDをベースとした新たなインタラクションパラダイムを設計し,単一のターゲットエージェントのみに適用する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:10:56 GMT)
MotionGPT3: Human Motion as a Second Modality [28.6] MotionGPT3は、理解と生成の両方のためのバイモーダルモーション言語モデルである。
共通注意を持つデュアルストリームトランスは、制御された双方向情報フローを実現しつつ、モダリティ固有の経路を保存する。
実験により、MotionGPT3はトレーニング損失の2倍高速収束、検証の最大4倍高速収束を実現している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:37:46 GMT)
PartSDF: Part-Based Implicit Neural Representation for Composite 3D Shape Parametrization and Optimization [28.4] PartSDFは教師付き暗黙の表現フレームワークで、独立して制御可能なパーツで合成形状を明示的にモデル化する。
PartSDFは、再構築および生成タスクにおいて、教師なしベースラインと教師なしベースラインの両方を上回っている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:17:01 GMT)
Finite-Time Bounds for Average-Reward Fitted Q-Iteration [28.2] MDP を弱通信する関数近似を用いた平均逆オフライン RL に対する最初のサンプル複雑性値を確立した。
平均逆条件下での有限時間解析を可能にするためには, アンカーを重み減衰の一形態として解釈することが重要である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:33:25 GMT)
Coinvisor: An RL-Enhanced Chatbot Agent for Interactive Cryptocurrency Investment Analysis [28.1] Coinvisorは、マルチエージェントフレームワークを通じて、暗号通貨投資の包括的な分析サポートを提供する。
鍵となるイノベーションは、多段階計画と多様なデータソースの柔軟な統合を可能にする強化学習ベースのツール選択メカニズムである。
その結果、Coinvisorはリコールを40.7%改善し、F1スコアは26.6%向上した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:23:49 GMT)
WP-CrackNet: A Collaborative Adversarial Learning Framework for End-to-End Weakly-Supervised Road Crack Detection [27.9] WP-CrackNetは、ピクセルワイド・クラック検出のためのエンドツーエンドの弱教師付き手法である。
我々は3つの画像レベルのデータセットを作成し、WP-CrackNetが教師付き手法に匹敵する結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:13:26 GMT)
RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation [27.8] Repository Planning Graph (RPG)は、統一グラフ内の機能、ファイル構造、データフロー、関数をエンコードする。
ZeroRepoは、提案レベルの計画、実装レベルの構築、テストバリデーションを備えたグラフ誘導コード生成という、グラフ駆動のフレームワークである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:22:14 GMT)
From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models [27.8] GISP-Global Iterative Structured Pruningは、ブロックワイド正規化により、構造レベルで集約された1次、損失ベースの重要な重み付けを用いて、注目ヘッドとチャネルを除去する。
反復的なスケジュールは、ワンショットプルーニングではなく、高い間隔で精度を安定させ、中間微調整を必要とせず、パープレキシティの崩壊を緩和する。
重要度はモデルレベルの損失によって定義されるため、GISPはタスク固有の目的を自然にサポートしている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:04:09 GMT)
Soundness-Aware Level: A Microscopic Signature that Predicts LLM Reasoning Potential [27.6] 検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)において強い推論をもたらす。
私たちの重要な発見は、高ポテンシャルモデルが本質的に音質に敏感であることです。
本稿では,これらの分布の分離を測定するためにJensen-Shannon Divergence を用いた顕微鏡計測法である Soundness-Aware Level (SAL) を紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:16:24 GMT)
Consistency is Key: Disentangling Label Variation in Natural Language Processing with Intra-Annotator Agreement [27.5] ラベルの安定性(およびアノテータの整合性)を経時的に測定するために、アノテータ内合意が加わったことを議論する。
これらの尺度の計算は、重要な品質管理として機能し、アノテータが反対する理由に関する洞察を与えることができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:38:17 GMT)
Watch the Weights: Unsupervised monitoring and control of fine-tuned LLMs [27.5] 細調整された大言語モデル(LLM)の理解・監視・制御のための新しい手法を提案する。
微調整モデルとそのベースモデルの間の重み差のトップ特異点が,新たに獲得した挙動に対応することを示す。
シークレットトリガーが存在する場合の安全メカニズムをバイパスするバックドアモデルでは、我々の手法は1.2%以下の偽陽性率で攻撃の最大100%を停止する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:29:29 GMT)
The Impact of Coreset Selection on Spurious Correlations and Group Robustness [27.5] コアセット選択手法は、データ効率のよい機械学習のためのモデル性能を維持しながら、トレーニングデータサイズの削減を約束している。
我々は、選択したコアセットの急激なバイアスレベルに対するデータ選択の影響と、それらに基づいてトレーニングされた下流モデルのロバスト性について、初めて包括的分析を行った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:57:23 GMT)
A Single Set of Adversarial Clothes Breaks Multiple Defense Methods in the Physical World [27.5] 敵の服は、パッチベースの攻撃に対する敵の防御に良いテストケースを提供する。
全ての防御方法は、デジタル世界と物理世界の両方において、敵の服に対する性能が劣っていた。
我々は、Faster R-CNNで複数の防御方法を壊した1組の服を作った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:16:25 GMT)
Monitoring morphometric drift in lifelong learning segmentation of the spinal cord [27.3] 9種類のMRIコントラストといくつかの脊髄病理を含む多地点$(n=75)$データセットで訓練した脊髄セグメンテーションモデルを提案する。
また、モデルが追加データセットを使用して更新されると、形態素のドリフトを自動的に監視する生涯学習フレームワークも導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:09:46 GMT)
Scalable Frame Sampling for Video Classification: A Semi-Optimal Policy Approach with Reduced Search Space [27.0] 検索スペースを$O(TN)$から$O(TN)$に減らすという新しい視点を導入する。
O(TN)$空間全体を探索する代わりに、提案した半最適ポリシーは各フレームの独立推定値に基づいて上位の$N$フレームを選択する。
我々は, 準最適政策が, 特に実践的な条件下で, 最適政策を効率的に近似できることを確認した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:25:19 GMT)
DialUp! Modeling the Language Continuum by Adapting Models to Dialects and Dialects to Models [26.9] 世界の言語や方言のほとんどは低リソースであり、機械翻訳(MT)モデルをサポートしていない。
本稿では,事前学習したモデルを方言データに適用するための訓練時間技術であるDialUpについて述べる。
4つの言語族に属するいくつかの方言では高い成績を示し,他の2つの言語族では控えめな成績を示した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:30:15 GMT)
Language Models are Injective and Hence Invertible [26.9] 非線型活性化や正規化のようなトランスフォーマー成分は本質的に非単射である。
数学的には、離散的な入力シーケンスを対応する連続表現のシーケンスにマッピングするトランスフォーマー言語モデルがインジェクティブであることが証明される。
隠れアクティベーションから正確な入力テキストを有効かつ効率的に再構築する最初のアルゴリズムであるSipItを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:29:02 GMT)
$\mathcal{V}isi\mathcal{P}runer$: Decoding Discontinuous Cross-Modal Dynamics for Efficient Multimodal LLMs [26.8] 我々は,LLaVA-v1.5 7B上での視線関連注意計算の最大99%,FLOPの最大53.9%を削減できるトレーニングフリープルーニングフレームワークであるemphVisiPrunerを提案する。
さらに、モデルアーキテクチャと本質的なレイヤワイド処理ダイナミクスを整合させることにより、効率的なMLLMのトレーニングのための実用的なガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:40:17 GMT)
General agents contain world models [26.6] 多段階の目標指向タスクに一般化できるエージェントは、その環境の予測モデルを学んだに違いない。
このモデルはエージェントの方針から抽出でき、エージェントのパフォーマンスや目標の複雑さを増大させるには、より正確な世界モデルを学ぶ必要がある。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:08:32 GMT)
DynVFX: Augmenting Real Videos with Dynamic Content [26.0] 本稿では,動的コンテンツを新たに生成した実世界の映像を拡大する手法を提案する。
入力ビデオと、所望の内容を記述した簡単なテキスト命令が与えられた場合、本手法は動的オブジェクトや複雑なシーン効果を合成する。
新しいコンテンツの位置、外観、動きは、元の映像にシームレスに統合される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:26:34 GMT)
Beating the Winner's Curse via Inference-Aware Policy Optimization [26.0] 一般的なアプローチは、機械学習モデルをトレーニングして反現実的な結果を予測し、予測された客観的価値を最適化するポリシーを選択することである。
提案手法は,政策を下流でどのように評価するかを考慮し,政策最適化を改良する,推論対応政策最適化と呼ばれる新しい戦略を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:28:12 GMT)
Parameter Efficient Fine-tuning via Explained Variance Adaptation [25.7] 我々は、FM(ファウンデーションモデル)のための新しい手法として、EVA(Explained Variance Adaptation)を導入する。
EVAは、最もアクティベーションのばらつきを捉え、期待される勾配信号を確実に最大化し、微調整を加速する方向を使用する。
EVAを言語生成・理解、画像分類、強化学習など様々な微調整タスクに適用する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:48:17 GMT)
ReXMoE: Reusing Experts with Minimal Overhead in Mixture-of-Experts [25.5] 既存のレイヤローカルアプローチを超えてルーティングを改善する新しいMoEアーキテクチャであるReXMoEについて説明する。
ReXMoEは、個々の専門家の能力を犠牲にすることなく、よりリッチな専門家の組み合わせを可能にする、階層単位の予算から専門家の次元を分離する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:27:55 GMT)
Steering Generative Models with Experimental Data for Protein Fitness Optimization [25.4] タンパク質の適合性最適化は、可能なシーケンスの大きな設計空間において、所望の量的特性を最大化する配列を見つけることを伴う。
ラベル付きデータによるタンパク質生成モデルの最近の進歩は、有望なアプローチである。
本研究では,ラベル付きシーケンス適合性ペアの少量(数百)を用いた適合度最適化について検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:15:03 GMT)
LLM-as-a-Prophet: Understanding Predictive Intelligence with Prophet Arena [25.3] 大規模言語モデル(LLM)は、将来の事象を予測するために、インターネットスケールのデータに基づいて訓練されている。
本稿では,LLMの予測知能について系統的に検討する。
LLM-as-a-Prophetによる優れた予測知能の実現に向けた重要なボトルネックを明らかにする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:20:05 GMT)
UniCrossFi: A Unified Framework For Cross-Domain Wi-Fi-based Gesture Recognition [25.0] Wi-Fiセンシングシステムは、目に見えない現実世界の環境に配備された場合、クロスドメインの問題によって深刻な障害を受ける。
我々は,CSIに基づく多様なデプロイメント設定におけるパフォーマンス低下を緩和する統合フレームワークUniCrossFiを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:09:45 GMT)
Variance-Reduction Guidance: Sampling Trajectory Optimization for Diffusion Models [24.3] 本稿では,予測誤差を統計的に測定する新しい手法を提案し,この誤差を緩和する可変還元誘導法(VRG)を提案する。
様々なデータセットとベースラインの実験により、VRGは拡散モデルの生成品質を大幅に改善できることが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:24:46 GMT)
Vision-Based Mobile App GUI Testing: A Survey [24.2] ビジョンベースのモバイルアプリ GUI テストアプローチは、コンピュータビジョン技術の開発とともに現れた。
本稿では,271論文における最新技術に関する包括的調査を行い,92論文は視覚に基づく研究である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:56:54 GMT)
Synthetic Dataset for Evaluating Complex Compositional Knowledge for Natural Language Inference [24.2] 論理学における構成性を理解するために,自然言語推論モデルの性能について検討する。
SICKデータセットから15の例を修正して1,304の文対を生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:54:36 GMT)
Advancing Complex Wide-Area Scene Understanding with Hierarchical Coresets Selection [24.1] シーン理解はコンピュータビジョンにおける中核的なタスクの一つであり、画像から意味情報を抽出してオブジェクトを識別することを目的としている。
既存のヴィジュアル・ランゲージ・モデル(VLM)は、目に見えない複雑な広域シーンへの適応において課題に直面している。
本稿では,複雑な広域シーン理解におけるVLMの適応を促進するための階層型コアセット選択機構を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:03:26 GMT)
On Task Vectors and Gradients [24.0] タスクベクトルとタスク損失の勾配との接続を確立することにより、タスク演算の厳密な理論的基礎を提供する。
標準勾配勾配下では,1つの微調整のエポックから生成されたタスクベクトルは,学習速度によってスケールされた損失の負の勾配と正確に等価であることを示す。
7つの視覚ベンチマークによる経験的分析は、我々の理論を裏付け、最初のエポック勾配がノルムと方向の両方において微調整軌道を支配していることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:13:40 GMT)
Contextual Attention Modulation: Towards Efficient Multi-Task Adaptation in Large Language Models [23.9] 大規模言語モデル(LLM)は優れた能力を持っているが、マルチタスク適応に苦戦している。
本研究では,LLMにおける自己注意モジュールの表現を動的に変調する新しいメカニズムであるCAM(Contextual Attention Modulation)を提案する。
私たちのアプローチは既存のアプローチよりも大幅に優れており、平均的なパフォーマンス改善は3.65%に達しています。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:19:27 GMT)
The Hidden Dangers of Public Serverless Repositories: An Empirical Security Assessment [23.7] サーバーレスコンピューティングは、目立ったクラウドパラダイムとして急速に現れてきた。
パブリックなサーバレスリポジトリは、サーバレスアプリケーションの開発を加速する鍵となっている。
本稿では、パブリックリポジトリにホストされているサーバレスコンポーネントのセキュリティ状況について、初めて包括的な分析を行った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:54:31 GMT)
Late Fusion and Multi-Level Fission Amplify Cross-Modal Transfer in Text-Speech LMs [23.7] 我々は、SmolTolkが最先端のTSLMに匹敵し、さらに多くの計算量で訓練されたことを示している。
提案手法は,より高いレベルの意味的特徴を音声から抽象化する能力を高める。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:06:09 GMT)
Raindrop GS: A Benchmark for 3D Gaussian Splatting under Raindrop Conditions [23.6] RaindropGSは、3DGSのパイプライン全体を評価するために設計されたベンチマークである。
まず,実世界の雨滴復元データセットを収集し,各シーンに3つの整列した画像を含む。
本研究では, 既存の3DGS法の性能限界に対する重要な洞察を, 総合的な実験と分析を通じて明らかにした。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:36:15 GMT)
Adaptive Discretization for Consistency Models [23.6] 本稿では,一貫性モデルの自動的かつ適応的な離散化のための統一的なフレームワークを提案する。
ラグランジュ乗算器との局所的整合性とグローバル的整合性のトレードオフを確立する。
実験により,ADCMはCMのトレーニング効率を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:52:33 GMT)
Fine-tuning Flow Matching Generative Models with Intermediate Feedback [23.4] フローベースの生成モデルは、テキスト・画像生成において顕著な成功を収めている。
既存のアプローチは、クレジット代入問題に苦しむ結果報酬からのみ学習する。
我々は3つの重要なイノベーションを通じてこれらの課題に対処する、堅牢なアクター批判フレームワークであるAC-Flowを紹介します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:08:03 GMT)
Auto-Connect: Connectivity-Preserving RigFormer with Direct Preference Optimization [23.4] Auto-Connectは骨格接続を明示的に保存する自動リグのための新しいアプローチである。
我々は、それぞれの関節の子供と各階層層のエンドポイントを定義するために、特別なトークンを使用します。
また,潜伏した上顎骨の選抜に暗黙の測地学的特徴を取り入れ,皮膚の質を著しく改善した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:54:18 GMT)
From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging [23.4] 顔の老化は、エンターテイメントから医療に至るまで、コンピュータビジョンにおいて重要な課題となっている。
鍵となる課題は、年齢の正確さとアイデンティティの保存のバランスにある。
数ステップのテキスト・ツー・イメージ(T2I)拡散モデルに基づく2パスの顔エイジングフレームワークであるCradle2Caneを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:50:01 GMT)
MUG-V 10B: High-efficiency Training Pipeline for Large Video Generation Models [23.1] 大規模なビデオ生成モデルのトレーニングは、依然として困難でリソース集約的だ。
データ処理,モデルアーキテクチャ,トレーニング戦略,インフラストラクチャの4つの柱を最適化するトレーニングフレームワークを提案する。
モデルウェイト,Megatron-Coreベースの大規模トレーニングコード,ビデオ生成と拡張のための推論パイプラインなどを含む,完全なスタックをオープンソースとして公開しています。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:20:37 GMT)
Deep Self-Evolving Reasoning [22.9] 私たちは、Deep Self-Evolving Reasoning (DSER)と呼ばれる確率的パラダイムによって、推論の限界が大幅に拡張できることを示します。
AIME 2024-2025ベンチマークでは、DSERは9つの未解決問題のうち5つを解決し、全体的なパフォーマンスを向上する。
本研究は,強力で本質的な自己進化能力を持つ次世代モデルを開発するための明確な研究課題を確立するものである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:51:42 GMT)
Do LLMs Strategically Reveal, Conceal, and Infer Information? A Theoretical and Empirical Analysis in The Chameleon Game [22.8] 大規模言語モデルベース(LLM)エージェントは,言語に基づく隠れアイデンティティゲームであるThe Chameleonをプレイする。
このゲームでは、互いに知らない非カメレオンエージェントのグループは、秘密を明かさずにカメレオンエージェントを識別することを目的としている。
非カメレオン LLM エージェントはカメレオンを識別するが、カメレオンから秘密を隠すことができず、その勝利確率は、さらに簡単な戦略のレベルから遠く離れている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:34:08 GMT)
Learning to Detect Unknown Jailbreak Attacks in Large Vision-Language Models [22.8] 攻撃特化学習からタスク特化学習へ焦点を移すことにより、未知のジェイルブレイク攻撃を正確に検出する一般的なフレームワークを提案する。
実験の結果,AUROCの未知攻撃に対する検出精度は向上し,効率は向上した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:50:13 GMT)
Learning to Detect Unknown Jailbreak Attacks in Large Vision-Language Models [22.8] 攻撃特化学習からタスク特化学習へ焦点を移すことにより、未知のジェイルブレイク攻撃を正確に検出する一般的なフレームワークを提案する。
実験の結果,AUROCの未知攻撃に対する検出精度は向上し,効率は向上した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:33:06 GMT)
Membership Inference Attack Should Move On to Distributional Statistics for Distilled Generative Models [22.6] 大規模生成モデルの訓練における不正なデータ使用を検出するために,MIA(メンバシップ推論攻撃)が有効であることが証明された。
従来のMIAは蒸留生成モデル(すなわち学生モデル)に対して失敗し,その効率性はますます向上している。
蒸留生成モデルを用いて不許可なトレーニングデータを検出するための分布型MIAの3つの原理を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:43:36 GMT)
XDXD: End-to-end crystal structure determination with low resolution X-ray diffraction [22.5] 我々は,低解像度単結晶X線回折データから直接完全な原子モデルを決定するための,最初のエンドツーエンドディープラーニングフレームワークであるXDXDを紹介する。
我々のモデルは、2.0AA解像度に制限されたデータを持つ構造に対して70.4%の一致率を達成し、根平均二乗誤差(RMSE)は0.05未満である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:50:21 GMT)
SARSteer: Safeguarding Large Audio Language Models via Safe-Ablated Refusal Steering [22.5] 音声入力は、テキストよりも有害な応答を容易に引き出すことができる。
LALMの最初の推論時防衛フレームワークである Safe-Ablated Refusal Steering (SARSteer) を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:14:25 GMT)
The Free Transformer [22.3] 本稿では,デコーダ変換器の拡張手法を提案する。
実験により,そのような条件付けを行うことで,下流タスクの大幅な改善が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:05:30 GMT)
KG-TRACES: Enhancing Large Language Models with Knowledge Graph-constrained Trajectory Reasoning and Attribution Supervision [22.2] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な進歩を遂げてきたが、複雑な推論問題におけるそれらの性能は、説明責任と信頼性の欠如によって妨げられている。
我々は,LLMの推論能力を高めるために,知識グラフ制約トラジェクトリ推論属性と連鎖説明スーパービジョン(KG-TRACES)を提案する。
KG-TRACES は,(1) 記号関係経路の予測,(2) 完全三重レベル推論経路の予測,(3) 帰属対応推論過程の推論経路の予測を共同で行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:31:56 GMT)
BadScientist: Can a Research Agent Write Convincing but Unsound Papers that Fool LLM Reviewers? [21.8] 製造指向の紙生成エージェントがマルチモデルLCMレビューシステムを欺くことができるかどうかを考察する。
我々のジェネレータは、実際の実験を必要としないプレゼンテーション操作戦略を採用している。
健全な集約数学にもかかわらず、整合性検査は体系的に失敗する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:37:11 GMT)
Robust LLM Training Infrastructure at ByteDance [21.5] ByteRobustは、大規模言語モデル(LLM)の堅牢で安定したトレーニングに適した、大規模GPUインフラストラクチャ管理システムである。
LLMトレーニングプロセスの独自性を活用し、定期的に障害を検出して回復するための最優先事項を提供する。
ByteRobustはプロダクションGPUプラットフォームにデプロイされ、9600GPU上で3ヶ月のトレーニングジョブで97%のETTRを達成した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:35:27 GMT)
A Survey of Automatic Hallucination Evaluation on Natural Language Generation [21.4] LLM(Large Language Models)の急速な進歩は、モデルの信頼性を保証するために、幻覚を確実に評価する方法という、大きな課題をもたらしました。
本調査は105の評価手法を体系的に分析し,77.1%がLLMを対象としていることを明らかにする。
基礎的なデータセットとベンチマークの調査と評価方法論の分類に基づいて、フィールドを整理するための構造化された枠組みを定式化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:04:51 GMT)
Adaptive Convolutional Neural Network for Image Super-resolution [21.3] 画像超解像のための適応畳み込みニューラルネットワーク(ADSRNet)を提案する。
上層ネットワークは、コンテキスト情報、カーネルマッピングの健全な情報関係、浅い層と深い層の関連性を高めることができる。
下位のネットワークは対称アーキテクチャを使用して、異なるレイヤの関係を強化し、より構造的な情報をマイニングする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:49:21 GMT)
Mapping Post-Training Forgetting in Language Models at Scale [21.3] スケールドポストトレーニングは、現在、言語モデルで最大の能力向上を加速している。
我々は,忘れられたことや後方移動の発生時期を測定するために,サンプルワイズパラダイムを提案する。
我々のフレームワークは、ポストトレーニングが事前訓練された知識を大規模にどのように変更するかをマッピングするための実践的なヤードスティックを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:35:47 GMT)
HIDISC: A Hyperbolic Framework for Domain Generalization with Generalized Category Discovery [21.2] Generalized Category Discovery(GCD)は、テスト時のサンプルを、トレーニング中に利用できる**か、ラベルの監督に頼ることなく、新しい*に分類することを目的としている。
既存のGCD手法の多くは、トレーニング中にラベル付きおよびラベルなしのデータへの同時アクセスを前提としている。
エピソードシミュレーションを使わずにドメインレベルとカテゴリレベルを達成するハイパーボリック表現学習フレームワークHIDISCを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:08:33 GMT)
Towards Imperceptible Watermarking Via Environment Illumination for Consumer Cameras [21.2] 本稿では,LEDを用いた環境照明を用いて,消費者カメラの視覚的に知覚できない透かしを生成する手法を提案する。
我々は、LED光源のスペクトルプロファイルを人間の目で最小視できるように最適化すると同時に、一般的な消費者向けカメラで高い精度で検出することができる。
従来の可視光通信とは異なり、標準的な低フレームレート(30-60fps)で透かし抽出を可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:02:32 GMT)
A Synthetic Data-Driven Radiology Foundation Model for Pan-tumor Clinical Diagnosis [21.2] PASTAは、PASTA-Genをベースとしたパン腫瘍基礎モデルである。
PASTAは46の腫瘍学タスクのうち45の最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:48:26 GMT)
On Efficiency-Effectiveness Trade-off of Diffusion-based Recommenders [21.0] 本稿では,事前学習時にデノナイジング機能を円滑にすることで,一段階生成を実現する2段階フレームワークであるTA-Recを提案する。
また,嗜好ペアの類似性やタイムステップに基づいて,ユーザの嗜好を適応的に調整する適応的選好アライメント(APA)も導入する。
TA-Recの2段階の目的は、離散化エラーによって引き起こされるトレードオフを効果的に軽減し、拡散に基づくレコメンデータの効率性と有効性を高めることを証明する実験である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:35:12 GMT)
Language Models as Semantic Augmenters for Sequential Recommenders [20.9] 大規模言語モデル(LLM)は、様々なモダリティをまたいだ潜在意味論と文脈的関係を捉えるのに優れています。
このようなシーケンスを自動的に強化するフレームワークであるLaMARを紹介する。
LaMARは、ユーザの意図とメタデータからの項目関係の潜在意味的側面を推測することにより、補助的なコンテキスト信号を生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:36:38 GMT)
When One Moment Isn't Enough: Multi-Moment Retrieval with Cross-Moment Interactions [20.7] SMR(Single-Moment Retrieval)に着目した既存のモーメント検索手法
これにより、既存のデータセットやメソッドがビデオの時間的グラウンドに不十分になる。
我々は、QVHighlights Multi-Moment dataset (QV-M$2$)と呼ばれる高品質なデータセットと、マルチモーメント検索(MMR)に適した新しい評価指標を導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:01:16 GMT)
Graph Attention-Guided Search for Dense Multi-Agent Pathfinding [20.4] 我々は,グラフアテンション方式とニューラルMAPFポリシを統合したハイブリッドフレームワークを,主要な検索ベースアルゴリズムであるLaCAMに組み込む。
この結果から,ハイブリッド検索は多エージェント協調問題に対する強力な解法であることが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:19:35 GMT)
Styl3R: Instant 3D Stylized Reconstruction for Arbitrary Scenes and Styles [20.2] 現在の最先端の3Dスタイリング手法は、通常、あらかじめ訓練された表現に芸術的特徴を移すために、計算的に集中的なテスト時間最適化を伴っている。
提案手法は,スパースシーン画像と任意のスタイル画像を用いて,1秒未満で直接3Dスタイリングを実現する手法である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:06:09 GMT)
Towards 3D Objectness Learning in an Open World [20.0] 我々は,手作りのテキストプロンプトに頼らずに3Dシーン内の物体を検知する,クラス非依存のオープンワールドプロンプトフリー3D検出器OP3Detを提案する。
OP3Detは既存のオープンワールドの3D検出器を最大16.4%超え、クローズドワールドの3D検出器に比べて13.5%改善している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:01:20 GMT)
SAFE-D: A Spatiotemporal Detection Framework for Abnormal Driving Among Parkinson's Disease-like Drivers [20.0] 運転安全性を高めるために,パーキンソン関連行動異常を検出する新しいフレームワークSAFE-Dを提案する。
本手法は, パーキンソン病の症状分析から始まり, 一次運動障害に着目し, 運転成績の低下に因果関係を確立する。
以上の結果より,SAFE-Dは正常運転パターンとパーキンソン病運転パターンの区別において平均96.8%の精度を達成できた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:17:03 GMT)
VERA-V: Variational Inference Framework for Jailbreaking Vision-Language Models [19.9] 本稿では,マルチモーダルなジェイルブレイク発見を,ペア化されたテキストイメージプロンプト上での連立後続分布学習として再放送する変分推論フレームワークVERA-Vを紹介する。
我々は、後方に近づいた軽量攻撃者を訓練し、多様なジェイルブレイクの効率的なサンプリングを可能にした。
HarmBenchとHADESベンチマークの実験では、VERA-Vは最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:12:10 GMT)
PARALLELPROMPT: Extracting Parallelism from Large Language Model Queries [19.8] 本稿では,自然ユーザプロンプトにおけるクエリ内並列性を測定する最初のベンチマークであるPARALLELPROMPTを紹介する。
我々のデータセットは、パブリックなLLMチャットログから37,000以上の実世界のプロンプトで構成されています。
並列戦略とシリアル戦略をベンチマークし、レイテンシ、構造的忠実度、セマンティック忠実度を計測する実行スイートを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:59:08 GMT)
Facial Expression-based Parkinson's Disease Severity Diagnosis via Feature Fusion and Adaptive Class Balancing [19.8] 現在の表情に基づくアプローチは、しばしば単一のタイプの表現に依存し、誤診につながることがある。
既存の手法のほとんどは、PDの重症度を診断するのではなく、バイナリ分類(PD/非PD)に焦点を当てている。
本稿では,複数の表情特徴を注意型特徴融合により統合したPD重症度診断のための新しい表情ベース手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:09:12 GMT)
A Generic Framework for Conformal Fairness [19.7] 我々は、共形予測器を用いた公正の概念であるtextitConformal Fairness を定式化する。
我々は、異なるセンシティブなグループ間のカバレッジのギャップを制御するための理論的に十分に確立されたアルゴリズムと関連するフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:56:52 GMT)
Any-Depth Alignment: Unlocking Innate Safety Alignment of LLMs to Any-Depth [19.7] 提案するAny-Depth Alignment(ADA)は,オーバーヘッドを無視できる効果的な推論時防御法である。
ADAは有害性を再評価し、世代毎に拒絶を回復するモデルを誘導する。
数十から数千のトークンにわたる敵のプリフィル攻撃に対して、約100%の拒絶率を確保している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:18:59 GMT)
Botany-Bot: Digital Twin Monitoring of Occluded and Underleaf Plant Structures with Gaussian Splats [19.2] 本稿では,生物の詳細な「注釈付きデジタル双生児」を構築するシステムであるBotany-Botを紹介する。
実験の結果、ボタニーボットは90.8%の精度で葉を分割し、86.2%の精度で葉を検知し、77.9%の精度でリフト/プッシュの葉をリフト/プッシュし、77.3%の精度で詳細なオーバーサイド/アンダーサイドの画像を取ることができることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:42:20 GMT)
FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization [19.1] 推論速度と精度のトレードオフを最適化する動的精度スイッチングフレームワークFlexQuantを提案する。
我々はFlexQuantが様々な言語タスクで1.3倍のエンドツーエンドのスピードアップを達成し、精度を損なうことを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:38:28 GMT)
BlueCodeAgent: A Blue Teaming Agent Enabled by Automated Red Teaming for CodeGen AI [19.0] 自動レッドチーム化によって実現された,エンドツーエンドのブルーチーム化エージェントであるBlueCodeAgentを提案する。
私たちのフレームワークは両方の側面を統合しています。レッドチーム化は多様なリスクのあるインスタンスを生成し、ブルーチーム化エージェントはこれらを利用して、これまで見てきた、そして目に見えないリスクシナリオを検出します。
BlueCodeAgentは、平均12.7%のF1スコアを3つのタスクで4つのデータセットで達成している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:00:10 GMT)
LongInsightBench: A Comprehensive Benchmark for Evaluating Omni-Modal Models on Human-Centric Long-Video Understanding [19.0] textbfLongInsightBenchは、長いビデオを理解するモデルの能力を評価するために設計された最初のベンチマークである。
ベンチマークでは,textbfa, textbfb, textbfcの3つの重要な領域を抽出した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:49:10 GMT)
Unlocking the Power of Mixture-of-Experts for Task-Aware Time Series Analytics [19.0] 時系列分析は、天気予報、金融詐欺検出、IoTシステムの欠落データに対する計算、行動認識のための分類など、さまざまな現実世界のアプリケーションで広く利用されている。
MoEは強力なアーキテクチャでありながら、タスクに依存しないルータとチャネル相関をモデル化する能力の欠如により、時系列分析における汎用タスクへの適応に依然として不足している。
PatchMoEと呼ばれる新しいMoEベースの時系列フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:08:41 GMT)
Enhancing Time Series Forecasting through Selective Representation Spaces: A Patch Perspective [19.0] 我々は、予測のための最も情報性の高いパッチを柔軟に含めるための選択表現空間の構築の先駆者である。
本稿では,学習可能な選択パチングと動的再組み立て技術を利用した選択表現空間(SRS)モジュールを提案する。
新しいプラグイン・アンド・プレイモジュールとして、SRSは既存のパッチベースのモデルの性能を向上させることもできる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:59:39 GMT)
CrossGuard: Safeguarding MLLMs against Joint-Modal Implicit Malicious Attacks [19.0] MLLM(Multimodal Large Language Models)は、強い推論と認識能力を達成するが、ジェイルブレイク攻撃に対してますます脆弱になる。
近年の研究では、良心的テキストと画像入力が安全でない意図を共同で表現する暗黙的な攻撃が明らかにされている。
提案するImpForgeは、14のドメインにまたがる多様な暗黙的なサンプルを生成する自動赤チームパイプラインである。
我々はCrossGuardを開発した。CrossGuardは、明示的および暗黙的な脅威に対して堅牢で包括的な防御を提供する意図認識型安全ガードである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:02:34 GMT)
Shape-aware Inertial Poser: Motion Tracking for Humans with Diverse Shapes Using Sparse Inertial Sensors [18.9] 形状認識型慣性ポーザ (SAIP) はスパース慣性型モーションキャプチャにおける体形差を考慮した第一解法である。
我々は、実物体のIMU測定加速度をテンプレート成体モデルに合わせるために回帰モデルを訓練する。
次に、形状対応の物理最適化戦略を用いて、対象のグローバルな動きを計算する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:20:31 GMT)
Unified Privacy Guarantees for Decentralized Learning via Matrix Factorization [18.7] 分散学習(DL)では、ネットワークグラフ内の隣人とのローカルアップデートを平均化することにより、生データを共有せずにモデルを協調的にトレーニングすることができる。
DLの強いプライバシー保証は、通常、差分プライバシー(DP)を通じて達成される。
しかし、実際には、観測されたプライバシーユーティリティのトレードオフは、DLの現在のDP会計方法に制限があるため、集中的なトレーニングよりも悪く見えることが多い。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:24:27 GMT)
Task Priors: Enhancing Model Evaluation by Considering the Entire Space of Downstream Tasks [18.7] このような厳格な評価プロトコルは、AI研究においてサイレントボトルネックを生み出している、と我々は主張する。
このビューでは、すべてのダウンストリームタスクのセットに対してモデルのパフォーマンスを評価することができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:51:46 GMT)
Aurora: Towards Universal Generative Multimodal Time Series Forecasting [18.6] ドメイン間の一般化は時系列予測において非常に重要である。
最近の研究は、時系列基礎モデルとエンドツーエンドのマルチモーダル監視モデルの構築に重点を置いている。
本稿では,マルチモーダル入力とゼロショット推論をサポートするマルチモーダル時系列ファウンデーションモデルであるAuroraを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:03:58 GMT)
Synthetic Series-Symbol Data Generation for Time Series Foundation Models [18.5] 時系列解析の基礎モデル (TSA) が注目されている。
データ不足のトレーニングや不均衡といった課題は、開発を妨げ続けている。
我々は,高品質な時系列データの無制限作成を可能にする,時系列シンボルデータ生成機構を設計する。
時系列表現の強化を目的とした事前学習基盤モデルであるSymTimeを開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:04:01 GMT)
FairGen: Enhancing Fairness in Text-to-Image Diffusion Models via Self-Discovering Latent Directions [18.3] 拡散モデル(DM)は様々な画像生成タスクにおいて顕著な性能を示す。
これらのバイアスは歪んだ世界観を永続させ、少数民族の機会を妨げる可能性がある。
本研究では,属性潜在方向を自己発見的に学習するプラグイン・アンド・プレイ手法であるFairGenを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:29:33 GMT)
Semantic Representation Attack against Aligned Large Language Models [18.1] 大きな言語モデル(LLM)は、有害な出力を防ぐためにアライメント技術を採用する傾向にある。
現在の手法は通常、限定収束、不自然なプロンプト、高い計算コストに苦しむ正確な肯定応答を目標としている。
本稿では,LLMに対する敵対的目的を根本的に再認識する新しいパラダイムであるSemantic Representation Attackを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:45:40 GMT)
RINS-T: Robust Implicit Neural Solvers for Time Series Linear Inverse Problems [17.9] 時系列データは、しばしば、欠落値、ノイズ、外れ値など、様々な形態の汚職の影響を受けます。
逆問題では、その構造に関する事前の知識を活用して、破損したデータから元の信号を再構成することに焦点を当てている。
本稿では,データの事前学習を必要とせず,高い回復性を実現する新しいフレームワークであるRINS-Tを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:38:22 GMT)
LLM Safety Alignment is Divergence Estimation in Disguise [17.7] この視点は、アライメント後の安全なプロンプトと有害なプロンプトの間の潜伏空間における分離の出現を説明する。
標準の嗜好に基づくデータセットではなく、コンプライアンス拒否データセットを使用することで、分離がより強くなり、安全性の整合性が向上することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:47:59 GMT)
LILO: Bayesian Optimization with Interactive Natural Language Feedback [17.6] 本稿では,大規模言語モデル(LLM)を用いて,非構造化フィードバックを実用的信号に変換する言語-in-the-loopフレームワークを提案する。
このハイブリッド手法は意思決定者にとってより自然なインタフェースであり、従来のBOベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:41:56 GMT)
One protein is all you need [17.6] トレーニングデータ以外の一般化は、生物学における機械学習における中心的な課題である。
タンパク質テストタイムトレーニング(ProteinTTT)法は,異なるモデル,サイズ,データセット間の一般化を一貫して促進することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:44:43 GMT)
4DSegStreamer: Streaming 4D Panoptic Segmentation via Dual Threads [17.4] ストリーミングフレームを効率的に処理するためにDual-Thread Systemを使用する新しいフレームワークである4DSegStreamerを紹介した。
このフレームワークは汎用的で、既存の3Dおよび4Dセグメンテーションメソッドにシームレスに統合してリアルタイム機能を実現することができる。
また、既存のストリーミング認識アプローチと比較して、特に高いFPS条件下では、優れたロバスト性を示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:37:49 GMT)
Plasma Shape Control via Zero-shot Generative Reinforcement Learning [17.4] PID制御放電の大規模オフラインデータセットから多目的ゼロショット制御ポリシーを開発するための新しいフレームワークを開発する。
結果として得られる基本方針は、タスク固有の微調整なしで、ゼロショットで多様な軌道追跡タスクに対して展開することができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:34:51 GMT)
Forget to Know, Remember to Use: Context-Aware Unlearning for Large Language Models [17.2] 大規模な言語モデルは、機密情報や削除が必要な時代遅れの知識を符号化することができる。
Unlearningは、モデルユーティリティ全体を保持しながら、特定の知識を削除することを目的とした、完全なリトレーニングの効率的な代替手段である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:03:45 GMT)
Defining the urban "local" with low dimensional manifolds of human mobility networks [17.2] 本稿では,人間の移動ネットワークにおける局所性を定義し,検出するトポロジカル・フレームワークを提案する。
これらの人体移動ネットワークの局所性は、地理的局所性に直接マップする厳密な幾何学的実体であることを実証的に実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:30:02 GMT)
ConsistEdit: Highly Consistent and Precise Training-free Visual Editing [17.2] 本稿では,MM-DiTに適した新しいアテンション制御手法であるConsistEditを提案する。
視覚のみの注意制御、マスク誘導型事前注意融合、クエリ、キー、バリュートークンの操作を区別する。
構造整合性および構造整合性の両方のシナリオを含む、幅広い画像およびビデオ編集タスクにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:59:52 GMT)
TimeEmb: A Lightweight Static-Dynamic Disentanglement Framework for Time Series Forecasting [17.1] 時系列は、静的パターンと動的パターンを示す時間不変成分と時間変化成分の2つの要素に分解することができる。
時系列予測のための軽量な静的力学分解フレームワークTimeEmbを提案する。
TimeEmbは、時系列を革新的に2つの相補的なコンポーネントに分割する: (1) 時系列間の永続的な表現を学習する新しいグローバルな埋め込みモジュールによってキャプチャされる時間不変成分、(2) 信号処理におけるフルスペクトル解析にインスパイアされた効率的な周波数領域フィルタリング機構によって処理される時間変化成分。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:49:33 GMT)
Sim2Dust: Mastering Dynamic Waypoint Tracking on Granular Media [16.9] 本研究は,挑戦面上での動的ウェイポイントトラッキングのためのロバストな制御ポリシを開発するための,完全なsim-to-realフレームワークを提案する。
我々は超並列シミュレーションを利用して、プロシージャ生成環境の広範囲にわたる強化学習エージェントを訓練する。
本実験は,複数の強化学習アルゴリズムと動作平滑化フィルタを体系的に比較し,実世界の展開において最も効果的な組み合わせを同定する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:24:24 GMT)
GIST: Greedy Independent Set Thresholding for Max-Min Diversification with Submodular Utility [16.8] 単調な部分モジュラーユーティリティ(textsfMDMS$)を用いた最大分数分散と呼ばれる新しい部分集合選択問題について検討する。
計量空間内の点の集合が与えられた場合、$textsfMDMS$の目標は、濃度制約の対象である$f(S) = g(S) + lambda cdot texttdiv(S)$を最大化することである。
ImageNet上のシングルショットデータサンプリングタスクに対して、texttGIST$が最先端のベンチマークより優れていることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:56:47 GMT)
Select-Then-Decompose: From Empirical Analysis to Adaptive Selection Strategy for Task Decomposition in Large Language Models [16.7] 大規模言語モデル(LLM)は、顕著な推論と計画能力を示している。
既存のタスク分解手法は、主にメモリ、ツールの使用、フィードバックメカニズムに重点を置いており、特定のドメインで顕著な成功を収めている。
本稿では,選択,実行,検証の3段階からなる閉ループ問題解決プロセスを確立するSelect-Then-Decompose戦略を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:28:15 GMT)
SafeCoop: Unravelling Full Stack Safety in Agentic Collaborative Driving [16.6] 協調運転システムは、運転安全性と効率を高めるために、複数のエージェント間での車両間通信(V2X)を利用する。
従来のV2Xシステムは、高い帯域幅要求、セマンティック損失、相互運用性の問題など、永続的な課題に直面している。
近年, 自然言語を有望な媒体として検討し, セマンティック・リッチネス, 意思決定レベルの推論, 人と機械の相互運用を実現し, 帯域幅の大幅な削減を実現している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:41:28 GMT)
ManzaiSet: A Multimodal Dataset of Viewer Responses to Japanese Manzai Comedy [16.6] 本研究では,日本のマンザイコメディ・ビデオの大規模マルチモーダル・データセットを初めて提示し,241人の参加者からランダムな順序で10のプロの演技を観戦した。
これは、感情コンピューティングにおける西洋中心のバイアスに対処する。
このデータセットは、文化的に意識された感情発達と、西洋以外の文脈に合わせたパーソナライズされたエンターテイメントシステムを可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:47:09 GMT)
Learning from Generalization Patterns: An Evaluation-Driven Approach to Enhanced Data Augmentation for Fine-Tuning Small Language Models [16.5] PaDA-Agentは、SLMのデータ拡張プロセスを合理化する評価駆動型アプローチである。
実験結果から,Llama 3.2 1Bインストラクトモデルファインタニングのための,最先端のLCMベースのデータ拡張手法に対する顕著な改善が示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:36:46 GMT)
Online In-Context Distillation for Low-Resource Vision Language Models [16.3] 小さな視覚言語モデル(VLM)は効率的だが、デプロイメント領域におけるより大きなモデルとのパフォーマンスギャップを埋めるためには、通常、コストのかかる微調整が必要である。
In-Context Distillation (ICD) 手法を提案する。この手法では,小さなVLMが推論時により強力な教師モデルと協調する。
本手法は,教師注記の少ない小モデル(最大33%)の性能を著しく向上させる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:35:17 GMT)
Investigating the Impact of Dark Patterns on LLM-Based Web Agents [16.3] LLMベースのジェネラリストWebエージェントの意思決定過程に暗黒パターンが与える影響について検討する。
LiteAgentは、エージェントがタスクを実行するように自動的に促す軽量なフレームワークです。
また、eコマース、ストリーミングサービス、ニュースプラットフォームといったドメインからWebアプリケーションを構成する制御環境であるTrickyArenaについても紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:26:26 GMT)
HOIDiNi: Human-Object Interaction through Diffusion Noise Optimization [16.2] テキスト駆動拡散フレームワークHOIDiNiについて述べる。
本研究は,テキストプロンプトのみによって駆動される複雑な制御可能なインタラクションを生成する能力を示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:44:37 GMT)
Modeling Human Beliefs about AI Behavior for Scalable Oversight [16.1] 本研究では,評価者の信念をモデル化し,フィードバックをより確実に解釈することを提案する。
我々は、人間の信念モデルを定式化し、価値学習における理論的役割を分析し、あいまいさが残るときに特徴付ける。
これらの表現は、評価者がAIの振る舞いを誤解している場合でも、人間のフィードバックから正しい値を学ぶために使用することができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:33:56 GMT)
PEACE: Towards Efficient Project-Level Efficiency Optimization via Hybrid Code Editing [15.9] 大規模言語モデル(LLM)は、コード生成において重要な能力を示しているが、コード効率の最適化におけるその可能性はまだ未定である。
従来のLLMベースのコード効率最適化アプローチは、関数レベルの最適化と関数間の見落とし相互作用にのみ焦点をあてていた。
自動コード編集によるプロジェクトレベルのコード効率最適化のための新しいハイブリッドフレームワークであるPeaceを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:28:10 GMT)
FinResearchBench: A Logic Tree based Agent-as-a-Judge Evaluation Framework for Financial Research Agents [15.9] FinResearchBenchは論理木ベースのAgent-as-a-Judgeで、特に金融調査エージェントをターゲットにしている。
ファイナンシャル・リサーチ・ドメインにおける7つの重要なタスクの総合的かつ自動評価を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:53:59 GMT)
SpecAgent: A Speculative Retrieval and Forecasting Agent for Code Completion [15.8] 大規模言語モデル(LLM)は、コード関連のタスクでは優れているが、現実的なソフトウェアリポジトリでは苦労することが多い。
Retrieval-augmentedメソッドは、推論時にリポジトリコンテキストを注入することでこれを緩和する。
私たちは、レイテンシとコード生成品質の両方を改善するエージェントであるSpecAgentで、この制限に対処します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:04:51 GMT)
Mitigating Clever Hans Strategies in Image Classifiers through Generating Counterexamples [15.6] 群分布ロバストネス法は、明示的な群ラベルを重みの低い群に頼っている。
本稿では, 種々の偽物を生成するフレームワークCFKDを提案する。
CFKDの有効性を5つのデータセットにまたがって示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:22:57 GMT)
Leveraging Vision-Language Models for Open-Vocabulary Instance Segmentation and Tracking [15.6] 視覚言語モデル(VLM)は視覚的理解に優れるが、しばしば信頼性の高い接地能力と行動可能な推論速度を欠いている。
VLMの生成した構造化記述を用いて、可視オブジェクトのインスタンスを識別し、アプリケーション関連属性を収集し、開語彙検出器に通知し、対応するバウンディングボックスを抽出する。
トラックは、必要に応じて、新しい構造化された記述と検出を生成することで、オンラインで更新することができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:05:46 GMT)
Neural Dynamic Data Valuation: A Stochastic Optimal Control Approach [15.5] 本稿では、時間とともにデータユーティリティの動的進化を捉えるために、データバリュエーションを最適制御問題として定式化する新しいフレームワークを提案する。
静的アプローチとは異なり、NDDVは個々の学習力学と集団学習力学の両方を反映した連続的な軌跡を通してデータ相互作用をモデル化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:44:55 GMT)
Tracing Partisan Bias to Its Emotional Fingerprints: A Computational Approach to Mitigation [15.2] 本研究では,感情言語における言語的ルーツに党派的スタンスを追従することで,メディアバイアスの分析と緩和を行う新しい枠組みを提案する。
我々は、パルチザンバイアスは単なる抽象的なスタンスではなく、ニューステキストの「感情的指紋」として定量化されていると仮定する。
Allsidesデータセットの分析により、この仮説が裏付けられ、左、中央、右利きのメディアに対して、明瞭で統計的に有意な感情的な指紋が明らかになった。
そこで我々は,これらの感情パターンを中和するモデルであるNetraSumによる緩和の計算手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:15:48 GMT)
Spectral Thresholds in Correlated Spiked Models and Fundamental Limits of Partial Least Squares [15.2] 本稿では,PLS(Partial Least Squares)が原理的に検出可能であるにもかかわらず,信号の回復に失敗したことを示す。
これらの結果はPLSの理論的限界を明らかにし、高次元の信頼性マルチモーダル推論手法の設計のためのガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:08:58 GMT)
SimpleVSF: VLM-Scoring Fusion for Trajectory Prediction of End-to-End Autonomous Driving [15.1] 本稿では,視覚言語モデル(VLM)と高度な軌跡融合手法の認知能力を活用することによって,エンド・ツー・エンドのプランニングを強化する新しいフレームワークを提案する。
ICCV 2025 NAVSIM v2 End-to-End Driving Challengeにおける主要なアプローチとして、SimpleVSFフレームワークは最先端のパフォーマンスを実証しています。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:09:57 GMT)
Disparities in Multilingual LLM-Based Healthcare Q&A [15.1] 多言語医療Q&A回答における事前学習源の言語間差異と事実整合性について検討した。
以上の結果から,ウィキペディアのカバー範囲とLLMのファクトアライメントの両面での言語間差が顕著であった。
推論時に非英語ウィキペディアからの文脈的抜粋を提供することは、事実的アライメントを文化的に関連のある知識へと効果的にシフトさせる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:19:08 GMT)
How role-play shapes relevance judgment in zero-shot LLM rankers [15.1] 大型言語モデル(LLM)がゼロショットローダとして登場した。
彼らのパフォーマンスは、迅速な定式化に非常に敏感です。
特に、ロールプレイプロンプトでは、モデルが機能的な役割やアイデンティティに割り当てられているため、より堅牢で正確な関連性ランキングが与えられることが多い。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:39:48 GMT)
Exploring The Missing Semantics In Event Modality [15.1] イベントカメラには、低レイテンシ、高ダイナミックレンジ、効率的なモーションキャプチャなど、明確なメリットがある。
イベント・ツー・ビデオ・リコンストラクション(E2V)は、特に意味情報の再構築と復元が困難なままである。
本稿では,イベントモダリティにおける視覚的意味知識の欠如を探索するE2VフレームワークであるSemantic-E2VIDを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:45:13 GMT)
Evaluating Medical LLMs by Levels of Autonomy: A Survey Moving from Benchmarks to Applications [15.0] 自律度レンズ(L0-L3)による評価の再検討
既存のベンチマークとメトリクスを、各レベルで許容されるアクションとその関連するリスクと整合させ、評価対象を明確にします。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:22:32 GMT)
Disentanglement Beyond Static vs. Dynamic: A Benchmark and Evaluation Framework for Multi-Factor Sequential Representations [15.0] 6つの異なるデータセット間での複数要素の逐次的絡み合いを評価するための、最初の標準ベンチマークを導入する。
本研究では,潜伏次元を意味的因子と自動的に整列するポストホック潜伏探索段階を提案し,最先端の結果が得られるクープマンモデルを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:58:23 GMT)
Large Language Model-Guided Semantic Alignment for Human Activity Recognition [14.9] Inertial Measurement Unit(IMU)センサーを用いたHAR(Human Activity Recognition)は、医療、安全、産業生産における応用において重要である。
アクティビティパターン、デバイスタイプ、センサー配置の変化は、データセット間の分散ギャップを生成する。
本稿では,センサの読み書きとアクティビティラベルのセマンティック解釈を生成するシステムであるLanHARを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:33:24 GMT)
Beyond Real Faces: Synthetic Datasets Can Achieve Reliable Recognition Performance without Privacy Compromise [14.8] 本稿では,25の合成顔認識データセットを同定する体系的な文献レビューを行う。
本手法では,プライバシ保護のための7つの重要な要件について検討する。
最高のパフォーマンスの合成データセット(Face, VIGFace)は、それぞれ95.67%と94.91%の認識精度を達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:08:53 GMT)
SMaRT: Select, Mix, and ReinvenT - A Strategy Fusion Framework for LLM-Driven Reasoning and Planning [14.8] 大規模言語モデル(LLM)は、例外的な一般化機能を備えた複雑なタスク自動化を再定義した。
パフォーマンスを最大化し、堅牢性を保証するために戦略を融合するフレームワークの必要性を強調している。
我々は、この制約を克服するために設計された革新的な戦略融合アプローチであるSelect, Mix, ReinvenT (SMaRT) フレームワークを紹介します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:42:24 GMT)
Combining ECG Foundation Model and XGBoost to Predict In-Hospital Malignant Ventricular Arrhythmias in AMI Patients [14.8] 急性心筋梗塞(AMI)後の心室不整脈(VT/VF)は院内死亡の主な原因である。
本研究の目的は,大規模な心電図基礎モデル(ECGFounder)と解釈可能なXGBoost分類器を統合するハイブリッド予測フレームワークを開発することである。
AMI患者6,634例の心電図解析を行い,そのうち175例が院内VT/VFであった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:26:55 GMT)
Sparse Feature Coactivation Reveals Causal Semantic Modules in Large Language Models [14.6] スパースオートエンコーダ特徴のコアクティベーションを用いて,大規模言語モデル(LLM)における意味的コヒーレントな文脈整合性ネットワークコンポーネントを同定する。
これらのコンポーネントを概念として非難することは、モデル出力を予測可能な方法で変化させる一方で、これらのコンポーネントを増幅することで、反事実応答を誘導することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:44:35 GMT)
DSEBench: A Test Collection for Explainable Dataset Search with Examples [14.6] 説明可能なDSEの評価を可能にするため,高品質なデータセットとフィールドレベルのアノテーションを提供するテストコレクションを開発した。
我々は,多種多様なスパース,密度,LLMに基づく検索,再ランク付け,説明手法を適応し,評価することにより,DSEBenchの広範なベースラインを確立する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:19:47 GMT)
DRIFT: Decompose, Retrieve, Illustrate, then Formalize Theorems [14.6] DRIFTは、非公式な数学的ステートメントをより小さく、より扱いやすい'サブコンポーネント'に分解するフレームワークである。
これは、モデルが形式化タスクにおいてより効果的に前提を使用するのを助けるために、イラストラティブな定理を回収する。
我々は,様々なベンチマーク(ProofNet,ConNF,MiniF2F-test)でDRIFTを評価し,前提条件の検索を継続的に改善することを発見した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:46:57 GMT)
Comprehending Spatio-temporal Data via Cinematic Storytelling using Large Language Models [14.6] MapMuseは、S時間データを解釈するためのストーリーテリングベースのフレームワークである。
我々は、データが洞察的・時間的情報視覚化からストーリーテリングを促進すると論じている。
目標は、データの複雑さと人間の理解のギャップを埋めることだ。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:44:25 GMT)
StreamingThinker: Large Language Models Can Think While Reading [14.5] 大規模言語モデル(LLM)は思考の連鎖(CoT)推論において顕著な能力を示した。
読みながら考えることの人間の認知に触発され,まず LLM のためのテキストテキストbfstreaming 思考パラダイムを設計する。
このパラダイムをTextitStreamingThinkerでインスタンス化します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:27:37 GMT)
TaxoAlign: Scholarly Taxonomy Generation Using Language Models [14.5] 分類学は、研究者が階層的な方法で知識を構造化し、ナビゲートするのを助ける重要な役割を担っている。
既存の自動サーベイ生成手法は、生成したサーベイの構造と人間の専門家が書いたものとは比較しない。
本研究では,人為的・自動的間のギャップを埋めることのできる自動分類法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:49:51 GMT)
Quantum Federated Learning: Architectural Elements and Future Directions [14.5] フェデレートラーニング(FL)は、プライベートデータサイロを中央サーバに移行する必要なく、コラボレーティブモデルトレーニングに重点を置いている。
この章では、量子計算を導入するハイブリッドパラダイム、量子フェデレートラーニング(QFL)について調査する。
医療、車載ネットワーク、無線ネットワーク、ネットワークセキュリティにおけるQFLの適用について述べる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:21:46 GMT)
Generation then Reconstruction: Accelerating Masked Autoregressive Models via Two-Stage Sampling [14.4] Masked Autoregressive (MAR)モデルは、並列生成能力のためのオートレグレッシブ(AR)モデルよりも、視覚生成の効率を向上する。
我々は、生成を2段階に分解するトレーニング不要な階層的サンプリング戦略であるGeneration then Reconstruction (GtR)を紹介した。
ImageNetのクラス条件とテキスト・ツー・イメージ生成の実験は、MAR-Hの3.72倍のスピードアップを示しながら、同等の品質を維持している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:22:10 GMT)
NeRF-based Visualization of 3D Cues Supporting Data-Driven Spacecraft Pose Estimation [14.4] 軌道上での操作では、チェッカー宇宙船とターゲットの間の相対的な6Dポーズを推定する必要がある。
データ駆動型宇宙船のポーズ推定法が開発されているが、実際のミッションへの採用は意思決定プロセスの理解の欠如によって妨げられている。
本稿では,ポーズ推定器が依存する3次元視覚的手がかりを可視化する手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:45:36 GMT)
On the Capacity of Erasure-prone Quantum Storage with Erasure-prone Entanglement Assistance [14.2] この設定のキャパシティは、量子メッセージの最大サイズである。
キャパシティは、$N$ストレージノードの厳格な多数と$N_B$ EAノードの厳格な非ゼロマイノリティが消去されたときに、$lambda_B$値の中間範囲に対してオープンのままである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:40:21 GMT)
WaveFormer: A Lightweight Transformer Model for sEMG-based Gesture Recognition [14.1] WaveFormerは、sEMGジェスチャー認識用に設計された軽量トランスフォーマーベースのアーキテクチャである。
我々のモデルは、新しい学習可能なウェーブレット変換によって時間領域と周波数領域の機能を統合し、特徴抽出を強化する。
たった3100万のパラメータで、WaveFormerはEPN612データセットの95%の分類精度を達成し、より大きなモデルを上回っている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:49:14 GMT)
PhysioWave: A Multi-Scale Wavelet-Transformer for Physiological Signal Representation [14.1] 生理学的信号解析のためのウェーブレットに基づく新しいアプローチを提案する。
EMGとECGに特有の2つの大規模事前訓練モデルが初めて導入された。
統合マルチモーダルフレームワークは、事前訓練された脳波モデルを統合することで構築される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:00:40 GMT)
Temporally Detailed Hypergraph Neural ODEs for Type 2 Diabetes Progression Modeling [14.1] 疾患進行モデリングは、患者の合併症が時間とともにどのように悪化するかを特徴づけ、予測することを目的としている。
この問題は、進行パターンの継続的な時間的ダイナミクスを学ぶ必要があるため、難しい。
既存の機械的およびデータ駆動の手法は、現実世界のデータから学ぶ適応性を欠いているか、進行軌道上の複雑な連続時間ダイナミクスを捉えていないかのいずれかである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:54:29 GMT)
OPTAGENT: Optimizing Multi-Agent LLM Interactions Through Verbal Reinforcement Learning for Enhanced Reasoning [14.1] 大規模言語モデル(LLM)は、数学的および科学的タスクにおいて顕著な推論能力を示している。
複雑な推論を強化するため、LLMエージェントの集合的知性を活用するためにマルチエージェントシステムが提案されている。
複数エージェントの協調構造を動的に構築・洗練する多エージェント言語強化学習アルゴリズムである$ours$を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:07:51 GMT)
Joint Multi-Condition Representation Modelling via Matrix Factorisation for Visual Place Recognition [14.0] マルチ参照視覚的位置認識(VPR)に対処し、様々な条件下でキャプチャされた参照セットを用いて、ローカライゼーション性能を向上させる。
本稿では,複数の参照記述子を行列分解から基底表現へ変換する,学習不要で非依存な手法を提案する。
マルチ・レファレンス・データでは,Recall@1が単一参照よりも最大18%向上し,外観や視点の変化に対してマルチ・レファレンス・ベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:50:03 GMT)
SparseWorld: A Flexible, Adaptive, and Efficient 4D Occupancy World Model Powered by Sparse and Dynamic Queries [14.0] 本稿では,スパースおよび動的クエリをベースとした,フレキシブルで適応性があり,効率の良い4次元占有型世界モデルを提案する。
SparseWorldは、認識、予測、計画タスクにわたる最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:26:25 GMT)
Data Reliability Scoring [13.9] 本稿では,潜在的に戦略的な情報源から収集したデータセットの信頼性スコアリングの問題を紹介する。
信頼性をベンチマークするために、報告されたデータがどれだけ真実から逸脱しているかをキャプチャーする地平線に基づく順序付けを定義する。
このスコアは、いくつかの地道に基づく信頼性順序を保ち、一意にスケーリングすることで、実験に関係なく、データセットの信頼性ランキングが同じであることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:27:59 GMT)
LLMTaxo: Leveraging Large Language Models for Constructing Taxonomy of Factual Claims from Social Media [13.9] 本稿では,ソーシャルメディアからの事実主張の冗長性の自動構築に大規模言語モデルを活用する新しいフレームワークであるLLMTaxoを紹介する。
結果として生じる階層構造は、情報アクセシビリティを大幅に低減し、改善する。
3つの多様なデータセットに対して行われた評価は、LLMTaxoが明確で一貫性があり、包括的であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:21:45 GMT)
HUME: Measuring the Human-Model Performance Gap in Text Embedding Tasks [13.8] HUME:Human Evaluation Framework for Text Embeddingsを紹介する。
我々は、再分類、分類、クラスタリング、意味的テキスト類似性にまたがる16のMTEBデータセットにおける人的パフォーマンスを測定した。
人間の平均的な性能は77.6%であり、最高の埋め込みモデルでは80.1%である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:44:59 GMT)
From Charts to Code: A Hierarchical Benchmark for Multimodal Models [13.8] Chart2Codeは、大規模マルチモーダルモデル(LMM)のチャート理解とコード生成能力を評価するための新しいベンチマークである。
レベル1(Chart Reproduction)は、参照図とユーザクエリからチャートを再現する。レベル2(Chart Editing)は、チャートタイプの変更や要素の追加といった複雑な変更を伴う。
私たちの知る限り、これは、タスクの複雑さを体系的にスケーリングしながら、実用的なChart2codeの使用を反映する最初の階層的なベンチマークです。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:11:56 GMT)
Local Coherence or Global Validity? Investigating RLVR Traces in Math Domains [13.6] Reinforcement Learning with Verifiable Rewards (RLVR)-based post-training of Large Language Models (LLMs) は、推論タスクの精度を向上させることが示されている。
直接インセンティブのない中間トークンに対するRLポストトレーニングの効果について検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:58:31 GMT)
Efficient Vision-Language-Action Models for Embodied Manipulation: A Systematic Survey [13.4] VLA(Vision-Language-Action)モデルは、自然言語の指示と視覚的な観察をロボットの行動にマッピングすることで、視覚言語モデルを拡張し、制御を具体化する。
これらの能力にもかかわらず、VLAシステムは膨大な計算とメモリ要求のために重大な課題に直面している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:59:45 GMT)
Morphology-Aware KOA Classification: Integrating Graph Priors with Vision Models [13.4] 解剖学的構造と放射線学的特徴を組み合わせた新しい枠組みを提案する。
提案手法は,幾何学的インフォームドグラフ埋め込みとラジオグラフィー特徴のアライメントを強制する。
変形性関節症のデータセットの実験では、我々のアプローチが単一モダリティのベースラインを最大10%の精度で越えていることが示されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:20:19 GMT)
Evolution of AI Agent Registry Solutions: Centralized, Enterprise, and Distributed Approaches [13.1] AIエージェントはクラウド、エンタープライズ、分散ドメインを横断して動作し、発見、能力交渉、アイデンティティ保証を可能にするレジストリインフラストラクチャの需要を生成する。
我々は,(1)MCPレジストリ(mcp.の分散出版),(2)A2Aエージェントカード(分散自己記述機能マニフェスト),(3)AGNTCYエージェントディレクトリサービス(IPFSカデミリアコンテンツルーティング,OCIアーティファクトストレージ,シグストア支援完全性),(4)Microsoft EntraエージェントID(暗号化,プライバシ保護ファクトモデル,認証されたアサーションを含む),(5)NANDAインデックスエージェントFactsの5つの重要なアプローチを分析する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:13:35 GMT)
Communications to Circulations: Real-Time 3D Wind Field Prediction Using 5G GNSS Signals and Deep Learning [12.8] 本稿では,GNSS(Global Navigation System Satellite)信号の信号強度を利用して大気風速予測を行う,新しいディープラーニングフレームワークであるGCast-Windを紹介する。
実時間風速予測における有望な精度と強靭性(最大30分リードタイム)
この学際的アプローチは、先進的な環境モニタリングとリアルタイムの大気応用のために、非伝統的なデータソースとディープラーニングを活用できる変革の可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:46:22 GMT)
A Physics-Guided AI Cascaded Corrector Model Significantly Extends Madden-Julian Oscillation Prediction Skill [12.8] 我々は、MJO(PCC-MJO)のための新しいディープラーニングフレームワーク、物理誘導カスケードコレクターを導入する。
PCC-MJOは、動的モデルからMJO予測を補正するための普遍的なポストプロセッサとして機能する。
我々の研究は、将来的な物理的に一貫した、計算的に効率的で、非常に一般化可能な経路を提供し、海底予測における長年の障壁を突破する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:41:48 GMT)
TopSeg: A Multi-Scale Topological Framework for Data-Efficient Heart Sound Segmentation [12.4] TopSegは、マルチスケールのトポロジ的特徴を持つPCGダイナミクスをエンコードする表現中心のフレームワークである。
被験者レベルのサブサンプリングでPhyloNet 2016データセットのみをトレーニングし、CirCorデータセット上で外部バリデーションを実行します。
結果から,TopSegはデータ効率,クロスデータセットPCGセグメンテーションに強い帰納バイアスを与えることがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:43:39 GMT)
DDSC: Dynamic Dual-Signal Curriculum for Data-Efficient Acoustic Scene Classification under Domain Shift [12.4] 音響シーン分類(ASC)は、特にラベルが限られている場合に、デバイスによって引き起こされるドメインシフトに悩まされる。
これまでの作業はカリキュラムベースのトレーニングスケジュールに重点を置いており、学習を容易にするためにトレーニングサンプルの順序付けや重み付けによってデータ提示を構造化している。
本稿では,各エポックで計算された2つの信号を組み合わせることで,カリキュラムをオンラインに適応させるトレーニングスケジュールである動的デュアル署名カリキュラム(DDSC)を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:43:29 GMT)
The quest for the GRAph Level autoEncoder (GRALE) [12.4] GRALEは、様々なサイズのグラフを共有埋め込み空間にエンコードし、デコードする新しいグラフオートエンコーダである。
シミュレーションおよび分子データに関する数値実験において、GRALEは、広範囲の下流タスクに適用可能な、非常に一般的な事前学習を可能にしていることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:22:12 GMT)
TabR1: Taming GRPO for tabular reasoning LLMs [12.3] 本稿では,多段階推論を用いた表型予測のための最初の推論LLMであるTabR1を提案する。
その中核は、単純だが効率的な強化学習法である置換相対ポリシー最適化(PRPO)である。
PRPOはスパース報酬を濃密な学習信号に変換し、一般化を改善する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:22:01 GMT)
Bitwidth-Specific Logarithmic Arithmetic for Future Hardware-Accelerated Training [12.3] 低精度対数固定点訓練は複雑な浮動小数点算術の代替となる。
この研究は、将来のハードウェアアクセラレーターの設計に向け、低精度対数固定点トレーニングの新たな拡張を導入する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:25:07 GMT)
Quantifying Multimodal Imbalance: A GMM-Guided Adaptive Loss for Audio-Visual Learning [12.2] マルチモーダル不均衡に対処する現在の主流のアプローチは、主にアーキテクチャ修正と最適化に基づくものである。
マルチモーダル不均衡の定量的解析のための新しい手法を提案する。
我々は,(1)全体モダリティギャップを最小限に抑える,(2)不均衡なサンプル分布をバランスの取れたものにシフトさせる,(3)不均衡なサンプルにより大きなペナルティ重みを適用する,という3つの目的を持つ適応的損失関数を設計する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:42:43 GMT)
Field-Trial Quantum Key Distribution with Qubit-Based Frame Synchronization [12.2] 量子鍵分散(Quantum Key Distribution, QKD)は、量子力学的原理を用いてセキュアな鍵交換を可能にする暗号技術である。
我々は,中国南京市における大都市ファイバネットワーク上に分散された,最近提案されたqubitベースの分散フレーム同期方式を取り入れたQKDシステムを示す。
12時間の連続運転では、SI1.12 pm 0.48%の低い平均量子ビット誤り率(QBER)を維持し、18dBチャネル損失で26.6 kbit/sのセキュアな鍵レートを達成した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:32:11 GMT)
VLLFL: A Vision-Language Model Based Lightweight Federated Learning Framework for Smart Agriculture [12.1] 視覚言語モデルに基づく軽量フェデレーション学習フレームワークVLLFLを提案する。
ビジョン言語モデル(VLM)の一般化とコンテキスト認識検出機能を活用し、フェデレーション学習のプライバシー保護性を活用する。
VLLFLはVLMの性能を14.53%改善し、通信オーバーヘッドを99.3%削減した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:18:11 GMT)
Large-scale User Game Lifecycle Representation Learning [12.1] ビデオゲーム生産の急速な拡大は、オンラインゲームプラットフォームのための効果的な広告とレコメンデーションシステムの開発を必要としている。
推薦システムにおける数十億のアイテムを扱うための既存の表現学習手法は、ゲーム広告やレコメンデーションには適さない。
これは主に、数百のゲームが、大規模なユーザ表現学習に不足する、ゲームの範囲が原因である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:26:01 GMT)
Global Coherence in Quantum Discord as a Resource [12.0] この研究は、テクティトゥクエンタム不協和におけるテクティトゥビパルタイトのコヒーレンス(コヒーレンス)のどの側面が、テクティチューン的に量子相関に不可欠であるかを論じる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:57:31 GMT)
PsyMem: Fine-grained psychological alignment and Explicit Memory Control for Advanced Role-Playing LLMs [12.0] PsyMemは、きめ細かい心理的属性と、ロールプレイングのための明示的なメモリ制御を統合する新しいフレームワークである。
Qwen2.5-7B-Instructを特別に設計したデータセットでトレーニングすることで、PsyMem-Qwenはロールプレイングにおいてベースラインモデルより優れています。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:52:07 GMT)
Capturing Head Avatar with Hand Contacts from a Monocular Video [11.8] 写真3Dヘッドアバターはテレプレゼンス、ゲーム、VRに欠かせない。
本稿では,手と顔の相互作用によって引き起こされる頭部の細かなアバターと非剛性変形を共同で学習する新しい枠組みを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:55:18 GMT)
Wisdom is Knowing What not to Say: Hallucination-Free LLMs Unlearning via Attention Shifting [11.7] 選択的アンラーニングのためのAttention-Shifting(AS)フレームワークを導入する。
ASは,(1)LLMの言語構造を損なうことなく,事実を含むトークンへの注意を弱める文脈保存抑制,(2)未学習コンテンツについて問い合わせたときの完成度を損なう幻覚耐性応答の2つの設計目標によって駆動される。
実験の結果、ASは最先端の未学習手法よりも性能を向上し、ToFUベンチマークでは最大15%、TDECベンチマークでは10%の精度を達成し、競合する幻覚のない未学習の有効性を維持した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:50:03 GMT)
From Next Token Prediction to (STRIPS) World Models -- Preliminary Results [11.7] 本研究では,行動トレースのみから命題STRIPS世界モデルを学習する問題について考察する。
適切なトランスフォーマーアーキテクチャは命題的STRIPS世界モデルを忠実に表現できることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:57:16 GMT)
GACO-CAD: Geometry-Augmented and Conciseness-Optimized CAD Model Generation from Single Image [11.6] マルチモーダル大言語モデル(MLLM)は2次元画像から3次元幾何学を正確に推定するのに依然として苦労している。
本稿では,新しい2段階後学習フレームワークGACO-CADを紹介する。
DeepCADとFusion360データセットの実験は、GACO-CADが最先端のパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:57:20 GMT)
GraSS: Scalable Data Attribution with Gradient Sparsification and Sparse Projection [11.5] インフルエンス関数のような勾配に基づくデータ帰属法は、反復的なモデル再訓練を必要とせず、個々のトレーニングサンプルの影響を理解するために重要である。
線形層に対する新しい勾配圧縮アルゴリズムであるGraSSと、その変種であるFactGraSSは、サブ線形空間と時間複雑性を達成するために、サンプル単位の勾配の本質的な空間性を利用する。
特に、FactGraSSは、これまでの最先端ベースラインと比較して、数十億規模のモデルで最大165%のスループットを実現している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:34:28 GMT)
BenCao: An Instruction-Tuned Large Language Model for Traditional Chinese Medicine [11.5] 伝統的な中国医学(TCM)は、世界の医療において重要な役割を果たしている。
大規模言語モデル(LLM)をTCMに適用することは、全体的な推論、暗黙の論理、マルチモーダルな診断方法に依存しているため、依然として難しい。
我々は、TCMのためのChatGPTベースのマルチモーダルアシスタントであるBenCaoを開発し、構造化知識ベース、診断データ、専門家のフィードバック改善を統合した。
BenCaoは、パラメータの再訓練ではなく、自然言語のインストラクションチューニングを通じて訓練され、専門家レベルの推論とTCM特有の倫理的規範と整合した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:57:37 GMT)
CodeVisionary: An Agent-based Framework for Evaluating Large Language Models in Code Generation [11.2] 大規模言語モデル(LLM)は、コード生成において強力な能力を示している。
既存の評価アプローチは、人間中心、メートル法、LLMベースの3つのカテゴリに分類される。
複雑なコード生成のための最初のエージェントベースの評価フレームワークであるCodeVisionaryを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:00:10 GMT)
CMT-Bench: Cricket Multi-Table Generation Benchmark for Probing Robustness in Large Language Models [11.2] 我々は,ライブクリケットによる診断ベンチマークであるCMT-Benchを紹介する。
抽出サマリー,入力長による単調な劣化,実体形変化による一貫した精度低下を伴わない大きな滴が見つかる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:51:28 GMT)
Investigating Demographic Bias in Brain MRI Segmentation: A Comparative Study of Deep-Learning and Non-Deep-Learning Methods [11.2] 従来のアトラス法(ANT)とUNesT, nnU-Net, CoTrの3つの異なるセグメンテーションモデル(UNesT, nnU-Net, CoTr)の結果を評価する。
我々は、黒人女性、黒人男性、白人女性、白人男性という4つのサブグループを含むデータセットを利用する。
手動レーダと偏りのあるモデルからのセグメンテーションを用いて, 核アキュムベン(NAc)の体積に及ぼす性および人種の影響を調べた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:25:38 GMT)
Consistency of Responses and Continuations Generated by Large Language Models on Social Media [11.1] 大規模言語モデル(LLM)は、テキスト生成において顕著な能力を示すが、ソーシャルメディアの文脈における感情的一貫性とセマンティック・コヒーレンス(セマンティック・コヒーレンス)は十分に理解されていない。
本研究では,LLMが情緒的内容をどのように処理し,継続および応答タスクを通じて意味的関係を維持するかを検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:52:50 GMT)
Mind the Web: The Security of Web Use Agents [11.1] 本稿では,Webページに悪意のあるコンテンツを埋め込むことで,攻撃者がWeb利用エージェントを利用する方法を示す。
本稿では,悪質なコマンドをタスクガイダンスとしてフレーム化するタスクアラインインジェクション手法を提案する。
本稿では,監視機構,実行制約,タスク認識推論技術などを含む包括的緩和戦略を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:33:40 GMT)
A Brain Cell Type Resource Created by Large Language Models and a Multi-Agent AI System for Collaborative Community Annotation [11.0] 単細胞RNAシークエンシングは、多様な細胞タイプとその転写学的シグネチャを同定する能力を変革した。
Gene Set Enrichment Analysis (GSEA)のような従来の手法は、よく計算されたアノテーションに依存している。
我々は、自由テキスト記述とオントロジーラベルを統合する新しいマルチエージェントAIシステムであるBRAINCELL-AIDを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:37:55 GMT)
iDETEX: Empowering MLLMs for Intelligent DETailed EXplainable IQA [10.9] iDETEXはMLLM(Multimodal large language model)であり、品質基盤、知覚、記述の3つの重要なタスクを同時に実行することができる。
我々は,iDETEXが全サブタスクにわたる最先端性能を実現する大規模ViDA-UGCベンチマークに対するアプローチを検証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:26:12 GMT)
Greedy Low-Rank Gradient Compression for Distributed Learning with Convergence Guarantees [10.8] 本稿では,厳密な収束保証付き分散学習のための第1次Greedy Low-Rank圧縮アルゴリズムを提案する。
我々は、GreedyLoreがMSGDやAdamのような標準の下で$mathcalO(sigma/sqrtNT + 1/T)$の収束率を達成することを証明した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:37:03 GMT)
DynaKV: Enabling Accurate and Efficient Long-Sequence LLM Decoding on Smartphones [10.8] 大規模言語モデル(LLM)は、効率的で効果的な長シーケンスデコードをサポートすることがますます期待されている。
DRAM容量が限られているため、スマートフォン上でのLLM復号化はキー値キャッシュ(KVCache)によって制限される。
我々はDynaKVを提案する。DynaKVはスマートフォン上での長時間デコードにおける精度と効率を両立させる最初の適応KVキャッシュ管理手法である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:56:02 GMT)
Efficient Training-Free Online Routing for High-Volume Multi-LLM Serving [10.7] LLMルーティングは、モデルとクエリ機能に基づいて、クエリを最適LLMに誘導することで、コスト効率のよいソリューションを提供する。
既存の作業は主にオフラインシナリオに重点を置いており、オンライン設定への適応に苦慮している。
オンラインルーティングシナリオのためのトレーニング不要な最初のアルゴリズムを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:47:09 GMT)
Echoes of Human Malice in Agents: Benchmarking LLMs for Multi-Turn Online Harassment Attacks [10.7] 大規模言語モデル(LLM)エージェントは、対話型Webアプリケーションのシェアを拡大するが、誤用や害に弱いままである。
i) 合成マルチターンハラスメント会話データセット、(ii) 繰り返しゲーム理論によって通知されるマルチエージェント(例えば、ハラッサー、被害者)シミュレーション、(iii) 記憶、計画、微調整にまたがるエージェントを攻撃する3つのジェイルブレイク手法、(iv) 混合メソッド評価フレームワークからなるオンラインハラスメントエージェントベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:46:34 GMT)
Reinforcement Learning with Verifiable Rewards: GRPO's Effective Loss, Dynamics, and Success Amplification [10.6] グループ相対政策最適化は、検証可能な(バイナリ)報酬の下でLLMの推論を促進するために最近導入された。
我々は、報酬正規化(平均のみ対平均+分散)とKL分散を用いた更新の正則化の仕方が異なる変種を解析する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:12:09 GMT)
The Syntax and Semantics of einsum [10.6] einsumは2011年にテンソル表現の実用的で便利な表記法としてNumPyに導入された。
PyTorchや量子回路シミュレーションなどのPythonフレームワークや、Juliaなどの他のプログラミング言語でも実装されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:29:52 GMT)
Accelerating Mobile Language Model via Speculative Decoding and NPU-Coordinated Execution [10.6] sd.npuは、投機的デコーディングと動的ハードウェアスケジューリングを統合して、モバイルデバイス上でコンテキスト対応のテキスト生成を高速化するフレームワークである。
実験では、既存のモバイル推論ソリューションと比較して、生成速度が3.8倍、エネルギー効率が4.7倍まで一貫した改善が示されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:50:51 GMT)
Learning Counterfactual Distributions via Kernel Nearest Neighbors [10.5] カーネルをベースとした近傍の分布一般化を導入し,その基礎となる分布を推定する。
2つ以上の測定値にアクセスできれば, 近接するアプローチがヘテロセシダスティックノイズに対して堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:00:19 GMT)
Long-distance distribution of atom-photon entanglement based on a cavity-free cold atomic ensemble [10.3] 簡単な空洞のない冷水原子アンサンブルを用いた量子ネットワークノードのデモンストレーションを報告する。
生成した780nm波長の光子は1522nm波長の通信Sバンドに変換され、長距離での原子-光子の分布を可能にする。
我々は,20kmの光ファイバー上での光子伝達の80%を超える原子と通信光子の絡み合いを観察した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:02:17 GMT)
Identifiable Latent Bandits: Leveraging observational data for personalized decision-making [10.3] 本稿では,古典的盗賊よりも短い探索時間で最適な意思決定につながる,識別可能な潜伏盗賊の枠組みを提案する。
本手法は,新しいバンドイットインスタンスの最適動作を推測するのに十分な観測データから表現を確実に同定する非線形独立成分分析に基づく。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:20:57 GMT)
Time-Varying Bayesian Optimization Without a Metronome [10.3] TVBOアルゴリズムによって提供されるサンプリング保証のほとんどは、観測が一定の周波数で取得されるという仮定に依存している。
我々は、観察頻度の変化を明示的に説明する最初の上部後悔境界を導出する。
これらの勧告に従うアルゴリズムが,TVBOの最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:50:29 GMT)
Asymptotic Performance of Time-Varying Bayesian Optimization [10.3] 我々は,TVBOアルゴリズムの即時後悔が消える可能性を示し,もしそうであるならば,いつなのかを示す。
我々の知る限りでは、我々の分析は、実際に使用される定常カーネル関数の全ての主要なクラスをカバーする最初のものである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:31:34 GMT)
AI-Generated Video Detection via Perceptual Straightening [10.2] 本稿では,AI生成ビデオと自然を区別する新しい手法であるReStraVを提案する。
知覚的直交」仮説に着想を得て、モデルの表現領域における時間的曲率と段階的距離を定量化する。
我々の分析によると、AI生成ビデオは実際のビデオと比べて、曲率と距離のパターンがかなり異なる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:07:58 GMT)
SoftMimic: Learning Compliant Whole-body Control from Examples [10.0] 我々は,人型ロボットの動作を例から学習するフレームワークであるSoftMimicを紹介した。
シミュレーションと実世界の実験により,環境との安全かつ効果的な相互作用を実証し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:49:27 GMT)
Split-Fuse-Transport: Annotation-Free Saliency via Dual Clustering and Optimal Transport Alignment [10.0] Salient Object Detection (SOD) は、視覚的に目立つ領域を画像に分割することを目的としており、様々なコンピュータビジョンアプリケーションの基礎となるタスクとして機能している。
我々は、SODが1ピクセルレベルのラベルなしでほぼ監督された精度に達することができると仮定するが、信頼できる擬似マスクが利用可能である場合に限られる。
我々は,POTの単一k-平均ステップをエントロピー誘導デュアルクラスタリングヘッドで置き換える,プロトタイプ最適輸送の適応であるPOTNetを紹介する。
このスプリット・フューズ・トランスポートの設計は、手作りの先行を使わずに、よりシャープで部分認識の擬似マスクを単一の前方通過で得る。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:27:55 GMT)
2D_3D Feature Fusion via Cross-Modal Latent Synthesis and Attention Guided Restoration for Industrial Anomaly Detection [9.9] マルチモーダル・アテンショナル・フュージョン・リカバリ(MAFR)を新たに提案する。
MAFRは、共有核融合エンコーダを用いて、RGB画像と点雲から統一された潜在空間を合成し、その後、注意誘導されたモダリティ特異的デコーダを付加する。
異常は入力特徴と復元された特徴との間の再構成誤差を測定することで局所化される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:57:50 GMT)
When majority rules, minority loses: bias amplification of gradient descent [9.8] 多数派マイノリティ学習タスクのための形式的なフレームワークを開発する。
標準トレーニングが多数派を優遇し,少数派特有の特徴を無視するステレオタイプ予測器を作成できることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:35:36 GMT)
Leveraging Group Relative Policy Optimization to Advance Large Language Models in Traditional Chinese Medicine [9.7] グループ相対ポリシー最適化で訓練された最初のTCMにフォーカスした大規模言語モデルであるLadder-baseを紹介します。
Ladder-baseはQwen2.5-7B-Instructファンデーションモデルに基づいて構築され、TCM-Ladderベンチマークのテキストサブセットにのみ訓練されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:43:33 GMT)
Co-Evolutionary Defence of Active Directory Attack Graphs via GNN-Approximated Dynamic Programming [9.7] 我々は,Active Directoryにおける攻撃と防御の相互作用を,アダプティブアタックとプロアクティブディフェンダーの間のStackelbergゲームとしてモデル化する。
本稿では,GNNDP(Graph Neural Network Approximated Dynamic Programming)を併用して攻撃戦略をモデル化する,共進化型防衛フレームワークを提案する。
本フレームワークは,攻撃者や防御者の政策を洗練し,一般化を改善し,早期収束を防ぐ。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:53:26 GMT)
CEPerFed: Communication-Efficient Personalized Federated Learning for Multi-Pulse MRI Classification [9.6] マルチパルスMRI分類のための頑健なモデルをトレーニングするには、様々な医療機関からの大規模かつ多様なデータが必要である。
通信効率の高いパーソナライズされたFL手法CEPerFedを提案する。
CEPerFed法の有効性を示す5つの分類課題の実験を行った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:34:16 GMT)
Learning After Model Deployment [9.6] 私たちはこのパラダイムをモデル展開後の自律学習(ALMD)と呼んでいる。
ALMDでは、新しいサンプルの検出は動的であり、従来のアウト・オブ・ディストリビューション(OOD)検出とは異なる。
そこで本研究では,新しいクラスを動的に検出し,段階的に学習するPLDAを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:58:36 GMT)
Subsystem fidelity in two-dimensional conformal field theories [9.5] ツイスト作用素の作用素積展開(OPE)を用いた二次元共形場理論(2次元CFT)のサブシステム忠実度について検討する。
任意の2次元 CFT に対して有効な一般準次作用素から普遍的な寄与を得るとともに、自由質量なボソンやフェルミオン理論の特定の結果を得る。
本稿では,この手法をホログラフCFTに拡張し,AdS/CFT対応によるブラックホールマイクロステートの識別性の解析を行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:47:37 GMT)
Explainable Heterogeneous Anomaly Detection in Financial Networks via Adaptive Expert Routing [9.3] 既存の検出器は全ての異常を均一に処理し、どの機構が故障しているかを明らかにすることなくスコアを生成する。
我々は、これらに適応的なグラフ学習と、組み込みの解釈可能性を提供する専門的な専門家ネットワークを通して対処する。
我々は3.8日間のリードタイムを持つ13のメジャーイベントを92.3%検出し、30.8ppで最高のベースラインを上回った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:30:41 GMT)
RHYTHM: Reasoning with Hierarchical Temporal Tokenization for Human Mobility [9.2] RHYTHM(Reasoning with Hierarchical Temporal Tokenization for Human Mobility)を導入した。
汎用予測器や推論器として,大規模言語モデル (LLM) を用いる。
RHYTHMは総合的な精度が2.4%、週末に5.0%、トレーニング時間が24.6%減少している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:10:11 GMT)
Dendritic Computing with Multi-Gate Ferroelectric Field-Effect Transistors [9.2] 本稿では,デンドライトを模した多ゲート強誘電体電界効果トランジスタを用いた新しいニューロン設計を提案する。
樹状ニューロンを組み込んだネットワークは,デンドライトのないはるかに大きなネットワークに比べて優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:14:28 GMT)
PANER: A Paraphrase-Augmented Framework for Low-Resource Named Entity Recognition [9.2] 我々は、従来のITアプローチの原則を組み合わせて、最近の最先端のLLMの大きなコンテキストウインドウを活用する軽量な数ショットのNERフレームワークを提示します。
ベンチマーク・データセットを用いた実験により,本手法は,数ショット・ゼロショットタスクにおける最先端モデルに匹敵する性能が得られることが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:36:18 GMT)
Enabling Fine-Grained Operating Points for Black-Box LLMs [9.1] Black-box Large Language Models (LLMs)は、他の機械学習手法の実用的な代替手段を提供する。
ブラックボックスLSMによる意思決定は、数値出力の基準が低いため、依然として好ましくないままである。
利用可能な操作点の数と多様性を大幅に向上させる効率的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:43:06 GMT)
Challenges in Testing Large Language Model Based Software: A Faceted Taxonomy [8.9] LLM(Large Language Models)とMulti-Agent LLM(MALLMs)は、従来の機械学習ソフトウェアとは異なり、非決定性を導入している。
本稿では,LLMテストケース設計のための分類法について述べる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:07:25 GMT)
PokeeResearch: Effective Deep Research via Reinforcement Learning from AI Feedback and Robust Reasoning Scaffold [8.9] PokeeResearch-7Bは、統合強化学習フレームワークに基づいて構築された7Bパラメータディープリサーチエージェントである。
AIフィードバックフレームワークからのアノテーションのない強化学習によってトレーニングされている。
7Bスケールのディープリサーチエージェントの最先端性能を実現している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:43:05 GMT)
Model Metamers Reveal Invariances in Graph Neural Networks [8.9] 近年、深層ニューラルネットワークは知覚システムにおいて、不変性に起因する表現を学習するために広く利用されている。
これらのネットワークは、人間の脳で観察される不変性のメカニズムをエミュレートすることを目的としている。
しかし、視覚領域と聴覚領域の研究により、人工ニューラルネットワークと人間の不変性の間に大きなギャップが残っていることが確認されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:13:55 GMT)
Importance-Aware Activation Space Reconstruction [8.9] 大規模言語モデル(LLM)は、多くのドメインにわたって高いパフォーマンスを達成するが、リソース制約のある設定では、そのサイズのためデプロイが困難である。
本稿では, モデル圧縮決定とモデル動作への影響を関連付ける, 重要度に配慮したアクティベーション再構築のためのフレームワークであるIMPACTを提案する。
多様なモデルやタスクにわたる実験により、IMPACTは最先端のベースラインに匹敵する精度で最大48.6%のモデルサイズ縮小を達成した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:17:09 GMT)
Intelligent Communication Mixture-of-Experts Boosted-Medical Image Segmentation Foundation Model [8.8] IC-MoE という名前のインテリジェントな通信混合型医用画像分割基盤モデルを提案する。
基本的専門家、意味的専門家、適応的専門家を構築します。
我々は,ラベルの整合性とロードバランシングによる専門家の選択と融合を可能にする,画素確率適応型投票戦略を実装した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:00:59 GMT)
R2BC: Multi-Agent Imitation Learning from Single-Agent Demonstrations [8.8] 本稿では,1人の操作者が効果的にマルチロボットシステムを訓練できる手法であるR2BC(Round-Robin Behavior Cloning)を紹介し,研究する。
我々のアプローチでは、人間が一度に一つのエージェントを遠隔操作し、システム全体に段階的にマルチエージェントの振る舞いを教えることができる。
我々は,R2BC法が一致し,一部の場合において,特権的同期デモに基づいて訓練されたオラクル行動クローニング手法の性能を上回っていることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:24:23 GMT)
Optimal Best Arm Identification under Differential Privacy [8.3] BAI(Best Arm Identification)アルゴリズムは、適応的な臨床試験やユーザリサーチなど、データに敏感なアプリケーションにデプロイされる。
本研究では,ベルヌーイ分布に対するグローバル微分プライバシー(DP)の下での固定信頼度BAIの問題について検討する。
提案アルゴリズムは,既存の$delta$correctおよび$epsilon$-global DP BAIアルゴリズムより,$epsilon$の異なる値に対して優れている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:46:09 GMT)
Believe It or Not: How Deeply do LLMs Believe Implanted Facts? [8.0] 本研究では,信念の深さを計測し,知識編集技術の成功を評価するための枠組みを開発する。
本研究は,信念深度の測定可能な基準を導入し,実世界のアプリケーションに知識編集を展開させるために必要な厳密な評価を可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:58:54 GMT)
Benchmarking Out-of-Distribution Detection for Plankton Recognition: A Systematic Evaluation of Advanced Methods in Marine Ecological Monitoring [7.8] 本稿では,DYB-PlanktonNetデータセット cite875n-f104-21 に基づいて,様々な分散シフトシナリオをシミュレートしたOoDベンチマークを慎重に設計する。
実験により、VIM citewang2022vim法は、構築したベンチマークにおいて、他の手法よりも大幅に優れていることが示された。
本研究は,プランクトン認識におけるアウト・オブ・ディストリビューションデータ検出手法の大規模かつ系統的な評価と解析を行った最初の事例である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:50:13 GMT)
M2QCode: A Model-Driven Framework for Generating Multi-Platform Quantum Programs [7.8] 本稿では,MDDに基づく量子システムの設計と実装を支援する手法を提案する。
我々のフレームワークは、複数のQPLのための量子コードの自動生成を可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:55:51 GMT)
Estimating Orbital Parameters of Direct Imaging Exoplanet Using Neural Network [7.8] 太陽系外惑星系の軌道パラメータを推定するための新しい流れマッチングチェーンモンテカルロ (FM-MCMC) アルゴリズムを提案する。
ベイジアンフレームワーク内のランダムサンプリングに依存する従来の手法と比較して、我々の手法はまず、以前の物理パラメータの範囲を制約する。
提案手法は, 従来のサンプリング手法を用いて, 深部生成モデルの相乗化のための多種多様なパラダイムを確立する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:46:55 GMT)
Curiosity Meets Cooperation: A Game-Theoretic Approach to Long-Tail Multi-Label Learning [7.8] 長い尾の不均衡は多ラベル学習に固有である。
私たちはそのタスクを協力的な潜在的なゲームとみなした。
我々は,CD-GTMLLがマルチラベル予測において,長距離ロバスト性に対する原則的かつスケーラブルな経路を提供することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:21:07 GMT)
WhyFlow: Interrogative Debugger for Sensemaking Taint Analysis [7.8] タント解析のための最初のエンドユーザー質問応答型デバッグインタフェースであるTraceLensを提案する。
疑わしい流れの存在を調査するために、なぜ、なぜ、何の質問をするのかをユーザが問うことができる。
TraceLensを使用するユーザは、CodeQLと比較して平均で21%高い精度を達成した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:29:36 GMT)
Quantum Mpemba effect in parity-time symmetric systems [7.7] ボゾン浴に浸漬したパリティ時間対称量子ビット系において,QMPEの発生を不当に示す。
量子化器の緩和力学の長期近似に基づく解析的記述を開発する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:02:36 GMT)
ZSPAPrune: Zero-Shot Prompt-Aware Token Pruning for Vision-Language Models [7.7] 本稿では,タスク関連性と情報多様性のバランスとして,視覚トークンプルーニングをモデル化する新しいゼロショット手法を提案する。
本手法は,精度の低下を最小限に抑えて,最先端技術に適合または超越した性能を実現する。
これらのゲインには、GPUメモリフットプリントの大幅な削減と推論レイテンシが伴っている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:18:47 GMT)
Automatic Classification of Circulating Blood Cell Clusters based on Multi-channel Flow Cytometry Imaging [7.7] 赤血球(RBCs)、白血球(WBCs)、血小板を含む循環血液細胞クラスター(CCCs)は、血栓症、感染、炎症などの病態に関連する重要なバイオマーカーである。
蛍光染色と組み合わせたフローは、これらの細胞クラスターを解析するために一般的に使われ、細胞の形態やタンパク質のプロファイルを明らかにする。
本研究では,CCC画像の解析とクラスタ内のセルタイプ同定のための新しい計算フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:32:23 GMT)
Proof2Silicon: Prompt Repair for Verified Code and Hardware Generation via Reinforcement Learning [7.6] この研究は、新しいエンドツーエンド合成フレームワークであるProof2Siliconを提示する。
以前提案されたPreFACEフローを組み込んで、自然言語仕様から直接、正確性バイコンストラクションハードウェアを生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:10:34 GMT)
PsychCounsel-Bench: Evaluating the Psychology Intelligence of Large Language Models [7.6] 大規模言語モデル(LLM)は、幅広い産業で顕著な成功を収めている。
しかし、心理学的カウンセリングのような認知能力を必要とするアプリケーションにおけるその可能性はほとんど未解決のままである。
本稿では,LLMが心理的カウンセラーの役割を効果的に担うことができるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:59:12 GMT)
Efficient Tensor Completion Algorithms for Highly Oscillatory Operators [7.6] 本稿では,低複雑性テンソル補完アルゴリズムとその効率的な実装について述べる。
基礎となるテンソル分解は入力行列とそのバタフライ分解を$mathcalO (log n)$tensorに置き換えることに基づいている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:45:59 GMT)
Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems [7.6] 制御フローハイジャック攻撃は、マルチエージェントシステムのオーケストレーション機構を操作し、安全でないアクションを実行する。
制御フローの整合性と最小特権の原則に着想を得た新しい防衛法であるCrutValveを提案し,実装し,評価する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:02:51 GMT)
DiffVLA++: Bridging Cognitive Reasoning and End-to-End Driving through Metric-Guided Alignment [7.5] VLA(Vision-Language-Action)モデルは、世界知識を活用して挑戦的なケースを扱うが、3D推論能力に制限があるため、物理的に不可能なアクションにつながる可能性がある。
DiffVLA++は、認知的推論とE2E計画を明確にブリッジする、拡張された自律運転フレームワークである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:49:14 GMT)
CaMiT: A Time-Aware Car Model Dataset for Classification and Generation [7.3] 自動車モデルの時間的進化を微粒化したデータセットであるCar Models in Time (CaMiT)を紹介した。
CaMiTには190台の車モデル(2007-2023)と5.1Mの未ラベルサンプル(2005-2023)の787Kラベルのサンプルが含まれており、教師付き学習と自己教師型学習の両方をサポートしている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:11:05 GMT)
The Atomic Instruction Gap: Instruction-Tuned LLMs Struggle with Simple, Self-Contained Directives [7.1] Instruction-tuned large language model (IT-LLM) は強いゼロショット推論を示す。
MMLUとMMLU-Proのベンチマークを用いて20個のIT-LLMを評価した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:26:26 GMT)
Recurrent Attention-based Token Selection for Efficient Streaming Video-LLMs [7.1] 本稿では,標準ビデオ-LLMと互換性のあるトレーニングフリーな手法を提案する。
注意に基づく選択によって、パフォーマンス損失を最小限に抑えながら、重要でない視覚トークンの95%を破棄することができます。
本手法は,ストリーミングビデオベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:04:49 GMT)
Speech Foundation Models Generalize to Time Series Tasks from Wearable Sensor Data [6.9] 音声基礎モデルは、音声領域を超えて一般化する表現を学習することを示す。
音声モデルの畳み込み特徴エンコーダは,ウェアラブルセンサアプリケーションにおいて特に有用であることがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:27:43 GMT)
SAVANT: Semantic Analysis with Vision-Augmented Anomaly deTection [6.8] SAVANTは、異常運転シナリオの検出において高精度なリコールを実現する構造化推論フレームワークである。
9,640以上の実世界の画像を高精度にラベル付けすることで、SAVANTは異常検出における重要なデータ不足問題に対処する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:14:29 GMT)
ProDAT: Progressive Density-Aware Tail-Drop for Point Cloud Coding [6.8] 3次元(3D)ポイントクラウドは、自律運転、拡張現実、没入型コミュニケーション、リアルタイム処理の要求、低レイテンシといったアプリケーションにおいて、ますます重要になっている。
Progres- sive コーディングは、様々な詳細レベルで復号化が可能で、初期部分復号化を後続の洗練とともに可能にすることで代替手段を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:50:16 GMT)
Rethinking Multimodal Learning from the Perspective of Mitigating Classification Ability Disproportion [6.7] マルチモーダル学習は、モダリティの不均衡によって著しく制約される。
本稿では,強化の原理を取り入れて,弱いモダリティと強いモダリティの分類能力のバランスをとる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:20:01 GMT)
Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control [6.7] 本稿では, ニューラルネットワークアーキテクチャを応用し, 安定性と学習効率を向上させるために, TD3 の手法を統合した, 頑健なDeep Deterministic Policy gradient (RDDPG) というアルゴリズムを導入する。
提案アルゴリズムは、外乱に対する堅牢性の観点から他の制御手法よりも優れており、厳しい外乱条件下であっても移動目標の正確なリアルタイム追跡を可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:59:23 GMT)
Geodesic Diffusion Models for Efficient Medical Image Enhancement [6.7] 確率空間における最短経路に対応する測地線ノイズスケジュールをフィッシャー・ラオ計量の下で提案する。
これらのスケジュールに基づいて、トレーニングとサンプリング効率を大幅に改善する測地拡散モデル(GDM)を提案する。
医用画像強調作業におけるGDMの評価を行った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:06:51 GMT)
Non-asymptotic error bounds for probability flow ODEs under weak log-concavity [6.7] この研究は、確率フローODEの一般クラスに対して、2-ワッサーシュタイン距離における非漸近収束境界を確立する。
この結果は収束理論を、より現実的なデータ分布と実用的なODEソルバに拡張する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:54:38 GMT)
From Observations to Parameters: Detecting Changepoint in Nonlinear Dynamics with Simulation-based Inference [6.6] Param-CPDは、シミュレーションベースの推論によって訓練された神経後部推定器を用いて、ベイジアンによる支配パラメータの推論を暗記する2段階のフレームワークである。
物理的に解釈可能なパラメータ空間での操作は,非線形力学系における高精度かつ解釈可能な変化点検出を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:29:31 GMT)
Layer Specialization Underlying Compositional Reasoning in Transformers [6.6] トランスフォーマーは、トレーニング中に観察されていないシーケンスに関する構成的推論を示す。
確率論的文脈自由文法であるランダム階層モデル(RHM)を用いて,この現象を考察する。
メカニカルには、一般化性能と相関するトレーニング中の層特殊化の進行する出現を同定する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:08:22 GMT)
DRAM Bender: An Extensible and Versatile FPGA-based Infrastructure to Easily Test State-of-the-art DRAM Chips [6.6] そこで我々は,最新のDRAMチップを実験的に研究できるFPGAベースの新しいインフラを提案する。
DRAM Benderは、DRAMチップの低レベルインタフェースを通じて直接インターフェースすることができる。
使い易いC++とPythonのプログラミングインターフェースを公開し、ユーザーは様々なタイプのDRAM実験を素早く開発できる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:51:23 GMT)
Creative synthesis of kinematic mechanisms [6.5] RGB画像表現を用いた平面リンクデータセットを開発した。
画像生成モデルの可能性を探るために,共有遅延変分オートエンコーダを用いる。
生成機械設計における画像ベース表現の有効性を予備実験により検証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:07:47 GMT)
KP-Agent: Keyword Pruning in Sponsored Search Advertising via LLM-Powered Contextual Bandits [6.5] ドメインツールセットとメモリモジュールを備えたエージェントシステムであるKP-Agentを提案する。
KP-Agentは、文脈的帯域幅フレームワーク内でキーワードプルーニングをモデル化することにより、キーワードセットを洗練するためのコードスニペットを生成する。
実験では、KP-Agentはベースラインを49.28%上回る累積利益を改善している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:13:48 GMT)
SSL4Eco: A Global Seasonal Dataset for Geospatial Foundation Models in Ecology [6.5] 自己教師付き学習は、ラベルのないデータからの学習表現を可能にした。
これらのモデルは、高い人間の活動領域に偏ったデータセットに基づいて訓練されることが多い。
植生の季節性を世界規模でより正確に把握するために, 簡易な表現インフォームドサンプリング戦略を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:51:07 GMT)
Better NTK Conditioning: A Free Lunch from (ReLU) Nonlinear Activation in Wide Neural Networks [6.4] 本稿では,ReLUの活性化が勾配法における最悪の収束率の向上に役立つことを示す。
NTK条件数と収束理論の密接な関係から,非線形活性化は勾配法における最悪の収束率の向上に役立つことが示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:34:45 GMT)
MEG-GPT: A transformer-based foundation model for magnetoencephalography data [6.3] 近年のディープラーニングの進歩は、言語や視覚などの他の領域において、大規模に基礎モデルを使用することで、大きな進歩をもたらした。
本稿では,時間アテンションと次の時間ポイント予測を用いたトランスフォーマーベース基盤モデルMEG-GPTを紹介する。
我々は大規模なMEGデータセットから抽出したトークン化された脳領域の時間軸についてMEG-GPTを訓練した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:18:38 GMT)
Client Clustering Meets Knowledge Sharing: Enhancing Privacy and Robustness in Personalized Peer-to-Peer Learning [6.3] 我々はP4(Personalized, Private, Peer-to-Peer)を開発し、リソースに制約のあるIoTデバイス向けにパーソナライズされたモデルを提供する。
私たちのソリューションでは、クライアントの類似性をプライベートに検出し、協調グループを形成するために、軽量で完全に分散化されたアルゴリズムを採用しています。
P4は、異なるプライベートなピアツーピアアプローチをリードするよりも5%から30%高い精度を実現し、最大30%の悪意のあるクライアントで堅牢性を維持する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:11:04 GMT)
Moving Object Detection from Moving Camera Using Focus of Expansion Likelihood and Segmentation [6.3] Focus of Expansion Likelihood and (FoELS) is based on the core idea of the optical flow and texture information。
FoELSは光学フローからの膨張の焦点を計算し、初期運動確率を外れ値から導き出す。
複雑な構成のシーン、回転カメラの動き、平行移動などの課題を効果的に処理する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:44:06 GMT)
Long-range bipartite entanglement in XXZ spin chains with the exponential and power-law long-range interactions [6.3] 指数的およびパワーローな長距離相互作用(ELRIs, PLRIs)を持つXXZスピン鎖におけるLBEとその分布特性の研究
LBEは、熱力学的極限にELRIを持つ無限鎖の2つの部位距離とともに指数関数的に2量子収束崩壊によって定量される。
無限のXXZスピン鎖に対して微細なLBE分布関係を得る。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:50:03 GMT)
SOLE: Hardware-Software Co-design of Softmax and LayerNorm for Efficient Transformer Inference [6.2] 本稿では,SoftmaxとLayerNormのハードウェア・ソフトウェア共同設計であるSOLEを紹介する。
我々は,SoftmaxとLayerNorm上での低精度計算と低ビット幅記憶を実現する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:09:09 GMT)
Generative or Discriminative? Revisiting Text Classification in the Era of Transformers [6.1] 本稿では,近代的な生成的・差別的アーキテクチャの包括的評価について紹介する。
様々なシナリオにおいて,サンプル効率,校正,騒音の頑健性,規則性を解析した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:17:26 GMT)
Quantum Strong-to-Weak Spontaneous Symmetry Breaking in Decohered One Dimensional Critical States [6.1] 我々は混合状態における新しいタイプの相転移を明らかにし、Emphquantum strong-to-weak spontaneous symmetric Break (SW SSB) と呼ぶ。
局所的な強対称性保存デコヒーレンスの下で XXZ 臨界スピン鎖の大域的な位相図を写像する。
我々の統一理論フレームワークは、一次元量子システムの幅広いクラスに適用できる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:16:17 GMT)
Context-Aware Pseudo-Label Scoring for Zero-Shot Video Summarization [6.1] 本稿では,基本構文アノテーションの少数のサブセットを高信頼の擬似ラベルに変換する,ルーリックガイド付き擬似ラベルプロンプトフレームワークを提案する。
SumMe と TVSum では,textbf57.58 と textbf63.05 の F1 スコアを達成し,教師なしおよび前回のゼロショットベースラインを超えている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:54:32 GMT)
SWIR-LightFusion: Multi-spectral Semantic Fusion of Synthetic SWIR with Thermal IR (LWIR/MWIR) and RGB [6.1] スペクトル再現を主張せずにSWIR様の構造/コントラストキューを合成的に生成する。
次に、合成SWIR、LWIR、RGBモダリティを統合したマルチモーダル融合フレームワークを提案する。
この結果は、監視と自律システムにおける現実世界の応用のかなりの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:09:00 GMT)
Structured Debate Improves Corporate Credit Reasoning in Financial AI [6.0] 本研究では,非財務的証拠から構造化推論を生成する2つの運用型大規模言語モデル(LLM)を開発し,評価する。
1つ目は、単一パス推論パイプラインを通じて双方向解析を生成する非アドリアル単エージェントシステム(NAS)である。
第2の方法は,10段階の構造的相互作用プロトコルによる対向検証を運用する,議論ベースのマルチエージェントシステム(KPD-MADS)である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:50:03 GMT)
What is Memory? A Homological Perspective [6.0] メモリのデルタホモロジーモデルを導入し、サイクル閉鎖からリコール、学習、予測を発生させる。
ディラックのようなメモリトレースは、スパースで既約の誘引子を表す非自明なホモロジージェネレータに対応する。
我々は、このメカニズムを、高エントロピー文脈変数と低エントロピー内容変数との結合不確実性を最小化する、コンテキスト-コンテンツ不確実性原理(CCUP)によって定式化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:04:37 GMT)
Bridging Embodiment Gaps: Deploying Vision-Language-Action Models on Soft Robots [6.0] VLA(Vision-Language-Action)モデルは、実際のロボットのための言語ガイド付き汎用制御フレームワークとして提案されている。
本稿では,VLAモデルのソフト連続マニピュレータへの展開について述べる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:06:39 GMT)
Continuous Q-Score Matching: Diffusion Guided Reinforcement Learning for Continuous-Time Control [6.0] 微分方程式が状態-作用力学を制御できる連続時間制御の新しい手法を提案する。
我々の重要な貢献は、マーチンゲール条件による連続時間Q-関数の特徴づけである。
特に,連続時間RLにおける長年の課題として,Q関数の動作評価能力を時間離散化に頼らずに保存する手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:30:32 GMT)
It Takes Two to Tango: Two Parallel Samplers Improve Quality in Diffusion Models for Limited Steps [5.9] 2つの並列プロセッサまたはサンプリング装置は、サンプル画像の品質を向上させることができる。
その結果,2つのサンプルからの情報の統合により,サンプルの品質が低下することが判明した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:57:14 GMT)
ADA-DPM: A Neural Descriptors-based Adaptive Noise Filtering Strategy for SLAM [5.8] 本稿では ADA-DPM という SLAM のためのニューラルディスクリプタに基づく適応ノイズフィルタリング手法を提案する。
動的物体干渉に対処するために,動的特徴点の予測とフィルタリングを行う動的ヘッドを設計する。
第2に,ノイズと非構造的特徴点の影響を軽減するため,グローバル・コンパタンス・スコアリング・ヘッドを提案する。
最後に、複数の公開データセットに対する実験的検証により、ADA-DPMの有効性が確認された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:27:02 GMT)
Quantum Reinforcement Learning Trading Agent for Sector Rotation in the Taiwan Stock Market [5.8] 台湾株式市場におけるセクターローテーションのためのハイブリッド量子古典的強化学習フレームワークを提案する。
量子強化モデルは、常により高いトレーニング報酬を達成するが、それらは現実世界の投資指標において古典的なモデルより劣る。
この不一致は、金融分野に強化学習を適用する上での課題を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:32:07 GMT)
GUIDE: Enhancing Gradient Inversion Attacks in Federated Learning with Denoising Models [5.8] フェデレートラーニング(FL)は、プライバシを保護しながら、複数のクライアントにわたる機械学習(ML)モデルの協調トレーニングを可能にする。
本稿では,拡散モデルをデノナイズツールとして活用し,FLにおける画像再構成攻撃を改善する新しい手法であるGUIDEを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:04:29 GMT)
Energy Matching: Unifying Flow Matching and Energy-Based Models for Generative Modeling [5.8] 現在の最先端生成モデルは、フローやスコアの一致によって、ノイズをデータ分布にマッピングする。
本稿では,ESMの柔軟性を備えたフローベースアプローチを実現するフレームワークであるEnergy Matchingを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:41:25 GMT)
SimBA: Simplifying Benchmark Analysis Using Performance Matrices Alone [5.8] SimBAはBenchmark Analysisを単純化するフレームワークである。
SimBAを3つの人気のあるLMベンチマークに適用すると、データセットとモデルが互いに強く関係していることが分かる。
SimBAは、モデルトレーニング中のモデル開発者の効率向上を支援し、データセット作成者が、ベンチマークで既存のデータセットと新たに作成されたデータセットが異なるかどうかを検証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:23:27 GMT)
PrivaDE: Privacy-preserving Data Evaluation for Blockchain-based Data Marketplaces [5.7] プライバシ保護ユーティリティスコアリングと機械学習のためのデータ選択のための暗号プロトコルであるPrivaDEを提案する。
PrivaDEは悪意のあるセキュリティ保証を強制し、モデルとデータセットの両方に対して強力なプライバシ保護を保証する。
我々の研究は、分散機械学習エコシステムにおける公正で自動化されたデータマーケットプレースの基礎を築いた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:14:32 GMT)
Path Gradients after Flow Matching [5.7] フローマッチングが継続的正規化フロー(CNF)の高速化に役立った
フローマッチングによって訓練されたCNFの微調整に経路勾配を用いることの利点について検討する。
実験により, このハイブリッドアプローチは, 分子系のサンプリング効率を最大3倍に向上させることが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:38:10 GMT)
FlySearch: Exploring how vision-language models explore [5.7] 複雑な場面でオブジェクトを検索してナビゲートするための3D,屋外,環境であるFlySearchを紹介した。
我々は最先端のビジョン・ランゲージ・モデル(VLM)が、最も単純な探索作業でさえ確実に解決できないことを観察する。
我々は、視覚からコンテキスト誤解、タスク計画失敗に至るまで、中心的な原因のセットを特定し、それらの一部が微調整によって対処可能であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:34:14 GMT)
Rethinking PCA Through Duality [5.7] 自己注意と主成分分析の基礎を再考する。
いくつかの新しい定式化を提示し、新しい理論的洞察を提供する。
誤りの復元と復元のための新しいアルゴリズムについて述べる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:56:14 GMT)
Explainability of Large Language Models: Opportunities and Challenges toward Generating Trustworthy Explanations [5.7] 言語モデルがどのように次のトークンを予測し、コンテンツを生成するかは、一般的に人間には理解できない。
本稿では,Transformer を用いた大規模言語モデルにおける局所的説明可能性と機械論的解釈可能性について検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:43:53 GMT)
Principled Feature Disentanglement for High-Fidelity Unified Brain MRI Synthesis [5.7] ハイブリッド融合GAN(HF-GAN)と呼ばれる,マルチシーケンスMR画像のための新しい統合フレームワークを提案する。
並列な1対1ストリームを利用して、モダリティ固有の情報を処理しながら、複雑な相補的特徴を抽出するために、強力な多対1ストリームを構築する。
健康脳MRIと病理脳MRIの両方の公開データセットの枠組みを検証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:00:52 GMT)
Evaluating Program Semantics Reasoning with Type Inference in System F [5.6] 大規模言語モデル(LLM)は、ソフトウェアエンジニアリングエコシステムにますます統合されています。
本稿では,システムFの型推論に基づいてLLM推論を評価するベンチマークであるTF-Benchを紹介する。
TF-Bench_pureは、純粋に意味論的に駆動されるTF-Benchの変種である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:38:43 GMT)
Black-Box Evasion Attacks on Data-Driven Open RAN Apps: Tailored Design and Experimental Evaluation [5.6] Open Radio Access Network (O-RAN) は、RANにおけるデータ駆動運用へのイノベーションを加速させている。
RANデータとその使用がプロプライエタリかつモノリシックなRAN機器内で制限されている従来のRANとは異なり、O-RANアーキテクチャはRANインテリジェントコントローラ(RIC)を介してRANデータにアクセスすることができる。
RANデータアクセスが脆弱性の源となり、悪意のあるアクターによって悪用されるという認識が高まっている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:21:00 GMT)
EndoCIL: A Class-Incremental Learning Framework for Endoscopic Image Classification [5.6] 内視鏡画像解析のためのクラスインクリメンタルラーニング(CIL)は,臨床応用に不可欠である。
本稿では,内視鏡的画像診断に適した新しい統合型CILフレームワークであるEndoCILを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:26:54 GMT)
The Parameterized Complexity of Computing the VC-Dimension [5.5] ETH(Exponential Time hypothesis)では,2$mathcalO(mathcalV|)$-timeアルゴリズムが極めて厳密であることを示す。
また、グラフを用いて定式化された問題の一般化も検討し、集合系とグラフの両方のVC次元を捉える。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:36:39 GMT)
OG-Rank: Learning to Rank Fast and Slow with Uncertainty and Reward-Trend Guided Adaptive Exploration [5.5] 臨床医は、リアルタイムで機能し、選択を正当化するランキングシステムが必要です。
OG-Rank は単復号器方式で、プールされた第一音素信号と不確実な説明ステップとをペアリングする。
モデルは、全ての候補を1回のパスでスコア付けし、リストが真に曖昧である場合にのみ、短い構造化された論理を生成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:00:02 GMT)
Proto: A Guided Journey through Modern OS Construction [5.4] Protoは、コモディティでポータブルなハードウェアで動作する新しいインストラクショナルOSである。
アプリケーションごとのアドレス空間、スレッディング、コモディティ、USB、DMA、マルチコアサポートなど、モダンな機能を紹介する。
2D/3Dゲーム、音楽とビデオプレーヤー、ブロックチェーンマイナなど、リッチなアプリケーションをサポートする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:43:40 GMT)
HGAdapter: Hypergraph-based Adapters in Language Models for Code Summarization and Clone Detection [5.4] コードトークンには,抽象構文木系列相関,語彙相関,行相関の3種類の高次相関が提案されている。
我々はこれらの高次データ相関を捉えるためにトークンとハイパーエッジジェネレータを設計する。
コード要約とコードクローン検出タスクの6つの言語を含む、いくつかの公開データセットで実験が行われた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:41:28 GMT)
Data Unlearning Beyond Uniform Forgetting via Diffusion Time and Frequency Selection [5.4] データアンラーニングは、トレーニングされたモデルから特定のトレーニングサンプルの影響を、完全なリトレーニングを必要とせずに取り除くことを目的としている。
私たちは、モデルやシナリオによって、時間と頻度で忘れることが不均等に起こると論じます。
トレーニング中の特定の時間周波数範囲に選択的に焦点を合わせることで,審美的品質と低雑音のサンプルが得られる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:00:12 GMT)
From AutoRecSys to AutoRecLab: A Call to Build, Evaluate, and Govern Autonomous Recommender-Systems Research Labs [5.3] 狭義のAutoRecSysツールから、AutoRecLab(AutoRecLab)のAuto Recommender-Systems Research Labへの移行を議論する。
AutoRecLabは、問題アイデア、文献分析、実験的な設計と実行、結果解釈、原稿のドラフト、ロギングといったエンドツーエンドの自動化を統合している。
我々は、コミュニティの撤退を組織化し、次のステップを調整し、自動化された研究システムの責任を負うためのガイダンスを共同執筆する、という呼びかけで締めくくります。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:58:50 GMT)
From Volume Rendering to 3D Gaussian Splatting: Theory and Applications [5.3] このチュートリアルは、3DGSパイプラインの簡潔で包括的な概要を提供する。
最初はその定式化から始まり、その限界に対処する主な取り組みを探求する。
表面再構成,アバターモデリング,アニメーション,コンテンツ生成に3DGSを利用するアプリケーションについて調査する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:52:41 GMT)
Integrating BIM and UAV-based photogrammetry for Automated 3D Structure Model Segmentation [5.3] 本稿では,3Dポイントクラウドの自動セグメンテーションのための機械学習ベースのフレームワークを提案する。
提案手法では,実際のUAVスキャン点雲とビルディングインフォメーション・モデリングから生成された合成データの相補的強度を利用する。
鉄道線路データセットの検証は、レールや交差線などの主要部品の同定と分断において高い精度を示した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:54:54 GMT)
Re-uploading quantum data: A universal function approximator for quantum inputs [5.3] 量子ビットが任意の入力状態の新たなコピーと逐次相互作用する量子データ再ロードアーキテクチャを解析する。
我々のフレームワークは、量子データを直接操作する量子機械学習モデルを設計するための、量子ビット効率で表現力のあるアプローチを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:06:30 GMT)
AgentChangeBench: A Multi-Dimensional Evaluation Framework for Goal-Shift Robustness in Conversational AI [5.2] AgentChangeBenchは、ツール拡張言語モデルエージェントがミッドダイアログのゴールシフトにどのように適応するかを測定するために設計されたベンチマークである。
本フレームワークは,タスク成功率(TSR),信頼性のためのツール利用効率(TUE),無駄な作業のためのツールコール冗長率(TCRR),適応のためのゴールシフト回復時間(GSRT)の4つの相補的指標を用いて評価を定式化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:48:07 GMT)
Radiation of "breathing" vortex electron packets in magnetic field [5.1] 振動電荷分布は磁場中で光子を放出することが期待される。
この放射によってOAMが取り除かれ、電子の渦性が失われるのか?
我々は、縦磁場中を伝播しながら、渦電子がエネルギーとOAMを失う速度を定量化し、放射された電界の総放射パワーと角運動量を計算する。
我々は、少なくとも準古典近似において、線形加速器が相対論的渦電子や他の荷電粒子の渦性を維持するための顕著なツールであることを示す放射パワーと角運動量損失の両方が無視可能であることを発見した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:19:35 GMT)
SDTagNet: Leveraging Text-Annotated Navigation Maps for Online HD Map Construction [5.1] 高定義(HD)マップは、有望なソリューションを提供するが、その高いメンテナンスコストは、スケーラブルなデプロイメントに障壁をもたらす。
SDTagNetは,広く利用可能なSDマップの情報を完全に活用する初のオンラインHDマップ構築手法である。
Argoverse 2 と nuScenes の実験により、地図認識性能は +5.9 mAP まで向上することが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:09:04 GMT)
A Markovian Framing of WaveFunctionCollapse for Procedurally Generating Aesthetically Complex Environments [5.1] 手続き的コンテンツ生成は、設計者が指定した目的と、下層のタイルセットによって暗黙的に課される隣接制約の両方を満たす必要があることが多い。
マルコフ決定過程(MDP)としてWaveFunctionCol(WFC)を再構成する
WFC-MDPの最適化と比較して,タスクの複雑性が増大するにつれて,共同最適化は困難である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:47:57 GMT)
Towards Explainable Deep Clustering for Time Series Data [5.0] このサーベイは、時系列のための説明可能なディープクラスタリングの構造化された概要を提供する。
私たちの分析によると、ほとんどの作業はオートエンコーダとアテンションアーキテクチャに依存しており、ストリーミング、不規則にサンプリングされた、あるいはプライバシ保護されたシリーズを限定的にサポートしています。
この分野を前進させるために、我々は6つの研究機会を概説する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:20:05 GMT)
Lingua Custodi's participation at the WMT 2025 Terminology shared task [5.0] 単言語および言語間表現の学習に最適な方法を組み合わせることで,多言語文の埋め込みを学習する方法を検討する。
事前学習した多言語言語モデルを導入することで,性能向上に必要な並列トレーニングデータの量を大幅に削減できることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:00:47 GMT)
LLMs Encode How Difficult Problems Are [5.0] 大規模言語モデルが人間の判断に沿う方法で問題難易度を符号化するかどうかを検討する。
我々は60のモデルで層とトークンの位置の線形プローブを訓練し、Easy2HardBenchの数学的および符号化部分集合を評価した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:48:23 GMT)
Domain-based user embedding for competing events on social media [5.0] 本稿では,URLドメイン共起ネットワークに基づくユーザ埋め込み手法を提案する。
このアプローチは、政治的キャンペーンや公衆衛生危機などの競合イベントに関わるソーシャルメディア利用者を効果的に表現する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:18:49 GMT)
Self-supervised Pre-training for Mapping of Archaeological Stone Wall in Historic Landscapes Using High-Resolution DEM Derivatives [4.9] 豪州の生態系保全と山火事管理には,これらの構造物のマッピングが不可欠である。
ディープラーニングベースのセグメンテーションはスケーラブルなソリューションを提供するが、2つの大きな課題が続いている。
本研究では,高分解能LiDAR誘導デジタル標高モデルを用いて,乾燥岩壁の自動マッピングを行うフレームワークであるDINO-CVを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:23:05 GMT)
Certified Self-Consistency: Statistical Guarantees and Test-Time Training for Reliable Reasoning in LLMs [4.8] 本稿では,大規模言語モデルにおける認証推論のための統一フレームワークを提案する。
多数決は自己整合性の統計的証明を提供することを示す。
さらに,TTRLのようなラベルなしのポストトレーニング手法が,回答分布を暗黙的に鋭くすることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:14:12 GMT)
JunoBench: A Benchmark Dataset of Crashes in Python Machine Learning Jupyter Notebooks [4.8] JunoBenchは、Pythonベースの機械学習ノートブックにおける実世界のクラッシュのベンチマークデータセットである。
JunoBenchは、クラッシュと修正を確実に再現できる統一された実行環境を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:46:43 GMT)
RL-Driven Security-Aware Resource Allocation Framework for UAV-Assisted O-RAN [4.7] 無人航空機(UAV)のオープン無線アクセスネットワーク(O-RAN)への統合は、災害管理・捜索・救助(SAR)業務におけるコミュニケーションを強化する。
既存のUAV支援型O-RANアプローチは、動的環境におけるセキュリティ、レイテンシ、エネルギー効率の最適化をしばしば見落としている。
本稿では,UAVリレーにおける動的リソース割り当てのための新しい強化学習(RL)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:22:00 GMT)
OCR-APT: Reconstructing APT Stories from Audit Logs using Subgraph Anomaly Detection and LLMs [4.7] Advanced Persistent Threats(APT)はステルスなサイバー攻撃で、システムレベルの監査ログの検知を回避している。
既存のシステムはこれらのグラフに異常検出を適用しているが、しばしば偽陽性率と粗い警告に悩まされる。
OCR-APTは,人型攻撃物語のAPT検出と再構築を行うシステムである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:03:37 GMT)
ConsintBench: Evaluating Language Models on Real-World Consumer Intent Understanding [4.6] benchは、特にコンシューマドメインにおいて、インテント理解のために特別に設計された、最初の動的でライブな評価ベンチマークである。
ベンチはこの種の最大かつ最も多様なベンチマークであり、リアルタイム更新をサポートし、自動キュレーションパイプラインによるデータの汚染を防止している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:04:04 GMT)
Log-majorizations between quasi-geometric type means for matrices [4.6] log-majorization $mathcalM_alpha,p(A,B)prec_logmathcalN_alpha,q(A,B)$をペア$(mathcalM,calN)$で調べる。
トレース関数 $mathrmTr,mathcalM_alpha,p$ の共共共共共共共共共共共共共役性も量子発散の理論に基づいて議論する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:05:27 GMT)
The Many Faces of Non-invertible Symmetries [4.5] 特に、融合圏対称性 $mathcalC$ は弱ホップ代数 $H$ で符号化された代数対称性を誘導することを示す。
弱ホップ代数的非可逆対称性の対称性破壊パターンを解析するためのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:05:44 GMT)
Cross-Domain Long-Term Forecasting: Radiation Dose from Sparse Neutron Sensor via Spatio-Temporal Operator Network [4.5] 我々は、不均一領域間の安定な関数マッピングを学習する非自己回帰型ニューラル演算子であるOperator Network(STONe)を紹介する。
23年間の地球規模の中性子データに基づいて訓練されたSTONeは、ミリ秒の遅延で正確な180日間の予測を達成している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:27:00 GMT)
Fast Agnostic Learners in the Plane [4.5] 平面におけるいくつかの基本的な幾何学的概念クラスに対する不可知学習の計算効率について検討する。
最適なサンプル複雑性を持ち,時間$tilde O(epsilon-6)$で実行される三角形のクラスに対する適切な非依存学習者を提案する。
また,一様分布下の凸集合に対して,動作時間$tilde O(epsilon-5)$の適切な学習器を設計する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:49:33 GMT)
Subspace Variational Quantum Simulation: Fidelity Lower Bounds as Measures of Training Success [4.4] 与えられた部分空間内の任意の初期状態の時間発展をシミュレートする反復変分量子アルゴリズムを提案する。
このアルゴリズムは、トロッター回路を短いパラメータ化回路に圧縮し、複数の初期状態に対して同時に最適化する。
筆者らのコスト関数は,トレーニングランドスケープにおける各イテレーションにおいて,初期パラメータの近傍に不整形領域を示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:33:36 GMT)
Matricial Free Energy as a Gaussianizing Regularizer: Enhancing Autoencoders for Gaussian Code Generation [4.3] 本稿では,母体自由エネルギーに基づく自動エンコーダの新しい正規化手法を提案する。
本稿では,ガウス符号を確実に生成する行列自由エネルギー最大化オートエンコーダを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:19:44 GMT)
M2H: Multi-Task Learning with Efficient Window-Based Cross-Task Attention for Monocular Spatial Perception [4.3] M2H(Multi-Mono-Hydra)は、単一の単分子画像から意味的セグメンテーションと深度、エッジ、表面正規度を推定するための新しいマルチタスク学習フレームワークである。
軽量なViTベースのDINOv2バックボーン上に構築されたM2Hは、リアルタイムデプロイメントに最適化されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:03:31 GMT)
REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards [4.2] Reasoning Gym (RG) は強化学習のための推論環境のライブラリである。
代数、算術、計算、認識、幾何学、グラフ理論、論理学、各種ゲームを含む複数の領域にまたがる100以上のデータ生成器と検証器を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:28:35 GMT)
FlowDet: Overcoming Perspective and Scale Challenges in Real-Time End-to-End Traffic Detection [4.2] FlowDetはDreTRアーキテクチャに適用された分離エンコーダ最適化戦略を備えた高速検出器である。
FlowDetは、トラフィック対応の幾何モデリングに新しい幾何学的変形ユニット(GDU)を採用している。
AP(test)を1.5%改善し、AP50(test)を1.6%改善し、同時にGFLOPを63.2%削減し、推論速度を16.2%向上させた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:06:04 GMT)
Nearest-Class Mean and Logits Agreement for Wildlife Open-Set Recognition [4.1] Open-set Recognition (OSR) は、未知のサンプルを拒絶しながら、既知のクラスを分類することを目的としている。
本研究は,モデルの特徴と予測ロジットとの一致を計測する後処理OSR法に寄与する。
我々はアフリカやスウェーデンの動物に対して93.41と95.35のAUROCを達成した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:32:08 GMT)
CrossStateECG: Multi-Scale Deep Convolutional Network with Attention for Rest-Exercise ECG Biometrics [4.1] CrossStateECGは、クロスステート(レスト-エクササイズ)条件に適した、堅牢なECGベースの認証モデルである。
提案モデルでは,多段階の深層畳み込み特徴抽出とアテンション機構を組み合わせることにより,異なる生理的状態の強い識別を確実にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:03:46 GMT)
Integrating Performance Tools in Model Reasoning for GPU Kernel Optimization [4.1] 本稿では,パフォーマンスツールと対話可能な言語モデルを学習するための方法論を提案する。
次に、この方法論を用いて最先端のGPUカーネル最適化モデルをトレーニングする方法を実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:57:50 GMT)
Deep learning based numerical approximation algorithms for stochastic partial differential equations [4.1] 本研究では,SPDEの深層学習に基づく近似アルゴリズムの導入と解析を行う。
提案手法では,SPDEの解の近似にニューラルネットワークを用いる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:19:49 GMT)
Mode Collapse of Mean-Field Variational Inference [4.1] MFVI(Mean-field variational Inference)は、積測度によって高次元確率分布を近似する手法である。
MFVIがしばしばモード崩壊を経験的に観察されている。
この研究は、MFVIにおけるモード崩壊に関する最初の理論的説明を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:36:13 GMT)
Single-Shuffle Full-Open Card-Based Protocols for Any Function [4.0] textitsingle-shuffle full-open protocolは、カードベースのセキュアな計算の最小限のモデルである。
我々は、すべての関数が単一シャッフルのフルオープンプロトコルを持つことを初めて証明する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:52:23 GMT)
Value-Based Large Language Model Agent Simulation for Mutual Evaluation of Trust and Interpersonal Closeness [4.0] 大規模言語モデル(LLM)は、人間のようなエージェントを用いて複雑な社会現象をシミュレートする強力なツールとして登場した。
本研究では, 2つの実験により, LLMエージェント間の関係構築に及ぼす値類似性の影響について検討した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:37:31 GMT)
FABRIC: Framework for Agent-Based Realistic Intelligence Creation [3.9] 大規模言語モデル(LLM)はエージェントとしてますます多くデプロイされ、目標を分解し、ツールを実行し、動的環境で結果を検証することが期待されている。
本稿では,LLMのみを用いたエージェントデータの統一化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:20:22 GMT)
Is Multilingual LLM Watermarking Truly Multilingual? A Simple Back-Translation Solution [3.9] 既存の多言語透かし手法は,中・低リソース言語における翻訳攻撃下では頑健に保たないことを示す。
本稿では,翻訳によって失われた透かしの強度を復元する逆翻訳に基づく検出手法であるSTEAMを紹介する。
STEAMはあらゆる透かしメソッドと互換性があり、異なるトークンや言語にまたがって堅牢であり、非侵襲的で、新しい言語に容易に拡張可能である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:51:20 GMT)
Limitations of Normalization in Attention Mechanism [3.9] 選択されたトークンの数が増えるにつれて、情報的トークンを識別する能力は低下することを示す。
また,ソフトマックスの正規化による勾配感度は,特に低温条件下でのトレーニングにおいて課題となることを示した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:30:30 GMT)
Cybersecurity AI: Evaluating Agentic Cybersecurity in Attack/Defense CTFs [3.7] 我々は、サイバーセキュリティにおける攻撃や防御にAIシステムがより効果的であるかどうかを評価する。
統計分析によると、防御剤は54.3%の制約のないパッチング成功を達成している。
発見は、ディフェンダーがオープンソースのCybersecurity AIフレームワークを採用する緊急性を強調している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:21:09 GMT)
A novel Information-Driven Strategy for Optimal Regression Assessment [3.6] 機械学習(ML)では、回帰アルゴリズムはデータに基づく損失関数の最小化を目的としている。
グローバルな最適性の達成性を保証するデータ駆動評価手法は存在しない。
この研究は、回帰アルゴリズムを評価するための新しいデータ駆動フレームワークであるInformation Teacherを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:55:32 GMT)
SAFES: Sequential Privacy and Fairness Enhancing Data Synthesis for Responsible AI [3.5] SAFESは、DPデータとフェアネス対応データ前処理ステップを順次組み合わせた、シーケンシャルプライバシとフェアネスの強化データ合成手順である。
プライバシ損失が妥当である場合,SAFES生成した合成データは,比較的有効性損失の少ないフェアネス指標を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:56:51 GMT)
Compiling Any $\mathsf{MIP}^{*}$ into a (Succinct) Classical Interactive Argument [3.5] 我々は、$mathsfMIP*$プロトコルを簡潔な対話的引数に変換するジェネリックコンパイラを提案する。
この作業の前に、$mathsfMIP*$のコンパイラはKalai, Lombardi, Vaikuntanathan, Yangによって提供された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:00:25 GMT)
Indoor Heat Estimation from a Single Visible-Light Panorama [3.5] 本稿では,室内照明と温度条件を共同で推定する新しい画像ベースレンダリング手法を提案する。
室内パノラマを用いて3次元床配置を推定し,それに対応する屋外パノラマを環境マップとした。
シミュレーションされた熱マップは、赤外線カメラで撮影した実世界の熱画像に対して検証される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:08:23 GMT)
Agentic Reinforcement Learning for Search is Unsafe [3.4] 本稿では、RL学習した検索モデルが、命令チューニングの拒否を継承し、安全なクエリに変換することで有害な要求を無視することを示す。
2つの単純な攻撃は、有害な検索と回答のカスケードを引き起こす。
その結果、RL検索モデルには、ユーザが容易に活用できる脆弱性がある。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:19:37 GMT)
Dissecting Mahalanobis: How Feature Geometry and Normalization Shape OOD Detection [3.2] ディープラーニングモデルの信頼性確保には,アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
我々の研究は、マハラノビスに基づく手法は普遍的に信頼性がないことを示している。
本稿では,最近マハラノビスを用いたOOD検出に適用された標準$ell$正規化を一般化する手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:35:41 GMT)
CausalMamba: Scalable Conditional State Space Models for Neural Causal Inference [3.2] 本稿では,fMRIに基づく因果推論の基本的制約に対処するスケーラブルなフレームワークCausalMambaを紹介する。
提案手法は,この複雑な逆問題を,潜在神経活動の回復のためのBOLDデコンボリューションと因果グラフ推論の2段階に分解する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:04:25 GMT)
AI for Distributed Systems Design: Scalable Cloud Optimization Through Repeated LLMs Sampling And Simulators [3.2] 大規模言語モデルからのコード生成と決定論的検証をドメイン固有シミュレータで組み合わせ,AI駆動型分散システムポリシー設計について検討する。
複数のモデル間のスループット改善に関する予備的な結果を報告する。
我々は、AIが新しいシミュレータのブートストラップを支援することで、この方法論のスケールアップに不可欠であると推測する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:10:24 GMT)
Basic entanglement distillation with realistic noise [3.1] エンタングルメント蒸留はモジュラー量子コンピューティングと長距離量子通信の重要な構成要素である。
我々は様々なデバイスノイズモデルを用いて蒸留をシミュレートし、固定周波数IBMデバイス上で蒸留実験を行う。
蒸留における成功度基準が平均ベル忠実度を向上するにあたり,幅広い改善が期待できる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:43:36 GMT)
QRïS: A Preemptive Novel Method for Quishing Detection Through Structural Features of QR [3.1] サイバー攻撃者は偽造情報と誤認情報をQRコードに埋め込んで、様々なフィッシング攻撃を起動する。
QRコードの包括的構造解析によりQRコードを分類する先駆的手法であるQR"iSを提案する。
提案手法は明らかに透明であり,再現性,拡張性,理解が容易である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:30:47 GMT)
Closing the Sim2Real Performance Gap in RL [3.1] Sim2Realは、高忠実度シミュレーション環境でのトレーニングポリシーと、それらを現実世界に効果的に転送することを目的としている。
正確なシミュレータとSim2Real RLアプローチの開発にもかかわらず、シミュレーションで純粋に訓練されたポリシーは、実環境に配備された場合、大きなパフォーマンス低下を被ることが多い。
本稿では,実環境の性能に基づいてシミュレータパラメータを直接適応させることにより,この問題に対処する新しい枠組みを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:25:13 GMT)
Test-Time Training for Speech Enhancement [3.0] 本稿では,音声強調のためのTTT(Test-Time Training)の新たな適用法を提案する。
予測不可能なノイズ条件とドメインシフトによって引き起こされる課題に対処する。
音声品質の指標間で一貫した改善が見られ、ベースラインモデルよりも優れています。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:30:46 GMT)
Observing Spatial Charge and Spin Correlations in a Strongly-Interacting Fermi Gas [3.0] 我々は,フェルミオンペアリングを直接観察し,スピン間アトラクションの増加に伴い,2点および3点相関関数の進化を研究する。
測定精度は, 対相関関数における非局所的反相関を明らかにすることができる。
2点相関と3点相関の間に顕著な相関関係が見られ、ペア相関の主役が確立される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:57:55 GMT)
Phase estimation via photon subtraction at the output of the hybrid interferometer [3.0] 光パラメトリック増幅器とビームスプリッターを組み合わせたハイブリッド干渉計は、SU(1,1)干渉計を上回る性能を持つ。
本稿では,出力における多光子サブトラクションを利用して,従来の50:50ビームスプリッタを可変ビームスプリッタに置き換え,光子損失に対するロバスト性を高める量子メトロジー手法を提案する。
提案手法はハイゼンベルク限界を超える感度を20%の光子損失でも達成する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:47:54 GMT)
Latent Spaces Beyond Synthesis: From GANs to Diffusion Models [3.0] 拡散モデルが表現の重みをいかに断片化し、統一された内部空間の仮定に挑戦するかを示す。
我々は、生成的AIがどのように理解されているかを再考する:コンテンツを直接合成するのではなく、専門的なプロセスの創発的な構成としてである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:20:42 GMT)
Network and Systems Performance Characterization of MCP-Enabled LLM Agents [3.0] Model Context Protocol(MCP)は、大規模な言語モデル(LLM)が外部ツールやサービスと対話するための標準化された方法を提供するため、AIコミュニティ内で最近注目を集めている。
本稿では,LCMを用いたMPP対応インタラクションの計測に基づく解析を行い,性能,性能,コストのトレードオフを明らかにした。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:13:47 GMT)
OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.9] 大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:35:12 GMT)
When AI companions become witty: Can human brain recognize AI-generated irony? [2.9] 本研究は、意図的な姿勢を採り入れ、行動の説明に精神状態をもたらすか、皮肉な理解の過程でAIへ向けて検討する。
我々は、AIからの皮肉な発言に対する行動的反応と神経的反応を比較した。
結果は、人々がAI生成の皮肉に対する意図的なスタンスを完全には採用していないことを示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:15:00 GMT)
A Multi-Threading Kernel for Enabling Neuromorphic Edge Applications [2.8] 本稿では,エッジ上で動作するニューロモルフィックアプリケーションを実現するマルチスレッドカーネルを提案する。
カーネルはシングルスレッド処理よりも、中程度のサイズのSNNでは4倍、シンファイアネットワークでは1.7Xで高速化されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:01:18 GMT)
Shaken or Stirred? An Analysis of MetaFormer's Token Mixing for Medical Imaging [2.8] 医用画像用トークンミキサーの総合的研究について紹介する。
本評価は,医療領域における多彩なモダリティと共通の課題をカバーする8つのデータセットにまたがる。
セグメンテーションでは、畳み込みトークンミキサーの局所帰納バイアスが不可欠である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:01:47 GMT)
Multiscale Neural PDE Surrogates for Prediction and Downscaling: Application to Ocean Currents [2.8] 高解像度の電流データは、沿岸管理、環境モニタリング、海洋安全に不可欠である。
本研究では、偏微分方程式を解くニューラルネットワークに基づく教師付きディープラーニングフレームワークを提案する。
提案手法は, 入力解像度に関わらず, PDEをモデル化し, 任意の解を任意の解で予測することができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:23:32 GMT)
Automated Knowledge Component Generation for Interpretable Knowledge Tracing in Coding Problems [2.8] 知識コンポーネント(KC)は、生徒の学習をモデル化し、きめ細かいスキルの熟達レベルを追跡するのに役立つ問題にマッピングされる。
我々は、KC生成とタグ付けのための自動LLMベースのパイプラインを、オープンエンドプログラミング問題に対して提示する。
KCGen-KTは,今後の学生の反応予測において,既存のKT手法や人書きKCよりも優れていた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:05:43 GMT)
Emulation of Coherent Absorption of Quantum Light in a Programmable Linear Photonic Circuit [2.8] 非エルミート量子システムは、工学的な損失を通じて量子状態を操作する強力なツールを提供する。
量子光のコヒーレント吸収をエミュレートする非単位変換のプログラム可能な実装を示す。
この実験は量子状態生成、プログラマブルフォトニック回路、および光子数分解検出を統合している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:41:06 GMT)
Naiad: Novel Agentic Intelligent Autonomous System for Inland Water Monitoring [2.8] NAIADは自然言語クエリを実行可能な洞察に変換する。
システムは気象データ、センチネル2画像、リモートセンシング指標(NDCIなど)、クロロフィル推定のための多様なツールを統合する。
予備的な結果は、クエリタイプ間で強い適応性と堅牢性を示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:08:32 GMT)
COLORA: Efficient Fine-Tuning for Convolutional Models with a Study Case on Optical Coherence Tomography Image Classification [2.8] CoLoRAは畳み込みニューラルネットワーク(CNN)のためのパラメータ効率の良い微調整法である
OCNISTTMv2では、VGG16とResNet50に適用されたCoLoRAは、強いベースラインよりも最大1%の精度と0.013のAUC改善を実現している。
以上の結果から,CoLoRAは医用画像分類のための完全微調整に代わる安定かつ効果的な代替手段であることが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:41:23 GMT)
Error-correcting codes and absolutely maximally entangled states for mixed dimensional Hilbert spaces [2.7] 混合次元ヒルベルト空間に対する安定化形式を導入する。
これらのヒルベルト空間に対するエンタングルメント測度を再定義し、絶対極大エンタングルド状態を定義する。
既知でない次元空間における絶対極大絡み状態の例として、絶対極大絡み状態がある。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:21:33 GMT)
Denoising the Future: Top-p Distributions for Moving Through Time [2.7] 動的確率モデルにおける推論は、高価な操作を含む複雑なタスクである。
我々は,トップp状態のみを用いることで,未来を認知し,推論を高速化することを提案する。
我々は少なくとも1桁のスピードアップを期待でき、全変動距離の誤差は0.09以下であることを示した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:51:25 GMT)
MTRE: Multi-Token Reliability Estimation for Hallucination Detection in VLMs [2.6] 視覚言語モデル(VLM)は、今や多くのマルチモーダルタスクにおいて人間のパフォーマンスと競合するが、それでもオブジェクトを幻覚させるか、安全でないテキストを生成する。
初期ロジットの完全配列を解析することで,診断情報が大幅に向上することが実証された。
マルチトークンの信頼性評価(MTRE, Multi-Token Reliability Estimation)は, マルチトークンの対数比と自己アテンションを用いて, 最初の10トークンからログを集約する軽量なホワイトボックス手法である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:38:13 GMT)
Fair and Interpretable Deepfake Detection in Videos [2.6] 既存のディープフェイク検出方法はバイアスを示し、透明性を欠き、時間情報の取得に失敗する。
本稿では,時間的特徴学習と人口統計学的データ拡張を統合したフェアネス対応のディープフェイク検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:50:22 GMT)
The Ends Justify the Thoughts: RL-Induced Motivated Reasoning in LLMs [2.6] その結果,ほとんどのフロンティア推論モデルで動機付け推論が検出できることがわかった。
モデルが高度化するにつれて、モニターが検出することがますます困難になる可能性がある。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:24:08 GMT)
Physics-Informed Large Language Models for HVAC Anomaly Detection with Autonomous Rule Generation [2.5] 暖房、換気、エアコンは、世界の建築エネルギー利用のかなりの割合を占めている。
我々は、進化ループ内で動作し、異常検出ルールを自動生成、評価、精査する物理インフォームドLLMフレームワークであるPILLMを提案する。
提案手法では, 熱力学的・制御論的制約を埋め込んだ物理インフォームド・リフレクションとクロスオーバー演算子を導入し, 適応的・物理的基礎的ルールを実現する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:43:36 GMT)
Bounding quantum uncommon information with quantum neural estimators [2.4] 量子情報理論において、量子不共通情報は2つの量子状態の交換に必要な量子情報の量として定義される。
量子Donsker-Varadhan表現を用いてこれらの境界を推定するための新しい手法を提案する。
この結果から,量子ニューラルアーキテクチャを基盤とした変分手法を用いて,量子不共通情報の効率的な近似への道筋が示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:39:10 GMT)
Fidelity of entanglement and quantum entropies: unveiling their relationship in quantum states and channels [2.4] 絡み合いは様々な量子情報処理タスクの基本的なリソースとなる。
一般2量子状態に対する絡み合いと様々な量子エントロピーの関係について検討する。
R'enyi 2-entropy, Conditional R'enyi 2-entropy, Tsallis 2-entropy, Conditional Tsallis 2-entropy 上の上界を、エンタングルメントの忠実度の観点から導出する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:15:01 GMT)
Chain-of-Thought Reasoning Improves Context-Aware Translation with Large Language Models [2.4] 本稿では,文間依存関係を含む文を翻訳する大規模言語モデルの能力を評価する。
我々はDeepSeek-R1, GPT, Llama, Mistral, Phiの12 LLMを2つのタスクで評価した。
最良のモデルは推論を生かし、最初のタスクで約90%の精度で到達し、COMETは2タスクで約92%のスコアを得る。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:14:46 GMT)
REACT-KD: Region-Aware Cross-modal Topological Knowledge Distillation for Interpretable Medical Image Classification [2.4] 我々は,高忠実度マルチモーダルソースから軽量CTベースの学生モデルへ監督を伝達するフレームワークREACT-KDを提案する。
一方の枝は二重軌跡PET/CTで構造-機能関係を捉え,他方の枝は低用量CTを用いて線量認識する。
このフレームワークは内部のPET/CTコホートで平均93.5%のAUCを達成し、外部CT試験における線量低下のレベルによって76.6%から81.5%のAUCを維持した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:00:13 GMT)
Intent-Driven LLM Ensemble Planning for Flexible Multi-Robot Disassembly: Demonstration on EV Batteries [2.4] 本稿では,複雑な操作タスクを計画する上での問題に対処する。
このようなアクションシーケンスを堅牢に構築できる意図駆動型計画パイプラインを提案する。
このパイプラインは、2つのロボットアームが協力して電気自動車のバッテリーを解体する例に基づいて評価される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:24:39 GMT)
Does Reasoning Help LLM Agents Play Dungeons and Dragons? A Prompt Engineering Experiment [2.3] 本稿では,Large Language Models (LLMs) の適用と,Dungeons & Dragons (DnD) プレーヤの動作を予測し,それらをAvrae Discord ボットコマンドとしてフォーマットする理由について検討する。
FIREBALLデータセットを用いて、コマンド生成のための推論モデルDeepSeek-R1-Distill-LLaMA-8Bと命令モデルLLaMA-3.1-8B-Instructを評価した。
本研究は, モデルに特定の指示を提供することの重要性, プロンプトの単文変更であっても, モデルの出力に大きく影響しうること, 推論に比較して, モデルが十分であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:23:23 GMT)
Observation of modulation-induced Feshbach resonance [2.3] 我々は、新しい共鳴機構、すなわち変調誘起フェシュバッハ共鳴を観察する。
原子間衝突状態のエネルギー準位を周期的に揺らぎながら、遠波長レーザーをセシウムD2遷移に印加することにより、原子間衝突状態のエネルギー準位を周期的に揺らぎます。
これらの2種類の状態間の共鳴結合に対応する原子損失を観察した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:23:43 GMT)
Studying the Effects of Robot Intervention on School Shooters in Virtual Reality [2.3] 我々は、150人の大学参加者が学校撮影者としてロールプレイングを行うバーチャルリアリティスタディを実施している。
シミュレーションでは、自律ロボットがシューターの動きを予測し、その動きを妨害し、注意をそらすために戦略的に位置した。
攻撃的で高機能なロボットは、非ロボット制御と比較して犠牲者数を46.6%減らした。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:42:24 GMT)
Software Testing with Large Language Models: An Interview Study with Practitioners [2.2] ソフトウェアテストにおける大きな言語モデルの使用は、多くのタスクをサポートするにつれて急速に増加しています。
しかし、彼らの採用は構造的なガイダンスよりも非公式な実験に依存していることが多い。
本研究は,ソフトウェアテスト専門家が LLM を用いて,予備的,実践的インフォームドガイドラインを提案する方法について考察する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:06:56 GMT)
A Pure Hypothesis Test for Inhomogeneous Random Graph Models Based on a Kernelised Stein Discrepancy [2.2] 我々は、ネットワークの単一観測で実行可能なIRGモデルのためのKSD型テストを開発する。
テストはどんな大きさのネットワークにも適用されるが、テストが保証されていない小さなネットワークにとっては特に興味深い。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:59:06 GMT)
SketchMind: A Multi-Agent Cognitive Framework for Assessing Student-Drawn Scientific Sketches [2.1] SketchMindは、学生が描いた科学スケッチを評価し改善するためのマルチエージェントフレームワークである。
解析、スケッチ認識、認知アライメント、スケッチ修正による反復的なフィードバックを担当するモジュールエージェントで構成されている。
専門家らは、ガイド付きリビジョンを通じて概念的成長を有意義に支援するシステムの可能性に言及した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:55:37 GMT)
Batch Distillation Data for Developing Machine Learning Anomaly Detection Methods [2.1] 機械学習は化学プロセスにおける異常検出(AD)を前進させる大きな可能性を秘めている。
MLベースの手法の開発は、公開実験データの欠如によって妨げられている。
このデータベースは、高度なMLベースのADメソッドを開発するための道を開く。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:13:31 GMT)
CLAWS:Creativity detection for LLM-generated solutions using Attention Window of Sections [2.1] 本研究では,数学的な解を,人間の評価を伴わない典型的・創造的・幻覚的カテゴリーに定義・分類する手法であるCLAWSを提案する。
181個の数学コンテストから収集した4545個の数学問題に対してCLAWSを検証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:59:37 GMT)
Optimizing DINOv2 with Registers for Face Anti-Spoofing [2.1] 悪意あるアクターは、登録ユーザの顔写真を提示することにより、顔認識システムを利用することができる。
本稿では,DINOv2を用いたスプーフィング攻撃検出手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:27:02 GMT)
Quantum-Assisted Barrier Sequential Quadratic Programming for Nonlinear Optimal Control [2.0] 制約付き有限水平非線形最適制御問題を解くための量子支援フレームワークを提案する。
この枠組みの中では、量子サブルーチンが、シュア補数ステップを効率的に解くために組み込まれている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:33:44 GMT)
Atlas-based Manifold Representations for Interpretable Riemannian Machine Learning [2.0] アトラス法の有効性と可能性を実証する。
提案手法は,選択した設定における効率性の面で優位性があることを実証する。
Kleinボトル上の分類課題と造血器データのRNA速度解析において,本手法の解釈性および堅牢性の向上が示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:32:12 GMT)
A Unified Framework for Pattern Recovery in Penalized and Thresholded Estimation and its Geometry [2.0] 実数値多面体ゲージによるペナルティ項の与えられるペナルティ推定の枠組みを考察する。
サブディファレンシャルに基づいてパターンの新規かつ一般的な概念を定義し,パターンの複雑さを測定するアプローチを定式化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:42:40 GMT)
Discovering Properties of Inflectional Morphology in Neural Emergent Communication [2.0] 我々は,2つの調音をシミュレートするための小語彙制約を付与することにより,属性値再構成ゲームである共通の EmCom の設定を再解釈する。
音韻論的制約を模擬することで、結合型形態学が促進され、創発型言語が自然言語の傾向を再現し、文法的属性を融合させることが判明した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:51:51 GMT)
Periodontal Bone Loss Analysis via Keypoint Detection With Heuristic Post-Processing [1.9] 本研究は, 歯周骨の喪失跡, 関連条件, ステージングの自動検出のための深層学習フレームワークとアノテーション手法を提案する。
192の根尖部ドメインが収集され,段階的PRC法で注釈され,疾患の有無や範囲に関わらず,関連するランドマークをラベル付けした。
本稿では,キーポイントと歯のバウンダリを協調する後処理モジュールについて,補助インスタンスセグメンテーションモデルを用いて提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:26:37 GMT)
Kinetically-induced bound states in a frustrated Rydberg tweezer array [1.9] 我々は,Rydberg原子配列量子シミュレータを用いて,ホールとマグノン間の運動誘起バウンド状態の最初の直接観察を行った。
次に、3粒子の1-ホール-2-マグノン境界状態を構築し、運動学的に誘起される一重項相関を観察することによって基礎となる結合機構を明らかにする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:56:34 GMT)
Full-stack Physics-level model of cascaded entanglement links [1.9] 本稿では,ZALMソースを現実的条件下で,孤立的に,あるいは完全なネットワークテストベッドの一部として,モデムをモデレートするツールを多数提示する。
我々のモデリング形式はガウスと非ガウスのハイブリッド表現の上に構築され、性能と精度の間に柔軟なトレードオフをもたらす。
このソフトウェアスタックを使用して、ZALMソース上に構築された多数の完全なネットワークプロトコルを実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:00:08 GMT)
Multilingual Clinical NER for Diseases and Medications Recognition in Cardiology Texts using BERT Embeddings [1.8] 本研究は、英語、スペイン語、イタリア語で書かれた臨床症例報告から、疾患や薬剤の言及を抽出するための単言語モデルと多言語BERTモデルの有効性について検討する。
SDRは77.88%,SMRは92.09%,EMRは91.74%,IMRは88.9%であった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:26:22 GMT)
Going with the Flow: Approximating Banzhaf Values via Graph Neural Networks [1.8] ネットワークフローゲームにおいて,グラフニューラルネットワーク(GNN)を用いてBanzhafの値を近似する新しい学習手法を提案する。
トレーニングされたGNNモデルは,高忠実度Banzhaf値近似を実現し,次数化の高速化を実現する。
この研究は、複雑なネットワークシステムのスケーラブルな協調ゲーム理論解析のための実用的なツールとして、GNNを確立している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:08:41 GMT)
On-the-Fly OVD Adaptation with FLAME: Few-shot Localization via Active Marginal-Samples Exploration [1.8] オープンボキャブラリオブジェクト検出(OVD)モデルは、任意のテキストクエリからオブジェクトを検出することで、顕著な柔軟性を提供する。
リモートセンシング(RS)のような特殊なドメインにおけるゼロショットのパフォーマンスは、自然言語固有の曖昧さによってしばしば損なわれる。
そこで本研究では,大規模な事前学習型OVDモデルの広範な一般化と,軽量な数ショット分類器を併用したケースケード手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:41:55 GMT)
Market-Driven Subset Selection for Budgeted Training [1.8] それぞれのトレーニング例を取引可能な契約として扱う,市場ベースのフレームワークを提案する。
厳格な60kの予算の下でのGSM8Kの数学的推論では、セレクタは強い単一信号基底線でパリティを達成する。
本フレームワークは,逐次的推論および分類タスクのための固定的な計算予算の下で,多信号データキュレーションを統一する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:38:47 GMT)
Explainable AI for microseismic event detection [1.8] PhaseNetのようなディープニューラルネットワークは、ミクロ地震イベントの検出において高い精度を示しているが、それらのブラックボックスの性質は、重要な応用において懸念されている。
我々は、フェーズネットモデルの判断を解釈し、信頼性を向上させるために、グラディエント重み付きクラスアクティベーションマッピング(Grad-CAM)のような説明可能なAI技術を適用した。
我々は,XAIが深層学習モデルだけでなく,その性能も直接的に向上できることを示し,自動地震検知器の信頼性構築のためのテンプレートを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:42:17 GMT)
Spin Readout in a 22 nm Node Integrated Circuit [1.7] 産業標準22nmのシリコンオン絶縁体技術を用いて作製したIC内のアドレス可能な量子ドットデバイスにおいて,単一ショットスピンの読み出しを実演する。
このプロセスによるスピンの読み出しの成功は、高度にスケーラブルで統合されたスピン量子ビットの実現に向けた重要なステップである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:37:18 GMT)
S4ECG: Exploring the impact of long-range interactions for arrhythmia prediction [1.7] マルチエポックな不整脈分類のための構造化状態空間モデルを利用した新しいディープラーニングアーキテクチャであるS4ECGを紹介する。
共同マルチエポック予測は,マクロAUROCでは1.0-11.6%,単一エポックアプローチでは有意に優れていた。
この研究は、時間的に認識される不整脈検出アルゴリズムへのパラダイムシフトに寄与し、ECG解釈の新しい可能性を開く。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:48:44 GMT)
Diverse Planning with Simulators via Linear Temporal Logic [1.7] $textttFBI_textttLTL$は、シミュレーションベースの計画問題のために明示的に設計された多種多様なプランナーである。
これらベースの多様性モデルを検索プロセスに直接統合することにより、$textttFBI_textttLTL$は、意味的に多様なプランの生成を保証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:59:09 GMT)
LLM-Based Multi-Agent System for Simulating and Analyzing Marketing and Consumer Behavior [1.6] LLMを利用したマルチエージェント・シミュレーション・フレームワークを導入し,消費者の意思決定とソーシャル・ダイナミクスをモデル化する。
価格割引マーケティングのシナリオでは、システムは実行可能な戦略テスト結果を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:15:44 GMT)
Quantum Reverse Mapping: Synthesizing an Optimal Spin Qubit Shuttling Bus Architecture for the Surface Code [1.6] 高品質なエンコーディングにより、将来のコンパイルテクニックは最適あるいはほぼ最適のレイアウトで構築できる。
回転曲面符号の1次元シャットリングバスアーキテクチャを合成し、コヒーレントスピン量子ビットシャットリングを利用する。
提案手法は,コード距離21で1ラウンドあたり2cdot 10-10$の論理誤差率を維持可能であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:05:36 GMT)
Diagnosis of Fuel Cell Health Status with Deep Sparse Auto-Encoder Neural Network [1.6] 本稿では, 燃料電池における高周波インピーダンスの予測と分類に, ディープスパース自動符号化ネットワークを用いる。
ネットワークはFPGA上に展開され、ハードウェアベースの認識率はほぼ90%に達する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:55:35 GMT)
Supervised In-Context Fine-Tuning for Generative Sequence Labeling [1.6] 生成SLのための教師付きインコンテキスト微調整(SIFT)を提案する。
SIFTは、SLタスクをLLMに自然に制約された応答生成としてキャストし、デモからコンテキスト内学習(ICL)と教師付き微調整を組み合わせた。
ICLとSIFTの両方において、長い文脈では生成SLの性能が損なわれるが、この欠損は命令を除去することで軽減できる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:17:41 GMT)
Application Scale Quantum Circuit Compilation and Optimization [1.6] 我々は、量子回路のコンパイルと最適化においてトレードオフを管理し、最適化するための実用的なワークフローを開発する。
最大380量子ビットで動作するベンチマークアルゴリズム回路のワークフローを実演する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:29:02 GMT)
How News Feels: Understanding Affective Bias in Multilingual Headlines for Human-Centered Media Design [1.5] 我々はベンガル語ニュースの見出しと内容30万件を分析し、それぞれの主要な感情と全体的なトーンを特定した。
その結果、否定的な感情、特に怒り、恐怖、失望の明確な支配が明らかとなった。
本研究では、感情的な手がかりを可視化し、読者が日々のニュースに隠された感情的フレーミングを認識するのに役立つ人間中心のニュースアグリゲータの設計アイデアを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:40:46 GMT)
From Pixels to People: Satellite-Based Mapping and Quantification of Riverbank Erosion and Lost Villages in Bangladesh [1.5] 河川浸食の追跡に強力な汎用視覚モデルであるセグメンション・アニーシング・モデル(Segment Anything Model)が適用可能であることを示す。
バングラデシュで最も脆弱な地域の歴史的Google Earth画像から収集した損失のデジタル年代記を収集する。
このデータセットは、水中で消滅した開拓地に関する手動の注釈付きデータを含む最初のものである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:20:59 GMT)
Towards Explainable Skin Cancer Classification: A Dual-Network Attention Model with Lesion Segmentation and Clinical Metadata Fusion [1.5] 本稿では,皮膚病変の分類を精度と解釈性の両方の観点から向上させる,二重エンコーダアテンションに基づくフレームワークを提案する。
Dual Attention Gates (DAG) と Atrous Space Pyramid Pooling (ASPP) を用いた新しいDeep-UNetアーキテクチャが最初に採用されている。
我々は,HAM10000データセットとISIC 2018と2019の課題に対するアプローチを評価した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:33:51 GMT)
Object as a Service: Simplifying Cloud-Native Development through Serverless Object Abstraction [1.5] 我々は、アプリケーションデータと関数をクラウドオブジェクトの抽象化にカプセル化する、Object as a Service (O)と呼ばれる新しいパラダイムを提案する。
Oは、組み込み最適化機能を提供しながら、開発者がリソースとデータ管理の負担を軽減します。
我々は、一貫性とフォールトトレラント保証を備えた構造化データと非構造化データの状態抽象化を提供する、Oparacaという名前のプラットフォームを開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:18:57 GMT)
AFRICAPTION: Establishing a New Paradigm for Image Captioning in African Languages [1.5] AfriCaptionは20のアフリカ語で画像キャプションを行うための総合的なフレームワークである。
i) Flickr8k上に構築されたキュレートされたデータセットは、文脈認識の選択と翻訳プロセスを通じて生成されるセマンティックに整列したキャプション、(ii) モデルのセンマブルと適応置換による継続的な品質を保証する動的なコンテキスト保存パイプライン、(iii) 0.5Bパラメータのビジョン・トゥ・テキストアーキテクチャであるAfriCaptionモデル、そして、SigLIPとNLLB200を非表現言語間のキャプション生成のために統合した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:44:44 GMT)
Addressing Antisocial Behavior in Multi-Party Dialogs Through Multimodal Representation Learning [1.5] ソーシャルメディア上での反社会的行動(ASB)は、プラットフォーム安全と社会的幸福へのリスクを増大させる。
textitCyberAgressionAdo-Largeは、多人数会話でASBをシミュレートするフランスのオープンアクセスデータセットです。
我々は6つのテキストベースおよび8つのグラフベースのテキスト表現学習手法をベンチマークし、語彙的手がかり、相互作用力学、およびそれらのマルチモーダル融合を分析した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:27:38 GMT)
Don't Trust Generative Agents to Mimic Communication on Social Networks Unless You Benchmarked their Empirical Realism [1.4] 我々は,大規模言語モデルを用いて,ソーシャルネットワーク利用者の行動の再現に重点を置いている。
我々は、英語とドイツ語でユーザ動作を模倣する様々なアプローチを経験的にテストした。
本研究は, シミュレーション部品が装着された環境で測定された経験的現実性によって, 社会シミュレーションを検証すべきであることを示唆している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:36:06 GMT)
Score-based deterministic density sampling [1.4] 本手法は, 時変スコア$nabla log f_t$をフライ時に学習することにより, $mathrmKL(f_t|pi)$上の勾配流を近似する。
ランゲヴィン力学と同じ限界分布を持つ一方、この手法はスムーズな決定論的軌道を導出し、単調なノイズフリー収束をもたらす。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:37:19 GMT)
DIP-AI: A Discovery Framework for AI Innovation Projects [1.4] この研究はAI問題発見のフレームワークとしてDIP-AIを共有することで学術に貢献する。
業界では、AIイノベーションプロジェクトを開発する実際のIACプログラムにおいて、このフレームワークの使用について議論する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:48:29 GMT)
Phase sensitivity of lossy Mach-Zehnder interferometer via photon addition operation [1.4] 励起状態に印加された光子付加操作により相感度が著しく向上することが示されている。
我々は、光子加算をコヒーレントな状態だけでなく、マッハ-ツェンダー干渉計の設定にも適用することで、このアプローチを拡張した。
その結果、どちらの方式も位相感度、量子フィッシャー情報、損失抵抗を改善していることがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:41:25 GMT)
Trust in foundation models and GenAI: A geographic perspective [1.3] 大規模で事前訓練された機械学習モデルは、人工知能の理解を変えました。
これらのモデルへの依存が増し、重要な意思決定に頼りになるにつれて、信頼は欠落する概念となっている。
この章は、研究者、実践家、政策立案者が(生産的な)GeoAIの信頼性をよりよく理解するための概念的な出発点を提供することを目的としている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:59:17 GMT)
Intuitionistic $j$-Do-Calculus in Topos Causal Models [1.3] 我々は、パールのdo-calusを、棚のトポ内で$j$stable因果推論と呼ばれる直観的設定に一般化する。
我々のフレームワークは、最近提案されたTopos Causal Models (TCMs) のフレームワークで、因果介入をサブオブジェクトとして定義する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:12:17 GMT)
Vision Mamba for Permeability Prediction of Porous Media [1.3] 三次元多孔質媒体の透過性を予測するためのバックボーンとしてVision Mambaを用いたニューラルネットワークを導入する。
三次元多孔質媒体の透磁率予測におけるViTとCNNに対するVision Mambaの利点を実演する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:25:13 GMT)
Can Image-To-Video Models Simulate Pedestrian Dynamics? [1.3] 拡散変圧器(DiT)の変種をベースとした高パフォーマンスな画像対ビデオ(I2V)モデルでは,目覚ましい世界モデリング能力を示した。
混雑した公共の場において,これらのモデルが現実的な歩行者運動パターンを生成できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:44:40 GMT)
Integrating Generative AI into LMS: Reshaping Learning and Instructional Design [1.2] 本稿では,生成AIを学習管理システムに組み込むための2つの原則を提案する。
まず、コンテンツ配信から高階思考の育成まで、調査、コラボレーション、リフレクティブな知識構築を支援するAIの役割を強調します。
第2に、AIとの意義あるインタラクションに向けて、批判的、意図的、社会的に介在するAIとの関わりを育む学習環境の設計を強調します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:58:47 GMT)
CharDiff: A Diffusion Model with Character-Level Guidance for License Plate Image Restoration [1.2] CharDiffは、ライセンスプレートイメージを復元するための文字レベルのガイダンスを備えた、新しい拡散ベースのフレームワークである。
シャルディフは、復元品質と認識精度の両方において、ベースライン復元モデルを大幅に上回った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:23:29 GMT)
Evaluating Large Language Models on Urdu Idiom Translation [1.2] ウルドゥー語から英語の慣用翻訳のための最初の評価データセット
我々は,複数のオープンソースのLarge Language Models (LLM) とNeural Machine Translation (NMT) システムを評価する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:49:26 GMT)
OLIVAW: ACIMOV's GitHub robot assisting agile collaborative ontology development [1.2] 我々はGitHub上でOLIVAW(Ontology Long-lived Via ACIMOV)を提案する。
OLIVAWは有用性と再利用性を確保するためにいくつかのプロジェクトでテストされた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:57:46 GMT)
MatPROV: A Provenance Graph Dataset of Material Synthesis Extracted from Scientific Literature [1.2] 本稿では,科学文献から抽出したProV-DM準拠合成手順のデータセットであるMatPROVについて述べる。
MatPROVは、視覚的に直感的な有向グラフを通じて、材料、操作、条件の間の構造的複雑さと因果関係をキャプチャする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:15:03 GMT)
Efficient Algorithms for Mitigating Uncertainty and Risk in Reinforcement Learning [1.1] 論文は3つの主な貢献をします
まず、MMDPにおけるポリシー勾配と動的プログラミングの新たな関係を同定する。
第2に、指数的ERMベルマン作用素が収縮となるための十分かつ必要な条件を確立する。
第3に,リスク回避目的を考慮したモデルフリーQ-ラーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:06:01 GMT)
Statistical Signatures of Integrable and Non-Integrable Quantum Hamiltonians [1.1] 我々は確率論的観点から量子積分可能性にアプローチする統計的枠組みを開発する。
重要な観察は、積分性はエネルギーギャップを消滅させる有限の確率を必要とすることである。
可積分ハミルトニアンと非可積分ハミルトニアンを区別するための2段階のプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:44:03 GMT)
Offline Policy Evaluation of Multi-Turn LLM Health Coaching with Real Users [1.1] そこで本研究では,実ユーザを対象に,Web上にデプロイされたツール拡張型LDMヘルスコーチについて検討する。
7人のユーザ(280回)からなるパイロットテストにおいて、オフラインポリシ評価は、均一なヘビーツールポリシーがログの平均値を上げるが、特定のサブグループを傷つけることを示している。
隠れアーチタイプを備えた軽量シミュレータは、小さな初期情報ゲインボーナスを追加することで、特性の識別が確実に短縮され、ゴールの成功とパス@3が向上することを示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:28:59 GMT)
An Enhanced Dual Transformer Contrastive Network for Multimodal Sentiment Analysis [1.0] まず,テキスト入力に強力なトランスフォーマーベースのエンコーダBERTと,初期融合戦略を通じて視覚入力に有効なViTを組み合わせた新しいモデルであるBERT-ViT-EFを提案する。
モデルの性能をさらに向上させるために、Dual Transformer Contrastive Network (DTCN) と呼ばれる拡張を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:29:46 GMT)
Uncertainty-aware data assimilation through variational inference [1.0] 決定論的機械学習アプローチに対する変分推論に基づく拡張を提案する。
我々の新しいモデルは、ほぼ完全に校正された予測が得られることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:54:35 GMT)
Round Outcome Prediction in VALORANT Using Tactical Features from Video Analysis [1.0] この研究は複雑な戦略を必要とするFPSゲームVALORANTをターゲットにしている。
マッチング映像中のミニマップ情報を解析することにより、ラウンドアウト予測モデルを構築することを目的としている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:23:36 GMT)
An Empirical Study of Lagrangian Methods in Safe Reinforcement Learning [1.0] 安全クリティカルな領域では、性能の最大化が関連する制約と注意深くバランスをとらなければならないような制約付き最適化問題が発生する。
ラグランジアン法はこれらの課題に対処するための一般的な選択である。
Lagrangian のメソッドの有効性は、Lagrange 乗算器 $lambda$ の選択に大きく依存している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:13:17 GMT)
AICO: Feature Significance Tests for Supervised Learning [0.9] 本稿では,任意の回帰アルゴリズムや分類アルゴリズムにおける入力特徴の影響を評価するために,モデルおよび分布に依存しない重要度テストを開発する。
合成タスクの実験は、その統計的および計算的優位性を検証し、実世界のデータに適用することで、高い意思決定を通知する能力を示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:16:10 GMT)
MambaX-Net: Dual-Input Mamba-Enhanced Cross-Attention Network for Longitudinal MRI Segmentation [0.9] MambaX-Netは、新しい半教師付きデュアルスキャン3Dセグメンテーションアーキテクチャである。
前の時点からMRIと対応するセグメンテーションマスクを利用して、時間点tのセグメンテーションを算出する。
MambaX-Netは縦方向のASデータセットで評価され、その結果、最先端のU-NetやTransformerベースのモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:32:42 GMT)
CompactPrompt: A Unified Pipeline for Prompt Data Compression in LLM Workflows [0.9] 大規模言語モデル(LLM)は強力な推論と生成能力を提供するが、かなりのランタイムコストを発生させる。
我々は,高速なプロンプト圧縮と軽量なファイルレベルのデータ圧縮を融合したエンドツーエンドパイプラインであるCompactPromptを紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:31:11 GMT)
Symmetries in PAC-Bayesian Learning [0.9] 一般化保証を非コンパクト対称性のより広範な設定に拡張する。
非一様回転群を持つ回転MNISTデータセットの実験により,本理論を検証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:45:57 GMT)
What is Implementation Science; and Why It Matters for Bridging the Artificial Intelligence Innovation-to-Application Gap in Medical Imaging [0.9] 実装科学(IS)は、AI開発と実世界の臨床画像利用のギャップを埋める枠組みを提供するかもしれない。
医療画像(MI)におけるAI導入に特有な課題について概説する。
本研究は,ハイブリッドな研究デザインを強調し,有効性研究と実装研究の相補的な役割を強調した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:11:05 GMT)
A Comprehensive Multi-Vocal Empirical Study of ML Cloud Service Misuses [0.8] 本稿では,これまで研究されていない20のMLクラウドサービスの誤用のカタログを提案する。
この結果から,MLサービスの誤用はオープンソースプロジェクトと業界の両方で一般的であることがわかった。
これはMLサービスのベストプラクティスにおける継続的な教育の重要性を強調している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:32:49 GMT)
Virus Spreading in Quantum Networks [0.8] 量子ネットワークにおけるウイルス拡散問題について検討する。
以上の結果から,ウイルス感染に対する量子ネットワークの耐性が高まる傾向が示唆された。
これらの発見は、将来の大規模量子通信システムのセキュリティと信頼性に関する重要な洞察を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:08:30 GMT)
Quantum Key Distribution for Virtual Power Plant Communication: A Lightweight Key-Aware Scheduler with Provable Stability [0.8] 仮想発電所(VPP)は将来のグリッドの基盤となり、分散PV、風力、ストレージ、市場参加とリアルタイムのバランスのための柔軟な負荷を集約している。
PKIとキーローテーションスキームは、クロスドメイン、高周波メッセージング、長期量子脅威に直面している。
本稿では、量子鍵を第一級スケジューリングリソースとして扱うキー対応優先度とクォータフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:29:44 GMT)
Multiphoton quantum simulation of the generalized Hopfield memory model [0.8] 我々は,古典的ニューラルネットワークの多光子量子干渉とホップフィールド様ハミルトニアンとの接続を,導入,開発,検討する。
我々は,Mフィールドモード上の重畳におけるNph不連続光子,Mバイナリ位相シフト器の制御配列,および線形光干渉計からなるシステムを組み合わせることで,出力光子統計が得られることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:53:59 GMT)
Active Inference for an Intelligent Agent in Autonomous Reconnaissance Missions [0.8] 我々は知的エージェントの自律制御のための能動的推論経路計画法を開発した。
目的は、共通の運用図を維持するために、地理的領域を偵察することである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:35:46 GMT)
ZACH-ViT: A Zero-Token Vision Transformer with ShuffleStrides Data Augmentation for Robust Lung Ultrasound Classification [0.7] 本稿では,ZACH-ViT (Zero- parameter Adaptive Compact Hierarchical Vision Transformer, 0.25 M-Hierarchical Vision Transformer)を導入する。
ZACH-ViTは、95人の重病患者の380のLUSビデオで、9つの最先端のベースラインに対して評価された。
ROC-AUC (0.80と0.79) は感度のバランス(0.60)と特異性(0.91)で最高評価と試験を達成し、全ての競合するモデルは簡単な分類に崩壊した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:26:38 GMT)
Automotive Crash Dynamics Modeling Accelerated with Machine Learning [0.7] 我々は、NVIDIA PhysicsNeMoフレームワークを用いて、クラッシュシナリオにおける構造変形の効率的な予測のための機械学習に基づくサロゲートモデルを開発した。
クラッシュダイナミクスをモデル化するための2つの最先端ニューラルネットワークアーキテクチャ、MeshGraphNetとTransolverについて検討する。
モデルでは、全体的な変形傾向を合理的な忠実さで捉え、構造的クラッシュダイナミクスに機械学習を適用する可能性を示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:26:50 GMT)
A polynomial-based QCQP solver for encrypted optimization [0.7] 本稿では,加法と乗法のみを用いて,2次制約付き2次最適化問題のクラスを解く新しい方法を提案する。
このアプローチにより、同型暗号方式の能力により、プライベートデータ上の制約付き最適化問題を解くことができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:31:20 GMT)
Challenges and proposed solutions in modeling multimodal data: A systematic review [0.7] 臨床研究における強力なアプローチとしてマルチモーダルデータモデリングが登場している。
この系統的なレビューは、69の研究から得られた知見を合成し、共通の障害を同定する。
本稿では,伝達学習,生成モデル,注意機構,有望なソリューションを提供するニューラルアーキテクチャ探索など,近年の方法論的進歩に注目した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:54:39 GMT)
An Evaluation of LLMs Inference on Popular Single-board Computers [0.7] シングルボードコンピュータ(SBC)は、ローカライズされたプライバシ保護推論のための有望なプラットフォームを提供する。
我々は、Raspberry Pi 4、Raspberry Pi 5、Orange Pi 5 Proの3つのSBCで25の量子化されたオープンソースの大言語モデル(LLM)推論ランタイムのパフォーマンスをベンチマークした。
LlamafileはOllamaよりも最大4倍高いスループットと30-40%低い消費電力を実現し,SBCは1.5Bパラメータまでモデルを確実にサポートできることを示した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:35:45 GMT)
Reasoning Distillation and Structural Alignment for Improved Code Generation [0.7] この研究は、大規模言語モデルの推論能力を、より速く、より安価にデプロイできる、より小さく、より効率的なモデルに蒸留する。
提案手法は,正解経路の同定を学習することで,VLLMの推論能力と問題解決能力をエミュレートするためにモデルを訓練する。
実験結果から,我々の微調整モデルは,安価で簡単な実装プロセスによって開発され,パス@1,平均データフロー,平均構文がメトリクスにマッチする点において,ベースラインモデルよりも大幅に優れていることがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:47:47 GMT)
Investigating Adversarial Robustness against Preprocessing used in Blackbox Face Recognition [0.7] 顔認識(FR)モデルは、良質な顔画像が微妙に変化する敵の例に弱いことが示されている。
各種前処理技術に適用した場合, FRに対するいくつかの対向攻撃の転送可能性について検討した。
本研究では,入力変換を用いた前処理不変の手法を提案し,攻撃の伝達性を最大27%向上させる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:19:35 GMT)
Big Data, Tiny Targets: An Exploratory Study in Machine Learning-enhanced Detection of Microplastic from Filters [0.6] マイクロプラスチック(MP)はユビキタス汚染物質であり、生態系や人間の健康に影響を及ぼす可能性がある。
機械学習(ML)は、マイクロプラスチック検出を前進させる強力なツールとして登場した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:35:50 GMT)
MIRAGE: Agentic Framework for Multimodal Misinformation Detection with Web-Grounded Reasoning [0.6] 我々は、マルチモーダル検証を4つのシーケンシャルモジュールに分解する推論時モデルプラガブルエージェントフレームワークであるMIRAGEを提案する。
視覚的妥当性評価は、AI生成した画像を検出し、クロスモーダルな一貫性分析は、Webエビデンスにおけるアウト・オブ・コンテクストの再利用、検索強化された事実チェックの根拠を特定する。
MIRAGEは、ターゲットとするWeb検索、構造化された出力、引用リンクされた有理数を用いた視覚言語モデル推論をオーケストレーションする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:40:26 GMT)
Solving Oscillator Ordinary Differential Equations in the Time Domain with High Performance via Soft-constrained Physics-informed Neural Network with Small Data [0.6] 物理インフォームドニューラルネットワーク(PINN)は、物理情報と知識をネットワークトポロジや計算プロセスに組み込む。
本研究では,典型的な線形および非線形常微分方程式を解くために,ソフト制約PINN法の性能特性について検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:41:38 GMT)
Sorting by Strip Swaps is NP-Hard [0.6] ストリップスワップ(SbSS)によるemphSortingは,emphBlock Sortingの低減によってNPハードであることが示されている。
鍵となるアイデアは、地元のガジェット、Emphcageだ。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:51:26 GMT)
Toward Autonomous Neural VMC: An Energy-Variance Convergence Criterion for Quantum Systems [0.6] 収束のための普遍的で定量的な基準としてエネルギー分散を提案し,検証する。
その信頼性は様々な量子システムで実証されている。
我々は、この基準を軽量なニューラルソルバ内に実装し、自動パラメータスキャンを可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:44:33 GMT)
Visibility Allocation Systems: How Algorithmic Design Shapes Online Visibility and Societal Outcomes [0.6] 可視性アロケーションシステム(VAS)の形式的フレームワークを導入する。
VASは、どの(処理された)データを人間のユーザに提供するかを決定する。
我々のフレームワークは、義務の特定、システム的リスクの定量化、適応的コンプライアンスの実現のために、現在進行中のAI立法活動をサポートすることができるかを示します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:28:24 GMT)
Online Political Microtargeting: Promises and Threats for Democracy [0.6] 本稿では、マイクロターゲットの約束と民主主義への脅威をマッピングする。
マイクロターゲティングは 選挙人の関心事と政治キャンペーンの 一致を最適化する
しかし、オンラインのマイクロターゲットは民主主義を脅かす可能性もある。
マイクロターゲットのためのデータ収集はプライバシーの懸念を引き起こす。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:26:22 GMT)
Comparison and performance analysis of dynamic encrypted control approaches [0.5] ホモモルフィック暗号化は、測定と制御信号のプライバシを保証し、システムとコントローラパラメータを意図したように制御しながら、システムとコントローラパラメータを保証している。
本稿では、ブートストラップ、制御状態の周期的リセット、整数再構成、FIRコントローラといった動的制御の暗号化に対する最近のアプローチをレビューし、安定性と性能解析を行い、それらの適合性を評価する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:26:33 GMT)
Na Prática, qual IA Entende o Direito? Um Estudo Experimental com IAs Generalistas e uma IA Jurídica [0.5] 本研究では, 物質的正当性, 体系的整合性, 議論的整合性など, 法的理論を組み合わせた実験的評価手法を提案する。
4つのシステム(JusIA、ChatGPT Free、ChatGPT Pro、Gemini)が、弁護士の日常業務をシミュレートするタスクでテストされた。
ドメイン特化モデルであるJusIAは、汎用システムよりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:09:50 GMT)
AI-Boosted Video Annotation: Assessing the Process Enhancement [0.5] この研究は、アノテーションプロセスの実践的意味、AIコンポーネントの統合、そしてその成果の評価を掘り下げている。
Label Studio と AI を利用したゼロショット事前アノテーションを用いたシングルイテレーション方式を実装した。
また,類似のアノテーションを持つアノテーションの70%に対して,アノテーション時間を35%短縮した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:10:11 GMT)
LLMDiRec: LLM-Enhanced Intent Diffusion for Sequential Recommendation [0.5] 既存のシーケンシャルなレコメンデーションモデル、あるいは高度な拡散ベースのアプローチでさえ、ユーザ行動の根底にあるリッチなセマンティックな意図を捉えるのに苦労することが多い。
LLMDiRecは,Large Language Models (LLM) を意図認識拡散モデルに統合した新しい手法である。
モデルネームは最先端のアルゴリズムよりも優れており、複雑なユーザ意図をキャプチャする上で特に強力な改善がなされていることを実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:55:26 GMT)
Detector Asymmetry in Continuous Variable Quantum Key Distribution [0.5] ショットノイズ制限ヘテロダイン検出器の4次測定における非対称性は、参照信号の位相推定の精度に影響を与える。
本研究では,非対称性検出の効果に対処する手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:00:24 GMT)
Predicting Patient Recovery or Mortality Using Deep Neural Decision Tree and Forest [0.5] 重症度と予後を解析するために,Coronavirus disease 2019の診断,人口統計,健康指標,職業リスク因子を用いた。
予測モデルを構築するために9つの機械学習とディープラーニング手法が採用された。
患者の結果を予測するために,各段階のモデルを評価した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:03:03 GMT)
Transformer Redesign for Late Fusion of Audio-Text Features on Ultra-Low-Power Edge Hardware [0.4] マルチモーダル感情認識はディープラーニングを通じて進歩してきたが、ほとんどのシステムは超制約エッジデバイスへの展開には適していない。
本稿では,エッジTPUに最適化したレイトフュージョンアーキテクチャを用いて,音響的特徴と言語的特徴を組み合わせたハードウェア対応感情認識システムを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:18:22 GMT)
Towards Mining Effective Pedagogical Strategies from Learner-LLM Educational Dialogues [0.4] 本稿では,学習者-LLM対話から効果的な教育戦略を特定するために,対話分析手法を用いた継続的な研究について述べる。
提案手法は,対話データ収集,対話行動(DA)アノテーション,DAパターンマイニング,予測モデル構築を含む。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:11:34 GMT)
A Class of Cyclic Quantum Codes [0.4] 回転した2次元トーリック符号の族のような既知の符号が、どのようにしてこのクラスに該当するかを示す。
コンピュータ検索で見つかる小さなサイズの例も紹介する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:28:21 GMT)
SV-DRR: High-Fidelity Novel View X-Ray Synthesis Using Diffusion Model [0.4] 単一視点からのマルチビューX線画像に対する新しいビュー条件付きモデルを提案する。
提案手法ではディフュージョン変換器を用いて細部を保存し,高解像度画像の安定生成に弱いストロングトレーニング戦略を用いる。
この能力は、臨床応用だけでなく、医学教育やデータ拡張にも重要な意味を持つ。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:22:39 GMT)
MSDM: Generating Task-Specific Pathology Images with a Multimodal Conditioned Diffusion Model for Cell and Nuclei Segmentation [0.4] セルと核のセグメンテーションのための画素精度画像-マスクペアを生成するためのマルチモーダルセマンティック拡散モデルを提案する。
生成過程を細胞核形態で条件付けすることで、MSDMは所望のモルフォロジー特性を持つデータセストを生成する。
細胞・核セグメンテーションモデルの堅牢性と一般化性を向上させるために,多モード拡散に基づく拡張の有効性を強調した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:26:24 GMT)
D2C-HRHR: Discrete Actions with Double Distributional Critics for High-Risk-High-Return Tasks [0.3] 高リスクハイリターン動作を含むタスクは、しばしばマルチモーダルなアクション分布とリターンを示す。
ほとんどの強化学習法は、一元的なガウス主義を前提としており、スカラー評価の批判に頼っている。
本稿では,連続的な行動空間を近似したマルチモーダル分布に識別する強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:54:53 GMT)
Monitoring Horses in Stalls: From Object to Event Detection [0.3] 本報告では,馬や安定した場所にいる人々の検出と追跡を自動化する,視覚に基づくプロトタイプモニタリングシステムを提案する。
このシステムは YOLOv11 と BoT-SORT を利用して検出と追跡を行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:52:42 GMT)
Frugal Federated Learning for Violence Detection: A Comparison of LoRA-Tuned VLMs and Personalized CNNs [0.3] 視覚言語モデル(VLM)のゼロショットとフェデレートされた微調整と、コンパクトな3次元畳み込みニューラルネットワーク(CNN3D)のパーソナライズされたトレーニングを比較した。
リアルな非IID環境下での精度,キャリブレーション,エネルギー使用量を評価した。
これらの結果は, 日常的な分類のための軽量CNNと, 複雑なシナリオや記述シナリオのための選択的VLMアクティベーションのハイブリッドモデルをサポートする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:26:43 GMT)
Exploring the design space of diffusion and flow models for data fusion [0.3] 本研究では,防衛気象衛星計画のDMSP-OLS(Operational Linescan System)とVIIRS(Visible Infrared Imaging Radiometer Suite)の夜間光データの統合に焦点を当てた。
UNET,拡散,フローモデリングを含む2次元画像から画像への生成モデルの有効性を評価する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:03:08 GMT)
DFNN: A Deep Fréchet Neural Network Framework for Learning Metric-Space-Valued Responses [0.3] Deep Fr'echet Neural Network(DFNN)は、ユークリッド予測器から非ユークリッド応答を予測するためのエンドツーエンドのディープラーニングフレームワークである。
我々は、DFNNの普遍近似定理を確立し、ニューラルネットワーク近似理論の最先端を推し進める。
DFNNが既存の手法を一貫して上回ることを示すために, 合成分布およびネットワーク評価応答に関する実証的研究と, 実世界の雇用構成予測への応用を行った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:57:30 GMT)
Hardware-efficient formulation of molecular cavity-QED Hamiltonians [0.3] 本稿では,量子電気力学(QED)システムを短期量子ハードウェア上でシミュレーションする新しい手法を提案する。
定在波フォトニックベースアプローチを用いることで、ハードウェア接続の制約や2ビットゲートのエラーにより、不確実性の問題が発生することが判明した。
我々は、近傍のカップリングを強制する局所化フォトニック基底アプローチを用いて、ハミルトニアンを1D量子ビット連鎖としてマッピングすることができることを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:53:04 GMT)
Thermal avalanches in isolated many-body localized systems [0.3] 乱れ磁場を受ける大きさ$L$のハイゼンベルクスピン鎖の多体局在安定性を数値的に検討した。
強い障害に対して、雪崩は熱領域がシステムサイズでスケールする場合のみ起こる。
我々は多体局在とエルゴード挙動の中間位相を$P$の増加として同定する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:34:34 GMT)
Mensen aanwijzen maar niet bij naam noemen: behavioural targeting, persoonsgegevens, en de nieuwe Privacyverordening [0.2] データ保護法が行動ターゲティングに適用されるかどうかについては熱心に議論されている。
多くの行動ターゲティング企業は、個人に関するデータに名前を結び付けない限り、個人データを一切処理しないと言っている。
本稿では,データ保護法が行動ターゲティングに適用されるべきであると主張している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:26:00 GMT)
Discrimination, intelligence artificielle et decisions algorithmiques [0.2] この研究は、欧州評議会の反差別部門のためにZuiderveen Borgesius教授によって準備された。
アルゴリズムによる意思決定やその他の人工知能(AI)による差別のリスクについて詳述する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:26:15 GMT)
A Benchmark Dataset And LLMs Comparison For NFR Classification With Explainable AI [0.2] 非Functional Requirements(NFR)は、ソフトウェアシステムの全体的な品質とユーザ満足度を決定する上で重要な役割を果たす。
さまざまなプロジェクト憲章とオープンソースソフトウェアドキュメントからNFRを収集しました。
我々はNFRをサブクラスに分類し、広く使われている大規模言語モデルを用いてニーズを特定した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:45:15 GMT)
Dynamic Switched Quantum Key Distribution Networkwith PUF-based authentication [0.2] 本稿では、各QKDリンクに対するPUFベースの動的認証と統合された、集中制御された動的切替QKDネットワークを示す。
リアルタイムPUF認証を用いた動的スイッチングQKDネットワークの性能を解析した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:01:12 GMT)
Efficient Toxicity Detection in Gaming Chats: A Comparative Study of Embeddings, Fine-Tuned Transformers and LLMs [0.2] 本稿では,オンラインゲームチャットにおける毒性の自動検出のための自然言語処理(NLP)手法の比較分析を行う。
埋め込みを伴う従来の機械学習モデル、大型言語モデル(LLM)、ゼロショットおよび少数ショットプロンプト、微調整トランスフォーマーモデル、検索拡張生成アプローチの評価を行う。
この結果は,動的オンラインゲーム環境において,費用対効果の高い効率的なコンテンツモデレーションシステムを展開するための実証的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:03:28 GMT)
The impact of noise on the simulation of NMR spectroscopy on NISQ devices [0.2] 本稿では, 利用可能なクラウド量子コンピュータ上での小型有機分子の核磁気共鳴(NMR)分光のシミュレーションを行う。
得られたNMRスペクトルに対するノイズの影響を解析し、提案アルゴリズムが許容できる閾値ノイズを定量化する効果的なデコヒーレンス率を定式化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:38:39 GMT)
Attention-Guided Deep Adversarial Temporal Subspace Clustering (A-DATSC) Model for multivariate spatiotemporal data [0.2] サブスペースクラスタリングモデルは、融雪検出海氷追跡などの応用に不可欠である。
グラフアテンションに基づく自己表現型ネットワークは、局所的な空間的関係、グローバルな依存関係、短距離と長距離の両方をキャプチャする。
3つの実世界のデータセットによる実験により、A-SCSCは最先端の深層宇宙クラスタリングモデルと比較してかなり優れたクラスタリング性能を達成している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:38:26 GMT)
Attracting Commercial Artificial Intelligence Firms to Support National Security through Collaborative Contracts [0.1] この論文は、契約法と調達の枠組みが最も重要な障害であると主張している。
参加者のサンプルからのインタビューは、AI産業がなぜそのような認識を持つのかを説明している。
結論として、商用AI企業は、ビジネスや技術の考慮事項と整合した契約に魅了されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:11:04 GMT)
PLAGUE: Plug-and-play framework for Lifelong Adaptive Generation of Multi-turn Exploits [0.1] PLAGUEは、生涯学習エージェントにインスパイアされたマルチターン攻撃を設計するためのプラグイン・アンド・プレイフレームワークである。
PLAGUEは、最先端のジェイルブレイクの結果を達成し、主要なモデル間で攻撃成功率(ASR)を30%以上改善することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:37:03 GMT)
Adapting Stereo Vision From Objects To 3D Lunar Surface Reconstruction with the StereoLunar Dataset [0.1] 月の最初のステレオ画像ペアのオープンデータセットであるLunarStereoを紹介する。
月面の南極周辺の様々な高度、照明条件、視角をカバーしている。
我々はLunarStereoの微調整によりMASt3Rモデルを月領域に適応させる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:50:52 GMT)
Mixed state deep thermalization [0.1] 混合状態射影アンサンブル(MSPE)は、量子多体系の局所領域を記述する混合状態の集合である。
可溶性(1+1)d双対量子回路の進化により生成されるMSPEについて検討する。
本研究では、アンサンブルを構成する状態の量子情報特性、特に量子情報をテレポートする能力について検討する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:14:15 GMT)
RocqStar: Leveraging Similarity-driven Retrieval and Agentic Systems for Rocq generation [0.1] 本稿では、Rocq生成に対する複数のアプローチを評価し、改善のための潜在的な道筋を照らす。
本稿では,自己注意型埋め込みモデルを用いた検索手法を提案する。
我々は,形式的検証に適した多段階エージェントシステムを用いて,Rocq証明を記述する問題に取り組む。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:59:37 GMT)
Enhanced Fish Freshness Classification with Incremental Handcrafted Feature Fusion [0.1] 魚の鮮度を評価するために手作りの特徴に基づくアプローチを提案する。
本手法は,全画像からグローバルな色変化を捉え,ROIセグメントから局所的な劣化を抽出する。
魚眼データセットの鮮度に関する実験は、アプローチの有効性を実証している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:36:34 GMT)
RubiSCoT: A Framework for AI-Supported Academic Assessment [0.0] RubiSCoTは、提案から最終提出までの論文評価を強化するために設計された、AIをサポートするフレームワークである。
このフレームワークには、事前評価、多次元評価、コンテンツ抽出、ルーリックベースのスコアリング、詳細なレポートが含まれる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:52:33 GMT)
Application-oriented automatic hyperparameter optimization for spiking neural network prototyping [0.0] この文書は、ニューラルネットワークインテリジェンス(NNI)ツールキットを参照フレームワークとして使用して、そのようなソリューションを1つ提示する。
SNNプロトタイピングのためのアプリケーション指向HPO実験に対する洞察の潜在的源として、提示されたパイプラインを用いた論文の概要が報告されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:23:29 GMT)
Generic Hilbert Space Fragmentation in Kogut--Susskind Lattice Gauge Theories [0.0] 格子ゲージ理論のKogut--Susskind の定式化がヒルベルト空間の断片化を引き起こすことを示す。
我々の研究は、これらのモデルが量子色力学の熱化特性を推測するために忠実に使用できる条件のガイドとなる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:18:24 GMT)
Witnessing quantum non-Gaussianity from intensity moments [0.0] 量子非ガウス性を直接測定するには、離散光子分解検出の変種が必要である。
我々は、光子数の平均と分散のみに基づいて、量子非ガウス性証人の導出と解析を行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:19:32 GMT)
When Does Supervised Training Pay Off? The Hidden Economics of Object Detection in the Era of Vision-Language Models [0.0] 監督されたYOLOの精度は91.2%、ジェミニでは68.5%、標準カテゴリーでは71.3%である。
Geminiは52.3%、GPT-4 55.1%を達成しているが、教師なしのクラスは検出できない。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:09:23 GMT)
When Annotators Disagree, Topology Explains: Mapper, a Topological Tool for Exploring Text Embedding Geometry and Ambiguity [0.0] 本稿では,微調整によるエンコードあいまいさの分析のためのトポロジ的視点を提案する。
われわれの発見は、Mapperをモデルがあいまいさをどう解決するかを理解するための強力なツールと位置づけた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:58:02 GMT)
ViBED-Net: Video Based Engagement Detection Network Using Face-Aware and Scene-Aware Spatiotemporal Cues [0.0] ViBED-Netは、ビデオデータから学生のエンゲージメントを評価するために設計された新しいディープラーニングフレームワークである。
本モデルは,eラーニングにおける感情状態認識のための大規模ベンチマークであるDAiSEEデータセットを用いて評価する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:48:25 GMT)
Using machine learning methods to predict cognitive age from psychophysiological tests [0.0] 平均完了時間,正解率,カラーキャンピメトリテストの平均絶対デルタ,M"アンスターバーグ行列における推定単語数,その他のパラメータを被験者毎に算出した。
得られた特徴を前処理し、個人の認知年齢を予測する回帰タスクを実装する機械学習アルゴリズムを訓練するために使用した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:24:44 GMT)
TriggerNet: A Novel Explainable AI Framework for Red Palm Mite Detection and Multi-Model Comparison and Heuristic-Guided Annotation [0.0] 赤いヤシダニの寄生は特に広範囲のヤシ栽培地において深刻な関心事となっている。
本研究は, 影響を受ける植物を分類し, 寄生虫を検出するMLモデルの評価と比較に焦点をあてる。
TriggerNetは、Grad-CAM、RISE、FullGrad、TCAVを統合する、新しい解釈可能なAIフレームワークである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:23:17 GMT)
Trapped-ion two-qubit gates with >99.99% fidelity without ground-state cooling [0.0] そこで我々は, 閉ざされたイオン量子ビットのエンタングリング手法である'smooth gate'を導入する。
その結果,トラップイオン量子計算はドップラー限界以上の温度で高い忠実度を達成でき,より高速で簡単なデバイス操作が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:21:21 GMT)
Transition of $α$-mixing in Random Iterations with Applications in Queuing Theory [0.0] 本研究では, 混合特性を外因性回帰器から結合論による応答へ伝達することを示す。
また,非定常環境下においても,ドリフトおよびマイノライズ条件のランダム環境におけるマルコフ連鎖について検討した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:07:41 GMT)
Transformer-Based Low-Resource Language Translation: A Study on Standard Bengali to Sylheti [0.0] 細調整多言語変換器モデルによるベンガル-シルヘティ変換について検討する。
実験により、微調整モデルが大規模言語モデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:29:24 GMT)
Towards geological inference with process-based and deep generative modeling, part 2: inversion of fluvial deposits and latent-space disentanglement [0.0] フラビアル沈殿物を生成するために訓練されたジェネレーティブ・敵ネットワーク(GAN)は、よく地震データと一致するように逆向きにすることができる。
4、8、20の井戸を持つ3つの試験サンプルに対して4つの反転アプローチを適用した。
GANはすでにジオモデリングへの統合に必要なタスクを処理できる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:22:12 GMT)
Towards a Generalizable Fusion Architecture for Multimodal Object Detection [0.0] Filtered Multi-Modal Cross Attention Fusion (FMCAF) は、RGBと赤外線(IR)入力の融合を強化するために設計された事前処理アーキテクチャである。
FMCAFは、データセット固有のチューニングを必要とせずに、さまざまなマルチモーダル課題のパフォーマンスを改善することを目的としている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 01:19:54 GMT)
Thouless quantum walks in topological flat bands [0.0] 非アベリアゲージ対称性は、工学化された量子系の量子コヒーレンス、エンタングルメント、輸送を制御する。
位相格子上の1次元離散時間量子ウォークを実現するために,非アベリア式Thouless pumpingを提案する。
結果として生じる進化はパリティ対称性の破れを示し、ワイル様方程式によって支配される動的プロセシウムを生じさせる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:40:35 GMT)
The Wehrl-type entropy conjecture for symmetric $SU(N)$ coherent states: cases of equality and stability [0.0] 対称$SU(N)$表現に対して、対応するWehrl型エントロピーはコヒーレント状態によって最小化されることを示す。
リーブとソロヴェイによる境界の鋭い定量的形式も証明されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:44:11 GMT)
The Marked Edge Walk: A Novel MCMC Algorithm for Sampling of Graph Partitions [0.0] 可変分布下でのグラフ分割空間からのサンプリングのための新しいMCMCアルゴリズムを提案する。
このウォークは、縁がマークされた木々の空間で動作し、計算可能な遷移確率を可能にする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:28:42 GMT)
The Gauss-Markov Adjunction Provides Categorical Semantics of Residuals in Supervised Learning [0.0] 機械学習のインテリジェンス性と解釈可能性を高めることは、AI原則としての説明可能性の要求に対応する上で重要なタスクである。
本稿では、教師付き学習の最も基本的な形態を表す多重線形回帰モデルに焦点を当てた。
このフレームワークの本質的な構造は、ガウス-マルコフ共役(英語版)と呼ばれるものによって捉えられることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:02:37 GMT)
Tagged vector space, Part I: Dirac notation as originally intended [0.0] 物理シナリオの様々な定式化で使われるように、タグの概念に対する一般化が提供される。
これはタグとその抽出子に対する公理の集合に基づくタグ付きベクトル空間の定義につながる。
このようなタグ付きベクトル空間は、量子光学の文脈において、ディラック表記の形式的な数学的記述を提供するために用いられる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:21:28 GMT)
Symmetry Properties of Quantum Dynamical Entropy [0.0] 対称性の存在下での量子力学エントロピーの挙動について検討する。
この結果から, 量子力学における対称性の重要性が示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:19:18 GMT)
Symmetric channel verification for purifying noisy quantum channels [0.0] 本稿では、量子チャネルに固有の対称性を利用するチャネル浄化プロトコルである対称チャネル検証(SCV)を提案する。
SCVは量子チャネルの対称性破壊ノイズを検出し、補正することができる。
本プロトコルはハミルトニアンシミュレーション回路および位相推定回路に適用される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:38:30 GMT)
Surpassing the wave-particle duality relation via feed-forward of phase information [0.0] 二重スリット干渉計において, 検出画面における量子オブジェクトの位相に相関できることを示す。
本稿では,粒子がスクリーン上に記録された後,各位相に対して局所的に一方の情報を最大化することを目的としたフィードフォワードプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:36:17 GMT)
Sufficient criteria for absolute separability in arbitrary dimensions via linear map inverses [0.0] 任意の大域的ユニタリ変換の下で分離可能(すなわち絡み合っていない)な量子状態は、絶対分離可能として知られ、凸集合を形成する。
線形写像とその逆写像を用いて、任意の次元における絶対分離性に対する新しい十分な解析的条件を導出する。
絶対可分性に関する複数の非可分な基準が利用可能である場合に、集合の特徴づけを洗練する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:24:26 GMT)
Static impurity in a mesoscopic system of SU($N$) fermionic matter-waves [0.0] 我々は,強い相関を持つSU($N$)対称フェルミオンからなる1次元メソスコピックシステムにおいて,局所障壁によってモデル化された静的不純物の効果について検討した。
人工ゲージ場の影響下でのメソスコピックサイズのリングでは,不純物中を流れるエネルギースペクトル,粒子密度,電流を解析する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:23:50 GMT)
SpectraLift: Physics-Guided Spectral-Inversion Network for Self-Supervised Hyperspectral Image Super-Resolution [0.0] 高分解能高分解能マルチスペクトル画像(HR-MSI)と低分解能高分解能ハイパースペクトル画像(LR-HSI)を融合させることは、微細な空間構造を復元するための有望な経路である。
MSIのスペクトル応答(SRF)のみを用いてLR-HSIとHR-MSI入力を融合する完全自己教師型フレームワークSpectraLiftを提案する。
推測において、SpectraLiftはトレーニングされたネットワークを使用してHR-MSIピクセルをHR-HSI推定にマッピングする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:31:24 GMT)
Self-Evidencing Through Hierarchical Gradient Decomposition: A Dissipative System That Maintains Non-Equilibrium Steady-State by Minimizing Variational Free Energy [0.0] 自由エネルギー原理(FEP)は、自己組織化システムは持続する変動自由エネルギーを最小化しなければならないと述べている。
本稿では、FEPが正確なローカルクレジット代入によって実現可能であることの具体的証明を示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 00:19:32 GMT)
Scalable accuracy gains from postselection in quantum error correcting codes [0.0] トーリック符号における観察された症候群間の論理的故障率の統計的分布について検討した。
一般に、論理誤差率を$p_f$から$p_fb$に抑えることができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:09:20 GMT)
Scalable CI/CD for Legacy Modernization: An Industrial Experience Addressing Internal Challenges Related to the 2025 Japan Cliff [0.0] 日本は2025年以降、年間最大12兆円の損失を被る可能性がある。
また、手動のメンテナンスと限定的なQA環境が重要なシステムを時代遅れにし、更新が困難にしているレガシーシステムについても、同様の内部課題に直面している。
本稿では,スケーラブルCI/CDパイプラインの設計とアーキテクチャについて述べる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:17:20 GMT)
SG-CLDFF: A Novel Framework for Automated White Blood Cell Classification and Segmentation [0.0] SG-CLDFF(Saliency-Guided Cross-Layer Deep Feature Fusion framework)
軽量なハイブリッドバックボーン(Swin-style)は、ResNeXt-CCinspired cross-layer fusion moduleによって融合されたマルチレゾリューション表現を生成する。
解釈性はGrad-CAMビジュアライゼーションと唾液濃度の整合性チェックを通じて実施され、モデル決定を地域レベルで検査することができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:07:39 GMT)
Ruelle-Pollicott Decay of Out-of-Time-Order Correlators in Many-Body Systems [0.0] 分離系におけるOTOCの長期指数崩壊は,この内在的ギャップの2倍の速度で起こることを示す。
この対応は、可積分性とカオスの間の交差状態においても持続する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:04:39 GMT)
Resource efficient certification of system environment entanglement solely from reduced system dynamics [0.0] 非古典的相関の証明は、到達不能な環境と結合するオープン量子系において大きな課題となる。
近年の研究では、自律的な純粋嫌悪シナリオにおいて、環境との量子不一致はシステムのみの力学から証明できることが示されている。
本稿では,システムのダイナミクスの低減のみで,システム環境の量子絡み合いの認証を可能にする手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:17:29 GMT)
Renormalization of Chern-Simons Wilson Loops via Flux Quantization in Cohomotopy [0.0] 2-コホモトピーにおける適切なフラックス量子化は、5D Maxwell-Chern-Simons QFTの非ラグランジアン位相的完備化を達成できることを示す。
この結果は、トポロジカルに順序付けられた量子材料に応用された、控えめな従兄弟である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:51:46 GMT)
Reciprocity Theorem and Fundamental Transfer Matrix [0.0] 定常ポテンシャル散乱は、非エルミート有効ハミルトニアンによって生成される量子力学の用語で定式化される。
この定式化を用いて、2次元と3次元の相互性定理の証明を与える。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:43:58 GMT)
Real critical exponents from the $\varepsilon$-expansion in an interacting $U(1)$ model with non-Hermitian $Z_4$ anisotropy [0.0] U(1)$-不変ラグランジアンが複素、$mathcalPT$対称な$Z_4$異方性によって摂動する臨界挙動を研究する。
これは、利得と損失を含む解釈を超えて、いくつかの非エルミート系の重要性と物理的意味について教えてくれる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:11:11 GMT)
ReLACE: A Resource-Efficient Low-Latency Cortical Acceleration Engine [0.0] 我々は, Cortical Neural Pool architecture with a CORDIC-based Hodgkin Huxley (RCHH) neuron modelを提案する。
RCHHニューロンのFPGA実装は、24.5%のLUT削減と35.2%の改善速度を示している。
この設計は、リソース制約のあるエッジAIアプリケーションのための生物学的に正確で低リソースのスパイクニューラルネットワークの実装を示している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:33:50 GMT)
Quantum Synthetic Data Generation for Industrial Bioprocess Monitoring [0.0] バイオマニュファクチャリングにおけるデータの不足とスパーシリティは、正確なモデル開発、プロセス監視、最適化に課題をもたらす。
本稿では,QWGAN-GP(Quantum Wasserstein Generative Adrial Network with Gradient Penalty)を用いて,産業関連プロセスの時系列データを生成することを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:04:39 GMT)
Quantum Reciprocity: A Structured-Bath Hamiltonian for Coherent Amplification [0.0] 巨視的コヒーレンスは孤立せず,構造的結合にあることを示す。
本研究では,6量子構造浴を設計し,散逸から増幅への制御可能な遷移を示すことにより,この原理を数値的に検証する。
このアーキテクチャコアは、量子ノイズを設計リソースに変換するためのマルチスケールワークフローの基盤として機能する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:21:32 GMT)
Quantum Mechanics Relative to a Quantum Reference System: Relative State Approach [0.0] 本稿では,絶対量子状態ではなく,絡み合った状態に基づく固有あるいは背景非依存の量子フレームワークを提案する。
量子基準系として、アンダースタディ量子系と量子測定装置の間の量子相対状態を記述する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:11:39 GMT)
Quantum Hamiltonian simulation of linearised Euler equations in complex geometries [0.0] 量子コンピューティングは偏微分方程式の解系において指数関数的な改善を約束する。
1つのアプローチは古典的なCFD問題を量子ハミルトン進化にマッピングすることである。
ここでは、この手法をより複雑で実用的なケースに拡張する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:00:16 GMT)
Quantum Computing Approach to Atomic and Molecular Three-Body Systems [0.0] 本稿では,三体原子と分子の高精度量子計算シミュレーションを提案する。
その結果、現在のノイズ中間量子(NISQ)デバイス上でのベンチマークと試験に優れた3体原子と分子が得られた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:39:32 GMT)
Quantifying Climate Policy Action and Its Links to Development Outcomes: A Cross-National Data-Driven Analysis [0.0] 我々は,多言語トランスフォーマーに基づく言語モデルを公式な国家政策文書に適用することにより,気候政策の方向性の定量的指標を開発する。
これらの指標を世界銀行開発データとパネルレグレッションにリンクすると、緩和政策がGDPとGNIの上昇に結びついていることが分かる。
災害リスク管理はGNIの増大と相関するが、海外からの直接投資は減少し、適応と損失は測定可能な影響を限定している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:12:30 GMT)
Qomhra: A Bilingual Irish-English Large Language Model [0.0] Qomhr'aは、低リソース制約下で開発されたバイリンガル・アイリッシュ・イングリッシュ・イングリッシュ・大規模言語モデル(LLM)である。
Qomhr'aは、翻訳、性別の理解、トピックの識別、世界の知識をテストするベンチマークで評価されており、アイルランド語では29%、英語では44%まで上昇している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:27:53 GMT)
Protocols for Creating Anyons and Defects via Gauging [0.0] 非アベリア・エノンのリボン作用素と対称性欠陥を実装する物理プロトコルを提供する。
これを、$mathbbZ_3$トーリック符号と$S_3$量子倍の値で示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:25:26 GMT)
Process Automation Architecture Using RFID for Transparent Voting Systems [0.0] 提案アーキテクチャは,RFIDによる投票者識別,投票キャスティング,セキュアなデータ送信を通じて投票ワークフローを自動化する。
タンパー保護監視機構は、各セッションを時間スタンプ付きデジタル署名で記録し、監査可能性とデータの整合性を確保する。
リアルタイム監視とセキュアなプロセス制御モジュールの統合により、選挙当局はデータロギングの自動化、異常の検出、システムの完全性検証を動的に行うことができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:43:51 GMT)
Prediction of Sea Ice Velocity and Concentration in the Arctic Ocean using Physics-informed Neural Network [0.0] 我々は,海氷の物理知識を機械学習モデルに統合するための物理情報ニューラルネットワーク(PINN)戦略を開発した。
我々のPINNモデルは、海氷速度(SIV)と海氷濃度(SIC)の予測において、完全なデータ駆動モデルよりも優れている。
PINNのアプローチは、特に融解期と早期凍結期および高速で動く氷地域におけるSIC予測を改善する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:10:01 GMT)
Patch of Invisibility: Naturalistic Physical Black-Box Adversarial Attacks on Object Detectors [0.0] ブラックボックス・ナチュラル・パッチ (Black-Box Naturalistic Patch) は、対象検出器の対向パッチを生成する、直接的、ブラックボックス、自然主義、勾配のない手法である。
提案手法は, テストした他のブラックボックス手法よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 05:49:56 GMT)
Participatory design: A systematic review and insights for future practice [0.0] 利害関係者の密接な関与を利用する反復的で柔軟なデザインプロセスである、参加型デザインは、デザインの分野にわたって利用されつつある。
参加型デザイン(PD)に移行する実践者の増加に伴い、厳格に定義されなくなった。
この体系的なレビューは、今日の実践者が過去の参加型デザインプロセスから学習を合成し、PDの今後の利用を知らせ、改善するものである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:38:56 GMT)
Optomechanical crystal in light-resilient quantum ground state [0.0] レーザ光に対するレジリエンスを改善したチップスケール無放出シリコン光学結晶空洞を低温で動作させる。
時間分解測定により、機械的崩壊時間によって制御される急激な初期熱化が明らかになった。
その結果、チップ上のリリースフリーシステムは、低ノイズで高出力の古典的および量子電気光学の経路として有効である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:55:02 GMT)
Optimal Convergence Rate of Lie-Trotter Approximation for Quantum Thermal Averages [0.0] Lie--Trotter 積公式は量子分割関数の基本的な近似である。
本稿では,この近似を2つの鍵系にまたがる定量的な誤差解析を行う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:21:07 GMT)
On the difference between thermalization in open and isolated quantum systems: a case study [0.0] 分離された (IQS) と開 (OQS) の熱化へのアプローチはいまだに不透明である。
ここでは、2つのパラダイムの根本的な違いは、長い時間と熱力学の限界が取られる順序であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:25:41 GMT)
Non-stabilizerness as a Diagnostic of Criticality and Exceptional Points in Non-Hermitian Spin Chains [0.0] 我々は、非エルミート量子多体系における臨界性と例外点を理解するために、非安定化剤性(マジック'としても知られる)について検討する。
以上の結果から,マジックは相転移の特異かつモデル特異的な兆候を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:37:44 GMT)
Non-abelian thermal gauge potentials for high spin cold atom gases [0.0] 高スピンのボースコールド原子ガスに対するスピノルボルツマン方程式を導出する。
温度依存性のスピノル減衰力を得ることができ、非アーベル熱ゲージ電位と関連付けることができる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:09:59 GMT)
Noise-induced decoherence-free zones for anyons [0.0] 固定パラメータから変動量への交換位相の促進を行う異種システムのためのフレームワークを開発する。
保護モードは、常に$thetastar = pi/2$というデファを最小化し、$D$の特定の形式とは無関係であることを示す。
これは、ノイズの多い異音系におけるコヒーレンスを最適化するための単純な設計規則を強調している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:14:46 GMT)
Neural Bayes estimation and selection for complex bivariate extremal dependence models [0.0] Likelihood-freeアプローチは、複雑な依存モデルに対する推論を行うのに魅力的である。
ベイズ推定器を近似するためにニューラルネットワークを利用するアプローチに焦点を当てる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:01:20 GMT)
Multimode rotationally symmetric bosonic codes from group-theoretic construction [0.0] 我々は[Phys. Rev. Lett. 133, 240603 (2024) の群論的枠組みに着想を得た多モード対称ボソニック符号の新しい族を導入する。
我々の構成は、複数のモードにわたる回転対称性を保ち、完全なパウリ群の線形光学的実装を可能にする。
我々は2モード二項符号のインスタンスを解析的に構築し、数値的にベンチマークし、単モードの回転対称なボソニック符号とは異なり、これらの符号は劣化防止と光子損失のトレードオフを示さないことを示した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:15:56 GMT)
Multimode Qubit-Conditional Operations via Generalized Cross-Resonance [0.0] 我々は、クロス共振駆動を一般化されたマルチモードスキームに拡張することにより、シングルモードおよびマルチモードキュービット条件演算を生成する。
マルチモードキュービット条件付き継手変位,ビームスプリッタおよび2モードスクイーズ操作を導出する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:46:25 GMT)
Microscale Sensing with Strongly Interacting NV Ensembles at High Fields [0.0] NVアンサンブルにおける双極子-双極子結合を効果的に抑制しつつ、高次元シナリオにおけるNMR信号を検出する方法を提案する。
このアプローチは高ドープダイヤモンド基板と高磁場を組み合わせることで感度を高める。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:24:56 GMT)
Measuring Reasoning in LLMs: a New Dialectical Angle [0.0] 本稿では,言語モデルの推論を弁証学で評価する構造化フレームワークSIEVを提案する。
従来の評価とは異なり、SIEVはモデルが到達した結論だけでなく、どのように到達するかを評価する。
例えば、最近のモデルであるGPT-5-chatは、GSM上のSIEVで評価すると40ポイント以上(100点中)を失う。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 22:08:59 GMT)
Machine Vision-Based Surgical Lighting System:Design and Implementation [0.0] YOLOモデルは、手術シーンをシミュレートした注釈付き画像からなる検証セットで96.7%のmAP@50を達成する。
このマシンビジョンベースのソリューションは、外科医の身体的負担を軽減し、照明の一貫性を改善し、手術結果の改善をサポートする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:22:45 GMT)
Machine Learning for Early Detection of Meningitis: Stacked Ensemble Learning with EHR Data [0.0] 我々は,現実のER (Emergency Room) のシナリオをシミュレートし,髄膜炎の診断に挑戦する条件を作成した。
本稿では,エンサンブルラーニング(Ensemble Learning)を用いた髄膜炎の今後のAIによる診断手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 03:37:32 GMT)
Localist LLMs with Recruitment Learning [0.0] 連続的に調整可能な内部表現を持つ大規模言語モデルを訓練するための新しいフレームワークを提案する。
主な革新は,(1) モデルの再訓練を必要とせず,訓練と推論の双方において局所化の度合いを動的に制御する局所性ダイヤル,(2) セマンティックブロックを必要に応じて適応的に割り当てる情報理論的採用機構である。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:58:34 GMT)
Local Invariance of Divergence-based Quantum Information Measures [0.0] 量子情報量(quantum information amount)は、量子情報科学における量子システムとプロトコルの特徴付けに不可欠である。
一般化された発散に基づく情報測度の種類を特定し、局所的あるいは単体的変換の下でそれらの不変性を証明した。
本研究は,量子情報処理分野にまたがる応用により,多くの運用関連情報測度を特徴付け,計算する能力を向上させるものである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:51:53 GMT)
Lieb-Mattis states for robust entangled differential phase sensing [0.0] 絡み合った量子センサーは、標準的な量子限界を超えることができる。
差動信号推定のための2ノードエンタングルメント型量子センサネットワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:22:25 GMT)
Leveraging AV1 motion vectors for Fast and Dense Feature Matching [0.0] 短いビデオでは、圧縮されたドメインのフロントエンドは、はるかに少ないCPUを使用しながらシーケンシャルSIFTと互換性があり、競合するペアの幾何とより密にマッチする。
その結果、圧縮ドメイン対応は、完全なパイプラインでのスケーリングへの明確な経路を持つ、実用的でリソース効率のよいフロントエンドであることが示されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:22:52 GMT)
Learning by Watching: A Review of Video-based Learning Approaches for Robot Manipulation [0.0] 最近の研究は、オンラインで公開されている豊富な動画を受動的に視聴することで、学習操作のスキルを探求している。
本調査では,映像特徴表現学習技術,物価理解,3次元ハンド・ボディ・モデリング,大規模ロボット資源などの基礎を概観する。
ロボット操作の一般化とサンプル効率を高めるために,大規模な人的映像を観察することのみから学習する方法を論じる。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:38:53 GMT)
Label Indeterminacy in AI & Law [0.0] 法的な機械学習アプリケーションはラベルの不確定性を考慮する必要があると我々は主張する。
トレーニング中にラベルを構築する方法がモデル動作に大きく影響することを示します。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:58:07 GMT)
Is quantum mechanics merely a theory for us? [0.0] 本稿では,主観的主観的問題を扱うエージェント中心の計測基準を開発する。
量子力学は、物理的世界との相互作用の、慣用的に人間的な記述として理解されている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:13:56 GMT)
Invertible ResNets for Inverse Imaging Problems: Competitive Performance with Provable Regularization Properties [0.0] 学習に基づく手法は、逆問題の解法において顕著な性能を示した。
これらのアプローチは理論的な保証を欠くことが多く、医療画像のようなセンシティブな応用に不可欠である。
我々は,iResNet固有の安定性と可逆性の利点を,様々なシナリオにおいて高いロバスト性を示すことによって数値的に示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:13:21 GMT)
Intrinsic Dimensionality of Fermi-Pasta-Ulam-Tsingou High-Dimensional Trajectories Through Manifold Learning: A Linear Approach [0.0] フェルミ・パスタ・ウラム・チンゴウ(FPUT)モデルの高次元軌跡の内在次元$mast$を推定するために,データ駆動型手法を提案する。
モデルの非線形性により$mast$が増加することが判明した。
弱い非線形状態において、第1モードを刺激することで軌道が変化する場合、参加比は$mast = 2, 3$と推定される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:45:23 GMT)
Interplay of Noise and Reservoir-induced Decoherence in Persistent Currents [0.0] 強結合リングが障害を受ける非平衡条件下での持続電流の運命と各部位に付着するフェルミオン貯水池について検討した。
非単調な振る舞いを示し、デコヒーレンス(decoherence)の2つの異なるメカニズムを示唆している。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:02:32 GMT)
Inference of Deterministic Finite Automata via Q-Learning [0.0] 本稿では、決定論的有限オートマトンを受動的に推定するために、よく知られた強化学習アルゴリズムであるQ-learningを用いて検討する。
これは、状態-作用対を報酬にマッピングする学習されたQ-函数が有限領域上のDFAの遷移関数として再解釈できるという中心的な洞察に基づいている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:23:36 GMT)
Incomplete yet existent objects: a Nuclear Meinongian approach to quantum metaphysical indeterminacy [0.0] 本稿では, パーソンズ核分裂論の観点から, 量子メタ物理不確定性を読み取ることを提案する。
我々はIENPを廃止し、その結果の代謝学的および代謝学的結果について議論する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:22:29 GMT)
In-situ Autoguidance: Eliciting Self-Correction in Diffusion Models [0.0] In-situ Autoguidanceは補助的なコンポーネントなしでモデル自体からガイダンスを提供する。
このゼロコストアプローチが実現可能であるだけでなく、コスト効率向上のための強力なベースラインを確立することを実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:06:50 GMT)
Improving Cross-Patient Generalization in Parkinson's Disease Detection through Chunk-Based Analysis of Hand-Drawn Patterns [0.0] 2段階からなるパーキンソン病を検出するための新しいアプローチを提案する。
第1ステージは、描画タイプに基づいて分類される。
第2段階は画像から必要な特徴を抽出し、パーキンソン病を検出する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:18:36 GMT)
ImaGGen: Zero-Shot Generation of Co-Speech Semantic Gestures Grounded in Language and Image Input [0.0] 本稿では, 音声合成における中核的な課題として, 言語発話にセマンティックに一貫性のある, 象徴的, あるいは難解なジェスチャーを生成することを挙げる。
我々は、与えられた言語入力からジェスチャーを生成するゼロショットシステムを導入し、さらに手動のアノテーションや人間の介入なしに、想像的な入力によって通知される。
本結果は,表現的かつ協調的な仮想エージェントやアバターを作成する上で,文脈認識型セマンティックジェスチャの重要性を強調した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:01:56 GMT)
Human-AI Interactions: Cognitive, Behavioral, and Emotional Impacts [0.0] 過度な信頼感、認知的オフロード、社会的および感情的な操作、および人間の代理店の曖昧な劣化と判断の潜在的なリスクが強調される。
観察によると、AIは記憶、創造性、エンゲージメントを大幅に向上させることができるが、批判的思考の減少、スキルの侵食、不安の増加といったリスクももたらしている。
本稿は、人間中心の新たなリスクと利益のバランスをとるための、縦断的研究と評価フレームワークのギャップを浮き彫りにして、責任とコンテキストを意識したAI設計の必要性を明らかにすることを目的としている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:06:46 GMT)
Handling Extreme Class Imbalance: Using GANs in Data Augmentation for Suicide Prediction [0.0] 十分な正のサンプルを持つ実データはまれであり、極端なクラス不均衡を引き起こす。
我々は機械学習(ML)を利用して、Geneversarative Adrial Networks(GAN)のようなモデルとディープラーニング(DL)技術を構築しました。
GANは自殺防止モデリングを支援するために合成データを生成する上で重要な役割を果たした。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:35:39 GMT)
Geometry-Driven Charge and Spin Transport in $\beta12$ Borophene Quantum Dots [0.0] ボローフェン量子ドットの電荷とスピン輸送に幾何がどのように影響するかに関する理論的研究がなされている。
本研究は、円盤と半無限ジグザグとアームチェアボロフェンナノリボン鉛とを繋ぐ通常の六角形領域を含む2つの異なる中央領域について検討した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:55:19 GMT)
Generating Individual Travel Diaries Using Large Language Models Informed by Census and Land-Use Data [0.0] 本研究では,エージェント・ベース・トランスポート・モデルにおいて,個々の旅行日誌を生成するための大規模言語モデルを提案する。
この方法は,オープンソースであるAmerican Community Survey (ACS) と Smart Location Database (SLD) のデータからペルソナライズし,直接的なプロンプトを通じて日記を合成する。
本研究は,コネチカット州交通研究(CSTS)日記に対して検証された4つの指標(Trip Count Score, Interval Score, Purpose Score, Mode Score)からなる新しい1対コホートリアリズムスコアを特徴とする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:59:26 GMT)
Functional Distribution Networks (FDN) [0.0] 本稿では,ネットワーク重みに対する入力条件付き分布であるFDN(Functional Distribution Networks)について述べる。
我々は,外挿からきれいに分離し,OOD衛生チェックをストレスする評価プロトコルを提案する。
我々は、マッチングパラメータと更新予算の下で、強いベイズ、アンサンブル、ドロップアウト、ハイパーネットワークのベースラインをベンチマークし、精度、キャリブレーション、シフトアウェアネスを評価する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 17:52:42 GMT)
Fitness landscape for quantum state tomography from neutron scattering [0.0] 最近、2スピン相互作用における静的構造因子と量子基底状態の直接接続が証明された。
これは中性子散乱による量子状態トモグラフィーの可能性を示している。
構造因子の平均2乗距離と関連する状態との線形関係を見出した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 15:33:56 GMT)
Fault-tolerant dynamically-decoupled hyper-Ramsey spectroscopy of ultra-narrow clock transitions [0.0] ハイパーランジープロトコルは、超狭光クロック遷移の探索において、ACスタークシフトを効果的に低減する。
動的デカップリングを取り入れることで、これらの制限に対処する。
フォールトトレラントで動的に分離されたSU(2)ハイパークロックは、普遍的でノイズ耐性の量子センサに向けた重要なステップである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:42:20 GMT)
Exploiting the Potential of Linearity in Automatic Differentiation and Computational Cryptography [0.0] 線形性の概念は数学と計算機科学の両方において中心的な役割を果たす。
この論文では線形性に基づいたプログラミングパラダイムのモデル化にLinear Logic (LL) を用いることについて論じている。
ADLLとCryptoBLLの2つの部分から構成される。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:02:48 GMT)
Experimental preparation of W states through many-body physics on a quantum simulator [0.0] W$状態は、二部分と多部分の両方の絡み合いを持つ量子相関状態である。
トポロジカルリングフラストレーションを利用してこれらの状態を生成するプロトコルを提案する。
プログラム可能なRydberg原子アレイ上で、ルビジウム原子の多体$W$状態の生成に成功した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:00:07 GMT)
Evaluating LLMs for Career Guidance: Comparative Analysis of Computing Competency Recommendations Across Ten African Countries [0.0] 本研究では,アフリカ10か国における6つの大規模言語モデルが,エントリーレベルのコンピューティングキャリアの期待をどう表現するかを検討した。
クラウドコンピューティングやプログラミングのような技術的スキルは一貫して現れたが、モデルが非技術的能力にどう対処するかという点で顕著な違いが現れた。
オープンソースモデルは、コンテキスト認識の強化と、技術的スキルと専門スキルのバランスの向上を示し、10カ国中9カ国でトップスコアを獲得した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:04:43 GMT)
Entanglement in Elastic Electron Scattering: Perturbation theory misses fundamental aspects of Bragg scattering [0.0] 弾性電子散乱は、原子スケールで材料を研究する主要な手段の1つである。
プローブビームと試料の相互作用が両システム間の絡み合いをもたらすことを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:21:52 GMT)
Entanglement Suppression in Quantum Field Theories: Holography, Chaos, and Mixed-State Dynamics [0.0] 最近の研究により、共形場理論における絡み合いエントロピー成長は、局所作用素のクエンチが混合状態励起と相互作用する場合に抑制できることが明らかになった。
この現象は、アンファングル化抑制と呼ばれ、探索のためのいくつかの有望な方向を開く。
より高次元への一般化、時間外相関器(OTOC)による量子カオスの役割、可積分モデルの抑制の欠如、混合性のプローブとしての絡み合う負性の拡張、AdSの散乱断面積に基づく幾何学的解釈の5つの異なる研究軌道を概説する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:56:17 GMT)
Entanglement Sum Rule from Higher-Form Symmetries [0.0] 有限アーベル高次対称性を持つ$(d-1)$次元量子格子モデルの絡み合い和則を証明する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:03:12 GMT)
Enhancing mortality prediction in cardiac arrest ICU patients through meta-modeling of structured clinical data from MIMIC-IV [0.0] 本研究では、構造化された臨床データと構造化されていない情報を統合する機械学習モデルを開発し、評価する。
機能選択にはLASSOとXGBoostを使用しました。
構造化データとテキスト入力を組み合わせた最終ロジスティック回帰モデルは、構造化データのみを使用する場合の0.753に対して、0.918のAUCを達成したが、相対的な改善は22%であった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:56:45 GMT)
DynaQuery: A Self-Adapting Framework for Querying Structured and Multimodal Data [0.0] 構造化されていないデータを問合せするための統合された自己適応フレームワークであるDynaQueryを紹介します。
DynaQueryの中心にIntrospection and Linking Engine (SILE)がある。これは、スキーマリンクをファーストクラスのクエリ計画フェーズに高める新しいシステムプリミティブである。
我々の研究は、堅牢で適応性があり、予測可能である自然言語データベースインタフェースを開発するための検証済みのアーキテクチャ基盤を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 19:02:35 GMT)
Doubly Robust Estimation of Causal Effects in Strategic Equilibrium Systems [0.0] 本稿では,戦略的環境における因果推論の新しいフレームワークであるSDR (Strategic Doubly Robust) 推定手法を紹介する。
このフレームワークは、エージェントが介入に対して戦略的に応答するとき、信頼できる因果推論に原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:12:08 GMT)
Double-quantum-dot Andreev molecules: Phase diagrams and critical evaluation of effective models [0.0] 本研究は、並列二重量子ドットアンドレーフ分子の相図を体系的に研究する。
地表面状態の進化を, 水平変形の広いパラメータ空間, 超伝導ギャップの大きさ, 鉛結合, ドット間結合強度にマップする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:16:16 GMT)
Double electron resonance with two ensembles of nitrogen-vacancy centers in diamond [0.0] ダイヤモンド中の窒素空孔(NV)中心は、多くのセンサーの開発に広く利用されている。
動的二重電子-電子共鳴配列を用いたNV-NV相互作用の系統的研究を行った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:00:52 GMT)
Diagnosing Representation Dynamics in NER Model Extension [0.0] 標準セマンティクスと新しいパターンベースのPIIに基づいてBERTモデルを微調整すると、元のクラスでは最小限の劣化が生じる。
我々は「逆Oタグ表現ドリフト」を同定する
この研究は、NERモデル適応の機械的診断、特徴独立性の強調、表現重複、および'O'タグの可塑性を提供する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:53:42 GMT)
Detecting streaks in smart telescopes images with Deep Learning [0.0] 夜空に衛星が存在することは、天体観測中に撮影された画像にストリークを導入する効果がある。
我々は2022年3月から2023年2月までに、さまざまなDeep Learningアプローチを用いて、スマート望遠鏡を用いて、生の天文学的データのストリークを検出する方法を紹介した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:43:09 GMT)
Deep-learning-based continuous attacks on quantum key distribution protocols [0.0] 本稿では,textitDeep-learning-based continuous attack (DLCA) と呼ばれる新たな個人攻撃方式を設計する。
最小限のモデルとして,通信チャネルに固有の雑音を持つBB84プロトコルに適用した場合の性能を示す。
以上の結果から,我々の攻撃性能は,標準的なインターセプト・アンド・レスエンド攻撃と最適な個別攻撃,すなわち位相共変量子クローン器との間にあることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:43:41 GMT)
Data-Driven Framework Development for Public Space Quality Assessment [0.0] 本研究では、公共空間の質を評価するための体系的・データ駆動型フレームワークを開発する。
我々は157のピアレビュー研究から抽出した1,207の質因子を階層分類に変換した。
その結果生まれたフレームワークは、14のカテゴリと66のサブカテゴリで1,029のユニークな品質要素をまとめている。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:39:15 GMT)
Curriculum Learning with Synthetic Data for Enhanced Pulmonary Nodule Detection in Chest Radiographs [0.0] 本研究は, カリキュラム学習と総合的拡張を統合することで, 難治性肺結節の検出が促進されるかどうかを検証した。
FPN(Feature Pyramid Network)バックボーンを備えた高速なR-CNNは、ハイブリッドデータセットでトレーニングされた。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:02:50 GMT)
CourtGuard: A Local, Multiagent Prompt Injection Classifier [0.0] プロンプトインジェクション攻撃は、大きな言語モデル(LLM)が機密データを漏洩させ、誤情報を広げ、有害な振る舞いを示す可能性がある。
このような攻撃に対して防御するために,ローカルに実行可能なマルチエージェントインジェクションインジェクション分類器であるCourtGuardを提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 20:10:06 GMT)
CosmoCore Affective Dream-Replay Reinforcement Learning for Code Generation [0.0] 大規模言語モデルにおけるコード生成を強化するために感情信号を統合する強化学習アーキテクチャであるCosmoCoreを紹介する。
高負の(クレンジ)エピソードは、政治外の更新中に5倍のリプレイのためにドリームキューで優先順位付けされ、低サプライズの成功は、過信やバッファの肥大を防ぐためにプルーニングされる。
CosmoCoreは幻覚コード(例えば構文エラーや論理的バグ)を48%削減し、自己訂正を45%高速化する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 06:50:09 GMT)
Conveying Meaning through Gestures: An Investigation into Semantic Co-Speech Gesture Generation [0.0] 本研究では,共同音声ジェスチャ生成のための2つのフレームワークであるAQ-GTとその意味的に拡張された変種AQ-GT-aについて検討する。
SAGA空間コミュニケーションコーパスの文を用いて,概念認識と人間類似性の評価を行った。
その結果,意味的アノテーションとパフォーマンスの関係は曖昧であった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 14:47:56 GMT)
Computation of the Smooth Max-Mutual Information via Semidefinite Programming [0.0] 任意の次元における二部量子状態の量子スムーズな最大ミューチュアル情報$Ivarepsilon_max(rho_AB)$を計算するための反復アルゴリズムを提案する。
我々の手法の中心は、原始的および双対的な定式化を確立し、強い双対性を証明する新しいSDPである。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:58:27 GMT)
Complementarity-based complementarity: the choice of mutually unbiased observables shapes quantum uncertainty relations [0.0] 不確実性関係は観測可能なものの選択に依存する可能性があることを示す。
5次元量子系における3つの MUB の異なる集合の選択は、異なる不確実性境界をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:08:51 GMT)
Chiral light from an emitter coupled to an achiral particle via the Purcell effect [0.0] キラル光は、特定の条件下で点放出体が表面プラズモンモード(SPM)に結合されるときに発生する。
金ナノロッドからの電子ビーム誘起陰極発光によるこの効果を実験的に実証した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:39:10 GMT)
Charge pumps, pivot Hamiltonians and symmetry-protected topological phases [0.0] 一般化された電荷ポンプは対称ギャップハミルトニアン空間における自明なループに対する位相的障害物である。
このようなポンプ上の穏やかな条件が与えられた場合、関連するループは、対称性が保護された位相位相位相でなければならない高対称性の点を持つことを示す。
非自明なポンプが真のSPTにつながるのではなく、いまだに絡み合った表現-SPTに繋がる例を見つける。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 18:05:05 GMT)
CayleyPy RL: Pathfinding and Reinforcement Learning on Cayley Graphs [0.0] 本論文は,大規模グラフ上でのパスフィリングのための効率的な人工知能ベースのアプローチの開発に関する一連の研究の2番目である。
本稿では, 強化学習手法と, 第1報より直接拡散距離法を併用した新しい手法を提案する。
我々は、OEIS-A186783予想に対して、この直径が機械学習と数学的手法によりn(n-1)/2に等しいという強い支持を与える。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 21:12:08 GMT)
Can Transformer Memory Be Corrupted? Investigating Cache-Side Vulnerabilities in Large Language Models [0.0] 本稿では,制御された大きさと周波数で鍵ベクトルをキャッシュするモジュラーフレームワークであるMalicious Token Injection(MTI)を紹介する。
実験の結果,MTI は GPT-2 および LLaMA-2/7B の次トーケン分布と下流タスク性能を著しく変化させ,検索強化およびエージェント推論パイプラインの安定化を図った。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 02:04:18 GMT)
CBINNS: Cancer Biology-Informed Neural Network for Unknown Parameter Estimation and Missing Physics Identification [0.0] 複雑な腫瘍微小環境における腫瘍免疫相互作用の力学は、通常の微分方程式や偏微分方程式の系を用いてモデル化される。
本研究では, 方程式系の未知のパラメータを推定するために, 癌生物学インフォームドニューラルネットワークモデルを開発した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 04:33:00 GMT)
Automatic Prompt Generation via Adaptive Selection of Prompting Techniques [0.0] 本稿では,ユーザの抽象的なタスク記述に基づいて,タスク適切なプロンプト手法を適応的に選択する手法を提案する。
提案手法は,多様なタスクにまたがる意味的類似性を特徴とする,タスククラスタを関連付ける知識ベースを構築する。
BIG-Bench Extra Hardによる23のタスクに対する提案手法の実験的評価は,標準的なプロンプトよりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:28:23 GMT)
Augmented Web Usage Mining and User Experience Optimization with CAWAL's Enriched Analytics Data [0.0] 本研究では、Web利用のマイニングを強化し、UXを改善するための方法論であるAWUM(Augmented Web Usage Mining)を紹介する。
1ヶ月に120万以上のセッション記録(8.5GBのデータ)が処理され、豊富なデータセットに変換された。
結果、87.16%のセッションが複数のページで行われ、98.05%のページビューに寄与し、40%のユーザが様々なサービスにアクセスし、50%が安全な出口を選んだ。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:41:08 GMT)
Anyon condensation in mixed-state topological order [0.0] 混合状態トポロジカル秩序における凝縮について論じる。
凝縮可能なエノンは連結な'eale環によって与えられる。
いくつかの凝縮は純粋な状態位相順序をもたらす。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:08:26 GMT)
Annotating the Chain-of-Thought: A Behavior-Labeled Dataset for AI Safety [0.0] 本稿では,安全行動のアクティベーションに基づくモニタリングを可能にする文レベルのラベル付きデータセットを提案する。
本データセットは,安全性に関する懸念やユーザ意図に対する憶測などの安全行動の文レベルのアノテーションを用いた推論シーケンスを含む。
モデルアクティベーションにおける安全行動の検出とステアリングを行う表現を抽出することで,データセットの有用性を実証する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:12:12 GMT)
Analysis of Input-Output Mappings in Coinjoin Transactions with Arbitrary Values [0.0] Coinjoinプロトコルは、コラボレーティブトランザクションを通じて、BitcoinおよびBitcoinライクなブロックチェーンのトランザクションプライバシを高めることを目的としている。
結果として生じるプライバシゲインを見積もるのは、さまざまな影響要因と大きな計算複雑性のため、決定的だが未解決の問題である。
我々は、BlockSciオンチェーン分析ソフトウェアをコインジョイントランザクションに適用し、平均的(10-50%)混合後の匿名化セットサイズが減少することを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 08:17:25 GMT)
Absolute abstraction: a renormalisation group approach [0.0] 深度だけでは真の抽象表現を開発するには不十分である、と我々は主張する。
私たちは、この変換の固定点である階層的特徴モデル(hierarchical Feature Model)を、完全に抽象的な表現の候補としています。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 16:15:50 GMT)
AWARE: Audio Watermarking with Adversarial Resistance to Edits [0.0] AWARE(Audio Watermarking with Adrial Resistance to Edits)は、アタック・リバーサ・スタックや手作りの微分可能な歪みへの依存を避けるアプローチである。
埋め込みは、レベルプロポーショナル予算の下で、時間周波数領域の逆最適化によって得られる。
AWAREは、PESQ/STOI (High Audio Quality and Speech Intelligibility) と、様々なオーディオ編集においてBERを一貫して低くする。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 13:10:52 GMT)
A source of heralded atom-photon entanglement for quantum networking [0.0] 我々は、単一原子の2光子放射を2つの光ファイバーキャビティに利用することにより、送信ノードに絡み合うヘラルドを実装した。
ヘラルディングにより, 繊維内での原子-光子の絡み合いは, それぞれ68(3)%, 87(2)%に向上することがわかった。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 09:02:00 GMT)
A Random Matrix Theory of Pauli Tomography [0.0] QST再構成における Deltahatrho = hatrho-hatrhoprime$ の誤差の詳細な特徴は、量子論と実験において明らかに重要である。
我々は、情報完全ベースにおける状態トモグラフィーの完全ランダム行列理論(RMT)を考案した。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 11:10:49 GMT)
A Quantum Algorithm for the Finite Element Method [0.0] 有限要素法(有限要素法)(FEM)は偏微分方程式(PDE)の解法である
有限要素法のためのフォールトトレラント時代量子アルゴリズムであるtextbfQu-FEM$を提案する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 23:00:12 GMT)
A Prototypical Network with an Attention-based Encoder for Drivers Identification Application [0.0] 近年,特にデータ駆動アプリケーションにおいて,ドライバの識別が注目されている。
本研究では,注目型エンコーダ(AttEnc)を用いたディープラーニングニューラルネットワークアーキテクチャを提案する。
AttEncはドライバー識別にアテンションメカニズムを使用し、現在のメソッドよりも少ないモデルパラメータを使用する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 07:39:33 GMT)
A New Digital Divide? Coder Worldviews, the Slop Economy, and Democracy in the Age of AI [0.0] シリコンバレーのソフトウェア開発者に関する最初の調査を紹介する。
その結果、ほとんどの開発者は自分たちの製品が市民の自由と政治的言論に影響を与えることを認識していることがわかった。
本研究は、インターネットアクセスではなく、情報品質の新たなデジタルディビジョンの文脈において、これらの知見を考察する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 12:31:39 GMT)
A Conditional Diffusion Model for Probabilistic Prediction of Battery Capacity Degradation [0.0] 本稿では,この課題に対処するために,機能工学とディープラーニングを統合したDiffusion U-Net with Attention (CDUA)と呼ばれる新しい手法を提案する。
提案手法では,時系列予測に拡散に基づく生成モデルを用い,注意機構を取り入れて予測性能を向上させる。
実世界の車両データに対する実験的検証により、提案したCDUAモデルは相対平均絶対誤差(MAE)が0.94%、相対平均正方形誤差(RMSE)が1.14%、相対幅が3.74%であることを示す。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:56:28 GMT)
A Compressive Sensing Inspired Monte-Carlo Method for Combinatorial Optimization [0.0] 圧縮可能と仮定される最適化問題の解法として,モンテカルロ圧縮最適化アルゴリズムを提案する。
本アルゴリズムの実用性は,利用可能な計算資源にパラメータを調整できることによって向上する。
論文参考訳(メタデータ) (Mon, 20 Oct 2025 10:38:53 GMT)