EarthMind: Leveraging Cross-Sensor Data for Advanced Earth Observation Interpretation with a Unified Multimodal LLM [103.8] 地球観測(EO)データ分析は、環境と人間の動態のモニタリングに不可欠である。
最近のMultimodal Large Language Models (MLLM) は、EO理解の可能性を秘めているが、シングルセンサー入力に限定されている。
我々は、シングルセンサーとクロスセンサーの両方の入力を処理する統合視覚言語フレームワークであるEarthMindを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:14:53 GMT)
The Clever Hans Mirage: A Comprehensive Survey on Spurious Correlations in Machine Learning [99.0] 機械学習モデルは、入力の非本質的特徴と対応するラベルの間の急激な相関に敏感である。
本稿では,機械学習モデルにおける突発的相関に対処する既存の最先端手法の詳細な分類法とともに,この問題の包括的調査を行う。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:05:52 GMT)
SparseD: Sparse Attention for Diffusion Language Models [98.1] 拡散言語モデル(DLM)は自己回帰モデル(AR)に代わる有望な代替手段を提供する
既存のオープンソースDLMは、高い推論遅延に悩まされている。
DLMのための新しいスパースアテンション手法であるスパースDを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:10:10 GMT)
LLaVA-OneVision-1.5: Fully Open Framework for Democratized Multimodal Training [92.9] LLaVA-OneVision-1.5はLMMの新しいファミリーである
これは、計算コストと財政コストを大幅に削減して最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:52:55 GMT)
Interaction Field Matching: Overcoming Limitations of Electrostatic Models [85.9] 静電場整合(EFM)は、近年、電気コンデンサのアイデアを用いて、データ生成と転送のための物理に着想を得たパラダイムとして登場した。
我々は、静電気以外の一般的な相互作用場を利用できるEMFの一般化であるInteraction Field Matching (IFM)を提案する。
一連の玩具および画像データ転送問題に対して,その性能を示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:45:05 GMT)
Electric Currents for Discrete Data Generation [85.9] ECD$2$Gは電気工学理論に基づく離散的なデータ生成の先駆的手法である。
ECD$2$G法を説明するための概念実証実験を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:57:18 GMT)
LightFair: Towards an Efficient Alternative for Fair T2I Diffusion via Debiasing Pre-trained Text Encoders [84.4] 本稿では,テキストエンコーダの悪影響に対処して,公平なテキスト・画像拡散モデル(T2I DM)を実現するための,新しい軽量なアプローチを提案する。
T2I DMは複数のコンポーネントから構成されており、テキストエンコーダは最も微調整可能なフロントエンドモジュールである。
本手法は,SOTA脱バイアスをトレーニング負荷のわずか1/4ドルで達成し,サンプリング負荷がほぼ増加しない。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:46:39 GMT)
RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.4] 大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。
リスク概念空間を再構築する理論的枠組みを導入する。
マルチエージェント協調評価フレームワークRADARを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:35:32 GMT)
Visual CoT Makes VLMs Smarter but More Fragile [79.3] チェーン・オブ・ソート(CoT)技術は視覚言語モデル(VLM)における推論を著しく向上させた
Visual CoTは、興味のある領域のトリミングや注釈付けなどの明示的なビジュアル編集を推論プロセスに統合する。
視覚摂動下での視覚的CoTロバスト性の最初の体系的評価について述べる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:19:59 GMT)
SPELL: Self-Play Reinforcement Learning for evolving Long-Context Language Models [79.0] SPELLは、長文推論のためのスケーラブルでラベルなしの最適化を可能にする。
本稿では、文書長を徐々に向上させる自動カリキュラムと、モデルの進化する機能に質問の難しさを適応させる報奨関数を導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:08:10 GMT)
GUI-Shepherd: Reliable Process Reward and Verification for Long-Sequence GUI Tasks [75.5] 本稿では,エージェントを誘導するプロセス・リワード・モデルを提案する。
Gui-Shepherdは52ドル(約5,800円)のインタラクションからなるさまざまな大規模データセットでトレーニングされている。
GUIエージェントにおけるプロセス管理の体系的な研究を最初に行った。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:35:16 GMT)
Knowledge Homophily in Large Language Models [75.1] 大規模言語モデル(LLM)における類似知識のホモフィリパターンについて検討する。
我々は LLM の知識を三重項レベルと実体レベルの両方の知識チェックを通じてグラフ表現にマッピングする。
このホモフィリ原理により、三重項の実体レベルの知識度スコアを推定するグラフニューラルネットワーク(GNN)回帰モデルを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:40:27 GMT)
Estimating Time Series Foundation Model Transferability via In-Context Learning [74.7] 時系列基礎モデル(TSFM)は、大規模な事前訓練を通じて強力なゼロショット予測を提供する。
微調整は、公開データに制限のあるドメインのパフォーマンス向上に依然として不可欠である。
モデル選択をコンテキスト内学習問題として再キャストする転送可能性推定フレームワークであるTimeTicを紹介する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:07:13 GMT)
Do Larger Language Models Generalize Better? A Scaling Law for Implicit Reasoning at Pretraining Time [73.2] この研究は、モデルサイズのスケーリングによる直感的効果を示し、言語モデル(LM)におけるスケーリングと推論の関係に関する新たな洞察を提供する。
我々は,実世界の大規模知識グラフの構造と分布を再現する合成暗黙のマルチホップ推論環境において,ゼロからLMを事前学習する。
次に、実世界の事前学習における暗黙的推論の単純化とみなすことができるマルチホップ推論を必要とする、グラフの欠落したエッジを完遂するLMの能力を評価する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:01:31 GMT)
Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning [71.3] サンプルプルーニングとトークンプルーニングを戦略的に協調する統合フレームワークを提案する。
Q-Tuningは、トレーニングデータの12.5%しか使用せず、全データSFTベースラインに対する平均38%の改善を実現している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:27:38 GMT)
A Statistical Learning Perspective on Semi-dual Adversarial Neural Optimal Transport Solvers [70.4] 本稿では,ミニマックス二次OT解法により得られた近似OT写像の一般化誤差の上限を確立する。
解析は2次OTに焦点をあてるが、同様の境界は一般的なOTの場合に導出され、将来の研究に期待できる方向を踏むことができると信じている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:46:45 GMT)
Mix-Ecom: Towards Mixed-Type E-Commerce Dialogues with Complex Domain Rules [69.0] この研究はまず、Mix-EComと呼ばれる新しいコーパスを紹介した。これは、実際のカスタマーサービス対話とポストプロセッシングに基づいて構築され、ユーザのプライバシを削除し、CoTプロセスを追加する。
具体的には、4つの対話型(QA,レコメンデーション,タスク指向対話,チャット)、3つのeコマースタスク型(プレセール,ロジスティクス,アフターセール)、82のeコマースルールを含んでいる。
その結果、現在のeコマースエージェントはeコマース対話を扱う十分な能力を持っていないことがわかった。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:19:27 GMT)
Fast Thinking for Large Language Models [67.7] 我々は、訓練中にのみ簡潔なCoTスケッチを使用して個別戦略事前のコードブックを学習するフレームワークであるLatent Codebooks for Fast Thinkingを紹介した。
推論では、コードブックから抽出した少数の連続的思考スイッチのモデル条件を1パスにすることで、明確な推論トークンを生成することなく、戦略レベルのガイダンスを可能にする。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:19:48 GMT)
QuantSparse: Comprehensively Compressing Video Diffusion Transformer with Model Quantization and Attention Sparsification [67.2] 拡散変換器は素晴らしいビデオ生成能力を示すが、その計算とメモリの禁止コストは実際の展開を妨げる。
モデル量子化とアテンションスパシフィケーションは圧縮に有望な2つの方向であるが、それぞれがアグレッシブ圧縮の下で深刻な性能劣化を被っている。
モデル量子化と注意散布を統合した統合フレームワークである textbfQuantSparse を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:49:44 GMT)
Thread: A Logic-Based Data Organization Paradigm for How-To Question Answering with Retrieval Augmented Generation [65.5] ハウツー質問は意思決定に不可欠であり、動的でステップバイステップのレスポンスを必要とする。
我々は,ハウツー質問をより効果的に処理できる新しいデータ組織パラダイムThreadを提案する。
具体的には、「論理単位」(LU)という新たな知識を導入し、大きな言語モデルによって文書をより構造化され、疎結合なLUに変換する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:27:08 GMT)
FrameMind: Frame-Interleaved Chain-of-Thought for Video Reasoning via Reinforcement Learning [65.4] 現在のビデオ理解モデルは、各質問の特定の推論条件にかかわらず、固定されたフレームサンプリング戦略に依存し、所定の視覚入力を処理する。
この静的アプローチは、視覚的エビデンスを適応的に収集する能力を制限し、広範囲の時間的カバレッジやきめ細かい空間的詳細を必要とするタスクにおいて、最適以下のパフォーマンスをもたらす。
Frame-Interleaved Chain-of-Thought (FiCOT)を通して、モデルが推論中に視覚情報を動的に要求することを可能にする強化学習で訓練されたエンドツーエンドフレームワークであるFrameMindを紹介する。
従来のアプローチとは異なり、FrameMindは複数のターンで動作し、モデルがテキスト推論とアクティブな視覚知覚を交互に切り替え、ツールを使って抽出する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:59:43 GMT)
Efficient Multi-turn RL for GUI Agents via Decoupled Training and Adaptive Data Curation [65.4] 視覚言語モデル(VLM)に基づくGUIエージェントは複雑なタスクの自動化を約束するが、強化学習(RL)の適用において大きな課題に直面している。
異種モジュールを高度に非結合的に協調するGUIエージェントのための非結合エージェントRLトレーニングフレームワークであるDARTを提案する。
OSWorldのベンチマークでは、DART-GUI-7Bは42.13%のタスク成功率、14.61%の絶対ゲイン、オープンソースSOTAよりも7.34%高い。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:19:20 GMT)
3D-LATTE: Latent Space 3D Editing from Textual Instructions [64.8] 本研究では,ネイティブな3次元拡散モデルの潜在空間内で動作する学習自由な編集手法を提案する。
生成元からの3Dアテンションマップとソースオブジェクトをブレンドすることで、編集合成をガイドする。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:16:44 GMT)
Double Check My Desired Return: Transformer with Target Alignment for Offline Reinforcement Learning [64.6] 教師付き学習(RvS)による強化学習は、シーケンスモデリングタスクとしてオフラインRLをフレーム化する。
決定変換器(DT)は、実際の完了したリターンを特定のターゲットリターンと確実に整合させるのに苦労する。
そこで我々は,Offline RLの目標アライメントによる変換器の二重チェックを行う新しいアプローチであるDoctorを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:32:52 GMT)
DiffPCN: Latent Diffusion Model Based on Multi-view Depth Images for Point Cloud Completion [63.9] DiffPCN(DiffPCN)を提案する。
提案手法は, 粗い点雲を発生させる初期段階と, 品質を向上する改良段階の2段階からなる。
実験の結果,DiffPCNは幾何的精度と形状の完全性において最先端の性能を発揮することがわかった。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:05:43 GMT)
Representation Entanglement for Generation: Training Diffusion Transformers Is Much Easier Than You Think [63.3] REPAとその変種は、事前訓練されたモデルから外部の視覚表現を取り入れることで、拡散モデルのトレーニング課題を効果的に軽減する。
偏見推論過程全体において欠落している外部アライメントは、識別的表現の可能性を完全に活用するに足らないと我々は主張する。
本稿では,事前学習した基礎モデルから,低レベル画像ラテントを1つの高レベルクラストークンで絡み合わせるRepresentation Entanglement for Generation (REG)を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:19:38 GMT)
Analyzing and Evaluating Unbiased Language Model Watermark [63.0] UWbenchは、偏りのない透かし手法の原理的評価を専門とする、最初のオープンソースベンチマークである。
我々の枠組みは理論的な貢献と経験的な貢献を組み合わせている。
我々は,非バイアス性,検出性,堅牢性という3軸評価プロトコルを確立し,トークン改質攻撃がパラフレーズベースの手法よりも安定したロバストネス評価を提供することを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:46:01 GMT)
GBSK: Skeleton Clustering via Granular-ball Computing and Multi-Sampling for Large-Scale Data [62.4] 本稿では,大規模データセットのクラスタリング処理を行うために,GBSKというスケーラブルなスケルトンクラスタリングアルゴリズムを提案する。
データセットのマルチサンプリングと多粒度グラニュラーボールの構築により、GBSKは徐々に統計的「骨格」を発見
さらに,ユーザビリティの向上と現実シナリオへの展開を容易にするため,パラメータ設定を簡略化した適応型AGBSKを導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:41:15 GMT)
An Ensemble Framework for Unbiased Language Model Watermarking [61.0] 本研究では,アンサンブル・フレームワークであるENSを提案する。
ENSは複数の独立した透かしインスタンスを順次構成し、それぞれ異なるキーによって管理され、透かし信号を増幅する。
実験的な評価では、ENSは信頼できる検出に必要なトークンの数を大幅に減らし、平滑化やパラフレージング攻撃に対する耐性を高めている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:37:44 GMT)
On the Design of KL-Regularized Policy Gradient Algorithms for LLM Reasoning [59.1] 政策勾配アルゴリズムは大規模言語モデル(LLM)の推論能力の向上に成功している。
規則化されたポリシーグラディエント(RPG)ビューは、広く使われている$k_3$ペナルティが、正確には非正規化されたKLであることを示している。
RPG-REINFORCE with RPG-Style Clipは、DAPOよりも最大6ドル以上の絶対パーセンテージポイントの精度を向上させる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:42:53 GMT)
Towards a Comprehensive Scaling Law of Mixture-of-Experts [54.1] 本論文では,すべての重要な要因を考慮に入れた総合的かつ正確なMoEスケーリング法を提案する。
我々の結果は、$G$と$S$の最適設定が、モデルアーキテクチャとデータサイズの両方に依存しないことを示しています。
提案したMoEスケーリング法則は,将来のMoEモデル設計およびトレーニングを促進するための,正確かつ洞察に富んだガイダンスとして機能する可能性がある。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:35:34 GMT)
MotionVerse: A Unified Multimodal Framework for Motion Comprehension, Generation and Editing [54.0] MotionVerseは、シングルパーソンとマルチパーソンの両方のシナリオで人間の動作を理解し、生成し、編集するフレームワークである。
我々は、連続的な動き列をマルチストリーム離散トークンに変換する残差量子化を伴う動きトークン化器を用いる。
また、残留トークンストリームの符号化を時間的に停滞させる textitDelay Parallel Modeling 戦略も導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:20:56 GMT)
Mash, Spread, Slice! Learning to Manipulate Object States via Visual Spatial Progress [53.7] SPARTAは、オブジェクトの状態変化操作タスクのファミリーで最初に統合されたフレームワークである。
SPARTAは、空間的に進行するオブジェクト変化のセグメンテーションマップ、実行可能領域と変換可能領域を知覚する視覚的スキル、時間とともに漸進的な進歩を捉える高密度報酬を統合している。
SPARTAを現実のロボットで検証し、10種類の現実世界のオブジェクトにまたがる3つの課題について検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:56:07 GMT)
Reversed in Time: A Novel Temporal-Emphasized Benchmark for Cross-Modal Video-Text Retrieval [49.4] クロスモーダル検索(例えば、画像テキスト、ビデオテキスト)は、情報検索およびマルチモーダル視覚言語理解分野において重要なタスクである。
本稿では,新しい時間強調ビデオテキスト検索データセットRTimeを紹介する。
私たちのRTimeデータセットは、現在1ビデオにつき10キャプションの21Kビデオで構成されており、合計で約122時間です。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:46:07 GMT)
Compose and Fuse: Revisiting the Foundational Bottlenecks in Multimodal Reasoning [49.2] MLLM(Multimodal large language model)は、テキスト、ビジョン、オーディオなどの多様な入力を統合することで推論を強化することを約束する。
しかし、追加のモダリティがパフォーマンスを損なうかどうかについての報告は相反する。
我々は、多モーダル推論を6つの相互作用パターンに分類し、事実がどのようにモダリティに分散され、論理的に組み合わせられるかを決定する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:46:11 GMT)
Audio-centric Video Understanding Benchmark without Text Shortcut [49.0] 音声視覚大言語モデル(LLM)の映像理解タスクにおける補助的モダリティとして機能することも多い。
本稿では,マルチモーダルLLMの映像理解能力を評価するために,AVUT(Audio-centric video understanding benchmark)を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:16:42 GMT)
RPG360: Robust 360 Depth Estimation with Perspective Foundation Models and Graph Optimization [49.0] RPG360は、トレーニング不要のロバストな360度モノクル深度推定法である。
グラフに基づく最適化を用いた新しい深度スケールアライメント手法を提案する。
提案手法は,Matterport3D,Stanford2D3D,360Locなど,多様なデータセットにまたがる優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:33:12 GMT)
Generalizable Speech Deepfake Detection via Information Bottleneck Enhanced Adversarial Alignment [48.7] 信頼誘導対向アライメントは、識別的手がかりを消去することなく攻撃固有のアーティファクトを適応的に抑制する。
IB-CAANは、多くのベンチマークにおいて、ベースラインと最先端のパフォーマンスを一貫して上回る。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:48:49 GMT)
ReWatch-R1: Boosting Complex Video Reasoning in Large Vision-Language Models through Agentic Data Synthesis [48.2] 先進的なビデオ推論を促進するために構築された大規模データセットであるReWatchを紹介する。
中心となるイノベーションは、CoT合成のためのMulti-Agent ReActフレームワークです。
スーパービジョンファインチューニング(SFT)とRLVRフレームワークを用いた強力なベースラインLVLMのポストトレーニングによりReWatch-R1を開発する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:38:16 GMT)
Meta Pruning via Graph Metanetworks : A Universal Meta Learning Framework for Network Pruning [47.9] ネットワークプルーニングのための全く新しいメタラーニングフレームワークを提案する。
理論上はほとんど全ての種類のネットワークに適用でき、あらゆる種類のプルーニングを持ち、非常に汎用性と転送性を有する。
我々のフレームワークは、ニューラルネットワーク(metanetwork)を介して、複雑なプルーニングルールを自動で学習することができ、特別なトレーニングをすることなくプルーすることのできる非常に一般的な機能を備えている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:42:31 GMT)
MineAnyBuild: Benchmarking Spatial Planning for Open-world AI Agents [47.0] 我々は,MinecraftゲームにおけるオープンワールドAIエージェントの空間計画能力を評価するために,MineAnyBuildというベンチマークを構築した。
MineAnyBuildは、与えられたマルチモーダルなヒューマンインストラクションに基づいて実行可能なアーキテクチャ構築プランを生成するエージェントを必要とする。
4000のキュレートされた空間計画タスクを伴い、リッチなプレイヤー生成コンテンツを利用することで無限に拡張可能なデータ収集のパラダイムを提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:39:59 GMT)
AGSwap: Overcoming Category Boundaries in Object Fusion via Adaptive Group Swapping [45.9] クロスカテゴリオブジェクトを1つのコヒーレントオブジェクトに融合させることは、テキスト・ツー・イメージ(T2I)生成において注目を集めている。
textbfAdaptive Group Swapping (AGSwap) を提案する。
我々はまた、ImageNet-1KとWordNet上に構築された大規模で階層的に構造化されたデータセットである textbfCross-category Object Fusion (COF) も導入した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:08:18 GMT)
Optuna vs Code Llama: Are LLMs a New Paradigm for Hyperparameter Tuning? [45.6] この研究は、LoRAを用いてパラメータ効率の良いCode Llamaを微調整することで、ハイパーパラメータ最適化のための大規模言語モデル(LLM)の使用について検討する。
提案手法は,計算オーバーヘッドを大幅に削減しつつ,競合的あるいは優れたRoot Mean Square Error(RMSE)を実現する。
その結果,LLMに基づく最適化によって,木構造型パーゼンエミュレータ (TPE) のようなベイズ的手法が確立されただけでなく,知覚品質と低レイテンシ処理を必要とする実世界のアプリケーションへのチューニングが高速化された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:53:20 GMT)
XTransfer: Modality-Agnostic Few-Shot Model Transfer for Human Sensing at the Edge [45.4] XTransferは、資源効率の高い設計で、モダリティに依存しない、少数ショットのモデル転送を可能にする第一種方式である。
最先端のパフォーマンスを実現し、センサデータ収集やモデルトレーニング、エッジデプロイメントのコストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:19:55 GMT)
HomeSafeBench: A Benchmark for Embodied Vision-Language Models in Free-Exploration Home Safety Inspection [45.2] 身体的エージェントは、家庭環境における安全上の危険を識別し報告することができる。
既存のベンチマークには2つの重要な制限がある。
HomeSafeBenchは、一般的な5つのホームセーフティーハザードをカバーする12,900のデータポイントを持つベンチマークである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:01:27 GMT)
Spiral of Silence in Large Language Model Agents [45.0] スピラル・オブ・サイレンス(SoS)理論では、少数派の見解を持つ個人は社会的孤立を恐れて発言することをしばしば控えている。
SoSライクなダイナミクスは、大きな言語モデルで純粋に統計的な言語生成から生まれるのか?
本研究では,「歴史」と「ペルソナ」の信号の可利用性を体系的に変化させる4つの制御条件について考察する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:59:54 GMT)
Revisit the Imbalance Optimization in Multi-task Learning: An Experimental Analysis [44.4] マルチタスク学習(MTL)は、1つのネットワークをトレーニングして複数のタスクを共同実行することで汎用的な視覚システムを構築することを目的としている。
期待されているが、そのポテンシャルは「不均衡な最適化」によって妨げられることが多い。
本稿では,この持続的問題に寄与する要因を解明するための系統的な実験的検討を行った。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:40:06 GMT)
Revisiting Vulnerability Patch Localization: An Empirical Study and LLM-Based Solution [44.4] オープンソースのソフトウェア脆弱性検出は、ソフトウェアのセキュリティを維持し、ソフトウェアサプライチェーンの整合性を確保するための重要なコンポーネントである。
従来の検出方法は、大量のコミット履歴を処理する際に、大きなスケーラビリティの課題に直面している。
バージョン駆動型候補フィルタリングと大規模言語モデルに基づく多ラウンド対話投票を組み合わせた新しい2段階フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:59:10 GMT)
Omni-SafetyBench: A Benchmark for Safety Evaluation of Audio-Visual Large Language Models [43.9] Omni-SafetyBenchは、OLLMの安全性評価のための最初の総合的な並列ベンチマークである。
複雑なオムニモーダル入力によるOLLMの理解課題を考慮し,条件付き攻撃成功率(C-ASR)と拒絶率(C-RR)に基づく安全スコアを提案する。
Omni-SafetyBenchを用いて、既存の安全アライメントアルゴリズムを評価し、OLLMの安全性アライメントにおける重要な課題を特定した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:50:33 GMT)
Taught Well Learned Ill: Towards Distillation-conditional Backdoor Attack [43.7] 蒸留条件のバックドア攻撃(DCBA)
DCBAは休眠と検出不能なバックドアを教師モデルに注入し、KDプロセスを介して学生モデルで活性化される。
我々のSCARは、事前最適化されたトリガーインジェクション機能を持つ暗黙の微分アルゴリズムを用いて、この複雑な最適化に対処する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:24:46 GMT)
Learning Encoding-Decoding Direction Pairs to Unveil Concepts of Influence in Deep Vision Networks [43.5] Empical evidence shows that deep vision network presented concept as direction in latent space, vectors called concept embeddeds。
与えられたパッチに対して、複数の潜伏因子は、概念埋め込みを係数として線形に結合することでコンパクト表現に符号化される。
潜在因子は、デコード方向と呼ばれるベクトルであるフィルタで内部積を介して回収することができる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:02:34 GMT)
Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning [43.2] 現在のアライメント戦略は、キュレートされたデータセットによる監視された安全性の微調整に依存している。
教師付き微調整は,表面テクスチャパターンと安全応答の急激な相関を必然的に強化することを示す。
マシン・アンラーニング(MU)は、教師付き安全微調整の強力な代替手段であることを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:35:12 GMT)
Jet-Nemotron: Efficient Language Model with Post Neural Architecture Search [42.5] Jet-Nemotronはハイブリッドアーキテクチャ言語モデルの新しいファミリーである。
それは、主要なフルアテンションモデルの正確さと一致または超える。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:41:58 GMT)
Towards Redundancy Reduction in Diffusion Models for Efficient Video Super-Resolution [41.2] ビデオ超解像(VSR)への生成拡散モデルへの直接適応は冗長性をもたらす。
OASISは、$textbfa$ttention $textbfs$pecialization for real-world v$textbfi$deo $textbfs$uper- resolutionを備えた効率的な$textbfo$ne-step拡散モデルである。
OASISは、合成データセットと実世界のデータセットの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:08:51 GMT)
FuzzyLight: A Robust Two-Stage Fuzzy Approach for Traffic Signal Control Works in Real Cities [41.1] ファジィライトと呼ばれる頑健な2段階ファジィ手法を提案する。
圧縮センシングとRTLを統合してTSCデプロイメントを行う。
これは22の交差点の実際の都市で機能し、現実世界とシミュレーション環境の両方で優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:18:21 GMT)
DiffInk: Glyph- and Style-Aware Latent Diffusion Transformer for Text to Online Handwriting Generation [41.1] DiffInkは、完全な手書き文字を生成するための最初の遅延拡散トランスフォーマーフレームワークである。
InkVAEは2つの相補的な潜在空間正規化損失で拡張された新しい逐次変分オートエンコーダである。
次に、ターゲットテキストと参照スタイルを統合し、コヒーレントペントラジェクトリを生成する新しい遅延拡散変換器InkDiTを紹介する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:58:15 GMT)
Don't Settle Too Early: Self-Reflective Remasking for Diffusion Language Models [40.9] RemeDiはマスクベースのDLMで、トークンの分布と各ステップにおけるトークン毎の信頼スコアを予測する。
モデルに不正トークンを検出して再マスクする教師付き微調整を含む、この能力をトレーニングするために、リマスク対応パイプラインをトレーニングします。
実験により、RemeDiは複数のデータセット上のオープンソースのDLMの最先端の結果を達成することが示された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:39:49 GMT)
Not All Tokens are Guided Equal: Improving Guidance in Visual Autoregressive Models [39.4] Information-Grounding Guidance (IGG) は、意味的に重要な領域へのガイダンスを注意を通して固定する新しいメカニズムである。
IGGはよりシャープでコヒーレントでセマンティックな画像を提供し、ARベースのメソッドの新しいベンチマークを設定している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:33:49 GMT)
Continuous Chain of Thought Enables Parallel Exploration and Reasoning [39.4] 連続価値トークン(CoT2)による思考の連鎖は、本質的に探索能力を必要とする論理的推論タスクによって動機付けられている。
我々は、CoT2が複数の離散トレースを並列に追跡するのにどのように役立つかを示す。
また, 埋込次元が十分であれば, サブセット和問題(subset sum problem)を解くCoT2ベースの一層変圧器も提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:02:10 GMT)
Aligning LLMs for Multilingual Consistency in Enterprise Applications [39.2] 大規模言語モデル(LLM)は、グローバルなエンタープライズアプリケーションには信頼できないままである。
細調整LDMのための実用的なバッチワイドアライメント戦略を提案する。
このアプローチは、英語のパフォーマンス、モデル推論、検索品質を損なうことなく、英語以外の精度を最大23.9%向上させる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:51:22 GMT)
StolenLoRA: Exploring LoRA Extraction Attacks via Synthetic Data [39.2] 本稿では,LoRA抽出と呼ばれるモデル抽出攻撃の新たな焦点を紹介する。
代用モデルを用いてLoRA適応モデルの機能を抽出するStolenLoRAと呼ばれる新しい抽出法を提案する。
実験では,StolenLoRAの有効性を実証し,96.60%の攻撃成功率を10kクエリで達成した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:51:35 GMT)
Accurate and Efficient Low-Rank Model Merging in Core Space [39.1] コアスペースのマージフレームワークは、共通アライメントベースでLoRA対応モデルのマージを可能にする。
Core Spaceは既存のマージ技術を大幅に改善し、ビジョンと言語タスクの両面で最先端の結果が得られます。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:21:24 GMT)
Revisiting Visual Understanding in Multimodal Reasoning through a Lens of Image Perturbation [38.7] 言語のみのモデルでは、生の視覚入力を消費するMLLMと同等またはそれ以上の性能が得られることを示す。
そこで我々は,アルゴリズムの修正を必要とせず,知覚の堅牢性を高めるシンプルな視覚摂動フレームワークを提案する。
本研究は,マルチモーダル数学的推論における視覚摂動の重要性を明らかにするものである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:21:13 GMT)
Any-to-Bokeh: Arbitrary-Subject Video Refocusing with Video Diffusion Model [38.6] 拡散モデルは、カメラシミュレーションの強力なツールとして登場した。
画像ベースのボケレンダリングは有望な結果を示しているが、ビデオボケの拡散は未解明のままである。
時間的コヒーレントな深度対応ビデオボケレンダリングを生成するための一段階拡散フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:29:49 GMT)
ZeroScene: A Zero-Shot Framework for 3D Scene Generation from a Single Image and Controllable Texture Editing [36.1] 画像から3Dのシーン再構成とテクスチャ編集をゼロショットで行う新しいシステムを提案する。
ZeroSceneは、入力画像からオブジェクトレベルの2Dセグメンテーションと深度情報を抽出し、シーン内の空間的関係を推測する。
そして、ポイントクラウドの3Dおよび2Dプロジェクション損失を共同で最適化し、正確なシーンアライメントのためのオブジェクトのポーズを更新する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:21:12 GMT)
Automated design of compound lenses with discrete-continuous optimization [36.0] 本稿では,複合レンズ設計における連続的パラメータと離散的パラメータの両方を自動的に,共同で更新する手法を提案する。
本手法は,勾配に基づく最適化とマルコフ連鎖モンテカルロサンプリングアルゴリズムを組み合わせることで,この性能を実現する。
そこで本研究では,複合レンズの広義設計空間を効果的に探索する様々なレンズ設計タスクについて実験的に検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:08:23 GMT)
Towards Foundation Models for Zero-Shot Time Series Anomaly Detection: Leveraging Synthetic Data and Relative Context Discrepancy [33.7] 時系列異常検出(TSAD)は重要な課題であるが、見えないデータに一般化するモデルを開発することは大きな課題である。
我々は、新しい事前学習パラダイムの上に構築されたTSADの新たな基盤モデルであるtextttTimeRCDを紹介した。
textttTimeRCD はゼロショット TSAD において,既存の汎用および異常固有の基盤モデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:02:53 GMT)
RCI: A Score for Evaluating Global and Local Reasoning in Multimodal Benchmarks [33.7] リージョンインデックス(RCI)は、データセットがグローバルとローカルの視覚情報に依存することを定量化する最初のモデルベースのスコアである。
RCIを広く使用されている13のマルチモーダルベンチマークに適用すると,そのほとんどは局所的推論を好んでいることがわかった。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:26:11 GMT)
Token Merging via Spatiotemporal Information Mining for Surgical Video Understanding [32.5] 本稿では,画像理解トークン統合法(STIM-TM)を提案する。
STIM-TMは、時間的および空間的次元に沿ってトークンの冗長性を独立に減少させる分離戦略を導入する。
STIM-TMは、トレーニングなしの方法で動作し、65ドル以上のGFLOPを削減し、総合的な手術ビデオタスク間の競争精度を維持しながら、かなりの効率を達成する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:24:57 GMT)
ByteSized32Refactored: Towards an Extensible Interactive Text Games Corpus for LLM World Modeling and Evaluation [32.0] 本稿では,ByteSized32 コーパスのモジュール化と実装であるByteSized32Refactoredを紹介した。
各テキストゲームのコード構造を最適化し,GameBasic.pyファウンデーションライブラリを作成する。
集中型設計により、ByteSized32Refactoredはより効率的に拡張でき、新しいシナリオと仕様のテキストゲームを含めることができます。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:07:54 GMT)
DESIGNER: Design-Logic-Guided Multidisciplinary Data Synthesis for LLM Reasoning [31.7] 本稿では,「設計論理」の概念を導入し,人間教育者の質問作成過程を模倣するようにLCMに指示する。
LLMを使って、さまざまな分野にわたる既存の質問から12万以上の設計ロジックをリバースエンジニアリングし、抽象化します。
これらの設計ロジックをソースドキュメントとマッチングすることで、既存のデータセットの難しさや多様性をはるかに超える推論的な質問を作成できるのです。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:53:49 GMT)
Continuous Optimization for Feature Selection with Permutation-Invariant Embedding and Policy-Guided Search [31.5] 我々は,特徴選択の知識を連続的な埋め込み空間に保存するエンコーダ・デコーダパラダイムを開発した。
埋め込み空間の探索を指導するために,政策に基づく強化学習アプローチも採用している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:56:46 GMT)
Language Model Planning from an Information Theoretic Perspective [31.3] デコーダのみの言語モデル(LM)は、コヒーレントな長距離生成をサポートするために中間計算を編成する。
計画には、長い地平線上で計算を構造化し、複数の可能な継続を考慮し、過去の情報を選択的に再利用することが含まれる。
我々は、合成文法、パスフィニングタスク、自然言語データセットにわたるLMにおける計画について研究する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:58:15 GMT)
Joint Value Estimation and Bidding in Repeated First-Price Auctions [31.2] 競売者は、各競売の後に実現された結果(勝敗)のみを観察する。
本稿では,私的価値を共同で推定し,入札戦略を最適化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:07:44 GMT)
AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving [31.1] VLM(Vision-Language Models)は、自律走行を約束するが、幻覚、非効率な推論、限られた実世界の検証は、正確な知覚と堅牢なステップバイステップ推論を妨げる。
我々は、Chain-of-Thought(CoT)推論と、自律運転タスクのための動的エージェントスタイルのツール呼び出しを統合した、先駆的な統合フレームワークであるtextbfAgentThinkを紹介した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:34:37 GMT)
The Final Layer Holds the Key: A Unified and Efficient GNN Calibration Framework [31.1] グラフニューラルネットワーク(GNN)は、グラフベースのタスクにおいて顕著な効果を示した。
しかしながら、彼らの予測的自信は、しばしば誤解され、通常、自信不足を示す。
本稿では,この問題に対処するための簡易かつ効率的なグラフキャリブレーション法を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:37:12 GMT)
Adversarial Versus Federated: An Adversarial Learning based Multi-Modality Cross-Domain Federated Medical Segmentation [31.0] フェデレーション学習は、異なるクライアント間で機械学習モデルの協調トレーニングを可能にする。
我々は新しいフェデレーションドメイン適応(FedDA)セグメンテーショントレーニングフレームワークを提案する。
提案するFedDAは、クロスドメインのフェデレーションアグリゲーションを実現し、クロスモダリティ処理機能を備えた単一モダリティクライアントを実現する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:26:04 GMT)
DriveE2E: Closed-Loop Benchmark for End-to-End Autonomous Driving through Real-to-Simulation [31.0] 我々は,CARLAシミュレータに現実の運転シナリオを密に統合した,単純なクローズドループ評価フレームワークを導入する。
当社のアプローチでは、高マウントのインフラストラクチャセンサーによってキャプチャされた総合的な100時間ビデオデータセットから選択された800の動的トラフィックシナリオを抽出する。
これらのデジタル双生児は実世界の交通と環境特性を正確に再現し、CARLAのより現実的なシミュレーションを可能にした。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:55:14 GMT)
Pretraining Scaling Laws for Generative Evaluations of Language Models [30.7] 生成評価にパス-at-k$を適合させ、最も高価なモデルのパス-at-k$を予測するための3つの異なるスケーリング法則を示す。
我々のフレームワークは、研究者や実践者に対して、生成性能を予測するための洞察と方法論を提供します。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:04:18 GMT)
Autoregressive Video Generation beyond Next Frames Prediction [30.7] VideoARは、様々な予測ユニットをサポートする統一されたフレームワークである。
立方体に基づく予測は、常に優れた品質、速度、時間的コヒーレンスを提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:37:53 GMT)
Reasoning Scaffolding: Distilling the Flow of Thought from LLMs [30.6] 我々は、推論を構造化生成プロセスとして再編成するフレームワークであるReasoning Scaffoldingを紹介します。
本手法は, 精度と論理的整合性の両方において, 最先端の蒸留法よりも優れていた。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:49:32 GMT)
K-DeCore: Facilitating Knowledge Transfer in Continual Structured Knowledge Reasoning via Knowledge Decoupling [30.5] 既存の連続学習アプローチは、シーケンシャルなタスクに適用した場合、重大な課題に直面します。
そこで我々はCSKRフレームワークであるtextscK-DeCoreを提案する。
textscK-DeCoreは、異なるステージに対してデュアルパースペクティブなメモリ統合機構を統合し、構造誘導された擬似データ合成戦略を導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:34:21 GMT)
From An LLM Swarm To A PDDL-Empowered HIVE: Planning Self-Executed Instructions In A Multi-Modal Jungle [30.3] 我々は、一連のアトミックアクションの知識を意識した計画のための包括的ソリューションであるHiveを紹介する。
Hiveは一連のモデルで動作し、自然言語の命令を受け取り、スケジュールし、アトミックアクションの計画を実行します。
エージェントシステムのマルチモーダル能力を総合的に評価するために, MuSE ベンチマークを導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:13:10 GMT)
Temporal Grounding as a Learning Signal for Referring Video Object Segmentation [29.6] Referring Video Object (RVOS)は、自然言語表現に基づくビデオ内のオブジェクトのセグメンテーションと追跡を目的としており、ビジュアルコンテンツとテキストクエリの正確なアライメントを必要とする。
既存の手法は、主に訓練中にフレームサンプリングとすべての可視物体の監督が区別できないため、意味的ミスアライメントに悩まされることが多い。
私たちは、MeViSベンチマークに基づいて構築されたデータセットであるMeViS-Mを紹介します。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:27:41 GMT)
StrucADT: Generating Structure-controlled 3D Point Clouds with Adjacency Diffusion Transformer [29.6] 本稿では,部分的存在と部分的隣接関係を構成する形状構造を用いて点雲の生成を制御することを提案する。
この構造グラフ表現に基づいて,新しい構造制御可能な点雲生成モデルであるStrucADTを紹介する。
実験により, 構造制御可能な3次元点雲生成法は高品質で多様な点雲を生成することが示された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:45:51 GMT)
Towards Understanding Subliminal Learning: When and How Hidden Biases Transfer [29.6] 言語モデルは蒸留中に隠れバイアスを転送することができる。
この現象をサブリミナル学習(subliminal learning)という。
柔らかい蒸留の下では,教師の次点の完全な分布について,教師の指導を受けることができる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:51:22 GMT)
CE-FAM: Concept-Based Explanation via Fusion of Activation Maps [29.5] 活性化マップ(CE-FAM)の融合による概念ベース説明
本稿では,CE-FAM(Fusion of Activation Maps)による概念ベース説明法を提案する。
提案手法は,注釈付きデータセットを必要とせず,任意の概念を扱うためにVLM知識を活用しながら,概念領域とそのコントリビューションを識別するための一般的なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:40:53 GMT)
RAM-W1K: A Multi-Task Wrist Dataset and Benchmark for Rheumatoid Arthritis [29.3] 手首は関節リウマチ(RA)の診断における重要な領域である
このデータセットは、4つの医療センターから388人の患者から1048個の手首の従来のX線写真で構成されている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:16:06 GMT)
Reinforcement Learning with Inverse Rewards for World Model Post-training [29.2] ビデオワールドモデルにおける動作追跡を改善するために,逆回帰を用いた強化学習を提案する。
RLIRは、逆ダイナミクスモデルを用いて生成されたビデオから入力アクションを復元することにより、検証可能な報酬信号を導出する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:27:47 GMT)
Vidar: Embodied Video Diffusion Model for Generalist Manipulation [28.2] Vidarは、ほとんどのエンボディメント固有のデータを転送可能なビデオに置き換える、事前駆動のローショット適応パラダイムである。
以上の結果から,強力で安価なビデオプリエントと最小限のオンロボットアライメントという,“先行的かつ多数の実施”のためのスケーラブルなレシピが示唆された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:56:12 GMT)
MetaMind: Modeling Human Social Thoughts with Metacognitive Multi-Agent Systems [28.2] メタ認知の心理学理論に触発されたマルチエージェントフレームワークであるMetaMindを紹介する。
我々のフレームワークは3つの挑戦的なベンチマークで最先端のパフォーマンスを実現し、実世界の社会的シナリオは35.7%改善した。
この研究は、共感的対話や文化的に敏感な相互作用に応用して、人間のような社会知性に向けてAIシステムを前進させる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:33:10 GMT)
A Necessary Step toward Faithfulness: Measuring and Improving Consistency in Free-Text Explanations [28.1] 本稿では,エビデンス重みの概念を拡張し,予測-説明整合性の尺度を提案する。
直接選好最適化を適用することで、3つのモデルファミリー間で発生した説明の一貫性が向上することを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:19:57 GMT)
Taming Masked Diffusion Language Models via Consistency Trajectory Reinforcement Learning with Fewer Decoding Step [28.1] マスケッド拡散言語モデルは、並列復号化、フレキシブルな生成順序、推論ステップの少ないポテンシャルなどの特性を提供する。
直感的なアプローチは、自己回帰(AR)言語モデルのために確立された技術を直接MDLMに転送することである。
本稿では,EOS Early Rejection (EOSER) と Ascending Step-Size (ASS) デコードスケジューラを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:01:15 GMT)
MCPMark: A Benchmark for Stress-Testing Realistic and Comprehensive MCP Use [28.0] MCPMarkは、より現実的で包括的な方法でMPPの使用を評価するために設計されたベンチマークである。
ドメインの専門家とAIエージェントが共同で作成した127ドルの高品質なタスクで構成されている。
平均して、LCMは16.2ドル、タスクごとに17.4ドルのツールコールを必要とし、以前のMPPベンチマークよりも大幅に上回っている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:53:27 GMT)
Multi-Scale Spatial-Temporal Hypergraph Network with Lead-Lag Structures for Stock Time Series Forecasting [27.9] 本研究は,ストック時系列予測のためのHermesフレームワークを提案する。
移動アグリゲーションとマルチスケールの融合モジュールをハイパーグラフネットワークに統合する。
その結果,Hermesは既存の最先端手法よりも効率と精度が優れていることがわかった。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:13:55 GMT)
BOSfM: A View Planning Framework for Optimal 3D Reconstruction of Agricultural Scenes [26.8] アクティブビジョン(AV)は多くの応用でロボット工学の研究が注目されている。
本報告では, 新規な再構成品質に基づく最適化手法を提案する。
選択した2次元画像から求める環境の3次元構造を再構築する「動きからの構造」の概念に依存している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:50:36 GMT)
From Personal to Collective: On the Role of Local and Global Memory in LLM Personalization [26.7] 大規模言語モデル(LLM)のパーソナライゼーションは、過去のインタラクションに基づいて、個人ユーザに対して振る舞いをモデル化することを目的としている。
ローカルメモリとグローバルメモリを組み合わせたローカル・グローバル・メモリ・フレームワーク(LoGo)を提案する。
LoGoは、コールドスタートユーザーを温め、バイアスのある予測を緩和することで、パーソナライズ品質を継続的に改善する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:32:18 GMT)
VCSearch: Bridging the Gap Between Well-Defined and Ill-Defined Problems in Mathematical Reasoning [26.6] 5000以上の不確定な数学的問題を含むPMC(Issue with Missing and Contradictory conditions)というベンチマークを開発した。
VCSEARCHは、解決不可能な問題を特定する精度を、さまざまな大きな言語モデルで少なくとも12%向上させる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:03:09 GMT)
HS-STaR: Hierarchical Sampling for Self-Taught Reasoners via Difficulty Estimation and Budget Reallocation [26.5] 自己学習推論器(STaR)は、自己学習に自己生成応答を活用することにより、大規模言語モデル(LLM)の数学的推論能力を高める。
本稿では,自己学習推論のための階層型サンプリングフレームワークHS-STaRを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:46:13 GMT)
MedLA: A Logic-Driven Multi-Agent Framework for Complex Medical Reasoning with Large Language Models [26.2] textscMedLAは、大規模な言語モデル上に構築されたロジック駆動のマルチエージェントフレームワークである。
エージェントはグラフ誘導の議論を行い、論理木を比較して反復的に洗練する。
textscMedLAは静的ロールベースシステムと単一エージェントベースラインの両方を一貫して上回っていることを実証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:06:39 GMT)
DEMO:Diffusion-based Evolutionary Optimization for 3D Multi-Objective Molecular Generation [25.8] 構造的制約を満足しながら複数の目的特性を最適化することは、3次元分子発見の大きな課題である。
本稿では,事前学習した拡散モデルの生成力を生かした新しい3次元分子多目的進化アルゴリズムを提案する。
本手法は,拡散モデルの前方処理で定義される雑音空間におけるクロスオーバー操作を行い,親の特徴や所望のフラグメントを子孫に融合させる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:25:09 GMT)
Logic Gate Neural Networks are Good for Verification [25.7] 学習論理ゲートネットワーク(LGN)における大域的ロバスト性と公正性を検証するためのSAT符号化を導入する。
提案手法は,新たに構築された5クラスの変種を含む5つのベンチマークデータセットを用いて評価し,LGNが検証に適しており,高い予測性能を維持していることを確認した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:03:31 GMT)
On the Emergence of Weak-to-Strong Generalization: A Bias-Variance Perspective [25.6] W2SG(Weak-to-strong generalization)とは、弱い教師によってラベル付けされたデータセットに基づいて訓練された強力な学生モデルが、ターゲットタスクにおいて教師より優れる現象である。
近年の研究では、学生モデルと教師モデルの間の予測ミスフィットによるパフォーマンス向上が評価されている。
W2SGは、生徒モデルが個々の教師を模倣するのではなく、その後部の平均教師に近似した場合に出現する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:13:18 GMT)
Video Panels for Long Video Understanding [25.6] 本稿では,長時間ビデオ理解に特化して設計された視覚的プロンプト戦略を提案する。
複数のフレームを1つの画像に組み合わせることで、時間分解能の空間的詳細を効果的に取り除くことができる。
我々のアプローチは、トレーニングフリー、パラメータフリー、モデル非依存であり、既存のビデオ言語モデルにシームレスに統合できる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:05:55 GMT)
Towards Large-Scale In-Context Reinforcement Learning by Meta-Training in Randomized Worlds [25.3] In-Context Reinforcement Learning (ICRL)により、エージェントは対話的な体験から自動的に、そしてオンザフライで学習することができる。
我々はAnyMDPという手続き的に生成されたマルコフ決定プロセスを提案する。
慎重に設計されたランダム化プロセスを通じて、AnyMDPは比較的低い構造バイアスを維持しながら、大規模に高品質なタスクを生成することができる。
提案手法は,AnyMDPタスクを十分に大規模に行うことで,多目的な文脈内学習パラダイムによる学習では考慮されなかったタスクを一般化できることを実証した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:53:05 GMT)
Durian: Dual Reference Image-Guided Portrait Animation with Attribute Transfer [25.3] デュリアンは、1つ以上の参照画像から対象のポートレートに相互同一性属性を伝達したポートレートアニメーションビデオを生成するための最初の方法である。
本稿では,通常のポートレートビデオを利用して,明示的なペアデータなしで属性転送を学習する自己再構成式を提案する。
Durianは、属性転送を伴うポートレートアニメーションの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:25:52 GMT)
Hanfu-Bench: A Multimodal Benchmark on Cross-Temporal Cultural Understanding and Transcreation [25.3] Hanfu-Benchは、専門家による新しいマルチモーダルデータセットである。
文化的な視覚的理解と文化的なイメージの再現という2つの中心的な課題から構成される。
我々の評価では, 閉鎖型VLMは視覚的カットラル理解の非専門家と同等に機能するが, 人間の専門家では10%弱に低下する。
トランスクリエーション作業では,多面的評価により,最高の性能モデルがわずか42%の成功率を達成したことが示唆された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:52:01 GMT)
From Past To Path: Masked History Learning for Next-Item Prediction in Generative Recommendation [25.3] Masked History Learning (MHL) は、単純な次のステップの予測から歴史の深い理解へと目標をシフトする、新しいトレーニングフレームワークである。
MHLは、マスクされた歴史的なアイテムを再構築する補助的なタスクで、標準的な自己回帰目標を増強する。
3つの公開データセットの実験により、我々の手法は最先端の生成モデルよりも著しく優れていることが示された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:22:19 GMT)
PartnerMAS: An LLM Hierarchical Multi-Agent Framework for Business Partner Selection on High-Dimensional Features [23.8] 評価を3層に分割する階層型マルチエージェントフレームワークを提案する。戦略を設計するプランナーエージェント,役割特異的評価を行う専門エージェント,アウトプットを統合するスーパーバイザエージェントである。
140のケースで、PartnerMASはシングルエージェントと議論ベースのマルチエージェントベースラインを一貫して上回り、最大10-15%のマッチレートを達成する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:39:03 GMT)
Bridging the Performance Gap Between Target-Free and Target-Based Reinforcement Learning [21.4] 本稿では,オンラインネットワークの最後の線形層のコピーをターゲットネットワークとして利用する新しい手法を提案する。
連続的なベルマン更新を並列に学習する反復型Q-ラーニングの概念と組み合わせることで、ターゲットレスアプローチのサンプル効率を向上させることができる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:20:32 GMT)
Falcon: A Cross-Modal Evaluation Dataset for Comprehensive Safety Perception [19.1] 本研究は,視覚的質問応答におけるコンテンツモデレーションにおける視覚情報の重要性を強調した。
私たちはFalconを紹介します。これは大規模な視覚言語安全データセットで、13の有害カテゴリにわたる57,515のVQAペアを含みます。
Falconデータセットを用いてQwen2.5-VL-7Bから微調整した特殊評価器FalconEyeを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:00:37 GMT)
Embedding Domain Knowledge for Large Language Models via Reinforcement Learning from Augmented Generation [19.0] 本稿では,RLAG(Reinforcement Learning from Augmented Generation)を提案し,ドメイン知識を大規模言語モデルに組み込む。
提案手法は, サンプリング世代間を反復的に循環し, 計算した報酬によってモデルを最適化する。
医学、法学、天文学、および現在のイベントデータセットにわたる実験結果から、提案手法がベースラインアプローチを著しく上回ることを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:06:48 GMT)
Pancreas Part Segmentation under Federated Learning Paradigm [18.7] MRIにおける膵部分(頭部,体,尾部)分節に対する初回フェデレートラーニング(FL)アプローチを提案する。
このコントリビューションは、まずは、MRIにおける膵部分のデライン化の技術的複雑さと、それ以前のアプローチを妨げるデータ不足の問題の2つの根本的な課題に対処する。
直接データを共有することなく、7つの医療機関間で協調的なモデルトレーニングを可能にするプライバシー保護FLフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:42:43 GMT)
Disentanglement of Variations with Multimodal Generative Modeling [18.6] マルチモーダルデータの堅牢な表現を学習する際の課題を解決するために,IDMVAE(Information-disentangled Multimodal VAE)を提案する。
既存のアプローチと比較すると、IDMVAEは共有情報とプライベート情報の明確な分離を示し、課題のあるデータセットに対して優れた生成品質とセマンティックコヒーレンスを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 00:54:39 GMT)
Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory [18.5] 本稿では,長期メモリを備えた新しいマルチモーダルエージェントフレームワークであるM3-Agentを紹介する。
M3-Agentは、リアルタイムの視覚的および聴覚的入力を処理し、エピソードおよびセマンティックメモリの構築と更新を行う。
命令が与えられた後、M3-Agentは自動でマルチターン推論を行い、関連するメモリを取得してタスクを完了させる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:03:44 GMT)
Rethinking Reward Miscalibration of GRPO in Agentic RL [18.5] 結果に基づく報酬は、これらの欠陥のある中間ステップに対して期待される負の優位性を保証することを示す。
我々は,善悪行為の埋め込みを分離するために,善悪行為を分類するアクターの訓練を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:24:38 GMT)
PDFBench: A Benchmark for De novo Protein Design from Function [18.4] PDFBenchは、関数誘導デノボタンパク質設計のための最初の包括的なベンチマークである。
本ベンチマークでは,2つのキー設定の16のメトリクスに対して,8つの最先端モデルを体系的に評価する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:52:13 GMT)
Aha Moment Revisited: Are VLMs Truly Capable of Self Verification in Inference-time Scaling? [18.4] 視覚言語モデル(VLM)に類似した推論時間スケーリング手法が有用かどうかを検討する。
多数決や自己検証によるベスト・オブ・Nといった戦略はVLMのパフォーマンスを向上させるが、多数決は検証中心の戦略を著しく上回っている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:02:38 GMT)
Hedonic Neurons: A Mechanistic Mapping of Latent Coalitions in Transformer MLPs [18.3] 本稿では,連立ゲーム理論に基づく機械的解釈可能性フレームワークを提案する。
非添加作用を有する神経細胞の安定な連なりを抽出する。
次に、レイヤ間の遷移を永続性、分割、マージ、消失として追跡します。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:55:24 GMT)
PERSE: Personalized 3D Generative Avatars from A Single Portrait [18.1] PERSEは、参照ポートレートからパーソナライズされた3D生成アバターを構築する方法である。
提案手法は,大規模な合成2Dビデオデータセットから始まる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:33:24 GMT)
Binary Diff Summarization using Large Language Models [17.9] 大型言語モデル(LLM)は、従来のツールを拡張するためにバイナリ分析に適用されている。
LLMを用いた二項差分要約のための新しいフレームワークを提案する。
6つのオープンソースプロジェクトに3つの異なるマルウェアを注入することで、ソフトウェアサプライチェーンセキュリティベンチマークを作成します。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:47:24 GMT)
Semantic-guided Diverse Decoding for Large Language Model [17.8] Semantic-Guided Diverse Decoding (SeemDiD)を紹介する。
SemDiDは3つの相補的なメカニズムによって品質と多様性のバランスをとる。
実験では、SemDiDは既存のメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:32:17 GMT)
From Neural Networks to Logical Theories: The Correspondence between Fibring Modal Logics and Fibring Neural Networks [17.5] モーダル論理のフィブリング(英: Fibring of modal logics)は、モーダル論理の可算族を単一のフィブリング言語に結合するための、十分に確立された形式主義である。
ニューラルネットワークのファイブリングは、ニューラルネットワークにおける学習と推論を組み合わせるためのニューロシンボリックフレームワークとして導入された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:32:42 GMT)
SynParaSpeech: Automated Synthesis of Paralinguistic Datasets for Speech Generation and Understanding [17.4] 笑いやため息のようなパラ言語的な音は、より現実的で魅力的なスピーチを合成するのに不可欠である。
大規模パラ言語データを生成するための自動フレームワークを提案し,それをSynParaSpeechデータセットの構築に適用する。
データセットは6つのパラ言語カテゴリーで構成され、118.75時間のデータと正確なタイムスタンプは、いずれも自然な会話音声に由来する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:08:35 GMT)
Are VLMs Ready for Lane Topology Awareness in Autonomous Driving? [17.3] VLM(Vision-Language Models)は、最近、マルチモーダル推論において顕著な進歩を示したが、自動運転におけるその応用は限定的である。
本研究では,道路トポロジ理解におけるVLMの能力を体系的に評価する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:38:55 GMT)
Emission-GPT: A domain-specific language model agent for knowledge retrieval, emission inventory and data analysis [17.3] エミッションGPT(Electron-GPT)は、大気のエミッションドメインに適した、知識に富んだ大規模言語モデルエージェントである。
1万以上のドキュメント(標準、レポート、ガイドブック、ピアレビューされた文献を含む)のキュレートされた知識ベース上に構築されたElectron-GPTは、迅速なエンジニアリングと質問補完を統合し、正確なドメイン固有の質問応答をサポートする。
ユーザは、クエリや視覚化、ソースコントリビューションの分析、ユーザ定義シナリオのエミッションファクタの推奨といった、自然言語によるエミッションデータをインタラクティブに分析することができる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:50:05 GMT)
Find your Needle: Small Object Image Retrieval via Multi-Object Attention Optimization [17.2] 本研究では,小物体画像検索(SoIR)の課題に対処する。その目的は,特定の小物体を含む画像を,散らばったシーンで検索することである。
主な課題は、画像内のすべてのオブジェクトを効果的に表現する、スケーラブルで効率的な検索のための単一のイメージ記述子を構築することである。
専用多目的事前学習フェーズを組み込んだ新しい検索フレームワークであるMaO(Multi-object Attention Optimization)を導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:44:35 GMT)
Exponential Advantage from One More Replica in Estimating Nonlinear Properties of Quantum States [16.2] 我々は、幅広い観測可能なクラスに対して$mathrmtr(rhok O)$を推定することは、$(k-1)$-replicaの関節測定に制限された任意のプロトコルに対して指数関数的に難しいことを証明した。
その結果、任意の整数$k>2$に対する$(k-1)$-と$k$-replicaプロトコルの指数的分離が初めて確立された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:46:43 GMT)
What Do Indonesians Really Need from Language Technology? A Nationwide Survey [16.1] インドネシアにおける母語話者の実際のニーズを評価するために全国調査を実施している。
以上の結果から,特に機械翻訳や情報検索による言語障壁への対処が最重要課題であることが示唆された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:45:28 GMT)
Half-order Fine-Tuning for Diffusion Model: A Recursive Likelihood Ratio Optimizer [16.1] 確率拡散モデル(DM)は、連鎖構造を通して推論することで内容を生成する。
現代の手法は強化学習 (RL) と切り離されたバックプロパゲーション (BP) に基づいている
DMのためのRLR(Recursive Likelihood Ratio)ファインチューニングパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:20:24 GMT)
How Effective Are Time-Series Models for Rainfall Nowcasting? A Comprehensive Benchmark for Rainfall Nowcasting Incorporating PWV Data [15.7] RainfallBench(レインフォールベンチ)は、降雨用に設計されたベンチマークである。
このデータセットは、6つの必須変数の15分間隔で記録された5年間の気象観測から導かれる。
我々はRainfallBenchで6つの主要なアーキテクチャで20以上の最先端モデルを評価した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:21:24 GMT)
From Static to Dynamic: a Survey of Topology-Aware Perception in Autonomous Driving [15.7] 自律運転を実現するための鍵は、トポロジーを意識した認識にある。
静的な事前構築された地図からダイナミックなセンサー駆動の知覚へのシフトを観察する。
より適応的でスケーラブルで説明可能な自律運転システムを実現するための道を開いたのです。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:47:33 GMT)
Assessing Large Language Models in Updating Their Forecasts with New Information [15.7] EVOLVECASTは,大規模言語モデルが新たな情報に反応して予測を適切に修正するかどうかを評価するフレームワークである。
我々は、人間予測器を比較基準として、更新された状況下での予測シフトと信頼度校正を分析する。
言語化やロジットに基づく信頼度評価は、常に他方よりも優れておらず、どちらも人間の基準から遠く離れている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:16:20 GMT)
Tequila: Trapping-free Ternary Quantization for Large Language Models [15.6] 大規模言語モデル(LLM)をエッジデバイスにデプロイするには,量子化技術が不可欠である。
テキーラ(Tequila)は、デッドゾーントラッピングされた重みを動的バイアスとして再資源化することで、トラップなし量子化最適化手法である。
SOTAベースラインよりも4%の精度向上を実現し、(1%の差で)完全精度のパフォーマンスと3.0倍の推論スピードアップとほぼ一致している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:17:40 GMT)
The Impossibility of Inverse Permutation Learning in Transformer Models [15.5] 復号器のみの変圧器における逆置換学習の問題について検討する。
任意の深さのデコーダのみの変換器では、このタスクを学習できないことを示す。
これは、チェーン・オブ・シントが推し進める、あるいはより一般的には中間思考のトークンが推論を可能にする別のメカニズムを示唆するかもしれない。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:48:11 GMT)
Security and Privacy Measurement on Chinese Consumer IoT Traffic based on Device Lifecycle [15.4] 本研究は,中国における消費者向けIoTデバイストラフィックに関する最初の大規模データセットを構築した。
38のブランドと12のデバイスカテゴリにまたがる77のデバイスからのトラフィックを集めています。
他の地域と比較すると、中国の消費者向けIoTデバイスは国内サービスに依存している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:04:40 GMT)
From What to Why: A Multi-Agent System for Evidence-based Chemical Reaction Condition Reasoning [15.3] ChemMASは、条件予測をエビデンスベースの推論タスクとして再設定するマルチエージェントシステムである。
ChemMASはドメイン固有のベースラインよりも20~35%向上し、Top-1精度で汎用LLMを10~15%上回る。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:34:35 GMT)
Bridging the Knowledge-Prediction Gap in LLMs on Multiple-Choice Questions [15.2] 大規模言語モデル(LLM)は、しばしば多重選択質問(MCQ)で失敗する。
このサブスペース内の知識座標と予測座標を整合させるために隠れ状態を変化させるパラメータフリーな介入であるtextbfKAPPA (Knowledge-Aligned Prediction through Projection-based Adjustment) を導入する。
Big-Bench-Hard と ARC-Challenge のバイナリ選択再構成実験により、KAPPA は精度を大幅に向上し、ベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:57:24 GMT)
Beyond the Exploration-Exploitation Trade-off: A Hidden State Approach for LLM Reasoning in RLVR [15.1] RLVR(Reinforcement Learning for Verifiable Rewards)の一般的な見解は、探索・探索トレードオフのレンズを通して最近の進歩を解釈している。
我々はこの視点を再検討し、この認識されたトレードオフは基本的な制約ではなく、測定レベルの成果物である可能性を示唆している。
本稿では,相乗的探索・探索強化の原理を最初に運用する,Velocity-Exploiting Rank-Learning (VERL)を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:14:58 GMT)
M3DLayout: A Multi-Source Dataset of 3D Indoor Layouts and Structured Descriptions for 3D Generation [15.0] テキスト駆動の3Dシーン生成では、オブジェクトレイアウトは、高レベルの言語命令を詳細な出力でブリッジする重要な中間表現として機能する。
3次元屋内レイアウト生成のための大規模マルチソースデータセットであるM3Dを紹介する。
M3Dは15,080のレイアウトと258k以上のオブジェクトインスタンスで構成され、現実世界のスキャン、プロのCADデザイン、手続き的に生成されたシーンを統合している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:16:08 GMT)
Beyond Greedy Exits: Improved Early Exit Decisions for Risk Control and Reliability [14.0] 早期のDeep Neural Networksは、中間層での予測を可能にすることで、適応推論を可能にする。
我々のフレームワークは、フルモデルのパフォーマンスと比較して、パフォーマンス低下(2%)を最小限に抑えながら、スピードアップ(1.70-2.10x)が一貫した改善を示している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:05:24 GMT)
Making Language Model a Hierarchical Classifier [14.0] 人間の階層的思考能力によって動機づけられた階層的デコーダアーキテクチャは,テキストの復号化を同時に行うことができる。
本研究は、スクラッチから事前学習した一般化階層的推論器の可能性を示している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:57:03 GMT)
Navigating the Labyrinth: Path-Sensitive Unit Test Generation with Large Language Models [13.9] 単体テストはソフトウェアの品質保証には不可欠だが、テストの記述とメンテナンスは時間がかかり、エラーが発生しやすい。
このギャップを埋めるために、コード知識とLLMのセマンティック機能を組み合わせることで、パスに敏感なフレームワークであるJUnitGenieを紹介します。
JUnitGenieを実世界の10のJavaプロジェクトから2,258の複雑な焦点メソッドで評価する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:29:57 GMT)
SAR-KnowLIP: Towards Multimodal Foundation Models for Remote Sensing [13.9] クロスモーダル人工知能は近年広く注目を集めており、自然画像の研究において大きな進歩を遂げている。
既存の手法は主にRGB画像用に設計されており、合成開口レーダ(SAR)画像のモデリングにおいて大きなギャップを残している。
本稿では、再利用可能なデータと評価ベースラインとともに、初の汎用SARマルチモーダル基盤モデルであるSAR-KnowLIPを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:03:25 GMT)
Improving constraint-based discovery with robust propagation and reliable LLM priors [13.9] 高信頼度種子から縁を伝播する因果発見法であるMosaCDを提案する。
次に、最も信頼性の高いエッジを優先し、スケルトンに基づく発見手法と統合可能な、新しい信頼度低下伝搬戦略を適用する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:00:20 GMT)
VeriFuzzy: A Dynamic Verifiable Fuzzy Search Service for Encrypted Cloud Data [13.9] 暗号化クラウドデータ上で動的で検証可能なファジィ検索(DVFS)をサポートするサービスは、依然として根本的な課題である。
本稿では,3つのイノベーションを包括的に統合した新しいDVFSサービスフレームワークである textbfVeriFuzzy を提案する。
私たちのコードとデータセットは現在オープンソースで、将来のDVFS研究に刺激を与えたいと思っています。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:45:47 GMT)
Achieving quantum advantage in a search for a violations of the Goldbach conjecture, with driven atoms in tailored potentials [12.9] ゴールドバッハ予想は、任意の自然数$N$が2ドル以上であっても、$ptext(I)$と$ptext(II)$の2つの素数の和として書けると述べている。
本稿では,問題を解く量子アナログデバイスを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:51:45 GMT)
A Multi-Camera Vision-Based Approach for Fine-Grained Assembly Quality Control [12.8] 既存のソリューションは、しばしばシングルビューイメージングや手動検査に依存している。
本稿では,新しいマルチビュー品質制御モジュールを提案する。
3つのカメラビューから画像をキャプチャすることで、システムはアセンブリプロセスのコンポーネントの包括的視覚的カバレッジを提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:37:48 GMT)
From NL2SQL to NL2GeoSQL: GeoSQL-Eval for automated evaluation of LLMs on PostGIS queries [12.5] 本研究では,PostGISクエリ生成のための最初のエンドツーエンド自動評価フレームワークであるGeo-Evalを紹介する。
このフレームワークは4つの認知次元、5つの習熟度レベル、20のタスクカテゴリを含み、総合的な評価モデルのパフォーマンスを提供する。
並行して、3つのタスクタイプ、340のPostGIS関数、82のドメイン固有データベースにまたがる14178の質問からなるベンチマークデータセットGeo-Benchを開発した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:50:48 GMT)
Patterns in the Transition From Founder-Leadership to Community Governance of Open Source [12.5] 637のGitHubリポジトリを分析して、創業者主導から共有ガバナンスへの移行をトレースします。
役割と行動が成長し、規制がよりバランスを取ります。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:17:58 GMT)
FastViDAR: Real-Time Omnidirectional Depth Estimation via Alternative Hierarchical Attention [11.9] FastVidarは、魚眼カメラの入力を4つ受け取り、完全な深度マップを360ドル(約3万3000円)で作成する新しいフレームワークだ。
ビューをまたいだ機能を効率的に融合する代替階層的注意(AHA)機構を導入する。
本稿では,多視点深度推定を共有正方形座標系に投影する新しいERP融合手法を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:25:27 GMT)
Theoretical Modeling of LLM Self-Improvement Training Dynamics Through Solver-Verifier Gap [11.7] 理論的には、ソルバ検証ギャップの概念を用いて自己改善の訓練力学をモデル化する。
分析を拡張して、外部データがフレームワーク内のこれらのダイナミクスにどのように影響するかを調べます。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:36:59 GMT)
OVSeg3R: Learn Open-vocabulary Instance Segmentation from 2D via 3D Reconstruction [11.6] OVSeg3Rは、3D再構成の助けを借りて、よく研究された2D知覚モデルからオープン語彙の3Dインスタンスセグメンテーションを学習する。
OVSeg3Rは2Dビデオの再構成シーンを直接入力として採用し、手作業による手作業の調整は避ける。
OVSeg3Rはテールクラスとヘッドクラスのパフォーマンスギャップを著しく狭め、ScanNet200ベンチマークで+2.3 mAPを全体として改善した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 00:41:22 GMT)
Benchmarking LLM-Assisted Blue Teaming via Standardized Threat Hunting [11.6] 本稿では,大規模言語モデルをブルーチームで指導するためのベンチマークであるCyberTeamを提案する。
まず、脅威属性からインシデント応答への分析タスク間の依存関係をキャプチャすることで、現実的な脅威追跡をモデル化する。
次に、各タスクは、その特定の分析要求に合わせて調整された一連の運用モジュールを通して対処される。
全体として、CyberTeamは30のタスクと9つの運用モジュールを統合し、標準化された脅威分析を通じてLLMをガイドする。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:08:17 GMT)
When Is Diversity Rewarded in Cooperative Multi-Agent Learning? [11.5] 異種チームに適した目的を調査する。
計算パラダイムとしてマルチエージェント強化学習(MARL)を用いる。
We show that HetGPS reiscovers the reward regimes predict by our theory。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:35:57 GMT)
QKV Projections Require a Fraction of Their Memory [11.0] 本稿では,注意層におけるQ,K,V$プロジェクションのメモリ消費を最大512ドルまで削減するテンソル圧縮手法を提案する。
PAMMはFlashAttentionのような効率的な注意手法で完全に構成可能であり、メモリ効率のLLMトレーニングのための実用的で補完的な方法である。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:30:47 GMT)
DataPuzzle: Breaking Free from the Hallucinated Promise of LLMs in Data Analysis [11.0] 大規模言語モデル(LLM)は、マルチモーダルデータ分析にますます応用されている。
一般的なPrompt-to-Answer'パラダイムは、LSMをブラックボックスアナリストとして扱う。
複雑な質問を分解する概念的マルチエージェントフレームワークであるDataPuzzleを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:12:23 GMT)
RIV: Recursive Introspection Mask Diffusion Vision Language Model [11.0] マスク拡散に基づく視覚言語モデル(MDVLM)はマルチモーダル理解タスクにおいて顕著な進歩を遂げている。
これらのモデルでは、生成されたトークンのエラーを修正できないため、自己補正能力が欠如している。
本稿では,自己補正能力を備えた再帰検査マスク拡散視覚言語モデル(RIV)を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:01:46 GMT)
PreScope: Unleashing the Power of Prefetching for Resource-Constrained MoE Inference [10.9] メモリへの専門家の重み付けは、計算を数倍超えるPCIe転送遅延をもたらす。
予測駆動型エキスパートスケジューリングシステムPreScopeについて述べる。
PreScopeは141%のスループットと74.6%のレイテンシを実現している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:35:12 GMT)
Multi-Level Heterogeneous Knowledge Transfer Network on Forward Scattering Center Model for Limited Samples SAR ATR [10.7] 本研究は,前向き散乱中心モデル(FSCM)という,純粋および鍵標的知識を移行するための新しいシミュレーションデータについて検討する。
この目的を達成するために,FSCMの知識を特徴,分布,カテゴリレベルから完全に移行する多レベル異種知識伝達ネットワークを提案する。
特に,FSCMデータとSAR画像による2つの新しいデータセットに対する広範な実験により,本手法の優れた性能が示された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:04:04 GMT)
CGELBank Annotation Manual v1.2 [10.1] CGELBankは、Cambridge Grammar of the English(CGEL; Huddleston and Pullum, 2002)から派生した英語の構文形式に基づく木バンクおよび関連ツールである
この文書はCGELBankアノテーションスキームの特異性を概説している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 00:02:34 GMT)
APRMCTS: Improving LLM-based Automated Program Repair with Iterative Tree Search [10.0] APRMCTS はモンテカルロ木探索 (MCTS) をパッチ探索に取り入れ、探索されたパッチのグローバル評価を行い、改良と生成のために最も有望なパッチを選択する。
Defects4Jの835のバグに関する実験では、GPT-3.5と統合すると、APRMCTSは合計201のバグを修正でき、すべての最先端のベースラインを上回ります。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:48:20 GMT)
A Second-Order Perspective on Pruning at Initialization and Knowledge Transfer [10.0] 本研究では,事前学習した視覚モデルのプルーニングに対するデータの影響について検討する。
驚くべきことに、1つのタスクでプルーニングすることは、目に見えないタスクでもモデルがゼロショットのパフォーマンスを維持する。
この現象は,大規模データセット上での事前学習によって引き起こされる,良好な損失景観に起因している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:55:11 GMT)
An Investigation of Batch Normalization in Off-Policy Actor-Critic Algorithms [10.0] バッチ正規化(BN)は、トレーニング安定性を改善し、オーバーフィッティングを緩和し、より効果的な最適化を可能にすることによって、ディープラーニングの成功において重要な役割を担っている。
BNは深い強化学習環境において、特にその堅牢性と訓練の容易さによって、独特な優位性を維持している、と我々は主張する。
DRLパイプラインにおける頑健なBN統合のための実用的な提案を行うためのモード認識バッチ正規化(MA-BN)手法を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:54:33 GMT)
ToDi: Token-wise Distillation via Fine-Grained Divergence Control [10.0] Token-wise Distillation (ToDi) は、Sigmoid-based weighting function を用いてトークンごとのフォワードKLとリバースKLを適応的に結合する新しい方法である。
ToDiは、均一またはより粒度の低い戦略を用いて、最近の蒸留ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:55:16 GMT)
A Self-Adaptive Frequency Domain Network for Continuous Intraoperative Hypotension Prediction [9.8] 術中低血圧 (IOH) は, 術後合併症と強く関連している。
既存の手法は時間領域情報と周波数領域情報の両方を組み込む際に制限に直面している。
SAFDNet(Self-Adaptive Frequency Domain Network)を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:02:28 GMT)
GradES: Significantly Faster Training in Transformers with Gradient-Based Early Stopping [9.8] 早期停止はグローバルなバリデーション損失を監視し、すべてのパラメータ更新を同時に停止する。
textitGradESは、トランスフォーマーコンポーネント内で動作可能な、新しい勾配ベースの早期停止アプローチである。
textitGradESはトレーニング時間を1.57--7.22$times$で高速化すると同時に、オーバーフィッティングの早期防止による一般化を同時に強化する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:09:03 GMT)
Controllable Reference Guided Diffusion with Local Global Fusion for Real World Remote Sensing Image Super Resolution [9.7] 超解像技術は、リモートセンシング画像の空間分解能を高め、より効率的な大規模な地球観測アプリケーションを可能にする。
既存のRefSR手法は、クロスセンサーの解像度ギャップや重要な土地被覆の変化など、現実世界の複雑さに苦しむ。
実世界リモートセンシング画像SRのための新しい制御可能な参照誘導拡散モデルであるCRefDiffを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:26:55 GMT)
Curriculum-Guided Layer Scaling for Language Model Pretraining [9.6] 計算効率向上のためのフレームワークであるCGLS(Curriculum-Guided Layer Scaling)を提案する。
CGLSは、データの増大とモデルの成長を同期させる。
モデル深度の増加は、様々なダウンストリームベンチマークにおいて、より良い一般化とゼロショット性能をもたらすことを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:30:51 GMT)
Integrated Communication and Control for Energy-Efficient UAV Swarms: A Multi-Agent Reinforcement Learning Approach [9.5] 本稿では,UAVSwarm支援通信の品質向上を目的とした,統合型通信・制御協調設計機構を提案する。
マルコフ決定過程(MDP)として,共同資源配分と3次元軌道制御問題を定式化する。
我々は,UAV群全体のリアルタイム協調動作を可能にするマルチエージェント強化学習フレームワークを開発した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:23:04 GMT)
Joint Memory Frequency and Computing Frequency Scaling for Energy-efficient DNN Inference [9.3] リソース制約のあるデバイスでは、高いレイテンシとエネルギーオーバーヘッドは避けられない。
この課題に対処するため、ほとんどの研究者は動的電圧と周波数スケーリング(DVFS)技術に焦点を当てている。
本稿ではまず,結合記憶周波数と計算周波数のスケーリングが推定時間とエネルギー消費に与える影響について検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:28:58 GMT)
Characteristic Root Analysis and Regularization for Linear Time Series Forecasting [9.3] 時系列予測は多くの領域において重要な課題である。
近年の研究では、単純な線形モデルの驚くほどの競争性が強調されている。
本稿では時間力学における特性根の役割に焦点を当てる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:06:30 GMT)
Toward Preference-aligned Large Language Models via Residual-based Model Steering [9.2] 本稿では,Residual Steering (PaLRS) を用いた大規模言語モデルの参照アライメントを提案する。
PaLRSは、Large Language Modelsの残留ストリームに符号化された好み信号を利用する。
各種小型オープンソースLLM上でのPaLRSの評価を行った。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:16:16 GMT)
Pragmatic Inference for Moral Reasoning Acquisition: Generalization via Distributional Semantics [9.2] 大規模言語モデル(LLM)の有望な研究方向としてモラル推論が登場した
本稿では, LLMが分布意味論に依存しつつも, 一般化された道徳的推論を実現する方法について検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:40:58 GMT)
LUQ: Layerwise Ultra-Low Bit Quantization for Multimodal Large Language Models [8.9] マルチモーダルLLMの超低ビット(4ビット)量子化に関する最初の研究について述べる。
解析の結果,多モードトークンと中間層アクティベーションは,テキストトークンと比較して,統計的分散とエントロピーが著しく高いことがわかった。
我々はMLLM量子化の新しい戦略であるLUQ:Layerwise Ultra-Low Bit Quantizationを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:20:00 GMT)
Long Context Scaling: Divide and Conquer via Multi-Agent Question-driven Collaboration [8.8] 長いコンテキストを処理するための新しいマルチエージェントフレームワークを提案する。
XpandA(Expand-Agent)は質問駆動ワークフローと動的パーティショニングと結合されている。
XpandAは、フルコンテキスト、RAGおよびそれ以前のエージェントベースのメソッドのベースラインに対する20%の改善と1.5倍の推論高速化を実現している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:52:21 GMT)
TGT: A Temporal Gating Transformer for Smartphone App Usage Prediction [8.7] 本研究では,時間帯に隠蔽表現を条件付ける時間的ゲーティングモジュールを備えたTransformerフレームワークを提案する。
TGTは15の競争ベースラインをはるかに上回り、HR@1で顕著な利益を上げ、コールドスタートシナリオ下で堅牢性を維持する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:32:54 GMT)
HFuzzer: Testing Large Language Models for Package Hallucinations via Phrase-based Fuzzing [8.7] 大規模言語モデル(LLM)はコード生成に広く使用されているが、実用製品に適用した場合、重大なセキュリティリスクに直面している。
パッケージ幻覚に対するLLMのテストは、パッケージ幻覚を緩和し、潜在的な攻撃に対して防御するために重要である。
パッケージ幻覚のためのLLMをテストするための新しいフレーズベースのファジリングフレームワークであるHFUZZERを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:16:43 GMT)
Interpreting deep learning-based stellar mass estimation via causal analysis and mutual information decomposition [8.6] Sloan Digital Sky Survey (SDSS) と Wide-field Infrared Survey Explorer (WISE) から得られたデータを用いて、画像ベースモデルに対する物理的解釈を提供する有意義な結果を得た。
我々の研究は、深層学習と解釈可能性技術を組み合わせることで得られる利益を実証し、よりデータ駆動の天体物理学研究を促進することを約束している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:17:25 GMT)
PEARL: Peer-Enhanced Adaptive Radio via On-Device LLM [8.6] PEARLはデバイス間通信(D2D)における協調的な層間最適化のためのフレームワークである。
コンテキスト認識報酬は、アプリケーション寛容によってレイテンシを正規化し、デバイスバッテリ状態によってエネルギーを変調する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:43:17 GMT)
Focusing on What Matters: Object-Agent-centric Tokenization for Vision Language Action models [8.5] 我々は,視覚・言語・アクション(VLA)モデルのためのオブジェクト・エージェント中心のトークン化であるOat-VLAを提案する。
Oat-VLAは、パフォーマンスを犠牲にすることなく、視覚トークンの数をわずかに減らすことができる。
我々は,Oat-VLA が LIBERO スイート上で OpenVLA の少なくとも2倍の速度で収束していることを明らかにする。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:42:53 GMT)
Explore-Execute Chain: Towards an Efficient Structured Reasoning Paradigm [8.4] Chain-of-Thought(CoT)とその変種は、大規模言語モデル(LLM)の推論能力を著しく向上させた。
E2C$(Explore-Execute Chain)は、推論を2つの異なるフェーズに分離する構造化推論フレームワークである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:48:40 GMT)
EduVidQA: Generating and Evaluating Long-form Answers to Student Questions based on Lecture Videos [8.4] 本稿では,マルチモーダル大規模言語モデル(MLLM)を用いて,オンライン講義から学生の質問に自動的に答える方法について検討する。
EduVidQAデータセットは,296のコンピュータサイエンスビデオから5252対の質問応答ペア(合成と実の両方)で紹介され,さまざまなトピックと難易度をカバーしている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:33:58 GMT)
Merging Memory and Space: A State Space Neural Operator [8.4] State Space Neural Operator (SS-NO) は時間依存偏微分方程式の解演算子を学習するためのコンパクトなアーキテクチャである。
SS-NOは多種多様なPDEベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:46:23 GMT)
StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions [8.3] 伝統的なインパクトモデルは、限られた観測と概念の漂流のために空間的な一般化に苦しむ。
ランドスケープインタラクションを中心とした地層モデルであるStefaLandを紹介した。
我々の知る限り、これは地表面相互作用予測を実証的に改善する最初の地表面基盤モデルである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 00:59:45 GMT)
Comprehension Without Competence: Architectural Limits of LLMs in Symbolic Computation and Reasoning [8.2] 大型言語モデル (LLM) は、記号的推論、算術的精度、論理的整合性を必要とするタスクにおいて、表面流速が著しく低下するが、体系的に失敗する。
本稿では,このような障害の構造的診断を行い,テキスト理解とテキストコンピテンスの間に持続的なギャップがあることを明らかにする。
我々はこの現象を,命令経路と行動経路が幾何学的に,機能的に二分される計算テキストスプリット・ブレイン症候群と呼ぶ。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:21:18 GMT)
Efficient Domain-Adaptive Multi-Task Dense Prediction with Vision Foundation Models [8.2] 本稿では,視覚基礎モデル(VFM)を強力な教師として活用することにより,このギャップを埋める,シンプルで効果的なUDAフレームワークであるFAMDAを紹介する。
提案手法は,基礎モデルを自己学習パラダイムに統合し,対象ドメインに対する高品質な擬似ラベルを生成する。
実験により、FAMDAは、標準の合成から現実のUDAマルチタスク学習ベンチマークにおいて、最先端(SOTA)性能を達成し、日々の適応に挑戦することが示されている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:02:36 GMT)
Diffusion Generative Models Meet Compressed Sensing, with Applications to Imaging and Finance [8.0] CSDM: まずデータセットを潜伏空間に圧縮し、潜伏空間で拡散モデルを訓練し、次に、潜伏空間で生成されたサンプルに圧縮されたセンシングアルゴリズムを適用して元の空間に復号する。
提案手法は, 拡散モデル推論とスパースリカバリを組み合わせることにより, より高速な収束を実現する。
このアプローチの有効性を説明するために,手書きの数字,医療・気候画像,ストレステストのための財務時系列など,さまざまなデータセットを用いて数値実験を行った。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:56:10 GMT)
When Federated Learning Meets Quantum Computing: Survey and Research Opportunities [7.8] 量子フェデレーションラーニング(QFL)は、分散フェデレーションラーニング(FL)モデルのスケーラビリティと効率を改善するために、量子コンピューティング(QC)の進歩を活用する新興分野である。
本稿では,FLがQCに適合する際の課題と解決策について,体系的かつ包括的な調査を行う。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:28:42 GMT)
EfficientMIL: Efficient Linear-Complexity MIL Method for WSI Classification [7.6] パッチ選択モジュールAdaptive Patch Selector (APS) を用いた全スライド画像(WSI)分類のための新しい線形複雑MIL手法であるEfficientMILを導入する。
効率的なMILは、複数の病理組織学データセットにまたがる他のMIL法よりも優れた計算効率の向上を実現している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:47:11 GMT)
On The Variability of Concept Activation Vectors [7.5] 本稿では,概念活性化ベクトル(CAV)の理論解析を行い,その変動性を定量化する。
いくつかの実生活データセットの実験により確認され、普遍的な結果に向けて指摘された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:23:31 GMT)
Automated Vulnerability Validation and Verification: A Large Language Model Approach [7.5] 本稿では、生成AI、特に大規模言語モデル(LLM)を利用したエンドツーエンド多段階パイプラインを提案する。
本手法は,国立脆弱性データベース(National Vulnerability Database)のCVE開示情報から抽出する。
これは、Retrieval-Augmented Generation (RAG)を使用して、外部の公開知識(例えば、脅威アドバイザリ、コードスニペット)で拡張する。
パイプラインは生成されたアーティファクトを反復的に洗練し、テストケースでのアタック成功を検証し、複雑なマルチコンテナセットアップをサポートする。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:16:12 GMT)
Is Thompson Sampling Susceptible to Algorithmic Collusion? [7.4] プレイヤーがトンプソンサンプリングを使用すると、ゲームダイナミクスはナッシュ平衡に収束することを示す。
プレイヤーが意図的に競争戦略を展開していないにもかかわらず、このケースではアルゴリズムによる共謀は発生しないことを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:33:32 GMT)
Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs [7.4] 本稿では2つの特殊モデルからなるエージェントシステムであるFathom-DeepResearchを紹介する。
ひとつは、ライブWeb検索とターゲットWebページクエリによるエビデンスベースの調査に最適化された、DeepSearchモデルであるFathom-Search-4Bである。
2つ目は、Qwen3-4Bから訓練されたFathom-Synthesizer-4Bである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:58:11 GMT)
Game-Oriented ASR Error Correction via RAG-Enhanced LLM [7.3] 一般的なASRシステムは、ショートフレーズ、ラピッドスピーチ、ジャーゴン、ノイズといったゲーム固有の課題に苦しむ。
本稿では,大規模言語モデル,RAG(Retrieval-Augmented Generation),データ拡張戦略を統合したGO-AECフレームワークを提案する。
GO-AECは文字誤り率を6.22%、文誤り率を29.71%削減し、ゲームシナリオにおけるASRの精度を大幅に改善した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:12:07 GMT)
Controllable Generation of Large-Scale 3D Urban Layouts with Semantic and Structural Guidance [7.3] 大規模3次元ベクトル都市レイアウト生成のための制御可能なフレームワークを提案する。
幾何学的特徴や意味的属性,エッジ重み,建物の高さをグラフに埋め込むことで,本手法は2次元レイアウトをリアルな3次元構造に拡張する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:08:17 GMT)
Two-Stage Nuisance Function Estimation for Causal Mediation Analysis [7.2] Tchetgen Tchetgen and Shpitser (2012) は、メディエーション機能に対する効率的で、偏りがあり、堅牢な影響関数に基づく推定器を導入した。
この推定器は治療、メディエーター、および結果平均メカニズムに依存している。
本研究では、4つのニュアンス関数を必要とする可能性関数の特定の再パラメータ化について考察する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:55:08 GMT)
GPS-MTM: Capturing Pattern of Normalcy in GPS-Trajectories with self-supervised learning [7.2] 大規模モビリティデータの基礎モデルであるGPSMasked Trajectory Transformer(GPS-MTM)を紹介する。
GPS-MTMはモビリティを2つの相補的なモードに分解する:状態(興味のあるカテゴリー)と行動(エージェント遷移)
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:00:50 GMT)
Disentangling Score Content and Performance Style for Joint Piano Rendering and Transcription [7.2] EPR(Expressive Performance rendering)とAPT(Automatic piano transcription)は、音楽情報検索において基本的な逆のタスクである。
本稿では,EPRとAPTを協調的にモデル化する統合フレームワークを提案する。
我々のフレームワークは変換器に基づくシーケンス・ツー・シーケンスアーキテクチャに基づいて構築されており、シーケンス・アライン・データのみを用いて訓練されている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:36:33 GMT)
SURGE: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors [7.2] 大規模言語モデル(LLM)がコード実行予測の代理モデルとして機能するかどうかを検討する。
オープンソースおよびプロプライエタリ LLM の広範な分析を通じて,スケーリング法則,データ効率,予測精度について検討する。
計算機処理における効率的なサロゲートとしてのLCMの実現可能性に関する重要な知見を明らかにした。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:36:20 GMT)
GeoFunFlow: Geometric Function Flow Matching for Inverse Operator Learning over Complex Geometries [7.2] 偏微分方程式(PDE)が支配する逆問題は、科学や工学において重要である。
複素幾何学上の逆問題に対する幾何拡散モデルフレームワークであるEm GeoFunFlowを紹介する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:21:52 GMT)
Open-DeBias: Toward Mitigating Open-Set Bias in Language Models [7.0] 我々は,テキストベースの質問応答タスクにおいて,オープンセットバイアス検出と緩和という新たな課題に取り組む。
OpenBiasBenchは、様々なカテゴリやサブグループにまたがるバイアスを評価するために設計されたベンチマークである。
また,新しいデータ効率,パラメータ効率のデバイアス法であるOpen-DeBiasを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:08:39 GMT)
DeepONet for Solving Nonlinear Partial Differential Equations with Physics-Informed Training [7.0] 本研究では,物理インフォームドトレーニングにおけるDeepONetの性能について検討し,(1)ディープブランチとトランクネットワークの近似能力,(2)ソボレフノルムの一般化誤差の2点に着目した。
以上の結果から,複雑な分岐ネットワークが性能向上に寄与するのに対し,トランクネットワークは比較的シンプルに維持される場合が最も有効であることがわかった。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:23:10 GMT)
SVAC: Scaling Is All You Need For Referring Video Object Segmentation [6.9] Video Video Object (RVOS) は、自然言語による記述に基づいて、対象物をビデオシーケンスに分割することを目的としている。
マルチモーダル大言語モデル(LMML)の最近の進歩は,テキスト・ビデオ理解の強化を通じてRVOSの性能を改善している。
入力フレームとセグメンテーショントークンをスケーリングすることでRVOSを改善する統一モデルSVACを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:02:09 GMT)
Time-Shifted Token Scheduling for Symbolic Music Generation [6.8] 遅延に基づくスケジューリング機構を適用し、デコードステップを越えて複合的なトークンを拡張する。
本手法は,標準的な複合トークン化よりもすべてのメトリクスを改善し,そのギャップを微細なトークン化に狭める。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:52:44 GMT)
Scrambling-Enhanced Quantum Battery Charging in Black Hole Analogues [6.8] ブラックホールは自然界で最速の量子情報スクランブラを構成する。
ブラックホールの衝突が、予め設定された衝突パラメータの制御されたクエンチを介して帯電に与える影響について検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:06:44 GMT)
Controllable Adversarial Makeup for Privacy via Text-Guided Diffusion [6.7] 対面認識技術は、顔画像に逆らうことによってプライバシーを保護する。
生成的メイクベースのアプローチは最も広く研究されている。
我々は,ユーザ定義のテキストプロンプトによって誘導される局所的な対角化粧を生成する新しい拡散ベースのフレームワークであるMASQUEを開発する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:12:16 GMT)
Extracting Moore Machines from Transformers using Queries and Counterexamples [6.6] 正規言語で訓練された変換器の高レベル抽象化として有限状態オートマトンを構築する。
文献で使用される多くのトレーニングタスクをそれらにマッピングできるので、ムーアマシンを抽出する。
本稿では,正のみの学習法とシーケンス精度を詳細に研究することで,このアプローチの有用性を実証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:25:45 GMT)
MemMamba: Rethinking Memory Patterns in State Space Model [6.5] マンバのような選択的状態空間モデルは O(n) 時間と O(1) 繰り返しの推論で高い効率性を示すが、その長距離メモリは指数関数的に崩壊する。
長文読解時の塩分情報の蒸留・保存方法に着想を得て,MemMambaを提案する。
MemMambaは、長期間のベンチマークで既存のMambaとTransformerよりも大幅に改善されている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:40:58 GMT)
Conformal prediction of future insurance claims in the regression problem [6.5] 本稿では、有効な予測のための一般的な機械学習戦略である共形予測を紹介する。
提案手法はモデルフリーとチューニングフリーの両方である。
また、事前指定されたカバレッジの確率レベルで有限サンプルの妥当性を保証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:25:54 GMT)
ReLumix: Extending Image Relighting to Video via Video Diffusion Models [5.9] ビデオのポストプロダクション中に照明を制御することは、計算写真において重要な目標である。
本稿では、時間合成からリライトを分離する新しいフレームワークであるReLumixを紹介する。
ReLumixは、合成データに基づいて訓練されているが、実世界のビデオに対する競争上の一般化を示している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:35:33 GMT)
CLEAR: Calibrated Learning for Epistemic and Aleatoric Risk [5.8] 2つの異なるパラメータを持つ校正法であるCLEARを提案する。
予測可能性-計算可能性-安定性フレームワークから引き出された(i)量子不確実性と(ii)アンサンブルに対して、(i)量子レグレッションでどのように使用できるかを示す。
17の多様な実世界のデータセットで、CLEARはインターバル幅で平均28.2%と17.4%の改善を達成した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:18:33 GMT)
Communication-aware Wide-Area Damping Control using Risk-Constrained Reinforcement Learning [5.7] 非理想的な通信リンク、特に遅延は、電力系統の高速ネットワーク制御に重大な影響を及ぼす。
伝統的に、このサイバー物理結合に対処するために遅延推定と補償アプローチが採用されている。
本稿では,通信遅延をターゲットとしたリスク制約付きフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:51:11 GMT)
Finite-Time Bounds for Two-Time-Scale Stochastic Approximation with Arbitrary Norm Contractions and Markovian Noise [5.7] 2時間スケール近似(英: Two-time-scale Approximation、SA)は、強化学習と最適化に応用した反復アルゴリズムである。
強化学習の応用により、非線型2時間スケール SA 上の最初の平均正方形を与える。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:03:17 GMT)
3D Foundation Model for Generalizable Disease Detection in Head Computed Tomography [5.7] 本稿では,頭部CTの基礎モデルであるFM-CTについて紹介する。
提案手法では,手動アノテーションを必要とせずに,361,663個の非コントラスト3次元頭部CTスキャンの大規模データセット上で,ディープラーニングモデルを事前学習する。
以上の結果から, 自己監督基盤モデルにより下流診断における性能が著しく向上することが示唆された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:50:50 GMT)
TF-Bench: Evaluating Program Semantics Reasoning with Type Inference in System F [5.6] 大規模言語モデル(LLM)は、ソフトウェアエンジニアリングエコシステムにますます統合されています。
本稿では,システムFの型推論に基づいてLLM推論を評価するベンチマークであるTF-Benchを紹介する。
TF-Bench_pureは、純粋に意味論的に駆動されるTF-Benchの変種である。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:57:42 GMT)
Self-Normalized Resets for Plasticity in Continual Learning [5.6] SNR(Self-Normalized Resets)は、ニューロンの重みをリセットすることで可塑性損失を緩和する適応アルゴリズムである。
我々は,SNRが競合するアルゴリズムと比較して常に優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:26:18 GMT)
Automatic Speech Recognition for Greek Medical Dictation [5.5] 本論文の主な目的は,ギリシャ語医療用音声書き起こしのためのドメイン固有システムを作ることである。
自動音声認識技術とテキスト修正モデルを組み合わせたシステムを開発した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:15:47 GMT)
Position: Thematic Analysis of Unstructured Clinical Transcripts with Large Language Models [5.4] LLM(Large Language Model)は、構造化されていない臨床転写のセマンティック解析をサポートする。
既存の評価方法は大きく異なり、進歩を妨げ、研究全体で有意義なベンチマークを防ぐ。
本稿では,妥当性,信頼性,解釈可能性の3つの側面に着目した評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:36:22 GMT)
HyMaTE: A Hybrid Mamba and Transformer Model for EHR Representation Learning [5.4] 縦型データ表現に適したハイブリッドモデルであるHyMaTE(HyMaTE:HyMaba and Transformer Model for EHR Representation Learning)を提案する。
複数の臨床データセット上の予測タスクでモデルをテストすることにより、HyMaTEがより効果的で、よりリッチで、よりニュアンスに統一されたEHRデータの表現をキャプチャする能力を示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:24:15 GMT)
Mode Selection in Quantum Nonlinear Optics Using Optical Resonators [5.3] 非線形プロセスにおけるモードセレクタとしての光共振器の新しい応用について述べる。
まず,共振器による自発的なダウンコンバージョンにより,デコリレーションと波長の柔軟性を向上したスペクトル非相関光子対を生成できることを示す。
次に,高分解能時間モード選択性と正確なスペクトル制御を有する量子パルスゲートを実現する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:54:50 GMT)
Deep Taxonomic Networks for Unsupervised Hierarchical Prototype Discovery [5.3] 既存の手法は、しばしば構造をクラスの数に結び付け、中間階層レベルで利用可能なリッチなプロトタイプ情報を未利用にする。
我々はこれらのギャップを埋めるために設計された新しい潜伏変数アプローチであるDeep Taxonomic Networkを導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:13:32 GMT)
$\mathbf{R}^3$: Reconstruction, Raw, and Rain: Deraining Directly in the Bayer Domain [5.2] ほとんどの再構成ネットワークはISP後のsRGBイメージでトレーニングされているが、イメージ信号処理パイプラインは、色やクリップのダイナミックレンジを不可逆的に混合し、細部がぼやけている。
本報告では, 雨害対策として雨害対策を応用し, 生モザイクを直接学習することで, より優れた再現性が得られることを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:31:24 GMT)
Detecting and Rectifying Noisy Labels: A Similarity-based Approach [5.2] 本稿では,ニューラルネットワークの直観的特徴を利用したポストホック,モデルに依存しない誤り検出と修正手法を提案する。
我々の考えは、誤ラベル付きデータポイントと真のクラスデータポイントとの類似性は他のクラスのデータポイントよりも高いという観察に基づいている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:41:56 GMT)
Variable Rate Image Compression via N-Gram Context based Swin-transformer [5.1] 本稿では,学習画像圧縮のためのN-gramコンテキストベースのSwin変換器を提案する。
我々は,N-gramコンテキストをSwin Transformerに組み込むことで,高解像度画像再構成における大域無視の限界を克服する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:46:32 GMT)
Avoid Catastrophic Forgetting with Rank-1 Fisher from Diffusion Models [5.1] 破滅的な忘れは、ニューラルモデルにおける継続的な学習の中心的な障害である。
我々は,すでに高品質な再生データを生成することができる拡散モデルの勾配幾何学について検討する。
EWCのランク1変種は、対角近似と同等に安価であるが、支配的な曲率方向を捉えている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:51:16 GMT)
TReF-6: Inferring Task-Relevant Frames from a Single Demonstration for One-Shot Skill Generalization [5.1] 本稿では,単純化された6DoFタスク関連フレームを単一軌道から推定するTReF-6を提案する。
提案手法は,DMP(Dynamic Movement Primitive)のパラメータ化の基準となる局所フレームの原点を定義するために,軌道形状から純粋に影響点を同定する。
推定フレームは視覚言語モデルを介して意味的に接地され、グラウンドド・SAMによって新しいシーンにローカライズされる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:29:06 GMT)
Evaluating the Impact of Radiographic Noise on Chest X-ray Semantic Segmentation and Disease Classification Using a Scalable Noise Injection Framework [4.9] 我々は2つの重要な胸部X線作業における量子(Poisson)と電子(Gaussian)ノイズのシミュレーションに対する最先端畳み込みニューラルネットワーク(CNN)の堅牢性を評価する。
セマンティックセグメンテーションモデルは非常に脆弱で、肺セグメンテーション性能は重度の電子ノイズ下で崩壊した。
我々は、AtelectasisとPneumothoraxを区別するなどの特定のタスクが、量子ノイズの下で破滅的に失敗することを発見した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:09:43 GMT)
End-to-End Deep Learning for Predicting Metric Space-Valued Outputs [4.9] 本稿では,計量空間値出力を予測するためのディープラーニングフレームワークであるE2Mを紹介する。
E2Mは、トレーニング出力よりも重み付けされたFr'teche手段を介して予測を行う。
以上の結果から,E2Mは常に最先端の性能を達成でき,その優位性はより大きいサンプルサイズでより顕著になることがわかった。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 00:46:12 GMT)
Guide: Generalized-Prior and Data Encoders for DAG Estimation [4.3] 我々は,Large Language Model (LLM) の生成した隣接行列と,デュアルエンコーダアーキテクチャによる観測データを統合するフレームワークである textbfGUIDE を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:35:21 GMT)
GPM: The Gaussian Pancake Mechanism for Planting Undetectable Backdoors in Differential Privacy [4.3] 意図しないプライバシー喪失のいくつかの出来事は、数値的な問題と微分プライバシーソフトウェアの不適切な構成に起因する。
本稿では、広く使われているガウスのメカニズム(GM)と計算的に区別できない新しいメカニズムであるガウスのパンケーキ機構(GPM)を提案する。
GMの数値的な問題による意図しないプライバシの損失とは異なり、GPMはデータプライバシに対する敵対的だが検出不可能なバックドア攻撃である。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:14:06 GMT)
Color-Pair Guided Robust Zero-Shot 6D Pose Estimation and Tracking of Cluttered Objects on Edge Devices [4.3] 本稿では,エッジデバイス上での効率的な実行を目的とした統合フレームワークを提案する。
当社のアプローチの鍵は、ライトと不変なカラーペアの特徴表現の共有です。
最初の見積のために、この機能はライブRGB-Dビューとオブジェクトの3Dメッシュの間の堅牢な登録を容易にする。
追跡に関しては、同じ特徴論理が時間的対応を検証し、軽量モデルが物体の動きを確実に回帰させることができる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:07:49 GMT)
SIE3D: Single-image Expressive 3D Avatar generation via Semantic Embedding and Perceptual Expression Loss [4.2] SIE3Dは、単一の画像と記述テキストから表現力のある3Dアバターを生成するフレームワークである。
画像からアイデンティティの特徴を融合させ、新しい条件付けスキームを通じてテキストからセマンティックな埋め込みを行う。
テキストを正確に一致させるために、革新的な知覚的表現損失関数を導入している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:56:42 GMT)
A Weather Foundation Model for the Power Grid [4.1] 我々はSilurian AIのWFM, Generative Forecasting Transformer (GFT)を微調整する
5つのグリッドクリティカル変数に対して、ハイパーローカルでアセットレベルの予測を提供する。
平均精度は0.72で、頭頂部ライムアイス検出を行う。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:05:46 GMT)
Symbolic Imitation Learning: From Black-Box to Explainable Driving Policies [4.1] シンボリック・イミテーション・ラーニング(SIL)を導入し、合成データセットから説明可能かつ一般化可能な駆動ポリシーを導出する。
SILは、様々な運転条件の強い性能を維持しながら、ポリシーの透明性を著しく向上させる。
これらの知見は、より安全で信頼性の高い自律システムを促進するために、ILPを模倣学習に統合する可能性を強調している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:34:29 GMT)
From Fields to Splats: A Cross-Domain Survey of Real-Time Neural Scene Representations [3.8] この調査は、SLAM、テレプレゼンスと遠隔操作、ロボット操作、および3Dコンテンツ生成において、3DGSがどのように採用されているかを調べる。
3DGSがNeRFベースのアプローチに取って代わりつつある理由を説明する統一された研究質問に関するレビューをまとめる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:30:50 GMT)
Contrastive Learning Enhances Language Model Based Cell Embeddings for Low-Sample Single Cell Transcriptomics [3.8] 大規模言語モデル(LLM)は、自然言語処理や生成、コンピュータビジョン、マルチモーダル学習といった分野にまたがるリッチな表現を生成する能力を示している。
本稿では、単一セルRNAシークエンシング(scRNA-seq)とLLMを統合し、知識インフォームド遺伝子埋め込みを導出する計算フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 00:45:39 GMT)
Optimism as Risk-Seeking in Multi-Agent Reinforcement Learning [3.3] リスク探索の目的を楽観主義として解釈する原則的枠組みを提案する。
我々は、エントロピーリスク/KL-ペナルティ設定の明示的な公式を含む楽観的値関数に対するポリシー勾配定理を導出する。
この枠組みはリスクに敏感な学習と楽観主義を統一し,MARLにおける協調に対する理論的根拠と実践的効果的なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:44:59 GMT)
Towards Interpretable Visual Decoding with Attention to Brain Representations [3.3] 近年の研究では、複雑な視覚刺激が深部生成モデルを用いて人間の脳活動からデコードできることが示されている。
視覚的デコードフレームワークであるNeuroAdapterを提案する。
本研究は、視覚神経科学のレンズを通して、脳と画像の終末復号化の可能性を強調し、拡散モデルを解釈する方法を確立するものである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:55:55 GMT)
A Hierarchical Structure-Enhanced Personalized Recommendation Model for Traditional Chinese Medicine Formulas Based on KG Diffusion Guidance [3.2] 本稿では,知識グラフ拡散誘導,すなわちTCM-HEDPRに基づく,新しい階層構造付きパーソナライズドレコメンデーションモデルを提案する。
具体的には,患者対人的なプロンプトシーケンスを用いた症状表現を事前訓練し,データ拡張にプロンプト指向のコントラスト学習を適用した上で,KG誘導の同種グラフ拡散法と自己認識機構を統合し,非線形症状-ハーブ関係をグローバルに捉えた。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 01:40:01 GMT)
Multiple Concurrent Proposers: Why and How [3.1] 単一プロモーターブロックチェーンはマイナー抽出可能な値(MEV)に悩まされる
我々は,これらの特性を正確に提供するマルチ並列プロポーサ (MCP) プロトコルを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:24:18 GMT)
A Novel Hybrid Deep Learning and Chaotic Dynamics Approach for Thyroid Cancer Classification [3.1] 本稿では,適応畳み込みニューラルネットワーク(CNN)とCohen-Daubechies-Feauveau(CDF9/7)ウェーブレットを結合するインテリジェントな分類法を提案する。
DDTI甲状腺超音波画像(n = 1,638画像,819悪性/819良性)を5倍のクロスバリデーションを用いて評価した。
提案手法は98.17%の精度、98.76%の感度、97.58%の特異性、97.55%のF1スコア、AUCは0.9912である。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:46:31 GMT)
VFSI: Validity First Spatial Intelligence for Constraint-Guided Traffic Diffusion [3.1] 現在のモデルは、物理的妥当性をアーキテクチャ要求よりも創発的な性質として扱う。
本稿では,拡散サンプリング中のエネルギーベース誘導による制約を強制する,妥当性第一空間知能(VFSI)を提案する。
200のシナリオで、VFSIは衝突率を67%(24.6%から8.1%)削減し、全体的な妥当性を87%(50.3%から94.2%)改善している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:48:49 GMT)
Med-PU: Point Cloud Upsampling for High-Fidelity 3D Medical Shape Reconstruction [3.0] 骨盤形状の正確な再構築のために,医用画像セグメンテーションと点雲アップサンプリングを統合したフレームワークであるMed-PUを提案する。
ランドマークやPCAベースの統計形状モデルとは異なり、Med-PUは大規模3次元形状データから直接暗黙の解剖学を学習する。
Med-PUは、アーティファクトを低減しつつ、表面品質と解剖学的忠実度を一貫して改善し、入力密度間の堅牢性を実証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:16:30 GMT)
Adapting Large Language Models to Mitigate Skin Tone Biases in Clinical Dermatology Tasks: A Mixed-Methods Study [3.0] 皮膚疾患に対するSkinGPT-4(SkinGPT-4)の性能バイアスについて検討した。
我々は、SkinGPT-4のバックボーンを利用して、カスタム皮膚疾患分類タスクのための微調整モデルを開発した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:40:40 GMT)
PVTAdpNet: Polyp Segmentation using Pyramid vision transformer with a novel Adapter block [2.6] PVTAdpNet(Pyramid Vision Transformer Adapter Residual Network)を導入する。
このモデルは、U-Netスタイルのエンコーダ・デコーダ構造と、ピラミッドビジョントランスフォーマーのバックボーン、新しい残留ブロック、アダプタベースのスキップ接続を統合している。
PVTAdpNetはリアルタイムで正確なポリプセグメンテーションを実現し、ベンチマークデータセット上での優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:55:50 GMT)
How Does A Text Preprocessing Pipeline Affect Ontology Matching? [2.5] トークン化と正規化(フェーズ1テキストプリプロセッシングに分類される)は、ストップワードの除去やステミング/レマタイズよりも効果的である。
本稿では,第2相テキスト前処理で発生する不要な偽マッピングを修復する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:43:59 GMT)
WAREX: Web Agent Reliability Evaluation on Existing Benchmarks [2.3] 本稿では,既存のベンチマークを用いた Web Agent Reliability Evaluation を提案する。
WebArena、WebVoyager、REALの3つの人気のあるベンチマークでWAREXの影響を測定します。
実験の結果,WAREXの導入はタスク成功率の大幅な低下を招き,最先端エージェントの堅牢性に限界があることが示唆された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:51:05 GMT)
MAUSAM: An Observations-focused assessment of Global AI Weather Prediction Models During the South Asian Monsoon [2.3] 南アジアモンスーンにおけるAI不確実性の測定(MAUSAM:Measuring AI Uncertainty in South Asian Monsoon)について,7つのAIベースの予測システムの評価を行った。
AIモデルは、幅広い変数にわたるモンスーン中の印象的な予測スキルを示しています。
モデルは、極度の降水量の過小予測のような、より微細なスケールで体系的なエラーを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:58:49 GMT)
Similarity-Based Assessment of Computational Reproducibility in Jupyter Notebooks [2.3] Jupyter Notebookの再実行は、さまざまな要因によって必ずしも同じ結果を生成するとは限らない。
本稿では,類似度に基づく再現性指標(SRI)を紹介する。
SRIは、異なるタイプのPythonオブジェクトに特有の類似度メトリクスに基づいた、新しいメソッドを採用している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:01:51 GMT)
Low-Overhead and High-Fidelity Preparation of Logical Non-Clifford States with Multi-Level Transversal Injection [2.3] 状態蒸留またはゲート合成は通常、耐故障性回転ゲートを実装するために使用される。
任意のクリフォード階層レベルで回転状態を作成するためのMLTI(Multi-level Injection)法を提案する。
MLTIは従来の手法に比べてオーバーヘッドを著しく低減しつつ高い忠実度を達成する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:52:13 GMT)
Measurement of Medial Elbow Joint Space using Landmark Detection [1.8] 本研究は関節腔を計測する新しい超音波肘部データセットを提案する。
このデータセットは、22人の被験者から4,201個の肘超音波画像からなり、上腕骨と尺骨にランドマークの注釈が付けられている。
本研究では,熱マップに基づく,回帰に基づく,トークンに基づくランドマーク検出手法を用いて,提案したデータセットを用いた共同空間計測手法の評価を行った。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:29:22 GMT)
EWC-Guided Diffusion Replay for Exemplar-Free Continual Learning in Medical Imaging [1.8] 患者を記憶しない継続的学習フレームワークを提案する。
コンパクトなVision Transformerバックボーンを用いて、8つのMedMNIST v2タスクとCheXpertを評価した。
その結果,臨床画像モデルの拡張性,プライバシに配慮した継続的適応のための実践的経路が示唆された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:23:46 GMT)
From Occasional to Steady: Habit Formation Insights From a Comprehensive Fitness Study [1.7] この研究は、トゥルキエ最大のスポーツチェーンであるマルス・アスレティック・クラブ(Mars Athletic Club)のデータを利用する。
生活習慣形成には,特定の参加期間が不可欠であることが示唆された。
因果推論分析を用いて、パーソナライズされたガイダンスと社会的ダイナミクスが長期にわたるエンゲージメントの重要な要因であることを実証した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:04:13 GMT)
Ancestry Tree Clustering for Particle Filter Diversity Maintenance [1.7] 粒子フィルタリングにおける線形時間多様性維持手法を提案する。
系統樹のトポロジーに基づいて粒子をクラスターし、十分に大きなサブツリーの密接な関連粒子をまとめる。
我々は,マルチモーダルロボットシミュレーションと実世界のマルチモーダル屋内環境におけるアプローチを検証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:45:03 GMT)
Virtual Nodes based Heterogeneous Graph Convolutional Neural Network for Efficient Long-Range Information Aggregation [1.7] 仮想ノードはグラフ内の特定のタイプのすべてのノードと相互接続された補助ノードである。
VN-HGCNは4ドルの層しか持たない効果的な情報集約を実現する。
VN-HGCNの有効性を実証評価した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:52:18 GMT)
SEARA: An Automated Approach for Obtaining Optimal Retrievers [1.6] 本稿では,サブセットサンプリング手法を用いて評価データの課題に対処するSEARAを提案する。
本手法は,実際のユーザクエリに基づいて,完全自動検索を低コストで実現する。
我々は,知識に基づくQ&Aシステムや検索に基づく旅行アシスタントなど,従来のRAGアプリケーションにまたがる手法を検証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:55:24 GMT)
BTC-SAM: Leveraging LLMs for Generation of Bias Test Cases for Sentiment Analysis Models [1.6] 感性分析(SA)モデルは、現実世界の応用において有害な社会的バイアスを持つ。
最小限の仕様を持つSAモデルにおいて、バイアステストのための高品質なテストケースを生成する新しいバイアステストフレームワークであるBTC-SAMを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:39:40 GMT)
Equation-Free Coarse Control of Distributed Parameter Systems via Local Neural Operators [1.5] 本稿では,局所的ニューロ演算子を顕微鏡・メソスコピックデータで訓練し,効率的な短時間解演算子を得るデータ駆動型代替手法を提案する。
その後、Krylov-Arnoldi は支配的な固有スペクトルを近似し、ヤコビアン集合を明示せずに開ループのスローダイナミクスを捕捉する縮小モデルを生成する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:01:53 GMT)
Latent Representation Learning from 3D Brain MRI for Interpretable Prediction in Multiple Sclerosis [1.5] InfoVAE-Med3Dは、認知低下の解釈可能なバイオマーカーをターゲットにした、3次元脳MRIの潜在表現学習手法である。
提案手法はInfoVAEを拡張して画像と潜伏変数間の相互情報を明示的に最大化する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 04:22:56 GMT)
A Survey on Self-supervised Contrastive Learning for Multimodal Text-Image Analysis [1.5] 近年のテキストイメージモデルにおけるコントラスト学習のアプローチの概要について述べる。
第3に、プロセスで使用されるテクニックの最新の進歩を紹介し、議論する。
テキスト画像に基づく自己教師付きコントラスト学習モデルの最近の技術応用について論じる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:14:54 GMT)
Min-Max Optimisation for Nonconvex-Nonconcave Functions Using a Random Zeroth-Order Extragradient Algorithm [1.4] 変動不等式の観点から、min-max問題について議論する。
制約のない問題に対して、ZO-EGアルゴリズムのNC-NC目的関数の$epsilon$-stationary点近傍への収束を確立する。
非微分可能の場合、目的関数の滑らかなバージョンのエプシロン$定常点の近傍へのZO-EGアルゴリズムの収束を証明する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:55:46 GMT)
Merge Now, Regret Later: The Hidden Cost of Model Merging is Adversarial Transferability [1.3] モデルマージング(MM)が対向例の伝達性に及ぼす影響について検討する。
我々は、MMは、95%以上の相対的な転送攻撃の成功率を持つ、転送攻撃に対して確実に防御できないことを示す。
本研究は,MMを用いたより安全なシステムを設計するための重要な知見を提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:01:21 GMT)
AgentGuard: Runtime Verification of AI Agents [1.1] AgentGuardは、エージェントAIシステムの実行時検証のためのフレームワークである。
動的確率保証(Dynamic Probabilistic Assurance)と呼ばれる新しいパラダイムを通じて、継続的な量的保証を提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:08:50 GMT)
Large Language Models and Futures Price Factors in China [1.1] 我々は、中国先進国市場向けの因子モデル構築において、GPT(Generative Pre-trained Transformer)のような大規模言語モデルの能力を活用している。
長短長の戦略と長短の戦略により、単一要素と多要素のポートフォリオを設計するための40の要素をうまく獲得する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:24:10 GMT)
From Frustration to Fun: An Adaptive Problem-Solving Puzzle Game Powered by Genetic Algorithm [1.0] 本稿では,問題解決スキル開発を支援するゲームを用いて,適応型問題解決について検討する。
適応型AIを利用したパズルゲームを用いて、適応型問題解決システムは遺伝的アルゴリズムを用いてパスフィンディングに基づくパズルを動的に生成する。
プレイヤモデリングシステムは、ユーザインタラクションを記録し、パズルの生成を通知し、プレイヤのさまざまなメトリクスに基づいて、ターゲットの難易度を近似する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:40:14 GMT)
Comparison of Hyperplane Rounding for Max-Cut and Quantum Approximate Optimization Algorithm over Certain Regular Graph Families [1.0] Goemans-Williamson アルゴリズムによる Max-Cut の近似は 0.912-approximation で達成される。
エッジウェイトを摂動することで計算的に難解なインスタンスの構築について検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:00:28 GMT)
Jackal: A Real-World Execution-Based Benchmark Evaluating Large Language Models on Text-to-JQL Tasks [0.9] 自然言語クエリをJira JQLにマッピングするための、オープンで実世界の実行ベースのベンチマークはありません。
検証済みのJQLクエリとペアリングされた10万の自然言語(NL)リクエストと、20万以上の問題のあるライブJiraインスタンス上での実行ベースの結果からなる、新しい大規模テキスト・トゥ・JQLベンチマークであるJackalを紹介した。
パラメータサイズ、オープンおよびクローズドソースモデル、実行精度、正確な一致、正準正則整合を対象とする23大言語モデル(LLM)のテキストからJQL結果について報告する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:23:22 GMT)
Evaluating the Effectiveness of Transformer Layers in Wav2Vec 2.0, XLS-R, and Whisper for Speaker Identification Tasks [0.9] 本研究では,Wav2Vec 2.0,XLS-R,Whisperの話者識別タスクにおける3種類の高度な音声エンコーダモデルの性能を評価する。
We found that Wav2Vec 2.0 and XLS-R capture speaker-specific features in their early layer, with fine-tuning improve stability and performance。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:00:24 GMT)
From Unstable to Playable: Stabilizing Angry Birds Levels via Object Segmentation [0.9] 既存のPCGモデルによって生成された不安定なレベルを同定し,修復する手法を提案する。
我々はAngry Birdsをケーススタディとして使用し、確立したPCGアプローチによるゲームレベルの手法を実証した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:15:19 GMT)
AutoML in Cybersecurity: An Empirical Study [0.9] 本稿では,11の公開サイバーセキュリティデータセットを対象とした8つのオープンソースAutoMLフレームワークを体系的に評価する。
結果は、ツールやデータセット間での大幅なパフォーマンスの変動を示しており、一貫して優れたソリューションは存在しない。
主な課題は、敵の脆弱性、モデルドリフト、不適切な機能エンジニアリングである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:52:46 GMT)
Quantum Mpemba effect without global symmetries [0.8] ムペンバ効果(Mpemba effect)は、最初に平衡から遠く離れた系が平衡に近づくよりも速く緩和する現象であり、古典的な系において広く研究されている。
我々は、QMEは、そのような対称性を欠く汎用的で非可積分な多体システムにおいてユビキタスであると主張する。
横方向および縦方向の場を持つ量子イジングモデルのようなパラダイムモデルを用いて、QMEは初期状態のエネルギー密度によって理解可能であることを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:17:35 GMT)
From Edge to HPC: Investigating Cross-Facility Data Streaming Architectures [0.8] DTS(Direct Streaming)、PRS(Proxied Streaming)、MSS(Managed Service Streaming)の3つのクロスファシリティデータストリーミングアーキテクチャについて検討する。
我々の研究では、DTSは最小のホップパスを提供し、スループットの向上とレイテンシの低減を実現しているのに対し、MSSは複数のユーザに対してデプロイメントの実現可能性とスケーラビリティを提供していますが、大きなオーバーヘッドが発生しています。
PRSは、ほとんどの場合、DTSに匹敵するパフォーマンスを備えたスケーラブルなアーキテクチャを提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:54:38 GMT)
Do LLMs Understand Romanian Driving Laws? A Study on Multimodal and Fine-Tuned Question Answering [0.7] 本稿では,ルーマニアの運転法QAにおけるLarge Language Models (LLMs) について解説した。
我々は1,208件の検索データセット(387件のマルチモーダル)を公開し、テキストのみのSOTAシステムとマルチモーダルのSOTAシステムを比較した。
Llama 3.1-8B-InstructとRoLlama 3.1-8B-Instructのドメイン特異的微調整の影響を測定した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:58:00 GMT)
Semantic Representation of Processes with Ontology Design Patterns [0.7] オントロジーデザインパターン(ODP)は、繰り返し発生する問題に対してモジュール型セマンティックおよび再利用可能なモデリングソリューションを提供する。
この研究は、科学的・工学的なプロセスモデリングに関係し、その構造に埋め込まれた暗黙的なデザインパターンを特定した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:42:01 GMT)
Quantum state-preparation control in noisy environment via most-likely paths [0.6] 雑音の影響を受けないオープン量子系の別の見方として、平均力学を仮定的雑音軌道に到達させる方法を考える。
本稿では,騒音発生確率に基づく状態準備問題の制御戦略を提案する。
概念実証として,提案手法を劣化雑音下でのqu状態生成に適用し,任意の目標状態に対する制御されたRabiドライブの解析的解決を行う。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:04:52 GMT)
Cognifying Education: Mapping AI's transformative role in emotional, creative, and collaborative learning [0.6] 感情的サポート、創造性、文脈理解、学生参加、問題解決、倫理と道徳、コラボレーションの7つの主要な領域について検討する。
私たちは、AIが人間の教育者を補完し、強化することで、認知、社会的、感情的な側面を越えてより豊かな学習経験を育むことができることに気付きました。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:32:10 GMT)
Do Repetitions Matter? Strengthening Reliability in LLM Evaluations [0.4] LLMのリーダーボードはシングルランに依存することが多いが、信頼できる結論を得るために何回繰り返しが必要なのかは不明だ。
我々は、AI4Mathベンチマークで8つの最先端モデルを再評価し、設定ごとに3つの独立した実行を実行しました。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:45:20 GMT)
Energy Consumption of TLS, Searchable Encryption and Fully Homomorphic Encryption [0.4] プライバシー強化技術(PET)は、プライバシー規制に反応して大きな注目を集め、ユーザーデータ保護を優先するアプリケーションの開発を推進している。
本研究は, 暗号PETの環境影響を, 3個のPETによるエネルギー消費の増加を非私的PETと比較して測定することによって検討した。
その結果,TLSの2倍から検索可能暗号化の10倍,FHEの10倍まで,エネルギー消費量の増大が認められた。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:37:54 GMT)
From Drawings to Decisions: A Hybrid Vision-Language Framework for Parsing 2D Engineering Drawings into Structured Manufacturing Knowledge [0.4] 2Dエンジニアリング図面からの重要な情報は、デジタル製造の進歩に不可欠である。
手動の抽出は遅く、労働集約的であるが、一般的なOCRモデルは複雑なレイアウト、エンジニアリングシンボル、回転テキストのために失敗することが多い。
回転認識オブジェクト検出モデル(YOLOv11-obb)とトランスフォーマーに基づく視覚言語モデル(VLM)を統合するハイブリッドビジョン言語フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:44:47 GMT)
Tool-Assisted Conformance Checking to Reference Process Models [0.3] 整合性チェックは、さまざまなプロセスの品質と一貫性を維持するために不可欠です。
本稿では,参照モデルに対する具体的なプロセスモデルの自動適合性チェックについて検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:15:23 GMT)
Non-Abelian interference of topological edge states [0.3] トポロジカル境界状態は、一方向伝播や雑音の頑健性など、特徴的な特性を示す。
二重対称性で保護された非アベリア量子干渉および絡み合い生成の実装を実証する。
我々の研究は、量子科学と技術に適用された非アベリアトポロジーを探索するための代替経路を確立する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:29:27 GMT)
Digital welfare fraud detection and the Dutch SyRI judgment [0.3] 判定の即時効果は限定的であることを示す。
この判決は、不正検出はプライバシーの権利を尊重する形で起こらなければならないことを政策立案者に思い出させる。
この判断は、個人データを使用する場合の透明性の重要性も確認する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:32:05 GMT)
Automatic selection of primary studies in systematic reviews with evolutionary rule-based classification [0.3] 我々は,論文検索プロセスから抽出した論文が関連しているかどうかを自動的に判断する進化的機械学習手法「我がモデル」を提案する。
文法を用いて文法と規則の構造を定義することにより、従来のテキスト情報と最先端の手法では考慮されていない他の文献データを簡単に組み合わせることができる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:13:20 GMT)
Opinions can be Incorrect! In our Opinion. On the accuracy principle in data protection law [0.3] 正確性原理は、個人データに対して、データ対象に関する意見の形で適用可能であると論じる。
我々はまた、規範的な観点から、正確性原理は意見に適用されるべきであると主張する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:37:46 GMT)
Causal inference for the expected number of recurrent events in the presence of a terminal event [0.2] 終端故障イベントを伴う繰り返しイベントデータにおける因果推論のための多元的ロバストな推定フレームワークを開発する。
条件付き独立検閲よりも弱い条件下で推定値が識別可能であることを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:40:44 GMT)
Price discrimination, algorithmic decision-making, and European non-discrimination law [0.2] アルゴリズムによる意思決定には差別効果がある。
オンライン価格の差別は間接的な差別につながる可能性がある。
しかし、論文は、非差別法はアルゴリズムによる意思決定に適用した場合に欠陥があることを示している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:41:48 GMT)
The AI Agent Code of Conduct: Automated Guardrail Policy-as-Prompt Synthesis [0.2] 本稿では,非構造化設計文書の検証可能なリアルタイムガードレールへの翻訳を自動化する新しいフレームワークを提案する。
『Promptとしての政治』では、自然言語政策の解釈と実施にLarge Language Models(LLMs)を使用している。
さまざまなアプリケーションにまたがってアプローチを検証することで、スケーラブルで監査可能なパイプラインを実証しています。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:36:52 GMT)
A Cross-Lingual Analysis of Bias in Large Language Models Using Romanian History [0.2] 研究プロセスは3段階に分けて実施され、期待する応答の種類がある程度、応答そのものに影響を及ぼすという考え方を確認する。
その結果、バイナリ応答の安定性は比較的高いが、完璧には程遠いことが示され、言語によって異なる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:03:09 GMT)
Beyond Game Theory Optimal: Profit-Maximizing Poker Agents for No-Limit Holdem [0.1] Game-Theory-Regret Minimization (CFR) は、ヘッドアップの状況では最高であり、CFRは、ほとんどのマルチウェイの状況では最強の方法である。
我々のアプローチは、ポーカーエージェントが単に負けないものから、多様な相手に一貫して勝つものへとどう動くかを示すことを目的としている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:51:57 GMT)
WordAlchemy: A transformer-based Reverse Dictionary [0.0] インド語をサポートするオープンソースのクロスランガル逆辞書システムを提案する。
このアーキテクチャは、従来の BERT の Masked Language Modeling (MLM) 技術ではなく、Translation Language Modeling (TLM) 技術を使用している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:40:30 GMT)
Vision-Grounded Machine Interpreting: Improving the Translation Process through Visual Cues [0.0] Vision-Grounded Interpreting (VGI) は、一元的機械解釈の限界に対処するために設計された新しい手法である。
本稿では,Webカメラからの音声入力と視覚入力の両方を処理するために,視覚言語モデルを統合するプロトタイプシステムを提案する。
本手法の有効性を評価するため,3種類のあいまいさを対象とする手作り診断コーパスを構築した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:25:33 GMT)
Transparent, Evaluable, and Accessible Data Agents: A Proof-of-Concept Framework [0.0] 本稿では、AIエージェントの開発と評価のためのモジュール型コンポーネントベースのアーキテクチャについて述べる。
このシステムは、技術的でないユーザが複雑なデータウェアハウスと対話できるようにすることによって、データアクセシビリティにおける中核的な課題に対処する。
設計の要点は、多層推論フレームワークを通じて達成される透明な意思決定へのコミットメントである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 23:54:41 GMT)
The Role of Logic and Automata in Understanding Transformers [0.0] ここ数年の急速な進歩を、トランスフォーマーに何ができるかという疑問に振り返る。
この質問に答える上で、ロジックとオートマトンの役割は不可欠です。
また、論理、オートマトン、検証、変換器の交点におけるいくつかのオープンな問題についても言及する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:34:30 GMT)
The Non-Abelian Casimir Effect for Plates, Symmetrical Tube and Box on the Lattice [0.0] 2+1)D および (3+1)D における非アーベル SU(3) ゲージ理論におけるカシミールポテンシャルの非摂動結果を示す。
パラレルプレート(3+1)Dを超える測地を初めて探索し、対称管と対称箱に対するカシミール効果が魅力的であることを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:17:19 GMT)
The Hidden Costs of Translation Accuracy: Distillation, Quantization, and Environmental Impact [0.0] 本研究では,機械翻訳を用いた実スケール,蒸留,定量化モデルの比較を行った。
評価1回あたりの炭素排出量分析の結果, BLEUスコアが最も高い3.3B fp32モデルでは, 環境フットプリントが最大であることが判明した。
攻撃的な量子化(INT4)でさえ高いレベルの精度とフラレンシを保持しており、モデル間の差は概して小さい。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 17:32:52 GMT)
The Aharonov-Casher theorem on a line [0.0] 一次元空間におけるスピン=1/2$荷電粒子の零モードの縮退について検討する。
一次元では、スカラーポテンシャルの無限族が存在する可能性が示されている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:44:32 GMT)
Taking control: Policies to address extinction risks from advanced AI [0.0] AI企業からの自発的なコミットメントは不適切で不十分な反応である、と私たちは主張する。
先進的なAIの脅威に有意義に対処する3つの政策提案について述べる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:59:21 GMT)
Spectral decomposition and high-accuracy Greens functions: Overcoming the Nyquist-Shannon limit via complex-time Krylov expansion [0.0] 複素時間クリロフ空間を用いて基本極限を克服する方法を示す。
2次元Su-Schrieffer-Heegerモデルにおける臨界$S-1/2$Heisenbergモデルとライトバイポーラロンの例において、精度の大幅な改善を示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 21:59:11 GMT)
SALM: A Multi-Agent Framework for Language Model-Driven Social Network Simulation [0.0] SALM(Social Agent LM Framework)は、言語モデル(LM)をソーシャルネットワークシミュレーションに統合するための新しいアプローチである。
私たちのコントリビューションには階層的なプロンプトアーキテクチャが含まれており、4000以上のタイムステップで安定したシミュレーションを可能にし、トークン使用率を73%削減しています。
本研究では, 長期的社会現象をモデル化し, 行動忠実度を実証的に検証した上で, 最初のLCMベースのフレームワークを実証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:32:26 GMT)
Robust Deep Network Learning of Nonlinear Regression Tasks by Parametric Leaky Exponential Linear Units (LELUs) and a Diffusion Metric [0.0] 非線形ac.fは 非線形データセットの学習に必要です
Smooth but disappearing-gradient ac.f's have limited performance。
トレーニングされたモデルの性能を評価するために、新しい拡散損失計量も提案されている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:51:04 GMT)
Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning [0.0] 本稿では,ロボットナビゲーションと各種エージェントや障害物とのインタラクションを改善するための,新しい深層強化学習手法を提案する。
このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを確保する。
ロボットに近づいたり、異なる物体と衝突したりすることを罰する新たな報酬関数を導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:25:12 GMT)
Reasoning Isn't Enough: Examining Truth-Bias and Sycophancy in LLMs [0.0] 本研究は,大規模言語モデルの精度検出能力について,これまでで最大評価を行ったものである。
真理バイアスの率、あるいは主張が真であると信じる確率は、推論モデルでは非推論モデルよりも低い。
最も関係のあるのは、いくつかの高度なモデルにおいて、梅毒の傾向を特定することである。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:57:43 GMT)
Quantum calculation of the collision-induced line-shape effects in antiprotonic helium and the new accurate ab initio $\bar{p}$He$^{+}$-He potential energy surface [0.0] 反陽子性ヘリウム中での衝突誘起スペクトル線の拡大とシフトに関する最初の完全な初期計算について述べる。
このデータセットは、初期の半古典的計算のための厳密なベンチマークを提供する。
これはアンチプロトン性ヘリウムの高精度分光のための堅牢な理論基準を確立する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:45:36 GMT)
Quantum Resonance Beyond Direct Measurement: Insights from Weak Measurement [0.0] 弱い測定によって実現されたアハロノフの弱値増幅は、物理パラメータを高精度に測定する汎用的な手段を提供する。
この関係は、主に弱値増幅の研究に使用される標準スキームである間接弱測定の場合において成り立つことを示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 06:56:31 GMT)
Quantum Algorithm of the GLMY Homology on Digraphs [0.0] 本稿では,GLMYホモロジーに対する量子アルゴリズムを提案する。
GLMYホモロジーの量子アルゴリズムは一般に立方体スピードアップを提供し、入力データがパスの仕様として与えられる場合の指数的量子優位性を提供することができる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 03:34:00 GMT)
Privacy in the Age of AI: A Taxonomy of Data Risks [0.0] 本稿では,AIプライバシリスクを分類する分類法を提案する。
データセットレベル、モデルレベル、インフラストラクチャレベル、インサイダー脅威の4つのカテゴリに分類される19の主要なリスクを特定します。
発見はこれらの次元のバランスの取れた分布を明らかにし、人間のエラー(9.45%)が最も重要な要因である。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 00:20:03 GMT)
Preserving Cross-Modal Stability for Visual Unlearning in Multimodal Scenarios [0.0] 3つの重要なコンポーネントを統合したクロスモーダル・コントラスト・アンラーニング(CCU)フレームワークを提案する。
CCUの精度は7.12%向上し、学習時間の7%に過ぎなかった。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:03:37 GMT)
Performance of Machine Learning Methods for Gravity Inversion: Successes and Challenges [0.0] 機械学習の最近の進歩は、重力反転のためのデータ駆動アプローチを動機付けている。
まず、重力異常を直接密度場にマッピングするように訓練された畳み込みニューラルネットワークを設計する。
生成モデルをさらに研究するために,変分オートエンコーダ(VAE)とGAN(Generative Adversarial Networks)を用いる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 19:19:07 GMT)
Path Integral Quantum Control for Quantum Chemistry Applications [0.0] 我々は、パラメータ化量子回路の最適化にPiQCアルゴリズムを適用した。
可変量子固有解器(VQE)に対するPQCのゲートベースおよびパルスベースバージョンをベンチマークする。
どちらのPiQCアルゴリズムも、分子結合距離の変化によって誘導される標的ハミルトニアンの変化に対するSPSAよりも強い堅牢性を示す。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:42:06 GMT)
Open Opportunities in AI Safety, Alignment, and Ethics (AI SAE) [0.0] 本稿では、外部アドオンとしてではなく、アライメントのための構造レンズとして倫理を探求する。
モラル推論は、圧縮され生存バイアスのある投影として扱われる。
この論文は、倫理を直接表現的基質に埋め込むことによって、哲学的主張をより経験的に親しみやすいものにする研究の課題をスケッチしている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:52:36 GMT)
Noncommutative Landau problem in graphene: a gauge-invariant analysis with the Seiberg-Witten map [0.0] グラフェン中の無質量電子の2次元非可換(NC)平面における定バックグラウンド磁場下での相対論的量子力学について検討した。
具体的には、この背景場内の単層グラフェン中の相対論的電子の運動を分析し、NCランダウ系のエネルギースペクトルを計算する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:17:12 GMT)
Non-local integrals of motion for deformed $W$-algebra $W_{q,t}(g)$ associated with $g=A_l^{(1)}, D_l^{(1)}, E_{6,7,8}^{(1)}$ [0.0] 運動の非局所積分の可換性は、直接計算により$g=A_l(1)$と$D_l(1)$の場合に示される。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:46:13 GMT)
Mathematically rigorous proofs for Shapley explanations [0.0] 数学的に厳密な観点から、Lundberg と Lee の2つの主要な結果について議論する。
最初の結果は、Youngの公理に基づく機械学習におけるShapley値の公理的評価である。
2つ目の結果は、重み付き線形回帰問題の一意解としてShapley値を記述することができることを示している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:26:50 GMT)
Learning-Based Testing for Deep Learning: Enhancing Model Robustness with Adversarial Input Prioritization [0.0] このプロジェクトはディープニューラルネットワーク(DNN)における障害検出とモデルロバスト性の向上を目的としている。
本手法は, アーキテクチャ固有の特徴や形式的検証に頼ることなく, モデル欠陥を暴露する確率の高い逆入力のサブセットを選択する。
テストの置換を効率的に組織することにより、さまざまなデータセット、モデルアーキテクチャ、および敵攻撃テクニックで、潜在的なすべての障害を著しく高速に発見する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:31:30 GMT)
Learning to Explain Air Traffic Situation [0.0] 本稿では,航空交通状況を説明するための機械学習フレームワークを提案する。
具体的には,トランスフォーマーをベースとした多エージェント軌道モデルを用いて,航空機の時空間移動とそれらの間の社会的相互作用の両方をカプセル化する。
これにより、航空管制官が交通状況をどのように認識し理解しているかを説明できる。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:24:15 GMT)
Information theory for data-driven model reduction in physics and biology [0.0] 我々は,将来最も予測的な変数として定義される変数を同定する手法を開発する。
高圧縮の極限において、関連する変数は、最も遅く縮退する固有関数によって直接決定される。
この結果から,変数を自動識別する深層学習ツールが確立された。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:28:07 GMT)
Hilbert space representation for quasi-Hermitian position-deformed Heisenberg algebra and Path integral formulation [0.0] ハイゼンベルク代数の位置変形は、この代数を生成する作用素のエルミティシティの損失につながることを示す。
すると、これらの準エルミート作用素に付随するヒルベルト空間表現を構築し、準エルミート・ハイゼンベルク代数を生成する。
我々は、この系のユークリッドプロパゲータ、作用、運動エネルギーが、標準的な古典力学の限界によって制約されていることを実証する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:17:20 GMT)
Hierarchical MLANet: Multi-level Attention for 3D Face Reconstruction From Single Images [0.0] そこで本研究では,単一の画像から3次元顔モデルを再構成するための畳み込みニューラルネットワークによるアプローチを提案する。
本モデルでは, 顔形状, テクスチャ, ポーズ, 照明パラメータを1つの画像から予測する。
3D Morphable Model (3DMM)パラメータを公開データセットから組み込んだ半教師付きトレーニング戦略が採用されている。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:39:06 GMT)
Haag Duality for 2D Quantum Spin Systems [0.0] ハーグ双対性(Haag duality)は、2次元の格子量子スピン系に対する局所性の強い概念である。
双連結$C*$-弱ホップ代数に基づく二次元テンソルネットワーク状態がハーグ双対性を満たすことを証明する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:27:49 GMT)
Gradient-based grand canonical optimization enabled by graph neural networks with fractional atomic existence [0.0] State-of-the-artモデルは一般的に、原子埋め込みを反復的に更新するためにメッセージパッシングを使用するグラフニューラルネットワークである。
我々は、分数原子の存在を考慮に入れた連続変数を含むことによって、メッセージパッシング形式を拡張した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:13:28 GMT)
From Quasiperiodicity to a Complete Coloring of the Kohmoto Butterfly [0.0] コフモトモデルのスペクトルは、コフモト蝶として知られるフラクタル相図を生成する。
このレターはその障害を克服し、Kohmotoモデル指標の完全な分類を提供する。
本手法では, コフモトバタフライをスペクトル木グラフとしてエンコードし, 周期スペクトルを通して準周期的な性質を反映する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:34:43 GMT)
FairViT-GAN: A Hybrid Vision Transformer with Adversarial Debiasing for Fair and Explainable Facial Beauty Prediction [0.0] 顔の美を予測するための新しいハイブリッドフレームワークである textbfFairViT-GAN を提案する。
本研究では,FairViT-GANが予測精度を向上し,textbf0.9230のピアソン相関を実現し,RMSEをtextbf0.2650に短縮することを示す。
対象者の分類精度がほぼランダムな確率(52.1%)に低下する傾向がみられた。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:55:31 GMT)
Efficient Identification of High Similarity Clusters in Polygon Datasets [0.0] 本稿では,検証を必要とするクラスタ数を削減し,これらのシステムに対する計算負荷を低減させるフレームワークを提案する。
このフレームワークは動的類似性指数閾値、教師付きスケジューリング、リコール制約付き最適化を統合している。
提案手法は精度を犠牲にすることなく計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:39:15 GMT)
Effective delocalization in the one-dimensional Anderson model with stealthy disorder [0.0] 我々は、アンダーソンモデルと「スティルティー」障害を1次元で解析的に、数値的に研究する。
固定エネルギーと小さなが有限障害強度$W$に対して、任意の有限長系に対して、局所化長がシステムサイズを超えるステルスネス$chi$が存在する。
非相関性障害とは違い、局所化長$xi$は小 W の先行順序に$W-2$とスケールするが、ステルス乱数系に対する$xi$の摂動展開における先行順序項は、徐々に多くの項に対して同一に消滅する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 13:43:55 GMT)
Edge-FIT: Federated Instruction Tuning of Quantized LLMs for Privacy-Preserving Smart Home Environments [0.0] 本稿では,大規模言語モデル(LLM)のFIT(Federated Instruction Tuning)のためのスケーラブルなフレームワークを提案する。
当社のEdge-FITフレームワークは,フェデレーション学習と4ビット量子化低ランク適応(QLORA)を組み合わせたものです。
私たちは、IoTドメイン用の汎用Databricks Dolly 15kデータセットをフィルタリングすることで、これを実証します。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:06:37 GMT)
EVO-LRP: Evolutionary Optimization of LRP for Interpretable Model Explanations [0.0] 説明可能なAI(XAI)メソッドは、どの画像領域がモデルの予測に影響を与えるかを特定するのに役立つが、ディテールと解釈可能性の間のトレードオフに直面していることが多い。
本稿では,CMA-ES(Co Matrix Adaptation Evolution Strategy)を用いて,量的解釈可能性指標に基づくLRPハイパーパラメータのチューニングを行う手法であるEVO-LRPを紹介する。
EVO-LRPは、解釈可能性メトリックのパフォーマンスと視覚的コヒーレンスの両方において従来のXAIアプローチより優れており、クラス固有の特徴に対して強い感度を持つ。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:42:53 GMT)
Dynamically near-stable two-mode squeezing in optomechanical systems [0.0] 2モード圧縮状態は、量子情報処理とメトロジーに広く応用されたパラダイム的絡み合った状態である。
ハイブリッド3モードキャビティ光学系における2モードスクイーズ方式を提案する。
我々は、オープン量子システムフレームワーク内で生成する過程の厳密な理論的解決策を提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 02:55:53 GMT)
Dynamic Policy Induction for Adaptive Prompt Optimization: Bridging the Efficiency-Accuracy Gap via Lightweight Reinforcement Learning [0.0] 本稿では,1ステップのマルコフ決定プロセス(MDP)として適応戦略選択を形式化する軽量強化学習フレームワークであるPrompt Policy Network(PPN)を紹介する。
算術的推論ベンチマークの実験では、PPNは競争精度を維持しながら自己整合性よりも61.5%のトークンコスト削減を達成した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 07:32:42 GMT)
Diffusion Models are Kelly Gamblers [0.0] 条件拡散ストアには、シグナルを$X$と条件情報$Y$と結びつけるための追加情報がある。
拡散モデルは無限に深い自己エンコーダである、という一般的な観点から、いくつかのニュアンスを指摘する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:27:25 GMT)
DNABERT-2: Fine-Tuning a Genomic Language Model for Colorectal Gene Enhancer Classification [0.0] DNABERT-2は、DNAから可変長トークンを学習するためにバイトペアエンコーディングを使用するトランスフォーマーゲノム言語モデルである。
遺伝子エンハンサーは、いつ、どこで遺伝子がスイッチされるかを制御するが、その配列の多様性と組織特異性は、大腸癌の特定を困難にしている。
大腸癌におけるBPEトークン化を用いた第2世代のゲノム言語モデルを適用した最初の研究である。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:10:03 GMT)
CrashSplat: 2D to 3D Vehicle Damage Segmentation in Gaussian Splatting [0.0] 本研究では,2次元マスクの昇降による3次元損傷セグメンテーションを行う自動車両損傷検出パイプラインを提案する。
また,シングルビュー3D-GSセグメンテーションのためのシンプルな学習自由アプローチを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:49:33 GMT)
Constructing Opera Seria in the Iberian Courts: Metastasian Repertoire for Spain and Portugal [0.0] ペレス、ガルーピ、ヨメリ、コンフォルト、コルセッリは、イベリア宮廷のオペラ・セリアの作曲を依頼された作曲家である。
この記事では、国際舞台における5人の作曲家(ペレス、ガルーピ、ヨミッリ、コンフォルト、コルセッリ)のスタイルが、イベリアの宮廷でオペラ・セリアを書くよう依頼された際にどう変わるかを調査します。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 09:35:51 GMT)
Chronic Obstructive Pulmonary Disease Prediction Using Deep Convolutional Network [0.0] 本研究では,慢性閉塞性肺疾患(COPD)を検出するための呼吸音解析のための深部畳み込みニューラルネットワーク(CNN)を用いたアプローチを提案する。
このシステムは、病気の重症度を軽度、中等度、重度に分類する。
ICBHIデータベースの評価は10倍のクロスバリデーションと90%の精度で96%の精度を達成した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:02:24 GMT)
Bayesian Mixture-of-Experts: Towards Making LLMs Know What They Don't Know [0.0] Mixture-of-Experts (MoE) は大規模で効率的な大規模言語モデルの構築を可能にした。
標準的な決定論的ルーティングメカニズムは、重大な制限を提示する。
この論文では、構造化されたtextbfBayesian MoEルーティングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 12:07:35 GMT)
Automatic Question & Answer Generation Using Generative Large Language Model (LLM) [0.0] 本研究では,NLPにおける教師なし学習手法の活用を提案する。
カスタマイズされたモデルは、教育者、インストラクター、テキストベースの評価に従事する個人に対して効率的なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 22:13:13 GMT)
Atom beam-splitter with internal state selection using spin-dependent optical standing wave potentials [0.0] スピン依存光電位を用いた出力ビーム中の原子の内部スピン状態の操作を可能にする原子ビームスプリッター。
このような原子ビームスプリッターの有用性は、一定の均一な電場を受ける原子のアハロノフ・カシエ相の測定に応用して実証される。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 10:45:46 GMT)
Asymptotic Expansion for Nonlinear Filtering in the Small System Noise Regime [0.0] システムノイズの小さなパラメータに基づく非線形フィルタリングのための新しい拡張法を提案する。
このアプローチは、既存の手法に固有の計算効率と精度のトレードオフを緩和する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:50:45 GMT)
Artificially Fluent: Swahili AI Performance Benchmarks Between English-Trained and Natively-Trained Datasets [0.0] 本研究は、Swahiliデータで完全にトレーニングされ、テストされた2つの単言語BERTモデルと、同等の英語ニュースデータで比較した。
このアプローチは、スワヒリの入力を英語モデルで評価するために翻訳すると、スワヒリで完全にモデルを訓練しテストするよりも、より良い性能が得られるかどうかを評価することによって仮説を検証する。
その結果、高品質な翻訳にもかかわらず、スワヒリ語学習モデルはスワヒリ語から英語への翻訳モデルよりも優れた性能を示し、それぞれ0.36%対1.47%の誤差が得られた。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:25:45 GMT)
An international treaty to implement a global compute cap for advanced artificial intelligence [0.0] この条約の主な条項は、グローバルな計算上限であり、合意された計算リソースのしきい値を超えるAIシステムの開発を禁止している。
この条約は、先進的な人工知能の危険性から文明を保護するための統治体制を実装することで、世界のリーダーにとって有用なテンプレートになることを期待している。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 14:36:06 GMT)
An Empirical Study on the Computation Budget of Co-Optimization of Robot Design and Control in Simulation [0.0] ロボットの設計と制御の協調最適化は、どちらもタスクに適合する設計と制御を生成する。
本稿では,シミュレーションにおける設計と制御の協調最適化に固有の課題について検討する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 16:24:28 GMT)
AmarDoctor: An AI-Driven, Multilingual, Voice-Interactive Digital Health Application for Primary Care Triage and Patient Management to Bridge the Digital Health Divide for Bengali Speakers [0.0] AmarDoctorは多言語音声対話型デジタルヘルスアプリだ。
ベンガル語話者のための総合的な患者トリアージとAIによる臨床決定支援を提供する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 11:31:59 GMT)
A Voter-Based Stochastic Rejection-Method Framework for Asymptotically Safe Language Model Outputs [0.0] 本稿では,LLMの安全性を活用して,安全でない,あるいは低品質な大規模言語モデル(LLM)の出力を防止する手法を提案する。
このシステムでは、LCMチェッカーが生成した出力の受理性に投票し、不承認のしきい値に達すると再生する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 18:15:48 GMT)
A University of Texas Medical Branch Case Study on Aortic Calcification Detection [0.0] テキサス大学医学部(UTMB)はZaulon Labs, Inc.と共同で、胸部X線写真を用いた大動脈石灰化(AC)の検出とコーディングを強化した。
心血管疾患の予後に重要な価値があるにもかかわらず、ACは報告されていないことが多い。
3,988名の患者のうち495名の患者(総検査総数5,000名)が、再納のために適切にコーディングされていない大動脈石灰化の徴候を報告していた。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 15:08:53 GMT)
A State-Specific Iterative Decoupling Scheme Based on Perturbation Theory for Low-Energy Electronic States [0.0] マルチステップRayleigh-SchrodingerとBrillouin-Wigner摂動スキームの選択的かつスケーラブルな拡張を導入する。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 08:40:02 GMT)
A Small Math Model: Recasting Strategy Choice Theory in an LLM-Inspired Architecture [0.0] 「戦略選択理論(SCT)脚注戦略選択理論」
SCTをSmall Math Model' (SMM) として再放送する
論文参考訳(メタデータ) (Sun, 28 Sep 2025 20:58:48 GMT)
A Recall-First CNN for Sleep Apnea Screening from Snoring Audio [0.0] 睡眠時無呼吸症(Sleep apnea)は、重篤な睡眠関連呼吸障害であり、治療を受けていないと健康に影響を及ぼす。
ポリソムノグラフィーは高価で時間を要するため、大規模な集団のスクリーニングには実用的ではない。
そこで本研究では,呼吸記録を用いて無呼吸の兆候を見つけることで,よりアクセスしやすい選択肢を探索した。
論文参考訳(メタデータ) (Sun, 28 Sep 2025 05:00:01 GMT)