FlexOlmo: Open Language Models for Flexible Data Use [197.5] 我々は、データ共有なしで分散トレーニングをサポートする新しい言語モデル(LM)であるFlexOlmoを紹介します。
FlexOlmoはエキスパートの混成アーキテクチャを採用しており、各専門家はクローズドデータセットで独立して訓練される。
我々は、公開データで訓練された一般専門家と、他のデータ所有者から独立した訓練を受けた専門家とを効果的に組み合わせることができることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:44:49 GMT)
EGOILLUSION: Benchmarking Hallucinations in Egocentric Video Understanding [80.6] EgoIllusionは、エゴセントリックビデオにおけるMLLMの幻覚を評価する最初のベンチマークである。
EgoIllusionは1,400本のビデオと8000人の人間による注釈付きオープンおよびクローズドエンドの質問のペアで構成されている。
10個のMLLMを評価すると、GPT-4oやGeminiのような強力なモデルを含む大きな課題が示され、59%の精度しか達成できなかった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:06:02 GMT)
From Unaligned to Aligned: Scaling Multilingual LLMs with Multi-Way Parallel Corpora [80.1] TED Talks に基づく大規模かつ高品質なマルチウェイ並列コーパス TED2025 を導入する。
このデータセットは113の言語にまたがっており、最大50の言語が並列に並び、広範囲にわたるマルチリンガルカバレッジを保証する。
実験により、マルチウェイ並列データでトレーニングされたモデルは、不整合多言語データでトレーニングされたモデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:22:14 GMT)
NAT: Learning to Attack Neurons for Enhanced Adversarial Transferability [77.2] Neuron Attack for Transferability (NAT) は、特定のニューロンを埋め込む方法である。
我々のアプローチは、以前の階層レベルの最適化がいくつかのニューロンに不均等に焦点をあてることがしばしばあるという観察に動機づけられている。
個々のニューロンを標的にすることで、ニューラルネットワークのコアユニットを効果的に破壊する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:06:31 GMT)
MDIQA: Unified Image Quality Assessment for Multi-dimensional Evaluation and Restoration [76.9] 本稿では,多次元画像品質評価(MDIQA)フレームワークを提案する。
我々は,5つの技術次元と4つの審美次元を含む,様々な知覚次元にわたる画像品質をモデル化する。
MDIQAモデルの準備が整うと、画像復元(IR)モデルの柔軟なトレーニングのためにデプロイできる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:17:14 GMT)
X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents [76.7] X-Teamingは、一見無害な相互作用が有害な結果へとエスカレートし、対応する攻撃シナリオを生成するフレームワークである。
X-Teamingは最新のClaude 3.7 Sonnetモデルに対して96.2%の攻撃成功率を達成した。
XGuard-Trainは、オープンソースのマルチターン安全トレーニングデータセットで、前回のベストリソースの20倍大きい。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:09:57 GMT)
NinA: Normalizing Flows in Action. Training VLA Models with Normalizing Flows [75.7] 拡散モデルは、複雑なマルチモーダルな動作分布をモデル化できるため、アクションデコーダとして広く採用されている。
我々は、VLA(Vision-Language-Action)モデルのための、高速で表現力のある変化型デコーダであるNinAを提案する。
実験の結果,NinAは同一のトレーニング体制下での拡散法と同等の性能を示し,精度は大幅に向上した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:02:15 GMT)
Learning from Diverse Reasoning Paths with Routing and Collaboration [65.8] 経路品質フィルタリング,条件付きルーティング,ピアラーニングを組み合わせたQR-Distill(Quality-filtered Routing with Cooperative Distillation)を提案する。
従来のシングルパス蒸留法やマルチパス蒸留法よりもQR-ディスティルが優れていることを示す実験がある。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:15:57 GMT)
Let's Use ChatGPT To Write Our Paper! Benchmarking LLMs To Write the Introduction of a Research Paper [64.5] SciIGは、タイトル、抽象、および関連する作品からコヒーレントな紹介を生成するLLMの能力を評価するタスクである。
オープンソース (DeepSeek-v3, Gemma-3-12B, LLaMA 4-Maverick, MistralAI Small 3.1) およびクローズドソース GPT-4o システムを含む5つの最先端モデルを評価する。
結果は、特に意味的類似性と忠実性において、ほとんどのメトリクスにおいて、LLaMA-4 Maverickの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 13:15:20 GMT)
CAARMA: Class Augmentation with Adversarial Mixup Regularization [59.9] 話者検証は典型的なゼロショット学習課題である。
クラス拡張フレームワークであるCAARMAを紹介する。
当社のフレームワークは,すべてのベースラインモデルに対して,8%の大幅な改善を実現しています。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 21:56:01 GMT)
PVNet: Point-Voxel Interaction LiDAR Scene Upsampling Via Diffusion Models [57.0] 拡散モデルに基づく点-ボクセル相互作用フレームワークであるPVNetを提案する。
具体的には、スパース点雲を誘導条件とし、近くのフレームから得られた合成点雲を入力とする。
さらに,各アップサンプリング点の環境認識能力を効率よく向上する点とボクセルの両方の機能を統合する点とボクセルの相互作用モジュールを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:55:03 GMT)
CoLMbo: Speaker Language Model for Descriptive Profiling [56.6] 話者認識システムは、しばしば分類タスクに限られ、詳細な話者特性を生成するのに苦労する。
本稿では、話者エンコーダとプロンプトベースの条件付けを統合することで、これらの制約に対処する話者言語モデル(SLM)であるCoLMboを紹介する。
CoLMboはユーザ定義のプロンプトを利用して、新しい話者特性に動的に適応し、カスタマイズされた記述を提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:55:31 GMT)
Dual Orthogonal Guidance for Robust Diffusion-based Handwritten Text Generation [55.4] 拡散に基づく手書きテキスト生成(HTG)アプローチは、トレーニング時間と通常のスタイルで観察される単語内単語の頻度が高く、印象的な結果が得られる。
トレーニングサンプルを記憶する傾向があり、しばしばスタイルの多様性と生成の明確さに苦しむ。
そこで本研究では,元のプロンプトに対して負に摂動したプロンプトを利用する新しいサンプリング誘導戦略であるDual Orthogonal Guidance(DOG)を提案する。
最新技術であるDiffusionPenとOne-DMの実験結果から、DOGは、語彙外単語や難解な書き方であっても、内容の明快さと可変性を両立させることを示した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 13:09:19 GMT)
Deep Learning-based Techniques for Integrated Sensing and Communication Systems: State-of-the-Art, Challenges, and Opportunities [54.1] 本稿では,統合型センシング・通信(ISAC)システムにおける深層学習(DL-based)技術の最近の発展と研究を概観的にレビューする。
ISACは、車載ネットワークや産業用ロボティクスなど、多くの新興アプリケーションにおいて、センサーと通信機能の両方を必要とするため、6Gおよびネットワーク以上の重要なイネーブラーと見なされている。
従来の手法の代替として、DLベースの手法は計算複雑性を減らした効率的でほぼ最適のソリューションを提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:27:51 GMT)
AnimateAnywhere: Rouse the Background in Human Image Animation [52.1] AnimateAnywhereは、カメラの軌跡を必要とせずに人間の画像アニメーションの背景を刺激するフレームワークである。
人間のポーズシーケンスから背景動きを学習するための背景動き学習装置(BML)を導入する。
実験によると、AnimateAnywhereは人間のポーズシーケンスから背景の動きを効果的に学習する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:05:05 GMT)
MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark [51.3] MMTUは、25の現実世界のテーブルタスクに30万以上の質問がある大規模なベンチマークである。
MMTUは、専門家レベルで実際のテーブルを理解し、推論し、操作できるモデルを包括的に評価するように設計されている。
MMTUはテーブル理解、推論、コーディングといった、今日のフロンティアモデルにとって困難なスキルの組み合わせを必要としています。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:07:50 GMT)
HumanoidVerse: A Versatile Humanoid for Vision-Language Guided Multi-Object Rearrangement [51.2] 視覚言語誘導型ヒューマノイド制御のための新しいフレームワークであるHumanoidVerseを紹介する。
HumanoidVerseは、自然言語命令と自我中心のカメラRGB観測のみでガイドされる複数のオブジェクトの連続的な操作をサポートする。
我々の研究は、現実の知覚的制約の下で複雑なシーケンシャルなタスクを実行できる、堅牢で汎用的なヒューマノイドエージェントに向けた重要なステップである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:23:14 GMT)
LGE-Guided Cross-Modality Contrastive Learning for Gadolinium-Free Cardiomyopathy Screening in Cine CMR [51.1] CMRを用いたガドリニウムフリー心筋症スクリーニングのためのコントラシブラーニングおよびクロスモーダルアライメントフレームワークを提案する。
CMRとLate Gadolinium Enhancement (LGE) 配列の潜伏空間を整列させることにより, 本モデルでは線維症特異的な病理組織をCMR埋め込みにエンコードする。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:21:23 GMT)
LLM-Forest: Ensemble Learning of LLMs with Graph-Augmented Prompts for Data Imputation [50.4] 巨大なコーパスで訓練された大規模言語モデル(LLM)は、データ生成に強い可能性を示している。
我々は,信頼度に基づく重み付け投票によって出力を集約した,数発のプロンプト学習 LLM ツリーの "フォレスト" を導入した新しいフレームワーク LLM-Forest を提案する。
このフレームワークは、2部情報グラフという新しい概念に基づいて構築され、特徴と値の粒度の両方で高品質な関連項目を識別する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 23:27:56 GMT)
Towards a Real-World Aligned Benchmark for Unlearning in Recommender Systems [49.8] 推薦システムにおける非学習のためのより現実的なベンチマークの開発を導くために,設計デシダータと研究質問のセットを提案する。
我々は、現実世界の削除要求の逐次的で時間に敏感な性質を反映した、未学習のセットアップについて論じる。
本稿では,提案したdesiderataをベースとした次世代レコメンデーションセッティングの予備実験を行い,アンラーニングが逐次レコメンデーションモデルにも有効であることを確認した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:05:40 GMT)
Periodic Vibration Gaussian: Dynamic Urban Scene Reconstruction and Real-time Rendering [49.4] 周期振動ガウスモデル(PVG)を提案する。
PVGは、当初静的シーン表現のために設計された効率的な3Dガウススプラッティング技術に基づいている。
PVGは、最良の代替品よりも900倍の速度でレンダリングできる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:56:43 GMT)
Zero-shot Multimodal Document Retrieval via Cross-modal Question Generation [47.7] PreMIRはMLLMの幅広い知識を活用して、検索前にクロスモーダルな事前質問(preQ)を生成するシンプルなフレームワークである。
実験により、PreMIRは、クローズドドメインやマルチリンガル設定など、分散ベンチマークから得られるアートパフォーマンスの状態を達成している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:14:41 GMT)
Geolocation-Aware Robust Spoken Language Identification [46.4] 位置情報認識型LIDは、言語レベルの位置情報をSSLベースのLIDモデルに組み込む新しいアプローチである。
位置情報予測を補助的タスクとして導入し、予測ベクトルを条件付き信号として中間表現に注入する。
6つの多言語データセットに対する実験により、我々のアプローチは言語内変異や目に見えない領域に対する堅牢性を向上させることが示された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 21:49:27 GMT)
Attention Layers Add Into Low-Dimensional Residual Subspaces [46.3] トランスモデルは驚くほど低次元の部分空間に限定されていることを示す。
我々は,この低ランク構造が,スパース辞書学習における死特徴問題の根本原因であると考えている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:27:00 GMT)
Align 3D Representation and Text Embedding for 3D Content Personalization [45.9] Invert3Dは便利な3Dコンテンツパーソナライズのためのフレームワークである。
我々は,3Dコンテンツをテキスト埋め込みに整合した3D埋め込みに投影する,カメラ条件の3D-to-textインバース機構を開発した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:43:26 GMT)
E-4DGS: High-Fidelity Dynamic Reconstruction from the Multi-view Event Cameras [44.8] イベントカメラは低消費電力、高時間分解能、高ダイナミックレンジの利点を提供する。
高速移動におけるシーン再構築の課題に対する新しい視点
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:54:38 GMT)
Breaking the Exploration Bottleneck: Rubric-Scaffolded Reinforcement Learning for General LLM Reasoning [43.6] 大規模言語モデル(LLM)は、推論能力の出現を促進するために強化学習(RL)の可能性を強調している。
大規模言語モデル(LLM)の最近の進歩は、推論能力の出現を促進するためにRLの可能性を強調している。
本稿では,探索のボトルネックを突破するための新しい指導的足場構築フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:47:31 GMT)
Watermarking Visual Concepts for Diffusion Models [43.4] パーソナライズ技術は特定の概念で画像を生成する。
悪意のあるユーザは、ターゲットのコンセプトに関連する不正なコンテンツや偽情報を生成できる。
モデル透かしは、悪意のある生成された画像を追跡し、彼らの著作権を保護する効果的なソリューションである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:04:45 GMT)
Explaining Black-box Language Models with Knowledge Probing Systems: A Post-hoc Explanation Perspective [43.3] 事前訓練された言語モデル(PLM)は、大量のラベルのないデータに基づいて訓練されるが、顕著な推論スキルを示す。
本稿では,KnowProbと呼ばれる知識誘導型探索手法をポストホックな説明法で提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:41:59 GMT)
Mitigating Jailbreaks with Intent-Aware LLMs [42.5] 大規模言語モデル (LLMs) は、反対に作られた命令によってジェイルブレイク攻撃に弱いままである。
Intent-FTはシンプルで軽量な微調整手法で、LLMに応答する前に命令の基本的な意図を推測するように明示的に訓練する。
実証的には、Intent-FTは評価されたすべての攻撃カテゴリを一貫して緩和し、単一の攻撃が50%の成功率を超えない。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:11:04 GMT)
Limitations of refinement methods for weak to strong generalization [42.3] 我々は,計算的に難解なオラクル法を含む他の手法により,ラベルの洗練が達成できるかどうかを解析する。
ラベルリファインメントとラベルリファインメントはどちらも既約誤差に悩まされており,ラベルリファインメントとオラクルの間には性能的ギャップが残されている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 13:17:26 GMT)
Quantum Resource Management in the NISQ Era: Challenges, Vision, and a Runtime Framework [42.0] 我々は,実行時対応の量子ソフトウェア開発のためのビジョンを提案し,その実現に向けた重要な課題を特定する。
本稿では,動的リソース評価に基づく量子プログラムの条件付き実行を可能にするプロトタイプフレームワークであるQonsciousを紹介する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:34:12 GMT)
SyncGuard: Robust Audio Watermarking Capable of Countering Desynchronization Attacks [41.3] これらの課題に対処するため,SyncGuardという学習型スキームを提案する。
具体的には、任意の長さのオーディオに透かしを埋め込むためのフレームワイド放送埋め込み方式を設計する。
さらに強靭性を高めるために,細かな設計による歪み層を導入する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:28:04 GMT)
Contrastive Prompt Clustering for Weakly Supervised Semantic Segmentation [41.1] 本稿では,新しいWSSSフレームワークであるContrastive Prompt Clustering (CPC)を提案する。
CPCはLarge Language Models (LLM) を利用して、固有のクラス間の関係を符号化するカテゴリクラスタを導出する。
PASCAL VOC 2012 と MS 2014 の実験では、CPC がWSSS の既存の最先端手法を上回ることが示されている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:49:08 GMT)
A Lightweight Convolution and Vision Transformer integrated model with Multi-scale Self-attention Mechanism [41.0] Vision Transformer (ViT) は、長距離依存モデリング能力の強いコンピュータビジョンタスクで普及している。
本稿では, 畳み込みブロックを持つ軽量ViTモデルSAEViT(Sparse-Attention-Efficient-ViT)を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:05:34 GMT)
Understanding Action Effects through Instrumental Empowerment in Multi-Agent Reinforcement Learning [39.7] 本研究は,政策分布の分析のみでエージェント行動に対する有意義な洞察を抽出できるかどうかを考察する。
知的エージェントが収束器質的価値を追求する傾向にある現象にインスパイアされた我々は、ICV(Intended Cooperation Values)を導入する。
ICVは、その決定(不確実性)と選好の整合性を評価することで、チームメイトの方針に対するエージェントの作用を測定する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:31:22 GMT)
RADAR: A Reasoning-Guided Attribution Framework for Explainable Visual Data Analysis [37.4] MLLM(Multimodal Large Language Models)は、自動視覚データ分析のための有望な機能を提供する。
しかし、視覚的データのどの部分が結論を知らせるかを可視化することができない。
MLLMの能力を評価するための第一歩を踏み出します。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:42:43 GMT)
WildSpoof Challenge Evaluation Plan [37.3] WildSpoof Challengeは、2つの間にある音声処理タスクにおいて、Wildデータの使用を促進することを目的としている。
本研究は,(1)音声合成のためのTTS(Text-to-Speech)と(2)音声検出のためのSASV(Spowing-robust Automatic Speaker Verification)の2つの並列トラックから構成される。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:08:24 GMT)
RPD-Diff: Region-Adaptive Physics-Guided Diffusion Model for Visibility Enhancement under Dense and Non-Uniform Haze [37.0] RPD-Diffは、複雑なヘイズシナリオにおける堅牢な可視性向上のための領域適応型物理誘導脱ハジング拡散モデルである。
物理的に先行して拡散マルコフ連鎖を変換し、ターゲット遷移を発生させ、密集したヘイズシナリオにおける条件付け不足の問題を緩和する。
密集した非均一なヘイズシナリオに挑戦して最先端のパフォーマンスを実現し、高品質で高精細な明快さと色忠実さを備えたヘイズフリーな画像を提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:12:26 GMT)
Parallel assembly of neutral atom arrays with an SLM using linear phase interpolation [36.9] 超高速空間光変調器で表示されたホログラムを更新することにより、光ツイーザ中の単一原子を任意のジオメトリに高速に並列に再配置する。
提案手法の汎用性を示すため, 再配置サイクル当たりの確率0.996(2)を成功させて, 同じ原子試料を複数のジオメトリーに分類した。
これにより、この手法は量子計算と量子シミュレーションのために大きな原子配列を再構成するための有用なツールとなる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:25:16 GMT)
Source Code Summarization in the Era of Large Language Models [34.8] 大規模言語モデル(LLM)は、コード関連のタスクのパフォーマンスを大幅に向上させた。
本稿では,LLMにおけるコード要約の体系的および包括的研究を行う。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:44:13 GMT)
TextOnly: A Unified Function Portal for Text-Related Functions on Smartphones [34.6] 本研究では,テキストボックスにテキストを入力するだけでテキスト関連機能にアクセス可能な統合機能ポータルであるTextOnlyを提案する。
たとえばレストランの名前を入力するとGoogleマップの検索がトリガーになり、挨拶はWhatsAppで会話を開始する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:17:02 GMT)
A Survey of Deep Learning-based Point Cloud Denoising [33.8] 3D幾何学の獲得は、コンピュータグラフィックス、自律運転、ロボット工学、拡張現実など、幅広いアプリケーションに欠かせない。
ポイントクラウドのデノゲーションは基本的な問題であり、基盤となる構造を保ちながらクリーンなポイントセットを回復することを目的としている。
最近のディープラーニングアプローチでは、ニューラルネットワークアーキテクチャを活用して、独特な表現を学び、強力な結果を示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:53:24 GMT)
HieroAction: Hierarchically Guided VLM for Fine-Grained Action Analysis [33.8] HieroActionは人間の行動の正確で構造化された評価を提供する視覚言語モデルである。
推論経路は評価プロセスを構成し、ポリシー学習は報酬に基づく最適化を通じて各ステージを洗練する。
これらの統合によって、複数のベンチマークデータセットで優れたパフォーマンスが示すように、正確で解釈可能なアセスメントが保証される。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:19:27 GMT)
Quantifying Language Disparities in Multilingual Large Language Models [31.2] 大規模多言語評価で報告された結果は、しばしば、対象言語、実験的な設定の違い、モデル選択などの要因によって断片化され、まとめられる。
本稿では,これらの相反する変数をアンタングル化し,性能実現率,変動係数,言語ポテンシャルの3つの解釈可能な指標を導入するフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 23:25:38 GMT)
THEME : Enhancing Thematic Investing with Semantic Stock Representations and Temporal Dynamics [30.9] テーマ投資は、構造的トレンドに沿ったポートフォリオを構築することを目的としています。
textscTHEMEは、複雑な投資テーマをナビゲートするためのスケーラブルで適応的なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:05:37 GMT)
scI2CL: Effectively Integrating Single-cell Multi-omics by Intra- and Inter-omics Contrastive Learning [29.2] scI2CLは、新しいシングルセルマルチオミクス融合フレームワークである。
scI2CLは、広く使用されている4つの実世界のデータセットで8つの最先端メソッドを上回っている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:42:28 GMT)
Balanced Sharpness-Aware Minimization for Imbalanced Regression [29.0] 実世界のデータは、しばしば不均衡な分布を示し、レグレッションモデルが特に希少な観測値のターゲット値に対して不適切な結果をもたらす。
回帰モデルの均一な一般化能力を実現するために,バランスドシャープネス・アウェア最小化(BSAM)を提案する。
特に,従来のシャープネス認識の最小化から始めて,観測空間全体にわたる一般化能力を均質化するための新たな目標再重み付け戦略を導入する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:57:07 GMT)
POT: Inducing Overthinking in LLMs via Black-Box Iterative Optimization [28.8] 我々は,ブラックボックス攻撃フレームワークのPOT(Prompt-Only OverThinking)を提案する。
PoTは他の方法に比べて優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:27:42 GMT)
Two Birds with One Stone: Enhancing Uncertainty Quantification and Interpretability with Graph Functional Neural Process [27.8] グラフニューラルネットワーク(GNN)は、グラフデータに強力なツールである。
しかし、それらの予測は誤校正され、解釈性に欠ける。
本稿では,新しい不確実性と解釈可能なグラフ分類モデルを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:48:05 GMT)
QuestA: Expanding Reasoning Capacity in LLMs via Question Augmentation [27.6] 強化学習(RL)は、大規模言語推論モデル(LLM)の訓練において重要な要素となっている。
本稿では,問題の難易度を低減し,より情報的な学習信号を提供するため,質問増補による簡易かつ効果的な戦略を提案する。
我々の方法であるQuestAは、数学推論タスクにおけるRLトレーニングで適用された場合、pass@1だけでなくpass@kも改善する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:48:58 GMT)
DataTales: A Benchmark for Real-World Intelligent Data Narration [26.9] DataTalesは、データナレーションにおける言語モデルの習熟度を評価するために設計されたベンチマークである。
本研究は,有能なデータナレーションに必要な精度と分析深度を達成する上で,言語モデルが直面する重要な課題を浮き彫りにするものである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 13:21:51 GMT)
DeAR: Dual-Stage Document Reranking with Reasoning Agents via LLM Distillation [26.7] 大規模言語モデル(LLM)は、候補集合に対する大域的推論を可能にすることで、リストワイズドキュメントの優先順位を変更している。
textbfDeeptextbfAgenttextbfRank(textbfDeAR)を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:46:08 GMT)
Preserving Domain Generalization in Fine-Tuning via Joint Parameter Selection [26.4] JPS(Joint Selection)は、パラメータの小さなサブセットへの更新を制限し、事前訓練されたモデルの強度を維持・活用する新しい手法である。
JPSは、最先端の領域一般化法と比較して優れた性能を示し、提案手法の有効性と有効性を実証する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:00:45 GMT)
Quantifying Sycophancy as Deviations from Bayesian Rationality in LLMs [26.3] Sycophancy, or overly agreeable or flattering behavior, is documented issue in large language model (LLMs)
ベイジアンフレームワークを用いて、ユーザの視点で提示された合理的な行動からの逸脱として、梅毒を定量化する。
我々は,3つの異なるタスク,オープンソースとクローズド LLM の組み合わせ,および2つの異なる方法について,サイコファンシーを探索する手法について検討した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:11:00 GMT)
Delta-SVD: Efficient Compression for Personalized Text-to-Image Models [25.1] 本研究では,DreamBoothファインチューニングによるパラメータ重み付け更新をターゲットとした,ポストホックなトレーニング不要圧縮手法であるDelta-SVDを提案する。
Delta-SVD は,CLIP スコア,SSIM,FID で測定された生成品質の低下を無視して,かなりの圧縮を実現することを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:21:46 GMT)
FaceCrafter: Identity-Conditional Diffusion with Disentangled Control over Facial Pose, Expression, and Emotion [25.0] 本研究では,アイデンティティ保存を損なうことなく,ポーズ,表情,感情を正確に制御できる新しいアイデンティティ条件拡散モデルを提案する。
提案手法は,ポーズ,表情,感情に対する制御精度の点で既存の手法を超越し,アイデンティティのみの条件下での生成の多様性を向上させる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:20:34 GMT)
GraphPPD: Posterior Predictive Modelling for Graph-Level Inference [24.4] 本研究では,不確実性を考慮した予測を実現するために,後天予測分布(PPD)のための新しい変分モデルフレームワークを提案する。
既存のGNNから派生したグラフレベルの埋め込みに基づいて、我々のフレームワークはデータ適応方式でPDを学習することができる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:28:50 GMT)
Planning for Success: Exploring LLM Long-term Planning Capabilities in Table Understanding [24.3] 本稿では,大規模言語モデルの長期計画能力を活用してテーブル理解を強化することを提案する。
当社のアプローチでは,ステップが緊密に相互接続され,最終的な目標を達成する,長期計画の実行を可能にします。
本手法は,WikiTableQuestionsおよびTabFactデータセット上での最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:24:35 GMT)
Improving Table Understanding with LLMs and Entity-Oriented Search [24.3] 大規模言語モデル(LLM)を用いたテーブル理解向上のためのエンティティ指向検索手法を提案する。
このアプローチは、質問とテーブルデータ間の意味的類似性、およびテーブルセル間の暗黙的な関係を効果的に活用する。
テーブルエンティティにフォーカスし、テーブルセルがセマンティックにタイトに束縛されていることを保証する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:02:45 GMT)
Spatio-Temporal Pruning for Compressed Spiking Large Language Models [23.7] 大規模言語モデル(LLM)は、大きなモデルサイズと高い推論遅延のため、エネルギー環境への展開に重大な課題をもたらす。
高速な性能を維持しながら計算効率を最適化するスパイクLDMのための新しいスパイク時空プルーニングフレームワークを提案する。
私たちのアプローチは、リアルタイムで低消費電力の自然言語処理アプリケーションに魅力的なソリューションを提供します。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:21:47 GMT)
WHEN TO ACT, WHEN TO WAIT: Modeling the Intent-Action Alignment Problem in Dialogue [23.4] 対話システムは、ユーザ発話が意味論的に完全であると同時に、適切なシステムアクションに必要な明快さと完全さが欠如している場合に失敗することが多い。
我々は、UserLLMとAgentLLMの対話を通して非対称情報ダイナミクスをモデル化するフレームワークSTORMを提案する。
コントリビューションには,(1)対話システムにおける非対称情報処理の形式化,(2)協調理解の進化をモデル化する意図形成,(3)タスクパフォーマンスとともに内部認知改善を測定する評価指標などが含まれている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 18:43:47 GMT)
SSG-Dit: A Spatial Signal Guided Framework for Controllable Video Generation [22.1] 制御可能なビデオ生成は、ユーザが提供する条件と正確に整合したビデオコンテンツを合成することを目的としている。
既存のモデルは、しばしば強いセマンティック一貫性を維持するのに苦労する。
本稿では,高忠実度制御可能なビデオ生成のための新しい,効率的なフレームワークであるSSG-DiTを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:30:17 GMT)
Sim-to-Real Transfer of Deep Reinforcement Learning Agents for Online Coverage Path Planning [22.1] 被覆経路計画は、制限された地域の自由空間全体をカバーする経路を見つける問題である。
本稿では,この課題に対する連続空間強化学習の有効性について検討する。
提案手法は従来のRLに基づく手法と高度に専門化された手法の両方の性能を上回ることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:20:46 GMT)
Neural Contrast Expansion for Explainable Structure-Property Prediction and Random Microstructure Design [21.8] 本稿では,費用対効果と説明可能な構造固有性モデルを提案する。
提案手法は強コントラスト展開形式の上に構築され,非有界ランダム場の$N$-point相関をその有効特性に解析的にマッピングする。
静的伝導および電磁波伝搬の場合,NCEモデルは材料設計に有用な正確で洞察に富んだ感度情報を明らかにする。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:00:43 GMT)
4D-PreNet: A Unified Preprocessing Framework for 4D-STEM Data Analysis [20.8] 注意力強化されたU-NetアーキテクチャとResNetアーキテクチャを統合したエンドツーエンドのディープラーニングパイプラインである4D-PreNetを,デノナイズ,中心補正,楕円歪み校正を同時に行う。
我々のパイプラインは、偏光中に平均2乗誤差を最大50%削減し、中心検出タスクにおいて、平均誤差が0.04ピクセル未満で、サブピクセル中心の局所化を実現する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:24:09 GMT)
Self-Correcting Code Generation Using Small Language Models [20.7] 自己補正は、言語モデルが連続的な改善を通じて出力を修正および改善できるようにすることで、コード生成の可能性を実証している。
マルチターンコード修正のための小型言語モデルの能力向上を目的としたアプローチであるCoCoSを紹介する。
1Bスケールのモデルでは、CoCoSはMBPPで35.8%、HumanEvalで27.7%の改善を実現している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:05:01 GMT)
Quadratic Binary Optimization with Graph Neural Networks [20.5] グラフニューラルネットワーク(GNN)と擬似非制約バイナリ最適化(QUBO)の相関について検討する。
本稿では,グラフ表現学習技術とQUBO認識機能を統合するアーキテクチャであるQUBO-GNNを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:08:52 GMT)
Addressing Annotation Scarcity in Hyperspectral Brain Image Segmentation with Unsupervised Domain Adaptation [19.8] 本研究は、高スペクトル脳画像における脳血管のセグメンテーションのための新しいディープラーニングフレームワークを提案する。
本研究は,従来の教師付きトレーニングを阻害する重度ラベル不足に対する批判的課題に対処する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:55:42 GMT)
ZPD-SCA: Unveiling the Blind Spots of LLMs in Assessing Students' Cognitive Abilities [19.7] 大規模言語モデル(LLM)は、教育応用の可能性を示しているが、読み物の認知的アライメントを正確に評価する能力は、まだ十分に研究されていない。
ステージレベルの中国語読解難易度を評価するための新しいベンチマークであるZPD-SCAを紹介する。
実験の結果,LLMはゼロショット学習のシナリオでは不十分であり,Qwen-max と GLM はランダムな推測の確率よりも低い値を示した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 05:27:00 GMT)
Sig-DEG for Distillation: Making Diffusion Models Faster and Lighter [19.3] Signature-based Differential Equation Generator (Sig-DEG) は、事前学習した拡散モデルを蒸留するための新しい生成装置である。
Sig-DEGは部分シグネチャを利用して、部分区間上のブラウン運動を効率的に要約する。
実験により、Sig-DEGは、推論ステップの数を桁違いに減らしながら、競合生成品質を達成することを示した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:16:14 GMT)
Not Just for Archiving: Provable Benefits of Reusing the Archive in Evolutionary Multi-objective Optimization [19.3] 我々は,新たなソリューション生成の過程において,MOEAを再利用することで,アーカイブをさらに支援できることを解析的に示す。
本分析は、よく研究されているOneJumpZeroJump問題に適用されたSMS-EMOAに焦点をあてる。
また, アーカイブ・ソリューションの再利用は, 人口規模を直接利用するよりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:25:19 GMT)
HiCache: Training-free Acceleration of Diffusion Models via Hermite Polynomial-based Feature Caching [19.1] HiCacheはトレーニング不要のアクセラレーションフレームワークで、機能予測を改善する。
本稿では,予測精度を保ちながら数値安定性を確保する二重スケーリング機構を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:35:16 GMT)
Structural Energy-Guided Sampling for View-Consistent Text-to-3D [19.0] テキスト・トゥ・3D生成はしばしばジャヌス問題に悩まされ、オブジェクトが他の角度から重複または歪んだ幾何学に崩壊する。
本研究では, 実時間で完全にマルチビューの整合性を実現する学習自由なプラグイン・アンド・プレイフレームワークSEGSを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:26:04 GMT)
AWM-Fuse: Multi-Modality Image Fusion for Adverse Weather via Global and Local Text Perception [18.4] AWM-Fuseは、悪天候に対する新しい融合法である。
グローバルテキストとローカルテキストの認識によって、複数の劣化を処理するように設計されている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:55:19 GMT)
360Brew: A Decoder-only Foundation Model for Personalized Ranking and Recommendation [18.3] 我々は、LinkedInのデータとタスクに基づいてトレーニングされ、微調整された150Bパラメータ、デコーダのみのモデルである、研究前のモデルである360Brew V1.0を紹介します。
このモデルは、LinkedInプラットフォームのさまざまなセグメントで30以上の予測タスクを解決し、現在のプロダクションシステムと同等以上のパフォーマンスレベルを達成することができる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:04:03 GMT)
On the sample complexity of semi-supervised multi-objective learning [17.9] 多目的学習では、競合する可能性のある予測タスクを1つのモデルで共同で解決する必要がある。
Bregman の損失で定義された目的に対して、$mathcalG$ の複雑さはラベルのないデータでのみ有効であることが証明される。
これらのレートは擬似ラベルによる単純な半教師付きアルゴリズムによって達成される。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:15:36 GMT)
Optimizing Neural Networks with Learnable Non-Linear Activation Functions via Lookup-Based FPGA Acceleration [17.9] FPGAベースの設計は、エッジCPUやGPUに比べて優れた計算速度と104ドル以上のエネルギー効率を実現する。
このブレークスルーは、我々のアプローチをエネルギークリティカルエッジAIの実用的な実現方法として位置づけており、計算強度と電力制約が従来の適応的アクティベーションネットワークの使用を妨げている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:51:14 GMT)
ZAPS: A Zero-Knowledge Proof Protocol for Secure UAV Authentication with Flight Path Privacy [17.6] 既存の暗号化技術はセキュリティを提供するが、完全なプライバシーを保証することができない。
本稿では,zk-SNARKに基づくプライバシ保護型フライトパス認証・検証フレームワークを提案する。
私たちのソリューションは、プライバシ、セキュリティ、計算効率のバランスをとり、民間と軍事の両方の用途において、リソースに制約のあるUAVに適している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:45:25 GMT)
LLM-based Human-like Traffic Simulation for Self-driving Tests [16.8] 本稿では,認知理論と大規模言語モデル(LLM)を組み合わせ,現実的な交通シナリオを生成するHDSimを提案する。
実験により、HDSimをシミュレーションに組み込むことで、自動運転システムの安全性に重大な障害の検出が最大68%向上し、現実主義と矛盾する事故の解釈可能性が得られることが明らかになった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:30:55 GMT)
Local Information Matters: A Rethink of Crowd Counting [16.7] 本論文の動機は,画像のごく一部を個人が占める,群集カウントの本質的特徴を再考することにある。
これにより,モデルの局所的モデリング能力を強調する,クラウドカウントの新しいモデル設計原則を提案する。
LIMM(Local Information Matters Model)と呼ばれる群集カウントモデルの設計と原則に従う。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:45:19 GMT)
History-Aware and Dynamic Client Contribution in Federated Learning [16.7] Federated Learning(FL)は、複数のクライアントがプライベートデータを公開せずにMLモデルをトレーニングする、コラボレーティブ機械学習(ML)アプローチである。
本稿では,クライアント参加が動的であるFLContribという履歴認識型クライアントコントリビューションアセスメントアセスメントフレームワークを提案する。
FLContribは,複数のユーティリティ関数に対するコントリビューションを推定する上で,効率的かつ一貫して正確であることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:13:12 GMT)
MDD: A Dataset for Text-and-Music Conditioned Duet Dance Generation [16.7] テキスト制御および音楽条件付き3Dデュエットダンスモーション生成用に設計された多モードベンチマークデータセットであるMultimodal DuetDance(MDD)を紹介する。
我々のデータセットは、プロのダンサーが行う620分間の高品質なモーションキャプチャーデータからなり、音楽と同期し、10K以上のきめ細かい自然言語記述を詳述する。
アノテーションは、空間的関係、身体の動き、リズムを詳述し、人間の動き、音楽、そしてデュエットダンス生成のためのテキストをシームレスに統合する最初のデータセットとなる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 05:56:37 GMT)
Beyond Emotion Recognition: A Multi-Turn Multimodal Emotion Understanding and Reasoning Benchmark [15.9] 実生活シナリオから1,451件のビデオデータと5,101件のプログレッシブ質問を含むマルチターンマルチモーダル感情理解・推論ベンチマークを導入する。
本稿では,エージェントが背景コンテキスト,文字のダイナミックス,イベントの詳細といった特定の側面を専門とするマルチエージェントフレームワークを提案し,システムの推論能力を向上させる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:10:29 GMT)
Natural Language Satisfiability: Exploring the Problem Distribution and Evaluating Transformer-based Language Models [15.8] 満足度問題は様々な次元によって異なり、TLMがそれらの解法を学ぶ能力に影響を及ぼす可能性がある。
計算複雑性のクラスや文法構成の異なる問題インスタンスが,TLMの推論規則を学習する能力にどのように影響するかを検討する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:19:16 GMT)
Frequency Regulation for Exposure Bias Mitigation in Diffusion Models [15.6] 逆過程における予測ノイズサンプルのエネルギーは、前方過程における摂動サンプルと比較して連続的に減少する。
我々はウェーブレット変換を利用した動的周波数制御機構を導入し、低周波サブバンドと高周波サブバンドを別々に調整する。
我々は厳密な数学的形態の露出バイアスを導出する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:17:35 GMT)
DPad: Efficient Diffusion Language Models with Suffix Dropout [14.9] Diffusion Scratchpad (DPad) は、近くの接尾辞の小さなセットに注意を向ける訓練不要の手法である。
DPad は (i) 固定長の接尾辞窓を維持するスライディングウィンドウ, (ii) 距離デカイドロップアウト, (ii) 注意計算の前に遠接辞トークンを決定的に除去する2つの戦略を統合している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:28:45 GMT)
HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation [14.9] HunyuanVideo-Foleyはエンドツーエンドのテキスト・ビデオ・オーディオ・フレームワークである。
高忠実度オーディオを視覚力学や意味文脈と正確に整合させて合成する。
音声の忠実度、視覚的セマンティックなアライメント、時間的アライメント、分布マッチングにまたがる新しい最先端パフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:30:18 GMT)
RecCoT: Enhancing Recommendation via Chain-of-Thought [14.7] 現代のレコメンデーションシステムは、暗黙のフィードバック信号からユーザとイテムの協調信号を学習する。
RecSysは、ユーザーがなぜ特定のアイテムを好まないかを理解するのに苦労する。
これらの手法の多くはレビューのレーティングの予測に重点を置いているが、人間には理解できない説明を与えていない。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:34:13 GMT)
e-boost: Boosted E-Graph Extraction with Adaptive Heuristics and Exact Solving [14.7] Eグラフは多くの分野、特に論理合成と形式的検証に興味を寄せている。
このギャップを3つの重要なイノベーションで埋める新しいフレームワークであるe-boostを紹介します。
e-boostは、従来の正確なアプローチ(ILP)よりも58倍のランタイムスピードアップを示し、最先端の抽出フレームワーク(SmoothE)よりも19.04%パフォーマンスが改善された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 21:21:57 GMT)
Score Matching on Large Geometric Graphs for Cosmology Generation [14.6] 宇宙論における銀河の重力クラスタリングをシミュレートする等変グラフニューラルネットワークを用いたスコアベース生成モデルを提案する。
提案した同変スコアベースモデルでは,60,000halosまでの本格的な宇宙論的な点雲の生成に成功した。
この研究は、構造形成の基盤となる重力クラスターと密接に類似するように設計された生成モデルを導入することで進展する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:08:06 GMT)
Does Calibration Affect Human Actions? [14.6] 分類モデルの校正が、モデルの予測を消費する非専門家による決定にどのように影響するかを検討する。
予測理論の補正は、人間の判断とモデルの予測との相関性を高めるために不可欠である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:12:47 GMT)
ImF: Implicit Fingerprint for Large Language Models [14.6] 我々は,ジェネレーション・リビジョン・インターベンション(GRI)攻撃という新たな敵攻撃を導入する。
GRIは、現在のフィンガープリント手法のセマンティックな脆弱性を利用して、事実上指紋を消去する。
Inlicit Fingerprints (ImF) と呼ばれる新しいモデル指紋パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:45:26 GMT)
Unbiased Reasoning for Knowledge-Intensive Tasks in Large Language Models via Conditional Front-Door Adjustment [14.5] 大規模言語モデル(LLM)は自然言語処理において顕著な能力を示しているが、知識集約的なタスクではうまく機能しない。
本稿では,クエリと応答間の因果効果の偏りのない推定を可能にする,新しい因果的プロンプトフレームワークである条件付きフロントドアプロンプト(CFD-Prompting)を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 05:52:39 GMT)
Reconciling Communication Compression and Byzantine-Robustness in Distributed Learning [14.2] 分散学習(DL)は、分散データよりもスケーラブルなモデルトレーニングを可能にするが、ビザンチンの障害や通信コストの高さに悩まされている。
本稿では,従来のPolyakの運動量と新たなコーディネート圧縮機構を統合したRoSDHBというアルゴリズムを提案する。
特に、正直な労働者の平均損失関数のリプシッツの滑らかさは、[29]と対照的に、大域的ヘッセン分散の特別な滑らかさを仮定する[29]に対してのみ仮定する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:11:47 GMT)
LiteASR: Efficient Automatic Speech Recognition with Low-Rank Approximation [13.8] 本稿では,ASRエンコーダの低ランク圧縮方式であるLiteASRを導入する。
評価の結果,Whisperの大容量v3エンコーダサイズを50%以上圧縮し,Whisper媒体サイズと転写精度を比較検討した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:42:54 GMT)
Decoding Alignment: A Critical Survey of LLM Development Initiatives through Value-setting and Data-centric Lens [13.7] AIアライメントは、大規模言語モデルの開発におけるポストトレーニングフェーズの基盤となっている。
この研究は、価値設定とデータ中心の観点から、アライメントがどのように理解され、実際に適用されるかを明らかにすることを目的としています。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:18:43 GMT)
SERES: Semantic-aware neural reconstruction from sparse views [13.5] スパース画像から3次元高忠実度モデルを生成する意味認識型ニューラルネットワーク再構成法を提案する。
スパース入力における不一致特徴によって引き起こされる重度のラディアンス曖昧性の課題に対処するために,パッチベースの意味ロジットを追加することにより,ニューラルな暗黙表現を充実させる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:14:01 GMT)
PII-Compass: Guiding LLM training data extraction prompts towards the target PII via grounding [13.4] ドメイン内データを用いて手作業で構築した抽出プロンプトを接地することで,個人識別情報(PII)の抽出性を向上させることができることを示す。
提案手法は,1,128,128,2308問合せでそれぞれ0.92%,3.9%,6.86%のPII電話番号抽出率,すなわち15人に15人の電話番号を抽出可能である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:46:24 GMT)
Linguistic Neuron Overlap Patterns to Facilitate Cross-lingual Transfer on Low-resource Languages [13.1] 我々は,ゼロショット言語間インコンテキスト学習を改善するための,シンプルで効果的な方法であるBridgeX-ICLを提案する。
言語固有のニューロンに焦点を当てた既存の研究とは異なり、BridgeX-ICLは、共有ニューロンが言語間性能を向上させるかどうかを探求している。
我々は,LLMの内部言語スペクトルを重なり合うニューロンに基づいて定量化するためのHSICに基づく計量法を提案し,最適な橋梁選択を導出する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:13:57 GMT)
Cross-field SNR Analysis and Tensor Channel Estimation for Multi-UAV Near-field Communications [13.0] 本稿では,分散近接場マルチUAV通信システムにおけるチャネル推定について検討する。
球面領域マッチング探索(SD-OMP)とテンソル-OMPの2つのチャネル推定アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:50:36 GMT)
Requirements-Driven Automated Software Testing: A Systematic Review [13.0] この体系的な文献は、要求入力フォーマット、変換技術、生成されたテストアーティファクト、評価方法、一般的な制限の現状を批判的に検証する。
本研究は,機能要件,モデルベース仕様,自然言語フォーマットの優位性に注目した。
テストケース、構造化されたテキスト形式、要求カバレッジは一般的だが、完全な自動化は依然として稀である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:40:57 GMT)
What Did I Do Wrong? Quantifying LLMs' Sensitivity and Consistency to Prompt Engineering [13.0] 分類タスク,すなわち感度と一貫性の2つの指標を導入する。
感度はプロンプトの 言い換えによる予測の変化を測る
その代わり、一貫性は、同じクラスの要素の言い換えで予測がどのように変化するかを測定する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 18:44:57 GMT)
VQL: An End-to-End Context-Aware Vector Quantization Attention for Ultra-Long User Behavior Modeling [12.6] 大規模レコメンデーションシステムでは、超長期のユーザ行動シーケンスは、進化する関心の豊かなシグナルを符号化する。
超長期動作モデリングのためのコンテキスト対応ベクトル量子化アテンションフレームワークであるVQLを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:58:18 GMT)
Styleclone: Face Stylization with Diffusion Based Data Augmentation [12.5] StyleCloneは、画像から画像への翻訳ネットワークを訓練して、特定のスタイルで顔をスタイリングする方法である。
従来のスタイル画像と実顔画像の両方でガイドされた多様なスタイルサンプルを生成することにより、スタイルデータセットの多様性を著しく向上させる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:48:18 GMT)
RephraseTTS: Dynamic Length Text based Speech Insertion with Speaker Style Transfer [12.5] そこで本研究では,対応する全文書き起こしを条件としたテキスト条件付き音声挿入作業を提案する。
提案手法は,可変長の音声挿入が可能な変圧器に基づく非自己回帰手法に従う。
実験結果とLibriTTSのユーザスタディにより,既存の適応テキストから音声への変換法に基づくベースラインよりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:12:49 GMT)
Investigating red packet fraud in Android applications: Insights from user reviews [12.5] 我々は,赤いパケットを持つアプリのユーザレビューの広範な収集について,最初の調査を行っている。
334のアプリから36万以上の実際のユーザーレビューを集めており、赤いパケットはGoogle Playと3つの人気Androidアプリマーケットで入手できる。
赤いパケット詐欺が普及し、ユーザー体験に大きな影響を与え、アプリの評判を損なうことがわかりました。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:19:26 GMT)
ObjexMT: Objective Extraction and Metacognitive Calibration for LLM-as-a-Judge under Multi-Turn Jailbreaks [12.4] OBJEX(MT)は,テキストを単一文ベースに抽出するモデルを必要とするベンチマークである。
抽出された金の目的との意味的類似性を用いて、LLM判定器によって精度が評価される。
クロードソネット4は,最大目標抽出精度(0.515)と最適キャリブレーションを実現する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:32:04 GMT)
SPORTSQL: An Interactive System for Real-Time Sports Reasoning and Visualization [12.4] 動的スポーツデータの自然言語クエリと可視化のためのモジュール型インタラクティブシステムであるSPORTSQLを提案する。
このシステムは,リアルタイム・ファンタシー・プレミアリーグ(FPL)データから構築した実時間インデックスデータベース上で,ユーザ質問を実行可能sqlに変換する。
私たちのデモでは、非専門家のユーザが、自然な会話インターフェースを通じて、スポーツ統計の進化をシームレスに探求する方法について強調した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:51:30 GMT)
A Global Optimization Algorithm for K-Center Clustering of One Billion Samples [12.1] 本稿では,K中心クラスタリング問題に対する実用的なグローバル最適化アルゴリズムを提案する。
クラスタ内の最大距離を最小化するために、クラスタの中心としてKサンプルを選択することを目的としている。
我々のアルゴリズムは、合成および実世界の全てのデータセットにおいて、目的関数を平均25.8%削減することができる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:25:04 GMT)
Dream to Chat: Model-based Reinforcement Learning on Dialogues with User Belief Modeling [11.9] 我々は,ユーザの感情,感情,意図,将来的な発話を予測できる対話世界モデルを構築した。
本稿では,モデルに基づく強化学習フレームワークを対話システムに適用し,DreamCUBというフレームワークを提案する。
実験により、事前訓練された対話世界モデルは、感情分類と感情識別に関する最先端のパフォーマンスを達成できることが示されている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:24:03 GMT)
SALMAN: Stability Analysis of Language Models Through the Maps Between Graph-based Manifolds [11.4] 本研究では,内部パラメータの変更や複雑な摂動に頼らずにモデル安定性を評価する統一的局所(サンプルレベル)ロバストネスフレームワーク(SALMAN)を提案する。
提案手法の中心となるのがDMD(Distance Mapping Distortion)尺度である。
攻撃効率とロバストトレーニングの大幅な向上を示すことによって、我々は、トランスフォーマーベースのNLPシステムの信頼性を向上させるための実用的、モデルに依存しないツールとして、我々のフレームワークを位置づける。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:50:55 GMT)
Multimodal Medical Endoscopic Image Analysis via Progressive Disentangle-aware Contrastive Learning [11.2] 本稿では,Align-Disentangle-Fusion'機構に基づく,革新的な多モード表現学習フレームワークを提案する。
本手法は最先端のアプローチを一貫して上回り,様々な臨床シナリオにおいて高い精度を達成している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:02:51 GMT)
DeltaFlow: An Efficient Multi-frame Scene Flow Estimation Method [10.8] 我々はDeltaFlow(Delta$Flow)という軽量な3Dフレームワークを提案し、Delta$スキームを通じて動きのキューをキャプチャし、時間的特徴を最小の計算コストで抽出する。
$Delta$Flowは22%のエラーと2倍の高速推論で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:06:59 GMT)
Optimizing the Design of an Artificial Pancreas to Improve Diabetes Management [10.6] 糖尿病は米国だけでも3800万人に影響を与える。
この治療の目的は、連続したグルコースメーターで測定されるように、血糖値を許容範囲の中央に保持することである。
第二の目標は注射を最小化することであり、これは一部の患者が実施するのが不快で困難である。
本研究では,神経進化を治療の最適な戦略の発見に用いた。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:00:41 GMT)
Effective Red-Teaming of Policy-Adherent Agents [10.5] タスク指向のLLMベースのエージェントは、適格性やキャンセルルールの返金といった厳格なポリシーを持つドメインで、ますます使われています。
本稿では,個人的利益のためにポリシーに忠実なエージェントを活用することを目的とした,敵対的ユーザに焦点を当てた新たな脅威モデルを提案する。
CRAFTは、ポリシーを意識した説得戦略を利用して、顧客サービスシナリオにおいてポリシーに忠実なエージェントを弱体化させるマルチエージェントのレッドチームシステムである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:21:30 GMT)
TabResFlow: A Normalizing Spline Flow Model for Probabilistic Univariate Tabular Regression [10.5] 単変量表回帰に特化して設計された正規化スプラインフローモデルであるTabResFlowを紹介する。
我々は、9つの公開ベンチマークデータセット上でTabResFlowを評価し、確率スコアの既存の確率回帰モデルを一貫して上回っていることを示した。
また,現実の自動車価格予測タスクにおけるTabResFlowの実用性についても,選択的回帰の下で検証した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:09:02 GMT)
Being Kind Isn't Always Being Safe: Diagnosing Affective Hallucination in LLMs [10.5] 大きな言語モデル(LLM)は、感情的に敏感な相互作用にますます使われています。
我々は、このリスクを、情緒的な社会的存在を育む感情的に没入的な反応を生み出す、感情的幻覚(Affective Hallucination)と定義する。
AHaBenchは,500件のメンタルヘルス関連プロンプトと専門家インフォームド・リファレンス・レスポンスのベンチマークで,情緒的エンメシュメント(Emotional Enmeshment),Illusion of Presence(Illusion of Presence),Fostering Overdependence(Fostering Overdependence)の3次元で評価した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:55:05 GMT)
Targeted Wearout Attacks in Microprocessor Cores [10.5] 負バイアス温度不安定は、マイクロプロセッサなどのナノスケールCMOS回路において支配的な老化機構である。
この入力への依存は、論理のターゲットパスが意図的に劣化する可能性のあるタイミング障害注入攻撃を意味する。
我々は、攻撃者がそのような攻撃を利用でき、同一のユニットを使用した共実行の被害者アプリケーションにおいて、ターゲットデータとサイレントデータの破損につながることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:54:21 GMT)
Towards Safeguarding LLM Fine-tuning APIs against Cipher Attacks [10.5] 敵は、モデルの安全性メカニズムをバイパスするために、大きな言語モデルの微調整APIを利用することができる。
モデル安全性を維持する防衛戦略の能力を評価するためのベンチマークであるCIFR(Cipher Fine-tuning Robustness benchmark)を紹介する。
プローブモニタは,99%以上の検出精度を達成し,未知の暗号変種や家族に一般化し,最先端のモニタリング手法と比較した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:55:15 GMT)
A Novel Local Focusing Mechanism for Deepfake Detection Generalization [10.2] ディープフェイク生成技術は、堅牢で一般化可能な検出方法の必要性を強めている。
本研究では,実画像と偽画像を識別するための識別的局所特徴に明示的に対応する新しいローカルフォーカス機構(LFM)を提案する。
LFMは3.7の精度向上と2.8の精度向上を実現している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:06:30 GMT)
Exponential Family Variational Flow Matching for Tabular Data Generation [10.2] 本研究では,表データ生成のための変分フローマッチング(VFM)手法であるTabbyFlowを開発した。
異種データ型を表すEF-VFM(Exponential Family Variational Flow Matching)を提案する。
また,Bregmanの発散に基づく変動流整合と一般化流整合の関連性を確立する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:55:24 GMT)
Baltimore Atlas: FreqWeaver Adapter for Semi-supervised Ultra-high Spatial Resolution Land Cover Classification [9.7] ランドカバー分類は、サブメーターリモート画像上でのランドカバータイプを特定する。
既存の手法のほとんどは1mの画像にフォーカスし、大規模なアノテーションに大きく依存している。
本稿では,大規模トレーニングデータへの依存度を低減するため,土地被覆分類フレームワークであるボルチモア・アトラスを紹介する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:08:04 GMT)
UM3: Unsupervised Map to Map Matching [9.7] マップ・ツー・マップマッチング(Map-to-map matching)は異種ソース間で空間データを整列させる重要なタスクである。
3つの重要な革新を通じてこれらの課題に対処する、教師なしグラフベースのフレームワークを提案する。
提案手法は,タスクマッチングにおける最先端の精度を実現し,既存の手法を大きなマージンで上回っている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:14:52 GMT)
MSPCaps: A Multi-Scale Patchify Capsule Network with Cross-Agreement Routing for Visual Recognition [9.5] マルチスケール・パッチ・カプセル・ネットワーク(MSPCaps)は,マルチスケールの特徴学習と効率的なカプセル・ルーティングを統合した新しいアーキテクチャである。
提案するMPPCapsは優れたスケーラビリティと優れたロバスト性を実現し,分類精度の点で複数のベースライン法を一貫して上回っている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:56:00 GMT)
The Impact of Annotator Personas on LLM Behavior Across the Perspectivism Spectrum [9.5] ヘイトスピーチと虐待を注釈するLarge Language Models(LLMs)の能力について検討する。
我々は、パースペクティブ・モデリングのための既存のアノテータ・モデリング技術に対するLCM生成アノテーションを評価する。
強いパースペクティビズムに合わせたよりパーソナライズされたデータセットに対して、LLMアノテータモデリングの性能は近づいたが、人間のアノテータには及ばなかった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 23:32:09 GMT)
ExtraGS: Geometric-Aware Trajectory Extrapolation with Uncertainty-Guided Generative Priors [9.0] エクストラGSは、幾何学的および生成的事前の両方を統合する軌道外挿のための全体論的なフレームワークである。
その結果,ExtraGSは外挿されたビューのリアリズムと幾何的整合性を著しく向上する一方で,元の軌道に沿って高い忠実さを保っていることがわかった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:53:01 GMT)
Solving the Min-Max Multiple Traveling Salesmen Problem via Learning-Based Path Generation and Optimal Splitting [8.9] Min-Max Multiple Traveling Salesmen Problemは、複数のセールスマンのツアーをコーディネートすることで、最長ツアーの長さを最小化することを目的としている。
NPハードの性質のため、正確な解法は$P ne NP$という仮定の下で非現実的になる。
我々は,強化学習と最適分割アルゴリズムを統合した2段階のフレームワークである textbfGenerate-and-Split (GaS) を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:00:57 GMT)
Factor Informed Double Deep Learning For Average Treatment Effect Estimation [8.8] 本稿では,二重深層学習戦略を用いた推定手法を提案する。
応答関数と確率スコアの両方にFAST-NN(Facter-augmented Deep Learning-based estimator)を用いる。
提案手法は, 極めてフレキシブルな確率モデルと結果モデルに基づいて, 半パラメトリック効率を実現する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:26:33 GMT)
Mind the Gap: A Decade-Scale Empirical Study of Multi-Stakeholder Dynamics in VR Ecosystem [8.6] トピックモデリングと影響分析を944,320のユーザレビューと389,477の開発者投稿に適用する。
以上の結果から,ユーザが繰り返しこのような問題を提起する一方で,開発者フォーラムで議論されることは滅多にないことがわかった。
これらの洞察は、VRエコシステムにおけるユーザーと開発者の間のギャップを埋めるためのデータ駆動のレコメンデーションを可能にする。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 05:35:12 GMT)
GoalfyMax: A Protocol-Driven Multi-Agent System for Intelligent Experience Entities [8.5] 私たちは、エンドツーエンドのマルチエージェントコラボレーションのためのプロトコル駆動フレームワークであるGoalfyMaxを紹介します。
GoalfyMax が Model Context Protocol (MCP) 上に構築された標準化された Agent-to-Agent (A2A) 通信層を導入
Experience Pack(XP)アーキテクチャは、タスクの合理性と実行トレースの両方を保存する階層型メモリシステムである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:06:11 GMT)
ReFactX: Scalable Reasoning with Reliable Facts via Constrained Generation [8.3] 本稿では,検索者や補助モデルに依存することなく,大規模言語モデルが外部知識にアクセスできるようにするスケーラブルな手法を提案する。
提案手法はプレビルドプレフィックスツリーインデックスを用いた制約付き生成を用いる。
質問応答に関する提案を評価した結果,大規模知識ベース(事実8億件)にスケールし,ドメイン固有のデータに適応し,効果的な結果が得られた。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:21:47 GMT)
Online Learning for Approximately-Convex Functions with Long-term Adversarial Constraints [8.3] 本研究では, 長期的予算制約を伴うオンライン学習問題を, 対戦環境において検討する。
この問題では、各ラウンド$t$で、学習者は凸集合からアクションを選択し、その後、相手がコスト関数を明らかにする。
提案手法は, 保証を改善した$textttAdversas$問題に対して, 効率的なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:21:24 GMT)
Provable Emergence of Deep Neural Collapse and Low-Rank Bias in $L^2$-Regularized Nonlinear Networks [8.3] 非線形活性化を伴うフィードフォワードネットワークの一般クラスに対して,ディープ・ニューラル・崩壊と低ランク・ウェイト行列の出現との関係を示す。
また, 深い神経崩壊構成のグローバルな最適性や, 補間最小点と大域的最適点の間の損失障壁の実用的欠如を証明した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:01:08 GMT)
Playing with Voices: Tabletop Role-Playing Game Recordings as a Diarization Challenge [7.9] 本稿では,テーブルトップロールプレイングゲーム (TTRPG) のオーディオがダイアリゼーションシステムの課題であることを示す。
我々は、小さなTTRPGオーディオデータセットを作成し、AMIとICSIコーパスと比較する。
その結果,TTRPGsの特性は両ダイアリザの混乱率が高いことがわかった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:23:40 GMT)
Automated Landfill Detection Using Deep Learning: A Comparative Study of Lightweight and Custom Architectures with the AerialWaste Dataset [7.8] AerialWasteデータセットは、イタリアのロンバルディア地方の10434枚の画像の大規模なコレクションである。
ディープラーニングモデルを使用して、データセットをトレーニングし、検証した。
バイナリ分類は92.33%の精度、92.67%の精度、92.33%の感度、92.41%のF1スコア、92.71%の特異性を持つ。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:52:24 GMT)
Orchid: Image Latent Diffusion for Joint Appearance and Geometry Generation [7.7] 色, 深度, 表面の正常な画像を生成する前に, 共同外観幾何学を学習する統合潜在拡散モデルOrchidを導入する。
Orchidは、テキストから直接色、深さ、正常な画像を生成し、関節の単眼深度と正常な推定をサポートする。
関節分布から採取することで、大きな3D領域をシームレスに塗布する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:12:57 GMT)
Modeling Probabilistic Reduction using Information Theory and Naive Discriminative Learning [7.7] 我々はBuckeyeコーパスを用いた3つのモデルについて検討した。1つは情報理論式を用いたNDL由来予測器、もう1つは従来のNDL予測器、もう1つはN-gram確率予測器である。
以上の結果から,N-gramモデルはNDLモデルよりも優れており,NDLが認知モチベーションが高いという仮定に挑戦する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:31:05 GMT)
Drive As You Like: Strategy-Level Motion Planning Based on A Multi-Head Diffusion Model [7.3] 拡散型多頭部軌道プランナ(M拡散プランナ)を提案する。
初期の訓練段階では、すべての出力ヘッドは、高品質な軌道を生成するためにウェイトを共有する。
戦略選択のガイドとして,大規模言語モデル(LLM)を導入し,動的かつ命令対応の計画を可能にする。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:33:11 GMT)
LEL: A Novel Lipschitz Continuity-constrained Ensemble Learning Model for EEG-based Emotion Recognition [6.9] 脳波に基づく感情認識を強化する新しいフレームワークであるLEL(Lipschitz continuity-constrained Ensemble Learning)を導入する。
3つの公開ベンチマークデータセットの実験結果は、LELの最先端性能を実証した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 13:52:39 GMT)
Evaluating Contrast Localizer for Identifying Causal Units in Social & Mathematical Tasks in Language Models [6.8] この研究は、神経科学的コントラストローカライザを用いて、大きな言語モデル(LLM)と視覚言語モデル(VLM)における、心の理論(ToM)と数学的推論タスクの因果関係ユニットをピンポイントする。
コントラスト刺激セットを用いてトップアクティベート単位の局所化を行い,その因果的役割を目標アブレーションにより評価した。
ToMおよび数式ベンチマークを用いて, 機能的選択単位が低活性, ランダム選択単位が下流の精度に及ぼす影響を比較検討した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:46:19 GMT)
ProtoEHR: Hierarchical Prototype Learning for EHR-based Healthcare Predictions [6.6] ProtoEHRは、EHRデータのリッチでマルチレベルの構造を利用して、医療予測を強化する、解釈可能な階層型プロトタイプ学習フレームワークである。
まず,大規模言語モデルを用いて医療コード間の意味的関係を抽出し,医用知識グラフを知識源として構築する。
次に,3段階にわたる文脈的表現をキャプチャする階層的表現学習フレームワークを設計し,各レベルにプロトタイプ情報を組み込んで,固有の類似性を捕捉し,一般化を改善する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:42:22 GMT)
Error analysis for the deep Kolmogorov method [6.6] 熱PDEの深部コルモゴロフ法に対する誤差解析を行う。
具体的には、熱PDEの正確な解と近似深部ニューラルネットワーク(DNN)の実現関数との全体平均2乗距離の収束率による収束を明らかにする。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 23:49:01 GMT)
What Matters in Data for DPO? [6.2] DPO(Direct Preference Optimization)は、大規模言語モデルを人間の好みに合わせるためのシンプルで効果的なアプローチとして登場した。
本研究では,DPOの嗜好データ分布が理論的・経験的両面からどう影響するかを体系的に検討する。
選択された応答の質がDPOの目的を最適化する上で重要な役割を担っているのに対し、拒否された応答の質は比較的限定的な影響を持つ可能性があることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:00:30 GMT)
Automatic Speech Recognition of African American English: Lexical and Contextual Effects [6.2] 本研究では,CCR(Consonant Cluster Reduction)とING-reuction(ING-reuction)の2つの重要な変数に着目した。
CCRとING-deuctionの存在がASRの誤認識を増加させるかどうかを調べる。
この分析により, LMを含まないASR系において, CCRとINGが単語誤り率(WER)に与える影響は小さいが有意であることが明らかとなった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:36:49 GMT)
An Efficient Dual-Line Decoder Network with Multi-Scale Convolutional Attention for Multi-organ Segmentation [5.7] 本稿では,効率的なデュアルラインデコーダセグメンテーションネットワーク(EDLDNet)を提案する。
提案手法は, モデルロバスト性向上のため, トレーニング時に構造的摂動を取り入れることを学ぶノイズデコーダを特徴とする。
両デコーダから複数スケールのセグメンテーションマスクを活用することにより,変異に基づく損失関数を用いてモデルの一般化を促進する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:34:27 GMT)
The Power of Framing: How News Headlines Guide Search Behavior [5.3] 被験者が質問文を入力し,特定の言語フレームで抽出した見出しの中から選択する制御実験を行った。
見出しフレーミングは追従クエリを著しく形作り、エピソードフレームはより具体的なクエリを生み出した。
これらの結果から,フレーミングに対する短時間の露光であっても,ユーザの情報探索行動の方向性を有意に変化させることが示唆された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:12:19 GMT)
PainFormer: a Vision Foundation Model for Automatic Pain Assessment [5.1] 痛みは人口のかなりの割合に影響を与える多様体条件である。
本研究では,マルチタスク学習原理に基づく視覚基盤モデルPainFormerを紹介する。
PainFormerは様々な入力モードから高品質な埋め込みを効果的に抽出する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:40:52 GMT)
GRADE: Generating multi-hop QA and fine-gRAined Difficulty matrix for RAG Evaluation [5.0] Retrieval-Augmented Generation (RAG) システムは知識集約型NLPタスクに広く採用されている。
現在の評価は、実世界のシナリオで必要とされる構造的な複雑さと多段階の推論を見落としていることが多い。
タスクの難易度を2次元でモデル化する新しい評価フレームワークであるtextscGRADEを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:26:41 GMT)
Generating Synthetic Contrast-Enhanced Chest CT Images from Non-Contrast Scans Using Slice-Consistent Brownian Bridge Diffusion Network [4.7] 非コントラストCTスキャンからコントラスト強調画像の合成のための最初のブリッジ拡散法を提案する。
従来のスライス法とは異なり,本フレームワークは高解像度2D方式で動作しながら,完全な3D解剖学的整合性を保っている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 05:02:16 GMT)
GRAID: Synthetic Data Generation with Geometric Constraints and Multi-Agentic Reflection for Harmful Content Detection [4.6] 我々は、データセット拡張のための新しいパイプラインであるGRAID(Geometric and Reflective AI-Driven Data Augmentation)を紹介する。
GRAID は (i) 制約付き LLM を用いた幾何学的制御例の生成と (ii) マルチエージェント反射過程による拡張の2段階からなる。
GRAIDを用いた有害テキスト分類データセットの強化により,下流ガードレールモデルの性能が大幅に向上することが実証された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:09:58 GMT)
Cyber Orbits of Large Scale Network Traffic [4.6] 複雑なネットワーク振舞いの物理的類似は、これらの新たに発見されたネットワーク現象を理解するのに役立つ。
時空距離'の $r(t)$ でソースを観測する確率は 1/r(t)2$ である。
この物理アナログを匿名ネットワークセンシンググラフチャレンジのデータで観測されたソース相関に応用すると、エレガントなサイバー軌道のアナログとなる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:21:29 GMT)
Degree of Staleness-Aware Data Updating in Federated Learning [4.5] 我々は,データの不安定度を定量化するために,DoS(Degree of Staleness)と呼ばれる新しいメトリクスを導入する。
クローズド形式で各クライアントに対して最適なローカルデータ更新戦略を導出し、サーバに対してほぼ最適な戦略を導出する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:31:39 GMT)
Mind the Gap: Time-of-Check to Time-of-Use Vulnerabilities in LLM-Enabled Agents [4.3] 大規模言語モデル(LLM)対応エージェントは、広範囲のアプリケーションで急速に出現している。
本研究は,LSM対応エージェントにおけるTOCTOU(time-of-use)脆弱性に関する最初の研究である。
我々は,このタイプの脆弱性を評価するために設計された,66の現実的なユーザタスクを備えたベンチマークTOCTOU-Benchを紹介する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:41:49 GMT)
A Decoupled LOB Representation Framework for Multilevel Manipulation Detection with Supervised Contrastive Learning [4.1] 金融市場は世界経済の安定に欠かせないが、貿易ベースの操作(TBM)はしばしばその公正性を損なう。
ケースケード付きLOB表現パイプラインと教師付きコントラスト学習を組み合わせた表現学習フレームワークを提案する。
我々のフレームワークは、Transformerベースのアーキテクチャにより、様々なモデルにおける検出性能を継続的に改善します。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:57:32 GMT)
Disentangling Polysemantic Neurons with a Null-Calibrated Polysemanticity Index and Causal Patch Interventions [4.0] ポリセマンティリティ指数(英: Polysemanticity Index、PSI)は、ニューロンのトップアクティベーションが意味的に異なるクラスタに分解されたときを定量化する、ヌルキャリブレーションの指標である。
Tiny-ImageNetの画像で評価された事前トレーニングされたResNet-50では、PSIは活性化セットをコヒーレントな名前のプロトタイプに分割したニューロンを特定する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:48:59 GMT)
How to craft a deep reinforcement learning policy for wind farm flow control [4.0] タービン間のウェイク効果は、風力発電所全体のエネルギー生産を著しく減少させる。
既存の機械学習アプローチは、準静的な風条件や小さな風力発電に限られている。
本研究は、ウェイクステアリングポリシーを開発するための、新しい深層強化学習手法を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 21:55:47 GMT)
HV Metric For Time-Domain Full Waveform Inversion [3.6] フルウェーブフォームインバージョン(Full-wave-form Inversion, FWI)は、地震や超音波のデータから高分解能材料パラメータを再構成する強力な手法である。
(L2) とワッサーシュタインの時間的目標 - 符号付き信号に自然に作用する輸送ベースの距離を必要とする。
本稿では, (L2) と Wasserstein の時間 I における目的の代替として, エルフサイクルのスキップを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:28:47 GMT)
Unveiling the Latent Directions of Reflection in Large Language Models [3.4] モデルアクティベーションにおける遅延方向レンズによる反射について検討する。
新しい反射誘導命令は体系的に識別でき、反射行動を直接強化または抑制することができる。
この研究は、大きな言語モデルにおける反射的推論の機械論的理解への道を開く。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:05:15 GMT)
Convolutional Neural Networks for Accurate Measurement of Train Speed [3.3] CNNベースのアプローチ、特にマルチブランチモデルでは、従来の手法に比べて精度と堅牢性が優れている。
これらの知見は、鉄道安全性と運転効率を高めるための深層学習技術の可能性を浮き彫りにした。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:35:58 GMT)
RF-PGS: Fully-structured Spatial Wireless Channel Representation with Planar Gaussian Splatting [3.3] 本稿では,スパースパス損失スペクトルのみから高忠実度電波伝搬路を再構成する新しいフレームワークRF-PGSを提案する。
従来の放射界法と比較して、RF-PGSは再構成精度を大幅に向上し、トレーニングコストを低減し、無線チャネルの効率的な表現を可能にする。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:33:21 GMT)
HoarePrompt: Structural Reasoning About Program Correctness in Natural Language [3.2] HoarePromptは、プログラム検証から自然言語アーティファクトへの基本的なアイデアを適応する、新しいアプローチである。
ループを管理するために,モデル検査に広く用いられているk-induction法の適応として,数発のk-inductionを提案する。
実験の結果,HoarePromptはZero-shot-CoTプロンプトを正当性分類に用いた場合と比較して,MCCを61%改善することがわかった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:26:21 GMT)
Frequency Response Identification of Low-Order Systems: Finite-Sample Analysis [3.2] 本稿では,低次システム学習のための周波数領域同定手法を提案する。
同定過程のサンプリング周波数の複雑さを上界に導出する。
サンプルの複雑さの詳細な分析と、その用語と依存関係の完全な解釈が提供される。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:53:26 GMT)
High-Throughput Low-Cost Segmentation of Brightfield Microscopy Live Cell Images [3.2] 本研究は,光電場顕微鏡で観察した無残な生細胞のセグメンテーションに焦点を当てた。
冷凍エンコーダの比較分析を取り入れた低コストCNNパイプラインを開発した。
このモデルは、多様な生きた細胞変異を特徴とする公開データセットで検証された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:36:18 GMT)
TriagerX: Dual Transformers for Bug Triaging Tasks with Content and Interaction Based Rankings [2.8] 事前訓練された言語モデル(PLM)は、バグトリアージタスクで使用できるトランスフォーマーベースのアーキテクチャである。
PLMは、統計機能に依存する従来の機械学習(ML)モデルよりも、トークンセマンティクスをキャプチャできる。
TriagerXはトークンのセマンティクスをより確実に評価するためにデュアルトランスフォーマーアーキテクチャを使用している。
SOTAベースラインを含む9つのトランスフォーマーベースのメソッドをすべて越え、Top-1とTop-3の推奨精度を10%以上向上させる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:10:42 GMT)
Transformer-based Models to Deal with Heterogeneous Environments in Human Activity Recognition [2.8] モバイルデバイス上でのヒューマンアクティビティ認識(HAR)は、デバイスの慣性測定ユニットから収集されたデータに基づいてトレーニングされたニューラルネットワークを使用して可能であることが実証されている。
これらのモデルでは、畳み込みニューラルネットワーク(CNN)、Long Short-Term Memory(LSTM)、Transformer(トランスフォーマー)、あるいはこれらを組み合わせて、最先端の結果とリアルタイムのパフォーマンスを実現している。
本稿では、機械学習アプリケーションにおけるデータ不均一性の問題と、それが広範に展開することを妨げる方法について述べる。
我々はHARTとMobileHART for Human Activity Recognition Transformerという2つのセンサワイドトランスアーキテクチャのコードを提案し,公開する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:07:17 GMT)
AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark [2.7] データクリーニングを自動的に生成するLLMベースのパイプラインであるAutoDCWorkflowを提案する。
パイプラインは生のテーブルとデータ分析の目的を持ち、OpenRefine操作のシーケンスを生成して、最小限のクリーンなテーブルを生成する。
6つの操作は、フォーマットの不整合、型エラー、重複など、一般的なデータ品質の問題に対応する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 21:01:08 GMT)
EduRABSA: An Education Review Dataset for Aspect-based Sentiment Analysis Tasks [2.6] ABSAの教育評価データセットであるEduRABSA(Education Review ABSA)について紹介する。
英語の3つのレビュー科目(コース、教員、大学)をカバーしている。
また、オフラインで、軽量で、インストール不要な手動データアノテーションツールであるASQE-DPT(Data Processing Tool)も共有しています。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:38:40 GMT)
Beyond Play and Pause: Turning GPT-4o Spatial Weakness into a Strength for In-Depth Interactive Video Learning [2.6] Untwistは、インタラクティブなビデオ学習を可能にするAI駆動システムである。
ビデオ全体や特定の地域について、バウンディングボックスを使って質問することができる。
Untwistは、理解を深めるためにビデオコンテンツを抽出し、プロセスし、構造化する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 23:08:04 GMT)
REGEN: Real-Time Photorealism Enhancement in Games via a Dual-Stage Generative Network Framework [2.5] 生成的対角ネットワークを用いたレンダリングゲームフレームの光現実性向上のための新しいアプローチを提案する。
デュアルステージgEnerative Network framework(REGEN)によるゲームにおけるリアルタイム光リアリズムの強化を提案する。
提案手法は,頑健なIm2Im法に匹敵する視覚的結果が得られることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:28:05 GMT)
CARLA2Real: a tool for reducing the sim2real appearance gap in CARLA simulator [2.5] 我々は、シミュレーションデータのフォトリアリズムを高めるために最先端のアプローチを採用し、それらを実世界のデータセットの視覚的特徴と整合させる。
そこで我々はCARLA2Realを開発した。CARLA2Realは、広く使われているオープンソースのCARLAシミュレーターである。
このツールは、CARLAをほぼリアルタイムで出力し、13FPSのフレームレートを実現し、実世界のデータセットの視覚的スタイルとリアリズムに変換する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:50:12 GMT)
Polarization-dependent chiral transport and chiral solitons in spin Kitaev models [2.4] 我々は、スピン・キタエフモデルと呼ばれる新しい量子スピンモデルのクラスを構築するためのプロトコルを提案する。
結果として生じるフリップフリップとフロップフロップの項は、興味深い量子輸送力学をもたらす。
我々の結果は、曲線空間での輸送と、スピントロニクス、情報処理、量子センシングへの応用の新しい機会を開く。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:51:13 GMT)
Integrative Experiments Identify How Punishment Impacts Welfare in Public Goods Games [2.4] 本研究では,大規模統合実験を通じて,共同作業環境における罰の効果について検討した。
我々は,新しい実験における罰則の予測において,人間の予測よりも優れるモデルを開発した。
我々の結果は、それが機能し、機能しない特定の条件に「機能する」か否かの罰に関する議論を再燃させます。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:07:27 GMT)
Prototype-Guided Diffusion: Visual Conditioning without External Memory [2.1] プロトタイプ拡散モデルでは、外部メモリなしで効率的な視覚条件付けを行うために、プロトタイプ学習を直接拡散プロセスに統合する。
PDMは、計算とストレージのオーバーヘッドを低減しつつ、高速な品質を維持し、拡散モデルにおける検索ベースの条件付けに代わるスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:05:33 GMT)
Do Multimodal LLMs See Sentiment? [2.0] MLLM(Multimodal Large Language Models)の感情推論能力を検討するために,MLLMsentという独自のフレームワークを提案する。
最近確立されたベンチマークの実験は、我々の提案が、最先端の結果を達成することを実証している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:11:46 GMT)
PowerChain: Automating Distribution Grid Analysis with Agentic AI Workflows [2.0] 多くの小規模ユーティリティーや協同組合は研究開発の労働力に欠けており、そのため大規模に高度な分析を利用できない。
我々は,自動エージェントオーケストレーションと大規模言語モデル(LLM)関数呼び出しによる未知のDG解析タスクを解決するために,新しいエージェントAIシステムPowerChainを開発した。
GPT-5およびオープンソースのQwenモデルを用いて,実効用データで動作する複雑なDG解析タスク上で,PowerChainがエキスパートレベルを生成可能であることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:24:46 GMT)
CP4SBI: Local Conformal Calibration of Credible Sets in Simulation-Based Inference [1.9] 本研究では,局所ベイズカバレッジを持つ信頼可能な集合を構成するモデルに依存しない共形キャリブレーションフレームワークを開発する。
我々の提案した2つの変種、すなわち回帰木による局所校正とCDFに基づく校正により、任意のスコアリング関数に対して有限サンプルの局所カバレッジを保証する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:13:10 GMT)
KL-Regularised Q-Learning: A Token-level Action-Value perspective on Online RLHF [1.9] 我々は、LM-RLHF設定のための新しいアクション値RL法、KL正規化Q-Learning(KLQ)を開発した。
本手法は, 動機が全く異なるにもかかわらず, 特定の意味でのPPOと等価であることを示す。
我々は、KLQがLM-RLHF目標の最適化においてPPOと対決し、LLM-as-a-judge評価においてPPOに対して一貫した勝利率を達成することを示した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:50:54 GMT)
When Developer Aid Becomes Security Debt: A Systematic Analysis of Insecure Behaviors in LLM Coding Agents [1.8] LLMベースのコーディングエージェントは、急速にソフトウェア開発にデプロイされているが、その安全性への影響はよく分かっていない。
我々は,5つの最先端モデルにわたる12,000以上のアクションを解析し,自律型符号化エージェントの最初の系統的安全性評価を行った。
我々は,4つの主要な脆弱性を識別する高精度検出システムを開発した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:49:50 GMT)
Understanding Learning Dynamics Through Structured Representations [1.7] 本稿では,内部構造的選択が学習システムの振舞いをいかに形作るかを検討する。
これらの構造が勾配流、スペクトル感度、固定点挙動にどのように影響するかを分析する。
固定テンプレートを規定するのではなく、解釈可能な方法で学習行動を操ることのできるトラクタブルデザインの原則を強調します。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:57:32 GMT)
One-step learning algorithm selection for classification via convolutional neural networks [1.7] 畳み込みニューラルネットワークをバイナリ分類のためのデータセットで直接訓練する一段階のスキームが提案されている。
目的は、メタ機能を明確に識別することなく、データの基盤構造を学習することである。
シミュレーションデータセットを用いた実験により, 提案手法は線形パターンと非線形パターンの両方を同定する上で, ほぼ完璧な性能が得られることが示された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 13:16:54 GMT)
CTRL-F: Pairing Convolution with Transformer for Image Classification via Multi-Level Feature Cross-Attention and Representation Learning Fusion [1.4] コンボリューションとトランスフォーマーを組み合わせた,軽量なハイブリッドネットワークを提案する。
畳み込み経路から取得した局所応答とMFCAモジュールから取得したグローバル応答とを融合する。
実験により、我々の変種は、大規模データや低データレギュレーションでスクラッチからトレーニングしたとしても、最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:26:09 GMT)
Quantum Speed Limits For Open System Dynamics Based On Representation Basis Dependent $\boldsymbol{\ell^{p}_{w}}$-Seminorm [1.4] 我々は、初期状態と最終状態の間の進化時間を低くする量子速度制限(QSL)のファミリーを報告する。
これらは有限次元ヒルベルト空間における開、閉、時間に依存しない、あるいは時間に依存しないシステムに適用できる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:05:39 GMT)
Tiny-BioMoE: a Lightweight Embedding Model for Biosignal Analysis [1.2] 痛みは複雑で広まりやすい状態であり、人口のかなりの部分に影響を与える。
この研究は、第2回マルチモーダル・センシング・グランドチャレンジ(AI4PAIN)に提出された。
提案手法では,生体信号解析のための軽量な事前学習型埋め込みモデルであるTiny-BioMoEを導入する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:40:23 GMT)
Multi-Representation Diagrams for Pain Recognition: Integrating Various Electrodermal Activity Signals into a Single Image [1.2] この研究は、第2回マルチモーダル・センシング・グランドチャレンジ(AI4PAIN)に提出された。
提案手法では, 入力モードとして電磁気活性信号を利用するパイプラインを提案する。
従来の融合法と同等で、いくつかの場合において優れた結果が得られる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:41:41 GMT)
Efficient Pain Recognition via Respiration Signals: A Single Cross-Attention Transformer Multi-Window Fusion Pipeline [1.2] この研究は、第2回マルチモーダル・センシング・グランドチャレンジ(AI4PAIN)に提出された。
提案手法では,呼吸を入力信号とし,高効率なクロスアテンション変換器とマルチウィンドウ戦略を統合するパイプラインを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:42:46 GMT)
Dynamically Preparing Robust Bell States in Su-Schrieffer-Heeger Systems [0.9] 本稿では,時間境界工学と運動量空間の射影測定を用いてベル状態を作成するための枠組みを提案する。
その結果,ベル状態は環境デコヒーレンスとパラメトリック時間変動の両方に対して顕著な堅牢性を示した。
この時間境界エンジニアリングフレームワークは、フェルミオンとボソニックの励起の両方に適用でき、量子通信や量子計算においてベル状態を生成するための堅牢なパラダイムを提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:41:36 GMT)
Efficient utilization of imaginarity in quantum steering [0.9] 量子ステアリング現象による量子情報処理における複素数の役割について述べる。
両部量子ビット系の操舵基準を定式化し、信頼できない側で2つの二コトミック測定と信頼できない側で2つの相互に不偏な基底を求める。
提案した虚偽のステアリング不等式によって具現化された量子相関は、適切に構築されたエルミート作用素によって確認可能であることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:44:07 GMT)
DiffS-NOCS: 3D Point Cloud Reconstruction through Coloring Sketches to NOCS Maps Using Diffusion Models [0.9] 既存の手法は、しばしば3D空間で直接動作するが、2Dスケッチから正確な3D構造を再構築する際のドメインのばらつきと困難さは重要な障害である。
本研究では,DiffS-NOCS(Diffusion-based Sketch-to-NOCS Map)を提案する。
ShapeNetの実験では、DiffS-NOCSコントロール可能できめ細かい点のクラウド再構成がスケッチに一致していることが示されている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:15:43 GMT)
Tunable Superconducting Quantum Interference Device Coupler for Fluxonium Qubits [0.9] チューナブルカプラは、高いオン/オフ結合比と1つの設計でクロストークを低減した高忠実な2ビットゲートを実現する。
2ビットゲートを実装するための2つのスキームを提案し、$sqrtitextSWAP$-like gate with $99.9%$ open-system fidelity in 6 nanosecondsを予測した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 05:42:59 GMT)
Toward Knowledge-Guided AI for Inverse Design in Manufacturing: A Perspective on Domain, Physics, and Human-AI Synergy [0.8] AIは製造における逆設計を再構築し、材料、製品、プロセスにおける高性能な発見を可能にしている。
しかし、純粋にデータ駆動のアプローチは、スパースデータ、高次元の設計空間、複雑な制約によって特徴づけられる現実的な製造環境に苦しむことが多い。
この視点は、3つの補完的な柱の上に構築された統合フレームワークを提案する: 物理的に意味のある目的と制約を確立するためのドメイン知識と、限定的または偏りのあるデータに基づく一般化を強化する物理インフォームド機械学習、直感的で人間中心のインタラクションをサポートするための大規模言語モデルベースのインターフェイス。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 04:47:22 GMT)
Robust Diagram Reasoning: A Framework for Enhancing LVLM Performance on Visually Perturbed Scientific Diagrams [0.8] LLM(Large Language Models)とLVLM(Large Language Models)は、科学と工学の応用を大いに約束する。
既存の評価ベンチマークはこの課題を概ね見落としており、LVLMの堅牢な推論能力は過小評価されている。
本稿では,ロバストダイアグラム推論(RDR)フレームワークについて紹介する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 09:50:58 GMT)
CE-RS-SBCIT A Novel Channel Enhanced Hybrid CNN Transformer with Residual, Spatial, and Boundary-Aware Learning for Brain Tumor MRI Analysis [0.8] このフレームワークは4つのコアイノベーションを通じて、局所的な細粒度とグローバルなコンテキストのキューを利用する。
このフレームワークは98.30%の精度、98.08%の感度、98.25%のF1スコア、98.43%の精度を実現している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:09:39 GMT)
Anemoi: A Semi-Centralized Multi-agent Systems Based on Agent-to-Agent Communication MCP server from Coral Protocol [0.7] Anemoi は、Coral Protocol の Agent-to-Agent (A2A) 通信 MCP サーバ上に構築された、半集中型の MAS である。
従来のデザインとは異なり、Anemoiは構造的かつ直接的なエージェント間コラボレーションを可能にし、すべてのエージェントが進捗を監視し、結果を評価し、ボトルネックを特定し、リアルタイムに改善を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:45:10 GMT)
Towards Principled Analysis and Mitigation of Space Cyber Risks [0.7] 宇宙インフラは現代の社会の基盤となっているが、それらのリスクはほとんど理解されていない。
本研究では、宇宙インフラや宇宙サイバー攻撃に対する現実のサイバー攻撃を特徴付ける革新的な枠組みを紹介する。
テストベッドによる検証により,宇宙のサイバーリスクを分析し,軽減することによるフレームワークの有用性を実証する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:14:13 GMT)
Beyond Blur: A Fluid Perspective on Generative Diffusion Models [0.7] 本稿では, 対流拡散過程に基づく生成画像合成のための新しいPDE駆動の汚職過程を提案する。
この研究は、流体力学、次元のないPDE理論、深層生成モデリングを橋渡しし、物理的に情報を得た画像の破損過程について新たな視点を提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:37:03 GMT)
FuSeFL: Fully Secure and Scalable Cross-Silo Federated Learning [0.7] フェデレートラーニング(FL)は、クライアントデータを集中化せずに協調的なモデルトレーニングを可能にするため、プライバシに敏感なドメインには魅力的である。
クロスサイロ設定用に設計された完全セキュアでスケーラブルなFLスキームであるFuSeFLを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:34:03 GMT)
Fiducial Marker Splatting for High-Fidelity Robotics Simulations [0.7] 高忠実度3Dシミュレーションは移動ロボットの訓練に不可欠である。
ガウススプラッティング(GS)のような最近のニューラルレンダリング手法は目覚ましい視覚的リアリズムを実現するが、フィデューシャルマーカーを組み込む柔軟性は欠如している。
本稿では,GSのフォトリアリズムと構造化マーカー表現を組み合わせたハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:53:51 GMT)
Studying the effect of the phonon coherence and inflow on the formation of hydrogen bonds in the $[(\rm{H}_2\rm{O})_2]^m$ cluster [0.7] 単純な$rmHrmO$関連水素結合モデルを提案する。
このモデルでは、粒子のマクロ振動とマイクロ振動を記述するために異なる種類のフォノンが導入された。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:04:37 GMT)
Tri-Accel: Curvature-Aware Precision-Adaptive and Memory-Elastic Optimization for Efficient GPU Usage [0.7] Tri-Accelは3つのアクセラレーション戦略と、トレーニング中の適応パラメータを併用する統合最適化フレームワークである。
ResNet-18とEfficientNet-B0を搭載したCIFAR-10では、Tri-Accelはトレーニング時間の最大9.9%削減とメモリ使用量の13.3%削減を実現している。
静的混合精度トレーニングと比較して、Tri-Accelは78.1%の精度を維持し、標準ハードウェアのメモリフットプリントを0.35GBから0.31GBに削減している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 05:38:42 GMT)
Rethinking How AI Embeds and Adapts to Human Values: Challenges and Opportunities [0.6] AIシステムは長期的な推論を実装し、進化する価値に適応し続けなければならない、と私たちは主張する。
価値アライメントは、人間の価値の完全なスペクトルに対処するためにより多くの理論を必要とする。
我々は、価値アライメントに関連する課題を特定し、価値アライメント研究を進めるための方向性を示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 18:19:05 GMT)
Neural Stochastic Differential Equations on Compact State-Spaces [0.6] 現代の確率モデルの多くはSDEに依存しているが、それらの採用は不安定性、有界領域外における誘導バイアスの低さ、制限的ダイナミクスやトレーニングのトリックに依存しているため妨げられている。
本稿では,連続力学,高次解法,帰納バイアスを有するコンパクト多面体空間上のニューラルSDEの新しいクラスを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:05:42 GMT)
Token Homogenization under Positional Bias [0.6] トークンは,特に極端位置に偏りがある場合,処理中に顕著さを系統的に失うことを示す。
本研究は,同種化の存在と位置注意機構への依存を裏付けるものである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:59:05 GMT)
Using LLM for Real-Time Transcription and Summarization of Doctor-Patient Interactions into ePuskesmas in Indonesia: A Proof-of-Concept Study [0.6] 本稿では,大規模言語モデル(LLM)を用いて,インドネシアにおける医師と患者との会話のリアルタイムの書き起こしと要約を自動化する概念実証フレームワークを提案する。
本システムは,ePuskesmasフォームを自動生成するブラウザエクステンションとして実装された医用要約用GPT-3.5とWhisperモデルを組み合わせた。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 04:47:47 GMT)
Computational Intelligence based Land-use Allocation Approaches for Mixed Use Areas [0.4] 都市の土地利用配分は、持続可能な都市開発政策に不可欠な複雑な多目的最適化問題である。
本稿では,混合利用地域における土地利用配分最適化のための新しい計算知能手法を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:02:49 GMT)
Towards Production-Worthy Simulation for Autonomous Cyber Operations [0.4] 我々は、Patch、Isolate、Unisolateという3つの新しいアクションを実装することで、CybORGのCage Challenge 2環境を拡張します。
そこで我々は,報酬信号とエージェントの特徴空間を改良し,訓練性能を向上させるエージェント開発の設計を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:29:25 GMT)
M3DMap: Object-aware Multimodal 3D Mapping for Dynamic Environments [0.3] 画像、点雲、テキストなどのマルチモーダルデータを含む動的3Dシーンの普遍的な表現は存在しない。
本稿では,同時代のアプローチを分類したマルチモーダル3Dマップ構築手法の分類法を提案する。
また、静的シーンと動的シーンの両方のためのマルチモーダル3Dマップをオブジェクト認識で構築するために設計された、M3DMapと呼ばれるオリジナルのモジュラー手法についても記述している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:45:48 GMT)
Task-Aware Tuning of Time Constants in Spiking Neural Networks for Multimodal Classification [0.3] スパイキングニューラルネットワーク(SNN)は、ウェアラブルセンシングや時系列分析といった分野において、低消費電力エッジコンピューティングの候補として期待されている。
重要なニューロンパラメータである漏れ時間定数(LTC)は、Leaky Integrateand-Fireニューロンにおける情報の時間的統合を制御している。
本研究では,静的画像,動的画像,生体信号時系列分類に応用した時間適応フィードフォワードSNNにおけるLCCの役割について検討した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:18:39 GMT)
Reinforcement-Guided Hyper-Heuristic Hyperparameter Optimization for Fair and Explainable Spiking Neural Network-Based Financial Fraud Detection [0.3] 本稿では,スパイキングネットワークと人口符号化CSNPCを統合し,スパイキングシステムのための強化誘導ハイパーヒューリスティックモデルを提案する。
我々のモデルは、厳格な$5%の偽陽性率(FPR)で90.8%のリコールを達成し、最先端のスパイクモデルと非スパイキングモデルを上回っている。
これらの結果は,集団符号化されたSNNと強化誘導型ハイパーヒューリスティックを組み合わせて,公正かつ透明で高性能な不正検出を行う可能性を示している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:24:15 GMT)
SugarcaneShuffleNet: A Very Fast, Lightweight Convolutional Neural Network for Diagnosis of 15 Sugarcane Leaf Diseases [0.3] 低資源地域のサトウキビ農家は、葉の病気に弱いままである。
多くのディープラーニングモデルは、現実世界の条件下での一般化に失敗する。
本研究は,サトウキビ葉病分類のための培養データセットであるSugarcaneLD-BDについて述べる。
SugarcaneShuffleNetはデバイス上での迅速な診断に最適化された軽量モデルである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 18:39:25 GMT)
LLM-D12: A Dual-Dimensional Scale of Instrumental and Relational Dependencies on Large Language Models [0.2] 人々が大規模言語モデル(LLM)とどのように相互作用するかを理解することへの関心が高まっている。
LLM-D12(LLM-D12)とよばれるLCM依存度を測定する新しい12項目アンケートを開発し,その妥当性を検証した。
このスケールは、著者の以前の理論的研究に基づいており、それに応じてアイテムが開発され、イギリスで526人の参加者から回答が集められた。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:43:33 GMT)
Reasoning with RAGged events: RAG-Enhanced Event Knowledge Base Construction and reasoning with proof-assistants [0.2] 本稿では,複数のLPMを用いた過去のイベントの自動抽出モデルを提案する。
我々はトゥキディデスの史料を用いて評価を行う。
抽出されたRDF表現をCoq証明アシスタント仕様に変換する自動翻訳パイプラインを開発した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:08:02 GMT)
A Straightforward Pipeline for Targeted Entailment and Contradiction Detection [0.2] 主要な課題は、どの文が特定のクレームの前提または矛盾として機能するかを特定することである。
対象分析のための両手法の強みを組み合わせた手法を提案する。
本手法は,NLIが同定した関係を注目度スコアとフィルタリングすることにより,テキスト中の任意のクレームに対する最も重要なセマンティックな関係を効率的に抽出する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:59:24 GMT)
Fourier-Guided Attention Upsampling for Image Super-Resolution [0.1] 周波数誘導アテンション(英: Frequency-Guided Attention, FGA)は、単一画像の超解像のための軽量アップサンプリングモジュールである。
試験の結果、PSNRの平均利得は0.120.14dB、周波数領域の整合性は最大29%向上した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:41:59 GMT)
PD-Loss: Proxy-Decidability for Efficient Metric Learning [0.0] 本稿では, 学習可能なプロキシとd'の統計フレームワークを統合し, 埋め込み空間を効率的に最適化する新しい目的である Proxy-Decidability Loss (PD-Loss) を紹介する。
PD-Lossは、組込み最適化の新しい視点を導入しながら、最先端のメソッドに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:46:00 GMT)
Laser Mössbauer spectroscopy of ^{229}Th [0.0] M"オスバウアー分光法は生化学、地質学、固体物理学で広く用いられている。
我々は、この技術を真空紫外レーザーを用いて、トリウム229の低エネルギー核遷移をプローブする光学範囲に拡張する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:22:06 GMT)
What Developers Ask to ChatGPT in GitHub Pull Requests? an Exploratory Study [0.0] ChatGPTのような大規模言語モデル(LLM)は、プロ文法タスクの解決において、ソフトウェア開発者を支援するための新しいツールセットを導入した。
この制限を探索するため,139個のPull Requestsから抽出した155個のChatGPTリンクを手動で評価した。
その結果,14種類のChatGPT要求を4つのグループに分類したカタログが得られた。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 23:24:47 GMT)
WebSight: A Vision-First Architecture for Robust Web Agents [0.0] WebSightは視覚的知覚によって純粋にWeb環境と対話するように設計された視覚ベースのWebエージェントである。
UI要素のインタラクションに最適化された視覚言語モデルであるWebSight-7Bを紹介する。
WebSight-7BはShowdown Clicksベンチマークで58.84%のトップ1の精度を達成し、より大規模なジェネラリストモデルを上回った。
WebSightとWebSight-7Bは、解釈可能で堅牢で効率的なビジュアルWebナビゲーションのための新しい標準を確立する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:02:59 GMT)
Unitary network: Tensor network unitaries with local unitarity [0.0] テンソルネットワークユニタリのための指向アーキテクチャであるユニタリネットワークを導入する。
一元ネットワークのクラスは、指数的に抑制されたテールまで局所性を保持するグローバルなユニタリを含むことを示す。
また、単一ネットワークにおける情報フローは、量子セルオートマトンに対する既知の指標と一致するフローインデックスによって特徴付けられることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:35:29 GMT)
Three-qubit W state tomography via full and marginal state reconstructions on ibm_osaka [0.0] 我々は17個の測定設定を必要とする3量子量子状態トモグラフィー方式を提案する。
我々は3ビットW状態の再構成にトモグラフィー方式を用いる。
2ビットのサブシステムから再構成されたW状態の忠実度は、完全な3ビットトモグラフィから得られたものよりも一貫して大きいことを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:06:57 GMT)
Thermal nature of the causal diamond horizon: A hidden property of the inertial propagator [0.0] 我々はミンコフスキー時空における慣性ファインマンプロパゲータの隠れ熱特性を明らかにする方法を開発した。
因果的地平線を横切る未来指向の伝播は一貫して解釈できる。
放射と吸収の比は熱アンサンブルのボルツマン因子を再現することがわかった。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:45:16 GMT)
The compressible Neural Particle Method for Simulating Compressible Viscous Fluid Flows [0.0] 粒子法は計算流体力学において重要な役割を担っているが、これらは実装し解くのが最も困難である。
最も一般的な方法はスムーズな粒子流体力学であり、津波やダム破壊のような大きな変形を含む問題設定に適している。
ニューラルネットワークを用いて空間領域の速度と圧力を近似した圧縮可能なニューラル粒子法を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:24:19 GMT)
Symmetric channel verification for purifying noisy quantum channels [0.0] 本稿では、量子チャネルに固有の対称性を利用するチャネル浄化プロトコルである対称チャネル検証(SCV)を提案する。
SCVは量子チャネルの対称性破壊ノイズを検出し、補正することができる。
本プロトコルはハミルトニアンシミュレーション回路および位相推定回路に適用される。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:10:30 GMT)
Structural Damage Detection Using AI Super Resolution and Visual Language Model [0.0] 本研究では,空飛ぶドローン映像,高度なAIベースビデオ超解像モデル,ビデオ再生変換器(VRT),および27億パラメータビジュアル言語モデル(VLM)であるGemma3:27bを活用する,費用対効果の高い新しいフレームワークを提案する。
この統合システムは、低解像度の災害映像を改善し、構造的損傷を特定し、建物を4つの損傷カテゴリーに分類するように設計されている。
このフレームワークは84.5%の精度を達成し、非常に正確な結果を提供する能力を示した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:12:06 GMT)
Reciprocity Theorem and Fundamental Transfer Matrix [0.0] 定常ポテンシャル散乱は、非エルミート有効ハミルトニアンによって生成される量子力学の用語で定式化される。
この定式化を用いて、2次元と3次元の相互性定理の証明を与える。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:10:11 GMT)
Real-Time RAG for the Identification of Supply Chain Vulnerabilities [0.0] 本研究は, 新規な検索前処理と検索技術を統合することで, サプライチェーン解析への革新的アプローチを提案する。
本手法は,新たな情報を拡張LLMに組み込む際の遅延を低減することを目的として,サプライチェーンディスラプタのタイムリーな解析を可能にする。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:06:19 GMT)
Quantum State Fidelity for Functional Neural Network Construction [0.0] 我々は関数型ネットワークを構築するためにハイブリッド量子アルゴリズムを実装した。
我々の結果は、量子コンピューティングが神経科学におけるデータ駆動モデリングの選択肢として、可能で潜在的に有利な選択肢を提供することを示唆している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 04:26:53 GMT)
Quantifying Out-of-Training Uncertainty of Neural-Network based Turbulence Closures [0.0] NNベースの乱流閉鎖は、従来の乱流閉鎖のための訓練済みサロゲートとして使用されるように開発されている。
これらのMLベースのクロージャの普及のボトルネックは、これらのモデルに対する相対的な不確実性(UQ)の欠如である。
本稿では,3つのNN法とガウス過程(GP)によるてんかんUQの質を比較した。
正確なGPは、Root Mean Squared Error(RMSE)が2.14 cdot 10-5$で、Dが4.59 cdot 10-4で最高の精度を発揮する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 03:43:40 GMT)
QFrCoLA: a Quebec-French Corpus of Linguistic Acceptability Judgments [0.0] 本稿では,25,153個のドメイン内文と2,675個のドメイン外文からなる規範的二項受容可能性判定データセットであるQFrCoLAを紹介する。
我々は、QFrCoLAと他の7つの言語的二項受容可能性判定コーパスを用いて、7つの言語モデルをベンチマークする。
平均的に、微調整トランスフォーマーベースのLMは、ほとんどの言語において強力なベースラインであり、ゼロショットバイナリ分類の大言語モデルは、そのタスクでは不十分である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 01:51:45 GMT)
Pseudo-Hermiticity, Anti-Pseudo-Hermiticity, and Generalized Parity-Time-Reversal Symmetry at Exceptional Points [0.0] ブロック対角作用素に対する擬ハーミティティーの同値性を証明し、一般化された$PT$対称性を証明した。
2次元と無限次元のヒルベルト空間でそれぞれ作用する擬エルミート作用素のペアに対して、 antlinear operator $tau$ と $X$ の明示的な式を得る。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:14:04 GMT)
Post-Quantum Blockchain: Challenges and Opportunities [0.0] PQC(Post-Quantum Computation)は、これらの量子攻撃に対する基本的な解決策である。
本稿では、量子コンピュータが古典的ブロックチェーン技術に課す脅威を概観することを目的とする。
ブロックチェーン研究者には、PQBセキュリティに関する有用なガイドラインを提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:53:49 GMT)
PlantVillageVQA: A Visual Question Answering Dataset for Benchmarking Vision-Language Models in Plant Science [0.0] PlantVillageVQAデータセットは、55,448枚以上の画像に基づいて、高品質なQA(QA)ペア193,609枚で構成されている。
データセットは、科学的正確性と関連性に関して、ドメインの専門家によって反復的にレビューされた。
本研究の目的は,植物病の診断精度を高めるために,公開され,標準化され,専門家が検証したデータベースを提供することである。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:04:57 GMT)
Particle creation from entanglement entropy [0.0] 本研究では、エントロピーと放射される粒子スペクトルとの明確な関係を導出し、エントロピーの絡み合いが粒子生成をいかに促すかを検討する。
主に低エントロピー限界に焦点をあてるとともに、調和周期から生じる顕著な粒子生成の事例についても検討する。
その結果,情報フローと物質生成の明示的な連携が確立され,「ビットから」の具体的な実演が提供される。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 15:43:36 GMT)
Operator: A Protocol for Trustless Verification Under Uncertainty [0.0] 検証ゲームにおいて,コラテラライズされたクレームによる正当性を強制するプロトコルを提案する。
タスクは意図として公開され、解決者はそれらを満たすために競います。
どんな挑戦者でも、検証プロセスのトリガーとして挑戦することで結果に挑戦することができる。
不正なエージェントがスラッシュされ、正しい反対が報われ、誤検証自体を罰するエスカレーションパスが設けられる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:54:26 GMT)
Open quantum systems and the grand canonical ensemble [0.0] 祝福されたリンドブラッド方程式は、量子系における密度作用素の非単位時間進化を支配している。
リンドブラッド方程式の導出に伴う大標準統計力学の整合性について検討する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:51:59 GMT)
Negative Spin $Δ_T$ noise Induced by Spin-Flip Scattering and Andreev Reflection [0.0] 超伝導接合部における電荷$Delta_T$ノイズとスピン$Delta_T$ノイズについて検討する。
$Delta_T$ノイズは厳密に正であり、スピン$Delta_T$ノイズは正から負に逆転する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:54:42 GMT)
NMR Protocol for Black-Box Ergotropy Estimation via Feedback Algorithm [0.0] エルゴトロピーを推定するためのフィードバックベースアルゴリズム(FQErgo)を提案し,実験的に実証する。
FQErgoは、特定の期待値によって強度が反復的に調整されたドライブフィールドを適用し、単一のプローブキュービットを使用して都合よく読み取る。
ランダムな初期状態におけるFQErgoの数値解析により、受動的状態の生成とエルゴトロピーの推定に成功したことを確認する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 07:45:11 GMT)
MoE-Beyond: Learning-Based Expert Activation Prediction on Edge Devices [0.0] 自己回帰復号中に専門家のアクティベーションを予測するための学習ベースエキスパートアクティベーション予測器であるMoE-Beyondを紹介する。
我々の予測器は、WebGLM-QAデータセットからの見えないプロンプトを効果的に一般化し、97.5%の精度と86.6%のF1スコアを達成した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:28:32 GMT)
Mantis: A Simulation-Grounded Foundation Model for Disease Forecasting [0.0] マンティス(Mantis)は、メカニカルシミュレーションで完全に訓練された基礎モデルである。
マンティスは4億日以上のシミュレートされた流行のダイナミクスに基づいて構築されている。
機械的に解釈可能であり、公衆衛生意思決定者は予測の背後にある潜伏したドライバーを特定できる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 06:57:55 GMT)
Magnetic noise in macroscopic quantum spatial superposition [0.0] 磁場のランダムなゆらぎが、物質波干渉計の経路をランダムに揺らぎ、量子重ね合わせをデコヒートすることを示す。
このような物質波干渉計は、物理学における多くの新しい基礎的な進歩の基盤となっている。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:16:49 GMT)
Leveraging GNN to Enhance MEF Method in Predicting ENSO [0.0] アンサンブルの80人全員の類似性を直接モデル化するために,グラフ解析を用いたより良いフレームワークを提案する。
コミュニティ検出手法を用いて20名のメンバを最適化したサブセットを得る。
この方法は、ノイズ除去とアンサンブルコヒーレンスに重点を置くことにより予測スキルを向上させる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 12:25:24 GMT)
Learning Spatio-Temporal Dynamics via Operator-Valued RKHS and Kernel Koopman Methods [0.0] 演算子値化されたカーネル空間(OV-RKHS)とカーネルベースのクープマン演算子法を組み合わせることにより、値ベクトル関数の進化パラメトリックダイナミクスを学習するための統一的なフレームワークを導入する。
このアプローチは、空間構造と時間構造の両方を保持しながら、複雑な時間ベクトル場のデータ駆動推定を可能にする。
我々は時間依存型OV-RKHSの表現定理を確立し、滑らかなベクトル境界に対するソボレフ型近似を導出し、カーネル・クープマン作用素近似に対するスペクトル収束保証を提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 04:28:12 GMT)
Learning ON Large Datasets Using Bit-String Trees [0.0] この論文は類似性保存ハッシュ、分類、がんゲノム学の計算方法を発展させている。
Inverted hash table (ComBI) の圧縮BSTを導入する。
GRAFとComBIは,がん患者の生存率のスケーラブルな予測を可能にするサンプル単位の分類可能性の推定に有効であることを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:49:42 GMT)
Learned Structure in CARTRIDGES: Keys as Shareable Routers in Self-Studied Representations [0.0] 長文LLM推論のボトルネックは、線形に増大するKVキャッシュである。
最近の研究で提案されているCARTRIDGESは、オフライン計算を利用して、フルドキュメントで通常必要とされるよりもはるかに小さなKVキャッシュをトレーニングするアプローチである。
学習したCARTRIDGE鍵値キャッシュ構造の最初の機械的探索を示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:20:06 GMT)
Lattice Quantum Geometry Controlling 118 K Multigap Superconductivity in Heavily Overdoped CuBa2Ca3Cu4O10+d [0.0] 超伝導体であるCuBa2Ca3Cu4O10+d(Cu1234)は、高い臨界温度(Tc118K)、高い臨界電流密度と大きな上部臨界磁場を示す。
温度依存性の格子パラメータは、TCのc軸の低下と、TCの下の面Cu-Oの負の熱膨張を特徴とする特異な構造遷移を示す。
温度, c/a軸比, および表面Cu-Oひずみの相図を作成し, 開裂領域と酸素再配置領域を同定した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:53:02 GMT)
LSM and CPT [0.0] 空間と逆時間を同時に反映する反単位対称性を持つ1+1d格子モデルについて検討する。
これらの対称性のいくつかは異常であり、リーブ=シュルツ=マティス型制約に繋がる。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:04:40 GMT)
JUDGEBERT: Assessing Legal Meaning Preservation Between Sentences [0.0] 本稿では,2つの法的テキスト間での法的意味の保存を評価するための新しいデータセットFrJUDGEを紹介する。
JUDGEBERTは、フランスの法律文書の簡易化における法的意味の保存を評価するために考案された、新しい評価指標である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 02:03:16 GMT)
IGNIS: A Robust Neural Network Framework for Constrained Parameter Estimation in Archimedean Copulas [0.0] 我々は,アルキメデスコプラの統一的ニューラルネットワーク推定フレームワークIGNISを紹介する。
IGNISはデータ駆動依存度から根底にあるコプラパラメータテータへの直接的かつ堅牢なマッピングを学習する。
現実世界の財務および健康のデータセットの正確で安定した見積もりを提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 04:41:42 GMT)
From Small to Large: A Graph Convolutional Network Approach for Solving Assortment Optimization Problems [0.0] 混合多項ロジット選択モデルに基づく制約付きアソシエーション最適化
問題のグラフ表現を開発し、次にGCNを訓練して最適な選択肢のパターンを学習する。
本稿ではGCNの出力に基づく2つの推論ポリシーを提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 10:06:58 GMT)
F4-ITS: Fine-grained Feature Fusion for Food Image-Text Search [0.0] デジタル食品コンテンツは、きめ細かい視覚的理解と検索が可能な堅牢で正確なシステムの必要性を強めている。
F4-ITS: F4-ITS: Fine-fine Feature Fusion for Food Image-Text Search, a training-free, vision- language model (VLM)-guided framework。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:36:31 GMT)
Exploring AI-Enabled Test Practice, Affect, and Test Outcomes in Language Assessment [0.0] 生成AI駆動の自動アイテム生成(AIG)は、大規模なアイテムバンクの作成と複数のプラクティステストを拡張する。
本研究は,AIG対応の実践試験をハイテイク言語アセスメントに活用した最初の大規模研究である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 18:41:30 GMT)
Evaluating Federated Learning for At-Risk Student Prediction: A Comparative Analysis of Model Complexity and Data Balancing [0.0] 遠隔教育における高いドロップアウト率と失敗率は、学術機関にとって大きな課題である。
本研究は、イギリスの大学における学生のリスクを予測するために、初期の学術的パフォーマンスとデジタルエンゲージメントパターンに基づく機械学習モデルを開発し、評価する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 19:58:16 GMT)
Enhancing Knowledge Tracing through Leakage-Free and Recency-Aware Embeddings [0.0] 知識追跡(KT)は、学習コンテンツとのインタラクションのシーケンスに基づいて、学生の将来のパフォーマンスを予測することを目的としている。
いくつかのKTモデルはラベルの漏洩に対して脆弱であり、入力データが不注意に正しい答えを明らかにする。
本研究では,入力埋込み工法において,接地トラスラベルをマスキングすることで,ラベルの漏洩を防止する方法を提案する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:13:25 GMT)
Energy eigenvalues of quadratic, pure quartic and quartic anharmonic oscillators with variational method [0.0] エネルギー固有値は、変分法を適用することにより、二次(fracg2 x22$)、純粋クォート(lambda x4 $)、準調和振動子(fracg2 x222 + lambda x4 $)に対して計算される。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 20:24:58 GMT)
DevLicOps: A Framework for Mitigating Licensing Risks in AI-Generated Code [0.0] ジェネレーティブAIコーディングアシスタント(ACA)は広く採用されているが、重大な法的およびコンプライアンス上のリスクがある。
この記事では、ACA関連のライセンスリスクを管理するための実践的なフレームワークであるDevLicOpsを紹介します。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:51:29 GMT)
Complexity in finitary argumentation (extended version) [0.0] 本稿では,無限だが有限の議論フレームワークに関連する計算問題の複雑性について検討する。
多くの推論形式に対して、有限無限 AF は推論の自然な設定を提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 11:02:43 GMT)
CoPE: A Lightweight Complex Positional Encoding [0.0] コンテントと位置情報の両方をエンコードするために複素数値符号化を利用する新しいアーキテクチャであるCoPEを紹介する。
提案手法では,従来の位置エンコーディングを,実部が意味的コンテンツをキャプチャし,虚部が位置情報をエンコードする複雑な埋め込みに置き換える。
我々は,CoPEが長期劣化を示さず,線形注意と相容れないことを示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 08:02:07 GMT)
An MLP Baseline for Handwriting Recognition Using Planar Curvature and Gradient Orientation [0.0] 本研究では,手書き文字認識のための多層パーセプトロンを駆動するには,2次幾何学的手がかりだけで十分かどうかを検討する。
この3つの手作り特徴マップを入力として用い,MNIST桁で97%,EMNIST文字で99%の精度を実現した。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:22:01 GMT)
ARTPS: Depth-Enhanced Hybrid Anomaly Detection and Learnable Curiosity Score for Autonomous Rover Target Prioritization [0.0] ARTPS(Autonomous Rover Target Prioritization System)は、深度推定、異常検出、学習可能な好奇心スコアを組み合わせた新しいハイブリッドAIシステムである。
このシステムは、AUROCが0.94、AUPRCが0.89、F1スコアが0.87で、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 17:37:05 GMT)
A fluxonium qubit-based hybrid electromechanical system [0.0] 超伝導フラクソニウム量子ビットは、数MHzから数GHzの遷移周波数で高度に調整可能なエネルギーレベル構造を示す。
本研究では, 浮遊機械共振器に結合したフラキソニウム量子ビットからなるフラキソナブル電気機械システムについて理論的に検討する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 18:29:43 GMT)
A Workflow for Map Creation in Autonomous Vehicle Simulations [0.0] 正確な地図と適応可能な地図は、自律走行車(AV)の開発において重要である。
本稿では,オンタリオ工科大学の駐車場の3Dマップの生成を通じて,AV開発のための地図作成を効率化するカスタムワークフローを提案する。
今後、SLAM技術の導入、より広範なシミュレータ互換性のためのワークフローの最適化、地図生成精度を高めるために緯度と経度値のより柔軟な扱いについて研究する予定である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 00:58:09 GMT)
A Tie-breaking based Local Search Algorithm for Stable Matching Problems [0.0] 不完全リストと結びつき(SMTI)を有する安定結婚問題と、関係のある病院・居住者問題(HRT)に対するタイブレーキングに基づく局所探索(TBLS)アルゴリズムを導入する。
TBLSは最も高いマッチングサイズを達成する一方、TBLS-Eは最も低い性平等コストを示す。
どちらのアルゴリズムも、大規模インスタンスを解く際に、他のローカル検索アルゴリズムよりも高速な計算速度を示す。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 14:18:02 GMT)
A Superselection Rule for Quantum Causality [0.0] 不確定因果順序の対称性原理として、局所的な研究室間の接続に関する独立したフレーム選択を定式化する。
すべての二部共変過程$-$は多部回路の辺りやカット間の縮小を含む-$は因果分離可能である。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 16:01:25 GMT)
A Sobel-Gradient MLP Baseline for Handwritten Character Recognition [0.0] 我々は古典的なソベル演算子を再考し、簡単な問いを述べる:手書き文字認識(HCR)のための全密度多層パーセプトロン(MLP)を駆動するのに十分な一階エッジマップは十分か?
水平および垂直のソベル微分のみを入力として、MNISTおよびEMNIST文字上でニューラルネットワークをトレーニングする。
極端な単純さにもかかわらず、結果として得られたネットワークは、MNIST桁で98%、EMNIST文字で92%の精度に達し、CNNに近づきながら、メモリフットプリントと透過的な機能を提供する。
論文参考訳(メタデータ) (Sat, 23 Aug 2025 22:19:08 GMT)