Audio-Aware Large Language Models as Judges for Speaking Styles [123.4] 音声認識型大言語モデル(ALLM)を自動判断器として用いて音声の話し方を評価する。
4つの音声言語モデル(SLM)を用いて2つのタスクを完了し、人間とALMを用いてSLMの応答を判断する。
以上の結果から,現在のSLM,GPT-4o-audioでさえも,発話スタイルの制御や自然な対話生成に改善の余地があることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:05:48 GMT)
You Only Estimate Once: Unified, One-stage, Real-Time Category-level Articulated Object 6D Pose Estimation for Robotic Grasping [119.4] YOEOは、エンドツーエンドでインスタンスセグメンテーションとNPCS表現を出力する単一ステージのメソッドである。
我々は、統一ネットワークを使用してポイントワイズセマンティックラベルとセントロイドオフセットを生成し、同じパートインスタンスのポイントが同じセントロイドに投票できるようにする。
また,合成学習したモデルを実環境に展開し,200Hzでリアルタイムな視覚フィードバックを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:49:20 GMT)
SYNTHIA: Novel Concept Design with Affordance Composition [114.2] 所望の価格に基づいて,新規で機能的なコヒーレントなデザインを生成するためのフレームワークであるSynTHIAを紹介する。
我々は,我々のオントロジーに基づくカリキュラム学習手法を開発し,細粒度T2Iモデルと対比して,段階的に手頃な構成を学習する。
実験の結果,SynTHIAは最先端のT2Iモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:10:44 GMT)
NTIRE 2025 Challenge on HR Depth from Images of Specular and Transparent Surfaces [103.7] CVPR 2025における画像修復・拡張(NTIRE)ワークショップと共同で開催した,仕様面および透明面の画像からのHR深度に関するNTIRE 2025課題について報告する。
この課題は、特にこの分野の主要な開問題である高分解能曲面と非ランベルト曲面の2つに対処するために、深さ推定の研究を進めることを目的としている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:27:15 GMT)
Application of convolutional neural networks in image super-resolution [99.3] 畳み込みニューラルネットワーク(CNN)は、画像超解像の主流の手法となっている。
異なるタイプの深層学習方法には大きな違いがある。
本稿では,まず画像超解像におけるCNNの原理を紹介し,次にCNNをベースとしたバイキュビック,近傍,双線形,変換畳み込み,サブピクセル層,画像超解像のためのメタアップサンプリングを紹介する。
最後に, 画像超解像におけるCNNの発展を促進するため, 研究の潜在的なポイントと欠点を概説し, 論文全体を要約する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:07:16 GMT)
Movie Facts and Fibs (MF$^2$): A Benchmark for Long Movie Understanding [97.1] MF$2$は、モデルがフル長の映画から重要な物語情報を理解し、統合し、思い出せるかどうかを評価するための新しいベンチマークである。
各ペアについて、モデルは真と偽のクレームの両方を正しく識別する必要がある。
実験の結果、オープンウェイトモデルとクローズド・オブ・ザ・アーティファクトモデルの両方が人間のパフォーマンスにかなり劣っていることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:58:36 GMT)
Infinity Search: Approximate Vector Search with Projections on q-Metric Spaces [94.1] 我々は、$q$の測度空間において、計量木は三角形の不等式のより強いバージョンを活用でき、正確な探索の比較を減らすことができることを示した。
任意の異方性測度を持つデータセットを$q$-metric空間に埋め込む新しい射影法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:09:44 GMT)
Precise Information Control in Long-Form Text Generation [92.9] 現代言語モデル(LM)における中心的な課題は、固有の幻覚である。
提案手法は,短時間の自己完結文のセットで与えられた長文の出力をモデルで生成することを必要とするタスクの定式化である。
提案するPIC-Benchは,PIC設定に適合する8つの長文生成タスクのベンチマークである。
PIC-Bench 上でのオープンかつプロプライエタリな LM の評価は、驚くべきことに、最先端の LM が 70% 以上も内在的に幻覚していることを示している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:42:42 GMT)
TMT: Tri-Modal Translation between Speech, Image, and Text by Processing Different Modalities as Different Languages [92.9] Tri-Modal Translation (TMT) モデルは、音声、画像、テキストにまたがる任意のモダリティを翻訳する。
音声と画像データを個別のトークンにトークン化し、モダリティをまたいだ統一インターフェースを提供する。
TMTは単一モデルの性能を一貫して上回っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:15:28 GMT)
Training Software Engineering Agents and Verifiers with SWE-Gym [89.6] SWE-Gymは、現実世界のソフトウェアエンジニアリング(SWE)エージェントをトレーニングするための最初の環境である。
SWE-Gymには2,438の現実世界のPythonタスクインスタンスが含まれている。
我々はSWE-Gymを用いて言語モデルに基づくSWEエージェントを訓練し、解答率において最大19%の絶対ゲインを達成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:53:20 GMT)
PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time [88.0] PersonaAgentは、汎用的なパーソナライゼーションタスクに対処するために設計されたフレームワークである。
パーソナライズされたメモリモジュールとパーソナライズされたアクションモジュールを統合する。
テストタイムのユーザ嗜好アライメント戦略は、リアルタイムのユーザの嗜好アライメントを保証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:29:49 GMT)
Generalization of Geometric Graph Neural Networks with Lipschitz Loss Functions [84.0] 幾何グラフニューラルネットワーク(GNN)の一般化能力について検討する。
我々は,このGNNの最適経験リスクと最適統計リスクとの一般化ギャップを証明した。
複数の実世界のデータセットに対する実験により、この理論結果を検証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:13:03 GMT)
A Manifold Perspective on the Statistical Generalization of Graph Neural Networks [84.0] 我々は、スペクトル領域の多様体からサンプリングされたグラフ上のGNNの統計的一般化理論を確立するために多様体の視点を取る。
我々はGNNの一般化境界が対数スケールのグラフのサイズとともに線形に減少し、フィルタ関数のスペクトル連続定数とともに線形的に増加することを証明した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:52:34 GMT)
Exploring Diffusion Transformer Designs via Grafting [82.9] 計算予算の少ない新しいアーキテクチャを実現するために,事前に訓練された拡散変換器(DiT)を編集する簡単な手法であるグラフト方式を提案する。
演算子置換からアーキテクチャ再構成に至るまで,事前訓練したDiTをグラフトすることで,新しい拡散モデルの設計を探索できることが示されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:59:47 GMT)
Benchmarking Misuse Mitigation Against Covert Adversaries [80.7] 既存の言語モデルの安全性評価は、オーバースト攻撃と低レベルのタスクに重点を置いている。
我々は、隠蔽攻撃と対応する防御の評価を自動化するデータ生成パイプラインである、ステートフルディフェンスのためのベンチマーク(BSD)を開発した。
評価の結果,分解攻撃は有効な誤用防止剤であり,その対策としてステートフルディフェンスを強調した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:33:33 GMT)
LabSafety Bench: Benchmarking LLMs on Safety Issues in Scientific Labs [79.0] 大規模言語モデル(LLM)は、手続き的なガイダンスから自律的な実験オーケストレーションまで、タスクをますます支援している。
このような過度な信頼性は、リスク識別やリスクアセスメントの失敗が重大事故を引き起こす高リスクな実験室環境では特に危険である。
実験室安全ベンチマーク (LabSafety Bench) を提案し, 潜在的な危険を識別し, リスクを評価し, 実験室環境における安全でない行動の結果を予測する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:15:53 GMT)
Token Communications: A Unified Framework for Cross-modal Context-aware Semantic Communications [78.8] 我々は、生成意味コミュニケーション(GenSC)において、クロスモーダルなコンテキスト情報を活用するための大規模なモデル駆動フレームワークであるトークン通信(TokCom)を紹介する。
本稿では,GFM/MLLMをベースとしたトークン処理をセマンティック通信システムに組み込む方法について検討し,将来無線ネットワークの様々な層において効率的なTokComを実現する上での鍵となる原則について述べる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:53:50 GMT)
BRiTE: Bootstrapping Reinforced Thinking Process to Enhance Language Model Reasoning [78.6] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な機能を示した。
本稿では,新しいグラフィカルモデルを用いてLLM推論を定式化する統一確率的フレームワークを提案する。
本稿では,Bootstrapping Reinforced Thinking Process (BRiTE)アルゴリズムについて述べる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:49:45 GMT)
Position: Evaluating Generative AI Systems Is a Social Science Measurement Challenge [78.4] 我々は,MLコミュニティが,GenAIシステム評価のための計測機器を開発する際に,社会科学の学習と図面の恩恵を受けることを論じる。
我々は,GenAIシステムの能力,行動,および影響に関する概念を測定するための,社会科学からの計測理論に基づく4段階の枠組みを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:15:14 GMT)
LaMP-Cap: Personalized Figure Caption Generation With Multimodal Figure Profiles [77.6] 本稿では,マルチモーダルな人物キャプション生成のためのデータセットであるLaMP-Capを紹介する。
実験では、プロファイル情報を使用することで、オリジナルの著者が書いたものに近いキャプションを生成することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:16:16 GMT)
Do-PFN: In-Context Learning for Causal Effect Estimation [75.6] 予備データ適合ネットワーク(PFN)は, 合成データに基づいて事前学習を行い, 結果を予測する。
提案手法により,基礎となる因果グラフの知識を必要とせず,因果効果の正確な推定が可能となる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:43:57 GMT)
IntentionESC: An Intention-Centered Framework for Enhancing Emotional Support in Dialogue Systems [74.1] 感情的支援の会話では、意図の不明確さは、支持者に不適切な戦略を採用させる可能性がある。
Intention-centered Emotional Support Conversation frameworkを提案する。
支援者の意図を定義し、これらの意図を推測するための重要な感情状態の側面を特定し、それらを適切な支援戦略にマッピングする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:14:49 GMT)
UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control [73.7] 最適制御(SOC)に基づく拡散ブリッジ統合フレームワークUniDBを提案する。
UniDBは、SOCベースの最適化を通じて問題を定式化し、最適制御器のための閉形式解を導出する。
Doobの$h$-transformを使った既存の拡散ブリッジが、我々のフレームワークの特別なケースであることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:11:42 GMT)
Analyzing LLMs' Knowledge Boundary Cognition Across Languages Through the Lens of Internal Representations [72.6] 本研究は,LLMが言語間の知識境界をどのように認識するかを解析するための最初の研究である。
1) LLM の知識境界に対する認識は, 言語間の中間層と中間層にコード化されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:24:25 GMT)
Does Your 3D Encoder Really Work? When Pretrain-SFT from 2D VLMs Meets 3D VLMs [72.1] 本稿では,最近の3次元視覚言語モデルを3次元オブジェクト中心,2次元イメージベース,および3次元シーン中心のアプローチに分類する。
3Dシーン中心のVLMと2Dシーン中心のVLMのアーキテクチャ的類似性にもかかわらず、最新の3Dオブジェクト中心と2Dイメージベースアプローチと比較して比較的低い性能を示した。
本研究は,これらのモデルが多モードアライメント機能を有する一方で,言語的手がかりに過度に頼り,頻繁な回答に過度に適合する傾向があることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:09:06 GMT)
CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval [71.0] CLaMRは、ビデオフレーム、書き起こされた音声、画面上のテキスト、メタデータの4つのモダリティを共同でインデックスするマルチモーダルな遅延相互作用レトリバーである。
CLaMRは2つの重要な革新を通じて動的モダリティ選択を強化するために訓練されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:02:30 GMT)
Dynamic Mixture of Progressive Parameter-Efficient Expert Library for Lifelong Robot Learning [69.8] ジェネラリストのエージェントは生涯を通じて継続的に学び、適応し、破滅的な忘れを最小化しながら効率的な転送を実現する必要がある。
従来の研究は、シングルタスク適応のためのパラメータ効率の良い微調整を探索し、少数のパラメータで凍結事前訓練されたモデルを効果的に操る。
本稿では,生涯にわたるロボット学習のためのDMPEL(Dynamic Mixture of Progressive Efficient Expert Library)を提案する。
我々のフレームワークは、トレーニング可能な最小限のパラメータと記憶を生かしながら、継続的な適応を通して成功率において、最先端の生涯学習方法よりも優れています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:13:04 GMT)
Saffron-1: Towards an Inference Scaling Paradigm for LLM Safety Assurance [69.6] SAFFRONは、安全保証のために明示的に調整された、新しい推論スケーリングパラダイムである。
我々のアプローチの中心は、要求される報酬モデルの評価を著しく削減する乗算報酬モデル(MRM)の導入である。
トレーニング済みの多機能報酬モデル(Saffron-1)とそれに伴うトークンレベルの安全報酬データセット(Safety4M)を公開します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:05:45 GMT)
Certified Human Trajectory Prediction [66.2] 本稿では,ロバスト性を保証する軌道予測に適した認証手法を提案する。
そこで本研究では, 拡散型トラジェクトリデノイザを提案し, 本手法に組み込むことにより, 性能低下を緩和する。
認定された予測器の精度と堅牢性を実証し、認定されていない予測器に対するそれらの優位性を強調する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:34:56 GMT)
TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.7] 本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:59:50 GMT)
Debiasing Online Preference Learning via Preference Feature Preservation [64.6] 最近の嗜好学習フレームワークは、二対比較とスカラー報酬で人間の嗜好を簡単にする。
これにより、大規模言語モデルの反応は、主に好まれる特徴に偏り、オンラインの嗜好学習ステップのイテレーション中に悪化する可能性がある。
本研究では,人間の嗜好特徴の分布を維持するための嗜好特徴保存法を提案し,オンライン選好学習プロセスを通じてそのようなリッチな信号を利用する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:19:07 GMT)
The NetMob25 Dataset: A High-resolution Multi-layered View of Individual Mobility in Greater Paris Region [64.3] 本稿では,提案したデータセットのサーベイ設計,収集プロトコル,処理手法,特徴について述べる。
データセットには、人口統計、社会経済、家庭の特徴を記述した個人データベース(i)、タイムスタンプ、輸送モード、旅行目的を含む8,000以上の注釈付き変位を持つトリプスデータベース(ii)、約5億の高周波ポイントからなるRaw GPSトレースデータベース(iii)の3つのコンポーネントが含まれている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:22:21 GMT)
FreeTimeGS: Free Gaussian Primitives at Anytime and Anywhere for Dynamic Scene Reconstruction [64.3] FreeTimeGSはガウスのプリミティブを任意の時間と位置で表示できる新しい4D表現である。
我々の表現は強い柔軟性を持ち、ダイナミックな3Dシーンをモデル化する能力を向上させる。
いくつかのデータセットに対する実験結果から,本手法のレンダリング品質は,最近の手法よりも大きなマージンで優れていることが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:38:48 GMT)
Learning to Weight Parameters for Data Attribution [63.8] 生成モデルにおけるデータ帰属について検討し、どのトレーニング例が与えられた出力に最も影響するかを特定することを目的とした。
本稿では,ラベル付きデータを必要とせず,属性に適したパラメータ重み付けを学習することで,これをモデル化する手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:32:04 GMT)
SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.7] 我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:09:08 GMT)
Hey, That's My Data! Label-Only Dataset Inference in Large Language Models [63.4] CatShiftはラベルのみのデータセット推論フレームワークである。
LLMは、新しいデータに晒されたとき、学習した知識を上書きする傾向にある。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:02:59 GMT)
Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks [62.8] 複数のテキストリッチな画像を含む視覚言語タスクを扱うためのMLLMであるLeopardを提案する。
まず、テキストリッチでマルチイメージのシナリオに合わせて、約100万の高品質なマルチモーダル命令チューニングデータをキュレートした。
第2に,視覚列長の割り当てを動的に最適化する適応型高解像度マルチイメージ符号化モジュールを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:53:30 GMT)
MoA: Heterogeneous Mixture of Adapters for Parameter-Efficient Fine-Tuning of Large Language Models [61.9] ローランド適応 (LoRA) とミックスオブエキスパート (MoE) を統合するための固有テキストbfMixture-of-Adapters (MoA) アプローチを提案する。
実験結果から, 不均一なMoAは均一なMoE-LoRA法よりも性能およびパラメータ効率が優れていることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:54:19 GMT)
Feedforward Few-shot Species Range Estimation [61.6] 特定の種が地球上でどこで発見できるかを知ることは、生態学の研究と保全に不可欠である。
正確な射程推定は 知られている全ての種の 比較的小さな割合でしか 利用できない
我々は、限られたデータから種の範囲を正確に推定するという課題に対処するために、数発の種範囲推定の新しいアプローチを概説する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:17:40 GMT)
ByzSecAgg: A Byzantine-Resistant Secure Aggregation Scheme for Federated Learning Based on Coded Computing and Vector Commitment [61.5] ByzSecAggは、フェデレートラーニングのための効率的なセキュアアグリゲーションスキームである。
ByzSecAggはビザンツの攻撃やプライバシーの漏洩に耐性がある。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:07:58 GMT)
Who Can Withstand Chat-Audio Attacks? An Evaluation Benchmark for Large Audio-Language Models [60.7] アドリラルオーディオ攻撃は、人間と機械の相互作用における大きなオーディオ言語モデル(LALM)の利用の増加に重大な脅威をもたらす。
本稿では,4種類の音声攻撃を含むChat-Audio Attacksベンチマークを紹介する。
Gemini-1.5-Pro, GPT-4oなど, 音声対話機能を有する6つの最先端LALMの評価を行った。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:43:02 GMT)
Bayesian Persuasion as a Bargaining Game [60.4] 長期的説得のための統一的なフレームワークとよく構造化されたソリューションの概念を導入する。
この視点はゲーム構造の共通知識を明確にし、レシーバに匹敵するコミットメント能力を与える。
このフレームワークは、2段階の検証と推論のパラダイムによって検証される。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:42:34 GMT)
IDA-Bench: Evaluating LLMs on Interactive Guided Data Analysis [60.3] IDA-Benchは、多ラウンドの対話シナリオで大規模言語モデルを評価する新しいベンチマークである。
エージェント性能は、最終的な数値出力と人間由来のベースラインを比較して判断する。
最先端のコーディングエージェント(Claude-3.7-thinkingなど)でさえ50%のタスクを成功させ、シングルターンテストでは明らかでない制限を強調している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:33:47 GMT)
Rethinking Machine Unlearning in Image Generation Models [59.7] CatIGMUは、新しい階層的なタスク分類フレームワークである。
EvalIGMUは包括的な評価フレームワークである。
高品質な未学習データセットであるDataIGMを構築した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:39:59 GMT)
TRACT: Regression-Aware Fine-tuning Meets Chain-of-Thought Reasoning for LLM-as-a-Judge [59.6] TRACT(Two-stage Regression-Aware fine-tuning with CoT)は、CoT推論と回帰学習を組み合わせた手法である。
4つの LLM-as-a-judge データセットと2つの LLM データセットによる実験により、TRACT が既存の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:43:14 GMT)
Reusing Trajectories in Policy Gradients Enables Fast Convergence [59.3] 政策勾配法 (PG) は効果的な強化学習アルゴリズムの一種である。
本稿では,古いトラジェクトリと新しいトラジェクトリを組み合わせたPGアルゴリズムであるRPG(Retrospective Policy Gradient)を提案する。
確立された仮定の下では、RPGは文献で最もよく知られたレートである$widetildeO(epsilon-1)$のサンプル複雑性を達成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:42:15 GMT)
Learning Deterministic Policies with Policy Gradients in Constrained Markov Decision Processes [59.3] 我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し,支配的仮定の下でのグローバルな最終点収束保証を享受する。
制約制御タスクにおいて,アクションベース(C-PGAE)とパラメータベース(C-PGPE)の両方を実証的に検証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:29:05 GMT)
AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [59.0] 大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:07:23 GMT)
Interpretable Enzyme Function Prediction via Residue-Level Detection [58.3] 本稿では,酵素機能予測のための注意に基づくフレームワークであるProtDETRを提案する。
学習可能な関数クエリのセットを使用して、残差レベルの一連の特徴から異なるローカル表現を適応的に抽出する。
ProtDETRは、既存のディープラーニングベースの酵素機能予測法よりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:19:56 GMT)
A Survey of Automatic Evaluation Methods on Text, Visual and Speech Generations [58.1] 本稿では,3つのモダリティすべてにまたがる生成コンテンツの自動評価手法の総合的なレビューと統合分類について述べる。
本分析は,最も成熟したテキスト生成手法の評価から開始する。
次に、このフレームワークを画像およびオーディオ生成に拡張し、その幅広い適用性を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:09:46 GMT)
Large Language Models are Demonstration Pre-Selectors for Themselves [57.1] 大規模言語モデル(LLM)を備えたインコンテキスト学習(ICL)は、トレーニングデータ全体から数ショットのデモを選択することで、強力な数ショットのパフォーマンスを提供する。
FEw yet Essential Demonstration prE-selectoRは、デモの代表的なサブセットを特定する新しい事前選択フレームワークである。
FEwでもEssential Demonstration prE-selectoRは、パフォーマンスを維持しながら、トレーニングデータのサイズを20%以上削減できる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:29:03 GMT)
Peri-LN: Revisiting Normalization Layer in the Transformer Architecture [57.1] Pre-LNとPost-LNは、大規模なトレーニングの制限にもかかわらず、長年にわたってプラクティスを支配してきた。
最近、いくつかのオープンソースモデルが静かに第3の戦略を採用し始めた。
Peri-LNは、よりバランスの取れた分散成長、より安定な勾配流、収束安定性を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:19:11 GMT)
AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.6] 自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:13:12 GMT)
RelGNN: Composite Message Passing for Relational Deep Learning [56.5] RelGNNはリレーショナルデータベースから構築されたグラフのユニークな構造特性を活用するために特別に設計された新しいGNNフレームワークである。
RelGNNは、Relbench(Fey et al., 2024)から30の多様な実世界のタスクで評価され、ほとんどのタスクで最先端のパフォーマンスを実現し、最大25%の改善を実現している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:36:51 GMT)
Training Deep Learning Models with Norm-Constrained LMOs [56.0] 線形最小化オラクル(LMO)を用いて問題の幾何学に適応する新しいアルゴリズム群を提案する。
我々は,Adamに頼らずに,我々のアルゴリズムであるScionを用いたナノGPTトレーニングの大幅な高速化を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:42:19 GMT)
Noise Consistency Regularization for Improved Subject-Driven Image Synthesis [55.8] 微調整安定拡散は、モデルを適用して特定の対象を含む画像を生成することによって、被写体駆動画像合成を可能にする。
既存の微調整手法は、モデルが確実に被写体を捕捉できない不適合と、被写体イメージを記憶し、背景の多様性を減少させる過適合の2つの主要な問題に悩まされる。
拡散微調整のための2つの補助的整合性損失を提案する。第1に、事前(非対象)画像に対する予測拡散雑音が事前訓練されたモデルと一致し、忠実度が向上する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:17:37 GMT)
Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application [55.4] 生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
微分方程式(SDE)に基づく理論基礎の確立
信号対雑音比(SNR)と復調時間ステップとの閉形式解析関係を導出する。
受信した信号とDMのトレーニングデータとの分布ミスマッチに対処するため、数学的に原理化されたスケーリング機構を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:20:32 GMT)
Writing-RL: Advancing Long-form Writing via Adaptive Curriculum Reinforcement Learning [55.4] 本稿では,適応型カリキュラム強化学習フレームワーク「Ling-RL: An Adaptive Curriculum Reinforcement Learning」について紹介する。
フレームワークは3つの重要なコンポーネントで構成されている。高い学習可能性を持つサンプルを優先するMargin-aware Data Selection戦略、差別的な学習信号を提供するPairwise Comparison Rewardメカニズム、動的参照スケジューリングアプローチである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:40:39 GMT)
Large Language Models are Good Relational Learners [55.4] 本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:07:55 GMT)
Preference Learning for AI Alignment: a Causal Perspective [55.2] 私たちはこの問題を因果パラダイムに枠組み化し、永続的な課題を特定するための因果関係の豊富なツールボックスを提供します。
因果推論の文献を継承し、信頼性の高い一般化に必要な重要な仮定を特定する。
そこで本研究では, 因果関係に基づくアプローチがモデルロバスト性をいかに改善するかを, ナイーブ報酬モデルの障害モードを例示する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:45:42 GMT)
Exploring Microstructural Dynamics in Cryptocurrency Limit Order Books: Better Inputs Matter More Than Stacking Another Hidden Layer [55.2] ニューラルネットワークに余分な隠蔽層やパラメータを追加することで、短期的な価格予測が真に向上するかどうかを検討することを目的としている。
我々は,BTC/USDT LOBスナップショットを100ミリ秒から複数秒間隔で公開して,解釈可能なベースライン,ロジスティック回帰,XGBoostからディープアーキテクチャ(DeepLOB,Conv1D+LSTM)まで,モデルをベンチマークする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:43:30 GMT)
Improving the Diffusability of Autoencoders [54.9] 高品質な画像やビデオを生成するための主要なアプローチとして、潜伏拡散モデルが登場している。
我々は、現代のオートエンコーダのスペクトル分析を行い、その潜在空間における不規則な高周波成分を同定する。
我々は、この高周波成分が拡散合成プロセスの粗大な微細な性質に干渉し、生成品質を阻害する仮説を立てた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:43:53 GMT)
Masked Language Models are Good Heterogeneous Graph Generalizers [54.4] Masked Language Modeling-based method - Masked Language Modeling-based method
本稿では,シンプルだが効果的なマスケプド言語モデリング手法を提案する。
HGトークンの代わりにメタパスベースのテキストシーケンスを使用して、構造的および意味的な情報を抽出する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:21:24 GMT)
Sharp Gap-Dependent Variance-Aware Regret Bounds for Tabular MDPs [54.3] 我々は,モノトニック値 Omega (MVP) アルゴリズムが,差分を考慮した差分依存残差境界を$tildeOleft(left(sum_Delta_h(s,a)>0 fracH2 log K land MathttVar_maxtextc$。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:33:57 GMT)
RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models [53.6] 本稿では,RoSTE (Rotated Straight-Through-Estimator) というアルゴリズムを提案する。
RoSTEは、量子化を意識した微調整(QA-SFT)と適応的な回転戦略を組み合わせることで、アクティベーションアウトリーを減少させる。
その結果, 予測誤差は収束重みの量子化誤差と直接比例し, 最適化された回転構成により効果的に管理できることが判明した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:29:18 GMT)
Global Convergence of Gradient EM for Over-Parameterized Gaussian Mixtures [53.5] 勾配EMの力学を考察し, テンソル分解を用いて幾何的景観を特徴付ける。
これは、m=2$という特別な場合を超えるEMや勾配EMに対する最初の大域収束と回復の結果である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:32:38 GMT)
Self-Supervised Generative-Contrastive Learning of Multi-Modal Euclidean Input for 3D Shape Latent Representations: A Dynamic Switching Approach [53.4] 本稿では,3次元形状の潜在表現を学習するための,生成型とコントラスト型を組み合わせたニューラルアーキテクチャを提案する。
このアーキテクチャでは、2つのエンコーダブランチをボクセルグリッドと、同じ形状のマルチビューイメージに使用している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:00:51 GMT)
Table-r1: Self-supervised and Reinforcement Learning for Program-based Table Reasoning in Small Language Models [52.9] 表推論(TR)は、半構造化データに対する構造化推論を必要とする。
小型言語モデル(SLM)は、大きなLM(LLM、例えばGPT-4o)と比較して限られた能力を持つ。
実行可能プログラムを生成することで、テキストベースTR(T-TR)の鍵となる制限を回避するプログラムベースTR(P-TR)を提案する。
4つのTRベンチマークの実験により、Table-r1は全てのSLMベースの手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:52:19 GMT)
Latent Thought Models with Variational Bayes Inference-Time Computation [52.6] ラテント思考モデル(LTM)は、ラテント空間における明示的な事前モデルに従う明示的なラテント思考ベクトルを包含する。
LTMは自己回帰モデルや離散拡散モデルよりも優れたサンプルおよびパラメータ効率を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:40:37 GMT)
CoIR: A Comprehensive Benchmark for Code Information Retrieval Models [52.6] COIR(Code Information Retrieval Benchmark)は、コード検索機能を評価するために設計された、堅牢で包括的なベンチマークである。
COIRは、厳密にキュレートされた10のコードデータセットで構成され、7つの異なるドメインにまたがる8つの特有の検索タスクにまたがる。
我々は,COIRを用いた9つの広く使用されている検索モデルを評価し,最先端システムにおいても,コード検索タスクの実行に重大な困難があることを明らかにする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:39:22 GMT)
The Bakers and Millers Game with Restricted Locations [52.4] 本研究では,ベイカーズ・アンド・ミラーズ・ゲーム(Bakers and Millers Game)と呼ばれる,顧客と販売者による戦略的位置選択について研究した。
最適なバーゲティング力を得るために、パン屋は他のパン屋とほとんど競争せず、多くの製粉業者が小麦粉を買う場所を選択したいと考えた。
我々は、より難しい制限された設定でさえ平衡を許容する洗練された効率的なアルゴリズムを通して示している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:17:55 GMT)
Visual Graph Arena: Evaluating Visual Conceptualization of Vision and Multimodal Large Language Models [51.9] 視覚抽象化のためのAIシステムの能力を評価し改善するためのビジュアルグラフアリーナ(VGA)を導入する。
人間はタスク間でほぼ完璧な精度を達成し、モデルは同型検出で完全に失敗し、パス/サイクルタスクにおいて限られた成功を示した。
表現不変推論の課題を分離することにより、VGAは、AIビジュアルモデルにおける人間のような概念化に向けた前進を促進するためのフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:06:25 GMT)
CoMemo: LVLMs Need Image Context with Image Memory [51.7] CoMemoは、Contextイメージパスとイメージメモリパスを組み合わせてビジュアル処理を行うデュアルパスアーキテクチャである。
2次元空間認識を維持するためにサムネイルに基づく位置アグリゲーションを利用する新しい位置符号化機構であるRoPE-DHRを導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:59:06 GMT)
A projection-based framework for gradient-free and parallel learning [51.0] 私たちはこのパラダイムを実現するJAXベースのソフトウェアフレームワークであるPJAXを紹介します。
PJAXは基本演算に対する射影演算子を構成し、実現可能性問題に対する解演算子を自動的に導出する。
各種アーキテクチャ(MLP、CNN、RNN)を標準ベンチマークでPJAXを用いてトレーニングし、その汎用性を実証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:44:56 GMT)
Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models [50.6] 視覚表現におけるニューロンレベルでの単意味性を評価するための包括的枠組みを提案する。
実験の結果,視覚言語モデルで訓練したSAEは個々のニューロンの単意味性を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:18:16 GMT)
Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.6] 医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:56:41 GMT)
Can Theoretical Physics Research Benefit from Language Agents? [50.6] 大規模言語モデル(LLM)は、様々な領域にわたって急速に進歩しているが、理論物理学研究への応用はまだ成熟していない。
このポジションペーパーは、LLMエージェントが、ドメイン知識やツールボックスと適切に統合された場合、理論的、計算的、応用物理学を加速するのに役立つと主張している。
マルチモーダルデータを処理し、検証可能な仮説を提案し、設計実験を行う物理特殊化LSMを構想する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:20:06 GMT)
The Synergy of LLMs & RL Unlocks Offline Learning of Generalizable Language-Conditioned Policies with Low-fidelity Data [50.5] TEDUOは、シンボリック環境におけるオフライン言語条件のポリシー学習のための、新しいトレーニングパイプラインである。
まず、オフラインデータセットをよりリッチなアノテーションで拡張する自動化ツールとして、次に、一般化可能な命令フォローエージェントとして使用します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:05:49 GMT)
Quantifying the Optimization and Generalization Advantages of Graph Neural Networks Over Multilayer Perceptrons [50.3] グラフネットワーク(GNN)は、グラフ構造化データから学習する際、顕著な能力を示した。
最適化と一般化の観点から、GNNと一般化を比較した分析の欠如がまだ残っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:58:22 GMT)
Label-Context-Dependent Internal Language Model Estimation for CTC [50.3] 本稿では,コネクショニストの時間的分類のための新しい文脈依存型ILM推定手法を提案する。
実験の結果,コンテキスト依存型ILMはドメイン間評価において,コンテキスト非依存型の先行よりも優れていた。
平滑化手法を用いたラベルレベルKDは,他のILM推定手法を超えている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:54:43 GMT)
Web Intellectual Property at Risk: Preventing Unauthorized Real-Time Retrieval by Large Language Models [49.3] 本稿では,Webコンテンツ作成者に対して,不正な抽出と再配布からWebベースのIPを保護するための新しいフレームワークを提案する。
提案手法はモチベーションの原則に従い,難解なブラックボックス最適化問題に効果的に対処する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:55:29 GMT)
CO-VADA: A Confidence-Oriented Voice Augmentation Debiasing Approach for Fair Speech Emotion Recognition [49.3] モデルアーキテクチャの変更や人口統計情報への依存を伴わずにバイアスを緩和する信頼性指向音声強調脱バイアス手法であるCO-VADAを提案する。
CO-VADAはトレーニングデータに存在するバイアスパターンを反映したトレーニングサンプルを特定し、無関係な属性を変更してサンプルを生成するために音声変換を適用する。
我々のフレームワークは様々なSERモデルや音声変換ツールと互換性があり、SERシステムの公平性を改善するためのスケーラブルで実用的なソリューションとなっている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:25:56 GMT)
ADIOS: Antibody Development via Opponent Shaping [49.3] 抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
しかし、治療によって誘導される選択的圧力は、新しいウイルス株の出現を引き起こす。
私たちの治療法はウイルスの進化を防御し、積極的に影響を及ぼすことができます。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:07:55 GMT)
Additive decomposition of one-dimensional signals using Transformers [48.7] 一次元信号分解は、様々な科学分野において確立され広く使われている技術である。
近年の研究では、この問題に最新のディープラーニングモデルを適用すると、期待できる可能性を持った、エキサイティングで未探索な領域が現れることが示唆されている。
我々はTransformerアーキテクチャを利用して、信号を構成コンポーネントに分解する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:09:40 GMT)
Normalizing Flows are Capable Generative Models [48.3] TarFlowはシンプルでスケーラブルなアーキテクチャで、高性能なNFモデルを実現する。
エンドツーエンドのトレーニングは簡単で、ピクセルを直接モデリングして生成することができる。
TarFlowは、画像の確率推定に新たな最先端結果を設定し、以前のベストメソッドを大きなマージンで上回る。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:45:35 GMT)
Proactive Assistant Dialogue Generation from Streaming Egocentric Videos [48.3] この研究は、多様なタスクを通じてユーザーを誘導できるリアルタイムでプロアクティブなAIアシスタントを開発するための基礎を築いた。
まず,注釈付きエゴセントリックビデオから対話を合成する新しいデータキュレーションパイプラインを提案する。
第2に、広範囲な人間の研究を通して検証された自動評価指標のスイートを開発する。
第3に,ストリーミングビデオ入力を処理し,文脈的に適切な応答を生成するエンド・ツー・エンド・モデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:23:29 GMT)
PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts [47.9] 我々は、ステップバイステップ、オープンエンド、クリエイティブマルチモーダル推論を評価するために設計された667のパズルハントスタイルの大規模ベンチマークであるPuzzleWorldを紹介した。
ほとんどの最先端モデルでは最終解の精度は1-2%に過ぎず、最高のモデルではパズルの14%しか解けず、ステップワイズ精度は40%に達する。
誤り解析により,現在のモデルは筋力的推論を示し,言語に基づく推論の限界に悩まされ,視覚的および空間的推論に不可欠なスケッチ能力が欠如していることが判明した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:17:09 GMT)
Gradual Transition from Bellman Optimality Operator to Bellman Operator in Online Reinforcement Learning [47.6] 連続行動空間の場合、アクター批判法はオンライン強化学習(RL)において広く用いられている。
本研究では,ベルマン最適度演算子をアクター批判フレームワークに組み込むことの有効性を検討した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:46:20 GMT)
Loki's Dance of Illusions: A Comprehensive Survey of Hallucination in Large Language Models [46.7] 大型言語モデル(LLM)は、実際に正確に見えるが実際に作られた情報を生成することがある。
これらの幻覚の頻度は、ユーザを誤解させ、判断や判断に影響を及ぼす可能性がある。
金融、法律、医療などの分野では、このような誤報が重大な経済的損失、法的紛争、健康リスクを引き起こしている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:50:08 GMT)
Learning Along the Arrow of Time: Hyperbolic Geometry for Backward-Compatible Representation Learning [46.5] 後方互換性のある表現学習により、更新されたモデルが既存のモデルとシームレスに統合され、ストアドデータの再処理が回避される。
そこで我々は、時間をモデルの信頼と進化を捉えるための自然な軸として扱う、双曲幾何学への視点転換を提案する。
実験は、よりレジリエントで適応可能な機械学習システムを実現するために、互換性を達成するための提案手法の優越性を検証した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:53:40 GMT)
Training-Free Query Optimization via LLM-Based Plan Similarity [46.0] LLM-PM (LLM-based Plan Mapping) は,クエリのデフォルト実行プランを埋め込んだフレームワークである。
JOB-CEBベンチマークで評価したところ、LLM-PMは平均21%のレイテンシ低減を実現している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:16:07 GMT)
Stealix: Model Stealing via Prompt Evolution [45.6] 我々は、事前に定義されたプロンプトなしでモデルステルスを実行する最初のアプローチであるStealixを紹介した。
Stealixは2つのオープンソースの事前訓練モデルを使用して、被害者モデルのデータ分布を推定し、遺伝的アルゴリズムを通じてプロンプトを反復的に洗練する。
実験の結果、Stealixはクラス名やきめ細かいプロンプトにアクセスしても、他のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:34:00 GMT)
Evolutionary Perspectives on the Evaluation of LLM-Based AI Agents: A Comprehensive Survey [45.5] 従来の大規模言語モデル(LLM)からより高度なAIエージェントへの移行は、重要な進化のステップである。
既存の評価フレームワークは、LLMチャットボットとAIエージェントの区別を曖昧にし、適切なベンチマークを選択する研究者の間で混乱を招くことが多い。
本稿では,進化的観点からの現在の評価手法の体系的分析を紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:52:18 GMT)
Future of Work with AI Agents: Auditing Automation and Augmentation Potential across the U.S. Workforce [45.3] 作業員がAIエージェントの自動化や強化を望んでいるかを評価するための新しい枠組みを導入する。
我々のフレームワークは、ニュアンスな労働者の欲求を捉えるために、オーディオ強化されたミニインタービューを備えている。
我々はWORKBankデータベースを構築し、1500のドメインワーカーの好みとAI専門家の能力評価を収集する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:05:52 GMT)
Infi-MMR: Curriculum-based Unlocking Multimodal Reasoning via Phased Reinforcement Learning in Multimodal Small Language Models [45.2] Infi-MMRは、マルチモーダル小言語モデルの推論能力を体系的に解放するフレームワークである。
第1フェーズであるFoundational Reasoning Activationは、高品質なテキスト推論データセットを活用して、モデルの論理推論能力を活性化し、強化する。
第2のフェーズであるクロスモーダル推論適応は、キャプション拡張されたマルチモーダルデータを使用して、推論スキルをマルチモーダルコンテキストにプログレッシブに転送する。
第3フェーズであるMultimodal Reasoning Enhancementでは、言語バイアスを緩和し、堅牢なクロスモーダル推論を促進するために、キュレートされたキャプションフリーなマルチモーダルデータを採用している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:03:09 GMT)
Training-Free Constrained Generation With Stable Diffusion Models [45.1] 安定拡散モデルは、様々な領域にまたがるデータ合成における最先端のモデルである。
本稿では,安定拡散モデルと制約付き最適化フレームワークの新たな統合を提案する。
このアプローチの有効性は、精密な形態計測特性の付着を必要とする材料設計実験によって実証される。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:42:50 GMT)
FontAdapter: Instant Font Adaptation in Visual Text Generation [45.0] 本稿では,参照グリフ画像に条件付きで,未知のフォントで数秒以内に視覚テキストを生成するフレームワークFontAdapterを提案する。
実験によると、FontAdapterは推論中に微調整を加えることなく、見えないフォント間で高品質で堅牢なフォントカスタマイズを可能にする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:00:49 GMT)
Optimizing entanglement distribution via noisy quantum channels [45.0] 絡み合い分布は量子情報科学において重要な問題である。
ノイズの多い量子チャネルを経由した2つの遠方部間の量子絡み合いの分散戦略について検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:48:20 GMT)
A Culturally-Rich Romanian NLP Dataset from "Who Wants to Be a Millionaire?" Videos [45.0] 大きな言語モデル(LLM)は、言語や文化の文脈で様々なパフォーマンスを示す。
本研究は,ルーマニアのゲームショー "Who Wants to Be a Millionaire?
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:21:38 GMT)
Data Swarms: Optimizable Generation of Synthetic Evaluation Data [45.0] 合成評価データの生成を最適化するアルゴリズムであるData Swarmsを提案する。
まず、既存のデータを用いて初期データ生成者の群れを訓練し、様々な評価目標を定義する。
次に、データジェネレータのスワムを最適化するために、パーティクルスワムを最適化する。
我々はそれをAdversarial Swarmsに拡張し、データジェネレータSwarmはより難しいデータを生成し、テストテイカーモデルSwarmはそのようなデータから学習する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:20:24 GMT)
Cross-lingual Collapse: How Language-Centric Foundation Models Shape Reasoning in Large Language Models [44.9] textbfCross-lingual Collapseは、多言語言語モデルが支配的な事前学習言語に回帰する体系的なドリフトである。
実験の結果, (i)GRPOは事前学習言語の不均衡を急速に増幅し, わずか数百回の更新で低リソース言語が侵食され, (ii) 言語整合性報酬はこのドリフトを緩和するが, ほぼ5~10ppの精度の低下を犠牲にしていることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:08:48 GMT)
LLM in the Loop: Creating the ParaDeHate Dataset for Hate Speech Detoxification [44.9] 解毒のための高品質な並列データセット、特にヘイトスピーチは、人間のアノテーションのコストと感度のために不足している。
本稿では, GPT-4o-mini を利用した新しいLCM-in-the-loopパイプラインを提案する。
8K以上のヘイト/非ヘイトテキストペアのベンチマークとしてParaDeHateをリリースし、幅広いベースライン手法を評価した。
実験結果から,ParaDeHateを微調整したBARTなどのモデルでは,スタイル精度,コンテンツ保存,流速が向上した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:45:27 GMT)
GuessBench: Sensemaking Multimodal Creativity in the Wild [44.8] 広汎でノイズの多い,多元的な人間の創造性をモデル化する上で,視覚言語モデル(VLM)を評価する新しいベンチマークであるGuessBenchを提案する。
GuessBenchは、オンラインマルチプレイヤーMinecraftミニゲーム「Guess the Build」のデータを入手している。
静的画像設定や動的画像設定,自然言語ヒントなど,2000年問題の実際のゲームプレイから1500枚の画像をキュレートする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:23:52 GMT)
Discrete Minds in a Continuous World: Do Language Models Know Time Passes? [44.5] 大規模言語モデル(LLM)は、イベントの順序付けや時間推定といった時間的推論のタスクで優れています。
LLMが時間の経過を知覚し、それに応じて意思決定に適応するかどうかを検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:37:01 GMT)
Do LLMs Really Forget? Evaluating Unlearning with Knowledge Correlation and Confidence Awareness [44.4] 大規模言語モデル(LLM)における意図しない記憶の軽減を目的とした機械学習手法
実世界の知識の暗黙構造をより正確に捉えた知識未学習評価フレームワークを提案する。
私たちのフレームワークは、未学習のパフォーマンスをより現実的で厳格に評価します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:35:19 GMT)
Taming Knowledge Conflicts in Language Models [44.4] 言語モデル(LM)は、パラメトリックメモリが文脈的知識と矛盾する場合、しばしば知識の衝突に遭遇する。
JICEは、微調整を必要とせず、パラメトリックな信念や文脈的知識のどちらに対してもLMを操るテストタイムアテンション介入手法である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:46:29 GMT)
FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion [44.2] FPSAttentionは、ビデオ生成のためのFP8量子化とスパーシリティの新たなコデザインである。
1) 量子化とスパーシリティの両方を同時にサポートする統一された3Dタイルワイドの粒度,2) ノイズスケジュールに適応し,量子化/スパーシティエラーとデノナイズステップの強い相関に対処するデノナイズされたステップアウェア戦略,3) FlashAttentionを活用するネイティブなハードウェアフレンドリーなカーネル。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:12:20 GMT)
CryoFastAR: Fast Cryo-EM Ab Initio Reconstruction Made Easy [43.7] 我々はCryo-EMノイズ画像から直接ポーズを予測できる最初の幾何学的基礎モデルであるCryoFastARを紹介した。
CryoFastARは、マルチビュー機能と、大規模シミュレーションされたCryo-EMデータに現実的なノイズとCTF変調を統合することで、ポーズ推定精度と一般化を向上する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:32:32 GMT)
ActionPiece: Contextually Tokenizing Action Sequences for Generative Recommendation [43.6] 我々はアクションシーケンスをトークン化するときにコンテキストを明示的に組み込むActionPieceを提案する。
特徴パターンを新しいトークンとしてマージし,その共起頻度に基づいて語彙を構築する。
特徴集合の非順序性を考えると、さらに集合置換正則化を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:11:42 GMT)
Restereo: Diffusion stereo video generation and restoration [43.2] ステレオビデオを生成するだけでなく、左ビデオと右ビデオの両方を1つのモデルで一貫した拡張を行う新しいパイプラインを導入する。
本手法は,比較的小さなステレオビデオデータセットを用いて微調整し,高品質な実世界のビデオに適用することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:14:24 GMT)
Diversity of Transformer Layers: One Aspect of Parameter Scaling Laws [42.9] トランスフォーマーは、幅広いタスクにわたって優れたパフォーマンスを提供します。
タスク解決性能はパラメータサイズの増加によって向上する。
本研究では,トランスフォーマーのパラメータサイズを決定するレイヤとそのサイズに着目した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:28:58 GMT)
Just Enough Thinking: Efficient Reasoning with Adaptive Length Penalties Reinforcement Learning [42.8] ALPによるDeepScaleR-1.5Bのトレーニングは、パフォーマンスを著しく低下させることなく、平均トークン使用量を50%削減する。
固定予算と均一なペナルティ基準に対して、ALPは、簡単なプロンプトで計算をカットし、保存されたトークンを難しいものに再配置することで、予算の削減をよりインテリジェントに再分配する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:38:39 GMT)
The Scales of Justitia: A Comprehensive Survey on Safety Evaluation of LLMs [42.6] 大規模言語モデル(LLM)は自然言語処理(NLP)分野において顕著な可能性を示した。
LLMは、特に敵のシナリオにおいて、毒性や偏見のような安全でない要素を時々示してきた。
本調査は,LLMの安全性評価の最近の進歩を包括的かつ体系的に概観することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:50:50 GMT)
O-MaMa @ EgoExo4D Correspondence Challenge: Learning Object Mask Matching between Egocentric and Exocentric Views [42.0] 本報告では、マスクマッチングタスクとして扱うことにより、クロスイメージセグメンテーションを再定義する。
提案手法は,(1)高密度DINOv2セマンティックな特徴をプールし,FastSAMマスク候補から識別対象レベルの表現を得るマスクコンテキスト,(2)多視点観測を融合するEgo$leftarrow$Exoクロスアテンション,(3)共有潜在空間におけるクロスビュー特徴を整列するマスクマッチングコントラスト損失からなる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:19:08 GMT)
Small Models, Big Support: A Local LLM Framework for Teacher-Centric Content Creation and Assessment using RAG and CAG [41.9] 大規模言語モデル(LLM)は、学生向けの教育援助としてますます活用されている。
既存の教育ソリューションの多くはクラウドベースのインフラストラクチャやプロプライエタリなツールに依存している。
本稿では,3B-7Bの小さなパラメータを活用し,教材生成と評価をカスタマイズしたLLMをローカルに展開する,エンドツーエンドのオープンソースフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:47:03 GMT)
Noise-reduction of multimode Gaussian Boson Sampling circuits via Unitary Averaging [41.9] 我々は、一元平均化プロトコルを統合することにより、ガウスボソンサンプリング(GBS)回路を改善する。
我々はビームスプリッタや位相シフト器の欠陥を含む任意の干渉音を緩和する。
大規模システムの性能向上を予測できるパワーロー式を導出する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:28:06 GMT)
Position: Theory of Mind Benchmarks are Broken for Large Language Models [41.8] 我々の論文は、大きな言語モデルが新しいパートナーにどのように適応するかを直接テストできないため、マインドベンチマークの大多数が壊れていると論じている。
この問題は、心の理論が人間の心の理論をテストする方法から圧倒的にインスピレーションを受けているという事実に起因している。
本稿では,精神機能理論の概念を紹介し,その行動に対する合理的な反応に従って,文脈内でエージェントに適応する能力について紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:06:52 GMT)
HIGHT: Hierarchical Graph Tokenization for Molecule-Language Alignment [41.8] 大規模言語モデル(LLM)の分子認識を改善するために,原子,モチーフ,分子レベルの情報トークンを符号化したグラフトークン化器を提案する。
実世界の14のベンチマーク実験では、幻覚の40%削減におけるHighTの有効性が検証され、様々な分子言語下流タスクにおいて顕著に改善された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:09:22 GMT)
TiC-LM: A Web-Scale Benchmark for Time-Continual LLM Pretraining [41.6] 歴史的Webデータに基づいてトレーニングされた大規模言語モデル(LLM)は、必然的に時代遅れになる。
114ダンプのCommon Crawl(CC)から得られたLCMの時間-連続事前学習のためのWebスケールデータセットを提案する。
また、一般CCデータと特定ドメインの両方にわたって時間階層評価を設計する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:49:43 GMT)
Vid2Sim: Generalizable, Video-based Reconstruction of Appearance, Geometry and Physics for Mesh-free Simulation [41.2] Vid2Simは、幾何学と物理特性を回復するための一般化可能なビデオベースのアプローチである。
物理世界の知識を捉えるために訓練されたフィードフォワードニューラルネットワークは、物理システムの観察された構成をビデオから再構築する。
軽量な最適化パイプラインは、推定外観、幾何学、物理的特性を洗練し、ビデオ観察と密接に一致させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:00:46 GMT)
Unleashing the Potential of Consistency Learning for Detecting and Grounding Multi-Modal Media Manipulation [41.0] 本研究では,DGM4における偽造の微粒化認識能力を高めるために,CSCL (Contextual-Semantic Consistency Learning) という新しい手法を提案する。
具体的に言うと、各モジュールは、トークンペアの異種情報から追加の監視を活用することで、一貫性機能を構築する。
DGM4の実験により、CSCLは、特に接地されたコンテンツに対して、新しい最先端のパフォーマンスを達成することが証明された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:59:07 GMT)
Astra: Toward General-Purpose Mobile Robots via Hierarchical Multimodal Learning [40.8] Astraは、モバイルロボットナビゲーションのための総合的なデュアルモデルアーキテクチャである。
Astra-Globalは視覚と言語入力を処理し、自己と目標のローカライゼーションを実行する。
Astra-Localは、ローカルパス計画とオドメトリー推定を処理する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:08:47 GMT)
3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model [40.7] 主な理由は、ロボットの操作スキルを教えるための、大きく均一なデータセットがないことだ。
現在のロボットデータセットは、単純なシーン内で異なるアクション空間でロボットのアクションを記録することが多い。
我々は人間とロボットの操作データから3次元フローワールドモデルを学ぶ。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:00:31 GMT)
A Survey on Sparse Autoencoders: Interpreting the Internal Mechanisms of Large Language Models [40.7] 大規模言語モデル(LLM)は自然言語処理を変換しているが、その内部メカニズムはほとんど不透明である。
機械的解釈性は、LLMの内部動作を理解する手段として、研究コミュニティから大きな注目を集めている。
スパースオートエンコーダ(SAE)は、LLM内の複雑な重畳された機能をより解釈可能なコンポーネントに分解する能力のために、将来性のある方法として登場した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:26:10 GMT)
Exploring Dark Knowledge under Various Teacher Capacities and Addressing Capacity Mismatch [40.4] 本論文は,異なる能力を持つ教師が提供する暗黒の知識を深く掘り下げるものである。
我々は、誤った階級の区別が暗黒知識の本質を具現化していると論じる。
より大きく、より正確な教師は、より小さな教師に比べて教育能力を損なう、この区別が欠けている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:16:47 GMT)
Enhancing Orthopox Image Classification Using Hybrid Machine Learning and Deep Learning Models [40.3] 本稿では、機械学習モデルと事前訓練されたディープラーニングモデルを組み合わせて、拡張データを必要とせずに、深い特徴表現を抽出する。
その結果, この特徴抽出法は, 最先端技術における他の手法と組み合わせることで, 優れた分類結果が得られることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:52:07 GMT)
VideoChat-A1: Thinking with Long Videos by Chain-of-Shot Reasoning [40.1] VideoChat-A1は、新しい長編ビデオエージェントパラダイムである。
長いビデオでは、明確な連鎖推論パラダイムを通じて深く考えることができる。
ショットチェーンに沿ったマルチモーダル推論によって、VideoChat-A1はステップバイステップの人間の思考プロセスを効果的に模倣することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:58:31 GMT)
Reflect-then-Plan: Offline Model-Based Planning through a Doubly Bayesian Lens [39.9] RefPlanは2つのベイズ的オフラインモデルベース(MB)プランニングアプローチである。
ベイズの後続推定として計画を再キャストすることで、不確実性モデリングとMB計画を統合する。
これにより、保守的なオフラインRLポリシーのパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:40:12 GMT)
Optimal absorption and emission of itinerant fields into a spin ensemble memory [39.7] この研究はスピンベースの量子メモリに焦点をあて、そこでは反復電磁場が大きなアンサンブルに格納される。
我々は吸収過程と放出過程の両方を記述するカスケード量子モデルを開発した。
超伝導量子プロセッサと相互作用するマイクロ波量子メモリの文脈で数値シミュレーションを行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:16:54 GMT)
carps: A Framework for Comparing N Hyperparameter Optimizers on M Benchmarks [39.2] carpsはComprehensive Automated Research Performance Studiesのベンチマークフレームワークである。
我々は、ブラックボックス、マルチオブジェクト、マルチオブジェクト、マルチオブジェクトの4つの重要なタイプのHPOタスクに焦点をあてる。
5つのコミュニティベンチマークコレクションから336のタスクと28種類の9つのファミリーで、私たちはこれまでで最大のGotoライブラリを提供しています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:01:39 GMT)
RNE: a plug-and-play framework for diffusion density estimation and inference-time control [39.1] Radon-Nikodym Estimator (RNE) は拡散時間密度推定と制御のための柔軟なプラグアンドプレイフレームワークである。
RNEは、様々な既存の密度推定と推論時間制御を接続し、統一する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:32:14 GMT)
Visualizing, Rethinking, and Mining the Loss Landscape of Deep Neural Networks [39.0] 本稿では,v-basin,v-side,w-basin,w-peak,vv-basin曲線を含む1次元曲線を単純から複雑に体系的に分類する。
観測されたいくつかの興味深い現象を説明するために,ヘッセン行列のレンズからの理論的洞察を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:59:59 GMT)
Aerial Multi-View Stereo via Adaptive Depth Range Inference and Normal Cues [39.0] 本稿では,多視点深度推定精度を向上させるための適応深度MVS(ADR-MVS)を提案する。
ADR-MVSは、クロスアテンション離散性学習を用いて、深さと正規推定値から適応範囲マップを生成する。
実験により,ADR-MVSはWHU,LuoJia-MVS,M"unchenデータセット上で最先端の性能を実現することが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:14:55 GMT)
Generalizable LLM Learning of Graph Synthetic Data with Reinforcement Learning [38.5] 本稿では、グラフ合成データの一般化可能な学習を強化学習で解き放つことを提案する。
まず、合成グラフ問題に対するソリューションベースおよびプロセスベース報酬を設計する。
実験により、我々のRLレシピは5つのデータセットに対して統計的に有意な改善をもたらすことが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:55:21 GMT)
SIGMA: Refining Large Language Model Reasoning via Sibling-Guided Monte Carlo Augmentation [38.4] Monte Carlo Tree Searchは、高品質な連鎖データを生成するための強力なテクニックである。
従来の手法では、探索木から上位の軌道のみを保持するのが一般的である。
我々は,これら捨てられた兄弟ノードを再統合し,LSM推論を洗練するための新しいフレームワークであるSIGMAを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:55:16 GMT)
Fixing It in Post: A Comparative Study of LLM Post-Training Data Quality and Model Performance [38.4] 我々は、Tulu-3-SFT-MixとSmolTalkという2つの著名なオープントレーニング後のデータセットを総合的に分析した。
構造的および質的な類似点と2つのデータセットの違いを明らかにする統計を導出する。
我々の発見は、より効果的なトレーニング後のデータセットを構築するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:34:06 GMT)
Subspecialty-Specific Foundation Model for Intelligent Gastrointestinal Pathology [38.3] Digepathは、GI病理学の専門的な基礎モデルである。
GI疾患の210,043枚のH&E画像から3億3300万枚以上のマルチスケール画像に事前トレーニングされている。
GI病理に関連する34のタスクのうち33のタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:39:32 GMT)
What Really is a Member? Discrediting Membership Inference via Poisoning [38.2] メンバシップ推論テストは、特定のデータポイントが言語モデルのトレーニングセットに含まれるかどうかを決定することを目的としている。
近年の研究では、このようなテストは正確なマッチングに基づいて厳密なメンバーシップ定義の下で失敗することがしばしば示されている。
テストがターゲットポイントの誤った予測を発生させるような方法で、トレーニングデータセットに毒を与えることが可能である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:48:56 GMT)
Seeing like a Cephalopod: Colour Vision with a Monochrome Event Camera [37.9] セファロポッドは1種類の光受容体を持つにもかかわらず、独特の色の識別能力を示す。
我々は、この生物学的メカニズムから着想を得て、ボールレンズとイベントベースのカメラを組み合わせたスペクトルイメージングシステムを設計する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:40:05 GMT)
Reinforcement Learning Optimization for Large-Scale Learning: An Efficient and User-Friendly Scaling Library [37.8] ROLLは、コスト効率が高くフォールトトレラントな大規模トレーニングを目指す技術パイオニア、トレーニングに対する柔軟なコントロールを必要とする開発者、アジャイル実験を求める研究者の3つの主要なユーザグループを対象とする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:33:56 GMT)
Bootstrapping World Models from Dynamics Models in Multimodal Foundation Models [37.8] 我々は動的モデルを用いて、合成データと推論時間検証を用いて世界モデルをブートストラップする。
GPT4o-as-judgeによると、我々の最良のモデルは、最先端の画像編集モデルと性能を競い合っており、実世界のサブセットでは15%のマージンで改善されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:50:18 GMT)
Tackling Feature and Sample Heterogeneity in Decentralized Multi-Task Learning: A Sheaf-Theoretic Approach [37.5] We introduced a novel sheaf-theoretic-based approach for Federated Multi-task Learning (FMTL)
セルラーシーブを用いてクライアント関係を表現することにより、不均一なクライアントモデル間の相互作用を柔軟にモデル化することができる。
本稿では,提案アルゴリズムであるSheaf-FMTLが,最先端の分散化FMTLアルゴリズムと一致してサブ線形収束率を達成することを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:16:44 GMT)
Opt-Out: Investigating Entity-Level Unlearning for Large Language Models via Optimal Transport [37.2] 大規模言語モデルは不注意にも、ユーザに対してプライベートで機密性の高い情報を開示する。
最適なトランスポートベースのアンラーニング手法であるOpt-Outを導入する。
また、最初のエンティティレベルの未学習データセットも提示する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:08:20 GMT)
Diving into Self-Evolving Training for Multimodal Reasoning [36.7] 自己進化的トレインは複雑な推論タスクの鍵となるアプローチとして登場した。
本稿では,強化学習のレンズによるマルチモーダル推論のための自己進化学習を再構成する。
M-STARは、様々なサイズと多様なベンチマークのモデル間で一貫したパフォーマンス向上を実現するフレームワークである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:36:59 GMT)
Certification for Differentially Private Prediction in Gradient-Based Training [36.7] 非私的モデルの出力にノイズを加えることによって、差分プライバシーが達成されるプライベート予測について検討する。
既存の方法は、モデルのグローバルな感度に比例したノイズに依存しており、多くの場合、プライベートトレーニングと比較して、準最適プライバシーユーティリティトレードオフをもたらす。
本稿では,凸緩和法と有界伝播法を利用して,データセット固有の上限値の予測感度を計算するための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:37:51 GMT)
Corrector Sampling in Language Models [36.6] 我々はResample-Previous-Tokens (RPT)と呼ばれる新しいサンプリング手法を提案する。
RPTは、以前生成されたテキストのウィンドウでトークンを反復的に再検討し、潜在的に置き換えることでエラーの蓄積を緩和する。
事前訓練された8Bパラメータモデルを100BのRTTで微調整すると、推論とコーディングのベンチマークで10%の改善が得られた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:21:35 GMT)
MIRIAD: Augmenting LLMs with millions of medical query-response pairs [36.3] 医療用QAペア5,821,948の大規模キュレートコーパスであるMIRIADを紹介する。
また,MIRIADの精度はRAGベースラインに比べて6.7%向上した。
56の医学分野にまたがるMIRIADのインタラクティブマップであるMIRIAD-Atlasについても紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:52:32 GMT)
Optimal Rates in Continual Linear Regression via Increasing Regularization [36.3] 本研究では,ランダムなタスク順序付けの下での連続線形回帰について検討する。
この設定では、$k$学習後の最悪の損失は、$Omega (1/k)$の低いバウンドを認める。
明示的等方的$ell$正則化と有限ステップ予算による暗黙的正則化という2つのよく使われる正則化スキームを用いる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:51:14 GMT)
C-SEO Bench: Does Conversational SEO Work? [36.0] 大規模言語モデル (LLM) は,検索エンジンを会話型検索エンジン (CSE) に変換する。
C-SEO Benchは、複数のタスク、ドメイン、アクター数にまたがるC-SEOメソッドを評価するために設計された最初のベンチマークである。
文献で報告された結果とは対照的に,現在のC-SEO法はほとんど無効果であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:49:49 GMT)
Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision [35.8] エゴセントリック(第一人)とエゴセントリック(第三人)の両方の観点から世界を認識することは、人間の認知に不可欠である。
本稿では,エキソセントリックな視点とエゴセントリックな視点の両方から,映像理解のレビューを行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:25:48 GMT)
On the Query Complexity of Verifier-Assisted Language Generation [35.4] 本研究では,事前学習した言語モデル生成器を用いて制約付き生成を推論するフレームワークを開発する。
検証者へのアクセスは、難解な問題(情報理論上または計算上)を、難解な問題にレンダリングすることができる。
トークンワイド・リジェクション・サンプリングのような単純なアルゴリズムでさえ、検証器へのアクセスによる大きなメリットを享受できることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:45:58 GMT)
Membership Inference Attacks for Unseen Classes [35.2] 本研究では,サブクラス全体へのアクセスが不可能な会員推論攻撃について検討する。
シャドーモデル攻撃の性能は壊滅的に低下することを示す。
次に、同じ制限を持たない別のアプローチ、量子回帰の可能性を実証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:27:52 GMT)
Cavity-Quantum Electrodynamics with Moiré Flatband Photonic Crystals [35.1] 量子ドットは、42 psから1692 psまでの40の因子で調整できるが、これは強いパーセルの増強とパーセルの阻害効果に起因する。
我々の発見は、量子インターネットアプリケーションのための量子光源、量子光スイッチ、量子ノードのムーアのフラットバンド化への道を開いた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:23:26 GMT)
Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models [35.1] 大規模言語モデルにおける抽象的推論を支援する内部メカニズムについて検討する。
抽象的推論を3つの計算で実装した創発的シンボリックアーキテクチャを同定する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:23:34 GMT)
FADE: Frequency-Aware Diffusion Model Factorization for Video Editing [34.9] FADEはトレーニングなしだが、非常に効果的なビデオ編集手法である。
本稿では,各コンポーネントの役割を最適化するための因子化戦略を提案する。
実世界のビデオ実験により,我々の手法は高品質で現実的で時間的に整合した編集結果を一貫して提供することを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:00:39 GMT)
TracLLM: A Generic Framework for Attributing Long Context LLMs [34.8] 我々は,長期LLMに適した最初の汎用コンテキストトレースバックフレームワークであるTracLLMを開発した。
我々のフレームワークは、既存の特徴属性手法の有効性と効率を向上させることができる。
評価の結果,TracLLMはLLMの出力に繋がる長い文脈でテキストを効果的に識別できることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:32:31 GMT)
Simple Yet Effective: Extracting Private Data Across Clients in Federated Fine-Tuning of Large Language Models [34.4] FedLLMs(FedLLMs)のフェデレートされた微調整は、機密ドメインにおけるデータのプライバシを保ちながら、強力なモデルパフォーマンスを達成するための有望なアプローチを示す。
本稿では,FedLLMに特化して設計された簡易かつ効果的な抽出攻撃アルゴリズムを提案する。
実験結果から,最も脆弱なカテゴリーは,被害者排他的PIIの56.57%,"Address","Birthday","Name"であった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:13:29 GMT)
Cartridges: Lightweight and general-purpose long context representations via self-study [34.0] 大規模な言語モデルは、大きなテキストコーパスに埋もれたクエリに答えるためにしばしば使用される。
本研究では,コーパスに関する合成会話を生成し,文脈蒸留目的のカートリッジを訓練する学習レシピを提案する。
自己学習で訓練したCartridgesは、ICLの機能を複製するが、提供コストはかなり安い。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:48:23 GMT)
Benchmarking and Improving Large Vision-Language Models for Fundamental Visual Graph Understanding and Reasoning [33.9] LVLM(Large Vision-Language Models)は、様々なタスクにまたがる顕著な性能を示す。
近年の研究では、LVLMは視覚グラフに係わる際にかなりの制限を受けることが示されている。
LVLMの基本的グラフ理解と推論能力を調べるための22のタスクをカバーするベンチマークであるVGCureを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:41:46 GMT)
Efficient Diffusion Models: A Survey [33.6] 拡散モデルは高品質なコンテンツを生成できる強力な生成モデルとして登場してきた。
これらの能力は、重要な計算資源と長い生成時間のコストがかかる。
本稿では,効率的な拡散モデルの研究を体系的かつ包括的にレビューする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:57:09 GMT)
Exactly solvable models for fermionic symmetry-enriched topological phases and fermionic 't Hooft anomaly [33.5] 過去10年間で、対称性に富んだ位相(SET)位相の概念が提案され、その分類はボゾン系に対して体系的に研究されてきた。
格子モデルにおけるこれらのフェルミオンSET(fSET)相をどうやって実現するかは、難しい問題である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:16:52 GMT)
When to Trust Context: Self-Reflective Debates for Context Reliability [32.8] SR-DCR(Self-Reflective Debate for Contextual Reliability)は、トークンレベルの自信と非対称なマルチエージェントの議論を統合する軽量フレームワークである。
ClashEvalベンチマークの実験では、SR-DCRは信頼に値する入力の精度を維持しながら、一貫してロバスト性を高めることが示されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:09:34 GMT)
Not All Rollouts are Useful: Down-Sampling Rollouts in LLM Reinforcement Learning [32.6] PODSは多数のロールアウトを並列に生成し、情報サブセットのみをトレーニングし、更新コストを削減しながら学習信号を保存する。
我々は最大分散ダウンサンプリングでPODSをインスタンス化し、これは報酬の多様性を最大化し、$O(nlog n)$解を許容する原理的な基準である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:25:59 GMT)
Generalized Incremental Learning under Concept Drift across Evolving Data Streams [32.6] 実世界のデータストリームは、概念の漂流を特徴とする固有の非定常性を示し、適応学習システムにとって重要な課題となっている。
我々は,GILCD (Generalized Incremental Learning under Concept Drift) を定式化し,オープン環境ストリーミング環境における分布空間とラベル空間の連成進化を特徴付ける。
本稿では,新しいプロトタイプをベース表現と融合させ,新しいクラス識別を安定的に実現するCalibrated Source-Free Adaptation (CSFA)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:36:24 GMT)
TT-Occ: Test-Time Compute for Self-Supervised Occupancy via Spatio-Temporal Gaussian Splatting [32.6] 自己監督型3D占有予測は、コストのかかる3Dアノテーションを必要とせずに、シーンの運転を理解するための有望なソリューションを提供する。
TT-Occと呼ばれる実用的で柔軟なテストタイム占有予測フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:21:31 GMT)
PoisonBench: Assessing Large Language Model Vulnerability to Data Poisoning [32.5] 我々は、好み学習中のデータ中毒に対する大規模言語モデルの感受性を評価するためのベンチマークであるPoisonBenchを紹介する。
データ中毒攻撃は、隠れた悪意のあるコンテンツやバイアスを含むために、大きな言語モデルレスポンスを操作することができる。
8つの現実的なシナリオに2つの異なる攻撃タイプをデプロイし、21の広く使用されているモデルを評価します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:12:20 GMT)
Diversity Explains Inference Scaling Laws: Through a Case Study of Minimum Bayes Risk Decoding [32.0] 推論手法は大規模言語モデル(LLM)の性能を引き出す上で重要な役割を果たす
現在、LLMは生成した複数のサンプルを利用した推論手法を使用しており、最小ベイズリスク(MBR)復号から導出することができる。
従来,MBR復号化による生成性能の向上を実証的に検討してきた。
我々は、バイアス-多様性分解の観点から、MBR復号の新たな理論的解釈を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:14:03 GMT)
Multi-Agent Collaboration via Cross-Team Orchestration [31.5] 大規模言語モデル(LLM)は、特に組織化された自律エージェントを通じて、様々なドメインに大きな影響を与えている。
これはスケーラブルなマルチチームフレームワークで、オーケストレーションされたチームはさまざまなタスク指向のソリューションを共同で提案できる。
実験では、最先端のベースラインと比較して、ソフトウェアの品質が顕著に向上している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:45:40 GMT)
Constrained Sampling for Language Models Should Be Easy: An MCMC Perspective [31.4] 制約付き復号化により、言語モデルは、確実に厳しい制約を満たすサンプルを作成することができる。
既存の制約付きデコードアプローチは、基礎となるモデル分布を歪ませる。
我々はマルコフ・チェイン・モンテカルロに基づく新しい制約付きサンプリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:28:20 GMT)
DesignBench: A Comprehensive Benchmark for MLLM-based Front-end Code Generation [31.2] MLLM(Multimodal Large Language Models)は、フロントエンドの自動化において顕著な機能を示す。
DesignBenchは、自動フロントエンドエンジニアリングにおけるMLLMの機能を評価するためのベンチマークである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:21:21 GMT)
Where is the signal in tokenization space? [31.0] 大規模言語モデル (LLM) は通常、テキストを決定論的に標準的なトークンシーケンスにエンコードするトークン化器を伴って出荷される。
本稿では,非標準トークン化について検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:17:50 GMT)
One Stone, Two Birds: Enhancing Adversarial Defense Through the Lens of Distributional Discrepancy [30.5] 統計的逆データ検出(SADD)は、次のバッチが逆データ例(AE)を含むかどうかを検出する
本稿では,DAD(Distributal-discrepancy-based Adversarial Defense)という2段階の対角防御手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:10:48 GMT)
CAPability: A Comprehensive Visual Caption Benchmark for Evaluating Both Correctness and Thoroughness [30.4] CAPabilityは、6つの重要なビューにまたがる12次元にわたる視覚的キャプションを評価するための総合的なベンチマークである。
我々は、生成したキャプションを評価するために、視覚要素アノテーションで1万1千近い人注画像や動画をキュレートした。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:23:02 GMT)
Reconstructing Heterogeneous Biomolecules via Hierarchical Gaussian Mixtures and Part Discovery [30.2] クライエミクス(Cryo-EM)は、分子生物学において、非常にノイズの多い2次元電子顕微鏡画像から原子分解能で3次元分子構造を推定するための計算手法である。
階層型ガウス混合モデルを用いた新しい3次元再構成フレームワークを提案する。
特に、モデルの構造は粒子の部分的分割を推論する初期過程に基礎を置いており、コンフォメーションと組成のばらつきの両方を扱うために必須な帰納的バイアスを与える。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:38:54 GMT)
Generating Long Semantic IDs in Parallel for Recommendation [30.0] セマンティックIDベースのリコメンデーションのための軽量フレームワークであるRPGを提案する。
我々は、マルチトークン予測損失を用いて、各トークンを独立して予測するようにモデルを訓練する。
実験の結果、セマンティックIDの長さを64にスケールアップすることで、RPGは生成ベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:20:37 GMT)
Pseudo Relevance Feedback is Enough to Close the Gap Between Small and Large Dense Retrieval Models [29.9] 大規模言語モデル (LLM) のバックボーンに高密度レトリバーを拡張させることは, 検索効率を向上させる主要な戦略である。
本稿では,機能ベースの擬似関連フィードバック(PRF)フレームワークであるPromptPRFを紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:23:25 GMT)
Topology of Reasoning: Understanding Large Reasoning Models through Reasoning Graph Properties [29.5] 本稿では,各推論ステップで隠れ状態表現をクラスタリングすることで抽出した推論グラフの概念を紹介する。
複数のタスクにまたがる巡回性、直径、小世界指数の3つの重要なグラフ理論特性を解析する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:05:11 GMT)
Reinforcing Code Generation: Improving Text-to-SQL with Execution-Based Learning [29.1] 大規模言語モデル(LLM)を用いたコード生成の問題点について検討する。
RL-tuningは、問合せペアの形で弱い監督しか行わず、モデル生成sql符号の精度を31.49から49.83に改善し、誤り率を25.43%から14.71%に下げる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:52:41 GMT)
SeedEdit 3.0: Fast and High-Quality Generative Image Editing [29.1] 我々は,私たちのT2IモデルであるSeedream 3.0とともにSeedEdit 3.0を紹介します。
メタインフォパラダイムとメタインフォ埋め込み戦略を用いた拡張データキュレーションパイプラインを開発した。
テストベンチマークでSeedEdit 3.0を評価し、実/合成画像編集を行い、複数の面のトレードオフを最大限に達成し、56.1%のユーザビリティを実現した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:18:12 GMT)
Comprehensive Vulnerability Analysis is Necessary for Trustworthy LLM-MAS [28.7] 大規模言語モデルに基づくマルチエージェントシステム (LLM-MAS) は、ハイテイクなアプリケーションにますます多くデプロイされている。
LLM-MASは、エージェント間通信、信頼関係、ツール統合を通じて、ユニークな攻撃面を導入している。
本稿では,多様な研究を統一するLSM-MASの脆弱性解析のための体系的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:01:06 GMT)
MINT: Multimodal Instruction Tuning with Multimodal Interaction Grouping [28.7] 我々は,マルチモーダルインタラクションのタイプに基づいた,シンプルながら驚くほど効果的なタスクグループ化戦略であるMINTを紹介する。
提案手法は,マルチモーダル命令チューニングにおいて,既存のタスクグループ化ベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:40:20 GMT)
Efficient and Direct Duplex Modeling for Speech-to-Speech Language Model [28.4] 本稿では,連続的なユーザ入力とチャネル融合を伴うエージェント出力を特徴とする,新しい2重音声合成(S2S)アーキテクチャを提案する。
ユーザ入力に事前トレーニングされたストリーミングを使用することで、音声事前トレーニングを必要とせずに、第1の二重S2Sモデルを実現できる。
実験結果から,提案モデルが従来の2次モデルよりも,推論,ターンテイク,バージイン能力に優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:56:54 GMT)
DynamicMind: A Tri-Mode Thinking System for Large Language Models [28.3] DynamicMindは、大規模言語モデルのための新しい三モード思考システムである。
ゼロショットの質問応答タスクに対して,高速,正常,スローの思考モードを自律的に選択する。
性能と計算効率の効果的なトレードオフを確立しつつ、優れたZSQA機能を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:02:13 GMT)
Transformative or Conservative? Conservation laws for ResNets and Transformers [28.3] 本稿では,近代建築の保全法則の導出と解析により,そのギャップを埋める。
まず、ReLU(あるいは線形)浅層ネットワークのような基本構造ブロックは、畳み込みの有無にかかわらず、容易に保存則を表現できることを示す。
次に、パラメータのサブセットにのみ依存する保存法則の概念を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:53:35 GMT)
MimeQA: Towards Socially-Intelligent Nonverbal Foundation Models [27.9] 非言語的なソーシャルインタラクションに富んだ、新しいデータソースをタップします。
我々は、YouTubeから8時間分のビデオクリップをソーシングすることで得られる、MimeQAという新しいデータセットをコントリビュートする。
最新のビデオ大言語モデル(vLLMs)を評価し,20~30%の精度で精度が低く,86%の人が得点した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:32:53 GMT)
VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters [27.8] 本稿では,リッチで高品質な自然画像からTSFファンデーションモデルを構築するための新しい道を探る。
画像再構成タスクとしてTSFを再構成することにより、画像事前学習とTSF下流タスクのギャップを埋める。
提案されたVisionTSは、既存のTSFファンデーションモデルよりもゼロショット予測性能が向上する可能性がある。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:46:28 GMT)
Synthetic Text Generation for Training Large Language Models via Gradient Matching [27.7] 合成可読テキストを生成するための理論的に厳密な最初のアプローチを提案する。
合成例の埋め込みを反復的に最適化するために, Alternating Direction Method of Multipliers (ADMM) を利用する。
生成した合成テキストは、実際のデータを微調整して得られた解の近傍にモデルを収束させることを保証している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:43:38 GMT)
Unlocking Recursive Thinking of LLMs: Alignment via Refinement [27.7] 大規模言語モデルの可能性を解き明かす新しい手法であるtextbfAvR: textbfAlignment via Refinementを提案する。
LLaMA-3-8B-インストラクトモデルの性能をAlpacaEval 2.0で20%以上向上させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:54:06 GMT)
Reasoning Through Execution: Unifying Process and Outcome Rewards for Code Generation [27.5] 大規模言語モデルはコード生成に優れていますが、推論を必要とする複雑なプログラミングタスクに苦労します。
本稿では,実行可能検証を活用することで,プロセスと結果の監視を統一するアウトカム・リフィニング・プロセス・スーパービジョンを紹介する。
5つのモデルと3つのベンチマークによる実験では、26.9%の精度でコード効率が42.2%向上した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:13:42 GMT)
DyGMamba: Efficiently Modeling Long-Term Temporal Dependency on Continuous-Time Dynamic Graphs with State Space Models [27.0] 連続時間動的グラフ(CTDG)の学習モデルであるDyGMambaを提案する。
DyGMambaは、ほとんどのケースで最先端を実現していることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:57:10 GMT)
Multidimensional Adaptive Coefficient for Inference Trajectory Optimization in Flow and Diffusion [26.9] フローモデルと拡散モデルは、様々なタスクにおいて強い性能と訓練安定性を示してきた。
フローおよび拡散モデルのためのプラグインモジュールである多次元適応係数(MAC)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:50:49 GMT)
Deconfounding Multi-Cause Latent Confounders: A Factor-Model Approach to Climate Model Bias Correction [26.7] 地球温暖化モデル(GCM)は、地球系をシミュレートすることで、将来の気候変動を予測するのに不可欠である。
GCMは、モデルの不確実性、パラメータ化の単純化、複雑な気候現象の不十分な表現による体系的なバイアスを示す。
本稿では,GCMと観測データの両方を利用する新しいバイアス補正手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:23:17 GMT)
Progressive Data Dropout: An Embarrassingly Simple Approach to Faster Training [26.7] ハードデータマイニングとドロップアウトの洞察を活用するための,代替的なトレーニングパラダイムを提案する。
提案されたプログレッシブデータドロップアウトは、有効エポックの数をベースラインの12.4%に削減する。
驚くべきことに,提案手法は最大4.82%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:56:50 GMT)
Alternating Gradient Flows: A Theory of Feature Learning in Two-layer Neural Networks [26.6] 本稿では,ニューラルネットワークにおける特徴学習のダイナミクスを記述するアルゴリズムフレームワークであるAlternating Gradient Flows (AGF)を紹介する。
AGFは、動作を交互に2段階のプロセスとして近似する: 休眠ニューロン上のユーティリティ関数を最大化し、アクティブなニューロンに対するコスト関数を最小化する。
AGFを2次ネットワークに適用してモジュラー加算を訓練し、トレーニング力学の完全な特徴付けを行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:29:13 GMT)
Bridging Annotation Gaps: Transferring Labels to Align Object Detection Datasets [26.6] Label-Aligned Transfer Proposal (LAT)は、さまざまなソースデータセットからのアノテーションをターゲットラベル空間に体系的にプロジェクションする。
LATは目標領域検出性能を一貫した改善し、半教師付きベースラインよりも最大4.8APのゲインを得る。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:12:59 GMT)
GRASP: Replace Redundant Layers with Adaptive Singular Parameters for Efficient Model Compression [26.5] 本稿では,新しい圧縮フレームワークGRASP(Gradient-based Retention of Adaptive Singular Parameters)を提案する。
冗長なレイヤを最小限のパラメータセットで置き換えることによって、GRASPは、最小限のオーバーヘッドで強力なパフォーマンスを維持しながら、効率的な圧縮を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:26:26 GMT)
LlavaGuard: An Open VLM-based Framework for Safeguarding Vision Datasets and Models [26.1] LlavaGuardはVLMベースの視覚保護装置のスイートで、大規模データとモデルの時代における信頼性の高いガードレールの必要性に対処する。
VLMセーフガードの安全性を教えるために,高品質なヒューマンエキスパートアノテーションを用いたマルチモーダル安全データセットを作成する。
0.5Bから7BまでのLlavaGuardモデルは、フレキシブルポリシーに対するビジュアルコンテンツの安全性コンプライアンスを評価する汎用ツールとして機能する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:08:12 GMT)
Context is Gold to find the Gold Passage: Evaluating and Training Contextual Document Embeddings [26.0] 本研究では,文書ワイドコンテキストを利用した検索モデルの評価を行うためのベンチマークであるConTEBを紹介する。
以上の結果から,最先端の埋め込みモデルは,コンテキストが必要な検索シナリオで苦労していることがわかった。
InSeNTは、遅延チャンキングプーリングと組み合わせることで文脈表現学習が促進される、新しい対照的なポストトレーニング手法である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:42:11 GMT)
Graph Deep Learning for Time Series Forecasting [25.9] グラフベースの予測器は、時系列コレクションにまたがるグラフの予測を条件付けすることで、ペアワイズな関係を利用する。
本チュートリアルでは,予測問題を形式化し,グラフベースの予測器の設計原理を提供する包括的方法論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:55:23 GMT)
Runtime Analysis of Evolutionary NAS for Multiclass Classification [25.7] 1+1)-ENASアルゴリズムを1ビットおよびビットワイズで検討し、期待されるランタイム上の上限と下限を解析する。
両変異を用いたアルゴリズムは、期待実行時上限の$O(rMlnrM)$と下位境界の$Omega(rMlnM)$との最適値を求めることができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:09:30 GMT)
When to use Graphs in RAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation [25.5] グラフ検索強化世代(GraphRAG)は、外部知識で大規模言語モデル(LLM)を拡張するための強力なパラダイムとして登場した。
最近の研究では、GraphRAGは多くの現実世界のタスクにおいてバニラRAGを過小評価している。
GraphRAGは本当に有効か、グラフ構造がRAGシステムに測定可能なメリットを提供するシナリオは存在するのか?
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:37:47 GMT)
Breaking the Gaussian Barrier: Residual-PAC Privacy for Automatic Privatization [25.4] 本稿では,逆推定後に残るプライバシを定量化する f-divergence ベースの尺度である Residual PAC Privacy を紹介する。
また,最適な雑音分布を選択するゲーム理論であるRPACプライバシーのための,Stackelberg Residual-PAC(SR-PAC)の民営化機構を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:52:47 GMT)
Mitigating Catastrophic Forgetting with Adaptive Transformer Block Expansion in Federated Fine-Tuning [25.1] 大規模言語モデル(LLM)のFedFT(Federated Fine-tuning)は、分散データ環境にモデルを適用するための有望なソリューションとして登場した。
適応型トランスフォーマーブロック拡張機構と動的トレーニング可能なブロック割り当て戦略を統合した新しいFedFTフレームワークであるFedBEを提案する。
その結果、FedBEは、下流タスクの精度を劣化させることなく、微調整後の一般タスクにおける12~74%の精度保持と1.9~3.1xのモデル収束促進比を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:59:11 GMT)
On Measuring Long-Range Interactions in Graph Neural Networks [25.0] 長距離グラフタスクは、グラフニューラルネットワーク研究においてオープンな問題である。
グラフ上の演算子に対するレンジ測度を導入し、合成実験により検証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:48:30 GMT)
Maximum Entropy Reinforcement Learning with Diffusion Policy [24.9] 本稿では,MaxEnt RLの目的を満たすためのポリシー表現として,複雑なマルチモーダル分布をキャプチャ可能な強力な生成モデルである拡散モデルを用いる。
提案手法により,効率的な探索が可能となり,最適なMaxEntポリシーに近づいた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:54:29 GMT)
An Optimized Franz-Parisi Criterion and its Equivalence with SQ Lower Bounds [24.1] 統計的検出問題において,Franz-Parisi基準を最適化し,計算ハードフェーズを特徴付ける。
この等価性は、幅広い統計モデルによって満たされる穏やかな仮定の下で成り立つ。
我々の同値性は、いくつかの既知の SQ の下界の導出を統一し、単純化する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:39:32 GMT)
ExAct: A Video-Language Benchmark for Expert Action Analysis [24.0] ExActは、熟練した身体活動のエキスパートレベルの理解のためのビデオ言語ベンチマークである。
これには、6つのドメインで11の身体活動にまたがる3521人の専門家によるビデオ質問応答ペアが含まれている。
最高性能のGPT-4oモデルは44.70%の精度しか達成せず、訓練された専門家や専門家が達成した82.02%を大きく下回っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:58:51 GMT)
State-Covering Trajectory Stitching for Diffusion Planners [23.9] State-Covering Trajectory Stitching (SCoTS)は、短いトラジェクトリセグメントを縫合する報酬のないトラジェクトリ拡張法である。
SCoTSは,オフラインの目標条件付きベンチマーク上での拡散プランナの性能と一般化能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:08:55 GMT)
Differentiable Quadratic Optimization For The Maximum Independent Set Problem [23.6] pCQO-MISはグラフ内の数ノードでのみスケールし、数値エッジではないことを示す。
実験により,提案手法の有効性を,精度,サンプリング,データ中心アプローチと比較した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:39:00 GMT)
Optimizing Recall or Relevance? A Multi-Task Multi-Head Approach for Item-to-Item Retrieval in Recommendation [23.6] 本稿では,ハイリコールとセマンティック関連性を両立するマルチタスクとマルチヘッドI2I検索モデルを提案する。
MTMHは数十億のユーザを対象とする商用プラットフォームのプロプライエタリなデータを用いて評価し、リコールを最大14.4%改善し、セマンティック関連性を最大56.6%向上させることができることを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:00:20 GMT)
The Canary's Echo: Auditing Privacy Risks of LLM-Generated Synthetic Text [23.4] 我々は、敵がLarge Language Models(LLMs)によって生成された合成データにアクセス可能であると仮定する。
我々は、データ合成に使用されるLPMを微調整するために使用されるトレーニングデータをターゲットに、メンバーシップ推論攻撃(MIA)を設計する。
モデルに基づくMIAのために作られたカナリアは、合成データのみを公開する場合、プライバシー監査のサブ最適化であることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:04:33 GMT)
Wavelet-based Disentangled Adaptive Normalization for Non-stationary Times Series Forecasting [23.3] 時系列予測における非定常性に対処するために、ウェーブレットに基づく不整合適応正規化(WDAN)を提案する。
WDANは離散ウェーブレット変換を用いて入力を低周波数トレンドと高周波変動に分解する。
複数のベンチマークの実験では、WDANは様々なバックボーンモデルにおける予測精度を一貫して改善している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:25:29 GMT)
Clone-Robust Weights in Metric Spaces: Handling Redundancy Bias for Benchmark Aggregation [23.3] 距離空間の要素の集合が与えられる。
要素の分布は任意であり、おそらく逆である。
このような操作に耐性のある方法で要素を重み付けできますか?
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:55:48 GMT)
TimeRecipe: A Time-Series Forecasting Recipe via Benchmarking Module Level Effectiveness [23.1] TimeRecipeはモジュールレベルで時系列予測メソッドを体系的に評価するフレームワークである。
TimeRecipeは、個々のコンポーネントの有効性を評価するために、1万以上の実験を行います。
以上の結果から,設計空間の徹底的な探索により,既存の最先端手法よりも優れたモデルが得られることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:11:48 GMT)
EASG-Bench: Video Q&A Benchmark with Egocentric Action Scene Graphs [23.1] EAS-GBenchは,エゴセントリックビデオの質問応答ベンチマークである。
本ベンチマークでは,複数の言語のみのビデオ大言語モデル(ビデオLLM)を評価した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:33:16 GMT)
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation [23.0] 本稿では,バッチ・ツー・グロバルマッチングにおける画像の多様性を高めるため,多様性駆動型早期学習(DELT)方式を提案する。
我々のアプローチは概念的には単純だが有効であり、事前に定義されたIPCサンプルを小さなサブタスクに分割し、局所的な最適化を用いる。
我々のアプローチは、異なるデータセットとIPC(クラスごとのイメージ)で平均2$sim$5%の先行技術よりも優れています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:05:04 GMT)
m-KAILIN: Knowledge-Driven Agentic Scientific Corpus Distillation Framework for Biomedical Large Language Models Training [23.0] バイオメディカルな大規模言語モデル(LLM)のためのコーパスヘッダーは、オープンソースの科学コーパスにおいて、不十分な量と品質のプレス課題に対処しようとしている。
本稿では, バイオメディカル領域におけるLLMトレーニングに適した, 科学的コーパス蒸留のための知識駆動型エージェントフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:07:21 GMT)
Laplace Transform Based Low-Complexity Learning of Continuous Markov Semigroups [23.0] 本稿ではマルコフ半群の無限小生成器(IG)のスペクトル分解を通してマルコフ過程を学習するためのデータ駆動型アプローチを提案する。
物理インフォームドカーネルレグレッションを含む既存の技術は計算コストが高く、スコープが限られている。
本稿では,移動演算子のラプラス変換を特徴とするIGの分解能を利用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:06:36 GMT)
ECoRAG: Evidentiality-guided Compression for Long Context RAG [22.8] Evidentiality-guided RAG (EcoRAG framework) を提案する。
ECoRAGは、明細度に基づいて検索した文書を圧縮することで、性能を向上させる。
ECoRAGはレイテンシを低減するだけでなく、トークンの使用を最小化するため、非常にコスト効率が高い。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:57:28 GMT)
BioMol-MQA: A Multi-Modal Question Answering Dataset For LLM Reasoning Over Bio-Molecular Interactions [22.8] BioMol-MQA データセットは (i) テキストと情報検索のための分子構造を持つマルチモーダル知識グラフ (KG) と (ii) マルチモーダル KG 上での検索と推論において LLM 機能をテストするために設計された課題からなる。
我々のベンチマークでは、既存のLLMはこれらの質問に答えるのに苦労しており、必要なバックグラウンドデータしか与えられていないことが示されており、強力なRAGフレームワークの必要性を示唆している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:48:22 GMT)
ZeroFlow: Overcoming Catastrophic Forgetting is Easier than You Think [22.3] 我々はZeroFlowを紹介した。ZeroFlowはグラデーションのない最適化アルゴリズムを設計した最初のベンチマークである。
以上の結果から,フォワードパスだけでは,忘れを軽減できる可能性が示唆された。
本稿では,フォワードパスのみを用いて,抵抗の忘れ方を改善する新しい拡張を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:00:41 GMT)
Training on Plausible Counterfactuals Removes Spurious Correlations [22.1] P-CFE (Plusible counterfactual explanations) は、入力を最小限に修正して分類器の決定を変更する摂動である。
本研究では,非摂動入力を分類するために,誘導的内向的ターゲットクラスをラベル付けしたp-CFEを用いて分類器を訓練できることを実証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:30:06 GMT)
Modality-Fair Preference Optimization for Trustworthy MLLM Alignment [22.1] MLLM(Multimodal large language model)は、様々なタスクにおいて顕著な成功を収めている。
しかし、視覚的エンコーダとテキスト的エンコーダの別個のトレーニングは、しばしばモダリティの誤った調整をもたらす。
これらの不正確さは、実世界の応用におけるMLLMの信頼性を著しく損なう。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:50:17 GMT)
Graph Neural Network Generalization with Gaussian Mixture Model Based Augmentation [22.0] 本稿では,Rademacher複雑性を用いた理論的枠組みを導入し,一般化誤差を計算した。
このフレームワークは、効率的なグラフデータ拡張アルゴリズムであるGRATINの設計を知らせる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:10:37 GMT)
SageAttention2++: A More Efficient Implementation of SageAttention2 [21.7] 本稿では,FP16に蓄積したFP8 Matmulの高速な命令を利用して,SageAttention2を高速化することを提案する。
実験によると、SageAttention2++は、SageAttention2と同じ注意精度を維持しながら、FlashAttentionよりも3.9倍のスピードアップを達成した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:47:22 GMT)
Unisoma: A Unified Transformer-based Solver for Multi-Solid Systems [21.7] 構造化モジュールによる固体変形に影響を及ぼす要因を組み込んだ,新しい明示的モデリングパラダイムを導入する。
具体的には,ソリッドの可変数の処理が可能な統一かつ柔軟なトランスフォーマーモデルであるUnisomaを提案する。
暗黙的なモデリング手法と比較して、明示的なモデリングは多様な結合パターンを持つマルチソリッドシステムに適している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:12:02 GMT)
LaDEEP: A Deep Learning-based Surrogate Model for Large Deformation of Elastic-Plastic Solids [21.7] 我々は,textbfElastic-textbfPlastic SolidsのtextbfLarge textbfDeformationのためのディープラーニングに基づく代理モデルであるLaDEEPを紹介する。
固体変形の物理的過程を特徴付けるため、2段トランスフォーマーベースのモジュールはトークン列を入力として変形を予測するように設計されている。
LaDEEPは有限要素法よりも5桁高速で、他のディープラーニングのベースラインと比べて平均20.47%向上している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:47:37 GMT)
SpargeAttention: Accurate and Training-free Sparse Attention Accelerating Any Model Inference [21.5] SpargeAttnは任意のモデルに対する普遍的スパースで量子化された注意である。
本手法は,エンドツーエンドのメトリクスを犠牲にすることなく,言語,画像,ビデオ生成などの多様なモデルを大幅に高速化する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:45:17 GMT)
Hierarchical and Collaborative LLM-Based Control for Multi-UAV Motion and Communication in Integrated Terrestrial and Non-Terrestrial Networks [21.4] 本研究は,複数のUAVの連立動作と通信制御を地球外ネットワークと非地球外ネットワークで行うことを目的としたものである。
大規模言語モデル(LLM)に基づく新しい階層的協調手法を提案する。
実験により,提案手法は, システム報酬の向上, 運用コストの低減, ベースライン手法と比較してUAV衝突率の大幅な低減を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:59:52 GMT)
Pegasus: A Universal Framework for Scalable Deep Learning Inference on the Dataplane [21.1] Pegasusは、ディープラーニング(DL)操作を3つのデータプレーン指向プリミティブに変換することで、分割、マップ、SumReduceという汎用性を実現する。
ペガサスは、平均精度を最大22.8%向上させ、248倍のモデルサイズと212倍の入力スケールで最先端のアプローチより優れている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:17:12 GMT)
Jacobian Sparse Autoencoders: Sparsify Computations, Not Just Activations [21.1] 本稿では,与えられたモデル成分の入力と出力のアクティベーションに空間性を生じるジャコビアンSAEと,それらを接続する計算(形式的にはジャコビアン)に空間性をもたらすヤコビアンSAEを提案する。
JSAEは,従来のSAEと同様,下流LLM性能を保ちながら,比較的広い範囲の計算空間を抽出することがわかった。
このことは、計算グラフの空間性が、LLMがトレーニングを通じて学習する特性であることを示すとともに、JSAEが標準のSAEよりも学習されたトランスフォーマー計算を理解するのに適していることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:10:03 GMT)
Come Together, But Not Right Now: A Progressive Strategy to Boost Low-Rank Adaptation [21.1] 低ランク適応(LoRA)は,大規模基盤モデルに適応するためのパラメータ効率の高い微調整手法として登場している。
微調整の過程でアダプタのアクティベーション確率を徐々に高めるプログレッシブトレーニング戦略であるCoToプルーニングを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:33:06 GMT)
LLMs on the Line: Data Determines Loss-to-Loss Scaling Laws [21.1] ロス・ツー・ロスのスケーリング法則は、事前トレーニングされたデータセットと下流タスク間の損失を関連付ける。
実験の結果,事前学習データとトークン化器がスケーリングの傾向を決定することがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:05:02 GMT)
Astraea: A GPU-Oriented Token-wise Acceleration Framework for Video Diffusion Transformers [21.0] ビデオ拡散変換器 (vDiT) は, テキスト・ビデオ生成において顕著な進歩を遂げているが, その高い計算要求は, 実用的展開において大きな課題を呈している。
本稿では,vDiTをベースとしたビデオ生成において,ほぼ最適設定を検索する自動フレームワークであるASTRAEAを紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:46:57 GMT)
FDLLM: A Dedicated Detector for Black-Box LLMs Fingerprinting [21.0] 大規模言語モデル(LLM)は、デジタルコンテンツ作成の風景を急速に変えつつある。
FD-Datasetは、20の有名なプロプライエタリおよびオープンソースLLMから90,000のテキストサンプルからなる総合的なバイリンガルフィンガープリントベンチマークである。
また,パラメータ効率の低いLow-Rank Adaptation (LoRA) を利用して基礎モデルの微調整を行う新しいフィンガープリント手法であるFDLLMを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:27:29 GMT)
MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding [20.8] MedXpertQAには17の専門分野と11の身体システムにまたがる4,460の質問が含まれている。
MMは、多様な画像と豊富な臨床情報を備えた専門家レベルの試験問題を導入する。
ベンチマークで18の先行モデルを評価した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:00:07 GMT)
DeformCL: Learning Deformable Centerline Representation for Vessel Extraction in 3D Medical Image [20.8] Deformable Centerlinesに基づいた新しい連続表現であるDeformCLを紹介する。
以前の表現と比較すると、DeformCLには3つの大きな利点がある。
本稿では,DeformCLのこれらの特性を完全に活用するために,包括的学習パイプラインをケースド方式で構築する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:33:34 GMT)
Causal Effect Identification in lvLiNGAM from Higher-Order Cumulants [20.8] 本稿では,高次累積を用いた線形非ガウス非巡回モデル (lvLiNGAM) における因果効果の同定について検討する。
因果効果が一つのプロキシや機器で識別可能であることを証明し、対応する推定方法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:46:59 GMT)
KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes [20.8] 104個の実世界のデータサイエンスパイプラインを手作業でキュレートしたベンチマークであるKRAMABENCHを紹介する。
これらのパイプラインは、データ処理におけるAIシステムのエンドツーエンド機能をテストする。
以上の結果から,既存のアウト・オブ・ボックスモデルでは,適切なデータサイエンスコード生成タスクを十分に解決できるが,既存のアウト・オブ・ボックスモデルでは不十分であることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:18:45 GMT)
SALVE: A 3D Reconstruction Benchmark of Wounds from Consumer-grade Videos [20.7] 本稿では,消費者向けビデオからの3次元創傷再建について述べる。
SALVEデータセットを導入し、異なるカメラで捉えた現実的な創傷ファントムのビデオ記録を含む。
我々は,従来のフォトグラメトリーパイプラインから高度なニューラルレンダリングアプローチまで,最先端の3次元再構成手法の精度と精度を評価する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:51:18 GMT)
BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning [20.6] B-spline Encoded Action Sequence Tokenizer (BEAST)について述べる。
BEAST は B-splines を用いて、アクションシーケンスをコンパクトな離散トークンまたは連続トークンにエンコードする。
BEASTは166のシミュレーションタスクと8つの実世界のタスクからなる3つの異なるロボット設定からなる3つの確立されたベンチマークで評価した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:26:16 GMT)
Approximating Latent Manifolds in Neural Networks via Vanishing Ideals [20.5] 我々は, 無限イデアルがディープネットワークの潜在多様体をいかに特徴付けるかを示すことによって, 多様体学習と計算代数学の関連性を確立する。
本稿では,中間層で事前学習されたネットワークを切断し,消滅するイデアルのジェネレータを介して各クラス多様体を近似するニューラルアーキテクチャを提案する。
得られたモデルは、トレーニング済みのベースラインよりも著しく少ないが、同等の精度を維持し、高いスループットを実現し、パラメータが少ない。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:33:50 GMT)
Synthetic Face Datasets Generation via Latent Space Exploration from Brownian Identity Diffusion [20.4] 我々は,大規模な合成顔データセットを生成することを目的とした,Langevin,Dispersion,DisCoという3つの補完アルゴリズムを導入する。
これを使って、顔データセットを複数生成し、顔認識モデルをトレーニングすることでそれらをベンチマークし、我々の方法で生成されたデータが、以前のGANベースデータセットのパフォーマンスを上回ることを示す。
拡散モデルはトレーニングデータを記憶するために示されるが、新しい合成データセットの漏洩を防止し、より責任のある合成データセットへの道を開く。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:01:04 GMT)
In Search of Forgotten Domain Generalization [20.3] Out-of-Domain (OOD) 一般化は、1つ以上のドメインでトレーニングされたモデルが見えないドメインに一般化する能力である。
コンピュータビジョンのImageNet時代において、モデルのOOD性能を測定するための評価セットは、スタイルに関して厳密にOODであるように設計されていた。
基礎モデルや拡張Webスケールデータセットの出現は、この評価プロセスを邪魔している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:29:53 GMT)
In-context denoising with one-layer transformers: connections between attention and associative memory retrieval [20.1] 注目型アーキテクチャと高密度連想型メモリネットワークとの接続を洗練させるタスクであるインコンテキストデノベーションを導入する。
理論上, 実験上, ある制限された復調問題を単層変圧器でも最適に解けることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:00:45 GMT)
Exploiting Similarity for Computation and Communication-Efficient Decentralized Optimization [19.8] 本研究では,最先端通信と計算複雑性を実現するSPDO法を提案する。
実験の結果,SPDOは既存の手法よりも有意に優れていた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:37:10 GMT)
Bridging External and Parametric Knowledge: Mitigating Hallucination of LLMs with Shared-Private Semantic Synergy in Dual-Stream Knowledge [19.8] 本稿では,DSSP-RAG(Shared-Private Semantic Synergy)のためのDual-Stream Knowledge-Augmented Frameworkを提案する。
フレームワークの中心は、自己意識を混合意識に洗練し、制御された内外的知識統合のための共有とプライベートのセマンティクスを区別する、新しいアプローチである。
ベンチマークデータセットの実験では、DSSP-RAGは競合を効果的に解決し、二重ストリーム知識の相補性を向上し、強いベースラインよりも優れたパフォーマンスをもたらすことが示されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:00:23 GMT)
HilbertMamba: Local-Global Reciprocal Network for Uterine Fibroid Segmentation in Ultrasound Videos [19.7] 正常スクリーニングと子宮線維化の早期発見は悪性化の予防に不可欠である。
本稿ではLGRNet(Local-Global Reciprocal Network)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:18:12 GMT)
Instructor-Worker Large Language Model System for Policy Recommendation: a Case Study on Air Quality Analysis of the January 2025 Los Angeles Wildfires [19.6] ロサンゼルスの山火事における大気の質を調査するために,多エージェントの大規模言語モデルフレームワークを改良し,活用する。
我々は、インストラクタエージェントとWorkerエージェントからなるマルチエージェントの大規模言語システムを使用する。
本研究では,インストラクタ・ワークス LLM システムの健康基準を空気質に基づいて評価することにより,データに基づく政策推薦の能力をテストする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:36:32 GMT)
ChronoTailor: Harnessing Attention Guidance for Fine-Grained Video Virtual Try-On [19.6] Video Virtual try-onは、ビデオの中の人の衣服を、目的の衣服にシームレスに置き換えることを目的としている。
既存のアプローチは、継続性を維持し、衣服の詳細を再現するのに依然として苦労している。
拡散に基づくフレームワークであるChronoTailorは、きめ細かい衣料を保存しながら、時間的に一貫したビデオを生成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:26:39 GMT)
Toward a Low-Cost Perception System in Autonomous Vehicles: A Spectrum Learning Approach [19.2] 本稿では,Bartlettの空間スペクトル推定手法に着想を得た新しい画素位置符号化アルゴリズムを提案する。
提案手法は,高分解能カメラ画像を利用してレーダ深度マップ生成モデルを訓練する。
提案手法は,一方向チャンファー距離(UCD)において,最先端技術(SOTA)を27.95%向上させることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:21:59 GMT)
Cyber Security of Sensor Systems for State Sequence Estimation: an AI Approach [19.1] 本稿では,問題となるセンサデータのみを正確に識別・除去する手法を開発した。
この手法はセンサデータの統計モデルに既知の形式を仮定しない。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:51:44 GMT)
AANet: Virtual Screening under Structural Uncertainty via Alignment and Aggregation [18.9] 構造的不確実性の下で正確な仮想スクリーニングを実現するためのアライメント・アンド・アグリゲーション・フレームワークを導入する。
本手法は,新しいアポ構造のベンチマークで評価し,ブラインドアポ設定における最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:52:19 GMT)
RB-SCD: A New Benchmark for Semantic Change Detection of Roads and Bridges in Traffic Scenes [18.7] Road and Bridge Semantic Change Detection (RB-SCD)データセットは、260対の高解像度リモートセンシング画像からなるベンチマークである。
RB-SCDは多様な地域をカバーし、複数の国で10以上の都市にまたがる様々な道路や橋のタイプを含んでいる。
この挑戦的なデータセットに基づいて、MFDCD(Multimodal Frequency-Driven Change Detector)と呼ばれる新しいフレームワークを提案する。
MFDCDは周波数領域におけるマルチモーダル特性を統合しており、DFC(Dynamic Frequency Coupler)とTFF(Textual Frequency Filter)の2つの鍵成分から構成されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:18:46 GMT)
Conditioning Diffusions Using Malliavin Calculus [18.6] 生成的モデリングと最適制御において、中央の計算タスクは、与えられた端末時間報酬を最大化するために参照拡散プロセスを変更することである。
本稿では,Tweedieスコア公式の非線形微分方程式への一般化を中心に,Malliavin計算に基づく新しい枠組みを導入する。
これにより、拡散ブリッジや、すでに訓練済みの拡散モデルに条件付き制御を追加するような、幅広いアプリケーションを扱うことができます。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:32:07 GMT)
Provable Complexity Improvement of AdaGrad over SGD: Upper and Lower Bounds in Stochastic Non-Convex Optimization [18.5] 適応勾配法は、最も成功したニューラルネットワークトレーニングアルゴリズムの一つである。
これらの手法は凸SGD-ノルマリティよりも次元依存性が優れていることが知られている。
本稿では,構造物の滑らかさと勾配雑音の分散に関する新しい仮定を紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:08:17 GMT)
Flexible Operator Fusion for Fast Sparse Transformer with Diverse Masking on GPU [18.5] フレキシブルマスキングとGPU上の演算子融合によるスパーストランスフォーマーの最適化を組み込んだフレームワークであるSTOFを提案する。
STOFは,MHA計算で1.7倍,エンドツーエンド推論で1.5倍の高速化を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:54:34 GMT)
AssetDropper: Asset Extraction via Diffusion Models with Reward-Driven Optimization [18.4] AssetDropperは参照イメージから資産を抽出するように設計されたフレームワークである。
提案モデルでは,入力画像から選択した被験者の正面図を抽出する。
我々は、フィードバックでクローズドループを満たすために、事前訓練された報酬モデルを採用する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:57:25 GMT)
Object Navigation with Structure-Semantic Reasoning-Based Multi-level Map and Multimodal Decision-Making LLM [18.4] 環境属性マップ(EAM)とMLLM階層推論モジュール(MHR)を用いたアクティブオブジェクトナビゲーションフレームワークを提案する。
EAMは、観測された環境をSBERTで推論し、観測されていない環境を拡散で予測することによって構築される。
MHRはEAMにインスパイアされてフロンティア探索決定を行い、長距離シナリオにおける回路軌道を避けて経路効率を向上させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:08:40 GMT)
NGA: Non-autoregressive Generative Auction with Global Externalities for Advertising Systems [18.4] グローバルな外部性を備えた非自己回帰生成オークション(NGA)について紹介する。
NGAは、隣接する有機物の影響だけでなく、広告間の関係を捉えることで、グローバルな外部性を明示的にモデル化する。
効率をさらに高めるために、NGAは非自己回帰的制約ベースのデコード戦略と、リストワイド報酬と支払い計算の統合のための並列マルチトウワー評価器を利用する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:25:14 GMT)
Neural Responses to Affective Sentences Reveal Signatures of Depression [18.3] 大うつ病(Major Depressive Disorder、MDD)は、非常に一般的な精神疾患であり、その神経認知基盤の深い理解が不可欠である。
本研究では、自己参照感情文に対する神経反応を測定することにより、抑うつが感情処理の時間的ダイナミクスをどう変えるかを検討する。
以上の結果から,抑うつ状態における感情情報と自己参照情報の統合が阻害されたことが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:09:08 GMT)
TASTE-Rob: Advancing Video Generation of Task-Oriented Hand-Object Interaction for Generalizable Robotic Manipulation [18.1] TASTE-Robは、エゴ中心のハンドオブジェクトインタラクションビデオ100,856のデータセットである。
それぞれのビデオは、言語指示と慎重に一致し、一貫したカメラ視点から記録される。
リアリズムを高めるために,我々は3段階のポーズ・リファインメント・パイプラインを導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:50:09 GMT)
LLIA -- Enabling Low-Latency Interactive Avatars: Real-Time Audio-Driven Portrait Video Generation with Diffusion Models [17.9] 拡散に基づくモデルは、その卓越した表現力のために、仮想人間世代に広く採用されている。
本稿では,これらの課題に対処するための拡散モデルに基づく,新しいオーディオ駆動型ポートレートビデオ生成フレームワークを提案する。
本モデルでは,解像度384x384,解像度512x512で最大78FPS,ビデオ生成遅延140msと215msで最大78FPSを実現している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:09:07 GMT)
Trajectory Entropy: Modeling Game State Stability from Multimodality Trajectory Prediction [17.7] エージェント間の複雑な相互作用は、現実のシナリオにおける自律運転にとって重要な課題である。
近年,エージェントの相互作用をレベルkゲームフレームワークとして定式化する,有望なアプローチが出現している。
本稿では、レベルkゲームフレームワーク内のエージェントのゲームステータスを明らかにするために、トラジェクトリ・エントロピーと呼ばれるメトリクスを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:17:55 GMT)
Full Conformal Adaptation of Medical Vision-Language Models [17.5] 大規模に事前訓練された視覚言語モデル(VLM)は、前例のない転送可能性を示している。
この研究は、ますます普及している分割共形予測フレームワークの下で、それらの振る舞いを調査する。
本稿では,事前学習した基礎モデルを協調的に適応・適合するための新しい設定である,完全共形適応を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:32:00 GMT)
UDora: A Unified Red Teaming Framework against LLM Agents by Dynamically Hijacking Their Own Reasoning [17.4] 外部ツールを備えた大規模言語モデル(LLM)エージェントは、複雑なタスクに対してますます強力になっている。
UDoraはLDMエージェント用に設計された統一されたレッド・チーム・フレームワークで、エージェントの推論プロセスを動的にハイジャックし、悪意ある振る舞いを強制する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:45:53 GMT)
Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping [17.2] 本稿では,小サンプルサイズ体制における2つの政策を厳密に比較するための新しい統計枠組みを提案する。
実験では、ほぼ最適に停止し、研究者が評価を中止し、最小限の試行で決定を下せることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:24:36 GMT)
DiMA: An LLM-Powered Ride-Hailing Assistant at DiDi [17.2] DiDi、Uber、Lyftといったオンデマンド配車サービスは、都会の交通手段にマッチせず、利便性と柔軟性を提供している。
本稿では,DiDi Chuxing における LLM を利用した配車支援システム DiMA について紹介する。
私たちの目標は、シームレスな配車サービスを提供することです。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:05:22 GMT)
Tug-of-war between idiom's figurative and literal meanings in LLMs [17.0] 非構成的比喩的意味はしばしばイディオムの解釈から強く分かれる。
この双対性は、比喩的な意味でイディオムを解釈する2つの意味の表現と決定を学習するモデルを必要とする。
我々は、機械的解釈可能性のツールを用いて、大きな事前訓練された因果変換器がこの曖昧さにどう対処するかを追跡する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:41:57 GMT)
Ophora: A Large-Scale Data-Driven Text-Guided Ophthalmic Surgical Video Generation Model [16.9] 眼科手術では、手術映像を解釈し、その後の手術を予測することができるAIシステムの開発には、高品質なアノテーションを備えた多数の眼科手術ビデオが必要である。
我々は,眼科手術映像を自然言語で生成できる先駆的モデルであるOphoraについて紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:36:26 GMT)
semantic-features: A User-Friendly Tool for Studying Contextual Word Embeddings in Interpretable Semantic Spaces [16.9] LMの文脈的単語埋め込みを研究するための,使い易いセマンティック・フェース(semantic-features)を紹介する。
本稿では,発話の意味的解釈に対する発話構成の選択の文脈的影響を計測する。
意味的特徴を応用することにより、3つのマスキング言語モデルの文脈的単語埋め込みが期待された感性を示すことを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:33:27 GMT)
Can LLMs Express Personality Across Cultures? Introducing CulturalPersonas for Evaluating Trait Alignment [16.7] 行動に富んだ文脈で人格表現を評価するための,人間による検証のための最初の大規模ベンチマークであるCulturalPersonasを紹介する。
我々のデータセットは、6つの異なる国で3000のシナリオベースの質問にまたがっており、地域価値に根ざした日々のシナリオを通してパーソナリティを引き出すように設計されている。
以上の結果から,CulturalPersonasは国固有の人格分布との整合性を向上させることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:33:19 GMT)
Gaussian is All You Need: A Unified Framework for Solving Inverse Problems via Diffusion Posterior Sampling [16.7] 拡散モデルは、複雑なデータ分布をモデル化することによって、様々な高品質な画像を生成することができる。
既存の拡散法の多くは、拡散逆サンプリングプロセス内の可能性関数を近似することにより、データ一貫性のステップを統合する。
本稿では,既存の近似が不十分であるか,あるいは計算的に非効率であることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:02:54 GMT)
STSBench: A Spatio-temporal Scenario Benchmark for Multi-modal Large Language Models in Autonomous Driving [16.6] STSBenchは、自律運転のための視覚言語モデル(VLM)の総合的な理解をベンチマークするためのフレームワークである。
このベンチマークでは、複数のビューにまたがる43の多様なシナリオが特徴で、その結果、971人の人間による検証された複数選択の質問が生まれている。
徹底的な評価により、複雑な環境における基本的なトラフィックダイナミクスを推論する既存のモデルの能力の欠点が明らかになる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:25:22 GMT)
RecGPT: A Foundation Model for Sequential Recommendation [16.5] 我々は、真にゼロショットの一般化機能を実現するための逐次レコメンデーションのための基礎モデルを開発する。
提案手法は,テキスト機能のみからアイテム表現を導出することで,既存のIDベースの手法から逸脱する。
我々は、不均一なテキスト記述を標準化された離散トークンに変換するFinite Scalar Quantizationと統合されたアイテムトークン化を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:53:02 GMT)
Variational Inference for Quantum HyperNetworks [16.4] 変分量子アルゴリズムは、量子回路の測定によって二分重を生成するために用いられる。
重ね合わせや絡み合いのような重要な量子現象は、より広い解空間の探索を促進する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:57:43 GMT)
What Is Seen Cannot Be Unseen: The Disruptive Effect of Knowledge Conflict on Large Language Models [16.4] 大規模言語モデルは、しばしばタスクを実行するために文脈入力とパラメトリック知識の両方に依存する。
これらの資料は、特に回収された文書がモデルのパラメトリックな信念と矛盾する場合に矛盾する可能性がある。
本研究では,LLMの動作を文脈記憶の衝突下で体系的に評価する診断フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:20:23 GMT)
ThinkEdit: Interpretable Weight Editing to Mitigate Overly Short Thinking in Reasoning Models [16.4] 本研究では、推論モデルの隠れ表現に、推論の長さがどのように埋め込まれているかを検討する。
textbftextitThinkEditは、非常に短い推論の問題を軽減するために、シンプルだが効果的な重み編集手法である。
モデルのパラメータの0.2%にしか変更されないため、textbftextitThinkEditは、過剰に短い推論を減らし、顕著な精度向上をもたらす。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:18:27 GMT)
Paradigms of AI Evaluation: Mapping Goals, Methodologies and Culture [16.4] 我々は、AI評価の現場における最近の研究を調査し、6つの主要なパラダイムを特定した。
我々は,現在の評価手法の広さに対する意識を高め,異なるパラダイム間の相互補間を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:52:52 GMT)
Differentially Private Explanations for Clusters [16.2] 本稿では,ブラックボックスクラスタリング結果の説明を提供するフレームワークであるDPClustXについて述べる。
我々は,DPClustXを実データ上で実験的に解析し,厳密なプライバシー制約下であっても洞察に富んだ正確な説明を提供することを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:14:45 GMT)
LightGTS: A Lightweight General Time Series Forecasting Model [16.1] LightGTSは、一貫した周期的モデリングの観点から設計された軽量な汎用時系列予測モデルである。
ゼロショットとフルショットの両方の設定で、9つの実世界のベンチマークで最先端の予測性能を達成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:49:37 GMT)
PoCGen: Generating Proof-of-Concept Exploits for Vulnerabilities in Npm Packages [16.1] PoCGenは、npmパッケージの脆弱性に対するPoCエクスプロイトを自動生成し、検証する新しいアプローチである。
大規模な言語モデル(LLM)をPoCエクスプロイト生成のための静的および動的解析技術と併用する、初めての完全自律型アプローチである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:49:53 GMT)
Optimized projection-free algorithms for online learning: construction and worst-case analysis [16.1] 本研究は線形最適化オラクル(Frank-Wolfe)を用いたオンライン学習のためのプロジェクションフリーアルゴリズムの研究と開発である。
半定値プログラミングを利用してオンラインFrank-Wolfe型アルゴリズムを数値的に設計・解析する方法を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:22:20 GMT)
Let's Put Ourselves in Sally's Shoes: Shoes-of-Others Prefixing Improves Theory of Mind in Large Language Models [16.1] 大規模言語モデル(LLM)における心の理論(ToM)はまだ人間レベルの性能に達していない。
ToMの既存の推論時間法は、世界状態の変化を含む文脈から信念を推測するために特化している。
Inference-time method for ToM, Shoes-of-Others (SoO) prefixing, which makes less assumptions about contexts and is apply to wide scenarios。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:47:46 GMT)
Evaluating Neuron Explanations: A Unified Framework with Sanity Checks [15.8] 本研究では,1つの数学的枠組みの下で,既存の多くの説明評価手法を統合する。
多くの一般的なメトリクスが正当性チェックに失敗し、概念ラベルに大きな変更を加えてスコアを変更しないことを示す。
本結果に基づいて,今後の評価基準を追従し,信頼性評価指標の集合を同定するガイドラインを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:09:47 GMT)
E^2GraphRAG: Streamlining Graph-based RAG for High Efficiency and Effectiveness [15.8] 本稿では,グラフベースのRAGフレームワークであるE2GraphRAGを提案する。
E2GraphRAGはGraphRAGの最大10倍のインデックス化を実現し、LightRAGの100倍の高速化を実現している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:11:48 GMT)
System-Aware Unlearning Algorithms: Use Lesser, Forget Faster [15.8] 本稿では,線形分類のための厳密なシステム認識型アンラーニングアルゴリズムを提案する。
理論的には、削除能力、正確性、メモリ、計算時間の間のトレードオフを分析する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:30:40 GMT)
CrimeMind: Simulating Urban Crime with Multi-Modal LLM Agents [15.7] マルチモーダルな都市環境下での都市犯罪をシミュレートするための新しい枠組みであるCristMindを提案する。
我々の設計の重要な革新は、ルールアクティビティ理論(RAT)をクライムミンドのエージェントワークフローに統合することである。
アメリカの主要都市4都市での実験では、犯罪ミンドは犯罪ホットスポット予測と空間分布精度において従来のABMとディープラーニングベースラインの両方を上回っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:01:21 GMT)
Learning Design-Score Manifold to Guide Diffusion Models for Offline Optimization [15.7] 本稿では,設計スコア多様体を学習する拡散型フレームワークであるManGOを紹介する。
ManGOは、トレーニングデータ以外の一般化を実現するために、設計スコアの相互依存を全体的に統一する。
様々な領域にわたる24の単目的と10の多目的の最適化手法より優れている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:11:10 GMT)
Splat and Replace: 3D Reconstruction with Repetitive Elements [15.6] 我々は3次元シーンにおける反復的要素を活用して、新規なビュー合成を改善する。
私たちの重要な観察は、環境がしばしば反復的な要素で満たされていることです。
本稿では,3DGS再構成において繰り返し発生する各インスタンスを分割し,それらをまとめて登録し,インスタンス間で情報を共有できるようにする手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:34:22 GMT)
Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning [15.6] 次世代マルチモーダル推論モデルであるSkywork R1V2を提案する。
コアとなるR1V2では、ハイブリッド強化学習パラダイムが導入されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:27:18 GMT)
Voice Impression Control in Zero-Shot TTS [15.5] ゼロショット音声合成における音声印象制御法を開発した。
様々な音声印象対の強度を表現するために低次元ベクトルを用いる。
主観的評価と主観的評価の両方の結果から,印象制御における本手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:34:29 GMT)
MindLLM: A Subject-Agnostic and Versatile Model for fMRI-to-Text Decoding [15.3] 機能的磁気共鳴画像(fMRI)信号をテキストに復号することは神経科学において重要な課題である。
我々は、主観的かつ汎用的なfMRI-to-textデコーディングのためのモデルであるMindLLMを提案する。
本稿では,fMRI信号から多種多様な意味表現を捉える能力を高める新しい手法であるBrain Instruction Tuning(BIT)を紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:06:45 GMT)
TRUST: Test-time Resource Utilization for Superior Trustworthiness [15.0] このようなノイズの影響を考慮し,より信頼性の高い信頼度推定を行う新しいテスト時間最適化法を提案する。
このスコアは単調なサブセット選択関数を定義し、低いスコアを持つサンプルを除去すると、集団の精度は一貫して上昇する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:52:32 GMT)
ProSec: Fortifying Code LLMs with Proactive Security Alignment [14.9] 既存のメソッドは、インストラクションチューニングのための現実世界の脆弱性からセキュリティに焦点を当てたデータセットを収集する。
コードLLMをセキュアなコーディングプラクティスと整合させるために設計された,新しいプロアクティブなセキュリティアライメントアプローチであるProSecを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:27:10 GMT)
Towards Efficient Multi-LLM Inference: Characterization and Analysis of LLM Routing and Hierarchical Techniques [14.9] 言語モデル(LM)は、テキスト生成、要約、質問応答といったタスクに優れています。
彼らの推論は計算コストが高く、ハードウェア、電力、帯域幅に制限のある設定でエネルギーを集中的に消費する。
近年のアプローチでは、クエリの複雑さに基づいて、動的に計算資源を割り当てる複数のLLMインテリジェントモデル選択戦略が導入されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:13:08 GMT)
Numerical Investigation of Sequence Modeling Theory using Controllable Memory Functions [14.8] 本稿では,異なる時系列モデルが時間構造を効果的に捉える方法を評価するための,合成ベンチマークフレームワークを提案する。
このアプローチのコアは、それぞれがメモリ機能と時間依存の強さを決定するパラメータによって特徴づけられる合成ターゲットを生成することである。
いくつかのシーケンスモデリングアーキテクチャの実験は、既存の理論的洞察を確認し、新しい発見を明らかにする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:02:59 GMT)
Online Detection of LLM-Generated Texts via Sequential Hypothesis Testing by Betting [14.7] 我々は,ソースが大言語モデル(LLM)なのか人間なのかを迅速かつ正確に判定するアルゴリズムを開発した。
我々は、既存のオフライン検出技術に基づいて、ベッティングによるシーケンシャル仮説テストの手法を用いる。
提案手法の有効性を実証するために実験を行った。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:17:10 GMT)
ARMOR: Empowering Multimodal Understanding Model with Interleaved Multimodal Generation Capability [14.7] ARMORは、マルチモーダルな大規模言語モデルのためのリソース効率が高く純粋な自動回帰フレームワークである。
既存のMLLMを微調整することで、理解と生成を両立させる。
ARMOR は,既存の MLLM を UniM にアップグレードし,将来性のある画像生成機能を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:03:44 GMT)
Contextually Guided Transformers via Low-Rank Adaptation [14.7] 変換器をベースとした大規模言語モデル(LLM)は、テキスト処理において優れているが、特殊な振る舞いのプロンプトに依存しているため、計算オーバーヘッドが生じる。
本稿では,モデル重みにコンテキストをエンコードすることで,明示的なプロンプトの必要性を解消するトランスフォーマーアーキテクチャの修正を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:34:39 GMT)
SATversary: Adversarial Attacks on Satellite Fingerprinting [14.7] 送信機指紋認証は、通信を認証するメカニズムを提供する。
最適化されたジャミング信号は、攻撃者と被害者の比率が-30dB以下の50%のエラー率を引き起こす可能性があることを示す。
また、攻撃者の送信機を含む受信メッセージの認証に使用されるデータを変更することで、永続的なメッセージ偽造を可能にするデータ中毒攻撃も提示する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:27:19 GMT)
WisWheat: A Three-Tiered Vision-Language Dataset for Wheat Management [14.7] VLM(Vision-Language Models)は、スケーラブルでデータ駆動型の管理サポートを実現するための有望なソリューションとして登場した。
小麦管理タスクにおけるVLM性能を向上させるために,3層構造を有する小麦特異的データセットWisWheatを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:45:34 GMT)
HO-FMN: Hyperparameter Optimization for Fast Minimum-Norm Attacks [14.6] 本稿では,よく知られた高速最小ノルム攻撃アルゴリズムのパラメトリック変種を提案する。
我々は12のロバストモデルを再評価し、追加のチューニングを必要とせずに敵の摂動が小さくなることを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:06:37 GMT)
CodeContests+: High-Quality Test Case Generation for Competitive Programming [14.6] 本稿では,競合プログラミング問題に対する高品質なテストケースを作成するエージェントシステムを提案する。
我々は、このシステムをCodeContestsデータセットに適用し、CodeContests+というテストケースを改善した新しいバージョンを提案する。
その結果、CodeContests+はCodeContestsよりもはるかに高い精度を実現し、特にTPR(True Positive Rate)が顕著であることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:29:01 GMT)
Graph Diffusion that can Insert and Delete [14.5] 離散 Denoising Diffusion Probabilistic Models (DDPM) に基づくグラフの生成モデルは、分子生成に対する原則的なアプローチを提供する。
本稿では,ノードの単調な挿入と削除をサポートするため,ノイズ発生処理とノイズ発生処理を再構成する。
GrIDDDと呼ばれる結果のモデルは、生成中に化学グラフを動的に成長または縮小します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:45:45 GMT)
Neighbour-Driven Gaussian Process Variational Autoencoders for Scalable Structured Latent Modelling [14.4] ガウス過程 (GP) 変分オートエンコーダ (VAEs) は、完全に分解されたガウス前処理をGP前処理に置き換えることで標準のVAEを拡張する。
大規模GPVAEにおける正確なGP推論の実行は、計算的に禁止されており、しばしば既存のアプローチは制限的なカーネルの仮定に頼らざるを得ない。
本稿では,拡張性のあるGPVAE推論を実現するために,潜在空間における局所的隣接性を利用する近似手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:35:56 GMT)
Biases Propagate in Encoder-based Vision-Language Models: A Systematic Analysis From Intrinsic Measures to Zero-shot Retrieval Outcomes [14.3] 社会集団バイアスは、基礎エンコーダに基づく視覚言語モデル(VLM)に固有のものであり、下流タスクのバイアスに現れる。
ゼロショットテキスト・トゥ・イメージ(TTI)とイメージ・トゥ・テキスト(ITT)検索におけるバイアスの度合いと、表現空間における固有バイアスの度合いを関連付けることにより、この伝播を測定するための制御された枠組みを導入する。
その結果,内因性バイアスと外因性バイアスの間に有意な相関がみられ,平均$rho$ = 0.83$pm$ 0.10が得られた。
注目すべきは、より大きな/ベターパフォーマンスモデルがより大きなバイアス伝播を示すこと、これは懸念を提起する発見である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:01:32 GMT)
A Comprehensive Survey on Concept Erasure in Text-to-Image Diffusion Models [14.3] テキスト・ツー・イメージ(T2I)モデルは、自然言語のプロンプトから高品質で多様な視覚コンテンツを生成できる。
著作権のあるスタイル、繊細なイメージ、有害なコンテンツを再現する能力は、重大な倫理的および法的懸念を引き起こす。
概念消去は、望ましくないコンテンツの生成を防ぐためにT2Iモデルを変更することで、外部フィルタリングの積極的な代替手段を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:12:20 GMT)
Statistically Valid Post-Deployment Monitoring Should Be Standard for AI-Based Digital Health [14.3] FDAが登録しているAIベースの医療ツールのわずか9%に、デプロイ後の監視計画が含まれている。
既存の監視アプローチはしばしば手動、散発的、リアクティブである。
本稿では,データの変化の検出とモデル性能の劣化を,統計的に異なる仮説テスト問題として扱うことを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:04:44 GMT)
Efficient Fine-Grained Guidance for Diffusion Model Based Symbolic Music Generation [14.2] 拡散モデルにFGG(Fined Guidance)アプローチを導入する。
FGGは拡散モデルをガイドし、専門家作曲家の制御と意図とより密に整合した音楽を生成する。
このアプローチは拡散モデルにより、即興性やインタラクティブな音楽生成といった高度な応用に優れる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:03:36 GMT)
SGD Jittering: A Training Strategy for Robust and Accurate Model-Based Architectures [14.1] SGDジッタリング(SGD jittering)と呼ばれる、再構成時に繰り返しノイズを注入する単純なMBAのトレーニング手法を提案する。
理論的には、SGDジッタリングは標準的な平均二乗誤差トレーニングよりも一般化するだけでなく、平均ケース攻撃よりも堅牢であることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:09:38 GMT)
Structure Guided Large Language Model for SQL Generation [14.1] 構造対応型テキスト・ツー・クエリ・フレームワーク(SGU)を提案する。
SGU対応のテキスト・ツー・クエリ・フレームワーク(SGU)は、最先端のテキスト・ツー・モデルよりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:37:27 GMT)
ResearchTown: Simulator of Human Research Community [14.0] ResearchTownは、リサーチコミュニティシミュレーションのためのマルチエージェントフレームワークである。
ResearchTownは、協調研究活動の現実的なシミュレーションを提供する。
ResearchTownは、複数の研究者と多様な論文で堅牢なシミュレーションを維持できる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:39:34 GMT)
The Coming Crisis of Multi-Agent Misalignment: AI Alignment Must Be a Dynamic and Social Process [14.0] 人間の価値観や好みとAIの整合性は依然として重要な課題だ。
エージェントは互いに関与するので、個々の目標と集合目標の両方を達成するために調整する必要があります。
社会構造は、グループや個人の価値を減らしたり、壊したりすることができる。
私たちは、人間、優先的、客観的なアライメントを相互依存的な概念として扱うようにAIコミュニティに呼びかけます。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:55:21 GMT)
SMAR: Soft Modality-Aware Routing Strategy for MoE-based Multimodal Large Language Models Preserving Language Capabilities [13.9] 既存のマルチモーダルMOEモデル構築方法は、トレーニングコストが高いか、事前訓練されたモデルを適用する際に言語能力の劣化に悩まされる。
そこで我々は,Kullback Leibler の発散を利用してルーティング確率分布を制御する新しい正規化手法である Soft Modality Aware Routing (SMAR) を提案する。
ビジュアル・インストラクション・チューニングの実験では、SMARは86.6%の保持率を維持し、純粋なテキストはわずか2.5%であり、高いマルチモーダル性能を維持しながらベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:47:29 GMT)
Fréchet Radiomic Distance (FRD): A Versatile Metric for Comparing Medical Imaging Datasets [13.7] Fr'echet Radiomic Distance (Fr'echet Radiomic Distance) という医療画像に適した新しい知覚基準を導入する。
FRDは、様々な医療画像の分野で、他の画像分布指標よりも優れていることを示す。
FRDは、低いサンプルサイズでの安定性や計算効率などの付加的な利点を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:36:34 GMT)
Bridging Audio and Vision: Zero-Shot Audiovisual Segmentation by Connecting Pretrained Models [13.6] 複数の事前学習モデルを活用することでタスク固有のトレーニングを不要にするゼロショットAVSフレームワークを提案する。
提案手法は,音声,視覚,テキスト表現を統合し,AVS固有のアノテーションを使わずに正確な音源分割を可能にする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:06:35 GMT)
QualitEye: Public and Privacy-preserving Gaze Data Quality Verification [13.6] QualitEyeは、画像ベースの視線データ品質を検証する最初の方法である。
これは、検証に必要な情報を含む新しい目像のセマンティック表現を採用する。
我々はMPIIFaceGaze と GazeCapture のデータセット上で QualitEye を評価し,高い検証性能を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:27:04 GMT)
Smoothed Preference Optimization via ReNoise Inversion for Aligning Diffusion Models with Varied Human Preferences [13.6] 直接選好最適化(DPO)は、テキスト・ツー・イメージ(T2I)生成モデルと、ペアの選好データを用いた人間の選好を一致させる。
本稿では, DPO の目的を改善するために, 好み分布をモデル化する新しい手法である SmPO-Diffusion を提案する。
提案手法は,既存手法における過度な最適化と客観的なミスアライメントの問題を効果的に軽減する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:14:26 GMT)
Images Speak Louder than Words: Understanding and Mitigating Bias in Vision-Language Model from a Causal Mediation Perspective [13.5] 広範囲なデータセットで事前訓練された視覚言語モデルは、性情報とオブジェクトやシナリオを関連付けることによって、必然的にバイアスを学習することができる。
本稿では,因果媒介分析を取り入れた枠組みを提案し,バイアス発生と伝播の経路を計測・マッピングする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:39:14 GMT)
LinGuinE: Longitudinal Guidance Estimation for Volumetric Lung Tumour Segmentation [13.5] LinGuinEは、縦断的な肺腫瘍を分断する自動方法である。
放射線科医は、CTスキャンにおける腫瘍の位置を任意の時点に示す初期入力を提供しなければならない。LinGuinEはこの腫瘍の内部の点を採取し、剛性登録を用いて別の時点に伝播させる。
我々は、任意の時点を出発点として使用し、アブレーション実験を行い、LinGuinEセットアップが両方のテストデータセットで最良の結果をもたらすことを示します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:52:33 GMT)
Diffusion-Based Hierarchical Graph Neural Networks for Simulating Nonlinear Solid Mechanics [13.4] Rolling Diffusion-Batched Inference Network (ROBIN)は、2つの重要なイノベーションを統合する新しい学習シミュレータである。
微細な局所力学と、ビーム曲げや多体接触のような現象に不可欠なグローバルな構造効果の両方を捉えている。
ROBINは、すべてのタスクで最先端の精度を達成し、既存の次のステップの学習シミュレータよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:46:36 GMT)
Beyond Facts: Evaluating Intent Hallucination in Large Language Models [13.3] FAITHQAは20,068問題を含む意図幻覚の新しいベンチマークである。
我々は、最先端のモデルにおいても意図幻覚は一般的な問題であると考えている。
意図の幻覚を検出するための自動LLM生成評価指標であるCONSTRAINT SCOREを導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:10:55 GMT)
DPO-Shift: Shifting the Distribution of Direct Preference Optimization [13.3] 選択した確率の分布を制御的にシフトさせるためにDPOシフトを導入する。
DPO-Shiftは、選択された確率を改善し、報酬マージンを犠牲にすることで、根本的なトレードオフを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:18:28 GMT)
Antithetic Noise in Diffusion Models [13.2] それぞれの初期雑音と否定をペアリングすると、強い負の相関を持つサンプルが得られる。
私たちのフレームワークはトレーニング不要で、モデルに依存しません。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:46:26 GMT)
Lost in the Passage: Passage-level In-context Learning Does Not Necessarily Need a "Passage" [13.2] In-context Learning (ICL)は、大規模言語モデル(LLM)が多くのタスクで素晴らしいパフォーマンスを得ることを可能にする。
本研究は、生成タスクのためのパスレベル長文ICLに焦点を当てる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:49:20 GMT)
The Optimization Paradox in Clinical AI Multi-Agent Systems [13.2] コンポーネントレベルの最適化とシステム全体のパフォーマンスの関係は、まだよく分かっていない。
この関係をMIMIC-CDMデータセットから2,400症例を用いて検討した。
マルチエージェントシステムは一般にシングルエージェントよりも優れているが、コンポーネント最適化またはベスト・オブ・ブリードシステムは優れたコンポーネントと優れたプロセスメトリクスは診断精度に優れていない(上位マルチエージェントシステムでは67.7%対77.4%)。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:01:51 GMT)
JailbreakLens: Visual Analysis of Jailbreak Attacks Against Large Language Models [13.2] JailbreakLensは視覚分析システムで、ユーザはターゲットモデルに対してjailbreakのパフォーマンスを探索することができる。
モデルセキュリティの評価とモデルの弱点の同定を支援するシステムの有効性を実証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:39:01 GMT)
Do Large Vision-Language Models Distinguish between the Actual and Apparent Features of Illusions? [13.0] 人間は視覚錯覚に敏感で、感覚や認知の過程を研究する貴重な道具として機能する。
大規模視覚言語モデル(LVLM)のような機械が視覚錯覚に類似した感受性を示すかどうかの研究が始まっている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:47:50 GMT)
Predicting ICU In-Hospital Mortality Using Adaptive Transformer Layer Fusion [13.0] 本稿では,LoRAアダプタと適応層重み付け機構を併用して,BERTバックボーンから意味的特徴を融合するモジュール型アテンションベースアーキテクチャであるALFIAを紹介する。
ALFIAは、厳格なcw-24(CriticalWindow-24)ベンチマークに基づいて、AUPRCの最先端の分類器を上回り、バランスの取れた精度-リコールプロファイルを保存する。
本実験では,ALFIAの早期期成績が良好であることを確認するとともに,日常的な臨床テキストを直接操作することで,リスク階層化や緊急ケア設定への時間的介入に便利な,堅牢なツールを臨床医に提供した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:55:30 GMT)
LLM-based relevance assessment still can't replace human relevance assessment [12.8] 近年の研究では、情報検索における関連性評価のための大規模言語モデル(LLM)が、人間の判断に匹敵する評価をもたらすことが示唆されている。
Upadhyayらは、LLMに基づく関連性評価は、TRECスタイルの評価における従来の人間関連性評価を完全に置き換えることができると主張している。
本稿ではこの主張を批判的に検証し、この結論の妥当性を損なう実践的・理論的制約を強調した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:27:49 GMT)
Synthetic Tabular Data: Methods, Attacks and Defenses [12.4] 合成データは、プライバシの懸念から解放された、機密性の高い固定サイズのデータセットを無制限に一致するデータのソースに置き換えるソリューションとして、しばしば位置づけられる。
合成データ生成はこの10年で大きく進歩し、機械学習とデータ分析の進歩を生かしている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:16:57 GMT)
ENMA: Tokenwise Autoregression for Generative Neural PDE Operators [12.3] 本稿では,物理現象から生じるダイナミクスをモデル化するための生成型ニューラルテンポラル演算子ENMAを紹介する。
ENMAは、フローマッチング損失を訓練した生成マスク付き自己回帰変換器を用いて、将来の動的圧縮潜在空間を予測する。
このフレームワークは、新しいPDEレジームに一般化され、時間依存パラメトリックPDEのワンショットサロゲートモデリングをサポートする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:25:14 GMT)
Projectable Models: One-Shot Generation of Small Specialized Transformers from Large Ones [12.3] 大規模トランスフォーマーのパラメータをより小さな特殊モデルのパラメータにマッピングする手法について検討する。
この変換タスクを具体化することにより、より小さなモデルで特定のタスクを実行するのに必要な知識のより狭い範囲を捉えることを目指している。
画像モデリングタスクにおいて,生成したモデルの性能が普遍的条件付きモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:05:38 GMT)
ELEVATE-GenAI: Reporting Guidelines for the Use of Large Language Models in Health Economics and Outcomes Research: an ISPOR Working Group on Generative AI Report [12.2] この記事ではELEVATE GenAIフレームワークとチェックリストを紹介します。
このフレームワークは,既存の報告ガイドラインを対象とする文献レビューを通じて開発された。
モデルの特徴、正確性、公平性、偏見を含む10のドメインから構成される。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:10:30 GMT)
DAM: Dynamic Attention Mask for Long-Context Large Language Model Inference Acceleration [12.2] 本稿では,アダプティブマスクをアダプティブマップレベルで割り当てる動的スパースアテンション機構を提案する。
コンテキスト認識型アテンション構造を学習することにより、フルアテンションモデルとの高アライメントを実現し、パフォーマンスの低下を最小限に抑える。
このアプローチは、大規模言語モデルの実践的な展開を可能にする、フルアテンションに代わるスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:24:36 GMT)
GeoClip: Geometry-Aware Clipping for Differentially Private SGD [12.1] 個人差分勾配降下(DP-SGD)の鍵となる課題は、サンプルごとの勾配クリッピング閾値を設定することである。
そこで我々はGeoClipを提案する。GeoClipは、勾配分布の幾何学と整合した変換ベースで勾配をクリップし、摂動する幾何学的フレームワークである。
我々はGeoClipの収束保証を提供し、勾配クリッピングの確率を制御下に保ちながら付加される雑音の量を最小限に抑える最適変換のための閉形式解を導出する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:41:17 GMT)
Multi-Modal Multi-Task Federated Foundation Models for Next-Generation Extended Reality Systems: Towards Privacy-Preserving Distributed Intelligence in AR/VR/MR [12.1] 我々は,マルチモーダルマルチタスク(M3T)フェデレーション基盤モデル(FedFM)が,XRシステムに変換機能を提供することを想定する。
モデルトレーニングとアグリゲーションのための異なる調整パラダイムを必要とするFedFMのモジュラーアーキテクチャを提案する。
この視点は、次世代のXRシステムにおいて、コンテキスト対応のプライバシ保護インテリジェンスのための技術的および概念的な基礎をグラフ化することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:23:42 GMT)
Domain Adaptation in Agricultural Image Analysis: A Comprehensive Review from Shallow Models to Deep Learning [12.1] 本稿では,農業画像解析における課題に対して,ドメイン適応(DA)技術がどう対処できるかを考察する。
本論文は、農業画像におけるDAの最近の進歩、特に複雑な農業環境における実践的応用を体系的にレビューする。
本稿では,DA手法を浅層および深層学習モデルに分類し,さらに教師付き,半教師付き,教師なしのアプローチに分割する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:52:10 GMT)
A Novel Large-scale Crop Dataset and Dual-stream Transformer Method for Fine-grained Hierarchical Crop Classification from Integrated Hyperspectral EnMAP Data and Multispectral Sentinel-2 Time Series [12.0] きめ細かい作物の分類は、精密農業と食料安全保障監視に不可欠である。
これらの2つのモダリティを組み合わせた研究は、ハイパースペクトルデータ取得と作物型アノテーションコストの課題により、依然として少ない。
本研究では,30m分解能EnMAPハイパースペクトルデータとSentinel-2時系列を統合することで,階層型ハイパースペクトルデータ(H2Crop)を構築する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:18:50 GMT)
Neural-Augmented Kelvinlet: Real-Time Soft Tissue Deformation with Multiple Graspers [12.0] 本稿では,軟組織変形を現実的かつリアルタイムに近似する新しい物理インフォームド・ニューラルシミュレータを提案する。
我々のフレームワークは、Kelvinletをベースとした前駆体をニューラルシミュレータに統合し、Kelvinletを残留学習と正規化に活用する最初のアプローチとなる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:22:49 GMT)
Does It Make Sense to Speak of Introspection in Large Language Models? [11.9] 我々は,大規模言語モデルから明らかな内省的自己報告の2つの事例を提示し,批判する。
人間では、そのような報告はイントロスペクション(introspection)の学部によるものとされ、通常は意識と結びついている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:26:38 GMT)
BiTrajDiff: Bidirectional Trajectory Generation with Diffusion Models for Offline Reinforcement Learning [11.9] BiTrajDiffは、オフライン強化学習(RL)のための新しいDAフレームワークである
軌道生成タスクを2つの独立かつ相補的な拡散過程に分解する。
BiTrajDiffは、重要状態をアンカーとして効果的に利用して、潜在的に価値ある未探索領域に拡張することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:41:33 GMT)
Demystifying Topological Message-Passing with Relational Structures: A Case Study on Oversquashing in Simplicial Message-Passing [11.8] トポロジカルディープラーニング(TDL)は,関係データの高次相互作用をモデル化するための強力なツールとして登場した。
本稿では,グラフとトポロジカルメッセージパッシングを橋渡しする,統一的な公理的フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:31:36 GMT)
Comment on 'Time Crystals Made of Electron-Positron Pairs': Parity Considerations and Numerical Validation [11.7] 基礎研究 (arXiv:2105.04346) の確立した知見を批判的に検討し, 有意差を認めた。
我々の数値解析はこの矛盾を裏付ける。
パリティ対称性を適切に組み込んだ新しい変換を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:46:57 GMT)
From Prototypes to General Distributions: An Efficient Curriculum for Masked Image Modeling [11.6] Masked Image Modelingは視覚表現学習のための強力な自己教師型学習パラダイムとして登場した。
本稿では,原典例からデータセットのより複雑なバリエーションまで,学習プロセスの進行を構造化する,プロトタイプ駆動型カリキュラム学習フレームワークを提案する。
本研究は, 自己指導型視覚学習において, トレーニング事例の順序を慎重に制御することが重要な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:44:24 GMT)
Knowledge Retention for Continual Model-Based Reinforcement Learning [11.6] DRAGOは連続モデルに基づく強化学習のための新しいアプローチである。
DRAGOは、Synthetic Experience RehearsalとRe Get Memories Through Explorationの2つの重要なコンポーネントで構成されている。
実証的な評価は、DRAGOがタスク間の知識を保存でき、様々な連続学習シナリオにおいて優れたパフォーマンスを達成できることを示している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:59:52 GMT)
Obfuscation-Resilient Binary Code Similarity Analysis using Dominance Enhanced Semantic Graph [11.5] ORCASは、支配強化セマンティックグラフ(DESG)に基づく難燃性BCSAモデルである
我々は,支配強化セマンティックグラフ(DESG)に基づく難易度回復型BCSAモデルであるORCASを開発する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:26:53 GMT)
Zero-Shot Event Causality Identification via Multi-source Evidence Fuzzy Aggregation with Large Language Models [11.5] 事象因果同定(ECI)は、テキストコンテキストにおける事象間の因果関係を検出することを目的としている。
既存のECIモデルは、主に管理された方法論に依存しており、大規模な注釈付きデータに依存している。
本稿では,Multi-source Evidence Fuzzy Aggregationに基づく新しいゼロショットフレームワークMEFAを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:56:05 GMT)
FlowOE: Imitation Learning with Flow Policy from Ensemble RL Experts for Optimal Execution under Heston Volatility and Concave Market Impacts [11.5] FlowOEはフローマッチングモデルに基づく新しい模倣学習フレームワークである。
FlowOEはさまざまな専門家の戦略から学び、市場状況に適応的に最も適した専門家の行動を選択する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:28:22 GMT)
Convergence of linear programming hierarchies for Gibbs states of spin systems [11.5] 本稿では,スピン系のギブス分布の下での局所関数の期待値の計算問題を考察する。
第1階層は局所スピンフリップ平等を課し、高エネルギー物理学におけるブートストラップの文献において検討されている。
2番目の階層は、ギブズ状態を固定点とするマルコフ連鎖に基づいており、最適化文献、最近ではブートストラップ文献で研究されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:35:51 GMT)
Estimating stationary mass, frequency by frequency [11.5] 本稿では,指数関数的に$alpha$-mixingプロセスの定常分布によって配置される確率質量を推定する問題を考察する。
総変分距離におけるこの確率ベクトルを推定し、$n$の普遍的一貫性を示す。
我々は、自然の自己正規化統計混合配列の濃度不等式を含む補完ツールを開発し、関連する問題に対する推定器の設計と分析に独立して有用であることを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:08:45 GMT)
Adjusting Model Size in Continual Gaussian Processes: How Big is Big Enough? [11.4] 多くの機械学習モデルでは、トレーニング前にサイズを制御するパラメータを設定する必要がある。
連続学習におけるガウス過程(単層ニューラルネットワーク)に対するこの問題について検討する。
ほぼ最適性能を維持しながらモデルサイズを自動的に調整する手法を開発した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:19:35 GMT)
Common Data Format (CDF): A Standardized Format for Match-Data in Football (Soccer) [11.4] 本研究の目的は,CDF(Common Data Format)と呼ばれる,サッカーデータの均一かつ標準化されたフォーマットを提案することである。
CDFは、マッチシートデータ、ビデオ映像、イベントデータ、追跡データ、およびメタデータの5種類のマッチングデータに対して、最小限のスキーマを定義している。
それは、提供されたデータが明確で、十分にコンテキスト化された(例えば、その証明は明確)ことを保証すること、そして、共通の下流分析タスクを可能にすることを目的としている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:34:47 GMT)
Non-convex matrix sensing: Breaking the quadratic rank barrier in the sample complexity [11.4] 少数の測定値から低ランク線形凸行列を再構成する問題に対して,アルゴリズムの2つのクラスが研究されている。
試料数の因子化勾配は、試料の複雑さの点で核ノルムの最小化と同程度に効率的であることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:28:27 GMT)
On the Merits of LLM-Based Corpus Enrichment [11.4] 我々は、genAIを使って文書コーパスを充実させるという、新しい視点を主張する。
エンリッチメントは、既存のドキュメントを変更したり、新しいドキュメントを生成することに基づいている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:02:14 GMT)
Joint-GCG: Unified Gradient-Based Poisoning Attacks on Retrieval-Augmented Generation Systems [11.3] Retrieval-Augmented Generation (RAG) システムは、応答を生成する前に、外部コーパスから関連文書を取得することで、Large Language Models (LLM) を強化する。
既存の毒殺攻撃戦略は、検索と生成段階を非結合として扱い、その効果を制限している。
Joint-GCGは、レトリバーモデルとジェネレータモデルの両方にわたる勾配ベースの攻撃を統合する最初のフレームワークである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:12:06 GMT)
A Preference-Driven Methodology for High-Quality Solidity Code Generation [11.1] textbfmytitleは、人間の好みを超えて標準DPOを拡張して、定量化されたブロックチェーン固有のメトリクスを組み込む新しいフレームワークである。
本稿では,Pass@k(機能的正当性),Compile@k(機能的正当性),Gas@k(ガス効率),Secure@k(セキュリティ評価)の4つの相補的指標を用いた総合的評価手法を紹介する。
私たちのフレームワークは、すべての臨界次元にわたって既存のアプローチを著しく上回り、66.7%のPass@5、58.9%のGas@5、62.5%のSecure@5を達成しています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:39:17 GMT)
Explainability in Context: A Multilevel Framework Aligning AI Explanations with Stakeholder with LLMs [11.1] 本稿では、AIに対する信頼が、説明書の設計と提供にどのように影響するかを論じる。
このフレームワークは、アルゴリズムとドメインベース、人間中心、社会的説明責任の3つのレイヤで構成されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:54:41 GMT)
BoA: Attention-aware Post-training Quantization without Backpropagation [11.1] トレーニング後の量子化は、リソース制約のあるデバイスに大規模言語モデルをデプロイするための有望なソリューションである。
層間依存関係を考慮し、量子化重みを最適化する新しいバックプロパゲーションフリーPTQアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:19:48 GMT)
FinSage: A Multi-aspect RAG System for Financial Filings Question Answering [11.0] FinSageはマルチモーダルな事前処理パイプラインで、多様なデータフォーマットを統一し、メタデータの要約を生成する。
実験の結果、FinSageは75人の専門家による質問に対して92.51%の印象的なリコールを達成した。
FinSageは、すでに1200人以上が利用しているオンラインミーティングにおいて、財務的な質問応答エージェントとして成功している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:46:36 GMT)
Domain Generalizable Knowledge Tracing via Concept Aggregation and Relation-Based Attention [11.0] 本稿では,知識追跡のための領域一般化手法を提案する。
また,多様な領域からの学生同士の相互作用のシーケンスにおける概念格差を低減するために,概念集約アプローチを提案する。
運動情報を完全に活用するために,ドメイン一般化KTタスクに適した知識追跡モデルDGRKTを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:50:52 GMT)
diffDemorph: Extending Reference-Free Demorphing to Unseen Faces [10.9] diffDeMorphは、視覚的忠実度の高い複合形態画像から成分画像を効果的に切り離す。
本手法は,合成顔画像を用いて生成した形態を訓練し,実形態を検査することにより,その実用性を向上させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:25:33 GMT)
Few Labels are all you need: A Weakly Supervised Framework for Appliance Localization in Smart-Meter Series [10.9] CamALはアプライアンス・パターンのローカライゼーションを弱く管理するアプローチであり、トレーニング対象の家庭におけるアプライアンスの存在に関する情報のみを必要とする。
実世界の4つのデータセットを用いて実施した実験により,CamALが既存の弱教師付きベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:08:34 GMT)
DeviceScope: An Interactive App to Detect and Localize Appliance Patterns in Electricity Consumption Time Series [10.9] DeviceScopeは、個々のアプライアンスパターンを検出し、ローカライズすることによって、スマートメーターデータの理解を容易にするインタラクティブツールである。
本システムは,家電のローカライゼーションに弱い教師付きアプローチであるCamALをベースとしている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:32:38 GMT)
Computational Limits of Low-Rank Adaptation (LoRA) Fine-Tuning for Transformer Models [10.8] 微粒化複雑性理論を用いた変圧器モデルにおけるローランド適応(LoRA)の計算限界について検討する。
我々のキーとなる観察は、LoRA適応の勾配計算における低ランク分解の存在がアルゴリズムの高速化につながることである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:22:09 GMT)
AdvSumm: Adversarial Training for Bias Mitigation in Text Summarization [10.8] 本稿では,テキスト要約におけるバイアスを軽減するためのトレーニングフレームワークAdvSummについて述べる。
AdvSummは、敵対的堅牢性に触発された新しいPerturberコンポーネントを導入し、Sequence-to-Sequenceモデルの埋め込みレベルに勾配誘導摂動を適用した。
筆者らは,AdvSummが,要約品質を損なうことなく,要約に特化して,名称国籍バイアス,政治的フレーミングバイアスを効果的に低減することを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:57:52 GMT)
A novel non-convex minimax $p$-th order concave penalty function approach to low-rank tensor completion [10.8] 低ランクテンソル完備化(LRTC)問題は,部分サンプル情報からテンソルを再構築することを目的としている。
この性能に対処するために、新しいミニマックス$p$-th Order penalty (MPCP)を提案する。
提案したモデルは、視覚的品質と定量的指標の両方において最先端のデータセットより優れている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:43:00 GMT)
Unveiling Markov Heads in Pretrained Language Models for Offline Reinforcement Learning [10.6] 我々は,事前学習言語モデル(PLM)から決定変換器(DT)への知識が,オフライン強化学習(RL)において大きな注目を集めていることを示す。
PLMはRLタスクでうまく機能し、興味深い疑問を提起します。
本稿では,事前学習したDTとMoA(Mixture of Attention)を併用したGPT2-DTMAを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:11:05 GMT)
SATA-BENCH: Select All That Apply Benchmark for Multiple Choice Questions [10.6] 大規模言語モデル(LLM)は、単一回答の複数選択タスクでますます評価される。
多くの実世界の問題は、選択肢の集合から正しい答えを識別する必要がある。
SATA-BENCHは、Select All That Apply 質問における LLM の評価のための最初の専用ベンチマークである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:00:29 GMT)
Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting [10.5] 本稿では,外見符号と二元格子を統一する多スケール二元格子を提案する。
本手法は動的に分離された自律走行シーン再構築における幾何的精度を大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:15:21 GMT)
RoPETR: Improving Temporal Camera-Only 3D Detection by Integrating Enhanced Rotary Position Embedding [10.4] 本稿では,速度推定の高速化を目的としたStreamPETRフレームワークの改良について紹介する。
改良されたアプローチでは、VT-Lバックボーンを用いて70.86%の最先端NDSを実現し、カメラのみの3Dオブジェクト検出のための新しいベンチマークを設定した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:55:27 GMT)
Open Your Eyes: Vision Enhances Message Passing Neural Networks in Link Prediction [10.3] グラフビジョンネットワーク(GVN)と呼ばれる効果的なフレームワークを提案することにより、視覚構造を考慮したグラフニューラルネットワークを実現する。
GVNは、大規模グラフの挑戦を含む、7つのリンク予測データセットにわたるビジョン強化の恩恵を一貫して受けている。
このような改善は既存のSOTA(State-of-the-art)メソッドと互換性があり、GVNは新たなSOTA結果を得る。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:03:54 GMT)
Where Is The Ball: 3D Ball Trajectory Estimation From 2D Monocular Tracking [10.2] 2次元追跡シーケンスから3次元球軌道推定法を提案する。
本手法は,シミュレーションデータのみを訓練しながら,最先端の性能を実現する。
本手法は,スポーツ分析や仮想リプレイにおける様々な応用を開放し,複数の軌跡を持つ実世界のシナリオに一般化することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:42:05 GMT)
State Dependent Optimization with Quantum Circuit Cutting [10.2] 我々はISDOを組み込んだ状態依存最適化(SDO)フレームワーク,新たに提案した測度依存最適化(MSDO),偏りのある可観測選択戦略を提案する。
本稿では,QAOA,QFT,BV回路のノイズシミュレーションについて検証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:59:25 GMT)
Rethinking Semi-supervised Segmentation Beyond Accuracy: Reliability and Robustness [10.2] 信頼性スコア(Reliable Score, RSS)は、予測精度、キャリブレーション、不確実性の測定を調和平均で組み合わせた新しい尺度である。
我々は、半教師付き学習研究と現実世界の展開ニーズをより良く整合させるために、RSSのようなより包括的なメトリクスへの評価プロトコルのシフトを提唱する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:37:45 GMT)
FinanceReasoning: Benchmarking Financial Numerical Reasoning More Credible, Comprehensive and Challenging [10.2] FinanceReasoningは、金融数値推論問題における大きな推論モデル(LRM)の推論能力を評価するために設計された新しいベンチマークである。
4つの公開データセットからの質問の15.6%を更新し、詳細なPythonソリューションで908の新たな質問を注釈付けします。
我々は、3,133個のPython形式の関数を構築し、LEMの金銭的推論能力を高める。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:53:58 GMT)
PROVSYN: Synthesizing Provenance Graphs for Data Augmentation in Intrusion Detection Systems [10.2] プロヴァンスグラフ解析は侵入検知に重要な役割を果たし、特にAPT(Advanced Persistent Threats)に対して重要である。
ProVSYNは,3相パイプラインを通じてプロファイランスグラフを合成する自動フレームワークである。
ProVSYNは高忠実度グラフを生成し,有効データ拡張による検出性能の向上を図っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:41:17 GMT)
Model Collapse in the Self-Consuming Chain of Diffusion Finetuning: A Novel Perspective from Quantitative Trait Modeling [10.2] 本稿では,事前に訓練されたテキスト-画像拡散モデルが生成した画像に基づいて微調整される拡散の連鎖について検討する。
画像品質の悪化は普遍的であり,このモデル崩壊に影響を及ぼす要因としてCFGスケールを同定した。
本稿では,遺伝子変異に触発された簡便かつ効果的な方法として,再利用可能な拡散微細構造(ReDiFine)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:43:49 GMT)
Unveiling Topological Structures from Language: A Comprehensive Survey of Topological Data Analysis Applications in NLP [10.1] トポロジカル・データ・アナリティクス(Topological Data Analysis)は、ノイズにもかかわらずデータの本質的な形状を識別する統計手法である。
トポロジカルデータ分析は、コンピュータビジョンのような構造的に異なる領域に比べて、自然言語処理領域内ではあまり注目を集めていない。
本研究は,これらの研究を理論的および非理論的アプローチに分類した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:40:59 GMT)
A Fisher-Rao gradient flow for entropy-regularised Markov decision processes in Polish spaces [10.0] 無限水平エントロピー規則化マルコフ決定過程に対するフィッシャー・ラオ政策勾配流のポーランド状態と行動空間による大域収束について検討する。
勾配流の大域的健全性を確立し,その指数収束性を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:01:07 GMT)
Graph Attention Networks Unleashed: A Fast and Explainable Vulnerability Assessment Framework for Microgrids [10.0] 独立したマイクログリッドは、孤立した島や戦場での戦闘のようなシナリオにおいて、分散型エネルギー資源と負荷を組み合わせることで、電力供給に不可欠である。
従来のモンテカルロシミュレーション(MCS)法は計算に高価で時間を要する。
本研究では,自己注意プールにより強化されたグラフアテンションネットワークとMCSを統合した,高速かつ説明可能な脆弱性評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:54:52 GMT)
Low-Resource Domain Adaptation for Speech LLMs via Text-Only Fine-Tuning [10.0] 音声を付加することなく、未ペアのターゲットドメインテキストを用いて、音声LLMのテキストのみを微調整する手法を提案する。
LibriSpeech,SlideSpeech,Messicalデータセットの実験により,本手法が競合認識性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:34:29 GMT)
SAGE: A Framework of Precise Retrieval for RAG [9.9] Retrieval-augmented Generation (RAG) は,質問応答タスクの遂行に有意義な能力を示した。
RAGメソッドはセマンティクスを考慮せずにコーパスをセグメントし、関連するコンテキストを見つけるのが困難になる。
これらの制限を克服するために、RAGフレームワーク(SAGE)を導入します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:47:56 GMT)
Information-Theoretic Detection of Unusual Source Code Changes [9.9] 我々は,オープンソースプロジェクトのソースコードの情報内容を情報理論の観点から測定する。
私たちの焦点は、トークンと抽象構文木ノードという、2つの基本的なコード表現のエントロピーにあります。
我々はエントロピーに基づく異常検出を行い、我々のアプローチが60%以上の精度で異常なソースコード変更イベントを効果的に認識できることを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:03:13 GMT)
Towards Robust Multimodal Physiological Foundation Models: Handling Arbitrary Missing Modalities [9.8] 生理オムニ (Phylo Omni) は、マルチモーダルな生理的信号解析の基礎モデルである。
分離されたマルチモーダル・トークンーザを訓練し、マスクされた信号の事前訓練を可能にする。
最先端のパフォーマンスを達成しつつ、モダリティの欠如に対して強い堅牢性を維持します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:41:10 GMT)
When Better Features Mean Greater Risks: The Performance-Privacy Trade-Off in Contrastive Learning [9.7] 本稿では,エンコーダモデルを対象としたMIA攻撃によるプライバシの脅威を系統的に検討する。
本稿では,Lp-Norm Likelihood Attack (LpLA) と呼ばれる特徴ベクトルのpノルムに基づく新しいメンバシップ推論攻撃法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:03:29 GMT)
Pts3D-LLM: Studying the Impact of Token Structure for 3D Scene Understanding With Large Language Models [9.7] 本研究は,3次元トークン構造に関する厳密な研究であり,映像ベースおよび点ベース表現を体系的に比較する。
本稿では,ソナタで事前学習したポイントトランスフォーマーV3エンコーダの3Dポイントクラウド機能を組み込むことで,視覚トークンを充実させる手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:35:26 GMT)
MAPLE: Multi-Agent Adaptive Planning with Long-Term Memory for Table Reasoning [9.6] テーブルベースの質問応答は、現在のLLMが達成に苦慮している複雑な推論機能を必要とする。
我々は,フィードバック駆動ループで作業する認知エージェントを通じて,人間の問題解決を模倣する新しいフレームワークMAPLEを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:21:28 GMT)
Route-and-Reason: Scaling Large Language Model Reasoning with Reinforced Model Router [9.6] 大規模言語モデルの問題解決能力を高めるためには,多段階推論が不可欠であることが証明されている。
しかし、多くの推論ステップは比較的単純であり、より効率的な小規模言語モデルで処理できる。
異種LLM間の協調推論を可能にする新しいフレームワークであるR2-Reasonerを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:18:56 GMT)
Quake: Adaptive Indexing for Vector Search [9.5] 動的環境において低レイテンシと高リコールを維持する適応インデックスシステムであるQuakeを導入する。
評価の結果、動的ワークロードでは、Quakeは1.5-38xのクエリレイテンシ削減と4.5-126xの更新レイテンシ削減を実現している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:58:25 GMT)
Generating Grounded Responses to Counter Misinformation via Learning Efficient Fine-Grained Critiques [9.5] MisMitiFactは、ファクトグラウンドの反レスポンスを大規模に生成するための効率的なフレームワークである。
我々は,手軽なファクトチェックサイトから得られたデータに基づいて訓練された軽量できめ細かな批判モデルを開発する。
フィードバック生成スループットは5倍に向上し、コスト効率が高く、大規模な誤情報低減に非常に適している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:46:09 GMT)
RETENTION: Resource-Efficient Tree-Based Ensemble Model Acceleration with Content-Addressable Memory [9.5] RETENTIONは、ツリーベースのモデル推論のCAMキャパシティ要求を大幅に削減するエンドツーエンドフレームワークである。
本稿では,CAMにおけるドナー状態の広範利用によるメモリ冗長性を軽減するために,2つの革新的なデータ配置戦略を取り入れたツリーマッピング手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:25:51 GMT)
RepoMaster: Autonomous Exploration and Understanding of GitHub Repositories for Complex Task Solving [9.5] RepoMasterは、複雑なタスクを解決するためにGitHubリポジトリを探索、再利用するために設計された、自律的なエージェントフレームワークである。
RepoMasterは関数呼び出しグラフ、モジュール依存グラフ、階層的なコードツリーを構築し、必須コンポーネントを特定する。
新たにリリースしたGitTaskBenchでは、RepoMasterがタスクパス率を24.1%から62.9%に引き上げ、トークン使用率を95%削減しました。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:35:21 GMT)
Explaining Matters: Leveraging Definitions and Semantic Expansion for Sexism Detection [9.5] 本稿では、性差別検出のための2つのプロンプトベースのデータ拡張手法を提案する。
また,複数の言語モデルから補完的な視点を集約することで,予測関係を解消するアンサンブル戦略を導入する。
EDOSデータセットに対する実験的な評価は、すべてのタスクにおける最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:58:12 GMT)
Diffusion as Reasoning: Enhancing Object Navigation via Diffusion Model Conditioned on LLM-based Object-Room Knowledge [9.5] 我々はObjectNavタスクの強化のための新しいアプローチを提案する。
我々は拡散モデルを訓練し、セマンティックマップにおけるオブジェクトの統計分布パターンを学習する。
ナビゲーション中の探索領域の地図を未知領域の地図を生成する条件として利用することにより,対象対象物の長期的目標推論を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:18:14 GMT)
CAT-LLM: Style-enhanced Large Language Models with Text Style Definition for Chinese Article-style Transfer [9.3] 複雑な中国語長文におけるスタイル転送の課題に対処する中国語記事スタイル転送(CAT-LLM)フレームワークを提案する。
Cat-LLMは、記事スタイルを分析し、モデル化するための機械学習アルゴリズムを統合する、bespoke pluggable Text Style Definition (TSD)モジュールを備えている。
内部スタイルツリーの動的拡張をサポートし、新しい多様なスタイル定義をシームレスに組み込むことができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:55:23 GMT)
From Tools to Teammates: Evaluating LLMs in Multi-Session Coding Interactions [9.3] MemoryCodeは、無関係な情報の中で単純なコーディング命令を追跡し実行するためのLarge Language Modelsの機能をテストするために設計されたデータセットである。
その結果,LLMの基本的な制限が強調され,長期的相互作用において効果的に協調する能力が制限された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:12:50 GMT)
Token Signature: Predicting Chain-of-Thought Gains with Token Decoding Feature in Large Language Models [9.3] CoT(Chain-of-Thought)技術は、複雑な推論タスクにおける大規模言語モデル(LLM)の性能向上に有効であることが証明されている。
トークン確率分布の単調性はCoT推論により得られる利得と相関する可能性があることを予備観測する。
トークン確率分布に基づく2つの指標を提案し,異なるタスク間でCoTの有効性を評価する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:53:27 GMT)
Adaptive and Robust Watermark for Generative Tabular Data [9.3] 生成表データに対するフレキシブルでロバストな透かし機構を提案する。
ウォーターマークされたデータセットがデータ品質と下流のユーティリティに無視できる影響があることを理論的および実証的に示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:38:03 GMT)
NeoBERT: A Next-Generation BERT [9.3] NeoBERTは、双方向モデルの能力を再定義する次世代エンコーダである。
すべてのコード、データ、チェックポイント、トレーニングスクリプトをリリースし、研究と実際の採用を加速します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:57:10 GMT)
Cost-Efficient LLM Training with Lifetime-Aware Tensor Offloading via GPUDirect Storage [9.1] TERAIOは低コストPCIeベースのソリッドステートドライブ(SSD)を用いたGPUメモリ拡張のためのフレームワーク
その設計は、各大規模言語反復訓練プロセスにおいて、アクティブテンソルが割り当てられたGPUメモリのごく一部(平均1.7%)しか取らないという我々の観察によって進められている。
TERAIO は様々な LLM のトレーニング性能を平均 1.47 倍改善し,理想性能の 80.7% を達成している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:57:20 GMT)
Direct Behavior Optimization: Unlocking the Potential of Lightweight LLMs [9.1] DeBoPはLwLLMの動作を直接最適化する自動最適化手法である。
現状のLLMが優れているが、LwLLMは一般的に性能が劣る7つの課題についてDeBoPを評価した。
DeBoPに最適化されたLwLLMは、ほとんどのタスクでGPT-3.5を超え、計算時間を約60%削減した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:40:42 GMT)
HeavyWater and SimplexWater: Watermarking Low-Entropy Text Distributions [9.1] 大きな言語モデル(LLM)の透かしは、テキストの証明の認証、機械生成されたテキストの誤用の抑制、AIシステムの信頼の促進を可能にする。
LLMウォーターマーキングは、コーディングのような低エントロピー生成タスクでは困難である。
我々のゴールは、透かし検出の可能性を最大化し、生成したテキストの歪みを最小限に抑えるために、ランダムな側情報をどのように効果的に利用するかを理解することである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:52:34 GMT)
Lagrangian-based Equilibrium Propagation: generalisation to arbitrary boundary conditions & equivalence with Hamiltonian Echo Learning [9.1] GLEP(Generalized Lagrangian Equilibrium Propagation)は、静的入力によるエネルギーベースモデル(EBM)の学習アルゴリズムである。
GLEPはシステムの境界条件に応じて異なる学習アルゴリズムを生成することを示す。
そして, GLEPの特殊な場合として, ハミルトンエコー学習(HEL)が導出可能であることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:17:40 GMT)
Knowledge Graph Embeddings with Representing Relations as Annular Sectors [9.0] 領域ベースの埋め込みモデルは、通常、そのタスクを達成するために、点としてエンティティを埋め込み、幾何学的領域として関係を組み込む。
進歩にもかかわらず、これらのモデルはしばしば実体に固有の意味的階層性を見落としている。
極座標における新しい埋め込みモデルであるセクターEを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:30:36 GMT)
Mirage: A Multi-Level Superoptimizer for Tensor Programs [9.0] 我々は、テンソルプログラムのための最初のマルチレベルスーパー最適化であるMirageを紹介する。
Mirageのキーとなるアイデアは$mu$Graphsで、カーネルにおけるテンソルプログラムの統一表現、スレッドブロック、GPU計算階層のスレッドレベルである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:35:15 GMT)
SatelliteFormula: Multi-Modal Symbolic Regression from Remote Sensing Imagery for Physics Discovery [9.0] リモートセンシング画像から直接物理的に解釈可能な表現を導出する新しい記号回帰フレームワークを提案する。
SatelliteFormulaは、空間スペクトル特徴抽出のためのVision Transformerベースのエンコーダと、物理誘導制約を組み合わせて、一貫性と解釈性を保証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:39:54 GMT)
Bias for Action: Video Implicit Neural Representations with Bias Modulation [8.9] 本稿では,ActINRと呼ばれる暗黙的ニューラル表現(INR)に基づく新しい連続ビデオモデリングフレームワークを提案する。
ビデオINRとこのバイアスINRを合わせてトレーニングすることで、ビデオスローモーションの10ドル、空間超解像の4倍、スローモーションの2倍、デノナイジング、ビデオインペインティングなど、ユニークな機能を示します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:46:55 GMT)
A UD Treebank for Bohairic Coptic [8.9] ボヘリック・コプト語(Bohairic Coptic)は、マムルーク前、ビザンティン・エジプト後期、コプト教会の現代語の主要なコプト語方言である。
本稿では,聖書のテキスト,聖人の生活,キリスト教のアセティック・ライティングなど,さまざまな作品から収集した,ボヘラクティック・コプトの最初の構文的注釈付きコーパスを提示し,評価する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:42:58 GMT)
A Novel, Human-in-the-Loop Computational Grounded Theory Framework for Big Social Data [8.7] 結果の信頼性とロバスト性への信頼は、"Human-in-the-loop"手法を採用することに依存している、と我々は主張する。
本稿では,大規模定性的データセットの分析を支援する計算基底理論(CGT)の方法論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:43:12 GMT)
NILMFormer: Non-Intrusive Load Monitoring that Accounts for Non-Stationarity [8.7] 非侵入負荷モニタリングは、家庭の収集した総消費電力を分散して、個々の家電機器の消費電力を回収する問題である。
NILMの現在の最先端ソリューションは、ディープラーニング(DL)に基づいており、家庭全体の消費状況のサブシーケンスで動作する。
本稿では,新しいサブシーケンス定常化/非定常化方式を組み込んだトランスフォーマーアーキテクチャであるNILMFormerを紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:46:58 GMT)
MEDAL: A Framework for Benchmarking LLMs as Multilingual Open-Domain Chatbots and Dialogue Evaluators [8.7] 本稿では,対話評価ベンチマークの生成,評価,キュレートを行う自動マルチエージェントフレームワークであるMEDALを紹介する。
シードコンテキストの異なるユーザ-チャットボットの多言語対話を生成する。
次に、強いLLMを用いてチャットボットの性能を多次元的に解析し、顕著な言語間性能差を明らかにする。
その後、いくつかの推論と非推論 LLM がオープンドメイン対話の評価器として機能する能力を評価するためにベンチマークが使用される。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:53:36 GMT)
Token Transforming: A Unified and Training-Free Token Compression Framework for Vision Transformer Acceleration [8.6] 本稿では,既存のすべてのメソッドを一般化する多対多のToken変換フレームワークを提案する。
具体的には、40%のFLOPを減らし、DeiT-Sを1.5ドル、限界0.1%の精度低下で加速する。
本手法をセグメント化,オブジェクト検出,深さ推定,言語モデル生成など,高密度な予測タスクに拡張する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:18:11 GMT)
Privacy Perspectives and Practices of Chinese Smart Home Product Teams [8.6] 本報告では,中国のスマートホーム製品チームメンバーを対象に,27件の半構造化インタビューを行った。
我々の結果は、参加者が個人のプライバシーの権利よりも国家安全保障を優先する中国のデータプライバシー法に準拠することを強調したことを示している。
中国固有の文化的、社会的、法的要因も参加者の倫理的配慮や、ユーザーのプライバシーとセキュリティと利便性のバランスに対する態度に影響した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:49:48 GMT)
Zero-Shot Detection of LLM-Generated Code via Approximated Task Conditioning [8.6] LLM(Large Language Model)が生成するコードは、セキュリティ、知的財産権、学術的完全性に影響を及ぼす。
ゼロショットLLM生成符号検出における条件付き確率分布の役割について検討する。
与えられたコードスニペットを生成するのに使用される元のタスクを近似する新しいゼロショット検出手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:23:37 GMT)
MoralCLIP: Contrastive Alignment of Vision-and-Language Representations with Moral Foundations Theory [8.5] MoralCLIPは、明示的な道徳的根拠を持つマルチモーダル学習を拡張する新しい埋め込み表現法である。
MoralCLIPはマルチラベルデータセットSocial-Moral Image Databaseに基づいており、視覚コンテンツにおける道徳的基盤を同一視している。
以上の結果から,モラルコンテンツに対する一元的・多元的理解の両面において,明確なモラル監督が向上することが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:52:13 GMT)
Covering Number of Real Algebraic Varieties and Beyond: Improved Bounds and Applications [8.4] ユークリッド空間における多くの集合の被覆数について上限を証明する。
本稿では,3つの計算応用における結果のパワーについて説明する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:56:11 GMT)
BAQ: Efficient Bit Allocation Quantization for Large Language Models [8.4] 学習後モデルの量子化は、大規模言語モデルのメモリと計算コストを削減するために広く採用されている手法である。
既存の手法の多くは均一またはビット幅の割り当てに依存しており、量子化ノイズに対するウェイトの不均一な感度を考慮できない。
本稿では,Hessianプロキシから得られた感度指標に基づいて,量子化ビット幅を割り当てる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:27:01 GMT)
Towards an Explainable Comparison and Alignment of Feature Embeddings [8.1] 本研究では,組込みの比較を行うSPECフレームワークを提案し,参照データセットのクラスタリングにおける差を識別する。
本稿では、このカーネルベースのアプローチをスケーラブルに実装し、サンプルサイズとともに線形に成長する計算複雑性について述べる。
画像ネットやMS-COCOのような大規模データセット上での埋め込みの比較と整列を行うSPECの適用例を示す数値的な結果を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:50:37 GMT)
Computational bottlenecks for denoising diffusions [8.1] 最適値に非常に近いドリフトが存在するのに対して,ターゲット値から非常に遠い分布を持つ試料が得られた。
サンプリングが容易な確率分布を$mu$で研究することで、逆の証拠を与えるが、拡散過程のドリフトは難解である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:31:17 GMT)
LETS Forecast: Learning Embedology for Time Series Forecasting [8.1] 本稿では,非線形力学系モデリングとディープニューラルネットワークを統合するフレームワークDeepEDMを紹介する。
経験的動的モデリング(EDM)にインスパイアされ、Takensの定理に根ざしたDeepEDMは、時間遅れの埋め込みから潜伏空間を学ぶ新しいディープモデルを提供する。
以上の結果から,DeepEDMは入力ノイズに対して頑健であり,精度の予測において最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:24:12 GMT)
Variance-Reduced Fast Operator Splitting Methods for Stochastic Generalized Equations [8.0] 分散還元推定器のクラスを導入し,その分散還元限界を確立する。
次に,FBS (Accelerated variance-Reduced forward-backward splitting) アルゴリズムを設計する。
提案手法は,期待ノルム上の$mathcalO (1/k2)$と$o (1/k2)$収束率の両方を達成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:12:19 GMT)
Variance-Reduced Fast Krasnoselkii-Mann Methods for Finite-Sum Root-Finding Problems [8.0] 有限和共役方程式 $Gx = 0$ を解くために, 分散還元を伴う高速クラスクラスKrasnoselkii-Mann 法を提案する。
我々のアルゴリズムは単一ループであり、より広範なルートフィンディングアルゴリズムのために特別に設計された、偏りのない分散還元推定器の新たなファミリーを利用する。
数値実験は我々のアルゴリズムを検証し、最先端の手法と比較して有望な性能を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:15:44 GMT)
Bridging the Gap: In-Context Learning for Modeling Human Disagreement [8.0] 大規模言語モデル(LLM)はNLP分類タスクにおいて高い性能を示している。
本研究では,LLMが複数の視点を捉えることができ,ヘイトスピーチや攻撃的言語検出などの主観的タスクにおいてアノテータの不一致を反映できるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:24:29 GMT)
Balancing Beyond Discrete Categories: Continuous Demographic Labels for Fair Face Recognition [8.0] 我々は,アイデンティティごとの離散値ではなく,連続変数としての民族ラベルの使用を改訂することを提案する。
民族ごとの同一のアイデンティティ数を持つことは、バランスの取れたデータセットを表すものではないことを示す。
65以上の異なるモデルをトレーニングし、オリジナルのデータセットの20以上のサブセットを作成しました。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:56:32 GMT)
Federated Foundation Model for GI Endoscopy Images [8.0] ファンデーションモデルは汎用表現を学習することで有望なソリューションを提供する。
ファンデーションモデルトレーニングは通常、広範なデータセットを必要とし、病院は大量のデータを生成するが、プライバシー制限は直接的なデータ共有を妨げている。
本稿では,腹腔鏡画像の基礎モデルをトレーニングするためのFLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:08:37 GMT)
Phonetically-Augmented Discriminative Rescoring for Voice Search Error Correction [7.8] 近年の映画タイトルは、E2E ASRシステムのトレーニングデータでは十分に表現されていない。
本稿では,ASRモデルの出力に基づいて音声検索を行う音声補正システムを提案する。
本手法は,人気映画のベンチマークにおいて,単語誤り率を4.4~7.6%向上させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:25:18 GMT)
Do Large Language Models Reason Causally Like Us? Even Better? [7.7] 大きな言語モデル(LLM)は、人間のようなテキストを生成する際、印象的な能力を示している。
我々は,コライダーグラフに基づくタスクを用いて,ヒトの因果推論と4つのLDMを比較した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:57:08 GMT)
BiAssemble: Learning Collaborative Affordance for Bimanual Geometric Assembly [7.7] 部品を完全な全体に統合するプロセスである形状組み立ては、幅広い現実世界の応用において重要なロボット技術である。
これにより、ロボットは、様々な断片の把握、組み立て、およびその後の双方向の協調操作のための幾何学的手がかりを認識する必要がある。
本稿では,長軸アクションシーケンスを用いた幾何学的組立において,点レベルの可測性の幾何学的一般化と,両面的な協調を意識した学習能力を利用する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:30:16 GMT)
ResPF: Residual Poisson Flow for Efficient and Physically Consistent Sparse-View CT Reconstruction [7.6] スパース・ビュー・コンピュート・トモグラフィー(CT)は、放射線線量を減らすための実用的な方法であるが、結果として生じる逆問題により、正確な画像再構成に重大な課題が生じる。
生成モデリングの最近の進歩、特にポアソンフロー生成モデル(PFGM)は、高忠実度画像合成を可能にする。
本稿では, 残余ポアソンフロー(ResPF)生成モデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:43:35 GMT)
Does It Run and Is That Enough? Revisiting Text-to-Chart Generation with a Multi-Agent Approach [7.6] 大規模な言語モデルでは、自然言語チャートの記述を実行可能なコードに変換することができるが、生成したスクリプトの約15%はまだ実行できない。
本稿では,既製のGPT-4o-miniモデルのみを用いて,ドラフト,実行,修理,判断を分離する軽量マルチエージェントパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:39:17 GMT)
SurGSplat: Progressive Geometry-Constrained Gaussian Splatting for Surgical Scene Reconstruction [7.6] SurGSplatは幾何学的制約を統合することで3Dガウススプラッティング(3DGS)を段階的に洗練するために設計された新しいパラダイムである。
血管構造やその他の重要な特徴の詳細な再構築を可能にすることで、SurGSplatは外科医に視覚的明瞭度を向上させる。
実験により,SurGSplatは新規ビュー合成(NVS)とポーズ推定精度の両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:02:11 GMT)
Identifying Reliable Evaluation Metrics for Scientific Text Revision [7.5] ROUGEやBERTScoreといった従来のメトリクスは主に、意味のある改善を捉えるのではなく、類似性に重点を置いている。
まず手動による注釈研究を行い、異なる修正の質を評価する。
そこで本研究では,NLPドメインの参照不要評価指標について検討する。
LLM-as-a-judge評価とタスク固有のメトリクスを組み合わせたハイブリッドアプローチが,最も信頼性の高いリビジョン品質評価を提供することがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:54:59 GMT)
MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models [7.4] MapEvalは、3つの異なるタスクにわたる基礎モデルを評価するために設計されたベンチマークである。
空間的関係、ナビゲーション、旅行計画、現実世界の地図の相互作用をカバーしている。
ロングコンテキスト推論、APIインタラクション、ビジュアルマップ分析を扱うモデルが必要です。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:14:05 GMT)
Autocomp: LLM-Driven Code Optimization for Tensor Accelerators [7.4] Autocompは、アクセラレータープログラマがドメイン知識とハードウェアフィードバックを利用してコードを最適化することを可能にするアプローチである。
我々はAutocomp最適化コードがベンダーが提供するライブラリよりも高速に5.6倍(GEMM)と2.7倍(畳み込み)を実行することを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:09:51 GMT)
MCA-Bench: A Multimodal Benchmark for Evaluating CAPTCHA Robustness Against VLM-based Attacks [7.3] MCA-Benchは包括的な再現可能なベンチマークスイートである。
不均一なCAPTCHA型を単一の評価プロトコルに統合する。
大規模な実験により、MCA-Benchは現在のCAPTCHA設計の脆弱性スペクトルを効果的にマッピングしていることが明らかになった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:02:01 GMT)
Video LLMs for Temporal Reasoning in Long Videos [7.3] テンポラルVLM(TemporalVLM)は、ビデオ大言語モデルであり、時間的推論を効果的に行い、長いビデオにおいてきめ細やかな理解を可能にする。
我々のアプローチには、長期入力ビデオの時間認識機能へのマッピングと、ローカルおよびグローバルの両方のキューを含むビジュアルエンコーダが含まれる。
本研究では,TemporalVLMの評価を容易にするために,産業集積プロセス,すなわちIndustrialASMの大規模ビデオデータセットを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:24:54 GMT)
SafeGenBench: A Benchmark Framework for Security Vulnerability Detection in LLM-Generated Code [7.2] LLM生成コードのセキュリティ評価に特化して設計されたベンチマークであるベンチマークを導入する。
このベンチマークに基づいて,モデル生成コードにセキュリティ脆弱性が存在することを評価する自動評価フレームワークを開発した。
本稿では,LLMのセキュアコード生成性能について,今後の進歩に有効な知見を提供するとともに,今後の課題を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:48:02 GMT)
Quasi-Bayes empirical Bayes: a sequential approach to the Poisson compound decision problem [7.1] ストリーミングやオンラインドメインにおけるPoisson複合決定問題について検討する。
準ベイズ的手法を用いることで,データの蓄積に伴う観測毎の計算コストの一定値の評価,計算効率,維持が容易な逐次推定値が得られる。
漸近的頻繁主義者は、この推定が確立され、一貫性と最適性を示し、後者は過剰なベイズリスクや後悔を消すものとして理解されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:04:11 GMT)
Emergent Response Planning in LLMs [7.0] 我々は,大規模言語モデル (LLM) が将来,その隠れ表現に先んじることを示す。
この結果は、透明性と生成制御を改善するための潜在的な応用を示唆している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:38:48 GMT)
Over-PINNs: Enhancing Physics-Informed Neural Networks via Higher-Order Partial Derivative Overdetermination of PDEs [7.0] 物理制約を課す補助方程式を生成するためのOver-PINNフレームワークを導入する。
これは、かなりの計算コストを発生させることなく、解の精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:38:13 GMT)
Textile Analysis for Recycling Automation using Transfer Learning and Zero-Shot Foundation Models [6.9] 本稿では, 標準RGB画像, コスト効率のよいセンシングモダリティを, 自動化システムにおける重要な前処理タスクに利用することを検討する。
本稿では,コンベアベルト構成のためのコンピュータビジョンコンポーネントについて,(a)4種類の一般的な織物の分類と,(b)ボタンやジッパーなどの非繊維の特徴のセグメンテーションを行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:49:53 GMT)
MARS: Radio Map Super-resolution and Reconstruction Method under Sparse Channel Measurements [6.9] 本稿では,CNNとトランスフォーマーを組み合わせたマルチスケールAware Radiomap Super- resolution法を提案する。
異なるシーンとアンテナ位置での実験により、MARSはMSEとSSIMの両方でベースラインモデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:50:26 GMT)
GenIR: Generative Visual Feedback for Mental Image Retrieval [6.8] 心的イメージ検索(MIR)の課題について検討する。
MIRは、ユーザーがイメージ検索エンジンとのマルチラウンドインタラクションを通じて、精神的に想定されたイメージの検索を洗練する現実的で過度に探索された環境をターゲットにしている。
本稿では,拡散に基づく画像生成を活用し,各ラウンドにおけるAIシステムの理解を明確化するための生成多ラウンド検索パラダイムであるGenIRを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:28:03 GMT)
Validation of the Critical Reflection and Agency in Computing Index: Do Computing Ethics Courses Make a Difference? [6.7] 計算指標におけるクリティカルリフレクション及びエージェンシーの有効性の証拠を提供する。
我々の心理測定分析は、倫理的発達の異なる次元を示し、信頼性と構築の妥当性を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:53:30 GMT)
Decomposability-Guaranteed Cooperative Coevolution for Large-Scale Itinerary Planning [6.6] 大規模反復計画は、旅行セールスマン問題の変種である。
本稿では,大規模反復計画の分解可能性について分析する。
本稿では,大規模反復計画のための新しい多目的協調進化アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:31:57 GMT)
A semantic embedding space based on large language models for modelling human beliefs [6.6] 我々は、オンラインユーザの議論データを活用し、信念を微調整された大言語モデル(LLM)にマッピングすることで、信念の相互作用を研究する。
この信念空間は、社会問題にまたがる多様な信念の相互接続性と分極を捉えている。
本研究は,既存の信念と新しい信念との距離に基づいて,個人が認知不協和を推定する方法の新たな信念を予測できることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:30:29 GMT)
Anomalous flow in correlated quantum systems: No-go result and multiple-charge scenario [6.4] 関連量子系は古典的な期待に反する熱力学的挙動を示すことができる。
温度勾配に対する異常エネルギーフロー(AEF)は、パラダイム的な例である。
任意の相関量子系間の電荷交換を記述するための一般的なグローバル局所熱力学手法を開発する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:33:47 GMT)
Let's CONFER: A Dataset for Evaluating Natural Language Inference Models on CONditional InFERence and Presupposition [6.4] 本研究では,NLIモデルが条件文の推論をどのように処理するかを評価するための新しいデータセットであるConFERを紹介する。
2つの事前学習モデルを含む4つのNLIモデルの性能を評価し、条件付き推論への一般化について検討する。
以上の結果から,NLIモデルは条件付き推論に苦慮し,既存のNLIデータセットの微調整が必ずしも性能を向上するとは限らないことが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:42:20 GMT)
Uncertainty Propagation in the Fast Fourier Transform [6.4] 本稿では,信念の伝播と期待の伝播を用いたベイズ近似の効率的な枠組みを提案する。
提案手法は, 高精度な平均および分散推定値による安定収束を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:56:26 GMT)
Regret-Free Reinforcement Learning for LTL Specifications [6.3] 本稿では,線形時間論理(LTL)仕様を未知の力学系に対して学習する最初のオンラインアルゴリズムを提案する。
我々の中心となる技術的成果は、MDP上の無限水平リーチ回避問題に対する後悔のない学習アルゴリズムである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:51:04 GMT)
On Efficient Estimation of Distributional Treatment Effects under Covariate-Adaptive Randomization [6.3] 既製の機械学習手法を利用したフレキシブルな分散回帰フレームワークを提案する。
提案する推定器の分布を確立し,有効な推論手順を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:14:38 GMT)
Positional Encoding meets Persistent Homology on Graphs [6.3] 位置符号化(PE)と永続ホモロジー(PH)はこの問題を軽減するための有望なアプローチとして現れている。
PEとPHの相対的メリットと欠点を厳密に理論的に評価した。
我々の知見は、PHとPEの両方よりも明らかに表現力が高い、新しい学習可能なPiPEの設計を示唆する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:22:17 GMT)
CP-Bench: Evaluating Large Language Models for Constraint Modelling [6.3] 制約プログラミング(CP)は、よく適合した問題解決パラダイムであるが、その中核となるプロセス、すなわち制約モデリングは、広く採用されるボトルネックである。
近年,Large Language Models (LLM) をモデリングアシスタントとして使用し,問題記述を実行可能な制約モデルに変換する研究が行われている。
CP-Benchは、様々な既知の問題クラスを含む新しいベンチマークデータセットである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:56:02 GMT)
Hallucinate, Ground, Repeat: A Framework for Generalized Visual Relationship Detection [6.3] 本研究では,大規模言語モデル(LLM)を構造化されたリレーショナルプリミティブとして活用する,反復的なビジュアルグラウンドディングフレームワークを導入する。
予測最大化(EM)にインスパイアされた本手法は,LLMを用いて検出対象から候補シーングラフを生成することと,視覚モデルを用いてこれらの仮説を知覚的証拠(最大化)と整合させる訓練とを交互に行う。
オープンワールドVRDのための新しいベンチマークをVisual Genomeに導入し、21の予測付きで評価し、3つの設定で評価する。このモデルでは、LLMのみ、少数ショット、およびデバイアスベースラインを上回り、平均リコール(mR@50)を達成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:43:15 GMT)
Integer Linear Programming Preprocessing for Maximum Satisfiability [6.1] 最近のMaxSAT評価では、ほとんどのMaxSATソルバはポートフォリオの一部としてILPソルバを採用している。
本稿では,Linear Programming (ILP) プリプロセッシング技術がMaxSAT解決に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:21:38 GMT)
Thermally activated detection of dark particles in a weakly coupled quantum Ising ladder [6.1] ダーク粒子は(準)局所的な操作によって基底状態から励起することはできない。
その結果,暗黒粒子の存在を検証するための実用的な基準が得られた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:16:06 GMT)
Adapting Under Fire: Multi-Agent Reinforcement Learning for Adversarial Drift in Network Security [6.1] 進化する攻撃は、従来のネットワークセキュリティ手法の限界を露呈している。
本稿では,2つのエージェントが時間とともにポリシーを改善する環境を設計する。
ブルーエージェントはモデル精度をわずか2~3ステップで30%向上させ、それぞれ25~30サンプルしか使用しない。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:38:37 GMT)
A Cognac shot to forget bad memories: Corrective Unlearning in GNNs [6.1] 我々は,最近定式化された矯正的未学習の問題について検討した。
現在のグラフアンラーニング手法は、操作された集合が全て知られている場合でも、操作の効果を解き放たない。
コニャックというグラフアンラーニング手法を導入し、5%しか特定されていない場合でも操作セットの効果を解き放つことができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:32:58 GMT)
FuseUNet: A Multi-Scale Feature Fusion Method for U-like Networks [6.1] 本稿では,UNet復号処理を初期値問題として再定義する,新しいマルチスケール機能融合法を提案する。
ACDC、KiTS2023、MSD脳腫瘍、ISIC皮膚病変セグメンテーションデータセットの実験は、機能利用の改善、ネットワークパラメータの削減、高性能の維持を実証した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:34:06 GMT)
EqCollide: Equivariant and Collision-Aware Deformable Objects Neural Simulator [6.1] EqCollideは、変形可能な物体とその衝突に対する最初のエンドツーエンド同変ニューラルネットワークシミュレータである。
実験の結果、EqCollideは様々なオブジェクト構成に対して正確で安定でスケーラブルなシミュレーションを実現することがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:49:58 GMT)
A Theoretical Study of (Hyper) Self-Attention through the Lens of Interactions: Representation, Training, Generalization [6.0] 一つの層に線形な自己アテンション(自己アテンション)が一対の相互作用を捉えた関数を効率的に表現し、学習し、一般化することができることを示す。
本分析は,学習中に観察される相互作用パターンの多様性について,最小限の仮定の下で,自己意識が相互相互作用学習者として機能することを明らかにする。
我々は、エンティティ間の異なる特徴レベルの相互作用の結合を学習するために設計された、新しいニューラルネットワークモジュールであるHyperFeatureAttentionを紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:44:10 GMT)
Loss Functions for Predictor-based Neural Architecture Search [6.0] 性能予測器における損失関数に関する最初の包括的な研究を行い、これらを回帰、ランキング、重み付き損失関数の3つのタイプに分類した。
その結果,損失関数の特定のカテゴリを効果的に組み合わせて予測器ベースのNASを向上できることが判明した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:36:46 GMT)
A Deep Learning Approach for Facial Attribute Manipulation and Reconstruction in Surveillance and Reconnaissance [6.0] 監視システムはセキュリティと偵察において重要な役割を果たすが、その性能は低品質の画像やビデオによって損なわれることが多い。
既存のAIベースの顔分析モデルは、皮膚のトーンの変化と部分的に隠された顔に関連するバイアスに悩まされている。
本稿では,データセットのバイアスを補うための合成トレーニングデータを生成することにより,監視機能を向上させるデータ駆動プラットフォームを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:09:17 GMT)
BrainMorph: A Foundational Keypoint Model for Robust and Flexible Brain MRI Registration [5.9] 本稿では,最近提案されたKeyMorphフレームワークに基づく汎用脳MRI登録のためのキーポイントベース基礎モデルを提案する。
BrainMorphと呼ばれる私たちのモデルは、マルチモーダル、ペアワイド、スケーラブルなグループワイド登録をサポートするツールとして機能します。
BrainMorphは、頭蓋骨と非頭蓋骨の巨大なデータセットで訓練されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:23:04 GMT)
To Protect the LLM Agent Against the Prompt Injection Attack with Polymorphic Prompt [5.9] 本稿では,ポリモルフィック・プロンプト・アセンブラという,新しい軽量防衛機構を提案する。
アプローチは、インジェクションのインジェクションがシステムプロンプトの構造を推測し、壊す必要があるという洞察に基づいている。
PPAは攻撃者がプロンプト構造を予測するのを防ぎ、性能を損なうことなくセキュリティを向上させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:50:57 GMT)
Driven-dissipative quantum battery with nonequilibrium reservoirs [5.7] 外部駆動と消散の両方の下で量子電池システムについて検討する。
非平衡のシナリオでは、補償機構によって量子電池の充電効率と電力の両方を最適化することができる。
本研究は,量子デバイスの性能を常に向上させるという一般的な仮定に挑戦する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:49:54 GMT)
You Only Fine-tune Once: Many-Shot In-Context Fine-Tuning for Large Language Model [5.7] 大規模言語モデル(LLM)は、文脈内学習(ICL)を実行する優れた能力を持っている
many-Shot In-Context Fine-tuning (ManyICL)は、ICLの原則をマルチショット設定に拡張することで、このパフォーマンスギャップを著しく狭める。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:36:04 GMT)
A Driving Regime-Embedded Deep Learning Framework for Modeling Intra-Driver Heterogeneity in Multi-Scale Car-Following Dynamics [5.6] 本稿では、離散駆動方式を車体運動予測に組み込む新しいデータ駆動型自動車追従フレームワークを提案する。
提案したハイブリッドディープラーニングアーキテクチャは、離散運転系統分類のためのGated Recurrent Unitsと、連続的キネマティック予測のためのLong Short-Term Memory Networkを組み合わせたものである。
このフレームワークはアクセラレーションの予測誤差を著しく減らし(最大MSE改善は58.47%に達した)、速度と距離を計測し、重要な交通現象を再現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:19:33 GMT)
Do we need rebalancing strategies? A theoretical and empirical study around SMOTE and its variants [5.6] 我々はSMOTE密度の非漸近上界を複数導出した。
我々は、SMOTEが元のマイノリティのサンプルをコピーする傾向があることを証明した。
我々はSMOTEを理論的な知見に基づいて適用し,2つの新しい変種を導入した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:19:38 GMT)
Grokking Beyond the Euclidean Norm of Model Parameters [5.5] グラッキング(Grokking)とは、勾配に基づく手法でニューラルネットワークを最適化する際の追従の遅延を指す。
グラッキングは, 明示的あるいは暗黙的に, 正規化によって引き起こされることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:44:28 GMT)
BARK: A Fully Bayesian Tree Kernel for Black-box Optimization [5.5] ベイズ加法回帰木(BART)のガウス過程の観点からベイズ最適化を行う。
我々の BART Kernel (BARK) はツリーアグリーメントを用いて断片的整合関数の後方定義を行い、マルコフ連鎖モンテカルロアプローチを用いてツリーカーネルの空間を探索する。
本実験は,BARKの総合ベンチマークおよび応用ベンチマークにおける高い性能を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:22:03 GMT)
Robust sensor fusion against on-vehicle sensor staleness [5.5] センサモード間の時間的ミスアライメントは、一貫性のないオブジェクト状態推定につながる。
この問題に対処するための新しいモデルに依存しないアプローチを提案する。
われわれの手法は、同期条件と古い条件の両方で一貫して良い性能に到達している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:18:54 GMT)
AMPED: Adaptive Multi-objective Projection for balancing Exploration and skill Diversification [5.4] 本稿では,探索とスキル多様化のバランスをとるための適応多目的投影法(AMPED)を提案する。
AMPEDは、探索とスキル多様性の目標をバランスさせ、対立を緩和し、チューニングへの依存を減らすための勾配手術技術を導入している。
提案手法は,様々なベンチマークにおいてSBRLベースラインを超えている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:59:39 GMT)
Direct Fisher Score Estimation for Likelihood Maximization [5.3] 確率関数が難解である場合の逐次確率問題について検討する。
本稿では,局所的なスコアマッチング手法に基づいて,フィッシャースコアを直接モデル化する勾配に基づく最適化手法を提案する。
我々は,スムース化によるバイアスの限界を含む,スコア推定器の理論的保証を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:19:14 GMT)
Exponential Family Variational Flow Matching for Tabular Data Generation [5.3] 本研究では,表データ生成のための変分フローマッチング(VFM)手法であるTabbyFlowを開発した。
異種データ型を表すEF-VFM(Exponential Family Variational Flow Matching)を提案する。
また,Bregmanの発散に基づく変動流整合と一般化流整合の関連性を確立する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:07:48 GMT)
Technical Report for Egocentric Mistake Detection for the HoloAssist Challenge [5.3] 手続き的エラーと実行的エラーの両方を処理するオンライン誤り検出フレームワークを導入する。
誤りを検知すると、説明的フィードバックを生成するために大きな言語モデル(LLM)を使用する。
HoloAssistベンチマークの実験により,本手法の有効性が確認された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:39:09 GMT)
Tau-Eval: A Unified Evaluation Framework for Useful and Private Text Anonymization [5.2] 本稿では,テキスト匿名化手法をベンチマークするオープンソースフレームワークであるTau-Evalを紹介する。
Pythonライブラリ、コード、ドキュメント、チュートリアルが公開されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:59:35 GMT)
How to craft a deep reinforcement learning policy for wind farm flow control [5.2] タービン間のウェイク効果は、風力発電所全体のエネルギー生産を著しく減少させる。
既存の機械学習アプローチは、準静的な風条件や小さな風力発電に限られている。
本研究は、ウェイクステアリングポリシーを開発するための、新しい深層強化学習手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:07:05 GMT)
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models [5.2] LauraTSEは、ターゲット音声の離散表現の初期層を生成する、小規模の自動回帰デコーダのみの言語モデルを採用している。
一段階エンコーダのみの言語モデルは、混合と参照音声の両方からの情報を統合することにより、完全な表現を再構築する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:00:41 GMT)
Understanding Memorization in Generative Models via Sharpness in Probability Landscapes [5.1] 本稿では,ログ確率密度のシャープネスを用いて拡散モデルの記憶度を解析するための幾何学的枠組みを提案する。
本稿では,潜時拡散モデルにおける画像生成の初期段階におけるシャープネスを定量化する手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:19:07 GMT)
GraphCheck: Multi-Path Fact-Checking with Entity-Relationship Graphs [5.1] GraphCheckは、クレームを構造化および体系的な検証のためにエンティティ関連グラフに変換するフレームワークである。
DP-GraphCheckは、ダイレクトプロンプトとGraphCheckを適応的に選択するために軽量戦略セレクタを使用する変種である。
提案手法は既存の手法,特にマルチホップクレームよりも優れている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:48:34 GMT)
Similarity Matching Networks: Hebbian Learning and Convergence Over Multiple Time Scales [5.1] 本研究では,主部分空間投影のための固有性マッチングネットワークの検討と解析を行う。
マルチレベル最適化フレームワークを利用することで、オフライン環境でのダイナミクスの収束を証明できる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:46:22 GMT)
Persistent Homology of Topic Networks for the Prediction of Reader Curiosity [5.1] テキストのセマンティック構造内の意味情報ギャップを定量化し,読み手好奇心をモデル化するフレームワークを提案する。
その結果,ベースラインモデルに比べて好奇性予測が有意に向上していることが実験的に示された。
このパイプラインは、テキスト構造と読者エンゲージメントとの関係を解析するための新しい計算方法を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:11:10 GMT)
Dy3DGS-SLAM: Monocular 3D Gaussian Splatting SLAM for Dynamic Environments [5.1] モノクロRGB入力を用いた動的シーンのための3次元ガウススティング(3DGS)SLAM法であるDy3DGS-SLAMを提案する。
その結果,Dy3DGS-SLAMは動的環境下での最先端のトラッキングとレンダリングを実現することがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:43:41 GMT)
MergeRepair: An Exploratory Study on Merging Task-Specific Adapters in Code LLMs for Automated Program Repair [5.0] 大規模言語モデル(LLM)は、いくつかのソフトウェア開発関連のタスクで高い能力を示している。
アダプタは特定のニーズに合わせてLSMをカスタマイズするより効率的な方法を提供する。
モデル(およびアダプタ)のマージは、複数のタスクが可能な1つのモデルを開発する技術として登場した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:09:35 GMT)
On generating direct powers of dynamical Lie algebras [5.0] これは$K ge 1$に対して$mathfrakg_A'cong bigoplus_j=1Kmathfrakg_A$となる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:29:48 GMT)
Neural Collapse in Cumulative Link Models for Ordinal Regression: An Analysis with Unconstrained Feature Model [5.0] 我々は、通常神経崩壊(ONC)と呼ばれる現象が実際に出現し、以下の3つの特性によって特徴付けられることを示した。
特に、ゼロ正則化極限では、潜伏変数としきい値の間に非常に局所的で単純な幾何学的関係が現れる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:57:02 GMT)
Scalable unsupervised feature selection via weight stability [4.8] アンサンプの特徴選択は、高次元データのクラスタリング性能向上に不可欠である。
我々は、ミンコフスキー重み付き$k$-means++という、ミンコフスキー重み付き$k$-means++の新しい初期化戦略を紹介した。
我々は,安定かつ情報的特徴を特定するために,ミンコフスキー指数の多種多様な特徴量を集約するFS-MWK++と,サブ教師付きクラスタリングに基づくスケーラブルなバリエーションであるSFS-MWK++という2つの新しい特徴選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:24:41 GMT)
Physics-Informed Neural Networks for Control of Single-Phase Flow Systems Governed by Partial Differential Equations [4.8] 物理インフォームド・ニューラルネット・フォー・コントロール(PINC)フレームワークを拡張して,ニューラルネットワークと物理保存法則を統合する。
PDEのPINCモデルは、幅広い制御入力に対する平衡解を学習する定常ネットワークと、時間変化境界条件下で動的応答をキャプチャする過渡的ネットワークの2段階に構成されている。
本研究では,物理法則のみを用いてトレーニングされたPINCモデルを用いて,流れのダイナミクスを正確に表現し,リアルタイム制御が可能であることを実証し,数値実験により本手法の有効性を検証した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:50:19 GMT)
Boolean matrix logic programming for active learning of gene functions in genome-scale metabolic network models [4.8] ゲノムスケールの代謝ネットワークモデル(GEM)は、生物学的システムの遺伝子工学を評価するために広く用いられている。
GEMは、主に遺伝子相互作用の不完全なアノテーションのために、遺伝子組み換え細胞の振る舞いを正確に予測できないことが多い。
我々は、費用対効果実験をガイドし、解釈可能な論理プログラムを用いて、モデル細菌の最先端GEMを符号化する新しいシステム、BMLP_active$を開発する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:46:24 GMT)
There's Waldo: PCB Tamper Forensic Analysis using Explainable AI on Impedance Signatures [4.7] 印刷回路基板(PCB)のセキュリティは、電子システムに重大なリスクをもたらすタンパリングを含むサプライチェーンの脆弱性によって、ますます重要になっている。
グローバルカバレッジを持つ非侵襲的で信頼性の高いPCBタンパ検出手法の1つは、PCBの電源ネットワーク(PDN)のインピーダンス特性である。
本稿では,インピーダンスシグネチャに関する説明可能なAI(XAI)を用いた新しいPCB法医学的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:31:49 GMT)
AS-ASR: A Lightweight Framework for Aphasia-Specific Automatic Speech Recognition [4.7] AS-ASRはWhisper-tinyに基づく軽量な失語特異的音声認識フレームワークである。
提案手法は,様々な比率で標準音声と失語音声を体系的に組み合わせ,ロバストな一般化を実現する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:38:53 GMT)
BestServe: Serving Strategies with Optimal Goodput in Collocation and Disaggregation Architectures [4.7] BestServeは,様々な運用シナリオ下での実績を推定することで,サービス戦略のランク付けを行う新しいフレームワークである。
我々のフレームワークは、単一の標準CPU上で数分で最適な戦略を決定し、コストのかかるベンチマークを不要にします。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:40:10 GMT)
Overcoming Challenges of Partial Client Participation in Federated Learning : A Comprehensive Review [4.7] Federated Learning(FL)は、異なるクライアントから生データを開示することなく、共有グローバルモデルを協調的にトレーニングする学習メカニズムである。
本稿では、FLにおける部分的クライアント参加の影響について広範な調査を行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:35:34 GMT)
A Certified Unlearning Approach without Access to Source Data [4.6] 有効なデータ除去を実現するための認定アンラーニングフレームワークを提案する。
提案手法では,ソースデータの統計特性を近似したサロゲートデータセットを用いる。
その結果,プライバシに敏感な設定におけるアプローチの有効性と信頼性が示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:22:47 GMT)
Synthetic Problem Generation for Reasoning via Quality-Diversity Algorithms [4.6] SPARQ: Quality-Diversity Algorithmによる推論のための合成問題生成について述べる。
1つのモデルのみを用いて高品質で多様な合成数学問題と解対を生成する。
本研究では, 生成したデータを難易度でフィルタリングし, 同じモデルを微調整することで, 相対モデルの性能を最大24%向上させることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:49:42 GMT)
TimeWak: Temporal Chained-Hashing Watermark for Time Series Data [4.6] TimeWakは時系列拡散モデルのための最初の透かしアルゴリズムである。
TimeWakは、時間的連鎖したハッシュの透かしを、実際の時間的特徴空間に直接埋め込む。
我々は,TimeWakが合成データ品質,透かし検出性,堅牢性に与える影響を,様々な後処理攻撃下で評価した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:47:45 GMT)
Eigenspectrum Analysis of Neural Networks without Aspect Ratio Bias [4.5] 近年、重量行列の固有スペクトルによるディープニューラルネットワーク(DNN)の診断が活発な研究領域となっている。
重量行列のアスペクト比が重み度推定値に与える影響を考察する。
固定アスペクト比のサブサンプリングによる重み行列の正規化手法であるFARMSを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:59:28 GMT)
LDPM: Towards undersampled MRI reconstruction with MR-VAE and Latent Diffusion Prior [4.5] 拡散モデルを用いてMRI再構成を解こうとする研究もあるが、これらの手法はピクセル空間で直接動作する。
リッチな視覚的背景を持つ自然画像に事前学習した潜時拡散モデルでは,MRI再構成における高い計算コストの問題を解くことが期待されている。
LDPM法(Latent Diffusion Prior-based Undersampled MRI reconstruction)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:25:15 GMT)
NeurNCD: Novel Class Discovery via Implicit Neural Representation [4.5] NeurNCDは、新しいクラス発見のための汎用的でデータ効率のよいフレームワークである。
本フレームワークはオープン・クローズド・ワールド・セッティングの両方において優れたセグメンテーション性能を実現する。
提案手法は,NYUv2 と Replica のデータセットにおける最先端のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:43:34 GMT)
MATP-BENCH: Can MLLM Be a Good Automated Theorem Prover for Multimodal Problems? [4.5] MATP-BENCH(Multimodal Automated Theorem Proving benchmark)を導入する。
MATP-BENCHは、高校、大学、および競争レベルの数学から引き出された1056のマルチモーダル定理からなる。
MATP-BENCHを用いて、様々な高度なマルチモーダル言語モデルを評価する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:33:12 GMT)
Optimizing Cloud-to-GPU Throughput for Deep Learning With Earth Observation Data [4.5] ペタバイト規模の地球観測(EO)データに基づくディープラーニングモデルのトレーニングには、データストレージから計算リソースを分離する必要がある。
標準的なPyTorchデータローダは、クラウドストレージから直接GeoTIFFファイルをストリーミングする際に、最新のGPUを利用できない。
クラウドオブジェクトストレージとローカルSSDの両方からGeoTIFFロードスループットをベンチマークし、異なるローダ構成とデータパラメータを体系的にテストする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:54:13 GMT)
Highway to Hull: An Algorithm for Solving the General Matrix Code Equivalence Problem [4.5] 本稿では,一般の場合の行列符号等価問題を解く新しいアルゴリズムを提案する。
我々のアルゴリズムは、ナラヤナンのエフェットal.と同じ時間複雑さを達成できるが、空間の複雑さは低い。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:48:24 GMT)
Banyan: Improved Representation Learning with Explicit Structure [4.4] 明示的な階層構造を利用して意味表現を効率的に学習するモデルであるBanyanを提案する。
リソース制約のある環境での効率よく解釈可能なNLPの可能性を強調している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:42:01 GMT)
A Systematic Review of Poisoning Attacks Against Large Language Models [4.4] 広範囲なLSM中毒攻撃の分類に適用可能な包括的中毒脅威モデルを提案する。
毒の脅威モデルには、攻撃の物流と操作戦略を定義する4つの毒の攻撃仕様と、攻撃の重要な特徴を測定するために使用される6つの毒の指標が含まれる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:32:43 GMT)
AQUATIC-Diff: Additive Quantization for Truly Tiny Compressed Diffusion Models [4.4] この研究は、拡散モデル圧縮の問題にコードブックベースの加算ベクトル量子化を適用する。
We report sFID 1.92 points lower than the full-precision model at W4A8 and the best-reported results for FID, sFID and ISC at W2A8。
また、効率的な推論カーネルを介して、任意のハードウェア上でFLOPの節約を実証することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:37:09 GMT)
Improved Allergy Wheal Detection for the Skin Prick Automated Test Device [4.4] Skin Prick Automated Test (SPAT) はテスト結果の一貫性を高めるために設計された。
吸入アレルギーの疑いのある患者868ドルのSPATデータを用いて,これらの画像から捕鯨を検出・デライン化するための自動手法を考案した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:31:22 GMT)
Defurnishing with X-Ray Vision: Joint Removal of Furniture from Panoramas and Mesh [4.3] テクスチャメッシュとそれに対応するパノラマ画像として表現された室内空間の劣化したレプリカを生成するパイプラインを提案する。
まず、メッシュ表現から家具を分割、取り除き、平面を拡張し、穴を埋め、単純化された廃メッシュ(SDM)を得る。
次にこれらをガイドとして、ControlNetの塗り絵を通してパノラマ画像から家具を取り除きます。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:08:37 GMT)
Assessing the Impact of Anisotropy in Neural Representations of Speech: A Case Study on Keyword Spotting [4.3] 本研究は,文書言語学におけるキーワードスポッティングにおける異方性を評価する。
異方性にもかかわらず、wav2vec2類似性は、転写のない単語を効果的に識別する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:52:56 GMT)
SDN-Based False Data Detection With Its Mitigation and Machine Learning Robustness for In-Vehicle Networks [4.3] 本稿では,車載ネットワークを対象としたFDDMS(False Data Detection and Mitigation System)を提案する。
FDDMSは、偽データインジェクション攻撃をリアルタイムで監視し、検出するように設計されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:09:36 GMT)
Sketched Equivariant Imaging Regularization and Deep Internal Learning for Inverse Problems [4.3] 等変イメージング(EI)正則化は、ディープイメージングネットワークの教師なしトレーニングにおけるデファクト技術となっている。
本稿では,ランダムなスケッチ手法を応用したスケッチ付きEI正規化手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:52:23 GMT)
Dissecting Bias in LLMs: A Mechanistic Interpretability Perspective [4.2] 大規模言語モデル(LLM)は、社会的、人口統計学的、性別的偏見を示すことが知られている。
我々は、GPT-2やLlama2のようなモデルの中で、そのようなバイアスがどのように構造的に表現されるかを分析する。
これらの成分を除去することで、バイアスのある出力を削減できるだけでなく、他のNLPタスクにも影響を及ぼすことを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:35:43 GMT)
Testing and learning structured quantum Hamiltonians [4.1] 正規化フロベニウスノルムの下で、未知の$n$qubit Hamiltonian $H$をクエリからその進化作用素 $e-iHt$ までテストし、学習する問題を考察する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:33:44 GMT)
In a Few Words: Comparing Weak Supervision and LLMs for Short Query Intent Classification [4.0] ユーザ意図の分類を,情報カテゴリ,ナビゲーションカテゴリ,トランザクションカテゴリに経験的に比較する。
以上の結果から,LSMはリコール時の監督能力が劣る一方で,精度の低下に悩まされ続けていることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:20:41 GMT)
pLDDT-Predictor: High-speed Protein Screening Using Transformer and ESM2 [4.0] 高速なタンパク質スクリーニングツールであるpLDDT-Predictorを導入する。
我々のモデルは、Pearsonの相関でAlphaFold2のpLDDTのスコアを0.7891と予測し、タンパク質を平均0.007秒で処理する。
pLDDT-Predictorは150万の多様なタンパク質配列の包括的データセットを用いて,高信頼構造を正確に分類することを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:56:59 GMT)
HAVIR: HierArchical Vision to Image Reconstruction using CLIP-Guided Versatile Diffusion [3.9] 脳の活動から視覚情報を再構築することは神経科学とコンピュータビジョンのギャップを埋める。
HAVIRは複雑なシナリオにおいても視覚刺激の構造的特徴と意味的情報の両方を再構築する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:33:49 GMT)
DriveAction: A Benchmark for Exploring Human-like Driving Decisions in VLA Models [3.9] VLA(Vision-Language-Action)モデルには高度な自律運転があるが、既存のベンチマークにはシナリオの多様性、信頼性の高いアクションレベルのアノテーション、人間の好みに沿った評価プロトコルが欠けている。
我々は,2,610の駆動シナリオから生成された16,185のQAペアからなる,VLAモデル用に特別に設計された最初のアクション駆動ベンチマークであるDriveActionを紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:30:52 GMT)
User Altruism in Recommendation Systems [3.9] レコメンデーションシステム(RecSys)に基づくソーシャルメディアプラットフォームのユーザは、プラットフォームコンテンツと戦略的に対話し、将来のレコメンデーションに影響を与える。
このようなプラットフォームでは、ユーザーは大規模草の根運動を形成するために文書化されており、アルゴリズムによって抑圧されたコンテンツと対話し、その推奨を「ブースト」するよう促している。
ユーザとRecSysの間のゲームについて検討し、ユーザがRecSys(潜在的に操作された)のコンテンツに対する好みを提供する。
結果がいくつかのモデルの誤用に対して堅牢であることを示し、その結果を裏付ける。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:19:41 GMT)
Practical Secure Delegated Linear Algebra with Trapdoored Matrices [3.8] 我々は、高速でデータ公開のデリゲート線型代数に対する自然効率性とセキュリティデシダータを述べる。
我々はサーバのサブ線形オーバーヘッド、クライアントの計算コストを劇的に削減し、以前のアルゴリズムよりも様々な実用的な利点を享受する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:06:40 GMT)
DebFlow: Automating Agent Creation via Agent Debate [3.8] DebFlowは、リフレクションを最適化し、統合して改善するための議論のメカニズムを使用するフレームワークである。
提案手法は,HotpotQA,MATH,ALFWorldを含む6つのベンチマークデータセットで評価した。
トレーニング中、我々のフレームワークは最先端のベースラインと比較してリソース消費を37%削減します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:01:46 GMT)
Improving Numerical Stability of Normalized Mutual Information Estimator on High Dimensions [3.8] k-Nearest Neighbor (k-NN) に基づく手法を用いて正規化された相互情報を推定するには、スケーリング不変なk-NN半径の計算が必要となる。
本研究では,高次元空間における半径計算の数値安定性を向上させる対数変換手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:42:30 GMT)
GroMo: Plant Growth Modeling with Multiview Images [3.7] 本稿では,植物齢予測と葉数推定の2つの主要な課題を対象とした成長モデル(GroMo)課題を提案する。
GroMo Challengeは、植物の成長を追跡し予測するための革新的なソリューションを奨励することで、植物の表現型研究を進めることを目的としている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:25:15 GMT)
Simultaneous imaging of vibrational, rotational, and electronic wave packet dynamics in a triatomic molecule [3.7] 振動, 回転, 電子自由度の相互作用が分子波パケットの進化を制御していることを示す。
時間分解クーロン爆発画像(CEI)と量子機械波パケットシミュレーションを用いて分子の曲げ振動を直接マッピングする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:51:47 GMT)
MOGO: Residual Quantized Hierarchical Causal Transformer for High-Quality and Real-Time 3D Human Motion Generation [3.7] MOGOは、効率的でリアルタイムな3Dモーション生成に適した新しい自動回帰フレームワークである。
MoGOは、運動スケール適応型残留ベクトル量子化モジュールであるMoSA-VQと、残留量子化階層型因果変換器であるRQHC-Transformerの2つの重要なコンポーネントから構成される。
意味的忠実性を高めるために,テキスト制御下での動作復号化を改善するテキスト条件アライメント機構を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:26:54 GMT)
ScriptDoctor: Automatic Generation of PuzzleScript Games via Large Language Models and Tree Search [3.6] ScriptDoctorは、PuzzleScriptでゲームを自動的に生成し、テストするための大規模言語モデル駆動システムである。
ゲームデザインのアイデアを反復ループで生成し、テストする。
これは、新しいゲームコンテンツを生成する上で、自動化されたオープンエンドのLLMベースの可能性の具体的な例として機能する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:40:19 GMT)
A PID-Controlled Tensor Wheel Decomposition Model for Dynamic Link Prediction [3.5] 本研究では, PID制御型テンソルホイール分解(PTWD)モデルについて述べる。
提案するPTWDモデルは,他のモデルと比較して高精度なリンク予測機能を有する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:39:13 GMT)
WER We Stand: Benchmarking Urdu ASR Models [3.5] 本稿では,Urdu Automatic Speech Recognition(ASR)モデルの総合評価を行う。
単語誤り率(WER)を用いた3種類のASRモデル(Whisper, MMS, Seamless-M4T)の性能解析を行った。
読み上げ音声データセットでは、スムーズな広さが他のASRモデルより優れているのに対し、ささやきの広さは会話音声データセットでは最高であることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:56:48 GMT)
A Riemannian Optimization Perspective of the Gauss-Newton Method for Feedforward Neural Networks [3.5] 我々は,スムーズな活性化関数を持つニューラルネットワークを学習するためのガウスニュートン力学の収束性を分析する。
適切な減衰スケジュールが選択されたレバンス・マルカルト力学は、潜在的に条件の悪いニューラル・タンジェント・カーネル行列にも拘わらず、高速収束率が得られることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:33:42 GMT)
AI Simulation by Digital Twins: Systematic Survey, Reference Framework, and Mapping to a Standardized Architecture [3.5] 不十分なデータ量と品質は、現代のサブシンボリックAIの採用における課題を迫っている。
これらの課題を軽減するために、AIシミュレーションは、シミュレーションされた合成データを使ってAIエージェントを安全かつ効率的に開発できる仮想トレーニング環境を使用する。
デジタル双生児は、これらの高忠実な物理システムの仮想レプリカが最先端のシミュレータを備えているため、AIシミュレーションに新たな道を開く。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:13:38 GMT)
BecomingLit: Relightable Gaussian Avatars with Hybrid Neural Shading [3.4] 本研究では,インタラクティブなレートで新たな視点から表現可能な,光沢のある高解像度ヘッドアバターの再構成手法であるBecomingLitを紹介する。
様々な照明条件下で多数の被験者の多視点配列からなる新しいデータセットを収集する。
本稿では,ニューラル拡散BRDFと解析的特異項を組み合わせたハイブリッド型ニューラルシェーディング手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:53:58 GMT)
Enduring Disparities in the Workplace: A Pilot Study in the AI Community [3.4] 産学歴1260名のAI/MLプロフェッショナルを対象に,異なる軸をまたいだパイロット調査を行った。
その結果, 職場経験における疎外・疎外化サブグループの持続的格差が示唆された。
我々は、アクセシビリティは、ポジティブな職場環境にとって重要な課題であり、障害者の従業員は、非障害者の同僚よりも職場経験が劣っていることを強調する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:01:19 GMT)
HMVLM: Multistage Reasoning-Enhanced Vision-Language Model for Long-Tailed Driving Scenarios [3.4] 本稿では,認知にインスパイアされた高速スローアーキテクチャの遅い分岐を実装するエンドツーエンド駆動フレームワークであるHaoMo Vision-Language Model(HMVLM)を紹介する。
高速コントローラは低レベルのステアリング、スロットル、ブレーキコマンドを出力し、遅いプランナー、大きな視覚言語モデルでは、遅延を伴わずに「歩行者への利益」や「トラックの後にマージ」のような高レベルのインテントを生成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:51:06 GMT)
The complexity of the SupportMinors Modeling for the MinRank Problem [3.3] ここでは、SupportMinors Modelingの複雑さについて、実証された見積もりを提供します。
これは主に、オリジナルの記事に含まれる複雑さの見積もりを確認している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:37:51 GMT)
RKEFino1: A Regulation Knowledge-Enhanced Large Language Model [3.3] 我々は、Fino上に構築された規制知識強化型金融推論モデルであるRKEFinoを提案する。
本稿では,2つのQAタスクと数理推論を定式化し,文と表の両方の財務要素をカバーする新しい数値的NERタスクを導入する。
コンプライアンスクリティカルな財務課題におけるRKEFino1の有効性と一般化能力について実験的に検証した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:02:52 GMT)
DermaCon-IN: A Multi-concept Annotated Dermatological Image Dataset of Indian Skin Disorders for Clinical AI Research [3.3] DermaCon-INは、南インドで約3000人の患者から5450件以上の臨床画像が収集されたデータセットである。
それぞれの画像は、240以上の異なる診断がなされ、階層的、エチオロジーに基づく分類の下に構築された、ボード認証された皮膚科医によって注釈付けされる。
このデータセットは、インドにおける外来医療でよく見られる皮膚学的な状況と声調の変化を、幅広い範囲で捉えている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:59:08 GMT)
Optimization Proxies using Limited Labeled Data and Training Time -- A Semi-Supervised Bayesian Neural Network Approach [3.3] 制約付き最適化問題は、在庫管理や電力網など、さまざまなエンジニアリングシステムで発生する。
標準ディープニューラルネットワーク(DNN)ベースの機械学習プロキシは、ラベル付きデータが不足し、トレーニング時間が制限された実用的な環境では有効ではない。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:58:27 GMT)
Feature-Based Lie Group Transformer for Real-World Applications [3.2] 表現学習の主な目的は、実世界の感覚入力から意味のある表現を、監督なしで取得することである。
ガロア代数理論における群分解を用いた新しい手法を提案する。
この方法は、より一般的な表現を定義することを約束するが、特徴抽出なしでピクセル間変換を仮定する。
特徴抽出とオブジェクトセグメンテーションを組み合わせることで,より現実的なシナリオにグループ分解理論を適用する方法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:48:26 GMT)
Tensor-to-Tensor Models with Fast Iterated Sum Features [3.2] 入力サイズが線形な新しいテンソル・ツー・テンソル層を提案する。
画像処理パイプラインに挿入可能なイメージ・ツー・イメージ層を提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:44:36 GMT)
Policy Optimization for Continuous-time Linear-Quadratic Graphon Mean Field Games [3.2] グラフィオン(Graphon)とは、フィールドゲームがそのようなゲームを近似するための原則的なフレームワークを提供することを意味する。
本稿では,連続時間有限水平線形四元数GMFGに対するポリシー最適化フレームワークの提案と解析を行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:06:06 GMT)
Vehicle: Bridging the Embedding Gap in the Verification of Neuro-Symbolic Programs [3.1] 本稿では, ニューロシンボリックな検証問題を部品に分解する。
次に、検証条件言語のための略語として、Vabyを紹介します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:25:20 GMT)
A Theoretical Justification for Asymmetric Actor-Critic Algorithms [2.9] 線形関数近似器を用いた非対称アクター批判アルゴリズムの正当性を提案する。
結果として生じる有限時間境界は、非対称な批評家がエージェント状態のエイリアスから生じる誤り項を排除していることを示している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:05:32 GMT)
Research on Personalized Financial Product Recommendation by Integrating Large Language Models and Graph Neural Networks [2.9] 大規模言語モデル(LLM)とグラフニューラルネットワーク(GNN)を統合したハイブリッドフレームワークを提案する。
事前訓練されたLLMはテキストデータ(例えばユーザレビュー)をリッチな特徴ベクトルにエンコードし、不均一なユーザ生成グラフは相互作用と社会的結びつきをモデル化する。
公開および実世界の財務データセットの実験では、我々のモデルは、強い解釈可能性を持つ、正確性、リコール、NDCGにおいてスタンドアロンのLLMやGNNよりも優れています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:41:33 GMT)
E-LDA: Toward Interpretable LDA Topic Models with Strong Guarantees in Logarithmic Parallel Time [2.8] LDAトピックモデルにおいて、各文書に割り当てられたトピックを推測する問題に対して、証明可能な保証を備えた最初の実用的なアルゴリズムを提供する。
これは、社会科学、データ探索、因果推論設定におけるトピックモデルの多くの応用における主要な推論問題である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:05:48 GMT)
The Economic Dispatch of Power-to-Gas Systems with Deep Reinforcement Learning:Tackling the Challenge of Delayed Rewards with Long-Term Energy Storage [2.8] P2G(Power-to-Gas)技術は、風力や太陽などの断続的な再生可能エネルギーを電力網に統合することを可能にした。
これらのシステムの最もコスト効率のよい運用を決定することは、再生可能エネルギーの揮発性の性質、電力価格、負荷のために複雑である。
本研究では, 深層強化学習がP2Gシステムの経済活動にどのように適用できるかを, 徹底的に検討し, 新たな手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:20:08 GMT)
SPRINT: Enabling Interleaved Planning and Parallelized Execution in Reasoning Models [2.8] 大きな推論モデルは複雑な推論タスクでは優れているが、典型的には長いシーケンシャル連鎖を生成する。
SPRINTは、LRMが並列化の機会を動的に識別し活用できるようにするために設計された、新しいトレーニング後および推論時フレームワークである。
本研究では,SPRINTフレームワークで微調整されたモデルが,数学などの複雑な領域における推論モデルの性能と一致することを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:10:31 GMT)
PrivTru: A Privacy-by-Design Data Trustee Minimizing Information Leakage [2.7] 最適なプライバシー特性を実現するデータトラストのインスタンス化であるPrivTruを紹介する。
PrivTruは、データトラストが所定のクエリに応答するためにデータソースから要求する必要がある最小限の情報量を算出する。
分析の結果,PrivTruは受託者の事前の知識に関わらず,受託者への情報漏洩を最小限に抑えることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:33:59 GMT)
Learning Time-Varying Multi-Region Communications via Scalable Markovian Gaussian Processes [2.6] 我々はマルコフ的ガウス過程を用いて時間変化の時間的遅延で脳のコミュニケーションを学習する新しい枠組みを提案する。
この研究は、分散ニューラルネットワークの理解を深め、動的脳ネットワークを解析するためのスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:51:23 GMT)
Can Masked Autoencoders Also Listen to Birds? [2.4] Masked Autoencoders (MAEs) は、リッチな意味表現を学習することで、音声分類において競合する結果を示した。
汎用モデルは、きめ細かいオーディオドメインに直接適用しても、うまく一般化できない。
この研究は、このドメインギャップを埋めるには、ドメイン固有の事前トレーニングデータ以上のものが必要であることを実証している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:48:16 GMT)
Analyzing the Evolution and Maintenance of Quantum Software Repositories [2.4] この調査では、10,000人以上の開発者からの120万のコミットを含む、21,000以上のGitHubリポジトリの大規模なマイニング分析を行っている。
リポジトリの成長、プログラミング言語、フレームワークの採用、コントリビュータの動向を分析し、2017年以降のリポジトリの200%の増加とコントリビュータの150%の増加を明らかにします。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:11:49 GMT)
WoundAIssist: A Patient-Centered Mobile App for AI-Assisted Wound Care With Physicians in the Loop [2.3] 我々は、患者中心のAI駆動型モバイルアプリケーションであるWoundAIssistを紹介した。
WoundAIssistは、患者が写真やアンケートを通じて、自宅で定期的に傷を文書化することを可能にする。
デバイス上での創傷セグメンテーションのための軽量深層学習モデルにより、創傷治癒進行の連続的なモニタリングが可能となる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:10:32 GMT)
Quantifying Adversarial Uncertainty in Evidential Deep Learning using Conflict Resolution [2.3] C-EDL (Conflict-aware Evidential Deep Learning) は、ポストホック後の不確実性定量化手法である。
C-EDLは入力毎に多様なタスク保存変換を生成し、不一致を定量化して不確実性推定を校正する。
実験により,C-EDLは最先端のEDLと競争ベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:06:23 GMT)
Exciton-polariton condensates in van der Waals magnetic microwires [2.3] 反強磁性半導体CrSBrにおけるエキシトン-ポラリトン縮合を示す。
光励起下では、光学キャビティに埋め込まれたCrSBrマイクロワイヤは、偏光子凝縮の目印を示す。
以上の結果から、CrSBrマイクロワイヤは磁化可能な偏光子凝縮体を探索するための有望なプラットフォームとして注目されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:55:08 GMT)
FPDANet: A Multi-Section Classification Model for Intelligent Screening of Fetal Ultrasound [2.3] 本稿では,これらの課題に対処するため,二国間マルチスケール情報融合ネットワークFPDANetを提案する。
具体的には,特徴の類似性を利用した位置注意機構(DAN)モジュールを設計する。
さらに,FPAN情報融合モジュールを設計し,コンテキストおよびグローバルな特徴の依存関係を抽出する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:00:17 GMT)
Ab Initio Nonparametric Variable Selection for Scalable Symbolic Regression with Large $p$ [2.2] シンボリック回帰(SR)は、データの非線形関係を特徴付けるシンボリック表現を発見するための強力な手法である。
既存のSR法は、多くの入力変数を持つデータセットにスケールしないが、現代の科学的応用では一般的である。
本稿では,Ab初期非パラメトリック変数選択とSRを組み合わせたPAN+SRを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:05:31 GMT)
SDE Matching: Scalable and Simulation-Free Training of Latent Stochastic Differential Equations [2.2] SDEマッチング(SDE Matching)を提案する。
以上の結果から,SDEマッチングは随伴感度法に匹敵する性能を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:21:10 GMT)
Neural Flow Diffusion Models: Learnable Forward Process for Improved Diffusion Modelling [2.2] より広い範囲のプロセスをサポートすることで拡散モデルを強化する新しいフレームワークを提案する。
また,前処理を学習するための新しいパラメータ化手法を提案する。
結果はNFDMの汎用性と幅広い応用の可能性を評価する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:38:36 GMT)
London Blue Light Collaboration Evaluation: A Comparative Analysis of Spatio temporal Patterns on Emergency Services by London Ambulance Service and London Fire Brigade [2.1] ロンドン・アンバランス・サービス(London Ambulance Service, LAS)とロンドン消防旅団(London Fire Brigade, LFB)は、資源調整の課題に直面している。
本研究では,サービス要求における時間的・空間的類似性について検討し,定期的な緊急協力の可能性について検討した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:55:18 GMT)
PyGemini: Unified Software Development towards Maritime Autonomy Systems [2.1] PyGeminiは、海上自律開発を統合するためにAutoferry Geminiの遺産の上に構築されている。
このフレームワークはスタンドアロンアプリケーション、クラウドベースのサービス、組み込みライブラリとして機能する。
海上ツールのスイートを通じて、その汎用性を実証します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:43:00 GMT)
LengClaro2023: A Dataset of Administrative Texts in Spanish with Plain Language adaptations [2.0] 本稿では,スペイン語における法的行政文書のデータセットであるLengClaro2023を紹介する。
スパニッシュ・ソーシャル・セキュリティのウェブサイトから最も頻繁に使用される手順に基づいて、それぞれのテキストに2つの簡易化された等価テキストを作成しました。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:52:52 GMT)
SemiOccam: A Robust Semi-Supervised Image Recognition Network Using Sparse Labels [2.0] 半教師付き学習を高効率で活用する画像認識ネットワークであるSemiOccamを提案する。
特徴表現と対象クラス間の相互情報を最適化し,階層的な混合密度分類決定機構を構築する。
本稿では、半教師付き学習タスクのためのSTL-10データセットにおける長年見過ごされてきたデータ漏洩問題を明らかにし、実験結果の信頼性を確保するために重複を除去する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:45:08 GMT)
Towards Mixed-Criticality Software Architectures for Centralized HPC Platforms in Software-Defined Vehicles: A Systematic Literature Review [1.9] 確立されたガイドラインに基づく体系的なレビュープロトコルを構築した。
第三に、重要な機能領域、制約を抽出し、自動車SWAの変化を駆動する技術を実現する。
マイクロプロセッサベースのシステム・オン・チップのためのサンプルSWAを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:40:30 GMT)
Hierarchical Refinement: Optimal Transport to Infinity and Beyond [1.9] 最適な低ランク結合は,Monge マップの下の画像と各点を共役することを示す。
低ランクOTサブプロブレムを用いて各データセットのマルチスケールパーティションを動的に構築するアルゴリズムを導出する。
階層的リファインメント(Hierarchical Refinement)の利点を、100万以上のポイントを含むいくつかのデータセットで示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:11:35 GMT)
A Lightweight Dual-Branch System for Weakly-Supervised Video Anomaly Detection on Consumer Edge Devices [1.8] ルールベースのビデオ異常検出(RuleVAD)は、コンシューマハードウェア上での高効率かつ低複雑さな脅威検出のために設計された、新しい軽量なシステムである。
暗黙のブランチは、視覚的特徴を使って、高速で粗いバイナリ分類を行い、不要な処理を避けるために正常なアクティビティを効率的にフィルタリングする。
マルチモーダルな明示的なブランチが引き継ぎ、データマイニングを適用して、シーンから解釈可能なテキストベースのアソシエーションルールを生成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:04:26 GMT)
Towards Effective Extraction and Evaluation of Factual Claims [1.8] LLM(Large Language Models)が生成する長文コンテンツを事実チェックするための一般的な戦略は、独立して検証可能な単純なクレームを抽出することである。
本稿では,ファクトチェックの文脈におけるクレーム抽出と,このフレームワークを適用するための自動化された,スケーラブルで,かつレプリケート可能な手法を提案する。
また, LLMに基づくクレーム抽出手法であるCrimifyを導入し, 評価フレームワークにおける既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:08:49 GMT)
Ensemble Elastic DQN: A novel multi-step ensemble approach to address overestimation in deep value-based reinforcement learning [1.8] 本稿では,エンサンブルを弾性的なステップ更新で統一し,アルゴリズム性能を安定化させる,Ensemble Elastic Step DQN (EEDQN) という新しいアルゴリズムを提案する。
EEDQNは、過大評価バイアスとサンプル効率という、深層強化学習における2つの大きな課題に対処するように設計されている。
以上の結果から,EEDQNは全テスト環境において一貫したロバストな性能を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:36:19 GMT)
NameTag 3: A Tool and a Service for Multilingual/Multitagset NER [1.8] NameTag 3は、多言語、マルチデータセット、マルチタグのエンティティ認識のためのオープンソースツールである。
コマンドラインツールとして、およびクラウドベースのサービスとして利用可能で、ローカルインストールなしで使用することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:19:41 GMT)
Improving LLM-Powered EDA Assistants with RAFT [1.8] 大きな言語モデル(LLM)は会話エージェントとしての生産性を高めることができる。
オープンソースLLMは電子設計自動化(EDA)のためのドメイン固有の知識を欠いている
Retrieval-Augmented Generation (RAG) のコンテキストでは、LLMは外部のコンテキストに依存するが、それでも不正確な応答を生成する可能性がある。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:50:51 GMT)
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning [1.7] 近年の拡散政策における状態再構成特徴学習を取り入れた新しい手法を提案する。
本手法は,OOD状態による分散シフトを軽減するために,一般化可能な状態表現の学習を促進する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:23:26 GMT)
FIST: A Structured Threat Modeling Framework for Fraud Incidents [1.7] FISTは、詐欺シナリオに特化して設計された、革新的な構造化された脅威モデリング手法である。
社会工学の戦術、ステージベースの行動分解、再利用可能な知識ベースへの詳細な攻撃テクニックのマッピングが組み込まれている。
FISTは、不正検出の効率を高め、脅威情報共有の標準化を目指している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:54:49 GMT)
Inferring fine-grained migration patterns across the United States [1.7] 我々は、高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
私たちは2010年から2019年までの年次移行行列のデータセットであるMIGRATEを作成し、47億組のCensus Block Groupのフローをキャプチャします。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:38:22 GMT)
Machine learning for in-situ composition mapping in a self-driving magnetron sputtering system [1.6] 本研究はマグネトロン共スパッタリングに基づくSDLを提案する。
フレームワークを用いて,多素子, 組成グレード薄膜の正確な合成マップを得る。
スパッタ室に設置した水晶結晶マイクロバランスセンサを用いて,多素子薄膜の組成分布を予測する手法を開発した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:38:35 GMT)
GS4: Generalizable Sparse Splatting Semantic SLAM [1.6] 本稿では,学習可能なネットワークを用いて,RGB-Dビデオストリームから3次元シーン表現をインクリメンタルに構築し,更新する,GSベースのセマンティックSLAMアルゴリズムを提案する。
実世界のベンチマークScanNet上での最先端のセマンティックSLAM性能を、他のGSベースの手法と比較して桁違いに低めに示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:28:37 GMT)
Effect of Weak Measurement Reversal on Quantum Correlations in a Correlated Amplitude Damping Channel, with a Neural Network Perspective [1.6] ベル,ヴェルナー,および2つの量子ビットの最大絡み合った混合状態と相関振幅減衰チャネルの量子相関の進化について検討した。
我々は、進化中の異なる量子相関測度間の関係の分析を強化するために、ニューラルネットワークモデルを用いている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:14:53 GMT)
Sparse Autoencoders for Hypothesis Generation [1.5] hypotheSAEsはテキストデータ(例:見出し)とターゲット変数(例:クリック)の関係を仮説化する方法である。
テキスト埋め込みでスパースオートエンコーダを訓練し、データ分布を記述する解釈可能な特徴を生成する。
対象変数を予測する機能を選択し,(3)各特徴の自然言語解釈を生成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:34:19 GMT)
Towards Infant Sleep-Optimized Driving: Synergizing Wearable and Vehicle Sensing in Intelligent Cruise Control [1.5] 自動運転(AD)は車の安全性と運転の快適性を大幅に向上させたが、乗客の健康、特に幼児の睡眠への影響は十分に研究されていない。
本稿では,運転行動のパーソナライズと,利用者の快適さと旅行効率の最適なバランスをとるために,AD内における強化学習(RL)の統合について検討する。
幼児の睡眠の質を高めるため,様々な運転条件に適応するインテリジェントクルーズ制御フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:29:49 GMT)
End-to-End Framework for Robot Lawnmower Coverage Path Planning using Cellular Decomposition [1.5] 自律型芝刈り機は、多様で不規則な形状の芝刈り機を効果的に操作し維持するために、効率的な被覆経路計画(CPP)が必要である。
本稿では,航空地図上のユーザ定義境界をシームレスに最適化したカバレッジパスに変換することを目的とした,CPPのための包括的エンドツーエンドパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:20:45 GMT)
BOLD: Boolean Logic Deep Learning [1.4] 本稿では、ブール重みと入力からなるニューロンを、降下勾配や実算術の代わりにブール論理を用いてブール領域で効率的に訓練できるようなブール変動の概念を導入する。
提案手法は,ImageNet分類におけるベースライン完全精度を実現し,セマンティックセグメンテーションの最先端結果を上回った。
トレーニングと推論の双方において、エネルギー消費を著しく減少させる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:26:36 GMT)
The Lock-in Hypothesis: Stagnation by Algorithm [1.4] 大きな言語モデル(LLM)のトレーニングとデプロイは、人間のユーザによるフィードバックループを生成する。
このフィードバックループは、ユーザの既存の価値観や信念を複雑にし、多様性の喪失と、偽の信念のロックインにつながる可能性がある、という仮説を立てる。
解析は、新しいGPTイテレーションのリリース後に突然、しかし持続的な多様性の低下を明らかにし、仮説化された人間とAIのフィードバックループと一致している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:31:31 GMT)
Medical Knowledge Integration into Reinforcement Learning Algorithms for Dynamic Treatment Regimes [1.4] 動的治療レジーム(DTR)は、臨床データから得られた決定規則に基づいて治療効果を高める。
強化学習(Reinforcement Learning, RL)アルゴリズムは、個々の患者データとその医療履歴によって規定されたこれらの決定ルールを決定することができる。
これらのモデルに医療専門知識を組み込むことで、治療勧告の信頼性を高め、医療専門家や患者によるこのアプローチの採用を促進することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:53:12 GMT)
Training with Confidence: Catching Silent Errors in Deep Learning Training with Automated Proactive Checks [1.4] ディープラーニング(DL)モデルのトレーニングは複雑なプロセスであり,検出と診断が困難なサイレントエラーに陥りやすい。
本稿では,サイレントトレーニングエラーに対処するために,積極的にチェックを行うフレームワークであるTRAINCHECKを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:34:42 GMT)
Large Language Models Can Be a Viable Substitute for Expert Political Surveys When a Shock Disrupts Traditional Measurement Approaches [1.4] このポジションペーパーでは、大量のデジタルメディアデータに基づいて訓練された大規模言語モデル(LLM)が、ショックが従来の測定を妨害する場合に、専門家による政治調査の代用として有効であると論じている。
我々は、LLMとのペアワイズ比較プロンプトを使用し、連邦政府機関のイデオロギースコアを導出する。
また、同様のアプローチを用いて、イデオロギーの規制下であっても、知識機関としての連邦機関の認識がどの機関がDOGEを標的としているかを予測する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:14:57 GMT)
Enhancing Software Supply Chain Security Through STRIDE-Based Threat Modelling of CI/CD Pipelines [1.4] 本研究では,継続的統合/継続的デプロイメントライフサイクルを通じてリスクを特定し,緩和するために,構造化された脅威モデリングアプローチを適用します。
脅威は文書化されており、NIST SP 800-218、トップ10のCI/CDリスク、SLSAフレームワークなどの標準から引き出された包括的なセキュリティコントロールが提供されている。
このアプローチは、進化するソフトウェアサプライチェーンの脅威に対するCI/CDパイプラインのセキュリティを強化するための実践的なロードマップを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:06:59 GMT)
An Active Learning-Based Streaming Pipeline for Reduced Data Training of Structure Finding Models in Neutron Diffractometry [1.3] 本研究では,不確実性サンプリングを用いて確率分布から抽出した学習データをシミュレートする新しいバッチモードアクティブラーニング(AL)ポリシーを提案する。
精度を向上しながら、トレーニングデータの約75%の削減で、同じモデルのトレーニングにおける有効性を確認した。
次に、このALポリシを用いた効率的なストリームベースのトレーニングワークフローの設計について論じ、2つの異種プラットフォームの性能調査を示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:48:22 GMT)
Analysis of cost-efficiency of serverless approaches [1.3] 我々は2010年から2024年までの期間をGoogle Scholar検索エンジンを用いて体系的な文献レビューを行った。
我々は、サーバーレスアプローチの適用による相対的なコスト削減に影響を与える可能性のある17のパラメータを抽出した34の関連研究を特定した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:58:26 GMT)
Optically accessible high-finesse millimeter-wave resonator for cavity quantum electrodynamics with atom arrays [1.3] 温度が1Kで5.8(1)×107$のミリ波Fabry-P'erot空洞を提示する。
強い原子-光子結合と光アクセスの目標の衝突は、ほぼ共焦点幾何学を動機付けている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:03:58 GMT)
Gradient Similarity Surgery in Multi-Task Deep Learning [1.2] 本研究は、最適化過程を導くために、勾配等級類似度尺度に基づく新しい勾配手術法を導入する。
similarity-Aware Momentum Gradient Surgery (SAM-GS) は1次運動量の勾配等化と変調を採用する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:40:50 GMT)
Machine Learning Predictions for Traffic Equilibria in Road Renovation Scheduling [1.1] 本稿では,道路改修に伴うネットワーク全体の混雑を予測するために,機械学習に基づく代理モデルを用いて検討する。
XGBoostは、さまざまな指標においてオルタナティブを著しく上回り、最も顕著なのは平均絶対パーセンテージエラー(MAPE)である。
このモデリング手法は、保守計画における大規模交通割当問題の計算負担を軽減する可能性がある。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:59:05 GMT)
TissUnet: Improved Extracranial Tissue and Cranium Segmentation for Children through Adulthood [1.1] 頭蓋骨,皮下脂肪,筋肉を3次元T1強調MRIから抽出する深層学習モデルTissUnetを提案する。
このモデルは155対のMRI断層撮影(CT)スキャンでトレーニングされ、9つのデータセットで検証された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:21:34 GMT)
Integrating Spatiotemporal Features in LSTM for Spatially Informed COVID-19 Hospitalization Forecasting [1.1] 本研究は、米国における毎日の国家レベルのインシデント入院を予測するための、新しいLong Short-Term Memory(LSTM)フレームワークを提案する。
我々は,Facebookのソーシャル・コネクテッドネス・インデックス(Social Connectedness Index)から派生した,入院に対する社会的親和性(Social Proximity to Hospitalizations,SPH)という特徴を,予測を改善するために提示する。
われわれのモデルは、Omicronの急増中、州別27ドル、42ドル、54ドル、69ドルをそれぞれ24ドル、21ドル、28ドルと、それぞれ上回っている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:22:11 GMT)
Angular $k$-uniformity and the Hyperinvariance of Holographic Codes [1.1] ホログラフィック量子誤り訂正符号は、AdS-CFTにおけるバルク境界双対性を探索するための魅力的なおもちゃモデルとして登場した。
角 k-一様性(angular k-uniformity)と呼ばれる幾何学的基準を導入し、標準 k-一様性とその平面多様体を洗練する。
この条件は、任意の次元の正規双曲ハニカム上の超不変ホログラフィック符号の体系的同定と構築を可能にする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:08:13 GMT)
Quantum Checkers: The Development and Analysis of a Quantum Combinatorial Game [1.0] 本稿では,新しい量子ゲームである量子チェッカー(コードネームCheqqers)を開発し,解析する。
量子力学からの重畳、絡み合い、測定、干渉の概念は、新しい種類の法的な動きを加えることで、チェッカーのゲームに統合される。
ランダムエージェントとモンテカルロ木探索エージェントを用いて,このゲームの初期解析を行った。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:39:28 GMT)
Two-parameter estimation via photon subtraction operation within a feedback-assisted interferometer [1.0] フィードバック型干渉計における多光子サブトラクション動作は、理想的および光子損失条件下での測定精度を向上させることができる。
両条件に最適フィードバック強度R_optが存在することを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:29:25 GMT)
An Ontology for Representing Curriculum and Learning Material [1.0] 本稿では,教育教材の密接な相互接続のための枠組みとして,カリキュラムKGオントロジーを提案する。
原型オープンナレッジ・ネットワーク・ユースケースのための実体化されたグラフを提供し、ドメインの専門家や教育者から得られた能力的質問を用いて検証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:21:05 GMT)
A Synthetic Pseudo-Autoencoder Invites Examination of Tacit Assumptions in Neural Network Design [1.0] 本稿では,任意の整数集合を1つの数値変数に符号化する問題を解く手作りニューラルネットワークを提案する。
標準的なニューラルネットワーク操作のみを使用しながら、この分野の一般的な概念に挑戦する設計選択を行います。
このニューラルネットは実用化を意図していない。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:32:14 GMT)
InstantFT: An FPGA-Based Runtime Subsecond Fine-tuning of CNN Models [0.9] FPGAを用いたIoTデバイス上での超高速CNN微調整手法を提案する。
コンセプトドリフトを用いたデータセット実験により、InstantFTは既存のローランド適応(LoRA)よりも17.4倍高速で訓練済みのCNNを微調整できることが示された。
我々のFPGAベースのInstantFTは、微調整時間をわずか0.36秒に短縮し、エネルギー効率を16.3倍に改善し、非定常データ分布へのCNNのオンザフライ適応を可能にする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:01:09 GMT)
LGAR: Zero-Shot LLM-Guided Neural Ranking for Abstract Screening in Systematic Literature Reviews [0.9] 体系的な文献レビューは、トピックに関するすべての関連論文を特定し評価することを目的としている。
現在までに、大型言語モデル(LLM)を用いた抽象的なスクリーニング手法はバイナリ分類設定に重点を置いている。
ゼロショットLLMガイド付き抽象ランクラであるLGARを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:31:00 GMT)
Rational Tuning of LLM Cascades via Probabilistic Modeling [0.9] 大規模言語モデル(LLM)の連立性能分布の確率的モデルを提案する。
ベイズ最適化を用いた信頼しきい値の選択と比較すると、マルコフパラメトリックコプラモデルの方がエラーコストのトレードオフに有利である。
異なるLLMの誤差率間の相互作用に関する我々のフレームワークの帰納的仮定は、サンプル効率を高める。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:12:02 GMT)
Securing Traffic Sign Recognition Systems in Autonomous Vehicles [0.9] 信号認識に使用するディープニューラルネットワーク(DNN)の誤り最小化攻撃を行う。
本稿では,誤り最小化攻撃の軽減を目的としたデータ拡張に基づくトレーニング手法を提案する。
我々の検出モデルは、攻撃の特定において99%以上の成功率を達成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:35:03 GMT)
Minoritised Ethnic People's Security and Privacy Concerns and Responses towards Essential Online Services [0.9] 本研究は、少数民族の安全とプライバシの懸念、態度、行動に焦点をあてる。
英国における様々な少数民族に対する44の半構造化インタビューのテーマ分析を行った。
プライバシーに関する懸念と個人情報のコントロールの欠如が主要なテーマとして浮上し、多くのインタビュアーは、プライバシーをオンラインサービスを使用する際の最も重要な関心事として考えている。
我々は、より包括的で、疎外的で、プライバシーに配慮したオンラインサービスの設計について学んだ教訓を提供するために、その結果を描きます。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:17:44 GMT)
Mixed-curvature decision trees and random forests [0.9] 決定木(DT)とそのランダム森林(RF)拡張はユークリッド空間における分類と回帰の作業場である。
DTおよびRFアルゴリズムを、いくつかの双曲的、超球的、ユークリッド的成分の積多様体積に拡張する。
我々の新しい角的再構成は、決定木を効果的にするためのアルゴリズム特性を保ちながら多様体幾何学を尊重する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:26:35 GMT)
Cal or No Cal? -- Real-Time Miscalibration Detection of LiDAR and Camera Sensors [0.8] 安全の観点からは、センサーのキャリブレーションは自動運転の鍵となる。
オンラインキャリブレーションは厳格なリアルタイムとリソースの制約を受ける。
校正パラメータの直接回帰から校正状態のバイナリ分類に焦点を移す誤校正検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:34:05 GMT)
Compression of executable QR codes or sQRy for Industry: an example for Wi-Fi access points [0.8] ネットワーク機器の設定、診断、産業環境での強化されたスマートマニュアルなどだ。
本研究では,文字列によって取られる空間を削減し,sQRyの適用性を拡大する,シンプルかつ効果的な戦略を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:00:05 GMT)
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery [0.8] 我々は、当初、約10,610人の高品質な人間のピアランク写真画像からなるDataSeeds.AIサンプルデータセット(DSD)を紹介した。
DSDは、商用画像データセットの新しい標準となるように設計された基礎的なコンピュータビジョンデータセットである。
我々は、DSDが既知のベンチマークに対する特定のモデルに対して生成した量的改善を文書化し、我々の評価で使用されるコードとトレーニングされたモデルを一般公開する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:50:28 GMT)
Effects of inert background gases and photo-illumination on three-color electromagnetically induced transparency of rubidium vapor [0.8] 不活性ガス存在下での室温Rb蒸気の電磁誘導透過(EIT)について検討した。
この研究は、混合種の温気蒸気の分光学的研究、気相セルにおけるRydberg原子のセンシング、低圧放電プラズマの非侵襲電界診断において興味深い。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:15:26 GMT)
C2F-CHART: A Curriculum Learning Approach to Chart Classification [0.8] 粗大なカリキュラム学習を利用したチャート分類のための新しい学習手法を提案する。
私たちがC2F-CHARTと呼ぶアプローチは、クラス間の類似性を利用して、難易度が異なる学習タスクを作成します。
ICPR 2022 CHART-Infographics UB UNITEC PMC データセット上で,本手法をベンチマークし,最先端の結果を上回った。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:49:24 GMT)
Pathfinding Quantum Simulations of Neutrinoless Double-$β$ Decay [0.8] 1+1D量子色力学における単純核のニュートリノレス2-$β$崩壊の共設計量子シミュレーションの結果を示す。
ニュートリノのない2-$beta$崩壊の明確な信号が測定され、これはレプトンナンバー違反をリアルタイムで観測する最初の量子シミュレーションとなった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:31:16 GMT)
On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation [0.8] 病理学における視覚言語モデルにより、マルチモーダルケース検索と自動レポート生成が可能となる。
これまで開発されたモデルの多くは、スライド画像全体から推測できない情報を含む病理報告に基づいて訓練されてきた。
視覚言語モデリングのための病理報告からの情報選択がマルチモーダル表現の質や生成レポートにどのように影響するかを検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:39:19 GMT)
A symmetric LWE-based Multi-Recipient Cryptosystem [0.8] 本稿では,LWE問題の難易度に基づくセキュリティを備えた,量子後多値対称暗号システムについて述べる。
単一の送信者は、受信者に送信される単一の暗号文を生成する複数の受信者に対して複数のメッセージを暗号化する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:23:54 GMT)
Elementary Math Word Problem Generation using Large Language Models [0.7] 大規模言語モデル(LLM)に基づくMWP生成システムを提案する。
私たちのシステムへの唯一の入力は、必要となるMWPの数、グレード、質問の種類(加算、減算など)である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:20:56 GMT)
Any-Class Presence Likelihood for Robust Multi-Label Classification with Abundant Negative Data [0.7] マルチラベル分類(MLC)は、インスタンスを1つ以上の非排他クラスに割り当てる。
工業的欠陥検出、農業病の特定、医療診断などのLCC応用では、大量の負のデータに遭遇することが一般的である。
正の例において,不在クラス確率の相対的寄与を任意のクラスの存在可能性に制御する正規化パラメータを導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:59:11 GMT)
Conformal-DP: Data Density Aware Privacy on Riemannian Manifolds via Conformal Transformation [0.7] Differential Privacy(DP)は、キャリブレーションされたノイズを追加することで、プライバシを保存するデータ分析を可能にする。
共形変換を利用したemphConformal-DPを提案する。
我々は、我々のメカニズムが優れたプライバシーとユーティリティのトレードオフを達成するための合成および実世界のデータセットに関する実験を通して示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:55:17 GMT)
Inferring entropy production in many-body systems using nonequilibrium MaxEnt [0.7] 本稿では,多体システムやメモリの長い非マルコフシステムを含む高次元生産システムにおいて,エントロピー(EP)を推定する方法を提案する。
エントロピー原理の双対類似性を利用して, 軌道レベルEPと最大値以下を平均EPで推定する。
本研究では,1000スピンの非平衡スピンモデルと大規模なニューラルスパイク訓練データセットを用いて,その数値性能を実証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:31:59 GMT)
Challenging Vision-Language Models with Surgical Data: A New Dataset and Broad Benchmarking Study [0.6] 本研究は,視覚言語モデル(VLM)の内視鏡的課題に対する能力を評価するための大規模な研究である。
さまざまな最先端モデル、複数の外科的データセット、広範囲な人間の参照アノテーションを用いて、3つの重要な研究課題に対処する。
以上の結果から,VLMはオブジェクトカウントやローカライゼーションなどの基本的な外科的知覚タスクを,一般的なドメインタスクに匹敵するパフォーマンスレベルで効果的に行うことができることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:53:12 GMT)
Regional, Lattice and Logical Representations of Neural Networks [0.5] 本稿では、隠れ層におけるReLUアクティベーション関数と、出力層におけるTruncated IDアクティベーション関数とのフィードフォワードニューラルネットワークの変換アルゴリズムを提案する。
また,異なる大きさのニューラルネットワークに対して,提案手法によって出力される局所表現の複雑さを実験的に検討した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:58:09 GMT)
"We need to avail ourselves of GenAI to enhance knowledge distribution": Empowering Older Adults through GenAI Literacy [0.5] 高齢の成人はしばしば、新興技術の採用に関するより大きな予約を示す。
本研究では,GenAIリテラシーを高齢者に提供するための戦略を検討する。
定量的データは、AIリテラシーの改善傾向を示しているが、統計的には重要ではなかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:38:37 GMT)
FedShield-LLM: A Secure and Scalable Federated Fine-Tuned Large Language Model [0.5] Federated Learning (FL)は、LLM(Large Language Models)のトレーニングと微調整のための分散フレームワークを提供する。
FLはプライバシとセキュリティの懸念に対処し、LLMの相当な計算要求に関連する課題をナビゲートする。
ローランド適応 (LoRA) パラメータに対して, 完全同型暗号化 (FHE) を用いたプルーニングを用いた新しいFedShield-LLMを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 00:05:05 GMT)
EdgeProfiler: A Fast Profiling Framework for Lightweight LLMs on Edge Using Analytical Model [0.4] 本稿では,エッジシステム上での軽量大言語モデル(LLM)を評価するためのフレームワークであるEdgeProfilerを紹介する。
このフレームワークはTinyLLaMA、Gemma3.1B、Llama3.2-1B、DeepSeek-r1-1.5BなどのコンパクトなLCMをプロファイルしている。
プロファイリングにより,4ビット量子化によりモデルメモリ使用量を約60~70%削減し,精度は2~5%に抑えられた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:56:07 GMT)
$\text{C}^{2}\text{BNVAE}$: Dual-Conditional Deep Generation of Network Traffic Data for Network Intrusion Detection System Balancing [0.4] 本稿では,バランスの取れたネットワークトラフィックデータを生成するために,Dual-Conditional Batch Normalization Variational Autoencoder(textC2textBNVAE$)を提案する。
$textC2textBNVAE$は、異なるデータカテゴリへのモデルの適応性を改善し、リアルなカテゴリ固有のデータを生成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:01:17 GMT)
Scalable Language Agnostic Taint Tracking using Explicit Data Dependencies [0.4] 本稿では,言語に依存しないデータ依存表現のためのシステムの設計と実装について述べる。
我々は、このデータフロー分析システムをオープンソースコード分析プラットフォームJoernに寄贈し、コミュニティに提供します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:15:59 GMT)
fairmetrics: An R package for group fairness evaluation [0.4] Fairmetrics Rパッケージは、グループベースのフェアネス基準を厳格に評価するための、ユーザフレンドリなフレームワークを提供する。
群に基づく公平度基準は、あるモデルが一組の事前定義されたグループに対して等しく正確であるか、あるいは適切に校正されているかを評価する。
Fairmetricsは、便利なラッパー関数を通じて、複数のメトリクスに対してポイントとインターバルの見積もりを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:07:41 GMT)
Detecting Voice Phishing with Precision: Fine-Tuning Small Language Models [0.4] 代表的オープンソース小言語モデル(LM)であるLlama3を微調整して音声フィッシング(VP)検出器を開発する。
そこで我々は慎重に設計したVP評価基準を提供し,CoT(Chain-of-Thought)技術を適用した。
実験の結果,VP評価基準付きプロンプトを含むデータセットを微調整したLlama3-8Bモデルでは,小型LMで最高の性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:44:12 GMT)
A multistep segmentation algorithm for vessel extraction in medical imaging [0.4] カーベレット変換のタイトなフレームとSURE手法のしきい値とを組み合わせた2次元画像の管状構造セグメンテーションの反復的手順を提案する。
提案アルゴリズムは主に [1, 9] で提案された TFA の提案に基づいており, 画像のヘッセン行列の固有ベクトルを用いて, この反復部分を改善する。
実験により,提案モデルの有効性を実証した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:20:34 GMT)
CoxNTF: A New Approach for Joint Clustering and Prediction in Survival Analysis [0.3] CoxNTFは、非負のテンソル因子化(NTF)を用いて、生存結果と密接に関連する有意義な潜在表現を導出する新しいアプローチである。
以上の結果から,CoxNTFはCoxnetに匹敵する生存予測性能が得られた。
この新しいアプローチは機能冗長性を効果的に処理し、共同クラスタリングと生存分析の予測に強力なツールとなる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:43:51 GMT)
LTG at SemEval-2025 Task 10: Optimizing Context for Classification of Narrative Roles [0.3] コンテキスト選択のための単純なエンティティ指向アプローチにより、限られたコンテキストウィンドウを持つモデルを用いたテキスト分類が可能となることを示す。
我々の文脈選択アプローチとXLM-RoBERTa言語モデルは、より大きな生成言語モデルでスーパービジョンファインチューニング(Supervised Fine-Tuning, Supervised Fine-Tuning, Supervised Language Model)に匹敵する、あるいは優れています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:58:45 GMT)
Evaluating AI-Powered Learning Assistants in Engineering Higher Education: Student Engagement, Ethical Challenges, and Policy Implications [0.3] 本研究では、AIを活用した学習フレームワークである教育AIハブを、大規模なR1公立大学の学部・環境工学コースで活用することを評価する。
学生たちは、AIアシスタントの利便性と快適さを高く評価し、AIツールの使用の容易さを報告している。
多くの学生はAIの使用を倫理的に許容できると見なしたが、制度的な政策や潜在的な学術的不正に対する理解について不確実性を示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:02:49 GMT)
Hybrid Stabilization Protocol for Cross-Chain Digital Assets Using Adaptor Signatures and AI-Driven Arbitrage [0.3] スタブルコインは、分散化、安定性、規制遵守のバランスをとる未解決のトリレンマに直面している。
本稿では,暗号コライズド・リザーブ,アルゴリズム・フューチャーズ契約,クロスチェーン・プールを組み合わせたハイブリッド暗号安定化プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 03:14:05 GMT)
SDS-Net: Shallow-Deep Synergism-detection Network for infrared small target detection [0.2] 現在のCNNに基づく赤外小目標検出法は,浅部特徴と深部特徴の均一性を見落としている。
依存関係の関係と融合機構は、マルチレベル機能の相補性を十分に活用できない。
本稿では,マルチレベル特徴表現を効率的にモデル化する浅層深度相乗効果検出ネットワーク(SDS-Net)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:44:41 GMT)
MLOps with Microservices: A Case Study on the Maritime Domain [0.1] このケーススタディでは,海上ドメインにおける異常検出のためのMLES(Machine Learning-Enabled System)の構築において学んだ課題と教訓について述べる。
MLESとして、Ocean Guardはコード、モデル、データコントラクトを採用して、サービス間のガイドラインを確立している。
このケーススタディは、ソフトウェアエンジニア、機械学習エンジニア、データサイエンティストに、同様のアプローチをシステムに活用させることを期待している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:04:59 GMT)
Assessing Intersectional Bias in Representations of Pre-Trained Image Recognition Models [0.1] 顔画像のイメージネット分類器の表現におけるバイアスについて検討する。
ImageNet分類器の表現は、特に年齢の区別が可能である。
あまり強調されないが、このモデルは特定の民族を関連付け、中年の集団で性別を区別しているように見える。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:29:49 GMT)
ICU-TSB: A Benchmark for Temporal Patient Representation Learning for Unsupervised Stratification into Patient Cohorts [0.1] ICU-TSB (Temporal Stratification Benchmark) を導入した。
本ベンチマークは, 臨床的に検証された疾患群とクラスターのアライメントを測定するために, 疾患を利用した新しい階層的評価フレームワークである。
その結果,時間的表現学習が臨床的に意味のある患者コホートを再発見できることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:52:50 GMT)
Depermissioning Web3: a Permissionless Accountable RPC Protocol for Blockchain Networks [0.1] ブロックチェーンネットワークでは、いわゆる“フルノード”がRPCインターフェースを通じてクライアントからのトランザクションにデータを提供し、中継する。
このサービスレイヤは、ブロックチェーン上に格納された“Web3”データと、ブロックチェーンネットワークのピアとして直接参加できない“Web2”モバイルあるいはWebアプリケーションとの統合を可能にする。
我々は、プライバシ、完全性、データアクセスに関する懸念に対処するために、パーミッションレス・アカウンタブルRPCプロトコル(PARP)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:27:31 GMT)
Large Language Models Often Know When They Are Being Evaluated [0.0] そこで本研究では,フロンティア言語モデルを用いて,評価や実世界の展開に起因した書き起こしを正確に分類できるかどうかを検討する。
我々は61の異なるデータセットから1000のプロンプトと書き起こしのベンチマークを構築した。
以上の結果から,フロンティアモデルにはまだ評価・認識レベルがかなり高いことが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:01:36 GMT)
WhisQ: Cross-Modal Representation Learning for Text-to-Music MOS Prediction [0.0] テキストから音楽システムへの平均オピニオンスコア(MOS)予測は、全体的な音楽品質とテキストプロンプトアライメントの両方を評価する必要がある。
本稿では、シーケンスレベルのコアテンションと最適なトランスポート正規化を通じて、この二重評価問題に対処するマルチモーダルアーキテクチャであるWhisQを紹介する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:12:51 GMT)
When Clifford benchmarks are sufficient; estimating application performance with scalable proxy circuits [0.0] 幅広い種類のエラーモデルに対して、これらの懸念は保証されていない。
Pauli twirling によるノイズ調整を許容する誤差モデルに対して、任意のジェネリック回路のダイヤモンドノルムと忠実度は、クリフォードゲートのみからなるプロキシ回路の忠実度によってよく近似されることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:43:00 GMT)
WISCA: A Consensus-Based Approach to Harmonizing Interpretability in Tabular Datasets [0.0] 機械学習(ML)モデルにおいて、解釈可能性は依然として不可欠である。
本研究では、6つのMLモデルを6つの合成データセットでトレーニングした。
WISCA(Weighted Scaled Consensus Attributions)は,コンセンサスを説明するために開発された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:26:25 GMT)
Unlocking Chemical Insights: Superior Molecular Representations from Intermediate Encoder Layers [0.0] 我々は、22個のADMET特性予測タスクにまたがる5種類の分子エンコーダの包括的解析を行う。
最適中間層からの固定埋め込みを用いることで、下流の性能は平均5.4%向上した。
これらの中間層への微調整により平均改善率は8.5%となり、性能は40.8%まで向上した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:03:51 GMT)
Unbounded entanglement-sustaining sequential local quantum state discrimination [0.0] 任意の数のパーティが2つの純量子状態を区別できるプロトコルを提案する。
我々のプロトコルは、最小限のエラー状態判別アプローチを採用している。
2つの状態の集合の大規模な族では、識別の成功確率は統一に必要なものと同じくらい近い。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:48:39 GMT)
Ultradecoherence model of the measurement process [0.0] 測定装置は、他のどの時間スケールよりも高速なオープンデコヒーレンスダイナミクスを持つようにモデル化できる。
この制限では、測定装置は常に、高速デコヒーレンス時間スケールで設定された精度まで一定の状態を仮定する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:05:55 GMT)
Towards scalable active steering protocols for genuinely entangled state manifolds [0.0] マルチパーティの絡み合った状態をターゲットにしたアクティブステアリングプロトコルを導入・解析する。
最大22量子ビットのシステムに対する数値シミュレーションでは、このプロトコルはスケーラブルであり、システム間の高マルチパーティントの絡み合いを可能にすることが示唆されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:17:31 GMT)
Towards Analyzing and Understanding the Limitations of VAPO: A Theoretical Perspective [0.0] 強化学習(RL)は、複雑なロングチェーン・オブ・ソート(ロングCoT)推論において、大きな言語モデル(LLM)を強化する。
VAPOの制限は、クレジット割り当てにおける固有の困難、時間的に抽象化された目標を持つ価値関数表現能力、グローバルバリューシグナルを局所的な政策改善に変換することに起因すると我々は主張する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:19:27 GMT)
TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research [0.0] 本研究では,おもちゃのタスクの形式的構造と実世界の複雑さを組み合わせることで,テキスト・ツー・ジェネレーションを学習の理想的なタスクとして提案する。
最小回路の識別にはエッジパッチやスパースオートエンコーダなどの解釈可能性技術を適用する。
私たちの研究は、構造化され、段階的に複雑な設定における解釈可能性メソッドの探索と比較のための堅牢なフレームワークを提供します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:22:50 GMT)
Tilt-Induced Localization in Interacting Bose-Einstein Condensates for Quantum Sensing [0.0] 傾斜光学格子に閉じ込められたボース・アインシュタイン凝縮体の局在遷移について検討した。
その結果,線形ポテンシャルによる局在化-非局在化遷移のサインが明らかとなった。
本稿では, 量子臨界検出のためのプラットフォームとして, 傾斜格子における相互作用BECの利用を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:36:47 GMT)
Thermoelectric energy conversion in molecular junctions out of equilibrium [0.0] 我々は、熱電量子輸送を研究するために、最近開発された一般化Kadanoff-Baym ansatzの中で、非平衡グリーン関数形式を提示する。
本研究は, 有限バンド幅効果の重要性を強調し, 時間分解熱電輸送のモデル化におけるGKBA法の有効性を実証するものである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:40:43 GMT)
Thermal avalanches in isolated many-body localized systems [0.0] 乱れ磁場を受ける大きさ$L$のハイゼンベルクスピン鎖の多体局在安定性を数値的に検討した。
強い障害に対して、雪崩は熱領域がシステムサイズでスケールする場合のみ起こる。
我々は多体局在とエルゴード挙動の中間位相を$P$の増加として同定する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:26:30 GMT)
Theoretical Foundations of the Deep Copula Classifier: A Generative Approach to Modeling Dependent Features [0.0] ディープコピュラ(Deep Copula、DCC)は、各特徴の辺縁分布の学習を、その結合依存構造をモデル化することから分離する生成モデルである。
軽量ニューラルネットワークは、機能相互作用を柔軟かつ適応的にキャプチャするために使用される。
DCCは依存性を意識した分類のための数学的基盤と解釈可能なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:44:27 GMT)
The quantum and the thermal fluctuations in deexcitations and excitations [0.0] 量子力学の枠組みにおける量子ゆらぎと熱ゆらぎを分析する。
異なる特徴を持つ非整合摂動として認識され、これら2つのタイプのゆらぎは、光学ブロッホ方程式における散逸項に繋がる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:26:12 GMT)
The World of AI: A Novel Approach to AI Literacy for First-year Engineering Students [0.0] この研究は、AIに以前の露出をほとんど、あるいは全く持たない1年生の工学生のために設計された、新しいコースを提示する。
コースは工学部と人文科学部が共同開発した3つのモジュールに分けられた。
その結果, 学生によるAI課題の理解は, 多様な指標で改善された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:04:56 GMT)
The Structure of Financial Equity Research Reports -- Identification of the Most Frequently Asked Questions in Financial Analyst Reports to Automate Equity Research Using Llama 3 and GPT-4 [0.0] この研究は72のERRの文を文単位で分析し、48.7%の文を169の質問アーチタイプに分類した。
我々は質問を事前に定義しなかったが、ERRの声明からのみ派生した。
この研究は、現在のERRの書き込みプロセスが、さらなる自動化、品質と効率の改善の恩恵を受ける可能性があることを裏付けている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:06:06 GMT)
The Influence of the Memory Capacity of Neural DDEs on the Universal Approximation Property [0.0] 本稿では,ニューラルDDEにおけるメモリ容量が普遍近似特性に与える影響について検討する。
Ktau$のメモリ容量が十分小さい場合、ニューラルDDEのダイナミクスはニューラルODEによって近似できることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:27:07 GMT)
Teaming in the AI Era: AI-Augmented Frameworks for Forming, Simulating, and Optimizing Human Teams [0.0] 論文は、チームの満足度、エンゲージメント、パフォーマンスを高めるAI強化されたチーム最適化フレームワークと実用的なシステムを開発することを目的としている。
まず,多腕バンディットアルゴリズムを利用して,ユーザの好みに基づいてチーム構成を反復的に洗練するチーム形成フレームワークを提案する。
第2に、大きな言語モデル(LLM)を使用して、チームと個々のメンバの両方に即時かつパーソナライズされたフィードバックを提供するAI駆動システムであるtAIfaを紹介します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:58:32 GMT)
TQml Simulator: Optimized Simulation of Quantum Machine Learning [0.0] 量子状態ベクトル上でのゲート層の作用をシミュレーションするための普遍的およびゲート固有の手法をベンチマークする。
我々は、与えられた回路の各層に対して最も効率的なシミュレーション手法を用いて、TQml Simulatorという数値シミュレータを開発した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:55:33 GMT)
T-TExTS (Teaching Text Expansion for Teacher Scaffolding): Enhancing Text Selection in High School Literature through Knowledge Graph-Based Recommendation [0.0] 本研究は,文学テキストの選択において,初等教育者のための足場を提供するツールの必要性に対処するものである。
我々はT-TExTS(T-TExTS)のための推薦システムを開発した。
知識グラフを用いて、教育的メリット、ジャンル、主題的関連性に基づく高校英語文学の本を示唆する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:20:02 GMT)
Strong Mitigation of the Magnetic-Field-Induced Frequency Shift in Coherent-Population-Trapping Atomic Clocks [0.0] 我々は、コヒーレント・ポピュレーション・トッピング(CPT)マイクロ波原子時計におけるクロック(0-0'')遷移の磁場誘起周波数シフト(MFS)について検討した。
その結果,CPTを用いた小型原子時計(MAC)の開発に寄与し,長期周波数安定性が向上した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:32:44 GMT)
Squeezing and quantum control of antiferromagnetic magnon pseudospin [0.0] 反強磁性体は、マグノン擬似スピンを形成するコヒーレントに結合したマグノン励起をホストする。
我々は、固有モード量子特性を決定する上で重要な役割を浮き彫りにするマグノン擬似スピンの強いスクイーズを見つける。
この結果は任意の結合ボソン系に適用可能であり、一般ボソン擬スピンの量子揺らぎ工学を導入する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:18:44 GMT)
Simmering: Sufficient is better than optimal for training neural networks [0.0] これは、ニューラルネットワークをトレーニングして、十分十分な重みとバイアスを生成する物理ベースの方法です。
我々は、SimmeringがAdamが過剰に適合するニューラルネットワークを修正していることを示し、Simmeringが最初からデプロイされた場合、過適合を避けることを示す。
本稿では,ニューラルネットワーク学習のパラダイムとして最適化を問うとともに,情報幾何学的議論を活用し,十分な学習アルゴリズムのクラスの存在を示唆する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:35:59 GMT)
Sequential Monte Carlo approximations of Wasserstein--Fisher--Rao gradient flows [0.0] 我々は、Kulback--Leibler分散の最小解であるいくつかの偏微分方程式を、$pi$から考える。
そこで我々は,Wasserstein-Fisher--Rao Flow of the Kullback--Leibler divergenceを近似する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:24:46 GMT)
Scalable Simulation of Fermionic Encoding Performance on Noisy Quantum Computers [0.0] 本研究では,Derby-Klassen符号化と呼ばれる局所符号化の性能について検討する。
我々は,Derby-Klassenエンコーディングを用いたポストセレクション手法の高サンプリング要求が,その適用性に限界をもたらすことを見出した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:00:01 GMT)
Scaffolding Creativity: Integrating Generative AI Tools and Real-world Experiences in Business Education [0.0] 本研究では,ビジネス教育における生成型AIツールと経験的学習の交わりについて検討する。
革新的な学部課程のケーススタディを通じて、学生が様々なAIモダリティとどのように相互作用し、適応するかを検討する。
この統合されたアプローチによって、初心者ユーザーが創造的な障壁を克服し、スキル獲得を加速し、AI生成の洞察と現実のバリデーションの間の動的相互作用を創出できることが明らかになった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:33:07 GMT)
Revisiting 3D LLM Benchmarks: Are We Really Testing 3D Capabilities? [0.0] 3D LLM評価における「2D-Cheating」問題を特定し,これらの課題を点雲の描画画像を用いたVLMで容易に解決できることを示した。
我々は、真の3D理解をよりよく評価するための原則を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:51:44 GMT)
Reinforcement Learning for Autonomous Warehouse Orchestration in SAP Logistics Execution: Redefining Supply Chain Agility [0.0] 本研究では,SAP Logistics Executionにおける倉庫作業の自律的オーケストレーションに強化学習を活用した先駆的フレームワークを提案する。
300,000 LEトランザクションの合成データセットは、マルチリンガルデータや運用上の障害を含む現実の倉庫シナリオをシミュレートする。
この分析は95%のタスク最適化精度を実現し、従来の手法に比べて処理時間を60%削減する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:34:27 GMT)
Redundant parameter dependencies in truncated classic and quantum Linear Response and Equation of Motion theory [0.0] 波動関数から分子特性を抽出することは、線形応答(LR)形式主義または等価に運動方程式(EOM)形式主義によって行うことができる。
計算された励起エネルギーは、基底状態がFCI溶液である場合でも、特定の選択された軌道に依存する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:18:34 GMT)
Recommender systems, stigmergy, and the tyranny of popularity [0.0] 本稿では,ユーザ固有のキャリブレーションを取り入れた検索プラットフォームを提案する。
私たちはプラットフォーム開発者に、単語の埋め込みとLLMを、ユーザの自律性を高める方法でどのように実装できるかをアドバイスします。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:27:23 GMT)
Rapid training of Hamiltonian graph networks without gradient descent [0.0] Hamiltonian Graph Networks (HGN) は15の解法よりも600倍高速にトレーニングできる。
我々は,N-body mass-spring system を含む様々なシミュレーションにおいて,最大3次元の物理量で頑健な性能を示す。
最小限の8ノードシステムでトレーニングしても、モデルがゼロショット方式で4096ノードのシステムに再トレーニングせずに一般化できることを明らかにする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:10:05 GMT)
Quantum mechanics can find a needle in a haystack every time [0.0] グローバーのアルゴリズムは、量子コンピューティングの優位性の先駆的な実証の1つである。
4から10要素のデータベースを探索し、1つのマークされた要素を選択すれば、平均的な成功確率は99.77 pm 0.05%である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:00:10 GMT)
Quantum Time Series Similarity Measures and Quantum Temporal Kernels [0.0] カーネルは、様々な類似性に基づく分類、クラスタリング、回帰アルゴリズムの重要なコンポーネントである。
本研究では、量子隠れマルコフモデル(QHMM)として知られる量子生成モデルが、その基礎となる分布を記述すると仮定する。
量子状態間のトレースやビュール距離などの分岐測度を用いて、シーケンス類似性を評価する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:19:42 GMT)
Quantum Interference in Two-Atom Resonant X-ray Scattering of an Intense Attosecond Pulse [0.0] 我々は、強いアト秒パルスで駆動される2つの非相互作用性Ne+イオンからの共鳴X線散乱を理論的に研究する。
我々のモデルは、ラビ振動、光イオン化、オージェ崩壊、弾性散乱と共鳴蛍光経路間の量子干渉を含む。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 23:33:20 GMT)
Private GPTs for LLM-driven testing in software development and machine learning [0.0] 要求に基づいて実行可能なテストコードを自動的に生成する,プライベートGPTの能力について検討する。
私たちは受け入れ基準を入力として使用し、エピックやストーリーの一部として定式化します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:05:41 GMT)
Privacy for Quantum Annealing. Attack on Spin Reversal Transformations in the case of cryptanalysis [0.0] SRTを用いて得られたIsing問題から元の問題を回復する方法を示す。
また,本手法は大規模問題にも有効であることを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:40:33 GMT)
Polarization properties of photon Bose-Einstein condensates [0.0] 我々は, ポンプビームのパワーと偏光に依存する熱・凝縮光の偏光を実験的に検討した。
ポンプの偏光を完全に制御することで、ポアンカー球の表面に任意の状態を作ることができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:58:58 GMT)
Option Pricing Using Ensemble Learning [0.0] アンサンブル学習の特徴は、柔軟性、高精度、洗練された構造である。
本稿では、価格設定のためのアンサンブル学習の適用について検討し、古典的な機械学習モデルとの比較分析を行う。
金融シミュレーションにおいて、ロバスト性やリアリズムを改善するために、実験間でパラメータ転送を活用する新しい実験戦略が導入された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 06:55:49 GMT)
On-board Mission Replanning for Adaptive Cooperative Multi-Robot Systems [0.0] 協調型自律ロボットシステムは、複雑なマルチタスクミッションを実行する上で大きな可能性を秘めている。
通常は遠隔地で、ダイナミックで危険な環境で活動する。
したがって、高速でオンボードなリプランニングアルゴリズムはレジリエンスを高めるために必要である。
この研究は、自律型マルチエージェントシステムにおけるレジリエンス向上の道を開いた。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:54:19 GMT)
On Quantum Random Walks in Biomolecular Networks [0.0] 生体分子ネットワークは、生物学的システムの組織に関する貴重な洞察を提供する。
これらのネットワークは、細胞機能、疾患のメカニズム、治療標的の同定を理解するための鍵となる。
生体分子ネットワーク解析のための量子ランダムウォーク(QRW)の可能性を探る。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:25:52 GMT)
On Inverse Problems, Parameter Estimation, and Domain Generalization [0.0] 逆問題設定におけるパラメータ推定の一般的な問題を分析する。
まず、離散パラメータ推定分析と直接的に関連づけることで、ドメインシフト問題に対処する。
データ処理の前後で観測されたパラメータ推定の理論的解析を行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:15:02 GMT)
Not All Jokes Land: Evaluating Large Language Models Understanding of Workplace Humor [0.0] プロのユーモアステートメントのデータセットと,各ステートメントの適切性を決定する機能を開発する。
5つの大言語モデルに対する評価は、LLMがユーモアの妥当性を正確に判断するのに苦戦していることを示している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:45:56 GMT)
Model Reduction for Quantum Systems: Discrete-time Quantum Walks and Open Markov Dynamics [0.0] 量子系の正確なモデル還元のためのフレームワークは代数的手法を用いて構築される。
提案した還元アルゴリズムは,Groverのアルゴリズムを実現する量子ウォークなど,原典型例で実証および検証を行う。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:00:43 GMT)
Microgrids Coalitions for Energy Market Balancing [0.0] 本稿では,エネルギー市場のダイナミクスに対処できる最適マイクログリッド連携を同定する手法を提案する。
個体はマイクログリッドの連合体として表現され、世代を超えて個体群の進化は組換えと突然変異によって保証される。
適合関数は、連立が生み出す総価値と、連立によって取引されるエネルギーがエネルギー市場によって利用可能/要求されるエネルギーを超える場合の連立に適用されるペナルティとの差として定義される。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:06:11 GMT)
Metainformation in Quantum Guessing Games [0.0] この研究はミーテン情報の概念を導入している。
たとえまだ提供されていないとしても、特定のタイプの追加のサイド情報が後で利用可能になることは知識である。
以上の結果から, 達成可能な成功確率は, 事前測定側情報と同じくらい有用となる点まで向上できることが示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:58:21 GMT)
Mapping of a many-qubit state onto an oscillator using controlled displacements [0.0] 振動子四重項によって制御された四重項において、キューディット状態がどのように変位するかを示す。
キューディット二次状態の重ね合わせで量子情報を符号化する完全回路を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:52:40 GMT)
Mapping correlations and coherence: adjacency-based approach to data visualization and regularity discovery [0.0] 相関は、データの規則性を記述するための最も一般的に使われ、効果的なアプローチである。
相関のタイプと度合いを表す地図を導出するアルゴリズムを提案する。
本手法は, 正規性発見のための新しい計算手法の開発を容易にする。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:31:16 GMT)
Leveraging Generative AI for Enhancing Automated Assessment in Programming Education Contests [0.0] 本稿では、生成型AI(大規模言語モデル)を活用して、競争力のあるプログラムアセスメントのための高品質なテストケース作成を自動化する革新的なNLP駆動方式を提案する。
以上の結果から,AIが生成したテストケースは,OJI 5年生のプログラミング問題のうち67%の未検出エラーを同定し,評価を大幅に向上することが示された。
プロンプト、翻訳データセット、方法論をオープンに共有することで、教育者やコンテスト主催者が容易に統合して評価品質を高め、作業負荷を低減し、学習者のパフォーマンスに対する洞察を深めることのできる、実践的なNLPベースのツールを提供します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:20:04 GMT)
Learners' Languages [0.0] バックプロップ・アズ・ファクター(Backprop as functor)では、深層学習の基本的な要素である降下とバックプロパゲーションが、強いモノノイド関手 Para(Euc)$to$Learn として概念化できることが示されている。
ここでは、Slens は 1 変数の関手の圏である Poly の完全な部分圏であり、関手 $Amapsto AyA$ を通して観察する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:23:54 GMT)
Kernel Density Machines [0.0] カーネル密度マシン(英: kernel density machine、KDM)は、ラドン-ニコディム微分の非パラメトリック推定器である。
整合性、機能中心極限定理、有限サンプル誤差境界を含む厳密な理論的保証を提供する。
シミュレーションおよび実データに基づく実験結果から,KDMの有効性と精度が示された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:58:34 GMT)
Judgment of Learning: A Human Ability Beyond Generative Artificial Intelligence [0.0] 大規模言語モデル(LLM)は、様々な言語に基づくタスクにおいて、人間の認知を模倣する傾向にある。
我々は、ChatGPTに基づくLLMが人間の学習判断(JOL)と一致しているかどうかを評価するために、クロスエージェント予測モデルを導入する。
実験の結果,人間のJOLは実際のメモリ性能を確実に予測するが,いずれのLLMも同等の予測精度は示さなかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:40:17 GMT)
Investigating the Relationship between Weighted Figure of Merit and Rosin's Measure [0.0] コンピュータビジョンアプリケーションに必要なさらなる処理のために、直線セグメントを分割してデジタル境界を近似する問題を解くために多くの研究がなされた。
多角形近似の良さを評価するのに使われた最初の尺度は、有益である。
ロシンは数学的な分析を通じて「メリット」と呼ばれる尺度を導入した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:20:18 GMT)
Interpolation of Quantum Polar Codes and Quantum Reed-Muller Codes [0.0] 量子極符号はいくつかの要件を満たすが、特定の重要な特徴を欠いているため、広く使われることを妨げている。
既存の構成では、有効な量子コードを生成するために絡み合いの補助を必要としたり、有限サイズの性能に乏しいり、あるいは基礎となるチャネル特性に極性符号を合わせるのに失敗したりしている。
そこで我々は,量子極符号と量子RM符号の補間戦略を提案し,量子極符号を絡み合うことなく設計し,有限サイズの符号性能を向上させるという課題に対処する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:07:46 GMT)
Integrating Complexity and Biological Realism: High-Performance Spiking Neural Networks for Breast Cancer Detection [0.0] スパイキングニューラルネットワーク(SNN)は、空間的特徴と時間的特徴の効率的な符号化を可能にする。
SNNは、従来のディープラーニングモデルの性能の一致が困難であるため、医療画像認識に限定的に適用されている。
本稿では,SNNとLempel-Ziv Complexity(LZC)を組み合わせた新しい乳がん分類手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:47:27 GMT)
Information versus Physicality: On the Nature of the Wavefunctions of Quantum Mechanics [0.0] 物理状態の分布と波動関数を関連付けるというPBRの議論の開始仮定に欠陥があることを示します。
量子状態の標準過程と射影測定を含むPBR論文の考察は、空間と時間における波動関数のオントロジ的状態に対処できないことを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:33:17 GMT)
Improving choice model specification using reinforcement learning [0.0] 選択モデラーを支援するための深層強化学習フレームワークを提案する。
エージェント」はモデルを特定し、それらを推定し、適度さとパシモニーに基づいて報酬を受け取る。
その結果、エージェントはその戦略を動的に適応させ、データ生成プロセス間で有望な仕様を特定します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:40:16 GMT)
Improving Customer Service with Automatic Topic Detection in User Emails [0.0] 本研究では、Telekom Srbijaにおける顧客のサービス効率を向上させる新しい自然言語処理パイプラインを提案する。
パイプラインの中心は、教師なしのトピックモデリングを可能にするモジュラーフレームワークBERTopicである。
システムは現在、同社のプロダクション環境で運用されており、自動Eメール分類を通じて顧客サービスの運用を合理化している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 12:12:39 GMT)
Imitating Radiological Scrolling: A Global-Local Attention Model for 3D Chest CT Volumes Multi-Label Anomaly Classification [0.0] 3次元CTスキャンのマルチラベル分類は、データの体積特性と検出すべき異常の多様性のために難しい課題である。
畳み込みニューラルネットワーク(CNN)に基づく既存のディープラーニング手法は、長距離依存を効果的に捉えるのに苦労する。
我々は,3次元CTスキャン解析において,放射線技師のスクロール挙動をエミュレートする新しいグローバルアテンションモデルCT-Scrollを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:43:45 GMT)
How to explain grokking [0.0] 学習におけるグルーキング(遅延一般化)の説明は、勾配ランゲヴィン力学(ブラウン運動)によってグルーキングをモデル化し、熱力学の考え方を適用することによって与えられる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:27:37 GMT)
High Throughput Event Filtering: The Interpolation-based DIF Algorithm Hardware Architecture [0.0] 本稿では、周波数重みフィルタを用いた距離ベース補間方式のハードウェアアーキテクチャを提案し、FPGAチップ上で実装する。
我々のアーキテクチャは、毎秒403.39万イベントのスループットを達成し、センサー解像度は1280 x 720と428.45 MEPS、解像度は640 x 480である。
AUROC(Area Under the Receiver Operating Characteristics)指数の平均値はデータセットによって0.844から0.999まで変化した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:49:18 GMT)
Finite-temperature entanglement and coherence in asymmetric bosonic Josephson junctions [0.0] 準一次元非対称二重井戸ポテンシャルに閉じ込められたN相互作用原子からなるボソニックジョセフソン接合の有限温度特性について検討する。
本研究では,状態の統計的アンサンブル,熱力学および絡み合いエントロピー,人口不均衡のスペクトル分解を数値的に計算する。
システムパラメータへの依存性を解析し、特に有限温度とオンサイトエネルギー非対称性がシステムの絡み合いやコヒーレンス特性にどのように影響するかを示す。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:36:45 GMT)
Feedback Guidance of Diffusion Models [0.0] Interval-Free Guidance (CFG) は, 条件付き拡散モデルにおける試料の忠実度向上の標準となっている。
本稿では,FBG(FeedBack Guidance)を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 13:46:32 GMT)
Fake Friends and Sponsored Ads: The Risks of Advertising in Conversational Search [0.0] 本稿では,対話型検索における広告の将来を批判的に検討する。
これは、この分野で広告が取るであろう形態の概要を提供する。
また、会話エージェントが他の目的を達成するために不整合のユーザ信頼を利用するという「フェイクフレンドジレンマ」も導入されている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:09:30 GMT)
FairICP: Encouraging Equalized Odds via Inverse Conditional Permutation [0.0] 本稿では,FairICPを導入し,対数学習と新しい逆条件変分法を統合する。
FairICPは、複雑で多次元的な属性によって記述された公正な条件下での等化オッズを促進するフレキシブルで効率的なスキームを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:36:08 GMT)
Exact Diagonalization of Sums of Hamiltonians and Products of Unitaries [0.0] 新しいツールは固有値と固有ベクトルに対する明示的な非摂動表現を提供する。
より長い共役論文では、新しいツールを断熱的量子進化に適用している。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 05:24:52 GMT)
Evolution of a twisted electron wave packet perturbed by an inhomogeneous electric field [0.0] 不均一な外部電界と相互作用する空間局在電子LG波パケットの非相対論的ダイナミクスについて検討する。
電場は波状パケットの構造を著しく変化させ、定性的形状を歪ませる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 21:41:06 GMT)
Evidencing Quantum Gravity with Thermodynamical Observables [0.0] テーブルトップ設定における重力の量子的記述に関する経験的証拠を得るための実験は、量子情報シグネチャの検出に焦点を当てた。
重力の量子化は、マクロ的、熱力学的な量の測定によって推測できる別の方法を探究する。
ボース気体の熱容量における古典的重力相互作用の予測と量子重力相互作用の明確な区別を見いだす。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:46:12 GMT)
Enhancing radioisotope identification in gamma spectra via supervised domain adaptation [0.0] 本研究では, 教師付き領域適応手法がラジオアイソトープ識別モデルを改善する方法について検討した。
まず、合成ソースドメインのデータを用いて放射性同位元素の同定モデルを事前訓練し、新しいターゲットドメインに対して微調整する。
解析の結果、微調整モデルの方が、ソースドメインデータやターゲットドメインデータのみにのみトレーニングされたモデルよりも大幅に優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:33:06 GMT)
Enhancing pretraining efficiency for medical image segmentation via transferability metrics [0.0] 医用画像のセグメンテーションタスクでは、ラベル付きトレーニングデータの不足が大きな課題となっている。
本稿では,事前学習したモデルが対象データをいかに頑健に表現できるかを計測する,対照的な学習に基づく新しい伝達可能性指標を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:33:48 GMT)
Emulating compact binary population synthesis simulations with robust uncertainty quantification and model comparison: Bayesian normalizing flows [0.0] 二元座標の集団シミュレーションは重力波(GW)観測から天体物理学的な知見を抽出する上で重要な役割を担っている。
ベイズ正規化フローを導入し,エミュレータの不確かさを定量化し,余剰化する方法を開発した。
共通エンベロープ進化により形成された二元ブラックホール群のシミュレーションにおいて, 推定不確かさの精度, 校正, およびデータ増幅の影響を実証した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 01:17:52 GMT)
Design Tradeoffs in Photonically Linked Qubit Networks [0.0] 量子ネットワークは、リモート量子処理ノード間で絡み合った量子ビットのペアを分散することで実現できる。
我々は、小さな光学キャビティに強く結合したイオン通信量子ビットに基づく2つのプロトコルを考える。
強い結合プロトコルの採用は、高忠実性を維持しながら、30~75%の実質的な流通率の改善をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 17:50:32 GMT)
Deep Learning Weather Models for Subregional Ocean Forecasting: A Case Study on the Canary Current Upwelling System [0.0] 本研究は,当初グローバル気象予報のために開発されたグラフニューラルネットワークを応用し,地域の海洋予測を改善することを目的としている。
このモデルは衛星データを用いて訓練され、海洋力学を捉える際の性能を評価するために最先端の物理海洋モデルと比較される。
以上の結果から, 深層学習モデルは, 高度化に課題があるにもかかわらず, 従来の手法を超越していることがわかった。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:05:06 GMT)
Decoupling Representation and Learning in Genetic Programming: the LaSER Approach [0.0] 生涯学習から表現進化を分離するフレームワークであるLaSERを提案する。
LaSER が標準 GP と GP を上回り、線形回帰が続くことを示す。
表現と適応の役割を分離することで、LaSERは象徴的回帰と分類の原則と枠組みを提供する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 08:30:09 GMT)
Data-Driven High-Dimensional Statistical Inference with Generative Models [0.0] HI-SIGMAは,データ駆動の背景分布を用いて非結合な高次元統計的推論を行う手法である。
HI-SIGMAは,標準手法に比べて感度が向上し,系統的不確実性を直接組み込むことができることを示した。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:00:24 GMT)
Competing automorphisms and disordered Floquet codes [0.0] 自己同型が時間的に不均一な分布を持つフロケ符号について研究する。
この視点は、欠落した測定のノイズモデルに従うと、動的自己同型(DA)符号における論理情報の保護または測定を説明することができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:03:18 GMT)
Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting [0.0] 予測が販売水準を過小評価すると、企業は販売、不足、そして関連する市場での小売業者の評判に影響を及ぼす。
本研究は,高解像度のレンガとモルタルの小売データセットに適用した予測モデルを徹底的に評価する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:08:17 GMT)
Combating Reentrancy Bugs on Sharded Blockchains [0.0] Reentrancyは、シャードなブロックチェーンに関するスマートコントラクトバグの有名なソースです。
本稿では,本モデルの特徴とその持続性バグに対する影響を3つの例で検討する。
これらの問題を解決するためにICPで活用できる新しいRustとMotokoパターンを紹介します。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:57:03 GMT)
CoT is Not True Reasoning, It Is Just a Tight Constraint to Imitate: A Theory Perspective [0.0] CoT(Chain-of-Thought)の促進により、大規模言語モデルの性能が明らかに向上した。
チェーン・オブ・サートは、大規模言語モデルに推論の形式を模倣するように誘導する強力な構造的制約として機能する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:13:39 GMT)
Classical analog circuit emulation of quantum Grover search algorithm [0.0] 我々は、普遍的な量子ゲートと量子アルゴリズムをエミュレートする完全にアナログなフレームワークを構築した。
これらの回路では、入力線と出力線は計算基底状態(CBS)を表すため、$n$ qubitsを表すために2n$行が必要である。
このフレームワークは絡み合った状態をエミュレートすることができ、デコヒーレンスがなく、測定は古典的であり、崩壊しない。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:51:28 GMT)
Casimir energy for $N$ constant conductivity $δ$-plates with a neural network perception [0.0] グラフェンに対して一定導電率を有する多層板のカシミール相互作用について検討した。
また、完全な磁気伝導体と複数導電率$delta$プレートの間のカシミールエネルギーについて検討し、ボイジャーの反発をもたらす。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 20:34:40 GMT)
Can spacetime fluctuations generate entanglement between co-moving accelerated detectors? [0.0] リンドラー・ウェッジのネスト配列では、元のリンドラー・フレームの真空は、シフトしたリンドラー・フレームのオブザーバに熱的に占有しているように見える。
検出器の加速度に対する絡み合いの依存性について検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:29:25 GMT)
CCLSTM: Coupled Convolutional Long-Short Term Memory Network for Occupancy Flow Forecasting [0.0] textbfCoupled Convolutional LSTM (CTM) を提案する。
CTMは、占有フローのメトリクスに関する最先端のパフォーマンスを達成し、この提出の時点で、2024年のOccupancy and Flow Prediction Challengeのリーダーボード上のすべてのメトリクス(テキスト)にランク付けされている。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:38:55 GMT)
Building Models of Neurological Language [0.0] 本稿では,神経学におけるドメイン固有言語モデルの開発と評価について述べる。
主な貢献は、神経学固有のデータセット(ケースレポート、QAセット、教科書由来のデータ)の作成、マルチワード表現抽出のためのツール、および医学用語のグラフベースの分析である。
パフォーマンスメトリクスとグラフコミュニティの結果が報告され、将来的にはphi-4のようなオープンソースのアーキテクチャを使ったマルチモーダルモデルに向けた作業が開かれる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:14:28 GMT)
Bioptic B1: A Target-Agnostic Potency-Based Small Molecules Search Engine [0.0] 我々は,標的に依存せず有効性に基づく分子探索モデルを開発した。
超大型の40B Enamine REALライブラリを100%リコールレートでスクリーニングした。
我々は、新しい分子の速度性能と検索品質の両面において、我々のモデルと最先端モデルのベンチマークを行った。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 22:20:55 GMT)
Beyond the Projection Postulate and Back: Quantum Theories with Generalised State-Update Rules [0.0] 有効な非従来的更新ルールの明示的な例を示す。
この状態更新ルールのフレームワークにより、投影的な更新ルールと他のすべてのプロパティを区別する操作プロパティを特定できます。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 16:12:59 GMT)
Being Strong Progressively! Enhancing Knowledge Distillation of Large Language Models through a Curriculum Learning Framework [0.0] 知識蒸留(KD)は、教師モデルの能力をより小さな学生モデルに転送することで、大きな言語モデル(LLM)を圧縮する。
LLMの既存のKD法は、訓練中に学生モデルの分布が大きく変化することを防ぐのに失敗することが多い。
我々は,「プログレッシブ・オーバーロード」の強度トレーニング原理に着想を得た,新しいプラグインカリキュラム学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:48:38 GMT)
Automated Journalistic Questions: A New Method for Extracting 5W1H in French [0.0] フランスのニュース記事から5W1H情報を取得するための,最初の自動抽出パイプラインを設計する。
また、4人のアノテータによってマークされた5W1Hの回答が付いた250本のケベックのニュース記事のコーパスも作成しています。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:28:37 GMT)
Applying XAI based unsupervised knowledge discovering for Operation modes in a WWTP. A real case: AQUAVALL WWTP [0.0] 淡水がより需要の高い商品である場合、水の再利用が重要なポイントである。
WWTPは、目標を達成するために最善を尽くす必要がある複雑な施設である。
WWTPは主に監視されており、時間とともに機能する歴史データの巨大なデータベースを生成する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:34:56 GMT)
Ancilla measurement-based Quantum Otto engine using double-pair spin architecture [0.0] 双対スピンペアアーキテクチャを用いた量子熱エンジンモデルを提案する。
補助スピン対を2次元構成で使用して性能を調節する。
エンジン効率が標準量子オットー限界を超えることを実証する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:15:04 GMT)
An optical frequency shifter based on continuous-wave pump fields [0.0] 連続波ポンプ場を用いた水素装荷中空糸の偏光保存周波数変換について述べる。
本稿では,様々な制限と損失機構について論じるとともに,変換効率をほぼ一元化に高めるための経路を提案する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 11:19:17 GMT)
An Uncertainty-Aware ED-LSTM for Probabilistic Suffix Prediction [0.0] ビジネスプロセスの簡潔な予測は、プロセスが完了するまでイベントの残りのシーケンスを予測する。
確率的接尾辞予測(probabilistic suffix prediction)は,接尾辞の確率分布を近似する新しいアプローチである。
提案手法は,Uncertainty-Aware-Decoder LSTM (U-ED-LSTM) とモンテカルロサフィックスサンプリングアルゴリズムに基づく。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 09:03:44 GMT)
An Ensemble-Based Two-Step Framework for Classification of Pap Smear Cell Images [0.0] Pap Smear Cell Classification Challenge (PS3C)は2025年にI SBIと共同で設立された。
本研究の目的は,パップスミア画像分類のための自動ツールの開発を促進することである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 07:48:14 GMT)
A quantum algorithm for linear autonomous differential equations via Padé approximation [0.0] 離散化解は行列指数の積で表すことができる。
提案アルゴリズムは対角線パド近似により行列指数を近似する。
提案アルゴリズムの複雑さを解析する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 10:48:09 GMT)
A low-loss telecom-band nanofiber cavity for interfacing Yb atomic qubits [0.0] テレコム波長遷移におけるイッテルビウム(Yb)原子との効率的な界面設計のための光ナノファイバーキャビティの作製
加熱プル法では、従来の水素-酸素火炎を重水素-酸素火炎に置き換えることで、ヒドロキシルによる吸収損失を抑制する。
テレコムバンドにおけるファイバ集積原子-光子インターフェースの実用化は,スケーラブルな量子通信と分散量子コンピューティングへの重要なステップである。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 14:33:59 GMT)
A generalization of Bernstein-Vazirani algorithm with multiple secret keys and a probabilistic oracle [0.0] 問題は、量子オラクルを使って複数の秘密鍵の集合から1つ以上の秘密鍵を見つけることである。
提案した量子アルゴリズムは(a)確率オラクルへの単一のクエリを用いて任意のキー(確実に)を取得することができる。
古典的なアルゴリズムでは、秘密鍵の1ビットも確実に見つけることができません。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 04:29:21 GMT)
A Unified Representation for Continuity and Discontinuity: Syntactic and Computational Motivations [0.0] 本稿では,3つの文法形式,すなわちPhrase Structure Grammar(PSG),Dependency Grammar(DG),Categorial Grammar(CG)の言語構造を統一的に表現する。
対応原理はPSG, DG, CGからの表現原理の統一表現を可能にするために提案される。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 02:25:42 GMT)
A Framework of decision-relevant observability: Reinforcement Learning converges under relative ignorability [0.0] 因果推論パラダイムが欠如の無知を形式化することを示す。
相対的無知(Relative ignorability)は、不完全データに基づいて正確な意思決定の要求を洗練させるグラフィカル・因果的基準である。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 18:00:32 GMT)
(LiFT) Lightweight Fitness Transformer: A language-vision model for Remote Monitoring of Physical Training [0.0] 本稿では,RGBスマートフォンカメラのみを用いたエクササイズの遠隔監視を可能にするフィットネストラッキングシステムを提案する。
我々のモデルは76.5%の精度で運動を検出し、RGBビデオのみを使用して85.3%の精度で反復を数えることができる。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 19:07:06 GMT)
(AI peers) are people learning from the same standpoint: Perception of AI characters in a Collaborative Science Investigation [0.0] シナリオベースアセスメント(SBA)は、本物の社会的相互作用のコンテキストを提供するためのシミュレーションエージェントを導入する。
近年のテキスト・トゥ・ビデオ技術のようなマルチモーダルAIの進歩により、これらのエージェントはAI生成文字に拡張される。
本研究では,協調科学研究の文脈を反映したSBAにおいて,教師とチームメイトの役割を担っているAIキャラクタを学習者がどう感じているかを検討する。
論文参考訳(メタデータ) (Fri, 06 Jun 2025 15:29:11 GMT)