Reliable Few-shot Learning under Dual Noises [166.5] そこで我々はDETA++(Denoized Task Adaptation)を提案する。
DETA++はメモリバンクを使用して、各インナータスククラスのクリーンなリージョンを格納し、精製する。
大規模な実験は、DETA++の有効性と柔軟性を示している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:05:57 GMT)
xGen-MM (BLIP-3): A Family of Open Large Multimodal Models [152.1] BLIP-3は大規模マルチモーダルモデルを開発するためのオープンフレームワークである。
事前訓練されたベースモデルと微調整された命令を含む4Bと14Bのモデルをリリースする。
我々のモデルは、類似のモデルサイズを持つオープンソースのLMM間での競合性能を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:29:26 GMT)
PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding [126.2] 画像と映像の理解において透過的な研究を行うために,完全オープンかつ再現可能なフレームワークで知覚モデル(PLM)を構築することを研究する。
モデルからの蒸留なしで標準的な訓練パイプラインを分析し、大規模合成データを調べ、重要なデータギャップを識別する。
これらのギャップを埋めるために、我々は、挑戦的なビデオ理解タスクを評価するためのスイートであるPLM-VideoBenchをリリースした。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:16:57 GMT)
AutoPresent: Designing Structured Visuals from Scratch [99.8] エンド・ツー・エンドの画像生成とプログラム生成を様々なモデルでベンチマークする。
スライド生成用のコードと7kペアの命令でトレーニングされた8B LlamaベースのモデルであるAutoPresentを開発した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:27:02 GMT)
EvoLM: In Search of Lost Language Model Training Dynamics [97.7] EvoLMは、事前トレーニング、継続事前トレーニング、教師付き微調整、強化学習を含む、LMのトレーニングダイナミクスの体系的かつ透過的な分析を可能にするモデルスイートである。
1Bおよび4Bパラメータを持つ100以上のLMをスクラッチからトレーニングすることにより、上流(言語モデリング)と下流(確率解決)の両方の推論能力を評価する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:58:47 GMT)
MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation [89.7] MultiFinBenは、グローバルファイナンシャルドメインに合わせた最初のマルチリンガルおよびマルチモーダルベンチマークである。
我々は,最初のOCR組み込み財務QAタスクである EnglishOCR と SpanishOCR の2つの新しいタスクを紹介する。
本稿では,動的で難易度の高い選択機構を提案し,コンパクトでバランスの取れたベンチマークをキュレートする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:27:14 GMT)
Progressive Inference-Time Annealing of Diffusion Models for Sampling from Boltzmann Densities [85.8] 拡散に基づくサンプル学習のために, PITA(Progressive Inference-Time Annealing)を提案する。
PITAはボルツマン分布のアナーリングと拡散平滑化という2つの相補的手法を組み合わせたものである。
N-体粒子系、アラニンジペプチド、トリペプチドの平衡サンプリングを可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:14:22 GMT)
Revela: Dense Retriever Learning via Language Modeling [85.1] 本稿では,言語モデリングによる自己教師型検索学習のための統合学習フレームワークであるRevelaを紹介する。
一般ドメイン (BEIR) とドメイン固有 (CoIR) のベンチマークで様々なバックボーン上でRevelaを評価する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:13:59 GMT)
Learning to Refine with Fine-Grained Natural Language Feedback [81.7] 我々は,3つの異なるLLM能力の構成要素として,フィードバックによる洗練を検討することを提案する。
提案手法の鍵となる特性は,ステップ2の批判モデルがエラーに対してきめ細かいフィードバックを与えることができる点である。
文書基盤要約の事実整合性を改善する作業において,異なる機能モデルがDCRによる精細化の恩恵を受けることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:03:45 GMT)
Using Natural Language Explanations to Rescale Human Judgments [81.7] 大規模言語モデル(LLM)を用いて順序付けアノテーションと説明を再スケールする手法を提案する。
我々は、アノテータのLikert評価とそれに対応する説明をLLMに入力し、スコア付けルーリックに固定された数値スコアを生成する。
提案手法は,合意に影響を及ぼさずに生の判断を再スケールし,そのスコアを同一のスコア付けルーリックに接する人間の判断に近づける。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:59:14 GMT)
Mitigating Over-Squashing in Graph Neural Networks by Spectrum-Preserving Sparsification [81.1] 本稿では,構造的ボトルネック低減とグラフ特性保存のバランスをとるグラフ再構成手法を提案する。
本手法は、疎性を維持しながら接続性を高めたグラフを生成し、元のグラフスペクトルを大半保存する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:01:00 GMT)
Demystify Transformers & Convolutions in Modern Image Deep Networks [80.2] 本稿では,一般のコンボリューションとアテンション演算子の真の利益を,詳細な研究により同定することを目的とする。
注意や畳み込みのようなこれらの特徴変換モジュールの主な違いは、それらの空間的特徴集約アプローチにある。
様々なSTMが統合されたフレームワークに統合され、包括的な比較分析を行う。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:23:50 GMT)
On Domain-Adaptive Post-Training for Multimodal Large Language Models [72.7] 本稿では,MLLMのドメイン適応をポストトレーニングにより体系的に検討する。
データ合成、トレーニングパイプライン、タスク評価に重点を置いています。
バイオメディシン、食品、リモートセンシングなどの高インパクト領域で実験を行う。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:55:02 GMT)
ExploraCoder: Advancing code generation for multiple unseen APIs via planning and chained exploration [70.3] ExploraCoderはトレーニング不要のフレームワークで、大規模な言語モデルにコードソリューションで見えないAPIを呼び出す権限を与える。
実験の結果、ExploreaCoderは、事前のAPI知識に欠けるモデルのパフォーマンスを大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:08:17 GMT)
SP-VLA: A Joint Model Scheduling and Token Pruning Approach for VLA Model Acceleration [69.5] VLA(Vision-Language-Action)モデルは、その強力な制御能力に注目が集まっている。
計算コストが高く、実行頻度も低いため、ロボット操作や自律ナビゲーションといったリアルタイムタスクには適さない。
本稿では,共同スケジューリングモデルとプルーニングトークンにより,VLAモデルを高速化する統一フレームワークSP-VLAを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:54:06 GMT)
On Path to Multimodal Historical Reasoning: HistBench and HistAgent [68.0] HistBenchは、AIの歴史的推論能力を評価するために設計された、414の高品質な質問の新しいベンチマークである。
タスクは、一次資料に基づく事実検索から、原稿や画像の解釈分析まで、幅広い歴史的問題にまたがる。
我々は、OCR、翻訳、アーカイブ検索、ヒストリーにおける画像理解のための慎重に設計されたツールを備えたヒストアジェント(HistAgent)を提示する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:42:45 GMT)
DeltaProduct: Improving State-Tracking in Linear RNNs via Householder Products [63.7] リニアリカレントニューラルネットワーク(線形RNN)は、シーケンスモデリングのためのトランスフォーマーの競合代替手段として登場した。
対角行列は、Mamba、GLA、mLSTMなどのモデルで使用されるが、高速に実行可能であるが、表現性は限られている。
DeltaNetやRWKV-7といった最近のアーキテクチャでは、同時トークンとチャネルミキシングが可能な対角形+ランク1構造が採用されている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:21:12 GMT)
A Survey of World Models for Autonomous Driving [63.3] 自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
世界モデルは、マルチセンサーデータ、セマンティックキュー、時間ダイナミクスを統合する駆動環境の高忠実度表現を提供する。
本稿では、自律運転の世界モデルにおける最近の進歩を体系的にレビューする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:19:49 GMT)
Reinforcing Spatial Reasoning in Vision-Language Models with Interwoven Thinking and Visual Drawing [62.4] 空間における推論への描画は、視覚空間における基本的な描画操作を通じてLVLMを推論できる新しいパラダイムである。
我々のモデルはVILASRと呼ばれ、様々な空間推論ベンチマークで既存の手法より一貫して優れています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:46:55 GMT)
Screen Hijack: Visual Poisoning of VLM Agents in Mobile Environments [60.0] GHOSTは視覚言語モデル(VLM)上に構築された移動体エージェントに特化して設計された最初のクリーンラベルバックドア攻撃である。
本手法は,トレーニングサンプルの一部の視覚入力のみを,対応するラベルや指示を変更することなく操作する。
実世界の6つのAndroidアプリとモバイルに適応した3つのVLMアーキテクチャを対象に,本手法の評価を行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:46:05 GMT)
Provably Efficient Online RLHF with One-Pass Reward Modeling [59.3] 本稿では,過去のデータを保存する必要がなく,一定時間で計算できるワンパス報酬モデリング手法を提案する。
提案手法は,統計的および計算効率の両面で向上することを示す理論的保証を提供する。
我々はUltrafeedback-binarizedおよびMixture2データセット上でLlama-3-8B-InstructとQwen2.5-7B-Instructモデルを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:54:01 GMT)
A Community-driven vision for a new Knowledge Resource for AI [59.3] WordNetのような知識リソースの成功にもかかわらず、検証可能な汎用的な知識ソースは、AIインフラストラクチャにおいて重要な欠陥である。
本稿では,この知見を要約し,新しい知識基盤に向けたコミュニティ主導のビジョンを概説する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:51:28 GMT)
Subspace-Boosted Model Merging [58.9] Subspace Boostingは、最大20のエキスパートモデルのマージ効率を、ビジョンベンチマークで評価した場合、10%以上の大きなマージンで向上させる。
本稿では,高次一般化特異値分解を用いてタスク類似性をさらに定量化し,モデルマージに対する新たな解釈可能な視点を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:59:29 GMT)
Learning Multi-scale Spatial-frequency Features for Image Denoising [58.9] 本稿では,マルチスケール適応型デュアルドメインネットワーク(MADNet)を提案する。
画像ピラミッド入力を用いて低解像度画像からノイズのない結果を復元する。
高周波情報と低周波情報の相互作用を実現するために,適応型空間周波数学習ユニットを設計する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:28:09 GMT)
Relic: Enhancing Reward Model Generalization for Low-Resource Indic Languages with Few-Shot Examples [58.6] ほとんどのオープンソースの多言語報酬モデルは、主にオープンソース言語の好みデータセットに基づいて訓練されている。
低リソースIndic言語における報酬モデリングのための新しい文脈内学習フレームワークであるRELICを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:56:16 GMT)
Uncertainty Quantification in Retrieval Augmented Question Answering [57.1] 本稿では,QAモデルが備える通路の有効性を推定することで,QAモデルの不確実性を定量化する。
我々は、目標QAモデルの通過効率を予測するために軽量ニューラルネットワークを訓練し、単純な情報理論のメトリクスが解の正しさをある程度予測できる一方で、より高価なサンプリングベースの手法を効率的に近似または上回ることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:51:02 GMT)
ALTA: Compiler-Based Analysis of Transformers [56.8] 本稿では,ALTAプログラムをトランスフォーマー重みにマッピングできるALTAとコンパイラを提案する。
ALTA は Weiss らによって提案された RASP にインスパイアされている。
コンポジション一般化タスクのSCANベンチマークの解法と同様に,トランスフォーマーがパリティと加算を計算するための長さ不変のアルゴリズムをどう表現できるかを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:55:45 GMT)
IllusionBench+: A Large-scale and Comprehensive Benchmark for Visual Illusion Understanding in Vision-Language Models [56.3] 現在のビジュアル言語モデル(VLM)は印象的なイメージ理解を示すが、視覚錯覚に苦慮している。
我々はIllusionBenchを紹介した。IllusionBenchは、古典的な認知錯覚と現実のシーン錯覚を含む包括的視覚錯覚データセットである。
我々は従来のパターンに似ているが現実に異なるトラップイリュージョンを設計し、SOTAモデルの問題を強調する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:53:18 GMT)
FOCoOp: Enhancing Out-of-Distribution Robustness in Federated Prompt Learning for Vision-Language Models [56.3] ビジョン言語モデルのためのフェデレーション・プロンプト・ラーニング(FPL)は、分散クライアント間でモデルを協調的に適応するための強力なアプローチである。
既存のFPLアプローチは、特にアウト・オブ・ディストリビューション(OOD)シフトにおいて、パフォーマンスと堅牢性の間のトレードオフに悩まされる。
我々は、クライアント間の多様な分散をキャプチャするFederated OOD-aware Context Optimization (FOCoOp)フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:16:02 GMT)
Weight Factorization and Centralization for Continual Learning in Speech Recognition [55.6] リハーサルのない多言語、言語に依存しない状態でモデルを継続的に訓練することは、破滅的な忘れを招きかねない。
人間の脳が覚醒サイクルを通じて知識を学習・統合する能力に着想を得て,継続的な学習手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:59:24 GMT)
BiMark: Unbiased Multilayer Watermarking for Large Language Models [54.6] テキスト品質とメッセージ埋め込み能力のバランスをとる新しい透かしフレームワークであるBiMarkを提案する。
BiMarkは、短いテキストに対して最大30%高い抽出率を達成すると同時に、低いパープレキシティで示されるテキスト品質を維持する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:08:59 GMT)
Re-TASK: Revisiting LLM Tasks from Capability, Skill, and Knowledge Perspectives [54.1] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)による複雑な問題を解決する重要な方法となっている。
本稿では,LLMタスクを能力,スキル,知識の観点から再考する理論モデルであるRe-TASKフレームワークを紹介する。
多様な領域にわたる実験は、Re-TASKの有効性を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:59:40 GMT)
GRPO-CARE: Consistency-Aware Reinforcement Learning for Multimodal Reasoning [53.9] 我々は、複雑な実世界のビデオにバランスの取れた知覚と推論を必要とするベンチマークであるSEED-Bench-R1を紹介する。
SEED-Bench-R1を用いて、標準GRPOは解の精度を向上する一方で、推論ステップと解の論理的コヒーレンスを57.9%の一貫性で減少させる。
応答の正しさと推論コヒーレンスの両方を明示的な監督なしに最適化する整合性を考慮したRLフレームワークGRPO-CAREを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:49:13 GMT)
StoryWriter: A Multi-Agent Framework for Long Story Generation [53.8] 長いストーリー生成は、既存の大きな言語モデルにとって依然として課題である。
本稿では,3つの主要モジュールから構成されるマルチエージェント・ストーリー生成フレームワークであるStoryWriterを提案する。
StoryWriterは、ストーリーの品質と長さの両方において、既存のストーリー生成ベースラインを大幅に上回る。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:26:58 GMT)
One Sample is Enough to Make Conformal Prediction Robust [53.8] 共形予測は, 1つのランダムな摂動入力に対して前方通過しても, ある程度の堅牢性が得られることを示す。
提案手法は,入力毎に多数のパス(例えば100回程度)を使用するSOTA法と比較して,平均セットサイズが小さいロバストな集合を返す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:14:25 GMT)
Breaking the Compression Ceiling: Data-Free Pipeline for Ultra-Efficient Delta Compression [53.1] UltraDeltaはデータフリーのデルタ圧縮パイプラインで、超高圧縮と強力なパフォーマンスを実現する。
UltraDeltaは、冗長性を最小化し、情報を最大化し、層間、層内、大域的な寸法で性能を安定させるように設計されている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:45:16 GMT)
Each Rank Could be an Expert: Single-Ranked Mixture of Experts LoRA for Multi-Task Learning [53.1] Low-Rank Adaptation (LoRA)は、その効率性とモジュール性から、大きな言語モデル(LLM)を特定のドメインに適用するために広く使われている。
最近の研究は、各LoRAモジュールを専門家として扱い、複数の特殊なLoRAモジュールによるタスク干渉を軽減することで、Mixture of Experts (MoE)を採用している。
効果はあるものの、これらの手法は個々のタスク内の知識を分離することが多く、関連するタスク間で共有された知識を完全に活用することができない。
各ランクをテキスト処理することでMoEをLoRAに埋め込むシングルランク専門家LoRA(textbfSMoRA)を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:00:52 GMT)
Streaming Non-Autoregressive Model for Accent Conversion and Pronunciation Improvement [52.9] 本研究では,非ネイティブ音声を母語的アクセントに変換する最初のアクセント変換モデルを提案する。
提案手法は,従来のACアーキテクチャをEmformerエンコーダと最適化推論機構で変更することでストリーム処理を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:05:29 GMT)
SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity [52.9] SparseLoRAは,コンテキスト空間の空間的分散によって微調整を高速化する手法である。
SparseLoRAは計算コストを最大2.2倍、測定速度を最大1.6倍に削減する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:53:34 GMT)
Advancing Embodied Agent Security: From Safety Benchmarks to Input Moderation [52.8] エンボディード・エージェントは、複数のドメインにまたがって大きな潜在能力を示す。
既存の研究は主に、一般的な大言語モデルのセキュリティに重点を置いている。
本稿では, エンボディエージェントの保護を目的とした新しい入力モデレーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:21:00 GMT)
Structured Attention Matters to Multimodal LLMs in Document Understanding [52.4] 入力形式が文書理解性能に与える影響について検討する。
生のOCRテキストはMLLMの性能を向上するのではなく、しばしば機能不全であることがわかった。
本稿では,LaTexパラダイムを用いて文書要素を符号化する構造保存手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:16:18 GMT)
CRIA: A Cross-View Interaction and Instance-Adapted Pre-training Framework for Generalizable EEG Representations [52.3] CRIAは、可変長および可変チャネルコーディングを使用して、異なるデータセット間でEEGデータの統一表現を実現する適応フレームワークである。
このモデルでは、時間的、スペクトル的、空間的特徴を効果的に融合させるクロスアテンション機構を採用している。
テンプル大学脳波コーパスとCHB-MITデータセットによる実験結果から、CRIAは既存の方法よりも、同じ事前学習条件で優れていることが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:31:08 GMT)
Learning Multi-Branch Cooperation for Enhanced Click-Through Rate Prediction at Taobao [51.8] MBCnet(Multi-Branch Cooperation Network)を紹介する。
MBCnetは、複数のブランチネットワークが互いに協調して、より複雑な機能相互作用モデリングを可能にする。
大規模産業データセットの実験とアプリでのオンラインA/Bテストは、MBCnetの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:53:17 GMT)
CP$^2$: Leveraging Geometry for Conformal Prediction via Canonicalization [51.7] 幾何データシフトにおける共形予測(CP)の問題について検討する。
本稿では,幾何的ポーズなどの幾何学的情報を統合することを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:12:02 GMT)
Reimagination with Test-time Observation Interventions: Distractor-Robust World Model Predictions for Visual Model Predictive Control [51.1] 世界モデルは、現在の観測と計画された行動によって、ロボットが将来の観察を「想像」することができる。
新たな視覚的障害は、行動結果の予測を破損させ、ロボットが計画や行動検証のために世界モデルの想像力に依存するとき、下流の障害を引き起こす可能性がある。
本稿では、世界モデルによるより信頼性の高い行動結果の予測を可能にする簡易かつ効果的なテストタイム戦略であるReOI(Reimagination with Observation Intervention)を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:41:29 GMT)
Relational Deep Learning: Challenges, Foundations and Next-Generation Architectures [50.5] グラフ機械学習は、任意のグラフ構造化データで学習するモデルの能力を大幅に向上させた。
従来の工学的特徴を伴わない'関係エンティティグラフ'のエンドツーエンド表現を可能にする新しい青写真を提案する。
本稿では、大規模マルチテーブル統合や、時間力学と異種データのモデリングの複雑さなど、重要な課題について論じる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:51:38 GMT)
Efficient and Flexible Neural Network Training through Layer-wise Feedback Propagation [49.4] レイヤワイドフィードバックフィードバック(LFP)は、ニューラルネットワークのような予測器のための新しいトレーニング原則である。
LFPはそれぞれの貢献に基づいて個々のニューロンに報酬を分解する。
提案手法は,ネットワークの有用な部分と有害な部分の弱体化を両立させる手法である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:57:46 GMT)
ML-Master: Towards AI-for-AI via Integration of Exploration and Reasoning [49.3] 本稿では,探索と推論をシームレスに統合する新しいAI4AIエージェントであるML-Masterを提案する。
我々はML-MasterをMLE-Benchで評価し、平均メダル率29.3%を達成し、既存の手法をはるかに上回っている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:53:28 GMT)
A Quantum-Control Lambda-Calculus with Multiple Measurement Bases [49.2] 複数の測定ベースをサポートする型付き量子計算であるLambda-SXを紹介する。
型システム内の任意のベースに対する重複性を追跡することで、Lambda-SXは、測定に関するより柔軟な制御と構成的推論を可能にします。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:59:39 GMT)
InstructTTSEval: Benchmarking Complex Natural-Language Instruction Following in Text-to-Speech Systems [48.4] テキスト音声システムは、固定されたスタイルのラベルに依存したり、これらのキューを制御するために音声プロンプトを挿入する。
近年の試みでは、パラ言語的特徴を修飾する自然言語命令の活用が試みられている。
InstructTTSEvalは、複雑な自然言語スタイル制御の能力を測定するためのベンチマークである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:08:01 GMT)
Polyline Path Masked Attention for Vision Transformer [48.3] ビジョントランスフォーマー (ViT) はコンピュータビジョンにおいて大きな成功を収めた。
Mamba2は自然言語処理タスクにおいて大きな可能性を実証している。
本稿では,VTの自己注意機構とMamba2の強化された構造化マスクを統合するポリリンパス仮面注意(PPMA)を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:52:30 GMT)
Resource Allocation for Twin Maintenance and Computing Task Processing in Digital Twin Vehicular Edge Computing Network [48.2] 車両エッジコンピューティング(VEC)は、車両の近くにVECサーバを配置することで、計算キャッシュサービスを提供する。
しかしながら、VECネットワークは、ハイカーモビリティのような課題に直面している。
本研究では,ネットワーク内のツイン処理による2種類の遅延について検討した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:29:09 GMT)
External Evaluation of Discrimination Mitigation Efforts in Meta's Ad Delivery [47.4] 本稿では,Metaによって実装された可変還元システム(VRS)が,個人にとっての機会へのアクセスを有意義に改善していないことを示す。
そして、現実世界の広告でVRSを評価する実験を行い、VRSがばらつきを減らす一方で、広告主のコストも上昇させることを示した。
当社のアプローチは,すべてのグループからのユーザに対する広告露出の増加と,広告主に対するコスト削減によって,VRSよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:29:26 GMT)
AlignDistil: Token-Level Language Model Alignment as Adaptive Policy Distillation [46.7] トークンレベルの報酬最適化のためのRLHF等価蒸留法を提案する。
実験の結果、既存の方法よりもAlignDistilの方が優れていることが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:29:42 GMT)
On Continuous Monitoring of Risk Violations under Unknown Shift [46.7] 進化するデータストリームにおけるリスク違反のリアルタイムモニタリングのための一般的なフレームワークを提案する。
我々の手法は、遭遇したシフトの性質について最小限の仮定の下で機能する。
本稿では,異常検出におけるリスクの監視と,さまざまなシフト下での予測によるアプローチの有効性について述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:52:24 GMT)
Error mitigation of shot-to-shot fluctuations in analog quantum simulators [46.5] 本稿では,ハミルトニアンがシステムダイナミクスを制御しているパラメータのショット・ツー・ショット変動に対処する誤差軽減手法を提案する。
我々は、このショット・ツー・ショットノイズを増幅し、ゼロノイズ制限を外挿することで、現実的な雑音分布に対するノイズのない結果が復元されることを厳密に証明する。
数値解析により,現実的な条件下でのRydberg原子配列の有効多体コヒーレンス時間の大幅な向上を予測した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:00:00 GMT)
ShapeLib: Designing a library of programmatic 3D shape abstractions with Large Language Models [46.4] プログラム型3次元形状抽象化ライブラリの設計にLLMの先行を活用できる最初の方法であるShapeLibを提案する。
本システムでは,ライブラリに含める関数のテキスト記述と,典型的な形状のシードセットという,2種類の設計意図を受け入れている。
また,ShapeLibは,汎用性やユーザビリティ,操作時の妥当性の維持といった面で,従来の代替抽象的発見よりも明確なメリットがあることがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:48:04 GMT)
Robust Reward Modeling via Causal Rubrics [46.4] リワードモデル(RM)は、人間のフィードバックによってLLM(Large Language Models)を整列させるのに基本的だが、報酬のハッキングに悩まされることが多い。
Creeは、報酬のハッキングを軽減するために設計された明確な因果モデルに基づく、新しいフレームワークである。
CreeはRewardBenchの標準ベースラインを大幅に上回り、平均精度を最大5.4%向上させ、特定のカテゴリーで最大13.2%と7.2%のゲインを達成した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:59:47 GMT)
4Seasons: Benchmarking Visual SLAM and Long-Term Localization for Autonomous Driving in Challenging Conditions [46.0] 大規模4Seasonsデータセットに基づく課題条件下での自律運転のための新しい視覚的SLAMと長期局所化ベンチマークを提案する。
提案したベンチマークでは,季節変化や天候,照明条件の変動による劇的な外見の変化が報告されている。
本稿では,視覚計測,大域的位置認識,および地図に基づく視覚的位置決め性能を共同評価するための統合ベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:17:07 GMT)
Leveraging Influence Functions for Resampling Data in Physics-Informed Neural Networks [45.8] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)を解くための強力なアプローチを提供する
PINNは最近、科学機械学習の分野で貴重なツールとして登場した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:21:14 GMT)
Modeling Membrane Degradation in PEM Electrolyzers with Physics-Informed Neural Networks [45.3] プロトン交換膜 (PEM) 電解器は持続可能な水素製造に重要である。
長期的な性能は膜劣化によって妨げられ、信頼性と安全性の課題を引き起こす。
従来の物理学に基づくモデルが開発され、解釈可能性を提供しているが、測定や校正が難しい多くのパラメータを必要とする。
本研究では,PEM電解器の膜劣化をモデル化するための物理インフォームドニューラルネットワーク(PINN)の最初の応用について述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:46:49 GMT)
AGC-Drive: A Large-Scale Dataset for Real-World Aerial-Ground Collaboration in Driving Scenarios [45.2] AGC-DriveはAerial-Ground Cooperativeの3D知覚のための最初の大規模実世界のデータセットである。
このデータセットは、都市部のラウンドアバウト、ハイウェイトンネル、オン/オフランプを含む14の現実世界の運転シナリオをカバーしている。
車両間協調認識と車間協調認識の2つの3次元タスクのベンチマークを提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:48:43 GMT)
SGIC: A Self-Guided Iterative Calibration Framework for RAG [45.2] 大規模言語モデル(LLM)は、頑健な文脈内推論を生かしている。
ツールとして不確実性スコアを用いる新しいフレームワークを提案する。
また、反復的な自己校正訓練セットを構築するための革新的なアプローチも導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:45:13 GMT)
A control of threshold of hard excitaion mode of optomechanical system by a low-intensity seed wave [45.0] フォノンモードを介して相互に相互作用するコヒーレント波によって励起される2つの光モードに基づく光学系を考える。
低強度のシード波による低周波光モードの励起は、ハード励起モードの閾値を著しく低下させる可能性があることを実証した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:36:01 GMT)
TARDIS STRIDE: A Spatio-Temporal Road Image Dataset and World Model for Autonomy [44.9] 本研究では,360度パノラマ画像を相互接続した観測,状態,行動ノードに変換する方法を示す。
我々は、このデータセットをトランスフォーマーベースの生成ワールドモデルであるTARDISを介してベンチマークする。
我々は、制御可能な画像合成、命令追従、自律的自己制御、最先端のジオレファレンスなど、さまざまなエージェントタスクにおいて、堅牢な性能を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:10:29 GMT)
On Learning Multi-Modal Forgery Representation for Diffusion Generated Video Detection [44.6] 本稿では,拡散生成コンテンツを検出するためのMulti-Mod-al Detection(MM-Det)という革新的なアルゴリズムを提案する。
MM-Detは、Multi-Modal Forgery Representation(MMFR)を生成することで、LMM(Large Multi-Modal Models)の深い総合的能力を利用する
MM-Detによるビデオフォサイシクス(DVF)の最先端性能の実現
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:51:03 GMT)
Semantic-Aware Spectrum Sharing in Internet of Vehicles Based on Deep Reinforcement Learning [43.8] 深部強化学習(DRL)ソフトアクター・クリティック(SAC)アプローチに基づく意味認識スペクトル共有アルゴリズム(SSS)を提案する。
我々は、IoV環境におけるV2VおよびV2Iスペクトル共有における意味情報のメトリクスを再定義し、高速意味スペクトル効率(HSSE)と意味伝達率(HSR)を導入した。
この最適化は、V2VとV2Iの共有戦略の最適リンク、セマンティック情報を送信する車両の送信パワー、送信されるセマンティックシンボルの長さを含む。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:42:33 GMT)
Learning to Route LLMs with Confidence Tokens [43.6] 大規模言語モデル(LLM)は、いくつかのタスクにおいて印象的なパフォーマンスを示し、現実のアプリケーションにますますデプロイされている。
高精細度設定では、LCMの出力がいつ信頼できないかを知ることが不可欠となる。
本研究では,LLMが回答の信頼度を確実に示すことができる範囲と,この信頼度の概念が下流の精度向上にどのように変換できるかを考察する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:52:45 GMT)
DT-UFC: Universal Large Model Feature Coding via Peaky-to-Balanced Distribution Transformation [43.5] 本稿では,大規模モデルの普遍的特徴符号化に関する最初の体系的研究について述べる。
主な課題は、異なるモデルから抽出された特徴の本質的に多様性があり、分布的に互換性のない性質にある。
本稿では,高度に歪んだ特徴分布を共通目標空間に再帰させる学習ピーク対均衡分布変換を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:43:32 GMT)
Deep-Reinforcement-Learning-Based AoI-Aware Resource Allocation for RIS-Aided IoV Networks [43.4] 車両間通信(V2X)方式を考慮したRIS支援車両インターネット(IoV)を提案する。
車両間リンク(V2I)のタイムラインと車両間リンク(V2V)の安定性を改善するため,情報量(AoI)モデルとペイロード伝達確率モデルを導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:33:44 GMT)
PL-Guard: Benchmarking Language Model Safety for Polish [43.4] ポーランド語における言語モデルの安全性分類のために,手動で注釈付きベンチマークデータセットを導入する。
また、モデルロバスト性に挑戦するために設計されたこれらのサンプルの逆摂動変異体も作成する。
我々は、アノテーション付きデータの異なる組み合わせを用いてこれらのモデルをトレーニングし、それらのパフォーマンスを評価し、公開されているガードモデルと比較する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:56:41 GMT)
4Seasons: A Cross-Season Dataset for Multi-Weather SLAM in Autonomous Driving [43.1] 本稿では,自律運転における季節的・挑戦的な知覚条件をカバーする新しいデータセットを提案する。
その中には、視覚計測、グローバルな位置認識、マップベースの再位置追跡などが含まれる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:00:43 GMT)
Code Graph Model (CGM): A Graph-Integrated Large Language Model for Repository-Level Software Engineering Tasks [42.8] 大きな言語モデル(LLM)は関数レベルのコード生成を約束しているが、リポジトリレベルのソフトウェアエンジニアリングタスクは依然として難しい。
本稿では,オープンソース LLM がエージェントベースアプローチを必要とせずに,リポジトリレベルのタスクを効果的に処理できるかどうかを検討する。
リポジトリコードグラフ構造をLLMのアテンション機構に統合するコードグラフモデル(CGM)を導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:50:53 GMT)
LeVERB: Humanoid Whole-Body Control with Latent Vision-Language Instruction [42.7] ヒューマノイド全体制御のための視覚言語・クローズドループベンチマーク(WBC)について紹介する。
そこで我々は,人間型視覚言語WBCのための階層型遅延命令追従フレームワークであるLeVERB: Latent Vision-Language-Encoded Robot Behaviorを提案する。
私たちのベンチマークでは、単純なビジュアルナビゲーションタスクでゼロショットが80%の成功率、全体的な58.5%の成功率が、階層的な階層的なVLA実装よりも7.8倍高い。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:57:34 GMT)
Generating Directed Graphs with Dual Attention and Asymmetric Encoding [42.0] 離散フローマッチングフレームワーク上に構築された有向グラフの最初の生成モデルであるDirectoを提案する。
提案手法は,非対称なペアワイズ関係に適合する原理的位置エンコーディングと,(ii)入出力依存と出出力依存の両方を捉える二重アテンション機構と,(iii)頑健で離散的な生成機構を組み合わせたものである。
本研究は,提案手法の有効性と汎用性を強調し,有向グラフ生成における今後の研究の基盤を確立するものである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:35:20 GMT)
RealDriveSim: A Realistic Multi-Modal Multi-Task Synthetic Dataset for Autonomous Driving [41.8] 本稿では,自律運転のための現実的なマルチモーダル合成データセットであるRealDriveSimを紹介する。
このデータセットは人気のある2DコンピュータビジョンアプリケーションとそのLiDARアプリケーションをサポートし、64クラスまでの詳細なアノテーションを提供する。
提案するデータセットを広範囲のアプリケーションやドメインに対して広範囲に評価し,既存の総合ベンチマークと比較して最先端の結果を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:49:49 GMT)
On using AI for EEG-based BCI applications: problems, current challenges and future trends [41.8] 人工知能(AI)の最近の進歩は、頭皮脳波(EEG)から脳信号を解読する進歩を加速している
現実のEEGベースのBCIにAIを適用することで、信頼性に影響を与える可能性のある、ユニークで複雑なハードルが提示される。
私たちの目標は、真に実践的で効果的なEEGベースのBCIソリューションを作成するための明確なロードマップを作成することです。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:43:17 GMT)
Seeing is Fixing: Cross-Modal Reasoning with Multimodal LLMs for Visual Software Issue Fixing [41.8] 大規模言語モデル-(LLM)ベースの自動プログラム修正(APR)技術は、現実のGitHubの課題を解決する上で有望な結果を示している。
これらの自律システムは、視覚情報の解釈と活用の制限により、マルチモーダルな問題のシナリオを解決するのに苦労する。
GUIRepairは,視覚情報を理解し,取得することで,多モーダルな問題シナリオを解決するための多モーダルな推論手法である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:42:11 GMT)
A Survey on Future Frame Synthesis: Bridging Deterministic and Generative Approaches [41.6] Future Frame Synthesis (FFS) は、既存のコンテンツに基づいて将来のフレームシーケンスを生成することを目的としている。
この調査は、一般的に使用されるデータセットと代表アルゴリズムをカバーする、FFSに関する既存の研究の包括的なレビューを提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:21:06 GMT)
Core Knowledge Deficits in Multi-Modal Language Models [41.4] MLLM(Multi-modal Large Language Models)は、ハイレベルな認識と推論よりも印象的な能力を示す。
しかし、野生での頑丈さは限定的であり、人間にとって直感的で努力の無い仕事では不足することが多い。
これらの欠陥は,幼少期から人間に根ざした,中核的な知識の欠如に起因する,という仮説を考察する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:48:50 GMT)
FlatCAD: Fast Curvature Regularization of Neural SDFs for CAD Models [41.1] 混合二階項のみを正規化する曲率プロキシを提案する。
メソッドはドロップインでフレームワークに依存しないため、スケーラブルで曲率に敏感なSDF学習への実践的な道を開く。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:54:08 GMT)
Privacy-Preserving LLM Interaction with Socratic Chain-of-Thought Reasoning and Homomorphically Encrypted Vector Databases [40.9] 大規模言語モデル(LLM)は、カレンダー、メール、医療記録などの機密性の高いユーザーデータにアクセスするパーソナルエージェントとして、ますます使われるようになっている。
現在、ユーザはトレードオフに直面している。強力なが信頼できないLLMプロバイダにプライベートレコードを送信することで、露出リスクが増大する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:13:30 GMT)
Consistency Verification in Ontology-Based Process Models with Parameter Interdependencies [40.5] プロセス知識の形式化は、製造におけるパラメータ相互依存の一貫性のあるモデリングを可能にする。
クロスコンテキストアプリケーションと知識再利用をサポートするために、そのような表現は汎用形式で定義され、複数のプロセスコンテキストにまたがって適用される。
本稿では,これまで開発されたプロセスセマンティクスモデルに対する検証機構について述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:21:16 GMT)
SWE-Dev: Evaluating and Training Autonomous Feature-Driven Software Development [40.5] SWE-Devは、現実世界の機能開発タスクで自律的なコーディングシステムを評価し、訓練するために設計された最初の大規模データセットである。
このコレクションは、Supervised Fine-Tuning(SFT)のための高品質なデータを提供するが、実行可能単体テストから正確な報酬信号を提供することで強化学習(RL)を可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:54:44 GMT)
Out-of-Distribution Detection: A Task-Oriented Survey of Recent Advances [40.3] Out-of-Distribution(OOD)検出は、トレーニングカテゴリ空間外のテストサンプルを検出することを目的としている。
評価シナリオ,様々な応用,今後の研究方向性について論じる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:58:59 GMT)
When Does Divide and Conquer Work for Long Context LLM? A Noise Decomposition Framework [39.7] 本稿では,Large Language Models (LLM) を長文に適用することの課題について検討する。
本稿では,長いコンテキストタスクの障害モードを,クロスチャンク依存(タスクノイズ),コンテキストサイズで大きくなる混乱(モデルノイズ),部分的な結果の完全統合(集約ノイズ)の3つのカテゴリに分類する理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:49:34 GMT)
Solving Zero-Sum Convex Markov Games [38.7] 本研究では,Nash equilibria (NE) に独立手法を用いて,2プレーヤゼロサムゲーム (cMG) におけるグローバルコンバージェンスを初めて保証する。
NC-pおよび両側pPL条件下での一般的な制約付きmin-max問題に対処する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:12:02 GMT)
Human2LocoMan: Learning Versatile Quadrupedal Manipulation with Human Pretraining [38.6] 我々は,人間とロコマンの双方から収集したデータを活用して,四面体操作のためのクロス・エボディメント・模倣学習システムを提案する。
我々は,6つの実世界の操作タスクにおいて,平均成功率を41.9%向上させるシステムの有効性を検証した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:22:52 GMT)
GoalLadder: Incremental Goal Discovery with Vision-Language Models [38.4] 視覚環境における単一言語命令からRLエージェントを学習する新しい手法を提案する。
GoalLadderは、自然言語で指定されたタスクの完了にエージェントを近づける状態の漸進的な発見で動作する。
以前の作業とは異なり、GoalLadderはVLMのフィードバックを完全に信頼していない。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:28:27 GMT)
ScaleGNN: Towards Scalable Graph Neural Networks via Adaptive High-order Neighboring Feature Fusion [37.2] スケーラブルで効果的なグラフ学習のために,マルチレベルグラフ機能を適応的に融合する新しいフレームワークであるScaleGNNを提案する。
予測精度と計算効率の両面で,ScaleGNNは最先端のGNNよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:21:40 GMT)
AutoV: Learning to Retrieve Visual Prompt for Large Vision-Language Models [37.1] 様々な候補から最適な視覚刺激を自動選択するTextbfAutoVを提案する。
大規模言語モデルに視覚的プロンプトのセットを入力し、モデルが生成した予測損失に応じてそれらをランク付けする。
ランキングを監視信号として使用し、LVLMの様々な視覚的プロンプトから最適な視覚的プロンプトを自動選択するようAutoVを訓練する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:02:53 GMT)
Ladder-residual: parallelism-aware architecture for accelerating large model inference with communication overlapping [36.7] すべての残差ベースモデルに適用可能な,シンプルなアーキテクチャ変更であるLadder Residualを紹介する。
Ladder Residualをすべてのレイヤに適用することで、TPシャーディングを8デバイス以上使用することで、推論時にエンドツーエンドのウォールクロックを29%高速化することができる。
1Bおよび3Bラダー変換器をスクラッチからトレーニングし、標準の高密度変圧器ベースラインに匹敵する性能を観測する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:06:08 GMT)
From General to Targeted Rewards: Surpassing GPT-4 in Open-Ended Long-Context Generation [36.5] 本稿では、データセットと報奨信号計算方法を含む革新的強化学習(RL)ベースのフレームワークであるProxyRewardを紹介する。
本研究は,人間による複雑なオープンエンド質問に対処するLLMの能力を高める効果的な方法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:44:34 GMT)
GFlowGR: Fine-tuning Generative Recommendation Frameworks with Generative Flow Networks [36.4] 本稿では、生成勧告(GR)を多段階生成タスクとして扱い、GFlowNetsベースの微調整フレームワーク(GFlowGR)を構築する。
提案フレームワークは,従来のレコメンデータシステムからの協調的知識を統合し,適応的軌道サンプリングと包括的報酬モデルを作成する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:04:31 GMT)
AutoHFormer: Efficient Hierarchical Autoregressive Transformer for Time Series Prediction [36.2] 時系列予測には、3つの競合する目標を同時に達成するアーキテクチャが必要である。
本稿では,これらの課題に対処する階層型自己回帰変換器であるAutoHFormerを紹介する。
総合的な実験により、AutoHFormer 10.76XはP08のPatchTSTと比較して高速なトレーニングと6.06倍のメモリ削減を示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:47:04 GMT)
On the Theoretical Understanding of Identifiable Sparse Autoencoders and Beyond [36.1] スパースオートエンコーダ(SAE)は、大規模言語モデル(LLM)によって学習された特徴を解釈する強力なツールとして登場した。
複雑な重畳されたポリセマンティックな特徴を、わずかに活性化されたニューラルネットワークによる特徴再構成によって解釈可能なモノセマンティックな特徴に復元することを目的としている。
SAEの幅広い応用にもかかわらず、SAEがどのような条件下で、重畳された多意味的特徴から基底真理単意味的特徴を完全に回復できるかは不明である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:16:08 GMT)
Efficient and Privacy-Preserving Soft Prompt Transfer for LLMs [35.9] POST(Privacy of Soft prompt Transfer)は、小さなモデルでソフトプロンプトのプライベートチューニングを可能にするフレームワークである。
計算コストを削減し、プライバシーを保護し、実用性の高いソフトプロンプトを効果的に転送する。
実験の結果,POSTは計算コストを低減し,プライバシを保ち,高ユーティリティなソフトプロンプトを効果的に転送することがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:25:16 GMT)
A Comprehensive Survey on Continual Learning in Generative Models [35.8] 本稿では,主流生成モデルに対する連続学習手法の包括的調査を行う。
これらのアプローチをアーキテクチャベース、正規化ベース、リプレイベースという3つのパラダイムに分類する。
我々は、トレーニング目標、ベンチマーク、コアバックボーンを含む、異なる生成モデルに対する連続的な学習設定を分析する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:08:46 GMT)
SWE-Factory: Your Automated Factory for Issue Resolution Training Data and Evaluation Benchmarks [34.9] SWE-Factoryは、大規模なGitHubイシュー解決データセットを作成するために設計された、自動パイプラインである。
SWE-Builderは評価環境構築を自動化するマルチエージェントシステムである。
出口符号に基づくグルーピングは手動検査に比べて100%精度が向上する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:54:48 GMT)
From Experts to a Generalist: Toward General Whole-Body Control for Humanoid Robots [34.3] BumbleBee (BB) は、モーションクラスタリングとsim-to-real適応を組み合わせたエキスパート・ジェネリストの学習フレームワークである。
BBは最先端の全身制御を実現し、実世界でのアジャイルで堅牢で汎用的なヒューマノイドのパフォーマンスのための新しいベンチマークを設定します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:15:49 GMT)
PRISON: Unmasking the Criminal Potential of Large Language Models [34.2] 我々は,大言語モデルの犯罪ポテンシャルを,虚偽の声明,フレームアップ,心理的操作,感情の軽視,道徳的拡張の5つの次元にわたって定量化する。
古典映画に適応した構造化犯罪シナリオを用いて,ロールプレイによるLLMの犯罪可能性と反犯罪能力を評価する。
その結果、最先端のLLMは、誤解を招く声明や回避戦術の提案など、創発的な犯罪傾向をしばしば示している。
刑事役のモデルでは、平均41%の精度で偽装行為を認識し、犯罪行為の実施と検出の重大なミスマッチを明らかにする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:06:27 GMT)
FlowRAM: Grounding Flow Matching Policy with Region-Aware Mamba Framework for Robotic Manipulation [34.0] FlowRAMは、生成モデルを利用して地域認識を実現する新しいフレームワークである。
FlowRAMは4段階未満のステップで、さまざまな現実世界のタスクに対して物理的に妥当なアクションを生成することができる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:30:02 GMT)
Stepping Out of Similar Semantic Space for Open-Vocabulary Segmentation [34.0] Open-vocabulary segmentationは、無制限テキスト入力をガイダンスとして与えられた任意のカテゴリのセグメンテーションを実現することを目的としている。
トレーニングセマンティクスとは大きく異なるOpenBenchという新しいベンチマークを提示する。
また,多様なオープンシナリオに対するセグメンテーション性能を改善するため,OVSNetという手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:32:53 GMT)
Reconfigurable Intelligent Surface Assisted VEC Based on Multi-Agent Reinforcement Learning [33.6] 車両のエッジコンピューティングは、タスクをローカルに実行したり、近くのエッジデバイスにオフロードすることで、高強度タスクを実行することができる。
リアシスト(RIS)は、車両通信をサポートし、代替の通信経路を提供するために導入された。
改良型マルチエージェント・ディープ決定性勾配ポリシーを応用した新しい深層強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:37:05 GMT)
Joint Tensor-Train Parameterization for Efficient and Expressive Low-Rank Adaptation [33.3] Low-Rank Adaptation (LoRA)は、そのパラメータ効率の良い大規模ニューラルネットワークの微調整で広く認識されている。
本稿では,これらの制約を克服する新しいテンソルトレイン誘導適応フレームワークを提案する。
その結果,Guide ベースの LoRA は標準 LoRA と TT-LoRA を一貫して上回り,より少ないパラメータで精度とスケーラビリティの向上を実現している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:46:23 GMT)
RiOT: Efficient Prompt Refinement with Residual Optimization Tree [32.7] Residual Optimization Tree (RiOT) は自動プロンプト最適化のための新しいフレームワークである。
RiOTはテキストグラデーションを通じてプロンプトを反復的に洗練し、各ステップで複数のセマンティックな候補を生成し、パープレキシティを使って最適なプロンプトを選択する。
ツリー構造は最適化プロセスを効率的に管理し、スケーラビリティと柔軟性を確保する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:19:56 GMT)
LMR-BENCH: Evaluating LLM Agent's Ability on Reproducing Language Modeling Research [32.4] 大規模言語モデル(LLM)エージェントは、科学的発見の進展に顕著な可能性を証明している。
しかし、研究論文、特にNLPドメインからコードを再生する能力は、いまだ解明されていない。
本稿ではLMR-BENCHについて述べる。LMR-BENCHは言語モデリング研究におけるLLMエージェントのコード再生能力を評価するためのベンチマークである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:04:16 GMT)
AutoSculpt: A Pattern-based Model Auto-pruning Framework Using Reinforcement Learning and Graph Learning [32.1] AutoSculptは、ディープニューラルネットワーク(DNN)のためのパターンベースの自動プルーニングフレームワーク
既存の推論エンジンで認識可能なDNNアーキテクチャ内の規則的なパターンを自動的に識別し、特定する。
最大90%の刈り取り率と約18%の改善を達成し、全てのベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:50:21 GMT)
Membership Inference Attack Should Move On to Distributional Statistics for Distilled Generative Models [31.8] 大規模生成モデルの訓練における不正なデータ使用を検出するために,MIA(メンバシップ推論攻撃)が有効であることが証明された。
従来のMIAは蒸留生成モデル(すなわち学生モデル)に対して失敗し,その効率性はますます向上している。
蒸留生成モデルを用いて不許可なトレーニングデータを検出するための分布型MIAの3つの原理を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:33:05 GMT)
Can Common VLMs Rival Medical VLMs? Evaluation and Strategic Insights [31.7] 医用ビジョン言語モデル(VLM)は、様々な画像処理のために大規模な事前訓練を利用するが、かなりの計算とデータ資源を必要とする。
本研究は, 疾患診断および視覚的質問応答(VQA)の共通および医学的VLMを系統的に評価する。
医学固有の事前訓練は、ID設定において利点があるが、一般的なVLMは、軽量な微調整の後、医学固有のモデルにマッチするか、超える。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:59:00 GMT)
Learning Model Successors [31.3] 我々は、トレーニングで観察された有限標本に基づいて、統一テーマは誘導であると主張する。
本稿では,モデル継承という中心的な概念を取り入れた新しい学習パラダイム,インダクティブラーニングを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:03:39 GMT)
From Pixels to CSI: Distilling Latent Dynamics For Efficient Wireless Resource Management [31.1] 本稿では,制御システムのダイナミクスを協調的にモデル化し,予測する新しい機械学習手法を提案する。
提案手法は,ベースライン方式に匹敵する制御性能を維持しつつ,送信電力を50%以上削減することを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:08:20 GMT)
A Scalable Factorization Approach for High-Order Structured Tensor Recovery [30.9] 分解は、非常に小さな次元の約$N$因子を使って$N$のテンソルを表すが、パラメータの数を著しく減少させる。
これらの問題に対する計算的メモリ効率のアプローチは、局所アルゴリズムを用いた因子を直接的に最適化することである。
様々なテンソル分解問題を解くための因子分解の統一的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:07:07 GMT)
IS-Bench: Evaluating Interactive Safety of VLM-Driven Embodied Agents in Daily Household Tasks [30.5] 対話型安全性のために設計された最初のマルチモーダルベンチマークであるIS-Benchを紹介する。
高忠実度シミュレーターでインスタンス化された388のユニークな安全リスクを持つ161の挑戦的なシナリオが特徴である。
これは、特定のリスク発生ステップの前/後においてリスク軽減アクションが実行されるかどうかを検証する、プロセス指向の新たな評価を容易にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:34:46 GMT)
Probing the Robustness of Large Language Models Safety to Latent Perturbations [30.2] 安全アライメントは、信頼できる人工知能を構築する上で重要な要件である。
我々は、小さな潜伏シフトが、整列モデルにおける安全でない応答を引き起こすことを観察する。
学習中に隠された表現に制御された摂動を注入する微調整戦略であるLayer-wise Adversarial Patch Training (LAPT)を導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:03:05 GMT)
GeoGuess: Multimodal Reasoning based on Hierarchy of Visual Information in Street View [29.0] マルチモーダル推論,すなわちGeoGuessの新規かつ挑戦的なタスクについて紹介する。
ストリートビューの画像が与えられた場合、その場所を特定し、詳細な説明を行うことが課題である。
特別にキュレートされたGeoExplainデータセットを導入することでGeoGuessのベンチマークを確立する。
また,マルチモーダル・マルチレベル推論手法,すなわちSightSenseを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:19:31 GMT)
Serving Large Language Models on Huawei CloudMatrix384 [28.9] 従来のAIクラスタは、計算強度、メモリ帯域幅、チップ間通信、レイテンシの制限に直面している。
本稿では,Huawei CloudMatrixを紹介する。Huawei CloudMatrixは,プロダクショングレードのCloudMatrix384スーパーノードで実現された次世代AIアーキテクチャである。
384 Ascend 910 NPUと192 Kunpeng CPUを超広帯域統一バス(UB)ネットワークを介して相互接続し、直接通信とリソースの動的プールを可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:27:10 GMT)
Aligning ASR Evaluation with Human and LLM Judgments: Intelligibility Metrics Using Phonetic, Semantic, and NLI Approaches [28.8] 1)既存のメトリクスは知性を十分に反映していない、(2)LSMはASR出力を洗練できるが、ASR書き起こしの修正の有効性は過小評価されている。
本稿では,自然言語推論(NLI)スコア,意味的類似性,音韻的類似性を組み合わせた新しいメトリクスを提案する。
我々のASR評価基準は,音声アクセシビリティプロジェクトデータにおける人間の判断と0.890の相関を達成し,従来の手法を超越し,誤りに基づく尺度よりもインテリジェンスを優先する必要性を強調した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:21:19 GMT)
AGI-Driven Generative Semantic Communications: Principles and Practices [28.8] 我々は,ジェネレーティブセマンティックコミュニケーション(GSC)という,AGIアプリケーションをサポートするためのAGI駆動通信パラダイムを導入する。
まず、GSCの基本概念と既存の意味コミュニケーションとの違いを説明し、その後、高度なAI技術に基づくGSCの一般的なフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:03:11 GMT)
DRL-Based Federated Self-Supervised Learning for Task Offloading and Resource Allocation in ISAC-Enabled Vehicle Edge Computing [28.5] Vehicle Edge Computing(VEC)は、タスクをRoad Side Unit(RSU)にオフロードすることで、この問題に対処する。
改良されたアルゴリズムは、部分的なタスクをROSにオフロードし、送信電力、CPU周波数、タスク割り当て比率を調整することでエネルギー消費を最適化する。
シミュレーションの結果,拡張アルゴリズムは省エネ,オフロード効率の向上,フェデレートSSLの精度の向上を実現している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:46:58 GMT)
DrunkAgent: Stealthy Memory Corruption in LLM-Powered Recommender Agents [28.3] 大規模言語モデル(LLM)を利用したエージェントは、パーソナライズされた振る舞いモデリングを実現するために、リコメンデータシステム(RS)でますます使われている。
本稿では,LSMを用いたリコメンデータエージェントにおけるメモリベースの脆弱性について,初めて体系的に検討する。
我々は,意味論的に意味のある敵の引き金を発生させる新しいブラックボックス攻撃フレームワークDrunkAgentを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:01:46 GMT)
FastInit: Fast Noise Initialization for Temporally Consistent Video Generation [27.8] 我々は、推論中に反復的な洗練の必要性をなくすFastInitを紹介する。
FastInitは、フレーム間の高時間一貫性を実現しつつ、ビデオ生成の効率を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:11:45 GMT)
Noise Fusion-based Distillation Learning for Anomaly Detection in Complex Industrial Environments [27.7] 自動化工業製造における異常検出と局所化は、生産効率と製品品質を大幅に向上させる。
既存の方法では、事前に定義された撮像環境の欠陥を検出することができる。
本稿では,産業環境における異常検出と局所化のための新しい手法を提案する。
HetNetは、ローカル変更に関する限られた情報を使用して、通常のパターンの特徴をモデル化することを学ぶことができる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:08:47 GMT)
Under the Shadow of Babel: How Language Shapes Reasoning in LLMs [27.5] 大規模言語モデルは,様々な言語に埋め込まれた習慣的論理構造を内部化することを示す。
1)LLMは,中国語の語源や文の初期接続性に注目しつつ,英語のバランスの取れた分布を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:06:38 GMT)
FEA-Bench: A Benchmark for Evaluating Repository-Level Code Generation for Feature Implementation [26.1] FEA-Benchは、大規模な言語モデルがコードリポジトリ内でインクリメンタルな開発を行う能力を評価するために設計されたベンチマークである。
83のGitHubリポジトリからのプルリクエストを収集し、ルールベースとインテントベースのフィルタリングを使用して、新機能開発にフォーカスしたタスクインスタンスを構築します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:42:41 GMT)
Faster Stochastic Optimization with Arbitrary Delays via Asynchronous Mini-Batching [26.0] 遅延に関する事前の知識を必要とせずに、全ての量子化に同時に適応する手法を示す。
さらに、非サイズの$O(inf_q tau_q2/(q T)2+sigma/sqrtqT)$と、凸問題に対する$O(tau_q2/(q T)2+sigma/sqrtqT)$の収束率を得る。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:01:44 GMT)
Hopfield-Fenchel-Young Networks: A Unified Framework for Associative Memory Retrieval [25.8] ホップフィールドネットワークのような連想記憶モデルは、メモリ容量の進歩とトランスフォーマーにおける自己注意とのつながりにより、新たな関心を集めている。
本研究では,これらのモデルをより広範なエネルギー関数群に一般化する統合フレームワークであるHopfield-Fenchel-Youngネットワークを導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:04:54 GMT)
EFormer: An Effective Edge-based Transformer for Vehicle Routing Problems [25.2] エッジをVRPの唯一の入力として使用するエッジベースのトランスフォーマーモデルであるEFormerを紹介する。
提案手法では,エッジ情報を一時ノード埋め込みに変換するために,混合スコアアテンション機構を備えたプリコーダモジュールを用いる。
EFormerは、合成データセットに基づいて確立されたベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:07:11 GMT)
Diffusion-Based Hypothesis Testing and Change-Point Detection [25.2] スコアベースの仮説テストと変化点検出停止規則を拡散に基づくアナログに拡張する。
本稿では,拡散型アルゴリズムの利点を説明するために,重み行列を数値的に最適化し,数値シミュレーションを行う。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:22:27 GMT)
Robust Hallucination Detection in LLMs via Adaptive Token Selection [25.2] 大きな言語モデル(LLM)の幻覚は、より広範なデプロイメントを妨げる重要な安全性上の懸念を引き起こす。
本研究では,適応的選択とクリティカルトークンの学習を通じて,幻覚の堅牢な検出を可能にする新しいアプローチであるHaMIを提案する。
本研究では,ハロシン化検出タスクの革新的な定式化により,このロバスト性を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:59:34 GMT)
KCES: Training-Free Defense for Robust Graph Neural Networks via Kernel Complexity [24.9] グラフニューラルネットワーク(GNN)は、小さくて知覚できない摂動や敵の攻撃に対して非常に脆弱である。
本稿では,KCES(Kernel Complexity-Based Edge Sanitization)を提案する。
KCESは一貫してGNNの堅牢性を高め、最先端のベースラインを上回り、既存の防御効果を増幅する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:59:17 GMT)
Layer-wise Alignment: Examining Safety Alignment Across Image Encoder Layers in Vision Language Models [24.7] 一定の層をスキップして早期に退避することで,VLMが有害な応答を発生させる可能性が高まることを示す。
層ワイドマルチモーダルRLHFを実現するために,Clipped-Proximal Policy Optimization (Clip-PPO) アルゴリズムの簡易かつ効果的な修正を提案する。
我々は3つのマルチモーダルデータセットにまたがるL-PPOアルゴリズムを評価し,早期出口による有害性を連続的に低減することを示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:42:13 GMT)
CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity [23.8] 我々は,潜在的にあいまいな自然言語によって指定されたタスクを達成できる,新しいロボット操作フレームワークを導入する。
このフレームワークはVLM(Vision-Language Model)を使用して、自然言語命令の抽象概念を解釈する。
本稿では,言語あいまいさ,コンタクトリッチな操作,多目的インタラクションといった課題に対して,アプローチが優れていることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:42:03 GMT)
PR-DETR: Injecting Position and Relation Prior for Dense Video Captioning [23.4] 本稿では,検出トランスに先立って位置と関係を注入する,PR-DETRという新しい高密度ビデオキャプションフレームワークを提案する。
一方,我々はまず位置対応クエリを生成し,シーン固有の位置と潜在的な事象のセマンティック情報を提供する。
一方、イベント間相互作用を導く前に、イベント境界間の関係を明示的に計算し、キャプションのセマンティックコヒーレンスを改善するイベント関係エンコーダを設計する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:07:42 GMT)
Hunyuan3D 2.5: Towards High-Fidelity 3D Assets Generation with Ultimate Details [23.4] Hunyuan3D 2.5は、高忠実で詳細なテクスチャ化された3Dアセットを生成することを目的とした、3D拡散モデルの堅牢なスイートである。
形状生成に関して、我々は、スケールした高品質なデータセット、モデルサイズ、計算で訓練された新しい形状基礎モデルLATTICEを導入する。
テクスチャ生成に関しては、Hunyuan3D 2.0 Paintモデルから拡張された新しいマルチビューアーキテクチャにより、PBR(phyiscal-based rendering)によってアップグレードされる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:57:40 GMT)
Beyond Self-Talk: A Communication-Centric Survey of LLM-Based Multi-Agent Systems [23.4] 大規模言語モデルに基づくマルチエージェントシステムは、複雑で協調的でインテリジェントな問題解決能力の可能性から、最近大きな注目を集めている。
既存の調査は、通常、LLM-MASをアプリケーションドメインやアーキテクチャに従って分類し、エージェントの振る舞いや相互作用を調整する際のコミュニケーションの中心的な役割を見越す。
本レビューは,LLM-MASにおける通信機構の理解を深め,堅牢でスケーラブルでセキュアなマルチエージェントシステムの設計と展開を容易にすることを目的としている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:55:24 GMT)
OJBench: A Competition Level Code Benchmark For Large Language Models [23.1] OJBenchは、大規模言語モデル(LLM)の競合レベルのコード推論能力を評価するために設計された、新しくて挑戦的なベンチマークである。
我々は,オープンソースモデルとオープンソースモデルの両方,推論指向モデルと非推論指向モデルを含む37モデルに対して,OJBenchを用いた包括的評価を行う。
以上の結果から,o4-miniやGemini-2.5-pro-expといった最先端の推論指向モデルでさえ,競争レベルの問題に悩まされていることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:27:02 GMT)
Neural Prioritisation for Web Crawling [23.0] 本稿では,クローリングの有効性を高めるために,セマンティックな品質駆動型優先順位付け手法を提案する。
クローリングプロセスに直接意味理解を組み込む。
実験の結果,既存のクロール法と比較して,ニューラルクロール法は収穫率,最大NDCG,探索効率を著しく向上することがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:59:21 GMT)
LAECIPS: Large Vision Model Assisted Adaptive Edge-Cloud Collaboration for IoT-based Embodied Intelligence System [22.8] エボディード・インテリジェンス(Embodied Intelligence, EI)は、生産システムを動的店舗のフロア環境内で柔軟に知覚し、推論し、適応し、操作することを可能にする。
大規模ビジョンモデルを用いたIoTベースのインボディードインテリジェンスシステムのための適応エッジクラウドコラボレーションフレームワークであるLAECIPSを提案する。
LAECIPSはクラウド上の大きなビジョンモデルをエッジ上の軽量モデルから切り離し、プラグアンドプレイモデルの適応と継続的な学習を可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:45:04 GMT)
Distribution Parameter Actor-Critic: Shifting the Agent-Environment Boundary for Diverse Action Spaces [22.7] 本稿では,分散パラメータをアクションとして扱う新しい強化学習(RL)フレームワークを提案する。
この再化は、元のアクションタイプに関係なく、新しいアクション空間を連続させる。
離散化された行動空間を持つ同じ環境での競合性能を実証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:19:19 GMT)
OpenPath: Open-Set Active Learning for Pathology Image Classification via Pre-trained Vision-Language Models [22.5] 病理画像分類のためのオープンセット能動的学習手法OpenPathを提案する。
OpenPathは、選択されたサンプルの純度が高いため、モデルの性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:34:29 GMT)
From LLM-anation to LLM-orchestrator: Coordinating Small Models for Data Labeling [22.1] AutoAnnotatorは、マルチモデル協調アノテーションに基づく完全な自動アノテーションフレームワークである。
GPT-3.5-turboと直接アノテートした場合に比べ、アノテーションのコストは74.15%削減され、精度は6.21%向上した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:26:08 GMT)
FLAME: Towards Federated Fine-Tuning Large Language Models Through Adaptive SMoE [21.9] FLAMEは、Sparse Mixture-of-Experts (SMoE)アーキテクチャに基づく新しい連邦学習フレームワークである。
グローバルな(圧縮されていない)LoRA行列を保持し、クライアントごとにアクティベートされた専門家の数を変えることで、クライアント側の適応性を達成する。
軽量な再スケーリング機構とアクティベーション対応アグリゲーションスキームによって、これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:02:19 GMT)
HyperPath: Knowledge-Guided Hyperbolic Semantic Hierarchy Modeling for WSI Analysis [21.4] 双曲空間における意味階層のモデル化を導くために,テキスト記述から知識を統合する新しい手法であるHyperPathを提案する。
本手法は,病理視覚言語基盤モデルから抽出した視覚的特徴とテキスト的特徴を双曲空間に適用する。
提案手法は,WSI解析におけるハイパーボリック埋め込みの可能性を強調し,既存の手法と比較してタスク間での優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:30:33 GMT)
Long-Context Generalization with Sparse Attention [21.3] トランスフォーマーベースのアーキテクチャは、伝統的に注意重みを計算するためにソフトマックスを使用している。
シーケンス長が増加するにつれて、非情報的トークンは注意確率の質量を蓄積し、分散と表現的崩壊をもたらす。
本稿では,$alpha$-entmax を用いて注意機構を疎結合にすることで,これらの問題を回避できることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:43:25 GMT)
Celo: Training Versatile Learned Optimizers on a Compute Diet [20.7] 学習アーキテクチャやメタトレーニングの手順における重要な要素は、強力なメタ一般化につながる可能性がある。
そこで本稿では,評価課題のセットに基づいて,大規模システムの定量的性能を確実に評価するための評価指標を提案する。
提案手法であるCeloは,学習者のメタ一般化性能向上に大きく貢献する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:01:04 GMT)
DynScaling: Efficient Verifier-free Inference Scaling via Dynamic and Integrated Sampling [20.6] 推論時間スケーリングは、テスト時間計算の増大を通じて、大きな言語モデル(LLM)の性能向上に有効であることが証明されている。
しかし、実際的な応用は、外部検証への依存や、現実的な計算制約に対する最適化の欠如によってしばしば妨げられる。
我々はDynScalingを提案し、これらの制限を2つの主要なイノベーション、すなわち並列シーケンスサンプリング戦略と帯域幅に基づく動的予算配分フレームワークを通じて解決する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:40:54 GMT)
Large-Scale Data Selection for Instruction Tuning [20.5] 命令チューニングのためのデータ選択アプローチは、通常、小さなプールから小さなデータセットを選択することでテストされる。
しかし、一般的なインストラクションチューニングモデルでは、数十万から数百万のサンプルをトレーニングし、さらに大きなデータプールからサンプリングすることが多い。
この設定では,最近提案された多くの手法はランダムな選択に欠けており,さらに大きなデータプールへのアクセスを与えられると,性能が低下することさえ示している。
表現に基づくデータ選択の変種(RDS+)は、テストされたすべての設定において、より複雑なメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:19:15 GMT)
Think Global, Act Local: Bayesian Causal Discovery with Language Models in Sequential Data [20.2] 言語モデル(LM)は、サロゲートを提供するが、独自の問題解決、矛盾、バイアスが伴う。
本稿ではこれらのギャップを埋めるハイブリッドベイズフレームワークBLANCE(Bayesian LM-Augmented Causal Estimation)を提案する。
提案手法は, 直交非巡回グラフ (DAG) から部分アンセストラルグラフ (PAG) への変換により, コヒーレントベイズフレームワーク内のあいまいさを許容する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:45:06 GMT)
Quantifying artificial intelligence through algorithmic generalization [20.0] AIシステムは、アルゴリズムの推論を必要とするテストに不足している。
AIシステムにおけるアルゴリズム推論を定量化する理論的枠組みは存在しない。
本稿では,アルゴリズムの一般化を定量化するために,計算複雑性理論の枠組みを採用する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:56:12 GMT)
A Free Probabilistic Framework for Analyzing the Transformer-based Language Models [19.8] 本稿では,トランスフォーマーに基づく言語モデル解析のための演算子理論フレームワークについて概説する。
我々は、注意を非可換的畳み込みとして再解釈し、表現の階層的伝播を自由加法的畳み込みによって支配される進化とみなす。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:13:02 GMT)
VesselSDF: Distance Field Priors for Vascular Network Reconstruction [19.4] 本稿では,血管再建のための署名付き距離場を利用した新しいフレームワークであるVesselSDFを提案する。
本手法は, 連続SDF回帰問題として容器セグメンテーションを再構成し, 体積の各点を最寄りの容器表面への符号付き距離で表現する。
VesselSDFは既存の手法を著しく上回り、血管の形状と接続性を保ち、臨床環境でより信頼性の高い血管分析を可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:20:51 GMT)
Empowering Graph-based Approximate Nearest Neighbor Search with Adaptive Awareness Capabilities [19.4] 本稿では,Adaptive Topology とQuery AwarEness を用いた GATE, High-tier Near Graph を提案する。
Gateは、最先端のグラフベースのインデックスと比較して、クエリパフォーマンスの1.2-2.0倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:07:12 GMT)
A Survey of Automatic Hallucination Evaluation on Natural Language Generation [18.3] 大規模言語モデル(LLM)は、正確な幻覚評価という重要な課題を提起している。
本研究は,74種類の評価手法を包括的に分析することにより,この限界に対処するものである。
本稿では,解釈可能性の強化やアプリケーション固有の評価基準の統合など,戦略的な方向性を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:17:15 GMT)
Probe before You Talk: Towards Black-box Defense against Backdoor Unalignment for Large Language Models [17.8] LLM(Large Language Models)に対するバックドアのアンアライメント攻撃は、隠れたトリガーを使用して、安全アライメントのステルスな妥協を可能にする。
我々は,裏口LDMを不活性化させるために,推論中にトリガサンプルを検出するブラックボックスディフェンスBEATを紹介する。
本手法は, サンプル依存目標の課題を, 反対の観点から解決する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:30:56 GMT)
Multi-Preference Optimization: Generalizing DPO via Set-Level Contrasts [17.2] 応答集合全体の最適化のために,$textbfMulti-Preference Optimization (MPO)を提案する。
MPOは偏差に基づく重み付けを採用しており、平均的な報酬から最も逸脱する外れ値の応答を強調している。
理論的には、MPOはクエリ毎のレスポンス数に対して$mathcalOleft(frac1sqrtnright)$でアライメントバイアスを低減する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:00:28 GMT)
A Distributional-Lifting Theorem for PAC Learning [17.0] 分散仮定は効率的なアルゴリズムの設計を促進するが、その到達範囲と妥当性は制限される。
ブラン、ランゲ、マリク、タンの最近の研究は、一様分布学習者を持ち上げる特別な事例であると考えた。
これらの手法は, ランダムな例にのみアクセスすることで, 情報論的に抽出可能であることを示す。
次に、$Dstar$を学ぶ必要性を助長する別のアプローチを取り、標準のPACモデルで動作するリフターを生成します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:28:38 GMT)
Unraveling the Interplay between Carryover Effects and Reward Autocorrelations in Switchback Experiments [16.8] 本稿ではマルコフ環境における様々なスイッチバック設計の比較分析を行う。
その結果, 異なるスイッチバック設計の有効性は, (i) 搬送効果の大きさと (ii) 報奨誤差の自己相関に大きく依存していることが判明した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:39:49 GMT)
Representation Learning with Mutual Influence of Modalities for Node Classification in Multi-Modal Heterogeneous Networks [16.7] 我々は、HGNN-IMA(Inter-Modal Attention)を用いた異種グラフニューラルネットワーク(Herogeneous Graph Neural Network)という、MMHNにおけるノード分類の新しいモデルを提案する。
本稿では,HGNN-IMA (Herogeneous Graph Neural Network with Inter-Modal Attention) と呼ばれるMMHNのノード分類モデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:49:10 GMT)
A Implies B: Circuit Analysis in LLMs for Propositional Logical Reasoning [16.7] 複数の事実を組み合わせて解を得る必要のある最小命題論理問題について検討する。
この問題をMistral と Gemma モデルで研究することにより、最大27B のパラメータで、モデルがそのような論理問題を解くのに使用するコアコンポーネントを照らし出す。
異なるレイヤにおける注意頭の役割について、きめ細かい洞察を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:14:18 GMT)
AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment [16.4] AssistantXは、現実世界のシナリオにおける自律的な操作のために、高精度に設計されたプロアクティブアシスタントである。
AssistantXは4つの特殊なLLMエージェントからなるマルチエージェントフレームワークを採用しており、それぞれが知覚、計画、意思決定、反射的レビューに特化している。
提案手法の有効性を実証し,AssistantXがユーザの指示に反応し,緊急対応戦略を積極的に調整し,タスク完了を確実にするために積極的に支援を求めることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:49:43 GMT)
On the Limits of Language Generation: Trade-Offs Between Hallucination and Mode Collapse [16.3] 未知の言語からのサンプルを考えると、言語モデルはトレーニングで見えない有効な文字列を生成するべきである。
そうでなければ、無効な文字列を出力することは「幻覚」を構成し、全範囲のキャプチャーに失敗すると「モード崩壊」につながる。
我々は,ゴールドとアングルインをベースとした統計的言語生成システムにおいて,これを検証した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:35:38 GMT)
Exploring Big Five Personality and AI Capability Effects in LLM-Simulated Negotiation Dialogues [16.1] 本稿では,ミッションクリティカルな交渉文脈におけるエージェントAIシステムの評価フレームワークを提案する。
ソトピアをシミュレーションテストベッドとして使用し、人格特性とAIエージェント特性が社会的交渉結果にどのように影響するかを体系的に評価する2つの実験を行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:14:56 GMT)
Adversarial Attacks and Detection in Visual Place Recognition for Safer Robot Navigation [16.0] スタンドアロンの視覚的位置認識(VPR)システムは、よく設計された敵攻撃に対する防御がほとんどない。
本稿では、他の知覚タスクに共通する4つの敵攻撃と、VPR局所化性能に対する4つの新しいVPR特異的攻撃の効果を広範囲に分析する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:19:21 GMT)
Bayesian Optimization over Bounded Domains with the Beta Product Kernel [15.7] ベータ分布密度関数の積によって誘導される非定常カーネルであるベータカーネルを紹介する。
私たちのカーネルは、よく知られたMat'ernやRBFなど、幅広いカーネルよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:45:57 GMT)
On the optimal regret of collaborative personalized linear bandits [15.7] 本稿では,協調的パーソナライズされたリニアバンディットにおける最適後悔について検討する。
我々は,エージェント数,相互作用ラウンド,不均一性の程度が共に後悔にどう影響するかを特徴付ける情報理論の下限を提供する。
私たちの結果は、いつ、いつ、コラボレーションが最適な後悔の束縛でどのように役立つか、完全な特徴を与えます。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:56:31 GMT)
Modeling Public Perceptions of Science in Media [15.6] 本稿では,ニュースの持続性,重要度,驚き度など,12次元にわたる公的な認識をモデル化する計算フレームワークを提案する。
我々は、米国と英国の多様な人口から2,101人の参加者から10,489のアノテーションで、大規模な科学ニュースの認識データセットを作成します。
我々は,公共の知覚スコアを高い性能で予測するNLPモデルを開発した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:49:28 GMT)
KVCache Cache in the Wild: Characterizing and Optimizing KVCache Cache at a Large Cloud Provider [15.5] 大規模言語モデル(LLM)の実現はクラウドプロバイダにとって重要であり、各要求処理後の中間結果(KV$)をキャッシュすることで、スループットとレイテンシが大幅に向上する。
我々は、主要なLLMサービスプロバイダの1つから、KV$ワークロードパターンを初めて体系的に評価した。
本稿では,特にキャッシュ容量の制限により,実世界のトレース下でのサービス性能を向上させる,ワークロード対応のキャッシュ消去ポリシーを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:18:16 GMT)
From Coarse to Continuous: Progressive Refinement Implicit Neural Representation for Motion-Robust Anisotropic MRI Reconstruction [15.3] MRIでは、スライス・ツー・ボリュームの再構成は、2次元スライスから一貫した3次元脳の体積を回復するために重要である。
プログレッシブ改良型暗黙的ニューラル表現フレームワーク(PR-INR)を提案する。
我々のPR-INRは、幾何対応座標空間内での運動補正、構造改善、体積合成を統一する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:58:43 GMT)
Distributional Adversarial Loss [15.3] 本研究では,分散対向損失と呼ばれる新たな対向損失の概念について検討する。
目標は、全体的な敵の損失を最小限にすることである。
対向的損失という概念に対して,PAC学習環境におけるサンプルの複雑性境界を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:07:24 GMT)
Large Language Models in Argument Mining: A Survey [15.0] Argument Mining (AM) はテキストから議論的構造を抽出することに焦点を当てている。
LLM(Large Language Models)の出現は、AMを大きく変化させ、高度な文脈内学習を可能にした。
本研究は, LLM駆動型AMの最近の進歩を体系的に合成する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:12:58 GMT)
Black-Box Privacy Attacks on Shared Representations in Multitask Learning [15.0] 推論攻撃のレンズを用いて、共有表現によってどのような情報が明らかにされるかを検討する。
我々は、同じタスクからの埋め込み間の依存関係を利用する機械学習モデルに対する、効率的で純粋にブラックボックス攻撃を開発する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:56:41 GMT)
SemAgent: A Semantics Aware Program Repair Agent [14.8] SemAgentは、イシュー、コード、実行セマンティクスを利用して完全なパッチを生成する、新しいワークフローベースのプロシージャである。
我々は、(a)実行セマンティクスを活用して関連するコンテキストを検索し、(b)一般化された抽象化を通して問題セマンティクスを理解し、(c)この抽象化のコンテキスト内でコードセマンティクスを分離する、という新しいパイプラインを通してこれを実現する。
提案手法は,SWEBench-Liteベンチマークで44.66%の解率を達成し,ワークフローベースのアプローチを全て上回り,ベースラインと比較して7.66%の絶対的な改善を実現している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:27:58 GMT)
A Scoping Review of Synthetic Data Generation for Biomedical Research and Applications [14.5] このスコーピングレビューは、PRISMA-ScRガイドラインに従い、2020年から2025年にかけて発行された59の研究を合成する。
本総説では, 合成データ生成におけるバイオメディカル研究と応用動向を体系的に検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:38:17 GMT)
Tuning-Free Coreset Markov Chain Monte Carlo via Hot DoG [14.4] 学習速度のない勾配最適化手法であるHot-start Distance over Gradient (Hot DoG)を提案する。
本研究では,Hot DoGによるコアセット重みの収束に関する理論的解析を行った。
また,Hot DoGが他の学習時間自由勾配法よりも高品質な後部近似を提供することを示す実験結果も提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:15:03 GMT)
PAROAttention: Pattern-Aware ReOrdering for Efficient Sparse and Quantized Attention in Visual Generation Models [14.1] 視覚生成において、注意機構の二次的な複雑さは、高いメモリと計算コストをもたらす。
課題を軽減するための注意パターンを*再編成する。
視覚特徴抽出の局所的な集約性に着想を得て,新しい**Pattern-Aware token Re Ordering (PARO)*テクニックを設計する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:25:02 GMT)
Voice of a Continent: Mapping Africa's Speech Technology Frontier [14.1] アフリカの豊かな言語多様性は、音声技術では著しく不足している。
我々は、複数のアフリカの言語と音声タスクにまたがって最先端のパフォーマンスを実現するため、Simbaファミリのモデルを紹介した。
我々の研究は、アフリカの言語多様性を反映した拡張された音声技術資源の必要性を強調している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:54:28 GMT)
Collision-assisted information scrambling on a configurable photonic chip [14.1] 本稿では,オープン量子システムにおける情報スクランブルを調査するためのフォトニック回路を提案する。
我々は,光子伝播の数値シミュレーションを行い,三部体の相互情報はシステム環境と環境環境の相互作用に依存することを示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:53:13 GMT)
Automatic dataset shift identification to support safe deployment of medical imaging AI [14.0] データ配信のシフトは、臨床AIモデルの性能を著しく損なう可能性がある。
画像データセットのための教師なしデータセットシフト識別フレームワークを提案する。
提案手法の有効性を3つの異なる画像モダリティで示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:53:22 GMT)
Essential-Web v1.0: 24T tokens of organized web data [13.9] Essential-Web v1.0は24トリルのデータセットで、すべてのドキュメントにトピック、フォーマット、コンテントの複雑さ、品質をカバーした12カテゴリの分類をアノテートする。
競争力のあるWebキュレートデータセット(SOTAと比較して8.0%)、Webコード(+14.3%)、STEM(+24.5%)、医学的データを得る。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:02:41 GMT)
Chest X-ray Foundation Model with Global and Local Representations Integration [13.7] CheXFoundは、堅牢なCXR表現を学び、幅広い下流タスクを効果的に一般化するビジョン基盤モデルである。
我々はCheXFoundをキュレートしたCXR-1Mデータセットで事前訓練し、公開ソースから100万以上のユニークなCXRを作成した。
以上の結果から,CheXFoundは有病率の異なる40の疾患の分類において,最先端モデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:25:55 GMT)
V2X-VLM: End-to-End V2X Cooperative Autonomous Driving Through Large Vision-Language Models [13.7] 自動車間協力(V2X)は、古典的な自動運転の認識限界を克服するための有望なパラダイムとして浮上している。
本稿では、視覚言語モデル(VLM)に基づく新しいエンドツーエンド(E2E)協調自動運転フレームワークであるV2X-VLMを紹介する。
V2X-VLMは、車両やインフラからの多視点カメラビューとテキストベースのシーン記述を統合し、運転環境のより包括的な理解を可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:02:13 GMT)
Song Form-aware Full-Song Text-to-Lyrics Generation with Multi-Level Granularity Syllable Count Control [13.7] 単語,フレーズ,行,段落レベルで多段階の音節制御を可能にする歌詞生成フレームワークを提案する。
提案手法は,入力テキストと歌唱形式に条件付けされた完全な歌詞を生成し,特定の音節制約に適合することを保証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:04:51 GMT)
Joint Optimization of Age of Information and Energy Consumption in NR-V2X System based on Deep Reinforcement Learning [13.6] 5Gニューラジオ(NR)技術に基づくV2X仕様。
モード2サイドリンク(SL)通信はLTE-V2Xのモード4に似ており、車両間の直接通信を可能にする。
この影響を緩和するために 干渉キャンセル法が使われています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:35:51 GMT)
Advanced Sign Language Video Generation with Compressed and Quantized Multi-Condition Tokenization [13.6] SignViPは、複数のきめ細かい条件を組み込んだ新しいフレームワークである。
SignViPは、ビデオ品質の時間的コヒーレンスやセマンティクスの忠実さなど、メトリクス間の最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:56:06 GMT)
TrainVerify: Equivalence-Based Verification for Distributed LLM Training [13.6] 大規模言語モデル(LLM)を大規模にトレーニングするには、数千のデバイスで並列実行する必要がある。
LLMの分散トレーニングを検証可能なシステムであるTraiVerifyを導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:10:06 GMT)
A multimodal dataset for understanding the impact of mobile phones on remote online virtual education [13.6] IMPROVEデータセットは、オンライン教育における携帯電話の利用が学習者に与える影響を評価するために設計されたマルチモーダルリソースである。
120人の学習者から収集された行動、生体、生理、および学術的パフォーマンスデータを含んでいる。
このデータセットは、GitHubとScience Data Bankを通じて研究するために公開されている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:11:05 GMT)
Align the GAP: Prior-based Unified Multi-Task Remote Physiological Measurement Framework For Domain Generalization and Personalization [13.5] MSSDtextbfG と TTPtextbfPriors (textbfGAP) をバイオメトリックスとリモート・フォトプレソグラフィーで統合したフレームワークを提案した。
MSSDGベンチマークを6つの公開データセット上でTTPAプロトコルに拡張し、完全なラベリングを備えた新しい実世界駆動データセットを導入しました。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:17:30 GMT)
SwarmThinkers: Learning Physically Consistent Atomic KMC Transitions at Scale [13.4] 我々は,原子スケールシミュレーションをSwarmインテリジェンスシステムとして再放送する強化学習フレームワークであるSwarmThinkersを紹介する。
放射誘起Fe-Cu合金析出をシミュレーションするベンチマークにおいて、SwarmThinkersは単一のA100 GPU上でフルスケールで物理的に一貫したシミュレーションを行う最初のシステムである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:19:38 GMT)
Competing Bandits in Decentralized Contextual Matching Markets [13.3] 我々は、需要側(プレイヤーまたはエージェント)が供給側(腕)と競合する二面的マッチング市場における分散学習を研究する。
それぞれのエージェントに対して、腕平均は既知の特徴ベクトルと未知の(エージェント固有の)パラメータの線形関数で表されると仮定する。
そこで我々は,潜伏環境を特定し,同時に安定したマッチングを得る学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:33:38 GMT)
QG-SMS: Enhancing Test Item Analysis via Student Modeling and Simulation [13.2] テスト項目分析(テスト項目解析)をQG評価に導入する。
トピックカバレッジ、アイテムの難易度、アイテムの識別、イントラクタ効率など、ディメンションによって品質が異なる質問のペアを構築します。
学生のモデリングとシミュレーションに大規模言語モデルを活用する新しいQG評価フレームワークQG-SMSを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:49:50 GMT)
Graph-Cover-based Characterization of the Bethe Partition Function of Double-Edge Factor Graphs [13.2] 因子グラフ(DE-FG)とその分割関数について検討する。
DE-FGの分割関数の近似は、非負の実値ではなく複素値の和を含むため、S-FGよりも難しい。
特定で容易にチェック可能な条件を満たすD-FGのクラスに対して、有限グラフ被覆の観点からBethe分割関数の特性を与える。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:08:54 GMT)
Multi-use LLM Watermarking and the False Detection Problem [13.0] デジタル透かしは、自動生成されたテキストの誤用に起因するリスクを軽減できる有望な解決策である。
しかし,検出とユーザ識別の両方に同じ埋め込みを同時に使用すると,誤検出の問題が発生する。
本稿では,検出と識別を共同で生成したテキストに符号化するDual Watermarkingを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:37:02 GMT)
Statistical Inference under Performativity [12.9] 我々は、実演性の下での推定と推論のための中心極限定理を構築する。
我々は、小さなラベル付きデータセットとより大規模な機械学習予測データセットに基づいて、性能評価下での予測駆動推論(PPI)について検討する。
本論文は,我々の知る限り,性能評価に基づく統計的推論を初めて確立した論文である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:25:32 GMT)
Large Language Models are Near-Optimal Decision-Makers with a Non-Human Learning Behavior [12.8] 大規模言語モデル(LLM)は、AIをサポートする意思決定の性質と範囲を変えてきた。
しかし、人間に比べて決定を下す過程は、まだよく理解されていない。
本研究では,実世界の意思決定の3つの中核領域にわたる5つのLLMの意思決定行動について検討した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:32:55 GMT)
Efficient Mixture-of-Expert for Video-based Driver State and Physiological Multi-task Estimation in Conditional Autonomous Driving [12.8] 道路の安全は世界中で重要な課題であり、交通事故による死者は約135万人である。
VDMoEと呼ばれる新しいマルチタスクDMSを提案し、RGBビデオ入力を利用して運転状態を非侵襲的に監視する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:53:13 GMT)
Security through the Eyes of AI: How Visualization is Shaping Malware Detection [12.7] マルウェアの検出と分類に応用された既存の可視化に基づくアプローチを評価する。
このフレームワーク内では、マルウェア検出パイプラインの重要な段階にわたる最先端のアプローチを分析する。
我々は、可視化ベースのアプローチにおける主な課題を明らかにし、この重要な分野における進歩と将来的な方向性についての洞察を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:53:18 GMT)
Next-Token Prediction Should be Ambiguity-Sensitive: A Meta-Learning Perspective [12.7] 我々は,トランスフォーマーがモデルサイズ全体にわたって高いあいまいさの予測に苦慮していることを示す。
予備的な結果は、キャパシティアロケーションの改善とテストタイムのスケーラブルな推論を通じて、あいまいな文脈でかなりの増加を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:05:12 GMT)
LazyEviction: Lagged KV Eviction with Attention Pattern Observation for Efficient Long Reasoning [12.6] 拡張推論シーケンスでは、キー値(KV)キャッシュサイズが大きくなるため、GPUメモリのオーバーヘッドが大幅に増加する。
既存のKVキャッシュ圧縮手法は、メモリボトルネックを軽減するが、長い推論タスクに苦労する。
そこで我々は,KVメモリの低減と推論性能の維持を目的としたラギングKV消去フレームワークであるLazyEvictionを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:25:04 GMT)
CVC: A Large-Scale Chinese Value Rule Corpus for Value Alignment of Large Language Models [12.2] 本研究では,中国中核値に基づく階層的価値枠組みを提案し,主次元3,コア値12,派生値50を包含する。
我々は,人間のアノテーションによって拡張・拡張された25万以上の値規則を含む大規模中国価値コーパス(CVC)を構築した。
われわれの研究は、中国の特徴を表す総合的な価値評価とアライメントのための文化的適応型ベンチマークフレームワークを確立する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:47:55 GMT)
Heterogeneous-Modal Unsupervised Domain Adaptation via Latent Space Bridging [12.2] Heterogeneous-Modal Unsupervised Domain Adaptation (HMUDA) という新しい設定を提案する。
HMUDAは、両方のモダリティからラベルのないサンプルを含むブリッジドメインを活用することで、全く異なるモダリティ間の知識伝達を可能にする。
セマンティックセグメンテーションタスク用に設計された特殊なフレームワークであるLatent Space Bridging (LSB)を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:31:51 GMT)
How Far Can Off-the-Shelf Multimodal Large Language Models Go in Online Episodic Memory Question Answering? [11.9] 市販のマルチモーダル大言語モデル (MLLM) が追加トレーニングなしでオンライン・エピソード・メモリ・ビデオ質問応答 (OEM-VQA) に対処できるかどうかを検討する。
我々のパイプラインは、ストリーミングエゴセントリックなビデオをMLLMディスクリプタモジュールを介して、数分で数キロバイトの軽量なテキストメモリに変換し、このメモリをLCM推論モジュールでクエリすることで、複数の質問に答える。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:35:49 GMT)
MoiréXNet: Adaptive Multi-Scale Demoiréing with Linear Attention Test-Time Training and Truncated Flow Matching Prior [11.8] 本稿では,A Posteriori (MAP) 推定と高度な深層学習技術を統合することで,画像と映像のデシフティングを実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:15:07 GMT)
On the composable security of weak coin flipping [11.6] 弱コインフリップ(英: Weak coin flipping)は、2つの不信な当事者が相互にランダムなビットを生成し、遠隔通信を通じて勝者に同意する暗号プリミティブである。
スタンドアローンの安全な弱いコインフリッププロトコルは、ノイズのない量子通信チャネルから構築できるが、その構成性は未解明のままである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:58:45 GMT)
Floating-Point Neural Networks Are Provably Robust Universal Approximators [11.1] ニューラルネットワークはより一般的な区間普遍近似(IUA)定理を享受する。
オープンな疑問は、IUA定理が浮動小数点設定でまだ成り立つかどうかである。
浮動小数点設定における我々のIUA定理は、実数値設定と物質的差異を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:43:04 GMT)
Fast Training-free Perceptual Image Compression [11.1] トレーニング不要な知覚画像は、デコード中に事前訓練された無条件生成モデルを採用し、新しい条件生成モデルのトレーニングを避ける。
本稿では,理論的な保証を伴って,既存の知覚的品質を向上する学習自由アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:43:46 GMT)
Double Entendre: Robust Audio-Based AI-Generated Lyrics Detection via Multi-View Fusion [11.1] 本稿では,音声中の歌詞関連情報を自動書き起こした歌詞と音声特徴を組み合わせ,マルチモーダルでモジュール形式のレイトフュージョンパイプラインを提案する。
我々のD-detect法は、既存の歌詞ベースの検出器より優れ、音声の摂動にも頑健である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:56:49 GMT)
FinCoT: Grounding Chain-of-Thought in Expert Financial Reasoning [11.0] FinCoTは、ドメイン固有の専門的財務推論からの洞察を取り入れた構造化チェーン・オブ・思想(CoT)の推進的アプローチである。
我々は10の金融ドメインにまたがる3つの主要なプロンプトスタイルとCFAスタイルの質問に対するFinCoTの評価を行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:18:55 GMT)
Reranking-based Generation for Unbiased Perspective Summarization [10.7] 我々は,人間のアノテーションを用いて,計量信頼性をベンチマークするテストセットを開発した。
従来の指標は言語モデルに基づく指標に比べて性能が低いことが示され、強力な評価指標であることが証明された。
本研究の目的は,視点要約手法の信頼性評価と開発に寄与することである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:01:43 GMT)
Fine-Tuning Large Audio-Language Models with LoRA for Precise Temporal Localization of Prolonged Exposure Therapy Elements [10.7] 本稿では,セッション音声やテキストから鍵PEの忠実度要素を自動的時間的局所化する手法を提案する。
我々のアプローチは、Low-Rank Adaptation (LoRA) を用いて、学習済みの大規模なオーディオ言語モデル Qwen2-Audio を微調整し、30秒間の音声書き起こし入力を処理する。
この研究は、PE療法における忠実度追跡のためのスケーラブルなフレームワークを導入し、臨床医のトレーニング、監督、品質保証をサポートする可能性がある。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:02:49 GMT)
SDE-SQL: Enhancing Text-to-SQL Generation in Large Language Models via Self-Driven Exploration with SQL Probes [10.7] 本研究では,大規模言語モデルによる推論中のデータベースの自己駆動探索を可能にするフレームワークであるSDE-を提案する。
従来の方法とは異なり、SDE-はin-contextのデモとして質問コンテキストペアに頼ることなく、ゼロショット設定で動作する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:10:10 GMT)
Data-Agnostic Cardinality Learning from Imperfect Workloads [10.4] 本稿では,実世界の制約下での動作を意図した,データに依存しない定性学習システムGRASPを提案する。
GRASPは、統合テンプレートを見えないように一般化し、テンプレートの不均衡を結合するのに堅牢である。
GRASPは、不完全なワークロードにおける既存のクエリ駆動モデルよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:58:31 GMT)
Bridging Text and Crystal Structures: Literature-driven Contrastive Learning for Materials Science [10.2] Contrastive Language-Structure Pre-Training (CLaSP) は結晶構造とテキスト間のクロスモーダルな埋め込み空間を構築するための学習パラダイムである。
CLaSPは、結晶構造間の特性や機能に関する類似性を捉えた材料埋め込みを実現することを目的としている。
テキストベース結晶構造スクリーニングと埋め込み空間可視化によるCLaSPの有効性を実証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:21:04 GMT)
Fast data inversion for high-dimensional dynamical systems from noisy measurements [10.1] 我々は高次元力学系に対するフレキシブル潜在因子モデルのためのスケーラブルなアプローチを開発する。
カスカディア地域の測地学的な観測に本手法を適用することにより, 地震の地震観測データと独立に一致したスリップの推定値が得られた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:48:21 GMT)
Rethinking External Slow-Thinking: From Snowball Errors to Probability of Correct Reasoning [10.0] テストタイムのスケーリングは、大きな言語モデルにおける推論を強化するために実証されている。
本稿では,外的スロー思考手法を誤り確率を緩和するための戦略として解釈できることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:05:12 GMT)
R3eVision: A Survey on Robust Rendering, Restoration, and Enhancement for 3D Low-Level Vision [10.0] 3次元低レベルビジョン(3D LLV)は、古典的な2次元低レベルビジョンタスクを3次元空間領域に拡張する。
LLVをニューラルレンダリングフレームワークに統合する最近の手法は、有害な条件下で高忠実度3D再構成を可能にする方法を説明するために分類される。
本研究は、3D LLVを実環境におけるロバストな3Dコンテンツ生成とシーンレベルの再構築の基本的な方向性として位置づける。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:25:46 GMT)
Quantum algorithms for matrix geometric means [9.7] 我々は行列幾何学的な手段のための量子サブルーチンを考案し、リカティ方程式の解を構築する。
古典データと量子データの両方を対象とした新しい量子学習アルゴリズムを提示する。
サブルーチンはまた、幾何学的R'enyi相対エントロピーとウルマン忠実度を推定するのにも有用である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:36:31 GMT)
SafeTriage: Facial Video De-identification for Privacy-Preserving Stroke Triage [9.6] 緊急時の脳卒中の効果的なトリアージは、顔面筋の調整において微妙な異常を識別する臨床医の能力に依存していることが多い。
最近のAIモデルは、患者の顔ビデオからそのようなパターンを検出することを約束しているが、実際の患者データに依存しているため、倫理的およびプライバシー上の課題が提起されている。
本研究は,脳卒中診断に必須な動作手がかりを保ちながら,患者の顔映像を識別する新しい方法であるSafeTriageを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:02:47 GMT)
LabTOP: A Unified Model for Lab Test Outcome Prediction on Electronic Health Records [9.6] 本稿では,EHRデータに基づく言語モデリング手法を活用し,実験結果を予測する統一モデルであるLabTOPを提案する。
公開されている3つのEHRデータセット上でLabTOPを評価し、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:20:21 GMT)
Wavelet-based Global Orientation and Surface Reconstruction for Point Clouds [9.5] そこで本研究では,ウェーブレットを用いたモリファイドインジケータ関数の表現法を提案し,配向と表面再構成の両タスクを完遂する。
修正カーネル関数を用いて、ウェーブレット基底関数の連続性と整合して、表面の不連続性を円滑にする。
本手法は,スパースモデルの配向と再構成の両面において,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:20:05 GMT)
Distinguishing Predictive and Generative AI in Regulation [9.5] 我々は、有意義に異なるポリシー応答を要求する、生成的AIの4つの異なる側面を識別する。
これらは、規制対象の貧弱な生成AIの汎用性と適応性、効果的な評価を設計することの難しさ、ステークホルダーや専門知識の源泉のエコシステムを変える新たな法的懸念である。
政策立案者がより効果的に規制対象を特定し、より広いエコシステムにわたる制約を活用して生成的AIを管理するための3つの推奨事項を概説する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:17:55 GMT)
SoK: The Privacy Paradox of Large Language Models: Advancements, Privacy Risks, and Mitigation [9.4] 大型言語モデル(LLM)は、機械が顕著な精度で人間に似たテキストを生成することができる高度な人工知能システムである。
本稿では, LLMにおけるプライバシーの包括的分析を行い, 課題を4つの主要領域に分類する。
提案するプライバシ課題を対象として,既存の緩和メカニズムの有効性と限界を評価し,さらなる研究を行うための領域を特定する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:30:24 GMT)
Federated Learning for MRI-based BrainAGE: a multicenter study on post-stroke functional outcome prediction [9.3] 脳年齢差(BrainAGE)は、脳の健康を反映するバイオマーカーである。
堅牢なBrainAGEモデルのトレーニングには大きなデータセットが必要である。
1674例の脳卒中患者のFLAIR画像を用いた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:16:18 GMT)
Incentivize Contribution and Learn Parameters Too: Federated Learning with Strategic Data Owners [9.2] 本稿は、貢献の合理性の問題に対処し、現存する文献と区別する。
本稿では、予算バランスが取れ、最適なパラメータ学習とともに完全なデータ貢献を可能にする第2のメカニズムを提案する。
実(フェデレートされた)データセット(CIFAR-10、FeMNIST、Twitter)による大規模な実験は、これらのアルゴリズムが実際に非常に高速に収束し、良好な福祉保証が得られ、すべてのエージェントのモデルパフォーマンスが向上していることを示している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:06:03 GMT)
BEADs: Bias Evaluation Across Domains [9.2] 我々は、幅広いNLPタスクをサポートするために、BEAD(Bias Evaluations Across Domains)データセットを紹介します。
この研究の重要な貢献は、拡張性のためにGPT-4によって提供されるゴールドスタンダードのアノテーションである。
この結果から,BEADはモデル微調整の際の様々なバイアスを効果的に表面化し,言語生成タスクにおけるバイアスを軽減することが示唆された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:43:07 GMT)
Data marketplaces can increase the willingness to share social media data at low prices [8.9] 本稿では、データマーケットプレイスが個人に対してTwitterデータパッケージの販売意欲を高めることができるかどうかを検討する。
また、プライバシー保護とデータ購入者のタイプが、これらの決定にどのように影響するかについても検討している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:31:42 GMT)
Tailoring Synthetic Gauge Fields in Ultracold Atoms via Spatially Engineered Vector Beams [8.9] 本稿では、VBを介する内部状態のカップリングにより、超低温原子中の合成ストライプ場を生成する新しい手法を提案する。
我々の研究は、量子制御とエキゾチックな量子状態と位相の探索のための強力なツールとしてVBを確立した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:33:45 GMT)
FALCON: Feedback-driven Adaptive Long/short-term memory reinforced Coding Optimization system [8.8] 大規模言語モデル(LLM)は、コードの自動生成において大きな進歩を遂げた。
教師付き微調整(SFT)と人間からのフィードバック(RLHF)からの強化学習の課題は、正確で人間中心のコードを生成する失敗につながった。
フィードバック駆動型適応長/短周期メモリ強化符号化最適化(FALCON)を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:54:43 GMT)
Adaptive Experimental Design for Policy Learning [8.7] 実験中に治療用アームを実験単位に割り当てる意思決定者について検討し,実験終了時の文脈に基づいて最適な治療用アームを推奨する。
我々は、最適政策の期待結果と提案された政策の間にある最悪のケースで予想される後悔に焦点を当てる。
この戦略は, 実験単位数が増加するにつれて, 後悔の上界における先頭因子が下界と一致するという意味で, 最小値の速度最適値であることが証明された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:27:47 GMT)
REIS: A High-Performance and Energy-Efficient Retrieval System with In-Storage Processing [8.6] 大きな言語モデル(LLM)は固有の課題に直面します。
Retrieval-Augmented Generation (RAG)は、LLMの静的トレーニングに基づく知識を外部知識リポジトリで補完する。
本稿では,これらの制約を3つのキーメカニズムで処理するRAG用に設計された最初のISPシステムであるREISを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:26:51 GMT)
Joint User Priority and Power Scheduling for QoS-Aware WMMSE Precoding: A Constrained-Actor Attentive-Critic Approach [8.5] 6G無線ネットワークは、エネルギー効率を維持しながら、様々なQoS(Quality-of-Service)要求をサポートすることが期待されている。
Constrained Successive Approximation (CSS) メソッドのより効果的な処理を最適化するために、CAAC (Constrained Attentive-CAC) が組み込まれている。
CAACはエネルギー効率と満足度の両方においてベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:00:03 GMT)
A Lightweight RL-Driven Deep Unfolding Network for Robust WMMSE Precoding in Massive MU-MIMO-OFDM Systems [8.5] 本稿では,各SWMMSEイテレーションをネットワーク層にマッピングする,軽量強化学習(RL)駆動の深層展開(RLDDU-Net)ネットワークを提案する。
具体的には、そのDUモジュールは、ビーム領域の間隔と周波数領域のサブキャリア相関を統合し、収束を著しく加速し、計算オーバーヘッドを低減する。
不完全なCSI下でのシミュレーションの結果、RLDDU-Netは計算効率と収束効率を向上しつつ、既存のEWSR性能のベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:54:42 GMT)
SycnMapV2: Robust and Adaptive Unsupervised Segmentation [8.5] 人間の視覚は、明示的な訓練を必要とせず、視覚的手がかりのセグメンテーションに優れており、ノイズの重大さが増大しても、非常に堅牢である。
SyncMapV2は、教師なしセグメンテーションを最先端のロバストネスで解決する最初の方法である。
SyncMapV2は、SOTA法で見られる23.8%の減少に比べて、デジタル汚職下では0.01%のmIoUが最小値の低下を示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:17:30 GMT)
HSTU-BLaIR: Lightweight Contrastive Text Embedding for Generative Recommender [8.5] 本稿では,軽量なコントラストテキスト埋め込みモデルで生成レコメンデータを増強するハイブリッドフレームワークHSTU-BLaIRを提案する。
HSTU-BLaIRをAmazon Reviews 2023データセットの3つのサブセットとSteamデータセットの2つのEコマースデータセットで評価した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:04:38 GMT)
Mobility-Aware Federated Self-supervised Learning in Vehicular Network [8.3] Federated Learning(FL)は、高度な分散機械学習アプローチである。
ロードサイドユニット(RSU)にすべてのデータをアップロードすることなく、モデルを複数のデバイスで同時にトレーニングすることで、各車両のプライバシを保護する。
本稿では,ラベルを必要とせず,車載環境下での自己教師型学習のための事前学習段階として機能するFLSimCoという,画像ボケレベルからアグリゲーションへのFLアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:23:51 GMT)
RDD: Robust Feature Detector and Descriptor using Deformable Transformer [8.0] 本稿では,新規かつ堅牢なキーポイント検出器/ディスクリプタであるRobust Deformable Detector (RDD)を提案する。
我々は、変形可能な注意が鍵となる位置に焦点を当て、探索空間の複雑さを効果的に減らすことを観察した。
提案手法は,スパースマッチングタスクにおいて,最先端のキーポイント検出/記述手法よりも優れている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:39:14 GMT)
Knee-Deep in C-RASP: A Transformer Depth Hierarchy [7.9] 内部の注意を除いた固定精度の変圧器について検討する。
この変圧器のサブクラスはプログラミング言語C-RASPと表現的に等価であることを示す。
第二に、より深いC-RASPプログラムはより浅いC-RASPプログラムよりも表現力が高いことを証明する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:27:54 GMT)
Towards Generalizable Generic Harmful Speech Datasets for Implicit Hate Speech Detection [7.8] 過激なヘイトスピーチはソーシャルメディアプラットフォームにとって重要な課題となっている。
本稿では,暗黙のヘイトスピーチの検出に対処し,多様なデータセット間の一般化性を高める手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:23:08 GMT)
The Exploration of Error Bounds in Classification with Noisy Labels [7.7] 本稿では,ディープラーニングフレームワークにおけるノイズラベルによる分類問題に対する過大なリスクの誤差境界に着目した。
過大なリスクに対して誤差境界を導出し、それを統計的誤差と近似誤差に分解する。
低次元多様体仮説の下では、高次元入力空間の影響を軽減するために近似誤差をさらに洗練する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:48:37 GMT)
Assessing and Mitigating Medical Knowledge Drift and Conflicts in Large Language Models [7.6] 大規模言語モデル(LLM)は医療の分野で大きな可能性を秘めているが、急速に発展する医療知識に適応する上で大きな課題に直面している。
本研究は, LLMが臨床ガイドラインの進展にどう反応するかを考察し, 概念の漂流と内的矛盾に着目した。
4,290のシナリオにまたがる7つの最先端モデルの評価は、時代遅れのレコメンデーションを拒絶することの難しさを証明した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:59:05 GMT)
Observation of criticality-enhanced quantum sensing in non-unitary quantum walks [7.6] 非エルミートトポロジカルシステムにおいて、臨界性に富む量子感度を実験的に示す。
解析の結果,検出されたエンハンスメントは定常状態の挙動に直接的な影響があることが示唆された。
本実験では,量子臨界度と非エルミート物理学を応用して,量子強調感度を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:37:40 GMT)
Generalizability of Media Frames: Corpus creation and analysis across countries [7.6] 本稿では,ブラジルの政治・経済に関するニュース記事のデータセットであるFrameNews-PTを紹介する。
我々は、MFCフレームがブラジルの議論問題にどのように一般化するかを評価する。
我々は、異文化間フレームの使用には慎重な考慮が必要であると結論づける。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:15:25 GMT)
DiffO: Single-step Diffusion for Image Compression at Ultra-Low Bitrates [7.3] 画像圧縮(DiffO)のための最初の単一ステップ拡散モデルを提案する。
実験の結果,DiffOは従来の拡散法に比べてデコード速度を50倍向上させながら,圧縮性能を上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:53:27 GMT)
Latent Noise Injection for Private and Statistically Aligned Synthetic Data Generation [7.2] データの合成は、スケーラブルでプライバシー保護の統計分析に欠かせないものとなっている。
マスク付き自己回帰流(MAF)を用いた潜時ノイズ注入法を提案する。
トレーニングされたモデルから直接サンプリングする代わりに、我々のメソッドは潜在空間の各データポイントを摂動させ、それをデータドメインにマップします。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:22:57 GMT)
Dense 3D Displacement Estimation for Landslide Monitoring via Fusion of TLS Point Clouds and Embedded RGB Images [7.1] 地すべりモニタリングは、ジオハザードを理解し、関連するリスクを軽減するために不可欠である。
既存の点クラウドベースの手法は、一般的に幾何学的またはラジオメトリック的な情報に依存する。
本稿では,3次元点雲と共登録RGB画像とを融合した階層的分割に基づく粗い微細化手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:28:09 GMT)
Do We Talk to Robots Like Therapists, and Do They Respond Accordingly? Language Alignment in AI Emotional Support [7.0] 本研究は,ヒトとヒトのセラピーセッションにおいて,ロボットと共有される関心が,ヒトとヒトのセラピーセッションで共有される関心事と一致しているかを検討する。
我々は,ユーザとプロのセラピストとのインタラクションと,ソーシャルロボットとの支援的な会話を含む2つのデータセットを分析した。
その結果、ロボットの会話開示の90.88%は、人間の治療データセットからクラスタにマッピングできることがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:20:30 GMT)
Regression Testing Optimization for ROS-based Autonomous Systems: A Comprehensive Review of Techniques [7.0] ROSASに適した回帰テスト最適化手法を体系的にレビューする最初の総合的な調査を行う。
我々は122の代表的な研究を回帰テストケースの優先順位付け、最小化、選択方法に分類した。
ROSASの回帰テストに特有の大きな課題として,頻繁なシステム修正に対応するテストを効果的に優先順位付けすること,冗長テストを効率的に最小化すること,影響のあるテストケースを正確に選択することの難しさを挙げる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:43:36 GMT)
Full-stack Analog Optical Quantum Computer with A Hundred Inputs [6.8] 連続変数を利用した革新的なアナログ光量子コンピュータを提案する。
本システムでは、100MHzのクロック周波数で100のアナログ入力を実現し、総括的なフルスタックアーキテクチャで動作させる。
この発展はアナログ量子コンピューティングの探索において大きな前進となる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:59:31 GMT)
DISCIE -- Discriminative Closed Information Extraction [6.7] 本手法では,関係抽出精度を向上させるために,タイプ情報とエンティティ固有情報を組み合わせた識別手法を用いる。
特に、この手法は最先端のエンドツーエンド生成モデルと比較して優れた性能を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:24:48 GMT)
Analyzing the Influence of Knowledge Graph Information on Relation Extraction [6.7] 我々は複数のデータセットで実験を行い、それぞれが関係の数、トレーニング例、基礎となる知識グラフなどによって異なる。
その結果,知識グラフ情報の統合は性能を著しく向上させることがわかった。
我々は,知識グラフに基づく特徴量の寄与を,既存の関係抽出手法とグラフ対応ニューラルベルマン・フォードネットワークを組み合わせることで評価する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:21:08 GMT)
OSWorld-Human: Benchmarking the Efficiency of Computer-Use Agents [6.7] 我々は、コンピュータ利用AIのフラッグシップベンチマークであるOSWorld上で、コンピュータ利用エージェントの時間的パフォーマンスに関する最初の研究を行う。
計画とリフレクションのための大規模なモデル呼び出しは、全体のレイテンシの大部分を占めています。
次に、OSWorld-HumanというオリジナルのOSWorldデータセットを手動でアノテートしたバージョンを構築します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:26:40 GMT)
CapsDT: Diffusion-Transformer for Capsule Robot Manipulation [6.5] VLA(Vision-Language-Action)モデルが顕著な研究領域として登場し、様々な応用において大きな可能性を示している。
本研究では,胃内ロボット操作のためのDiffusion TransformerモデルであるCapsDTを設計する。
本研究では,ロボットアーム付き磁石によって制御されるカプセル内視鏡ロボットシステムを開発した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:25:48 GMT)
Grounding Language Models with Semantic Digital Twins for Robotic Planning [6.5] セマンティック・デジタル・ツインズ(SDT)とLarge Language Models(LLM)を統合する新しいフレームワークを提案する。
提案フレームワークは,高レベル推論とセマンティック環境理解を効果的に組み合わせ,不確実性と障害に直面した信頼性の高いタスク完了を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:38:00 GMT)
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models [6.4] 検索強化世代(RAG)は、新しい情報を導入する主要な方法となっている。
最近のRAGは、知識グラフのような様々な構造を持つベクトル埋め込みを拡大して、いくつかのギャップ、すなわちセンスメイキングと連想性に対処している。
我々は,現実的,感覚的,連想的なメモリタスクにおいて,標準RAGを総合的に上回るフレームワークであるHippoRAG 2を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:34:45 GMT)
DIGMAPPER: A Modular System for Automated Geologic Map Digitization [6.3] 地質図のデジタル化を自動化するために米国地質調査所(USGS)と共同で開発されたシステムであるDIGMAPPERについて述べる。
DIGMAPPERは、地図レイアウト分析、特徴抽出、ジオレファリングのための最先端のディープラーニングモデルを統合する、完全にDocker化されたワークフローオーケストレーションアーキテクチャを備えている。
DARPA-USGSデータセットからの100以上の注釈付き地図の評価は、ポリゴン、線、点特徴抽出において高い精度を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:51:47 GMT)
Decentralized Collective World Model for Emergent Communication and Coordination [6.3] 本稿では,コミュニケーションのためのシンボルの出現と協調行動の両方を可能にする,完全に分散化されたマルチエージェント世界モデルを提案する。
提案手法は,世界モデルと通信チャネルを統合し,エージェントが環境動態を予測し,部分的な観測結果から状態を推定し,重要な情報を共有できるようにする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:49:54 GMT)
Evaluating Time-Dependent Methods and Seasonal Effects in Code Technical Debt Prediction [6.2] Code Technical Debt (Code TD) 予測は、最近のソフトウェアエンジニアリング研究で大きな注目を集めている。
コードTD予測に対する標準化されたアプローチは、その進化に影響を与える要因を完全に捉えるものではない。
本研究の目的は、時間依存モデルと季節効果がコードTD予測に与える影響を評価することである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:21:02 GMT)
Data-Driven Policy Mapping for Safe RL-based Energy Management Systems [6.2] 本稿では,クラスタリング,予測,制約付き政策学習を組み合わせた3段階強化学習に基づく建築エネルギー管理システム(BEMS)を提案する。
実世界のデータから評価することで,特定の建築タイプに対して,運用コストを最大15%削減する。
全体として、このフレームワークはスケーラブルで堅牢で費用対効果の高い建築エネルギー管理を提供します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:29:48 GMT)
SAFER-D: A Self-Adaptive Security Framework for Distributed Computing Architectures [6.1] Internet of ThingsとCyber-Physical Systemsの台頭は、セキュアで堅牢な通信を保証するための新たな課題をもたらしている。
本稿では,多種多様な適応戦略を組み合わせた総合的かつ効率的な防衛機構を構築するための総合的自己適応型セキュリティフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:02:35 GMT)
From Semantic To Instance: A Semi-Self-Supervised Learning Approach [6.1] 本稿では,高パフォーマンスなインスタンスセグメンテーションモデルを開発するために,最小限の手動アノテーションを必要とする半自己教師型学習手法を提案する。
GLMaskは、色特徴への依存を最小限に抑えつつ、形状、テクスチャ、パターンにフォーカスするモデルのためのイメージマスク表現である。
提案手法は従来のインスタンスセグメンテーションモデルを大幅に上回り、mAP@50の98.5%の最先端の小麦ヘッドインスタンスセグメンテーションモデルを確立する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:38:01 GMT)
Learning Causally Predictable Outcomes from Psychiatric Longitudinal Data [6.1] 縦断的生医学データの因果推論は依然として中心的な課題である。
本アルゴリズムは, 結果集約のための非負の, 臨床的に解釈可能な重みを学習する。
我々のアルゴリズムは因果関係の回復における最先端の手法より一貫して優れている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:56:30 GMT)
ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning [6.1] ReinFlowは、継続的ロボット制御のためのオンライン強化学習フレームワークである。
学習可能なノイズをフローポリシーの決定論的パスに注入し、フローを離散時間マルコフプロセスに変換する。
代表的な移動と操作タスクでReinFlowをベンチマークします。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:06:02 GMT)
Optimal Online Bookmaking for Any Number of Outcomes [6.0] 本稿では,オンラインブックメイキングの課題について考察する。そこでは,オンラインブックメーカがイベントの起こりうる結果に賭ける確率を動的に更新する。
どんなイベントでも、どんな賭けラウンドでも、ブックメーカの最適損失は、単純さの最大の根源であることを示す。
当社のソリューションは、財務リスクを回避しながら、帳簿作成者ができるだけ公平であることを示し、明示的な特徴は、本書作成者の後悔とハーミッツの関係が興味深いことを示している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:11:58 GMT)
End-to-End Speech Translation for Low-Resource Languages Using Weakly Labeled Data [6.0] 本稿では、弱いラベル付きデータを用いて音声からテキストへの翻訳モデルを構築することができるという仮説を考察する。
我々は、最先端の文エンコーダを用いて、Bitextマイニングの助けを借りてデータセットを構築した。
以上の結果から,STシステムはマルチモーダルな多言語ベースラインに匹敵する性能を持つ弱いラベル付きデータで構築可能であることが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:11:01 GMT)
Statistical Inference of Optimal Allocations I: Regularities and their Implications [5.9] ソート演算子の特性を解析することにより,値関数のアダマール微分性を導出する。
アダマール微分可能性の結果に基づいて,関数デルタ法を適用して値関数過程の特性を求める。
値関数に対する二重/脱バイアス推定器を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:21:09 GMT)
Evaluating VisualRAG: Quantifying Cross-Modal Performance in Enterprise Document Understanding [5.9] クロスモーダルな入力の統合の信頼性を測定するための,体系的,定量的なベンチマークフレームワークを導入する。
本手法は,技術指標とユーザ中心信頼度との間に定量的な関係を確立する。
この作業は、重要なエンタープライズアプリケーションのためのマルチモーダルRAGの信頼性を定量化し、強化するための厳格なフレームワークを提供することによって、責任あるAIデプロイメントを前進させる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:05:00 GMT)
Observation of photonic dynamics in dissipative quantum Rabi models [5.8] 強いフォトニック散逸を持つオープン量子ラビモデル(QRM)は実験的に研究されていない。
回路QEDにおけるそのようなオープンシステムの最初の実験例を示す。
その結果, 系の挙動はフォトニック散逸によって著しく変化していることがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:40:16 GMT)
TD3Net: A Temporal Densely Connected Multi-Dilated Convolutional Network for Lipreading [5.8] バックエンドアーキテクチャとして高密度スキップ接続と時間畳み込みを組み合わせた時間密結合型多進化ネットワークTD3Netを提案する。
2つの大きな公開データセットであるLRW(Lip Reading in the Wild)とLRW-1000(Lip Reading in the Wild)を用いた単語レベルの読解処理の実験結果から,提案手法が最先端の手法に匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:55:03 GMT)
Action Spotting and Precise Event Detection in Sports: Datasets, Methods, and Challenges [5.7] ビデオイベントの検出は、現代のスポーツ分析の中心であり、パフォーマンス評価、コンテンツ生成、戦術的フィードバックのための重要な瞬間の自動理解を可能にする。
ディープラーニングは極めて高度なタスクを持っているが、既存の調査はしばしば、スポーツによって引き起こされる詳細な時間的要求とドメイン固有の課題を見落としている。
この調査はまず、TAL, AS, PES の明確な概念的区別を提供し、その後、AS と PES の最近の深層学習アプローチをカバーする方法に基づく分類法を紹介した。
スポーツビデオ分析において、より時間的に正確で、一般化可能で、実用的なイベントスポッティングに向けたオープンな課題と今後の方向性を概説する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:05:54 GMT)
AUTOLAW: Enhancing Legal Compliance in Large Language Models via Case Law Generation and Jury-Inspired Deliberation [5.7] AutoLawは、ドメイン固有の大規模言語モデル(LLM)のための新しい違反検出フレームワークである。
LLMの法的コンプライアンスを強化するために、敵対的なデータ生成と陪審に触発された審議プロセスを組み合わせる。
本研究は, 法的不一致を適応的に調査し, 信頼性の高い文脈対応の判断を下すフレームワークの能力を強調した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:05:42 GMT)
Approximation Fixpoint Theory with Refined Approximation Spaces [5.7] 近似固定点理論(英: Approximation Fixpoint Theory、AFT)は、非単調な推論形式論の様々な意味論をカバーする強力な理論である。
本稿では、時間間隔よりも洗練された近似を扱うためにAFTを拡張した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:12:53 GMT)
Safety Interventions against Adversarial Patches in an Open-Source Driver Assistance System [5.7] 認識入力を標的とする安全クリティカルアタックに対して,広く使用されているADASのレジリエンスを評価する。
様々な安全機構をシミュレートして、攻撃軽減効果とADASレジリエンスの強化効果を評価する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:51:31 GMT)
Build Agent Advocates, Not Platform Agents [5.5] 言語モデルエージェントは、人々がオンラインでナビゲートし行動する方法を仲介する。
既にインターネット検索、通信、商取引を支配している企業がこれらのエージェントをコントロールしているなら、その結果のプラットフォームエージェントは監視を強化します。
このポジションペーパーは、個人の自律性と選択を安全にするユーザ制御エージェントを推進すべきである、と論じている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:55:30 GMT)
Enhancing Document-Level Question Answering via Multi-Hop Retrieval-Augmented Generation with LLaMA 3 [5.5] LLaMA 3上に構築されたこのフレームワークは、高密度検索モジュールと高度なコンテキスト融合とマルチホップ推論機構を統合している。
実験の結果,提案システムは既存の検索・生成ベースラインよりも優れていた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:22:18 GMT)
Complexity of Injectivity and Verification of ReLU Neural Networks [5.5] ReLUネットワークによって計算される関数のインジェクティビティは、関数の可逆性が要求されるたびに重要な役割を果たす。
インジェクティビティを決定する正確な計算複雑性のcoNP完全性を証明する。
また,特定の入力が特定の出力しか得られないことを検証するネットワーク検証問題についても検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:51:59 GMT)
SlepNet: Spectral Subgraph Representation Learning for Neural Dynamics [5.4] グラフニューラルネットワークは、グラフ構造化データの機械学習に有用である。
それらはグラフ上のパターン信号の表現に限られている。
SlepNetはグラフ調和ではなくSlepianベースを使用する新しいGCNである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:03:52 GMT)
Neurosymbolic Object-Centric Learning with Distant Supervision [5.4] 非構造化データから直接オブジェクト中心表現を学習するためのニューロシンボリックな定式化を提案する。
このアプローチをニューロシンボリックモデルであるDeepObjectLogでインスタンス化する。
音確率論的論理推論を有効にすることにより、記号成分は、新しい学習信号を導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:26:42 GMT)
P2MFDS: A Privacy-Preserving Multimodal Fall Detection System for Elderly People in Bathroom Environments [5.4] 65歳以上は2050年までに世界の人口の16%を占めると予測されている。
80%以上の滝は、浴室などの湿潤で制限された環境で発生している。
浴室環境における高齢者のプライバシ保護型マルチモーダル転倒検知システムを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:22:14 GMT)
History-Augmented Vision-Language Models for Frontier-Based Zero-Shot Object Navigation [5.3] 本稿では、動的履歴認識プロンプトの利用を先駆する新しいゼロショットObjectNavフレームワークを提案する。
私たちの中心となるイノベーションは、VLMにアクション履歴コンテキストを提供し、ナビゲーションアクションのセマンティックガイダンススコアを生成することです。
また、検出対象に対する最終アプローチを洗練するためのVLM支援のウェイポイント生成機構も導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:50:16 GMT)
AlphaTrans: A Neuro-Symbolic Compositional Approach for Repository-Level Code Translation and Validation [5.3] リポジトリレベルのコード翻訳を自動化するニューロシンボリックアプローチであるAlphaTransを提案する。
AlphaTransを利用して,836,8575,2719>クラス,メソッド,テストからなる10の実世界のオープンソースプロジェクトを翻訳しました。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:21:34 GMT)
BIDA: A Bi-level Interaction Decision-making Algorithm for Autonomous Vehicles in Dynamic Traffic Scenarios [5.2] 対話型モンテカルロ木探索(MCTS)と深部強化学習(DRL)を統合した双方向インタラクション意思決定アルゴリズム(BIDA)を設計する。
具体的には、3種類のDRLアルゴリズムを用いて、インタラクティブMCTSのオンライン推論プロセスをガイドする信頼性の高い価値ネットワークとポリシーネットワークを構築する。
実験により, BIDAは対話型推論を向上し, 計算コストを低減させるだけでなく, 最新のベンチマークよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:03:40 GMT)
Quantum-Classical Correspondence of Non-Hermitian Symmetry Breaking [5.2] 固有状態の実-複素スペクトル遷移と自発対称性の破れは非エルミート物理学の中心である。
我々の研究は非エルミート対称性の破れの物理的メカニズムを明らかにし、非エルミート現象の制御と応用に幅広い意味を持つ新しい視点を導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:06:14 GMT)
Multi-agent Multi-armed Bandits with Minimum Reward Guarantee Fairness [5.1] マルチエージェント・バンディット(MA-MAB)における公平性を確保しつつ,社会福祉を最大化するアルゴリズムを提案する。
提案するアルゴリズムであるRewardFairUCBは、アッパー信頼境界法を利用して、公正性と社会福祉の両面において、サブ線形後悔境界を達成する。
本稿では、RewardFairUCBアルゴリズムが、$tildeO(T1/2)$と$tildeO(T3/4)$のフェアネス後悔上限をインスタンスに依存しない社会福祉後悔保証を実現することを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:59:25 GMT)
Dual Thinking and Logical Processing -- Are Multi-modal Large Language Models Closing the Gap with Human Vision ? [5.1] 我々は、人間の視覚における二重思考の枠組みの証拠を提供するために、新しい敵対的データセットを導入する。
私たちの精神物理学的な研究は、急速に続く複数の推論の存在を示しています。
エラーの解析は、視覚処理の早期停止は、関連する情報が欠落する可能性があることを示している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:41:34 GMT)
Bridging Brain with Foundation Models through Self-Supervised Learning [5.0] ファンデーションモデル(FM)は、人工知能の能力を再定義した。
これらの進歩は脳信号解析の転換の機会となる。
本調査は基礎モデルを用いて脳波の新興分野を体系的にレビューする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:03:58 GMT)
SimBank: from Simulation to Solution in Prescriptive Process Monitoring [4.9] SimBankはPresPMメソッドの正確なベンチマークのために設計されたシミュレータである。
様々なレベルの複雑さを伴う様々な介入最適化問題を取り入れている。
SimBankは総合的な評価機能も提供している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:02:19 GMT)
Surg-3M: A Dataset and Foundation Model for Perception in Surgical Settings [4.9] 本稿では,Surg-3Mをベースとした自己教師型基礎モデルであるSurgFMについて述べる。
Surg-3MとSurgFMはどちらも、自律的なロボット手術システムの開発を加速する大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:55:49 GMT)
Synthetic ALS-EEG Data Augmentation for ALS Diagnosis Using Conditional WGAN with Weight Clipping [4.9] 条件付きWasserstein Generative Adversarial Network(CWGAN)を用いたALS患者のための合成脳波信号を生成する。
我々は、ALS EEG信号の分布を学習するために、プライベートEEGデータセット(ALS対非ALS)でCWGANを訓練する。
脳波記録の事前処理と正規化を行い、合成ALS信号を生成するためにCWGANモデルを訓練する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:57:23 GMT)
Min-p, Max Exaggeration: A Critical Analysis of Min-p Sampling in Language Models [4.8] 本論文は, min-pを支持する証拠の包括的再検討を行い, 元の論文の4行の証拠と異なる結論に達した。
元の論文で示された証拠は、min-pが品質、多様性、あるいは品質と多様性のトレードオフを改善するという主張を支持していないと結論づける。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:41:52 GMT)
Detecting Prefix Bias in LLM-based Reward Models [4.6] 選好データセットに基づいて訓練された報酬モデルにおいて,プレフィックスバイアスを検知し,評価するための新しい手法を提案する。
これらの指標を活用して、人種と性別の異なる嗜好モデルにおける大きなバイアスを明らかにします。
本研究は,公正かつ信頼性の高い報酬モデルを開発する上で,バイアス対応データセットの設計と評価を重要視するものである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:38:26 GMT)
The Memory Paradox: Why Our Brains Need Knowledge in an Age of AI [4.5] 本稿では、神経科学と認知心理学に基づいて、AIシステムへの重度依存が、宣言的記憶と手続き的記憶の融合を損なう可能性について検討する。
我々は、"グロキング"のような深層学習現象と過度学習と直観の神経科学との顕著な類似点を強調した。
本稿は、大規模言語モデルの時代における教育と労働訓練の政策的意味を結論付けている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:05:41 GMT)
BriefMe: A Legal NLP Benchmark for Assisting with Legal Briefs [4.5] 法務NLPで過小評価されている法的作業の核心は、法務ブリーフィングの執筆と編集である。
法的なブリーフィングに焦点を当てた新しいデータセットであるBRIEFMEを紹介する。
言語モデルには3つのタスクが含まれており、議論の要約、議論の完了、事例検索というブリーフを書く際に、法的専門家を支援する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:35:29 GMT)
Can AI Dream of Unseen Galaxies? Conditional Diffusion Model for Galaxy Morphology Augmentation [4.4] 本研究では,機械学習データを拡張するために,現実的な銀河画像を合成するための条件拡散モデルを提案する。
本研究では,本モデルが特定の形態的特徴条件に密着した多彩な高忠実度銀河画像を生成することを示す。
このモデルにより、生成外挿により、よく注釈付けされたデータを未知の領域に投影し、希少なオブジェクト検出を進めることができる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:44:09 GMT)
CORAL: Disentangling Latent Representations in Long-Tailed Diffusion [4.3] 長い尾を持つデータセットで訓練した拡散モデルの挙動について検討する。
尾級部分空間の潜在表現は、ヘッドクラスのそれと大きな重複を示す。
本稿では、教師付き相対的損失を利用して、よく区切られた潜在クラス表現を促進するコントラスト型潜在クラスアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:23:44 GMT)
Physical complexity and black hole quantum computers [4.3] 計算の究極的な限界は論理的ではなく物理的であることを示す。
計算作業を行うために必要な物理資源、時間、エネルギー、エントロピー、自由エネルギーについて検討する。
本研究は,従来の電子計算機,量子コンピュータ,生物系,ブラックホール,宇宙そのものに物理複雑性の測定結果を適用した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:15:59 GMT)
Natural Intelligence: the information processing power of life [4.3] 本稿では,生体システムの情報処理能力について考察する。
すべての分子は、その化学組成を介して情報を登録する。
個々のヒトの細胞は、毎秒約1020〜1022ドルのバイオオプスを行う。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:24:55 GMT)
A Brain-to-Population Graph Learning Framework for Diagnosing Brain Disorders [4.2] 本稿では2段階のBrain-to-Population Graph Learningフレームワークを提案する。
脳表象学習と呼ばれる第1段階では、GPT-4からの脳のアトラス知識を活用して、グラフ表現を充実させる。
第2段階では、集団障害診断と呼ばれる表現型データは、集団グラフ構築に組み込まれ、コンバウンディング効果を緩和するために特徴融合される。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:32:57 GMT)
Learning Dynamics in Continual Pre-Training for Large Language Models [4.2] CPT(Continuous Pre-Training)は、特定の下流タスクに強力な基礎モデルを適用する一般的な方法となっている。
私たちは、各トレーニングステップにおいて、一般的なドメインパフォーマンスとダウンストリームドメインパフォーマンスがどのように進化するかに注目し、検証損失によってドメインパフォーマンスを測定します。
我々の定式化は、損失ポテンシャル、ピーク学習率、トレーニングステップ、リプレイ率など、CPTにおけるいくつかの重要な要因を包括的に理解している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:38:17 GMT)
Uniform Mean Estimation for Heavy-Tailed Distributions via Median-of-Means [4.2] The Median of Means (MoM)は、ヘビーテールデータの文脈で人気を得た平均推定器である。
独立性のある新しい対称性技術を用いて,新しい試料の複雑さを証明した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:51:05 GMT)
Integrating Generative Adversarial Networks and Convolutional Neural Networks for Enhanced Traffic Accidents Detection and Analysis [4.2] 本研究では,事故検知システムにおける監視監視とデータ不足の問題に対処する。
この動機は、世界中の自動車事故数の統計値の上昇に起因している。
提案フレームワークは,リアルタイムの事故検出機能のために,交通安全アプリケーションに適合する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:06:20 GMT)
Robustness Evaluation of OCR-based Visual Document Understanding under Multi-Modal Adversarial Attacks [4.2] 我々は,OCRベースのVDUモデルに対するマルチモーダル攻撃の生成と評価を行うための,最初の統一フレームワークを提案する。
本手法では, OCR境界ボックス, ピクセル, テキストの操作を単語と行の粒度に組み込んだ, 勾配に基づく6つのレイアウト攻撃シナリオを網羅する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:38:31 GMT)
How Hard Is Snow? A Paired Domain Adaptation Dataset for Clear and Snowy Weather: CADC+ [4.0] 冬期における自律運転のための最初のペア気象領域適応データセットであるCADC+を提案する。
また, 積雪が3次元物体検出性能に及ぼす影響を評価するために, CADC+を用いた予備実験を行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:24:03 GMT)
Adaptive Social Metaverse Streaming based on Federated Multi-Agent Deep Reinforcement Learning [3.9] ソーシャルメタバースは、ソーシャルな対話、仕事、買い物、エンターテイメントを楽しむことができる。
没入的な相互作用には生体データと行動データの連続的な収集が必要であるため、プライバシは依然として大きな課題である。
我々はF-MAPPO(Federated Multi-Agent Proximal Policy Optimization)に基づく新しいストリーミングシステムであるASMS(Adaptive Social Metaverse Streaming)を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:33:43 GMT)
Competing Bandits in Matching Markets via Super Stability [3.8] 両面の報酬の不確実性を伴う市場における盗賊学習について検討する。
本研究は, 正規GSアルゴリズムよりも拡張Galle-Shapley (GS) アルゴリズムが真に安定なマッチングを実現することの利点を実証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:03:20 GMT)
FFINO: Factorized Fourier Improved Neural Operator for Modeling Multiphase Flow in Underground Hydrogen Storage [3.8] 本稿では,多相流問題に対する高速サロゲートモデルとして,新しいニューラル演算子アーキテクチャFFINOを提案する。
また、FFINOモデルと最先端のFMIONetモデルを比較する。
我々の新しいFFINOモデルは、トレーニング可能なパラメータが38.1%、トレーニング時間が17.6%、FMIONetに比べてメモリが12%少ない。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:50:26 GMT)
VRAIL: Vectorized Reward-based Attribution for Interpretable Learning [3.8] VRAILは、状態特徴から解釈可能な重み表現を学ぶ、価値に基づく強化学習(RL)のためのフレームワークである。
VRAILは、状態特徴を用いた推定値関数に適合する深層学習(DL)ステージと、これを用いて潜在ベース報酬変換による学習を形作るRLステージの2段階で構成されている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:21:23 GMT)
Energy-Based Transfer for Reinforcement Learning [3.7] 強化学習アルゴリズムは、しばしばサンプル効率の低下に悩まされる。
そこで本研究では,配電系統外検出を用いて誘導を選択的に発行するエネルギーに基づく伝達学習手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:25:52 GMT)
Geometric Learning in Black-Box Optimization: A GNN Framework for Algorithm Performance Prediction [3.7] 本研究では、最適化アルゴリズムの性能を予測するために、グラフデータ構造とグラフニューラルネットワークの利用について検討する。
2つのモジュラーフレームワーク、modCMA-ES と modDE に焦点をあて、このフレームワークは2つの広く使われている微分自由最適化アルゴリズムを分解する。
6つのランタイム予算と2つの問題次元にまたがる24のBBOB問題に対して、324 modCMA-ESおよび576 modDE変異を評価した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:56:05 GMT)
The Technical Debt Gamble: A Case Study on Technical Debt in a Large-Scale Industrial Microservice Architecture [3.7] 本研究は,マイクロサービスベースの大規模産業システムにおける技術的負債(TD)の出現状況について考察する。
以上の結果から,静的ソースコード解析は総合的TD発見の効率的なエントリポイントとなることが示唆された。
マイクロサービスアーキテクチャにおけるTD管理に適した戦略のセットを特定します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:04:39 GMT)
Clifford augmented density matrix renormalization group for \textit{ab initio} quantum chemistry [3.6] 本稿では,CA-DMRGの量子化学ハミルトニアンに対する効率的な手法を提案する。
以上の結果から,CA-DMRGはDMRGよりも数桁高い精度で結合寸法を達成できることがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:48:52 GMT)
Physical-Layer Signal Injection Attacks on EV Charging Ports: Bypassing Authentication via Electrical-Level Exploits [3.6] SAE J1772, CCS, IEC 61851, GB/T 20234, NACSなどの主要な充電プロトコルのセキュリティについて検討した。
小型の悪意のあるデバイスを充電器コネクタに挿入することで、攻撃者は不正な信号を注入して充電プロセスを妨害することができる。
本稿では、物理的信号を注入する充電器ガンプラグイン装置と遠隔操作のためのワイヤレスコントローラを含む、概念実証(PoC)攻撃ハードウェアである Portulator を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:31:29 GMT)
Self-Critique-Guided Curiosity Refinement: Enhancing Honesty and Helpfulness in Large Language Models via In-Context Learning [3.6] 本稿では,広く使用されている10種類の大言語モデルのベンチマーク評価を行う。
新たなプロンプト戦略,自己批判による好奇心の洗練を促すことを提案する。
提案手法は、2つの軽量なインコンテキストステップを組み込むことで好奇心駆動型プロンプト戦略を拡張する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:42:35 GMT)
Two Heads Are Better than One: Simulating Large Transformers with Small Ones [3.5] 長い入力シーケンスを持つ変換器は、短い入力シーケンスしか持たない変換器で効率的にシミュレートできることを示す。
次に、平均ケース入力、スライディングウインドウマスキング、アテンションシンクを含む様々な自然シナリオにおいて、最適数$O(N/M)$の小さな変圧器が十分であることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:24:00 GMT)
Advancing Automated Speaking Assessment Leveraging Multifaceted Relevance and Grammar Information [3.5] 本稿では,ハイブリッドスコアリングモデルを構築するための2つの新しい拡張を紹介する。
まず、多面的関連モジュールは、L2話者の質問内容と関連する画像内容、例、および音声応答を統合する。
第2に、高度な文法誤差補正(GEC)と特定のエラーカテゴリを特定するための詳細なアノテーションを用いて、きめ細かい文法エラー特徴を導出する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:01:11 GMT)
Segment Anything for Satellite Imagery: A Strong Baseline and a Regional Dataset for Automatic Field Delineation [3.5] SAM(Segment Anything Model)に基づくフィールドデライン化のためのパイプラインを提案する。
本論文では,公開データセットの使用に加えて,補完的な地域データセットを取得する方法について述べる。
ERASとして知られる新しい地域データセットが公開されている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:48:20 GMT)
Infrastructure for AI Agents [3.4] 我々は,技術システムとAIエージェント以外の共有プロトコルという,テクスチャファジェントインフラストラクチャの概念を提案する。
1)特定のエージェント,そのユーザ,あるいは他のアクターに行動をもたらすこと,2)エージェントのインタラクションを形成すること,3)エージェントから有害なアクションを検出して治療すること,である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:32:18 GMT)
Web(er) of Hate: A Survey on How Hate Speech Is Typed [3.4] 我々は、データセット作成における反射的アプローチを議論し、研究者はデータセット構築中に自身の価値判断を認め、透明性と方法論的厳密さを育むよう促す。
本稿では,これらの方法論の選択を多種多様なデータセットで批判的に検討し,共通テーマと実践,およびそれらのデータセット信頼性への影響について述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:12:20 GMT)
np spin correlations in the deuteron ground state [3.3] 重陽子 (deuteron) は、陽子と中性子の2つの粒子からなる最も単純な原子核である。
それらのスピンが互いに量子的に絡み合っているかを研究する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:44:03 GMT)
Pattern-Based Graph Classification: Comparison of Quality Measures and Importance of Preprocessing [3.2] グラフ分類は、その構造的特徴と属性的特徴に基づいてグラフを分類することを目的としており、ソーシャルネットワーク分析やバイオインフォマティクスといった様々な分野に応用されている。
意味のあるパターンを特定するためには、各パターンの識別能力を評価する機能として、品質指標を使用することが標準的手法である。
これらの指標を比較していくつかの洞察を提供しようとする調査はごくわずかで、いずれもグラフに特化していない。
本論文では,38種類の品質指標の比較分析を行い,パターンのゴールド標準ランキングを精査する手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:28:41 GMT)
Slit-loaded coplanar waveguide for color-center spin qubits [3.1] 色中心のスピン量子ビットは、量子センシング、通信、情報処理のために広く研究されている。
レーザーとマイクロ波の両方を小さなフットプリントマイクロ波導波路やアンテナを使って色中心に効果的に照射することは困難である。
信号線に細いスリットを持つ小型コプラナー導波路を導入することにより、レーザーとマイクロ波の両方を効果的に照射できることを実験的に示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:26:27 GMT)
Evaluating the Use of LLMs for Documentation to Code Traceability [3.1] 大規模言語モデルは、様々なソフトウェアドキュメンテーションとソースコードの間のトレースリンクを確立することができる。
私たちは2つのオープンソースプロジェクト(Unity CatalogとCrawl4AI)から2つの新しいデータセットを作成します。
その結果、最高の性能のLLMは2つのデータセットで79.4%と80.4%のF1スコアを達成した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:18:53 GMT)
Comparative Analysis of Abstractive Summarization Models for Clinical Radiology Reports [3.1] 本研究は, 放射線学報告の発見部から簡潔な印象を生成するために, 高度な抽象的要約モデルを用いることを考察する。
T5-base, BART-base, PEG-x-base, ChatGPT-4, LLaMA-3-8B, およびカバー機構を備えたカスタムポインタジェネレータネットワークを含む, 事前訓練およびオープンソースの大規模言語モデルの比較分析を行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:07:17 GMT)
Low-Resource Video Super-Resolution using Memory, Wavelets, and Deformable Convolutions [3.0] ビデオスーパーレゾリューション(VSR)は、リソース制約のあるエッジデバイスへのデプロイにおいて、依然として大きな課題である。
本稿では,230万のパラメータで最先端の再現精度を実現する,VSRのための新しい軽量かつパラメータ効率のニューラルアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:49:16 GMT)
Hybrid Attention Network for Accurate Breast Tumor Segmentation in Ultrasound Images [3.0] 病変分割のためのハイブリッドアテンションベースネットワークを提案する。
提案アーキテクチャでは,エンコーダ部に事前学習したDenseNet121を組み込んで,ロバストな特徴抽出を行う。
公開データセットの実験は、我々の手法が既存のアプローチより優れていることを示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:32:54 GMT)
Artificial Intelligence for Atmospheric Sciences: A Research Roadmap [3.0] 大気科学は、大気の質から極端な気象イベント、気候変動まで、環境現象を理解するのに不可欠である。
センシング、通信、コンピューティング、人工知能(AI)の最近の進歩は、大気科学を著しく進歩させた。
本稿では,大気科学と計算機科学の分野を橋渡しし,大気研究におけるAIの変容の可能性を明らかにする重要な学際的概要を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:59:32 GMT)
Random feature approximation for general spectral methods [2.9] この研究は、Tikhonov正則化の以前の結果をスペクトル正則化技術の幅広いクラスに拡張した。
我々は,ニューラルタンジェントカーネル(NTK)アプローチのレンズを用いて,ニューラルネットワークとニューラル演算子の理論的解析を可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:00:17 GMT)
Reproducible Evaluation of Camera Auto-Exposure Methods in the Field: Platform, Benchmark and Lessons Learned [2.9] 露光時に画像を生成するエミュレータを利用する手法を提案する。
様々な露出時間で取得した画像を使用することで,地上の真理画像と比較して1.78%未満のルート平均二乗誤差(RMSE)で画像をエミュレートできることを実証した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:01:01 GMT)
LLM-based Satisfiability Checking of String Requirements by Consistent Data and Checker Generation [2.9] 大規模言語モデル(LLM)は、形式的推論タスクの代替手法として登場した。
本稿では,文字列上のNL要求の満足度を検証するハイブリッドアプローチを提案する。
LLMは、Pythonベースのチェッカーの完全なテスト精度さえ達成して、自然言語をチェッカーに効果的に翻訳する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:41:43 GMT)
Spotting tell-tale visual artifacts in face swapping videos: strengths and pitfalls of CNN detectors [2.9] ビデオストリームにおける顔交換操作は、リモートビデオ通信における脅威の増大を表している。
近年の文献では,ビデオフレームに導入された視覚的アーティファクトを,アルゴリズムのスワップによって特徴付け,活用することを提案する。
本稿では,2つのデータコーパス上でのCNNに基づくデータ駆動モデルのベンチマークにより,本手法の有効性について検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:51:11 GMT)
Robustness of entanglement in a non-Hermitian cavity-optomechanical system even away from exceptional points [2.8] 量子物理学は、$mathcalPT$-symmetric である非エルミート的ハミルトニアンを考えることで複素領域に拡張することができる。
同様の効果が例外点(EP)から得られるかどうかを考察する。
また,EPから遠ざかるパラメータ群において,突然の絡み合いの消失を緩和することができ,また,絡み合いの回復は熱雑音に対して極めて堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:46:56 GMT)
Quantum Computer Fingerprinting using Error Syndromes [2.7] 「我々は、量子エラー補正(QEC)の副産物を利用して、ハードウェアのアイデンティティを検証し、量子計算を無料で認証する戦略を提案している。」
シンドローム測定をメタデータのソースとして扱うことにより、検証を標準QECプロトコルにシームレスに組み込む。
我々は,数世代にわたるIBM量子コンピュータ上で,複数の誤り訂正符号,量子状態,回路コンパイル戦略を用いてアプローチを検証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:23:08 GMT)
Towards Classifying Histopathological Microscope Images as Time Series Data [2.7] 本稿では,顕微鏡画像を時系列データとして分類する手法を提案する。
動的時系列ウォーピング(DTW)を利用して、可変長の画像列を固定長ターゲットに適合させる手法を提案する。
提案手法の有効性は,様々なベースラインと性能を比較し,様々な推論戦略の利点を示すことで実証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:51:15 GMT)
Leveraging Optimal Transport for Distributed Two-Sample Testing: An Integrated Transportation Distance-based Framework [2.7] 本稿では,ITD(Integrated Transportation Distance)を用いた分散二サンプルテストのための新しいフレームワークを提案する。
データプライバシを保ちながら効率的な計算を可能にするために、分散環境での実装のための置換テスト手順が提案されている。
結果は、ITDが分散クライアント間で情報を効果的に集約し、個々のクライアントを調べる際に見逃される可能性のある微妙な分散シフトを検出することを示唆している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:59:48 GMT)
Guaranteed prediction sets for functional surrogate models [2.6] 本稿では,関数型機械学習のための統計的に保証された予測セットを得る手法を提案する。
この手法は、代理モデルの誤差の低次元表現に基づいてネスト予測セットを構築し、セットプロパゲーション手法を用いてこれらのセットを予測空間にマッピングする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:06:48 GMT)
Rigorous Maximum Likelihood Estimation for Quantum States [2.6] 既存の量子状態トモグラフィーは、高い計算とメモリ要求のため、限られたスケーラビリティの厳密な終了を避ける。
本稿では,行列を因子によって再構成することで,これらの制約に対処する。
提案手法は,5時間以内で最先端問題に対する最先端のソリューションを実証できることを実証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:18:50 GMT)
MetaQAP -- A Meta-Learning Approach for Quality-Aware Pretraining in Image Quality Assessment [2.6] 画像品質評価(IQA)は、幅広い応用において重要な課題であるが、人間の知覚の主観的性質と実世界の画像歪みの複雑さのため、依然として困難な課題である。
本研究は,品質に配慮した事前学習とメタ学習を活用することで,これらの課題に対処する新しい非参照IQAモデルであるMetaQAPを提案する。
提案したMetaQAPモデルではPearson Linear correlation Coefficient (PLCC) とSpearman Rank Order correlation Coefficient (SROCC) のスコアが0.9885/0.9812,Konで0.9702/0.9658で優れた性能を示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:03:47 GMT)
Agentic Personalisation of Cross-Channel Marketing Experiences [2.6] ファンネルイベントのインクリメンタルエンゲージメントを最大化するモジュール型意思決定ポリシーを最適化することを目指している。
当社の方法論は,いくつかの製品機能にまたがるさまざまな目標イベントを著しく増加させ,現在1億5000万人のユーザを対象に展開しています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:07:31 GMT)
Efficient Event-Based Object Detection: A Hybrid Neural Network with Spatial and Temporal Attention [2.5] ニューロモルフィックハードウェア上のスパイキングニューラルネットワーク(SNN)は、エネルギー効率と低レイテンシのイベントベースのデータ処理のためにしばしば考慮される。
本稿では、イベントベースオブジェクト検出のためのアテンションベースのHybrid SNN-ANNバックボーンを紹介する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:37:32 GMT)
Quantum dynamical signatures of non-Hermitian boundary modes [2.5] 非エルミートバルク境界対応は、非エルミート皮膚効果と異常な境界モードの挙動の相互作用を特徴とする。
ここでは、境界モードの実験的にアクセス可能なシグネチャを導出する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:29:51 GMT)
Web Archives Metadata Generation with GPT-4o: Challenges and Insights [2.5] 本稿では,Web Singapore Archiveにおけるメタデータ生成におけるgpt-4oの利用について検討する。
データ削減技術を用いて112のWeb ARChive(WARC)ファイルを処理し、メタデータ生成コストを99.9%削減した。
この研究は、コンテンツ不正確性、幻覚、翻訳問題を含む主要な課題を特定し、人間カタログの置き換えではなく、Large Language Models(LLM)が補体として機能すべきであることを示唆している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:56:00 GMT)
STAR-Pose: Efficient Low-Resolution Video Human Pose Estimation via Spatial-Temporal Adaptive Super-Resolution [2.3] 映像に基づく人間のポーズ推定に特化して設計された時空間適応型超解像フレームワークを提案する。
提案手法は,LakyReLU修飾線形アテンションを用いた空間時間変換器を特徴とする。
極低分解能(64x48)条件下では最大5.2%のmAP改善を実現し、カスケードアプローチよりも2.8倍から4.4倍高速な推論を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:38:49 GMT)
Spatially-Aware Evaluation of Segmentation Uncertainty [2.3] 不確実性評価指標は、空間的文脈や解剖学的構造を無視して、別々にボクセルを扱います。
構造情報と境界情報を含む3つの空間認識メトリクスを提案する。
以上の結果より,臨床的に重要な因子との整合性が向上し,有意義な不確実性パターンと急激な不確実性パターンの識別性が向上した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:24:57 GMT)
Quality over Quantity: An Effective Large-Scale Data Reduction Strategy Based on Pointwise V-Information [2.1] 我々は、ポイントワイドV情報(PVI)に基づく効果的なデータ削減戦略を提案する。
実験により、データの10%-30%を除去すると、0.0001%から0.76%の精度で分類器のパフォーマンスが保たれることが示された。
我々は、以前英語データセットにのみ適用されていたPVIフレームワークを、中国における多様なNLPタスクやベースモデルに移行した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:59:19 GMT)
Teaching Complex Systems based on Microservices [2.1] コンピュータサイエンスの大学院生にそのような先進的な概念を教えることは可能であることを示す。
我々は,サンパウロ大学で80人以上の生徒にこの教科を教えた経験について紹介する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:37:51 GMT)
Flow Matching: Markov Kernels, Stochastic Processes and Transport Plans [2.0] フローマッチング技術は、逆問題の解決に利用できる。
逆問題の解法として,フローマッチングが有効であることを示す。
本稿では,連続正規化フローとスコアマッチング手法について簡潔に述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:52:11 GMT)
A Novel Multi-layer Task-centric and Data Quality Framework for Autonomous Driving [1.9] 次世代の自動運転車(AV)は、大量のマルチソースおよびマルチモーダルデータに依存している。
異なるソースとモダリティのデータ品質(DQ)は、通常、予期せぬ環境要因やセンサーの問題によって変化する。
本稿では,データ層,DQ層,タスク層,アプリケーション層,目標層という5つのレイヤから構成される,タスク中心でデータ品質の高い新しいVaseフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:05:50 GMT)
Arch-Router: Aligning LLM Routing with Human Preferences [1.9] ルーティングは、異なるモデルの使用を運用する上で不可欠な技術になっている。
本稿では、クエリをユーザ定義ドメインにマッチさせることで、モデル選択をガイドする、嗜好整合型ルーティングフレームワークを提案する。
我々のアプローチは主観評価基準を捉え、ルーティング決定をより透明で柔軟にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:57:41 GMT)
Performance of Rank-One Tensor Approximation on Incomplete Data [1.8] 本研究は, スペクトル解析により再構成性能にアクセス可能なランダム行列モデルに還元可能であることを示す。
これらの結果は、そのエントリのランダム部分の削除によるテンソルのメモリコストの人工的削減によって引き起こされるパフォーマンスの損失に光を当て、特定する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:34:53 GMT)
Beyond Audio and Pose: A General-Purpose Framework for Video Synchronization [1.8] ビデオ同期は、リアリティ番組制作、スポーツ分析、監視、自律システムなどのアプリケーションに不可欠である。
以前の作業はオーディオキューや特定の視覚イベントに大きく依存しており、さまざまな設定で適用性を制限する。
本稿では,特定の特徴抽出手法とは独立して動作するビデオ同期フレームワークであるVideoSyncを紹介する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:41:21 GMT)
CIVET: Systematic Evaluation of Understanding in VLMs [1.8] VLM(Vision-Language Models)は、様々なタスクにおいて競争力を発揮する。
対象物の性質と関係を制御・解釈可能な方法で研究する。
我々は,システマティC評価のための新しいフレームワークであるCIVETを紹介した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:19:46 GMT)
Towards reliable quantum software, algorithm and use-case development: Multidisciplinary analysis from the perspective of Finnish industries [1.8] TORQSは、フィンランドの産業における信頼性の高いソフトウェア開発のジレンマと量子コンピューティングの可能性について、多分野的な視点から研究してきた。
ここでは、プロジェクトの主要な観察結果と結果を、量子ソフトウェア、アルゴリズム、ハードウェア、ビジネスに投資するためのエッセイのロードマップとタイムラインにまとめます。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:05:47 GMT)
Identifying Heterogeneity in Distributed Learning [1.7] 最小データ伝送量を用いた分散M推定における不均一パラメータ成分の同定法について検討する。
1つは再正規化されたWaldテストに基づいており、分散データブロックの数が$K$で最小ブロックのサンプルサイズより小さいオーダーである限り一貫性がある。
2つ目は、データブロック間の最大と最小のコンポーネント単位でのパラメータの差に基づく、極端なコントラストテスト(ECT)である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:26:48 GMT)
VideoGAN-based Trajectory Proposal for Automated Vehicles [1.7] 本稿では,鳥眼視(BEV)の交通シナリオのビデオに基づいて訓練された生成ネットワーク(GAN)が,統計的に正確な軌跡を生成できるかどうかを検討する。
そこで本研究では,ビデオ生成モデルのトレーニングデータとして,低解像度のBEV占有グリッドビデオを使用するパイプラインを提案する。
我々は,20ms未満の推論時間で,100GPU時間以内のトレーニングで最高の結果を得た。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:57:44 GMT)
DRIVE Through the Unpredictability:From a Protocol Investigating Slip to a Metric Estimating Command Uncertainty [1.7] 本稿ではDRIVEプロトコルを用いて,スリップ状態空間のシステム識別とキャラクタリゼーションのためのデータの収集を標準化する。
速度指令空間を探索し、地形とロボットの相互作用の到達速度を推定するプロトコルの能力を評価する。
コマンドの不確実性を推定し、デプロイのリスク可能性と重症度を評価するために、予測不可能な指標が提案されている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:33:33 GMT)
Autonomous Computer Vision Development with Agentic AI [1.7] 本稿では,エージェントAIを用いた自然言語プロンプトから,特殊なコンピュータビジョンシステムを自律的に構築できることを実証する。
これには、医療画像分析ツールを備えたオープンソースのCognitive AI環境であるSimpleMind(SM)の拡張が含まれていた。
コンピュータビジョンエージェントは、肺、心臓、リブの平均ダイススコア0.96、0.82、0.83の50個の胸部X線画像に対して、自動的に設定、訓練、テストを行う。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:19:13 GMT)
Chaos Engineering: A Multi-Vocal Literature Review [1.6] カオスエンジニアリングは、生産中のシステムが乱条件下でどのように振る舞うかを積極的にテストする。
従来のレジリエンステスト手法は、しばしば、現代のシステムの複雑な相互作用や障害モードを捉えるのに失敗する。
我々は,学術文献と灰色文献の両方から洞察を合成するために,多言語文献レビューを行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:24:28 GMT)
One Period to Rule Them All: Identifying Critical Learning Periods in Deep Networks [1.6] 批判的学習期間は、多くのトレーニングレシピの成功において初期のエポックが決定的な役割を果たす深層学習を含む重要な現象を理解する。
深層ニューラルネットワークのトレーニングにおける臨界周期を同定するための体系的アプローチを提案する。
これらの期間を超えて資源集約的なレシピを停止させることで、学習フェーズを著しく加速し、トレーニング時間、エネルギー消費、CO$排出の削減を実現します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:45:21 GMT)
Temporal horizons in forecasting: a performance-learnability trade-off [1.6] 地平線が短すぎると長期的な傾向を見逃しかねないが、地平線は予測誤差の蓄積によって収束を妨げる。
カオスシステムでは、損失ランドスケープの粗さはトレーニングの地平線とともに指数関数的に増大する。
また,長い地平線でトレーニングしたモデルは短期的な予測によく当てはまるが,短い地平線でトレーニングしたモデルはカオス(周期的)システムにおいて指数関数的に(線形的に)悪い長期的な予測に苦しむ。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:30:55 GMT)
LLM-Guided Indoor Navigation with Multimodal Map Understanding [1.5] 屋内地図画像からコンテキスト対応ナビゲーションインストラクションを生成するための大規模言語モデル(LLM)、すなわちChatGPTの可能性を探る。
以上の結果から,パーソナライズされた屋内ナビゲーションを支援するLLMが,平均86.59%,最大97.14%の正答率を持つ可能性が示唆された。
これらの結果は、AI駆動ナビゲーションと補助技術に重要な意味を持つ。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:05:07 GMT)
Conformal prediction for frequency-severity modeling [1.5] 本稿では,保険請求の予測間隔を構築するためのモデルに依存しない枠組みを提案する。
我々は2段階の周波数重大度モデリングの領域に共形予測を分割する手法を拡張した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:59:14 GMT)
Learning Topology Actions for Power Grid Control: A Graph-Based Soft-Label Imitation Learning Approach [1.4] 我々は、渋滞管理に適したグリッドトポロジを見つけるために、新しいImitation Learning (IL)アプローチを導入する。
一つの最適な動作を強制するためにハードラベルに依存する従来のIL法とは異なり,本手法では,グリッドの混雑解消に適した動作の有効性を捉えるソフトラベルを構築している。
我々のアプローチは、最先端のDeep Reinforcement Learning(DRL)ベースラインエージェントと同様に、ハードラベルのエージェントよりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:08:57 GMT)
A Sparse Tensor Generator with Efficient Feature Extraction [1.4] スパーステンソル研究における大きな障害は、大規模なスパーステンソルデータセットの欠如である。
我々は,実スパーステンソルの鍵特性を再現するスマートスパーステンソルジェネレータを開発した。
また,スパーステンソル特徴の包括的集合を抽出する効率的な方法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:29:18 GMT)
Representation Learning of Point Cloud Upsampling in Global and Local Inputs [1.4] 本稿では,ポイントクラウドのグローバルおよびローカルな構造的特徴から明示的に学習することで,アップサンプリング性能を向上させる新しいフレームワークであるReLPUを提案する。
我々のフレームワークは、最先端のオートエンコーダベースのネットワークに適用され、標準データセット上で検証された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:03:27 GMT)
Hierarchical and Modular Network on Non-prehensile Manipulation in General Environments [1.3] 非包括的操作は、ロボットが家庭などの一般的な環境で操作する上で重要である。
しかしながら、非包括的操作に関する先行研究は、多様な測地を持つ環境全体にわたって、まだ一般化できない。
本稿では,タスク要求に基づいて適応的にネットワークモジュールを再構成するモジュール構造を提案する。
さらに、353個のオブジェクトを持つ現実世界のシーンの9つのデジタルツインを特徴とするシミュレーションベースのベンチマークもリリースした。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:45:06 GMT)
Contactless Precision Steering of Particles in a Fluid inside a Cube with Rotating Walls [1.3] 本研究では,複数粒子の流れを制御できる新しい制御アルゴリズムを提案する。
このシステムは回転ディスクを使用して、粒子を正確な場所に輸送する流れ場を生成する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:56:54 GMT)
Investigating Lagrangian Neural Networks for Infinite Horizon Planning in Quadrupedal Locomotion [1.3] ラグランジアンニューラルネットワーク(LNN)は、帰納的バイアスを利用してシステムダイナミクスを学ぶための原則的で解釈可能なフレームワークである。
この研究は、4つの力学モデルによる四足歩行ロボットの無限水平計画のためのLNNを評価する。
実験により、LNNはサンプル効率(10倍)と予測精度(2~10倍)をベースライン法と比較して改善することが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:04:24 GMT)
Active MRI Acquisition with Diffusion Guided Bayesian Experimental Design [1.3] 臨床環境におけるMRIの利点を最大化するための鍵となる課題は、画像品質を著しく劣化させることなく取得時間を短縮することである。
この目的には、高速な取得のために生のk空間測定をアンダーサンプリングすることと、高忠実度画像再構成および解析タスクのための十分な生情報を収集することのバランスが必要である。
本稿では, 逐次ベイズ実験設計(BED)を用いて, 最も情報性の高い測定値の適応的, タスク依存的な選択を実現することを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:48:30 GMT)
The Role of Explanation Styles and Perceived Accuracy on Decision Making in Predictive Process Monitoring [1.3] 説明可能なAI(XAI)は、予測の背後にある推論を提供することで、この問題に対処することを目指している。
予測プロセスモニタリング(PPM)におけるXAIの現在の評価は、主にユーザ中心の側面を見渡す機能メトリクスに焦点を当てています。
本研究では, 意思決定における説明スタイル(機能的重要性, ルールベース, 対実的)とAIの精度(低いか高いか)の影響について検討した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:30:28 GMT)
Behaviour Planning: A Toolkit for Diverse Planning [1.2] 本稿は,n次元グリッド表現を用いた多様性のより表現豊かなモデリングを可能にする,多様な計画問題に対する新しいアプローチを提案する。
本稿では,emphBehaviour Planningと呼ばれる,このようなカスタマイズ可能な多様性モデルに基づく多様な計画を生成する新しいツールキットを提案する。
本実装の実証的な評価から,我々の新しいカスタマイズ可能な多様性モデルに基づく多様な計画作成において,行動計画が現在の多様な計画手法を著しく上回っていることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:08:19 GMT)
From Data to Decision: Data-Centric Infrastructure for Reproducible ML in Collaborative eScience [1.1] 機械学習(ML)における再現性は依然として中心的な課題である
現在のMLは、しばしば断片化され、非公式なデータ共有、アドホックスクリプト、ゆるく接続されたツールに依存している。
本稿では,ライフサイクルを意識したアーティファクトのためのデータ中心フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:09:01 GMT)
Co-Speech Gesture and Facial Expression Generation for Non-Photorealistic 3D Characters [1.1] 本研究では,非フォトリアリスティックな文字に特有の誇張表現を含む感情表現手法を提案する。
ユーザスタディでは、既存研究と比較して、複数の面で大きな改善が見られた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:14:50 GMT)
Efficient Retail Video Annotation: A Robust Key Frame Generation Approach for Product and Customer Interaction Analysis [1.1] 本稿では,小売ビデオのキーフレーム識別を自動化するディープラーニングベースのアプローチを提案する。
提案手法は,ビデオアノテーションにおける平均2倍のコスト削減につながる。
キーフレーム検出の自動化により、小売ビデオラベリングタスクの大幅な時間と労力の節約が可能になる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:04:23 GMT)
Overfitting in Histopathology Model Training: The Need for Customized Architectures [1.0] 画像解析のための微調整された大規模モデルでは, 病理組織学的なタスクに適用した場合, 最適な性能と大幅な過度なオーバーフィッティングが期待できる。
本研究は,病理組織像解析に特化して設計されたカスタマイズアーキテクチャの必要性を強調した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:05:54 GMT)
Interpretable and Granular Video-Based Quantification of Motor Characteristics from the Finger Tapping Test in Parkinson Disease [1.0] 本稿では,ビデオ記録からPDモータ特性を定量化するコンピュータビジョンに基づく手法を提案する。
低スキネジア、ブレジキネシア、シークエンス・エフェクト、鎮静剤を特徴付けるために、臨床的に関係のある4つの特徴セットが提案されている。
運動障害学会統一パーキンソン病評価尺度 (MDS-UPDRS) の指触診スコアを推定するために, これらの特徴を機械学習分類器の訓練に利用した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:49:06 GMT)
Signatures to help interpretability of anomalies [1.0] 機械学習は、アウトプットを理解するという意味では、意思決定やスコアのように、ブラックボックスと見なされることが多い。
本稿では,この決定にどの特徴が寄与したかを強調することによって,異常の解釈を支援することを目的とした,異常シグネチャのアイデアを紹介する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:40:05 GMT)
Manifold Learning for Personalized and Label-Free Detection of Cardiac Arrhythmias [0.9] 我々は, 非線形次元減少 (NLDR) は心電図信号の医学的特徴に適応できることを示した。
MIT-BIHデータセットのMLIIおよびV1リードを用いて、NLDRが心臓モニタリングに大いに期待できることを実証した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:39:57 GMT)
From Teacher to Student: Tracking Memorization Through Model Distillation [0.9] 大規模言語モデル(LLM)は、トレーニングデータの一部を記憶することで知られており、プライバシとセキュリティに関する重要な懸念を提起している。
本研究では,異なる知識蒸留法(KD)が,大規模な教師モデルをより小さな学生に蒸留した場合の微調整タスクデータの記憶にどのように影響するかを検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:44:25 GMT)
Compressibility measurement of the thermal MI--BG transition in an optical lattice [0.9] 障害は個々の量子粒子を局在させることで絶縁状態に導電する変換に応用することができる。
本報告では, 障害非依存の圧縮性を有する状態から, 障害による圧縮性が増大する状態へ移行した状態の超低温格子ガス中の測定結果について報告する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:04:19 GMT)
An Exploratory Approach Towards Investigating and Explaining Vision Transformer and Transfer Learning for Brain Disease Detection [0.9] 本研究では、視覚変換器(ViT)と伝達学習(TL)モデルを用いて脳疾患の分類を行った。
その結果,ViTは伝達学習モデルを超え,94.39%の分類精度が得られた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:22:10 GMT)
Automatic Speech Recognition Biases in Newcastle English: an Error Analysis [0.9] 本研究では,地域方言であるニューカッスル英語におけるASRの性能について検討した。
まず,ASRの誤認識の背後にある重要な音韻,語彙,形態的誤りを同定したサブサンプルのマニュアルエラー解析を行った。
その結果、ASRの誤りは地域方言の特徴と直接相関し、社会要因はASRのミスマッチにおいてより少ない役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:24:12 GMT)
Improved Exploration in GFlownets via Enhanced Epistemic Neural Networks [0.8] トレーニングのための適切な軌道を効果的に特定することは、GFlowNetsでは未解決の問題である。
提案アルゴリズムは,GFlownetのベースライン法と比較し,グリッド環境での評価を行う。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:39:30 GMT)
Centre driven Controlled Evolution of Wireless Virtual Networks based on Broadcast Tokens [0.8] 無線センサネットワークでは、ノード間の仮想接続は、様々なノード間で共有されるキーの関数である。
本稿では,異なるノードにおける同時かつ分散されたキーリリースを制御するフレームワークとアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:24:42 GMT)
Malware Classification Leveraging NLP & Machine Learning for Enhanced Accuracy [0.8] 本稿では,NLPを用いたn-gram解析と機械学習によるマルウェア分類の強化について検討する。
n-gramアプローチを実装することで、さまざまな機械学習アルゴリズムで99.02%の精度を実現しました。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:32:53 GMT)
EndoMUST: Monocular Depth Estimation for Robotic Endoscopy via End-to-end Multi-step Self-supervised Training [0.7] 本研究では,多段効率のファインタニングを施した新しいフレームワークを提案する。
基礎モデルに基づくパラメータ効率の微調整に基づいて,提案手法は最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:31:59 GMT)
AGE-US: automated gestational age estimation based on fetal ultrasound images [0.7] 少なからぬ出生は、新生児死亡率の増加や、将来の心臓病の可能性が高まるなど、重大な健康リスクをもたらす。
本研究では,自動妊娠年齢計算のための解釈可能な深層学習手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:15:06 GMT)
Fully convolutional 3D neural network decoders for surface codes with syndrome circuit noise [0.6] ANNは量子誤り訂正(QEC)の復号問題に対する有望なアプローチである
最近の拡張性を重視したアプローチでは、局所的なANNを用いて初期シンドロームと最終処理をグローバルな残留復号器に分割している。
本稿では,曲面コードデータシミュレーションとベンチマークデコーディングのためのベクトル化手法を提案する。
性能は、最大$d=97$の回転曲面符号に一般化され、偏極パラメータ閾値は最大$0.7%$が達成された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:04:04 GMT)
Dual-Objective Reinforcement Learning with Novel Hamilton-Jacobi-Bellman Formulations [0.6] 強化学習(RL)における厳しい制約は、しばしば政策性能を低下させる。
ハミルトン・ヤコビ方程式とRLを結びつける最近の進歩を拡張し、二重目的満足度に対する2つの新しい値関数を提案する。
本稿では,これらの問題を解くための近似政策最適化(DO-HJ-PPO)のバリエーションを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:27:17 GMT)
Theory of multi-qubit superradiance in a waveguide in the presence of finite delay times [0.6] 導波管型量子電磁力学系における複数の2レベル原子(量子ビット)の量子力学について検討する。
本稿では、時間遅延フィードバック効果の有意な影響と、瞬時結合力学を仮定する際の明確な分解を明らかにする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:09:15 GMT)
Comprehensive Lung Disease Detection Using Deep Learning Models and Hybrid Chest X-ray Data with Explainable AI [0.5] 本研究では,ハイブリッドデータセットを用いた深層学習と移動学習の有効性について検討した。
その結果、VGG16、Xception、ResNet50V2、DenseNet121のハイブリッドデータセットでは、それぞれ99%の精度でパフォーマンスが向上した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:42:40 GMT)
Unpacking Generative AI in Education: Computational Modeling of Teacher and Student Perspectives in Social Media Discourse [0.5] 本研究は、ソーシャルメディアデータを用いた教育におけるGAIに関する利害関係者談話のダイナミクスに関する最も包括的分析の1つを提示する。
私たちのデータセットには1,199件のReddit投稿と13,959件のトップレベルのコメントが含まれています。
本研究は, より明確な制度方針, より透明なGAI統合実践, 教育者, 学生の支援メカニズムの必要性を示唆するものである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:50:08 GMT)
Quantum Catalytic Space [0.5] 量子触媒の対数空間は常に時間内に量子的に計算可能であることを示す。
また, 単一量子触媒対数空間と古典触媒対数空間の両方を1クリーン量子ビットモデルでシミュレートできることを示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:59:24 GMT)
DeepGDel: Deep Learning-based Gene Deletion Prediction Framework for Growth-Coupled Production in Genome-Scale Metabolic Models [0.5] 本稿では,ゲノム規模メタボリックモデルを用いた遺伝子欠失予測手法を提案する。
提案フレームワークは、ディープラーニングアルゴリズムを利用して、シーケンシャルな遺伝子を学習、統合し、データ表現を代謝する。
実験により,提案手法の有効性を実証し,ベースライン法よりも大幅に改善した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:07:51 GMT)
SaTor: Satellite Routing in Tor to Reduce Latency [0.5] 高いレイテンシはTorネットワークにおける重要な制限であり、Webアプリケーションの応答性に悪影響を及ぼします。
本稿では,Torのレイテンシを低減するための衛星支援ルーティング方式であるSaTorを提案し,検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:18:04 GMT)
Semantic Outlier Removal with Embedding Models and LLMs [0.5] 我々は,不必要なテキストセグメントを識別・抽出するためのコスト効率のよい透明なSORE(Semantic Outlier removal)を紹介する。
SOREは、約LLM抽出精度をコストのごく一部で達成する。
当社のシステムは現在本番環境にデプロイされており、複数の言語で毎日数百万のドキュメントを処理しています。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:06:12 GMT)
Zero Curvature Condition for Quantum Criticality [0.5] 本稿では, 量子位相遷移(QPT)の幾何学的アプローチを提案し, 微視的秩序から非可換作用素間の競合へ焦点を移す。
量子可観測空間境界上のゼロ曲率点においてQPTが発生し、最大可換性を示すとともに、臨界点における基盤となる可積分構造が示唆される。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:36:29 GMT)
Patch-based learning of adaptive Total Variation parameter maps for blind image denoising [0.4] ノイズがガウシアンかポアソンかのいずれかでありうる状況について考察し、ノイズ分布が不明な状況について検証する。
我々は,各画像画素に対して,テレビの正規化と対応するデータの忠実度を最適に重み付けするパッチベースのアプローチを定義する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:17:50 GMT)
Boosting multi-demographic federated learning for chest radiograph analysis using general-purpose self-supervised representations [0.4] フェデレートラーニング(FL)は、医療画像分析モデルをトレーニングするための分散型かつプライバシ保護のアプローチを提供する。
既存の大規模FL研究は成人のデータセットに限られており、小児データによって引き起こされる固有の課題を無視している。
各種施設の成人胸部X線写真523点, 小児画像9,125点について検討した。
その結果、FLはより小さな成人データセットでのみ性能が向上するが、より大きなデータセットでは性能が低下することが判明した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:21:48 GMT)
fairmetrics: An R package for group fairness evaluation [0.4] Fairmetrics Rパッケージは、グループベースのフェアネス基準を厳格に評価するための、ユーザフレンドリなフレームワークを提供する。
群に基づく公平度基準は、あるモデルが一組の事前定義されたグループに対して等しく正確であるか、あるいは適切に校正されているかを評価する。
Fairmetricsは、便利なラッパー関数を通じて、複数のメトリクスに対してポイントとインターバルの見積もりを提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:00:46 GMT)
Category-based Galaxy Image Generation via Diffusion Models [0.4] 拡散モデルのネットワーク設計において、銀河画像の特徴と天体物理特性の両方を活用する天文学における最初のフレームワークであるGalCatDiffを提案する。
GalCatDiffは拡張されたU-NetとAstro-RAB(Residual Attention Block)という新しいブロックを組み込んでいる。
実験により、GalCatDiffはサンプルの色と大きさの分布の整合性において既存の手法よりも優れており、生成した銀河は視覚的にも現実的にも物理的に整合性があることが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:14:33 GMT)
MambaHash: Visual State Space Deep Hashing Model for Large-Scale Image Retrieval [0.4] 線形時間複雑性を持つビジョン・マンバは、研究者から広く注目を集めている。
我々はMambaHashと呼ばれる視覚状態空間ハッシュモデルを提案する。
広範に使用されている3つのデータセットに関する総合的な実験を行った。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:30:55 GMT)
Cyberbullying Detection in Hinglish Text Using MURIL and Explainable AI [0.4] デジタルプラットフォーム上でのHindi-English(Hinglish)通信のコード混在は、既存のサイバーいじめ検知システムに課題をもたらす。
本稿では,インド語多言語表現(MURIL)アーキテクチャを用いたHinglishテキストにおけるサイバーいじめ検出のためのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:46:42 GMT)
A Hybrid DeBERTa and Gated Broad Learning System for Cyberbullying Detection in English Text [0.4] 最近の研究によると サイバーいじめは 約54.4%の若者に影響を与えます
本稿では,変圧器モデルにおける文脈理解能力と広範学習システムのパターン認識強度を併用して,効果的なサイバーバブル検出を行うハイブリッドアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:15:22 GMT)
Quantum complexity phase transitions in monitored random circuits [0.3] 監視されたランダム回路における量子状態複雑性のダイナミクスについて検討する。
正確な量子状態の複雑性の進化は、測定率を変更する際に相転移を起こす。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:23:00 GMT)
Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval [0.3] 特許画像は、特許のイノベーションに関する情報を伝える技術図である。
現在の方法は、ロカルノ国際分類システムで定義されたような特許の階層的関係を無視している。
検索プロセスにおいて,その関係を導き出すために,LISPの分類を利用した階層的多陽性のコントラスト損失を導入する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:08:49 GMT)
Understanding the Challenges and Promises of Developing Generative AI Apps: An Empirical Study [0.1] 2022年のChatGPTは、生成人工知能モバイルアプリ(つまり、Gen-AIアプリ)の急激な急増を引き起こした。
Google Play Storeの173のGen-AIアプリから、676,066のレビューをユーザ中心で分析します。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:39:55 GMT)
NepaliGPT: A Generative Language Model for the Nepali Language [0.1] ネパール語の生成言語モデルは存在せず、微調整を含む下流のタスクはまだ検討されていない。
本研究はネパール語に特化した生成型大規模言語モデルである textitNepaliGPT を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:31:12 GMT)
Initial Investigation of LLM-Assisted Development of Rule-Based Clinical NLP System [0.1] ルールベースの自然言語処理 (NLP) システムは, 解釈可能性や操作効率の面から, 臨床現場で有効である。
我々は,ルールベースのシステム開発フェーズのみにおいて,大規模言語モデル(LLM)を用いた新しいアプローチを提案する。
本実験は,臨床関連テキストスニペットの同定において,例外的なリコールを示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:55:33 GMT)
Prompt-based Dynamic Token Pruning to Guide Transformer Attention in Efficient Segmentation [0.1] 本研究では,セグメンテーションパイプラインにおける無関係トークンの処理を選択的に削減する適応的プロンプト誘導プルーニング法を提案する。
実験の結果,35-55%のトークンを$sim$で還元し,ベースラインに対する計算コストを低減した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:45:46 GMT)
Bootstrapping entanglement in quantum spin systems [0.1] 我々はブートストラップ法を用いて、量子多体系における期待値を決定する。
次に、これらの値を用いて、システムの絡み合う内容を評価する。
このアプローチは、新しい計算方法論を提供するだけでなく、二部構成と多部構成の絡み合い特性の包括的視点を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:18:07 GMT)
WebXAII: an open-source web framework to study human-XAI interaction [0.0] WebXAIIは、eXplainable Artificial Intelligence (XAI)システムとのヒューマンインタラクションの研究を促進するために設計されたWebフレームワークである。
WebXAIIは完全な実験プロトコルを具現化することができ、実験のすべての側面を人間の参加者に提示することができる。
文献の最先端研究のプロトコルを再現することにより,WebXAIIが関連プロトコルを効果的に具現化できることを実証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:45:07 GMT)
Visual Image Reconstruction from Brain Activity via Latent Representation [0.0] レビューでは、フィールドの進化は初期の分類のアプローチから洗練された再構築まで遡る。
多様なデータセットの必要性と、人間の知覚的判断に合わせた洗練された評価指標について論じる。
視覚画像再構成は、ニューラルコーディングに関する有望な洞察を提供し、視覚経験の新たな心理的測定を可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:37:28 GMT)
Vision-Guided Chunking Is All You Need: Enhancing RAG with Multimodal Document Understanding [0.0] Retrieval-Augmented Generation (RAG) システムは情報検索と質問応答に革命をもたらした。
従来のテキストベースのチャンキング手法は、複雑なドキュメント構造、マルチページテーブル、埋め込みフィギュア、ページ境界を越えたコンテキスト依存に苦労する。
本稿では,Large Multimodal Models(LMM)を利用してPDF文書をバッチで処理する,新しいマルチモーダル文書チャンキング手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:11:43 GMT)
Verification of Quantum Circuits through Barrier Certificates using a Scenario Approach [0.0] 本稿では,量子回路のバリア証明書を合成する手法を提案する。
我々の手法は初期状態やシステムの力学における不確実性を扱うことができる。
量子回路に関するいくつかのケーススタディを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:52:27 GMT)
Variance-Based Defense Against Blended Backdoor Attacks [0.0] バックドア攻撃は、AIモデルをターゲットにした微妙ながら効果的なサイバー攻撃のクラスである。
本稿では,与えられたデータセット上でモデルをトレーニングし,有毒なクラスを検出し,攻撃トリガの重要部分を抽出する新しい防御手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:44:06 GMT)
Validity of generalized Gibbs ensemble in a random matrix model with a global $\mathbb{Z}_2$-symmetry [0.0] 交換対称性が保存されるランダム対称中心対称行列(SC)を考える。
非常に長い時間スケールで崩壊しない初期状態が存在することを示す。
また, SC行列の場合, 局所観測可能な一般観測装置に熱処理が適用されないことを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:49:59 GMT)
Unveiling Political Influence Through Social Media: Network and Causal Dynamics in the 2022 French Presidential Election [0.0] 2022年のフランス大統領選挙では、政治候補者とその近しいネットワークが投稿した重要なトピックについて、毎日のTwitterメッセージを収集しました。
データ駆動型アプローチを用いて、政党間の相互作用を分析し、政治討論の風景を形成する中心的なトピックを特定します。
以上の結果から, 保健政策や外交政策といった特定の課題が, 特に急激な選挙期において, 政党間の影響力の触媒としてどのように振る舞うかが示唆された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:35:02 GMT)
Transparency Techniques for Neural Networks trained on Writer Identification and Writer Verification [0.0] 著者識別(WI)と著者検証(WV)を訓練したニューラルネットワークに2つの透明性技術を適用する
第1のテクニックはピクセルレベルのサリエンシマップを提供し、第2のテクニックのポイント固有のサリエンシマップは2つの画像間の類似性に関する情報を提供する。
目標は、手書きテキストの類似点に関する情報を持つ法医学の専門家を支援し、識別プロセスのためにニューラルネットワークが選択した特徴を探索することである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:07:04 GMT)
TrajSceneLLM: A Multimodal Perspective on Semantic GPS Trajectory Analysis [0.0] 我々は,GPSトラジェクトリのセマンティック理解を強化するためのマルチモーダル視点であるTrajSceneLLMを提案する。
本稿では,旅行選択を分析し,移動行動を理解する上で重要な課題である旅行モード識別(TMI)の枠組みを検証した。
このセマンティックエンハンスメントは、さまざまな下流のアプリケーションや、人工知能の将来の研究に有意義な可能性を約束する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:31:40 GMT)
Towards AI-Driven Policing: Interdisciplinary Knowledge Discovery from Police Body-Worn Camera Footage [0.0] 本稿では,高度な人工知能(AI)と統計機械学習(ML)技術を用いて,警察用ボディウーンカメラ(BWC)映像を解析するための新しい枠組みを提案する。
我々の目標は、警察官と民間人の相互作用パターンを検出し、分類し、分析し、重要な行動力学を特定することである。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:59:33 GMT)
Thermalization and irreversibility of an isolated quantum system II [0.0] 拡散非平衡状態情報の消去による絡み合いエントロピーの不可逆的な成長を数値的に示す。
我々の研究は、熱力学の第2法則、したがって統計物理学におけるエルゴード仮説が量子情報の観点から理解され、証明できることを実証している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:10:10 GMT)
Thermal Modeling and Optimal Allocation of Avionics Safety-critical Tasks on Heterogeneous MPSoCs [0.0] 高消費電力とアビオニクスの安全基準が組み合わさって、新しい熱管理の課題をもたらす。
本稿では,不均一MPSoC上での周期的タスクのオフライン熱的アロケーション手法について検討する。
実験的なパワーモデルとILPを統合することで,テスト対象のプラットフォーム上での他の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:33:08 GMT)
The quantification of a genuine tetrapartite entanglement in a mixed spin-(1/2,1) Heisenberg tetramer [0.0] 混合スピン(1/2,1)ハイゼンベルク四量体の絡み合いは、3つの異なるアプローチで定量化される。
両断面の絡み合いの度合いは, 両断面の負性度を0, 非0温度で評価する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:01:43 GMT)
The Quantum Formalism Revisited [0.0] 量子力学の構造要素と古典力学(統計力学)の構造要素について論じる。
多くの驚くべき類似性にもかかわらず、よく知られた基本的な違いがある。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:25:40 GMT)
The Quantified Body: Identity, Empowerment, and Control in Smart Wearables [0.0] 生体データのストリームとして体がますますレンダリングされる時代において、スマートウェアラブルは予測的ガバナンスの基盤として現れてきた。
本稿は、Apple Watch、Fitbit、Oura Ringなどのデバイスが、フィードバック駆動型のセルフサーベイランスを通じて身体の自律性をどのように再構成するかを批判的に検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:24:17 GMT)
The Condition Number as a Scale-Invariant Proxy for Information Encoding in Neural Units [0.0] 実効的な知識符号化には不十分な高条件数は、そのユニットが情報を選択的に増幅し圧縮することを学習したことを示唆する可能性がある。
本稿では,これらの原則を多モーダル大規模言語モデルの選択的微調整に応用する実践事例について述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:06:16 GMT)
TAPS: Throat and Acoustic Paired Speech Dataset for Deep Learning-Based Speech Enhancement [0.0] 喉頭と音響マイクを用いて60人の韓国語話者から記録されたペア音声のデータセットであるThroat and Acoustic Paired Speechデータセットを紹介した。
近年の深層学習アプローチでは喉頭マイクロホン記録の強化が期待されているが、標準データセットの欠如によりさらなる進歩が制限されている。
TAPSデータセット上で3つのベースラインディープラーニングモデルを検証し,音声品質の向上とコンテンツ復元に優れたマッピングベースのアプローチを見出した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:31:40 GMT)
Sustainable Greenhouse Microclimate Modeling: A Comparative Analysis of Recurrent and Graph Neural Networks [0.0] 本研究では,時空間グラフニューラルネットワーク(STGNN)の温室マイクロ気候モデリングへの応用について紹介する。
従来のリカレントニューラルネットワーク(RNN)と比較する。
我々のSTGNNアプローチは、これらの関係を有向グラフとして表現することで、この制限に対処し、モデルが環境依存性と方向性の両方をキャプチャすることを可能にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:17:39 GMT)
State-Space Kolmogorov Arnold Networks for Interpretable Nonlinear System Identification [0.0] 本稿では,この課題に対処するために,国家空間コルモゴロフ・アルノルドネットワーク(SS-KAN)を提案する。
提案したモデルは、SilverboxとWiener-Hammersteinベンチマークの2つのベンチマークシステムで検証されている。
その結果,SS-KANはスパーシティプロモーティング正規化による解釈可能性の向上を図っている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:25:48 GMT)
Stability of thermal equilibrium in long-range quantum systems [0.0] 長距離相互作用を持つシステムにおいて,誤差が局所観測値の測定に与える影響について検討した。
局所期待値の安定性は、ギブス状態とリーブ・ロビンソン境界上の相関の崩壊から導かれることを証明している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:36:44 GMT)
Single-shot high-resolution spectroscopy of single-photon-level optical pulses using a virtually imaged phased-array and single-photon avalanche diode array [0.0] 単一光子レベルにおける単発高分解能分光は、有望な測定技術として現れている。
本稿では,高分解能周波数-空間モードマッピングを統合した単一ショット高分解能単一光子分光システムを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:00:54 GMT)
Sharpening Kubernetes Audit Logs with Context Awareness [0.0] K8sは、クラスタ内のAPIインタラクションを追跡する強力な機能である監査ログを提供する。
クラスタ内のすべてのコンポーネントが対話し、ユーザのアクションに応答するので、大量のデータを継続的に生成します。
K8NTEXTは、コンテキストを再構築することでK8s監査ログを合理化するための新しい手法である。
我々は,50,100以上の相関行動を含む複雑な操作であっても,常に正確なコンテキスト再構築を提供することを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:02:22 GMT)
Semantic Preprocessing for LLM-based Malware Analysis [0.0] 本稿では,Portable Executable ファイルのレポートを生成する新しい前処理手法を提案する。
この前処理の目的は、マルウェアアナリストが理解できるバイナリファイルの意味表現を集めることである。
この前処理を用いて、複雑なデータセット上で平均0.94の重み付きF1スコアを達成する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:55:01 GMT)
Self-consistent tensor network method for correlated super-moiré matter beyond one billion sites [0.0] モイアと超モイアの材料は、エキゾチックな相関量子物質を設計するための例外的なプラットフォームを提供する。
スーパーモアの資料はこの要件を、数百万から数十億のサイトを考慮すべき限界まで押し上げています。
我々は,10億のサイトに到達するシステムにおいて,相関状態の解決を可能にする方法論を確立する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:36:35 GMT)
SecureFed: A Two-Phase Framework for Detecting Malicious Clients in Federated Learning [0.0] フェデレートラーニング(FL)は、モデルをトレーニングするための分散メソッドを提供しながら、データのプライバシを保護する。
分散スキーマのため、結果を変えたり、モデルのパフォーマンスを妨害したりできる敵のクライアントに感受性がある。
本研究では,攻撃者の影響を識別・低減する二相FLフレームワークSecureFedを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:52:48 GMT)
Scaling GR(1) Synthesis via a Compositional Framework for LTL Discrete Event Control [0.0] 本稿では、離散イベントシステムコントローラの制御器合成における構成的アプローチを提案する。
我々は、ラベリングされた遷移システムの集合として与えられたプラントのモジュラー構造を利用して制御する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:23:15 GMT)
SERP Interference Network and Its Applications in Search Advertising [0.0] 本稿では、検閲された観測データを活用して、バイパートイト(製品広告やテキスト広告への検索クエリ)の干渉ネットワークを構築することを提案する。
重み付きプロジェクションを作成して一部グラフを作り、ランダム化されたクラスタを作成するのに使用します。
ペイド検索のための新しい入札アルゴリズムの評価において,この実験的な設計の応用を実証する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:33:05 GMT)
SEP-GCN: Leveraging Similar Edge Pairs with Temporal and Spatial Contexts for Location-Based Recommender Systems [0.0] SEP-GCNは、文脈的に類似した相互作用エッジのペアから学習する新しいグラフベースのレコメンデーションフレームワークである。
SEP-GCNは、類似の時間的ウィンドウや地理的近接で発生するエッジペアを識別することにより、コンテキスト的類似性リンクでユーザ-itemグラフを拡張する。
ベンチマークデータセットの実験では、SEP-GCNは予測精度とロバスト性の両方において、強いベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:48:30 GMT)
Robust global tripartite entanglement in a mixed spin-($1$,$1/2$,$1$) Heisenberg trimer [0.0] 混合スピンを持つハイゼンベルク三量体における大域的三部構造エンタングルメントを厳密に解析した。
基底状態が2つの分離可能な地域では, 強大な大域的絡みが熱的に活性化されることが判明した。
この熱的絡み合いの大きさは著しく高く、これまで報告されていない1/2ドルの値にほぼ達している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:30:34 GMT)
Qubit thermodynamics: Entropy production from nonadiabatic driving [0.0] 断熱性は、量子制御、計算、シミュレーションに対する多くの有望なアプローチの基盤である。
量子ビット制御における非断熱誤差をエントロピー生成の一形態として解析する。
我々は、有効ハミルトニアンに関して平衡が定義されるとき、エントロピーはほぼ単調に増加することを示した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:51:54 GMT)
Quantum-enabled optical large-baseline interferometry: applications, protocols and feasibility [0.0] 光学超長基線干渉計は、天文学的な画像と精密な測定の両方において、前例のない角分解能の可能性を秘めている。
量子対応VLBIの最近の進歩は、絡み合い支援プロトコル、量子メモリストレージ、非局所計測技術による課題に対処することを目的としている。
これらの技術がどのようにジオデシーに拡張されるのか、具体的には地球の自転のモニタリングについて検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:35:40 GMT)
Quantum-Informed Contrastive Learning with Dynamic Mixup Augmentation for Class-Imbalanced Expert Systems [0.0] QCL-MixNetは、不均衡下でのロバストな分類のための動的混合のための新しいフレームワークである。
QCL-MixNetは、20の最先端の機械学習、ディープラーニング、GNNベースのベースラインをマクロF1とリコールで一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:18:04 GMT)
Quantum state smoothing when Alice assumes the wrong type of monitoring by Bob [0.0] アリスの真の状態の推定精度は、彼女の設定、ボブの実際の設定、そして間違った仮定された設定に強く依存していることを示す。
いくつかのケースでは、間違った滑らか化は正しい滑らか化と同程度に正確であるが、別のケースではアリスのフィルタリングされた推定値よりもはるかに正確でないことも示している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:33:14 GMT)
Quantum metrology of a structured reservoir [0.0] 構造された貯水池の特性を正確に特徴づけることは量子システムにおいて重要な課題である。
熱水浴としてモデル化されたアンシラキュービットとマルコフ環境からなる構造型貯水池に結合した2レベルシステム(キュービット)をプローブとして使用した。
本稿では、量子フィッシャー情報(QFI)を用いてパラメータ推定の精度を定量化し、過渡状態と定常状態の両方で系の力学を解析する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:44:16 GMT)
Quantum dynamics in the self-consistent quadratic approximation [0.0] 自己整合2次理論は、量子力学における非線形寄与を説明するために提示される。
力学はトレース保存であることが証明されており、ハミルトン状態は初期ガウス状態の運動定数として作用する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:54:56 GMT)
Quantum Artificial Intelligence for Secure Autonomous Vehicle Navigation: An Architectural Proposal [0.0] 本稿では,量子人工知能に基づく新しいアーキテクチャを提案する。
マルチモーダルセンサ融合のための量子ニューラルネットワーク、ナビゲーションポリシー最適化のための量子強化学習のためのNav-Q
最後に、ポスト量子暗号プロトコルは、車両通信とV2X(Vehicle to Everything)通信の両方の通信チャネルを確保するために使用される。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:45:49 GMT)
Quadratic Hamiltonian approach to heat transport in fermionic systems [0.0] 本研究では, 1粒子相関関数のペシェルトリックの助けを借りて, 二次フェルミオン系に基づく量子熱輸送の問題点を考察する。
単モードヒートバルブの特定のケースに効率的な数値法を適用し,解析式と比較した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:17:18 GMT)
QMetro++ -- Python optimization package for large scale quantum metrology with customized strategy structures [0.0] QMetro++は最適な推定プロトコルを特定するためのPythonパッケージである。
このパッケージは、最近開発されたQFIの基本上界の計算方法の実装を伴っている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:13:22 GMT)
Optimizing Multilingual Text-To-Speech with Accents & Emotions [0.0] 本稿では,アクセントを付加した新しいTSアーキテクチャを提案する。
本稿では,言語固有の音素アライメント型エンコーダ-デコーダアーキテクチャを統合することで,Parler-TTSモデルを拡張した。
テストでは、アクセント精度が23.7%改善し、ネイティブリスナーによる感情認識精度が85.3%向上した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:35:05 GMT)
Optimizing MoE Routers: Design, Implementation, and Evaluation in Transformer Models [0.0] Mixture of Experts (MoE)アーキテクチャは言語モデルのスケーラビリティを向上するが、そのパフォーマンスはトークンを専門の専門家に移すルータモジュールに依存している。
この研究は、MoEルータの設計の比較分析を提供し、その性能を効率的かつ効率的な大規模モデル展開のために最適化するための洞察を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:55:43 GMT)
Optical centrifuge for nanoparticles [0.0] 我々は,光ツイーザ内における浮遊ナノロータの回転制御のための光遠心分離器の開発について検討した。
光遠心分離器は、光学トラップを形成するために使用されるタイトな焦点の光学場の線形偏光を高速に回転させることによって生成される。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:38:53 GMT)
Operator-space fragmentation and integrability in Pauli-Lindblad models [0.0] 閉量子系におけるヒルベルト空間の断片化は、制約された相互作用の存在下でのデコヒーレンスを遅くする効果的なメカニズムである。
我々は、リンドブラディアンの進化を経た混合状態の作用素空間の断片化のための一般的なメカニズムを開発する。
これらの方法を用いることで、パウリ・リンドブラッド模型の普遍的力学状態の域が明らかになる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:01:25 GMT)
Operationalizing Automated Essay Scoring: A Human-Aware Approach [0.0] 機械学習に基づくアプローチをLarge Language Models(LLM)アプローチと比較し、その強み、類似点、相違点を同定する。
MLに基づくAESモデルでは,LSMの精度は向上するが,説明可能性に苦慮する一方,LSMはよりリッチな説明を提供する。
これらの次元を解析することにより、異なる方法間の課題とトレードオフを特定し、より信頼性が高く信頼性の高いAES手法に寄与することを目的とする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:06:17 GMT)
On the generalization of Tanimoto-type kernels to real valued functions [0.0] Tanimotoカーネル(Jaccard index)はバイナリ属性の集合間の類似性を記述するツールである。
本稿では,任意の実数値関数の類似性を計測できる,より一般的な谷本カーネルを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:46:47 GMT)
On the choice of non-linear terms in blocking cat states by energy conservation [0.0] エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。
W.D. Wick, arXiv:1710.03278]で導入された種類の非線形項は、測定問題の解法としてエネルギー保存によって空間猫をブロックすることであった。
最後に [W.D. Wick, arXiv:1710.03278] の提案を検証するための実験的見積もりを述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:45:54 GMT)
On the Robustness of Decision-Focused Learning [0.0] 決定焦点学習(Decision-Focused Learning, DFL)は、機械学習(ML)モデルを訓練し、不完全な最適化問題の欠落パラメータを予測するための新興学習パラダイムである。
DFLは、予測と最適化タスクを統合することで、エンドツーエンドシステムでMLモデルをトレーニングし、トレーニングとテストの目的の整合性を向上させる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:50:12 GMT)
On the Performance of Cyber-Biomedical Features for Intrusion Detection in Healthcare 5.0 [0.0] この研究は、ネットワークトラフィックとバイオメディカルセンサーデータを統合したHealthcare 5.0データセットにeXplainable AI(XAI)を適用する。
分類結果によると、XGBoostは良性およびデータ修正で99%のF1スコア、スプーフィングで81%を達成した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:23:06 GMT)
On Design of Representative Distributionally Robust Formulations for Evaluation of Tail Risk Measures [0.0] CVaR(Conditional Value-at-Risk)は、極度の損失の影響を定量化するために広く用いられるリスク尺度である。
この感度に対処するため、分散ロバスト最適化(DRO)は、可算データ分布の集合に対して最悪のCVaR値を評価する。
本稿では,DROの定式化に極値理論を活用することを目的とする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:40:02 GMT)
Obtaining continuum physics from dynamical simulations of Hamiltonian lattice gauge theories [0.0] 連続限界に対する近似時間進化の影響を厳格に制御する新しい枠組みを提案する。
動作統計の不確実性以下に近似時間進化誤差を駆動するSBTEプロトコルを用いることで、単純化された再正規化手順が導かれることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:28:21 GMT)
Nonequilibrium Quasiparticles in Superconducting Circuits: Energy Relaxation, Charge and Flux Noise [0.0] ジョセフソン接合を横切る過剰な準粒子のトンネルは超伝導量子ビットにおける主要な損失とデコヒーレンス機構の1つとして認識されている。
準粒子からの電荷ノイズは対数周波数のフラックスノイズを引き起こし、フラックス量子ビットで観測されるフラックスノイズに匹敵する「ほぼ白い」寄与をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 22:48:22 GMT)
No-go theorems for sublinear-depth group designs [0.0] 局所ゲートを持つ1次元のサブ線形回路からなる$G$の部分集合が、$G$に対して近似的な$k$-designを形成することを証明している。
ほとんどの群について、そのようなアンサンブルは、高い確率で、一定深度測定の単一ショットで$k$-designsと区別できる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:51:18 GMT)
News Sentiment Embeddings for Stock Price Forecasting [0.0] 主な焦点は、ウォール・ストリート・ジャーナルのニュースの見出しを使って、毎日の時間スケールで株価の動きを予測することだ。
予備的な結果は、トレーニングや機械学習システムの最適化と比較して、ヘッドラインデータの埋め込みは、少なくとも40%の株価予測に大きく貢献することを示している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:30:07 GMT)
Mr. Snuffleupagus at SemEval-2025 Task 4: Unlearning Factual Knowledge from LLMs Using Adaptive RMU [0.0] 大規模言語モデル(LLM)は、自然言語の理解と生成において顕著な能力を示した。
トレーニングデータを記憶する傾向は、プライバシ、著作権コンプライアンス、セキュリティに関する懸念を提起する。
本研究では,LLMからの機密情報を学習するために適応表現ミスディレクテーション・アンラーニング(RMU)技術を適用する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:06:44 GMT)
MonoSOWA: Scalable monocular 3D Object detector Without human Annotations [0.0] 本稿では,ドメイン固有のアノテーションを使わずに,単一のRGBカメラから3Dオブジェクト検出器をトレーニングする方法を提案する。
この手法は3つの公開データセットで評価され、人間のラベルを使わずに、先行研究よりもかなりの差で性能が向上する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:30:04 GMT)
Mixed-Signal Quantum Circuit Design for Option Pricing Using Design Compiler [0.0] 本稿では3つの新しい手法を取り入れた混合信号量子回路フレームワークを提案する。
JP Morganのオプション価格回路と比較した12 qubit のケーススタディにおいて,ゲート数を 4095 から 392 に削減した。
我々の設計はアナログの単純さとデジタルの柔軟性と合成性を組み合わせることで、量子回路が古典的なVLSI技術を効果的に活用できることを実証している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:38:18 GMT)
Metainformation in Quantum Guessing Games [0.0] この研究はミーテン情報の概念を導入している。
たとえまだ提供されていないとしても、特定のタイプの追加のサイド情報が後で利用可能になることは知識である。
以上の結果から, 達成可能な成功確率は, 事前測定側情報と同じくらい有用となる点まで向上できることが示された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:36:33 GMT)
Memory effects in a dynamical decoupling process by parity kicks [0.0] 各キックが制御されていないシステムの動的マップと通勤すると、制御によってもたらされる最終状態の変化は、制御のないメモリ効果の強みの和(差)によって上(下)に制限される。
その結果, ある条件下では, 制御による制御の効果や性能の向上は, 制御の有無に関わらず, 記憶効果の強さに比例することが示唆された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:53:53 GMT)
Measuring (a Sufficient) World Model in LLMs: A Variance Decomposition Framework [0.0] 本研究では,大言語モデル (LLM) が世界モデルを持つかどうかを評価するための形式的枠組みを提案する。
本稿では,ユーザの目的による変動性,ユーザの調音性,モデルの不安定性の3つのコンポーネントに,モデル応答の可変性を測定するための新しい評価手法を提案する。
以上の結果から,より大きなモデルでは,ユーザ目的の変化による出力変動が大きく,より堅牢な世界モデルであることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:19:18 GMT)
Matrix systems, algebras, and open maps [0.0] M_n$ のすべての *-部分代数に対する制限は開であることを示す。
これは行列理論と量子情報理論における位相問題を簡単にする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:02:45 GMT)
Loss of integrability in a system with two-photon interactions [0.0] 2光子ディックモデル(Dicke model)に焦点をあてる。
2光子ディックモデルにおける積分可能性の喪失について、量子診断と古典診断の両方を用いて検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:00:02 GMT)
Logical Noise Bias in Magic State Injection [0.0] 物理レベルでの偏りのないノイズであっても、重要な位相(Z$)バイアスが論理ノイズにどのように生じるかを示す。
我々は,この論理的雑音バイアスの大きさについて検討した回路において,雑音誤差補正回路を鍵制限因子として同定した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:50:46 GMT)
Lindblad dynamics of open multi-mode bosonic systems: Algebra of bilinear superoperators, exceptional points and speed of evolution [0.0] 行列に付随する左超作用素と右超作用素の二次結合のリー代数に基づく手法を開発する。
本手法は, スーパープロパゲータの低温近似を導出し, フォトニック偏光モードを表す2モード系の特別な場合について検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:48:39 GMT)
Levitodynamics: An analysis of quantum fluctuations based on stochastic mechanics [0.0] マグリニらによる最近の研究成果(Nature 595-373-377(2021年))を再現した。
カルマンフィルタを用いた量子最適制御に基づいて報告された位相空間力学はコヒーレント状態の概念を用いて理解することができる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:54:10 GMT)
Leveraging CNN and IoT for Effective E-Waste Management [0.0] 不適切な処理とe-wasteの不十分なリサイクルは、深刻な環境・健康リスクをもたらす。
本稿では,電子廃棄物の識別,分類,ルーティングを向上させるために,IoT対応システムと軽量CNNベースの分類パイプラインを組み合わせることを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:19:15 GMT)
Large Language Models for Spreadsheets: Benchmarking Progress and Evaluating Performance with FLARE [0.0] 大規模言語モデル(LLM)は、様々な領域にまたがるいくつかの重要な機能を示している。
本研究では,スプレッドシート機能の実行において,LLMをリードする性能を評価するためのベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 03:47:38 GMT)
LLMs in Coding and their Impact on the Commercial Software Engineering Landscape [0.0] 大規模言語モデルコーディングツールは現在、ソフトウェア工学において主流となっている。
しかし、こうしたツールが人間の努力を開発スタックに移すにつれ、新たな危険が生じます。
企業はすべてのAI生成コードにタグを付け、レビューする必要がある、と私たちは主張する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:43:54 GMT)
It is high time we let go of the Mersenne Twister [0.0] Mersenne Twisterは、Cコンパイラ、Python言語、Maple数学計算システムにおいてデフォルトのジェネレータである。
本稿は、非特殊主義者を対象に、これらの結果を調査し、新しい、単純で、理解可能な例を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:49:39 GMT)
Interventions Against Machine-Assisted Statistical Discrimination [0.0] 私は、人間ではなく、機械学習によって生成されるような、検証可能な信念によって引き起こされる統計的差別を研究します。
信念が検証可能であれば、統計的差別に対する介入は、肯定的な行動のようなシンプルで信条のないデザインを超えることができる。
各種統計バイアスを示す訓練データであっても, 平衡統計偏差の除去には有効であることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:13:41 GMT)
Integrating Dynamical Systems Learning with Foundational Models: A Meta-Evolutionary AI Framework for Clinical Trials [0.0] NetraAIは、小さな臨床試験データセットの安定性と解釈性のために設計されたシステムベースのフレームワークである。
我々はNetraAIの基礎を定式化し、収縮マッピング、情報幾何学、進化的アルゴリズムを組み合わせて予測的患者コホートを同定する。
信頼できる説明可能な知識を優先することによって、NetraAIは、臨床発見を加速するために、適応的で自己反射的なAIの新しい世代を提供する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:50:01 GMT)
Improvement of Nuclide Detection through Graph Spectroscopic Analysis Framework and its Application to Nuclear Facility Upset Detection [0.0] 分光放射検出器を用いた放射性核種の検出限界と検出された各放射量子の到着時間を改善する方法を提案する。
本稿では,核施設からのセシウムの脱離検出方法について述べる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:06:10 GMT)
Improved Intelligibility of Dysarthric Speech using Conditional Flow Matching [0.0] 失語症(Dysarthria)は、言語機能障害の1つ。
これにより、頑健な顎関節-正則音声変換技術の開発が必要とされる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:24:17 GMT)
Human-like Forgetting Curves in Deep Neural Networks [0.0] この研究は、人工モデルが人間のような忘れ曲線を示すかどうかを調べることによって、認知科学とニューラルネットワークの設計を橋渡しする。
ニューラルネットワークにおける情報保持度を測定するための定量的枠組みを提案する。
提案手法は,ネットワークの現在の隠蔽状態と以前に格納されたプロトタイプ表現との類似性を評価することで,リコール確率を算出する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:04:13 GMT)
HausaNLP at SemEval-2025 Task 11: Advancing Hausa Text-based Emotion Detection [0.0] 本稿では,低リソースのアフリカ系言語であるHausaにおけるマルチラベル感情検出へのアプローチについて述べる。
アフリカの言語で事前訓練されたトランスフォーマーベースのモデルであるAfriBERTaを微調整して、Hausaテキストを怒り、嫌悪感、恐怖、喜び、悲しみ、驚きの6つの感情に分類しました。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:19:35 GMT)
Harnessing omnipresent oscillator networks as computational resource [0.0] 本稿では,オシレータネットワークを計算資源として活用するための普遍的なフレームワークを提案する。
そこで我々は,倉本モデルに非線形目標系を強制し,目標系を訓練されたフィードバックループで置換した後,対象系をエミュレートする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 12:52:37 GMT)
Harmonizing Safety and Speed: A Human-Algorithm Approach to Enhance the FDA's Medical Device Clearance Policy [0.0] 我々は、FDAが510(k)医療機器のクリアランスプロセスを改善するために、人間とアルゴリズムを組み合わせたアプローチを開発した。
まず,510(k)医療機器のリコールリスクを推定する機械学習手法を開発した。
次に、FDAの委員会への承認、拒絶、延期を推奨するデータ駆動クリアランス政策を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 21:50:48 GMT)
Hallucination Level of Artificial Intelligence Whisperer: Case Speech Recognizing Pantterinousut Rap Song [0.0] 私たちは、フィンランドのラップ曲をテキストに翻訳する、楽しいが難しい試みにAIを投入しています。
フィンランドのラップ歌詞は、主人公の弟であるマクティモが書いたものである。
歌詞の書き起こしは、シンティカ・ヤンヌ(Syntikka Janne)のシンセサイザー音楽プレーヤーを強姦しているため、難しいだろう。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:46:58 GMT)
From Generation to Adaptation: Comparing AI-Assisted Strategies in High School Programming Education [0.0] このケーススタディでは、LCA支援プログラミングにおける2つの対照的な教育的アプローチについて検討した。
学生はLCAを使用して抽象仕様からコードを生成し、たった20%のMVP完了を達成した。
フェーズ2では、学生はLCAを使用して、既存の最小機能ユニット(MFU)、小さな、機能的なコード例を適応し、100%MVPの完成を達成した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 01:46:57 GMT)
Explainable Rule Application via Structured Prompting: A Neural-Symbolic Approach [0.0] 大規模言語モデル(LLM)は複雑な推論タスクでは優れているが、一貫性のあるルールアプリケーション、例外処理、説明可能性に苦慮している。
本稿では、推論を3つの検証可能なステップ(エンティティ識別、プロパティ抽出、シンボリックルール適用)に分解する構造化プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:14:01 GMT)
Exoplanet Classification through Vision Transformers with Temporal Image Analysis [0.0] 我々は、NASAのケプラーミッションからグラミアン・Angular Fields(GAF)とRecurrence Plots(RP)に生光曲線データを変換する手法を提案する。
これらの変換されたイメージはビジョントランスフォーマー(ViT)モデルへの入力として機能し、複雑な時間的依存関係をキャプチャする能力を活用する。
モデルの性能を5倍のクロスバリデーション手法を用いてリコール,精度,F1スコアの指標を用いて評価し,モデルの性能のロバストな推定値を得る。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:57:17 GMT)
Enhancing Mathematical Reasoning in Large Language Models with Self-Consistency-Based Hallucination Detection [0.0] 数学的推論の信頼性を高めるために,構造化自己整合性フレームワークを導入する。
本手法は,中間ステップと最終出力の自己整合性を強制し,論理的不整合や幻覚を低減させる。
実験の結果,SCは証明精度,記号的推論精度,数値安定性を著しく向上することがわかった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:27:36 GMT)
Enhanced microscale NMR spectroscopy of low-gyromagnetic ratio nuclei via hydrogen transfer [0.0] NV中心を用いた低磁気比核における微小スケールでの化学シフトとJカップリングを検出する方法を提案する。
提案プロトコルは,13ドルCを含むシナリオに対して,1桁以上の感度向上を実現し,より低いジャイロ磁気比を持つ原子核の感度向上を実現している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:17:01 GMT)
Enhanced Dermatology Image Quality Assessment via Cross-Domain Training [0.0] テレダーマトロジーでは、画像の粗悪さは未解決の問題のままである。
皮膚科学における画像品質評価(IQA)の研究は少ない。
皮膚科と非皮膚科のIQAデータセットを組み合わせたIQAモデルのクロスドメイントレーニングを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:07:06 GMT)
Efficient Transformations in Deep Learning Convolutional Neural Networks [0.0] 本研究では、画像分類のためのResNet50畳み込みニューラルネットワーク(CNN)モデルにおける信号処理変換の統合について検討する。
実験の結果、WHTを組み込むことでエネルギー消費量が大幅に削減され、精度が向上した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:54:59 GMT)
Effects of acceleration on interatomic interactions [0.0] 加速が2つの基底状態原子間の相互作用にどのように影響するかを考察する。
加速と原子間分離に対する各成分の依存性は一般的に異なる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:54:43 GMT)
Effect of linear and nonlinear coupling processes on correlation properties of bosonic modes [0.0] 2つのボゾンモードからなる系の相関特性に及ぼす線形および非線形結合過程の影響について検討した。
与えられた結合の種類が一階相関の生成の原因となる状況について検討する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 13:21:43 GMT)
Discovery of entanglement generation by elastic collision to realise the original Einstein-Podolsky-Rosen thought experiment [0.0] 1935年、アルベルト・アインシュタイン、ボリス・ポドルスキー、ネイサン・ローゼンによる思考実験で「絡み合いの驚くべき量子効果」が発見された。
私は、この方法の概要を述べています。EPRのアイデアは、この方法では一度もテストされていません。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:41:29 GMT)
Dimensionality Reduction on IoT Monitoring Data of Smart Building for Energy Consumption Forecasting [0.0] 本研究は、環境・エネルギー消費センサを用いて、小さなスマートオフィスを監視するパイロットIoTネットワークから取得したデータの相関分析に焦点を当てる。
研究の動機は、機械学習(ML)予測アルゴリズムを入力パラメータのエネルギー消費削減に利用できるようにする監視変数間の統計的相関を見出すことであった。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:29:35 GMT)
Detection of twisted radiowaves with Rydberg atoms [0.0] 構造された電磁波の存在下でのアルカリ原子の外部電子について述べる。
Rydberg-atom-based detector of twisted radiowaves の2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:42:53 GMT)
Design of Advanced Readout and System-on-Chip Analog Circuits for Quantum Chip [0.0] 我々は4量子ビット超伝導チップと新しいパラメトリック増幅器を統合した先進的な量子リードアウトアーキテクチャを設計する。
従来の手法とは異なり、Purcellフィルタのようなコンポーネントは不要である。
デザインは、Cバンドにまたがって調整されたゲインプロファイルが特徴で、鋭いピーク(24dB)とトラフ(0dB)がある。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:36:57 GMT)
Deep learning joint extremes of metocean variables using the SPAR model [0.0] 本稿では,メトカン変数の多変量結合極値推定のための新しいディープラーニングフレームワークを提案する。
Semi-Parametric Angular-Radial (SPAR)モデルに基づいている。
5つのメトカン変数のケーススタディを用いて, この手法を高次元に適用する方法を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:11:18 GMT)
Deceptive Humor: A Synthetic Multilingual Benchmark Dataset for Bridging Fabricated Claims with Humorous Content [0.0] 提案するDeceptive Humor データセット (DHD) は, 偽造クレームから得られたユーモアを注入したコメントの集合である。
それぞれのエントリーには、Satire Level(微妙な風刺は1からオーバート風刺は3まで)とラベルが付けられ、5つのユーモアタイプに分類される。
データセットは英語、テルグ語、ヒンディー語、カンナダ語、タミル語、およびそれらのコードミキシング形式にまたがっており、多言語分析に有用なリソースとなっている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 06:50:49 GMT)
Critical Limitations in Quantum-Selected Configuration Interaction Methods [0.0] 我々はQSCI法が化学における実用性を著しく阻害する限界に直面していることを示す。
QSCIは原則として、高品質な構成相互作用(CI)の拡張を得られるが、新しい決定因子を見つけるのに非効率に苦しむことを示す。
これはQSCIがより効率的で古典的な応用に遅れているため、量子化学の応用において有用性を妨げている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:32:45 GMT)
Controlling photon-magnon coupling using another magnon [0.0] 平面ヘキサゴナルリング共振器上に配置されたYIGとNiFe薄膜の光子を介するマグノン-マグノン結合について検討した。
磁気膜間の直接双極子相互作用がない場合に、マグノン-マグノン相互作用の明確なシグネチャを観察する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:50:59 GMT)
Collisional charging of a transmon quantum battery [0.0] トランスモン状態の超伝導回路に基づく非調和レベルの間隔を持つエネルギー貯蔵用量子デバイスのモデルを提案する。
これは、同一および独立の2段階系の集合との逐次的相互作用によって充電される。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 09:50:49 GMT)
Coherent control over the high-dimensional space of the nuclear spin of alkaline-earth atoms [0.0] 我々は超低温ストロンチウム87原子の核自由度のコヒーレントな操作を示す。
我々は、対応する大きなヒルベルト空間を量子資源として完全に活用するためのツールキットを提供する。
本稿では,3秒後に測定可能なデコヒーレンスを伴わない孤立したゼーマン状態を含むラムゼー干渉計を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:23:44 GMT)
Classification of Cattle Behavior and Detection of Heat (Estrus) using Sensor Data [0.0] 我々は、加速度計とジャイロセンサーを備えた安価なBluetoothベースの首首首輪を設計、展開し、実際の牛のリアルタイム行動データを収集した。
ラベル付きデータセットは、同期されたCCTV映像を使用して作成され、フィード、ルミネーション、嘘などの振る舞いに注釈を付ける。
実験では,93%以上の行動分類精度,96%のエストラス検出精度が得られた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:00:23 GMT)
ChatDBG: Augmenting Debugging with Large Language Models [0.0] ChatDBGはプログラマがデバッガとの共同対話を行うことを可能にする。
根本原因を分析し、バグを説明し、広範囲の現実世界のエラーに対する正確な修正を生成することができる。
ChatDBGは急速に普及しており、すでに75,000回以上ダウンロードされている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:23:11 GMT)
Can structural correspondences ground real world representational content in Large Language Models? [0.0] LLMと世界的実体の間の構造的対応の存在は、それらの実体の接地表現には不十分である、と私は論じる。
LLMのテキストバウンドネスは、適切なタスクへの関与を防ぐために、その面に現れます。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 14:48:40 GMT)
CLOUD: A Scalable and Physics-Informed Foundation Model for Crystal Representation Learning [0.0] CLOUD(Crystal Language mOdel for Unified and Differentiable Materials Modeling)は,新しいSCOPE(Symmetry-Consistent SCOPE)をトレーニングしたトランスフォーマーベースのフレームワークである。
CLOUDは600万以上の結晶構造で事前訓練されており、幅広い材料特性を予測する上での競争性能を達成する。
異種材料モデリングの概念の証明として, フォノン内部エネルギーと熱容量の予測にCLOUDを適用した。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:45:24 GMT)
CLIP-MG: Guiding Semantic Attention with Skeletal Pose Features and RGB Data for Micro-Gesture Recognition on the iMiGUE Dataset [0.0] マイクロジェスチャ認識のためのCLIP(Pose-Guided Semantics-Aware CLIP-based Architecture)を提案する。
CLIP-MGは、iMiGUEデータセット上でのマイクロジェスチャ分類に適した修正CLIPモデルである。
提案モデルでは,Top-1の精度が61.82%である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 15:16:06 GMT)
Bhatt Conjectures: On Necessary-But-Not-Sufficient Benchmark Tautology for Human Like Reasoning [0.0] Bhatt Conjecturesフレームワークは、AI推論と理解を評価するための厳密で階層的なベンチマークを導入している。
Agentreasoning-sdkは実践的な実装を示し、現在のAIモデルが複雑な推論タスクに苦労していることを明らかにする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:27:58 GMT)
Beyond Prediction -- Structuring Epistemic Integrity in Artificial Reasoning Systems [0.0] 構造的推論、命題的コミットメント、矛盾検出をサポートする。
信念表現、メタ認知プロセス、規範的検証を形式化し、象徴的推論、知識グラフ、ブロックチェーンベースの正当化を統合する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:20:55 GMT)
Bayesian Epistemology with Weighted Authority: A Formal Architecture for Truth-Promoting Autonomous Scientific Reasoning [0.0] 本稿では,ベイジアン・エピステロジーとウェイト・オーソリティ(BEWA)を紹介する。
BEWAは、構造化された科学的主張に対する動的で確率論的に一貫性のある関数としての信念を運用している。
グラフベースのクレーム伝搬、権威的信頼性モデリング、暗号化アンカー、ゼロ知識監査検証をサポートする。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 04:22:35 GMT)
Batayan: A Filipino NLP benchmark for evaluating Large Language Models [0.0] バタヤンは8つのタスクを統合し、そのうち3つはフィリピンのコーパスの前には存在していなかった。
フィリピンの複雑な形態的・構文的構造に対して,我々の厳密でネイティブな話者主導の適応と検証プロセスは,流布と信頼性を保証する。
表現不足言語に文化的・言語的に忠実な資源を構築するための原則的ソリューションを提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 08:30:50 GMT)
Band engineering aided by topological edge state proximity effects: Inducing anti-chirality in graphene [0.0] 隣り合う領域からのエッジ状態間の近接がバンド構造をどう変えるかを示す。
バルク状の分散を伴うトポロジカルエッジ状態の共存は、反キラリティの出現につながる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:25:07 GMT)
Automated Energy Billing with Blockchain and the Prophet Forecasting Model: A Holistic Approach [0.0] 提案方式は,Wi-Fi対応のESP32モジュールとモバイルアプリケーションインタフェースを用いたリアルタイム電力消費モニタリングを容易にする。
セキュアで透明な請求処理のためにブロックチェーンを統合し、自動支払いのためにスマートコントラクトを採用する。
Prophetモデルは、予測精度を向上させるために、慎重にデータ前処理、変換、パラメータチューニングを行うエネルギー需要予測に使用される。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 23:26:36 GMT)
AutomataGPT: Forecasting and Ruleset Inference for Two-Dimensional Cellular Automata [0.0] 約100万の擬似軌道上で事前訓練されたデコーダのみの変換器であるAutomataPTを提案する。
最大96%の関数的(アプリケーション)精度と82%の正確なルール行列マッチングで、ガバナンス更新ルールを再構築する。
トランスフォーマーモデルがデータのみからCAダイナミクスを忠実に推論し実行できることを示すことによって、我々の研究は現実世界の力学現象をデータ効率のCAサロゲートに抽象化する基礎となる。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 05:54:08 GMT)
AndroIDS : Android-based Intrusion Detection System using Federated Learning [0.0] 本稿では,AndroIDSという,統合学習に基づく侵入検知フレームワークを提案する。
システムコールトレースをパーソナライズされたプライバシ保護データソースとして使用する。
精度は96.46 %、92.87 %、F1 スコアは89 %、86 %である。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:42:02 GMT)
An unholy trinity: TFNP, polynomial systems, and the quantum satisfiability problem [0.0] 複素系の研究に基づいて, 完全関数NP (TFNP) の2つの新しいサブクラスを定義する。
我々の研究の中心は、SDR(System of Distinct Representatives)を用いた量子SAT(Quantum SAT)として知られる計算問題である。
本稿では, SFTA がゼロエラー版 SDR に含まれることから, 疎度・高次複雑さの根源を SDR で QSAT に埋め込む方法を示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:46:53 GMT)
An introduction to Causal Modelling [0.0] このチュートリアルは、潜在的な結果とグラフィカルな手法を統合することで、現代的な因果モデリングの簡潔な紹介を提供する。
明確な表記法、直観的な説明、応用研究者の実践例に重点を置いている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:29:09 GMT)
An efficient neuromorphic approach for collision avoidance combining Stack-CNN with event cameras [0.0] 本研究は,イベントベースカメラを用いた革新的な衝突回避システムを提案する。
このシステムはStack-CNNアルゴリズム(以前は隕石検出に使用されていた)を使用して、リアルタイムのイベントベースのカメラデータを分析して、かすかに動く物体を検出する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 16:15:05 GMT)
An Approach Towards Identifying Bangladeshi Leaf Diseases through Transfer Learning and XAI [0.0] 本研究の目的は,深層学習モデルを用いて6植物に21の異なる葉病を分類することである。
VGG19とXceptionは、それぞれ98.90%と98.66%という高い精度を達成している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 19:07:13 GMT)
All Or Nothing: No-Downfolding Theorems For Quantum Simulation [0.0] 非自明なハミルトニアン $mathbfH(x)equivmathbfA+xmathbfB$ に対して、正確な量子ダウンフォールディングは不可能であることを示す。
低次元有効ハミルトニアン $mathbfh(x)equivmathbfa+xmathbfb$ は固有値関数 $E_i(x)$ of $mathbfH(x)$ を正確に回復することができない。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 18:25:46 GMT)
Advancing atomic electron tomography with neural networks [0.0] 原子電子トモグラフィー(AET)は、ピコメーターレベルの精度で非破壊的な原子イメージングを提供する。
近年の進歩は、深層学習、特に畳み込みニューラルネットワークをAETに統合し、再構築の忠実性を改善している。
このレビューは、ニューラルネットワーク支援AETの最近の進歩を強調し、3D原子画像における永続的な課題を克服する上での役割を強調している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 07:54:07 GMT)
Advancing Harmful Content Detection in Organizational Research: Integrating Large Language Models with Elo Rating System [0.0] 大規模言語モデル(LLM)は、組織研究に有望な機会を提供する。
彼らの内蔵モデレーションシステムは、研究者が有害なコンテンツを分析しようとすると、問題を引き起こす可能性がある。
本稿では,有害コンテンツ分析のためのLCM性能を大幅に向上するElo評価手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:01:12 GMT)
Advanced Game-Theoretic Frameworks for Multi-Agent AI Challenges: A 2025 Outlook [0.0] 我々は、複雑な環境でマルチエージェントAIシステムがどのように適応し交渉するかを示す数学的フォーマリズム、シミュレーション、コーディングスキームのセットを提供する。
この研究は、不確実で部分的に敵対的な文脈における戦略的相互作用を整合させる、堅牢な理論的ツールをAI研究者に提供することを目的としている。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 17:26:03 GMT)
AI-Driven Tools in Modern Software Quality Assurance: An Assessment of Benefits, Challenges, and Future Directions [0.0] この研究は、現代のAI指向ツールを品質保証プロセスに統合するメリット、課題、および展望を評価することを目的としている。
この研究は、AIがQAに変革をもたらす可能性を実証しているが、これらの技術を実装するための戦略的アプローチの重要性を強調している。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 20:22:47 GMT)
AI labeling reduces the perceived accuracy of online content but has limited broader effects [0.0] 提案する公開ポリシーに関するニュース記事の明示的なAIラベル付けは,その認識精度を低下させることを示す。
AIラベリングはポリシーへの関心を減少させるが、ポリシーへの支持に影響せず、オンラインの誤情報に対する一般的な懸念も引き起こさない。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 10:32:52 GMT)
AI is the Strategy: From Agentic AI to Autonomous Business Models onto Strategy in the Age of AI [0.0] 私たちは現在、エージェントAIが価値創造、デリバリ、キャプチャのコアメカニズムを実行することができる段階に入りつつある、と論じています。
このシフトは、AIを戦略をサポートするツールではなく、戦略そのものとして再編成する。
ABMがエージェント実行、継続的適応、段階的な人的意思決定のオフロードを通じて、競争上の優位性をいかに作り直すかを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 11:11:06 GMT)
A Vietnamese Dataset for Text Segmentation and Multiple Choices Reading Comprehension [0.0] ベトナム語は1億2200万人以上の母語話者を持つ20番目の言語である。
データセットにはテキストセグメンテーションのための15,942の文書と16,347の合成多重選択質問応答ペアが含まれている。
実験の結果、mBERT は両タスクにおける単言語モデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 02:53:24 GMT)
A Qubit as a Bridge Between Statistical Mechanics and Quantum Dynamics [0.0] この研究は、最も単純な量子系である量子ビットを基礎モデルとして調べることで、熱平衡と量子力学の統一的な視点を示す。
熱分割関数とLoschmidt振幅の両方を複素平面の異なる経路に沿った1つの解析関数の拡張として解釈できることを示す。
論文参考訳(メタデータ) (Thu, 19 Jun 2025 00:18:38 GMT)