Dynamic Context-oriented Decomposition for Task-aware Low-rank Adaptation with Less Forgetting and Faster Convergence [131.4] タスク認識方式でアダプタを初期化する新しい手法であるコンテキスト指向分解適応(CorDA)を提案する。
本手法は,タスク認識により,知識保存モード (KPM) と命令レビューモード (IPM) の2つのオプション適応モードを実現する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:55:14 GMT)
Discrete Audio Tokens: More Than a Survey! [107.7] 本稿では,離散型音声トークンの体系的レビューとベンチマークを行う。
音声、音楽、一般的なオーディオドメインをカバーしている。
本稿では,エンコーダデコーダ,量子化技術,トレーニングパラダイム,ストリーム性,アプリケーションドメインに基づくトークン化アプローチの分類法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:38:29 GMT)
Bayesian Neural Scaling Law Extrapolation with Prior-Data Fitted Networks [100.1] スケーリング法則は、しばしばパワーローに従っており、より大きなスケールでのスケーリングの振る舞いを予測するために、パワーロー関数のいくつかの変種を提案した。
既存の手法は主に点推定に依存しており、現実のアプリケーションにとって欠かせない不確実性を定量化しない。
本研究では,ニューラルスケーリング法外挿のためのPFNに基づくベイズフレームワークについて検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:34:25 GMT)
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention [90.7] MiniMax-M1は、オープンウェイトで大規模なハイブリッドアテンション推論モデルである。
コンテクストの長さは100万トークンで、DeepSeek R1のコンテクストサイズは8倍だ。
MiniMax-M1は大規模強化学習を用いて訓練されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:08:02 GMT)
MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation [89.7] MultiFinBenは、グローバルファイナンシャルドメインに合わせた最初のマルチリンガルおよびマルチモーダルベンチマークである。
我々は,最初のOCR組み込み財務QAタスクである EnglishOCR と SpanishOCR の2つの新しいタスクを紹介する。
本稿では,動的で難易度の高い選択機構を提案し,コンパクトでバランスの取れたベンチマークをキュレートする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:01:49 GMT)
UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions [88.7] ビデオアプリケーションへの需要は、高品質なビデオ生成モデルにより高い要求を課す。
我々はまず,高品質なUHD-4Kテキスト・ビデオ・データセットUltraVideoを提案する。
各ビデオには9つの構成キャプションと1つの要約キャプション(平均824語)がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:52:52 GMT)
T-SVG: Text-Driven Stereoscopic Video Generation [87.6] 本稿では,テキスト駆動ステレオビデオ生成(T-SVG)システムを紹介する。
テキストプロンプトを使用してビデオ生成を合理化し、参照ビデオを作成する。
これらのビデオは、3Dポイントのクラウドシーケンスに変換され、微妙なパララックス差のある2つの視点からレンダリングされる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:18:30 GMT)
Omni-AdaVideoRAG: Omni-Contextual Adaptive Retrieval-Augmented for Efficient Long Video Understanding [73.6] AdaVideoRAGは、軽量なインテント分類器を使用して、クエリ複雑性に基づいた検索に適応する新しいフレームワークである。
我々のフレームワークは、Omni-Knowledge Indexingモジュールを使用して、テキスト(キャプション、ASR、OCR)、視覚的特徴、セマンティックグラフから階層データベースを構築する。
実験では、既存のMLLMにシームレスに統合することで、長時間ビデオ理解のための効率と精度の向上が示されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:18:15 GMT)
SoK: Advances and Open Problems in Web Tracking [71.5] Webトラッキングは、パーソナライズされた広告とコンバージョン追跡を可能にする、広範かつ不透明なプラクティスである。
Webトラッキングは、広告業界の変化、ブラウザによるアンチトラッキング対策の導入、新たなプライバシー規制の実施などによって、かつての世代の変革が進んでいる。
このシステム化・オブ・ナレッジ(SoK)は、この幅広い研究を統合することを目的としており、近代的で急速に進化するWebトラッキングのランドスケープを形成するための技術的なメカニズム、対策、および規制の包括的概要を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:30:54 GMT)
IGD: Token Decisiveness Modeling via Information Gain in LLMs for Personalized Recommendation [70.3] 我々は,トークン決定性をチューニングと復号の両方に統合する情報ゲインに基づく決定性対応トークンハンドリング(IGD)戦略を導入する。
IGDはリコメンデーションの精度を一貫して改善し、強力なベースラインに比べて広く使われているランキングの指標で顕著に向上した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:28:19 GMT)
Intra-Trajectory Consistency for Reward Modeling [67.8] 軌道内整合性正則化を開発し、より高い次トーケン生成確率を持つプロセスがより一貫した報酬を維持することを強制する。
提案した正規化でトレーニングした報酬モデルにより、より優れたDPO整合ポリシーが導出され、より優れたベスト・オブ・N(BON)検証結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:03:11 GMT)
SuperDisco: Super-Class Discovery Improves Visual Recognition for the Long-Tail [67.8] 我々は,長い尾の認識のための超クラス表現を発見するアルゴリズムであるSuperDiscoを提案する。
我々は,長期分布を扱うための表現学習を指導するために,超クラスグラフを構築することを学ぶ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:55:33 GMT)
SeqPE: Transformer with Sequential Position Encoding [67.8] SeqPEは、各$n$次元位置指数をシンボルシーケンスとして表現し、軽量なシーケンシャル位置エンコーダを用いて埋め込みを学習する。
言語モデリング、長文質問応答、および2次元画像分類による実験により、SeqPEはパープレキシティ、正確なマッチング(EM)、精度の強いベースラインを超えるだけでなく、手作業によるアーキテクチャ再設計を必要とせず、多次元入力へのシームレスな一般化を可能にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:16:40 GMT)
An Interdisciplinary Approach to Human-Centered Machine Translation [67.7] 機械翻訳(MT)ツールは現在、プロの翻訳者がいない状況で広く使われている。
MT技術の進歩にもかかわらず、システム開発と実世界の利用の間にはギャップが持続している。
本稿では,システム設計と多様なコミュニケーション目標の整合性を強調し,MTに対する人間中心のアプローチを提唱する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:27:44 GMT)
Agentic 3D Scene Generation with Spatially Contextualized VLMs [67.3] 本稿では,複雑な3D環境の生成,理解,編集を可能にする新しいパラダイムを提案する。
我々は,VLMが空間コンテキストから反復的に読み取って更新するエージェント型3Dシーン生成パイプラインを開発した。
その結果,我々のフレームワークは多様かつ困難な入力を処理でき,事前の作業では観測できないような一般化のレベルを達成することができることがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:42:37 GMT)
Lightweight Task-Oriented Semantic Communication Empowered by Large-Scale AI Models [66.6] 大規模人工知能(LAI)モデルは、リアルタイム通信シナリオにおいて重大な課題を提起する。
本稿では,LAIモデルから知識を抽出・凝縮するために知識蒸留(KD)技術を活用することを提案する。
本稿では,反復推論の必要性を排除したプレストア圧縮機構を備えた高速蒸留法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:42:16 GMT)
Whenever, Wherever: Towards Orchestrating Crowd Simulations with Spatio-Temporal Spawn Dynamics [65.7] ニューラル・テンポラル・ポイント・プロセスを用いて生成時間生成ダイナミクスをモデル化するnTPP-GMMを提案する。
我々は,nTPP-GMMを用いた3つの実世界のデータセットのシミュレーションによるアプローチの評価を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:26:43 GMT)
DeSPITE: Exploring Contrastive Deep Skeleton-Pointcloud-IMU-Text Embeddings for Advanced Point Cloud Human Activity Understanding [65.7] DeSPITEはDeep Skeleton-Pointcloud-IMU-Text Embeddingモデルである。
MSR-Action3D と HMPEAR の実験により,DeSPITE は点雲 HAR に対する効果的な事前学習戦略であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:18:44 GMT)
Multipole Attention for Efficient Long Context Reasoning [64.9] 大規模推論モデル (LRM) は複雑な問題解決タスクにおいて有望な精度の向上を示す。
LRMは、答える前に考えるために、長い連鎖推論を生成する必要がある。
本稿では,重要なトークンに対してのみ正確に注意を払うことで,自己回帰推論を高速化するマルチポール注意法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:00:40 GMT)
AlphaEvolve: A coding agent for scientific and algorithmic discovery [63.1] 我々は,最先端LLMの能力を大幅に向上させる進化的符号化エージェントAlphaEvolveを提案する。
AlphaEvolveはLLMの自律パイプラインを編成し、そのタスクはコードを直接変更することでアルゴリズムを改善することである。
本稿では,多くの重要な計算問題に適用することで,このアプローチの広範な適用性を実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:37:18 GMT)
Regret Minimization and Convergence to Equilibria in General-sum Markov Games [61.7] 汎用マルコフゲームにおいて,全てのエージェントが実行した場合のサブ線形後悔保証を提供する学習アルゴリズムを初めて提示する。
我々のアルゴリズムは分散化され、計算効率が良く、エージェント間の通信は不要である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:11:45 GMT)
KEPLA: A Knowledge-Enhanced Deep Learning Framework for Accurate Protein-Ligand Binding Affinity Prediction [60.2] 我々は遺伝子オントロジーとタンパク質の性質から事前知識を統合する新しいディープラーニングフレームワークKEPLAを提案する。
2つのベンチマークデータセットの実験では、KEPLAは一貫して最先端のベースラインを上回っている。
さらに、知識グラフ関係と横断的注意マップに基づく解釈可能性分析は、基礎となる予測メカニズムに関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:02:42 GMT)
Screen Hijack: Visual Poisoning of VLM Agents in Mobile Environments [60.0] GHOSTは視覚言語モデル(VLM)上に構築された移動体エージェントに特化して設計された最初のクリーンラベルバックドア攻撃である。
本手法は,トレーニングサンプルの一部の視覚入力のみを,対応するラベルや指示を変更することなく操作する。
実世界の6つのAndroidアプリとモバイルに適応した3つのVLMアーキテクチャを対象に,本手法の評価を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:09:32 GMT)
Train with Perturbation, Infer after Merging: A Two-Stage Framework for Continual Learning [59.7] P&M(texttext-Perturb-and-Merge)は,モデルマージをCLパラダイムに統合し,忘れることを避けるための新しい連続学習フレームワークである。
理論的解析により、全てのタスクにおける総損失増加を最小化し、最適マージ係数の解析解を導出する。
提案手法は,複数の連続学習ベンチマークデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:19:46 GMT)
Just Go Parallel: Improving the Multilingual Capabilities of Large Language Models [59.2] 大規模言語モデル(LLM)は、並列データに対して明示的に訓練されることなく、印象的な翻訳能力を実証している。
近年の研究では、トレーニングデータに付随するバイリンガル信号が原因であることが示唆されている。
多言語エンコーダベースおよびエンコーダデコーダ言語モデルの多言語能力を高めるために,並列データの有用性を最大化する様々な手法が提案されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:21:15 GMT)
Verifying the Verifiers: Unveiling Pitfalls and Potentials in Fact Verifiers [59.2] 我々は,14のファクトチェックベンチマークのサンプルを用いて,12の事前学習LDMと1つの特殊ファクト検証器を評価した。
データセットにおけるアノテーションエラーとあいまいさに対処することの重要性を強調します。
最上位のパフォーマンスを実現するために、前作でしばしば見落とされがちな、数ショットのインコンテキストの例を持つフロンティアLSM。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:32:10 GMT)
Beyond Browsing: API-Based Web Agents [58.4] APIベースのエージェントはWebArenaの実験でWebブラウザエージェントを上回っている。
ハイブリッドエージェント(Hybrid Agents)は、タスク全体にわたって、ほぼ均一にパフォーマンスを向上する。
結果から,APIが利用可能であれば,Webブラウジングのみに依存するという,魅力的な代替手段が提示されることが強く示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:23:37 GMT)
Test3R: Learning to Reconstruct 3D at Test Time [58.1] Test3Rは驚くほどシンプルなテストタイム学習技術で、幾何学的精度を大幅に向上させる。
本手法は従来の3次元再構成法や多視点深度推定法よりも優れていた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:56:22 GMT)
Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search [57.3] 大規模言語モデル(LLM)は、様々な領域にまたがる顕著な推論能力を示している。
近年の研究では、テスト時間計算の増加はLLMの推論能力を高めることが示されている。
そこで我々は,1)COAT推論形式を内部化するための小規模な形式調整段階,2)強化学習を活用した大規模自己改善段階を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:29:47 GMT)
No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need! [56.8] アクション選択の前に報酬とコストが観測される$(i)$オンラインリソース割当と、アクション選択後、完全なフィードバックや盗賊フィードバックの下で、リソース制限付きオンライン学習である$(ii)$オンラインリソース割当に焦点を当てた。
報酬とコスト分布が時間とともに任意に変化する場合、これらの設定でサブ線形後悔を達成することは不可能であることが知られている。
我々は、支出計画に従う基準線に対する半線形後悔を実現する一般的な(基本的)二重的手法を設計し、また、支出計画が予算のバランスの取れた配分を保証すると、アルゴリズムの性能が向上する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:42:31 GMT)
OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation [56.5] OPERAは、ユーザペルソナ、ブラウザの観察、きめ細かいWebアクション、そして自己報告されたジャストインタイム論理を包括的にキャプチャする最初のパブリックデータセットである。
我々は,現在のLCMがユーザの次の行動と合理的性をどの程度予測できるかを評価するための最初のベンチマークを確立する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:32:08 GMT)
Discrete Diffusion in Large Language and Multimodal Models: A Survey [56.3] 離散拡散言語モデル(dLLM)と離散拡散多モード言語モデル(dMLLM)の体系的調査を提供する。
自己回帰(AR)モデルとは異なり、dLLMとdMLLMはマルチトークンの並列デコードパラダイムを採用している。
我々は、dLLMとdMLLMの歴史的発展を辿り、基礎となる数学的枠組みを定式化し、代表モデルを分類する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:59:08 GMT)
Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.4] 上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:09:49 GMT)
Towards a Cascaded LLM Framework for Cost-effective Human-AI Decision-Making [55.2] 複数の専門分野にまたがってタスクを適応的に委譲するLLM決定フレームワークを提案する。
まず、deferral Policyは、ベースモデルの回答を受け入れるか、あるいは大きなモデルでそれを再生するかを決定する。
第2に、禁忌ポリシーは、カスケードモデル応答が十分に確実であるか、または人間の介入を必要とするかを判定する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:30:20 GMT)
RelTopo: Enhancing Relational Modeling for Driving Scene Topology Reasoning [55.2] 道路トポロジー推論は自動運転にとって重要であり、効率的なナビゲーションと交通規制の遵守を可能にする。
既存の手法は通常、レーン検出またはレーン・トゥ・レーン(L2L)のトポロジー推論(英語版)に重点を置いており、しばしばこれらのタスクを共同で最適化するためにレーン・トゥ・トラッフィック・エレメント(L2T)の関係をテキスト化している。
人間は自然に道路要素認識と接続性推論の文脈的関係を利用するので、リレーショナルモデリングは知覚と推論の両方に有益であると主張する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:40:28 GMT)
Idiosyncrasies in Large Language Models [54.3] 大規模言語モデル(LLM)における慣用句の公開と研究
LLM生成テキストへの微調整テキスト埋め込みモデルにより,優れた分類精度が得られることがわかった。
我々はLLMを審査員として利用し、各モデルの慣用句の詳細かつオープンな記述を生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:27:25 GMT)
NeuVAS: Neural Implicit Surfaces for Variational Shape Modeling [54.1] NeuVASは、スパース入力形状制御の下で拘束されたニューラル暗黙表面を用いた形状モデリングにおける変分アプローチである。
ニューラルネットワークSDFのゼロレベル設定面の形状変化を最小限に抑えるために,曲面曲率関数に基づく滑らかさ項を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:39:45 GMT)
LTRR: Learning To Rank Retrievers for LLMs [53.3] ルーティングベースのRAGシステムは、単一リトリバーベースのシステムよりも優れていることを示す。
パフォーマンス向上は、特にAnswer Correctness(AC)メトリックでトレーニングされたモデルで顕著である。
SIGIR 2025 LiveRAG チャレンジの一環として,提案システムを用いて提案手法の有効性を実証した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:53:18 GMT)
A Comprehensive Survey on Video Scene Parsing:Advances, Challenges, and Prospects [53.2] Video Scene Parsing (VSP) はコンピュータビジョンの基盤として登場した。
VSPはコンピュータビジョンの基盤として現れ、ダイナミックシーンにおける多様な視覚的実体の同時セグメンテーション、認識、追跡を容易にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:39:03 GMT)
Ego-R1: Chain-of-Tool-Thought for Ultra-Long Egocentric Video Reasoning [53.0] Ego-R1は、超長い(日数や数週間)自我中心の動画を推論するためのフレームワークである。
人間の問題解決戦略に触発されたEgo-R1は、複雑な推論をモジュラーステップに分解する。
Ego-R1は、超長大な自我中心の動画を理解するというユニークな課題に効果的に取り組むことができることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:17:08 GMT)
GS-2DGS: Geometrically Supervised 2DGS for Reflective Object Reconstruction [52.0] 2次元ガウス散乱(2DGS)に基づく反射物体に対するGS-2DGSと呼ばれる新しい再構成法を提案する。
合成および実データを用いた実験結果から,本手法はガウスの手法を再現・啓蒙の面で著しく上回っていることが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:40:16 GMT)
Random Matrix Theory for Deep Learning: Beyond Eigenvalues of Linear Models [51.9] 現代の機械学習(ML)とディープニューラルネットワーク(DNN)は高次元のデータを扱うことが多い。
特に、データ次元、サンプルサイズ、モデルパラメータの数がすべて大きな比例規則は、新しく、時には直感に反する振る舞いを引き起こす。
本稿では、線形モデルの固有値に基づく解析を超えて従来のランダム行列理論(RMT)を拡張し、非線形MLモデルによる課題に対処する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:54:08 GMT)
The Butterfly Effect: Neural Network Training Trajectories Are Highly Sensitive to Initial Conditions [51.7] たとえ小さな摂動であっても、同じ訓練軌跡を確実に引き起こすことで、トレーニング時間とともに急速に減少する効果が発散することを示します。
この結果から,ニューラルネットワークのトレーニング安定性,微調整,モデルマージ,モデルアンサンブルの多様性の実践的意味が示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:35:16 GMT)
Leveraging In-Context Learning for Language Model Agents [51.3] インコンテキスト学習(ICL)と動的に選択されたデモは、大規模言語モデル(LLM)の柔軟性と、トレーニングデータを活用してパフォーマンスを向上させる能力を組み合わせたものだ。
実演における類似タスクの軌道選択は, LLMエージェントの性能, 信頼性, 堅牢性, 効率を著しく向上させることを示す。
より大規模なモデル(アノテーションフェーズ)から得られた実演により、より小さなモデルも改善され、ICLエージェントはよりコストのかかる訓練されたエージェントと競合する可能性がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:37:49 GMT)
Dynamic Acoustic Model Architecture Optimization in Training for ASR [51.2] DMAOは、Grow-and-drop戦略を使用して、トレーニング中にパラメータを自動的に再配置するアーキテクチャ最適化フレームワークである。
CTC onSpeech, TED-Lium-v2, Switchboard を用いてDMAOの評価を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:47:34 GMT)
UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [51.0] マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。
重みベクトル w でパラメトリした線型効用関数の場合に焦点を当てる。
学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:09:59 GMT)
Taming Polysemanticity in LLMs: Provable Feature Recovery via Sparse Autoencoders [50.5] 既存のSAEトレーニングアルゴリズムは厳密な数学的保証を欠いていることが多く、実用的な制限に悩まされている。
まず,特徴の特定可能性という新たな概念を含む特徴回復問題の統計的枠組みを提案する。
本稿では、ニューラルネットワークのバイアスパラメータを適応的に調整し、適切なアクティベーション間隔を確保する手法である「バイアス適応」に基づく新たなSAEトレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:58:05 GMT)
Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures [50.1] 手術用コンピュータビジョンの応用の最近の進歩は、視覚のみのモデルによって駆動されている。
これらの手法は、固定されたオブジェクトカテゴリのセットを予測するために手動で注釈付き手術ビデオに依存する。
本研究では,オープンな外科的eラーニングプラットフォームを通じて提供される外科的ビデオ講義が,効果的な視覚と言語監督の信号を提供することができるという考えを提起した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:07:50 GMT)
Unveiling the Learning Mind of Language Models: A Cognitive Framework and Empirical Study [50.1] 大規模言語モデル(LLM)は、数学、コーディング、推論といったタスクにまたがる印象的な機能を示している。
しかし、彼らの学習能力は、動的環境に適応し、新しい知識を得るのに不可欠であり、まだ過小評価されていない。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:24:50 GMT)
LLM2Rec: Large Language Models Are Powerful Embedding Models for Sequential Recommendation [49.8] シーケンスレコメンデーションは、類似したユーザやアイテムの履歴行動から協調フィルタリング(CF)信号をモデル化することで、ユーザの将来のインタラクションを予測することを目的としている。
従来のシーケンシャルなレコメンダは、高次の共起パターンを通じてCF信号をキャプチャするIDベースの埋め込みに依存している。
大規模言語モデル(LLM)の最近の進歩は、テキスト記述からアイテム表現を導出するテキストベースのレコメンデーションアプローチを動機付けている。
理想的な埋め込みモデルは、ドメイン内およびドメイン外のレコメンデーションパフォーマンスを改善するために、CF信号とリッチなセマンティック表現をシームレスに統合すべきである、と我々は主張する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:27:06 GMT)
X-Scene: Large-Scale Driving Scene Generation with High Fidelity and Flexible Controllability [49.5] X-Sceneは大規模ドライビングシーン生成のための新しいフレームワークである。
幾何的複雑度と外観の忠実度の両方を実現し、フレキシブルな制御性を提供する。
X-Sceneは、大規模な運転シーン生成のための制御性と忠実性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:43:18 GMT)
Discovering Temporal Structure: An Overview of Hierarchical Reinforcement Learning [49.5] この研究は、意思決定における根本的な課題の観点から、HRLの利点を特定することを目的としている。
次に、オンラインエクスペリエンスからオフラインデータセットまで、HRLの時間構造を検出するメソッドのファミリーをカバーします。
最後に、時間構造発見の課題と、そのような取り組みに特に適した領域に焦点を当てる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:36:32 GMT)
Fake it till You Make it: Reward Modeling as Discriminative Prediction [49.3] GAN-RMは、手動の嗜好アノテーションと明示的な品質次元工学を排除した効率的な報酬モデリングフレームワークである。
提案手法は,少数の対象サンプルを識別し,報酬モデルを訓練する。
実験では、GAN-RMが複数の主要なアプリケーションにまたがって有効であることを実証した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:59:40 GMT)
Capability Salience Vector: Fine-grained Alignment of Loss and Capabilities for Downstream Task Scaling Law [49.3] 全体的な損失を分解し、トークンに異なる重みを割り当て、特定のメタ能力を評価する。
様々な人気のあるベンチマーク実験により、提案した能力保証ベクトルは、下流タスクにおける言語モデル性能の予測可能性を大幅に改善できることが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:16:03 GMT)
CertDW: Towards Certified Dataset Ownership Verification via Conformal Prediction [48.8] 本稿では,最初の認証データセット透かし(CertDW)とCertDWベースの認証データセットオーナシップ検証手法を提案する。
共形予測に触発されて,主確率 (PP) と透かし頑健性 (WR) の2つの統計指標を導入する。
我々は、不審モデルのWR値が、透かしのないデータセットでトレーニングされた良性モデルのPP値を大幅に上回る場合に、PPとWRの間に証明可能な低い境界が存在することを証明した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:17:23 GMT)
Learning Coherent Matrixized Representation in Latent Space for Volumetric 4D Generation [48.7] 本研究では,空間次元と時間次元をまたいだ形状と色を動的に変化させた4次元配列を生成する枠組みを提案する。
まず、コヒーレントな3次元形状と色モデリングを用いて、各3次元形状フレームの形状と色を潜在空間にエンコードする。
次に,効率的な拡散モデル演算が可能な行列化4次元シーケンス表現を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:18:52 GMT)
Steering LLM Thinking with Budget Guidance [48.7] 予算指導は、微調整を必要とせず、目標予算に向けてLSMの推論プロセスを操る方法である。
提案手法では,ガンマ分布を残りの思考長にわたってモデル化する軽量な予測器を提案する。
この信号は、生成をソフトでトークンレベルの方法でガイドするために使用され、全体の推論トレースが指定された思考予算に従うことを保証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:57:05 GMT)
MathFusion: Enhancing Mathematical Problem-solving of LLM through Instruction Fusion [48.4] MathFusionはクロスプロブレム命令合成による数学的推論を強化する新しいフレームワークである。
MathFusionは、高いデータ効率を維持しながら、数学的推論を大幅に改善する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:58:00 GMT)
We Should Identify and Mitigate Third-Party Safety Risks in MCP-Powered Agent Systems [48.3] MCPが導入した新たな安全リスク問題に細心の注意を払うため, LLMの安全に関する研究コミュニティを提唱する。
MCPによるエージェントシステムの安全性のリスクは本当の脅威であり、その防御は自明なものではないことを実証するために、一連の実験を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:24:31 GMT)
AceReason-Nemotron 1.1: Advancing Math and Code Reasoning through SFT and RL Synergy [48.3] 強い推論モデルの開発において,教師付き微調整(SFT)と強化学習(RL)の相乗効果について検討した。
スケーリング戦略は 推理性能に顕著な改善をもたらします
我々のAceReason-Nemotron-1.1 7Bモデルは、Qwen2.5-7Bに基づく推論モデルにおいて、AceReason-Nemotron-1.0と新しい最先端性能を著しく上回っている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:27:48 GMT)
Can a Bayesian Oracle Prevent Harm from an Agent? [48.1] 我々は、所定の安全仕様に違反する確率に基づいて、文脈依存境界を推定することを検討する。
世界の異なる仮説が全く異なる結果をもたらす可能性があることに注意し、我々は真だが未知の仮説の下で予測される安全違反の確率に基づいて導かれる。
我々は、この結果の2つの形態、すなわち、i.d.の場合と非i.d.の場合を考察し、そのような理論結果を実用的なAIガードレールに変換するためのオープンな問題で結論付ける。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:38:43 GMT)
Optimizing Temperature for Language Models with Multi-Sample Inference [47.1] 本稿では,異なる大言語モデルに対する(近傍)最適温度の自動同定という課題に対処する。
モデルアーキテクチャ、データセット、タスクタイプ、モデルサイズ、予測精度の変動を考慮して、性能最適化における温度の役割を総合的に分析する。
本稿では,温度自動最適化のためのエントロピーに基づく新しい計量法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:53:48 GMT)
Deep Network Pruning: A Comparative Study on CNNs in Face Recognition [47.1] 顔認識に応用したディープネットワーク圧縮法について検討する。
この方法は、SqueezeNet(1.24Mパラメータ)と人気のあるMobileNetv2(3.5M)とResNet50(23.5M)の3つのネットワーク上でテストされる。
フィルタのかなりの割合は、性能損失を最小限に抑えて取り除くことができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:04:46 GMT)
A Self-Refining Framework for Enhancing ASR Using TTS-Synthesized Data [46.7] 本稿では,ラベルのないデータセットのみを用いて,ASR性能を向上させる自己精錬フレームワークを提案する。
台湾語マンダリン音声における枠組みの有効性を実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:47:41 GMT)
EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization [46.4] Mixture-of-Experts (MoE)モデルは、大規模なディープラーニングの基盤として現れている。
MoEモデルは、従来の量子化技術に挑戦する固有の複雑さを持つ。
我々は,MoE アーキテクチャに適した新しい PTQ フレームワークである EAQuant を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:18:50 GMT)
ZINA: Multimodal Fine-grained Hallucination Detection and Editing [46.2] MLLM(Multimodal Large Language Models)はしばしば幻覚を発生させ、出力は視覚的内容から逸脱する。
本稿では,MLLMの微細な幻覚の検出と編集を行う新しいタスクを提案する。
ZINAは,角化したスパンをきめ細かいレベルで識別し,エラータイプを6つのカテゴリに分類し,適切な改善を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:27:59 GMT)
XYZ-IBD: A High-precision Bin-picking Dataset for Object 6D Pose Estimation Capturing Real-world Industrial Complexity [46.1] XYZ-IBDは6Dポーズ推定のためのビンピッキングデータセットである。
ミリ精度アノテーションによる本物のロボット操作のシナリオを反映している。
データセットには15のテクスチャなし、金属で、ほとんど対称な形状と大きさのオブジェクトが含まれている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:48:51 GMT)
SA-LUT: Spatial Adaptive 4D Look-Up Table for Photorealistic Style Transfer [45.9] フォトスタイル転送(PST)は、コンテンツ構造を保ちながら参照画像色を適応させることで、現実世界のカラーグレーディングを可能にする。
LUT効率とニューラルネットワーク適応性を組み合わせた空間適応型4Dルックアップテーブル(SA-LUT)を提案する。
実験により、SA-LUTは最先端の手法を大幅に上回り、LPIPSのスコアを3D LUTのアプローチと比べて66.7%低下させることが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:25:12 GMT)
Generative Representational Learning of Foundation Models for Recommendation [45.9] RecFoundは、レコメンデーションファウンデーションモデルのための生成的表現型学習フレームワークである。
生成タスクと埋め込みタスクの両方をカバーするレコメンデーションファンデーションモデルのための、最初の包括的なデータセットを構築した。
RecFoundはさまざまなレコメンデーションタスクで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:10:31 GMT)
CALM: Consensus-Aware Localized Merging for Multi-Task Learning [45.2] モデルマージは、複数の微調整モデルの強みを統一モデルに統合することを目的としている。
既存のメソッドはタスク演算によって表現され、大域的および局所的な手法に分類される。
本稿では,グローバルなタスクコンセンサスに整合した局所情報を含むCALM法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:19:45 GMT)
Mitigating loss of variance in ensemble data assimilation: machine learning-based and distance-free localizations for better covariance estimation [45.0] アンサンブルデータ同化における共分散推定を改善するための2つの新しい手法を提案する。
主な目的は、サンプリングエラーによるばらつきの損失を軽減し、データ同化結果を強化することである。
これらのメソッドは、Multiple Data Assimilation (ES-MDA)フレームワークでEnsemble Smootherに統合される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:09:27 GMT)
A Hybrid Artificial Intelligence Method for Estimating Flicker in Power Systems [45.0] 本稿では,Hフィルタと適応線形ニューロンネットワークを組み合わせたハイブリッドAI手法を提案する。
提案手法はHフィルタのロバスト性を利用して不確実でノイズの多い条件下で電圧エンベロープを抽出し,次にADALINEを用いてエンベロープに埋め込まれたフリック周波数を正確に同定する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:38:39 GMT)
G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems [44.8] 大規模言語モデル (LLM) を利用したマルチエージェントシステム (MAS) は、単一のLLMエージェントよりもはるかに高い認知と実行能力を示している。
組織記憶理論に触発されたMASのための階層型エージェントメモリシステムG-Memoryを紹介する。
Gメモリは、インボディードアクションの成功率と知識QAの精度を、それぞれ20.89%$と10.12%$で改善する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:45:10 GMT)
Fast Second-Order Online Kernel Learning through Incremental Matrix Sketching and Decomposition [44.6] オンライン学習(OKL)は、ストリーミング環境での予測性能が期待できるため、かなりの研究関心を集めている。
既存の2次OKLアプローチは、予め設定された予算に関して、少なくとも2次時間の複雑さに悩まされている。
本稿では,2次OKLに適した高速増分行列スケッチと分解手法FORTSを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:04:21 GMT)
Beyond Chemical QA: Evaluating LLM's Chemical Reasoning with Modular Chemical Operations [43.6] 我々は、分子構造理解を算術に着想を得た演算でブリッジする推論フレームワークであるChemCoTBenchを紹介する。
ChemCoTBenchは、化学的問題解決を透明でステップバイステップの推論に形式化する。
分子特性最適化と化学反応予測という2つの高影響タスクのモデルを評価する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:52:25 GMT)
MotiveBench: How Far Are We From Human-Like Motivational Reasoning in Large Language Models? [43.6] MotiveBenchは200のリッチなコンテキストシナリオと、複数のモチベーションレベルをカバーする600の推論タスクで構成されている。
私たちは7つの人気のあるモデルファミリーの実験を行い、各ファミリー内の異なるスケールとバージョンを比較します。
その結果、最も先進的なLSMでさえ、人間のような動機づけを達成できないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:18:28 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [43.6] 本稿では,知識グラフタスクに大規模言語モデル(LLM)を活用する新しいフレームワークである知識グラフ大言語モデル(KG-LLM)を紹介する。
まず、構造化知識グラフデータを自然言語に変換し、次にこれらの自然言語プロンプトを微調整 LLM に変換する。
KG-LLMフレームワークの有効性を示すため,Flan-T5,LLaMa2,Gemmaの3つのLLMを微調整した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:37:13 GMT)
Stream-Omni: Simultaneous Multimodal Interactions with Large Language-Vision-Speech Model [43.5] Stream-Omniは、効率的なモダリティアライメントを備えた大きな言語ビジョン音声モデルである。
様々なモダリティの組み合わせの下での相互作用を同時にサポートすることができる。
視覚的理解、音声対話、および視覚的な音声対話タスクにおいて、高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:06:45 GMT)
Graph Neural Networks and Deep Reinforcement Learning Based Resource Allocation for V2X Communications [43.4] 本稿では,グラフニューラルネットワーク(GNN)と深層強化学習(DRL)を統合する手法を提案する。
通信リンクをノードとする動的グラフを構築することにより、V2V通信における高い成功率を確保することを目指している。
提案手法は,GNNのグローバルな特徴学習能力を維持し,分散ネットワーク展開をサポートする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:00:30 GMT)
Code Graph Model (CGM): A Graph-Integrated Large Language Model for Repository-Level Software Engineering Tasks [42.8] 大きな言語モデル(LLM)は関数レベルのコード生成を約束しているが、リポジトリレベルのソフトウェアエンジニアリングタスクは依然として難しい。
本稿では,オープンソース LLM がエージェントベースアプローチを必要とせずに,リポジトリレベルのタスクを効果的に処理できるかどうかを検討する。
リポジトリコードグラフ構造をLLMのアテンション機構に統合するコードグラフモデル(CGM)を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:22:09 GMT)
Realtime-Capable Hybrid Spiking Neural Networks for Neural Decoding of Cortical Activity [42.7] 皮質内脳-機械界面(iBMIs)は、損傷によって失われた脳活動の回復と復号に有望な解決策を提供する。
このような神経補綴物の患者は、デバイスがかさばる配線から生じる永久的な頭蓋骨の開口に悩まされる。
最近では、スパイクニューラルネットワーク(SNN)が低消費電力神経復号の候補として研究されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:08:08 GMT)
LeVERB: Humanoid Whole-Body Control with Latent Vision-Language Instruction [42.7] ヒューマノイド全体制御のための視覚言語・クローズドループベンチマーク(WBC)について紹介する。
そこで我々は,人間型視覚言語WBCのための階層型遅延命令追従フレームワークであるLeVERB: Latent Vision-Language-Encoded Robot Behaviorを提案する。
私たちのベンチマークでは、単純なビジュアルナビゲーションタスクでゼロショットが80%の成功率、全体的な58.5%の成功率が、階層的な階層的なVLA実装よりも7.8倍高い。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:56:53 GMT)
MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification [42.6] 我々は、協調学習と整合性正規化のパラダイムを擬似ラベルで組み合わせた、新しい半教師付き学習(SSL)アルゴリズムであるMultiMatchを紹介する。
コアとなるMultiMatchは、3つの重要な目的のために設計された3倍の擬似ラベル重み付けモジュールを備えている。
このモジュールは、Multihead Co-trainingのヘッドアグリーメント、FreeMatchの自己適応しきい値、MarginMatchのAverage Pseudo-Marginsの3つの既存のテクニックを強化し、統合する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:28:26 GMT)
FindMeIfYouCan: Bringing Open Set metrics to $\textit{near} $, $ \textit{far} $ and $\textit{farther}$ Out-of-Distribution Object Detection [42.4] Out-Of-Distribution (OOD) 検出は、オブジェクト検出(OD)のための重要な研究方向として登場した。
本稿では,OOD-ODの現在の評価プロトコルが重複しないオブジェクトの仮定に違反していることを示す。
我々は、IDデータセットから$textitnear$、$textitfar$、$textitfarther$に分類された新しい評価分割を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:11:56 GMT)
AutoVLA: A Vision-Language-Action Model for End-to-End Autonomous Driving with Adaptive Reasoning and Reinforcement Fine-Tuning [42.4] Vision-Language-Action(VLA)モデルは、エンドツーエンドの自動運転を約束している。
現在のVLAモデルは、物理的に実現不可能なアクション出力、複雑なモデル構造、あるいは不要に長い推論に苦しむ。
本稿では,単一自己回帰生成モデル内での推論と行動生成を統一する新しいVLAモデルであるAutoVLAを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:58:50 GMT)
Fair Generation without Unfair Distortions: Debiasing Text-to-Image Generation with Entanglement-Free Attention [42.3] Entanglement-Free Attention (EFA) は、非ターゲット属性をバイアス緩和時に保存しながら、ターゲット属性を正確に組み込む手法である。
推論時に、EFAは、ターゲット属性を同じ確率でランダムにサンプリングし、選択された層内の交差アテンションを調整して、サンプル属性を組み込む。
大規模な実験により、EFAは非ターゲット属性を保ちながらバイアスを緩和する既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:40:32 GMT)
Energy-Efficient Digital Design: A Comparative Study of Event-Driven and Clock-Driven Spiking Neurons [42.2] 本稿では,ハードウェアアクセラレーションのためのスパイキングニューラルネットワーク(SNN)ニューロンモデルについて包括的に評価する。
我々は、Leaky Integrate and Fire(LIF)ニューロンの異なる変種に基づいて、ソフトウェア、高速プロトタイピング、および様々なSNNモデルの試験を開始する。
FPGA上に実装されたその後のハードウェアフェーズでは,シミュレーション結果が検証され,設計トレードオフに関する実践的な洞察が提供される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:10:19 GMT)
Gatekeeper: Improving Model Cascades Through Confidence Tuning [42.1] カスケード構成の小型モデルを校正するための新しい損失関数「ゲートキーパー」を導入する。
我々のアプローチは、より小さなモデルを微調整して、より大規模なモデルに複雑なタスクを遅延させながら、正しく実行できるタスクを確実に処理する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:32:06 GMT)
Rectifying Privacy and Efficacy Measurements in Machine Unlearning: A New Inference Attack Perspective [42.0] 本稿では,不正確な未学習手法の評価において重要なギャップに対処するため,RULI (Rectified Unlearning Evaluation Framework via Likelihood Inference)を提案する。
RULIは、未学習の有効性とプライバシリスクをサンプルごとの粒度で測定するために、二重目的攻撃を導入している。
既存の手法で過小評価されているプライバシーリスクを暴露し,最先端のアンラーニング手法の重大な脆弱性を明らかにした。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:30:02 GMT)
Towards fault-tolerant quantum computation with universal continuous-variable gates [41.9] 連続可変(CV)システムは、量子計算に顕著な可能性を示している。
計算普遍性の基本的な概念は、[Phys. Rev. Lett. 82, 1784 (1999) に導入された。
しかし、フォールトトレラント計算の重要な目的を達成するには何らかのエンコーディングが必要である。
本稿では,Gottesman-Kitaev-Preskill (GKP)エンコーディングを利用して,説得力のある証拠を提示する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:07:39 GMT)
Pairing particles into holonomies [41.9] ホロノミは量子計算とシミュレーションに大きな関心を持つ。
ここでは粒子数を増やして新しいホロノミーのクラスを構築する。
単一粒子ホロノミーを持たない系に複数粒子ホロノミーが存在することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:56:03 GMT)
Balancing Intensity and Focality in Directional DBS Under Uncertainty: A Simulation Study of Electrode Optimization via a Metaheuristic L1L1 Approach [41.9] 本研究の目的は、最近開発されたL1-norm regularized L1-norm fit (L1L1) 法を用いて電極接触構成の選択を改善することである。
我々のフレームワークは、リード場減衰に基づく解空間の制約によって不確実性を取り入れている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:12:43 GMT)
Are manual annotations necessary for statutory interpretations retrieval? [41.9] 法的な概念によって最適なアノテーション数を決定することを試みる。
また、アノテーションの文がランダムに描けるか、あるいはモデルの性能が向上しているかも確認する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:15:57 GMT)
Align-then-Unlearn: Embedding Alignment for LLM Unlearning [41.9] Unlearningは、個人情報や著作権のあるコンテンツなど、訓練されたモデルから特定のデータを選択的に取り除こうとしている。
セマンティック埋め込み空間においてアンラーニングを行う新しいフレームワークであるAlign-then-Unlearnを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:48:01 GMT)
HSRMamba: Contextual Spatial-Spectral State Space Model for Single Image Hyperspectral Super-Resolution [41.9] Mambaは、その強力なグローバルモデリング能力と線形計算複雑性のために、視覚タスクにおいて例外的な性能を示した。
HSRMambaはハイパースペクトル画像超解像(HSISR)のための文脈空間スペクトルモデリング状態空間モデルである
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:32:29 GMT)
Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry [41.9] ビデオカメラトラジェクトリ編集のための新しいフレームワークであるVid-CamEditを紹介する。
我々のアプローチは、時間的に一貫した幾何を推定する2つのステップと、この幾何学によって導かれる生成的レンダリングからなる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:02:47 GMT)
Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [41.5] 分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:20:12 GMT)
Conformal Linguistic Calibration: Trading-off between Factuality and Specificity [41.5] 本稿では,言語プラグマティクスのレンズを通して,抑止と言語キャリブレーションを結合する枠組みを提案する。
以上の結果から,本手法は実精度に適合した精度で校正出力を生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:13:10 GMT)
Efficient Inference for Large Reasoning Models: A Survey [41.2] LRM(Large Reasoning Models)は、Large Language Models(LLM)の推論能力を大幅に向上させる。
しかし、それらの熟考的推論プロセスはトークンの使用、メモリ消費、推論時間に非効率をもたらす。
本調査では, LRMに特化して設計された効率的な推論手法を概説し, 推論品質を維持しつつトークンの非効率を緩和することに着目した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:51:48 GMT)
PhenoKG: Knowledge Graph-Driven Gene Discovery and Patient Insights from Phenotypes Alone [40.6] 本稿では,患者表現型から因果遺伝子を予測するためのグラフベースのアプローチを提案する。
我々のモデルは、グラフニューラルネットワークとトランスフォーマーを組み合わせることで、現在の最先端技術よりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:54:12 GMT)
Deep Linear Network Training Dynamics from Random Initialization: Data, Width, Depth, and Hyperparameter Transfer [40.4] 我々は,枝を1/sqrttextdepth$にスケールした場合に無限の深さ制限を可能にする非残留ニューラルネットワークと残留ニューラルネットワークの両方について記述する。
本モデルでは, 電力法構造データに対する高速化された電力法則トレーニングのダイナミクスを, 最近の研究で観測されたリッチな状態下で回復することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:52:01 GMT)
A Complex UNet Approach for Non-Invasive Fetal ECG Extraction Using Single-Channel Dry Textile Electrodes [40.1] 胎児心電図(fECG)は、臨床環境を超えて胎児の健康を評価するための有望なツールである。
このセットアップは、fECG信号の正確な抽出を複雑にするノイズやモーションアーチファクトの増加など、多くの課題を提示している。
ドライテキスタイル電極を用いた単チャンネル記録からAI技術を用いてfECGを抽出する先駆的手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:35:52 GMT)
Federated ADMM from Bayesian Duality [39.7] フェデレートされたADMMを導出し、拡張する、根本的に新しい方法を提案する。
等方性ガウス後部を用いた場合,ADMMは自然に回復する。
我々の研究は、原始双対法を改善するための新しいベイズ的道を開く。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:02:33 GMT)
Feature learning in finite-width Bayesian deep linear networks with multiple outputs and convolutional layers [39.7] 深い線形ネットワークは広く研究されているが、複数の出力と畳み込み層を持つ有限幅アーキテクチャの場合はほとんど知られていない。
我々の研究は、この物理学の直観と用語を厳密なベイズ統計に翻訳する辞書を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:42:27 GMT)
Training Neural Networks by Optimizing Neuron Positions [39.7] ユークリッド空間にニューロンが埋め込まれたパラメータ効率のよいニューラルネットワークを提案する。
トレーニング中、それらの位置は最適化され、シナプス重みは連結ニューロン間の空間距離の反転として決定される。
これらの距離依存配線規則は、伝統的な学習可能な重量行列を置き換え、生物学的にインスパイアされた誘導バイアスを導入しながらパラメータの数を著しく削減する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:26:13 GMT)
Comparison of ConvNeXt and Vision-Language Models for Breast Density Assessment in Screening Mammography [39.6] 本研究では,BI-RADSシステムを用いた自動分類のためのマルチモーダル法とCNN法の比較を行った。
ゼロショット分類は、微調整されたConvNeXtモデルがBioMedCLIP線形プローブよりも優れた性能を示した。
これらの結果から, マルチモーダル学習の約束にもかかわらず, エンドツーエンドの微調整を施したCNNモデルの方が, 医用画像の特化に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:14:37 GMT)
Fast and Furious Symmetric Learning in Zero-Sum Games: Gradient Descent as Fictitious Play [39.2] 本稿では,ゼロサムゲームにおける2つの非regretアルゴリズムのサブ線形後悔保証について検討する。
Fictitious Play と Online Gradient Descent は、正規化がないために不安定さと線形後悔を示す。
我々は、任意のタイブレークルールを持つ有限プレイが$O(sqrtT)$後悔していることを証明し、カルリンの有限プレイ予想が持つ新しいクラスのゲームを確立する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:07:15 GMT)
A Gravity-informed Spatiotemporal Transformer for Human Activity Intensity Prediction [39.0] 本研究は,物理インフォームド・ディープラーニング・フレームワーク,すなわち重力インフォームド・テンポラル・トランス(重力フォーマ)を提案する。
人間の活動の基本的な法則は、提案された適応重力モデルによって明確にモデル化することができる。
6つの実世界の大規模活動データセットの実験は、我々のアプローチが最先端のベンチマークよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:32:51 GMT)
Language Agents for Hypothesis-driven Clinical Decision Making with Reinforcement Learning [38.5] 本稿では,仮説駆動型不確実性認識言語エージェントLA-CDMを用いて,臨床診断のための意思決定をモデル化することを提案する。
LA-CDMは, 正確な仮説生成, 仮説の不確実性推定, 効率的な意思決定という, 臨床的意思決定の重要な側面を目標とした3つの目標を掲げて, LA-CDMを訓練する。
4つの腹部疾患を対象とする実世界のデータセットMIMIC-CDMについて検討した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:32:01 GMT)
EchoShot: Multi-Shot Portrait Video Generation [37.8] EchoShotは、基礎的なビデオ拡散モデルに基づいて構築されたポートレートカスタマイズのためのネイティブなマルチショットフレームワークである。
マルチショットシナリオにおけるモデルトレーニングを容易にするため,大規模かつ高忠実な人間中心のビデオデータセットであるPortraitGalaを構築した。
適用性をさらに向上するため、EchoShotを拡張して、参照画像に基づくパーソナライズされたマルチショット生成と、無限ショットカウントによる長いビデオ合成を行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:00:16 GMT)
A Comprehensive Survey on Vector Database: Storage and Retrieval Technique, Challenge [37.6] ベクトルデータベース(VDB)は、従来のデータベース管理システムの能力を超える高次元データを管理する。
VDBは現在、大規模な言語モデルと密に統合されており、現代の人工知能システムにも広く適用されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:42:11 GMT)
Load Balancing Mixture of Experts with Similarity Preserving Routers [37.3] Sparse Mixture of Experts (MoE)モデルは、大規模なニューラルネットワークをトレーニングするためのスケーラブルで効率的なアーキテクチャを提供する。
トークン単位のリレーショナル構造を保持する新しいロードバランシング損失を導入する。
その結果, ルータの損失は36%, 収束速度は36%向上し, 冗長性が低下することがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:22:59 GMT)
Diagnosing and Improving Diffusion Models by Estimating the Optimal Loss Value [37.3] 拡散モデルの診断と改善のための最適損失値を推定する必要性を提唱する。
まず、拡散モデルの統一的な定式化の下で、閉形式の最適損失を導出する。
最適損失に基づいて,より高性能なトレーニングスケジュールを構築した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:59:54 GMT)
Gradient-Normalized Smoothness for Optimization with Approximate Hessians [37.2] 本研究では, 近似2次情報と勾配正規化手法を組み合わせることで, 高速なグローバル収束率を実現するアルゴリズムを開発した。
我々は,Hessianを用いたロジスティック回帰問題およびFisher and Gaussを用いた非連続ソフトコンバージェンス最適化における結果の直接的応用を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:19:34 GMT)
LARP: Tokenizing Videos with a Learned Autoregressive Generative Prior [36.7] 本稿では、自己回帰(AR)生成モデルにおける現在のビデオトークン化手法の限界を克服する新しいビデオトークン化手法であるLARPを提案する。
局所的な視覚的パッチを直接離散トークンにエンコードする従来のパッチワイドトークンライザとは異なり、LARPは全体的トークン化スキームを導入している。
ローカルなパッチレベルの情報に制限されるのではなく、よりグローバルでセマンティックな表現をキャプチャする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:06:19 GMT)
Pro-AD: Learning Comprehensive Prototypes with Prototype-based Constraint for Multi-class Unsupervised Anomaly Detection [36.3] 教師なし異常検出のためのプロトタイプベースの再構成手法は、学習可能なプロトタイプの限られたセットを利用する。
本稿では,これらの問題に対処するPro-ADを提案し,そのプロトタイプを完全活用して異常検出性能を向上する。
当社のPro-ADは,マルチクラス非教師付き異常検出タスクにおいて,優れたロバスト性および実用性を示し,最先端性能を実現している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:04:12 GMT)
POROver: Improving Safety and Reducing Overrefusal in Large Language Models with Overgeneration and Preference Optimization [36.3] 汎用的なプロンプトのオーバージェネレーションは、有用性に最小限の影響しか与えず、安全性を著しく向上させる。
有害なプロンプトの過剰発現は安全性を維持しながら11.1%から57.6%に有用性を高める。
POROVerの適用により、57.6%から82.1%まで有用性が向上する一方で、同等レベルの安全性を維持している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:47:36 GMT)
PPO-Based Vehicle Control for Ramp Merging Scheme Assisted by Enhanced C-V2X [36.2] オンランプ・マージは自動運転にとって重要な課題だ。
本稿では,強化学習に基づく新しい統合制御手法を提案する。
我々は,C-V2X(Cellular Vehicle-to-Everything)モード4を利用した拡張プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:49:30 GMT)
Online Optimization for Learning to Communicate over Time-Correlated Channels [36.0] 本研究では,時間関連チャネル上でのコミュニケーション学習におけるオンライン最適化問題について検討する。
楽観的なオンラインミラー降下フレームワークに基づく2つのオンライン最適化アルゴリズムを開発した。
提案手法は,学習システムの予測誤差確率に基づいて線形後悔を導出することで理論的に保証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:48:05 GMT)
What is the Right Notion of Distance between Predict-then-Optimize Tasks? [35.8] OTD$3$は、機能やラベルに加えて下流の決定を組み込んだ、新しいデータセット距離である。
提案した距離は,3つの予測列最適化タスク間でのモデル伝達可能性を正確に予測できることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:24:56 GMT)
Roboflow100-VL: A Multi-Domain Object Detection Benchmark for Vision-Language Models [35.8] 本稿では,100個のマルチモーダルオブジェクト検出データセットの大規模コレクションであるRoboflow100-VLを紹介する。
我々は、ゼロショット、少数ショット、半教師付き、完全教師付き設定で、我々のベンチマークの最先端モデルを評価する。
CVPR 2025 Foundational FSOD コンペティションについて論じ,コミュニティからの洞察を共有した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:08:27 GMT)
A Comprehensive Survey on Continual Learning in Generative Models [35.7] 本稿では,主流生成モデルに対する連続学習手法の包括的調査を行う。
これらのアプローチをアーキテクチャベース、正規化ベース、リプレイベースという3つのパラダイムに分類する。
我々は、トレーニング目標、ベンチマーク、コアバックボーンを含む、異なる生成モデルに対する連続的な学習設定を分析する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:27:25 GMT)
High-fidelity entanglement and coherent multi-qubit mapping in an atom array [34.8] 我々は、Ytterbium-171 tweezer配列において、複数の量子ビットにまたがる絡み合った量子状態の生成とコヒーレントマッピングを示す。
結果は、量子情報科学の複数の分野を前進させながら、それらの間に橋を架ける汎用的なアーキテクチャを確立する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:58:53 GMT)
Understand the Implication: Learning to Think for Pragmatic Understanding [34.3] プラグマティクス(英: Pragmatics)とは、文字通りの解釈を超えて意味を推測する能力である。
既存の手法は注釈付きラベルに依存しているが、人間が暗黙の意味を解釈するために自然に使用する推論プロセスを見落としている。
我々は、正しい解釈と誤解釈の両方に対して明確な推論(思考)を含む、新しい実用的データセット、ImpliedPreferenceを導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:45:08 GMT)
MambaMia: A State-Space-Model-Based Compression for Efficient Video Understanding in Large Multimodal Models [33.9] 大規模なマルチモーダルモデルに反映する前に、複数のビデオフレームの特徴を圧縮する効率的なフレームワークを提案する。
われわれのフレームワークは、リソースを意識した効率を重視し、現実世界のデプロイに実用的である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:49:49 GMT)
Enhancing Logits Distillation with Plug\&Play Kendall's $τ$ Ranking Loss [33.8] 知識蒸留は通常、教師と学生のロジット間のKL(Kulback-Leibler)のばらつきを最小限に抑える。
その結果,KL分散尺度によって引き起こされる勾配は,教師の対数の大きさとともに,低確率チャネルの更新を減少させることがわかった。
我々はKendallの$tau$係数に基づいて,任意のロジット蒸留フレームワークにシームレスに統合可能な補助的なランキング損失を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:47:51 GMT)
AttentionDrag: Exploiting Latent Correlation Knowledge in Pre-trained Diffusion Models for Image Editing [33.7] 本研究では,AttentionDragという一段階のポイントベース画像編集手法を提案する。
このフレームワークは、大規模な再最適化や再トレーニングを必要とせずに、セマンティック一貫性と高品質な操作を可能にする。
以上の結果から,最先端の手法をはるかに高速に超越した性能を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:42:38 GMT)
StgcDiff: Spatial-Temporal Graph Condition Diffusion for Sign Language Transition Generation [33.7] 離散符号間のスムーズな遷移を生成するグラフベースの条件拡散フレームワークStgcDiffを提案する。
具体的には、エンコーダ・デコーダアーキテクチャをトレーニングし、空間的時間的骨格の構造認識表現を学習する。
我々は,その空間的特徴を効果的にモデル化する,Sign-GCNモジュールをフレームワークのキーコンポーネントとして設計する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:09:51 GMT)
Better Think with Tables: Tabular Structures Enhance LLM Comprehension for Data-Analytics Requests [33.5] 大規模言語モデル(LLM)は、情報検索やデータ操作に関連するデータ分析要求に悩まされることが多い。
我々は、データ分析要求のために表構造をLCMに注入するThinking with Tablesを紹介した。
テーブルを提供すると平均的なパフォーマンスが40.29パーセント向上し、操作性やトークン効率が向上することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:00:53 GMT)
Avoiding Obfuscation with Prover-Estimator Debate [33.1] 本稿では,複雑な問題に対する人間の判断の正当性を保証するAI討論のためのプロトコルを提案する。
不正直な議論者は、正直な相手に計算的に難解な問題を解くよう強制する計算効率のよい戦略を利用できる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:37:33 GMT)
MLOmics: Cancer Multi-Omics Database for Machine Learning [33.0] MLOmicsは,バイオインフォマティクスと機械学習モデルの開発と評価を改善することを目的とした,オープンソースのマルチオミクスデータベースである。
MLOmicsには8,314人の患者サンプルがあり、4つのオミクスタイプ、層状特徴、広範囲なベースラインを持つ32種類の癌をカバーしている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:34:25 GMT)
LongCodeBench: Evaluating Coding LLMs at 1M Context Windows [32.9] 我々は、コード理解と修復を、長期コンテキストモデルの自然なテストベッドと課題として認識する。
我々はLongCodeBenchを紹介した。LongCodeBenchは、Long-contextのシナリオでLLMのコーディング能力をテストするためのベンチマークである。
私たちは、Claude 3.5 Sonnetの29%から3%のパフォーマンス低下など、ロングコンテキストがすべてのモデルにとって弱点であることに気付きました。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:55:19 GMT)
NeedleInATable: Exploring Long-Context Capability of Large Language Models towards Long-Structured Tables [32.9] textscNeedleInATable (NIAT)は、各テーブルセルを針として扱い、セルの位置やルックアップ質問に基づいてターゲットセルを抽出するモデルを必要とする。
私たちのデータ、コード、モデルは、将来の研究を促進するためにリリースされます。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:19:54 GMT)
Making LLMs Better Many-to-Many Speech-to-Text Translators with Curriculum Learning [32.9] MLLM(Multimodal Large Language Models)は、音声テキスト翻訳(S2TT)タスクにおいて大きな成功を収めている。
本稿では,大規模言語モデルの機械翻訳機能を活用し,S2TTタスクに適応する3段階のカリキュラム学習戦略を提案する。
実験結果から,提案手法は15時間14ドルの言語対で最先端の平均性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:05:04 GMT)
Symmetry in Neural Network Parameter Spaces [32.7] 冗長性のかなりの部分はパラメータ空間の対称性によって説明される。
これらの対称性は損失ランドスケープと制約学習のダイナミクスを形成し、最適化、一般化、モデルの複雑さを理解するための新しいレンズを提供する。
既存の文献を要約し、対称性と学習理論の関連を明らかにするとともに、この新興分野におけるギャップと機会を特定する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:59:12 GMT)
Computational lower bounds in latent models: clustering, sparse-clustering, biclustering [32.5] スパースPCA、植込みクラスタリング、クラスタリングのような多くの高次元問題において、複雑性のある最もよく知られたアルゴリズムは、計算制約のないアルゴリズムで証明可能な統計的性能に到達できない。
この観測により、いくつかの問題に対して、計算の制約なしに達成可能な最高の統計性能と、多時間アルゴリズムで達成可能な最高の性能とのギャップが生じるという予想が生まれた。
ポリ時間で達成可能な最高の性能を評価するための強力なアプローチは、低次傾斜角で達成可能な最高の性能を調べることである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:08:30 GMT)
Scalable registration of single quantum emitters within solid immersion lenses through femtosecond laser writing [32.2] 我々は、フォトニック構造内で個々の量子エミッタを生成するために、マーカーのないフェムト秒レーザーライティング技術を示す。
この方法は、炭化ケイ素のスピン光子界面を用いた集積量子デバイスの開発にスケーラブルである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:32:19 GMT)
Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency [32.2] 本稿では、駆動ビデオとLiDARシーケンスの合同生成のための統一的なフレームワークを提案する。
我々は,3D-VAEモダリティにDiTベースのビデオ拡散モデルを統合する2段階アーキテクチャと,NeRFベースのレンダリングと適応サンプリングを備えたBEV対応LiDARジェネレータを用いる。
構造化セマンティクスで生成をガイドするために,シーンレベルとインスタンス言語を統括する視覚レベルモデル上に構築されたキャプションモジュールであるDataCrafterを紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:12:30 GMT)
SENMAP: Multi-objective data-flow mapping and synthesis for hybrid scalable neuromorphic systems [32.1] 本稿では、スケーラブルでエネルギー効率の良いニューロモルフィック・コンピューティング・アーキテクチャ・フレームワークのためのマッピングと合成ツールであるSENMapを紹介する。
SENMapは、アーキテクチャ、事前訓練されたSNNとANNの現実的な例、およびイベントレートベースのパラメータを考察し、SENSIMと共にオープンソースにして、製造前に柔軟なニューロモルフィックチップ設計を支援する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:17:57 GMT)
Designing Deep Learning Frameworks for LLMs:Challenges, Expectations, and Opportunities [32.1] 大規模言語モデル(LLM)は、実業界アプリケーションにおいて大きな進歩をもたらす。
LLMは、効率的なモデル構築、分散実行、最適化されたデプロイメントのためのDLフレームワークに依存している。
DLフレームワークのユーザビリティ、機能制限、バグにより、開発効率が損なわれ、深刻な障害やリソースの浪費を引き起こす可能性がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:45:03 GMT)
Convex Markov Games: A New Frontier for Multi-Agent Reinforcement Learning [32.0] コンベックス・マルコフゲーム(英語版)のクラスを導入し、占有度よりも一般的なコンベックス・プレイスを可能にする。
無限の時間的地平線とマルコフゲームよりも厳密な一般性にもかかわらず、純粋な戦略ナッシュ平衡が存在する。
実験により,従来の常連型ゲームに対する新しい解法,不斉協調ゲームにおける公正な解法,ロボット倉庫環境における安全な長期行動の優先順位が明らかにされた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:03:24 GMT)
Efficient 3D Perception on Multi-Sweep Point Cloud with Gumbel Spatial Pruning [31.7] 既存の方法は、屋外の点雲の希少な性質のため、距離や隠蔽された物体を認識する際の限界に直面している。
本研究では,時間的に連続する複数の雲を蓄積することにより,この問題の顕著な緩和を観察する。
本稿では,学習したエンドツーエンドのサンプリングに基づいて動的に点をプーンする,シンプルで効果的なグンベル空間プレーニング層を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:17:33 GMT)
A Training-free LLM-based Approach to General Chinese Character Error Correction [31.5] 中国語のスペル訂正(CSC)は,漢字の文字誤りの訂正を目的とした重要な課題である。
本稿では,3種類の文字誤りに着目した汎用漢字誤り訂正(C2EC)の課題を紹介する。
トレーニング不要なプロンプトフリーCSC法をC2ECに拡張し,Levenshtein距離を用いて長さ変化を処理し,新たなプロンプトベース大規模言語モデル(LLM)を活用して性能を向上させる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:35:23 GMT)
Motion-R1: Chain-of-Thought Reasoning and Reinforcement Learning for Human Motion Generation [31.5] Motion-R1は、Chain-of-Thoughtメカニズムを統合したモーション言語モデリングフレームワークである。
複雑なテキスト命令を論理的に構造化されたアクションパスに明示的に分解することで、モーションR1はモーション生成のための高レベルなセマンティックガイダンスを提供する。
複数のベンチマークデータセットに対する実験では、Motion-R1は最先端の手法と比較して、競争力や優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:23:11 GMT)
xbench: Tracking Agents Productivity Scaling with Profession-Aligned Real-World Evaluations [30.3] 私たちは、AIエージェント能力と現実世界の生産性のギャップを埋めるために設計された、専門性に沿った評価スイートであるxbenchを紹介します。
xbenchは、業界の専門家によって定義された評価タスクを備えた、商業的に重要なドメインをターゲットにしている。
我々は、これらの専門分野のベースラインを確立するために、現代エージェントを指導するための初期評価結果を提示する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:16:14 GMT)
Improved Off-policy Reinforcement Learning in Biological Sequence Design [30.3] 本稿では,政策探索を信頼性のある地域に限定することでロバスト性を高める,新たな非政治検索法である$delta$-Conservative Searchを提案する。
実験の結果,既存の機械学習手法よりも高い精度で高速なシーケンスを探索できることがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:12:08 GMT)
Prefix-Tuning+: Modernizing Prefix-Tuning through Attention Independent Prefix Data [29.8] 本稿では,Prefix-Tuningの原理を一般化した新しいアーキテクチャであるPrefix-Tuning+を紹介し,その欠点に対処する。
我々の実験は、様々なベンチマークでPrefix-Tuning+が既存のPrefix-Tuningメソッドより一貫して優れていることを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:30:26 GMT)
Self-Regularization with Sparse Autoencoders for Controllable LLM-based Classification [29.7] 大規模言語モデル(LLM)潜在空間における意図しない特徴を特定し,規則化する新しいフレームワークを提案する。
本稿では,有毒なチャット検出,報酬モデリング,疾患診断を含む3つの実世界の課題に関する枠組みについて検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:24:41 GMT)
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers [29.7] RIFLExは、最先端のビデオ拡散変換器における高品質な2x外挿を実現するフリーランチである。
画質を向上し、長いビデオなしで最小限の微調整で3倍の補間を可能にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:39:37 GMT)
Position: Certified Robustness Does Not (Yet) Imply Model Security [29.6] 認証された堅牢性は、人工知能システムの敵例に対する解決策として推奨される。
我々は,検出のパラドックスを含む,現在の研究における重要なギャップを識別する。
本稿では,これらの基本的な課題に対処し,実用化に向けての分野を前進させる手順を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:18:33 GMT)
Arctic Long Sequence Training: Scalable And Efficient Training For Multi-Million Token Sequences [29.5] 長いシーケンスは、RAG、長いドキュメントの要約、マルチモーダリティなど、アプリケーションにとって重要なものです。
ALSTはMetaのLlama 8Bモデルのトレーニングをサポートし、単一のH100 GPUで500Kシーケンス長、単一の8xH100 GPUノードで3.7M、4ノードクラスタで15M以上である。
ALSTはHFモデルと完全に互換性があり、Deepspeed経由でオープンソース化されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:52:28 GMT)
AirIO: Learning Inertial Odometry with Enhanced IMU Feature Observability [29.0] 慣性計測ユニット(IMU)のみを用いた慣性計測(IO)は、無人航空機(UAV)用途に軽量で費用対効果の高いソリューションを提供する。
既存の学習ベースのIOモデルは、歩行者の動きとは異なる非常にダイナミックで非線形なパターンのため、UAVへの一般化に失敗することが多い。
本研究では,従来のIMUデータからグローバル座標への変換は,UAVにおける重要なキネマティック情報の可観測性を損なうものであることを確認した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:43:25 GMT)
Upcycling Large Language Models into Mixture of Experts [27.5] 厳密な言語モデルをスパース・ミックス・オブ・エキスパート(MoE)モデルにリサイクルすることは、既に訓練されたモデルのモデル容量を増やすための効率的なアプローチである。
より高密度モデルトレーニングを継続して実施した。
また、ソフトマックス-then-topKエキスパートルーティングは、トップK-then-softmaxアプローチよりも改善されていることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:29:18 GMT)
Stochasticity-aware No-Reference Point Cloud Quality Assessment [27.3] 従来の研究は、ポイントクラウド品質評価(PCQA)をレグレッション問題と見なしていた。
この研究は、既存のデータセットのラベル付けプロセスによって動機付けられた、非参照PCQAのための最初の確率的アーキテクチャを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:47:15 GMT)
ExtendAttack: Attacking Servers of LRMs via Extending Reasoning [27.2] 大規模推論モデル(LRM)は複雑なタスクにおいて有望な性能を示す。
サーバのリソースを悪質に占有するために,ExtendedAttack と呼ばれる LRM に対する新たな攻撃手法を提案する。
我々は,HumanEvalベンチマークのo3モデルに対して,ExtensionAttackがモデル応答長を2.5倍に向上することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:49:05 GMT)
Mitigating Safety Fallback in Editing-based Backdoor Injection on LLMs [27.0] 大規模言語モデル(LLM)は、自然言語タスク全体で強いパフォーマンスを示しているが、バックドア攻撃には弱いままである。
最近のモデル編集ベースのアプローチでは、パラメータを変更して特定のトリガを攻撃者が望んだ応答にマッピングすることで、効率的なバックドアインジェクションが可能になる。
本稿では、肯定的な出力を共同で促進し、拒絶応答を抑制するデュアルオブジェクトモデル編集フレームワークであるDualEditを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:28:07 GMT)
Bridging Unsupervised and Semi-Supervised Anomaly Detection: A Theoretically-Grounded and Practical Framework with Synthetic Anomalies [26.9] 異常検出は、サイバーセキュリティやヘルスケアといった分野における重要なタスクである。
半教師付きADのための理論的基礎と実証的有効フレームワークを提案する。
合成異常は低密度領域におけるより良い異常モデリングを可能にすることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:48:54 GMT)
Bokeh Diffusion: Defocus Blur Control in Text-to-Image Diffusion Models [26.8] Bokeh Diffusionはシーン一貫性のあるbokehコントロールフレームワークである。
本稿では,合成ぼかし増量による画像の調整を行うハイブリッド・トレーニング・パイプラインを提案する。
われわれのアプローチは、フレキシブルでレンズライクなぼかし制御を可能にし、インバージョンによる実際の画像編集のような下流アプリケーションをサポートする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:29:51 GMT)
DualEdit: Dual Editing for Knowledge Updating in Vision-Language Models [26.8] テキストと視覚の両方を各キー層で修正するエディタであるDualEditを提案する。
我々は、複数のVLMバックボーンとベンチマークデータセットにわたるDualEditを評価し、最先端のVLM編集ベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:04:16 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [26.4] CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。
テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令処理におけるLLMの強化手法を提案する。
我々は,ルール中心の報酬信号が検証可能な強化学習を利用して,特に指示に従うための推論を育成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:40:34 GMT)
Watermarking LLM-Generated Datasets in Downstream Tasks [26.3] 大規模言語モデル(LLM)は、感情分類、レビュー生成、質問応答など幅広い分野にまたがる、急速な進歩を経験した。
効率性と汎用性のため、研究者や企業はモデルをトレーニングするためにLLM生成データをますます活用している。
LLMが生成したコンテンツを追跡できないことは大きな課題となり、LLM所有者の著作権侵害につながる可能性がある。
本研究では,LLM生成データセットに透かしを注入する手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:51:49 GMT)
AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents [25.5] AgentCourtは、LLMベースのエージェントの対角的進化を通じて課題に対処する包括的な法的シミュレーションフレームワークである。
1000件の民事事件をシミュレートすることにより、エージェントの法的推論能力を高める進化した知識基盤を構築する。
我々の研究は、法的なAIにおける敵対的学習の重要性を強調し、より広範な司法・規制の文脈にシミュレーションに基づく法的推論を拡張するための有望な方向性を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:19:20 GMT)
SRKD: Towards Efficient 3D Point Cloud Segmentation via Structure- and Relation-aware Knowledge Distillation [25.4] 3Dポイントクラウドセグメンテーションは、大規模トランスフォーマーベースのモデルの計算複雑性とデプロイメント制限のため、現実的な課題に直面している。
SRKDと呼ばれる新しい構造と関係を意識した知識蒸留フレームワークを提案する。このフレームワークは、リッチな幾何学的および意味的な知識を、大きな凍結教師モデルから軽量の学生モデルに伝達する。
提案手法は,実世界の展開シナリオにおいて,モデル複雑性を大幅に低減し,その有効性と効率を実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:32:58 GMT)
Micro-macro Gaussian Splatting with Enhanced Scalability for Unconstrained Scene Reconstruction [25.3] 本研究では,シーン表現をグローバル,洗練,本質的な構成要素に分解することで,多様なスケールで3次元再構成を実現する手法を提案する。
SMW-GSは以下のイノベーションを取り入れている: マイクロマクロプロジェクション: ガウス点が多様性を改善したマルチスケールの詳細をサンプリングすることを可能にするマイクロマクロプロジェクション; ウェーブレットベースのサンプリング: 周波数領域情報を用いて特徴表現を洗練し、複雑なシーンの外観をよりよく捉える。
実験により、SMW-GSは、再建品質とスケーラビリティの両方において既存の手法よりも優れており、特に大規模な都市環境において、照明のバラツキに挑戦している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:11:13 GMT)
An overview of domain-specific foundation model: key technologies, applications and challenges [25.1] ドメイン固有基盤モデル(FM)のカスタマイズは、汎用モデルの制限に対処する。
この記事では、ドメイン固有のFMをカスタマイズするための方法論について、タイムリーかつ網羅的に概説する。
基本的な概念を導入し、一般的なアーキテクチャの概要を説明し、ドメイン固有のモデルを構築するための重要な方法を調査します。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:13:39 GMT)
Lost in the Mix: Evaluating LLM Understanding of Code-Switched Text [25.1] コードスイッチング(英: Code-switching、CSW)とは、1つの言説の中で2つ以上の言語を交互に行う行為である。
大規模言語モデル(LLM)は現在、コンテンツと通信生成の中心となっている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:19:27 GMT)
Balancing Knowledge Delivery and Emotional Comfort in Healthcare Conversational Systems [24.9] 我々は、大規模言語モデルを用いて、現実世界の対話型医療対話データセットを書き換える。
患者に対するネガティブな感情とそれに対応する医学的反応を提示し,その懸念に対処しながら患者の感情を和らげる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:54:03 GMT)
STAGE: A Stream-Centric Generative World Model for Long-Horizon Driving-Scene Simulation [24.9] STAGEは、階層的な特徴調整と、持続可能なビデオ合成のためのマルチフェーズ最適化の先駆けとなる自動回帰フレームワークである。
HTFTはビデオ生成プロセスを通してビデオフレーム間の時間的一貫性を高める。
我々はNuscenesデータセット上で600フレームの高品質なドライビングビデオを生成しました。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:53:05 GMT)
The impact of uncertainty on regularized learning in games [24.8] ゲームにおけるランダム性と不確実性が学習に与える影響について検討する。
特に、"follow-the-regularized-leader"のダイナミクスに注目します。
あらゆるゲームにおいて、ノイズレベルに関係なく、「不確実性は極端なものを好む」ことを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:28:22 GMT)
UltraZoom: Generating Gigapixel Images from Regular Photos [24.5] 我々は,カジュアルにキャプチャされた入力からオブジェクトのギガピクセル分解能画像を生成するシステムであるUltraZoomを提案する。
フルショットイメージ(グロバル、ローディテール)と1つ以上のクローズアップ(ローカル、ハイディテール)が与えられた場合、UltraZoomは、クローズアップ例の詳細な詳細とスケールに合わせてフルイメージをスケールアップする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:58:29 GMT)
ROSA: Harnessing Robot States for Vision-Language and Action Alignment [24.4] VLM(Vision-Language Models)は、エンドツーエンドのロボット制御において大きな進歩を遂げた。
本稿では,ロボットの状態推定を利用して視覚言語と行動空間のアライメントを改善する新しいトレーニングパラダイムROSAを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:34:20 GMT)
NTU Speechlab LLM-Based Multilingual ASR System for Interspeech MLC-SLM Challenge 2025 [24.1] MLC-SLM(Interspeech 2025 Multilingual Conversational Speech and Language Model)チャレンジ(Task I)のために開発されたNTU音声ラボシステムについて詳述する。
本稿では,多言語自動音声認識システムの包括的分析を行い,モデルアーキテクチャ,データ選択,学習戦略における重要な進歩に注目した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:28:27 GMT)
DicFace: Dirichlet-Constrained Variational Codebook Learning for Temporally Coherent Video Face Restoration [24.0] ビデオ顔の復元は、劣化した入力から顔の詳細を回復しながら、時間的一貫性を維持する上で重要な課題に直面します。
本稿では,Vector-Quantized Variational Autoencoders (VQ-VAEs) をビデオ復元フレームワークに拡張する手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:54:28 GMT)
On Synthesizing Data for Context Attribution in Question Answering [23.9] QA ( Question Answering) は LLM の「野生における」使用のかなりの部分を占めている。
この情報を提供することがコンテキスト属性のタスクである。
主要な貢献は、コンテキスト属性データを合成するための新しい生成戦略であるSynQAである。
我々は,SynQAを用いて合成した属性データは,文脈属性の微調整に極めて有効であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:22:39 GMT)
EvolvTrip: Enhancing Literary Character Understanding with Temporal Theory-of-Mind Graphs [23.9] EvolvTripは、物語を通して心理学的発達を追跡する視点対応の時間知識グラフである。
本研究は,物語理解における時間的性格的状態の明示的表現の重要性を強調した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:05:17 GMT)
Ask Optimal Questions: Aligning Large Language Models with Retriever's Preference in Conversation [23.7] RetPOは、ターゲット検索システムの好みに合わせて検索クエリを再構成する言語モデルを最適化するように設計されている。
我々は、12Kの会話で410K以上のクエリを書き換えるRetrievers' Feedbackと呼ばれる大規模なデータセットを構築した。
その結果,2つのベンチマークにおいて,従来のリライト・ザ・リトリーブ・アプローチの最先端性能を上回る優位性を示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:39:07 GMT)
PF-LHM: 3D Animatable Avatar Reconstruction from Pose-free Articulated Human Images [23.7] PF-LHMは、1つまたは複数のカジュアルにキャプチャされたポーズレス画像から、高品質な3Dアバターを秒間に生成する大規模な人間再構成モデルである。
カメラや人間のポーズアノテーションを必要とせず、高忠実でアニマタブルな3次元アバターを実現する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:59:56 GMT)
VL-GenRM: Enhancing Vision-Language Verification via Vision Experts and Iterative Training [23.4] Vision-Language Reward Model (VL-RM) は、構造化されたフィードバックを提供することでVLモデルを整列させる鍵となる。
高品質のトレーニングデータがすでに強力なVLモデルに依存しているため、ブートストラップジレンマが発生する。
本稿では,視覚の専門家,思考の合理性,およびMarginベースのリジェクションサンプリングを活用した反復的トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:10:51 GMT)
Bi-directional Context-Enhanced Speech Large Language Models for Multilingual Conversational ASR [23.3] 本稿では、多言語連続会話自動音声認識(ASR)を改善するために、言語固有の双方向コンテキストを音声大言語モデル(SLLM)に統合する。
トレーニング中の文字レベルのコンテキストマスキング戦略を提案する。これにより、コンテキストの一部がランダムに除去され、堅牢性が向上し、推論中に発生する可能性のある欠陥のある文字のエミュレートが向上する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:03:23 GMT)
GeoSDF: Plane Geometry Diagram Synthesis via Signed Distance Field [23.2] 平面幾何学図合成は、教育ツールからAIによる数学的推論まで、コンピュータグラフィックスにおいて重要なタスクである。
署名距離場(Signed Distance Field, SDF)を用いて, 図の自動生成を行う新しいフレームワークGeoSDFを提案する。
我々はGeoSDFにおいて、幾何学的要素や制約を簡単に表現するための記号言語を定義し、合成された幾何学図をSDFで自己検証することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:50:55 GMT)
Foundation Models in Medical Imaging -- A Review and Outlook [23.1] 基礎モデル(FM)は、未ラベルデータの大規模な収集から学んだ医療画像の分析方法を変えつつある。
本稿では,FMの病態,放射線学,眼科領域への応用について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:28:22 GMT)
TongSearch-QR: Reinforced Query Reasoning for Retrieval [22.8] TongSearch QRは、クエリ推論と推論集約検索における書き換えのための、小規模言語モデルのファミリーである。
半ルールに基づく新たな報酬関数により、より小さな言語モデルを実現する強化学習アプローチを採用する。
BRIGHTベンチマークの実験結果によると、BM25をリトリーバーとして、TongSearch QR-7BとTongSearch QR-1.5Bモデルの両方が既存のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:35:12 GMT)
Comparative Evaluation of 3D Reconstruction Methods for Object Pose Estimation [22.8] 本稿では,3次元再構成品質がポーズ推定精度に与える影響を評価するための新しいベンチマークを提案する。
複数の最先端の3D再構成とオブジェクトポーズ推定手法による詳細な実験により、現代的な再構成手法によって生成された幾何学が、正確なポーズ推定に十分であることが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:47:24 GMT)
SASep: Saliency-Aware Structured Separation of Geometry and Feature for Open Set Learning on Point Clouds [22.8] 本稿では,3次元物体認識のためのSalience-Aware Structured separation (SASep)を提案する。
SASepは、(i)意味論的分解(TSD)モジュールで、オブジェクトを重要かつ重要でない部分に意味的に分解し、(ii)擬似未知のオブジェクトを生成する幾何学的戦略(GSS)モジュールと、(iii)特徴レベルの分離を強化するための合成支援マージン分離(SMS)モジュールを含む。
実験の結果, SASepは3次元OSRにおいて優れた性能を示し, 既存の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:22:11 GMT)
Evolvable Conditional Diffusion [22.6] ブラックボックス、非微分可能マルチフィジカルモデルは、生成過程を導くのに効果的に使用できる。
我々は、確率論的進化のレンズを通して、第一原理から進化誘導的なアプローチを導出する。
提案手法を2つのAI for Scienceシナリオで検証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:11:32 GMT)
General agents need world models [22.6] 多段階の目標指向タスクに一般化できるエージェントは、その環境の予測モデルを学んだに違いない。
このモデルはエージェントの方針から抽出でき、エージェントのパフォーマンスや目標の複雑さを増大させるには、より正確な世界モデルを学ぶ必要がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:07:32 GMT)
ReflecTool: Towards Reflection-Aware Tool-Augmented Clinical Agents [22.6] 大規模言語モデル(LLM)は医療分野で有望な可能性を示している。
ClinicalAgent Bench (CAB) は、5つの重要な臨床次元にわたる18のタスクからなる総合的な医療エージェントベンチマークである。
ReflecToolはドメイン固有のツールを2段階以内で利用できる新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:25:31 GMT)
On the Completeness of Invariant Geometric Deep Learning Models [22.4] 不変モデルは、点雲における情報的幾何学的特徴を利用して有意義な幾何学的表現を生成する。
完全連結条件下での幅広い不変モデルの理論的表現性を特徴付ける。
我々の理論的結果は不変モデルの表現力のギャップを埋め、その能力の厳密で包括的な理解に寄与する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:11:40 GMT)
MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models [22.0] マルチモーダル統合によるジェスチャーの多様性とリズムを向上させるMambaTalkを紹介する。
我々の手法は最先端のモデルの性能と一致するか超えている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:28:28 GMT)
Theoretically Unmasking Inference Attacks Against LDP-Protected Clients in Federated Vision Models [22.0] フェデレーション学習は、直接的なデータ共有を避けながら、サーバの調整を通じてクライアント間の協調学習を可能にする。
メンバーシップ推論攻撃(MIA)に関する最近の研究は、この概念に異議を唱えており、未保護のトレーニングデータに対する高い成功率を示している。
完全連結層や自己アテンション層の脆弱性を利用する低ポリノミカル時間MIAの成功率について理論的に低い境界を導出する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:48:11 GMT)
FrameBridge: Improving Image-to-Video Generation with Bridge Models [21.9] 拡散モデルは画像間(I2V)生成において顕著な進歩を遂げた。
彼らのノイズ・ツー・データ生成プロセスは、本質的にこのタスクと一致していないため、最適下合成の品質につながる可能性がある。
フレーム・ツー・フレーム生成過程をブリッジモデルに基づくデータ・ツー・データ生成プロセスでモデル化することにより、与えられた画像に含まれる情報を完全に活用することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:22:26 GMT)
ProfiLLM: An LLM-Based Framework for Implicit Profiling of Chatbot Users [21.8] ProfiLLMはチャットボットのインタラクションを通じて暗黙的で動的なユーザープロファイリングを行うための新しいフレームワークである。
ProfiLLMのITSec適応版であるProfiLLM[ITSec]を開発し,その性能を1,760人の人間的な会話で評価した。
その結果、ProfiLLM[ITSec]はITSecプロファイルを迅速かつ正確に推測し、単一のプロンプトの後に実際のスコアと予測スコアのギャップを最大55~65%削減した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:33:44 GMT)
ASMR: Augmenting Life Scenario using Large Generative Models for Robotic Action Reflection [21.8] 本稿では,ロボット支援シナリオにおけるデータ拡張に着目した新しいフレームワークを提案する。
潜在的な会話や環境コンテキストをシミュレートするために、洗練された大きな言語モデルを活用する。
さらに生成されたデータは、最新のマルチモーダルモデルを洗練し、適切なアクションをより正確に決定するのに役立つ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:58:54 GMT)
CFBenchmark-MM: Chinese Financial Assistant Benchmark for Multimodal Large Language Model [21.7] MLLM(Multimodal Large Language Models)は、LLM(Large Language Models)の成長とともに急速に発展してきた。
本稿では, CFBenchmark-MMについて紹介する。CFBenchmark-MMは, テーブル, ヒストグラムチャート, ラインチャート, パイチャート, 構造図を含む9000以上の画像検索ペアを持つ中国のマルチモーダル・ファイナンス・ベンチマークである。
我々は、段階的に異なる視覚コンテンツを提供することで、マルチモーダル情報を扱う際のMLLMを評価するための段階的評価システムを開発した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:52:44 GMT)
Adaptive Sensitivity Analysis for Robust Augmentation against Natural Corruptions in Image Segmentation [21.6] 自然汚染に対する堅牢性を高めるための適応型感度誘導型増感法を提案する。
我々の感度分析は平均10倍高速で、以前の感度解析の約200倍のストレージを必要とする。
最小限の微調整により、私たちの感度誘導増強法は、実世界のデータセットと合成データセットの両方で堅牢性を向上させる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:26:53 GMT)
FinLMM-R1: Enhancing Financial Reasoning in LMM through Scalable Data and Reward Design [21.6] FinLMM-R1は、データ構築のための自動化されたスケーラブルなパイプラインと、LMMのマルチモーダル推論を改善するための強化されたトレーニング戦略を組み合わせる。
23,397の財務報告から89,378枚の画像検索ペアを収集し,算術的推論,統計的推論,財務的説明,財務的知識などのタスクを網羅した。
第1段階では、構造化された思考内容の生成において、モデルを導くための形式と精度の報酬を伴うテキストのみのタスクに焦点をあてる。
第2段階では,画像選択,思考内容長,対人報酬などの付加的な報酬成分を付加したマルチイメージコントラスト型サンプルを構築した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:19:31 GMT)
New Paradigm for Integrated sensing and Communication with Rydberg Atomic Receiver [21.3] RYDAR(RYDAR)は理論上、-174dBm/Hz以下の未認識の電気信号を検出できる。
RYDARをベースとしたISACの今後の応用は計画されており、民間と軍事の両方の目的において大きな可能性を示唆している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:45:43 GMT)
Learning an Optimal Assortment Policy under Observational Data [21.1] 我々は,MNL(Multinomial Logit)モデルに基づくオフラインアソシエーション最適化の基本的問題について検討する。
本稿では、オフライン学習のパラダイムを考察し、効率的なオフライン配置最適化のための最小限のデータ要件について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:36:23 GMT)
Curriculum Learning for Biological Sequence Prediction: The Case of De Novo Peptide Sequencing [21.0] 本稿では,構造的タンパク質配列学習戦略を取り入れた非自己回帰ペプチドシークエンシングモデルを提案する。
我々のカリキュラム学習戦略は、様々なデータ分布に対するサンプルトレーニングに基づいて、NATトレーニング失敗頻度を90%以上削減する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:44:25 GMT)
A Novel ViDAR Device With Visual Inertial Encoder Odometry and Reinforcement Learning-Based Active SLAM Method [21.0] 本稿では,新しい視覚-慣性-エンコーダ結合型オドメトリー(VIEO)を提案する。
深部強化学習(DRL)に基づくプラットフォーム動作分離能動SLAM法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:11:57 GMT)
Enhanced SPS Velocity-adaptive Scheme: Access Fairness in 5G NR V2I Networks [21.0] V2I技術は、車両と道路インフラ間の情報交換を可能にする。
本稿では、車両ネットワークの最適化問題を定式化する。
5G NR V2Iモード2のSPS機構における選択ウィンドウを調整し,多目的最適化手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:01:41 GMT)
Active Perception for Tactile Sensing: A Task-Agnostic Attention-Based Approach [20.9] ロボット工学において、アクティブな触覚は重要な研究領域として現れている。
この研究は、部分的に観察可能な環境がもたらす課題に対処するために、TAP(Task-Agnostic Active Perception)を導入している。
設計上、TAPは完全にタスクに依存しず、原則としてあらゆるアクティブな知覚問題に一般化することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:57:39 GMT)
Mixture of Cognitive Reasoners: Modular Reasoning with Brain-Like Specialization [20.9] 本研究では,Mixture of Cognitive Reasoners (MiCRo)アーキテクチャとトレーニングパラダイムを紹介する。
事前学習したトランスフォーマーモデルを4つの専門モジュールに分割し、それぞれがよく研究された認知脳ネットワークに対応する。
人間の認知に関わる生物学的に誘発される誘導バイアスは、解釈可能性、性能、制御性において大きなモデリング上の利益をもたらすことが示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:21:54 GMT)
CMCTS: A Constrained Monte Carlo Tree Search Framework for Mathematical Reasoning in Large Language Model [20.8] 本稿では,大規模言語モデル(LLM)の数学的推論能力を高めるために,制約付きモンテカルロ木探索(CMCTS)フレームワークを提案する。
制約された行動空間、プロセス・リワード・モデル(PRM)、部分順序規則を組み込むことで、CMCTSは状態空間の多様性と行動選択合理性の観点から、この制限を効果的に解決する。
実験結果から, CMCTSは複数の数学的推論ベンチマークにおいて優れた性能を示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:37:38 GMT)
A Technical Study into Small Reasoning Language Models [20.0] 約0.5億のパラメータを持つ小型推論言語モデル (SRLM) は、計算効率とコスト効率が優れており、魅力的な代替手段となる。
本研究では, 教師付き微調整(SFT), 知識蒸留(KD), 強化学習(RL)など, 各種トレーニング戦略について検討し, 0.5B SRLMの性能向上を図る。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:18:11 GMT)
WildCAT3D: Appearance-Aware Multi-View Diffusion in the Wild [20.0] 本研究では,野生で撮影された多様な2次元映像データから得られたシーンの新たなビューを生成するフレームワークWildCAT3Dを提案する。
トレーニングされたモデルは、推論時に新しいシーンに一般化し、複数の一貫した新しいビューを生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:42:52 GMT)
Scientifically-Interpretable Reasoning Network (ScIReN): Uncovering the Black-Box of Nature [20.0] 解釈可能なニューラル推論とプロセスベースの推論を組み合わせた,完全透明なフレームワークを提案する。
解釈可能なエンコーダは科学的に有意な潜在パラメータを予測する。
ScIReNは、科学的解釈可能性を提供しながら、予測精度でブラックボックスネットワークを上回っている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:21:37 GMT)
TensorSLM: Energy-efficient Embedding Compression of Sub-billion Parameter Language Models on Low-end Devices [19.9] 本論文では,Train Decomposition (TTD) を用いたトレーニングフリートークン埋め込み圧縮手法を提案する。
典型的なローエンドデバイスであるRaspberry Pi上で,圧縮率,言語タスク性能,レイテンシ,省エネ性を考慮した低ランク構造の評価を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:09:43 GMT)
Active Multimodal Distillation for Few-shot Action Recognition [19.9] 本稿では,タスク固有のコンテキストキューを用いて,各サンプルに対する信頼度を積極的に識別する新しいフレームワークを提案する。
我々のフレームワークはアクティブサンプル推論(ASI)モジュールを統合し、アクティブ推論を利用して信頼性の高いモダリティを予測する。
強化学習とは異なり、アクティブ推論は報酬をエビデンスに基づく選好に置き換え、より安定した予測を行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:10:56 GMT)
Robust Multi-bit Text Watermark with LLM-based Paraphrasers [19.8] LLMでパラフレーズを埋め込んだ、知覚不能なマルチビットテキスト透かしを提案する。
透かしを埋め込むために、2つのパラフレーズを使って文レベルで定義済みのバイナリコードをエンコードします。
我々の透かしは、小さな(1.1B)テキストパラフレーズでAUCを99.99%以上検出できることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:12:38 GMT)
PeakWeather: MeteoSwiss Weather Station Measurements for Spatiotemporal Deep Learning [19.6] PeakWeatherを紹介します。これは8年以上にわたって10分毎に収集された、高品質な表面気象観測データセットです。
データセットには、スイスの複雑な地形に分布する302のステーション位置から、さまざまな気象変数が含まれている。
PeakWeatherは、基礎的な機械学習研究、気象学、センサーベースのアプリケーションの両方を前進させるために、現実世界のベンチマークとして機能する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:16:42 GMT)
PartInstruct: Part-level Instruction Following for Fine-grained Robot Manipulation [19.6] 本稿では,パートレベルの命令を用いたロボット操作モデルの訓練と評価を行うための,最初の大規模ベンチマークであるPartInstructを紹介する。
PartInstructは、14のカテゴリにまたがる513のオブジェクトインスタンスで構成され、それぞれにアノテートされた部分レベルの情報と、16のタスククラスに編成された1302のきめ細かい操作タスクで構成されている。
トレーニングセットは3Dシミュレータで合成された1万以上のエキスパート・デモからなり、各デモは高レベルなタスク・インストラクション、ベース部分に基づくスキル・インストラクションの連鎖、およびオブジェクトとその部分に関する地中3D情報と組み合わせられる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:45:50 GMT)
GeoRecon: Graph-Level Representation Learning for 3D Molecules via Reconstruction-Based Pretraining [19.4] 分子表現学習のためのグラフレベルの事前学習フレームワークGeoReconを提案する。
事前学習中、モデルは、分子幾何学の再構築を正確に導くことができるグラフ表現を生成するように訓練される。
GeoReconは、ノード中心のベースラインを複数の分子ベンチマークで上回る。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:35:49 GMT)
Unlearning Isn't Invisible: Detecting Unlearning Traces in LLMs from Model Outputs [19.1] 大規模言語モデル(LLM)のための機械学習(MU)は、特定の望ましくないデータや知識を訓練されたモデルから取り除こうとする。
未学習のトレース検出という新たな脆弱性を特定します。
すべてのモデルサイズにわたる未学習トレースの検出において, 誤り関連プロンプトが90%以上の精度で可能であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:03:51 GMT)
The Courage to Stop: Overcoming Sunk Cost Fallacy in Deep Reinforcement Learning [19.0] オフ政治深層学習(RL)は、通常、学習中に過去の経験を再利用するためにリプレイバッファを利用する。
このような非形式的で無駄なトランジションをサンプリングすることは、沈むコストの低下に対処することで回避できる、と我々は主張する。
本稿では,戦略的早期終了を可能にする軽量なメカニズムであるLearning to Stop (LEAST)を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:30:00 GMT)
COME: Adding Scene-Centric Forecasting Control to Occupancy World Model [18.8] 世界モデルは、環境力学をシミュレートし、合成データを生成する自律運転にとって重要である。
既存の方法では、エゴ車の動きを乱すのに苦労している(シーンの進化から振り返る)
本研究では,シーン中心の座標系を利用して環境変化をエゴ運動から分離することを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:01:09 GMT)
Multiverse Through Deepfakes: The MultiFakeVerse Dataset of Person-Centric Visual and Conceptual Manipulations [18.5] GenAI技術は、非常にリアルなディープフェイクコンテンツ生成に寄与している。
進行中の努力にもかかわらず、研究コミュニティには、大規模で推論能力を備えたディープフェイクベンチマークデータセットがまだ欠けている。
本稿では,大規模人物中心のディープフェイクデータセットであるMultiFakeVerseを紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:09:09 GMT)
The Space Complexity of Learning-Unlearning Algorithms [18.4] ユーザに対して強力なデータ削除保証を提供する機械学習アルゴリズムのメモリ複雑性について検討する。
後で特定のトレーニングサンプルを削除するために、どれくらいのストレージが必要か尋ねます。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:31:41 GMT)
ASAP: Learning Generalizable Online Bin Packing via Adaptive Selection After Proposal [18.3] 本稿では,解決者の意思決定を,提案と選択の2つのポリシーに分解するASAPを提案する。
オンライン適応中は、テスト分布に迅速に適応するために選択ポリシーを微調整するのみである。
実験により,ASAPは分布内および分布外インスタンスに優れた一般化と適応能力を示すことが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:20:50 GMT)
Touch begins where vision ends: Generalizable policies for contact-rich manipulation [18.2] 本稿では,微粒な操作タスクを解決するフレームワークであるVisuoTactile Local (ViTaL)ポリシー学習を紹介する。
ViTaLは、目に見えない環境でのコンタクトリッチなタスクで約90%の成功を達成している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:59:48 GMT)
Safe Domains of Attraction for Discrete-Time Nonlinear Systems: Characterization and Verifiable Neural Network Estimation [18.2] 離散時間自律非線形システムにおいて,安全なアトラクション領域を正確に推定する枠組みを提案する。
まず新しいズボフ方程式を導出し、その解はアトラクションの正確な安全な領域に対応する。
次に、ニューラルネットワークを用いてズボフ方程式の解を近似する物理インフォームドアプローチを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:09:51 GMT)
Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning [18.2] 本稿では,複数の3次元シーン理解タスクを同時に扱うために,インスタンス対応3次元大規模マルチモーダルモデル(Inst3D-LMM)を提案する。
まず,MCMF(Multi-view Cross-Modal Fusion)モジュールを導入し,それに対応する幾何学的特徴に多視点2Dセマンティクスを注入する。
シーンレベルの関係対応トークンに対しては、オブジェクト間の複雑な対空間関係をキャプチャするための3次元インスタンス空間関係(3D-ISR)モジュールをさらに提示する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:53:34 GMT)
Scaling Laws for Upcycling Mixture-of-Experts Language Models [17.8] 大規模言語モデル(LLM)の事前トレーニングはリソース集約的であり、ハイエンドのGPUクラスタでも数ヶ月のトレーニング時間を必要とすることが多い。
そのような計算要求を緩和する2つのアプローチがある: より小さなモデルを再利用して、より大きなモデルをトレーニングする(アップサイクル)、そして、Mix-of-experts (MoE)のような計算効率の良いモデルを訓練する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:27:08 GMT)
Seismic Acoustic Impedance Inversion Framework Based on Conditional Latent Generative Diffusion Model [17.7] 本研究では, 条件付き遅延生成拡散モデルに基づく新しい耐震性インバージョンフレームワークを提案する。
提案手法は,数段の拡散ステップで高い反転精度と強い一般化能力が得られることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:19:40 GMT)
FrontendBench: A Benchmark for Evaluating LLMs on Front-End Development via Automatic Evaluation [17.6] FrontendBenchは、人間と大規模言語モデル(LLM)が共同開発したベンチマークである。
このベンチマークは、5つのレベルのWebコンポーネントにまたがる、148の厳密なプロンプト-テストケースペアで構成されている。
自動評価フレームワークはサンドボックス環境内で生成されたコードを実行し、事前に定義されたテストスクリプトを使用して結果を評価する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:20:31 GMT)
VIS-Shepherd: Constructing Critic for LLM-based Data Visualization Generation [17.6] MLLM(Multimodal Large Language Model)をベースとした評価モデルであるVIS-Shepherdを紹介する。
当社のアプローチの核心は、高品質な可視化基準データセットを構築するためのフレームワークです。
実験の結果,オープンソースMLLMモデルでは,小型(7Bパラメータ)のMLLMモデルでも大幅な性能向上が得られた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:15:38 GMT)
Estimation of Treatment Effects in Extreme and Unobserved Data [17.5] 極端データにおける治療効果を評価するための新しい枠組みを導入し, 稀な事象発生時の因果効果を捉えた。
極端治療効果に対する一貫した推定器を開発し,その性能について厳密な非漸近解析を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:17:44 GMT)
Consistency of Neural Causal Partial Identification [17.5] 因果モデル(Causal Models)の最近の進歩は、因果効果の同定と部分的同定が神経生成モデルによって自動的に行われるかを示した。
連続変数とカテゴリー変数の両方を持つ一般設定において、NCMによる部分的識別の整合性を証明する。
結果は、深さと接続性の観点から、基盤となるニューラルネットワークアーキテクチャの設計の影響を強調している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:15:21 GMT)
Boosting Column Generation with Graph Neural Networks for Joint Rider Trip Planning and Crew Shift Scheduling [17.5] 本稿では,JRTPCSSP(Joint Rider Trip Planning and Crew Shift Scheduling Problem)とAttention and Gated GNN-Informed Column Generation(AGGNNI-CG)と呼ばれる新しい解法を提案する。
AGGNNI-CGは、列生成と機械学習をハイブリダイズして、アプリケーションの現実的な制約を伴って、JRTPCSSPのほぼ最適解を得る。
AGGNNI-CGは、ジョージア州チャタム郡のパラトランジットシステムから、挑戦的な実世界のデータセットに適用されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:57:28 GMT)
EffiCoder: Enhancing Code Generation in Large Language Models through Efficiency-Aware Fine-tuning [17.4] 大規模言語モデル(LLM)は、コード生成においてますます重要な役割を果たす。
EffiCoderを導入し、高品質なデータセット上でLLMを微調整することで、両方の面を改善する。
EffiCoderは、AI駆動のコード生成を進めるためのスケーラブルで効果的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:27:30 GMT)
DesignCoder: Hierarchy-Aware and Self-Correcting UI Code Generation with Large Language Models [17.3] DesignCoderは、階層的かつ自己修正の自動化コード生成フレームワークである。
複雑なネストUI階層を理解し予測するMLLMの能力を向上するUI Grouping Chainsを導入する。
また、生成したコードのエラーを特定し、修正するモデルの能力を改善するための自己補正機構も組み込んでいます。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:20:43 GMT)
Deep Learning for Wildfire Risk Prediction: Integrating Remote Sensing and Environmental Data [17.3] 森林火災は生態系、野生生物、人間社会に重大な脅威をもたらし、生息地の破壊、汚染物質の排出、損失につながる。
本稿では,リモートセンシングと併用したディープラーニングアプローチを中心に,山火事リスク予測手法の総合的なレビューを行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:07:17 GMT)
SimpleDoc: Multi-Modal Document Understanding with Dual-Cue Page Retrieval and Iterative Refinement [17.3] Document Visual Question Answering (DocVQA)は実用的で難しいタスクである。
最近の手法は、同様のRAG(Retrieval Augmented Generation)パイプラインに従う。
DocVQA用の拡張フレームワークであるSimpleDocを紹介します。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:15:58 GMT)
DualFast: Dual-Speedup Framework for Fast Sampling of Diffusion Models [17.1] 拡散確率モデル(DPM)は視覚生成において顕著な成功を収めた。
反復サンプリングによる推論速度の低下に悩まされる。
既存の高速サンプリング器は、離散化誤差を減らすために刺激的な努力をする。
サンプリングプロセスはさらに加速できるのだろうか?
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:59:57 GMT)
Unifying Uniform and Binary-coding Quantization for Accurate Compression of Large Language Models [17.1] 大規模言語モデル(LLM)の正確な量子化手法であるUniQuanF (UniQuanF with Flexible Mapping)を提案する。
UniQuanFは、UQのフレキシブルマッピング技術とBCQの非一様量子化レベルを統合することで、強い表現性と最適化性を利用する。
実験の結果、UniQuanFは既存のUQとBCQの手法より優れており、GSM8Kベンチマークで最大4.60%高い精度を達成している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:25:05 GMT)
Towards Geo-Culturally Grounded LLM Generations [16.9] ジェネレーティブ・大型言語モデル(LLM)は、世界中の多様な文化的認識のギャップを実証している。
本研究では,LLMが様々な国文化に親しみを呈する能力に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:58:21 GMT)
RealHiTBench: A Comprehensive Realistic Hierarchical Table Benchmark for Evaluating LLM-Based Table Analysis [16.6] RealHiTBenchは、様々な入力フォーマットにわたるLarge Language Models (LLM)のパフォーマンスを評価するために設計されたベンチマークである。
LLMを25個使用した実験の結果,RealHiTBenchは本当に難しいベンチマークであることがわかった。
また、階層的なヘッダをツリー構造に整理するツリーベースのパイプラインであるTreeThinkerも開発しています。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:19:08 GMT)
Decoupled Cross-Modal Alignment Network for Text-RGBT Person Retrieval and A High-Quality Benchmark [16.2] 検索の堅牢性を高める効果的な戦略として,クロスモーダル情報融合が出現している。
可視光と熱の両モードの相補的な手がかりを組み合わせることで、クロススペクトル情報融合を取り入れたText-RGBT Person Retrievalを提案する。
本研究では,この分野の研究開発を促進するために,高品質なテキストRGBT人物検索データセットであるRGBT-PEDESを作成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:46:17 GMT)
Learning to utilize image second-order derivative information for crisp edge detection [16.2] エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:04:24 GMT)
How Much Can We Forget about Data Contamination? [15.9] トレーニングデータへのベンチマークデータの漏洩は、大規模言語モデルにとって重要な課題である。
3次元のスケーリングに基づいてベンチマークオーバーフィッティングの規模を実験的に定量化する。
また, 重み劣化パラメータが例忘れに及ぼす影響について検討し, 累積重み劣化よりも経験的忘れが早く起こることを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:00:21 GMT)
A Robust Real-Time Lane Detection Method with Fog-Enhanced Feature Fusion for Foggy Conditions [15.9] 実世界の霧のシナリオで捉えたFogyLaneデータセットを導入し、FogyCULaneとFogyTusimpleという2つの追加データセットを合成する。
我々は,Global Feature Fusion Module (GFFM) を組み込んで,霧画像のグローバルな関係を捉えることにより,車線検出のためのロバストなFog-Enhanced Networkを提案する。
F1スコアはFogyLaneで95.04、FogyCULaneで79.85、FogyTusimpleで96.95である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:05:37 GMT)
Sustainable Machine Learning Retraining: Optimizing Energy Efficiency Without Compromising Accuracy [15.7] 本稿では,一般的なリトレーニング手法のエネルギー消費について検討する。
最新のデータのみによるリトレーニングは、すべての利用可能なデータと比較して、エネルギー消費を最大25%削減することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:53:02 GMT)
FoMoH: A clinically meaningful foundation model evaluation for structured electronic health records [15.6] ファンデーションモデルは、下流のタスクとは無関係に意味のある表現を抽出する能力を考えると、医療において大きな可能性を秘めている。
包括的かつ有意義なタスクのデシダラタが欠如していることから、これらのモデルが臨床的有用性にもたらす可能性については、ほとんど意見の一致がない。
コロンビア大学アーヴィング医療センターの500万人の患者を対象に, EHRデータに基づく最先端基礎モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:03:07 GMT)
Efficient Numerical Integration in Reproducing Kernel Hilbert Spaces via Leverage Scores Sampling [15.6] 本稿では,積分を対象確率測度に対して,積分の点的評価のみを用いて近似する問題を考察する。
本稿では,初期観測から得られる近似レバレッジスコアを用いて,$mn$サンプルのランダムな小部分集合を均一に描画するか,あるいは近似的に評価する手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:06:17 GMT)
An invitation to the sample complexity of quantum hypothesis testing [15.5] 量子仮説テスト(QHT)のサンプル複雑性について検討する。
我々は、対称的および非対称的な設定において、二項QHTのサンプル複雑性を特徴づける。
複数のQHTのサンプル複雑性に関するバウンダリを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:16:37 GMT)
Affordable AI Assistants with Knowledge Graph of Thoughts [15.5] 大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。
我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。
KGoTはGAIAベンチマークでのタスク成功率を、GPT-4o miniのHugging Face Agentsと比較して29%改善した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:19:01 GMT)
MT-PCR: A Hybrid Mamba-Transformer with Spatial Serialization for Hierarchical Point Cloud Registration [15.5] 我々は,MambaモジュールとTransformerモジュールを統合した最初のポイントクラウド登録フレームワークであるMT-PCRを提案する。
MT-PCRはトランスフォーマー法および同時処理法よりも精度と効率が優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:49:43 GMT)
How Does LLM Reasoning Work for Code? A Survey and a Call to Action [15.4] 大規模言語モデル (LLM) はコード領域に拡張され、コード生成、翻訳、要約、修復といった複雑な作業が容易になった。
特に、GitHubのイシュー解決のようなソフトウェアエンジニアリング(SWE)タスクについて研究されている。
本研究では,そのようなタスクを遂行する能力が不足しているコード推論手法について検討し,その性能向上に使用されるパラダイムについて検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:18:09 GMT)
CAT: Contrastive Adversarial Training for Evaluating the Robustness of Protective Perturbations in Latent Diffusion Models [15.4] 保護的摂動としての敵対的な例は、不正なデータの使用を防ぐために開発された。
本稿では,これらの保護手法に対する適応的攻撃として,コントラスト対応訓練(Contrastive Adversarial Training, CAT)を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:12:59 GMT)
Understanding Learning Invariance in Deep Linear Networks [15.3] 等変および不変の機械学習モデルは、サンプル効率を改善するためにデータの対称性と構造パターンを利用する。
本稿では,データ拡張,正規化,ハードワイリングという,不変性を実現するための3つのアプローチに関する理論的比較を行う。
ハードワイアリングとデータ拡張における最適化問題の要点は,サドルと大域的最適化のみから構成される,同一であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:24:07 GMT)
Meta-learning how to Share Credit among Macro-Actions [15.3] この難しさは、エピソードごとの平均決定回数を減らすことと、アクションスペースのサイズを増やすことのトレードオフに起因すると我々は主張する。
本稿では,行動とマクロアクションの関係を利用して信用代入メカニズムを改善する新しい正規化用語を提案する。
その結果,全環境におけるレインボー-DQNベースラインの大幅な改善が認められた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:52:49 GMT)
Attribution-guided Pruning for Compression, Circuit Discovery, and Targeted Correction in LLMs [15.2] 大規模言語モデル(LLM)は多くの現代のAIアプリケーションの中心である。
eXplainable AI(XAI)の最近の研究は、解釈可能性がモデル圧縮を可能にすることを示唆している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:38:36 GMT)
Assessing the Limits of In-Context Learning beyond Functions using Partially Ordered Relation [14.9] 本稿では,帰納的複雑化の概念を導入し,部分順序関係におけるICLの性能について述べる。
ほとんどの場合、選択された計量の飽和性能は、ICLはいくつかの利点を提供するが、十分な実証例が存在する場合でも、プロンプトの複雑さが増大するにつれて、その効果が制限されていることを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:35:41 GMT)
Test-time Contrastive Concepts for Open-world Semantic Segmentation with Vision-Language Models [14.9] 最近のCLIP-like Vision-Language Models (VLM)は、大量の画像テキストペアで事前訓練され、オープン語彙セマンティックセマンティックセグメンテーションへの道を開いた。
本稿では,クエリ固有のテキストコントラストの概念を自動生成する2つのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:01:40 GMT)
Tady: A Neural Disassembler without Structural Constraint Violations [14.8] 改良されたモデルアーキテクチャと専用の後処理アルゴリズムを備えたニューラルディスアセンブラであるTadyを紹介する。
そこで,Tadyは命令レベルの精度を維持しつつ,構造的制約違反や関数を高い効率で効果的に除去することを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:11:43 GMT)
Neural Genetic Search in Discrete Spaces [14.7] 我々は新しいテスト時間探索法であるニューラル・ジェネティック・サーチ(NGS)を導入する。
NGSは、遺伝的アルゴリズムの進化のメカニズムを深層モデルの生成手順に組み込んでいる。
このアプローチは、深層生成モデルのための汎用的で実装が容易な探索アルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:45:59 GMT)
Calibrated Predictive Lower Bounds on Time-to-Unsafe-Sampling in LLMs [14.6] 我々は、安全でない(有害な)応答を引き起こすのに必要な大規模言語モデル(LLM)世代数を定量化するフレームワークを開発する。
我々の重要な革新は、凸最適化問題として定式化された適応型、プロンプトごとのサンプリング戦略を設計することである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:21:25 GMT)
Enhancing Goal-oriented Proactive Dialogue Systems via Consistency Reflection and Correction [14.5] ゴール指向対話システムにおいて, 整合性反射補正法を提案する。
本稿では,ゴール指向対話システムにおける一貫性の反映と補正手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:15:21 GMT)
Improving Multimodal Learning Balance and Sufficiency through Data Remixing [14.3] 弱いモダリティを強制する方法は、単調な充足性とマルチモーダルなバランスを達成できない。
マルチモーダルデータのデカップリングや,各モーダルに対するハードサンプルのフィルタリングなど,モダリティの不均衡を軽減するマルチモーダルデータリミックスを提案する。
提案手法は既存の手法とシームレスに統合され,CREMADでは約6.50%$uparrow$,Kineetic-Soundsでは3.41%$uparrow$の精度が向上する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:50:29 GMT)
Dive3D: Diverse Distillation-based Text-to-3D Generation via Score Implicit Matching [14.3] 我々は,KLに基づく目的をScore Implicit Matching (SIM)損失に置き換える新しいテキストから3D生成フレームワークであるDive3Dを紹介する。
様々な2D-to-3DプロンプトにまたがってDive3Dを検証した結果,定性評価において従来手法よりも常に優れていたことが判明した。
Dive3Dはまた、テキスト・アセットアライメント、3Dの可視性、テキスト・ジオメトリの一貫性、テクスチャの質、幾何学的ディテールなど、定量的な指標に関する強力な結果も達成している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:21:30 GMT)
A Memetic Walrus Algorithm with Expert-guided Strategy for Adaptive Curriculum Sequencing [14.3] 本稿では,3つの重要な革新を通じて最適化を向上するメメティック・ワラスを提案する。
OULADデータセットの実験では、MWOの優れたパフォーマンスが示されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:45:02 GMT)
Navigating the Black Box: Leveraging LLMs for Effective Text-Level Graph Injection Attacks [14.2] 本稿では,テキスト分散グラフ(TAG)に適した新しいブラックボックスGIAフレームワークであるATAG-LLMを紹介する。
提案手法は,大言語モデル(LLM)を利用して,解釈可能なテキストレベルのノード属性を直接生成する。
厳格なブラックボックス設定では、ターゲットノードを最小限のトレーニングコストで効率よく摂動し、TAGに対するテキストレベルのグラフインジェクション攻撃を確実にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:16:21 GMT)
Distinct Computations Emerge From Compositional Curricula in In-Context Learning [14.1] コンポジションサブタスクのカリキュラムを文脈で提示することで、トランスフォーマーが学習する計算をどう変えるかを検討する。
サブタスクのカリキュラムで訓練されたモデルは、目に見えない構成タスクに対してゼロショット推論を行うことができることを示す。
これらのモデルには,カリキュラム設計によって変調された多種多様な戦略が採用されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:49:42 GMT)
Mitigating Data Poisoning Attacks to Local Differential Privacy [14.1] 本稿では,新しい防御機能群を含む一般的な周波数推定のための包括的緩和フレームワークを提案する。
そこで本研究では,ウシの報告を正確に識別する新たな手法を提案する。
攻撃行動がステルス化し、悪意のあるユーザを直接フィルタリングするのは難しい場合、隠れた敵のパターンを効果的に認識できる検出法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:08:15 GMT)
Efficient Unsupervised Shortcut Learning Detection and Mitigation in Transformers [13.8] ショートカット学習(ショートカットラーニング)、すなわち、タスクに直接関係しない望ましくない機能への依存は、機械学習アルゴリズムの適用を厳しく制限する大きな課題である。
我々は、機械学習の最近の進歩を活用して、トランスフォーマーにおけるショートカット学習の検出と緩和の両立が可能な教師なしのフレームワークを作成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:28:17 GMT)
Model Context Protocol (MCP) at First Glance: Studying the Security and Maintainability of MCP Servers [13.7] Anthropicは2024年後半にこのツールエコシステムを標準化するためにModel Context Protocol (MCP)を導入した。
採用にもかかわらず、MPPのAI駆動の非決定論的制御フローは、持続可能性、セキュリティ、保守性に対する新たなリスクをもたらす。
我々は1,899のオープンソースMPPサーバを評価し,その健全性,セキュリティ,保守性を評価した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:26:37 GMT)
Zero-Shot Temporal Interaction Localization for Egocentric Videos [13.7] EgoLocと呼ばれる新しいゼロショットTIL手法を提案する。
2Dと3Dの両方を吸収することにより、EgoLocはHOIの接触/分離タイムスタンプに関する高品質な初期推定を直接サンプリングする。
EgoLocは、最先端のベースラインに比べて、エゴセントリックなビデオの時間的相互作用のローカライゼーションが優れている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:47:36 GMT)
Dissecting RGB-D Learning for Improved Multi-modal Fusion [13.7] RGB-Dモデルの相補的および融合機構はブラックボックスのままである。
本稿では,RGB-Dビジョンコミュニティを識別するための分析フレームワークと新たなスコアを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:26:24 GMT)
New characterization of full weight spectrum one-orbit cyclic subspace codes [13.7] 我々は、FWS符号の族における重み分布を決定し、一定の条件下でFWS符号の同値類を示す。
我々は$r$-FWS符号の完全な分類を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:34:38 GMT)
Convergence Analysis of the Wasserstein Proximal Algorithm beyond Geodesic Convexity [13.5] 近位降下アルゴリズムは、一般計量空間における非線形および非滑らか性に対する強力なツールである。
平均場ニューラルネットワークにおけるユークリッドアルゴリズムよりも高速な収束率を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:47:31 GMT)
A Dataless Reinforcement Learning Approach to Rounding Hyperplane Optimization for Max-Cut [13.4] エージェントが改良された丸みを帯びた超平面を選択し、ゴーマンス・ウィリアムソン(GW)アルゴリズムで生成されたものよりも優れたカットを得られるように学習する、非エポゾディック強化学習の定式化に基づくトレーニングデータフリーアプローチを提案する。
提案手法は, 密度や次数分布の異なる大規模グラフに対して, より優れたカットを一貫して達成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:31:49 GMT)
Constant Stepsize Local GD for Logistic Regression: Acceleration by Instability [13.3] 我々は,任意の段数 $eta > 0$ を用いて,分離可能な異種データを用いたロジスティック回帰のための局所勾配 Descent の解析を行った。
我々の分析は、非常に大きなステップサイズによって不安定が引き起こされる、citewu2024largeの単一マシン解析と並行して行われる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:29:00 GMT)
A Probabilistic Neuro-symbolic Layer for Algebraic Constraint Satisfaction [13.2] 安全クリティカルなアプリケーションでは、線形連続環境の制約の満足度が不可欠である。
非連結制約の満足度を保証する様々な近似を導入する。
この定式化は記号積分による効率的かつ正確な再正規化を可能にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:05:22 GMT)
Bias Delayed is Bias Denied? Assessing the Effect of Reporting Delays on Disparity Assessments [13.2] 遅延した人口統計データは、監視と行動の重要な点で欠落している可能性がある。
我々は,50州すべてにおいて,プライマリケアの実践を通じて500万人以上の患者の電子的健康記録を用いて,医療におけるそのような影響を特徴づけた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:44:17 GMT)
Low-dimensional adaptation of diffusion models: Convergence in total variation [13.2] 拡散生成モデルが(未知の)低次元構造をどのように活用してサンプリングを高速化するかを検討する。
本研究はDDIM型試料試料の未知の低次元構造への適応性を示す最初の厳密な証拠である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:24:32 GMT)
Evolution of ReID: From Early Methods to LLM Integration [13.2] 人物の再識別は、手作りの特徴に基づく手法からディープラーニングアプローチへと進化してきた。
この調査は、完全な進化を辿り、大規模な言語モデルを利用するReIDアプローチに関する最初の包括的なレビューの1つを提供する。
重要な貢献は、画像とテキストのアライメントを強化するGPT-4oによって生成される動的でアイデンティティ固有のプロンプトを使用することである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:03:46 GMT)
Quantifying Structure in CLIP Embeddings: A Statistical Framework for Concept Interpretation [13.2] 概念に基づくアプローチは、モデルの内部表現の中で人間の理解可能な概念を特定することを目的としている。
現在の手法では統計的厳密さが欠如しており、特定の概念を検証し、異なる手法を比較することは困難である。
本稿では,CLIP埋め込み空間内の回転感度構造を定量化する仮説テストフレームワークを提案する。
既存のアプローチとは異なり、発見された概念は堅牢で再現可能なパターンを表すという理論的保証を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:43:11 GMT)
Adapting Whisper for Parameter-efficient Code-Switching Speech Recognition via Soft Prompt Tuning [13.2] Whisperのような大規模多言語ASRモデルは、高リソース設定では優れているが、低リソースシナリオでは課題に直面している。
SPT(Soft Prompt Tuning)は,CS ASRを事前知識を維持しつつ拡張するパラメータ効率の高い手法である。
本研究では,(1)ソフトプロンプトとWhisperモデルの完全微調整(FFT),(2)ソフトプロンプトのみを凍結することでSPTのオリジナルデザインに固執し,ソフトプロンプトの訓練を行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:14:51 GMT)
When Detection Fails: The Power of Fine-Tuned Models to Generate Human-Like Social Media Text [13.1] ソーシャルメディアは、オンライン・インフルエンス・キャンペーンにおいて重要な攻撃源となっている。
我々は、オープンソース、クローズドソース、微調整されたLLMの組み合わせから、505,159のAI生成ソーシャルメディアポストのデータセットを作成します。
典型的な研究仮定の下ではポストを検出できるが、攻撃者が細調整されたモデルを公開しないというより現実的な仮定の下では、検出可能性は劇的に低下する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:31:25 GMT)
ReinDSplit: Reinforced Dynamic Split Learning for Pest Recognition in Precision Agriculture [13.0] 我々はReinDSplitを紹介した。ReinDSplitは強化学習フレームワークで、各デバイスに対してスプリットポイントを動的に調整する。
Qラーニングエージェントは適応オーケストレータとして機能し、ワークロードとデバイス間のレイテンシしきい値のバランスをとる。
ResNet18, GoogleNet, MobileNetV2の3種類の昆虫分類データセットを用いてReinDSplitを評価する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:18:56 GMT)
A Survey on World Models Grounded in Acoustic Physical Information [13.0] 本調査は, 音波物理情報に基づく世界モデルの新しい分野を包括的に概観する。
理論的基盤、重要な方法論の枠組み、最近の技術進歩について考察する。
この調査では、ロボット工学、自律運転、ヘルスケア、ファイナンスにおけるアコースティックワールドモデルの重要な応用について詳述している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:59:42 GMT)
Testing the quantum nature of gravity through interferometry [13.0] このプロトコルの特徴は、SN自己重力によって誘導される2つのインターフェロメトリアームの非対称性を利用して、試験質量の共通運動と微分運動の間のクロストークを生成することである。
以上の結果から,10dB圧縮入力状態の補助を行うと,1ケルビン環境下でSN理論を確定的に検証するのに十分な信号-雑音比が得られた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:05:41 GMT)
Accelerating PDE-Constrained Optimization by the Derivative of Neural Operators [12.8] 勾配に基づくPDE制約最適化問題のための新しいフレームワークを提案する。
我々は,ニューラル演算子を専門的に訓練し,ニューラル演算子内での微分学習を強化する。
実験により,演算子とその導関数を正確に学習する上で,モデルの有効性が示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:58:36 GMT)
Regional climate risk assessment from climate models using probabilistic machine learning [12.7] GenFocalは、微細な時間スケールで相互作用する複雑な気候プロセスのための汎用的でエンドツーエンドな生成フレームワークである。
現在の気候における極端なリスクを、先進的なアプローチよりも正確に評価する。
GenFocalは、気候の予測がdecadalの時間スケールに与える影響に関する文献と一致する、魅力的な結果を示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:56:55 GMT)
What Matters in Learning from Large-Scale Datasets for Robot Manipulation [12.7] 我々はこの質問に答えるために大規模なデータセット合成研究を行っている。
既存のデータセットの多様性の共通源を手続き的にエミュレートするデータ生成フレームワークを開発した。
カメラのポーズや空間配置は、収集における多様性と検索におけるアライメントの両方にとって重要な次元であることがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:25:29 GMT)
ActiveSplat: High-Fidelity Scene Reconstruction through Active Gaussian Splatting [12.6] ガウススプラッティングを利用した自律型高忠実度再構築システムであるActiveSplatを提案する。
このシステムは、オンラインマッピング、視点選択、経路計画のための統合されたフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:09:39 GMT)
AdaLRS: Loss-Guided Adaptive Learning Rate Search for Efficient Foundation Model Pretraining [12.6] オンライン最適学習率探索を行うプラグイン・アンド・プレイ適応学習率探索アルゴリズムである textbfAdaLRS を提案する。
実験により,AdaLRSは最適近傍の最適学習率を顕著な効率と有効性で調整することが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:14:01 GMT)
Membership Inference Attacks as Privacy Tools: Reliability, Disparity and Ensemble [12.5] メンバーシップ推論攻撃(MIA)は、機械学習モデルのプライバシに重大な脅威をもたらす。
MIA以前の研究は、主にAUC、精度、TPR@low FPRなどのパフォーマンス指標に焦点を当てていた。
これらの格差は、プライバシー評価ツールとしてのMIAの信頼性と完全性に重要な意味を持つ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:22:07 GMT)
Language-Aware Prompt Tuning for Parameter-Efficient Seamless Language Expansion in Multilingual ASR [12.3] 本稿では,言語干渉や未知言語への拡張といった課題に対処する。
FLEURSによる3言語にわたる実験では、Entire SPTとLAPTは言語拡張タスクにおいてDecoder SPTを5.0%、16.4%上回った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:15:53 GMT)
LocationReasoner: Evaluating LLMs on Real-World Site Selection Reasoning [12.3] 実世界のサイト選択の文脈において,大規模言語モデルの推論能力を評価するために設計されたベンチマークであるLocationReasonerを紹介する。
このベンチマークは、制約ベースの位置情報検索のための社内ツールによってサポートされている、さまざまな難易度を持つ300以上の慎重に構築されたクエリで構成されている。
大規模な評価は、最先端の推論モデルが、現実の文脈において、非合理的な前者よりも限られた改善をもたらすことを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:23:56 GMT)
Open-Set LiDAR Panoptic Segmentation Guided by Uncertainty-Aware Learning [12.3] 我々は不確実性誘導型オープンセット・パノプティクス・セグメンテーション・フレームワークであるULOPSを提案する。
我々のアーキテクチャは、不確実性推定を伴うセマンティックセグメンテーションのための分離されたデコーダを組み込んでいる。
推論中、未知のインスタンスを識別および分割するために不確実性推定を利用する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:03:51 GMT)
A Survey on Imitation Learning for Contact-Rich Tasks in Robotics [12.2] 本稿では、微妙な相互作用のダイナミクスを捉えるのに欠かせない指導方法や感覚モダリティを含む実証収集手法について検討する。
マルチモーダル学習と基礎モデルの最近の進歩は、産業、家庭、医療領域にまたがる複雑なコンタクトタスクの性能を著しく向上させてきた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:55:20 GMT)
Achieving Collective Welfare in Multi-Agent Reinforcement Learning via Suggestion Sharing [12.2] 自己利益と集団福祉の対立は、しばしば共有福祉を達成する努力を妨げる。
この問題に対処する新しいマルチエージェント強化学習法(MARL)を提案する。
報酬、価値、ポリシーを共有する従来の協調型MARLソリューションとは異なり、エージェントがアクション提案を交換する新しいMARLアプローチを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:10:31 GMT)
EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics [12.1] EmoDynamiXは、ユーザの微粒な感情と、不均一なグラフを使用してシステム戦略の間の談話ダイナミクスをモデル化し、パフォーマンスと透明性を改善します。
2つのESCデータセットの実験結果から、EmoDynamiXは従来の最先端の手法よりも優れたマージンを持つことが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:32:22 GMT)
Sample Complexity of the Linear Quadratic Regulator: A Reinforcement Learning Lens [12.0] 我々は,$widetildemathcalO (1/varepsilon)$関数評価において,$varepsilon$-optimalityを達成する最初のアルゴリズムを提供する。
この結果は,2点勾配推定の領域外において,既存の文献を著しく改善する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:29:16 GMT)
SuperPlace: The Renaissance of Classical Feature Aggregation for Visual Place Recognition in the Era of Foundation Models [11.9] 我々は古典的特徴集約法を復活させ、より基本的なVPRモデルを開発し、まとめてSuperPlaceと呼ぶ。
G$2$Mは、最近の手法と比較して、特徴次元のわずか10分の1で有望な結果が得られる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:40:49 GMT)
ADAgent: LLM Agent for Alzheimer's Disease Analysis with Collaborative Coordinator [11.9] アルツハイマー病(英語: Alzheimer's disease、AD)は、進行性神経変性疾患である。
既存の手法のほとんどは、医療専門家が使用する多面的アプローチとは対照的に、単一モダリティデータに依存している。
本稿では,ユーザクエリに対処し,意思決定を支援するために,大規模言語モデル(LLM)上に構築されたAD分析のためのAIエージェントであるADAgentを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:56:04 GMT)
Empirical Evaluation of Large Language Models in Automated Program Repair [11.8] 大規模言語モデル(LLM)は、自動プログラム修復(APR)のための新しい機会を提供する
我々は,7Bから33Bパラメータ,多様なアーキテクチャ,目的の4つのオープンソースLLM,CodeLlama,LLaMA,StarCoder,DeepSeek-Coderを研究した。
2つのバグシナリオ(エンタプライズグレードとアルゴリズム)、3つの言語(Java、C/C++、Python)と4つのプロンプト戦略で評価し、6つのベンチマークで600万以上の生成されたパッチを分析しました。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:52:15 GMT)
Instruction Following by Boosting Attention of Large Language Models [11.7] 潜水ステアリングは 内部の活性化を 誘導する 軽量な技術だ
InstABoostは、世代間のモデルの注意を変えることで、インストラクションの強度を高める。
InstABoostは従来のプロンプトと潜伏したステアリングよりも優れたコントロール成功を示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:42:35 GMT)
Bures-Wasserstein Flow Matching for Graph Generation [11.6] グラフ生成は分子設計から薬物発見まで、分野において重要なタスクとして現れてきた。
グラフの基本的な幾何学を尊重するグラフ生成のためのフローマッチングフレームワークであるBWFlowを紹介する。
新たなフレームワークは、連続的および離散的なフローマッチングアルゴリズムの両方に適用できる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:36:56 GMT)
PRO: Projection Domain Synthesis for CT Imaging [11.6] PROは、潜在拡散モデルを用いて投影領域でCT画像合成を行う最初のフレームワークである。
Proは生の投影データからリッチな構造的表現を学習し、制御可能な合成のためにアナトミカルテキストプロンプトを利用する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:57:29 GMT)
MoNetV2: Enhanced Motion Network for Freehand 3D Ultrasound Reconstruction [11.5] 本研究では,多様な走査速度と戦術の下での再構成の精度と一般化性を高めるために,MoNetV2の拡張型モーションネットワークを提案する。
MoNetV2は、再構築品質と3つの大きなデータセットでの汎用性の両方のパフォーマンスにおいて、既存のメソッドを上回っている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:57:34 GMT)
Disentangling Codemixing in Chats: The NUS ABC Codemixed Corpus [11.5] コードミキシングは、単一の言説の中で複数の言語からの言語要素をシームレスに統合する。
著者ラベル付きで、人間の会話や関係をモデル化するのに適した公開コーパスが不足している。
本研究では,厳格なプライバシと倫理基準を維持しつつ,文脈におけるコードミキシングを理解するためのラベル付き汎用コーパスについて紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:12:52 GMT)
VideoMat: Extracting PBR Materials from Video Diffusion Models [11.5] テキストプロンプトや1つの画像が与えられた3Dモデルの高品質な素材を生成するために、微調整ビデオ拡散モデル、ビデオの本質的な分解、および物理ベースで微分可能なレンダリングを利用する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:02:05 GMT)
HKD4VLM: A Progressive Hybrid Knowledge Distillation Framework for Robust Multimodal Hallucination and Factuality Detection in VLMs [11.4] 本稿では、Responsible AIチャレンジの2つのトラックに対するソリューションを提案する。
本稿では,HKD4VLMと呼ばれる,先進的なハイブリッド知識蒸留フレームワークを提案する。
具体的には、このフレームワークをピラミッド様のプログレッシブオンライン蒸留と3次結合精製蒸留に分解することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:03:41 GMT)
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions [11.3] 大規模言語モデル(LLM)は、有害な行動を引き起こすジェイルブレイク攻撃に対して脆弱なままである。
悪意のあるユーザは、有害な意図のために、共通のインタラクションパターンを簡単に活用することができます。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:13:14 GMT)
CoIFNet: A Unified Framework for Multivariate Time Series Forecasting with Missing Values [11.2] CoIFNet(Collaborative Imputation-Forecasting Network)は、不備な値の存在下で堅牢なMTSFを実現するために、インキュベーションと予測を統合する新しいフレームワークである。
CoIFNetは、$underlinetextbf24.40$%$underlinetextbf23.81$%($underlinetextbf23.81$%)の損失率0.6で、また$underlineboldsymbol4.3times$と$underlineboldsymbol2.1times$でメモリと時間の効率を改善している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:15:12 GMT)
Truth Knows No Language: Evaluating Truthfulness Beyond English [11.2] 本稿では,バスク語,カタルーニャ語,ガリシア語,スペイン語の真正性を評価するために,TrathfulQAベンチマークをプロ翻訳して導入する。
本研究は, 人的評価, 複数選択尺度, LLM-as-a-Judge スコアを用いて, 基礎モデルと指導訓練モデルを比較し, 最先端のオープンLCMを12個評価した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:10:18 GMT)
Experimental Design for Semiparametric Bandits [11.2] 両腕の報酬が線形成分と未知の、潜在的に敵対的なシフトを組み合わせた有限腕半パラメトリックバンドについて検討する。
我々は,シャープな後悔境界,PAC境界,ベストアーム識別保証を同時に提供する最初の実験設計手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:53:00 GMT)
AnalogXpert: Automating Analog Topology Synthesis by Incorporating Circuit Design Expertise into Large Language Models [11.0] 本稿では,実用的なトポロジ合成問題の解決を目的としたLLMベースのエージェントであるAnalogXpertを提案する。
まず、アナログトポロジをSPICEコードとして表現し、設計空間を減らすためにサブ回路ライブラリを導入する。
第2に、CoTと非コンテキスト学習技術を用いて、問題を2つのサブタスクに分解する。
第3に,LLMが初期設計の誤りを漸進的に修正できる証明読解戦略を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:21:40 GMT)
Gated Rotary-Enhanced Linear Attention for Long-term Sequential Recommendation [10.9] Gated Rotary Enhanced Linear Attention (RecGRELA) を用いた長期連続勧告モデルを提案する。
まず,ユーザの履歴情報内の長距離依存性をモデル化するためのRELA(Rotary-Enhanced Linear Attention)モジュールを提案する。
次に、局所的選好を取り入れた局所的ショートオペレーションを導入し、理論的洞察を実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:56:10 GMT)
A dataset of questions on decision-theoretic reasoning in Newcomb-like problems [10.8] いわゆるニューコム型問題の決定理論において,自然言語質問のデータセットを導入する。
ニューコムのような問題に対する推論のいくつかの方法は、モデル間のより深い協調を可能にするかもしれない。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:12:47 GMT)
Zero-Shot Solving of Imaging Inverse Problems via Noise-Refined Likelihood Guided Diffusion Models [10.7] モデル再構成なしに様々な画像逆問題に対処できるゼロショットフレームワークを提案する。
そこで我々は,確率値の閉形式近似を導出するノイズ改善機構を提案する。
我々は、推論効率をさらに向上するために、Denoising Diffusion Implicit Models (DDIM) サンプリング戦略を統合する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:56:50 GMT)
Manifold Metric: A Loss Landscape Approach for Predicting Model Performance [10.7] 損失ランドスケープに基づく新しい視点を導入し、線形連結されたミニマの多様体を含むことを示した。
具体的には、モデル展開の影響を研究するために、この多様体のサイズを推定する計量を提案する。
実験の結果, 実測値と実測値との相関が強く, より深いモデル比較が可能となった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:39:12 GMT)
Maximizing Information in Domain-Invariant Representation Improves Transfer Learning [10.7] ドメイン適応(DA)技術は、データ表現をドメイン非依存表現(DIRep)とドメイン依存表現(DDRep)に分解する。
現在のDAアルゴリズム、例えばDomain-Separation Networks (DSN)は、この問題に適切に対処していない。
本研究では,DDRepにおける情報内容の最小化に強い制約を課し,対象ラベルに関する関連情報を保持するDIRepを作成するアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:13:11 GMT)
Efficient Medical VIE via Reinforcement Learning [10.7] ビジュアル情報抽出(VIE)は、構造化されていない文書イメージを、レポート分析やオンラインコンサルティングといった医療応用に不可欠な構造化フォーマットのような構造化フォーマットに変換する。
従来の手法はOCRと言語モデルに依存し、エンドツーエンドのマルチモーダルモデルは直接生成を提供する。
我々は、100の注釈付きサンプルを使用してこれらの課題に対処するために、Reinforcement Learning with Verifiable Rewards(RLVR)フレームワークをベースとしています。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:10:25 GMT)
A Game-Theoretic Negotiation Framework for Cross-Cultural Consensus in LLMs [10.7] 大型言語モデル (LLMs) は、WEIRD (Western, Educated, Industrialized, Rich, Democratic) の文化的偏見を示す。
この単文化的な観点は、支配的な価値観を強化し、多様な文化的視点を疎外する可能性がある。
公正で堅牢な異文化間の合意を促進するために設計された体系的枠組みを導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:42:39 GMT)
Regular-pattern-sensitive CRFs for Distant Label Interactions [10.6] 長距離ラベルの相互作用を学習する能力を備えた標準線形鎖型CRFの強化手法として,正則パターン感応性CRFを提案する。
ユーザが指定したパターンの集合からRPCRFを自動構築する方法を詳述し、そのモデルの有効性を3つの合成シーケンスモデリングデータセットのシーケンス上で実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:46:29 GMT)
Block-wise Adaptive Caching for Accelerating Diffusion Policy [10.6] Block-wise Adaptive Caching(BAC)は、中間動作特徴をキャッシュすることで拡散ポリシーを高速化する手法である。
BACは、ロボットベンチマークで無償で最大3倍の推論スピードアップを達成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:14:58 GMT)
Overcoming Overfitting in Reinforcement Learning via Gaussian Process Diffusion Policy [10.6] 本稿では,拡散モデルとガウス過程回帰を統合した新しいアルゴリズムを提案する。
シミュレーションの結果,本手法は分布シフト条件下での最先端アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:41:06 GMT)
Roadmap on Incentive Compatibility for AI Alignment and Governance in Sociotechnical Systems [10.5] 既存の方法論は主に技術的側面に焦点を当てており、しばしばAIシステムの複雑な社会技術的性質を無視している。
Incentive Compatibility Sociotechnical Alignment Problem (ICSAP)
ICを実現するための古典的なゲーム問題として,機構設計,契約理論,ベイズ的説得の3つを論じ,ICSAP解決の視点,可能性,課題について論じる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:46:07 GMT)
InfiniSST: Simultaneous Translation of Unbounded Speech with Large Language Model [10.4] InfiniSSTは、マルチターン対話タスクとしてSSTを定式化する新しいアプローチである。
我々は,MST-Cから翻訳トラジェクトリとロバストセグメントを構築し,トレーニング中に多遅延拡張を行った。
MuST-C En-Es、En-De、En-Zhの実験では、InfiniSSTは計算に意識したレイテンシを0.5秒から1秒に短縮することを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:38:23 GMT)
Unlearning-Enhanced Website Fingerprinting Attack: Against Backdoor Poisoning in Anonymous Networks [10.3] Webサイトフィンガープリント(WF)は、ダークウェブを規制し管理するための効果的なツールである。
本稿ではWFが直面している隠れたバックドア毒殺事件に対処することを目的とする。
自動毒点検出と破壊効果の完全除去を実現するために,未学習技術を統合したモシドを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:48:41 GMT)
ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models [10.1] 回転型サリエンシ対応重み量子化(ROSAQ)を提案する。
ROSAQは、プロジェクション特徴空間において、元の特徴空間ではなく、健全なチャネルを特定する。
カーネルの融合により、ROSAQはFP16の実装よりも約2.3倍スピードアップし、バッチサイズ64の256トークンを生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:30:33 GMT)
FreeQ-Graph: Free-form Querying with Semantic Consistent Scene Graph for 3D Scene Understanding [10.1] FreeQ-Graphは、事前に定義された語彙なしで、完全で正確な3Dシーングラフから自由形式のクエリをエンコードする。
グラフノードを正確なセマンティックラベルと整合し、マージしたスーパーポイントの3次元セマンティックアライメント機能を活用する。
我々のモデルは、複雑な自由形式のセマンティッククエリと複雑なリレーショナル推論の両方に優れている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:56:50 GMT)
Forecast-Then-Optimize Deep Learning Methods [10.1] 時系列予測は、様々な分野において重要な意思決定の基盤となっているが、洗練されたモデルからの生の予測は、しばしば体系的な誤りとバイアスを伴っている。
Forecast-Then-Then (FTO) フレームワークについて検討し,その体系的シナプスを開拓した。
ディープラーニングと大規模言語モデルは、ほとんどのエンタープライズアプリケーションにおいて従来のパラメトリック予測モデルよりも優れています。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:02:30 GMT)
Uncertainty-Aware Critic Augmentation for Hierarchical Multi-Agent EV Charging Control [10.0] ビルとEVの両方のエネルギー需要を規制する新しいリアルタイム充電制御であるHUCAを提案する。
HUCAは階層的なアクタークリティカルネットワークを使用して、動的価格シナリオにおけるEV充電の必要性を考慮して、建物の電力コストを動的に削減する。
実世界の電気データセットのシミュレーションと不確実な離脱シナリオによる実験により、HUCAは総電力コストにおいてベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:25:33 GMT)
CAMS: A CityGPT-Powered Agentic Framework for Urban Human Mobility Simulation [9.9] textbfCAMSは、言語に基づく都市基盤モデルを利用して都市空間における人間の移動をシミュレートするエージェントフレームワークである。
textbfCAMSは、外部に提供された地理空間情報に頼ることなく、優れた性能を達成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:24:07 GMT)
Hardware Design and Security Needs Attention: From Survey to Path Forward [9.9] 注目に基づく人工知能(AI)モデルの最近の進歩は、デジタルハードウェア設計を自動化する大きな可能性を解き放っている。
本研究では,ハードウェア設計とセキュリティの自動化に向けた技術的ハードルと今後の展望を明らかにする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:24:13 GMT)
JENGA: Object selection and pose estimation for robotic grasping from a stack [9.9] 我々は,これらのオブジェクトの正確な6DoFポーズを推定し,把握に適したオブジェクトを選択する問題を定義する。
この問題に対処するため,カメラIMUベースのアプローチを提案し,スタックの上位層に非障害物オブジェクトを優先順位付けする。
本手法は, 施工シナリオにおいて, ブリック・ピッキング・アプリケーションとして, 提案手法の展開結果を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:43:02 GMT)
Joint Analysis of Optical and SAR Vegetation Indices for Vineyard Monitoring: Assessing Biomass Dynamics and Phenological Stages over Po Valley, Italy [9.8] 本研究は、双極性レーダ植生指標(DpRVI)と光学指標を組み合わせて、ブドウ畑の作物を特徴づける。
ブドウ園は、その顕著な行方向により、明らかに非等方性散乱挙動を示す。
DpRVIのブドウ園モニタリングへの応用は、気候変動の適応とリスク低減のための幅広い戦略分野にリモートセンシング技術を統合することの一部である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:16:00 GMT)
EmbodiedPlace: Learning Mixture-of-Features with Embodied Constraints for Visual Place Recognition [9.8] 視覚的位置認識(VPR)は、コンピュータビジョンにおけるシーン指向の画像検索問題である。
そこで本稿では,Mixture-of-Features (MoF) アプローチを具体的制約下で適用することにより,グローバルな特徴を洗練する,新しい簡易なリグレード手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:40:12 GMT)
From General Reasoning to Domain Expertise: Uncovering the Limits of Generalization in Large Language Models [9.7] 推論は意思決定の基礎です。
AI技術が進化するにつれて、一般的な推論において優れているようにLLMを訓練する傾向が強まっている。
本研究では、LLMの一般的な推論能力が、ドメイン固有の推論タスクにおけるそれらのパフォーマンスとどのように結びつくかを検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:20:08 GMT)
What Happens During the Loss Plateau? Understanding Abrupt Learning in Transformers [9.6] 本研究は, 浅層変圧器におけるそのような力学のメカニズムについて考察する。
このモデルでは,高原ではしばしば解釈可能な部分解が生成され,出力に強い繰り返しバイアスが生じる。
これらの現象の繰り返しバイアスと表現の崩壊は,おもちゃの組立の人工物ではなく,PythiaやOLMoのような大規模言語モデルの初期訓練段階に現れていることを検証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:51:18 GMT)
Rethinking Explainability in the Era of Multimodal AI [9.6] マルチモーダルAIシステムはユビキタスになり、ハイテイクなアプリケーションにまたがって優れたパフォーマンスを実現している。
既存の説明可能性のテクニックの多くは単調のままであり、モダリティ固有の特徴属性、概念、回路トレースを分離して生成する。
本稿では, マルチモーダルモデル決定を駆動するクロスモーダルな影響を, 体系的に誤表現し, 捉えることができないことを論じる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:08:29 GMT)
GLU Attention Improve Transformer [9.4] GLU(Gated Linear Units)は、ニューラルネットワークの性能向上に大きな可能性を示している。
GLUアテンションと呼ばれる新しい注意機構を導入し、アテンションの値に非線形性を導入する。
私の実験では、GLU注意は、余分なパラメータや無視可能な計算コストを伴って、テキストと視覚のモダリティ間のモデル性能と収束速度を向上することを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:38:56 GMT)
Geometric Kolmogorov-Arnold Superposition Theorem [9.4] コルモゴロフ・アルノルドネットワーク(KAN)は、コルモゴロフ・アルノルド理論(KAT)を実装するための訓練可能なモデルとして導入された。
O(n)$, $O(1,n)$, $S_n$, general $GL$ など,様々な群作用に対する等式と不変性を取り入れたkanの新たな拡張を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:00:31 GMT)
Disentangling 3D from Large Vision-Language Models for Controlled Portrait Generation [9.3] 本稿では,大規模な視覚言語モデルから3Dを遠ざけることの問題点について考察する。
これにより、年齢、髪型、眼鏡などの外観特性の自由形式のテキスト制御や、顔の表情とカメラポーズの3D幾何学制御が可能になる。
既存の手法と比較して,本手法では,テキストと3D制御を付加したポートレートを生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:26:45 GMT)
Rethinking Explainable Machine Learning as Applied Statistics [9.0] 説明可能な機械学習は、その並列性を応用統計と認識する必要がある、と我々は主張する。
研究論文では、これがほとんど議論されていないという事実が、現在の文献の主な欠点の1つである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:08:35 GMT)
EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence [9.0] EmbodiedGenはインタラクティブな3Dワールドジェネレーションのための基盤となるプラットフォームだ。
高品質で、制御可能で、フォトリアリスティックな3Dアセットを低コストでスケーラブルに生成することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:50:31 GMT)
Investigating the interaction of linguistic and mathematical reasoning in language models using multilingual number puzzles [8.8] 言語モデル (LLMs) は言語-数学のパズルと、言語間数系を含む。
言語における数値の言語的側面と数学的側面を解き放つ一連の実験を通して, LLM にとってなぜこの課題が難しいのかを考察する。
人間のスケールデータにおける暗黙のパターンから構成規則を柔軟に推論する能力は、現在の推論モデルにとってオープンな課題である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:09:38 GMT)
Video Individual Counting With Implicit One-to-Many Matching [8.8] Video Individual Countingは、ビデオから歩行者のフラックスを推定することを目的としている。
VICの主な問題は、フレーム間で共存する歩行者を特定する方法である。
暗黙的な1対Many mAtchiNgを持つ単純だが効果的なVICモデルであるOMANを紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:20:00 GMT)
ETM: Modern Insights into Perspective on Text-to-SQL Evaluation in the Age of Large Language Models [8.6] Execution Accuracy (EXE) と Exact Set Matching Accuracy (ESM) は、パフォーマンスを誤って表現できる固有の制限に悩まされている。
我々は,構文的要素と意味的要素の両方を用いてクエリを比較することで,これらの問題を緩和する新しい指標ETM(Enhanced Tree Matching)を導入する。
ETM と ESM は23.0% と 28.9% の偽陽性と負の比率を産出でき、EMM はそれぞれ 0.3% と 2.7% に減少する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:19:19 GMT)
Overcoming Occlusions in the Wild: A Multi-Task Age Head Approach to Age Estimation [8.5] 本稿では,GAN(Generative Adversarial Network)とトランスフォーマーアーキテクチャを組み合わせて,隠蔽顔から頑健な年齢推定を実現する手法を提案する。
FG-NET, UTKFace, MORPHデータセットによる実験結果から, 提案手法が既存の顔年齢推定技術を超えていることが判明した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:00:05 GMT)
Alignment Quality Index (AQI) : Beyond Refusals: AQI as an Intrinsic Alignment Diagnostic via Latent Geometry, Cluster Divergence, and Layer wise Pooled Representations [8.5] 大規模言語モデルのアライメントを評価するために、アライメント品質指標(AQI)を導入する。
AQIはクラスタリングの品質をキャプチャして、たとえアウトプットが準拠しているように見える場合でも、隠れたミスアライメントやジェイルブレイクのリスクを検出する。
また,挑戦条件下での堅牢な評価を容易にするLITMUSデータセットを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:22:28 GMT)
Multiview Geometric Regularization of Gaussian Splatting for Accurate Radiance Fields [8.4] 本稿では,多視点ステレオ(MVS)深度,RGB,および正規制約をガウススプラッティングに統合する効果的な多視点幾何正規化戦略を提案する。
我々の重要な洞察は、MVS由来の深度点とガウススプラッティング最適化位置の相補的関係である。
この知見を活用するために、不確実性推定を伴う中央値の深度に基づく相対的な深度損失を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:02:46 GMT)
Variational Inference with Mixtures of Isotropic Gaussians [8.4] 変分推論 (VI) はベイズ推定において一般的な手法であり、パラメトリック族内の後部分布の最適近似を求める。
我々は変分フレームワークを開発し、このファミリーに適した効率的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:42:15 GMT)
On Efficient Solutions of General Structured Markov Processes in Quantum Computational Environments [8.3] 我々は、一般的なマルコフ過程の定常分布を計算するための最初の量子アルゴリズムを考案した。
一般的なマルコフ過程によって動機づけられたものの、我々の量子アルゴリズムはより大規模な数値計算問題に対処するために利用することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:24:17 GMT)
Compact representation and long-time extrapolation of real-time data for quantum systems [8.2] 本研究では,ESPRITアルゴリズムの量子系のシミュレーションからリアルタイムな動的データを拡張するための応用について考察する。
我々は、短時間のダイナミクスから情報を抽出し、長時間の挙動を確実に予測する能力を示す。
ESPRITは、量子位相をキャラクタリゼーションするための純粋にデータ駆動のアプローチを提供し、動的観測変数の無限時間値を予測する方法を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:59:15 GMT)
VideoPDE: Unified Generative PDE Solving via Video Inpainting Diffusion Models [8.2] 本稿では,ビデオ・インペインティング拡散変換器モデルを用いて偏微分方程式(PDE)を解くための統一的な枠組みを提案する。
本研究では,細粒度,高忠実度インペイント,コンディショニングのための画素空間ビデオ拡散モデルを提案する。
提案手法は,多種多様なPDEと問題設定にまたがる高精度で汎用的なソリューションを提供し,最先端のベースラインよりも優れた性能を実現している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:58:00 GMT)
Online Learning for Equilibrium Pricing in Markets under Incomplete Information [8.1] 不完全な情報設定において、均衡価格をT$の地平線上で学習する問題を考察する。
我々は、顧客需要が一定であれば$O(1)$、需要が時間とともに変化する場合は$O(sqrtT)$の後悔を同時に達成するアルゴリズムを開発する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:05:19 GMT)
Buy it Now, Track Me Later: Attacking User Privacy via Wi-Fi AP Online Auctions [8.1] レイヤ2ネットワーク識別子はセキュリティ上の脆弱性を示し、ユーザのプライバシーを危険にさらす。
中古市場におけるWi-Fiアクセスポイントに対する新たなプライバシ攻撃を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:42:14 GMT)
SatHealth: A Multimodal Public Health Dataset with Satellite-based Environmental Factors [8.1] SatHealthは、環境データ、衛星画像、医学的クレームから推定される全発生頻度、健康指標の社会的決定要因を組み合わせたデータセットである。
SatHealthの2症例(地域公衆衛生モデルと個人病リスク予測)で実験を行った。
その結果,生物環境情報はAIモデルの性能と時間空間の一般化性を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:34:41 GMT)
Improved Online Confidence Bounds for Multinomial Logistic Bandits [8.1] 本稿では,MNLモデルに対するオンライン信頼度の向上を提案する。
この結果をMNLブレイビットに適用し,変分依存性の最適後悔を実現する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:10:36 GMT)
Safe-Child-LLM: A Developmental Benchmark for Evaluating LLM Safety in Child-AI Interactions [8.0] 子ども(7~12歳)と青年(13~17歳)の2つの発達段階において,AIの安全性を評価するためのベンチマークとデータセットであるSafe-Child-LLMを紹介した。
我々のフレームワークは、赤チームコーパスからキュレートされた200の敵のプロンプトからなる新しい多部データセットと、ジェイルブレイク成功のための人名ラベルと、標準化された0-5の倫理的拒絶尺度を含む。
ChatGPT、Claude、Gemini、LLaMA、DeepSeek、Grok、Vicuna、Mistralを含む主要なLCMを評価することで、子供向けシナリオにおける重大な安全性の欠陥が明らかになった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:04:54 GMT)
Conformal Prediction Sets for Deep Generative Models via Reduction to Conformal Regression [8.0] 入力に対するブラックボックス深部生成モデルから,有効かつ小さな予測セットを生成する問題を考える。
我々は、生成予測セット(GPS)と呼ばれる単純で効果的な共形推論アルゴリズムを開発する。
GPSの背後にある重要な洞察は、許容可能な出力を得るのに必要な最小限のサンプル数に対して、分布内の固有の構造を利用することである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:59:40 GMT)
Vine Copulas as Differentiable Computational Graphs [7.9] 本稿では,マルチレベルなVine構造と関連する計算を抽象化するDAGであるVine計算グラフを紹介する。
我々は、条件付きサンプリング、効率的なサンプリング順序スケジューリング、およびカスタマイズされた条件付き変数のためのVine構造の構築のための新しいアルゴリズムを考案する。
PyTorch上に構築されたGPUアクセラレーションされたPythonライブラリであるTorchvinecopulibにこれらのアイデアを実装し、適合性、サンプリング、密度評価のためのスケーラビリティを改善した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:57:36 GMT)
StoryBench: A Dynamic Benchmark for Evaluating Long-Term Memory with Multi Turns [7.6] 長期記憶は、自律的な知性を達成するために、大規模言語モデルにとって不可欠である。
既存のベンチマークでは、知識保持と動的シーケンシャル推論を評価する上で、課題に直面している。
インタラクティブなフィクションゲームに基づく新しいベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:54:31 GMT)
R2LDM: An Efficient 4D Radar Super-Resolution Framework Leveraging Diffusion Model [7.6] R2LDMは高密度かつ高精度な4次元レーダーポイント雲を生成する革新的な手法である。
レンジ画像や鳥の目視(BEV)画像を利用する代わりに、ボクセル特徴を用いてLiDARと4Dレーダポイントの雲を表現します。
R2LDMは、ペアの生レーダーデータからLiDARのような点雲を効果的に生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:21:22 GMT)
DVP-MVS++: Synergize Depth-Normal-Edge and Harmonized Visibility Prior for Multi-View Stereo [7.5] そこで我々は,DVP-MVS++を提案する。DVP-MVS++は,高度で可視性の高いパッチ変形に対して,奥行き正規のエッジアライメントと調和されたクロスビューの両方を相乗化する革新的な手法である。
ETH3D, Tanks & TemplesおよびStrechaデータセットの評価結果は,提案手法の最先端性能と堅牢な一般化能力を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:15:22 GMT)
Sharpness-Aware Machine Unlearning [7.5] 機械非学習方式におけるシャープネス認識記憶(SAM)の有効性を特徴付ける。
SAM は,信号強度に応じて様々なテスト誤差境界を導出し,そのようなデノナイジング性を捨てることを示す。
本稿では,シャープMinMaxを提案する。シャープMinMaxは,SAMによる信号の学習と,シャープネスによる誤り信号の学習を行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:24:10 GMT)
Inherently Faithful Attention Maps for Vision Transformers [7.5] 本稿では,学習した2値注意マスクを用いて,画像領域のみが予測に影響を与えることを保証するアテンションベース手法を提案する。
実験により,本手法は突発的相関やアウト・オブ・ディストリビューションの背景に対して,ロバスト性を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:52:37 GMT)
SpaceTrack-TimeSeries: Time Series Dataset towards Satellite Orbit Analysis [7.5] 本研究は、Starlink衛星からの操作行動の代表的なデータセットを収集し、キュレートする。
このデータセットは、TLE(Two-Line Element)カタログデータと対応する高精度なエフェメリスデータを統合することで、より現実的で多次元的な宇宙物体の挙動モデリングを可能にする。
これは、機動検出法の実践的な展開と、ますます混雑する軌道環境における衝突リスクの評価に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:57:50 GMT)
Characterising Bugs in Jupyter Platform [7.3] 本稿ではJupyterプラットフォームにおける387のバグについて検討する。
これらのJupyterのバグは、11の根本原因と11のバグ症状に分類される。
開発者には14の大きな発見がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:24:06 GMT)
Self-Supervised Enhancement for Depth from a Lightweight ToF Sensor with Monocular Images [7.3] 本稿では,自己教師型学習フレームワークであるSelfToFを提案する。
提案手法は,NYUおよびScanNetデータセットの広範な実験により検証され,効率的かつ効果的である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:57:58 GMT)
LOB-Bench: Benchmarking Generative AI for Finance -- an Application to Limit Order Book Data [7.3] 本稿では,リミテッド・オーダー・ブック(LOB)における生成メッセージ・バイ・オーダーデータの品質と現実性を評価するためのベンチマークを提案する。
本フレームワークは,実LOBデータと実LOBデータ間の条件および非条件統計量の分布差を計測する。
ベンチマークには、スプレッド、オーダーブックボリューム、オーダー不均衡、メッセージ間の時間といった一般的なLOB統計情報も含まれている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:02:28 GMT)
Hierarchical Language Models for Semantic Navigation and Manipulation in an Aerial-Ground Robotic System [7.3] 本稿では,大規模言語モデル (LLM) と微調整型視覚言語モデル (VLM) を統合した階層型フレームワークを提案する。
LLMはタスクを分解してグローバルなセマンティックマップを構築し、VLMはタスク特定セマンティックラベルと2次元空間情報を空中画像から抽出し、ローカルプランニングをサポートする。
これは、VLMに基づく認識とLLM駆動のタスク推論とモーションプランニングを統合した地上異種システムの最初の実演である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:10:40 GMT)
FOAM: A General Frequency-Optimized Anti-Overlapping Framework for Overlapping Object Perception [7.3] 重なり合う物体知覚は、ランダムに重なり合う前景の特徴を分離し、背景の特徴を抑えつつ前景の特徴を抽出することを目的としている。
本稿では、よりテクスチャや輪郭情報を抽出する際のモデルを支援するために、一般周波数ベースのアンチオーバーラップフレームワーク(FOAM)を提案する。
具体的には、周波数空間変換器ブロック(FSTB)を設計し、周波数領域と空間領域の両方から特徴を同時に抽出し、ネットワークがフォアグラウンドからより多くのテクスチャ特徴をキャプチャするのに役立つ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:58:49 GMT)
Simple is what you need for efficient and accurate medical image segmentation [7.2] 本稿では,スケーラブルな超軽量医用画像分割モデルSimpleUNetを提案する。
記録破りの16KBパラメータ設定により、SimpleUNetはLBUNetや他の軽量ベンチマークを上回っている。
0.67MBの派生型は、より優れた効率(8.60 GFLOPs)と精度を実現し、マルチセンターの乳房病変のデータセットの平均DSC/IoUは85.76%/75.60%に達した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:31:48 GMT)
A Regret Perspective on Online Selective Generation [7.2] 大規模な言語生成モデルは人間とますます相互作用するが、その偽造された反応は懸念を引き起こす。
この幻覚効果に対処するために、選択的生成と呼ばれる解答を選択的に棄却することは、幻覚を効果的に制御する方法を提供する。
部分フィードバックに基づく選択生成のためのオンライン学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:51:30 GMT)
TR2M: Transferring Monocular Relative Depth to Metric Depth with Language Descriptions and Scale-Oriented Contrast [7.1] 現在の単分子深度推定法は主にメートル法深度推定(MMDE)と相対深度推定(MRDE)に分けられる。
MMDEは、計量スケールの深さを推定するが、しばしば特定の領域に限られる。MRDEは、異なる領域にわたってよく一般化するが、下流のアプリケーションを妨げる不確実なスケールを持つ。
TR2Mはテキスト記述と画像の両方を入力として利用し、2つの再スケールマップを推定し、画素レベルで相対深度をメートル法深度に転送する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:50:00 GMT)
The Sample Complexity of Distributed Simple Binary Hypothesis Testing under Information Constraints [7.1] 逐次的相互作用は、分散された単純二項仮説テストのサンプルの複雑さを低減するのに役立たないことを示す。
第2の問題は、通信に制約のある単純なバイナリ仮説テストのための既存のサンプル複雑性境界の締め付けを示唆している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:50:27 GMT)
Audio-Visual Driven Compression for Low-Bitrate Talking Head Videos [7.1] 本稿では,コンパクトな3Dモーション機能と音声信号を統合した,新しい音声視覚駆動ビデオを提案する。
CelebV-HQデータセットの実験では,VVCに比べて22%削減された。
これは、同等の帯域幅で優れたリップシンク精度と視覚的忠実度を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:34:48 GMT)
Rethinking Test-Time Scaling for Medical AI: Model and Task-Aware Strategies for LLMs and VLMs [7.1] テスト時のスケーリングは、推論中に大きな言語モデルやビジョン言語モデルの推論能力を高めるための有望なアプローチとして現れている。
大規模言語モデルと視覚言語モデルの両方への影響を評価し,モデルサイズ,固有モデル特性,タスク複雑性などの要因を考慮した。
本研究は,医療分野におけるテストタイムスケーリングを効果的に活用するための実践的ガイドラインを提供し,医療分野の信頼性と解釈可能性の要求を満たすために,これらの戦略をさらに洗練する方法について考察する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:15:53 GMT)
BOW: Bottlenecked Next Word Exploration [7.0] Next-word Prediction (NWP)は、強い表面レベルの流速を提供するが、堅牢な推論のサポートを欠いていることが多い。
推論ボトルネックを導入してNWPを再考する新しいRLフレームワークであるBOW(Bottlenecked Next Word Explorion)を提案する。
BOWはバニラNWPに代わる効果的でスケーラブルな代替品として機能する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:58:54 GMT)
Quantum computing and artificial intelligence: status and perspectives [6.9] 量子コンピューティングが革新的なAIソリューションの開発を支援する方法について説明している。
また、量子技術の研究と開発を促進することができる古典的なAIのユースケースについても検討している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:30:10 GMT)
Direct Reasoning Optimization: LLMs Can Reward And Refine Their Own Reasoning for Open-Ended Tasks [6.9] 大規模言語モデル(LLM)を微調整するための強化学習フレームワークであるダイレクト推論最適化(DRO)を提案する。
DROは新たな報酬信号、Reasoning Reflection Reward (R3)によって誘導される。
DROは、オープンエンドドメインと構造化ドメインの両方にわたって広く適用されながら、強いベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:43:38 GMT)
TimeMaster: Training Time-Series Multimodal LLMs to Reason via Reinforcement Learning [6.9] 時系列推論は、マルチモーダル大言語モデル(MLLM)において重要な課題である。
時系列MLLMを可視化した時系列入力やタスクプロンプト上で直接構造化・解釈可能な推論を行うことができる強化学習ベースのTimeMasterを導入する。
TimeMasterは最先端のパフォーマンスを達成し、古典的な時系列モデルと数ショットのGPT-4oをそれぞれ14.6%以上、パフォーマンスが7.3%以上向上した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:12:26 GMT)
Modeling Barrett's Esophagus Progression using Geometric Variational Autoencoders [6.7] バレット食道(BE)の早期発見は食道癌を効果的に予防し治療するために重要である。
S-VAEとShape Kendall VAEは,分類精度,再構成損失,生成能力の向上を示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:45:38 GMT)
A Neural Model for Word Repetition [6.7] 本稿では,単語反復の認知モデルと人間の脳の神経機構のギャップを,深層ニューラルネットワークを用いてモデル化することで埋める手法を提案する。
本研究では,(1)単語反復タスクをシミュレートするための大規模なモデルセットのトレーニング,(2)人間の行動研究から既知の影響を探索するためのテストのバッテリの作成,(3)アブレーション研究による脳損傷のシミュレートを行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:09:24 GMT)
Learning-based 3D Reconstruction in Autonomous Driving: A Comprehensive Survey [6.7] 学習に基づく3D再構成は、自律運転におけるトランスフォーメーション技術として登場した。
我々は近年の進歩を多視点で詳細に分析する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:16:35 GMT)
Diffusion-Based Depth Inpainting for Transparent and Reflective Objects [6.6] 本稿では,透過的および反射的オブジェクトに特化して設計された拡散型深度塗布フレームワークを提案する。
DITRは、堅牢な適応性を持つ透明で反射性のある物体の奥行き塗装に非常に効果的である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:52:28 GMT)
Learning to Explore in Diverse Reward Settings via Temporal-Difference-Error Maximization [6.5] 本研究では,密度,疎度,探索-逆報酬設定に対して頑健な,新しい探索手法である安定誤差探索(SEE)を提案する。
本手法では,遠方政治学習による不安定性の軽減,累積的TDエラーをエピソード設定で最大化する関心の対立,TDエラーの非定常的性質の3つの設計選択を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:36:24 GMT)
TextureSplat: Per-Primitive Texture Mapping for Reflective Gaussian Splatting [6.4] ガウススプラッティングは、高いレンダリングフレームレートで驚くほど新しいビュー合成性能を示した。
幾何学的および物理的に接地した放射場を用いてこの問題に対処する手法を提案する。
また、GPUハードウェアを利用して、統一されたテクスチャアトラスを用いて、テスト時のレンダリングを高速化することを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:41:40 GMT)
UAV Object Detection and Positioning in a Mining Industrial Metaverse with Custom Geo-Referenced Data [6.4] 本研究では,UAVに基づくセンシング,LiDAR地形モデリング,深層学習に基づく物体検出を組み合わせた統合システムアーキテクチャを提案する。
提案するパイプラインには、ジオレファレンス、3次元再構成、オブジェクトの局所化が含まれており、構造化された空間出力を産業用デジタルツインプラットフォームに統合することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:59:56 GMT)
Position: Pause Recycling LoRAs and Prioritize Mechanisms to Uncover Limits and Effectiveness [6.4] ローランクアダプタ(LoRA)のマージやルーティングは,大規模言語モデルの拡張手段として人気がある。
本稿は,新たなマージアルゴリズムやルーティングアルゴリズムの開発から,LoRAの再利用が本当に効果的である条件の理解へと,研究コミュニティの焦点を移すことを主張する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:35:22 GMT)
Personalizable Long-Context Symbolic Music Infilling with MIDI-RWKV [6.3] エッジデバイス上での効率的でコヒーレントなコクリエーションを実現するために,RWKV-7線形アーキテクチャに基づく新しいモデルMIDI-RWKVを提案する。
また、MIDI-RWKVは、極低サンプル体制におけるパーソナライズのために、初期状態を微調整する効果的な方法を認めた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:04:01 GMT)
Beyond One-Size-Fits-All: A Study of Neural and Behavioural Variability Across Different Recommendation Categories [6.2] 私たちは、焦点をユーザにシフトし、異なる推奨カテゴリ間で神経的および行動的変動をデコードするという課題に初めて対処します。
具体的には,様々なレコメンデーションタイプを含む包括的eコマースデータセットを用いて,制御された調査を行った。
提案手法は, 検索クエリの結果から, Exact, Substitute, Complement, Irrelevantの製品に分類されたレコメンデーションに対して, 神経反応と行動応答の両方を解析した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:23:17 GMT)
Behaviour Discovery and Attribution for Explainable Reinforcement Learning [6.1] 強化学習(RL)エージェントへの信頼を構築するには、なぜ特定の決定を下すのかを理解する必要がある。
既存の説明可能性の手法は、しばしば単一状態または全軌道に焦点をあてる。
動作発見とセグメンテーションのための完全にオフラインで報酬のないフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:43:25 GMT)
Representing local protein environments with atomistic foundation models [6.1] 原子基盤モデル(AFM)の中間的特徴から得られた局所タンパク質環境の表現法を提案する。
AFMから導かれる表現空間は有意義な構造を示し、データ駆動の事前構築を可能にする。
生体分子NMR分光法(英語版)の文脈において、提案された表現により、第一種物理学インフォームド化学シフト予測器が実現できることを実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:48:20 GMT)
Brain Imaging Foundation Models, Are We There Yet? A Systematic Review of Foundation Models for Brain Imaging and Biomedical Research [6.1] ファンデーションモデル(FM)は人工知能に革命をもたらし、医療画像において大きな可能性を秘めている。
脳画像は、神経疾患の診断と治療において重要な役割を担っているにもかかわらず、まだ表現されていない。
脳画像のためのFMの総合的およびキュレートされたレビューを初めて紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:46:46 GMT)
BiFold: Bimanual Cloth Folding with Language Guidance [6.1] 本研究では,テキストコマンドを条件とした折りたたみ動作の学習を行う。
我々は、事前学習された視覚言語モデルを活用し、操作行動を予測するためにそれを再利用する。
我々のモデルであるBiFoldは、既存の言語条件の折りたたみベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:20:38 GMT)
A Comprehensive Survey on Deep Learning Solutions for 3D Flood Mapping [6.1] 洪水は気候変動と都市化によって悪化し、効果的な災害管理のための先進的な解決策を必要としている。
従来の2Dフラッドマッピング技術は限られた洞察を提供するが、ディープラーニング(DL)を利用した3Dフラッドマッピングは、洪水範囲と深さを統合することで機能強化を提供する。
本稿では,深層学習に基づく3次元フラッドマッピングの総合的な調査を行い,その進歩を2次元地図上で強調する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:06:18 GMT)
Stochastic Multi-Objective Multi-Armed Bandits: Regret Definition and Algorithm [6.0] 多目的マルチアームバンドイット(MO-MAB)問題は、オンライン最適化タスクに広く適用されている。
我々は、対立する目的に対してバランスのとれたパフォーマンスを保証する、新しく包括的な後悔の指標を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:09:28 GMT)
Fast Convergence for High-Order ODE Solvers in Diffusion Probabilistic Models [5.9] 拡散確率モデルは、データをノイズに変換するノイズ注入プロセスの逆転を学ぶことでサンプルを生成する。
この逆過程を決定論的確率フロー常微分方程式(ODE)として再構成することで、高次解法を用いた効率的なサンプリングが可能になる。
スコア関数は一般的にニューラルネットワークによって近似されるため、全体のサンプリング精度を理解する上では、その正則性、近似誤差、数値積分誤差の相互作用を分析することが重要である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:09:25 GMT)
An Investigation into Value Misalignment in LLM-Generated Texts for Cultural Heritage [5.9] 大型言語モデル(LLM)は、文化遺産に関連するタスクでますます普及している。
古文書の翻訳、口伝の保存、教育内容の制作など、歴史的記念物の記述を作成するのに用いられる。
しかし、歴史的事実の誤表現、文化的なアイデンティティの侵食、複雑な文化的な物語の単純化など、文化的な価値の誤認識は発生した文献に存在している可能性がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:37:06 GMT)
C-TLSAN: Content-Enhanced Time-Aware Long- and Short-Term Attention Network for Personalized Recommendation [5.9] 我々はTLSANアーキテクチャの拡張であるC-TLSAN(Content-Enhanced Time-Aware Long- and Short-Term Attention Network)を提案する。
C-TLSANは、ユーザの過去のインタラクションにリンクしたテキストコンテンツを、長期的および短期的な注意層に直接埋め込むことで、レコメンデーションパイプラインを充実させる。
大規模なAmazonデータセットに対する広範な実験を行い、C-TLSANを最先端のベースラインに対してベンチマークする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:16:26 GMT)
OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning [5.8] OTFusionは、視覚情報と意味情報を整合した共有確率表現を学ぶことを目的としている。
OTFusionはオリジナルのCLIPモデルよりも一貫して優れており、平均精度は10%近く向上している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:27:47 GMT)
On Information-Theoretic Measures of Predictive Uncertainty [5.8] その重要性にもかかわらず、予測の不確実性の最良の定量化方法に関する普遍的な合意はない。
提案手法は, 予測の不確かさを, (I) 予測モデル (II) 真の予測分布の近似の2つの要因により分類する。
我々は、これらの対策を広範囲にわたるタスクにわたって広範囲に評価し、ある対策が優れている条件を特定した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:48:56 GMT)
Team Anotheroption at SemEval-2025 Task 8: Bridging the Gap Between Open-Source and Proprietary LLMs in Table QA [5.6] 本稿では,SemEval 2025 Task 8: Question Answering (QA) をテーブル上に構築するシステムを提案する。
提案手法は,テキストからコードへの生成モジュール,自己補正機構,検索拡張生成(RAG)など,いくつかの重要なコンポーネントを統合している。
評価段階では,提案手法は80%の精度を達成し,38チーム中13位にランクインした。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:42:18 GMT)
Polyra Swarms: A Shape-Based Approach to Machine Learning [5.6] 本稿では,関数の代わりに形状を近似する新しい機械学習手法であるPolyra Swarmsを提案する。
特に,タスクによっては,特に異常検出などのタスクに対して,Polyra Swarmsの方がニューラルネットワークよりも望ましいことを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:16:54 GMT)
SAFE: Finding Sparse and Flat Minima to Improve Pruning [5.5] 平坦度を目的とする空間制約最適化問題としてプルーニングを定式化する。
本稿では,SAFEと拡張されたSAFE$+$を提案する。
SAFEは、競争力と確立されたベースラインを比較することで、より優れた一般化性能を持つスパースネットワークを一貫して獲得する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:36:58 GMT)
Complexity of Injectivity and Verification of ReLU Neural Networks [5.5] ReLUネットワークによって計算される関数のインジェクティビティは、関数の可逆性が要求されるたびに重要な役割を果たす。
インジェクティビティを決定する正確な計算複雑性のcoNP完全性を証明する。
また,特定の入力が特定の出力しか得られないことを検証するネットワーク検証問題についても検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:32:52 GMT)
IKDiffuser: Fast and Diverse Inverse Kinematics Solution Generation for Multi-arm Robotic Systems [5.5] IKDiffuserは、多腕ロボットシステムのための高速で多様なIKソリューション生成のために設計された拡散モデルである。
IKDiffuserは構成空間上の結合分布を学習し、複雑な依存関係をキャプチャする。
6つの異なるマルチアームシステムの実験において、提案したIKDiffuserは優れた解の精度、精度、多様性、計算効率を達成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:12:04 GMT)
From Promise to Peril: Rethinking Cybersecurity Red and Blue Teaming in the Age of LLMs [5.4] 大規模言語モデル(LLM)は、赤と青のチーム操作を増強することでサイバーセキュリティを再構築する。
このポジションペーパーは、MITRE ATT&CKやNIST Cybersecurity Framework (CSF)のようなサイバーセキュリティフレームワークにまたがってLLMアプリケーションをマッピングする。
主な制限は幻覚、文脈保持の制限、推論の低さ、プロンプトに対する感受性である。
我々は,人間のループ監視の維持,モデル説明可能性の向上,プライバシ保護機構の統合,敵対的搾取に頑健なシステムの構築を推奨する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:52:19 GMT)
Geodesic Slice Sampler for Multimodal Distributions with Strong Curvature [5.4] ターゲット分布に適したより一般的なジオメトリにヒット・アンド・ランスライスサンプリングを一般化する手法を提案する。
提案手法は,マルチモーダル分布におけるモード間の強い曲率と急激な遷移を持つ領域の探索を可能にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:17:23 GMT)
Experiential Semantic Information and Brain Alignment: Are Multimodal Models Better than Language Models? [5.4] 計算言語学における一般的な仮定は、マルチモーダルモデルによって学習されたテキスト表現が言語のみのモデルよりも豊かで人間的なものであるということである。
コントラッシブなマルチモーダルモデルからの単語表現と、それらが情報を取得する範囲における言語のみの表現を比較した。
その結果,言語のみのモデルは両面でマルチモーダルモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:32:22 GMT)
Atomizer: Generalizing to new modalities by breaking satellite images down to a set of scalars [5.4] 既存のモデルは、固定された入力形式とモダリティ固有のエンコーダに依存しており、新しい構成を導入する際に再トレーニングを必要とする。
我々は、リモートセンシング画像をトークンの集合として表現し、それぞれがピクセルのスペクトル帯域値に対応するフレキシブルアーキテクチャであるAtomizerを紹介した。
Atomizerは標準的なモデルより優れており、様々な解像度と空間サイズで堅牢なパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:30:37 GMT)
The Remarkable Robustness of LLMs: Stages of Inference? [5.3] 本研究では,Large Language Models (LLM) の構造的介入に対するロバスト性について検討する。
驚くべきことに、モデルは微調整なしでオリジナルのトップ1予測精度の72-95%を維持している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:21:00 GMT)
Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images [5.2] すべての最先端DM(SD3、SDXL、Flux、DeepFloyd IF)がこの問題に対して脆弱であることを示す。
本稿では,DMのテキスト生成層のみをターゲットとしたファインチューニング手法を提案する。
この領域の研究を進めるために、画像中のNSFWテキスト生成を評価するためのオープンソースのベンチマークであるToxicBenchをリリースする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:48:00 GMT)
Learning Event Completeness for Weakly Supervised Video Anomaly Detection [5.1] 弱監視ビデオ異常検出(LEC-VAD)のための新しい学習イベント完全性を提案する。
LEC-VADは、視覚と言語の間のカテゴリー認識とカテゴリー認識のセマンティクスの両方を符号化する。
本研究では,異常項目のカテゴリに関連付けられた簡潔なテキスト記述を豊かにするための,新しいメモリバンクベースのプロトタイプ学習機構を開発する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:56:58 GMT)
Learned radio interferometric imaging for varying visibility coverage [5.0] 様々な可視性カバレッジを学習した後処理とアンロールされた反復的再構成手法を開発した。
本稿では,これらの手法が可視性の範囲のばらつきを最小限から最小限の微調整なしで回避できるようにするためのトレーニング戦略を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:54:32 GMT)
GreedyPrune: Retenting Critical Visual Token Set for Large Vision Language Models [5.0] GreedyPruneは、セマンティックサリエンシと視覚的多様性を最適化するために設計された、トレーニング不要のビジュアルトークンプルーニングアルゴリズムである。
GreedyPruneは様々なマルチモーダルタスクやモデルにまたがって最先端の精度を実現し、エンドツーエンドの推論遅延を大幅に低減することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:21:11 GMT)
NGD-SLAM: Towards Real-Time Dynamic SLAM without GPU [5.0] 本稿では,CPU上でのみ動作するリアルタイム動的SLAMシステムを提案する。
本稿では,カメラ追跡と深層学習に基づくマスキングを分離するマスク伝搬機構を提案する。
従来の手法と比較して,ラップトップCPU上での追跡フレームレート60FPSを実現しつつ,動的環境における高精度なローカライゼーションを実現する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:22:00 GMT)
Seewo's Submission to MLC-SLM: Lessons learned from Speech Reasoning Language Models [4.9] MLC-SLM(Multilingual Conversational Speech Language Model Challenge)の両トラック用システム
ASRのための音声モデルにおいて、推論と自己補正を明確に強化する多段階学習パイプラインを導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:42:05 GMT)
Uncertainty-Aware Remaining Lifespan Prediction from Images [4.9] 本稿では,事前学習した視覚トランスフォーマーの基礎モデルを用いて,顔画像と全身画像から残存寿命を推定する手法を提案する。
提案手法は,確立したデータセット上で7.48年間の最先端平均絶対誤差(MAE)を達成し,さらに2つの新しい高品質データセットに対して4.79年と5.07年のMAEを改善する。
臨床展開を意図してはいないが、これらの結果は画像から医療関連信号を抽出する可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:47:37 GMT)
MARCO: Hardware-Aware Neural Architecture Search for Edge Devices with Multi-Agent Reinforcement Learning and Conformal Prediction Filtering [4.8] MARCOは、リソース制約のあるエッジデバイスをターゲットにした、効率的なニューラルネットワーク探索(NAS)のためのハードウェア対応フレームワークである。
MARCOは、自動DNN設計とエッジAIデプロイメントのためのCADとのギャップを埋める。
MARCOはOFAベースラインに比べて検索時間全体の3,4倍の削減を実現している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:58:09 GMT)
Leveraging LLM and Self-Supervised Training Models for Speech Recognition in Chinese Dialects: A Comparative Analysis [4.8] 自己教師付き事前トレーニングと大規模言語モデル(LLM)を組み合わせることで、低リソースシナリオにおけるASRのパフォーマンスを効果的に向上させることができる。
我々は、ラベル付き方言とアクセント付き音声データの30,000時間でData2vec2モデルを事前訓練し、教師付きデータセット上で4万時間アライメントトレーニングを行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:57:48 GMT)
Turning Down the Heat: A Critical Analysis of Min-p Sampling in Language Models [4.8] 本論文は, min-pを支持する証拠の包括的再検討を行い, 元の論文の4行の証拠と異なる結論に達した。
元の論文で示された証拠は、min-pが品質、多様性、あるいは品質と多様性のトレードオフを改善するという主張を支持していないと結論づける。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:38:04 GMT)
Multi-Knowledge-oriented Nighttime Haze Imaging Enhancer for Vision-driven Intelligent Systems [4.7] ヘイズなどの逆画像条件は、画質を著しく劣化させる。
マルチ知識指向型夜間ヘイズイメージングエンハンサー(MKoIE)を提案する。
MKoIEは、昼間の脱毛、低照度強化、夜間の脱毛という3つのタスクを統合している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:32:08 GMT)
Geometric Embedding Alignment via Curvature Matching in Transfer Learning [4.7] 本稿では,複数のモデルを統合型トランスファー学習フレームワークに統合するための新しいアプローチを提案する。
個々のモデルの潜在空間のリッチ曲率を整列することにより、相互関係のアーキテクチャを構築する。
このフレームワークは、多様な情報源からの知識を効果的に集約し、ターゲットタスクのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:54:22 GMT)
Robustness of Reinforcement Learning-Based Traffic Signal Control under Incidents: A Comparative Study [4.7] 強化学習に基づく交通信号制御 (RL-TSC) が都市移動性向上のための有望なアプローチとして浮上している。
本研究では,動的インシデントシナリオ下でのRL-TSC手法のトレーニングと評価を行うオープンソースSUMOベースのシミュレーションフレームワークであるT-REXを紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:15:29 GMT)
Asymptotically Smaller Encodings for Graph Problems and Scheduling [4.7] いくつかのグラフ問題を、多くの節に対して$O(|V|2 / lg |V|)$のみを用いてCNFにエンコードできることを示す。
O(|V| lg |V|)$節のみを用いるような高密度区間グラフにおける独立集合に対する新しい符号化も示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:31:41 GMT)
Unify3D: An Augmented Holistic End-to-end Monocular 3D Human Reconstruction via Anatomy Shaping and Twins Negotiating [4.7] 本稿では,人間の再建を全体的プロセスとして扱う新しいパラダイムを紹介する。
本稿では、解剖学的形状抽出モジュールとツインズネゴシエイト再構成U-Netの2つのコアコンポーネントからなる新しい再構成フレームワークを提案する。
また,Comic Data Augmentation 戦略を提案し,より複雑なケースインプットでモデル性能を高めるために15k以上の人体スキャンを構築した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:48:32 GMT)
StaQ it! Growing neural networks for Policy Mirror Descent [4.7] 強化学習(RL)では、理論と実践の両方において、正規化が一般的なツールとして現れている。
我々は,最後の$M$Q関数のみをメモリに保持するPMDのようなアルゴリズムを提案し,解析する。
有限で十分大きい$M$に対して、収束アルゴリズムを導出することができ、ポリシー更新にエラーは発生しない。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:00:01 GMT)
Generalized Random Forests using Fixed-Point Trees [4.6] 本研究では,多次元の異種効果を推定するための一般化ランダムフォレスト(GRF)に対する計算効率の良い代替手法を提案する。
GRFは勾配に基づく分割基準に依存しているが、この手法はジャコビアン推定の必要性を排除した固定点近似を導入する。
提案手法は,機械学習および因果推論アプリケーションにおける局所的効果推定のスケーラブルな代替手段であることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:47:37 GMT)
Quantum concentration inequalities and equivalence of the thermodynamical ensembles: an optimal mass transport approach [4.6] 我々は量子スピン系に対する新しい濃度不等式を証明した。
我々の結果は、スピンを正則格子に配置する必要がない。
局所的なW1距離を導入し、局所観測可能な状態に対する2つの状態の識別性を定量化する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:40:10 GMT)
Data Shifts Hurt CoT: A Theoretical Study [4.5] Chain of Thought (CoT) は様々な大規模言語モデル (LLM) に適用され、出力の品質向上に有効であることが証明されている。
分散シフトとデータ中毒の2種類のデータシフトが、訓練されたモデルの品質に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:57:29 GMT)
TurBLiMP: A Turkish Benchmark of Linguistic Minimal Pairs [4.5] TurBLiMPはトルコ初の言語最小ペアのベンチマークである。
1000組の最小ペアで16の言語現象をカバーしているTurBLiMPは、トルコ語の言語評価資源において重要なギャップを埋めている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:45:30 GMT)
Diagnosing 2D symmetry protected topological states via mixed state anomaly [4.4] また, エッジ異常は, 絡み合いスペクトルだけでなく, 密度行列自体にも存在し, この現象を混合状態異常と呼ぶ。
この異常は対称性に富んだ混合状態に微妙にエンコードされ、領域法則を超えた障害への位相的寄与をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:00:03 GMT)
Equitable Electronic Health Record Prediction with FAME: Fairness-Aware Multimodal Embedding [4.4] FAME(Fairness-Aware Multimodal Embeddings, FAME)は,FAME(Fairness-Aware Multimodal Embeddings, FAME, FAME, FAME-Aware Multimodal Embeddings)の略。
誤差分布分散指数(EDDI)を利用して、サブグループ間の公平性を測定する。
我々は,FAMEの有効性を,他のベースラインと比較して,性能と公平性の観点から示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:23:42 GMT)
Sparse Convolutional Recurrent Learning for Efficient Event-based Neuromorphic Object Detection [4.4] ニューロモルフィックプロセッサ上でのイベントベースの効率的なオブジェクト検出のためのスパースイベントベース効率検出器(SEED)を提案する。
我々はスパース畳み込み再帰学習を導入し、これは再帰処理において92%以上の活性化間隔を達成し、スパースイベントデータに基づく推論のコストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:54:27 GMT)
Leveraging erasure errors in logical qubits with metastable $^{171}$Yb atoms [4.3] 量子誤り訂正符号と論理量子ビット回路をメタスタブルな171$Yb量子ビットで示す。
核スピン量子ビットのコヒーレント輸送における劣化誤差を強く抑制できることを示す。
我々は,中間回路消去測定に基づく復号中に誤り訂正を行い,$[4,2,2]$符号の論理量子ビット符号化を実演する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:29:05 GMT)
How Much is Enough? The Diminishing Returns of Tokenization Training Data [4.3] 1GBから900GBまでの英語学習データを用いて,BPE,UnigramLM,WordPieceのトークンをさまざまな語彙サイズで訓練する。
トレーニングデータのサイズが約150GBを超えると、リターンは低下する。
ロシア語のテキストでは、200GBのデータからトークンライザをトレーニングした後のリターンの低下が観察され、英語のトレーニングよりも約33%高い。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:51:10 GMT)
On the Feasibility of Fully AI-automated Vishing Attacks [4.3] ヴァイシング攻撃は社会工学の一形態であり、攻撃者は個人を騙して機密情報を開示するために電話をかける。
我々は、AIの出現とともに、ヴァイシング攻撃がエスカレートする可能性について研究する。
我々は、公開AI技術を用いて開発されたAIを利用したバイシングシステムであるViKingを紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:59:36 GMT)
MAGIC: Multi-Agent Argumentation and Grammar Integrated Critiquer [4.3] マルチエージェント論と文法統合批評(MAGIC)
フレームワークは、複数の特殊エージェントを使用して、異なる書き込みの側面を評価し、総合的なスコアを予測し、詳細でルーリックなフィードバックを生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:02:46 GMT)
Variational Inference Optimized Using the Curved Geometry of Coupled Free Energy [4.3] 結合自由エネルギーに基づく変分推論のための最適化フレームワークを提案する。
我々は、結合指数族の曲面幾何学を考慮に入れ、変分推論手法を拡張した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:30:11 GMT)
Perfect Privacy for Discriminator-Based Byzantine-Resilient Federated Learning [4.2] フェデレーテッド・ラーニング(FL)は、大規模な機械学習において大きな可能性を秘めているが、新たなプライバシとセキュリティの課題が導入されている。
ByITFLとLoByITFLは,ユーザのデータを盗聴者からプライベートに保ちながら,ビザンチンユーザに対するレジリエンスを高める2つの新しいFLスキームである。
プライバシとビザンチンのレジリエンスに関する理論的保証、収束保証、実験結果の検証を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:47:02 GMT)
Understanding Lookahead Dynamics Through Laplace Transform [4.2] ゲーム内のハイパーパラメータの収束解析のための周波数領域フレームワークを提案する。
双線型ゲームの離散時間ダイナミクスを周波数領域に変換し、正確な収束基準を導出する。
離散時間設定における実証的検証は、我々のアプローチの有効性を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:20:40 GMT)
K/DA: Automated Data Generation Pipeline for Detoxifying Implicitly Offensive Language in Korean [4.2] 我々はK/DAと呼ばれる自動ペアデータ生成パイプラインを導入する。
このパイプラインは、暗黙の攻撃性とトレンドに整合したスラングで攻撃的な言語を生成するように設計されている。
我々は,K/DAが生成したデータセットが,既存の韓国のデータセットと比較して高いペア一貫性と暗黙の攻撃性を示すことを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:08:23 GMT)
Clique detection using symmetry-restricted quantum circuits [4.2] 本稿では,変分不変量子回路のclique問題への適用について述べる。
実験では、より大きなサブグラフ内のノードの識別を通じて、cliqueをラベル付けするよう要求する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:16:29 GMT)
JEPA4Rec: Learning Effective Language Representations for Sequential Recommendation via Joint Embedding Predictive Architecture [4.2] JEPA4Recはセマンティックにリッチで転送可能な表現をキャプチャし、レコメンデーションパフォーマンスを改善する。
我々は、レコメンデーションデータセットの項目情報をキャプチャするのに適した、修正された埋め込み層を備えた双方向トランスフォーマーエンコーダを採用している。
6つの実世界のデータセットの実験は、JEPA4Recが一貫して最先端のメソッドを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:08:36 GMT)
Advancing Image-Based Grapevine Variety Classification with a New Benchmark and Evaluation of Masked Autoencoders [4.1] 本研究では,フィールド取得画像に基づくブドウ品種識別のためのMAE(Masked Autoencoders)の評価を行った。
その結果,MAEとラベルなしデータセットで事前学習したViT-B/16モデルでは,F1スコアが0.7956となり,他のモデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:25:23 GMT)
Blockchain and Biometrics: Survey, GDPR Elements, and Future Directions [4.1] 本稿では、ブロックチェーンとバイオメトリックスの組み合わせを調査し、この統合に関する最初の法的分析を含む。
論文では、PKIシステムにおける新しいアプリケーションのためのブロックチェーンとバイオメトリックスの組み合わせ、分散信頼サービス、アイデンティティ管理などについて論じる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:05:55 GMT)
Optimistic Q-learning for average reward and episodic reinforcement learning [4.0] 平均報酬強化学習における後悔最小化のための楽観的なQ-ラーニングアルゴリズムを提案する。
提案手法は,提案手法を厳密に一般化し,平均報酬設定におけるモデルフリーアルゴリズムに関する過去の文献のすべての状態に対する有界ヒット時間テキストの仮定よりもはるかに制約が小さい。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:51:30 GMT)
Efficient Approximate Temporal Triangle Counting in Streaming with Predictions [4.0] 時間的辺のストリームから時間的三角形数を近似するスケーラブルで効率的なアルゴリズムSTEPを導入する。
STEPは、時間的エッジが関与する三角形の数と、単純なサンプリング戦略を組み合わせる。
解析学的に、サブ線形メモリを使用することで、STEPは偏りのない非常に正確な推定値が得られることを証明した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:34:54 GMT)
Anomaly Object Segmentation with Vision-Language Models for Steel Scrap Recycling [4.0] 視覚言語モデルに基づく異常検出を提案する。
このモデルにより, 鋼スクラップ内のきめ細粒度における異常の自動検出が可能となった。
画像エンコーダを微調整し、マルチスケールの機構とテキストプロンプトを通常の画像と異常画像の両方に合わせる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:21:01 GMT)
Nonclassicality of fully degenerate triple-photon states and its application in generating non-Gaussian entanglement [4.0] 圧縮状態の非ガウス性および非古典性は相互作用強度の増加とともに増大する。
ビームスプリッタ上の0相および$pi$相圧縮状態の干渉により生じる2モード状態の相関特性について検討した。
この結果は, 完全退化三光子状態の非古典的性質を強調し, それらの状態に基づいて非ガウス交絡を準備するための経路を確立する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:10:33 GMT)
pySpainMobility: a Python Package to Access and Manage Spanish Open Mobility Data [4.0] pySpainMobilityは、スペインのモビリティデータへのアクセスを簡単にするPythonパッケージである。
このパッケージは再現可能な分析を可能にし、研究、ポリシー、運用ドメインにわたるアプリケーションをサポートする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:49:10 GMT)
Inverse design of the transmission matrix in a random system using Reinforcement Learning [3.9] 本研究は, 補強学習を用いた伝送行列の変更による散乱系の逆設計へのアプローチを示す。
我々は,3種類の退化透過点を達成するために,物体関数のナビゲートに近似ポリシを利用する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:58:56 GMT)
Dynamical quantum phase transition with divergent multipartite entanglement [3.8] 可積分状態と非可積分状態の両方における一次元逆場イジングモデルの非平衡クエンチダイナミクスについて検討する。
本稿では, 動的量子相転移(DQPT)を急激な時間における分岐多部絡み合いを特徴とする新しいタイプの動的量子相転移(DQPT)について報告する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:19:20 GMT)
DSAC: Low-Cost RowHammer Mitigation Using In-DRAM Stochastic and Approximate Counting Algorithm [3.8] 本稿では,2種類の行アクティベーション誘発ビットフリップの基本機構について述べる。
最先端のカウンタベースアルゴリズムよりも133倍低い最大外乱を実現することができる,DRAM内保護技術を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:13:01 GMT)
Mind the Gap: a Spectral Analysis of Rank Collapse and Signal Propagation in Attention Layers [3.7] ソフトマックスに基づく注意の代替は、効果的な情報の流れを妨げる傾向があるためである。
我々は、注目行列の2つの最大の特異勾配の間のスペクトルギャップを明らかにするために厳密な解析を行う。
外れ値を取り除き、広さのランク崩壊を解消する新しい簡単な実用的解法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:30:24 GMT)
NAROCE: A Neural Algorithmic Reasoner Framework for Online Complex Event Detection [3.7] スマートシティやヘルスケアといった現実的なタスクの多くは、複雑なイベント(CE)の推論を必要とする。
オンラインCE検出のためのニューラルネットワーク推論フレームワークであるNAROCEを提案する。
実験の結果、NAROCEは精度、より長い、見えないシーケンスへの一般化、データ効率において最強のベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:31:42 GMT)
CodeImprove: Program Adaptation for Deep Code Models [3.6] コードモデルは、様々な理由でパフォーマンスが劣化することが多い。
我々は、通常の入力とスコープ外入力を区別し、スコープ外入力をスコープ内入力に変換するCodeImproveを提案する。
実験の結果、CodeImproveは精度8.78%まで向上し、2つのSEタスク上での3つのコードモデルの相対的改善の51.28%を達成できた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:59:44 GMT)
Querying Large Automotive Software Models: Agentic vs. Direct LLM Approaches [3.5] 大規模言語モデル(LLM)は、自然言語を通じてソフトウェアモデルのような複雑なソフトウェアアーチファクトと対話する新たな機会を提供する。
本稿では,LLMを利用してソフトウェアモデルに対する疑問に答えるための2つのアプローチについて検討する。
自動車分野におけるタイミング解析とソフトウェア最適化のために設計されたEcoreメタモデルを用いて,これらの手法を評価する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:34:28 GMT)
A dataset of high-resolution plantar pressures for gait analysis across varying footwear and walking speeds [3.5] UNB StepUP-P150は足底圧力を用いた歩行解析と認識のためのフットステップデータベースである。
このデータセットは、1.2m×3.6mの圧力感知通路を用いて収集された高分解能プランタ圧力データを含む。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:47:43 GMT)
Breaking Thought Patterns: A Multi-Dimensional Reasoning Framework for LLMs [3.5] 大規模言語モデル(LLM)は、しばしば厳格な推論プロセスによって制約され、創造的な応答を生成する能力を制限する。
これを解決するために、LADDERと呼ばれる新しいフレームワークを提案し、Chain-of-Thought(CoT)推論、Mixture of Experts(MoE)モデル、多次元アップ/ダウンサンプリング戦略を組み合わせた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:59:51 GMT)
Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery [3.4] 大腸全摘術後1年で死亡率の予測が得られた。
術後合併症,非計画的寛解,輸血,重症感染症が続発した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:52:58 GMT)
Cavity Optomechanical Probe of Gravity Between Massive Mechanical Oscillators [3.4] マイクロ波光学装置における重力探査手法を提案する。
このスキームは、試験質量と駆動源質量の間の周期的な重力変調をミリグラムスケールで組み込む。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:06:52 GMT)
Evaluating how LLM annotations represent diverse views on contentious topics [3.4] 生成型大規模言語モデル (LLM) は, 同一データセット内の同じ階層カテゴリーにおいて, 同一方向のバイアスを受ける傾向があることを示す。
自動データアノテーションタスクにLLMを用いた研究者や実践者にとっての意義について論じる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:52:04 GMT)
Beyond the First Read: AI-Assisted Perceptual Error Detection in Chest Radiography Accounting for Interobserver Variability [3.3] 本稿では,ポスト解釈コンパニオンシステムであるRADARを紹介する。
RADARは放射線学のアノテーションとCXRの画像を取り込み、地域レベルの分析を行う。
RADARのリコールは0.78、精度は0.44、F1のスコアは0.56であった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:36:38 GMT)
CHILL at SemEval-2025 Task 2: You Can't Just Throw Entities and Hope -- Make Your LLM to Get Them Right [3.3] エンティティ・アウェア・マシン翻訳(EA-MT)におけるSemEval 2025 Task 2のアプローチについて述べる。
提案システムは,大規模言語モデル(LLM)を用いた検索型拡張生成(RAG)と反復型自己精製手法の2つの主要なアプローチを組み合わせることで,名前付きエンティティの翻訳精度を向上させることを目的としている。
このシステムの特徴は自己評価機構であり、LLMはエンティティ翻訳の精度と全体的な翻訳品質の2つの重要な基準に基づいて、自身の翻訳を評価する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:26:10 GMT)
Resilient superconducting-element design with genetic algorithms [3.3] 超伝導量子回路は、原子エネルギースペクトルと選択規則をはしごと3レベル製造として示している。
我々のマルチループ回路は、回路パラメータのランダムなゆらぎ、すなわち最終的な欠陥の下では堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:30:24 GMT)
Cybersecurity and Embodiment Integrity for Modern Robots: A Conceptual Framework [3.3] 我々は、異なるデバイスに対するサイバー攻撃が、ロボットのタスクを完了させる能力に根本的に異なる結果をもたらすことを示す。
これらの提案を達成するには、ロボットは少なくとも3つの特性を持つ必要がある、と我々は主張する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:49:14 GMT)
A SHAP-based explainable multi-level stacking ensemble learning method for predicting the length of stay in acute stroke [3.3] 既存の機械学習モデルは、最適以下の予測性能、限定的な一般化可能性を示し、システムレベルの要因を見落としている。
我々は,虚血性脳梗塞と出血性脳梗塞に対する解釈可能な多段階重ねアンサンブルモデルを開発した。
説明可能なアンサンブルモデルは,虚血性脳卒中におけるLOSの延長を効果的に予測する。
出血性脳卒中にはさらなる検証が必要である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:45:13 GMT)
Adaptive Guidance Accelerates Reinforcement Learning of Reasoning Models [3.2] 検証可能な報酬(RLVR)に基づく強化学習で学習した推論モデルを用いて,新たな問題を解決する方法について検討する。
RLVRは、(1)pass@$k$をpass@1に圧縮し、(2)"capability gain"を通じて、モデルが以前、$k$で解決できなかった新しい問題を解決することを学習する、という2つの主要な手段を通してパフォーマンスを駆動する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:03:06 GMT)
Antibody Foundational Model : Ab-RoBERTa [3.2] 本稿では,RoBERTaを用いた抗体特異的モデルであるAb-RoBERTaを紹介する。
このリソースは、寄生虫の予測や人間性評価など、幅広い抗体関連研究応用をサポートすることを意図している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:22:07 GMT)
Probabilistic Modeling of Spiking Neural Networks with Contract-Based Verification [3.2] スパイキングニューラルネットワーク(SNN)は「現実的な」計算のモデルである。
SNNは、神経細胞の反応性活性化/応答の時間遅延(およびおそらくは確率)に焦点を当てている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:30:16 GMT)
Real Time Self-Tuning Adaptive Controllers on Temperature Control Loops using Event-based Game Theory [3.2] 本稿では,イベントベース動的ゲーム理論を用いた産業システムにおけるPID制御の適応性向上手法を提案する。
従来の自己学習手法とは対照的に,提案手法はイベント駆動型制御戦略とゲーム理論学習アルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:19:46 GMT)
SemanticST: Spatially Informed Semantic Graph Learning for Clustering, Integration, and Scalable Analysis of Spatial Transcriptomics [3.1] 本稿では,空間転写学解析のためのグラフベースのディープラーニングフレームワークSemanticSTを提案する。
ミニバッチトレーニングをサポートしており、Xenium(50,000セル)のような大規模データセットにスケーラブルなグラフニューラルネットワークとしては初めてのものだ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:40:40 GMT)
Entanglement witnesses mediated via axionLike particles [3.1] 絡み合いは単に量子的性質であり、卓上実験において標準模型を超えて物理学をテストするのに非常に役立つ。
空間量子重ね合わせにおける中性粒子と荷電粒子の対の赤外線状態における湯川型ポテンシャルの絡み合いに基づく部分正の証を与える。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:12:18 GMT)
AgentSense: Virtual Sensor Data Generation Using LLM Agents in Simulated Home Environments [3.1] 堅牢で一般化可能なスマートホームベースのヒューマンアクティビティ認識(HAR)システムを開発する上での大きな障害は、大規模で多様なラベル付きデータセットの欠如である。
本稿では,大規模言語モデルを利用して多様なペルソナを生成する仮想データ生成パイプラインであるAgentSenseを紹介する。
仮想センサデータを活用することで,特に実データに制限がある場合,性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:17:53 GMT)
Benchmarking Practices in LLM-driven Offensive Security: Testbeds, Metrics, and Experiment Design [3.1] 大きな言語モデル(LLM)は、攻撃的な浸透テストツールを駆動するための強力なアプローチとして現れています。
本稿では,Large Language Model (LLM) による攻撃の評価に使用される方法論とベンチマーク手法について分析する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:07:38 GMT)
Metritocracy: Representative Metrics for Lite Benchmarks [3.1] 評価指標のサブセットの選択のための2つの表現概念を定式化するために,社会選択理論からのアイデアを用いる。
まず、位置表現を導入し、すべての選択肢がすべての位置カットオフで十分に表現されていることを保証します。
次に、位置比例を導入し、任意の位置における小さな誤差よりも、比例的に過大あるいは過小に表現されないことを保証します。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:43:27 GMT)
The Rich Get Richer in Bitcoin Mining Induced by Blockchain Forks [2.9] マイニング報酬の分配の公平さは、少数の鉱山労働者の計算力の集中を防ぐ上で重要な役割を担っている。
計算資源が大きい鉱山労働者が不当に高い報酬を受け取れば、システムの分散化に対する脅威となる。
この研究は、意図しないブロックチェーンフォークに焦点を当てて、BitcoinのTRGRを分析します。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:03:50 GMT)
Using LLMs for Security Advisory Investigations: How Far Are We? [2.9] 大規模言語モデル(LLM)は、ソフトウェアセキュリティにおいてますます使われているが、正確な脆弱性アドバイザリを生成する上での信頼性は、いまだに不確実である。
本研究では,(1)CVE-IDから有効なセキュリティアドバイザリを生成し,(2)偽CVE-IDと現実を区別し,(3)CVE-IDをアドバイザリ記述から抽出する能力について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:17:34 GMT)
Evaluating Sensitivity Parameters in Smartphone-Based Gaze Estimation: A Comparative Study of Appearance-Based and Infrared Eye Trackers [2.9] 本研究では,スマートフォンを用いた深層学習眼球追跡アルゴリズムの評価を行い,その性能を市販の赤外線眼球追跡装置と比較した。
本研究の目的は,現実的なモバイル利用条件下での外観に基づく視線推定の実現可能性を検討することである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:38:38 GMT)
Qwen vs. Gemma Integration with Whisper: A Comparative Study in Multilingual SpeechLLM Systems [2.9] 本稿では,MLC-SLM Challenge 2025のための大規模言語モデル(LLM)を用いた多言語音声認識と言語モデリングに焦点を当てた。
本システムでは,Qwen2.5-7Bをデコーダのみの言語モデルとして,Gemma3-12Bと18.6%を用いて,プライベートテスト平均WER/CERの16.63%の競合性能を実現している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:23:07 GMT)
An Empirical Study of LLM-as-a-Judge: How Design Choices Impact Evaluation Reliability [2.9] 評価における評価設計,復号化戦略, CoT (Chain-of-Tought) 推論の効果について検討した。
その結果,評価基準は信頼性に重要であり,非決定的サンプリングは決定論的評価よりも人間の嗜好との整合性を向上し,CoT推論は明確な評価基準が存在する場合の利得を最小化することがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:04:43 GMT)
Students' Reliance on AI in Higher Education: Identifying Contributing Factors [2.7] 本研究では,大学生のAI依存パターンに寄与する潜在的な要因について検討した。
適切な依存は、学生の自己効力、プログラミングリテラシー、認知の必要性に大きく関係している。
信頼度は、タスク後の信頼度とAIアシスタントとの満足度に有意な相関を示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:55:26 GMT)
PRISM2: Unlocking Multi-Modal General Pathology AI with Clinical Dialogue [2.7] PRISM2は、臨床対話を通して訓練された多モードスライドレベルの基礎モデルであり、スケーラブルで一般化可能な病理学AIを実現する。
PRISM2は、70万近い標本(230万WSI)と実際の臨床診断報告を2段階のプロセスで組み合わせて訓練されている。
PRISMやTITANといった従来のスライドレベルのモデルよりも優れており、診断およびバイオマーカー予測タスクにおいて高い性能を発揮する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:12:51 GMT)
EmoNews: A Spoken Dialogue System for Expressive News Conversations [2.6] 本研究では,文脈的手がかりに基づいて感情音声を制御するタスク指向音声対話システム(SDS)を開発した。
感情的SDSに対する主観評価尺度を提案し,提案システムとベースラインシステムの感情制御性能を判定する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:16:04 GMT)
Evaluating Explainability: A Framework for Systematic Assessment and Reporting of Explainable AI Features [2.4] 説明可能なAI機能の評価と報告を行うフレームワークを提案する。
評価の枠組みは,(1)類似した入力に対する説明のばらつきの定量化,2)説明が真実にどの程度近いかの定式化,3)説明とモデル内部機構の整合性の評価,4)タスク性能への影響評価の4つの基準に基づく。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:51:46 GMT)
Missing the human touch? A computational stylometry analysis of GPT-4 translations of online Chinese literature [2.4] 本研究では,大規模言語モデル(LLM)のスタイリスティックな特徴について検討する。
計算スタイメトリー分析により、GPT-4翻訳は語彙、構文、内容の特徴において人間の翻訳と密接に一致していることが示された。
これらの発見は、ポストヒューマンの観点から、AIが文学翻訳に与える影響についての洞察を与える。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:48:09 GMT)
Evaluating Generalization and Representation Stability in Small LMs via Prompting [2.4] 本稿では,小型言語モデルの2つの適応パラダイムに基づく一般化能力について検討する。
本研究は,小モデルが適応戦略の異なる知識を内在化し,一般化する過程において,重要な違いを呈するものである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:44:26 GMT)
An Explainable and Interpretable Composite Indicator Based on Decision Rules [2.4] 複合指標は、複数の基準で評価された単位の得点や分類に広く用いられている。
結果の説明可能性と解釈可能性、および手順の透明性を保証することが不可欠である。
本稿では,「if..., then...」決定規則を用いて,説明可能な複合指標と解釈可能な複合指標を構築する手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:00:12 GMT)
High-expressibility Quantum Neural Networks using only classical resources [2.3] 本稿ではQNNアプリケーションでよく用いられるパラメタライズド量子回路の表現可能性について検討する。
QNNにおける高い表現性は、純粋に古典的なリソースで達成可能である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:29:28 GMT)
NaSh: Guardrails for an LLM-Powered Natural Language Shell [2.3] 自然言語シェルは、ユーザがそのようなエラーから回復するためのガードレールを提供するべきだ、と私たちは主張する。
私たちはNaShという新しいシェルを設計することで、それを実現するためのいくつかのアイデアを具体化します。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:34:25 GMT)
Training Hybrid Deep Quantum Neural Network for Efficient Reinforcement Learning [2.3] 量子回路は、次元が指数関数的に増加するヒルベルト空間にデータを埋め込む。
量子回路を局所的に近似する有接サロゲートqtDNNを導入する。
我々は、連続制御強化学習のためのハイブリッドディープ量子ニューラルネットワークhDQNN-TD3を設計する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:42:00 GMT)
Evaluation of Nuclear Microreactor Cost-competitiveness in Current Electricity Markets Considering Reactor Cost Uncertainties [2.2] 本稿では、今日の電力市場におけるマイクロリアクターのコスト競争性を評価し、原子炉コストの不確実性に着目した。
遺伝的アルゴリズム(GA)は、原子炉燃料の濃縮、尾の濃縮、燃料交換間隔、排出燃焼といった重要な技術パラメータを最適化するために用いられる。
その結果、マイクロリアクターはコスト競争力を維持することができ、生産税額控除(PTC)が支持すれば、Lは48.21/MWhから78.32/MWhとなる。
オフショア風、水力、バイオマスといった従来の原子力、石炭、再生可能エネルギーと比較して、最適化されたマイクロア
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:04:48 GMT)
Looking around you: external information enhances representations for event sequences [2.2] 表現学習は、ストア購入、クライアントトランザクション、一般の人々の振る舞いなど、さまざまなドメインでモデルを生成する。
我々は複数のユーザ表現から情報を集約し、複数のイベントシーケンスのシナリオに対して特定のユーザを増強する手法を開発した。
本研究は,単純なプール技術から,トレーニング可能な注意に基づくカーネルアテンションアグリゲーションまで,多様なアグリゲーションアプローチについて考察する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:14:34 GMT)
Stress-Testing Multimodal Foundation Models for Crystallographic Reasoning [2.2] 結晶学的推論の基礎モデルを評価するには、物理的な制約を課しながら一般化挙動を分離するベンチマークが必要である。
本研究では,ストレステスト型マルチモーダル生成モデルに対する2つの物理的基盤評価プロトコルを備えたマルチスケールマルチクリスタルデータセットを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:40:33 GMT)
KI4Demokratie: An AI-Based Platform for Monitoring and Fostering Democratic Discourse [2.2] 私たちは、ジャーナリスト、研究者、政策立案者を支援するAIベースのプラットフォームKI4Demokratieを紹介します。
KI4Demokratieは、毎日収集された大規模なドイツのオンラインデータに機械学習モデルを適用する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:27:27 GMT)
Generalized Proof-Number Monte-Carlo Tree Search [2.1] 一般化Proof-Number Monte-Carlo Tree Search:最近提案されたProof-Number Search(PNS)とMCTS(MCTS)の組み合わせの一般化
本稿では,従来のPNSとMCTSの組み合わせの3つのコア修正を提案する。
これにより、もはや無防備な数を必要としないという意味でコードの複雑さを減らし、2人以上のプレイヤーを持つゲームに適用可能なテクニックを一般化する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:45:36 GMT)
POPQC: Parallel Optimization for Quantum Circuits (Extended Version) [2.0] 量子プログラムや回路の最適化は、量子コンピューティングの基本的な問題である。
最近の研究は、局所最適性と呼ばれるより弱い最適性を求める新しいアプローチを提案した。
本稿では,量子回路の局所最適化のための並列アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:26:27 GMT)
PB$^2$: Preference Space Exploration via Population-Based Methods in Preference-Based Reinforcement Learning [2.0] 我々は、この選好探索問題を人口ベース手法を用いて同定し、解決する。
多様なエージェントの個体数を維持することで、より包括的な選好環境の探索が可能になることを実証する。
この多様性は、明らかに区別可能な振る舞いを持つ嗜好クエリを生成することにより、報酬モデル学習を改善する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:51:33 GMT)
Observation of many-body coherence in quasi-one-dimensional attractive Bose gases [2.0] マクロコヒーレンス(Macroscopic coherence)は、集合的な振る舞いを示す量子多体系の重要な特徴である。
ここでは, 退化擬似一次元(1D)ボースガスの1次および2次コヒーレンスを, 反発性から変調不安定な相互作用系に焼成した実験的検討を行った。
その結果, 非線形物理学における雑音増幅密度変調と分散衝撃波との相互作用から位相コヒーレント密度波の進化が明らかとなった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:23:20 GMT)
Task-aligned prompting improves zero-shot detection of AI-generated images by Vision-Language Models [2.0] 本研究では,AI生成画像のゼロショット検出における事前学習型視覚言語モデルの使用について検討する。
タスクアライメントの促進により、より焦点を絞った推論が可能となり、微調整なしで性能が大幅に向上することを示す。
以上の結果から,タスクアライメントは,VLMの潜在能力の向上と,より集中的な推論を促すことが示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:28:03 GMT)
Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets: the triangular lattice [2.0] 我々は、三角-格子反強磁性ハイゼンベルクモデルの研究のために、リカレントニューラルネットワーク(RNN)波動関数アンゼを用いている。
我々は、ハミルトニアン変換によりシミュレーションの精度を著しく改善できることを見出した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:10:53 GMT)
Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets: the square lattice [2.0] 機械学習に基づく変分モンテカルロシミュレーションは、量子多体基底状態をターゲットにするための有望なアプローチである。
我々は、リカレントニューラルネットワーク(RNN)を変分アンセットとして使用し、そのリカレント特性を活用して、徐々に大きなシステムの基底状態をシミュレートする。
トレーニング時間を増やすことで,シミュレーションの結果の精度を体系的に向上できることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:08:24 GMT)
Quantum Algorithm for Estimating Betti Numbers Using Cohomology Approach [2.0] トポロジカルデータ分析は大規模データ分析の強力なツールとして登場した。
我々は双対のアプローチ、すなわちコホモロジーを利用して、ホッジ理論の洞察とデ・ラムコホモロジーの洞察を組み合わせた。
より詳細な分析を行い、我々のコホモロジーフレームワークは、いくつかの制度において以前のホモロジー法よりも指数関数的に高速に動作可能であることを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:49:30 GMT)
Hybrid Meta-learners for Estimating Heterogeneous Treatment Effects [2.0] 観測データから条件平均治療効果(CATE)を推定するには、教師付き学習とは異なる決定をモデル化する必要がある。
従来のアプローチは、2つの主要な「メタ・ラーナー」パラダイムに分類することができる。
データセットに応じて直接正規化と間接正規化を補間する新しい正規化戦略であるHybrid Learner(H-learner)を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:37:20 GMT)
Mapping Farmed Landscapes from Remote Sensing [1.9] 本稿では,農村景観の特徴の高解像度(25cm)マップであるFarmscapesを紹介した。
このマップは、942の注釈付きタイルからなる新しいデータセットに基づいて訓練されたディープラーニングセグメンテーションモデルを用いて作成された。
Google Earth Engineでイングランド全体の地図を公開することによって、生態学者や政策立案者に強力なオープンアクセスツールを提供しています。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:50:05 GMT)
Large Language Models as 'Hidden Persuaders': Fake Product Reviews are Indistinguishable to Humans and Machines [1.9] 3つの研究によると、人間は機械によって生成された実際の製品レビューと偽の製品レビューを区別できなくなった。
その結果, 信頼性の高い購入検証に頼らなければ, 至るところのレビューシステムは, 不正行為の機械化の影響を受けやすいことが明らかとなった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:54:56 GMT)
Prekey Pogo: Investigating Security and Privacy Issues in WhatsApp's Handshake Mechanism [1.8] WhatsAppはSignalプロトコルのバージョンを使用して、強力なセキュリティ保証を備えたエンドツーエンド暗号化(E2EE)を提供する。
最初からPFS(Perfect Forward Secrecy)を確実にするには、一時(一度)プリキーのスタッシュをサーバに格納する必要がある。
私たちは、WhatsAppの個々のユーザーデバイスに対して、ターゲットとする致命的な攻撃をデモした最初の人です。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:22:46 GMT)
Generalizing the matching decoder for the Chamon code [1.8] チャモン符号として知られる3次元,非CSS,低密度のパリティチェックコードに対して,マッチングデコーダのバリエーションを実装した。
一般化された整合デコーダは、整合前に信念伝播ステップによって拡張され、ノイズの偏極に対するしきい値が10.5%となる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:46:57 GMT)
Intelligent Image Sensing for Crime Analysis: A ML Approach towards Enhanced Violence Detection and Investigation [1.8] 本稿では,暴力検出と分類のための包括的枠組みを導入し,二者・多階級の暴力分類にスーパーバイザード・ラーニングを適用した。
トレーニングは、フレームレベルのアノテーションを備えたさまざまなカスタマイズされたデータセット上で実施され、監視カメラ、人間の録画、ホッケーの試合、ソハ、さまざまなプラットフォームにわたるwvdデータセットのビデオが組み込まれている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:39:16 GMT)
From Flat to Feeling: A Feasibility and Impact Study on Dynamic Facial Emotions in AI-Generated Avatars [1.8] 我々は,Unreal Engine 5 MetaHumanレンダリングとNVIDIA Omniverse Audio2Faceを併用したリアルタイムアーキテクチャを導入し,評価した。
その結果、アバターは、悲しみと喜びで高い識別率を達成することで、感情を認知的に表現できることが示された。
しかし、怒りの認識は音声を使わずに著しく低下し、高覚醒感情に対する同調的な声道の重要性が浮き彫りになった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:34:36 GMT)
Latent Multi-Head Attention for Small Language Models [1.7] 本稿では,小型言語モデルに対する潜時マルチヘッドアテンション(MLA)の総合的研究について紹介する。
標準マルチヘッドアテンション(MHA)、MLA、MLA+RoPE(MLA+RoPE)の3種類のアーキテクチャをベンチマークする。
我々の重要な発見は、半ランクの潜伏次元 (r = d/2) を持つ MLA+RoPE が 45% KV-cache のメモリ削減を実現し、検証損失は 0.3% しか増加していないことである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:57:37 GMT)
Connecting phases of matter to the flatness of the loss landscape in analog variational quantum algorithms [1.7] 変分量子アルゴリズム(VQA)は、短期的な量子優位を約束するが、デジタルゲートベースのアプローチで一般的に構築されるパラメトリズド量子状態は、バレンプラトーのようなスケーラビリティの問題に悩まされることが多い。
いくつかの量子シミュレーションプラットフォームに固有の、乱れたIsing鎖の$M$ quenchesからなるアナログVQA ans'atzeについて検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:00:02 GMT)
Entanglement-minimized orbitals enable faster quantum simulation of molecules [1.7] スピン適応行列積状態(MPS)を用いたエンタングルメント最小化軌道(EMO)を見つけるための効率的な古典的アルゴリズムを提案する。
提案アルゴリズムは,4つの鉄を含む鉄硫黄クラスターに対する事前の軌道最適化手法に対して,ほぼ1桁の精度で初期状態の重なりを向上する。
以上の結果から,これらの課題に対する初期状態の準備には,従来の推定値よりもはるかに少ないリソースが必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:49:20 GMT)
Can you see how I learn? Human observers' inferences about Reinforcement Learning agents' learning processes [1.7] 強化学習(RL)エージェントは、人間の観察者によって直感的に解釈できない学習行動を示すことが多い。
この研究は、エージェントの学習プロセスに対する人間の観察者の理解の要因に関するデータ駆動的な理解を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:04:27 GMT)
Autonomous Computer Vision Development with Agentic AI [1.7] 本稿では,エージェントAIを用いた自然言語プロンプトから,特殊なコンピュータビジョンシステムを自律的に構築できることを実証する。
これには、医療画像分析ツールを備えたオープンソースのCognitive AI環境であるSimpleMind(SM)の拡張が含まれていた。
コンピュータビジョンエージェントは、肺、心臓、リブの平均ダイススコア0.96、0.82、0.83の50個の胸部X線画像に対して、自動的に設定、訓練、テストを行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:18:56 GMT)
Thought Crime: Backdoors and Emergent Misalignment in Reasoning Models [1.7] 私たちは、Chain-of-Thoughtを無効にした悪意のある行動に関する推論モデルを微調整し、評価時にCoTを再実現します。
推論モデルは、しばしばバックドアトリガーを記述し、説明し、ある種の自己認識を示すことができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:10:04 GMT)
Navigating through CS1: The Role of Self-Regulation and Supervision in Student Progress [1.7] 大学への流動的な移行のための学生の自己規制の必要性は知られている。
本研究の目的は,学習支援活動とコース管理活動とをCS1内で統合することであった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:17:23 GMT)
Refining Ky Fan's majorization relation with linear programming [1.6] 2つの正の半定値作用素のテンソル積である2つの作用素の和に対して、ケイファンの偏微分関係の可分版が証明される。
量子情報理論におけるスピンアライメント予想は、2レターレベルに肯定的に解決される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:52:57 GMT)
Honesty in Causal Forests: When It Helps and When It Hurts [1.6] 正直さは個人レベルの効果推定の精度を損なう可能性があることを示す。
我々は、誠実さは正規化の一形態であり、正規化の選択と同様に、非正規化のパフォーマンスによって導かれるべきであると主張する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:32:58 GMT)
A Systematic Review of User-Centred Evaluation of Explainable AI in Healthcare [1.6] 本研究の目的は、医療におけるXAIのユーザエクスペリエンスを特徴付ける、明確に定義された原子特性の枠組みを開発することである。
また,システム特性に基づいて評価戦略を定義するための文脈に敏感なガイドラインも提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:30:00 GMT)
A classical proof of quantum knowledge for multi-prover interactive proof systems [1.6] 知識証明(PoK)において、検証者は、証明者が特権情報を持っていることを確信する。
QMAにおける問題に対する最初の統計的ゼロ知識(ZK) PoK証明システムを提案する。
我々の結果は、事前共有された絡み合った状態の証明に加えて、証明者が量子システムにアクセスできることを証明する、新しい形の自己テストと見なすことができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:45:50 GMT)
Towards Infant Sleep-Optimized Driving: Synergizing Wearable and Vehicle Sensing in Intelligent Cruise Control [1.5] 自動運転(AD)は車の安全性と運転の快適性を大幅に向上させたが、乗客の健康、特に幼児の睡眠への影響は十分に研究されていない。
本稿では,運転行動のパーソナライズと,利用者の快適さと旅行効率の最適なバランスをとるために,AD内における強化学習(RL)の統合について検討する。
幼児の睡眠の質を高めるため,様々な運転条件に適応するインテリジェントクルーズ制御フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:29:36 GMT)
Efficient learning and optimizing non-Gaussian correlated noise in digitally controlled qubit systems [1.5] 雑音最適化回路設計における高次スペクトル推定法について述べる。
注目すべきは、デジタル駆動された量子ビットダイナミクスは、適用された制御の複雑さによってのみ決定できることである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:01:54 GMT)
ADAM-Dehaze: Adaptive Density-Aware Multi-Stage Dehazing for Improved Object Detection in Foggy Conditions [1.5] 逆気象条件、特に霧は、自動運転車、監視システム、その他の安全上重要なアプリケーションに重大な課題をもたらす。
霧強度の異なる画像復元と物体検出を共同で最適化する適応型高密度脱ヘイズフレームワークであるADAM-Dehazeを紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:00:52 GMT)
Improving Prostate Gland Segmenting Using Transformer based Architectures [1.5] 前立腺解剖の自動セグメンテーションに、読者間変動とクロスサイトドメインシフトが挑戦する。
前立腺分画におけるUNETRとSwinUNETRの性能を以前の3D UNetモデルと比較した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:53:50 GMT)
Towards Explaining Monte-Carlo Tree Search by Using Its Enhancements [1.4] 本稿では,XAI のサブフィールドである Explainable Search に応用される知識に依存しない説明性の必要性を論じる。
モンテカルロ木探索(MCTS)の拡張は、知識のないまま、追加データを取得し、高品質な説明を提供するソリューションとして提案されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:21:37 GMT)
Integrated Pipeline for Monocular 3D Reconstruction and Finite Element Simulation in Industrial Applications [1.4] 本稿では,モノクロ映像,有限要素シミュレーション解析,複合現実視表示に基づく高忠実度3次元再構成を統合した統合ワークフローを提案する。
実験により, 精度を高く保ちながら, シミュレーション効率と可視化効果が良好であることが確認された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:57:05 GMT)
Dimension Reduction via Random Projection for Privacy in Multi-Agent Systems [1.4] マルチエージェントシステム(MAS)では、エージェントはシステムについて観測を行い、その情報を融合センターに送信する。
融合センターは情報を集約し、可能な限り精度でシステムパラメータについて結論付けます。
システム全体の効率性を改善するために、エージェントは観測データにいくつかのプライベートパラメータを追加する必要がある。
このシナリオでは、フュージョンセンターに送信されたデータは、プライバシー上のリスクに直面します。
フュージョンセンタに通信するデータは、データプライバシ侵害や推論攻撃に対して、分散的に保護されなければならない。
コサイン類似度を用いたシステムの実用性とプライバシの定量化
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:34:28 GMT)
Density-aware Walks for Coordinated Campaign Detection [1.4] コーディネートされたキャンペーンは、ソーシャルメディアプラットフォームをしばしば活用し、トピックを人工的に増幅し、不正確なトレンドをオーガニックに見せ、ユーザをエンゲージメントに誤解させる。
本研究は,問題をグラフ分類タスクとしてモデル化することで協調キャンペーンを検出することに焦点を当てる。
最近導入されたLarge Engagement Networks (LEN)データセットを利用することで、2023年のトルコ大統領選挙に先立ち、Twitter上のフェイクトレンドと認証トレンドの両方からエンゲージメントパターンをキャプチャする300以上のネットワークを含む。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:44:38 GMT)
Theory of Stationary Photon Emission from a Steadily Driven Parametric Oscillator Based on the Complex Spectral Analysis of the Heisenberg Equation [1.3] パラメトリック発振器からの連続場への光子放出特性が発振器の複素固有周波数の挙動とどのように関係しているかを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:00:21 GMT)
Projecting U.S. coastal storm surge risks and impacts with deep learning [1.3] 熱帯低気圧(TC)による最も致命的な危険の1つ
近年の人工知能の自然災害モデリングへの応用は、この問題に対処するための新たな道のりを示唆している。
深層学習嵐サージモデルを用いて,米国における沿岸域のサージリスクを90万件の総合TCイベントから効率的に推定する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:12:51 GMT)
Automatic Extraction of Clausal Embedding Based on Large-Scale English Text Data [1.3] 本稿では、英語の埋め込み節の自然発生例を検知し、注釈付けするための方法論的アプローチを提案する。
我々のツールは、我々のデータセットGolden Embedded Clause Set (GECS)で評価されている。
本稿では,オープンソースコーパスDolmaから抽出した自然発生英語の埋め込み節の大規模データセットについて述べる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:48:04 GMT)
Estimating the Jones polynomial for Ising anyons on noisy quantum computers [1.2] 本研究では,既存の雑音量子コンピュータから得られた実験結果について述べる。
我々は、ユニティの格子根であるユニティの4番目の根における評価に焦点をあてる。
振幅の実部と虚部を加法誤差まで推定するには、アダマール試験を用いる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:36:02 GMT)
Enabling On-Device Medical AI Assistants via Input-Driven Saliency Adaptation [1.2] 大規模言語モデル(LLM)は、医療シナリオに重大な影響を与えるが、エッジデバイスなどのリソース制約のあるリアルタイム環境へのデプロイには、違法に大きいままである。
汎用圧縮フレームワークによって最適化された新しい医療アシスタントシステムを導入し,LLMを専門分野への展開に適したものにする。
ドメイン固有データに対するニューロンの塩分濃度を計測することにより、無関係なニューロンを積極的にプーンし、性能を保ちながらモデルサイズを小さくすることができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:22:18 GMT)
Characterizing Linguistic Shifts in Croatian News via Diachronic Word Embeddings [1.2] 950万のクロアチアのニュース記事のコーパスを用いて、5年間にトレーニングされたスキップグラムワード埋め込みを用いて意味変化を定量化する。
分析の結果,単語の埋め込みは,この時間帯における主要な話題に関連する用語の言語的変化を捉えていることがわかった。
また、2020年以降のエンコードによる埋め込みが感情分析タスクの肯定性を高めているという証拠も見出され、同時期に精神状態の低下が報告された研究とは対照的である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:54:56 GMT)
Riemann Tensor Neural Networks: Learning Conservative Systems with Physics-Constrained Networks [1.2] 微分自由対称テンソル(DFST)は連続体力学において基本的なものである。
本稿では,DFST条件をマシン精度に本質的に満足する新しいニューラルアーキテクチャを提案する。
この研究は、ニューラルPDEサロゲートの誘導バイアスとしてDFSTを使った最初のものである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:33:21 GMT)
Recognizing Unseen States of Unknown Objects by Leveraging Knowledge Graphs [1.2] 我々は,オブジェクトの知識や推定に頼らずに,あるオブジェクトの状態を予測する最初のオブジェクト非依存状態分類法(OaSC)を提案する。
提案手法の各種環境における性能について検討した。
提案したOaSC法は,すべてのデータセットやベンチマークにおける既存手法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:30:26 GMT)
A Practical Guide for Evaluating LLMs and LLM-Reliant Systems [1.2] 本稿では,代表的なデータセットを積極的にキュレートし,有意義な評価指標を選択するための実践的評価フレームワークを提案する。
我々は,現実の要求に順応し,ユーザニーズに応えなければならないシステムの実践的開発と展開をうまく統合する有意義な評価手法を採用する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:18:16 GMT)
From Data-Driven to Purpose-Driven Artificial Intelligence: Systems Thinking for Data-Analytic Automation of Patient Care [1.1] 機械学習のために既存の実世界の患者データセットを再利用することは、モデル開発における最適なアプローチであるとは限らない、と我々は主張する。
我々は,臨床理論と実世界の運用状況の社会技術的現実性に基づく,目的駆動型機械学習パラダイムを提唱する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:07:44 GMT)
Impact of Fixing Spins in a Quantum Annealer with Energy Rescaling [1.1] 本研究では,固定スピン,有望なサイズ縮小法,およびエネルギー再スケーリングの影響について検討した。
量子アニール器を用いた数値シミュレーションと実験により、固定スピン法が量子アニール性能を向上させることを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:59:40 GMT)
Compositional World Knowledge leads to High Utility Synthetic data [1.1] 限られたデータに対する条件付き拡散モデルのトレーニングが,不正確な基礎分布をもたらすことを示す。
我々は、条件付き独立を強制することによって世界の構成的性質を反映するCoInDを提案する。
我々は、CoInDが生成した合成データが忠実であることを示し、これはCelebAにおける合成シフトタスクにおける最先端の最悪のグループ精度に変換する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:22:17 GMT)
Step-by-step Instructions and a Simple Tabular Output Format Improve the Dependency Parsing Accuracy of LLMs [1.1] そこで我々は,音声の共通部分タグ付けが,構文的頭部と依存性ラベルの予測に先行する,新しいステップバイステップの指示戦略を提案する。
本手法は,幻覚や汚染を伴わない17言語を対象に,Universal Dependenciesデータセットの最先端精度を実現する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:09:38 GMT)
From Empirical Evaluation to Context-Aware Enhancement: Repairing Regression Errors with LLMs [1.1] Javaレグレッションバグに関するAPRテクニックを実証研究する。
RegMiner4APRは、広く使用されている32の現実世界のJava GitHubリポジトリから収集されたJava回帰バグのベンチマークである。
以上の結果から,従来のAPRツールはバグ修正に失敗し,LSMベースのAPRアプローチは有望な可能性を秘めていることがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:49:18 GMT)
LapDDPM: A Conditional Graph Diffusion Model for scRNA-seq Generation with Spectral Adversarial Perturbations [1.0] 安定かつ高忠実な scRNA-seq 生成のための条件付きグラフ拡散確率モデルである LapDDPM を導入する。
我々は,複雑なscRNA-seq分布からの効果的な学習と生成のための条件付きスコアベースモデルを開発した。
多様なscRNA-seqデータセットの実験は、LapDDPMの優れた性能を示し、高い忠実性を実現し、生物学的に証明可能な細胞型特異なサンプルを生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:35:32 GMT)
Decompositional Reasoning for Graph Retrieval with Large Language Models [1.0] 大規模言語モデル(LLM)は多くのNLPタスクに優れるが、マルチホップ推論と現実の一貫性に苦しむ。
本稿では,テキスト知識グラフをクエリ分解によるLLM推論プロセスに統合する新しい検索手法を提案する。
本手法は,複雑な質問をサブクエストに分解し,関連するテキストのサブグラフを検索し,質問固有の知識グラフを作成して回答生成を誘導する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:44:28 GMT)
Ace-CEFR -- A Dataset for Automated Evaluation of the Linguistic Difficulty of Conversational Texts for LLM Applications [1.0] Ace-CEFRは、英語の会話文節のデータセットで、対応するレベルのテキスト難易度に専門家が注釈を付けたものである。
Ace-CEFRで訓練されたモデルは、人間の専門家よりもテキストの難易度を正確に測定できることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:40:16 GMT)
A Criterion for Extending Continuous-Mixture Identifiability Results [0.9] 混合分布は、ランダム現象をモデル化するための多用途で広く使用されるフレームワークを提供する。
我々は、既知のカーネルベースの識別可能性の結果を新しいカーネル分布に拡張するために、単純な基準である生成機能アクセシビリティーを指定する。
この基準は、関連するカーネルのモーメント生成関数やラプラス変換の関数関係に基づいており、離散変数と連続変数の両方の連続混合に適用することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:39:01 GMT)
Development of the user-friendly decision aid Rule-based Evaluation and Support Tool (REST) for optimizing the resources of an information extraction task [0.9] ルールは、持続可能性、転送可能性、解釈可能性、開発負担の観点からMLやLLMと比較して、情報抽出(IE)のデフォルトオプションになり得る。
IE の手法としてルールと ML の持続的かつ複合的な利用を提案する。
私たちは、アノテータがデフォルトのオプションとしてルールを選択し、IEタスクの各エンティティに対してMLを選択するのを助けるために、REST決定ツールの有効性とパフォーマンスメトリクスを開発し、検証しました。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:38:04 GMT)
Sketched Sum-Product Networks for Joins [0.9] そこで我々はSum-Product Networksを提案する。
我々は,Fast-AGMSとBound Sketchメソッドを実装した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:13:48 GMT)
AI-Informed Model Analogs for Subseasonal-to-Seasonal Prediction [0.9] 季節と季節の予測は公衆衛生、災害に備え、農業に不可欠である。
我々は、S2S予測を改善するための解釈可能なAIインフォームドモデルアナログ予測手法について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:39:13 GMT)
Knowledge Graph Fusion with Large Language Models for Accurate, Explainable Manufacturing Process Planning [0.9] 検索と合成を強化した検索検索ネットワーク(ARKNESS)を提案する。
ARKNESSはゼロショットの知識グラフ構築と検索拡張生成を融合し、CNCプロセス計画のための検証済みで数値的に正確な回答を提供する。
ARKNESSは、ツールサイズとフィードスピードの最適化にまたがる155の業界別質問に基づいて、GPT-4oの精度と、複数選択の精度で+25ポイントのゲインを達成している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:26:08 GMT)
SPOT: Bridging Natural Language and Geospatial Search for Investigative Journalists [0.9] SPOTはオープンソースの自然言語インタフェースであり、OSMのリッチでタグベースの地理データを直感的なシーン記述を通じてよりアクセスしやすいものにしている。
モデル出力の幻覚、OSMタグ付けの不整合、ユーザ入力のノイズの性質といった現実的な課題に対処する。
我々の知る限り、SPOTは、このレベルの精度でOSMデータへの信頼できる自然言語アクセスを実現する最初のシステムである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:55:44 GMT)
Gravitational wave imprints on spontaneous emission [0.9] 平面重力波は単一原子からの自然放出を変調することを示す。
解析の結果、この効果は最先端のコールド原子実験で測定できることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:00:05 GMT)
Flexible-length Text Infilling for Discrete Diffusion Models [0.9] この課題を克服するための最初の離散拡散モデルである textbfDDOT (textbfDiscrete textbfDiffusion with textbfOptimal textbfTransport Position Coupling) を導入する。
DDOTは、新しいサンプルレベル最適輸送(OT)結合を用いて、トークン値とトークン位置を共同で識別する。
One-Billion-WordやYelpといったテキスト入力ベンチマークの実験では、DDOTが単純な拡散ベースラインより優れていることが示されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:02:12 GMT)
Efficient Algorithms for Logistic Contextual Slate Bandits with Bandit Feedback [0.8] 本稿では,ロジスティック・コンテクスト・スレート・バンド問題について考察する。
選択したスレートに対して、ロジスティックモデルにより決定された単一のバイナリ報酬が観測される。
本稿では,Slate-GLM-OFUとSlate-GLM-TSの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:19:02 GMT)
A Necessary and Sufficient Condition for Quantum Realizability of Correlations for Arbitrary Normalized Observables in the Clauser--Horne--Shimony--Holt Setup [0.8] 我々は、任意の固定正規化可観測体のクレーター-ホーネ-シモニー-ホルト設定で与えられた相関値を再現する量子状態を確立する。
我々の条件はベルの元々のシナリオに当てはまり、ベルの元々の不等式が侵害されているか否かは、選択された可観測物に敏感に依存することを明らかにする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:21:06 GMT)
From Reasoning to Code: GRPO Optimization for Underrepresented Languages [0.8] 本稿では,Qwen 2.5モデルの小型コードバージョンとグループ相対ポリシー最適化を組み合わせた一般化可能なアプローチを提案する。
推論によるフィードバックを直接強化学習ループに統合することにより、論理的に一貫性があり、構文的に正確なコードを生成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:41:16 GMT)
Angular Momentum Entanglement Mediated By General Relativistic Frame Dragging [0.7] フレーム描画に関する一般相対論的補正を考慮した球対称試験質量の角モータ間の相互作用について検討した。
このアプローチでは、プローブの質量は直接的に関係せず、代わりに角運動量が中心的な役割を果たす。
最適エンタングリング速度は最大で非局在な初期状態で達成されるが、有意な量子相関は2つの回転系の間でも生じうることを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:17:38 GMT)
AS400-DET: Detection using Deep Learning Model for IBM i (AS/400) [0.7] 1,050のシステム画面画像からなる人手による注釈付きデータセットを提案する。
各イメージには、テキストラベル、テキストボックス、オプション、テーブル、命令、キーボード、コマンドラインを含む複数のコンポーネントが含まれている。
我々は最先端のディープラーニングモデルに基づく検出システムを開発し、異なるアプローチを評価する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:53:30 GMT)
Dual Protection Ring: User Profiling Via Differential Privacy and Service Dissemination Through Private Information Retrieval [0.7] 我々は、個人化されたサービスを評価するために、機密性の高いプライベート属性と、差分プライバシーに基づく同等のプロファイルを含むユーザプロファイルを開発する。
我々は、個人化されたサービスを、異なる個人プロファイルに対して検索するために、異なる種類のプライベート情報検索(PIR)を使用する。
実験の結果,PIR方式の違いによる処理遅延は,現在の広告システムと類似していることがわかった。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:33:12 GMT)
ViewPCL: a point cloud based active learning method for multi-view segmentation [0.7] このフレームワークは、ポイントクラウドの分布間の差を測定する新しいスコアに依存している。
提案手法は,データ効率が高く説明可能なアクティブラーニング手法である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:16:17 GMT)
Stimulus Motion Perception Studies Imply Specific Neural Computations in Human Visual Stabilization [0.7] プレゼンテーションは2段階に分かれている。第1に、実験的に観察された行動に非常に寄与するメカニズムの動作に関する機能的な記述である。
第二に、機能的振る舞いを実装する可能性のある回路レベルの神経要素のより投機的な提案である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:00:49 GMT)
Evaluating the Robustness of Dense Retrievers in Interdisciplinary Domains [0.6] 評価ベンチマークの特徴は、検索モデルにおけるドメイン適応の真の利点を歪める可能性がある。
トピックの多様性,境界重なり,意味的複雑性といった,大きく異なる特徴を持つ2つのベンチマークが,微調整のメリットの認識に影響を及ぼす可能性があることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:54:08 GMT)
Enhancing Large Language Models with Reliable Knowledge Graphs [0.6] 知識グラフは、検証された知識で大規模言語モデルを構築するための有望なソリューションを提供する。
それらのポテンシャルは、固有のノイズ、不完全性、およびそれらの剛性構造とLLMの柔軟な推論を統合する複雑さによって制約されている。
この論文は、信頼性の高いKGを精製し活用することによってLCMを強化する凝集フレームワークを通じて、これらの制限に対処する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:43:18 GMT)
Logical Expressiveness of Graph Neural Networks with Hierarchical Node Individualization [0.6] Hierarchical Ego Graph Neural Networks (HEGNN)は、グラフニューラルネットワーク(GNN)の表現的拡張である。
HEGNNは部分グラフ-GNNを一般化し、グラフを同型まで区別できる表現的モデルの階層を形成する。
実験により,HEGNNの実用性を確認し,従来のGNNアーキテクチャと比較した場合の利点を示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:39:31 GMT)
The Price of Freedom: Exploring Expressivity and Runtime Tradeoffs in Equivariant Tensor Products [0.6] E(3)$-equivariantのニューラルネットワークは、幅広い3Dモデリングタスクで成功している。
本研究では,多数のテンソル積演算を慎重に系統的に解析する。
理論的ランタイム保証は経験的性能と大きく異なる可能性がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:15:18 GMT)
Automatic Multi-View X-Ray/CT Registration Using Bone Substructure Contours [0.6] 術中骨登録のための新しい多視点X線/CT登録法を提案する。
メソッドはマルチビューの輪郭ベースの反復的最近点 (ICP) 最適化で構成されている。
MRPD 0.67mmと商用溶液の5.35mmとで連続的にサブミリ精度を達成している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:33:37 GMT)
Flatfish Lesion Detection Based on Part Segmentation Approach and Lesion Image Generation [0.6] ヒラメは、世界中で大量に消費される主要な養殖種である。
伝統的に、視覚検査によって病変が検出されるが、多数の魚を観察することは困難である。
本研究は, 生成的対向ネットワークと画像調和法を用いて, 魚の病変像を増強する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:53:44 GMT)
Signal Use and Emergent Cooperation [0.6] 我々は、自律的なエージェントが、部族に組織され、コミュニケーション信号を使って彼らの活動を調整し、集団的効率を高める方法を示す。
本研究は、これらのエージェント集団における文化の自己組織化と、コミュニケーション戦略の変化が彼らの適合性と協力にどのように影響するかに焦点を当てる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:24:30 GMT)
A Structured Bangla Dataset of Disease-Symptom Associations to Improve Diagnostic Accuracy [0.6] 疾患症状データセットは、医学研究、疾患診断、臨床意思決定、AIによる健康管理の応用に重要かつ需要がある。
本研究は, 各種オンライン資料, 医療文献, 公衆衛生データベースから, 疾患症状の関係を体系的にコンパイルする。
このデータは、ピアレビューされた医療論文、臨床ケーススタディ、および疾患症状関連報告を分析して収集された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:38:39 GMT)
The ASP-based Nurse Scheduling System at the University of Yamanashi Hospital [0.6] ASP(Answer Set Programming)を用いた看護計画システムの設計原理について述べる。
看護師の選好と各病棟の病院要員の調整を必要とする複雑な最適化問題である。
山梨大学附属病院におけるこれらの課題に対するASPの実践的応用について述べる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:25:06 GMT)
Compositional Active Learning of Synchronizing Systems through Automated Alphabet Refinement [0.5] 我々は、未知の分解を伴う同期並列システムの合成学習手法を開発した。
我々のアプローチは、コンポーネントモデルを学習しながら、グローバルアルファベットをコンポーネントアルファベットに自動的に洗練します。
本稿では,これらの概念を実装した合成学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:55:28 GMT)
CACTUS as a Reliable Tool for Early Classification of Age-related Macular Degeneration [0.5] CACTUSは説明可能性と柔軟性を提供し、標準のMLモデルより優れている。
関連性やバイアスの少ないデータを排除することで、臨床医がフィードバックを提供し、バイアスに対処するための臨床シナリオを作成しました。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:41:13 GMT)
A Semantically-Aware Relevance Measure for Content-Based Medical Image Retrieval Evaluation [0.5] 本稿では, CBIR 評価のための新しい妥当性尺度を提案する。
公開データセットを用いた妥当性尺度の有効性と妥当性を定量的に検証した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:04:48 GMT)
Adopting Use Case Descriptions for Requirements Specification: an Industrial Case Study [0.5] ユースケース記述(UC)は機能要件を特定するための顕著なフォーマットである。
既存の文献には、高品質なUC記述の書き方に関するレコメンデーションがたくさんある。
我々は,大規模でグローバルに分散した事例会社において,UC記述の採用に関する実証的証拠を提供することを目標としている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:43:34 GMT)
Universal cooling of quantum systems via randomized measurements [0.5] 量子系は、システムの詳細を事前に知ることなく冷却可能であることを示す。
このことは、複雑な量子システムの堅牢でスケーラブルな冷却は、汎用的で構造に依存しないプロトコルによって達成できることを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:47:21 GMT)
Quantum-Enhanced Simulated Annealing Using Rydberg Atoms [0.4] この研究は、量子強化型シミュレートアニール(QESA)と呼ばれるRydberg量子古典ハイブリッドが計算時間に有利なことを実験的に証明した。
その結果、QESAは、複雑な最適化問題を効率的に解くための古典的手法よりも計算上の優位性を提供する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:03:51 GMT)
Building Automotive Security on Internet Standards: An Integration of DNSSEC, DANE, and DANCE to Authenticate and Authorize In-Car Services [0.4] 本稿では,DNSSEC,DANE,DANCEを自動車に組み込むことで車内サービスを認証し,認証することを提案する。
弊社のアプローチでは、DNSSECの助けを借りて、サービスの暗号化認証とサービスデプロイメントの認証を分離しています。
我々は,サービスサプライヤーによってのみ生成される証明書による車内サービス認証を提案し,OEMがのみ署名したDNSSEC TLSAレコードを通じて配信する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:02:32 GMT)
SuperPoint-SLAM3: Augmenting ORB-SLAM3 with Deep Features, Adaptive NMS, and Learning-Based Loop Closure [0.4] 我々は,ORBを自己監督型SuperPoint検出器-ディスクリプタに置き換えるドロップインアップグレードであるSuperPoint-SLAM3を紹介する。
SuperPoint-SLAM3は平均翻訳誤差を4.15%から0.34%に、回転誤差を0.0027 deg/mから0.0010 deg/mに下げる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:27:32 GMT)
Crime Hotspot Prediction Using Deep Graph Convolutional Networks [0.4] 犯罪のホットスポット予測は、都市の安全と効果的な法執行の確保に重要であるが、犯罪活動に固有の複雑な空間的依存関係のため、依然として困難である。
本稿では,犯罪データをグラフとして表現することで空間依存を明示的にモデル化する,グラフ畳み込みネットワーク(GCN)に基づく新しいフレームワークを提案する。
本手法は,88%の分類精度を達成し,従来の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:47:29 GMT)
Beyond Shapley Values: Cooperative Games for the Interpretation of Machine Learning Models [0.4] 我々は、協調ゲーム理論を解釈可能性の観点から再考し、そのツールのより広くより原則化された利用を論じる。
We highlight two general general family of efficient allocations, the Weber and Harsanyi set, which extends beyond Shapley values。
本稿では,これらのアロケーション方式の概要を述べるとともに,値関数とアグリゲーション規則の区別を明確にし,信頼性と理論的な特徴属性を構築するための3段階の青写真を紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:22:23 GMT)
ESRPCB: an Edge guided Super-Resolution model and Ensemble learning for tiny Printed Circuit Board Defect detection [0.3] 本稿では,エッジ誘導型超解像とアンサンブル学習を組み合わせた新しいフレームワークESRPCBを提案する。
エッジ特徴を取り入れることで、超解像過程は重要な構造的詳細を保ち、小さな欠陥が強調画像で識別可能であることを保証している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:34:35 GMT)
Numerical ranges of Bargmann invariants [0.3] 任意の有限次元の量子系に対するバーグマン不変量の数値範囲を厳密に決定する。
これらの不変量の許容値は、丸いグラム行列対称性を示す(i)純粋状態または(ii)量子ビット状態のみを用いて達成できることを示す。
これらの結果は、量子力学におけるバーグマン不変量の基本的限界を確立し、量子情報処理における様々な応用のための確かな数学的基礎を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:04:02 GMT)
Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval [0.3] 特許画像は、特許のイノベーションに関する情報を伝える技術図である。
現在の方法は、ロカルノ国際分類システムで定義されたような特許の階層的関係を無視している。
検索プロセスにおいて,その関係を導き出すために,LISPの分類を利用した階層的多陽性のコントラスト損失を導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:53:02 GMT)
Deep Diffusion Models and Unsupervised Hyperspectral Unmixing for Realistic Abundance Map Synthesis [0.3] 我々のフレームワークは、ブラインド線形ハイパースペクトルアンミックスと最先端拡散モデルを統合し、合成アブリダンスマップの現実性と多様性を高める。
我々は、地球観測のためのPRISMA宇宙ミッションの実際のハイパースペクトル画像を用いて、我々のアプローチを検証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:42:51 GMT)
Exploring Economic Sectoral Dynamics Through High-resolution Mobility Data [0.2] われわれは,2019年1月から2023年1月までの米国全土における人体移動パターンを総合的に分析したデータセットを提示する。
このデータセットは、経済セクターが組織した公共の場所で約1200万ポイント・オブ・関心(POI)の訪問、旅行、時間についてレポートしている。
さまざまなタイプのビジネスにパターンを分散させることで、経済学、都市研究、公衆衛生の研究者に貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:38:24 GMT)
A Silent Speech Decoding System from EEG and EMG with Heterogenous Electrode Configurations [0.2] 脳波/EMGを異種電極配置で処理できるニューラルネットワークを導入する。
大規模脳波/EMGデータセットを用いたマルチタスク学習によるサイレント音声復号における高い性能を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:57:35 GMT)
High-Quality Facial Albedo Generation for 3D Face Reconstruction from a Single Image using a Coarse-to-Fine Approach [0.2] 本稿では,UVアルベドマップ生成のための新しいエンド・ツー・エンド粗大化手法を提案する。
提案手法はまず,低次元係数で駆動されるUVアルベドパラメトリックモデル(UVAPM)を用いて粗いアルベドマップを生成する。
高精度なアルベドマップを作成するために,分離アルベドマップを用いたディテールジェネレータを訓練する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:32:57 GMT)
Enhancing Omics Cohort Discovery for Research on Neurodegeneration through Ontology-Augmented Embedding Models [0.1] NeuroEmbedは、コホートやサンプルを表現するための意味論的に正確な埋め込み空間のエンジニアリングのためのアプローチである。
本手法は,(1)公開リポジトリからのコホート抽出,(2)バイオメディカルクラスタリングと組込み空間でのクラスタリングを用いたコホートとサンプルのメタデータの半自動正規化と強化,(3)標準化されたメタデータ次元のランダムな組み合わせに基づくコホートとサンプルの問合せデータセットの自動生成,(4)クエリを最適化するためのドメイン固有の埋め込み器の微調整の4段階からなる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:27:10 GMT)
Deflating Deflationism: A Critical Perspective on Debunking Arguments Against LLM Mentality [0.1] 我々は、民間の実践が、精神状態と能力をLLMにもたらすために、実現不可能な基盤を提供すると論じている。
LLMs simpliciterに対して、どちらの戦略も精神徴候に対するノックダウンケースを提供していないことが判明した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:17:11 GMT)
A robust and scalable framework for hallucination detection in virtual tissue staining and digital pathology [0.1] 仮想組織染色とデジタル病理のための自律的品質・幻覚評価法であるAQuAについて述べる。
AQuAは、許容され、受け入れられない事実上の染色された組織像を検出すると、99.8%の精度を自律的に達成する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:33:51 GMT)
Leveraging Intermediate Features of Vision Transformer for Face Anti-Spoofing [0.1] 本研究では,視覚変換器(ViT)を用いたスプーフィング攻撃検出手法を提案する。
また,フェース・アンチ・スフィング・データ拡張法とパッチ・ワイド・データ拡張法という2つのデータ拡張法を提案する。
提案手法の有効性を,OULU-NPUとSiWを用いた実験により実証した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:47:44 GMT)
Value-Free Policy Optimization via Reward Partitioning [0.1] 単軌道強化学習のための新しい手法であるReward Partitioning Optimization (RPO)を導入する。
RPOは、データから直接推定されるアプローチを使用して、観察された報酬を正規化する。
我々は,Flan-T5エンコーダデコーダモデルを用いて,スカラーフィードバック言語モデリングタスクにおけるRPOの有効性を検証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:06:27 GMT)
Weakest Link in the Chain: Security Vulnerabilities in Advanced Reasoning Models [0.0] 我々は、類似の非推論モデルと比較して、高度な推論モデルにおける弱点を体系的に評価する。
特定の攻撃タイプでは、推論モデルはかなり脆弱である(例えば、攻撃のツリーのプロンプトで最大32ポイント悪い)。
本研究は,言語モデルにおける高度な推論のセキュリティへの影響を浮き彫りにし,多様な手法によるストレステストの安全性の重要性を強調した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:32:18 GMT)
ViT-NeBLa: A Hybrid Vision Transformer and Neural Beer-Lambert Framework for Single-View 3D Reconstruction of Oral Anatomy from Panoramic Radiographs [0.0] パノラマ線写真(PX)とコーンビームCT(CBCT)の2つの主要画像モダリティによる歯科診断
PX画像は費用対効果が高くアクセスしやすいが、深度情報の欠如により診断精度が低下する。CBCTはこの問題に対処するが、高コスト、放射線暴露の増加、アクセシビリティの制限などの欠点を提示する。
視覚変換器をベースとしたニューラルビール・ランバートモデルであるViT-NeBLaを導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:01:14 GMT)
Vector Ontologies as an LLM world view extraction method [0.0] 大きな言語モデル(LLM)は、世界の複雑な内部表現を持っているが、これらの構造は、元の予測タスクを超えて解釈または再利用することが難しいことで知られている。
ベクトルオントロジー(英: vector ontology)は、ある領域内の概念と関係の幾何学的解析を可能にする、存在論的に有意な次元にまたがる領域固有のベクトル空間を定義する。
GPT-4o-miniを用いて、複数の自然言語プロンプトを通してジャンル表現を抽出し、これらの投影の一貫性を言語的変動と、その接地構造データとの整合性から解析する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:49:21 GMT)
Variational Autoencoder for Generating Broader-Spectrum prior Proposals in Markov chain Monte Carlo Methods [0.0] 本研究では,マルコフ連鎖モンテカルロ法(McMC)の効率性と適用性を高めるために,変分オートエンコーダ法を用いる。
VAEフレームワークは、データ駆動のアプローチによって、逆問題におけるより広い範囲の相関構造を柔軟にキャプチャすることを可能にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:11:16 GMT)
Using Large Language Models to Study Mathematical Practice [0.0] 本稿では,GoogleのGemini 2.5 Proによるコーパス調査の結果を報告する。
arXiv.orgの5000の数学論文のサンプルに基づいて、実験は数百の有用な注釈付きサンプルのデータセットを作成した。
また、実践指向哲学の研究ツールとして、これらの手法に関する議論を始めようとしている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:22:50 GMT)
Unsupervised anomaly detection on cybersecurity data streams: a case with BETH dataset [0.0] ストリーム学習アルゴリズムは、ほぼリアルタイムのデータ処理を提供することができる。
本稿では,サイバーセキュリティイベントを伴うBETHデータセット上の3つのPythonストリーム機械学習ライブラリの10のアルゴリズムの結果について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:42:51 GMT)
Twisted-photons Spectral-Angular Distribution Emitted by Relativistic Electrons at Axial Channeling [0.0] 相対論的電子から放出されるツイスト光子の軸流中におけるスペクトル角分布について検討した。
その結果,QEDの枠組みで得られたものと比較した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:01:31 GMT)
Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations [0.0] 階層的なクラスタリングに基づく検索手法を提案する。
本手法は,意味的関連コンテンツを適応的に選択しながら,システム応答の精度と関連性を維持する。
我々のフレームワークは実装が簡単で、既存のRAGパイプラインと簡単に統合できます。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:34:29 GMT)
Towards an Approach for Evaluating the Impact of AI Standards [0.0] AI標準の目標は、AIを使用するシステムにおけるイノベーションと公的な信頼を促進することである。
これらの標準化活動がイノベーションと信頼の目標に与える影響を測定するための形式的あるいは共有的な方法が欠如している。
本稿では,AI標準の効果を評価するための分析手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:58:59 GMT)
Towards a Formal Specification for Self-organized Shape Formation in Swarm Robotics [0.0] 構造と形状の形成のためのロボットの自己組織化は、スウォームロボットシステムの刺激的応用である。
提示された形式的仕様モデルは、複雑な形状や構造を形成するためのSwarmロボットシステムの設計と実装のアウトラインを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:13:20 GMT)
Towards Pervasive Distributed Agentic Generative AI -- A State of The Art [0.0] 知的エージェントとLarge Language Models(LLM)の急速な進歩は、広範にわたるコンピューティング分野を変革している。
この調査では、LLMエージェントのアーキテクチャコンポーネントの概要と、さまざまなシナリオにおけるデプロイメントと評価について概説する。
リソース制約のあるデバイス上でのローカルおよび分散実行を含む、最先端のエージェントデプロイメント戦略とアプリケーションを強調している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:15:06 GMT)
Towards Bug-Free Distributed Go Programs [0.0] 本稿では,分散プログラムにおける通信競合の欠如を証明できる検証フレームワークについて述べる。
我々は、分散プログラムがどのように実行されるのかを静的に推論し、フェール・バイ・オーダを使用してバッファリングおよび未バッファリングのチャネルに拡張する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:19:22 GMT)
Toward hybrid quantum simulations with qubits and qumodes on trapped-ion platforms [0.0] トラップイオンプラットフォーム上での離散(量子)変数と連続(量子)変数を用いたゲートベースハイブリッド量子コンピューティングの実現可能性について検討する。
既存のトラップイオン量子プラットフォームにおいて,高忠実度ハイブリッドゲートと測定操作が実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:00:56 GMT)
Thermalization and irreversibility of an isolated quantum system II [0.0] 拡散非平衡状態情報の消去による絡み合いエントロピーの不可逆的な成長を数値的に示す。
我々の研究は、熱力学の第2法則、したがって統計物理学におけるエルゴード仮説が量子情報の観点から理解され、証明できることを実証している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:55:36 GMT)
The Urban Model Platform: A Public Backbone for Modeling and Simulation in Urban Digital Twins [0.0] オープンな都市モデルプラットフォームは、都市デジタル双生児のモデリングとシミュレーションのためのパブリックな技術バックボーンとして機能することを発見した。
このようなプラットフォームはオープン標準に基づいて構築され、モデルの分散統合を可能にし、都市システムを表現するためのマルチモデルアプローチをサポートする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:41:20 GMT)
The Transition Matrix -- A classification of navigational patterns between LMS course sections [0.0] 本研究では,応用科学専門大学におけるMoodle LMSの747コースのナビゲーションデータを解析した。
生成したヒートマップの多くには1つ以上の対角軸が含まれており、学生が通常、現在のものから次のもの、または前の部分までナビゲートしていることを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:14:20 GMT)
Testing the Quantum Equivalence Principle with Gravitational Waves [0.0] 量子同値原理から導かれる波の振幅や周波数などの重力波観測値の修正について検討する。
LIGO/Virgoのコラボレーションによって観測された最も解決された重力波イベントと比較することにより、量子同値原理の違反に関するバウンダリを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 23:04:40 GMT)
TUM Teleoperation: Open Source Software for Remote Driving and Assistance of Automated Vehicles [0.0] オープンソースソフトウェアは現在、遠隔運転(例えばステアリングホイールとペダル、リモートアシスト)を組み合わせていない。
我々は,自動運転ソフトウェアと対話可能な,モジュール型のオープンソース遠隔操作ソフトウェアスタックを提案する。
ソフトウェアは様々な現実世界とシミュレーションプラットフォームとのシームレスな統合のための標準化されたインタフェースを特徴としている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:18:35 GMT)
TIP-Search: Time-Predictable Inference Scheduling for Market Prediction under Uncertain Load [0.0] TIP-Searchは、不確実なワークロード下でのリアルタイム市場予測のための時間予測可能な推論スケジューリングフレームワークである。
TIP-Searchを3つの実世界のリミットオーダーブックデータセットで評価する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:58:59 GMT)
Stability Analysis of Physics-Informed Neural Networks via Variational Coercivity, Perturbation Bounds, and Concentration Estimates [0.0] PINNは、サンプルコロケーション点上の残差に基づく損失を最小限に抑え、偏微分方程式(PDE)の近似解を導出する。
ネットワーク出力における有界摂動が、残留成分と教師付き損失成分の両方を通してどのように伝播するかを定量化する決定論的安定性境界を導出する。
この研究は、PINNに数学的に基礎を置き、実際に適用可能な安定性の枠組みを提供し、ロバストトレーニングにおける演算子構造、サンプリング設計、機能正則性の役割を明確にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:41:15 GMT)
Specification and Evaluation of Multi-Agent LLM Systems -- Prototype and Cybersecurity Applications [0.0] 本稿では,マルチエージェントシステムによるアスペクトの特定と評価を目的とした探索的研究の結果を報告する。
システムアーキテクチャとプロトタイプは、以前の研究から拡張され、マルチエージェントシステムのための仕様が導入された。
サイバーセキュリティタスクを含むテストケースは、アーキテクチャと評価アプローチの実現可能性を示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:03:49 GMT)
Spatially Resolved Optical Responses of a High-Kinetic-Inductance Microwave Resonator [0.0] 本研究では, NbTiNナノワイヤ共振器の局所光応答をレーザ走査型マイクロ波分光システムと希釈冷凍機と一体化して測定した。
共振器の光学応答は共振モードと位置との相関を示し、共振器の周りの2レベル系に起因する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:45:55 GMT)
Socratic RL: A Novel Framework for Efficient Knowledge Acquisition through Iterative Reflection and Viewpoint Distillation [0.0] 現在の強化学習(RL)手法は、単純で結果に基づく報酬信号に依存している。
本稿では,この制限に対処する新しいプロセス指向フレームワークであるソクラティック強化学習(Socratic Reinforcement Learning, Socratic-RL)を紹介する。
このフレームワークでは、分離された"Teacher-Student"アーキテクチャを使用して、"Teacher AI"がインタラクション履歴を分析し、因果的な洞察を抽出し、それらを構造化された"ビューポイント"に定式化する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:57:58 GMT)
Series of molecular-like doubly excited states of a quasi-three-body Coulomb system [0.0] ストロンチウム原子の高角運動量惑星状態の共鳴多光子励起について検討した。
二重イオン化しきい値に収束する2重励起電子状態が第一原理計算によって同定され、再現された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:52:22 GMT)
Scaling Algorithm Distillation for Continuous Control with Mamba [0.0] In-Context Reinforcement Learning (ICRL) を実行する新しいアプローチとして,アルゴリズム蒸留(AD)が提案されている。
我々は,非常に長いコンテキストにADをスケールすることでICRLの性能が向上し,SOTAオンラインメタRLベースラインと競合することを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:15:02 GMT)
Scalable Simulation of Quantum Many-Body Dynamics with Or-Represented Quantum Algebra [0.0] 我々は、ORQAに基づく量子シミュレーションのためのスケーラブルで汎用的な並列アルゴリズムを提案する。
最大1兆個のパウリ弦を用いて局所磁化の時間的変化を追跡することで,127量子重六角格子上のイジング模型をシミュレートする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:41:54 GMT)
SAGDA: Open-Source Synthetic Agriculture Data for Africa [0.0] SAGDAはPythonベースのオープンソースツールキットで、合成農業データセットの生成、拡張、検証を行う。
SAGDAの設計と開発プラクティスを紹介し、そのコア機能を強調します。
SAGDAの能力を拡大し、アフリカの農業において、オープンソースでデータ駆動の実践が果たす重要な役割を浮き彫りにする将来の計画で締めくくります。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:06:29 GMT)
Rydberg blockade mechanism through the lens of graph theory: characterization and applications [0.0] Rydbergブロックは、中性原子デバイスを用いた量子アルゴリズムの基本である。
本稿では、Rydbergブロックとその動作を、様々な駆動スキームの下で包括的に理論的に解析する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:26:15 GMT)
Revising the quantum work fluctuation framework to encompass energy conservation [0.0] 我々は、エネルギー保存を示唆するジャジンスキーの等式に量子補正を導入する。
十分に大きいと、この補正により量子論は第二法則に違反することが多い。
回路実装とともに動作のための2点計測方式を改良した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:31:19 GMT)
Restarted contractive operators to learn at equilibrium [0.0] 我々は、再起動戦略とADによって計算されたJFBを組み合わせるアルゴリズムを導入し、学習手順を最適なDECフレームワークに任意に近づけることができることを示す。
本稿では,重み付きノルムの重み付け,プラグイン・アンド・プレイスキームの段階化と正規化レベル,フォワード・バックワード・イテレートに埋め込まれたDRUNetデノイザの訓練に有効であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:38:56 GMT)
Real-time Seafloor Segmentation and Mapping [0.0] ポシドニア・オーシャンカ・メドウ(Posidonia Oceanica meadows)は、サバイバルと保全のために岩に大きく依存する海草の一種である。
ディープラーニングベースのセマンティックセグメンテーションと視覚自動監視システムは、さまざまなアプリケーションで有望であることを示している。
本稿では,自律型水中車両(AUV)がポシドニア大洋の牧草地の境界を自律的に調査できるようにするために,機械学習とコンピュータビジョン技術を組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:32:37 GMT)
Rademacher learning rates for iterated random functions [0.0] トレーニングデータセットが、必ずしも既約あるいは非周期的でない反復ランダム関数によって生成される場合を考える。
支配関数が第一引数に関して収縮的であるという仮定の下で、まず、対応するサンプル誤差に対する一様収束結果を確立する。
次に、近似経験的リスク最小化アルゴリズムの学習可能性を示し、その学習速度を導出する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:36:13 GMT)
Quantum-Informed Contrastive Learning with Dynamic Mixup Augmentation for Class-Imbalanced Expert Systems [0.0] QCL-MixNetは、不均衡下でのロバストな分類のための動的混合のための新しいフレームワークである。
QCL-MixNetは、20の最先端の機械学習、ディープラーニング、GNNベースのベースラインをマクロF1とリコールで一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:44:30 GMT)
Quantum thermalization mechanism and the emergence of symmetry-breaking phases [0.0] 本稿では,対称性破壊相の出現を考慮した固有状態熱化仮説の一般化を提案する。
2つの非可換離散対称性を持つ3サイトBose-Hubbardモデルに対する数値実験により、この形式化の適用性について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:24:33 GMT)
Quantum interrogation of imperfect absorbers using post-selection [0.0] 本稿では, 構成的干渉とポストセレクションを用いた量子問合せ測定手法を提案する。
本手法は, 単光子と弱減衰源に対して有効であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:44:51 GMT)
Quantum algorithm for solving generalized eigenvalue problems with application to the Schrödinger equation [0.0] 励起状態エネルギーの推定は、システムサイズによる指数的スケーリングのために古典的なアルゴリズムでは困難である。
パラメータ化行列系列の固有値と特異値を推定するための量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:24:30 GMT)
Quantum Engineering of Qudits with Interpretable Machine Learning [0.0] 任意の次元のキューディットの制御と雑音評価のための機械学習ベースのグレーボックスフレームワークを提案する。
また、ノイズダイナミクスの解釈可能なモデリングを可能にする局所的な解析拡張も導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:46:23 GMT)
Quantum Circuits for the Metropolis-Hastings Algorithm [0.0] 量子コンピュータはメトロポリス・ハスティング(MH)シミュレーションの高速化を期待されている。
本稿では,古典的提案受容論理に従う量子ウォーク構成を提案する。
MHシミュレーションでは、エンドツーエンドの2次高速化が期待できる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:16:48 GMT)
Quantitative Comparison of Fine-Tuning Techniques for Pretrained Latent Diffusion Models in the Generation of Unseen SAR Image Concepts [0.0] 本研究は,大規模な事前学習型潜伏拡散モデルの急激な画像領域への適応について検討する:合成開口レーダ(SAR)
我々は、Low-Rank Adaptation (LoRA)のようなフルモデル微調整とパラメータ効率のアプローチを含む、複数の微調整戦略を探索、比較する。
提案手法は,テキストエンコーダのLoRAによる部分的チューニングとSAR>トークンの埋め込み学習を併用して,迅速なアライメントの維持に有効であることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:48:01 GMT)
Q-AIM: A Unified Portable Workflow for Seamless Integration of Quantum Resources [0.0] Q-AIM(Quantum Access Infrastructure Management)は、量子ハードウェアへのアクセスと管理を統合するソフトウェアフレームワークである。
Q-AIMはホストのインフラストラクチャに単一のエントリポイントを公開し、量子コンピュータとのセキュアで簡単なインタラクションを提供する。
最小限のメモリフットプリントで、コンテナは最小のサーバインスタンスでもデプロイできるように最適化される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:52:55 GMT)
Purely quantum memory in closed systems observed via imperfect measurements [0.0] 量子系における記憶は オープン量子系の理論の中心的な問題です
しかし、閉系における不完全な測定によって引き起こされる記憶効果についてはほとんど分かっていない。
本研究では,不完全なストロボスコープ量子計測によって観測された閉系におけるメモリの出現と特性について検討する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:52:26 GMT)
Probing Hilbert space fragmentation using controlled dephasing [0.0] 個々のセクター内のユニタリダイナミクスは、遅いか非エルゴディックかもしれない。
追加の制御されたデファス化は、単一のクリロフセクター内でシステムを確実に混合することを示します。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:00:00 GMT)
Parametric instability in a magnomechanical system [0.0] 量子揺らぎは臨界速度閾値より上のスピン電流を発生させるが、低温ではこの閾値以下でスピン電流は発生しない。
この強化された振る舞いは、マグノンベースの量子技術において、高感度の測定と効率的なスピン電流発生をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:07:35 GMT)
On the Conditions for a Quantum Violent Relaxation [0.0] 熱力学限界における2体全対全相互作用を持つ汎用多体系の力学について検討する。
平均場有効ハミルトニアンスペクトルにおいて、暴力的緩和が起こるためには、非常に具体的な条件を満たさなければならないことを示す。
我々の結果は、平均場状態においても量子効果が力学にかなり劇的な影響を及ぼすことを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:44:04 GMT)
On Immutable Memory Systems for Artificial Agents: A Blockchain-Indexed Automata-Theoretic Framework Using ECDH-Keyed Merkle Chains [0.0] 本稿では,暗号的に固定された決定論的計算フレームワークであるMerkle Automatonの概念を紹介する。
各エージェントのトランジション、メモリフラグメント、推論ステップは、オンチェーンでルートされたMerkle構造内で実行される。
このアーキテクチャはメモリをキャッシュではなく台帳として再設定する - 内容がプロトコルによって強制され、暗号によって拘束され、形式論理によって制約される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:43:56 GMT)
NeuroPhysNet: A FitzHugh-Nagumo-Based Physics-Informed Neural Network Framework for Electroencephalograph (EEG) Analysis and Motor Imagery Classification [0.0] EEG分析はノイズ、非定常性、オブジェクト間の変動など、大きな課題に直面している。
本研究では,脳波信号解析と運動画像分類に適した新しい物理情報ニューラルネットワーク(PINN)フレームワークであるNeuroPhysNetを紹介する。
NeuroPhysNetはFitzHugh-Nagumoモデルを導入し、予測を制約し、モデルの堅牢性を高めるために神経力学の原理を組み込んだ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:21:04 GMT)
MultiViT2: A Data-augmented Multimodal Neuroimaging Prediction Framework via Latent Diffusion Model [0.0] マルチモーダル・メディカルイメージングは、構造的および機能的ニューロイメージングのような多様なデータタイプを統合する。
本研究は、構造的および機能的ニューロイメージングデータに基づくニューロイメージング予測フレームワークに焦点を当てる。
統合失調症の分類精度において,MultiViT2は第1世代モデルよりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:25:13 GMT)
Mildly-Interacting Fermionic Unitaries are Efficiently Learnable [0.0] アルゴリズムはガウス近傍のガウス次元のフェルミオン単位系を時間内に少なくとも2n - O(t)$で学習できることを示す。
また、ガウス近傍のフェルミオン性ユニタリに関する構造的な結果も証明する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:37:31 GMT)
Measuring Decoherence Due to Quantum Vacuum Fluctuations [0.0] 粒子と真空のゆらぎとの相互作用は、粒子電荷を突然オン/オフできる場合、不可逆的なデコヒーレンスを引き起こす。
このようなシナリオに対する先行順序のデコヒーレンス効果を計算し、その検出のための実験的な設定を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 20:32:15 GMT)
Many-body quantum dimerization in 2D atomic arrays [0.0] 2次元原子配列を異なるフォトニック環境に結合し、半充填励起部分空間に着目する。
特に、このセクターにおける最小放射状態がコヒーレント重ね合わせによってよく説明されることを示す。
我々は、このエキゾチックな状態を探索する可能性のある戦略と、その限界と課題について議論する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:31:55 GMT)
Machine Learning-Driven Compensation for Non-Ideal Channels in AWG-Based FBG Interrogator [0.0] シリコン窒化ケイ素(SiON)を用いたファイバブラッググレーティング(FBG)インタクタの実験的検討を行った。
AWGベースの尋問器はコンパクトで拡張性があるが、その実用性能は非理想スペクトル応答によって制限される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:58:03 GMT)
Machine Learning as Iterated Belief Change a la Darwiche and Pearl [0.0] バイナリANNは、入力と出力の両方がバイナリ値に制限されるフィードフォワードネットワークである。
ダラルの信念変化の方法は、自然に信念の状態の構造化された段階的な進化を誘導することを示す。
本研究では、二元的ANNのトレーニングダイナミクスをより効果的にモデリングし、堅牢なAGMスタイルの変更操作でモデル化できることを実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:10:52 GMT)
Long-time Freeness in the Kicked Top [0.0] 自由度に関する大きな偏差理論を導入し、関連する時間スケールを定義し解析する。
本研究は,カオス力学の長期的挙動に関する新たな知見を提供し,多体量子力学の研究に広く影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:35:17 GMT)
Limitations of tensor network approaches for optimization and sampling: A comparison to quantum and classical Ising machines [0.0] We developed a tensor network (TN) based algorithm to reveal the low-Energy spectrum of Ising spin-glass systems。
我々の決定論的アプローチは、枝と枝の探索戦略と、TNの収縮による辺縁の近似計算を組み合わせたものである。
ペガサスグラフとゼファーグラフで定義されたランダムな問題に対して、最大数千スピンのアプローチをベンチマークする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:51:19 GMT)
Leveraging Vision-Language Pre-training for Human Activity Recognition in Still Images [0.0] 285枚のMSCOCO画像から、歩いたり走ったり、座ったり、立っていたりすると、CNNのスクラッチ精度は41%だった。
微調整のマルチモーダルCLIPは、これを76%に引き上げ、対照的に視覚言語による事前トレーニングは、現実世界のデプロイメントにおける静止画像のアクション認識を決定的に改善することを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:15:02 GMT)
Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos [0.0] Lecture Video Visual Objectsデータセットは、教育ビデオコンテンツにおける視覚的オブジェクト検出のための新しいベンチマークである。
データセットは、生物学、計算機科学、地球科学にまたがる245の講義ビデオから抽出された4,000フレームで構成されている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:18:21 GMT)
Laser absorption spectroscopy to probe the superposition principle in atomic translational motion [0.0] 原子間量子変換運動(重畳あるいは非重畳)の性質と測定(崩壊または非崩壊)に関する長年のジレンマを解消する数原子ドップラー感受性吸収分光法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:55:22 GMT)
Isolating Noisy Labelled Test Cases in Human-in-the-Loop Oracle Learning [0.0] 誤ってラベル付けされたテストケースは、ループ内学習技術のトレーニングプロセスに悪影響を及ぼす可能性がある。
本報告では, 人道学習における誤検査事例を識別する手法であるISONOISEを紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:12:23 GMT)
Integrating Knowledge Graphs and Bayesian Networks: A Hybrid Approach for Explainable Disease Risk Prediction [0.0] 本稿では,知識グラフとマルチモーダルEHRデータからBNを構築するための新しい手法を提案する。
本手法は、一般的な医療知識と患者固有のコンテキストのバランスをとり、効果的に不確実性に対処し、説明性が高く、予測性能が良いことを実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:57:07 GMT)
Improving Student Self-Confidence in Quantum Computing with the Qubit Touchdown Board Game [0.0] Qubit Touchdown(クビットタッチダウン)は、量子コンピューティングに学生を紹介するために開発された2人プレイのボードゲームである。
量子コンピュータは、量子物理学の法則に基づく新しいタイプのコンピュータであり、異なるルールのセットに従うため、通常のコンピュータよりも早く特定の問題を解くことができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:13:55 GMT)
Imaging at the quantum limit with convolutional neural networks [0.0] 画像再構成のための深部畳み込みニューラルネットワークモデルの性能限界を評価する。
我々は、光のコヒーレントな状態に照らされた自然物体の画像に基づいてU-Netモデルを訓練する。
平均二乗誤差が標準量子限界を超えることが判明した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:45:36 GMT)
How Real is CARLAs Dynamic Vision Sensor? A Study on the Sim-to-Real Gap in Traffic Object Detection [0.0] イベントカメラは、交差点でのリアルタイム物体検出に適している。
堅牢なイベントベース検出モデルの開発は、注釈付き現実世界データセットの可用性の制限によって妨げられている。
本研究では,CARLAs DVSを用いたイベントベース物体検出におけるsim-to-realギャップの定量的解析を行った。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:27:43 GMT)
Homogeneous Free-Standing Nanostructures from Bulk Diamond over Millimeter Scales for Quantum Technologies [0.0] ダイヤモンド中の光アドレス可能なスピン量子ビットに基づく量子デバイスは、量子センシングや通信といった量子技術のための有望なプラットフォームである。
我々はこのハードルに、単結晶ダイヤモンドからミリスケール、細い(70nmまで)、高い並列膜を作り出すアプローチで取り組む。
膜は汚染のないままであり、最先端の量子応用で必要とされる原子的に滑らかな表面を持つ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:49:33 GMT)
Hello Afrika: Speech Commands in Kinyarwanda [0.0] アフリカの言語には音声コマンドモデルのデジェスがあります。
Hello Afrikaはこの問題に対処することを目的としており、最初のイテレーションはKinyarwanda言語に焦点を当てている。
このモデルは、一般的な指示、数字、ウェイクワードで構成されたカスタム音声コマンドコーパスから構築された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:30:19 GMT)
Heart Rate Classification in ECG Signals Using Machine Learning and Deep Learning [0.0] 本研究は心電図信号からの心拍を2つの異なるアプローチで分類する。
従来の機械学習は、手作りの機能と、ECGビートを変換した画像によるディープラーニングを利用している。
SVMやAdaBoostのようなモデルではスコアが大幅に低くなり、このタスクには限定的な適合性を示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:40:48 GMT)
HealthQA-BR: A System-Wide Benchmark Reveals Critical Knowledge Gaps in Large Language Models [0.0] HealthQA-BRは、ポルトガル語を話す医療のための最初の大規模システムワイドベンチマークである。
医学や専門知識だけでなく、看護、歯科、心理学、社会労働、その他の関連医療分野の知識も独自に評価している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:40:25 GMT)
HELENA: High-Efficiency Learning-based channel Estimation using dual Neural Attention [0.0] HELENAは、軽量な畳み込みバックボーンと2つの効率的な注意機構を組み合わせた、コンパクトなディープラーニングモデルである。
HELENAは推論時間を45.0%削減する(0.175,ms対0.318,ms)
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:21:27 GMT)
Gradient Boosting for Spatial Regression Models with Autoregressive Disturbances [0.0] 自己回帰障害を伴う空間回帰モデルに対して,新しいモデルに基づく勾配促進アルゴリズムを提案する。
このアルゴリズムは、高次元の設定でも実現可能な代替推定手順を提供する。
ケーススタディでは、潜在的な空間依存構造を取り入れたドイツ地区の寿命をモデル化する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:40:47 GMT)
Global Convergence of Adjoint-Optimized Neural PDEs [0.0] 本研究では,ニューラルネットワークを用いたPDEモデルの学習において,隠れた単位数と学習時間の両方が無限大となるような条件下での随伴勾配勾配勾配最適化手法の収束性について検討する。
具体的には、ニューラルネットワークを元項に埋め込んだ非線形放物型PDEの一般クラスに対して、ターゲットデータ(すなわち、大域的最小化器)に対する訓練されたニューラルネットワークPDEソリューションを証明する。
大域収束証明は有限次元収束解析では遭遇しないユニークな数学的挑戦を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:00:00 GMT)
Gauge fields induced by curved spacetime [0.0] 私は、周期的時空測度におけるディラックフェルミオン、ゲージ場における非相対論的フェルミオン、格子上の周期的スカラー場におけるディラックフェルミオンの間の拡張双対性(有理性)を発見した。
これは、格子上の時空測度、ゲージ場、スカラー場の間の予期せぬ等価性を示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:33:20 GMT)
From Euler to AI: Unifying Formulas for Mathematical Constants [0.0] 数式を体系的に統一する。
我々は、$pi$に対して407の異なる式を検証し、$pi$無限和の間の証明を行う。
我々の方法は$zeta(3)$を含む他の定数に一般化し、ドメイン間の知識を統一する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:07:26 GMT)
Finding Optimal Kernel Size and Dimension in Convolutional Neural Networks An Architecture Optimization Approach [0.0] 畳み込みニューラルネットワーク(CNN)におけるカーネルサイズ選択は批判的だが、しばしば見過ごされる設計決定である。
本稿では,最適なカーネルサイズ決定のためのBKSEF(Best Kernel Size Estimation)を提案する。
BKSEFは情報理論、信号処理、学習理論の原理を統合することで、情報ゲイン、計算効率、精度の向上のバランスをとる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:15:30 GMT)
Few-Shot Learning for Industrial Time Series: A Comparative Analysis Using the Example of Screw-Fastening Process Monitoring [0.0] わずかながらの学習は視界において有望であるが、エンフィズスリアルな時系列データについてはいまだに探索されていない。
本稿では,2,300サンプルの多変量トルクデータセットを用いて,スクリュー締結過程の監視に関する系統的FSL研究を行う。
マルチラベルシーケンスを複数の単一ラベルタスクに分解する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:38:34 GMT)
Fatigue-Aware Adaptive Interfaces for Wearable Devices Using Deep Learning [0.0] 本研究では,ウェアラブルデバイスを対象とした疲労対応インタフェースシステムを提案する。
ディープラーニングを使って生理的データを分析し、インターフェース要素を調整して認知負荷を軽減する。
実験の結果,認知負荷は18%減少し,ユーザ満足度は22%改善した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:07:07 GMT)
Exploring the Strongly-Interacting Regime of Effective Multi-Body Interactions in a Trapped Ultracold Atom System [0.0] 深部光学格子に密閉された超低温ボソンからなる数体システムについて検討した。
強く相互作用する状態における少数原子系の挙動を実験的に明らかにする。
この研究は、強く相互作用する少数のシステムをより深く理解するための重要なステップです。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:25:39 GMT)
Exploiting the Exact Denoising Posterior Score in Training-Free Guidance of Diffusion Models [0.0] Diffusion Posterior Smpling (DPS) に基づく一般的な手法のクラスは、難解な後楽譜関数を直接近似しようとする。
非条件のスコア関数で抽出可能なタスクを純粋に分解するための、正確な後部スコアに対する新しい表現を提案する。
これらのステップサイズは、色付け、ランダムな塗布、超解像などの関連する逆問題に転送可能であることを実証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:43:28 GMT)
Excitation-Pulse Intensity Mediated Coherent Control in V-Type Systems [0.0] V型3レベルシステムは、様々な量子系におけるコヒーレントな光-物質相互作用を探索する基礎モデルとして機能する。
3レベル系のコヒーレントな進化は励起パルス持続時間と励起状態間のエネルギー分離の積に依存していることを示す。
励起パルスのパルス領域を変化させることで、異なる量子経路に対応する個々のスペクトル特徴を選択的にオン/オフできることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:24:41 GMT)
Exact Quantum Capacity of Decohering Channels in Arbitrary Dimensions [0.0] 我々は、広い種類のデコヒーリングチャネルの量子容量に対して、$Lambda(rho) = (1 - x)rho + x D(rho),$ ここで$D(rho)はヒルベルト行列$rho$ヒルベルト$のデコヒーレンスの異なる形のデコヒーレンスを表す。
本研究は, 量子通信におけるコヒーレンスの役割を明らかにし, 量子チャネル容量の研究において稀な正確なベンチマークを提供するものである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 12:06:26 GMT)
Evolutionary chemical learning in dimerization networks [0.0] 本稿では,CDN(Competitive Dimerization Networks)に基づく化学学習のための新しいフレームワークを提案する。
これらのネットワークは、誘導進化によってin vitroでトレーニング可能であることを示す。
突然変異、選択、増幅を含む訓練プロトコルにより、CDNはノイズの多い入力パターン間で堅牢に識別することができる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:10:12 GMT)
Evaluation of Vision Transformers for Multimodal Image Classification: A Case Study on Brain, Lung, and Kidney Tumors [0.0] この研究は、MRIおよびCTスキャンのいくつかのデータセットにおいて、Swin TransformerやMaxViTを含むVision Transformersアーキテクチャのパフォーマンスを評価する。
その結果、Swin Transformerは高い精度を示し、個々のデータセットの平均で99%、組み合わせたデータセットで99.4%の精度を実現した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:10:45 GMT)
Evaluating Large Language Models for Phishing Detection, Self-Consistency, Faithfulness, and Explainability [0.0] 大規模言語モデル(LLM)は、ドメイン固有のフィッシング分類タスクを改善するための有望な方向性と可能性を示している。
LLMはフィッシングメールを正確に分類するだけでなく、予測に確実に適合し、内部に一貫性のある説明を生成することができるのか?
BERT、Llamaモデル、Wizardなど、微調整されたトランスフォーマーベースのモデルを使って、ドメインの関連性を改善し、特定の区別をフィッシングするように調整しています。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:54:28 GMT)
Enhancing interpretability of rule-based classifiers through feature graphs [0.0] ルールベースシステムにおける特徴量推定のためのフレームワークを提案する。
グラフベースの機能可視化戦略も導入する。
臨床特徴の複合的予測価値に関する新たな知見を明らかにするために,本手法の能力について紹介する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:29:37 GMT)
Enforcing tail calibration when training probabilistic forecast models [0.0] 本研究では,確率予測モデルの学習に使用する損失関数を用いて,極端な事象に対する予測の信頼性を向上させる方法について検討する。
我々は,最先端モデルが極端風速のキャリブレーション予測を発行しないことを示すとともに,モデルトレーニング中の損失関数への適切な適応により,極端事象のキャリブレーションを改善することができることを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:51:06 GMT)
Emergence of an Epsilon-Near-Zero Medium from Microscopic Atomic Principles [0.0] 本研究は, 原子格子の集合散乱から有効近ゼロ屈折率が出現することを示し, 基本的には精密な顕微鏡シミュレーションを用いた。
25層アレイにおいて、協調応答は媒体内の有効光波長を30倍以上に増加させる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 09:35:02 GMT)
Efficient algorithms for quantum chemistry on modular quantum processors [0.0] 本稿では,複数の計算モジュールに分散した量子化学アルゴリズムの実装を紹介する。
並列性を最大化するために、Trotterizationの擬似可換性を用いたパッキング方式を設計する。
分子構造を自然に利用し,モジュール間遅延を低減する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:22:18 GMT)
Edeflip: Supervised Word Translation between English and Yoruba [0.0] 本研究では,英語からヨルバ語への単語翻訳のための教師付き埋め込みアライメント手法を実装した。
その結果, 高い埋め込み品質と正規化埋め込みにより単語翻訳精度が向上し, 両者の相互作用効果が向上することがわかった。
本結果は,低リソース言語における最先端の教師あり組込みアライメントの限界を実証するものである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:14:52 GMT)
EUNIS Habitat Maps: Enhancing Thematic and Spatial Resolution for Europe through Machine Learning [0.0] EUNISの生息地分類は欧州の生息地を分類するのに重要である。
260のEUNIS生息地を階層レベル3で予測する。
欧州全体で100mの解像度で、最も可能性の高いEUNIS生息地を示す欧州の生息地マップを作成した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:10:08 GMT)
Dynamic Reinsurance Treaty Bidding via Multi-Agent Reinforcement Learning [0.0] 本稿では,再保証条約入札のための新しいマルチエージェント強化学習(MARL)フレームワークを開発する。
MARLエージェントは、最大15%高い引受利益、20%低い尾リスク、25%以上のシャープ比の改善を達成する。
これらの結果は、MARLがより透明性があり、適応的で、リスクに敏感なリシュアランス市場への道を開くことを示唆している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:43:22 GMT)
Dynamic Preference Multi-Objective Reinforcement Learning for Internet Network Management [0.0] 本稿では,RLをベースとしたネットワーク管理エージェントを提案する。
偏りのない訓練に有利な選好分布を推定できる数値計算法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:03:58 GMT)
Do Music Preferences Reflect Cultural Values? A Cross-National Analysis Using Music Embedding and World Values Survey [0.0] 本研究は,国民音楽の嗜好が文化的価値を反映する程度について考察する。
われわれは、西欧と非西欧の62か国にわたるYouTube Music Chartsから、長期にわたるポピュラー音楽データを収集した。
LP-MusicCaps と GPT-based summarization を用いて各トラックのセマンティックキャプションを生成した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:05:41 GMT)
Distinguishing Autonomous AI Agents from Collaborative Agentic Systems: A Comprehensive Framework for Understanding Modern Intelligent Architectures [0.0] 大規模言語モデルの出現は、人工知能の2つの異なる相互接続パラダイム、すなわちスタンドアロンAIエージェントと協調エージェントAIエコシステムを触媒した。
本研究は, 運用原則, 構造構成, 配置方法論の体系的解析を通じて, これらのアーキテクチャを識別するための決定的な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:03:41 GMT)
Discerning What Matters: A Multi-Dimensional Assessment of Moral Competence in LLMs [0.0] 道徳的能力は道徳的原則に従って行動する能力である。
大規模言語モデル(LLM)は、道徳的能力を求める状況においてますます展開されているため、この能力を実証的に評価することへの関心が高まっている。
i) 道徳的特徴を明確に強調した事前パッケージ化された道徳的シナリオへの過度な信頼、(ii) 道徳的推論よりも検証予測に焦点をあてること、(iii) 追加情報が必要な時に認識できないモデルの不適切なテスト。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 03:59:38 GMT)
Digital Transformation of Urban Planning in Australia: Influencing Factors and Key Challenges [0.0] 本研究は、技術・組織・外部環境(TOE)の枠組みの下で、組織間理論と計画支援科学(PSScience)を採用する。
これには、ビクトリア州とニューサウスウェールズ州政府と民間の13のITおよび都市計画の専門家との半構造化されたインタビューを含む複数のケーススタディが含まれる。
オーストラリアにおける都市計画システムのデジタルトランスフォーメーションの課題は, 組織的, 外部的環境要因に関係していることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:23:46 GMT)
Detecting zero-point fluctuations with stochastic Brownian oscillators [0.0] ゼロ点変動の検出を可能にする一般的な増幅戦略を提案する。
本稿では,未知の熱浴の量子揺らぎの証として,ウイルス比を用いる方法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:45:12 GMT)
Detecting Hard-Coded Credentials in Software Repositories via LLMs [0.0] ソフトウェア開発者は、パスワード、ジェネリックシークレット、プライベートキー、ソフトウェアリポジトリのジェネリックトークンなどの認証情報をハードコードすることが多い。
これらの認証は、潜在的な敵によって悪用され、バックドア攻撃のような悪意ある攻撃を行うために攻撃面を生成する。
最近の検出では、埋め込みモデルを用いてテキスト認証をベクトル化し、予測のために分類器に渡す。
我々のモデルは、ベンチマークデータセットのF1測定値において、現在の最先端よりも13%優れています。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 04:33:48 GMT)
Designing open quantum systems for enabling quantum enhanced sensing through classical measurements [0.0] 我々は、古典的な測定によって、多体量子拡張が実際に得られることを示す。
我々はこれを、閉じ込められたイオンまたは空洞QEDセットアップで実現可能な、オープンスピンボソンモデルのクラスに対して詳細に説明する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 10:04:06 GMT)
Delving Into the Psychology of Machines: Exploring the Structure of Self-Regulated Learning via LLM-Generated Survey Responses [0.0] 大きな言語モデル(LLM)は、人間のような反応や振舞いをシミュレートする能力を提供する。
LLMは、介入シナリオのテスト、理論モデルの改良、スパースデータセットの拡張、および到達しにくい人口の表現に使用することができる。
本研究では, 項目分布, 理論的SRL次元の心理的ネットワーク, 潜在因子構造に基づく心理的妥当性について検討した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:48:58 GMT)
Deep Learning-Based Multi-Object Tracking: A Comprehensive Survey from Foundations to State-of-the-Art [0.0] マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおける中核的なタスクであり、フレーム内のオブジェクトを検出し、時間をかけて関連付ける。
ディープラーニングベースの手法の進歩は、2022年にByteTrackによるトラッキング・バイ・検出と、エンドツーエンドのトラッキングのためのMOTRの導入によって加速された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 13:15:01 GMT)
Deep Learning-Based Breast Cancer Detection in Mammography: A Multi-Center Validation Study in Thai Population [0.0] EfficientNetV2アーキテクチャを改良した乳房がん検出のための深層学習システムの開発
モデルはタイの主要な医療センターのマンモグラムで訓練され、3つの異なるデータセットで検証された。
がん検出では、それぞれのデータセットで0.89、0.96、0.94のAUROCを達成した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:42:49 GMT)
Data-Driven Soil Organic Carbon Sampling: Integrating Spectral Clustering with Conditioned Latin Hypercube Optimization [0.0] 土壌有機炭素(SOC)モニタリングは、しばしば代表的なフィールドサンプリング場所の選択に依存する。
スペクトルクラスタリングと条件付きラテンハイパーキューブサンプリングを統合した新しいハイブリッド手法を提案する。
この改良されたサンプリング設計はより正確なSOC予測をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:20:35 GMT)
DETRPose: Real-time end-to-end transformer model for multi-person pose estimation [0.0] マルチパーソンポーズ推定(MPPE)は、画像に存在するすべての個人に対するキーポイントを推定する。
本稿では,MPPEをリアルタイムに実行可能なトランスフォーマーモデル群を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:34:13 GMT)
Contrastive Self-Supervised Learning As Neural Manifold Packing [0.0] 本稿では,表現学習を多様体パッキング問題として再キャストする自己教師型フレームワークであるContrastive Learning As Manifold Packing (CLAMP)を紹介する。
このフレームワークでは、各クラスは1つのイメージの複数の拡張ビューを埋め込んだサブマニフォールドで構成されている。
標準線形評価プロトコルでは、CLAMPは最先端の自己教師型モデルと競合する性能を達成している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:24:31 GMT)
Condition Monitoring with Machine Learning: A Data-Driven Framework for Quantifying Wind Turbine Energy Loss [0.0] 本研究では,風力タービンのコンディションモニタリングのための高度でスケーラブルな機械学習フレームワークを提案する。
このフレームワークは、厳密な前処理によって正常なタービン挙動を効果的に分離し、ドメイン固有のルールと異常検出フィルタを取り入れている。
データ前処理法は、ウィンドファーム当たりのSCADAデータの平均31%を保持し、大幅なデータ削減をもたらした。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 00:44:54 GMT)
Computing the Distance between unbalanced Distributions -- The flat Metric [0.0] 任意の次元で平坦な計量を計算するための実装を提供する。
我々の実装は、質量差に非常によく適応し、異なる分布を区別するためにそれらを使用する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 11:43:39 GMT)
Comment on The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity [0.0] 大規模推論モデル(LRM)は、特定の複雑性しきい値を超えた計画パズルについて「精度の崩壊」を示す。
これらの結果は,基本的推論失敗ではなく,実験的な設計上の制約を主に反映していることが実証された。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:04:21 GMT)
Causal Mediation Analysis with Multiple Mediators: A Simulation Approach [0.0] 因果仲裁の分析には、露光によって引き起こされる共同設立者や、関連する複数の仲介者が含まれることが多い。
本研究は, 媒介者ごとの一連の分布モデルから得られるポテンシャルをシミュレーションし, これら全ての量を評価するための一般的な手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 21:35:14 GMT)
Causal Deep Learning [0.0] 逆因果質問は、マルチ線形投影アルゴリズムを実装するニューラルネットワークで対処される。
計算にスケーラブルな解に対しては、ブロック代数を利用してディープニューラルネットワークの集合を導出する。
テンソル因子分析の結果である因果神経ネットワークは、データに依存しないが、顔画像で示される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:38:39 GMT)
CONQURE: A Co-Execution Environment for Quantum and Classical Resources [0.0] 本研究は量子資源と古典資源の共同実行環境であるCONQUREを提案する。
当社のAPIは、平均12.7mテストのオーバーヘッドが低く、イオントラップデバイスで機能を示す。
当社のOpenMP拡張は,VQEの実行を3.1倍の削減で並列化可能にする。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:18:15 GMT)
Blocklet concatenation: Low-overhead fault-tolerant protocols for fusion-based quantum computation [0.0] コード結合とゲートに基づくフォールトトレラント量子コンピューティングのためのプロトコルの構築を提案する。
これらのプロトコルは、厳密な局所性制約を伴わずに、低重安定化器測定の量子回路の族として解釈できる。
本稿では,フォトニックハードウェアにおける論理演算,復号化,プロトコルの実装を行う手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:48:19 GMT)
Bhatt Conjectures: On Necessary-But-Not-Sufficient Benchmark Tautology for Human Like Reasoning [0.0] 大きな言語や推論モデル(LLMs/LRMs)が本当の理由なのか、単にパターンマッチがゴールポストのシフトに悩まされているのか、議論する。
という2つの分析--私の精神モデルでその霧を切り抜けたベンチマーク。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 01:10:55 GMT)
Bayesian Active Learning of (small) Quantile Sets through Expected Estimator Modification [0.0] 本稿では,ガウス的プロセスモデリングに基づくベイズ的アクティブラーニング戦略を提案する。
この戦略は、我々が期待する推定量修正(EEM)と呼ぶより広い原理に属する新しいサンプリング基準によって推進される。
ROTOR37圧縮機モデルを含むいくつかの合成例と工業応用事例について,この戦略の性能を概説した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:13:48 GMT)
BanditWare: A Contextual Bandit-based Framework for Hardware Prediction [0.0] BanditWareは、アプリケーションに適したハードウェアを動的に選択するオンラインレコメンデーションシステムである。
従来の統計的および機械学習のアプローチとは異なり、BanditWareはオンラインで、新しいワークロードが到着すると学習と適応をリアルタイムで行う。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:40:34 GMT)
Arbitrarily Applicable Same/Opposite Relational Responding with NARS [0.0] 非公理的推論システムにおいて、テクスタル的に適用可能な同/正則リレーショナル応答の出現を示す。
本研究は,心理学の学習にインスパイアされた関係学習機構を,人工知能の枠組みに組み込むことの可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:46:44 GMT)
An LLM's Apology: Outsourcing Awkwardness in the Age of AI [0.0] 現代社会のダイナミクスの鍵となる部分は、短い注意を喚起することである。
このタスクをLLM(Large Language Model)に委譲する能力は、摩擦を大幅に減少させる可能性がある。
FLAKE-Benchは,様々な社会的,専門的,ロマンチックなシナリオから,モデルの有効性を効果的に,優しく,人間的に抽出する能力の評価手法である。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:46:14 GMT)
An Interdisciplinary Review of Commonsense Reasoning and Intent Detection [0.0] ACL,EMNLP,CHI(2020-2025)の28論文を分析し,方法論と応用によって整理した。
常識推論はゼロショット学習、文化適応、構造化評価、対話的文脈でレビューされる。
インテント検出は、オープンセットモデル、生成的定式化、クラスタリング、人間中心システムを通じて行われる。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 22:26:17 GMT)
Ai-Facilitated Analysis of Abstracts and Conclusions: Flagging Unsubstantiated Claims and Ambiguous Pronouns [0.0] 我々は,人間のような階層的推論を引き出すために設計された概念証明プロンプトを提示し,評価する。
このプロンプトは、2つの非自明な解析的タスクをターゲットにしている。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:34:31 GMT)
Agent Capability Negotiation and Binding Protocol (ACNBP) [0.0] 本稿ではACNBP(Agen Capability Negotiation and Binding Protocol)を提案する。
ACNBPは、異種マルチエージェントシステムにおけるエージェント間のセキュアで効率的な、検証可能な相互作用を促進するために設計されたフレームワークである。
我々は,MAESTRO脅威モデリングフレームワークを用いた包括的セキュリティ解析によりACNBPの有効性を示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:18:24 GMT)
Adversarially Robust Bloom Filters: Privacy, Reductions, and Open Problems [0.0] ブルームフィルタ(ブルームろく、英: Bloom filter)は、より大きい宇宙の要素のセット$S$を表す空間効率の確率的データ構造である。
ブルームフィルタの対向的堅牢性とプライバシーについて検討する。
PRFをベースとしたBloomフィルタがNOYモデルの強いBP-testをフェールすることを証明する。
プライバシー保証の異なるBloomフィルタを初めて導入する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 02:10:21 GMT)
Adversarial Disentanglement by Backpropagation with Physics-Informed Variational Autoencoder [0.0] 物理系の部分的な知識の下での推測と予測は困難である。
本稿では,物理モデルとデータ駆動モデルの柔軟性を組み合わせた物理インフォームド変分オートエンコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 16:18:25 GMT)
Adapting LLMs for Minimal-edit Grammatical Error Correction [0.0] 本稿では,誤り率適応のトピックについて検討し,新しいトレーニングスケジュール法を提案する。
我々の実験は、BEA-testセット上の単一モデルシステムに対して、新しい最先端の結果を設定しました。
我々は、デトークン化されたデータセットのトレーニングが結果に影響を与えるかどうかを分析し、修正された誤例を用いてデータセットの使用の影響を計測する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 07:00:48 GMT)
Activation Space Interventions Can Be Transferred Between Large Language Models [0.0] モデル間での安全介入は、共有活性化空間の学習されたマッピングを通して伝達可能であることを示す。
このアプローチは、バックドアの除去と有害なプロンプトの拒絶という、確立された2つのAI安全タスクに対して実証する。
また、バックドアに関連付けられた知識を組み込むために、モデルに微調整を施した新しいタスク、textitcorrupted機能を提案する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:43:55 GMT)
Accessibility Barriers in Multi-Terabyte Public Datasets: The Gap Between Promise and Practice [0.0] 本研究では、Webクロール、衛星画像、科学データ、共同プロジェクトにおけるアクセシビリティの課題について検討する。
我々の分析は、一般的に「一般にアクセス可能」なデータセットは、意味のある分析のために1000ドル以上の最小限の投資を必要としていることを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 08:52:58 GMT)
AI reconstruction of European weather from the Euro-Atlantic regimes [0.0] 本稿では,ヨーロッパ・大西洋気象局(WR)の指標に基づいて,月平均気温と降水量の異常を再構築する非線形AIモデルを提案する。
WRは、ヨーロッパの気象にかなりの影響を及ぼす大気循環の繰り返し、準定常、持続的な状態を表す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 17:59:02 GMT)
A theoretical basis for model collapse in recursive training [0.0] 生成モデルからのトレーニングは、シミュレーションされた確率分布のいわゆる「崩壊」につながることが知られている。
このノートは、外部ソース、どのようにマイナーであれ、サンプルにも貢献するかどうかによって、実際には2つの異なる振る舞いが得られていることを示している。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 06:14:31 GMT)
A note on Hall conductance and Hall conductivity in interacting Fermion systems [0.0] NEASS法を線形応答に適用してホール導電率の式を導出する方法を示す。
半平面上の化学ポテンシャルの断熱的増加に対する微視的電流応答の線形応答係数として得られることを示す。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 15:03:45 GMT)
A Reference Model and Patterns for Production Event Data Enrichment [0.0] プロダクションイベントデータを豊かにするために設計された参照モデルとパターンのコレクションを導入します。
リファレンスモデルは、プロダクションイベントデータを保存し、抽出する標準的な方法を提供する。
これらのパターンは、製造プロセスから発生したイベントデータセットからの経験的観察に基づいて開発される。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:36:50 GMT)
A Production Scheduling Framework for Reinforcement Learning Under Real-World Constraints [0.0] 実世界の運用環境は、従来のスケジューリングアプローチの効率を低下させる追加の複雑さを導入します。
強化学習(RL)はこれらの課題に対処する可能性を秘めている。
JobShopLabは、研究開発と産業アプリケーションの両方のためのオープンソースのツールだ。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 14:50:26 GMT)
A Hybrid Neural Network -- Polynomial Series Scheme for Learning Invariant Manifolds of Discrete Dynamical Systems [0.0] 本稿では,物理インフォームドおよび数値解析インフォームド方式で学習するハイブリッド機械学習手法を提案する。
提案手法は、系列と浅いニューラルネットワークを組み合わせることで、両方のアプローチの相補的な強みを利用する。
提案手法は純粋近似とスタンドアロンニューラルネットワークの両方に優れることを示した。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 19:42:34 GMT)
A Hybrid GA LLM Framework for Structured Task Optimization [0.0] GA LLMは、遺伝的アルゴリズムと大規模言語モデルを組み合わせて、厳密な制約の下で構造化された生成タスクを処理するハイブリッドフレームワークである。
言語モデルはドメイン知識と創造的バリエーションを提供し、遺伝的アルゴリズムは構造的整合性とグローバルな最適化を保証する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 05:48:44 GMT)
A Dual-Layer Image Encryption Framework Using Chaotic AES with Dynamic S-Boxes and Steganographic QR Codes [0.0] 本稿では,ロバストな画像暗号化と鍵分散フレームワークを提案する。
改良されたAES-128アルゴリズムとカオス理論と高度なステガノグラフィー技術を統合している。
監視、医療画像、デジタル法医学などのアプリケーションにおいて、機密画像送信のためのスケーラブルでセキュアなソリューションを提供する。
論文参考訳(メタデータ) (Mon, 16 Jun 2025 18:16:14 GMT)