Constructive interference at the edge of quantum ergodic dynamics [116.9] 時間外2次相関器 OTOC$(2)$ を用いてエルゴード力学を特徴付ける。
時間反転のない力学とは対照的に、OTOC$(2)$は長い時間スケールで基礎となる力学に敏感である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:29:23 GMT)
SmartEraser: Remove Anything from Images using Masked-Region Guidance [114.4] SmartEraserはMasked-Region Guidanceと呼ばれる新しい削除パラダイムで構築されている。
Masked-Region Guidanceは、削除プロセスのガイダンスとして、入力中のマスクされた領域を保持します。
大規模オブジェクト除去データセットであるSyn4Removalを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:08:59 GMT)
Bayesian Neural Scaling Law Extrapolation with Prior-Fitted Networks [100.1] スケーリング法則は、しばしばパワーローに従っており、より大きなスケールでのスケーリングの振る舞いを予測するために、パワーロー関数のいくつかの変種を提案した。
既存の手法は主に点推定に依存しており、現実のアプリケーションにとって欠かせない不確実性を定量化しない。
本研究では,ニューラルスケーリング法外挿のためのPFNに基づくベイズフレームワークについて検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:11:20 GMT)
ViCrit: A Verifiable Reinforcement Learning Proxy Task for Visual Perception in VLMs [98.3] ViCrit (Visual Caption Hallucination Critic) は、VLMを訓練し、人間の手書き画像キャプションの段落に挿入された微妙で合成的な視覚幻覚をローカライズするRLプロキシタスクである。
ViCrit Taskでトレーニングされたモデルは、さまざまなビジョン言語モデルベンチマークで大幅に向上している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:16:54 GMT)
The Emergence of Abstract Thought in Large Language Models Beyond Any Language [95.5] 大規模言語モデル(LLM)は様々な言語で効果的に機能する。
予備的研究では、LLMの隠れた活性化は、英語以外のプロンプトに反応してもしばしば英語に類似している。
近年の結果は多言語のパフォーマンスが強く、他の言語での特定のタスクにおける英語のパフォーマンスを超えている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:00:54 GMT)
The Sample Complexity of Online Strategic Decision Making with Information Asymmetry and Knowledge Transportability [93.1] 情報非対称性はマルチエージェントシステムの普及した特徴である。
本論文は,オンライン学習における基本的課題について考察する。知識伝達を必要とする場合でも,共同設立者について学ぶために,非I.d.アクションを適用できるのか?
本稿では,情報非対称性下でのシステム力学を正確に同定し,強化学習における知識伝達の課題を効果的にナビゲートするために,サンプル効率のよいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:06:57 GMT)
Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models [90.5] 我々は、前身のGTE-Qwenシリーズよりも大幅に進歩したQwen3 Embeddingシリーズを紹介する。
Qwen3 Embeddingシリーズは、組み込みタスクと再ランクタスクの両方のためのモデルサイズの範囲を提供する。
Qwen3 Embeddingシリーズは様々なベンチマークで最先端の結果が得られる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:54:49 GMT)
STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization [87.8] textbfSkill textbfTraining with textbfAugmented textbfRotation (textbfSTAR) は、スキル学習と構成の両方を進化させて複雑な振る舞いを完遂するフレームワークである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:50:28 GMT)
MindOmni: Unleashing Reasoning Generation in Vision Language Models with RGPO [87.5] 近年のテキスト・ツー・イメージシステムは、マルチモーダル入力や複雑な推論タスクの処理において制限に直面している。
我々は、強化学習による推論生成を取り入れ、これらの課題に対処する統合マルチモーダルな大規模言語モデルであるMind Omniを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:44:25 GMT)
Vision Generalist Model: A Survey [87.5] 本稿では、ビジョンジェネラリストモデルの概要を概観し、その分野におけるその特性と能力について考察する。
関連ドメインへの簡単な探索を行い、相互接続と潜在的なシナジーに光を当てます。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:23:41 GMT)
Incorporating Linguistic Constraints from External Knowledge Source for Audio-Visual Target Speech Extraction [87.5] AV-TSEの補助的知識源として,事前学習言語モデル (PSLM) と事前学習言語モデル (PLM) の可能性を検討する。
本研究では, AV-TSE モデルに対するPSLM や PLM からの言語制約を追加の監視信号として活用することを提案する。
推論中に余分な計算コストがなければ、提案手法は音声品質と知能性を一貫して改善する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:36:26 GMT)
A theoretical framework for self-supervised contrastive learning for continuous dependent data [86.5] 自己教師付き学習(SSL)は、特にコンピュータビジョンの分野で、表現を学習するための強力なアプローチとして登場した。
本稿では,サンプル間のアンフェマティック独立に適した対照的なSSLの理論的枠組みを提案する。
具体的には、標準のUEAベンチマークとUCRベンチマークでTS2Vecを上回り、それぞれ4.17$%と2.08$%の精度で改善した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:23:47 GMT)
Reasoning Models Are More Easily Gaslighted Than You Think [85.8] 我々はOpenAIのo4-mini、Claude-3.7-Sonnet、Gemini-2.5-Flashの3つの最先端推論モデルを評価する。
ガス灯消火プロンプトによる精度低下が認められた。
GaslightingBench-Rは、推論モデルの認識可能性を評価するために設計された新しい診断ベンチマークである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:52:25 GMT)
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain [82.8] 対向的浄化法は 対向的摂動を 前方から等方性雑音の一部に 浸入させようとする
我々は周波数領域の視点に目を向け、画像を振幅スペクトルと位相スペクトルに分解する。
両スペクトルとも,逆方向の摂動による損傷は周波数とともに単調に増加する傾向にある。
本稿では,原画像の保存を最大化しながら,対向的摂動を解消できる浄化法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:31:27 GMT)
Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models [79.8] 本稿では,高品質な嗜好データを自律的に生成するアルゴリズムであるセルフステアリング最適化(SSO$)を提案する。
$SSO$は、ポリシーモデル自体からデータジェネレータを構築するために、特別な最適化目標を採用しています。
評価の結果,$SSO$は人選好アライメントと報酬最適化のベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:43:28 GMT)
SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending [79.8] SkillBlenderは、多目的なヒューマノイドロコ操作のための新しい階層的強化学習フレームワークである。
SkillBlenderは、まずゴール条件付きタスク非依存のプリミティブスキルを事前訓練し、その後、これらのスキルを動的にブレンドして複雑なロコ操作タスクを達成する。
また,3つのエボディメント,4つのプリミティブスキル,8つの難解なロコ操作タスクを含む並列的,クロスエボディメント,多種多様なシミュレーションベンチマークであるSkillBenchを紹介した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:24:26 GMT)
Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [77.3] 3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:48:53 GMT)
Directing Mamba to Complex Textures: An Efficient Texture-Aware State Space Model for Image Restoration [75.5] TAMAMbaIRは画像テクスチャの達成と性能と効率のトレードオフを同時に知覚する。
画像超解像, デラリニング, 低照度画像強調のためのベンチマーク実験により, TAMAMbaIRは高い効率で最先端の性能を達成できることを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:43:40 GMT)
Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.1] 大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:03:52 GMT)
PlayerOne: Egocentric World Simulator [73.9] PlayerOneは、最初のエゴセントリックなリアルワールドシミュレータである。
それは、エゴセントリックなビデオを生成し、エゴセントリックなカメラで捉えたユーザーの実際のシーンの人間の動きと厳密に一致している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:53 GMT)
InterActHuman: Multi-Concept Human Animation with Layout-Aligned Audio Conditions [70.6] リッチなマルチモーダル条件を持つエンドツーエンドの人間アニメーションは,近年顕著な進歩を遂げている。
既存のほとんどの手法は、単一の主題をアニメーションし、グローバルな方法で条件を注入するしかなかった。
本稿では,各アイデンティティの時間的フットプリントに対する条件の強い領域特異的な結合を強制する,新しい枠組みを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:57:09 GMT)
Ming-Omni: A Unified Multimodal Model for Perception and Generation [69.8] 本稿では,画像,テキスト,音声,ビデオの処理が可能な統合マルチモーダルモデルを提案する。
Ming-Omniは専用エンコーダを使用して異なるモダリティからトークンを抽出し、Lingによって処理する。
Ming-Omniは、オーディオと画像生成をサポートすることで、従来のマルチモーダルモデルを超えて拡張する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:50:49 GMT)
LEO-VL: Towards 3D Vision-Language Generalists via Data Scaling with Efficient Representation [68.8] 3D-VLのジェネラリストを開発する上で重要な障害は、効率的なシーン表現が欠如していることによる、データのスケーラビリティにある。
本稿では,2次元知覚と3次元空間構造を橋渡しする効率的なシーン表現である,凝縮特徴格子(CFG)上に構築された3次元VLモデルLEO-VLを提案する。
我々は、現実世界の屋内シーンの4つの領域と、キャプションや対話といった5つのタスクにまたがる700万以上の高品質な3D-VLデータをキュレートする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:56:34 GMT)
Measuring What Makes You Unique: Difference-Aware User Modeling for Enhancing LLM Personalization [68.8] 本稿では,Large Language Models (LLM) のパーソナライゼーションを強化するために,差分認識パーソナライズ学習(DPL)を提案する。
DPLは、戦略的に代表ユーザを比較のために選択し、タスク関連の違いを抽出するための構造化標準を確立する。
実世界のデータセットの実験により、DPLはLLMのパーソナライゼーションを大幅に向上させることが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:01:56 GMT)
SplitLoRA: Balancing Stability and Plasticity in Continual Learning Through Gradient Space Splitting [68.0] 継続的な学習には、安定性を保ちながら複数のタスクを連続的に学習するモデルが必要である。
グラディエント・プロジェクションはCLにおいて有効で一般的なパラダイムとして現れ、以前に学習したタスクの勾配空間を2つの部分空間に分割する。
新しいタスクは小部分空間内で効果的に学習され、これにより以前取得した知識との干渉が軽減される。
既存の勾配射影法は、勾配空間を適切に分割することが困難であるため、塑性と安定性の最適なバランスを達成するのに苦労する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:54:39 GMT)
NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.1] 本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:59:17 GMT)
Modality-Balancing Preference Optimization of Large Multimodal Models by Adversarial Negative Mining [66.5] LMMにおけるモダリティの不均衡に対処するため、新しい選好学習フレームワークMBPOを提案する。
MBPOは、強い負の反応、すなわちLLMバイアスによって誤った反応を生成することによって、より効果的なオフライン嗜好データセットを構築する。
視覚言語課題におけるLMM性能を高め、幻覚を効果的に軽減することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:54:30 GMT)
GenBreak: Red Teaming Text-to-Image Generators Using Large Language Models [65.9] テキスト・ツー・イメージ(T2I)モデルは、ヌードや暴力を含む有害なコンテンツを生成するために誤用することができる。
近年のT2Iモデルに対する赤チーム攻撃と敵攻撃は、顕著な制限がある。
我々は、基盤となる脆弱性を体系的に調査するために、レッドチーム大言語モデル(LLM)を微調整するフレームワークであるGenBreakを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:09:12 GMT)
SAGE: Exploring the Boundaries of Unsafe Concept Domain with Semantic-Augment Erasing [65.8] 望ましくない概念に微妙な重みを消去する概念。
既存の方法は、安全でない概念を固定語として扱い、繰り返し消去する。
本稿では,概念語消去を概念ドメイン消去に変換する意味拡張消去について紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:21:24 GMT)
OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation [65.2] 専門的な実行から戦略的計画を切り離す階層的なマルチエージェントフレームワークであるWorkforceを紹介します。
推論中、Workforceはワーカーエージェントの追加や修正によって新しいドメインにシームレスに適応する。
トレーニングには、ドメイン間の一般化を改善する最適化されたワークフォース学習(OWL)を導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:42:53 GMT)
UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting [64.3] 既存の事前学習方法は、オブジェクトレベルとシーンレベルの両方の点群に対して等しく有効である。
UniPre3Dは,任意のスケールの点群やアーキテクチャの3Dモデルに対してシームレスに適用可能な,最初の統合事前学習手法である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:23:21 GMT)
TextSquare: Scaling up Text-Centric Visual Instruction Tuning [62.9] 大規模かつ高品質な命令チューニングデータセットSquare-10Mを作成するための新しいアプローチを提案する。
われわれのモデルであるTextSquareは、最先端のText中心のMLLMをはるかに上回っている。
さらに、GPT4VやGeminiといったトップクラスのモデルでは、テキスト中心のベンチマークを10つ中6つで上回っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:20:44 GMT)
Reinforcing Spatial Reasoning in Vision-Language Models with Interwoven Thinking and Visual Drawing [62.4] 空間における推論への描画は、視覚空間における基本的な描画操作を通じてLVLMを推論できる新しいパラダイムである。
我々のモデルはVILASRと呼ばれ、様々な空間推論ベンチマークで既存の手法より一貫して優れています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:41:50 GMT)
Squeezed Attention: Accelerating Long Context Length LLM Inference [61.8] 本稿では,入力コンテキストの大部分を固定したアプリケーションを高速化するために,Squeezed Attentionを提案する。
推論中、ユーザ入力からのクエリトークンとセントロイドを比較し、固定されたコンテキストからどのキーが意味論的に関連しているかを予測する。
また,線形から対数的への注意の複雑さを,固定した文脈長に対して低減できる階層型アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:50:44 GMT)
Fast Monte Carlo Tree Diffusion: 100x Speedup via Parallel Sparse Planning [61.7] 最近提案されたモンテカルロ木拡散(MCTD)は,木に基づく探索と拡散を組み合わせて,有望な解を提供する。
Fast-MCTDは、遅延ツリー更新と冗長性認識による並列ロールアウトを可能にするParallel MCTDと、軌道粗大化によるロールアウト長の削減を行うSparse MCTDの2つの技術を統合する。
実験により、Fast-MCTDは標準MCTDよりも最大100倍の高速化を実現し、計画性能を維持または改善した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:17:40 GMT)
ETS: Efficient Tree Search for Inference-Time Scaling [61.6] テストタイムの計算スケーリングにおいて有望なアプローチのひとつは、プロセス報酬モデルに対する検索である。
木探索過程における軌跡の多様性は、多様性の増大がさらなる探索を促進するため、探索の精度に影響を与える。
本稿では,冗長なトラジェクトリを抽出し,必要な多様なトラジェクトリを維持しながら,KVの共有を促進する効率的なツリー探索(ETS)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:59:20 GMT)
Coxeter codes: Extending the Reed-Muller family [59.9] 我々は、領域 $mathbbZm$ を任意の有限コクセター群に置き換えることで、RM族を一般化するバイナリ線形符号のクラスを導入する。
コクセター符号はまた、閉じた対角線Z$回転が非自明な論理を実行することができる量子符号の族を生じる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:40:56 GMT)
Efficient Prediction of SO(3)-Equivariant Hamiltonian Matrices via SO(2) Local Frames [59.9] 我々は、電子構造計算を高速化するためにハミルトン行列を予測することを考える。
ハミルトン行列の対角線外ブロックとSO(2)局所フレームの関係から、QHNetV2を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:04:29 GMT)
NTPP: Generative Speech Language Modeling for Dual-Channel Spoken Dialogue via Next-Token-Pair Prediction [59.4] 話者に依存しない双方向音声対話学習を実現するために,新しい生成モデルパラダイムであるNext-Token-Pair Prediction(NTPP)を導入する。
提案手法であるNTPPは, ターンテイク予測, 応答コヒーレンス, 自然性の観点から, SLMの会話能力を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:45:04 GMT)
Unlocking General Long Chain-of-Thought Reasoning Capabilities of Large Language Models via Representation Engineering [59.3] 既存の作業では、いくつかの例だけをチューニングすることで、長いCoT推論の能力を効率的に引き出すことができる。
このことは、LLMの一般的な能力であるCoT推論の長さを調査する動機となっている。
LLMの一般的な長大CoT推論能力を解き放つ新しい表現工学手法であるGLoREを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:55:09 GMT)
Cosmos-Drive-Dreams: Scalable Synthetic Driving Data Generation with World Foundation Models [59.3] 私たちは,挑戦的なシナリオを生成することを目的とした,合成データ生成パイプラインであるCosmos-Drive-Dreamsを紹介した。
このパイプラインを駆動するCosmos-Driveは、運転ドメインのためのNVIDIA Cosmosファウンデーションモデルに特化したモデルのスイートである。
高忠実で挑戦的なシナリオで運転の量と多様性を拡大するためにコスモス・ドライブ・ドレームを応用することで、これらのモデルの有用性を実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:24:46 GMT)
Efficient Multilingual ASR Finetuning via LoRA Language Experts [59.3] 本稿では,WhisperをベースとしたLoRA言語エキスパートによる多言語ASRをカスタマイズするための効率的な微調整フレームワークを提案する。
LoRAエキスパート融合や知識蒸留により,本手法は従来の微調整法よりも目標言語での認識性能が向上する。
実験の結果,提案モデルでは,言語認識および言語認識のシナリオにおいて,約10%と15%の性能向上が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:06:27 GMT)
Structural-Spectral Graph Convolution with Evidential Edge Learning for Hyperspectral Image Clustering [59.2] ハイパースペクトル画像(HSI)クラスタリングは、アノテーションなしで同様のピクセルを同じクラスに割り当てる。
既存のグラフニューラルネットワーク(GNN)は、入力されたHSIのスペクトル情報を十分に活用できない。
グラフ構造化HSIスーパーピクセルに適した構造スペクトルグラフ畳み込み演算子(SSGCO)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:41:34 GMT)
Flipping Against All Odds: Reducing LLM Coin Flip Bias via Verbalized Rejection Sampling [59.1] 大規模言語モデル(LLM)は、しばしば自然言語を用いて確率分布を正確に記述することができる。
このミスマッチはモンテカルロ法、エージェントベースのシミュレーション、ランダム化された意思決定などの信頼性を必要とするタスクでの使用を制限する。
本稿では,古典的リジェクションサンプリングの自然言語適応であるVerbalized Rejection Smpling (VRS)を紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:58 GMT)
Computation Mechanism Behind LLM Position Generalization [59.0] 大規模言語モデル(LLM)は、テキストの位置を扱う際の柔軟性を示す。
彼らは位置摂動のあるテキストを理解し、より長いテキストに一般化することができる。
この研究は言語現象とLLMの計算機構を結びつける。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:40:29 GMT)
Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations [59.0] エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
本稿では,因果アノテーションを用いて潜在表現を規則化するメトリクス学習手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:31:39 GMT)
LPO: Towards Accurate GUI Agent Interaction via Location Preference Optimization [58.7] 位置優先最適化(Location Preference Optimization、LPO)は、位置データを利用してインタラクションの好みを最適化する新しいアプローチである。
LPOは情報エントロピーを使用して、情報に富んだゾーンに注目して相互作用位置を予測する。
私たちのコードは間もなくhttps://github.com/AIDC-AI/LPO.comで公開されます。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:43:30 GMT)
CaLMQA: Exploring culturally specific long-form question answering across 23 languages [58.2] CaLMQAは、文化的に異なる23言語にわたる51.7Kの質問のデータセットである。
我々は,LLM生成長文回答の事実性,関連性,表面品質を評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:56:58 GMT)
Towards a general-purpose foundation model for fMRI analysis [58.1] 我々は,4次元fMRIボリュームから学習し,多様なアプリケーション間で効率的な知識伝達を可能にするフレームワークであるNeuroSTORMを紹介する。
NeuroSTORMは、複数のセンターにまたがる5万人以上の被験者から5歳から100歳までの28.65万fMRIフレーム(→9000時間)で事前トレーニングされている。
年齢/性別予測、表現型予測、疾患診断、fMRI-to-image検索、タスクベースのfMRIの5つのタスクにおいて、既存の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:51:01 GMT)
Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [57.9] 医療知識の豊富なマルチモーダルデータセットを構築した。
次に医学専門のMLLMであるLingshuを紹介します。
Lingshuは、医療専門知識の組み込みとタスク解決能力の向上のために、マルチステージトレーニングを行っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:12:18 GMT)
Monte Carlo Tree Diffusion for System 2 Planning [57.5] モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
本手法は,木構造化プロセスとしてデノナイジングを再認識し,部分的にデノナイジングした計画を反復的に評価し,刈り取り,精錬する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:22:31 GMT)
AnimateAnyMesh: A Feed-Forward 4D Foundation Model for Text-Driven Universal Mesh Animation [57.2] 本稿では,任意の3Dメッシュの効率的なテキスト駆動アニメーションを可能にする最初のフィードフォワードフレームワークであるAnimateAnyMeshを紹介する。
我々のアプローチは、動的メッシュシーケンスを効果的に圧縮し再構成する新しいDyMeshVAEアーキテクチャを活用する。
また、DyMeshデータセットにもコントリビュートし、テキストアノテーション付き4M以上の動的メッシュシーケンスを格納しています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:55:16 GMT)
Mitigating Spurious Correlations in LLMs via Causality-Aware Post-Training [57.0] 大規模言語モデル (LLMs) は、事前学習中に得られた素早い相関関係により、アウト・オブ・ディストリビューション (OOD) のサンプルで失敗することが多い。
ここでは、因果認識後学習(CAPT)を通して、このような素因的相関を緩和することを目的とする。
公式因果推論ベンチマークCLadderと論理推論データセットPrOntoQAの実験により、CAPTで微調整された3Bスケールの言語モデルでは、従来のSFTおよびより大きなLLMを分散処理(ID)およびOODタスクで上回る結果が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:30:28 GMT)
VerIF: Verification Engineering for Reinforcement Learning in Instruction Following [55.6] 検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)の強化の鍵となる技術となっている。
ルールベースのコード検証とLLMベースの大規模な推論モデルによる検証を組み合わせた検証手法であるVerIFを提案する。
我々はVerIFを用いたRLトレーニングを2つのモデルに適用し、いくつかの代表的な命令追従ベンチマークで大幅に改善した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:10:36 GMT)
MAGMaR Shared Task System Description: Video Retrieval with OmniEmbed [55.5] 我々はTevatron 2.0ツールキットの強力なマルチモーダル埋め込みモデルであるOmniEmbedを使用して、テキスト、画像、オーディオ、ビデオの統一埋め込みを生成する。
2025年5月20日時点の公募では、MAGMaRのタスクリーダーボードの最高スコアを達成しました。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:40:26 GMT)
Give Me FP32 or Give Me Death? Challenges and Solutions for Reproducible Reasoning [55.0] 本研究は,数値精度が大規模言語モデルの推論に与える影響について,最初の系統的研究を行った。
我々は16ビットの精度で重みを格納するが、FP32では全ての計算を実行する軽量な推論パイプラインであるLayerCastを開発した。
そこで我々は16ビットの精度で重みを格納するが、FP32では全ての計算を実行する軽量な推論パイプラインLayerCastを開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:23:53 GMT)
Test-Time Adaptation for Generalizable Task Progress Estimation [54.9] 専門的な視覚的軌跡とその自然言語タスク記述に基づいてモデルを訓練するための勾配に基づくメタラーニング戦略を導入する。
テスト時間適応法は, 単一学習環境から多様なアウト・オブ・ディストリビューションタスク, 環境, 実施形態へ一般化する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:05:33 GMT)
Goal Kernel Planning: Linearly-Solvable Non-Markovian Policies for Logical Tasks with Goal-Conditioned Options [54.4] 我々はLinearly-Solvable Goal Kernel Dynamic Programming (LS-GKDP)と呼ばれる合成フレームワークを導入する。
LS-GKDPは、Linearly-Solvable Markov Decision Process (LMDP)形式とOptions Framework of Reinforcement Learningを組み合わせたものである。
本稿では,目標カーネルを持つLMDPが,タスク接地によって定義された低次元部分空間におけるメタポリティシの効率的な最適化を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:43:11 GMT)
SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner [53.5] テスト駆動開発(TDD)に基づく新しいデータ合成フレームワーク**SWE-Flow*を紹介します。
人為的な問題に依存する既存のソフトウェアエンジニアリングデータとは異なり、**SWE-Flow*は、単体テストから直接インクリメンタルな開発ステップを推論する。
私たちは現実のGitHubプロジェクトから16,061のトレーニングインスタンスと2,020のテストインスタンスを生成し、**SWE-Flow-Eval**ベンチマークを作成しました。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:30:10 GMT)
DySS: Dynamic Queries and State-Space Learning for Efficient 3D Object Detection from Multi-Camera Videos [53.5] Bird's Eye View (BEV) におけるカメラベースの3Dオブジェクト検出は、自律運転において最も重要な認識タスクの1つである。
状態空間学習と動的クエリを用いた新しいDySSを提案する。
提案するDySSは,優れた検出性能と効率的な推論を実現する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:49:56 GMT)
XMeCap: Meme Caption Generation with Sub-Image Adaptability [53.3] 社会的な意味や文化的な詳細に深く根ざした噂は、機械にとってユニークな挑戦である。
我々は、教師付き微調整と強化学習を採用するtextscXMeCapフレームワークを紹介した。
textscXMeCapは、シングルイメージのミームの平均評価スコアが75.85、マルチイメージのミームが66.32、それぞれ最高のベースラインが6.75%と8.56%を上回っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:23:40 GMT)
On-the-Fly Adaptive Distillation of Transformer to Dual-State Linear Attention [53.2] 大規模言語モデル(LLM)は、自己アテンションを通じてグローバルトークンの依存関係をキャプチャするが、長い入力に対する計算とメモリコストに直面する。
本稿では,2つの隠れ状態を維持し,その1つは,リニアアテンションアーキテクチャに典型的な短距離バイアスを緩和して,リニアアテンションをトラッキングするための新しい設計法であるtextbfdslaを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:25:06 GMT)
EgoNormia: Benchmarking Physical Social Norm Understanding [52.9] EGONORMIAは、安全性、プライバシ、プロキシ、丁寧さ、協力性、コーディネーション/プロアクティビティ、コミュニケーション/レポータビリティの7つの標準カテゴリにまたがる。
我々の研究は、現在の最先端のビジョン言語モデル(VLM)は、堅固な標準理解が欠如していることを示し、EGONORMIAでは最大54%、EGONORMIAでは65%と評価された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:13:59 GMT)
HoliSafe: Holistic Safety Benchmarking and Modeling with Safety Meta Token for Vision-Language Model [52.7] 既存の安全チューニングデータセットとベンチマークは、画像とテキストの相互作用が有害なコンテンツを生み出す方法を部分的に考慮しているだけである。
私たちは、安全で安全でない5つの画像とテキストの組み合わせにまたがる、全体安全データセットとベンチマークであるHoliSafeを紹介します。
我々は,学習可能な安全メタトークンと専用の安全ヘッドを備えた新しいVLMであるSafeLLaVAを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:53:30 GMT)
Efficient Heuristics Generation for Solving Combinatorial Optimization Problems Using Large Language Models [52.5] 近年のLarge Language Models (LLMs) を用いた組合せ最適化問題の解法に関する研究
プロンプトにおけるタスク固有の知識の欠如は、LLMが不特定な探索方向を提供し、良好なパフォーマンスの導出を妨げることがしばしばある。
本稿では,Herculesアルゴリズムを提案する。このアルゴリズムは設計したコア抽象化プロンプティング(CAP)法を利用して,コアコンポーネントをエリートHGから抽象化し,プリミティブに事前知識として組み込む。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:21:31 GMT)
Mechanistic PDE Networks for Discovery of Governing Equations [52.5] データから偏微分方程式を発見するためのモデルであるメカニスティックPDEネットワークを提案する。
表現されたPDEは解決され、特定のタスクのためにデコードされる。
線形偏微分方程式に特化して、ネイティブ、GPU対応、並列、スパース、微分可能多重グリッドソルバを開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:04:07 GMT)
DGS-LRM: Real-Time Deformable 3D Gaussian Reconstruction From Monocular Videos [52.5] Deformable Gaussian Splats Large Reconstruction Model (DGS-LRM)を紹介する。
動的シーンのモノクロポーズビデオから変形可能な3Dガウススプラットを予測する最初のフィードフォワード法である。
最先端のモノクロビデオ3D追跡手法と同等の性能を発揮する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:58 GMT)
Improving Personalized Search with Regularized Low-Rank Parameter Updates [52.3] 視覚言語検索のための視覚言語二重エンコーダモデルの内部表現の適応方法を示す。
言語エンコーダの最終層における小さなパラメータ集合の正規化低ランク適応は、テキストインバージョンに対する高い効率の代替となる。
提案手法は,自然言語クエリを用いた個人化画像検索のための2つのベンチマークにおいて,最先端の精度を実現する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:15:21 GMT)
Discovering Physics Laws of Dynamical Systems via Invariant Function Learning [51.8] 我々は、常微分方程式(ODE)によって支配される力学系の基底法則を学習することを考える。
我々はtextbfInvariant textbfFunctions (DIF) のtextbfDisentanglement と呼ばれる新しい手法を提案する。
私たちのコードはAIRSライブラリの一部としてリリースされています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:44:03 GMT)
Efficient Part-level 3D Object Generation via Dual Volume Packing [51.7] パートレベルの3Dオブジェクト生成のための新しいエンドツーエンドフレームワークを提案する。
提案手法は,任意の数の完全かつ意味論的に意味のある部分を持つ高品質な3Dオブジェクトを生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:55:03 GMT)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.6] 異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:29:18 GMT)
Mitigating Object Hallucination in Large Vision-Language Models via Image-Grounded Guidance [51.3] Image-gRounded guIdaNcE (MARINE)は、トレーニングフリーかつAPIフリーのフレームワークである。
MARINEは、LVLMに画像グラウンドガイダンスを導入することにより、推論中の物体の幻覚を効果的かつ効率的に低減する。
私たちのフレームワークの柔軟性は、さらに複数のビジョンモデルの統合を可能にし、より信頼性が高く堅牢なオブジェクトレベルのガイダンスを可能にします。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:33:21 GMT)
Failure Modes of LLMs for Causal Reasoning on Narratives [51.2] 本研究では,大言語モデル(LLM)の因果推論能力について,物語から因果関係を推定する代表的な問題から検討する。
最新の言語モデルでさえ、物語の提示とパラメトリック知識の両方において、信頼できないショートカットに依存していることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:07:36 GMT)
Beyond Bradley-Terry Models: A General Preference Model for Language Model Alignment [51.1] 我々は、優先順位を効率的に捉えるために、応答を潜在空間に埋め込むアプローチである選好埋め込みを導入する。
また、人間からのフィードバックから報酬に基づく強化学習を一般化する嗜好スコアに基づく一般選好最適化(GPO)を提案する。
提案手法は,基礎モデルの微妙な人的価値との整合性を高めることができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:11:12 GMT)
A Closer Look at TabPFN v2: Understanding Its Strengths and Extending Its Capabilities [51.1] Tabular Prior-data Fitted Network v2 (TabPFN v2)は、さまざまな下流データセット間で、前例のないコンテキスト内学習性能を達成する。
本研究では,TabPFN v2が属性トークンをランダムに入力しても属性関係を推測可能であることを示す。
我々はTabPFN v2の制限がテスト時間分割・コンテキスト戦略によって対処できることを実証した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:51:44 GMT)
Continuously Updating Digital Twins using Large Language Models [49.8] デジタルツイン(Digital twins)は、現実のシステムのモデルであり、潜在的なアクションに応答してそれらのダイナミクスをシミュレートすることができる。
現在のアプローチは、固定された、明確に定義されたモデリング環境を必要とするため、この点で苦労しています。
我々は,状況適応型言語モデルに基づくDigital TwinであるCALM-DTを開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:45:28 GMT)
ComfyUI-R1: Exploring Reasoning Models for Workflow Generation [49.1] 私たちはワークフローの自動生成のための最初の大きな推論モデルであるComfyUI-R1を紹介します。
ノードの選択、ワークフロー計画、コードレベルのワークフローを含む、長いチェーン・オブ・シンク(CoT)推論データを構築します。
実験の結果、我々の7B-パラメーターモデルでは、高いパスレート、ノードレベル、グラフレベルのF1スコアとともに、97%のフォーマットの妥当性が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:35:15 GMT)
Decoupling the Image Perception and Multimodal Reasoning for Reasoning Segmentation with Digital Twin Representations [49.0] Reasoning(RS)は、暗黙のテキストクエリに基づいてオブジェクトをセグメント化する必要があるマルチモーダル視覚テキストタスクである。
現在のRSアプローチは、知覚と推論の両方に微調整の視覚言語モデル(VLM)に依存している。
本稿では、Digital Twin表現を中間層として活用し、認識を推論から切り離す新しいRS手法DTwinSegerを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:48:23 GMT)
Critic-CoT: Boosting the reasoning abilities of large language model via Chain-of-thoughts Critic [48.9] Critic-CoTは、LLMをSystem-2のような批判能力にプッシュするフレームワークである。
人間のアノテーションを使わずにCoT推論パラダイムと遠隔スーパービジョンデータの自動構築
GSM8KとMATHの実験は、我々の強化されたモデルがタスク解決性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:01:02 GMT)
Discrepancies are Virtue: Weak-to-Strong Generalization through Lens of Intrinsic Dimension [48.4] W2S(Wak-to-strong)一般化(W2S)とは、弱い教師が生成した擬似ラベルに基づいて強力な学生モデルを訓練するファインタニング(FT)の一種である。
我々は、分散還元の観点から、リッジレス回帰設定におけるW2Sを解析する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:15:49 GMT)
OmniDRCA: Parallel Speech-Text Foundation Model via Dual-Resolution Speech Representations and Contrastive Alignment [48.2] 我々は,共同自己回帰モデルに基づく並列音声テキスト基盤モデルOmniDRCAを提案する。
コントラストアライメントによる音声理解を高めつつ,音声とテキストを並列に処理する手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:57:22 GMT)
Constrained Human-AI Cooperation: An Inclusive Embodied Social Intelligence Challenge [47.7] CHAICは、インボディードエージェントの社会的知覚と協力をテストするために設計された包括的インボディード・ソーシャル・インテリジェンス・チャレンジである。
CHAICの目標は、身体的制約の下で活動している可能性がある人間を支援するために、自我中心の観察装置を備えたエンボディエージェントである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:24:29 GMT)
Attention Head Embeddings with Trainable Deep Kernels for Hallucination Detection in LLMs [47.2] 大規模言語モデルにおける幻覚検出のための新しい手法を提案する。
その結果,幻覚応答は接地応答に比べて刺激からの偏差が小さいことがわかった。
本稿では,分布距離を原理的幻覚スコアとして用いたモデル固有検出法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:59:15 GMT)
TOGA: Temporally Grounded Open-Ended Video QA with Weak Supervision [47.1] 本稿では,ビデオ質問応答(ビデオQA)の時間的グラウンド化の問題に対処する。
開始と終了の時間に基づいたオープンエンドの回答を生成します。
我々はTOGAに回答と時間的接地を共同で生成するように指示する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:52:31 GMT)
CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [46.6] マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。
提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:25:41 GMT)
ReSim: Reliable World Simulation for Autonomous Driving [46.4] 我々は,危険性の高い非専門家を含む様々な行動下での多様なオープンワールド運転シナリオの信頼性シミュレーションを開発する。
我々のReSimパラダイムは、最大で44%高い視覚的忠実度を実現し、専門家と非専門家の両方のアクションの制御性を50%以上改善します。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:55:05 GMT)
Regularizing Learnable Feature Extraction for Automatic Speech Recognition [46.3] ニューラルフロントエンドは、音声認識のための従来の固定された特徴抽出パイプラインに代わる魅力的な代替手段である。
本研究では,学習可能な特徴抽出フロントエンドを用いたASRモデルの正規化手法について検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:46:14 GMT)
MEDUSA: A Multimodal Deep Fusion Multi-Stage Training Framework for Speech Emotion Recognition in Naturalistic Conditions [46.3] MEDUSAは4段階のトレーニングパイプラインを備えたマルチモーダルフレームワークである。
DeepSERは、Deep-Modal Transformer fusionの新たな拡張である。
Manor MixUpは、さらなるレギュラー化のために使用される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:41:23 GMT)
ELBO-T2IAlign: A Generic ELBO-Based Method for Calibrating Pixel-level Text-Image Alignment in Diffusion Models [46.3] ELBO(エビデンスローバウンド)に基づく拡散モデルにおける画素テキストアライメントのキャリブレーション手法を提案する。
本手法はトレーニング不要で汎用的な手法であり,誤認識の原因を特定する必要がなくなる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:47:03 GMT)
GraphLAMA: Enabling Efficient Adaptation of Graph Language Models with Limited Annotations [46.2] 大規模言語モデル(LLM)は様々な領域でその強みを示しており、グラフ言語モデル(GLM)としてグラフ解析に最近統合されている。
LLMを予測子として、いくつかのGLMは自然言語で記述された未確認タスクを解釈し、パラメータチューニングなしでプロンプトのいくつかの例から学習することができる。
効率的なチューニングと推論に特化したモデルバックボーンと学習スキームを備えたGraphLAMA法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:38:01 GMT)
Optimizing Cooperative Multi-Object Tracking using Graph Signal Processing [45.7] 本稿では,3次元LiDARシーンにおける物体追跡のための協調型MOTフレームワークを提案する。
検出された境界ボックスによって定義される全連結グラフトポロジーを利用して、グラフラプラシアン処理最適化手法を用いる。
実世界のV2V4Realデータセットを用いて、広範な評価研究が行われた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:21:58 GMT)
RSafe: Incentivizing proactive reasoning to build robust and adaptive LLM safeguards [45.5] 大規模言語モデル(LLM)は、意図的な安全確保努力にもかかわらず、脆弱性を示し続けている。
ポリシー違反のリスクから保護するために、外部ガードモデルによるシステムレベルのモデレーションが一般的な緩和戦略として現れている。
我々は、特定の安全ポリシーの範囲内で堅牢な保護を提供するためのガイド付き安全推論を行う適応型推論ベースの安全ガードであるRSafeを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:27:11 GMT)
Beyond Calibration: Physically Informed Learning for Raw-to-Raw Mapping [45.4] 既存のraw-to-raw変換手法では、照明変更への適応性の低下、高い計算コスト、同時カメラ操作やオーバーラップ・オブ・ビューといった非現実的な要件といった制限に直面している。
我々は,デバイス間の変換を推定するために,特定の照明下での生画像のシミュレートを行う軽量で物理的にインフォームドされたアプローチであるニューラル・フィジカル・モデル(NPM)を導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:36:46 GMT)
Adv-BMT: Bidirectional Motion Transformer for Safety-Critical Traffic Scenario Generation [45.4] 本稿では,現実のシナリオを多様かつ現実的な対話で拡張するAdv-BMTフレームワークを提案する。
本稿では,Adv-BMTによる衝突シナリオの品質評価を行った。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:54:50 GMT)
Future of Work with AI Agents: Auditing Automation and Augmentation Potential across the U.S. Workforce [45.3] 作業員がAIエージェントの自動化や強化を望んでいるかを評価するための新しい枠組みを導入する。
我々のフレームワークは、ニュアンスな労働者の欲求を捉えるために、オーディオ強化されたミニインタービューを備えている。
我々はWORKBankデータベースを構築し、1500のドメインワーカーの好みとAI専門家の能力評価を収集する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:25:21 GMT)
Provoking Multi-modal Few-Shot LVLM via Exploration-Exploitation In-Context Learning [45.1] 本稿では、LVLM(Large Vision-Language Models)のICLについて検討し、マルチモーダルな実演選択のポリシーについて検討する。
マルチモーダル情報を融合し,適切な実演を総合的に適応的に選択する政策を探求する新たな探索・探索強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:38:12 GMT)
Wavelet Scattering Transform and Fourier Representation for Offline Detection of Malicious Clients in Federated Learning [45.0] フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間で機械学習モデルのトレーニングを可能にする。
異常なクライアントや破損したクライアントの存在は、モデルパフォーマンスを著しく低下させる可能性がある。
我々は、トレーニング前に悪意のあるクライアントにラベル付けする検出アルゴリズムWAFFLEを提案する。
蒸留された公開データセットに基づいてトレーニングされた軽量検出器は、最小限の通信と計算オーバーヘッドでラベル付けを実行する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:48:00 GMT)
Training-Free Voice Conversion with Factorized Optimal Transport [45.0] 本稿では,kNN-VCパイプラインのトレーニング不要な修正であるFactized MKL-VCを紹介する。
元のパイプラインとは対照的に,提案アルゴリズムは参照音声の5秒で高品質な非言語間音声変換を行う。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:23:03 GMT)
The Rabin cryptosystem over number fields [45.0] ランダムな平文の復号化は整数分解問題と同じくらい難しいことを示す。
本稿では,従来のRabin方式と比較して,新しい暗号システムの性能について検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:05:00 GMT)
ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning [45.0] ReasonMedは最大の医学推論データセットであり、最初の170万の推論パスから370万の高品質なサンプルを抽出した。
我々は、サブ10Bモデルのベンチマークを新たに設定したReasonMed-7Bを4.17%上回り、PubMedQAのLLaMA3.1-70Bを4.60%上回っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:36:55 GMT)
Understanding Long Videos with Multimodal Language Models [44.8] LLM(Large Language Models)は、長いビデオ理解ベンチマークにおいて優れたパフォーマンスを達成するために、最近のアプローチを可能にしている。
本研究では,LLMの広範な世界知識と強力な推論能力が,この強みにどのように影響するかを考察する。
得られたマルチモーダルビデオ理解フレームワークは、複数のビデオ理解ベンチマークで最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:46:56 GMT)
CoRT: Code-integrated Reasoning within Thinking [44.8] o1やDeepSeek-R1のようなLarge Reasoning Models(LRM)は、長いチェーン・オブ・シント(CoT)による自然言語推論において顕著な進歩を示している。
Code Interpreter(CI)は、モデルの内部テキスト表現以外の外部知識を提供する。
本稿では,CIを効果的かつ効率的に活用するためのLRM教育のためのポストトレーニングフレームワークであるCoRTを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:59:02 GMT)
LLMs Cannot Reliably Judge (Yet?): A Comprehensive Assessment on the Robustness of LLM-as-a-Judge [44.6] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な知性を示してきた。
これらのシステムは、評価結果を操作できる敵攻撃の影響を受けやすい。
LLMに基づく審査員による既存の評価手法は、しばしば断片的であり、包括的な評価のための統一された枠組みが欠如している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:48:57 GMT)
DreamCS: Geometry-Aware Text-to-3D Generation with Unpaired 3D Reward Supervision [44.6] 3D-MeshPrefは、最初の大規模な未ペアの3D嗜好データセットである。
RewardCSは、3D-MeshPrefのデータを直接トレーニングした最初の報酬モデルである。
DreamCSはRewardCSをテキストから3Dパイプラインに統合する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:54:24 GMT)
Harmonizing and Merging Source Models for CLIP-based Domain Generalization [44.5] CLIPベースのドメイン一般化は、CLIPと複数のソースデータセットの強力なゼロショット分類機能を活用することで、未確認領域へのモデル一般化を改善することを目的としている。
既存のメソッドは通常、複数のソースドメインにまたがって単一のモデルをトレーニングし、ドメイン共有情報をキャプチャする。
近年の研究では、モデルマージが多目的最適化の競合を効果的に軽減し、一般化性能を向上させることが示されている。
私たちは、CLIPベースのドメイン一般化のための新しいソースモデルマージフレームワークであるHarmonizing and Merging (HAM)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:52:36 GMT)
Disclosure Audits for LLM Agents [44.3] 大規模言語モデルエージェントは、パーソナルアシスタント、カスタマーサービスボット、臨床助手として登場し始めている。
本研究では、これらのリスクを定量化し、監査する会話プライバシのための監査フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:47:37 GMT)
Learnable Spatial-Temporal Positional Encoding for Link Prediction [44.1] L-STEP という単純な時間リンク予測モデルを提案する。
L-STEPは、空間時間スペクトルの観点からグラフ特性を保存することができる。
L-STEPは最新の大規模TGBベンチマークで主要な性能を得る。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:31:52 GMT)
Factorized Video Autoencoders for Efficient Generative Modelling [44.0] 本稿では,入力サイズと直交的に成長する4平面の因数分解潜在空間にデータを投影するオートエンコーダを提案する。
提案した4面ラテント空間は高忠実度再構成に必要なリッチな表現を保っていることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:15:59 GMT)
RS-MTDF: Multi-Teacher Distillation and Fusion for Remote Sensing Semi-Supervised Semantic Segmentation [44.0] 本稿では,リモートセンシングにおける半教師付き学習を指導する新しいフレームワークであるRS-MTDF(Multi-Teacher Distillation and Fusion)を紹介する。
RS-MTDFは、複数の凍結したビジョン・ファンデーション・モデル(VFM)を専門教師として採用し、特徴レベルの蒸留を利用して生徒の特徴を堅牢な表現と整合させる。
提案手法は,LoveDAにおけるラベル比率の異なる既存手法よりも優れており,セマンティックカテゴリの大部分においてIoUが最も高い。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:46:53 GMT)
Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models [44.0] 大規模言語モデル(LLM)のための自己信頼による強化学習(RLSC)を提案する。
RLSCはモデル自身の自信を報奨信号として使用し、ラベル、選好モデル、報酬工学の必要性を排除している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:21:59 GMT)
Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs [43.9] VLM(Vision-Language Model)は、視覚的な入力に関する質問に答える能力を示すが、テキスト上で類似のタスクを実行する際の精度は高い。
異なるモードのテキスト回路を同定し,比較することにより,この精度ギャップについて検討する。
これを解決するために、後層の視覚データトークンの表現を以前のレイヤに戻します。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:56:44 GMT)
Improving Discriminator Guidance in Diffusion Models [43.9] クロスエントロピー損失を用いた判別器の訓練は、一般的に行われるように、モデルと対象分布間のクルバック・リーブラーのばらつきを増大させることができることを示す。
KLの発散を適切に最小化する識別器誘導のための理論的に健全な学習目標を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:24:13 GMT)
Code-Switching Curriculum Learning for Multilingual Transfer in LLMs [43.9] 大規模言語(LLL)は、現在、様々な言語において、ほぼ人間レベルのパフォーマンスを示しているが、そのパフォーマンスは、少数の高リソース言語の後、劇的に低下している。
第2言語習得プロセス,特にコードスイッチングにおける人間の不均衡に着想を得て,言語間学習のための枠組みを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:32:20 GMT)
Evaluating Multimodal Large Language Models on Video Captioning via Monte Carlo Tree Search [43.8] MLLM(Multimodal Large Language Models)のビデオ理解能力の評価にビデオキャプションを用いることができる。
既存のベンチマークや評価プロトコルは、キーポイントの不足や均質な生成など、重要な問題に悩まされている。
我々はモンテカルロ木探索(MCTS)を利用して多種多様な記述文を構築する自動フレームワークAutoCaptionを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:11:37 GMT)
Inverting Black-Box Face Recognition Systems via Zero-Order Optimization in Eigenface Space [43.7] ブラックボックス認識モデルから顔画像を再構築することは、重大なプライバシー上の脅威となる。
そこで本研究では,PCA由来の固有面空間内でゼロ階最適化を行うことにより,カラー顔の再構成を行うDarkerBBを提案する。
LFW、AgeDB-30、FPベンチマークの実験では、DarkerBBは類似性のみの環境で、競合クエリ効率で最先端の検証精度を達成している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:15:18 GMT)
UniForward: Unified 3D Scene and Semantic Field Reconstruction via Feed-Forward Gaussian Splatting from Only Sparse-View Images [43.4] 本稿では,3次元シーンとセマンティックフィールドの再構成を統一したフィードフォワードモデルを提案する。
我々のUniForwardは、スパースビュー画像のみから、3Dシーンと対応するセマンティックフィールドをリアルタイムで再構築することができる。
新規なビュー合成と新規なビューセグメンテーションの実験により,本手法が最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:01:21 GMT)
V-JEPA 2: Self-Supervised Video Models Enable Understanding, Prediction and Planning [43.2] 現代のAIにとっての大きな課題は、世界を理解し、主に観察によって行動することを学ぶことである。
本稿では,インターネット規模のビデオデータと少量のインタラクションデータを組み合わせた自己教師型アプローチについて検討する。
我々は物理世界で理解し、予測し、計画できるモデルを開発する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:57:09 GMT)
What Can RL Bring to VLA Generalization? An Empirical Study [42.6] VLA(Large Vision-Language Action)モデルは、AIを具現化する大きな可能性を示している。
教師付き微調整(SFT)による主な訓練は、分散シフト下での複合誤差による一般化を制限する。
本稿では,VLAの一般化評価のための総合的ベンチマークを導入し,RL微調整の影響を系統的に検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:27:58 GMT)
7B Fully Open Source Moxin-LLM/VLM -- From Pretraining to GRPO-based Reinforcement Learning Enhancement [42.1] Moxin 7Bは、オープンサイエンス、オープンソース、オープンデータ、オープンアクセスの原則に準拠した、完全にオープンソースのLarge Language Models (LLM) である。
トレーニング済みのコードと設定、トレーニングと微調整のデータセット、中間および最終チェックポイントをリリースします。
実験により, ゼロショット評価, 少数ショット評価, CoT評価など, 各種評価において, 優れた性能が得られることが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:10:59 GMT)
Binary classification for perceived quality of headlines and links on worldwide news websites, 2018-2024 [41.9] オンラインニュースの普及により、認識される低品質ニュースの見出し/リンクが広く公開される可能性がある。
我々は、全世界のニュースサイトリンク/ヘッダーで57,544,214件のバランスの取れたデータセットを用いて、12の機械学習モデルを評価した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:05:57 GMT)
State Similarity in Modular Superconducting Quantum Processors with Classical Communications [41.9] モジュールアーキテクチャに適したクロスプラットフォーム忠実度推定アルゴリズムを提案する。
我々は、最大6キュービットのモジュラー超伝導量子プロセッサ上で、このプロトコルを実験的に実装し、2つの11キュービットGHZ状態の類似性を検証した。
概念実証として、6つの3キュービットモジュールを用いた5キュービット量子位相学習タスクに適用し、たった8つのトレーニングサンプルで位相情報を抽出することに成功した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:19:37 GMT)
Enhancing Traffic Accident Classifications: Application of NLP Methods for City Safety [41.8] ミュンヘンの交通事故を分析し、異なるタイプの事故を区別するパターンと特徴を特定する。
データセットは、位置、時間、気象条件などの構造化された表形式の特徴と、各事故の状況を詳述した構造化されていない自由テキスト記述の両方で構成されている。
ラベルの信頼性を評価するために,トピックモデリングや少数ショット学習などのNLP手法を適用し,ラベル付け過程の矛盾を明らかにする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:50:49 GMT)
A Hierarchical Probabilistic Framework for Incremental Knowledge Tracing in Classroom Settings [41.8] 知識追跡(KT)は、学生の進化する知識状態を推定し、パフォーマンス履歴に基づいて新しいエクササイズでパフォーマンスを予測することを目的としている。
KTの多くの現実的な教室設定は、典型的には低リソースであり、学生の運動履歴が大きくなるにつれてオンライン更新が必要である。
本稿では,知識概念の木構造階層上での学習者の理解をモデル化する確率的KTフレームワークであるナレッジトレーベースのナレッジトレーシング(KT$2$)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:49:02 GMT)
LIFEBench: Evaluating Length Instruction Following in Large Language Models [41.6] 本稿では,大規模言語モデルの長文指示に従う能力を評価するためにLIFEBenchを提案する。
LIFEBenchは英語と中国語の4つのタスクカテゴリにまたがる10,800のインスタンスで構成されている。
ほとんどのモデルでは、短い命令を適切に追従するが、一定のしきい値を超えると急激に劣化する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:36:18 GMT)
When Large Language Models are Reliable for Judging Empathic Communication [41.0] 大規模言語モデル(LLM)は、テキストベースの会話において共感的な応答を生成するのに優れている。
共感コミュニケーションのニュアンスをどの程度確実に判断できるか?
我々は、専門家、クラウドワーカー、LLMが4つの評価フレームワーク間で共感的なコミュニケーションを注釈する方法について比較する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:10:23 GMT)
Automatic Pseudo-Harmful Prompt Generation for Evaluating False Refusals in Large Language Models [41.0] 安全性に配慮した大型言語モデル(LLM)は、時に「蚊を殺す方法」のような偽の有害なプロンプトを誤って拒否することがある。
ユーザーをイライラさせるだけでなく、アライメントが保護しようとする価値に対する大衆の反発を引き起こしている。
本稿では,多種多様・コンテンツ制御・モデル依存型擬似有害プロンプトの自動生成手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:14:28 GMT)
SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding [40.9] SpikeSMOKEは低出力のモノクル3Dオブジェクト検出のための新しい試みである。
SpikeSMOKEはSMOKEと比較してエネルギー消費を大幅に削減できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:55:43 GMT)
Geometric Regularity in Deterministic Sampling of Diffusion-based Generative Models [39.9] 決定論的サンプリング力学における顕著な幾何学的規則性を明らかにする。
すべての軌道は、モデルアーキテクチャ、適用条件、生成された内容に関わらず、ほぼ同じ「ボメラン」形状を示す。
提案手法は,サンプリング時間スケジュールと基礎となる軌道構造との整合性を向上する動的プログラミングに基づくスキームを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:09:09 GMT)
TaskCraft: Automated Generation of Agentic Tasks [39.9] エージェントタスクは、自律性、ツールの使用、適応推論による多段階的な問題解決を必要とする。
textscCraftTaskは、難易度、マルチツール、検証可能なエージェントタスクを生成する自動化ワークフローである。
本稿では,エージェントチューニングと評価に関する今後の研究を支援するために,約36,000のタスクからなる大規模合成データセットを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:58:14 GMT)
ProbDiffFlow: An Efficient Learning-Free Framework for Probabilistic Single-Image Optical Flow Estimation [39.9] 文献には単一フレーム光フロー推定法が登場している。
本稿では,単一画像から光学的流れを推定するトレーニングフリーフレームワークProbDiffFlowを提案する。
ProbDiffFlowは精度、多様性、効率性を向上し、既存のシングルイメージと2フレームのベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:56:10 GMT)
Raising the Bar: Investigating the Values of Large Language Models via Generative Evolving Testing [39.7] 本稿では,測定理論における適応試験法に基づく新しい生成的進化試験手法であるGAAを提案する。
GETAはモデル能力に適したテスト項目を動的に生成することで、LLMの根底にある道徳的境界を探索する。
GETAは、アイテムの難易度とモデル値の整合性の連成分布を学習することでLLMと共進化する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:47:45 GMT)
Training-Free Guidance Beyond Differentiability: Scalable Path Steering with Tree Search in Diffusion and Flow Models [39.1] TreeG: Tree Search-Based Path Steering Guidanceを提案する。
TreeGは、各ステップで候補を提案し、評価し、選択することで、トレーニング不要のガイダンスのための統一されたフレームワークを提供する。
実験の結果,TreeGはシンボリック・ミュージック・ジェネレーション,小分子設計,エンハンサーDNA設計において,トップ・ガイダンス・ベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:18:01 GMT)
RNE: a plug-and-play framework for diffusion density estimation and inference-time control [39.1] Radon-Nikodym Estimator (RNE) は拡散時間密度推定と制御のための柔軟なプラグアンドプレイフレームワークである。
RNEは、様々な既存の密度推定と推論時間制御を接続し、統一する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:51:44 GMT)
Epass: Efficient and Privacy-Preserving Asynchronous Payment on Blockchain [39.1] Buy Now Pay Later(BNPL)は急速に成長するeコマースモデルで、消費者はすぐに商品を手に入れて支払いを遅らせることができる。
新たなブロックチェーン技術はBNPLプラットフォームにデジタル通貨取引を提供し、BNPLプラットフォームがデジタルウォレットとの統合を可能にする。
しかし、取引の透明性は、悪意のある参加者がオンチェーンの非同期支払いから消費者の財務状態を引き出す可能性があるため、重要なプライバシー上の懸念を引き起こす。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:32:54 GMT)
Surfer-H Meets Holo1: Cost-Efficient Web Agent Powered by Open Weights [39.0] Surfer-Hは、Vision-Language Models (VLM)を統合してWeb上でユーザ定義タスクを実行するコスト効率のよいWebエージェントである。
私たちは、Webナビゲーションと情報抽出に特化した、新しいオープンウェイトなVLMコレクションであるHolo1と組み合わせました。
Holo1を使用すると、Surfer-HはWebVoyagerで92.2%の最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:33:38 GMT)
Leveraging Coordinate Momentum in SignSGD and Muon: Memory-Optimized Zero-Order [39.0] ダウンストリームタスクに事前訓練されたモデルを適用するには、微調整大型言語モデル(LLM)が不可欠である。
従来の一階述語アルゴリズムは、モデルサイズであまりスケールしない、禁止的なメモリと計算コストを発生させる。
メモリと計算効率の代替としてゼロオーダー(ZO)最適化法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:05:40 GMT)
AbstRaL: Augmenting LLMs' Reasoning by Reinforcing Abstract Thinking [38.9] 大規模言語モデル(LLM)は、しばしばその推論に頑健さを欠いている。
このアプローチは、推論の問題に重点を置いています。
この抽象化プロセスは、単に教師付き微調整よりも強化学習(RL)によりより良く得られる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:45:46 GMT)
AsFT: Anchoring Safety During LLM Fine-Tuning Within Narrow Safety Basin [38.6] 大規模言語モデル(LLM)は、微調整中に安全性のリスクに対して脆弱である。
AsFT(Anchoring Safety in Fine-Tuning)と呼ばれる安全微調整手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:43:10 GMT)
TinySplat: Feedforward Approach for Generating Compact 3D Scene Representation [38.5] TinySplatは、コンパクトな3Dシーン表現を生成するための完全なフィードフォワードアプローチである。
TinySplatは標準フィードフォワード3DGS法に基づいており、トレーニング不要の圧縮フレームワークを統合している。
私たちのフレームワークはエンコーディング時間の25%とデコーディング時間の1%しか必要としません。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:47:19 GMT)
ReID5o: Achieving Omni Multi-modal Person Re-identification in a Single Model [38.4] Omni Multi-modal Person Re-identification (OM-ReID) と呼ばれる新しい課題について検討する。
ORBenchは、5つのモダリティにまたがる1,000のユニークなIDからなる最初の高品質なマルチモーダルデータセットである。
また,ReIDのための新しいマルチモーダル学習フレームワークであるReID5oを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:26:13 GMT)
The Entropy Characterization of Quantum MDS Codes [38.4] 参照系における$k$クォーディットと$n$符号付きクォーディットの合同状態のエントロピーは、完全に特徴づけられる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:05:42 GMT)
Expert-in-the-Loop Systems with Cross-Domain and In-Domain Few-Shot Learning for Software Vulnerability Detection [38.1] 本研究では,CWE(Common Weaknessions)を用いたPythonコードの識別をシミュレーションすることにより,ソフトウェア脆弱性評価におけるLLM(Large Language Models)の利用について検討する。
その結果,ゼロショットプロンプトは性能が低いが,少数ショットプロンプトは分類性能を著しく向上させることがわかった。
モデル信頼性、解釈可能性、敵の堅牢性といった課題は、将来の研究にとって重要な領域のままである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:43:51 GMT)
ToxSyn-PT: A Large-Scale Synthetic Dataset for Hate Speech Detection in Portuguese [37.7] ToxSyn-PTは、きめ細かいヘイトスピーチ分類を可能にする最初の大規模なポルトガルのコーパスである。
データセットには、マイノリティグループと毒性ラベルに等しく分散された53,274の合成文が含まれている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:59:29 GMT)
Test-Time-Scaling for Zero-Shot Diagnosis with Visual-Language Reasoning [37.4] 視覚言語モデルを用いた信頼性のある医用画像診断のためのフレームワークを提案する。
テストタイムスケーリング戦略は、複数の候補出力を信頼性のある最終診断に集約する。
様々な医用画像モダリティにまたがるアプローチを評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:23:38 GMT)
Griffin: Towards a Graph-Centric Relational Database Foundation Model [37.1] Griffinはデータベース(RDB)用に特別に設計された最初の基礎モデルの試みである
我々は、クロスアテンションモジュールと新しいアグリゲータを組み込むことで、アーキテクチャを強化する。
グリフィンは、様々な領域にわたるRDBから抽出された大規模、異質、および時間グラフで評価される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:37:10 GMT)
Unsupervised Elicitation of Language Models [37.0] 我々は,教師なしの新たなアルゴリズムである内部コヒーレンス最大化(ICM)を導入し,独自のラベルで事前学習した言語モデルを微調整する。
GSM8k-verification, TruthfulQA, and Alpaca reward modeling taskについて,本手法はゴールデン・インスペクションのトレーニング性能と一致した。
LMの能力が強大な超人であるタスクにおいて、この手法は人間のラベルのトレーニングよりもはるかに優れた能力を引き出すことができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:40:08 GMT)
STAMImputer: Spatio-Temporal Attention MoE for Traffic Data Imputation [36.9] 既存のタイム・ツー・スペースのメソッドは、ブロック単位で欠落したデータシナリオの特徴を効果的に抽出することができないことが多い。
本稿では,トラフィックデータ計算のためのSTAMImputerという,専門家ネットワークの時空間注意混合方式を提案する。
その結果,STAMImputer は既存の SOTA 手法に比べて性能が大幅に向上した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:33:59 GMT)
TooBadRL: Trigger Optimization to Boost Effectiveness of Backdoor Attacks on Deep Reinforcement Learning [36.8] TooBadRLは、DRLバックドアトリガーを3つの臨界軸(時間、空間、大きさ)に沿って体系的に最適化するフレームワークである。
TooBadRLは,通常のタスク性能の低下を最小限に抑えつつ,攻撃成功率を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:50:17 GMT)
A Call for Collaborative Intelligence: Why Human-Agent Systems Should Precede AI Autonomy [36.7] 人間とAIのチームワークは、AIが単独で作業するよりも複雑なタスクをうまく処理できることを示す。
本稿は、AIの進歩は、独立系がどのように成長するかではなく、人間がいかにうまく機能するかによって測定されるべきである、と論じる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:08:13 GMT)
GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment [36.5] 大きな言語モデル(LLM)は印象的な能力を示すが、人間の好みに注意深く対応する必要がある。
テストタイムアライメント手法は、報酬モデル(RM)を使用して凍結したLLMを再トレーニングせずにガイドすることでこの問題に対処する。
我々は、Autoregressive Reward Modelを活用するテスト時間アライメントアプローチであるGenARMを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:11:03 GMT)
OctoNav: Towards Generalist Embodied Navigation [36.1] エンボディードナビゲーションは、エンボディードAIの幅広い追求の基盤の柱である。
本研究では,自由形指示に従う汎用ナビゲーションエージェントを提案する。
我々は,OctoNav-BenchとOctoNav-R1と呼ばれる大規模ベンチマークとそれに対応する手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:15:17 GMT)
Autoregressive Adversarial Post-Training for Real-Time Interactive Video Generation [36.0] 既存の大規模ビデオ生成モデルは計算集約的である。
本稿では,事前学習した遅延ビデオ拡散モデルをリアルタイムな対話型ビデオ生成器に変換するための自己回帰逆行後訓練を提案する。
モデルでは1つのニューラルファンクション評価を用いて1回に1つの潜在フレームを自動回帰的に生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:04:23 GMT)
eFlesh: Highly customizable Magnetic Touch Sensing using Cut-Cell Microstructures [35.9] eFleshセンサーの構築には,3Dプリンタ,既製の磁石,希望形状のCADモデル,磁力計回路基板の4つのコンポーネントしか必要としない。
本研究では,コンベックスOBJ/STLファイルを3Dプリント可能なSTLに変換するオープンソース設計ツールを提案する。
センサキャラクタリゼーション実験により,eFleshは0.5mmの接触局在RMSE,通常の力は0.27N,せん断力は0.12Nの力予測RMSEの能力を示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:46 GMT)
MOSAIC: Multiple Observers Spotting AI Content [35.7] 大規模言語モデル(LLM)は大規模に訓練され、強力なテキスト生成能力を備えている。
本研究では,人文テキストから人工的に生成したテキストを自動的に識別する手法を提案する。
種々のジェネレータLSMを用いて実験を行った結果,本手法は各モデルの強度を効果的に活用できることが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:13:33 GMT)
Why Are Web AI Agents More Vulnerable Than Standalone LLMs? A Security Analysis [35.6] 本研究では,WebAIエージェントの脆弱性の増加に寄与する要因について検討する。
我々は,WebAIエージェントの脆弱性を増幅する3つの重要な要因,(1)ユーザの目標をシステムプロンプトに埋め込んだこと,(2)マルチステップアクション生成,(3)観察能力の3つを特定した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:01:49 GMT)
Follow the Energy, Find the Path: Riemannian Metrics from Energy-Based Models [35.5] 本稿では,事前学習したエネルギーベースモデルから直接リーマン計量を導出する手法を提案する。
これらの測度は空間的に異なる距離を定義し、測地学の計算を可能にする。
EBM由来のメトリクスは、確立されたベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:22:23 GMT)
COGENT: A Curriculum-oriented Framework for Generating Grade-appropriate Educational Content [35.4] COGENTは、カリキュラム指向の教育コンテンツを生成するためのフレームワークである。
3つのカリキュラムコンポーネント(科学概念、コアアイデア、学習目標)を組み込んでいます。
我々は、長さ、語彙、文の複雑さを通じて可読性を制御する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:27:50 GMT)
Debunk and Infer: Multimodal Fake News Detection via Diffusion-Generated Evidence and LLM Reasoning [34.8] フェイクニュース検出のためのDebunk-and-Inferフレームワークを提案する。
DIFNDは条件付き拡散モデルの生成強度と多モーダル大言語モデルの協調推論能力を統合する。
FakeSVとFVCデータセットの実験は、DIFNDが既存のアプローチを上回るだけでなく、信頼できる決定を下していることを示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:08:43 GMT)
Learning to Collaborate Over Graphs: A Selective Federated Multi-Task Learning Approach [34.8] 本稿では,クライアント毎にパーソナライズされた学習を可能にするために,クライアント間の類似性を活用した新しいマルチタスク学習手法を提案する。
本稿では,クライアントのローカルクラスから学んだ特徴を要約したコンパクトなベクトル表現である特徴アンカーを導入する通信効率の高いスキームを提案する。
さらに、クライアントは分類ヘッド、軽量の線形層を共有し、グラフベースの正規化を実行し、クライアント間のコラボレーションを可能にする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:39:18 GMT)
Towards Multi-modal Graph Large Language Model [34.7] マルチモーダルグラフ大言語モデル(MG-LLM)の可能性を探り,多様なマルチモーダルグラフデータやタスクを統一・一般化する。
1)マルチモーダルな構造と属性の統一空間,2)多様なマルチモーダルなグラフタスクを扱う能力,3)マルチモーダルなインコンテキスト学習,4)自然言語とのマルチモーダルなグラフインタラクション,5)マルチモーダルなグラフ推論。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:41:29 GMT)
ScaleLSD: Scalable Deep Line Segment Detection Streamlined [34.3] 本稿では,画像中の線形状評価のための線分検出(Line Segment Detection,LSD)の問題点について検討する。
LSDのスケーラブルな自己教師型学習に焦点をあてて、私たちは(ディープで非ディープな)LSDアプローチの基本設計を再検討し、合理化します。
われわれのScaleLSDは、先駆的な非ディープLSDアプローチよりもはるかに多くの線分を自然画像から検出できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:34:21 GMT)
Optimization over Sparse Support-Preserving Sets: Two-Step Projection with Global Optimality Guarantees [34.2] スパース最適化では、$ell_$ pseudo-normを使ってハード制約を強制することは、制御されたスパーシリティのような利点を提供する。
多くの現実世界のアプリケーションは、余分な制約だけでなく、余分な制約も要求します。
本稿では,これらの制約をカスタマイズした2ステップのプロジェクション演算子を備えた,保存困難な反復アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:46:49 GMT)
Large Language Models for Outpatient Referral: Problem Definition, Benchmarking and Challenges [34.1] 大規模言語モデル(LLM)は、医療システム全体にわたる外来の紹介業務にますます適用されている。
有効性を評価するための標準化された評価基準が欠如している。
このようなシステムに特化して設計された包括的評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:45:52 GMT)
LEMUR Neural Network Dataset: Towards Seamless AutoML [34.0] LEMURは、さまざまなアーキテクチャのためのよく構造化されたコードを持つニューラルネットワークモデルのオープンソースデータセットである。
LEMURは、一貫性を維持しながら、新しいデータセットとモデルへのシームレスな拡張を可能にする。
LEMUR VR拡張は、バーチャルリアリティーにおけるモデルのシームレスなデプロイを可能にし、リソース制約のあるデバイス上でのパフォーマンスを最適化する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:16:41 GMT)
Non-Contact Health Monitoring During Daily Personal Care Routines [33.9] リモート光胸腺撮影(r)は、生理的信号の非接触で連続的なモニタリングを可能にする。
240の同期RGBと、21人の参加者による赤外線(IR)顔画像を含む、最初の長期rラーニングデータセットを提示する。
実験により、RGBとIRビデオの入力を組み合わせることで、非接触的な生理的モニタリングの精度と堅牢性が向上することが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:29:21 GMT)
Lost in Sequence: Do Large Language Models Understand Sequential Recommendation? [33.9] 大きな言語モデル(LLM)は、高度なテキスト理解能力とコンテキスト認識のおかげで、推奨のための有望なツールとして登場した。
本稿では,事前学習したSRecモデルから抽出したユーザ表現をLLMに蒸留することにより,LLMへのシーケンシャル情報の統合を向上する手法を提案する。
実験の結果, LLM-SRecは, ユーザの項目間相互作用の系列を理解する能力を高め, 最終的にレコメンデーション性能の向上につながることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:41:16 GMT)
VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use [33.8] VTool-R1は、視覚言語モデルを訓練し、思考のマルチモーダル連鎖を生成する最初のフレームワークである。
VTool-R1はPythonベースのビジュアル編集ツールをReinforcement Learning Finetuningプロセスに統合する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:47:49 GMT)
Monet: Mixture of Monosemantic Experts for Transformers [33.8] トランスフォーマー(Monet)アーキテクチャのためのモノセマンティックエキスパート(Mixture of Monosemantic Experts)を紹介する。
Monetはスパース辞書学習を直接エンドツーエンドのMixture-of-Expertsプリトレーニングに組み込む。
本分析は,専門家間の知識の相互排他性を示し,各専門家にカプセル化されたパラメトリック知識を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:36:27 GMT)
HopaDIFF: Holistic-Partial Aware Fourier Conditioned Diffusion for Referring Human Action Segmentation in Multi-Person Scenarios [33.6] アクションセグメンテーションは、未編集のビデオをセグメントに分割し、事前に定義されたアクションセットからラベルを割り当てることを目的とした、ハイレベルなビデオ理解における中核的な課題である。
本研究では,テキスト参照誘導型ヒューマンアクションセグメンテーションを多人数設定で開発する。
RHAS133は133本の映画から作成され、33時間のビデオデータによる137のきめ細かいアクションで注釈付けされている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:13:18 GMT)
TAMO:Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent with Multi-Modality Observation Data in Cloud-Native Systems [33.6] 大規模言語モデル(LLM)は、コンテキスト推論とドメイン知識の統合においてブレークスルーをもたらした。
細粒度根本原因解析のための多モード観測データ,すなわちTAMOを用いたツール支援LLMエージェントを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:57:02 GMT)
GIQ: Benchmarking 3D Geometric Reasoning of Vision Foundation Models with Simulated and Real Polyhedra [33.5] 本稿では,視覚モデルと視覚言語基礎モデルの幾何学的推論能力を評価するためのベンチマークであるGIQを紹介する。
GIQは224種類の多面体からなる合成および実世界の画像からなる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:23:29 GMT)
Beyond Nash Equilibrium: Bounded Rationality of LLMs and humans in Strategic Decision-making [33.3] 大規模言語モデルは、戦略的意思決定設定にますます使われている。
行動ゲーム理論研究に適応した実験パラダイムを用いて,LLMと人間を比較した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:43:54 GMT)
SemanticSplat: Feed-Forward 3D Scene Understanding with Language-Aware Gaussian Fields [33.1] ホロスティックな3Dシーン理解は、拡張現実やロボットインタラクションといったアプリケーションには不可欠だ。
既存のフィードフォワード3Dシーン理解手法(例えば、LSM)は、シーンから言語ベースのセマンティクスを抽出することに限定されている。
フィードフォワード型セマンティック3D再構成手法であるSemanticSplatを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:56:39 GMT)
Less is More: DocString Compression in Code Generation [32.4] LLM(Large Language Models)は、関数/メソッドシグネチャとDocStringを実行可能なコードに変換するために使用される。
プロンプト圧縮の最近の進歩は自然言語処理(NLP)において有望な結果を示しているが、コード生成への適用性はまだ不明である。
コード生成のためのDocString圧縮専用の新しい圧縮手法であるShortenDocを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:25:03 GMT)
Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency [32.2] 本稿では、駆動ビデオとLiDARシーケンスの合同生成のための統一的なフレームワークを提案する。
我々は,3D-VAEモダリティにDiTベースのビデオ拡散モデルを統合する2段階アーキテクチャと,NeRFベースのレンダリングと適応サンプリングを備えたBEV対応LiDARジェネレータを用いる。
構造化セマンティクスで生成をガイドするために,シーンレベルとインスタンス言語を統括する視覚レベルモデル上に構築されたキャプションモジュールであるDataCrafterを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:38:38 GMT)
Auto-Regressive vs Flow-Matching: a Comparative Study of Modeling Paradigms for Text-to-Music Generation [32.1] 最先端システム(SOTA)は、トレーニングデータセット、モデリングパラダイム、アーキテクチャ選択など、多くの領域で大きく異なる。
本研究はモデリングパラダイムにのみ焦点をあてる。
自動回帰デコーディングと条件付きフローマッチングという,最も一般的な2つのモデリングパラダイムを比較した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:09:05 GMT)
DeepTraverse: A Depth-First Search Inspired Network for Algorithmic Visual Understanding [32.0] 本稿では,アルゴリズム検索戦略に触発された新しい視覚アーキテクチャであるDeepTraverseを紹介する。
我々は,DeepTraverseが高度に競争力のある分類精度と頑健な特徴識別を実現していることを示す。
我々の研究は、このようなアルゴリズムの事前を統合することで、より効率的で高性能で構造化された視覚バックボーンを構築するための原則的かつ効果的な戦略が提供されることを実証している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:04:45 GMT)
Using Sign Language Production as Data Augmentation to enhance Sign Language Translation [31.8] 手話データセットは、しばしば話される言語データセットよりも桁違いに小さい。
我々は手話生産の最近の進歩を活用して既存の手話データセットを強化することを提案する。
提案手法は,既存のデータセットを効果的に拡張し,手話翻訳モデルの性能を最大19%向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:56:51 GMT)
Temporal-Guided Spiking Neural Networks for Event-Based Human Action Recognition [31.5] 本稿では、プライバシ保護人間行動認識(HAR)のための、ニューラルネットワーク(SNN)とイベントベースのカメラとの有望な相互作用について検討する。
時間セグメントベースSNN(textitTS-SNN)と3D畳み込みSNN(textit3D-SNN)の2つの新しいフレームワークを紹介した。
イベントベースHARにおけるさらなる研究を促進するため、高解像度のCeleX-Vイベントカメラを用いて収集したデータセット、textitFallingDetection-CeleXを作成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:19:19 GMT)
PersonaLens: A Benchmark for Personalization Evaluation in Conversational AI Assistants [31.5] タスク指向AIアシスタントのパーソナライゼーションを評価するベンチマークであるPersonaLensを紹介する。
本ベンチマークでは,リッチな嗜好とインタラクション履歴を備えた多様なユーザプロファイルと,2つの特殊なLDMベースのエージェントを特徴とする。
我々は、そのパーソナライゼーション能力に顕著な多様性を明らかにし、会話型AIシステムを進化させる上で重要な洞察を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:16:07 GMT)
RConE: Rough Cone Embedding for Multi-Hop Logical Query Answering on Multi-Modal Knowledge Graphs [30.9] 知識グラフ上で応答するマルチホップクエリは、クエリに応答するために、開始ノードから1つ以上のホップをトラバースする。
本稿では,クエリに応答するために必要なマルチモーダル情報をキャプチャする埋め込み手法RConEを提案する。
MMKGを問合せする論理構造を初めて導入し,その答えとしてマルチモーダルエンティティのサブエンティティを含む問合せに答える。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:52:33 GMT)
SkipVAR: Accelerating Visual Autoregressive Modeling via Adaptive Frequency-Aware Skipping [30.9] 生成プロセスにおける高周波コンポーネント、または後続のステップは、推論遅延に不均等に寄与する。
ステップ冗長性と非条件分岐冗長性の2つの主要な非効率性の原因を同定する。
本稿では、不要な生成ステップを選択的に省略して効率を向上させる自動ステップスキッピング戦略を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:58:42 GMT)
MVGBench: Comprehensive Benchmark for Multi-view Generation Models [30.6] マルチビュー画像生成モデル(MVG)の総合ベンチマークであるMVGBenchを提案する。
MVGBenchは幾何学・テクスチャ・画質・意味論の3次元一貫性を評価する(視覚言語モデルを用いた)
得られたベストプラクティスを用いて,評価されたMVGを3次元一貫性で上回る手法であるViFiGenを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:02:40 GMT)
On a few pitfalls in KL divergence gradient estimation for RL [30.6] LLMのRLトレーニングにおいて,KL偏差の勾配推定を実装する際の落とし穴がいくつか指摘されている。
最初の大きな落とし穴は、KLの発散を最小限に抑える損失関数としてKLの推定を通じて区別することである。
このような実装は一般に誤りであり、所望のKL勾配を生成できないことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:43:33 GMT)
Quantum resources in resource management systems [30.4] 本稿では,既存のワークロード管理システムを用いた量子リソース制御のための設計アーキテクチャと参照実装について述べる。
我々は、オンプレミスとクラウドの量子コンピューティングリソースを既存の高性能コンピューティングセンターに統合できるSlurm用のプラグイン群を紹介した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:29:49 GMT)
CRITICTOOL: Evaluating Self-Critique Capabilities of Large Language Models in Tool-Calling Error Scenarios [30.2] 大規模な言語モデルが外部ツールを利用する能力により、ますます多様なタスクに対処できるようになった。
タスクがより複雑で長期的になると、複雑なツール利用プロセスが様々な予期せぬエラーを引き起こす可能性がある。
このようなエラーの特定、診断、回復など、効果的に対処する方法が、ツール学習を進める上で重要な研究方向として現れている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:18 GMT)
On Finetuning Tabular Foundation Models [29.8] TabPFNv2は、小規模データセット上の従来のGBDTベースのメソッドよりも優れたパフォーマンスを主張する。
多様なデータセットに対してTabPFNv2の様々な微調整戦略を評価する。
実験対象の問合せ表現の点生成物は, 勾配適応後, 目標の類似性をより正確に反映していることから, 微調整の成功が示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:47:49 GMT)
On the development of an AI performance and behavioural measures for teaching and classroom management [29.7] 本稿では,授業のダイナミクスを解析するためのAI駆動型尺度の開発に焦点をあてた2年間の研究プロジェクトについて述べる。
主な成果としては、キュレートされたオーディオビジュアルデータセット、新しい行動測定、概念実証教育レビューダッシュボードなどがある。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:52:50 GMT)
Application-Driven Value Alignment in Agentic AI Systems: Survey and Perspectives [29.5] 本稿では、特定のアプリケーションシナリオにおけるエージェントシステムの値アライメントについてレビューする。
大規模なモデルによって駆動されるAIの進歩と、社会的ガバナンスの要求を統合する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:25:38 GMT)
PerfTracker: Online Performance Troubleshooting for Large-scale Model Training in Production [29.5] PerfTrackerは、きめ細かいプロファイリングを利用する最初のオンライントラブルシューティングシステムである。
PerfTrackerはO(10,000)の大規模GPUクラスタの運用サービスとしてデプロイされている。
様々な難しいパフォーマンスの問題を診断するために使われてきた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:20:40 GMT)
AI Agent Behavioral Science [29.3] AIエージェント行動科学は、行動の体系的な観察、仮説をテストするための介入の設計、そしてAIエージェントが時間とともにどのように行動し、適応し、相互作用するかの理論的指導による解釈に焦点を当てている。
我々は、個々のエージェント、マルチエージェント、人間とエージェントのインタラクション設定にまたがる研究の体系化を行い、この視点が、公正さ、安全性、解釈可能性、説明責任、プライバシーを行動特性として扱うことによって、責任あるAIにどのように影響を与えるかを実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:50:20 GMT)
Marrying Autoregressive Transformer and Diffusion with Multi-Reference Autoregression [29.1] 本稿では,Autoregressive (AR) Transformerと拡散モデルを組み合わせた最初の画像生成モデルであるTransDiffを紹介する。
TransDiffはラベルと画像を高レベルのセマンティックな特徴にエンコードし、拡散モデルを用いて画像サンプルの分布を推定する。
ImageNet 256x256ベンチマークでは、TransDiffはスタンドアロンのARトランスフォーマーや拡散モデルに基づいて、他の画像生成モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:50:31 GMT)
The Computational Advantage of Depth: Learning High-Dimensional Hierarchical Functions with Gradient Descent [29.0] 本稿では,潜在部分空間次元の階層構造を組み込んだ対象関数のクラスを紹介する。
深層ネットワークの学習力学と一般化性能を,高次元限界における浅層ネットワークと比較して解析的に検討した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:59:36 GMT)
Towards Better Code Generation: Adaptive Decoding with Uncertainty Guidance [29.0] 我々はShannon Entropyを介して定量化されたトークンレベルの不確実性によって導かれる適応デコードフレームワークであるAdaDecを紹介する。
AdaDecは従来のビームサーチよりも15.5%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:29:51 GMT)
Dynamic Diffusion Schrödinger Bridge in Astrophysical Observational Inversions [28.9] 動的天体物理系の文脈における拡散シュリンガーブリッジ(DSB)モデルについて検討した。
本稿では、天体物理の力学に最適化された対の領域仮定を持つDSBの変種であるAstro-DSBモデルを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:43:38 GMT)
The Less You Depend, The More You Learn: Synthesizing Novel Views from Sparse, Unposed Images without Any 3D Knowledge [28.5] 一般化可能な新規ビュー合成(NVS)の問題を考える。
NVSは、シーンごとの最適化なしにスパースやアンポーズされた2D画像から新しいビューを生成することを目的としている。
我々は,3次元誘導バイアスを最小限に抑え,入力とターゲットの両方のビューに依存性を生じさせる新しいNVSフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:57:08 GMT)
NestQuant: Nested Lattice Quantization for Matrix Products and LLMs [28.5] 学習後量子化(PTQ)は,大規模言語モデル(LLM)の効率的な展開のための重要な手法として登場した。
この研究は、自己相似ネスト格子に基づくウェイトとアクティベーションのための新しいPTQスキームであるNestQuantを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:01:15 GMT)
Omni-DPO: A Dual-Perspective Paradigm for Dynamic Preference Learning of LLMs [28.4] Omni-DPOは、各選好ペアの固有品質とそれらのペア上でのモデルの進化性能を考慮に入れた双対パースペクティブ最適化フレームワークである。
様々なモデルとベンチマークの実験結果から,Omni-DPOの優位性と一般化能力が示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:58:05 GMT)
Enhancing Low-Cost Video Editing with Lightweight Adaptors and Temporal-Aware Inversion [28.4] 本稿では,時間空間的・意味的一貫性をBaliteral DDIMインバージョンと統合するフレームワークを提案する。
MSR-VTTデータセットで示すように,本手法は知覚品質,テキスト画像アライメント,時間的コヒーレンスを大幅に改善する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:23:47 GMT)
DAVSP: Safety Alignment for Large Vision-Language Models via Deep Aligned Visual Safety Prompt [27.9] LVLM(Large Vision-Language Models)は、様々なアプリケーションで顕著な進歩を遂げているが、悪意のあるクエリには弱いままである。
既存のアライメントアプローチは、悪意のあるクエリを効果的に保存しながら、悪意のあるクエリに抵抗することができない。
本稿では、入力画像の周囲にトレーニング可能なパディング領域を付加するDeep Aligned Visual Safety Prompt (DAVSP)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:06:41 GMT)
Whoever Started the Interference Should End It: Guiding Data-Free Model Merging via Task Vectors [27.8] textbfWUDI-Merging(textbfWhoever started the interference shotextbfUld entextbfD textbfIt)は、追加データや再スケーリング係数なしで干渉を排除するモデルマージ手法である。
視覚と言語ベンチマークの総合的な経験的評価は、我々の方法の優位性を示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:50:16 GMT)
Autonomous Imagination: Closed-Loop Decomposition of Visual-to-Textual Conversion in Visual Reasoning for Multimodal Large Language Models [27.8] MLLM(Multimodal Large Language Models)は、一見単純な視覚的タスクに対処する。
これらのタスクは、視覚からテキストへの変換能力に挑戦する。
本稿では,MLLMが視覚入力を反復的に修正できるように,自律的想像力というアプローチを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:49:11 GMT)
Sentence-level Reward Model can Generalize Better for Aligning LLM from Human Preference [27.2] 我々は各文にスコアを割り当て、中間粒度の報酬モデルを導入することを提案する。
すべての文のスコアを応答レベルスコアに集約する新しい注意機構が導入された。
提案手法はRewardBench上で応答レベル報酬モデルを2.7%向上させる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:42:58 GMT)
SHIELD: Multi-task Multi-distribution Vehicle Routing Solver with Sparsity and Hierarchy [26.7] 疎性と階層性の両方の原則を活用する新しいモデルであるShielDを紹介する。
より優れた局所表現を生成するために,問題における階層構造の存在を活かしたコンテキストベースのクラスタリング層を開発する。
提案手法は, 実世界の9つの地図において, 16種類のVRPのバリエーションを持つ既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:43:18 GMT)
Design Patterns for Securing LLM Agents against Prompt Injections [26.6] インジェクション攻撃は 自然言語入力に対する エージェントの弾力性を利用してる
本稿では,AIエージェントのインジェクションに対する抵抗性を証明可能な設計パターンのセットを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:20:58 GMT)
Through a Steerable Lens: Magnifying Neural Network Interpretability via Phase-Based Extrapolation [26.5] 本稿では,ネットワーク勾配を無限小運動の形式として扱うことにより,クラス間の暗黙の経路を可視化する新しいフレームワークを提案する。
合成と実世界の両方のデータセットの実験では、フェーズ中心の補間が知覚的に整合し、意味的に意味のある変換をもたらすことが示されている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:26:42 GMT)
Rethinking Text-based Protein Understanding: Retrieval or LLM? [26.3] タンパク質テキストモデルは、タンパク質の生成と理解において大きな注目を集めている。
現在のアプローチでは、タンパク質関連の知識を、継続した事前学習とマルチモーダルアライメントを通じて、大きな言語モデルに統合することに重点を置いている。
そこで本研究では,タンパク質間テキスト生成のための微調整LDMを著しく上回り,学習不要シナリオにおける精度と効率性を示す検索強化手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:48:34 GMT)
Discovering Forbidden Topics in Language Models [26.2] トークンプリフィルを用いて禁止トピックを見つけるための拒絶探索手法を開発した。
我々は、公共安全チューニングデータを備えたオープンソースモデルTulu-3-8BのIPCをベンチマークした。
我々の発見は、AIシステムのバイアス、バウンダリ、アライメント障害を検出するために、リファリング法が重要な必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:52:27 GMT)
RecipeGen: A Step-Aligned Multimodal Benchmark for Real-World Recipe Generation [26.2] レシピベースのText-to-Image (T2I), Image-to-Video (I2V), Text-to-Video (T2V) 生成のための,最初の大規模実世界のベンチマークであるRecipeGenを紹介する。
RecipeGenには、レシピ26,453件、画像196,724件、ビデオ4,491件が含まれており、さまざまな材料、調理手順、スタイル、料理の種類をカバーしている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:08:22 GMT)
Knowledge Graphs are all you need: Leveraging KGs in Physics Question Answering [26.1] 質問回答タスクに対するモデル応答品質の向上を目的としたパイプラインを導入する。
LLMを用いて質問の内部ロジックをキャプチャする知識グラフを構築することにより、これらのグラフはサブクエストの生成をガイドする。
その結果,知識グラフから派生したサブクエストは,元の質問の論理に対する忠実度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:43:44 GMT)
CoLMbo: Speaker Language Model for Descriptive Profiling [26.1] 話者認識システムは、しばしば分類タスクに限られ、詳細な話者特性を生成するのに苦労する。
本稿では、話者エンコーダとプロンプトベースの条件付けを統合することで、これらの制約に対処する話者言語モデル(SLM)であるCoLMboを紹介する。
CoLMboはユーザ定義のプロンプトを利用して、新しい話者特性に動的に適応し、カスタマイズされた記述を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:50:16 GMT)
Leveraging LLMs to Evaluate Usefulness of Document [26.0] 本稿では,ユーザの検索コンテキストと行動データを大規模言語モデルに統合する,新たなユーザ中心評価フレームワークを提案する。
本研究は,文脈情報や行動情報に精通したLLMが有用性を正確に評価できることを実証する。
また,本手法で作成したラベルをユーザ満足度予測に適用し,実世界の実験により,これらのラベルが満足度予測モデルの性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:47:20 GMT)
Natural Language Guided Ligand-Binding Protein Design [26.0] 本稿では,自然言語の指示に従うタンパク質生成モデルのファミリーであるInstructProを提案する。
InstructProは特定の命令と機能的に整合したタンパク質配列を生成する。
InstructPro-1B(10億のパラメータを持つ)とInstructPro-3B(30億のパラメータを持つ)の2つのモデル変異をトレーニングします。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:15:22 GMT)
LLM-to-Phy3D: Physically Conform Online 3D Object Generation with LLMs [26.0] LLM-to-Phy3Dは、既存のLCM-to-3Dモデルで、その場で適合した3Dオブジェクトを生成できる、物理的に適合したオンライン3Dオブジェクト生成である。
LLM-to-Phy3Dの体系的評価は、車両設計最適化におけるアブレーション研究によって支持され、様々なLCMの改善が4.5%から106.7%向上した。
奨励的な結果は、科学や工学の応用にLLM-to-Phy3Dを物理AIに応用する可能性を示唆している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:06:21 GMT)
Synergizing Reinforcement Learning and Genetic Algorithms for Neural Combinatorial Optimization [25.6] 本稿では,DRLの学習効率をGAのグローバル検索能力と相乗化するための進化的拡張機構を提案する。
EAMは、学習されたポリシーからソリューションを生成し、クロスオーバーや突然変異といったドメイン固有の遺伝子操作によってそれらを精製することで機能する。
EAMは、アテンションモデル、POMO、SymNCOのような最先端のDRLソルバとシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:17:30 GMT)
MIRA: Medical Time Series Foundation Model for Real-World Health Data [25.5] 医用時系列の統一基盤モデルは、アノテーションの負担を軽減し、モデルのカスタマイズを最小化し、堅牢な転送を可能にする。
医療時系列の予測に特化して設計された統合基盤モデルであるMIRAを紹介する。
MIRAは、他のゼロショットベースラインや微調整ベースラインと比較して、アウト・オブ・ディストリビューションとイン・ディストリビューションのシナリオで平均10%と7%の誤差を予測できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:03:59 GMT)
CASPER: A Large Scale Spontaneous Speech Dataset [25.4] 本稿では,自発音声データの不足に対処するための基礎研究として,我々のデータセットと方法論を紹介する。
今後このデータセットを拡大し、研究コミュニティのためのリソースを拡大する予定です。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:02:37 GMT)
Video2BEV: Transforming Drone Videos to BEVs for Video-based Geo-localization [25.4] 我々は、新しいビデオベースドローンジオローカライズタスクを定式化し、Video2BEVパラダイムを提案する。
このパラダイムは、ビデオをBird's Eye View (BEV)に変換し、その後のtextbfinter-platformマッチングプロセスを簡素化する。
提案手法を検証するために,新しいビデオベースジオローカライゼーションデータセットUniVを導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:51:01 GMT)
Neural Functions for Learning Periodic Signal [25.3] 本稿では,計測から周期パターンを抽出し,その情報を利用して信号を表現する新しいネットワークアーキテクチャを提案する。
偏微分方程式の周期解の学習を含む包括的実験により提案手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:52:01 GMT)
AskToAct: Enhancing LLMs Tool Use via Self-Correcting Clarification [25.3] AskToActは、クエリとツールの実行ソリューションの間の構造的マッピングを利用する。
クエリから重要なパラメータを体系的に取り除き,それらを根拠として保持することにより,高品質なトレーニングデータの自動構築を可能にする。
我々のフレームワークは、異なるモデルアーキテクチャにわたって堅牢なパフォーマンスを示し、追加のトレーニングなしで完全に見えないAPIに一般化することに成功しています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:06:37 GMT)
The Secure Overview and Analysis OF 3GPP MAC CE [25.0] MAC CEはMAC層に位置する制御信号の一種であるネットワークプロトコルに導入された。
本稿ではMAC CEに対するセキュリティの脅威とそれに対応する保護機構について検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:24:21 GMT)
AlignHuman: Improving Motion and Fidelity via Timestep-Segment Preference Optimization for Audio-Driven Human Animation [24.7] 提案する textbfAlignHuman は,事前参照最適化をポストトレーニング手法と分割/コンカレントトレーニング戦略を組み合わせたフレームワークである。
LoRAは、それぞれの嗜好データを用いて訓練され、推論中に対応する間隔で活性化され、動きの自然性と忠実性を高める。
実験の結果、AlignHumanは強いベースラインを改善し、推論中にNFEを削減し、3.3$times$ Speedupを達成した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:33:03 GMT)
Meet Me at the Arm: The Cooperative Multi-Armed Bandits Problem with Shareable Arms [24.6] 本研究では,非センシング環境下での分散マルチプレイヤーマルチアームバンディット(MMAB)問題について検討する。
腕を引っ張る選手の数がその能力を超えると、関係者は全員無報酬となる。
A-CAPELLA(Algorithm for Capacity-Aware Parallel Elimination for Learning and Allocation)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:14:32 GMT)
Consistent Story Generation with Asymmetry Zigzag Sampling [24.5] 非対称なプロンプトとビジュアルシェアリングを備えたZigzag Smplingと呼ばれる新しいトレーニング不要サンプリング戦略を導入する。
提案手法は、非対称なプロンプト間の交互に対象特性を保持するジグザグサンプリング機構を提案する。
本手法は,コヒーレントで一貫した視覚的ストーリーの生成において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:14:27 GMT)
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test [24.4] APIプロバイダは、コスト削減やモデル動作の不正な変更のために、量子化または微調整の亜種を慎重に提供することができる。
そこで我々は,ブラックボックスLLMの挙動等式を局所的に展開した認証モデルに検証できるランクベース均一性試験を提案する。
我々は、量子化、有害な微調整、脱獄プロンプト、完全なモデル置換など、さまざまな脅威シナリオに対するアプローチを評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:04:10 GMT)
Do LLMs Give Psychometrically Plausible Responses in Educational Assessments? [24.3] テスト受験者が教育評価の項目にどう答えるかを知ることは、テスト開発に不可欠である。
大型言語モデル(LLM)がテスト項目に対する人間的な反応を示す場合、テスト開発を加速するためにパイロット参加者として使用する可能性が開ける可能性がある。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:41:10 GMT)
Steps are all you need: Rethinking STEM Education with Prompt Engineering [24.3] シュートとチェーン・オブ・ワートのプロンプトは、物理学的質問回答タスクに適用すると、有望であることが示されている。
物理質問回答タスクに適用された場合、ほとんどショットやチェーン・オブ・ソートのプロンプトは期待できない。
The Mixture of Experts (MoE) Model, as analogical prompting, we can be shown improve model performance。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:47:23 GMT)
Scalable Non-Equivariant 3D Molecule Generation via Rotational Alignment [24.1] このような等変制約を緩和する手法を提案する。
非同変拡散モデルが整列表現上で訓練される。
実験結果から,本手法は従来報告した非同変モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:23:56 GMT)
GigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture [24.0] 本稿では,ロシア大言語モデル(LLM)のGigaChatファミリーを紹介する。
モデルアーキテクチャ、事前学習プロセス、および設計選択をガイドするための実験に関する詳細なレポートを提供する。
本稿では,API,Telegramボット,Webインターフェースを通じてアクセス可能なトップパフォーマンスモデルのシステムデモを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:46:49 GMT)
Human-like object concept representations emerge naturally in multimodal large language models [24.0] 大規模言語モデル(LLM)における対象概念表現と人間の認知との関係を考察するために,行動解析と神経画像解析を併用した。
我々の発見は、マシンインテリジェンスに対する理解を深め、より人間的な人工知能システムの開発に報いる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:15:37 GMT)
An Online Learning Approach to Prompt-based Selection of Generative Models and LLMs [23.9] 本研究では,与えられた入力プロンプトに対して最適なデータ生成モデルを予測するためのオンライン学習フレームワークを提案する。
提案したPAK-UCBアルゴリズムは、腕に共通するコンテキスト変数を持つコンテキスト帯域(CB)設定に対処する。
実画像と画像と画像の合成モデルを用いた実験により,RFF-UCBは最適な生成モデルを特定するのに成功していることが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:24:54 GMT)
Classifying Unreliable Narrators with Large Language Models [23.8] 本稿では,複数のドメインからのナラティブを人間に注釈付けしたデータセットTUNaを提案する。
ナレーション内,ナレーション間,テキスト間不確実性の分類タスクを定義する。
実世界のテキストデータに基づいて,信頼できないナレーター分類を行うために,文献からの学習を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:17:12 GMT)
A Survey on the Role of Artificial Intelligence and Machine Learning in 6G-V2X Applications [23.8] 6Gネットワークは、コネクテッド・アンド・オートマチック・ビークル(CAV)の超信頼性、低レイテンシ、高容量接続を提供すると期待されている。
人工知能(AI)と機械学習(ML)は、V2X通信を最適化するための重要な実現手段として登場した。
この調査は、6G-V2X通信に適用されたAIとMLモデルの進歩を包括的にレビューする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:36:18 GMT)
The Four Color Theorem for Cell Instance Segmentation [23.7] 四色定理にインスパイアされた新しいセルインスタンス分割法を提案する。
隣接インスタンスが異なるラベルを受信できるようにする4色符号化方式を提案する。
この再構成は4つの予測クラスで制約付きセマンティックセグメンテーション問題を達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:33:58 GMT)
Generalization Error Analysis for Attack-Free and Byzantine-Resilient Decentralized Learning with Data Heterogeneity [23.5] 異種データを用いた非攻撃・ビザンチン弾力的な分散学習におけるきめ細粒度誤差解析について述べる。
また、悪意のあるエージェントによる攻撃がエラーに大きく影響していることも明らかにした。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:44:34 GMT)
Self-Supervised Multi-Part Articulated Objects Modeling via Deformable Gaussian Splatting and Progressive Primitive Segmentation [23.2] DeGSSは,物体を変形可能な3次元ガウス場として符号化し,幾何学,外観,動きを1つのコンパクト表現に埋め込む統一フレームワークである。
一般化とリアリズムを評価するために、合成PartNet-Mobilityベンチマークを拡張し、RGBキャプチャと正確にリバースエンジニアリングされた3Dモデルを組み合わせたリアル・トゥ・シムデータセットRS-Artをリリースする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:32:16 GMT)
Learning single-index models via harmonic decomposition [22.9] シングルインデックスモデルの学習問題について検討し、mathbbR$のラベルは未知の1次元射影を通してのみbbRd$の入力 $boldsymbolx に依存する。
展開とオンラインSGDに基づく2種類の推定器を導入し、それぞれが最適な複雑性または最適なランタイムを達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:59:53 GMT)
Rethinking Brain Tumor Segmentation from the Frequency Domain Perspective [22.8] 本稿では,脳腫瘍の分節を周波数領域の観点から再考するハーモナイズド周波数融合ネットワーク(HFF-Net)を提案する。
腫瘍領域を包括的に特徴付けるため,MRI画像を低周波成分に分離する周波数領域分解(FDD)モジュールを開発した。
腫瘍境界に対する感受性をさらに高めるため,我々は重要な高周波の詳細を適応的に強調するAdaptive Laplacian Convolution (ALC)モジュールを導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:44:51 GMT)
EditInspector: A Benchmark for Evaluation of Text-Guided Image Edits [22.8] テキスト誘導画像編集評価のための新しいベンチマークであるEditInspectorを紹介する。
我々はEditInspectorを利用して、編集評価における最先端(SoTA)ビジョンと言語モデルの性能を評価する。
以上の結果から,現在のモデルでは,編集を包括的かつ頻繁に評価することは困難であることが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:58:25 GMT)
SAFE: Multitask Failure Detection for Vision-Language-Action Models [22.7] 視覚言語アクションモデル(VLA)は、様々な操作タスクのセットにわたって有望なロボット行動を示している。
新規タスクのアウト・オブ・ボックスにデプロイすると、成功率は制限される。
本稿では,VLAなどの汎用ロボットポリシーのための障害検出ツールSAFEを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:59:13 GMT)
Generate-then-Verify: Reconstructing Data from Limited Published Statistics [22.6] 我々は、多くの可能なデータセットが公表された統計に一致し、プライベートデータセット全体を完璧に再構築することが不可能な体制に焦点を当てる。
まず、$textbfgenerates$一組のクレームを、次に$textbfverify$各クレームがすべての可能なデータセットに対して保持するかどうかを判断する、新しい整数プログラミング手法を導入します。
我々は、米国の十年国勢調査のリリースによる住宅レベルのマイクロデータに対する我々のアプローチを評価し、そのようなデータに関する情報が比較的少ない場合でも、プライバシー侵害は継続可能であることを実証した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:54:47 GMT)
Crafting Customisable Characters with LLMs: Introducing SimsChat, a Persona-Driven Role-Playing Agent Framework [22.5] 大きな言語モデル(LLM)は、命令を理解し、人間に似たテキストを生成する素晴らしい能力を示す。
実世界のキャラクターをシミュレートするためにLLMを利用するCustomisable Conversation Agent Frameworkを導入する。
我々は,様々な現実的な設定を取り入れた自由にカスタマイズ可能なロールプレイングエージェントであるSimsChatを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:18:44 GMT)
From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining [22.2] 本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:22:17 GMT)
Rethinking Diverse Human Preference Learning through Principal Component Analysis [22.1] 二項比較から多種多様な人間の嗜好を抽出するために, DRM(Decomposed Reward Models)を導入する。
DRMは好みをベクトルとして表現し、主成分分析(PCA)を用いて分析する
DRMは、意味のある好みの次元(例えば、有用性、安全性、ユーモア)を効果的に抽出し、追加のトレーニングなしで新規ユーザーに適応する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:43:13 GMT)
Class Similarity-Based Multimodal Classification under Heterogeneous Category Sets [22.0] 我々は,MMHCL (Multi-Modal Heterogeneous Category-set Learning) という実用的な設定を提案する。
提案手法は,複数のベンチマークデータセットにおいて,既存の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:49:22 GMT)
Toward Reliable AR-Guided Surgical Navigation: Interactive Deformation Modeling with Data-Driven Biomechanics and Prompts [22.0] 本稿では,計算効率を向上しつつ,FEMレベルの精度を維持するデータ駆動アルゴリズムを提案する。
変形モデリングプロセスに新たなヒューマン・イン・ザ・ループ機構を導入する。
提案アルゴリズムは, 平均目標登録誤差を3.42mmとし, ボリューム精度で最先端の手法を超越した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:34:08 GMT)
Only-Style: Stylistic Consistency in Image Generation without Content Leakage [21.7] Only-Styleは、スタイリスティックな一貫性を維持しつつ、セマンティックなコヒーレントな方法でコンテンツの漏洩を軽減するために設計された方法である。
Only-Styleは、推論中にコンテンツのリークをローカライズすることで、スタイルアライメントプロセスを制御するパラメータの適応的なチューニングを可能にする。
提案手法は,多種多様なインスタンスにまたがる広範囲な評価により,最先端の手法よりも大幅に改善されたことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:33:09 GMT)
Persona-judge: Personalized Alignment of Large Language Models via Token-level Self-judgment [21.7] ペルソナ・ジャッジ(Persona-judge)は、トレーニング不要なパーソナライズされたアライメントと、目に見えない好みのアライメントを可能にする、新しい差別的パラダイムである。
Persona-judgeは、パーソナライズされたアライメントに対して、スケーラブルで、計算的に効率的なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:31:37 GMT)
Revisiting Self-Consistency from Dynamic Distributional Alignment Perspective on Answer Aggregation [21.6] 自己整合性は、多様なサンプルを集約することで推論を改善する。
復号化温度がランダム性を制御し,応答分布を積極的に形成することを示す。
温度を動的に校正する信頼性駆動機構を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:11:03 GMT)
Reward Models Enable Scalable Code Verification by Trading Accuracy for Throughput [21.6] 結果報酬モデル(ORM)が,速度のトレーディング精度を通じて検証をスケールする上で重要な役割を担っていることを示す。
生成-帰属-ランクのアプローチを分析し、不正だが高いランクの解をフィルタリングすることで機能することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:58:21 GMT)
EfficientVLA: Training-Free Acceleration and Compression for Vision-Language-Action Models [21.4] VLA(Vision-Language-Action)モデルは、エンボディインテリジェンスに対する変換ポテンシャルを示すが、高い計算とメモリ要求によって著しく妨げられる。
本稿では,構造化およびトレーニング不要な推論促進フレームワークであるEfficientVLAを紹介する。
提案手法を標準VLAモデルであるCogACTに適用し,予測速度を1.93倍に向上し,FLOPを28.9%に削減し,SIMPLERベンチマークでは0.6%の成功率の低下に留まった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:34:57 GMT)
LLM2TEA: Agentic AI Designer Finds Innovative Objects with Generative Evolutionary Multitasking [21.2] LLM駆動型マルチタスク進化アルゴリズム(LLM2TEA)を導入する。
LLM2TEAは、複数のドメインからの設計の相互オーバーと相乗効果を促進し、個別の規律を超越する革新的なソリューションへと繋がる。
LLM2TEAは、クリエイティブなだけでなく、現実世界のアプリケーションでも機能するデザインを生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:19:51 GMT)
MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling [21.1] キャラクタビデオ合成は、ライフライクなシーン内でアニマタブルなキャラクターのリアルなビデオを作成することを目的としている。
Miloは、文字ビデオを制御可能な属性で合成できる新しいフレームワークである。
Miloは、任意のキャラクタへの高度なスケーラビリティ、新しい3Dモーションへの一般化、インタラクティブな現実世界のシーンへの適用性を実現している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:28:01 GMT)
Causal Sufficiency and Necessity Improves Chain-of-Thought Reasoning [20.9] CoT(Chain-of-Thought)は、複雑な推論機能を備えた大規模言語モデル(LLM)の実現において、必要不可欠な役割を担っている。
本稿では,CoT推論を補足と必要の両レンズで特徴付ける因果的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:22:09 GMT)
Real-time adaptive tracking of fluctuating relaxation rates in superconducting qubits [20.7] 量子ビットの緩和率を推定するための実時間ベイズ法を提案する。
2つの固定周波数超伝導トランスモン量子ビットの緩和時間変動を適応的かつ連続的に追跡する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:14:23 GMT)
Vision Matters: Simple Visual Perturbations Can Boost Multimodal Math Reasoning [20.6] 言語のみのモデルでは、生の視覚入力を消費するMLLMと同等またはそれ以上の性能が得られることを示す。
そこで我々は,アルゴリズムの修正を必要とせず,知覚の堅牢性を高めるシンプルな視覚摂動フレームワークを提案する。
本研究は,マルチモーダル数学的推論における視覚摂動の重要性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:39:46 GMT)
What is the Cost of Differential Privacy for Deep Learning-Based Trajectory Generation? [20.5] DP-SGDが最先端生成モデルの実用性にどのように影響するかを示す。
本稿では,形式的な保証と実用性への影響を評価する条件生成のための新しいDP機構を提案する。
その結果,DP-SGDは,データセットが十分に大きければ有効性は保たれるものの,性能に著しく影響を及ぼすことが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:59:52 GMT)
Decoding Knowledge Attribution in Mixture-of-Experts: A Framework of Basic-Refinement Collaboration and Efficiency Analysis [20.5] MoEモデルは、"ミッドアクティベーション、遅延増幅"パターンにより、層ごとの効率を37%向上させる。
これらの洞察はMoEの解釈可能性を高め、効率性、特殊化、堅牢性のバランスをとるための原則を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:28:53 GMT)
A First Look at Bugs in LLM Inference Engines [20.5] LLM推論エンジンにおけるバグに関する最初の実証的研究について述べる。
我々は5つの広く採用されているLLM推論エンジンの公式リポジトリをマイニングし、現実世界のバグ929の包括的なデータセットを構築した。
その結果,6つの主要なバグ症状と28の根本原因の分類が明らかとなり,バグの検出と位置に関する重要な課題に光を当てた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:25:36 GMT)
Mitigating Posterior Salience Attenuation in Long-Context LLMs with Positional Contrastive Decoding [20.5] 後天無力化(PSA)現象は,長期の経時的パフォーマンス低下と相関する。
本研究では,長時間の注意から得られるロジットと設計した局所的な注意から得られるロジットとを対比した,訓練不要な位置コントラストデコーディング(PCD)を提案する。
PCDは、長いコンテキストのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:10:44 GMT)
Attention, Please! Revisiting Attentive Probing for Masked Image Modeling [20.4] 我々は,冗長な投射を排除し,トレーニング可能なパラメータの数を減らし,従来のマルチヘッド注意よりも最大10$times$のスピードアップを実現する,効率的な探究機構(EP)を導入する。
EPはMIMをはるかに超えて様々な事前学習パラダイムを一般化し、解釈可能なアテンションマップを生成し、ローショットやレイヤーワイドの設定において強力なゲインを達成している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:10:26 GMT)
Exploring Test-Time Adaptation for Object Detection in Continually Changing Environments [20.3] 連続的テスト時間適応(CTTA)は、目標ドメインを継続的に変更するソーストレーニングモデルに徐々に適応する、有望な手法として登場した。
我々は3つのコアコンポーネントを特徴とするAMRODについて,CTTAシナリオにおける検出モデルに対するこれらの課題に対処する。
我々は,AMRODが既存の方法よりも優れている4つのCTTAオブジェクト検出タスクにおいて,AMRODの有効性を実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:51:33 GMT)
Representation Shattering in Transformers: A Synthetic Study with Knowledge Editing [20.3] 知識編集(KE)アルゴリズムは、モデルの重みを変更して、不正、時代遅れ、その他の望ましくない事実関連付けに対するターゲット更新を実行する。
我々は,KEの適用が,モデルのより広い事実的リコール精度に悪影響を及ぼし,推論能力が低下することを示す。
我々の研究は、KEがモデル能力に悪影響を及ぼす理由を説明するための正確な力学仮説をもたらす。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:29:40 GMT)
Multiverse: Your Language Models Secretly Decide How to Parallelize and Merge Generation [20.1] 並列生成が可能な新しい生成モデルであるMultiverseを導入する。
次に,データ,アルゴリズム,システムの共設計キュレーションを用いた実世界のマルチバース推論モデルを構築した。
また,Multiverse-32Bは,同じコンテキスト長を用いて,平均1.87%のAR-LLMよりも優れたスケーリング性能を示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:23 GMT)
MedMoE: Modality-Specialized Mixture of Experts for Medical Vision-Language Understanding [20.1] 診断コンテキストに基づいて視覚表現を適応する視覚言語処理フレームワークであるMedMoEを提案する。
MedMoEには、レポートタイプに条件付きMixture-of-Experts (MoE)モジュールが組み込まれている。
このフレームワークは、推論においてモダリティ固有の監督を必要とせず、テキスト記述と整合した局所的な視覚表現を生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:15:03 GMT)
ClimateViz: A Benchmark for Statistical Reasoning and Fact Verification on Scientific Charts [20.1] 専門家による科学的グラフを用いた科学的事実チェックのための,最初の大規模ベンチマークであるClimateVizを紹介する。
ClimateVizには2,896件のビジュアライゼーションに関連する49,862件のクレームが含まれている。
我々は、プロプライエタリシステムとオープンソースシステムの両方を含む最先端のマルチモーダル言語モデルをゼロショットおよび少数ショット設定で評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:49:01 GMT)
Listen, Chat, and Remix: Text-Guided Soundscape Remixing for Enhanced Auditory Experience [20.0] リステン・チャット・リミックス(Listen, Chat, and Remix, LCR)は、ユーザが提供するテキスト命令に基づいて、各音源を混合して制御する新しいマルチモーダルサウンドリミックス装置である。
ユーザーはオープン語彙のテキストプロンプトを入力し、大きな言語モデルによって解釈され、音の混合をリミックスするためのセマンティックフィルタを作成する。
システムは混合物をそのコンポーネントに分解し、セマンティックフィルタを適用し、フィルタされたコンポーネントを所望の出力に再組み立てする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:11:56 GMT)
Differentially Private Federated $k$-Means Clustering with Server-Side Data [20.0] FedDP-KMeansは$k$-meansクラスタリングのためのアルゴリズムで、完全なフェデレーションと差分プライベートである。
提案アルゴリズムは,合成および実世界のベンチマークタスクにおいて優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:31:04 GMT)
Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought [19.8] ビデオ理解は、ビデオ分析からインタラクティブシステムまで、様々な用途に不可欠である。
視覚言語モデルの発展にもかかわらず、これらのモデルはしばしば、微妙で時間的な詳細を捉えるのに苦労する。
これを解決するために、ビデオ理解を強化するために設計された画期的なデータセットであるVideo-Thoughtを紹介した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:44:26 GMT)
TACTIC: Translation Agents with Cognitive-Theoretic Interactive Collaboration [19.6] 本稿では,TACTICと呼ばれる認知情報に基づくマルチエージェントフレームワークを提案する。
ヒトの翻訳行動で観察される主要な認知過程を反映する6つの機能的に異なるエージェントから構成される。
我々の手法は一貫して最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:57:34 GMT)
A Shortcut-aware Video-QA Benchmark for Physical Understanding via Minimal Video Pairs [19.5] 本稿では,ビデオ言語モデルの物理的理解を評価するための簡易なショートカット対応ビデオQAベンチマークを提案する。
このベンチマークは、55Kの高品質なマルチチョイスビデオQAの例で構成されている。
MVPの人的パフォーマンスは92.9%、最先端の最先端ビデオ言語モデルは40.2%である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:57:32 GMT)
Time-Unified Diffusion Policy with Action Discrimination for Robotic Manipulation [19.4] 本稿では,行動認識機能を利用した時間統一拡散政策(TUDP)を提案する。
提案手法はRLBench上での最先端性能を,マルチビューで82.6%,シングルビューで83.8%と高い成功率で達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:11:49 GMT)
Q-SAM2: Accurate Quantization for Segment Anything Model 2 [19.4] 効率的なセグメンテーションモデル2(SAM2)のための高精度な低ビット量子化法を提案する。
Q-SAM2は、量子化時の重量分布と活性化分布の特異性に起因する性能劣化に対処する。
実験の結果,Q-SAM2は高精度な推論が可能であり,効率は著しく向上した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:21:38 GMT)
EmoNet-Voice: A Fine-Grained, Expert-Verified Benchmark for Speech Emotion Detection [19.4] 本稿では,音声感情検出のための新しいリソースであるEmoNet-Voiceを紹介する。
EmoNet-Voiceは、40の感情カテゴリーの細かいスペクトルでSERモデルを評価するように設計されている。
また、人間の専門家と高い合意を得て、音声感情認識の新しい標準となる共感型Insight Voiceモデルも導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:06:59 GMT)
TransXSSM: A Hybrid Transformer State Space Model with Unified Rotary Position Embedding [19.4] 状態空間モデル(SSM)は線形時間シーケンスモデリングを容易にする。
トランスフォーマーは明示的な回転位置埋め込み(RoPE)に依存し、SSMは畳み込みによって暗黙的な位置表現を利用する。
トランスフォーマー層とSSM層をコヒーレントに統合したハイブリッドアーキテクチャである textbfmodel を導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:26:51 GMT)
LLM Enhancers for GNNs: An Analysis from the Perspective of Causal Mechanism Identification [19.4] グラフニューラルネットワーク(GNN)の入力として使用されるノード表現を最適化する機能拡張器として,大規模言語モデル(LLM)を用いて検討する。
解析結果に基づいて,LLMエンハンサーとGNN間の情報伝達を改善するためのプラグアンドプレイ最適化モジュールを設計する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:16:38 GMT)
MetricHMR: Metric Human Mesh Recovery from Monocular Images [19.3] MetricHMR (Metric Human Mesh Recovery) は、モノクロ画像からの正確なグローバル翻訳によって、人間のメッシュ回復を計測するためのアプローチである。
厳密なスケールと深さの曖昧さに苦しむ既存のHMR法とは対照的に,MetricHMRは再構成結果に幾何学的に合理的な身体形状と大域的な翻訳を生成することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:39:23 GMT)
Automated Synthesis of Formally Verified Multi-Abstraction Function Summaries [19.2] 本稿では,記号実行,大規模言語モデル(LLM),および相対的最強ポストコンディション(RSP)を生成するための形式検証を組み合わせた新しいフレームワークを提案する。
我々のアプローチは、VST-Aのシンボル的実行を利用して、プログラムの実行パスと状態遷移を正確に追跡する。
生成したRSPから,ドメイン固有言語内で表現される最強の非冗長な条件を自動で合成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:33:02 GMT)
Emphasising Structured Information: Integrating Abstract Meaning Representation into LLMs for Enhanced Open-Domain Dialogue Evaluation [19.2] 本フレームワークは,意味表現学習の強化を目的としたゲーティング機構を通じて,AMRグラフ情報を統合する。
本フレームワークは,複数のデータセットにまたがる人間の判断と強い相関関係を達成し,対話評価のための新たなベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:02:28 GMT)
Improving Handwritten Text Recognition via 3D Attention and Multi-Scale Training [19.1] 本稿では,新しい3次元アテンションモジュールとグローバルなコンテキスト情報を用いて,新しい認識ネットワークを提案する。
注意機構、完全接続層、再帰ユニット、畳み込み層を含む主要な正準神経ユニットを効率的にネットワークに編成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:17:25 GMT)
Scaling Laws for Uncertainty in Deep Learning [18.9] 本稿では,データセットやモデルサイズに関して,予測の不確実性の様々な尺度に関連するスケーリング法の存在を示す。
この研究は、ベイズ的アプローチに対して繰り返される懐疑主義を追放する強力な証拠を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:09:05 GMT)
Beyond Personalization: Federated Recommendation with Calibration via Low-rank Decomposition [18.3] フェデレーションレコメンデーション(FR)は、レコメンデーションシステムにおけるユーザのプライバシを保護するための有望なパラダイムである。
グローバルに集約されたアイテムの埋め込みはユーザ埋め込みのスキューを誘導し、最適以下のパフォーマンスをもたらすことを実証的に見出した。
我々は、ユーザ埋め込みスキューを緩和し、パフォーマンス、効率、プライバシ間で望ましいトレードオフを実現するためにPFedCLRを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:51:19 GMT)
Intent Factored Generation: Unleashing the Diversity in Your Language Model [18.3] 多様性を高める方法はしばしばトークンレベルでのみ動作し、同じ応答を言い換える。
本稿では, サンプリング過程を2段階に分解するIntent Factored Generationを提案する。
本手法の有効性は,様々なタスクにまたがって実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:26:45 GMT)
Brain-wide interpolation and conditioning of gene expression in the human brain using Implicit Neural Representations [18.2] Implicit Neural Representation (INR) は空間転写学データを解析するためのツールである。
我々は、ボクセルレベルの解像度で、脳全体にわたる任意の遺伝子の完全な空間地図を作成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:03:13 GMT)
TableEval: A Real-World Benchmark for Complex, Multilingual, and Multi-Structured Table Question Answering [18.2] 既存のTableQAベンチマークは、単純なフラットテーブルにフォーカスし、データ漏洩に悩まされることがしばしばある。
現実的なTableQAタスク上でLLMを評価するために設計された新しいベンチマークであるTableEvalを紹介する。
データ漏洩のリスクを最小限に抑えるため、最近の実世界の文書からすべてのデータを収集する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:37:07 GMT)
HadaNorm: Diffusion Transformer Quantization through Mean-Centered Transformations [18.0] ポストトレーニング量子化(PTQ)は,行列演算のビット幅を削減することで,有望な解を提供する。
本稿では,既存のアプローチを拡張し,アウトレーヤを効果的に緩和する新しい線形変換法であるHadaNormを提案する。
本研究では,HadaNormが変圧器ブロックの様々な構成成分の量子化誤差を一貫して低減できることを実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:54:34 GMT)
FinTSBridge: A New Evaluation Suite for Real-world Financial Prediction with Advanced Time Series Models [17.9] 最先端の時系列予測モデルと金融資産価格を結びつける橋がまだ必要である。
ファイナンシャルドメインから3つのデータセットを構築し、最近の研究から10回の時系列予測モデルを選択した。
MSE と MAE に加えて msIC と msIR という新たな指標を開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:26:46 GMT)
LogProber: Disentangling confidence from contamination in LLM responses [17.9] 機械学習において、汚染とは、データテストがトレーニングセットにリークする状況を指す。
ブラックボックスの設定で汚染を検知できる新しい,効率的なアルゴリズムであるLogProberを紹介した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:42:54 GMT)
AcTracer: Active Testing of Large Language Model via Multi-Stage Sampling [17.9] AcTracerは,大規模言語モデル(LLM)に適した,アクティブなテストフレームワークである。
より正確な性能推定を達成するために、戦略的にテストデータの小さなサブセットを選択する。
実験の結果,AcTracerは既存手法と比較して最先端の性能を達成できた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:57:45 GMT)
An LLM-Empowered Adaptive Evolutionary Algorithm For Multi-Component Deep Learning Systems [17.8] 多目的進化アルゴリズム(MOEA)は、複雑な多成分アプリケーションにおいて最適な解を求めるために広く用いられている。
本稿では,MCDLシステムにおける安全性違反を検出する適応的進化探索アルゴリズムである$mu$MOEAを提案する。
実験の結果,$mu$MOEAは進化探索の効率と多様性を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:44:22 GMT)
VIBE: Can a VLM Read the Room? [17.7] 視覚言語モデル(VLM)はこのギャップを考慮に入れることができるが、そのような社会的手がかりに対して正しい推論を行う能力はほとんど注目されていない。
VLMのための新しいタスクとして,ビジュアルソーシャル・プラグマティック・推論を提案する。
本稿では,この課題に対するVLMの能力をテストするための高品質なデータセットを構築し,その上でのVLMの性能をベンチマークする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:07:35 GMT)
No Task Left Behind: Isotropic Model Merging with Common and Task-Specific Subspaces [17.7] モデルマージは、複数のタスク固有のモデルの重みを単一のマルチタスクモデルに統合する。
この問題に対する最近の関心にもかかわらず、シングルタスクモデルと組み合わせたモデルの間には大きなパフォーマンスギャップが残っている。
タスク固有成分とマージ行列の特異成分のアライメントは,性能改善と強く相関していることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:14:36 GMT)
UmbraTTS: Adapting Text-to-Speech to Environmental Contexts with Flow Matching [17.6] UmbraTTSは、音声と環境の両方を共同で生成するフローマッチングベースのTSモデルである。
本モデルでは,背景音量のきめ細かな制御が可能であり,多様な,一貫性のある,コンテキスト対応の音声シーンを生成できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:43:08 GMT)
Learning to Optimize Package Picking for Large-Scale, Real-World Robot Induction [17.5] 本稿では, 変態調整を予測し, サンプルピック用吸引カップの選択を改善し, 成功確率を高めるMLベースのフレームワークを提案する。
提案手法は, 大規模な倉庫自動化シナリオにおいて, サンプルベースサンプリングベースラインと比較して, ピック故障率を20%削減し, その有効性を実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:04:50 GMT)
3DGeoDet: General-purpose Geometry-aware Image-based 3D Object Detection [17.5] 3DGeoDetは幾何学を意識した新しい3Dオブジェクト検出手法である。
屋内および屋外環境では、シングルビューとマルチビューのRGBイメージを効果的に処理する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:18:36 GMT)
3D-Aware Vision-Language Models Fine-Tuning with Geometric Distillation [17.3] VLM(Vision-Language Models)は様々な視覚的・言語的タスクにおいて顕著な性能を示した。
人為的な幾何学的手がかりを予め訓練されたVLMに注入するフレームワークであるGeometric Distillationを提案する。
本手法は、自然な画像テキスト入力と互換性を保ちながら、表現を幾何学的に認識するように形成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:56:59 GMT)
Alzheimer's Dementia Detection Using Perplexity from Paired Large Language Models [17.2] アルツハイマー認知症(英語: Alzheimer's dementia、AD)は、認知機能低下を伴う神経変性疾患である。
この研究は、最近の大規模言語モデル(LLM)を用いて、AD検出のためのペアパープレキシティアプローチを拡張した。
我々は、ADReSS 2020チャレンジベンチマークの最高ランク法より平均3.33%、そして6.35%の精度を向上する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:15:13 GMT)
Causal Climate Emulation with Bayesian Filtering [17.1] 我々は因果表現学習に基づく解釈可能な気候モデルエミュレータを開発した。
安定な自己回帰エミュレーションのためのベイズフィルタを含む物理インフォームドアプローチを導出する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:00:55 GMT)
From Judgment to Interference: Early Stopping LLM Harmful Outputs via Streaming Content Monitoring [17.1] 既存のモデレータは主に従来のフル検出を実践し、完全なLLM出力に基づいて有害性を決定する。
近年の研究では、モデレーターが生成途中を監督し、有害性が検出された場合に出力を早期に停止する部分検出に注意が向けられている。
本稿では,レスポンスレベルのラベルとトークンレベルのラベルを二重に管理するストリーミングコンテンツモニタを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:58 GMT)
AWP: Activation-Aware Weight Pruning and Quantization with Projected Gradient Descent [17.0] 本稿では, 投射勾配降下法(AWP)によるアクティブ・アウェア・ウェイトプルーニングと量子化の手法を提案する。
実験により、AWPは最先端のLCMプルーニング法および量子化法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:49:46 GMT)
DIVE into MoE: Diversity-Enhanced Reconstruction of Large Language Models from Dense into Mixture-of-Experts [16.8] Mixture-of-Experts (MoE)アーキテクチャを持つ大規模言語モデル(LLM)は、パラメータのサブセットを選択的に活性化することにより、高いコスト効率を達成する。
MoE LLMの推論効率にもかかわらず、スクラッチからの豊富な専門家の訓練はかなりのオーバーヘッドを引き起こす。
DIVEという多様性向上手法を提案する。
DIVEはトレーニング効率を最小限の精度で達成し、既存のプルーニング法とMoE再構成法を同じ数のアクティベートパラメータで上回る。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:05:24 GMT)
ContentV: Efficient Training of Video Generation Models with Limited Compute [16.7] ContentVはテキスト・ツー・ビデオのモデルであり、テキスト・プロンプトから複数の解像度と期間にわたる多様な高品質のビデオを生成する。
256 x 64GBのニューラルプロセッシングユニット(NPU)を4週間訓練した後、最先端のパフォーマンス(VBenchでは85.14)を達成した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:48:38 GMT)
Textual Bayes: Quantifying Uncertainty in LLM-Based Systems [16.4] 大規模言語モデル(LLM)は、現実世界の課題を解決する能力がますます高まっている。
不確実性を正確に定量化することは 重要な問題です
この課題は、多くの最先端のLCMのクローズドソース、ブラックボックスの性質によって複雑化されている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:00 GMT)
IGraSS: Learning to Identify Infrastructure Networks from Satellite Imagery by Iterative Graph-constrained Semantic Segmentation [16.4] 多くのインフラネットワークは、ソースへの到達性(運河など)や接続性(道路など)などのグラフレベルの特性を持ち、これらの既存の真実を改善するために利用することができる。
本稿では,RGBを含むセマンティックセグメンテーションモジュールと追加モダリティ(NDWI, DEM)をグラフベースの地上構造改善モジュールと組み合わせた,新しい反復的フレームワークIGraSSを開発する。
実験の結果、IGraSSは到達不能な管の分節を約18%から3%に減らし、改良された地中真実による訓練は管の識別を著しく改善することがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:45:23 GMT)
Hearing Hands: Generating Sounds from Physical Interactions in 3D Scenes [16.4] シーンと物理的に相互作用する人間の手の音を予測できるのか?
我々は、手を使って3Dシーン内で物体を操作する映像を録画する。次に、このアクション・サウンド・ペアを使って、修正された流れモデルのトレーニングを行い、3Dハンド・トラジェクトリを対応するオーディオにマッピングする。
テスト時にユーザは、手ポーズのシーケンスとしてパラメータ化された他のアクションのモデルをクエリして、対応する音を見積もることができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:58:34 GMT)
Reasoning Language Models: A Blueprint [16.0] 推論言語モデル(RLM)は、AIの問題解決能力を再定義した。
しかし、それらの高コスト、プロプライエタリな性質、複雑なアーキテクチャは、アクセシビリティとスケーラビリティの課題を提示している。
本稿では、RLMコンポーネントをモジュール化フレームワークにまとめる包括的青写真を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:19:22 GMT)
PDE-Controller: LLMs for Autoformalization and Reasoning of PDEs [16.0] 偏微分方程式(PDE)によって制御されるシステムを制御するためのフレームワークであるPDE-Controllerを提案する。
提案手法により,LLMは非公式な自然言語命令を形式仕様に変換し,PDE制御の実用性を改善するための推論と計画手順を実行することができる。
私たちのPDE-Controllerは、推論、オートフォーマル化、プログラム合成において、最新のオープンソースおよびGPTモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:07:41 GMT)
SPARKE: Scalable Prompt-Aware Diversity Guidance in Diffusion Models via RKE Score [16.0] 拡散モデルは高忠実度画像合成と即時誘導生成モデルにおいて顕著な成功を収めている。
そこで本稿では,SPARKE(Scalble Prompt-Aware R'eny Kernel Entropy Diversity Guidance)法を提案する。
本研究では,複数のテキスト・画像拡散モデル上でSPARKE法を数値的に検証し,提案手法が有意な計算コストを伴わずに生成したデータの迅速な多様性を向上させることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:53:45 GMT)
Devil's Hand: Data Poisoning Attacks to Locally Private Graph Learning Protocols [16.0] この研究は、ローカルなプライベートグラフ学習プロトコルをターゲットにした、最初のデータ中毒攻撃を導入している。
攻撃者は偽のユーザーをプロトコルに注入し、偽のユーザーを操作して本物のユーザーとリンクを確立する。
攻撃の有効性は理論的にも経験的にも示される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:46:11 GMT)
TTT-Bench: A Benchmark for Evaluating Reasoning Ability with Simple and Novel Tic-Tac-Toe-style Games [15.8] 大規模な推論モデル(LRM)は、オリンピアードレベルの数学的問題を含む幅広いタスクにわたって、印象的な推論能力を示している。
多くの推論ベンチマークはSTEM領域に焦点を絞っているが、より広いタスク領域で正しい推論を行うLRMの能力はいまだ未定である。
LRMの基本的な戦略的、空間的、論理的推論能力を評価するために設計された新しいベンチマークである textbfTTT-Bench を紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:03:19 GMT)
Adding simple structure at inference improves Vision-Language Compositionality [15.8] 本稿では,イメージとキャプションが与えられた場合,イメージを小さな作物に分割する,推論時に単純な構造を加えることを提案する。
提案手法は,評価された視覚言語モデルの性能をトレーニングなしで継続的に改善する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:06:25 GMT)
SRPL-SFDA: SAM-Guided Reliable Pseudo-Labels for Source-Free Domain Adaptation in Medical Image Segmentation [15.7] 領域適応(DA)は、新しい臨床センターに適用する場合、医用画像セグメンテーションモデルの堅牢な展開に不可欠である。
SFDA(SRPL-SFDA)のためのSegment Anything Model (SAM)-guided Reliable Pseudo-Labels法を提案する。
SRPL-SFDAは, ラベルのない対象ドメインにおいて, 疑似ラベル品質を効果的に向上し, 信頼性に配慮したトレーニングを活用することにより, SFDAの性能向上を図っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:16:03 GMT)
Model Attribution and Detection of Synthetic Speech via Vocoder Fingerprints [15.7] 音声信号とローパスまたはEnCodecフィルタのバージョン間の平均残差が、強力なボコーダ指紋として機能することを示す。
付随する頑健性の研究は、ある程度の騒音レベルにも耐えうることを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:45:22 GMT)
Understanding the Skill Gap in Recurrent Language Models: The Role of the Gather-and-Aggregate Mechanism [15.6] 状態空間モデル(SSM)は、長いシーケンスに対してトランスフォーマーの効率的な代替手段を提供する。
本研究では,TransformerおよびSSMに基づく言語モデルにおいて,コンテキスト内検索がどのように動作するかを検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:06:08 GMT)
DipLLM: Fine-Tuning LLM for Strategic Decision-making in Diplomacy [15.5] 大規模言語モデル(LLM)は、AIシステムの平衡探索に代わる有望な代替手段を提供する。
外交の均衡政策を学習する微調整LDMエージェントDipLLMを提案する。
本研究は,マルチプレイヤーゲームにおける複雑な戦略決定処理のための微調整LDMの可能性を示すものである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:25:32 GMT)
SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis [15.4] この制限に対処するために設計された評価フレームワークであるSceneEvalを紹介する。
SceneEvalには、特定のオブジェクトと入力テキストに記述されている属性の存在のような明示的なユーザ要求と、オブジェクトの衝突がないような暗黙的な期待の両方のメトリクスが含まれている。
SceneEvalを用いた最近のシーン生成手法の評価を行い、生成されたシーンを詳細に評価し、複数の次元にまたがる改善のための強度と領域を強調した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:42:00 GMT)
Enhancing Code LLMs with Reinforcement Learning in Code Generation: A Survey [15.4] 大規模言語モデル(LLM)の強化のための強力なパラダイムとして強化学習(RL)が登場した。
この調査は、コード開発ライフサイクル全体にわたってRL駆動のテクニックを体系的にレビューする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:18:55 GMT)
DREsS: Dataset for Rubric-based Essay Scoring on EFL Writing [15.4] DREsSは、ルーリックベースの自動化エッセイのための大規模で標準的なデータセットで、合計48.9Kのサンプルをスコアリングする。
DREsS_New、DREsS_Std、DREsS_CASEの3つのサブデータセットからなる。
筆者らは, DREsS_CASEの40.1Kの合成サンプルを生成し, 基準値を45.44%改善するエッセイの汚職ベースの強化戦略であるCASEを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:32:02 GMT)
Fine-tuning Diffusion Policies with Backpropagation Through Diffusion Timesteps [15.3] NCDPOは拡散政策を雑音条件決定政策として再構成する新しい枠組みである。
実験の結果,NCDPOはスクラッチからトレーニングを行う際に,PPOに匹敵するサンプル効率が得られることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:28:08 GMT)
Fine-Grained Spatially Varying Material Selection in Images [15.1] 本稿では,光源や反射率の変動に頑健な画像の材料選択法を提案する。
本稿では,従来の方法よりも微細で安定した選択結果を得るマルチレゾリューション処理戦略を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:49:53 GMT)
FedVLMBench: Benchmarking Federated Fine-Tuning of Vision-Language Models [15.1] VLM(Vision-Language Models)は、視覚情報とテキスト情報を統合したものである。
最近の取り組みでは、プライバシー問題に対処するために、VLMの微調整にフェデレートラーニング(FL)を導入している。
We present FedVLMBench, first systematic benchmark for federated fine-tuning of VLMs。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:52:27 GMT)
Gaussian Herding across Pens: An Optimal Transport Perspective on Global Gaussian Reduction for 3DGS [15.1] 本稿では,グローバルなガウス混合還元として3DGSのコンパクト化を推し進める,新しい最適輸送視点を提案する。
具体的には、まず、KD-ツリー分割上の複合輸送のばらつきを最小化し、コンパクトな幾何学的表現を生成する。
本手法は,バニラおよび加速3DGSパイプラインの任意の段階に適用可能であり,軽量なニューラルレンダリングへの効率的かつ非依存的な経路を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:04:44 GMT)
Coil2Coil: Self-supervised MR image denoising using phased-array coil images [15.1] クリーンな画像の取得やペアのノイズ破損画像の学習を必要としない,自己教師型デノベーション手法Coil2Coil(C2C)を提案する。
C2Cは、いくつかの自己教師付きメソッドに対して最高のパフォーマンスを示し、教師付きメソッドに匹敵する結果を報告している。
クリーン画像やペア画像にスキャンを加える必要がないという大きな利点があるため、様々な臨床応用に容易に利用できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:25:29 GMT)
SALAD: Systematic Assessment of Machine Unlearing on LLM-Aided Hardware Design [15.0] 大規模言語モデル(LLM)は、ハードウェア設計自動化のための変換機能を提供する。
LLMは、Verilog評価データ汚染、知的財産権(IP)設計リーク、悪意のあるVerilog生成のリスクなど、重要なデータセキュリティ上の課題を提起する。
SALADは、機械学習を利用してこれらの脅威を緩和する包括的アセスメントである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:29:05 GMT)
On the Similarities of Embeddings in Contrastive Learning [15.0] 本稿では,正対と負対の埋め込みのコサイン類似性を解析し,比較学習(CL)を理解するための統一的な枠組みを提案する。
フルバッチ設定では、負のペアの類似性が一定の閾値以下に低下した場合、正のペアの完全アライメントは達成不可能であり、この不一致は、内的負のペアを組み込むことによって軽減できることを示す。
ミニバッチ設定では、バッチ内の負のペア間のより小さなバッチサイズがより強く分離され、負のペアの類似性がより高くなることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:21:05 GMT)
Federated Unsupervised Visual Representation Learning via Exploiting General Content and Personal Style [15.0] フェデレートラーニングは、複数のクライアントが、ローカルクライアント間のプライバシー侵害を引き起こすことなく、グローバルモデルを集合的に学習することを可能にする。
本稿では,ローカルなスタイル情報をローカルなコンテンツ情報に注入することで,より一般化されたグローバルモデルを学ぶための新しい手法であるFedStyleを提案する。
我々は,FedStyleが一般化ベースライン法とパーソナライズベースライン法の両方を,スタイリゼーションされた分散化環境でより優れていることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:57:15 GMT)
DynaSubVAE: Adaptive Subgrouping for Scalable and Robust OOD Detection [14.9] 表現学習と適応OOD検出を共同で行う動的サブグループ変分自動符号化フレームワークであるDynaSubVAEを紹介する。
従来のアプローチとは異なり、DynaSubVAEはその潜在構造を動的に更新して新しいトレンドを捉え、データとともに進化する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:33:52 GMT)
Optimizing Latent Dimension Allocation in Hierarchical VAEs: Balancing Attenuation and Information Retention for OOD Detection [14.8] 階層的変分オートエンコーダ(HVAE)は、従来のVAEよりも優れた表現能力を提供する。
既存のアプローチはしばしば遅延容量を任意に割り当て、非効率な表現や後続の崩壊につながる。
本稿では,HVAEにおける潜在次元割り当てを最適化するための理論的基盤となるフレームワークを提案する。
固定遅延予算の下で最適な割り当て比$rast$の存在を証明し、この比率を調整することでOOD検出性能が一貫したことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:16:19 GMT)
Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information [14.8] 我々は,ニューラルレッグキネマティクスモデルという,オンライン学習に基づく脚キネマティクスモデルを開発した。
このモデルのオンライントレーニングにより,ロボットの荷重変化への適応性が向上する。
本手法は, テクトチュラル脚運動学モデルにより, 最先端の作業より優れる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:28:07 GMT)
AugGen: Synthetic Augmentation Can Improve Discriminative Models [14.7] 合成データ生成は、外部データセットや事前訓練されたモデルに代わる有望な代替手段を提供する。
本稿では,自己完結型合成拡張技術であるAugGenを紹介する。
以上の結果から,慎重に統合された合成データは,プライバシー制約を緩和し,顔認識における識別性能を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:32:30 GMT)
Resa: Transparent Reasoning Models via SAEs [14.6] SAE-Tuningは、新規で効率的なスパースオートエンコーダチューニング手順によって訓練された1.5B推論モデルのファミリーである。
SAE-Tuningは、RL訓練後の特定のベースモデルに適用される前に、RL訓練後の推論性能の97%以上を維持している。
AIME24では43.33%のPass@1、AMC23では90%のPass@1などの推論性能を約1ドルで実現している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:44:01 GMT)
ContextBuddy: AI-Enhanced Contextual Insights for Security Alert Investigation (Applied to Intrusion Detection) [14.6] 我々は、アナリストの以前の調査から学ぶアシスタントAIであるContextBuddyを紹介する。
コンテクスト選択を逐次決定問題として定式化する。
ContextBuddyは、強化学習アナリストのシミュレートを支援し、分類精度を向上した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:24:18 GMT)
Cross-Channel Unlabeled Sensing over a Union of Signal Subspaces [14.6] チャネル間をシャッフルした測定からマルチチャネル信号を回復する問題に、チャネル間無ラベルセンシングが対処する。
この研究は、チャネル間無ラベルセンシングフレームワークをサブスペースの結合にある信号に拡張する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:10:59 GMT)
A High-Quality Dataset and Reliable Evaluation for Interleaved Image-Text Generation [14.6] 本稿では,SEIR(Self-Evaluation with Iterative Refinement)法を用いて構築した大規模マルチモーダルデータセットであるInterSynを紹介する。
InterSynは、強くインターリーブされた画像テキスト応答を備えたマルチターン、命令駆動対話を備えている。
インターリーブ型マルチモーダル出力を評価できる信頼性評価ツールの欠如に対処するため,SynJudgeを紹介した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:21:20 GMT)
Boosting Rust Unit Test Coverage through Hybrid Program Analysis and Large Language Models [14.5] 本稿では,大規模言語モデル(LLM)を活用して高カバレッジ単体テストを生成する手法であるPALMを提案する。
PALMはプログラム解析を行い、関数内の分岐条件を特定し、それを経路制約に結合する。
このアプローチを実装し、それを10のオープンソースのRustクラッドで評価します。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:16:55 GMT)
3D-RAD: A Comprehensive 3D Radiology Med-VQA Dataset with Multi-Temporal Analysis and Diverse Diagnostic Tasks [14.4] 医用視覚質問応答 (Med-VQA) は, 臨床診断支援に有意な可能性を秘めている。
本稿では,ラジオグラフィCTスキャンを用いた3次元メドVQAの高速化を目的とした大規模データセットである3D-RADを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:55:42 GMT)
LaMAGIC2: Advanced Circuit Formulations for Language Model-Based Analog Topology Generation [14.3] 本稿では,言語モデルに基づくアナログトポロジー生成のための識別子付き簡潔なフロートインプット標準式であるLaMAGIC2を紹介する。
LaMAGIC2は0.01と10倍のMSEで34%高い成功率を得る。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:28:00 GMT)
DeepForm: Reasoning Large Language Model for Communication System Formulation [14.2] 通信システムの定式化は6Gと将来の無線技術の発展に不可欠である。
我々は,CSFRC(Communication System Formulation Reasoning Corpus)と呼ばれる,世界初となる大規模かつオープンソースなデータセットを,このドメインに対して慎重にキュレートした。
フレームワークには2段階のトレーニング戦略が採用されている。第1に,Chain-of-Thought(CoT)データを用いてドメイン知識を抽出し,第2にルールベース強化学習(Reinforcement Learning, RL)アルゴリズム,第2にReMaxに基づくC-ReMax。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:56:27 GMT)
Detecting State Manipulation Vulnerabilities in Smart Contracts Using LLM and Static Analysis [14.2] PriceSleuthは、Large Language Model(LLM)と静的解析を利用して、Price Manipulation(PM)攻撃を積極的に検出する新しい手法である。
今回,PriceSleuthの有効性を実証するために,予備実験を行った。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:29:28 GMT)
Towards Reliable Proof Generation with LLMs: A Neuro-Symbolic Approach [14.2] 大型言語モデル(LLM)は厳密な論理的推論と記号的推論を必要とする形式的ドメインと競合する。
本稿では,LLMの生成強度と構造成分を組み合わせ,この課題を克服するニューロシンボリックアプローチを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:19:10 GMT)
Hidden in Plain Sight: Evaluation of the Deception Detection Capabilities of LLMs in Multimodal Settings [14.1] 本稿では,Large Language Model (LLM) とLarge Multimodal Model (LMM) の自動偽造検出機能について,包括的に評価する。
実生活トライアル面接(RLTD)、対人的シナリオ(MU3D)、詐欺的レビュー(OpSpam)の3つの異なるデータセットを用いて、オープンソースおよび商用LLMの性能を評価する。
以上の結果から,LMMはクロスモーダルな手法を十分に活用するのに苦戦しているのに対し,微調整のLLMはテキスト偽造検出タスクにおいて最先端のパフォーマンスを実現することが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:12:50 GMT)
Athena: Enhancing Multimodal Reasoning with Data-efficient Process Reward Models [13.9] 本稿では,プロセス報酬モデル(PRM)であるAthena-PRMを提案する。
当社のAthena-PRMは、複数のベンチマークやシナリオで一貫して優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:01:59 GMT)
Mitigating Reward Over-optimization in Direct Alignment Algorithms with Importance Sampling [13.9] RLHF(Reinforcement Learning from Human Feedback)の代替として、DAA(Direct Alignment Algorithms)が登場した。
これらの手法は、モデルが基準ポリシーから逸脱する過度な最適化の影響を受けやすく、トレーニングが進むにつれて性能が低下する。
本稿では,オフラインDAAの過度最適化問題を軽減するために,新しい重要サンプリング手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:36:33 GMT)
Dynamic Negative Guidance of Diffusion Models [13.9] 負のプロンプティング(NP)は、一定の指導尺度の仮定によって制限されていることを示す。
我々は、ほぼ最適時間とガイダンスの状態依存変調に依存する、Dynamic Negative Guidanceと呼ばれる原則的手法を導出する。
以上の結果から,DNGを安定拡散法を用いてNPよりも正確で侵襲的なガイダンスを得ることが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:15:35 GMT)
Balanced Hyperbolic Embeddings Are Natural Out-of-Distribution Detectors [13.8] 階層的な双曲型埋め込みは、分布内および分布外サンプルの識別に好適である。
階層的歪みと浅層と広層の階層間のバランスを協調的に最適化する双曲型クラス埋め込みアルゴリズムを概説する。
我々の双曲的埋め込みは、他の双曲的アプローチよりも優れ、最先端のコントラスト的手法に勝り、階層的な分布の一般化を可能にする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:51:06 GMT)
Let's Fuse Step by Step: A Generative Fusion Decoding Algorithm with LLMs for Robust and Instruction-Aware ASR and OCR [13.8] GFD (Generative Fusion Decoding) は、大規模言語モデルとクロスモーダルテキスト認識システムを統合するために設計された。
GFDが異なるモデルのミスマッチしたトークン空間をまたいで動作できるようにするために必要な定式化を導出する。
GFDはプラグアンドプレイで、様々な自動回帰モデルと容易に互換性がある。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:09:58 GMT)
Assessing and Advancing Benchmarks for Evaluating Large Language Models in Software Engineering Tasks [13.7] 大規模言語モデル(LLM)は、ソフトウェア工学(SE)で人気が高まっている。
この分野での有効性を 理解するためには 有効性の評価が不可欠です
本稿では、291ベンチマークの徹底的なレビューを行い、どのベンチマークが利用可能か、どのようにベンチマークを構築しているか、これらのベンチマークの将来展望の3つの主要な側面に対処する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:11:10 GMT)
Zero-Shot Temporal Interaction Localization for Egocentric Videos [13.7] EgoLocと呼ばれる新しいゼロショットTIL手法を提案する。
2Dと3Dの両方を吸収することにより、EgoLocはHOIの接触/分離タイムスタンプに関する高品質な初期推定を直接サンプリングする。
EgoLocは、最先端のベースラインに比べて、エゴセントリックなビデオの時間的相互作用のローカライゼーションが優れている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:15:54 GMT)
MAGIC-VQA: Multimodal And Grounded Inference with Commonsense Knowledge for Visual Question Answering [13.7] 本稿では,広視野言語モデル(LVLM)と共通知識を体系的に統合することにより,視覚質問応答(VQA)を向上させる新しいフレームワークであるMAGIC-VQAを紹介する。
MAGIC-VQAは、外部ソースからの明示的な知識統合、コンテキストの洗練のためのBY-Type Post-Processing、構造化推論のためのグラフニューラルネットワーク(GNN)を用いたインプシット知識拡張という3段階のプロセスを採用している。
我々のフレームワークは,ベンチマークデータセット上での最先端性能を実現し,VQAにおける常識推論を大幅に改善する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:33:08 GMT)
HEIST: A Graph Foundation Model for Spatial Transcriptomics and Proteomics Data [13.7] 本稿では,空間転写学データのための階層型グラフトランスフォーマーモデルHEISTを紹介する。
HEISTは15の臓器にまたがる124の組織から22.3M細胞で事前訓練されている。
細胞埋め込みにおける微小環境の影響を効果的にコードし、空間的にインフォームドされたサブ集団の発見を可能にする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:29:01 GMT)
An Effective End-to-End Solution for Multimodal Action Recognition [13.6] 我々は,マルチモーダル情報を効果的に活用する包括的マルチモーダル行動認識ソリューションを提案する。
トップ1の精度は99%,トップ5の精度は100%で,ソリューションの優位性を実証した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:54:02 GMT)
Large Language Models Miss the Multi-Agent Mark [13.6] 我々は,MAS理論と現在のMAS LLM実装の相違点を強調した。
我々の立場では、多くのMAS LLMは、自律性、社会的相互作用、構造化環境といったマルチエージェントの特徴を欠いている。
我々は、誤字や機会の欠如を避けるため、確立されたMAS概念のより良い統合とより正確な用語を提唱する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:42:27 GMT)
Balans: Multi-Armed Bandits-based Adaptive Large Neighborhood Search for Mixed-Integer Programming Problem [13.4] 混合整数プログラミング(MIP)は、様々な重要な最適化問題をモデル化し解決するための強力なパラダイムである。
オンライン学習機能を備えたMIPのための適応型メタソリューションであるBaransを提案する。
Balansは、デフォルトのMIP解決器よりもパフォーマンスが大幅に向上し、どの最良地区にもコミットするより優れ、最先端のMIPの大規模検索よりも改善されている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:25:17 GMT)
Query-Level Uncertainty in Large Language Models [13.2] 我々は,レイヤやトークン間の自己評価を活用する,emphInternal Confidenceと呼ばれる新しい,トレーニング不要な手法を導入する。
事実的QAと数学的推論の両タスクに関する実証的な結果は、我々の内的信頼度がいくつかの基準線を上回ることを示す。
提案手法は,効率のよいRAGとモデルカスケードに利用でき,性能を維持しながら推論コストを低減できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:39:48 GMT)
When Detection Fails: The Power of Fine-Tuned Models to Generate Human-Like Social Media Text [13.1] ソーシャルメディアは、オンライン・インフルエンス・キャンペーンにおいて重要な攻撃源となっている。
我々は、オープンソース、クローズドソース、微調整されたLLMの組み合わせから、505,159のAI生成ソーシャルメディアポストのデータセットを作成します。
典型的な研究仮定の下ではポストを検出できるが、攻撃者が細調整されたモデルを公開しないというより現実的な仮定の下では、検出可能性は劇的に低下する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:51:28 GMT)
EVINET: Towards Open-World Graph Learning via Evidential Reasoning Network [13.1] 本稿では,主観的論理フレームワークにベータ埋め込みを統合するフレームワークであるEvidential Reasoning Network(EVINET)を紹介する。
EVINETには2つの重要なモジュールが含まれている。
大規模な実験により、EVINETは複数のメトリクスで最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:50 GMT)
Multi-task Representation Learning for Mixed Integer Linear Programming [13.1] 本稿では,ML誘導MILP問題解決のためのマルチタスク学習フレームワークについて紹介する。
我々は,マルチタスク学習モデルが同一分布内の特殊モデルと類似して動作することを示す。
これは、問題のサイズやタスクの一般化において、それらを著しく上回る。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:30:19 GMT)
Effective Regularization Through Loss-Function Metalearning [13.1] 進化的計算は、ニューラルネットワークアーキテクチャのさまざまな側面を最適化するために使用することができる。
本稿では,そのような関数が過剰適合を回避し,有効正則化につながることを理論的に示す。
本稿では,正規化の理解に向けた第一歩として,進化的ニューラルアーキテクチャ探索の能力について述べる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:52:09 GMT)
Unveiling the Hidden: Movie Genre and User Bias in Spoiler Detection [13.1] 既存のスポイラー検出手法は主にレビューテキストを分析し、映画ジャンルやユーザーバイアスの影響を見落としていることが多い。
ジャンル固有のデータとユーザの行動バイアスを組み込んだ新しいスポイラー検出フレームワークであるGUSDを導入する。
GUSDは現状の成果を達成し、映画レビュープラットフォームにおけるユーザエクスペリエンスを向上させる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:58:32 GMT)
Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play Reinforcement Learning [13.1] 我々は3v3マルチドローンバレーボールを習うことの課題に取り組む。
このタスクには、高レベルの戦略的調整と低レベルのアジャイル管理の両方が必要です。
階層型強化学習フレームワークである階層型自己学習を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:47:48 GMT)
LLMail-Inject: A Dataset from a Realistic Adaptive Prompt Injection Challenge [12.8] LLMail-Injectは,参加者が電子メールに悪意ある指示を注入しようとする現実的なシナリオをシミュレートする公開課題である。
我々は、課題コード、提案の全データセット、そして、このデータがどのように命令データ分離問題に対する新たな洞察を提供するかを示す分析結果をリリースする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:30:07 GMT)
Meta-learning Optimizers for Communication-Efficient Learning [12.6] 通信効率のよいSGD、特にローカルなSGDは近年大きな関心を集めている。
これらのアプローチの多くの変種が提案されているが、ディープラーニングの最先端適応に遅れを生じることがある。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:03:11 GMT)
ProxyGPT: Enabling User Anonymity in LLM Chatbots via (Un)Trustworthy Volunteer Proxies [12.6] 大規模言語モデル(LLM)のためのプライバシ強化システムであるProxyGPTを提案する。
従来のプロキシシステムとは異なり、ProxyGPTは"ユーザ"層で動作し、アイデンティティが要求される環境でブラウザとのインタラクションをプロキシする。
我々は、TLSデータ証明のための最新のWeb証明プロトコルを用いて、定期的な整合性監査を行うことにより、悪意のあるプロキシを防止する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:11:41 GMT)
AI shares emotion with humans across languages and cultures [12.5] 言語文化グループとモデル家族間の人間とAIの感情的アライメントを評価する。
分析の結果,LLM由来の感情空間は人間の知覚と構造的に一致していることがわかった。
モデル表現は、異なる感情カテゴリーにまたがって安定かつ自然に調節可能であることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:42:30 GMT)
Physical Layer-Based Device Fingerprinting for Wireless Security: From Theory to Practice [12.5] 物理的レイヤベースのデバイス指紋認証は、無線セキュリティのための新しいデバイス認証である。
本稿では,ハードウェア障害に基づくID認証とチャネル機能に基づく認証に焦点を当てる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:47:05 GMT)
Curvature Tuning: Provable Training-free Model Steering From a Single Parameter [12.5] 曲率チューニング(英: Curvature Tuning)は、モデルの決定境界を変調する解釈可能かつ原則化されたステアリング法である。
我々は,CTがモデル決定境界曲率を順応的に調整し,スムーズな関数空間にモデルを投影することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:09:08 GMT)
Vector Representations of Vessel Trees [12.4] 本稿では,3次元血管ネットワークに着目した木構造幾何データのベクトル表現を学習するための新しいフレームワークを提案する。
我々のフレームワークであるVeTTAは、医用画像における解剖学的構造を正確に、柔軟で、位相的に一貫したモデリングを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:34:08 GMT)
ChartReasoner: Code-Driven Modality Bridging for Long-Chain Reasoning in Chart Question Answering [12.3] 本稿では,チャート上での正確かつ解釈可能な推論を可能にするための,コード駆動型フレームワークを提案する。
まず、多彩なチャート画像を構造化されたEChartsコードに変換するために、高忠実度モデルを訓練する。
次に、一般的なチャート推論データ合成パイプラインを設計する。
最後に、教師付き微調整と強化学習を組み合わせた最終マルチモーダルモデルを訓練する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:55:36 GMT)
ImageChain: Advancing Sequential Image-to-Text Reasoning in Multimodal Large Language Models [12.3] ImageChainは、画像データに対するシーケンシャルな推論機能を備えたMLLMを強化するフレームワークである。
提案手法は,次の場面における記述課題の性能向上に寄与する。
ImageChainは、コミックからロボティクスまで幅広いアプリケーションにおいて、堅牢なゼロショット・アウト・オブ・ドメインのパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:35:11 GMT)
A Manually Annotated Image-Caption Dataset for Detecting Children in the Wild [12.3] 未成年者の描写を検出するためのベンチマークツールを対象とした画像キャプチャデータセットをリリースする。
ICCWDには、画像中の子供の有無を示すために手動でラベル付けされた1万枚の画像カプセルが含まれている。
以上の結果から, 子どもの発見は, 75.3%の正の正の確率を達成し, 難易度の高い課題であることが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:55:54 GMT)
Hyperspectral Image Classification via Transformer-based Spectral-Spatial Attention Decoupling and Adaptive Gating [12.2] ディープニューラルネットワークは、ハイパースペクトル画像分類においていくつかの課題に直面している。
本稿ではSTNetと呼ばれる新しいネットワークアーキテクチャを提案する。
提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:30:34 GMT)
Do Large Vision-Language Models Distinguish between the Actual and Apparent Features of Illusions? [12.2] 人間は視覚錯覚に敏感で、感覚や認知の過程を研究する貴重な道具として機能する。
大規模視覚言語モデル(LVLM)のような機械が視覚錯覚に類似した感受性を示すかどうかの研究が始まっている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:03:57 GMT)
One Patient, Many Contexts: Scaling Medical AI Through Contextual Intelligence [12.1] 医療AIにおけるコンテキストスイッチングのビジョンを概説する。
現在のモデルは、医療の進化する状況にまたがって行動の動的調整に苦慮している。
我々は、専門分野や地域にわたって幅広い病気を診断、管理、治療するためのコンテキストスイッチングAIを構想する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:23:57 GMT)
Adapting Vision-Language Foundation Model for Next Generation Medical Ultrasound Image Analysis [12.1] 視覚言語基礎モデルは様々なコンピュータビジョンアプリケーションで優れている。
視覚言語基礎モデルのためのドメイン適応手法を開発した。
本手法は,超音波画像解析のための視覚言語基盤モデルの性能を効果的に向上させることができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:11:14 GMT)
Multi-Modal Multi-Task Federated Foundation Models for Next-Generation Extended Reality Systems: Towards Privacy-Preserving Distributed Intelligence in AR/VR/MR [12.1] 我々は,マルチモーダルマルチタスク(M3T)フェデレーション基盤モデル(FedFM)が,XRシステムに変換機能を提供することを想定する。
モデルトレーニングとアグリゲーションのための異なる調整パラダイムを必要とするFedFMのモジュラーアーキテクチャを提案する。
この視点は、次世代のXRシステムにおいて、コンテキスト対応のプライバシ保護インテリジェンスのための技術的および概念的な基礎をグラフ化することを目的としている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:49:57 GMT)
Rewind-to-Delete: Certified Machine Unlearning for Nonconvex Functions [12.0] 機械学習アルゴリズムは、スクラッチを使わずにモデルから効率的にデータを収集することを目的としている。
証明されたマシン・アンラーニングは 微分一般化に基づく 強力な理論上の保証だ
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:31:48 GMT)
Self-Predictive Representations for Combinatorial Generalization in Behavioral Cloning [11.9] 行動クローニング(BC)法は、ロボット工学などの分野における人間による実証からポリシーを学ぶ効果的な方法である。
目標条件付き行動クローニング(GCBC)法は、分散トレーニングタスクでうまく機能するが、新しい状態とゴールペアの条件付けを必要とするタスクに、必ずしもゼロショットを一般化するとは限らない。
本稿では,単純な表現学習目標である$textBYOL-gamma$ augmented GCBCを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:32:41 GMT)
HAIF-GS: Hierarchical and Induced Flow-Guided Gaussian Splatting for Dynamic Scene [11.9] 本稿では,スパースアンカー駆動変形による構造的・一貫した動的モデリングを実現する統合フレームワークHAIF-GSを提案する。
HAIF-GSは, レンダリング品質, 時間的コヒーレンス, 再構成効率において, 従来の動的3DGS法よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:45:08 GMT)
TSVC:Tripartite Learning with Semantic Variation Consistency for Robust Image-Text Retrieval [11.9] クロスモーダル検索は意味的関連性を通して異なるモダリティの下でデータをマップする。
既存のアプローチでは、データペアが適切に整合しており、広く存在するアノテーションノイズを無視していると暗黙的に仮定している。
本稿では,画像テキスト検索のための意味変化一貫性(TSVC)を用いた三部学習を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:33:05 GMT)
ChatbotManip: A Dataset to Facilitate Evaluation and Oversight of Manipulative Chatbot Behaviour [11.9] 大規模言語モデル(LLM)は明示的に指示されたときに操作可能である。
BERT+BiLSTMのような小さな微調整されたオープンソースモデルは、ゼロショット分類に匹敵する性能を持つ。
我々の研究は、LCMがますますコンシューマ向けアプリケーションにデプロイされるにつれて、操作リスクに対処する必要性を強調しています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:29:43 GMT)
ADAgent: LLM Agent for Alzheimer's Disease Analysis with Collaborative Coordinator [11.8] アルツハイマー病(英語: Alzheimer's disease、AD)は、進行性神経変性疾患である。
既存の手法のほとんどは、医療専門家が使用する多面的アプローチとは対照的に、単一モダリティデータに依存している。
本稿では,ユーザクエリに対処し,意思決定を支援するために,大規模言語モデル(LLM)上に構築されたAD分析のためのAIエージェントであるADAgentを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:22:19 GMT)
On the Importance of Embedding Norms in Self-Supervised Learning [11.8] 自己教師付き学習(SSL)は、教師付き信号のないデータ表現のトレーニングを可能にし、機械学習において重要なパラダイムとなっている。
ほとんどのSSLメソッドは、埋め込みベクトル間のコサイン類似性を使用し、したがってハイパースフィアにデータを効果的に埋め込む。
組込みノルムがSSL収束率を制御し,ネットワーク信頼度を符号化し,予期せぬサンプルに対応する最小限のノルムを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:17:56 GMT)
Bipedal Balance Control with Whole-body Musculoskeletal Standing and Falling Simulations [11.7] バランス制御は、人間と二足歩行ロボットシステムにとって重要である。
この研究は、人間のバランス力学に関する独自の筋肉レベルの洞察を提供する。
バランス障害のある個人に対する標的的介入を開発するための基盤を提供するかもしれない。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:23:49 GMT)
The Everyday Security of Living with Conflict [11.6] このような状況下でセキュリティに関わり、理解する上で、異なるアプローチを提供します。
私たちはコロンビア、レバノン、スウェーデンのフィールド研究から得た3つのヴィグネットを通してそれを実現しています。
我々は,セキュリティ技術の設計において,そのような生きた経験を考えるために,セキュリティ研究者や実践者が行動を起こすよう呼びかけることによって,結論付ける。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:18:21 GMT)
NnD: Diffusion-based Generation of Physically-Nonnegative Objects [11.6] この研究は、物理的に意味のある非負のオブジェクトのクラスに焦点をあてる。
計算コストを大幅に削減するため,非負拡散(NnD)を提案する。
NnDは、高品質な物理シミュレーションオブジェクトを訓練する。訓練が完了すれば、生成と推論に使用できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:51:24 GMT)
HSENet: Hybrid Spatial Encoding Network for 3D Medical Vision-Language Understanding [11.5] 本稿では、3次元の視覚的手がかりを有効視知覚と投影によって活用し、正確で堅牢な視覚言語理解を実現する枠組みを提案する。
具体的には、HSENetは、グローバルなボリュームコンテキストと微細な解剖学的詳細の両方を知覚するために、デュアル3Dビジョンエンコーダを使用している。
また,高分解能な3次元空間領域をコンパクトな視覚的トークン集合に凝縮する効率的なマルチモーダルプロジェクタであるSpatial Packerを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:46:57 GMT)
VideoMat: Extracting PBR Materials from Video Diffusion Models [11.5] テキストプロンプトや1つの画像が与えられた3Dモデルの高品質な素材を生成するために、微調整ビデオ拡散モデル、ビデオの本質的な分解、および物理ベースで微分可能なレンダリングを利用する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:36:49 GMT)
Network Dynamics-Based Framework for Understanding Deep Neural Networks [11.4] 本稿では,動的システム理論のレンズを通して学習力学を解析するための理論的枠組みを提案する。
ニューラルネットワークの線形性と非線形性の概念をニューロンレベルで2つの基本変換単位を導入することにより再定義する。
異なる変換モードは、重みベクトルの組織、異なる情報抽出のモード、質的に異なる学習フェーズの出現において、異なる集団的挙動をもたらす。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:48:58 GMT)
Adjusting Model Size in Continual Gaussian Processes: How Big is Big Enough? [11.4] 多くの機械学習モデルでは、トレーニング前にサイズを制御するパラメータを設定する必要がある。
連続学習におけるガウス過程(単層ニューラルネットワーク)に対するこの問題について検討する。
ほぼ最適性能を維持しながらモデルサイズを自動的に調整する手法を開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:41:25 GMT)
On the Virtues of Information Security in the UK Climate Movement [11.4] 英国における抗議活動や様々な活動家の場で,参加者の観察とインタビューを行った。
我々は、英国気候運動のメンバーが、オープンネスとシークレットシーの根本的な緊張に苦しんだことを示す。
我々の発見は、アクティビスト環境における情報セキュリティ研究の社会的複雑さを浮き彫りにした。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:31:35 GMT)
Multi-Party Supervised Fine-tuning of Language Models for Multi-Party Dialogue Generation [11.3] 大規模言語モデル(LLM)は通常、ダイアディックや二者対話に参加するために微調整される。
本研究では,多人数対話データセットに基づくLLMのためのマルチパーティファインチューニングフレームワーク (MuPaS) を設計する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:49:06 GMT)
Beyond Overconfidence: Foundation Models Redefine Calibration in Deep Neural Networks [11.2] ディープニューラルネットワークは、特に分布シフトにおいて、体系的な過信を示すことが知られている。
本稿では,基礎モデルの校正挙動を包括的に調査する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:48:36 GMT)
Language Models Resist Alignment: Evidence From Data Compression [11.2] 大型言語モデル(LLM)は意図しないあるいは望ましくない振る舞いを示すことがある。
微調整が事前学習に対するアライメントを著しく損なうことを示す。
本研究は,LLMの弾性特性に対処し,アライメントに対する抵抗を緩和する必要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:23:47 GMT)
Randomized Block-Coordinate Optimistic Gradient Algorithms for Root-Finding Problems [11.2] 大規模設定における非線形方程式の解を近似する2つの新しいアルゴリズムを開発した。
本稿では,機械学習,統計的学習,ネットワーク最適化などにおける顕著な応用を網羅した大規模有限サム包含のクラスに適用する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:17:06 GMT)
Writing-Zero: Bridge the Gap Between Non-verifiable Tasks and Verifiable Rewards [11.1] 我々は、検証不可能なタスクと検証可能な報酬のギャップを埋める統一的なRLVRベースのトレーニングパラダイムを提案する。
本稿では,GenRMとBootstrapped Relative Policy Optimization (BRPO)アルゴリズムを提案する。
提案手法は,LLMが微調整を監督せずに堅牢な書込み機能を開発する上で有効である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:56:19 GMT)
Convert Language Model into a Value-based Strategic Planner [11.1] 感情支援会話(ESC)は、効果的な会話を通じて個人の感情的苦痛を軽減することを目的としている。
状態モデルの観点からダイアグラムを定義するために,straQ* というフレームワークを提案する。
当社のフレームワークでは,ESC中にLCMをブートストラップし,長期的リターンに基づいて最適な戦略を決定し,最終的にLSMの応答を誘導する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:49:15 GMT)
TRIDENT: Temporally Restricted Inference via DFA-Enhanced Neural Traversal [11.0] TRIDENTは、再トレーニングを必要とせず、時間的制約の遵守を保証する推論時アルゴリズムである。
TRIDENTは完全な制約満足度を実現し,最先端技術と比較すると,効率と高品質の指標が向上している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:14:01 GMT)
TrioXpert: An automated incident management framework for microservice system [10.9] TrioXpertは、マルチモーダルデータを完全に活用できるエンドツーエンドのインシデント管理フレームワークである。
複数タスクを同時に処理するために、大きな言語モデル(LLM)を用いた協調推論機構を採用している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:10:52 GMT)
Modified K-means Algorithm with Local Optimality Guarantees [10.9] K-meansアルゴリズムは機械学習において最も広く研究されているクラスタリングアルゴリズムの1つである。
本稿では,K-meansアルゴリズムが局所最適解に収束する条件を提案する。
連続性と離散性の両方において局所的最適性を保証するK-meansアルゴリズムの簡単な修正を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:52:53 GMT)
A Large and Balanced Corpus for Fine-grained Arabic Readability Assessment [10.9] 本稿では,アラビア語可読性評価のための大規模かつきめ細かいデータセットであるBa balanced Arabic Readability Evaluation Corpus (BAREC)を紹介する。
BARECは1百万語にまたがる69,441の文からなる。
コーパスはジャンルの多様性、トピックのカバレッジ、ターゲットのオーディエンスとのバランスを保ち、アラビア文字の複雑さを評価するための包括的なリソースを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:32:39 GMT)
Bridging Online Behavior and Clinical Insight: A Longitudinal LLM-based Study of Suicidality on YouTube Reveals Novel Digital Markers [10.8] 自殺は西側諸国で主要な死因である。
ソーシャルメディアが日常生活の中心となるにつれ、デジタルフットプリントは自殺行動に関する貴重な洞察を提供する。
調査: 自殺行為はYouTubeでどのように現れるのか、専門家の知識とどのように異なるのか?
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:12:02 GMT)
Safe Screening Rules for Group SLOPE [10.8] 群 SLOPE は、予測子の群を適応的に選択するためによく機能する。
しかし、グループSLOPEのブロック非分離群効果は、既存のメソッドを無効または非効率にする。
ゼロ係数をもつ不活性群を効率的に同定するグループSLOPEモデルに適した安全なスクリーニングルールを導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:56:08 GMT)
Causality-Inspired Fair Representation Learning for Multimodal Recommendation [10.8] 本稿では,因果性に着想を得たモダリティ指向のモダリティ・アンタングルメントと関係認識のフェアネス学習を通じて,新しいフェア・マルチモーダル・レコメンデーション・アプローチ(FMMRec)を提案する。
提案手法は,マルチモーダルレコメンデーションにおける反ファクトフェアネスの実現を目的としている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:28:52 GMT)
Alice and the Caterpillar: A more descriptive null model for assessing data mining results [10.8] 観測されたバイナリトランザクションおよびシーケンスデータセットから得られた結果を評価するための新しいヌルモデルを導入する。
我々のnullモデルは、既存のモデルよりも観測されたデータセットのより多くのプロパティを保持します。
nullモデルからデータセットをサンプリングするためのマルコフ連鎖モンテカルロアルゴリズムのスイートであるAliceについて説明する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:04:34 GMT)
Fine-Tuning Large Audio-Language Models with LoRA for Precise Temporal Localization of Prolonged Exposure Therapy Elements [10.7] 本稿では,セッション音声やテキストから鍵PEの忠実度要素を自動的時間的局所化する手法を提案する。
我々のアプローチは、Low-Rank Adaptation (LoRA) を用いて、学習済みの大規模なオーディオ言語モデル Qwen2-Audio を微調整し、30秒間の音声書き起こし入力を処理する。
この研究は、PE療法における忠実度追跡のためのスケーラブルなフレームワークを導入し、臨床医のトレーニング、監督、品質保証をサポートする可能性がある。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:21:06 GMT)
Hierarchical Image Matching for UAV Absolute Visual Localization via Semantic and Structural Constraints [10.6] 無人航空機(UAV)には絶対的な位置決めが不可欠であるが、グローバルナビゲーション衛星システム(GNSS)信号が利用できない場合には困難である。
視線に基づく絶対的位置決め手法は、UAVの現在の視界を基準衛星マップで推定し、その位置を推定する手法として人気を博している。
既存の手法は主に従来の画像マッチングと低レベルの画像マッチングに依存しており、ソース間の相違や時間的変動による大きな違いによって困難に悩まされている。
セマンティック・アウェアと統合したUAV絶対位置推定のための階層的クロスソース画像マッチング手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:53:03 GMT)
A polychromatic continuous-variable quantum communication network enabled by optical frequency combs [10.5] 光周波数コムで実現した多色連続可変量子通信ネットワークについて報告する。
他の多重化技術と比較して、多色量子ネットワークは理論的にはユーザの増加とともに減少することなく秘密鍵レートを達成することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:59:08 GMT)
Fluoroscopic Shape and Pose Tracking of Catheters with Custom Radiopaque Markers [10.5] 脳血管内におけるステアブルカテーテルとロボットカテーテルのナビゲーションには、カテーテルの形状とポーズの認識が必要である。
これらのカテーテルを追跡する努力は、平面的なセグメンテーションまたはかさばるセンサー機器に限られている。
この作業により、ステアブルカテーテルはバイプレーンイメージングの下で自律的にナビゲートすることができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:56:23 GMT)
SAFEFLOW: A Principled Protocol for Trustworthy and Transactional Autonomous Agent Systems [10.4] 大規模言語モデル(LLM)や視覚言語モデル(VLM)の最近の進歩は、複雑な推論とマルチモーダルツールの使用が可能な強力な自律エージェントを可能にしている。
能力の増大にもかかわらず、今日のエージェントフレームワークは脆弱であり、セキュアな情報フロー、信頼性、マルチエージェント調整のための原則的なメカニズムが欠如している。
SAFEFLOWは信頼性の高いLDM/VLMベースのエージェントを構築するための新しいプロトコルレベルフレームワークである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:14:10 GMT)
BiCo-Fusion: Bidirectional Complementary LiDAR-Camera Fusion for Semantic- and Spatial-Aware 3D Object Detection [10.3] 新しいトレンドはマルチモーダル入力、すなわちLiDARとカメラを融合させることである。
LiDARの機能は詳細なセマンティック情報と格闘し、カメラは正確な3D空間情報を欠いている。
BiCo-Fusionは、ロバストなセマンティックおよび空間認識の3Dオブジェクト検出を実現する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:16:14 GMT)
Almost-Optimal Local-Search Methods for Sparse Tensor PCA [10.2] 局所探索法は統計応用に広く用いられている。
最近の研究では「局所計算的」なギャップが明らかになっている。
そこで我々は,このギャップを「埋める」ための一連の局所探索手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:33:25 GMT)
Building UD Cairo for Old English in the Classroom [10.2] UDカイロ文に基づく古英語用木バンクのサンプルを提示する。
LLMのプロンプトと検索の組み合わせを古英語の真正データに適用する。
以上の結果から,現代英語のLLM出力は文法を反映していないが,後編集により緩和できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:29:57 GMT)
The 2025 PNPL Competition: Speech Detection and Phoneme Classification in the LibriBrain Dataset [10.2] 非侵襲的な脳データからの音声復号は、社会的影響の可能性を秘めている。
2025年のPNPLコンペティションの最終的な目標は、「ImageNet moment」の条件を作成することである。
我々は、ユーザフレンドリーなPythonライブラリ(pnpl)とともに、これまで記録された最大のオブジェクト内MEGデータセット(LibriBrain)を提示する。
このコンペティションには、アルゴリズムのイノベーションを強調するスタンダードトラックと、大規模コンピューティングに報いると思われる拡張トラックが特徴だ。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:34:33 GMT)
Code-Switching Red-Teaming: LLM Evaluation for Safety and Multilingual Understanding [10.2] 赤チームクエリのコードスイッチングは、大規模言語モデル(LLM)の望ましくない振る舞いを効果的に引き出すことができる
我々は,コードスイッチングされた赤チームクエリを合成するシンプルな,効果的なフレームワークCSRTを紹介した。
CSRTは,既存の多言語リピート技術よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:32:09 GMT)
Multi-FPGA Synchronization and Data Communication for Quantum Control and Measurement [10.1] 量子コンピュータが量子ビット数で増加するにつれて、古典的な制御システムはスケールしなければならない。
ほとんどのオープンソースソリューションはシングルボード無線周波数システム(RFSoC)に限定されている
複数のRFSoC基板上でクロックカウンタを同期するクロック同期フレームワークを設計する。
また,ファイバリンク上でPGA間で量子計測データを転送するデータ通信システムを開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:27:22 GMT)
Mono: Is Your "Clean" Vulnerability Dataset Really Solvable? Exposing and Trapping Undecidable Patches and Beyond [10.1] 既存のセキュリティパッチは、しばしば不正確なラベル、不十分なコンテキスト情報、決定不能なパッチに悩まされる。
信頼性のある脆弱性データセットを構築するための、人間の専門家の推論プロセスをシミュレートする、新しいフレームワークであるmonoを紹介します。
monoはラベリングエラーの31.0%を補正し、プロデュール間脆弱性の89%を回復し、CVEの16.7%が決定不能なパッチを含んでいることを明らかにした。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:55:51 GMT)
Pre-trained Large Language Models Learn Hidden Markov Models In-context [10.1] 隠れモデル(HMM)は、ラテンチャン構造を持つシーケンシャルデータをモデリングするツールであるが、現実のデータに適合する。
事前学習された言語(LLM)は、文脈内学習によって生成されたデータを効果的に学習できることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:17:22 GMT)
Real-Time Network Traffic Forecasting with Missing Data: A Generative Model Approach [10.1] 本稿では,欠落データを用いたリアルタイムネットワークトラフィック予測のための生成モデルを提案する。
実世界のデータセットを用いた実験では,平均絶対誤差(MAE)が0.002以下で,100ミリ秒以内の正確なネットワークトラフィック予測が達成された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:07:38 GMT)
DecIF: Improving Instruction-Following through Meta-Decomposition [9.9] DecIFは、多種多様な高品質の命令追従データを生成する、完全に自律的でメタ分解誘導フレームワークである。
命令生成のために,LLMは様々なメタ情報を反復的に生成し,応答制約と組み合わせて意味的にリッチな命令を生成するように誘導する。
応答生成のために、各命令を原子レベルの評価基準に分解し、厳密な検証と不正確な命令応答対の除去を可能にする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:50:54 GMT)
Using Shapley interactions to understand how models use structure [9.9] 我々は、Shapley Taylorインタラクション指標(STII)を用いて、言語モデルと音声モデルが内部的にどのように関係し、その入力を構造化するかを調べる。
モデル内の相互作用パターンを,構文構造,非構成的意味論,音声的協調という3つの基礎的言語構造に関連付ける。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:47:02 GMT)
Generalized Lie Symmetries in Physics-Informed Neural Operators [9.8] 物理インフォームド・ニューラル演算子(PINO)は偏微分方程式(PDE)の解演算子を学習するための強力なツールとして登場した。
近年の研究では、リーポイント対称性情報を取り入れることで、PINOのトレーニング効率が大幅に向上することが示されている。
本稿では,ポイント対称性の進化的代表を生かした新たな損失増大戦略を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:08:57 GMT)
Towards Scalable Defenses against Intimate Partner Infiltrations [9.7] Intimate Partner Infiltration (IPI) は、身近な近さと個人的知識を活用し、標準的保護を回避する。
スマートフォン上での不正アクセスや不審な動作を継続的に監視する自動IPI検出システムであるAIDを提案する。
AIDは、既存手法の11倍低い1.6%の偽陽性率と、エンドツーエンドのF1スコア0.981の、非所有者アクセスおよび細粒なIPI関連アクティビティを高精度に検出する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:50:53 GMT)
Active Learning for Forecasting Severity among Patients with Post Acute Sequelae of SARS-CoV-2 [9.7] PASCとして知られるSARS-CoV-2のPostacute Sequelaeは、世界中の医療システムにとって大きな課題となっている。
従来のモデルでは、PASCの微妙な進歩を捉えるために、構造化されたデータ闘争を訓練していた。
本稿では,臨床リスクを予測し,そのリスクに関連する進行事象を特定するためのアクティブアテンションネットワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:14:54 GMT)
Mapping NVD Records to Their VFCs: How Hard is it? [9.7] NVD(National Vulnerability Database)レコードを脆弱性修正コミット(VFC)にマッピングすることは、脆弱性分析には不可欠だが、NVD参照の明確なリンクが不足しているため、難しい。
本研究では, このマッピングの実現可能性について, 実証的アプローチを用いて検討する。
NVD参照のマニュアル分析では、Git参照は86%以上成功し、非Git参照は14%以下である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:14:29 GMT)
Scalable First-order Method for Certifying Optimal k-Sparse GLMs [9.6] そこで本研究では,BnBフレームワークの視点緩和を解くために,一階近位勾配アルゴリズムを提案する。
提案手法は双有界計算を著しく高速化し,大規模問題に対する最適性証明の提供に極めて有効であることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:23:10 GMT)
Temperature Optimization for Bayesian Deep Learning [9.6] テストログ予測密度を最大化する温度を選択するためのデータ駆動手法を提案する。
提案手法は,グリッド探索において,コストのごく一部で比較可能な性能を実証的に証明する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:25:32 GMT)
Physics-Informed Teleconnection-Aware Transformer for Global Subseasonal-to-Seasonal Forecasting [9.6] S2S (Subseasonal-to-seasonal) 予測は、大気系のカオス力学による重要な課題である。
我々はTelePiTを紹介した。TelePiTは、多スケール物理とテレコネクション認識を融合することで、グローバルなS2S予測を強化する新しいディープラーニングアーキテクチャである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:52:56 GMT)
Optimal quantum metrology under energy constraints [9.6] 我々は、エネルギー制約された量子多段階過程を特徴づける理論的枠組みを開発する。
推定精度は非拘束エネルギーの次元の増大から任意に恩恵を受けるが、エネルギー制約は無限次元系において1/E2$の究極的精度スケーリングをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:37:14 GMT)
Assessing the Impact of Refactoring Energy-Inefficient Code Patterns on Software Sustainability: An Industry Case Study [9.5] 本稿では,自動ソフトウェアサステナビリティ評価ツールを用いて,エネルギー非効率なコードパターンの持続可能性への影響を評価する産業ケーススタディを提案する。
予備的な結果は、アプリケーションのサステナビリティーのリファクタリング後への影響を浮き彫りにしており、ユーザ毎のエネルギー消費は29%減少している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:34:45 GMT)
MedChat: A Multi-Agent Framework for Multimodal Diagnosis with Large Language Models [9.4] 緑内障検出と大言語モデル(LLM)の統合は、眼科医の不足を軽減するための自動戦略である。
一般的なLLMを医用画像に適用することは、幻覚、限定的な解釈可能性、ドメイン固有の医療知識の不足により、依然として困難である。
我々は、特殊視モデルと複数のロール固有のLLMエージェントを組み合わせたマルチエージェント診断フレームワークとプラットフォームであるMedChatを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:43:27 GMT)
DynaSplat: Dynamic-Static Gaussian Splatting with Hierarchical Motion Decomposition for Scene Reconstruction [9.4] 我々は,ガウススプラッティングをダイナミックなシーンに拡張するアプローチであるDynaSplatを提案する。
我々は、変形オフセット統計と2次元運動流の整合性の融合により、シーン要素を静的または動的に分類する。
次に、粗い大域変換ときめ細かい局所運動の両方を捉える階層的な動きモデリング戦略を導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:13:35 GMT)
Guidelines for Fine-grained Sentence-level Arabic Readability Annotation [9.3] Balanced Arabic Readability Evaluation Corpus (BAREC) は、アラビア語の詳細な文レベルの可読性評価のための大規模リソースである。
Taha/Arabi21フレームワークに基づいて、このガイドラインはアラビア語話者の教育者による反復的な教育によって洗練された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:30:18 GMT)
You Are What You Say: Exploiting Linguistic Content for VoicePrivacy Attacks [9.2] 攻撃者訓練および評価データセットにおける話者内言語内容の類似性の影響を評価する。
また,VoicePrivacy Attacker Challengeデータセットでは,平均誤り率(EER)が35%に達し,EERを2%以下に抑えることができた。
我々の研究は、VoicePrivacyデータセットを再設計し、公正で偏見のない評価を確実にし、プライバシー評価のグローバルEERへの依存に挑戦することを提案している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:46:18 GMT)
DCIRNet: Depth Completion with Iterative Refinement for Dexterous Grasping of Transparent and Reflective Objects [9.2] 透過的および反射的オブジェクトのための新しいマルチモーダルディープコンプリートネットワークであるDCIRNetを提案する。
提案手法は,RGB画像と不完全深度マップ間の補完情報を抽出するための,革新的なマルチモーダル機能融合モジュールを組み込んだものである。
透明で反射的なオブジェクトの把握成功率を44%で改善しました。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:04:22 GMT)
Q2E: Query-to-Event Decomposition for Zero-Shot Multilingual Text-to-Video Retrieval [9.2] 最近のアプローチでは、LLM(Large-Language Models)とVLM(Vision-Language Models)からのパラメトリック知識の抽出と活用に顕著な習熟性を示している。
ゼロショット多言語テキスト・ビデオ検索のためのクエリ・ツー・イベント分解手法Q2Eを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:37:54 GMT)
Revisit What You See: Disclose Language Prior in Vision Tokens for Efficient Guided Decoding of LVLMs [9.0] 本稿では、視覚トークンを参照してLVLM(Large Vision-Language Models)におけるテキスト生成プロセスのガイドを行う、シンプルで効果的な復号法であるReVisiTを紹介する。
提案手法は,テキストトークン分布空間に投影し,制約付き発散最小化により,各復号ステップにおいて最も関連性の高い視覚トークンを動的に選択することにより,視覚トークン内に埋め込まれた意味情報を活用する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:46:55 GMT)
Know What You Don't Know: Uncertainty Calibration of Process Reward Models [9.0] 最先端のPRMでさえ、キャリブレーションが不十分であり、しばしば成功確率を過大評価することができる。
我々は、PRM出力が真の成功確率によく適合するように、量子レグレッションによって行われるキャリブレーション手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:39:26 GMT)
Community detection with the Bethe-Hessian [8.9] スパースブロックモデル(SBM)におけるベーテ・ヘッセン分光法の最初の厳密な分析法を提供する。
ベーテ・ヘッセン行列の負の外れ値の数は、ケステン・スティグムしきい値より上のブロックの数を一貫して推定できることが示される。
また、その外周負固有値の位置の濃度を定め、ベーテ・ヘッセン行列に基づくスペクトル法により、弱い整合性を実現することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:45:18 GMT)
Improving the performance of optical inverse design of multilayer thin films using CNN-LSTM tandem neural networks [8.8] 本稿では,SiO2/TiO2多層膜の透過スペクトルの逆設計にディープラーニングを利用する。
タンデムニューラルネットワーク(TNN)を実装し,一対多のマッピング問題を解く。
LSTM-LSTMをベースとしたTNNが最も精度が高いが、TNNの9つの構成の中では最長の訓練時間を要することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:12:13 GMT)
FLoD: Integrating Flexible Level of Detail into 3D Gaussian Splatting for Customizable Rendering [8.8] 3DGSのためのフレキシブル・レベル・オブ・ディテール(FLoD)を提案する。
FLoDは、レベル固有の3Dスケール制約を通じて、マルチレベル3DGS表現を構成する。
レベルごとのトレーニング戦略を導入し、レベル間の構造的一貫性を確保する。
実験によると、FLoDは、品質とメモリ使用量のトレードオフを伴う様々なレンダリングオプションを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:18:49 GMT)
Self-Calibrating BCIs: Ranking and Recovery of Mental Targets Without Labels [8.8] ラベル付きデータや事前学習されたデコーダにアクセスせずに、未知のメンタルターゲットを復元する最初のフレームワークとアルゴリズムを提示する。
自然主義的な顔画像実験により, CURSORは, 1) ラベル情報なしで人間の知覚的判断と相関する画像類似度, (2) 未知の精神目標に対する刺激のランク付け, (3) 未知の精神目標と区別できない新たな刺激を生成できることを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:21:47 GMT)
AD^2-Bench: A Hierarchical CoT Benchmark for MLLM in Autonomous Driving under Adverse Conditions [8.8] CoT(Chain-of-Thought)推論は、構造化された多段階の意思決定能力を強化する強力なアプローチとして現れている。
既存のベンチマークでは、CoTプロセスの厳格な評価の必要性がほとんど見過ごされている。
AD2-Benchは、悪天候と複雑なシーンを持つ自動運転用に特別に設計された最初のChain-of-Thoughtベンチマークである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:41:46 GMT)
Distributionally and Adversarially Robust Logistic Regression via Intersecting Wasserstein Balls [8.7] 提案手法は,提案手法が標準データセットのベンチマーク手法よりも優れていることを示す。
前者からインスピレーションを得て、ロジスティック回帰のためにAROのワッサーシュタイン DR について検討し、トラクタブル凸最適化の修正が認められることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:08:46 GMT)
Comparing human and LLM politeness strategies in free production [8.7] 大規模言語モデル(LLM)におけるポリット音声の基本的なアライメントの課題
我々は,LLM が,制約された作業とオープンな作業の両方において,人間と LLM の応答を比較することによって,同様に文脈に敏感なレパートリーを採用できるかどうかを検討する。
大規模モデルでは計算実用学の文献から重要な選好を再現することができ、人間の評価者は驚くほどオープンな文脈でLLM生成の応答を好んでいる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:44:46 GMT)
Plug-and-Play image restoration with Stochastic deNOising REgularization [8.7] SNORE(Denoising Regularization)と呼ばれる新しいフレームワークを提案する。
SNOREは、適切なレベルのノイズのある画像のみにデノイザを適用する。
これは明示的な正則化に基づいており、逆問題を解決するための降下につながる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:55:26 GMT)
Patient-Specific Deep Reinforcement Learning for Automatic Replanning in Head-and-Neck Cancer Proton Therapy [8.7] プロトン療法中の解剖学的変化は、ブラッグのピークをシフトさせ、腫瘍のアンダードシングやオーガン・アット・リスクオーバードーシングを危険にさらす。
現在の手動のリプランニングプロセスはリソース集約的で時間を要する。
本稿では,IMPT自動更新のための患者固有の深層強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:06 GMT)
Hybrid Classical-Quantum Sampling for Lattice Scalar Field Theory [8.7] 二次元ユークリッド空間における格子スカラー場の理論をアニールにより検討する。
補助量子ビットを用いて、クォート相互作用項を書き換えるための量子3スキームを導入する。
モンテカルロサンプリングをメトロポリス・ハスティングスアルゴリズムを用いて行い、従来のメトロポリスシミュレーションの結果と比較する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:39:09 GMT)
EnerBridge-DPO: Energy-Guided Protein Inverse Folding with Markov Bridges and Direct Preference Optimization [8.6] この研究は、低エネルギーで安定なタンパク質配列を直接生成するモデルを開発することで、制限を克服することを目的としている。
本稿では,低エネルギーで高安定性なタンパク質配列を生成することを目的とした,新しい逆フォールディングフレームワークであるEnerBridge-DPOを提案する。
評価の結果,EnerBridge-DPOは,最先端モデルに匹敵する配列回復率を維持しつつ,低エネルギーのタンパク質複合体配列を設計可能であることが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:12:26 GMT)
Neuromorphic Optical Tracking and Imaging of Randomly Moving Targets through Strongly Scattering Media [8.5] 我々は、通常見えない物体の追跡と画像化のための、エンドツーエンドのニューロモルフィック光学工学と計算手法を開発した。
密度散乱媒質から生じる光をイベントカメラで検出し、画素ワイドの同期スパイク列車に変換する。
本研究では,高密度な乱流媒質中におけるランダムに移動する物体の追跡とイメージング,および空間的静止だが光学的動的物体の像再構成を実演する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:14:31 GMT)
From Neural Representations to Interpretable Logic Rules [8.5] 本稿では,ニューラルネットワークから解釈可能な論理規則を復号化するための新しいアプローチであるNeuroLogicを紹介する。
NeuroLogicは幅広いニューラルネットワークに適応することができる。
NeuroLogicはニューラルネットワークのブラックボックスの性質を理解するのに役立ちます。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:42:53 GMT)
Calculating Software's Energy Use and Carbon Emissions: A Survey of the State of Art, Challenges, and the Way Ahead [8.4] ソフトウェアとAIの普及には、その成長するエネルギーと炭素フットプリントという、隠れたリスクが伴う。
ソフトウェアおよびAI関連エネルギーおよび/または二酸化炭素排出量の測定を可能にする方法とツールについて、最先端のレビューを行う。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:02:00 GMT)
How Do People Revise Inconsistent Beliefs? Examining Belief Revision in Humans with User Studies [8.2] 我々は、古典的信念変化理論よりも説明に基づく改訂を一貫して好んでいることを示す。
これらの発見は、人間の推論をモデル化したり、人間と対話するように設計されたAIシステムに影響を及ぼす。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:52:33 GMT)
DeepMultiConnectome: Deep Multi-Task Prediction of Structural Connectomes Directly from Diffusion MRI Tractography [8.2] 本稿では,構造コネクトームを直接トラクトグラフィーから予測するディープラーニングモデルであるDeepMultiConnectomeを紹介する。
マルチタスク学習を備えたポイントクラウドベースのニューラルネットワークを使用して、モデルは、接続されたリージョンに応じて、ストリームラインを分類する。
DeepMultiConnectomeは、予測されたコネクトームと従来のストリーラインのラベル付け法を用いて生成された従来のコネクトームを比較して評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:09:20 GMT)
OWSM-Biasing: Contextualizing Open Whisper-Style Speech Models for Automatic Speech Recognition with Dynamic Vocabulary [8.2] 本稿では、既存の文脈バイアス法とOpen Whisper-Style Speech Models (OWSM) v3.1を統合し、事前学習したパラメータを凍結する。
実験の結果,提案手法は偏りの単語誤り率(B-WER)を11.6ポイント改善することがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:53:40 GMT)
SparseSSM: Efficient Selective Structured State Space Models Can Be Pruned in One-Shot [8.1] Mambaのような状態空間言語モデルは、線形複雑性推論を許容しながらTransformerの品質にマッチする。
既存のワンショットプルーニング手法はアテンションブロックに適合し、時間共有および離散化された状態遷移行列を考慮できない。
SparseSSMは、古典的最適な脳外科医(OBS)フレームワークをステートスペースアーキテクチャに拡張した最初のトレーニングフリープルーニングフレームワークである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:14:57 GMT)
LoRA-Edit: Controllable First-Frame-Guided Video Editing via Mask-Aware LoRA Fine-Tuning [8.1] 拡散モデルを用いたビデオ編集は、ビデオの高品質な編集を作成できる顕著な成果を上げている。
ファーストフレーム誘導編集は、最初のフレームを制御できるが、その後のフレームよりも柔軟性に欠ける。
フレキシブルなビデオ編集のための事前訓練された画像対ビデオ(I2V)モデルに適応するマスクベースのLoRAチューニング手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:03:55 GMT)
Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation [8.1] Open-Vocabulary semantic segmentation (OVSS)とDomain Generalization in semantic segmentation (DGSS)は微妙な相補性を強調している。
OV-DGSSは、見えない領域にまたがる堅牢性を保ちながら、見えないカテゴリのためのピクセルレベルのマスクを生成することを目的としている。
我々は,OVSSとDGSSの強みを初めて統一する,OV-DGSSのための新しい単一ステージフレームワークであるVireoを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:54:47 GMT)
A Geometric Modeling of Occam's Razor in Deep Learning [8.0] ディープニューラルネットワーク(DNN)は、非常に高次元のパラメータ空間の恩恵を受ける。
彼らの巨大なパラメータの複雑さと実践上の素晴らしいパフォーマンスは、より興味深く、説明できないものです。
本稿では,この現象を研究するための幾何学的フレーバー付き情報理論手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:31:46 GMT)
Decomposition Strategies and Multi-shot ASP Solving for Job-shop Scheduling [8.0] ジョブショップスケジューリング問題(JSP、Job-shop Scheduling Problem)は、ジョブを含むタスクをできるだけ早く完了するように、マシンを共有するタスクをシーケンスに配置する、よく知られた、困難な最適化問題である。
本稿では,ASP(Multi-shot Answer Set Programming)の解法を用いて,操作を逐次スケジュールし,最適化可能な時間窓への問題分解について検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:24:30 GMT)
Counterfactual Multi-player Bandits for Explainable Recommendation Diversification [7.9] 我々は、説明可能な推薦の多様化を実現するために、textbfCounterfactual textbfMulti-player textbfBandits (CMB)法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:27:06 GMT)
Can LLMs Ground when they (Don't) Know: A Study on Direct and Loaded Political Questions [7.9] 本稿では,大言語モデル (LLM) が知識を持つ場合の共通基盤をどのように管理するかを検討する。
本研究では,LLMが直接知識質問に答える能力について検討し,誤報を前提とした質問をロードする能力について考察する。
本研究は,LLMが偽ユーザ信念を根底から否定する能力において,政治的言論における偽情報の緩和に果たした役割に対する懸念を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:58:55 GMT)
Towards Efficient and Effective Alignment of Large Language Models [7.9] 大規模言語モデル(LLM)は多様なタスクにまたがる優れた能力を示すが、それらを効率的かつ効果的に人間の期待に合わせることは重要な課題である。
この論文は、データ収集、トレーニング、評価において新しい方法論を導入することで、LCMアライメントを推し進める。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:08:52 GMT)
ErrorEraser: Unlearning Data Bias for Improved Continual Learning [7.8] 継続的な学習は主に、破滅的な忘れ込みを防ぎ、新しいタスクの学習を容易にするために知識を伝達することを目的としている。
CLのバイアスによる誤記憶を除去する汎用プラグインであるErrorEraserを提案する。
ErrorEraserは、データバイアスの負の影響を著しく軽減し、3種類のCLメソッド間で高い精度と低い忘れ率を達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:54:29 GMT)
Benchmarking Debiasing Methods for LLM-based Parameter Estimates [7.8] 大規模言語モデル(LLM)は、テキストに注釈を付けるための安価で強力な方法を提供するが、専門家と比較すると矛盾することが多い。
このバイアスを軽減するために、デザインベースのスーパーバイザードラーニング(Supervised Learning、スーパーバイザードラーニング)や予測パワー推論(Predict-Powered Inference、PPI)などのデバイアス手法を開発した。
私たちはDSLとPPIをさまざまなタスクで比較し、どちらも大きなデータセットで低いバイアスを達成しているが、DSLはバイアス低減と経験的効率でPPIを上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:37:02 GMT)
Do Multiple Instance Learning Models Transfer? [7.8] マルチ・インスタンス・ラーニング(MIL)は計算病理学における基礎的アプローチである
MILはしばしば、小さく、弱く管理された臨床データセットと競合する。
本研究では,事前学習型MILモデルの伝達学習能力を評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:53:38 GMT)
Provable Benefits of Unsupervised Pre-training and Transfer Learning via Single-Index Models [7.7] 教師なし事前学習と転送学習は、ニューラルネットワークのトレーニングアルゴリズムを初期化するために一般的に使用される。
教師なし事前学習と移動学習が高次元教師あり学習の複雑さに及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:36:14 GMT)
Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models [7.7] 我々は、迅速で直接的な回答(高速思考)と精巧で連鎖的な熟考(スロー思考)とのトレードオフは、明示的に管理されなければならないと論じている。
本稿では, 推論に対する適応制御が, 監視信号の強化, 新たな多次元ベンチマークのモチベーション, コスト意識, セキュリティ意識の展開ポリシーの通知などを実現する方法について概説する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:55:00 GMT)
AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI) [7.6] LLMに対する敵の脅威は、現在の防衛が適応できるよりも急速にエスカレートしている。
ALKALIは, 厳格にキュレートされた最初の逆数ベンチマークである。
本稿では、遅延空間正規化と協調するアライメントフレームワークGRACEを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:27:54 GMT)
Knockoffs Inference under Privacy Constraints [7.6] 差分プライバシーパラダイム内でのノックオフ推論のための包括的フレームワークを提案する。
提案手法は,元のモデル-Xのノックオフ手順に係わる正確なFDR制御を保ちながら,堅牢なプライバシ保護を保証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:06:21 GMT)
Med-REFL: Medical Reasoning Enhancement via Self-Corrected Fine-grained Reflection [7.6] Med-REFL, underlinetextbfMedical underlinetextbfReasoning underlinetextbfEnhancement via self-corrected underlinetextbfFine-grained refunderlinetextbfLection。
本手法は,医学的疑問を微粒な推論経路に分解し,各ステップとそのその後のリフレクションを定量的に評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:58:38 GMT)
CINeMA: Conditional Implicit Neural Multi-Modal Atlas for a Spatio-Temporal Representation of the Perinatal Brain [7.6] CINeMAは、高分解能、神経側頭葉、マルチモーダル脳アトラスを作成するための新しいフレームワークである。
計算集約的な画像登録を避け、アトラス構築時間を数日から数分に短縮する。
GA、生年月日、腹腔鏡下手術(VM)、コーパス・カロサム・アジェネシス(ACC)などの解剖学的特徴に対するフレキシブルな条件付けを可能にする
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:39:41 GMT)
SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models [7.5] 本稿では,SEarch-Augmented Languageモデルを評価するための新しい課題ベンチマークであるSealQAを紹介する。
SealQAには、Seal-0、Seal-Hard、LongSealの3つのフレーバーがある。
DeepSeek-R1-671Bやo3-miniのような高度な推論モデルは、ノイズの多い検索結果に対して非常に脆弱であることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:00:00 GMT)
Detecting (emergent) continuous symmetry of criticality via subsystem's entanglement spectrum [7.5] 量子多体系における臨界点の基底(創発的)対称性を数値的に同定する。
エンタングルメントスペクトルが冷却後のエンタングルメント基底状態の破壊対称性を観測できるという事実に起因している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:00:49 GMT)
GLD-Road:A global-local decoding road network extraction model for remote sensing images [7.4] 道路網は地図作成、自動運転、災害対応に不可欠である。
グローバル効率と局所精度を組み合わせた2段階モデルGLD-Roadを提案する。
実験の結果、GLD-Roadは最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:36:25 GMT)
When Is Diversity Rewarded in Cooperative Multi-Agent Learning? [7.4] 計算パラダイムとしてマルチエージェント強化学習(MARL)を用いる。
我々は,不特定なMARL環境のパラメータ空間を最適化する勾配に基づくアルゴリズムであるヘテロジニアス環境設計(HED)を紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:33:55 GMT)
MCA-Bench: A Multimodal Benchmark for Evaluating CAPTCHA Robustness Against VLM-based Attacks [7.3] MCA-Benchは包括的な再現可能なベンチマークスイートである。
不均一なCAPTCHA型を単一の評価プロトコルに統合する。
大規模な実験により、MCA-Benchは現在のCAPTCHA設計の脆弱性スペクトルを効果的にマッピングしていることが明らかになった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:56:19 GMT)
Towards Practical Alzheimer's Disease Diagnosis: A Lightweight and Interpretable Spiking Neural Model [7.3] アルツハイマー病 (AD) の早期診断は, 主観的評価やマルチモーダル画像モダリティの高コストにより, 極めて困難である。
脳にインスパイアされたパラダイムとして、スパイキングニューラルネットワーク(SNN)は本質的にADにおける神経変性のスパースでイベント駆動パターンをモデル化するのに適している。
我々は、生物にインスパイアされたLIFニューロンと、領域適応的畳み込みとマルチスケールのスパイク注意を統合するハイブリッドニューラルネットワークであるFasterSNNを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:10:49 GMT)
CROW: Eliminating Backdoors from Large Language Models via Internal Consistency Regularization [7.3] 大規模言語モデル(LLM)は、隠れたトリガーを介して出力を操作するバックドア攻撃に対して脆弱である。
本稿では,バックドアモデルがトリガ時に不安定な層単位の隠蔽表現を示すという観測を生かした内部一貫性規則化(CROW)を提案する。
CROWは、微調整やバックドアの中立化など、クリーンな参照モデルや知識のトリガを必要とせず、小さなクリーンなデータセットのみを使用して、レイヤ間の一貫性を強制する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:40:14 GMT)
Empirical Quantification of Spurious Correlations in Malware Detection [7.2] モデルがコンパイラが残した空の空間にどのように依存しているかを示す。
運用にどちらが適しているかをよりよく理解するために、エンド・ツー・エンドの2つのモデルのランキングを導入します。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:32:06 GMT)
Accelerating LLM Inference with Lossless Speculative Decoding Algorithms for Heterogeneous Vocabularies [7.1] 投機的復号法(SD法)は、単一の目標フォワードパスを使用して複数のトークンを生成することにより、実質的な効率向上をもたらす。
既存のSDアプローチでは、ドラフトラとターゲットモデルは同じ語彙を共有する必要があるため、ドラフトラのプールが制限される。
この共有語彙制約を除去する3つの新しいSD手法を提案する。
我々のアルゴリズムは、標準の自己回帰復号よりも最大2.8倍の高速化を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:26:45 GMT)
Provable Sim-to-Real Transfer via Offline Domain Randomization [7.1] sim-to-realギャップを減らす主要な戦略はドメインランダム化(DR)である
Standard DRは、実際のシステムから利用可能なオフラインデータを無視する。
オフライン領域ランダム化(ODR)について検討し、まずシミュレーターパラメータの分布をオフラインデータセットに適合させる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:22:33 GMT)
Effective Red-Teaming of Policy-Adherent Agents [7.1] タスク指向のLLMベースのエージェントは、適格性やキャンセルルールの返金といった厳格なポリシーを持つドメインで、ますます使われています。
本稿では,個人的利益のためにポリシーに忠実なエージェントを活用することを目的とした,敵対的ユーザに焦点を当てた新たな脅威モデルを提案する。
CRAFTは、ポリシーを意識した説得戦略を利用して、顧客サービスシナリオにおいてポリシーに忠実なエージェントを弱体化させるマルチエージェントのレッドチームシステムである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:59:47 GMT)
Identifiable Latent Bandits: Leveraging observational data for personalized decision-making [7.1] 本稿では,古典的盗賊よりも短い探索時間で最適な意思決定につながる,識別可能な潜伏盗賊の枠組みを提案する。
本手法は,観測データから表現を確実に同定し,新たなバンドイットインスタンスの最適動作を推測する非線形独立成分分析に基づく。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:30:45 GMT)
M3-JEPA: Multimodal Alignment via Multi-gate MoE based on the Joint-Predictive Embedding Architecture [6.9] 現在のマルチモーダル学習戦略は主にオリジナルのトークン空間で最適化されている。
我々はマルチモーダルなタスクにJEPA(Joint Embedding predictive Architecture)を導入し、入力埋め込みを予測器によって出力埋め込み空間に変換する。
我々は,M3-JEPAが様々なモダリティやタスクの最先端性能を達成でき,未知のデータセットやドメインに一般化でき,学習と推論の両方において計算効率がよいことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:11:10 GMT)
Towards Bridging the Reward-Generation Gap in Direct Alignment Algorithms [6.8] Reinforcement Learning from Human Feedback (RLHF)アルゴリズムの代替として、DAA(Direct Alignment Algorithms)が登場した。
DAAは、トレーニング中の最適化目標と推論時の実際の生成性能の相違に悩まされる。
プリフィックス指向等長トレーニング(POET)という,シンプルで効果的なアプローチを導入する。
POETは、より短い長さに合わせるために、好ましくない応答と好ましくない応答の両方を切断する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:02:18 GMT)
Cross-Learning Between ECG and PCG: Exploring Common and Exclusive Characteristics of Bimodal Electromechanical Cardiac Waveforms [6.8] 本稿では,ECGとPCGの共通性と排他的特性について検討する。
線形および非線形機械学習モデルを用いて、各モダリティを他方から再構成する。
臨床的に関連がある心電図のバイオマーカー、例えば、動注点やQT間隔は、PCGのクロスオブジェクト設定から推定できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:16:59 GMT)
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning [6.7] オフラインおよびオンライン学習を統合するハイブリッドフレームワークであるMOORL(Meta Offline-Online Reinforcement Learning)を提案する。
提案手法は,オフラインデータとオンラインデータの相補的強みを効果的に組み合わせることで,探索の促進を図っている。
計算オーバーヘッドが最小限であるMOORLは、実世界のシナリオにおける実用的な応用の可能性を強調し、高い性能を達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:12:50 GMT)
TGRPO :Fine-tuning Vision-Language-Action Model via Trajectory-wise Group Relative Policy Optimization [6.7] 近年のVision-Language-Actionモデルの進歩は、大規模なデータセットで事前訓練された場合に、多様なシーン、タスク、ロボットプラットフォームにまたがる強力な一般化能力を示している。
これらのモデルは、静的な軌跡データセットを使用して、ほとんど監督された微調整(SFT)に依存する新しい環境において、タスク固有の微調整を必要とする。
本稿では,TGRPO(Trjectory-wise Group Relative Policy Optimization)法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:42:44 GMT)
Gaussian2Scene: 3D Scene Representation Learning via Self-supervised Learning with 3D Gaussian Splatting [6.7] ポイントクラウドの事前トレーニングのための自己教師付き学習(SSL)は、多くの3Dビジョンタスクの基盤となっている。
本稿では,3次元ガウススティング(3DGS)の効率性と明示性を事前学習に活用する,シーンレベルのSSLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:42:02 GMT)
Jigsaw-Puzzles: From Seeing to Understanding to Reasoning in Vision-Language Models [6.6] Jigsaw-Puzzlesは空間的複雑さの高い1,100個の慎重にキュレートされた実世界の画像からなる新しいベンチマークである。
このデータセットに基づいて、視覚言語モデルの空間知覚、構造的理解、推論能力を厳格に評価する5つのタスクを設計する。
その結果、最強モデルであるGemini-2.5-Proでさえ、全体的な精度は77.14%に過ぎず、特にオーダージェネレーションタスクでは性能が劣っていることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:50:21 GMT)
Prompt Variability Effects On LLM Code Generation [6.3] コード生成は、Large Language Models (LLM) の最も活発な応用分野の1つである。
LLMを用いたコード生成のための合成評価パイプラインと、体系的なペルソナに基づく評価手法を提案する。
提案手法の有用性を実証し,コミュニティの利益のためにコードを共有する実験的な証拠を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:43:48 GMT)
Trustworthy AI: Safety, Bias, and Privacy -- A Survey [6.3] 我々は、この分野の現状を調査し、AIモデルの信頼性に挑戦する懸念について、有望な洞察と視点を提示する。
本稿では,モデルの信頼性を損なう安全,プライバシ,バイアスの3つの推力に関する問題点について検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:44:34 GMT)
Accurate and efficient zero-shot 6D pose estimation with frozen foundation models [6.3] FreeZeV2は、無関係なデータに基づいて事前学習された幾何学的および視覚的基礎モデルを活用することにより、未確認オブジェクトへの強力な一般化を実現する訓練不要の手法である。
我々は,BOPベンチマークの7つのコアデータセット上でFreeZeV2を評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:23:38 GMT)
Adam Exploits $\ell_\infty$-geometry of Loss Landscape via Coordinate-wise Adaptivity [6.3] 好ましくは $ell_infty$-geometry が SGD であるのに対して、Adam は影響を受けていない。
我々の実験は、好ましくは $ell_infty$-geometry が SGD であるのに対して、Adam が影響を受けていない場合、さらに悪化することを確認した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:28:30 GMT)
Enhancing Human-Robot Collaboration: A Sim2Real Domain Adaptation Algorithm for Point Cloud Segmentation in Industrial Environments [6.3] 本稿では、3DポイントクラウドデータのセマンティックセマンティックセグメンテーションのためのSim2Realドメイン適応における先駆的アプローチについて紹介する。
我々の焦点は、シミュレーション環境から実世界のアプリケーションへ堅牢に移行し、実用性と安全なHRCへの影響を高めるネットワークの開発である。
提案手法は実世界のHRCセットアップと産業用点雲のシミュレーションにより評価され, 最先端性能の向上, セグメンテーション精度97.76%, 既存手法に比べて堅牢性に優れていた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:36:07 GMT)
SWAT-NN: Simultaneous Weights and Architecture Training for Neural Networks in a Latent Space [6.2] ニューラルネットワークのアーキテクチャと重みを同時に最適化するフレームワークを提案する。
我々のフレームワークはまず、アーキテクチャ情報とパラメトリック情報の両方を連続的な潜在空間に埋め込む、普遍的なマルチスケールオートエンコーダを訓練する。
データセットが与えられたら、埋め込み空間内の点をランダムに初期化し、勾配降下によって更新して最適なニューラルネットワークを得る。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:56:59 GMT)
BF-Max: an Efficient Bit Flipping Decoder with Predictable Decoding Failure Rate [6.2] Bit-Flipping (BF) デコーダはポスト量子暗号方式で広く使われている。
セキュリティ上の問題に対して、デコード失敗率(DFR)が無視可能であることを保証しなければならない。
我々はBFデコーダの新バージョンを導入し、BF-Maxと呼ぶ。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:04:05 GMT)
A brain-inspired generative model for EEG-based cognitive state identification [6.2] 本稿では、インパルスアテンションニューラルネットワークと変分オートエンコーダを融合した脳誘発生成モデルを提案する。
勾配に基づく学習とヘテロ連想記憶を統合することによってモデルを訓練するためのハイブリッド学習法を提案する。
実験の結果,BIGモデルでは,最先端手法に匹敵する89%以上の分類精度が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:28:37 GMT)
ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning [6.1] ReinFlowは、継続的ロボット制御のためのオンライン強化学習フレームワークである。
学習可能なノイズをフローポリシーの決定論的パスに注入し、フローを離散時間マルコフプロセスに変換する。
代表的な移動と操作タスクでReinFlowをベンチマークします。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:12:17 GMT)
TimeDART: A Diffusion Autoregressive Transformer for Self-Supervised Time Series Representation [6.0] 我々は,新しい自己教師型時系列事前学習フレームワークである textbfTimeDART を提案する。
TimeDARTは2つの強力な生成パラダイムを統合し、より伝達可能な表現を学ぶ。
時系列予測と分類のための公開データセットに関する広範な実験を行う。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:43:57 GMT)
A new type of federated clustering: A non-model-sharing approach [5.9] 本研究では,データ協調クラスタリング(DC-Clustering)を提案する。
DC-Clusteringは、水平と垂直の分割が共存する複雑なデータパーティショニングシナリオ上のクラスタリングをサポートする。
その結果,本手法は,すべてのデータがプールされている集中クラスタリングに匹敵するクラスタリング性能が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:57:26 GMT)
The Remarkable Robustness of LLMs: Stages of Inference? [5.8] 本研究では,Large Language Models (LLM) の構造的介入に対するロバスト性について検討する。
驚くべきことに、モデルは微調整なしでオリジナルのトップ1予測精度の72-95%を維持している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:12:50 GMT)
Delegations as Adaptive Representation Patterns: Rethinking Influence in Liquid Democracy [5.8] 液状民主主義は、影響力の委譲による意思決定における労働の分断のメカニズムである。
トランジシティーは、制限なしの電力蓄積につながると懸念されている。
流動民主主義における代表団の新たなモデルを導入することにより、推移性は実際、熟考の影響と意思決定力の効果的な規制にどのように貢献するかを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:34:05 GMT)
Evidential Deep Learning with Spectral-Spatial Uncertainty Disentanglement for Open-Set Hyperspectral Domain Generalization [5.8] ハイパースペクトル画像分類のための新しいオープンセット領域一般化フレームワークを提案する。
このフレームワークは、SIFD(Spectrum-Invariant Frequency Disentanglement)、DCRN(Dual-Channel Residual Network)、EDL(Evidential Deep Learning)、SSUD(Spectral-Spatial Uncertainty Disentanglement)の4つの重要なコンポーネントを組み合わせている。
実験結果から,本手法は最先端のドメイン適応手法に匹敵する性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:07:14 GMT)
BemaGANv2: A Tutorial and Comparative Survey of GAN-based Vocoders for Long-Term Audio Generation [5.7] 本稿では,BemaGANv2のチュートリアルスタイルのサーベイと実装ガイドについて述べる。
BemaGANv2は、高忠実で長期間のオーディオ生成のために設計された高度なGANベースのボコーダである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:57:05 GMT)
Neural Networks Generalize on Low Complexity Data [5.7] 本稿では、ReLUを活性化したフィードフォワードニューラルネットワークが、低複雑性データに基づいて一般化されていることを示す。
我々は、そのようなネットワークの記述長の概念とともに、この単純なプログラミング言語を定義する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:53:05 GMT)
Inv-Entropy: A Fully Probabilistic Framework for Uncertainty Quantification in Language Models [5.7] 大規模言語モデル(LLM)は自然言語処理を変換しているが、信頼性の高いデプロイメントには有効な不確実性定量化(UQ)が必要である。
既存のUQメソッドは多くの場合、確率論的基盤を欠いている。
本稿では, 与えられた出力に条件付き入力空間の多様性を評価することによって不確実性を定量的に評価する, 逆モデルに基づく完全確率的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:02:17 GMT)
From Intention to Execution: Probing the Generalization Boundaries of Vision-Language-Action Models [5.7] VLA(Vision-Language-Action)モデルは、汎用的で汎用的なロボットポリシーを作成することを約束する。
従来の模倣学習ベンチマークは言語命令の欠如のため不適当である。
言語命令,視覚,オブジェクトにまたがる10のサブカテゴリにまたがる50のシミュレーションベースのタスクの統合スイートを導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:52:18 GMT)
Share Secrets for Privacy: Confidential Forecasting with Vertical Federated Learning [5.6] 主な課題は、トレーニングと推論の両方において、データのプライバシと、小さくノイズの多いデータセットへの過度な適合である。
VFL' (STV) を用いたシークレット共有時系列予測を提案する。
その結果,STVの予測精度は集中型アプローチに匹敵することがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:08:58 GMT)
AcademicBrowse: Benchmarking Academic Browse Ability of LLMs [5.6] AcademicBrowseは、学術研究における大規模言語モデル(LLM)の複雑な情報検索能力を評価するために設計された最初のデータセットである。
データセットは少なくとも15の学術分野にまたがる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:05:23 GMT)
Bridging the Gap Between Open-Source and Proprietary LLMs in Table QA [5.6] 本稿では,SemEval 2025 Task 8: Question Answering (QA) をテーブル上に構築するシステムを提案する。
提案手法は,テキストからコードへの生成モジュール,自己補正機構,検索拡張生成(RAG)など,いくつかの重要なコンポーネントを統合している。
評価段階では,提案手法は80%の精度を達成し,38チーム中13位にランクインした。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:26:08 GMT)
"Is This Really a Human Peer Supporter?": Misalignments Between Peer Supporters and Experts in LLM-Supported Interactions [5.5] メンタルヘルスは世界的な懸念が高まり、AIによる精神社会的支援へのアクセス拡大への関心を喚起している。
LLMは、特にリアルタイム、テキストベースのインタラクションにおいて、ピアサポートインタラクションを強化する新たな機会を提供する。
我々は、LLMシミュレーションされた苦難クライアント、文脈に敏感なLLM生成提案、リアルタイム感情可視化を備えたAI支援システムを提案し、評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:06:41 GMT)
SafeCoT: Improving VLM Safety with Minimal Reasoning [5.5] 我々は、視覚言語モデルにおける拒絶動作を改善する軽量で解釈可能なフレームワークであるSafeCoTを紹介する。
SafeCoTは,訓練データに制限がある場合でも,過度な拒絶と一般化を著しく低減することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:57:37 GMT)
Energy Aware Development of Neuromorphic Implantables: From Metrics to Action [5.4] スパイキングニューラルネットワーク(SNN)とニューロモルフィックコンピューティングは、従来のニューラルネットワーク(ANN)に代わる有望な選択肢を提供する
SNNモデルのエネルギー性能を評価することは、標準化され実行可能なメトリクスが欠如しているため、依然として課題である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:58:36 GMT)
Securing Open RAN: A Survey of Cryptographic Challenges and Emerging Solutions for 5G [5.3] Open Radio Access Networks (O-RAN)は、モジュール性と柔軟性を5Gデプロイメントに導入する。
本稿では,13の学術・産業ソースを対象に,暗号入札攻撃などの脆弱性を調査し,最近の研究を要約する。
新たなテストベッドと、動的オーケストレーションを容易にするAI駆動のコントローラに重点を置いている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:04:40 GMT)
Generation of frequency entanglement by rotating Doppler effect [5.3] 本稿では,2光子状態の連続的な生成を,後操作によるハイブリッドな自由度で実現する周波数絡み込みを生成する手法を提案する。
これにより、室温で広い周波数範囲で周波数絡み合った光子の任意の修正が可能となる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:01:15 GMT)
Optimal Noise Reduction in Dense Mixed-Membership Stochastic Block Models under Diverging Spiked Eigenvalues Condition [5.3] コミュニティ検出は、現代のネットワーク科学において最も重要な問題の一つである。
本稿では,Airoldiらによって提案されたMMSB(Mixed-Membership Block Model)について考察する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:29:03 GMT)
Analysis of Anonymous User Interaction Relationships and Prediction of Advertising Feedback Based on Graph Neural Network [5.3] 本稿では3つの主要な貢献を成すDTH-GNN(Decoupled Temporal-Hierarchical Graph Neural Network)を提案する。
まず,各相互作用を短周期バースト,昼周期,長距離メモリの3種類のチャネルに分割し,並列拡張残差の畳み込みカーネルを用いて特徴抽出を行う。
第三に、フィードバック知覚のコントラストを定式化し、様々なタイムスライスの一貫性を最大化し、二重ビューターゲットによる制御露光情報のエントロピーを最大化し、二重モーメントキュー蒸留のグローバルプロトタイプを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:40:24 GMT)
Private Aggregation for Byzantine-Resilient Heterogeneous Federated Learning [5.2] 検証可能な秘密共有とセキュアアグリゲーションの慎重な共設計と、調整された対称なプライベート情報検索スキームを含む多段階的手法を提案する。
各種攻撃に対する本手法の有効性を評価し,これまでに知られていた手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:42:18 GMT)
Tractable hierarchies of convex relaxations for polynomial optimization on the nonnegative orthant [5.2] 非負オルサントに含まれる半代数集合上の最適化問題 (POP) を考える。
我々は、ディキンソン・ポフによる P'olya's Positivsatz の拡張に基づく半定緩和階層を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:28:57 GMT)
Is Fine-Tuning an Effective Solution? Reassessing Knowledge Editing for Unstructured Data [5.2] 大規模言語モデル(LLM)の関連知識の更新には,非構造化知識編集(UKE)が不可欠である。
これは、現実世界の知識の一般的な形態である長文や自由形文などの非構造的な入力に焦点を当てている。
従来の研究では有効な方法が提案され、試験されているが、いくつかの問題が存在する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:43:10 GMT)
Can LLMs Generate Good Stories? Insights and Challenges from a Narrative Planning Perspective [5.2] 本稿では,文献事例に基づく物語計画におけるLarge Language Models (LLMs) の評価ベンチマークを提案する。
実験の結果, GPT-4 層 LLM は小さなスケールで因果音を発生させることができるが, キャラクタの意図と劇的な対立を伴う計画は依然として困難である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:27:08 GMT)
A Unified Framework to Enforce, Discover, and Promote Symmetry in Machine Learning [5.1] 機械学習モデルに対称性を組み込むための統一理論および方法論の枠組みを提供する。
対称性の強制と発見は、リー微分の双線型構造に対して双対である線形代数的タスクであることを示す。
本稿では、リー微分と核ノルム緩和に基づく凸正規化関数のクラスを導入することで対称性を促進する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:48:38 GMT)
Code Vulnerability Repair with Large Language Model using Context-Aware Prompt Tuning [5.1] 大規模言語モデル(LLM)は、脆弱なコードの検出と修復において重大な課題を示している。
本研究では、GitHub CopilotをLLMとして使用し、バッファオーバーフロー脆弱性に焦点を当てる。
実験の結果,バッファオーバーフローの脆弱性に対処する際のCopilotの能力には,76%の脆弱性検出率と15%の脆弱性修正率の差が認められた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:41:56 GMT)
MVTamperBench: Evaluating Robustness of Vision-Language Models [5.1] textbfMVTamperBenchは、MLLMの強靭性を5つの一般的なタンパリング手法に対して体系的に評価するベンチマークである。
MVTamperBenchは3.4Kのオリジナルビデオで構成され、19の異なるビデオ操作タスクをカバーする17K以上のタンパー付きクリップに拡張されている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:24:02 GMT)
LLM-Powered CPI Prediction Inference with Online Text Time Series [5.0] 本稿では,オンラインテキスト時系列を取り入れたLCMによるCPI予測手法を提案する。
広く使われている中国のソーシャルネットワークサイトから、大量の高周波オンラインテキストを収集する。
我々は,月毎のCPIデータとLLM生成日毎のCPIサロゲートを組み合わせた時系列フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:41:58 GMT)
Intelligent Design 4.0: Paradigm Evolution Toward the Agentic AI Era [5.0] 本稿では,エージェントAIシステムによる新たなパラダイムとして,インテリジェントデザイン4.0(ID 4.0)を紹介する。
本稿では,ID 4.0の概念的枠組みを提案し,工学設計プロセスのエンドツーエンド自動化を支援する可能性について論じる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:57:26 GMT)
EnrichEvent: Enriching Social Data with Contextual Information for Emerging Event Extraction [4.9] 本稿では、ストリーミングソーシャルデータから特定されていないイベントを特定するために、エンドツーエンドの新規フレームワークであるEnrichEventを提案する。
我々は、ツイートの文脈的知識を活用して、その表現を豊かにし、イベントに関するユーザの意見をよりよく把握する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:21:45 GMT)
AtmosMJ: Revisiting Gating Mechanism for AI Weather Forecasting Beyond the Year Scale [4.9] 本研究では,ERA5データを球面再マッピングなしで直接操作する深層畳み込みネットワークを提案する。
以上の結果から,AtmosMJは約500日間,安定かつ物理的に妥当な予測が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:38:56 GMT)
Identifiability Challenges in Sparse Linear Ordinary Differential Equations [4.9] スパースシステムは,実質的に関係のあるスパース性体制において,正の確率で識別できないことを示す。
さらに、この理論的不同一性は、データから線形ODEを推定する最先端の手法でどのように現れるのかを実証的に研究する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:55:36 GMT)
CausalVQA: A Physically Grounded Causal Reasoning Benchmark for Video Models [4.9] CausalVQAはビデオ質問応答(VQA)のためのベンチマークデータセットである
それは、物理的世界の因果関係に対するモデルの理解を調査する質問と回答のペアで構成されている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:10:36 GMT)
Irony Detection, Reasoning and Understanding in Zero-shot Learning [4.8] 皮肉に焦点を当てたプロンプトは、データセット固有の制限を克服し、一貫性のある人間の読みやすい推論を生成することができる。
皮肉検出,推論,理解におけるLCMのゼロショット能力の向上を目的とした今後の研究の道筋を明らかにする。
これには、皮肉検出における文脈認識の進展、ハイブリッド・シンボリック・ニューラル・メソッドの探索、マルチモーダルデータの統合が含まれる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:02:02 GMT)
CheckManual: A New Challenge and Benchmark for Manual-based Appliance Manipulation [4.8] そこで本研究では,手作業によるアプライアンス操作ベンチマークであるCheckManualを提案する。
具体的には、CADアプライアンスモデルに基づくマニュアルを作成するために、大規模なモデル支援による人為的なデータ生成パイプラインを設計する。
モデル性能評価のための新しいマニュアルベースの操作課題,メトリクス,シミュレータ環境を確立する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:50:48 GMT)
Urban1960SatSeg: Unsupervised Semantic Segmentation of Mid-20$^{th}$ century Urban Landscapes with Satellite Imageries [4.8] $textbfUrban 1960SatBench$は、歴史的衛星画像に基づく注釈付きセグメンテーションデータセットである。
$textbfUrban 1960SatUSM$は教師なしセグメンテーションタスクのためのベンチマークフレームワークである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:41:30 GMT)
Assortment Optimization for Patient-Provider Matching [4.8] プロバイダのローオーバーの増加は、頻繁に、利用可能なプロバイダで患者をリマッチさせる必要が生じる。
患者に限定された提供者メニューを提供することにより,新規な患者支援マッチング手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:17:25 GMT)
Chat-of-Thought: Collaborative Multi-Agent System for Generating Domain Specific Information [4.8] Chat-of-Thoughtは、産業資産のためのFMEA(Failure Modes and Effects Analysis)文書の作成を容易にするように設計されている。
Chat-of-Thoughtでは、高度なAI技術を活用して、複数の協調的なLarge Language Model(LLM)ベースのエージェントを特定の役割で採用している。
このシステムにおける重要な革新は、動的でマルチパーソナライズされた議論によってコンテンツの反復的な洗練を可能にする、思考のチャットの導入である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:06:06 GMT)
Conformal Prediction as Bayesian Quadrature [4.8] 共形予測のような分布のない不確実性定量化技術は、損失ブラックボックスモデルが生じることを保証します。
我々はベイズの観点から共形予測の中心的側面を再考し、頻繁な保証の欠点を解明する。
我々は、解釈可能な保証を提供し、テスト時に観測される可能性のある損失の範囲をよりリッチに表現するベイズ二次法に基づく実用的な代替案を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:39:13 GMT)
LID Models are Actually Accent Classifiers: Implications and Solutions for LID on Accented Speech [4.7] 先行研究により,LIDモデルの性能はアクセント付き音声で著しく低下することが示唆された。
LIDシステムはL2アクセント音声を話者の母語あるいは関連言語と誤分類することが多い。
単言語ASRシステムに頼ることなく,シーケンスレベルの情報をモデルに統合する手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:08:00 GMT)
polyGen: A Learning Framework for Atomic-level Polymer Structure Generation [4.7] 繰り返し単位化学のような最小の入力から高分子構造に特異的に設計された最初の生成モデルであるpolyGenを紹介する。
ポリゲンは、高分子の伝統的な結晶構造予測法の限界を克服し、現実的で多様な線形および分岐配座を生成することに成功した。
天然高分子の弾力性を示す最初の原子レベルの実証実験として、物質構造生成の新たな能力を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:33:57 GMT)
Securing Large Language Models: Threats, Vulnerabilities and Responsible Practices [4.6] 大規模言語モデル(LLM)は、自然言語処理(NLP)のランドスケープを大きく変えた。
本研究は,5つのテーマの観点から,LLMに関するセキュリティとプライバシの懸念を徹底的に調査する。
本稿は, LLMの安全性とリスク管理を強化するために, 今後の研究に期待できる道筋を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:27:36 GMT)
Conditional diffusion models for guided anomaly detection in brain images using fluid-driven anomaly randomization [4.6] 脳MRIにおける異常検出と正常画像再構成のための新しい条件拡散モデルフレームワークを提案する。
我々の弱教師付きアプローチは、合成された擬似病理像をモデリングプロセスに統合し、健康な画像の再構築をより良く指導する。
我々は,ATLASデータセットから合成異常データセットと実病態の両方を用いて,本モデルの病理診断能力を評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:27:00 GMT)
Interface-sensitive microwave loss in superconducting tantalum films sputtered on c-plane sapphire [4.5] タンタル (Ta) はニオブ (Nb) またはアルミニウム (Al) 表面の微細な損失源に対処するための有望な材料として出現した。
ここでは, 成長温度の異なるc面サファイア上にスパッタしたTa, Nb薄膜の構造と電気的性質について系統的研究を行った。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:03:11 GMT)
The Fellowship of the LLMs: Multi-Agent Workflows for Synthetic Preference Optimization Dataset Generation [4.5] 本稿では,マルチモデルを用いた合成優先度最適化(PO)データセットの生成手法を提案する。
データセット生成プロセスの自動化と向上において,これらの有効性と可能性を評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:37:04 GMT)
Large Language Models for Design Structure Matrix Optimization [4.5] 複雑なエンジニアリングシステムでは、設計構造行列(DSM)を用いてコンポーネントや開発活動間の相互依存性をモデル化し分析することが多い。
フィードバックループを最小限に抑え、モジュール性やプロセス効率を向上させるためにDSM内の要素を再編成することは、エンジニアリング設計と運用において困難な最適化問題となっている。
本研究では, 大規模言語モデル (LLM) が, 高度な推論や文脈理解にその能力を活用することで, そうしたCO問題の解決を支援する可能性について検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:53:35 GMT)
DANCE: Deep Learning-Assisted Analysis of Protein Sequences Using Chaos Enhanced Kaleidoscopic Images [4.5] 癌は、制御不能な細胞増殖を特徴とする複雑な疾患である。
T細胞受容体(TCR)は、癌に関連する抗原の認識において重要な役割を担っている。
近年のシークエンシング技術の進歩は、TCRレパートリーの包括的なプロファイリングを促進している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:30:51 GMT)
Style over Substance: Distilled Language Models Reason Via Stylistic Replication [4.3] 特殊推論言語モデル(RLM)は、詳細な推論トレースによるテスト時間計算のスケーリングが性能を大幅に向上させることを示した。
本研究では, 蒸留モデルが推理中に複製された文体パターンを内部にどの程度内在させるかを検討する。
合成トレーサを用いたモデルでは, 蒸留された推理能力は, 表面レベルのパターンに大きく依存していることが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:31:47 GMT)
CHIP: A multi-sensor dataset for 6D pose estimation of chairs in industrial settings [4.3] CHIPは、実際の産業環境における椅子の6次元ポーズ推定のために設計された最初のデータセットである。
CHIPは、ロボットのキネマティクスから自動的に派生した6Dポーズに注釈付けされた77,811RGBD画像からなる。
結果は、データセットがもたらすユニークな課題を強調しながら、改善の余地がかなりあることを示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:13:31 GMT)
Towards Open Foundation Language Model and Corpus for Macedonian: A Low-Resource Language [4.3] LLM(Large Language Models)の採用を促進するリソースを作成します。
これまでにマケドニア最大のコーパスを収集し、40GBのテキストデータと3.5Bの単語を収集した。
我々は、キュレートされたデータセットに基づいて、最先端の8B-パラメータモデルであるinter domestic-yakをトレーニングし、8つのベースラインモデルに対して評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:46:58 GMT)
When Meaning Stays the Same, but Models Drift: Evaluating Quality of Service under Token-Level Behavioral Instability in LLMs [4.3] 本研究では,大規模言語モデルがトークンレベルでの認識のみが異なるが,同じ意味的意図を保持するプロンプトにどのように反応するかを検討する。
本稿では,意味論的に等価なプロンプトリワードの下でのLCMの挙動ドリフトを測定するための診断フレームワークであるPmpt-based Semantic Shift (PBSS)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:26:32 GMT)
Generalized Gaussian Entropy Model for Point Cloud Attribute Compression with Dynamic Likelihood Intervals [4.2] ニューラルネットワークが現在の方法で推定するエントロピーパラメータは、より正確な確率推定に利用できる。
平均誤差判別器 (MED) を提案し, エントロピーパラメータ推定が正確かどうかを判定し, 順列間隔を動的に調整する。
実験により,本手法は3つのVAEモデル上での速度歪み(RD)性能を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:34:56 GMT)
Generalizable and Fast Surrogates: Model Predictive Control of Articulated Soft Robots using Physics-Informed Neural Networks [4.1] 本研究では,データ効率を重視した音声ソフトロボット(ASR)のための物理インフォームドニューラルネットワーク(PINN)を提案する。
リカレントニューラルネットワークとは対照的に、PINNは高い一般化性を提供する。
精度の高いFPモデルの予測速度は、PINNで最大467倍、わずかに精度が低下する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:07:14 GMT)
Wasserstein Barycenter Soft Actor-Critic [4.1] 本稿では、時間差学習のための悲観的アクターと探索を促進する楽観的アクターの恩恵を受けるWBSACアルゴリズムを提案する。
We show that WBSAC is more sample- efficient on MuJoCo continuous control task。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:39:50 GMT)
From Symbolic to Neural and Back: Exploring Knowledge Graph-Large Language Model Synergies [4.1] 本稿では,知識グラフ(KG)と大規模言語モデル(LLM)の相乗効果を系統的に検討する。
KGは、推論を改善し、幻覚を減らし、複雑な質問応答を可能にするLLMと、KGの構築、完了、クエリを容易にするLLM拡張KGである。
本稿では, ニューロシンボリックな統合, ダイナミックなKG更新, データの信頼性, 倫理的考察, より複雑な現実世界の知識タスクを管理できるインテリジェントシステムの実現など, 今後の研究方向性を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:58:14 GMT)
Latent Factorization of Tensors with Threshold Distance Weighted Loss for Traffic Data Estimation [4.1] リアルタイムトラフィックデータ収集プロセスでは、通信障害などの問題が不完全あるいは破損したデータセットにつながることが多い。
外れ値モデル (LFT) の潜在因子化は広く採用され, 有効解となっている。
本稿では,オフリヤモデル(TDFTWL)の閾値距離重み付け(TDW)損失感度依存性の潜在因子化を提案する。
提案したTDFTWLモデルは、精度と計算効率の両面で、最先端のアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:36:13 GMT)
Token Constraint Decoding Improves Robustness on Question Answering for Large Language Models [4.1] 我々は,Token Constraint Decoding (TCD)を導入し,評価する。
この単純で効果的な推論時間アルゴリズムは、ノイズのある設定で堅牢性を高めるためにトークンレベルの予測をアライメントする。
本研究は, 実世界の不完全条件下での推論安定性向上のための, 実用的, モデルに依存しないアプローチとして, TCDを確立した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:33:56 GMT)
Partitewise Entanglement [4.1] 3量子GHZ状態の2部還元状態として$rhoAB$は分離可能であることが知られているが、part $A$とpart $B$は、part $C$をトレースせずに実際に互いに絡み合っている。
任意の次元を持つ任意の$n$-partiteシステムにおいてそのような絡み合いを探索し、[Phys. Rev. A 110, 032420(2024)]で提案されたペアエンタングル(PE)を含むパーティショアエンタングルメント(PWE)と呼ぶ。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:50:04 GMT)
Metric-Entropy Limits on the Approximation of Nonlinear Dynamical Systems [4.1] RNNは、リプシッツ特性を満たす非線形系を近似し、過去の入力を十分に早く忘れることができることを示す。
私たちが考えるシーケンス・ツー・シーケンス・マッピングの集合は近似理論で一般的に解析される関数類よりもはるかに大きいので、洗練された計量エントロピー的特徴付けが必要である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:51:53 GMT)
Societal AI Research Has Become Less Interdisciplinary [4.0] この研究は、2014年から2024年にかけて、ArXivで発行された10万以上のAI関連論文を分析した。
コンピュータ科学のみのチームが、この分野全体の社会的アウトプットのシェアを拡大している。
これらの知見は、社会的AIのドライバに関する共通の仮定に挑戦する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:42:30 GMT)
Minimax optimality of deep neural networks on dependent data via PAC-Bayes bounds [3.9] Schmidt-Hieber (2020) は、最小二乗回帰推定のためにReLuを活性化したディープニューラルネットワークの最小最適性を証明した。
我々は、最小二乗およびロジスティック回帰を含むより一般的な機械学習問題について研究する。
我々は、ロジスティック損失を伴う分類の類似の下限を確立し、提案したDNN推定器がミニマックスの意味で最適であることを証明した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:02:54 GMT)
Convergence of Decentralized Actor-Critic Algorithm in General-sum Markov Games [3.9] 一般的なマルコフゲームにおける学習アルゴリズムの特性について検討する。
特に,各エージェントがアクター批判学習を動的に採用する分散アルゴリズムに着目した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:16:09 GMT)
PGDA-KGQA: A Prompt-Guided Generative Framework with Multiple Data Augmentation Strategies for Knowledge Graph Question Answering [3.9] 知識グラフ質問回答(KGQA)は自然言語処理において重要な課題である。
PGDA-KGQA は,KGQA のための複数のデータ拡張戦略を備えた,プロンプト誘導型生成フレームワークである。
実験により、PGDA-KGQAは標準KGQAの最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:56:03 GMT)
Learning Geometric Invariant Features for Classification of Vector Polygons with Graph Message-passing Neural Network [3.8] より表現的かつ頑健な多角形の潜在表現を学習するための単純なグラフメッセージパッシングフレームワークであるPolyMPを提案する。
このフレームワークは,自己ループグラフ情報を階層的に取得し,多角形分類のための幾何学的不変特徴を学習する。
以上の結果から,PolyMPとPolyMP-DSCは共通変換の下で不変な表現的幾何学的特徴を効果的に捉えていることが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:39:27 GMT)
Learning the dynamics of Markovian open quantum systems from experimental data [3.7] このアルゴリズムはマルコフ・チェイン・モンテカルロのアプローチに基づいている。
我々は,1対の量子エミッタ上で実行される量子光学実験について,我々のアルゴリズムをベンチマークした。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:39:45 GMT)
AURA: A Multi-Agent Intelligence Framework for Knowledge-Enhanced Cyber Threat Attribution [3.7] AURA(Attribution Using Retrieval-Augmented Agents)は、APT属性の自動化と解釈のための知識強化フレームワークである。
AURAはTactics, Techniques, and procedures (TTPs)、Indicators of Compromise (IoCs)、マルウェアの詳細、敵対ツール、時間情報など様々な脅威データを取り込みます。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:00:51 GMT)
Retrofitting Large Language Models with Dynamic Tokenization [3.6] 現在の言語モデル(LM)は固定された静的なサブワードトークン化器を使用する。
このデフォルトの選択は一般的に、特に英語以外の言語において、効率と言語能力の低下をもたらす。
入力テキストに基づいてトークン境界を動的に決定する手法として,動的トークン化を用いたLMの再構成を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:08:24 GMT)
Physiological-Model-Based Neural Network for Heart Rate Estimation during Daily Physical Activities [3.6] 心不全 (HF) は世界的な健康上の課題であり、早期発見は結果を改善する機会を提供する。
個々の心拍数(HR)の推定は、動的デジタルツインとして機能し、心臓のバイオマーカーの正確な追跡を可能にする。
本研究では,日常の身体活動における酸素摂取量(VO2)データに基づくHR推定のための新しい生理モデルベースニューラルネットワーク(PMB-NN)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:48:08 GMT)
TerraMind: Large-Scale Generative Multimodality for Earth Observation [3.5] TerraMindは、地球観測のための初の生成的マルチモーダル基礎モデルである。
他のマルチモーダルモデルとは異なり、TerraMindはトークンレベルとピクセルレベルのデータを組み合わせたデュアルスケール表現で事前訓練されている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:44:41 GMT)
Vectorized Region Based Brush Strokes for Artistic Rendering [3.5] 近年の脳卒中絵は、脳卒中パラメータの予測と反復的精錬によって脳卒中の詳細を捉えることに焦点が当てられている。
これらの手法は、しばしば芸術的原則や意図に沿ったストローク構成を作り出すのに苦労する。
i) 対象領域におけるブラシストロークのセマンティックガイダンスを容易にし, (ii) ブラシストロークパラメータを計算し, (iii) セグメントとストローク間のシーケンスを構築し, 最終的な図面を逐次描画する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:45:36 GMT)
Robust Distributed Estimation: Extending Gossip Algorithms to Ranking and Trimmed Means [3.5] 本研究では,大域的にロバストな数値を推定することにより,外乱平均を計算することができることを示す。
我々は,textscGoRankと呼ばれるランク推定のための新しいゴシップアルゴリズムを提案し,それを応用して,トリミング平均推定専用のゴシップ手順を設計する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:42:15 GMT)
Retrieval of Surface Solar Radiation through Implicit Albedo Recovery from Temporal Context [3.4] 衛星画像からの地表の太陽放射の検索は、クリアスキー条件下で観測される背景反射率の推定に大きく依存する。
本研究では,衛星画像列から透明面反射率を暗黙的に推定する,SSR検索のための注意型エミュレータを提案する。
十分に長期の時間的文脈を提供すると、このモデルはアルベドインフォームドモデルの性能と一致することを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:56:35 GMT)
Low-resource domain adaptation while minimizing energy and hardware resource consumption [3.4] 異なる数値精度フォーマットとデータ並列化戦略が、トレーニング速度とモデルの精度の両方にどのように影響するかを評価する。
私たちの発見は、エネルギー効率、アクセシビリティ、ハードウェアの可用性の制限が重要な懸念事項であるような環境に関係しています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:45:24 GMT)
Traveling Waves Integrate Spatial Information Through Time [3.3] 視覚刺激に応答して隠れた状態で進行波を発生させる畳み込みリカレントニューラルネットワークを導入する。
移動波は局所的に接続されたニューロンの受容野を効果的に拡張し、長距離符号化と情報通信を支援する。
人工ネットワークにおける移動波に基づくコミュニケーションと視覚表現への第一歩として,波動力学が効率性とトレーニング安定性の恩恵をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:57:01 GMT)
Kvasir-VQA-x1: A Multimodal Dataset for Medical Reasoning and Robust MedVQA in Gastrointestinal Endoscopy [3.3] Kvasir-VQA-x1は消化管内視鏡(GI)の新しい大規模データセットである。
我々は159,549組の新しい質問応答ペアを組み込むことで,元のKvasir-VQAを大幅に拡張した。
Kvasir-VQA-x1は、より困難で臨床的に関係のあるベンチマークを提供することで、より信頼性が高く効果的なマルチモーダルAIシステムの開発を加速することを目指している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:31:38 GMT)
Leveraging LLMs for Mission Planning in Precision Agriculture [3.3] 本稿では,自然言語命令を用いて複雑なデータ収集タスクを自律ロボットに割り当てるエンド・ツー・エンドシステムを提案する。
再利用性を高めるために、ミッションプランは既存のIEEEタスク仕様標準を使用してエンコードされ、既存のROSライブラリで高レベルのミッション記述をブリッジするROS2ノードを介してロボットで実行される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:25:23 GMT)
Machine Learning-Based Classification of Oils Using Dielectric Properties and Microwave Resonant Sensing [3.3] 本稿では, 各種油試料の誘電特性に基づく分類のための機械学習手法を提案する。
マイクロ波共振センサは非破壊的で低出力で動作し、特にリアルタイム産業用途に適している。
実験により, ランダム森林分類器を用いて, 99.41%の分類精度が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:41:08 GMT)
Product of Experts with LLMs: Boosting Performance on ARC Is a Matter of Perspective [3.3] トレーニング、生成、スコアリングフェーズを通じて、タスク固有のデータ拡張を活用します。
深度優先探索アルゴリズムを用いて多種多様な高確率候補解を生成する。
本手法はパブリックARC-AGI評価セットにおいて71.6%(286.5/400タスク)のスコアを得る。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:19:33 GMT)
Interpreting learned search: finding a transition model and value function in an RNN that plays Sokoban [3.3] 我々はパズルゲーム「ソコバン」をプレイするために訓練された畳み込みリカレントニューラルネットワーク(RNN)を部分的にリバースエンジニアリングした。
以前の研究によると、このネットワークはテストタイムの計算量を増やして、より多くのレベルを解決している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:36:17 GMT)
YOCO: A Hybrid In-Memory Computing Architecture with 8-bit Sub-PetaOps/W In-Situ Multiply Arithmetic for Large-Scale AI [3.3] 本稿では、アナログインメモリコンピューティング(AiMC)の可能性を探り、YOCOと呼ばれる革新的な人工知能(AI)アクセラレーターアーキテクチャを導入する。
YOCOは計算効率とストレージ密度のバランスをとるためにハイブリッドのReRAM-SRAMメモリ構造を採用している。
3つのSOTAベースラインと比較すると、平均的なYOCOはエネルギー効率を最大3.9x-19.9x、スループットを最大6.8x-33.6x、CNN/トランスフォーマーモデルでは最大6.8x-33.6x向上する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:19:31 GMT)
Identity and Access Management for the Computing Continuum [3.3] 分散化された識別と認証機構を利用するZero-Trust (ZT) アクセス制御ソリューションを提案する。
我々は、関係ベースのアクセス制御(ReBAC)を用いて、連続体に固有の信頼関係の進化を捉えるポリシーを定義します。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:45:25 GMT)
Speech Synthesis By Unrolling Diffusion Process using Neural Network Layers [3.3] UDPNetは音声合成における逆拡散過程を高速化する新しいアーキテクチャである。
UDPNetは、品質と効率の両面で最先端の手法を一貫して上回っていることを示す。
これらの結果は、UDPNetをリアルタイム音声合成アプリケーションのための堅牢なソリューションとして位置づけている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:56:08 GMT)
Synthetic Geology -- Structural Geology Meets Deep Learning [3.2] ボキセル化画像に応用した生成人工知能の技術に基づいて,ニューラルネットワークをトレーニングすることにより,地表の地質データを3次元の地下領域に拡張する手法を実証する。
地質活動のイオンを模倣した合成データ生成プロセスの設計により,地下深層学習の発展におけるこのデータギャップを埋める。
このような合成データに基づいてトレーニングされた基礎モデルは、以前は目に見えない表面地形と地質図から地下の3次元画像を生成することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:42:28 GMT)
Chem42: a Family of chemical Language Models for Target-aware Ligand Generation [3.2] Chem42は、生成化学言語モデルの最先端のファミリーである。
分子構造、相互作用、結合パターンの洗練されたクロスモーダル表現を実現する。
有効な薬物候補の探索スペースを減らすことで、Chem42は薬物発見パイプラインを加速することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:18:10 GMT)
Automatic Treatment Planning using Reinforcement Learning for High-dose-rate Prostate Brachytherapy [3.2] 高用量(HDR)前立腺切断療法では、針の配置パターンは医師の経験にのみ依存する。
本研究は, プレプランニング段階における患者解剖学に基づいて, 針位置と居住時間を提供するための強化学習(RL)の有用性について検討した。
このアプローチは手続き時間を短縮し、一貫した計画品質を確保する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:46:42 GMT)
MindForge: Empowering Embodied Agents with Theory of Mind for Lifelong Cultural Learning [3.2] 大型言語モデル(LLM)を駆使したエージェントは、Minecraftのような世界にオープンエンドの能力を持つことを約束する。
本稿では,文化的生涯学習のための生成型フレームワークであるMindForgeを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:09:04 GMT)
Searching Efficient Deep Architectures for Radar Target Detection using Monte-Carlo Tree Search [3.1] 本稿では,モンテカルロ木探索(MCTS)に基づく新しいニューラルネットワーク探索手法を提案する。
専門家が設計したベースラインよりも大幅に軽量でありながら,必要な検出確率を満たす新しいネットワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:58:33 GMT)
VAT-KG: Knowledge-Intensive Multimodal Knowledge Graph Dataset for Retrieval-Augmented Generation [3.1] 視覚情報,音声情報,テキスト情報を網羅する,概念中心の知識集約型マルチモーダル知識グラフを提案する。
構築パイプラインは,マルチモーダルデータと細粒度セマンティクスの相互知識アライメントを保証する。
本稿では,任意のモダリティからクエリに応答して,概念レベルの詳細な知識を検索する,新しいマルチモーダルRAGフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:22:57 GMT)
Metritocracy: Representative Metrics for Lite Benchmarks [3.1] 評価指標のサブセットの選択のための2つの表現概念を定式化するために,社会選択理論からのアイデアを用いる。
まず、位置表現を導入し、すべての選択肢がすべての位置カットオフで十分に表現されていることを保証します。
次に、位置比例を導入し、任意の位置における小さな誤差よりも、比例的に過大あるいは過小に表現されないことを保証します。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:53:47 GMT)
Outside Knowledge Conversational Video (OKCV) Dataset -- Dialoguing over Videos [3.1] 我々は,2,017ドルのビデオと5,986ドルの人称注釈付き対話,40,954ドルのインターリーブ付き対話によるデータセットを紹介する。
会話モデルは、時間とともに関連する視覚的詳細を認識し、必要な情報が必ずしも視覚情報に存在しないような質問に答えなければならない。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:23:35 GMT)
Learning Interpretable Rules from Neural Networks: Neurosymbolic AI for Radar Hand Gesture Recognition [3.0] ルールベースのモデルは解釈可能性を提供するが、複雑なデータには苦労する。
本稿では,解釈可能なルールリストを学習するRL-Netというニューラルネットワークについて検討する。
我々は、完全に透過的なルールベースシステム(MIRA)と説明可能なブラックボックスモデル(XentricAI)に対してRL-Netをベンチマークする。
以上の結果から,RL-Netは高い性能(93.03% F1)を維持しつつ,ルールの複雑さを著しく低減し,良好なトレードオフを実現していることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:30:48 GMT)
Superstudent intelligence in thermodynamics [3.0] OpenAIの大規模言語モデルo3は、すべての学生を熱力学の試験に駆り立てた。
ゼロショットモードでは、モデルo3が全ての問題を正しく解決しました。
機械は複雑なタスクに精通し、通常は人間の知的能力の証明とみなされる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:01:41 GMT)
One For All: LLM-based Heterogeneous Mission Planning in Precision Agriculture [2.9] 我々は、非特殊主義者が異種ロボットを制御できる自然言語(NL)ロボットミッションプランナーを提案する。
我々のアーキテクチャは、人間の言語をさまざまなロボットプラットフォームで実行可能な中間記述にシームレスに翻訳します。
この研究は、精密農業におけるロボットの自動化を非技術ユーザーにとってよりアクセスしやすいものにするための重要なステップである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:45:44 GMT)
Value Portrait: Assessing Language Models' Values through Psychometrically and Ecologically Valid Items [2.9] 既存のベンチマークは、価値関連のバイアスに弱い人や機械のアノテーションに依存している。
本稿では,実生活におけるユーザ-LLMインタラクションをキャプチャするアイテムからなるValue Portraitベンチマークを提案する。
この心理的に検証されたアプローチは、特定の値と強く相関したアイテムがそれらの値を評価するための信頼できるアイテムとして機能することを保証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:38:26 GMT)
Learning to Align: Addressing Character Frequency Distribution Shifts in Handwritten Text Recognition [2.9] 手書きテキスト認識は、視覚入力を機械可読テキストに変換することを目的としている。
文字集合は時間とともに変化し、文字の頻度分布は歴史的時代や地域によって変化する。
本稿では,予測されたテキストの文字頻度分布とターゲット分布とのワッサーシュタイン距離を組み込んだ新たな損失関数を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:20:30 GMT)
AraReasoner: Evaluating Reasoning-Based LLMs for Arabic NLP [2.9] 大規模言語モデル(LLM)は推論能力の顕著な進歩を示している。
しかし、アラビアデータにおける彼らのパフォーマンスは、豊富な形態学、多様な方言、複雑な文字によって特徴づけられ、未発見のままである。
本稿では,複数の推論に焦点をあてたLLMの総合的なベンチマーク研究について述べる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:00:02 GMT)
Load-Aware Training Scheduling for Model Circulation-based Decentralized Federated Learning [2.8] 本稿では,Tram-FLの拡張であるLoad-Aware Tram-FLを提案する。
計算処理と通信コストの両方を含む全体的なトレーニング遅延は、目的関数によって最小化される。
MNIST と CIFAR-10 のシミュレーション結果から,負荷対応の Tram-FL はトレーニング時間を著しく短縮し,収束を加速することが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:09:53 GMT)
On The Impact of Merge Request Deviations on Code Review Practices [2.8] これらのケースを偏差と仮説で表現し、それらがバイアス分析を無視し、レビュー分析のためにMLモデルを弱めていると仮定する。
MRの37.02%で発生する7つの偏差カテゴリを同定し、数ショットの学習検出法(精度91%)を提案する。
我々は,(1)MR偏差の分類学,(2)AIによる検出アプローチ,(3)MLに基づくレビュー分析への影響の実証的証拠を含む。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:21:02 GMT)
Lower Bounds for Learning Quantum States with Single-Copy Measurements [2.8] 量子トモグラフィーとシャドウトモグラフィーの問題点を,未知の$d$次元状態の個々のコピーを用いて測定した。
特に、この手法は、その複雑さの観点から、フォークロアのパウリ・トモグラフィー(Pauli tomography)アルゴリズムの最適性を厳格に確立する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:10:17 GMT)
Phonology-Guided Speech-to-Speech Translation for African Languages [2.8] 音声合成のための韻律誘導フレームワーク(S2ST)を提案する。
Emphwithin-phylum言語対は30-40%低停止,3$times$以上のオンセット/オフセット相関を示した。
また、人間の判断と強く相関する3層無転写BLEUスイート(M1-M3)もリリースしています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:02:24 GMT)
Weakly Supervised Multiple Instance Learning for Whale Call Detection and Temporal Localization in Long-Duration Passive Acoustic Monitoring [2.7] DSMIL-LocNetは,袋レベルのラベルのみを用いて,クジラの呼検出と位置決めを行うフレームワークである。
我々のデュアルストリームモデルは2~30分間の音声セグメントを処理し、スペクトルと時間的特徴と注意に基づくインスタンス選択を利用する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:25:19 GMT)
MPFNet: A Multi-Prior Fusion Network with a Progressive Training Strategy for Micro-Expression Recognition [2.7] 本稿では,MPFNet(Multi-Prior Fusion Network)を提案する。
発達心理学にインスパイアされたMPFNet--MPFNet-PとMPFNet--Cの2つの変種を,幼児の認知並列処理と階層処理の2つの基本モードに対応して提示する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:39:41 GMT)
Holistic Uncertainty Estimation For Open-Set Recognition [2.7] HolUEはベイズ確率モデルに基づく全体的不確実性推定法である。
クジラとイルカを識別するための新しいオープンセット認識プロトコルを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:35:59 GMT)
LLM-BT-Terms: Back-Translation as a Framework for Terminology Standardization and Dynamic Semantic Embedding [2.7] LLM-BTは、大規模言語モデル(LLM)を利用したバックトランスレーションフレームワークである。
言語間セマンティックアライメントによる用語検証と標準化を自動化するように設計されている。
BLEUスコアと項レベルの精度は、強い言語間の堅牢性を示し、BLEUスコアは0.45を超え、ポルトガル語の項精度は100%に達する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:04:39 GMT)
Meta-Learning and Synthetic Data for Automated Pretraining and Finetuning [2.7] 機械学習(ML)における事前訓練モデルの増加は、実践者にとって大きな課題となる。
モデルがスケールするにつれて、実世界のデータへの依存度の増加は、トレーニングのボトルネックとなり、より効率的にデータを活用する必要がある。
この論文はメタラーニングを採用し、機械学習をディープラーニング領域に拡張する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:48:45 GMT)
DeepExtractor: Time-domain reconstruction of signals and glitches in gravitational wave data with deep learning [2.6] 本稿では,信号とグリッチをインターフェロメーターノイズを超えるパワーで再構成するDeepExtractorを提案する。
我々は,グリッチに関連するアプリケーションに注目し,DeepExtractorの有効性を3つの実験で検証する。
DeepExtractorはGlitchリカバリでBayesWaveを上回り、劇的な計算スピードアップを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:34:01 GMT)
Weighted Loss Methods for Robust Federated Learning under Data Heterogeneity [2.6] フェデレートラーニング(FL)は、複数のデータホルダーが、トレーニングデータを外部と共有することなく、機械学習モデルを協調的にトレーニングすることを可能にする。
FLはプライバシーの観点からは魅力的に思えるが、セキュリティの観点からは(ビザンチン)参加者がモデル収束を害する有毒な勾配(またはモデルパラメータ)に貢献できるため、多くの脅威を開放する。
WoLA(Worker Labelement Loss)は、データの不均一性にもかかわらず、正直な作業者の勾配を整合させる重み付き損失である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:04:43 GMT)
A Cytology Dataset for Early Detection of Oral Squamous Cell Carcinoma [2.6] 口腔扁平上皮癌OSCCは、特にアジア、アフリカ、南米のいくつかの地域では、大きな健康上の負担となっている。
病理組織学に基づく従来の診断は、侵襲的であり、資源集約的で、専門家の病理学者に頼っているため、低リソース環境でのアクセシビリティが制限されている。
このリソースは、自動検出を強化し、診断エラーを低減し、リソース制限された設定における初期OSCC診断を改善することを目的としており、最終的に世界中で死亡率の低下とより良い患者結果に寄与する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:29:24 GMT)
Learning Time-Varying Multi-Region Brain Communications via Scalable Markovian Gaussian Processes [2.6] 我々はマルコフ的ガウス過程を用いて時間変化の時間的遅延で脳のコミュニケーションを学習する新しい枠組みを提案する。
この研究は、分散ニューラルネットワークの理解を深め、動的脳ネットワークを解析するためのスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:36:31 GMT)
Worth Their Weight: Randomized and Regularized Block Kaczmarz Algorithms without Preprocessing [2.5] ランダム化ブロックKaczmarz法(RBK)のデータの一様サンプリング時の収束を解析し,その繰り返しがモンテカルロの感覚で$textit$ least-squaresの解に収束することを示す。
RBKイテレーションに正規化を組み込むことでこれらの問題を制御し、正規化アルゴリズムReBlocKを得る。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:58:47 GMT)
Teaching Physical Awareness to LLMs through Sounds [2.5] ACORNは大規模言語モデル(LLM)の物理的認識を音で教えるフレームワークである。
我々は,包括的音声質問応答データセットであるAQA-PHYを構築し,大きさ情報と位相情報の両方を処理するオーディオエンコーダを提案する。
本研究では,視線検出,ドップラー効果推定,方向推定など,実世界の実世界の課題において合理的な結果を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:18:01 GMT)
Out of Tune: Demystifying Noise-Effects on Quantum Fourier Models [2.4] 量子系のフーリエスペクトル, 表現可能性, エンタングリング能力に対する雑音の影響を系統的に解析する。
デコヒーレントノイズは、全ての試験されたアンスに一様に有害な効果をもたらす。
これは、ハードウェアリソースをより有効活用し、調整されたエラー修正スキームの構築を導くのに役立つかもしれない。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:52:31 GMT)
Towards Energy-Efficient and Low-Latency Voice-Controlled Smart Homes: A Proposal for Offline Speech Recognition and IoT Integration [2.4] 既存のAI音声認識サービスは、主にインターネット上のクラウドプラットフォームにデプロイされている。
オフライン音声認識とIoT技術に基づくスマートホームの概念を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:50:56 GMT)
Revisiting Diffusion Models: From Generative Pre-training to One-Step Generation [2.3] 本研究は,拡散訓練を生成前訓練の一形態と見なすことができることを示す。
パラメータの85%が凍結した事前学習モデルの微調整により、ワンステップ生成モデルを作成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:55:26 GMT)
CEM-FBGTinyDet: Context-Enhanced Foreground Balance with Gradient Tuning for tiny Objects [2.3] マルチスケール機能拡張と適応最適化を統合した新しいアーキテクチャであるE-FPN-BSを提案する。
第一に、私たちのContext Enhancement Module(CEM)は、効率的なグローバルな融合のために高レベルな特徴を整列し、圧縮するためにデュアルブランチ処理を採用している。
第2に、フォアグラウンド-バックグラウンド分離モジュール(FBSM)は、識別領域を動的に増幅する空間ゲーティングマスクを生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:13:38 GMT)
MMREC: LLM Based Multi-Modal Recommender System [2.3] 本稿では,Large Language Models(LLM)とディープラーニング技術を活用して,レコメンデータシステムを強化する新しい手法を提案する。
提案フレームワークは,マルチモーダル情報処理を取り入れたレコメンデーションの精度と妥当性を,統一された潜在空間表現を用いて向上することを目的としている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:27:29 GMT)
ASTAGEN: Empirical Evaluation of Automated SATD Taxonomy Generation with LLMs [2.3] 自己承認技術的負債(英: Self-admitted Technical debt、SATD)とは、ソフトウェアの品質を低下させる最適化コードのことである。
本研究では,大規模言語モデル(LLM)を用いたSATD分類の自動化に向けた最初のステップであるASTAGENを提案する。
我々は、SATDデータセット上のASTAGENを量子ソフトウェア、スマートコントラクト、機械学習の3つの領域から評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:59:57 GMT)
Bias Detection via Maximum Subgroup Discrepancy [2.2] 距離の概念である最大部分群離散性(MSD)を提案する。
この計量において、2つの分布が概して、すべての特徴部分群に対して相違が低ければ近い。
サンプルの複雑さが特徴数で線形であることを示し、実用的な用途で実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:50:00 GMT)
Survival Analysis as Imprecise Classification with Trainable Kernels [2.2] iSurvM、iSurvQ、iSurvJは、不正確な確率理論と注意機構を組み合わせてパラメトリック仮定なしで検閲されたデータを扱う。
合成および実データセットの実験により、提案されたモデルは、精度と計算複雑性の観点から、ベラン推定器を一貫して上回ることを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:40:09 GMT)
In-Context Bias Propagation in LLM-Based Tabular Data Generation [2.2] 文脈内バイアスが緩やかであっても、大域的な統計的歪みにつながることを示す。
悪意のあるコントリビュータが、合成データセットにバイアスを注入する逆シナリオを導入する。
以上の結果から,LSMに基づくデータ生成パイプラインに関連する新たな脆弱性が示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:39:29 GMT)
Learning a Gaussian Mixture for Sparsity Regularization in Inverse Problems [2.2] 逆問題では、スパーシティ事前の組み込みは、解に対する正則化効果をもたらす。
本稿では,ガウスの混合として事前に定式化された確率的疎性について提案する。
我々は、このネットワークのパラメータを推定するために、教師なしのトレーニング戦略と教師なしのトレーニング戦略をそれぞれ導入した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:42:32 GMT)
KI4Demokratie: An AI-Based Platform for Monitoring and Fostering Democratic Discourse [2.2] 私たちは、ジャーナリスト、研究者、政策立案者を支援するAIベースのプラットフォームKI4Demokratieを紹介します。
KI4Demokratieは、毎日収集された大規模なドイツのオンラインデータに機械学習モデルを適用する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:14:36 GMT)
Feature Normalization Prevents Collapse of Non-contrastive Learning Dynamics [2.1] データ拡張によって生成された2つの肯定的なビューをデータ表現空間内のアトラクション力によって類似させるコントラスト学習について検討する。
Tian et al. (2021)は、学習力学解析を通して、データの増大が正規化よりも十分に強い場合、その表現は崩壊を避けることができることを示した。
このコサインの損失は6階のダイナミクス(L2の損失は3階のダイナミクス)を誘導し、安定平衡が動的に現れることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:51:57 GMT)
Feature Engineering for Agents: An Adaptive Cognitive Architecture for Interpretable ML Monitoring [2.1] 大規模言語モデルに基づくエージェントに特徴工学の原則を適用したMLモニタリングのための認知アーキテクチャを提案する。
決定手順モジュールは、リファクタリング、ブレークダウン、コンパイルという3つの重要なステップを通じて、機能エンジニアリングをシミュレートする。
複数のLCMを用いた実験により, 各種ベースラインと比較して精度が有意に向上し, 提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:48:25 GMT)
Leggett-Garg inequalities for multitime processes [2.1] マルチタイムプロセスにおける演算子状態の定式化を用いて,Leggett-Gargの不等式に関するいくつかの側面について検討する。
我々は、レゲット・ガーグ不平等が保持すべきプロセス状態に関する十分な条件を見つけ、そこで、レゲット・ガーグ不平等の違反に対する影響を特徴付ける新しい方法を見出した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:40:25 GMT)
TikTok's Research API: Problems Without Explanations [2.1] TikTokは2023年7月にヨーロッパでResearch APIへのアクセスを拡大した。
この拡張にもかかわらず、提供されたデータには顕著な制限と不整合が持続する。
APIデータは不完全であり、データドキュメンテーションを扱う際には信頼できない。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:50:06 GMT)
Function-Guided Conditional Generation Using Protein Language Models with Adapters [2.1] 本稿では,タンパク質言語モデルへのアダプタを用いたタンパク質の条件生成手法であるProCALMを提案する。
ProCALMは、ターゲット関数からの条件付きシーケンス生成において、既存のメソッドのパフォーマンスと一致またはオーバーする。
また、稀で見えない関数にも一般化できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:50:48 GMT)
ECAM: A Contrastive Learning Approach to Avoid Environmental Collision in Trajectory Forecasting [2.0] 本稿では,環境との衝突回避能力を高めるためのコントラスト学習モジュールECAMを紹介する。
提案モジュールは既存の軌道予測モデルに統合することができ、衝突のない予測を生成する能力を向上させることができる。
実験の結果,提案モジュールと一体化した場合の衝突速度は,最先端手法により著しく低下することがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:35:36 GMT)
GRAIL: A Benchmark for GRaph ActIve Learning in Dynamic Sensing Environments [2.0] グラフベースのアクティブラーニング(AL)はグラフの構造を利用してラベルクエリを効率的に優先順位付けする。
GRAILは、動的で現実世界の環境でグラフAL戦略を評価するために設計されたベンチマークフレームワークである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:04:18 GMT)
Geometric deep learning for local growth prediction on abdominal aortic aneurysm surfaces [2.0] 腹部大動脈瘤 (AAA) は腹部大動脈の進行性局所拡張である。
現在の臨床ガイドラインでは、AAAの最大径が男性55mm、女性50mmを超える場合は、選択的外科的修復を推奨している。
局所的・多物理的特徴に富んだ血管表面のAAA成長を直接予測するためにSE(3)対称変圧器モデルを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:26:10 GMT)
PointNet with KAN versus PointNet with MLP for 3D Classification and Segmentation of Point Sets [1.9] Kolmogorov-Arnold Networks(KAN)は、ディープラーニングフレームワークにおける従来のマルチレイヤパーセプトロン(MLP)に代わるものとして、最近注目を集めている。
kanは、畳み込みニューラルネットワーク、グラフニューラルネットワーク、トランスフォーマーなど、さまざまなディープラーニングアーキテクチャに統合されている。
KansをPointNetに組み込んで、3Dポイントクラウドの分類とセグメンテーションタスクのパフォーマンスを初めて評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:54:30 GMT)
Simulation-trained conditional normalizing flows for likelihood approximation: a case study in stress regulation kinetics in yeast [1.9] 顕著な例は、活発に分裂する細胞のスナップショット測定からタンパク質の産生を推定することである。
ここでの課題は、娘細胞間のタンパク質含量を分割的に正規化することで、非指数的に分散した間隔で発生する細胞分裂に由来する。
シミュレーションデータから抽出可能な確率を近似するために、条件付きフロー(確率分布を学習するために設計されたニューラルネットワークモデルのクラス)を用いる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:44:18 GMT)
Evasion Attacks Against Bayesian Predictive Models [1.9] 本稿では,このようなモデルに対する最適回避攻撃を設計するための一般的な手法を提案する。
本研究では, 特定の点予測の摂動と, 後部予測分布の変化の2つの対向的目的について検討する。
どちらのシナリオに対しても,新しい勾配に基づく攻撃を提案し,その実装と特性を様々な計算装置で検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:53:20 GMT)
MIRAGE: Multimodal foundation model and benchmark for comprehensive retinal OCT image analysis [1.8] MIRAGEは、OCTと走査型レーザー眼鏡(SLO)画像の解析のための新しいFMである。
OCT/SLO分類とセグメンテーションタスクを用いた新しい評価ベンチマークを提案する。
一般および専門的なFMとセグメンテーション法との比較は,MIRAGEの両タスクにおける優位性を示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:38:22 GMT)
On the Privacy Risks of Spiking Neural Networks: A Membership Inference Analysis [1.8] スパイキングニューラルネットワーク(SNN)は、現実のアプリケーションにおいて、そのエネルギー効率と堅牢性のためにますます研究されている。
メンバーシップ推論攻撃(MIA)に対するSNNの感受性について検討する。
MIAは、あるサンプルがトレーニングデータセットの一部であるかどうかを敵が判断しようとする、大きなプライバシー上の脅威である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:08:27 GMT)
CiteFusion: An Ensemble Framework for Citation Intent Classification Harnessing Dual-Model Binary Couples and SHAP Analyses [1.8] CiteFusionは、SciCiteとACL-ARCという2つのベンチマークデータセット上のマルチクラスCitation Intent Classificationタスクに対処する。
このフレームワークは、マルチクラスタスクをクラス固有のバイナリサブタスクに1-vs-all分解する。
その結果、CiteFusionは最先端のパフォーマンスを達成し、Macro-F1スコアはSciCiteで89.60%、ACL-ARCで76.24%であった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:16:14 GMT)
Speeding up adiabatic holonomic quantum gates via $π$-pulse modulation [1.8] 本稿では,$pi$-pulse法に基づく高速ホロノミック量子ゲートの提案を行う。
従来の断熱限界を超えるホロノミックゲートの普遍的な集合を実現する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:59:14 GMT)
Accelerating quantum adiabatic evolution with $π$-pulse sequences [1.8] 我々は,$pi$パルスを用いて急激な断熱的進化を実現することを提案する。
本研究では,2レベルシステムと3レベルシステムの両方において,提案方式の有効性を実証する。
提案手法は従来のSTIRAPプロトコルと比較して高い忠実度を実現し,非断熱遷移を著しく抑制する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:37:45 GMT)
Leveraging data-driven weather models for improving numerical weather prediction skill through large-scale spectral nudging [1.7] 本研究は、物理学に基づくGEMとAIベースのGraphCastモデルの相対的な強みと弱みを示す。
物理空間とスペクトル空間におけるそれぞれの大域的予測の解析により、GraphCast予測された大規模なスケールは、より長いリードタイムにおいてGEMを上回っていることが明らかとなった。
GEMにより予測される温度と水平風の成分を大規模にグラフCast予測に向けてスペクトル的に評価するハイブリッドNWP-AIシステムを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:48:16 GMT)
On the Impossibility of a Perfect Hypervisor [1.7] 私たちはこのモデルの中で2つの定理を証明します。
理論上の不確定性にもかかわらず、完全なハイパーバイザは有限の計算資源を持つ任意のマシンには存在しない。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:05:07 GMT)
Latent Multi-Head Attention for Small Language Models [1.7] 本稿では,小型言語モデルに対する潜時マルチヘッドアテンション(MLA)の総合的研究について紹介する。
標準マルチヘッドアテンション(MHA)、MLA、MLA+RoPE(MLA+RoPE)の3種類のアーキテクチャをベンチマークする。
我々の重要な発見は、半ランクの潜伏次元 (r = d/2) を持つ MLA+RoPE が 45% KV-cache のメモリ削減を実現し、検証損失は 0.3% しか増加していないことである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:48:16 GMT)
Towards Fair Representation: Clustering and Consensus [1.7] 特定の保護された属性に関して、代表的であるだけでなく公平でもあるコンセンサスクラスタリングを見つけます。
調査の一環として,既存のクラスタリングを最小限に修正して公平性を実現する方法について検討した。
我々は,同値なグループ表現とニア線形時間定数係数近似アルゴリズムを用いたデータセットの最適アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:53:50 GMT)
Autonomous Computer Vision Development with Agentic AI [1.7] 本稿では,エージェントAIを用いた自然言語プロンプトから,特殊なコンピュータビジョンシステムを自律的に構築できることを実証する。
これには、医療画像分析ツールを備えたオープンソースのCognitive AI環境であるSimpleMind(SM)の拡張が含まれていた。
コンピュータビジョンエージェントは、肺、心臓、リブの平均ダイススコア0.96、0.82、0.83の50個の胸部X線画像に対して、自動的に設定、訓練、テストを行う。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:21:19 GMT)
Prompt-Guided Latent Diffusion with Predictive Class Conditioning for 3D Prostate MRI Generation [1.7] 潜在拡散モデル(LDM)は、医療画像の機械学習開発に影響を与えるデータの不足を緩和する可能性がある。
本稿では,これらの制約に対処するクラス定義型大規模言語モデルアダプタ (CCELLA) を提案する。
CCELLAは、LDM U-Netと非医学的な大言語モデルエンコードされたテキスト特徴を同時に条件付ける新しいデュアルヘッド条件付け手法である。
前立腺MRIデータセットの3次元FIDスコアは0.025であり、FID 0.071の最近の基礎モデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:12:48 GMT)
Quantum mixture-density network for multimodal probabilistic prediction [1.6] マルチモーダル確率分布は、量子系と古典系の両方で一般的である。
パラメータ化量子回路を用いてマルチモーダル分布を効率的にモデル化する量子混合密度ネットワーク(Q-MDN)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:13:29 GMT)
Improved Supervised Fine-Tuning for Large Language Models to Mitigate Catastrophic Forgetting [1.6] SFTデータにアクセスせずに破滅的忘れを効果的に抑制できる新しい,コスト効率のよいスーパーバイザードファインチューニング法を提案する。
実験結果から,本手法はタスク固有性能を改善しつつ,一般領域での一般化能力を保っていることが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:23:50 GMT)
"I Said Things I Needed to Hear Myself": Peer Support as an Emotional, Organisational, and Sociotechnical Practice in Singapore [1.5] 本稿ではシンガポールの20人の同志とのインタビュー研究から得られた知見を報告する。
参加者がピアサポートを開始、実行、維持し、モチベーション、感情的な労働力、そして彼らのプラクティスを形作る社会文化的側面を強調します。
メンタルヘルスにおける信頼性と文脈に敏感なAIの設計について提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:17:31 GMT)
One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image [1.5] 大規模マルチモーダルモデル(LMM)における幻覚抑制のためのマルチモーダル検索強化(M-RAG)
M-RAGは、事実知識ベース(KB)に悪意のあるエントリを注入することによってシステムを破壊しようとする敵に対する新たな攻撃ベクトルを導入した
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:07:55 GMT)
Towards Bridging Formal Methods and Human Interpretability [1.4] ラベリード・トランジション・システムズの重要性にもかかわらず、これらの設計の人間の理解について事前の研究は行われていない。
我々は148 LTS の設計データセットを作成し、324 対の比較で48 をサンプリングし、Bradley-Terry モデルを用いてそれらをランク付けした。
その結果、Albinの複雑性(tau = 0.444$)、状態空間サイズ(tau = 0.420$)、サイクロマティック複雑性(tau = 0.366$)、冗長性(tau = 0.315$)はLTS設計の人間の理解を最も正確に反映していることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:03:35 GMT)
UniToMBench: Integrating Perspective-Taking to Improve Theory of Mind in LLMs [1.4] 心の理論(ToM)は、大きな言語モデル(LLM)にとって難しい領域である。
本稿では,SimToMとTOMBENCHの強みを統合する統一ベンチマークUniToMBenchを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:55:40 GMT)
HI-SQL: Optimizing Text-to-SQL Systems through Dynamic Hint Integration [1.4] テキスト・ツー・ジェネレーションは自然言語とデータベースのギャップを埋め、ユーザーは専門知識を必要とせずにデータをクエリできる。
履歴クエリログを利用した新しいヒント生成機構を組み込んだパイプラインHI-theを提案する。
先行クエリを解析することにより、マルチテーブルおよびネストされた操作の複雑さを扱うことに焦点を当てたコンテキストヒントを生成する。
提案手法は,LCM生成クエリのクエリ精度を大幅に向上し,呼び出しやレイテンシの面で効率性を確保した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:07:55 GMT)
A Reinforcement Learning Approach for RIS-aided Fair Communications [1.4] 再構成可能なインテリジェントサーフェス(RIS)は、電磁波特性を動的に変化させ、ビームフォーミングを強化する物理要素で構成されている。
本稿では,複数の正則UEユニットに対して,効率的かつ公平なRIS-RLシステムを実現するための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:31:47 GMT)
Using Behavior Trees in Risk Assessment [1.3] 本稿では,開発中心の早期リスク評価のためのモデルに基づくアプローチを提案する。
本研究では,行動木モデルを用いてリスク評価活動を支援する。
本研究は,コード実装とリスク評価のアウトプットのギャップを埋める早期識別,可視化,支援における行動ツリーモデルの可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:07:21 GMT)
Assessing a Safety Case: Bottom-up Guidance for Claims and Evidence Evaluation [1.3] 本稿では,その主張と証拠によって安全事例がいかに支持されているかを評価するためのアプローチを,全体事例の信頼性を確立するためのアプローチとして検討する。
本論文は,技術監査の実施状況に基づくものであるが,特に安全事例の信頼性を判断する上での課題に対処するものである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:52:03 GMT)
A Unified Theory of Compositionality, Modularity, and Interpretability in Markov Decision Processes [1.3] 我々は、新しい報酬のないマルコフ決定プロセスのためのオプションカーネルベルマン方程式(OKBE)を紹介する。
OKBEは、状態時オプションカーネル(STOK)と呼ばれる予測マップを直接構築し、最適化し、ゴールを達成する確率を最大化する。
我々は、報酬-最大化は構成性、モジュラリティ、解釈可能性の性質と矛盾していると主張する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:21:22 GMT)
Anomaly Detection via Autoencoder Composite Features and NCE [1.3] オートエンコーダ(AE)または生成モデルは、通常入力のデータ分布をモデル化するためにしばしば使用される。
ノイズコントラスト推定(NCE)を訓練したAEと確率モデルの両方が異常検出を行うための非結合型トレーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:05:27 GMT)
variability.dev: Towards an Online Toolbox for Feature Modeling [1.3] ドメインとは独立して、モデラーはモデルを開き、閲覧し、編集し、変換し、保存し、設定する必要がある。
この記事では、FeatureIDE上に構築された機能モデリングのための、開発中のオンラインライブラリのプレビューを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:20:24 GMT)
Standard Language Ideology in AI-Generated Language [1.3] 標準言語イデオロギーは、大言語モデル(LLM)によって生成された言語に反映され、強化される
我々は、AI生成言語における標準言語イデオロギーがどのように現れるかを示す、オープンな問題の表層分類を提示する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:54:54 GMT)
Multi-Variable Batch Bayesian Optimization in Materials Research: Synthetic Data Analysis of Noise Sensitivity and Problem Landscape Effects [1.3] 本研究は, 実験材料研究における多数の入力変数とノイズを含む結果をエミュレートすることを目的とする。
最適化の進捗を効果的に追跡するために、学習曲線、パフォーマンスメトリクス、可視化を示す。
本研究の結果と方法により,実験材料研究の指導におけるBOの活用が促進される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:57:24 GMT)
Estimating the Joint Probability of Scenario Parameters with Gaussian Mixture Copula Models [1.2] 本稿では,自動走行システムの安全性検証のための運転シナリオの統計的モデリングへのガウス混合コプラモデルの最初の応用について述べる。
1千万件のシナリオで評価したところ、ガウス混合コプラモデルの方が、可能性とシンクホーン距離の両方において、データに適していることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:30:20 GMT)
From Concept to Measurement: A Survey of How the Blockchain Trilemma Can Be Analyzed [1.2] ブロックチェーンのトリレンマサブコンセプトを分析するためのメトリクスを通じて、コンストラクトとそれらの運用を識別するためのアプローチをレビューする。
この研究は、ブロックチェーンのトリレンマがどのようにブロックチェーンシステムに現れるかについて、より洗練された調査のための理論的基盤を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:10:08 GMT)
A Proposal to Extend the Common Model of Cognition with Metacognition [1.2] 認知の共通モデルにメタ認知を統合する統一的なアプローチを提案する。
本提案では,CMCの既存の認知機能を活用し,動作メモリ内で利用可能な構造や情報の最小限の拡張を行う。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:35:45 GMT)
NeRF-CA: Dynamic Reconstruction of X-ray Coronary Angiography with Extremely Sparse-views [1.2] 既存のCA再構成手法では、広範なユーザインタラクションや大規模なトレーニングデータセットが必要になることが多い。
NeRFは、これらの要求なしに、自然と医療の文脈で高忠実なシーンを再構築することに成功している。
完全自動4DCA再建に向けた第一歩であるNeRF-CAを導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:37:43 GMT)
AI5GTest: AI-Driven Specification-Aware Automated Testing and Validation of 5G O-RAN Components [1.2] AI5GTest - AIによる仕様対応テストフレームワーク。
O-RANコンポーネントの検証を自動化するように設計されている。
従来の手動の手法に比べて、全体のテスト実行時間が大幅に削減されている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:49:57 GMT)
Is Long Context All You Need? Leveraging LLM's Extended Context for NL2SQL [1.2] 大きな言語モデル(LLM)は、さまざまな自然言語処理タスクにまたがる印象的な機能を示している。
この意味的曖昧な問題に対する一つのアプローチは、より十分な文脈情報を提供することである。
長いコンテキストLLMは堅牢であり、拡張されたコンテキスト情報では失われないことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:49:37 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。
モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。
3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:30:56 GMT)
SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving [1.1] 本稿では,大規模言語モデル(LLM)をエッジで効率的に参照するための新しいアプローチを提案する。
多様なドラフトモデルを用いて、複数の候補トークンをローカルに作成できる軽量エッジデバイスであるSLEDを提案する。
単一の共有エッジサーバは、より正確なターゲットモデルを用いてトークンを効率よくバッチし、検証する。
Jetson Orin Nano、Raspberry Pi 5、6000エッジサーバを使った最初の実験は、大きなメリットを示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:55:54 GMT)
Ties of Trust: a bowtie model to uncover trustor-trustee relationships in LLMs [1.1] 大規模言語モデル(LLM)における信頼の概念化と定式化のためのボウイモデルを提案する。
コアコンポーネントは、信頼者と信頼者、そしてそれらの複雑な関係を結び付けることによって、信頼を包括的に探求する。
我々はこれらの関係を、提案されたボウティーモデルと、その社会技術エコシステムの範囲内で明らかにする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:42:52 GMT)
Step-by-step Instructions and a Simple Tabular Output Format Improve the Dependency Parsing Accuracy of LLMs [1.1] そこで我々は,音声の共通部分タグ付けが,構文的頭部と依存性ラベルの予測に先行する,新しいステップバイステップの指示戦略を提案する。
本手法は,幻覚や汚染を伴わない17言語を対象に,Universal Dependenciesデータセットの最先端精度を実現する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:56:10 GMT)
HRTR: A Single-stage Transformer for Fine-grained Sub-second Action Segmentation in Stroke Rehabilitation [1.1] 単一段変圧器における高分解能(細粒度)サブ秒動作の時間的局所化と分類を行うための高分解能時間変換器(HRTR)を提案する。
HRTRはストローク関連と一般的なデータセットの両方で最先端のシステムより優れている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:45:27 GMT)
Intelligent System of Emergent Knowledge: A Coordination Fabric for Billions of Minds [1.1] Intelligent System of Emergent Knowledge (ISEK)は、人間と人工知能エージェントが仲間として協力する分散ネットワークを確立する。
ISEKは,(1)検閲に抵抗する分散型マルチエージェントアーキテクチャ,(2)参加権の平等な共生型AI-ヒューマンコラボレーション,(3)分散コンセンサス機構によるレジリエントな自己適応,の3つの基本原則を組み合わせる。
経済インセンティブはネイティブの$ISEKトークンによって管理され、マイクロペイメント、ガバナンスへの参加、評判追跡が促進される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:28:05 GMT)
Online Discovery of Simulation Models for Evolving Business Processes (Extended Version) [1.1] ビジネスプロセスシミュレーション(Business Process Simulation、BPS)とは、ビジネスプロセスの動的な振る舞いを再現する技術である。
過去のイベントログからシミュレーションモデルを自動的に発見するための多くのアプローチが提案されている。
本稿では,Incremental Process Discovery と Online Machine Learning を組み合わせたストリーミングプロセスシミュレーション発見手法を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:57:05 GMT)
PARAFAC2-based Coupled Matrix and Tensor Factorizations with Constraints [1.1] AO(Alternating Optimization)とADMM(Alternating Direction Method of Multipliers)を用いたPARAFAC2ベースのCMTFモデルに適合するフレキシブルなアルゴリズムフレームワークを提案する。
様々なシミュレーションと実際のデータセットの実験は、提案したフレームワークの有用性と汎用性を示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:17:52 GMT)
Refining ensemble $N$-representability of one-body density matrices from partial information [1.0] アンサンブルワンボディの$N$-representability問題の階層を導入する。
この緩和された問題は、ホーンの問題の一般化に関連していることを示す。
さらなる凸緩和により、格子サイト占有に対する物理的に有意な制限を与える凸ポリトープが得られる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:36:32 GMT)
Revisiting the Equivalence of Bayesian Neural Networks and Gaussian Processes: On the Importance of Learning Activations [1.0] トレーニング可能なアクティベーションは、広範囲なBNNに対するGP前の効果的なマッピングに不可欠であることを示す。
また、設計によるグローバルな定常性を確保するためのトレーニング可能な周期的アクティベーションも導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:20:31 GMT)
Local surrogates for quantum machine learning [1.0] 推論は古典的なサロゲートに還元されるので、トレーニングが完了すると余分な量子計算コストが軽減される。
本稿では,再アップロード型量子学習モデルに基づく局所代用プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:14:15 GMT)
Prompt Attacks Reveal Superficial Knowledge Removal in Unlearning Methods [1.0] 素早い攻撃を受けると、いくつかの機械学習手法が失敗する可能性があることを示す。
アウトプットベース、ロジットベース、プローブ分析を用いて、未学習の知識がどの程度検索できるかを判断する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:36:30 GMT)
Modeling Probabilistic Reduction using Information Theory and Naive Discriminative Learning [1.0] 我々はBuckeyeコーパスを用いた3つのモデルについて検討した。1つは情報理論式を用いたNDL由来予測器、もう1つは従来のNDL予測器、もう1つはN-gram確率予測器である。
以上の結果から,N-gramモデルはNDLモデルよりも優れており,NDLが認知モチベーションが高いという仮定に挑戦する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:54:49 GMT)
Advancing Decoding Strategies: Enhancements in Locally Typical Sampling for LLMs [0.9] Adaptive Semantic-Aware typicality Smpling (ASTS) は局所典型サンプリング (LTS) アルゴリズムの改良版として提案されている。
ASTSは、計算効率を維持しながら、文脈的に一貫性があり多様なテキスト生成を保証する。
実験の結果,ASTSは反復を減らし,セマンティックアライメントを強化し,流速を向上させることにより,既存のサンプリング技術よりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:08:29 GMT)
Playing in the Sandbox: A Study on the Usability of Seccomp [0.9] 7人の経験豊富なSeccomp開発者が、アプリケーションに対するサンドボックスのアプローチについて調査したユーザビリティ試験を報告します。
Seccompの使用に関する多くの課題、参加者によるサンドボックス設計、そして開発者が効果的にサンドボックスアプリケーションを簡単にできると考えるものについて強調する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:27:16 GMT)
Attention-Bayesian Hybrid Approach to Modular Multiple Particle Tracking [0.8] 本研究では,素粒子の挙動を自己認識する能力とベイズフィルタの信頼性と解釈性を組み合わせたハイブリッドトラッキングフレームワークを提案する。
提案手法は,スプリアス検出に対するトラッキング精度とロバスト性の向上を実証し,高精度な複数粒子追跡シナリオのソリューションを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:47:37 GMT)
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery [0.8] 我々は、当初、約10,610人の高品質な人間のピアランク写真画像からなるDataSeeds.AIサンプルデータセット(DSD)を紹介した。
DSDは、商用画像データセットの新しい標準となるように設計された基礎的なコンピュータビジョンデータセットである。
我々は、DSDが既知のベンチマークに対する特定のモデルに対して生成した量的改善を文書化し、我々の評価で使用されるコードとトレーニングされたモデルを一般公開する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:13:04 GMT)
Low-Loss Space in Neural Networks is Continuous and Fully Connected [0.8] 2つの異なるミニマを、損失の少ない中間点からなる経路に接続できることを示す。
また、モデル一般化を改善するための新しい可視化手法や機会も提供しています。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:28:36 GMT)
A new approach for image segmentation based on diffeomorphic registration and gradient fields [0.8] 本稿では,2次元画像分割のための新しい変分フレームワークを提案する。
本手法は,画像領域の微分同相変換によるテンプレート曲線の変形としてセグメンテーションをモデル化する。
このアプローチはPythonで実装されており、PyKeopsライブラリを使用してGPUアクセラレーションを行う。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:16:15 GMT)
Guided Graph Compression for Quantum Graph Neural Networks [0.7] この研究は、グラフオートエンコーダを使用してノード数とノード特徴の次元の両方を削減する、ガイド付きグラフ圧縮(GGC)フレームワークを導入している。
このフレームワークは、高エネルギー物理学における基本的な重要性の分類問題であるJet Taggingタスクに基づいて評価される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:36:29 GMT)
Scoop-and-Toss: Dynamic Object Collection for Quadrupedal Systems [0.7] 四足歩行ロボットは、足の機敏性を活用して、追加のアクチュエーターを使わずに物体を収集できるフレームワークを提案する。
スクープのようなアドオンを片足に装着することで、ロボットは物体をスクープして背中に取り付けられた収集トレイに投げ込むことができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:28:27 GMT)
MADCluster: Model-agnostic Anomaly Detection with Self-supervised Clustering Network [0.7] 自己教師付きクラスタリングを利用したモデルに依存しない異常検出フレームワークMADClusterを提案する。
中心となる考え方は、通常のパターンデータを'単一クラスタ'にクラスタ化すると同時に、クラスタセンタを学習し、このセンタに近いデータをマッピングすることです。
4つの時系列ベンチマークデータセットの実験では、MADClusterを適用することで、比較モデルの全体的なパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:58:55 GMT)
Assessing the Quality of Denoising Diffusion Models in Wasserstein Distance: Noisy Score and Optimal Bounds [0.7] 拡散確率モデル(DDPM)は、推定スコア関数によって駆動される拡散過程を介してブラウン運動をマッピングすることでそのような例を構築する。
We establish finite-sample guarantees in Wasserstein-2 distance that exhibit two key features: (i) they characterizedize and Quantify the robustness of DDPMs to noisy score estimates, and (ii) they achieve faster convergence rate than previously known results。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:55:24 GMT)
Reevaluating Meta-Learning Optimization Algorithms Through Contextual Self-Modulation [0.7] 文脈自己変調(CSM)はニューラルコンテキストフロー(NCF)の強力な正規化機構である
我々は,CSMを関数空間に埋め込むことで無限変量に拡張する$i$CSMと,サンプリングされた最も近い環境の集合を通して,低コストなメタ段階更新の近似を提供することでスケーラビリティを向上させる$NCFという2つの拡張を導入する。
これらの拡張は、力学系、コンピュータビジョン問題、曲線フィッティング問題など、様々なタスクに関する包括的な実験を通じて実証される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:33:56 GMT)
Synthetic Human Action Video Data Generation with Pose Transfer [0.7] 本稿では,ポーズ転送を用いた合成人間の行動映像データを生成する手法を提案する。
本手法をToyota SmarthomeおよびNTU RGB+Dデータセット上で評価し,動作認識タスクの性能向上を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:52:39 GMT)
Dataset of News Articles with Provenance Metadata for Media Relevance Assessment [0.7] アウト・オブ・コンテクスト(Out-of-context)と誤分布画像(disattributed image)は、現代の偽情報や偽情報の風景におけるメディア操作の先駆的な形態である。
本稿では,プロビデンスタグ付き画像を用いたニュース記事データセットであるNews Media Provenanceデータセットを紹介する。
本稿では,このデータセット上の2つのタスク,起点関連位置(LOR)と始点関連時刻(DTOR)を定式化し,6つの大言語モデル(LLM)のベースライン結果を示す。
LORのゼロショット性能は期待できるが、DTORのパフォーマンスは妨げられ、特殊なアーキテクチャや今後の作業のための余地を残している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:21:05 GMT)
Abstraction-Based Proof Production in Formal Verification of Neural Networks [0.7] 本稿では,抽象的検証を実証する新しいフレームワークを提案する。
この作業は、共通の抽象化技術をサポートすることにより、スケーラブルで信頼性の高い検証を可能にすることを目的としている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:00:09 GMT)
Vastextures: Vast repository of textures and PBR materials extracted from real-world images using unsupervised methods [0.7] Vastexturesは50,000のテクスチャとPBR素材のリポジトリで、教師なしのプロセスを用いて現実世界の画像から抽出される。
天然画像から採取した2次元テクスチャと、これらのテクスチャから生成されたSVBRDF/PBR材料からなる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:33:31 GMT)
Center-fixing of tropical cyclones using uncertainty-aware deep learning applied to high-temporal-resolution geostationary satellite imagery [0.7] 本研究では,熱帯サイクロンの表面循環中心の位置を決定するための深層学習アルゴリズムを開発した。
赤外線衛星画像のアニメーション(時系列)を取り込み、ラグタイムで最大4時間までの9チャンネルを含む。
独立したテストデータセットでは、GeoCenterはすべてのシステムの平均/平均RMS誤差26.6/22.2/32.4 km、熱帯システム24.7/20.8/30.0 km、カテゴリー2〜5ハリケーン14.6/12.5/17.3 kmを達成している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:01:00 GMT)
Forecasting high-impact research topics via machine learning on evolving knowledge graphs [0.7] 我々は、研究者がこれまでに出版したことのないアイデアの発症の影響を予測する方法を示す。
我々は、2200万以上の科学論文から構築された大きな進化した知識グラフを開発した。
機械学習を用いることで、進化するネットワークのダイナミックな未来を高精度で予測できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:14:34 GMT)
SyncFed: Time-Aware Federated Learning through Explicit Timestamping and Synchronization [0.7] emphSyncFedは、明示的な同期とタイムスタンプを使用して、システム全体で共通の時間的参照を確立する、時間対応のFLフレームワークである。
静的性は、NTP(Network Time Protocol)の下で交換されたタイムスタンプに基づいて数値化され、サーバがクライアント更新の相対的な鮮度について推論することができる。
地理的に分散したテストベッドを用いた実験により, グローバルモデルが安定な時間的文脈で進化し, 精度と情報更新性が向上したことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:29:20 GMT)
Exploring Topological and Localization Phenomena in SSH Chains under Generalized AAH Modulation: A Computational Approach [0.6] Su-Schrieffer-Heeger (SSH) モデルは1次元トポロジカル絶縁体の正準例として機能する。
本稿では,トポロジ,準周期性障害,非ハーモニティ,時間依存運転の相互作用について考察する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:31:07 GMT)
Optimizing Shortfall Risk Metric for Learning Regression Models [0.6] UBSRは、基礎となる分布の非線形関数であるため、UBSRの目的による経験的リスク最小化は困難である。
分岐型アルゴリズムを考案し,UBSR最適解への収束を確立する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:47:35 GMT)
Context Is Not Comprehension: Unmasking LLM reasoning blind spots with VLO [0.6] 大きな言語モデルはListOps方程式をほぼ完璧に解けるが、VLOのパフォーマンスはわずか10kトークンで崩壊する。
VLOは決定論的でネストされた計算をコヒーレントなストーリーに織り込み、モデルが明示的な値を見つけるのではなく、内部の状態を追跡して更新することを強制する。
実験により,生のListOps方程式をほぼ完全精度で解くことができるLLMが10kトークンでVLOの性能を低下させることを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:14:53 GMT)
LLM-Driven Data Generation and a Novel Soft Metric for Evaluating Text-to-SQL in Aviation MRO [0.6] そこで本研究では,F1スコアベースの'ソフト'メトリクスを新たに導入し,実測値と実測値の重なりを定量化する。
我々は,MROデータベース上での実証的な評価を通じて,我々の貢献を実証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:04:13 GMT)
Towards Foundational Models for Dynamical System Reconstruction: Hierarchical Meta-Learning via Mixture of Experts [0.6] MixER: Mixture of Expert Reconstructors, a novel sparse top-1 MoE layer using a custom gating update algorithm based on $K$-means and least squares。
実験では、MixERの能力を検証し、最大10の通常のパラメトリック微分方程式の系に対する効率的なトレーニングとスケーラビリティを示す。
我々の層は、特に専門家が高度に関連したデータポイントからなるデータセットのごく一部しか処理できない場合、ハイデータレシエーションにおける最先端のメタラーナーを過小評価します。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:38:50 GMT)
The Effects of GitHub Copilot on Computing Students' Programming Effectiveness, Efficiency, and Processes in Brownfield Programming Tasks [0.6] GitHub Copilotは、ジェネレーティブ人工知能(GenAI)コーディングアシスタントである。
本稿では,GitHub Copilotが大学生のプログラミングパフォーマンス,行動,理解にどのように影響するかを検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:18:53 GMT)
Stakeholder Participation for Responsible AI Development: Disconnects Between Guidance and Current Practice [0.6] 責任AI(rAI)ガイダンスは、AI開発中のステークホルダー関与(SHI)を促進する。
Shiはすでに商用ソフトウェア開発で一般的ですが、潜在的に異なる目標があります。
本研究は,確立された Shi の実践が rAI 活動および潜在的な切断にどの程度貢献できるかを明らかにする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:43:07 GMT)
Apollo: A Posteriori Label-Only Membership Inference Attack Towards Machine Unlearning [0.6] 我々は、厳密な脅威モデルに従って、データサンプルが未学習であるかどうかを推測する新しいプライバシ攻撃を提案する。
提案攻撃は,従来の攻撃に比べてターゲットモデルへのアクセスを少なくするが,未学習サンプルの登録状況は比較的精度が高い。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:43:36 GMT)
Data-Centric Safety and Ethical Measures for Data and AI Governance [0.6] AIとデータセットライフサイクルのさまざまなステージを含む、責任あるデータセット設計フレームワークを提案する。
このフレームワークは、データセットの作成、使用、共有における責任あるプラクティスを促進して、レッドチーム化を促進し、リスクを最小限にし、AIモデルの信頼を高める。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:26:50 GMT)
Fundamental Limits of Learning High-dimensional Simplices in Noisy Regimes [0.6] 確率の高いアルゴリズムは、$ell$または総変分(TV)距離を真単純度から最大$varepsilon$で出力する。
雑音のないシナリオでは、我々の下界の$n ge Omega(K/varepsilon)$は既知の上界を定数要素まで一致させる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:35:38 GMT)
SANGAM: SystemVerilog Assertion Generation via Monte Carlo Tree Self-Refine [0.6] 本稿では,産業レベルの仕様からSVAを自動生成するためのLLM誘導モンテカルロ木探索を用いたSystemVerilog Assertion GenerationフレームワークであるSANGAMを紹介する。
その結果、我々のフレームワークであるSANGAMは、より堅牢なSVAを生成できることを示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:43:24 GMT)
Enhancing Bagging Ensemble Regression with Data Integration for Time Series-Based Diabetes Prediction [0.5] この研究は、2011年から2021年までの糖尿病関連データセットを統合するデータエンジニアリングプロセスから始まった。
次に、米国各都市における糖尿病の流行を予測する時系列予測のための拡張型バッグアンサンブル回帰モデル(EBMBag+)を導入する。
実験の結果,EBMBag+は0.41,RMSEは0.53,MAPEは4.01,R2は0.9であった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 04:21:50 GMT)
Convergence Conditions for Stochastic Line Search Based Optimization of Over-parametrized Models [0.5] 我々は、PLetrized line search に基づくアプローチと、一般的な検索方向を用いたアプローチに焦点をあてる。
我々は、アルゴリズムの一般クラスの高速収束を証明するために必要となる方向のさらなる性質について光を当てた。
運動量、共役勾配、適応的事前条件法に線探索を統合することが興味があるかもしれない。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:48:15 GMT)
MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion [0.5] マイクロ・エクスプレッション(ME)は微妙で、個人の真の感情状態を明らかにする非言語的な手がかりを流している。
既存のME研究は単一の視覚的モダリティに限られており、他の生理的モダリティによって伝達される豊かな感情情報を見渡せる。
本研究は,顔行動信号の同期収集を可能にする新しいME,MMMEを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:13:10 GMT)
The Impact of Feature Scaling In Machine Learning: Effects on Regression and Classification Tasks [0.5] 本研究は、14の機械学習アルゴリズムと16のデータセットにまたがる12のスケーリングテクニックを体系的に評価することで、機能スケーリングに関する包括的な研究が欠如していることに対処する。
我々は、予測性能(精度、MAE、MSE、R2$など)と計算コスト(トレーニング時間、推論時間、メモリ使用量)への影響を慎重に分析した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:44:11 GMT)
A Heuristic Algorithm Based on Beam Search and Iterated Local Search for the Maritime Inventory Routing Problem [0.5] 海運インベントリ問題(MIRP)は、世界の海運レベルの統合において重要な役割を担っている。
MIRPは世界海運水準の統合において重要な役割を担っている。
大規模なMIRPインスタンスやその変種を効率的に解決できる、確立された方法論はいまだに存在しない。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:25:50 GMT)
A look at adversarial attacks on radio waveforms from discrete latent space [0.4] VQVAEはデジタル無線波形を離散潜在空間にマッピングする。
本研究では,高SNR(RF)データポイント上で対向攻撃を行う場合のVQVAEの攻撃抑制特性を解析する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:09:26 GMT)
Arrival Control in Quasi-Reversible Queueing Systems: Optimization and Reinforcement Learning [0.4] 本稿では,準可逆待ち行列システムの到着率を最適化するための多目的スキームを提案する。
準可逆性キューシステムにバランスの取れた到着制御ポリシを補足することで、準可逆性を維持できることを示す。
我々は、入場制御の問題に焦点を合わせ、最適化と強化学習の枠組みにおいて結果を活用する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:41:33 GMT)
DAWN: Designing Distributed Agents in a Worldwide Network [0.4] DAWNはグローバルに分散エージェントを登録し、ゲートウェイエージェントを通じて簡単に発見できる。
No-LLM Mode for Deterministic Task, Copilot for augmented decision-making, and LLM Agent for autonomous operations。
DAWNは、専用の安全性、セキュリティ、コンプライアンスレイヤを通じて、世界中のエージェントコラボレーションの安全性とセキュリティを保証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:01:22 GMT)
Multi-Qubit Parity Gates for Rydberg Atoms in Various Configurations [0.4] 中性原子系におけるマルチキュービットパリティ相ゲートを実現するためのネイティブアプローチを提案する。
レーザー位相の時間プロファイルを形成することにより、個々の量子ビットアドレッシングを必要とせず、高忠実で時間効率の良い複数の量子ビット間のエンタングリング操作を可能にする。
その結果、短期中性原子量子プロセッサにおける複雑なマルチキュービット量子演算の実践的実装が容易となった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:02:51 GMT)
Integrating Universal Generative AI Platforms in Educational Labs to Foster Critical Thinking and Digital Literacy [0.4] 本稿では,ジェネレーティブ・人工知能(GenAI)プラットフォームを実験室に組み込むための新しい教育枠組みを提案する。
大規模言語モデル(LLM)への不クリティカルな依存の限界とリスクを認識して、提案された教育モデルでは、GenAIを研究対象と認知ツールとして再編成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:45:51 GMT)
From over-reliance to smart integration: using Large-Language Models as translators between specialized modeling and simulation tools [0.4] 大規模言語モデル(LLM)はモデリングとシミュレーション(M&S)に変革をもたらす
過信リスクは曖昧さ、論理的ショートカット、幻覚によって品質を損なう。
本稿では,M&Sタスクにおける複雑性を軽減するため,特殊なツール間でLLMを翻訳器として統合することを提唱する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:39:08 GMT)
Assessment of Evolving Large Language Models in Upper Secondary Mathematics [0.4] 大規模言語モデル (LLMs) は、教育環境での期待が高まっているが、数学的推論は進化していると考えられている。
本研究では,高等中等教育のための高度なデジタルテストであるフィンランド・マトリキュレーション試験を用いて,様々なLSMの数学的能力を評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:49:35 GMT)
HQFNN: A Compact Quantum-Fuzzy Neural Network for Accurate Image Classification [0.4] 高量子化ファジィニューラルネットワーク(HQFNN)は、量子信号を軽量CNN特徴抽出器に結合する。
HQFNNは、古典的でファジィで量子のみのベースラインを一貫して超越している。
ゲートカウント解析は、回路深さが入力次元と直交的に増加することを示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:12:20 GMT)
Feasibility Study of CNNs and MLPs for Radiation Heat Transfer in 2-D Furnaces with Spectrally Participative Gases [0.3] そこで我々は,2次元壁状領域における放射熱伝達解を近似する代理モデルを構築した。
この研究の独創性は、CNNアーキテクチャに適合するために問題(ガスと壁の特性)の入力を適応させることにある。
CNNアーキテクチャの性能は、より古典的なアーキテクチャと比較される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:14:50 GMT)
The Popularity Hypothesis in Software Security: A Large-Scale Replication with PHP Packages [0.3] 本稿では,ソフトウェアの人気がセキュリティやセキュリティに関係しているという仮説を考察する。
調査対象のデータセットには,PHPで記述された40万近いオープンソースソフトウェアパッケージが含まれている。
その結果、リリース履歴の脆弱性によって影響を受けるパッケージは、単一の脆弱性の影響を受けずにパッケージよりも一般的に人気があることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:43:17 GMT)
SMMT: Siamese Motion Mamba with Self-attention for Thermal Infrared Target Tracking [0.3] 本論は, 小説『シームズ・モーション・マンバ・トラッカー』(SMMT)を提唱する。
動作特徴を抽出し,見落としているエッジの詳細を復元するために,Motion Mamba モジュールを Siamese アーキテクチャに導入する。
さらに、特に動きブルの目標に対して、トラッキング精度を向上させるために、動きエッジ認識の回帰損失を設計する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:19:28 GMT)
LLM-D12: A Dual-Dimensional Scale of Instrumental and Relational Dependencies on Large Language Models [0.3] 人々が大規模言語モデル(LLM)とどのように相互作用するかを理解することへの関心が高まっている。
LLM-D12(LLM-D12)とよばれるLCM依存度を測定する新しい12項目アンケートを開発し,その妥当性を検証した。
このスケールは、著者の以前の理論的研究に基づいており、それに応じてアイテムが開発され、イギリスで526人の参加者から回答が集められた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:23:04 GMT)
Towards a Sampling Theory for Implicit Neural Representations [0.3] Inlicit Neural representations (INRs) は、コンピュータおよび計算画像における逆問題を解決する強力なツールとして登場した。
一般化された重み減衰正規化方式を用いて, 隠蔽層INRから画像の復元方法を示す。
低幅単層INRにより実現された正確な回復画像を得る確率を実証的に評価し、より現実的な連続領域ファントム画像の超解像回復におけるINRの性能を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:23:11 GMT)
Sampling Theory for Super-Resolution with Implicit Neural Representations [0.3] Inlicit Neural representations (INRs) は、コンピュータおよび計算画像における逆問題を解決する強力なツールとして登場した。
本稿では, 隠れ層INRとReLUと隠されたフーリエ層とを重み減衰正規化の形式を用いて適合させる方法を示す。
低幅単層INRにより実現された画像の正確な回復率を実証的に評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:18:20 GMT)
The Path is the Goal: a Study on the Nature and Effects of Shortest-Path Stability Under Perturbation of Destination [0.3] 本研究は,都会のナビゲーションにおける経路変動現象について考察する。
経路の安定性」という概念を導入し,経路が小方向調整に対していかに頑健であるかを測る。
分析の結果,経路安定性は都市特有の要因と旅行特性によって形成され,共通パターンが同定されることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:37:46 GMT)
Enhancing Facial Classification and Recognition using 3D Facial Models and Deep Learning [0.3] 分類精度を向上させるために,3次元顔モデルと深層学習手法を統合した。
このアプローチは、100%の個人分類、95.4%の性別分類、83.5%の表現分類の精度で顕著な結果が得られる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:18:49 GMT)
CiteFix: Enhancing RAG Accuracy Through Post-Processing Citation Correction [0.3] Retrieval Augmented Generation (RAG) はLarge Language Models (LLM) の強力な応用として登場した。
本研究は,情報検索および要約作業におけるAI生成コンテンツの信頼性と信頼性の向上に寄与する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:56:14 GMT)
Pointwise-in-Time Explanation for Linear Temporal Logic Rules [0.2] ルールステータスアセスメント(RSA)という新しい枠組みを提案する。
RSAは、個々の時間ステップにおける軌道進行を記述するために、直感的なステータスを任意のルールに割り当てる。
我々は、RSAがポストホック診断として有用であることに気付き、ユーザーはルールの集合に関してエージェントの振る舞いを体系的に追跡できる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:48:30 GMT)
"What are my options?": Explaining RL Agents with Diverse Near-Optimal Alternatives (Extended) [0.2] ディバース・ニア・オプティカル・オルタナティブズ(DNA)と呼ばれる,説明可能な強化学習のための新しいアプローチの議論を拡大する。
DNAは、ユークリッド空間における定性的に多様な軌跡を生成するためにポリシーを最適化し、軌道計画剤の合理的な「オプション」のセットを求める。
シミュレーションにおいて、DNAは意味的に異なる「オプション」を構成する定性的に異なるポリシーをうまく返すことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:15:56 GMT)
The Causal Information Bottleneck and Optimal Causal Variable Abstractions [0.2] Information Bottleneck (IB) は変数の抽象化を構築するために広く使われている手法である。
IBのような従来の手法は純粋に統計的であり、根底にある因果構造を無視する。
目的変数に対する因果制御を維持しつつ,選択した変数の集合を圧縮する因果情報ボトルネック(CIB)を提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:31:01 GMT)
Digital Privacy Everywhere [0.2] Digital Privacy Everywhere (DPE) は、デジタルデバイスに対する独自のプライバシーポリシーを、事前に定義された物理的境界内で積極的に実施するために設計された包括的システムである。
DPEアーキテクチャには、集中管理コンソール、フィールド検証ユニット(FVU)、モバイルデバイス(EMMD)の執行モジュール、外部地球所有権サービス(EGOS)が含まれる。
このシステムは、地理的にシームレスなユーザエクスペリエンスと運用上のスケーラビリティを維持しながら、リアルタイムでプライバシコンプライアンスを保証する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:25:49 GMT)
Bench to the Future: A Pastcasting Benchmark for Forecasting Agents [0.1] Bench To the Futureは、数百の高品質な質問がすでにその解決が知られている"pastcasting"ベンチマークである。
その結果,我々の過去の放送環境は,未解決の質問に対してインターネットを用いた予測に基づく結果に匹敵する結果が得られることが示唆された。
これは生きたベンチマークであり、トレーニングデータのカットオフ日数の増加を考慮し、新たな質問を継続的に追加するつもりです。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:18:40 GMT)
Repeated ancilla reuse for logical computation on a neutral atom quantum computer [0.1] 光ツイーザーに閉じ込められた中性原子に基づく量子プロセッサは、本来は原子の損失を生じやすい。
我々は、他の原子のコヒーレンスを維持しながら、量子計算中に失われた原子を置き換える能力を示す。
これは、システム内の原子の寿命よりも長い論理計算を実行するための重要なステップである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:58:17 GMT)
A Novel Lightweight Transformer with Edge-Aware Fusion for Remote Sensing Image Captioning [0.1] エンコーダ層の寸法を小さくし, 蒸留したGPT-2をデコーダとして使用するために, 軽量トランスフォーマアーキテクチャを提案する。
知識蒸留戦略は、より複雑な教師モデルから知識を伝達し、軽量ネットワークの性能を向上させるために用いられる。
実験により,提案手法は,最先端手法と比較してキャプション品質を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:24:02 GMT)
Surrogate models to optimize plasma assisted atomic layer deposition in high aspect ratio features [0.1] 我々は、断面厚みデータに基づいて飽和時間を予測するために、人工ニューラルネットワークを訓練する。
表面再結合がPEALDプロセスのプラズマ-表面相互作用を99%の精度で支配するかどうかを決定するために訓練された代理モデルである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:07:55 GMT)
Efficient Modular Multiplier over GF (2^m) for ECPM [0.1] 楕円曲線暗号(ECC)が主要な公開鍵プロトコルとして登場している。
本研究では,バイナリフィールドGF(2m)上のモジュラ乗算のためのハイブリッド乗算手法のハードウェア実装を提案する。
従来の乗算(CM)とカラツバ乗算(KM)の組み合わせを最適化して楕円曲線点乗算(ECPM)を強化する設計である。
本手法は,ECC暗号システムの高速化,ハードウェア効率,資源利用を著しく向上させる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:14:05 GMT)
Token-Efficient RL for LLM Reasoning [0.0] 本稿では,大規模言語モデル (LLM) において,厳密なメモリと計算限界下での推論に適した強化学習戦略を提案する。
ベースラインサブトラクションを用いた早期ポリシー勾配法に基づいて,出力トークンの小さな情報サブセット上で動作する批判のない手法を設計する。
提案手法は,SVAMPベンチマークの精度を46%から70%以上に向上し,マルチ桁乗算において高い性能を示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:30:22 GMT)
Where Journalism Silenced Voices: Exploring Discrimination in the Representation of Indigenous Communities in Bangladesh [0.0] 我々は220万件の新聞記事の最初のデータセットから4,893件の先住民関連記事を特定した。
結果は、先住民のニュース記事が文化やエンターテイメントをより多く表現していることを示している。
参加者は満場一致で表現不足の気持ちを表現した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:10:39 GMT)
Your Agent Can Defend Itself against Backdoor Attacks [0.0] 大規模言語モデル(LLM)を駆使したエージェントは、トレーニングと微調整の間、バックドア攻撃による重大なセキュリティリスクに直面している。
本稿では,LDMをベースとしたエージェントに対するバックドア攻撃に対する新たな防御策であるReAgentを紹介する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:39:01 GMT)
Workflow-Based Evaluation of Music Generation Systems [0.0] 本研究では,8つのオープンソースシステムを用いて,現代音楽制作における音楽生成システム(MGS)の探索的評価を行う。
選択されたシステムは、シンボリックおよびオーディオベースの音楽生成アプローチの両方において、アーキテクチャの多様性を表す。
発見によると、これらのシステムは、主に人間の専門知識を置き換えるのではなく、補完的なツールとして機能する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:07:47 GMT)
Wasserstein Distances on Quantum Structures: an Overview [0.0] 確率測度の最適輸送の理論は、様々な異なる分野に広く応用されている。
量子ワッサーシュタイン距離は、量子環境において幅広い発展をもたらした。
このレビューは、古典的最適輸送の分野と量子情報理論の両方から、量子最適輸送に興味を持つ人々のために書かれたものである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:39:33 GMT)
VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis [0.0] VISTA(Vision-Language Inference for Stock Time-Series Analysis)は,マルチモーダルストック予測のためのトレーニングフリーフレームワークである。
我々は、標準ベースラインに対してVISTAをベンチマークし、ARIMAやテキストのみのLLMベースのプロンプト手法を含む。
VISTAはこれらのベースラインを最大89.83%上回り、株価時系列分析におけるマルチモーダル推論の有効性を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:38:02 GMT)
Upper Bound on Quantum Fisher Information in Pseudo-Hermitian Systems [0.0] 我々は、擬エルミート・ハミルトニアンの曲面ヒルベルト空間上で定義される量子フィッシャー情報の共変定式化を開発する。
このフレームワークは状態規範の保存を保証し、パラメータの感度を一貫した処理を可能にする。
擬エルミート系における量子センシングがエルミート系よりも優越性を示すための基準を同定する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:04:04 GMT)
Unsupervised Deep Clustering of MNIST with Triplet-Enhanced Convolutional Autoencoders [0.0] 本研究は、MNIST手書き桁のための高度な教師なしクラスタリングシステムを実装した。
ディープ・ニューラル・オートエンコーダは、画像の最小でも解釈可能な表現を開発するために、フェーズ1のトレーニングプロセスを必要とする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:26:13 GMT)
Universality of stochastic control of quantum chaos with measurement and feedback [0.0] 制御対象の不安定な固定点における量子力学について検討する。
近年の研究では、この相互作用が、測定およびフィードバック駆動の動的量子相転移の族の下にあることが示されている。
数値シミュレーション,半古典的フォッカー・プランク解析,および量子チャネルの直接スペクトルを組み合わせることにより,制御遷移をマップアウトする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:01 GMT)
Universality of Photonic Interlacing Architectures for Learning Discrete Linear Unitaries [0.0] 最近の研究は、離散線型ユニタリ群 $U(N)$ が、有限列の対角位相演算とインターレースして表現できることを示唆している。
我々は、$U(N)$の要素を格子ハミルトンの1ドルプロパゲータと交互に$N$-パラメータ位相の列に分解できることを示した。
このアーキテクチャは、基本光学成分を用いて実装することができ、任意のユニタリ行列の再構成に成功することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:31:13 GMT)
Unconditionally Secure Wireless-Wired Ground-Satellite-Ground Communication Networks Utilizing Classical and Quantum Noise [0.0] 我々は、KLJN(Kirchhoff-Law-Johnson-Noise)を衛星通信の安全確保のアプローチとして紹介する。
KLJNは、単純さ、費用対効果、レジリエンスと無条件セキュリティを組み合わせることで、衛星通信セキュリティに革命をもたらす可能性がある。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:52:00 GMT)
Uncertainty relations for unified ($α$,$β$)-relative entropy of coherence under mutually unbiased equiangular tight frames [0.0] 量子コヒーレンスに基づく不確実性関係は、量子情報科学において重要な問題である。
平均統一(alpha$,$beta$)-相対的コヒーレンスエントロピーに関する不確実性関係を、相互に偏りのない等角的タイトフレームの下で論じる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:18:46 GMT)
Uncertain Quantum Critical Metrology: From Single to Multi Parameter Sensing [0.0] 臨界量子量論は、ハミルトニアン摂動への量子相転移の臨界点付近の系の固有状態の極度感度に依存する。
これは、これらの固有状態がハミルトニアンの全てのパラメータに非常に敏感であることを意味する。
現実的な設定では、システムの臨界度を調整するために使用される制御パラメータには、常にある程度の不確実性がある。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:25:12 GMT)
Unable to Forget: Proactive lnterference Reveals Working Memory Limits in LLMs Beyond Context Length [0.0] 人間では、そのような干渉に対する感受性は、作業記憶能力と逆の関連がある。
PI-LLMは意味論的に関連するキー-値の更新とクエリを逐次的にストリームする評価手法である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:53:49 GMT)
UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags [0.0] 本稿では,XPOS 配列から形態素合成構造を同定し,それらの構造を対応する UPOS カテゴリと整合させるセミ言語フレームワークを提案する。
我々はまた、議論的なエッセイから2,998の新たな文を注釈付けすることで、既存のL2-韓国コーパスを広げる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:35:33 GMT)
Two imaginarity monotones induced by unified $(α,β)$-relative entropy [0.0] 統合された$(alpha,beta)$-relative entropyによって誘導される2種類の虚性モノトンを提案する。
結果を説明するための明確な例を挙げる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:41:40 GMT)
Translating a VDM Model of a Medical Device into Kapture [0.0] 本稿では、D-RisQによって開発された公式なモデリングツールであるKaptureを用いて、既存の医療インプラントの形式的なVDMモデルを翻訳する。
本稿は,Kaptureのユーザビリティ,形式モデリングの課題,翻訳モデルの有効性を評価する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:50:50 GMT)
Transforming Expert Knowledge into Scalable Ontology via Large Language Models [0.0] 従来の分類学的アライメントへのアプローチは、概念ペアのエキスパートレビューに依存している。
本稿では,大規模言語モデル(LLM)とエキスパートキャリブレーション,反復的プロンプト最適化を組み合わせた新しいフレームワークを提案する。
F1スコアは0.97で、人間のベンチマーク0.68をほぼ上回りました。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:16:55 GMT)
Traceable LLM-based validation of statements in knowledge graphs [0.0] 本稿では,LPMを用いたRDFトリプルの検証手法を提案する。
LLMは、ユーザプロンプトに対する応答を構築するために使用される情報の起源を、現在確実に特定できないため、我々のアプローチは、内部のLLMの事実知識を完全に使用することを避けることである。
代わりに、認証されたRDF文は、ウェブ検索またはウィキペディアで検索された外部文書の断片と比較される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:50:42 GMT)
Towards Responsible AI: Advances in Safety, Fairness, and Accountability of Autonomous Systems [0.0] この論文は、AIシステムの安全性、公正性、透明性、説明責任に関する知識を前進させる。
我々は,古典的決定論的遮蔽技術を拡張し,遅延観測に対する耐性を高める。
我々は,グループフェアネスを逐次決定設定で強制するための,新しい後処理手法であるフェアネスシールドを導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:30:02 GMT)
Toward Scalable Quantum Compilation for Modular Architecture: Qubit Mapping and Reuse via Deep Reinforcement Learning [0.0] 本稿では、モジュール量子アーキテクチャのための注意に基づく深層強化学習(DRL)を用いた新しいQubitマッピングであるQARMAを提案する。
提案手法は、注目に基づくメカニズムとグラフニューラルネットワーク(GNN)を組み合わせて、最適なキュービット割り当て、ルーティング、再利用戦略を学習する。
モジュール構造を持つ高度に最適化されたQiskitと比較して、QARMA-Rはコア間通信を最大100%削減する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:52:17 GMT)
The optical Bloch equation for the finite-temperature fluctuations [0.0] 量子力学の枠組みにおける量子ゆらぎと熱ゆらぎを分析する。
異なる特徴を持つ非整合摂動として認識され、これら2つのタイプのゆらぎは、光学ブロッホ方程式における散逸項に繋がる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:48:50 GMT)
The QTF-Backbone: Proposal for a Nationwide Optical Fibre Backbone in Germany for Quantum Technology and Time and Frequency Metrology [0.0] 我々は、量子およびT&F信号のネットワーク分布のための、ドイツの国立繊維光学インフラであるQTF-Backboneを提案する。
QTF-Backboneは10年以上にわたる4段階のデプロイメントとして計画されており、研究機関や業界へのスケーラブルで持続可能なアクセスを保証する。
国内および欧州のハブとして、ドイツとヨーロッパを、時間と周波数の転送だけでなく、量子ネットワーキングの最前線に位置づける。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:01:04 GMT)
The NordDRG AI Benchmark for Large Language Models [0.0] NordDRG-AI-Benchmarkは、完全なDRGルールをキャプチャし、LLMの多言語診断、手順、関税ロジックを推論する能力を評価する最初の公開テストベッドである。
i) DRGロジック、ICDおよびNCSPコード、年齢/性別分割、国旗を含む20のテーブルを持つ定義テーブル、(ii) 実際のガバナンスを記述する専門家マニュアルと変更ログテンプレート、(iii) コードルックアップ、クロステーブル推論、多言語用語、品質保証監査にまたがる14のCaseMixタスクの即時パック。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:40:11 GMT)
The Aharonov-Casher Phase: Topological or Geometric? [0.0] Aharonov-Casher (AC) 相は、磁場を受ける磁気モーメントを持つ粒子が取る閉路の詳細に依存する。
経路の細部への交流相の依存性を解明する反例を考案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:36:58 GMT)
The Aharonov-Casher Phase: Considerations Regarding Force, Time-Dependence, and Berry Phase [0.0] Aharonov-Casher(AC)効果と磁気モーメントを有する粒子の力の関係について検討した。
ACハミルトニアンの一般形は、ディラック方程式へのフォルディ・ウーフイゼン変換を用いて導出される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:22:14 GMT)
Taming SQL Complexity: LLM-Based Equivalence Evaluation for Text-to-SQL [0.0] 本稿では,Large Language Models (LLM) を用いて意味論とより実践的な「弱」意味論的等価性の両方を評価する。
我々は,Sql同値と不等価の共通パターンを解析し,LLMに基づく評価の課題について議論する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:16:39 GMT)
Symmetric quantum states: a review of recent progress [0.0] 対称量子状態は魅力的な物体である。
これらは、粒子置換の下で不変のままである多部系に対応する。
これらの状態は、真のマルチパーティの絡み合いと、ノイズや摂動に対する顕著な頑丈さを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:23:07 GMT)
Statistics of topological defects across a phase transition in a digital superconducting quantum processor [0.0] 量子相転移が有限時間以内に交わるとき、臨界で断熱力学が遅くなり、トポロジカルな欠陥が形成される。
これらの欠陥の平均密度は、KZM(Kybble-Zurek mechanism)によって予測される普遍的な電力法則に従って、クエンチ速度とともにスケールする。
最大100キュービットまでの複数の量子処理ユニットを実証し、クエンチ時間の関数として高次累積が普遍的な電力法則に従うことを妨害する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:44:11 GMT)
Spatial and Pulse Efficiency Constraints in Atom Interferometric Gravitational Wave Detectors [0.0] 我々は,単一干渉計の空間範囲を明示的に考慮し,マルチダイアモンドジオメトリの最適構成を提案する。
実証実験以外の多くの提案は、最先端の運動量伝達技術ではまだ実証されていないパルス数を必要とする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:36:15 GMT)
Space-time correlations in monitored kinetically constrained discrete-time quantum dynamics [0.0] 我々は,Rydberg量子シミュレータに自然に実装された,運動的に制約された多体量子システムを示す。
非相関な無限温度平均定常状態を特徴とするにもかかわらず、ダイナミクスは高速かつ遅い時空領域の共存を示す。
我々の研究は、量子プロセッサやシミュレータにおける複雑な力学や集合現象を特徴づける手段として、離散時間オープン量子多体システムのための大規模な偏差フレームワークを確立する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:07:34 GMT)
Situated Bayes -- Feminist and Pluriversal Perspectives on Bayesian Knowledge [0.0] この記事では、ベイズの理論とその現代的利用の側面、例えば機械学習について紹介する。
ベイズ・セオレム(Bayes Theorem)と並んで、知識の批判的理論に関する数学的議論が展開される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:33:56 GMT)
Second-Order Coherence Across the Brillouin Lasing Threshold [0.0] ブリルアン・マンデルスタム散乱(英: Brillouin-Mandelstam scattering)は、2つの光場と1つの音場の間の3波混合過程である。
ブリュアンラシングしきい値に散乱するストークスの2階コヒーレンスを特徴付けるために、量子光学技術を用いる。
その結果, ブリルアン散乱に対する2次コヒーレンスおよび光子計数測定の適用により, ブリルアン散乱の理解を深める新たな方法が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:56:42 GMT)
ScoreMix: Improving Face Recognition via Score Composition in Diffusion Generators [0.0] ScoreMixは、識別器の性能を高めるための、非常に単純なデータ拡張戦略である。
我々は,すべてのベンチマークにおいて,識別能力を大幅に向上させる,挑戦的な合成サンプルを生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:06:44 GMT)
SLRNet: A Real-Time LSTM-Based Sign Language Recognition System [0.0] SLRNetは、MediaPipe Holistic and Long Short-Term Memory (LSTM)ネットワークを用いたリアルタイムWebカメラベースのASL認識システムである。
モデルはビデオストリームを処理し、ASLアルファベット文字と機能語の両方を認識する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:30:47 GMT)
SLEEPYLAND: trust begins with fair evaluation of automatic sleep staging models [0.0] 本稿では,オープンソースの睡眠ステージ評価フレームワークであるSLEEPYLANDを紹介する。
ドメイン内睡眠記録(ID)は220万時間以上、ドメイン外睡眠記録(OOD)は84万時間以上である。
本稿では,SoMNUSを紹介する。SoMNUSは,ソフト投票によるアーキテクチャとチャネル設定のモデルを組み合わせたアンサンブルである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:12:29 GMT)
Rydberg atom arrays as quantum simulators for molecular dynamics [0.0] 光ツイーザーアレイに保持されるリドバーグ原子は振動と電子自由度を結合する。
これにより、人工分子系の量子シミュレーションの機会が開かれる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:39:19 GMT)
Reviewing Uses of Regulatory Compliance Monitoring [0.0] 本研究は、ビジネスプロセスの規制コンプライアンス監視の利用に関する体系的な文献レビューを示す。
我々は、アプローチ間の共通点と相違点を強調し、様々なステップが手動で実行されていることを見つける。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:54:54 GMT)
Reinforcement Learning from Human Feedback [0.0] 人間からのフィードバックからの強化学習(RLHF)は、重要な技術およびストーリーテリングツールとなっている。
この本では、ある程度の量的背景を持つ人々に対して、コアメソッドについて穏やかに紹介したいと思います。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:15:22 GMT)
Reinforcement Learning Fine-Tuning of Language Model for Instruction Following and Math Reasoning [0.0] コンパクト言語モデル(Qwen2.5-0.5Bベース)における強化学習手法の有効性について検討する。
本研究では, 教師付き微調整(SFT), 嗜好ラベル付きデータを用いた直接選好最適化(DPO), 報酬モデルによるReinforce Leave-One-Out(RLOO)を比較した。
実験により、DPOが強固で一貫した結果をもたらすのに対し、DeBERTaの報酬モデリングを用いたROOは最適なアライメントを実現することが示された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:49:42 GMT)
Recovery dynamics of a gap-engineered transmon after a quasiparticle burst [0.0] 電離放射線の影響は超伝導量子ビット中の準粒子密度のバーストを生み出す。
これらのバーストは一時的に量子ビットコヒーレンスを分解し、量子誤り訂正に寄与する。
量子ビット遷移を連続的に監視することにより、3次元ギャップエンジニアリングされたトランモン量子ビット中の準粒子バーストを実験的に解決する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:15:24 GMT)
Reciprocity as the Foundational Substrate of Society: How Reciprocal Dynamics Scale into Social Systems [0.0] 相互性は単に局所的あるいは原始的な交換ではなく、大規模社会構造が出現するスケーラブルな基盤であると主張する。
本稿では,この出現をモデル化するための3段階の枠組みを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:53:07 GMT)
Quench dynamics of negativity Hamiltonians [0.0] 自由フェルミオン系におけるネガティビティとフェルミオンネガティビティのクエンチダイナミクスについて検討する。
標準負性ハミルトニアンは非局所ホッピング項と4つのフェルミオン相互作用の両方を含むのに対し、フェルミオン版は純粋に二次的である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:47:55 GMT)
Quantum Speed Limits from Symmetries in Quantum Control [0.0] 量子制御において、量子速度制限は特定のユニタリ変換を実装するのに必要な時間に基本的な下界を与える。
これらの速度制限を制御ハミルトニアンの対称性にリンクし、制御系力学を解くことなく計算できる量的境界を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:02 GMT)
Quantum Entanglement is Quantum: ZZ Production at the LHC [0.0] ダイボソン系の偏光とスピン相関は、精密テストや新しい物理学の探索のための強力なツールとして機能する。
pto e+e-mu+mu-$および$hto e+e-mu+mu-$プロセスの角係数を分析し,高次QCDとエレクトロ弱補正を取り入れた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:01:28 GMT)
Quantifying imaginarity of quantum operations [0.0] 本研究は,量子演算のノルムと重みに基づく2種類の虚性測度を示す。
結果は、操作の想像性に関する新たな洞察を与え、動的想像性に対する理解を深める。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:52:44 GMT)
QuGrav: Bringing gravitational waves to light with Qumodes [0.0] 逆ゲルトセンシュテイン効果による高周波重力波の検出には量子ボソニックモードの量子モードを用いる。
クエード内の光子場の占有数 $n$ に対して、変換確率はボース=アインシュタイン統計により$n+1$ になる。
以上の結果から,マイクロ波周波数および既存の技術を用いて,宇宙界の1.7桁以内の感度を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:06:08 GMT)
Photo-induced directional transport in extended SSH chains [0.0] 光の照射はシステム内の異方性を誘導し、方向流の流れと整流挙動のアクティブ制御を可能にする。
正か負かの補正方向は、光の偏光の変化によって正確に制御することができ、電子行動の外部光制御の可能性を強調している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:22:07 GMT)
Perfect state transfer between real pure states [0.0] 純状態は、単位ベクトルで表される$mathbbCn$の1次元部分空間に対応する。
我々は、量子スピンネットワークを表すグラフのハミルトニアンとして、隣接性を重視した実純粋状態とラプラシア行列の間の完全状態伝達(PST)理論を開発する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:29:12 GMT)
Oracle-Based Multistep Strategy for Solving Polynomial Systems Over Finite Fields and Algebraic Cryptanalysis of the Aradi Cipher [0.0] 本稿では,Depth-First Search戦略に基づく新しいアルゴリズムの実装を提案する。
本稿では,低遅延ブロック暗号Aradiの暗号解析に多段解法を適用した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:18:25 GMT)
Optimizing Genetic Algorithms with Multilayer Perceptron Networks for Enhancing TinyFace Recognition [0.0] この研究は、TinyFace、Heart Disease、Irisの3つの多様なデータセットを通して調査されたニューラルネットワークを実証的に検証する。
この研究は、機能工学とパラメータ最適化に関する文献に貢献し、幅広い機械学習タスクの実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:21:46 GMT)
OmniJet-$α_C$: Learning point cloud calorimeter simulations using generative transformers [0.0] 高粒度温度計における点雲として, 生成型変圧器を用いたカロリーメータを最初に使用した例を示す。
OmniJet-$alpha$モデルのトークン化子と生成部を用いて、検出器のヒットを整数列として表現する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:49:41 GMT)
Observation of Power Superbroadening of Spectral Line Profiles on IBM Quantum [0.0] パワーワイドニング(英: Power Wideening)とは、駆動場の強度が増大するにつれて、2状態の量子遷移におけるスペクトル線プロファイルの拡大を指す。
我々は、同じパルス領域の長方形パルスよりもはるかに広い出力を示す複数の形状パルスを提示する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:11:32 GMT)
New Fault Domains for Conformance Testing of Finite State Machines [0.0] 障害ドメインは、テスト中に検出する必要がある障害に関するテスターの仮定を反映します。
2つの有名な$m$-completeテストスイート生成戦略に対して、$k$-$A$-completenessの条件を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:09:48 GMT)
Network nonlocality with continuous variables: probing nonbilocality through pseudospin measurements [0.0] 量子ネットワークはベルのシナリオを超えて非局所的な相関を求めるための魅力的なプラットフォームを提供する。
疑似スピン計測を用いた連続可変CV(continuous-variable (CV)) フレームワークにおいて、最も単純な量子ネットワークであるバイローカルシナリオについて検討する。
本研究は,ネットワークベースの量子相関を実現するためのCVシステムの可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:33:33 GMT)
Multiverse Privacy Theory for Contextual Risks in Complex User-AI Interactions [0.0] 本稿では,各プライバシ決定が並列宇宙を創出する新しいフレームワークである,多元的プライバシ理論を紹介する。
今後の研究は、実世界のシナリオベースのサーベイデータを用いて、その応用を探求する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:02:59 GMT)
Multi-Agent Language Models: Advancing Cooperation, Coordination, and Adaptation [0.0] 協調型マルチエージェント強化学習(MARL)のレンズを用いた大規模言語モデル(LLM)における心の理論について検討する。
提案手法は, 人工エージェントと人的エージェントの双方に適応し, 協力する能力を高めることを目的としている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:12:34 GMT)
More entropy from shorter experiments using polytope approximations to the quantum set [0.0] 本稿では,様々なデバイス非依存の量子乱数生成(DI-QRNG)プロトコルにおいて,量子集合に対するポリトープ近似を体系的に構築する手法を提案する。
提案手法は,初期ポリトープ近似を反復的に洗練する2つの汎用暗号アルゴリズムに依存する。
有限サイズ系における証明エントロピー境界を著しく改善した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:37:56 GMT)
MoE-MLoRA for Multi-Domain CTR Prediction: Efficient Adaptation with Expert Specialization [0.0] MoE-MLoRAはエキスパートの混成フレームワークで、各専門家はドメインを専門にするために独立して訓練される。
MoE-MLoRAはMovielensとTaobaoの8つのCTRモデルで評価した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 07:55:32 GMT)
Milgram's experiment in the knowledge space: Individual navigation strategies [0.0] 年長、白、女の参加者は近接型戦略を採用する傾向があり、若い参加者はハブ型戦略を好む。
本研究は,ソーシャルナビゲーションとナレッジナビゲーションを関連づけるものであり,対象者の地理的および職業的情報を用いて社会空間をナビゲートする個人の傾向を理解することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:02:20 GMT)
Microservices and Real-Time Processing in Retail IT: A Review of Open-Source Toolchains and Deployment Strategies [0.0] このレビューでは、現代のイベント駆動型およびスケーラブルベースのアーキテクチャが小売システムと金融システムをどのように変えつつあるかについて説明する。
この分析によると、Kafka Spring Bootのようなテクノロジは、低レイテンシでイベント駆動のアプリケーションを構築する上で重要な役割を果たしている。
これらの発見は、スケーラブルなインフラストラクチャの設計を目指す業界実践者にとって、貴重な洞察を与えてくれる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:02:12 GMT)
Metrological symmetries in singular quantum multi-parameter estimation [0.0] ベイジアン後部分布には,未知のパラメータの空間を貫く持続可能性の線として,気象対称性が現れることを示す。
これらの線は有効パラメータの輪郭線であり、適切なパラメータ変換を通じて、それぞれが有効なCRBを推定し、従うことができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:55:27 GMT)
Memorization in Language Models through the Lens of Intrinsic Dimension [0.0] 言語モデル(LM)は、トレーニング中にデータの一部を記憶し、世代毎に意図せずに出力する傾向がある。
Intrinsic Dimension (ID) は, 潜時空間における配列の構造的複雑さの幾何的プロキシであり, 記憶の変調における役割について検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:42:27 GMT)
Measuring Corporate Human Capital Disclosures: Lexicon, Data, Code, and Research Opportunities [0.0] 企業価値創造には人的資本(HC)がますます重要になっている。
HCは現在、明確に定義された測定や開示の規則の対象にはなっていない。
我々は、HC関連キーワードの包括的リストを作成するために、HC開示の確認されたセットに基づいて訓練された機械学習アルゴリズム(word2vec)を使用する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:18:37 GMT)
Meaningless is better: hashing bias-inducing words in LLM prompts improves performance in logical reasoning and statistical learning [0.0] ハッシュ」は、認知バイアスを減らすために、意味のない識別子で大きな言語モデルでバイアスを誘発する可能性のある単語を隠蔽する。
この方法は、合計490のプロンプトを含む3つの実験セットで試験された。
本手法は,外部知識のバイアス低減と包摂性の向上を図った。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:55:38 GMT)
Mamba time series forecasting with uncertainty quantification [0.0] 電力消費のベンチマークでは、マンバの予測平均誤差は約8%である。
トラフィック占有率ベンチマークでは、平均誤差は18%に達する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:50:28 GMT)
Majorana Signatures in the Tripartite Uncertainty Relations with Quantum Memory [0.0] 超伝導体を通した第2の量子ドットと相関した1つの量子ドット上で行った測定の不確かさについて検討した。
マヨラナ準粒子は不確実性が最小限の下界に達することを証明している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:24:18 GMT)
Lower bounds on the number of rounds of the quantum approximate optimization algorithm required for guaranteed approximation ratios [0.0] 本稿では、QAOAに必要なラウンド数(QAOAランタイムの主成分)について、最初の低い係数をいくつか提示する。
従来の横フィールドミキサーの場合、(iv)我々のフレームワークは、すべての有界共起局所コスト問題に自明な下限を与える。
厳密には$k$-local cost Hamiltonian matching known results that constant approximation ratio is obtained with a constant-round QAOA。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:18:44 GMT)
Large Language Models for Toxic Language Detection in Low-Resource Balkan Languages [0.0] 本研究では,セルビア語,クロアチア語,ボスニア語における有毒なコメントをラベル付きデータで処理する大規模言語モデルについて検討した。
YouTubeとTikTokのコメントのデータセットを、さまざまなカテゴリーのビデオから作成し、手動でラベル付けしました。
4つのモデル(GPT-3.5 Turbo, GPT-4.1, Gemini 1.5 Pro, Claude 3 Opus)がゼロショットとコンテキスト拡張の2つのモードで試験された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:33 GMT)
Large Language Models for Scholarly Ontology Generation: An Extensive Analysis in the Engineering Field [0.0] 本稿では,異なる研究トピック間の意味的関係を識別する大規模モデルの能力について分析する。
我々はそのタスクを評価するためにIEEE Thesaurusに基づく金の標準を開発した。
Mixtral-8x7B、Dolphin-Mistral、Claude 3-7Bなど、いくつかの優れた結果が得られた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:58:18 GMT)
Krylov Complexity in Lifshitz-type Dirac Field Theories [0.0] 我々は、リフシッツ型ディラック場の理論におけるクリロフ複雑性を研究する。
我々は,異なる体制下でのクリロフ複雑性の成長と飽和挙動を解析した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:21:01 GMT)
K-ADAPT-VQE: Optimizing Molecular Ground State Searches by Chunking Operators [0.0] この研究はK-ADAPT-VQEを示し、各イテレーションでKのチャンクに演算子を追加することにより効率を向上する。
分子シミュレーションの結果,K-ADAPT-VQEは化学的精度を達成するために必要なVQEと量子関数呼び出しの総数を大幅に減少させることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:26:16 GMT)
Isoholonomic inequalities and speed limits for cyclic quantum systems [0.0] 量子速度制限は、量子系が状態間で進化するために必要な時間に基本的な下限を設定する。
伝統的な境界は状態の区別可能性に依存しており、初期状態と最終状態が一致する巡回進化に対して自明になる。
本研究では, 閉状態空間軌跡の長さをホロノミーで表す等ホロノミック不等式に基づく別のアプローチを検討する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:21:20 GMT)
Inverted Classroom in der Einführungsveranstaltung Programmierung [0.0] 2023/24年冬期、Nuremberg Techのコンピュータサイエンスの学生向けに、逆教室に基づく実験的な教育概念が導入された。
学生は文学的な仕事を通じて準備し、教育と学習の方法を活性化しなければならなかった。
この概念は全体として肯定的な評価を受けたが、多くの改善の機会が特定された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:59:23 GMT)
Interactions in Quantum Networks with Pulse Propagation Delays [0.0] 本研究では,フィールドモードの完全連続体の量子化を回避する理論的手法により,これらの遅延を考慮に入れることができることを示す。
本稿では, 原子のラムゼイ励起を, 分割・遅延量子パルスにより解析し, この手法の応用を解説する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:09:09 GMT)
Increasing the clock speed of a thermodynamic computer by adding noise [0.0] 得られた熱力学コンピュータプログラムは、元のコンピュータプログラムと等価であるが、クロック速度は高い。
このアプローチは、計算の忠実性を保ちながら熱力学計算の速度を向上する方法を提供する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 00:29:21 GMT)
Improving Oral Cancer Outcomes Through Machine Learning and Dimensionality Reduction [0.0] 口腔癌は、患者の生存率を高めるために、早期診断と正確な予後を必要とする、腫瘍学における深刻な課題を呈する。
機械学習とデータマイニングの最近の進歩は、従来の診断方法に革命をもたらし、良性病変と悪性口腔病変を区別するための洗練された自動化されたツールを提供している。
本研究では、ニューラルネットワーク、K-Nearest Neighbors(KNN)、SVM(Support Vector Machines)、およびアンサンブル学習技術を含む最先端データマイニング手法を総合的に検討し、特に口腔癌の診断と予後に応用した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:26:13 GMT)
ICE-ID: A Novel Historical Census Data Benchmark Comparing NARS against LLMs, \& a ML Ensemble on Longitudinal Identity Resolution [0.0] ICE-IDは、アイスランドの国勢調査記録の220年 (1703-1920) を含む、歴史的なアイデンティティ解決のための新しいベンチマークデータセットである。
ICE-IDは、複数の世代にわたる長手データにまたがり、名前のバリエーション、人口変動、豊富な系譜リンクをキャプチャする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:46:47 GMT)
Hybrid discrimination strategy based on photon-number-resolving detectors and mesoscopic twin-beam states [0.0] 状態識別は、量子通信プロトコルの実装において重要な課題である。
我々は、光の堅牢な量子状態を利用して、メソスコピック・インテンシティ・レシスタンスで機能するハイブリッド戦略を提案する。
我々のアプローチは古典的および量子的特徴(古典的な光の性質に基づく信頼性のある状態判別)と、非古典的な相関から生じるセキュリティを組み合わせたものである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:26:45 GMT)
Hybrid Quantum Algorithm for Simulating Real-Time Thermal Correlation Functions [0.0] 実時間量子熱相関関数を計算するために,hPIMC (Path Integral Monte Carlo) アルゴリズムを提案する。
本稿では,最近開発された確率Imaginary-Time Evolution (PITE)アルゴリズムを用いて,仮想時間進化の構成要素を正確に行うことができることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:04:50 GMT)
How attention simplifies mental representations for planning [0.0] 本研究では,タスク表現のどの側面が主観的認識に入り,計画に利用できるかを空間的注意がどのように制御するかを検討する。
空間的近接性は、迷路のどの側面が計画に利用できるかを決定する。
注意のスポットライト」の類推にインスパイアされ, 空間的注意の効果を, 有意な導出の計算的説明に取り入れた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:46:05 GMT)
Hollow-grams: Generalized Entanglement Wedges from the Gravitational Path Integral [0.0] 重力バルク領域に付随する絡み合いウェッジの提案を導出する。
我々は、ランダムテンソルネットワーク(RTN)と重力における固定幾何状態の接続を利用する。
BP提案は$nto1$制限で普遍的に再現されていることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:00 GMT)
High-Sensitivity Fiber Interferometer for Gravitational Phase Shift Measurement on Entangled States [0.0] 本研究の目的は, 経路交絡光子における重力誘起相転移の測定である。
我々は、地球重力電位で腕が垂直に変位しているキロメートル規模のファイバー干渉計を使用し、異なる高さで伝播する光子が異なる位相を蓄積することを可能にする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:10:23 GMT)
Guardians of the Regime: When and Why Autocrats Create Secret Police [0.0] 独裁者は秘密警察を使って権力を保ち、これらの組織は彼らの支配に対する反対を抑える。
既存の研究によると、秘密警察はこのことを非常に得意としていますが、驚くべきことに、彼らはオートクラシーでは想像するほどユビキタスではないのです。
本研究は,独裁者の制度的選択と権威主義政治の理解に寄与する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:31:03 GMT)
Generative Modeling with Diffusion [0.0] 本稿では,新しいサンプルを生成する手法として拡散モデルの概要を紹介する。
我々は、これらのノーミングとデノゲーションプロセスを正式に定義し、拡散モデルを用いてトレーニングと生成を行うアルゴリズムを提示する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:16:24 GMT)
Gender Bias in English-to-Greek Machine Translation [0.0] Google TranslateとDeepLの2つの翻訳では、ジェンダーバイアスが持続している。
GPT-4oは有望であり、ほとんどの曖昧なケースに対して適切な性別と中立の代替物を生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:44:12 GMT)
GLGENN: A Novel Parameter-Light Equivariant Neural Networks Architecture Based on Clifford Geometric Algebras [0.0] 一般化リプシッツ群同変ニューラルネットワーク(GLGENN)という,幾何代数に基づく同変ニューラルネットワークの新しいアーキテクチャを提案し,実装し,比較する。
これらのネットワークは、任意の非退化あるいは対称双線型形式を持つベクトル空間の回転や反射を含むすべての擬直交変換に同値である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:32:51 GMT)
Fully numerical Hartree-Fock calculations for atoms and small molecules with quantics tensor trains [0.0] 有限差分法を用いて、量子テンソルトレイン形式における分子特異的な量子化学基底関数の最適化のための完全に数値的な枠組みを提案する。
我々の研究は、十分に確立されたHF-溶媒の代替となる有望な方法を提供し、高度に正確で、完全に数値的で、分子適応的な基底セットを定義する道を開くことができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:25:03 GMT)
First-Spammed, First-Served: MEV Extraction on Fast-Finality Blockchains [0.0] 本研究は、高速ファイナリティブロックチェーンにおけるスパムベースの仲裁戦略の経済性を分析する。
CEX-DEX仲裁の最適戦略として,収益的なMEV機会を複数の小規模取引に分割することが示されている。
ArbitrumやZKsyncといった高速ロールアップのブロックの最上部にリバージョンされたトランザクションクラスタがあることが分かりました。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:02:49 GMT)
Fine-Grained control over Music Generation with Activation Steering [0.0] 本稿では,MusicGen と呼ばれる自己回帰生成型音楽変換器への推論時間介入による音楽生成のきめ細かい制御法を提案する。
本手法は, 学習した線形プローブの重みを用いて残差流を操り, 音色伝達, スタイル伝達, ジャンル融合を可能にする。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:02:39 GMT)
Finding a Fair Scoring Function for Top-$k$ Selection: From Hardness to Practice [0.0] 我々は、上位k$選択のための公平な線形スコアリング関数を同定する問題に対処する。
既存のアルゴリズムは特に高次元において効率的にスケールしない。
我々の解はSOTAと比較して最大数桁のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:39:41 GMT)
Features-based embedding or Feature-grounding [0.0] 本稿では,このような知識に基づく構造化思考が,特徴に基づく埋め込みを用いてディープラーニングモデルでどのように再現できるかを検討する。
特に、オペラブル辞書の共有可能な表現を解釈可能なドメイン固有の概念的特徴と整合させることを目的として、機能接地埋め込みを構築するための特定のアプローチを導入している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:24:29 GMT)
FARCLUSS: Fuzzy Adaptive Rebalancing and Contrastive Uncertainty Learning for Semi-Supervised Semantic Segmentation [0.0] 半教師付きセマンティックセグメンテーション(SSSS)は、ラベルのないデータを効果的に活用する上で、永続的な課題に直面している。
現在のアプローチは、しばしば支配階級を優先する厳格なしきい値によって不確実な地域を捨てる。
我々は,不確実性を4つの主要コンポーネントを通じて学習資産に変換する総合的な枠組みを導入する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:47:08 GMT)
Explaining word embeddings with perfect fidelity: Case study in research impact prediction [0.0] 単語埋め込みを訓練したロジスティック回帰に基づく分類モデルのための自己モデルRated Entities (SMER)。
SMERは,テキスト中の個々の単語の予測平均と正確に一致するので,理論上は説明モデルと完全に一致していることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:26:29 GMT)
Experimental observation of subabsorption [0.0] 単一原子物理学により予測されるよりも長い時間で光を吸収する原子アンサンブル(原子アンサンブル)を新しいタイプの集合的(協調的)カップリング効果を示す。
効果はサブ放射線の吸収アナログと見なすことができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:43:07 GMT)
Evolution of a twisted electron wave packet perturbed by an inhomogeneous electric field [0.0] 不均一な外部電界と相互作用する空間局在電子LG波パケットの非相対論的ダイナミクスについて検討する。
電場は波状パケットの構造を著しく変化させ、定性的形状を歪ませる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:46:28 GMT)
Evaluating BiLSTM and CNN+GRU Approaches for Human Activity Recognition Using WiFi CSI Data [0.0] CNN+GRUモデルは、空間的特徴を抽出できるため、UT-HARデータセット(95.20%)の精度が高い。
BiLSTMモデルは、長期の時間的依存関係を抽出することにより、高解像度のNTU-Fi HARデータセット(92.05%)でより良い性能を発揮する。
医療やインテリジェントホームシステムといったアプリケーションにおける,そのようなモデルの現実的な適用性を示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:10:34 GMT)
Error-Guided Pose Augmentation: Enhancing Rehabilitation Exercise Assessment through Targeted Data Generation [0.0] 本稿では,臨床関連動作ミスをシミュレートして合成骨格データを生成するEGPA(Error-Guided Pose Augmentation)を提案する。
実験では平均絶対誤差が27.6%まで減少し、誤り分類精度は45.8%に達した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:11:48 GMT)
Entanglement structure for finite system under dual-unitary dynamics [0.0] 両単位系からなる回路のグローバルダイナミクスに,各2体演算子がどのような影響を与えるかを示す。
また、双対ユニタリクラスの演算子と対になる場合、ダイナミクスにおける局所ユニタリの役割も強調する。
ペア生成物からなる初期状態の時間進化は, ほぼ極大なマルチパーティイト絡み合う状態を生成する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:17:17 GMT)
Entanglement Suppression, Quantum Statistics and Symmetries in Spin-3/2 Baryon Scatterings [0.0] 本研究では,非相対論的$S$波散乱における絡み合い抑制,量子統計,拡張対称性の相互作用について検討する。
同一粒子を散乱する場合、スピン統計の制約により絡み合いの力が消えることはない。
絡み合いの力は消滅しないが、グローバルまたは局所的な最小限に収まる場合、拡張された対称性が依然として出現する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:43:06 GMT)
Entanglement Holography in Quantum Phases via Twisted Rényi-N Correlators [0.0] 対称性を保護した位相位相位相において、領域法的な絡み合いを持つハミルトニアンの絡み合いに対するホログラフィー的枠組みを導入する。
還元密度行列 $rho propto e-H_e$ を低次元混合状態として扱うことができることを示す。
植民地として、ツイストR'enyi-N相関器の枠組みを熱状態と開量子系に一般化した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:22 GMT)
Empirical and computer-aided robustness analysis of long-step and accelerated methods in smooth convex optimization [0.0] 本研究は, 勾配計算における相対的不完全性を考慮した一階最適化手法のロバスト性を評価する。
相対的不正確性は、少ない情報ビットを用いて勾配を圧縮する際に起こる。
どちらの加速法も予想よりもはるかに頑健であり, 短縮係数が長ステップ法に大きく寄与することが観察された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:37:18 GMT)
Eigenlogic and Probabilistic Inference; when Bayes meets Born [0.0] 線形代数における固有射影作用素の文脈内で推論がどのように扱われるかを示す。
拡張により、固有作用素の固有系の外側のベクトルを用いて確率論的解釈が提案される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:58:04 GMT)
Efficient Implementation of a Quantum Algorithm with a Trapped Ion Qudit [0.0] qudits($$レベルのシステム)は、ハードウェア効率とアルゴリズム性能の両方に潜在的な利点を提供する。
最大8レベルまでのイオンquditを捕捉した単一イオンquditのマルチトーン制御を実証した。
グルーバーの探索アルゴリズムの最初の実装は5次元と8次元のキューディットである。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 03:35:55 GMT)
Dynamic structure factor of a driven-dissipative Bose-Hubbard model [0.0] 動的構造因子(DSF)は多体物理学における励起を理解する上で重要である。
非平衡スピンレスBose-Hubbardモデル(BHM)のDSFを、散逸相転移(DPT)の観点から定常状態に計算する。
以上の結果から,DPT点近傍のDSFは遷移点から離れたものと特徴的に異なり,DPTの明瞭な密度スペクトルシグネチャが得られることがわかった。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:17:41 GMT)
Dynamic Hypergraph Partitioning of Quantum Circuits with Hybrid Execution [0.0] NISQデバイスは量子ビット数が非常に制限されており、計算中にノイズに悩まされている。
本稿では,NISQデバイス固有の問題を克服するために,量子回路分割の活用に焦点をあてる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:41:05 GMT)
Droplet-gas phases and their dynamical formation in particle imbalanced mixtures [0.0] 等方性と異方性の両方の3次元閉じ込めにおける2成分粒子不均衡液滴の研究を行った。
混合液滴ガスからガスへの段階的な遷移は、平均的な補間アトラクションが減少するか、横方向の閉じ込めがより強くなるにつれて明らかにされる。
比較的低いガス分率の調整性は、原子番号、成分間不均衡、トラップアスペクト比、またはボックス電位の半径のパラメトリック変動によって示される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:10:32 GMT)
Distinguishing Graph States by the Properties of Their Marginals [0.0] 局所ユニタリ(LU)下におけるグラフ状態の同値関係について検討する。
これらの不変量は、最大8キュービットまでの全てのグラフ状態の絡み合いクラスを一意に識別することを示す。
我々は、大きなグラフをより小さなグラフに凝縮することで機能するグラフ状態の局所クリフォード(LC)同値性をテストするツールを一般化する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:12:01 GMT)
Digitization of Document and Information Extraction using OCR [0.0] 本論文は,光学文字認識(OCR)技術とLarge Language Models(LLM)を融合したテキスト抽出フレームワークを提案する。
スキャンされたファイルはOCRエンジンで処理され、デジタルファイルはレイアウト対応のライブラリを通して解釈される。
そして、抽出した原文をLLMで解析して、キー値対を特定し、あいまいさを解消する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:03:01 GMT)
Diffusion prior as a direct regularization term for FWI [0.0] フルウェーブフォーム・インバージョン(FWI)に先立つスコアベース生成拡散を提案する。
従来の拡散法とは異なり,本手法は逆拡散サンプリングを回避し,イテレーションを少なくする。
提案手法は,従来およびGANベースのFWI手法と比較して,忠実度と堅牢性を向上する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:43:23 GMT)
Detecção da Psoríase Utilizando Visão Computacional: Uma Abordagem Comparativa Entre CNNs e Vision Transformers [0.0] 本報告では, 咽頭病変とそれに似た疾患を含む多分類画像のタスクにおけるCNNとViTsの性能の比較を行った。
ViTはより小型のモデルで優れた性能を誇った。
本稿では、医用画像分類タスクにおけるViTsの可能性を強化する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:00:32 GMT)
Demystifying the Balanced Product Code: A Review [0.0] バランスのとれた製品コードのファミリーをレビューし、オリジナルとは全く異なるプレゼンテーションを行います。
ターゲットの聴衆は、高記憶密度量子コードに対してパリティチェック行列をどのように構築できるかを理解するために、誤り訂正の安定化形式に精通している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:34:58 GMT)
Decoherence Cancellation through Noise Interference [0.0] このプロトコルは、どちらも同じノイズダイナミクスを受ける場合、補助システムとの結合を利用する。
本稿では,プロトコルの効率が最適パラメータの変動に対して頑健であり,時間的雑音の特徴とは無関係であることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 06:58:14 GMT)
Critical Limitations in Quantum-Selected Configuration Interaction Methods [0.0] 我々はQSCI法が化学における実用性を著しく阻害する限界に直面していることを示す。
QSCIは原則として、高品質な構成相互作用(CI)の拡張を得られるが、新しい決定因子を見つけるのに非効率に苦しむことを示す。
これはQSCIがより効率的で古典的な応用に遅れているため、量子化学の応用において有用性を妨げている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 11:02:24 GMT)
Correlation vs causation in Alzheimer's disease: an interpretability-driven study [0.0] 本実験は, 相関分析, 機械学習分類, モデル解釈可能性技術の組み合わせを用いて, 臨床, 認知, 遺伝, バイオマーカーの特徴間の関係について検討した。
認知スコアや遺伝的危険因子を含むアルツハイマー病の分類に影響を及ぼす重要な特徴を同定する。
以上の結果から,強い相関関係が必ずしも因果関係を示唆するものではないことが示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:10:57 GMT)
Cooling a Qubit using n Others [0.0] 我々は、$n$ qubit マシンのエネルギー構造に関連する不等式が最適冷却プロトコルを決定することを示す。
また、冷却プロトコルは二部グラフ上の完全マッチングとして表現できることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:00 GMT)
Conclusive Local State Marking: More Nonlocality With No Entanglement [0.0] 複合量子状態のアンサンブルによって示される非局所性は、量子理論の顕著な非古典的特徴である。
ある積状態のアンサンブルが、伝統的に非局所的と考えられていたアンサンブルよりも強い非局所性を示すことを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:59:42 GMT)
Computational Irreducibility as the Foundation of Agency: A Formal Model Connecting Undecidability to Autonomous Behavior in Complex Systems [0.0] 我々は正確な数学的つながりを確立し 真に自律的なシステムに対して その将来の行動に関する疑問は 基本的に決定不可能であることを証明します
この発見は、人工知能、生物学的モデリング、そして自由意志のような哲学的概念に重大な影響を及ぼす。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:38:17 GMT)
Comparison of encoding schemes for quantum computing of $S > 1/2$ spin chains [0.0] スピン鎖の量子計算のための4つの異なる符号化スキームをスピン量子数$S>1/2$と比較する。
3つの異なる量子ビット符号化方式は、閉じ込められたイオン量子コンピュータを用いて1/2 le S le 5/2$のハミルトンシミュレーションによって評価される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 22:30:36 GMT)
Comparing human and LLM proofreading in L2 writing: Impact on lexical and syntactic features [0.0] 本研究は,人間とLLMの語彙的・統語的介入について検討し,同一の第二言語文における全体的理解性の向上を目的とした。
ヒトとLLMの証明読解はともにビッグラムの語彙的特徴を増強し、隣接する単語間のコヒーレンスと文脈的結合性の向上に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:37:00 GMT)
Certifying asymmetry in the configuration of three qubits [0.0] 3つの未知の量子ビット状態のブロッホベクトルの構成における非対称性の証明を行う。
我々は任意のミラー対称構成に対して有界な$Q_textmirror$を数値的に導出する。
我々は、公開量子プロセッサにプロトコルを実装した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 17:06:30 GMT)
Canonical Partition Function on a Quantum Computer through Trotter Interpolation [0.0] 本稿では,Trotterをベースとしたギブス状態観測可能推定アルゴリズムを提案し,その計算コストを$ tildeO(beta log1/epsilon)$とする。
我々のアプローチは、$log(Gamma)$ ancilla qubits を、$Gamma$ stage を持つハミルトニアンの量子化に基づく方法と比較する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 01:32:20 GMT)
California Crop Yield Benchmark: Combining Satellite Image, Climate, Evapotranspiration, and Soil Data Layers for County-Level Yield Forecasting of Over 70 Crops [0.0] 2008年から2022年にかけて、カリフォルニア全郡で70以上の作物をカバーした収量ベンチマークデータセットを紹介した。
このベンチマークは、ランドサットの衛星画像、日々の気候記録、毎月の蒸発散、高解像度の土壌特性など、さまざまなデータソースを統合している。
郡レベルの収量予測に適したマルチモーダル深層学習モデルを構築した。
提案手法は, カリフォルニアの多様な農業地域において, 全作物の未確認試験データセットに対して0.76の総合的なR2スコアを達成し, 高い予測性能を示した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 23:12:22 GMT)
Brillouin-Mandelstam scattering in telecommunications optical fiber at millikelvin temperatures [0.0] ミリケルビン温度における標準単モード電気通信光ファイバのブリルアン散乱スペクトルを測定した。
ミリケルビン温度では, アモルファス材料の微視的欠陥とのコヒーレント音響相互作用が観察された。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:24:11 GMT)
Bose-Einstein Condensates in a Synthetic Magnetic Field with Tunable Orientation [0.0] 位置依存デチューニングを受けるスピノルボース・アインシュタイン凝縮体の基底状態と動力学を系統的に研究する。
この変形は、合成磁場、角速度、および、トラップ異方性のために異なる方向に向けられる角運動量という3つの関連する量を引き起こす。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:41:25 GMT)
Black hole/quantum machine learning correspondence [0.0] ホーキング放射からの情報検索は、量子線形回帰のレンズを通して見ることができる。
ページタイム間の遷移はサブシステムのランク構造の変化と関連していることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:52:38 GMT)
Bipartite entanglement extracted from multimode squeezed light generated in lossy waveguides [0.0] 絡み合った2モードガウス状態は、連続可変量子コンピューティングおよび通信プロトコルの重要な構成要素である。
本研究は,スキューズ法が絡み合いを定量化することを示すとともに,最大二分割絡み合いをもたらす測定基準を構築した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 10:36:00 GMT)
Belief propagation for networks with loops: The neighborhoods-intersections-based method [0.0] NIB-methodは,ネットワーク内の相関を考慮し,計算資源のみを消費する手法である。
短いループしか持たないネットワークの場合, NIB-method は正確かつ最適であり, KCN-method に関して時間複雑性の低減を特徴付けることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:01:29 GMT)
Attention on flow control: transformer-based reinforcement learning for lift regulation in highly disturbed flows [0.0] 本研究では, ピッチ制御によるガスト列の空力昇降制御を効果的に行うための変圧器を用いた強化学習フレームワークを提案する。
学習戦略は,ガッツ数の増加に伴って性能ギャップが拡大し,最高の比例制御よりも優れることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:14:28 GMT)
Aspect-Based Opinion Summarization with Argumentation Schemes [0.0] 顧客が大量のレビューを乗り越え、手作業で重要な意見を結論付けるのは現実的ではない。
抽出的あるいは抽象的といった従来のアプローチは、基底的なアスペクト中心の要約を自動生成する際の課題に直面している。
提案する要約システムでは,エビデンスを裏付けるとともに,事前定義された側面の集合に頼らずに,様々な領域に適応する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 16:38:10 GMT)
Anomalous slow-down of the bound state dynamics in a non-locally coupled quantum circuit [0.0] 粒子に隣り合う次の熱的ホッピングを許すと, 振動が異常に遅くなることを示す。
本研究では,NNNホッピングにおいて,境界状態帯が準フラットバンド特性を示す魔法の強度に対して,そのような減速が生じることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 14:56:31 GMT)
Annotation-Free MIDI-to-Audio Synthesis via Concatenative Synthesis and Generative Refinement [0.0] CoSaRefはMIDI-to-audio合成法であり、MIDI-audioペアデータセットを必要としない。
MIDIの入力に基づいて合成音声トラックを生成し、MIDIアノテーションなしでデータセットに基づいて訓練された拡散に基づく深層生成モデルで洗練する。
デジタルオーディオワークステーションの伝統的な機能と同様、音声サンプルの選択やMIDI設計を通じて音色や表現を詳細に制御することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 12:29:54 GMT)
Analyzing Emotions in Bangla Social Media Comments Using Machine Learning and LIME [0.0] 本研究では,EmoNoBaデータセットからの22,698のソーシャルメディアコメントを用いた感情分析を行った。
我々は、線形SVM、KNN、ランダムフォレストといった機械学習モデルを用いて、TF-IDFベクトル化器からn-gramのデータを得る。
また,PCAが次元の減少にどのように影響するかについても検討した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:15:42 GMT)
Adversarial Surrogate Risk Bounds for Binary Classification [0.0] 逆行訓練は、堅牢な分類器を訓練する最も一般的な手法の1つである。
本稿では収束率を定量化する代理リスク境界を提供する。
我々は、標準(非逆)学習環境における分布依存的な代理的リスク境界を導出する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 02:57:08 GMT)
Advancing Exchange Rate Forecasting: Leveraging Machine Learning and AI for Enhanced Accuracy in Global Financial Markets [0.0] この調査は、Yahoo Financeから引用した2018年から2023年までのUSD/BDTの為替レートデータを活用している。
LSTM(Long Short-Term Memory)ニューラルネットワークが採用され、99.449%の精度を実現している。
方向性予測にはグラディエント・ブースティング(GBC)が適用され、1万ドルの初期資本に対して40.82%の利益率を示すバックテストが行われた。
この研究は歴史的傾向を分析し、BDT/USDレートが0.012から0.009に低下していることを示し、正常化された日々のリターンを取り入れてボラティリティを捉えている。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:22:07 GMT)
Accurate neural quantum states for interacting lattice bosons [0.0] 神経量子状態は相互作用強度のすべての値にわたって2次元ボース・ハバード・ハミルトン状態の基底状態を忠実に表現できることを示す。
これにより、超モット量子相転移における絡み合いエントロピーのスケーリングを解明することができる。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:55:57 GMT)
Accidental coincidences in camera-based high-dimensional entanglement certification [0.0] 単一光子アバランシェダイオードアレイと高強度タイムスタンピングカメラの絡み合い認証における事故要因の役割について検討した。
我々の研究は、高次元量子鍵分布(HD-QKD)のような逆シナリオにおける量子光学応用の開発に重要である。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 13:16:22 GMT)
A theoretical basis for model collapse in recursive training [0.0] 生成モデルからのトレーニングは、シミュレーションされた確率分布のいわゆる「崩壊」につながることが知られている。
このノートは、外部ソース、どのようにマイナーであれ、サンプルにも貢献するかどうかによって、実際には2つの異なる振る舞いが得られていることを示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 05:15:08 GMT)
A quantum semantic framework for natural language processing [0.0] 表現の複雑さが増大するにつれて、単一の意図する意味を回復する解釈エージェントが消滅する可能性について論じる。
この計算の難しさは、言語形式が意味を持ち、それ自体に欠陥があるという古典的な見解を示唆している。
あいまいさによる言語解釈は,非古典的文脈性を示すことができることを示す。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 18:00:30 GMT)
A Survey on Knowledge Organization Systems of Research Fields: Resources and Challenges [0.0] 知識組織システム(KOS)は、情報の分類、管理、検索において基本的な役割を果たす。
本稿は、現在のKOSに関する総合的な研究成果を学術分野に提示することを目的としている。
我々は、スコープ、構造、使用法、および他のKOSへのリンクの5つの主要な次元に基づいて45のKOSを分析した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 09:15:33 GMT)
A Navigation Framework Utilizing Vision-Language Models [0.0] VLN(Vision-and-Language Navigation)は、AIを具現化した複雑な課題である。
CLIPやFlamingoのような大規模視覚言語モデル(LVLM)の最近の進歩は、マルチモーダル理解を大幅に改善した。
動作計画から視覚言語理解を分離するモジュラー・プラグ・アンド・プレイナビゲーション・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 20:51:58 GMT)
A Deep Generative Model for the Simulation of Discrete Karst Networks [0.0] グラフ生成モデルを用いてカルストネットワークをグラフとして表現する。
ノードは空間情報とプロパティを保持し、エッジはノード間の接続を表す。
実世界のカルストネットワークを用いて本手法を検証し,生成したサブグラフとデータベースからの実際のサブグラフを比較した。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 15:10:41 GMT)
A Conjecture on a Fundamental Trade-Off between Certainty and Scope in Symbolic and Generative AI [0.0] 論文では、AIシステムにおける証明可能な正しさと広範なデータマッピング能力の基本的なトレードオフを定式化する予想を紹介している。
この暗黙のトレードオフを明確化し、厳密な検証にオープンにすることで、この予想は、エンジニアリングの野望とAIに対する哲学的な期待の両方を大きく変えた。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 19:18:13 GMT)
A Comparative Study of Machine Learning Techniques for Early Prediction of Diabetes [0.0] 本研究は,糖尿病予測のための機械学習手法の有効性を評価することを目的とする。
評価されたテクニックは、ロジスティック回帰、決定木、ランダムフォレスト、k-Nearest Neighbors、Naive Bayes、サポートベクトルマシン、グラディエントブースティング、ニューラルネットワークである。
この結果は、ニューラルネットワークアルゴリズムが78.7%の精度で最善を尽くし、続いてランダムフォレスト法が76.30%の精度で実行されたことを示している。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 21:12:28 GMT)
$H \to ZZ$ as a double-slit experiment [0.0] ZZ から 4ell$ への崩壊の $H = e,mu$ は、有名な二重スリットの実験と類似して量子干渉をテストするために用いられる。
スリット'をカバーする観測は$eemu$チャネルのデータから抽出でき、干渉を含む2つのスリット'が開放された時の観測は4e/4mu$チャネルで測定される。
論文参考訳(メタデータ) (Wed, 11 Jun 2025 08:24:30 GMT)