A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment [311.5] 本稿では, LLM のトレーニング, 展開, 商業化のプロセス全体を通して, 安全問題を体系的に検討する "フルスタック" の安全性の概念を紹介する。
我々の研究は800以上の論文を網羅的にレビューし、包括的カバレッジとセキュリティ問題の体系的な組織化を確保しています。
本研究は,データ生成の安全性,アライメント技術,モデル編集,LLMベースのエージェントシステムなど,有望な研究方向を特定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:33:33 GMT)
Distributionally Robust Wireless Semantic Communication with Large AI Models [120.3] 6G無線システムは、超低レイテンシで大量のデータをサポートすることが期待されている。
従来のビットレベルの伝送戦略は、現代的なデータ集約型アプリケーションに必要な効率と適応性をサポートできない。
セマンティックコミュニケーション(SemCom)の概念は、生データの代わりにタスク関連セマンティック情報を伝達することに集中することで、この制限に対処する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:03:57 GMT)
Faithfulness-Aware Uncertainty Quantification for Fact-Checking the Output of Retrieval Augmented Generation [108.1] 本稿では,RAG出力における幻覚検出の新しい手法であるFRANQ(Fithfulness-based Retrieval Augmented Uncertainty Quantification)を紹介する。
本稿では,事実性と忠実性の両方に注釈を付したQAデータセットを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:05:12 GMT)
Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity [105.5] MoGEはトークンを制約し、事前に定義された各専門家グループ内で同じ数の専門家を起動させる。
Pangu Pro MoEは1カード当たり1148トークン/秒を実現し、投機的アクセラレーションにより1カードあたり1528トークン/秒にさらに改善することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:42:15 GMT)
LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents [103.7] LabUtopiaは、一般化可能な推論可能なエンボディエージェントの開発を容易にするために設計された総合的なシミュレーションとベンチマークスイートである。
30の異なるタスクをサポートし、200以上のシーンと楽器の資産を含んでいる。
LabUtopiaは、科学的目的のエージェントにおける知覚、計画、制御の統合を促進する強力なプラットフォームを提供していることを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:50:53 GMT)
The Silent Saboteur: Imperceptible Adversarial Attacks against Black-Box Retrieval-Augmented Generation Systems [101.7] 本稿では,RAGシステムに対する敵攻撃について検討し,その脆弱性を同定する。
このタスクは、ターゲット文書を検索する非知覚的な摂動を見つけることを目的としており、もともとはトップ$k$の候補セットから除外されていた。
本稿では、攻撃者とターゲットRAG間の相互作用を追跡する強化学習ベースのフレームワークであるReGENTを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:01:29 GMT)
SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement [100.9] 我々はThinkLite-VLを紹介した。これは最先端(SoTA)パフォーマンスを実現する視覚推論モデルのファミリーで、トレーニングサンプルの桁数を桁違いに減らしている。
我々はMonte Carlo Tree Search (MCTS) を用いて、各インスタンスの解決に必要な視覚言語モデル(VLM)の推論反復数を用いてサンプルの難易度を測定する。
ThinkLite-VL-7BとThinkLite-VL-72Bは、8つの視覚的推論ベンチマークにおいて、それぞれのベースモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:55:27 GMT)
The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models [100.0] 本稿では,LLMによる推論,すなわち政策エントロピーの崩壊において,RLのスケーリングの大きな障害を克服することを目的としている。
実際には、エントロピーHと下流性能Rの間の変換方程式R=-a*eH+bを確立する。
Clip-Cov と KL-Cov という2つの単純かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:38:45 GMT)
Less, but Better: Efficient Multilingual Expansion for LLMs via Layer-wise Mixture-of-Experts [98.7] そこで本研究では,各層に対する新たな専門家の適切な数を決定するために,レイヤワイズ・エキスパート・アロケーション・アルゴリズム(LayerMoE)を提案する。
提案手法は, 従来の最先端のベースラインよりも60%少ない精度で性能を向上する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:54:53 GMT)
EvolveSearch: An Iterative Self-Evolving Search Agent [98.2] 大規模言語モデル(LLM)は、検索エンジンやWebブラウザなどのツールを統合することで、エージェント情報検索機能を変革した。
本研究では,SFTとRLを組み合わせた新たな反復的自己進化フレームワークであるEvolveSearchを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:50:48 GMT)
HiDream-I1: A High-Efficient Image Generative Foundation Model with Sparse Diffusion Transformer [95.3] HiDream-I1は17Bパラメータを持つオープンソースの画像生成基盤モデルである。
最先端の画像生成品質を数秒で達成する。
テキスト画像生成と命令ベースの画像編集を統合することで、HiDream-I1は進化し、包括的なイメージエージェントを形成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:15 GMT)
Pangu Embedded: An Efficient Dual-system LLM Reasoner with Metacognition [94.5] Pangu Embeddedは、Ascend Neural Processing Units (NPU) 上で開発された効率的なLarge Language Model (LLM) 推論器である。
既存の推論最適化 LLM でよく見られる計算コストと推論遅延の問題に対処する。
単一の統一モデルアーキテクチャ内で、迅速な応答と最先端の推論品質を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:03:02 GMT)
BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages [93.9] BRIGHTERは28の言語と複数のドメインにまたがるマルチラベルで感情アノテートされたデータセットの集合である。
データ収集とアノテーションプロセスに関する課題を強調し、モノリンガルおよびクロスリンガルなマルチラベル感情識別のための実験結果を報告する。
BRIGHTERデータセットは、テキストベースの感情認識のギャップに対処するための重要なステップであることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:24:43 GMT)
A Knowledge-guided Adversarial Defense for Resisting Malicious Visual Manipulation [93.3] 視覚的操作の悪意ある応用は、多くの分野でユーザーのセキュリティと評判に深刻な脅威をもたらしている。
本稿では,悪質な操作モデルを積極的に強制し,意味論的に混乱したサンプルを出力するために,知識誘導型敵防衛(KGAD)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:30:56 GMT)
Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models [92.7] 大規模言語モデル(LLM)は知識ギャップと幻覚のために忠実な推論に苦しむ。
グラフ制約推論(GCR)は、KGにおける構造的知識とLLMにおける非構造的推論を橋渡しする新しいフレームワークである。
GCRは最先端のパフォーマンスを達成し、追加のトレーニングをすることなく、見えないKGに対して強力なゼロショット一般化性を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:54:26 GMT)
NLP for Social Good: A Survey of Challenges, Opportunities, and Responsible Deployment [90.1] 自然言語処理の分野は、より意図と責任を持ったデプロイメントへのアプローチの必要性が高まっている、と私たちは考えています。
本稿では,NLPが社会的課題に対処する上で果たす役割について考察する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:14:44 GMT)
SeePhys: Does Seeing Help Thinking? -- Benchmarking Vision-Based Physics Reasoning [89.5] 物理問題に基づく推論のための大規模マルチモーダルベンチマークである SeePhys を提示する。
このベンチマークは、物理学の分野にまたがる7つの基本的な領域をカバーし、21のカテゴリの非常に異質なダイアグラムを取り入れている。
最も先進的な視覚推論モデル(例えばGemini-2.5-proやo4-mini)でさえ、ベンチマークで60%未満の精度を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:02:43 GMT)
3D Question Answering via only 2D Vision-Language Models [87.4] 大規模視覚言語モデル(LVLM)は、多くの分野を進歩させた。
代表的な例として,3次元質問応答(3D-QA)を用いた3次元シーン理解タスクの活用について検討する。
具体的には、3Dポイントクラウドから2Dビューをサンプリングし、2Dモデルにフィードして、与えられた質問に答える。
我々は3D-QAのための重要かつ多様なビューを自動的に選択する新しいアプローチであるcdViewsを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:04:39 GMT)
Kimi k1.5: Scaling Reinforcement Learning with LLMs [84.9] 我々は、強化学習で訓練された最新のマルチモーダル言語モデル、Kimi k1.5の訓練実践について報告する。
長いコンテキストスケーリングと改善されたポリシー最適化手法が、我々のアプローチの鍵となる要素である。
本システムは,複数のベンチマークやモダリティに対して,最先端の推論性能を実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:57:30 GMT)
Resolving Knowledge Conflicts in Domain-specific Data Selection: A Case Study on Medical Instruction-tuning [84.0] ドメイン固有の命令チューニングは、大規模言語モデルの性能向上のためのデファクトスタンダードとなっている。
LLMの実際のニーズを満たすドメイン固有の命令調整データを選択するための知識対応データ選択フレームワークを提案する。
大きな知識の衝突でデータをフィルタリングし、高品質で多様なデータをサンプリングすることで、KDSはLLMの能力を効果的に刺激し、ドメイン固有のパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:18:24 GMT)
KaFT: Knowledge-aware Fine-tuning for Boosting LLMs' Domain-specific Question-Answering Performance [84.0] Supervised Fine-tuning (SFT)は、大規模言語モデル(LLM)のドメイン固有質問応答(QA)性能を改善するための一般的なアプローチである。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:04:05 GMT)
3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model [83.7] 人間は、時間的・空間的な体験にまたがって長期記憶を活用することで、複雑なタスクを実行するのに優れる。
現在のLarge Language Models (LLM) は、動的でマルチルームな3D環境において、効果的に計画し、振る舞うのに苦労している。
本稿では,空間的時間的推論と動作を具現化した新しい動的メモリ管理と融合モデルである3DLLM-Memを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:13 GMT)
Decomposed Opinion Summarization with Verified Aspect-Aware Modules [82.4] レビューの観点から,ドメインに依存しないモジュラーアプローチを提案する。
科学研究、ビジネス、製品ドメインを表すデータセットをまたいだ実験を行います。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:31:34 GMT)
VQ-CTAP: Cross-Modal Fine-Grained Sequence Representation Learning for Speech Processing [81.3] テキスト音声(TTS)、音声変換(VC)、自動音声認識(ASR)などのタスクでは、クロスモーダルな粒度(フレームレベル)シーケンス表現が望まれる。
本稿では,テキストと音声を共同空間に組み込むために,クロスモーダルシーケンストランスコーダを用いた量子コントラスト・トーケン・音響事前学習(VQ-CTAP)手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:51:33 GMT)
SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement [81.3] SynWorldは、エージェントが自律的に環境を探索し、最適化し、アクションに対する理解を深めることを可能にするフレームワークである。
実験の結果,SynWorldは新しい環境下での行動知識の学習に効果的で汎用的なアプローチであることを実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:03:17 GMT)
Test-Time Immunization: A Universal Defense Framework Against Jailbreaks for (Multimodal) Large Language Models [80.7] テストタイム免疫(TIM)は、自己進化的な方法で様々なジェイルブレイク攻撃に対して適応的に防御することができる。
テストタイム免疫(TIM)は、自己進化的な方法で様々なジェイルブレイク攻撃に対して適応的に防御することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:57:46 GMT)
LongReD: Mitigating Short-Text Degradation of Long-Context Large Language Models via Restoration Distillation [79.9] 回復蒸留(LongReD)による長期事前トレーニング
LongReDは、選択されたレイヤの隠れた状態をオリジナルのモデルから短いテキストで蒸留する。
一般的なテキストベンチマークの実験では、LongReDはモデルの短文性能を効果的に維持することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:04:23 GMT)
InComeS: Integrating Compression and Selection Mechanisms into LLMs for Efficient Model Editing [77.5] In-context Learningは、コンテキストエンコーディングを通じて編集情報を解釈することで、有望な編集方法である。
この方法は、大きな言語モデルの限られたコンテキストウィンドウによって制約される。
編集コンテキストの処理能力を向上させるフレキシブルなフレームワークであるInComeSを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:20:18 GMT)
GoMatching++: Parameter- and Data-Efficient Arbitrary-Shaped Video Text Spotting and Benchmarking [77.0] ビデオテキストスポッティング(VTS)は、テキストトラッキングを追加することで、画像テキストスポッティング(ITS)を拡張する。
VTSの進歩にもかかわらず、既存のメソッドはまだITSで見られるパフォーマンスに劣っている。
GoMatching++は、既製の画像テキストスポッターをビデオスペシャリストに変換する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:02:45 GMT)
OmniAD: Detect and Understand Industrial Anomaly via Multimodal Reasoning [76.9] 我々は,微粒化解析のための異常検出と理解を統一するフレームワークであるOmniADを紹介した。
ビジュアル推論は、Text-as-Maskを活用することで詳細なインスペクションを提供する。
Visual Guided Textual Reasoningは、視覚知覚を統合することで包括的な分析を行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:02:15 GMT)
How Do LLMs Perform Two-Hop Reasoning in Context? [76.8] 2-ホップ推論(英: two-hop reasoning)とは、2つの論理的なステップで結論を導く過程を指す。
近年の大規模言語モデル(LLM)の進歩にもかかわらず、単純な2つのホップ推論の問題を解くのに失敗することは驚くほどある。
我々は、合成二脚推論タスクでスクラッチから3層トランスフォーマーを訓練し、内部情報の流れをリバースエンジニアリングする。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:25:29 GMT)
Text Generation Beyond Discrete Token Sampling [76.0] 入力の混合(Mixture of Inputs, MoI)は、自動回帰生成のためのトレーニング不要な方法である。
MoIはQwQ-32B、Nemotron-Super-49B、Gemma-3-27B、DAPO-Qwen-32Bを含む複数のモデルのパフォーマンスを継続的に改善している。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:56:17 GMT)
Zooming from Context to Cue: Hierarchical Preference Optimization for Multi-Image MLLMs [74.7] マルチレベル優先最適化フレームワークであるContext-to-Cue Direct Preference Optimization (CcDPO)を提案する。
CcDPOは、シーケンシャルなコンテキストからローカルな詳細まで、視覚的なヒントをズームすることで、マルチイメージ設定でのイメージ単位の知覚を強化する。
実験により、CcDPOは幻覚を著しく減少させ、一貫した性能向上をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:24:02 GMT)
AlignGen: Boosting Personalized Image Generation with Cross-Modality Prior Alignment [74.5] 我々は、パーソナライズされた画像生成のためのクロスモーダル優先アライメント機構であるAlignGenを提案する。
AlignGenは、既存のゼロショットメソッドよりも優れており、一般的なテスト時間最適化アプローチを超えています。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:57:55 GMT)
UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control [73.7] 最適制御(SOC)に基づく拡散ブリッジ統合フレームワークUniDBを提案する。
UniDBは、SOCベースの最適化を通じて問題を定式化し、最適制御器のための閉形式解を導出する。
Doobの$h$-transformを使った既存の拡散ブリッジが、我々のフレームワークの特別なケースであることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:21:32 GMT)
OVERT: A Benchmark for Over-Refusal Evaluation on Text-to-Image Models [73.7] Over-refusalは$textitover-refusal$として知られる現象で、T2Iモデルの実用性を減らす。
我々は,OVERT(textbfOVE$r-$textbfR$efusal evaluation on $textbfT$ext-to-image model)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:52:41 GMT)
PacTure: Efficient PBR Texture Generation on Packed Views with Visual Autoregressive Models [73.4] PacTureは、未ドメインの3Dメッシュから物理ベースのレンダリング(PBR)素材テクスチャを生成するためのフレームワークである。
ビューパッキング(View Packing)は、ビュー毎の有効解像度を高める新しいテクニックである。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:23:30 GMT)
Redundancy Principles for MLLMs Benchmarks [72.9] 1) ベンチマーク能力の冗長性,2) テスト質問数の冗長性,3) 特定のドメイン内のクロスベンチマークの冗長性。
20以上のベンチマークで数百のMLLMの性能を総合的に分析することにより,既存のMLLM評価における冗長性のレベルを定量的に測定することを目指している。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:41:02 GMT)
Full Domain Analysis in Fluid Dynamics [72.9] 進化的最適化、シミュレーション、機械学習の新たな技術は、流体力学のような領域を幅広く分析することを可能にする。
完全なドメイン分析は、計算物理学などにおける複雑なシステムを理解するのに有用なツールである。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:06:48 GMT)
Minimal Quantum Reservoirs with Hamiltonian Encoding [72.3] ハミルトニアン符号化に基づく量子貯水池計算のための最小限のアーキテクチャについて検討する。
このアプローチは、一般的に量子機械学習に関連する実験的なオーバーヘッドの多くを回避します。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:50:05 GMT)
CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design [69.8] CreatiDesignは、モデルアーキテクチャとデータセット構築の両方をカバーする、自動グラフィック設計のための体系的なソリューションである。
まず、異種設計要素の柔軟かつ正確な統合を可能にする統合されたマルチ条件駆動アーキテクチャを設計する。
さらに,各条件が指定された画像領域を正確に制御することを保証するため,マルチモーダルアテンションマスク機構を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:34:54 GMT)
EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.6] 戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:03:41 GMT)
EPiC: Efficient Video Camera Control Learning with Precise Anchor-Video Guidance [69.4] 本稿では,効率的なカメラ制御学習フレームワークであるEPiCを紹介する。
高価なカメラ軌跡アノテーションを使わずに高品質なアンカービデオを構築する。
EPiCはI2Vカメラ制御タスクに対してRealEstate10KとMiraDataのSOTA性能を達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:45:26 GMT)
Wolf Hidden in Sheep's Conversations: Toward Harmless Data-Based Backdoor Attacks for Jailbreaking Large Language Models [69.1] Supervised Fine-tuning (SFT) は、大きな言語モデルと人間の意図を協調させ、ラベル付きタスク固有データでトレーニングする。
近年の研究では、悪意のある攻撃者が、有害な質問応答ペアにトリガーを埋め込むことで、これらのモデルにバックドアを注入できることが示されている。
脱獄性LLMに対する新しいクリーンデータバックドアアタックを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:00:15 GMT)
Dynamic-Aware Video Distillation: Optimizing Temporal Resolution Based on Video Semantics [68.9] ビデオデータセットは、時間的情報の存在と異なるクラスにまたがる様々なレベルの冗長性によって、ユニークな課題を示す。
既存のDDアプローチでは、すべての異なるビデオセマンティクスにおける時間的冗長性を均一に仮定し、ビデオデータセットにおけるその有効性を制限している。
合成ビデオの時間分解能を最適に予測するための強化学習(RL)アプローチである動的認識ビデオ蒸留(DAViD)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:43:58 GMT)
SplitLoRA: Balancing Stability and Plasticity in Continual Learning Through Gradient Space Splitting [68.0] 継続的な学習には、安定性を保ちながら複数のタスクを連続的に学習するモデルが必要である。
グラディエント・プロジェクションはCLにおいて有効で一般的なパラダイムとして現れ、以前に学習したタスクの勾配空間を2つの部分空間に分割する。
新しいタスクは小部分空間内で効果的に学習され、これにより以前取得した知識との干渉が軽減される。
既存の勾配射影法は、勾配空間を適切に分割することが困難であるため、塑性と安定性の最適なバランスを達成するのに苦労する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:57:56 GMT)
DIPO: Dual-State Images Controlled Articulated Object Generation Powered by Diverse Data [68.0] DIPOは、一対のイメージから調音された3Dオブジェクトを制御可能な生成するためのフレームワークである。
本稿では,イメージペア間の関係を捉え,部分配置と関節パラメータを生成するデュアルイメージ拡散モデルを提案する。
複雑な3Dオブジェクトの大規模データセットであるPM-Xについて,レンダリング画像,URDFアノテーション,テキスト記述を伴って提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:22:57 GMT)
KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization [67.7] LLMは、大きなコンテキストウィンドウを必要とするアプリケーションでの利用が増えており、この大きなコンテキストウィンドウでは、KVキャッシュのアクティベーションが推論時のメモリ消費の主要な要因として表面化している。
量子化はKVキャッシュのアクティベーションを圧縮する上で有望な手法であるが、既存のソリューションは4ビット以下の精度でアクティベーションを正確に表現できない。
我々の研究であるKVQuantは、いくつかの新しい手法を取り入れることで、低精度のKVキャッシュ量子化を容易にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:58:29 GMT)
WebDancer: Towards Autonomous Information Seeking Agency [67.1] エージェントシステムの最近の進歩は、自律的な多段階研究の可能性を強調している。
データ中心およびトレーニング段階の観点からエージェントを探索するエンドツーエンドのエージェント情報を構築するための凝集パラダイムを提案する。
我々はこのフレームワークを ReAct, WebDancer に基づいた Web エージェントでインスタンス化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:57:07 GMT)
EULER: Enhancing the Reasoning Ability of Large Language Models through Error-Induced Learning [66.8] 大きな言語モデル(LLM)は強力な推論能力を示している。
Error-IndUced LEaRning (EULER) モデルは、高品質なソリューションエラーを生成するエラー露光モデルを開発することを目的としている。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:57:03 GMT)
Exploring Criteria of Loss Reweighting to Enhance LLM Unlearning [66.8] 損失再重み付けは、大きな言語モデル(LLM)を用いた機械学習において大きなメリットを示している。
本稿では,損失再重み付け,すなわち飽和と重要度という2つの異なる目標を同定する。
飽和度と重要度の両方の利点を組み合わせた簡易な再重み付け手法であるSatImpを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:33:24 GMT)
The Avengers: A Simple Recipe for Uniting Smaller Language Models to Challenge Proprietary Giants [66.7] 我々は、オープンソースのより小さな言語モデルの集合的インテリジェンスを効果的に活用する簡単なレシピであるAvengersを紹介します。
10のオープンソースモデル(それぞれ7Bパラメータ)により、Avengersは15のデータセットのうち9つでGPT-4.1を上回っている。
特に数学タスクでは GPT-4.1 を 18.21% 、コードタスクでは 7.46% で上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:47:12 GMT)
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control [66.7] VideoAnydoorは、高忠実度ディテール保存と正確なモーションコントロールを備えたゼロショットビデオオブジェクト挿入フレームワークである。
詳細な外観を保ちながら、微粒な動き制御をサポートするため、我々は画素ワーパーを設計する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:03:56 GMT)
Evaluating Implicit Bias in Large Language Models by Attacking From a Psychometric Perspective [66.3] 我々は、ある人口層に対する大きな言語モデルの暗黙の偏見を厳格に評価する。
心理測定の原則にインスパイアされた我々は,3つの攻撃的アプローチ,すなわち,軽視,軽視,指導を提案する。
提案手法は,LLMの内部バイアスを競合ベースラインよりも効果的に引き出すことができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:25:26 GMT)
Training Language Models to Generate Quality Code with Program Analysis Feedback [66.1] 大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:57:47 GMT)
One-Way Ticket:Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models [66.0] テキスト・ツー・イメージ(T2I)拡散モデルは、推論速度と画質のトレードオフに直面している。
学生モデルUNetアーキテクチャのための最初の時間非依存の統一TiUEを紹介する。
ワンパススキームを使用して、TiUEは複数のデコーダタイムステップにまたがるエンコーダ機能を共有し、並列サンプリングを可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:23:22 GMT)
Co-Saving: Resource Aware Multi-Agent Collaboration for Software Development [65.9] 本稿では,リソースを意識したマルチエージェントシステムであるCo-Savingを提案する。
私たちの重要なイノベーションは、"ショートカット"の導入です。
最先端のMAS ChatDevと比較して,トークン使用量の平均50.85%の削減を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:23:53 GMT)
Outsourced diffusion sampling: Efficient posterior inference in latent spaces of generative models [65.7] 本稿では、$p(mathbfxmidmathbfy) propto p_theta(mathbfx)$ という形式の後続分布からサンプリングするコストを償却する。
多くのモデルや制約に対して、後部ノイズ空間はデータ空間よりも滑らかであり、償却推論により適している。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:58:36 GMT)
Zero-Shot Vision Encoder Grafting via LLM Surrogates [65.4] 視覚言語モデル(VLM)は通常、控えめな大きさの視覚エンコーダと大きな言語モデル(LLM)をペアリングする。
我々は,大対象LLMと同じ埋め込み空間と表現言語を共有する小さな「代理モデル」を構築した。
我々のサロゲートトレーニングアプローチは、Llama-70Bをデコーダとして使用する場合、全体のVLMトレーニングコストを45%削減する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:59 GMT)
RAG-Zeval: Towards Robust and Interpretable Evaluation on RAG Responses through End-to-End Rule-Guided Reasoning [64.5] RAG-Zevalは、ルール誘導推論タスクとして忠実さと正しさの評価を定式化する、新しいエンドツーエンドフレームワークである。
提案手法は、強化学習による評価者を訓練し、コンパクトなモデルにより包括的および音質評価を生成する。
実験では、RAG-Zevalの優れた性能を示し、人間の判断と最も強い相関性を達成した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:55:33 GMT)
ReLearn: Unlearning via Learning for Large Language Models [64.3] 本研究では、効果的なアンラーニングのためのデータ拡張および微調整パイプラインであるReLearnを提案する。
このフレームワークでは、知識レベルの保存を測定するために、知識獲得率(KFR)と知識保持率(KRR)を導入している。
実験の結果,ReLearnは高品質な出力を保ちながら,目標とするリセットを実現することができた。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:57:30 GMT)
Learning Latent Graph Structures and their Uncertainty [64.0] 点予測損失の最小化は、潜時関係情報の適切な学習を保証するものではないことを示す。
本稿では,この共同学習課題を解決するサンプリングベース手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:44:29 GMT)
Deep Video Discovery: Agentic Search with Tool Use for Long-form Video Understanding [63.8] 長時間の映像理解は時間空間の複雑さによって大きな課題を呈する。
セグメント化されたビデオクリップ上でのエージェント検索戦略を活用するために,Deep Video Discoveryエージェントを提案する。
我々のDVDエージェントはSOTA性能を達成し,LVBenchデータセットの先行処理をはるかに上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:30:39 GMT)
CoSER: Coordinating LLM-Based Persona Simulation of Established Roles [62.9] CoSERデータセットは771冊の有名な書籍から17,966文字をカバーしている。
我々は,LLaMA-3.1 モデル上に構築された高度なオープンロールプレイング LLM である CoSER 8B と CoSER 70B を開発した。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:23:09 GMT)
Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.7] The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。
現在の最先端の成果を改善するために,3つの重要なコントリビューションを行います。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:49:57 GMT)
Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning [62.4] 本稿では,行動列上のQ値を出力する批判ネットワークを学習する,新しい値に基づく強化学習アルゴリズムを提案する。
実験により、CQN-ASは、様々なスパース逆ヒューマノイド制御およびテーブルトップ操作タスクにおいて、いくつかのベースラインより優れていることが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:11:21 GMT)
BinauralFlow: A Causal and Streamable Approach for High-Quality Binaural Speech Synthesis with Flow Matching Models [62.4] バイノーラルレンダリングパイプラインは、モノラルオーディオに基づいて自然な聴覚を模倣するオーディオを合成することを目的としている。
この問題を解決するために多くの方法が提案されているが、レンダリング品質とストリーミング可能な推論に苦慮している。
本稿では,BinauralFlow合成フレームワークという,フローマッチングに基づくストリーミング音声フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:59:15 GMT)
Fostering Video Reasoning via Next-Event Prediction [61.7] 我々は,将来的なビデオセグメントを,時間的推論を促進するためのリッチで自己指導的な信号として活用する学習タスクとして,次世代予測(NEP)を提案する。
このタスクを支援するために,V1-33Kという,多様な実世界のシナリオにまたがる33,000のビデオセグメントを自動抽出したデータセットをキュレートする。
NEPはMLLMの時間的推論を促進するためのスケーラブルで効果的なトレーニングパラダイムを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:13:34 GMT)
DreamMask: Boosting Open-vocabulary Panoptic Segmentation with Synthetic Data [61.6] オープンな語彙設定でトレーニングデータを生成する方法と、実データと合成データの両方でモデルをトレーニングする方法を探索するDreamMaskを提案する。
一般的に、DreamMaskは大規模なトレーニングデータの収集を著しく単純化し、既存のメソッドのプラグイン・アンド・プレイ・エンハンスメントとして機能する。
例えば、COCOで訓練しADE20Kで試験すると、ドリームマスクを装備したモデルは以前の最先端の2.1% mIoUよりも優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:11:16 GMT)
Reverse Preference Optimization for Complex Instruction Following [61.4] 本稿では,Reverse Preference Optimization (RPO) という,シンプルで効果的な手法を提案する。
選択された応答が完璧であることを保証するために、命令内の制約を動的に反転させることで、優先ペアのノイズを緩和する。
RPOはモデルサイズで効果的にスケールし、70B RPOモデルはGPT-4oを超える。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:44:27 GMT)
Epsilon-VAE: Denoising as Visual Decoding [61.3] 復号化は1段階の再構成から反復的改良へと移行する。
具体的には、デコーダを拡散処理に置き換え、ノイズを反復的に改善して元の画像を復元する。
拡散による反復的再構成により, 自己エンコーダであるEpsilon-VAEは高い再構成品質を実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:15:39 GMT)
Learning in Stackelberg Games with Non-myopic Agents [60.9] そこで本研究では,主役が非筋力的な長寿命エージェントと繰り返し対話するスタックルバーグゲームについて,エージェントの支払関数を知らずに検討する。
我々は、非ミオピックエージェントの存在下での学習を、ミオピックエージェントの存在下で堅牢な帯域最適化に還元する一般的なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:18:44 GMT)
Learning to Route Queries Across Knowledge Bases for Step-wise Retrieval-Augmented Reasoning [60.8] Multimodal Retrieval-Augmented Generation (MRAG)は、マルチモーダル大言語モデル(MLLM)における幻覚の緩和を約束している。
進化する推論状態に基づいて知識をいつどこで取得するかを学習する新しいMRAGフレームワークであるR1を提案する。
R1-は多種多様なKBを適応的かつ効果的に利用でき、不要な検索を減らし、効率と精度を向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:17:57 GMT)
Inference-time Alignment in Continuous Space [60.2] 推論時間アライメントのための単純で効果的なアルゴリズムであるSimple Energy Adaptation(textbfSEA$)を提案する。
SEAは、連続潜時空間における勾配に基づくサンプリングを通じて、基本ポリシーから最適なものへの元の応答を適応する。
例えば、SEAはAdvBenchで最大$textbf77.51%$、MATHで$textbf16.36%$で2番目に高いベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:53:42 GMT)
On the Within-class Variation Issue in Alzheimer's Disease Detection [60.1] Alzheimer's Disease (AD) 検出では、ADと非ADの個人を区別するために、機械学習の分類モデルを使用している。
そこで本研究では,サンプルスコア推定器を用いて,認知的スコアと整合した標本特異的なソフトスコアを生成できることを確認した。
ソフトターゲット蒸留(SoTD)とインスタンスレベルの再分散(InRe)の2つの簡易かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:42:35 GMT)
Benchmarking Abstract and Reasoning Abilities Through A Theoretical Perspective [59.7] 抽象的推論を本質的なパターンを抽出する能力として定義する数学的枠組みを開発する。
基本的な推論精度を計測する(scoreGamma)と、特定のシンボルに依存するモデルの定量化(scoreDelta)である。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:02:45 GMT)
Train with Perturbation, Infer after Merging: A Two-Stage Framework for Continual Learning [59.7] P&M(texttext-Perturb-and-Merge)は,モデルマージをCLパラダイムに統合し,忘れることを避けるための新しい連続学習フレームワークである。
理論的解析により、全てのタスクにおける総損失増加を最小化し、最適マージ係数の解析解を導出する。
提案手法は,複数の連続学習ベンチマークデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:14:19 GMT)
AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy [59.3] AstroVisBenchは天文学領域における科学計算と可視化の両方のための最初のベンチマークである。
本稿では,最先端言語モデルの評価を行い,天文学研究に有用なアシスタントとして携わる能力に大きなギャップがあることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:54:54 GMT)
Position: All Current Generative Fidelity and Diversity Metrics are Flawed [58.8] 現在のジェネレーティブの忠実度と多様性の指標がすべて欠陥があることを示します。
私たちの目標は、モデルではなく、メトリクスの開発により多くの労力を費やすように研究コミュニティを説得することにあります。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:10:33 GMT)
On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.8] 大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:43:19 GMT)
Continuous Evolution Pool: Taming Recurring Concept Drift in Online Time Series Forecasting [58.4] 継続的進化プール(Continuous Evolution Pool, CEP)は、異なる概念の予測器のインスタンスを格納するプール機構である。
CEPは、様々な概念の知識を効果的に保持する。
オンライン予測と繰り返し概念のシナリオでは,CEPは予測結果を著しく向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:27:49 GMT)
ProCrop: Learning Aesthetic Image Cropping from Professional Compositions [57.9] ProCropは、プロの写真を利用して収穫決定を導く検索方式である。
プロ画像のアウトペイントによって生成された242Kの弱い注釈付き画像の大規模データセットを提示する。
この合成対応データセット生成は、美学原理で導かれる多様な高品質な作物提案を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:38:44 GMT)
VideoRAG: Retrieval-Augmented Generation over Video Corpus [57.7] VideoRAGは、クエリによる関連性に基づいて、動的にビデオを取得するフレームワークである。
VideoRAGは近年のLVLM(Large Video Language Models)を利用している。
我々は,ビデオRAGの有効性を実験的に検証し,関連するベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:14:55 GMT)
From Large AI Models to Agentic AI: A Tutorial on Future Intelligent Communications [57.4] このチュートリアルは、大規模人工知能モデル(LAM)とエージェントAI技術の原則、設計、応用に関する体系的な紹介を提供する。
我々は,6G通信の背景を概説し,LAMからエージェントAIへの技術的進化を概説し,チュートリアルのモチベーションと主な貢献を明らかにする。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:54:07 GMT)
VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models [57.3] VScanは2段階のビジュアルトークン削減フレームワークである。
1)グローバルスキャンとローカルスキャンを視覚的エンコーディング中にマージすることで,(2)言語モデルの中間層にプルーニングを導入する。
VScanはプリフィルの2.91$times$スピードアップとFLOPの10$times$ダウンを実現し、オリジナルのパフォーマンスの95.4%を維持した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:08 GMT)
Efficient Long Context Language Model Retrieval with Compression [57.1] 情報検索のための新しいパラダイムとしてLong Context Language Models (LCLM)が登場した。
本稿では,LCLM検索に適した新しい圧縮手法を提案する。
また,CoLoRはテキスト内サイズを1.91倍に圧縮し,検索性能を6%向上することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:52:57 GMT)
Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [56.8] 2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。
TPAUC最適化のための既存のアルゴリズムは未探索のままである。
TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:55:05 GMT)
Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization [56.7] 本稿では,複雑なメモシステムや事前の高品質な実演データを必要としない,複数のタスクに対する知識とスキルを取り入れたAIエージェントの訓練手法を提案する。
このアプローチでは,エージェントが新たな経験を収集し,ヒントの形で人間から補正フィードバックを受け取り,このフィードバックを重みに組み込む,反復的なプロセスを採用している。
Llama-3をベースとしたエージェントに実装することで,数ラウンドのフィードバックの後,高度なモデルGPT-4oとDeepSeek-V3をタスクセットで性能向上させる手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:55:35 GMT)
CoThink: Token-Efficient Reasoning via Instruct Models Guiding Reasoning Models [56.4] 大規模言語モデル(LLM)は、テスト時間スケーリングとして知られる、テスト時間計算の増加の恩恵を受ける。
しかし、推論最適化モデルはしばしば単純な問題さえ考え過ぎ、過度に冗長な出力を生成し、トークン効率を低下させる。
1)強化学習は前方推論の情報密度を減少させ,(2)後方連鎖学習は冗長でしばしば不要な検証ステップを促進する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:24:45 GMT)
ObjectClear: Complete Object Removal via Object-Effect Attention [56.3] 我々は、オブジェクトとそれに関連する視覚的アーティファクトの両方の正確なマスクとともに、オブジェクト効果と不要なペア画像を提供するOBERという、オブジェクト・エフェクト除去のための新しいデータセットを紹介した。
本研究では,物体効果の注意機構を組み込んだ新しいフレームワーク ObjectClear を提案する。
実験では、ObjectClearが既存のメソッドよりも優れており、特に複雑なシナリオにおいて、オブジェクト・エフェクトの除去品質と背景の忠実さの改善を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:51:17 GMT)
SafetyAnalyst: Interpretable, Transparent, and Steerable Safety Moderation for AI Behavior [56.1] 我々は、新しいAI安全モデレーションフレームワークであるSafetyAnalystを紹介する。
AIの振る舞いを考えると、SafetyAnalystはチェーン・オブ・シークレット・推論を使用してその潜在的な結果を分析する。
効果を28個の完全に解釈可能な重みパラメータを使って有害度スコアに集約する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:21:43 GMT)
AutoL2S: Auto Long-Short Reasoning for Efficient Large Language Models [56.1] 推論可能な大規模言語モデル(LLM)は、複雑な推論タスクにおいて強力な性能を示す。
最近のアプローチでは、長い推論や短い推論をいつ適用すべきかを手動で決めることによって、この問題に対処しようとしている。
本稿では,LLMが生成した推論経路を動的に圧縮できる動的かつモデルに依存しないフレームワークであるAuto Long-Short Reasoning (AutoL2S)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:53 GMT)
Bridging Supervised Learning and Reinforcement Learning in Math Reasoning [55.9] 強化学習(Reinforcement Learning, RL)は、二分検証信号による自己改善を可能にすることで、近年の数学能力の急上昇において中心的な役割を担っている。
本研究は,LLMが障害を反映し,外部教師なしで自律的に改善できる教師型アプローチである負認識ファインチューニング(NFT)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:31:37 GMT)
Enhancing Uncertainty Estimation and Interpretability via Bayesian Non-negative Decision Layer [55.7] 本研究では, ディープニューラルネットワークを条件付きベイズ非負因子分析として再構成したベイズ非負決定層(BNDL)を開発した。
BNDLは複雑な依存関係をモデル化し、堅牢な不確実性推定を提供する。
また,BNDLが効果的に不整合学習を達成できるという理論的保証も提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:23:34 GMT)
Real-Time Blind Defocus Deblurring for Earth Observation: The IMAGIN-e Mission Approach [55.2] この研究は、ISSのIMAGIN-eミッションの地球観測画像の機械的デフォーカスに対処する。
提案手法は,Sentinel-2データを用いてデフォーカスカーネルを推定し,GANフレームワーク内で復元モデルをトレーニングする。
このアプローチは現在、IMAGIN-eミッションで展開されており、運用宇宙環境における実用性を実証している。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:52:38 GMT)
NGPU-LM: GPU-Accelerated N-Gram Language Model for Context-Biasing in Greedy ASR Decoding [54.9] この研究は、統計的なn-gram言語モデルのデータ構造を再考し、GPU最適化推論の高速かつ並列な操作を可能にする。
我々のアプローチは NGPU-LM と呼ばれ、7% 未満の計算オーバーヘッドを持つ全ての主要な ASR モデルに対して、カスタマイズ可能なgreedy decoding を導入している。
提案手法は,ビーム探索による顕著な遅延を回避しつつ,greedy と beam search の精度ギャップの50%以上を排除できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:43:10 GMT)
Scaling-up Perceptual Video Quality Assessment [54.7] マルチモーダル・イン・ループ型VQAマルチモーダル・インストラクション・データベースを効率的に構築する方法を示す。
我々の焦点は、微細なVQAの知識を提供するために、多くのコンテキスト内インストラクションデータを持つ技術と美的品質の次元である。
この結果から,我々のモデルは,品質理解と評価の両タスクにおいて,最先端のパフォーマンスを達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:24:52 GMT)
Variational Positive-incentive Noise: How Noise Benefits Models [54.4] 正感雑音(Pi-Noise)の枠組みに基づくランダムノイズによる古典モデルの利点について検討する。
Pi-Noiseの理想的目的は難易度が高いため,その代わりに変分境界,すなわち変分Pi-Noise(VPN)を最適化することを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:07:08 GMT)
ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation [54.3] VLA(Vision-Language-Action)モデルは、事前訓練された視覚表現と言語表現を活用することで、高度な汎用ロボット操作を実現する。
ForceVLAは、外力センシングをVLAシステム内の第一級のモダリティとして扱う。
提案手法は,器用な操作のためのマルチモーダル統合の重要性を強調し,身体知能ロボット制御のための新しいベンチマークを設定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:24:25 GMT)
VidText: Towards Comprehensive Evaluation for Video Text Understanding [54.2] VidTextは、ビデオテキスト理解の総合的かつ詳細な評価のためのベンチマークである。
さまざまな現実世界のシナリオをカバーし、多言語コンテンツをサポートする。
ビデオレベル、クリップレベル、インスタンスレベルのタスクを備えた階層的評価フレームワークを導入している。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:39:35 GMT)
Reference-Guided Identity Preserving Face Restoration [54.1] 顔のアイデンティティを保存することは、拡散に基づく画像復元において重要な課題である。
本稿では,顔の復元とアイデンティティの保存を改善するために,参照顔の有用性を最大化するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:46:34 GMT)
AutoElicit: Using Large Language Models for Expert Prior Elicitation in Predictive Modelling [53.5] 我々はAutoElicitを導入し、大規模言語モデルから知識を抽出し、予測モデルのための事前構築を行う。
これらの先行情報は情報的であり、自然言語を用いて洗練できることを示す。
AutoElicitは、非形式的な事前よりもエラーを大幅に減らし、ラベルを減らし、コンテクスト内学習を一貫して上回ります。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:16:40 GMT)
Criticality and Safety Margins for Reinforcement Learning [53.1] 我々は,定量化基盤真理とユーザにとっての明確な意義の両面から,批判的枠組みを定めようとしている。
エージェントがn連続的ランダム動作に対するポリシーから逸脱した場合の報酬の減少として真臨界を導入する。
我々はまた、真の臨界と統計的に単調な関係を持つ低オーバーヘッド計量であるプロキシ臨界の概念も導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:54:17 GMT)
StateSpaceDiffuser: Bringing Long Context to Diffusion World Models [53.1] StateSpaceDiffuserを導入し、長文タスクで拡散モデルを実行できるようにする。
この設計は拡散モデルの高忠実性合成を犠牲にすることなく長期記憶を復元する。
実験の結果、StateSpaceDiffuserは強力な拡散のみのベースラインを著しく上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:27:54 GMT)
Characterizing Bias: Benchmarking Large Language Models in Simplified versus Traditional Chinese [53.0] 本研究では,大言語モデルが中国語の2つの変種に刺激された場合の差分性能について検討する。
実世界のシナリオを反映した2つのベンチマークタスクを設計する。
分析の結果、LLM応答のバイアスはタスクとプロンプト言語の両方に依存していることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:56:49 GMT)
On Geometry-Enhanced Parameter-Efficient Fine-Tuning for 3D Scene Segmentation [53.0] 本稿では3Dポイント・クラウド・トランス用に設計された新しい幾何対応PEFTモジュールを提案する。
当社のアプローチでは,大規模3Dポイントクラウドモデルの効率的,スケーラブル,かつ幾何を考慮した微調整のための新しいベンチマークを設定している。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:08:36 GMT)
OSCAR: One-Step Diffusion Codec for Image Compression Across Multiple Bit-rates [52.7] 事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。
既存の手法のほとんどは、ランダムノイズから反復的にデノイングすることで、イメージを再構成する。
我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:58:12 GMT)
Faster and Better LLMs via Latency-Aware Test-Time Scaling [52.1] テスト時間スケーリング(TTS)は、推論時の言語モデル(LLM)の性能向上に有効であることが証明されている。
既存の研究は、レイテンシに敏感な観点から、TSの効率性を見落としている。
計算最適TSは、レイテンシが重要となるシナリオにおいて、必ずしも最低レイテンシをもたらすとは限らないことを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:14:01 GMT)
Arbiters of Ambivalence: Challenges of Using LLMs in No-Consensus Tasks [52.1] 本研究では, LLMのバイアスと限界について, 応答生成器, 判定器, 討論器の3つの役割について検討した。
我々は、様々な先行的曖昧なシナリオを含む例をキュレートすることで、合意なしのベンチマークを開発する。
以上の結果から, LLMは, オープンエンドの回答を生成する際に, 曖昧な評価を行うことができる一方で, 審査員や討論者として採用する場合は, 合意なしのトピックにスタンスを取る傾向が示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:31:54 GMT)
Judging Quality Across Languages: A Multilingual Approach to Pretraining Data Filtering with Language Models [51.8] 大規模言語モデル(LLM)を効果的に事前学習するためには,高品質な多言語学習データが不可欠である
本稿では,多言語多言語データを大規模に効率的にキュレートする体系的アプローチであるJQLを紹介する。
JQLは、LLMのアノテーション機能を、事前トレーニングされた多言語埋め込みに基づいて軽量アノテータに蒸留する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:06:54 GMT)
Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding [51.7] 拡散に基づく大規模言語モデル (Diffusion LLM) は、並列復号機能を持つ非自己回帰テキスト生成を約束している。
本稿では,双方向拡散モデルに適したブロック単位で近似したKVキャッシュ機構を提案する。
本稿では,信頼しきい値を超えるトークンを選択的に復号し,依存関係違反を軽減し,生成品質を維持できる信頼度対応並列復号方式を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:39:15 GMT)
MAMBO-NET: Multi-Causal Aware Modeling Backdoor-Intervention Optimization for Medical Image Segmentation Network [51.7] 融合因子は、複雑な解剖学的変異や画像のモダリティ制限などの医療画像に影響を与える可能性がある。
医用画像セグメンテーションのためのバックドア・インターベンション最適化ネットワークを提案する。
本手法は, 混乱要因の影響を著しく低減し, セグメンテーション精度を向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:40:10 GMT)
Skywork Open Reasoner 1 Technical Report [51.4] 提案するSkywork-OR1は,長期チェーン・オブ・ソート(CoT)モデルのための,効果的かつスケーラブルな強化学習(RL)実装である。
DeepSeek-R1-Distillモデルシリーズをベースとして、我々のRLアプローチは顕著なパフォーマンス向上を実現している。
我々のSkywork-OR1-32Bモデルは、AIME24とAIME25ベンチマークでDeepSeek-R1とQwen3-32Bを上回っています。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:56:04 GMT)
Online Fair Division for Personalized $2$-Value Instances [51.3] オンラインフェアディビジョン(オンラインフェアディビジョン)では,商品が一度に1つずつ到着し,定額のエージェントが配置されている。
善が現れると、各エージェントの持つ値が明らかになり、エージェントの1つに即時かつ不可逆的に割り当てられなければならない。
我々は、よく知られた公平性の概念に関して、最悪の場合の保証を得る方法を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:48:16 GMT)
Aurora: Are Android Malware Classifiers Reliable under Distribution Shift? [51.1] AURORAは、その信頼性と運用上のレジリエンスに基づいて、マルウェア分類器を評価するためのフレームワークである。
AURORAはさらに、ポイント・イン・タイムのパフォーマンスを超えるように設計されたメトリクスのセットによって補完されている。
最先端のフレームワークで観察する脆弱さは、ホワイトボードに戻る必要性を示唆している。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:22:43 GMT)
Core Context Aware Transformers for Long Context Language Modeling [50.8] 高速な長文モデリングのためのCCAアテンションを提案する。
本手法は,学習過程における冗長性を低下させながら,コアコンテキストに自動的に焦点を合わせ,強化する。
提案手法は,既存の大規模言語モデルにおける自己注意モジュールを最小限の微調整コストで置き換えることができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:05:34 GMT)
Weakly-Supervised Contrastive Learning for Imprecise Class Labels [50.6] 正対と負対を定義するために「連続的意味的類似性」の概念を導入する。
弱教師付きコントラスト学習のためのグラフ理論フレームワークを提案する。
我々のフレームワークは非常に多用途であり、多くの弱い教師付き学習シナリオに適用できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:50:40 GMT)
Distance between Relevant Information Pieces Causes Bias in Long-Context LLMs [50.4] LongPiBenchは、複数の関連する情報を含む位置バイアスを評価するために設計されたベンチマークである。
これらの実験によると、現在のほとんどのモデルは「中間の失われた」問題に対して堅牢であるが、関連する情報片の間隔に関する重大なバイアスが存在する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:13:12 GMT)
OpenS2V-Nexus: A Detailed Benchmark and Million-Scale Dataset for Subject-to-Video Generation [50.1] 我々は, (i) きめ細かいベンチマークである OpenS2V-Eval と (ii) 百万規模のデータセットである OpenS2V-5M からなる OpenS2V-Nexus を提案する。
OpenS2V-Evalは、自然の主観的外観とアイデンティティの忠実さを持つ主観的一貫性のあるビデオを生成するモデルの能力に焦点を当てている。
オープンソースの大規模S2V生成データセットOpenS2V-5Mを作成した。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:44:33 GMT)
Look Within or Look Beyond? A Theoretical Comparison Between Parameter-Efficient and Full Fine-Tuning [50.1] フルファインチューニング(FFT)に匹敵する性能を実現するPEFT法
最適化理論に基づく表現能力とロバスト性の観点から,PEFTとFFTの特性を比較した。
分類,生成,推論,微調整タスクを含む15のデータセットの実験と,11の逆検定セットによる理論の検証を行った。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:35:12 GMT)
PriRoAgg: Achieving Robust Model Aggregation with Minimum Privacy Leakage for Federated Learning [49.9] フェデレートラーニング(FL)は、大規模分散ユーザデータを活用する可能性から、最近大きな勢いを増している。
送信されたモデル更新は、センシティブなユーザ情報をリークする可能性があり、ローカルなトレーニングプロセスの集中的な制御の欠如は、モデル更新に対する悪意のある操作の影響を受けやすいグローバルモデルを残します。
我々は、Lagrange符号化計算と分散ゼロ知識証明を利用した汎用フレームワークPriRoAggを開発し、集約されたプライバシを満たすとともに、幅広いロバストな集約アルゴリズムを実行する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:55:33 GMT)
Adaptive Detoxification: Safeguarding General Capabilities of LLMs through Toxicity-Aware Knowledge Editing [49.9] ToxEditは毒性を意識した知識編集アプローチである。
前方伝播中の毒性活性化パターンを動的に検出する。
その後、適応的な層間経路を通じて計算をルーティングし、毒性を効果的に緩和する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:37:06 GMT)
Estimating the Effects of Sample Training Orders for Large Language Models without Retraining [49.6] 大規模言語モデル(LLM)において,サンプルの訓練順序が重要な役割を担っている
従来の手法では、様々なサンプル順序でモデルを再訓練する必要がある。
リトレーニングフリーのフレームワークを設計することで従来の手法を改善します。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:07:02 GMT)
Enhancing Tool Learning in Large Language Models with Hierarchical Error Checklists [49.5] 本稿では,階層型ツールエラーチェックリスト(HiTEC)フレームワークを提案する。
HiTECでは、共通、クロスツールの問題を特定するグローバルエラーチェックリストと、ツール固有の、コンテキストの障害をターゲットとするローカルエラーチェックリストという、2段階のアプローチを導入している。
本フレームワークは,基本手法と比較してパラメータ充足精度とツールコール成功率を大幅に改善する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:39:35 GMT)
Towards Scalable Language-Image Pre-training for 3D Medical Imaging [49.2] 本稿では,3次元医用画像作成のためのスケーラブルな事前訓練フレームワークHLIPについて,階層的注意を喚起する。
HLIPは、放射線学データの自然な階層(スライス、スキャン、研究)にインスパイアされた、軽量な階層的注意機構を採用している。
脳MRIで313万スキャン、頭部CTで144万スキャンで240万スキャンされた220万の患者で訓練されたHLIPは、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:16:34 GMT)
Point-to-Region Loss for Semi-Supervised Point-Based Crowd Counting [49.2] ポイント・ツー・ポイント(P2P)監視スキームを通じて、カウンターを訓練することで、混雑したシーンの歩行者を見つけるためにポイント検出が開発された。
我々は、擬似ラベルに基づく半教師付きカウントフレームワークにポイントベースのメソッドを統合する。
実装中、擬似ラベルに対する信頼度はP2Pを介して背景画素に伝達されない。
本稿では,歩行者に対応する地点を検出するのではなく,地域を分割するP2Pを代替するP2R方式を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:53:08 GMT)
FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control [49.1] FastTD3は強化学習(RL)アルゴリズムで、1つのA100 GPU上で3時間以内のHumanoidBenchタスクを解く。
我々はまた、ロボット工学におけるRL研究を加速するために、FastTD3の軽量で使いやすい実装を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:55:26 GMT)
How Transformers Learn Regular Language Recognition: A Theoretical Study on Training Dynamics and Implicit Bias [48.9] 我々は「偶対」と「パリティチェック」と呼ばれる正規言語認識のカテゴリにおける2つの代表的タスクに焦点をあてる。
我々のゴールは、注意層と線形層からなる一層トランスフォーマーが、これらの課題をいかに解決するかを探求することである。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:17:46 GMT)
Domain-Specific Pruning of Large Mixture-of-Experts Models with Few-shot Demonstrations [48.9] 本研究では,大規模MoEモデルにおける領域の特殊化と専門的冗長性について検討する。
本稿では,最も関係のある専門家のみを識別・保持するための簡易で効果的な刈取フレームワークであるEASY-EPを提案する。
DeepSeek-R1とDeepSeek-V3-0324の実験は、我々の手法が同じメモリ予算の下で同等の性能と2.99タイムのスループットを達成できることを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:08:05 GMT)
Maximizing Confidence Alone Improves Reasoning [48.8] RENT: エントロピー最小化による強化学習(Reinforcement Learning via Entropy Minimization)は、完全な教師なしのRL手法であり、外部の報酬や地道的な回答を必要としない。
得られた回答に高いモデル信頼をもたらす思考の連鎖を強化することで、モデルは推論能力を向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:37 GMT)
CityGo: Lightweight Urban Modeling and Rendering with Proxy Buildings and Residual Gaussians [48.2] CityGoは、テクスチャ化されたプロキシ幾何と周囲の3Dガウスアンを組み合わせたハイブリッドフレームワークで、空から見た都市景観のレンダリングを行う。
我々の表現はトレーニング時間を大幅に短縮し、平均1.4倍のスピードアップを実現し、純粋な3次元ガウススプラッティングアプローチに匹敵する視覚的忠実度を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:30:49 GMT)
ConKE: Conceptualization-Augmented Knowledge Editing in Large Language Models for Commonsense Reasoning [48.0] ConceptEditは、概念化とインスタンス化をKnowledge Editingパイプラインに統合するフレームワークである。
その結果,コンセプション編集は,他のベースラインに比べて信頼性が向上し,コモンセンスの知識を生み出すことができた。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:14:24 GMT)
Self-Taught Agentic Long Context Understanding [47.2] AgenticLUは、ターゲットの自己明確化と文脈的接地を統合するために設計されたフレームワークである。
AgenticLUはNarrativeQAで97.8%の回答リコールを達成し、検索深度は最大3、分岐係数は8である。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:15:07 GMT)
Your Data, My Model: Learning Who Really Helps in Federated Learning [47.0] 重要な課題は、どのピアがコラボレーションに最も有益かを決定することです。
本稿では,関係する協力者を選択するためのシンプルかつプライバシー保護手法を提案する。
我々のアプローチは、個人化されたフェデレーション学習のためのモデルに依存しない、データ駆動のピア選択を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:56:18 GMT)
From Dormant to Deleted: Tamper-Resistant Unlearning Through Weight-Space Regularization [46.8] LLMの最近の未学習手法は再学習攻撃に対して脆弱である。
学習後50%程度から100%近くまで、リザーブセットだけを微調整することで、忘れたセットの精度が回復できるという驚くべき発見をしました。
本稿では,再学習攻撃に対する最先端の耐性を実現する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:53:08 GMT)
Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration [46.7] 大規模言語モデル(LLM)は、ターンバイターンの人間とAIのコラボレーションにおいて優れているが、リアルタイムの対話を必要とする同時タスクに苦労している。
本稿では,システム1とシステム2を統合した新しい言語エージェントフレームワークであるDPT-Agentを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:14:14 GMT)
Machine Translation Models are Zero-Shot Detectors of Translation Direction [46.4] 平行テキストの翻訳方向を検出することは、機械翻訳訓練や評価に応用できるが、盗作や偽造の主張を解消するといった法医学的応用もある。
本研究では,翻訳文や機械翻訳文でよく知られた単純化効果によって動機付けられた,$p(texttranslation|text Origin)>p(textgenic|texttranslation)$という単純な仮説に基づいて,翻訳方向検出のための教師なしアプローチを検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:26:39 GMT)
Enabling Flexible Multi-LLM Integration for Scalable Knowledge Aggregation [45.7] 大規模言語モデル(LLM)は目覚ましい将来性を示しているが、従来の微調整によって継続的に改善することは困難である。
本稿では,多種多様なLCMから知識を適応的に選択・集約し,単一のより強力なモデルを構築するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:24:50 GMT)
What Makes a Good Reasoning Chain? Uncovering Structural Patterns in Long Chain-of-Thought Reasoning [45.7] 逐次LCoTを階層木構造に変換する自動化フレームワークであるLCoT2Treeを提案する。
グラフニューラルネットワーク(GNN)を用いて,LCoT2Treeによって抽出された構造パターンが最終性能の強い予測因子となることを明らかにした。
以上の結果から,LCoT2TreeをLLMの診断・解釈・改善のための強力なツールとして位置づけた。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:12:31 GMT)
VRAG-RL: Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning [45.4] 視覚的に豊かな情報にまたがる複雑な推論に適した新しいRLフレームワークであるVRAG-RLを紹介する。
このフレームワークにより、VLMは検索エンジンと相互作用し、シングルターンまたはマルチターン推論軌道を自律的にサンプリングする。
我々のアプローチは、RAGドメインにおけるRLの重要な制限を強調します。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:30:51 GMT)
Exact analysis of AC sensors based on Floquet time crystals [45.0] 本稿では,交流センサとして機能する閉系において,予熱結晶を含む一般フロッケ時間結晶(FTC)の挙動について考察する。
FTCセンサのマクロな対猫状態間の遷移を共鳴的に誘導する方法を示す。
本研究は, 線形および非線形応答系の両方について, 長距離相互作用型LCGモデルに基づく特定のFTCについて述べる。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:05 GMT)
Scaling Reasoning without Attention [44.4] アーキテクチャとデータ中心のイノベーションを通じて、両方の問題に対処する、注目のない言語モデルである。
我々のモデルは、自己アテンションとキー値キャッシュの必要性を排除し、固定メモリ、定数時間推論を可能にします。
ベンチマーク評価では、我々のモデル7Bは、強力なトランスフォーマーと同等のスケールのハイブリッドモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:52:15 GMT)
Empowering Intelligent Low-altitude Economy with Large AI Model Deployment [44.1] 低高度経済(LAE)は、商業と社会の航空活動を再定義する新興経済パラダイムである。
LAIMは、LAEサービスのインテリジェンスをさらに強化するための変革的なポテンシャルを提供する。
LAEにLAIMをデプロイすることは、計算/ストレージ要求とRAEエンティティの限られたオンボードリソースとのギャップなど、いくつかの課題をもたらす。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:27:07 GMT)
What Has Been Lost with Synthetic Evaluation? [43.8] 大規模言語モデル(LLM)は、データ生成にますます使われている。
オーバーテキストベンチマークを生成することにより, LLM が要求を満たすことができるかどうかを検討する。
我々は、LLMが人間によって認可されたものよりも難易度が低いことを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:12:32 GMT)
VIRAL: Vision-grounded Integration for Reward design And Learning [43.5] 強化学習は報酬関数の最大化を目的としている。
近年の進歩は、報酬生成のための大規模言語モデルが人間のパフォーマンスを上回っていることを示している。
報酬関数の生成と精算のためのパイプラインであるVIRALを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:16:09 GMT)
Uncertainty Estimation for Heterophilic Graphs Through the Lens of Information Theory [43.5] 我々は,データ処理の不等式に対する適切な類似性を開発し,モデルの層全体にわたって情報を定量化する。
結合ノード埋め込み空間上の単純なポストホック密度推定器でこれを実証的に確認する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:18:01 GMT)
Patterns Over Principles: The Fragility of Inductive Reasoning in LLMs under Noisy Observations [43.5] 本稿では,雑音の多い例で融合したデータからルールを推論する際の,大規模言語モデルの能力を評価するタスクであるRobust Rule Injectionを紹介する。
1)SRRはノイズ下での性能劣化を最小限に抑えた他の手法よりも優れており、(2)若干の精度の変化にもかかわらず、LLMはノイズ下で不安定を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:56:42 GMT)
Beyond the Permutation Symmetry of Transformers: The Role of Rotation for Model Fusion [43.3] 変圧器のパラメータ空間対称性の新たな形式である回転対称性を導入する。
置換対称性とは異なり、回転対称性は連続領域で作用し、変圧器の同値集合を著しく拡大する。
モデル融合を強化するためのプラグアンドプレイモジュールとして理論的に最適なマッチングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:23:12 GMT)
Can Large Language Models Match the Conclusions of Systematic Reviews? [43.3] 我々は、大言語モデル(LLM)は、同じ研究にアクセスできると、臨床専門家が書いた体系的なレビューの結論に一致するだろうか?
MedEvidenceでは、推論、非推論、医療スペシャリスト、さまざまなサイズ(7B-700Bから)のモデルを含む24のLCMをベンチマークします。
MedEvidenceでは、推論が必ずしも性能を向上しておらず、より大規模なモデルでは常に大きな利得が得られず、知識に基づく微調整は精度を低下させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:58:09 GMT)
A2Seek: Towards Reasoning-Centric Benchmark for Aerial Anomaly Understanding [43.2] A2Seek(Aerial Anomaly Seek)は、航空異常理解のための大規模で推論中心のベンチマークデータセットである。
A2Seek-R1は、R1スタイルの戦略を空中異常理解に一般化する新しい推論フレームワークである。
A2Seek-R1は予測精度が最大22.04%向上し、mIoUは13.9%向上した。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:28:13 GMT)
GOAT-TTS: Expressive and Realistic Speech Generation via A Dual-Branch LLM [42.9] 新たな2分岐ArchiTecture(GOAT-TTS)を用いた音声合成手法を提案する。
GOAT-TTSは音声エンコーダとプロジェクタを組み合わせて連続的な音響埋め込みをキャプチャし、パラ言語的特徴(言語、音色、感情)と意味的テキスト表現の双方向の相関を可能にする。
実験の結果,GOAT-TTSは最先端のTSモデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:24:12 GMT)
Beyond Completion: A Foundation Model for General Knowledge Graph Reasoning [42.9] MERRYは一般知識グラフ推論の基礎モデルである。
テキストと構造的モダリティのギャップを埋めるためのアーキテクチャを符号化する条件付きメッセージパッシング(CMP)を提案する。
28のデータセットに対する総合的な評価は、ほとんどのシナリオでMERRYが既存のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:21:28 GMT)
Hunyuan-Game: Industrial-grade Intelligent Game Creation Model [42.7] Hunyuan-Gameは知的ゲーム制作に革命をもたらすために設計された革新的なプロジェクトである。
このプロジェクトは、画像生成とビデオ生成の2つの主要分野を含んでいる。
画像生成コンポーネントは、数十億のゲームイメージからなる広大なデータセット上に構築されている。
ビデオ生成コンポーネントは、数百万のゲームとアニメのビデオのデータセットの上に構築されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:11:02 GMT)
Overcoming Dimensional Factorization Limits in Discrete Diffusion Models through Quantum Joint Distribution Learning [42.5] 本研究では,高次元分布学習における古典的制限を克服する量子拡大離散拡散モデルについて検討する。
本稿では,指数関数的に大きいヒルベルト空間において,拡散とデノイングによる連立確率学習を可能にする量子離散拡散確率モデル(QD3PM)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:11:47 GMT)
MR.NAVI: Mixed-Reality Navigation Assistant for the Visually Impaired [42.5] 本稿では,視覚障害者の空間認識を高める複合現実感システムであるMR. NAVIを提案する。
本システムでは,物体検出と深度推定のためのコンピュータビジョンアルゴリズムと自然言語処理を組み合わせることで,文脈的シーン記述を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:02:56 GMT)
TabularQGAN: A Quantum Generative Model for Tabular Data [42.3] 合成データは、現実世界のデータが少ない、あるいはプライベートなシナリオで有用であり、既存のデータセットを拡張または置換するために使用することができる。
本稿では、フレキシブルなデータ符号化と新しい量子回路アンサッツを備えた量子生成逆ネットワークアーキテクチャを提案する。
提案手法はMIMIC IIIヘルスケアデータセットとアダルト・センサスデータセットでテストされ、主要な古典的モデルに対して広範なベンチマークが行われる。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:19:39 GMT)
FlashFormer: Whole-Model Kernels for Efficient Low-Batch Inference [42.2] FlashFormerは、トランスフォーマーベースの大規模言語モデルの単一バッチ推論を高速化するための概念実証カーネルである。
我々は既存の最先端推論カーネルと比較して非自明なスピードアップを観察する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:19:30 GMT)
Self-Error-Instruct: Generalizing from Errors for LLMs Mathematical Reasoning [42.1] 本稿では,モデルの弱点に対処し,より一般化された目標学習データを合成するフレームワークであるSelf-Error-Instruct(SEI)を提案する。
具体的には、2つの数学的データセット(GSM8KとMATH)のターゲットモデルを探索し、悪い事例を特定する。
次に、同定されたエラータイプ毎の世代毎にいくつかの悪いケースをサンプリングし、インストラクターモデルに入力し、追加のトレーニングデータを合成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:02:47 GMT)
Language-Specific Latent Process Hinders Cross-Lingual Performance [41.6] 大規模言語モデル(LLM)は言語間移動が可能なが、異なる言語で書かれたのと同じクエリで入力されたときに一貫性のない出力を生成することができる。
LLMの暗黙的なステップを解釈するために、ロジットレンズを適用し、多言語多目的推論問題を解決する。
LLMは、共有セマンティック空間で作業するのではなく、個々の言語のサブスペースに依存しているため、一貫性が無く、精度が低いことが分かりました。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:16:18 GMT)
Mini-batch Coresets for Memory-efficient Language Model Training on Data Mixtures [41.6] 大規模言語モデル(LLM)における大規模ミニバッチの訓練の禁止化
我々は、コアセットによるLLM訓練(CoLM)を提案する。
CoLMは、微調整のメモリ要求を2倍に減らし、4倍大きなミニバッチでトレーニングを上回ります。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:08:37 GMT)
Knowledge Graph Retrieval-Augmented Generation for LLM-based Recommendation [41.4] 大規模言語モデル(LLM)は目覚ましい成果をもたらし、次世代のレコメンデーターシステムの開発の可能性を示している。
LLMは、LLMのバックボーン、特に幻覚の問題、最新のドメイン固有の知識の欠如に起因する固有の制限に直面している。
本稿では,知識グラフ(KG)から高品質かつ最新の構造情報を検索して,推薦を増強することを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:34:22 GMT)
EduBench: A Comprehensive Benchmarking Dataset for Evaluating Large Language Models in Diverse Educational Scenarios [41.4] 教育シナリオに適した最初の多様なベンチマークを紹介します。
本稿では,教師と学生の両方に関係のある12つの重要な側面をカバーする多次元評価指標を提案する。
構築したデータセット上で比較的小規模なモデルをトレーニングし、最先端の大規模モデルに匹敵するパフォーマンスを実現することを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:43:38 GMT)
Balanced Token Pruning: Accelerating Vision Language Models Beyond Local Optimization [41.3] LVLM(Large Vision-Language Models)は、イメージを数千のトークンにエンコードすることで、マルチモーダルタスク全体で素晴らしいパフォーマンスを示している。
従来のアプローチでは、トークンのプルーニングによって画像トークンの数を減らそうとしていた。
本稿では,視覚トークンをプルーニングするためのプラグイン・アンド・プレイ方式であるBa balanced Token Pruning (BTP)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:00:50 GMT)
cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning [41.2] 3つの入力モードを同時に処理するマルチモーダルCAD再構成モデルを提案する。
大規模プロシージャ生成データに対する教師付き微調整(SFT)と,オンラインフィードバックを用いた強化学習(RL)の2段階パイプラインをプログラム的に取得した。
DeepCADベンチマークでは、SFTモデルは3つの入力モードすべてにおいて既存の単一モードアプローチを同時に上回ります。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:32:31 GMT)
Versatile Cardiovascular Signal Generation with a Unified Diffusion Transformer [41.1] 低品質な信号を再構成し、記録されていない信号を合成するマルチモーダル拡散変換器UniCardioを提案する。
心臓血管信号の相補的な性質を生かして、UniCardioは、近年のタスク固有のベースラインよりも明らかに優れている。
これらのアドバンテージは、UniCardioをAI支援ヘルスケアの前進のための有望な道と位置づけている。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:45:39 GMT)
GETReason: Enhancing Image Context Extraction through Hierarchical Multi-Agent Reasoning [41.0] GETReasonは、表面レベルの画像記述を超えて、より深い文脈意味を推測するフレームワークである。
また、推論に基づく画像理解を評価するための新しい指標であるGREATを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:19:23 GMT)
PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation [40.9] 病理画像セグメンテーションのための新しいフェデレートラーニングフレームワークPathFLを提案する。
PathFLは、画像、特徴、モデルアグリゲーションの3段階のアライメント戦略を通じて、課題に対処する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:09:02 GMT)
Transformers Pretrained on Procedural Data Contain Modular Structures for Algorithmic Reasoning [40.8] 我々は,小型変圧器の改良にともなう,特定のアルゴリズム推論スキルとともに,手続きデータに有用ないくつかの形式を同定する。
我々の中核となる発見は、異なる手続き規則がモデルにおいて異なるが相補的な帰納的構造を具現化することである。
最も興味深いのは、複数の規則によって誘導される構造は、複数の能力を共同で付与するために構成することができることである。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:50:09 GMT)
Revisiting Weak-to-Strong Generalization in Theory and Practice: Reverse KL vs. Forward KL [40.8] 我々は, 前方KL分岐を逆KL分岐に置き換える理論的基礎的アプローチを提案する。
逆KL発散のゼロ強制効果は、高信頼の予測を優先する。
逆のKLと逆のクロスエントロピーは、強いモデルが前方のKLと標準のクロスエントロピーで訓練されたモデルより優れていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:43:07 GMT)
Streaming Flow Policy: Simplifying diffusion$/$flow-matching policies by treating action trajectories as flow trajectories [40.7] 動作軌跡をフロー軌跡として扱うことで拡散$/$flowポリシーを簡素化する。
我々のアルゴリズムは、最後のアクションの周囲の狭いガウシアンからサンプリングする。
フローマッチングによって学習された速度場を漸進的に統合し、単一の軌道を構成する一連のアクションを生成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:48:19 GMT)
Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning [40.6] Instruct-SkillMixは、命令追従のための多種多様な高品質なSFTデータを作成するための自動化アプローチである。
わずか4Kの例で、LLaMA-3-8B-BaseはAlpacaEval 2.0で42.76%の勝利率を達成した。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:21:23 GMT)
Agent-Centric Personalized Multiple Clustering with Multi-Modal LLMs [40.4] エージェント中心のパーソナライズされたクラスタリングフレームワークを提案する。
エージェントはリレーショナルグラフを横断して、ユーザの関心事に基づいてクラスタを検索する。
その結果,提案手法はカードオーダーとカードサイツのベンチマークで0.9667と0.9481のNMIスコアを得ることができた。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:30:00 GMT)
RedTeamCUA: Realistic Adversarial Testing of Computer-Use Agents in Hybrid Web-OS Environments [40.4] コンピュータ利用エージェント(CUA)はOS(OS)とウェブにまたがる複雑なタスクを自動化することを約束するが、間接的なプロンプトインジェクションには弱いままである。
我々は,VMベースのOS環境とDockerベースのWebプラットフォームを統合する,新しいハイブリッドサンドボックスを備えた,敵対的なテストフレームワークであるRedTeamCUAを提案する。
RedTeamCUAは、CUAの脆弱性を現実的で、制御され、体系的に分析するために必要なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:42:09 GMT)
On the Transferability and Discriminability of Repersentation Learning in Unsupervised Domain Adaptation [40.3] 標準的な逆数ベースのフレームワークは、ターゲットドメイン機能の識別性を無視し、最適以下のパフォーマンスをもたらす。
本稿では、ドメインアライメントの目的と識別可能性向上の制約を明確に統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:24:43 GMT)
Cross-DINO: Cross the Deep MLP and Transformer for Small Object Detection [39.6] スモールオブジェクト検出(SOD)は、限られた情報とモデルの低クラス予測スコアのために重大な課題を提起する。
これらの課題に対処するために,クロスディーノと呼ばれる新しいアプローチを導入する。
そこで本研究では,SOD上でのDETRライクなモデルの性能を効果的に向上することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:33:23 GMT)
Towards Robust Automated Perceptual Voice Quality Assessment with Speech Foundation Models [39.3] VOQANetは、生音声から高レベル音響および韻律情報を抽出するための注意機構を備えたディープラーニングフレームワークである。
VOQANet+は、ジッタ、シマー、ハーモニックス・トゥ・ノイズ比(HNR)などの手作り音響特性とSFMの埋め込みをハイブリッド表現に統合する。
その結果、特に患者レベルでは、文ベースの入力は母音ベースの入力よりも優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:58:07 GMT)
Private Rate-Constrained Optimization with Applications to Fair Learning [39.2] 差分プライバシー(DP)下における制約問題について検討する。
我々は、レート制約問題のラグランジアン定式化を解決するグラディエント・Descent-Ascent(SGDA)アルゴリズムの変種であるRaCO-DPを開発する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:55:01 GMT)
Dual-Head Knowledge Distillation: Enhancing Logits Utilization with an Auxiliary Head [38.9] 本稿では,広く使用されている確率レベル損失関数の補足として,ロジットレベル損失関数を導入する。
新たに導入されたロジットレベルの損失と,それ以前の確率レベルの損失の合計は,性能劣化につながる。
本稿では, 線形分類器を2つの分類ヘッドに分割し, 損失の異なる2つの分類ヘッドに分割する, 二重知識蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:47:50 GMT)
Test-Time Scaling with Repeated Sampling Improves Multilingual Text Generation [38.6] 推論時間スケーリングは推論タスクにおいて有望であるが、多言語生成におけるその有効性はまだ未定である。
我々は2つの多言語ベンチマーク上で、パープレキシティと報酬に基づく検証を用いてこのアプローチを評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:50:19 GMT)
Large Language Models for Depression Recognition in Spoken Language Integrating Psychological Knowledge [38.5] うつ病は公的な言論とAI研究の両方で注目を集める懸念が高まっている。
我々は,マルチモーダル型抑うつ検出への大規模言語モデルの最初の応用として,私たちの知る限りの最高の知識を提示する。
心理学的知識をLCMに組み込んで診断性能を高めるための新しい戦略を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:53:05 GMT)
LC-Tsallis-INF: Generalized Best-of-Both-Worlds Linear Contextual Bandits [38.4] 本研究では,両逆境における上界を後悔するEmphBest-of-Both-Worlds (BoBW) アルゴリズムを開発した。
提案アルゴリズムは限界条件下で$Oleft(log(T)1+beta2+betaTfrac12+betaright)$ regretを達成していることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:30:28 GMT)
Optimizing the pump coupling for a three-wave mixing Josephson parametric amplifier [38.2] マイクロ波フィルタを用いた3波混合JPAのポンプ結合方式の最適化について検討する。
我々は、SNAILベースのJPAにおいて、対応するフィルタ設計を実装し、電力効率とポンプ漏れ抑制の双方において、3桁以上の改善点を示す。
フィルタ結合型JPAはポンプポートから入力される雑音に対してより堅牢であり,ポンプポートの有効雑音温度が最大4Kの付加雑音性能に有意な変化は示さないことを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:28:49 GMT)
Unraveling LoRA Interference: Orthogonal Subspaces for Robust Model Merging [38.1] 個別タスクのための微調整された大規模言語モデル(LM)は、高いパフォーマンスをもたらすが、デプロイメントやストレージには高価である。
最近の研究は、複数のタスク固有のモデルを追加トレーニングなしで単一のマルチタスクモデルに結合するモデルマージについて検討している。
既存のマージ方式は、性能劣化のためにローランク適応(LoRA)を微調整したモデルでは失敗することが多い。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:28:12 GMT)
Anomalies by Synthesis: Anomaly Detection using Generative Diffusion Models for Off-Road Navigation [38.1] 画素ワイド異常検出のための解析・合成手法を提案する。
拡散モデルによりどの画像セグメントが修正されたかを分析するために,異常検出を定式化する。
私たちの編集技術は純粋にテスト時間であり、既存の基盤に統合することができます。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:26:48 GMT)
GeneBreaker: Jailbreak Attacks against DNA Language Models with Pathogenicity Guidance [38.1] DNA基盤モデルのジェイルブレイク脆弱性を評価する最初のフレームワークであるGeneBreakerを紹介する。
GeneBreakerは、高ホモロジー、非病原性ジェイルブレイクプロンプト、PathoLMでガイドされたビームサーチ、および病原体様の配列へのスタイア生成のためのログ確率を採用している。
GeneBreakerは、6つのバイラルカテゴリーにわたる最新のEvoシリーズのジェイルブレイクに成功している。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:58:32 GMT)
Knowledge Base Construction for Knowledge-Augmented Text-to-SQL [37.9] 本稿では,与えられたクエリに必要な知識を生成する基礎となる知識源であるテキスト・ツー・ワンの知識基盤を構築することを提案する。
私たちの知識ベースは包括的であり、利用可能なすべての質問と関連するデータベーススキーマの組み合わせに基づいて構築されます。
重なり合うデータベースシナリオと非重なり合うデータベースシナリオの両方を考慮して、複数のテキストから1つのデータセットに対するアプローチを検証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:17:58 GMT)
GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control [37.8] 実世界モデルにロバストな3次元形状条件を明示的に統合したGeoDriveを紹介する。
車両の位置を編集することでレンダリングを強化するため,トレーニング中の動的編集モジュールを提案する。
動作精度と空間認識の両面で既存のモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:46:51 GMT)
The Meeseeks Mesh: Spatially Consistent 3D Adversarial Objects for BEV Detector [37.7] 3Dオブジェクト検出は、自律運転システムにおいて重要な要素である。
本稿では,3次元物体検出モデルの3次元敵攻撃に対する脆弱性について検討する。
実世界の攻撃シナリオに適した非侵襲的な3次元対向オブジェクトを生成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:49:54 GMT)
Can LLMs Deceive CLIP? Benchmarking Adversarial Compositionality of Pre-trained Multimodal Representation via Text Updates [37.7] 偽テキストのサンプルを生成するために、MAC(Multimodal Adversarial Compositionality)を導入する。
我々は、サンプルワイド攻撃の成功率とグループワイドエントロピーに基づく多様性を両立させて評価した。
Llama-3.1-8Bのようなより小さな言語モデルを用いて、我々の手法は構成上の脆弱性を明らかにする上で優れた性能を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:45:55 GMT)
Subspecialty-Specific Foundation Model for Intelligent Gastrointestinal Pathology [37.6] Digepathは、GI病理学の専門的な基礎モデルである。
これは、20万以上のヘマトキシリンとエオシン含有のGI疾患のスライドから3億3300万枚以上の画像パッチで事前訓練されている。
疾患診断、分子予測、遺伝子変異予測、予後評価など、GI病理に関連する34のタスクのうち33の最先端のパフォーマンスを達成している。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:22:08 GMT)
Incentivizing Strong Reasoning from Weak Supervision [37.4] 大規模言語モデル (LLM) は推論集約的なタスクにおいて顕著な性能を示した。
推論能力の向上は一般的に、検証可能な信号を持つ強化学習(RL)か、高品質な長いチェーン・オブ・シンク(CoT)のデモンストレーションを持つ教師付き微調整(SFT)のいずれかに依存している。
高価で高品質な実演や強化学習を伴わないLCMの推論能力にインセンティブを与える新たな課題について検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:07:11 GMT)
How to Synthesize Text Data without Model Collapse? [37.2] 合成データのモデル崩壊は、自己生成データに対する反復的なトレーニングが徐々に性能を低下させることを示している。
半合成データを得るために,人為的データに対するトークン編集を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:22:58 GMT)
Ensuring User-side Fairness in Dynamic Recommender Systems [37.2] 本稿では,動的レコメンデーションシステムにおけるユーザ側の公正性を保証するための第一原理的な研究について述べる。
本稿では,FAir Dynamic rEcommender (FADE)を提案する。
FADEは、全体的なレコメンデーション性能を犠牲にすることなく、性能格差を効果的かつ効率的に低減することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:25:42 GMT)
Mitigating Audiovisual Mismatch in Visual-Guide Audio Captioning [37.2] 現在の視覚誘導型オーディオキャプションシステムは、現実のシナリオにおけるオーディオヴィジュアル・アライメントに対処できない。
本稿では,モーダルな不確実性定量化を通じて視覚情報の流れを動的に変調するエントロピー対応ゲート融合フレームワークを提案する。
また,合成ミスマッチ学習ペアを生成するバッチワイドオーディオ視覚シャッフル技術を開発した。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:08:17 GMT)
MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation [37.2] 本稿では,単一の画像から合成3Dシーンを生成するための新しいパラダイムであるMIDIを紹介する。
MIDIの中核には、オブジェクト間の相互作用と空間的コヒーレンスを直接生成プロセス内で効果的にキャプチャする、新しいマルチインスタンスアテンション機構が組み込まれている。
合成データ,実世界のシーンデータ,テキスト・ツー・イメージ拡散モデルにより生成されたスタイリングされたシーン画像の評価により,画像からシーン生成までの最先端性能を実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:43:35 GMT)
A Tool for Generating Exceptional Behavior Tests With Large Language Models [37.0] 異常行動テスト(EBT)を自動的に生成するフレームワークであるexLongについて述べる。
ExLongには、例外スロートレース、スローステートメントを保護する条件式、同様のトレースを実行する例外的動作テストに関する推論が含まれている。
デモビデオは、exLongが開発者のプロジェクトのための総合的なETT作成を効果的に支援する方法を示しています。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:53:20 GMT)
Logical Consistency is Vital: Neural-Symbolic Information Retrieval for Negative-Constraint Queries [36.9] 現在の密集した検索者は、類似性を埋め込むことで、コーパス内の関連文書を検索する。
本研究では,ニューラルシンボリックな情報検索手法である textbfNS-IR を提案し,ナイーブな自然言語の埋め込みを最適化する。
実験により、NS-IRは、Web検索および低リソース検索タスクにおいて、より優れたゼロショット検索性能が得られることを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:37:09 GMT)
Stochastic Chameleons: Irrelevant Context Hallucinations Reveal Class-Based (Mis)Generalization in LLMs [36.9] クラスベース(ミス)一般化と呼ぶ構造的だが欠陥のあるメカニズムからエラーが生じることを示す。
Llama-3、Mistral、Pythiaの実験では、この挙動がモデルの内部計算に反映されていることが明らかになった。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:47:52 GMT)
MultiScale Contextual Bandits for Long Term Objectives [36.9] マルチスケール政策学習のフレームワークを導入し、複数の時間スケールでフィードバックを動作させ、最適化する必要があるAIシステムを文脈的に整合させる。
より豊富なデータを持つ低い時間スケールが、より高速な学習のために、データ依存の階層的事前を提供する方法を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:12:09 GMT)
SlimLLM: Accurate Structured Pruning for Large Language Models [36.8] 構造化プルーニングは,大規模言語モデルのパラメータを圧縮する有効な解法である。
大規模言語モデルに対するSlimLLMという,効率的かつ高速な構造化プルーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:01:28 GMT)
Learning in Compact Spaces with Approximately Normalized Transformers [36.8] ディープラーニングでは、正規化と正規化は、オーバーフィッティング、数値不安定性、残ストリームのばらつきの増加といった課題に対する一般的な解である。
本研究では,より包括的だが近似正規化(変換器)を提案する。
我々のアプローチはパラメータのノルムを制約し、高次元ランダムベクトルのノルムの厳密な集中によって動機付けられたスカラー乗法によって全ての表現を正規化する。
GPTトレーニングに適用すると、QK正規化モデルに比べて40%早く収束し、3%未満の追加ランタイムを持つ。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:23:19 GMT)
Found in Translation: Measuring Multilingual LLM Consistency as Simple as Translate then Evaluate [36.6] 大規模言語モデル(LLM)は、英語のクエリに対して詳細で印象的な応答を提供する。
しかし、彼らは他の言語で同じクエリに対応することに本当に一貫性がありますか?
本稿では,LLMの言語間整合性を評価するためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:00:21 GMT)
The Climb Carves Wisdom Deeper Than the Summit: On the Noisy Rewards in Learning to Reason [36.5] 本研究では,報奨雑音が学習後の大規模言語モデルに与える影響について検討した。
その結果、LLMは相当な報酬雑音に対して強い強靭性を示すことがわかった。
本研究は,事前学習段階におけるモデルの基礎的能力の向上の重要性を示唆するものである。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:03 GMT)
Paths Not Taken: Understanding and Mending the Multilingual Factual Recall Pipeline [36.3] その結果,多言語大言語モデル (LLM) は,他の言語に比べて,実際のリコールタスクにおいて有意に優れた性能を示すことがわかった。
事実的リコールのための信頼性の高い英語中心のメカニズムの関与が不十分なことと、ターゲット言語への英語からの誤った翻訳である。
我々の介入によって、最低パフォーマンス言語では、リコール精度が35%以上向上しました。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:10:37 GMT)
On Learning Verifiers for Chain-of-Thought Reasoning [36.2] チェーン・オブ・ソート推論は、複雑な数学的および論理的問題を解くための強力なアプローチとして現れている。
しばしば、誤ったまたは根拠のない推論を通じて、トラックを走行することができる。
現在、LSMは複雑な問題を形式的に解くのに十分ではない。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:57:29 GMT)
Improving Contrastive Learning for Referring Expression Counting [36.0] C-REXは、教師付きコントラスト学習に基づく、新しいコントラスト学習フレームワークである。
画像空間内で完全に動作し、画像テキストのコントラスト学習のミスアライメントの問題を避ける。
C-REXはReferring Expression Countingで最先端の結果を達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:33:42 GMT)
TransMLA: Migrating GQA Models to MLA with Full DeepSeek Compatibility and Speedup [35.9] TransMLAはGQAベースのモデルをMLAベースのモデルにシームレスに変換するフレームワークである。
LLaMA-2-7BでKVキャッシュの93%を圧縮することにより、TransMLAは8Kコンテキスト長で10.6倍の推論スピードアップを達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:07:57 GMT)
LatentMove: Towards Complex Human Movement Video Generation [35.8] 我々は、高ダイナミックな人間のアニメーションに特化して設計されたDiTベースのフレームワークであるLatentMoveを提示する。
アーキテクチャには条件制御ブランチと学習可能なフェイス/ボディトークンが組み込まれており、フレーム間のきめ細かい詳細や一貫性を保っている。
I2Vシステムのロバスト性を評価するために設計された多種多様で挑戦的な人間の動きを特徴付けるデータセットである複合Human-Videos(CHV)を紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:10:49 GMT)
SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond [35.8] 多様な論理的推論データを大規模に生成するデータ合成フレームワークおよびデータセットであるSynLogicを提案する。
7Bおよび32Bモデルに基づくSynLogicデータセットにおけるRLトレーニングの有効性を検証する。
混合トレーニングモデルは、複数のベンチマークでDeepSeek-R1-Zero-Qwen-32Bより優れています。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:04:03 GMT)
First Steps Towards Overhearing LLM Agents: A Case Study With Dungeons & Dragons Gameplay [35.7] LLMエージェントと対話するための代替パラダイムを提案し、これを"overhearing agent"と呼ぶ。
これらの過度に耳を傾けるエージェントは会話に積極的に参加せず、人間同士の会話に「参加」し、バックグラウンドタスクを実行したり、ユーザーを支援するための提案を行う。
本研究では,ダンジョンマスターを補助するオーバヘッドエージェントとして,大規模マルチモーダル音声モデルを用いた詳細な研究を行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:34:36 GMT)
Identity-Preserving Text-to-Image Generation via Dual-Level Feature Decoupling and Expert-Guided Fusion [35.7] 本稿では,識別関連特徴と識別非関連特徴の分離を改善する新しい枠組みを提案する。
我々のフレームワークは、Implicit-ExplicitフォアグラウンドのデカップリングモジュールとFeature Fusionモジュールの2つの重要なコンポーネントで構成されています。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:40:46 GMT)
REVS: Unlearning Sensitive Information in Language Models via Rank Editing in the Vocabulary Space [35.6] 言語モデル(LM)は、トレーニングデータに見られる機密情報や個人識別可能な情報(PII)を不注意に記憶・拡散し、プライバシー上の懸念を引き起こすリスクがある。
LMから機密情報を学習する非段階的手法であるREVSを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:15:10 GMT)
Emergence of Diverse Topological States in Ge Doped MnBi2Te4 [35.6] MTI MnBi2Te4から強いトポロジカル絶縁体GeBi2Te4へのドーピング濃度を持つバンドの進化とトポロジカル位相図について検討した。
バンドモーメントマッピング法を用いることで、既知のMTI相に加えて、反強磁性状態において2種類の磁性ディラック半金属相が見つかる。
自明な状態は、2つの共存バンド反転と極端に長いフェルミ弧を持つワイル相に小さなひずみで調整することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:30:31 GMT)
Navigating the Latent Space Dynamics of Neural Models [35.4] 我々は、潜在多様体に作用する力学系として、ニューラルモデルの別の解釈を示す。
オートエンコーダモデルは、符号化復号写像を反復的に適用することによって導かれる、多様体上の潜在ベクトル場を暗黙的に定義することを示す。
本稿では,ベクトル場をネットワークの表現として活用し,モデルとデータの特性を解析するための新しいツールを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:57:41 GMT)
Machine Unlearning under Overparameterization [35.0] 機械学習アルゴリズムは、特定のサンプルの影響を取り除き、残りのデータだけで得られたであろうモデルを理想的に回復することを目的としている。
私たちは、多くのモデルがデータをインターポレートし保持する、過剰な設定のトレーニングで学びます。
我々は、正確で近似的なクラスを提供し、様々な未学習実験にまたがって、我々のフレームワークを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:14:57 GMT)
Personality-aware Student Simulation for Conversational Intelligent Tutoring Systems [34.8] Intelligent Tutoring Systems(ITS)は、パーソナライズされたセルフペースの学習体験を提供する。
大規模言語モデル(LLM)の出現により、より優れた人間と機械の相互作用が可能になる。
LLMは、与えられた言語能力と性格特性に応じて、多様な学生の反応を生成することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:25:26 GMT)
Galileo: Learning Global & Local Features of Many Remote Sensing Modalities [34.7] そこで本稿では,マスクモデルを用いて,柔軟な入力モダリティの集合にまたがるマルチスケール特徴を抽出する,自己教師付き学習アルゴリズムを提案する。
私たちのガリレオは、11のベンチマークと複数のタスクで衛星画像とピクセル時系列のSoTAスペシャリストモデルを上回る、単一のジェネラリストモデルです。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:46:10 GMT)
VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models [34.6] 視覚言語モデル(VLM)を用いた身体的視覚追跡(EVT)を強化する新しいフレームワークを提案する。
この研究は、EVTエージェントのアクティブ障害回復を支援するVLMベースの推論の最初の統合である。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:54:19 GMT)
Large Language Model Driven Recommendation [34.5] 言語主導のレコメンデーションの出現は、リコメンデーションのための自然言語(NL)インタラクションの使用を解放した。
この章では、LLMの一般NL能力が、高度にパーソナライズされたRSを構築する新しい機会を導く方法について論じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:19:44 GMT)
Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation [34.2] 本稿では,マルチパーソン会話ビデオ生成という新しい課題を提案する。
マルチパーソン世代における課題に対処するための新しいフレームワークであるMultiTalkを導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:57:06 GMT)
Few-Shot Learning from Gigapixel Images via Hierarchical Vision-Language Alignment and Modeling [34.1] HiVE-MILは階層的な視覚言語フレームワークであり、粗い(5x)と細い(20x)視覚/テキストノード間の親子リンクからなる統一グラフを構築する。
セマンティック一貫性をさらに強化するため、HiVE-MILには2段階のテキスト誘導動的フィルタリング機構が組み込まれている。
TCGA乳がん、肺がん、腎臓がんのデータセットの実験では、HiVE-MILは従来のMILと最近のVLMベースのMILアプローチの両方で一貫して優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:43:55 GMT)
Improving Continual Pre-training Through Seamless Data Packing [34.1] 本稿では,文脈情報をより効果的に保存し,モデル性能を向上させることを目的とした新しいデータパッキング戦略を提案する。
提案手法では,第1段階において連続列間の重なり合うトークンを同期するスライディングウインドウ手法を用いる。
第2段階では、短いテキストをターゲットのシーケンス長よりもわずかに大きいビンに詰め込むために、第1のFit-Decreasingアルゴリズムを採用し、パディングとトランケーションを最小化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:30:37 GMT)
Hybrid Batch Normalisation: Resolving the Dilemma of Batch Normalisation in Federated Learning [34.1] バッチ正規化(BN)は、ディープニューラルネットワークトレーニングにおいて、各バッチデータの入出力分布を調和させるために広く使用されている。
本研究では,Hybrid Batch Normalization (HBN) をカスタマイズした正規化手法を開発する。
HBNは、統計パラメータの更新と学習可能なパラメータの更新を分離し、分散シナリオにおけるグローバルな統計パラメータの偏りのない推定値を取得する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:46:34 GMT)
The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents [33.9] これまでの研究では、フェイクニュースは徐々に形成するよりむしろ本質的に存在すると仮定されてきた。
本稿では,新たなLarge Language Model(LLM)に基づくシミュレーション手法であるFUSEを提案する。
その結果、FUSEはフェイクニュースの進化パターンを効果的に捉え、既知のフェイクニュースを正確に再現し、人間の評価と密接に一致していることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:26:32 GMT)
VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use [33.8] VTool-R1は、視覚言語モデルを訓練し、思考のマルチモーダル連鎖を生成する最初のフレームワークである。
VTool-R1はPythonベースのビジュアル編集ツールをReinforcement Learning Finetuningプロセスに統合する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:58:13 GMT)
ExpProof : Operationalizing Explanations for Confidential Models with ZKPs [33.5] ZKP(Zero-Knowledge Proofs)を用いた敵シナリオにおける説明の運用に向けて一歩前進する。
具体的には、一般的な説明可能性アルゴリズムLIMEのZKP対応バージョンについて検討し、ニューラルネットワークとランダムフォレストの性能を評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:57:54 GMT)
ConsRec: Denoising Sequential Recommendation through User-Consistent Preference Modeling [33.3] ユーザ一貫性を持つ参照型シーケンスレコメンデーションシステム(ConsRec)を提案する。
ConsRecは安定したユーザの好みをキャプチャし、インタラクション履歴からノイズの多いアイテムをフィルタリングする。
その結果、ConsRecはベースラインレコメンデーションモデルよりも13%改善されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:55:13 GMT)
Semantics-aware Test-time Adaptation for 3D Human Pose Estimation [33.2] この研究は、人間の3次元ポーズ推定における意味的ミスアライメントを強調している。
テストタイム適応のタスクでは、ミスアライメントは過度にスムーズで、ガイドなしの予測として現れます。
我々は,3次元ポーズ推定の試行時間適応に先立って,セマンティックスを意識した動作の統合を開拓した。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:19:05 GMT)
Evaluating the Retrieval Robustness of Large Language Models [33.2] Retrieval-augmented Generation (RAG) は一般的に、知識集約的なタスクを解決するための大きな言語モデルのLLM(LLM)能力を向上する。
しかし、RAGは、不完全な検索と、検索されたコンテンツを活用する能力の制限により、パフォーマンスが低下する可能性がある。
我々は,(1)RAGが非RAGより常に優れているか,(2)検索された文書が常により良いパフォーマンスをもたらすか,(3)文書注文が結果に影響を及ぼすか,という3つの研究課題に焦点をあてる。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:34:31 GMT)
Suitability Filter: A Statistical Framework for Classifier Evaluation in Real-World Deployment Settings [33.1] 適合性信号を利用して性能劣化を検出する新しいフレームワークを提案する。
テストデータとユーザデータの両方に適合する信号を集約し、これらの経験的分布を比較する。
これにより、高スループットアプリケーションにおける潜在的な障害の積極的な緩和が可能となる。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:37:04 GMT)
Mitigating Overthinking in Large Reasoning Models via Manifold Steering [32.7] 大規模推論モデル(LRMs)は、推論中に過剰思考として知られる現象を示す。
低次元活性化多様体に操舵方向を優雅に投影する新しいアプローチであるマニフォールドステアリングを提案する。
本手法は,数個の数式ベンチマークの精度を維持・改善しながら,出力トークンを最大71%削減する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:39:26 GMT)
Text2Grad: Reinforcement Learning from Natural Language Feedback [32.6] 我々は、自由形式のテキストフィードバックをスパンレベルの勾配に変換する、きめ細かい強化パラダイムであるText2Gradを紹介する。
以上の結果から, 自然言語フィードバックが勾配に変換された場合, より詳細な政策最適化のための強力な信号であることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:23:49 GMT)
DeSocial: Blockchain-based Decentralized Social Networks [32.6] DeSocialは、アルゴリズムローカル開発チェーン(Ganache)上にデプロイされた分散型のソーシャルネットワーク学習フレームワークである。
DeSocialは実行をコーディネートし、モデルワイズ予測結果を返すことで、パーソナライズされた社会的予測に最適なバックボーンを選択することができる。
DeSocialは、各ユーザが指定したアルゴリズムを持ついくつかの検証ノードを均一に選択し、多数決によって予測結果を集計する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:06:40 GMT)
EnsemW2S: Enhancing Weak-to-Strong Generalization with Large Language Model Ensembles [32.2] そこで我々は,弱い専門家を育成するための新しい手法を提案し,同じ限られた人間レベルのデータでトレーニングし,複雑な超人レベルのタスクに一般化できるようにする。
われわれのアプローチは textbfEnsemW2S と呼ばれ、トークンレベルのアンサンブル戦略を採用し、複数の弱い専門家を反復的に組み合わせている。
我々は,弱い専門家のアンサンブルと,それに続く強力な学生モデルの両方の分布内(ID)および分布外(OOD)データセットの一般化性能を広範囲に評価した。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:23:12 GMT)
Can Test-time Computation Mitigate Memorization Bias in Neural Symbolic Regression? [32.2] 記号回帰は、与えられた数値データに適合する数学的方程式を発見することを目的としている。
大規模合成データセットで事前訓練されたトランスフォーマーを含む最近の手法が注目されている。
これらの手法は、短い推論時間などの利点を提供するが、特に入力変数の数が大きい場合、低い性能に悩まされる。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:01:25 GMT)
Breaking the Ceiling: Exploring the Potential of Jailbreak Attacks through Expanding Strategy Space [32.1] 大きな言語モデル(LLM)は、安全プロトコルをバイパスするジェイルブレイク攻撃など、多くの安全リスクに悩まされている。
我々は,脱獄戦略を,ELM理論に基づく重要な構成要素に分解する新しい枠組みを開発する。
従来の手法が完全に失敗するClaude-3.5で90%以上の成功率を達成した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:16:10 GMT)
Generative Social Choice: The Next Generation [32.0] 特定の民主的プロセスにおける重要なタスクは、ユーザの意見の完全な範囲を比例的に表す、簡潔な文のスレートを作成することである。
この課題は委員会選挙と似ているが、伝統的な設定とは異なり、候補者集合は様々な長さの全ての可能なステートメントで構成されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:40:24 GMT)
Improved Bounds for Swap Multicalibration and Swap Omniprediction [32.0] 我々は,有界線型関数に対する$O(sqrtT)$ $ell_2$-swap多重校正誤差を効率よく実現できることを示す。
また、凸関数とリプシッツ関数のクラスに対して、$varepsilon$-swap omnipredictorを効率的に学習する、$O(varepsilon -3)$サンプル複雑性も確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:05:07 GMT)
Q-VDiT: Towards Accurate Quantization and Distillation of Video-Generation Diffusion Transformers [32.0] 本稿では,ビデオDiTモデルに特化して設計された量子化フレームワークQDi-VTを提案する。
量子化の観点から,トークンおよび特徴次元の量子化誤差を補償するToken-Aware Quantization Estor (TQE)を提案する。
我々のW3A6 QDi-VTは23.40のシーン一貫性を実現し、新しいベンチマークを設定し、1.9$times$で最先端の量子化手法より優れている。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:33:52 GMT)
MemOS: An Operating System for Memory-Augmented Generation (MAG) in Large Language Models [31.9] 我々は,大規模言語モデル(LLM)用に設計されたメモリオペレーティングシステムであるMemOSを紹介する。
コアとなるMemCubeは、異種メモリの追跡、融合、マイグレーションを可能にする標準化されたメモリ抽象化である。
MemOSは、強力な制御性、適応性、進化性を備えたメモリ中心の実行フレームワークを確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:27:12 GMT)
Ultra-long-living magnons in the quantum limit [31.9] ミリケルビン温度における寿命18kmを超える短波長マグノンの観測について報告する。
我々の結果は、現代の固体量子コンピューティングプラットフォームにおけるデータキャリアとしてマグノンを使用するための扉を開く。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:43:02 GMT)
Intrinsic User-Centric Interpretability through Global Mixture of Experts [31.7] InterpretCCは、人間の理解の容易さと忠実さの説明を最適化する、本質的に解釈可能なニューラルネットワークのファミリーである。
本報告では,InterpretCCの説明は,他の本質的な解釈可能なアプローチよりも,行動性や有用性が高いことを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:34:43 GMT)
Let's Predict Sentence by Sentence [31.7] 本稿では,次の文の連続的な埋め込みを自動回帰予測することにより,事前訓練されたトークンレベルのLMを文空間内での操作に適応させるフレームワークを提案する。
以上の結果から,事前学習したLMは,遅延埋め込み空間内での抽象的構造的推論に効果的に移行できることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:28:35 GMT)
ASTPrompter: Preference-Aligned Automated Language Model Red-Teaming to Generate Low-Perplexity Unsafe Prompts [31.5] 既存のLLMのレッドチームアプローチは、高い攻撃成功率を優先し、多くの場合、高い複雑さのプロンプトをもたらす。
ASTPrompterは,攻撃者に対して高い攻撃成功率(ASR)を達成しつつ,低い難易度を維持するよう訓練する,コントラスト優先学習を用いた単一ステップ最適化手法である。
ASTPrompterは、Llama-8.1Bの攻撃成功率は5.1倍であり、凍結したLLMの2.1倍のインプットを使用する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:32:11 GMT)
WorkForceAgent-R1: Incentivizing Reasoning Capability in LLM-based Web Agents via Reinforcement Learning [31.5] ルールベースのR1スタイル強化学習フレームワークを用いて学習したLLMベースのWebエージェントであるWorkForceAgent-R1を紹介する。
我々は、出力形式への固執とアクションの正当性の両方を評価する構造付き報酬関数を用いて、WorkForceAgent-R1が頑健な中間推論を暗黙的に学習できるようにする。
WorkArenaベンチマークの実験では、WorkForceAgent-R1はSFTのベースラインを10.26-16.59%上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:45:28 GMT)
SOReL and TOReL: Two Methods for Fully Offline Reinforcement Learning [31.4] 本稿では,安全なオフライン強化学習のためのアルゴリズムSOReLを紹介する。
オフライン強化学習アルゴリズムTOReLについても紹介する。
我々の経験的評価は, ベイズ条件下での後悔を正確に推定するSOReLの能力を裏付けるものである。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:07:24 GMT)
Curse of High Dimensionality Issue in Transformer for Long-context Modeling [31.3] 注意計算において重要でないトークンを集約することにより冗長性を低減するために,textitDynamic Group Attention (DGA)を提案する。
その結果,DGAは競争性能を維持しながら計算コストを大幅に削減できることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:34:46 GMT)
FCKT: Fine-Grained Cross-Task Knowledge Transfer with Semantic Contrastive Learning for Targeted Sentiment Analysis [30.9] 本稿では,ターゲット感情分析(TSA)の課題に対処する。
TSAには2つのサブタスクがあり、レビューから特定の側面を特定し、対応する感情を決定する。
TSAに適した微粒なクロスタスク知識伝達フレームワークであるFCKTを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:02:51 GMT)
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration [30.8] LVLM(Large Vision-Language Models)は、視覚的理解と言語生成の融合において大きな進歩を遂げている。
この成功にもかかわらず、LVLMのトレーニングデータは、データ分布が極めて不均衡であるLong-Tail (LT)問題に悩まされている。
DSの段階では,Denoising Diffusion Probabilistic Models(DDPM)と不足した画像を利用して,表現不足の部分を補う。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:52:59 GMT)
A Unified Online-Offline Framework for Co-Branding Campaign Recommendations [30.6] 共同ブランドレコメンデーションを可能にする統合オンラインオフラインフレームワークを提案する。
私たちのアプローチは、"開始"と"ターゲット"のブランドをリンクする二部グラフを構築することから始まります。
オフライン最適化の段階において、我々のフレームワークは、複数のサブブランドの利益を同じ親ブランドの下に集約し、全体的なリターンを最大化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:41:07 GMT)
Topological Structure Learning Should Be A Research Priority for LLM-Based Multi-Agent Systems [30.5] 大規模言語モデルに基づくマルチエージェントシステム(MAS)は、協調的な知性によって複雑なタスクに取り組むための強力なパラダイムとして登場した。
最適な協力のためにどのようにエージェントを構造的に整理すべきかという問題は、まだほとんど未解決のままである。
本稿では,エージェントの選択,構造プロファイリング,トポロジ合成という3段階の体系的枠組みを導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:20:09 GMT)
Human-Object Interaction via Automatically Designed VLM-Guided Motion Policy [30.4] VLM(Vision-Language Models)を利用した最初の統合物理ベースのHOフレームワークを紹介する。
VLM-Guided Relative Movement Dynamics (RMD)を導入する。これは、強化学習のための目標状態と報酬関数を自動的に構築する、微細な時間的二部運動表現である。
提案手法をサポートするために,何千もの長期の静的および動的相互作用計画を持つ新しいデータセットであるInterplayを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:08:58 GMT)
Defining Foundation Models for Computational Science: A Call for Clarity and Rigor [30.4] 計算科学における基礎モデルの形式的定義を提案する。
このようなモデルが示すべき本質的で望ましい特徴の集合を具体化します。
データ駆動有限要素法(DD-FEM)は,従来のFEMのモジュラ構造をデータ駆動学習の表現力と融合させるフレームワークである。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:10:16 GMT)
SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning [30.3] 模倣学習は、人間のデモンストレーションから多様な行動の獲得を可能にすることで、ロボット能力を向上させる。
既存のロボットキュレーションアプローチは、高価な手作業によるアノテーションに依存し、粗い粒度でキュレーションを行う。
本稿では、低品質な状態-動作ペアをフィルタリングして模倣学習ポリシーの性能を向上させる自己教師型データキュレーションフレームワークであるSCIZORを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:45:05 GMT)
Thinking with Generated Images [30.3] 我々は,大規模マルチモーダルモデル(LMM)が視覚的推論にどのように関与するかを変換する,新しいパラダイムであるThinking with Generated Imagesを紹介する。
我々のアプローチは、AIモデルが人間の創造的、分析的、戦略的思考を特徴づける視覚的想像力や反復的な洗練に関わり得ることを可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:12:45 GMT)
Say What You Mean: Natural Language Access Control with Large Language Models for Internet of Things [29.8] 人間の意図と機械の強化可能な論理のギャップを埋めるフレームワークである LACE を提示する。
プロンプト誘導されたポリシー生成、検索強化された推論、フォーマルなバリデーションを組み合わせることで、表現的、解釈可能、検証可能なアクセス制御をサポートする。
LACEは、検証済みのポリシー生成において100%の正当性を達成し、最大88%の判定精度と0.79 F1スコアを達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:59:00 GMT)
Explanation Design in Strategic Learning: Sufficient Explanations that Induce Non-harmful Responses [29.6] 鍵となる疑問は、DMが戦略エージェントに害を与えないように説明を伝達する方法である。
行動推奨に基づく説明(ARexes)は、有害な応答に十分であることを示す。
実験により、ARexesは、エージェントのユーティリティを保ちながら、DMがモデルの予測性能を最適化できることが示されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:05:11 GMT)
AI instructional agent improves student's perceived learner control and learning outcome: empirical evidence from a randomized controlled trial [29.5] 本研究は,教科を主教科とする中等教育課程において,AI指導エージェントが生徒の認知的学習者制御と学業成績に与える影響について検討した。
AI指導エージェントグループの学生は、他のグループに比べて学習者のコントロールが有意に高いことを報告した。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:13:27 GMT)
From Failures to Fixes: LLM-Driven Scenario Repair for Self-Evolving Autonomous Driving [29.4] 本研究では,自動走行システムの自己開発を可能にするフレームワークである textbfSERA を提案する。
パフォーマンスログを分析することで、SERAは障害パターンを特定し、構造化バンクから動的にセマンティックに整合したシナリオを検索する。
ベンチマークの実験では、SERAは複数の自律走行ベースラインにわたる重要な指標を一貫して改善し、安全クリティカルな条件下での有効性と一般化性を実証している。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:46:19 GMT)
Shielded Diffusion: Generating Novel and Diverse Images using Sparse Repellency [29.1] 本稿では,事前学習した拡散モデルのサンプル軌跡を,参照集合外に落下する画像上に着陸させる手法を提案する。
生成軌道全体にわたって拡散SDEに反発項を追加することでこれを実現できる。
一般的な拡散モデルにSPELLを追加することで、FIDにわずかに影響を与えながら多様性が向上し、最近のトレーニングフリーの多様性手法よりも比較的優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:28:20 GMT)
Larger Is Not Always Better: Exploring Small Open-source Language Models in Logging Statement Generation [28.9] 自動ロギングステートメント生成のための大規模言語モデル(LLM)には、プライバシとリソースの問題がある。
本稿では,ロギングステートメントの自動生成のための小規模なオープンソース言語モデル(SOLM)を評価するための大規模な実証的研究について述べる。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:03:05 GMT)
Large Vocabulary Size Improves Large Language Models [28.8] 単語語彙サイズと大規模言語モデル(LLM)の性能の関係について検討する。
実験結果から,LLMの語彙サイズが大きくなると性能が向上することがわかった。
事前定義された語彙の代わりに新しい語彙を使用するための簡単な方法を導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:07:07 GMT)
Model Diffusion for Certifiable Few-shot Transfer Learning [28.8] 我々は,下流タスクに対する非空き学習理論の一般化を保証するために,新しい伝達学習手法を開発した。
ニューラルネットワーク重みの典型的な連続仮説空間とは対照的に、これは我々のモデル仮説をPEFTサンプルの有限集合に限定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:26:18 GMT)
Enhancing Target-unspecific Tasks through a Features Matrix [28.8] 一般知識は、目標非特異なタスクを強く推進する。
そこで本稿では,対象非特定タスクにおける特徴行列(FM)モデルの拡張を目的とした新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:18:30 GMT)
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models [28.7] PRMベンチ(PRM Bench)は, PRMの微細な誤差検出機能を評価するための, プロセスレベルのベンチマークである。
PRMBenchは、6,216の慎重に設計された問題と83,456のステップレベルラベルで構成され、複数の次元にわたるモデルを評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:55:32 GMT)
OWL: Probing Cross-Lingual Recall of Memorized Texts via World Literature [28.7] 本稿では,大規模言語モデル(LLM)における多言語・多言語間記憶について検討する。
OWLは、英語の原文、公用語(ベトナム語、スペイン語、トルコ語)、および6つの低リソース言語(Sesotho, Yoruba, Maithili, Malagasy, Setswana, Tahitian)の新しい翻訳を含む10の言語で20冊の本から31.5Kの抜粋を抽出したデータセットである。
事前学習データの直接翻訳のないテキストであっても,LLMは言語間のコンテンツを常にリコールしていることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:57:03 GMT)
Learning Compositional Behaviors from Demonstration and Language [28.4] BLADEは、模倣学習とモデルベースの計画を統合することで、長距離ロボット操作のためのフレームワークである。
我々は、新しい初期状態、外部の摂動、新しい目標など、新しい状況に一般化する上で重要な能力を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:19:59 GMT)
Do Large Language Models Think Like the Brain? Sentence-Level Evidence from fMRI and Hierarchical Embeddings [28.2] 本研究では,大規模言語モデルにおける階層的表現が,人文理解時の動的神経応答とどのように一致しているかを検討する。
その結果、モデル性能の改善は、表現アーキテクチャを脳に似た階層へと進化させることを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:40:06 GMT)
Natural Language Reinforcement Learning [27.8] 自然言語強化学習(NLRL)は、RLの原則を自然言語に拡張するフレームワークである。
NLRLの中心はLVF(Language Value Function)であり、解釈可能な言語的物語としての価値を再定義する。
NLRLは、教師なし環境相互作用を通じて、RLライクなポリシーと価値トレーニングを実現するために実践的に実装できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:04:45 GMT)
Security Benefits and Side Effects of Labeling AI-Generated Images [27.8] ラベルの意味について検討し,誤ラベルの可能性についても検討した。
我々は1300人以上の米国とEU参加者による事前登録されたオンライン調査を実施している。
我々は,不正確な主張を伝達する人造画像がラベルの存在下でより信頼性が高いと認識されるという,望ましくない副作用を見出した。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:24:45 GMT)
Update Your Transformer to the Latest Release: Re-Basin of Task Vectors [27.6] ファウンデーションモデルは、微調整によって開発された多数の特殊モデルのバックボーンとして機能する。
基礎となる事前訓練されたモデルを更新または再訓練すると、微調整されたモデルは時代遅れになる。
モデルの新しいリリースに微調整を転送することは可能ですか?
本研究では,データフリーで再学習することなく,新たなチェックポイントに微調整を移す方法について検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:55:12 GMT)
Multiclass Loss Geometry Matters for Generalization of Gradient Descent in Separable Classification [27.3] 分離線形分類のための非正規化手法の一般化性能について検討する。
収束速度は損失テンプレートの幾何に大きく影響されていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:39:14 GMT)
Language-Enhanced Representation Learning for Single-Cell Transcriptomics [27.3] 単細胞転写学における言語強化表現学習のための新しいフレームワークである scMMGPT を提案する。
scMMGPTは、ロバストな細胞表現抽出を採用し、定量的な遺伝子発現データを保存し、革新的な2段階事前学習戦略を導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:22:31 GMT)
Training Free Stylized Abstraction [27.3] スティル化抽象化は、視覚的に誇張されているが意味的に忠実な対象表現を合成し、認識可能性と知覚歪みのバランスをとる。
視覚言語モデル(VLLM)における推論時間スケーリングを用いて,単一の画像からスタイル化された抽象化を生成する学習自由フレームワークを提案する。
提案手法は,時間的時間的スケジューリングによって動的に構造復元を適応し,主観とスタイルの両方を尊重する高忠実度復元を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:57 GMT)
FAMA: The First Large-Scale Open-Science Speech Foundation Model for English and Italian [27.3] FAMAは、英語とイタリア語のオープンサイエンス・スピーチ・ファンデーション・モデルの最初のファミリーである。
既存のSFMと比較して最大8倍高速な競合性能を実現している。
コード、データセット、モデルを含むすべてのアーティファクトは、OS準拠のライセンスの下でリリースされている。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:19:34 GMT)
GraphOmni: A Comprehensive and Extendable Benchmark Framework for Large Language Models on Graph-theoretic Tasks [27.0] Graph Omniは、自然言語で記述されたグラフ理論タスクにおけるLLMの推論能力を評価するためのベンチマークである。
我々は,グラフタイプ,シリアライズ形式,シグナリングスキーム間の重要な相互作用を同定し,モデル性能に大きな影響を与えることを示す。
本稿では,LLM推論能力に影響を与える最適要因を適応的に選択する強化学習型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:47:46 GMT)
VisCRA: A Visual Chain Reasoning Attack for Jailbreaking Multimodal Large Language Models [26.8] MLRMにおける高度な視覚的推論のセキュリティへの影響について検討する。
視覚的推論が向上するにつれて、モデルはジェイルブレイク攻撃に対してより脆弱になる。
安全機構をバイパスするために視覚的推論チェーンを利用する新しいジェイルブレイクフレームワークであるVisCRAを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:29:46 GMT)
Scalable Parameter and Memory Efficient Pretraining for LLM: Recent Algorithmic Advances and Benchmarking [26.8] 大規模言語モデル(LLM)は前例のない速度で成長し、最近のモデルには数兆のパラメータを含むものもある。
この成長には、特にトレーニングや微調整に必要なメモリと計算資源に関して、かなりの計算上の課題が伴う。
パラメーターまたはメモリ効率のよいメソッドは、事前トレーニングの効率を高めつつ、フルモデルトレーニングに匹敵するパフォーマンスを達成することができるだろうか?
論文参考訳(メタデータ) (Wed, 28 May 2025 22:51:43 GMT)
HoliTom: Holistic Token Merging for Fast Video Large Language Models [26.8] ビデオ言語モデル(ビデオLLM)は、ビデオ理解において優れるが、冗長なビデオトークンによる計算不効率に直面する。
HoliTomは、新しいトレーニング不要な全体的トークンフレームワークである。
また,内部LLMトークンの類似性に基づくマージ手法を導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:49:18 GMT)
Pitfalls of Rule- and Model-based Verifiers -- A Case Study on Mathematical Reasoning [26.7] 数理推論をケーススタディとして、静的評価とRLトレーニングのシナリオの両方において、様々な検証を包括的に分析する。
まず、現在のオープンソースのルールベースの検証器は、よく使われる数学的データセット間で異なる形式で表される同等の答えを認識できないことが多く、無視できない偽陰性率をもたらす。
これらの制約に対処するための潜在的な解決策としてモデルベース検証について検討する。
静的評価では,モデルの検証精度が著しく向上していることが示されているが,さらに解析とRLトレーニングの結果から,特定のパターンを誤分類するハッキングに非常に敏感であることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:28:41 GMT)
Progressive Data Dropout: An Embarrassingly Simple Approach to Faster Training [26.7] ハードデータマイニングとドロップアウトの洞察を活用するための,代替的なトレーニングパラダイムを提案する。
提案されたプログレッシブデータドロップアウトは、有効エポックの数をベースラインの12.4%に削減する。
驚くべきことに,提案手法は最大4.82%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:26:52 GMT)
Overcoming Non-monotonicity in Transducer-based Streaming Generation [26.2] 本研究は,Transducerの復号と学習可能な単調な注意による入力ストリーム履歴を統合する。
提案手法は,フォワード・バックワードアルゴリズムを用いて,予測状態と入力タイムスタンプとのアライメントの後方確率を推定する。
実験によると、MonoAttn-Transducerはストリーミングシナリオにおける非モノトニックアライメントを効果的に処理している。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:20:49 GMT)
Beyond Verifiable Rewards: Scaling Reinforcement Learning for Language Models to Unverifiable Data [26.2] 本稿では、新しいアルゴリズムJEPOを用いて、RLを検証不可能なデータにスケールすることを提案する。
JEPO はJensen の証明を下限に当てはめ、これは生成過程においてチェーン・オブ・シントを潜在変数と見なす証拠の実用的単純化である。
半検証可能なデータ(数値)では、JEPOは、データソースのサブセットしか活用できない検証可能な報酬を持つRLと比較して、ソフトマッチに基づく評価を改善する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:42:09 GMT)
SAM-R1: Leveraging SAM for Reward Feedback in Multimodal Segmentation via Reinforcement Learning [26.2] 画像理解タスクにおいて,マルチモーダルな大規模モデルによるきめ細かい推論を可能にする新しいフレームワークSAM-R1を提案する。
提案手法は,マルチモーダル推論モデルのトレーニングにおいて,よりきめ細かいセグメンテーション設定を取り入れた最初の手法である。
3kのトレーニングサンプルだけで、SAM-R1は複数のベンチマークで高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:08:28 GMT)
Revisiting In-Context Learning with Long Context Language Models [26.1] In-Context Learning (ICL) は、言語モデルが入力コンテキストで提供される例に基づいて予測を行う手法である。
LCLM(Long Context Language Models)の出現により、コンテキストに含まれるサンプルの数が大幅に増加した。
本報告では,多点ショット方式のICL性能が標本選択法にまだ敏感であるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:02:54 GMT)
Smooth Sailing: Lipschitz-Driven Uncertainty Quantification for Spatial Association [26.1] 協会の推定は環境科学、疫学、経済学の中心である。
本研究では,空間的環境下での関連性に対して,有効かつ頻繁な信頼区間を構築する手法を提案する。
我々のアプローチは、この設定における名目上のカバレッジを保証し、実・模擬両方の実験において既存の技術より優れています。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:55:38 GMT)
Adaptive Exploration for Multi-Reward Multi-Policy Evaluation [26.0] オンラインマルチリワードマルチ政治ディスカウント設定における政策評価問題
我々は、$epsilon$-accurate 推定の観点を採用して、有限あるいは凸な報酬の集合に対して$epsilon$accurate 推定を達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:52:23 GMT)
Cultural Evaluations of Vision-Language Models Have a Lot to Learn from Cultural Theory [26.0] 現代の視覚言語モデル(VLM)は、しばしば文化的能力評価とベンチマークで失敗する。
本稿では,視覚文化研究の基盤となる方法論が画像の文化的分析に欠かせないことを論じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:04:04 GMT)
GraphCheck: Breaking Long-Term Text Barriers with Extracted Knowledge Graph-Powered Fact-Checking [25.9] GraphCheckは、抽出した知識グラフを使用してテキスト表現を強化するファクトチェックフレームワークである。
既存の方法によって見落とされがちなマルチホップ推論チェーンをキャプチャする。
最先端のLCMと同等のパフォーマンスを実現し、パラメータも大幅に少ない。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:57:49 GMT)
PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models [25.9] オープンで超高忠実なPrismLayersデータセットは200K (20K) の多層透明画像で, 正確なアルファマットが得られた。
また、最新のテキスト・画像生成モデルの美学と一致する強力なオープンソース多層生成モデルART+も提供します。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:09:33 GMT)
RISE: Reasoning Enhancement via Iterative Self-Exploration in Multi-hop Question Answering [25.8] 提案するRISE:Reasoning Enhancement via Iterative Self-Explorationは,モデルの推論能力を高めるために設計された新しいフレームワークである。
MHQAタスクに対処する3つの重要なステップ:質問分解、検索-then-read、自己批判である。
複数のMHQAベンチマークの実験により、RISEは推論精度とタスク性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:48:28 GMT)
Search and Refine During Think: Autonomous Retrieval-Augmented Reasoning of LLMs [25.8] 大きな言語モデルは印象的な推論能力を示してきたが、本質的には知識貯水池によって制限されている。
Retrieval-augmented reasoningは、LCMが外部リソースをクエリできるようにすることによって、この制限を緩和する。
本稿では,新しい探索・復調思考のパラダイムを取り入れた強化学習フレームワークであるAutoRefineを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:19:51 GMT)
Understanding Representation Dynamics of Diffusion Models via Low-Dimensional Modeling [25.7] 拡散モデルにおける一様表現ダイナミクスの出現について検討する。
この一様性は、ノイズスケールをまたいだデノイング強度とクラス信頼の相互作用から生じる。
分類タスクにおいて、一助動学の存在は、確実に一般化を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:17:58 GMT)
Mitigating Lost-in-Retrieval Problems in Retrieval Augmented Multi-Hop Question Answering [25.5] ChainRAGはマルチホップ質問応答のためのプログレッシブ検索および書き換え手法である。
欠落したキーエンティティと関連する文を完了することで、各サブクエストをシーケンシャルに処理する。
有効性と効率の両面で、一貫してベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:19:26 GMT)
Almost Linear Convergence under Minimal Score Assumptions: Quantized Transition Diffusion [25.5] 本稿では,データ量子化と離散拡散力学を統合する新しい手法である量子化遷移拡散(QTD)を提案する。
提案手法はまず,連続データ分布の$p_*$をヒストグラム近似とバイナリ符号化により離散的な$q_*$に変換する。
逆時間サンプリングでは,逆CTMCをシミュレートするために,テクスティットランキャットによる一様化手法を導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:10:11 GMT)
DvD: Unleashing a Generative Paradigm for Document Dewarping via Coordinates-based Diffusion Model [25.5] ドキュメンテーションデワープは、写真文書画像の変形を補正することを目的としており、テキストの可読性を向上させる。
我々はtextbfDiffusion フレームワークを用いて textbfDewarping textbf に取り組むための最初の生成モデル DvD を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:05:51 GMT)
Compressing Sine-Activated Low-Rank Adapters through Post-Training Quantization [25.4] Low-Rank Adaptation (LoRA) はパラメータ効率の良い微調整の標準手法となっている。
正弦波変換フレームワークを量子化LoRAアダプタに拡張する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:15:15 GMT)
Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO [25.3] MLLMの教師なし後学習のための簡易かつ効果的なフレームワークであるMM-UPTを提案する。
MM-UPTはGRPO上に構築され、従来の報酬信号を複数のサンプル応答に対する多数決に基づく自己回帰機構に置き換える。
実験により,MM-UPTはQwen2.5-VL-7Bの推論能力を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:11:16 GMT)
ATI: Any Trajectory Instruction for Controllable Video Generation [25.2] 本稿では、カメラの動き、オブジェクトレベルの翻訳、きめ細かい局所的な動きをシームレスに統合する、動画生成におけるモーション制御のための統一的なフレームワークを提案する。
提案手法は,事前学習した画像-映像生成モデルの潜在空間にユーザ定義トラジェクトリを投影することにより,凝集性のある解を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:49:18 GMT)
DAM: Domain-Aware Module for Multi-Domain Dataset Condensation [25.1] MDDC(Multi-Domain dataset Condensation)は、単一ドメインとマルチドメインの両方で一般化されたデータをコンデンスすることを目的としている。
ドメイン認識モジュール(DAM)は、学習可能な空間マスクを通じて、各合成画像にドメイン関連機能を埋め込む。
DAMは、ベースラインデータセット凝縮メソッドよりも、ドメイン内、ドメイン外、アーキテクチャ間のパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:13:38 GMT)
EvoMoE: Expert Evolution in Mixture of Experts for Multimodal Large Language Models [25.1] MLLM(Multi-modal large language model)は、MoE技術を採用した。
MoEの専門家は、単にLPMからFFNパラメータを複製することで、しばしば発生する。
専門家の統一性は、MOEの専門家が単に LLM から FFN パラメータを複製することによって生じることが多いためである。
ルータの剛性は 専門家の選択に 静的リニアルータが 広く使われていることに由来する
論文参考訳(メタデータ) (Wed, 28 May 2025 08:38:39 GMT)
An Augmentation-Aware Theory for Self-Supervised Contrastive Learning [25.0] 本稿では,自己教師付きコントラスト学習のための拡張型エラー境界を提案する。
教師付きリスクは、教師なしリスクだけでなく、データ拡張によって引き起こされるトレードオフによっても拘束されていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:18:20 GMT)
RC-AutoCalib: An End-to-End Radar-Camera Automatic Calibration Network [24.9] 本稿では,レーダとカメラシステムのためのオンライン自動幾何校正手法を提案する。
レーダ高度データにおける重要なデータ間隔と測定の不確実性を考えると、システム運用中に自動校正を行うのが長年の課題である。
本稿では,前眼と鳥眼の両方から特徴を収集するデュアルパースペクティブ表現を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:52:31 GMT)
Improving Brain-to-Image Reconstruction via Fine-Grained Text Bridging [24.9] 微細なブレイン・トゥ・イメージ再構成は、微細なテキストをブリッジとして利用して画像再構成を改善する。
FgB2Iは3つの重要なステージで構成されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:16:44 GMT)
Preference Adaptive and Sequential Text-to-Image Generation [24.8] 我々は、大規模なオープンソース(非シーケンシャル)データセットとともに、シーケンシャルな選好の新たなデータセットを作成します。
EM戦略を用いてユーザ嗜好モデルとユーザ選択モデルを構築し,様々なユーザ嗜好タイプを同定する。
次に,大規模マルチモーダル言語モデル (LMM) と値に基づくRLアプローチを用いて,ユーザへの迅速な拡張の適応的かつ多様なスレートを提案する。
PASTA(Preference Adaptive and Sequential Text-to-image Agent)は、適応的マルチターン機能を備えたT2Iモデルを拡張し、協調的共同創造を促進し、不確実性や不特定性に対処する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:35:37 GMT)
Integrating Intermediate Layer Optimization and Projected Gradient Descent for Solving Inverse Problems with Diffusion Models [24.7] 逆問題(IP)はノイズの観測から信号を再構成する。
DMはIPを解くための強力なフレームワークとして登場し、優れた再構築性能を実現している。
既存のDMベースの手法は、重い計算要求や準最適収束といった問題に頻繁に遭遇する。
これらの課題に対処するために,DMILOとDMILO-PGDという2つの新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:36:11 GMT)
Charting the Landscape of African NLP: Mapping Progress and Shaping the Road Ahead [24.7] アフリカは2000以上の言語を持つ世界で最も豊かな言語圏の1つである。
この多様性は、最先端の自然言語処理システムにはほとんど反映されない。
我々は過去5年間に出版されたアフリカ言語のためのNLPに関する734の研究論文を分析した。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:08:39 GMT)
A Comparative Study of Fuzzers and Static Analysis Tools for Finding Memory Unsafety in C and C++ [24.6] C/C++プログラムにおける100以上の既知のセキュリティ脆弱性に適用した5つの静的アナライザと13個のファザの実証分析を行った。
どちらのテクニックもさまざまなタイプのバグを発見していますが、それぞれに明確な勝者があります。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:22:29 GMT)
Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions [24.6] Chain-of-Talkers (CoTalk)は、アノテートされたサンプルの数を最大化するように設計されたAI-in-the-loop方法論である。
提案手法では,チェインオブスケジューラのアノテーション速度 (0.42 vs. 0.30 Unit/sec) と検索性能 (41.13% vs. 40.52%) を並列手法で改善することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:45:55 GMT)
Position: Don't Use the CLT in LLM Evals With Fewer Than a Few Hundred Datapoints [24.6] 我々は、CLTに基づく不確実性定量化手法は、数千の例からなるベンチマークでは適切であるが、より小型で高度に専門化されたベンチマークに依存する評価に対して、適切な不確実性評価を提供することができないと論じる。
これらの小さなデータ設定では、CLTベースの手法は非常に貧弱で、通常劇的に不確実性を過小評価する。
より一般的なシナリオにおいて、実装が容易で、より適切な代替の頻繁な手法とベイズ的手法を推奨する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:29:03 GMT)
Credal Prediction based on Relative Likelihood [24.3] 本稿では,相対可能性の統計的概念に基づいて,断裂予測に関する理論的基礎的アプローチを提案する。
このような方法で定義されたクレダル集合を適切に修正したアンサンブル学習手法により近似する問題に取り組む。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:20:20 GMT)
Self-Reflective Reinforcement Learning for Diffusion-based Image Reasoning Generation [24.2] 拡散モデルは最近、画像生成タスクにおいて例外的な性能を示した。
本稿では,拡散モデルに対する自己回帰RLアルゴリズムであるSRRLを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:37:21 GMT)
Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start [24.2] アハモーメント」パターンは強化学習(RL)の創発的特性に起因することが多い
本稿では,2段階アプローチによるマルチモーダル推論の強化に関する総合的研究について述べる。
実験の結果,この組み合わせはSFTのみの手法とRLのみの手法より一貫して優れていることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:21:38 GMT)
From Strangers to Assistants: Fast Desire Alignment for Embodied Agent-User Adaptation [24.2] LLM駆動型ユーザエージェントを統合したホームアシストシミュレーション環境HA-Desireを開発した。
本稿では、欲求に基づく心的推論機構を導入した、迅速な欲求整合のための新しいフレームワークFAMERを提案する。
本フレームワークは,タスク実行とコミュニケーション効率を大幅に向上させ,具体的エージェントがユーザ固有の欲求に迅速に適応できるようにする。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:51:13 GMT)
ControlTac: Force- and Position-Controlled Tactile Data Augmentation with a Single Reference Image [24.2] ControlTacは、単一の参照触覚画像、接触力、接触位置に条件付けされたリアルな触覚画像を生成する、制御可能なフレームワークである。
ControlTacは、触覚データセットを効果的に拡張し、一貫したゲインにつながることを実証します。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:10:51 GMT)
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation [24.1] 高速かつ高品質なタンパク質のバックボーン生成のための新しい補正四元流(ReQFlow)マッチング法を提案する。
本手法は,タンパク質鎖の各残基に対するランダムノイズから局所翻訳と3次元回転を生成する。
数値安定性を保証した四元数フロー(QFlow)を用いてモデルをトレーニングし、推論を高速化し、生成したタンパク質のバックボーンの設計性を向上させるためにQFlowモデルを修正する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:37:10 GMT)
MAC-Gaze: Motion-Aware Continual Calibration for Mobile Gaze Tracking [24.1] モバイルの視線追跡は基本的な課題に直面している。
本稿では,スマートフォン慣性計測ユニット(IMU)センサと連続学習技術を活用した動き認識型連続学習手法MAC-Gazeを提案する。
本システムでは、事前学習した視線推定器と、IMUに基づく活動認識モデルと、クラスタリングに基づくハイブリッド意思決定機構を統合した。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:38:04 GMT)
D-Fusion: Direct Preference Optimization for Aligning Diffusion Models with Visually Consistent Samples [23.9] 本稿では,DPO学習可能な視覚的一貫したサンプルを構築する手法であるD-Fusionを紹介する。
一方、マスクガイドによる自己注意融合を行うことで、得られた画像は正常に整合するだけでなく、与えられた不整合画像と視覚的に整合する。
一方、D-FusionはDPO訓練に欠かせない画像のノイズの軌跡を保持することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:03:41 GMT)
SP2RINT: Spatially-Decoupled Physics-Inspired Progressive Inverse Optimization for Scalable, PDE-Constrained Meta-Optical Neural Network Training [23.9] SP2RINTは、メタ光学系のための空間的に分離されたプログレッシブトレーニングフレームワークである。
シミュレーション・イン・ザ・ループのアプローチよりも1825倍高速でありながら、デジタル比較可能な精度を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:12:11 GMT)
Distribution free M-estimation [23.6] 本稿では,アニメーション統計や最適化問題に対する凸推定が,そのような仮定のない環境で解ける場合に特徴付ける。
我々は、おそらく、最小化される損失のリプシッツ連続性が分布自由化に必要ではないことを示し、機械学習における学習可能性の古典的特徴と異なることも示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:33:12 GMT)
Exploring the Landscape of Text-to-SQL with Large Language Models: Progresses, Challenges and Opportunities [23.6] 大規模言語モデル(LLM)の最近の進歩は、自然言語処理(NLP)の分野を著しく推進し、テキスト・ツー・リレーショナル・システムを改善するための新たな道を開いた。
本研究では,4つの重要な側面に焦点をあてて,テキスト・ツー・リレーショナルの体系的レビューを行う。
この調査は、LLMベースのテキスト・ツー・リレーショナルの深い理解に拍車をかけたもので、この分野の新たな革新と進歩を引き起こしている。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:23:38 GMT)
Principled Content Selection to Generate Diverse and Personalized Multi-Document Summaries [23.5] 大規模言語モデルは「中間の失われた」現象を示す。
これにより、多文書要約において様々な素材をカバーできなくなる。
我々は、このタスクのソースカバレッジを高めるために、原則付きコンテンツ選択が簡単な方法であることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:12:50 GMT)
Neuromorphic Sequential Arena: A Benchmark for Neuromorphic Temporal Processing [23.4] 本稿ではニューロモルフィック・シークエンシャル・アリーナ(NSA)について紹介する。
NSAには、さまざまなアプリケーションシナリオから7つの現実世界の時間的処理タスクが含まれており、それぞれが複数の時間スケールにわたってリッチな時間的ダイナミクスをキャプチャしている。
NSAは、ニューロモルフィックアルゴリズムの研究における進歩の体系的な追跡を可能にし、効果的で効率的なニューロモルフィック時間処理システムの開発の道を開く。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:57:40 GMT)
YH-MINER: Multimodal Intelligent System for Natural Ecological Reef Metric Extraction [23.4] 海洋生物多様性と生態過程を維持するために不可欠なサンゴ礁は、エスカレートする脅威に直面している。
本研究では,YH-OSIシステムを開発し,「対象検出・意味分割・優先入力」のためのインテリジェントなフレームワークを構築した。
本システムは,88%の属レベルの分類精度を達成し,同時にコア生態指標を抽出する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:36:18 GMT)
The Value of Information in Human-AI Decision-making [23.4] 情報の価値を特徴付けるための意思決定理論の枠組みに貢献する。
本稿では、SHAPの説明に適応し、人間の補足情報を強調する新しい説明手法を提案する。
我々は,人間の意思決定を最も補完するAIモデルを特定するために,補完的情報の尺度が利用できることを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:44:35 GMT)
VIGNETTE: Socially Grounded Bias Evaluation for Vision-Language Models [23.3] 本稿では、視覚言語モデル(VLM)のバイアスを評価するために、30M以上の画像を持つ大規模VQAベンチマークであるVIGNETTEを紹介する。
我々は、VLMが文脈的設定におけるアイデンティティをどう解釈するかを評価し、モデルがどのように特性と能力の仮定を作成し、差別のパターンを示すかを明らかにする。
我々の発見は微妙で多面的で驚くべきステレオタイプパターンを明らかにし、VLMが入力から社会的意味をどう構築するかについての洞察を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:00:30 GMT)
Talent or Luck? Evaluating Attribution Bias in Large Language Models [23.3] 社会心理学の理論は、人間が暗黙の認知を用いて出来事に対して責任を負う方法を説明する。
この研究は、モデルの推論格差が人口集団に対するバイアスをどう伝達するかを識別する認知的基盤によるバイアス評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:18:46 GMT)
Spa-VLM: Stealthy Poisoning Attacks on RAG-based VLM [23.3] 本稿では,大規模モデルに対する新たな毒殺パラダイムであるSpa-VLM(Stealthy Poisoning Attack on RAG-based VLM)を提案する。
我々は、敵対的な画像や誤解を招くテキストを含む悪意のあるマルチモーダルな知識エントリを作成し、RAGの知識ベースに注入する。
以上の結果から,攻撃成功率は0.8。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:44:10 GMT)
LiTEx: A Linguistic Taxonomy of Explanations for Understanding Within-Label Variation in Natural Language Inference [23.3] 自由文の説明を分類するための言語情報を用いた分類法であるLITEXを紹介する。
この分類を用いて、e-SNLIデータセットのサブセットに注釈を付け、分類の信頼性を評価し、NLIラベル、ハイライト、説明とどのように一致しているかを分析する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:32:48 GMT)
AudioTurbo: Fast Text-to-Audio Generation with Rectified Diffusion [23.3] 整流流は直線常微分方程式経路を学習することにより推論速度を向上させる。
このアプローチでは、フローマッチングモデルをスクラッチからトレーニングする必要があります。
本稿では,事前学習したTTAモデルにより生成された定性雑音サンプルペアから一階ODEパスを学習するAudioTurboを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:33:58 GMT)
Flexible Sampling for Long-tailed Skin Lesion Classification [23.2] 既存の長い尾の学習方法は、各クラスを等しく扱い、長い尾の分布を再バランスさせる。
本稿では,長鎖皮膚病変分類タスクに対するフレキシブルサンプリングと呼ばれるカリキュラムベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:05:55 GMT)
Re-ttention: Ultra Sparse Visual Generation via Attention Statistical Reshape [23.0] 大きなボトルネックは、複雑性が解像度とビデオ長で2倍にスケールする注意機構である。
既存の技術は、非常に高い空間レベルにおける視覚的品質の維持に失敗し、無視できない計算オーバーヘッドを発生させる可能性がある。
本稿では,視覚生成モデルに非常に注意を払わせるRe-ttentionを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:39:12 GMT)
PRISM: Video Dataset Condensation with Progressive Refinement and Insertion for Sparse Motion [22.8] 本稿では,ビデオデータセット凝縮のためのプログレッシブ・リファインメント・インサーション・フォー・スパース・モーション(PRISM)を提案する。
静的コンテンツを動的運動から分離する従来の方法とは異なり、本手法はこれらの要素間の重要な相互依存を保存する。
提案手法は,動作中の動作を完全に調整するためにフレームを段階的に洗練・挿入し,性能は向上するが,記憶力は低下する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:42:10 GMT)
EFIM: Efficient Serving of LLMs for Infilling Tasks with Improved KV Cache Reuse [22.8] クロスリクエストキー値 (KV) キャッシュの再利用は、中間計算を格納し再利用する手法である。
タスクを埋め込むため、KVキャッシュの再利用は、しばしばプロンプトフォーマットの構造によって妨げられる。
我々は、KVキャッシュの再利用性能を解放するFIMの変換プロンプトフォーマットであるEFIMを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:07:03 GMT)
RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction [22.7] RICOは視覚的再構成によってキャプションを洗練させる新しいフレームワークである。
DPOを用いてRICOのようなキャプションを生成するRICO-Flashを導入する。
提案手法はキャプション精度と完全性を大幅に向上させ,CapsBenchとCompreCapでは,ほとんどのベースラインを約10%上回った。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:29:34 GMT)
See through the Dark: Learning Illumination-affined Representations for Nighttime Occupancy Prediction [22.7] 職業予測は,占領地域の3次元空間分布とそれに対応する意味ラベルを推定することを目的としている。
照明に適応した表現を学習する新しいフレームワークである textbfLIAR を提案する。
実データと合成データの両方の実験は、挑戦的な夜間シナリオ下でのLIARの優れた性能を示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:56:02 GMT)
AdvAgent: Controllable Blackbox Red-teaming on Web Agents [22.7] AdvAgentは、Webエージェントを攻撃するためのブラックボックスのレッドチームフレームワークである。
強化学習に基づくパイプラインを使用して、敵のプロンプトモデルをトレーニングする。
慎重な攻撃設計では、エージェントの弱点を効果的に活用し、ステルス性と制御性を維持する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:38:51 GMT)
Positional Fragility in LLMs: How Offset Effects Reshape Our Understanding of Memorization Risks [22.6] 文脈ウィンドウの先頭から引き出された短い接頭辞が,動詞の暗記を最も強く引き起こすことを示す。
センシティブなデータをコンテキストウィンドウに深くシフトさせることは,抽出可能な記憶と変性の両方を抑制することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:39:49 GMT)
Advancing Expert Specialization for Better MoE [22.6] Mixture-of-Experts (MoE)モデルは、入力毎に専門家のサブセットだけを活性化することにより、大きな言語モデル(LLM)の効率的なスケーリングを可能にする。
一般的に使用される補助負荷分散損失は、しばしば専門家の重複と過度に均一なルーティングをもたらす。
本稿では,2つの相補的目的を取り入れた,シンプルで効果的な解を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:09:47 GMT)
Decomposing Elements of Problem Solving: What "Math" Does RL Teach? [22.5] 私たちは問題解決を、計画、実行、検証という基本的な機能に分解します。
RLを訓練したモデルは、計画スキルが不十分なため、基本的に新しい問題に悩まされ、"カバーウォール"にぶつかっていることを示す。
本研究は, LLM推論の強化におけるRLの役割について考察し, 重要な限界を明らかにするとともに, これらの障壁を克服するための道筋を示唆する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:18:49 GMT)
Adversarially Robust AI-Generated Image Detection for Free: An Information Theoretic Perspective [22.5] 我々は,AIGI検出において,対戦訓練(AT)がパフォーマンスの低下に悩まされていることを示す。
この差に触発されて,情報理論による無トレーニングロバスト検出(TRIM)を提案する。
TRIMは標準検出器上に構築され、予測エントロピーとKL分散を用いて特徴シフトを定量化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:20:49 GMT)
Measuring the Faithfulness of Thinking Drafts in Large Reasoning Models [22.3] 大規模推論モデル(LRM)は複雑な問題解決においてその能力を著しく向上させた。
本稿では,思考ドラフト忠実度を厳格に評価するための系統的対実介入フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:41:14 GMT)
Beyond Perception: Evaluating Abstract Visual Reasoning through Multi-Stage Task [22.2] 現在のマルチモーダル大言語モデル(MLLM)は、一般的な視覚的推論では優れているが、抽象的視覚的推論(AVR)では未探索のままである。
既存のベンチマークでは、単一ステップの推論に重点を置いて、最終的な結果を強調しながら、推論プロセスの多段階的な性質を無視している。
我々は、様々なレベルの複雑さの推論を評価するために設計されたマルチステージベンチマークであるMultiStARを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:34:45 GMT)
UniTalk: Towards Universal Active Speaker Detection in Real World Scenarios [22.2] アクティブな話者検出のタスクに特化して設計された新しいデータセットであるUniTalkを提案する。
UniTalkは、多様で困難な現実世界の状況に特化している。
ビデオは44.5時間以上、フレームレベルのアクティブな話者アノテーションが48,693の話者IDにまたがっている。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:08:59 GMT)
CHATS: Combining Human-Aligned Optimization and Test-Time Sampling for Text-to-Image Generation [22.1] 人間の嗜好アライメントのような重要なコンポーネントは、生成品質を保証する上で重要な役割を果たす。
そこで我々はCHATS(Combining Human-Aligned Optimization and Test-time Sampling)を紹介した。
我々はCHATSが例外的なデータ効率を示すことを観察し、小型で高品質な漏えいデータセットでのみ強力な性能を達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:38:29 GMT)
Training on Plausible Counterfactuals Removes Spurious Correlations [22.1] P-CFE (Plusible counterfactual explanations) は、入力を最小限に修正して分類器の決定を変更する摂動である。
本研究では,非摂動入力を分類するために,誘導的内向的ターゲットクラスをラベル付けしたp-CFEを用いて分類器を訓練できることを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:51:22 GMT)
Reinforcement Learning for Out-of-Distribution Reasoning in LLMs: An Empirical Study on Diagnosis-Related Group Coding [22.1] 大言語モデル(LLM)は、タスクの配布外の性質のため、診断関連グループ(DRG)コードと競合する。
本稿では,大規模強化学習(RL)を用いてDRGの自動符号化を行うDRG-Sapphireについて紹介する。
我々のモデルはMIMIC-IVベンチマークで最先端の精度を達成し、DRG代入に対する医師公認推論を生成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:54:07 GMT)
SridBench: Benchmark of Scientific Research Illustration Drawing of Image Generation Model [21.8] SridBenchは、科学フィギュア生成のための最初のベンチマークである。
これは13の自然科学とコンピュータ科学の分野にわたる主要な科学論文から1,120の事例で構成されている。
その結果、GPT-4o画像のような最上位モデルでさえ、人間のパフォーマンスに遅れがあることが判明した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:51:01 GMT)
New Tools are Needed for Tracking Adherence to AI Model Behavioral Use Clauses [21.8] 悪質で悪意のあるAIの使用に関する懸念は、テクノロジーのリスクを制限するメカニズムの設計につながった。
その結果、行動利用条項と許容可能な利用政策を持つライセンスが急増した。
本稿では、これらのライセンスの採用と遵守を追跡するツールが次の自然なステップであると位置づける。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:26:55 GMT)
CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling [21.7] コントラスト言語-画像事前学習(CLIP)はマルチモーダルインテリジェンスの基礎となっている。
最近の研究で、CLIPは機能空間の1つの側面しかエンコードできないことが判明した。
本稿では,一連の相補的なCLIPモデルを微調整し,それらをCLIP-MoEに変換する新しい戦略を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:03:54 GMT)
K-Paths: Reasoning over Graph Paths for Drug Repurposing and Drug Interaction Prediction [21.7] K-Pathsは、密度の高いバイオメディカル知識グラフから構造化され、多様性があり、生物学的に意味のあるマルチホップパスを抽出する、モデルに依存しない検索フレームワークである。
これらの経路は、保存されていない薬物・薬物・消毒相互作用の予測を可能にする。
実験によると、K-Pathsは最先端の言語モデル間でゼロショット推論を改善する。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:21:27 GMT)
Rethinking GNN Expressive Power from a Distributed Computational Model Perspective [21.7] 事前処理と後処理を明確に指定した修正 CONGEST モデルなど,明確に定義された計算モデルを使用することによって,GNN 表現性を分析するためのより健全なフレームワークが提供される,と我々は主張する。
制約のない事前処理を許可したり、外部に計算された機能を組み込んだりすることは、これらの事前計算によって表現性が向上し、時には問題を引き起こす可能性があることを示す。
これらの否定的な結果にもかかわらず、計算モデルの観点から仮想ノードとエッジの効果を特徴付ける肯定的な結果も提示する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:20:36 GMT)
SageAttention2++: A More Efficient Implementation of SageAttention2 [21.7] 本稿では,FP16に蓄積したFP8 Matmulの高速な命令を利用して,SageAttention2を高速化することを提案する。
実験によると、SageAttention2++は、SageAttention2と同じ注意精度を維持しながら、FlashAttentionよりも3.9倍のスピードアップを達成した。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:22:06 GMT)
A Stochastic Approximation Approach for Efficient Decentralized Optimization on Random Networks [21.7] 分散最適化における課題は、信頼できない帯域制限通信網の下でランダム時間トポロジに高速収束したアルゴリズムを開発することである。
本稿では,FSPDA(Fully Primal Dual Algorithm)フレームワークを用いた新しい近似手法を提案する。
数値実験は、FSPDAアルゴリズムの利点を示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:13:41 GMT)
Taming Recommendation Bias with Causal Intervention on Evolving Personal Popularity [21.6] 人気度バイアスは、人気のあるアイテムがより頻繁に推奨されるときに発生する。
既存のデバイアス手法は、人気バイアスを全ユーザーに対して均一に緩和する。
本稿では,推薦バイアスに対処するためのCausalEPP(Causal Intervention on Evolving Personal Popularity)という新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:52:31 GMT)
SHTOcc: Effective 3D Occupancy Prediction with Sparse Head and Tail Voxels [21.5] 3Dの占有率予測は、自動運転の分野で大きな注目を集めている。
従来は、ボクセルの最も重要な分布パターンを探索しなかったため、不満足な結果となった。
本稿では,スパースヘッドテールボクセル構造を用いて,頭部と尾部のキーボクセルを正確に同定し,バランスをとるSHTOccを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:16:15 GMT)
ReliableEval: A Recipe for Stochastic LLM Evaluation via Method of Moments [21.4] 本稿では,意味保存型摂動空間におけるモーメント評価手法について論じる。
GPT-4oやClaude-3.7-Sonnetのようなトップパフォーマンスモデルでさえ、かなりの迅速な感度を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:40:48 GMT)
Advancing high-fidelity 3D and Texture Generation with 2.5D latents [21.3] 本稿では3次元幾何学とテクスチャの融合生成のための新しい枠組みを提案する。
具体的には、2Dと3Dの間でシームレスに変換できる汎用2.5D表現を生成することに重点を置いている。
我々のモデルは、テキストや画像からのコヒーレントな構造と色を持つ高品質な3Dオブジェクトの生成に優れるだけでなく、テクスチャ生成における既存の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:14:46 GMT)
Understanding (Un)Reliability of Steering Vectors in Language Models [21.3] 本稿では,アクティベーションの違いが操舵信頼性に及ぼす影響について検討する。
実験で使用した7つのプロンプト型はすべて、正の操舵効果を生じるが、試料間で高いばらつきを示し、しばしば所望のものと逆の効果を与える。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:53:31 GMT)
ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation [21.3] 我々は,テキスト・ツー・イメージ生成における3次元配向グラウンドディングのための最初のゼロショット手法であるORIGENを紹介する。
本稿では,事前学習による3次元方向推定モデルを用いた報酬誘導サンプリング手法を提案する。
実験の結果,ORIGENはトレーニングベースとテストタイムの指導方法の両方で,定量的な測定値やユーザスタディよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:22:19 GMT)
Progressive Language-guided Visual Learning for Multi-Task Visual Grounding [21.3] マルチタスクビジュアルグラウンドティングのためのプログレッシブ言語誘導型ビジュアルラーニングフレームワークを提案する。
本稿では,マルチタスク・ビジュアル・グラウンドティングのためのプログレッシブ言語誘導型ビジュアル・ラーニング・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:11:06 GMT)
Hybrid Wave-wind System Power Optimisation Using Effective Ensemble Covariance Matrix Adaptation Evolutionary Algorithm [21.2] ハイブリッド・ウィンドウェーブシステムは、オフショア・ウィンド・プラットフォームとウェーブ・エナジー・コンバータ(WEC)を組み合わせて、コスト効率と信頼性の高いエネルギーソリューションを作成する。
本研究は,3つの球面WECを持つ5-MW OC4-DeepCwind半潜水プラットフォームを用いて,これらのシナジーを探索する。
本稿では,共分散行列適応,新規性探索,離散化技術を組み合わせた効果的なアンサンブル最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:12:25 GMT)
A Comprehensive Real-World Assessment of Audio Watermarking Algorithms: Will They Survive Neural Codecs? [21.1] RAW-Benchは、ディープラーニングベースのオーディオ透かし手法を評価するためのベンチマークである。
圧縮,背景雑音,残響などの様々な歪みを伴う包括的オーディオアタックパイプラインを導入する。
極性インバージョン、時間伸張、あるいはリバーブのような特定の歪みが、特定の方法に深刻な影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:20:39 GMT)
A Preprocessing Framework for Efficient Approximate Bi-Objective Shortest-Path Computation in the Presence of Correlated Objectives [21.1] 本研究は,両目的性短絡(BOSP)問題と相関する目的が存在することを考察する。
BOSPは、探索空間のサイズが目的関数の数とグラフサイズで指数関数的であるため、一般に計算的に困難である。
相関対象が存在する場合の探索労力を削減できる効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:26:14 GMT)
Towards Comprehensive Scene Understanding: Integrating First and Third-Person Views for LVLMs [21.1] E3VQAは,ego-exo画像対をベースとした4Kの高品質な質問応答対を用いた,マルチビュー質問応答のための最初のベンチマークである。
また、3つの相補的な視点からシーングラフを統合することにより、統一的なシーン表現を構築するトレーニングフリープロンプト技術であるM3CoTを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:09:42 GMT)
Learning World Models for Interactive Video Generation [21.0] 我々は、アクションコンディショニングと自動回帰フレームワークにより、インタラクティブな機能を備えた映像間モデルを強化する。
そこで本稿では, 長期のコンプレックスエラーを著しく低減するグローバルな条件付きビデオ検索拡張生成(VRAG)を提案する。
我々の研究は、内部世界モデリング機能を備えたビデオ生成モデルを改善するための包括的なベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:55:44 GMT)
Automating Thought of Search: A Journey Towards Soundness and Completeness [20.9] 大規模言語モデル(LLM)は、探索を必要とする計画問題の解決に使用されている。
Thought of Search (ToS) はコードで検索空間を定義することを提案した。
ToSはループに人間を必要とし、音の後継機能とゴールテストを生成する。
ToS(AutoToS)を自動化するための第一歩を踏み出し、言語モデルとのインタラクションのループから人間を取り出す。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:37:39 GMT)
4DTAM: Non-Rigid Tracking and Mapping via Dynamic Surface Gaussians [20.9] カメラのローカライゼーションと非剛体表面再構成を共同で行う4次元追跡マッピング法を提案する。
我々のアプローチは、深度測定や予測を伴うカラー画像のオンラインストリームから4Dシーンをキャプチャする。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:45:10 GMT)
Natural Language Processing in Support of Evidence-based Medicine: A Scoping Review [20.8] EBM(エビデンス・ベース・メディカル)は現代の医療の最前線にあり、臨床上の決定を導くのに最も有効な科学的証拠を使用することを強調している。
EBMのエビデンスを特定し、評価し、分析し、要約し、広めるために、自然言語処理(NLP)手法を調査する必要がある。
本研究は,臨床意思決定プロセスの強化において,NLPをEMMに活用する研究129件について,その重要な役割について詳細に検討した。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:17:01 GMT)
StressTest: Can YOUR Speech LM Handle the Stress? [20.8] センセントストレス(Sentence stress)とは、音声の発声の中で特定の単語に重点を置いて、アイデアを強調したり、対比させたり、あるいは新しい情報を導入することを指す。
近年の音声認識言語モデル(SLM)の進歩により,音声の直接処理が可能になった。
意味形成や話者意図形成において文ストレスが重要な役割を担っているにもかかわらず、そのようなモデルの評価や開発において、ほとんど見落とされ続けている。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:32:56 GMT)
Explicit Learning and the LLM in Machine Translation [20.6] この本は、LLMが説明を用いて新しい言語を学ぶ能力について探求している。
これを研究するために、我々は英語と構築言語間の実験を設計する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:31:44 GMT)
Comprehensive Evaluation on Lexical Normalization: Boundary-Aware Approaches for Unsegmented Languages [20.4] 大規模・マルチドメインの日本語正規化データセットを作成する。
我々は,最先端事前学習モデルに基づく正規化手法を開発した。
実験の結果,エンコーダのみのアプローチとデコーダのみのアプローチは,精度と効率の両面で有望な結果が得られることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:02:45 GMT)
Representation Shattering in Transformers: A Synthetic Study with Knowledge Editing [20.3] 知識編集(KE)アルゴリズムは、モデルの重みを変更して、不正、時代遅れ、その他の望ましくない事実関連付けに対するターゲット更新を実行する。
我々は,KEの適用が,モデルのより広い事実的リコール精度に悪影響を及ぼし,推論能力が低下することを示す。
我々の研究は、KEがモデル能力に悪影響を及ぼす理由を説明するための正確な力学仮説をもたらす。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:00 GMT)
Effective and Efficient One-pass Compression of Speech Foundation Models Using Sparsity-aware Self-pinching Gates [20.2] 本稿では,モデルプルーニングとパラメータ更新を一段階に統合した音声基礎モデル圧縮手法を提案する。
LibriSpeech-100hr corpus を用いた実験により,wav2vec2.0-base と HuBERT-large モデルのパラメータ数を 65% と 60% 削減できることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:24:21 GMT)
PrivacyRestore: Privacy-Preserving Inference in Large Language Models via Privacy Removal and Restoration [20.1] PrivacyRestoreは、推論中のユーザの入力のプライバシを保護するためのプラグイン・アンド・プレイ方式である。
プライバシストアの有効性を評価するために、医療ドメインと法律ドメインをカバーする3つのデータセットを作成します。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:38:37 GMT)
UI-Evol: Automatic Knowledge Evolving for Computer Use Agents [20.0] 自律的なGUI知識進化のためのプラグイン・アンド・プレイモジュールであるUI-Evolを提案する。
UI-Evolは、実際のエージェントと環境の相互作用から忠実な客観的なアクションシーケンスを抽出するRetrace Stageと、これらのシーケンスを外部参照と比較することによって既存の知識を洗練するCritique Stageの2つのステージで構成されている。
この結果から,UI-Evolはタスク性能を著しく向上させるだけでなく,コンピュータ利用エージェントの行動標準偏差がこれまで見過ごされていた問題にも対処できることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:32:05 GMT)
Position: Uncertainty Quantification Needs Reassessment for Large-language Model Agents [20.0] このポジションペーパーでは、従来の不確実性の二分法は、LLMエージェントが操作するオープンでインタラクティブな設定にはあまりに制限されていると論じている。
このような人間とコンピュータの相互作用における不確実性に着目した3つの新しい研究指針を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:08 GMT)
Test-Time Alignment of Discrete Diffusion Models with Sequential Monte Carlo [19.8] 本研究では,SMC(Sequential Monte Carlo)をベースとしたトレーニングフリー手法を提案する。
提案手法は, 報酬関数の1次テイラー展開により得られる局所的最適提案をツイストしたSMCを利用する。
離散空間における不定義勾配の挑戦に対処するために、Gumbel-Softmax 緩和を導入し、離散生成フレームワーク内で効率的な勾配に基づく近似を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:12:03 GMT)
Revisiting Group Relative Policy Optimization: Insights into On-Policy and Off-Policy Training [19.8] 我々は、政治と政治の双方の最適化体制において、グループ相対政策最適化(GRPO)を再考する。
我々は、政治と政治以外のGRPO目標の両方が報酬の改善をもたらすことを示す。
次に,2つのGRPO変種を用いた後学習における強化学習の実証的性能と検証可能な報酬とを比較した。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:42:33 GMT)
Robust Localization, Mapping, and Navigation for Quadruped Robots [19.8] 本稿では,低コスト四足歩行ロボットのためのロバストなローカライズ,マッピング,ナビゲーションシステムに向けた第一歩を示す。
我々は,接触支援キネマティック,視覚慣性オドメトリー,奥行き安定化ビジョンを組み合わせ,システムの安定性と精度を向上する。
シミュレーションの結果と2つの異なる現実世界の4Dプラットフォームにより、システムは環境の正確な2Dマップを生成し、自分自身をしっかりとローカライズし、自律的にナビゲートできることが示されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:28:45 GMT)
Physics-Informed Distillation of Diffusion Models for PDE-Constrained Generation [19.7] 拡散モデルは、物理系のモデリング、特に偏微分方程式(PDE)によって支配されるものにおいて、注目を集めている。
本稿では, PDE 制約を直接拡散過程に注入するのではなく, ポストホック蒸留段階において適用する, 単純かつ効果的なポストホック蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:17:58 GMT)
Learning When to Think: Shaping Adaptive Reasoning in R1-Style Models via Multi-Stage RL [19.7] 大規模推論モデル(LRM)は、最終的な答えを生成する前に、明示的でステップバイステップの推論シーケンスを生成するのに熟練している。
この過度に考える問題に対処するため、適応的思考能力を備えたLEMの装備方法について検討する。
推論ポリシーを段階的に最適化する多段階強化学習フレームワークであるAutoThinkを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:56:56 GMT)
ArgInstruct: Specialized Instruction Fine-Tuning for Computational Argumentation [19.6] 命令に従うための大規模言語モデル(LLM)のトレーニングは、目に見えないタスクに対処する能力を大幅に強化した。
本研究は、計算議論領域(CA)のための特殊命令微調整を導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:58:29 GMT)
Strengthening Proportionality in Temporal Voting [19.6] 承認投票による時間投票の枠組みにおける比例表現について検討する。
我々は,JR,PJR,EJRのより強力な変種について検討し,より要求の高い多元公理の時相適応を導入する。
我々は,EJR+とFJRの2つの公理が,いずれの選挙においても満足できるまま,EJRを強化していることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:02:52 GMT)
SkewRoute: Training-Free LLM Routing for Knowledge Graph Retrieval-Augmented Generation via Score Skewness of Retrieved Context [19.4] 大規模な言語モデルは多くのタスクで優れていますが、デプロイ時に高い推論コストがかかります。
性能とコストのバランスをとるための有望な解決策はLLMルーティングであり、より小さなLLMと複雑なLLMに単純なクエリを誘導する。
そこで我々は,KG-RAGに最適化された新しい学習不要なルーティングフレームワークを提案し,プラグアンドプレイ方式で性能とコストを効果的にバランスさせる。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:45:56 GMT)
DES-LOC: Desynced Low Communication Adaptive Optimizers for Training Foundation Models [19.4] ローカルSGDのような既存の頻繁な通信方式は、追加状態のため、自明に適用できない。
Desynced Low Communication Adaptives (DES-LOC)を提案する。
DES-LOCは、ファンデーションモデルトレーニングのためのスケーラブルで、帯域効率が高く、フォールトトレラントなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:32:33 GMT)
Reinforcement Learning with Verifiable Rewards: GRPO's Effective Loss, Dynamics, and Success Amplification [19.3] Group Relative Policy Optimizationが最近導入され、DeepSeek-R1モデルのトレーニングに成功している。
この論文では、検証可能な報酬を持つGRPOは、Kulback--Leibler が対照的な損失を正則化できることを示す。
固定点$p*$が$p_textref$より大きいことが保証され、GRPOがポリシーの成功確率を効果的に増幅することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:22:18 GMT)
Uncertainty Quantification with Proper Scoring Rules: Adjusting Measures to Prediction Tasks [19.2] 本研究では,(厳密な)適切なスコアリング規則,特定の種類の損失関数を,分散成分とエントロピー成分に分解して不確実性の尺度を提案する。
これは不確実性定量化のための柔軟なフレームワークをもたらし、異なる損失(スコアリングルール)でインスタンス化できる。
この柔軟性は確かに有利であることを示し、特に、選択予測のタスクを分析し、スコアリングルールがタスクの損失と理想的に一致することを示します。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:22:53 GMT)
Beyond External Monitors: Enhancing Transparency of Large Language Models for Easier Monitoring [18.8] 大規模言語モデル(LLM)はますます有能化しつつあるが、その思考と意思決定プロセスのメカニズムはいまだ不明である。
本稿では,LCMの透明性を向上し,モニタが不適切かつ敏感な行動を特定するのに役立つ新しい方法TELLMEを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:27:44 GMT)
Odysseus Navigates the Sirens' Song: Dynamic Focus Decoding for Factual and Diverse Open-Ended Text Generation [18.8] 大規模言語モデル(LLM)は、事実的正確かつ多様な様々なオープンエンドアプリケーションにまたがるテキストを生成するためにますます必要とされる。
我々は、新たなデータや知識、モデルを必要とすることなく、このトレードオフを解決する新しいプラグイン・アンド・プレイアプローチであるDynamic Focus Decoding (DFD)を紹介します。
DFDはレイヤ間の分布差に基づいてデコード焦点を適応的に調整し、LLM内の事実知識のモジュール的および階層的性質を活用する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:58:37 GMT)
BLUR: A Benchmark for LLM Unlearning Robust to Forget-Retain Overlap [18.7] 機械学習は、大規模な言語モデル(LLM)の安全性を向上させる可能性を秘めている。
非学習における鍵となる課題は、忘れられた品質(事実上望ましくない情報)のバランスをとることと、品質を維持すること(他の一般的なタスクにおいて優れたパフォーマンスを維持すること)である。
LLM アンラーニングのためのベンチマークである $textttBLUR$ を提示する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:09:04 GMT)
Preference Learning with Response Time [18.7] 応答時間情報をバイナリ選択データとともに組み込む新しい手法を提案する。
我々は、報酬モデル学習のためのオラクル収束率を達成するニーマン直交損失関数を開発する。
我々の実験は、画像よりも好み学習の文脈における理論的知見を検証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:55:54 GMT)
Solving Empirical Bayes via Transformers [18.7] この研究は、最も古い統計問題の1つを解決するために、現代のAIツール(トランスフォーマー)を適用している。
トランスモデルは、合成生成されたペアのセット$(X,theta)$で事前訓練され、未知の$pi$に適応することで、コンテキスト内学習(ICL)を学習する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:52:33 GMT)
Evaluation Hallucination in Multi-Round Incomplete Information Lateral-Driven Reasoning Tasks [18.6] 本研究は,既存手法の限界に対する新たな知見を明らかにする。
本稿では,推論経路の検査,多変量評価指標,人的性能との比較分析など,一連の評価基準を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:17:34 GMT)
BatteryLife: A Comprehensive Dataset and Benchmark for Battery Life Prediction [18.4] バッテリライフ予測(Battery Life Prediction, BLP)のための包括的なデータセットとベンチマークであるバッテリライフを提案する。
BatteryLifeは16のデータセットを統合し、前回の最大のデータセットの2.5倍のサンプルサイズを提供する。
BatteryLifeは、亜鉛イオン電池、ナトリウムイオン電池、そして業界でテストされているリチウムイオン電池のバッテリー寿命データセットを初めてリリースした。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:10:48 GMT)
Quantum Kernel Learning for Small Dataset Modeling in Semiconductor Fabrication: Application to Ohmic Contact [18.4] 我々は、浅いポーリZ特徴写像とトレーニング可能な量子カーネルアライメント層を組み合わせた量子カーネルアライメント回帰器(QKAR)を開発した。
QKARは、古典的なベースラインを複数のメトリクスで一貫して上回る。
これらの結果は、注意深く構築されたQMLモデルが、データ拘束型半導体モデリングにおいて予測上の利点をもたらすことを示唆している。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:40:06 GMT)
Reinforced Reasoning for Embodied Planning [18.4] 身体的計画では、エージェントは動的視覚観察と自然言語の目標に基づいて、一貫性のある多段階決定を行う必要がある。
具体的計画にR1スタイルの推論強化をもたらす強化微調整フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:21:37 GMT)
Test-Time Adaptation of Vision-Language Models for Open-Vocabulary Semantic Segmentation [18.3] テスト時間適応は、画像分類のための視覚言語モデルの文脈に広く関心を集めている。
本稿では,テスト時間中にセグメンテーションに適応する新しいTTA手法を提案する。
当社のアプローチは,任意のセグメンテーションネットワークのプラグアンドプレイとして使用することができ,追加のトレーニングデータやラベルは必要とせず,単一のテストサンプルでも有効である。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:24:47 GMT)
Quantifying the Impact of Motion on 2D Gaze Estimation in Real-World Mobile Interactions [18.3] 本稿では,ユーザの移動度と行動がモバイル視線追跡精度に与える影響を実証的に示す。
頭部距離、頭部ポーズ、装置の向きは、正確性に影響を与える重要な要因である。
発見は、より堅牢で適応的な視線追跡システムの必要性を強調している。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:41:19 GMT)
Orca: Browsing at Scale Through User-Driven and AI-Facilitated Orchestration Across Malleable Webpages [18.3] プロトタイプのWebブラウザであるOrcaとの新しいインタラクションを提示する。
Orcaは、大規模にWebコンテンツの探索、運用、組織化、合成をサポートする。
評価の結果,情報収集,ユーザコントロールの強化,およびWeb上のより広い情報空間における感覚形成の柔軟性向上に対する「期待」が明らかにされた。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:13:39 GMT)
Revisiting Feature Interactions from the Perspective of Quadratic Neural Networks for Click-through Rate Prediction [18.2] 二次ニューラルネットワーク(QNN)の観点からアダマール製品(HP)を再考する
我々は,QNNが機能空間を拡大し,活性化関数に頼らずにスムーズな非線形近似を提供する能力を明らかにする。
本稿では,CTR予測タスクに適した新しいニューロン形式QNN-alphaを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:16:45 GMT)
What Needs Attention? Prioritizing Drivers of Developers' Trust and Adoption of Generative AI [18.1] 我々は、GenAIに対する信頼と養子縁組の意図に影響を与える要因の理論モデルを開発した。
我々は,genAIのシステム/アウトプットの品質,機能的価値,目標維持が開発者の信頼に大きく影響していることを発見した。
我々は,人間とAIのインタラクションを効果的かつ信頼性が高く,包括的に行うために,今後のgenAIツール設計を導くための提案を行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:36:52 GMT)
The Empirical Mean is Minimax Optimal for Local Glivenko-Cantelli [18.1] 実験平均推定器(EME)の均一収束速度を研究対象とする,最近導入された局所Glivenko-Cantelli設定について再検討する。
本研究では, 任意の推定器がEMEだけでなく, 任意の推定器を許すような設定の一般化について検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:06:14 GMT)
MoRE: A Mixture of Low-Rank Experts for Adaptive Multi-Task Learning [18.0] マルチタスクのためのMixture of Low-Rank Experts (MoRE)を提案する。
各タスクに個別のLoRAを使う代わりに、異なるタスクでLoRAモジュールの異なるランクを調整します。
また、タスクごとに適切な専門家を選択するために、新しい適応的なランクセレクタを設計する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:32:09 GMT)
Efficient Ensemble for Fine-tuning Language Models on Multiple Datasets [17.8] 量子化LoRAのような既存の方法は、単一のデータセットに適応する際に効率的である。
タスク毎に1つのアダプタではなく、複数の小さなアダプタのアンサンブルを提案する。
我々のアプローチでは、QLoRAよりも10%高い平均テスト精度が提供され、わずか9%以上のFLOPが提供されます。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:27:08 GMT)
Concentrate on Weakness: Mining Hard Prototypes for Few-Shot Medical Image Segmentation [17.6] Few-Shot Medical Image (FSMIS) は、少数の注釈付き画像からセグメント化を行うモデルを訓練するために広く使われている。
我々は、明確なセグメンテーション境界に不可欠な、より弱い特徴にもっと注意を払うことを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:22:05 GMT)
Beyond path selection: Better LLMs for Scientific Information Extraction with MimicSFT and Relevance and Rule-induced(R$^2$)GRPO [17.6] RLVR(Reinforcement Learning with Verifiable Rewards)を用いた強化学習で訓練されたLarge Language Models (LLM)は、数学タスクの推論能力を改善することなく推論経路を洗練する。
我々は、SFTとRLVRの両方が、SciIEに基づく簡単な方法で推論経路を洗練し、推論能力を向上させることができると論じている。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:47:46 GMT)
THINK-Bench: Evaluating Thinking Efficiency and Chain-of-Thought Quality of Large Reasoning Models [17.6] 大きな推論モデル(LRM)は複雑なタスクにおいて顕著なパフォーマンスを達成しており、しばしば従来の大言語モデル(LLM)よりも優れています。
再考は計算効率を著しく制限する。
LRMの推論効率を評価するためのベンチマークであるThink-Benchを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:41:14 GMT)
CoC: Chain-of-Cancer based on Cross-Modal Autoregressive Traction for Survival Prediction [17.6] 我々は,生存予測を行うために,3つの臨床的モダリティと言語を含む4つのモダリティを最初に検討した。
臨床データを原特徴としてエンコードし,ドメイン固有の知識を学習に用いた。
相互学習の観点では,言語を用いて生の特徴を刺激し,相乗的表現のための自己回帰的相互トラクションモジュールを導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:11:49 GMT)
Towards Large Reasoning Models for Agriculture [17.6] 農業の意思決定は、複雑な、文脈固有の推論を伴う。
私たちはAgReasonを紹介します。AgReasonは、農業推論のための100の質問で、最初の専門家によるオープンソースの科学ベンチマークです。
また、人間の監視によって生成された44.6K問合せ対の大規模データセットであるAgThoughtsも紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:16:52 GMT)
Investigating Mechanisms for In-Context Vision Language Binding [17.4] VLM(Vision-Language Model)は、画像を認識し、テキストを理解し、両方のモダリティ内で関連性を構築する必要がある。
例えば、「赤いおもちゃの車のイメージ」が与えられたら、このイメージを「車」、「赤いおもちゃ」、「赤い物体」などのフレーズに関連づけるべきである。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:25:43 GMT)
Continual Learning Beyond Experience Rehearsal and Full Model Surrogates [17.2] 深層ニューラルネットワークの継続的な学習は依然として重要な課題である。
既存のソリューションは、経験のリハーサルや完全なモデルサロゲートに頼っていることが多い。
本稿では,経験的リハーサルやフルモデルサロゲートの必要性を解消する,スケーラブルなCLアプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:52:34 GMT)
Causal-PIK: Causality-based Physical Reasoning with a Physics-Informed Kernel [17.2] Causal-PIKは、ベイズ最適化を利用して物理インフォームドカーネルを介して因果相互作用を推論する手法である。
Causal-PIKは最先端の成果よりも優れており、目標を達成するためには少ないアクションを必要とする。
Causal-PIKは、人間の問題解決者であっても、非常に困難なタスクに対して競争力を維持しています。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:51:12 GMT)
A Provable Approach for End-to-End Safe Reinforcement Learning [17.2] 安全強化学習(RL)の長年の目標は、プロセス全体を通してポリシーの安全性を確保することである。
本稿では、オフライン安全なRLと安全なポリシー展開を統合するPLS(Provably Lifetime Safe RL)手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:48:20 GMT)
Guess the Age of Photos: An Interactive Web Platform for Historical Image Age Estimation [17.0] Guess the Age of Photosは、2つのゲーミフィケーションモードで過去の写真を推定するウェブプラットフォームだ。
ワイルドデータセットのDate Estimationの10,150イメージのサブセットを使用する。
113人のユーザーと15,473人のゲームプレイで評価され、このプラットフォームは4.25/5の満足度を得た。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:52:49 GMT)
Structured Memory Mechanisms for Stable Context Representation in Large Language Models [16.9] モデルは明示的なメモリユニット、ゲート書き込み機構、アテンションベースの読み込みモジュールを統合している。
メモリコンテンツの動的更新を可能にするために、忘れ機能が導入される。
このモデルは、テキスト生成の一貫性、マルチターン質問応答の安定性、コンテキスト間推論の精度において明らかな優位性を実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:49:04 GMT)
RenderFormer: Transformer-based Neural Rendering of Triangle Meshes with Global Illumination [16.9] 我々は、シーンの三角形に基づく表現から直接画像をレンダリングするニューラルネットワークレンダリングパイプラインであるRenderFormerを紹介する。
レンダリングに物理中心のアプローチを取るのではなく、シーケンスからシーケンスへの変換としてレンダリングを定式化する。
形状や光輸送の複雑さの異なるシーンでRenderFormerを実演し,評価した。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:20:46 GMT)
Parental Collaboration and Closeness: Envisioning with New Couple Parents [16.9] 私たちは10人の親のカップルとブレインストーミングにシナリオとデザインプローブを使用し、近接性をサポートする技術の可能性を探っています。
本報告では, 親のコペアレント化における現在の技術利用状況と, 親の親の親密性を考慮したコペアレント化技術について考察する。
本研究では,(1)親の能力を支えることによって相互依存を育むこと,(2)親の育児における肯定的な感情や体験,例えば検証や楽しさを融合させることによって,親の親近さを育む技術の可能性について論じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:53:08 GMT)
Seven Security Challenges That Must be Solved in Cross-domain Multi-agent LLM Systems [16.8] 大規模言語モデル(LLM)は、組織の境界を越えて協調する自律エージェントへと急速に進化している。
本稿では、クロスドメインマルチエージェントLLMシステムのセキュリティアジェンダをマッピングする。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:19:03 GMT)
Calibrating quantum gates up to 52 qubits in a superconducting processor [16.8] キャラクタ平均ベンチマークプロトコルを用いて52量子ビットまでのゲート密度をベンチマークする。
我々は、6ビットの平行CZゲートの忠実度を87.65%から92.04%に引き上げ、ゲート相関を3.53%から3.22%に下げる。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:17:00 GMT)
A Task-Driven Human-AI Collaboration: When to Automate, When to Collaborate, When to Challenge [16.7] 性能を改善しつつ、適切な人間とAIの統合が有意義なエージェンシーを維持するかを示す。
この枠組みは、実用的で道徳的に健全な人間とAIのコラボレーションの基礎を築いた。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:22:17 GMT)
GrowSplat: Constructing Temporal Digital Twins of Plants with Gaussian Splats [16.7] 本稿では,3次元ガウススプラッティングとロバストなサンプルアライメントパイプラインを組み合わせることで,植物の時間的デジタルツインを構築するための新しい枠組みを提案する。
オランダの植物エコ・フェノタイピング・センターのデータに対するアプローチを評価し,セコイア種とキノア種の詳細な時間的再構成を実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:00:53 GMT)
CoordField: Coordination Field for Agentic UAV Task Allocation In Low-altitude Urban Scenarios [16.7] 本稿では,複雑な都市環境下での不均一なUAV群をコーディネートするためのコーディネートフィールドエージェントシステムを提案する。
UAV動作とタスク選択を誘導するコーディネーションフィールド機構を提案し,創発的タスクの分散および適応的アロケーションを可能にする。
実験結果から, 動的変化に対するタスクカバレッジ, 応答時間, 適応性の観点から, より優れた性能が得られた。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:31:13 GMT)
Universal Visuo-Tactile Video Understanding for Embodied Interaction [16.6] 本稿では,VTV-LLMについて紹介する。
VTV-LLMは触覚と自然言語のギャップを埋める。
本稿では,VTVによるビジュオ触覚表現の強化を含む新しい3段階トレーニングパラダイムを開発する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:43:01 GMT)
Novelty Detection in Reinforcement Learning with World Models [16.5] 世界モデルを用いた強化学習(RL)は近年大きな成功を収めている。
しかし、突然世界力学や性質が変化した場合、エージェントの性能と信頼性は劇的に低下する。
生成されたワールドモデルフレームワーク内での新規性検出の実装は、デプロイ時にエージェントを保護するための重要なタスクである。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:48:23 GMT)
Efficient Preimage Approximation for Neural Network Certification [16.5] 現実のユースケースでは、パッチ攻撃に対する認証が難しい」
定量的なカバレッジ推定も提供する認証のアプローチのひとつは、ニューラルネットワークの事前イメージを活用することだ。
最先端のPreMAPアルゴリズムを含む事前近似法はスケーラビリティに苦慮する。
本稿では,より厳密な境界,適応的なモンテカルロサンプリング,改良された分岐を含むPreMAPのアルゴリズム改良を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:13:56 GMT)
LLMs Think, But Not In Your Flow: Reasoning-Level Personalization for Black-Box Large Language Models [16.4] 大規模言語モデルの推論レベルパーソナライズのためのフレームワークであるRPMを提案する。
RPMはモデルの推論プロセスとユーザのパーソナライズされたロジックを一致させる。
RPMは応答レベルのパーソナライズ方法よりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:20:32 GMT)
Toward universal steering and monitoring of AI models [16.3] 大規模AIモデルにおける一般概念の線形表現を抽出するためのスケーラブルなアプローチを開発する。
これらの表現がモデルステアリングを実現する方法を示します。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:52:55 GMT)
C-LoRA: Contextual Low-Rank Adaptation for Uncertainty Estimation in Large Language Models [16.3] Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)を微調整するためのコスト効率の良いソリューションを提供する。
LoRAは、データスカースな数ショット設定で過信な予測を生成する。
本研究では,新しい不確実性を認識し,パラメータを効率的に調整する手法として,コンテキスト低ランク適応(textbfC-LoRA)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:57:51 GMT)
CogniBench: A Legal-inspired Framework and Dataset for Assessing Cognitive Faithfulness of Large Language Models [16.3] 既存のベンチマークには、"認知的ステートメント"をマークせずにソース資料をリフレッシュする"実際のステートメント"のみが含まれている。
立法領域において証拠がどのように評価されるかに着想を得て、認知的言明の異なるレベルの忠実さを評価するための厳密な枠組みを設計する。
結果として得られる大規模なCogniBench-Lデータセットは、正確な認知幻覚検出モデルのトレーニングに使用することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:17:19 GMT)
Evaluation of LLMs in Speech is Often Flawed: Test Set Contamination in Large Language Models for Speech Recognition [16.2] 本研究は,LLMプレトレーニングコーパスにLibriSpeechとCommon Voiceの評価セットのかなりの量が現れることを明らかにする。
汚染の影響を測定するために、汚染の有無にかかわらずトレーニングされたLSMを比較した。
その結果,LSMの出力は少量のデータ汚染によってバイアスを受けることができることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:39:59 GMT)
Principled Out-of-Distribution Generalization via Simplicity [16.2] 画像生成における拡散モデルの合成一般化能力について検討する。
我々は,事前定義された簡易度を用いて定量化した簡易度によるOOD一般化の理論的枠組みを開発する。
我々は、真の、一般化可能な、単純なモデルを学ぶための、最初の鋭いサンプル複雑性を保証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:44:10 GMT)
CFP-Gen: Combinatorial Functional Protein Generation via Diffusion Language Models [16.2] CFP-Gen(CFP-Gen)は、結合型タンパク質遺伝子のための新しい拡散言語モデルである。
マルチモーダル条件を機能的、シーケンス的、構造的制約と統合することにより、de novoタンパク質の設計を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:05:46 GMT)
Improving the Variance of Differentially Private Randomized Experiments through Clustering [16.2] 差分的プライベートなメカニズムであるCluster-DPを提案する。
より高品質なクラスタを選択することで,プライバシー保証を損なうことなく,分散ペナルティを低減できることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:53:29 GMT)
Explorer: Scaling Exploration-driven Web Trajectory Synthesis for Multimodal Web Agents [16.2] 我々は,これまでで最大かつ最も多様な軌跡レベルのデータセットを合成するスケーラブルなレシピを開発した。
このデータセットには、49KのユニークなURL、720Kのスクリーンショット、3300万のWeb要素を含む、94K以上の成功したマルチモーダルWebトラジェクトリが含まれている。
我々は、Mind2Web-Live、Multimodal-Mind2Web、MiniWob++のようなオフラインおよびオンライン両方のWebエージェントベンチマークで強力なパフォーマンスを示します。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:42:15 GMT)
Bridging Distribution Shift and AI Safety: Conceptual and Methodological Synergies [16.2] 本稿では,その概念的および方法論的相乗効果の包括的分析を通じて,配電シフトとAIの安全性を橋渡しする。
従来の議論では、狭いケースや非公式なアナロジーに焦点をあてることが多いが、分散シフトの特定の原因ときめ細かいAI安全性の問題との間には、2つのタイプの接続を確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:11:30 GMT)
HASH-RAG: Bridging Deep Hashing with Retriever for Efficient, Fine Retrieval and Augmented Generation [16.1] Hash-RAGは、ディープハッシュ技術とシステマティック最適化を統合するフレームワークである。
このハッシュベースの効率的な検索フレームワークを基盤として,きめ細かなチャンクの基盤を確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:35:51 GMT)
Go With the Flow: Fast Diffusion for Gaussian Mixture Models [16.1] シュロディンガーブリッジ (Schrodinger Bridges, SBs) は、有限時間で操る拡散過程であり、与えられた初期分布を、適切なコスト関数を最小化する。
そこで本研究では,低次元問題を解くための一組の実行可能なポリシーの解析的パラメトリゼーションを提案する。
本稿では,オートエンコーダの潜伏空間における画像から画像への変換,マルチマージ運動量SB問題を用いたセルダイナミクスの学習など,低画像化におけるこのアプローチの可能性を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:50:00 GMT)
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on [16.1] 大規模なビデオ拡散変換器上に構築された仮想仮想試行フレームワークMagicTryOnを提案する。
我々は、U-Netアーキテクチャを拡散変換器に置き換え、ビデオの服飾一貫性をモデル化するために完全な自己アテンションを組み合わせる。
提案手法は,既存のSOTA法を総合評価で上回り,現場シナリオに一般化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:45:16 GMT)
PGLearn -- An Open-Source Learning Toolkit for Optimal Power Flow [16.0] 本稿では、PGLearnについて紹介する。PGLearnは、機械学習(ML)のための標準化されたデータセットと評価ツールの総合的なスイートで、OPF(Optimal Power Flow)の問題に対処する。
オープンで標準化されたデータセットと評価メトリクスを促進することで、PGLearnは最適な電力フロー問題に対する機械学習アプリケーションの研究とイノベーションを民主化し、加速することを目指している。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:10:04 GMT)
What Makes for Text to 360-degree Panorama Generation with Stable Diffusion? [16.0] 従来の低ランク適応技術を用いてパノラマ画像を生成することが可能であった。
我々はUniPanoと呼ばれるシンプルなフレームワークを導入し、将来の研究のエレガントなベースラインを確立することを目的としている。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:54:04 GMT)
ACE: Exploring Activation Cosine Similarity and Variance for Accurate and Calibration-Efficient LLM Pruning [15.9] 本研究では,高速刈り出し性能と高速刈り出し速度を同時に達成する効率的かつ効率的な刈り出し法を提案する。
実験結果から, 本手法は, パープレキシティの最大18%, プルーニング時間の最大63%低減を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:25:16 GMT)
Xinyu AI Search: Enhanced Relevance and Comprehensive Results with Rich Answer Presentations [15.9] Xinyu AI Searchは、クエリ分解グラフを組み込んだ新しいシステムで、複雑なクエリを動的にサブクエリに分割する。
検索パイプラインは多ソースアグリゲーションとクエリ拡張によって多様性を高め、フィルタと再ランク戦略は通過妥当性を最適化する。
Xinyu AI Searchは、人間の評価において8つの既存の技術を上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:30:22 GMT)
STDR: Spatio-Temporal Decoupling for Real-Time Dynamic Scene Rendering [15.9] 既存の3DGSに基づく動的再構成法は、しばしばtextbfSTDR(リアルタイムレンダリングのための空間結合デテンポラル)に悩まされる
実時間レンダリングのためのテキストbfSTDR (Spatio-coupling DeTemporal for Real-time rendering) を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:26:41 GMT)
Pure Exploration with Infinite Answers [15.8] 正解の集合が無限である可能性のある探索問題について検討する。
これらの問題に対して、インスタンス依存の低い境界を導出します。
我々は,Sticky-Sequence Track-and-Stopというフレームワークを提案し,Track-and-StopとSticky Track-and-Stopの両方を一般化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:23:36 GMT)
Non-Asymptotic Analysis of (Sticky) Track-and-Stop [15.8] 純粋な探索問題では、統計学者が順次情報を収集し、いくつかの未知の環境に関する質問に答える。
Track-and-Stopアルゴリズムはこれらの問題を解決する先駆的な手法である。
両アルゴリズムに漸近的でない保証を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:26:55 GMT)
TensorShield: Safeguarding On-Device Inference by Shielding Critical DNN Tensors with TEE [15.7] 既存の知恵は信頼された実行環境(TEE)内にモデルをデプロイする
本論文は,MS と MIA を完全に防御しながらモデルの部分テンソルを遮蔽する,最初の効率的なデバイス上の推論作業であるShield とのギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:24 GMT)
Using LLMs to Advance the Cognitive Science of Collectives [15.7] LLMは個人の認知の研究を変革しているが、集団認知の研究への応用は過小評価されている。
我々は、LCMが集団の研究を妨げる複雑さにどのように対処できるかを説明し、新しい方法を保証する可能性のあるリスクを提起する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:15:46 GMT)
Resolving Lexical Bias in Model Editing [15.7] 本稿では,編集の正確な局所化を容易にする不整合表現空間を学習するための原則的アプローチを提案する。
提案手法は,従来の手法よりも推論時の計算効率が良く,最先端のモデル編集結果が得られる。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:28:19 GMT)
Measuring Sycophancy of Language Models in Multi-turn Dialogues [15.5] SYCON Benchは、マルチターン・自由形式の会話環境におけるサイコフィナンシーを評価するための新しいベンチマークである。
SYCON Benchを3つの現実シナリオにわたる17の大規模言語モデルに適用すると、梅毒は相変わらず障害モードであることがわかる。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:05:46 GMT)
Learning Fine-Grained Geometry for Sparse-View Splatting via Cascade Depth Loss [15.4] 粗い部分から細かい部分まで幾何を段階的に洗練する深度監視フレームワークである階層深度誘導平滑化(HDGS)を導入する。
マルチスケールの奥行き整合性を実現することにより,スパースビューのシナリオにおける構造的忠実度を大幅に改善する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:16:42 GMT)
Tell me Habibi, is it Real or Fake? [15.3] コードスイッチング(英語版)、特にアラビア語と英語の間では、アラブ世界では一般的であり、デジタル通信で広く使われている。
textbfArEnAVは、音声中のコードスイッチング、方言のバリエーション、モノリンガルのアラビアコンテンツを含む、アラビア語と英語の音声・視覚の大規模ディープフェイクデータセットである。
本データセットは4つのText-To-Speechモデルと2つのリップ同期モデルを統合し,多言語マルチモーダルディープフェイク検出の包括的解析を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:54:36 GMT)
A Closer Look on Memorization in Tabular Diffusion Model: A Data-Centric Perspective [15.3] 生成したサンプルがレプリカとしてフラグ付けされている回数に基づいて,実サンプル毎のメモリ化を定量化する。
経験的分析により,暗記回数の重み付き分布が明らかとなった。
モデルに依存しない2段階緩和法であるDynamicCutを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:06:00 GMT)
In-context Language Learning for Endangered Languages in Speech Recognition [15.3] In-context Learning (ICL) を用いて,大規模言語モデル (LLM) が未知の低リソース言語を学習できるかどうかを検討する。
ICLは、これらの言語に特化して訓練された専用言語モデルに匹敵する、あるいは超越したASR性能を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:11:15 GMT)
A Novel Characterization of the Population Area Under the Risk Coverage Curve (AURC) and Rates of Finite Sample Estimators [15.3] AURC(Area Under the Risk-Coverage Curve)は、SCシステムの性能を評価するための最前線評価指標として登場した。
有限サンプルシナリオに対する実験的なAURCプラグイン推定器を導出する。
複数のデータセットにまたがる実験により,推定器の有効性を実証的に検証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:59:33 GMT)
SpeechVerifier: Robust Acoustic Fingerprint against Tampering Attacks via Watermarking [15.3] 本稿では,公開音声のみを用いて,音声の整合性を積極的に検証するSpeechVerifierを提案する。
音声フィンガープリントと透かしにインスパイアされたSpeechVerifierは、(i)効果的に改ざん攻撃を検知し、(ii)良性操作に頑健であり、(iii)公開音声のみに基づいて整合性を検証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:20:33 GMT)
Enhancing Retrieval for ESGLLM via ESG-CID -- A Disclosure Content Index Finetuning Dataset for Mapping GRI and ESRS [15.2] 気候変動は、組織のプラクティスにおける透明性と説明責任の必要性を増している。
Global Reporting Initiative(GRI)やEuropean Sustainability Reporting Standards(ESRS)といったフレームワークはESGレポートの標準化を目指している。
企業報告スタイルにおけるESG文書の相当な長さと可変性のため、包括的なレポートの生成は依然として困難である。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:06:41 GMT)
X-Factor: Quality Is a Dataset-Intrinsic Property [15.2] モデルアーキテクチャ、データセットサイズ、クラスバランスの3つの要因がテスト時のパフォーマンスに影響を与えることが示されているが、完全には説明できない。
データセットの品質は、データセットの構成クラスの品質という、より基本的なものの創発的な特性であることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:41:37 GMT)
BOFormer: Learning to Solve Multi-Objective Bayesian Optimization via Non-Markovian RL [15.1] 我々は,汎用的なQ-ラーニングフレームワークを提案し,このフレームワークをMOBOのシーケンス・モデリングによりサブスタンス化する textitBOFormer を提案する。
広範な評価により,BOFormerは,ベンチマークルールベースのアルゴリズムや学習ベースのアルゴリズムよりも常に優れていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:00:50 GMT)
Enhancing Lifelong Multi-Agent Path-finding by Using Artificial Potential Fields [15.1] MAPFアルゴリズムにAPFを組み込む手法を提案する。
APFはMAPFにとって有益ではないが、LMAPFのシステム全体のスループットは最大で7倍に向上する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:13:10 GMT)
Self-Critique and Refinement for Faithful Natural Language Explanations [15.0] 本稿では,自然言語解説の自己批判と再定義について紹介する。
このフレームワークは、モデルが自身の説明の忠実さを改善することを可能にする。
SR-NLEは不誠実度を著しく低下させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:08:42 GMT)
Understanding Model Ensemble in Transferable Adversarial Attack [14.9] まず、逆転送可能性の誤差を測定するために、転送可能性誤差を定義する。
次に、転送可能性エラーを脆弱性、多様性、定数に分解する。
本稿では,情報理論における最新の数学的ツールを用いて,複雑性と一般化項を用いて伝達可能性誤差を限定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:41:05 GMT)
Permissioned LLMs: Enforcing Access Control in Large Language Models [14.9] PerLM(Permissioned LLM)は、クエリ応答の組織データアクセス制御構造を重畳する。
PermLLMメカニズムは、望まれるアクセス制御を実現するために、効率的なファインチューニングの上に構築される。
4つの公開データセットに対する広範な実験により,PermLLM機構の有効性を実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:47:02 GMT)
From Motion to Behavior: Hierarchical Modeling of Humanoid Generative Behavior Control [14.9] 我々は、認知科学にインスパイアされた人間の行動生成から人間の行動モデリングへと一歩前進する。
我々は,多種多様な人間の動作を多種多様な高レベルな意図によってモデル化する,生成行動制御(GBC)と呼ばれる統一的なフレームワークを提案する。
実験により、GBCはより多様で目的のある高品質な人間の動きを10*長めの地平線で生成できることが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:21:33 GMT)
RePaViT: Scalable Vision Transformer Acceleration via Structural Reparameterization on Feedforward Network Layers [14.9] 我々は、注意層ではなく、フィードフォワードネットワーク(FFN)層が視覚変換器(ViT)の推論遅延の主な要因であることを明らかにした。
本研究では,テスト中の効率的なFFN層に対するポストトレーニング後構造的再パラメータ化を容易にする新しいチャネルアイドル機構を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:27:18 GMT)
Can Code-Switched Texts Activate a Knowledge Switch in LLMs? A Case Study on English-Korean Code-Switching [14.8] 近年の大規模言語モデル (LLM) は多言語能力を示すが, コーパスの訓練において英語が支配的であったため英語中心である。
Code-switching (CS) は、多言語話者が会話の中で言語を交互に交互に話す現象であり、微妙な文化的・言語的なニュアンスを伝えることができる。
その結果,CSは英語のテキストと比較して,特に言語固有の領域において,LSM内の知識を忠実に活性化することができることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:49:15 GMT)
Prototype Embedding Optimization for Human-Object Interaction Detection in Livestreaming [14.8] 人-物体相互作用検出(PeO-HOI)のためのプロトタイプ組込み最適化を提案する。
プロトタイプ埋め込み最適化は、オブジェクトバイアスがHOIに与える影響を軽減するために採用されている。
その結果,提案手法の精度は37.19%@full, 51.42%@non-rare, 26.20%@rareと推定された。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:19:37 GMT)
Towards a More Generalized Approach in Open Relation Extraction [14.8] 本稿では,ラベルのないデータを既知のインスタンスと新規インスタンスの混在とみなす,一般化されたOpenRE設定を提案する。
3つのベンチマークデータセットの実験により、MixOREは既知の関係分類と新しい関係クラスタリングにおいて競争ベースラインを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:21:54 GMT)
MapStory: LLM-Powered Text-Driven Map Animation Prototyping with Human-in-the-Loop Editing [14.7] 本研究では,自然言語テキストから直接地図アニメーションシーケンスを生成するアニメーションツールであるMapStoryを紹介する。
ユーザ記述のスクリプトが与えられた場合、MapStoryはエージェントアーキテクチャを活用してシーンのブレークダウンを自動的に生成し、スクリプトを主要なアニメーションビルディングブロックに分解する。
システムの設計とアーキテクチャについて詳述し、プロのアニメーターとの形式的なインタビューと200本の既存の地図アニメーションビデオの分析から情報を得た。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:36:08 GMT)
A Variational Perspective on Generative Protein Fitness Optimization [14.7] 本稿では,適合度最適化における変動的視点である変分潜時生成タンパク質最適化(VLGPO)を紹介する。
本手法は, タンパク質配列を連続潜伏空間に埋め込んで, 適合度分布からの効率的なサンプリングを可能にする。
VLGPOは、複雑さの異なる2つの異なるタンパク質ベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:26:27 GMT)
ALPS: Attention Localization and Pruning Strategy for Efficient Alignment of Large Language Models [14.7] 下流タスクに対する汎用大規模言語モデル(LLM)の調整は、しばしばかなりの訓練調整コストを発生させる。
我々は、最もタスクに敏感なアテンションヘッドをローカライズし、それらをプーンする効率的なアルゴリズムであるtextittextbfAttention textbfLocalization と textbfPruning textbfStrategy (textbfALPS)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:41:12 GMT)
Domaino1s: Guiding LLM Reasoning for Explainable Answers in High-Stakes Domains [14.6] この作業では、ドメインタスクに対する大きな言語モデルの推論機能を強化するDomain$o1$sを導入している。
ドメイン固有の推論ステップを活性化する微調整モデルのために,CoT-stock-2kおよびCoT-legal-2kデータセットを構築した。
また、ドメインモデルの説明可能性を評価するための新しい指標であるPROOF-Scoreを導入し、よりリッチな評価次元で従来の精度メトリクスを補完する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:18:34 GMT)
Overcoming the Machine Penalty with Imperfectly Fair AI Agents [14.6] 人間は機械と協力する傾向があり、機械ペナルティとして知られる現象である。
大規模言語モデルを用いたAIエージェントは,コミュニケーションを伴うソーシャルジレンマゲームにおいて,このペナルティを克服できることを示す。
分析によると、公正なエージェントは人間の参加者と同様、時にはゲーム前協力の約束を破るが、それでも効果的な社会規範として協力を確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:01:48 GMT)
SimProcess: High Fidelity Simulation of Noisy ICS Physical Processes [14.5] インダストリアル・コントロール・システムズ(ICS)は電力網や水処理プラントなどの重要なインフラを管理している。
既存のミツバチはICSの物理的過程を再現するのに苦労し、検出しにくい。
シムプロス(SimProcess)は、実世界の物理プロセスと密接な類似性を評価することで、ICSシミュレーションの忠実度をランク付けする新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:54:23 GMT)
Pre-training for Recommendation Unlearning [14.5] UnlearnRecはモデルに依存しない事前学習パラダイムであり、効率的な未学習操作のためのシステムを準備している。
本手法は,再学習手法に比べて10倍以上の高速化を実現した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:57:11 GMT)
PreP-OCR: A Complete Pipeline for Document Image Restoration and Enhanced OCR Accuracy [14.5] PreP-OCRは、文書イメージの復元と意味認識後OCR修正を組み合わせた2段階のパイプラインである。
原画像上のOCRと比較して,PreP-OCRは文字誤り率を63.9-70.3%削減する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:04:19 GMT)
Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond [14.4] 本稿では、長い推論モデルをトレーニングするためのオープンソースのスイートであるLight-R1を紹介する。
カリキュラムの学習は、多段階のポストトレーニングと組み合わせて、データの難易度を徐々に高めていく。
最終的なLight-R1-14B-DSは,AIME24と25のスコアが74.0,60.2の14Bモデル間でSOTA性能を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:32:29 GMT)
Causality and "In-the-Wild" Video-Based Person Re-ID: A Survey [14.4] ビデオベースの人物識別(Re-ID)は、目覚ましいベンチマークパフォーマンスにもかかわらず、実際のデプロイメントでは不安定である。
本研究は,従来の相関に基づくアプローチの原則的代替として,因果推論の新たな役割について考察する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:53:23 GMT)
GraphNarrator: Generating Textual Explanations for Graph Neural Networks [14.4] グラフニューラルネットワークのための自然言語説明を生成するための最初の方法であるGraphNarratorを提案する。
モデルを訓練するための基礎的真理説明の欠如に対処するために、まず、正当性に基づく説明からモデルの判断を捉える擬似ラベルを生成することを提案する。
高品質な擬似ラベルを使用して、エンド・ツー・エンドの説明生成モデルを訓練する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:45:19 GMT)
The quest for the GRAph Level autoEncoder (GRALE) [14.3] GRALEは、様々なサイズのグラフを共有埋め込み空間にエンコードし、デコードする新しいグラフオートエンコーダである。
シミュレーションおよび分子データに関する数値実験において、GRALEは、広範囲の下流タスクに適用可能な、非常に一般的な事前学習を可能にしていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:37:33 GMT)
Experience Retrieval-Augmentation with Electronic Health Records Enables Accurate Discharge QA [14.3] RAGは、事実の医療知識を提供するために広く応用されている。
ケースベースの知識は効果的な医学的推論に不可欠である。
電子健康記録に基づくExpRAGフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:49:23 GMT)
Generative Framework for Personalized Persuasion: Inferring Causal, Counterfactual, and Latent Knowledge [14.3] 代替システム応答の効果を調べるための仮説シナリオを作成する。
我々は、ユーザとシステム発話間の戦略レベルの因果関係を特定するために因果発見を用いる。
対実データに基づいてシステム応答を選択するためのポリシーを最適化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:37:07 GMT)
Is Noise Conditioning Necessary? A Unified Theory of Unconditional Graph Diffusion Models [14.2] 本研究では,ベルヌーイのエッジフリップの破損に着目した理論的枠組みを開発し,結合構造帰属雑音を含むより複雑なシナリオを包含するように拡張する。
以上の結果から,グラフデータ自体の高次元的な性質は,デノナイズ処理に十分な情報を符号化することが多いことが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:31:07 GMT)
Align-DA: Align Score-based Atmospheric Data Assimilation with Multiple Preferences [14.2] データ同化は、部分的および雑音的な観測と事前のモデル予測を組み合わせることで、力学系の完全な状態を推定することを目的としている。
大気の応用において、この問題は高次元状態空間に対する観測の空間性によって根本的に不均一である。
本稿では、DAを生成過程として定式化し、報酬信号を用いて背景前兆を導出するAlign-DAを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:15:41 GMT)
Vision-Language-Action Model with Open-World Embodied Reasoning from Pretrained Knowledge [14.1] 視覚言語アクション(VLA)モデルは、ロボット工学の次世代モデルとして登場した。
既存のエンドツーエンドのVLAシステムは、モデルが特定のロボットタスクに適応するため、微調整中に重要な機能を失うことが多い。
一般化可能なVLAモデルは、VLMのコア能力を維持し拡張するべきである。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:48:42 GMT)
If Pigs Could Fly... Can LLMs Logically Reason Through Counterfactuals? [14.1] 大きな言語モデル(LLM)は、よく知られた文脈で印象的な推論能力を示すが、文脈がパラメトリックな知識と矛盾する場合に苦労する。
本稿では,反事実的(仮説的知識の衝突)シナリオによる論理的推論を評価するために,CounterLogicを導入する。
本稿では,メタ認知的認識(知識衝突の特定)を推論の前に促進する手法であるSelf-Segregateを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:03:18 GMT)
Are classical deep neural networks weakly adversarially robust? [14.1] 敵の攻撃はますます注目され、古典的なDNNは敵の強固さが弱いと広く認識されている。
本稿では,レイヤワイズ機能を用いて特徴経路を構築する逆例検出と画像認識の手法を提案する。
本手法は,77.64%のクリーン精度と52.94%の対戦訓練法と比較して,計算コストのかかる防衛戦略に頼らずにトレードオフを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:58:05 GMT)
Finite-Sample Convergence Bounds for Trust Region Policy Optimization in Mean-Field Games [14.1] 有限状態空間におけるエルゴード平均フィールドゲーム(MFG)の近似ナッシュ平衡を計算するために設計された新しいアルゴリズムを提案する。
MFG文学における標準的な仮定の下で、我々はMF-TRPOの厳密な分析を行い、その収束に関する理論的保証を確立する。
この研究は、RL法を平均場決定法でブリッジすることでMFG最適化を推し進め、複雑なマルチエージェント問題の解法に理論的に根ざしたアプローチを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:50:25 GMT)
Continuum-armed Bandit Optimization with Batch Pairwise Comparison Oracles [14.1] ここでは,関数の最大値が$f(x)$以上であるような帯域最適化問題について検討する。
このようなペアワイズ比較は、共同価格と在庫補充問題に重要な応用を見出すことを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:41:00 GMT)
Multimodal Forecasting of Sparse Intraoperative Hypotension Events Powered by Language Model [14.0] 術中低血圧 (IOH) は全身麻酔下で頻繁に発生し, 心筋損傷や死亡率の増加などの副作用と強く関連している。
その重要性にもかかわらず、IOH予測はイベントのばらつきと、さまざまな患者にまたがる静的データと動的データを統合することの難しさによって妨げられている。
スパース低血圧事象を正確に識別し識別する多モーダル言語モデルフレームワークである textbfIOHFuseLM を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:44:55 GMT)
High Volume Rate 3D Ultrasound Reconstruction with Diffusion Models [14.0] 三次元超音波は解剖学的構造のリアルタイムな体積可視化を可能にする。
高ボリュームと高画質の両方を達成することは、依然として大きな課題である。
本稿では,拡散モデル(DM)を用いて空間的・時間的分解能の向上を図り,新しい3次元超音波再構成手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:14:12 GMT)
Learning to Steer Learners in Games [13.8] ゲームにおける繰り返しの相互作用を通じて学習アルゴリズムを活用することの問題点を考察する。
まず,学習者が非学習アルゴリズムの一般からアルゴリズムを使用していることを知っていれば,これは不可能であることを示す。
学習者のアルゴリズムが、既知の正則化器とステップサイズで上昇したミラーを解析することにより、より小さなクラスから引き出される場合、このアプローチの有効性を実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:14:44 GMT)
BiMi Sheets: Infosheets for bias mitigation methods [13.8] 機械学習(ML)における公正性の追求において、何百ものバイアス緩和手法が提案されている。
バイアス軽減手法の設計選択を文書化するための,ポータブルで均一なガイドとしてBiMiシートを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:41:35 GMT)
Bridging Arbitrary and Tree Metrics via Differentiable Gromov Hyperbolicity [13.8] 任意の計量空間が与えられると、ツリー計量からの偏差はグロモフの$delta$-hyperbolicityによって定量化できる。
本稿では,差分最適化フレームワーク DeltaZero を導入し,この問題を解決する。
我々の手法は一貫して最先端の歪みを実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:07:43 GMT)
Adapting Pretrained Language Models for Citation Classification via Self-Supervised Contrastive Learning [13.7] サイテーション分類は学術的な分析に欠かせない。
先行研究は、引用分類に基づく微調整事前学習言語モデル(PLM)を示唆している。
我々はこれらの課題を克服するためにPLMに適応する新しいフレームワーク、Citssを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:00:28 GMT)
LiDARDustX: A LiDAR Dataset for Dusty Unstructured Road Environments [13.7] 本稿では,高ダスト条件下での知覚タスクに特化して設計されたLiDARDustXデータセットを紹介する。
我々は最先端の3D検出とセグメント化アルゴリズムの性能を評価するためのベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:59:19 GMT)
CSI-Bench: A Large-Scale In-the-Wild Dataset for Multi-task WiFi Sensing [13.7] CSI(Channel State Information)のきめ細かい変化を捉えたWiFiセンシングは、人間の活動監視のための説得力のある非接触モードとして登場した。
既存のWiFiセンサーシステムは、均一なハードウェアで制御された環境で収集されたデータセットと、日々のアクティビティを反映しない断片化されたセッションベースの記録のために、現実世界の設定を一般化するのに苦労している。
CSI-Benchは,35名の実ユーザを抱えた26の屋内環境において,商用WiFiエッジデバイスを用いて収集した大規模Wildベンチマークデータセットである。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:29:29 GMT)
Point Cloud Synthesis Using Inner Product Transforms [13.6] 内部積を用いた点雲の幾何学的位相特性を符号化する新しい手法を開発した。
我々のエンコーディングは、再構成、生成、推論といった典型的なタスクにおいて、既存の手法よりも桁違いに高速な推論時間で高品質である。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:31:17 GMT)
Diss-l-ECT: Dissecting Graph Data with Local Euler Characteristic Transforms [13.6] グラフ表現学習における表現性と解釈性を高めるために,局所オイラー特性変換(ell$-ECT)を導入する。
本手法は,ノード分類タスクにおける標準グラフニューラルネットワーク(GNN)と比較して,優れた性能を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:34:58 GMT)
IRS: Incremental Relationship-guided Segmentation for Digital Pathology [13.5] 時間的に取得された部分的注釈付きデータに対処するインクリメンタルリレーション誘導学習方式
IRSは、病理学的セグメンテーションのマルチスケールな性質を効果的に扱う。
IRSは、現実世界のデジタル病理アプリケーションにとって堅牢なアプローチである。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:41:56 GMT)
From Reasoning to Learning: A Survey on Hypothesis Discovery and Rule Learning with Large Language Models [13.3] 人工知能(AGI)の追求において、新たな知識を学習し、推論し、生成するモデルの必要性が高まっている。
このサーベイは、大規模言語モデルに基づく仮説発見を調べるための構造化レンズを提供する。
仮説生成、適用、検証における既存の作業を合成し、重要な成果と臨界ギャップの両方を特定します。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:40:02 GMT)
DocReRank: Single-Page Hard Negative Query Generation for Training Multi-Modal RAG Rerankers [13.3] マルチモーダルレトリーバル増強世代(RAG)におけるリランカーの役割
本稿では, 単一ページのハードネガティブなクエリ生成方式を提案する。
LLM-VLMパイプラインを自動で使用し、ページとその肯定的なクエリを与えられた場合、クエリはフォームとコンテキストで可能な限り類似しているように表現し、ページから応答できないハードネガティブを生成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:56:41 GMT)
Decoding Dense Embeddings: Sparse Autoencoders for Interpreting and Discretizing Dense Retrieval [13.3] 本稿では,Dense Passage Retrieval(DPR)モデルに対する新しい解釈可能性フレームワークを提案する。
我々は,各潜伏概念の自然言語記述を生成し,DPRモデルの密埋め込みと問合せ文書類似度スコアの両方の人間の解釈を可能にする。
概念レベルスパース検索(CL-SR)は,語彙や意味的ミスマッチ間の堅牢な性能を維持しつつ,高いインデックス空間と計算効率を実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:50:17 GMT)
Embed Progressive Implicit Preference in Unified Space for Deep Collaborative Filtering [13.2] GNOLR(Generalized Neural Ordinal Logistic Regression)は、ユーザエンゲージメントの構造的進行を捉えるために提案されている。
GNOLRは予測精度を高め、ユーザのエンゲージメントの進行を捉え、検索プロセスを単純化する。
10の実世界のデータセットでの実験では、GNOLRは効率と適応性において最先端の手法を大幅に上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:03:57 GMT)
PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims [13.2] PEDANTICは14万件の米国特許権主張のデータセットで、不確定性の理由が指摘されている。
人間の検証研究は、高品質なアノテーションを生成する際のパイプラインの正確性を確認する。
PEDANTICは特許AI研究者に貴重なリソースを提供し、高度な検査モデルの開発を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:15:18 GMT)
Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation [13.2] 履歴に依存した行動ポリシーを推定すると,真の行動方針がマルコフ的であっても平均2乗誤差が小さくなることを示す。
より長い歴史における行動政策条件として, 変動の持続的減少を示す。
これらの結果は, 連続IS推定器, 二重頑健IS推定器, 辺縁化IS推定器など, その他のOPE推定器に拡張する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:42:20 GMT)
Surf2CT: Cascaded 3D Flow Matching Models for Torso 3D CT Synthesis from Skin Surface [13.2] Surf2CTは、外部表面スキャンと人口統計データから人間の胴体の全3DCTボリュームを合成するフレームワークである。
我々は、マサチューセッツ総合病院(MGH)から得られた3,198個の胴体CTスキャンとAutoPETチャレンジを組み合わせたデータセットでモデルをトレーニングした。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:01:36 GMT)
Enjoying Information Dividend: Gaze Track-based Medical Weakly Supervised Segmentation [13.1] GradTrackは、医師の視線トラック(固定点、期間、時間順を含む)を利用して、WSSSのパフォーマンスを向上させるフレームワークである。
Kvasir-SEGとNCI-I SBIデータセットの実験は、GradTrackが既存の視線ベースの手法を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:05:50 GMT)
Reasoning Is Not All You Need: Examining LLMs for Multi-Turn Mental Health Conversations [13.1] MedAgentは、現実的で多ターンのメンタルヘルス・センスメイキングの会話を合成的に生成する新しいフレームワークである。
医療環境におけるLLMのマルチターン会話能力を評価するための総合的フレームワークであるMultiSenseEvalを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:55:49 GMT)
Scaling Offline RL via Efficient and Expressive Shortcut Models [13.1] ノイズサンプリングプロセスの反復性のため, オフライン強化学習(RL)は依然として困難である。
本稿では、ショートカットモデルを利用してトレーニングと推論の両方をスケールする新しいオフラインRLアルゴリズムであるScalable Offline Reinforcement Learning (SORL)を紹介する。
我々は、SORLがオフラインのRLタスクにまたがって高い性能を達成し、テスト時間計算の増大とともに正のスケーリング挙動を示すことを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:59:22 GMT)
Plug-and-Play Posterior Sampling for Blind Inverse Problems [13.0] 本稿では,ブラインド・プラグ・アンド・プレイ拡散モデル (Blind-DM) を視覚的逆問題解決のための新しいフレームワークとして紹介する。
従来のパラメータ推定手法とは異なり,本手法では,問題を交互に復調シーケンスに再キャストすることで後続サンプリングを行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:53:07 GMT)
Cascaded 3D Diffusion Models for Whole-body 3D 18-F FDG PET/CT synthesis from Demographics [13.0] 人口統計学変数から直接高忠実度3D PET/CTボリュームを合成するための3次元拡散モデルフレームワークを提案する。
初期スコアベース拡散モデルでは、人口統計学的変数のみから低分解能PET/CTボリュームを合成する。
この後、空間分解能を洗練させる超解像残留拡散モデルが続く。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:38:33 GMT)
EventFlow: Forecasting Temporal Point Processes with Flow Matching [13.0] 機械学習では、ニューラルネットワークを使用して自己回帰的に時間点過程をモデル化することが一般的である。
本研究では,時間的ポイントプロセスのための非自己回帰生成モデルであるEventFlowを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:02:08 GMT)
SLoRD: Structural Low-Rank Descriptors for Shape Consistency in Vertebrae Segmentation [13.0] 各種臨床応用にはCT像からの多型椎骨切開が重要である。
既存の単段法と多段法は、不正確な脊椎の分節に悩まされている。
形状整合性のための構造的低ランク記述子に基づく輪郭生成ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:14:35 GMT)
Individualised Counterfactual Examples Using Conformal Prediction Intervals [12.9] 機械学習の分類モデルに典型的な高次元の特徴空間は、決定に多くの反実例を許容する。
我々は,個人の知識を明示的にモデル化し,共形予測間隔の幅によって個人が行う予測の不確実性を評価する。
ハイパーキューブ上に合成データセットを配置し、決定境界を完全に視覚化する。
第2に、この合成データセットにおいて、1つのCPICFが、元のクエリの周囲の個々の知識に与える影響を探索する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:13:52 GMT)
GraphEval: A Lightweight Graph-Based LLM Framework for Idea Evaluation [12.9] アイデア評価のためのグラフベース大規模言語モデルフレームワークであるGraphEvalを提案する。
複雑なアイデアは、小さなLLMからのプロンプトを使用して、理解可能な視点ノードに分解することができる。
作成した視点グラフは、ビューノード間のスコアを便利に伝播させ、アイデア評価の堅牢性を改善するために使用することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:28:39 GMT)
Diffusion Models as Cartoonists: The Curious Case of High Density Regions [12.9] 拡散モデルの高密度領域における画像の種類について検討する。
そこで本研究では,通常の試料より高い確率の画像を連続的に生成する,実用的な高密度サンプリング器を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:16:32 GMT)
Devil is in the Details: Density Guidance for Detail-Aware Generation with Flow Models [12.9] 画像の細部に影響を与えるために遅延コードをスケールする既存のテクニックであるPrefer Guidanceを解析する。
本稿では、サンプリング中に正確な対数密度制御を可能にする、ジェネレーティブODEの原理的な修正である密度誘導法を提案する。
本実験は, 試料の品質を損なうことなく, 画像の細粒度を制御できることを実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:34:22 GMT)
Grassroots Federation: Fair Governance of Large-Scale, Decentralized, Sovereign Digital Communities [12.9] 我々は、大規模な、分散化された、主権のあるデジタルコミュニティの平等主義的な形成と、公正な民主的ガバナンスに対処することを目指している。
草の根連合は、デジタルコミュニティの草の根の形成とその合意連合を通じて進化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:42:03 GMT)
Quantum Monte Carlo algorithm for solving Black-Scholes PDEs for high-dimensional option pricing in finance and its complexity analysis [12.9] 我々は,高次元オプション価格の相関で高次元のブラックショルズPDEを解く量子モンテカルロアルゴリズムを提案する。
有界なペイオフ関数に対しては,従来のモンテカルロ法と比較して,アルゴリズムの高速化が期待できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:05:35 GMT)
Pearl: A Multimodal Culturally-Aware Arabic Instruction Dataset [12.8] パールは、文化的理解のために設計された大規模なアラビアのマルチモーダルデータセットとベンチマークである。
パールは、アラブ諸国全体をカバーする文化的に重要な10の領域にまたがるK以上の例で構成されている。
すべてのデータセットとベンチマークが公開されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:14:47 GMT)
Understanding the behavior of representation forgetting in continual learning [12.8] 継続的な学習シナリオでは、以前に学んだタスクの破滅的な忘れ忘れが重要な問題である。
本稿では,表現を忘れることに関する最初の理論的分析を行い,この分析を用いて連続学習の振る舞いをよりよく理解する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:58:11 GMT)
FaceEditTalker: Interactive Talking Head Generation with Facial Attribute Editing [12.7] FaceEditTalkerは、コントロール可能な顔属性操作を可能にする統合フレームワークである。
高品質な音声同期ヘッドビデオを生成する。
本手法は, リップ同期精度, 映像品質, 属性制御性において, 最先端の手法よりも優れる。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:04:00 GMT)
RAGPPI: RAG Benchmark for Protein-Protein Interactions in Drug Discovery [12.6] タンパク質-タンパク質相互作用(PPI)の生物学的影響の回収は、医薬品開発における標的同定(ターゲットID)に不可欠である。
現在、PPIの生物学的影響を特定するためのベンチマークは存在しない。
RAG Benchmark for PPIs (RAGPPI) は4,420組の質問応答ベンチマークである。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:48:25 GMT)
CoMaPOI: A Collaborative Multi-Agent Framework for Next POI Prediction Bridging the Gap Between Trajectory and Language [12.5] 大きな言語モデル(LLM)は、次のPoint-Of-Interest(POI)予測タスクに新たな機会を提供する。
従来の手法は、次のPOI予測に表面的に適応しており、このタスクにLLMを適用する上での重要な課題をほとんど見落としている。
我々はCoMaPOIという次世代POI予測のための協調型マルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:32:01 GMT)
Privacy-preserving Prompt Personalization in Federated Learning for Multimodal Large Language Models [12.4] フェデレート・プロンプト・パーソナライゼーション(FPP)は、データの均一性と局所的なオーバーフィッティングに対処するために開発された。
我々は、パーソナライゼーションとプライバシ保証を調和させるセキュアなFPPプロトコルSecFPPを提案する。
SecFPPは、プライバシ保護ベースラインと非プライバシ保護ベースラインの両方で著しく優れています。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:09:56 GMT)
A Closer Look at Multimodal Representation Collapse [12.4] モーダリティの崩壊は、あるモーダリティからのノイズが、融合ヘッド内のニューロンの共有セットを介して、他のモーダリティからの予測的特徴によって絡み合っているときに起こることを示す。
本稿では,モダリティの欠如に対処する手法として,モダリティの崩壊を防止するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:31:53 GMT)
Machine Learning Models Have a Supply Chain Problem [12.4] オープンMLモデルの現在のエコシステムには、サプライチェーンの重大なリスクがある、と私たちは主張する。
これには、モデルを悪意のあるものに置き換えるアタッカーが含まれる。
次に、オープンなMLモデルに透明性をもたらすために、Sigstoreをどのように使用できるかを検討します。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:47:14 GMT)
A Survey of Uncertainty Estimation Methods on Large Language Models [12.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示している。
これらのモデルでは、偏見、幻覚、あるいは非現実的な反応が、その流感と現実的な外観によってもたらされる可能性がある。
不確実性推定がこの課題に対処する鍵となる方法である。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:33:52 GMT)
ValueSim: Generating Backstories to Model Individual Value Systems [12.2] 本稿では,個人バックストリーの生成を通じて個々の価値をシミュレートするフレームワークであるValueSimを紹介する。
World Values Surveyから派生した自己構築型ベンチマークでValueSimをテストすると、トップ1の精度が10%以上向上していることがわかる。
さらなる分析により、ユーザーインタラクション履歴の追加が利用可能になると、パフォーマンスが向上し、モデルがペルソナシミュレーション機能を時間とともに改善できることが示される。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:43:16 GMT)
MOSformer: Momentum encoder-based inter-slice fusion transformer for medical image segmentation [12.1] この問題を解決するために,新しいモーメントエンコーダを用いたスライス間核融合トランス (MOSformer) を提案する。
MOSformerは3つのベンチマークデータセット(Synapse、ACDC、AMOS)で評価され、それぞれ85.63%、92.19%、85.43%の新たな最先端のDSCを達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:41:41 GMT)
Taming Transformer Without Using Learning Rate Warmup [11.9] Transformerを大規模にスケールすることは、学習率のウォープのような技術的なトリックを使わずに、非常に難しい作業です。
本稿では,新たな最適化戦略,すなわち重み更新をスムーズに行う。
我々は、ViT、Swin-Transformer、GPTを用いて広範な実験を行い、学習率ウォームアップを使わずに、これらのトランスフォーマーを効果的に安定的に訓練できることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:55:28 GMT)
Task-Driven Implicit Representations for Automated Design of LiDAR Systems [11.9] 本稿では,任意の制約下でのタスク駆動型LiDARシステム設計のためのフレームワークを提案する。
連続した6次元設計空間におけるLiDARの構成を表現し、フローベース生成モデルを用いてタスク固有の暗黙の密度を学習する。
次に、センサを6次元空間のパラメトリック分布としてモデル化し、予測最大化を用いて学習した暗黙密度に適合させることにより、新しいLiDARシステムを合成する。
我々は,顔スキャン,ロボットトラッキング,物体検出などの現実のアプリケーションに触発されたLiDARシステム設計を実現することで,3次元視覚における多様なタスクに対する本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:27:42 GMT)
SDPO: Importance-Sampled Direct Preference Optimization for Stable Diffusion Training [11.9] 逆拡散過程と前方拡散過程のミスマッチに起因する時間ステップ依存性不安定性について検討した。
DPO-C&Mは,不定形タイムステップの切り抜きとマスキングにより安定性を向上させる実用戦略である。
次に、政治外バイアスを完全に補正する目的に重要サンプリングを組み込んだ、原則化されたフレームワークであるSDPOを紹介します。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:11:56 GMT)
Budget-Adaptive Adapter Tuning in Orthogonal Subspaces for Continual Learning in LLMs [11.9] 大規模言語モデル(LLM)は、連続学習(CL)のシナリオにおいて破滅的な忘れ方に悩まされることが多い。
LLMにおける継続学習のためのパラメータ効率の高い新しい手法であるOA-Adapterを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:38:21 GMT)
Latent Beam Diffusion Models for Decoding Image Sequences [11.9] 本研究では,静止空間探索のための新しいビーム探索手法を導入し,全画像列の条件付き生成を可能にする。
固定潜在表現を用いた従来の手法とは異なり,提案手法は最適潜在表現列を動的に探索する。
潜伏復調空間を探索するため、ビームサーチグラフはクロスアテンション機構でプルーニングされる。
人的および自動評価により、ビーム拡散は他のベースライン法よりも優れていることが確認される。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:52:44 GMT)
Reward Generalization in RLHF: A Topological Perspective [11.9] 人的フィードバックからの強化学習における報酬一般化の理論を導入する。
マクロレベルでは、RLHF情報フローを行動分布上の自動符号化プロセスとして表現する。
マイクロレベルでは、データセットトポロジが報酬一般化に与える影響をモデル化するためにベイズネットワークを誘導する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:59:41 GMT)
Global-Local Duality of Energetic Control Cost in Multipartite Quantum Correlated Systems [11.7] マルチパート量子相関系 (MQCS) は様々な量子情報処理に広く利用されている。
ここでは熱浴に弱結合した任意のMQCSの普遍的熱力学関係を明らかにする。
これらの関係を用いて, MQCSsの量子的特徴として, 有限時間での整形制御コストについて, 多部相関の正確な役割を解明する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:56:12 GMT)
Calibrated Value-Aware Model Learning with Stochastic Environment Models [11.6] 我々は、人気の高いMuZero損失を含む、価値認識モデル学習損失の家系を分析した。
これらの損失は、通常用いられるように、無調整の代理損失であり、必ずしも正しいモデルと値関数を回復しないことを意味する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:40:49 GMT)
Solving Inverse Problems with Deep Linear Neural Networks: Global Convergence Guarantees for Gradient Descent with Weight Decay [11.6] 重み劣化で訓練された深い線形ネットワークは,データ内の潜在部分空間構造に自動的に適応することを示す。
これは、重量減衰で訓練された深い線形ネットワークが、データの潜在部分空間構造に自動的に適応することを示す最初の結果である。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:25:56 GMT)
Functional Matching of Logic Subgraphs: Beyond Structural Isomorphism [11.6] 論理回路におけるサブグラフマッチングは多くの電子設計自動化(EDA)アプリケーションの基礎となっている。
本稿では,ある論理関数がより大きな回路内に暗黙的に存在するかどうかを識別する新しい手法である関数部分グラフマッチングの概念を導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:31:49 GMT)
Are Domain Generalization Benchmarks with Accuracy on the Line Misspecified? [11.5] 従来の知恵は、急激な相関関係に依存するモデルは、分配のアウト・オブ・ディストリビューションを一般化できないことを示唆している。
相関関係に対するロバスト性を評価するために広く用いられている多くのベンチマークが不明確であることを示す。
我々は、刺激的な相関性に対する堅牢性がどのように評価されるかを再考する必要性を強調し、フィールドが優先順位付けすべき適切に特定されたベンチマークを特定し、分散シフトの下でロバスト性を有意義に反映する将来のベンチマークを設計するための戦略を列挙する。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:45:19 GMT)
Cooperation of Experts: Fusing Heterogeneous Information with Large Margin [11.5] CoE(Cooperation of Experts)フレームワークは、マルチタイプ情報を統一された異種多重ネットワークにエンコードする。
このフレームワークでは、専用のエンコーダがドメイン固有の専門家として機能し、それぞれが特定の意味空間における異なる関係パターンの学習に特化している。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:31:56 GMT)
Rethinking Gradient-based Adversarial Attacks on Point Cloud Classification [11.4] 勾配に基づく敵攻撃は、点雲分類モデルの堅牢性を評価する主要なアプローチとなっている。
既存の方法はしばしば、点雲の不均一性を考慮していない均一な更新規則に依存している。
攻撃の有効性と非受容性の両方を改善するための2つの新しい戦略を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:55:36 GMT)
Precise In-Parameter Concept Erasure in Large Language Models [11.4] モデルパラメータから概念全体を正確に消去する新しいフレームワークであるPSSCESを提案する。
PISCESはディスタングルモデルを使用して、ベクトルを解釈可能な機能に分解し、ターゲットコンセプトに関連するものを識別し、モデルパラメータから削除する。
実験の結果、PSSCESは先進的消去法よりも効果が緩やかに向上し、目標コンセプトの精度は7.7%にまで低下した。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:58:23 GMT)
CADReview: Automatically Reviewing CAD Programs with Error Detection and Correction [11.3] CADレビュータスクを導入し,潜在的なエラーを自動的に検出し,修正する。
本稿では,プログラムエラーを効果的に検出するCADプログラム修復(ReCAD)フレームワークを提案する。
我々は,CADレビュータスクに対して,20K以上のプログラムイメージペアからなるデータセットCADReviewを作成し,多様なエラーを発生させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:41:00 GMT)
HumanAesExpert: Advancing a Multi-Modality Foundation Model for Human Image Aesthetic Assessment [11.3] HumanBeautyはHuman Image Aesthetic Assessment (HIAA)のために構築された最初のデータセット
HumanAesExpertは人間の画像の美的評価のための強力なビジョン言語モデルである。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:29:58 GMT)
FitCF: A Framework for Automatic Feature Importance-guided Counterfactual Example Generation [11.2] 我々はZeroCFを紹介した。ZeroCFは、特徴帰属法から派生した重要な単語を活用して、反実例を生成するための忠実なアプローチである。
第2に,新たなフレームワークであるFitCFを提案する。このフレームワークは,上述の反事実をラベルフリップ検証によって検証し,実演として挿入する。
We showed the effect of LIME and Integrated Gradients as backbone attribution method for FitCF and found the number of demonstrations have be largest effect on performance。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:18:07 GMT)
AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping [11.2] トランスフォーマーベースのリモートセンシング基礎モデル(RSFM)は、統一された処理能力のため、作物マッピングの可能性を秘めている。
農作物のマッピングに特化して設計された多時間リモートセンシング基盤モデルであるAgriFMを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:24:45 GMT)
On the Surprising Effectiveness of Large Learning Rates under Standard Width Scaling [11.2] 既存の無限幅理論は、大きな学習率で不安定を予測し、安定した学習率で特徴学習を消滅させる。
この相違は,カタパルト効果などの有限幅現象によって完全に説明できないことを示す。
制御された分散状態下でのニューラルネットワークの動作はCE損失では有効であるが,MSE損失では不可能である。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:40:48 GMT)
A Closer Look at the Existing Risks of Generative AI: Mapping the Who, What, and How of Real-World Incidents [11.1] 我々は、生成的AI障害に特化して分類を構築し、それらが引き起こす害にマッピングする。
本報告では、各種類の害、基礎となる障害モード、害のあるステークホルダー、およびそれらの共通する共起事故の頻度について報告する。
私たちの仕事は、政策立案者、開発者、ジェネレーティブAIユーザに実用的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:54:06 GMT)
Credit Risk Identification in Supply Chains Using Generative Adversarial Networks [11.1] 本研究では,サプライチェーンにおける信用リスクの識別を高めるためにGAN(Generative Adversarial Networks)の適用について検討する。
GANは、データの不足と不均衡データセットに関連する課題に対処する、合成クレジットリスクシナリオの生成を可能にする。
GAN生成データを活用することにより、サプライチェーンデータの動的および時間的依存関係を効果的にキャプチャし、予測精度を向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:41:01 GMT)
RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting [11.0] 本稿では,長期的再分析データを用いた新しいディープラーニングモデルであるRiverMambaを紹介する。
これを実現するために、RiverMambaは効率的なMambaブロックを活用し、モデルがグローバルスケールのチャネルルーティングをキャプチャできるようにする。
解析の結果,リヴァーマンバは流出時期やリード時間など,河川流出の確実な予測を行うことが明らかとなった。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:21:58 GMT)
WiseMind: Recontextualizing AI with a Knowledge-Guided, Theory-Informed Multi-Agent Framework for Instrumental and Humanistic Benefits [10.9] WiseMindは、NLPの分野間コンテキスト化フレームワークである。
うつ病、不安症、双極性障害で試験され、診断精度は84.2%に達する。
その結果、知識、プロセス、評価層にまたがる深い文脈化は、ベンチマーク駆動型NLPを臨床的に有意義な影響に変換することができることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:27:05 GMT)
Object-centric Self-improving Preference Optimization for Text-to-Image Generation [10.9] MLLMによるテキスト・画像生成のためのオブジェクト中心の自己改善型優先度最適化フレームワークを提案する。
OSPOは、効率的な選好最適化に欠かせない高品質な選好ペアデータの重要性を強調している。
我々はOSPOを3つの代表的な合成テキスト・イメージ・ベンチマークで検証し、ベースラインモデルよりもかなりの性能向上を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:45:42 GMT)
LoRA-One: One-Step Full Gradient Could Suffice for Fine-Tuning Large Language Models, Provably and Efficiently [10.8] 本稿では,Low-Rank Adaptation (LoRA) を用いた大規模言語モデルを用いて,理論が実用的なアルゴリズムをガイドし,拡張する方法について検討する。
勾配降下の下では、LoRAアダプタは1ステップの完全な微調整勾配の特異部分空間と整列する。
本稿では, 線形収束を構築し, プリコンディショナーを取り入れた理論駆動型アルゴリズムLoRA-Oneを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:34:19 GMT)
Sparsification and Reconstruction from the Perspective of Representation Geometry [10.8] スパースオートエンコーダ (SAE) は機械的解釈可能性において主要なツールである。
本研究は,表現幾何学の観点から,空間の原理を説明する。
具体的には、表現を理解し、表現の制約を取り入れることの必要性を強調している。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:54:33 GMT)
Zero-Shot 3D Visual Grounding from Vision-Language Models [10.8] 3Dビジュアルグラウンド(3DVG)は、自然言語記述を用いて、3Dシーンで対象物を見つけることを目的としている。
SeeGroundは、2Dビジョンランゲージモデル(VLM)を活用するゼロショット3DVGフレームワークで、3D特有のトレーニングの必要性を回避します。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:53:53 GMT)
SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation [10.8] Spiralは、深度、反射率の画像、セマンティックマップを同時に生成する新しいレンジビューLiDAR拡散モデルである。
Semantic KITTIとnuScenesデータセットの実験は、Spralが最小のパラメータサイズで最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:55:35 GMT)
Sun-Shine: A Foundation Large Language Model for Tibetan Culture and Heritage [10.8] チベット文化の最初の大規模言語モデルであるLlama-Sunshine(Sun-Shine)を紹介する。
Sun-Shineはチベット語の言語的特徴のために最先端のモデル最適化アーキテクチャを取り入れている。
また,チベット語テキストを多用した総合データセットであるTIB-STCを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:18:59 GMT)
X-GAN: A Generative AI-Powered Unsupervised Model for Main Vessel Segmentation of Glaucoma Screening [10.6] 本稿では,OCTA画像から主血管を抽出するAIを用いた非教師付きセグメンテーションモデルであるX-GANを提案する。
X-GANはラベル付きデータや高性能コンピューティングリソースに頼ることなく、100%近いセグメンテーション精度を達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:48:48 GMT)
FALCON: An ML Framework for Fully Automated Layout-Constrained Analog Circuit Design [10.6] 本稿では、仕様駆動アナログ回路合成を可能にする統合機械学習フレームワークであるFALCONを紹介する。
FALCONはまず、人間設計でガイドされた性能駆動型分類器を用いて、適切な回路トポロジーを選択する。
次に、独自のエッジ中心グラフニューラルネットワークを使用して、回路トポロジとパラメータをパフォーマンスにマップする。
この推論は、分析方程式の寄生的および周波数依存的な効果から導かれる、異なるレイアウトコストで導かれ、設計規則によって制約される。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:16:08 GMT)
NegVQA: Can Vision Language Models Understand Negation? [10.6] NegVQA(ネグVQA)は、様々な否定シナリオと画像探索分布をカバーする7,379の2項目からなる視覚的質問応答(VQA)ベンチマークである。
我々は,既存のVQAデータセットから質問の否定バージョンを生成するために,大規模な言語モデルを活用してNegVQAを構築する。
我々は、7つのモデルファミリーにわたる20の最先端のビジョン言語モデルを評価し、これらのモデルが否定にかなり苦労していることを見出した。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:58:37 GMT)
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing [10.5] 本稿では,事前学習した流れモデルに対する推論時間スケーリング手法を提案する。
本稿では,SDE に基づく生成,特に分散保存型 (VP) 補間型 (VP) 生成は,フローモデルにおける推論時間スケーリングのための粒子サンプリング法を改善することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:20:39 GMT)
Breaking the Cloak! Unveiling Chinese Cloaked Toxicity with Homophone Graph and Toxic Lexicon [10.5] ソーシャルメディアプラットフォームは、虐待的な言葉や差別的な発言など、有毒なコンテンツの著しい増加を経験している。
既存の方法はほとんどが英語のテキスト用に設計されているが、中国のクロークによる毒性の暴露はまだ解決されていない。
C$2$TUは,中国における有毒物公開のための新規なトレーニングフリーかつプロンプトフリーな方法である。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:58:15 GMT)
Towards Efficient Key-Value Cache Management for Prefix Prefilling in LLM Inference [10.5] 推論ワークロードは高いキャッシュ再利用性を示し、冗長性の低減とスピード向上に効率的なキャッシュが不可欠である。
我々は、公開されているトレースを用いて現実世界のKVCアクセスパターンを分析し、KVCメタデータ管理のためのRedisや最先端RDMAベースのシステムのような商用キーバリューストアを評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:05:55 GMT)
Copresheaf Topological Neural Networks: A Generalized Deep Learning Framework [10.5] 我々は,多種多様なディープラーニングアーキテクチャをカプセル化した,強力かつ統一的なフレームワークであるCTNNを紹介する。
CTNNは、特定のタスクやデータタイプに適したニューラルネットワークアーキテクチャの原則設計に対処する。
構造化データベンチマークによる実験結果から,CTNNは従来のベースラインを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:03:58 GMT)
Enhancing Study-Level Inference from Clinical Trial Papers via RL-based Numeric Reasoning [10.4] 我々はその問題を量的推論の1つとして概念化している。
本研究では,数値データ抽出モデルと効果推定成分からなる数値推論システムを開発する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:59:45 GMT)
DeepRTL2: A Versatile Model for RTL-Related Tasks [10.4] 提案するDeepRTL2は,RTLに関連する生成タスクと埋め込みタスクの両方を統一する汎用大規模言語モデル(LLM)のファミリーである。
幅広いタスクに同時に取り組むことで、DeepRTL2は、EDAのさまざまな課題に対する包括的なソリューションを提供する最初のモデルである。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:28:39 GMT)
Extended Landauer-Büttiker Formula for Current through Open Quantum Systems with Gain or Loss [10.4] 我々は、中間領域での利得または損失を伴う粒子およびエネルギー電流を記述するために、ランダウアー-B"uttiker公式を拡張した。
導出式に基づいて、電流の利得や損失によって引き起こされるいくつかの新しい効果について論じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:30:57 GMT)
An Effective Training Framework for Light-Weight Automatic Speech Recognition Models [10.3] 一つの大モデルから複数の小さなモデルを生成することができる2段階の効率的な表現学習手法を提案する。
提案手法は,単語誤り率を最大12.54%向上させる3倍の学習速度を実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:19:11 GMT)
On the Dynamic Regret of Following the Regularized Leader: Optimism with History Pruning [10.3] FTRL(Follow the Regularized Leader)は、オンライン凸最適化(OCO)のためのフレームワークである。
これまでの研究は、動的環境におけるフレームワークの制限を強調してきた。
我々は,FTRLが将来コストの楽観的な構成と過去のコストの慎重な線形化によって,既知の動的後悔境界を回復できることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:03:15 GMT)
TabXEval: Why this is a Bad Table? An eXhaustive Rubric for Table Evaluation [10.2] テーブルを質的かつ定量的に評価することは重要な課題である。
従来のメトリクスは、微妙な構造と内容の相違を捉えるのに失敗することが多い。
本稿では,マルチレベル構造記述子とコンテキストの微粒化を融合した新しい手法のルーリックを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:50:29 GMT)
Learning A Robust RGB-Thermal Detector for Extreme Modality Imbalance [10.2] RGBサーマル(RGB-T)オブジェクト検出は、熱赤外(TIR)画像を用いてRGBデータを補完し、困難な条件下での堅牢性を改善する。
従来のRGB-T検出器は、両モードが等しく寄与するバランスの取れたトレーニングデータを仮定する。
本稿では,新しいベース・アンド・オシリリア検出器アーキテクチャを提案することで,これらの課題に対処する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:18:55 GMT)
Can NeRFs See without Cameras? [10.2] 我々は、NeRFがマルチパス信号から学習し、環境を「見る」ことができることを示す。
本研究の目的は、家庭内の複数箇所で行われている疎Wi-Fi測定から、家庭の屋内フロアプランを推測することである。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:04:46 GMT)
When Trust Collides: Decoding Human-LLM Cooperation Dynamics through the Prisoner's Dilemma [10.1] 本研究では,大規模言語モデル(LLM)エージェントに対する人間の協調的態度と行動について検討する。
その結果, エージェントアイデンティティがほとんどの協調行動に有意な影響を及ぼすことが明らかとなった。
これらの知見は,自律エージェントとの競争におけるヒト適応の理解に寄与する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:51:40 GMT)
Targeted Unlearning Using Perturbed Sign Gradient Methods With Applications On Medical Images [10.1] 我々は、デプロイ後のモデル修正のための汎用ツールとして、機械学習を再考した。
境界に基づくアンラーニングの2段階最適化法を提案する。
第一次アルゴリズムが解き放たれたときの収束保証を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:36:57 GMT)
ChatPD: An LLM-driven Paper-Dataset Networking System [10.0] ChatPDは学術論文からデータセット情報を抽出するシステムである。
我々のシステムは3つの重要なモジュールで構成されている:textitpaper Collection, textitdataset Information extract, textitdataset entity resolution。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:31:08 GMT)
Efficient Logit-based Knowledge Distillation of Deep Spiking Neural Networks for Full-Range Timestep Deployment [10.0] 従来のニューラルネットワーク(ANN)の代替手段としてスパイキングニューラルネットワーク(SNN)が登場
それにもかかわらず、SNNはANNと比較して正確さに悩まされ、推論タイムステップによるデプロイメントの課題に直面していることが多い。
本研究では, 深部SNNのための新しい蒸留フレームワークを提案し, 特定の再学習をすることなく, フルレンジタイムステップにおける性能を最適化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:23:09 GMT)
Do You See Me : A Multidimensional Benchmark for Evaluating Visual Perception in Multimodal LLMs [10.0] Do You See Me"は,1,758のイメージと2,612の質問を備えた,スケーラブルなベンチマークである。
人間は96.49%の精度を達成し、トップMLLMは50%以下である。
これは、真に堅牢な視覚知覚を持つMLLMに対して、緊急の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:31:32 GMT)
NOCL: Node-Oriented Conceptualization LLM for Graph Tasks without Message Passing [9.9] グラフは、ソーシャルネットワーク、生物学、レコメンデーションシステムといったドメイン間の複雑な相互作用をモデル化するために不可欠である。
従来のグラフニューラルネットワークは教師付き学習に大きく依存しており、ラベルスカースシナリオにおける一般化と適用性を制限している。
我々はこれらの制限を克服するために,ノード指向概念化 LLM (NOCL) を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:48:43 GMT)
Signal attenuation enables scalable decentralized multi-agent reinforcement learning over networks [9.9] マルチエージェント強化学習(MARL)法は通常、エージェントがグローバルな状態観測可能性を楽しむ必要がある。
近年の研究では、エージェント間影響の減衰を前提に、各エージェントの局所的な近傍観測性に置き換えられることが示されている。
本稿では,MARLにおける信号減衰の分散化を,レーダネットワークにおける目標検出のための電力割当を行うための実証的な特別な事例を考慮し,その分散化を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:19:23 GMT)
Synonymous Variational Inference for Perceptual Image Compression [9.7] 本稿では,画像圧縮問題を再解析する同義的変分推論(SVI)手法を提案する。
理想的な同義集合(シンセット)を構築するために、典型的な同義語規準として知覚的類似性を用いる(シンセット)
本稿では,SVIの解析過程に対応する新しい画像圧縮方式を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:03:27 GMT)
Benignity of loss landscape with weight decay requires both large overparametrization and initialization [9.7] 大規模な過度なパラメトリゼーションの下で、風景は、すばやい局地的なミニマを伴わない、良心的になる。
より正確には、この状態において、ほぼ全ての一定の活性化領域は、大域的な最小値を持ち、急激な局所最小値を持たない。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:53:48 GMT)
Identifying critical residues of a protein using meaningfully-thresholded Random Geometric Graphs [9.7] 本稿では, 分子動力学シミュレーションを用いて, タンパク質の臨界残基を認識する3つの方法を提案する。
提案手法は,Random Geometric Graph (RGG) 変数を学習し,各残余変数の状態変数をこのグラフのノードにアタッチし,RGGは各残余ペアの状態変数間の相関行列を用いて学習する。
我々は,全156残基上で定義される全グラフ変数の後続確率と,1残基を除くすべてのグラフとの差をランク付けして,臨界度尺度を開発する。
臨界の第三のパラメトリケーション
論文参考訳(メタデータ) (Wed, 28 May 2025 14:45:33 GMT)
VME: A Satellite Imagery Dataset and Benchmark for Detecting Vehicles in the Middle East and Beyond [9.6] 衛星画像における車両検出は、交通管理、都市計画、災害対応に不可欠である。
現在のモデルは、特に地域によって、現実世界の多様性に苦しむ。
我々は、中東諸国の高解像度衛星画像において、車両検出のために明確に設計された、中東における車両(VME)データセットを提示する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:34:05 GMT)
Private Lossless Multiple Release [9.5] Koufogiannis et al. は Laplace ノイズに基づく微分プライベートなメカニズムに対して $textitgradual release$ result を示した。
より一般的な$textitmultiple release$設定では、アナリストが異なるプライバシパラメータでプライベートリリースを保持します。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:10:27 GMT)
InfoSAM: Fine-Tuning the Segment Anything Model from An Information-Theoretic Perspective [9.5] Segment Anything Model (SAM)は、一般的なタスクにおいて印象的なゼロショット機能を示すが、専門領域では苦労している。
本研究では,SAMの蒸留・保存による微調整を促進する情報理論であるInfoSAMを提案する。
多様なベンチマークによる実験では、InfoSAMが現実世界のタスクにおけるSAMファミリーのパフォーマンスを改善する効果を検証している。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:09:22 GMT)
Flexible Tool Selection through Low-dimensional Attribute Alignment of Vision and Language [9.4] 柔軟なツール選択は、人間が他の種と区別する複雑な認知能力を反映している。
視覚的ツール認識と言語的タスク理解を橋渡しするために,低次元属性表現を用いたフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:06:04 GMT)
LLM-ODDR: A Large Language Model Framework for Joint Order Dispatching and Driver Repositioning [9.4] 配車サービスにおける大規模言語モデル(LLMs)を協調運転者配置(ODDR)に活用する新しい枠組みを提案する。
我々の枠組みは, 従来の手法よりも, 有効性, 異常条件への適応性, 意思決定性において優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:14:55 GMT)
Unifying Continuous and Discrete Text Diffusion with Non-simultaneous Diffusion Processes [9.3] NeoDiffは、離散的アプローチと連続的アプローチの両方の長所を統合する、新しい拡散モデルである。
我々のアプローチは、テキスト生成のためのより原理的で効果的なフレームワークを提供する、離散的かつ連続的な拡散モデルの理論を統一する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:28:52 GMT)
HTMNet: A Hybrid Network with Transformer-Mamba Bottleneck Multimodal Fusion for Transparent and Reflective Objects Depth Completion [9.2] 透明で反射的な物体は深度センサーに重大な課題をもたらす。
本稿では,Transformer,CNN,Mambaアーキテクチャを統合した新しいハイブリッドモデルであるHTMNetを提案する。
本稿では,自己アテンション機構と状態空間モデルに基づく新しいマルチモーダル融合モジュールを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:36:38 GMT)
Risk-Informed Diffusion Transformer for Long-Tail Trajectory Prediction in the Crash Scenario [9.2] 軌道予測法は自動運転技術に広く応用されている。
トレーニングデータにおける重要なシナリオにおける軌道データの欠如は、ロングテール現象につながる。
我々の研究は、軌道予測における長期的課題を克服する手法を拡張している。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:49:36 GMT)
GuessArena: Guess Who I Am? A Self-Adaptive Framework for Evaluating LLMs in Domain-Specific Knowledge and Reasoning [9.2] 対戦型ゲームベースインタラクションに基づく適応評価フレームワークGuessArenaを提案する。
我々のフレームワークは、動的ドメイン知識モデリングとプログレッシブ推論アセスメントをシームレスに統合します。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:43 GMT)
Continuous Thought Machines [9.2] 本稿では、ニューラルネットワークをコア表現として活用するモデルであるContinuous Thought Machine(CTM)を紹介する。
CTMには、(1)ニューロンレベルの時間的処理、(2)ニューロンが独自の重みパラメータを使用して受信信号の履歴を処理する、(2)遅延表現として使用される神経同期という2つの中心的革新がある。
我々は,ImageNet-1K分類,2D迷路の解決,ソート,パリティ,質問応答,RLタスクなど,さまざまな課題にまたがるCTMの性能と汎用性を実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:50:21 GMT)
PAEFF: Precise Alignment and Enhanced Gated Feature Fusion for Face-Voice Association [9.2] 顔と声の関連を学習する課題について検討する。
埋め込み空間を正確に整列し,拡張ゲート融合で融合する手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:34:57 GMT)
PALADIN : Robust Neural Fingerprinting for Text-to-Image Diffusion Models [9.2] ニューラルフィンガープリントによる生成モデルへの貢献が、一般的なテクニックとして現れつつある。
既存の手法はどれも100%の属性精度を達成していない。
本稿では,テキスト・画像拡散モデルにニューラルネットワークを組み込むための高精度な手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:52:40 GMT)
Which Demographics do LLMs Default to During Annotation? [9.2] データアノテーションに大規模言語モデル(LLM)を用いることで、2つの研究方向が開発された。
我々は,ヒトアノテータLLMのどの属性が本質的に模倣されているかを評価する。
性別、人種、年齢に関連する顕著な影響を、人口動態の促進において観察する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:59:23 GMT)
Information-Computation Gaps in Quantum Learning via Low-Degree Likelihood [9.2] 本研究では、状態設計と低次硬度との一般的な関係を確立する。
これを応用して、ギブス状態のランダム、スパース、非局所ハミルトニアンの学習に最初の情報計算ギャップを得る。
また、単一量子ビット測定による戦略に対する量子誤差軽減のための低次硬度結果を得る。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:04:10 GMT)
Hybrid Disagreement-Diversity Active Learning for Bioacoustic Sound Event Detection [9.2] MFFT(Match First Farthest-traversal)は,委員会投票の不一致と多様性分析を統合した活発な学習手法である。
MFFTは、冷間開始時に68%、温間開始時に71%のmAPを達成し、アノテーションの2.3%しか使用していない。
特に、MFFTはコールドスタートのシナリオと、絶滅危惧種のモニタリングに重要な希少種に優れており、その実用的価値を示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:06:51 GMT)
GNNs-to-MLPs by Teacher Injection and Dirichlet Energy Distillation [9.1] グラフネットワーク(GNN)はグラフベースの学習において重要であり、特にノード分類において優れている。
高速な推論のためにGNNを多層パーセプトロン(MLP)に蒸留する最近の試みは、しばしばGNNの層間洞察を弱めている。
我々は,教師注入法とディリクレエネルギー蒸留法を用いて,GNNを層単位で蒸留する新しい手法であるTINEDを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:25:03 GMT)
UDuo: Universal Dual Optimization Framework for Online Matching [9.1] 3つの重要なイノベーションを通じて、オンラインアロケーションを根本的に再考する新しいパラダイムを提案する。
時間的ユーザ到着表現ベクトル、リソースペアリング学習者、オンライン時系列予測手法。
実験結果から,UDuoは現実の価格設定において従来の到着モデルよりも効率が高く,収束が速いことがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:25:50 GMT)
How Breakable Is Privacy: Probing and Resisting Model Inversion Attacks in Collaborative Inference [9.1] 協調推論は、中間機能をクラウドモデルに伝達することでエッジデバイスの計算効率を向上させる。
モデル逆攻撃(MIA)の難しさを評価するための確立された基準はない。
本稿では、CIにおけるMIAの難易度を評価するための最初の理論的基準を提案し、相互情報、エントロピー、有効情報量などを重要な要因として同定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:15:54 GMT)
Personalized Tree based progressive regression model for watch-time prediction in short video recommendation [9.1] TPM(Tree based Progressive Regression Model)は、慎重に設計され効果的な分解パラダイムを用いて、最先端のパフォーマンスを達成する。
TPMはウォッチタイムをいくつかの順序間隔に識別し、各ノードが特定の間隔に対応する二分決定ツリーに整理する。
そこで我々はPTPMを提案し,より優れた有効性と効率で時計推定の高度にパーソナライズされた分解を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:18:48 GMT)
Beyond Monoliths: Expert Orchestration for More Capable, Democratic, and Safe Large Language Models [9.1] Expert Orchestration"は、クエリ要求と分解に基づいて、数千の既存モデルからインテリジェントに選択するフレームワークである。
このアプローチは、すべてのユーザ要求に対処するためにコストのかかるジェネラリストモデルを強制するのではなく、ターゲットとする専門知識を活用することで、優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:32:10 GMT)
Learning to Charge More: A Theoretical Study of Collusion by Q-Learning Agents [9.1] 無限反復ゲームにおいて、この振る舞いに関する最初の理論的説明を提供する。
ゲームが1段階のナッシュ均衡価格と共謀誘発価格の両方を許容すると、企業は相反する価格を一貫して請求することを学ぶ。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:18:35 GMT)
Exploring the Limitations of Mamba in COPY and CoT Reasoning [9.0] Mamba は,計算コストを大幅に削減しつつ,シーケンスモデリングにおける Transformer の性能にマッチすることを示す。
さらに,MambaがChain of Thought(CoT)タスクに取り組む能力について分析する。
以上の結果から,任意のDP問題を解くために,Mambaの総コストは標準変換器に匹敵することがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:39:33 GMT)
When Models Reason in Your Language: Controlling Thinking Trace Language Comes at the Cost of Accuracy [9.0] 思考トレースを持つLarge Reasoning Models (LRMs) は、英語の推論タスクに強いパフォーマンスを示している。
なぜなら、ユーザーは自分の言語で表現された場合にのみ、その推論トレースが監視に有用であることを見つけることができるからだ。
我々は、XReasoningベンチマークでLRMの2つの主要なファミリーを評価し、最も先進的なモデルでさえしばしば英語に戻るか、他の言語で断片化された推論を生成することを発見した。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:44:12 GMT)
IMTS is Worth Time $\times$ Channel Patches: Visual Masked Autoencoders for Irregular Multivariate Time Series Prediction [9.0] IMTS 予測のための Visual MAE 適応フレームワーク VIMTS を提案する。
欠落した値の影響を軽減するため、VIMTSはまずタイムラインに沿ってIMTSを同じ間隔で特徴パッチに処理する。
そして、パッチ再構成のためのスパースマルチチャネルデータを扱う視覚的MAEの機能を利用し、その後、粗大なテクニックで正確な予測を生成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:44:03 GMT)
Generalization Analysis for Supervised Contrastive Representation Learning under Non-IID Settings [8.7] 非$i.d.$設定でContrastive Representation Learningフレームワークの一般化分析を行う。
そのクラスに関連する学習可能な表現のクラスを包含する数の対数として、各クラスで必要となるサンプル数を示す境界を導出する。
次に、線形写像やニューラルネットワークなどの共通関数クラスに対する過剰なリスク境界を導出するために、本研究の主な結果を適用する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:07:45 GMT)
FocusChat: Text-guided Long Video Understanding via Spatiotemporal Information Filtering [8.7] FocusChatはテキスト誘導型大規模言語モデルであり、ユーザのプロンプトと相関した視覚情報を強調する。
数発の実験では最先端の成果に匹敵する結果が得られ、事前学習のデータはわずか0.72万である。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:22:24 GMT)
Interpreting CLIP with Hierarchical Sparse Autoencoders [8.7] サエマトリオシュカ(MSAE)は複数の粒度の階層的表現を同時に学習する。
MSAEは、CLIPの再構築品質とスパーシリティの間に新しい最先端のフロンティアを確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:39:11 GMT)
MEDAL: A Framework for Benchmarking LLMs as Multilingual Open-Domain Chatbots and Dialogue Evaluators [8.7] 本稿では,対話評価ベンチマークの生成,評価,キュレートを行う自動マルチエージェントフレームワークであるMEDALを紹介する。
シードコンテキストの異なるユーザ-チャットボットの多言語対話を生成する。
次に、強いLLMを用いてチャットボットの性能を多次元的に解析し、顕著な言語間性能差を明らかにする。
その後、いくつかの推論と非推論 LLM がオープンドメイン対話の評価器として機能する能力を評価するためにベンチマークが使用される。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:45:42 GMT)
NRFormer: Nationwide Nuclear Radiation Forecasting with Spatio-Temporal Transformer [8.6] 放射線は人間の健康と環境に重大なリスクをもたらす。
本研究では,核放射線の変動を全国的に予測するための新しい枠組みであるNRFormerを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:19:31 GMT)
One Rank at a Time: Cascading Error Dynamics in Sequential Learning [8.6] ランク1のサブスペースを逐次学習する際にエラーがどのように伝播するかを示す。
我々の貢献は、このシーケンシャルなプロセスにおけるエラー伝播の特徴である。
これらの誤りは予測可能な方法で複雑であり、アルゴリズム設計と安定性の保証の両方に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:16:24 GMT)
UAVPairs: A Challenging Benchmark for Match Pair Retrieval of Large-scale UAV Images [8.6] 本稿では,大規模UAV画像のペア検索のためのベンチマークデータセット,UAVPairs,およびトレーニングパイプラインを提案する。
UAVPairsデータセットは、30の異なるシーンにわたる21,622の高解像度画像で構成されている。
UAVPairsデータセットとトレーニングパイプラインの有効性は、3つの異なる大規模UAVデータセットに関する包括的な実験を通じて検証される。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:21:05 GMT)
ICH-Qwen: A Large Language Model Towards Chinese Intangible Cultural Heritage [8.6] この研究は、オープンソースの中国語ICHデータのコーパスを用いて、ICHドメインのための大きな言語モデルであるICH-Qwenを開発する。
このモデルは、大きな言語モデルの自然言語理解と知識推論機能を使用し、合成データと微調整技術で強化される。
このモデルは、無形文化財の保護、継承、普及のためのインテリジェントなソリューションを提供するものと期待されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:02:13 GMT)
Farm-LightSeek: An Edge-centric Multimodal Agricultural IoT Data Analytics Framework with Lightweight LLMs [8.5] 我々はエッジ中心のマルチモーダル農業用IoTデータ分析フレームワークであるFarm-LightSeekを提案する。
このフレームワークは、センサを介してリアルタイムの農地のマルチソースデータを収集し、エッジノードでクロスモーダル推論と病気検出を行い、低レイテンシの管理決定を行う。
2つの実世界のデータセットで実施された実験は、Farm-LightSeekがミッションクリティカルなタスクにおける信頼性の高いパフォーマンスを一貫して達成していることを示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:09:36 GMT)
Simultaneously Solving FBSDEs and their Associated Semilinear Elliptic PDEs with Small Neural Operators [8.5] 前向きの微分方程式は、最適制御、ゲーム理論、経済学、数学ファイナンス、強化学習において重要な役割を果たす。
利用可能なFBSDEソルバは、textitindividual FBSDEsで動作しており、FBSDEの大規模なファミリーを解決するための計算可能な戦略を提供することはできない。
textitNeural演算子(NOs)は、分離されたFBSDEの大規模なファミリーをテキスト同期で解決するための代替アプローチを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:24:03 GMT)
Comparing Moral Values in Western English-speaking societies and LLMs with Word Associations [8.4] 主に英語データに基づいて学習した西英語コミュニティとLLMの関連性について検討した。
モラル基礎理論から派生したシードワードに基づく道徳的価値を伝播する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:05:54 GMT)
Symbolic Foundation Regressor on Complex Networks [8.4] 我々は,多数の相互作用変数で複雑なデータを圧縮できる,事前学習されたシンボルベースレジストレータを提案する。
我々のモデルは、ネットワーク以外の記号回帰、複雑なネットワークにおける記号回帰、および様々なドメインにわたるネットワークダイナミクスの推論について厳密に検証されてきた。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:53:29 GMT)
Latent Mamba Operator for Partial Differential Equations [8.4] 本稿では,潜時空間における状態空間モデル(SSM)の効率を,ニューラル演算子におけるカーネル積分定式化の表現力と統合する潜在マンバ演算子(LaMO)を紹介する。
LaMOは、ソリューション演算子近似における既存のベースラインよりも32.3%改善され、一貫したSOTA(State-of-the-art)性能を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:11:21 GMT)
Towards Practical Defect-Focused Automated Code Review [8.4] オンラインレコメンデーションサービスの中で、業界レベルのC++を分析しながら、完全な自動化パイプラインを調査します。
1)関連コンテキストの取得,2)キーインクルージョンの改善,3)偽アラーム率(FAR)の低減,4)人間のバグスライシングの統合。
提案手法は, 既往の断層記録からの実世界のマージ要求に基づいて検証され, 従来のLLMよりも2倍, 以前のベースラインより10倍向上した。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:21:00 GMT)
A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems [8.3] 安全性とパフォーマンスは競合する目標になり得るため、共同最適化が難しくなる。
本稿では,性能目標をコスト関数で符号化し,安全性要件を状態制約として課す,状態制約付き最適制御問題を提案する。
結果値関数はハミルトン・ヤコビ・ベルマン方程式を満たすことを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:55:13 GMT)
HelixDesign-Binder: A Scalable Production-Grade Platform for Binder Design Built on HelixFold3 [8.3] HelixDesign-Binderは、HelixFold3上に構築されたプロダクショングレードの高スループットプラットフォームである。
バックボーン生成やシーケンス設計から構造評価、多次元スコアリングに至るまで、完全なバインダー設計パイプラインを自動化する。
6つのタンパク質ターゲットのベンチマークは、HelixDesign-Binderが多種多様な高品質なバインダーを確実に生成していることを示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:39:31 GMT)
Symmetry reduction for testing $k$-block-positivity via extendibility [8.2] 最大交絡状態のユニタリ対称性を利用して、対応する半定値プログラムのサイズを小さくする。
例えば$k=2$の場合、SDPは2N+1 dN+1$から$lfloor fracN+12 rfloor$ブロックに縮小される。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:26:34 GMT)
Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering [8.2] 著者プロファイルは、共有するコンテンツを分析して個人の特徴を推測するタスクである。
本稿では,関係のないコンテンツと関係のないコンテンツとを区別することを目的とした著者プロファイリング手法を提案し,それに続いて,関連データのみを用いて実際のユーザプロファイリングを行う。
2つのTwitterコーパスにおける5つの人格特性予測手法の評価を行った。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:15:08 GMT)
Towards Conversational Development Environments: Using Theory-of-Mind and Multi-Agent Architectures for Requirements Refinement [8.2] 本稿では,FMを用いたAlignMindと呼ばれるマルチエージェントシステムを利用した新しい手法を提案する。
私たちのアプローチは、FMを最小限の能力で強化する認知アーキテクチャを持つことで、ソフトウェアメーカの精神状態と視点を考慮しています。
我々は、我々のアプローチがステークホルダーの意図と要求を正確に把握し、それらを仕様とステップバイステップの行動計画の両方として表現できることを実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:35:54 GMT)
Routing-Aware Placement for Zoned Neutral Atom-based Quantum Computing [8.2] ゾーン型中性原子アーキテクチャのためのルーティング対応配置法を提案する。
互換性のある動作を並列な再配置ステップにグループ化して、再配置ステップと走行距離を最小化する。
A*アルゴリズムを用いた実装は、再配置時間を平均で17%、ベストケースで49%削減する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:01 GMT)
Cognitively-Inspired Emergent Communication via Knowledge Graphs for Assisting the Visually Impaired [8.2] 本稿では,人間の視覚知覚と認知マッピングをエミュレートする新しいフレームワーク,Cognitively-Inspired Emergent Communication via Knowledge Graphs (VAG-EC)を紹介する。
本手法は,対象とその関係を表現する知識グラフを構築し,タスク関連エンティティを優先する注意機構を導入し,人間の選択的注意を反映する。
この構造化されたアプローチは、コンパクトで解釈可能で、文脈に敏感な記号言語の出現を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:09:06 GMT)
Combinatorial Reinforcement Learning with Preference Feedback [8.1] そこでは,学習エージェントが順次,複数の項目をユーザへ割り当てるアクションを提示する,優先的なフィードバックによる強化学習を検討する。
本枠組みは,(1)各項目の未知の値,(2)選択性を維持しながら楽観性を確保することの難しさ,の2つの課題に直面する。
本稿では,これらの課題に対処し,統計的に効率的なアルゴリズムMNL-VQLを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:29:42 GMT)
Can Large Language Models Be Trusted as Evolutionary Optimizers for Network-Structured Combinatorial Problems? [8.1] 大きな言語モデル(LLM)は、言語理解とさまざまなドメイン間の推論において素晴らしい能力を持っています。
本研究では,問題構造に係わるLLMの能力を評価するための体系的枠組みを提案する。
我々は,従来の個人レベルのアプローチと比較して,効率を著しく向上するコスト効率の高い集団レベルの最適化戦略を開発する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:39:13 GMT)
Improve Multi-Modal Embedding Learning via Explicit Hard Negative Gradient Amplifying [8.0] コアコントラスト学習パラダイムは、CLIPスタイルのモデルからMLLMに大きく変化しない。
本研究では,クエリ,正,負のサンプルに対する情報NCE損失の勾配を詳細に解析する。
そこで本研究では, 強陰性サンプルに関連する勾配を明示的に増幅し, より識別的な埋め込みの学習を促すことを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:18:19 GMT)
Seeing the Threat: Vulnerabilities in Vision-Language Models to Adversarial Attack [8.0] LVLM(Large Vision-Language Models)は、様々なマルチモーダルタスクにおいて顕著な機能を示す。
従来の敵攻撃がLVLMに埋め込まれた安全機構を回避できる理由を明らかにするために,系統的な表現解析を行う。
LVLMに対する敵攻撃のための2段階評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:43:39 GMT)
Hunting the Ghost: Towards Automatic Mining of IoT Hidden Services [7.9] 我々は,IoTデバイスに潜在的に有害な隠れサービスを見つけることを目的とした,ファームウェアの自動解析ツールを提案する。
提案手法では,静的解析とシンボリック実行を用いて,通常のユーザに対して透過的で,経験豊富な攻撃者に対して明示的なサービス検索とフィルタリングを行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:05:53 GMT)
LLMs Struggle to Reject False Presuppositions when Misinformation Stakes are High [7.9] 仮定は、与えられた情報を微妙に導入し、疑わしい情報や偽情報を埋め込むのに非常に効果的である。
このことは、LLMが人間のように、偽の前提として導入された誤解を招く仮定を発見・修正できないのではないかという懸念を提起する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:35:07 GMT)
PUATE: Efficient Average Treatment Effect Estimation from Treated (Positive) and Unlabeled Units [7.9] 我々は、治療群とラベルなし群のみを観察する環境で、ATEのための半パラメトリック効率的な推定器を開発した。
本研究は,データ不足と弱教師付き学習による因果推論の文献化に寄与する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:13:54 GMT)
On Provable Length and Compositional Generalization [7.9] 一般的なシーケンス・ツー・シーケンスモデルに対して、長さと合成の一般化に関する最初の証明可能な保証を提供する。
これらの異なるアーキテクチャのエンハン制限容量バージョンは、長さと構成の一般化の両方を達成することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:19:25 GMT)
Geometric Hyena Networks for Large-scale Equivariant Learning [7.9] 幾何学系の最初の同変長畳み込みモデルである幾何ハイエナを導入する。
我々のモデルは、同変変圧器より20倍高速な30kトークンの幾何学的コンテキストを処理する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:38:35 GMT)
Reward-Independent Messaging for Decentralized Multi-Agent Reinforcement Learning [7.9] MARL-CPCは、完全に分散化された独立したエージェント間の通信を可能にするフレームワークである。
アクション空間の一部としてメッセージを扱う従来の方法とは異なり、MARL-CPCはメッセージを状態推論にリンクする。
ベンチマークの結果、Bandit-CPCとIPPO-CPCは標準的なメッセージ・アズ・アクション・アプローチよりも優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:23:47 GMT)
Neural Restoration of Greening Defects in Historical Autochrome Photographs Based on Purely Synthetic Data [7.8] デジタル化されたオートクロム写真におけるグリーン色欠陥の自動除去のための最初のアプローチを提案する。
損傷したオートクロムの緑化欠陥を解析するための適切なトレーニングデータセットの欠如に対処するため,合成データにそのような欠陥を正確にシミュレートするための新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:28:35 GMT)
CLUE: Neural Networks Calibration via Learning Uncertainty-Error alignment [7.7] CLUE(Calibration via Learning Uncertainty-Error Alignment)は,学習中の予測不確かさを観測誤差と整合させる新しい手法である。
CLUEは,最先端のアプローチに対して,キャリブレーション品質と競争予測性能に優れることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:23:47 GMT)
BiasFilter: An Inference-Time Debiasing Framework for Large Language Models [7.5] 大規模言語モデル(LLM)における社会的バイアスの緩和は、ますます重要な研究目標となっている。
本稿では,BiasFilterを提案する。BiasFilterは,オープンソースのLLMとAPIベースのLLMをシームレスに統合する,モデルに依存しない推論時脱バイアスフレームワークである。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:09:10 GMT)
AI Mathematician: Towards Fully Automated Frontier Mathematical Research [7.5] 大規模共振モデル (LRM) は近年, 数学的能力に大きな進歩を遂げている。
我々は、LRMの推論強度を利用してフロンティア数学研究を支援するAI数学フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:10:37 GMT)
AgentDNS: A Root Domain Naming System for LLM Agents [7.5] AgentDNSはLarge Language Model (LLM)エージェントのためのルートドメイン命名およびサービスディスカバリシステムである。
従来のDNSの原則にインスパイアされたAgentDNSは、サービス登録、セマンティックサービスディスカバリ、セキュアな呼び出し、統一請求のための構造化されたメカニズムを導入している。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:56:22 GMT)
When Does Neuroevolution Outcompete Reinforcement Learning in Transfer Learning Tasks? [7.5] ニューロエボリューション(NE)は、局所最適化から逃れるための堅牢性、スケーラビリティ、能力について最近注目を集めている。
ステップゲートでは、ニューラルネットワークが論理回路をエミュレートし、モジュラー繰り返しと変分bを強調する設計で、エコロボットはブラックス物理エンジンを壁や障害物などの物体で拡張する。
実験により, NE法は伝達能力に違いがあり, RL法よりも高い結果が得られた。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:15:18 GMT)
CAST: Contrastive Adaptation and Distillation for Semi-Supervised Instance Segmentation [7.5] 我々は,事前学習型視覚基礎モデル(VFM)をコンパクトな専門家に圧縮する,半教師付き知識蒸留(SSKD)フレームワークであるCASTを紹介する。
1) コントラスト画素校正による自己学習による VFM 教師のドメイン適応,(2) 統一多目的損失によるコンパクトな学生への蒸留,の3段階に展開する。
Cityscapes と ADE20K では、我々の11X小学生は、適応された VFM 教師を +3.4 AP (33.9 vs. 30.5) と +1.5 AP (16.7 vs. 15.2) で上回り、州を上回ります。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:45:42 GMT)
Low-Rank Interconnected Adaptation across Layers [7.5] 層間(Lily)における低ランク相互接続型適応を提案する。
この構造は、レイヤごとの冗長な$AB$ペアを排除し、同等または少ないパラメータで上位の$Delta W$を可能にする。
モダリティ、アーキテクチャ、モデルサイズにわたる実験は、Lilyの優れたパフォーマンスと効率を実証している。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:05:19 GMT)
Voice Adaptation for Swiss German [7.4] 本研究は、スイスドイツ語方言における音声適応モデルの性能、すなわち標準ドイツ語のテキストをスイスドイツ語の方言言語に翻訳する性能について検討する。
このために、スイスのポッドキャストの大規模なデータセットを前処理し、方言のクラスを自動で書き起こし、注釈付けします。
このデータセット上でXTTSv2モデルを微調整し、人や自動化された評価において良好なスコアを達成し、所望の方言を正しく描画できることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:24:40 GMT)
Visual Cues Support Robust Turn-taking Prediction in Noise [7.4] 本研究は, PTTM の性能を, 一度展開すると発生する可能性のあるノイズの種類で検討する。
ホールド/シフトの精度はクリーン音声では84%から10dBの音楽ノイズでは52%に低下する。
マルチモーダルPTTMは、すべてのノイズタイプとSNRでオーディオのみのPTTMより優れている。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:11:13 GMT)
HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym [7.4] 強化学習(RL)メソッドはOpenAI Gymのようなツールを使って広くテストされている。
RLとの階層的計画のシームレスな統合を可能にするツールがない。
我々は、HDDLドメインと問題からOpenAI Gym環境を自動的に生成するPythonベースのツールであるHDDLGymを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:10:43 GMT)
Semantic Exploration and Dense Mapping of Complex Environments using Ground Robots Equipped with LiDAR and Panoramic Camera [7.3] 本稿では,LiDAR-パノラマカメラスイートを備えた地上ロボットを用いて,複雑な未知環境の自律的セマンティック探索と密集的セマンティックターゲットマッピングを行うシステムを提案する。
そこで我々はまず,幾何的カバレッジと意味的視点の両方の観察を完遂するタスクを再定義し,その後,意味的視点と幾何学的視点を別々に管理し,局所的な視点を生成するための新たな優先順位駆動型デカップリング型局所サンプリングを提案する。
さらに,ロボットの安全性を確保しつつ,積極的な探索行動を可能にする安全な攻撃的探索状態マシンを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:27:32 GMT)
Multipath cycleGAN for harmonization of paired and unpaired low-dose lung computed tomography reconstruction kernels [7.3] CT(Computed tomography)の再構成カーネルは空間分解能とノイズ特性に影響を与え、気腫定量化などの定量的画像計測において体系的変動をもたらす。
我々は,低用量肺がん検診コホートからのペアデータとペアデータの混合に基づいて訓練されたCTカーネルハーモニゼーションのためのマルチパスサイクルGANモデルを提案する。
このモデルは、ドメイン固有のエンコーダとデコーダを共用し、各ドメイン用に調整された識別器を使用する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:44:42 GMT)
CULEMO: Cultural Lenses on Emotion -- Benchmarking LLMs for Cross-Cultural Emotion Understanding [7.3] カルチャー・レンズ・オン・エモーション (CuLEmo) は、6つの言語にまたがるカルチャー・アウェア・感情予測を評価するための最初のベンチマークである。
キュレモ語は言語ごとに400の工芸的な質問で構成されており、それぞれに微妙な文化的推論と理解が必要である。
このベンチマークを用いて、カルチャーを意識した感情予測と感情分析タスクにおける、最先端のLCMの評価を行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:07:48 GMT)
An Optimistic Algorithm for online CMDPS with Anytime Adversarial Constraints [7.3] オンライン安全強化学習(RL)は、自律運転、ロボティクス、サイバーセキュリティなど、動的環境において重要な役割を果たす。
マルコフ決定プロセス(CMDP)をモデルとした安全制約を満たしつつ報酬を最大化する最適政策を学習することを目的とする。
既存の手法は制約の下でサブリニアな後悔を実現するが、制約が未知、時間変化、潜在的に敵意的に設計された場合、しばしば敵の設定で失敗する。
最適ミラーDescent Primal-Dual (OMDPD) アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:16:34 GMT)
LAMBDA: A Large Model Based Data Agent [7.2] 本稿では,LArge Model Based Data Agent (LAMBDA)を紹介する。
LAMBDAは、データ駆動アプリケーションにおけるデータ分析の課題に対処するように設計されている。
それは、人間と人工知能をシームレスに統合することで、データ分析パラダイムを強化する可能性がある。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:05:41 GMT)
A Novel Zero-Trust Identity Framework for Agentic AI: Decentralized Authentication and Fine-Grained Access Control [7.2] 本稿では,Agentic AI IAMフレームワークの提案について述べる。
リッチで検証可能なエージェント識別子(ID)に基づく包括的フレームワークを提案する。
また、Zero-Knowledge Proofs(ZKPs)によって、プライバシ保護属性の開示と検証可能なポリシーコンプライアンスを実現する方法について検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:37:25 GMT)
Spin dynamics and dark particle in a weak-coupled quantum Ising ladder with $\mathcal{D}_8^{(1)}$ spectrum [7.2] Emergent Ising$_h2$ integrability is expected in a quantum Ising ladder composed of two weakly Coupled critical transverse field Ising chains。
我々は、この理論のパリティとトポロジカル電荷に固有の選択規則が、ダーク粒子と呼ばれる電荷パリティ陰極粒子が基底状態から直接励起できないという重要な結果をもたらすことを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:37:27 GMT)
Two-Stage Feature Generation with Transformer and Reinforcement Learning [7.2] Two-Stage Feature Generation (TSFG)フレームワークは、Transformerベースのエンコーダデコーダアーキテクチャとプロキシポリシー最適化を統合している。
TSFGは,機能品質と適応性の観点から,既存の最先端手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:11:59 GMT)
FPAN: Mitigating Replication in Diffusion Models through the Fine-Grained Probabilistic Addition of Noise to Token Embeddings [7.1] 本稿では,トークン埋め込みに大量のノイズを確率的に付加する,きめ細かいノイズ注入手法を提案する。
提案したFPANは,ベースライン拡散モデルと比較して平均28.78%のレプリケーションを低減できる。
他の既存の緩和手法と組み合わせることで、FPANの手法により、画像の品質が改善されていなくても16.82%までレプリケーションを削減できます。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:29:20 GMT)
Assessing Quantum Advantage for Gaussian Process Regression [7.1] ガウス過程回帰のために提案された数個の量子アルゴリズムは指数的スピードアップを示さないことを示す。
量子ランタイムアルゴリズムの意味は、古典的なデータを量子コンピュータにロードする複雑さとは無関係である。
機械学習における一般的なカーネルの数値検証による理論的解析を補完する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:50:56 GMT)
CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature [7.1] 組換え例の大規模知識ベース(KB)であるCHIMERAを構築した。
ChiMERAは、科学者がどのようにして概念を再結合し、異なる領域からインスピレーションを得るかを探索するために使用することができる。
我々はCHIMERAを分析し、AIの異なるサブ領域における組換えの性質を探索する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:41:47 GMT)
LLMs Reproduce Stereotypes of Sexual and Gender Minorities [7.1] 我々は、二進圏を超えた性や性別のマイノリティに対する大きな言語モデルのバイアスについて研究する。
分析の結果, LLMは創造的執筆において性・性マイノリティのステレオタイプ表現を生成することがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:04:51 GMT)
Learning Curves of Stochastic Gradient Descent in Kernel Regression [7.1] 我々は、ソース条件下でのカーネル回帰において、シングルパスグラディエントDescent (SGD) を解析する。
驚くべきことに、SGD はすべてのスケールで最大 min-max の最適速度を達成する。
SGDが飽和の呪いを克服する主な理由は、指数関数的に減衰するステップサイズスケジュールである。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:16:11 GMT)
Frequency-Adaptive Discrete Cosine-ViT-ResNet Architecture for Sparse-Data Vision [7.0] 最適な低域・中域・高域境界を学習する適応周波数領域選択機構を提案する。
自作の50クラスの野生生物データセットでは、このアプローチは従来のCNNや固定バンドDCTパイプラインよりも優れています。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:39:58 GMT)
Robust and Conjugate Spatio-Temporal Gaussian Processes [7.0] 我々はAltamirano al et alの堅牢RCGPフレームワークを適応し、特殊化する。
我々は、古典的時間的GPに匹敵する計算コストで、アンロバスト時間的GPを得る。
本手法は,金融・気象分野において広く研究されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:14:29 GMT)
Identifying Causal Direction via Variational Bayesian Compression [6.9] このタスクで利用される重要な原理はアルゴリズムマルコフ条件であり、因果方向に応じて分解された結合分布は反因果方向よりも簡潔な符号長が得られると仮定する。
本稿では,ニューラルネットワークの変分ベイズ学習をコード長の解釈として活用することを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:41:56 GMT)
ER-REASON: A Benchmark Dataset for LLM-Based Clinical Reasoning in the Emergency Room [6.9] 大規模言語モデル (LLMs) は, ライセンス試験に基づく質問応答タスクにおいて, 広範囲に評価されている。
ER-Reason(ER-Reason)は、救急室におけるLSMに基づく臨床推論と意思決定を評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:43:44 GMT)
An Empirical Evaluation of Rewiring Approaches in Graph Neural Networks [6.9] 本稿では,ノードやグラフ表現の学習を必要としない,メッセージパッシングモデルに基づく評価設定を提案する。
実世界のノードとグラフ分類タスクの体系的比較を行い、基礎となるグラフを書き換えることが、メッセージパッシングの実用的な利点をもたらすことは滅多にないことを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:51:47 GMT)
Hierarchical Material Recognition from Local Appearance [6.8] 地域の外観から階層的認識のための材料分類を導入する。
分類学クラスの画像と深度マップを組み込んだ多種多様なアプリ内データセットをコントリビュートする。
本稿では,グラフアテンションネットワークに基づく階層的材料認識手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:20:50 GMT)
TLUE: A Tibetan Language Understanding Evaluation Benchmark [6.8] チベット語は700万人以上の人々が話しているが、大きな言語モデルの開発と評価は無視されている。
我々は,チベット語におけるLLMの能力を評価するための,最初の大規模ベンチマークであるTLUE(A Tibetan Language Understanding Evaluation Benchmark)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:40:24 GMT)
Domain specific ontologies from Linked Open Data (LOD) [6.7] ドメイン固有の知識は、知識をより効率的に消費し、プロプライエタリなコンテンツで拡張しやすくする。
ドメインに依存しないパイプラインでITの経験を議論し、ドメイン固有の用語集を使ってそれを拡張します。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:33:01 GMT)
How Do Experts Make Sense of Integrated Process Models? [6.6] 本研究では、専門家プロセスワーカーが、統合モデリングアプローチによって提供された情報をどのように理解するかを考察する。
ビジネスプロセスとルールの統合モデリングに基づくタスクに携わるエキスパートプロセスワーカーを研究することで、私たちは、センスメイキングの実践をよりよく理解するための道を開いた洞察を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:39:28 GMT)
DistMLIP: A Distributed Inference Platform for Machine Learning Interatomic Potentials [6.6] 機械学習原子間ポテンシャル(MLIP)は、量子力学計算をスケールアップするソリューションを提供する。
我々は、ゼロ冗長グラフレベルの並列化に基づく、MLIPのための効率的な分散推論プラットフォームであるDistMLIPを提案する。
我々は、広く使われている4つの最先端MLIP(CHGNet、MACE、Net、eSEN)上でDistMLIPを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:23:36 GMT)
Rethinking BPS: A Utility-Based Evaluation Framework [6.6] BPSモデルを評価するための最先端のアプローチには2つの重要な制限がある。
シミュレーションを予測問題として扱い、モデルが目に見えない未来の事象を予測できるかどうかをテストする。
代表的なプロセスの振る舞いを生成する能力に基づいて,シミュレーション品質を評価する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:00:52 GMT)
A Divide-and-Conquer Approach for Modeling Arrival Times in Business Process Simulation [6.6] ビジネスプロセスシミュレーション(Business Process Simulation, BPS)は、組織プロセスを分析し改善するための重要なツールである。
Case-arrivalモデルは、プロセスへの新しいケースエントリのパターンを決定する。
既存のアプローチはしばしば、地域間時間の過度に単純化された静的分布に依存している。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:09:51 GMT)
Diagnosing and Resolving Cloud Platform Instability with Multi-modal RAG LLMs [6.6] ARCAは、このドメインをターゲットにした新しいマルチモーダルRAG LLMシステムである。
ステップワイズ評価は、ARCAが最先端の代替品より優れていることを示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:17:40 GMT)
Eye-See-You: Reverse Pass-Through VR and Head Avatars [6.5] RevAvatarは、リバースパススルー技術を可能にするためにAI方法論を活用する革新的なフレームワークである。
RevAvatarは最先端の生成モデルとマルチモーダルAI技術を統合して、高忠実度2D顔画像の再構成を行う。
多様なVR特有の条件をエミュレートするために設計された20万のサンプルからなる新しいデータセットであるVR-Faceを提示する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:10:43 GMT)
Continuous Self-Improvement of Large Language Models by Test-time Training with Verifier-Driven Sample Selection [6.5] VDS-TTT(Verifier-Driven Sample Selection for Test-Time Training)と呼ばれる新しいフレームワークを導入する。
学習した検証器を用いて、生成された応答のプールをスコアし、高いランクの擬似ラベル付き例からのみ選び、微調整を施す。
低ランクなLoRAアダプタパラメータのみを微調整し、適応効率と高速収束を確保する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:04:19 GMT)
Robust Reward Alignment via Hypothesis Space Batch Cutting [6.4] 本稿では,新鮮かつ幾何学的に解釈可能な視点に基づく,堅牢で効率的な報酬アライメント手法を提案する。
提案手法は,人間の嗜好のバッチに基づいて,報酬仮説空間を「カット」により反復的に洗練する。
未知の誤選好に対処するため,各バッチに保守的な裁断手法を導入し,誤選好が仮説空間に過度に積極的になるのを防ぐ。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:40:46 GMT)
When Collaborative Filtering is not Collaborative: Unfairness of PCA for Recommendations [6.4] 主成分分析の基礎的手法(PCA)に着目する。
我々はPCAにおける項目不公平を誘発する2つの基本的人気メカニズムを同定する。
主成分を最適化するアルゴリズムである項目重み付きPCAを開発した。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:01:13 GMT)
Single Domain Generalization for Alzheimer's Detection from 3D MRIs with Pseudo-Morphological Augmentations and Contrastive Learning [6.4] この記事では、単一領域の一般化設定に焦点を当てる。
脳形態学はアルツハイマーの診断において重要な役割を担っていることが知られているため、学習可能な擬似形態学モジュールの使用を提案する。
3つのデータセットで実施された実験では、パフォーマンスと一般化能力が改善された。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:18:16 GMT)
Distance Transform Guided Mixup for Alzheimer's Detection [6.4] 本研究では、よく知られた混合手法を拡張することで、単一ドメインの一般化に焦点を当てる。
提案手法は脳の構造を保ちながら多様なデータを生成する。
実験結果から,ADNIデータセットとAIBLデータセットの両方で,一般化性能が向上した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:56:59 GMT)
Structurally Different Neural Network Blocks for the Segmentation of Atrial and Aortic Perivascular Adipose Tissue in Multi-centre CT Angiography Scans [6.4] 我々は,医療画像セグメンテーションのための機能学習を強化するために,CNNベースのブロックとSwinViTベースのブロックを置換するディープラーニングフレームワークであるLegoNetを紹介する。
これらのPVAT領域は、心血管疾患のリスクと一次臨床結果を評価する上で、予後に価値があることが示されている。
大規模なデータセット上でLegoNetを評価し、他の主要なアーキテクチャよりも優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:54:51 GMT)
GateNLP at SemEval-2025 Task 10: Hierarchical Three-Step Prompting for Multilingual Narrative Classification [6.3] 本稿では,SemEval 2025 Task 10 Subtask 2について述べる。
ニュース記事は、複数の言語にまたがる主要な物語とサブ物語の2段階の分類に分類することを目的としている。
提案手法は,3段階の大規模言語モデル (LLM) に基づく戦略である。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:59:28 GMT)
Solver-Free Decision-Focused Learning for Linear Optimization Problems [6.3] 多くの実世界のシナリオでは、最適化問題のパラメータは事前に知られておらず、文脈的特徴から予測されなければならない。
機械学習モデルは、最適化によって決定される問題パラメータを予測する。
本稿では, 線形最適化の幾何学的構造を利用して, 解の質を最小限に抑え, 効率的な学習を可能にする手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:55:16 GMT)
ProSpero: Active Learning for Robust Protein Design Beyond Wild-Type Neighborhoods [6.3] 本稿では,タンパク質工学の能動的学習フレームワークであるProSperoを提案する。
適合性関連残基選択と生物学的に制約されたシークエンシャルモンテカルロサンプリングを統合することにより,本手法は野生型近傍の探索を可能にする。
ProSperoは、さまざまなタンパク質工学タスクで既存のメソッドを一貫して上回るか、マッチする。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:45:43 GMT)
A Probabilistic Jump-Diffusion Framework for Open-World Egocentric Activity Recognition [6.3] 本稿では,ジャンプ拡散に基づく確率的残留探索フレームワークProbResを紹介する。
提案手法は,意味的コヒーレントな検索空間を構築するために,構造化コモンセンスを前もって統合する。
複数のオープンネスレベル(L0-L3)にわたってProbResを体系的に評価し,検索空間の複雑さの増加に対する適応性を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:44:14 GMT)
Functionality understanding and segmentation in 3D scenes [6.2] Fun3DUは、3Dシーンで機能を理解するために設計された最初のアプローチである。
Fun3DUは言語モデルを使用して、Chain-of-Thought推論を通じてタスク記述を解析する。
我々はFun3DUをSceneFun3D上で評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:37:44 GMT)
Shapley Value-driven Data Pruning for Recommender Systems [6.2] 共有価値駆動評価(Shapley Value-Driven Valuation, SVV)は、モデルトレーニングに対する客観的な影響に基づいてインタラクションを評価するフレームワークである。
SVVは、高い値との相互作用を強調しながら、低い値を下書きし、レコメンダシステムに効果的なデータプルーニングを実現する。
4つの実世界のデータセットでの実験では、SVVは精度とロバスト性の両方で既存のデノナイジング手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:27:59 GMT)
Rhetorical Text-to-Image Generation via Two-layer Diffusion Policy Optimization [6.2] Rhet2Pixは、多段階ポリシー最適化問題として修辞的テキスト・画像生成を定式化するフレームワークである。
GPT-4o,Grok-3などのSOTA MLLMと,定性評価と定量的評価の両面において,本モデルの方が優れた成績を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:03:37 GMT)
Optimal convex $M$-estimation via score matching [6.1] 実験的リスク最小化が回帰係数の下流推定における最適分散をもたらすデータ駆動凸損失関数を構築した。
人口レベルでは、最適凸損失の負の微分は、ノイズ分布の対数密度の微分の最も低い近似である。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:02:28 GMT)
When do neural networks learn world models? [6.0] ニューラルネットワークが同様の世界モデルを学ぶことができるかどうかについて、最初の理論的結果を示す。
低次バイアスを持つモデルは、軽度の仮定の下で遅延データ生成変数を確実に回復することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:13:08 GMT)
Modeling and Optimizing User Preferences in AI Copilots: A Comprehensive Survey and Taxonomy [6.0] AIコパイロットは、ソフトウェア開発やコンテンツ作成といったタスクでユーザを支援するために設計された、コンテキスト対応のAI駆動システムである。
このパーソナライゼーションの中心は、好みの最適化である。AIコパイロが個々のユーザの好みを検出し、解釈し、調整する能力である。
この調査は、AIコピロの設計において、ユーザの好みをキャプチャし、モデル化し、洗練する方法について論じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:52:39 GMT)
Analysis and Evaluation of Synthetic Data Generation in Speech Dysfluency Detection [6.0] 発声障害の検出は臨床診断と言語評価に不可欠である。
このデータセットは、単語レベルと音素レベルの両方にまたがる11のディスフルエンシカテゴリをキャプチャする。
このリソースを基盤として、エンド・ツー・エンドのディフルエンシ検出フレームワークを改善します。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:52:10 GMT)
Disambiguating Pauli noise in quantum computers [5.9] 学習可能なパラメータが自己整合的に特徴づけられる場合、学習不可能な(ゲージ)自由度はノイズダイナミクスやエラー軽減の予測に影響を与えないことを示す。
我々は,最近導入されたゲートセットパウリ雑音学習の枠組みを用いて,完全ゲートセットの雑音を効率よく自己整合的に特徴付け,緩和する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:46:17 GMT)
Balancing Computation Load and Representation Expressivity in Parallel Hybrid Neural Networks [5.9] FlowHNは、ロードバランシングのさまざまな戦略に対応する、新しい並列ハイブリッドネットワークアーキテクチャである。
FlowHNの2つの革新的な差別化要因は、注意とSSMブランチの間で分割されたFLOP認識動的トークンである。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:06:17 GMT)
RSCF: Relation-Semantics Consistent Filter for Entity Embedding of Knowledge Graph [5.9] 我々は、プラグインKGE法、Relation-Semantics Consistent Filter (RSCF)を導入する。
エンティティ変換にはセマンティック一貫性を強化する3つの機能がある。
RSCFは最先端のKGE法を大幅に上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:17:49 GMT)
Multilingual vs Crosslingual Retrieval of Fact-Checked Claims: A Tale of Two Approaches [5.9] マルチリンガルおよびクロスリンガルのパフォーマンスを改善するための戦略を検討する。
47言語におけるポストとクレームを含むデータセットに対するアプローチを評価する。
最も重要なことは、多言語性は多言語性よりも独自の特徴を持つセットアップであることが示される。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:47:10 GMT)
Neural Face Skinning for Mesh-agnostic Facial Expression Cloning [5.8] 本稿では,大域変形モデルと局所変形モデルの両方の強度を組み合わせた手法を提案する。
当社のアプローチは,顔メッシュ間の直感的な制御と詳細な表現のクローニングを可能にする。
各種メッシュ構造における表現忠実度, 変形伝達精度, 適応性の観点から, 最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:43:43 GMT)
Fast 3D point clouds retrieval for Large-scale 3D Place Recognition [5.8] 本稿では,3次元点群検索に微分可能探索指数(DSI)を適用することにより,検索の高速化に着目する。
提案手法は点記述子に基づいて1次元識別子を生成し,一定時間で直接検索できる。
提案手法は,その検索能力と最先端の手法とを比較した公開ベンチマークにおける位置認識として評価される。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:31:08 GMT)
Conditional Denoising Meets Polynomial Modeling: A Flexible Decoupled Framework for Time Series Forecasting [5.8] 本稿では,複雑な時間パターンをモデル化するための条件記述型多項式モデリング(CDPM)フレームワークを提案する。
結合した時系列をモデル化する代わりに、CDPMはそれを傾向と季節的な要素に分解し、個別にモデル化する。
スムーズなトレンドコンポーネントに対しては、歴史的依存関係を組み込んで線形モデルを強化するモジュールが提案されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:26:49 GMT)
Emotion-based Recommender System [5.7] 我々は、リコメンデータシステムと対話する際のユーザーの感情を捉えることができる新しい理論とメトリクスを作成します。
また、ユーザの感情と顧客ライフサイクルの変化を視覚化するための効果的で効率的な可視化技術も提供します。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:11:16 GMT)
FNOPE: Simulation-based inference on function spaces with Fourier Neural Operators [5.7] 本稿では,フローマッチングを目的としたフーリエ演算子 (FNO) アーキテクチャを用いた後部推定手法を提案する。
FNOPEは、技術手法の状態のシミュレーション予算のごく一部で関数値パラメータの推測を行うことができる。
FNOPEは、関数値パラメータの推論を可能にすることにより、SBI法を新しい科学的領域に適用可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:46:56 GMT)
Cross-Layer Feature Pyramid Transformer for Small Object Detection in Aerial Images [5.7] 空中画像における小型物体検出のための新しいアップサンプラーフリー特徴ピラミッドネットワークであるCFPTを導入する。
層間相互作用における位置を高めるために,層間相互受容場に基づく層間連続相対位置認識(CCPE)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:48:47 GMT)
PolyPose: Localizing Deformable Anatomy in 3D from Sparse 2D X-ray Images using Polyrigid Transforms [5.6] 変形可能な2D/3D登録のためのシンプルでロバストな方法であるPolyPoseを提案する。
PolyPoseは複雑な3次元変形場を剛体変換の合成としてパラメータ化する。
この強い誘導バイアスにより,PolyPoseは患者の術前容積を2枚までのX線画像に合わせることができた。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:02:56 GMT)
An unsupervised method for MRI recovery: Deep image prior with structured sparsity [5.4] 教師なしMRI再構成法は完全なk-spaceデータを必要としない。
深部画像前処理法(DISCUS)は,深部画像前処理法(DIP)を拡張した。
円盤は4つの研究で検証されました
論文参考訳(メタデータ) (Wed, 28 May 2025 18:06:12 GMT)
Visual Large Language Models Exhibit Human-Level Cognitive Flexibility in the Wisconsin Card Sorting Test [5.3] 本研究では、最先端の視覚大言語モデル(VLLM)の認知的柔軟性を評価する。
以上の結果から,VLLMはテキストベースの入力によって,チェーン・オブ・シークレットの下で人間レベルのセットシフト能力を達成したり,超えたりすることが判明した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:40:55 GMT)
Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models [5.3] 非均一な観測値分布が、最先端のモデルに深刻なバイアスをもたらすことを示す。
我々は、すべての研究領域とモデルでそれを定量化できる新しい指標として、Eccentricity-Area Under the Curve (EAUC)を紹介した。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:02:30 GMT)
Practical Adversarial Attacks on Stochastic Bandits via Fake Data Injection [5.3] 盗賊に対する敵対的な攻撃は伝統的にいくつかの非現実的な仮定に依存してきた。
現実的な敵の制約を反映したより実用的な脅威モデルを提案する。
我々は、このモデルの下で効率的な攻撃戦略を設計し、大小制約と時間的制約の両方に明示的に対処する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:47:13 GMT)
Kolmogorov-Arnold Attention: Is Learnable Attention Better For Vision Transformers? [5.3] Kolmogorov-Arnoldネットワーク(KAN)は、学習可能なアクティベーション関数からなる驚くべきイノベーションである。
我々は,任意の方法で動作可能なViTに対して,Kolmogorov-Arnold Attention (KArAt) と呼ばれる学習可能な最初の注意を設計する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:00:37 GMT)
ItDPDM: Information-Theoretic Discrete Poisson Diffusion Model [5.2] 本稿では,光子到着過程に着想を得た情報理論離散ポアソン拡散モデル(ITDPDM)を紹介する。
我々のアプローチの中心は、真のデータ可能性と証明可能な正確な関係を持つ情報理論ポアソン再構成損失(PRL)である。
IDPDMは、分布ロバストな離散生成モデルの概念の証明を実証する優れた推定値と競合生成品質を得る。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:53:21 GMT)
LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation [5.2] 韓国初の大規模判例検索ベンチマークであるLEGAR BENCHを,1.2万件以上のクエリで411種類の犯罪タイプをカバーした。
また、クエリーケースに対して法的要素推論を行い、ターゲットケースに基礎を置くコンテンツを直接生成する検索モデルであるLegalSearchLMを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:02:41 GMT)
Addressing and Visualizing Misalignments in Human Task-Solving Trajectories [5.2] 本研究では,(1)意図を表現する関数の欠如,(2)非効率な動作シーケンス,(3)課題を解決できない誤った意図の3つのタイプに分類する。
我々は、人間のタスク解決軌道で訓練されたAIモデルが、人間の推論を模倣する性能を向上させることを実験的に実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:56:35 GMT)
Symbolically Regressing Fish Biomass Spectral Data: A Linear Genetic Programming Method with Tunable Primitives [5.2] 本稿では, 魚のバイオマススペクトルデータをシンボル回帰問題としてモデル化し, 線形遺伝プログラミング法を用いてその問題を解く。
シンボリック回帰問題では、線形遺伝的プログラミングは与えられたプリミティブとトレーニングデータに基づいて回帰モデルを自動で合成する。
10種の魚のバイオマスを対象とする実験結果から,本手法は魚類のバイオマス組成予測の全体的な性能を向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:27:49 GMT)
Fast Feature Matching of UAV Images via Matrix Band Reduction-based GPU Data Schedule [5.1] 提案アルゴリズムは,UAV画像の特徴マッチングのための効率的な解法である。
77.0から100.0までのスピードアップ比を持つ特徴マッチングの効率をKD-Treeベースのマッチング手法と比較して向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:12:12 GMT)
SVA-ICL: Improving LLM-based Software Vulnerability Assessment via In-Context Learning and Information Fusion [5.1] 本研究では,大規模言語モデル(LLM)の性能向上のために,文脈内学習(ICL)を活用する新しいアプローチSVA-ICLを提案する。
12,071個のC/C++脆弱性からなる大規模データセットを用いて,SVA-ICLの有効性を評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:37:29 GMT)
PADAM: Parallel averaged Adam reduces the error for stochastic optimization in scientific machine learning [5.1] Ruppert-Polyak平均化や指数移動平均化(EMA)といった平均化技術は、一般的なADAMのような勾配降下(SGD)最適化手法の最適化を高速化するための強力なアプローチである。
本研究では,並列平均化ADAM(PADAM)と呼ばれる並列平均化手法を提案する。この手法では,ADAMの並列平均化変動を計算し,トレーニングプロセス中に最小の最適化誤差で勾配を動的に選択する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:07:34 GMT)
Accelerating Optimization via Differentiable Stopping Time [5.0] 一般的な定式化は、与えられた時間に低い損失を達成することである。
目標損失に達するまでの時間を最小化する双対は、時間が異なるため、微分不可能であると考えられている。
本稿では、微分方程式に基づいて、微分可能な停止時間を提案し、理論的に正当化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:59:13 GMT)
Bridging Fitness With Search Spaces By Fitness Supremums: A Theoretical Study on LGP [5.0] 本稿では, 線形遺伝プログラミング(LGP)を例として, 適合性と遺伝子型との関係について考察する。
講義編集距離を超越したフィットネスの最大値によって、フィットネスの期待が高まることが判明した。
次に、これらの結果を拡張して、命令編集距離に基づいて、LGPの肥大効果と最小打撃時間を説明する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:39:33 GMT)
B-XAIC Dataset: Benchmarking Explainable AI for Graph Neural Networks Using Chemical Data [4.9] B-XAICは、実世界の分子データと様々なタスクから構築された新しいベンチマークである。
このベンチマークは、XAIの忠実さに関する深い洞察を得るための貴重なリソースを提供し、より信頼性が高く解釈可能なモデルの開発を促進する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:40:48 GMT)
Revisiting Bayesian Model Averaging in the Era of Foundation Models [4.9] 我々は、古典的で本格的なベイズモデル平均化(BMA)パラダイムを再考し、事前訓練または/または軽微な基礎モデルを組み立てる。
予め訓練された基礎モデルから凍結した特徴を入力として取り出す訓練可能な線形分類器を導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:03:28 GMT)
Privacy-Preserving Inconsistency Measurement [4.9] マルチパーティ通信における不整合測定の新たな形態について検討する。
その結果,知識ベースの内容を明らかにすることなく,K_A U K_Bの不整合度を定量的に評価できることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:24:33 GMT)
Autoregression-free video prediction using diffusion model for mitigating error propagation [4.8] 本稿では拡散モデルを用いた最初のオートレグレスフリー(ARFree)ビデオ予測フレームワークを提案する。
自動回帰ビデオ予測メカニズムとは異なり、ARFreeはコンテキストフレームから直接将来のフレームを予測する。
提案するARFreeビデオ予測フレームワークは,2つのベンチマークデータセットを用いた実験により,最先端のビデオ予測手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:40:38 GMT)
K-COMP: Retrieval-Augmented Medical Domain Question Answering With Knowledge-Injected Compressor [4.8] Retrieval-augmented Question answering (QA)は外部情報を統合し、ドメイン知識に欠ける読者モデルのQA精度を向上させる。
しかし、クローズドドメインのために検索された文書は高い専門知識を必要とするため、読者モデルはテキストを完全に理解することが困難である可能性がある。
本稿では,正しい解答に必要な知識を提供するK-compを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:20:05 GMT)
Frugal Incremental Generative Modeling using Variational Autoencoders [4.8] 我々は変分オートエンコーダ(VAE)に基づく新しいリプレイフリーインクリメンタル学習モデルを開発する。
提案手法では,パラメータ数に非(あるいは少なくとも制御された)成長を伴わない静的と動的の2つの変数について検討した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:37:57 GMT)
Leveraging Interview-Informed LLMs to Model Survey Responses: Comparative Insights from AI-Generated and Human Data [4.8] 混合手法の研究は量的および質的なデータを統合するが、それらの異なる構造を整合させる際の課題に直面している。
本研究では,大規模言語モデル(LLM)が人間の調査応答を確実に予測できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:57:26 GMT)
You Do Not Fully Utilize Transformer's Representation Capacity [4.8] LIMe(Layer-Integrated Memory)は、階層単位のルーティング重み付けを学習し、以前のすべてのレイヤからの表現を無視可能なオーバーヘッドで統合する軽量な拡張である。
LIMeは一貫して高速収束、FLOPあたりのパープレキシティの低下、および合成タスクの大幅な精度向上を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:04:00 GMT)
IKIWISI: An Interactive Visual Pattern Generator for Evaluating the Reliability of Vision-Language Models Without Ground Truth [4.7] IKIWISI (I Know It When I See It) は、ビデオオブジェクト認識における視覚言語モデルを評価するための対話型視覚パターン生成装置である。
このツールは認知監査機構として機能し、人間と機械の認識のミスマッチを克服する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:41:08 GMT)
Fully Heteroscedastic Count Regression with Deep Double Poisson Networks [4.6] Deep Double Poisson Network (DDPN) はニューラル・離散カウント回帰モデルである。
DDPNはヘテロセダスティックガウスモデルと同様の頑健な回帰特性を示す。
多様なデータセットの実験では、DDPNが現在のベースラインを精度、キャリブレーション、アウト・オブ・ディストリビューション検出で上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:30:47 GMT)
Spectral clustering for dependent community Hawkes process models of temporal networks [4.6] 時間ネットワークは、しばしばノードペア間のコミュニティ構造と強い依存パターンを示す。
我々は、依存コミュニティホークス(DCH)モデルと呼ばれるモデルのクラスに対して統計結果を提供する。
事象数行列上のスペクトルクラスタリングの誤クラスタリング誤差の非漸近上界を導出する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:25:10 GMT)
RAD: Redundancy-Aware Distillation for Hybrid Models via Self-Speculative Decoding [4.5] 自己投機的復号を診断ツールとして用いる新しいフレームワークであるRAD(redundancy-Aware Distillation)を提案する。
RADを用いた自己蒸留が元のベースモデルの性能を大幅に上回っていることを実験的に実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:59:02 GMT)
AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings [4.5] クロスモーダル埋め込みはマルチモーダルモデルの基盤となる。
PCAやt-SNEのような伝統的な次元還元(DR)技術は、複数のモードでメトリクスを組み込むことができない。
AKRMap(AKRMap)は、モーダルな埋め込み距離を精度良く可視化する新しいDR技術である。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:27:59 GMT)
Test-time augmentation improves efficiency in conformal prediction [4.5] テスト時間拡張(TTA)は推論中に帰納バイアスを導入し、共形分類器によって生成される集合のサイズを再現することを示した。
TTAは任意のコンフォメーションスコアと組み合わせることができ、モデルの再トレーニングを必要とせず、予測セットのサイズを平均で10%-14%削減できる。
3つのデータセット、3つのモデル、2つの確立されたコンフォメーションスコアリング方法、異なる保証強度、そして、テスト時間拡張がコンフォメーションパイプラインに有用な追加である理由を示すために、いくつかの分散シフトを評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:29:31 GMT)
Safeguarding Privacy of Retrieval Data against Membership Inference Attacks: Is This Query Too Close to Home? [4.5] Mirabelは、RAGシステム用に設計された類似性に基づくMIA検出フレームワークである。
単純な検出・隠蔽戦略は攻撃者を難読化し、データユーティリティを維持でき、システムに依存しないことを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:35:07 GMT)
Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts [4.5] 空間的推論を強化するための新しいMLLMである ViCA2 (Visuospatial Cognitive Assistant 2) を紹介する。
ViCA2は、セマンティクスのためのSigLIPと空間構造のためのHieraを統合したデュアルビジョンアーキテクチャと、効率のためのトークン比制御機構を備えている。
また,322,000以上の質問応答対を持つ大規模認知データセットであるViCA322Kを開発した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:29:25 GMT)
Which Retain Set Matters for LLM Unlearning? A Case Study on Entity Unlearning [4.4] 大規模言語モデル(LLM)は、トレーニングデータから無許可または機密情報を保持するリスクがあり、プライバシー上の懸念を引き起こす。
LLMは、モデル全体のパフォーマンスを維持しながら、指定されたデータを選択的に削除することで、これらのリスクを軽減することを目指している。
我々は、類似した構文構造と削除を目的としたデータを共有するクエリ群であるSyntactically similar Neighbor Setを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:29:46 GMT)
AquaMonitor: A multimodal multi-view image sequence dataset for real-life aquatic invertebrate biodiversity monitoring [4.4] AquaMonitorは、通常の環境モニタリング中に収集された水性無脊椎動物のコンピュータビジョンデータセットとしては初めてのものだ。
データセットは43,189の標本から2.7Mの画像、1358の標本のDNA配列、1494の標本の乾物量と大きさの計測を含む。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:45:20 GMT)
Large Neighborhood and Hybrid Genetic Search for Inventory Routing Problems [4.4] 在庫ルーティング問題(IRP)は、サプライヤーから小売業者に数日にわたって在庫と流通業務を共同で最適化することに焦点を当てている。
我々は、IRPに適した新しい大規模地区探索演算子を開発する。
具体的には、オペレーターは、ルーティングと在庫コストを最小限に抑えながら、特定の小売業者へのすべての訪問を最適に取り除き、再試行する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:18:08 GMT)
Emotion-o1: Adaptive Long Reasoning for Emotion Understanding in LLMs [4.4] 本稿では,DeepSeek-R1を用いたタスク適応推論フレームワークを提案する。
実験結果は、4つのタスクでAccとF1のスコアが一貫した改善を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:32:16 GMT)
Unlocking Mental Health: Exploring College Students' Well-being through Smartphone Behaviors [4.4] 本研究は,学生のスマートフォンロック解除行動と,実環境におけるメンタルヘルスとの関係について,初めて検討したものである。
調査の結果、性別や場所によってスマートフォンの利用が重要な変化を示し、デジタル行動とメンタルヘルスの相互作用をより深く理解していることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:51:22 GMT)
Agent-UniRAG: A Trainable Open-Source LLM Agent Framework for Unified Retrieval-Augmented Generation Systems [4.3] 本稿では,最近の大規模言語モデル (LLM) エージェントの概念を用いたRAGシステムに対する新しいアプローチを提案する。
本稿では,統合検索拡張LLMシステムのためのエージェントUniRAGと呼ばれるトレーニング可能なエージェントフレームワークを提案する。
主なアイデアは、入力の複雑さに基づいてRAGタスクを段階的に解決するLLMエージェントフレームワークを設計することである。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:46:31 GMT)
Tracking Semantic Change in Slovene: A Novel Dataset and Optimal Transport-Based Distance [4.3] 我々は、200万人の話者を持つあまりリソースの乏しいスラヴ語であるSloveneにおける意味的変化の検出に焦点をあてる。
セマンティックチェンジ検出システムを評価するための最初のSloveneデータセットを提案する。
本稿では, セマンティックな変化を定量化するための, より堅牢なフレームワークを提供する, 正規化された最適輸送に基づく新しい計量法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:23:56 GMT)
A Physics-Informed Learning Framework to Solve the Infinite-Horizon Optimal Control Problem [4.2] 非線形システムの無限水平最適制御問題を解くために,物理インフォームドニューラルネットワーク(PINN)フレームワークを提案する。
代わりに、一意解を持つ定常HJBの有限水平変種にPINNを適用することで、この問題に取り組む。
多くの既存手法とは異なり、提案手法は非ポリノミカル基底関数とうまく機能する。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:21:49 GMT)
Mouse Lockbox Dataset: Behavior Recognition for Mice Solving Lockboxes [4.2] 複雑な機械パズル、いわゆるロックボックスを解く個々のマウスのビデオデータセットを提示する。
110時間以上のプレイタイムは、3つの異なる視点から記録された行動を示す。
フレームレベルの行動分類手法のベンチマークとして、2つの異なるマウスのすべてのビデオに対して、人間のアノテーション付きラベルを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:16:09 GMT)
The informativeness of the gradient revisited [4.2] 対象関数クラスのペア独立性に関連するパラメータの観点から、分散の一般性を与える。
理論的解析に加えて,近年の学習者による学習の誤りに対する深層学習に基づく攻撃の性質をよりよく理解するための実験も提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:23:37 GMT)
Deficient Excitation in Parameter Learning [4.2] 本稿では,不足励起(DE)下でのパラメータ学習問題について検討する。
提案したオンラインアルゴリズムは、識別可能部分空間と識別不能部分空間を計算できる。
識別可能な部分空間内の学習誤差は、ノイズフリーの場合において指数関数的に0に収束する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:05:58 GMT)
Understanding Adversarial Training with Energy-based Models [4.1] 我々は,エネルギーベースモデル(EBM)フレームワークを用いて,分類器の対人訓練(AT)をよりよく理解することを目指している。
我々は既存のATアプローチがトレーニング中のサンプルのエネルギーに与える影響を分析する。
本稿では,訓練中のエネルギー景観を円滑にするための新しい正則化器であるデルタエネルギー正則化器(DER)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:36:02 GMT)
VulBinLLM: LLM-powered Vulnerability Detection for Stripped Binaries [4.1] Vul-BinLLMは、大規模言語モデルを用いたバイナリ脆弱性検出のためのフレームワークである。
Vul-BinLLMは、拡張コンテキストで逆コンパイルと脆弱性推論を微妙に最適化することで、従来のバイナリ分析を反映している。
評価の結果,Vul-BinLLMはジュリエットデータセットの脆弱性の検出に極めて有効であることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:17:56 GMT)
Entropic Diagram Characterization of Quantum Coherence: Degenerate Distillation and the Maximum Eigenvalue Uncertainty Bound [4.1] 不整合操作下での全ての資源理論公理を満たす多種多様なコヒーレンス測度スイートを導入する。
この統一的アプローチは、フォン・ノイマン=ツァリスエントロピー空間における物理的に実現可能な状態の幾何学的境界を明らかにする。
本研究では, エントロピーに基づく不確実性関係を, マーセン・ウフィンク境界を精製し, 異なる測定基準をまたいだ最大の固有値を求めることにより強化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:35:47 GMT)
Learning Safe Strategies for Value Maximizing Buyers in Uniform Price Auctions [4.1] 単価最大化バイヤーの観点から、単価の複数ユニットオークションを繰り返す入札問題について検討する。
競売によらず,すべての競売においてRoI制約を満たすような安全な入札戦略を導入する。
実世界のオークションから得られた半合成データの実験により、安全な戦略は導出された理論的戦略を大幅に上回ることを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:35:29 GMT)
Partite-wise Entanglement [4.1] 3量子GHZ状態の2部還元状態として$rhoAB$は分離可能であることが知られているが、part $A$とpart $B$は、part $C$をトレースせずに実際に互いに絡み合っている。
ここでは任意の次元を持つ任意の$n$-partiteシステムにおいてそのような絡み合いを探求し、[Phys. Rev. A 110, 032420(2024)]で提案されたペアエンタングル(PE)を含むパーティタイト・エンタングルメント(PWE)と呼ぶ。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:43:57 GMT)
Improving Out-of-Distribution Detection with Markov Logic Networks [4.0] オープンワールドシナリオで動作するディープラーニングモデルの信頼性を確保するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
本研究はマルコフ論理ネットワーク(MLN)を利用した確率論的推論による既存のOOD検出器の拡張を提案する。
MLNは計算効率を保ちながら,既存のOOD検出器の性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:00:37 GMT)
Multi-Label Bayesian Active Learning with Inter-Label Relationships [3.9] 両課題に対処する多ラベルアクティブラーニング戦略を提案する。
本手法は, 漸進的に更新された正相関行列と負相関行列を組み込んで, 共起関係と解離関係を捉える。
私たちの戦略は、いくつかの確立された方法と比較して、信頼性と優れたパフォーマンスを継続的に達成します。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:54:03 GMT)
Message-Passing GNNs Fail to Approximate Sparse Triangular Factorizations [3.9] 疎行列プレコンディショナを学習するためのツールとして,グラフニューラルネットワーク(GNN)が提案されている。
本稿では、メッセージパッシングGNNは、疎三角形の分解を近似できないことを論じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:53:55 GMT)
ClaimPKG: Enhancing Claim Verification via Pseudo-Subgraph Generation with Lightweight Specialized LLM [3.9] ClaimPKGは、LLM推論と知識グラフ(KG)からの構造化知識をシームレスに統合するエンドツーエンドフレームワークである。
ClaimPKGは最先端のパフォーマンスを達成し、複数のカテゴリで9%-12%の精度で高いベースラインを達成している。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:34:14 GMT)
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning [3.9] オフライン強化学習(RL)は、固定データセットからポリシーを学ぶが、しばしば大量のデータを必要とする。
本稿では,カーネル関数近似を用いたオフラインRL法において,ラベルなしデータを利用するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:42:49 GMT)
Smart Surrogate Losses for Contextual Stochastic Linear Optimization with Robust Constraints [3.8] 機械学習モデルにより予測される不確実なパラメータに依存する不等式制約を含む文脈線形最適化(CSLO)の拡張について検討する。
制約の不確実性に対処するために、共形予測のような手法を用いて構築された文脈不確実性集合を用いる。
本研究では,SPORC+が制約の不確かさを効果的に処理し,重み付けと重み付けを併用することで,さらなる性能向上が期待できることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:29:40 GMT)
Lifted Forward Planning in Relational Factored Markov Decision Processes with Concurrent Actions [3.8] 対象数の指数的サイズではなく,空間を格納する一階表現を提案する。
我々はまた、この表現を用いて、多くの識別不能なオブジェクトやアクションに対するポリシーを効率的に計算する、リレーショナル・フォワード・プランナーであるForeplanを紹介した。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:08:27 GMT)
Fine-Grained and Thematic Evaluation of LLMs in Social Deduction Game [3.8] 本研究では,大言語モデル(LLM)が,サブテキストの推測やダブルスピークといった特殊なスキルを必要とする不明瞭なコミュニケーションをサポートできるかどうかを検討する。
本論では,彼らが採用した評価手法に関する2つの問題点を指摘し,第1の課題を解決するための7つのきめ細かい指標を紹介した。
2つ目の課題に対処するため,本論文ではテーマ分析を行い,LLMの性能を損なう4つの主要な原因を同定した。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:45:37 GMT)
Gender-Neutral Large Language Models for Medical Applications: Reducing Bias in PubMed Abstracts [3.8] 本稿では, 職業代名詞を中和することにより, 医療文献で用いられる大規模言語モデルにおける性別バイアスを軽減するためのパイプラインを提案する。
1965年からの379,000のPubMed抽象語のデータセットは、専門職に関連する代名詞を識別し、修正するために処理された。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:06:30 GMT)
From Kernels to Features: A Multi-Scale Adaptive Theory of Feature Learning [3.8] 本研究は,2つの視点を橋渡しする多段階適応型特徴学習の理論的枠組みを示す。
ネットワークの確率分布の体系的な拡張により、平均場スケーリングはサドル点近似のみを必要とすることが明らかになった。
線形および非線形ネットワークの場合、マルチスケール適応アプローチは指向性特徴学習効果をキャプチャする。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:21:28 GMT)
A Linguistically Motivated Analysis of Intonational Phrasing in Text-to-Speech Systems: Revealing Gaps in Syntactic Sensitivity [3.7] 我々は、心理言語学的研究にインスパイアされた手法を用いて、テキスト音声(TTS)システムの統語感度を解析した。
TTSシステムは,構文境界が曖昧な文において,国際句境界を正確に生成するのに苦労していることがわかった。
構文的境界位置のコマを含まない文でモデルを微調整し、より微妙な言語的手がかりに焦点を合わせるよう促す。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:11:29 GMT)
How Do Diffusion Models Improve Adversarial Robustness? [3.7] 本研究では,拡散モデルによる対向ロバスト性の改善について検討する。
精製された画像は拡散モデルの内部ランダム性に大きく影響されていることがわかった。
本研究は,拡散型精製のメカニズムに関する新たな知見を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:19:21 GMT)
LLäMmlein: Compact and Competitive German-Only Language Models from Scratch [3.7] 我々は、2つのドイツ専用デコーダモデル、LL"aMmlein 120Mと1Bを作成し、それらをスクラッチから透過的に公開し、トレーニングデータとともに、ドイツのNLP研究コミュニティが使用できるようにしました。
モデルトレーニングには、広範なデータ前処理、カスタムなドイツのトークン化器の作成、トレーニング自体、および様々なベンチマークの最終モデルの評価など、いくつかの重要なステップが含まれていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:38:43 GMT)
Oryx: a Performant and Scalable Algorithm for Many-Agent Coordination in Offline MARL [3.7] オフラインマルチエージェント強化学習(MARL)における鍵となる課題は、複雑な環境で効果的なマルチエージェント多段階協調を実現することである。
この課題に対処するために,オフライン協調型MARLのための新しいアルゴリズムであるOryxを提案する。
Oryxは65のテストデータセットの80%以上で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:17:44 GMT)
LaMDAgent: An Autonomous Framework for Post-Training Pipeline Optimization via LLM Agents [3.6] トレーニング後の完全なパイプラインを自律的に構築し、最適化するフレームワークであるLaMDAgentを紹介します。
LaMDAgentは、ツールの使用精度を9.0ポイント向上し、命令追従機能を保持する。
従来の人間主導の探査で見落とされがちな効果的なポストトレーニング戦略を明らかにする。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:30:51 GMT)
Self-supervised Learning Method Using Transformer for Multi-dimensional Sensor Data Processing [3.6] センサ信号を入力として,人間の行動認識のための深層学習アルゴリズムを開発した。
本研究では,Transformerアーキテクチャに基づく事前学習型言語モデルを構築した。
3つの重要な特徴を組み込んだn次元数値処理変換器を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:04:13 GMT)
Train Sparse Autoencoders Efficiently by Utilizing Features Correlation [3.6] 我々は Kronecker 積分解による潜在表現を分解する新しいアーキテクチャ KronSAE を提案する。
また、二項演算と演算を近似した識別可能なアクティベーション関数mANDを導入し、解釈性と性能を向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:41:11 GMT)
iDSE: Navigating Design Space Exploration in High-Level Synthesis Using LLMs [3.6] 高レベル合成はアジャイルなハードウェア開発ツールとして機能します。
伝統的な設計空間探索法(DSE)は、いまだに違法な探査コストと準最適結果に悩まされている。
我々は,設計空間を効果的にナビゲートするために,設計品質の認識を活用する最初のLLM支援型DSEフレームワークであるiDSEを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:08:57 GMT)
Improving Rule-based Reasoning in LLMs using Neurosymbolic Representations [3.6] 大規模言語モデル(LLM)は、推論タスクを確実に解決する上で、引き続き課題に直面している。
本稿では,隠れた状態をニューロシンボリックベクターにエンコードすることで,LLM推論を改善する新しいニューロシンボリック手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:56:33 GMT)
PS4PRO: Pixel-to-pixel Supervision for Photorealistic Rendering and Optimization [3.5] 本稿では,ニューラルレンダリングのためのデータ拡張手法としてビデオフレームを提案する。
PS4PROは様々なビデオデータセットに基づいて訓練されており、暗黙的にカメラの動きと現実世界の3D幾何学をモデル化している。
以上の結果から,静的シーンと動的シーンの両方における再構成性能が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:35:39 GMT)
Closed-Form Training Dynamics Reveal Learned Features and Linear Structure in Word2Vec-like Models [3.5] word2vecのような自己教師付き単語埋め込みアルゴリズムは、言語モデリングにおける表現学習を研究するための最小限の設定を提供する。
ダウンストリームタスクにおけるトレーニングダイナミクスと最終性能は、経験的に word2vec と非常によく似ていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:55:00 GMT)
Meta Co-Training: Two Views are Better than One [3.4] 協調学習アルゴリズムは、2つの異なるモデルを利用して、異なる独立かつ十分な表現やデータの"ビュー"にアクセスし、より優れた予測を行う。
独立ビューが利用できない一般的な場合、事前訓練されたモデルを用いて、そのようなビューを安価に構築できることが示される。
そこで我々は,新しい半教師付き学習アルゴリズムであるMeta Co-Trainingを提案する。これはコトレーニングよりも2つの利点がある: (i)学習は,異なるビューの情報内容の間に大きな相違がある場合に,より堅牢であり, (ii)反復ごとにスクラッチから再トレーニングする必要がない。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:01:10 GMT)
Limited Generalizability in Argument Mining: State-Of-The-Art Models Learn Datasets, Not Arguments [3.4] この研究は、このような最先端モデルの大規模な再評価を初めて提供する。
我々は,4つの変圧器,3つの標準,および1つの拡張を,より優れた一般化のためのコントラスト事前学習で評価した。
以上の結果から,これらのモデルは,内容語に結びついた語彙的ショートカットに依存する傾向が示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:00:56 GMT)
Safeguarding AI in Medical Imaging: Post-Hoc Out-of-Distribution Detection with Normalizing Flows [3.4] 現在のOOD検出方法は、事前訓練されたモデルに非現実的な再訓練または修正を要求する。
本稿では,既存の事前学習モデルとシームレスに統合する,ポストホック正規化フローベースアプローチを提案する。
我々の方法は84.61%のAUROCを達成し、ViM (80.65%) やMDS (80.87%) といった最先端の手法より優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:40:26 GMT)
Higher-Order Group Synchronization [3.4] グループ同期は、ネットワーク上のノイズの多い局所的な測定から信頼性の高いグローバル推定を決定する問題である。
ハイパーグラフ上で動作する新しい高階群同期問題を導入する。
数値実験により,本手法の潜在的な利点を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:37:10 GMT)
From Coders to Critics: Empowering Students through Peer Assessment in the Age of AI Copilots [3.3] 本稿では,大規模プログラミングコースで実装されたルーリックベースで匿名化されたピアレビュープロセスについて,実証的研究を行う。
学生同士の最終プロジェクト(2Dゲーム)を評価し,その評価を,相関,平均絶対誤差,根平均二乗誤差(RMSE)を用いたインストラクターの成績と比較した。
その結果、ピアレビューは、インストラクターの評価を適度な精度で近似し、学生のエンゲージメント、評価的思考、そして仲間に良いフィードバックを提供することへの関心を高めることができた。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:17:05 GMT)
Kernel-Smoothed Scores for Denoising Diffusion: A Bias-Variance Study [3.3] 拡散モデルは暗記しがちである。
スコアの正規化は、トレーニングデータセットのサイズを増やすのと同じ効果がある。
この視点は、拡散をデノナイズする2つの規則化機構を強調する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:22:18 GMT)
Solver-Informed RL: Grounding Large Language Models for Authentic Optimization Modeling [3.3] 大型言語モデル(LLM)は、しばしば幻覚に対する形式的正当で使用可能なモデルを生成するのに苦労する。
本稿では,検証リワードを用いた強化学習を用いた最適化モデルのためのLLMの信頼性を向上する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:36:33 GMT)
Graph-Assisted Culturally Adaptable Idiomatic Translation for Indic Languages [3.2] マルチワード式(MWE)とイディオムの翻訳には、ソース言語とターゲット言語の両方を深く理解する必要がある。
従来の静的知識グラフ(KG)とプロンプトベースのアプローチは、これらの複雑な関係を捉えるのに苦労する。
慣用的表現間の複雑なマッピングを学習する適応グラフニューラルネットワーク(GNN)に基づく手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:42:16 GMT)
Read Your Own Mind: Reasoning Helps Surface Self-Confidence Signals in LLMs [3.2] 質問応答(QA)タスクにおける自己報告された言語信頼度を分析して,DeepSeek R1-32Bの不確実性の原因について検討した。
我々はDeepSeekに、最終回答の前に長い連鎖を強制することで、その分布を探求する予算を与えることで、その言語スコアの有効性を大幅に改善することを示します。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:01:30 GMT)
Enhancing Semi-supervised Learning with Zero-shot Pseudolabels [3.2] データラベリングの高コストは、大規模に機械学習システムをデプロイする上で大きな障壁となる。
半教師付き学習(SSL)は、ラベル付きデータとラベル付きサンプルを併用することで、この課題を軽減する。
ファンデーションモデル(FM)は、ラベル付けコストをさらに削減できる強力なゼロショット機能を提供する。
我々は知識蒸留と一貫性に基づく学習を統合する新しいSSLフレームワークZeroMatchを紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:49:18 GMT)
HydraNet: Momentum-Driven State Space Duality for Multi-Granularity Tennis Tournaments Analysis [3.1] 本研究は,テニストーナメントにおける選手の運動量レベルを定量化するための新しいモメンタムスコア(MS)尺度を定義する。
運動量駆動型状態空間双対性に基づくフレームワークHydraNetを設計し、MSをモデル化する。
2012-2023 Wimbledonと2013-2023 US Openにまたがる100万レベルのテニスクロスコースデータセットを構築した。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:58:44 GMT)
EdgeVidSum: Real-Time Personalized Video Summarization at the Edge [3.1] EdgeVidSumは、エッジデバイス上で、ロングフォームビデオのパーソナライズされた高速な要約を生成する方法である。
このフレームワークは階層的な分析手法を用いており、軽量な2D CNNモデルによりサムネイルからユーザの好むコンテンツを識別する。
インタラクティブなデモでは、個々のユーザの好みに基づいて、映画、スポーツイベント、テレビ番組などのロングフォームビデオ用に調整されたビデオ要約を作成する能力を強調しています。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:59:41 GMT)
Regression and Forecasting of U.S. Stock Returns Based on LSTM [3.1] 本稿では、米国株式市場における3つの株式セクター、Manuf、Hitec、およびその他の投資リターンについて分析する。
ファマ・フレンチの3要素モデル、カーハートの4要素モデル、ファマ・フレンチの5要素モデルに基づいている。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:42:17 GMT)
RESOUND: Speech Reconstruction from Silent Videos via Acoustic-Semantic Decomposed Modeling [3.1] 視覚的手がかりから音声を再構成するL2S合成は、精度と自然性の課題に直面している。
サイレント・トーキング・フェイス・ビデオから可知で表現力のある音声を生成する新しいL2SシステムRESOUNDを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:46:13 GMT)
Measuring and Controlling Solution Degeneracy across Task-Trained Recurrent Neural Networks [3.0] タスク訓練されたリカレントニューラルネットワーク(RNN)は、計算をモデル化するために神経科学や機械学習で広く使われている。
同じタスクでトレーニングされた異なるRNNと、同様のパフォーマンスを達成することは、ソリューションデリジェンシーとして知られる、非常に異なる内部ソリューションを示す可能性がある。
ここでは、行動、ニューラルダイナミクス、ウェイトスペースという3つのレベルにまたがる解の縮退を定量化し、制御するための統一的なフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:31:26 GMT)
Quantum engineering of high harmonic generation [3.0] 量子サイドバンド高調波発生(QSHHG)では、高調波発生は明るい量子場によって乱される。
射影測定は、量子情報科学で一般的に用いられる様々な非古典状態を生成する。
これにより量子工学の高調波発生への道が開かれ、量子情報科学の短波長光源となる。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:22:01 GMT)
FastFace: Tuning Identity Preservation in Distilled Diffusion via Guidance and Attention [3.0] 蒸留により加速される拡散モデルに対するID適応器の学習自由化の課題に対処する。
我々は、アイデンティティの類似性と忠実性を改善するために、ユニバーサルなFastFaceフレームワークを提案する。
また,ID保存アダプタのための公開評価プロトコルも開発している。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:17:03 GMT)
SAT Strikes Back: Parameter and Path Relations in Quantum Toolchains [3.0] ハードウェア固有の)メトリクスのために最適化された(複数の)変換パスを見つけることが重要です。
我々は、k-SATインスタンスを入力としてフォーカスし、QUBOへの変換を行うことにより、この変換ツリーを拡大する。
私たちの結果は、自動(量子)ツールチェーンにおいても、前もって変換の有効なパスを評価するために使用できます。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:32:37 GMT)
From Controlled Scenarios to Real-World: Cross-Domain Degradation Pattern Matching for All-in-One Image Restoration [3.0] All-in-One Image Restoration (AiOIR) は、統一されたパラメータを持つ単一モデルを用いて、複数の劣化パターンによる画像復元を実現することを目的としている。
UDAIRフレームワークは、ソースドメインからターゲットドメインへの学習知識を活用することにより、AiOIRを効果的に実現するために提案されている。
10のオープンソースデータセットの実験結果は、UDAIRがAiOIRタスクのための新しい最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:22:00 GMT)
A Hybrid Multi-Factor Network with Dynamic Sequence Modeling for Early Warning of Intraoperative Hypotension [3.0] 過去の生理的信号を用いた術中低血圧(IOH)予測は重要である。
動的シーケンス予測タスクとしてIOH予測を定式化するハイブリッドマルチファクターネットワークを提案する。
公立と実世界の両方の臨床データセットの実験では、HMFが競争ベースラインを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:04:12 GMT)
Domain Adaptation of Attention Heads for Zero-shot Anomaly Detection [3.0] 本稿では,テキストエンコーダと画像エンコーダの両方を効果的にドメインに適応させることにより,制限を克服するHeadCLIPを提案する。
HeadCLIPはテキストエンコーダの学習可能なプロンプトを通じて正規性と異常の概念を一般化する。
HeadCLIPは、既存のZSAD技術よりもピクセルレベルと画像レベルで優れていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:45:51 GMT)
Transformers for Secure Hardware Systems: Applications, Challenges, and Outlook [3.0] トランスフォーマーモデルは、複雑な依存関係をモデル化できるため、セキュリティ領域で注目を集めている。
この調査は、ハードウェアセキュリティにおけるTransformerの使用に関する最近の進歩をレビューする。
サイドチャネル分析、ハードウェアトロイの木馬検出、脆弱性分類、デバイスのフィンガープリント、ファームウェアセキュリティなど、主要な領域にわたるアプリケーションを調査している。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:22:14 GMT)
CADRE: Customizable Assurance of Data Readiness in Privacy-Preserving Federated Learning [2.9] FL用のCADRE(Customizable Assurance of Data Readiness)は、ユーザがカスタムデータ準備標準を定義することを可能にする新しいフレームワークである。
既存のPPFLフレームワークに統合することで、フレームワークの実践的応用を実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:24:46 GMT)
Compression versus Accuracy: A Hierarchy of Lifted Models [2.8] 本稿では,モデルの階層性を保証するために,$varepsilon$値の階層構造を示す。
ACPを実行するために、特定の$varepsilon$値を選択するとき、圧縮と精度を明示的に重み付けすることができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:27:32 GMT)
Look & Mark: Leveraging Radiologist Eye Fixations and Bounding boxes in Multimodal Large Language Models for Chest X-ray Report Generation [2.8] Look & Mark (L&M) は、放射線医学的アイフィクス(Look)とバウンディングボックスアノテーション(Mark)を統合した新しい接地固定戦略である。
LLaVA-OVは87.3%の臨床平均成績(C.AVG)を達成しており、L&Mとインコンテキストラーニングを組み合わせた汎用モデルもすべてのモデルの中で最高である。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:54:40 GMT)
Pre-Training Curriculum for Multi-Token Prediction in Language Models [2.8] MTP(Multi-token Prediction)は、最近提案された言語モデルのための事前学習目標である。
本稿では,MTPトレーニングのためのカリキュラム学習戦略を提案し,前向きカリキュラムと逆カリキュラムの2つの変種を探索する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:19:18 GMT)
Simulation of single hole spin qubit in strained triangular FinFET quantum devices [2.8] 必要な量子ドット(QD)のゲート誘起生成は、ルッティンガー・コーン6x6 kp法に基づいて監視される。
これらの指標は, ひずみ依存性の強い大きさ変化を示すことを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:54:20 GMT)
HiLDe: Intentional Code Generation via Human-in-the-Loop Decoding [2.8] 本稿では,コード生成中のLCM決定を観察・直接的に影響を与える新しいインタラクション技術であるHuman-in-the-loop Decodingを提案する。
我々はこの手法を,LLMが決定する重要な決定を強調し,ユーザが探索するローカルな代替手段を提供するコード補完アシスタントであるHiLDeに実装する。
セキュリティ関連のタスクに関する調査(N=18)では、HiLDeが参加者に重大な脆弱性を発生させ、コード生成と目標の整合性を向上させたことが分かりました。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:11:17 GMT)
FastMamba: A High-Speed and Efficient Mamba Accelerator on FPGA with Accurate Quantization [2.7] 本稿では,ハードウェアアルゴリズムを併用したFPGA専用アクセラレータであるFastMambaについて述べる。
具体的には,アダマール変換により線形層に対して8ビットの量子化を実現し,出力値の除去に成功した。
Mamba2-2.7Bの出力デコード実験では、FastMambaはGTX 3090 GPUの6倍のエネルギー効率を実現している。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:37:58 GMT)
ImageReFL: Balancing Quality and Diversity in Human-Aligned Diffusion Models [2.7] 人間のフィードバックに基づいてトレーニングされたモデルを用いた逆向きの微調整は、アライメントを改善するが、しばしば多様性を損なう。
生成過程の後半にのみ報酬調整拡散モデルを適用する新しいサンプリング戦略であるテキスト組換え生成を導入する。
第2に,実画像のトレーニングによる画質の低下を最小限に抑えながら,画像の多様性を向上させる微調整手法である textitImageReFL を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:45:07 GMT)
Learning to Infer Parameterized Representations of Plants from 3D Scans [2.7] 我々はL-systemsベースの手続きモデルを用いて仮想植物でニューラルネットワークを訓練する。
トレーニング後、このネットワークは入力された3Dポイントクラウドに基づいてパラメトリックツリーのような表現を推論することができる。
ケノポジウム・アルバム植物に対する我々のアプローチを,合成植物実験を用いて評価し,我々の統合されたフレームワークが様々なタスクを担っていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:23:48 GMT)
Optimal kernel regression bounds under energy-bounded noise [2.7] カーネルベースの推定のために、厳密で漸近的でない不確実性を導出する。
カーネルベースの推定値に対して,厳密で計算が容易なバウンダリを返却する効果を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:11:24 GMT)
Space-bounded quantum interactive proof systems [2.6] 空間有界量子対話型証明システムの2つのモデル、$sf QIPL$と$sf QIP_rm UL$を紹介する。
一方、$sf QIPL$は検証動作毎に多数のピンチ中間測度を対数的に許容する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:01:47 GMT)
GL-PGENet: A Parameterized Generation Framework for Robust Document Image Enhancement [2.6] ドキュメント画像強調(DIE)は、ドキュメントAIシステムにおいて重要なコンポーネントであり、そのパフォーマンスが下流タスクの有効性を決定する。
マルチ劣化カラー文書画像のための新しいアーキテクチャであるGlobal with Local Parametric Generation Enhancement Network (GL-PGENet)について述べる。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:37:06 GMT)
Evaluating Supervised Learning Models for Fraud Detection: A Comparative Study of Classical and Deep Architectures on Imbalanced Transaction Data [2.6] 不正検出は金融や電子商取引といった高額な分野において依然として重要な課題である。
大規模かつ高度に不均衡なオンライントランザクションデータセット上で、4つの教師付き学習モデルの性能を体系的に比較する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:08:04 GMT)
Context-sensitive neocortical neurons transform the effectiveness and efficiency of neural information processing [2.6] ディープラーニング(DL)は、多くの現実世界のドメインの人間に匹敵する、あるいはそれ以上に優れたビッグデータ処理能力を持つ。
しかし、いくつかのアプリケーションでは持続不可能な高エネルギー要求とエラーのコストでは、しばしば発生するが、大きなものになり得る。
本研究は, 文脈に敏感な新皮質ニューロンの機能を模倣することにより, これらの制限を回避する方法を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:30:36 GMT)
Predicting Human Depression with Hybrid Data Acquisition utilizing Physical Activity Sensing and Social Media Feeds [2.5] うつ病、不安、その他の神経疾患などの精神障害は、世界的な大きな課題となっている。
本研究では,日々の身体活動を測定し,ソーシャルメディア(Twitter)のインタラクションを分析するスマートフォンセンサデータを活用するハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:47:34 GMT)
A Checks-and-Balances Framework for Context-Aware Ethical AI Alignment [2.5] 本稿では,大規模言語モデル(LLM)の倫理的アライメントのためのチェック・アンド・バランスフレームワークを提案する。
LLMは知識生成の執行部門、DIKEは倫理的ガードレールを確立する立法部門、ERISは文脈解釈の司法部門である。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:28:29 GMT)
Comparing Human and AI Rater Effects Using the Many-Facet Rasch Model [2.5] 大規模言語モデル (LLM) は, ローテイク評価において, 自動スコアリングのために広く研究されている。
本研究は,10個のLDMと人間専門家による2種類の筆記課題を比較検討した。
結果は、ChatGPT 4o、Gemini 1.5 Pro、Claude 3.5 Sonnetの使用を高いスコアリング精度、より高いレーダ信頼性、より低いレーダ効果でサポートした。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:07:32 GMT)
In Dialogue with Intelligence: Rethinking Large Language Models as Collective Knowledge [2.5] 大規模言語モデル(LLM)は通常、アーキテクチャ、振る舞い、トレーニングデータレンズを通して分析される。
この記事では、理論的かつ経験的再フレーミングについて述べる。 LLMs as dynamic instantiations of Collective Human Knowledge (CK)。
そこで我々は,創発的対話パターン,微調整の意味,協調の概念,人間と機械の認知の相互強化について検討した。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:36:00 GMT)
GLAMP: An Approximate Message Passing Framework for Transfer Learning with Applications to Lasso-based Estimators [2.5] 一般化長メッセージパッシング(GLAMP)について紹介する。
GLAMPはAMPの範囲を大幅に拡大し、これまで到達できなかった移動学習推定器の分析を可能にした。
本稿では,3つのラッソ型移動学習推定器のリスクを正確に評価することにより,GLAMPの有用性を実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:05:09 GMT)
LoKI: Low-damage Knowledge Implanting of Large Language Models [2.5] 微調整は特定のタスクに対して事前訓練されたモデルに適応するが、破滅的忘れ(CF)のリスクを引き起こす
textbfLow-damage textbfKnowledge textbfImplanting (textbfLoKI)を提案する。
2つの実世界のシナリオにおいて、LoKIは、完全な微調整とLoRAベースのメソッドに匹敵する、あるいはそれ以上のタスク固有のパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:47:26 GMT)
On the Intractability of Chaotic Symbolic Walks: Toward a Non-Algebraic Post-Quantum Hardness Assumption [2.4] シンボリックパス反転問題 (SPIP) は、Z2 上の有界雑音を持つ収縮アフィン写像によって生成されるシンボリックトラジェクトリに基づく新しい計算硬度仮定である。
従来のシステムとは異なり、SPIPは本質的に非代数的であり、計算的に不可能な逆転を描画するためにカオス的な記号進化と丸め誘導された非射影に依存する。
我々はSPIPがPSPACE-hardおよび#P-hardであることを証明し、短い記号列でさえ1つのエンドポイントに対して500以上の有効な軌道を生成できることを経験的シミュレーションによって証明した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:56:00 GMT)
Entropy-regularized Gradient Estimators for Approximate Bayesian Inference [2.4] 本稿では,Kulback-Leibler分散系の勾配流を近似することにより,ベイズ後部を推定し,多様なサンプルを生成する。
本研究は, モデルベース強化学習における手法の性能評価と有効性を検討するために, 分類タスクに関する経験的評価を行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:24:03 GMT)
Bridging Scales in Map Generation: A scale-aware cascaded generative mapping framework for seamless and consistent multi-scale cartographic representation [2.4] マルチスケールタイルマップは地理情報サービスに不可欠であり、測量と地図の基本的な成果となる。
現在のアプローチでは、動的マルチスケール生成と地図一般化原理の不十分な統合とタイルワイズ生成による空間的不連続の2つの根本的な課題に直面している。
本研究では,条件付き誘導拡散とマルチスケールカスケードアーキテクチャを利用するスケール対応地図生成フレームワーク(SCGM)を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:03:48 GMT)
Random Feature Representation Boosting [2.4] 本稿では, ブースティング理論を用いて, RFNNを構成する新しい手法であるRandom Feature Representation Boosting(RFRBoost)を紹介する。
RFRBoostは各レイヤでランダムな機能を使用してネットワーク表現の機能的勾配を学習し、RFNNの凸最適化の利点を保ちながら性能を向上させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:25:44 GMT)
Infinite-dimensional Mahalanobis Distance with Applications to Kernelized Novelty Detection [2.4] マハラノビス距離の概念を分離可能なバナッハ空間に拡張し、確率測度に付随するキャメロン・マルティンノルムとして再解釈する。
このアプローチは、いわゆる分散ノルムを通じて、ベースフリーでデータ駆動の異常距離の概念をもたらす。
12の実世界のデータセットに関する実証的研究において、核化された最も近いマハラノビス距離が従来の核化されたマハラノビス距離より優れていることを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:12:53 GMT)
EventEgoHands: Event-based Egocentric 3D Hand Mesh Reconstruction [2.4] 3Dハンドメッシュの再構築は難しいが、人間とコンピュータのインタラクションとAR/VRアプリケーションにとって重要な課題である。
本研究では,イベントベースの手メッシュ再構築手法であるEventEgoHandsを提案する。
本手法では,ハンド領域を抽出し,動的バックグラウンドイベントの影響を効果的に緩和するハンドモジュールを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:32:42 GMT)
Event-based Egocentric Human Pose Estimation in Dynamic Environment [2.4] スポーツモーション分析、VR/AR、ウェアラブルデバイスのためのAIといった応用には、前面のエゴセントリックカメラを使用して人間のポーズを推定することが不可欠である。
本研究では,頭部に装着した前面イベントベースカメラを用いて人間のポーズ推定を行う新しいタスクを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:13:01 GMT)
Distinguishing Fact from Fiction: Student Traits, Attitudes, and AI Hallucination Detection in Business School Assessment [2.3] 本研究では,英国ビジネススクールにおいて,学術的スキル,認知的特徴,AI懐疑主義が,事実的不正確なAI生成反応(幻覚)を検出する能力にどのように影響するかを検討する。
幻覚の同定に成功したのは20%に過ぎず、強力な学業成績、解釈スキル思考、習熟度、AI懐疑主義が重要な予測因子として現れている。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:39:57 GMT)
Do we still need Human Annotators? Prompting Large Language Models for Aspect Sentiment Quad Prediction [2.3] 本稿では,ASQPタスクにおけるゼロおよび少数ショット学習のための大規模言語モデル(LLM)の機能について検討する。
F1のスコアは、最先端の微調整モデルで得られたものとほぼ同等であり、これまで報告されたゼロショットと少数ショットのパフォーマンスを上回っている。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:36:07 GMT)
Comparative Analysis of Machine Learning Models for Lung Cancer Mutation Detection and Staging Using 3D CT Scans [2.3] 肺がんは世界中のがんの主要な原因であり、重要な突然変異やステージングを検出するための死亡率や非侵襲的な方法は、患者の予後を改善するのに不可欠である。
本稿では、ドメイン固有の事前トレーニングを備えた教師付きモデルであるFMCIB+XGBoostと、注意に基づくマルチインスタンス学習を備えた自己教師型モデルであるDinov2+ABMILの2つの機械学習モデルの性能を比較した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:04:35 GMT)
Tight qubit uncertainty relations studied through weak values in neutron interferometry [2.3] ハイゼンベルクの不確実性原理は、量子測定の誤差と、測定対象に対して誘導された乱れの間のトレードオフ関係を記述している。
普遍的有効関係は2003年に大沢によって導出され、一般的な概念の誤りと乱れを定義する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:54:31 GMT)
BioHopR: A Benchmark for Multi-Hop, Multi-Answer Reasoning in Biomedical Domain [2.3] 既存のベンチマークには、バイオメディカル領域におけるマルチホップ推論を評価する能力がない。
BioHopRは、構造化されたバイオメディカル知識グラフにおけるマルチホップ、マルチアンサー推論を評価するために設計された新しいベンチマークである。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:19:01 GMT)
Base and Exponent Prediction in Mathematical Expressions using Multi-Output CNN [2.2] 本研究は、多出力畳み込みニューラルネットワーク(CNN)を用いた数学的表現の画像から基底と指数の両方を予測するための単純化された効果的なアプローチを提案する。
このモデルは、実世界の条件をシミュレートするために、ランダムノイズ、フォントサイズの変化、およびブラーインテンシティを組み込んだ、指数式を含む10,900の合成画像に基づいて訓練される。
実験結果から,モデルがベースおよび指数値の予測において高い精度を達成し,ノイズや入力画像の変化に対するこのアプローチの有効性が証明された。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:09:42 GMT)
ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning [2.2] ReinFlowは、継続的ロボット制御のためのオンライン強化学習フレームワークである。
学習可能なノイズをフローポリシーの決定論的パスに注入し、フローを離散時間マルコフプロセスに変換する。
代表的な移動と操作タスクでReinFlowをベンチマークします。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:17:16 GMT)
Efficient Dynamic Shielding for Parametric Safety Specifications [2.2] Shieldingは、安全を損なう可能性がある場合、AIコントローラの動作を監視し、介入する必要があるランタイム安全執行ツールである。
パラメトリック安全仕様の動的シールドを導入し,実行時に発生する可能性のあるすべての安全仕様の集合を簡潔に表現する。
実験では、動的シールドはオフライン設計に数分かかり、各ステップでオンライン適応するのに1秒から数秒かかりましたが、ブルートフォースのオンライン再計算アプローチは最大5倍遅くなりました。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:30:03 GMT)
Evolution of repositories and privacy laws: commit activities in the GDPR and CCPA era [2.1] 2016年以降、12,391のリポジトリから37,213のコミットを分析しました。
私たちは、ほとんどのコミットが、法律が施行された日に実行され、プライバシーに関する用語がコミットメッセージに現れるのを観察します。
調査によると、プライバシーユーザーの権利に関する教育活動はもっと必要で、プライバシー勧告のためのツールも必要だ。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:10:58 GMT)
Forecasting Multivariate Urban Data via Decomposition and Spatio-Temporal Graph Analysis [2.1] 本稿では,高度なグラフニューラルネットワーク(GNN)を用いた多変量時系列予測モデルを提案する。
提案モデルでは, 予測の精度と解釈可能性を高めるために, 分解前処理ステップ, 孤立傾向, 季節, 残留成分を組み込んだ。
結果は、スマートインフラストラクチャシステムを最適化するモデルの可能性を強調し、エネルギー効率の高い都市開発と公共福祉の強化に寄与する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:24:04 GMT)
Patient-Aware Feature Alignment for Robust Lung Sound Classification:Cohesion-Separation and Global Alignment Losses [2.1] 患者結合分離損失(PCSL)とグローバル患者配向損失(GPAL)の2つの新たな損失を有する患者認識特徴配向フレームワークを提案する。
GPALは各患者の中心をグローバルな中心へと引きずり出し,特徴空間の断片化を防ぐ。
ICBHIデータセットでは,4クラスで64.84%,2クラスで72.08%のスコアが得られた。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:56:55 GMT)
Judging LLMs on a Simplex [2.1] 一般的な実践は、大言語モデル(LLM)自体を裁判官として使用することであるが、このアプローチの理論的性質はまだよく理解されていない。
判定と候補の両方を確率的単純度上の点として表現する幾何学的枠組みは,何であるか,何であるかを識別できないのか,有用な知見を提供することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:50:41 GMT)
Bayesian Attention Mechanism: A Probabilistic Framework for Positional Encoding and Context Length Extrapolation [2.1] トランスフォーマーベースの言語モデルは、トークンの順序を処理し、コンテキスト長の外挿をサポートするために位置符号化(PE)に依存している。
本稿では,確率モデル内で位置符号化を先行する理論的枠組みであるベイズ注意機構(BAM)を提案する。
BAMは既存の手法(例えば NoPE や ALiBi)を統一し、より長いコンテキストの一般化を大幅に改善する新しい一般化ガウス的位置付けを動機付けている。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:22:23 GMT)
The WHY in Business Processes: Unification of Causal Process Models [2.1] 因果推論はビジネスプロセスの介入と改善に不可欠です。
本稿では,複数の因果過程の変種を一貫したモデルに統一する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:12:30 GMT)
Quantitative Tsirelson's Theorems via Approximate Schur's Lemma and Probabilistic Stampfli's Theorems [2.0] 有限次元において、可観測因子の可換化によって生じる量子相関は、作用素が相互に可換であるような、異なるテンソル積因子の測定から得られるものと等価であることを示す。
例えば、$d-次元の双部量子戦略の可観測値が$epsilon$-almost commute であれば、可観測値は演算ノルムにおいて$O(mathrmpoly(d) epsilon$ の範囲内となる。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:51:27 GMT)
Mustafar: Promoting Unstructured Sparsity for KV Cache Pruning in LLM Inference [2.0] 非構造化空間は、LLMのKVキャッシュ圧縮を大幅に改善する。
非構造化空間下でのキーキャッシュとバリューキャッシュの両方に高い効果が期待できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:32:15 GMT)
Telecom quantum dots on GaAs substrates as integration-ready high performance single-photon sources [2.0] 通信帯域に放出される決定論的単一光子源の開発は、量子通信とフォトニック量子コンピューティングにとって重要な課題である。
本稿では, 分子線エピタキシー成長半導体量子ドットの光学特性と単一光子放出について検討する。
詳細な光学特性解析では、50 mu$eV以下の線幅、分光器分解限界に近い、低微細な構造分割が10 mu$eV、および$g(2) (0)$の値が0.08$である。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:41:56 GMT)
An Efficient Algorithmic Way to Construct Boltzmann Machine Representations for Arbitrary Stabilizer Code [2.0] 制限ボルツマンマシン(RBM)は安定化器の符号状態を表現可能であることを示す。
我々の発見は、高度に絡み合った状態を符号化する能力を強調し、量子誤り訂正符号の古典的シミュレーションに有用なツールとなるかもしれない。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:18:31 GMT)
System-driven Cloud Architecture Design Support with Structured State Management and Guided Decision Assistance [2.0] システム駆動型クラウドアーキテクチャ設計アプリケーションであるCloudArchitectBuddyを紹介します。
16名の業界実践者を対象に行った調査では,ユーザビリティ向上のために,システムの評価が高かった。
結果は、チャットインターフェースを構造化され、ガイドされたワークフローアプローチに統合することで、より実用的なソリューションが生まれることを示唆している。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:47:54 GMT)
Stratified Selective Sampling for Instruction Tuning with Dedicated Scoring Strategy [1.9] マルチステップパイプラインを使用することで、データ選択が効率的かつ普遍的に可能であることを示す。
タスクベースの分類を用いて最終データの構成を制御する。
この統合戦略は、最小限のオーバーヘッドで高性能な微調整を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:22:25 GMT)
Computing Optimal Transport Maps and Wasserstein Barycenters Using Conditional Normalizing Flows [1.8] 本研究では,高次元空間における最適輸送マップとワッサーシュタインバリセンタを効率的に計算する新しい手法を提案する。
提案手法は条件正規化フローを用いて、入力分布を共通潜在空間からの可逆的なプッシュフォワード変換として近似する。
条件分散最小化問題を解くことにより、この手法をワッサーシュタインのバリセンタにどのように拡張するかを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:46:07 GMT)
Fast Trajectory-Independent Model-Based Reconstruction Algorithm for Multi-Dimensional Magnetic Particle Imaging [1.8] 2D Particleoidal Imaging (MPI) は超常磁性ナノ粒子の分布を可視化するための有望な技術である。
MPI再構成は、フォワード演算子の時間消費分布系行列またはモデルに基づくシミュレーションに依存する。
本稿では,モデルベースMPI再構成を用いた実軌道非依存型MPIデータの最初の再構成について述べる。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:13:46 GMT)
Investigating the effectiveness of multimodal data in forecasting SARS-COV-2 case surges [1.7] 新型コロナウイルス(COVID-19)のパンデミック対応は、ケースの頻度や死亡率などの重要な結果を予測するために、統計モデルと機械学習モデルに大きく依存した。
既存のほとんどのモデルは、伝統的な疫学データに基礎を置いているが、ゲノム情報や人間の行動から派生したデータセットの可能性を未発見のまま残している。
本研究は, 生物(突然変異など), 公衆衛生(事例数, 政策介入など), 人間の行動特性(移動性, ソーシャルメディアの会話など)の相対的効果を, 国レベルでのケースサージの予測において強調した。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:00:02 GMT)
Quantum thermodynamic uncertainty relations without quantum corrections: A coherent-incoherent correspondence approach [1.7] コヒーレント-非コヒーレント対応は、コヒーレント進化中の元の量子系と、コヒーレントダイナミクスのない対応する非コヒーレント系の間のマッピングを確立する。
この枠組みは、量子熱力学におけるトレードオフを導出するための一般的な方法を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:53:36 GMT)
StarBASE-GP: Biologically-Guided Automated Machine Learning for Genotype-to-Phenotype Association Analysis [1.6] Star-based Single-locus and Epistasis Analysis Tool - Genetic Programming (StarBASE-GP)を提案する。
StarBASE-GPは、大規模ゲノムデータセットの表現型変異に関連する有意義な遺伝的変異を発見するための自動フレームワークである。
我々は,ラットノベギクス(茶色ラット)のコホート上でStarBASE-GPを評価し,体質量指数に関連する変異を同定した。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:05:15 GMT)
FireQ: Fast INT4-FP8 Kernel and RoPE-aware Quantization for LLM Inference Acceleration [1.6] FireQはPTQフレームワークとINT4-FP8行列乗算カーネルである。
FireQは、線形層重みとキー値をINT4に、アクティベーションとクエリをFP8に量子化する。
プリフィル相の3段配管は、プリフィル相における第1トーケンを減少させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:51:23 GMT)
Personalized Causal Graph Reasoning for LLMs: A Case Study on Dietary Recommendations [1.6] 本稿では,大規模言語モデルを強化するエージェントフレームワークとしてパーソナライズされた因果グラフ推論を提案する。
本研究は, 食生活の暗黙的な影響による個人的推論を必要とする栄養指向の食事レコメンデーションのケーススタディで評価した。
以上の結果から, 提案手法は, 3つの時間窓にまたがる平均グルコースiAUCを減らすために, パーソナライズされたダイエットレコメンデーションを効率的に提供できることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:18:49 GMT)
Beyond Surface-Level Patterns: An Essence-Driven Defense Framework Against Jailbreak Attacks in LLMs [1.6] EDDFはプラグイン・アンド・プレイ方式である。
1)オフライン本質データベースの構築,2)オンライン逆クエリ検出の2段階で動作する。
実験の結果,EDDFはアタック成功率を20%以上下げることにより既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:36:50 GMT)
Embedding Safety into RL: A New Take on Trust Region Methods [1.6] 我々は,信頼領域が安全な政策のみを含むことを保証するために,政策空間を再設定する制約付きトラスト地域政策最適化(C-TRPO)を導入する。
実験により、C-TRPOは競合リターンを維持しながら制約違反を低減することが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:15:49 GMT)
Token embeddings violate the manifold hypothesis [1.6] 各トークン周辺の近傍が、ヌル仮説として比較的平坦で滑らかな構造を持つと仮定する新しい統計テストを示す。
したがって、この証明はトークン部分空間がファイバーバンドルではなく、したがって多様体でもないことを示唆している。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:52:38 GMT)
Deterministic generation of multi-qubit entangled states among distant parties using indefinite causal order [1.6] 複数のネットワークノードにまたがる$N$-qubitの絡み合った状態を生成するためのプロトコルを提案する。
その結果,提案プロトコルは長距離エンタングルメント生成の効率を著しく向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:37:50 GMT)
Physics-inspired Generative AI models via real hardware-based noisy quantum diffusion [1.5] 量子拡散モデル(Quantum Diffusion Models、QDM)は、ジェネレーティブAIにおける新たなパラダイムであり、量子特性を使用して古典的な性能を向上させることを目的としている。
本稿では,物理に着想を得た2つのプロトコルを提案し,実装する。
第一に、量子ウォークの形式主義を用いて、前方過程における量子力学と古典力学の特定の相互作用は、完全に古典力学よりも低いFr'eche't Inception Distance (FID) を持つMNIST画像の集合を生成する統計的により堅牢なモデルを生成することを示した。
第2のアプローチでは、実IBMの本質的な雑音を利用して画像を生成するアルゴリズムを実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:11:48 GMT)
The Impact of the Single-Label Assumption in Image Recognition Benchmarking [1.5] ディープニューラルネットワーク(DNN)は通常、各画像が単一の正しいラベルを持つという仮定の下で評価される。
ImageNetのようなベンチマークの多くの画像には、複数の有効なラベルが含まれており、評価プロトコルと実際の視覚データの複雑さのミスマッチを生成する。
報告された精度ギャップに対するマルチラベル特性の影響を厳格に評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:15:13 GMT)
Localization behavior in a Hermitian and non-Hermitian Raman lattice [1.5] アラカリン線状原子に対するフレキシブルラマン格子系を導入し, 局在化挙動について検討する。
我々は、エルミート政権における不規則ポテンシャルのスピン依存性を調整することによって、臨界位相と移動エッジが生じることを実証する。
スピン選択性原子損失によって導入された非ハーモニティ性により、この系における局在化挙動は散逸によって抑制できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:04:00 GMT)
Robustness and Cybersecurity in the EU Artificial Intelligence Act [1.4] EU人工知能法(英語: EU Artificial Intelligence Act、AIA)は、異なるタイプのAIシステムに対して異なる法的原則を定めている。
我々は、ロバストネスとサイバーセキュリティに関連する条項における法的課題と欠点を特定します。
我々は、堅牢性とサイバーセキュリティがパフォーマンス破壊に対するレジリエンスを要求していることを示します。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:48:43 GMT)
Highly Efficient and Effective LLMs with Multi-Boolean Architectures [1.4] 大型言語モデル(LLM)の複雑さを劇的に減らすための有望な戦略として、重み二項化が登場した。
本稿では,LLMをマルチカーネルブールパラメータに効果的に変換する新しいフレームワークを提案する。
提案手法は,近年の超低ビット量子化法とバイナライゼーション法より優れている。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:40:34 GMT)
UP-SLAM: Adaptively Structured Gaussian SLAM with Uncertainty Prediction in Dynamic Environments [1.4] UP-SLAMは動的環境のためのリアルタイムRGB-D SLAMシステムである。
並列化フレームワークを通じて追跡とマッピングを分離する。
実験により、ローカライズ精度とレンダリング品質の両方において最先端の手法より優れていることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:23:16 GMT)
Pilot-Quantum: A Quantum-HPC Middleware for Resource, Workload and Task Management [1.4] Pilot-Quantumは、ハイブリッド量子古典環境におけるリソースとワークロードの統一されたアプリケーションレベルの管理を提供するように設計されている。
リソース、ワークロード、タスクを管理するために、もともとHPC用に開発されたPilot Abstraction概念モデルを実装している。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:02:42 GMT)
Securing the Software Package Supply Chain for Critical Systems [1.4] ソフトウェアシステムは様々な産業で使われる必需品として成長してきた。
2020年後半に起きたSolarWindsの大規模なハックが示すように、新たな脅威はソフトウェアサプライチェーンをターゲットにしている。
この章は、Proof of Authorityのコンセンサスとマルチパーティ署名を備えた許可付き台帳を含めることで、既存のデリバリフレームワークを強化します。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:42:37 GMT)
MObyGaze: a film dataset of multimodal objectification densely annotated by experts [1.4] 我々は,複雑なマルチモーダル(視覚,音声,音声)の時間的パターンをキャラクタリゼーションし,定量化するための新しいAIタスクを提案する。
対象化レベルと概念について専門家が高密度に注釈を付した20本の映画からなるマルチモーダル・オブジェクトライジング・ゲイズ・データセットを紹介した。
異なる学習課題を定式化し,低数のアノテータ間のラベルの多様性から学習する最善の方法を提案し,検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:07:28 GMT)
Nonadaptive Output Regulation of Second-Order Nonlinear Uncertain Systems [1.4] 本稿では,この問題を解消し,バースト現象を回避するための頑健な制御手法を提案する。
座標変換を導入することにより、ロバストな出力制御問題を非適応安定化問題に変換する。
解析により、拡張システムの出力零化多様体は、提案された非適応制御則によって魅力的にすることができることを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:13:37 GMT)
AI for Climate Finance: Agentic Retrieval and Multi-Step Reasoning for Early Warning System Investments [1.3] 本研究は、気候リスク・早期警戒システム(CREWS)ファンドにおけるEWS投資の追跡という現実的な応用に焦点を当てる。
我々は25のMDBプロジェクト文書を分析し、ゼロショット学習や少数ショット学習を含む複数のAI駆動型分類手法を評価する。
以上の結果より, エージェントベースRAGアプローチは, 87%の精度, 89%の精度, 83%のリコールを達成し, 他の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:58:37 GMT)
Modelling 1/f Noise in TRNGs via Fractional Brownian Motion [1.3] 乱数生成器のセキュリティは、複雑な1/falpha$位相ノイズのため、完全には理解されていない。
分数的なブラウン運動を包括的理論的枠組みとして導入し、ホワイトからフリック周波数ノイズまでのパワー・ロースペクトル密度を捉える。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:37:50 GMT)
LINGOLY-TOO: Disentangling Reasoning from Knowledge with Templatised Orthographic Obfuscation [1.3] 自然言語を基盤とした挑戦的推論ベンチマークであるlingOLY-TOOを紹介する。
実言語で記述された推論問題をパーミュレートして、多数の質問のバリエーションを生成する。
実験と分析は、モデルが推論を回避し、事前の知識から回答できることを示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:44:43 GMT)
Rethinking the Unsolvable: When In-Context Search Meets Test-Time Scaling [1.2] 本稿では,テキスト内検索とテスト時間スケーリングの併用の可能性について検討する。
内部スケーリングを付加したLLMに高度なコンテキスト内探索プロンプトを付加することにより、変換性能のブレークスルーを実現することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:28:18 GMT)
A Plug-and-Play Method for Guided Multi-contrast MRI Reconstruction based on Content/Style Modeling [1.2] エンド・ツー・エンドの学習に基づくガイド付き再構築手法が提案されている。
主な課題はデータセットのトレーニングである。
マルチコントラスト問題に対するモジュラー2世代アプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:34:19 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。
モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。
3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:30:45 GMT)
Quantum Simulations of Charge and Exciton Transfer in Multi-mode Models using Engineered Reservoirs [1.1] 線形ビブロニックカップリングモデルにおける電荷とエキシトン移動の開系量子シミュレーションを実演する。
退化モードはCTとVAETの速度を大きなエネルギーギャップで向上させるが、非退化モードはスローモード経路を活性化する。
私たちの研究は、エンジニアリングされた環境を持つ化学的に関連性があり、多くのモードのビブロニックプロセスへのスケーラブルなルートも確立しています。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:04 GMT)
Multimodal Survival Modeling in the Age of Foundation Models [1.1] マルチモーダル核融合の容易かつ付加的な効果を示す。
全体として、FMと病理報告からの情報抽出を利用して、生存のモデリングを近代化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:05:07 GMT)
A Human-Centric Approach to Explainable AI for Personalized Education [1.1] この論文は、eXplainable AI(XAI)研究の最前線に人間のニーズをもたらすことを目的としている。
マルチモーダルモジュラーアーキテクチャによる解釈可能性に関する4つの新しい技術貢献を提案する。
我々の研究は、最先端のパフォーマンスとビルトインの透明性と信頼のバランスをとる、人間中心のAIシステムの基礎を築いた。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:23:48 GMT)
BugWhisperer: Fine-Tuning LLMs for SoC Hardware Vulnerability Detection [1.1] 本稿では,システムオンチップ(SoC)セキュリティ検証の課題を解決するために,BugWhispererという新しいフレームワークを提案する。
我々は、SoCのセキュリティ脆弱性を検出するために特別に設計された、オープンソースで微調整されたLarge Language Model (LLM)を紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:25:06 GMT)
EvoGrad: Metaheuristics in a Differentiable Wonderland [1.1] 微分プログラミングは、複雑なモデルの効率的な勾配に基づくトレーニングを可能にすることで最適化に革命をもたらした。
EvoGradは、ECとSIをグラデーションベースの最適化と統合した、統一的な差別化可能なフレームワークである。
以上の結果から,完全微分可能な進化最適化とスワム最適化の実質的なメリットが示された。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:42:07 GMT)
The Resurrection of the ReLU [1.1] 本稿では,ReLU (SUGAR) のサロゲート勾配学習を,深層アーキテクチャのための新しいプラグアンドプレイ正規化器として紹介する。
SUGARは、前方通過中に標準のReLU関数を保存するが、後方通過においてその誘導体を滑らかな置換基で置き換える。
我々は,SUGARが十分に整合した代理関数と組み合わせることで,畳み込みネットワークアーキテクチャよりも性能が大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:55:51 GMT)
Research on Driving Scenario Technology Based on Multimodal Large Lauguage Model Optimization [1.0] 本稿では,運転シナリオにおけるマルチモーダルモデルを最適化するための包括的手法を提案する。
このメソッドは動的プロンプト最適化、データセットの構築、モデルトレーニング、デプロイメントといった重要な側面をカバーする。
モデルトレーニングでは、知識蒸留、動的微調整、量子化といった高度な技術が統合され、性能を高めながら記憶と計算コストを削減できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:22:11 GMT)
Bringing CLIP to the Clinic: Dynamic Soft Labels and Negation-Aware Learning for Medical Analysis [1.0] 臨床的に強化されたダイナミック・ソフト・ラベルと医用グラフィカル・アライメントを統合した新しいアプローチを提案する。
われわれのアプローチは、医療用CLIPトレーニングパイプラインに容易に統合され、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:00:18 GMT)
MIAS-SAM: Medical Image Anomaly Segmentation without thresholding [1.0] MIAS-SAMは、医用画像における異常領域のセグメンテーションのための新しいアプローチである。
パッチベースのメモリバンクを使用して、SAMエンコーダを使用して通常のデータから抽出された、関連する画像特徴を格納する。
最後に、MIAS-SAMは異常マップの重心を計算してSAMデコーダを誘導する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:25:37 GMT)
Something's Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks [0.9] 近年の表表現学習とデータ発見手法は,データレイク内の表結合探索(TUS)に取り組みつつある。
これらの手法は、実世界のTUSタスクにおける意味的理解を評価するためのベンチマークを用いて、一般的に評価される。
本稿では,セマンティックテーブル統合検索における進捗のより現実的で信頼性の高い評価を可能にするために,将来のベンチマークに不可欠な基準を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:44:41 GMT)
360-LLaMA-Factory: Plug & Play Sequence Parallelism for Long Post-Training [0.9] 360-LLaMA-Factoryは広く認識されており、Light-R1 arXiv:2503.10460、TinyR1 arXiv:2503.04872、Kaggle AIMO数学モデル、大企業のトレーニングフレームワークで使用されている。
この技術的レポートは、360-LLaMA-Factoryの異なるシーケンス並列モードについて深く掘り下げ、実装の洞察について論じます。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:33:46 GMT)
A Weak Supervision Learning Approach Towards an Equitable Mobility Estimation [0.9] 3m解像度の衛星画像を用いて駐車場の占有度を推定する弱い監視枠組みを提案する。
我々は、大型駐車場におけるAUCの0.92を達成するペアワイズ比較モデルを訓練する。
提案手法は、高価な高解像度画像への依存を最小限に抑え、スケーラブルな都市モビリティ解析を約束する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:36:36 GMT)
SemIRNet: A Semantic Irony Recognition Network for Multimodal Sarcasm Detection [0.9] SemIRNetはマルチモーダル皮肉検出タスクにおける暗黙的相関を識別するように設計されている。
このモデルの精度とF1値は、既存の最適手法と比較して1.64%と2.88%から88.87%、86.33%向上している。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:09:34 GMT)
Mapping the Regulatory Learning Space for the EU AI Act [0.9] EU AI法は、具体的な執行措置による世界最初の国際的AI規制である。
それは、製品の健康と安全性を規制する既存のEUメカニズムの上に構築されているが、基本的権利を保護するためにそれらを拡張している。
これはAI法の施行における複数の不確実性につながると我々は主張する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:27:18 GMT)
GitGoodBench: A Novel Benchmark For Evaluating Agentic Performance On Git [0.8] GitGoodBenchは、バージョン管理システム(VCS)タスク上でAIエージェントのパフォーマンスを評価するための新しいベンチマークである。
私たちのベンチマークでは、オープンソースのPython、Java、Kotlinリポジトリから抽出された3つのコアGitシナリオについて取り上げています。
我々は、カスタムツールを備えたGPT-4oを用いて、ベンチマークのプロトタイプバージョン上でベースライン性能を確立し、全体的な21.1%の解決率を達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:56:11 GMT)
High-Precision Multi-Qubit Clifford+T Synthesis by Unitary Diagonalization [0.8] クリフォード+Tゲートセットで表される量子回路の資源効率と高精度な近似合成は、フォールトトレラント量子コンピューティングにとって不可欠である。
探索に基づく手法を利用して、まずはユニタリを概略対角化し、解析的に逆解析する。
提案手法は,実量子アルゴリズムからユニタリを評価した場合に,一桁のオーダーで合成アルゴリズムの実装精度と実行時間を向上する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:53:41 GMT)
Subsystem Symmetry-Protected Topological Phases from Subsystem SymTFT of 2-Foliated Exotic Tensor Gauge Theory [0.8] 対称性位相場理論(SymTFT)は、$d$-次元理論における対称性と$(d+1)$-次元理論における位相秩序の間の対応を仮定する。
本研究では,サブシステムの対称性に保護された位相位相を特徴付け,分類するためのツールとして,サブシステムSymTFTを開発した。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:47:22 GMT)
Evaluation of the impact of expert knowledge: How decision support scores impact the effectiveness of automatic knowledge-driven feature engineering (aKDFE) [0.8] 副作用薬物イベント(ADE)は、患者の安全性とコストに影響を与える重要な医療上の課題を提起する。
本研究では,電子健康記録(EHR)データからADE予測を改善するために,知識駆動型自動特徴工学(aKDFE)を評価する。
本研究では,長期心QT間隔に対するドメイン特異的ADEリスクスコアの導入が,EMHデータと薬物処理イベントを用いた予測性能に与える影響について検討した。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:40:26 GMT)
On the performance of machine-learning assisted Monte Carlo in sampling from simple statistical physics models [0.8] キュリー・ワイスモデルに対する浅いMADEアーキテクチャに適用した広範に使われている逐次テンパリング手法について検討する。
この研究は、モンテカルロのサンプリングと最適化に機械学習技術を統合するための明確な理論的基盤を確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:13:11 GMT)
Temporal Convolutional Autoencoder for Interference Mitigation in FMCW Radar Altimeters [0.8] 時間的畳み込みネットワーク(TCN)オートエンコーダは受信信号の時間的相関を効果的に活用することを示す。
既存の手法とは異なり、本手法は受信周波数変調連続波(FMCW)信号を直接操作する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:52:10 GMT)
Local Hamiltonian Problem with succinct ground state is MA-Complete [0.8] 量子系の基底エネルギーを見つけることは、凝縮物質物理学と量子化学の基本的な問題である。
この問題に対処する既存の古典的アルゴリズムは、基底状態が簡潔な古典的記述を持つと仮定することが多い。
我々は,局所ハミルトン問題と簡潔な基底状態の複雑性について検討し,それがMA-Completeであることを証明した。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:09:11 GMT)
Immersive Fantasy Based on Digital Nostalgia: Environmental Narratives for the Korean Millennials and Gen Z [0.8] 本研究は, 単用マスク廃棄物の層状探索を目的としたメディアアート「Dear Passenger Please Wear a Mask」を紹介する。
この作品は、デジタルノスタルジーと、ミレニアル世代とゲンZの航空旅行の回想と、ユニークなファンタジーの物語を織り交ぜることで、生態学的懸念を過小評価した。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:44:03 GMT)
Gibbs state preparation for commuting Hamiltonian: Mapping to classical Gibbs sampling [0.8] Gibbsのサンプルでは、最先端の結果を再現できることが示されています。
我々のギブズサンプリング装置は、これまで未知のレギュレーションでギブズ状態を作成することができることを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:17:01 GMT)
MultiFormer: A Multi-Person Pose Estimation System Based on CSI and Attention Mechanism [0.7] チャネル状態情報(CSI)に基づく人間のポーズ推定は、非侵襲的で正確な人間の活動監視のための有望なアプローチとして浮上している。
本稿では,CSIによる人間のポーズを正確に推定する無線センシングシステムであるMultiFormerを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:36:02 GMT)
Do large language vision models understand 3D shapes? [0.7] 大規模視覚言語モデル(LVLM)は、世界の一般的な視覚的理解を達成するための主要なA.Iアプローチである。
この研究は、LVLMが3次元形状を真に理解しているかどうかを、モデルが全く同じ3次元形状の物体を識別しマッチングする能力をテストすることで検証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:33:32 GMT)
Variational Quantum Simulations of a Two-Dimensional Frustrated Transverse-Field Ising Model on a Trapped-Ion Quantum Computer [0.7] 変分量子固有解法(VQE)を用いて、16のサイト(量子ビット)に対して周期的境界条件を持つ正方格子上の位相を計算する。
我々は、VQEが支配的な磁気相を見つけるのに成功する、このモデルの基底状態相転移に注目した。
実験により, フラストレーションモデルの磁気位相は, 基底状態エネルギー, エネルギー微分, スピン相関関数によってほぼ完全に回復することがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:20:20 GMT)
Improving statistical learning methods via features selection without replacement sampling and random projection [0.7] 癌は、正常な遺伝子発現を阻害する遺伝学的およびエピジェネティックな変化を特徴とする遺伝疾患である。
高次元マイクロアレイデータセットは、「小さいn、大きなp」問題のために分類モデルに挑戦する。
本研究は癌バイオマーカーの発見に寄与し,マイクロアレイデータ解析のための堅牢な計算手法を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:36:46 GMT)
Coverage Biases in High-Resolution Satellite Imagery [0.7] 地中サンプリング距離が10m未満の光学衛星画像を提供する主要衛星コンステレーションのカバレッジバイアスについて検討した。
赤道から遠く離れた場所は、通常、研究中の星座によってより頻繁に再検討される。
歴史的衛星画像の可用性は、地上の社会経済的要因に影響されていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:42:53 GMT)
BD Open LULC Map: High-resolution land use land cover mapping & benchmarking for urban development in Dhaka, Bangladesh [0.7] BD Open LULC Map (BOLM)を導入し,11クラスのLULCアノテーションを画素単位で提供する。
BOLMは4,392 sq km (891万画素)で、地上の真理は3段階のプロセスで検証される。
We benchmark LULC segmentation using DeepLab V3+ across five major class and comparison on Bing and Sentinel-2A images。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:00:03 GMT)
Nullifiers of non-Gaussian cluster states through homodyne measurement [0.7] 非ガウス状態は、普遍性とフォールトトレランスに到達するためにクラスター状態に埋め込まれなければならない。
非ガウスクラスター状態のキャラクタリゼーションのためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:19:04 GMT)
Energy and polarization based on-line interference mitigation in radio interferometry [0.7] 電波干渉 (Radio frequency interference, RFI) は、地上の電波天文学において持続的な汚染物質である。
本稿では,このような干渉計の相関器で動作可能なオンラインRFI緩和方式を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:38:16 GMT)
On Heuristic Models, Assumptions, and Parameters [0.6] 我々は、不明瞭で不透明な技術的注意事項、選択、および資格者の過小評価されたファミリーが存在すると論じている。
このようなオブジェクトの3つの特定のクラス、モデル、仮定、パラメータを記述します。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:31:02 GMT)
SVRPBench: A Realistic Benchmark for Stochastic Vehicle Routing Problem [0.6] SVRPBenchは、都市部における車両ルーティングにおける高忠実度静的ダイナミクスをキャプチャする最初のオープンベンチマークである。
現実的な配送条件をシミュレートする: 時間依存の混雑、ログの正常な遅延、確率的事故、住宅および商業顧客のための実験的に根拠付けられた時間窓。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:03:31 GMT)
Speaking images. A novel framework for the automated self-description of artworks [0.6] ジェネレーティブAIの最近のブレークスルーは、芸術と文化遺産の領域における新しい研究視点への扉を開いた。
本稿では,オープンソースの大規模言語,顔検出,テキスト・音声・音声・アニメーションモデルを用いた自己説明型文化アーティファクトの創出に向けた新たな枠組みを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:13:41 GMT)
Quantum framework for Reinforcement Learning: Integrating Markov decision process, quantum arithmetic, and trajectory search [0.6] 本稿では、強化学習(RL)タスクに対処する量子フレームワークを提案する。
量子概念と量子探索アルゴリズムを用いることで,エージェント-環境相互作用の実装と最適化を行う。
その結果、RLにおける量子エンハンスメントを達成するための量子モデルの能力を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:50:35 GMT)
Efficiently Enhancing General Agents With Hierarchical-categorical Memory [0.6] パラメータ更新なしで学習できる汎用エージェントであるEHCを紹介する。
EHCは階層型メモリ検索(HMR)モジュールとタスクカテゴリ指向体験学習(TOEL)モジュールで構成される。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:12:51 GMT)
Quantum Neural Networks in Practice: A Comparative Study with Classical Models from Standard Data Sets to Industrial Images [0.6] 本稿では,古典的・古典的ハイブリッド畳み込みニューラルネットワーク(CNN)と,ランダム化された古典的・量子的ニューラルネットワーク(NN)の性能を比較した。
これらのアプローチを,複雑性を増大させる3つのデータセット上で評価する。
クロスデータセット性能解析では、異なる分類タスク間の量子モデルの限られた転送可能性を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:01:56 GMT)
Entanglement between accelerated probes in a de Sitter spacetime [0.6] 曲線時空における加速量子プローブによる真空エンタングルメントの特性について検討する。
量子場との相互作用は、初期の非相関プローブ間の非局所的な相関を異なる方向に加速させる。
この結果から, エンタングルメントは, 加速度や曲率の変化によって独立に変化することが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:04:06 GMT)
A Large Language Model-Enabled Control Architecture for Dynamic Resource Capability Exploration in Multi-Agent Manufacturing Systems [0.6] 本稿では,多エージェント製造システムのための大規模言語モデル対応制御アーキテクチャを提案する。
シミュレーションに基づくケーススタディでは、提案されたアーキテクチャがシステムのレジリエンスと柔軟性を向上させることが示されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:43:12 GMT)
MINDSTORES: Memory-Informed Neural Decision Synthesis for Task-Oriented Reinforcement in Embodied Systems [0.6] 本研究では,体験向上型計画フレームワークMINDSTORESを導入し,エージェントがメンタルモデルを構築し,活用できるようにする。
MINDSTORES は,既存のメモリベース LLM プランナよりも学習し,その知識を適用している。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:59:03 GMT)
CPINN-ABPI: Physics-Informed Neural Networks for Accurate Power Estimation in MPSoCs [0.6] 代替ブラインドパワー同定(ABPI)は理論的には定常温度への依存を排除している。
ABPIの性能は、実際のハードウェア実装では検証されていない。
本稿では、カスタム物理情報ニューラルネットワーク(CPINN)とABPIの熱モデルを統合する新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:22:15 GMT)
Reviewing Scientific Papers for Critical Problems With Reasoning LLMs: Baseline Approaches and Automatic Evaluation [0.6] 本稿では,いくつかのベースラインアプローチと,トップLLMを用いた拡張可能な自動評価フレームワークを導入し,手作業による評価のためにドメインエキスパートを募集することの難しさに対処する。
本稿では,文書に基づく科学的理解・推論に関する知見を提供し,今後の応用の基礎を定めている。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:14:30 GMT)
CrossNAS: A Cross-Layer Neural Architecture Search Framework for PIM Systems [0.5] CrossNASは、PIMシステム上の多次元検索空間を探索する自動化アプローチである。
CrossNASは、PIMニューラルアーキテクチャサーチ(NAS)の新しいベンチマークを設定し、精度とエネルギー効率の両方で従来の手法より優れている。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:00:49 GMT)
Detecting Undesired Process Behavior by Means of Retrieval Augmented Generation [0.5] 本稿では,プロセスモデル専用のプロセスモデルや,望ましくないプロセスの振る舞いを検出するためのリソース集約的な微調整を必要としないアプローチを提案する。
代わりに、リトリーバル拡張生成(RAG)を使用して、知識ベースに直接アクセス可能なLLMを提供します。
提案手法は, 望ましくない動作を検出する上で, 微調整LDMよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:03:46 GMT)
Extracting Research Instruments from Educational Literature Using LLMs [0.5] 大規模言語モデル (LLM) は学術文献から情報を抽出する。
本研究では,教育分野における研究機器の詳細な情報抽出を目的としたLLMシステムを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:00:32 GMT)
MUDDFormer: Breaking Residual Bottlenecks in Transformers via Multiway Dynamic Dense Connections [0.5] MUDD接続は任意のTransformerアーキテクチャにシームレスに統合できる。
実験の結果、MUDDFormerは様々なモデルアーキテクチャや言語モデリングのスケールでトランスフォーマーを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:57:47 GMT)
The Aloe Family Recipe for Open and Specialized Healthcare LLMs [0.5] この研究は、データ前処理とトレーニングの重要な段階を最適化することで、オープン医療用LDMの分野に貢献する。
結果として得られたモデルは、最高のプライベートな代替品と競合することが示され、パーミッシブなライセンスでリリースされている。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:14:44 GMT)
ClonEval: An Open Voice Cloning Benchmark [0.5] 音声合成音声合成モデルのための新しいベンチマークを提案する。
このベンチマークは、評価プロトコル、音声クローンモデルの性能を評価するためのオープンソースのライブラリ、および付随するリーダーボードで構成されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:18:03 GMT)
Complex Wavelet Mutual Information Loss: A Multi-Scale Loss Function for Semantic Segmentation [0.5] クラス不均衡とインスタンス不均衡は、セマンティックセグメンテーションにおける永続的な課題である。
本稿では,複雑なステアブルピラミッドによって分解されたサブバンド画像からの相互情報を利用する新たな損失関数である複合ウェーブレット相互情報損失(CWMI)を提案する。
CWMIの損失は、最先端の手法と比較してピクセル単位の精度とトポロジカルな指標の両方で大幅に改善される。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:45:18 GMT)
Interpretable Scaling Behavior in Sparse Subnetwork Representations of Quantum States [0.5] パラメータ数が1桁を超えると、スパースニューラルネットワークは密度の高いニューラルネットワークに匹敵する精度に達することが示される。
ネットワークサイズと物理モデルにまたがって持続する普遍的なスケーリングの挙動を同定し、そこではスケーリング領域の境界は、基礎となるハミルトニアンによって決定される。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:08 GMT)
Measurement-free reconstruction circuit of quantum secrets in quantum secret sharing [0.5] 安定化符号に基づく量子シークレット共有における量子シークレットの無測定再構成回路を提案する。
我々の再構成回路は幅$k+|J|$で、$O(k|J|)$1または2量子のユニタリゲートからなる。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:31:08 GMT)
Speech as a Multimodal Digital Phenotype for Multi-Task LLM-based Mental Health Prediction [0.5] うつ病検出のための3モーダルマルチメディアデータソースとして,患者音声データの処理を提案する。
提案手法は,抑うつ早期警戒データセットを用いて,3モーダル長手MLLを特徴とする手法である。
バランスの取れた精度は70.8%で、これは一方向、単一タスク、および非縦方向のそれぞれの方法よりも高い。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:07:17 GMT)
Inclusive, Differentially Private Federated Learning for Clinical Data [0.5] Federated Learning(FL)は、センシティブな患者データを集中化せずに、臨床AIモデルをトレーニングするための有望なアプローチを提供する。
実際の採用は、プライバシやリソース制約、コンプライアンスに関する課題によって妨げられています。
本稿では,定量的クライアントコンプライアンススコアに基づいて適応的にノイズを調整することでDPを向上する新しいFLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:36:21 GMT)
CLIPGaussian: Universal and Multimodal Style Transfer Based on Gaussian Splatting [0.4] 私たちはCLIPGaussiansを紹介した。CLIPGaussianは、複数のモダリティをまたいだテキストおよび画像誘導型スタイリングをサポートする最初の統一型スタイル転送フレームワークである。
本手法はガウスプリミティブを直接操作し,プラグインモジュールとして既存のGSパイプラインに統合する。
我々は,CLIPGaussianをマルチモーダルなスタイル転送のための汎用的で効率的な解として検証し,全てのタスクにおいて優れたスタイルの忠実さと一貫性を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:41:24 GMT)
Geometric GNNs for Charged Particle Tracking at GlueX [0.4] ジェファーソン研究所のGlueX実験から得られたデータを追跡するためのGNNモデルの評価を行った。
本稿では,複数のイベントをバッチで処理することで,GNNモデルによる大幅な高速化を実現することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:52:22 GMT)
Evaluating the performance of quantum processing units at large width and depth [0.4] 線形ランプ量子近似最適化アルゴリズム(LR-QAOA)に基づくベンチマークプロトコルを提案する。
LR-QAOAは、回路深度が増加するにつれてコヒーレント信号を保存するQPUの能力を定量化し、ランダムサンプリングと統計的に区別できない性能になるかどうかを特定する。
このプロトコルを6つのベンダーの24の量子プロセッサに適用し、最大156の量子ビットと1Dチェーンにまたがる1万の層、ネイティブレイアウト、完全に接続されたトポロジの問題をテストします。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:55:27 GMT)
Thermal Annealing and Radiation Effects on Structural and Electrical Properties of NbN/GaN Superconductor/Semiconductor Junction [0.4] 窒化ニオブ(NbN)超伝導体は、量子コンピューティングにおいて重要な構成要素である。
本研究では,GaN上に作製したNbN薄膜の構造と超伝導特性に及ぼす高温アニールおよび高線量ガンマ照射の影響について検討した。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:46:57 GMT)
Towards Achieving Concept Completeness for Textual Concept Bottleneck Models [0.4] 本稿では,小さな言語モデルを用いて,概念ラベルを教師なしで構築する新しいTCBMジェネレータを提案する。
CT-CBMは、完全に概念ベースを作成するために、ボトルネック層において重要かつ識別可能な概念を反復的にターゲットし、追加する。
CT-CBMは、概念ベースと概念検出精度の点で競合相手に対して顕著な結果を得る。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:49:18 GMT)
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges [0.4] この研究はAIエージェントとエージェントAIを区別し、構造化された概念分類、アプリケーションマッピング、課題分析を提供する。
ジェネレーティブAIは前駆体として位置づけられており、AIエージェントはツールの統合、エンジニアリングの促進、推論の強化を通じて前進している。
エージェントAIシステムは、マルチエージェントコラボレーション、動的タスク分解、永続メモリ、オーケストレーション自律性によって特徴付けられるパラダイムシフトを表している。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:28:08 GMT)
More buck-per-shot: Why learning trumps mitigation in noisy quantum sensing [0.4] 我々は,誤差軽減,推論技術,あるいはそれらの組み合わせにショットを投入することで,ノイズの多い量子センサの感度を(ショット)予算で向上できるかどうかを検討した。
その結果,ゼロノイズ外挿法のコストは,その利点を上回ることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:59:10 GMT)
Mitigating Text Toxicity with Counterfactual Generation [0.3] 毒性の軽減は、有害な意味を取り除くためにテキストを言い換えることである。
現在のメソッドは、最初の非有毒な意味を保ちながら、テキストをデトックスすることができない。
この研究は、カウンターファクト生成とテキストのデトックス化のギャップを埋める最初のものである。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:43:47 GMT)
LiDAR Based Semantic Perception for Forklifts in Outdoor Environments [0.3] 複雑な屋外環境で動作する自律フォークリフトに適した,新しいLiDARベースのセマンティックセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのアプローチの中心は、前方と下向きのLiDARセンサーを組み合わせたデュアルLiDARシステムの統合です。
2つのセンサーから取得した高分解能な3D点雲を用いて、本手法では、ポイント雲を安全クリティカルなインスタンスクラスに分割する軽量で堅牢なアプローチを採用する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:45:14 GMT)
Evaluating Compact LLMs for Zero-Shot Iberian Language Tasks on End-User Devices [0.3] 大規模言語モデルは、言語生成、翻訳、推論といったタスクにおいて顕著なパフォーマンスを達成するために、大幅に進歩した自然言語処理を持つ。
その相当な計算要件は、ハイエンドシステムへのデプロイメントを制限し、コンシューマグレードデバイスへのアクセシビリティを制限している。
本研究は,イベリア語に適したNLPタスクを網羅的に評価する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:37:18 GMT)
Facial Age Estimation: A Research Roadmap for Technological and Legal Development and Deployment [0.3] 自動顔年齢評価システムは、推定モード(顔の特徴に基づいて年齢を予測する)または検証モード(請求年齢を確認する)のいずれかで動作する。
これらのシステムは、年齢制限の商品、サービス、コンテンツへのアクセス制御をサポートし、eコマース、ソーシャルメディア、法医学、難民支援などの分野で利用することができる。
この白書では、このようなシステムの展開における現在の課題を概観し、関連する法と規制の展望を概説し、公正で堅牢で倫理的な年齢推定技術の今後の研究について考察する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:28:31 GMT)
Accountable, Scalable and DoS-resilient Secure Vehicular Communication [0.3] 放送された協調意識メッセージ(CAM)と分散環境通知メッセージ(DENM)は、セキュリティとプライバシ保護のために認証されている。
これにより非対称性が生成され、外部の敵が簡単に利用して、ブロックするDoS(DoS)攻撃を起動する。
本稿では、メッセージ検証ファシリテータと呼ばれる効率的な暗号構造を提案し、潜在的に有効なメッセージの検証のための処理資源の優先順位付けを行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:25:34 GMT)
A multimode cavity QED Ising spin glass [0.2] 空洞QEDはフラストレーションされた横フィールドイジング遷移によって駆動される。
本質的に非平衡であるにもかかわらず、このシステムはパリの平衡スピングラスの理論に関連する現象を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:59:15 GMT)
LaMM: Semi-Supervised Pre-Training of Large-Scale Materials Models [0.2] 改良された自己教師付き学習を取り入れた半教師付き事前学習手法であるLaMMと、効率的なマルチノード学習のための負荷分散アルゴリズムを提案する。
提案手法は,1つのNNPモデルをトレーニングするために,$sim$300M(3億ドル)の半ラベルサンプルの大規模データセットを効果的に活用し,速度と精度の両面で微調整性能を向上することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:36:49 GMT)
Design and testing of an agent chatbot supporting decision making with public transport data [0.2] 本稿では,データセットと対話し,意思決定を支援するユーザフレンドリーなツールを提案する。
それはエージェントアーキテクチャに基づいており、コアのLarge Language Model(LLM)の機能を拡張する。
本稿では,このようなジェネレーティブAIプロジェクトの主要なオープンな問題,すなわちシステムの性能を測定するためのデータ収集に取り組む。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:31:14 GMT)
Legal Assist AI: Leveraging Transformer-Based Model for Effective Legal Assistance [0.2] インドの多くの市民は、限定的な認識と関連する法的情報へのアクセスのため、法的権利の活用に苦慮している。
本稿では,大規模言語モデル(LLM)による効果的な法的支援を提供することにより,このギャップを埋めるトランスフォーマーベースモデルであるLegal Assist AIを紹介する。
このモデルは、GPT-3.5 TurboやMistral 7Bといった最先端モデルに対して評価され、AIBEで60.08%のスコアを得た。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:06:53 GMT)
Hypothesis Testing in Imaging Inverse Problems [0.2] 本稿では,逆問題の画像化に適した意味仮説テストのためのフレームワークを提案する。
画像ベースの仮説テストが難しい主な理由は3つある。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:29:43 GMT)
Quantum Reservoir Computing for Corrosion Prediction in Aerospace: A Hybrid Approach for Enhanced Material Degradation Forecasting [0.2] 材料劣化の予測は多くの業界で 解決すべき重要な問題です
量子機械学習は有望な研究分野であるが、不毛の台地や測定オーバーヘッドのようなよく知られた欠陥に悩まされている。
ここでは、より小さな量子貯水池を同時に進化させることにより、量子貯水池コンピューティングの領域で同じ考え方を用いる。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:16:20 GMT)
How We Won the ISLES'24 Challenge by Preprocessing [0.2] 脳卒中病変セグメンテーションの先駆的解決策として、改良された深層学習法が出現している。
ISLES'24の課題は、縦方向の脳卒中画像データを提供することによって、このニーズに対処する。
我々の勝利したソリューションは、慎重に設計された事前処理パイプラインが正確なセグメンテーションに有用であることを示している。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:02:21 GMT)
MRT at SemEval-2025 Task 8: Maximizing Recovery from Tables with Multiple Steps [0.2] textitSemEval 2025 Task 8: Question-Answering over Tabular Data Challenge。
我々の戦略は、LLMを使ったPythonコード生成を利用してテーブルと対話し、質問に対する回答を得る。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:50:22 GMT)
Towards Resilient and Sustainable Global Industrial Systems: An Evolutionary-Based Approach [0.1] 本稿では,産業システムの自動設計における新しい複雑な最適化問題を提案する。
これは、CO2排出量、輸送時間、コストを最小限に抑えるソリューションを見つけることを目的としている。
提案手法は、複雑な製造とサプライチェーンの課題を伴うあらゆる産業事例に適用できる。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:40:39 GMT)
Risks of AI-driven product development and strategies for their mitigation [0.1] この視点は、リスクと適切な緩和戦略に関する議論を開始することを目的としている。
我々は、人間の監視、説明責任、説明可能な設計を強調する、より安全なAI駆動製品開発のための一連の原則を概説する。
AI駆動の製品開発はまだ初期段階だが、この議論は、理解、規範設定、規制における重要な進歩を遅らせることなく、機会とリスクのバランスを取るのに役立つだろう。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:52:44 GMT)
Shaping Shared Languages: Human and Large Language Models' Inductive Biases in Emergent Communication [0.1] ヒトと大言語モデル(LLM)の帰納バイアスに最適化された人工言語がどのように進化するかを検討する。
我々は、人間が協力しても、あらゆる状況において信頼できるコミュニケーションを可能にする、参照接頭辞が出現することを示します。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:42:23 GMT)
Prediction of the Most Fire-Sensitive Point in Building Structures with Differentiable Agents for Thermal Simulators [0.1] 本稿では,MFSP(Mest Fire-Sensitive Point)の概念と,その識別のための効率的な機械学習フレームワークを提案する。
MFSPは、火災が開始すれば建物の安定性に最も深刻な有害な影響をもたらす場所と定義されている。
本フレームワークでは,従来の有限要素解析(FEA)シミュレータにおいて,グラフニューラルネットワーク(GNN)が効率的かつ微分可能なエージェントとして機能する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:18:35 GMT)
SimuGen: Multi-modal Agentic Framework for Constructing Block Diagram-Based Simulation Models [0.1] SimuGenは視覚的なSimulinkダイアグラムとドメイン知識の両方を活用することで、正確なSimulinkシミュレーションコードを自動的に生成するフレームワークである。
ソースコードはhttps://github.com/renxinxing123/SimuGen_beta.comで公開されています。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:35:43 GMT)
Navigating the AI-Energy Nexus with Geopolitical Insight [0.1] 本稿では,地政学的戦略とエネルギー資源管理が人工知能(AI)開発とどのように交わるかを検討する。
中国や湾岸諸国のような権威主義体制の中央集権的アプローチを分析することで、AIエネルギーニーズにリソースを割り当てるための多角的戦略を探求する。
これは、グローバルAIコンペティションを形成する上で、エネルギーインフラ、市場ダイナミクス、および国家主導のイニシアチブの役割を強調している。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:54:30 GMT)
Incorporating LLMs for Large-Scale Urban Complex Mobility Simulation [0.0] 本研究では,大規模言語モデル(LLM)とエージェントベースモデリング(ABM)を統合した都市モビリティシミュレーションの革新的アプローチを提案する。
従来のルールベースのABMとは異なり、提案フレームワークはLSMを利用してエージェントの多様性とリアリズムを高める。
実世界のデータを用いて,台北市の個人行動と大規模移動パターンをモデル化した。
論文参考訳(メタデータ) (Wed, 28 May 2025 01:54:28 GMT)
Large Language Models Often Know When They Are Being Evaluated [0.0] そこで本研究では,フロンティア言語モデルを用いて,評価や実世界の展開に起因した書き起こしを正確に分類できるかどうかを検討する。
我々は61の異なるデータセットから1000のプロンプトと書き起こしのベンチマークを構築した。
以上の結果から,フロンティアモデルにはまだ評価・認識レベルがかなり高いことが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:03:09 GMT)
Yambda-5B -- A Large-Scale Multi-modal Dataset for Ranking And Retrieval [0.0] 本稿ではYandex.Musicストリーミングプラットフォームをベースとした大規模オープンソースデータセットYambda-5Bを紹介する。
Yambda-5Bは、939万のトラックで100万人のユーザーから479億のユーザー・イテム・インタラクションを提供している。
Yambda-5Bの重要な特徴は、オーガニックユーザアクションとレコメンデーション駆動イベントを分離するis_organicフラグの追加である。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:12:57 GMT)
Voice CMS: updating the knowledge base of a digital assistant through conversation [0.0] 本稿では,デジタルアシスタントの知識ベースを更新するためのマルチエージェントLLMアーキテクチャと音声ユーザインタフェース(VUI)に基づくソリューションを提案する。
そのユーザビリティは、従来のグラフィカルコンテンツ管理システム(CMS)と比較して評価される。
この結果から,VUI全体のユーザビリティはグラフィカルインターフェースよりも低く評価されているものの,より複雑なタスクに対しては,すでにユーザが好んでいることが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:40:37 GMT)
Visualizing Cloud-native Applications with KubeDiagrams [0.0] KubeDiagramsは、マニフェストをアーキテクチャ図に変換するオープンソースツールである。
KubeDiagramsがシステムの理解を高め、分散クラウドネイティブシステムにおけるアーキテクチャ推論をサポートすることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:27:25 GMT)
Universal principles for sudden-quench quantum Otto engines [0.0] この研究は、相互作用駆動オットーサイクルの最近の結果を拡張して、多体相互作用量子モデルを一般化する。
このようなエンジンサイクルのネット作業は完全に粒子間相関によって決定されることを示す。
次に、相互作用駆動型量子オットーエンジンサイクルの解析を任意の量子作用素の強みに対して制御を行うシステムに拡張する。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:38:00 GMT)
Tripartite Entanglement dynamics: the influence of intrinsic decoherence and decoherence channels [0.0] 本研究は,デコヒーレンスの存在下での絡み合い対策に焦点を当てた。
外部磁場とジアラロシンスキー-モリヤ相互作用を持つXXZハイゼンベルク鎖を利用する。
様々なデコヒーレンスチャネルが分析され、通常$I$-tangleはデコヒーレンスの増加とともに減少する。
論文参考訳(メタデータ) (Wed, 28 May 2025 04:23:31 GMT)
Training RL Agents for Multi-Objective Network Defense Tasks [0.0] オープンエンドラーニング(OEL)は、狭義の能力よりも幅広い能力を達成する訓練エージェントを強調している。
我々は,OELにインスパイアされた自律型ネットワークディフェンダー開発のためのトレーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:18:21 GMT)
Topological Eigenvalue Theorems for Tensor Analysis in Multi-Modal Data Fusion [0.0] 本稿では,マルチモーダルデータ融合におけるテンソル固有値解析のための新しいフレームワークを提案する。
固有値とトポロジカルな特徴を結びつける新しい定理を確立することにより、提案フレームワークはデータの潜伏構造に関する深い洞察を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:47:31 GMT)
Timelike Quantum Energy Teleportation in the Nambu-Jona-Lasinio Model [0.0] 1+1次元ナムブ・ジョナ・ラシニオ(NJL)モデルにおいて,新しい時間的量子エネルギーテレポーテーションプロトコルを提案する。
ローカライズされたUnruh-DeWitt検出器をフェルミオン場に結合させることにより、初期観測者の測定によって後続の観測者がどのようにエネルギーを抽出できるかを実証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:05:44 GMT)
Thermal Modeling and Optimal Allocation of Avionics Safety-critical Tasks on Heterogeneous MPSoCs [0.0] 高消費電力とアビオニクスの安全基準が組み合わさって、新しい熱管理の課題をもたらす。
本稿では,不均一MPSoC上での周期的タスクのオフライン熱的アロケーション手法について検討する。
実験的なパワーモデルとILPを統合することで,テスト対象のプラットフォーム上での他の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:40:47 GMT)
Theory of itinerant collisional spin dynamics in nondegenerate molecular gases [0.0] 超低温だが非退化極性分子の2つの電場型回転状態に1/2$自由度をエンコードした反復動力学を研究する。
電界閉じ込めによる衝突遮蔽により全衝突路の損失をほぼ完全に抑制できることを示す。
この研究は、超低温分子衝突の領域と多体スピン物理学の間の橋渡しを確立する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:18:22 GMT)
The thread embodiment of holographic quantum entanglement [0.0] ホログラフィック双対性の絡み合い構造を特徴付けるホログラフィック絡み合いスレッド画像を開発する。
テンソルネットワークモデルとそれ以前のビットスレッドの概念に着想を得て,ホログラムバルクにおける絡み合いスレッドの軌跡を規定するルールを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:44:30 GMT)
The dynamics of spontaneous emission [0.0] 光子放出による励起原子の自然崩壊は、自然界や研究室において最も一般的かつ基本的な物理過程の1つである。
プロセスの単純さにもかかわらず、量子力学では、崩壊そのものは自然の法則と見なされ、さらなる分析や説明はされない。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:27:03 GMT)
The construction of a universal quantum gate set for the SU(2)k (k=5,6,7) anyon models via GA-enhanced SK algorithm [0.0] 我々は、SU(2)kエノンモデルを用いて、位相量子計算のための普遍量子ゲートセットを構築する。
遺伝的アルゴリズムを用いたSolovay-Kitaevアルゴリズム(GA-enhanced SKA)による1量子ゲートの合成
我々は、SU(2)5, SU(2)6, SU(2)7 構成の9つの EBM を用いて、局所同値類(SWAP)の正確な実装を得る。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:47:44 GMT)
The Geometry of ReLU Networks through the ReLU Transition Graph [0.0] 我々は、ReLUトランジショングラフ(RTG)と呼ばれる物体のレンズを通して、ReLUニューラルネットワークを解析するための新しい理論的枠組みを開発する。
このグラフでは、各ノードはネットワークの活性化パターンによって誘導される線形領域に対応し、エッジは単一ニューロンのフリップによって異なる領域を接続する。
RTG幾何を表現性、一般化、ロバスト性に結びつける新しい理論結果の組を導出する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:46:04 GMT)
Tempest: Autonomous Multi-Turn Jailbreaking of Large Language Models with Tree Search [0.0] 本研究では,大規模言語モデル (LLM) の安全性の段階的侵食を木探索の観点からモデル化する多ターン対向フレームワークである Tempest を紹介する。
我々は,Tempest が GPT-3.5-turbo で100%成功率,GPT-4 で97% を達成していることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:31:33 GMT)
Teleportation fidelity of quantum repeater networks [0.0] 大規模量子リピータネットワークにおける全ノード間の最大テレポーテーション忠実度の平均は,ネットワーク全体の資源性の尺度であることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:13:38 GMT)
Tailoring nuclear spins order with defects: a Quantum Technology CAD study [0.0] 原型システムは、平面外のスピンドライバ/プローブと相互作用するスピンの2次元順序分布を特徴とする。
広帯域半導体では、開体積点欠陥とミラー指数の低い官能化面によって実現できる。
超格子性モンテカルロによるシステム生成過程をシミュレーションし, 時間依存条件下でのエピタキシャル成長が, 制御された表面欠陥の多量化や破壊を実現するための有効な方法であることを実証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:24:36 GMT)
Symplectic Generative Networks (SGNs): A Hamiltonian Framework for Invertible Deep Generative Modeling [0.0] 我々は、ハミルトン力学を利用して潜在空間とデータ空間の間の非可逆な体積保存マッピングを構築する深層生成モデルであるSymphlectic Generative Network(SGN)を紹介する。
シンプレクティックな構造を持ち、ハミルトニアン系の時間発展としてデータ生成をモデル化することにより、SGNはヤコビアン計算の計算オーバーヘッドを発生させることなく正確な精度評価を行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:13:36 GMT)
Suppressing the Decoherence of Alkali-Metal Spins at Low Magnetic Fields [0.0] 熱セシウムスピンの脱コヒーレンスを二元衝突時のスピン回転相互作用によって実験的に検討した。
スピンデコヒーレンス速度を低磁場下でのいずれのプロセスによる大域的な抑制効果を報告した。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:32:39 GMT)
Superoscillations and Physical Applications [0.0] この章では、超振動と関連する現象の物理的実装と応用を選択的にレビューする。
我々は、スペックルにおける超振動と超成長のトピックをレビューし、パターン付きフィルタによる超酸化ホットスポット、超分光的2分子の識別、ノイズ緩和、点拡散関数における超振舞いの工学について述べる。
他の波動現象における超振動、超レーダー、量子物理学における一般化超現象など、将来の研究の方向性を概説する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:57:06 GMT)
Stereo Radargrammetry Using Deep Learning from Airborne SAR Images [0.0] 空中合成開口レーダ(SAR)画像からの深層学習を用いたステレオレーダグラム法を提案する。
深層学習に基づく手法は、幾何学的画像変調に支障をきたさないと考えられている。
我々は,SAR画像データセットを作成し,深層学習に基づく画像対応手法の微調整を行う。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:12:15 GMT)
Spontaneous Raman scattering from metastable states of Ba$^+$ [0.0] イオンと原子の2光子励起ラマン転移によって実行される量子論理ゲートは、自発散乱誤差によって基本的に制限される。
これらの散乱過程の最近の理論的処理は、遠波長レーザーによる実装において、そのようなゲートの誤差率の低い境界を予測していない。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:19:21 GMT)
Spectrally Resolved Higher Order Photon Statistics of Spontaneous Parametric Down Conversion [0.0] 自発パラメトリックダウン変換の光子統計は、波長、ポンプパワー、偶然の時間に依存する。
短波長はポンプ出力とともに非線形に増加し、長波長はより線形な挙動を示し、SPDCの発生における波長依存効率を示した。
測定された統計は、熱光源の特徴である負二項分布によって最もよく説明されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:33:32 GMT)
Smart Contracts for SMEs and Large Companies [0.0] このアプローチは、小さなIT能力を持つ中小企業から、ブロックチェーンスマートコントラクトを使用したIT企業まで、スマートコントラクトによるコラボレーションをサポートするためにどのように使用されているかを示します。
また、ブロックチェーン技術やスマートコントラクト開発に関する知識を必要としないBPMNモデラーによって、特定のアプリケーションでスマートコントラクトを生成するためにこのアプローチがどのように使用されるかを示します。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:40:21 GMT)
Single-qubit gates with errors at the $10^{-7}$ level [0.0] サブパート・パー・ミリオン・エラー率を持つ単一量子ビットゲートの達成を,43ドルCa$+超微細クロックキュービットで報告した。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:36:14 GMT)
Signatures of Correlation of Spacetime Fluctuations in Laser Interferometers [0.0] 時空変動(SF)はレーザー干渉計で検出できる。
2点相関関数の崩壊挙動と対称性によって特徴づけられる3つの異なるSFのクラスを考える。
予測される干渉計出力信号を解析し、SFの各クラスに特徴的な3つの信号を特定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:52:02 GMT)
SequentialBreak: Large Language Models Can be Fooled by Embedding Jailbreak Prompts into Sequential Prompt Chains [0.0] 本稿では,大規模言語モデル(LLM)の脆弱性を利用した新しいジェイルブレイク攻撃であるSequentialBreakを紹介する。
問題バンク,ダイアログ補完,ゲーム環境などの事例に限らず,有害なプロンプトをLCMを騙して有害な応答を発生させる良質なプロンプトに埋め込む,いくつかのシナリオについて論じる。
大規模な実験では、SequentialBreakは単一のクエリしか使用せず、攻撃成功率を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:18:39 GMT)
Sentiment Simulation using Generative AI Agents [0.0] 本稿では、心理的に豊かなプロファイルを組み込んだ生成AIエージェントを用いた感情シミュレーションの枠組みを提案する。
エージェントは2,485人のフィリピン人回答者の全国代表による調査からインスタンス化されている。
我々の研究は、心理分析を基礎としたAIエージェントによる感情モデリングのためのスケーラブルなフレームワークを確立した。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:50:56 GMT)
Self-orthogonalizing attractor neural networks emerging from the free energy principle [0.0] 我々は、ランダムな力学系の普遍的なパーティショニングに適用される自由エネルギー原理から、アトラクターネットワークがどのように出現するかを定式化する。
私たちのアプローチでは、明示的に学習と推論の規則を課す必要がなくなる。
我々の発見は、自己組織化されたアトラクタネットワークの統一理論を提供し、AIと神経科学の新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:10:03 GMT)
Scalable, Symbiotic, AI and Non-AI Agent Based Parallel Discrete Event Simulations [0.0] 本稿では,複数のAIエージェントと非AIエージェントを組み合わせた並列離散イベントシミュレーション(PDES)手法を提案する。
我々は、4つの異なるドメインから4つの問題を解き、その結果をAIモデルだけで比較することで、我々のアプローチを評価する。
その結果,バニラモデルの精度が23%未満であるため,アプローチ全体の精度は68%であった。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:50:01 GMT)
Sample importance for data-driven decoding [0.0] 単純なエラー訂正コードのDDDは、ノイズの多い不均衡なバイナリ分類問題と等価であることを示す。
複数ラウンドのシンドローム測定を含む量子符号の復号化に関する同様の改善を示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:02:54 GMT)
Sample Efficient Robot Learning in Supervised Effect Prediction Tasks [0.0] MUSEL(Model Uncertainty for Sample-Efficient Learning)は、ロボット工学における回帰タスクに適した新しいALフレームワークである。
MUSELは学習精度とサンプル効率を両立させ,情報的サンプルを選択する学習行動効果の有効性を検証した。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:23:27 GMT)
RocqStar: Leveraging Similarity-driven Retrieval and Agentic Systems for Rocq generation [0.0] 我々は、Rocq証明を生成するために、徹底した前提選択の重要性を強調した。
本稿では,自己注意型埋め込みモデルを用いた検索手法を提案する。
設計手法の評価では, 発電機の性能が28%向上した。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:26:11 GMT)
Risk-Sensitive Conformal Prediction for Catheter Placement Detection in Chest X-rays [0.0] 胸部X線におけるカテーテルと線位置検出のための新しいアプローチを提案する。
我々のモデルは同時に分類、セグメンテーション、ランドマーク検出を行う。
リスクに敏感なコンフォメーション予測は、統計的に保証された予測セットを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:47:10 GMT)
Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers [0.0] Retrieval-Augmented Generation (RAG) は、大規模言語モデルを強化するための強力なパラダイムとして登場した。
RAGは、検索品質、基底忠実度、パイプライン効率、ノイズや逆入力に対する堅牢性といった新しい課題を導入している。
本調査は、RAG研究における現在の知識を集約し、次世代の検索強化言語モデリングシステムの基礎となることを目的としている。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:57:04 GMT)
Rethinking Hybrid Retrieval: When Small Embeddings and LLM Re-ranking Beat Bigger Models [0.0] 我々は,3モーダルハイブリッド検索システムにおける埋め込みモデルの比較を行った。
SciFact、FIQA、NFCorpusデータセットで実施された実験では、MiniLM-v6構成による検索品質が大幅に改善された。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:39:40 GMT)
Quantum processes as thermodynamic resources: the role of non-Markovianity [0.0] 量子熱力学(Quantum thermodynamics)は、量子系と演算が有用な熱力学タスクを実行するための仕事の源としてどのように利用されるかを研究する。
実世界の状況では、オープン量子系の進化は一般にメモリ効果を示し、非マルコフ力学をもたらす。
ここでは、一般的なマルチ時間量子プロセスから熱的操作によって作業を取り出す中心課題における非マルコビアン性の役割を分析する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:41:24 GMT)
Quantum implementation of non-unitary operations with biorthogonal representations [0.0] 非単体作用素の生物直交表現に基づく新しい拡張法を提案する。
提案手法は,固有値が 1 を超える絶対値を持つ非単項演算子の実装において優れている。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:42:50 GMT)
Quantum cooling below absolute zero [0.0] SrTiO$_3$は、温度が低下した強誘電体モードの顕著な軟化を示す。
ハイゼンベルクの量子不確実性原理は、原子が強誘電体極小の中で局在することを防ぐ。
共鳴中赤外パルスでは、量子ゆらぎが抑制され、0K基底状態以下の物質を効果的に冷却する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:03:30 GMT)
Quantum confinement theory of ultra-thin films: electronic, thermal and superconducting properties [0.0] 電子機器の小型化は、数ナノメートルの厚さからわずか1-2ナノメートルまでの超薄膜の出現につながった。
従来の理論やab initio法は、実験で測定された性質を記述するのに苦労している。
量子閉じ込めに対する統一的な理論的アプローチが提案されており、インタフェースの実際の性質を考慮に入れることができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:27:29 GMT)
Quantum computational speedup and retrocausality [0.0] 最適量子アルゴリズムは、量子スピードアップの存在が論理的に相互排他的あるいは因果ループを意味することを示している。
慣用量子記述のユニタリ部分は数学的にはあるが、因果関係の振る舞いの記述はそれに沿って変化する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:15:29 GMT)
Quantum Walk Comb in a Dual Waveguide Quantum Cascade Laser [0.0] リング量子カスケードレーザー(英語版) (QCL) は、中赤外域で周波数コムを生成し、調整するための汎用的なツールであることが証明された。
解析対象のデバイスにおいて,量子ウォークコム演算が可能であることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:28:29 GMT)
Quantum Search on Computation Trees [0.0] モンタナロ(ToC)によるバックトラック木探索のための量子ウォークアルゴリズムの一般化を示す。
このフレームワークは、変数時間探索、量子分割と圧縮、爆弾クエリアルゴリズムなど、他の多くの量子フレームワークを再定義するための、簡単で便利な方法を提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:35:18 GMT)
Provably Efficient Quantum Thermal State Preparation via Local Driving [0.0] 熱密度行列 $rho_betapropto e-beta H$ は与えられたハミルトニアン$H$ に対応する量子多体物理学における中心的関心のタスクである。
本稿では, 利用可能な3つの成分の繰り返し実装しか必要としない, 量子熱状態の概略作成法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 19:48:07 GMT)
Polarization-dependent topology in quantum emitter chains [0.0] 鎖がジグザグ型であれば、偏光方向を調整することで異なる位相位相を実現できることを示す。
我々の発見は、量子エミッタの1つの配列の中で、様々な位相位相を積極的に切り替える方法を開く。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:54:04 GMT)
Physical Reduced Stochastic Equations for Continuously Monitored Non-Markovian Quantum Systems with a Markovian Embedding [0.0] 非マルコフ量子系をモデル化するための効果的なアプローチは、より大きな量子系に主(量子)の興味を持つ系を埋め込むことである。
近年、この埋め込みにおける主系の条件付き進化は、結合微分方程式の系として表現できることが示されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:52:37 GMT)
Optimizing QUBO on a quantum computer by mimicking imaginary time evolution [0.0] ITEMC(Imaginary Time Evolution-Mimicking Circuit)を用いてQUBO問題を解決するためのハイブリッド量子古典アルゴリズムを提案する。
回路パラメータは、単一のビットと2ビットの期待値のみを用いて、想像上の時間進化を忠実に模倣するように最適化されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:56:57 GMT)
Optimize Cardinality Estimation Model Pretraining by Simplifying the Training Datasets [0.0] 既存の事前学習データセットのごく一部に縮小された簡易なトレーニングデータセットを導入する。
この単純化されたデータセットに基づく事前訓練された濃度推定器は、ゼロショット設定で既存のモデルに匹敵する性能を達成できることを示す十分な実験結果が得られた。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:50:44 GMT)
OptiMindTune: A Multi-Agent Framework for Intelligent Hyperparameter Optimization [0.0] 本稿では,ハイパーパラメータをインテリジェントかつ効率的に最適化する新しいマルチエージェントフレームワークOptiMindTuneを紹介する。
私たちは、GoogleのGeminiモデルによって、Recommender Agent、Evaluator Agent、Decision Agentという3つの専門AIエージェントの協調的なインテリジェンスを活用しています。
我々のフレームワークは、高度な大規模言語モデルと適応検索の原則を統合し、スケーラブルでインテリジェントなAutoMLを実現する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:13:41 GMT)
Operationalizing CaMeL: Strengthening LLM Defenses for Enterprise Deployment [0.0] CaMeLは、大きな言語モデル(LLM)エージェントのインジェクションアタックを促す機能ベースのサンドボックスを導入した。
有効ではあるが、CaMeLは信頼されたユーザープロンプトを仮定し、サイドチャネルの懸念を省略し、デュアルLLM設計のためにパフォーマンスのトレードオフを引き起こす。
この回答はこれらの問題を識別し、CaMeLの脅威カバレッジと運用上のユーザビリティを拡大するエンジニアリングの改善を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:35:24 GMT)
On the definition and importance of interpretability in scientific machine learning [0.0] 物理科学の研究者たちは、予測モデルだけでなく、関心のシステムを支配する基本的な原理を明らかにすることを模索している。
方程式発見と記号回帰の研究者は、スパーシティの概念を解釈可能性で説明する傾向があると論じる。
我々の解釈可能性の概念は、数学的疎性に関するメカニズムの理解を強調する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:55:13 GMT)
On the choice of non-linear terms in blocking cat states by energy conservation [0.0] エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。
W.D. Wick, arXiv:1710.03278]で導入された種類の非線形項は、測定問題の解法としてエネルギー保存によって空間猫をブロックすることであった。
最後に [W.D. Wick, arXiv:1710.03278] の提案を検証するための実験的見積もりを述べる。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:39:15 GMT)
Ohm's law, Joule heat, and Planckian dissipation [0.0] 電流の発生とその散逸は重要な物理過程である。
近年、化学ポテンシャルの勾配は、多電子波動関数からのベリー接続の時間成分から生じることが示されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 03:03:08 GMT)
Numerical Optimization Strategies for the Variational Hamiltonian Ansatz in Noisy Quantum Environments [0.0] tVHAを用いた変分量子化学の8つの最適化アルゴリズムのベンチマークを行う。
ノイズのないサンプリングノイズ条件下では,$H$,$H_4$,$LiH$の性能を評価する。
ノイズサンプリングによって設定された精度限界を同定し,約1000発以上のリターンを減少させる。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:26:04 GMT)
Nonlocality of Quantum States can be Transitive [0.0] 量子化可能な非局所性推移性の概念が存在することを示す。
驚いたことに、量子状態の非局所性推移性は、ハール・ランダムの3量子状態の減少状態にも生じる。
量子状態と相関関係を構築するための簡単な方法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:14:22 GMT)
Nonlinear second-order dynamics describe labial constriction trajectories across languages and contexts [0.0] 言語や文脈において、即時変位と瞬時速度の比率は、一般的に運動開始から移動オフセットまでの指数的減衰曲線に従う。
我々は、この経験的発見を微分方程式で定式化し、点引力力学の仮定と組み合わせることで、口唇収縮軌跡を記述する非線形二階力学系を導出する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:41:41 GMT)
Non-convex entropic mean-field optimization via Best Response flow [0.0] 固定基準測度に関して、相対エントロピー(KL)によって正規化される空間確率測度における非函数の最小化の問題について議論する。
非函数から正規化子を選択する方法を示すので、Best Response は$L1$Wasserstein 距離の縮約となる。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:22:08 GMT)
Neural Networks as Universal Finite-State Machines: A Constructive Deterministic Finite Automaton Theory [0.0] 我々は、ユニバーサル有限状態マシン(N-FSM)としてフィードフォワードニューラルネットワークを確立する。
我々の結果は、有限深度ReLUとしきい値ネットワークが決定論的有限オートマトン(DFAs)を正確にシミュレートできることを証明している。
固定深度フィードフォワードネットワークは、メモリを必要とする非正規言語を認識できない。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:39:10 GMT)
Multivariate de Bruijn Graphs: A Symbolic Graph Framework for Time Series Forecasting [0.0] 本稿では,記号表現とニューラルモデリングのギャップを埋める新しいエンコーダであるDRAGONを提案する。
DRAGONは連続的な入力シーケンスを離散化し、それらを固定されたグラフ構造にマッピングすることで、グラフベースの注意による動的コンテキスト回復を可能にする。
DRAGONはデュアルブランチアーキテクチャ内の補助モジュールとして統合され、従来のCNNベースのエンコーダを象徴的で構造を意識した表現で拡張する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:36:26 GMT)
Momentum and spin dynamics of photon in linear dielectric medium [0.0] 双極子の運動量の変化はアブラハム運動量に対応することを示す。
一方、ミンコフスキー運動量は、伝播の方向と光子スピンの沈み込みを決定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:57:10 GMT)
Moderating Harm: Benchmarking Large Language Models for Cyberbullying Detection in YouTube Comments [0.0] 本研究は,OpenAI GPT-4.1, Google Gemini 1.5 Pro, Anthropic Claude 3 Opusの3つの主要な言語モデルを,5,080コメントのコーパスでベンチマークする。
YouTubeのデータセットは、英語、アラビア語、インドネシア語で1,334件の有害メッセージと3,746件の有害メッセージで構成されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:18:17 GMT)
Markovian heat engine boosted by quantum coherence [0.0] マルコフ型1キュービット熱機関における熱力学資源としての量子コヒーレンスの役割を評価する。
我々は、現実的な振幅と位相減衰チャネルをシミュレートし、オットーサイクル全体を量子回路に実装する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:07:56 GMT)
Markovian dissipation can stabilize a (localization) quantum phase transition [0.0] 我々はマルコフ散逸によって破壊されるよりむしろ安定化された非自明な量子相転移を示す。
定常状態はスピンのダイナミクスが凍結される局在相転移を示す。
後者は単なる消散状態ではなく、低周波ボソニックモードによるスピンダイナミクスの非自明な再正規化から生じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:01 GMT)
Mapping out AI Functions in Intelligent Disaster (Mis)Management and AI-Caused Disasters [0.0] 本研究は,災害(災害)管理における人工知能の機能のマッピングである。
原因パラメータの観点からの災害の分類から始まり、独立したAIやハイブリッドAIによる災害の仮説的なケースを導入する。
次に,災害管理と災害管理におけるAIの役割について概説する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:15:49 GMT)
Low Crosstalk in a Scalable Superconducting Quantum Lattice [0.0] 超伝導量子回路は、量子情報処理とシミュレーションを進めるための重要なプラットフォームである。
16個の固定周波数トランスモン量子ビットと近傍の静電容量結合からなる4x4平方格子を,低クロストークで拡張可能であることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:07:51 GMT)
Locking-Free Training of Physics-Informed Neural Network for Solving Nearly Incompressible Elasticity Equations [0.0] 分散不安定性により, ほぼ圧縮不可能な等質弾性方程式に対する有限要素法に適合する低次法則の精度は低下する。
本稿では,基本的に異なる機械学習駆動アプローチに基づくロバストな手法を提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:52:03 GMT)
Local Stability and Region of Attraction Analysis for Neural Network Feedback Systems under Positivity Constraints [0.0] フィードフォワードニューラルネットワーク(FFNN)により実現された静的非線形フィードバックを用いたLur'e形式の非線形システムの局所安定性について検討する。
正の系制約を利用することで、コンパクトな集合に制限された軌道の指数的安定性に十分な条件を与える Aizerman 予想の局所的変種を用いる。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:45:49 GMT)
Leveraging Diffusion Models for Synthetic Data Augmentation in Protein Subcellular Localization Classification [0.0] ラベル一貫性を持つサンプルを生成するために,クラス条件記述拡散確率モデル(DDPM)を実装した。
私たちは、Mix LossとMix Representationという2つのハイブリッドトレーニング戦略を通じて、実際のデータとの統合を検討します。
本研究は, バイオメディカル画像分類に生成増強を取り入れた場合の, 現実的なデータ生成と堅牢な管理の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:58:50 GMT)
Interpolation of Quantum Polar Codes and Quantum Reed-Muller Codes [0.0] 量子極符号はいくつかの要件を満たすが、特定の重要な特徴を欠いているため、広く使われることを妨げている。
既存の構成では、有効な量子コードを生成するために絡み合いの補助を必要としたり、有限サイズの性能に乏しいり、あるいは基礎となるチャネル特性に極性符号を合わせるのに失敗したりしている。
そこで我々は,量子極符号と量子RM符号の補間戦略を提案し,量子極符号を絡み合うことなく設計し,有限サイズの符号性能を向上させるという課題に対処する。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:04:02 GMT)
Information back-flow in quantum non-Markovian dynamics and its connection to teleportation [0.0] 量子過程は、その進化中に記憶効果が発生するとき、非マルコフ過程と呼ばれる。
本稿では,主システムと環境間の通信プロトコルにおける情報の流れを双方向に表現し,状態を回復させる方法について述べる。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:06:50 GMT)
Improving Respiratory Sound Classification with Architecture-Agnostic Knowledge Distillation from Ensembles [0.0] 呼吸音分類のためのソフトラベルは、訓練時にのみ余分なコストで効率よく蒸留知識を抽出する。
我々はICHBI上で64.39の最先端スコアを新たに達成し、以前の最高値である0.85を超え、アーキテクチャ全体の平均スコアを1.16以上改善した。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:49:18 GMT)
Improving QA Efficiency with DistilBERT: Fine-Tuning and Inference on mobile Intel CPUs [0.0] 本研究は,第13世代Intel i7-1355U CPU上での展開に最適化された,効率的なトランスフォーマーベースの質問応答モデルを提案する。
このモデルは、平均推定時間1問あたり0.1208秒のバリデーションF1スコア0.6536を達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:38:11 GMT)
Improvement of human health lifespan with hybrid group pose estimation methods [0.0] 人間のポーズ推定手法は,人間の身体の動きを実生活で追跡するためにコンピュータビジョンの進歩を利用する。
ポーズ推定運動の消費者は、人間のポーズコンテンツは利用可能なビデオを補う傾向があると信じている。
ヒトの健康を改善するために,ハイブリッドアンサンブルに基づくグループポーズ推定法を開発した。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:43:28 GMT)
Imitating Radiological Scrolling: A Global-Local Attention Model for 3D Chest CT Volumes Multi-Label Anomaly Classification [0.0] 3次元CTスキャンのマルチラベル分類は、データの体積特性と検出すべき異常の多様性のために難しい課題である。
畳み込みニューラルネットワーク(CNN)に基づく既存のディープラーニング手法は、長距離依存を効果的に捉えるのに苦労する。
我々は,3次元CTスキャン解析において,放射線技師のスクロール挙動をエミュレートする新しいグローバルアテンションモデルCT-Scrollを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:47:46 GMT)
IGNIS: A Neural Network Framework for Robust Parameter Estimation in Archimedean Copulas [0.0] IGNIS Networkは、観測可能な依存度からコプラパラメータへの直接マッピングを学習する、新しい統合ニューラルネットワークフレームワークである。
この結果は,現代の応用における堅牢かつ高精度な依存モデリングのためのニューラルメソッドの変換ポテンシャルを裏付けるものである。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:04:17 GMT)
Hyperbolic recurrent neural network as the first type of non-Euclidean neural quantum state ansatz [0.0] 本稿では,非ユークリッド型ニューラル量子状態(NQS)アンザッツを双曲型GRUの形で導入する。
我々の研究は、量子多体系に対する最初の非ユークリッドNQSアンサッツとして、双曲型GRUの生存可能性に関する概念実証である。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:06:25 GMT)
How to avoid (apparent) signaling in Bell tests [0.0] ベルテストは(透明)シグナリングを用いた実験データを生成することができる。
このシグナリングは、実験的な設計の弱点に起因する体系的な誤りに起因する可能性がある。
偏光に絡み合った光子を用いた一連の実験を行い、系統的誤りの共通源を特定し、それらを避けるためのアプローチを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:25:49 GMT)
High gain squeezing in lossy resonators: an asymptotic field approach [0.0] 集積フォトニックデバイスにおける非線形電磁相互作用を記述する方法を提案する。
本手法は、任意のパルス入力に対して非摂動的に進化を記述することによって、従来の連続波処理に拡張する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:27:52 GMT)
Handling bounded response in high dimensions: a Horseshoe prior Bayesian Beta regression approach [0.0] 本稿では, 後部をテーパー化した高次元スパースベータ回帰フレームワークに対するベイズ的手法を提案する。
私たちのメソッドは、Githubで利用可能なRパッケージbetaregbayesで実装されています。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:39:05 GMT)
Graph Contrastive Learning for Optimizing Sparse Data in Recommender Systems with LightGCL [0.0] LightGCLは、堅牢なグラフ拡張にSingular Value Decomposition(SVD)を使用するグラフコントラスト学習モデルである。
我々の実験は、人気バイアスに対する公正性とレジリエンスの改善も示しており、現実世界のレコメンデータシステムに適している。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:21:41 GMT)
Geometry of chiral temporal structures II: The formalism [0.0] 我々は、キラル分子の光イオン化や光励起によるエナンチオ感受性分子配向の出現を基礎とした数学的フォーマリズムを開発する。
複素光偏光ベクトルの空間における光駆動キラル電子状態におけるベリー接続やベリー曲率などの幾何学的量を考える。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:04:14 GMT)
Geometry of chiral temporal structures I: Physical effects [0.0] 本稿では,時間的形状の幾何学的および位相的特性を包含する時間的幾何学の概念を紹介する。
時間幾何学の中心概念であるベリー曲率とベリー接続は、光励起非平衡キラル電子力学のユビキタスな特徴として現れる。
我々の発見は、超高速で、トポロジカルに非自明で、エナンチオ感受性の化学動力学への道を開くかもしれない。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:03:38 GMT)
Generalizable Representation Learning for fMRI-based Neurological Disorder Identification [0.0] 正常な特徴から臨床的特徴への一般化を改善するために,新しい表現学習戦略を導入する。
我々は、制御データセットの自己教師付き学習を活用して、特定の教師付きタスクに限定されない固有の特徴に焦点を当てる。
その結果,多種多様な臨床関連課題における表現学習戦略の優位性を示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:27:12 GMT)
GUST: Quantifying Free-Form Geometric Uncertainty of Metamaterials Using Small Data [0.0] GUST (Generative Uncertainty Learning via Self-supervised pretraining and Transfer Learning) は、メタマテリアルの製造に固有の自由形式の幾何学的不確実性を定量化するフレームワークである。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:40:15 GMT)
Fusion Steering: Prompt-Specific Activation Control [0.0] Fusion Steeringは、質問応答(QA)タスクのための大規模言語モデル(LLM)の事実精度を改善する。
このアプローチでは、フルレイヤのステアリングやセグメント化されたステアリングなど、フレキシブルなステアリング構成を導入している。
より厳格なSimpleQAルーブリックの下では、セグメンテッドステアリングは0.0%から13.1%に完全に正しい応答を加速する。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:46:55 GMT)
Fundamental Complement of a Gravitating Region [0.0] EW$(B)$ は EW$(bar B)$ の空間的な補集合であることを示す。
ビッグバンの宇宙論は、閉じられているにもかかわらず、自明に再構築可能であることが分かりました。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:50:42 GMT)
Forecasting Residential Heating and Electricity Demand with Scalable, High-Resolution, Open-Source Models [0.0] 本稿では,確率論的深層学習モデルを用いた住宅暖房と電力需要の高精度予測のための新しい枠組みを提案する。
我々は、住宅セクターに対して、時間単位のビルレベルの電力供給と暖房需要予測に特に焦点をあてる。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:16:27 GMT)
Flow to Nishimori universality in weakly monitored quantum circuits with qubit loss [0.0] クビット損失とコヒーレントエラー(英: qubit loss and coherent error)は、長距離の絡み合いの形成を妨げる回路欠陥である。
本研究では,2種類の誤差が同時に発生する場合のしきい値挙動について検討し,投射安定度測定のクリフォード-レジームから離れると,パーコレーション臨界点が不安定になることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:00:01 GMT)
Fast Isotropic Median Filtering [0.0] メディアフィルタリングは計算画像処理の基盤となっている。
本手法は,任意のビット深度データ,任意のカーネルサイズ,任意の凸カーネル形状を効率的に操作する。
論文参考訳(メタデータ) (Wed, 28 May 2025 23:38:21 GMT)
Fairness through Feedback: Addressing Algorithmic Misgendering in Automatic Gender Recognition [0.0] 本稿では,ジェンダー自動認識システムの理論的,実践的な再考を提案する。
我々は、アルゴリズムのミスジェンダーとは異なり、人間と人間のミスジェンダーは再評価と修正の可能性を秘めているという観察に基づいて構築する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:49:05 GMT)
Exact Algorithms and Lower Bounds for Forming Coalitions of Constrained Maximum Size [0.0] この問題に対して,各チームがさらに境界サイズでなければならないバージョンについて検討する。
我々の主な貢献は、小さなチームの木のような構造(有界枝木幅)を効率的に扱うアルゴリズムである。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:11:14 GMT)
Evolution analysis of software quality metrics in an open-source java project: A case study on TestNG [0.0] 本研究では,オープンソースJavaテスティングフレームワークTestNGの5つの連続したバージョンにおけるソフトウェア品質指標の進化を分析する。
その結果、TestNGはより安定してメンテナンス可能なフレームワークに成熟し、継続的な開発とアーキテクチャの改善を反映していることがわかった。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:34:27 GMT)
Enhancing Paraphrase Type Generation: The Impact of DPO and RLHF Evaluated with Human-Ranked Data [0.0] パラフレーズ化は、テキストの単純化、機械翻訳、質問応答などのアプリケーションを強化する意味を持つ。
既存のパラフレーズ型生成法は、自動化されたメトリクスと限定的な人手によるトレーニングデータに依存するため、人間の嗜好に反することが多い。
本研究は,人間のランク付けされたパラフレーズ型データセットを活用し,モデル出力と人間の判断を直接整合させるためにDPO(Direct Preference Optimization)を統合することで,このギャップに対処する。
論文参考訳(メタデータ) (Wed, 28 May 2025 07:52:18 GMT)
Enhanced Excited State Population and Coherence via Adiabatic Tunneling Ionization and Excitation [0.0] トンネル電離と強磁場励起は、電荷移動やラシングなどの超高速現象を引き起こす。
近年の進歩は、トンネルと励起の複雑な相互作用により、イオン励起状態の個体数が大幅に増大することが示唆されている。
この研究は、強いレーザーパルスを用いて電子励起状態とコヒーレンスを生成し制御するための新しい枠組みを導入する。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:13:56 GMT)
Enantiosensitive locking of photoelectron spin and cation orientation [0.0] 我々はスピン選択光誘起力学のテクトダイナミックおよびテクトジオメトリ機構を確立する。
我々は、光電子のスピンと親分子のホールに対する分子カチオン配向のエナンチオ感応性ロック(enantio-sensitive locking)という新しい効果を報告した。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:56:48 GMT)
Effect of noise and topologies on multi-photon quantum protocols [0.0] 量子拡張ネットワークは、悪意のあるアクターに対する検出と保護を改善するために量子現象を使用することを目的としている。
このようなハイブリッドネットワークでは、単一光子に基づく量子プロトコルが送信距離とデータ速度のボトルネックとなる。
一方、マルチ光子量子プロトコルは、実用的な仮定の下で動作するよう設計されており、単一の光子エミッタを必要としない。
論文参考訳(メタデータ) (Wed, 28 May 2025 00:57:34 GMT)
Dynamical Sweet and Sour Regions in Bichromatically Driven Floquet Qubits [0.0] 異なる周波数の2つの周期駆動を用いた駆動フレームにおけるキュービットの動作は、単色駆動フレームよりも有利であることを示す。
準エネルギーギャップと劣化率の解析式を提示し、二色駆動がDCとACのトレードオフを緩和することを示した。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:22:35 GMT)
Domainator: Detecting and Identifying DNS-Tunneling Malware Using Metadata Sequences [0.0] Domainatorは、最先端のマルウェアとDNSトンネリングツールを検出し、区別するアプローチである。
本手法を7種類のマルウェアサンプルとトンネルツールを用いて評価し,DNSトラフィックに基づいて特定のマルウェアを識別する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:52:19 GMT)
Does Johnny Get the Message? Evaluating Cybersecurity Notifications for Everyday Users [0.0] 最近のアプローチでは、大規模な言語モデルを使用して、簡潔で技術的なセキュリティ警告を直感的な言語に書き直している。
このようなアラートがユーザに対してどの程度うまく説明されているのか、まだ明らかな疑問だ。
本稿では,Human-Centered Security Alert Evaluation Framework (HCSAEF)を紹介する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:58:29 GMT)
Document Valuation in LLM Summaries: A Cluster Shapley Approach [0.0] 大規模言語モデル(LLM)は、複数のソースからコンテンツを検索して要約するシステムにおいて、ますます使われている。
本稿では,各文書の余剰貢献に基づいてクレジットを割り当てるゲーム理論のShapley値を提案する。
そこで我々は,文書間の意味的類似性を利用した効率的な近似アルゴリズムであるCluster Shapleyを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:14:21 GMT)
Dividing quantum circuits for time evolution of stochastic processes by orthogonal series density estimation [0.0] 量子モンテカルロ積分(Quantum Monte Carlo integration, QMCI)は、確率変数の予測を推定する量子アルゴリズムである。
本稿では直交級数密度推定に基づいて$U_X(t)$を分割する手法を提案する。
本手法は,回路深度と総クエリ複雑性のスケーリングを,それぞれ$O(sqrtN)$と$O(N3/2)$として達成する。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:53:41 GMT)
Development and Validation of SXI++ LNM Algorithm for Sepsis Prediction [0.0] セプシスは全世界で4890万人以上が死亡し、毎年1100万人が死亡している。
SXI++ LNMは、複数のアルゴリズムとディープニューラルネットワークを活用することでセシス予測を洗練する機械学習スコアシステムである。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:20:35 GMT)
Detecting Cultural Differences in News Video Thumbnails via Computational Aesthetics [0.0] 本稿では,文化親和性の異なるソース間の画像のスタイルの違いを検出するための2段階のアプローチを提案する。
このアプローチを、米国と中国の2つのYouTubeチャンネルから等しく採取された2,400本のYouTubeビデオサムネイルで検証する。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:58:41 GMT)
Derivation of Fokker-Planck equation from Schrodinger dynamics [0.0] 我々は、可逆的なシュロディンガー力学に基づく純粋量子力学的アプローチにより、フォッカー・プランク方程式を導出する。
時間非依存ハミルトニアンの固有状態の表現を導出するために、この場合の熱力学的エントロピーは、量子エントロピーの粗いグライングに対応しなければならない。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:51:30 GMT)
Derailing Non-Answers via Logit Suppression at Output Subspace Boundaries in RLHF-Aligned Language Models [0.0] モデル重みやプロンプトを変更することなく、センシティブなコンテンツに対する大言語モデル(LLM)の拒絶率を低減する手法を提案する。
特定のモデルの拒絶は、しばしばトークンの特定のトークンシーケンスによってもたらされた、という観察によって動機づけられた。
この結果から, 退避行動は, 生成過程の特定の点において, 退避部分空間をブロックすることによって回避できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:25:24 GMT)
Depth-Based Matrix Classification for the HHL Quantum Algorithm [0.0] Harrow, Hassidim and Lloyd (HHL) は方程式の線形系に対するアルゴリズムである。
本稿では,機械学習の分類器を用いて,HHL実装に適した問題と評価できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:11:53 GMT)
Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification [0.0] 本研究は,深層学習による骨密度推定に広く利用可能な膝X線を用いたことを提案する。
統計的に厳格で患者固有の予測間隔を提供し、カバー範囲が保証されている。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:33:49 GMT)
Decision-Focused Forecasting: A Differentiable Multistage Optimisation Architecture [0.0] 決定に焦点をあてた予測は、完全に微分可能な多段階最適化アプローチを表現する再帰的な微分可能な最適化アーキテクチャである。
予測の時間的決定効果を考慮した勾配調整について述べる。
エネルギー貯蔵の調停とポートフォリオ最適化の多段階問題に適用し,本モデルが既存手法より優れていることを報告する。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:11:30 GMT)
Data-Driven Antenna Miniaturization: A Knowledge-Based System Integrating Quantum PSO and Predictive Machine Learning Models [0.0] 本研究では,HFSSシミュレーションと量子ビーム動的粒子群最適化を統合し,アンテナ設計を高速化する。
QDPSOアルゴリズムは11.53秒でループ次元を自動最適化し、共振周波数は1.2208 GHzである。
システムは、製造可能なパラメータを自動生成するパフォーマンスターゲットの正確な仕様を可能にする。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:04:36 GMT)
Crossed products and quantum reference frames: on the observer-dependence of gravitational entropy [0.0] 量子参照フレーム(QRF)を用いた重力エントロピーの詳細な解析を行う。
我々は、QFTのエネルギーのゆらぎにエネルギー変動が支配される時計を特徴とする半古典的状態を考える。
エントロピーを評価する際に、時計が単に部分的に追跡される可能性があることを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 02:31:24 GMT)
Counting trees: A treebank-driven exploration of syntactic variation in speech and writing across languages [0.0] 我々は、構文構造をデレクシカルな依存(サブ)ツリーとして定義し、音声および記述されたユニバーサル依存ツリーバンクからそれらを抽出する。
各コーパスについて, 構文的在庫の大きさ, 多様性, 分布, その重なり合い, 音声の最も特徴的な構造を解析した。
その結果、どちらの言語でも、音声コーパスは、記述されたコーパスよりも、より多様で多様な構文構造を含まないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:43:26 GMT)
Counterfactuals in Macroscopic Quantum Physics: Irreversibility, Measurement and Locality [0.0] 測度、可逆性、局所性はすべて、量子論の普遍性に挑戦するように見える。
我々は、不可逆性、情報消去、コヒーレンスに関連する量子熱力学の新たな特徴を見出した。
これは、絡み合いと量子分岐構造に格納された量子情報を特徴付ける新しい方法を明らかにする。
論文参考訳(メタデータ) (Wed, 28 May 2025 20:14:17 GMT)
Conversational Alignment with Artificial Intelligence in Context [0.0] この記事では、AIエージェントが人間のコミュニケーション規範やプラクティスと会話的に整合していることの意味について説明する。
我々は,現在の大規模言語モデル (LLM) アーキテクチャ,制約,余裕が,完全な対話的アライメントを実現する上で基本的な制約を課すことを示唆する。
論文参考訳(メタデータ) (Wed, 28 May 2025 22:14:34 GMT)
Contextual Memory Intelligence -- A Foundational Paradigm for Human-AI Collaboration and Reflective Generative AI Systems [0.0] 本稿では,知的システム構築のための新しいパラダイムとして,コンテキストメモリインテリジェンス(CMI)を紹介する。
CMIは、メモリを長手コヒーレンス、説明可能性、責任ある意思決定に必要な適応的な基盤として再配置する。
これにより、人間とAIのコラボレーション、生成的AI設計、組織のレジリエンスが向上する。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:59:16 GMT)
Configuration-dependent precision in magnetometry and thermometry using multi-qubit quantum sensors [0.0] 本研究では,4つの量子ビットからなる量子センサの性能について検討した。
強磁性カップリングでは、弱連結グラフ(例えば、連鎖グラフ、P_4)は弱磁場の推定において最適に作用するが、高連結グラフ(例えば、完全グラフ、K_4)は強磁場で励起される。
我々は、小さな摂動下でのエネルギースペクトルの変形を定量化するスペクトル感度測定法を導入し、磁気学的性能を最適化するツールを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 14:23:51 GMT)
Compensating for Data with Reasoning: Low-Resource Machine Translation with LLMs [0.0] Fragment-Shot Promptingは、構文的カバレッジに基づいて、入力をセグメント化し、翻訳例を検索する、コンテキスト内学習手法である。
Pivoted Fragment-Shotは、直接並列データなしで翻訳できる拡張である。
GPT-3.5, GPT-4o, o1-mini, LLaMA-3.3, DeepSeek-R1 を用いてイタリア語と2種類のラディン語の翻訳を行った。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:29:05 GMT)
Comparative analysis of robust entanglement generation in engineered XX spin chains [0.0] プロトコル1(P1)は連鎖の終端に対して相関を保つために停滞した結合に依存している。
Protocol 2 (P2)は、最適化されたバウンダリフィールドを使用して終端スピン間の仮想励起を仲介するデュアルポートアーキテクチャを採用する。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:35:41 GMT)
Community Detection in Networks: A Rough Sets and Consensus Clustering Approach [0.0] 本稿では,Rough Clustering-based Consensus Community Detection (RC-CCD) と呼ばれるフレームワークを提案する。
RC-CCDフレームワークは、Lancichinetti-Fortunato-Radicchi (LFR)法によって生成された、様々なネットワークスケール、ノード度、コミュニティサイズをシミュレートするベンチマークネットワーク上でテストされる。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:25:29 GMT)
Closing the Quantum-Classical Scaling Gap in Approximate Optimization [0.0] 異なる古典的パラダイムによる結果の再評価 -シミュレート・バイファーケーション・マシン(SBM)-
熱ゆらぎよりもカオス的な振る舞いを活用することで、SBMは同等または優れたスケーリング性能を達成する。
我々は、現在の量子異方体の生成が離散的な近似最適化において優越性を証明できる可能性は低いと結論づける。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:02:57 GMT)
Chest Disease Detection In X-Ray Images Using Deep Learning Classification Method [0.0] 胸部X線画像の分類のために,複数の分類モデルにまたがる性能について検討した。
ラベル付き医療用X線画像に基づいて,これらの事前学習アーキテクチャを微調整した。
最初の結果は、重要な分類基準で高い精度と高いパフォーマンスを約束する。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:24:33 GMT)
ChatCFD: an End-to-End CFD Agent with Domain-specific Structured Thinking [0.0] ChatCFDはOpenFOAMフレームワーク内で大きな言語モデル駆動のCFDパイプラインを自動化する。
ユーザは、自然言語プロンプトや出版文献から、最小限の専門知識で複雑なシミュレーションを設定および実行することができる。
論文参考訳(メタデータ) (Wed, 28 May 2025 08:43:49 GMT)
Characterization of Nanostructural Imperfections in Superconducting Quantum Circuits [0.0] ジョセフソン接合とスパイラル共振器の断面の原子レベル特性について述べる。
酸化物層の形成と炭素系汚染に関連する構造欠陥を同定した。
その結果,重要なインターフェースにおけるTLS欠陥は,デバイス性能の制限に大きく寄与することが示唆された。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:55:51 GMT)
Can Copulas Be Used for Feature Selection? A Machine Learning Study on Diabetes Risk Prediction [0.0] 本稿では,A2コプラのアッパーテール依存性係数(lambdaU)を用いた特徴選択フレームワークを提案する。
提案手法は,上尾の依存関係に基づいて5つの予測器を優先順位付けする。
これらの特徴は、4つの分類器にまたがるMIとGAの選択したサブセットにマッチする。
論文参考訳(メタデータ) (Wed, 28 May 2025 16:34:58 GMT)
Bridging Language, Vision and Action: Multimodal VAEs in Robotic Manipulation Tasks [0.0] 本研究では,ロボット操作分野における教師なし視覚-言語-アクションマッピングに着目した。
本研究では,シミュレータにおけるモデルの性能を最大55%向上させるモデル不変学習法を提案する。
我々の研究は、ロボット運動軌跡の教師なし学習に現在のマルチモーダルVAEを使用することの潜在的な利点と限界にも光を当てている。
論文参考訳(メタデータ) (Wed, 28 May 2025 15:24:13 GMT)
Benincasa-Dowker causal set actions by quantum counting [0.0] 因果集合論 (Causal set theory) は、時空が根本的に離散的な量子重力へのアプローチである。
任意の時空次元でベニンカサ・ドーカー作用を計算するために, $tildeO(n2)$ 実行時量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:50:06 GMT)
BPMN to Smart Contract by Business Analyst [0.0] 本稿では、BPMN(Business Process Management and Notation)モデルを用いて代表されるアプリケーションのスマートコントラクトを作成するという課題に対処する。
以前の作業では、BPMNモデルからスマートコントラクトを自動生成する方法論を紹介しました。
その後の調査では、ネストトランザクションのサポートを追加し、スマートコントラクトの修復やアップグレードを可能にして、アプローチを強化しました。
論文参考訳(メタデータ) (Wed, 28 May 2025 17:28:38 GMT)
Automating tumor-infiltrating lymphocyte assessment in breast cancer histopathology images using QuPath: a transparent and accessible machine learning pipeline [0.0] 腫瘍浸潤リンパ球(TIL)の評価パイプラインをQuPath内に構築した。
我々は,QuPathに事前学習したStarDist深層学習モデルを適用し,抽出したセル特徴を用いてバイナリ分類器を訓練した。
このパイプラインは病理学者が指定したTILスコアに対して評価し,外部試験セットでCohenのカッパ0.71を達成した。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:18:22 GMT)
Automated Essay Scoring Incorporating Annotations from Automated Feedback Systems [0.0] 我々は、スペルと文法的誤りを識別するアノテーションと、議論的なコンポーネントを強調するアノテーションの2つのタイプを統合する。
この手法が現実世界のシナリオにどのように適用できるかを説明するために、アノテーションを生成するために2つのLCMを用いる。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:39:56 GMT)
Anti-bosonic current in thermal spin pumping [0.0] ガドリニウム鉄ガーネットの熱スピンポンプについて検討し,反強磁性マグノンのダイナミクスとスピンおよび熱輸送への影響に着目した。
温度依存性のスピン波スペクトルと熱スピンポンピング定数を導出し,マグノンモードのコントリビューションによる異なる輸送機構を明らかにした。
論文参考訳(メタデータ) (Wed, 28 May 2025 12:59:37 GMT)
Anderson localization induced by structural disorder [0.0] 構造障害の強度が円滑に増加するとアンダーソン局在化遷移が生じることを示す。
本研究は, 物質波の破壊干渉が輸送を阻害し, 金属相と局所相の遷移を引き起こす, 構造的に乱れた格子モデルの新たなクラスを同定する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:27:39 GMT)
Advancing the heralded photon-number-state characterization by understanding the interplay of experimental settings [0.0] 単モード双対ビームから生成される最大3個の光子を含む有理数状態の特性を理論的に探索する。
以上の結果から,高画質光子数状態を生成するための最適パラメータ領域が同定され,量子技術での利用を推し進める上で有用な知見が得られた。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:32:52 GMT)
Advancing Reasoning in Large Language Models: Promising Methods and Approaches [0.0] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて著しく成功している。
複雑な推論スパンニング論理推論、数学的問題解決、コモンセンス推論、そして多段階推論を実行する能力は、人間の期待に届かない。
本調査は, LLMにおける推論向上技術に関する総合的なレビューを提供する。
論文参考訳(メタデータ) (Wed, 28 May 2025 05:08:18 GMT)
Advancing Hearing Assessment: An ASR-Based Frequency-Specific Speech Test for Diagnosing Presbycusis [0.0] 従来の音響測定では、聴覚障害が音声理解に与える影響を完全に特徴づけることができない。
本稿では,新しい音声認識(ASR)に基づく周波数固有音声テストの開発とシミュレーション評価について述べる。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:06:22 GMT)
Advances in Position-Momentum Entanglement: A Versatile Tool for Quantum Technologies [0.0] 位置モメンタム絡みは量子光学における汎用的な高次元資源である。
現実の基本的なテストから量子技術への応用に至るまで、空間の絡み合いは近年増大している。
論文参考訳(メタデータ) (Wed, 28 May 2025 11:51:21 GMT)
A local quantized marker for topological magnons from circular dichroism [0.0] トポロジカルマグノンは サンプルの端で キラル伝播モードを検出することで識別できる
本研究では,局所駆動散布法と円二光度測定を併用して,実験的にアクセス可能なトポロジカルスピンシステムに適した定量化トポロジカルマーカーを提案する。
論文参考訳(メタデータ) (Wed, 28 May 2025 13:27:21 GMT)
A comprehensive analysis of PINNs: Variants, Applications, and Challenges [0.0] 微分方程式を解くための強力な計算ツールとして,物理情報ニューラルネットワーク (PINN) が登場している。
本調査は,これらの要因を詳細に分析し,最近の進歩とPINNにおける最先端の研究と組み合わせることで,既存の文献のギャップを埋めようとしている。
論文参考訳(メタデータ) (Wed, 28 May 2025 18:25:17 GMT)
A Survey on Training-free Open-Vocabulary Semantic Segmentation [0.0] この調査では、トレーニングなしのオープン語彙セマンティックセマンティックセグメンテーションにおける歴史、ニュアンス、アイデア開発、最先端技術について取り上げる。
論文参考訳(メタデータ) (Wed, 28 May 2025 10:37:52 GMT)
A Note on Vectorial Boolean Functions as Embeddings [0.0] 我々は、$F$の少なくとも2M~2M-n$のコンポーネントはバランスが取れており、この最大値は、$F$が埋め込みであるときに正確に達成されることを示す。
部分ベント埋め込みでは、$n$が偶数であるとき、少なくとも2n − 1$のバランス成分が、$n$が奇数であるとき、$m-1 + 2n-1 - 1$のバランス成分が常に存在することを示す。
論文参考訳(メタデータ) (Wed, 28 May 2025 06:19:23 GMT)
A Combinatorial Theory of Dropout: Subnetworks, Graph Geometry, and Generalization [0.0] 本稿では,2進法の高次元グラフ上のランダムウォークをモデル化し,ドロップアウトの一般化とグラフ理論的理論を提案する。
一般化作業が大規模で接続された低抵抗クラスタを形成し,ネットワーク幅で指数関数的に増加することを証明した。
これによって、堅牢で構造化された、冗長性を備えた汎用的なワークの集合体からサンプリングするメカニズムとして、ドロップアウトが明らかになる。
論文参考訳(メタデータ) (Wed, 28 May 2025 21:33:01 GMT)
2-Category of Topological Quantum Computation [0.0] 同じカテゴリがトポロジカル量子コンピューティングモデルを定式化していると広く考えられている。
本稿では、任意の理論とトポロジカル量子コンピューティングのモデルの両方をキャプチャし、統一する分類形式論は、ブレイド(融合)2-カテゴリである、と論じる。
論文参考訳(メタデータ) (Wed, 28 May 2025 09:41:17 GMT)