RH20T-P: A Primitive-Level Robotic Dataset Towards Composable Generalization Agents [105.1] プリミティブレベルのロボット操作データセットであるRH20T-Pを提案する。
実際のシナリオで67種類の操作タスクをカバーする約38Kのビデオクリップが含まれている。
我々は、計画実行CGAパラダイムを標準化し、RH20T-PにRA-Pと呼ばれる典型的なベースラインを実装します。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:17:14 GMT)
BinaryHPE: 3D Human Pose and Shape Estimation via Binarization [99.8] 3次元人のポーズと形状推定(HPE)は、単一の画像から3次元の人体、顔、手を再構築することを目的としている。
本研究では,人体・顔・手の3次元パラメータを効率的に推定するバイナライズ手法であるBinaryHPEを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:33:43 GMT)
Frontiers in Intelligent Colonoscopy [96.6] 本研究は, インテリジェント大腸内視鏡技術のフロンティアと, マルチモーダル医療への応用の可能性について検討する。
大腸内視鏡的シーン知覚のための4つのタスクを通して,現在のデータ中心およびモデル中心のランドスケープを評価した。
今後のマルチモーダル時代を受け入れるために,大規模マルチモーダル・インストラクション・チューニング・データセットColoninST,大腸内視鏡で設計されたマルチモーダル言語モデルColonGPT,マルチモーダル・ベンチマークの3つの基本イニシアティブを構築した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:00:55 GMT)
Exploring Representation-Aligned Latent Space for Better Generation [86.5] 生成性能を改善するために,セマンティックな事前情報を統合するReaLSを導入する。
本研究では、ReaLSでトレーニングされたDETとSiTが、FID測定値の15%改善を実現することを示す。
拡張されたセマンティック潜在空間は、セグメンテーションや深さ推定のようなより知覚的な下流タスクを可能にする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:42:12 GMT)
Language Model Preference Evaluation with Multiple Weak Evaluators [78.5] GED(Preference Graph Ensemble and Denoise)は、複数のモデルベースの評価器を活用して嗜好グラフを構築する新しいアプローチである。
特に,本手法は,評価を統一グラフに集約し,デノナイジングプロセスを適用する2つの主要な段階から構成される。
我々は,本枠組みの理論的保証を行い,真理優先構造を回復する上での有効性を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:08:49 GMT)
Position: Evaluating Generative AI Systems is a Social Science Measurement Challenge [78.4] 我々は,MLコミュニティが,GenAIシステム評価のための計測機器を開発する際に,社会科学の学習と図面の恩恵を受けることを論じる。
我々は,GenAIの能力,行動,および影響に関する概念を測定するための,社会科学からの計測理論に基づく4段階の枠組みを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:09:51 GMT)
BrainMAP: Learning Multiple Activation Pathways in Brain Networks [77.2] 本稿では,脳ネットワークにおける複数の活性化経路を学習するための新しいフレームワークであるBrainMAPを紹介する。
本フレームワークは,タスクに関わる重要な脳領域の説明的分析を可能にする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:50:59 GMT)
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs [76.4] o1のようなモデルは、推論中に人間のような長時間の思考をエミュレートすることができる。
本論文は,これらのモデルにおける過度な考察の課題に関する,最初の包括的研究である。
精度を損なうことなく、過剰思考を緩和し、推論プロセスを合理化するための戦略を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:57:37 GMT)
How to Make LLMs Strong Node Classifiers? [70.1] 言語モデル(LM)は、グラフニューラルネットワーク(GNN)やグラフトランスフォーマー(GT)など、ドメイン固有のモデルの優位性に挑戦している。
本稿では,ノード分類タスクにおける最先端(SOTA)GNNに匹敵する性能を実現するために,既製のLMを有効活用する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:29:48 GMT)
Sigmoid Self-Attention is Better than Softmax Self-Attention: A Mixture-of-Experts Perspective [69.7] 本稿では,Sigmoid self-attentionがソフトマックスよりも試料効率が高いことを理論的に示す。
我々は,シグモイド自己注意における'専門家'は,ソフトマックス自己注意と同一の近似誤差を達成するために,極めて少ないデータを必要とすることを示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:36:14 GMT)
TeST-V: TEst-time Support-set Tuning for Zero-shot Video Classification [68.3] 我々は、ゼロショットビデオ分類(TEST-V)のためのTEst-time Support-set Tuningという新しいフレームワークを提案する。
サポートセットを複数のプロンプト(Multi-prompting Support-set Dilation, MSD)で拡張した後、学習可能なウェイトを通じてサポートセットを侵食し、キーキューをマイニングする。
$textbfTEST-V$は、4つのベンチマークで最先端の結果を達成し、サポートセットのディレーションとエロージョンに優れた解釈性を持つ。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:20:01 GMT)
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves? [65.9] 本稿では,モデル能力の特定の側面に基づいてLVLMをベンチマークする,オンデマンドで評価を行う自動フレームワークであるAutoBench-Vを紹介する。
5つの要求されたユーザ入力に対して9つの人気のあるLVLMを広範囲に評価することにより、このフレームワークの有効性と信頼性を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:27:26 GMT)
Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning [62.4] 本稿では,新しい値に基づく強化学習アルゴリズムであるCQN-AS(Coarse-to-fine Q-Network with Action Sequence)を紹介する。
我々は,53のロボットタスクに対して,疎密かつ高密度な報酬と実演と無実の報酬を用いたアルゴリズムを検討した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:09:07 GMT)
Towards Privacy-aware Mental Health AI Models: Advances, Challenges, and Opportunities [61.6] 精神病は、社会的、個人的コストがかなり高い広範囲で不安定な状態である。
近年の人工知能(AI)の進歩は、うつ病、不安障害、双極性障害、統合失調症、外傷後ストレス障害などの病態を認識し、対処するための大きな可能性を秘めている。
データセットやトレーニング済みモデルからの機密データ漏洩のリスクを含むプライバシー上の懸念は、これらのAIシステムを実際の臨床環境にデプロイする上で、依然として重要な障壁である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:10:02 GMT)
A Diffusion Model Translator for Efficient Image-to-Image Translation [60.9] 本稿では,拡散モデルトランスレータ (DMT) と呼ばれる,軽量トランスレータを用いた拡散モデルを効率よく実装する手法を提案する。
我々は、画像スタイリング、画像のカラー化、画像へのセグメント化、画像へのスケッチなど、さまざまなI2Iアプリケーションに対するアプローチを評価し、その有効性と汎用性を検証した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:01:24 GMT)
Personalized Denoising Implicit Feedback for Robust Recommender System [60.7] ユーザの個人的損失分布には,正常なインタラクションとノイズの多いインタラクションが明確に区別されていることを示す。
本稿では,ユーザのパーソナライズロス分布であるPLDを用いてDenoiseに対する再サンプリング戦略を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:13:06 GMT)
On Disentangled Training for Nonlinear Transform in Learned Image Compression [59.7] 学習画像圧縮(lic)は,従来のコーデックに比べて高いレート歪み(R-D)性能を示した。
既存のlic法は、非線形変換の学習において、エネルギーのコンパクト化によって生じる緩やかな収束を見落としている。
非線形変換の訓練において, エネルギーの縮退を両立させる線形補助変換(AuxT)を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:49:49 GMT)
UniAttn: Reducing Inference Costs via Softmax Unification for Post-Training LLMs [58.8] 大規模言語モデル(LLM)を現実世界のアプリケーションに適用するには、ポストトレーニングが不可欠である。
我々は,変圧器ブロック間でのソフトマックスのアクティベーションを統一し,推論コストを削減する新しいポストトレーニング手法であるtextbfAttetextbfntion (textbfUniAttn) における Softmax textbfUnification を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:16:31 GMT)
Sparse Gradient Compression for Fine-Tuning Large Language Models [58.4] ダウンストリームタスクのための微調整された大型言語モデル(LLM)は、広く利用されていることと、オープンソースモデルの利用が増加しているために、ますます重要になっている。
微調整に伴う高メモリコストは、特にモデルのサイズが大きくなるにつれて大きな課題である。
これらの制約に対処するためにスパース圧縮勾配(SGC)を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:18:28 GMT)
Multi-Modal Data-Efficient 3D Scene Understanding for Autonomous Driving [58.2] 我々は、異なるLiDARスキャンからレーザービーム操作を統合するフレームワークであるLaserMix++を導入し、データ効率の学習を支援するためにLiDAR-カメラ対応を組み込んだ。
結果は、LaserMix++が完全に教師付き代替よりも優れており、5倍のアノテーションで同等の精度を実現していることを示している。
この大幅な進歩は、LiDARベースの3Dシーン理解システムにおける広範囲なラベル付きデータへの依存を減らすための半教師付きアプローチの可能性を示している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:50:28 GMT)
What should an AI assessor optimise for? [58.0] AIアセスタ(AI Assessmentor)は、他のAIシステムの指標(損失値など)を予測する、外的、理想的には不適切なシステムである。
ここでは、問題に対処する: 常にターゲットメトリックのアセスメントをトレーニングするのが最適か?
本研究では, モノトニック写像と非モノトニック写像を用いた回帰損失と分類スコアについて実験的に検討した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:41:57 GMT)
MODS: Moderating a Mixture of Document Speakers to Summarize Debatable Queries in Document Collections [57.6] Debatable QFSを紹介します。これは、反対の視点でドキュメントを介してクエリに応答する要約を作成するタスクです。
パネルディスカッションを反映したマルチLLMフレームワークMODSを設計する。
議論の的になっているWebクエリとDebateQFSによる競合QAの実験と、Debatepediaによる新たな議論クエリのデータセットであるDebateQFSでは、トピックパラグラフのカバレッジとバランスにおいて、MODSがSOTAを38~59%上回ったことが示されている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:08:14 GMT)
Weak-to-Strong Diffusion with Reflection [56.4] Weak-to-Strong Diffusion (W2SD) を提案し、理想モデルと強モデルとのギャップを近似する。
広範囲な実験により、W2SDは人間の嗜好、美的品質、即効性を改善することが示されている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:00:08 GMT)
LEAF: Unveiling Two Sides of the Same Coin in Semi-supervised Facial Expression Recognition [56.2] 半教師付き学習は、表情認識におけるラベル不足の課題に取り組むための有望なアプローチとして現れてきた。
半教師付きFERのための表現関連表現と擬似ラベルを協調する統合フレームワークであるhierarchicaL dEcoupling And Fusing (LEAF)を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:59:17 GMT)
Benchmarking and Improving Bird's Eye View Perception Robustness in Autonomous Driving [55.9] 本稿では,BEVアルゴリズムのレジリエンスを評価するためのベンチマークスイートであるRoboBEVを紹介する。
検出,マップセグメンテーション,深さ推定,占有予測といったタスクにまたがる33の最先端のBEVベースの知覚モデルを評価する。
また, 事前学習や深度自由なBEVトランスフォーメーションなどの戦略が, アウト・オブ・ディストリビューションデータに対するロバスト性を高める上で有効であることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:49:41 GMT)
DEUCE: Dual-diversity Enhancement and Uncertainty-awareness for Cold-start Active Learning [54.4] コールドスタートアクティブラーニング(CSAL)は、手動アノテーションのためのラベルなしデータセットから貴重なインスタンスを選択する。
既存のCSAL手法は、弱いクラスと強い代表例を見落とし、バイアス学習をもたらす。
本稿ではCSALのための新しい二変量拡張および不確実性認識フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:00:03 GMT)
Bridging Internal Probability and Self-Consistency for Effective and Efficient LLM Reasoning [53.3] パープレキシティや自己整合性などの手法の第一理論誤差分解解析について述べる。
パープレキシティ法は、適切な整合関数が存在しないため、かなりのモデル誤差に悩まされる。
本稿では、自己整合性とパープレキシティを統合したReasoning-Pruning Perplexity Consistency(RPC)と、低確率推論経路を排除したReasoning Pruningを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:09:49 GMT)
Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.4] がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:19:00 GMT)
Refining Alignment Framework for Diffusion Models with Intermediate-Step Preference Ranking [50.3] 拡散モデルと人間の嗜好を整合させるためのTalored Optimization Preference(TailorPO)フレームワークを提案する。
提案手法は,ステップワイド報酬に基づいて,中間雑音のサンプルを直接ランク付けし,勾配方向の問題を効果的に解決する。
実験結果から,本手法は審美的,人為的な画像生成能力を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:08:43 GMT)
Measuring the Mental Health of Content Reviewers, a Systematic Review [50.1] 多くの労働者は、長期的、潜在的に不可逆的な心理的害を報告している。
この研究は、少量の曝露の後でも、他の種類の専門家に心理的に害を与える活動と似ている。
この体系的なレビューは、他の専門職からの心理的対策を要約し、コンテンツレビュアーの経験と関連づけるものである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:50:15 GMT)
VertiFormer: A Data-Efficient Multi-Task Transformer for Off-Road Robot Mobility [49.5] VertiFormerは、たった1時間のデータでトレーニングされた、新しいデータ効率のマルチタスクトランスフォーマーモデルである。
我々の実験は、限られたデータでオフロードロボットの移動にトランスフォーマーを効果的に活用するための洞察を提供する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:21:00 GMT)
Distributional Soft Actor-Critic with Three Refinements [47.5] 強化学習(Reinforcement Learning, RL)は、複雑な意思決定と制御タスクの解決に顕著な成功を収めた。
多くのモデルなしRLアルゴリズムは、不正確な値推定による性能劣化を経験する。
本稿では,これらの制限を克服し,Q値推定精度を向上させるために,DSACv1に3つの重要な改良点を導入する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:07:08 GMT)
GraphTeam: Facilitating Large Language Model-based Graph Analysis via Multi-Agent Collaboration [46.7] GraphTeamは3つのモジュールから5つのLLMベースのエージェントで構成されており、異なる特殊性を持つエージェントは複雑な問題に対処するために協力することができる。
6つのグラフ分析ベンチマークの実験は、GraphTeamが最先端のパフォーマンスを達成し、精度の点で最高のベースラインよりも平均25.85%改善していることを示している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:36:30 GMT)
Bitcoin-Enhanced Proof-of-Stake Security: Possibilities and Impossibilities [45.9] Bitcoinは世界で最もセキュアなブロックチェーンであり、Proof-of-Workマイニングの巨大なハッシュパワーによって支えられている。
Proof-of-Stakeチェーンはエネルギー効率が良く、最終性が速いが、いくつかのセキュリティ問題に直面している。
これらのセキュリティ問題は、外部の信頼できるソースを持たないPoSチェーンに固有のものであることを示す。
我々は、この問題を解決するために、市販のPoSプロトコルチェックポイントをBitcoin上に配置する新しいプロトコル、Babylonを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:19:02 GMT)
A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation [45.4] 後腹膜には、稀な良性および悪性型を含む様々な腫瘍があり、診断と治療の課題を引き起こす。
腫瘍径の推定は不規則な形状のため困難であり,手動分割は時間を要する。
本研究は,CNN,ViT,Mamba,xLSTMなどのU-Net拡張を,新しい社内CTデータセットと公開臓器セグメンテーションデータセットに基づいて評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:25:28 GMT)
HALO: Hadamard-Assisted Lower-Precision Optimization for LLMs [45.4] 本稿では,トランスフォーマーのための新しい量子化学習手法HALOを提案する。
提案手法により, 前方・後方パスにおける行列乗算の精度が低くなることが保証される。
LLAMAファミリーモデルに適用すると、HALOは様々なタスクの微調整中にほぼ完全精度に等しい結果が得られる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:58:20 GMT)
Learning to Compress Contexts for Efficient Knowledge-based Visual Question Answering [44.5] 圧縮文脈(RACC)を用いたtextbfRetrieval-textbfAugmented MLLMを提案する。
RACCは、与えられた画像検索ペアの取得した知識を圧縮して集約することを学ぶ。
これはOK-VQAで63.92%の最先端(SOTA)性能を達成する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:40:37 GMT)
RefDrone: A Challenging Benchmark for Referring Expression Comprehension in Drone Scenes [44.3] RefDroneはドローンシーンのRECベンチマークである。
RDAgentは、RECタスクのための半自動アノテーションツールである。
NGDINOは、マルチターゲットおよびノーターゲットケースを扱うために設計された新しい手法である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 10:44:11 GMT)
OneForecast: A Universal Framework for Global and Regional Weather Forecasting [44.2] 本稿では,グラフニューラルネットワーク(GNN)に基づくグローバル地域別ネスト気象予報フレームワークを提案する。
動的システムパースペクティブとマルチグリッド理論を組み合わせることで、マルチスケールグラフ構造を構築し、ターゲット領域を密度化し、局所的な高周波特性を捉える。
高分解能な地域予測のために,境界情報損失を軽減するニューラルネットワークネストグリッド法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:49:16 GMT)
M+: Extending MemoryLLM with Scalable Long-Term Memory [43.6] メモリLLMに基づくメモリ拡張モデルであるM+を導入し、長期情報保持を大幅に強化する。
M+は長期記憶機構と協調学習した検索装置を統合し、テキスト生成中に関連情報を動的に検索する。
長いコンテキスト理解や知識保持タスクを含む様々なベンチマークでM+を評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:13:10 GMT)
Beyond the Permutation Symmetry of Transformers: The Role of Rotation for Model Fusion [43.3] 変圧器のパラメータ空間対称性の新たな形式である回転対称性を導入する。
置換対称性とは異なり、回転対称性は連続領域で作用し、変圧器の同値集合を著しく拡大する。
モデル融合を強化するためのプラグアンドプレイモジュールとして理論的に最適なマッチングアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:44:55 GMT)
Comparative study of quantum error correction strategies for the heavy-hexagonal lattice [41.9] トポロジカル量子誤差補正は、量子コンピュータのスケーリングロードマップにおけるマイルストーンである。
四角い格子面のコードは、この問題に対処するための作業場となっている。
しかし、一部のプラットフォームではゲートエラーを最小限に抑えるために接続性はさらに低く保たれている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:41:18 GMT)
Breaking Information Cocoons: A Hyperbolic Graph-LLM Framework for Exploration and Exploitation in Recommender Systems [41.4] HERecはハイパーボリックグラフ-LLMフレームワークで、レコメンダシステムの探索とエクスプロイトを効果的にバランスさせる。
本フレームワークでは,(1)ハイパーボリック空間におけるテキスト記述とユーザ-イテム協調情報とを協調的に整合する階層型グラフ-LLM機構,(2)ユーザ-調整可能な探索-探索トレードオフを実現する階層型表現構造を導入している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:05:17 GMT)
Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead [41.3] 低ランク適応 (LoRA) を持つ細調整の大型言語モデルは一般的な慣行となり、LoRA更新でのみ同じLLMのコピーを多数生成する。
このパラダイムは、異なるLoRAを含むクエリに対するリアルタイム応答を提供するシステムの課題を示す。
本稿では,LoRA固有のスケーリング行列と組み合わせた共有ベースにLoRAを共同圧縮する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:56:34 GMT)
Identifying Sub-networks in Neural Networks via Functionally Similar Representations [41.0] 我々は、異なるサブネットワークの存在を調査し、ネットワークの理解を自動化するための一歩を踏み出した。
具体的には、ニューラルネットワーク内の機能的に類似した表現の概念に基づく、新しい自動化されたタスク非依存のアプローチについて検討する。
提案手法は,人間と計算コストを最小限に抑えたニューラルネットワークの動作に関する有意義な洞察を提供する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:45:33 GMT)
DUET: Optimizing Training Data Mixtures via Feedback from Unseen Evaluation Tasks [40.9] 本稿では,ベイズ最適化を用いたデータ選択手法を組み込むことで,フィードバックループを活用できるDUETという,グローバル・ローカルなアルゴリズムを提案する。
その結果、DUETは、データドメインのプールから混合したトレーニングデータを効率よく洗練し、目に見えない評価タスクにおけるモデルの性能を最大化することができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:52:32 GMT)
GEB+: A Benchmark for Generic Event Boundary Captioning, Grounding and Retrieval [40.4] Kinetic-GEB+と呼ばれる新しいデータセットを導入する。
データセットは、12Kビデオのステータス変更を記述するキャプションに関連する170万以上のバウンダリで構成されている。
現状の変化を通じて,よりきめ細かな,堅牢で,人間的な映像理解を支援する3つのタスクを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:16:51 GMT)
Latent Action Learning Requires Supervision in the Presence of Distractors [40.3] 実世界のビデオには、潜在的なアクション学習を妨げるアクション関連障害が含まれていることが示されています。
LAOMは,潜伏動作の質を8倍に向上する簡易なLAPO修正法である。
我々は、潜在アクション学習中のデータセット全体の2.5%にも満たない、地道的なアクションによる監視を提供することで、下流のパフォーマンスが平均4.2倍向上することを示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:35:51 GMT)
UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models [39.9] 物理推論における大規模言語モデル(LLM)を評価するためのベンチマークであるUGPhysicsを紹介する。
UGPhysicsには、英語と中国語の両方で5,520人の学部レベルの物理学問題が含まれており、7つの異なる回答タイプと4つの異なる物理推論スキルを持つ13の被験者をカバーしている。
また,物理問題の解答正当性を評価するために,MARJ(Model-Assistant Rule-based Judgment)パイプラインを開発した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:42:02 GMT)
Estimating LLM Uncertainty with Logits [39.1] 我々は,大規模言語モデルにおけるトークン固有の不確かさをリアルタイムで推定するために設計された新しいフレームワークであるLogU(Logits-Token Uncertainty)を紹介する。
実験の結果,LogUの有効性と妥当性が明らかとなり,モデル幻覚の課題に対処する上で大きな進展がみられた。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:18:02 GMT)
Do Audio-Visual Segmentation Models Truly Segment Sounding Objects? [39.0] AVSBench-Robustは、サイレント、環境騒音、オフスクリーン音を含む様々なネガティブなオーディオシナリオを取り入れたベンチマークである。
提案手法は, ほぼ完全な偽陽性率を維持しながら, 標準測定値とロバストネス測定値の両方において顕著な改善を実現している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:40:29 GMT)
When End-to-End is Overkill: Rethinking Cascaded Speech-to-Text Translation [38.9] ASR と自己教師型音声特徴量からの複数の候補を機械翻訳に組み込むことの利点について検討する。
解析の結果,カスケードエラーの主な原因は,テキスト領域にマッピングした場合の音声領域における類似したサンプル間のばらつきの増加にあることが明らかとなった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:29:21 GMT)
A Unit-based System and Dataset for Expressive Direct Speech-to-Speech Translation [38.9] 本研究は,様々な映画の音声トラックから,新しい,注意深くキュレートされた多言語データセットについて紹介する。
各データセットペアは、パラ言語情報と持続時間に正確にマッチする。
我々は、複数の韻律伝達技術を統合することでこれを強化し、正確で自然な響きがあり、パラ言語的詳細に富む翻訳を目指しています。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:24:32 GMT)
DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning [38.7] DINO-WM (DINO-WM) は視覚世界を再構築することなく視覚力学をモデル化する新しい手法である。
我々は,DINO-WMが6つの環境でテスト時にゼロショット動作解を実現することを実証した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:40:49 GMT)
CoddLLM: Empowering Large Language Models for Data Analytics [38.2] 大規模言語モデル(LLM)は、データ分析に革命をもたらす可能性がある。
我々は、Turbo後合成のための新しいデータレシピを公開した。
我々はMistralNeMo-12Bに基づく新しい基礎モデルであるCoddLLMをポストトレーニングする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:03:55 GMT)
Who's the MVP? A Game-Theoretic Evaluation Benchmark for Modular Attribution in LLM Agents [37.7] CapaBenchは、協調ゲーム理論のShapley Valueに基づく評価フレームワークである。
エージェントのアーキテクチャ内の個々のモジュールとその相互作用の限界影響を測定する。
CapabilityBenchは、コンポーネントレベルの評価と全体的システムアセスメントのギャップを埋める。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:07:34 GMT)
Assessing LLMs for Zero-shot Abstractive Summarization Through the Lens of Relevance Paraphrasing [37.4] 大言語モデル(LLM)は、与えられた記事に対する抽象的な要約のゼロショット生成において最先端のパフォーマンスを達成した。
本稿では,LLMのロバスト性を測定するためのシンプルな戦略であるrelevance paraphrasingを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:40:51 GMT)
Bias of Stochastic Gradient Descent or the Architecture: Disentangling the Effects of Overparameterization of Neural Networks [37.0] 本稿では,学習ミスをゼロにするランダムネットワークとSGD最適化ネットワークを研究することによって,一般化に影響を与える要因を解消することを目的とする。
実験により, 低試料状態下では, 幅の増大によるパラメータ化が一般化に有用であることが確認された。
深度を増大させるため、パラメータ化は一般化には有害であるが、ランダムおよびSGD最適化ネットワークも同様に振る舞うので、これはアーキテクチャ上のバイアスに起因する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:05:46 GMT)
QSpec: Speculative Decoding with Complementary Quantization Schemes [37.0] 量子化は、推論を加速し、大きな言語モデルのメモリ消費を減らすために、実質的に採用されている。
本稿では、投機的復号化のための2つの相補的量子化スキームをシームレスに統合するQSPECと呼ばれる新しい量子化パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:24:16 GMT)
Josephson microwave photon detector operating at 0.7 K [36.1] 100 nA以下の臨界電流を持つアル・ジョセフソン接合に基づくしきい値検出器は、マイクロ波光子検出に利用できる。
5GHzで2光子エネルギーと1光子エネルギーをそれぞれ90%と15%の効率で検出し,それぞれ0.1秒と0.01秒の暗カウント時間を示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:30:29 GMT)
ProxSparse: Regularized Learning of Semi-Structured Sparsity Masks for Pretrained LLMs [35.9] ProxSparseは,正規化最適化によりマスク選択が可能な学習ベースのフレームワークである。
ProxSparseは従来提案していた半構造化マスク選択法より一貫して優れていた。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:35:23 GMT)
Speculative Ensemble: Fast Large Language Model Ensemble via Speculation [35.5] Speculative Ensembleは、パフォーマンスを犠牲にすることなく、大規模言語モデルのアンサンブルを加速する新しいフレームワークである。
提案手法は,(1)検証分布は提案モデルと対象モデルのアンサンブル分布であり,(2)提案者と検証者との交互化により効率が向上する,という2つの重要な知見に基づいている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:22:11 GMT)
RPGBENCH: Evaluating Large Language Models as Role-Playing Game Engines [34.0] 本稿では,大言語モデル (LLM) をテキストベースのロールプレイングゲーム (RPG) エンジンとして評価するための最初のベンチマークであるRPGBenchを紹介する。
RPGBenchは、ゲーム作成(GC)とゲームシミュレーション(GS)の2つのコアタスクから構成される。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:40:24 GMT)
Regularized Langevin Dynamics for Combinatorial Optimization [33.9] 正規化ランゲヴィンダイナミクス(RLD)は、サンプリングされた溶液と現在の溶液の間に期待される距離を強制する。
シミュレーションアニーリング(SA)とニューラルネットワーク(NN)に基づく2つのCOソルバを開発した。
特に,我々のSAアルゴリズムは,従来のSOTA SA法の動作時間を最大80%削減すると同時に,同等あるいは優れた性能を実現している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:24:31 GMT)
Understanding Multimodal LLMs Under Distribution Shifts: An Information-Theoretic Approach [33.5] マルチモーダルな大言語モデル(MLLM)は期待できる能力を示しているが、分散シフトの下では苦労している。
MLLMの安全性と信頼性を確保するためには,MLLMのリスクを特徴づけ定量化できる形式的枠組みの確立が必要であると論じる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:06:56 GMT)
50 Shades of Deceptive Patterns: A Unified Taxonomy, Multimodal Detection, and Security Implications [33.3] 認知パターン (DP) は意図しない決定にユーザを操作するために意図的に設計されたユーザインタフェースである。
セキュリティとプライバシの観点から、偽造パターンの分類を拡大し、カテゴリとスコープを洗練しました。
我々は,商用マルチモーダル・大規模言語モデル(MLLM)を利用した,認識パターン検出のための新しい自動ツールDPGuardを開発した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:57:55 GMT)
GLINT-RU: Gated Lightweight Intelligent Recurrent Units for Sequential Recommender Systems [32.9] 本稿では,軽量かつ効率的なトランスフォーマーベースシーケンシャルレコメンデータシステムであるGLINT-RUを紹介する。
厳密な選択ゲートを組み込むことで、GLINT-RUは時間依存と微粒な位置情報を適応的にキャプチャし、高品質な潜伏表現を生成する。
3つのデータセットに対する大規模な実験により、GLINT-RUはより優れた予測精度と推論速度を達成することが示された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:23:41 GMT)
Free-Rider and Conflict Aware Collaboration Formation for Cross-Silo Federated Learning [32.4] Federated Learning(FL)は、複数のFL参加者がプライベートデータを共有せずにトレーニングモデル上でコラボレーションできる機械学習パラダイムである。
我々は、FL-PTがFLエコシステムの恩恵を受ける場合に限り、FL-PTがFLの恩恵を受けることを確実にする最適なFLコラボレーション形成戦略であるFedEgoistsを提案する。
FL-PT連立が最適であることは理論的に証明する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:27:20 GMT)
Toward generalizable learning of all (linear) first-order methods via memory augmented Transformers [32.3] メモリ拡張トランスフォーマーは線形一階法(LFOM)のクラス全体を実装可能であることを示す。
メモリ拡張トランスフォーマーがより高度なアルゴリズムを学習できるという理論的および実証的な証拠を提供する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:02:36 GMT)
Entropy-based measure of rock sample heterogeneity derived from micro-CT images [31.9] 提案手法は,マイクロCT画像を直接処理し,テキストの不均一性を同定する。
ブラジルの貯水池から採取した円筒形プラグ試料の4,935枚の画像からなるデータセットに適用した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:12:40 GMT)
Compilation and Fast Model Counting beyond CNF [31.6] 本稿では,関数のクラスを効率的にd-DNNFに変換するか,あるいはコンパイルするかに関する理論的知識を強化する。
問題の制約は、すべての変数順序付けに対して、定数幅順序付きバイナリ決定図(OBDD)で表現可能なすべての関数である。
制約のサブファミリーに適用し,コンパイルを必要としないモデルカウントのためのより効率的なFPTアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:00:04 GMT)
Fast Solvers for Discrete Diffusion Models: Theory and Applications of High-Order Algorithms [31.4] 現在の推論アプローチは主に、正確なシミュレーションと$tau$-leapingのような近似メソッドの2つのカテゴリに分類される。
本研究では,高次数値推論スキームの最初の拡張を離散拡散モデルに合わせることで,後者のカテゴリを推し進める。
提案手法を厳密に解析し,KL分散における$theta$-trapezoidal法の2次精度を確立する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:25:21 GMT)
Shape from Semantics: 3D Shape Generation from Multi-View Semantics [31.0] セマンティックスの形状」は、異なる視点から観察すると、幾何学と外観が意味論的に一致する3Dモデルを作成することができる。
我々のフレームワークは、複雑な詳細、よく構造化された幾何学、コヒーレントなテクスチャ、スムーズな遷移を持つメッシュを生成する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:51:59 GMT)
From Data Deluge to Data Curation: A Filtering-WoRA Paradigm for Efficient Text-based Person Search [30.9] テキストベースの人物検索では、プライバシ保護と手動アノテーションの困難なタスクに対する懸念に対処するため、データ生成が主流となっている。
構築されたデータセット内のデータのサブセットのみが決定的な役割を果たすことを観察する。
我々は、この重要なデータサブセットを識別するためのフィルタリングアルゴリズムと、光微細チューニングのためのWoRA学習戦略を含む新しいフィルタリング-WoRAパラダイムを導入する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:56:33 GMT)
Physics-Inspired Distributed Radio Map Estimation [28.9] 本研究では,陸地情報がない場合に,物理に着想を得た分散ラジオマップ推定(RME)ソリューションを提案する。
グローバルオートエンコーダモジュールはクライアント間で共有され、無線伝搬パターンに対する共通のパスロスの影響を捉え、クライアント固有のオートエンコーダモジュールはローカルシャドーイング効果によって生成される個々の特徴の学習に重点を置いている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:58:17 GMT)
AdvisorQA: Towards Helpful and Harmless Advice-seeking Question Answering with Collective Intelligence [28.7] よりパーソナライズされた関心事に対するアドバイスを提供する上で,LSMの能力を評価するために開発された最初のベンチマークであるAdvancedQAを紹介する。
私たちは、日常生活の質問、多様な応答、そして私たちの役に立つ度合いをトレーニングするための過半数の投票ランキングを含むベンチマークを完了しました。
ベースライン実験は, 有用度測定, GPT-4, 人的評価により, AdvisorQAの有効性を検証した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:22:04 GMT)
Embodied Intelligence for 3D Understanding: A Survey on 3D Scene Question Answering [28.7] 3D Scene Question Answeringは、3D視覚認識と自然言語処理を統合した学際的なタスクである。
大規模マルチモーダルモデリングの最近の進歩は、多様なデータセットの作成を促し、3D SQAのための命令チューニングとゼロショット手法の開発を加速させた。
本稿では,3D SQAを総合的に調査し,データセット,方法論,評価指標を体系的に検討する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:01:33 GMT)
Exploring Linear Attention Alternative for Single Image Super-Resolution [28.3] ディープラーニングベースのシングルイメージ超解像(SISR)技術は、低解像度(LR)画像を高解像度(HR)画像に拡張することに焦点を当てている。
本稿では,Receptance Weighted Key Value (RWKV) アーキテクチャと特徴抽出技術を組み合わせた新しい手法を提案する。
MambaIRモデルと比較すると,PSNRでは0.26%,SSIMでは0.16%の平均的な改善が得られた。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:39:02 GMT)
Subsampled Ensemble Can Improve Generalization Tail Exponentially [27.9] アンサンブル学習は、機械学習モデルの精度を改善するための一般的なテクニックである。
本稿では,アンサンブルの新たな視点について述べる。
我々は,アンサンブル手法がサンプル外性能を大幅に改善できることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:19:21 GMT)
A Comprehensive Survey on Inverse Constrained Reinforcement Learning: Definitions, Progress and Challenges [27.7] 逆制約強化学習(英: Inverse Constrained Reinforcement Learning、ICRL)とは、実験データに基づいて専門家が従う暗黙の制約を推測するタスクである。
本論では, ICRLの最近の進歩について分類学的に考察する。
ICRLの定義、進歩、重要な課題を理解しようとする初心者だけでなく、機械学習の研究者や実践者にとっても包括的な参照として機能する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:57:57 GMT)
MIM: Multi-modal Content Interest Modeling Paradigm for User Behavior Modeling [27.3] マルチモーダルコンテンツ興味モデリングパラダイム(MIM)を提案する。
MIMは3つの主要なステージで構成されている。
CTRでは+14.14%、RPMでは+4.12%の大幅な増加を達成した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:06:21 GMT)
K Nearest Neighbor-Guided Trajectory Similarity Learning [27.2] トレイ類似性は、多くの時間的データマイニングアプリケーションの基本である。
サブビュー類似性モデリング機構を備えた高効率トラジェクトリモデルであるTSMiniを提案する。
軌道類似度を学習する場合,TSMiniは平均22%の精度で最先端モデルより優れていることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:52:43 GMT)
TurboHopp: Accelerated Molecule Scaffold Hopping with Consistency Models [27.0] ターボホップ(TurboHopp)は、ポケットコンディショニングされた3D足場ホッピングモデルである。
既存の拡散ベースモデルに比べて最大30倍高速な推論速度と生成品質を実現している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:43:28 GMT)
PolarQuant: Leveraging Polar Transformation for Efficient Key Cache Quantization and Decoding Acceleration [27.0] KVキャッシュを低ビット幅に量子化することは、計算コストを削減する効果的な方法である。
従来の手法では、外れ値による鍵ベクトルの定量化に苦労し、過剰なオーバーヘッドが発生する。
そこで我々はPolarQuantと呼ばれる新しい量子化手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:59:03 GMT)
Scalable Thompson Sampling via Ensemble++ Agent [26.5] 本稿では,共有要素のアンサンブル更新アーキテクチャとランダムな線形結合方式により,制限をサイドステップするスケーラブルなエージェントであるEnsemble++を提案する。
線形バンドレットでは、Ensemble++エージェントは、正確なトンプソンサンプリングに匹敵する後悔の保証を達成するために、$Theta(d log T)$のアンサンブルサイズしか必要としない。
我々は、グラデーションベースの更新を通じて同じ目的を保ちながら、固定された特徴を学習可能な表現に置き換える神経拡張を導入する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:04:46 GMT)
Hidden in the Noise: Two-Stage Robust Watermarking for Images [25.7] 拡散モデルの初期雑音に基づく画像の歪みのない透かし手法を提案する。
透かしを検出するには、画像のために再構成された初期ノイズと、以前に使用した初期ノイズとを比較する必要がある。
本稿では,効率的な検出を行うための2段階の透かしフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:56:15 GMT)
MIND: Microstructure INverse Design with Generative Hybrid Neural Representation [25.6] マイクロマテリアルの逆設計は、特定の標的となる物理的特性を持つメタマテリアルを最適化する上で重要な役割を担っている。
本稿では,幾何学的特性と物理的特性を同時に符号化した,高度なハイブリッドニューラル表現であるHoloplaneと潜時拡散を統合した新しい生成モデルを提案する。
提案手法は,複数クラスにまたがって一般化され,多種多様なタイル状構造の生成が可能となり,特性精度が大幅に向上し,幾何的妥当性の制御が強化された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:25:47 GMT)
Integrating Frequency Guidance into Multi-source Domain Generalization for Bearing Fault Diagnosis [24.9] 本稿では,FARNetというFourierベースのAugmentation Restruction Networkを提案する。
本発明のネットワークは、振幅スペクトルサブネットワークと位相スペクトルサブネットワークとから構成され、ソースドメインとターゲットドメインとの相違を順次低減する。
モデル出力の決定境界を従来の三重項損失と比較して洗練するために,一般化に寄与する多様体三重項損失を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:23:03 GMT)
FinchGPT: a Transformer based language model for birdsong analysis [24.3] トークン間の長距離依存関係は、人間の言語の定義指標である。
本研究では,ベンガル・フィンチ(Ronchura striata domestica)の歌の分析にTransformerアーキテクチャを用いた。
鳥の音のテキスト化コーパスで学習したトランスフォーマーベースモデルであるFinchGPTを開発した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:06:34 GMT)
Addressing Delayed Feedback in Conversion Rate Prediction via Influence Functions [24.0] 遅延フィードバックモデリング(IF-DFM)のための影響関数を用いたフレームワークを提案する。
IF-DFMは、新たに取得した変換データと遅延した変換データがモデルパラメータに与える影響を推定するために影響関数を利用する。
ベンチマークデータセットの実験では、IF-DFMが最先端の手法を一貫して超越していることが示されている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:23:13 GMT)
Stein's Lemma for the Reparameterization Trick with Exponential Family Mixtures [23.9] スタインの補題はスタインの方法において重要な役割を果たす。
我々はスタインの補題を指数列混合分布に拡張する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:58:31 GMT)
Learning from Suboptimal Data in Continuous Control via Auto-Regressive Soft Q-Network [23.5] 本稿では,粗大かつ自己回帰的な方法でQ値をモデル化する値ベースRLアルゴリズムであるARSQを提案する。
ARSQは、連続的な作用空間を粗い階層の離散空間に分解し、きめ細かい連続制御タスクのサンプル効率を高める。
決定ステップごとに次元的行動の利点を自動回帰予測し、継続的な制御タスクにおいてより効果的な意思決定を可能にする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:04:53 GMT)
Unsupervised Multimodal 3D Medical Image Registration with Multilevel Correlation Balanced Optimization [22.6] マルチレベル相関バランス最適化に基づく教師なしマルチモーダル医用画像登録手法を提案する。
異なるモードの術前医療画像に対して、変形場間の最大融合により有効な情報のアライメントと積み重ねを実現する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:15:01 GMT)
NAVER: A Neuro-Symbolic Compositional Automaton for Visual Grounding with Explicit Logic Reasoning [22.6] 本稿では,人間の認知のような推論を必要とする手法の課題について考察する。
本研究では,明示的な確率論的論理推論を統合する構成的視覚的接地手法であるNAVERを提案する。
その結果、NAVERは最近のエンドツーエンドや構成ベースラインと比較して SoTA の性能が向上していることがわかった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:19:08 GMT)
LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness [22.4] 3次元シーン理解のための3次元認識型LMMの開発は、大規模3次元視覚言語データセットと強力な3次元エンコーダの欠如によって妨げられている。
LLaVA-3Dというシンプルなフレームワークを導入し,LLaVAを3次元シーン理解に効果的に適用する。
LLaVA-3Dは、3Dビジョン言語データセットでトレーニングされた場合、既存の3D LMMよりも3.5倍高速に収束する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:01:50 GMT)
Detecting Ambiguities to Guide Query Rewrite for Robust Conversations in Enterprise AI Assistants [22.2] NLU-NLGフレームワークを提案する。
我々は,実際のユーザの会話ログに基づいて分類法を開発し,そこから洞察を得てルールを設計し,分類器の特徴を抽出する。
これは現実世界のアプリケーション、すなわちAdobe Experience Platform AI Assistantにデプロイされている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:23:21 GMT)
SSRepL-ADHD: Adaptive Complex Representation Learning Framework for ADHD Detection from Visual Attention Tasks [21.6] Self Supervised Representation Learning (SSRepL)は、注意欠陥高活動障害(ADHD)データの有意義で堅牢な表現を捉えることができる。
本稿では,ADHDの症状のある子どもを検知する新しいSSRepL and Transfer Learning(TL)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:28:55 GMT)
FM2DS: Few-Shot Multimodal Multihop Data Synthesis with Knowledge Distillation for Question Answering [21.5] マルチモーダルなマルチホップ質問応答のためのトレーニングモデルを実現するための,高品質なデータセットを作成するための新しい手法を提案する。
提案手法は,ウィキペディアから関連するマルチモーダル文書を取得し,高レベルの質問や回答を合成的に生成し,厳格な基準で検証し,品質データを保証する5段階のパイプラインから構成される。
その結果、サンプルサイズが同じであれば、合成データに基づいてトレーニングされたモデルは、平均して1.9の正確なマッチング(EM)でトレーニングされたデータよりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 10:26:39 GMT)
xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing [21.4] ドメイン間政策伝達手法は主に、ポリシー学習を容易にするために、ドメインの対応や修正を学習することを目的としている。
本稿では,クロスドメイントラジェクトリ適応のために特別に設計された拡散モデルを用いたクロスドメイントラジェクトリ・EDitingフレームワークを提案する。
提案するモデルアーキテクチャは,対象データ内の動的パターンだけでなく,状態,行動,報酬間の複雑な依存関係を効果的にキャプチャする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:49:25 GMT)
Masked Generative Nested Transformers with Decode Time Scaling [21.3] 本研究では,視覚生成アルゴリズムにおける推論計算効率のボトルネックに対処することを目的とする。
我々は、計算を効果的に活用するためにデコード時間モデルのスケーリングスケジュールを設計し、計算の一部をキャッシュして再利用することができる。
実験の結果,ベースラインよりも3倍近い計算量で,競争性能が得られることがわかった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:41:01 GMT)
High dimensional analysis reveals conservative sharpening and a stochastic edge of stability [21.1] トレーニング損失Hessianの大きな固有値のダイナミクスは,モデル間およびバッチ全体において極めて堅牢な特徴を持っていることを示す。
しばしば、大きな固有値が増加するプログレッシブ・シャープニングの初期段階があり、続いて安定性の端として知られる予測可能な値での安定化が続く。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:30:40 GMT)
Langevin Unlearning: A New Perspective of Noisy Gradient Descent for Machine Unlearning [20.5] プライバシは、スクラッチから再トレーニングするための統計的不明瞭さとして定義される。
勾配勾配に基づくアンラーニングフレームワークであるランゲヴィン・アンラーニングを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:21:11 GMT)
Certified Machine Unlearning via Noisy Stochastic Gradient Descent [20.5] 機械学習は、訓練されたモデルに対する特定のデータポイントの効果を効率的に除去することを目的としている。
本研究では,雑音勾配勾配を非学習に活用し,その最初の近似的非学習保証を確立することを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:27:30 GMT)
Efficient Adaptive Experimental Design for Average Treatment Effect Estimation [20.4] 適応実験を用いて平均治療効果(ATE)を効率的に推定する方法を検討する。
適応実験において、実験者は過去のデータに基づいて治療確率を更新しながら、順次実験単位に治療を割り当てる。
提案した設計の任意のラウンドで有効である非パラメトリックおよび非漸近信頼区間を開発する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:04:58 GMT)
Interactive Learning of Physical Object Properties Through Robot Manipulation and Database of Object Measurements [20.3] このフレームワークは、テーブル上のオブジェクトに関する学習を最大化する探索的なアクション選択を含む。
ロボットパイプラインは、ロギングモジュールとオブジェクトのオンラインデータベースと統合されており、グリッパーが異なる63のオブジェクトの24,000以上の計測結果を含んでいる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:38:33 GMT)
A Survey on LLM-as-a-Judge [20.2] 大規模言語モデル(LLM)は、様々な領域で大きな成功を収めています。
LLMは、従来の専門家主導の評価に代わる魅力的な代替手段である。
LLM-as-a-Judgeシステムはどうやって構築できるのか?
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:55:51 GMT)
Tracing Representation Progression: Analyzing and Enhancing Layer-Wise Similarity [20.2] 本研究では,各変圧器の隠蔽層間の表現の類似性について検討する。
層間の表現が正の相関を示し、層が近づくと類似度が増加する。
浅い層の有効性を向上させるためのアライメント・トレーニング手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:29:19 GMT)
Deanonymizing Ethereum Validators: The P2P Network Has a Privacy Issue [19.4] 多くのブロックチェーンネットワークは、ピアツーピア(P2P)ネットワークにおけるバリデーターの匿名性を維持することを目的としている。
この研究は、P2Pネットワークがこの匿名性を提供していないことを示している。
本稿では,ネットワーク内の任意のノードに対して,接続されたピアにホストされたバリデータを特定する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:50:40 GMT)
Value Function Decomposition in Markov Recommendation Process [19.1] 本稿では,レコメンダ性能を向上させるためのオンライン強化学習フレームワークを提案する。
これらの2つの因子は、元の時間差損失を分解することで、別々に近似できることを示す。
アンタングル学習フレームワークは、より高速な学習と、アクション探索に対する堅牢性の向上により、より正確な推定を実現することができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:15:50 GMT)
From Few to Many: Self-Improving Many-Shot Reasoners Through Iterative Optimization and Generation [19.0] マルチショット・イン・コンテキスト・ラーニング(ICL)はパフォーマンス上のメリットをもたらす可能性があるが、どのような側面が利点を支配しているのか、さらに多くの例にスケールアップすることがICLを改善する最も効果的な方法なのかは不明だ。
本稿では,この最適化ステップとベイズ最適化とを交互に交互に交互に組み合わせて実例集合を探索するBRIDGEと,この集合を再利用して実例の推論経路をマルチショット方式に自動的に拡張する生成ステップを提案する。
Gemini, Claude および Mistral LLM の異なるサイズでは、BRIDGE は様々なタスクにまたがって大幅に改善されている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:23:24 GMT)
Sub-Sequential Physics-Informed Learning with State Space Model [18.6] PINNMambaは、サブシーケンスモデリングをSSMで導入する新しいフレームワークである。
PINNMambaは最先端アーキテクチャと比較してエラーを最大86.3%削減できることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:55:01 GMT)
Graph Classification Gaussian Processes via Hodgelet Spectral Features [18.4] 本稿では,グラフの分類のためのプロセスベース分類アルゴリズムを提案する。
私たちはHodge分解を利用して、頂点とエッジの複雑なリッチさをよりよく捉えます。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:59:13 GMT)
Network-informed Prompt Engineering against Organized Astroturf Campaigns under Extreme Class Imbalance [18.2] 本稿では,Twitter上でのアストロトゥルフキャンペーンを識別するための新しいフレームワークを提案する。
提案されたフレームワークは、言語モデルのトレーニングや微調整を一切必要としない。
我々のフレームワークは、精度、リコール、F1スコアの点で2x-3倍の改善を実現している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:49:49 GMT)
Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation [18.1] 本稿では,RAGデータストア内の文書を対象としたメンバシップ推論手法であるInterrogation Attack (IA)を提案する。
ステルス性を維持しながら、たった30クエリで推論に成功したことを実証します。
我々は,様々なRAG構成に対する事前推論攻撃に対して,TPR@1%FPRの2倍の改善が観察された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:01:18 GMT)
Efficient Over-parameterized Matrix Sensing from Noisy Measurements via Alternating Preconditioned Gradient Descent [17.7] 行列センシング問題の収束を早めるためのプレコンディショニング手法が提案されている。
本稿では,2因子パラメータを交互に更新するAPGDアルゴリズムを提案する。
理論的には、任意の乱数から始まる線形速度で APGD が準最適収束を達成することを証明している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:44:39 GMT)
The Benefits of Being Categorical Distributional: Uncertainty-aware Regularized Exploration in Reinforcement Learning [17.6] 分布RLの潜在的優位性は、導出分布整合エントロピー正則化に起因すると考えられる。
本研究は,RLにおける分布学習の導入による本質的なメリットを説明するために,本研究から新たな視点を提供する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:25:45 GMT)
SigWavNet: Learning Multiresolution Signal Wavelet Network for Speech Emotion Recognition [17.6] 音声感情認識(SER)は、音声信号の解読から感情状態において重要な役割を果たす。
本稿では,SERのための新しいエンド・ツー・エンド(E2E)深層学習フレームワークを提案する。
ウェーブレットの能力を利用して、時間領域と周波数領域の両方で効果的なローカライズを行う。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:18:06 GMT)
Learning to Fuse Temporal Proximity Networks: A Case Study in Chimpanzee Social Interactions [17.1] 我々はネットワーク表現を使い、チンパンジー間の社会的相互作用のためのデータを組み合わせる作業に繋がる。
これらの近接型重みを原理的に最適化し、時間の経過とともに構造的整合性に報いる革新的な損失関数を用いる。
チンパンジーのデータセットにアプローチを適用することで、動物ソーシャルネットワークの時系列における傾きを検出する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:51:22 GMT)
Group Distributionally Robust Dataset Distillation with Risk Minimization [17.1] 本稿では,クラスタリングとリスク尺度の最小化を組み合わせ,DDを遂行する損失を最小化するアルゴリズムを提案する。
我々は、我々のアプローチに理論的根拠を与え、その効果的な一般化と部分群間のロバスト性を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:20:54 GMT)
Enhancing Token Filtering Efficiency in Large Language Model Training with Collider [16.9] Colliderは、大規模言語モデル(LLM)トレーニングにおけるトークンフィルタリングの全効率を解放するシステムである。
Colliderのコアとなるのは、すべての層にわたる不連続トークンのアクティベーションをフィルタして、疎性を維持することだ。
疎いGEMMを高密度GEMMに変換して効率を最適化する自動ワークフローを特徴とする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:57:01 GMT)
Scaling Flaws of Verifier-Guided Search in Mathematical Reasoning [16.8] 大規模言語モデル(LLM)は、推論時間スケーリングがパフォーマンス改善のための有望な戦略として現れている、多段階推論に苦しむ。
検証者誘導探索は、有効な推論経路を選択して優先順位付けすることにより、サンプリングサイズが制限されたときに繰り返しサンプリングより優れる。
サンプルサイズが大きくなるにつれて、検証者誘導探索は利点を減らし、最終的には繰り返しサンプリングを過小評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:08:49 GMT)
Enhance Learning Efficiency of Oblique Decision Tree via Feature Concatenation [16.8] 特徴連結を用いた拡張ODT法(textttFC-ODT)を提案する。
textttFC-ODTは、決定経路に沿って投影を送信するためのモデル内の特徴変換を可能にする。
実験により、textttFC-ODTは、木深が制限された他の最先端の決定木よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:49:18 GMT)
Milmer: a Framework for Multiple Instance Learning based Multimodal Emotion Recognition [16.6] 本研究は,表情解析と脳波信号の統合による感情認識の課題に対処する。
提案するフレームワークは、視覚的および生理的モダリティを効果的に統合するために、トランスフォーマーベースの融合アプローチを採用している。
この研究の重要な革新は、複数の表情画像から意味のある情報を抽出する多重インスタンス学習(MIL)アプローチの採用である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:32:57 GMT)
$k$-SVD with Gradient Descent [16.6] ステップサイズ選択のための単純で普遍的な規則を持つ勾配発振器は、即興で$k$-SVD を求める。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:00:28 GMT)
The Composite Task Challenge for Cooperative Multi-Agent Reinforcement Learning [16.4] 協力を促進するための労働部門(DOL)は、現実世界の応用において広く認識されている。
多くの協調型マルチエージェント強化学習(MARL)手法は、エージェント間の協調を改善するためにDOLの概念を取り入れている。
実世界のシナリオにおけるMARL法の汎用性と適用性を高めるためには,マルチエージェントDOLと協調を必要とするタスクを開発する必要がある。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:07:08 GMT)
Contrastive Private Data Synthesis via Weighted Multi-PLM Fusion [16.3] データ合成のための事前訓練されたモデルに依存する既存の方法は、しばしばデータ不足のシナリオで苦労する。
我々は、重み付き多重事前学習言語モデル(PLM)フレームワークによる新しいコントラサシブプライベートデータ合成を提案し、WASPと命名した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:54:25 GMT)
360Brew: A Decoder-only Foundation Model for Personalized Ranking and Recommendation [16.1] 我々は、LinkedInのデータとタスクに基づいてトレーニングされ、微調整された150Bパラメータ、デコーダのみのモデルである、研究前のモデルである360Brew V1.0を紹介します。
このモデルは、LinkedInプラットフォームのさまざまなセグメントで30以上の予測タスクを解決し、現在のプロダクションシステムと同等以上のパフォーマンスレベルを達成することができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:44:05 GMT)
What Are Step-Level Reward Models Rewarding? Counterintuitive Findings from MCTS-Boosted Mathematical Reasoning [15.7] ステップレベルの報酬モデル(SRM)は、強化学習に基づくプロセスの監督やステップレベルの優先順位調整を通じて、数学的推論性能を著しく向上させることができる。
近年,モンテカルロ木探索(MCTS)をステップレベルの自動選好アノテーションとして用いたAlphaZeroのような手法が特に有効であることが証明されている。
本研究は,コヒーレンスの直感的側面,特にMCTSに基づくアプローチに着目したものである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:17:28 GMT)
A Hardware-Efficient Photonic Tensor Core: Accelerating Deep Neural Networks with Structured Compression [15.7] AIとディープニューラルネットワーク(DNN)は多くの分野に革命をもたらし、大規模なデータセットから複雑な特徴を抽出することで複雑なタスクを可能にした。
光コンピューティングは、並列性、高い計算速度、低消費電力という固有の利点のために、有望な代替手段を提供する。
構造圧縮型光ニューラルネットワーク(StrC-ONN)アーキテクチャのためのブロック循環型フォトニックテンソルコア(CirPTC)を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:03:45 GMT)
Patch Synthesis for Property Repair of Deep Neural Networks [15.6] 我々は、ディープニューラルネットワーク(DNN)のプロパティレベル修復のためのパッチベースの新しいアプローチであるPatchProを紹介する。
PatchProは、ネットワークの本来の性能を維持しながら、ロバストネス地区内のすべてのサンプルに特別な修復を提供する。
本手法は, 正当性検証とパッチモジュール割当機構を組み込んで, 敵攻撃に対する防御を可能にする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:49:12 GMT)
TESTEVAL: Benchmarking Large Language Models for Test Case Generation [15.3] 大規模言語モデル(LLM)を用いたテストケース生成のための新しいベンチマークであるTESTEVALを提案する。
オンラインプログラミングプラットフォームLeetCodeから210のPythonプログラムを収集し、全体的なカバレッジ、ターゲットライン/ブランチカバレッジ、ターゲットパスカバレッジという3つの異なるタスクを設計します。
特定のプログラム行/ブランチ/パスをカバーするテストケースを生成することは、現在のLLMでは依然として困難である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:28:28 GMT)
Zero-Shot Video Restoration and Enhancement Using Pre-Trained Image Diffusion Model [15.2] 本稿では,事前学習した画像拡散モデルに基づいて,ゼロショット映像の復元と拡張を行うための第1のフレームワークを提案する。
本手法は,任意の拡散型画像復元・拡張手法に挿入可能なプラグアンドプレイモジュールである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:58:42 GMT)
MQuant: Unleashing the Inference Potential of Multimodal Large Language Models via Full Static Quantization [15.0] MQuantは、マルチモーダル大規模言語モデル(MLLM)の課題に取り組むために設計されたポストトレーニング量子化フレームワークである。
5つのメインストリームMLLM(Qwen-VL, Mini-V, CogVLM2)では、W4A8のMQuantがほぼ浮動小数点精度(1%劣化)を実現し、推論遅延を最大30%削減する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:08:02 GMT)
Retraining-Free Merging of Sparse MoE via Hierarchical Clustering [14.9] 本稿では, 疎活性化型エキスパート混合(HC-SMoE)のための階層クラスタリングについて紹介する。
HC-SMoEは、パラメータ還元のためのタスクに依存しないエキスパートマージフレームワークである。
我々は、QwenやMixtralを含む最先端モデルにおけるHC-SMoEの有効性を示すために、複数のゼロショット言語タスクの理論的解析と評価を行う。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 10:30:17 GMT)
PM-MOE: Mixture of Experts on Private Model Parameters for Personalized Federated Learning [14.7] フェデレーテッド・ラーニング(FL)は、プライバシー保護と協調学習能力で広く注目を集めている。
パーソナライズド・フェデレーション(Personalized Federated Learning)は、モデルをグローバルな共有部分とローカルなプライベート部分に分割することで、この問題に対処する。
本稿では、パーソナライズされたモジュールとエネルギーベースのパーソナライズされたモジュールを組み合わせたPM-MoEアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:20:21 GMT)
Cost of Simulating Entanglement in Steering Scenario [14.1] 我々は、その振舞いをシミュレートするために必要な共有ランダム性の量の観点から、不安定な量子状態のリソース内容の定量化を行う。
シミュレーションコストが2ビットの不安定な状態であっても、厳格に証明する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:33:17 GMT)
Distributive Fairness in Large Language Models: Evaluating Alignment with Human Values [13.8] 多くの社会的問題は資源の分配に関係しており、公平さと経済効率は結果の望ましさにおいて重要な役割を担っている。
本稿では,大規模言語モデル (LLM) が基本的公平性の概念に準拠しているかどうかを考察し,人間の嗜好との整合性について検討する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:24:47 GMT)
Prices, Bids, Values: One ML-Powered Combinatorial Auction to Rule Them All [13.7] 本稿では,要求クエリと値クエリの両方から全情報を確実に活用する,新しい機械学習アルゴリズムを提案する。
MLHCAは、値と要求クエリを使用する新しいMLベースのオークションである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:52:39 GMT)
Optimizing Feature Selection in Causal Inference: A Three-Stage Computational Framework for Unbiased Estimation [13.2] 本稿では,変数の所望のサブセットを選択する際の大幅な改善を示す3段階フレームワークを提案する。
提案手法は,様々な環境にまたがる最先端の合成データを用いて評価し,実現可能な時間内に優れた性能を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:47:28 GMT)
Online Estimation with Rolling Validation: Adaptive Nonparametric Estimation with Streaming Data [13.1] 本稿では,多くの典型的な勾配勾配勾配推定器において最小限の費用がかかる,オンライン版Left-one-outクロスバリデーションである重み付き転がり検証手法を提案する。
我々の分析は単純であり、主にいくつかの一般的な統計的仮定に依存している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:37:43 GMT)
Detecting a Fifth-Force Gauge Boson via Superconducting Josephson Junctions [12.9] 超伝導ジョセフソン接合を用いた第5の力による量子位相差を検出する新しい設計法を提案する。
この実験は、ゲージボソンが0.01,$eVから10,$eVの範囲内にある場合、ゲージカップリングに最も敏感であることがわかった。
これは、新しい物理をミリ以下の小さなスケールで測定するための新しい道を開く。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:11:02 GMT)
It Takes Two: A Peer-Prediction Solution for Blockchain Verifier's Dilemma [12.7] 我々は,分散検証ゲームのための一相ベイズ的真理機構の設計に向けて,ビザンチン・ローバストなピア予測フレームワークを開発する。
我々の研究は、ブロックチェーンのセキュリティと堅牢性を高める分散検証プロトコルのためのインセンティブ設計のフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:06:37 GMT)
GraphMinNet: Learning Dependencies in Graphs with Light Complexity Minimal Architecture [12.3] 本稿では,最小限のGated Recurrent Unitの考え方をグラフ構造化データに一般化した新しいGNNアーキテクチャであるGraphMinNetを紹介する。
本手法は線形計算複雑性を伴う効率的なLRDモデリングを実現する。
その結果、10のデータセットのうち6つが優れた性能を示し、他のデータセットと競合する結果が得られた。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:46:48 GMT)
Robust Knowledge Distillation in Federated Learning: Counteracting Backdoor Attacks [12.2] フェデレートラーニング(FL)は、データのプライバシを保持しながら、複数のデバイス間で協調的なモデルトレーニングを可能にする。
悪意のある参加者が世界モデルに侵入できるバックドア攻撃の影響を受けやすい。
本稿では,制約的仮定に頼らずにモデル整合性を高める新しい防御機構であるロバスト知識蒸留(RKD)を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:57:08 GMT)
Proposal for a Quantum Mechanical Test of Gravity at Millimeter Scale [11.8] 重力によるポテンシャル差から誘起される量子相の異なる進化を検出するためにジョセフソン効果を利用する新しい実験を提案する。
この実験は、ミリスケールで量子力学的に重力をテストすることができ、また、小さなスケールでの重力のパリティ不変性を調べることができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:19:37 GMT)
A Differentiated Reward Method for Reinforcement Learning based Multi-Vehicle Cooperative Decision-Making Algorithms [11.5] 強化学習(Reinforcement Learning, RL)は, 状態-動作-回帰フィードバックループを通じて, 多車両協調運転戦略を最適化する大きな可能性を示す。
本稿では、状態遷移勾配情報を報酬設計に組み込んだ定常遷移系に基づく微分報酬法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:16:15 GMT)
MetaOpenFOAM 2.0: Large Language Model Driven Chain of Thought for Automating CFD Simulation and Post-Processing [11.5] 提案するMetaOpenFOAM 2.0は,COT(Chain of Thought)分解と反復検証を利用して,非専門家ユーザに対するアクセシビリティを向上させる。
シミュレーション(流動、熱伝達、燃焼)と後処理(抽出、可視化)をカバーする新しいベンチマークで、MetaOpenFOAM 2.0は実行可能性スコアが6.3/7、通過率は86.9%に達した。
アブレーション試験では,COTによる分解と反復精製によりタスク性能が大幅に向上した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:31:25 GMT)
It's Not Just a Phase: On Investigating Phase Transitions in Deep Learning-based Side-channel Analysis [11.1] サイドチャネル分析(SCA)は、攻撃者が意図しない情報を観察して秘密データを得るという現実的な脅威である。
ディープラーニングはブラックボックスとして機能するので、将来的には攻撃の仕組みを理解しなければならないセキュリティ評価者にとって、役に立たない。
この研究は、機械的解釈可能性が、関連情報が不足している現実的なシナリオに効果的にスケールできることを示します。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:41:39 GMT)
Class-Imbalanced-Aware Adaptive Dataset Distillation for Scalable Pretrained Model on Credit Scoring [10.7] 金融データセット上での大規模事前学習モデルの適用を拡大するための新しいフレームワークを提案する。
我々は,データセット蒸留における不均衡認識技術を統合することにより,財務データセットの性能が向上した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:55:35 GMT)
SeePerSea: Multi-modal Perception Dataset of In-water Objects for Autonomous Surface Vehicles [10.7] 本稿では,自律航法のためのマルチモーダル認識データセットについて紹介する。
自律型表面車両(ASV)の環境意識を高めるため、水中環境における水中障害物に焦点を当てている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:59:36 GMT)
VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding [10.5] Video Temporal Grounding (VTG)は、言語クエリを使用して特定のビデオ内のイベントタイムスタンプを正確に特定する。
ビデオ大言語モデル(ビデオLLM)は、ゼロショット方式で複数のタスクを同時に処理することができる。
本稿では,ビデオLLMのタイムスタンプローカライゼーション能力を向上させるモデルであるVTG-LLMを紹介する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:55:30 GMT)
Optimal compressed sensing for image reconstruction with diffusion probabilistic models [10.3] このような測定を最適化するための確立された方法は、主成分分析(PCA)、独立成分分析(ICA)、圧縮センシング(CS)などである。
本稿では,効率的な画像再構成のための線形測定の最適化手法を提案する。
2つの自然画像データセットに対して得られた最適測定値がPCA,ICA,CSと異なり,平均2乗再構成誤差が著しく低いことを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:37:30 GMT)
How Out-of-Distribution Detection Learning Theory Enhances Transformer: Learnability and Reliability [10.1] 本稿では,変圧器のOOD検出確率近似(PAC)理論を紹介する。
損失関数内の外れ値の誤分類をペナルティ化することにより、トランスフォーマーネットワークの信頼性を確実に向上させることができる。
このアプローチは、学習可能性を確保し、インレーヤとアウトレーヤの間の決定境界を洗練する新しいアルゴリズムをもたらす。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:24:57 GMT)
Simple Is Effective: The Roles of Graphs and Large Language Models in Knowledge-Graph-Based Retrieval-Augmented Generation [9.8] 大きな言語モデル(LLM)は強い推論能力を示すが、幻覚や時代遅れの知識のような制限に直面している。
本稿では、サブグラフを検索する知識グラフ(KG)ベースのRetrieval-Augmented Generation(RAG)フレームワークを拡張するSubgraphRAGを紹介する。
提案手法は,高効率かつフレキシブルなサブグラフ検索を実現するために,並列3重装飾機構を備えた軽量多層パーセプトロンを革新的に統合する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:03:04 GMT)
Learning Provably Improves the Convergence of Gradient Descent [9.8] 本稿では,学習者によるL2O(Learning to Optimize)問題の収束について検討する。
アルゴリズムの接点により、L2Oの収束が著しく向上する。
以上の結果から,GD法では50%の成績を示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:44:10 GMT)
Generalized Lie Symmetries in Physics-Informed Neural Operators [9.8] 物理インフォームド・ニューラル演算子(PINO)は偏微分方程式(PDE)の解演算子を学習するための強力なツールとして登場した。
近年の研究では、リーポイント対称性情報を取り入れることで、PINOのトレーニング効率が大幅に向上することが示されている。
本稿では,ポイント対称性の進化的代表を生かした新たな損失増大戦略を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:21:07 GMT)
Tracking the Feature Dynamics in LLM Training: A Mechanistic Study [9.7] SAE-Trackは,SAEの連続的な系列を効率的に取得するための新しい手法である。
我々は,特徴形成を機械的に調査し,その進捗測定方法を開発した。
トレーニング中の特徴の漂流を分析し可視化する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:47:18 GMT)
Improving Vision Transformers by Overlapping Heads in Multi-Head Self-Attention [9.4] MHSA(Multi-Head Self-Attention)は、アテンション機構を独立して適用することにより、各ヘッドが異なる表現を学習できるようにする。
マルチオーバーラップ型自己認識(MOHSA)を導入し、クエリー、キー、値の2つの頭と頭が重なり合うようにする。
提案手法の最適性能を十分に検討するために,重なり合う比の様々なパラダイムを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:56:14 GMT)
MambaGlue: Fast and Robust Local Feature Matching With Mamba [9.4] そこで我々は,MambaGlueと呼ばれる,新しいMambaベースの局所特徴マッチング手法を提案する。
Mambaは最先端のアーキテクチャであり、トレーニングと推論の両方において、優れたスピードで急速に認識されるようになった。
私たちのMambaGlueは、実世界のアプリケーションにおける堅牢性と効率のバランスを達成します。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:43:03 GMT)
On the Interplay Between Sparsity and Training in Deep Reinforcement Learning [9.3] スパース構造が学習性能に有意な影響を及ぼすことを示す。
与えられたドメインに対して最高のスパースアーキテクチャを選択することは、隠されたレイヤの重みが固定されているか学習されているかに依存する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:43:04 GMT)
Solving the Content Gap in Roblox Game Recommendations: LLM-Based Profile Generation and Reranking [9.3] 大規模言語モデル(LLM)は、ゲーム内のテキストデータを解析することでレコメンデーションシステムを強化する機会を提供する。
本稿では,人間のアノテーションを伴わないゲームにおいて,高品質で構造化されたテキスト機能を生成すること,そしてそれらの機能を検証することで,リコメンデーションの妥当性を向上させること,の2つの課題に対処する。
ゲーム内テキストを抽出し,LLMを用いてジャンルやゲームプレイの目的などの属性を生のプレイヤーのインタラクションから推測する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:30:56 GMT)
Differentially Private Multi-objective Selection: Pareto and Aggregation Approaches [9.1] 本稿では,PrivParetoとPrivAggの2つの新しい選択機構について述べる。
どちらもグローバルおよびローカルな感度アプローチをサポートし、複数のユーティリティ関数の感度をどのように構成するかを示す包括的な理論的分析を行う。
ソーシャルネットワークにおけるコスト感受性決定木構築と多目的影響ノード選択の2つの実世界の応用例を実演する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:52:47 GMT)
Stochastic Linear Bandits with Latent Heterogeneity [9.0] 本稿では、この未観測不均一性を顧客応答で明示的にモデル化する、新しい遅延不均一バンディットフレームワークを提案する。
本手法では,グループメンバシップとグループ固有報酬関数を同時に学習する革新的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:02:21 GMT)
Causal Abstraction Learning based on the Semantic Embedding Principle [8.9] 構造因果モデル(SCM)により,複数の解像度で複雑なシステムを調べることができる。
本稿では,CAの学習を可能にするSCMのカテゴリ理論的アプローチを提案する。
提案手法は,CAの構造に関する事前情報が異なる合成脳データと実世界脳データの両方で成功していることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:54:44 GMT)
How Does Microservice Granularity Impact Energy Consumption and Performance? A Controlled Experiment [8.8] 異なるスケールの2つのオープンソースのマイクロサービスベースシステムを用いた制御実験を行った。
各システムに対して、サービスやマージによる3つのレベルの粒度を作成しました。
粒度は平均461J以上のエネルギー (13%) で消費され、粗い粒度に比べて応答時間 (14%) に5.2msを加えた。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:10:14 GMT)
OAEI-LLM: A Benchmark Dataset for Understanding Large Language Model Hallucinations in Ontology Matching [8.7] 大規模言語モデル(LLM)の幻覚は、オントロジーマッチング(OM)で例外なく、ドメイン固有の下流タスクで一般的に発生する。
OAEI-LLMデータセットは、オントロジーアライメント評価イニシアチブ(OAEI)データセットの拡張版であり、OMタスクにおけるLSM固有の幻覚を評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:43:09 GMT)
Sagalee: an Open Source Automatic Speech Recognition Dataset for Oromo Language [8.6] 我々はエチオピアおよび近隣地域で広く話されている言語であるオロモ語のための新しいデータセットを提示する。
データセットはクラウドソーシングイニシアチブを通じて収集され、多様な話者と音声のバリエーションを含んでいる。
実際の音声録音を100時間、書き起こしと組み合わせて行い、クリーンでノイズの多い環境での読み上げ音声をカバーしている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:47:36 GMT)
Denoising Score Matching with Random Features: Insights on Diffusion Models from Precise Learning Curves [8.5] 生成拡散モデルにおいて,評価スコアマッチングの検定誤差と訓練誤差の正確な式を導出する。
私たちは次元$d$、データサンプル数$n$、機能数$p$が無限大となるような状態で運用しています。
私たちの仕事は、一般化と記憶のいずれも強化された条件に光を当てています。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:43:33 GMT)
Analysis of Diffusion Models for Manifold Data [8.5] 生成拡散モデルの時間逆ダイナミクスを解析する。
我々の分析で使われる重要なツールは、一般化線形モデルの相互情報(あるいは自由エネルギー)の正確な公式である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:14:35 GMT)
Sampling in High-Dimensions using Stochastic Interpolants and Forward-Backward Stochastic Differential Equations [8.5] 本稿では,高次元確率分布からサンプルを抽出する拡散型アルゴリズムのクラスを提案する。
我々の手法は、確率密度の時間インデクシングされたコレクションを定義するための補間フレームワークに依存している。
提案アルゴリズムは,従来の手法では処理が困難であった分布から,効果的にサンプルを抽出できることを実証する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:27:11 GMT)
Enhancing Memory and Imagination Consistency in Diffusion-based World Models via Linear-Time Sequence Modeling [8.3] EDELINEは、拡散モデルと線形時間状態空間モデルを統合し、メモリ保持と時間的一貫性を向上させる新しいフレームワークである。
複数のベンチマークで得られた結果から,EDELINEの長期タスクにおける事前ベースラインに対する優位性とロバスト性を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:49:59 GMT)
Locate-then-edit for Multi-hop Factual Recall under Knowledge Editing [8.0] location-then-edit パラダイムは知識編集において大きな可能性を秘めている。
従来手法では,知識を新たに編集するマルチホップのファクトリコール作業に苦慮していた。
IFMETは浅い層と深い層の両方を編集する新しい手法である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:21:59 GMT)
AdaFV: Rethinking of Visual-Language alignment for VLM acceleration [7.9] 偏りのあるVLMの自己アテンションに応じて視覚トークンを減らすいくつかのアプローチは、不正確な応答をもたらす。
本稿では,視覚的満足度とテキスト・ツー・イメージの類似性の有効性を動的に活用する,自己適応型クロスモーダリティ・アテンション・ミックス機構を提案する。
提案手法は,特に縮小速度が十分に大きい場合,最先端のトレーニング不要なVLM加速性能を実現する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:13:27 GMT)
Learn Sharp Interface Solution by Homotopy Dynamics [7.9] 本稿では,物理インフォームドニューラルネットワーク(PINN)の学習における課題について考察する。
本稿では, PINN損失関数の最小化の難しさについて検討する。
NysNewton-CG(NysNewton-CG)を新たに導入し,PINNの性能を大幅に改善した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:26:53 GMT)
How Do Model Export Formats Impact the Development of ML-Enabled Systems? A Case Study on Model Integration [7.7] ONNXは、ほとんどのケースで最も効率的な統合とポータビリティを提供する。
SavedModelとTorchScriptはPythonベースのシステムで非常に便利だった。
PickleとJoblibは、Pythonベースのシステムでさえ、最も統合するのが難しかった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:34:40 GMT)
A Probabilistic Approach for Model Alignment with Human Comparisons [7.7] 本研究では,従来の教師あり学習プロセスを強化できる条件を解析するための理論的枠組みを開発する。
本稿では,機械学習と人間のフィードバックを結びつける2段階の"Supervised Learning+Learning from Human Feedback"(SL+LHF)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:28:10 GMT)
OrcaLoca: An LLM Agent Framework for Software Issue Localization [7.6] OrcaLocaはソフトウェアイシューのローカライゼーションの精度を向上させるエージェントフレームワークである。
LLM誘導アクションの優先度に基づくスケジューリング、関連性スコア付きアクション分解、距離対応コンテキストプルーニングを統合している。
また、パッチ生成統合を通じて、オープンソースのフレームワークの最終的な解決率を6.33ポイント改善する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:15:03 GMT)
Converting Transformers into DGNNs Form [7.4] ダイグラフフーリエ変換に基づく合成ユニタリグラフ畳み込みを導入する。
Converterと呼ぶ結果のモデルは、トランスフォーマーをダイレクトグラフニューラルネットワーク形式に効果的に変換する。
我々は、Long-Range Arenaベンチマーク、Long-Range Arena分類、DNAシークエンスに基づく分類でConverterを検証した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:44:46 GMT)
Defense Against the Dark Prompts: Mitigating Best-of-N Jailbreaking with Prompt Evaluation [7.2] 近年の研究では、ランダム拡張の繰り返し使用によるBest-of-Nのジェイルブレイクが、すべての主要言語モデルに対して有効であることが示されている。
BoNの論文で成功したジェイルブレイクの100%は、我々のDefense Against The Dark Promptsメソッドでブロックされていることがわかりました。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:26:30 GMT)
XYScanNet: An Interpretable State Space Model for Perceptual Image Deblurring [7.0] ディープステートスペースモデル(SSM)は、CNNやTransformerネットワークに代わる有望な選択肢として浮上している。
本研究では,スライスとスライスを交互に走査するスライス・アンド・スキャン方式を提案する。
我々はXYScanNetを開発した。XYScanNetは軽量な機能融合モジュールと統合されたSSMアーキテクチャで、画像の劣化を改善できる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:31:31 GMT)
HERA: Improving Long Document Summarization using Large Language Models with Context Packaging and Reordering [6.9] HERAと呼ばれる新しい要約生成フレームワークを提案する。
まず、その意味構造によって長い文書をセグメンテーションし、同じ事象に関するテキストセグメントを検索し、最後にそれらを並べ替えて入力コンテキストを形成する。
実験の結果,HERAはROUGE,BERTScore,忠実度測定において基礎モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:55:06 GMT)
Affordance-based Robot Manipulation with Flow Matching [6.9] 本稿では,ロボット操作支援のためのフレームワークを提案する。
第1に,大規模モデルを下流シーンの空き時間理解タスクに効果的に適用し,第2に,視覚的空き時間モデルに基づいて,効果的にロボット行動軌跡を学習する。
我々は,教師付きフローマッチング手法を用いて,ロボットの行動軌跡を空き時間で案内する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:58:47 GMT)
SocratiQ: A Generative AI-Powered Learning Companion for Personalized Education and Broader Accessibility [6.9] 本稿では、適応学習技術を通じてソクラティック手法を実装するAIを活用した教育アシスタントであるソクラティQを紹介する。
このシステムは、生徒の反応と理解パターンに基づいて、パーソナライズされた学習経路を動的に生成する、新しい生成AIベースの学習フレームワークを採用している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:59:54 GMT)
Variance Reduction via Resampling and Experience Replay [6.7] モデルが$U$-と$V$-statisticsを使ってリプレイを経験する理論的枠組みを提案する。
本稿では,LSTDアルゴリズムとPDEに基づくモデルフリーアルゴリズムを用いて,政策評価タスクに適用する。
我々は,このフレームワークをカーネルリッジレグレッションに拡張し,経験リプレイに基づく手法により従来の$O(n3)$から計算コストを削減し,分散を同時に低減することを示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:46:08 GMT)
Dominated Novelty Search: Rethinking Local Competition in Quality-Diversity [6.6] 本研究では,動的フィットネス変換による局所的な競争を実現する品質多様性アルゴリズムであるDominated Novelty Searchを紹介する。
実験の結果, ドミネートノベルティサーチは, 標準品質・ダイバーシティ・ベンチマークにおいて, 既存の手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:15:50 GMT)
CAD: Confidence-Aware Adaptive Displacement for Semi-Supervised Medical Image Segmentation [6.6] 半教師付き医療画像セグメンテーションは、最小限の専門家アノテーションを活用することを目的としている。
本稿では,信頼度の高い最大の低信頼領域を高信頼パッチで選択的に識別し,置き換えるフレームワークである自信認識適応変位(CAD)を紹介する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:23:18 GMT)
Enhancing Highway Safety: Accident Detection on the A9 Test Stretch Using Roadside Sensors [6.4] 道路交通事故は5歳から29歳の人々にとって主要な死因であり、毎年約19万人が死亡している。
これらの死亡率を減らすためには、スピードアップ、飲酒運転、注意散らしなどのヒューマンエラーに対処することが不可欠である。
本稿では,ルールに基づくアプローチと学習に基づくアプローチを組み合わせた事故検出フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:34:16 GMT)
Transition Transfer $Q$-Learning for Composite Markov Decision Processes [6.3] 本稿では,高次元遷移力学を共有構造を表す低ランク成分の和としてモデル化した新しい複合MDPフレームワークを提案する。
これは純粋に低ランクな遷移モデルの一般的な仮定を緩和する。
UCB-TQLは、複数のタスクがコア線形MDPダイナミクスを共有するが、スパース次元に沿って分散するRLシナリオを転送するために設計されている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:22:00 GMT)
Positional Attention: Expressivity and Learnability of Algorithmic Computation [6.2] この研究は、アルゴリズム実行におけるトランスフォーマーにおける注意の役割をよりよく理解することを目的としている。
位置対応変換器(位置対応変換器)は並列計算モデルと同じ表現性を持つことを示す。
パラメータノルムにより良い理論的依存を示す一方で、特定のタスクはより多くの層を必要とする可能性がある。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:14:51 GMT)
A Theoretical Characterization of Optimal Data Augmentations in Self-Supervised Learning [6.2] 我々は、拡張は有用な表現を学ぶためにデータと似ていても、多様性も必要とせず、アーキテクチャが最適な拡張に重大な影響を与えていると論じている。
我々は、VICReg と Barlow Twins の2つの一般的な非競合損失を考慮し、そのような拡張を構築するアルゴリズムを提供する。
我々の分析によると、拡張は有用な表現を学ぶためにデータと似ていてはならず、多様性も必要であり、アーキテクチャは最適な拡張に重大な影響を与えている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:28:14 GMT)
TROI: Cross-Subject Pretraining with Sparse Voxel Selection for Enhanced fMRI Visual Decoding [6.1] fMRI(機能的磁気共鳴イメージング)視覚復号には、視覚刺激によって引き起こされる脳信号から元の画像を復号する。
本研究は, クロスオブジェクトfMRIデコードタスクのための新しい2段階データ駆動ROIラベル法であるTROIを提案する。
まず,スパースマスクトレーニングと低域通過フィルタリングを組み合わせたボクセル選択手法を提案する。
第2段階では、下流タスクの入力層を微調整するために学習率の巻き戻し戦略を適用する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:20:17 GMT)
Benchmark on Peer Review Toxic Detection: A Challenging Task with a New Dataset [6.1] この研究は、ピアレビューにおける毒性の検出という、重要だが未調査の領域を探求する。
まず、4つの異なるカテゴリにわたるピアレビューの毒性を定義し、OpenReviewプラットフォームからピアレビューのデータセットをキュレートする。
我々は、専用毒性検出モデルや感情分析モデルなど、様々なモデルをベンチマークする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:01:39 GMT)
Muti-Fidelity Prediction and Uncertainty Quantification with Laplace Neural Operators for Parametric Partial Differential Equations [6.0] Laplace Neural Operators (LNOs) は、科学機械学習において有望なアプローチとして登場した。
低忠実度ベースモデルと並列線形/非線形HF補正と動的相互重み付けを組み合わせた多忠実Laplace Neural Operator (MF-LNOs)を提案する。
これにより、LFデータセットとHFデータセットの相関を利用して、興味のある量の正確な推測を行うことができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:38:50 GMT)
Distributed Primal-Dual Algorithms: Unification, Connections, and Insights [5.9] 分散環境での一般的な経験的リスク最小化問題に対する原始双対アルゴリズムについて検討する。
アルゴリズムの両クラスは、原始変数と双対変数のみを含む統一された更新形式に変換可能であることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:56:11 GMT)
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing [5.8] Conditionally Overlapping Mixture of ExperTs (COMET) は、モジュラーでスパースなアーキテクチャを、指数関数的に重複する専門家数で誘導する一般的なディープラーニング手法である。
画像分類,言語モデリング,回帰といったタスクにおけるCOMETの有効性を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:25:33 GMT)
The Good, the Bad, and the Ugly: The Role of AI Quality Disclosure in Lie Detection [5.5] 低品質のAIアドバイザは、品質の開示が欠如しているため、テキストベースの嘘を広めるのに役立ち、嘘を検出するのに役立ちそうである。
情報開示のない低品質のアドバイザーに頼る場合、参加者の真偽検出率は、AIの真の有効性が明らかになると、自身の能力を下回ることがわかりました。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:14:39 GMT)
Minimalistic Video Saliency Prediction via Efficient Decoder & Spatio Temporal Action Cues [5.5] 本稿では,ViNetアーキテクチャをベースとした36MBモデルであるViNet-Sを紹介し,性能を損なうことなくモデルサイズやパラメータを大幅に削減する軽量デコーダを特徴とする。
本研究では,ViNet-SとViNet-Aのアンサンブルを平均化することにより,視覚のみと6つのオーディオ視覚的サリエンシデータセットに対して,1000fps以上を達成できることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:05:28 GMT)
LLM Evaluation Based on Aerospace Manufacturing Expertise: Automated Generation and Multi-Model Question Answering [5.4] 本稿では,航空宇宙製造におけるLarge Language Models (LLMs) に適した評価指標について紹介する。
重要な情報は、古典的な航空宇宙製造教科書やガイドラインの詳細なテキスト解析によって抽出される。
難易度の異なる複数の正解を巧みに構成する。
これらの質問に答えるために異なるLCMモデルが使用され、その精度が記録される。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 10:18:11 GMT)
CAT Pruning: Cluster-Aware Token Pruning For Text-to-Image Diffusion Models [5.4] 拡散モデルは、特にテキスト対画像合成の領域において、生成タスクに革命をもたらした。
しかし、反復的なデノゲーションプロセスは、かなりの計算資源を必要とする。
本稿では、トークンレベルのプルーニングとキャッシュ技術を統合して、この計算課題に対処する新しい加速戦略を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:46:02 GMT)
MCM: Multi-layer Concept Map for Efficient Concept Learning from Masked Images [5.1] マスク画像に基づく効率的な概念学習法を考案する最初の試みであるMCM(Multi-layer Concept Map)を提案する。
特に,異なるエンコーダ層とデコーダ層との相関関係を確立することで,非対称な概念学習アーキテクチャを導入する。
MCMは、全画像パッチの75%未満をトレーニングすることで、計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:45:49 GMT)
Discovering robust biomarkers of psychiatric disorders from resting-state functional MRI via graph neural networks: A systematic review [4.8] 障害予測タスクのためのfMRIデータセットに対して,GNNとモデル説明可能性技術がどのように適用されてきたかを検討する。
精神疾患に対するfMRIバイオマーカーを報告したGNNを用いて65種類の研究を同定した。
バイオマーカーのロバスト性を決定するために,客観的評価指標に基づく新しい標準を確立することを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:26:02 GMT)
Pause-Tuning for Long-Context Comprehension: A Lightweight Approach to LLM Attention Recalibration [4.7] 本稿では,長文入力の理解を深めるために注意を喚起する手法である停止チューニングを導入する。
提案手法では,ポーズトークンを人工的に挿入したデータセット上での言語モデルを微調整する。
本稿では,Needle-in-a-Haystackベンチマークを用いて,代替手法に対する停止チューニングを評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:47:15 GMT)
Life-Cycle Emissions of AI Hardware: A Cradle-To-Grave Approach and Generational Trends [4.7] 本研究では,温室効果ガス排出量の総合的AI加速器ライフサイクルアセスメント(LCA)を初めて発表した。
5つの処理ユニット(TPU)の解析は、ハードウェア寿命のすべての段階を包含する。
この研究の副産物は、AIハードウェアの持続可能性を評価するのに役立つ新しい計量計算炭素強度(CCI)である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:26:19 GMT)
Integrating Large Language Models in Causal Discovery: A Statistical Causal Approach [4.6] 本稿では,大言語モデル(LLM)を用いたSCDと知識に基づく因果推論(KBCI)を合成する,因果推論の新しい手法を提案する。
LLM-KBCI と LLM-KBCI を併用した SCD の結果は, 先行知識のない SCD の結果よりも, 基礎的真理に近づいたことが明らかとなった。
医療などの重要な領域にまたがる本提案手法の実用化に向けて, 限界, 臨界誤差のリスク, LLMに関する技術改善の期待, 結果のエキスパートチェックの現実的な統合などについても, 徹底的に検討する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:54:39 GMT)
An Empirical Analysis on the Use and Reporting of National Security Letters [4.6] 我々は国家安全保障書簡(NSL)の文脈でその現象を評価する。
NSL(英: NSL)は、アメリカ合衆国連邦政府の一部に、国家安全保障上の目的のために特定の情報を要求する権限を付与する法的手続きの一種である。
我々は,NSL使用に関する公開データの全範囲を慎重に分析することにより,透明性メカニズムがいかにうまく機能するかを評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:56:56 GMT)
Uniform-in-time weak propagation of chaos for consensus-based optimization [4.5] 有界探索領域上でのコンセンサスに基づく最適化(CBO)法におけるカオスの均一時間弱伝播について検討する。
我々の研究によると、弱い誤差は時間内に$O(N-1)$一様であり、そこでは$N$は粒子の数を表す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:38:10 GMT)
Efficient Sampling for Pauli Measurement-Based Shadow Tomography in Direct Fidelity Estimation [4.5] 同様の戦略は古典的な影から導き出すことができる。
具体的には,GHZおよびW状態を用いてDFEを行うために,パウリ測定を用いた効率的な手法について述べる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:26:27 GMT)
A Taxonomy of Real-World Defeaters in Safety Assurance Cases [4.4] ソフトウェアエンジニアリングコミュニティは、ソフトウェア保証ケースにおける現実世界の敗者の再利用可能な分類の恩恵を受けることができる。
安全クリティカルシステムにおける敗者の分析・管理を標準化するための基礎を築き,7つの幅広いカテゴリーの分類学を導出した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:38:41 GMT)
SubRegWeigh: Effective and Efficient Annotation Weighing with Subword Regularization [4.4] SubRegWeighは、既存のメソッドの4倍から5倍の速さでアノテーションの重み付けを行うことができる。
SubRegWeighは疑似不正確なラベルを用いた実験において、疑似不正確なラベルをアノテーションエラーとして明確に識別する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:02:25 GMT)
Interpretable Neural ODEs for Gene Regulatory Network Discovery under Perturbations [4.3] 本稿では、生物学的に有意な神経常微分方程式(ニューラル・オード)を組み込んだ新しいフレームワークであるPerturbODEを提案し、摂動下での細胞状態の軌跡をモデル化する。
シミュレーションおよび実際の過剰表現データセット間での軌道予測とGRN推論におけるPerturbODEの有効性を実証する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:30:20 GMT)
Mordal: Automated Pretrained Model Selection for Vision Language Models [4.3] Mordalは自動マルチモーダルモデル検索フレームワークであり、手動で介入することなくユーザ定義タスクに最適なVLMを効率的に見つける。
評価の結果,Mordalは最大8.9times$-$11.6times$低GPU時間を用いて,与えられた問題に対して最高のVLMを見つけることができることがわかった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:41:29 GMT)
Gaussians on their Way: Wasserstein-Constrained 4D Gaussian Splatting with State-Space Modeling [4.3] 現実世界と同じように自然に3Dガウスを移動させる方法を紹介します。
先行予測と現在の観測とを融合した状態整合フィルタを提案する。
また、ワッサーシュタイン距離正規化を用いて、ガウスパラメータのスムーズで一貫した更新を保証する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:10:44 GMT)
Multi-Order Hyperbolic Graph Convolution and Aggregated Attention for Social Event Detection [4.2] ソーシャルイベント検出(Social Event Detection、SED)は、特定の現実世界のイベントを特定することに焦点を当てたタスクであり、様々な領域にまたがる幅広いアプリケーションを持つ。
本稿では,SEDの性能向上を目的とした,MOHGCAA(Multi-Order Hyperbolic Graph Convolution with Aggregated Attention)を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:15:40 GMT)
Access Denied: Meaningful Data Access for Quantitative Algorithm Audits [4.2] 第三者監査はしばしばアクセス制限によって妨げられ、監査人は制限された低品質のデータに頼らざるを得ない。
本研究は,リシディズムと医療カバレッジ予測のための2つの現実的なケーススタディの監査シミュレーションを行う。
データの最小化と匿名化のプラクティスは、個々のレベルのデータのエラー率を強く向上させ、信頼性の低い評価につながることが分かっています。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:33:45 GMT)
Decentralized Inference for Distributed Geospatial Data Using Low-Rank Models [4.2] 本稿では,空間的低ランクモデルにおけるパラメータ推論に適した分散化フレームワークを提案する。
重要な障害は、観測中の空間的依存から生じ、ログのような状態が要約として表現されるのを防ぐ。
提案手法では,効率的なパラメータ最適化のために,マルチセンサと動的コンセンサス平均化を統合したブロック降下法を用いる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:17:01 GMT)
Engineering Educators' Perspectives on the Impact of Generative AI in Higher Education [4.1] 本研究は, 生産型AIの活用と展望について, 工学教育者を対象にした調査から得られた知見を報告する。
我々は、GenAIの利用と快適性、GenAIに対する全体的な視点、教育、学習、研究にGenAIを使うことの課題と潜在的害について質問し、彼らの教室でのGenAIの使用と統合に対するアプローチが、GenAIの経験とそれに対する認識に影響を与えているかどうかを検討した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:29:53 GMT)
Learning non-Gaussian spatial distributions via Bayesian transport maps with parametric shrinkage [4.0] 本稿では,拡張性に対するVecchia近似と組み合わせた,基底のパラメトリックガウス族に対するマップ成分の縮小を提案する。
結果として得られたShrinkTMアプローチは、特に少数のトレーニングサンプルにおいて、既存のBTMよりも正確である。
我々はShrinkTMの利点を実証するが、シミュレーションデータと気候モデル出力について数値実験を行う。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:55:02 GMT)
The Impact of Persona-based Political Perspectives on Hateful Content Detection [4.0] 政治的に多様な言語モデルは、多くの研究者や組織にアクセスできない計算資源を必要とする。
近年の研究では、ペルソナをベースとしたプロンプトが、追加の訓練なしに、モデルアウトプットに政治的多様性をもたらすことが確認されている。
本稿では、下流業務における政治的事前訓練に匹敵する結果が得られるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:53:17 GMT)
Integrating Urban Air Mobility with Highway Infrastructure: A Strategic Approach for Vertiport Location Selection in the Seoul Metropolitan Area [4.0] UAM(Urban Air Mobility)は、ソウル都市圏の交通アクセス性を高める効果的なソリューションである。
UAMと高速道路施設の地上交通を統合することで、限られた交通手段を持つ地域で効率的な接続ソリューションが実現できる。
本研究は、UAMと既存の高速道路インフラを統合するために、高速道路交通のVertiportsに適した場所を特定することに焦点を当てる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:25:33 GMT)
HoP: Homeomorphic Polar Learning for Hard Constrained Optimization [3.8] 制約付き最適化は、非常に効率的な合成訓練アプローチを必要とする。
データ駆動学習法として、L2Oはニューラルネットワークを利用して近似解を効率的に生成する。
HoPは既存のL2O法よりも最適に近い解を得る。
すべての場合、HoPは既存のL2O法よりも最適に近い解を得る。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:59:15 GMT)
Towards Resource-Efficient Streaming of Large-Scale Medical Image Datasets for Deep Learning [3.8] 医療画像ストリーミングツールキット(MIST)は、単一の高解像度コピーから異なる解像度とフォーマットで医療画像のストリーミングを可能にする。
MISTは、画像の品質に影響を与えることなく、データセットのホスティングとダウンロードに必要なストレージと帯域幅を削減する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:16:55 GMT)
DeepScribe: Localization and Classification of Elamite Cuneiform Signs Via Deep Learning [3.6] 1933年、シカゴ大学東洋研究所の考古学者たちは、ペルセポリスの発掘中に数万の土台や破片を発見した。
これらのタブレットの多くは、専門家のキュニフォーム主義者によって痛々しく撮影され、注釈付けされた5000枚以上のアノテートされたタブレットイメージと、10万枚以上のキュニフォームのサインバウンディングボックスからなるリッチなデータセットを提供している。
我々はこのデータセットを活用して、各符号の同一性に関する提案を提供するモジュール型コンピュータビジョンパイプラインであるDeepScribeを開発した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:37:13 GMT)
Vision-Language Modeling in PET/CT for Visual Grounding of Positive Findings [3.5] 視覚言語モデルは、オブジェクトのテキスト記述と画像内の特定の位置を視覚的接地を通して接続することができる。
これらのモデルは、PET/CTに欠ける大きな注釈付き画像テキストデータセットを必要とする。
我々はPET/CTレポート記述と画像位置をリンクする弱いラベルを生成するための自動パイプラインを開発し、それを3次元視覚言語視覚接地モデルのトレーニングに使用した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:59:31 GMT)
Provably-Stable Neural Network-Based Control of Nonlinear Systems [3.5] NNベースの制御に関する現在の文献は、安定性と追跡性能に関する理論的保証を欠いている。
本稿では,アフィン非線形システムのための実測可能なNNベース制御方式を設計するための体系的・包括的手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:05:06 GMT)
A statistically consistent measure of Semantic Variability using Language Models [3.5] 軽度の仮定の下で統計的に一貫した意味変数の尺度を示す。
この測度は意味スペクトルエントロピー(semantic spectrum entropy, 意味スペクトルエントロピー)と呼ばれ、棚外の言語モデルを必要とするアルゴリズムの実装が容易である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:55:58 GMT)
Advancing the Understanding and Evaluation of AR-Generated Scenes: When Vision-Language Models Shine and Stumble [3.5] 我々は、ARシーンの識別と記述において、3つの最先端の商用ビジョン・ランゲージ・モデル(VLM)の能力を評価する。
以上の結果から, VLMは一般的にARシーンの認識と記述が可能であることが示唆された。
仮想コンテンツ配置,レンダリング品質,物理的妥当性など,VLMのパフォーマンスに影響を及ぼす重要な要因を同定する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:27:00 GMT)
ForestColl: Throughput-Optimal Collective Communications on Heterogeneous Network Fabrics [3.5] ネットワークトポロジのスループット最適スケジュールを生成するツールであるForestCollを紹介する。
ForestCollは、ファブリックと直接アクセル接続の両方を含む、あらゆるネットワークファブリックをサポートしている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:17:16 GMT)
HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location [3.3] HyGenは、オンラインおよびオフラインワークロードの効率的なコロケーションを可能にする干渉対応LLMサービスシステムである。
運用負荷評価の結果,HyGenのスループットは最大3.87倍,オフラインスループットは5.84倍に向上した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:14:44 GMT)
Current Pathology Foundation Models are unrobust to Medical Center Differences [3.1] 我々は,病理基盤モデルが医療センター間の変動に対して堅牢であるかどうかを測定するために,ロバストネス指標を導入した。
現在評価されているすべての病理基盤モデルは、医療センターを強く表している。
医療センターの違いがFMによる予測性能に与える影響を定量的に評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:33:48 GMT)
StaICC: Standardized Evaluation for Classification Task in In-context Learning [3.1] 本稿では,テキスト内分類のための標準化された簡易評価ツールキット(StaICC)を提案する。
通常の分類タスクでは、StaICC-Normalを提供し、10個の広く使われているデータセットを選択し、一定の形式でプロンプトを生成する。
また,複数の側面からICLを診断するためのサブベンチマーク StaICC-Diag も提供し,より堅牢な推論処理を目指している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:45:09 GMT)
Sampling Binary Data by Denoising through Score Functions [2.9] Tweedie-Miyasawa式(TMF)はスコアベース生成モデルにおいて重要な要素である。
TMFはノイズデータのスコア関数を介してこれらを結合する。
我々はガウスノイズの代わりにベルヌーイノイズを平滑化装置として採用する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:59:02 GMT)
Efficient Direct-Connect Topologies for Collective Communications [2.9] ワークロードに関連する帯域幅のトレードオフに対して,レイテンシに最適化された直接接続トポロジを構築するためのアルゴリズムフレームワークを提供する。
提案手法は,与えられたクラスタサイズと度合いの様々なトポロジとスケジュールを合成し,与えられたワークロードの適切なトポロジとスケジュールを特定する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:20:49 GMT)
Simultaneous Estimation of Manipulation Skill and Hand Grasp Force from Forearm Ultrasound Images [2.8] 前腕超音波データを用いた操作スキルと手力の同時推定法を提案する。
我々のモデルでは、操作スキルの平均分類精度は94.87パーセント、操作スキルは10.16パーセント、根平均二乗誤差は0.51%、力推定では0.19ニュートンであった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:23:02 GMT)
Fighting Spurious Correlations in Text Classification via a Causal Learning Perspective [2.8] 本稿では,因果関係へのモデル依存を軽減するために,因果相関ロバスト (CCR) を提案する。
CCRは、逆確率重み付け(IPW)損失関数とともに、反ファクト推論に基づく因果的特徴選択法を統合する。
グループラベルを持たないメソッド間でのCCRの最先端性能を示し、場合によってはグループラベルを利用するモデルと競合する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:55:15 GMT)
Explorations of the Softmax Space: Knowing When the Neural Network Doesn't Know... [2.7] 本稿では,機械学習モデルにおける予測の信頼性を評価するための新しい手法を提案する。
我々は、トレーニングされたニューラルネットワークの出力がどのように変化するかをクラスタリングを用いて分析し、出力とクラスセントロイド間の距離を測定する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:25:03 GMT)
Segment Anything for Histopathology [2.7] ビジョンファウンデーションモデル(VFM)は、自動的および対話的セグメンテーションのより堅牢な代替手段を提供する。
本稿では,多種多様なデータセットを用いたSAMのトレーニングに基づく核セグメンテーションのためのVFMであるPathoSAMを紹介する。
私たちのモデルはオープンソースで、データアノテーションの一般的なツールと互換性があります。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:59:04 GMT)
Parameter Efficient Fine-Tuning of Segment Anything Model [2.7] Segment Anything Model (SAM) のようなビジョン基盤モデルは、広いセグメンテーション機能を通じてこの問題に対処する。
視覚変換器のためのQLoRAの実装とSAMの資源効率向上のための新しいアプローチを提供する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:39:17 GMT)
Multilingual State Space Models for Structured Question Answering in Indic Languages [2.6] 本稿では、Indic言語に適した効率的かつコンテキスト対応のQAシステムを構築するための状態空間モデル(SSM)の適用について検討する。
SSMはこのタスクに特に適しているのは、シーケンシャルデータにおける長期および短期の依存関係をモデル化できるためである。
その結果,これらのモデルは言語的微妙さを効果的に捉え,質問文の解釈,コンテキストアライメント,回答生成の大幅な改善につながった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:53:02 GMT)
Geometric Interpretation of Layer Normalization and a Comparative Analysis with RMSNorm [2.6] 本稿では,LayerNormの幾何学的解釈について述べる。
我々は、LayerNormの定義が本質的に一様ベクトルと結びついていることを示します。
LayerNormの標準化ステップは3つの簡単なステップで理解できることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:06:36 GMT)
Optimal Sensor Placement in Power Transformers Using Physics-Informed Neural Networks [2.4] 本研究は,物理インフォームドニューラルネットワーク(PIN)を用いた電力変圧器内の温度条件のシミュレーションと予測を目的とした。
得られた予測は、限られた数のセンサの制約の下で、変圧器内の温度センサの最適配置を決定するために使用され、効率的な性能モニタリングを可能にする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:44:41 GMT)
The Effect of Optimal Self-Distillation in Noisy Gaussian Mixture Model [2.4] 自己蒸留(英: self-distillation, SD)とは、モデルが自身の予測から自分自身を洗練させる技法である。
広く使われているにもかかわらず、その効果の基盤となるメカニズムはいまだ不明である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:31:30 GMT)
Policy Zooming: Adaptive Discretization-based Infinite-Horizon Average-Reward Reinforcement Learning [2.3] 無限水平平均逆強化学習(RL)におけるリプシッツ MDP について検討した。
for $d_texteff. = dPhi_z+2$ for model-free algorithmtextitPZRL-MF and $d_texteff. = 2d_mathcalS + dPhi_z + 3$ for
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:50:27 GMT)
A Comprehensive Survey of Reinforcement Learning: From Algorithms to Practical Challenges [2.2] 強化学習(RL)は人工知能(AI)の強力なパラダイムとして登場した。
本稿では,多種多様なアルゴリズムを巧みに分析するRLの包括的調査を行う。
我々は、RLアルゴリズムの選択と実装に関する実践的な洞察を提供し、収束、安定性、探索-探索ジレンマといった共通の課題に対処する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:49:26 GMT)
MonoDINO-DETR: Depth-Enhanced Monocular 3D Object Detection Using a Vision Foundation Model [2.1] 本研究では,視覚変換器(ViT)をベースとした基礎モデルをバックボーンとし,世界的特徴を抽出して深度推定を行う。
検出変換器(DETR)アーキテクチャを統合し、深度推定と物体検出性能を1段階的に改善する。
提案モデルは、KITTIの3Dベンチマークと高標高レース環境から収集したカスタムデータセットの評価により、最近の最先端手法よりも優れている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:37:13 GMT)
Developing Cryptocurrency Trading Strategy Based on Autoencoder-CNN-GANs Algorithms [1.9] 本稿では、機械学習アルゴリズムを用いて財務時系列の予測と分析を行う。
プロセスは、主契約価格データからランダムなノイズ変動をフィルタリングするデノナイジングオートエンコーダから始まる。
1次元畳み込みは、フィルタリングデータの次元性を減少させ、キー情報を抽出する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:22:53 GMT)
Two-stage Risk Control with Application to Ranked Retrieval [1.8] 提案手法は,Learning-then-test (LTT) と共形リスク制御 (CRC) フレームワークに基づく2段階リスク制御手法である。
本稿では,提案手法の理論的保証と,ランク付けされた検索タスクに適した新規な損失関数の設計を行う。
提案手法の有効性は,大規模で広く利用されている2つのデータセットの実験を通して検証する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 11:49:02 GMT)
Contrastive Forward-Forward: A Training Algorithm of Vision Transformer [1.7] Forward-Forwardは、脳内で起きていることに近い新しいトレーニングアルゴリズムだ。
本研究では,このアルゴリズムを,より複雑で現代的なネットワークであるビジョントランスフォーマーに拡張した。
提案アルゴリズムは,精度を最大10%向上し,Vision Transformerの収束速度を5~20倍に向上させる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:41:59 GMT)
Towards Efficient IMC Accelerator Design Through Joint Hardware-Workload Co-optimization [1.6] IMCチップアーキテクチャパラメータを最適化するハードウェア-ワークロード最適化フレームワークを提案する。
VGG16, ResNet18, AlexNet, MobileNetV3の36%, 36%, 20%, 69%のエネルギー待ち時間スコアが達成された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:24:13 GMT)
Actor Critic with Experience Replay-based automatic treatment planning for prostate cancer intensity modulated radiotherapy [1.6] 既存のモデルは大規模で高品質なデータセットを必要とし、普遍的な適用性に欠ける。
我々は、効率的な訓練、広範囲な適用性、および敵対的攻撃に対する自動治療計画のためのポリシーベースのDRLエージェントを開発した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:09:40 GMT)
Left-Deep Join Order Selection with Higher-Order Unconstrained Binary Optimization on Quantum Computers [1.6] 結合順序最適化は、クエリ最適化の最も重要な問題の一つである。
結合次数最適化のための3つの新しい量子最適化アルゴリズムを提案する。
我々は、結合順序選択のための古典的アルゴリズムと量子的アルゴリズムの間に重要な理論的接続を設定した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:00:36 GMT)
Analyzing the factors that are involved in length of inpatient stay at the hospital for diabetes patients [1.5] 新型コロナウイルスの感染拡大に伴う糖尿病患者の急増に伴う懸念について検討した。
本研究の目的は,糖尿病患者の入院期間に影響を与える因子を定量化する予測モデルを構築することである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:26:46 GMT)
Semantic Communication based on Generative AI: A New Approach to Image Compression and Edge Optimization [1.5] この論文は、最適化された画像圧縮とエッジネットワークリソース割り当てのための意味コミュニケーションと生成モデルを統合する。
通信インフラは、帯域幅効率とレイテンシーの大幅な改善の恩恵を受けることができる。
その結果、生成AIとセマンティックコミュニケーションを組み合わせて、より効率的なセマンティックゴール指向のコミュニケーションネットワークを構築する可能性を実証した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:48:31 GMT)
Transformer-Based Vector Font Classification Using Different Font Formats: TrueType versus PostScript [1.2] 変換器を用いたベクトルグラフィックスの深層学習において,アウトラインに基づくフォント表現がTrueTypeのアウトラインよりも優れていることを示す。
その結果,情報集約はトランスフォーマーによるベクトルグラフィックスの深層学習において重要であり,言語モデルのトークン化やビットマップによる画像認識モデルのパッチ分割においても重要であることが示唆された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:16:27 GMT)
Is Long Context All You Need? Leveraging LLM's Extended Context for NL2SQL [1.2] 大きな言語モデル(LLM)は、さまざまな自然言語処理タスクにまたがる印象的な機能を示している。
この意味的曖昧な問題に対する一つのアプローチは、より十分な文脈情報を提供することである。
長いコンテキストLLMは堅牢であり、拡張されたコンテキスト情報では失われないことを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:00:46 GMT)
Advancing MRI Reconstruction: A Systematic Review of Deep Learning and Compressed Sensing Integration [1.2] 長期の取得は、患者の不快感、モーションアーティファクト、リアルタイムアプリケーションの制限につながる可能性がある。
深層学習(DL)はMRI再建のための強力なツールである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:38:16 GMT)
Unelicitable Backdoors in Language Models via Cryptographic Transformer Circuits [1.1] トランスモデルに新しいバックドアのクラスを導入する。
無効性は、ディフェンダーがバックドアをトリガーすることを防ぐため、デプロイ前に適切に評価することは不可能である。
我々は, 暗号技術を用いることで, 新規な構築が不必要であるだけでなく, 良好な堅牢性を有することを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:22:37 GMT)
Leveraging Stable Diffusion for Monocular Depth Estimation via Image Semantic Encoding [1.0] 視覚的特徴から直接文脈情報を抽出する画像に基づくセマンティック埋め込みを提案する。
提案手法は,屋外シーンの処理におけるCLIP埋め込みの欠点に対処しながら,最先端モデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:37:22 GMT)
Data-Driven Mispronunciation Pattern Discovery for Robust Speech Recognition [1.0] 誤発音パターンを自動的に検出する2つのデータ駆動手法を提案する。
非ネイティブな電話機をアテンションマップを使ってネイティブな電話機と整列させることで、ネイティブな英語データセットにおける音声認識の5.7%の改善を実現した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:41:43 GMT)
Generating crossmodal gene expression from cancer histopathology improves multimodal AI predictions [1.0] デジタル病理組織学から合成されたゲノム表現は,がんの診断と生存リスクを高い精度で予測する。
PathoGenコードは、GitHubを通じて研究コミュニティによってオープンに利用することができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:28:30 GMT)
A Quantum Algorithm for Assessing Node Importance in the st-Connectivity Attack [0.9] 分散セキュリティの問題は、しばしばグラフに自然にマッピングされる。
協調ゲーム理論は、ノード中心性のニュアンスで柔軟な概念を作成するために使われてきた。
この研究は、ターゲット接続を維持するノードの重要性を近似するための量子的アプローチを記述する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:40:52 GMT)
Enhancing Field-Oriented Control of Electric Drives with Tiny Neural Network Optimized for Micro-controllers [0.8] 本稿では、永久磁石同期モータ(PMSM)のフィールド指向制御(FOC)に統合された小型フィードフォワードニューラルネットワークTinyFCを紹介する。
マイクロコントローラの計算およびメモリ制約に適合しながら、FOC性能を向上させるために、軽量な1400のパラメータであるTinyFCが開発された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:16:51 GMT)
Explainable AI for Sentiment Analysis of Human Metapneumovirus (HMPV) Using XLNet [0.8] 2024年、中国でHMPV(Human Metapneumovirus)が流行した。
本稿では、ソーシャルメディアデータを分析することで、感情分析がHMPVに対する公衆の反応の理解を高める方法について考察する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:41:23 GMT)
Efficient Source-Free Time-Series Adaptation via Parameter Subspace Disentanglement [0.8] 我々は、効率的なソースフリードメイン適応(SFDA)のためのフレームワークを提案する。
提案手法は,ソースモデル作成およびターゲット側適応のための改良されたパラダイムを導入する。
我々は,本フレームワークが様々なSFDA法と互換性があり,計算効率が高いことを実証した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:45:14 GMT)
FlexCloud: Direct, Modular Georeferencing and Drift-Correction of Point Cloud Maps [0.7] SLAMから生成された点クラウドマップの自動ジオレファレンスとしてFlexCloudを提案する。
我々のアプローチは、生成されたローカルポイントクラウドマップのみを利用して、異なるSLAMメソッドでモジュール的に動作するように設計されています。
我々のアプローチは、モバイルマッピングシステムによって収集されたデータから、一貫したグローバルな参照ポイントクラウドマップの作成を可能にする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 10:56:05 GMT)
Learning Difference-of-Convex Regularizers for Inverse Problems: A Flexible Framework with Theoretical Guarantees [0.7] 効果的な正則化の学習は、不適切な逆問題の解決に不可欠である。
本稿では,より広範な非正規化関数である差分DC関数が経験的性能を向上させることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:40:24 GMT)
Statistics of invertible topological excitations: a framework using operators and many-body Hilbert spaces [0.5] 弦作用素と多体ヒルベルト空間に基づいて、任意の次元の可逆位相励起に任意の統計量の概念を一般化する枠組みを開発する。
本稿では,従来の物理理論と一致した計算結果を得た統計計算プログラムを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:37:17 GMT)
Complex Wavelet Mutual Information Loss: A Multi-Scale Loss Function for Semantic Segmentation [0.5] 複雑なステアブルピラミッドによって分解されたサブバンド画像からの相互情報を利用する新しい損失関数を提案する。
CWMIの損失は、最先端の手法と比較してピクセル単位の精度とトポロジカルな指標の両方で大幅に改善される。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:19:48 GMT)
On the study of frequency control and spectral bias in Wavelet-Based Kolmogorov Arnold networks: A path to physics-informed KANs [0.4] スペクトルバイアス(英: Spectral bias)とは、ニューラルネットワークが初期のトレーニング段階で関数の低周波成分の学習を優先する傾向である。
我々はウェーブレット・コルモゴロフ・アーノルド・ネットワーク(Wav-KAN)のニューラルタンジェント・カーネル(NTK)の固有値を分析し、高周波成分に収束する能力を高める。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:35:12 GMT)
Stability of emergent time periodicity in a few-body interacting system [0.3] リプキン・メシュコフ・グリックモデルを用いて,創発的周期性の開始と回復性について検討した。
浴室が純粋に散逸するチャネルとして振る舞う場合にのみ,安定した時間周期の挙動を示すことができることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 10:15:19 GMT)
CoHiRF: A Scalable and Interpretable Clustering Framework for High-Dimensional Data [0.3] 課題を効果的に解決する新しいクラスタリング手法であるCoHiRF(Consensus Hierarchical Random Feature)を提案する。
CoHiRFは、ランダムな特徴選択を利用してノイズと次元効果を緩和し、縮小された特徴空間にK平均クラスタリングを繰り返し適用し、全一致のコンセンサス基準で結果を組み合わせる。
CoHiRFはK-Meansに匹敵する実行時間で計算効率が高く、大規模データセットにスケーラブルで、SC-SRGF、HDBSCAN、OPTICSといった最先端の手法に対して堅牢な性能を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:38:44 GMT)
Agentic AI: Expanding the Algorithmic Frontier of Creative Problem Solving [0.2] エージェント人工知能(AI)システムは、目標を自律的に追求し、決定を下し、長期間にわたって行動を起こすことができる。
この役割は、既存の法律、経済、マーケティングの枠組みにおいて、アドバイザリの役割から積極的に実行することへの挑戦へと移行する。
我々は、エージェントAIシステムがバインディング契約に入るか、新しいソリューションを生成する場合、責任帰属、知的財産権所有、インフォームド・コンセントのギャップを強調します。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:14:59 GMT)
Learning Compact and Robust Representations for Anomaly Detection [0.2] 本稿では,3つの重要な特性を強制する異常検出のための対照的な前文タスクを提案する。
これらの特性は協調して、異常検出のためのより堅牢で差別的な特徴空間を確保する。
提案手法は,NT-Xentの約12倍,Rot-SupConの約7倍のコンバージェンスを実現し,性能が向上した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:00:19 GMT)
Oscillations Make Neural Networks Robust to Quantization [0.2] 量子化アウェアトレーニング(QAT)における振動は,STE(Straight-Through Estimator)によって引き起こされる望ましくない人工物であることを示す。
量子化を改善するために振動を誘導する新しい正則化法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:39:58 GMT)
Exploration and Practice of Improving Programming Ability for the Undergraduates Majoring in Computer Science [0.2] 本稿では,プログラミング能力の向上の必要性と重要性を概説する。
学生のプログラミング能力を向上させるための探索と実践について論じる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:17:38 GMT)
Model-Free Predictive Control: Introductory Algebraic Calculations, and a Comparison with HEOL and ANNs [0.1] モデルフリー予測制御は、定数係数の線形微分方程式によって、ここで再構成される。
これは、ハミルトン・ヤコビ・ベルマン方程式である動的プログラミングとポントリャーギンの最大原理を置き換えるものである。
最近のANNアーキテクチャによる2つのタンクシステムの識別は、完全なモデリングとそれに対応する機械学習メカニズムが、制御においても、より一般的にも、AIにおいても必ずしも必要ではないことを示しているかもしれない。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:23:34 GMT)
Lessons for GenAI Literacy From a Field Study of Human-GenAI Augmentation in the Workplace [0.1] 本研究では、製品開発、ソフトウェアエンジニアリング、デジタルコンテンツ作成という3つの機能にまたがるGenAIの使用を比較した。
発見は、GenAIの使用とユーザのコンピューティング知識のレベルにおいて、幅広いばらつきを示している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:26:31 GMT)
Towards a complete classification of holographic entropy inequalities [0.1] ホログラフィックエントロピーの不等式、縮尺写像、部分立方体の間の試行性を利用する。
ホログラフィックエントロピーの不等式の有効性は、縮尺写像の存在によって示唆される。
また、興味深い副生成物、特に、候補量子エントロピー不等式を生成する手順を示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:16:28 GMT)
What is a Digital Twin Anyway? Deriving the Definition for the Built Environment from over 15,000 Scientific Publications [0.0] この研究は、52人の専門家を含む専門家による調査から得られた知見と比較した。
テキスト周波数分析とN-gram解析を用いてDigital Twinsの主要成分を抽出した。
DTコンポーネントの解析により,HPRT(High-Performance Real-Time)DTとLTDS(Long-Term Decision Support)DT(Long-Term Decision Support)DTの2種類のDTタイプが明らかになった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 05:37:39 GMT)
Wave function evolution from source to detection and the measurement [0.0] 波動関数の進化を解明するために,2つのスリットの間に余分な開口スリットを考える。
すべてのスリットが長くて薄いとき、1Dシュレーディンガー方程式は最後の検出まで波動関数の進化を与える。
この関数は振幅と位相情報を持つ実数値であり,波動関数と密接に関連していることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:48:27 GMT)
Uncertainty Quantification of Wind Gust Predictions in the Northeast US: An Evidential Neural Network and Explainable Artificial Intelligence Approach [0.0] 不確実性定量化(UQ)は、予測が信頼できるか、慎重な解釈を必要とするかを識別する。
ガスト予測におけるUQの新しいアプローチとして、顕在性ニューラルネットワーク(ENN)を導入する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:50:11 GMT)
Ultrafast All-Optical Measurement of Squeezed Vacuum in a Lithium Niobate Nanophotonic Circuit [0.0] 我々は、集積フォトニクスにおける量子状態トモグラフィーを実現し、ナノフォトニクス回路における圧縮真空の生成と全光学ウィグナートモグラフィーを実証する。
我々は分散工学を用いてフェムト秒パルスの歪みのない伝播を可能にし、超広帯域動作帯域を実現する。
室温統合プラットフォームにおける全光学超高速量子情報処理を実現するためのコースを図示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:33:30 GMT)
TinyEmo: Scaling down Emotional Reasoning via Metric Projection [0.0] TinyEmoは、感情的推論と分類のための小さなマルチモーダル言語モデルのファミリーである。
TinyEmoは感情の分類と感情の推論を行うことができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:50:55 GMT)
Time evolution of nodes in quantum superposition states [0.0] ノードは伝統的に、確率密度が消える固定点と見なされる。
この研究は、これらのノードが量子重畳状態において時間依存的な振動を示すことを示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:12:15 GMT)
The Societal Response to Potentially Sentient AI [0.0] 現在、AIの知覚に関する公的な懐疑論は高いままである。
AIシステムが進歩し、人間のようなインタラクションに熟練するにつれて、公衆の態度はシフトする可能性がある。
重要な疑問は、AIの知覚に関する公的な信念が専門家の意見から分かれるかどうかである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 10:22:04 GMT)
Structural Dynamics and Strong Correlations in Dynamical Quantum Optical Lattices [0.0] 光学キャビティ内に強く相互作用するボゾン原子を持つ量子多体相の形成について検討した。
我々は、キャビティ内の光と原子衝突との相互作用によって引き起こされる様々な構造相転移を観察する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:03:13 GMT)
Stress Accommodation in Nanoscale Dolan Bridges Designed for Superconducting Qubits [0.0] ジョセフソン接合は、多くの超伝導量子情報デバイスの主要な回路要素である。
ジョセフソン接合の標準的な製法は、ドーラン橋として知られるサブミクロンの吊り橋に依存している。
本研究では,ストレス回復チャネルを組み込んだジョセフソン接合リソグラフィーマスクの設計について述べる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:30:04 GMT)
Stabilization of Kerr-cat qubits with quantum circuit refrigerator [0.0] トンネル接合部における光子支援電子トンネルによるKerr-cat量子ビットのオンチップ冷凍について検討した。
系のQCR誘起脱励起の速度は4桁以上変化することができる。
QCRは、Kerr-cat量子ビットを安定化させる調整可能な散逸源として機能する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 04:55:37 GMT)
Social media polarization during conflict: Insights from an ideological stance dataset on Israel-Palestine Reddit comments [0.0] この研究は、2023年10月から2024年8月までに収集されたイスラエルとパレスチナの紛争に関するRedditのコメント9,969件を分析した。
機械学習、事前訓練された言語モデル、ニューラルネットワーク、迅速なエンジニアリング戦略など、さまざまなアプローチが、これらのスタンスを分類するために採用された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:26:11 GMT)
Sines, Transient, Noise Neural Modeling of Piano Notes [0.0] 3つのサブモジュールはピアノ録音からコンポーネントを学び、ハーモニック、トランジェント、ノイズ信号を生成する。
特異点から、三弦の異なる鍵と畳み込みに基づくネットワークとの結合をエミュレートする。
その結果、モデルがターゲットの部分分布と一致し、スペクトルの上部のエネルギーがより多くの課題をもたらすことを予測した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:18:06 GMT)
Self-Instruct Few-Shot Jailbreaking: Decompose the Attack into Pattern and Behavior Learning [0.0] 近年,大規模言語モデル(LLM)のジェイルブレイクについて,数発の悪意のあるデモが実施されている。
デモレベルの欲求探索を容易にするセルフインストラクトファウショットジェイルブレイク(Self-Instruct-FSJ)を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:30:34 GMT)
Scalable Framework for Classifying AI-Generated Content Across Modalities [0.0] 本稿では,知覚ハッシュ,類似度測定,擬似ラベル処理を統合したスケーラブルなフレームワークを提案する。
Defactify4データセットの総合評価は、テキストおよび画像分類タスクにおける競合性能を示す。
これらの結果は、生成AIが進化を続けるにつれて、現実世界のアプリケーションに対するフレームワークの可能性を強調している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:28:40 GMT)
SatMamba: Development of Foundation Models for Remote Sensing Imagery Using State Space Models [0.0] ファンデーションモデルは、自己教師付きアルゴリズムを通じて、大規模なラベル付けされていないデータセットで事前訓練されたディープラーニングモデルを指す。
リモートセンシングのための様々な基礎モデルが開発されている。
本研究では、マスク付きオートエンコーダとステートスペースモデルを組み合わせた新しい事前トレーニングフレームワークであるSatMambaを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:07:21 GMT)
Quantum interference with time-frequency modes and multiple-photons generated by a silicon nitride microresonator [0.0] 6種類の混合時間-周波数モードで, 励起光を用いたバイパルタイトガウス粒子サンプリングを行った。
同時に高スペクトル純度の窒化ケイ素マイクロ共振器から2つの時間ビンに非縮退二モードスクイーズを発生させる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:41:28 GMT)
Predictive modeling and anomaly detection in large-scale web portals through the CAWAL framework [0.0] 本研究では,CAWALフレームワークを通じて収集されたセッションおよびページビューデータを用いて,高度な予測モデリングとWeb利用マイニングアプリケーションにおける異常検出を行う手法を提案する。
その結果,ユーザの行動やシステムパフォーマンスの指標を詳細に把握し,大規模Webポータルの効率性,信頼性,スケーラビリティを向上させるための信頼性の高いソリューションであることが示唆された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:21:59 GMT)
Point-LN: A Lightweight Framework for Efficient Point Cloud Classification Using Non-Parametric Positional Encoding [0.0] 我々は,効率的な3Dポイントクラウド分類のための軽量フレームワークであるPoint-LNを紹介した。
Point-LNはFarthest Point Sampling (FPS)、k-Nearest Neighbors (k-NN)、非学習可能な位置符号化など、必須の非パラメトリックコンポーネントを統合している。
このハイブリッドアーキテクチャは計算コストの低減と高速な推論速度を保証するため、リアルタイムおよびリソース制約のあるアプリケーションにはPoint-LNが理想的である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 18:04:12 GMT)
On Multiquantum Bits, Segre Embeddings and Coxeter Chambers [0.0] 我々は、超キューブ構造とコクセター室分解による絡み合いの幾何学的構造を描写し、キュービットモジュライ空間の体系的研究を開発する。
このことは、量子エラー補正スキームに直接的な意味を持つ埋め込みの階層構造を明らかにする。
タイプ A$ のコクセター群の下でのセグレ多様体の対称性は、反射群のレンズを通して量子状態や誤差を解析することができる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:39:28 GMT)
Non-self-adjoint Dirac operators on graphs [0.0] 有限距離グラフ上でのディラック作用素の非自己随伴実現について検討する。
我々はその固有値に対してバーマン・シュウィンガーの原理の変種を導出する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:07:12 GMT)
Monitoring the energy of a cavity by observing the emission of a repeatedly excited qubit [0.0] 本研究では, 共振器崩壊率の4桁が分散結合率とクビット放出率の双方よりも桁違いに小さいため, 単発撮影と数追跡に到達する実験を行う。
量子ジャンプは、光子が1度にキャビティを離れると、キュービット蛍光を通して光子数を監視することで観測される。
本手法は, ボソニック符号やクォーディットの量子誤り訂正プロトコルに適用できる。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:43:21 GMT)
Methodology for a Statistical Analysis of Influencing Factors on 3D Object Detection Performance [0.0] 自動走行では、オブジェクトの局所化と分類によって環境を知覚する上で、オブジェクト検出は必須のタスクである。
ほとんどのオブジェクト検出アルゴリズムは、優れた性能を得るためにディープラーニングに基づいている。
本稿では,LiDARとカメラを用いた3Dオブジェクト検出器の検知性能に及ぼす対象物や環境に関連する諸要因の影響を解析するための第一種手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:05:35 GMT)
MarketSenseAI 2.0: Enhancing Stock Analysis through LLM Agents [0.0] LLM(Large Language Models)の急速な技術拡張にともなうMarketSenseAIの最近の進歩について紹介する。
MarketSenseAIはSECの提出書類と決算報告を処理し、さまざまな機関報告の体系的な処理を通じてマクロ経済分析を強化している。
2年間にわたるS&P100株の実証評価(2023-2024)によると、マーケットセンスAIは73.5%に比べて125.9%の累積リターンを達成している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 12:33:23 GMT)
Machine Learning Models for Reinforced Concrete Pipes Condition Prediction: The State-of-the-Art Using Artificial Neural Networks and Multiple Linear Regression in a Wisconsin Case Study [0.0] 合衆国の老朽化した下水道インフラは210万キロメートルをカバーしており、構造的な問題に直面している。
年間約75,000の衛生用下水道が深刻な経済、環境、公衆衛生の危険を生じさせている。
本研究は,機械学習モデルを用いて下水道パイプラインの状態の予測精度を向上させることを目的とする。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:16:08 GMT)
Looking into the Future of Health-Care Services: Can Life-Like Agents Change the Future of Health-Care Services? [0.0] 調査によると、情報検索者の40%未満は、オンライン情報によって健康に関する決定が下されたことを示唆している。
基本的なコンピュータスキル、インタラクションの欠如、ほとんどの検索エンジンと社会問題で対面する顔のない複数のWebサイトを検索すると、私たちは前述の問題を克服する特殊なライフライクなエージェントを開発しました。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:11:49 GMT)
Limits of Large Language Models in Debating Humans [0.0] 大規模言語モデル(LLM)を用いて議論するエージェントの限界を厳格に検証する。
エージェントは、人間よりも議論のトピックに溶け込み、集中し、すべてのプレイヤーの生産性を向上させることができることがわかった。
しかし、人間は他の人間ほど説得力も自信も持たず、私たちが収集した人間とエージェントの行動の指標は、互いに大きく異なっています。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:54:28 GMT)
Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images [0.0] 肺炎は小児の病気や死亡の主な原因であり、早期かつ正確な検出の必要性を暗示している。
胸部X線画像を用いた小児の肺炎検出のための軽量アンサンブルモデルを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:54:20 GMT)
IoT-enabled Drowsiness Driver Safety Alert System with Real-Time Monitoring Using Integrated Sensors Technology [0.0] 本稿では,統合センサ技術を用いたリアルタイムモニタリングによるモノのインターネット(IoT)対応ドライバ安全アラートシステムの構築を目的とする。
このシステムは、アルコールの存在を検知し、運転者の目の動きを監視するためのアルコールセンサーと赤外線センサーを備える。
赤外線センサーからのデータは、リアルタイムの監視とアラートのためにBluetooth経由で携帯電話に送信される。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 07:11:13 GMT)
Impacto de Treinamento em Programação Competitiva no Ensino Médio: Resultados e Desafios [0.0] 本稿では,ブラジル情報科学オリンピアド(OBI)への参加を中心に,効果的なプログラミング教育手法の開発をめざして,現在進行中の研究について述べる。
フェデラル・インスティチュート(Federal Institute)や州立学校(State School)の学生たちによるトレーニングは、コンピューティングへの関心を高める手段として、プログラミング・トレーニング・プログラムの重要性を実証している。
研究の次のステップは、より多くのトレーニングサイクルを実行し、競技で得られた結果を分析することである。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 02:48:51 GMT)
Holistic Robust Data-Driven Decisions [0.0] 実際には、オーバーフィッティングは単一の原因ではなく、同時にいくつかの要因によって引き起こされる。
ここでは, (i) 統計的誤差を有限サンプルデータ処理の結果とする, (ii) データノイズ, (ii) データポイントが有限精度でのみ測定された場合に発生する, (iii) データのごく一部が完全に破損するデータ不特定性という,3つの過適合な情報源について考察する。
我々は、そのような全体的保護を保証し、計算可能な新しいデータ駆動型定式化を設計する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:15:13 GMT)
Hamiltonian simulation of minimal holographic sparsified SYK model [0.0] N$Majoranaフェルミオンと$q=4$(量子相互作用)によるスパーシファイドSYKモデルのハミルトンシミュレーション
この複雑さは、100個の論理量子ビット未満と約106ドルのゲートで、このモデルで利点を享受し、リアルタイムのダイナミクスをスクランブル時間までシミュレートできることを意味している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 08:51:28 GMT)
Generating Sets of Stochastic Matrices [0.0] 行列の文脈で可視性を形式化するフレームワークを開発する。
次元 2 と 3 に対して可分要素を指定して生成集合を構成する。
生成集合から半群全体の生成に必要な因子の上限を与える。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:08:29 GMT)
Functional role of synchronization: A mean-field control perspective [0.0] 本研究の目的は、相互接続された力学系の集合的挙動を理解する方法を開発することである。
ピーター・ケインズ(Peter Caines)が開拓した平均フィールドゲーム(英語版)の分野は、これらのトピックに対処するのに非常に適している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:08:56 GMT)
Fast Vision Mamba: Pooling Spatial Dimensions for Accelerated Processing [0.0] 選択的スキャン(Mamba)を備えた状態空間モデル(SSM)は、効率的な視覚モデルに適応している。
Fast Vision Mamba (FastVim)は、モデル性能を維持しながら、Vision Mambaモデルの繰り返しステップ数を減少させる。
実験では,タスクのスループットが劇的に向上した最先端の性能を実証した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:35:20 GMT)
FGATT: A Robust Framework for Wireless Data Imputation Using Fuzzy Graph Attention Networks and Transformer Encoders [0.0] Fuzzy Graph Attention Network (FGAT)とTransformer Encoderは、堅牢で正確なデータ計算を行うために使用される。
モデルは、データの整合性が不可欠である無線センサネットワークやIoT環境のアプリケーションに適しています。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:44:21 GMT)
Extended analysis of distillation and purification of squeezed states of light [0.0] スクイーズ蒸留および精製に関する拡張理論解析を行った。
入力状態に影響を及ぼす損失を抑えることはできないことを示す。
2光子減量によるスクイーズ蒸留は、ゴッテマン・キタエフ・プレスキル(GKP)状態を生成する特定の方法と密接に関連していることがわかった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:50:38 GMT)
Evolutionary Power-Aware Routing in VANETs using Monte-Carlo Simulation [0.0] 本研究は、車載ネットワークにおけるAODVルーティングプロトコルの消費電力削減を最適化問題として扱う。
進化的アルゴリズムと並列モンテカルロシミュレーションを用いてエネルギー効率の良いAODV構成を探索する自動手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 14:29:31 GMT)
Evaluation of End-to-End Continuous Spanish Lipreading in Different Data Conditions [0.0] 本稿では,スペイン語の自動連続唇読解法における顕著な進歩について述べる。
異なる性質の2つのコーパスで実験を行い、最先端の結果を得た。
厳密な誤り解析を行い、自動システムの学習に影響を与える様々な要因について検討した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:48:20 GMT)
Ethics of generative AI and manipulation: a design-oriented research agenda [0.0] ジェネレーティブAIは、大規模な自動化された効果的な操作を可能にする。
特定の操作リスクは、いまだに不適切に調査されている。
この記事では、操作の概念的、経験的、設計的な側面を含む質問について概説する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:18:59 GMT)
Enhancing Link Prediction with Fuzzy Graph Attention Networks and Dynamic Negative Sampling [0.0] Fuzzy Graph Attention Networks (FGAT) は、動的負サンプリングのためにファジィ粗集合を統合する新しいアプローチである。
FNSはファジィ類似性に基づいて高品質な負エッジを選択し、トレーニング効率を向上させる。
2つの研究コラボレーションネットワークの実験は、FGATの優れたリンク予測精度を示し、最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:42:03 GMT)
Electronic Structure Theory with Molecular Point Group Symmetries on Quantum Annealers [0.0] 我々はXia-Bian-Kais (XBK) 法を実装し,電子構造理論計算の効率を向上させる。
従来の研究よりも広い対称性適応符号化(SAE)を提供することで、我々は以前報告されたものよりも大きな分子をシミュレートすることができる。
XBK法へのSAEの適用により、空間のサイズが指数関数的に減少し、問題のサイズとよく一致する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:30:57 GMT)
Efficient Hamiltonian encoding algorithms for extracting quantum control mechanism as interfering pathway amplitudes in the Dyson series [0.0] ハミルトニアン符号化は、制御量子系を管理する力学の背後にあるメカニズムを明らかにするための方法論である。
本稿では,経路クラスの振幅を計算する2つの新しい符号化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:33:13 GMT)
Efficient Brain Tumor Classification with Lightweight CNN Architecture: A Novel Approach [0.0] MRI画像を用いた脳腫瘍の分類は、早期かつ正確な検出が患者の予後に大きな影響を及ぼす医療診断において重要である。
近年のディープラーニング(DL)の進歩は将来性を示しているが、多くのモデルは精度と計算効率のバランスに苦慮している。
本稿では,分離可能な畳み込みと圧縮・励振ブロック(SEブロック)を統合した新しいモデルアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:06:42 GMT)
Doubly Robust Monte Carlo Tree Search [0.0] 我々はDouubly Robust Monte Carlo Tree Search (DR-MCTS)を紹介し、Douubly Robust Off-policy EstimationをMonte Carlo Tree Search (MCTS)に統合する新しいアルゴリズムを提案する。
提案手法は, MCTSロールアウトとDR推定を組み合わせることで, 条件下での非バイアス性および分散低減の理論的保証を提供する。
Tic-Tac-Toeと部分的に観測可能なVirtualHome環境における実証評価は、DR-MCTSが標準MCTSよりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 19:32:46 GMT)
Discovering Directly-Follows Graph Model for Acyclic Processes [0.0] 本稿では,非循環プロセスのための非循環DFGモデルを発見するための新しいプロセス探索アルゴリズムを提案する。
モデルは、イベントログを非循環DFGモデルを提供する部分に分割し、サイクルの形成を避けながらそれらをマージすることによって発見される。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:39:28 GMT)
Deep learning model for ECG reconstruction reveals the information content of ECG leads [0.0] 本研究は心電図(ECG)の欠損した鉛を再構成するためのU-netアーキテクチャに基づくディープラーニングモデルを提案する。
公開されているデータセットを使用して、モデルは12リードのECGデータを再生するように訓練された。
その結果,各ECGリードの情報内容と,その相互関係を定量化するモデルの有効性が明らかになった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 21:06:07 GMT)
Deep Horseshoe Gaussian Processes [0.0] 直交指数核を持つディープ・ガウス過程に基づく新しい単純前処理であるディープ・ホースシュー・ガウス過程(Deep Horseshoe Gaussian process)を紹介する。
ランダムな設計による非パラメトリック回帰では、関連する後続分布が2次損失の点で未知の真の回帰曲線を復元することを示す。
収束速度は、回帰関数の滑らかさと組成の両面に同時に適応する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:32:45 GMT)
Convolutional Fourier Analysis Network (CFAN): A Unified Time-Frequency Approach for ECG Classification [0.0] 機械学習は心電図(ECG)などの生体医学的信号の分類に変化をもたらした
我々は,(1)不整脈検出,(2)身元認識,(3)無呼吸検出の3つのECG分類タスクを評価した。
我々は、FANとCNNを統合した畳み込みフーリエ解析ネットワーク(CFAN)を開発した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 17:30:26 GMT)
Contextual Morphogenesis in Large Language Models: A Novel Approach to Self-Organizing Token Representations [0.0] 文脈形態形成は、学習された文脈依存に基づいてトークン境界を再構成する自己組織化機構を確立する。
経験的評価は、動的に調整されたトークン化が表現安定性を維持しながら複雑度を低下させることを示す。
異なる言語コーパス間の比較評価は、適応的トークン化は解釈可能性を維持しつつ、文脈的手がかりとの整合性を改善することを示唆している。
構造安定性の精製と予測性能における文脈形態形成の有効性は、従来のトークン化法に代わるものとしての生存性を強調している。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 03:50:46 GMT)
Context-Preserving Tensorial Reconfiguration in Large Language Model Training [0.0] CPTR(Context-Preservingial Reconfiguration)は、構造的因子化と適応的収縮による重みテンソルの動的複雑さを実現する。
実証的な評価は、CPTRが拡張配列間のコヒーレンス保持を改善することを示している。
性能比較の結果,CPTR強化モデルでは計算効率が向上し,メモリ消費が減少した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:55:19 GMT)
Comparative Analysis of Pooling Mechanisms in LLMs: A Sentiment Analysis Perspective [0.0] BERTやGPTのようなトランスフォーマーベースのモデルは、トークンレベルの埋め込みを文レベルの表現に集約するためにプール層に依存している。
Mean、Max、Weighted Sumといった一般的なプール機構は、この集約プロセスにおいて重要な役割を果たす。
本稿では,これらのプール機構が文レベル感情分析の文脈における2つの著名なLCMファミリー(BERTとGPT)に与える影響について検討する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 22:39:04 GMT)
Comparative Analysis of Community Detection Algorithms on the SNAP Social Circles Dataset [0.0] SNAP Social Circlesデータセットに適用されたいくつかの顕著なコミュニティ検出アルゴリズムの比較分析を行った。
モジュラリティ,正規化カット比,シルエットスコア,コンパクト性,分離性など,様々な指標に基づいて,これらのアルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 23:38:09 GMT)
Challenges and Innovations in LLM-Powered Fake News Detection: A Synthesis of Approaches and Future Directions [0.0] 偽ニュースの拡散は ソーシャルメディアのプラットフォームを通じて 一般大衆の信頼に 重大なリスクをもたらします
最近の研究には、マルチモーダルフレームワークにおける大規模言語モデルによる検出の強化が含まれている。
このレビューでは、ダイナミックなソーシャルメディアトレンド、リアルタイム、クロスプラットフォーム検出機能への適応性の重大なギャップがさらに明らかになった。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 06:56:17 GMT)
Binned Spectral Power Loss for Improved Prediction of Chaotic Systems [0.0] 本稿では,BSP(Binned Spectral Power)ロス(BSP)と呼ばれるスペクトルバイアスを緩和する新しい手法を提案する。
ポイントワイドなミスフィットに焦点を当てた従来の損失とは異なり、BSPの損失は、異なるスケールにわたるエネルギー分布の偏差を明示的に罰する。
以上の結果から,BSP損失は神経予測モデルの安定性とスペクトル精度を著しく向上させることが示された。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 15:58:21 GMT)
Bayesian Flow Is All You Need to Sample Out-of-Distribution Chemical Spaces [0.0] ベイジアンフローネットワークは,高品質なアウト・オブ・ディストリビューション・サンプルを生成することができることを示す。
本研究では,半自己回帰型トレーニング/サンプリング手法を導入し,モデル性能の向上と最先端モデルの超越を支援する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 09:14:08 GMT)
An Equivalence Between Compatibility and Deterministic Underlying States in Quantum Mechanics [0.0] 本稿では、シナリオにおけるすべての観測可能量のペア互換性と、そのシナリオに対する決定論的基礎状態モデルを作成する能力との等価性を確立する。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 20:26:37 GMT)
A logifold structure on measure space [0.0] 我々は,データセットを理解するための局所的・局所的・測度論的アプローチを開発する。
本研究では,ファジィ領域の探索やデータ分類問題の精度向上に有効であることを示す。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 01:44:16 GMT)
A global analysis of data breaches from 2004 to 2024 [0.0] 本研究は,産業,地域,攻撃方法,およびMicrosoft Power BIを用いた2004年から2024年までのデータ漏洩傾向の包括的分析を行う。
この研究は、政策立案者や組織リーダーがデータ洞察に基づいて情報的な決定を下すのを助けるために、データの可視化技術から利益を得ようとしている。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 13:30:52 GMT)
A framework for river connectivity classification using temporal image processing and attention based neural networks [0.0] 気候変動に伴う極度の気象現象は、河川や河川の接続に変化をもたらす可能性がある。
伝統的な河川流量計は展開に費用がかかり、大きな川体に限られている。
トレイルカメラ方式は低コストで容易に展開でき、時間単位のデータを集める代替手段である。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 16:00:28 GMT)
A Hybrid Random Forest and CNN Framework for Tile-Wise Oil-Water Classification in Hyperspectral Images [0.0] ハイパースペクトル画像(HSI)における油-水分類のための新しいハイブリッドランダムフォレストと畳み込みニューラルネットワーク(CNN)フレームワークを提案する。
空間的コンテキストを保存するという課題に対処するため、画像は小さな重複しないタイルに分割され、トレーニング、検証、テストの基礎となった。
Random Forestは、XGBoost、Attention-Based U-Net、HybridSNといった、ピクセル単位での分類において、優れた性能を示した。
論文参考訳(メタデータ) (Sat, 01 Feb 2025 00:13:06 GMT)