Fugu-MT: arxivの論文翻訳(概要)

Universal Item Tokenization for Transferable Generative Recommendation [89.4]
本稿では、転送可能な生成レコメンデーションのためのユニバーサルアイテムトークン化手法であるUTGRecを提案する。木構造コードブックを考案することにより、コンテンツ表現をアイテムトークン化のための対応するコードに識別する。生のコンテンツ再構成には、アイテムテキストとイメージを離散表現から再構成するために、デュアルライトウェイトデコーダを用いる。協調的知識統合においては,共起的アイテムが類似していると仮定し,共起的アライメントと再構築を通じて協調的信号を統合する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:07:49 GMT)
TerDiT: Ternary Diffusion Models with Transformers [88.0]
TerDiTは、低ビット拡散変圧器モデルのための最初の量子化対応トレーニングスキームである。モデルサイズは600Mから4.2B、画像解像度は256$times$256から512$times$512である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:46:47 GMT)
UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding [84.9]
離散表現と連続表現の組み合わせによって視覚入力を符号化する自動回帰生成モデルUniTokenを導入する。我々の統合ビジュアルエンコーディングフレームワークは、多次元情報を提供しながら、高レベルのセマンティクスと低レベルの詳細の両方をキャプチャする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:20:49 GMT)
AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.5]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:35:44 GMT)
Retro-Search: Exploring Untaken Paths for Deeper and Efficient Reasoning [84.3]
MCTSにインスパイアされた検索アルゴリズムであるRetro-Searchを導入し,大規模モデルから高品質な推論経路を抽出する。 Retro-Searchは、より良い、しかし短いトレースを見つけるための推論パスをふりかえりに修正する。当社のアプローチでは,モデルが独自のRetro-Search-edトレースに基づいて微調整される自己改善と,弱いから強い改善の2つのユースケースを実現しています。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:23:27 GMT)
Data Scaling Laws for End-to-End Autonomous Driving [83.9]
16時間から8192時間に及ぶ内部駆動データセット上での簡易エンド・ツー・エンド駆動アーキテクチャの性能評価を行った。具体的には、目標の性能向上を達成するために、どの程度のトレーニングデータが必要かを調査する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:23:48 GMT)
MLLM-as-a-Judge for Image Safety without Human Labeling [81.2]
AIGCの時代には、多くの画像生成モデルは有害なコンテンツを生成できる。確立された安全ルールに基づいて、このような安全でない画像を特定することが不可欠である。既存のアプローチでは、人間のラベル付きデータセットを使った微調整MLLMが一般的である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:30:18 GMT)
PRISM: Probabilistic Representation for Integrated Shape Modeling and Generation [79.5]
PRISMは、カテゴリー拡散モデルと統計的形状モデル(SSM)とガウス混合モデル(GMM)を統合した3次元形状生成の新しいアプローチである本手法では,構成SSMを用いて部分レベルの幾何学的変動をキャプチャし,GMMを用いて連続空間における部分意味を表現する。提案手法は,パートレベルの操作の品質と制御性の両方において,従来の手法よりも優れていた。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:48:08 GMT)
Pre-training Generative Recommender with Multi-Identifier Item Tokenization [78.9]
本稿では, MTGRecを用いて, 生成Recommender事前学習のためのトークンシーケンスデータを拡張する手法を提案する。このアプローチには、マルチアイデンティティーアイテムトークン化とカリキュラムレコメンデータ事前トレーニングという、2つの重要なイノベーションがあります。 3つの公開ベンチマークデータセットに対する大規模な実験は、MTGRecが従来の推奨基準と生成推奨基準の両方を大きく上回っていることを示している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:03:03 GMT)
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning [68.5]
本稿では,エージェントモデルと3次元駆動タスクを対応づける総合的視覚言語データセットを提案する。提案手法は,代替行動を検討する人間ドライバーと同様,潜在的なシナリオとその成果を評価することによって意思決定を促進する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:54:21 GMT)
A Classification View on Meta Learning Bandits [67.4]
我々は,固定された盗賊の収集のために,解釈可能かつ高速な探索計画のメタラーニングを行うために,本来の分類図を用いている。これは$O (lambda-2 C_lambda) log2 (MH)$で、$M$は$mathbbM$、$lambda$は盗賊上の分離パラメータ、$C_lambda (mathbbM)$は新しい分類係数である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:25:21 GMT)
Re-thinking Temporal Search for Long-Form Video Understanding [67.1]
現在の時間探索法は、Longvideobenchサブセットで2.1%の時間F1スコアしか達成していない。画像中の視覚探索に触発されて,空間探索として高価な時間探索を再構成する軽量な時間探索フレームワークT*を提案する。大規模な実験により、T*と既存の方法を統合することにより、SOTAの長めのビデオ理解が大幅に向上することが示された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:10:42 GMT)
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets [65.4]
本稿では,専門家が設計した報奨関数と,小規模データセットから学習した報奨関数を調整・微調整する新しいGFlowNet法を提案する。提案手法は,大規模テキスト条件による画像拡散モデルである安定拡散の高速かつ多様かつ事前保存的な微調整を実現する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 19:31:55 GMT)
VSLAM-LAB: A Comprehensive Framework for Visual SLAM Methods and Datasets [64.6]
VSLAM-LABは、VSLAMシステムの開発、評価、デプロイを効率化する統合フレームワークである。 VSLAMアルゴリズムのシームレスなコンパイルと構成、データセットの自動ダウンロードと前処理、標準化された実験設計、実行、評価を可能にする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:02:19 GMT)
AutoScale: Scale-Aware Data Mixing for Pre-Training LLMs [61.1]
より小さなスケールで良好に機能するデータ混合物は、大規模なスケールではその利点を保たない可能性があることを示す。 2段階のスケール対応データ合成フレームワークであるAutoScaleを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:22:39 GMT)
AVadCLIP: Audio-Visual Collaboration for Robust Video Anomaly Detection [57.6]
本稿では,ロバストなビデオ異常検出に音声と視覚の協調を利用する,弱教師付きフレームワークを提案する。本フレームワークは,複数のベンチマークにおいて優れた性能を示し,オーディオ統合により異常検出精度が大幅に向上する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:59:16 GMT)
HyperVQ: MLR-based Vector Quantization in Hyperbolic Space [56.4]
一般的な解決策は、VQ変分オートエンコーダ(VQVAE)にベクトル量子化(VQ)を採用することである。本稿では,双曲型多相ロジスティック回帰(MLR)問題としてVQを定式化する新しい手法であるHyperVQを紹介する。本実験は,HyperVQが従来のVQに比較し,識別性能を上回りながら,生成・再構成タスクに適合することを示した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:04:36 GMT)
Cramer-Rao Bounds for Laplacian Matrix Estimation [56.1]
クラマー・ラオ境界(CRB)の閉形式行列式をラプラシア行列推定に特化して導出した。電力系統における(i)トポロジー同定,(ii)拡散モデルにおけるグラフフィルタ同定,(iii)ラプラシアン制約下でのガウスマルコフ確率場における精度行列推定の3つの代表的応用について示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:28:31 GMT)
MagicTime: Time-lapse Video Generation Models as Metamorphic Simulators [56.0]
textbfChronoMagicと呼ばれるタイムラプスビデオテキストデータセットを作成し、メタモルフィックビデオ生成能力を解放する。実験は、高品質でダイナミックなメタモルフィックビデオを生成するためにMagicTimeの優位性と有効性を示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:43:41 GMT)
MASS: MoErging through Adaptive Subspace Selection [55.0]
モデルマージの新しいアプローチであるMASS(MoErging through Adaptive Subspace Selection)を提案する。 MASSはタスクごとに最も健全な特異なコンポーネントのみを格納し、それらを共有モデルにマージする。我々は,8,14,20タスクのベンチマークに対して,ViT-B-16,ViT-B-32,ViT-L-14を用いて,CLIPに基づく画像分類のMASSを評価する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:49:52 GMT)
INRetouch: Context Aware Implicit Neural Representation for Photography Retouching [54.2]
本稿では、プロの編集から前後のイメージペアを通して学習する新しいリタッチ転送手法を提案する。我々は,画像の内容とコンテキストに基づいて,適応的に編集を適用することを学習する文脈認識型インプシットニューラル表現を開発した。提案手法は,参照編集から暗黙的な変換を抽出し,それらを新しい画像に適用する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:25:45 GMT)
Multiple Heads are Better than One: Mixture of Modality Knowledge Experts for Entity Representation Learning [51.8]
高品質なマルチモーダル実体表現を学習することは、マルチモーダル知識グラフ(MMKG)表現学習の重要な目標である。既存の手法は、エレガントなエンティティワイドマルチモーダル融合戦略の構築に重点を置いている。適応型マルチモーダルな実体表現を学習するために,Mixture of Modality Knowledge Expert (MoMoK) を用いた新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:08:09 GMT)
Long-horizon Visual Instruction Generation with Logic and Attribute Self-reflection [50.2]
LIGERはLong-Horizon Instruction GEnerationのための最初のフレームワークである。前のステップの履歴的なプロンプトと視覚的記憶によって、各ステップのドラフトイメージを生成する。 LIGERは、さまざまな画像編集ツールを使用して、間違った属性、ロジックエラー、オブジェクトの冗長性、ドラフトイメージのアイデンティティの不整合などのエラーを修正している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:45:51 GMT)
Better Rates for Random Task Orderings in Continual Linear Models [50.1]
以前見られたタスクの損失を、$k$の繰り返しの後、忘れること、すなわち、分析する。実現可能な最小二乗の設定において、新しい最期境界を開発し、それらを連続学習に応用する。タスクを繰り返しないランダム化だけで、十分に長いタスクで破滅的な忘れを防げることが、初めて証明された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:39:45 GMT)
DynClean: Training Dynamics-based Label Cleaning for Distantly-Supervised Named Entity Recognition [49.5]
本稿では,トレーニングの進行に伴うモデルの挙動を生かした,トレーニングダイナミクスに基づくラベルクリーニング手法を提案する。また,遠隔ラベルの誤りを見つけるための自動しきい値推定手法も導入する。提案手法は,4つのデータセットにまたがる高度なDS-NER手法よりも優れている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:54:42 GMT)
Gating is Weighting: Understanding Gated Linear Attention through In-context Learning [48.9]
GLA(Gated Linear Attention)アーキテクチャには、MambaやRWKVといった競合モデルが含まれている。重み付きプレコンディショニング・グラディエント・ディフレクション(WPGD)アルゴリズムの一般クラスを多層GLAで実装可能であることを示す。穏やかな条件下では、一意の WPGD 解に対応する大域的最小値の存在と一意性(スケーリングまで)を確立する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 00:37:36 GMT)
Studying the Impact of Early Test Termination Due to Assertion Failure on Code Coverage and Spectrum-based Fault Localization [48.2]
本研究は,アサーション障害による早期検査終了に関する最初の実証的研究である。 6つのオープンソースプロジェクトの207バージョンを調査した。以上の結果から,早期検査終了は,コードカバレッジとスペクトルに基づく障害局所化の有効性の両方を損なうことが示唆された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:14:09 GMT)
Steering off Course: Reliability Challenges in Steering Language Models [46.3]
本研究では,DoLa,関数ベクトル,タスクベクトルの3つの顕著なステアリング手法を体系的に検討する。従来の研究とは対照的に、1.5Bから70Bのパラメータを持つ14の家系に属する36のモデルをテストする。本実験では, ステアリング性能が向上し, 劣化しないモデルが多数存在するため, ステアリング手法の有効性に大きなばらつきが認められた。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 22:19:46 GMT)
ZeroED: Hybrid Zero-shot Error Detection through Large Language Model Reasoning [45.4]
我々は,新しいゼロショット誤り検出フレームワークZeroEDを提案する。 ZeroEDは、特徴表現、エラーラベリング、データ構築のトレーニング、検出器トレーニングの4つのステップで運用されている。実験の結果、ZeroEDはF1スコアの最大30%改善と最大90%のトークンコスト削減で最先端の手法を大幅に上回ることがわかった。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:28:41 GMT)
Experimental evidence of quantum interferences in CO-H$_2$ rotational energy transfer at room temperature [45.0]
CO-H$衝突対数系の理論的に予測された量子干渉は、室温で初めて実験的に観測され、理論と実験の間の良好な一致が観察された。結果は、ポテンシャルエネルギー表面の異方性部分を検証するための貴重なベンチマークを提供し、光解離領域のような熱物性環境におけるCO排出の理論モデリングを支援する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:05:31 GMT)
CATP-LLM: Empowering Large Language Models for Cost-Aware Tool Planning [43.1]
コスト対応ツール計画のためのLCM(CATP-LLM)フレームワークを提案する。 LLMは、効率的な並行ツールの実行とコスト削減のために、複数のブランチの非逐次計画を生成するために、LLMを強化するためのツール計画言語を組み込んでいる。 OpenCATPの実験では、Llama2-7Bを背骨として使用しても、CATP-LLMはGPT-4より優れていることが示されている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:06:17 GMT)
The Point, the Vision and the Text: Does Point Cloud Boost Spatial Reasoning of Large Language Models? [42.4]
3次元大規模言語モデル (LLM) は点雲における空間情報を利用して3次元空間推論を行う。いくつかの有望な結果にもかかわらず、3次元空間的推論における点雲の役割は未解明のままである。 textitDoesポイントクラウドは、3D LLMの空間的推論能力を大幅に向上させるのか?
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:38:48 GMT)
Investigating the Scaling Effect of Instruction Templates for Training Multimodal Language Model [42.0]
マルチモーダル言語モデル(MLM)のトレーニングアプローチは、命令テンプレートの影響を見落としている。本研究では,15K以上のユニークな命令テンプレートを生成可能なプログラム型命令テンプレートを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:45:49 GMT)
Constructing the Truth: Text Mining and Linguistic Networks in Public Hearings of Case 03 of the Special Jurisdiction for Peace (JEP) [41.9]
コロンビアにおけるいわゆる偽陽性に焦点をあてた、平和のための特別司法裁判所(JEP)の判例03は、コロンビアの武力紛争の中でも最も悲惨な出来事の1つである。本稿では, 自然言語分析と意味共起モデルに基づく革新的な方法論を提案し, 被害者や出演者の公聴会に存在する物語パターンを探索し, 体系化し, 視覚化する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:04:27 GMT)
Deliberate Planning of 3D Bin Packing on Packing Configuration Trees [40.5]
オンライン3D Bin Packing Problem (3D-BPP) は産業自動化に広く応用されている。我々は,新しい階層表現,パッキング構成木(PCT)の学習を通じて,オンライン3D-BPPの実用性を高めることを提案する。 PCTは、ディープ強化学習(DRL)に基づくパッキングポリシー学習を支援するビンパッキングの状況と行動空間について、本格的な記述である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:07:10 GMT)
Domain Generalization for Face Anti-spoofing via Content-aware Composite Prompt Engineering [38.8]
顔アンチ・スプーフィング(FAS)におけるドメイン一般化は、微妙なスプーフィング手がかりに対するドメイン固有の信号の重大な干渉である。本稿では、インスタンスワイド複合プロンプトを生成するCCPE(Content-Aware Composite Prompt Engineering)を提案する。 CCPEは複数のクロスドメイン実験で有効性を確認し,SOTA(State-of-the-art)の結果を得た。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:00:41 GMT)
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers [36.5]
深度(MoD)の混合は、重要でない層をスキップすることで計算深度を動的に調整する。 MoDアプローチの主な課題は2つある: 1) 重要なレイヤをバイパスする際のパフォーマンス劣化のリスクを回避できるルータとともに、モデル全体をトレーニングする必要があるため、トレーニングコストが高くなる。本稿では,小さなデータセット上でのみルータを微調整し,フルモデルトレーニングに伴う計算オーバーヘッドを大幅に削減するルータチューニングを提案する。第2の課題として、動的深さで注意を配置するMindSkipを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:27:47 GMT)
WildFeedback: Aligning LLMs With In-situ User Interactions And Feedback [36.1]
WildFeedbackは、大規模言語モデル(LLM)との会話中にユーザからのフィードバックをその場で活用して、好みのデータセットを自動的に作成する新しいフレームワークである。実験の結果,WildFeedbackデータセットを微調整したLCMは,ユーザの好みに合わせて大幅に改善されていることがわかった。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:18:53 GMT)
Trust Region Preference Approximation: A simple and stable reinforcement learning algorithm for LLM reasoning [36.0]
本稿では,信頼領域選好近似(TRPA)アルゴリズムを提案する。好みに基づくアルゴリズムとして、TRPAは報酬ハッキングの問題を自然に排除する。実験の結果,TRPAは推論タスクの競争性能だけでなく,安定度も高いことがわかった。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:48:26 GMT)
Saliency-driven Dynamic Token Pruning for Large Language Models [32.9]
塩分駆動型動的トケンプルーニング(SDTP) 軽量なサリエンシ駆動予測モジュールは、各トークンの重要度をその隠れ状態で推定するように設計されている。ランキングに基づく最適化手法を提案し,評価スコアと予測重要スコアのランキングばらつきを最小化する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:15:07 GMT)
From Alexnet to Transformers: Measuring the Non-linearity of Deep Neural Networks with Affine Optimal Transport [32.4]
本稿では,DNNの非線形性シグネチャの概念を紹介する。これはディープニューラルネットワークの非線形性を測定するための,理論上初めての音響解である。提案した非線形署名の実用性を明らかにするための実験結果について述べる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:31:38 GMT)
Do We Need Responsible XR? Drawing on Responsible AI to Inform Ethical Research and Practice into XRAI / the Metaverse [32.2]
このポジションペーパーは,CHI 2025 ワークショップ "Everyday AR through AI-in-the-Loop" のために書かれたものだ。これは、HCIがResponsible XRを、Responsible AIと並行して定義する必要があるかどうかを反映している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:37:09 GMT)
Mocap-2-to-3: Lifting 2D Diffusion-Based Pretrained Models for 3D Motion Capture [31.8]
Mocap-2-to-3は複雑な3D動作を2Dポーズに分解する新しいフレームワークである。我々は2次元データを活用し,多様なシナリオにおける3次元運動再構成を向上する。実世界のデータセット上でのモデルの性能を評価する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:54:00 GMT)
VideoAgent2: Enhancing the LLM-Based Agent System for Long-Form Video Understanding by Uncertainty-Aware CoT [31.4]
本稿では,長時間のビデオ解析に適した特別なチェーン・オブ・シント(CoT)プロセスを提案する。我々の不確実性を認識したCoTは、外部ツールからのノイズを効果的に軽減し、より信頼性の高い出力を生み出します。我々は、一般的なコンテキスト取得や特殊なツール設計などの追加モジュールを含むVideoAgent2というシステムで、我々のアプローチを実装している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:03:34 GMT)
CO-Bench: Benchmarking Language Model Agents in Algorithm Search for Combinatorial Optimization [28.2]
LLMベースのエージェントは、ソフトウェア工学や機械学習研究のような分野において大きな注目を集めている。 CO-Benchは、広範囲のドメインと複雑性レベルから引き出された36の現実世界のCO問題のベンチマークスイートである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 00:47:43 GMT)
Exact Unlearning of Finetuning Data via Model Merging at Scale [27.4]
モデルマージに基づく正確なアンラーニング手法であるSIFT-Masksを提案する。最大500台のモデルをマージする4つの設定で、SIFT-Masksは単純なマージよりも精度を5～80%向上します。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:24:29 GMT)
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning [27.3]
実顔画像の基本表現を学習するための自己教師付き事前学習フレームワークを提案する。我々のモデルは、教師付き事前学習、視覚的および顔的自己指導型学習技術よりも優れており、タスク特化SOTA法よりも優れています。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:07:12 GMT)
PolyGuard: A Multilingual Safety Moderation Tool for 17 Languages [27.3]
PolyGUARDは、LLM(Large Language Models)世代を保護するための、最先端の多言語安全モデルである。これまでに17言語にまたがる190万のサンプルを含む、最大規模の多言語安全訓練コーパスで訓練されている。 PolyGUARDPROMPTSは、安全ガードレールの評価のための29Kサンプルを用いた高品質な多言語ベンチマークである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:09:21 GMT)
COHESION: Composite Graph Convolutional Network with Dual-Stage Fusion for Multimodal Recommendation [26.2]
マルチモーダルレコメンデーションにおける2つの重要なプロセスは、モダリティ融合と表現学習である。我々はCOHESIONと呼ばれるマルチモーダルレコメンデーションのための2段融合を用いたCOmposite grapH畳み込みnEtworkを紹介する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:42:49 GMT)
Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form [26.0]
本稿では, 頑健な制約付きMDP (RCMDP) における準最適ポリシーの同定が保証された最初のアルゴリズムを提案する。最適ポリシーは、一連の環境における最悪のシナリオにおける制約を満たしながら累積コストを最小化する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 00:39:54 GMT)
Memetic Search for Green Vehicle Routing Problem with Private Capacitated Refueling Stations [25.6]
本稿では,GVRP-PCAFSを解くために,制約付きツアーセグメンテーション(SCTS)と効率的なローカルサーチ(ELS)を分離した新しいメメティックアルゴリズムMETSを提案する。グローバルサーチでは,SCTS戦略は巨大ツアーを分割して多様なソリューションを生成し,総合的なフィットネス評価機能によって探索プロセスが導かれる。局所探索のために、ESSは一定時間移動評価機構を備えた調整された移動演算子を導入し、大規模溶液近傍の効率的な探索を可能にする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:52:49 GMT)
IMPersona: Evaluating Individual Level LM Impersonation [24.7]
本稿では,特定の個人の書き方や個人の知識を擬人化するためのLM評価フレームワークであるIMPersonaを紹介する。我々は、Llama-3.1-8B-Instructのような、わずかにサイズのオープンソースモデルでさえ、関連するレベルでの偽造能力を達成することを実証した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:57:58 GMT)
Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers [24.2]
コンペティティブ・ポクモン・シングルズ (Competitive Pok'emon Singles, CPS) は、プレイヤーが不完全な情報に基づいて相手を悪用することを学ぶ人気戦略ゲームである。観察者の3人称視点から保存したログからエージェントの1人称視点を再構築するパイプラインを開発する。このデータセットは、入力軌跡のみに基づいて相手に適応するように、大規模なシーケンスモデルをトレーニングするブラックボックスアプローチを可能にする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 07:35:15 GMT)
High Probability Complexity Bounds of Trust-Region Stochastic Sequential Quadratic Programming with Heavy-Tailed Noise [23.7]
本稿では,TR-SSQP(Trust-Region Sequential Quadratic Programming)法を提案する。一階および二階の$epsilon$-stationary点を特定するための高確率複雑性境界を確立する。提案手法は,光尾雑音設定と同一の高確率1次複雑性を実現する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 22:21:16 GMT)
Building LLM Agents by Incorporating Insights from Computer Systems [23.4]
計算機システムからの洞察を取り入れたLCMエージェントの構築を提唱する。フォン・ノイマンアーキテクチャに着想を得て,LLMエージェントシステムのための構造化フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:38:37 GMT)
MCP-Solver: Integrating Language Models with Constraint Programming Systems [23.2]
MCPソルバは、AIシステム統合のオープンソース標準であるModel Context Protocol(MCP)を通じて、シンボル解決器でLarge Language Modelsをブリッジする。我々の実装は制約プログラミング(Minizinc)、命題満足度(PySAT)、SATモジュラー理論(Python Z3)のためのインターフェースを提供する。このシステムは、修正中のモデルの一貫性を保証し、構造化された洗練を可能にするために、反復検証を伴う編集アプローチを採用している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:39:04 GMT)
WeiDetect: Weibull Distribution-Based Defense against Poisoning Attacks in Federated Learning for Network Intrusion Detection Systems [23.0]
WeiDetectは、悪意のある参加者を検知するFLベースのNIDSのための2段階のサーバーサイド防御機構である。多様な攻撃環境におけるアプローチの有効性を評価する実験を行った。 WeDetectは最先端の防衛アプローチよりも優れています。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:31:24 GMT)
The detection and rectification for identity-switch based on unfalsified control [21.8]
マルチオブジェクト追跡(MOT)の目的は、ビデオで検出されたオブジェクトを継続的に追跡し、識別することである。現在、多目的追跡のためのほとんどの手法は、動き情報をモデル化し、外見情報と組み合わせてオブジェクトを判断・追跡している。本稿では,多目的追跡におけるIDスウィッチ問題に対処するために,アンファルシフィケート制御を用いる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:11:14 GMT)
Targetless LiDAR-Camera Calibration with Anchored 3D Gaussians [21.1]
任意のシーンからセンサポーズとシーン形状を協調的に最適化するLiDARカメラキャリブレーション手法を提案する。 2つの実世界の自律走行データセットに関する広範な実験により,本手法の有効性を検証した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:00:01 GMT)
New Intent Discovery with Pre-training and Contrastive Learning [20.6]
新しい意図発見は、ユーザ発話から新しい意図カテゴリーを明らかにして、サポート対象クラスのセットを拡張することを目的としている。既存のアプローチは通常、大量のラベル付き発話に依存する。新たな意図発見のための2つの重要な研究課題に対する新しい解決策を提供する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:25:50 GMT)
Compression Laws for Large Language Models [20.6]
言語モデル(LLM)の圧縮法則を導入する。我々は、1000ドル以上の実験により、構造化モデル圧縮がLLMに与える影響を実証的に検討した。以上の結果から, クロスエントロピー損失は圧縮比に比例して2次的に増加することが示唆された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:39:34 GMT)
Achieving ${O}(ε^{-1.5})$ Complexity in Hessian/Jacobian-free Stochastic Bilevel Optimization [19.3]
我々は,非精度な定常点勾配二値最適化のために,$O(epsilon1.5)$サンプル複雑性を実現する方法を示す。私たちが知る限り、これは非精度な定常点勾配最適化のために$O(epsilon1.5)$サンプル複雑性を持つ最初のヘッセン/ヤコビアン自由法である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:07:23 GMT)
Formula-Supervised Sound Event Detection: Pre-Training Without Real Data [18.9]
本研究では,環境音解析モデルの事前学習のための新しい定式駆動型教師あり学習(F)フレームワークを提案する。具体的には、詳細な手順を概説し、音響事象検出(SED)の有効性を評価する。フォーミュラ-SEDを用いた大規模事前学習はモデルの精度を大幅に向上させ,訓練を加速させることを示した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:47:26 GMT)
FRAP: Faithful and Realistic Text-to-Image Generation with Adaptive Prompt Weighting [18.7]
FRAPは、トーケン毎のプロンプト重量を適応的に調整することに基づく、単純で効果的なアプローチである。 FRAPは、複雑なデータセットからのプロンプトに対して、プロンプト画像のアライメントが著しく高い画像を生成する。また, FRAPとLPMの即時書き直しを併用して, 劣化した即時画像のアライメントを復元する方法について検討した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:52:06 GMT)
UFT: Unifying Fine-Tuning of SFT and RLHF/DPO/UNA through a Generalized Implicit Reward Function [18.5]
SFTとアライメントを単一のトレーニングステージに統合するUnified Fine-Tuning(UFT)を導入する。実験結果から,UFTは命令調整データのみにおいて,SFTよりも優れていることが示された。命令チューニングデータとアライメントデータを組み合わせることで、UFTは破滅的な忘れを効果的に防止する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:40:21 GMT)
Prompting open-source and commercial language models for grammatical error correction of English learner text [18.5]
大規模言語モデル(LLM)は、流動的で文法的なテキストを生成するよう促すことができる。確立したベンチマークデータセット上で, 文法的誤り訂正(GEC)におけるLLMの性能評価を行った。いくつかのオープンソースモデルは、最小限の編集ベンチマークで商用モデルよりも優れており、いくつかの設定ではゼロショットプロンプトは、少数ショットプロンプトと同じくらい競争力がある。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:25:39 GMT)
DyCON: Dynamic Uncertainty-aware Consistency and Contrastive Learning for Semi-supervised Medical Image Segmentation [18.1]
動的不確実性を考慮した一貫性とコントラスト学習フレームワークであるDyCONを提案する。 UnCLは、各ボクセルの一貫性損失への寄与を動的に重み付けすることで、グローバルな一貫性を強制する。 FeCLは、二重焦点機構を導入することにより、不均衡領域における局所的特徴識別を強化する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:50:22 GMT)
MedM-VL: What Makes a Good Medical LVLM? [17.9]
従来の浅層モデルとタスク固有のモデルは、臨床実践に必要な複雑さとスケーラビリティに対処する上で、ますます制限されている。大型言語モデル(LLM)の出現は、医療用大規模視覚言語モデル(LVLM)の開発を促した。 2次元医用画像解析用MedM-VL-2Dと3次元CT用MedM-VL-CT-Chestの2種類をリリースする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:44:46 GMT)
Using Language Models to Decipher the Motivation Behind Human Behaviors [17.9]
大規模な言語モデルへの様々なプロンプトによって、人間の行動を完全に引き出すことができることを示す。そして、どの行動を引き出すのにどのプロンプトが必要なのかを分析することで、人間の行動の背後にあるモチベーションを推測することができる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:30:46 GMT)
Splits! A Flexible Dataset for Evaluating a Model's Demographic Social Inference [17.7]
我々は、集団理論と呼ばれる新しいタスクを定義し、システムでは、人口集団間で表現を区別する理論を書かなければならない。我々はSplits!の生のコーパスと評価スクリプトをリリースし、研究者がどのようにメソッドを推論するかを判断するのに役立つ。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:17:07 GMT)
Mitigating the Human-Robot Domain Discrepancy in Visual Pre-training for Robotic Manipulation [16.8]
そこで本研究では,容易に利用可能な人間ロボットのビデオデータを利用して,ドメインギャップを埋める新しい適応パラダイムを提案する。提案手法では,人間とロボットのビデオのセマンティクスを整列させるために,人間ロボットのアライメント損失を用いて,事前学習したモデルをパラメータ効率よくロボット領域に適応させる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:46:32 GMT)
StyleRec: A Benchmark Dataset for Prompt Recovery in Writing Style Transformation [16.7]
本稿では,スタイル転送とリフレージングのためのプロンプトの再構築に焦点をあてた,ユニークなプロンプト回復タスクについて検討する。 LLMアシストで作成されたデータセットを導入し、複数の技術による品質保証を行う。この結果から, 単発・微調整で最高の結果が得られたが, 従来の文類似度指標の欠陥が強調された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:02:28 GMT)
NCL-CIR: Noise-aware Contrastive Learning for Composed Image Retrieval [16.5]
Composed Image Retrieval (CIR)は、画像と修正テキストを組み合わせてターゲットをピンポイントするマルチモーダルクエリを用いて、ターゲット画像の検索を試みる。ペアは、不正確な修正テキスト、品質の低いターゲット画像、アノテーションエラーなどの問題により、部分的にあるいは完全に一致しないことが多い。重み補償ブロック (WCB) と雑音対フィルタブロック (NFB) の2つの主要な構成要素からなるCIR (NCL-CIR) のためのノイズ対応コントラスト学習法を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:27:23 GMT)
Tool-as-Interface: Learning Robot Policies from Human Tool Usage through Imitation Learning [16.4]
ツール使用時の知識を人間からロボットに伝達する枠組みを提案する。我々は,ミートボールスクーピング,パンフリップ,ワインボトルのバランス,その他の複雑なタスクなど,現実世界のさまざまなタスクに対するアプローチを検証する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:40:19 GMT)
Towards Efficient Risk-Sensitive Policy Gradient: An Iteration Complexity Analysis [16.3]
強化学習(Reinforcement Learning, RL)は、様々なアプリケーションで例外的な性能を示している。リスクに敏感な政策勾配法は、期待されるリターンとリスク対策の両方を取り入れ、より堅牢な政策を得る能力について検討されてきた。本稿では,リスクに敏感なポリシー勾配法に対して,指数関数的効用関数を持つREINFORCEアルゴリズムに着目し,厳密な反復複雑性解析を行う。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:22:06 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1]
本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。計算効率,近似誤差,プライバシ保護,解釈可能性の4つの主な課題について考察した。異なるDAタスクでSVアプリケーションを開発するための,モジュール的でオープンソースなフレームワークであるSVBenchを実装している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:04:37 GMT)
Empirical Coordination of Quantum Correlations [16.0]
量子相関に対する経験的協調の概念を導入する。これにより、経験的コーディネーションは量子システムにとって自然かつ操作的に意味のあるフレームワークとなる。本稿では,量子非局所ゲームの実装とシミュレーションに関する新たな知見を提供する方法について論じる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 19:39:47 GMT)
AROMA: Autonomous Rank-one Matrix Adaptation [15.9]
段階的にゼロに減少するトレーニング可能なパラメータがほとんどないランクワンのコンポーネントを反復的に構築することで、レイヤ固有の更新を構築するフレームワークであるAROMAを紹介します。 AROMA は低ランク適応 (LoRA) や AdaLoRA と比較してパラメータを著しく削減する一方で、自然言語理解や常識推論タスクにおいて優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:14:43 GMT)
EE-MLLM: A Data-Efficient and Compute-Efficient Multimodal Large Language Model [15.4]
視覚と言語相互作用の現在のアプローチは、自己注意に基づく方法と、相互注意に基づく方法の2つのカテゴリに分類される。 MLLMの自己注意機構を複合注意機構に変更した。 EE-MLLMは、限られたトレーニングデータでFlamingoを著しく上回り、H800 GPUでプリフィル時間を79msに短縮する。本稿では,EE-MLLM-Fという学習不要な変種について述べる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:52:08 GMT)
Decoding Recommendation Behaviors of In-Context Learning LLMs Through Gradient Descent [15.4]
本稿では,理論モデル LLM-ICL Recommendation Equivalent Gradient Descent Model (LRGD) を提案する。 LLMにおけるICL推論プロセスは、その二重モデルのトレーニング手順と一致し、二重モデルの試験出力に相当するトークン予測を生成する。さらに実演効率を向上し,性能崩壊を防止し,長期適応性を確保するため,実演における2段階最適化プロセスを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:36:45 GMT)
Weighted Averaged Stochastic Gradient Descent: Asymptotic Normality and Optimality [15.4]
Gradient Descent (SGD) は統計および機械学習において最も一般的なアルゴリズムの1つである。異なる環境でのSGDの収束を加速するために、様々な平均化スキームが提案されている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:42:12 GMT)
A Self-Supervised Paradigm for Data-Efficient Medical Foundation Model Pre-training: V-information Optimization Framework [15.4]
大規模データセット上での自己教師付き事前トレーニング医療基盤モデルは、例外的なパフォーマンスを示す。近年の研究では、データ効率のよい学習手法を導入して、この共通パラダイムに挑戦している。本稿では, 基本モデルの自己教師型事前学習にV情報を導入し, サンプル選択の理論的基礎を提供する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:50:25 GMT)
Toward LLM-Agent-Based Modeling of Transportation Systems: A Conceptual Framework [15.1]
交通システムのための汎用LLMエージェントに基づくモデリングフレームワークを提案する。我々の概念的枠組み設計は、人間の旅行者の意思決定と相互作用の過程と特性を忠実に再現する。 LLMエージェントに基づくモデリングフレームワークのさらなる改良が必要であるが、本手法は輸送システムのモデリングとシミュレーションを改善する可能性を秘めていると信じている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:58:40 GMT)
Selective Masking Adversarial Attack on Automatic Speech Recognition Systems [14.7]
本稿では,SMA攻撃(Selective Masking Adversarial attack)を提案する。実験により、SMA攻撃は、二重ソースシナリオにおいて、効果的で音声の敵対的な例を生成できることが示されている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 07:30:08 GMT)
Towards Domain Adaptive Neural Contextual Bandits [14.3]
文脈的包帯に対する第1次一般領域適応法を提案する。提案手法は,ソースドメインからのフィードバックを収集することで,対象ドメインの帯域幅モデルを学習する。実験結果から,本手法は実世界のデータセット上での最先端の文脈的帯域幅アルゴリズムよりも優れていることが示された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:23:33 GMT)
IRIS: LLM-Assisted Static Analysis for Detecting Security Vulnerabilities [14.2]
大規模な言語モデル(LLM)は印象的なコード生成機能を示しているが、そのような脆弱性を検出するためにコードに対して複雑な推論を行うことはできない。我々は,LLMと静的解析を体系的に組み合わせ,セキュリティ脆弱性検出のための全体リポジトリ推論を行うニューロシンボリックアプローチであるIRISを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:46:59 GMT)
Planning Safety Trajectories with Dual-Phase, Physics-Informed, and Transportation Knowledge-Driven Large Language Models [14.0]
LetsPiは、安全で人間らしい軌道計画のための、物理インフォームドで二相的、知識駆動のフレームワークである。幻覚を防ぎ、不確実性を最小化するために、このハイブリッドフレームワークは、物理学的インフォームド・ソーシャル・フォース・ダイナミクスによるLarge Language Model (LLM)推論を統合している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:34:33 GMT)
Enhance Then Search: An Augmentation-Search Strategy with Foundation Models for Cross-Domain Few-Shot Object Detection [14.0]
広範囲なデータセットで事前訓練されたファンデーションモデルは、クロスドメインの少数ショットオブジェクト検出タスクにおいて顕著に機能している。画像ベースデータ拡張手法とグリッドベースサブドメイン探索戦略の統合は,これらの基盤モデルの性能を著しく向上させることがわかった。本研究は,データスカース環境における視覚言語モデルの実践的展開を著しく推し進めるものである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:30:35 GMT)
All-vortex nonlinear Compton scattering in a polarized laser field [13.6]
強い偏光レーザー場における全渦非線形コンプトン散乱の過程を理論的に研究した。我々は、軌道角運動量(OAM)とスピン角運動量の交換を研究することができるプロセスの形式論を発展させる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:38:45 GMT)
End-to-end Feature Selection Approach for Learning Skinny Trees [13.4]
木アンサンブルにおける特徴選択のための最適化に基づく新しい手法を提案する。 Skinny Treesは、ツリーアンサンブルの機能選択のためのエンドツーエンドツールキットである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:10:53 GMT)
STQS: A Unified System Architecture for Spatial Temporal Quantum Sensing [13.4]
分散量子センシングのための統合システムアーキテクチャSTQSを提案する。包括的なゲートベースのフレームワークを用いることで、量子センシングスキームの設計空間を体系的に探求する。本稿では,参照状態と検出状態を比較し,信頼度を割り当てる新しい距離ベースメトリクスを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:10:49 GMT)
Active Learning with a Noisy Annotator [13.3]
ノイズ対応アクティブサンプリング(NAS)と呼ばれる新しいフレームワークを提案する。 NASは、ノイズの多い代表者の選択により発見されていない領域を特定し、これらの領域の再サンプリングを可能にする。 NASは、様々なノイズタイプとレートで標準的なアクティブラーニング手法の性能を著しく向上させる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:27:27 GMT)
Predicting Census Survey Response Rates With Parsimonious Additive Models and Structured Interactions [12.8]
本研究では, フレキシブルで解釈可能な非パラメトリックモデル群を用いて, アンケート応答率を予測することの問題点を考察する。この研究は、米国国勢調査局(US Census Bureau)の有名なROAMアプリケーションによって動機付けられている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:27:46 GMT)
Towards Super-polynomial Quantum Speedup of Equivariant Quantum Algorithms with SU($d$) Symmetry [12.7]
本稿では,多数の機械学習タスクに適した等価畳み込み量子アルゴリズムの枠組みを提案する。これにより、置換量子コンピューティング(PQC)という量子計算の自然なモデルを強化し、より強力なモデル、PQC+を定義することができます。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 04:25:29 GMT)
LoopGen: Training-Free Loopable Music Generation [12.7]
我々は,非自己回帰モデル (MAGNeT) を開発し,終端生成時の音声の開始に係わるトークンを円形パターンで生成する。ループのシーム周辺のトークンパープレキシティを計算し, ループ遷移の整合性を評価し, 55%の改善を観察した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:34:23 GMT)
Multi-Scale Diffusion: Enhancing Spatial Layout in High-Resolution Panoramic Image Generation [12.6]
本稿では,パノラマ画像生成フレームワークを複数の解像度レベルまで拡張する最適化フレームワークであるMulti-Scale Diffusion(MSD)を紹介する。本手法は勾配降下法を利用して低解像度画像の構造情報を高解像度出力に組み込む。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:44:55 GMT)
Knowledge Distillation for Federated Learning: a Practical Guide [12.2]
フェデレートラーニング(FL)は、センシティブな生データを集中的に収集することなく、ディープラーニングモデルのトレーニングを可能にする。 FLの最もよく使われるアルゴリズムは、パラメータに基づくスキーム(例えば、フェデレート平均化)で、よく知られた限界を持つ。正規知識蒸留(KD)はパラメータ吸収FLアルゴリズムの弱点を解き、緩和することができる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:27:29 GMT)
Spatial-Geometry Enhanced 3D Dynamic Snake Convolutional Neural Network for Hyperspectral Image Classification [12.2]
ディープニューラルネットワークは、ハイパースペクトル画像分類においていくつかの課題に直面している。これには、複雑でスパースな地上オブジェクト分布、小さなクラスタ構造、細長いマルチブランチ機能が含まれる。本稿では,改良された3次元DenseNetモデルに基づく空間幾何学拡張3次元ダイナミックスネークネットワーク(SG-DSCNet)を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:21:39 GMT)
SoK: Decoding the Enigma of Encrypted Network Traffic Classifiers [12.0]
TLS 1.3のような現代の暗号化プロトコルは、従来のネットワークトラフィック分類(NTC)手法に挑戦している。本稿では,MLに基づくNTC研究を包括的に分析し,その設計選択の分類とベンチマークスイートを開発する。時代遅れのデータセット、設計選択の監視、そして根拠のない仮定の結果に広く依存していることを示します。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:04:52 GMT)
Can SGD Select Good Fishermen? Local Convergence under Self-Selection Biases and Beyond [11.9]
我々は,$doperator次元の自己選択バイアスを持つ線形回帰器を$k$で推定する問題を再検討する。我々の主な結果は、この問題に対する$namepoly(d,k,1/varepsilon) + kO(k)$ time algorithmである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:59:12 GMT)
Foundation Models for Software Engineering of Cyber-Physical Systems: the Road Ahead [11.9]
ファンデーションモデル(FM)は、様々なソフトウェアエンジニアリング活動をサポートするためにますます使われています。 CPS(Cyber-Physical Systems)のソフトウェア工学への応用も増加している。そこで本研究では,CPSソフトウェア工学の様々なフェーズにFMを統合するための研究ロードマップを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:42:02 GMT)
Generative Large Language Models Trained for Detecting Errors in Radiology Reports [11.9]
このデータセットは、特定のプロンプトを用いてGPT-4によって生成された1,656の合成胸部放射線学報告を含む。 Llama-3、GPT-4、BiomedBERTなどいくつかのモデルはゼロショットプロンプト、少数ショットプロンプト、微調整戦略を用いて改良された。ゼロショットプロンプトを用いることで、微調整のLlama-3-70B-Instructモデルは、否定誤差0.769、左右誤差0.772、間隔変更エラー0.750、転写エラー0.828、全体の0.780というF1スコアで最高のパフォーマンスを達成した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:02:36 GMT)
DeepProtein: Deep Learning Library and Benchmark for Protein Sequence Learning [11.8]
DeepProteinは、タンパク質関連のタスクに適した、ユーザフレンドリーなディープラーニングライブラリだ。これにより、最先端のディープラーニングモデルでタンパク質データをシームレスに処理できる。一連の微調整されたProt-T5ベースのモデルであるDeepProt-T5は、4つのベンチマークタスクで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:40:55 GMT)
BrainMRDiff: A Diffusion Model for Anatomically Consistent Brain MRI Synthesis [11.7]
BrainMRDiffは、脳MRIのための新しいトポロジー保存、解剖学的誘導拡散モデルである。これを実現するために,腫瘍+構造凝集(TSA)とトポロジーガイド解剖保存(TGAP)の2つの重要なモジュールを紹介した。 TSAは様々な解剖学的構造と腫瘍情報を統合し、拡散過程の包括的な条件付け機構を形成する。 BrainMRDiffは既存のベースラインを超え、BraTS-AGデータセットで23.33%、BraTS-Metデータセットで33.33%のパフォーマンス改善を実現している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:16:50 GMT)
M2IV: Towards Efficient and Fine-grained Multimodal In-Context Learning in Large Vision-Language Models [11.5]
学習可能なtextbfVectors を LVLM に直接組み込んだ明示的なデモンストレーションを代用する textbfM2IV を提案する。 M2IVは、トレーニングを通じて堅牢なクロスモーダル忠実度と微粒なセマンティック蒸留を実現する。実験の結果、M2IVはVanilla ICLと先行表現工学のアプローチを超越していることがわかった。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 22:02:21 GMT)
REFORMER: A ChatGPT-Driven Data Synthesis Framework Elevating Text-to-SQL Models [11.5]
本稿では,ChatGPTの能力を活用するフレームワークであるREFORMERを提案する。我々のデータ拡張アプローチは、マスク付き質問を埋めて新しい質問を生成する「検索と編集」手法に基づいている。以上の結果から,ChatGPTが生成したパラフレージング質問が元のデータを増やすのに有効であることが確認された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:27:37 GMT)
Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.4]
大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。 LLMは、しばしばSQL生成に焦点を合わせ、現実世界の会話クエリの複雑さを無視している。 LLMの問合せ分類とSQL生成能力を評価するためのテストスイートMMを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:47:45 GMT)
Privacy in Fine-tuning Large Language Models: Attacks, Defenses, and Future Directions [11.3]
細調整された大規模言語モデル(LLM)は、様々な領域で最先端のパフォーマンスを達成することができる。本稿では、微調整LDMに関連するプライバシー問題に関する包括的調査を行う。メンバーシップ推論、データ抽出、バックドア攻撃など、さまざまなプライバシ攻撃に対する脆弱性を強調します。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:28:21 GMT)
SAM2MOT: A Novel Paradigm of Multi-Object Tracking by Segmentation [11.2]
Segment Anything 2 (SAM2)は、セグメンテーションを使った堅牢な単一オブジェクト追跡を可能にする。本稿では,新しいトラッカーであるSAM2MOTを提案する。 Tracking by DetectionやTracking by Queryとは異なり、SAM2MOTはセグメンテーションマスクから直接トラッキングボックスを生成する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:32:08 GMT)
Dissipation-Driven Transition of Particles from Dispersive to Flat Bands [11.2]
結合の散逸は分散バンドから平らなバンドへと粒子を駆動できることを示す。これにより、オープン量子系におけるFB物理学の新たな道が開かれる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 07:53:15 GMT)
SnapPix: Efficient-Coding--Inspired In-Sensor Compression for Edge Vision [10.9]
エッジ上でのエネルギー効率のよい画像取得は、リモートセンシングアプリケーションの実現に不可欠である。本稿では,センサ内部のアナログ領域に生画素を圧縮するSnapPixというセンサアルゴリズムを共設計したシステムを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:24:45 GMT)
Opening the black box of deep learning: Validating the statistical association between explainable artificial intelligence (XAI) and clinical domain knowledge in fundus image-based glaucoma diagnosis [10.9]
緑内障分類における深層学習モデルの意思決定過程を明らかにする。 VGG-11、ResNet-18、DeiT-Tiny、Swin Transformer-Tinyを含む4つのディープニューラルネットワークを開発した。我々の研究は、ディープニューラルネットワーク臨床医間の決定論理の収束の証拠を提供する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:57:34 GMT)
Unsupervised Domain Adaptation with Dynamic Clustering and Contrastive Refinement for Gait Recognition [10.8]
歩行認識は、個人の歩行パターンを分析することによって、遠くにいる個人を識別する新興技術である。近年,クラスタリングに基づく教師なし領域適応手法を用いて,教師なし歩行認識について検討している。本稿では,クラスタリングとモデルトレーニングにおけるノイズの多い擬似ラベルの影響を低減することを目的とした,GaitD CCRと呼ばれる新しいモデルを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:37:04 GMT)
LUIEO: A Lightweight Model for Integrating Underwater Image Enhancement and Object Detection [10.6]
本稿では,水中画像の強調と検出精度の向上を同時に行うマルチタスク学習手法を提案する。統合モデルは、情報通信と異なるタスク間の共有を動的に調整することを可能にする。数値実験により,提案モデルが視覚性能,物体検出精度,検出効率を満足できることを示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:37:41 GMT)
AdaptRec: A Self-Adaptive Framework for Sequential Recommendations with Large Language Models [10.5]
AdaptRecは、明示的な協調シグナルを組み込むことで、シーケンシャルなレコメンデーションのためにLarge Language Modelsを活用する、自己適応型のフラムワークである。本研究では,その行動系列を自然言語に変換するユーザコンテキスト適応型レコメンデーション・プロンプトを開発し,これらの情報をレコメンデーション・プロセスに明示的に統合する。 AdaptRecの優れたパフォーマンスを示す実験では、HitRatio@1スコアの7.13%、18.16%、10.41%が現実世界のデータセットで大幅に改善されている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 00:30:50 GMT)
Verification with Transparency: The TrendFact Benchmark for Auditable Fact-Checking via Natural Language Explanation [10.4]
我々は、構造化された自然言語の説明を取り入れた最初の中国のファクトチェックベンチマークであるTrendFactを紹介する。 TrendFactは、トレンドのソーシャルメディアコンテンツとプロのファクトチェックレポジトリから、7,643の慎重にキュレートされたサンプルで構成されている。数値的推論、論理的推論、常識的検証など、様々な推論形式をサポートしている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:15:55 GMT)
Divergent Paths: Separating Homophilic and Heterophilic Learning for Enhanced Graph-level Representations [10.4]
グラフ畳み込みネットワーク(GCN)は、よく似たノードが接続するが、しばしば異種グラフでは失敗するホモフィリーを示すグラフに最適化されている。本研究は,ノードのカテゴリIDが利用可能なグラフの解析を行い,カテゴリ内およびカテゴリ間コンポーネントをホモフィリーおよびヘテロフィリーの具体化として識別する。この問題を軽減するために、カテゴリ内畳み込み(IntraNet)とカテゴリ間ハイパスグラフ畳み込み(InterNet)を組み合わせることで、カテゴリ内およびインターカテゴリ間の部品を別々に学習する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:31:10 GMT)
DataRec: A Python Library for Standardized and Reproducible Data Management in Recommender Systems [10.3]
DataRecはPythonベースのライブラリで、レコメンデーションシステム研究におけるデータ処理の統合と合理化を目的としている。データセットの準備、データバージョニング、シームレスな統合のためのルーチンを提供することで、DataRecは方法論の標準化を促進する。私たちの貢献は、より広範なレコメンデーションシステムコミュニティにおいて、公正で、ベンチマークを行い、実験結果に対する信頼性を高めます。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 07:29:36 GMT)
Tight Regret Bounds for Fixed-Price Bilateral Trade [10.2]
ほぼ最適の$widetildeTheta(T2/3)$ tight bound for $textsfGlobal Budget Balance$ fixed-price mechanism with two-bit/one-bit feedback。相関値/逆値の場合、$Omega(T3/4)$ lower bound for $textsfGlobal Budget Balance$ fixed-price mechanism with two-bit/one-bit feedback。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:56:42 GMT)
Advancing Egocentric Video Question Answering with Multimodal Large Language Models [10.1]
Egocentric Video Question Answering (QA)は、長期的時間的推論、個人的視点、頻繁なカメラムーブメントのような特殊な課題を扱うモデルを必要とする。本稿では,QaEgo4Dv2上で,プロプライエタリおよびオープンソースのMultimodal Large Language Models(MLLM)を体系的に評価する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:58:23 GMT)
PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures [10.0]
実PIMシステム上でグラフニューラルネットワークを高速化する,効率的なMLライブラリであるPyGimを紹介する。我々は、計算集約型およびメモリ集約型カーネルをプロセッサ中心およびメモリ中心のシステムで実行するハイブリッドGNN実行を提供する。我々は、1992年のPIMコアを持つ実世界のPIMシステム上で、新しいGNNモデルを用いてPyGimを広範囲に評価し、Intel Xeonの最先端CPUを平均3.04倍に上回っていることを示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:54:52 GMT)
Event Ellipsometer: Event-based Mueller-Matrix Video Imaging [9.9]
本研究では,動的シーンのためのMumeller-matrixビデオを取得するためのEvent Ellipsometerを紹介する。楕円形状画像形成モデル,キャリブレーション法,楕円形状画像再構成法を開発した。 Event Ellipsometer が 30fps の Mueller-matrix ビデオ撮影を可能にし,楕円体計測をダイナミックなシーンに拡張できることを実験的に実証した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:58:03 GMT)
Geo-OLM: Enabling Sustainable Earth Observation Studies with Cost-Efficient Open Language Models & State-Driven Workflows [9.5]
Geo-OLMは、ツール呼び出しからタスクの進行を分離するツール拡張された地理空間エージェントである。提案手法は,GPT-4oの10%以内の精度で,プロプライエタリなモデルに適合して動作する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:31:04 GMT)
FlowMAC: Conditional Flow Matching for Audio Coding at Low Bit Rates [9.3]
FlowMACは、条件付きフローマッチング(CFM)に基づく低ビットレートでの高品質汎用オーディオ圧縮のための新しいニューラルオーディオである FlowMACは、最先端のGANベースとDDPMベースのニューラルオーディオコーデックを2倍のビットレートで実現している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:52:53 GMT)
Modeling of AUV Dynamics with Limited Resources: Efficient Online Learning Using Uncertainty [9.2]
本研究では,記憶容量の制約によるオンライン学習におけるリハーサルのためのデータポイントの選択における不確実性の利用について検討する。本稿では, 特定の閾値以下で不確実なサンプルを除外するThreshold法, 保存点間の不確実性を最大化するために設計されたGreedy法, 以前の2つのアプローチを組み合わせたThreshold-Greedyの3つの新しいアプローチを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:48:55 GMT)
Hallucination Detection using Multi-View Attention Features [9.2]
本研究では,大規模言語モデルの出力におけるトークンレベルの幻覚検出に取り組む。我々は,各トークンが受ける平均的注意を補完する注目行列から特徴を抽出する。これらの特徴はTransformerベースの分類器に入力され、トークンレベルの分類を行い、幻覚したスパンを識別する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:00:58 GMT)
Exploring Gaze Pattern Differences Between Autistic and Neurotypical Children: Clustering, Visualisation, and Prediction [9.1]
内部クラスタの妥当性指標は、ASDと発達期(TD)児の視線パターンの違いを区別するために用いられる。本研究では,7つのクラスタリングアルゴリズムを適用し,63個の内部クラスタ妥当性指標を抽出し,ASD診断と相関関係を明らかにする。 3つのデータセットの実験は高い予測精度(81% AUC)を示し、これらの指標の有効性を検証する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:59:18 GMT)
Assessing Computer Science Student Attitudes Towards AI Ethics and Policy [8.9]
コンピュータサイエンス(CS)を学ぶ中等生のAI倫理と政策に関する態度と能力は特に興味深い。コンピュータ科学者はAIツールの学習と利用の最前線にいるが、彼らのAIに対する態度はいまだ検討されていない。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:03:47 GMT)
Hypothesis Testing for Progressive Kernel Estimation and VCM Framework [8.9]
本稿では,光子サンプルの統計モデルと,それに関連するプログレッシブカーネル推定への貢献について述べる。そこで本研究では,F-test を用いた変数分析において,統計的人口に関するゼロ仮説を否定するか否かを判断する手法を提案する。そこで我々は, プログレッシブ光子マッピング (PPM) アルゴリズムを実装し, 核半径を非偏光放射率推定の仮説テストにより決定する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:37:35 GMT)
SiameseDuo++: Active Learning from Data Streams with Dual Augmented Siamese Networks [8.8]
この研究は、アクティブラーニングを使用して、予算に応じてラベル付けする人間のエキスパートのインスタンスを自動的に選択する、SiameseDuo++メソッドを提案する。具体的には、シナジーで動作し、生成された例によって強化される2つのシアムニューラルネットワークをインクリメンタルにトレーニングする。シミュレーション実験により,提案手法は学習速度および/または性能の点で,強いベースラインと最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:45:25 GMT)
Artificial Intelligence for Software Architecture: Literature Review and the Road Ahead [8.7]
本稿では,人工知能駆動型ソフトウェアアーキテクチャの展望について述べる。我々は,人工知能がアーキテクチャ設計の自動化,定量的トレードオフ分析のサポート,アーキテクチャ文書の更新を継続的に行う方法について検討する。結果として得られたロードマップは、ソフトウェアアーキテクチャへの14の現在の人工知能コントリビューションの概要と、アーキテクチャタスクをサポートするための6つの人工知能固有の課題を特定し、将来の改善のための6つの方法を明らかにしている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:00:07 GMT)
Crowdsourcing-Based Knowledge Graph Construction for Drug Side Effects Using Large Language Models with an Application on Semaglutide [8.6]
ソーシャルメディアは、薬物移動のための貴重な患者体験情報をキャプチャする、現実世界の豊富なデータ源である。大規模言語モデル(LLM)を利用して、ソーシャルメディアから薬物副作用を抽出し、それらを知識グラフ(KG)に整理するフレームワークを提案する。構築した知識グラフを用いて、様々なセマグルチドブランドにまたがる報告された副作用を経時的に分析する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:47:44 GMT)
REINFORCE++: An Efficient RLHF Algorithm with Robustness to Both Prompt and Reward Models [8.6]
REINFORCE++は、バッチの正規化報酬をベースラインとして使用しながら、批判モデルを削除する新しいアプローチである。プロンプトセットのトランケーションを必要とせずに、様々な報酬モデルに対して堅牢なパフォーマンスを示す。既存のREINFORCE法と比較して、RLHFとロングチェーン設定の両方において優れた一般化を実現している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:23:29 GMT)
Ultrasensitive Transverse Deflection Measurement with Two-photon Interference [8.4]
ホン・ウー・マンデル干渉(Hong-Ou-Mandel、HOM)は、古典物理学の可能性を超越した固有の量子現象である。光ビームの横たわみを測定するための空間HOM干渉計の実験実験を行った。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 07:52:43 GMT)
Binned Group Algebra Factorization for Differentially Private Continual Counting [8.2]
連続観察下での差分プライベートカウントのためのメモリ効率行列係数化について検討した。我々は、アンダーソンとパッホ(2024年)の双対技法を利用できる群代数分解の新たな構造特性を示す。我々の研究は、大規模私的学習システムにおける分解精度の理論的改善と実践的効率のギャップを埋めるものである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 07:55:45 GMT)
ZSMerge: Zero-Shot KV Cache Compression for Memory-Efficient Long-Context LLMs [8.0]
本稿では,効率的なキャッシュ管理のための動的KVキャッシュ圧縮フレームワークZSMergeを提案する。 ZSMergeはメモリ効率と推論速度を無視可能な性能劣化で著しく向上させる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:20:25 GMT)
Dynamic Neural Field Modeling of Visual Contrast for Perceiving Incoherent Looming [7.9]
AmariのDynamic Neural Field (DNF)フレームワークは、神経細胞グループの平均活性化をモデル化するための脳にインスパイアされたアプローチを提供する。我々は、専用DNFによって管理されるON/OFF視覚コントラストのモデリングを組み込むことで、DNFを拡張した。提案モデルでは,非コヒーレントなロケスト検出問題に効果的に対処し,最先端のロケストインスパイアされたモデルよりも大幅に優れていることを示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:04:14 GMT)
"You just can't go around killing people" Explaining Agent Behavior to a Human Terminator [7.8]
人間の介入数を最適化するための説明可能性スキームを提案する。本稿では、この設定を形式化し、人間の介入数を最適化するための説明可能性スキームを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 19:29:45 GMT)
Fingerprinting Implementations of Cryptographic Primitives and Protocols that Use Post-Quantum Algorithms [7.4]
我々はキー交換とデジタル署名プリミティブを解析し,フィンガープリント後量子(PQ)アルゴリズムの実現可能性を評価する。プロトコルレベルの分析では、PQキー交換の存在とタイプを検出することができる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:17:18 GMT)
An overview of model uncertainty and variability in LLM-based sentiment analysis. Challenges, mitigation strategies and the role of explainability [6.8]
本稿では,大規模言語モデル(LLM)におけるモデル変数問題(MVP)を体系的に検討する。 MVPの特徴は、一貫性のない感情分極、推論メカニズムに起因する不確実性、迅速な感度、トレーニングデータのバイアスである。この研究は、より信頼性が高く説明可能な、堅牢な感情分析モデルの開発に役立ち、金融、医療、政策立案といった高度な分野への展開を促進する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:20:39 GMT)
ArxivBench: Can LLMs Assist Researchers in Conducting Research? [6.6]
大規模言語モデル(LLM)は、推論、翻訳、質問応答といった様々なタスクを完了させる際、顕著な効果を示した。本研究では,オープンソース LLM とプロプライエタリ LLM を,関連する研究論文に回答する能力と,arXiv プラットフォーム上でホストされている記事への正確なリンクについて評価する。対象者によっては, LLM生成反応の関連性は認められず, 被験者によっては, 他者よりも有意に低い結果が得られた。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:00:10 GMT)
ODverse33: Is the New YOLO Version Always Better? A Multi Domain benchmark from YOLO v5 to v11 [6.6]
主要な疑問は、新しいYOLOバージョンのリリース頻度の増加にある。各YOLOバージョンの中核となるイノベーションはどのようなもので、これらの変更が実際のパフォーマンス向上にどのように変換されるのか? 本稿では、YOLOv1からYOLOv11への重要なイノベーションを要約し、ODverse33と呼ばれる包括的なベンチマークを導入し、実世界のマルチドメインアプリケーションにおけるモデル改善の実践的影響について検討する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:21:38 GMT)
A Survey of State of the Art Large Vision Language Models: Alignment, Benchmark, Evaluations and Challenges [6.5]
VLM(Multimodal Vision Language Models)は、コンピュータビジョンと自然言語処理の共通点において、トランスフォーメーショントピックとして登場した。研究の急速な進歩と様々なアプリケーションでの人気が高まる中、我々はVLMの総合的な調査を行っている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:12:51 GMT)
REvolve: Reward Evolution with Large Language Models using Human Feedback [6.5]
大規模言語モデル(LLM)は、自然言語のタスク記述から報酬を生成するために使われてきた。人間のフィードバックによって導かれるLLMは、人間の暗黙の知識を反映する報酬関数を定式化するのに用いられる。強化学習における報酬設計にLLMを使用する,真に進化的なフレームワークであるRevolveを紹介する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:42:37 GMT)
Biased Dueling Bandits with Stochastic Delayed Feedback [6.2]
遅延を伴う状況に対処するアルゴリズムを2つ提案する。完全遅延分布情報を必要とする第1のアルゴリズムは,遅延のない場合の遅延帯域問題に対する最適後悔境界を達成できる。第2のアルゴリズムは、分布が不明な状況に最適化されるが、遅延の期待値のみが利用可能である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:44:44 GMT)
DanceMosaic: High-Fidelity Dance Generation with Multimodal Editability [6.0]
DanceMosaicは高速かつ高忠実なダンス生成を可能にし、マルチモーダルモーション編集を可能にする。本稿では,テキスト・ツー・モーション・モデルに音楽とポーズ・アダプタを融合したマルチモーダル・マスク・モーション・モデルを提案する。提案手法は,ダンス生成における新たな最先端性能を確立し,既存の手法によって達成された品質と編集性を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 22:05:37 GMT)
CRANE: Reasoning with constrained LLM generation [6.0]
制約付きデコードアルゴリズムであるCRANEを提案し,制約付き生成の正しさと制約なし生成の柔軟性のバランスをとる。 CRANEは最先端の制約付き復号化戦略と標準の制約なし復号化戦略の両方を大きく上回っている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:09:46 GMT)
Hierarchical Planning for Complex Tasks with Knowledge Graph-RAG and Symbolic Verification [5.7]
大型言語モデル(LLM)はロボットプランナーとして約束されているが、長い水平と複雑なタスクでしばしば苦労している。本稿では,階層的計画生成のための知識グラフに基づくRAGを用いて,LLMベースのプランナを強化するニューロシンボリックアプローチを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:36:30 GMT)
Thermoxels: a voxel-based method to generate simulation-ready 3D thermal models [5.7]
Thermoxelsは、スパース画像からFAA互換モデルを生成できる新しいボクセルベースの手法である。本稿では,3次元シーンのRGB+サーマルメッシュを生成するサーモクセルの能力について述べる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:37:16 GMT)
Driving-RAG: Driving Scenarios Embedding, Search, and RAG Applications [5.4]
運転シナリオデータは、インテリジェントな車や自動運転の開発において、ますます重要な役割を担っている。本稿では,RAGシステムにおける効率的なシナリオデータ埋め込み,検索,アプリケーション化の課題に対処するための Driving-RAG フレームワークを紹介する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:05:33 GMT)
Who's Watching You Zoom? Investigating Privacy of Third-Party Zoom Apps [5.4]
本稿では1年以上にわたるZoom Marketplaceの進化について検討する。アプリのトレンド、データ収集の振る舞い、プライバシーポリシーの透明性を識別する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:48:58 GMT)
Estimating Coverage in Streams via a Modified CVM Method [5.3]
サンプルのカバレッジである$C$は、ランダムに選択された個人がサンプルに表されるクラスに属する確率として定義される。 C$は固定された人口パラメータではなく、サンプルの特性であるため、カバレッジの推定は困難である。本稿では,CVMアルゴリズムの簡単な修正に基づいて,ストリーミング設定において$C$を推定する簡易かつ効率的な手法を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:57:00 GMT)
Model Context Protocol (MCP): Landscape, Security Threats, and Future Research Directions [5.2]
Model Context Protocol(MCP)は、AIモデルと外部ツールとリソースのシームレスな相互作用を可能にするために設計された標準化されたインターフェースである。本稿では,MPP サーバのコアコンポーネント,ワークフロー,ライフサイクルに焦点をあてた総合的な MCP の概要について述べる。我々は、各フェーズに関連するセキュリティとプライバシのリスクを分析し、潜在的な脅威を軽減するための戦略を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:32:33 GMT)
AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents [5.0]
私たちは、20の現実世界のAndroidアプリに116のプログラムタスクに対して報酬信号を提供する、完全に機能するAndroid環境であるAndroidWorldを紹介します。静的テストセットを提供する既存のインタラクティブ環境とは異なり、AndroidWorldはパラメータ化され自然言語で表現されるタスクを動的に構築する。私たちの最高のエージェントは、AndroidWorldのタスクの30.6%を完了できます。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:37:50 GMT)
Extending Cox Proportional Hazards Model with Symbolic Non-Linear Log-Risk Functions for Survival Analysis [4.9]
我々は、生存分析の新しい手法であるGeneralized Cox Proportional Hazards (GCPH)モデルを導入する。 GCPHは従来のCPHモデルの解釈可能性を維持しつつ、非線形ログリスク関数の推定を可能にする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 04:35:11 GMT)
EclipseNETs: Learning Irregular Small Celestial Body Silhouettes [4.9]
不規則な小さな天体を取り巻く日食の正確な予測は、宇宙船の航法、軌道決定、宇宙船システム管理に不可欠である。本稿では,日食条件を効率的にかつ確実にモデル化するために,ニューラルな暗黙表現を活用する新しいアプローチを提案する。ベンヌ、伊藤川、67P/Churyumov-Gerasimenko、Erosの4体で試験された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:51:44 GMT)
How Accurately Do Large Language Models Understand Code? [4.8]
大規模言語モデル(LLM)は、コードの修復やテストといった開発後のタスクでますます使われています。コードの理解の定量化は、その抽象的な性質と標準化されたメトリクスの欠如のために難しい。本稿では,LLMのコード理解能力に関する大規模な実証的研究を行った。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:59:29 GMT)
Exploring Generative AI Techniques in Government: A Case Study [4.8]
カナダ国立研究評議会(NRC)は、GenAI技術の統合を日々の性能向上のために調査するパイロットイニシアチブを開始した。本稿では,NRCにおけるパフォーマンス計測,データ管理,インサイトレポートの自動化を目的とした,インテリジェントエージェントPubbieの開発を事例として紹介する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:52:38 GMT)
On the Spatial Structure of Mixture-of-Experts in Transformers [4.7]
MoEルータは、主に専門家の選択にセマンティック機能を利用する。本研究は,位置トークン情報も経路決定において重要な役割を果たすことを示すことによって,この概念に挑戦する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:31:55 GMT)
A Consequentialist Critique of Binary Classification Evaluation Practices [4.6]
ICML、FAccT、CHILといった主要なカンファレンスでは、トップKメトリクスや一定のしきい値が好まれています。我々は、この決定論的フレームワークを使用して、評価指標を最適なユースケースにマッピングし、Pythonパッケージであるbriertoolsとともに、より広範なBrierスコアの採用を促進する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:58:01 GMT)
Post-Quantum Wireless-based Key Encapsulation Mechanism via CRYSTALS-Kyber for Resource-Constrained Devices [4.6]
本稿では、リソース制約のあるデバイスで使用されるポスト量子暗号システムに適応する問題を考察する。本稿では,ポスト量子公開鍵暗号方式の実装の複雑さを最小限に抑えるために,無線通信チャネルの特性を活用することを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:57:00 GMT)
STGCN-LSTM for Olympic Medal Prediction: Dynamic Power Modeling and Causal Policy Optimization [4.5]
本稿では,オリンピックのメダル分布を予測するための新しいハイブリッドモデル STCN-LSTM を提案する。国家間の関係の強固さと国家パフォーマンスの長期的な依存関係を統合する。結果は、コーチングのモビリティ、イベントの分散、そして戦略的投資がメダル予測に与える影響に光を当てた。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:33:07 GMT)
Structuring Multiple Simple Cycle Reservoirs with Particle Swarm Optimization [4.5]
Reservoir Computing (RC)は、リカレントニューラルネットワーク(RNN)から導かれる時間効率の計算パラダイムである。本稿では,Echo State Networks (ESNs)を拡張したマルチ・リザーバ・フレームワークであるMultiple Simple Cycle Reservoirs (MSCRs)を紹介する。粒子群最適化 (PSO) を用いたMSCRの最適化は, 既存の多貯留層モデルよりも優れており, より低次元状態空間での競合予測性能を実現することが実証された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:25:40 GMT)
iADCPS: Time Series Anomaly Detection for Evolving Cyber-physical Systems via Incremental Meta-learning [4.4]
サイバー物理システム(ADCPS)の異常検出は、障害や潜在的な攻撃の特定に不可欠である。我々はメタラーニングに基づく段階的なアプローチ,すなわちiADCPSを提案し,モデルを継続的に更新する。 3つのPUMPデータセットを用いて,iADCPSの有効性を実証的に評価した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:02:31 GMT)
FedQUIT: On-Device Federated Unlearning via a Quasi-Competent Virtual Teacher [4.3]
フェデレートラーニング(FL)システムは、個々のデータの集中的な収集を必要とせずに、機械学習モデルの協調的なトレーニングを可能にする。本稿では,FedQUITを提案する。FedQUITは知識蒸留を用いて,FLグローバルモデルからデータへの寄与を隠蔽する新しいアルゴリズムである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:53:01 GMT)
SelfSplat: Pose-Free and 3D Prior-Free Generalizable 3D Gaussian Splatting [4.1]
ポーズフリーで3次元の事前自由な一般化可能な3次元再構成を実現するための新しい3次元ガウススプラッティングモデルであるSelfSplatを提案する。本モデルでは,これらの課題に対して,自己教師付き深度とポーズ推定手法を効果的に統合することによって対処する。提案手法の性能を評価するため,RealEstate10K,ACID,DL3DVなどの大規模実世界のデータセットを用いて評価を行った。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:08:27 GMT)
Your Image Generator Is Your New Private Dataset [4.1]
生成拡散モデルは、トレーニングデータを合成的に生成する強力なツールとして登場した。本稿では,これらの課題に対処するために,テクスチャ・コンディションド・ナレッジ・リサイクリング・パイプラインを提案する。パイプラインは10の多様な画像分類ベンチマークで厳格に評価されている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:46:08 GMT)
A Novel Cholesky Kernel based Support Vector Classifier [3.8]
Support Vector Machine (SVM)は、一般的な教師付き分類モデルである。この研究は、データの分散共分散構造の影響を調節する新しいColesky Kernelを提案する。 CholeskyカーネルベースのSVMの有効性は、ウィスコンシン乳癌(診断)データセットを分類することによって実証される。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:57:33 GMT)
Economic Battery Storage Dispatch with Deep Reinforcement Learning from Rule-Based Demonstrations [3.6]
本研究では,ソフトアクター・クリティック(SAC)を拡張し,実演から学習するアプローチを提案する。グリッド接続型マイクログリッドのケーススタディを行い、電力の通販価格に基づくif-then-else文を用いてデモを収集する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:16:42 GMT)
DDPT: Diffusion-Driven Prompt Tuning for Large Language Model Code Generation [3.4]
大規模言語モデル(LLM)は、コード生成において顕著な能力を示している。生成されたコードの品質は、使用するプロンプトの構造と構成に大きく依存する。本稿では,ガウス雑音から最適なプロンプト埋め込みを生成する方法を学習する新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 04:19:19 GMT)
Compiler Optimization Testing Based on Optimization-Guided Equivalence Transformations [3.3]
本稿では,コンパイラ最適化にインスパイアされたメタモルフィックテスト手法を提案する。提案手法ではまず,最適化条件を満たす入力プログラムを生成するために,最適化されたコード構築戦略を用いる。事前変換プログラムと後変換プログラムの出力を比較することで、不正な最適化バグを効果的に識別する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:37:57 GMT)
LeakGuard: Detecting Memory Leaks Accurately and Scalably [3.3]
LeakGuardは、正確性とスケーラビリティの十分なバランスを提供するメモリリーク検出ツールである。正確性のために、LeakGuardはライブラリと開発者が定義したメモリ割り当てとトランザクションロケーション関数の挙動を分析する。スケーラビリティのために、LeakGuardは関数の要約と制約の少ないシンボル実行技術を用いて、興味のある各関数を独立に調べる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:11:37 GMT)
Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation [3.2]
本稿では,タンパク質言語モデル(pLM)の新規ファミリーであるProt42を紹介する。注目すべきは、我々のモデルは最大8,192個のアミノ酸を処理し、標準的制限をはるかに超えていることだ。 Prot42は高親和性タンパク質結合体と配列特異的DNA結合タンパク質を産生する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:43:12 GMT)
Learning Conditionally Independent Transformations using Normal Subgroups in Group Theory [3.2]
教師なし表現学習における根本的な課題は、学習された特徴表現において異なる変換を分離することである。既存の手法は代数的独立性に基づいて変換を分解するが、これらの手法は主に可換変換に焦点を当てる。条件付き独立変換の分離を可能にするために,正規部分群を活用する新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:45:43 GMT)
AnomalyHybrid: A Domain-agnostic Generative Framework for General Anomaly Detection [3.2]
AnomalyHybridは、本物で多様な異常を生成するために設計されたドメインに依存しないフレームワークである。 AnomalyHybridはGAN(Generative Adversarial Network)ベースのフレームワークで、参照画像の外観をそれぞれターゲット画像の深さとエッジ構造に統合する2つのデコーダを備えている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 03:28:30 GMT)
Attributed Synthetic Data Generation for Zero-shot Domain-specific Image Classification [3.0]
本稿では,属性付きプロンプトを生成するために,大規模言語モデルを活用するAttrSynを提案する。 2つのきめ細かいデータセットに対するゼロショットドメイン固有の画像分類の実験では、AttrSynが生成した合成画像によるトレーニングがCLIPのゼロショット分類を著しく上回っている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:54:10 GMT)
Pre-trained Language Models and Few-shot Learning for Medical Entity Extraction [3.0]
本研究では,Transformer を用いた医療機関抽出手法を提案する。医療用テキストの専門性や複雑さを考慮すると、様々な事前訓練された言語モデルの性能を比較する。わずかながらの学習は、医療機関抽出の精度を高めることができる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:36:33 GMT)
Transport information Bregman divergences [2.8]
L2$-ワッサーシュタイン計量に埋め込まれた確率密度空間におけるブレグマンの発散について検討する。特に、$L2$-ワッサーシュタイン空間における負ボルツマン・シャノンエントロピーのブレグマン発散(英語版)により、輸送クルバック・リーバー(英語版)(KL)の発散を導出する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:36:25 GMT)
Future-Proof Yourself: An AI Era Survival Guide [2.7]
Future-Proof Yourselfは、読者が急速に変化する人工知能の世界をナビゲートする実践的なガイドだ。この本は、コンピュータがシンプルで相対的な言葉でデータからどのように学習するかを説明することから始まる。機械学習の基本的なアイデアが、画像を認識し、言語を理解し、さらには意思決定できる高度なシステムへとどのように進化していくかを示している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:11:29 GMT)
Systematic Literature Review on Vehicular Collaborative Perception -- A Computer Vision Perspective [2.7]
コラボレーティブ・パーセプション(CP)は、これらの問題を緩和するための有望な解決策として登場した。この研究は、PRISMA 2020ガイドラインに従い、106のピアレビュー記事を含む。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:56:04 GMT)
Towards Source Mapping for Zero-Knowledge Smart Contracts: Design and Preliminary Evaluation [2.6]
本稿では,zkSolcコンパイルパイプライン内のSolidityソースコード,LLVM IR,zkEVMバイトコード間のトレーサビリティを確立するためのソースマッピングフレームワークを提案する。我々は,50のベンチマークコントラクトと500の現実世界のzkSyncコントラクトのデータセット上でフレームワークを評価し,標準のSolidity構造に対して約97.2%のマッピング精度を観測した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:42:07 GMT)
Identity-related Speech Suppression in Generative AI Content Moderation [2.6]
生成AIシステムは、そのようなフィルタを使用して、望ましくない生成されたコンテンツがユーザによって作成または提示されるのを防ぐ。我々は,さまざまなコンテンツモデレーションAPIによって誤ってフィルタリングされた異なるアイデンティティグループに関連する音声に焦点を当て,音声抑圧の尺度を定義し,導入する。従来のAIデータと生成AIデータに対する識別関連音声抑圧の違いは、生成AIデータに対してAPIが優れているが、より長いテキストインスタンスやアイデンティティによって、不正確なフラグング動作のID固有の理由によって、より悪いものになっている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 00:30:38 GMT)
Statistical Guarantees Of False Discovery Rate In Medical Instance Segmentation Tasks Based on Conformal Risk Control [2.5]
インスタンスセグメンテーションは、病変、腫瘍、解剖学的構造の正確な局在化とデライン化を可能にすることで、医療画像解析において重要な役割を担っている。 Mask R-CNNやBlendMaskのようなディープラーニングモデルは目覚ましい進歩を遂げているが、リスクの高い医療シナリオにおけるそれらの応用は、信頼性の校正の問題によって制限されている。本稿では,この課題に対処するために,共形予測理論に基づく堅牢な品質制御フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:31:19 GMT)
Semiparametric Counterfactual Regression [2.4]
一般化可能なフレームワーク内での非実効的回帰のための2つの頑健なスタイル推定器を提案する。当社のアプローチでは,標準手法を維持しながら適応性を高めるために,漸進的な介入を用いる。解析の結果,提案した推定器は幅広い問題に対して$sqrn$-consistencyと正規性が得られることがわかった。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:15:26 GMT)
Scenario Understanding of Traffic Scenes Through Large Visual Language Models [2.3]
大規模ビジュアル言語モデル(LVLM)は、画像解析とコンテキストクエリによる分類を自動化することで、魅力的なソリューションを提供する。本研究では,LVLMが社内データセットとBDD100Kの両方で都市交通シーンを理解し,分類する能力を評価する。我々は、最先端モデルを統合するスケーラブルなキャプションパイプラインを提案し、新しいデータセットに柔軟なデプロイを可能にする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:21:08 GMT)
Attention-Driven LPLC2 Neural Ensemble Model for Multi-Target Looming Detection and Localization [2.3]
ハエの視覚系における2型視覚投射ニューロン(LPLC2)は、高い光沢選択性を有する。既存のLPLC2ニューロンのモデルでは、個々の細胞に集中してセントロイドに焦点を絞った拡張を検出したり、集団投票戦略を利用して地球規模の衝突情報を得る。本研究では,移動感応性ニューラルパスによって誘導されるボトムアップアテンション機構を利用して,LPLC2集団の数値モデルを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:07:57 GMT)
An Empirical Comparison of Text Summarization: A Multi-Dimensional Evaluation of Large Language Models [2.2]
本研究は17大言語モデル(OpenAI, Google, Anthropic, オープンソース)の要約性能を評価する。事実整合性、意味的類似性、語彙重なり、人間に似た品質の指標を用いて、7つの多様なデータセットのモデルを評価した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:24:22 GMT)
FluentLip: A Phonemes-Based Two-stage Approach for Audio-Driven Lip Synthesis with Optical Flow Consistency [2.2]
この研究は、オーディオ駆動唇合成のための2段階アプローチであるFluentLipを提案する。我々は、音素抽出器とエンコーダを統合し、マルチモーダル学習のための音声と音素情報の融合を生成する。提案したFluentLipを,5つの最先端(SOTA)アプローチと比較し,広範囲な実験により評価した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:44:30 GMT)
A Survey of Social Cybersecurity: Techniques for Attack Detection, Evaluations, Challenges, and Future Prospects [2.1]
科学的情報ソースの信頼性は、しばしば誤報の拡散によって損なわれる。この操作は、敵対的なビジネスアジェンダに役立ち、市民社会を妥協させる。社会サイバーセキュリティという新たな科学分野が誕生した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 00:53:09 GMT)
Multimodal Lengthy Videos Retrieval Framework and Evaluation Metric [2.0]
本稿では,視覚的マッチングストリームと聴覚的マッチングストリームと,独自の字幕ベースのビデオセグメンテーションアプローチを組み合わせた統合フレームワークを提案する。我々はYouCook2ベンチマークで実験を行い、有望な検索性能を示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:18:09 GMT)
Embedding Reliability Verification Constraints into Generation Expansion Planning [2.0]
本研究では,世代拡張計画に信頼性検証制約を組み込む手法を提案する。提案手法は,テキサス州電気信頼性協議会(ERCOT)地域を対象とした長期世代計画ケーススタディにより検証された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 04:58:45 GMT)
Causal Inference Isn't Special: Why It's Just Another Prediction Problem [1.9]
因果推論は予測モデリングとは異なるものとして描かれることが多い。しかし、中核では、因果推論は単に分布シフトの下での予測の構造化例である。この観点は因果推定をよく知られた一般化問題として再定義する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:37:50 GMT)
Interpreting the structure of multi-object representations in vision encoders [1.9]
我々は、分類、大規模視覚言語モデル、自己教師付き手法に基づいて事前訓練された視覚エンコーダを評価する。視覚エンコーダ内のトークンや層にオブジェクトワイズ表現がどのように分散されているかを検討する。本研究は,対象物が事前学習対象物との関連性に応じて,対象物の表現に有意な差異を呈するものである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:44:02 GMT)
From Explicit Rules to Implicit Reasoning in Weakly Supervised Video Anomaly Detection [1.8]
本稿では,ルールベースビオレンスモニタリング(RuleVM)について紹介する。 RuleVMはデュアルブランチアーキテクチャを採用している: 粗いバイナリ分類に視覚的特徴を使用する暗黙のブランチ、シーンフレームとアクションチャネルに特徴抽出を分割する、そして、きめ細かい分類に言語イメージアライメントを活用する明示的なブランチ。明示的なブランチは、最先端のYOLO-Worldモデルを使用してビデオフレーム内のオブジェクト検出を行い、関連ルールはビデオディスクリプタとしてデータから抽出される。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 04:35:46 GMT)
AutoPDL: Automatic Prompt Optimization for LLM Agents [1.7]
本稿では,適切なプロンプトエージェント構成を見つけるための自動アプローチであるAutoPDLを提案する。本稿では,PDLプロンプト言語を実装したライブラリを紹介する。我々は、一貫性のある精度向上(9.5pm17.5$%ポイント)を68.9ppまで示し、選択されたプロンプト戦略がモデルやタスクによって異なることを明らかにした。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:30:10 GMT)
Enhancing LLM-Based Text Classification in Political Science: Automatic Prompt Optimization and Dynamic Exemplar Selection for Few-Shot Learning [1.7]
大型言語モデル (LLMs) は、政治学におけるテキスト分類をかなり約束する。本フレームワークは,自動プロンプト最適化,動的指数選択,コンセンサス機構を通じてLLM性能を向上させる。オープンソースのPythonパッケージ(PoliPrompt)がGitHubで公開されている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:38:38 GMT)
Invariant deep neural networks under the finite group for solving partial differential equations [1.5]
我々は、有限群の下でニューラルネットワークのアーキテクチャを不変にする対称性強化ディープニューラルネットワーク(sDNN)を設計する。数値計算の結果,sDNNはサンプリング領域内外において強い予測能力を有することがわかった。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:39:17 GMT)
Squeeze and Excitation: A Weighted Graph Contrastive Learning for Collaborative Filtering [1.4]
グラフコントラスト学習(GCL)は、表現学習の堅牢性を高めることを目的としている。 Weighted Graph Contrastive Learning framework (WeightedGCL)は、特徴の非合理的な割り当てに対処する。重み付けGCLは、競合するベースラインに比べて大幅に精度が向上する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:30:59 GMT)
ICCheck: A Portable, Language-Agnostic Tool for Synchronizing Code Clones [1.3]
コードクローンの一貫性のない変更は、ソフトウェアの欠陥につながる可能性がある。 ICCheckは言語に依存しない、様々な環境にまたがるポータブルなツールである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:28:14 GMT)
How Users Employ Workarounds in Software Forms [1.3]
回避策により、システム制限にもかかわらず、ユーザーは目標を達成することができる。本研究では,入力したいデータがソフトウェア形式の制約に合致しない場合に,ユーザが回避策をどのように採用するかを検討する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:19:29 GMT)
eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events [1.2]
イベントカメラの固有キャリブレーション手法eKalibrを提案する。 eKalibrは、慎重に設計されたイベントベースのサークルグリッドパターン認識アルゴリズムに基づいている。パターン抽出と固有キャリブレーションの観点からeKalibrの性能を評価する実験を行った。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:35:01 GMT)
Distributed and Secure Kernel-Based Quantum Machine Learning [1.1]
量子コンピューティングは機械学習に革命をもたらすことを約束し、クラスタリングや距離推定といったタスクにおいて、大幅な効率向上を提供する。測定仮定や非閉定理といった基本的な原理を通じて、セキュリティを向上する。セキュアな量子機械学習は注目に値するが、カーネルベースの機械学習技術のセキュアで分散的な量子アナログの開発はいまだに未調査である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 18:29:28 GMT)
Removing Reflections from RAW Photos [1.1]
消費者写真用画像から現実世界の反射を除去するシステムについて述べる。本システムは線形(RAW)写真で動作し,反対方向を向いているオプションの文脈写真を受け入れる。 MacBookまたはiPhone 14 Proで4.5-6.5sで1Kでプレビュー画像を生成する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:37:28 GMT)
Word-specific tonal realizations in Mandarin [0.9]
本研究は,音素認識が単語の意味によって部分的に決定されることを示唆している。まず,台湾・マンダリン自発会話のコーパスに基づいて,従来確立されていたすべての単語形式関連予測器よりも,単語型が音素認識の強力な予測器であることが示される。次に、文脈固有単語埋め込みを用いた計算モデルを用いて、トークン固有ピッチ輪郭が保持データ上で50%の精度で単語タイプを予測することを示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 09:34:35 GMT)
Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad [0.8]
我々は2025年のUSAMOの6つの問題に対して、最先端の推論モデルを評価する。 Gemini-2.5-Proのみが25%という非自明なスコアを達成している。以上の結果から,現在のLLMは厳密な数学的推論作業には不十分であることが示唆された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:46:29 GMT)
Scalable Approximate Algorithms for Optimal Transport Linear Models [0.8]
エントロピー規則化OTデータフィット項を用いた非線形回帰モデルの一般クラスを解くための新しい枠組みを提案する。一般的なペナルティとデータ適合の条件に対する単純な乗法的更新を導出する。本手法は,実装の単純さと並列化の容易さから,大規模問題に適した手法である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:37:25 GMT)
Thanos: A Block-wise Pruning Algorithm for Efficient Large Language Model Compression [0.7]
Thanosは、メモリフットプリントを削減し、大規模言語モデル(LLM)の計算効率を向上させるために設計された、新しい重み付けアルゴリズムである。本稿では,適応マスクを用いたブロックワイドプルーニング方式を導入し,重み付けを動的に調整し,フレキシブルな空間パターンと構造化フォーマットを実現する。実験により,サノスは非構造化プルーニングにおける既成手法よりも優れた最先端性能を達成できることが確認された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:38:44 GMT)
Embrace rejection: Kernel matrix approximation by accelerated randomly pivoted Cholesky [0.7]
ランダムピボットされたコレスキー (RPCholesky) は、少数の列を用いて正半有限行列の低ランク近似を構築するアルゴリズムである。本稿では,ブロック行列計算とリジェクションサンプリングを併用したRPCholeskyの高速化版を開発し,元のアルゴリズムの実行を効率的にシミュレートする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:54:34 GMT)
SolRPDS: A Dataset for Analyzing Rug Pulls in Solana Decentralized Finance [0.6]
Solanaの暴走は、分散ファイナンス(DeFi)と対話するユーザに大きなダメージを与えている。開発者がユーザの信頼を利用して、DEX(Decentralized Exchanges)上のトークンプールから流動性を引き出すと、ラグプルが発生します。 Solanaのトランザクションから派生した最初の公開ルーグプルデータセットであるSolRPDSを紹介する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:36:48 GMT)
Non-Markovian N-spin chain quantum battery in thermal charging process [0.5]
エルゴトロピーは量子電池の性能を評価する重要な指標である。マイクロキャビティに埋め込まれたNスピン鎖からなる非マルコフ型QBにおけるエルゴトロピーダイナミクスについて検討した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 14:55:11 GMT)
Multimodal Cinematic Video Synthesis Using Text-to-Image and Audio Generation Models [0.4]
本研究は,高忠実度画像合成を取り入れた60秒フィルムの製作方法,物語構築のためのGPT-2,gTTSとYouTube-音楽を用いたハイブリッドオーディオパイプラインについて述べる。このフレームワークは、リニアフレーム、撮影後ソース(例えば、シャープニング)、およびプロの質の高い結果を提供するためにオーディオビデオ同期によって強化された5シーンフレームワークを使用する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:10:34 GMT)
SECQUE: A Benchmark for Evaluating Real-World Financial Analysis Capabilities [0.3]
SECQUEは4つの主要なカテゴリにわたるSECの申請分析に関する専門家による565の質問で構成されている。モデル性能を評価するため,複数のLLM判断器を利用した評価機構であるSECQUE-Judgeを開発した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 19:59:41 GMT)
CALF: A Conditionally Adaptive Loss Function to Mitigate Class-Imbalanced Segmentation [0.3]
不均衡データセットは、医学診断のためのディープラーニング(DL)モデルのトレーニングにおいて課題となる。本稿では,DLトレーニングにおける不均衡データセットの条件を満たすために,新しい,統計的に駆動された条件適応型損失関数(CALF)を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:03:33 GMT)
Here Comes the Explanation: A Shapley Perspective on Multi-contrast Medical Image Segmentation [0.2]
そこで我々は,脳腫瘍セグメンテーションにおける標準指標に基づいてトレーニングした最先端のモデルについて,コントラストレベルのShapley値を用いて説明する。以上の結果から,Shapley解析は腫瘍セグメンテーションに使用する異なるモデルの挙動に関する貴重な知見を提供することが示された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:52:07 GMT)
Directed Graph-alignment Approach for Identification of Gaps in Short Answers [0.1]
そこで,本研究では,学生の解答/参照回答と,それに対応するモデル回答/参照回答を比較して,学生の解答におけるギャップとして知られる欠落項目を同定する手法を提案する。識別されたギャップは、学生に形式的評価のためのフィードバックを提供するのに有用である。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:04:28 GMT)
Commuting Local Hamiltonians Beyond 2D [0.1]
通勤するハミルトンの複雑さを解析するための新しい手法を提案する。通勤する局所ハミルトニアンのより大きな族がNPであることを示す。局所ハミルトニアンを通勤する3Dの族がNPに含まれるのはこれが初めてである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:24:24 GMT)
Three-Factor Learning in Spiking Neural Networks: An Overview of Methods and Trends from a Machine Learning Perspective [0.1]
Spiking Neural Networks(SNN)の3要素学習ルールは、従来のヘビーン学習の重要な拡張として現れている。これらのメカニズムは生物学的な可視性を高め、人工神経系の信用割り当てを改善する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 08:10:16 GMT)
What can unitary sequences tell us about multi-time physics? [0.0]
マルチタイム量子プロセスは、時間的絡み合いやエキゾチック因果構造を含む、マルチパーティイト状態と同じリッチ性を持つ。比較的限られた制御に直面した場合でも、これらの現象が初期段階の量子プロセッサでいかに驚くほどアクセスしやすくなっているかを示す。我々の技術は一般的な量子力学プロセスに関係しており、凝縮物質物理学、量子生物学、NISQ時代の量子デバイスの深部診断など幅広い分野に及んでいる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:28:35 GMT)
Volley Revolver: A Novel Matrix-Encoding Method for Privacy-Preserving Neural Networks (Inference) [0.0]
我々は,手書き画像分類のための畳み込みニューラルネットワークを実装した。 40のvCPUを持つパブリッククラウドでは、MNISTテストデータセット上の畳み込みニューラルネットワークの実装には、$sim$287秒かかります。データ所有者は、これらの32の画像を暗号化した暗号文を1つだけパブリッククラウドにアップロードする必要がある。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:57:26 GMT)
Variational Self-Supervised Learning [0.0]
本稿では,変分推論と自己教師型学習を組み合わせた新しいフレームワークである変分自己監視学習(VSSL)を提案する。モーメントアップされた教師ネットワークは、ダイナミックなデータ依存の事前を定義する一方、学生エンコーダは、拡張ビューから近似的な後進を生成する。 CIFAR-10、CIFAR-100、ImageNet-100の実験では、VSSLは最上位の自己管理手法に対して、競争力または優れた性能を達成している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:28:50 GMT)
Twist-Induced Effects on Weyl Pairs in Magnetized Graphene Nanoribbons [0.0]
本稿では,磁化ヘリコダルグラフェンナノリボン中のワイル対のダイナミクスについて検討する。曲面を平らなミンコフスキー時空に埋め込むことで、この系に特有の完全共変2体ディラック方程式を導出する。グラフェンナノリボン中のワイル対の動的挙動に及ぼす均一磁場とツイスト数の影響について検討した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 11:25:24 GMT)
The foot, the fan, and the cuprate phase diagram: Fermi-volume-changing quantum phase transitions [0.0]
フェルミ表面(FL)を持つフェルミ液体は、再構成された「小さなフェルミポケット」を持つスピン密度波状態(SDW)への量子相転移を持つことができる。 FL-SDW量子相転移における空間障害の影響の研究は、低温における拡張量子臨界グリフィス型位相を予測する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:00:04 GMT)
Spreading dynamics in the Hatano-Nelson model with disorder [0.0]
疾患の導入は、皮膚効果とアンダーソンの局在の競合を招き、皮膚とアンダーソンの移行を引き起こす。我々の研究は、非エルミート系における非相互性や障害によって引き起こされるリッチダイナミクスを明らかにする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:40:14 GMT)
Solving Time-Fractional Partial Integro-Differential Equations Using Tensor Neural Network [0.0]
線形時間-屈折拡散波方程式を解くために,適応テンソルニューラルネットワーク部分空間に基づく新しい機械学習手法を提案する。提案したテンソルニューラルネットワークに基づく機械学習手法の有効性と精度を検証するために,いくつかの数値例が提供される。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:10:54 GMT)
Solving Sokoban using Hierarchical Reinforcement Learning with Landmarks [0.0]
本稿では,パズルゲーム「ソコバン」に適用した新しい階層型強化学習フレームワークを提案する。提案手法は6段階のポリシー階層を構築し,各上位のポリシーが下位のレベルに対してサブゴールを生成する。すべてのサブゴールとポリシーは、ドメインの知識なしに、ゼロからエンドツーエンドに学習されます。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 05:30:21 GMT)
Skin Color Measurement from Dermatoscopic Images: An Evaluation on a Synthetic Dataset [0.0]
画像色測定手法の4つのクラス(セグメンテーションベース、パッチベース、カラー量子化、ニューラルネットワーク)を評価する。この結果から, 偏光法および色量化法により, 頑健で光の不変な推定値が得られることがわかった。ニューラルネットワークモデル、特に過適合を減らすために重いぼやけと組み合わせた場合、光不変のフィッツパトリック予測を提供することができる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 13:57:34 GMT)
Self-organized cavity bosons beyond the adiabatic elimination approximation [0.0]
キャビティモードのダイナミクス,量子ゆらぎ,キャビティ-ボソン相関,および個別ランの自己組織化を考慮する。大規模システムでは, 非常に長い時間, 超流動な準長範囲秩序でメタスタビリティを観測する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 19:01:36 GMT)
Notes on Quantum Soundscapes and Music [0.0]
音素化によるデータへの「リスニング」は、信号の発見を容易にする。音素化によるデータへの「リスニング」は、データがマクロ的リアリズムに反した場合に相補的な方法を提供する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 21:13:59 GMT)
Non-linear Phillips Curve for India: Evidence from Explainable Machine Learning [0.0]
私たちは、インドにおける見出しインフレーションの予測と説明に機械学習手法を使用します。ヘッドラインインフレはインフレ予想によって引き起こされ、その後過去のインフレとアウトプットギャップが続き、供給ショックは降雨以外は限界的な影響しか与えない。これらの結果は、予測精度を改善し、インフレーションデータの複雑な非線形ダイナミクスを明らかにする機械学習モデルの能力を強調し、政策立案者にとって貴重な洞察を提供する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:17:36 GMT)
Micro-Oscillation Frequency Estimation of an Optical Point Source Using Spatial Mode Demultiplexing [0.0]
本稿では,光点状音源の運動特性を推定するためのノイズロバスト手法として空間モードデマルチプレクシング(SPADE)を提案する。本研究では,SPADEが点源の位置情報をいくつかの重要な空間モードに効率よく集中させ,必要な検出器の数を劇的に減らしていることを示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 04:10:49 GMT)
Limits to Analog Reservoir Learning [0.0]
アナログ貯水池コンピュータの学習能力に及ぼす雑音の影響について検討する。情報処理能力(IPC)はノイズによる性能劣化の定量化に有用な指標であることを示す。ノイズに晒された物理的アナログ貯水池コンピュータは、学習量の増加にのみ利用できると結論付けている。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 02:21:08 GMT)
KnowsLM: A framework for evaluation of small language models for knowledge augmentation and humanised conversations [0.0]
本研究は,LoRAランク,データセットスケール,プレフィックスデザインが知識保持とスタイルアライメントに与える影響について検討する。 LLMに基づく判断は、知識の正確さ、会話の質、簡潔さを考慮し、微調整が音調適応に最も適していることを示し、RAGはリアルタイムの知識増強に優れていた。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:58:08 GMT)
KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0]
本研究は,韓国語などの低リソース言語におけるABSAの直感的で効果的な枠組みを提案する。翻訳されたベンチマークと未ラベルの韓国データを統合することで、予測ラベルを最適化する。英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:37:44 GMT)
Ineffectiveness for Search and Undecidability of PCSP Meta-Problems [0.0]
PCSPの最もよく知られたアルゴリズムは、そのエンフデシジョン変種のみを解き、それらがエンフサーチにも適応できるかどうかは不明である。我々は、これらの解を適切な検索証明書に丸めることは、クラスTFNPのどの問題にも匹敵するほど難しいことを証明している。我々のツールは,ミニオンを特徴とするアルゴリズムに適しており,メタプロブレムの判定不能な結果を証明するためにも使用できる。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:08:05 GMT)
Impact of Absorption due to Zero-Field Splitting on Loss in Dielectrics [0.0]
超伝導量子ビットのコヒーレンス時間は損失機構によって制限される。常磁性不純物や欠陥のゼロフィールドスプリット状態間の遷移によって引き起こされるメカニズムを提案する。サファイア中のCr, Fe, Vの不純物については、10$-9$-10$-8$の範囲で4.5 GHzの損失接点を求める。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:37:33 GMT)
Hyperflows: Pruning Reveals the Importance of Weights [0.0]
ハイパーフローは、ウェイト除去に対するネットワークの勾配応答を観察することによって、各ウェイトの重要性を推定する動的プルーニング手法である。グローバルな圧力項は、全ての重みをプルーニングに向けて連続的に駆動し、正確性に重要なものを自動的に再認識する。ニューラルスケーリング法則に類似したパワー-ロー方程式を導出し、最終的な空間と圧力の関係について検討する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 16:09:18 GMT)
Hessian of Perplexity for Large Language Models by PyTorch autograd (Open Source) [0.0]
我々は,Hessian for Large Language Model(LLM)の少なくとも一部を正確に計算する方法のガイドを提供する。また、ベクトル・ヘッセン積(HVP)の複数のサンプルを用いて、ヘッセン行列の全対角線を計算する方法を示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:37:04 GMT)
Function Alignment: A New Theory of Mind and Intelligence, Part I: Foundations [0.0]
本稿では,心と知性の新たな理論である機能アライメントを紹介する。意味、解釈、類推が階層表現間の相互作用からどのように現れるかを明確にモデル化する。それはしばしば、計算アーキテクチャ、心理学理論、さらには禅のような観念的伝統を結びつけて、規律を分割する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:59:32 GMT)
Fine-Tuning Transformer-Based Vision-Language Models for Robust Object Detection in Unstructured Environments [0.0]
非構成の複雑な環境における物体検出タスクのためのFlorence2モデルを微調整した。最適化されたFlorence2モデルでは、オブジェクト検出精度が大幅に向上した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 17:48:14 GMT)
Evaluation framework for Image Segmentation Algorithms [0.0]
本稿では,画像セグメンテーションの基本概念と重要性と,精度向上における対話的セグメンテーションの役割を紹介する。詳細な背景理論セクションでは、しきい値、エッジ検出、領域の成長、特徴抽出、ランダムフォレスト、サポートベクターマシン、畳み込みニューラルネットワーク、U-Net、Mask R-CNNなど、さまざまなセグメンテーション手法が検討されている。比較分析では、それぞれの手法の強み、限界、トレードオフを強調し、詳細な結果を示す。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:20:26 GMT)
Environment-Assisted Generation of Non-Gaussian Wavepacket Quantum States [0.0]
超伝導回路プラットフォームを用いた非ガウスボゾン状態の単一モード移動波パケットを調製する。このような状態は、遠い量子プロセッサユニット間のセキュアな量子通信を可能にする。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 15:05:49 GMT)
Efficient Portfolio Selection through Preference Aggregation with Quicksort and the Bradley--Terry Model [0.0]
長期的利益をもたらすプロジェクトに対して、限られたリソースを割り当てる方法は、不確実性の下で意思決定でしばしば発生する問題である。そこで我々はQuicksortとBradley-Terryモデルに基づく比較ルールを提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:16:30 GMT)
Educational Twin: The Influence of Artificial XR Expert Duplicates on Future Learning [0.0]
人間のデジタル双生児は、拡張性、エンゲージメント、社会的学習因子の保存といった側面を改善する可能性がある。この技術はメリットを提供する一方で、教育者の自主性、社会的相互作用の変化、プライバシー、偏見、アイデンティティ保護といった倫理的配慮に関する課題も導入している。人間のデジタル双生児が教育の社会的側面を損なうことなく向上させるためには、対処すべき重要な研究課題を概説する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 06:41:42 GMT)
Capturing AI's Attention: Physics of Repetition, Hallucination, Bias and Beyond [0.0]
理論は、出力反復、幻覚、有害な内容など、優れたAI課題の分析を可能にする。その2体形式は、LCMがうまく機能する理由を示唆するが、一般化された3体注意によって、そのようなAIがさらにうまく動作することを示唆している。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:10:05 GMT)
Balancing Complexity and Informativeness in LLM-Based Clustering: Finding the Goldilocks Zone [0.0]
本稿では,情報性と認知的単純さのトレードオフを定量化することにより,最適なクラスタ数について検討する。大規模言語モデル(LLM)を用いてクラスタ名を生成し,その有効性を評価する。語彙分類における言語効率を並列化する16-22クラスタの最適範囲を同定する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 01:16:22 GMT)
Analysing Rescaling, Discretization, and Linearization in RNNs for Neural System Modelling [0.0]
リカレントニューラルネットワーク(RNN)は神経活動のモデル化に広く用いられているが、コアプロシージャの数学的相互作用は実現されていない。この研究は、これらの手順が通勤する条件を確立し、計算神経科学の柔軟な応用を可能にした。本研究は, 意思決定と運動制御における神経力学をシミュレートするための生物学的に有効なRNNの設計を, 直接指導するものである。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:27:25 GMT)
Advancing Multimodal In-Context Learning in Large Vision-Language Models with Task-aware Demonstrations [0.0]
LVLM(Large Vision-Language Models)の重要な機能として,マルチモーダルインコンテキスト学習(ICL)が登場している。我々はマルチモーダル ICL の根底にあるコアメカニズムに光を当て、ロバストなインコンテキストのデモシーケンスを構成する上で、タスクマッピングが重要な要素であると認識した。タスク認識機能を備えた軽量で強力なデコーダのみの変換器である textitSabER を提案する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 20:41:41 GMT)
AI2STOW: End-to-End Deep Reinforcement Learning to Construct Master Stowage Plans under Demand Uncertainty [0.0]
本稿では,AI2STOWを提案する。AI2STOWは,要求不確実性の下でマスタープランを作成するための,実現可能性予測とアクションマスクを備えたエンドツーエンドの深層強化学習モデルである。実験の結果,AI2STOWは強化学習やプログラミングのベースライン手法よりも客観的な性能と計算効率が優れていることが示された。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 12:45:25 GMT)
AGITB: A Signal-Level Benchmark for Evaluating Artificial General Intelligence [0.0]
本稿では,AGITB(Artificial General Intelligence Test Bed)を紹介する。 AGITBは、シンボル表現や事前訓練に頼ることなく、時間にわたってバイナリ信号を予測できるモデルの能力を通じて、インテリジェンスを評価する。テストベッドは、事前のバイアスを前提とせず、意味的な意味から独立して動作し、残酷な力や記憶によって解決不可能性を確保する。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 10:01:15 GMT)
A Novel Algorithm for Personalized Federated Learning: Knowledge Distillation with Weighted Combination Loss [0.0]
pFedKD-WCLは知識蒸留と二段階最適化を統合し、非IID課題に対処する。我々は,MNISTデータセットと非IID合成データセットを用いたpFedKD-WCLを,多相ロジスティック回帰モデルと多層パーセプトロンモデルを用いて評価した。
論文参考訳（メタデータ） (Sun, 06 Apr 2025 23:22:03 GMT)