UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding [84.9] 離散表現と連続表現の組み合わせによって視覚入力を符号化する自動回帰生成モデルUniTokenを導入する。
我々の統合ビジュアルエンコーディングフレームワークは、多次元情報を提供しながら、高レベルのセマンティクスと低レベルの詳細の両方をキャプチャする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 09:20:49 GMT)
AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.5] 最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:35:44 GMT)
Retro-Search: Exploring Untaken Paths for Deeper and Efficient Reasoning [84.3] MCTSにインスパイアされた検索アルゴリズムであるRetro-Searchを導入し,大規模モデルから高品質な推論経路を抽出する。
Retro-Searchは、より良い、しかし短いトレースを見つけるための推論パスをふりかえりに修正する。
当社のアプローチでは,モデルが独自のRetro-Search-edトレースに基づいて微調整される自己改善と,弱いから強い改善の2つのユースケースを実現しています。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:23:27 GMT)
Data Scaling Laws for End-to-End Autonomous Driving [83.9] 16時間から8192時間に及ぶ内部駆動データセット上での簡易エンド・ツー・エンド駆動アーキテクチャの性能評価を行った。
具体的には、目標の性能向上を達成するために、どの程度のトレーニングデータが必要かを調査する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:23:48 GMT)
MLLM-as-a-Judge for Image Safety without Human Labeling [81.2] AIGCの時代には、多くの画像生成モデルは有害なコンテンツを生成できる。
確立された安全ルールに基づいて、このような安全でない画像を特定することが不可欠である。
既存のアプローチでは、人間のラベル付きデータセットを使った微調整MLLMが一般的である。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:30:18 GMT)
PRISM: Probabilistic Representation for Integrated Shape Modeling and Generation [79.5] PRISMは、カテゴリー拡散モデルと統計的形状モデル(SSM)とガウス混合モデル(GMM)を統合した3次元形状生成の新しいアプローチである
本手法では,構成SSMを用いて部分レベルの幾何学的変動をキャプチャし,GMMを用いて連続空間における部分意味を表現する。
提案手法は,パートレベルの操作の品質と制御性の両方において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:48:08 GMT)
VSLAM-LAB: A Comprehensive Framework for Visual SLAM Methods and Datasets [64.6] VSLAM-LABは、VSLAMシステムの開発、評価、デプロイを効率化する統合フレームワークである。
VSLAMアルゴリズムのシームレスなコンパイルと構成、データセットの自動ダウンロードと前処理、標準化された実験設計、実行、評価を可能にする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 12:02:19 GMT)
AutoScale: Scale-Aware Data Mixing for Pre-Training LLMs [61.1] より小さなスケールで良好に機能するデータ混合物は、大規模なスケールではその利点を保たない可能性があることを示す。
2段階のスケール対応データ合成フレームワークであるAutoScaleを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:22:39 GMT)
AVadCLIP: Audio-Visual Collaboration for Robust Video Anomaly Detection [57.6] 本稿では,ロバストなビデオ異常検出に音声と視覚の協調を利用する,弱教師付きフレームワークを提案する。
本フレームワークは,複数のベンチマークにおいて優れた性能を示し,オーディオ統合により異常検出精度が大幅に向上する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:59:16 GMT)
HyperVQ: MLR-based Vector Quantization in Hyperbolic Space [56.4] 一般的な解決策は、VQ変分オートエンコーダ(VQVAE)にベクトル量子化(VQ)を採用することである。
本稿では,双曲型多相ロジスティック回帰(MLR)問題としてVQを定式化する新しい手法であるHyperVQを紹介する。
本実験は,HyperVQが従来のVQに比較し,識別性能を上回りながら,生成・再構成タスクに適合することを示した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 23:04:36 GMT)
Better Rates for Random Task Orderings in Continual Linear Models [50.1] 以前見られたタスクの損失を、$k$の繰り返しの後、忘れること、すなわち、分析する。
実現可能な最小二乗の設定において、新しい最期境界を開発し、それらを連続学習に応用する。
タスクを繰り返しないランダム化だけで、十分に長いタスクで破滅的な忘れを防げることが、初めて証明された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 18:39:45 GMT)
DynClean: Training Dynamics-based Label Cleaning for Distantly-Supervised Named Entity Recognition [49.5] 本稿では,トレーニングの進行に伴うモデルの挙動を生かした,トレーニングダイナミクスに基づくラベルクリーニング手法を提案する。
また,遠隔ラベルの誤りを見つけるための自動しきい値推定手法も導入する。
提案手法は,4つのデータセットにまたがる高度なDS-NER手法よりも優れている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:54:42 GMT)
Gating is Weighting: Understanding Gated Linear Attention through In-context Learning [48.9] GLA(Gated Linear Attention)アーキテクチャには、MambaやRWKVといった競合モデルが含まれている。
重み付きプレコンディショニング・グラディエント・ディフレクション(WPGD)アルゴリズムの一般クラスを多層GLAで実装可能であることを示す。
穏やかな条件下では、一意の WPGD 解に対応する大域的最小値の存在と一意性(スケーリングまで)を確立する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 00:37:36 GMT)
Studying the Impact of Early Test Termination Due to Assertion Failure on Code Coverage and Spectrum-based Fault Localization [48.2] 本研究は,アサーション障害による早期検査終了に関する最初の実証的研究である。
6つのオープンソースプロジェクトの207バージョンを調査した。
以上の結果から,早期検査終了は,コードカバレッジとスペクトルに基づく障害局所化の有効性の両方を損なうことが示唆された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:14:09 GMT)
Steering off Course: Reliability Challenges in Steering Language Models [46.3] 本研究では,DoLa,関数ベクトル,タスクベクトルの3つの顕著なステアリング手法を体系的に検討する。
従来の研究とは対照的に、1.5Bから70Bのパラメータを持つ14の家系に属する36のモデルをテストする。
本実験では, ステアリング性能が向上し, 劣化しないモデルが多数存在するため, ステアリング手法の有効性に大きなばらつきが認められた。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 22:19:46 GMT)
ZeroED: Hybrid Zero-shot Error Detection through Large Language Model Reasoning [45.4] 我々は,新しいゼロショット誤り検出フレームワークZeroEDを提案する。
ZeroEDは、特徴表現、エラーラベリング、データ構築のトレーニング、検出器トレーニングの4つのステップで運用されている。
実験の結果、ZeroEDはF1スコアの最大30%改善と最大90%のトークンコスト削減で最先端の手法を大幅に上回ることがわかった。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 10:28:41 GMT)
Experimental evidence of quantum interferences in CO-H$_2$ rotational energy transfer at room temperature [45.0] CO-H$衝突対数系の理論的に予測された量子干渉は、室温で初めて実験的に観測され、理論と実験の間の良好な一致が観察された。
結果は、ポテンシャルエネルギー表面の異方性部分を検証するための貴重なベンチマークを提供し、光解離領域のような熱物性環境におけるCO排出の理論モデリングを支援する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 08:05:31 GMT)
CATP-LLM: Empowering Large Language Models for Cost-Aware Tool Planning [43.1] コスト対応ツール計画のためのLCM(CATP-LLM)フレームワークを提案する。
LLMは、効率的な並行ツールの実行とコスト削減のために、複数のブランチの非逐次計画を生成するために、LLMを強化するためのツール計画言語を組み込んでいる。
OpenCATPの実験では、Llama2-7Bを背骨として使用しても、CATP-LLMはGPT-4より優れていることが示されている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:06:17 GMT)
The Point, the Vision and the Text: Does Point Cloud Boost Spatial Reasoning of Large Language Models? [42.4] 3次元大規模言語モデル (LLM) は点雲における空間情報を利用して3次元空間推論を行う。
いくつかの有望な結果にもかかわらず、3次元空間的推論における点雲の役割は未解明のままである。
textitDoesポイントクラウドは、3D LLMの空間的推論能力を大幅に向上させるのか?
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:38:48 GMT)
Investigating the Scaling Effect of Instruction Templates for Training Multimodal Language Model [42.0] マルチモーダル言語モデル(MLM)のトレーニングアプローチは、命令テンプレートの影響を見落としている。
本研究では,15K以上のユニークな命令テンプレートを生成可能なプログラム型命令テンプレートを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:45:49 GMT)
Constructing the Truth: Text Mining and Linguistic Networks in Public Hearings of Case 03 of the Special Jurisdiction for Peace (JEP) [41.9] コロンビアにおけるいわゆる偽陽性に焦点をあてた、平和のための特別司法裁判所(JEP)の判例03は、コロンビアの武力紛争の中でも最も悲惨な出来事の1つである。
本稿では, 自然言語分析と意味共起モデルに基づく革新的な方法論を提案し, 被害者や出演者の公聴会に存在する物語パターンを探索し, 体系化し, 視覚化する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 02:04:27 GMT)
Deliberate Planning of 3D Bin Packing on Packing Configuration Trees [40.5] オンライン3D Bin Packing Problem (3D-BPP) は産業自動化に広く応用されている。
我々は,新しい階層表現,パッキング構成木(PCT)の学習を通じて,オンライン3D-BPPの実用性を高めることを提案する。
PCTは、ディープ強化学習(DRL)に基づくパッキングポリシー学習を支援するビンパッキングの状況と行動空間について、本格的な記述である。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 09:07:10 GMT)
Domain Generalization for Face Anti-spoofing via Content-aware Composite Prompt Engineering [38.8] 顔アンチ・スプーフィング(FAS)におけるドメイン一般化は、微妙なスプーフィング手がかりに対するドメイン固有の信号の重大な干渉である。
本稿では、インスタンスワイド複合プロンプトを生成するCCPE(Content-Aware Composite Prompt Engineering)を提案する。
CCPEは複数のクロスドメイン実験で有効性を確認し,SOTA(State-of-the-art)の結果を得た。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:00:41 GMT)
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers [36.5] 深度(MoD)の混合は、重要でない層をスキップすることで計算深度を動的に調整する。
MoDアプローチの主な課題は2つある: 1) 重要なレイヤをバイパスする際のパフォーマンス劣化のリスクを回避できるルータとともに、モデル全体をトレーニングする必要があるため、トレーニングコストが高くなる。
本稿では,小さなデータセット上でのみルータを微調整し,フルモデルトレーニングに伴う計算オーバーヘッドを大幅に削減するルータチューニングを提案する。
第2の課題として、動的深さで注意を配置するMindSkipを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 18:27:47 GMT)
WildFeedback: Aligning LLMs With In-situ User Interactions And Feedback [36.1] WildFeedbackは、大規模言語モデル(LLM)との会話中にユーザからのフィードバックをその場で活用して、好みのデータセットを自動的に作成する新しいフレームワークである。
実験の結果,WildFeedbackデータセットを微調整したLCMは,ユーザの好みに合わせて大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:18:53 GMT)
Trust Region Preference Approximation: A simple and stable reinforcement learning algorithm for LLM reasoning [36.0] 本稿では,信頼領域選好近似(TRPA)アルゴリズムを提案する。
好みに基づくアルゴリズムとして、TRPAは報酬ハッキングの問題を自然に排除する。
実験の結果,TRPAは推論タスクの競争性能だけでなく,安定度も高いことがわかった。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:48:26 GMT)
Saliency-driven Dynamic Token Pruning for Large Language Models [32.9] 塩分駆動型動的トケンプルーニング(SDTP)
軽量なサリエンシ駆動予測モジュールは、各トークンの重要度をその隠れ状態で推定するように設計されている。
ランキングに基づく最適化手法を提案し,評価スコアと予測重要スコアのランキングばらつきを最小化する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:15:07 GMT)
From Alexnet to Transformers: Measuring the Non-linearity of Deep Neural Networks with Affine Optimal Transport [32.4] 本稿では,DNNの非線形性シグネチャの概念を紹介する。これはディープニューラルネットワークの非線形性を測定するための,理論上初めての音響解である。
提案した非線形署名の実用性を明らかにするための実験結果について述べる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:31:38 GMT)
Do We Need Responsible XR? Drawing on Responsible AI to Inform Ethical Research and Practice into XRAI / the Metaverse [32.2] このポジションペーパーは,CHI 2025 ワークショップ "Everyday AR through AI-in-the-Loop" のために書かれたものだ。
これは、HCIがResponsible XRを、Responsible AIと並行して定義する必要があるかどうかを反映している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 10:37:09 GMT)
VideoAgent2: Enhancing the LLM-Based Agent System for Long-Form Video Understanding by Uncertainty-Aware CoT [31.4] 本稿では,長時間のビデオ解析に適した特別なチェーン・オブ・シント(CoT)プロセスを提案する。
我々の不確実性を認識したCoTは、外部ツールからのノイズを効果的に軽減し、より信頼性の高い出力を生み出します。
我々は、一般的なコンテキスト取得や特殊なツール設計などの追加モジュールを含むVideoAgent2というシステムで、我々のアプローチを実装している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:03:34 GMT)
CO-Bench: Benchmarking Language Model Agents in Algorithm Search for Combinatorial Optimization [28.2] LLMベースのエージェントは、ソフトウェア工学や機械学習研究のような分野において大きな注目を集めている。
CO-Benchは、広範囲のドメインと複雑性レベルから引き出された36の現実世界のCO問題のベンチマークスイートである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 00:47:43 GMT)
Exact Unlearning of Finetuning Data via Model Merging at Scale [27.4] モデルマージに基づく正確なアンラーニング手法であるSIFT-Masksを提案する。
最大500台のモデルをマージする4つの設定で、SIFT-Masksは単純なマージよりも精度を5~80%向上します。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 21:24:29 GMT)
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning [27.3] 実顔画像の基本表現を学習するための自己教師付き事前学習フレームワークを提案する。
我々のモデルは、教師付き事前学習、視覚的および顔的自己指導型学習技術よりも優れており、タスク特化SOTA法よりも優れています。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:07:12 GMT)
PolyGuard: A Multilingual Safety Moderation Tool for 17 Languages [27.3] PolyGUARDは、LLM(Large Language Models)世代を保護するための、最先端の多言語安全モデルである。
これまでに17言語にまたがる190万のサンプルを含む、最大規模の多言語安全訓練コーパスで訓練されている。
PolyGUARDPROMPTSは、安全ガードレールの評価のための29Kサンプルを用いた高品質な多言語ベンチマークである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:09:21 GMT)
Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers [24.2] コンペティティブ・ポクモン・シングルズ (Competitive Pok'emon Singles, CPS) は、プレイヤーが不完全な情報に基づいて相手を悪用することを学ぶ人気戦略ゲームである。
観察者の3人称視点から保存したログからエージェントの1人称視点を再構築するパイプラインを開発する。
このデータセットは、入力軌跡のみに基づいて相手に適応するように、大規模なシーケンスモデルをトレーニングするブラックボックスアプローチを可能にする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 07:35:15 GMT)
High Probability Complexity Bounds of Trust-Region Stochastic Sequential Quadratic Programming with Heavy-Tailed Noise [23.7] 本稿では,TR-SSQP(Trust-Region Sequential Quadratic Programming)法を提案する。
一階および二階の$epsilon$-stationary点を特定するための高確率複雑性境界を確立する。
提案手法は,光尾雑音設定と同一の高確率1次複雑性を実現する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 22:21:16 GMT)
Building LLM Agents by Incorporating Insights from Computer Systems [23.4] 計算機システムからの洞察を取り入れたLCMエージェントの構築を提唱する。
フォン・ノイマンアーキテクチャに着想を得て,LLMエージェントシステムのための構造化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:38:37 GMT)
MCP-Solver: Integrating Language Models with Constraint Programming Systems [23.2] MCPソルバは、AIシステム統合のオープンソース標準であるModel Context Protocol(MCP)を通じて、シンボル解決器でLarge Language Modelsをブリッジする。
我々の実装は制約プログラミング(Minizinc)、命題満足度(PySAT)、SATモジュラー理論(Python Z3)のためのインターフェースを提供する。
このシステムは、修正中のモデルの一貫性を保証し、構造化された洗練を可能にするために、反復検証を伴う編集アプローチを採用している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 08:39:04 GMT)
WeiDetect: Weibull Distribution-Based Defense against Poisoning Attacks in Federated Learning for Network Intrusion Detection Systems [23.0] WeiDetectは、悪意のある参加者を検知するFLベースのNIDSのための2段階のサーバーサイド防御機構である。
多様な攻撃環境におけるアプローチの有効性を評価する実験を行った。
WeDetectは最先端の防衛アプローチよりも優れています。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:31:24 GMT)
The detection and rectification for identity-switch based on unfalsified control [21.8] マルチオブジェクト追跡(MOT)の目的は、ビデオで検出されたオブジェクトを継続的に追跡し、識別することである。
現在、多目的追跡のためのほとんどの手法は、動き情報をモデル化し、外見情報と組み合わせてオブジェクトを判断・追跡している。
本稿では,多目的追跡におけるIDスウィッチ問題に対処するために,アンファルシフィケート制御を用いる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:11:14 GMT)
Targetless LiDAR-Camera Calibration with Anchored 3D Gaussians [21.1] 任意のシーンからセンサポーズとシーン形状を協調的に最適化するLiDARカメラキャリブレーション手法を提案する。
2つの実世界の自律走行データセットに関する広範な実験により,本手法の有効性を検証した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:00:01 GMT)
New Intent Discovery with Pre-training and Contrastive Learning [20.6] 新しい意図発見は、ユーザ発話から新しい意図カテゴリーを明らかにして、サポート対象クラスのセットを拡張することを目的としている。
既存のアプローチは通常、大量のラベル付き発話に依存する。
新たな意図発見のための2つの重要な研究課題に対する新しい解決策を提供する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 23:25:50 GMT)
Compression Laws for Large Language Models [20.6] 言語モデル(LLM)の圧縮法則を導入する。
我々は、1000ドル以上の実験により、構造化モデル圧縮がLLMに与える影響を実証的に検討した。
以上の結果から, クロスエントロピー損失は圧縮比に比例して2次的に増加することが示唆された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:39:34 GMT)
UFT: Unifying Fine-Tuning of SFT and RLHF/DPO/UNA through a Generalized Implicit Reward Function [18.5] SFTとアライメントを単一のトレーニングステージに統合するUnified Fine-Tuning(UFT)を導入する。
実験結果から,UFTは命令調整データのみにおいて,SFTよりも優れていることが示された。
命令チューニングデータとアライメントデータを組み合わせることで、UFTは破滅的な忘れを効果的に防止する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:40:21 GMT)
Prompting open-source and commercial language models for grammatical error correction of English learner text [18.5] 大規模言語モデル(LLM)は、流動的で文法的なテキストを生成するよう促すことができる。
確立したベンチマークデータセット上で, 文法的誤り訂正(GEC)におけるLLMの性能評価を行った。
いくつかのオープンソースモデルは、最小限の編集ベンチマークで商用モデルよりも優れており、いくつかの設定ではゼロショットプロンプトは、少数ショットプロンプトと同じくらい競争力がある。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:25:39 GMT)
DyCON: Dynamic Uncertainty-aware Consistency and Contrastive Learning for Semi-supervised Medical Image Segmentation [18.1] 動的不確実性を考慮した一貫性とコントラスト学習フレームワークであるDyCONを提案する。
UnCLは、各ボクセルの一貫性損失への寄与を動的に重み付けすることで、グローバルな一貫性を強制する。
FeCLは、二重焦点機構を導入することにより、不均衡領域における局所的特徴識別を強化する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:50:22 GMT)
MedM-VL: What Makes a Good Medical LVLM? [17.9] 従来の浅層モデルとタスク固有のモデルは、臨床実践に必要な複雑さとスケーラビリティに対処する上で、ますます制限されている。
大型言語モデル(LLM)の出現は、医療用大規模視覚言語モデル(LVLM)の開発を促した。
2次元医用画像解析用MedM-VL-2Dと3次元CT用MedM-VL-CT-Chestの2種類をリリースする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 01:44:46 GMT)
Using Language Models to Decipher the Motivation Behind Human Behaviors [17.9] 大規模な言語モデルへの様々なプロンプトによって、人間の行動を完全に引き出すことができることを示す。
そして、どの行動を引き出すのにどのプロンプトが必要なのかを分析することで、人間の行動の背後にあるモチベーションを推測することができる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:30:46 GMT)
Splits! A Flexible Dataset for Evaluating a Model's Demographic Social Inference [17.7] 我々は、集団理論と呼ばれる新しいタスクを定義し、システムでは、人口集団間で表現を区別する理論を書かなければならない。
我々はSplits!の生のコーパスと評価スクリプトをリリースし、研究者がどのようにメソッドを推論するかを判断するのに役立つ。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 23:17:07 GMT)
Mitigating the Human-Robot Domain Discrepancy in Visual Pre-training for Robotic Manipulation [16.8] そこで本研究では,容易に利用可能な人間ロボットのビデオデータを利用して,ドメインギャップを埋める新しい適応パラダイムを提案する。
提案手法では,人間とロボットのビデオのセマンティクスを整列させるために,人間ロボットのアライメント損失を用いて,事前学習したモデルをパラメータ効率よくロボット領域に適応させる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:46:32 GMT)
StyleRec: A Benchmark Dataset for Prompt Recovery in Writing Style Transformation [16.7] 本稿では,スタイル転送とリフレージングのためのプロンプトの再構築に焦点をあてた,ユニークなプロンプト回復タスクについて検討する。
LLMアシストで作成されたデータセットを導入し、複数の技術による品質保証を行う。
この結果から, 単発・微調整で最高の結果が得られたが, 従来の文類似度指標の欠陥が強調された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:02:28 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1] 本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。
計算効率,近似誤差,プライバシ保護,解釈可能性の4つの主な課題について考察した。
異なるDAタスクでSVアプリケーションを開発するための,モジュール的でオープンソースなフレームワークであるSVBenchを実装している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:04:37 GMT)
EE-MLLM: A Data-Efficient and Compute-Efficient Multimodal Large Language Model [15.4] 視覚と言語相互作用の現在のアプローチは、自己注意に基づく方法と、相互注意に基づく方法の2つのカテゴリに分類される。
MLLMの自己注意機構を複合注意機構に変更した。
EE-MLLMは、限られたトレーニングデータでFlamingoを著しく上回り、H800 GPUでプリフィル時間を79msに短縮する。
本稿では,EE-MLLM-Fという学習不要な変種について述べる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 18:52:08 GMT)
Decoding Recommendation Behaviors of In-Context Learning LLMs Through Gradient Descent [15.4] 本稿では,理論モデル LLM-ICL Recommendation Equivalent Gradient Descent Model (LRGD) を提案する。
LLMにおけるICL推論プロセスは、その二重モデルのトレーニング手順と一致し、二重モデルの試験出力に相当するトークン予測を生成する。
さらに実演効率を向上し,性能崩壊を防止し,長期適応性を確保するため,実演における2段階最適化プロセスを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:36:45 GMT)
A Self-Supervised Paradigm for Data-Efficient Medical Foundation Model Pre-training: V-information Optimization Framework [15.4] 大規模データセット上での自己教師付き事前トレーニング医療基盤モデルは、例外的なパフォーマンスを示す。
近年の研究では、データ効率のよい学習手法を導入して、この共通パラダイムに挑戦している。
本稿では, 基本モデルの自己教師型事前学習にV情報を導入し, サンプル選択の理論的基礎を提供する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 02:50:25 GMT)
Toward LLM-Agent-Based Modeling of Transportation Systems: A Conceptual Framework [15.1] 交通システムのための汎用LLMエージェントに基づくモデリングフレームワークを提案する。
我々の概念的枠組み設計は、人間の旅行者の意思決定と相互作用の過程と特性を忠実に再現する。
LLMエージェントに基づくモデリングフレームワークのさらなる改良が必要であるが、本手法は輸送システムのモデリングとシミュレーションを改善する可能性を秘めていると信じている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:58:40 GMT)
Planning Safety Trajectories with Dual-Phase, Physics-Informed, and Transportation Knowledge-Driven Large Language Models [14.0] LetsPiは、安全で人間らしい軌道計画のための、物理インフォームドで二相的、知識駆動のフレームワークである。
幻覚を防ぎ、不確実性を最小化するために、このハイブリッドフレームワークは、物理学的インフォームド・ソーシャル・フォース・ダイナミクスによるLarge Language Model (LLM)推論を統合している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:34:33 GMT)
Enhance Then Search: An Augmentation-Search Strategy with Foundation Models for Cross-Domain Few-Shot Object Detection [14.0] 広範囲なデータセットで事前訓練されたファンデーションモデルは、クロスドメインの少数ショットオブジェクト検出タスクにおいて顕著に機能している。
画像ベースデータ拡張手法とグリッドベースサブドメイン探索戦略の統合は,これらの基盤モデルの性能を著しく向上させることがわかった。
本研究は,データスカース環境における視覚言語モデルの実践的展開を著しく推し進めるものである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:30:35 GMT)
All-vortex nonlinear Compton scattering in a polarized laser field [13.6] 強い偏光レーザー場における全渦非線形コンプトン散乱の過程を理論的に研究した。
我々は、軌道角運動量(OAM)とスピン角運動量の交換を研究することができるプロセスの形式論を発展させる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 09:38:45 GMT)
End-to-end Feature Selection Approach for Learning Skinny Trees [13.4] 木アンサンブルにおける特徴選択のための最適化に基づく新しい手法を提案する。
Skinny Treesは、ツリーアンサンブルの機能選択のためのエンドツーエンドツールキットである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:10:53 GMT)
STQS: A Unified System Architecture for Spatial Temporal Quantum Sensing [13.4] 分散量子センシングのための統合システムアーキテクチャSTQSを提案する。
包括的なゲートベースのフレームワークを用いることで、量子センシングスキームの設計空間を体系的に探求する。
本稿では,参照状態と検出状態を比較し,信頼度を割り当てる新しい距離ベースメトリクスを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 21:10:49 GMT)
Active Learning with a Noisy Annotator [13.3] ノイズ対応アクティブサンプリング(NAS)と呼ばれる新しいフレームワークを提案する。
NASは、ノイズの多い代表者の選択により発見されていない領域を特定し、これらの領域の再サンプリングを可能にする。
NASは、様々なノイズタイプとレートで標準的なアクティブラーニング手法の性能を著しく向上させる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:27:27 GMT)
Predicting Census Survey Response Rates With Parsimonious Additive Models and Structured Interactions [12.8] 本研究では, フレキシブルで解釈可能な非パラメトリックモデル群を用いて, アンケート応答率を予測することの問題点を考察する。
この研究は、米国国勢調査局(US Census Bureau)の有名なROAMアプリケーションによって動機付けられている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 02:27:46 GMT)
Towards Super-polynomial Quantum Speedup of Equivariant Quantum Algorithms with SU($d$) Symmetry [12.7] 本稿では,多数の機械学習タスクに適した等価畳み込み量子アルゴリズムの枠組みを提案する。
これにより、置換量子コンピューティング(PQC)という量子計算の自然なモデルを強化し、より強力なモデル、PQC+を定義することができます。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 04:25:29 GMT)
Can SGD Select Good Fishermen? Local Convergence under Self-Selection Biases and Beyond [11.9] 我々は,$doperator次元の自己選択バイアスを持つ線形回帰器を$k$で推定する問題を再検討する。
我々の主な結果は、この問題に対する$namepoly(d,k,1/varepsilon) + kO(k)$ time algorithmである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:59:12 GMT)
Foundation Models for Software Engineering of Cyber-Physical Systems: the Road Ahead [11.9] ファンデーションモデル(FM)は、様々なソフトウェアエンジニアリング活動をサポートするためにますます使われています。
CPS(Cyber-Physical Systems)のソフトウェア工学への応用も増加している。
そこで本研究では,CPSソフトウェア工学の様々なフェーズにFMを統合するための研究ロードマップを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 21:42:02 GMT)
Generative Large Language Models Trained for Detecting Errors in Radiology Reports [11.9] このデータセットは、特定のプロンプトを用いてGPT-4によって生成された1,656の合成胸部放射線学報告を含む。
Llama-3、GPT-4、BiomedBERTなどいくつかのモデルはゼロショットプロンプト、少数ショットプロンプト、微調整戦略を用いて改良された。
ゼロショットプロンプトを用いることで、微調整のLlama-3-70B-Instructモデルは、否定誤差0.769、左右誤差0.772、間隔変更エラー0.750、転写エラー0.828、全体の0.780というF1スコアで最高のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:02:36 GMT)
DeepProtein: Deep Learning Library and Benchmark for Protein Sequence Learning [11.8] DeepProteinは、タンパク質関連のタスクに適した、ユーザフレンドリーなディープラーニングライブラリだ。
これにより、最先端のディープラーニングモデルでタンパク質データをシームレスに処理できる。
一連の微調整されたProt-T5ベースのモデルであるDeepProt-T5は、4つのベンチマークタスクで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 18:40:55 GMT)
BrainMRDiff: A Diffusion Model for Anatomically Consistent Brain MRI Synthesis [11.7] BrainMRDiffは、脳MRIのための新しいトポロジー保存、解剖学的誘導拡散モデルである。
これを実現するために,腫瘍+構造凝集(TSA)とトポロジーガイド解剖保存(TGAP)の2つの重要なモジュールを紹介した。
TSAは様々な解剖学的構造と腫瘍情報を統合し、拡散過程の包括的な条件付け機構を形成する。
BrainMRDiffは既存のベースラインを超え、BraTS-AGデータセットで23.33%、BraTS-Metデータセットで33.33%のパフォーマンス改善を実現している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:16:50 GMT)
M2IV: Towards Efficient and Fine-grained Multimodal In-Context Learning in Large Vision-Language Models [11.5] 学習可能なtextbfVectors を LVLM に直接組み込んだ明示的なデモンストレーションを代用する textbfM2IV を提案する。
M2IVは、トレーニングを通じて堅牢なクロスモーダル忠実度と微粒なセマンティック蒸留を実現する。
実験の結果、M2IVはVanilla ICLと先行表現工学のアプローチを超越していることがわかった。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 22:02:21 GMT)
REFORMER: A ChatGPT-Driven Data Synthesis Framework Elevating Text-to-SQL Models [11.5] 本稿では,ChatGPTの能力を活用するフレームワークであるREFORMERを提案する。
我々のデータ拡張アプローチは、マスク付き質問を埋めて新しい質問を生成する「検索と編集」手法に基づいている。
以上の結果から,ChatGPTが生成したパラフレージング質問が元のデータを増やすのに有効であることが確認された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:27:37 GMT)
Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.4] 大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。
LLMは、しばしばSQL生成に焦点を合わせ、現実世界の会話クエリの複雑さを無視している。
LLMの問合せ分類とSQL生成能力を評価するためのテストスイートMMを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 09:47:45 GMT)
Privacy in Fine-tuning Large Language Models: Attacks, Defenses, and Future Directions [11.3] 細調整された大規模言語モデル(LLM)は、様々な領域で最先端のパフォーマンスを達成することができる。
本稿では、微調整LDMに関連するプライバシー問題に関する包括的調査を行う。
メンバーシップ推論、データ抽出、バックドア攻撃など、さまざまなプライバシ攻撃に対する脆弱性を強調します。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 10:28:21 GMT)
SAM2MOT: A Novel Paradigm of Multi-Object Tracking by Segmentation [11.2] Segment Anything 2 (SAM2)は、セグメンテーションを使った堅牢な単一オブジェクト追跡を可能にする。
本稿では,新しいトラッカーであるSAM2MOTを提案する。
Tracking by DetectionやTracking by Queryとは異なり、SAM2MOTはセグメンテーションマスクから直接トラッキングボックスを生成する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:32:08 GMT)
Dissipation-Driven Transition of Particles from Dispersive to Flat Bands [11.2] 結合の散逸は分散バンドから平らなバンドへと粒子を駆動できることを示す。
これにより、オープン量子系におけるFB物理学の新たな道が開かれる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 07:53:15 GMT)
Opening the black box of deep learning: Validating the statistical association between explainable artificial intelligence (XAI) and clinical domain knowledge in fundus image-based glaucoma diagnosis [10.9] 緑内障分類における深層学習モデルの意思決定過程を明らかにする。
VGG-11、ResNet-18、DeiT-Tiny、Swin Transformer-Tinyを含む4つのディープニューラルネットワークを開発した。
我々の研究は、ディープニューラルネットワーク臨床医間の決定論理の収束の証拠を提供する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:57:34 GMT)
Unsupervised Domain Adaptation with Dynamic Clustering and Contrastive Refinement for Gait Recognition [10.8] 歩行認識は、個人の歩行パターンを分析することによって、遠くにいる個人を識別する新興技術である。
近年,クラスタリングに基づく教師なし領域適応手法を用いて,教師なし歩行認識について検討している。
本稿では,クラスタリングとモデルトレーニングにおけるノイズの多い擬似ラベルの影響を低減することを目的とした,GaitD CCRと呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 12:37:04 GMT)
LUIEO: A Lightweight Model for Integrating Underwater Image Enhancement and Object Detection [10.6] 本稿では,水中画像の強調と検出精度の向上を同時に行うマルチタスク学習手法を提案する。
統合モデルは、情報通信と異なるタスク間の共有を動的に調整することを可能にする。
数値実験により,提案モデルが視覚性能,物体検出精度,検出効率を満足できることを示す。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 12:37:41 GMT)
AdaptRec: A Self-Adaptive Framework for Sequential Recommendations with Large Language Models [10.5] AdaptRecは、明示的な協調シグナルを組み込むことで、シーケンシャルなレコメンデーションのためにLarge Language Modelsを活用する、自己適応型のフラムワークである。
本研究では,その行動系列を自然言語に変換するユーザコンテキスト適応型レコメンデーション・プロンプトを開発し,これらの情報をレコメンデーション・プロセスに明示的に統合する。
AdaptRecの優れたパフォーマンスを示す実験では、HitRatio@1スコアの7.13%、18.16%、10.41%が現実世界のデータセットで大幅に改善されている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 00:30:50 GMT)
Verification with Transparency: The TrendFact Benchmark for Auditable Fact-Checking via Natural Language Explanation [10.4] 我々は、構造化された自然言語の説明を取り入れた最初の中国のファクトチェックベンチマークであるTrendFactを紹介する。
TrendFactは、トレンドのソーシャルメディアコンテンツとプロのファクトチェックレポジトリから、7,643の慎重にキュレートされたサンプルで構成されている。
数値的推論、論理的推論、常識的検証など、様々な推論形式をサポートしている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:15:55 GMT)
DataRec: A Python Library for Standardized and Reproducible Data Management in Recommender Systems [10.3] DataRecはPythonベースのライブラリで、レコメンデーションシステム研究におけるデータ処理の統合と合理化を目的としている。
データセットの準備、データバージョニング、シームレスな統合のためのルーチンを提供することで、DataRecは方法論の標準化を促進する。
私たちの貢献は、より広範なレコメンデーションシステムコミュニティにおいて、公正で、ベンチマークを行い、実験結果に対する信頼性を高めます。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 07:29:36 GMT)
Tight Regret Bounds for Fixed-Price Bilateral Trade [10.2] ほぼ最適の$widetildeTheta(T2/3)$ tight bound for $textsfGlobal Budget Balance$ fixed-price mechanism with two-bit/one-bit feedback。
相関値/逆値の場合、$Omega(T3/4)$ lower bound for $textsfGlobal Budget Balance$ fixed-price mechanism with two-bit/one-bit feedback。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:56:42 GMT)
Advancing Egocentric Video Question Answering with Multimodal Large Language Models [10.1] Egocentric Video Question Answering (QA)は、長期的時間的推論、個人的視点、頻繁なカメラムーブメントのような特殊な課題を扱うモデルを必要とする。
本稿では,QaEgo4Dv2上で,プロプライエタリおよびオープンソースのMultimodal Large Language Models(MLLM)を体系的に評価する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:58:23 GMT)
PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures [10.0] 実PIMシステム上でグラフニューラルネットワークを高速化する,効率的なMLライブラリであるPyGimを紹介する。
我々は、計算集約型およびメモリ集約型カーネルをプロセッサ中心およびメモリ中心のシステムで実行するハイブリッドGNN実行を提供する。
我々は、1992年のPIMコアを持つ実世界のPIMシステム上で、新しいGNNモデルを用いてPyGimを広範囲に評価し、Intel Xeonの最先端CPUを平均3.04倍に上回っていることを示す。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:54:52 GMT)
SiameseDuo++: Active Learning from Data Streams with Dual Augmented Siamese Networks [8.8] この研究は、アクティブラーニングを使用して、予算に応じてラベル付けする人間のエキスパートのインスタンスを自動的に選択する、SiameseDuo++メソッドを提案する。
具体的には、シナジーで動作し、生成された例によって強化される2つのシアムニューラルネットワークをインクリメンタルにトレーニングする。
シミュレーション実験により,提案手法は学習速度および/または性能の点で,強いベースラインと最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:45:25 GMT)
Artificial Intelligence for Software Architecture: Literature Review and the Road Ahead [8.7] 本稿では,人工知能駆動型ソフトウェアアーキテクチャの展望について述べる。
我々は,人工知能がアーキテクチャ設計の自動化,定量的トレードオフ分析のサポート,アーキテクチャ文書の更新を継続的に行う方法について検討する。
結果として得られたロードマップは、ソフトウェアアーキテクチャへの14の現在の人工知能コントリビューションの概要と、アーキテクチャタスクをサポートするための6つの人工知能固有の課題を特定し、将来の改善のための6つの方法を明らかにしている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:00:07 GMT)
Crowdsourcing-Based Knowledge Graph Construction for Drug Side Effects Using Large Language Models with an Application on Semaglutide [8.6] ソーシャルメディアは、薬物移動のための貴重な患者体験情報をキャプチャする、現実世界の豊富なデータ源である。
大規模言語モデル(LLM)を利用して、ソーシャルメディアから薬物副作用を抽出し、それらを知識グラフ(KG)に整理するフレームワークを提案する。
構築した知識グラフを用いて、様々なセマグルチドブランドにまたがる報告された副作用を経時的に分析する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:47:44 GMT)
REINFORCE++: An Efficient RLHF Algorithm with Robustness to Both Prompt and Reward Models [8.6] REINFORCE++は、バッチの正規化報酬をベースラインとして使用しながら、批判モデルを削除する新しいアプローチである。
プロンプトセットのトランケーションを必要とせずに、様々な報酬モデルに対して堅牢なパフォーマンスを示す。
既存のREINFORCE法と比較して、RLHFとロングチェーン設定の両方において優れた一般化を実現している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 02:23:29 GMT)
Dynamic Neural Field Modeling of Visual Contrast for Perceiving Incoherent Looming [7.9] AmariのDynamic Neural Field (DNF)フレームワークは、神経細胞グループの平均活性化をモデル化するための脳にインスパイアされたアプローチを提供する。
我々は、専用DNFによって管理されるON/OFF視覚コントラストのモデリングを組み込むことで、DNFを拡張した。
提案モデルでは,非コヒーレントなロケスト検出問題に効果的に対処し,最先端のロケストインスパイアされたモデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:04:14 GMT)
"You just can't go around killing people" Explaining Agent Behavior to a Human Terminator [7.8] 人間の介入数を最適化するための説明可能性スキームを提案する。
本稿では、この設定を形式化し、人間の介入数を最適化するための説明可能性スキームを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 19:29:45 GMT)
Fingerprinting Implementations of Cryptographic Primitives and Protocols that Use Post-Quantum Algorithms [7.4] 我々はキー交換とデジタル署名プリミティブを解析し,フィンガープリント後量子(PQ)アルゴリズムの実現可能性を評価する。
プロトコルレベルの分析では、PQキー交換の存在とタイプを検出することができる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:17:18 GMT)
An overview of model uncertainty and variability in LLM-based sentiment analysis. Challenges, mitigation strategies and the role of explainability [6.8] 本稿では,大規模言語モデル(LLM)におけるモデル変数問題(MVP)を体系的に検討する。
MVPの特徴は、一貫性のない感情分極、推論メカニズムに起因する不確実性、迅速な感度、トレーニングデータのバイアスである。
この研究は、より信頼性が高く説明可能な、堅牢な感情分析モデルの開発に役立ち、金融、医療、政策立案といった高度な分野への展開を促進する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 12:20:39 GMT)
ODverse33: Is the New YOLO Version Always Better? A Multi Domain benchmark from YOLO v5 to v11 [6.6] 主要な疑問は、新しいYOLOバージョンのリリース頻度の増加にある。
各YOLOバージョンの中核となるイノベーションはどのようなもので、これらの変更が実際のパフォーマンス向上にどのように変換されるのか?
本稿では、YOLOv1からYOLOv11への重要なイノベーションを要約し、ODverse33と呼ばれる包括的なベンチマークを導入し、実世界のマルチドメインアプリケーションにおけるモデル改善の実践的影響について検討する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:21:38 GMT)
A Survey of State of the Art Large Vision Language Models: Alignment, Benchmark, Evaluations and Challenges [6.5] VLM(Multimodal Vision Language Models)は、コンピュータビジョンと自然言語処理の共通点において、トランスフォーメーショントピックとして登場した。
研究の急速な進歩と様々なアプリケーションでの人気が高まる中、我々はVLMの総合的な調査を行っている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:12:51 GMT)
REvolve: Reward Evolution with Large Language Models using Human Feedback [6.5] 大規模言語モデル(LLM)は、自然言語のタスク記述から報酬を生成するために使われてきた。
人間のフィードバックによって導かれるLLMは、人間の暗黙の知識を反映する報酬関数を定式化するのに用いられる。
強化学習における報酬設計にLLMを使用する,真に進化的なフレームワークであるRevolveを紹介する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:42:37 GMT)
Estimating Coverage in Streams via a Modified CVM Method [5.3] サンプルのカバレッジである$C$は、ランダムに選択された個人がサンプルに表されるクラスに属する確率として定義される。
C$は固定された人口パラメータではなく、サンプルの特性であるため、カバレッジの推定は困難である。
本稿では,CVMアルゴリズムの簡単な修正に基づいて,ストリーミング設定において$C$を推定する簡易かつ効率的な手法を提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:57:00 GMT)
Model Context Protocol (MCP): Landscape, Security Threats, and Future Research Directions [5.2] Model Context Protocol(MCP)は、AIモデルと外部ツールとリソースのシームレスな相互作用を可能にするために設計された標準化されたインターフェースである。
本稿では,MPP サーバのコアコンポーネント,ワークフロー,ライフサイクルに焦点をあてた総合的な MCP の概要について述べる。
我々は、各フェーズに関連するセキュリティとプライバシのリスクを分析し、潜在的な脅威を軽減するための戦略を提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:32:33 GMT)
AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents [5.0] 私たちは、20の現実世界のAndroidアプリに116のプログラムタスクに対して報酬信号を提供する、完全に機能するAndroid環境であるAndroidWorldを紹介します。
静的テストセットを提供する既存のインタラクティブ環境とは異なり、AndroidWorldはパラメータ化され自然言語で表現されるタスクを動的に構築する。
私たちの最高のエージェントは、AndroidWorldのタスクの30.6%を完了できます。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:37:50 GMT)
Extending Cox Proportional Hazards Model with Symbolic Non-Linear Log-Risk Functions for Survival Analysis [4.9] 我々は、生存分析の新しい手法であるGeneralized Cox Proportional Hazards (GCPH)モデルを導入する。
GCPHは従来のCPHモデルの解釈可能性を維持しつつ、非線形ログリスク関数の推定を可能にする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 04:35:11 GMT)
EclipseNETs: Learning Irregular Small Celestial Body Silhouettes [4.9] 不規則な小さな天体を取り巻く日食の正確な予測は、宇宙船の航法、軌道決定、宇宙船システム管理に不可欠である。
本稿では,日食条件を効率的にかつ確実にモデル化するために,ニューラルな暗黙表現を活用する新しいアプローチを提案する。
ベンヌ、伊藤川、67P/Churyumov-Gerasimenko、Erosの4体で試験された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:51:44 GMT)
How Accurately Do Large Language Models Understand Code? [4.8] 大規模言語モデル(LLM)は、コードの修復やテストといった開発後のタスクでますます使われています。
コードの理解の定量化は、その抽象的な性質と標準化されたメトリクスの欠如のために難しい。
本稿では,LLMのコード理解能力に関する大規模な実証的研究を行った。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:59:29 GMT)
Exploring Generative AI Techniques in Government: A Case Study [4.8] カナダ国立研究評議会(NRC)は、GenAI技術の統合を日々の性能向上のために調査するパイロットイニシアチブを開始した。
本稿では,NRCにおけるパフォーマンス計測,データ管理,インサイトレポートの自動化を目的とした,インテリジェントエージェントPubbieの開発を事例として紹介する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:52:38 GMT)
On the Spatial Structure of Mixture-of-Experts in Transformers [4.7] MoEルータは、主に専門家の選択にセマンティック機能を利用する。
本研究は,位置トークン情報も経路決定において重要な役割を果たすことを示すことによって,この概念に挑戦する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:31:55 GMT)
A Consequentialist Critique of Binary Classification Evaluation Practices [4.6] ICML、FAccT、CHILといった主要なカンファレンスでは、トップKメトリクスや一定のしきい値が好まれています。
我々は、この決定論的フレームワークを使用して、評価指標を最適なユースケースにマッピングし、Pythonパッケージであるbriertoolsとともに、より広範なBrierスコアの採用を促進する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:58:01 GMT)
Post-Quantum Wireless-based Key Encapsulation Mechanism via CRYSTALS-Kyber for Resource-Constrained Devices [4.6] 本稿では、リソース制約のあるデバイスで使用されるポスト量子暗号システムに適応する問題を考察する。
本稿では,ポスト量子公開鍵暗号方式の実装の複雑さを最小限に抑えるために,無線通信チャネルの特性を活用することを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:57:00 GMT)
STGCN-LSTM for Olympic Medal Prediction: Dynamic Power Modeling and Causal Policy Optimization [4.5] 本稿では,オリンピックのメダル分布を予測するための新しいハイブリッドモデル STCN-LSTM を提案する。
国家間の関係の強固さと国家パフォーマンスの長期的な依存関係を統合する。
結果は、コーチングのモビリティ、イベントの分散、そして戦略的投資がメダル予測に与える影響に光を当てた。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:33:07 GMT)
iADCPS: Time Series Anomaly Detection for Evolving Cyber-physical Systems via Incremental Meta-learning [4.4] サイバー物理システム(ADCPS)の異常検出は、障害や潜在的な攻撃の特定に不可欠である。
我々はメタラーニングに基づく段階的なアプローチ,すなわちiADCPSを提案し,モデルを継続的に更新する。
3つのPUMPデータセットを用いて,iADCPSの有効性を実証的に評価した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:02:31 GMT)
FedQUIT: On-Device Federated Unlearning via a Quasi-Competent Virtual Teacher [4.3] フェデレートラーニング(FL)システムは、個々のデータの集中的な収集を必要とせずに、機械学習モデルの協調的なトレーニングを可能にする。
本稿では,FedQUITを提案する。FedQUITは知識蒸留を用いて,FLグローバルモデルからデータへの寄与を隠蔽する新しいアルゴリズムである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:53:01 GMT)
SelfSplat: Pose-Free and 3D Prior-Free Generalizable 3D Gaussian Splatting [4.1] ポーズフリーで3次元の事前自由な一般化可能な3次元再構成を実現するための新しい3次元ガウススプラッティングモデルであるSelfSplatを提案する。
本モデルでは,これらの課題に対して,自己教師付き深度とポーズ推定手法を効果的に統合することによって対処する。
提案手法の性能を評価するため,RealEstate10K,ACID,DL3DVなどの大規模実世界のデータセットを用いて評価を行った。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:08:27 GMT)
Your Image Generator Is Your New Private Dataset [4.1] 生成拡散モデルは、トレーニングデータを合成的に生成する強力なツールとして登場した。
本稿では,これらの課題に対処するために,テクスチャ・コンディションド・ナレッジ・リサイクリング・パイプラインを提案する。
パイプラインは10の多様な画像分類ベンチマークで厳格に評価されている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 18:46:08 GMT)
A Novel Cholesky Kernel based Support Vector Classifier [3.8] Support Vector Machine (SVM)は、一般的な教師付き分類モデルである。
この研究は、データの分散共分散構造の影響を調節する新しいColesky Kernelを提案する。
CholeskyカーネルベースのSVMの有効性は、ウィスコンシン乳癌(診断)データセットを分類することによって実証される。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:57:33 GMT)
Economic Battery Storage Dispatch with Deep Reinforcement Learning from Rule-Based Demonstrations [3.6] 本研究では,ソフトアクター・クリティック(SAC)を拡張し,実演から学習するアプローチを提案する。
グリッド接続型マイクログリッドのケーススタディを行い、電力の通販価格に基づくif-then-else文を用いてデモを収集する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 02:16:42 GMT)
DDPT: Diffusion-Driven Prompt Tuning for Large Language Model Code Generation [3.4] 大規模言語モデル(LLM)は、コード生成において顕著な能力を示している。
生成されたコードの品質は、使用するプロンプトの構造と構成に大きく依存する。
本稿では,ガウス雑音から最適なプロンプト埋め込みを生成する方法を学習する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 04:19:19 GMT)
Compiler Optimization Testing Based on Optimization-Guided Equivalence Transformations [3.3] 本稿では,コンパイラ最適化にインスパイアされたメタモルフィックテスト手法を提案する。
提案手法ではまず,最適化条件を満たす入力プログラムを生成するために,最適化されたコード構築戦略を用いる。
事前変換プログラムと後変換プログラムの出力を比較することで、不正な最適化バグを効果的に識別する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 01:37:57 GMT)
Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation [3.2] 本稿では,タンパク質言語モデル(pLM)の新規ファミリーであるProt42を紹介する。
注目すべきは、我々のモデルは最大8,192個のアミノ酸を処理し、標準的制限をはるかに超えていることだ。
Prot42は高親和性タンパク質結合体と配列特異的DNA結合タンパク質を産生する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:43:12 GMT)
Learning Conditionally Independent Transformations using Normal Subgroups in Group Theory [3.2] 教師なし表現学習における根本的な課題は、学習された特徴表現において異なる変換を分離することである。
既存の手法は代数的独立性に基づいて変換を分解するが、これらの手法は主に可換変換に焦点を当てる。
条件付き独立変換の分離を可能にするために,正規部分群を活用する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:45:43 GMT)
AnomalyHybrid: A Domain-agnostic Generative Framework for General Anomaly Detection [3.2] AnomalyHybridは、本物で多様な異常を生成するために設計されたドメインに依存しないフレームワークである。
AnomalyHybridはGAN(Generative Adversarial Network)ベースのフレームワークで、参照画像の外観をそれぞれターゲット画像の深さとエッジ構造に統合する2つのデコーダを備えている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 03:28:30 GMT)
Attributed Synthetic Data Generation for Zero-shot Domain-specific Image Classification [3.0] 本稿では,属性付きプロンプトを生成するために,大規模言語モデルを活用するAttrSynを提案する。
2つのきめ細かいデータセットに対するゼロショットドメイン固有の画像分類の実験では、AttrSynが生成した合成画像によるトレーニングがCLIPのゼロショット分類を著しく上回っている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:54:10 GMT)
Pre-trained Language Models and Few-shot Learning for Medical Entity Extraction [3.0] 本研究では,Transformer を用いた医療機関抽出手法を提案する。
医療用テキストの専門性や複雑さを考慮すると、様々な事前訓練された言語モデルの性能を比較する。
わずかながらの学習は、医療機関抽出の精度を高めることができる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:36:33 GMT)
Transport information Bregman divergences [2.8] L2$-ワッサーシュタイン計量に埋め込まれた確率密度空間におけるブレグマンの発散について検討する。
特に、$L2$-ワッサーシュタイン空間における負ボルツマン・シャノンエントロピーのブレグマン発散(英語版)により、輸送クルバック・リーバー(英語版)(KL)の発散を導出する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 01:36:25 GMT)
Future-Proof Yourself: An AI Era Survival Guide [2.7] Future-Proof Yourselfは、読者が急速に変化する人工知能の世界をナビゲートする実践的なガイドだ。
この本は、コンピュータがシンプルで相対的な言葉でデータからどのように学習するかを説明することから始まる。
機械学習の基本的なアイデアが、画像を認識し、言語を理解し、さらには意思決定できる高度なシステムへとどのように進化していくかを示している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:11:29 GMT)
Systematic Literature Review on Vehicular Collaborative Perception -- A Computer Vision Perspective [2.7] コラボレーティブ・パーセプション(CP)は、これらの問題を緩和するための有望な解決策として登場した。
この研究は、PRISMA 2020ガイドラインに従い、106のピアレビュー記事を含む。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 21:56:04 GMT)
Towards Source Mapping for Zero-Knowledge Smart Contracts: Design and Preliminary Evaluation [2.6] 本稿では,zkSolcコンパイルパイプライン内のSolidityソースコード,LLVM IR,zkEVMバイトコード間のトレーサビリティを確立するためのソースマッピングフレームワークを提案する。
我々は,50のベンチマークコントラクトと500の現実世界のzkSyncコントラクトのデータセット上でフレームワークを評価し,標準のSolidity構造に対して約97.2%のマッピング精度を観測した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 01:42:07 GMT)
Identity-related Speech Suppression in Generative AI Content Moderation [2.6] 生成AIシステムは、そのようなフィルタを使用して、望ましくない生成されたコンテンツがユーザによって作成または提示されるのを防ぐ。
我々は,さまざまなコンテンツモデレーションAPIによって誤ってフィルタリングされた異なるアイデンティティグループに関連する音声に焦点を当て,音声抑圧の尺度を定義し,導入する。
従来のAIデータと生成AIデータに対する識別関連音声抑圧の違いは、生成AIデータに対してAPIが優れているが、より長いテキストインスタンスやアイデンティティによって、不正確なフラグング動作のID固有の理由によって、より悪いものになっている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 00:30:38 GMT)
Statistical Guarantees Of False Discovery Rate In Medical Instance Segmentation Tasks Based on Conformal Risk Control [2.5] インスタンスセグメンテーションは、病変、腫瘍、解剖学的構造の正確な局在化とデライン化を可能にすることで、医療画像解析において重要な役割を担っている。
Mask R-CNNやBlendMaskのようなディープラーニングモデルは目覚ましい進歩を遂げているが、リスクの高い医療シナリオにおけるそれらの応用は、信頼性の校正の問題によって制限されている。
本稿では,この課題に対処するために,共形予測理論に基づく堅牢な品質制御フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:31:19 GMT)
Scenario Understanding of Traffic Scenes Through Large Visual Language Models [2.3] 大規模ビジュアル言語モデル(LVLM)は、画像解析とコンテキストクエリによる分類を自動化することで、魅力的なソリューションを提供する。
本研究では,LVLMが社内データセットとBDD100Kの両方で都市交通シーンを理解し,分類する能力を評価する。
我々は、最先端モデルを統合するスケーラブルなキャプションパイプラインを提案し、新しいデータセットに柔軟なデプロイを可能にする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 18:21:08 GMT)
Attention-Driven LPLC2 Neural Ensemble Model for Multi-Target Looming Detection and Localization [2.3] ハエの視覚系における2型視覚投射ニューロン(LPLC2)は、高い光沢選択性を有する。
既存のLPLC2ニューロンのモデルでは、個々の細胞に集中してセントロイドに焦点を絞った拡張を検出したり、集団投票戦略を利用して地球規模の衝突情報を得る。
本研究では,移動感応性ニューラルパスによって誘導されるボトムアップアテンション機構を利用して,LPLC2集団の数値モデルを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:07:57 GMT)
An Empirical Comparison of Text Summarization: A Multi-Dimensional Evaluation of Large Language Models [2.2] 本研究は17大言語モデル(OpenAI, Google, Anthropic, オープンソース)の要約性能を評価する。
事実整合性、意味的類似性、語彙重なり、人間に似た品質の指標を用いて、7つの多様なデータセットのモデルを評価した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:24:22 GMT)
FluentLip: A Phonemes-Based Two-stage Approach for Audio-Driven Lip Synthesis with Optical Flow Consistency [2.2] この研究は、オーディオ駆動唇合成のための2段階アプローチであるFluentLipを提案する。
我々は、音素抽出器とエンコーダを統合し、マルチモーダル学習のための音声と音素情報の融合を生成する。
提案したFluentLipを,5つの最先端(SOTA)アプローチと比較し,広範囲な実験により評価した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 09:44:30 GMT)
A Survey of Social Cybersecurity: Techniques for Attack Detection, Evaluations, Challenges, and Future Prospects [2.1] 科学的情報ソースの信頼性は、しばしば誤報の拡散によって損なわれる。
この操作は、敵対的なビジネスアジェンダに役立ち、市民社会を妥協させる。
社会サイバーセキュリティという新たな科学分野が誕生した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 00:53:09 GMT)
Enhancing LLM-Based Text Classification in Political Science: Automatic Prompt Optimization and Dynamic Exemplar Selection for Few-Shot Learning [1.7] 大型言語モデル (LLMs) は、政治学におけるテキスト分類をかなり約束する。
本フレームワークは,自動プロンプト最適化,動的指数選択,コンセンサス機構を通じてLLM性能を向上させる。
オープンソースのPythonパッケージ(PoliPrompt)がGitHubで公開されている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:38:38 GMT)
Invariant deep neural networks under the finite group for solving partial differential equations [1.5] 我々は、有限群の下でニューラルネットワークのアーキテクチャを不変にする対称性強化ディープニューラルネットワーク(sDNN)を設計する。
数値計算の結果,sDNNはサンプリング領域内外において強い予測能力を有することがわかった。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 09:39:17 GMT)
Squeeze and Excitation: A Weighted Graph Contrastive Learning for Collaborative Filtering [1.4] グラフコントラスト学習(GCL)は、表現学習の堅牢性を高めることを目的としている。
Weighted Graph Contrastive Learning framework (WeightedGCL)は、特徴の非合理的な割り当てに対処する。
重み付けGCLは、競合するベースラインに比べて大幅に精度が向上する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:30:59 GMT)
ICCheck: A Portable, Language-Agnostic Tool for Synchronizing Code Clones [1.3] コードクローンの一貫性のない変更は、ソフトウェアの欠陥につながる可能性がある。
ICCheckは言語に依存しない、様々な環境にまたがるポータブルなツールである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:28:14 GMT)
How Users Employ Workarounds in Software Forms [1.3] 回避策により、システム制限にもかかわらず、ユーザーは目標を達成することができる。
本研究では,入力したいデータがソフトウェア形式の制約に合致しない場合に,ユーザが回避策をどのように採用するかを検討する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 21:19:29 GMT)
eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events [1.2] イベントカメラの固有キャリブレーション手法eKalibrを提案する。
eKalibrは、慎重に設計されたイベントベースのサークルグリッドパターン認識アルゴリズムに基づいている。
パターン抽出と固有キャリブレーションの観点からeKalibrの性能を評価する実験を行った。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:35:01 GMT)
Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad [0.8] 我々は2025年のUSAMOの6つの問題に対して、最先端の推論モデルを評価する。
Gemini-2.5-Proのみが25%という非自明なスコアを達成している。
以上の結果から,現在のLLMは厳密な数学的推論作業には不十分であることが示唆された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 21:46:29 GMT)
Scalable Approximate Algorithms for Optimal Transport Linear Models [0.8] エントロピー規則化OTデータフィット項を用いた非線形回帰モデルの一般クラスを解くための新しい枠組みを提案する。
一般的なペナルティとデータ適合の条件に対する単純な乗法的更新を導出する。
本手法は,実装の単純さと並列化の容易さから,大規模問題に適した手法である。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:37:25 GMT)
Thanos: A Block-wise Pruning Algorithm for Efficient Large Language Model Compression [0.7] Thanosは、メモリフットプリントを削減し、大規模言語モデル(LLM)の計算効率を向上させるために設計された、新しい重み付けアルゴリズムである。
本稿では,適応マスクを用いたブロックワイドプルーニング方式を導入し,重み付けを動的に調整し,フレキシブルな空間パターンと構造化フォーマットを実現する。
実験により,サノスは非構造化プルーニングにおける既成手法よりも優れた最先端性能を達成できることが確認された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:38:44 GMT)
SolRPDS: A Dataset for Analyzing Rug Pulls in Solana Decentralized Finance [0.6] Solanaの暴走は、分散ファイナンス(DeFi)と対話するユーザに大きなダメージを与えている。
開発者がユーザの信頼を利用して、DEX(Decentralized Exchanges)上のトークンプールから流動性を引き出すと、ラグプルが発生します。
Solanaのトランザクションから派生した最初の公開ルーグプルデータセットであるSolRPDSを紹介する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:36:48 GMT)
Non-Markovian N-spin chain quantum battery in thermal charging process [0.5] エルゴトロピーは量子電池の性能を評価する重要な指標である。
マイクロキャビティに埋め込まれたNスピン鎖からなる非マルコフ型QBにおけるエルゴトロピーダイナミクスについて検討した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 14:55:11 GMT)
Multimodal Cinematic Video Synthesis Using Text-to-Image and Audio Generation Models [0.4] 本研究は,高忠実度画像合成を取り入れた60秒フィルムの製作方法,物語構築のためのGPT-2,gTTSとYouTube-音楽を用いたハイブリッドオーディオパイプラインについて述べる。
このフレームワークは、リニアフレーム、撮影後ソース(例えば、シャープニング)、およびプロの質の高い結果を提供するためにオーディオビデオ同期によって強化された5シーンフレームワークを使用する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:10:34 GMT)
SECQUE: A Benchmark for Evaluating Real-World Financial Analysis Capabilities [0.3] SECQUEは4つの主要なカテゴリにわたるSECの申請分析に関する専門家による565の質問で構成されている。
モデル性能を評価するため,複数のLLM判断器を利用した評価機構であるSECQUE-Judgeを開発した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 19:59:41 GMT)
CALF: A Conditionally Adaptive Loss Function to Mitigate Class-Imbalanced Segmentation [0.3] 不均衡データセットは、医学診断のためのディープラーニング(DL)モデルのトレーニングにおいて課題となる。
本稿では,DLトレーニングにおける不均衡データセットの条件を満たすために,新しい,統計的に駆動された条件適応型損失関数(CALF)を提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 12:03:33 GMT)
Here Comes the Explanation: A Shapley Perspective on Multi-contrast Medical Image Segmentation [0.2] そこで我々は,脳腫瘍セグメンテーションにおける標準指標に基づいてトレーニングした最先端のモデルについて,コントラストレベルのShapley値を用いて説明する。
以上の結果から,Shapley解析は腫瘍セグメンテーションに使用する異なるモデルの挙動に関する貴重な知見を提供することが示された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 23:52:07 GMT)
Directed Graph-alignment Approach for Identification of Gaps in Short Answers [0.1] そこで,本研究では,学生の解答/参照回答と,それに対応するモデル回答/参照回答を比較して,学生の解答におけるギャップとして知られる欠落項目を同定する手法を提案する。
識別されたギャップは、学生に形式的評価のためのフィードバックを提供するのに有用である。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:04:28 GMT)
Three-Factor Learning in Spiking Neural Networks: An Overview of Methods and Trends from a Machine Learning Perspective [0.1] Spiking Neural Networks(SNN)の3要素学習ルールは、従来のヘビーン学習の重要な拡張として現れている。
これらのメカニズムは生物学的な可視性を高め、人工神経系の信用割り当てを改善する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 08:10:16 GMT)
What can unitary sequences tell us about multi-time physics? [0.0] マルチタイム量子プロセスは、時間的絡み合いやエキゾチック因果構造を含む、マルチパーティイト状態と同じリッチ性を持つ。
比較的限られた制御に直面した場合でも、これらの現象が初期段階の量子プロセッサでいかに驚くほどアクセスしやすくなっているかを示す。
我々の技術は一般的な量子力学プロセスに関係しており、凝縮物質物理学、量子生物学、NISQ時代の量子デバイスの深部診断など幅広い分野に及んでいる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:28:35 GMT)
Twist-Induced Effects on Weyl Pairs in Magnetized Graphene Nanoribbons [0.0] 本稿では,磁化ヘリコダルグラフェンナノリボン中のワイル対のダイナミクスについて検討する。
曲面を平らなミンコフスキー時空に埋め込むことで、この系に特有の完全共変2体ディラック方程式を導出する。
グラフェンナノリボン中のワイル対の動的挙動に及ぼす均一磁場とツイスト数の影響について検討した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 11:25:24 GMT)
The foot, the fan, and the cuprate phase diagram: Fermi-volume-changing quantum phase transitions [0.0] フェルミ表面(FL)を持つフェルミ液体は、再構成された「小さなフェルミポケット」を持つスピン密度波状態(SDW)への量子相転移を持つことができる。
FL-SDW量子相転移における空間障害の影響の研究は、低温における拡張量子臨界グリフィス型位相を予測する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 21:00:04 GMT)
Spreading dynamics in the Hatano-Nelson model with disorder [0.0] 疾患の導入は、皮膚効果とアンダーソンの局在の競合を招き、皮膚とアンダーソンの移行を引き起こす。
我々の研究は、非エルミート系における非相互性や障害によって引き起こされるリッチダイナミクスを明らかにする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:40:14 GMT)
Solving Sokoban using Hierarchical Reinforcement Learning with Landmarks [0.0] 本稿では,パズルゲーム「ソコバン」に適用した新しい階層型強化学習フレームワークを提案する。
提案手法は6段階のポリシー階層を構築し,各上位のポリシーが下位のレベルに対してサブゴールを生成する。
すべてのサブゴールとポリシーは、ドメインの知識なしに、ゼロからエンドツーエンドに学習されます。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 05:30:21 GMT)
Skin Color Measurement from Dermatoscopic Images: An Evaluation on a Synthetic Dataset [0.0] 画像色測定手法の4つのクラス(セグメンテーションベース、パッチベース、カラー量子化、ニューラルネットワーク)を評価する。
この結果から, 偏光法および色量化法により, 頑健で光の不変な推定値が得られることがわかった。
ニューラルネットワークモデル、特に過適合を減らすために重いぼやけと組み合わせた場合、光不変のフィッツパトリック予測を提供することができる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 13:57:34 GMT)
Micro-Oscillation Frequency Estimation of an Optical Point Source Using Spatial Mode Demultiplexing [0.0] 本稿では,光点状音源の運動特性を推定するためのノイズロバスト手法として空間モードデマルチプレクシング(SPADE)を提案する。
本研究では,SPADEが点源の位置情報をいくつかの重要な空間モードに効率よく集中させ,必要な検出器の数を劇的に減らしていることを示す。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 04:10:49 GMT)
Limits to Analog Reservoir Learning [0.0] アナログ貯水池コンピュータの学習能力に及ぼす雑音の影響について検討する。
情報処理能力(IPC)はノイズによる性能劣化の定量化に有用な指標であることを示す。
ノイズに晒された物理的アナログ貯水池コンピュータは、学習量の増加にのみ利用できると結論付けている。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 02:21:08 GMT)
KnowsLM: A framework for evaluation of small language models for knowledge augmentation and humanised conversations [0.0] 本研究は,LoRAランク,データセットスケール,プレフィックスデザインが知識保持とスタイルアライメントに与える影響について検討する。
LLMに基づく判断は、知識の正確さ、会話の質、簡潔さを考慮し、微調整が音調適応に最も適していることを示し、RAGはリアルタイムの知識増強に優れていた。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:58:08 GMT)
KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0] 本研究は,韓国語などの低リソース言語におけるABSAの直感的で効果的な枠組みを提案する。
翻訳されたベンチマークと未ラベルの韓国データを統合することで、予測ラベルを最適化する。
英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 17:37:44 GMT)
Ineffectiveness for Search and Undecidability of PCSP Meta-Problems [0.0] PCSPの最もよく知られたアルゴリズムは、そのエンフデシジョン変種のみを解き、それらがエンフサーチにも適応できるかどうかは不明である。
我々は、これらの解を適切な検索証明書に丸めることは、クラスTFNPのどの問題にも匹敵するほど難しいことを証明している。
我々のツールは,ミニオンを特徴とするアルゴリズムに適しており,メタプロブレムの判定不能な結果を証明するためにも使用できる。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 23:08:05 GMT)
Impact of Absorption due to Zero-Field Splitting on Loss in Dielectrics [0.0] 超伝導量子ビットのコヒーレンス時間は損失機構によって制限される。
常磁性不純物や欠陥のゼロフィールドスプリット状態間の遷移によって引き起こされるメカニズムを提案する。
サファイア中のCr, Fe, Vの不純物については、10$-9$-10$-8$の範囲で4.5 GHzの損失接点を求める。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:37:33 GMT)
Hyperflows: Pruning Reveals the Importance of Weights [0.0] ハイパーフローは、ウェイト除去に対するネットワークの勾配応答を観察することによって、各ウェイトの重要性を推定する動的プルーニング手法である。
グローバルな圧力項は、全ての重みをプルーニングに向けて連続的に駆動し、正確性に重要なものを自動的に再認識する。
ニューラルスケーリング法則に類似したパワー-ロー方程式を導出し、最終的な空間と圧力の関係について検討する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 16:09:18 GMT)
Hessian of Perplexity for Large Language Models by PyTorch autograd (Open Source) [0.0] 我々は,Hessian for Large Language Model(LLM)の少なくとも一部を正確に計算する方法のガイドを提供する。
また、ベクトル・ヘッセン積(HVP)の複数のサンプルを用いて、ヘッセン行列の全対角線を計算する方法を示す。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:37:04 GMT)
Function Alignment: A New Theory of Mind and Intelligence, Part I: Foundations [0.0] 本稿では,心と知性の新たな理論である機能アライメントを紹介する。
意味、解釈、類推が階層表現間の相互作用からどのように現れるかを明確にモデル化する。
それはしばしば、計算アーキテクチャ、心理学理論、さらには禅のような観念的伝統を結びつけて、規律を分割する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 10:59:32 GMT)
Environment-Assisted Generation of Non-Gaussian Wavepacket Quantum States [0.0] 超伝導回路プラットフォームを用いた非ガウスボゾン状態の単一モード移動波パケットを調製する。
このような状態は、遠い量子プロセッサユニット間のセキュアな量子通信を可能にする。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 15:05:49 GMT)
Efficient Portfolio Selection through Preference Aggregation with Quicksort and the Bradley--Terry Model [0.0] 長期的利益をもたらすプロジェクトに対して、限られたリソースを割り当てる方法は、不確実性の下で意思決定でしばしば発生する問題である。
そこで我々はQuicksortとBradley-Terryモデルに基づく比較ルールを提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 23:16:30 GMT)
Educational Twin: The Influence of Artificial XR Expert Duplicates on Future Learning [0.0] 人間のデジタル双生児は、拡張性、エンゲージメント、社会的学習因子の保存といった側面を改善する可能性がある。
この技術はメリットを提供する一方で、教育者の自主性、社会的相互作用の変化、プライバシー、偏見、アイデンティティ保護といった倫理的配慮に関する課題も導入している。
人間のデジタル双生児が教育の社会的側面を損なうことなく向上させるためには、対処すべき重要な研究課題を概説する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 06:41:42 GMT)
Capturing AI's Attention: Physics of Repetition, Hallucination, Bias and Beyond [0.0] 理論は、出力反復、幻覚、有害な内容など、優れたAI課題の分析を可能にする。
その2体形式は、LCMがうまく機能する理由を示唆するが、一般化された3体注意によって、そのようなAIがさらにうまく動作することを示唆している。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:10:05 GMT)
Balancing Complexity and Informativeness in LLM-Based Clustering: Finding the Goldilocks Zone [0.0] 本稿では,情報性と認知的単純さのトレードオフを定量化することにより,最適なクラスタ数について検討する。
大規模言語モデル(LLM)を用いてクラスタ名を生成し,その有効性を評価する。
語彙分類における言語効率を並列化する16-22クラスタの最適範囲を同定する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 01:16:22 GMT)
Analysing Rescaling, Discretization, and Linearization in RNNs for Neural System Modelling [0.0] リカレントニューラルネットワーク(RNN)は神経活動のモデル化に広く用いられているが、コアプロシージャの数学的相互作用は実現されていない。
この研究は、これらの手順が通勤する条件を確立し、計算神経科学の柔軟な応用を可能にした。
本研究は, 意思決定と運動制御における神経力学をシミュレートするための生物学的に有効なRNNの設計を, 直接指導するものである。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 12:27:25 GMT)
Advancing Multimodal In-Context Learning in Large Vision-Language Models with Task-aware Demonstrations [0.0] LVLM(Large Vision-Language Models)の重要な機能として,マルチモーダルインコンテキスト学習(ICL)が登場している。
我々はマルチモーダル ICL の根底にあるコアメカニズムに光を当て、ロバストなインコンテキストのデモシーケンスを構成する上で、タスクマッピングが重要な要素であると認識した。
タスク認識機能を備えた軽量で強力なデコーダのみの変換器である textitSabER を提案する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 20:41:41 GMT)
AI2STOW: End-to-End Deep Reinforcement Learning to Construct Master Stowage Plans under Demand Uncertainty [0.0] 本稿では,AI2STOWを提案する。AI2STOWは,要求不確実性の下でマスタープランを作成するための,実現可能性予測とアクションマスクを備えたエンドツーエンドの深層強化学習モデルである。
実験の結果,AI2STOWは強化学習やプログラミングのベースライン手法よりも客観的な性能と計算効率が優れていることが示された。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 12:45:25 GMT)
AGITB: A Signal-Level Benchmark for Evaluating Artificial General Intelligence [0.0] 本稿では,AGITB(Artificial General Intelligence Test Bed)を紹介する。
AGITBは、シンボル表現や事前訓練に頼ることなく、時間にわたってバイナリ信号を予測できるモデルの能力を通じて、インテリジェンスを評価する。
テストベッドは、事前のバイアスを前提とせず、意味的な意味から独立して動作し、残酷な力や記憶によって解決不可能性を確保する。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 10:01:15 GMT)
A Novel Algorithm for Personalized Federated Learning: Knowledge Distillation with Weighted Combination Loss [0.0] pFedKD-WCLは知識蒸留と二段階最適化を統合し、非IID課題に対処する。
我々は,MNISTデータセットと非IID合成データセットを用いたpFedKD-WCLを,多相ロジスティック回帰モデルと多層パーセプトロンモデルを用いて評価した。
論文参考訳(メタデータ) (Sun, 06 Apr 2025 23:22:03 GMT)