Protecting Model Adaptation from Trojans in the Unlabeled Data [120.4] 本稿では,よく設計された毒物標的データによるモデル適応に対するトロイの木馬攻撃の可能性について検討する。
本稿では,既存の適応アルゴリズムとシームレスに統合可能なDiffAdaptというプラグイン・アンド・プレイ手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:54:35 GMT)
How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training [92.9] 大きな言語モデル(LLM)は、どのようにして新しい知識を内部化するかを理解する上で、重大なギャップに直面します。
知識記憶と処理を容易にする計算サブグラフを同定する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:55:43 GMT)
TabDiff: a Mixed-type Diffusion Model for Tabular Data Generation [91.5] グラフデータの混合型分布を1つのモデルでモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:46:06 GMT)
CRMArena: Understanding the Capacity of LLM Agents to Perform Professional CRM Tasks in Realistic Environments [90.3] CRMArenaは、プロフェッショナルな作業環境に根ざした現実的なタスクにおいて、AIエージェントを評価するために設計されたベンチマークである。
現状のLDMエージェントはReActプロンプトのタスクの40%以下で成功し,機能呼び出し能力でも55%以下であった。
この結果から,実環境に展開する関数呼び出しやルールフォローにおいて,エージェント機能の向上の必要性が示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:16:38 GMT)
AnyRefill: A Unified, Data-Efficient Framework for Left-Prompt-Guided Vision Tasks [85.7] 本稿では,多様な参照型視覚タスクに対処するため,新しいLPG(Left-Prompt-Guided)パラダイムを提案する。
本稿では,テキスト・ツー・イメージ(T2I)モデルを様々な視覚タスクに効果的に適用するAnyRefillを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:12:40 GMT)
DSV: Exploiting Dynamic Sparsity to Accelerate Large-Scale Video DiT Training [85.0] 拡散変換器(DiT)は、高品質なビデオのモデリングと生成において顕著な性能を示した。
本稿では,ビデオDiTのトレーニングを加速し,拡張するための新しいフレームワークであるDSVを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:50:24 GMT)
Don't Get Lost in the Trees: Streamlining LLM Reasoning by Overcoming Tree Search Exploration Pitfalls [83.9] 検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。
検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。
意味論的に等価なコンテンツを持つ冗長な状態による$textitover-Exploration$と、検証器のスコアリングにおける高いばらつきに起因する$textitunder-Exploration$である。
各種木探索アルゴリズムに適合するフレキシブルなプラグアンドプレイシステムであるFETCHを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:12:01 GMT)
CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models [77.4] CatVTONは仮想的な試着拡散モデルであり、任意のカテゴリーの衣服をターゲット個人に転送する。
CatVTONはVAEと単純化されたUNetのみで構成され、冗長な画像とテキストエンコーダを除去する。
実験により、CatVTONはベースライン法に比べて質的、定量的に優れた結果が得られることが示された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:41:41 GMT)
The Mirage of Model Editing: Revisiting Evaluation in the Wild [70.2] 質問応答アプリケーションにおけるモデル編集の有効性について検討する。
単一の編集実験により、現在行われている編集手法は、以前報告したよりも大幅に悪化していることが示された。
本分析は,既存のモデル編集手法の現実的適用性と評価手法の両面について,基礎的な再検討を行うものである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:57:55 GMT)
SyncSpeech: Low-Latency and Efficient Dual-Stream Text-to-Speech based on Temporal Masked Transformer [68.8] 本稿では、ストリーミング音声を同時に生成しながら、上流モデルからストリーミングテキスト入力を受信できる、双方向ストリームテキスト音声(TTS)モデルSyncSpeechを提案する。
SyncSpeechには次のような利点がある: 低レイテンシ、第2のテキストトークンの受信時にストリーミング音声を生成し始めるとき、高効率、そして、受信したテキストトークンに対応するすべての音声トークンを1ステップでデコードするとき、。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:14:17 GMT)
Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.3] 分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:22:45 GMT)
Convergence of Policy Mirror Descent Beyond Compatible Function Approximation [66.4] 我々は,より弱い変動支配を前提とした理論的PMD一般政策クラスを開発し,最良クラス政策への収束を得る。
我々の主観念は、占有度-勾配測度によって誘導される局所ノルムによって誘導される新しい概念を活用する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:05:46 GMT)
Looking Backward: Streaming Video-to-Video Translation with Feature Banks [65.5] StreamV2Vは、ユーザプロンプトによるリアルタイムストリーミングビデオ変換(V2V)を実現する拡散モデルである。
1つのA100 GPU上で20 FPSを実行することができ、FlowVid、CoDeF、Rerender、TokenFlowよりも15x、46x、108x、158x高速である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:01:55 GMT)
ReLearn: Unlearning via Learning for Large Language Models [64.3] 本研究では、効果的なアンラーニングのためのデータ拡張および微調整パイプラインであるReLearnを提案する。
このフレームワークでは、知識レベルの保存を測定するために、知識獲得率(KFR)と知識保持率(KRR)を導入している。
実験の結果,ReLearnは高品質な出力を保ちながら,目標とするリセットを実現することができた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:31:00 GMT)
PostEdit: Posterior Sampling for Efficient Zero-Shot Image Editing [63.4] 拡散サンプリングプロセスを制御するために後続のスキームを組み込んだPostEditを導入する。
提案したPostEditは、未編集領域を正確に保存しながら、最先端の編集性能を実現する。
インバージョンもトレーニングも不要で、約1.5秒と18GBのGPUメモリを必要とするため、高品質な結果が得られる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:36:54 GMT)
A Survey of World Models for Autonomous Driving [63.3] 自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
本稿では、自律運転の世界モデルにおける最近の進歩を体系的にレビューする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:38:23 GMT)
Corrupted Learning Dynamics in Games [62.7] すべてのプレイヤーが楽観的な追従型リーダー(OFTRL)に従うと、平衡は$O(log T)$の速さで計算できる。
本稿では,各プレイヤーが所定のアルゴリズムによって提案される戦略から逸脱する程度に依存する速度で,適応的に平衡を求める学習ダイナミクスを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:18:39 GMT)
Gumbel Reranking: Differentiable End-to-End Reranker Optimization [61.2] RAGシステムは関連する文書を識別するためにリランカーに依存している。
注釈付きクエリ-ドキュメントペアが不足しているため、これらのモデルの微調整は依然として難しい。
我々は,トレーニングと推論のギャップを最小限に抑えることを目的とした,リランカーのためのエンドツーエンドのトレーニングフレームワークであるGumbel Re rankを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:23:39 GMT)
Improved Unbiased Watermark for Large Language Models [59.0] 本稿では,非バイアスのマルチチャネル型透かしであるMCmarkを紹介する。
MCmarkは言語モデルの本来の分布を保存する。
既存の非バイアスの透かしよりも検出性と堅牢性を大幅に改善する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:02:36 GMT)
Synergy and Diversity in CLIP: Enhancing Performance Through Adaptive Backbone Ensembling [58.5] コントラスト言語-画像事前学習(CLIP)は画像表現学習において顕著な手法である。
本稿では,CLIPを訓練した視覚バックボーンの違いについて検討する。
方法によって、最高の単一のバックボーンよりも39.1%の精度が著しく向上する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:25:02 GMT)
When Backdoors Speak: Understanding LLM Backdoor Attacks Through Model-Generated Explanations [58.3] 大規模言語モデル(LLM)は、バックドア攻撃に弱いことが知られている。
本稿では,自然言語説明の新しいレンズによるバックドア攻撃について検討する。
以上の結果から,バックドアモデルではクリーンな入力に対してコヒーレントな説明が得られたが,有毒なデータに対して多様かつ論理的に欠陥のある説明が得られた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:19:01 GMT)
Can't See the Forest for the Trees: Benchmarking Multimodal Safety Awareness for Multimodal LLMs [56.4] MLLM(Multimodal Large Language Models)は、テキストと画像の両方を通して対話を可能にすることで、従来の言語モデルの能力を拡大した。
MMSafeAwareは,安全シナリオ29のMLLMを評価するために設計された,初の総合的マルチモーダル安全意識ベンチマークである。
MMSafeAwareには安全でないサブセットと安全でないサブセットの両方が含まれており、安全でないコンテンツを正しく識別するモデルの評価と、有用性を阻害する過敏性を回避することができる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:12:40 GMT)
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? [55.9] 人間は、様々な情報源からの知識を統合することで、顕著な構成的推論を示す。
本稿では,このスキルを再現する上でのトランスフォーマーの可能性を検証するための合成学習タスクを提案する。
数発のChain-of-Thoughtプロンプトにより、TransformersはFTCT上でコンストラクショナル推論を行うことができる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:20:23 GMT)
NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM [55.8] VLN(Vision-and-Language Navigation)は、エージェントを具現化するための重要なスキルであり、自然言語の指示に従って3D環境をナビゲートすることができる。
従来の方法では、トラジェクトリ動画をステップバイステップでデータ拡張の指示に変換するが、そのような指示はユーザの通信スタイルとうまく一致しない。
本稿では,VLNのユーザ要求命令を生成する検索拡張生成フレームワークであるNavRAGを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:17:36 GMT)
Learning to Ask: When LLM Agents Meet Unclear Instruction [55.7] 大きな言語モデル(LLM)は、言語スキルだけでは達成不可能なタスクに対処するための外部ツールを活用することができる。
我々は、不完全な命令下でのLLMツールの使用性能を評価し、エラーパターンを分析し、Noisy ToolBenchと呼ばれる挑戦的なツール使用ベンチマークを構築した。
Ask-when-Needed (AwN) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:50:40 GMT)
Conformation Generation using Transformer Flows [55.2] 本稿では,トランスネットワークに基づくコンフォーメーション生成のためのフローベースモデルConfFlowを提案する。
ConfFlowは、明示的な物理的制約を課すことなく、座標空間で直接サンプリングする。
ConfFlowは、最先端の学習ベースの方法と比較して、最大40%の精度向上を実現している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:07:09 GMT)
$f$-PO: Generalizing Preference Optimization with $f$-divergence Minimization [54.9] $f$-POは、既存のアプローチを一般化し拡張する新しいフレームワークである。
ベンチマークデータセットを用いて最先端言語モデルの実験を行う。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:19:36 GMT)
Large Language-Geometry Model: When LLM meets Equivariance [53.9] 本稿では,3次元物理システムを表現するための新しいフレームワークであるEquiLLMを提案する。
EquiLLMは分子動力学シミュレーション,ヒトの動作シミュレーション,抗体設計など,従来の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:50:49 GMT)
RoseRAG: Robust Retrieval-augmented Generation with Small-scale LLMs via Margin-aware Preference Optimization [53.6] 大規模言語モデル(LLM)は目覚ましい性能を達成したが、高い計算コストとレイテンシに直面している。
Retrieval-augmented Generation (RAG) は、外部知識を統合するのに役立つが、不完全な検索は、SLMを誤解させるノイズを引き起こす可能性がある。
我々は、Margin-aware Preference Optimizationを通じて、SLMのための堅牢なRAGフレームワークであるRoseRAGを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:56:53 GMT)
Reasoning-Augmented Conversation for Multi-Turn Jailbreak Attacks on Large Language Models [53.6] Reasoning-Augmented Conversationは、新しいマルチターンジェイルブレイクフレームワークである。
有害なクエリを良心的な推論タスクに再構成する。
RACEは,複雑な会話シナリオにおいて,最先端攻撃の有効性を実現する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:27:44 GMT)
GRIFFIN: Effective Token Alignment for Faster Speculative Decoding [52.9] GRIFFINはトークン指向のトレーニング戦略とトークン指向のドラフトモデルを組み込んだフレームワークである。
LLaMAシリーズとVicunaモデルを用いた実験では、GRIFFINは7%以上、スピードアップ率は8%以上である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:06:00 GMT)
Towards Data-Efficient Pretraining for Atomic Property Prediction [51.7] タスク関連データセットでの事前トレーニングは、大規模な事前トレーニングと一致するか、あるいは超える可能性があることを示す。
本稿では,コンピュータビジョンのFr'echet Inception Distanceにインスパイアされた,化学類似度指数(CSI)を紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:46:23 GMT)
FELLE: Autoregressive Speech Synthesis with Token-Wise Coarse-to-Fine Flow Matching [51.3] FELLEは、言語モデリングとトークンワイドフローマッチングを統合する自動回帰モデルである。
各連続値トークンに対して、FELLEは、前ステップからの情報を組み込んで、フローマッチングにおける一般的な事前分布を変更する。
FELLEは、言語モデルの出力に基づいて階層的に連続値のトークンを生成する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:54:32 GMT)
SnipGen: A Mining Repository Framework for Evaluating LLMs for Code [51.1] 言語モデル(LLM)は、コードリポジトリを含む広範なデータセットに基づいてトレーニングされる。
それらの有効性を評価することは、トレーニングに使用されるデータセットと評価に使用されるデータセットとが重複する可能性があるため、大きな課題となる。
SnipGenは、コード生成のために、様々な下流タスクをまたいだ迅速なエンジニアリングを活用するように設計された包括的なリポジトリマイニングフレームワークである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:39:08 GMT)
Probing Visual Language Priors in VLMs [51.0] Vision-Language Modelsの進歩にもかかわらず、真の視覚的推論ではなく、トレーニングデータに存在する視覚言語に過度に依存する可能性がある。
我々は、画像生成モデルと分配外Q&Aペアによって意図的に合成された分布外画像を含むベンチマークであるViLPを紹介する。
ViLPの各質問には、3つの潜在的な答えと3つの対応するイメージが組み合わされている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 00:34:39 GMT)
Generalized Factor Neural Network Model for High-dimensional Regression [50.6] 複素・非線形・雑音に隠れた潜在低次元構造を持つ高次元データセットをモデル化する課題に取り組む。
我々のアプローチは、非パラメトリック回帰、因子モデル、高次元回帰のためのニューラルネットワークの概念のシームレスな統合を可能にする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:13:55 GMT)
SCALE: Towards Collaborative Content Analysis in Social Science with Large Language Model Agents and Human Intervention [50.1] 我々は、効果的に機能する新しいマルチエージェントフレームワークを導入する。
Imulates $underlinetextbfC$ontent $underlinetextbfA$nalysis via。
underlinetextbfL$arge language model (LLM) agunderlinetextbfE$nts。
テキストコーディング、協調的な議論、動的コードブックの進化など、コンテンツ分析の重要なフェーズを模倣します。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 00:19:07 GMT)
LogiDynamics: Unraveling the Dynamics of Logical Inference in Large Language Model Reasoning [49.6] 本稿では、類似推論のための制御された評価環境を導入することにより、探索的アプローチを採用する。
帰納的,帰納的,帰納的,帰納的な推論パイプラインの比較力学を解析する。
仮説選択や検証,洗練といった高度なパラダイムを考察し,論理的推論のスケールアップの可能性を明らかにする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:54:53 GMT)
Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation [49.4] 大規模言語モデル(LLM)におけるバイアスと公平性の標準ベンチマークは、ユーザプロンプトに入力された社会的属性と短い応答の関係を測定する。
実世界の3つの文脈から類似したRUTEd評価法を開発した。
標準偏差指標は、より現実的な偏差指標と有意な相関関係がないことがわかった。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:57:20 GMT)
Improving Scientific Document Retrieval with Concept Coverage-based Query Set Generation [49.3] 概念カバレッジに基づくクエリセット生成(CCQGen)フレームワークは、ドキュメントの概念を包括的に網羅したクエリセットを生成するように設計されている。
従来のクエリでは十分にカバーされていない概念を識別し,その後のクエリ生成の条件として活用する。
このアプローチは、それぞれの新しいクエリをガイドして、以前のクエリを補完し、ドキュメントの徹底的な理解を支援する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:59:50 GMT)
Asymmetric Conflict and Synergy in Post-training for LLM-based Multilingual Machine Translation [48.1] 訓練後のCoMのメカニズムである言語対立と相乗効果を解析した。
本稿では,言語対立や相乗効果の非対称性に対処するために,方向対応学習アプローチとグループワイドモデルマージの組み合わせを提案する。
X-ALMA-13B-Pretrain-trained with multilingual pre-training- achieved performance to XALMA-13B (only SFT)
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:06:58 GMT)
OctoTools: An Agentic Framework with Extensible Tools for Complex Reasoning [47.5] OctoToolsはトレーニング不要で、ユーザフレンドリで、オープンソースのエージェントフレームワークで、さまざまなドメインにわたる複雑な推論に対処するために設計されている。
我々は16種類のタスクでOctoToolsの一般性を検証し、GPT-4oに対して9.3%の精度向上を達成した。
OctoToolsはAutoGen、GPT-Functions、LangChainを10.6%上回っている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:18:47 GMT)
Beyond Any-Shot Adaptation: Predicting Optimization Outcome for Robustness Gains without Extra Pay [46.9] 本稿では,モデル予測タスクサンプリング(MPTS)を提案し,タスク空間と適応リスクランドスケープの関連性を確立する。
MPTSは、タスクエピソード情報を生成モデルで特徴付け、後部推論からタスク固有の適応リスク値を直接予測する。
MPTSはゼロショット、少数ショット、多ショット学習パラダイムにシームレスに統合できる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:38:16 GMT)
Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [46.6] 大規模言語モデル(LLM)の幻覚を緩和するための効果的なアプローチとして,検索拡張世代(RAG)がますます認識されている。
PruningRAGはマルチグラニュラリティ・プルーニング・ストラテジーを用いて,関連コンテキストをより効果的に統合し,誤った情報に対するネガティブな影響を軽減するためのプラグアンドプレイRAGフレームワークである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:07:13 GMT)
Large Language Models and Causal Inference in Collaboration: A Comprehensive Survey [46.4] 因果推論は、自然言語処理(NLP)モデルの予測精度、公正性、堅牢性、説明可能性を高める可能性を示している。
生成型Large Language Models(LLM)の出現は、様々なNLPドメインに大きな影響を与えている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:07:51 GMT)
SafeDialBench: A Fine-Grained Safety Benchmark for Large Language Models in Multi-Turn Dialogues with Diverse Jailbreak Attacks [46.3] 大規模言語モデル(LLM)の安全性を評価するための詳細なベンチマーク SafeDialBench を提案する。
具体的には,6つの安全次元を考慮した2階層型階層型安全分類法を設計し,22の対話シナリオの下で中国語と英語の双方で4000以上のマルチターン対話を生成する。
特に,LLMの革新的なアセスメントフレームワークを構築し,安全でない情報を検出し,処理し,ジェイルブレイク攻撃時の一貫性を維持する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:08:08 GMT)
RAS: Retrieval-And-Structuring for Knowledge-Intensive LLM Generation [46.2] Retrieval-And-Structuring(RAS)は,クエリ固有の知識グラフを動的に構築する新しいフレームワークである。
RASは,(1)検索品質を維持しながら検索空間を効率的に絞り込むテーマスコープ検索機構,(2)知識ニーズを判断し,集中サブクエリを生成するアクション計画モジュール,(3)検索したテキストを進化した知識グラフに変換する動的知識構造化アプローチ,の4つの技術革新を紹介した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:01:49 GMT)
Knowledge Graph-Driven Retrieval-Augmented Generation: Integrating Deepseek-R1 with Weaviate for Advanced Chatbot Applications [45.9] 構造化バイオメディカル知識と大規模言語モデル(LLM)を組み合わせた革新的なフレームワークを提案する。
本システムでは,年齢関連黄斑変性(AMD)に関する医学的要約から因果関係を同定・精査し,詳細な知識グラフを作成する。
ベクトルベース検索と局所展開言語モデルを用いて,臨床証拠を直接参照して,文脈的に関連性があり,検証可能な応答を生成する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:52:28 GMT)
A Survey of LLM-based Agents in Medicine: How far are we from Baymax? [45.0] 大規模言語モデル(LLM)は、LLMベースのエージェントの開発を通じて医療を変革している。
この調査は、医学におけるLSMベースのエージェントの総合的なレビューを提供する。
医療エージェントシステムの主要な構成要素として, システムプロファイル, 臨床計画機構, 医療推論フレームワーク, 外的能力向上などについて分析する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:21:05 GMT)
VLMs as GeoGuessr Masters: Exceptional Performance, Hidden Biases, and Privacy Risks [44.7] VLM(Visual-Language Models)は、様々なタスクで顕著なパフォーマンスを示している。
詳細な地理メタデータと組み合わせた1200枚の画像からなるベンチマークデータセットを提案する。
これらのモデルは画像から地理情報を認識する能力を示すが、地域的偏見は顕著である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:28:34 GMT)
EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing [43.6] 我々は,エキスパート選択ルーティングを備えた拡散変圧器のためのMixture-of-Experts(MoE)モデル(EC-DIT)を新たに開発する。
EC-DITは、入力テキストを理解するために割り当てられた計算を適応的に最適化し、各画像パッチを生成する。
テキストと画像のアライメント評価において、我々の最大のモデルでは、最先端のGenEvalスコアが71.68%に達し、直感的に解釈可能な競合推論速度を維持しています。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:27:11 GMT)
Large Language Models Penetration in Scholarly Writing and Peer Review [43.6] 学術的な視点と次元にまたがる大規模言語モデルの浸透を評価する。
本実験は,学術的プロセスにおけるLLMの役割の増大を明らかにするために,textttLLMetricaの有効性を実証した。
これらの知見は、学術的信頼性を維持するために、LLMの使用における透明性、説明責任、倫理的実践の必要性を強調した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:37:34 GMT)
The Multi-Faceted Monosemanticity in Multimodal Representations [42.6] 我々は、機能単意味性の最近の進歩を活用して、深いマルチモーダルモデルから解釈可能な特徴を抽出する。
以上の結果から,この分類は,異なるモダリティの認知的理解と密接に一致していることが明らかとなった。
これらの結果は、タスクに依存しない解釈可能性ツールを備えた大規模マルチモーダルモデルが、重要な接続と異なるモダリティの区別に関する貴重な洞察を提供することを示している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:51:07 GMT)
Evaluating the Potential of Quantum Machine Learning in Cybersecurity: A Case-Study on PCA-based Intrusion Detection Systems [42.2] 従来の機械学習のサイバーセキュリティアプリケーションに対する量子コンピューティングと機械学習(QML)の影響について検討する。
まず、サイバーセキュリティに特有な機械学習問題における量子コンピューティングの潜在的な利点について検討する。
次に,実世界の問題に対するフォールトトレラントQMLアルゴリズムの今後の影響を定量化する手法について述べる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:49:25 GMT)
Uncertainty-Aware Step-wise Verification with Generative Reward Models [42.2] 生成報酬モデルを用いたステップワイド検証の信頼性を高めるために,不確実性定量化(UQ)を活用することを提案する。
ステップワイド検証におけるPRMの不確実性を定量化するための既存手法よりも優れた新しいUQ手法であるCoT Entropyを導入する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:00:56 GMT)
Design and Simulation of the Adaptive Continuous Entanglement Generation Protocol [41.8] 量子ネットワークにおける重要なパフォーマンス指標は、ユーザのEP要求に対するTTS(Time-to-serve)である。
本稿では,アダプティブ連続絡み合い生成プロトコル(ACP)について検討し,量子ネットワークノードが隣人と連続的にEPを生成できるようにする。
ACP は TTS を 94% まで減少させ、エンタングルメントの忠実度を 0.05 まで向上させる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:12:42 GMT)
A Survey on Diffusion Models for Anomaly Detection [41.2] 拡散モデル(DM)は、生成AIモデルの強力なクラスとして登場した。
DMADは、ますます複雑で高次元のデータにおける偏差を特定するための有望なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:35:44 GMT)
Exploration by Optimization with Hybrid Regularizers: Logarithmic Regret with Adversarial Robustness in Partial Monitoring [41.2] 部分的な監視は、限られたフィードバックを伴うオンライン意思決定問題の一般的なフレームワークである。
ハイブリッド正規化器を用いたExOの新しいフレームワークと解析法を提案する。
特に、$O(sum_a neq a*)$で、$k$、$m$、$T$はアクション、観察、ラウンドの数である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:23:06 GMT)
Revisiting Weak-to-Strong Generalization in Theory and Practice: Reverse KL vs. Forward KL [40.8] 我々は, 前方KL分岐を逆KL分岐に置き換える理論的基礎的アプローチを提案する。
逆KL発散のゼロ強制効果は、高信頼の予測を優先する。
逆KLと逆クロスエントロピーは、強いモデルがフォワードKLと標準クロスエントロピーで訓練されたモデルより一貫して優れていることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:50:20 GMT)
An Intelligent Agentic System for Complex Image Restoration Problems [39.9] AgenticIRは、イメージ処理に対する人間のアプローチを、知覚、スケジューリング、実行、反射、再スケジューリングの5つの重要な段階に従って模倣する。
我々は、テキスト生成を介して対話する大規模言語モデル(LLM)と視覚言語モデル(VLM)を用いて、IRモデルのツールボックスを操作する。
実験では、複雑なIRタスクを扱うAgenicIRの可能性を実証し、視覚処理における汎用知性を達成するための有望な道を示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:30:30 GMT)
Beyond Similarity: A Gradient-based Graph Method for Instruction Tuning Data Selection [39.8] 大規模言語モデル (LLM) は, 命令チューニングによる一般化能力の顕著さから, 様々な産業において大きな可能性を秘めている。
G2IS (Gradient-based Graph Instruction Selection) は、混合勾配に基づく命令グラフを構築し、命令間の結合分布と相互依存性をキャプチャする手法である。
G2ISは、様々なドメイン適応タスクで従来のメソッドよりも優れており、特に複雑なデータスカースシナリオにおいて、大幅なパフォーマンス向上をもたらす。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:06:00 GMT)
iTool: Boosting Tool Use of Large Language Models via Iterative Reinforced Fine-Tuning [39.7] 大規模な言語モデルを外部ツールで拡張することは、その能力を強化するための有望なアプローチである。
その結果, 合成データの増加に伴い, トレーニングは著しく低下することがわかった。
本稿では,これらの課題を軽減するために,反復的に強化された微調整戦略を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:51:09 GMT)
Step-by-Step Mastery: Enhancing Soft Constraint Following Ability of Large Language Models [39.1] 大規模言語モデル(LLM)には、複数の制約を含む命令に従うことが不可欠である。
高品質な出力を持つデータセットを自動構築するパイプラインを設計する。
データ構築プロセス中に発生する正と負のサンプルを十分に活用するために、トレーニング手法として直接選好最適化(DPO)を選択する。
我々は,LLMのソフト制約追従能力を向上させるための手法の有効性を実験的に評価した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:36:29 GMT)
Graders should cheat: privileged information enables expert-level automated evaluations [38.8] 自動評価言語モデル(LM)は、評価プロセスとそれに関連するコストを加速する魅力的な方法である。
しかし、どちらのモデルの能力の限界を超えている問題を評価するために、候補者のLMよりも弱いであろうグレーダーLMをどうやって信頼できるだろうか?
地道なソリューションや問題固有のガイドラインなどの特権情報を提供することによって,このようなフロンティア問題に対する自動評価が向上することを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:47:41 GMT)
Logarithmic Width Suffices for Robust Memorization [38.2] 特定のアーキテクチャを持つニューラルネットワークの記憶能力は 徹底的に研究されている
本稿では,フィードフォワードReLUニューラルネットワークがいかに頑健に記憶できるかという自然問題について考察する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:28:21 GMT)
DEEPER Insight into Your User: Directed Persona Refinement for Dynamic Persona Modeling [38.2] 本稿では,動的ペルソナモデリングのための新しいアプローチであるDEEPERを提案する。
10ドメインにわたる4800人のユーザによる動的ペルソナモデリングの実験は、DEEPERの優れたペルソナ最適化能力を強調している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:02:37 GMT)
Structure-aware Domain Knowledge Injection for Large Language Models [38.1] StructTuningは、大規模言語モデル(LLM)をドメインスペシャリストに変換する方法論である。
従来の知識注入性能の100パーセントを達成しながら、トレーニングコーパスに必要なトレーニングコーパスをわずか5%削減します。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:35:11 GMT)
Who's the MVP? A Game-Theoretic Evaluation Benchmark for Modular Attribution in LLM Agents [37.7] CapaBenchは、協調ゲーム理論のShapley Valueに基づく評価フレームワークである。
エージェントのアーキテクチャ内の個々のモジュールとその相互作用の限界影響を測定する。
CapabilityBenchは、コンポーネントレベルの評価と全体的システムアセスメントのギャップを埋める。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:34:47 GMT)
Scalable Multi-Agent Offline Reinforcement Learning and the Role of Information [37.2] データセット収集とオフライン学習の両方にスケーラブルな新しいルーチンを提案する。
エージェントはまず、事前に特定された情報共有ネットワークと一貫性のある多様なデータセットを収集する。
提案手法は,FQIの教師あり学習段階における固有誤差を,共有情報と非共有情報との相互情報に限定することを可能にしている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:28:42 GMT)
BoT: Breaking Long Thought Processes of o1-like Large Language Models through Backdoor Attack [36.9] 我々は,o1-likeモデルの長い思考過程をターゲットとした,新たな攻撃シナリオを提案する。
バックドア攻撃による内在的推論機構を選択的に破壊できるBoTを提案する。
最近のDeepSeek-R1を含むオープンソースのo1-likeモデルの実験では、BoTが高い攻撃成功率をほぼ達成していることが示された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:45:56 GMT)
Cuckoo: An IE Free Rider Hatched by Massive Nutrition in LLM's Nest [36.6] 本研究では,情報抽出モデルが大規模言語モデル (LLM) リソースのフリーライダーとして機能することを示す。
We show that IE model can act a free riders on LLM resources by reframing next-token emphprediction into emphextraction for tokens present in the context。
具体的には,提案する次世代トークン抽出(NTE)パラダイムを用いて,LLMの事前学習および後学習データから102.6Mの抽出データを変換し,汎用IEモデルであるemphCuckooを学習する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:32:20 GMT)
M$^2$IST: Multi-Modal Interactive Side-Tuning for Efficient Referring Expression Comprehension [36.4] 参照式理解(Referring Expression comprehension、REC)は、言語表現に基づいて画像中の対象物を特定する視覚言語タスクである。
M$2$IST: Multi-Modal Interactive Side-Tuning with M$3$ISAs: Mixture of Multi-Modal Interactive Side-Adapters。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:44:39 GMT)
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step [36.0] LLaVA-CoTは、自律的な多段階推論を実現するために設計された新しいVLMである。
チェーン・オブ・シークレットのプロンプトとは異なり、LLaVA-CoTは独立に要約、視覚的解釈、論理的推論、結論生成の逐次的な段階に関与する。
100kのトレーニングサンプルと単純な推論時間スケーリング手法により、LLaVA-CoTはベースモデルを幅広いマルチモーダル推論ベンチマークで7.4%上回る。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:24:42 GMT)
Fast Rates in Stochastic Online Convex Optimization by Exploiting the Curvature of Feasible Sets [35.9] オンライン線形最適化では、損失関数の平均勾配が一定の閾値を超えると、実現可能な集合の曲率を利用することができることが知られている。
本研究では、損失関数の曲率に適応したアルゴリズムが、実現可能な集合の曲率を活用できることを明らかにする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:51:50 GMT)
A Simple and Adaptive Learning Rate for FTRL in Online Learning with Minimax Regret of $Θ(T^{2/3})$ and its Application to Best-of-Both-Worlds [35.9] FTRL(Follow-the-Regularized-Leader)は、さまざまなオンライン学習問題の強力なフレームワークである。
学習率とTsallisエントロピー正規化器によるFTRLは,既存のBest-of-Both-Worlds(BOBW)の上界を後悔する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:26:49 GMT)
REVS: Unlearning Sensitive Information in Language Models via Rank Editing in the Vocabulary Space [35.6] 言語モデル(LM)は、トレーニングデータに見られる機密情報や個人識別可能な情報(PII)を不注意に記憶・拡散し、プライバシー上の懸念を引き起こすリスクがある。
LMから機密情報を学習する非段階的手法であるREVSを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:12:42 GMT)
Unlocking the Power of Function Vectors for Characterizing and Mitigating Catastrophic Forgetting in Continual Instruction Tuning [35.3] 破滅的な忘れ(CF)は、機械学習において重要な課題であり、モデルは新しいタスクを学ぶ際に学習した情報を忘れる。
本研究はCFを様々な設定で探索し、モデル忘れは特定のトレーニングタスクとモデル自体の影響を受けていることを発見した。
本稿では,FVを安定させ,それを忘れるために正規化手法を取り入れた新しい関数ベクトル誘導訓練手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:06:17 GMT)
PATCH: Empowering Large Language Model with Programmer-Intent Guidance and Collaborative-Behavior Simulation for Automatic Bug Fixing [34.8] バグ修正は、ソフトウェア開発とメンテナンスにおいて重要な意味を持つ。
最近の研究は、ソフトウェアバグを自動的に解決する大規模言語モデル(LLM)の可能性を探ることに大きく貢献している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:45:58 GMT)
GePBench: Evaluating Fundamental Geometric Perception for Multimodal Large Language Models [34.6] 本稿では,MLLMの幾何学的知覚能力を評価するための新しいベンチマークであるGePBenchを紹介する。
評価の結果,現在最先端のMLLMは幾何学的知覚タスクに重大な欠陥があることが明らかとなった。
GePBenchデータを用いてトレーニングしたモデルは、幅広いベンチマークタスクにおいて大幅に改善されていることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:39:45 GMT)
Car-Following Models: A Multidisciplinary Review [34.4] 自動車追従モデルには、交通工学、物理学、動的システム制御、認知科学、機械学習、強化学習など、様々な分野が含まれる。
それは、理論に基づくキネマティックモデル、心理物理モデル、適応クルーズ制御モデルから強化学習(RL)や模倣学習(IL)のようなデータ駆動アルゴリズムまで、代表的アルゴリズムをレビューする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:22:31 GMT)
A Logical Fallacy-Informed Framework for Argument Generation [34.4] FIPOは、大規模言語モデルを論理的に健全な議論に導いてくれる、誤用インフォームドフレームワークである。
議論データセットの結果から,提案手法は誤り率を最大17.5%削減することを示した。
私たちのコードは alucamouchel.com/lucamouchel/Logical-Fallacies で利用可能です。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:31:23 GMT)
Simplify RLHF as Reward-Weighted SFT: A Variational Method [34.2] RLHF(Reinforcement Learning from Human Feedback)は、Large Language Models(LLM)と人的価値の整合に不可欠である。
変分推論の観点からRLHFの単純化を提案する。
我々は、アライメント目標を報酬駆動型微調整形式に変換し、トレーニングの安定性と効果を顕著に向上させる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:22:00 GMT)
Evaluating the Paperclip Maximizer: Are RL-Based Language Models More Likely to Pursue Instrumental Goals? [33.1] 主な関心事は、テキスト構造収束(textitinstrumental convergence)である。AIシステムは、究極の目標を覆い、人間の意図した目標から逸脱する意図しない中間目標を開発する。
この問題は特に強化学習(RL)訓練モデルに関係しており、報酬を最大化するために創造的だが意図しない戦略を生成することができる。
また,RL駆動モデルでは,目標指向行動の最適化が人間の意図に反する可能性があるため,楽器収束の傾向が強いことを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:29:20 GMT)
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention [32.5] 我々は、アルゴリズムのイノベーションとハードウェアの最適化を統合する、ネイティブにトレーニング可能なスパースアテンションメカニズムであるNSAを紹介する。
NSAは動的な階層的なスパース戦略を採用し、粗粒のトークン圧縮と細粒のトークン選択を組み合わせて、グローバルなコンテキスト認識と局所的精度の両方を維持する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:53:44 GMT)
Rewrite to Jailbreak: Discover Learnable and Transferable Implicit Harmfulness Instruction [32.0] 大規模言語モデル(LLM)は様々な領域に広く適用されている。
LLMを攻撃するための転送可能なブラックボックスジェイルブレイク法であるRewrite to Jailbreak (R2J)アプローチを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:43:39 GMT)
Categorical Data Clustering via Value Order Estimated Distance Metric Learning [31.9] 本稿では,属性値間の順序関係がクラスタリング精度の決定的要因であることを示す。
本稿では,クラスタと注文の協調学習を可能にする新しい学習パラダイムを提案する。
このアルゴリズムは収束保証によりより優れたクラスタリング精度を実現する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:03:08 GMT)
Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation [31.6] ヒトの身体のParseグラフは、ヒトのポーズ推定(HPE)を完遂するためにヒトの脳内で得られる。
機能マップのParse Graph(RMPG)に基づいたRefinement Moduleを設計し、トップダウン分解とボトムアップの組み合わせの2段階を含む。
我々のネットワークは、複数の主流の人間のポーズデータセットにおいて優れた結果を得る。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:07:16 GMT)
Exploiting Point-Language Models with Dual-Prompts for 3D Anomaly Detection [31.4] 3次元点雲における異常検出は、幅広い産業応用において不可欠である。
3D Anomaly dEtection (PLANE) のためのデュアルプロンプトを用いた新しいポイント・ランゲージモデルを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:10:57 GMT)
Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation [30.3] ニューラルマシン翻訳(NMT)の一般的な手法である、最大後部復号法は、推定後部確率を最大化することを目的としている。
最小ベイズリスク(MBR)復号法は、最も期待されているユーティリティで仮説を求める方法を提供する。
以上の結果から, sMBRはNMT復号法として有望なアプローチであることが示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:36:24 GMT)
Learning Autonomous Code Integration for Math Language Models [30.1] 本稿では,メタ認知ツール利用決定と進化能力の間の自己強化サイクルを構築するために,構造化探索(E-step)と非政治最適化(M-step)を併用する新しいフレームワークを提案する。
当社の7Bモデルは、MATH500では11%、AIMEでは9.4%、o1のようなCoTでは9.4%改善しています。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:18:23 GMT)
SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe [30.0] 大規模言語モデル (LLM) は命令チューニングを行い、命令-応答ペアをNext-token Prediction (NTP) を用いて訓練する。
命令チューニングを改善する努力は、しばしば高品質な教師付き微調整(SFT)データセットに焦点を当てる。
SFTMix は,従来の NTP パラダイムを超越した LLM 命令のチューニングを行う,Mix ベースの新しいレシピである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:41:33 GMT)
DuplexMamba: Enhancing Real-time Speech Conversations with Duplex and Streaming Capabilities [29.7] 本稿では,マンバをベースとした音声とテキストの対話のためのマルチモーダル・デュプレックスモデルを提案する。
DuplexMambaは同時入力処理と出力生成を可能にし、動的に調整してリアルタイムストリーミングをサポートする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:42:48 GMT)
TEASER: Token Enhanced Spatial Modeling for Expressions Reconstruction [29.4] 人物中心のコンピュータビジョンタスクでは,1つの眼内画像からの3D顔の再構成が重要な課題である。
現在のアプローチでは、誇張された不規則な口の形、表情、非対称な顔の動きに苦労している。
本稿では,これらの課題に対処し,顔形状を3次元的に拡張するTEASERを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:00:06 GMT)
DP-MemArc: Differential Privacy Transfer Learning for Memory Efficient Language Models [29.1] DP-MemArcは,大規模言語モデルのメモリコスト削減を目的とした,新しいトレーニングフレームワークである。
DP-MemArcは、様々な差分プライバシーメモリ効率の良い微調整スキームをサポートするために、サイドネットワークまたは可逆ネットワーク設計を組み込んでいる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:57:37 GMT)
MemHunter: Automated and Verifiable Memorization Detection at Dataset-scale in LLMs [28.6] 本稿では,メモリ駆動型LDMをトレーニングし,仮説テストを用いて,データセットレベルでのメモリ化を効率的に検出するMemHunterを紹介する。
MemHunterは、データセットレベルの記憶検出が可能な最初の方法であり、大規模データセットのプライバシーリスクを評価する重要なツールを提供する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:20:55 GMT)
Comparative Analysis of FPGA and GPU Performance for Machine Learning-Based Track Reconstruction at LHCb [28.6] 大型ハドロン衝突型加速器における光度と粒度の増加は、より効率的なデータ処理ソリューションの必要性を喚起している。
荷電粒子トラックのための有望なツールとして機械学習が登場した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:13:26 GMT)
CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting [28.6] 気象・気候イベント予測(WCEF)を提案し,気象・気候事象を予測する。
CLLMateは、26,156の環境ニュース記事とERA5の再分析データを用いたWCEFの最初のデータセットである。
我々は、CLLMate上に23の既存のMLLMを体系的にベンチマークし、クローズドソース、オープンソース、そして細調整されたモデルを作成しました。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:05:11 GMT)
Human alignment of neural network representations [28.3] ニューラルネットワークで学習した表現と行動応答から推定される人間の心的表現のアライメントに影響を与える要因について検討する。
モデルスケールとアーキテクチャは基本的に人間の行動応答に影響を与えないことがわかった。
食物や動物などの人間の概念はニューラルネットワークによってよく表現されているのに対し、ロイヤルやスポーツ関連の物体はそうではない。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:38:13 GMT)
Compression with Global Guidance: Towards Training-free High-Resolution MLLMs Acceleration [28.3] マルチモーダルな大言語モデル(MLLM)は、視覚的コンテンツ理解と推論における例外的な性能から注目されている。
視覚トークンの数を減らしたトークン圧縮技術は,計算コストの削減に有効であることを示した。
本稿では,高分解能MLLMに適した新しいトークン圧縮手法,GlobalCom$2$を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:33:57 GMT)
Atoxia: Red-teaming Large Language Models with Target Toxic Answers [27.4] Atoxiaは、オープンソースのモデルだけでなく、GPT-4oのような最先端のブラックボックスモデルでも安全性のリスクを検出することができる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:47:15 GMT)
Automating Legal Concept Interpretation with LLMs: Retrieval, Generation, and Evaluation [27.3] 法律記事には、常に変化する社会に適応するための曖昧な概念が含まれていることが多い。
厳密で専門的な注釈と法の専門家による要約が必要である。
法律専門家の教義をエミュレートすることで,新たな枠組みであるATRIEを導入する。
ATRIEは法的概念解釈器と法的な概念解釈評価器から構成される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:15:08 GMT)
Condense, Don't Just Prune: Enhancing Efficiency and Performance in MoE Layer Pruning [26.9] 本研究では,大小のMoE層をより小さく,より密度の高い層に縮合するConDense-MoEを提案する。
当社のアプローチは,Feed-Forward Networksを多数の小さなエキスパートに分割する,共有専門家による詳細なMoEのために特別に設計されています。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:56:37 GMT)
An Interpretable Automated Mechanism Design Framework with Large Language Models [26.9] メカニズムは長い間経済理論の基盤であり、伝統的なアプローチは数学的導出に依存してきた。
支払いとアロケーションを設計するために、ニューラルネットワークを使った微分経済学を含む最近の自動化アプローチが出現している。
コード生成タスクとしてメカニズム設計を再構築する新しいフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:33:03 GMT)
Registering Source Tokens to Target Language Spaces in Multilingual Neural Machine Translation [26.7] 多言語ニューラルマシン翻訳(MNMT)は、複数の言語にまたがる任意の翻訳を目的としている。
我々は,小規模なMNMT特化モデルが大規模言語モデル(LLM)と競合することを可能にする新しい手法である登録を導入する。
大規模ベンチマークであるEC-40の実験から,本手法がMNMTの最先端技術に進展することを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:49:37 GMT)
MaskFlow: Discrete Flows For Flexible and Efficient Long Video Generation [25.7] 離散表現とフローマッチングを組み合わせた統合ビデオ生成フレームワークである textbfMaskFlow を紹介する。
トレーニング中にフレームレベルのマスキング戦略を活用することで、MaskFlowはトレーニングシーケンスの10倍以上の長さのビデオを生成する。
我々は,FaceForensics (FFS) とDeepmind Lab (DMLab) のデータセットにおける手法の品質を検証するとともに,最先端のアプローチと競合するFr'echet Video Distance (FVD) を報告する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:59:11 GMT)
Bridging the Gap: Enabling Natural Language Queries for NoSQL Databases through Text-to-NoSQL Translation [25.6] 自然言語クエリをアクセス可能なクエリに変換することを目的としたText-to-Noタスクを導入する。
この分野での研究を促進するために、我々はTEND(Text-to-Noデータセットのショートインターフェース)という、このタスクのための大規模かつオープンソースのデータセットをリリースした。
また,SLM(Small Language Model)支援とRAG(Retrieval-augmented Generation)支援の多段階フレームワークSMARTを設計した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:01:48 GMT)
Understanding Dynamic Diffusion Process of LLM-based Agents under Information Asymmetry [25.5] 情報内容と分配機構によって定義された12の非対称なオープン環境における情報拡散のダイナミクスについて検討する。
我々はエージェントが異なる情報に注意を割り当てるのを支援する動的注意機構を設計する。
我々は、情報コクーンの出現、情報ギャップの進化、社会資本の蓄積を観察する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:02:48 GMT)
Local-Cloud Inference Offloading for LLMs in Multi-Modal, Multi-Task, Multi-Dialogue Settings [25.2] 大規模言語モデル(LLM)は、複数の対話やマルチモーダルデータソースを通じてマルチタスク解決能力を示すことができる。
LLMのこれらの特徴は、大きなサイズを超えて、推論段階でのデプロイメントをより困難にしている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:18:28 GMT)
Recent Advances in Discrete Speech Tokens: A Review [25.0] 離散的な音声トークンは、その離散的でコンパクトで簡潔な性質によって特徴づけられ、効率的な伝送と記憶に有利である。
現在の研究は、個別の音声トークンを音響トークンと意味トークンの2つの主要なクラスに分類し、それぞれがリッチな研究領域へと発展してきた。
本研究は,既存の分類学と最近の音声トークン化の革新を体系的に合成し,各パラダイムの長所と短所を批判的に検討し,トークンタイプ間での系統的比較を提示する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:11:09 GMT)
Functional Homotopy: Smoothing Discrete Optimization via Continuous Parameters for LLM Jailbreak Attacks [24.9] 本研究では,機能的ホモトピー法と呼ばれる新しい最適化手法を提案する。
一連の簡単な最適化問題を構築することにより、確立されたホモトピー法から導かれる原理を用いて、これらの問題を反復的に解決する。
この手法を大規模言語モデル(LLM)に対するジェイルブレイク攻撃合成に適用し,既存の手法よりも20%~30%の精度向上を実現した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:16:15 GMT)
L4DR: LiDAR-4DRadar Fusion for Weather-Robust 3D Object Detection [24.6] L4DRは,LiDARと4Dレーダ融合を効果的に実現する3次元物体検出法である。
我々のL4DRには、センサギャップを再現するためのマルチモーダルMMEとフォアグラウンド・アウェア・デノナイジング(FAD)技術が含まれています。
霧のレベルによってパフォーマンスが大幅に向上し、3D mAPは従来のLiDARのみのアプローチよりも最大20.0%向上した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:39:05 GMT)
Towards Rationality in Language and Multimodal Agents: A Survey [23.5] この研究は、より合理的な言語とマルチモーダルエージェントを構築する方法について議論する。
合理性は理性によって導かれる性質であり、証拠や論理原理と整合した意思決定によって特徴づけられる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:30:30 GMT)
G$^2$V$^2$former: Graph Guided Video Vision Transformer for Face Anti-Spoofing [23.3] スプーフされた顔を含むビデオでは、光度またはダイナミックな異常に基づいて、スプーフの証拠を発見できるかもしれない。
本稿では,顔と顔のランドマークを組み合わせたグラフガイドビデオビジョン変換器を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:25:18 GMT)
BFA: Best-Feature-Aware Fusion for Multi-View Fine-grained Manipulation [23.3] マルチビュー操作タスクのためのBFA融合戦略を提案する。
ポリシーネットワークの視覚的バックボーンに基づいて、各ビューの重要度を予測する軽量ネットワークを設計する。
予測された重要度に基づいて、再重み付けされたマルチビュー機能はその後融合され、エンドツーエンドのポリシーネットワークに入力される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:26:21 GMT)
A Survey on Data-Centric AI: Tabular Learning from Reinforcement Learning and Generative AI Perspective [23.3] タブラルデータ(Tabular data)は、バイオインフォマティクス、医療、マーケティングなど、さまざまな領域で広く使われているデータフォーマットの1つである。
本調査では,データ空間を精製するための基本技術として,強化学習(RL)と特徴選択と特徴生成のための生成的アプローチについて検討する。
我々は,既存の課題を要約し,今後の研究の方向性について論じ,この分野の継続的なイノベーションを促進する洞察を提供することを目的とする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:41:47 GMT)
Stochastic Population Update Can Provably Be Helpful in Multi-Objective Evolutionary Algorithms [23.2] 多目的進化アルゴリズム(MOEA)における集団更新は重要な要素である
本稿では,MOEAの探索において,人口更新が有用であることを示す。
具体的には,二目的問題であるOneJumpZeroとBi-RoyalRoadの2つのMOEA(SMS-EMOAとNSGA-II)の予測実行時間を,決定論的集団更新機構をランダムに置き換えれば指数関数的に減少できることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:42:12 GMT)
Unveiling the Capabilities of Large Language Models in Detecting Offensive Language with Annotation Disagreement [23.0] 本研究では,攻撃言語検出における多言語モデル(LLM)の性能を系統的に評価する。
本研究では,二項分類の精度を分析し,モデル信頼度と人的不一致度の関係を検証し,不一致サンプルがモデル決定にどう影響するかを考察する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:03:10 GMT)
The Rotary Position Embedding May Cause Dimension Inefficiency in Attention Heads for Long-Distance Retrieval [23.0] RoPE(Rotary Position Embedding)は多くの大規模言語モデル(LLM)のアテンションヘッドで広く使われている。
本稿では,RoPEの適用が特定の次元の低効用を引き起こすことを示す制御実験を示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:32:29 GMT)
SSVEP-BiMA: Bifocal Masking Attention Leveraging Native and Symmetric-Antisymmetric Components for Robust SSVEP Decoding [22.6] 定常視覚誘発電位(SSVEP)に基づく脳-コンピュータインタフェース(BCI)は、そのシンプルさと高情報伝達速度(ITR)において一般的なパラダイムである。
本稿では,SSVEPの復号化にネイティブおよび対称非対称成分を相乗的に活用するバイオ焦点マスキングアテンションベース手法(SSVEP-BiMA)を提案する。
提案手法は,2つの公開データセットに対して実験を行い,提案手法が精度とITRの両方においてベースラインアプローチを超えることを示した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:58:59 GMT)
Libra: Leveraging Temporal Images for Biomedical Radiology Analysis [21.8] 放射線医学報告生成(RRG)には、高度な医用画像解析、効果的な時間的推論、正確なテキスト生成が必要である。
本稿では,胸部X線レポート生成に適した時間認識MLLMであるLibraを紹介する。
Libraは、放射線学固有の画像エンコーダと、ペア化された現在の画像と以前の画像の時間差を正確に捉え統合するために設計された新しい時間アライメントコネクタ(TAC)を組み合わせる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:29:23 GMT)
Leveraging Constrained Monte Carlo Tree Search to Generate Reliable Long Chain-of-Thought for Mathematical Reasoning [21.7] Long Chain-of-Thoughts (CoTs) は、Large Language Models (LLMs) の推論能力を改善するために広く注目を集めている。
本稿では, 動作空間の制約とLong CoTsの出現を, 洗練された探索戦略によって導くことを提案する。
提案手法により,72Bモデルを超える推論能力を 7B モデルで実現できる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:39:57 GMT)
Collaborative Deterministic-Diffusion Model for Probabilistic Urban Spatiotemporal Prediction [21.5] データに固有の複雑さを捉える上で,確率論的予測が果たす重要な役割を強調した。
我々は,予測精度と不確実性を扱う能力の両方を改善するために,決定論的・確率的モデルと協調するCoSTを提案する。
CoSTは決定論的指標と確率論的指標の両方において既存の手法を著しく上回り、計算コストの低い20%の改善を実現している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:35:26 GMT)
PEA: Enhancing LLM Performance on Computational-Reasoning Tasks [21.1] 本研究では、計算推論問題と呼ばれる重要な推論タスクのクラスを記述し、解決するための形式的なアプローチを紹介する。
このフレームワークはこれらの問題を述語と列挙の構成要素に分解し、LLMを使って特定の述語、列挙、集約ルールに基づいてプログラムを合成する。
実験的な評価により、PEAはベンチマーク計算問題における基礎となるモデルの性能を大幅に向上し、平均精度が約50%向上し、効率が向上することがわかった。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 00:27:05 GMT)
Enhancing Intent Understanding for Ambiguous Prompts through Human-Machine Co-Adaptation [21.0] ユーザのプロンプトと修正中の画像の相互情報を用いた人間機械協調型適応戦略を提案する。
改良されたモデルにより、複数ラウンドの調整の必要性が軽減されることが判明した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:02:47 GMT)
The Streaming Batch Model for Efficient and Fault-Tolerant Heterogeneous Execution [20.9] 本稿では, 効率的かつフォールトトレラントなヘテロジニアス実行を可能にする2つのモデルのハイブリッドであるストリーミングバッチモデルを紹介する。
我々は、従来のバッチ処理やストリーム処理システムと比較して、異種バッチ推論パイプラインのスループットを3~8$timesで改善するストリーミングバッチモデルの実装であるRay Dataを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:42:09 GMT)
Knowing Your Target: Target-Aware Transformer Makes Better Spatio-Temporal Video Grounding [20.9] 既存のTransformerベースのSTVGアプローチは、単に0を使用するオブジェクトクエリのセットを利用することが多い。
単純さにもかかわらず、これらのゼロオブジェクトクエリは、ターゲット固有の手がかりが欠如しているため、識別対象情報の学習が困難である。
STVG (Target-Aware Transformer for STVG) を新たに導入し,ビデオテキストペアからターゲット固有のキューを探索することで,オブジェクトクエリを適応的に生成する手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:38:33 GMT)
Leveraging Uncertainty Estimation for Efficient LLM Routing [20.7] エッジクラウド環境に大規模言語モデル(LLM)をデプロイするには、コストとレスポンス品質のバランスをとるための効率的なルーティング戦略が必要である。
従来のアプローチでは、ベンチマークデータセットから人間の参照データまたは精度メトリクスをルーティング基準として優先順位付けしていた。
我々は、不確実性推定を利用してルーティング決定を最適化する新しいフレームワークである信頼性駆動型LLMルータを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:08:47 GMT)
VulRG: Multi-Level Explainable Vulnerability Patch Ranking for Complex Systems Using Graphs [20.4] この作業では、脆弱性パッチの優先順位付けのためのグラフベースのフレームワークを導入している。
多様なデータソースとメトリクスを普遍的に適用可能なモデルに統合する。
洗練されたリスクメトリクスは、コンポーネント、アセット、システムレベルの詳細な評価を可能にします。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:21:52 GMT)
A Survey on Vulnerability Prioritization: Taxonomy, Metrics, and Research Challenges [20.4] リソース制約は効果的な脆弱性優先順位付け戦略を必要とする。
本稿では,メトリクスを重大度,悪用性,文脈要因,予測指標,集約手法に分類する新しい分類法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:33:37 GMT)
HawkEye: Statically and Accurately Profiling the Communication Cost of Models in Multi-party Learning [19.7] マルチパーティコンピューティング(MPC)ベースの機械学習(MPL)は、プライバシ保護を伴う複数のパーティからのデータを活用するための重要な技術となっている。
近年,MPL の通信オーバーヘッドを低減するため,様々な MPC 対応モデルが提案されている。
MPCフレンドリーなモデルの最適化の中で、この課題に取り組む重要な要素は、モデルの通信コストをプロファイリングすることである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:49:27 GMT)
Learning to Reason from Feedback at Test-Time [19.6] 成功を得るためには、環境とフィードバックとの反復的な相互作用がしばしば必要です。
既存のアプローチは、長さの一般化に苦しむか、事前情報を活用することなく、単純な再試行に依存している。
本稿では,テスト時の最適化問題としてフィードバック利用を定式化する新しいパラダイムであるFTTTを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:05:27 GMT)
A Critical Review of Predominant Bias in Neural Networks [19.6] この2つのバイアスには、永続的で、広範囲にまたがるが、未調査の混乱が存在することが分かりました。
これら2つの偏りの数学的定義を2つ提供し、これらの定義を活用して総合的な論文リストを統一することにより、明確さの回復を目指す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:55:19 GMT)
EPIC: Efficient Position-Independent Context Caching for Serving Large Language Models [19.5] EPICは、大きな言語モデルのための位置非依存のコンテキストキャッシュを導入している。
EPICはTTFTの最大8倍のスループットと既存のシステムに対する7倍のスループットを提供する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:50:00 GMT)
Alberta Wells Dataset: Pinpointing Oil and Gas Wells from Satellite Imagery [19.5] 何百万もの石油とガスの井戸が世界中に散らばっている。
これらの場所の多くは不明であり、井戸がふさがれるのを防ぎ、汚染効果が回避された。
本稿では,Planet Labsの高解像度マルチスペクトル衛星画像を活用した,この問題に対する最初の大規模ベンチマークデータセットを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:31:55 GMT)
Exposing Numeracy Gaps: A Benchmark to Evaluate Fundamental Numerical Abilities in Large Language Models [19.5] 大規模言語モデル(LLM)は、自然言語処理タスクにおける印象的な機能を示している。
基本算術、数値、等級数比較などの数値推論タスクにおけるそれらの性能は、驚くほど貧弱なままである。
既存のベンチマークは主に言語能力や構造化された数学的問題解決に焦点を当てている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:48:28 GMT)
MMUNLEARNER: Reformulating Multimodal Machine Unlearning in the Era of Multimodal Large Language Models [19.4] MLLM(Multimodal Large Language Models)の時代におけるMultimodal Machine Unlearning(MU)の課題を再考する。
我々は,新しい幾何制約付き降下勾配法MMUnlearnerを開発した。
MLLMの重みを、未学習時の残りの概念とテキスト知識に制約された重み値マップで更新する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:23:50 GMT)
Shortcuts and Identifiability in Concept-based Models from a Neuro-Symbolic Lens [19.3] 概念ベースモデル(concept-based Model)は、入力を高レベルな概念にマッピングする概念抽出器と、これらを予測に変換する推論層を学習するニューラルネットワークである。
概念ベースモデルと推論ショートカット(RS)の新たな接続を確立することでこの問題を研究する。
具体的には、まずRSを概念ベースモデルのより複雑な設定に拡張し、次に概念と推論層の両方を識別するための理論的条件を導出する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:45:09 GMT)
Provable and Practical Online Learning Rate Adaptation with Hypergradient Descent [19.2] 本稿では,過勾配降下法(HDM)の収束特性について検討する。
本研究では, 実験的, 理論的支援を伴う最新の適応勾配法の開発に本手法を適用した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:49:02 GMT)
FinMTEB: Finance Massive Text Embedding Benchmark [19.0] 金融分野向けに設計されたMTEBに特化して開発されたFinMTEB(FinMTEB)について紹介する。
FinMTEBは、7つのタスクにまたがる64の金融ドメイン固有の埋め込みデータセットで構成されている。
1)汎用ベンチマークのパフォーマンスは,金融ドメインタスクとの相関が限定されていること,(2)ドメイン適応モデルの方が汎用タスクより一貫して優れていること,(3)意外なことに,単純なBag-of-Words(BoW)アプローチは,金融セマンティックテクスチャ類似タスクにおける洗練された埋め込みよりも優れていること,の3点を示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:23:52 GMT)
OSUM: Advancing Open Speech Understanding Models with Limited Resources in Academia [18.7] 我々は,制約のある学術リソースの下でSLUMを訓練する可能性を検討するために,オープン音声理解モデルOSUMを提案する。
OSUMモデルは、WhisperエンコーダとQwen2 LLMを組み合わせて、音声認識(ASR)、タイムスタンプによる音声認識(SRWT)、音声イベント検出(VED)、音声感情認識(SER)、音声スタイル認識(SSR)、話者性別分類(SGC)、話者年齢予測(SAP)、音声テキストチャット(STTC)など、幅広い音声タスクをサポートする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:03:17 GMT)
Text-promptable Propagation for Referring Medical Image Sequence Segmentation [18.6] Referring Medical Image Sequenceは、医療用テキストプロンプトに対応する解剖学的実体を分類することを目的としている。
TPPは、クロスモーダルなプロンプト融合に基づく任意の対象のセグメンテーションをサポートする。
4つのモダリティと20の異なる臓器と病変を網羅した,大規模で包括的なベンチマークを作成した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:13:11 GMT)
RuleRAG: Rule-Guided Retrieval-Augmented Generation with Language Models for Question Answering [18.6] ルール誘導型検索拡張生成方式(RuleRAG-ICL)を提案する。
RuleQAの実験では、Recall@10では+89.2%の検索品質が向上し、Exact Matchでは+103.1%の回答精度が向上した。
さらに、既存のRAGデータセット4つの実験では、ルールQAのルールを提供することで、ルールRAGが有効であることを示している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:50:09 GMT)
Balancing the Budget: Understanding Trade-offs Between Supervised and Preference-Based Finetuning [18.4] 大規模言語モデルの訓練後、しばしば監視ファインタニング(SFT)のパイプラインと、優先度ファインタニング(PFT)が伴う。
本研究では,2段階間のトレーニングデータ予算を最適に割り当てる方法について検討する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:57:35 GMT)
Is Elo Rating Reliable? A Study Under Model Misspecification [18.4] 多くのゲームはBradley-Terryモデルの仮定から大きく逸脱しており、Eloの信頼性に関する疑問が提起されている。
これらの逸脱にもかかわらず、エロはより複雑な格付けシステムよりもしばしば優れている。
Eloの予測精度とランキング性能との間には強い相関関係が認められた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:07:33 GMT)
RomanLens: The Role Of Latent Romanization In Multilinguality In LLMs [18.3] 大言語モデル(LLM)は、英語中心のコーパスで主に訓練されているにもかかわらず、顕著な多言語一般化を示す。
多言語処理におけるブリッジとして,ローマ文字を用いた非ローマ文字の表現であるロマン化の役割について検討する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:10:22 GMT)
AdaGC: Improving Training Stability for Large Language Model Pretraining [18.2] 大きなLanguageText Models(LLM)は、スケーリング中に損失の急増に直面します。
グローバルなクリッピングがこれを緩和する一方で、従来のアプローチは特定のバリエーションを緩和する。
我々は,AdaGCがグローバルクリッピングよりも25%早く収束していることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:13:23 GMT)
Precise Asymptotics and Refined Regret of Variance-Aware UCB [18.1] マルチアーメッド・バンドイット(MAB)問題に対するアッパー信頼境界変動(UCB-V)の挙動について検討した。
UCB-Vは不安定であり,腕拍動速度が常に決定論的であるとは限らないことが示唆された。
この高い確率結果の応用として、UCB-Vがより洗練された後悔境界を達成できることが確かめられる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:55:38 GMT)
Beyond Pairwise: Global Zero-shot Temporal Graph Generation [18.1] 時間関係抽出(TRE)は自然言語処理(NLP)の基本課題である
本稿では,文書の完全時間グラフを同時に生成するTREのゼロショット手法を提案する。
また、ドキュメント内のターゲットイベントのすべてのペアに対する完全なアノテーションを備えた新しいデータセットであるOmniTempも導入しています。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:06:50 GMT)
CoLA: Compute-Efficient Pre-Training of LLMs via Low-Rank Activation [17.8] 我々は,CoLAとそのメモリ効率向上実装であるCoLA-Mを紹介する。
モデルアクティベーションにおいて広く観測される低ランク構造を利用して、モデルサイズを削減し、モデルのキャパシティを向上し、トレーニング効率を向上させる。
6000万から70億のパラメータを持つLLaMAモデルの実験では、CoLAはコンピューティングコストを$bf 2pmbtimes$で削減し、フルランクレベルのパフォーマンスを維持しながら、トレーニングスループットを$bf 1.86pmbtimes$で改善している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:05:16 GMT)
New Rates in Stochastic Decision-Theoretic Online Learning under Differential Privacy [17.7] HuとMehta(2024年)は、オープンな問題を提起した:$varepsilon$-differential privacyの下で、決定論的オンライン学習($K$アクションと$T$ラウンドを含む)の最適なインスタンス依存率は何ですか?
本稿では,2つの新しい結果を得ることで,この問題に部分的に対処する。まず,$Oleft(fraclog KDelta_min + fraclog2Kvarepsilonright)$。
第二に
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:13:51 GMT)
Break the Checkbox: Challenging Closed-Style Evaluations of Cultural Alignment in LLMs [17.7] 大規模言語モデル(LLM)における文化的アライメントを評価するために、クローズドスタイルのマルチチョイスサーベイに依存する研究が多数ある。
本研究では、この制約された評価パラダイムに挑戦し、より現実的で制約のないアプローチを探求する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 00:34:13 GMT)
Deep Incomplete Multi-view Learning via Cyclic Permutation of VAEs [17.3] 不完全データにおけるビュー間の不変関係を抽出する多視点自動エンコーダ(MVP)を提案する。
MVPは、変分自動エンコーダの潜在空間におけるビュー間の対応を確立し、行方不明のビューの推測を可能にする。
提案手法の有効性を,欠落率の異なる7つの多様なデータセットに対して示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:36:43 GMT)
Uncertainty-Aware Search and Value Models: Mitigating Search Scaling Flaws in LLMs [16.8] 本稿では,2つのキーコンポーネントを含む不確実性を考慮した検索フレームワークを提案する。
従来の値誘導探索では85.8%であった16サンプルに対して90.5%のカバレッジを達成した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:10:30 GMT)
$T^2$ of Thoughts: Temperature Tree Elicits Reasoning in Large Language Models [16.7] 大規模言語モデル(LLM)は人工知能、特に複雑な意思決定シナリオにおいて強力なツールとして登場した。
本研究では,LLMにおける温度木(T2$)による推論能力の向上について,アルゴリズムを用いて検討する。
温度に基づく動的探索深度調整は混合結果が得られるが,T2oT$の適応能力と組み合わせた固定探索深度は,より信頼性が高く,汎用的な問題解決戦略をもたらすことが示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:58:06 GMT)
Skillful Nowcasting of Convective Clouds With a Cascade Diffusion Model [16.6] 本稿では,衛星画像におけるクラウドフィールドの送信にカスケードアーキテクチャとマルチモーダル入力を利用する拡散モデルSATcastを紹介する。
SATcastは従来の手法よりも優れた精度とロバスト性を示している。
特にSATcastは、最大24時間予測スキルを維持しており、運用上の nowcasting アプリケーションの可能性を強調している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:29:13 GMT)
Are Generative Models Underconfident? An Embarrassingly Simple Quality Estimation Approach [16.2] 品質推定(QE)は、真理参照が得られない場合のモデル出力の品質を推定する。
複数の実行可能な出力オプションが存在する場合にモデルの信頼性を高めるDMP(Dominant Mass Probability)を提案する。
DMPはピアソンの地中品質との相関を平均+0.208で改善する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:12:31 GMT)
Mask Approximation Net: A Novel Diffusion Model Approach for Remote Sensing Change Captioning [15.9] 本稿では,拡散モデルを用いたリモートセンシング画像変化検出と記述のための新しいアプローチを提案する。
高周波ノイズの管理によりモデル性能を向上させるために,周波数誘導型複素フィルタモジュールを導入する。
本稿では,リモートセンシングによる変化検出と記述のための提案手法の有効性を検証する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:13:25 GMT)
Personalized Federated Fine-Tuning for LLMs via Data-Driven Heterogeneous Model Architectures [15.6] フェデレートラーニング(FL)は、データ共有なしで大規模言語モデルの協調的な微調整を可能にする。
データ駆動の異種モデルアーキテクチャを実現する軽量なパーソナライズFLフレームワークであるFedAMoLEを提案する。
実験によると、FedAMoLEは既存の手法に比べて平均5.14%精度が向上している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:57:35 GMT)
Large Language Models for Autonomous Driving (LLM4AD): oncept, Benchmark, Experiments, and Challenges [15.5] 大規模言語モデル(LLM)は、自律運転システムの様々な側面を強化する可能性を秘めている。
本稿では,自動走行(LLM4AD)のためのLLMの設計概念について紹介する。
LLM4ADシステムの性能とポテンシャルを徹底的に評価し、実世界の車両プラットフォーム上で一連の実験を行う。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:42:54 GMT)
Diffusing DeBias: a Recipe for Turning a Bug into a Feature [15.2] 本稿では,Diffusing DeBias (DDB)について述べる。
提案手法は, 条件付き拡散モデルを用いて, バイアスアンプモデルの訓練に用いる合成バイアスアライメント画像を生成する。
提案手法は,複数のベンチマークデータセットにおける現在の最先端の状態を,大きなマージンで打ち負かす。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:42:41 GMT)
Narrowing Information Bottleneck Theory for Multimodal Image-Text Representations Interpretability [15.2] Narrowing Information Bottleneck Theoryは、従来のボトルネックアプローチを再定義する新しいフレームワークである。
提案手法は,画像の解釈可能性の平均9%,テキストの解釈可能性の平均58.83%を向上し,処理速度63.95%を高速化する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:01:37 GMT)
TableTime: Reformulating Time Series Classification as Training-Free Table Understanding with Large Language Models [14.9] 大規模言語モデル (LLM) は多変量時系列分類において有効であることを示した。
LLM は LLM の潜在空間内の時系列の埋め込みを直接コードし、LLM の意味空間と一致させる。
MTSCを表理解タスクとして再編成するテーブルタイムを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:03:52 GMT)
Improving Similar Case Retrieval Ranking Performance By Revisiting RankSVM [14.7] 同様のケース検索は、最も重要な法的AIタスクの1つである。
我々は、言語モデルではなく、学習の観点から、現在のモデルのランク付け性能を改善しようとしている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:59:00 GMT)
FairCoT: Enhancing Fairness in Text-to-Image Generation via Chain of Thought Reasoning with Multimodal Large Language Models [14.6] 思考の連鎖(CoT)推論を通じて画像モデルにテキストの公平性を高める新しいフレームワークであるFairCoTを紹介する。
また,FairCoTは画像品質や意味的忠実さを犠牲にすることなく,公平性と多様性を著しく向上させることを示した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:55:25 GMT)
Efficient Long-Decoding Inference with Reasoning-Aware Attention Sparsity [14.4] 推論タスクを解くには、時間とメモリ消費の$O(N)を発生させる(思考の)長いデコードチェーンを必要とすることが多い。
我々はRaaSという新しいアルゴリズムを提案し、マイルストーントークンを識別し、保持するが、それはもはや必要なくなるまでである。
このパターンに基づいて,$O(L)$時間と$O(L)$メモリの複雑さで精度の高いRaaSというアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:28:52 GMT)
CBraMod: A Criss-Cross Brain Foundation Model for EEG Decoding [14.3] 初期のEEG復号法は教師付き学習に依存しており、特定のタスクやデータセットによって制限され、モデルの性能と一般化性を妨げる。
本稿では,空間的依存と時間的依存を別々にモデル化できるCBraModという新しい基礎モデルを提案する。
CBraModは、幅広いタスクにまたがって最先端のパフォーマンスを実現し、その強力な能力と一般化可能性を証明する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:05:43 GMT)
Leveraging Contrastive Learning for Enhanced Node Representations in Tokenized Graph Transformers [14.1] 我々はGCFormerと呼ばれる新しいグラフ変換器を提案し、最適なノード表現の学習にグラフ情報を利用する。
GCFormerはハイブリッドトークンジェネレータを開発し、正と負の2種類のトークンシーケンスを生成し、多様なグラフ情報をキャプチャする。
これらの生成されたトークンシーケンスから意味のあるノード表現を学習するために、カスタマイズされたTransformerベースのバックボーンが採用されている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:03:28 GMT)
Accelerating Anchors via Specialization and Feature Transformation [14.1] 説明品質を損なうことなくアンカーを加速するための事前学習型アプローチを提案する。
提案手法はアンカーのアルゴリズムの反復性を生かし、与えられた入力が十分正確になるまで説明を徐々に洗練する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:30:01 GMT)
TPCap: Unlocking Zero-Shot Image Captioning with Trigger-Augmented and Multi-Modal Purification Modules [14.1] TPCapは、ゼロショット画像キャプションのためのトリガー拡張およびマルチモーダル浄化フレームワークである。
0.82Mのトレーニング可能なパラメータとトレーニングしか持たず、TPCapは最先端のモデルに匹敵する競争性能を達成している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:16:03 GMT)
MasRouter: Learning to Route LLMs for Multi-Agent Systems [14.0] LLM(Large Language Models)をベースとしたマルチエージェントシステムは,LLM機能の境界を推し進めることが実証されている。
現在のルーティング手法は、クエリ毎にLLM選択をカスタマイズすることで、単一エージェントシナリオのオーバーヘッドを効果的に削減する。
まず、MASのすべてのコンポーネントを統一的なルーティングフレームワークに統合するマルチエージェントルーティングシステム(MASR)の問題を紹介する。
Mas is a high-perform, achieve a $1.8%sim8.2%$ improve over the state-of-the-art method on MBPP; 2) Economical, reduce overhead to up 52.07%$ than S.
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:00:59 GMT)
VisPath: Automated Visualization Code Synthesis via Multi-Path Reasoning and Feedback-Driven Optimization [14.0] VisPathは、不特定クエリを処理するために特別に設計されたマルチステージフレームワークである。
最初は初期クエリを使用して、Chain-of-Thought(CoT)プロンプトを通じて、さまざまな変更クエリを生成する。
洗練されたクエリは、候補の視覚化スクリプトを生成するために使用され、複数のイメージを生成するために実行される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:09:42 GMT)
Setting the Course, but Forgetting to Steer: Analyzing Compliance with GDPR's Right of Access to Data by Instagram, TikTok, and YouTube [13.9] 3つの主要なソーシャルメディアプラットフォームが提供するデータダウンロードパッケージ(DDP)の理解性と信頼性を評価する。
4カ国で400人の参加者を募集し、様々な要件にまたがるDDPの理解度を評価した。
また,自動ボットとユーザ支援型DDPを活用することで,DDPの信頼性を3つのプラットフォームで評価する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:15:11 GMT)
Triple Modality Fusion: Aligning Visual, Textual, and Graph Data with Large Language Models for Multi-Behavior Recommendations [13.9] 本稿では,三重モダリティの融合を活かした,多行動レコメンデーションのための新しいフレームワークを提案する。
提案モデルであるTriple Modality Fusion (TMF)は,大規模言語モデル(LLM)のパワーを利用して,これらの3つのモダリティを調整・統合する。
大規模な実験により,提案手法の有効性が示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:41:32 GMT)
medIKAL: Integrating Knowledge Graphs as Assistants of LLMs for Enhanced Clinical Diagnosis on EMRs [13.8] medIKALは、診断能力を高めるために、LLM(Large Language Models)と知識グラフ(KG)を組み合わせる。
medIKALは、そのタイプに基づいて医療記録のエンティティに重み付けされた重要性を割り当て、KG内の候補疾患の正確な局在を可能にする。
新たに導入した中国のEMRデータセットの広範な実験により,medIKALの有効性を検証した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:58:12 GMT)
ClimateLLM: Efficient Weather Forecasting via Frequency-Aware Large Language Models [13.7] 天気予報の基礎モデルであるClimateLLMを提案する。
時間的および空間横断的な協調フレームワークを通じて、時間的依存関係をキャプチャする。
周波数分解と大言語モデルを統合し、空間的および時間的モデリングを強化する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:57:50 GMT)
Mammo-Clustering: A Weakly Supervised Multi-view Tri-level Information Fusion Context Clustering Network for Localization and Classification in Mammography [13.6] マンモグラフィー画像は通常、非常に高解像度で、病変はごく小さな領域のみを占める。
ニューラルネットワークのダウンサンプリングは、マイクロ石灰化や微妙な構造が失われることを容易に引き起こす。
本稿では,三重情報融合を用いたコンテキストクラスタリングネットワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:00:00 GMT)
Mind Your Theory: Theory of Mind Goes Deeper Than Reasoning [13.5] LLMにおける心の理論(ToM)は近年,研究の中心的対象となっている。
LLMベンチマーク、ToMアドオン、ToM Probing、ToMの公式モデルなど、AIのさまざまなコミュニティにおけるいくつかの作業行を特定します。
認知タスクに使用される動的環境にインスパイアされたToM能力の評価を改善することを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:15:14 GMT)
Na'vi or Knave: Jailbreaking Language Models via Metaphorical Avatars [13.5] 本稿では,大規模言語モデル(LLM)の想像能力を利用してジェイルブレイクを実現する新たな攻撃フレームワークを提案する。
特に、AVATARは、与えられた有害な標的から有害な物質を抽出し、無害な敵性物質にマッピングする。
その結果, AVATAR は脱獄性 LLM を効果的に導入し, 最先端の攻撃成功率を達成できることが示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:19:14 GMT)
Singularity and universality from von Neumann to Rényi entanglement entropy and disorder operator in Motzkin chains [13.3] 障害作用素のスケーリングも、R'enyiエンタングルメントエントロピーと同様、先行項で$logl$であることを示す。
我々は、$logl$という用語の係数が、R'enyiエントロピーと障害作用素の両方において普遍定数であることを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:39:48 GMT)
Streamlining the Collaborative Chain of Models into A Single Forward Pass in Generation-Based Tasks [13.3] Retrieval-Augmented Generation(RAG)やエージェントベースのフレームワークでは、"Chain of Models"アプローチが広く使われている。
最近の進歩は、複数のタスクに適応する共有ベースモデルを可能にするプロンプトチューニングを適用することで、この問題に対処しようとしている。
本稿では,隠れ状態の共有を可能にする新しいプロンプトチューニング手法であるFTHSSを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:37:14 GMT)
A Survey of Large Language Models in Psychotherapy: Current Landscape and Future Directions [13.2] 大規模言語モデル(LLM)は、精神疾患の評価、診断、治療を強化することにより、精神療法における有望な解決策を提供する。
本調査は、精神療法におけるLLM応用の現状を概観する。
本稿では,精神療法の過程を,評価,診断,治療の3つの要素に分類し,各領域における課題と進歩を検討するための新しい概念分類法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:18:40 GMT)
Hierarchical Expert Prompt for Large-Language-Model: An Approach Defeat Elite AI in TextStarCraft II for the First Time [13.1] 大規模言語モデル(LLM)のための階層的エキスパート・プロンプトを提案する。
本手法は,専門家レベルの戦術知識を用いて,ゲーム状況の理解を改善する。
実験の結果,提案手法は複雑な意思決定課題に対処するための実用的な解法であることが示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:36:31 GMT)
Phantom: Subject-consistent video generation via cross-modal alignment [13.1] Phantomはシングルオブジェクトおよびマルチオブジェクト参照用の統合ビデオ生成フレームワークである。
我々は、既存のID保存ビデオ生成をカバーしつつ、強化されたアドバンテージを提供しながら、ヒューマンジェネレーションにおける主観的一貫性を強調した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:02:50 GMT)
Quality-Aware Decoding: Unifying Quality Estimation and Decoding [12.8] 本稿では,部分翻訳を確実に評価できる新しいトークンレベルQEモデルを提案する。
次に、品質認識復号のためのQEモデルを統合する復号戦略を提案する。
私たちのアプローチは文書翻訳タスクにおいて大きなメリットをもたらします。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:43:39 GMT)
When to Speak, When to Abstain: Contrastive Decoding with Abstention [12.6] 大規模言語モデル(LLM)は、事前訓練された(パラメトリック)知識と外部(文脈)知識を活用することで、様々なタスクにまたがる例外的なパフォーマンスを示す。
本稿では,LLMが関連する知識が利用可能であれば応答を生成でき,それ以外は無視できる新しい学習自由復号法であるContrastive Decoding with Abstentionを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:09:46 GMT)
Vision-Enhanced Time Series Forecasting via Latent Diffusion Models [12.5] LDM4TSは視覚強調時系列予測のための遅延拡散モデルの強力な画像再構成機能を利用する新しいフレームワークである。
時系列を多視点視覚表現に変換するための補完的変換手法を最初に用いた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:15:06 GMT)
PlanGenLLMs: A Modern Survey of LLM Planning Capabilities [12.3] LLMは計画を生成する大きな可能性を秘めており、初期世界の状態を望ましい目標状態に変換する。
これらのシステムの多くは特定の問題に適応しており、それらを比較したり、新しいタスクに最適なアプローチを決定することは困難である。
我々の調査は、このギャップを埋めるために、現在のLLMプランナの概要を概観することを目的としている。
1990年、カルタムとウィルキンスによる基礎研究に基づいて、完全性、実行可能性、最適性、表現、一般化、効率の6つの重要な性能基準を検証した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:54:57 GMT)
Safety Evaluation of DeepSeek Models in Chinese Contexts [12.3] Ciscoの子会社であるロバスト・インテリジェンスが行った調査によると、DeepSeek-R1は有害なプロンプトを処理する際に100%の攻撃成功率を持つ。
中国語と英語で堅牢なパフォーマンスを示すモデルとして、DeepSeekモデルは、両方の言語コンテキストにおいて同様に重要な安全性評価を必要とする。
本研究では,中国固有の安全性評価ベンチマークであるCHiSafetyBenchを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:05:54 GMT)
Exploring the Personality Traits of LLMs through Latent Features Steering [12.1] 本研究では, 文化的規範や環境ストレス要因などの要因が, 大規模言語モデル(LLM)内でどのように性格特性を形作るかを検討する。
本研究では,モデル内の要因に対応する潜在特徴を抽出し,ステアリングすることで,モデルの振る舞いを変更する訓練自由アプローチを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:19:15 GMT)
QA-Expand: Multi-Question Answer Generation for Enhanced Query Expansion in Information Retrieval [12.1] 本稿では,クエリ拡張のための新しい効果的なフレームワークであるQA-Expandを紹介する。
まず、最初のクエリから複数の関連する質問を生成し、その後、サロゲート文書として対応する疑似回答を生成する。
BEIR(英語版)やTREC(英語版)などのベンチマークの大規模な実験は、QA-Expandが最先端の手法よりも最大13%検索性能を向上させることを示した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:24:44 GMT)
Dyve: Thinking Fast and Slow for Dynamic Process Verification [11.7] Dyveは動的プロセス検証器で、高速で遅い思考を統合することで、大きな言語モデルにおける推論エラー検出を強化する。
我々は、Dyveが既存のプロセスベースの検証を著しく上回り、Best-of-N設定の性能を高めることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:11:19 GMT)
Generating Skyline Datasets for Data Science Models [11.5] 本稿では,複数のユーザ定義モデルパフォーマンス尺度を最適化することにより,データセットを検出するフレームワークであるMODisを紹介する。
スカイラインデータセットを生成するための3つの実現可能なアルゴリズムを導出する。
スカイラインデータ探索アルゴリズムの有効性と有効性を実験的に検証した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:33:59 GMT)
Predicting Depression in Screening Interviews from Interactive Multi-Theme Collaboration [11.4] 本稿では,対話型抑うつ検出フレームワークを提案する。
テキスト内学習技術を活用して、臨床面接におけるテーマを特定し、テーマ内およびテーマ間相関の両方をモデル化する。
臨床医の興味をシミュレートするためにAIによるフィードバックを採用し、テーマのインタラクティブな調整が重要となる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:37:16 GMT)
Ramp Up NTT in Record Time using GPU-Accelerated Algorithms and LLM-based Code Generation [11.1] ホモモルフィック暗号化(HE)はプライバシ保護機械学習(PPML)のコアビルディングブロックである
HEの性能向上のために、多くのGPU加速暗号方式が提案されている。
大規模言語モデル(LLM)の強力なコード生成能力を考えると、実用的なGPUフレンドリなアルゴリズムコードを自動的に生成する可能性を探究する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:53:23 GMT)
Noncommutative metasurfaces enabled diverse quantum path entanglement of structured photons [11.0] 本研究では,非可換な準曲面と絡み合った光子との相互作用を利用して,多様な経路の絡み合いを実現する手法を提案する。
提案手法は,幅広い量子状態のスペクトルにまたがる多様な量子パスの絡み合いのチューニングを可能にする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:51:47 GMT)
The Case of FBA as a DEX Processing Model [11.0] 連続処理は、各入ってくるトランザクションと現在の注文帳とを一致させる。
離散処理は、一様価格の2倍のオークションでバッチで個別にトランザクションを実行する。
一般的なシナリオでは、福祉損失が少なく、継続的な処理よりも流動性が高いことが分かりました。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:03:20 GMT)
How to Backdoor Consistency Models? [11.0] バックドア攻撃に対する一貫性モデルの脆弱性に関する最初の研究を行う。
提案フレームワークは,バックドア攻撃に対する一貫性モデルの脆弱性を実証する。
我々のフレームワークは、高い実用性と特異性を維持しながら、一貫性モデルの妥協に成功した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:54:38 GMT)
Statistical inference on black-box generative models in the data kernel perspective space [10.9] ブラックボックス生成モデルの表現結果をモデルレベルの統計的推論タスクに拡張する。
モデルレベルの表現は複数の推論タスクに有効であることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 00:52:37 GMT)
CARMA: Enhanced Compositionality in LLMs via Advanced Regularisation and Mutual Information Alignment [10.8] 我々は,大規模言語モデルにおける構成的推論の安定性と堅牢性を高めるために,CARMAを提案する。
CARMAは、特徴の断片化を軽減するために、相互情報の規則化と階層的安定性の制約を用いる。
その結果, CARMAは微調整によって生じる変動を低減し, トークン表現を安定化し, 構成的推論を改善した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:18:15 GMT)
CSP: A Simulator For Multi-Agent Ranking Competitions [10.8] ランキングコンペティションでは、文書作者は過去のランキングに反応してコンテンツを変更することで、最高のランキングを競う。
生成AIの台頭、特にLarge Language Models(LLMs)は、文書作成者としてLLMを使用するという新しいパラダイムを導入している。
このアプローチは、人間による競争におけるスケーラビリティの制約に対処し、ウェブ上でのLLM生成コンテンツの役割の増大を反映している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:56:15 GMT)
QuaLLM: An LLM-based Framework to Extract Quantitative Insights from Online Forums [10.7] 本研究は,オンラインフォーラム上でテキストデータから量的洞察を分析し,抽出する新しいフレームワークであるQuaLLMを紹介する。
このフレームワークを適用して、Redditの2つのライドシェアワーカーコミュニティからの100万以上のコメントを分析しました。
AIとアルゴリズムのプラットフォーム決定に関する重要な労働者の懸念を明らかにし、労働者の洞察に関する規制の要求に応えました。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:30:22 GMT)
Talk Structurally, Act Hierarchically: A Collaborative Framework for LLM Multi-Agent Systems [10.7] textitTalk 構造的には、Act Hierarchically (TalkHier) はコンテキスト豊富な交換のための構造化通信プロトコルを導入する新しいフレームワークである。
textitTalkHierは、推論スケーリングモデル(OpenAI-o1)、オープンソースのマルチエージェントモデル(AgentVerseなど)など、さまざまな種類のSoTAを追い越している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:26:58 GMT)
Transfer Learning Analysis of Variational Quantum Circuits [10.6] 本研究は変分量子回路(VQC)の伝達学習を解析する
損失境界の解析において,VQCの適応性と能力を検討するために形式主義を確立した。
解析的微調整法は、類似ドメインの適応に最適な遷移を実現するために導かれる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:33:35 GMT)
A Large Language Model Guided Topic Refinement Mechanism for Short Text Modeling [10.6] 既存のトピックモデルは、しばしば短いテキストの根底にあるセマンティックなパターンを正確に捉えるのに苦労する。
本稿では,トピックリファインメント(Topic Refinement)と呼ばれる新しいモデル非依存機構を提案する。
トピックリファインメントによりトピックの品質が向上し、トピック関連テキスト分類タスクのパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:36:45 GMT)
G-Safeguard: A Topology-Guided Security Lens and Treatment on LLM-based Multi-agent Systems [10.5] 大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は,様々な複雑なタスクにおいて顕著な機能を示した。
これらのシステムがますます重要なアプリケーションに統合されるにつれて、敵の攻撃、誤情報伝播、意図しない行動に対する脆弱性が懸念されている。
我々は、トポロジー誘導型セキュリティレンズであるG-Safeguardを導入し、ロバストMASに対する治療を行った。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:48:41 GMT)
Reversible Data Hiding over Encrypted Images via Intrinsic Correlation in Block-Based Secret Sharing [10.4] 暗号化された画像(RDH-EI)を隠蔽する可逆的データは、クラウドサービスのセキュアなイメージ管理に不可欠である。
既存のRDH-EIスキームは、しばしば高い計算複雑性、低い埋め込み率、過剰なデータ拡張に悩まされる。
本稿では,ブロック方式の秘密共有をまず分析することにより,これらの課題に対処する。
高容量RDH-EIスキームと大容量RDH-EIスキームの2つの新しいRDH-EIスキームを設計する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:35:12 GMT)
Gaussian multi-target filtering with target dynamics driven by a stochastic differential equation [10.3] 本稿では,連続時間に目標ダイナミクスを付与し,離散時間で測定を行うマルチターゲットフィルタリングアルゴリズムを提案する。
本研究では,新しいターゲットの集合の分布を導出し,その誕生時の各ターゲットの最適な適合平均と共分散のクローズドフォーム表現を算出する。
これらの連続離散多ターゲットフィルタは、非線形微分方程式によって駆動される標的力学にも拡張される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:12:28 GMT)
MSc-SQL: Multi-Sample Critiquing Small Language Models For Text-To-SQL Translation [10.2] テキスト・ツー・ジェネレーションは、非専門家が自然言語でデータベースと対話することを可能にする。
GPT-4のような大規模クローズドソースモデルの最近の進歩は、アクセシビリティ、プライバシ、レイテンシの課題を提示している。
我々は、小型で効率的でオープンソースのテキスト・ツー・ジェネレーション・モデルの開発に注力する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:37:28 GMT)
Maximize Your Diffusion: A Study into Reward Maximization and Alignment for Diffusion-based Control [10.2] 拡散に基づく計画、学習、制御手法は、強力で表現力豊かな意思決定ソリューションの有望な分岐を示す。
制御応用のための微調整手法の拡張について検討する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 00:30:39 GMT)
AIGC for Industrial Time Series: From Deep Generative Models to Large Generative Models [10.1] 本稿では,DGMからLGMへの産業時系列生成モデルの概要を概説する。
まず,産業時系列生成のためのDGMベースのAIGCフレームワークを提案する。このフレームワークでは,先進的な産業用DGMを調査し,多視点分類を提案する。
さらに, 産業用LGMの構築に必要な重要な技術は, 大規模産業用データセット, 複合産業用LGMアーキテクチャ, 産業用時系列の自己監督訓練, 産業用ダウンストリームタスクの微調整の4つの側面から分析する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:04:11 GMT)
Deep Reinforcement Learning-Based Bidding Strategies for Prosumers Trading in Double Auction-Based Transactive Energy Market [10.1] コミュニティベースのダブルオークション市場は、消費者が社会福祉への参加と最大化を奨励する有望なTEMと見なされている。
本研究では,複数のDERを具備したTEMを用いて,エネルギー取引を透過的かつ効率的に管理する方式を提案する。
また、市場環境のスケーラビリティとプライバシを確保するために、分散学習と実行を伴う深層強化学習(DRL)モデルを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:38:21 GMT)
Coarse-to-Fine Process Reward Modeling for Mathematical Reasoning [9.8] 大規模言語モデル(LLM)は、厳密なインクリメンタルな情報を示すのに失敗することが多い。
そこで本研究では,単純かつ効果的な粗大な戦略であるモデルを提案する。
モデルは、重要なきめ細かい知識を保持しながら冗長性を緩和する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:23:07 GMT)
OptMATH: A Scalable Bidirectional Data Synthesis Framework for Optimization Modeling [9.6] 高品質な最適化モデリングデータセットの欠如は、大きな言語モデルを悩ませます。
本稿では,OptMATHという高品質なデータセットを合成するためのスケーラブルなフレームワークを提案する。
我々は,OptMATHでトレーニングした様々なサイズのモデルが,複数のモデリングベンチマークにおいて優れた結果が得られることを実証した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:38:37 GMT)
Prompting in the Dark: Assessing Human Performance in Prompt Engineering for Data Labeling When Gold Labels Are Absent [9.5] 本稿では,ユーザが手動でラベル付けされたベンチマークを使わずに,大規模言語モデル(LLM)にデータをラベル付けするシナリオについて検討する。
われわれはGoogle SheetsアドオンであるPromptingSheetを開発した。
その結果,4回以上の反復でラベル付け精度が向上したのは,暗黒でのプロンプトが信頼性の低い9名のみであった。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:54:26 GMT)
Revealing the Inherent Instructability of Pre-Trained Language Models [9.5] 本稿では,RT(Response Tuning)が命令とそれに対応する対応マッピングを命令チューニングから取り除くことを示す。
実験の結果、RTは応答のみに基づいて訓練され、広範囲の指示に効果的に反応し、訓練対象に近づきやすいことを示すことができた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:50:42 GMT)
Reversal of Thought: Enhancing Large Language Models with Preference-Guided Reverse Reasoning Warm-up [9.4] 大規模言語モデル(LLM)は、推論タスクにおいて顕著な性能を示すが、数学的および複雑な論理的推論において制限に直面している。
バッチ推論前のウォームアップフェーズにおいて,LLMの論理的推論能力を高めるために,Reversal of Thought (RoT)を提案する。
RoT は Preference-Guided Reverse Reasoning warm-up 戦略を利用している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:11:13 GMT)
Vision Language Models Know Law of Conservation without Understanding More-or-Less [9.3] ConserveBenchは、物理量の4次元にわたる365の認知実験の電池である。
ビジョン言語モデルは一般的に変換タスクに長けているが、非変換タスクでは失敗する傾向にある。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:35:10 GMT)
ALGEN: Few-shot Inversion Attacks on Textual Embeddings using Alignment and Generation [9.2] ALGEN(alignment and generation)を用いたテキスト・エンベディング・インバージョン・アタックを提案する。
ALGEN攻撃はドメインや言語間で効果的に転送でき、重要な情報を明らかにする。
我々は,NLPに埋め込みアライメントを応用した新しいテキスト埋め込みインバージョンパラダイムを構築した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:11:13 GMT)
POD-Attention: Unlocking Full Prefill-Decode Overlap for Faster LLM Inference [9.2] 我々は、ハイブリッドバッチの注意を効率的に計算する最初のGPUカーネルであるPOD-Attentionを紹介する。
POD-Attentionは、GPUのリソースを慎重に割り当てることで、計算帯域とメモリ帯域の両方の利用を最大化することを目的としている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:09:25 GMT)
CL-MFAP: A Contrastive Learning-Based Multimodal Foundation Model for Molecular Property Prediction and Antibiotic Screening [9.2] 非教師付きコントラスト学習(CL)ベースのマルチモーダル基礎(MF)モデルであるCL-MFAPを導入する。
このモデルは、ChEMBLデータセットから薬物のような性質を持つ1.6万の生物活性分子を用いて、3つのエンコーダを共同で事前訓練する。
CL-MFAPは、異なる分子モードを有効利用することにより、抗生物質特性予測におけるベースラインモデルより優れ、抗生物質関連特性予測タスクの微調整時に、ドメイン特異的性能が優れていることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:45:19 GMT)
Efficient Alternating Minimization with Applications to Weighted Low Rank Approximation [9.1] 我々は,更新を概ね計算できる最小化の交互化フレームワークを開発した。
我々のフレームワークの核心は、反復最小化の堅牢な解析とともに、高精度な多重応答回帰解法である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:02:16 GMT)
Utilitarian Algorithm Configuration for Infinite Parameter Spaces [9.1] 有効性アルゴリズム構成は、与えられたアルゴリズムのパラメータ空間を自動的に検索し、その性能を最適化する手法である。
無限パラメータ空間を効率的に探索するためのCOUP(Continuous, Optimistic Utilitarian Procrastination)を導入する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:15:31 GMT)
Rideshare Transparency: Translating Gig Worker Insights on AI Platform Design to Policy [8.9] 透明性に関連する害、緩和戦略、労働者のニーズを特定します。
オンラインプラットフォームワーカーコミュニティに投稿された100万件以上のコメントのLCMに基づく分析を組み合わせた,新しい混合手法による研究を用いている。
我々は、プラットフォームが公開透明性レポートを公開することを要求する新しい規制は、労働者の幸福を改善するためのより効果的な解決策であると主張している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:48:50 GMT)
ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations [8.6] 本研究は,フォントラベルアノテーションを使わずに,原画像のみを用いてフォント制御可能な多言語テキストレンダリングを実現することができることを示す。
この実験は、ゼロショットテキストにおける我々のアルゴリズムの概念の証明と、多様なフォントや言語にわたるフォント編集を提供する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:30:18 GMT)
Grammatical Error Correction for Low-Resource Languages: The Case of Zarma [8.4] 文法的誤り訂正は、テキストの品質と可読性を改善することを目的としている。
西アフリカで500万人以上が話していたGEC for Zarmaについて検討する。
ルールベース手法,機械翻訳(MT)モデル,大規模言語モデルという3つのアプローチを比較した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:41:58 GMT)
QuOTE: Question-Oriented Text Embeddings [8.4] QuOTE(Question-Oriented Text Embeddings)は、検索強化世代(RAG)システムへの新たな拡張である。
従来のRAGパイプラインとは異なり、QuOTEは、チャンクが潜在的に答えうる仮説的な質問でチャンクを拡張する。
マルチホップ質問応答タスクを含め,QuOTEは検索精度を大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:37:13 GMT)
A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems [8.3] 安全性とパフォーマンスは競合する目標になり得るため、共同最適化が難しくなる。
本稿では,性能目標をコスト関数で符号化し,安全性要件を状態制約として課す,状態制約付き最適制御問題を提案する。
結果値関数はハミルトン・ヤコビ・ベルマン方程式を満たすことを示した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:46:17 GMT)
Let's Be Self-generated via Step by Step: A Curriculum Learning Approach to Automated Reasoning with Large Language Models [8.3] カリキュラム学習にインスパイアされたtextbfLBS3 自動推論のための新しいプロンプト手法を提案する。
LBS3はLLMを操り、ターゲットクエリに関連付けられた簡単にハードなプロキシクエリをリコールする。
これは、簡単なプロキシクエリから派生した例的なプロンプトを利用して、ハードプロキシクエリの解決にLSMを向けるプログレッシブ戦略を起動する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:50:33 GMT)
Prevalence, Sharing Patterns, and Spreaders of Multimodal AI-Generated Content on X during the 2024 U.S. Presidential Election [8.0] AIGCのスーパースプレッダーは、右傾向きで自動動作を示すX Premiumサブスクライバーである可能性が高い。
この研究は、オンライン社会政治環境を形成する上で、生成的AIが果たす役割を理解するための第一歩となる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:55:29 GMT)
Practical Topics in Optimization [8.0] 最適化は、数学、コンピュータ科学、オペレーション研究、機械学習など、進歩する分野において基礎的な役割を果たす。
機械学習モデルの精細化からリソース割り当ての改善、効率的なアルゴリズムの設計に至るまで、最適化技術は複雑な問題に取り組む上で不可欠なツールである。
本書は,各分野における最適化手法の理解と適用に必要な知識を読者に提供することを目的としている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:00:50 GMT)
LLMs and Childhood Safety: Identifying Risks and Proposing a Protection Framework for Safe Child-LLM Interaction [8.0] 本研究では,子育て型アプリケーションにおけるLarge Language Models (LLMs) の利用拡大について検討する。
これは、バイアス、有害なコンテンツ、文化的過敏といった安全性と倫理上の懸念を強調している。
本稿では,コンテンツ安全性,行動倫理,文化的感受性の指標を取り入れた安全・LLMインタラクションのための保護フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:39:48 GMT)
Efficient and Effective Prompt Tuning via Prompt Decomposition and Compressed Outer Product [8.0] 低パラメータプロンプトチューニング法は、PT法とLoRA法で性能と効率を向上する。
6つのアーキテクチャと8つのデータセットにわたる実験により、LAMPはパフォーマンスと効率において、最先端のPTベースのメソッドとLoRAベースのメソッドより優れていることが示された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:50:12 GMT)
Quantifying the Capability Boundary of DeepSeek Models: An Application-Driven Performance Analysis [7.9] 我々は,DeepSeek-V3,DeepSeek-R1,DeepSeek-R1-Distill-Qwen,DeepSeek-R1-Distill-LlamaシリーズをA-Eval上で評価した。
元の命令調整モデルと蒸留モデルを比較して、推論の強化が性能に与える影響を分析する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:29:58 GMT)
The Shrinking Landscape of Linguistic Diversity in the Age of Large Language Models [7.8] 大規模言語モデル (LLMs) は, 言語多様性の顕著な低下と関係があることが示唆された。
テキストの中核的な内容は、LLMがテキストを洗練・書き直しする際に保持されるが、書体スタイルを均質化するだけでなく、特定の支配的特徴やバイアスを選択的に増幅し、他を抑圧する方法でスタイル的要素を変更することも示している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:51:07 GMT)
FairFare: A Tool for Crowdsourcing Rideshare Data to Empower Labor Organizers [7.8] ライダーワーカーは、ギグワークプラットフォームが不透明なAIとアルゴリズムシステムに依存しているため、予測不可能な労働条件を経験する。
FairFareは、従業員のデータをクラウドソースして分析して、テイクレートを見積もるツールです。
評価インタビューの間、主催者はフェアファールが法案言語とコロラド州上院法案24-75の成立に影響を与えたと報告した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:30:26 GMT)
Performance Review on LLM for solving leetcode problems [7.7] 本稿では,Lietcodeのプログラミング問題に対するLLM(Large Language Models)の総合的な性能評価について述べる。
我々は, GPT-4 と GPT-3.5-turbo を含む複数の LLM の解を生成する。
コード生成や問題解決タスクにおける現在のLLMの長所と短所を強調した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:52:45 GMT)
DualContrast: Unsupervised Disentangling of Content and Transformations with Implicit Parameterization [7.6] 形状に焦点を絞った科学画像データセットの解析には,コンテンツと変換の教師なしの歪みが重要である。
生成モデルを用いた新しいコントラスト手法であるDualContrastを開発した。
本実験は,既存の自己監督的・明示的パラメータ化手法に対するDualContrastの有効性を示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:13:26 GMT)
Balancing Embedding Spectrum for Recommendation [7.5] 表現は埋め込み空間全体の部分空間にまたがる傾向を示し、最適解が得られ、モデルの容量が減少することを示した。
トレーニング中の埋め込みのスペクトル分布のバランスをとるために,DirectSpecと呼ばれる新しい手法を提案する。
また,無関係なサンプルをより効率的に最適化するために,自己ペース勾配を用いた拡張型DirectSpec+を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:51:05 GMT)
Classical elasticity meets quantum complexity: A connection from the holographic lens [7.4] せん断応力と形成の複雑さはせん断ひずみの増加とともに増大することを示す。
非常に大きなせん断状態において、それらは協調した振る舞いを示し、普遍的なスケーリング関係に固執する。
我々の発見は、大きな静的ブラックホールのベッケンシュタイン-ホーキングエントロピーと共に、複雑性が線形にスケールするという以前の理解に反する反例を与える。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:30:18 GMT)
Leveraging Previous Steps: A Training-free Fast Solver for Flow Diffusion [7.4] フロー拡散モデル (FDM) は近年, 高品質のため, 生成タスクの可能性を示唆している。
現在のFDMの常微分方程式(ODE)解法は依然として遅い生成に悩まされている。
高品質な生成を維持しつつ,NFEを低減できる新しいトレーニングフリーフローゾルバを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:41:43 GMT)
AI-Augmented Metamorphic Testing for Comprehensive Validation of Autonomous Vehicles [7.2] 自動運転車は交通機関に革命をもたらす可能性があるが、安全を確保することは大きな課題だ。
従来のテスト手法では、システムの振る舞いが正しいかどうかを判断するオラクルの問題を含む、重要な制限に直面している。
我々は、安定拡散のようなAI駆動画像生成ツールを統合することで、メタモルフィックテスト(MT)を強化することを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:31:59 GMT)
Strain induced topological phase transitions in split and line graphs of bipartite lattices featuring flat bands [7.1] フラットバンドを汎用的に支持する2次元格子のクラスについて検討し,その電子的およびトポロジ的特性に対するひずみの影響に着目した。
ひずみがない場合、スピン軌道結合の導入はバルク励起ギャップを誘導し、平坦なバンドを位相的に非自明な特性を持つ準平らなバンドに変換する。
本研究は, 電子・トポロジカル相を多種多様な2次元材料で操作するための汎用ツールとして, ひずみ工学の可能性を強調した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:00:01 GMT)
Span-Agnostic Optimal Sample Complexity and Oracle Inequalities for Average-Reward RL [7.0] 生成モデルを用いてマルコフ決定過程(MDP)において,$varepsilon$-optimal Policyを求める際のサンプル複雑性について検討した。
我々は,知識を必要とせず,最適なスパンベース複雑性に適合するアルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:10:55 GMT)
Spatial Conformal Inference through Localized Quantile Regression [7.0] 等角予測はパラメトリックな仮定に頼ることなく有効な予測間隔を提供する。
本研究では,空間データに特化して設計された共形予測法である局所空間整形予測(L SCP)を提案する。
L SCP は既存の手法に比べて非常に厳密で一貫した予測間隔で正確なカバレッジを実現する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:48:57 GMT)
The Relationship between No-Regret Learning and Online Conformal Prediction [7.0] 本研究は,ノンレグレット学習とオンライン共形予測の関係を示す。
敵の設定における閾値カバレッジとスワップレグレットの密接な関係を示す。
また, グループ条件付きカバレッジを保証するために, 後悔しない学習アルゴリズムを使わずに, 続くリーダーファミリーのアルゴリズムを使用できることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:39:05 GMT)
Generalization of the Gibbs algorithm with high probability at low temperatures [6.8] 本稿では、Gibsアルゴリズムの一般化誤差にバウンダリを与え、高温領域における既知のデータ非依存境界を復元する。
高い確率で、ギブスの後部から引き出された1つの仮説の一般化誤差は、同様のまたはより小さな経験的誤りを伴う全ての仮説の総容積とともに減少する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:40:19 GMT)
Code Simulation as a Proxy for High-order Tasks in Large Language Models [6.7] 我々は、Large Language Models (LLM) の能力を評価するために、自然主義的および合成的推論タスクのペアを収集する。
我々は、プログラミングにおける共通構造を、自然主義的推論タスクの構成要素の1つとして活用する。
我々の貢献は、手作りの人間注記問題に対するスケーラブルな補完として、LLMの推論能力を総合的にテストすることの上に成り立っている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:32:00 GMT)
Cost-Effective Attention Mechanisms for Low Resource Settings: Necessity & Sufficiency of Linear Transformations [6.7] Scaled Dot Product Attention (SDPA)は、現代のディープラーニングアプリケーションのバックボーンです。
その万能性を犠牲にすることなく効率を向上する。
我々はSDPAを最大10%向上させながら、その速度を改善し、パラメータを25%削減することに成功していることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:14:16 GMT)
Grand Challenges in Immersive Technologies for Cultural Heritage [6.7] 没入型技術の統合は、文化遺産の提示方法を変えてきた。
これらのテクノロジの採用は、さまざまな課題や潜在的なリスクをもたらします。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:26:51 GMT)
Stochastic Optimization of Inventory at Large-scale Supply Chains [6.7] 所望のサービスレベルを維持しながら在庫と関連するコストを最小限に抑えるシミュレーション最適化フレームワークを提案する。
フレームワークの目標は、事前に定義されたサービスレベルの制約を受けるコストを最小限に抑える最適なリオーダーパラメータを見つけることです。
このアプローチは在庫水準を10~35%削減し、数十億ドルの経済的利益をもたらすことが証明されている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:25:50 GMT)
Generating Millions Of Lean Theorems With Proofs By Exploring State Transition Graphs [6.7] 我々はLeanNavigatorを開発した。これはリーンの定理と証明の大規模なデータセットを生成する新しい方法だ。
我々は10億のトークンを合計470万の定理で生成し、以前のデータセットを桁違いに上回った。
この広範なデータセットを使用して、我々は、定理証明タスクにおいて最先端のReProverモデルより優れたAIモデルを訓練した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:20:39 GMT)
Leveraging Multimodal-LLMs Assisted by Instance Segmentation for Intelligent Traffic Monitoring [6.6] 本研究では,リアルタイムQuanser Interactive Labシミュレーションプラットフォーム上でのトラフィック監視作業にLLaVAビジュアルグラウンド・マルチモーダル大言語モデル(LLM)を利用する。
複数の都市に設置されたカメラはシミュレーションからリアルタイムの画像を収集し、LLaVAモデルに入力して分析を行う。
このシステムは、車両の位置を認識する精度が84.3%、ステアリング方向が76.4%で、従来のモデルを上回っている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:03:26 GMT)
CacheFocus: Dynamic Cache Re-Positioning for Efficient Retrieval-Augmented Generation [6.5] LLM(Large Language Models)は、入力長と計算コストの制限により、様々な言語タスクを排他的に拡張する。
既存のアプローチであるtextemdashは、これらの問題を部分的に緩和するが、しばしば追加のトレーニングを必要とするか、より長い入力でパフォーマンス劣化に悩まされる。
textbftextitCacheFocusは、長さの正規化を強化し、さらなるトレーニングを行わずに推論遅延を低減する方法である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:33:16 GMT)
A Spatiotemporal Approach to Tri-Perspective Representation for 3D Semantic Occupancy Prediction [6.5] 視覚に基づく3Dセマンティック占有予測は、LiDARベースのアプローチを好んで、ますます見落としている。
本研究では、時間的コヒーレントな3Dセマンティック占有度を予測するために設計されたトランスフォーマーアーキテクチャであるS2TPVFormerを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:14:02 GMT)
WhiSPA: Semantically and Psychologically Aligned Whisper with Self-Supervised Contrastive and Student-Teacher Learning [6.3] 本研究は,後続のテキスト-LMが不要となるような音声モデルにおけるLMの改善手法を提案する。
本稿では,教師としての言語モデル埋め込みによる対照的な損失という,新たな学習目標を生かしたWhiSPAを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:25:21 GMT)
MultiTEND: A Multilingual Benchmark for Natural Language to NoSQL Query Translation [6.1] 本稿では,自然言語によるクエリ生成のためのマルチ言語ベンチマークとして,MultiTENDを紹介する。
自然言語を様々な言語構造にまたがるクエリに翻訳する際の課題を分析する。
並列リンクプロセスを通じてクエリ生成ギャップに多言語入力をブリッジする新しいフレームワークであるMultiLinkを紹介する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:12:47 GMT)
TituLLMs: A Family of Bangla LLMs with Comprehensive Benchmarking [6.1] 1B と 3B のパラメータサイズで最初の大容量バングラ LLM である TituLLMs を提示する。
TituLLMsをトレーニングするために、約37億トークンの事前トレーニングデータセットを収集しました。
我々はLlama-3.2トークンを言語や文化固有の知識に組み込むように拡張した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:22:23 GMT)
Smoothing Out Hallucinations: Mitigating LLM Hallucination with Smoothed Knowledge Distillation [5.9] 我々は知識蒸留(KD)による幻覚の緩和を提案する。
KDは学生モデルにスムーズなソフトラベルを提供し、自信過剰を減らし、事実的根拠を改善する。
要約ベンチマークの実験結果から、KDは標準的な微調整に比べて幻覚を減少させることが示された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:05:36 GMT)
Quantum learning advantage on a scalable photonic platform [5.8] 物理システムの学習における量子的優位性は 未解決のフロンティアのままです
本稿では、ボゾン変位過程の確率分布を学習するための量子拡張プロトコルのフォトニック実装を提案する。
この結果から,非理想的,雑音的絡み合いであっても,連続変数量子系において有意な量子優位性を実現することができることが示された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:19:55 GMT)
MCGAN: Enhancing GAN Training with Regression-Based Generator Loss [5.8] 高忠実度データを生成する強力なツールとして,GAN(Generative Adversarial Network)が登場している。
既存のアプローチの主なボトルネックは、ジェネレータトレーニングの監督の欠如である。
我々はモンテカルロガン(MCGAN)と呼ばれるアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:49:00 GMT)
Electronic States and Mechanical Behaviors of Phosphorus Carbide Nanotubes -- Structural and Quantum Phase Transitions in a Quasi-one-dimensional Material [5.7] モノレイヤーの$PC_3$ -- 前回の手紙でカゴメバンドを2つ持っていると判明した -- は、ナノチューブに巻き上げると、多くの印象的な特性を示す。
アームチェアと$PC_3$NTsは室温が安定であり、ディラックと電子平面バンドの縮退した組み合わせをフェルミ準位に表示する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:56:34 GMT)
Rethinking Oversmoothing in Graph Neural Networks: A Rank-Based Perspective [5.5] ランクベースのメトリクスが常に過剰なスムースを捉えるのに対して、エネルギーベースのメトリクスは失敗することが多いことを示す。
特に,エネルギー指標が変化しないシナリオにおいても,ランクの大幅な低下が性能劣化と密接に一致していることが明らかになった。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:57:44 GMT)
Is The Watermarking Of LLM-Generated Code Robust? [5.5] コードベースのコンテキストでは、ウォーターマーキングのテクニックがはるかに脆弱であることを示します。
具体的には、変数リネームやデッドコード挿入といった単純なセマンティック保存変換が、ウォーターマークを効果的に消去できることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:31:00 GMT)
CounterBench: A Benchmark for Counterfactuals Reasoning in Large Language Models [5.4] 本研究では, 大規模言語モデル(LLM)の性能評価を行った。
我々は,新しいベンチマークデータセットであるCounterBenchを紹介した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:19:37 GMT)
Integrating Language Models for Enhanced Network State Monitoring in DRL-Based SFC Provisioning [5.4] 本稿では,Deep Reinforcement Learning(DRL)とLanguage Models(LM)を統合し,ネットワーク管理を強化する。
DRLからLMに最終的なVNF割り当てを供給することにより、システムはSFC、DC、VNFに関連するクエリを処理および応答し、リソース利用、ボトルネック検出、将来の需要計画に関するリアルタイムな洞察を可能にする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:52:14 GMT)
Error Bounds for Open Quantum Systems with Harmonic Bosonic Bath [5.3] ボーソニック浴を用いた開量子系の物理観測可能性のバス相関関数依存性について検討した。
図式および議論に基づいて,浴槽相関関数の変動によって引き起こされる物理観測値の差を誤差推定する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:32:48 GMT)
Survival Kernets: Scalable and Interpretable Deep Kernel Survival Analysis with an Accuracy Guarantee [5.3] 本稿では、サバイバルカーネットと呼ばれる新しいディープカーネルサバイバルモデルを提案する。
解釈や理論解析のモデル化が可能な方法で、大規模なデータセットにスケールする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 00:24:54 GMT)
CORDIAL: Can Multimodal Large Language Models Effectively Understand Coherence Relationships? [5.2] 本研究は、類似度に基づくメトリクスを超えて、MLLMを評価するための談話駆動フレームワークを採用することの必要性を強調する。
我々のベンチマークである CORDIAL は、3つの異なる談話領域で様々な粒度でコヒーレンス関係を包含している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:54:44 GMT)
From Deception to Perception: The Surprising Benefits of Deepfakes for Detecting, Measuring, and Mitigating Bias [5.2] ディープフェイク技術は 悪用の可能性があると 批判されています
本研究は、重要な社会的領域におけるバイアスを検出し、測定し、緩和するためのツールとして、その重要な可能性を実証する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:55:28 GMT)
On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.1] 我々は,強い対数対数データの下での拡散に基づく生成モデルの収束挙動を理論的に保証する。
スコア推定に使用される関数のクラスは、スコア関数上のリプシッツネスの仮定を避けるために、リプシッツ連続関数からなる。
この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:56:15 GMT)
Directional Transport in Rydberg Atom Arrays via Kinetic Constraints and Temporal Modulation [5.0] 不等間隔の原子配列における励起と絡み合った状態の方向輸送を実現するための実験的に実現可能なスキームを提案する。
距離依存性のRydberg-Rydberg相互作用と時間変調レーザデチューニングを活用することにより,局所的なアドレッシングを必要とせずに励起流を誘導する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:47:00 GMT)
JPEG Inspired Deep Learning [5.0] 精巧なJPEG圧縮は、ディープラーニング(DL)の性能を実際に向上させる
トレーニング可能なJPEG圧縮層で基盤となるDNNアーキテクチャをプリペイドする新しいDLフレームワークであるJPEG-DLを提案する。
私たちのコードはhttps://github.com/AhmedHussKhalifa/Inspired-DL.gitで利用可能です。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:42:15 GMT)
Akan Cinematic Emotions (ACE): A Multimodal Multi-party Dataset for Emotion Recognition in Movie Dialogues [4.9] アカン会話感情データセット(Akan Conversation Emotion dataset)は、アフリカ語における最初のマルチモーダル感情対話データセットである。
385の感情ラベル付き対話と6,162の発話が音声、視覚、テキストのモダリティにわたって含まれている。
このデータセットに韻律ラベルがあることは、最初の韻律的に注釈付けされたアフリカの言語データセットにもなった。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:24:33 GMT)
Towards identifying possible fault-tolerant advantage of quantum linear system algorithms in terms of space, time and energy [4.8] 耐故障性超伝導デバイスにおける空間,時間,エネルギー資源の詳細な評価を行う。
我々の研究は、フォールトトレラントな量子コンピュータが現実世界にまつわる問題に対して、可能で重要な利益を達成するためにどれだけ進歩すべきかを定量的に決定する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:12:32 GMT)
Cultural Palette: Pluralising Culture Alignment via Multi-agent Palette [4.7] 大きな言語モデル(LLM)は、世代における顕著なパフォーマンスにもかかわらず、さまざまな文化的価値と整合する上で課題に直面します。
文化パレット(Cultural Palette)は、文化的なアライメントを再定義するマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:21:29 GMT)
Artificial Intelligence in Creative Industries: Advances Prior to 2025 [4.7] 人工知能(AI)の急速な進歩は、クリエイティブ産業に大きな影響を与えた。
本稿は、これらの開発が創造的機会と効率をどのように拡大したかを考察する。
これらの革新にもかかわらず、クリエイティブコンテンツからの通信トラフィックが要求されるため、特にメディア業界には課題が残っている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:20:10 GMT)
Towards Real-Time Generation of Delay-Compensated Video Feeds for Outdoor Mobile Robot Teleoperation [4.7] 本稿では,教師のための遅延補償画像をリアルタイムで生成するモジュール型学習ベースビジョンパイプラインを提案する。
提案手法は,我々の設定における最先端のアプローチと比較して,より正確な画像を生成する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:43:14 GMT)
Demystifying Hateful Content: Leveraging Large Multimodal Models for Hateful Meme Detection with Explainable Decisions [4.6] 本稿では,LMM(Large Multimodal Models)を利用した新しいフレームワークであるIntMemeを紹介する。
IntMemeは、ミームのモデレーションにおける正確性と説明可能性の両方を改善するという2つの課題に対処する。
提案手法はPT-VLMにおける不透明度と誤分類の問題に対処し,LMMを用いた憎しみのあるミーム検出を最適化する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:45:40 GMT)
Error Bound Analysis for the Regularized Loss of Deep Linear Neural Networks [4.6] 深部線形ネットワークの正則化二乗損失の局所的幾何学的景観を特徴付ける。
エラーホールドの下の十分かつ必要な条件を特定します。
本研究では,線形ネットワークの正規化損失に対して勾配が線形収束を示すことを示す数値実験を行った。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:53:52 GMT)
FlashCheck: Exploration of Efficient Evidence Retrieval for Fast Fact-Checking [4.6] ファクトチェックの自動化は,誤報をリアルタイムで,情報源で効果的に対処するために不可欠である。
既存の研究は主に、大規模なデータ収集からの証拠検索ではなく、事実検証の部分に焦点を当てている。
本稿では,ウィキペディアのような大規模コレクションからの簡潔な事実文の集合を索引付けして,事実チェックパイプラインの検索フェーズを強化する手法について検討する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:05:21 GMT)
OMG: Opacity Matters in Material Modeling with Gaussian Splatting [4.6] 逆レンダリングはコンピュータビジョンとグラフィックスにおける長年の問題である。
ニューラルレンダリングの最近の進歩は、フォトリアリスティックでプラウシブルな逆レンダリング結果を可能にする。
3D Gaussian Splattingの出現は、リアルタイムレンダリングの可能性を示すことによって、それを次のレベルへと引き上げた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:18:41 GMT)
ShieldLearner: A New Paradigm for Jailbreak Attack Defense in LLMs [4.5] ShieldLearnerは、防衛における人間の学習を模倣する新しいパラダイムである。
試行錯誤によって、アタックシグネチャを自動でパターンアトラスに蒸留する。
Adaptive Adversarial Augmentationは、防御されたプロンプトの逆のバリエーションを生成する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:47:41 GMT)
FED: Fast and Efficient Dataset Deduplication Framework with GPU Acceleration [4.5] 最近NVIDIAはGPUベースのMinHash LSH復号法を導入したが、まだ準最適である。
本稿では,GPUクラスタにMinHash LSHを最適化するGPU高速化復号化フレームワークFEDを提案する。
大規模な実験では、1.2兆のトークンの重複は4ノード16GPU環境でわずか6時間で完了する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:56:11 GMT)
Wearable-based Fair and Accurate Pain Assessment Using Multi-Attribute Fairness Loss in Convolutional Neural Networks [4.5] 臨床的な痛み評価におけるAIの採用は、パーソナライゼーションや公平性といった課題によって妨げられている。
機械学習やディープラーニングを含む多くのAIモデルは偏見を示し、性別や民族に基づいて特定のグループを識別する。
本稿では、データ中の保護属性を考慮に入れたマルチ属性フェアネス損失(MAFL)に基づく畳み込みニューラルネットワーク(CNN)モデルを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:41:21 GMT)
Investigating Language Preference of Multilingual RAG Systems [4.4] MRAGシステムは、クエリとドキュメント間の言語的バリエーションによって、関連する情報を取得するのに苦労する。
本稿では,翻訳された多言語パスを相補的なモデル知識で融合するフレームワークであるDual Knowledge Multilingual RAGを提案する。
実験結果から,DKM-RAGは言語嗜好を緩和し,多様な言語環境における性能向上を図っている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:54:05 GMT)
Fairness with Exponential Weights [4.4] 特定のアプリケーションにおける識別を除去する必要性から、Hedgeの効率的な実装を等価な文脈的帯域幅問題に対して効率的に変換できるメタアルゴリズムを開発した。
統計的に同値な任意のアルゴリズムに対して、結果のアルゴリズムは、それぞれ独立に保護された特性に対してExp4の対応するインスタンスを実行するのと同じ後悔境界を持つ。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:07:06 GMT)
Leveraging Large Language Models for Cybersecurity: Enhancing SMS Spam Detection with Robust and Context-Aware Text Classification [4.3] 本研究では,SMSデータ中のスパムメッセージの検出における特徴抽出手法と分類アルゴリズムの有効性を評価する。
TF-IDFは、Naive Bayes、Support Vector Machines、Deep Neural Networksと組み合わせると、最も信頼性の高いパフォーマンスを提供する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:39:36 GMT)
The Computational Advantage of MIP* Vanishes in the Presence of Noise [4.0] エンタングルメント MIP* を持つ量子マルチプロペラ対話型証明システムは、古典的な MIP よりもはるかに強力である。
QinとYao '21と'23の最近の研究は、プローサの共有状態がノイズを含む場合、この利点は著しく減少することを示した。
提案手法では,各EPR状態が任意に小さなノイズ量で影響を受ける場合,その複雑性クラスはNEXP = MIPと等価であることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:42:42 GMT)
Solving Online Resource-Constrained Scheduling for Follow-Up Observation in Astronomy: a Reinforcement Learning Approach [4.0] 本稿では,オンライン天文資源制約スケジューリングのための強化学習手法であるROARSを提案する。
天文観測スケジューリングの構造を捉えるために、有向非巡回グラフ(DAG)を用いて全てのスケジュールを記述する。
深い強化学習は、収束するまで反復的に局所的な書き換えを行うことで実現可能なソリューションを改善する政策を学ぶために使用される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:01:12 GMT)
Leveraging Conditional Mutual Information to Improve Large Language Model Fine-Tuning For Classification [3.9] 本稿では,条件付き相互情報(CMI)の情報理論原理を大規模言語モデル(LLM)の微調整に適用する。
我々の研究は情報理論とLLM開発の間のギャップを埋め、ハイパフォーマンスな言語モデルを構築するための新たな洞察を提供する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:24:00 GMT)
JExplore: Design Space Exploration Tool for Nvidia Jetson Boards [3.8] JExploreはマルチボードソフトウェアおよびハードウェアデザインスペース探索ツールである。
任意の検索ツールと統合できるため、検索アルゴリズムの共通ベンチマークグラウンドを作成することができる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:37:01 GMT)
Artworks Reimagined: Exploring Human-AI Co-Creation through Body Prompting [3.8] 本稿では,公共施設における画像生成のための入力モダリティとしてのボディプロンプトについて検討する。
このコンセプトをインタラクティブなアートインスタレーションであるArtworks Reimaginedに実装し、ボディプロンプトを通じて既存のアートを変換します。
ビジターのサンプルを半構造化したインタビュー(N = 79)では,ボディプロンプトが良好に受容され,インスタレーションのビジターにとって魅力的な,楽しい体験が得られた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:20:54 GMT)
MemeSense: An Adaptive In-Context Framework for Social Commonsense Driven Meme Moderation [3.8] 本稿では,ソーシャルコモンセンス推論を視覚的および意味論的に関連付けられた参照例と融合する,適応型インコンテキスト学習フレームワークであるMemeSenseを紹介する。
MemeSenseは、語彙的、視覚的、倫理的な考慮を効果的にバランスさせ、正確かつコンテキスト対応のミーム介入を可能にする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:46:24 GMT)
RT-DEMT: A hybrid real-time acupoint detection model combining mamba and transformer [3.6] 伝統的な中国の治療法は、高い主観性のために臨床実践においてしばしば論争に直面する。
現在のインテリジェントアシスト治療システムには2つの大きな制限がある。
本稿では,効率的なグローバル情報統合を実現するための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:59:06 GMT)
Sampling reduced density matrix to extract fine levels of entanglement spectrum [3.6] 低層微細絡み合いスペクトル(ES)を抽出する新しい手法を提案する。
量子モンテカルロシミュレーションを用いて環境をトレースし、還元密度行列を対角化してESを得る。
我々のシミュレーション結果は、前例のないほど大きなシステムサイズで、環境自由度の高い絡み合いスペクトルの実践的なスキームを確立した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:51:05 GMT)
Low-Rank Continual Personalization of Diffusion Models [3.6] 近年のDreamboothやLoRAのような拡散モデルのパーソナライズ手法は、微調整された事前学習モデルによって新しい概念を創出することができる。
これらのテクニックを連続したタスクに適用して、例えば新しいオブジェクトやスタイルを含むようにすることで、以前の知識を忘れてしまう。
本研究では,過去のタスクのアダプタにアクセスできない厳密な体制下での継続的カスタマイズの問題に取り組む。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:55:37 GMT)
Surgical Scene Understanding in the Era of Foundation AI Models: A Comprehensive Review [3.6] 機械学習(ML)とディープラーニング(DL)の最近の進歩は、最小侵襲手術(MIS)における外科的シーン理解を著しく強化している。
本稿では、CNN、ビジョントランスフォーマー(ViT)、Segment Anything Model(SAM)のような基礎モデルなど、最先端のMLおよびDL技術の統合について調査する。
本稿では,これらの技術が直面する課題,例えばデータの変動性や計算要求について考察し,臨床環境における倫理的考察と統合のハードルについて考察する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:27:20 GMT)
Accurate estimation of feature importance faithfulness for tree models [3.5] 我々は、PGI二乗と呼ぶ特徴ランク(または属性)の予測忠実度を摂動に基づく計量として考える。
PGI2乗に基づく木モデルの予測において重要となる特徴のランク付け手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:05:39 GMT)
Measurement-Based Entanglement Distillation and Constant-Rate Quantum Repeaters over Arbitrary Distances [3.5] 測定に基づく量子リピータは絡み合った蒸留とリンク間の交換を用いる。
本稿では, 測定に基づく絡み合い蒸留のための体系的プロトコルと, 安定器符号を活用可能なリピータへの応用について紹介する。
この研究は、将来のグローバルスケールのフォールトトレラント量子ネットワークのためのスケーラブルなバックボーンを確立する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:53:09 GMT)
AI Generations: From AI 1.0 to AI 4.0 [3.4] 本稿では,人工知能(AI)が複数の世代にまたがって進化していくことを提案する。
これらのAI世代は、アルゴリズム、計算能力、データ間の優先順位のシフトによって駆動される。
人工知能が人間のような自律性に近づいた(あるいはそうしようとする)ときに生じる、深い倫理的、規制的、哲学的な課題を探求する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:19:44 GMT)
Standalone FPGA-Based QAOA Emulator for Weighted-MaxCut on Embedded Devices [3.4] 本研究は,組み込みシステムのための,コンパクトでスタンドアロンなFPGAベースのQCエミュレータを提案する。
提案した設計は、時間複雑性を O(N2) から O(N) に還元する。
エミュレータは2キュービット構成の1.53倍から9キュービット構成の852倍までの省エネを実現した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:30:16 GMT)
Exploiting Defenses against GAN-Based Feature Inference Attacks in Federated Learning [3.4] フェデレートラーニング(FL)は、データプライバシを維持しながら、孤立したデータアイランドをマージすることを目的としている。
近年の研究では、GANベースの攻撃をFLで使用して、プライベートデータセットの分布を学習できることが示されている。
攻撃者が被害者のデータの実際の分布を学習するのを防ぐためのフレームワークであるAnti-GANを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:05:54 GMT)
ECG-Expert-QA: A Benchmark for Evaluating Medical Large Language Models in Heart Disease Diagnosis [3.3] ECG-Expert-QAは、ECG解釈における診断能力を評価するために設計された総合的なマルチモーダルデータセットである。
データセットは47,211個の精巧にキュレートされた質問応答ペアで構成され、臨床シナリオの範囲にまたがる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:28:55 GMT)
Neural Networks Remember More: The Power of Parameter Isolation and Combination [3.2] 破滅的な忘れは、事前訓練された言語モデルにとって広範囲にわたる問題である。
この問題を解決するための鍵は、モデルの可塑性と安定性の間のトレードオフを見つけることである。
モデル安定性と塑性のバランスをとるための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:58:57 GMT)
A Survey on Active Feature Acquisition Strategies [3.2] アクティブな特徴取得は、完全なデータ収集のコストを抑えながら正確な予測を行うという課題を研究する。
これらの戦略は、各インスタンスで最も重要な機能のみを選択的に取得することにより、データ収集が高価または時間を要するシナリオにおける効率的な意思決定を可能にする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:19:33 GMT)
Vendi-RAG: Adaptively Trading-Off Diversity And Quality Significantly Improves Retrieval Augmented Generation With LLMs [3.0] Vendi-RAGは、検索の多様性と回答の品質を共同で最適化する反復的なプロセスに基づくフレームワークである。
Veddi-RAGは、フレキシブルな類似性に基づく多様性指標であるVendi Score(VS)を活用して、文書検索における意味的多様性を促進する。
Veddi-RAGは従来のシングルステップとマルチステップのRAGアプローチよりも大幅に精度が向上している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:46:10 GMT)
Zero-Reference Lighting Estimation Diffusion Model for Low-Light Image Enhancement [3.0] ゼロLEDと呼ばれる低照度画像強調のための新しいゼロ参照光推定拡散モデルを提案する。
拡散モデルの安定収束能力を利用して、低照度領域と実常照度領域の間のギャップを埋める。
ゼロ参照学習を通じてペアのトレーニングデータへの依存を緩和する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:38:42 GMT)
FLIP: Flow-Centric Generative Planning as General-Purpose Manipulation World Model [3.0] 本稿では,視覚空間のモデルベース計画アルゴリズムFLIPについて述べる。
FLIPは、オブジェクト、ロボット、タスクに対して、一般的なアクション表現としてイメージフローを持つ長い水平プランを合成することができる。
さらに、合成されたフローとビデオプランは、ロボットの実行のための低レベル制御ポリシーのトレーニングをガイドすることができる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:13:51 GMT)
Faces of Fairness: Examining Bias in Facial Expression Recognition Datasets and Models [2.9] 本研究では、FERデータセットとモデルにおけるバイアス源について検討する。
AffectNet、ExpW、Fer2013、RAF-DBの4つの共通のFERデータセットが分析されている。
本研究は、最先端畳み込みニューラルネットワーク(CNN)モデルを含む6つの深層モデルのバイアスと公平性を評価する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:23:16 GMT)
Unveiling Environmental Impacts of Large Language Model Serving: A Functional Unit View [2.6] 大規模言語モデル(LLM)は強力な能力を提供するが、特に二酸化炭素の排出において、環境コストがかなり高い。
機能ユニット (FU) の概念を導入し, LLM の環境影響を評価するための FU ベースのフレームワークである FUEL を開発した。
本研究は, モデル選択, 展開戦略, ハードウェア選択を最適化することにより, 二酸化炭素排出量削減の可能性を明らかにする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:20:18 GMT)
Identifiability of total effects from abstractions of time series causal graphs [2.6] 本研究では,観測時系列からの介入による全効果の同定可能性の問題について検討する。
我々は、拡張された要約因果グラフと要約因果グラフの2つの抽象概念を考察する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:47:07 GMT)
Agentic LLM Framework for Adaptive Decision Discourse [2.5] 本研究では,実世界のエージェント型大規模言語モデル(LLM)フレームワークを紹介する。
従来の意思決定支援ツールとは異なり、このフレームワークは対話、トレードオフ探索、エージェント間の相互作用によって生成される創発的なシナジーを強調している。
その結果、第1次探索がいかに堅牢で公平なレコメンデーションパスを育むかが明らかとなった。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:46:37 GMT)
Teaching Well-Structured Code: A Literature Review of Instructional Approaches [2.4] この体系的な文献レビューは、既存の教育的アプローチ、その目的、およびそれらの効果を測定するために使用される戦略を識別する。
これらの研究は,(1)自動化ツールの開発・評価に焦点をあてた研究,(2)他の教材について議論する研究,(3)コード品質を支援するためのコース設計の全体的アプローチを通じて,カリキュラムにコード構造を統合する方法について議論する研究の3つのカテゴリに分類した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:51:22 GMT)
Controlling Quantum Coherence of V-type Atom in Dissipative Cavity by Detuning and Weak Measurement Reversal [2.4] V型原子と散逸性単一モードキャビティからなる対話型システムを考える。
量子コヒーレンス(quantum coherences)は、自然発生干渉(SGI)、空洞と環境の結合、弱い測定とその逆転、原子と空洞の間の変形などのパラメータで研究される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:56:43 GMT)
DT4ECG: A Dual-Task Learning Framework for ECG-Based Human Identity Recognition and Human Activity Detection [2.3] 本稿では、心電図に基づく人物識別と活動検出のための革新的なデュアルタスク学習フレームワークDT4ECGを紹介する。
このフレームワークは、残留ブロックと統合された堅牢な1次元畳み込みニューラルネットワーク(1D-CNN)を用いて、識別ECGの特徴を抽出する。
その結果,ID分類では99.12%,活動分類では90.11%の精度が得られた。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:13:59 GMT)
Robust Q-Learning for finite ambiguity sets [2.3] 分布的に堅牢なマルコフ決定問題を解くための新しい$Q$-learningアルゴリズムを提案する。
我々のアプローチは、ある基準測度の周りの球のあいまいさ集合を含むよく研究されたケースを越えている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:16:16 GMT)
Evolving Skeletons: Motion Dynamics in Action Recognition [2.3] 我々は骨格グラフとハイパーグラフの表現を比較し、動き注入されたポーズに対する静的ポーズを解析する。
本研究は, テイラー変態骨格の強度と限界を強調し, 運動力学の強化の可能性を示した。
本研究は,運動量の多いデータを処理し,行動認識の分野を前進させる,革新的な骨格モデリング技術の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:11:23 GMT)
Do Language Models Understand Time? [2.3] 大規模言語モデル(LLM)は、アクション認識、異常検出、要約を含む、ビデオベースのコンピュータビジョンアプリケーションに革命をもたらした。
本研究は,ビデオ処理におけるLLMの役割を,時間的推論能力に着目して批判的に考察する。
LLMの時間的理解を制限するため、バイアス、時間的アノテーションの欠如、ドメイン固有の制限など、既存のビデオデータセットによる課題を分析します。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:55:06 GMT)
MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation [2.3] MedCLIP-SAMv2はCLIPとSAMモデルを統合して臨床スキャンのセグメンテーションを行う新しいフレームワークである。
提案手法は,DHN-NCE(Decoupled Hard Negative Noise Contrastive Estimation)によるBiomedCLIPモデルの微調整を含む。
また,ゼロショットセグメンテーションラベルを弱教師付きパラダイム内で使用することにより,セグメンテーション品質をさらに向上する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:31:28 GMT)
TUMLU: A Unified and Native Language Understanding Benchmark for Turkic Languages [2.1] 本稿では,テュルク語MMLUのTUMLUとTUMLU-miniの2つのベンチマークを提案する。
TUMLU-miniは、アゼルバイジャン語、クリミア・タタール語、カラカルパック語、カザフ語、タタール語、トルコ語、ウイグル語、ウズベク語で11人の学者からなる中・高校レベルの質問からなる。
また、より簡潔でバランスの取れた、手作業によるデータセットのサブセットであるTUMLU-miniも提示します。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:07:38 GMT)
Game-Of-Goals: Using adversarial games to achieve strategic resilience [2.1] 競合するエージェントは、最大限の逆境で行動していると仮定する。
ゲームツリー探索法を用いて最適な実行戦略を選択する。
評価関数は、実行計画を修正可能にしたいという考えに基づいています。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:34:59 GMT)
The Q-Spellbook: Crafting Surface Code Layouts and Magic State Protocols for Large-Scale Quantum Computing [2.1] 量子誤り訂正は、信頼性のある量子コンピューティングの基盤となる。
表面符号はクリフォードゲートにとって効率的であるが、非クリフォードゲートを処理するにはマジックステート蒸留プロトコルが必要である。
任意の回路を修正できる大規模量子アーキテクチャでは、データキュービットの特殊曲面符号とマジック状態蒸留の個別符号が必要である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:13:51 GMT)
Non-Uniform Memory Sampling in Experience Replay [2.0] 破滅的な忘れを和らげるための一般的な戦略は、経験的なリプレイである。
ほとんどのアプローチでは、このバッファからのサンプリングはデフォルトで一様であると仮定する。
我々は試験毎に50種類の非一様サンプリング確率重みを生成し、最終的な精度を一様サンプリング基準値と比較する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:04:16 GMT)
Asymptotic Freedom at the Berezinskii-Kosterlitz-Thouless Transition without Fine-Tuning Using a Qubit Regularization [1.8] 本研究では, 2次元のハードコアループガスモデルを提案し, 理論的に自由な大規模量子場理論を定式化する方法を提案する。
微調整がなければ、我々のモデルは、古典格子XYモデルの普遍的なステップスケーリング関数を大相で再現することができる。
Berezinskii-Kosterlitz-Thouless遷移における普遍量のいくつかは、従来のXYモデルと比較して、我々のモデルにおいてより小さい有限サイズ効果を示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:47:20 GMT)
Benchmarking the performance of quantum computing software [1.8] Benchpressは、複数の量子コンピューティングソフトウェア開発キットのパフォーマンスと範囲を評価するベンチマークスイートである。
Benchpressはオープンソースであるため、パフォーマンスクレームの透明性と検証が保証される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:51:16 GMT)
Downlink CCM Estimation via Representation Learning with Graph Regularization [1.7] 本稿では,UL CCM を DL CCM にマッピング関数でマッピングする環境について考察する。
推定問題の解法として表現学習アルゴリズムを提案する。
提案アルゴリズムは3つの誤差指標でベンチマーク手法を超越する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:33:51 GMT)
UNITE-FND: Reframing Multimodal Fake News Detection through Unimodal Scene Translation [1.7] UNITE-FNDは,非モーダルテキスト分類タスクとしてマルチモーダルフェイクニュース検出を再構成する新しいフレームワークである。
本稿では,Gemini 1.5 Proを用いて,視覚コンテンツを構造化されたテキスト記述に変換する6つの特殊プロンプト戦略を提案する。
この結果から、構造化されたテキストベースの表現は、直接マルチモーダル処理を最小限の精度で置き換えることができることが示された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:00:57 GMT)
Adjust Your Focus: Defocus Deblurring From Dual-Pixel Images Using Explicit Multi-Scale Cross-Correlation [1.7] 写真ではデフォーカスのぼかしが一般的な問題である。
最近の研究は、この問題を解決するためにデュアルピクセル(DP)画像情報を活用している。
本稿では,2つのDPビュー間の相互相関関係を明示的に提案し,ネットワークの適切な振れを導出する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 05:55:57 GMT)
Primus: A Pioneering Collection of Open-Source Datasets for Cybersecurity LLM Training [1.5] 大規模言語モデル(LLM)は、金融、法律、医学などの専門分野において顕著な進歩を見せている。
本稿では,プレトレーニング,命令微調整,蒸留の推論など,すべての主要な訓練段階をカバーする包括的なデータセットについて紹介する。
データセットの継続事前トレーニングでは、集計スコアが15.88%向上し、蒸留の推論ではセキュリティ認証が10%向上した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:34:49 GMT)
Self-Reflection Makes Large Language Models Safer, Less Biased, and Ideologically Neutral [1.5] 自己回帰はより安全になり(毒性のないものは97.8%、毒性のないものは75.8%)、バイアスの少ない(77%、偏りのないものは94.3%)、イデオロギー的に中立な反応(党派寄りの反応は100%、非党派的な反応は87.7%)であることが示される。
本稿は,大規模言語モデルの展開における本研究の意義について論じる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:33:15 GMT)
Distributed Learning with Discretely Observed Functional Data [1.5] 本稿では,分散スペクトルアルゴリズムとソボレフカーネルを組み合わせることで,関数線形回帰問題に取り組む。
アルゴリズムの仮説関数空間は、ソボレフカーネルによって生成されるソボレフ空間である。
我々は、ソボレフノルムにおける分散スペクトルアルゴリズムの収束に対する上界と下界のマッチングを導出する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:36:05 GMT)
Exploiting network optimization stability for enhanced PET image denoising using deep image prior [1.4] PETは、トレーサー線量とスキャン時間に制約があるため、統計的ノイズによって影響を受ける。
画像品質向上のために, 深層学習(DL)に基づくPET復調法が用いられている。
本稿では,DLソリューションをより信頼性が高くし,条件付き深度画像に適用する手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:27:56 GMT)
Decoding Reading Goals from Eye Movements [1.3] 本研究は,情報探索と一般読解の2種類の共通読解目標を区別できるかどうかを検討する。
大規模な視線追跡データを用いて、様々なアーキテクチャとデータ表現戦略をカバーする幅広いモデルを用いて、この問題に対処する。
我々は、参加者がテキストを読み終えるずっと前に、正確な予測をリアルタイムで行うことができることを発見した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:19:17 GMT)
Surprisal Takes It All: Eye Tracking Based Cognitive Evaluation of Text Readability Measures [1.2] 可読性評価のための新しいアイトラッキング手法を提案する。
既存の可読性公式は読みやすさの予測因子として適度であることがわかった。
単語あたりの平均長、頻度、特に副詞は読みやすさの指標として既存の可読性公式より優れている傾向にある。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:51:44 GMT)
Mixture of Tunable Experts - Behavior Modification of DeepSeek-R1 at Inference Time [1.2] 本稿では,Large Language Models(LLMs)のMixture-of-Expertsアーキテクチャを拡張する手法を提案する。
MoTEは、推論時間中のLLMにおける有意義で集中的な振る舞い変化を可能にする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:24:39 GMT)
Déjà Vu? Decoding Repeated Reading from Eye Movements [1.2] 視線移動パターンに基づいて、読者が以前テキストに遭遇したかどうかを自動的に判断できるかどうかを問う。
我々はこのタスクの2つの変種を導入し、特徴ベースモデルとニューラルモデルの両方を用いて大きな成功を収めた。
本稿では,モデルが使用する情報に対する洞察を得られるモデル性能の分析を行い,その一方で,予測モデリングを解析ツールとして活用し,繰り返し読み出しにおけるメモリの役割をよりよく評価する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:59:29 GMT)
GS-GVINS: A Tightly-integrated GNSS-Visual-Inertial Navigation System Augmented by 3D Gaussian Splatting [1.1] 3D Splatting (3DGS) は3次元地図再構成と視覚SLAMの領域で注目されている。
3DGSにより強化された密に統合されたプルーニング・ビジュアル・慣性ナビゲーションシステムであるGS-GVINSを提案する。
このシステムは3次元ガウス写像を大規模屋外環境における連続的な微分可能表現として利用し,構築された3次元ガウス写像によるナビゲーション性能を向上させる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:29:32 GMT)
Causal reasoning in difference graphs [1.1] これは、様々な公衆衛生応用の可能性を秘めている因果推論に対する新しいアプローチを提供する。
特に、非パラメトリックな環境での完全な因果変化と全体効果の同定、および線形的な環境での直接的な因果変化と直接的な影響に焦点を当てている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:17:39 GMT)
Quantum Error Mitigation for Sampling Algorithms [1.1] 本稿では,任意の量子誤差緩和手法を適用し,誤差低減出力分布を得るためのフレームワークを提案する。
また、この分布からサンプリングする方法を考案し、量子位相推定にQEM法を適用するための明示的なスキームを構築した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:00:59 GMT)
Learning to Stop Overthinking at Test Time [1.0] テスト時間のスケーリングは、トレーニング時間のスケーリングが限界に達した後に約束される、最も活発な研究領域の1つです。
テスト時間における各サンプルに必要な最適な計算量を決定するためのテスト時間トレーニング手法を提案する。
また,より効率的かつ堅牢な視覚推論のための新しい繰り返しアーキテクチャであるConv-LiGRUを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:17:05 GMT)
From Data to Decisions: The Transformational Power of Machine Learning in Business Recommendations [0.9] 本研究は,機械学習(ML)がレコメンデーションシステム(RS)の進化と有効性に与える影響を探求することを目的とする。
この研究は、コンテンツがパーソナライズされ、好みの変化に動的に適応する、シームレスで直感的なオンライン体験に対するユーザの期待が高まることを明らかにする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 08:19:12 GMT)
Symmetry-protected Landau-Zener-Stückelberg-Majorana interference and non-adiabatic topological transport of edge states [0.9] 本研究では,Landau-Zener-St"uckelberg-Majorana(LZSM)干渉をカイラルミラー様対称性下で研究する。
我々の研究は、非断熱的トポロジカルトランスポートによる量子制御、量子状態移動、および量子通信を研究する別の方法を明らかにする。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:46:48 GMT)
Frequency matters: Modeling irregular morphological patterns in Spanish with Transformers [0.9] 我々はスペイン語の動詞パラダイムに注目し、ある動詞は不規則なL字型パターンに従う。
変圧器モデルにおける正規パターンと不規則パターンの取得における入力周波数の役割について検討する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:15:07 GMT)
ANCHOLIK-NER: A Benchmark Dataset for Bangla Regional Named Entity Recognition [0.8] データセットは約10,443文、1リージョンあたり3,481文である。
データは2つの公開データセットから収集され、様々なオンライン新聞や記事からウェブスクレイピングによって収集された。
データセットは各リージョンごとに別々のサブセットに構成され、どちらもCSVフォーマットで利用できる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 16:59:10 GMT)
Unlocking the Potential of Generative AI through Neuro-Symbolic Architectures: Benefits and Limitations [0.7] ニューロシンボリック人工知能(NSAI)は人工知能(AI)における変革的アプローチである
NSAIは、大規模および非構造化データを扱うディープラーニングの能力と、シンボリックメソッドの構造的推論を組み合わせる。
本稿では、NSAIアーキテクチャを体系的に研究し、ニューラルネットワークとシンボリックコンポーネントの統合に対する独自のアプローチを強調した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:06:33 GMT)
Neural Operators for Stochastic Modeling of Nonlinear Structural System Response to Natural Hazards [0.7] 我々は、地震や風などの自然災害にさらされる構造系の非線形時間履歴応答の予測に、DeepONet(DeepONet)とFunier Neural operator(FNO)の2つの最先端のニューラル演算子を用いている。
どちらの場合も、訓練されたメタモデルは、対応する高忠実度モデルよりも桁違いに高速でありながら高い精度を達成する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:41:36 GMT)
Fine-tuning Language Models for Recipe Generation: A Comparative Analysis and Benchmark Study [0.7] 本研究は, 様々な非常に小さな言語モデルを微調整し, レシピ生成タスクの探索と研究を行う。
我々は、ロバストな評価指標を開発し、レシピ生成のオープンなタスクを異なる言語モデルで比較する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:50:00 GMT)
Evaluating Large language models on Understanding Korean indirect Speech acts [0.7] 本研究は,現在のLLMが発話の意図を,与えられた会話コンテキストを考慮し理解できるかどうかを評価する。
プロプライエタリなモデルは、オープンソースモデルに比べて比較的高いパフォーマンスを示した。
Claude3-Opusを除くほとんどのLLMは間接的音声行為の理解において著しく低い性能を示した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:59:19 GMT)
Deep Contrastive Learning for Feature Alignment: Insights from Housing-Household Relationship Inference [0.6] 本研究は,アメリカン・コミュニティ・サーベイ(ACS)パブリック・ユース・マイクロデータ・サンプル(PUMS)を用いて,住宅・住宅関係を推定するための深いコントラスト学習モデルを開発する。
提案手法は,2つの異なる実体間の連接関係を,対象の真理データを明示的にラベル付けせずに学習することを目的としている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:06:06 GMT)
Mind the Confidence Gap: Overconfidence, Calibration, and Distractor Effects in Large Language Models [0.6] 本稿では,モデルサイズ,緩和要因,質問タイプが信頼性アライメントに与える影響について検討する。
本稿では,過信度を計測し,複数選択形式が誤校正を悪化させるかどうかを検討するための評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 07:46:09 GMT)
Non-Markovian two-time correlation functions for optomechanical systems [0.5] 空洞光学系の2時間相関関数(TTCF)について検討した。
数値シミュレーションは,(1)マルコフ政権と非マルコフ政権の長期定常状態が異なること,(2)時間依存TTCFが環境に関する情報を明らかにすること,の2つの主要な結論を支持する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 03:50:31 GMT)
Tracing Vulnerabilities in Maven: A Study of CVE lifecycles and Dependency Networks [0.5] 本研究では,Mavenにおける3,362個のCVEのライフサイクルを分析し,脆弱性軽減のパターンを明らかにし,リスクパッケージに影響を与える要因を特定する。
キーとなる発見は、"Publish-Before-Patch"シナリオにおけるトレンドである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:28:24 GMT)
Detecting Cadastral Boundary from Satellite Images Using U-Net model [0.4] 本稿では,ResNet34バックボーンを用いたU-Netモデルの学習にトランスファーラーニングを用い,カダストラル境界を検出する。
イランの農地における2つの衛星画像の性能を「精度」「リコール」「Fスコア」を用いて評価した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:04:37 GMT)
Towards Achieving Concept Completeness for Unsupervised Textual Concept Bottleneck Models [0.4] テキスト・コンセプト・ボトルネック・モデル(英: Textual Concept Bottleneck Models, TBM)は、最終的な予測を行う前に、一連の健全な概念を予測するテキスト分類のための解釈・バイ・デザイン・モデルである。
本稿では,CT-CBM(Complete Textual Concept Bottleneck Model)を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:28:43 GMT)
WeedVision: Multi-Stage Growth and Classification of Weeds using DETR and RetinaNet for Precision Agriculture [0.0] 本研究は対象検出モデルを用いて174クラスにわたる16種の雑草を同定・分類する。
203,567枚の画像からなる頑健なデータセットを開発した。
RetinaNetは優れた性能を示し、トレーニングセットで0.907、テストセットで0.904の平均平均精度(mAP)を達成した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:49:22 GMT)
Understanding Sample Generation Strategies for Learning Heuristic Functions in Classical Planning [0.0] 本研究では,従来の計画課題において,コスト・ツー・ゴールの推定値で表されるサンプルに基づいて,従来の計画課題のよい関数を学習する問題について検討する。
我々の主なゴールは、学習機能によって誘導される欲求最優先ニューラルサーチ(GBFS)の性能に対するサンプル生成戦略の影響をよりよく理解することである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:37:39 GMT)
Towards Automatic Identification of Missing Tissues using a Geometric-Learning Correspondence Model [0.0] 患者内構造メッシュの欠損組織を同定するためのパイプラインを提案する。
これは、対応する解剖学で欠落点を特定するために幾何学的学習モデルが提案された初めての例である。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:43:53 GMT)
The foot, the fan, and the cuprate phase diagram: Fermi-volume-changing quantum phase transitions [0.0] フェルミ表面(FL)を持つフェルミ液体は、再構成された「小さなフェルミポケット」を持つスピン密度波状態(SDW)への量子相転移を持つことができる。
FL-SDW量子相転移における空間障害の影響の研究は、低温における拡張量子臨界グリフィス型位相を予測する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 21:08:52 GMT)
The Virtual Quantum Device (VQD): A tool for detailed emulation of quantum computers [0.0] 我々はQuEST量子エミュレータに基づくシステムであるVirtual Quantum Device (VQD) プラットフォームを提案する。
非専門家のユーザは、特定の量子コンピュータに詳細なエラーモデル、分岐ゲートセット、接続性をエミュレートすることができる。
我々は、トラップされたイオン、窒素空孔中心、中性原子配列、シリコン量子ドットスピン、超伝導デバイスに対応するVQDの5つのファミリーを作成し、探索する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:08:26 GMT)
The Butterfly Effect of Technology: How Various Factors accelerate or hinder the Arrival of Technological Singularity [0.0] 本稿では、技術的特異点の概念と、その到来を加速または妨げうる要因について考察する。
バタフライ効果は、複雑なシステムの小さな変化がいかに有意で予測不可能な結果をもたらすかを理解するためのフレームワークとして用いられる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:38:35 GMT)
Sound Conveyors for Stealthy Data Transmission [0.0] 本研究は,音声ファイルに情報を隠蔽するために行われた。
この実装は、txt、doc、pdfなどの文書をオーディオファイルに隠し、必要に応じて隠された文書を検索することを目的としている。
このシステムはAES暗号化をサポートし、WaveとMP3ファイルの両方を許容する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 04:02:56 GMT)
SVM/SVR Kernels as Quantum Propagators [0.0] サポートベクトルマシン(SVM)カーネルと量子グリーン関数の等価性を確立する。
多くの標準核は自然にグリーンの函数に対応し、この対応は物理作用素の同値性から生じることを示す。
一般的に使用されるカーネルが収束に繋がらない場合に、カスタムカーネルを作成するために、Polynomial Method(KPM)を使用します。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:55:43 GMT)
SURGE: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors [0.0] 大規模言語モデル(LLM)は、コード理解やコード生成など、コード関連のタスクにおいて顕著な機能を示している。
しかしながら、LLMが汎用的なサロゲートコードエグゼキュータとして機能するかどうかについても、同様に重要で未解明の疑問がある。
本研究は,LLMを代用コード実行子として使用することの実現可能性に関する実証的な知見を提供する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 15:38:19 GMT)
Revealing Symmetry-Broken Superconducting Configurations by Density Functional Theory [0.0] 現在、従来の超伝導体と非伝統的な超伝導体の超伝導に関するコヒーレントな理論は欠落している。
ここでは, 通常の導電構成の原子摂動による対称性破壊型超伝導構造の形成から超伝導が生じることを示す。
本研究は, 従来の超伝導体ではSODTはバルク材料に埋め込まれており, フォノン振動で容易に破壊できることを示す。
YBa2Cu3O7 (YBCO7)のような非伝統的な超伝導体では、SODTはバルク材料に非常に弱い結合を持つ層状ポントン構造によって保護される。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:19:13 GMT)
Rashomon perspective for measuring uncertainty in the survival predictive maintenance models [0.0] 航空機エンジンの残留実用寿命の予測は、航空宇宙や防衛といった高信頼性分野において重要な領域である。
従来の回帰モデルは検閲されたデータに苦しむため、バイアスのある予測につながる可能性がある。
一方、サバイバルモデルは、検閲されたデータを効果的に処理し、メンテナンスプロセスの予測精度を向上させる。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 13:36:56 GMT)
Randomized term grouping over physical law on digital quantum simulation [0.0] 我々は、デジタル量子コンピュータ上でハミルトン力学を計算するために、qDriftに基づくランダム化アルゴリズムを導入する。
物理の保存法則は任意の量子状態の進化の過程で従うからである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 22:13:50 GMT)
Quantum signatures of chaos in noisy tomography [0.0] 連続計測量子トモグラフィーを量子カオス研究のパラダイムとして用いている。
本研究では、乱れと乱れのないシステム力学の下での2つの演算子間の時間外順序付き相関器(OTOC)であるエラーのスクランブルを捉える量を定義する。
以上の結果から,ロシミットエコーと「エラーOTOC」が捉えた誤りのスクランブルの基本的な関係を示すだけでなく,量子情報処理においてこのようなリンクが動作に影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:31:01 GMT)
Prosthetics of the Indian State: The e-Shram Portal for Unorganized Workers in India [0.0] 余剰理論を用いて、労働者に対してこのデータベースの運用を批判する。
本研究は,インドの非公式セクター経済における非組織労働者のためのデジタルポータル/データベースであるe-Shramについて検討する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:27:29 GMT)
Prompt Inject Detection with Generative Explanation as an Investigative Tool [0.0] 大規模言語モデル(LLM)は、敵のプロンプトベースのインジェクションに対して脆弱である。
本研究では, LLMのテキスト生成機能を用いて, インジェクションの検出を行う。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 06:16:00 GMT)
ProbTalk3D: Non-Deterministic Emotion Controllable Speech-Driven 3D Facial Animation Synthesis Using VQ-VAE [0.0] 感情と非決定主義は多様で感情に富んだ顔のアニメーションを生成するために不可欠である、と我々は主張する。
本稿では,感情制御可能な音声駆動3次元顔画像合成のための非決定論的ニューラルネットワーク手法ProbTalk3Dを提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:23:08 GMT)
Noumenal Labs White Paper: How To Build A Brain [0.0] このホワイトペーパーでは、Noumenal Labsの取り組みをガイドする人工知能やマシンインテリジェンスの設計原則について説明している。
この分野での研究と開発の最終目標は、私たちの世界に対する理解を高め、私たちを置き換えることなく、それで行動する能力を高めるマシンインテリジェンスを設計することである。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 18:15:37 GMT)
Multiscale autonomous forecasting of plasma systems' dynamics using neural networks [0.0] 本稿では,階層型マルチスケールニューラルネットワークアーキテクチャの自律プラズマ予測への応用を実証する。
ファインスケールネットワークは高速進化機能を正確に解決し、粗いスケールネットワークはより広い時間的コンテキストを提供する。
本研究により, 従来の単スケールネットワークよりも高い性能を示した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 17:02:54 GMT)
Machine Learning-Based Intrusion Detection and Prevention System for IIoT Smart Metering Networks: Challenges and Solutions [0.0] 本稿では、IIoTベースのスマート計測ネットワークの安全性に関する課題について考察する。
エッジデバイスを保護するための機械学習ベースの侵入検知システム(IDPS)を提案する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 14:08:59 GMT)
Learning the Exact Time Integration Algorithm for Initial Value Problems by Randomized Neural Networks [0.0] 本稿では、初期値問題(IVP)に対する正確な時間積分アルゴリズムを学習するために、極端学習機械(ELM)型ランダム化ニューラルネットワーク(NN)を利用する手法を提案する。
学習したNNアルゴリズムは、ニューラルネットワークの自由度が増大するにつれて、タイムマーチングエラーが指数関数的に減少し、長期間のシミュレーションで非常に正確な解を生成する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:53:52 GMT)
Imaging current flow and injection in scalable graphene devices through NV-magnetometry [0.0] 我々は高分解能窒素空洞(NV)磁力計を用いて、金で接触した単層グラフェンデバイスにおける電荷の流れを可視化する。
以上の結果から,スケーラブルな2次元材料を特徴付けるための重要なツールとして,高分解能NV磁気計測が確立された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 10:52:48 GMT)
Graceful forgetting: Memory as a process [0.0] メモリの論理的理論が提案され、バウンドストレージ空間内での入力にどのように対応できるかを説明する。
この理論は、記憶に関する広範な知識を理解し、機能的および機械的用語における記憶の理解に近づけるための助けとなることを意図している。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:46:34 GMT)
Exploring Contextual Flux in Large Language Models: A Novel Approach to Self-Modulating Semantic Networks [0.0] 自己変調機構は言語モデル内で動的適応機能を導入する。
コンテキスト適応戦略は、拡張シーケンスにわたるトークン埋め込み軌跡に影響を与える。
自己規制は、生成の柔軟性を維持しながら、テキスト生成の一貫性を高める。
適応的な埋め込み更新はコヒーレンスの特定の側面を改善するが、その影響はモデルのキャパシティと入力の複雑さに及ばない。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 01:08:19 GMT)
Empirical evaluation of LLMs in predicting fixes of Configuration bugs in Smart Home System [0.0] 本研究では,スマートホームシステムにおける構成バグの修正予測におけるLarge Language Models (LLMs)の有効性を評価する。
この研究は、GPT-4、GPT-4o(GPT-4 Turbo)、Claude 3.5 Sonnetの3つの著名なLCMを分析した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:11:36 GMT)
Data Ecofeminism [0.0] ジェネレーティブ・人工知能(GenAI)は環境に大きな影響を与えている。
この論文は、GenAIイノベーションレースの緊急再評価を求めている。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 11:47:50 GMT)
Convergence proofs and strong error bounds for forward-backward stochastic differential equations using neural network simulations [0.0] 我々は、これらの解と偏微分方程式の解との接続を強調する前方微分方程式を導入する。
本稿では,ニューラルネットワークを用いた高次元偏微分方程式の近似解法と,マルチレベルモンテカルロを用いた微分方程式の近似解について概説する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 09:45:32 GMT)
Continuous-variable quantum key distribution with noisy squeezed states [0.0] 連続可変(CV)量子鍵分布(QKD)プロトコルのセキュリティと性能におけるノイズキャンザリングの役割について考察する。
圧縮された状態のノイズは、必然的にソースの光学的損失から生じるものであり、盗聴器による潜在的搾取に関する懸念を引き起こす。
我々は、盗聴者に対してより多くの情報を提供する可能性があるため、アンチ・スチーズ・ノイズは一般的にプロトコルのセキュリティにとって有害であることを示す。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:38:18 GMT)
Comment on Consequences of the single-pair measurement of the Bell parameter [0.0] Genovese と Piacentini は最近の実験で、ベルパラメータは1対の光子で測定されたと主張している。
Virziらの実験で測定されたパラメータは、多くのループホールフリーテストで議論され推定されたベルパラメータSではない。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 20:28:49 GMT)
Capturing magic angles in twisted bilayer graphene from information theory markers [0.0] 有効なフェルミ速度が消える魔法の角度付近で、ツイスト角$theta$に対して高い感度を示す。
我々は、このゼロモードの量子臨界度を魔法のツイスト角度で捉えるために、情報理論のマーカー、例えば、フィデリティ・サセプティビリティや絡み合いエントロピーを用いています。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 19:40:48 GMT)
Analysis, forecasting and system identification of a floating offshore wind turbine using dynamic mode decomposition [0.0] 本稿では, 動的モード分解(DMD)を応用したヘキサフロート浮揚風力タービンの動特性の, データ駆動式フリーモデリングについて述べる。
そこで,DMD は,システム同定と秩序の低減のために,システム状態の即時的知識から短期的な予測を行うために,i) 動的システムから知識を抽出するために,i) モーダル解析(ii) を用いている。
結果は、短期予測とシステム同定のためのアプローチの能力を示し、リアルタイム連続学習デジタルツインニングの可能性を示し、データ駆動型縮小順序モデリングを代理する。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 23:33:55 GMT)
An Enhancement of CNN Algorithm for Rice Leaf Disease Image Classification in Mobile Applications [0.0] 本研究では,従来コンボリューショナルニューラルネットワーク(CNN)モデルに頼っていたイネ葉病画像分類アルゴリズムの強化に焦点を当てた。
我々は、CNNのローカル特徴抽出とVision Transformersのグローバルコンテキスト学習を統合する軽量モデルであるImageNet-1k weightsを用いて、MobileViTV2_050で転送学習を採用した。
このアプローチにより、MobileViTV2_050-Aの分類精度が15.66%向上し、ベースラインデータセットでトレーニングされた最初の拡張モデルが93.14%に達した。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 12:20:40 GMT)
A recurrent vision transformer shows signatures of primate visual attention [0.0] 本稿では、自己アテンションとリカレントメモリを統合したリカレントビジョントランス(Recurrent Vision Transformer, Recurrent ViT)を提案する。
本モデルでは,クエーの精度向上やクエーの応答の高速化など,注意のサインのような霊長類を呈する。
これらの結果から、反復的なフィードバックを自己注意に取り入れることで、霊長類の視覚的注意を捉える重要な側面を捉えることができることが示唆された。
論文参考訳(メタデータ) (Sun, 16 Feb 2025 02:22:27 GMT)