Fugu-MT: arxivの論文翻訳(概要)

Automated Black-box Prompt Engineering for Personalized Text-to-Image Generation [150.0]
PRISMは人間の解釈可能なプロンプトと転送可能なプロンプトを自動的に識別するアルゴリズムである。 T2Iモデルへのブラックボックスアクセスのみを前提として、望まれる概念を効果的に生成できる。本実験は,オブジェクト,スタイル,画像の正確なプロンプト生成におけるPRISMの有効性と有効性を示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:09:52 GMT)
Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent [102.3]
マルチモーダル大規模言語モデル(MLLM)に固有の「ハロシン化」問題を緩和する上で,mRAG(Multimodal Retrieval Augmented Generation)が重要な役割を果たしている。マルチモーダル検索のための自己適応型計画エージェントOmniSearchを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:48:49 GMT)
Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents [101.2]
GovSimは、大規模言語モデル(LLM)における戦略的相互作用と協調的意思決定を研究するために設計された生成シミュレーションプラットフォームである。最強のLSMエージェントを除く全てのエージェントは、GovSimの持続的均衡を達成することができず、生存率は54%以下である。道徳的思考の理論である「大学化」に基づく推論を活用するエージェントは、持続可能性を大幅に向上できることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:21:20 GMT)
Language Models Learn to Mislead Humans via RLHF [101.0]
言語モデル(LM)は、特にタスクが複雑である場合に、人間にとって検出が難しいエラーを生成する。我々はこの現象を標準のRLHFパイプラインで研究し、モデル開発者が意図していないことから「U-SOPHISTRY」と呼ぶ。我々の研究は、RLHFの重要な障害モードを強調し、人間の調整を支援するためのさらなる研究を求めている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:06:53 GMT)
MME-Survey: A Comprehensive Survey on Evaluation of Multimodal LLMs [97.9]
MLLM(Multimodal Large Language Models)は、産業と学術の両方から注目を集めている。開発プロセスでは、モデルの改善に関する直感的なフィードバックとガイダンスを提供するため、評価が重要である。この研究は、研究者に異なるニーズに応じてMLLMを効果的に評価する方法を簡単に把握し、より良い評価方法を促すことを目的としている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:24:31 GMT)
SILMM: Self-Improving Large Multimodal Models for Compositional Text-to-Image Generation [92.7]
大規模マルチモーダルモデル(LMM)は、マルチモーダル理解と生成において印象的な能力を示した。マルチステップ生成のためのレイアウト計画や、人間のフィードバックやAIフィードバックからの学習など、既存のアプローチは、迅速なエンジニアリングに大きく依存している。モデルに依存しない反復型自己フィードバックフレームワーク(SILMM)を導入し,LMMが有用でスケーラブルな自己改善を実現し,テキスト画像のアライメントを最適化する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:28:08 GMT)
Anytime Acceleration of Gradient Descent [92.0]
エム収束保証による勾配勾配勾配の段階的加速度について検討する。滑らかな(強くない)凸最適化のために、任意の停止時間に対して、勾配降下が$O(T-1.119)$の収束保証を達成できる段階的なスケジュールを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:22:26 GMT)
Detecting Discrepancies Between AI-Generated and Natural Images Using Uncertainty [91.6]
本稿では,誤用と関連するリスクを軽減するために,予測不確実性を利用してAI生成画像を検出する新しい手法を提案する。この動機は、自然画像とAI生成画像の分布差に関する基本的な仮定から生じる。本稿では,AI生成画像の検出スコアとして,大規模事前学習モデルを用いて不確実性を計算することを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:32:25 GMT)
Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [88.1]
展開中のシナリオにオンザフライで適応する問題について検討する。 ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。 ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:52:59 GMT)
Does RLHF Scale? Exploring the Impacts From Data, Model, and Method [83.5]
本研究では,大規模言語モデルにおける人間のフィードバックからの強化学習のスケーリング特性について検討する。 RLHFフレームワークの主要なコンポーネント、モデルサイズ、データ構成、推論予算、およびそれらのパフォーマンスへの影響を分析します。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:19:48 GMT)
DnA-Eval: Enhancing Large Language Model Evaluation through Decomposition and Aggregation [75.8]
大規模言語モデル(LLM)はスケーラブルで経済的な評価指標である。これらの評価者がどの程度信頼できるかという問題は、重要な研究課題として浮上している。本稿では,デコンプリートとアグリゲートを提案し,その評価プロセスを教育実践に基づいて異なる段階に分解する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:41:57 GMT)
Data Reconstruction: When You See It and When You Don't [75.0]
我々は,2つの補足的な疑問に対処することで,再建攻撃の概念を「サンドウィッチ」することを目指している。我々は,再建攻撃に対するセキュリティ定義を定式化するために,新たな定義パラダイムであるナルシッソス・レジリエンスを導入する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:32:15 GMT)
Language Model as Visual Explainer [72.9]
本稿では,木構造言語学的説明を用いた視覚モデル解釈のための体系的アプローチを提案する。提案手法は,属性を付与した木の形で人間に理解可能な説明を提供する。提案手法の有効性を確認するため,新しいベンチマークを導入し,厳密な評価を行う。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:46:23 GMT)
FOF-X: Towards Real-time Detailed Human Reconstruction from a Single Image [68.8]
本稿では,1枚の画像から詳細な人物形状をリアルタイムに再現するFOF-Xを提案する。 FOF-Xはテクスチャや照明による性能劣化を避ける。 FOFとメッシュ表現間の変換アルゴリズムをラプラシアン制約とオートマトンベース不連続整合器で拡張する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:46:29 GMT)
Discriminative Fine-tuning of LVLMs [67.1]
CLIPのような対照的に訓練された視覚言語モデル(VLM)は、識別的視覚言語表現学習の事実上のアプローチとなっている。我々は,LVLMの識別的微調整のための新たな訓練手法である「両世界のベスト」を組み合わせることを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:58:42 GMT)
[CLS] Token Tells Everything Needed for Training-free Efficient MLLMs [66.5]
MLLM(Multi- Language Large Language Models)は、最近、広範囲の視覚タスクにおいて強力なパフォーマンスを示した。しかし、その効率的なデプロイメントは、高い計算コストとメモリ要求のため、依然として大きな課題である。本稿では,VTC圧縮という,列車不要の視覚圧縮のための簡易かつ効果的な手法を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:29:39 GMT)
GL-Fusion: Rethinking the Combination of Graph Neural Network and Large Language model [63.8]
グラフニューラルネットワーク(GNN)とLarge Language Models(LLM)を深く統合した新しいアーキテクチャを導入する。本稿では,(1)GNNのメッセージパッシング機能を直接LLMのトランスフォーマー層に組み込む構造対応トランスフォーマー,(2)グラフノードとエッジから圧縮されていない全テキストを処理するグラフテキストクロスアテンション,(3)GNN-LLMツインプレクタ,(3)GNN-LLMツインプレクタ,3)GNNのスケーラブルなワンパス予測とともに,LLMの柔軟な自己回帰生成を実現する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:49:58 GMT)
Language-Guided Image Tokenization for Generation [63.1]
TexTokは、言語を活用して高度なセマンティクスを提供する、シンプルだが効果的なトークン化フレームワークである。記述的なテキストキャプションにトークン化プロセスを条件付けすることで、TexTokはトークン化プロセスが詳細な視覚的詳細を潜在トークンにエンコードすることに集中できるようにする。バニラ DiT ジェネレータを備えた TexTok は、ImageNet-256 と -512 でそれぞれ 1.46 と 1.62 の最先端 FID スコアを達成している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 03:18:17 GMT)
Accelerating Multimodal Large Language Models by Searching Optimal Vision Token Reduction [62.8]
MLLM(Multimodal Large Language Models)は、入力イメージを視覚トークンとしてエンコードし、それらを言語バックボーンに入力する。画像解像度が大きくなるにつれて、視覚トークンの数は2次的に増加し、膨大な計算コストがかかる。本稿では,各層を浅層から深層まで保持する最小限の視覚トークンを求めるために,欲求探索アルゴリズム(G-Search)を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:41:32 GMT)
On Socially Fair Low-Rank Approximation and Column Subset Selection [62.4]
低ランク近似と列サブセット選択は、豊富な機械学習アプリケーションに適用される2つの基本的および関連する問題である。驚くべきことに、一定要素の近似であっても、特定の標準複雑性仮説の下では指数時間を必要とすることが示される。一定の数の群と一定要素の精度で、na"ive $ntextpoly(k)$ではなく2textpoly(k)$ timeで実行されるような、公平な低ランク近似のアルゴリズムを与える。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:34:16 GMT)
Learning from Neighbors: Category Extrapolation for Long-Tail Learning [62.3]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:09:08 GMT)
BiDM: Pushing the Limit of Quantization for Diffusion Models [60.0]
本稿では,DMの重みとアクティベーションを完全にバイナライズし,量子化を1ビット限界まで押し上げる手法であるBiDMを提案する。 DMを完全にバイナライズする最初の取り組みとして、LSUN-Bedrooms 256$times$256のLDM-4モデルのW1A1 BiDMは22.74という驚くべきFIDを達成した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:45:21 GMT)
NNsight and NDIF: Democratizing Access to Open-Weight Foundation Model Internals [58.8]
NNsightとNDIFは、非常に大きなニューラルネットワークの科学的研究を可能にするために、タンデムで機能する技術である。 NNsightは、遅延リモート実行を導入するためにPyTorchを拡張したオープンソースのシステムである。 NDIFは、NNsightリクエストを実行するスケーラブルな推論サービスで、GPUリソースと事前トレーニングされたモデルを共有することができる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:16:12 GMT)
COVE: Unleashing the Diffusion Feature Correspondence for Consistent Video Editing [57.8]
ビデオ編集は新たな課題であり、現在のほとんどの手法では、ソースビデオを編集するために、事前訓練されたテキスト・トゥ・イメージ(T2I)拡散モデルを採用している。我々は,高品質で一貫したビデオ編集を実現するために,COVE(Cor correspondingence-guided Video Editing)を提案する。 COVEは、追加のトレーニングや最適化を必要とせずに、事前訓練されたT2I拡散モデルにシームレスに統合することができる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:17:43 GMT)
Compositional Representation of Polymorphic Crystalline Materials [56.8]
PCRLは,構成の確率論的モデリングを用いて,利用可能な構造情報から多型を抽出する手法である。 16のデータセットに対する広範囲な評価は、構成表現の学習におけるPCRLの有効性を示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:35:38 GMT)
Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models [55.3]
MLLMのためのMMGiCアノテーション(Multimodal Multi-Grained Concept Annotation)を特徴とする新しいデータセットを提案する。分析の結果,構造化テンプレートと汎用MLLMフレームワークの下で,多義的な概念アノテーションが相互に統合され,補完されることが明らかとなった。さらに,12のマルチモーダル理解および生成ベンチマークにおいて,MMGiCと画像キャプチャデータとの公正な比較と効果的な協調関係を検証し,我々の仮説を検証した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:45:44 GMT)
MotionStone: Decoupled Motion Intensity Modulation with Diffusion Transformer for Image-to-Video Generation [55.2]
静止画像に画像間(I2V)生成を条件付け、動き強度を付加的な制御信号として最近強化した。これらの動き認識モデルは多様な動きパターンを生成するために魅力的だが、そのようなモデルを野生の大規模ビデオでトレーニングするための信頼性の高い動き推定器は存在しない。本稿では,映像中の物体とカメラのデカップリング運動強度を計測できる新しい動き推定器の課題に対処する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:12:37 GMT)
MaskBit: Embedding-free Image Generation via Bit Tokens [54.8]
我々は,VQGANの実証的,体系的な検討を行い,近代化されたVQGANを導いた。第2のコントリビューションは、ビットトークンを用いた埋め込み不要な画像生成が、ImageNet 256x256ベンチマークで1.52の最先端のFIDを達成することを示した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:55:36 GMT)
TableTime: Reformulating Time Series Classification as Zero-Shot Table Understanding via Large Language Models [54.4]
大規模言語モデル (LLM) は多変量時系列分類において有効であることを示した。 LLM は LLM の潜在空間内の時系列の埋め込みを直接コードし、LLM の意味空間と一致させる。 MTSCを表理解タスクとして再編成するテーブルタイムを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:11:58 GMT)
Latent-Reframe: Enabling Camera Control for Video Diffusion Model without Training [51.9]
我々は、微調整なしで事前訓練されたビデオ拡散モデルでカメラ制御が可能なLatent-Reframeを紹介した。 Latent-Reframeはサンプリング段階で動作し、オリジナルのモデル分布を維持しながら効率を維持する。当社のアプローチでは,ビデオフレームの潜在コードを再設計し,タイムアウェアな点雲を通して入力カメラ軌跡と整合する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:59:54 GMT)
Track4Gen: Teaching Video Diffusion Models to Track Points Improves Video Generation [51.7]
Track4Genは、ビデオ拡散損失とフレーム間のポイントトラッキングを組み合わせた空間的に認識されたビデオジェネレータである。 Track4Genは、安定したビデオ拡散をバックボーンとして使用し、ビデオ生成とポイントトラッキングを統合することが可能であることを実証している。評価の結果,Track4Genは外見のドリフトを効果的に低減し,時間的安定性と視覚的コヒーレントな映像生成を実現することがわかった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:21:00 GMT)
Post-hoc Probabilistic Vision-Language Models [51.1]
視覚言語モデル(VLM)は、分類、検索、生成タスクにおいて顕著な成功を収めている。追加トレーニングを必要としないVLMにおけるポストホック不確実性評価を提案する。この結果から,大規模モデルの安全性クリティカルな応用が期待できることがわかった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:16:13 GMT)
DREAM: Domain-agnostic Reverse Engineering Attributes of Black-box Model [50.9]
対象モデルのトレーニングデータセットの可用性を必要とせずに,ブラックボックスリバースエンジニアリングの新たな問題を提案する。対象のブラックボックスモデルの属性を未知のトレーニングデータで推測するために,ドメインに依存しないメタモデルを学ぶ。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:37:05 GMT)
Understanding the differences in Foundation Models: Attention, State Space Models, and Recurrent Neural Networks [50.3]
本稿では,これらすべてのアーキテクチャの共通表現に関する原則的な調査を可能にする動的システムフレームワーク(DSF)について紹介する。ソフトマックスアテンションと他のモデルクラスとの原理的比較を行い、ソフトマックスアテンションを近似できる理論条件について議論する。このことは、DSFが将来のより効率的でスケーラブルな基盤モデルの体系的な開発を導く可能性を示している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:25:05 GMT)
Tiny Object Detection with Single Point Supervision [48.9]
本稿では,航空画像におけるロバストな微小物体検出のためのポイント・インスツルメンテーション法を提案する。点アノテーションにおけるスケールの曖昧さと位置変化からラベルノイズを扱うために、ポイント・インストラクターは教師-学生アーキテクチャを採用している。この枠組みでは、画像領域のランダムマスキングにより回帰学習が促進され、教師はノイズの多い点アノテーションを粗い擬似ボックスに変換することができる。第2段階では、これらの粗い擬似ボックスは動的多重インスタンス学習を用いて洗練され、最も信頼できるインスタンスを適応的に選択する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:13:17 GMT)
TeD-Q: a tensor network enhanced distributed hybrid quantum machine learning framework [48.5]
TeD-Qは、量子機械学習のためのオープンソースのソフトウェアフレームワークである。古典的な機械学習ライブラリと量子シミュレータをシームレスに統合する。量子回路とトレーニングの進捗をリアルタイムで視覚化できるグラフィカルモードを提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:45:21 GMT)
Cooperative SQL Generation for Segmented Databases By Using Multi-functional LLM Agents [48.3]
多機能エージェント(CSMA)に基づく協調sql生成フレームワークを提案する。人間のチームワークにおけるコラボレーションに触発されて、CSMAは3つのステージから構成される。スパイダーとバードのベックマークの実験では、CSMAは最先端技術に匹敵する高いパフォーマンスを達成している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:16:19 GMT)
VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide [48.2]
VideoGuideは、事前訓練されたテキスト・ツー・ビデオ(T2V)モデルの時間的一貫性を高める新しいフレームワークである。ガイドモデルの復調標本をサンプリングモデルの復調過程に補間することにより、時間的品質を向上させる。提案手法は時間的一貫性と画像の忠実度を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:01:25 GMT)
Dual UAV Cluster-Assisted Maritime Physical Layer Secure Communications via Collaborative Beamforming [47.2]
無人航空機(UAV)は、海上無線通信を支援する中継プラットフォームとして使用できる。共同ビームフォーミング(CB)は、遠隔での海上通信のためにUAV中継を支援するために、信号強度と範囲を増強することができる。本稿では,海上無線通信における物理層セキュリティを実現するために,CBを経由した二重UAVクラスタアシストシステムを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:11:02 GMT)
Time Series Forecasting with LLMs: Understanding and Enhancing Model Capabilities [46.0]
大規模言語モデル(LLM)は多くの分野に適用され、近年急速に発展してきた。近年の研究では、大規模な言語モデルを、さらなる微調整を行なわずに、アンフェロショット時系列推論として扱っている。本研究は,LLMが周期性に欠けるデータセットにおいて,明確なパターンや傾向を持つ時系列予測において良好に機能することを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:51:48 GMT)
Estimating the Hallucination Rate of Generative AI [44.9]
本稿では,生成AIを用いたテキスト内学習における幻覚率の推定手法を提案する。 ICLでは、条件生成モデル(CGM)にデータセットと予測質問を入力し、応答を生成する。我々は、ICL問題に対処し、CGMが幻覚を発生させる確率を推定する新しい方法を開発した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:50:49 GMT)
Freeze-Omni: A Smart and Low Latency Speech-to-speech Dialogue Model with Frozen LLM [44.6]
本稿では, Freeze-Omni という, 音声文によるマルチモーダルLLMアーキテクチャを提案する。我々の主な貢献は、音声入力と出力のモダリティがテキストLLMに容易に接続できることである。さらに,マルチタスク学習による二重対話能力を実現する手法も設計した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:41:56 GMT)
SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers [43.2]
SPIQAは、科学研究論文の文脈内で複雑な図形や表を解釈するために設計されたデータセットである。データセット作成には自動および手動のキュレーションを使用します。 SPIQAは270Kの質問をトレーニング、検証、3つの異なる評価分割に分割する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:14:12 GMT)
DapperFL: Domain Adaptive Federated Learning with Model Fusion Pruning for Edge Devices [43.1]
エッジコンピューティング環境では、フェデレートラーニング(FL)が機械学習のパラダイムとして注目されている。複数のドメインにわたるモデル性能を向上させるために,異種FLフレームワークDapperFLを提案する。異種クライアントを持つ現実世界のFLプラットフォーム上でDapperFLを実装した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:50:04 GMT)
Contextual Bilevel Reinforcement Learning for Incentive Alignment [42.2]
両レベルの意思決定モデルであるCB-RL(Contextual Bilevel Reinforcement Learning)を導入する。 CB-RL は Stackelberg Game と見ることができ、リーダーとリーダーのコントロールを超えたランダムなコンテキストが同時に多くの MDP の設定を決定する。このフレームワークは、従来の二段階最適化を超えて、報酬形成、契約理論、メカニズム設計といった様々な分野に関連性を見出す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:04:50 GMT)
Hyperspectral Image Spectral-Spatial Feature Extraction via Tensor Principal Component Analysis [41.7]
本稿では,ハイパースペクトル画像分類におけるスペクトル空間特徴抽出の課題について述べる。提案手法では、円形の畳み込みをテンソル構造に組み込んで、スペクトル情報と空間情報の両方を効果的に捕捉・統合する。この枠組みに基づいて、従来の主成分分析(PCA)技術は、主成分分析(TPCA)と呼ばれるテンソルベースに拡張される。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:52:09 GMT)
ToMBench: Benchmarking Theory of Mind in Large Language Models [41.6]
ToMは、自分自身や他人に精神状態を知覚し、解釈する認知能力である。既存のToM評価は、制約されたスコープ、主観的判断、意図しない汚染といった課題によって妨げられる。 ToMBenchには3つの重要な特徴がある: 社会的認知における8つのタスクと31の能力を含む体系的評価フレームワーク、自動的かつ偏りのない評価をサポートする複数選択質問フォーマット、データ漏洩を厳密に回避するためのビルト・トゥ・スクラッチバイリンガルインベントリ。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:20:51 GMT)
FluentEditor2: Text-based Speech Editing by Modeling Multi-Scale Acoustic and Prosody Consistency [41.0]
テキストベースの音声編集(TSE)により、ユーザーは元の録音を変更することなく、対応するテキストを直接修正して音声を編集できる。現在のTSE技術は、学習中に生成された音声と編集領域における参照の相違を最小限に抑えることに焦点を当てていることが多い。従来のtextitFluentEditor モデルである textittextbfFluentEditor2 をベースとした新しい流速音声編集手法を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:50:03 GMT)
On the Crucial Role of Initialization for Matrix Factorization [40.8]
この研究は古典的低ランク行列分解問題を再考し、整合率の形成における初期化の重要な役割を明らかにする。我々はNystrom NyGDを対称非対称行列分解タスクに導入し、ローランクアダプタ(LoRA)に拡張する。提案手法は,大規模言語および拡散モデルにおいて,1Bから7Bパラメータに至るまで,様々なダウンストリームおよびモデルスケールで優れた性能を示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:55:14 GMT)
Multi-View Incongruity Learning for Multimodal Sarcasm Detection [40.1]
マルチモーダルサルカズム検出(MSD)は下流の様々なタスクに不可欠である。既存のMSD法は、素早い相関に依存する傾向がある。本稿では,マルチモーダルサルカズム検出のためのコントラスト学習(MICL)によるマルチモーダルイングルリティの統合手法を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:04:49 GMT)
Edge-free but Structure-aware: Prototype-Guided Knowledge Distillation from GNNs to MLPs [39.8]
グラフエッジ(エッジフリー設定)を必要としないが構造認識を学習するプロトタイプガイド型知識蒸留(PGKD)を提案する。具体的には、まず、グラフニューラルネットワーク(GNN)におけるグラフ構造の影響を分析するために、クラスプロトタイプを使用します。次に、そのような情報をGNNからベンチマークに抽出するために2つの損失を設計する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:09:05 GMT)
Generation of Tunable Three-Photon Entanglement in Cubic Nonlinear Coupled Waveguides [39.7]
三次元非線形結合導波路における空間的絡み合いを伴う3光子状態の生成について理論的に検討する。この研究は、単純なチップ上の3光子空間の絡み合いの統合源を示し、高度な多光子量子アプリケーションにさらなる再構成性を提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:13:24 GMT)
Fully Distributed Online Training of Graph Neural Networks in Networked Systems [38.4]
グラフニューラルネットワーク(GNN)は、大規模ネットワークシステムにおいて、スケーラブルで分散化された人工知能を開発するための強力なツールである。我々は,大規模ネットワークシステムに適用されたGNNのための通信効率,完全分散オンライントレーニング手法を開発した。我々は、教師なし、教師なし、強化学習パラダイムの下でGNNを訓練する上で、我々のアプローチの有効性を実証する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:41:22 GMT)
Fully Open Source Moxin-7B Technical Report [38.1]
大きな言語モデル(LLM)は、その人気と能力の急激な上昇によって、大きな変革を遂げている。この問題を緩和するために、モデルオープンネスフレームワーク(MOF)に従って開発された完全にオープンソースなLLMであるMoxin 7Bを紹介します。本モデルは,事前学習コードと構成の包括的リリースを通じて,オープンサイエンスのMOF分類レベルを最大化する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:01:46 GMT)
Lightweight Spatial Embedding for Vision-based 3D Occupancy Prediction [37.8]
LightOccは、軽量空間埋め込みを利用する革新的な3D占有予測フレームワークである。 LightOccはベースラインの予測精度を大幅に向上させ、Occ3D-nuScenesベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:49:35 GMT)
CardOOD: Robust Query-driven Cardinality Estimation under Out-of-Distribution [37.0]
CardOODは、堅牢なクエリ駆動の濃度推定器を構築するために設計された一般的な学習フレームワークである。古典的移動/ロマンス学習手法を拡張して,クエリ駆動の濃度推定器を訓練する。また,濃度推定の特性を利用した新しい学習アルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:11:11 GMT)
A Self-Learning Multimodal Approach for Fake News Detection [36.0]
偽ニュース分類のための自己学習型マルチモーダルモデルを提案する。このモデルは、ラベル付きデータを必要としない機能抽出のための堅牢な手法であるコントラスト学習を利用する。公開データセットを用いた実験結果から,提案モデルがいくつかの最先端の分類手法より優れていることが示された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:41:44 GMT)
Unsupervised Multi-Parameter Inverse Solving for Reducing Ring Artifacts in 3D X-Ray CBCT [35.7]
リングアーティファクトは、X線検出器の非理想的応答により、3DコーンビームCT(CBCT)で一般的である。現在の最先端(SOTA)リングアーティファクトリダクション(RAR)アルゴリズムは、教師あり学習のための広範なペアCTサンプルに依存している。マルチパラメータ逆問題として3次元CBCT RARを定式化した教師なしの textbfRiner を導入する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:22:58 GMT)
Chimera: Improving Generalist Model with Domain-Specific Experts [35.7]
ドメイン特化の専門家による既存のLMMの能力を高めるために,スケーラブルで低コストなマルチモーダルパイプラインを導入する。具体的には、プログレッシブ・トレーニング・ストラテジーを設計し、専門家モデルからの機能をジェネラリストLMMの入力に統合する。結果として、チャート、テーブル、数学、ドキュメントドメインにまたがる多用途モデルが出来上がります。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:10:42 GMT)
CPRM: A LLM-based Continual Pre-training Framework for Relevance Modeling in Commercial Search [34.1]
CPRMは、大規模言語モデル(LLM)の継続的な事前訓練のために設計されたフレームワークである本フレームワークは3つのモジュールから構成される: 1) クエリとマルチフィールドアイテムを併用してドメイン知識を強化する,2) コンテキスト内事前学習を適用する,3) 関連するドメイン知識とバックグラウンド情報を生成する,という3つのモジュール。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:07:00 GMT)
Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting [33.0]
3D Gaussian Splatting(3DGS)は、高品質な3D再構成によるリアルタイムレンダリングが可能な有望な技術として登場した。その可能性にもかかわらず、3DGSは針状アーティファクト、準最適ジオメトリー、不正確な正常といった課題に遭遇する。正規化として有効ランクを導入し、ガウスの構造を制約する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:05:26 GMT)
Self-Guidance: Boosting Flow and Diffusion Generation on Their Own [32.9]
自己ガイド(Self-Guidance, SG)は、特定のトレーニングやある種のニューラルネットワークアーキテクチャを必要としない、強力な拡散ガイダンスである。安定拡散3.5やFLUXのような最先端拡散モデルでは、SGはFIDや人選スコアといった画像生成性能を大幅に向上させる。 SGは、手、顔、腕などの高品質な人体の生成に驚くほど良い効果があることがわかった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:32:27 GMT)
TopoCellGen: Generating Histopathology Cell Topology with a Diffusion Model [32.7]
本研究では,トポロジ制約を拡散モデルに統合し,現実的で文脈的に正確なセルトポロジの生成を改善する手法を提案する。本手法は,セルの分布と相互作用のシミュレーションを改良し,セル検出や分類などの下流タスクにおける結果の精度と解釈可能性を高める。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:02:22 GMT)
Memory-augmented Transformers can implement Linear First-Order Optimization Methods [32.3]
メモリ拡張型トランスフォーマー(Memformer)は線形一階最適化手法を実装可能であることを示す。我々は、Memformersがより高度な最適化アルゴリズムを学習できるという理論的および実証的な証拠を提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:56:33 GMT)
FinEval: A Chinese Financial Domain Knowledge Evaluation Benchmark for Large Language Models [32.0]
本稿では,LLMの金融分野の知識と実践能力を評価するためのベンチマークであるFinEvalについて述べる。データセットには、金融学術知識、金融産業知識、金融セキュリティ知識、金融エージェントの4つの重要な領域に分類される8,351の質問が含まれている。以上の結果から、Claude 3.5-Sonnetは、ゼロショット設定下において、すべての金融ドメインカテゴリで72.9の最大重み付き平均スコアを達成している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:34:31 GMT)
FlexDiT: Dynamic Token Density Control for Diffusion Transformer [31.8]
Diffusion Transformer (DiT)は、優れた生成性能を提供するが、計算上の要求に直面する。我々は,空間次元と時間次元の両方でトークン密度を動的に適用するFlexDiTを提案する。本実験はFlexDiTの有効性を実証し,FLOPの55%削減と推論速度の175%改善を実現した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:59:16 GMT)
Open-Source Periorbital Segmentation Dataset for Ophthalmic Applications [30.6]
深層学習を用いた眼窩周囲のセグメンテーションと距離予測は、疾患状態の客観的定量化を可能にする。現在、深層学習モデルのトレーニングを目的としたセグメンテーションデータセットの報告は、目の周りの領域でサブミリの精度で行われていない。本稿では,このデータセットをイントラグレータ内信頼性試験およびイントラグレータ間信頼性試験により検証し,軌道周辺セグメンテーションネットワークのトレーニングにおけるデータの有用性を示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:16:02 GMT)
Doppelgangers++: Improved Visual Disambiguation with Geometric 3D Features [30.2]
ドッペルガンガー検出の精度を高め、3次元再構成精度を向上させる手法であるドッペルガンガース++を提案する。私たちのコントリビューションには、ランドマークベースのデータセットを超えて拡大するために、日々のシーンからジオタグ付きイメージを組み込んだ、多様なトレーニングデータセットが含まれています。 Doppelgangers++は、標準的なSfMとMASt3R-SfMパイプラインにシームレスに統合され、さまざまなシーンで効率性と適応性を提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:08:47 GMT)
Sharp Matrix Empirical Bernstein Inequalities [30.1]
有界固有値を持つ対称ランダム行列に対して、2つの鋭い経験的ベルンシュタイン不等式を示す。鋭いことは、両方の不等式が未知の分散に厳密な方法で適応することを意味する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:56:29 GMT)
Efficient Semantic Splatting for Remote Sensing Multi-view Segmentation [29.6]
本稿では,ガウススプラッティングに基づくセマンティックスプラッティング手法を提案する。提案手法は,RGB画像とセマンティックセグメンテーション結果を同時にレンダリングし,画像平面上に点雲のRGB属性と意味的特徴を投影する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:28:30 GMT)
FuseMoE: Mixture-of-Experts Transformers for Fleximodal Fusion [29.1]
FuseMoEは、革新的なゲーティング機能を備えた、エキスパートの混成フレームワークである。多様なモダリティを統合するために設計されたFuseMoEは、欠落したモダリティと不規則にサンプリングされたデータトラジェクトリのシナリオを管理するのに効果的である。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:21:12 GMT)
Open-Source Acceleration of Stable-Diffusion.cpp [28.8]
安定拡散Turbo (Sd) は拡散モデルを高速化するための効率的な推論フレームワークである。本研究では、Winogradアルゴリズムを利用して2次元畳み込み処理を高速化するSdの最適化版を提案する。本フレームワークは,SDv1.4, v1.5, v2.1, SDXL, SDXL-Turboなど,様々な安定拡散モデルに対して,適切なエンドツーエンド結果を提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:27:17 GMT)
GBR: Generative Bundle Refinement for High-fidelity Gaussian Splatting and Meshing [27.7]
GBR(Generative Bundle Refinement)は、4-6の入力ビューのみを用いた高忠実なガウススプラッティングとメッシュ化のための手法である。 GBRは、幾何学的精度を高めるために神経束調整モジュールと、幾何学的忠実性を改善するために生成深度改善モジュールを統合している。 GBRは、大規模な現実世界のシーンを再構築し、レンダリングする能力を示している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:00:25 GMT)
Accelerating Video Diffusion Models via Distribution Matching [26.5]
本研究は, 拡散蒸留と分散マッチングのための新しい枠組みを導入する。提案手法は, 事前学習した拡散モデルをより効率的な数ステップ生成器に蒸留することに焦点を当てる。ビデオGAN損失と新しい2Dスコア分布マッチング損失の組合せを利用して、高品質なビデオフレームを生成する可能性を実証する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:36:32 GMT)
A Comprehensive Guide to Explainable AI: From Classical Models to LLMs [25.1]
説明可能な人工知能(XAI)は、AIシステムにおける透明性と解釈可能性の必要性の高まりに対処する。決定木、線形回帰、サポートベクトルマシンといった従来のモデルの解釈可能性を探る。本書は、SHAP、LIME、Grad-CAM、反実的説明、因果推論などの実践的なテクニックを提示する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:24:32 GMT)
Non-convex Stochastic Composite Optimization with Polyak Momentum [25.1]
一般化近位勾配は広く用いられる勾配降下法(SGD)の強力な一般化である。しかし、メソッドがマシン内の多くのアプリケーションに収束しないことは知られている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:08:14 GMT)
TLCR: Token-Level Continuous Reward for Fine-grained Reinforcement Learning from Human Feedback [24.4]
人間のフィードバックからの強化学習のためのTLCR(Token-Level Continuous Reward)を紹介する。提案するTLCRは,従来のシーケンスレベルやトークンレベルの離散報酬よりも一貫した性能向上を実現している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:22:13 GMT)
Anti-Reference: Universal and Immediate Defense Against Reference-Based Generation [24.4]
反参照は、参照ベースの生成技術によって引き起こされる脅威から画像を保護する新しい方法である。本研究では,微調整に基づくカスタマイズ手法に対する共同攻撃を可能にする一元的損失関数を提案する。提案手法は特定の転送攻撃能力を示し,グレーボックスモデルといくつかの商用APIの両方に効果的に挑戦する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:04:45 GMT)
Spin relaxation in inhomogeneous magnetic fields with depolarizing boundaries [24.0]
脱分極壁を有する気相セルに閉じ込められた原子スピンの場不均一性による緩和に関する研究を行った。希ガススピンのような核スピンとは対照的に、非被覆細胞の原子スピンは境界でランダム化される。高入力パワーシナリオの偏差はポンプ磁場の減衰によって生じ、不均一に分散された光シフトをもたらす。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:39:41 GMT)
A4-Unet: Deformable Multi-Scale Attention Network for Brain Tumor Segmentation [23.6]
脳腫瘍のセグメンテーションモデルは近年診断に役立っている。彼らは不規則な形状や不明瞭な境界など、MRIの複雑さと変動性の課題に直面している。これらの問題に対処する新しいネットワークA4-Unetを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:28:53 GMT)
M$^{3}$-20M: A Large-Scale Multi-Modal Molecule Dataset for AI-driven Drug Design and Discovery [23.6]
本稿では2000万以上の分子を含む大規模マルチモーダル分子データセットであるM$3$-20Mを紹介する。 AI駆動のドラッグデザインと発見をサポートするように設計されている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 03:43:07 GMT)
Nested Diffusion Models Using Hierarchical Latent Priors [23.6]
ネスト拡散モデル(ネスト拡散モデル)は、効率的で強力な階層的生成フレームワークである。提案手法では,様々な意味レベルで潜伏変数を段階的に生成するために,一連の拡散モデルを用いる。これらの潜伏変数を構築するために,事前学習した視覚エンコーダを用いて,強い意味的視覚表現を学習する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:13:39 GMT)
Beyond Pairwise Correlations: Higher-Order Redundancies in Self-Supervised Representation Learning [23.0]
埋め込み空間の冗長性の概念を形式化し、より複雑で高次の依存関係を捉える冗長性尺度を導入する。本稿では,組込み空間における冗長性を低減する手法として,予測可能性最小化による自己教師付き学習(SSLPM)を提案する。我々はSSLPMが最先端の手法と競合していることを示し、最も優れたSSLメソッドが低埋め込み空間冗長性を示すことを示した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:54:33 GMT)
Do Vision & Language Decoders use Images and Text equally? How Self-consistent are their Explanations? [22.4]
視覚と言語モデル(VLM)デコーダは、マルチモーダルタスクにおける最も優れたアーキテクチャである。回答や説明を生成する際に、入力視覚とテキストのモダリティがどの程度使われているかは明らかになっていない。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:51:03 GMT)
TrojanRobot: Backdoor Attacks Against LLM-based Embodied Robots in the Physical World [22.3]
本稿では,ロボット操作に特化したバックドアアタックを提案し,物理世界で初めてバックドアアタックを実装した。バックドア視覚言語モデルをロボットシステム内の視覚知覚モジュールに組み込むことで,ロボットアームの動作を物理的に誤解させることに成功した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:42:22 GMT)
Leveraging Data Characteristics for Bug Localization in Deep Learning Programs [21.6]
本稿では,Deep Learning (DL)プログラムにおける構造的バグの検出とローカライズを行うTheiaを提案する。 Theiaは40のバグギープログラムにおいて57/75のバグをローカライズすることに成功しているのに対し,NeuraLintは17/75のバグをローカライズする前に構造バグをローカライズできる最先端のアプローチである。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 01:52:06 GMT)
Conformal Symplectic Optimization for Stable Reinforcement Learning [21.5]
相対論的運動エネルギーを利用することで、RADは特殊相対性理論と制限パラメータの更新を有限速以下に取り入れ、異常な影響を効果的に緩和する。特にRADは155.1%のパフォーマンス向上を実現しており、アタリゲームのトレーニングにおける有効性を示している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:07:57 GMT)
Utilizing Large Language Models in an iterative paradigm with domain feedback for zero-shot molecule optimization [21.3]
本稿では,シンプルなドメインフィードバックプロバイダである$textRe3$DFを提案する。 $textRe3$DFは、修飾分子が化学的に無効である場合、外部ツールキットRDKitを使用して分子幻覚を処理する。 20の単価目標に対して、$textRe3$DFはそれぞれ16.96%、20.76%を緩い(textttl)と厳格な(texttts)の閾値で増加させる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:33:07 GMT)
AI-Driven Virtual Teacher for Enhanced Educational Efficiency: Leveraging Large Pretrain Models for Autonomous Error Analysis and Correction [21.2]
本稿では,学生用textbfErrors (VATE) を自律的に解析し,修正するための革新的 textbfVirtual textbfAI textbfTeacher システムを提案する。このシステムは、小学校数学教育のためのSquirrel AI学習プラットフォーム上に展開され、78.3%の精度でエラー解析を行っている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 03:25:51 GMT)
Benchmarking Vision, Language, & Action Models on Robotic Learning Tasks [20.9]
視覚言語アクション(VLA)モデルは汎用ロボットシステムを開発する上で有望な方向を示す。 VLAモデルを評価するための総合的な評価フレームワークとベンチマークスイートを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:54:43 GMT)
One-Shot Real-to-Sim via End-to-End Differentiable Simulation and Rendering [20.9]
本稿では,特徴の同時識別を可能にする,新しい微分可能な点ベースオブジェクト表現を提案する。本手法では, グリッドベース外見場と組み合わせた, 新たな微分可能な点ベースオブジェクト表現を用いる。本研究では,ロボットのアクションシーケンスのみから,シミュレーションとレンダリング可能な世界モデルの両方を学習可能であることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:29:02 GMT)
TOOL-ED: Enhancing Empathetic Response Generation with the Tool Calling Capability of LLM [20.9]
共感的会話は、個人間の日々の会話において重要な特徴である。大規模言語モデル (LLM) は共感的応答を生成する上で優れた性能を示した。本稿では,コモンセンス・ナレッジ・ベースを共感的ツールとしてカプセル化した感情的ナレッジ・ツール・コール(EKTC)フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:14:25 GMT)
INSIGHT: Explainable Weakly-Supervised Medical Image Analysis [20.6]
INSIGHTは、熱マップ生成を誘導バイアスとして統合する、弱制御アグリゲータである。 CTとWSIのベンチマークでは、INSIGHTは最先端の分類結果と弱いラベル付きセマンティックセグメンテーション性能を達成する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:58:40 GMT)
Perception Tokens Enhance Visual Reasoning in Multimodal Language Models [19.3]
本稿では、言語が不十分なタスクの推論を支援するために設計された画像表現であるパーセプショントークンを紹介する。知覚トークンは、言語モデルにおけるチェーン・オブ・シークレットのプロンプトに似た補助的推論トークンとして機能する。 AURORAトレーニング手法は、視覚入力に対する推論を改善するために知覚トークンを増強する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:18:30 GMT)
CR-CTC: Consistency regularization on CTC for improved speech recognition [19.0]
Connectionist Temporal Classification (CTC) は自動音声認識(ASR)の手法として広く使われている。本稿では,2つのCTC分布間の整合性を実現するConsistency-Regularized CTC (CR-CTC)を提案する。 CTCとアテンションベースのエンコーダデコーダ(CTC/AED)を組み合わせたトランスデューサやシステムに匹敵する技術結果が得られることで、CTCの性能を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:17:19 GMT)
Rethinking Kullback-Leibler Divergence in Knowledge Distillation for Large Language Models [18.9]
Kullback-Leiber分散は、Large Language Models (LLM) の圧縮に知識蒸留 (KD) で広く使われている。以前のアサーションとは対照的に、逆クルバック・リブラー(英語版)(RKL)の発散はモード探索であり、したがって平均シーキング前方クルバック・リブラー(英語版)(FKL)の発散よりも好ましい。本稿では,FKLとRKLを組み合わせるために重みを適応的に割り当てる,単純で効果的な適応型Kulback-Leiber(AKL)分散法を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:03:38 GMT)
Puzzle: Distillation-Based NAS for Inference-Optimized LLMs [17.7]
大規模言語モデル(LLM)は目覚ましい能力を示しているが、その採用は推論時に高い計算コストによって制限されている。本稿では,特定のハードウェア上でLLM推論を高速化するフレームワークであるPuzzleについて述べる。 Nemotron-51Bは、バッチサイズが大きい単一のGPU上で推論できる最も正確な言語モデルである。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:55:59 GMT)
Are foundation models for computer vision good conformal predictors? [17.5]
コンフォーマル予測(CP)に基づく視覚・視覚言語基礎モデルの振る舞いについて検討する。この結果から, 基礎モデルはコンフォーマライズ手順, 特にビジョントランスフォーマーの統合に適していることが判明した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:05:38 GMT)
Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement Learning [17.5]
本稿では,因果強化学習におけるシステムダイナミクスをモデル化するための,二方向無測な共起仮定を提案する。神経テンソルネットワークを考案し,計測されていない共同創設者とシステムダイナミクスの両方を同時に学習する2方向デコンファレンスアルゴリズムを開発した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:28:58 GMT)
Tube Loss: A Novel Approach for Prediction Interval Estimation and probabilistic forecasting [17.5]
本稿では,予測区間(PI)の境界の同時推定のための新しい損失関数「タブロス」を提案する。管損失に基づく経験的リスクを最小化することにより得られるパイは、既存の方法によるPIよりも高品質であることが示されている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:17:53 GMT)
Speech Is Not Enough: Interpreting Nonverbal Indicators of Common Knowledge and Engagement [17.3]
マルチモーダル分析は、グループメンバーの非言語的相互作用を特定するために重要である。本稿では,教室における学生のタスク指向インタラクションにおける非言語行動の検出と追跡について紹介する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 03:26:44 GMT)
Robust Bayesian Scene Reconstruction by Leveraging Retrieval-Augmented Priors [17.1]
オブジェクト幾何学の3D表現を構築することは、多くの下流ロボティクスタスクにとって重要である。本研究では,1枚のRGBD画像から多目的シーンを再構成する問題に焦点をあてる。本稿では、既存のメッシュデータセットを利用して情報的事前構築を行う再構成手法BRRPを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 01:04:18 GMT)
Curse of Attention: A Kernel-Based Perspective for Why Transformers Fail to Generalize on Time Series Forecasting and Beyond [17.0]
TSFタスクにおける変圧器の非効率性に関する最初の理論的説明を提案する。トレーニングアテンションネットワークにおけるbf非対称学習のメカニズムを考察する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:29:06 GMT)
Using Offline Data to Speed Up Reinforcement Learning in Procedurally Generated Environments [16.6]
本研究では, エージェントがオフラインデータをトラジェクトリ形式で活用して, 手続き的に生成した環境におけるサンプル効率を向上させることができるかを検討した。 1)オンラインRLトレーニングの前にポリシーを事前学習し、(2)オフラインデータからオンラインRLとILでポリシーを同時に訓練する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:48:18 GMT)
Revisiting DeepFool: generalization and improvement [16.6]
我々は,有効性と計算効率のバランスを崩す新たな敵攻撃群を導入する。提案手法は,大規模モデルのロバスト性の評価にも適しており,敵の訓練に使用できる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:47:58 GMT)
SizeGS: Size-aware Compression of 3D Gaussians with Hierarchical Mixed Precision Quantization [16.5]
SizeGSは,視覚的品質を最適化しつつ,特定のサイズ予算内で3DGSを圧縮するフレームワークである。最適ハイパーパラメータを10分で同定するアルゴリズムを開発し、最先端の手法に匹敵する品質で1.69$times$の効率向上を実現した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:09:14 GMT)
Self-Supervised Learning with Probabilistic Density Labeling for Rainfall Probability Estimation [16.1]
SSLPDLはNWP予測を後処理することで降雨確率を推定するための後処理手法である。極端気象現象のクラス不均衡に対処するために,確率密度に基づく簡単なラベル付け手法を提案する。実験の結果,SSLPDLは地域降水後処理において,他の降水予測モデルを上回ることがわかった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:56:09 GMT)
Enhanced 3D Generation by 2D Editing [15.9]
事前訓練された2D拡散モデルから3D表現を蒸留することは、ゲーム、フィルム、インテリアデザインの3Dクリエイティブアプリケーションに不可欠である。現在のSDS法は拡散モデルからの非効率な情報蒸留によって妨げられ、光現実的な3Dコンテンツの作成を妨げている。 GE3D (3D Generation by Editing)を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:53:05 GMT)
IE-NeRF: Inpainting Enhanced Neural Radiance Fields in the Wild [15.9]
本稿では,ニューラル・ラジアンス・フィールド(NeRF)と野生の無制御写真を用いて,リアルな新しいビューを合成するための新しいアプローチを提案する。 textitInpainting Enhanced NeRF, あるいは我々のフレームワークは, 画像インパインティング技術からインスピレーションを得て, 従来のNeRFを強化する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:59:47 GMT)
Evaluating Robustness of LLMs on Crisis-Related Microblogs across Events, Information Types, and Linguistic Features [15.8]
Xのようなマイクロブログプラットフォームは、災害時に政府にリアルタイム情報を提供する。従来、教師付き機械学習モデルが用いられてきたが、一般化性に欠けていた。本稿では,災害関連ソーシャルメディアデータ処理における6つの有名なLarge Language Model(LLM)の性能を詳細に分析する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:30:29 GMT)
Dynamic Incremental Optimization for Best Subset Selection [15.8]
最良のサブセット選択は、多くの学習問題に対する金の標準と見なされている。主問題構造と双対問題構造に基づいて,効率的な部分集合双対アルゴリズムを開発した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:44:36 GMT)
Causal Bayesian Optimization via Exogenous Distribution Learning [15.8]
既存の因果ベイズ最適化(CBO)法は、報酬を最大化するために因果構造を変更するハード介入に依存する。学習内因性分布を利用した新しいCBO法を開発した。異なるデータセットとアプリケーションの実験により,提案手法の利点が示された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:44:47 GMT)
Learning from Snapshots of Discrete and Continuous Data Streams [15.8]
離散データストリームと連続データストリームの両方から異なるクラスの関数を学習する性質について検討する。適応学習アルゴリズムは時間依存関数とデータ依存関数の集合を学習するために必要であることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:03:08 GMT)
SABER: Model-agnostic Backdoor Attack on Chain-of-Thought in Neural Code Generation [15.3]
CoT(Chain-of-Thought)推論は、コード生成におけるCLM(Code Language Models)の信頼性を高めるために提案されている。 CoTモデルは、CoT推論を言語モデルに効果的に統合するように設計されており、コード生成において顕著な改善が達成されている。本研究では,コード生成タスクにおけるバックドアインジェクションに対するCoTモデルの脆弱性について検討する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:36:00 GMT)
ActiveAnno3D -- An Active Learning Framework for Multi-Modal 3D Object Detection [15.2]
ラベル付けのためのデータサンプルを選択するためのアクティブラーニングフレームワークであるActiveAnno3Dを提案する。我々は nuScenes と TUM Traffic Intersection データセット上で BEVFusion と PV-RCNN を用いて実験およびアブレーション研究を行った。アクティブな学習フレームワークをproAnnoラベリングツールに統合し、AIによるデータ選択とラベリングを可能にします。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:15:15 GMT)
Continuous Sleep Depth Index Annotation with Deep Learning Yields Novel Digital Biomarkers for Sleep Health [15.2]
連続型睡眠深度診断法は、睡眠構造に関するより詳細な情報を明らかにし、睡眠医学における定期的な臨床使用のための新しいデジタルバイオマーカーを提供する。ケーススタディでは、睡眠深度指数が従来の睡眠ステージよりもニュアンスな睡眠構造を捉えていた。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:12:37 GMT)
A multidimensional measurement of photorealistic avatar quality of experience [14.9]
フォトリアリスティックなアバターは人間のアバターで、実際の人間のように見え、動き、話す。 10次元のアバター性能を主観的に測定するオープンソースのテストフレームワークを提供する。ある種の現実主義のレベルを超えるアバターに対して、これらの測定された次元のうち8つは強く相関している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 01:09:23 GMT)
Are Clinical T5 Models Better for Clinical Text? [14.9]
T5のようなトランスフォーマーベースのエンコーダ/デコーダアーキテクチャを持つ大規模言語モデルは、教師付きタスクの標準プラットフォームとなっている。最近の研究は、新しいまたは適応された既存のモデルを臨床データに訓練してきた。臨床T5モデルは、FLANで調整された汎用T5モデルよりも良い選択か? トレーニングセットと異なる新しい臨床領域を一般化するだろうか?
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:52:17 GMT)
CRiM-GS: Continuous Rigid Motion-Aware Gaussian Splatting from Motion-Blurred Images [14.7]
CRiM-GS は textbfContinuous textbfRigid textbfMotion-aware textbfGaussian textbfSplatting である。リアルタイムレンダリング速度を維持しながら、モーションブルーの画像から正確な3Dシーンを再構築する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:05:26 GMT)
Dissecting the Interplay of Attention Paths in a Statistical Mechanics Theory of Transformers [14.6]
本稿では,トランスフォーマーと密接な関係を持つ深層多頭部自己注意ネットワークについて考察する。このモデルでベイズ学習の統計力学理論を開発する。合成および実世界のシーケンス分類タスクについて,本研究の成果を確認した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:29:42 GMT)
Prism: Semi-Supervised Multi-View Stereo with Monocular Structure Priors [14.6]
そこで本研究では,実画像とレンダリング画像の同時学習を可能にする,半教師付き学習フレームワークを提案する。知覚画像のメトリクスにインスパイアされ、深い特徴損失と多スケール統計損失により、MVSと単分子予測を比較した。未ラベルのスマートフォンビデオと、MVSネットワークをトレーニングするためのフォトリアリスティックな合成データセットの両方を使用するための扉を開く。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 01:05:41 GMT)
An Entailment Tree Generation Approach for Multimodal Multi-Hop Question Answering with Mixture-of-Experts and Iterative Feedback Mechanism [14.5]
マルチモーダルなマルチホップ質問応答の現在の手法は、主に2つの課題に直面している。大量の冗長な情報を含む検索された証拠は、性能を著しく低下させる。解釈可能な推論ステップのない推論プロセスは、複雑な問題を扱うための論理的誤りを発見するのを難しくする。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:47:55 GMT)
FairSort: Learning to Fair Rank for Personalized Recommendations in Two-Sided Platforms [14.4]
本稿では,ユーザ側フェアネス,プロバイダ側フェアネス,パーソナライズされたレコメンデーションユーティリティ間のトレードオフソリューションを見つけるためのモデルであるFairSortを提案する。 FairSortは、プロバイダとユーザの両方の公正性を考慮しながら、より信頼性の高いパーソナライズされたレコメンデーションを保証できることを示します。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:07:37 GMT)
LVP-CLIP:Revisiting CLIP for Continual Learning with Label Vector Pool [14.1]
継続的学習は、以前獲得した知識を忘れずに、逐次新しいタスクを学習できるようにモデルを更新することを目的としている。最近の連続学習アプローチでは、高次元特徴空間と多次元特徴マッチングに視覚言語モデルCLIPを利用することが多い。本稿では,CLIPに基づく連続学習を再考し,ラベルベクトルプール(LVP)の概念を導入する。LVPはテキストラベルを類似性参照としてトレーニングイメージに置き換え,理想的なテキスト記述の必要性を排除している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:22:39 GMT)
BudgetFusion: Perceptually-Guided Adaptive Diffusion Models [14.0]
拡散モデルが画像を生成する前に最も知覚的に効率的な拡散ステップ数を示す新しいモデルであるBudgetFusionを提案する。実験の結果、BudgetFusionは知覚的類似性を損なうことなく、1プロンプトあたり最大5秒節約できることがわかった。私たちは、この研究が核となる疑問に答えるための努力を始めることを願っている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:23:40 GMT)
Dense ReLU Neural Networks for Temporal-spatial Model [13.8]
非パラメトリック推定にRectified Linear Unit (ReLU) アクティベーション機能を利用する完全接続深層ニューラルネットワークに着目する。我々は、観測された測定における時間的および空間的依存に対処するため、収束率につながる非漸近境界を導出する。我々はまた、多様体上のデータをモデル化し、高次元データの本質的な次元性を探求することで、次元性の呪いに取り組む。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:59:52 GMT)
BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models [13.7]
この研究は、バイアス継承に対抗するために設計された新しいPEFT法であるBias-Alleviating Low-Rank Adaptation (BA-LoRA)を導入している。 BA-LoRAは、(1)整合正則化器、(2)多様性正則化器、(3)特異値分解正則化器の3つの異なる正則化項を含む。その結果、BA-LoRAはLoRAとその最先端の変種よりも優れていた。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:10:25 GMT)
Explainable Adversarial Learning Framework on Physical Layer Secret Keys Combating Malicious Reconfigurable Intelligent Surface [13.4]
マン・イン・ザ・ミドルRIS(MITM-RIS)の盗聴に対処する逆学習フレームワークを提案する。提案手法では,PL-SKGが正統なユーザ間で高い鍵となる合意を達成できることが示唆された。これにより、将来の6Gで信頼できない反射デバイスと無線通信をセキュアにする道が開ける。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:42:12 GMT)
Vision Transformer-based Semantic Communications With Importance-Aware Quantization [13.3]
本稿では、無線画像伝送のための重要量化(IAQ)を用いた視覚変換器(ViT)に基づくセマンティック通信システムを提案する。筆者らのIAQフレームワークは, エラーのない, 現実的な通信シナリオにおいて, 従来の画像圧縮手法よりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:24:47 GMT)
Understanding the Impact of Graph Reduction on Adversarial Robustness in Graph Neural Networks [13.0]
グラフニューラルネットワーク(GNN)は、大規模グラフデータから学習するためにますます人気が高まっている。本稿では,グラフ縮小技術,特にグラフ粗大化とスパーシフィケーションが,GNNの敵攻撃に対する堅牢性に与える影響を実証研究する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:22:23 GMT)
Learning to Correction: Explainable Feedback Generation for Visual Commonsense Reasoning Distractor [12.8]
大規模マルチモーダルモデル(LMM)は視覚的コモンセンス推論(VCR)タスクにおいて顕著な性能を示した。しかし,LMMが障害発生時の視覚的コモンセンス誤差を補正する能力はまだ解明されていない。我々はこの誤り訂正過程をシミュレートするLMMの先駆的な研究である。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 03:59:59 GMT)
Equivariant Machine Learning on Graphs with Nonlinear Spectral Filters [12.7]
グラフ汎函数シフトを対称性群、つまりグラフシフト作用素と可換なユニタリ作用素と考える。グラフ関数シフトに完全同値な非線形スペクトルフィルタ(NLSF)を提案する。ノードおよびグラフ分類ベンチマークにおいて、既存のスペクトルGNNよりもNLSFの方が優れた性能を示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:16:39 GMT)
Domain Generalization for Medical Image Analysis: A Review [12.4]
本稿では、MedIAに適した領域一般化(DG)研究を包括的にレビューする。 DG法をデータレベル,特徴レベル,モデルレベル,分析レベルに分類する。データ取得からモデル予測,解析に至るまで,これらの手法がMedIAワークフローの様々な段階においてどのように利用できるかを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:28:17 GMT)
Large Language Model Evaluation via Matrix Nuclear-Norm [11.9]
本稿では,大規模言語モデル(LLM)のデータ圧縮精度を定量化するための指標として,マトリックス核ノルムを紹介する。さらに、(L_1,2text-norm )を用いて核ノルムを近似することにより、モデルの情報圧縮能力を効果的に評価できる。マトリックス核ノームは、CEREBRAS-GPTモデルにおいて、サイズが111Mから6.7Bに増加するにつれて、マトリックスエントロピーの8倍から24倍の速度を達成する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:18:49 GMT)
A flexible Bayesian g-formula for causal survival analyses with time-dependent confounding [11.5]
我々は、従来のパラメトリックなg-形式を強化する代替のg-形式推定器を開発する。本稿では,二分的時間変化治療に焦点をあて,個別生存データに対するg-formulasの一般クラスを導入する。各治療戦略について,後部サンプリングアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 01:20:24 GMT)
Estimating quantum amplitudes can be exponentially improved [11.3]
量子振幅(二つの量子状態間の重なり合い)を推定することは、量子コンピューティングの基本的な課題である。本稿では,純粋状態から行列形式への変換による量子振幅推定のための新しいアルゴリズムフレームワークを提案する。我々のフレームワークは、それぞれ標準量子極限$epsilon-2$とハイゼンベルク極限$epsilon-1$を達成する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:21:21 GMT)
Fine-Tuning LLMs with Noisy Data for Political Argument Generation and Post Guidance [11.3]
Redditのデータ上の微調整されたモデルは、議論の質が最も高く、ノイズの多いデータの組み合わせは、持続的な毒性につながった。プロンプティング戦略は、個人攻撃のような特定の有毒な特徴を減らしたが、より広範な影響しか与えなかった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:00:57 GMT)
KaSA: Knowledge-Aware Singular-Value Adaptation of Large Language Models [11.1]
知識認識型特異値適応(KaSA) 本稿では,知識認識特異値を用いた特異値分解(SVD)を利用したPEFT手法である知識認識特異値適応(KaSA)を導入し,その課題との関連性に基づいて,知識を動的に活性化する。実験の結果、KaSAは16のベンチマークと4つの合成データセットでFFTと14のPEFTベースラインを一貫して上回っていることがわかった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:26:22 GMT)
Large Language Models Merging for Enhancing the Link Stealing Attack on Graph Neural Networks [10.8]
グラフデータに対するリンク盗難攻撃は、重大なプライバシー上の脅威となる。攻撃者は複数の攻撃者のデータ知識を組み合わせることで、より効果的な攻撃モデルを構築することができる。本稿では,クロスデータセットと大規模言語モデルを利用したリンク盗難攻撃手法を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:37:05 GMT)
ArrivalNet: Predicting City-wide Bus/Tram Arrival Time with Two-dimensional Temporal Variation Modeling [10.8]
バスと路面電車のための2次元時間変動に基づく多段階ATPであるtextitArrivalNetを提案する。 1次元の時間列を周期内および周期間変分に分解し、2次元テンソルに再キャストする。異なる周波数で変換された2Dブロックは、コンピュータビジョンのバックボーンで効果的な学習を可能にする画像のような特徴表現を持つ。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:24:35 GMT)
MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.7]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。 MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。 MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:34:23 GMT)
DocETL: Agentic Query Rewriting and Evaluation for Complex Document Processing [10.7]
大規模言語モデル(LLM)は、構造化されていないデータを分析することを約束している。ユーザ定義操作のためのLLM出力は、最適化されたプロンプトであっても、しばしば不正確である。本稿では,複雑な文書処理パイプラインを最適化するDocETLを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:18:40 GMT)
Photophysics of O-band and transition metal color centers in monolithic silicon for quantum communications [10.6]
シリコンホストでは、スピン光子界面として、限られた数のOバンドカラーセンターが探索されている。この研究は、シリコン中の2つの有望なOバンド欠陥、すなわちTセンターと*$Cu(遷移金属)カラーセンターを調査し、比較する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:10:41 GMT)
GraPE: A Generate-Plan-Edit Framework for Compositional T2I Synthesis [10.5]
本稿では,複雑な多段階生成のタスクを3段階に分解する,T2I合成の代替パラダイムを提案する。提案手法は,モジュール性が高く,トレーニングが自由であり,画像生成モデルと編集モデルの組み合わせに対して適用可能であるという事実から,その強みを導出する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:29:56 GMT)
Mean--Variance Portfolio Selection by Continuous-Time Reinforcement Learning: Algorithms, Regret Analysis, and Empirical Study [10.4]
本研究では,観測可能な要因により株価が拡散する過程にある市場における平均-変動ポートフォリオの選択について検討する。本稿では,市場係数の学習や推定を行うことなく,事前委託投資戦略を直接学習する汎用データ駆動型RLアルゴリズムを提案する。その結果, 連続的RL戦略は, 特に揮発性クマ市場において, 常に最良であることが明らかとなった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:31:10 GMT)
DECO: Life-Cycle Management of Enterprise-Grade Chatbots [9.9]
DECOはエンタープライズグレードのチャットボットを開発し、デプロイし、管理するための包括的なフレームワークである。効率的でカスタマイズされた検索拡張世代(RAG)アルゴリズムをサポートする。また、構造化されていないインシデントログをユーザフレンドリで構造化されたガイドに変換するための堅牢なメカニズムも組み込まれている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:00:06 GMT)
Rule-based Data Selection for Large Language Models [9.9]
トレーニングデータの質は、大規模言語モデル(LLM)の性能に大きく影響する。複数の人為的指標(ルール)に基づいてデータを評価・選択するためにLLMを用いた研究が増えている。従来のルールベースのアプローチは、しばしば人間のベクトルに強く依存し、ルールを評価するための効果的な指標が欠如し、新しいタスクへの適応性が制限されている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:44:57 GMT)
ReverseNER: A Self-Generated Example-Driven Framework for Zero-Shot Named Entity Recognition with Large Language Models [9.9]
ゼロショット名前付きエンティティ認識タスクにおいて,大規模言語モデル(LLM)の限界を克服するためのフレームワークであるReverseNERを提案する。文から始めるのではなく、LLMを使用して定義に基づいてエンティティを生成し、それらを全文に拡張する。その結果,タスク文と意味的・構造的類似性を保ちながら,明確にラベル付けされたエンティティを持つ注釈付き文が得られた。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:23:15 GMT)
Feasibility study of frequency-encoded photonic qubits over a free-space channel [9.7]
本研究では、フィールドワイド干渉計を利用して、自由空間チャネル上で伝送される周波数ビンをデコードする新しい手法を提案し、実証する。我々の受動的アプローチは、周波数ビン符号化の汎用性を拡張し、長距離および変動チャネルへの道を開く。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:27:38 GMT)
XKV: Personalized KV Cache Memory Reduction for Long-Context LLM Inference [9.7]
大規模言語モデル(LLM)推論は出力トークンを1つずつ生成し、多くの冗長な計算に繋がる。 KV-Cacheフレームワークは時間と空間の複雑さを妥協する。既存の研究では、推論精度に重要でないキャッシュデータの一部を削除することで、メモリ消費を減らすことができる。各レイヤのキャッシュサイズをパーソナライズしてカスタマイズすることで,メモリの大幅な削減が期待できることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:32:08 GMT)
Radon Implicit Field Transform (RIFT): Learning Scenes from Radar Signals [9.2]
Implicit Neural Representation (INR)は、最小限のレーダーデータでコンパクトで連続的な表現を提供する。 RIFTは、レーダーのための古典的なフォワードモデルとINRベースのシーン表現の2つのコンポーネントで構成されている。データフットプリントは10%に過ぎず、RIFTモデルはシーン再構築において最大188%の改善を実現している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:46:17 GMT)
Imputation Matters: A Deeper Look into an Overlooked Step in Longitudinal Health and Behavior Sensing Research [8.5]
健康と行動の結果に対する縦断的受動的センシング研究は、しばしば欠落や不完全なデータを持っている。したがって、欠落したデータを効果的に処理することは、重要なデータ処理とモデリングのステップである。計算結果の優先順位付けは研究結果に大きな影響を及ぼす可能性が示唆された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:29:53 GMT)
Quality-Aware Image-Text Alignment for Real-World Image Quality Assessment [8.4]
No-Reference Image Quality Assessment (NR-IQA) は、高画質の参照画像が利用できない場合に、人間の知覚に合わせて画像品質を測定する方法に焦点を当てている。最先端のNR-IQAアプローチの大部分における人間アノテーション付き平均オピニオンスコア(MOS)への依存は、そのスケーラビリティと実際のシナリオへの適用性を制限している。 MOSを必要としないCLIPベースの自己教師型意見認識手法であるQuariCLIPを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:00:50 GMT)
EEG-Based Mental Imagery Task Adaptation via Ensemble of Weight-Decomposed Low-Rank Adapters [8.2]
本稿では,パラメータ効率のよい精神イメージタスク適応のための,重み分解型低ランク適応法であるEDoRAの新たなアンサンブルを提案する。提案手法は,心的画像分類のための完全細管法と最先端PEFT法よりも優れた性能を示した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:57:00 GMT)
Ctrl-V: Higher Fidelity Video Generation with Bounding-Box Controlled Object Motion [8.1]
本稿では,現実的な映像合成において,物体の動きを正確に制御する方法を提案する。これを実現するために,バウンディングボックスを用いてオブジェクトの動きを制御し,この制御を画素空間内の2Dまたは3Dボックスのレンダリングに拡張する。我々の手法であるCtrl-Vは、修正および微調整された安定ビデオ拡散(SVD)モデルを利用して、軌跡生成と映像生成の両方を解決する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:16:59 GMT)
MG-3D: Multi-Grained Knowledge-Enhanced 3D Medical Vision-Language Pre-training [8.0]
3次元医用画像解析は多くの臨床応用において重要である。 3次元医用画像解析では、大規模視覚言語による事前訓練がまだ検討されていない。大規模データ(47.1K)に基づいて事前学習したMG-3Dを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:45:59 GMT)
Mixture-of-PageRanks: Replacing Long-Context with Real-Time, Sparse GraphRAG [7.9]
グラフに基づく検索アルゴリズムであるPageRankをベースとしたアルゴリズムを開発し,MixPR(Mix-of-PageRanks)と呼ぶ。 MixPRは、効率よく安価な検索のためにスパース行列を用いて実装されたPageRankベースのグラフ検索アルゴリズムの混合を使用する。我々の検索システムは,幅広い長期コンテキストのベンチマークタスクに対して,最先端の結果を達成している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:55:12 GMT)
Boundary-Guided Learning for Gene Expression Prediction in Spatial Transcriptomics [7.8]
本稿では,病理画像から抽出した境界情報を手がかりとして,BG-TRIPLEXというフレームワークを提案する。我々のフレームワークはピアソン相関係数(PCC)で既存の手法を一貫して上回っている本手法は,WSIと遺伝子発現の複雑な相互作用を理解する上で,境界機能の重要性を強調している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:03:57 GMT)
Hallucination Detox: Sensitive Neuron Dropout (SeND) for Large Language Model Training [7.7]
本研究では,学習過程と幻覚の出現との関係について検討する。感性低下(Sensitivity Dropout, SenD)は, 覚醒の軽減を目的としたトレーニングプロトコルである。さらに,従来のEigenScoreを2倍の速度で近似する,教師なし幻覚検出尺度であるEfficient EigenScore(EES)を開発した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:42:11 GMT)
GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion [7.6]
計量単分子深度推定の一般化は、その不適切な性質のために重要な課題となる。本稿では,様々なカメラ設定の整合性を維持する新しい標準表現を提案する。また,物体の大きさや垂直位置の手がかりによって推定される深度を適応的かつ確率的に融合する新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:04:34 GMT)
InkSight: Offline-to-Online Handwriting Conversion by Learning to Read and Write [7.5]
InkSightは、物理的なメモ取り者が自分の仕事(オフラインの筆跡)をデジタルのインク(オンラインの筆跡)に変換するのを助ける当社のアプローチでは、事前の読み書きと組み合わせて、大量のペアのサンプルがない場合にモデルをトレーニングすることが可能です。人間の評価では,HierTextデータセット上で得られたサンプルの87%が,入力画像の有効なトレースとして検討されている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:05:43 GMT)
Paraphrase-Aligned Machine Translation [7.3]
大規模言語モデル(LLM)は機械翻訳において重要な機能を示している。本稿では,LLMを微調整して文を言い換える手法であるParaAlign Translatorを提案する。実験結果から,LLaMA-3-8Bモデルの性能は資源豊富な場合と低リソースの場合の両方で向上することが示された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:17:26 GMT)
BAMBA: A Bimodal Adversarial Multi-Round Black-Box Jailbreak Attacker for LVLMs [7.2]
現在の作業には、単一ラウンド攻撃の制限、二重モードのシナジーの不足、ブラックボックスモデルへのトランスファー可能性の低下、迅速なエンジニアリングへの依存の4つの問題がある。本稿では,LVLM用マルチラウンドブラックボックスジェイルブレイク攻撃器であるBAMBAを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:14:16 GMT)
Fuzzy Norm-Explicit Product Quantization for Recommender Systems [7.1]
低複雑性で適切なレコメンデーションを生み出すという点で最もコスト効率のよいテクニックの1つは、PQ(Product Quantization)である。本研究は,標準ベースの製品量子化を行うファジィアプローチを提案する。提案手法は,NEQ,PQ,RQなどのすべてのPQアプローチを,94%,69%,59%のNetflix,Audio,Cifar60kデータセットをリコールすることで,+6%,+5%,+8%に向上させる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:14:57 GMT)
Language hooks: a modular framework for augmenting LLM reasoning that decouples tool usage from the model and its prompt [7.1]
新機能で言語モデルを拡張するための新しいフレームワークであるLanguage hooksを紹介します。我々は、最先端のベースラインに対して我々の手法をベンチマークし、タスク認識アプローチよりも優れていることを発見した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:16:17 GMT)
3D-Consistent Image Inpainting with Diffusion Models [7.1]
同一シーンに属する画像ペアを用いた生成モデルを提案する。生成拡散モデルの変更は、シーンの別の視点をデノナイジングプロセスに組み込むことで行う。提案手法を1つの実世界のデータセットと3つの実世界のデータセットで評価し, セマンティック・コヒーレントおよび3D一貫性のインペインティングを生成することを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:07:07 GMT)
Steering Large Language Models to Evaluate and Amplify Creativity [7.0]
創造性を判断するために、創造的に書く方法に関するこの知識を活用できることを示します。我々は,LLMの内部状態の違いを抽出する機械的アプローチを,「空虚」あるいは「創造的」に応答するよう促す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:28:48 GMT)
COMPILED: Deep Metric Learning for Defect Classification of Threaded Pipe Connections using Multichannel Partially Observed Functional Data [6.7]
本稿では,各サンプルが部分的に観察された多チャンネル関数データとして表現される欠陥分類に着目した。各欠陥タイプのサンプルは限定的かつ不均衡である。本稿では,Deep Metrics Learningに基づくCompactLEDと呼ばれる革新的な分類手法を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:45:24 GMT)
Perceptual Hash Inversion Attacks on Image-Based Sexual Abuse Removal Tools [6.5]
我々は、画像に基づく性的虐待をオンラインで検出し、除去するために不可欠な知覚的ハッシュが、生成AIに基づく低予算の逆攻撃による脆弱性に直面していることを示す。 IBSA除去ツールにセキュアなハッシュマッチングを実装することで、致命的な結果の軽減を図っている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:23:16 GMT)
Adversarial Transferability in Deep Denoising Models: Theoretical Insights and Robustness Enhancement via Out-of-Distribution Typical Set Sampling [6.2]
深層学習に基づく画像認識モデルは優れた性能を示すが、ロバストネス分析の欠如は依然として重要な懸念点である。主な問題は、これらのモデルが敵攻撃の影響を受けやすいことである。本稿では,新たな対人防御手法であるOut-of-Distribution typical Set Smpling Training戦略を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:47:57 GMT)
EGEAN: An Exposure-Guided Embedding Alignment Network for Post-Click Conversion Estimation [6.2]
クリック後変換率(CVR)の推定は、オンライン広告システムにとって不可欠である。因果的アプローチの進歩にもかかわらず、CVR推定はCovariate Shiftによる課題に直面している。本研究では,この問題を解決するためのEGEAN(Exposure-Guided Embedding Alignment Network)を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:17:02 GMT)
SpiKernel: A Kernel Size Exploration Methodology for Improving Accuracy of the Embedded Spiking Neural Network Systems [6.0]
Spiking Neural Networks(SNN)は、機械学習ベースのアプリケーションタスクに対して、超低消費電力/エネルギー消費を提供する。現在、ほとんどのSNNアーキテクチャはより高精度なモデルサイズを必要とする。カーネルサイズ探索によりSNNの精度を向上させる新しい手法であるSpike Kernelを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:29:56 GMT)
Quantum delayed "choice" based on vectorially structured photon [6.0]
本稿では、単一光子の量子状態を任意の偏光重畳に調整し、量子遅延選択(QDC)実験の新たなバージョンを提案する。波状粒子と粒子状粒子との間の単一光子の変形挙動を観察し,古典的な波動・粒子像に挑戦する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:03:21 GMT)
Strategizing Equitable Transit Evacuations: A Data-Driven Reinforcement Learning Approach [6.0]
本稿では,バスによる避難を最適化するデータ駆動型強化学習フレームワークを提案する。我々は、避難問題を強化学習によって解決されたマルコフ決定過程としてモデル化する。提案手法は,避難効率とサービス分散の両面で,大幅な改善を実現していることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:17:38 GMT)
Transportation Marketplace Rate Forecast Using Signature Transform [5.8]
我々は署名変換に基づく新しい統計手法を開発した。これらのマーケットプレース率を予測するために,予測的かつ適応的なモデルを構築しました。我々の手法に基づくアルゴリズムは、予測精度がはるかに優れているAmazonのトラック運転によって展開されている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 05:49:01 GMT)
Taming Sensitive Weights : Noise Perturbation Fine-tuning for Robust LLM Quantization [5.7]
量子化誤差に対する感度重みの影響を抑えるため,NPFT(Noth Perturbation Fine-tuning)を提案する。 NPFTは、外周重量を同定し、外周重量のランダムな摂動を、PEFT最適化によるモデルとして追加する。 OPTおよびLLaMAモデルに適用すると、NPFT法は均一および非一様量子化器の安定な性能向上を実現する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:46:22 GMT)
When Vision Models Meet Parameter Efficient Look-Aside Adapters Without Large-Scale Audio Pretraining [5.7]
本研究では,Look Aside Adapter (LoAA) を用いて視覚モデルを直接微調整することにより,事前学習段階をバイパスすることを提案する。実験により, 種々の音声・音声タスクにおいて, 視覚モデルが事前学習された音声モデルの性能に到達または超えることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:14:30 GMT)
GlocalCLIP: Object-agnostic Global-Local Prompt Learning for Zero-shot Anomaly Detection [5.5]
グローバルプロンプトとローカルプロンプトの相補的学習を改善するために,局所的コントラスト学習を導入する。 ZSADにおけるGlocalCLIPの一般化性能を実世界の15のデータセットで実証した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:35:08 GMT)
PIG: Physics-Informed Gaussians as Adaptive Parametric Mesh Representations [5.4]
ニューラルネットワークを用いた部分微分方程式(PDE)の近似は、大きく進歩している。 PINNは、高周波および非線形成分の学習に苦慮しているMLP(Multi-Layer Perceptrons)のスペクトルバイアスによって、限られた精度に悩まされることが多い。本稿では,ガウス関数を用いた特徴埋め込みと軽量ニューラルネットワークを組み合わせた物理インフォームドガウス(PIG)を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:58:29 GMT)
Rethinking Model-based, Policy-based, and Value-based Reinforcement Learning via the Lens of Representation Complexity [5.4]
強化学習(Reinforcement Learning, RL)は、モデルベースRL、ポリシーベースRL、価値ベースRLなど、さまざまなパラダイムを包含する。この研究は、これらのRLパラダイムの中で、表現の潜在的階層(表現すべき関数の複雑さ)について検討する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:40:46 GMT)
Language Model Powered Digital Biology with BRAD [5.3]
大規模言語モデル(LLM)は構造化されていない統合に適しています。バイオインフォマティクス検索デジタルアシスタント(BRAD)の試作について紹介する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:45:30 GMT)
Functional analytic insights into irreversibility of quantum resources [5.2]
特定の状態の集合を保存する量子チャネルは、それらの集合によって誘導される基底ノルムに対して収縮的であることを示す。安定化器プロトコルでは可逆的に相互変換できないクォート魔法状態が存在することを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:58:29 GMT)
Learning Volumetric Neural Deformable Models to Recover 3D Regional Heart Wall Motion from Multi-Planar Tagged MRI [5.2]
ボリューム型ニューラルデフォルマブルモデル(upsilon$NDMs)を新たに導入する。我々の$upsilon$NDMは、低次元大域的変形パラメータ関数のセットを通して、心臓壁の形状と動きを表す。我々は3次元局所心壁運動データセットの大規模なコホート実験を行った。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:28:43 GMT)
Self-supervised cost of transport estimation for multimodal path planning [5.1]
本研究では,ロボットが周囲の移動コストを見積もることができる自己教師型学習手法を開発した。本手法は,マルチモーダルモビリティ・モルフォボット(M4)に応用し,その環境を走行・飛行・セグウェイ・クロールするロボットに適用する。本稿では,Nvidia Jetson Orin Nano ロボット・コンピュータ・ユニットに実装した低計算コストについて述べる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:02:35 GMT)
A Comprehensive Survey and Guide to Multimodal Large Language Models in Vision-Language Tasks [5.0]
MLLM(Large Language Model)は、テキスト、画像、ビデオ、オーディオを統合し、モーダルな理解と生成のためのAIシステムを実現する。 Bookは、スケーラビリティ、堅牢性、およびクロスモーダル学習における重要な課題に対処しながら、MLLM実装の顕著な点について検討している。倫理的考察、責任あるAI開発、そして今後の方向性に関する議論をまとめると、この権威あるリソースは理論的な枠組みと実践的な洞察の両方を提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:48:30 GMT)
Dilated Balanced Cross Entropy Loss for Medical Image Segmentation [4.9]
本研究では,医療画像のセグメンテーションにおける不均衡データの問題に対処する新しい手法を提案する。バランスの取れたクロスエントロピー(CE)損失では、各クラスに割り当てられた重みはクラス周波数の逆である。異なるデータセットに対する実験により、提案した拡張バランスCE(DBCE)損失は、バランスCE損失よりも大きなマージンで優れていることが示された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:49:30 GMT)
Toward Democracy Levels for AI [4.0]
我々は、あるドメインにおける決定が民主的に行われる程度を評価するための「民主主義レベル」フレームワークを提供する。このフレームワークは (i) 民主的なAI、多元的AI、および公的なAIエコシステムのロードマップで定義するために、 (ii) 難しいAIガバナンスの質問に対する意思決定の正当性を高める必要がある組織を指導するために、 (iii) AI組織を評価して責任を負うことを目指す人々による粗悪品として使用することができる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:00:32 GMT)
Kernel Stochastic Configuration Networks for Nonlinear Regression [3.9]
本稿では,コンフィグレーションネットワーク(SCN)のカーネルバージョンについて述べる。モデルの表現学習能力と性能安定性を高めることを目的としている。再構成空間におけるデータ分布は回帰解法に好適であることが示されている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:54:04 GMT)
Can Generative AI Solve Your In-Context Learning Problem? A Martingale Perspective [3.8]
我々は、CGMの予測分布からの祖先サンプリングが、仮定されたベイズモデルの後方予測からのデータセットのサンプリングと等価であることを示す。生成予測の$p$-valueは、ICL問題に対してモデルが適切なタイミングを決定するための統計的決定手順で使用できる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:03:21 GMT)
Learning the dynamics of Markovian open quantum systems from experimental data [3.7]
このアルゴリズムはマルコフ・チェイン・モンテカルロのアプローチに基づいている。我々は,1対の量子エミッタ上で実行される量子光学実験について,我々のアルゴリズムをベンチマークした。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:28:06 GMT)
An Overview of Cyber Security Funding for Open Source Software [3.6]
論文ではOSSの2つの資金調達機関と、彼らが出資したプロジェクトについて検討する。両方の資金調達機関の焦点は、ソフトウェアセキュリティとサイバーセキュリティ全般に向けられている。サイバーセキュリティとサステナビリティだけでは、2つの機関による資金調達決定の背後にある根拠を完全に説明できない、という重要な議論が提起されている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:48:30 GMT)
From Critique to Clarity: A Pathway to Faithful and Personalized Code Explanations with Large Language Models [3.5]
本稿では、忠実でパーソナライズされたコード説明を生成する革新的なアプローチを提案する。本手法は,プロンプト強化,自己消費機構,パーソナライズされたコンテンツカスタマイズ,外部ツールとのインタラクションを統合した手法である。提案手法は,コード説明の質と関連性を大幅に向上させることが示唆された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:02:04 GMT)
Heuristic-Induced Multimodal Risk Distribution Jailbreak Attack for Multimodal Large Language Models [3.5]
本研究では,HIMRDと呼ばれる2つの要素からなるマルチモーダルジェイルブレイク攻撃手法を提案する。理解促進プロンプトは、MLLMが悪意のあるプロンプトと誘導プロンプトを再構築するのに役立ち、肯定的な出力の可能性を高める。このアプローチはMLLMの脆弱性を効果的に発見し、人気の高い7つのオープンソースMLLMの平均攻撃成功率は90%、人気の高い3つのオープンソースMLLMの平均攻撃成功率は約68%に達する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:20:45 GMT)
Predicting Drug-Gene Relations via Analogy Tasks with Word Embeddings [3.4]
そこで本研究では,BioConceptVecの埋め込みには薬物遺伝子関係に関する情報が含まれており,類似の計算によって薬剤の標的遺伝子を予測することができることを示す。提案手法はGPT-4のような大規模言語モデルに匹敵する薬物遺伝子関係の予測性能を示した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:03:03 GMT)
Characterizing the Yang-Lee zeros of the classical Ising model through the dynamic quantum phase transitions [3.4]
古典的イジングモデルの分割関数は、非エルミート力学におけるロシミット振幅と等価であることを示す。我々の研究は、ヤン=リー零点と非エルミート力学の間の内部接続を明らかにし、前者の動的特徴付けを提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 01:31:46 GMT)
Towards Data Contamination Detection for Modern Large Language Models: Limitations, Inconsistencies, and Oracle Challenges [3.0]
我々は,8つの挑戦的データセットにまたがる4つの最先端LCMを用いた5つの汚染検出手法を評価する。解析の結果,現在の手法は仮定や応用に非自明な制約があることが明らかとなった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:15:26 GMT)
Enhancing Content Representation for AR Image Quality Assessment Using Knowledge Distillation [3.0]
本稿では,拡張現実シナリオの画質評価に特化して設計された,深層学習に基づく客観的指標を提案する。 1)参照画像から顕著な特徴を抽出するための自己教師付き事前学習型視覚変換器の微調整,(2)計算シフト表現による歪みの定量化,(3)知覚品質の特徴を捉えるための横断的アテンションベースのデコーダの活用,(4)正規化技術の統合とラベルスムーズ化によるオーバーフィッティング問題への対処,の4つの重要なステップを含む。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:25:30 GMT)
Image Deraining with Frequency-Enhanced State Space Model [2.9]
本研究では,画像デライニングによる画像デライニングにSSMを導入し,DFSSM(Deraining Frequency-Enhanced State Space Model)を提案する。我々は,複数のカーネルサイズを持つ畳み込みを用いて,様々なスケールの劣化を効果的に捕捉する,新しい混合スケールゲート畳み込みブロックを開発した。合成および実世界の雨天画像データセットの実験により,我々の手法が最先端の手法を超越していることが判明した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:43:12 GMT)
Enhanced Computationally Efficient Long LoRA Inspired Perceiver Architectures for Auto-Regressive Language Modeling [2.9]
Transformer アーキテクチャは自然言語処理分野に革命をもたらし、Large Language Models (LLM) のバックボーンとなっている。 Transformerアーキテクチャの課題の1つは、長いシーケンス長の効率的な処理を禁止する注意機構の二次的な複雑さである。この点において重要な研究の1つは、計算の複雑さを減らしながら優れた性能を示したPerceiverクラスのアーキテクチャである。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:41:38 GMT)
Efficient preparation of the AKLT State with Measurement-based Imaginary Time Evolution [2.6]
本研究では, Affleck-Lieb-Kennedy-Tasaki (AKLT) モデルの基底状態を作成する手法を提案する。提案手法はキュービット型シミュレータと互換性があることを示し,回路再コンパイルにおける変分量子アルゴリズムを用いることで,MITEに必要な測定演算子は回路深度がより浅い回路で十分に近似可能であることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 01:36:15 GMT)
DeMem: Privacy-Enhanced Robust Adversarial Learning via De-Memorization [2.5]
現実のアプリケーションにおける機械学習モデルの信頼性を保証するためには、敵対的堅牢性が不可欠である。従来の研究では、敵の訓練による敵の堅牢性の向上は、プライバシ攻撃に対する脆弱性を高めることが示されている。リスクの高いサンプルを選択的にターゲットとし,プライバシ保護とモデルロバストネスのバランスを向上するDeMemを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:22:58 GMT)
Synthesizing Document Database Queries using Collection Abstractions [2.4]
本稿では,入力出力例から文書データベースクエリを自動的に生成する合成手法を提案する。新しいドメイン固有言語は、代数的なスタイルで文書データベースクエリの代表セットを表現するように設計されている。様々な情報源から110ベンチマークの評価結果から,提案手法が108ベンチマークをうまく合成できることが示唆された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:17:19 GMT)
Dynamics Based Neural Encoding with Inter-Intra Region Connectivity [2.4]
本稿では,ビデオ刺激を用いた視覚野記録について,映像理解モデルの比較に焦点をあてた最初の大規模研究を提案する。映像理解モデルが視覚野の反応を予測する方法について重要な知見を提供する。本稿では,最高の映像理解モデル上に構築されたニューラルエンコーディング方式を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:08:07 GMT)
SurgiTrack: Fine-Grained Multi-Class Multi-Tool Tracking in Surgical Videos [2.4]
この研究は、外科的ツールトラッキングの新しい標準を設定し、最小侵襲の手術に対してより適応的で正確な支援を行うためのダイナミックな軌跡を提供する。本稿では,ツール検出にYOLOv7を活用する新しいディープラーニング手法であるSurgiTrackを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:30:46 GMT)
Accelerating Manufacturing Scale-Up from Material Discovery Using Agentic Web Navigation and Retrieval-Augmented AI for Process Engineering Schematics Design [2.4]
プロセス・フロー・ダイアグラム(PFD)とプロセス・アンド・インスツルメンテーション・ダイアグラム(PID)は産業プロセスの設計、制御、安全性にとって重要なツールである。精密かつ規則に準拠した図の作成は、特に自動化とデジタル化の時代において、材料発見から工業生産へのブレークスルーを拡大する上で、依然として重要な課題である。本稿では,知識獲得と生成を伴う2段階のアプローチを通じて,これらの課題に対処する自律型エージェントフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:36:42 GMT)
Accurate Multi-Category Student Performance Forecasting at Early Stages of Online Education Using Neural Networks [2.2]
本研究では,学生のパフォーマンスを正確に予測できるニューラルネットワークに基づく新しいアプローチを提案する。提案したモデルは、識別、フェイル、パス、ウィズドローのカテゴリでの結果を予測する。その結果,提案手法の予測精度は既存の最先端技術よりも約25%高いことがわかった。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:37:30 GMT)
Quantum Threat in Healthcare IoT: Challenges and Mitigation Strategies [2.2]
IoT(Internet of Things)は医療を変革し、遠隔患者の監視、薬物依存の強化、慢性疾患の管理を促進している。この章では、医療用IoTセキュリティに対する量子脅威について検討し、暗号化の妥協による潜在的影響を強調している。量子後暗号(PQC)と量子鍵分布(QKD)のような量子抵抗技術を導入している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:48:14 GMT)
Consistent Quantum Causes [2.2]
一貫性歴史学のアプローチはそのような理論を提供する。正常に検査された装置が初期の顕微鏡的原因を明らかにするという通常の実験室の直感を正当化する。時間的に可逆な方法での量子情報の議論における量子回路の使用は、初期の原因の適切な同定を防ぐことができる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:52:07 GMT)
Policy-shaped prediction: avoiding distractions in model-based reinforcement learning [2.1]
本研究では,事前訓練されたセグメンテーションモデルの相乗効果,タスク認識の再構築損失,および逆学習により,世界モデルの能力に焦点を合わせる方法を開発した。提案手法は, イントラクタの影響を低減し, 頑健なモデルベース強化学習に向けての進歩である。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:21:37 GMT)
Towards Modeling Human-Agentic Collaborative Workflows: A BPMN Extension [2.0]
大規模言語モデル(LLM)は、自律的なインテリジェントエージェントの定義を促進する。これらのエージェントのオーケストレーションと調整は、いまだに難しい。現在のビジネスプロセスモデリング言語は、これらの新しい混合コラボレーティブなシナリオを規定することに関して不足しています。私たちは、この新しいタイプのワークフローの定義を可能にするために、よく知られたプロセスモデリング言語(BPMN)を拡張します。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:34:30 GMT)
BERTtime Stories: Investigating the Role of Synthetic Story Data in Language pre-training [1.9]
TinyStories を用いた言語事前学習における合成物語データの効果について検討した。 TinyStoriesのサブセット上でGPT-Neoモデルをトレーニングします。 1億語未満の単語にアクセスしても、モデルは与えられたストーリーに対して高品質でオリジナルな補完を生成することができる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:54:01 GMT)
Optimizing Location Allocation in Urban Management: A Brief Review [1.8]
ロケーション割り当て問題は、都市管理におけるデジタルトランスフォーメーションの新たな部分となる可能性がある。既存の基準に基づく正確な位置割り当ての問題は、コスト管理、利益、効率、市民満足度に直接影響する。この分野では、この道を継続し、科学的・実践的な研究を改善するための提言がなされる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:02:40 GMT)
CSG: A Context-Semantic Guided Diffusion Approach in De Novo Musculoskeletal Ultrasound Image Generation [1.7]
CSG(Context-Semantic Guidance)という,スケーラブルなセマンティック・コンテキスト条件生成モデルを提案する。筋骨格(MSK)超音波画像におけるCSGによる所見(病理異常)の生成能力を示す。その結果,CSGが生成した合成画像はセマンティックセグメンテーションモデルの性能を向上し,実画像との類似性を高めた。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:48:09 GMT)
A Linear-Time Algorithm for the Closest Vector Problem of Triangular Lattices [1.6]
従来のCVPアルゴリズムでは$O(n log n)$-timeを必要とするのに対し、CVPアルゴリズムは$O(n log n)$-timeである。さらに改良を行い,$O(n)$-timeアルゴリズムを構築した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:47:49 GMT)
A Dynamic Tree Structure for Hierarchical On-Chain Asset Management [1.6]
Sarvは、デジタル的に表現可能なコンポーネント間の階層的な関係を表現するように設計された、新しいモノリシックなブロックチェーンベースのデータ構造である。当社のアプローチでは,ツリーベースのデータ構造を利用して製品とそのサブコンポーネントを正確に反映し,修正,分解,借用,補修などの機能を実現する。サーヴの特異性は、コンパクトで非モノリシックなアーキテクチャ、不変性、および2層アクション認可スキームにある。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:58:28 GMT)
Graph Dual-stream Convolutional Attention Fusion for Precipitation Nowcasting [1.5]
降水は今,グラフシーケンス問題として再検討する。我々のモデルでは、空間的時間的相互作用に対して異なる注意機構を用いる。融合モジュールは両方のストリームを統合し、空間情報と時間情報を利用して精度を向上させる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:59:41 GMT)
LVS-Net: A Lightweight Vessels Segmentation Network for Retinal Image Analysis [1.3]
本稿では,網膜血管を分割して疾患検出効率を向上させる軽量エンコーダデコーダモデルを提案する。エンコーダにマルチスケールの畳み込みブロックを組み込んで、様々な大きさと厚さの容器を正確に識別する。ダイススコアが86.44%、84.22%、87.88%の既存モデルを上回っている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:21:37 GMT)
Towards AI-$45^{\circ}$ Law: A Roadmap to Trustworthy AGI [1.2]
我々は、信頼できるAGIに向けたバランスのとれたロードマップの指針として、textitAI-textbf$45circ$ Lawを提案する。我々は,Trustworthy AGI の TextitCausal Ladder を実践的なフレームワークとして紹介する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:14:16 GMT)
Depression detection from Social Media Bangla Text Using Recurrent Neural Networks [1.2]
ソーシャルメディア投稿の感情を分析し、社会に対する肯定的、否定的、感情的な行動を検出することができる。感情分析における重要な課題の1つは、精神疾患の根本原因であるソーシャルメディアのテキストから落ち込んだテキストを特定することである。本稿では,抑うつに着目した感情分析を行うために,Facebookのテキストに自然言語処理手法を適用した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:53:51 GMT)
Uncovering Uncertainty in Transformer Inference [1.2]
変換言語モデルにおける反復推論仮説(IIH)について検討する。本研究は, 残留流路に埋没したn番目のトークンが損失減少の軌跡を辿っていることを示すIIHに対する実証的支持を提供する。本稿では,この不確実性を検出するためにクロスエントロピーを利用する手法を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:46:10 GMT)
Implicit Delta Learning of High Fidelity Neural Network Potentials [1.1]
Implicit Delta Learning (IDLe) 法は、高忠実度量子力学(QM)データの必要性を低減する。 IDLeは、最大50倍の高忠実度データを使用しながら、単一の高忠実度ベースラインと同じ精度を達成する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:35:45 GMT)
Mask of truth: model sensitivity to unexpected regions of medical images [1.0]
我々は、胸部X線と眼底画像の分類に畳み込みニューラルネットワーク(CNN)の能力に挑戦する。マスク戦略に関わらず、PadデータセットでトレーニングされたすべてのモデルがランダムにAUC(Area Under the Curve)を得ることができることを示す。また,Chaksuデータセットでは,非バイアスモデルに対する期待値に一致した結果が得られた。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:26:00 GMT)
New Additive OCBA Procedures for Robust Ranking and Selection [1.0]
我々は,限られたサンプリング予算下での不正選択の可能性を最小限に抑えるため,新しい固定予算頑健なR&S手法を開発した。そこで我々は,従来のOCBA法よりも頑健なOCBA法の優越性を検証するため,総合的な数値的研究を行った。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:42:07 GMT)
HiBO: Hierarchical Bayesian Optimization via Adaptive Search Space Partitioning [0.8]
HiBOは,グローバルレベルの検索空間分割情報をローカルBOベースの取得戦略に統合した,新しい階層型アルゴリズムである。一連の評価は、HiBOが高次元の合成ベンチマークにおいて最先端の手法より優れていることを示している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:52:42 GMT)
MCP-MedSAM: A Powerful Lightweight Medical Segment Anything Model Trained with a Single GPU in Just One Day [0.7]
医用画像のセグメンテーションには、解剖学的構造や異常を識別することに焦点を当てて、医療画像を意味のある領域に分割することが含まれる。 Anything Model(SAM)は、様々なタスクのパフォーマンスを改善するために、医学領域に適応するよう研究者に促している。 MCP-MedSAMは、単一のGPU上で1日以内にトレーニングできるように設計された、強力で軽量な医療SAMモデルである。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:50:59 GMT)
Benchmarking foundation models as feature extractors for weakly-supervised computational pathology [0.6]
肺, 大腸癌, 胃癌, 乳癌13例の病理組織学的基盤モデルを用いて, 6,818例, 9,528例の病理組織学的検討を行った。視覚言語基礎モデルであるCONCHは、視覚のみの基礎モデルと比較して最高性能を示し、Virchow2は第2位である。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:59:11 GMT)
Fairness in Computational Innovations: Identifying Bias in Substance Use Treatment Length of Stay Prediction Models with Policy Implications [0.5]
予測機械学習(英: Predictive Machine Learning, ML)は、医学的意思決定を強化する計算技術である。しかし、社会的バイアスはそのようなモデルにエンコードすることができ、不利なグループの健康結果に不注意に影響を及ぼす懸念を提起する。この問題は、物質使用障害(SUD)の治療の文脈において特に重要であり、予測モデルのバイアスは、非常に脆弱な患者の回復に大きな影響を及ぼす可能性がある。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:47:23 GMT)
Overcoming the Thermal-Noise Limit of Microwave Measurements by Pre-cooling with an Active Cold Load [0.3]
本稿では,マイクロ波空洞の電磁モードを占有する劣化熱光子の大部分が,測定を行う直前に除去する「アクティブ予冷却(APC)」法を提案する。この負荷は商業用低雑音増幅器(LNA)の入力の形を取る。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:28:13 GMT)
FedRBE -- a decentralized privacy-preserving federated batch effect correction tool for omics data based on limma [0.3]
FedRBEはlimmaの removeBatch メソッドのフェデレーションである。 FedRBEは、欠落した値のデータを効果的に処理し、自動化されたユーザフレンドリなオンラインユーザインターフェースを提供する。我々は,シミュレーションおよび実オミクスデータに基づいて,フェドRBEアルゴリズムの評価を行い,非無視差のある集中型手法に匹敵する性能を実現した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:23:31 GMT)
Securing Proof of Stake Blockchains: Leveraging Multi-Agent Reinforcement Learning for Detecting and Mitigating Malicious Nodes [0.3]
MRL-PoS+は、PoSブロックチェーンのセキュリティを強化するための新しいコンセンサスアルゴリズムである。 MRL-PoS+は,PoSブロックチェーンの攻撃レジリエンスを著しく向上することを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:52:34 GMT)
Impact of Conflicting Transactions in Blockchain: Detecting and Mitigating Potential Attacks [0.3]
ブロックチェーンネットワーク内のトランザクションの競合は、パフォーマンス上の問題を引き起こし、セキュリティ上の脆弱性を導入する。我々はこれらの攻撃を緩和するための一連の対策を提案する。私たちの発見は、ブロックチェーンのセキュリティとパフォーマンスを強化するために、競合するトランザクションを積極的に管理することの重要性を強調しています。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:57:38 GMT)
Cloud Platforms for Developing Generative AI Solutions: A Scoping Review of Tools and Services [0.3]
Generative AIは、機械がコンテンツ、コード、デザインを作成できるようにすることで、エンタープライズアプリケーション開発を変革している。クラウドコンピューティングは、生成AIモデルをトレーニング、デプロイ、スケールするためのインフラストラクチャを提供することによって、これらのニーズに対処する。このレビューでは、生成AIのためのクラウドサービスを調べ、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud、IBM Cloud、Oracle Cloud、Alibaba Cloudといった主要なプロバイダに焦点を当てている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:49:07 GMT)
Quantum tomography of a third-order exceptional point in a dissipative trapped ion [0.2]
非エルミタン吸収分光法を用いてパリティ時間対称性破砕誘起3次例外点を実験的に観察した。クエンチ力学によるパリティ時間対称性の破れに付随する本質的な3階リウヴィリア特異点を同定する。我々の実験は、2段階以上の非エルミート現象を観測するために拡張することができ、量子情報技術に応用できる可能性がある。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:33:54 GMT)
State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features [0.2]
そこで我々は,3つの深層学習手法を開発し,セグメンテーションと軌道周辺距離予測を行った。また, 疾患分類における眼窩周囲距離の有用性についても検討した。我々は、オープンソースの健康な目で訓練されたモデルを用いて、病気の目で堅牢なセグメンテーションを実現することができることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:12:58 GMT)
Experimenting with Multi-modal Information to Predict Success of Indian IPOs [0.2]
我々は、IPOが成功するかどうかを推定するための機械学習と自然言語処理に基づくアプローチについて説明する。我々は、IPO申請書、マクロ経済要因、市場条件、Grey Market Price等に記載されたさまざまな事実がIPOの成功に与える影響を幅広く研究してきた。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:11:55 GMT)
ProtGO: A Transformer based Fusion Model for accurately predicting Gene Ontology (GO) Terms from full scale Protein Sequences [0.1]
本稿では,遺伝子オントロジーの用語をフルスケールのタンパク質配列から予測できるトランスフォーマーベースの融合モデルを提案する。このモデルは、酵素の構造内の短期的および長期的依存関係の両方を理解することができ、様々なGO用語に関連するモチーフを正確に識別することができる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:09:45 GMT)
KITE-DDI: A Knowledge graph Integrated Transformer Model for accurately predicting Drug-Drug Interaction Events from Drug SMILES and Biomedical Knowledge Graph [0.1]
薬物と薬物の相互作用(DDI)は、身体の損傷や死に至ることがある。 DDIイベントを予測するための現代の研究は、バイオメディカル知識グラフ(KG)または薬物SMILESの情報に依存する。本研究では,エンドツーエンドの完全自動機械学習パイプラインを生成するために,KG統合トランスフォーマーアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 00:49:57 GMT)
Automated Extraction and Creation of FBS Design Reasoning Knowledge Graphs from Structured Data in Product Catalogues Lacking Contextual Information [0.1]
オントロジーに基づく知識グラフ(KG)は,様々な意思決定シナリオにおいて,効果的な知識管理と再利用が望ましい。 KGの自動抽出と生成に関するほとんどの研究は、広範囲な非構造化データセットに基づいている。本研究は,このギャップに対処するために開発された手法とデジタルワークフローについて報告する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 09:20:25 GMT)
siForest: Detecting Network Anomalies with Set-Structured Isolation Forest [0.0]
現代のサイバーセキュリティシステムは、数十億の日々のネットワークインタラクションを分析し、潜在的な脅威を特定するという課題に直面している。本稿では,インターネットスキャンデータ中の異常を検出するために,アイフォレスト(iForest)機械学習アルゴリズムのバリエーションについて検討する。特に、設定されたデータの異常を検出するiForestメソッドの新たな拡張であるSet-Partitioned isolated Forest(siForest)を提示する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 18:18:40 GMT)
doScenes: An Autonomous Driving Dataset with Natural Language Instruction for Human Interaction and Vision-Language Navigation [0.0]
doScenesは、人間と車両の命令インタラクションの研究を促進するために設計された、新しいデータセットである。 DoScenesは命令と駆動応答のギャップを埋め、コンテキスト認識と適応計画を可能にする。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:16:47 GMT)
Trust No AI: Prompt Injection Along The CIA Security Triad [0.0]
本稿では,著者が実施・公表した研究に基づいて,実世界の活用事例と概念実証事例をまとめた。これは、即時注射がCIAのトリアドを損なうことを示し、サイバーセキュリティとAIシステム全般に継続的なリスクをもたらしている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:46:30 GMT)
TrojanForge: Generating Adversarial Hardware Trojan Examples Using Reinforcement Learning [0.0]
ハードウェアトロイの木馬問題は、攻撃者とディフェンダーの間の連続したゲームと考えることができる。機械学習は近年、HT研究の進展において重要な役割を担っている。 TrojanForgeはHT検出器を倒す敵の例を生成する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:10:15 GMT)
Trade-off relations between Bell nonlocality and local Kochen-Specker contextuality in generalized Bell scenarios [0.0]
これら2つのリソースのそれぞれに任意の量が存在するはずがないことを示す。グローバルな文脈性の概念の観点から、どのように理解できるかについて議論する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:00:56 GMT)
Towards Modeling Data Quality and Machine Learning Model Performance [0.0]
距離-雑音比 (SNR) で精度がどう変化するか, モデルの性能を決定するためにDDR精度曲線をどう使うかを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:15:10 GMT)
Thermal Image-based Fault Diagnosis in Induction Machines via Self-Organized Operational Neural Networks [0.0]
誘導機のコンディションモニタリングは、コストのかかる中断や機器の故障を防止するために不可欠である。本研究では,2次元自己組織型オペレーショナルニューラルネットワーク(Self-ONNs)を用いて,リスケージ誘導電動機の熱画像から不正やローターの故障を診断する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:37:23 GMT)
The AI Double Standard: Humans Judge All AIs for the Actions of One [0.0]
AIが増殖するにつれて、あるAIに対する道徳的な態度が他のAIに対する態度に流出することで、知覚が絡まってしまう可能性がある。我々は、2つの事前登録された実験において、AIや人間のエージェントの一見有害で不道徳な行動が、他のAIや人間に対する態度にどのように影響するかをテストした。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:26:52 GMT)
Stochastic Gradient Descent Revisited [0.0]
勾配降下(SGD)は、機械学習における非勾配収束問題のアルゴリズムである。本稿では、全範囲収束理論を示し、速度と複雑さを提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:15:08 GMT)
SLEGO: A Collaborative Data Analytics System with LLM Recommender for Diverse Users [0.0]
SLEGOは、経験豊富な開発者と初心者のギャップを埋める、共同分析プラットフォームである。これにより、開発者は分析ツールを共有できると同時に、初心者のユーザはプログラミングスキルを使わずに包括的な分析パイプラインを構築することができる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:49:43 GMT)
Risk factor identification and classification of malnutrition among under-five children in Bangladesh: Machine learning and statistical approach [0.0]
本研究では,5歳未満の子どもの栄養失調の原因について,MICS 2019(Multiple Indicator Cluster)の全国調査から解明することを目的とした。決定木(DT)、ランダムフォレスト(RF)、サポートベクトルマシン(SVM)、マルチレイヤパーセプトロン(MLP)ニューラルネットワークの4つの確立された機械学習アルゴリズムに基づいて、さまざまな栄養失調ステージを分類する。統計的ピアソン相関係数分析は、子供の栄養失調に関連する重要な要因を理解するためにも行われる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 04:50:23 GMT)
Reinforcement Learning for a Discrete-Time Linear-Quadratic Control Problem with an Application [0.0]
強化学習(RL)を用いた離散時間線形四分法(LQ)制御モデルについて検討する。探索コストを測定するためにエントロピーを用いることで、問題の最適フィードバックポリシーはガウス型でなければならないことを示す。次に、離散時間LQモデルの結果を適用し、離散時間平均分散資産-信頼性管理問題を解き、RLアルゴリズムのポリシー改善と収束性を証明する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:55:13 GMT)
Quantum Pair State Transfer on Isomorphic Branches [0.0]
ハイゼンベルク$XY$ハミルトニアンによって支配される等型分岐を持つ量子ネットワークにおけるある種のペア状態の進化は、局所構造にのみ依存する。結果は、パス、サイクルなど、さまざまなグラフにおけるペア状態移動の存在を明らかにするために使用される。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:01:13 GMT)
Pre-trained protein language model for codon optimization [0.0]
オープンレディングフレーム(ORF)配列のコドン最適化はmRNAワクチンにおけるmRNA安定性と発現の増強に不可欠である。本研究では,コドン最適化に利用可能なアミノ酸の表現に,事前学習されたタンパク質言語モデル(PPLM)を用いることを検討した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 03:01:38 GMT)
Paddy Disease Detection and Classification Using Computer Vision Techniques: A Mobile Application to Detect Paddy Disease [0.0]
植物病は食料供給に大きな影響を与え、農家、農業に依存した経済、世界の食料安全保障に問題を引き起こします。農業技術の発展にもかかわらず、正確な早期診断は依然として課題である。ディープラーニングのアプリケーションは、植物病理学者を必要とせずに、病気を正確に識別するのに役立つ。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:08:27 GMT)
Over-rotation coherent error induced by pseudo-twirling of quantum gates [0.0]
コヒーレンスエラーは、量子コンピューティングのスケーラビリティにとって重要な課題である。多ビット非クリフォードゲートにおけるコヒーレントエラーを処理するための擬似ツイリング(PST)と呼ばれるフレームワークが導入された。既存のPST理論に対する高次補正が過剰回転コヒーレント誤差をもたらすことを解析的に示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:35:52 GMT)
Order Theory in the Context of Machine Learning: an application [0.0]
関連するポリトープが順序ポリトープであるニューラルネットワークについて検討する。提案手法は,畳み込みフィルタを2時間2ドルと解釈できるニューラルネットワークをいかに誘導するかを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:57:41 GMT)
Optimal partition of feature using Bayesian classifier [0.0]
ネイブベイズでは、特定の特徴は独立特徴と呼ばれ、分類を予測する際に条件付き相関や依存を持たない。本研究では,Naive Bayes法がもたらす課題を克服する手法として,Comonotone-Independence (CIBer)を提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:04:23 GMT)
On Diffusion Posterior Sampling via Sequential Monte Carlo for Zero-Shot Scaffolding of Protein Motifs [0.0]
そこで本研究では,足場作業の記述と解決のためのガイダンスを新たに導入する。シングルモチーフとマルチモチーフの問題の解決に成功しました。この研究は、モチーフ足場作業におけるゼロショット後部サンプリング器の改良能力と領域を強調した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:38:59 GMT)
Nonlocal coherent states in an infinite array of boson sites [0.0]
正則コヒーレント状態(英: regular coherent state, CS)は、単一部位に置かれたボソン粒子の特別な種類の量子状態である。この研究では、後者のケースを解く数学的に厳密な構成を実証する。結果として生じる非局所コヒーレント状態(NCS)は、無限配列のフォック空間で作用する無限に多くの消滅作用素の全てに対して同時に固有である。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 16:48:54 GMT)
Noise-induced quantum-circuit refrigeration [0.0]
室温で発生する雑音は、共振器フォック状態の熱分布につながることを示す。これらの観測は、純粋に熱で駆動される量子回路冷凍機への道を開く。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:37:15 GMT)
Network analysis of the Danish bicycle infrastructure: Bikeability across urban-rural divides [0.0]
我々はデンマークの自転車網を分析し、約43,000km2と約6mioの住民をカバーしている。この国は低ストレスのインフラを多く持っているが、分布は不均一である。低ストレスのインフラの断片化は、高い交通負荷に耐えられないサイクリストにとって、低モビリティをもたらす。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:11:24 GMT)
Model Contribution Rate Theory: An Empirical Examination [0.0]
本稿では,ソフトウェア開発者の生産性を定量的に分析する手法として,コントリビューション率の指標を精査し,意味のある開発努力と異常を区別する手法を提案する。この発見は、現代のソフトウェアエンジニアリングプラクティスにおけるチームのパフォーマンスとワークフロー管理を最適化するための実用的な洞察を提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:56:23 GMT)
Measuring Grammatical Diversity from Small Corpora: Derivational Entropy Rates, Mean Length of Utterances, and Annotation Invariance [0.0]
文法の導出エントロピーと、それが生成する発話の平均長は、基本的にリンクされていることを示す。 MLUは単なるプロキシではなく、統語的多様性の基本的な尺度であるということを実証します。導出エントロピー率(英: derivational entropy rate)は、異なる文法的アノテーションフレームワークが木バンクの文法的複雑さを決定する速度を指標とする。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:54:57 GMT)
Materials-Discovery Workflows Guided by Symbolic Regression: Identifying Acid-Stable Oxides for Electrocatalysis [0.0]
本研究では,真独立性スクリーニングとスペーサー化演算子(SISSO)のシンボリック・レグレッション・アプローチに基づくALワークフローを開発する。我々は、平均予測とその不確実性を定量化するためにSISSOモデルのアンサンブルを訓練し、アクティブラーニングにおけるSISSOの使用を可能にする。高品質DFT-HSE06計算を用いて酸性安定酸化物を分離し,SISSO誘導ALワークフローを実証した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:09:15 GMT)
Learning Cluster Representatives for Approximate Nearest Neighbor Search [0.0]
この論文はクラスタリングに基づく近似近傍探索の包括的説明を提供する。また、新しい最先端の手法のあらゆる側面を紹介し、掘り下げます。この直感の発達と,それを内積探索の最大化に適用することにより,単純な線形関数を用いた学習クラスタ代表がクラスタリングに基づく近接探索の精度を大幅に向上させることを示した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:31:32 GMT)
Investigating the Role of Quantum Entanglement in Heavy Ion Collisions through Elliptic Flow [0.0]
本稿では、重イオン衝突における初期異方性と最終状態運動量異方性の関係について検討する。重イオン衝突における熱化に関する以前の研究に基づいて、Pb-PbおよびXe-Xe衝突における$v$の$p_T$依存性まで解析を拡張した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:51:54 GMT)
Interpretation of wave function by coherent ensembles of trajectories [0.0]
量子力学における波動関数のアンサンブル解釈を改訂する。時空における量子軌道のアンサンブルのコヒーレンス(自動一致)を導入する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:55:19 GMT)
Infusing Prompts with Syntax and Semantics [0.0]
本研究では,多種多様な構文情報や意味情報を大規模言語モデルに直接注入する効果を解析する。言語分析によって言語モデルが大幅に向上し、これまでの最高のシステムを超えている点が示される。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 23:49:38 GMT)
Information Seeking and Communication among International Students on Reddit [0.0]
本研究では,新型コロナウイルスのパンデミックが留学生の情報探索行動に与える影響について検討した。本研究は,パンデミック期間中に複数の質問を投稿するユーザ数が著しく増加したことを示唆している。繰り返し質問をする人はコミュニケーションに積極的に関与し、知識の継続的な追求を示唆している。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 21:48:55 GMT)
Incentivized Symbiosis: A Paradigm for Human-Agent Coevolution [0.0]
我々は、人間とAIエージェントの両方に対してルール、インセンティブ、結果を定義し、強制するために、Web3原則にインスパイアされた新しい道徳的枠組みを提案する。我々の研究は、AIエージェントが人間と共進化して、共有的で持続可能な進歩の軌跡を形作る方法を示す、インセンティブ付き共生のいくつかの変革的応用を横切る。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:23:48 GMT)
Homeostasis and Sparsity in Transformer [0.0]
本稿では, RFB-kWTA や Smart Inhibition などのホメオスタシス機構をトランスの注意機構やトランスの出力に応用することを提案する。提案手法は,従来の変圧器0.2768BLEUと,変圧器ブロック0.3007BLEUのアテンション機構と出力にのみ適用可能なモデルとを著しく上回っている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 13:24:31 GMT)
Hilbert-Space Ergodicity in Driven Quantum Systems: Obstructions and Designs [0.0]
時間依存ハミルトニアンを持つ閉系に対する量子エルゴード性の概念を研究する。統計的擬似ランダム性は、単一周波数で駆動される量子システムによって既に達成可能であることを示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:52:48 GMT)
Heat current and fluctuations between a dissipative qubit and a monitor under continuous measurement and feedback [0.0]
連続的な量子測定とフィードバックは、定常状態であっても、キュービットとモニターの間の熱交換を誘導する。これらのプロセスによって誘導されるクビット冷却を実証する。この結果は,連続測定とフィードバックによって制御される量子冷凍機の開発に潜在的な応用をもたらす。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:52:24 GMT)
GD-VAEs: Geometric Dynamic Variational Autoencoders for Learning Nonlinear Dynamics and Dimension Reductions [0.0]
我々は、観測から非線形力学の同相表現を学習するためのデータ駆動手法を開発した。このアプローチは、一般多様体ラテント空間の力学の非線形状態空間モデルを学ぶ。パラメータ化されたPDEと物理における問題に動機付けられ, 縮小次元表現の学習タスクにおける手法の性能について検討した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 03:01:40 GMT)
Evolving Algebraic Multigrid Methods Using Grammar-Guided Genetic Programming [0.0]
文法規則を用いて任意の形状のサイクルを生成し、スムーズさと緩和重量を独立に選択する。これらの柔軟なサイクルは、文法規則の助けを借りて代数的マルチグリッド(AMG)法で使われ、遺伝的プログラミングを用いて最適化される。最適化された柔軟なサイクルは、標準的なサイクルタイプよりも高い効率と優れたパフォーマンスを提供する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:21:35 GMT)
Ethnography and Machine Learning: Synergies and New Directions [0.0]
この章は、エスノグラフィーと機械学習が有用に組み合わせられると主張する、成長する奨学金の体系に基づいている。具体的には、特定のタイプのプロジェクトに対して、定性的なフィールド研究とともに機械学習を使うことの価値(および課題)を説明する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:28:05 GMT)
Electricity Price Prediction Using Multi-Kernel Gaussian Process Regression combined with Kernel-Based Support Vector Regression [0.0]
本稿では,ドイツの電力価格を予測するためのハイブリッドモデルを提案する。このアルゴリズムはガウス過程回帰(GPR)とサポート回帰ベクトル(SVR)を組み合わせたものである。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:19:30 GMT)
Doubly Quantum Mechanics [0.0]
我々は、空間回転群のSU(2)$を量子群$SU_q(2)$に昇格させることにより、スピン=$frac12$測定の定式化を開発する。確率測定は、これらの構成において、$SU_q(2)$の量子的性質から生じる本質的な不確実性によって影響を受ける。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:10:35 GMT)
Domain-Specific Translation with Open-Source Large Language Models: Resource-Oriented Analysis [0.0]
オープンソースの自己回帰型デコーダ専用大言語モデル(LLM)のドメイン固有翻訳性能とタスク指向機械翻訳(MT)モデルとの比較を行った。実験では,医学領域に焦点をあて,英語とフランス語,英語とポルトガル語,英語とスワヒリ,スワヒリと英語の4つの言語ペアについて検討した。 NLLB-200 3.3Bは、医学翻訳における8Bパラメータの範囲で、全てのLLMを上回ります。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:54:13 GMT)
Differentiation of Linear Optical Circuits [0.0]
本稿では、線形光回路の解析勾配を評価するための古典的および量子的アルゴリズムを開発する。実測統計学で生じる「相互作用しない」の観測可能な特別なクラスの期待値の勾配を計算する方法を示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 22:30:30 GMT)
Development of Neural Network-Based Optimal Control Pulse Generator for Quantum Logic Gates Using the GRAPE Algorithm in NMR Quantum Computer [0.0]
一般的な単一量子論理ゲートに対して最適な制御パルスを生成するニューラルネットワークを導入する。ニューラルネットワークを利用することで、妥当な時間スケールで、任意の単一量子ビット量子論理ゲートを効率的に実装できる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 08:31:55 GMT)
Consciousness-Centered Ontology of Relational Quantum Dynamics (RQD) [0.0]
量子ダイナミクスは、量子理論と時空、観測者、意識との相互作用を再定義する。 RQDは、量子力学、重力、意識が単一の統合現実の面であることを明らかにしている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 15:57:31 GMT)
Comparative Study of Causal Discovery Methods for Cyclic Models with Hidden Confounders [0.0]
我々は、サイクルと隠れた共同設立者を持つことが許される疎線形モデルの因果発見の問題に焦点をあてる。我々は4つの因果発見技術に関する包括的かつ徹底的な比較研究を準備した。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 06:40:44 GMT)
Comb Tensor Networks vs. Matrix Product States: Enhanced Efficiency in High-Dimensional Spaces [0.0]
コーム型テンソルネットワークアーキテクチャにより,MPSよりも効率的な収縮が得られることを示す。この結果から,MPSからコムテンソルネットワークへ遷移する連続的および高次元データ分布は,精度を保ちながら計算オーバーヘッドを大幅に減少させる可能性が示唆された。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 20:28:49 GMT)
Classifier-free guidance in LLMs Safety [0.0]
本稿では,修正型分類器フリーガイダンスによって強化された推論を用いたORPO強化学習法を用いて,保持データセットのないLLMアンラーニングについて述べる。この記事は、NeurIPS 2024 LLM-PC 提出の延長版であり、第2位に贈られた。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 02:11:33 GMT)
Characterizing Jupiter's interior using machine learning reveals four key structures [0.0]
木星の内部構造は、NASAのジュノーミッションによる正確な重力場の測定、ガリレオの大気データ、ボイジャーの電波観測によって制限されている。我々は,CMS法に基づく深層学習モデルを用いて,幅広い内部モデルを探索する。木星の内部は、4つの特徴的な構造を明確に区別する2つの効果的なパラメータによって説明できる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 11:22:29 GMT)
Binary Feature Mask Optimization for Feature Selection [0.0]
モデルの結果を考慮した特徴を選択する新しいフレームワークを提案する。機械学習モデルの予測を用いてマスク演算子を得る。実生活データセットの大幅な性能向上を示す。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:49:50 GMT)
Automatic Organization of Neural Modules for Enhanced Collaboration in Neural Networks [0.0]
本研究はニューラルネットワーク(NN)の構造に関する新しい視点を提案する。伝統的なNNは通常、便利な木のような構造である。我々は,ニューラル・モジュールというニューラル・ユニットを編成する新しい方法を確立するために,同期グラフに基づく構造を導入する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:05:58 GMT)
Are intrinsic decoherence models physical theories? [0.0]
量子力学における測定問題を解くために,固有デコヒーレンスモデル (IDMs) が提案されている。本研究では,これらのモデルのうち2つの状態を物理理論として評価し,パラメータの推定可能性の究極的境界を確立する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 10:46:57 GMT)
AI-Enhanced Decision-Making for Sustainable Supply Chains: Reducing Carbon Footprints in the USA [0.0]
本研究は, 炭素フットプリントに特化して, 持続可能なサプライチェーンの意思決定を支援する方法について論じる。この論文は、米国における持続可能なサプライチェーンの実践を促進するためのAI駆動ソリューションの実装に関する課題と機会についてレビューする。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 19:47:15 GMT)
A brief introduction to the diffusion Monte Carlo method and the fixed-node approximation [0.0]
量子モンテカルロ法(Quantum Monte Carlo, QMC)は、複雑な量子多体問題に対処するための強力な計算技法のファミリーである。本稿では,拡散モンテカルロ法(DMC)について紹介する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:36:04 GMT)
A Web-Based IDE for DevOps Learning in Software Engineering Higher Education [0.0]
本稿では,大学カリキュラムにおけるDevOps学習の促進を目的とした,革新的なオンライン統合開発環境(IDE)を提案する。考案されたツールは、標準化された、アクセス可能な学習環境を提供し、デファナとエンゲージメントチュートリアルを備えている。研究結果は、学生の間で、セルフペースト学習アプローチに対する顕著な嗜好を浮き彫りにしている。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 12:29:08 GMT)
A Cross-Validation Study of Turkish Sentiment Analysis Datasets and Tools [0.0]
この研究は、トルコ語における感情分析のより微妙な理解を促進する。トルコにおける10年以上にわたるこの分類に基づく感情分析データセットの地図を提供する。これらのデータセット上で最先端の感情分析ツールを実行し、人気のあるトルコの感情データセットのパフォーマンスを分析しました。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 14:59:21 GMT)
A Collaborative Multi-Agent Approach to Retrieval-Augmented Generation Across Diverse Data [0.0]
Retrieval-Augmented Generation (RAG)はLarge Language Models (LLM)を強化する従来のRAGシステムでは、クエリ生成、データ検索、レスポンス合成に単一エージェントアーキテクチャを使用するのが一般的である。本稿では,これらの制約に対処するマルチエージェントRAGシステムを提案する。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 07:18:19 GMT)
1-800-SHARED-TASKS at RegNLP: Lexical Reranking of Semantic Retrieval (LeSeR) for Regulatory Question Answering [0.0]
本稿では,Cling 2025 RegNLP RIRAG (Regulatory Information Retrieval and Answer Generation) の課題について述べる。我々は,規制領域における高度な情報検索と回答生成技術を活用している。検索には、0.8201のリコール@10と0.6655のmap@10の新たなアプローチであるLeSeRを用いる。
論文参考訳（メタデータ） (Sun, 08 Dec 2024 17:53:43 GMT)