Movie Gen: A Cast of Media Foundation Models [133.4] 高品質の1080pHDビデオを生成する基礎モデルのキャストであるMovie Genについて紹介する。
ユーザの画像に基づいて,高精度な命令ベースのビデオ編集やパーソナライズされたビデオの生成などの追加機能を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:22:46 GMT)
Harnessing Webpage UIs for Text-Rich Visual Understanding [112.0] テキストベース大規模言語モデル(LLM)を用いたWebページUIからの汎用マルチモーダル命令の合成を提案する。
これらの命令はUIスクリーンショットと組み合わせて、マルチモーダルモデルのトレーニングを行う。
我々は、100万のWebサイトから730万のサンプルを含むデータセットであるMultiUIを紹介し、多様なマルチモーダルタスクとUIレイアウトをカバーした。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:48:54 GMT)
FlashTex: Fast Relightable Mesh Texturing with LightControlNet [105.5] ControlNetアーキテクチャに基づいた新しいテキスト・ツー・イメージモデルであるLightControlNetを紹介した。
本手法は, メッシュを任意の照明環境下で適切に切断し, レンダリングできるように, 結果として生じるテクスチャの材質/反射率を下げるためのものである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:45:06 GMT)
Cliqueformer: Model-Based Optimization with Structured Transformers [102.6] 我々は、MBOタスクの構造を学習し、経験的に改良された設計につながるモデルを開発する。
我々はCliqueformerを、高次元のブラックボックス機能から、化学・遺伝設計の現実的なタスクまで、様々なタスクで評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:35:47 GMT)
Exploring the Design Space of Visual Context Representation in Video MLLMs [102.1] ビデオマルチモーダル大言語モデル(MLLM)は、様々な下流タスクでビデオセマンティクスを理解する際、顕著な能力を示した。
ビジュアルコンテキスト表現は、ビデオからフレームを選択し、フレームからトークンを更に選択するスキームを指す。
本稿では,視覚的文脈表現のための設計空間について検討し,より効率的な表現方式を見出すことにより,映像MLLMの性能向上を目指す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:59:52 GMT)
MACAROON: Training Vision-Language Models To Be Your Engaged Partners [95.3] 大規模視覚言語モデル(LVLM)は、質問が曖昧でラベルが付されていない場合でも詳細な応答を生成する。
本研究では,LVLMを受動的回答提供者から積極的参加パートナーへ移行することを目的とする。
我々は、LVLMに対して、ラベルなし質問に対するコントラスト応答対を自律的に生成するように指示する、ContrAstive pReference Optimizationのための自己iMaginAtionであるMACAROONを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:12:50 GMT)
DepthSplat: Connecting Gaussian Splatting and Depth [90.1] 本稿では,ガウススプラッティングと深さ推定を結合するDepthSplatを提案する。
まず,事前学習した単眼深度特徴を生かして,頑健な多眼深度モデルを提案する。
また,ガウス的スプラッティングは教師なし事前学習の目的として機能することを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:58 GMT)
GeoCalib: Learning Single-image Calibration with Geometric Optimization [89.8] 単一の画像から視覚的な手がかりは、焦点距離や重力方向などの内在的および外在的なカメラパラメータを推定するのに役立ちます。
この問題に対する現在のアプローチは、行と消滅点を持つ古典幾何学か、エンドツーエンドで訓練されたディープニューラルネットワークに基づいている。
最適化プロセスを通じて3次元幾何学の普遍的な規則を利用するディープニューラルネットワークであるGeoCalibを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:14:12 GMT)
$γ-$MoD: Exploring Mixture-of-Depth Adaptation for Multimodal Large Language Models [87.4] 我々は既存のMLLMに対して$gamma$-MoDという革新的な戦略を提案する。
$gamma$-MoD では、MLLM における MoD の展開を導くための新しい計量法が提案されている。
MLLMの計算空間を最大化する2つの新しい設計法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:53 GMT)
Human Action Anticipation: A Survey [86.4] 行動予測に関する文献は、行動予測、活動予測、意図予測、目標予測など、様々なタスクにまたがる。
我々の調査は、この断片化された文献を結びつけることを目的としており、最近の技術革新とモデルトレーニングと評価のための新しい大規模データセットの開発をカバーしています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:37:40 GMT)
MotionBank: A Large-scale Video Motion Benchmark with Disentangled Rule-based Annotations [85.9] 我々は、13の動画アクションデータセット、1.24Mのモーションシーケンス、132.9Mの自然な、多様な人間のモーションフレームからなるMotionBankを構築した。
私たちのMotionBankは、人間のモーション生成、モーションインコンテキスト生成、そしてモーション理解といった、一般的なモーション関連タスクに役立ちます。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:31:24 GMT)
MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs [81.0] 大規模言語モデル(LLM)は、高い精度で算術語問題を解くことができるが、訓練された言語よりも複雑な問題にどのように一般化するかは、ほとんど分かっていない。
本研究では、任意に複雑な算術証明を持つ問題に対してLLMを評価するためのフレームワーク、MathGAPを提案する。
テストされたモデルのうち、ほとんどのモデルでは、証明がより深く、より広くなるにつれて、パフォーマンスが著しく低下していることが分かりました。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:48:14 GMT)
RAG-DDR: Optimizing Retrieval-Augmented Generation Using Differentiable Data Rewards [78.7] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLMs) における幻覚を緩和する効果を証明している。
現在のアプローチでは、命令チューニングを使用してLLMを最適化し、検索した知識を活用する能力を改善している。
本稿では,異なるRAGモジュール間でデータ嗜好を整列させることでRAGシステムを訓練するDDR法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:53:29 GMT)
Active-Dormant Attention Heads: Mechanistically Demystifying Extreme-Token Phenomena in LLMs [77.7] 実践者は変圧器に基づく大言語モデルにおいて、3つのパズリング現象を一貫して観察してきた。
これらの現象は、ある種のいわゆる「シンクトークン」が不当に高い注意重みを負っているのが特徴である。
極端トーケン現象のメカニズムを解明する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:54:06 GMT)
Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.5] 変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:30:27 GMT)
Understanding and Mitigating Language Confusion in LLMs [77.0] 我々は,既存の英語および多言語プロンプトを用いた15の型的多様言語の評価を行った。
Llama Instruct と Mistral のモデルでは,言語的混乱の度合いが高いことがわかった。
言語混乱は,数発のプロンプト,多言語SFT,選好調整によって部分的に緩和できることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:57:10 GMT)
FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Model [76.8] textbfFlexible Vision Transformer (FiT) は、テキスト非制限解像度とアスペクト比で画像を生成するために設計されたトランスアーキテクチャである。
FiTv2は、高度なトレーニングフリーな外挿技術を導入する際に、FiTの収束速度を2倍に向上させる。
総合的な実験は、FiTv2の幅広い解像度での異常な性能を実証している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:51:49 GMT)
A Theory for Token-Level Harmonization in Retrieval-Augmented Generation [76.8] Retrieval-augmented Generation (RAG)は、検索したテキストを利用して大規模言語モデル(LLM)を強化する。
本稿では,RAGの利益と有害性を説明するための理論を提供する。
提案手法は,本理論に基づいて,純粋LLMとRAGの協調生成を実現する実用的手法であるTok-RAGを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:15:11 GMT)
K-Level Reasoning: Establishing Higher Order Beliefs in Large Language Models for Strategic Reasoning [76.3] マルチエージェント環境で戦略を動的に適応させるためには、LLM(Large Language Model)エージェントが必要である。
我々は,「K-Level Reasoning with Large Language Models (K-R)」という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:08:15 GMT)
DPLM-2: A Multimodal Diffusion Protein Language Model [76.0] DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:20:24 GMT)
Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.9] 我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:25:06 GMT)
Adversarial Exposure Attack on Diabetic Retinopathy Imagery Grading [75.7] 糖尿病網膜症(DR)は、世界中の視覚障害の主要な原因である。
診断を助けるために、多くの最先端の作業が強力なディープニューラルネットワーク(DNN)を構築し、網膜基底画像(RFI)を介してDRを自動的にグレードする。
RFIは一般的に、不正グレードにつながる可能性のあるカメラ露出の問題によって影響を受ける。
本稿では,敵攻撃の観点からこの問題を考察する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:30:22 GMT)
L3DG: Latent 3D Gaussian Diffusion [74.4] L3DGは3次元ガウス拡散定式化による3次元ガウスの3次元モデリングのための最初のアプローチである。
我々は、部屋の大きさのシーンで効率的に操作するために、スパース畳み込みアーキテクチャーを用いている。
3Dガウス表現を利用することで、生成されたシーンを任意の視点からリアルタイムでレンダリングすることができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:19:32 GMT)
Aggregation Artifacts in Subjective Tasks Collapse Large Language Models' Posteriors [74.0] In-context Learning (ICL) は、Large Language Models (LLM) を用いた自然言語処理の主要な手法となっている。
本研究は,低アグリゲーション,異質なアノテーションを組み合わせたアグリゲーションの結果が,プロンプトに有害なノイズを生じさせるアノテーションのアーティファクトに繋がるかどうかを考察する。
この結果から,アグリゲーションは主観的タスクのモデル化において不明瞭な要因であり,代わりに個人をモデリングすることを重視することが示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:16:00 GMT)
Failing Forward: Improving Generative Error Correction for ASR with Synthetic Data and Retrieval Augmentation [73.9] 生成誤差補正モデルは、トレーニング中に発生する特定の種類のエラーを超えて一般化することが困難であることを示す。
DARAGは、ドメイン内(ID)およびOODシナリオにおけるASRのためのGCCを改善するために設計された新しいアプローチである。
私たちのアプローチはシンプルでスケーラブルで、ドメインと言語に依存しません。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:00:29 GMT)
VidPanos: Generative Panoramic Videos from Casual Panning Videos [73.8] パノラマ画像ステッチは、カメラの視野を越えて広がるシーンの統一された広角ビューを提供する。
本稿では,カジュアルにキャプチャされたパンニングビデオからパノラマ動画を合成する方法を提案する。
我々のシステムは、人、車、流れる水など、さまざまな場所のシーンにビデオパノラマを作成できる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:53:24 GMT)
SimpleToM: Exposing the Gap between Explicit ToM Inference and Implicit ToM Application in LLMs [72.1] 大規模言語モデル(LLM)が行動予測に「心の理論」(ToM)を暗黙的に適用できるかどうかを検証する。
ToM推論の異なる程度をテストする3つの質問を含む新しいデータセットSimpleTomを作成します。
私たちの知る限り、SimpleToMは、現実的なシナリオにおけるメンタルステートの知識を必要とする下流の推論を探求する最初のデータセットです。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:15:00 GMT)
Persistent Pre-Training Poisoning of LLMs [71.5] 我々の研究は、事前学習中に言語モデルも妥協できるかどうかを初めて評価した。
我々は、有害な敵に対する影響を測定するために、スクラッチから一連のLSMを事前訓練する。
我々の主な結果は、モデルの事前トレーニングデータセットの0.1%しか中毒にならず、4つの攻撃のうち3つがポストトレーニングを通じて持続するのに十分であるということです。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:27:13 GMT)
Exploring Progress in Multivariate Time Series Forecasting: Comprehensive Benchmarking and Heterogeneity Analysis [70.8] 我々は、MTS予測提案を確実かつ公平に評価する手段の必要性に対処する。
BasicTS+は、MTS予測ソリューションの公平で包括的で再現可能な比較を可能にするために設計されたベンチマークである。
リッチデータセットとともにBasicTS+を適用し,45 MTS以上の予測ソリューションの性能を評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:13:51 GMT)
InferAct: Inferring Safe Actions for LLM-Based Agents Through Preemptive Evaluation and Human Feedback [70.5] 本稿では,リスク行動が実行される前に,潜在的なエラーを積極的に検出する新しい手法であるInferActを紹介する。
InferActは人間のプロキシとして機能し、安全でないアクションを検出し、ユーザーの介入を警告する。
広く使われている3つのタスクの実験は、InferActの有効性を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:26:10 GMT)
How Numerical Precision Affects Mathematical Reasoning Capabilities of LLMs [69.6] 本稿では,変圧器を用いた大規模言語モデルの数学的タスクにおける有効性に影響を与える重要な要因として,数値的精度を同定する。
その結果,数値精度の低いトランスフォーマーでは,繰り返し加算や整数乗算などの算術的なタスクに対処できないことがわかった。
対照的に、標準的な数値精度のトランスフォーマーは、モデルサイズを大幅に小さくすることで、これらのタスクを効率的に処理することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:35 GMT)
Depth-supervised NeRF: Fewer Views and Faster Training for Free [69.3] DS-NeRF (Depth-supervised Neural Radiance Fields) は、容易に利用できる深度監視を利用する学習分野の損失である。
我々の損失は他のNeRF法と互換性があることを示し、深度は安価で消化し易い監視信号であることを示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:11:28 GMT)
A Comparative Study on Reasoning Patterns of OpenAI's o1 Model [69.1] OpenAIのo1モデルは、ほとんどのデータセットで最高のパフォーマンスを実現しています。
また、いくつかの推論ベンチマークについて詳細な分析を行う。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:09:03 GMT)
ShadowLLM: Predictor-based Contextual Sparsity for Large Language Models [68.0] 我々は,LLMの挙動を隠蔽し,より親密なパターンを強制できる新しい予測器であるShadowLLMを開発した。
ShadowLLMは最先端のDejaVuフレームワーク上で最大20%のスピードアップを達成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:45:10 GMT)
Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.9] きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。
粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。
きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:46:18 GMT)
CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy [67.2] 認知行動療法(CBT)支援の体系的評価のための新しいベンチマークであるCBT-BENCHを提案する。
我々は, CBT-BENCHにおける3段階の課題を含む: I: 基本的CBT知識獲得, 複数選択質問のタスク; II: 認知的モデル理解, 認知的歪み分類, 主根的信念分類, きめ細かい中核信念分類のタスク; III: 治療的応答生成, CBTセラピーセッションにおける患者音声に対する応答生成のタスク。
実験結果から,LLMはCBT知識のリサイティングに優れるが,複雑な実世界のシナリオでは不十分であることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:52:57 GMT)
Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance [66.5] バリューガイド型ポリシーステアリング(V-GPS)は、ポリシーの重みを微調整したり、アクセスしたりすることなく、幅広い種類のジェネラリストポリシーと互換性がある。
同じ値関数は、異なるアーキテクチャで5つの最先端ポリシーの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:46:26 GMT)
ActionCOMET: A Zero-shot Approach to Learn Image-specific Commonsense Concepts about Actions [66.2] 我々は8.5k画像と59.3k画像に接地されたアクションに関する59.3kの推論からなるデータセットを開発する。
本稿では、提供された視覚入力に特有の言語モデルに存在する知識を識別するフレームワークであるActionCOMETを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:22:57 GMT)
Rethinking Optimal Transport in Offline Reinforcement Learning [64.6] オフラインの強化学習では、データはさまざまな専門家によって提供され、一部は準最適である。
効率的なポリシを抽出するには、データセットから最高の振る舞いを強調する必要がある。
本稿では,各状態に対する最善の専門家行動の公平な分布に状態をマッピングするポリシーを見つけることを目的としたアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:36:43 GMT)
On the Role of Attention Heads in Large Language Model Safety [64.5] 大規模言語モデル(LLM)は、複数の言語タスクにおいて最先端のパフォーマンスを達成するが、それらの安全ガードレールを回避できる。
モデル安全への個人的貢献を評価するため,マルチヘッド対応のための新しい指標として,安全ヘッドImPortant Score(Ships)を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:08:06 GMT)
Estimating Body and Hand Motion in an Ego-sensed World [64.1] 頭部装着装置から人体の動きを推定するシステムであるEgoAlloについて述べる。
エゴセントリックなSLAMポーズとイメージのみを使用して、EgoAlloは条件付き拡散モデルからサンプリングを行い、3Dボディポーズ、高さ、手のパラメータを推定する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:51:19 GMT)
Estimating Body and Hand Motion in an Ego-sensed World [64.1] 頭部装着装置から人体の動きを推定するシステムであるEgoAlloについて述べる。
エゴセントリックなSLAMポーズとイメージのみを使用して、EgoAlloは条件付き拡散モデルからサンプリングを行い、3Dボディポーズ、高さ、手のパラメータを推定する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:51:19 GMT)
FIRE: Fact-checking with Iterative Retrieval and Verification [63.7] FIREはエビデンス検索とクレーム検証を反復的に統合する新しいフレームワークである。
大きな言語モデル(LLM)のコストを平均7.6倍、検索コストを16.5倍削減しながら、パフォーマンスが若干向上している。
これらの結果から,FIREは大規模ファクトチェック業務における適用を約束していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:44:18 GMT)
LLoCO: Learning Long Contexts Offline [63.3] 長いコンテキストを処理するための新しいアプローチであるLLoCOを提案する。
LLoCOはコンテキスト圧縮とLoRAによるドメイン内パラメータ効率の微調整を通じて、オフラインでコンテキストを学習する。
提案手法は、4kトークンLLaMA2-7Bモデルの有効コンテキストウインドウを拡張し,最大128kトークンを処理する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:54:37 GMT)
Belief Revision: The Adaptability of Large Language Models Reasoning [63.0] 本稿では,LMの信念修正能力をテストするための新しいデータセットであるBelief-Rを紹介する。
このタスクは、人間が事前の推論を抑える方法にインスパイアされ、新しく提案されたデルタ推論フレームワーク内のLMを評価する。
様々なプロンプト戦略にまたがる$sim$30 LMを評価した結果,LMは一般的に,新たな情報に反応して信念を適切に修正するのに苦慮していることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:28:24 GMT)
Help Me Identify: Is an LLM+VQA System All We Need to Identify Visual Concepts? [63.0] 本稿では,大規模言語モデルとVQA(Visual Question Answering)システムを活用した,視覚概念学習のためのゼロショットフレームワークを提案する。
VQAシステムに問い合わせ画像とともにこれらの質問を行い、回答を集約し、テスト画像中のオブジェクトの有無を判定する。
実験では,既存のゼロショット視覚分類法や少数ショット概念学習手法と同等の性能を示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:16:10 GMT)
PUMA: Empowering Unified MLLM with Multi-granular Visual Generation [62.7] 統一MLLMと多言語視覚生成を併用したPUMAを提案する。
PUMAはMLLMの入力と出力の両方としてマルチグラニュラ視覚特徴を統一する。
この研究は、様々な視覚的タスクの粒度要求に適応できる真に統一されたMLLMに向けた重要なステップである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:57 GMT)
Chain of Ideas: Revolutionizing Research in Novel Idea Development with LLM Agents [62.4] 科学文献の急激な増加は、研究者が最近の進歩と意義ある研究方向を見極めるのを困難にしている。
大規模言語モデル(LLM)の最近の発展は、新しい研究のアイデアを自動生成するための有望な道のりを示唆している。
本研究では, チェーン構造に関連文献を整理し, 研究領域の進展を効果的に反映する, LLMベースのエージェントであるChain-of-Ideas(CoI)エージェントを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:26:37 GMT)
Trust but Verify: Programmatic VLM Evaluation in the Wild [62.1] プログラム型VLM評価(Programmatic VLM Evaluation、PROVE)は、オープンなクエリに対するVLM応答を評価するための新しいベンチマークパラダイムである。
我々は,PROVE上でのVLMの有効性-実効性トレードオフをベンチマークした結果,両者のバランスが良好であることは極めて少ないことがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:19:18 GMT)
Scaling Laws and Compute-Optimal Training Beyond Fixed Training Durations [62.1] スケールは強力な機械学習モデルを得る上で重要な要素となっている。
本研究では,コサインのスケジュールに依存するため,スケールとトレーニングの研究は必然的に複雑である,と論じる。
その結果,重量平均化はトレーニングの軌道に沿って,異なるスケールでのトレーニングコストを伴わずに向上することがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:01:15 GMT)
Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.1] 大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:31:32 GMT)
Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.1] 大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:31:32 GMT)
Model Supply Chain Poisoning: Backdooring Pre-trained Models via Embedding Indistinguishability [61.5] そこで我々は,PTMに埋め込まれたバックドアをモデルサプライチェーンに効率的に移動させる,新しい,より厳しいバックドア攻撃であるTransTrojを提案する。
実験の結果,本手法はSOTAタスク非依存のバックドア攻撃より有意に優れていた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:00:14 GMT)
Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models [61.5] 集約精度を検査する際には、スキルワイドのパフォーマンスが不明確になる。
モデル生成論理を検査することで,任意の評価事例に関連する基礎的スキルを復元する自動手法を提案する。
私たちのスキルスライスとフレームワークは、モデル評価の新しい道を開き、スキル固有の分析を活用して、よりきめ細やかで実用的なモデル機能の理解を解き放ちます。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:51:40 GMT)
Roadmap towards Superhuman Speech Understanding using Large Language Models [60.6] 大規模言語モデル(LLM)は、音声データと音声データを統合したものである。
GPT-4oのような最近の進歩は、エンドツーエンドのLLMの可能性を強調している。
本稿では,基本自動音声認識(ASR)から高度な超人モデルまで,5段階のロードマップを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:44:06 GMT)
Satellite Streaming Video QoE Prediction: A Real-World Subjective Database and Network-Level Prediction Models [59.1] LIVE-Viasat Real-World Satellite QoE Databaseを紹介する。
このデータベースは、現実世界のストリーミングサービスから記録された179のビデオで構成されている。
本稿では,QoE予測モデルの有効性を評価することで,この新たな資源の有用性を実証する。
また、ネットワークパラメータを予測された人間の知覚スコアにマッピングする新しいモデルを作成しました。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:22:50 GMT)
De-mark: Watermark Removal in Large Language Models [59.0] 我々は、n-gramベースの透かしを効果的に除去するために設計された高度なフレームワークであるDe-markを紹介する。
提案手法は,透かしの強度を評価するために,ランダム選択探索と呼ばれる新しいクエリ手法を利用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:42:10 GMT)
Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability,Reproducibility, and Practicality [58.9] 本稿では,T2Vモデルのための包括的で標準化されたプロトコルであるText-to-Video Human Evaluation (T2VHE)プロトコルを紹介する。
このプロトコルには、明確に定義されたメトリクス、完全なアノテータトレーニング、効果的な動的評価モジュールが含まれている。
我々は、完全なプロトコルワークフロー、動的評価コンポーネントの詳細、アノテーションインターフェースコードを含む、T2VHEプロトコルのセットアップ全体をオープンソースにします。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:11:36 GMT)
VLM-Grounder: A VLM Agent for Zero-Shot 3D Visual Grounding [57.0] 3Dビジュアルグラウンドティングはロボットにとって不可欠であり、自然言語と3Dシーン理解を統合する必要がある。
VLM-Grounderは視覚言語モデル(VLM)を用いて2次元画像のみに基づくゼロショット3次元視覚グラウンドティングを行う新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:55 GMT)
Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [57.0] 拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:10:13 GMT)
Nonlinear Stochastic Gradient Descent and Heavy-tailed Noise: A Unified Framework and High-probability Guarantees [56.8] 本研究では,重音の存在下でのオンライン学習における高確率収束について検討する。
切断のみを考慮し、有界な$p$-thモーメントでノイズを必要とする最先端技術と比較して、幅広い非線形性の保証を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:25:28 GMT)
Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [56.0] Visual Foundation Models (VFM) は、3D表現学習を強化するために使用される。
VFMは、弱制御された画素間コントラスト蒸留のためのセマンティックラベルを生成する。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:06:26 GMT)
A Watermark for Order-Agnostic Language Models [55.9] Pattern-markは、順序に依存しないLM用に特別に設計されたパターンベースの透かしフレームワークである。
我々は,高周波鍵パターンを持つ透かしキー列を生成するマルコフチェーン型透かし生成器を開発した。
タンパク質MPNN や CMLM などの順序に依存しない LM の評価では,パターンマークによる検出効率の向上,生成品質,ロバスト性などが示されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:41:28 GMT)
MirrorCheck: Efficient Adversarial Defense for Vision-Language Models [55.7] 本稿では,視覚言語モデルにおける対角的サンプル検出のための,新しい,しかしエレガントなアプローチを提案する。
本手法は,テキスト・トゥ・イメージ(T2I)モデルを用いて,ターゲットVLMが生成したキャプションに基づいて画像を生成する。
異なるデータセットで実施した経験的評価により,本手法の有効性が検証された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:46:45 GMT)
Architecting a reliable quantum operating system: microkernel, message passing and supercomputing [55.6] 量子オペレーティングシステム(QCOS)は、古典的なハードウェア上で動作する古典的なソフトウェアである。
以下の原則に従ってQCOSを設計すべき理由について議論する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:24:55 GMT)
LLM-based Cognitive Models of Students with Misconceptions [55.3] 本稿では,この2つの要件を満たすためにLLM(Large Language Models)を命令調整できるかどうかを検討する。
真正な学生ソリューションパターンを反映したデータセットを生成する新しいPythonライブラリであるMalAlgoPyを紹介する。
我々の洞察は、AIに基づく学生モデルの理解を高め、効果的な適応学習システムへの道を開く。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:27:43 GMT)
Enabling Natural Zero-Shot Prompting on Encoder Models via Statement-Tuning [55.3] ステートメントチューニングは、有限文の集合として識別タスクをモデル化し、エンコーダモデルを訓練し、潜在的なステートメントを識別してラベルを決定するテクニックである。
その結果, ステートメント・チューニングは, パラメータが著しく少ない最先端のLCMと比較して, 競争性能が向上することを示した。
この研究は、いくつかの設計選択が少ショットとゼロショットの一般化に与える影響を調査し、ステートメントチューニングが控えめなトレーニングデータで高いパフォーマンスを達成できることを明らかにした。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:21:24 GMT)
ScreenWriter: Automatic Screenplay Generation and Movie Summarisation [55.2] ビデオコンテンツは、ユーザーがキープロットポイントをリコールしたり、見ずに概要を見ることができるようなテキスト記述や要約の需要を駆り立ててきた。
本稿では,映像のみを操作し,対話,話者名,シーンブレーク,視覚的記述を含む出力を生成するScreenWriterを提案する。
ScreenWriterは、映像を視覚ベクトルのシーケンスに基づいてシーンに分割する新しいアルゴリズムを導入し、アクターの顔のデータベースに基づく文字名決定の難しい問題に対する新しい方法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:59:54 GMT)
LESS: Label-Efficient and Single-Stage Referring 3D Segmentation [55.1] 参照3Dは、クエリの文で記述された3Dポイントクラウドから、指定されたオブジェクトのすべてのポイントをセグメントする視覚言語タスクである。
本稿では,LESSと呼ばれるレファレンス3次元パイプラインを提案する。
ScanReferデータセット上での最先端のパフォーマンスは、バイナリラベルのみを使用して、以前の3.7% mIoUの手法を上回ります。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:47:41 GMT)
OpenDAS: Open-Vocabulary Domain Adaptation for Segmentation [55.0] 視覚言語モデル(VLM)にドメイン固有の知識を注入するオープン語彙ドメイン適応の課題を提案する。
既存のVLM適応手法では、ベース(トレーニング)クエリのパフォーマンスが向上するが、新しいクエリ上でのVLMのオープンセット能力を維持できない。
我々のアプローチは、新しいクラスにおける元のVLMを一貫して上回るパラメータ効率の手法である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:54:04 GMT)
Scaling Wearable Foundation Models [54.9] センサ基礎モデルのスケーリング特性を計算,データ,モデルサイズにわたって検討する。
最大4000万時間分の心拍数、心拍変動、心電図活動、加速度計、皮膚温度、および1分間のデータを用いて、私たちはLSMを作成します。
この結果から,LSMのスケーリング法則は,時間とセンサの両面において,計算や外挿などのタスクに対して確立されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:08:21 GMT)
Improving Multi-modal Large Language Model through Boosting Vision Capabilities [54.3] 視覚言語モデルを強化するための視覚理解能力の改善に注力する。
マルチモーダル言語モデルである textbfArcana を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:36:38 GMT)
PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.1] PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:43:40 GMT)
Fluid: Scaling Autoregressive Text-to-image Generative Models with Continuous Tokens [54.0] 視覚における自己回帰モデルのスケールアップは、大きな言語モデルほど有益でないことが証明されている。
モデルが離散トークンを使用するか、連続トークンを使用するか、BERTやGPTのようなトランスフォーマーアーキテクチャを用いてランダムまたは固定順序でトークンを生成するか、という2つの重要な要素に焦点を当てる。
その結果,すべてのモデルが検証損失の点で効果的にスケールしているのに対して,評価性能はFID,GenEvalスコア,視覚的品質などによって異なる傾向を呈することがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:59 GMT)
Instruction-Driven Game Engine: A Poker Case Study [53.7] IDGEプロジェクトは、大規模言語モデルで自由形式のゲーム記述を追従し、ゲームプレイプロセスを生成することにより、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオへの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
我々の最初の進歩はポーカーのIDGEの開発であり、これは幅広いポーカーの変種をサポートするだけでなく、自然言語入力を通じて高度に個別化された新しいポーカーゲームを可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:16:27 GMT)
Heisenberg scaling based on population coding [53.6] 本研究では, 量子力学のハイゼンベルクスケーリングについて, 集団符号化の観点から検討する。
集団符号化の観点からパラメータ空間の識別可能な要素の数を結合する相互情報を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:53:52 GMT)
Meta-DiffuB: A Contextualized Sequence-to-Sequence Text Diffusion Model with Meta-Exploration [53.6] 本稿では,既存のS2S-拡散モデルの限界を克服するために,スケジューラ・エクスロイタS2S-拡散パラダイムを提案する。
我々はメタ探索を用いて、各文の文脈化ノイズをスケジューリングするための追加スケジューラモデルを訓練する。
我々のエクスプローラーモデルであるS2S-拡散モデルでは、スケジューラモデルによってスケジュールされたノイズを利用して更新と生成を行う。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:06:02 GMT)
Ethics Whitepaper: Whitepaper on Ethical Research into Large Language Models [53.3] このホワイトペーパーは、大規模言語モデル(LLM)の研究を取り巻く倫理的考察の概要を提供する。
LLMが広く使われるアプリケーションに統合されるにつれて、その社会的影響が増大し、重要な倫理的疑問が前面に浮かび上がっている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:36:02 GMT)
Remember, Retrieve and Generate: Understanding Infinite Visual Concepts as Your Personalized Assistant [53.3] 本稿では,MLLMのパーソナライズのためのRAP(Retrieval Augmented Personalization)フレームワークを紹介する。
RAPは、外部データベースを更新することで、リアルタイムの概念編集を可能にする。
RAP-MLLMは、追加の微調整なしで無限の視覚概念に一般化することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:10:26 GMT)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.9] 拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:02 GMT)
PTQ4DiT: Post-training Quantization for Diffusion Transformers [52.9] ポストトレーニング量子化(PTQ)は、計算とメモリフットプリントを大幅に削減できる高速でデータ効率のソリューションとして登場した。
提案するPTQ4DiTは,DiTのための特別に設計されたPTQ手法である。
PTQ4DiTは8ビットの精度でDiTの量子化に成功した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:28:15 GMT)
PTQ4DiT: Post-training Quantization for Diffusion Transformers [52.9] ポストトレーニング量子化(PTQ)は、計算とメモリフットプリントを大幅に削減できる高速でデータ効率のソリューションとして登場した。
提案するPTQ4DiTは,DiTのための特別に設計されたPTQ手法である。
PTQ4DiTは8ビットの精度でDiTの量子化に成功した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:28:15 GMT)
AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.1] 本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:50:38 GMT)
Provable Benefits of Complex Parameterizations for Structured State Space Models [51.9] 構造化状態空間モデル (Structured State Space Model, SSM) は、指定された構造に固執する線形力学系である。
パラメータ化が現実の典型的なニューラルネットワークモジュールとは対照的に、SSMは複雑なパラメータ化を使用することが多い。
本稿では,実対角 SSM と複素対角 SSM の形式的ギャップを確立することにより,SSM の複雑なパラメータ化の利点を説明する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:35:50 GMT)
Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.8] モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:47:56 GMT)
Mixture of In-Context Experts Enhance LLMs' Long Context Awareness [51.7] 大規模言語モデル(LLM)は、異なる文脈の位置に対する不均一な認識を示す。
本稿では,この課題に対処するため,"Mixture of In-Context Experts" (MoICE) という新しい手法を提案する。
MoICEには2つの重要なコンポーネントがある: LLM内の各アテンションヘッドに統合されたルータと、軽量なルータのみのトレーニング最適化戦略である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:53:50 GMT)
ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding [51.5] 我々はARKit LabelMakerを紹介した。これは、密集したセマンティックアノテーションを備えた、最初の大規模で現実世界の3Dデータセットである。
また,3次元セマンティックセグメンテーションモデルを用いて,ScanNetおよびScanNet200データセットの最先端性能を推し進める。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:44:35 GMT)
Partial-differential-algebraic equations of nonlinear dynamics by Physics-Informed Neural-Network: (I) Operator splitting and framework assessment [51.3] 偏微分代数方程式の解法として, 新規な物理情報ネットワーク(PINN)の構築法が提案されている。
これらの新しい手法には PDE 形式があり、これは未知の従属変数が少ない低レベル形式からより従属変数を持つ高レベル形式へと進化している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:25:49 GMT)
Instruction Matters: A Simple yet Effective Task Selection for Optimized Instruction Tuning of Specific Tasks [51.2] 本稿では,命令情報のみを利用してタスクを識別する,シンプルで効果的なタスク選択手法を提案する。
提案手法は,タスク間のペア転送可能性の複雑な測定や,対象タスクのためのデータサンプルの作成を必要とする従来の手法に比べて,はるかに効率的である。
実験の結果、命令のみに選択されたタスクセットのトレーニングにより、P3、Big-Bench、NIV2、Big-Bench Hardといったベンチマークのパフォーマンスが大幅に改善された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:57:27 GMT)
MagicTailor: Component-Controllable Personalization in Text-to-Image Diffusion Models [51.1] 本稿では,テキスト・ツー・イメージ(T2I)モデルの境界を押し上げる新しいタスクであるコンポーネント・コントロール可能なパーソナライゼーションを提案する。
これらの課題を克服するために、動的マスケード分解(DM-Deg)を活用して、望ましくない視覚的セマンティクスを動的に摂動させる革新的なフレームワークであるMagicTailorを設計する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:22:53 GMT)
KOI: Accelerating Online Imitation Learning via Hybrid Key-state Guidance [51.1] キーステートガイド付きオンライン模倣(KOI)学習手法について紹介する。
我々は視覚言語モデルを用いて、専門家の軌跡から意味的キー状態を抽出し、「何をすべきか」の目的を示す。
セマンティックキー状態間の間隔内では、動作キー状態の捕捉に光流が使用され、「どうするか」のメカニズムが理解される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:35:21 GMT)
CLaMP 2: Multimodal Music Information Retrieval Across 101 Languages Using Large Language Models [51.0] CLaMP 2は、音楽情報検索用の101言語に対応するシステムである。
大規模言語モデルを活用することで,大規模に洗練され一貫した多言語記述が得られる。
CLaMP 2は、多言語セマンティックサーチとモーダル間の音楽分類において、最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:43:54 GMT)
Preference Diffusion for Recommendation [50.9] DMベースのレコメンデータに適した最適化対象であるPreferDiffを提案する。
PreferDiffは、BPRをログライクなランキング目標に変換することで、ユーザの好みをよりよく把握する。
これはDMベースのレコメンデーション向けに特別に設計された、パーソナライズされたランキングの損失である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:02:04 GMT)
Beyond Coarse-Grained Matching in Video-Text Retrieval [50.8] きめ細かい評価のための新しいアプローチを導入する。
テストキャプションを自動的に生成することで,既存のデータセットにアプローチを適用することができる。
きめ細かい評価実験は、このアプローチがきめ細かな違いを理解するモデルの能力を高めることを実証している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:59:34 GMT)
DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation [50.7] 本稿では,動的長大映像のオール・アット・オンス生成を可能にするフレームワークであるDAWNを提案する。
DAWNは,(1)潜在動作空間における音声駆動型顔力学生成,(2)音声駆動型頭部ポーズと点滅生成の2つの主要成分から構成される。
本手法は, 唇の動きを正確に表現し, 自然なポーズ・瞬き動作を特徴とする実写映像と鮮明な映像を生成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:32:36 GMT)
Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [50.0] 本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:42:12 GMT)
Style-Compress: An LLM-Based Prompt Compression Framework Considering Task-Specific Styles [49.7] Style-Compressは、より小さな言語モデルを適用して、新たなタスクでより大きなモデルのプロンプトを、追加のトレーニングなしで圧縮する軽量フレームワークである。
提案手法は,実効圧縮プロンプトを,スタイルのバリエーションやコンテキスト内学習を通じて,タスク固有の実演として反復的に生成し,選択する。
Style-Compressは、オリジナルのプロンプト再構成、テキスト要約、マルチホップQA、CoT推論の4つのタスクで2つのベースライン圧縮モデルを上回っている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:35:49 GMT)
All models are wrong, some are useful: Model Selection with Limited Labels [49.6] 本稿では,事前学習した分類器をラベル効率で選択するフレームワークであるMODEL SELECTORを紹介する。
MODEL SELECTOR はラベル付きデータの必要性を劇的に減らし,最良あるいは最良に近い性能のモデルを選択することを示す。
モデル選択におけるMODEL SELECTORのロバスト性をさらに強調し, 最良モデルを選択する場合, ラベル付けコストを最大72.41%削減する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:45:56 GMT)
GBCT: An Efficient and Adaptive Granular-Ball Clustering Algorithm for Complex Data [49.6] 粒状球クラスタリング(GBCT)と呼ばれる新しいクラスタリングアルゴリズムを提案する。
GBCTは、従来の点関係ではなく、グラニュラーボールの関係に従ってクラスタを形成する。
グラニュラーボールは様々な複雑なデータに適合するので、GBCTは従来のクラスタリング法よりも非球面データセットにおいてはるかに優れている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:32:05 GMT)
Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval [49.4] 知識グラフ(KG)から構造化文書関係を付加したLLMを拡張した知識対応クエリ拡張フレームワークを提案する。
文書テキストをリッチなKGノード表現として活用し、KAR(Knowledge-Aware Retrieval)のための文書ベースの関係フィルタリングを利用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:03:23 GMT)
MEGA: Memory-Efficient 4D Gaussian Splatting for Dynamic Scenes [49.4] 本稿では,4DGSのためのメモリ効率フレームワークを提案する。
TechnicolorとNeural 3D Videoのデータセットで約190$times$と125$times$のストレージ削減を実現している。
レンダリング速度とシーン表現の品質を維持し、フィールドに新しい標準を設定する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:47:08 GMT)
ActiveRAG: Autonomously Knowledge Assimilation and Accommodation through Retrieval-Augmented Agents [49.3] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)が外部知識を活用することを可能にする。
既存のRAGモデルは、LLMを受動的情報受信者として扱うことが多い。
人間の学習行動を模倣するマルチエージェントフレームワークであるActiveRAGを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:21:03 GMT)
Deep Reinforcement Learning for Online Optimal Execution Strategies [49.2] 本稿では,動的な金融市場における非マルコフ的最適実行戦略の学習に挑戦する。
我々は,Deep Deterministic Policy Gradient(DDPG)に基づく新しいアクター批判アルゴリズムを提案する。
提案アルゴリズムは最適実行戦略の近似に成功していることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:38:08 GMT)
DiffATR: Diffusion-based Generative Modeling for Audio-Text Retrieval [49.1] ノイズから関節分布を生成する拡散型ATRフレームワーク(DiffATR)を提案する。
優れたパフォーマンスを持つAudioCapsとClothoデータセットの実験は、我々のアプローチの有効性を検証する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:16:52 GMT)
Progressive Mixed-Precision Decoding for Efficient LLM Inference [49.1] 我々は,デコーディングのメモリバウンドネスに対処するために,プログレッシブ・ミックス・プレシジョン・デコーディング(PMPD)を導入する。
PMPDはfp16モデルの行列ベクトル乗算において1.4$-$12.2$times$ Speedupを達成する。
我々の手法は、fp16モデルよりも3.8$-$8.0$times$、均一量子化アプローチよりも1.54$times$のスループット向上をもたらす。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:46:33 GMT)
VL-GLUE: A Suite of Fundamental yet Challenging Visuo-Linguistic Reasoning Tasks [48.7] VL-GLUEは、自然言語理解のためのマルチタスクベンチマークである。
既存の大規模視覚言語モデルでは,このベンチマークは非常に難しい。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:27:17 GMT)
Towards Better Performance in Incomplete LDL: Addressing Data Imbalance [48.5] 我々は,不完全なラベルと不均衡なラベル分布を同時に扱うフレームワークであるtextIncomplete and Im Balance Label Distribution Learning (I(2)LDL)を提案する。
本手法は, ラベル分布行列を, 頻繁なラベルのための低ランク成分と希少なラベルのためのスパース成分に分解し, 頭部と尾部のラベルの構造を効果的に把握する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:12:57 GMT)
Revocable Encryption, Programs, and More: The Case of Multi-Copy Security [48.5] 復号化可能な暗号化や復号化可能なプログラムなど,復号化可能なプリミティブの実現可能性を示す。
これは、マルチコピーセキュリティというより強い概念が、制限不能な暗号において到達範囲内にあることを示唆している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:37:40 GMT)
Addressing Heterogeneity and Heterophily in Graphs: A Heterogeneous Heterophilic Spectral Graph Neural Network [48.1] 異種不テロ親和性スペクトルグラフニューラルネットワーク(H2SGNN)を提案する。
H2SGNNは、局所独立フィルタリングとグローバルハイブリッドフィルタリングというデュアルモジュールアプローチを採用している。
4つの実世界のデータセットに対する大規模な実証評価は、最先端の手法と比較してH2SGNNの優位性を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:23:53 GMT)
A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement [48.0] Reinforcement Learning from Human Feedback (RLHF) は言語モデルのアライメントにおいて主要なアプローチとなっている。
本稿では,マージンに基づく手法の共通の落とし穴を同定する。
我々はこれらの問題行動の背景にある理由を軽視する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:52:01 GMT)
Sample Compression Hypernetworks: From Generalization Bounds to Meta-Learning [47.8] 再構成関数はサンプル圧縮理論において重要である。
実値メッセージに対する新しいサンプル圧縮一般化法を導出する。
我々は,厳密な一般化保証付き予測器を出力する新しいハイパーネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:12:35 GMT)
MedINST: Meta Dataset of Biomedical Instructions [47.7] MedINSTは133のバイオメディカルNLPタスクと700万以上のトレーニングサンプルで構成されている。
我々は、MedINST上で複数のLLMを微調整し、MedINST32上での評価を行い、クロスタスクの一般化の強化を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:38:54 GMT)
Probing the Latent Hierarchical Structure of Data via Diffusion Models [47.6] 拡散モデルを用いた実験は,データの潜伏構造を探索するための有望なツールであることを示す。
我々はこの予測を、最先端拡散モデルを用いてテキストと画像の両方で確認する。
以上の結果から,潜在変数がデータにどのように現れるかを示し,これらの影響を実データで測定する方法を確立した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:08:39 GMT)
Normalizing self-supervised learning for provably reliable Change Point Detection [47.6] 変化点検出法 (CPD) は入力データストリームの分布の急激な変化を特定することを目的としている。
従来の教師なしCDD技術は、しばしば強い仮定に依存して、重大な制限に直面している。
本研究は,表現学習の表現力と従来のCPD手法の基盤性を統合する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:07:56 GMT)
FaceSaliencyAug: Mitigating Geographic, Gender and Stereotypical Biases via Saliency-Based Data Augmentation [46.7] コンピュータビジョンモデルにおける性別バイアスに対処することを目的としたFaceSaliencyAugというアプローチを提案する。
Flickr Faces HQ(FFHQ)、WIKI、IMDB、Labelled Faces in the Wild(LFW)、UTK Faces、Diverseデータセットを含む5つのデータセットで、画像類似度スコア(ISS)を使用してデータセットの多様性を定量化する。
実験の結果,CNN と ViT の男女差の低減が明らかとなり,コンピュータビジョンモデルにおける公平性と傾きの促進に本手法の有効性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:36:52 GMT)
Improving Word Translation via Two-Stage Contrastive Learning [46.7] BLIタスクのための頑健で効果的な2段階のコントラスト学習フレームワークを提案する。
多様な言語のための標準BLIデータセットに関する総合的な実験は、我々のフレームワークによって実現された大きな成果を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:50:37 GMT)
PopAlign: Diversifying Contrasting Patterns for a More Comprehensive Alignment [46.7] より包括的で多様なコントラストパターンを構築し、嗜好データを強化する方法について検討する。
我々は、プロンプト、モデル、パイプラインレベルにまたがる多様なコントラストパターンを統合するフレームワークであるPopAlignを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:22:05 GMT)
Atomic Calibration of LLMs in Long-Form Generations [46.0] 大型言語モデル(LLM)は幻覚に悩まされることが多く、現実世界のアプリケーションにとって大きな課題となっている。
我々は,原子の反応を原子のクレームに分解することで,ファクトリティのキャリブレーションをきめ細かなレベルで評価する新しい手法である原子キャリブレーションを導入する。
実験の結果,原子キャリブレーションは長文生成に適しており,マクロキャリブレーションの結果も改善できることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:09:26 GMT)
A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models [45.8] ポストトレーニングは、様々なタスクに大規模な事前訓練モデルを適用するための重要なパラダイムとして現れている。
本稿では,DARE や BitDelta などの既存手法を拡張して,訓練後モデルにおけるデルタパラメータ編集の適用性と有効性を高める。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:56:53 GMT)
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations [45.6] AURORAデータセット(AURORA data)は、ビデオやシミュレーションエンジンから人間に注釈を付け、キュレートされた高品質なトレーニングデータの集合である。
AURORA-finetuned model on a new expert-curated benchmark across 8 various editing task。
我々のモデルは従来の編集モデルよりもはるかに優れており、人間のレーティングによって判断される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:12:44 GMT)
Robust Fast Adaptation from Adversarially Explicit Task Distribution Generation [45.6] タスク識別子上に配置されたタスク分布を明示的に生成する。
我々は、敵の訓練から高速適応を強固にすることを提案する。
この研究は、特にメタラーニングにおけるタスク分散シフトを扱う際に、実践的な意味を持っている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:27:49 GMT)
Quantum digital signature based on single-qubit without a trusted third-party [45.4] 我々は、よりセキュリティを向上させるために、量子ビット技術のみを頼りにすることなく、新しい量子デジタル署名プロトコルを提案する。
また,このプロトコルは,非対称性,不確定性,拡張性など,他の重要な安全特性を満足する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:49:29 GMT)
Efficient Anatomical Labeling of Pulmonary Tree Structures via Deep Point-Graph Representation-based Implicit Fields [45.2] 肺疾患は世界中で死の主な死因の1つである。
高解像度画像スタックと高密度ボクセルグリッド上の標準CNNを用いた従来のアプローチは、計算効率、解像度の制限、局所的文脈、形状トポロジーの不十分な保存といった課題に直面している。
本手法は,高密度なボクセルからスパースポイント表現に移行し,メモリ効率の向上とグローバルなコンテキスト利用を実現することで,これらの問題に対処する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:23:45 GMT)
Latent Space Chain-of-Embedding Enables Output-free LLM Self-Evaluation [45.1] 我々は,LLMが出力不要な自己評価を行うことを可能にするために,潜在空間におけるChain-of-Embedding (CoE)を提案する。
CoEは、LLMの潜在的思考経路として扱うことができる、推論時間中に生成される全ての進行的な隠れ状態から構成される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:09:24 GMT)
Modeling Future Conversation Turns to Teach LLMs to Ask Clarifying Questions [45.0] 今後,予測結果のシミュレーションにより,選好ラベルを割り当てることを提案する。
これにより、LLMは、将来の順番で各ユーザの解釈に合わせた応答を生成することができるとき、明確な質問をすることを学ぶことができる。
我々は,各ユーザの解釈と期待された回答を再現できる質問を明確にする能力に基づいて,システム評価を行う。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:29:04 GMT)
LLM-based Translation Inference with Iterative Bilingual Understanding [45.0] 大規模言語モデル(LLM)の言語間機能に基づいた,新しい反復的バイリンガル理解翻訳法を提案する。
LLMの言語横断的能力により、ソース言語とターゲット言語を別々にコンテキスト理解することが可能になる。
提案したIBUTは、いくつかの強力な比較法より優れている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:28:25 GMT)
BLT: Can Large Language Models Handle Basic Legal Text? [44.9] GPT-4とClaudeは、基本的な法的テキスト処理では性能が良くない。
ベンチマークの粗悪なパフォーマンスは、法的慣行の信頼性を疑うものだ。
トレーニングセットの微調整は、小さなモデルでもほぼ完璧なパフォーマンスをもたらす。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:03:11 GMT)
Emphasizing Semantic Consistency of Salient Posture for Speech-Driven Gesture Generation [44.8] 音声駆動ジェスチャ生成は、入力音声信号と同期したジェスチャシーケンスを合成することを目的としている。
従来の手法では、ニューラルネットワークを利用して、コンパクトな音声表現をジェスチャーシーケンスに直接マッピングする。
そこで本稿では,姿勢のセマンティック一貫性を重視した音声によるジェスチャー生成手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:22:59 GMT)
GDeR: Safeguarding Efficiency, Balancing, and Robustness via Prototypical Graph Pruning [44.4] トレーニング可能なプロトタイプを用いて,プロセス中のトレーニングを更新するための新しいソフトプルーニング手法であるGDeRを導入する。
GDeRは、トレーニングサンプルの30%削減で、完全なデータセットのパフォーマンスを達成または上回る。
また、不均衡なトレーニングやノイズの多いトレーニングシナリオにおいて、最先端のプルーニング手法よりも優れています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:56:01 GMT)
CooHOI: Learning Cooperative Human-Object Interaction with Manipulated Object Dynamics [44.3] 本稿では,2段階の学習パラダイムを通した多文字オブジェクトを扱う新しいフレームワークであるCooHOIを紹介する。
CooHOIは本質的に効率的であり、マルチキャラクタインタラクションのモーションキャプチャデータに依存せず、より多くの参加者と幅広いオブジェクトタイプを含むようにシームレスに拡張することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:41:22 GMT)
CrystalX: Ultra-Precision Crystal Structure Resolution and Error Correction Using Deep Learning [44.0] 本研究では,全原子レベルでの超精密構造解析モデルであるCrystalXを開発した。
このモデルを検証するために,5万回以上のX線回折測定を行った。
このディープラーニングモデルは、結晶構造解析の時間枠に革命をもたらし、それを数秒に短縮する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:12:55 GMT)
Learning to Route with Confidence Tokens [43.6] 大規模言語モデルが回答の信頼性を確実に示すことができる範囲について検討する。
本稿では,LLMの信頼性を確実に表現するための軽量トレーニング戦略であるSelf-REFを提案する。
信頼度を言語化したり、トークンの確率を調べるといった従来の手法と比較して、信頼度トークンは下流のルーティングや拒否学習タスクにおいて著しく改善されていることを実証的に示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:28:18 GMT)
Framing in the Presence of Supporting Data: A Case Study in U.S. Economic News [43.5] 我々は、客観的な測度がデータをサポートする形で存在する、ニュースに値するトピックが存在すると論じる。
本稿では,この設定における編集選択を分析するための計算フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:09:40 GMT)
Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation [43.5] マルチモーダル理解と生成を統合する自動回帰フレームワークであるJanusを紹介する。
Janusは視覚的エンコーディングを別々の経路に分離し、単一の統一トランスフォーマーアーキテクチャを使って処理する。
実験によると、Janusは以前の統一モデルを超え、タスク固有のモデルのパフォーマンスにマッチするか、超えている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:58:37 GMT)
MIRAGE-Bench: Automatic Multilingual Benchmark Arena for Retrieval-Augmented Generation Systems [43.2] MIRAGE-Benchは,Wikipedia上の18の多言語言語を対象とした標準化されたアリーナベース多言語RAGベンチマークである。
このアイデアを用いて、Wikipedia上の18の多様な言語に対して、標準化されたアリーナベースの多言語RAGベンチマークであるMIRAGE-Benchを開発した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:18:49 GMT)
SCMM: Calibrating Cross-modal Representations for Text-Based Person Search [43.2] テキスト・ベース・パーソナリティ・サーチ(TBPS)は,大規模ギャラリーから対象人物の正確な検索を可能にする重要なタスクである。
クロスモーダルTBPSタスクでは、共通埋め込み空間において、よく分散された表現を得ることが重要である。
本稿では,Sew and Masked Modeling (SCMM) という手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:57:50 GMT)
Benchmarking LLMs for Translating Classical Chinese Poetry:Evaluating Adequacy, Fluency, and Elegance [43.1] 古典漢詩を英語に翻訳するための適切なベンチマーク(PoetMT)を導入する。
この課題は、文化的、歴史的に重要な内容の翻訳に適当であるだけでなく、言語的な優雅さや詩的な優雅さへの厳格な固執も必要である。
本稿では,古典詩に関する知識を取り入れた検索型機械翻訳手法であるRATを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:17:57 GMT)
Benchmarking LLMs for Translating Classical Chinese Poetry:Evaluating Adequacy, Fluency, and Elegance [43.1] 古典漢詩を英語に翻訳するためのベンチマークを導入する。
この課題は、文化的、歴史的に重要な内容の翻訳に適当であるだけでなく、言語的な優雅さや詩的な優雅さへの厳格な固執も必要である。
本稿では,古典詩に関する知識を取り入れた翻訳プロセスを強化する機械用textbfAugmented machine textbfTranslation法であるRATを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:17:57 GMT)
Leveraging Invariant Principle for Heterophilic Graph Structure Distribution Shifts [42.8] Heterophilic Graph Neural Networks (HGNN) は、グラフ上の半教師付き学習タスクに対して有望な結果を示している。
この構造差や分布シフトを扱うために、異種グラフ上の不変ノード表現を学習する方法は、まだ解明されていない。
異種情報を組み込んだ不変ノード表現を生成可能なフレームワークである textbfHEI を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:15:38 GMT)
On the practicality of quantum sieving algorithms for the shortest vector problem [42.7] 格子ベースの暗号は、量子後暗号の主要な候補の1つである。
量子攻撃に対する暗号セキュリティは、最短ベクトル問題(SVP)のような格子問題に基づいている
SVPを解くための漸近的な量子スピードアップはGroverの探索に依存している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:54:41 GMT)
DreamVideo-2: Zero-Shot Subject-Driven Video Customization with Precise Motion Control [42.5] 本研究では、特定の主題と動きの軌跡でビデオを生成することができるゼロショットビデオカスタマイズフレームワークDreamVideo-2を提案する。
具体的には,対象学習におけるモデル固有の能力を活用する参照アテンションを導入する。
我々は,ボックスマスクの頑健な動作信号を完全に活用して,高精度な動作制御を実現するためのマスク誘導型モーションモジュールを考案した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:52:57 GMT)
DALK: Dynamic Co-Augmentation of LLMs and KG to answer Alzheimer's Disease Questions with Scientific Literature [42.5] 我々は,LDMとKGの動的共拡張(DALK)について紹介する。
LLMとKGの相乗化フレームワークを相互に強化することで、まずLLMを活用して進化するAD固有の知識グラフを構築する。
そこで我々は,KGから適切な知識を抽出し,LLM推論能力を増強するために,新しい自己認識型知識検索手法を用いた粗大なサンプリング手法を用いる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:31:13 GMT)
From chalkboards to chatbots: SELAR assists teachers in embracing AI in the curriculum [41.9] SELARは、教師が人工知能をカリキュラムに統合するためのフレームワークである。
本稿では,Hague University of Applied Sciencesの講師が主催するワークショップを通じて,フレームワークの有効性を評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:40:59 GMT)
Scaling laws for post-training quantized large language models [41.8] 良く訓練された大言語モデル(LLM)の一般化能力は、モデルサイズの関数として予測可能であることが知られている。
後処理後圧縮後のLCMの品質は予測不可能であり,ケースバイケースの検証が必要となることが多い。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:40:13 GMT)
RecoveryChaining: Learning Local Recovery Policies for Robust Manipulation [41.4] 本稿では,ロボットの回復方針を個別に学習するために階層的強化学習を提案する。
回復方針は、感覚観測に基づいて故障が検出されたときに起動され、ロボットをタスクを完了できる状態に導こうとする。
提案手法は,3段階の多段階操作タスクにおいて,低報酬で評価し,ベースラインで学習したものよりもはるかに堅牢な回復ポリシーを学習する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:14:43 GMT)
Unconstrained Model Merging for Enhanced LLM Reasoning [41.3] 複数のエキスパートモデルをひとつの大きな言語モデルにマージする可能性について検討する。
等質なモデルアーキテクチャと異質なモデルアーキテクチャの両方に対応可能な,制約のないモデルマージフレームワークを提案する。
7つのベンチマークと9つの推論最適化LDMで、推論がマージから出現する重要な発見を明らかにする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:04:07 GMT)
Spiking GS: Towards High-Accuracy and Low-Cost Surface Reconstruction via Spiking Neuron-based Gaussian Splatting [41.3] 3Dガウシアン・スプレイティングは、数分で3Dシーンを再構築することができる。
表面再構成精度の進歩にもかかわらず、再建された結果は依然としてバイアスを示し、保存とトレーニングの非効率さに悩まされている。
本稿は,低効率部品の統合に起因する非効率性の原因と復元バイアスについて,異なる観察結果を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:25:01 GMT)
Spiking GS: Towards High-Accuracy and Low-Cost Surface Reconstruction via Spiking Neuron-based Gaussian Splatting [41.3] 3Dガウシアン・スプレイティングは、数分で3Dシーンを再構築することができる。
表面再構成精度の進歩にもかかわらず、再建された結果は依然としてバイアスを示し、保存とトレーニングの非効率さに悩まされている。
本稿は,低効率部品の統合に起因する非効率性の原因と復元バイアスについて,異なる観察結果を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:25:01 GMT)
Spiking GS: Towards High-Accuracy and Low-Cost Surface Reconstruction via Spiking Neuron-based Gaussian Splatting [41.3] 3Dガウシアン・スプレイティングは、数分で3Dシーンを再構築することができる。
表面再構成精度の進歩にもかかわらず、再建された結果は依然としてバイアスを示し、保存とトレーニングの非効率さに悩まされている。
本稿は,低効率部品の統合に起因する非効率性の原因と復元バイアスについて,異なる観察結果を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:25:01 GMT)
Chatbot-Based Ontology Interaction Using Large Language Models and Domain-Specific Standards [41.2] 大規模言語モデル(LLM)は、SPARQLクエリ生成を強化するために使用される。
システムはユーザーの問い合わせを正確なSPARQLクエリに変換する。
確立されたドメイン固有の標準からの追加情報がインターフェースに統合される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:13:18 GMT)
ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization [41.1] Online Reward Selection and Policy Optimization (ORSO)は、オンラインモデル選択問題として報酬選択を形作る新しいアプローチである。
ORSOは、人間の介入なしに有望な報酬関数を自動的に識別するために、原則化された探索戦略を採用している。
我々はIsaac Gymシミュレータを用いて,様々な連続制御タスクに対してORSOの有効性を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:55:05 GMT)
"Vorbeşti Româneşte?" A Recipe to Train Powerful Romanian LLMs with English Instructions [40.6] ルーマニア語用にカスタマイズされたオープンソースのLLMを収集、翻訳し、評価し、リリースするのはこれが初めてです。
我々は,RoLLMsの有用性と高い性能について,各ボードにまたがって最先端の結果を得ることによって論じる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:42:19 GMT)
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers [40.4] より重要でない層をスキップすることで計算深度を動的に調整するために,MoD(Mixture of Depths)を導入した。
約束にもかかわらず、現在のMoDアプローチは未探索のままであり、2つの大きな課題に直面している。
本稿では,小さなデータセット上でのみルータを微調整し,フルモデルトレーニングに伴う計算オーバーヘッドを大幅に削減するルータチューニングを提案する。
第2の課題として,動的深度でtextitAttention をデプロイする MindSkip を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:23:50 GMT)
Representing Model Weights with Language using Tree Experts [39.9] 本稿では,モデル重みと言語の両方を組み込んだ共同空間内のモデルを表現することを学ぶ。
Probing Experts (ProbeX) は理論的に動機づけられた軽量な探査手法である。
以上の結果から, ProbeX は大規模モデルの重みを共有重み付き埋め込み空間に効果的にマッピングできることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:17:09 GMT)
Feature learning in finite-width Bayesian deep linear networks with multiple outputs and convolutional layers [39.7] 深い線形ネットワークは広く研究されているが、複数の出力と畳み込み層を持つ有限幅アーキテクチャの場合はほとんど知られていない。
我々の研究は、この物理学の直観と用語を厳密なベイズ統計に翻訳する辞書を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:15:09 GMT)
Advocate -- Trustworthy Evidence in Cloud Systems [39.6] 動的に相互接続するサービスによって特徴付けられるクラウドネイティブアプリケーションの急速な進化は、信頼性と監査可能なシステムを維持する上で重要な課題を提示します。
従来の検証と認証の方法は、クラウドコンピューティングで一般的な高速でダイナミックな開発プラクティスのため、しばしば不十分である。
本稿では、クラウドネイティブなアプリケーション操作の検証可能な証拠を生成するために設計された、エージェントベースの新しいシステムであるAdvocateを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:09:26 GMT)
Evaluating Self-Generated Documents for Enhancing Retrieval-Augmented Generation with Large Language Models [39.2] 本稿では,多種多様な自己生成文書(SGD)を包括的に分析し,知識集約型タスクの実験を行う。
我々は,SGD の分類を体系的機能言語学(SFL)に基づいて開発し,異なるSGD カテゴリーの影響を比較する。
また,SGDのカテゴリに基づくさらなる融合手法は,知識駆動型QAタスクのRAGによる大幅な進歩を実現するために,SGDをより活用するための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:38:54 GMT)
DN-4DGS: Denoised Deformable Network with Temporal-Spatial Aggregation for Dynamic Scene Rendering [39.0] 騒音抑制戦略を導入し, 標準3次元ガウスの座標の分布を変化させ, 騒音を抑制する。
Decoupled Temporal-Spatial Ag?gregation Moduleは、隣接点やフレームからの情報を集約するように設計されている。
実世界の各種データセットを用いた実験により,本手法がリアルタイムなレンダリング品質を実現することを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:43:07 GMT)
Harnessing Your DRAM and SSD for Sustainable and Accessible LLM Inference with Mixed-Precision and Multi-level Caching [38.9] 本稿では,スパースリソース制約の推論を可能にするモデルモジュール化を用いた混合精度アルゴリズムを提案する。
M2Cacheはまず神経細胞をスパースに変調し、その重要なランキングを作成する。
計算要求を減らすために、重み空間に動的混合精度量子化機構を採用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:33:39 GMT)
NFT1000: A Cross-Modal Dataset for Non-Fungible Token Retrieval [38.6] 我々は、756万の画像テキストペアを含む「NFT Top1000 Visual-Text」(NFT1000)というベンチマークデータセットを導入する。
このデータセットと、CLIPシリーズの事前学習モデルを活用することにより、動的マスキング微調整方式を提案する。
また、ビジュアルテキストペアデータの類似性と検索難度を評価するために、ロバストなメトリクス包括的変動指標(CVI)を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:53:23 GMT)
UniDrive: Towards Universal Driving Perception Across Camera Configurations [38.4] 3次元認識は,3次元2次元投影に基づく2次元画像から3次元情報を推測することを目的としている。
カメラ構成をまたいだ一般化は、異なる自動車モデルに自律運転モデルをデプロイする上で重要である。
我々は、カメラ構成全体にわたって普遍的な認識を実現するために、視覚中心の自律運転のための新しいフレームワークUniDriveを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:59 GMT)
Breaking Chains: Unraveling the Links in Multi-Hop Knowledge Unlearning [38.0] 大きな言語モデル(LLM)は、しばしば個人または著作権のあるデータを含む巨大な情報ストアとして機能し、それらをゼロから再トレーニングすることは不可能である。
MUNCHは、マルチホップクエリをサブクエストに分解し、最終的な意思決定における未学習モデルの不確実性を活用する、単純な不確実性に基づくアプローチである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:00:15 GMT)
D-FINE: Redefine Regression Task in DETRs as Fine-grained Distribution Refinement [37.8] D-FINEは、優れた位置決め精度を実現する強力なリアルタイム物体検出器である。
D-FINEは、FDRとGlobal Optimal Localization Self-Distillation(GO-LSD)の2つの重要なコンポーネントから構成される。
Objects365で事前訓練された場合、D-FINE-L / Xは57.1% / 59.3%APとなり、既存のリアルタイム検出器を全て上回っている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:57:01 GMT)
A Human-in-the-Loop Fairness-Aware Model Selection Framework for Complex Fairness Objective Landscapes [37.5] ManyFairHPOはフェアネスを意識したモデル選択フレームワークで、実践者が複雑でニュアンスのあるフェアネスの客観的な風景をナビゲートすることを可能にする。
我々は,複数のフェアネス目標のバランス,自己充足的予言などのリスク軽減,公平性を考慮したモデリング決定における利害関係者の導出のための解釈可能な洞察の提供などにおけるMaryFairHPOの有効性を実証する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:32:24 GMT)
On Diffusion Models for Multi-Agent Partial Observability: Shared Attractors, Error Bounds, and Composite Flow [37.4] 拡散モデルを用いたDEC-POMDPにおける局所的な行動観測履歴からのグローバルな状態の再構築について検討する。
ディープラーニング近似誤差により、固定点が真の状態から逸脱することを発見した。
本論文では, 理論収束が真の状態に保証されるエージェントを反復する複合拡散過程を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:23:33 GMT)
Tables as Texts or Images: Evaluating the Table Reasoning Ability of LLMs and MLLMs [37.2] 画像に基づく表表現におけるLLMの性能評価を初めて紹介する。
本研究は、テーブル関連タスクにおけるLLMの有効利用に関する知見を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:39:59 GMT)
Scalable Drift Monitoring in Medical Imaging AI [37.2] 我々は,スケーラブルなドリフトモニタリングのための拡張フレームワークであるMCC+を開発した。
それは、医療画像AIモデルのためのリアルタイムドリフト検出を導入したCheXstrayフレームワークの上に構築されている。
MMC+は、継続的パフォーマンス監視の信頼性と費用対効果を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:57:35 GMT)
Evolutionary Computation and Explainable AI: A Roadmap to Understandable Intelligent Systems [37.0] 進化的計算(EC)は、説明可能なAI(XAI)に寄与する大きな可能性を提供する
本稿では、XAIの紹介を行い、機械学習モデルを説明するための現在の技術についてレビューする。
次に、ECがXAIでどのように活用できるかを検討し、ECテクニックを取り入れた既存のXAIアプローチを調べます。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:00:45 GMT)
UCFE: A User-Centric Financial Expertise Benchmark for Large Language Models [36.7] UCFEベンチマークは、大規模な言語モデル(LLM)が複雑な現実世界の財務タスクを処理する能力を評価するために設計されている。
804名を対象に,財務課題に対するフィードバックを収集し,ユーザ調査を行った。
その結果,Pearson相関係数は0.78。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:03:52 GMT)
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations [36.6] 大規模な言語モデルは、しばしばかなりのストレージスペースを必要とする。
パラメータ数が膨大であるため、これらのモデルは大きなストレージスペースを必要とすることが多い。
1つの研究方向は、浮動小数点数の整数置換を用いてモデルを圧縮することを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:35:57 GMT)
Think Thrice Before You Act: Progressive Thought Refinement in Large Language Models [36.4] Progressive Thought Refinement (PTR) は,大規模言語モデルによる応答の段階的改善を可能にするフレームワークである。
PTRは思考データ構築と思考マスク微調整フェーズの2段階で動作する。
実験の結果, PTRは10種類のタスクにおいてLLM性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:23:24 GMT)
AdaSwitch: Adaptive Switching between Small and Large Agents for Effective Cloud-Local Collaborative Learning [36.4] 本研究では,大規模クラウドベースLLMと小規模ローカルデプロイLLMの協調運用を容易にする新しいLCM利用パラダイムを提案する。
本フレームワークは,比較的小型のLLMをインスタンス化したローカルエージェントと,大型のLLMを搭載したクラウドエージェントの2つの主要モジュールから構成される。
この協調処理は、ローカルエージェントがエラーを内観的に識別し、クラウドエージェントから積極的に支援を求める適応機構によって実現される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:07:37 GMT)
Granular Privacy Control for Geolocation with Vision Language Models [36.3] GPTGeoChatと呼ばれる新しいベンチマークを開発し、ユーザとの位置情報対話を適度に行うビジョン言語モデルの能力をテストする。
我々は,室内アノテータとGPT-4v間の1,000の画像位置情報の会話を収集する。
位置情報が多すぎるかどうかを判断することで,GPT-4vの位置情報会話を適度に行う様々なVLMの能力を評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:58:53 GMT)
Cross-Lingual Auto Evaluation for Assessing Multilingual LLMs [36.3] Herculeは、英語で利用可能な参照回答に基づいて、応答にスコアを割り当てることを学ぶ言語間評価モデルである。
本研究は,LLMを用いた言語横断評価の総合的研究であり,多言語評価のためのスケーラブルで効果的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:45:32 GMT)
Simulating electronic structure on bosonic quantum computers [35.9] 量子コンピューティングの最も有望な応用の1つは、多くのフェルミオン問題のシミュレーションである。
電子構造であるハミルトニアンは、量子ビット支援フェルミオン-クモドマッピングにより、量子モードの系に変換できることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:34:31 GMT)
Generative Location Modeling for Spatially Aware Object Insertion [35.6] 生成モデルは、オブジェクト挿入を含む画像編集タスクの強力なツールになっている。
本稿では,現実的な物体の位置を識別するための位置モデルの構築に焦点をあてる。
具体的には,背景画像と所望のオブジェクトクラスに条件付き境界ボックス座標を生成する自己回帰モデルを訓練する。
この定式化により、スパース配置アノテーションを効果的に処理し、直接選好最適化を行うことで、不明瞭な位置を選好データセットに組み込むことができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:00:41 GMT)
RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models [35.6] 現在の医療用大規模視覚言語モデル(Med-LVLM)は、しばしば現実の問題に遭遇する。
外部知識を利用するRAGは、これらのモデルの現実的精度を向上させることができるが、2つの大きな課題を提起する。
本稿では,2つのコンポーネントからなるRULEを提案する。まず,検索したコンテキストの選択を通じて事実性リスクを制御するための有効な戦略を提案する。
次に、検索したコンテキストへの過度な依存がエラーを引き起こしたサンプルに基づいて、選好データセットをキュレートしてモデルを微調整する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:55:28 GMT)
Seeing Through VisualBERT: A Causal Adventure on Memetic Landscapes [35.4] 構造因果モデル(SCM)に基づくフレームワークを提案する。
このフレームワークでは、VisualBERTは、ミーム入力と因果概念の両方に基づいて、入力ミームのクラスを予測するように訓練されている。
入力属性法は我々のフレームワークの因果性を保証するものではないことが分かり、安全クリティカルなアプリケーションにおけるそれらの信頼性に関する疑問を提起する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:32:00 GMT)
Optimal Quantization for Matrix Multiplication [35.0] 我々は、ネスト格子に基づく普遍量化器を、任意の(非ランダムな)行列対に対する近似誤差の明示的な保証付きで、フロベニウスノルム$|A|_F, |B|_F$, $|Atop B|_F$のみの観点から、$A$, $B$とする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:19:48 GMT)
uDistil-Whisper: Label-Free Data Filtering for Knowledge Distillation in Low-Data Regimes [34.9] ラベル付きデータを用いることなく,大きなWhisperモデルを比較的小さなモデルに蒸留できることを示す。
私たちのモデルは、教師モデルと同等以上の性能を維持しながら、計算効率とメモリ効率も25~50%向上しています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:15:16 GMT)
SpreadsheetBench: Towards Challenging Real World Spreadsheet Manipulation [34.8] SpreadsheetBenchは,現在の大規模言語モデル(LLM)を,スプレッドシートユーザのワークフローにマージするように設計されている。
合成クエリと単純化されたスプレッドシートファイルに依存する既存のベンチマークとは異なり、SpreadsheetBenchはオンラインExcelフォーラムから収集された912の質問から作られている。
単一ラウンドおよび複数ラウンドの推論条件下での各種LLMの総合評価は,最先端モデル(SOTA)と人為的性能との間に大きなギャップがあることを示唆している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:23:23 GMT)
t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving [34.5] t-READiは,マルチモーダルセンサデータの変動を考慮した適応型推論システムである。
平均推論精度を6%以上改善し、推論遅延を約15倍削減する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:14:37 GMT)
t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving [34.5] t-READiは,マルチモーダルセンサデータの変動を考慮した適応型推論システムである。
平均推論精度を6%以上改善し、推論遅延を約15倍削減する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:14:37 GMT)
CREAM: Consistency Regularized Self-Rewarding Language Models [34.3] 自己回帰型大規模言語モデル (LLM) は, 優先データに対する人間のアノテーションを必要とせずに, LLM-as-a-Judge を用いてアライメント性能を向上させることに成功した。
しかし、報酬とランキングの正確性は保証されていないため、精度の高い報酬と高品質な選好データを保証するのに不可欠である。
本稿では,各イテレーション間の報酬整合性を利用して自己回帰訓練を規則化する一貫性正規化sElf-rewarding lAnguage Model (CREAM)を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:47:35 GMT)
A Self-Constructing Multi-Expert Fuzzy System for High-dimensional Data Classification [33.9] Fuzzy Neural Networks (FNN) は、分類タスクに有効な機械学習モデルである。
自己構築型多機能ファジィシステム(SOME-FS)を提案する。
混合構造学習とマルチエキスパート先進学習の2つの学習戦略を組み合わせる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:41:54 GMT)
From Redundancy to Relevance: Information Flow in LVLMs Across Reasoning Tasks [33.5] 我々は,視覚的質問応答と画像キャプションタスクのために,様々なLVLMの切り抜き戦略を用いて実験を行った。
視覚的表現の貢献の観点から情報の流れを探索することにより、浅い層に収束する傾向にあるが、より深い層に分散する傾向があることを観察する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:17:25 GMT)
An Evolved Universal Transformer Memory [33.3] 従来の手法では, コンテクストの特定の部分を手作業によるルールで取り除き, 現代的な基礎モデルのエスカレーションコストを相殺することを提案した。
我々は、トランスの性能と効率を両立させる学習されたメモリ管理ネットワークを導入することで、このトレードオフを克服する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:47:10 GMT)
Single-Timescale Multi-Sequence Stochastic Approximation Without Fixed Point Smoothness: Theories and Applications [33.2] マルチシーケンス近似(Multi-sequence Approximation, SA)は、信号処理や機械学習の分野において、多列SA(Multi-sequence SA)として知られる複数の結合配列を含む。
固定点の滑らかさを仮定することなく,MSSAに対してより厳密な単一時間スケール解析を行う。
これらの理論的知見を双方向の最適化と通信効率のよい分散学習に適用することにより、性能保証を伴う緩和された仮定および/またはより単純なアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:39:53 GMT)
Advancing Large Language Model Attribution through Self-Improving [32.8] 大規模言語モデル(LLM)の帰属能力向上のためのフレームワークSTARTを提案する。
STARTは、サンプリングされた応答から構築されたきめ細かい選好監視信号を反復的に利用し、堅牢で包括的で帰属可能な生成を促進する。
ロングフォームQAとマルチステップ推論をカバーする3つのオープンドメイン質問回答データセットの実験は、平均25.13%のパフォーマンス向上を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:55:33 GMT)
SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction [32.7] 遅延層にキャッシュを選択的にドロップすることで、層間KVキャッシュの冗長性を低減できるSimLayerKVを提案する。
我々のアプローチは、長文大言語モデルのある層が「怠慢」な振る舞いを示すという観察に基づいている。
SimLayerKVは、KVキャッシュ圧縮比が5$times$で、4ビット量子化と組み合わせると1.2%の性能低下しか達成しない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:58:14 GMT)
BenTo: Benchmark Task Reduction with In-Context Transferability [32.6] 本稿では,大規模言語モデル(LLM)のベンチマークに使用するタスクを効率的に削減する方法を検討する。
In-context Learning (ICL) による2つのタスク間の伝達可能性を推定する実用的な指標を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:41:15 GMT)
Cross-Domain Graph Data Scaling: A Showcase with Diffusion Models [32.5] 拡散モデル上に構築された普遍グラフ構造拡張器UniAugを提案する。
まず、各領域にまたがる数千のグラフ上の離散拡散モデルを事前学習し、グラフ構造パターンを学習する。
下流相では,事前学習拡散モデルの助けを借りて,グラフ構造拡張を施すことにより適応的な拡張を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:56:08 GMT)
An Active Learning Framework for Inclusive Generation by Large Language Models [32.2] 大規模言語モデル(LLM)は、多様なサブ集団を表すテキストを生成する。
本稿では,知識蒸留により強化されたクラスタリングに基づくアクティブラーニングフレームワークを提案する。
2つの新しいデータセットをモデルトレーニングと組み合わせて構築し、ベースラインモデルよりも2%-10%の性能向上を示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:09:35 GMT)
Efficient Vision-Language Models by Summarizing Visual Tokens into Compact Registers [32.2] 本稿では,より小さなレジスタトークン集合に要約することで,視覚トークンの数を削減できる手法を提案する。
ビクターは4%未満の精度低下を示し、トレーニング時間を43%削減し、推論スループットを3.3倍に向上させる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:45:13 GMT)
ActionReasoningBench: Reasoning about Actions with and without Ramification Constraints [31.9] アクション・アンド・チェンジ(RAC)に関する推論(Reasoning about Actions and Change)は、AIの基本的な問題を解決する上で、歴史的に重要な役割を担ってきた。
我々は8つのドメインを含む新しい診断ベンチマークであるActionReasoningBenchを紹介し、19のアクションシーケンスに対する質問を含む。
このベンチマークは、6つの主要なRAC次元にわたるLLM(Large Language Models)を厳格に評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:48:31 GMT)
Boosting LLM Translation Skills without General Ability Loss via Rationale Distillation [31.7] 大規模言語モデル(LLM)は多くのNLPタスクにまたがって印象的な結果を得たが、それでも機械翻訳の難しさに悩まされている。
本稿では,RaDis (Rationale Distillation) と呼ばれる新しい手法を提案する。
RaDisはLLMの強力な生成能力を活用して、データトレーニングの合理性を作り、それを“再生”して、忘れることを防ぐ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:09:43 GMT)
Grounding Large Language Models in Interactive Environments with Online Reinforcement Learning [31.6] 機能的接地によるアライメントを実現するためのアプローチ(GLAM)について検討する。
エージェントが環境と対話するにつれて、段階的に更新されるポリシーとしてLLMを使用するエージェントを考える。
機能的グラウンドの高レベルな形態と空間的・ナビゲーションタスクのセットを研究するために設計された対話型テキスト環境を用いて,いくつかの科学的問題を研究する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:00:06 GMT)
Trojan Prompt Attacks on Graph Neural Networks [31.6] Graph Prompt Learning(GPL)は、トレーニング済みのGNNモデルを特定の下流タスクに適応するために、モデル全体を微調整することなくプロンプトを使用する、有望なアプローチとして導入された。
既存のグラフバックドア攻撃は、トレーニング中にモデルパラメータを変更することに依存しているが、GNNエンコーダパラメータが事前トレーニング後に凍結されるため、このアプローチは現実的ではない。
グラフプロンプトに特化して設計されたバックドアアタックフレームワークであるTGPAを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:57:27 GMT)
Prompt Compression for Large Language Models: A Survey [31.6] 本稿では, ハードプロンプト法とソフトプロンプト法に分類した, プロンプト圧縮技術の概要について述べる。
また, 各種急速圧縮手法の下流適応について検討した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:09:09 GMT)
Autonomous Agents for Collaborative Task under Information Asymmetry [31.4] Informative Multi-Agent Systems を表す新しいMASパラダイム iAgents を提案する。
iAgentsでは、ヒューマンソーシャルネットワークはエージェントネットワークにミラーされ、エージェントはタスク解決に必要な人間の情報を積極的に交換する。
実験によると、iAgentsは140人の個人と588人の関係を持つソーシャルネットワーク内で協力し、30ターン以上で自律的にコミュニケーションし、70万近いメッセージから情報を検索して3分以内にタスクを完了できる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:30:41 GMT)
Improving Bilingual Lexicon Induction with Cross-Encoder Reranking [31.1] BLICEr (BLI with Cross-Encoder Re rank) と呼ばれる新しい半教師付きポストホックリグレード法を提案する。
鍵となる考え方は、mPLMから言語間の語彙的知識を抽出し、元のCLWEと組み合わせることである。
BLICErは、多様な言語にまたがる2つの標準BLIベンチマークで、新しい結果を確立している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:47:50 GMT)
Superlatives in Context: Modeling the Implicit Semantics of Superlatives [31.1] 重ね合わせは、最大/最小の性質を持つ要素を選別するために用いられる。
重ね合わせは暗黙の現象や談話制限を研究するのに理想的な現象である。
現代のモデルでは、文脈における最上級のセマンティクスの微粒化が困難であることが示される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:19:32 GMT)
TAIA: Large Language Models are Out-of-Distribution Data Learners [30.6] 効果的な推論時間介入手法を提案する:全てのパラメータを訓練するが、注意のみで推論する(trainallInfAttn)。
trainallInfAttnは、ほとんどのシナリオで完全に調整されたモデルとベースモデルの両方と比較して、優れた改善を実現している。
trainallInfAttnのデータのミスマッチに対する高い耐性は、jailbreakのチューニングに耐性を持ち、一般的なデータを使った特別なタスクを強化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:37:23 GMT)
Observation of string-breaking dynamics in a quantum simulator [30.4] 弦を破る力学は、高エネルギー粒子衝突や初期の宇宙の進化において重要な役割を果たす。
量子シミュレータは古典的な計算手法より優れていることが期待されている。
弦破りの力学をシミュレートするために必要な実験能力を初めて実験で実証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:46:07 GMT)
Self-Supervised Scene Flow Estimation with Point-Voxel Fusion and Surface Representation [30.4] シーンフロー推定は、点雲の2つの連続するフレーム間の点の3次元運動場を生成することを目的としている。
既存の点ベースの手法は点雲の不規則性を無視し、長距離依存を捉えるのが困難である。
本稿では,分散グリッドアテンションとシフトウインドウ戦略に基づくボクセルブランチを用いて,長距離依存性を捕捉するポイントボクセル融合法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:05:15 GMT)
CLIMB: Language-Guided Continual Learning for Task Planning with Iterative Model Building [30.3] ロボットタスク計画のための連続学習フレームワークCLIMBを提案する。
CLIMBは、自然言語の記述からモデルを構築し、タスクを解決しながら、予期せぬ述語を学び、その情報を将来の問題に保存する。
またBlocksWorld++ドメインも開発しています。これは、簡単に使える実環境と、継続的な学習を評価するのに困難なタスクのカリキュラムを兼ね備えたシミュレーション環境です。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:53:43 GMT)
GeSubNet: Gene Interaction Inference for Disease Subtype Network Generation [29.9] 知識データベースから遺伝子機能ネットワークを取得することは、疾患ネットワークとサブタイプ固有のバリエーションのミスマッチによる課題である。
本稿では、異なる疾患サブタイプを区別しながら、遺伝子相互作用を予測できる統一表現を学習するGeSubNetを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:58:57 GMT)
Deep Learning-based Software Engineering: Progress, Challenges, and Opportunities [29.9] ディープラーニングベースのソフトウェアエンジニアリングに関する最初のタスク指向調査を示す。
ディープラーニングのテクニックに大きく影響された、12のソフトウェアエンジニアリングサブ領域をカバーする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:46:00 GMT)
Eliciting Uncertainty in Chain-of-Thought to Mitigate Bias against Forecasting Harmful User Behaviors [29.9] 会話予測タスクは、展開された会話の結果を予測するモデルである。
ソーシャルメディアのモデレーションに応用すれば、有害なユーザーの行動を予測することができる。
本稿では,潜在的なバイアスを軽減するツールとして,モデルの不確実性がどの程度有効かを検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:07:53 GMT)
WinoQueer: A Community-in-the-Loop Benchmark for Anti-LGBTQ+ Bias in Large Language Models [29.8] WinoQueerは、大きな言語モデル(LLM)がLGBTQ+コミュニティに有害なバイアスをエンコードするかどうかを測定するために設計されたベンチマークである。
我々はこのベンチマークをいくつかの人気のあるLCMに適用し、オフザシェルフモデルが一般に相当なアンチキーバイアスを示すことを発見した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:30:08 GMT)
Towards Satellite Non-IID Imagery: A Spectral Clustering-Assisted Federated Learning Approach [29.6] 低軌道(LEO)衛星は、様々なモノのインターネット(IoT)アプリケーションを実現するために、豊富な地球観測データ(EOD)を集めることができる。
効率的なEDD処理機構を実現するためには,1) 衛星と地上局の接続が間欠的であるため,大規模なデータを地上に送信することなく観測データを処理すること,2) 非独立で同一の(非IID)衛星データを処理すること,の課題を検討する必要がある。
軌道を用いたスペクトルクラスタリングによるクラスタリング型自己知識蒸留(OSC-FSKD)を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:36:58 GMT)
ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries [29.6] 大型言語モデル(LLM)は、意図した意味から逸脱する幻覚出力の傾向にある。
コード要約における幻覚検出に特化してキュレートされた$sim$10Kのサンプルを用いたファースト・オブ・ザ・キンドデータセットを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:38:55 GMT)
Dataset Condensation for Recommendation [29.2] 推奨に適した軽量凝縮フレームワーク(DConRec)を提案する。
我々は,確率論的アプローチによる個別のユーザとイテムのインタラクションをモデル化し,ユーザの潜在的な嗜好を凝縮したデータセットに組み込むために,事前拡張モジュールを設計する。
複数の実世界のデータセットに対する実験結果から,本フレームワークの有効性と有効性が確認された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:35:41 GMT)
Representation Learning of Structured Data for Medical Foundation Models [29.1] 我々はUniStructアーキテクチャを導入し、構造化されていないテキストと構造化データのマルチモーダル医療基盤モデルを設計する。
本手法は,広範囲な内部医療データベースと構造化医療記録の公開リポジトリのモデル事前学習を通じて検証される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:02:28 GMT)
Can MLLMs Understand the Deep Implication Behind Chinese Images? [29.0] 中国語画像に対するMLLMの高次知覚と理解能力を評価することを目的とした**C**hinese **I**mage **I**mplication understanding **Bench*mark, **CII-Bench**を紹介する。
CII-Benchの画像は中国のインターネットからソースされ、手動でレビューされ、それに対応する回答も手動で作成される。
CII-Benchは中国伝統文化のイメージを取り入れており、中国の伝統文化に対するモデルの理解を深く反映している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:24 GMT)
ConsisSR: Delving Deep into Consistency in Diffusion-based Image Super-Resolution [28.9] 実世界の超解像(Real-ISR)は、未知の複雑な劣化によって劣化した低品質(LQ)入力から高品質(HQ)イメージを復元することを目的としている。
セマンティックとピクセルレベルの整合性を扱うためにConsisSRを導入する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:41:52 GMT)
Efficient Deep Learning Board: Training Feedback Is Not All You Need [28.9] 自動性能予測とコンポーネントレコメンデーションのための革新的なディープラーニングボードであるEfficientDLを提案する。
トレーニングのフィードバックがない魔法は、提案した包括的で多次元できめ細かいシステムコンポーネントデータセットから来ています。
例えば、EfficientDLはResNet50、MobileNetV3、EfficientNet-B0、MaxViT-T、Swin-B、DaViT-Tといった主流モデルとシームレスに動作する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:43:34 GMT)
A Little Human Data Goes A Long Way [28.8] Fact Verification (FV) と Question Answering (QA) における合成データの利用について検討する。
純粋に合成されたデータに基づいてトレーニングされたモデルは、125個の人為的なデータポイントを含むことで、確実に改善できることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:04:02 GMT)
DriveDreamer4D: World Models Are Effective Data Machines for 4D Driving Scene Representation [28.6] textitDriveDreamer4Dを導入し,世界モデルの先行モデルを利用した4次元運転シーン表現を強化した。
われわれの知る限り、TextitDriveDreamer4Dは、運転シナリオにおける4D再構成を改善するためにビデオ生成モデルを利用した最初のものである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:07:46 GMT)
IterSelectTune: An Iterative Training Framework for Efficient Instruction-Tuning Data Selection [28.6] 高品質な命令データを選択するための効率的で費用対効果の高い反復的トレーニングポリシーである$textbfIterSelectTune$を紹介した。
ソースデータの約20%を微調整することで、本手法は、全データセット上で調整されたモデルよりも一貫して優れる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:48:57 GMT)
Cefdet: Cognitive Effectiveness Network Based on Fuzzy Inference for Action Detection [28.4] 本研究ではファジィ推論(Cefdet)に基づく認知効果ネットワークを提案する。
人間の認知をシミュレートする「認知に基づく検出」の概念を導入する。
Cefdetは、公開データセット上のいくつかの主流アルゴリズムに対して、優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:16:52 GMT)
Cefdet: Cognitive Effectiveness Network Based on Fuzzy Inference for Action Detection [28.4] 本研究ではファジィ推論(Cefdet)に基づく認知効果ネットワークを提案する。
人間の認知をシミュレートする「認知に基づく検出」の概念を導入する。
Cefdetは、公開データセット上のいくつかの主流アルゴリズムに対して、優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:16:52 GMT)
Stochastic Flow Matching for Resolving Small-Scale Physics [28.3] 気象などの物理科学では、超解答の小さな詳細が大きな課題となっている。
入力を潜在基底分布に符号化し、次いでフローマッチングを行い、小規模物理を生成する。
我々は現実世界のCWA気象データセットとPDEベースのコルモゴロフ気象データセットの両方について広範な実験を行った。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:09:13 GMT)
SafeGen: Mitigating Sexually Explicit Content Generation in Text-to-Image Models [28.2] テキスト・ツー・イメージ・モデルは、安全でない作業用コンテンツ(NSFW)を生成するために騙されることがある。
我々は、テキスト・ツー・イメージ・モデルによる性的コンテンツ生成を緩和するフレームワークであるSafeGenを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:28:23 GMT)
Temporal-Enhanced Multimodal Transformer for Referring Multi-Object Tracking and Segmentation [28.2] Referring Multi-object Tracking (RMOT)は、ビデオ中の任意の数の対象物を見つけることを目的とした、新たなクロスモーダルタスクである。
本稿では, Transformer アーキテクチャの利点を活用するために TenRMOT と呼ばれる小型トランスフォーマー方式を提案する。
TenRMOTは参照マルチオブジェクト追跡とセグメンテーションタスクの両方において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:07:05 GMT)
IGOR: Image-GOal Representations are the Atomic Control Units for Foundation Models in Embodied AI [28.2] Image-Goal Representations (IGOR)は、人間やさまざまなロボットにまたがる統一的で意味的に一貫したアクション空間を学習する。
IGORは大規模ロボットと人間の活動データ間の知識伝達を可能にする。
我々はIGORが人間とロボットの知識伝達と制御の新しい可能性を開くと考えている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:41:16 GMT)
MixEval-X: Any-to-Any Evaluations from Real-World Data Mixtures [28.1] MixEval-Xは,入力と出力のモダリティをまたいだ評価を最適化する,世界初の実世界のベンチマークである。
実世界のタスク分布を再構築するために,マルチモーダルベンチマークと適応修正パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:52:28 GMT)
Accounting for Sycophancy in Language Model Uncertainty Estimation [28.1] 梅毒率と不確実性評価との関係を初めて検討した。
ユーザの信頼感は,梅毒の影響を調節する上で重要な役割を担っていることを示す。
モデルとユーザの不確実性の両方を外部化することは、梅毒のバイアスの影響を軽減するのに役立ちます。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:00:25 GMT)
Suitability of KANs for Computer Vision: A preliminary investigation [28.0] Kolmogorov-Arnold Networks (KAN) はニューラルネットワークのパラダイムを導入し、ネットワークの端に学習可能な関数を実装する。
本研究は、視覚モデルにおけるkansの適用性と有効性を評価し、基本的な認識とセグメンテーションタスクに焦点をあてる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:02:17 GMT)
Building Better: Avoiding Pitfalls in Developing Language Resources when Data is Scarce [27.9] 与えられた言語のデータは、トークンの集まり以上のものと見なすべきである。
優れたデータ収集とラベル付けのプラクティスは、より人間中心で社会的に意識した技術を構築する上で鍵となる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:32:23 GMT)
aiXcoder-7B: A Lightweight and Effective Large Language Model for Code Completion [27.3] 本稿では,aiXcoder-7Bというコード補完のための軽量で効果的なLarge Language Model (LLM)を提案する。
既存のLLMと比較すると、aiXcoder-7Bのコード補完精度は高く、スケールは小さい(70億のパラメータ)。
我々は,aiXcoder-7Bの優位性を,(1)多目的学習,(2)多種多様なデータサンプリング戦略,(3)広範囲な高品質データという3つの重要な要因とみなす。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:32:02 GMT)
Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.3] MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。
GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。
実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:56:12 GMT)
Identifying Privacy Personas [27.3] プライバシ・ペルソナは、自身の知識、行動パターン、自己効力度レベル、プライバシ保護の重要性に対する認識に関して、ユーザセグメントの違いを捉えている。
文学では様々なプライバシ・ペルソナが派生しているが、重要な属性の観点から異なる人物をまとめている。
本研究では,対話型教育アンケートに対する質的,定量的な回答分析を組み合わせることで導出する8つのペルソナを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:49:46 GMT)
Identifying High Consideration E-Commerce Search Queries [27.2] 本稿では,Eコマースサイトにおけるハイリフレクション(HC)クエリを識別するために,EQR(Engagement-based Query Ranking)アプローチを提案する。
EQRは、人気信号よりも、顧客の行動、財務、カタログ情報に関連するクエリレベルの特徴を優先する。
モデルは商業的にデプロイされ、ダウンストリームの顧客への影響の観点から、人間の選択したクエリよりも優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:22:42 GMT)
Average gradient outer product as a mechanism for deep neural collapse [26.9] Deep Neural Collapse (DNC)は、Deep Neural Networks (DNN)の最終層におけるデータ表現の驚くほど硬い構造を指す。
本研究では,平均勾配外積(AGOP)を通した特徴学習によりDNCが生成するデータ依存環境を提案する。
特徴学習体制下で訓練されたニューラルネットワークに対して,適切な特異ベクトルと重みの値が,クラス内変動の崩壊の大部分の原因となることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:25:39 GMT)
LLM-based Unit Test Generation via Property Retrieval [26.9] プロパティベースのRetrieval Augmentationは、基本的なベクトル、テキスト類似性、グラフベースのメソッドを超えてLLMベースのRetrieval-Augmented Generationを拡張する。
提案手法では,タスク固有のコンテキストを考慮し,プロパティ検索機構を導入している。
提案手法は,前処理,プロパティ検索,単体テスト生成を逐次実行するAPTと呼ばれるツールに実装する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:33:12 GMT)
InstructAny2Pix: Flexible Visual Editing via Multimodal Instruction Following [26.5] InstructAny2Pixは、ユーザが音声、画像、テキストを含む命令を使って入力画像を編集できるフレキシブルなマルチモーダル命令フォローシステムである。
本システムでは,命令誘導型編集タスクを複数実施できることを実証する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:30:33 GMT)
Disentangling Likes and Dislikes in Personalized Generative Explainable Recommendation [26.2] ユーザの感情に焦点をあてた新しいデータセットと評価手法を導入する。
購入後のレビューから,ユーザの肯定的,否定的な意見を明示的に抽出し,データセットを構築する。
生成した説明文がユーザの感情に合致するかどうかに基づいてシステムを評価することを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:15:00 GMT)
FAMSeC: A Few-shot-sample-based General AI-generated Image Detection Method [26.1] 本稿では,LoRAをベースとしたForgery Awareness ModuleとSemantic特徴誘導型コントラスト学習戦略に基づく汎用AI生成画像検出手法であるFAMSeCを提案する。
実験によると、FAMSeCは最先端の手法より優れており、トレーニングサンプルの0.56%で分類精度が14.55%向上している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:21:43 GMT)
Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach [26.0] Retrieval Augmented Generation (RAG) は、Large Language Models (LLM) において、過度に長いコンテキストを効率的に処理するための強力なツールである。
RAGとLong-context (LC) LLMを比較し,両者の強みを活用することを目的とした。
本稿では, モデル自己回帰に基づいて, クエリをRAGやLCにルーティングする, 単純かつ効果的な手法であるSelf-Routeを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:51:19 GMT)
Annealed Stein Variational Gradient Descent for Improved Uncertainty Estimation in Full-Waveform Inversion [25.7] 変分推論 (VI) は、パラメトリックまたは非パラメトリックな提案分布の形で後部分布に近似的な解を与える。
本研究は、フルウェーブフォーム・インバージョンにおけるVIの性能向上を目的としている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:15:26 GMT)
AnyDesign: Versatile Area Fashion Editing via Mask-Free Diffusion [25.6] ファッション画像編集は、与えられた指示に基づいて人物の外観を変更することを目的としている。
現在の手法ではセグメンタやキーポイント抽出器のような補助的なツールが必要であり、柔軟性と統一されたフレームワークが欠如している。
本稿では,多目的領域におけるマスフリー編集を可能にする拡散法であるAnyDesignを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:58:47 GMT)
AnyDesign: Versatile Area Fashion Editing via Mask-Free Diffusion [25.6] ファッション画像編集は、与えられた指示に基づいて人物の外観を変更することを目的としている。
現在の手法ではセグメンタやキーポイント抽出器のような補助的なツールが必要であり、柔軟性と統一されたフレームワークが欠如している。
本稿では,多目的領域におけるマスフリー編集を可能にする拡散法であるAnyDesignを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:58:47 GMT)
Generating Signed Language Instructions in Large-Scale Dialogue Systems [25.6] 我々は、アメリカン手話(ASL)命令で強化された目標指向対話型AIシステムを導入する。
本システムは,ユーザからの入力を受信し,検索手法と認知に基づく光沢変換を活用して,ASL命令をシームレスに生成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:56:29 GMT)
Parameter-efficient Adaptation of Multilingual Multimodal Models for Low-resource ASR [25.6] マルチモーダルモデルは、テキストのみの適応とパラメータ効率のよいASR微調整によって、ラベルなしのテキストを活用することができる。
ゼロショット設定でベースラインよりも17%のWER削減を実現し,ハイリソース言語からの言語間移動を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:19:44 GMT)
Larger Language Models Don't Care How You Think: Why Chain-of-Thought Prompting Fails in Subjective Tasks [25.6] In-Context Learning (ICL) in Large Language Models (LLM) が自然言語処理の主流の手法として登場した。
ICLはタスク先行の検索に大きく依存しており、タスクを実行するための"学習"は少なくなっている。
驚くべきことに、CoT(Chain-of-Thought)は、大きな言語モデルではICLと同じ後方崩壊に悩まされている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:02:02 GMT)
Repetition Neurons: How Do Language Models Produce Repetitions? [25.4] 本稿では,テキスト生成タスクにおける繰り返し問題の原因となるスキルニューロンとして,反復ニューロンを紹介する。
近年の訓練済み言語モデルにより生成されたテキストの繰り返し開始前後のアクティベーション値を比較することで、これらの繰り返しニューロンを同定する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:43:47 GMT)
Unlocking the Capabilities of Masked Generative Models for Image Synthesis via Self-Guidance [25.4] Masked Generative Model (MGM)は、非常に効率的なサンプリングステップを提供しながら、印象的な生成能力を示している。
本稿では,より優れた生成品質を実現する自己誘導サンプリング手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:48:05 GMT)
Beyond Instruction Following: Evaluating Inferential Rule Following of Large Language Models [25.3] 大規模言語モデル(LLM)は、安全で正確でインテリジェントな実世界のシナリオによって制御され、ガイドされるはずである。
LLMの推論規則追従能力を評価しようとする従来の研究は、推論規則追従のシナリオと命令追従のシナリオを区別することができない。
本稿では、まず、推論規則追従の概念を明らかにし、推論規則追従能力の多様化範囲を評価するための総合的なベンチマークであるルールベンチを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:00:19 GMT)
Beyond Instruction Following: Evaluating Inferential Rule Following of Large Language Models [25.3] 大規模言語モデル(LLM)は、安全で正確でインテリジェントな実世界のシナリオによって制御され、ガイドされるはずである。
LLMの推論規則追従能力を評価しようとする従来の研究は、推論規則追従のシナリオと命令追従のシナリオを区別することができない。
本稿では、まず、推論規則追従の概念を明らかにし、推論規則追従能力の多様化範囲を評価するための総合的なベンチマークであるルールベンチを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:00:19 GMT)
Reward-free World Models for Online Imitation Learning [25.3] 本研究では,報酬のない世界モデルを活用したオンライン模倣学習手法を提案する。
提案手法は, 復元を伴わない潜在空間における環境力学を学習し, 効率的かつ高精度なモデリングを可能にする。
DMControl,myoSuite, ManiSkill2 など,様々なベンチマークを用いて本手法の評価を行い,既存手法と比較して優れた実証性能を示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:13:32 GMT)
An Empirical Study of the Non-determinism of ChatGPT in Code Generation [25.3] 本稿では,非決定論が実際に高いことを実証するための実証的研究を行う。
我々は,3つのコード生成ベンチマークから829個のコード生成問題を解析した結果を報告する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:38:59 GMT)
Web Agents with World Models: Learning and Leveraging Environment Dynamics in Web Navigation [25.3] 本稿では,WMA(World-model-augmented, WMA)Webエージェントを提案する。
WebArenaとMind2Webの実験は、私たちの世界モデルが、トレーニングなしでエージェントのポリシー選択を改善していることを示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:37:00 GMT)
Cyber Attacks Prevention Towards Prosumer-based EV Charging Stations: An Edge-assisted Federated Prototype Knowledge Distillation Approach [25.2] 本稿では,1)ネットワークトラフィック(NT)データに対するサイバーアタック検出と,2)サイバーアタック介入の2つの側面について述べる。
本稿では,各クライアントを専用ローカルエッジサーバ(DLES)上に配置するエッジ支援型プロトタイプ知識蒸留(E-FPKD)手法を提案する。
実験分析により、提案したE-FPKDは、NSL-KDD、UNSW-NB15、IoTID20データセット上で最大のODCを達成可能であることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:31:55 GMT)
LocateBench: Evaluating the Locating Ability of Vision Language Models [25.1] この能力を評価するためのベンチマークを提案する。
いくつかの大きな視覚言語モデルの精度を計測する。
最強モデルであるGPT-4oの精度でさえ、人間の精度を10%以上遅れている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:48:24 GMT)
Solving Prior Distribution Mismatch in Diffusion Models via Optimal Transport [24.9] 近年,拡散モデル(DM)に関する知識は著しく増大しているが,いくつかの理論的なギャップが残っている。
本稿では、最適輸送(OT)理論と離散初期分布を持つDMとの深い関係について検討する。
拡散終了時間が増加するにつれて、確率フローは古典モンジュ・アンペア方程式の解の勾配に指数関数的に収束する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:54:55 GMT)
Accelerating Codec-based Speech Synthesis with Multi-Token Prediction and Speculative Decoding [24.5] 本稿では,推論中の速度と品質のトレードオフを,追加のトレーニングを必要とせずに柔軟に行うことができる拡張推論手法を提案する。
私たちの中核となる考え方は、複数の予測ヘッドを使用して、ARモジュールの推論ステップ毎に複数のトークンを予測することです。
実験では,各トークンの予測に要する時間は,ベースラインモデルと比較して4~5に短縮された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:55:26 GMT)
Avoiding Copyright Infringement via Large Language Model Unlearning [24.1] 本稿では,複数段階にわたる大規模言語モデルから著作権付きコンテンツを解放するための新しいフレームワークを提案する。
ランダムなラベリング損失を導入し、モデルの汎用的知識を確実に維持することにより、未学習の有効性を向上させる。
実験結果から,SSUは未学習の有効性と汎用言語能力とのトレードオフを効果的に達成できることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:15:31 GMT)
An Online Learning Approach to Prompt-based Selection of Generative Models [23.9] 様々な入力プロンプトに対する最良の生成モデルのオンライン識別は、サブ最適モデルのクエリに関連するコストを削減できる。
与えられた入力プロンプトに対して最適なデータ生成モデルを予測するためのオンライン学習フレームワークを提案する。
実画像と画像と画像の合成モデルを用いた実験により,RFF-UCBは最適な生成モデルを特定するのに成功していることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:33:35 GMT)
Experimental Contexts Can Facilitate Robust Semantic Property Inference in Language Models, but Inconsistently [23.6] 本稿では,実験環境がプロパティ継承を行う際のLMの堅牢性を向上させることができるケーススタディを提案する。
タスクの最小限の修正により、いくつかのLMは入力から浅い非セマンティックを拾うことが判明した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:06:23 GMT)
MedCare: Advancing Medical LLMs through Decoupling Clinical Alignment and Knowledge Aggregation [23.6] 大規模言語モデル(LLM)は、特に医学分野で価値のある自然言語理解と生成の進歩を示す。
従来のアプローチでは後者のタスクを無視するか、少数のタスクに集中していたため、一般化が失われる。
このパイプラインは、ナレッジアグリゲータとノイズアグリゲータを使用して、最初の段階で多様な知識を符号化し、有害情報をフィルタリングする。
MedCare (1.8B, 7B, 14B) の様々なモデルサイズは、いずれも類似のモデルサイズを持つ既存のモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:04:54 GMT)
Bias Behind the Wheel: Fairness Testing of Autonomous Driving Systems [23.5] 本稿では,自律走行システムにおける重要な課題である自動歩行者検出の公平性試験を行う。
我々は,大規模な実世界のデータセットを用いて,人口集団間で最先端のディープラーニングに基づく歩行者検出器を8つ評価した。
以上の結果より, 未発見児の割合は, 成人より20.14%高かった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:53:57 GMT)
FairMindSim: Alignment of Behavior, Emotion, and Belief in Humans and LLM Agents Amid Ethical Dilemmas [23.3] FairMindSimを導入し、不公平なシナリオを通じて道徳的ジレンマをシミュレートした。
我々はLLMエージェントを用いて人間の行動をシミュレートし,様々な段階のアライメントを確保した。
以上の結果から,GPT-4oは社会的正義の感覚が強く,人間はより豊かな感情を呈することが明らかとなった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:02:31 GMT)
FairMindSim: Alignment of Behavior, Emotion, and Belief in Humans and LLM Agents Amid Ethical Dilemmas [23.3] FairMindSimを導入し、不公平なシナリオを通じて道徳的ジレンマをシミュレートした。
我々はLLMエージェントを用いて人間の行動をシミュレートし,様々な段階のアライメントを確保した。
以上の結果から,GPT-4oは社会的正義の感覚が強く,人間はより豊かな感情を呈することが明らかとなった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:02:31 GMT)
BQA: Body Language Question Answering Dataset for Video Large Language Models [23.2] 非言語コミュニケーションは形式的な規則を欠き、常識的理解に基づく複雑な推論を必要とする。
身体言語を正確に解釈するビデオ大言語モデル(VideoLLMs)は、人間の無意識行動がモデルに意図を誤解釈させる可能性があるため、重要な課題である。
本稿では,ボディランゲージの短いクリップから感情を正しく解釈できるかどうかを検証するために,ボディーランゲージ質問応答データセットであるBQAを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:19:26 GMT)
AdaFisher: Adaptive Second Order Optimization via Fisher Information [22.9] 本稿では,適応型プレコンディショニング勾配のためのフィッシャー情報行列に対して,ブロック対角近似を利用する適応型2次のAdaFisherを提案する。
AdaFisher は精度と収束速度の両方において SOTA よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:51:23 GMT)
MobA: A Two-Level Agent System for Efficient Mobile Task Automation [22.8] MobA(モブア)は、マルチモーダルな大規模言語モデルを利用した携帯電話エージェントである。
高レベルグローバルエージェント(GA)は、ユーザコマンドの理解、履歴の追跡、計画タスクの責任を負う。
低レベルのローカルエージェント(LA)は、GAからサブタスクとメモリによって誘導される関数呼び出しの形式で詳細なアクションを予測する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:53:50 GMT)
The Geometry of Numerical Reasoning: Language Models Compare Numeric Properties in Linear Subspaces [22.3] 本稿では,大規模言語モデル(LLM)が論理比較問題に答える際に,埋め込み空間の低次元部分空間に符号化された数値属性を利用するかどうかを検討する。
まず,これらの部分空間を最小二乗回帰を用いて同定し,比較プロンプトに関連付けられた数値特性を効果的に符号化した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:44:11 GMT)
Bias in the Mirror : Are LLMs opinions robust to their own adversarial attacks ? [22.0] 大規模言語モデル(LLM)は、トレーニングデータとアライメントプロセスからバイアスを受け継ぎ、微妙な方法で応答に影響を与える。
LLMの2つのインスタンスが自己議論を行う新しいアプローチを導入し、反対の視点でモデルの中立バージョンを説得する。
我々は、モデルがどのようにしっかりとバイアスを保ち、誤った情報を強化するか、有害な視点に移行するかを評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:06:02 GMT)
LLM-Human Pipeline for Cultural Context Grounding of Conversations [22.0] 社会的規範の遵守または違反は、しばしば会話のテナーを規定する。
会話に「文化コンテキスト」を導入する。
我々は中国の文化から、110kの社会規範と23kの会話の違反記述を生成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:33:01 GMT)
SurrogatePrompt: Bypassing the Safety Filter of Text-to-Image Models via Substitution [21.9] 我々は、Midjourneyに対する最初の即時攻撃を開発し、その結果、豊富なNSFW画像が生成される。
我々のフレームワークであるSurrogatePromptは、大規模言語モデル、画像からテキスト、画像から画像へのモジュールを利用して、攻撃プロンプトを体系的に生成する。
その結果、Midjourneyのプロプライエタリな安全フィルタを攻撃プロンプトでバイパスして88%の成功率を明らかにした。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:34:21 GMT)
360U-Former: HDR Illumination Estimation with Panoramic Adapted Vision Transformers [21.4] 我々はGANとして360U-Formerを訓練し、限られた視野低ダイナミックレンジ画像(LDRI)からHDRIを生成する。
提案手法は,現在の照明推定プロトコルとデータセットを用いて評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:03:53 GMT)
Relay Decoding: Concatenating Large Language Models for Machine Translation [21.4] 我々はRD(Relay Decoding)と呼ばれる革新的なアプローチを提案し、ソースとターゲット言語を個別にサポートする2つの異なる大規模モデルを結合する。
これら2つのモデル間の接続を容易にするための単純なマッピング層を導入し、訓練に限られた並列データを活用することにより、機械翻訳タスクにおいて優れた結果が得られた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:39:05 GMT)
Utilizing Large Language Models in An Iterative Paradigm with Domain Feedback for Molecule Optimization [21.3] 本稿では,シンプルなドメインフィードバックプロバイダである$textRe2$DFを提案する。
$textRe2$DFは、修飾された分子が化学的に無効である場合、分子を処理するために外部ツールキットRDKitを使用する。
20の単価目標に対して、$textRe2$DFは、緩やかで厳格な閾値の下で、ヒット率を16.95%、20.76%向上させる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:04:57 GMT)
GlossyGS: Inverse Rendering of Glossy Objects with 3D Gaussian Splatting [21.2] GlossyGSは、光沢のある物体の形状と素材を、素材の先行要素を統合することによって正確に再構築することを目的としている。
定量的解析と定性的可視化により, 提案手法は高忠実度ジオメトリーと光沢物体の材料を再構成するのに有効であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:00:29 GMT)
MMAD-Purify: A Precision-Optimized Framework for Efficient and Scalable Multi-Modal Attacks [21.2] 我々は,攻撃フレームワークの有効性を高めるために,精度最適化ノイズ予測器を組み込んだ革新的なフレームワークを導入する。
当社のフレームワークは,マルチモーダル攻撃に対する最先端のソリューションを提供し,レイテンシの低減を実現している。
本研究の枠組みは, 浄化防御に対する優れた伝達性と堅牢性を実現することを実証する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:52:39 GMT)
On the Reliability of Large Language Models to Misinformed and Demographically-Informed Prompts [20.8] 本研究では,大言語モデル(LLM)が支援するチャットボットを用いて,人口統計情報を用いて,誤情報や質問に対処する。
True/Falseの質問を使って定量的に分析すると、これらのチャットボットがこれらのクローズドな質問に対して正しい答えを与えることができることが分かる。
ドメインの専門家から集めた質的な洞察は プライバシーや倫理的影響に 懸念がまだあることを示している
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:52:38 GMT)
Game of Coding: Sybil Resistant Decentralized Machine Learning with Minimal Trust Assumption [20.6] 本稿では,コーディングフレームワークのゲームにおけるノード数の増加がもたらす意味について検討する。
敵ノード数の増加による敵ノードの柔軟性の増大にもかかわらず、敵ノードのパワー向上は敵ノードにとって有益ではないことを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:35:34 GMT)
Active inference and deep generative modeling for cognitive ultrasound [20.4] 解剖学的環境と相互に相互作用する情報探索エージェントとして,US画像システムを再キャストできることが示唆された。
このようなエージェントは、送信受信シーケンスを自律的に適応して、画像を完全にパーソナライズし、情報取得をその場で積極的に最大化する。
次に,不確実性を積極的に低減し,一連の実験において診断値を最大化する機構をシステムに装備する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:09:14 GMT)
Generation through the lens of learning theory [20.3] 統計的学習理論のレンズを通して生成を研究する。
仮説クラスの2つの性質は両立していることが示される - 生成可能ではあるが予測不可能なクラスがあり、その逆も成り立つ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:14:49 GMT)
SAM-Guided Masked Token Prediction for 3D Scene Understanding [20.3] ファンデーションモデルは2Dタスクのパフォーマンスを大幅に向上させており、Bridge3Dのような最近の研究はこれらのモデルを用いて3Dシーン理解を改善している。
しかし、3次元データセットにおける2次元と3次元の表現の不一致や長期分布といった課題は、知識蒸留の有効性を制限している。
本稿では,3次元変圧器構造と地域レベルの知識蒸留をシームレスに整合させる新しいSAM誘導トークン化手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:15:32 GMT)
UniG: Modelling Unitary 3D Gaussians for View-consistent 3D Reconstruction [20.1] ビュー一貫性を持つ3次元再構成と新しいビュー合成モデルUniGを提案する。
UniGはスパース画像から3Dガウスの高忠実度表現を生成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:48:02 GMT)
Personalized Adaptation via In-Context Preference Learning [20.0] Preference Pretrained Transformer (PPT) は、オンラインユーザフィードバックを用いた適応型パーソナライズのための新しいアプローチである。
この結果から,大規模言語モデルにおけるスケーラブルで効率的なパーソナライズのためのコンテキスト内学習の可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:06:02 GMT)
Toward Efficient Kernel-Based Solvers for Nonlinear PDEs [20.0] 本稿では,非線形偏微分方程式(PDE)を効率的に解くための新しいカーネル学習フレームワークを提案する。
カーネルに微分演算子を埋め込む最先端のカーネルソルバとは対照的に,本手法ではこれらの演算子をカーネルから排除する。
我々は、標準カーネル形式を用いて解をモデル化し、導関数を計算するために補間剤を区別する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:19:24 GMT)
Mixed-Precision Embeddings for Large-Scale Recommendation Models [19.9] 混合精密埋め込み(Mixed-Precision Embeddings、MPE)は、新しい埋め込み圧縮法である。
MPEは予測精度を含まないまま、Criteoデータセット上で約200倍の圧縮を実現している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:19:08 GMT)
The Latent Road to Atoms: Backmapping Coarse-grained Protein Structures with Latent Diffusion [19.9] 潜伏拡散バックマッピング(LDB)は、これらの課題に対処するために潜伏空間内での拡散をデノナイズする新しいアプローチである。
3つの異なるタンパク質データセット上でLDBの最先端性能を評価する。
計算生物学におけるCGシミュレーションと原子レベル解析のギャップを効果的に埋め、LDBをバックマッピングのための強力でスケーラブルなアプローチとして位置づけた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:38:07 GMT)
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion [19.5] 品質の低いデータや少ないデータは、実際にディープニューラルネットワークをトレーニングする上で大きな課題となっている。
拡散カリキュラム(DisCL)は、訓練段階ごとに画像合成のイメージガイダンスレベルを調整する。
DisCLは、多様性や品質に弱いかもしれない高感度画像を学習するウォームアップとして、高品質な画像から特徴を学ぶことに焦点を当てている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:33:35 GMT)
A Review of the Non-Invasive Techniques for Monitoring Different Aspects of Sleep [19.5] 睡眠モニタリングのための研究が進められており、睡眠行動を理解するための重要なツールとなっている。
睡眠分析のための金の標準法は、臨床環境で行うポリソムノグラフィ(PSG)であるが、この方法は高価であり、長期使用には複雑である。
家庭内睡眠モニタリングに安価で使い易いウェアラブルと非ウェアラブルの両方を用いた様々なソリューションが提案されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:58:05 GMT)
From Gradient Clipping to Normalization for Heavy Tailed SGD [19.4] 最近の実証的な証拠は、機械学習の応用が重尾ノイズを伴い、実際に有界分散の標準的な仮定に挑戦していることを示している。
本稿では, 勾配依存型雑音収束問題において, テール雑音下での厳密性を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:01 GMT)
Learning Multimodal Cues of Children's Uncertainty [19.3] 本研究では,不確実性の非言語的手がかりを研究するために,発達心理学者と認知心理学者との共同で注釈付きデータセットを提案する。
次に、データ分析を行い、不確実性の異なる役割とタスクの難易度とパフォーマンスとの関係について検討する。
最後に、参加者のリアルタイムビデオクリップから不確実性を予測するマルチモーダル機械学習モデルを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:46:00 GMT)
Data Defenses Against Large Language Models [19.3] データディフェンス"により、データ所有者は、大きな言語モデルがデータに対する推論の実行をブロックできる。
本研究では, 逆方向のインジェクションを自動生成する手法を開発した。
このような推論に対する直接的な抵抗を可能にする倫理について検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:51:56 GMT)
Contextual Bandits with Arm Request Costs and Delays [19.3] 本稿では,時間的遅延と関連するコストを伴って,新たなアームセットを要求できるコンテキスト的バンディット問題の拡張を提案する。
この設定では、学習者は、各選択が1つの時間単位を取るように、決定セットから複数のアームを選択することができる。
我々は、武器を効果的に選択し、新しい武器を要求する適切な時間を決定するアルゴリズムを設計し、彼らの後悔を最小限に抑える。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:44:50 GMT)
Learning to Summarize from LLM-generated Feedback [19.2] 本研究は,LLM生成フィードバックを用いて要約を人間の好み,完全性,簡潔さに合わせることで要約品質を向上させることを目的とする。
我々の実験は、フィードバックの質、寸法、粒度が好みの学習にどのように影響するかを示す。
SummLlama3-8bはLlama3-70bの約10倍の精度で人為的な要約を生成するモデルである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:01:09 GMT)
Algorithmic Content Selection and the Impact of User Disengagement [19.1] 本稿では、不満を抱いた利用者が不満を抱く可能性のあるコンテンツ選択問題に対するモデルを提案する。
両腕の期待報酬とユーザ満足度との関係が線形に関係している場合、最適なコンテンツ選択ポリシーを効率的に計算できることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:43:06 GMT)
Perceive, Reflect, and Plan: Designing LLM Agent for Goal-Directed City Navigation without Instructions [19.0] 本稿では,その知覚,反映,計画能力に特徴付けられる新しいエージェントワークフローを提案する。
LLaVA-7Bは都市のナビゲーションに十分な精度でランドマークの方向と距離を把握できるように微調整できる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:43:13 GMT)
Independently-Normalized SGD for Generalized-Smooth Nonconvex Optimization [19.0] 我々は、多くの非機械学習問題が従来の非スムーズな非スムーズな状態を超えるような条件を満たすことを示した。
独立サンプリングと正規化を利用する独立正規化勾配降下アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:52:00 GMT)
CAKD: A Correlation-Aware Knowledge Distillation Framework Based on Decoupling Kullback-Leibler Divergence [18.9] 相関知識蒸留(CAKD)フレームワークは、予測に最も大きな影響を及ぼす蒸留成分の面を優先順位付けするために設計された。
本研究は, 蒸留工程の異なる部分の影響を綿密に検討することの重要性と有効性を強調した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:48:20 GMT)
Towards Cross-Cultural Machine Translation with Retrieval-Augmented Generation from Multilingual Knowledge Graphs [18.8] XC-Translateは、機械翻訳のための最初の大規模な手作業によるベンチマークである。
KG-MTは、多言語知識グラフからの情報をニューラルネットワーク翻訳モデルに統合する、新しいエンドツーエンド手法である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:56:22 GMT)
Interpret and Control Dense Retrieval with Sparse Latent Features [18.8] 本稿では,スパース・オートエンコーダ (SAE) を用いた新しい手法を提案する。
実験結果から, 学習した潜在スパース特徴と再構成された埋め込みはともに, 元の高密度ベクトルとほぼ同じ精度を保っていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:59:48 GMT)
Octree-GS: Towards Consistent Real-time Rendering with LOD-Structured 3D Gaussians [18.8] 3D-GSは、NeRFベースのニューラルシーン表現と比較して、顕著なレンダリングの忠実さと効率を示した。
シーン表現のためのレベル・オブ・ディーテール分解をサポートするLOD構造型3次元ガウスアプローチを特徴とするOctree-GSを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:11:31 GMT)
Transferable Belief Model on Quantum Circuits [18.7] 伝達可能な信念モデルはデンプスター・シェーファー理論の意味論的解釈である。
本稿では,量子AIモデルの基本情報表現の新しい視点を紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:52:24 GMT)
Transferable Belief Model on Quantum Circuits [18.7] 伝達可能な信念モデルはデンプスター・シェーファー理論の意味論的解釈である。
本稿では,量子AIモデルの基本情報表現の新しい視点を紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:52:24 GMT)
Retrospective Learning from Interactions [18.6] 大規模言語モデルとユーザ間のマルチターンインタラクションには、暗黙のフィードバック信号が自然に含まれている。
このような信号は言語の比較的制約のある部分空間を占めており、LLMは実際のタスクで失敗してもそれらを識別することができる。
本稿では,過去のインタラクションにおいて,レトロスペクションを通じてそのような信号から学習するReSpectを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:03 GMT)
Adaptive and oblivious statistical adversaries are equivalent [18.4] あらゆる種類の汚職に対して, サンプル適応的, サンプル公開的敵は, サンプルサイズに匹敵する因子に富んでいることを示す。
対応するサンプル適応逆数が入力を破損した場合に同じ課題を解くアルゴリズムが$A'$であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:42:56 GMT)
AutoAL: Automated Active Learning with Differentiable Query Strategy Search [18.2] 本研究は, AutoAL という,最初の識別可能な能動学習戦略探索手法を提案する。
任意のタスクに対して、SearchNetとFitNetはラベル付きデータを使って反復的に最適化され、そのタスクで候補ALアルゴリズムのセットがどれだけうまく機能するかを学ぶ。
AutoALは、すべての候補ALアルゴリズムや他の選択ALアプローチと比較して、常に優れた精度を達成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:09 GMT)
SemSim: Revisiting Weak-to-Strong Consistency from a Semantic Similarity Perspective for Semi-supervised Medical Image Segmentation [18.2] 医用画像分割のための半教師付き学習(SSL)は難しいが、非常に実践的な課題である。
セムシム(SemSim)という名前のFixMatchに基づく新しいフレームワークを提案する。
SemSimは3つの公開セグメンテーションベンチマークで最先端の手法よりも一貫した改善をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:31:37 GMT)
MoR: Mixture of Ranks for Low-Rank Adaptation Tuning [18.1] Low-Rank Adaptation (LoRA) は研究を推進し、その性能を完全な微調整と整合させる。
MoEスタイルのLoRAメソッドはパラメータと推論遅延を大幅に増加させる。
入力に基づいて異なるタスクのランク特化情報を学習するMixture of Ranks(MoR)を導入する。
MoRは1.31%のパフォーマンス向上を実現し、標準手法に比べて93.93%のパラメータしか使用していない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:14:52 GMT)
Inductive Gradient Adjustment For Spectral Bias In Implicit Neural Representations [17.8] Inlicit Neural Representations (INR)は様々なコンピュータタスクで成功している。
バニラ多層パーセプトロン(MLP)のスペクトルバイアスのため、既存の手法は高度なアーキテクチャを使った設計や、高精度なINRのためのトレーニング技術の再開発に重点を置いている。
本稿では,eNTKに基づく勾配変換行列の帰納的一般化により,スペクトルバイアスを意図的に改善する実用的な勾配調整法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:51:10 GMT)
Arbitrarily-Conditioned Multi-Functional Diffusion for Multi-Physics Emulation [17.7] ACMFD(Arbitrally-Conditioned Multi-Functional Diffusion)を多物理エミュレーションのための多元的確率的サロゲートモデルとして提案する。
ACMFDは、フォワード予測、様々な逆問題、システム全体や他で条件付けられた量のサブセットのデータシミュレーションを含む、単一のフレームワーク内で幅広いタスクを実行できる。
複数の基本的多物理系におけるACMFDの利点を実証する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:34:06 GMT)
Cross-modality Information Check for Detecting Jailbreaking in Multimodal Large Language Models [17.7] マルチモーダル大言語モデル(MLLM)は、多モーダル情報を包括的に理解するためにLLMの能力を拡張する。
これらのモデルは、悪意のあるユーザーがターゲットモデルの安全アライメントを壊し、誤解を招く、有害な回答を発生させることができるジェイルブレイク攻撃の影響を受けやすい。
本稿では,悪質な摂動画像入力を識別するプラグイン・アンド・プレイのジェイルブレイク検出装置であるCIDERを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:49:20 GMT)
Cross-modality Information Check for Detecting Jailbreaking in Multimodal Large Language Models [17.7] マルチモーダル大言語モデル(MLLM)は、多モーダル情報を包括的に理解するためにLLMの能力を拡張する。
これらのモデルは、悪意のあるユーザーがターゲットモデルの安全アライメントを壊し、誤解を招く、有害な回答を発生させることができるジェイルブレイク攻撃の影響を受けやすい。
本稿では,悪質な摂動画像入力を識別するプラグイン・アンド・プレイのジェイルブレイク検出装置であるCIDERを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:49:20 GMT)
Generalization Error of the Tilted Empirical Risk [17.5] 教師付き統計学習アルゴリズムの一般化誤差(リスク)は、これまで見られなかったデータに対する予測能力を定量化する。
指数傾斜にインスパイアされたLi et al. (2021) は、機械学習アプリケーションのための非線形リスク指標として傾いた経験的リスクを提案した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:23:07 GMT)
Generalization Error of the Tilted Empirical Risk [17.5] 教師付き統計学習アルゴリズムの一般化誤差(リスク)は、これまで見られなかったデータに対する予測能力を定量化する。
指数傾斜にインスパイアされたLi et al. (2021) は、機械学習アプリケーションのための非線形リスク指標として傾いた経験的リスクを提案した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:23:07 GMT)
Uncovering Attacks and Defenses in Secure Aggregation for Federated Deep Learning [17.5] フェデレートラーニングは、多様なデータに対するグローバルモデルの協調学習を可能にし、データのローカリティを保ち、ユーザデータを中央サーバに転送する必要をなくす。
セキュアアグリゲーションプロトコルは、ユーザ更新をマスク/暗号化し、中央サーバがマスキングされた情報を集約できるように設計されている。
MicroSecAgg (PoPETS 2024) は,既存のアプローチの通信複雑性を緩和することを目的とした,単一のサーバセキュアアグリゲーションプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:20:01 GMT)
Uncovering Attacks and Defenses in Secure Aggregation for Federated Deep Learning [17.5] フェデレートラーニングは、多様なデータに対するグローバルモデルの協調学習を可能にし、データのローカリティを保ち、ユーザデータを中央サーバに転送する必要をなくす。
セキュアアグリゲーションプロトコルは、ユーザ更新をマスク/暗号化し、中央サーバがマスキングされた情報を集約できるように設計されている。
MicroSecAgg (PoPETS 2024) は,既存のアプローチの通信複雑性を緩和することを目的とした,単一のサーバセキュアアグリゲーションプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:20:01 GMT)
Strong-to-weak spontaneous symmetry breaking meets average symmetry-protected topological order [17.4] これら2つの順序の非自明な拡張から生じる二重ASPT位相と呼ばれる新しい位相のクラスを提案する。
この新たなフェーズは以前の研究には欠落しており、従来の閉じたシステムには存在しない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:36:53 GMT)
Corruption-Robust Linear Bandits: Minimax Optimality and Gap-Dependent Misspecification [17.3] 線形バンディットでは、学習者が腐敗した報酬に直面するとき、効果的に学習できるのか?
汚職レベルは学習者が選択した行動に依存するが、汚職レベルは学習者が選択した行動に依存しない。
線形包帯については, 強い汚職と弱い汚職下でのミニマックス後悔のギャップを, 完全に特徴づける。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:29:04 GMT)
Corruption-Robust Linear Bandits: Minimax Optimality and Gap-Dependent Misspecification [17.3] 線形バンディットでは、学習者が腐敗した報酬に直面するとき、効果的に学習できるのか?
汚職レベルは学習者が選択した行動に依存するが、汚職レベルは学習者が選択した行動に依存しない。
線形包帯については, 強い汚職と弱い汚職下でのミニマックス後悔のギャップを, 完全に特徴づける。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:29:04 GMT)
Corruption-Robust Linear Bandits: Minimax Optimality and Gap-Dependent Misspecification [17.3] 線形バンディットでは、学習者が腐敗した報酬に直面するとき、効果的に学習できるのか?
汚職レベルは学習者が選択した行動に依存するが、汚職レベルは学習者が選択した行動に依存しない。
線形包帯については, 強い汚職と弱い汚職下でのミニマックス後悔のギャップを, 完全に特徴づける。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:29:04 GMT)
The Impact of Visual Information in Chinese Characters: Evaluating Large Models' Ability to Recognize and Utilize Radicals [17.2] 我々は,大言語モデルと視覚言語モデルによる漢字の視覚的要素の理解を評価する。
我々の結果は、モデルが驚くほど、しかしまだ限られた、視覚情報に関する知識を誇示していることを示している。
我々は、ラジカルに関する追加情報を提供する際に、パートオフ音声タグ付けにおける一貫した改善を観察する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:30:52 GMT)
The Impact of Visual Information in Chinese Characters: Evaluating Large Models' Ability to Recognize and Utilize Radicals [17.2] 大規模言語モデル(LLM)と視覚言語モデル(VLM)を評価する。
我々の結果は、モデルが驚くほど、しかしまだ限られた、視覚情報に関する知識を誇示していることを示している。
我々は、ラジカルに関する追加情報を提供する際に、パートオフ音声タグ付けにおける一貫した改善を観察する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:30:52 GMT)
Is Prior-Free Black-Box Non-Stationary Reinforcement Learning Feasible? [17.2] 本研究では,非定常強化学習(NS-RL)の問題点を,システムの非定常性に関する事前知識なしで研究する。
MASTERとして知られる最先端のブラックボックスアルゴリズムは、その目標を達成するための条件を特定することに焦点を当てている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:09:56 GMT)
Trinity: A General Purpose FHE Accelerator [17.2] 我々は、CKKS、TFHE、およびそれらの変換スキームを1つのアクセラレータ内で効率的にサポートする統一アーキテクチャに基づく、最初のマルチモーダルFHEアクセラレータを提案する。
本稿では,アルゴリズム最適化,ハードウェアコンポーネントの再利用,動的ワークロードスケジューリングを取り入れた新しいFHEアクセラレータTrinityを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:02:38 GMT)
Let Me Finish My Sentence: Video Temporal Grounding with Holistic Text Understanding [17.1] Video Temporal Groundingは、テキストクエリにマッチするビデオクリップ内の視覚的フレームを特定することを目的としている。
VTGの最近の研究は、視覚フレームとテキストクエリを個々のトークンシーケンスとして関連付けるために、クロスアテンションを使用している。
本稿では,全体的テキスト情報を含む視覚的フレームレベルゲート機構を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:31:02 GMT)
Fine-Tuning Language Models on Multiple Datasets for Citation Intention Classification [17.0] 引用意図分類(Citation intention Classification, CIC)は、意図によって引用を分類するツールである。
以前の研究では、事前訓練された言語モデル(PLM)がCICベンチマークで最先端のパフォーマンスを達成できることが示されている。
複数の補助的CICデータセットとともに、一次関心のデータセット上でPLMを微調整するマルチタスク学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:45:02 GMT)
Diffusing States and Matching Scores: A New Framework for Imitation Learning [16.9] 敵対的模倣学習は伝統的に、学習者と敵対的に選択されたコスト関数の間の2つのプレイヤーゼロサムゲームとしてフレーム化されている。
近年、拡散モデルはGANの非敵対的な代替品として出現している。
提案手法は, 様々な連続制御問題に対して, GANスタイルの模倣学習ベースラインより優れていることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:25 GMT)
Don't Label Twice: Quantity Beats Quality when Comparing Binary Classifiers on a Budget [16.8] 特定のデータポイントの複数のノイズラベルを、過半数の投票でよりノイズの少ないラベルに集約するのは、一般的なプラクティスです。
従来の知恵に反する定理を証明します。
機械学習ベンチマークの設計における研究の意義について論じる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:30:07 GMT)
Temporally Consistent Factuality Probing for Large Language Models [16.2] 本稿では, 時間的に一貫性のある課題であるTeCFaPを紹介する。
既存のメトリクスの定義を拡張して、時間次元にわたって一貫した事実性を表現します。
次に,マルチタスク・インストラクション・チューニング(MT-IT)と一貫した時間依存性強化学習(CTSRL)を組み合わせた新しいソリューションCoTSeLFを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:37:44 GMT)
Temporally Consistent Factuality Probing for Large Language Models [16.2] 本稿では, 時間的に一貫性のある課題であるTeCFaPを紹介する。
既存のメトリクスの定義を拡張して、時間次元にわたって一貫した事実性を表現します。
次に,マルチタスク・インストラクション・チューニング(MT-IT)と一貫した時間依存性強化学習(CTSRL)を組み合わせた新しいソリューションCoTSeLFを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:37:44 GMT)
LLMOPT: Learning to Define and Solve General Optimization Problems from Scratch [16.2] 最適化の一般化を促進するため,LLMOPTと呼ばれる統合学習ベースのフレームワークを提案する。
LLMOPTは、様々な最適化問題タイプを定義するための普遍モデルとして導入された5要素の定式化を構築している。
LLMOPTの最適化一般化能力を評価し,実世界の6つのデータセットを比較した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:37:37 GMT)
MedAide: Towards an Omni Medical Aide via Specialized LLM-based Multi-Agent Collaboration [16.1] 大規模言語モデル(LLM)による対話システムは、現在医療分野において潜在的に有望であることを示している。
本稿では,医療専門サービスのためのオムニ・メディカル・マルチエージェント・コラボレーション・フレームワークであるMedAideを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:22:41 GMT)
Day-Night Adaptation: An Innovative Source-free Adaptation Framework for Medical Image Segmentation [15.8] 我々はデイナイト適応(DyNA)と呼ばれる新しい適応フレームワークを提案する。
このフレームワークは、ソースデータへのアクセスを必要とせずに、日々のループを通じてターゲットドメインにモデルを適応させる。
具体的には、日中と夜間の異なる適応戦略を実践し、臨床環境の要求に応えた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:02:29 GMT)
Skeleton: A New Framework for Accelerating Language Models via Task Neuron Localized Prompt Tuning [15.7] メモリと時間の複雑さの観点から,言語モデルを効率的に活用するための,Skeletonと呼ばれる新しいプロンプトチューニングフレームワークを提案する。
提案手法は, 様々なベンチマークにおいて, 推論効率を著しく向上させる(ほとんどの x 1.73 高速化)。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:01:27 GMT)
On Partial Prototype Collapse in the DINO Family of Self-Supervised Methods [15.5] データサンプルをコンパクトな表現にマッピングする学習は、表現の崩壊問題につながる。
クラスタ上のデータポイントの分散を規則化することが、この問題を回避するための一般的な戦略です。
提案手法では, プロトタイプの崩壊問題をDINOファミリーに残しており, プロトタイプに重大な冗長性をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:06:34 GMT)
Mitigating the Backdoor Effect for Multi-Task Model Merging via Safety-Aware Subspace [15.5] 本稿では,タスク干渉とバックドア脆弱性を同時に軽減する新しいDAM手法を提案する。
既存のマージ手法と比較して、DAMはパフォーマンスとセキュリティのバランスが良く、攻撃成功率を2-10ポイント削減する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:13:31 GMT)
On the Learn-to-Optimize Capabilities of Transformers in In-Context Sparse Recovery [15.2] K層変換器は, 証明可能な収束率を持つL2OアルゴリズムをK層に線形に実行可能であることを示す。
従来のL2Oアルゴリズムとは違って、トレーニングにおいて測定行列に一致させる必要があるが、トレーニングされたTransformerは、異なる測定行列で生成されたスパースリカバリ問題を解くことができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:18:28 GMT)
Data-Driven Estimation of Heterogeneous Treatment Effects [15.1] 異種治療効果推定(ヘテロジニアス・エフェクト・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント)は、経験科学において重要な問題である。
機械学習を用いた不均一な処理効果推定のための最先端データ駆動手法について調査する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:40:25 GMT)
Limits to scalable evaluation at the frontier: LLM as Judge won't beat twice the data [15.0] 新たなデバイアスツールのファミリーは、いくつかの高品質なラベルを使用して多数のモデル判断をデバイアスすることで、問題を解決することを約束している。
本研究の主目的は,審査員が評価モデルに比較して精度が低い場合,デバイアス法が要求される地上の真実ラベルの量を半分以上減らすことができないことである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:49:42 GMT)
SaMoye: Zero-shot Singing Voice Conversion Model Based on Feature Disentanglement and Enhancement [14.9] 歌唱音声変換(SVC)は、歌唱者の声を参照音声から他の歌唱者の声に変換し、本来の意味を保ちながら行うことを目的としている。
そこで我々は,歌唱を人間と非人間の音色に変換できる,オープンソースの初の高品質ゼロショットSVCモデルSaMoyeを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:54:06 GMT)
A Simulation System Towards Solving Societal-Scale Manipulation [14.8] AIによる操作の台頭は、社会的信頼と民主的プロセスに重大なリスクをもたらす。
しかし、これらの効果を現実世界で大規模に研究することは倫理的にも論理的にも非現実的です。
この問題に対処するために設計されたシミュレーション環境を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:16:24 GMT)
Are LLMs Models of Distributional Semantics? A Case Study on Quantifiers [14.8] 分布意味論モデルは真理条件推論や記号処理に苦しむ。
期待とは対照的に、LSMは正確な量化器とあいまいな量化器の人間の判断とより密接に一致している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:28:35 GMT)
SemiEvol: Semi-supervised Fine-tuning for LLM Adaptation [14.8] プロパゲート・アンド・セレクト方式によるLLM適応のための半教師付き微調整フレームワークであるSemiEvolを紹介した。
知識伝播のために、SemiEvolは2段階のアプローチを採用し、ラベル付きデータからインウェイトとインコンテクストの両方の方法でラベル付きデータに知識を伝達する。
知識選択のために、SemiEvolは、高品質な擬応答サンプルを選択する協調学習機構を組み込んでいる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:59:46 GMT)
Mitigating Hallucinations in Large Vision-Language Models via Summary-Guided Decoding [14.7] LVLM(Large Vision-Language Models)は、視覚入力から詳細でコヒーレントな応答を生成する。
言語に対する依存度が高すぎるため、幻覚を起こす傾向にある。
我々は,SGD(Session-Guided Decoding)という新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:24:27 GMT)
Modeling Human Subjectivity in LLMs Using Explicit and Implicit Human Factors in Personas [14.7] 大規模言語モデル (LLMs) は、人間中心の社会科学タスクでますます使われている。
これらのタスクは非常に主観的であり、環境、態度、信念、生きた経験など人間的要因に依存している。
我々は,LLMを人間的なペルソナで促進する役割について検討し,モデルに特定の人間であるかのように答えるよう求めた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:32:46 GMT)
Duoduo CLIP: Efficient 3D Understanding with Multi-View Images [14.6] Duoduo CLIPは、ポイントクラウドではなく、マルチビューイメージから形状エンコーディングを学ぶ3D表現学習のモデルである。
当社のアプローチは,既存のポイントクラウド手法よりも優れた一般化を示すだけでなく,GPU要件やトレーニング時間を短縮する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:05:16 GMT)
Efficient PAC Learning of Halfspaces with Constant Malicious Noise Rate [14.5] 本研究では,悪質な雑音の存在下でのハーフスペースの計算効率の高いPAC学習の問題について検討する。
再重み付きヒンジ損失を最小化することにより、一定の耐雑音性が得られることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:50:06 GMT)
Efficient PAC Learning of Halfspaces with Constant Malicious Noise Rate [14.5] 本研究では,悪質な雑音の存在下でのハーフスペースの計算効率の高いPAC学習の問題について検討する。
再重み付きヒンジ損失を最小化することにより、一定の耐雑音性が得られることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:50:06 GMT)
Enhancing Dataset Distillation via Label Inconsistency Elimination and Learning Pattern Refinement [14.5] ECCV-2024データ蒸留チャレンジの1位にランクインした。
本稿では,ECCV-2024データ蒸留チャレンジで第1位となったソリューションについて述べる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:09:28 GMT)
DART: Disentanglement of Accent and Speaker Representation in Multispeaker Text-to-Speech [14.3] マルチレベル変分オートエンコーダ(ML-VAE)とベクトル量子化(VQ)を用いたアンサングル話者とアクセント表現の新しい手法を提案する。
提案手法は、話者とアクセントの特徴を効果的に分離する難しさに対処し、合成音声のよりきめ細かい制御を可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:51:46 GMT)
scFusionTTT: Single-cell transcriptomics and proteomics fusion with Test-Time Training layers [14.3] scFusionはTTTベースのマスク付きオートエンコーダを用いたシングルセルマルチモーダルオミクスフュージョンの新しい手法である。
我々はヒトゲノム中の遺伝子とタンパク質の秩序情報をTTT層と組み合わせ、マルチモーダルオミクスを融合させ、単調オミクス解析を強化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:29:29 GMT)
ControlAgent: Automating Control System Design via Novel Integration of LLM Agents and Domain Expertise [14.1] 制御系設計は、様々な分野にわたる広範囲の応用を持つ近代工学の重要な側面である。
様々な領域におけるLarge Language Models (LLM) の進歩にもかかわらず、制御系設計におけるそれらの応用は、制御理論の複雑さと特異性のために制限されている。
LLMエージェントと制御指向ドメイン専門知識の新たな統合により制御システム設計を自動化する新しいパラダイムであるControlAgentを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:42:48 GMT)
SmoothGNN: Smoothing-aware GNN for Unsupervised Node Anomaly Detection [14.1] 個別平滑化パターン(ISP)と近隣平滑化パターン(NSP)を紹介する。
ISPとNSPは、異常ノードの表現が通常のノードよりもスムーズであることを示している。
これらの知見に触発されて,新しいノード異常検出フレームワークであるSmoothGNNを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:56:51 GMT)
SiamSeg: Self-Training with Contrastive Learning for Unsupervised Domain Adaptation in Remote Sensing [14.1] 非教師なしドメイン適応(UDA)が有望なソリューションとして登場し、モデルが未ラベルのターゲットドメインデータから学習できるようにする。
最近の進歩、特に擬似ラベル生成による自己教師型学習は、ドメインの相違を緩和する可能性を示している。
コンピュータビジョンの進歩にもかかわらず、RS画像セグメンテーションへの擬似ラベル法の適用はいまだ検討されていない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:59:39 GMT)
Prompt-SAW: Leveraging Relation-Aware Graphs for Textual Prompt Compression [14.0] 既存の圧縮プロンプトの圧縮の試みは、圧縮されたプロンプトの可読性/解釈性の観点から、サブスタンダードな結果をもたらす。
PromptSAW: Prompt compresSion via Relation AWare graphs, a effective strategy for prompt compression over task-agnostic and task-aware prompts。
GSM8K-aug,すなわちタスクに依存しないプロンプトのための既存のGSM8Kベンチマークの拡張版を提案し、総合的な評価プラットフォームを提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:20:23 GMT)
RemoteDet-Mamba: A Hybrid Mamba-CNN Network for Multi-modal Object Detection in Remote Sensing Images [14.0] 我々は,RemoteDet-Mambaと呼ばれる,四方向選択的走査型融合方式を用いたマルチモーダルリモートセンシングネットワークを提案する。
RemoteDet-Mambaは、単一モードのローカル機能の学習とパッチレベルのグローバル機能の統合を同時に促進する。
DroneVehicleデータセットの実験結果は、RemoteDet-Mambaの有効性を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:20:20 GMT)
Learning Macroeconomic Policies based on Microfoundations: A Stackelberg Mean Field Game Approach [13.9] 本稿では,マイクロファウンデーションに基づくマクロ経済政策をモデル化するStackelberg Mean Field Game (SMFG) アプローチを提案する。
このアプローチは、大規模なマイクロエージェントを集団として扱い、このマイクロ集団の動的応答を学習することで、マクロ経済政策を最適化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:08:54 GMT)
Learning Contrastive Feature Representations for Facial Action Unit Detection [13.8] 顔アクションユニット(AU)検出は、AUが活性化する際の微妙な特徴差を検出するという課題に長年遭遇してきた。
本稿では、自己教師付き信号と教師付き信号の両方を組み込んだAU検出を目的とした、新しいコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:10:16 GMT)
Learning Contrastive Feature Representations for Facial Action Unit Detection [13.8] 顔アクションユニット(AU)検出は、AUが活性化する際の微妙な特徴差を検出するという課題に長年遭遇してきた。
本稿では、自己教師付き信号と教師付き信号の両方を組み込んだAU検出を目的とした、新しいコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:10:16 GMT)
SLM-Mod: Small Language Models Surpass LLMs at Content Moderation [13.8] 大規模言語モデル(LLM)は、コンテンツモデレーションを含む多くの自然言語理解タスクにおいて有望であることを示している。
コミュニティ固有のコンテンツモデレーションタスクにおいて,SLM(Small Language Model)のオープンソース利用について検討する。
15のRedditコミュニティからの150万のコメントを使って、SLMはコンテンツモデレーションにおいてLLMよりも優れています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:16:37 GMT)
LayerSkip: Enabling Early Exit Inference and Self-Speculative Decoding [13.7] 大規模言語モデル(LLM)の高速化のためのエンドツーエンドのソリューションを提案する。
また,すべての変圧器層が同じ出口を共有できる早期の出口損失を,早期の層で低落率,後期の層で高落率,早期の出口損失に適用した。
このトレーニングレシピは、モデルに補助的なレイヤやモジュールを追加することなく、初期のレイヤでの早期退避の精度を高めることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:50:46 GMT)
TCP-Diffusion: A Multi-modal Diffusion Model for Global Tropical Cyclone Precipitation Forecasting with Change Awareness [13.7] 熱帯サイクロン降水拡散 (TCP-Diffusion) は, 熱帯サイクロン降水量予測のマルチモーダルモデルである。
過去の降雨観測とマルチモーダル環境変数に基づいて,過去12時間のTCセンター周辺の降雨を3時間ごとの解像度で予測した。
気象要因の影響とNWPモデル予測からの有用性を考慮し,特殊エンコーダを用いたマルチモデルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:58:05 GMT)
Composing Novel Classes: A Concept-Driven Approach to Generalized Category Discovery [13.7] 我々は、ラベルなしデータセットにおける新しいクラスを発見することを目的として、一般化されたカテゴリ発見問題に取り組む。
本稿では,GCDのための新しい概念学習フレームワークであるConceptGCDを紹介し,概念を2つのタイプに分類する。
我々のフレームワークはまず、既知のクラス事前学習モデルにより既知のクラス概念を抽出し、そこから導出可能な概念を生成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:30:20 GMT)
Online-to-PAC Conversions: Generalization Bounds via Regret Analysis [13.6] 私たちは「一般化ゲーム」と呼ばれるオンライン学習ゲームを構築します。
本ゲームにおけるオンライン学習アルゴリズムの存在は,統計的学習アルゴリズムの一般化誤差に制約があることを示唆する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:51:50 GMT)
PLANRL: A Motion Planning and Imitation Learning Framework to Bootstrap Reinforcement Learning [13.6] PLANRLは、ロボットがいつ古典的な動き計画を使うべきか、いつポリシーを学ぶべきかを選択するためのフレームワークである。
PLANRLは2つの操作モードを切り替える: オブジェクトから離れたときに古典的なテクニックを使ってウェイポイントに到達し、オブジェクトと対話しようとするときに細かい操作制御を行う。
我々は,複数の課題のあるシミュレーション環境と実世界のタスクにまたがってアプローチを評価し,既存手法と比較して適応性,効率,一般化の点で優れた性能を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:21:46 GMT)
Multi-marginal Schrödinger Bridges with Iterative Reference Refinement [13.5] 実践者は、しばしば複数の時点のサンプルスナップショットを用いて、観測されていない人口軌道を推測することを目的としている。
複数の時間点にわたるサンプルスナップショットから観測されていない軌跡を学習する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:03:12 GMT)
Latent Weight Diffusion: Generating Policies from Trajectories [13.4] 遅延重み拡散(英語: Latent Weight Diffusion、LWD)は、拡散を利用して、軌道よりもむしろロボットタスクのポリシーに関する分布を学習する手法である。
LWDは、バニラマルチタスクポリシーよりも高い成功率を達成する一方で、推論時に最大18倍のモデルを使用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:30:29 GMT)
Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model [13.4] 本稿では,単一のCF画像から動的FFAビデオを生成するGANモデルであるFundus2Videoを紹介する。
FVDは1497.12、PSNRは11.77である。
これらの結果から,Fundus2VideoはFFA検査の強力な非侵襲的代替品であり,多彩な網膜生成基盤モデルであると考えられた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:53:13 GMT)
Broken Windows: Exploring the Applicability of a Controversial Theory on Code Quality [13.4] コード履歴がコード品質の進化に実際に影響を及ぼすかどうかを調べる。
開発者がコミットするファイルの品質に基づいてコミットの品質をカスタマイズするかどうかを確認します。
我々の結果は、ソフトウェア実践と研究の両方に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:16:35 GMT)
Boosting Imperceptibility of Stable Diffusion-based Adversarial Examples Generation with Momentum [13.3] 我々は,SD-MIAE(SD-MIAE)という新しいフレームワークを提案する。
視覚的不受容性を保ち、元のクラスラベルとのセマンティックな類似性を保ちながら、ニューラルネットワーク分類器を効果的に誤解させることができる敵の例を生成する。
実験の結果,SD-MIAEは79%の誤分類率を示し,最先端法よりも35%向上した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:22:11 GMT)
GPTON: Generative Pre-trained Transformers enhanced with Ontology Narration for accurate annotation of biological data [13.0] GPTONは、構造化された知識を言語化されたオントロジーの用語を通じてLLMに注入し、上位5つの予測における遺伝子セットの68%の正確なテキストとアノテーションを達成している。
手動による評価により、GPTONの堅牢性は確認され、遺伝子セットアノテーションを超えるバイオメディカル研究を著しく前進させるLLMと構造化知識を活用する可能性を強調している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:08:57 GMT)
Integrating Expert Judgment and Algorithmic Decision Making: An Indistinguishability Framework [13.0] 予測と意思決定タスクにおける人間とAIの協調のための新しい枠組みを導入する。
我々の手法は人間の判断を利用して、アルゴリズム的に区別できない入力を区別する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:13:08 GMT)
Integrating Expert Judgment and Algorithmic Decision Making: An Indistinguishability Framework [13.0] 予測と意思決定タスクにおける人間とAIの協調のための新しい枠組みを導入する。
我々の手法は人間の判断を利用して、アルゴリズム的に区別できない入力を区別する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:13:08 GMT)
Measuring Free-Form Decision-Making Inconsistency of Language Models in Military Crisis Simulations [12.9] BERTScoreに基づくメトリクスを用いて、応答の不整合を定量的に測定する。
その結果,5つのLMは意味的差異を示す不整合のレベルを示すことがわかった。
我々は、軍事的決定を通知するためにLMを使用する前に、さらなる検討を行うことを推奨する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:12:17 GMT)
RiTeK: A Dataset for Large Language Models Complex Reasoning over Textual Knowledge Graphs [12.8] 我々は,テキスト知識グラフ(RiTeK)を用いたLLMの複雑な推論のためのデータセットを開発し,広範なトポロジ的構造を網羅する。
多様なトポロジ構造、注釈付き情報、複雑なテキスト記述を統合した現実的なユーザクエリを合成する。
そこで我々はモンテカルロ木探索法 (CTS) を導入し, 特定のクエリに対してテキストグラフから関係経路情報を自動的に抽出する手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:33:37 GMT)
In-context learning and Occam's razor [12.6] 我々はオッカムのカミソリと文脈内学習の関連を描いている。
特に,テキスト内学習者の訓練に使用される次点の予測損失は,事前符号化と呼ばれるデータ圧縮手法と直接的に等価であることを示す。
我々の理論と実証実験は、文脈内学習の規範的な説明を提供するだけでなく、現在の文脈内学習手法の欠点を解明する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:37:34 GMT)
Better to Ask in English: Evaluation of Large Language Models on English, Low-resource and Cross-Lingual Settings [12.5] GPT-4, Llama 2 および Gemini は, 東南アジアの他の低リソース言語と比較して, 英語での有効性が評価されている。
GPT-4はLlama 2とGeminiを5つのプロンプト設定と全言語で上回ったことを示唆している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:12:30 GMT)
Breaking Bad: How Compilers Break Constant-Time~Implementations [12.5] 本稿では,ディフェンシブプログラミング手法によって導入されたプロテクションを,コンパイラがどのように壊すかを検討する。
我々は,現在最先端の暗号ライブラリにそのようなコンパイラによって引き起こされる問題が現れるかどうかを,大規模な実験で検証する。
本研究は,最も高い評価を受けている暗号ライブラリのいくつかにおいて,コンパイラが引き起こす秘密の操作がいくつか発生していることを明らかにする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:34:02 GMT)
Cerberus: Efficient Inference with Adaptive Parallel Decoding and Sequential Knowledge Enhancement [12.4] 大規模言語モデル(LLM)は自動回帰復号化に依存するため、推論速度のボトルネックに直面していることが多い。
既存の並列デコーディングフレームワークにおける2つの重要な問題を特定しました。
我々は適応並列デコーディングフレームワークであるCerberusを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:55:18 GMT)
Guided Reinforcement Learning for Robust Multi-Contact Loco-Manipulation [12.4] 強化学習(Reinforcement Learning, RL)は、各タスクに合わせた細かなマルコフ決定プロセス(MDP)設計を必要とすることが多い。
本研究は,マルチコンタクトロコ操作タスクの動作合成と制御に対する体系的アプローチを提案する。
モデルベース軌道から生成されたタスク毎の1つの実演のみを用いて,RLポリシーを訓練するためのタスク非依存のMDPを定義する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:46:27 GMT)
HEALTH-PARIKSHA: Assessing RAG Models for Health Chatbots in Real-World Multilingual Settings [12.3] 本研究は、インド人患者から収集した実世界データに基づいて、24大言語モデル(LLM)を広範囲に評価する。
モデルの性能は様々であり,命令調律されたIndicモデルは必ずしもIndic言語クエリでうまく機能しないことがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:29:57 GMT)
Multi-CATE: Multi-Accurate Conditional Average Treatment Effect Estimation Robust to Unknown Covariate Shifts [12.3] 我々は、CATE T-learnerを後処理するために、マルチ精度の予測子を学習するために方法論を使用する。
このアプローチは、(より大きな)確立された観測データと(より小さな)ランダム化されたデータセットを組み合わせることができることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:57:27 GMT)
Transformers4NewsRec: A Transformer-based News Recommendation Framework [12.3] Transformers4NewsRecは textbf Transformersライブラリ上に構築された新しいPythonフレームワークです。
このフレームワークは、様々なニュースレコメンデーションモデルの性能を統一し比較するために設計されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:27:57 GMT)
UAV3D: A Large-scale 3D Perception Benchmark for Unmanned Aerial Vehicles [12.3] 無人航空機(UAV)は、航空写真、監視、農業など多くの用途で使用されている。
UAVアプリケーションの既存のベンチマークは、主に従来の2D認識タスクのために設計されている。
UAV3Dは1000のシーンで構成され、それぞれに20のフレームと完全な注釈付き3Dバウンディングボックスがある。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:34:39 GMT)
MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling [12.2] 大規模言語モデル(LLM)のための汎用エージェントアーキテクチャであるMeNTiを紹介する。
MeNTiは特殊な医療ツールキットを統合し、メタツールとネスト呼び出し機構を使用してLSMツールの利用を促進する。
計算機シナリオの臨床過程におけるLCMの定量的評価能力を評価するために,CalcQAを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:46:22 GMT)
LAR-ECHR: A New Legal Argument Reasoning Task and Dataset for Cases of the European Court of Human Rights [12.2] 本稿では,Largument Reasoning(LAR)について述べる。Large Language Models(LLMs)の法的推論能力を評価するための新しいタスクである。
我々は欧州人権裁判所(ECHR)の事例を用いて,この作業のためのデータセット(LAR-ECHR)を構築した。
我々は、LAR-ECHR上で7つの汎用LLMを評価し、(a)LAR-ECHRはEU法に基づくが、(b)LAR-ECHRは、LORに比べて、トップモデルをより明確に区別するが、(b)LAR-ECHRは、確立された米国ベースの法律推論ベンチマークであるLegalBenchのモデルと整合していることを発見した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:03:38 GMT)
SAMReg: SAM-enabled Image Registration with ROI-based Correspondence [12.2] 本稿では,医療用画像登録のための対の関心領域(ROI)に基づく新しい空間対応表現について述べる。
我々は,トレーニング(あるいはトレーニングデータ)や勾配に基づく微調整,即時的なエンジニアリングを必要としない新しい登録アルゴリズムSAMRegを開発した。
提案手法は,試験指標間でのインテンシティベース反復アルゴリズムとDDF予測学習ベースネットワークより優れている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:23:48 GMT)
A Systematic Investigation of Knowledge Retrieval and Selection for Retrieval Augmented Generation [12.0] 検索拡張生成(RAG)は,外部知識をモデル出力に統合することにより,自然言語生成を向上するための強力な手法として登場した。
本稿では,知識検索と選択がRAGシステムにおける下流生成性能にどのように影響するかを包括的に分析する。
その結果、下流ジェネレータモデルの能力とタスクとデータセットの複雑さは、知識検索と選択がRAGシステム全体の性能に与える影響に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:30:55 GMT)
Similarity-Dissimilarity Loss with Supervised Contrastive Learning for Multi-label Classification [11.5] マルチラベル分類のためのコントラスト学習を用いた類似性-類似性損失を提案する。
提案する損失は、教師付きコントラスト学習パラダイムの下で、すべてのエンコーダの性能を効果的に向上させる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:12:55 GMT)
Achieving Exponential Asymptotic Optimality in Average-Reward Restless Bandits without Global Attractor Assumption [11.4] 両腕の動的部分集合を2つ維持する新しいアンフツーセットポリシーを提案する。
2組のポリシーは、$O(exp(-C N)$Optimity gap for a $N$-armed problem で最適であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:28:16 GMT)
Structure-Preserving Network Compression Via Low-Rank Induced Training Through Linear Layers Composition [11.4] ローランド誘導訓練(LoRITa)と呼ばれる理論的修正手法を提案する。
LoRITaは線形層を構成することで低ランク化を促進し、特異値切り込みを用いて圧縮する。
我々は,完全連結ネットワーク上でのMNIST,視覚変換器上でのCIFAR10,畳み込みニューラルネットワーク上でのCIFAR10/100と画像ネットを用いたアプローチの有効性を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:38:11 GMT)
Improving Generalization on the ProcGen Benchmark with Simple Architectural Changes and Scale [11.4] 近年の強化学習(RL)と単純なアーキテクチャ変更が組み合わさって、ProcGenベンチマークの一般化が大幅に改善されている。
2次元の畳み込みレイヤを3次元の畳み込みレイヤに置き換え、レイヤ毎の畳み込みカーネル数をスケールアップする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:59:03 GMT)
Loss Landscape Characterization of Neural Networks without Over-Parametrization [11.4] 本稿では, 過度な過度なパラメータ化を必要とせず, 最新の深層モデルの損失を特徴付ける新しい関数のクラスを提案する。
この仮定の下で、勾配に基づく函数が収束の理論的保証を持つことを証明する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:23:17 GMT)
MixEHR-Nest: Identifying Subphenotypes within Electronic Health Records through Hierarchical Guided-Topic Modeling [11.3] マルチモーダルEHRデータを用いて,数千の疾患からサブフェノタイプトピックを推定する,ガイド付きトピックモデルMixEHR-Nestを提案する。
MixEHR-Nestは、疾患の進行と重症度を予測する表現型ごとに異なるパターンを持つ亜フェノタイプを同定することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:48:06 GMT)
SeerAttention: Learning Intrinsic Sparse Attention in Your LLMs [11.3] 本研究では,従来の注意を学習可能なゲートで強化する新しい注意機構を開発し,注意マップ内の重要なブロックを適応的に選択し,残りのブロックがスパースであると推定する。
SeerAttentionは32k長の顕著な90%のパリシティ比を達成でき、FlashAttention-2の5.67倍のスピードアップを提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:07:09 GMT)
The Disparate Benefits of Deep Ensembles [11.3] 本稿では,Deep Ensemblesのパフォーマンス向上とフェアネスの相互作用について検討する。
異なる利益効果(disparate benefit effect)と呼ぶものにおいて、それぞれが異なるグループを不均一に好んでいることが分かっています。
この不公平さを軽減するために,ポストプロセッシングが有効な方法であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:53:01 GMT)
Proof Flow: Preliminary Study on Generative Flow Network Language Model Tuning for Formal Reasoning [11.3] 本稿では,形式的推論の領域,特にニューラル定理証明設定における概念実証について述べる。
古典的な報酬最大化強化学習とは異なり、GFlowNetsは合成対象をサンプリングするための有望なアプローチとして登場した。
我々の初期の結果は、GFlowNetが検索環境におけるモデル性能を向上させる可能性を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:10:12 GMT)
A Construction of Evolving $3$-threshold Secret Sharing Scheme with Perfect Security and Smaller Share Size [11.1] 進化する$k$-thresholdシークレット共有スキームを$k=3で検討する。
次に,完全セキュリティを備えた新たな3ドルThresholdスキームを提案する。
このモデルと従来提案した3ドルthresholdスキームに基づいて,より簡潔な3ドルthresholdシークレットシェアリングスキームを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:17:11 GMT)
RescueADI: Adaptive Disaster Interpretation in Remote Sensing Images with Autonomous Agents [11.1] 本稿では,複数の相関解釈タスクを計画・実行することで要求を解決する新しいタスクである適応的災害解釈(ADI)を紹介する。
我々はRescueADIという新しいデータセットを提案する。このデータセットには高解像度RSIと3つの接続された側面(計画、知覚、認識)のアノテーションが含まれている。
大規模言語モデル(LLM)によって駆動される自律エージェントを用いたタスク計画と実行のための新しい災害解釈手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:36:52 GMT)
Memory-Efficient Optimization with Factorized Hamiltonian Descent [11.0] 本稿では,この課題に対処するためのメモリ効率因子化手法を取り入れた新しい適応型H-Facを提案する。
運動量とスケーリングパラメータ推定器の両方にランク1パラメータ化を適用することで、H-Facはメモリコストをサブ線形レベルに削減する。
我々はハミルトン力学から導かれる原理に基づいてアルゴリズムを開発し、最適化力学と収束保証において堅牢な理論的基盤を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:33:05 GMT)
Faster Diffusion Sampling with Randomized Midpoints: Sequential and Parallel [10.8] 我々のアルゴリズムは、$widetilde O(log2 d)$ parallel roundsでのみ実行できるように並列化可能であることを示す。
また、我々のアルゴリズムは、$widetilde O(log2 d)$ parallel roundsでしか実行できないことを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:54:52 GMT)
ArrivalNet: Predicting City-wide Bus/Tram Arrival Time with Two-dimensional Temporal Variation Modeling [10.8] バスと路面電車のための2次元時間変動に基づく多段階ATPであるtextitArrivalNetを提案する。
1次元の時間列を周期内および周期間変分に分解し、2次元テンソルに再キャストする。
異なる周波数で変換された2Dブロックは、コンピュータビジョンのバックボーンで効果的な学習を可能にする画像のような特徴表現を持つ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:17:23 GMT)
G2D: From Global to Dense Radiography Representation Learning via Vision-Language Pre-training [10.8] 我々は、textbfDenseレベル表現学習(G2D)のための、textbfGlobalという新しい医用ビジョン言語事前学習フレームワークを提案する。
G2Dは,大域的視覚言語アライメントと並行して,擬似セグメンテーションタスクを通じて,密で意味的な画像表現を学習する。
G2Dは、6つの医療画像タスクと25の疾患、特にセマンティックセグメンテーションにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:33:09 GMT)
Fairness-aware Federated Minimax Optimization with Convergence Guarantee [10.7] フェデレートラーニング(FL)はそのプライバシー保護機能のためにかなりの注目を集めている。
ユーザデータ管理の自由の欠如は、モデルが人種や性別などのセンシティブな要因に偏っている、グループフェアネスの問題につながる可能性がある。
本稿では,FLにおけるグループフェアネス問題に明示的に対処するために,拡張ラグランジアン法(FFALM)を用いたフェアフェデレーション平均化アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:56:28 GMT)
LLM-aided explanations of EDA synthesis errors [10.7] 大規模言語モデル(LLM)は、テキスト理解と質問応答能力を示している。
我々は,21種類のバグコードサンプル上に3つのOpenAI LLMを用いて,936個のエラーメッセージ説明を生成する。
その結果, 約71%のケースにおいて, LLMは初等学習者に適した正解と完全解法を与えることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:49:56 GMT)
The KnowWhereGraph Ontology [10.6] KnowWhereGraphは、広く公開されている地理空間知識グラフの1つである。
自然災害(ハリケーン、山火事など)、気候変数(気温、降水量など)、土壌特性、作物や土地被覆タイプ、人口統計、健康、様々な場所や地域識別子など、30の層からのデータが含まれている。
これらは、食料安全保障や農業サプライチェーンの課題に対処するために、さまざまなアプリケーションによって、グラフを通じて活用されてきた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:18:41 GMT)
Reducing Bias in Federated Class-Incremental Learning with Hierarchical Generative Prototypes [10.5] Federated Learning (FL) は、ディープモデルのトレーニングを、複数のデバイスに分散した計算によって解き放つことを目的としている。
FCLで自然に現れるインクリメンタルとフェデレーションのバイアスに光を当てました。
我々の提案は、トレーニング済みのバックボーンを効率的に微調整することで、最後の層のバイアスを抑える。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:52:10 GMT)
GeoCoder: Solving Geometry Problems by Generating Modular Code through Vision-Language Models [10.4] 視覚パラメトリックモデル(VLM)は、様々なマルチモーダルタスクにおいて大きな進歩を遂げた。
彼らはいまだに幾何学的な問題に悩まされており、事前訓練中に見えない数学的操作を行うことができないため、著しく制限されている。
モジュール型コードファインタニングを利用して,事前に定義された幾何関数ライブラリを使用してコードの生成と実行を行うGeoCoderを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:56:52 GMT)
SAda-Net: A Self-Supervised Adaptive Stereo Estimation CNN For Remote Sensing Image Data [10.4] 本稿では,自己改善型適応能力を有する自己教師型CNNを提案する。
最初のイテレーションでは、生成された不均等写像は不正確でうるさい。
この擬似基底構造は、ネットワークのトレーニングステップにおける各エポック後に適応され、更新される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:46:26 GMT)
Anchored Alignment for Self-Explanations Enhancement [10.3] 本稿では,大規模言語モデルによる推論の表現能力の向上を目的としたアライメント手法を提案する。
提案手法は,説明品質評価,自己指導データセット生成,モデルアライメントという3つの重要な要素から構成される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:42:48 GMT)
Nearly Tight Black-Box Auditing of Differentially Private Machine Learning [10.3] 本稿では,ブラックボックス脅威モデルにおけるDP-SGDアルゴリズムの監査手順を提案する。
DP-SGDのプライバシ分析は、初期モデルパラメータの選択に非依存であるからである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:15:29 GMT)
Context-Aware Adapter Tuning for Few-Shot Relation Learning in Knowledge Graphs [10.2] 本稿では,知識グラフにおける数ショット関係学習のための文脈認識型アダプタRelAdapterを提案する。
まず、RelAdapterは、メタ知識の関連性固有の調整可能な適応を容易にする軽量なアダプタモジュールを備えている。
第2に、RelAdapterはターゲット関係に関するコンテキスト情報に富み、それぞれの異なる関係への適応性を高める。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:00:29 GMT)
Context-Aware Adapter Tuning for Few-Shot Relation Learning in Knowledge Graphs [10.2] 本稿では,知識グラフにおける数ショット関係学習のための文脈認識型アダプタRelAdapterを提案する。
まず、RelAdapterは、メタ知識の関連性固有の調整可能な適応を容易にする軽量なアダプタモジュールを備えている。
第2に、RelAdapterはターゲット関係に関するコンテキスト情報に富み、それぞれの異なる関係への適応性を高める。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:00:29 GMT)
See Where You Read with Eye Gaze Tracking and Large Language Model [10.1] 本稿では,リニアとジャンプの両方をサポートする読み上げトラッキングとハイライトシステムを提案する。
制御された実験では、信頼性の高いリニアリーディングトラッキングが示され、ジャンプリーディングの精度は84%である。
18名のボランティアによる実地試験は,読解段落の追跡と強調においてシステムの有効性を実証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:23:57 GMT)
PyGim : An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures [10.0] 実PIMシステム上でグラフニューラルネットワークを高速化する,効率的なMLライブラリであるPyGimを紹介する。
我々は、計算集約型およびメモリ集約型カーネルをプロセッサ中心およびメモリ中心のシステムで実行するハイブリッドGNN実行を提供する。
我々は、1992年のPIMコアを持つ実世界のPIMシステム上で、新しいGNNモデルを用いてPyGimを広範囲に評価し、Intel Xeonの最先端CPUを平均3.04倍に上回っていることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:21:19 GMT)
Do LLMs Overcome Shortcut Learning? An Evaluation of Shortcut Challenges in Large Language Models [9.9] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な機能を示している。
本稿では,LLMの性能に及ぼすショートカットの影響を評価するためのテストスイートであるShortcut Suiteを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:52:52 GMT)
From Isolated Conversations to Hierarchical Schemas: Dynamic Tree Memory Representation for LLMs [9.8] 動的木構造メモリ表現を活用するアルゴリズムであるMemTreeを導入し、情報の組織化、検索、統合を最適化する。
我々のアルゴリズムは、新しい情報や既存の情報のセマンティック埋め込みを比較して、このメモリ構造を動的に適応させ、モデルのコンテキスト認識を強化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:47:11 GMT)
CYCLO: Cyclic Graph Transformer Approach to Multi-Object Relationship Modeling in Aerial Videos [9.8] 本研究では,空中ビデオにおける多目的関係モデリングに焦点を当てた新しいAeroEyeデータセットを提案する。
本稿では,Cyclic Graph Transformer (CYCLO) アプローチを提案する。
また、提案手法により、固有巡回パターンでシーケンスを処理し、オブジェクト関係を正しい順序で処理することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:05:50 GMT)
LightPAL: Lightweight Passage Retrieval for Open Domain Multi-Document Summarization [9.7] Open-Domain Multi-Document Summarization (ODMDS)は、ユーザクエリに応答して巨大なドキュメントコレクションから要約を生成するタスクである。
ODMDSタスクのオープンエンドクエリでは、従来の検索列サマリズアプローチは不足している。
ODMDSの軽量パス検索手法であるLightPALを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:09:37 GMT)
Attr-Int: A Simple and Effective Entity Alignment Framework for Heterogeneous Knowledge Graphs [9.7] エンティティアライメント(EA)とは、異なる知識グラフ(KG)内のエンティティをリンクすることである。
本稿では, 異種KG間の整合性の問題について検討し, 対処する。
本稿では,Attr-Intと呼ばれるシンプルで効果的なエンティティアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:16:56 GMT)
See Where You Read with Eye Gaze Tracking and Large Language Model [9.7] 本稿では,リニアとジャンプの両方をサポートする読み上げトラッキングとハイライトシステムを提案する。
制御された実験では、信頼性の高いリニアリーディングトラッキングが示され、ジャンプリーディングの精度は84%である。
18名のボランティアによる実地試験は,読解段落の追跡と強調においてシステムの有効性を実証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:23:57 GMT)
See Where You Read with Eye Gaze Tracking and Large Language Model [9.7] 本稿では,リニアとジャンプの両方をサポートする読み上げトラッキングとハイライトシステムを提案する。
制御された実験では、信頼性の高いリニアリーディングトラッキングが示され、ジャンプリーディングの精度は84%である。
18名のボランティアによる実地試験は,読解段落の追跡と強調においてシステムの有効性を実証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:23:57 GMT)
Optimizing Preference Alignment with Differentiable NDCG Ranking [9.6] 近年の研究では、嗜好学習の理論的願望と実際の結果との間にかなりの相違が明らかになっている。
本稿では、人間の嗜好調整を学習から学習までのタスクとみなす新しい手法である、アンダーラインDirectアンダーラインランキングアンダーライン最適化(O)を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:54:57 GMT)
NLIP_Lab-IITH Multilingual MT System for WAT24 MT Shared Task [9.5] 本稿では,NLIP Lab の多言語機械翻訳システムである WAT24 の多言語 Indic MT タスクにおける共有タスクについて述べる。
本稿では、アライメント合意の目的を用いたIndic言語の事前学習について検討する。
我々は,小型かつ高品質なシードデータを用いて,言語指向の多言語翻訳モデルを微調整した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:18:23 GMT)
PrE-Text: Training Language Models on Private Federated Data in the Age of LLMs [9.4] PrE-Text合成データは、デバイス上で訓練された小さなモデルよりも優れていることを示す。
また,PrE-TextのDP合成データを用いて大規模モデルを微調整することで,大規模言語モデル(LLM)の性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:11:46 GMT)
On the Use of Audio to Improve Dialogue Policies [9.4] 音声とテキストの埋め込みを組み合わせることで、音声情報を追加する新しいアーキテクチャを提案する。
実験により、音声埋め込み対応対話ポリシーがテキストベースよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:37:20 GMT)
Expected Sliced Transport Plans [9.3] 本研究では, 1次元の最適輸送計画を, もともとの空間に戻す「揚力」操作を提案する。
本研究では、EST計画を用いて、ある点から別の点へ移動する際のユークリッドの個々のコストの和を重み付けし、入力された離散確率測度間の有効距離を求めることを証明する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:18:31 GMT)
EchoApex: A General-Purpose Vision Foundation Model for Echocardiography [9.2] 本稿では,初の汎用視覚基礎モデルであるEchoApexを紹介し,様々な臨床応用について紹介する。
自己教師付き学習を活用して、EchoApexは11の臨床センターから2000万以上のエコー画像に事前訓練されている。
最先端のタスク固有のモデルと比較すると、EchoApexは統一されたイメージエンコーディングアーキテクチャでパフォーマンスが改善されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:13:49 GMT)
SouLLMate: An Application Enhancing Diverse Mental Health Support with Adaptive LLMs, Prompt Engineering, and RAG Techniques [9.1] メンタルヘルスの問題は個人の日常生活に大きな影響を及ぼすが、多くの人は利用可能なオンラインリソースでも必要な支援を受けていない。
この研究は、最先端のAI技術を通じて、多様な、アクセス可能な、スティグマのない、パーソナライズされた、リアルタイムのメンタルヘルスサポートを提供することを目的としている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:04:32 GMT)
Interpreting Temporal Graph Neural Networks with Koopman Theory [9.1] 時間グラフに対する説明可能性のアプローチを導入する。
本稿では,STGNNの決定過程を解釈する2つの方法を提案する。
本稿では,感染時間や感染ノードなどの解釈可能な特徴を,拡散過程の文脈で正確に識別する方法を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:56:33 GMT)
FedPAE: Peer-Adaptive Ensemble Learning for Asynchronous and Model-Heterogeneous Federated Learning [9.1] フェデレートラーニング(FL)は、分散データソースを持つ複数のクライアントが、データのプライバシを損なうことなく、共同で共有モデルをトレーニングすることを可能にする。
我々は、モデルの不均一性と非同期学習をサポートする完全分散pFLアルゴリズムであるFederated Peer-Adaptive Ensemble Learning (FedPAE)を紹介する。
提案手法では,ピアツーピアモデル共有機構とアンサンブル選択を用いて,局所情報とグローバル情報とのより洗練されたバランスを実現する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:47:19 GMT)
Cross-Domain Sequential Recommendation via Neural Process [9.0] Cross-Domain Sequential Recommendation (CDSR)は、シーケンスベースのユーザ関心モデリングにおいてホットなトピックである。
オーバーラップしないユーザの行動の可能性を解き明かし、CDSRを強化する方法を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:22:57 GMT)
Learning Counterfactual Distributions via Kernel Nearest Neighbors [9.0] カーネルをベースとした近傍の分布一般化を導入し,その基礎となる分布を推定する。
2つ以上の測定値にアクセスできれば, 近接するアプローチがヘテロセシダスティックノイズに対して堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:36:01 GMT)
Distributional Matrix Completion via Nearest Neighbors in the Wasserstein Space [9.0] わずかに観察された経験的分布の行列を考えると、観測された行列と観測されていない行列の両方に関連する真の分布をインプットしようと試みる。
最適輸送のツールを用いて、最も近い隣人法を分布設定に一般化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:50:17 GMT)
Integrating Temporal Representations for Dynamic Memory Retrieval and Management in Large Language Models [8.9] 我々は、シナプス力学をレトリーバル強化生成(RAG)に組み込む新しいアプローチであるSynapticRAGを提案する。
本手法は,会話から長期的文脈維持と特定の情報抽出を強化することで,文脈認識型対話型AIシステムを進化させる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:51:03 GMT)
Pricing Factors and TFMs for Scalability-Focused ZK-Rollups [8.9] 本稿では,ZK-Rollupsにおけるトランザクション課金機構(TFM)の設計について検討する。
インセンティブの整合性や純利益性など,適切なTFMが持つべき特性について概説する。
さらに、TFMの代替案を提案し、トレードオフについて議論し、さらなる調査を必要とするオープンな疑問を強調します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:09:18 GMT)
Continuous-time q-Learning for Jump-Diffusion Models under Tsallis Entropy [8.9] 本稿では,Tsallisエントロピー正規化の下で,Q-ラーニング(Q-ラーニングの連続的対応)を特徴とするジャンプ拡散モデルの連続時間強化学習について検討する。
最適ポートフォリオ清算問題と非LQ制御問題という2つのファイナンシャル・アプリケーションについて検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:45:44 GMT)
Quamba: A Post-Training Quantization Recipe for Selective State Space Models [8.9] State Space Models (SSM) は、大きな言語モデルのためのTransformerに代わる魅力的な代替品として登場した。
本研究では,入力アクティベーションの最大値を選択的SSMに抑制する静的8ビットSSM量子化法を提案する。
8ビットのウェイトアクティベーションを量子化したMamba 2.8B SSMはハードウェアアクセラレーションの恩恵を受け、Nvidia Orin Nano 8Gでは1.72倍のレイテンシを実現しています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:32:33 GMT)
Discrete distributions are learnable from metastable samples [8.9] 多変数分布のサンプルとして設計されたマルコフ連鎖サンプリングは、しばしば状態空間の特定の領域で立ち往生する。
本研究では, メタスタビリティ条件を満たす準安定分布の単一変数条件が, 真の分布に近い平均値であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:38:44 GMT)
Continuous normalizing flows for lattice gauge theories [8.9] 群変換の下で同変である行列リー群に対する一般的な連続正規化フローアーキテクチャを提案する。
これを2次元の格子ゲージ理論に原理証明として適用し、競合性能を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:30:44 GMT)
Into the Unknown Unknowns: Engaged Human Learning through Participation in Language Model Agent Conversations [8.8] 協調的なSTORMは、複数のLMエージェント間の会話を観察し、管理することを可能にする。
エージェントはユーザの代理として質問を行い、未知の未知をセレンディピティーに発見する。
自動評価のために,実際の情報検索記録をユーザ目標として収集し,WildSeekデータセットを構築する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:43:22 GMT)
Can Medical Vision-Language Pre-training Succeed with Purely Synthetic Data? [8.8] 医療ビジョン言語による事前トレーニングモデルのトレーニングには、ペアで高品質な画像テキストデータを備えたデータセットが必要である。
近年の大規模言語モデルの進歩により,大規模合成画像テキストペアの生成が可能になった。
多様な高品質な合成データセットを構築するための自動パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:11:07 GMT)
The Writing is on the Wall: Analyzing the Boom of Inscriptions and its Impact on EVM-compatible Blockchains [8.7] 本稿では,2023年後半から2024年前半にかけての取引急増に関するデータ駆動分析について述べる。
また, ある日, Arbitrum および ZKsync 時代において, 碑文が90%近くを占めていたことが確認された。
また,ZKsyncとArbitrumは,これらの急激な上昇中,中央値のガス料金が低かった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:22:42 GMT)
A theoretical perspective on mode collapse in variational inference [8.7] 統計的に有利なシナリオにおいてもモード崩壊が存在することを示し、それを駆動する2つの主要なメカニズム、平均アライメントと消滅するウェイトを同定する。
我々の理論的な知見は、一般的な生成モデルのクラスである正規化フローを用いた変分推論の実装と一致している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:56:30 GMT)
Targeted Vaccine: Safety Alignment for Large Language Models against Harmful Fine-Tuning via Layer-wise Perturbation [8.6] T-Vaccineは、モデル選択層のみに摂動を適用するメモリ効率の良い安全アライメント手法である。
その結果,T-バクシンは防御効果と資源効率の両方においてバクシンよりも優れていた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:49:06 GMT)
Targeted Vaccine: Safety Alignment for Large Language Models against Harmful Fine-Tuning via Layer-wise Perturbation [8.6] T-Vaccineは、モデル選択層のみに摂動を適用するメモリ効率の良い安全アライメント手法である。
その結果,T-バクシンは防御効果と資源効率の両方においてバクシンよりも優れていた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:49:06 GMT)
Estimating the Probabilities of Rare Outputs in Language Models [8.6] 小型変圧器言語モデルからのargmaxサンプリングの文脈における低確率推定について検討した。
その結果、重要サンプリングはアクティベーション外挿より優れるが、どちらもナイーブサンプリングより優れていることがわかった。
低確率推定のための新しい手法は、最悪の場合の性能についてより強力な保証を提供するために必要である、と我々は主張する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:31:18 GMT)
Auditing and Enforcing Conditional Fairness via Optimal Transport [8.6] 条件付き人口均等(きゅうきょくせい、英: Conditional population parity、CDP)とは、ある追加機能や特徴セットを条件に、予測モデルや決定過程の人口均等度を測る尺度である。
多くのアルゴリズム的公平性技術は人口統計学的平等を狙うために存在するが、CDPは達成がずっと難しい。
最適な輸送文献から借りた統計的距離に依存する条件付き人口格差(CDD)の新たな尺度を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:08:13 GMT)
Local transfer learning Gaussian process modeling, with applications to surrogate modeling of expensive computer simulators [8.5] 科学的進歩における重要なボトルネックは、複雑なシステムのためのコンピュータシミュレーションのコストのかかる性質である。
多くのアプリケーションでは、関連するシステムで利用可能なデータがあることが多い。
重要な疑問は、このような"ソース"システムからの情報を効果的にサロゲートトレーニングのためにどのように転送するかである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:53:56 GMT)
Recurrent Neural Goodness-of-Fit Test for Time Series [8.2] 時系列データは、金融や医療など、さまざまな分野において重要である。
従来の評価基準は、時間的依存関係と潜在的な特徴の高次元性のために不足している。
Recurrent Neural (RENAL) Goodness-of-Fit testは,生成時系列モデルを評価するための新しい,統計的に厳密なフレームワークである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:32:25 GMT)
Pseudo Dataset Generation for Out-of-Domain Multi-Camera View Recommendation [8.2] 本稿では,通常の動画を擬似ラベル付きマルチカメラビューレコメンデーションデータセットに変換することを提案する。
対象領域のビデオから派生した擬似ラベル付きデータセット上でモデルをトレーニングすることにより、対象領域におけるモデルの精度が68%向上する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:21:22 GMT)
Natural Language Processing Methods for the Study of Protein-Ligand Interactions [8.2] 自然言語処理の最近の進歩は、タンパク質-リガンド相互作用を予測する効果的な方法の開発に関心を抱いている。
本稿では,近年の文献にそのようなアプローチが適用された経緯と,短期記憶,変圧器,注意などの有用なメカニズムについて解説する。
我々は、PLIの研究におけるNLP手法の現在の限界と、今後の課題について論じる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:56:34 GMT)
Natural Language Processing Methods for the Study of Protein-Ligand Interactions [8.2] 自然言語処理の最近の進歩は、タンパク質-リガンド相互作用を予測する効果的な方法の開発に関心を抱いている。
本稿では,近年の文献にそのようなアプローチが適用された経緯と,短期記憶,変圧器,注意などの有用なメカニズムについて解説する。
我々は、PLIの研究におけるNLP手法の現在の限界と、今後の課題について論じる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:56:34 GMT)
See Behind Walls in Real-time Using Aerial Drones and Augmented Reality [8.2] ARD2は、2つの空中ドローンと拡張現実(AR)デバイスを使用したリアルタイムな壁面監視を可能にするフレームワークである。
第1段階では、ARD2は、ドローン、ユーザ、ターゲット間の幾何学的関係を利用して、ターゲットの方向をユーザーのARディスプレイに投影する。
第2段階では、ターゲットの輪郭を再構築するためにドローンの画像が合成され、ユーザは壁の後ろのターゲットを視覚化することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:51:58 GMT)
Airdrops: Giving Money Away Is Harder Than It Seems [8.1] 本稿では,エアドロップの設計空間について概説し,効果的戦略の鍵となる成果について述べる。
我々は6つの大規模空地からのオンチェーンデータを分析し、その成功を評価し、トークンのかなりの部分が「空地農家」によって売られることが多いことを発見した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:15:29 GMT)
A Method for Efficient Heterogeneous Parallel Compilation: A Cryptography Case Study [8.1] 本稿では,多様なハードウェアアーキテクチャにまたがるデータ管理と並列計算を最適化するために,ハイパーという新しいMLIRベースの方言を提案する。
HETOCompilerは,複数のハッシュアルゴリズムを実装し,不均一なシステム上での実行を可能にする,暗号に着目したコンパイラのプロトタイプである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:06:57 GMT)
$π$QLB: A Privacy-preserving with Integrity-assuring Query Language for Blockchain [8.0] 現在のブロックチェーンシステムは、組み込みセキュリティとプライバシ保証を備えたデータクエリをサポートしていない。
本稿では,クエリ入力の機密性とクエリ結果の整合性を保証するブロックチェーンシステム用のクエリ言語である$pi$QLBを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:03:22 GMT)
D-Net: Dynamic Large Kernel with Dynamic Feature Fusion for Volumetric Medical Image Segmentation [7.9] 動的大カーネル(DLK)および動的特徴融合(DFF)モジュールを提案する。
D-Netは、マルチスケールの大規模な受容場を効果的に利用し、グローバルな文脈情報を適応的に活用することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:51:28 GMT)
What Matters in Transformers? Not All Attention is Needed [7.9] トランスフォーマーベースの大規模言語モデル(LLM)は、様々なタスクで有望なパフォーマンスを示している。
また、冗長なアーキテクチャを導入し、現実世界のデプロイメントに効率上の課題を提起する。
我々は、類似度に基づくメトリクスを用いて、ブロック、アテンション層を含むトランスフォーマー内の異なるモジュール間の冗長性を調べる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:43:35 GMT)
Bounded KRnet and its applications to density estimation and approximation [7.8] 本稿では,有界領域上に,B-KRnetと呼ばれる可逆写像を開発する。
データに対する密度推定/近似や、フォッカー・プランク方程式やケラー・セゲル方程式のようなPDEの解に応用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:48:59 GMT)
A Simplifying and Learnable Graph Convolutional Attention Network for Unsupervised Knowledge Graphs Alignment [7.7] 教師なし知識グラフアライメント(SLU)のための簡易かつ学習可能なグラフ畳み込み型アライメントネットワークを提案する。
具体的には、まず2つのKGのグラフ構造をモデル化するバックボーンネットワークとして、新しいシンプルなフレームワークLCATを紹介する。
そこで我々は、アライメントされたエンティティの無効な近傍情報を効率的にフィルタリングするために、ポテンシャルマッチング関係に基づく関係構造の再構築手法を設計する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:37:46 GMT)
FAStEN: An Efficient Adaptive Method for Feature Selection and Estimation in High-Dimensional Functional Regressions [7.7] 本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:23:51 GMT)
Self-Managing DRAM: A Low-Cost Framework for Enabling Autonomous and Efficient in-DRAM Operations [7.7] 本稿では,自律的なDRAM保守操作を可能にする,低コストなDRAMアーキテクチャであるSelf-Managing DRAM(SMD)を提案する。
SMDは、メモリコントローラからチップへのメンテナンス操作を制御する責任を負う。
DDRxインタフェースに新しいピンを追加することなく、低レイテンシで実装可能であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:57:05 GMT)
Unmasking Database Vulnerabilities: Zero-Knowledge Schema Inference Attacks in Text-to-SQL Systems [7.6] 本稿では,データベースの事前知識を必要とせずに,テキストから生成モデルへの基盤となるデータベーススキーマを再構築するための新しいゼロ知識フレームワークを提案する。
F1スコアは生成モデルで最大.99、微調整モデルで最大.78である。
本稿では、生成モデルに対する簡単な保護機構を提案し、これらの攻撃を緩和する際の限界を実証的に示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:06:23 GMT)
Adaptive Constraint Integration for Simultaneously Optimizing Crystal Structures with Multiple Targeted Properties [7.6] Adaptive Crystal Synthesizer (SMOACS) を用いた同時多目的最適化
SMOACSは、モデル再トレーニングを必要とせずに、適応的制約を最適化プロセスに統合することを可能にする。
我々は,135個の原子サイトまでの大きな原子配置において,電気的中立性を維持するという困難な制約を満たす中で,バンドギャップの最適化を実証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:05:20 GMT)
Adaptive Constraint Integration for Simultaneously Optimizing Crystal Structures with Multiple Targeted Properties [7.6] Adaptive Crystal Synthesizer (SMOACS) を用いた同時多目的最適化
SMOACSは、モデル再トレーニングを必要とせずに、適応的制約を最適化プロセスに統合することを可能にする。
我々は,135個の原子サイトまでの大きな原子配置において,電気的中立性を維持するという困難な制約を満たす中で,バンドギャップの最適化を実証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:05:20 GMT)
Looking Inward: Language Models Can Learn About Themselves by Introspection [7.5] イントロスペクションは、その人の現在の精神状態へのアクセスを特権的に許可する。
我々は,イントロスペクションを,トレーニングデータに含まれない,あるいは派生していない知識の獲得と定義する。
本研究では,LLMの微調整によるイントロスペクションについて検討し,その挙動を仮説的シナリオで予測する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:24:10 GMT)
CERES: Critical-Event Reconstruction via Temporal Scene Graph Completion [7.5] 本稿では,実世界のデータに基づくシミュレーションにおけるオンデマンドシナリオ生成手法を提案する。
実世界のデータセットから得られたシナリオをシミュレーションに統合することにより、テストの妥当性と妥当性を高める。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:02:06 GMT)
Performance of a GPU- and Time-Efficient Pseudo 3D Network for Magnetic Resonance Image Super-Resolution and Motion Artifact Reduction [7.5] 磁気共鳴イメージング(MRI)の最重要課題は、取得時間短縮と運動アーティファクトの減少である
深層学習に基づく画像復元は、高分解能かつモーションアーティファクトのないMRI画像を生成するための有望なソリューションとして登場した。
本研究では, 擬似3次元MRI画像の超解像再構成(SRR)と動きアーチファクト縮小(MAR)のための統合された2次元ディープラーニングフレームワークを採用した。
ネットワークの精度は画素ワイドの不確実性マップを用いて評価し、最先端の手法に対して性能をベンチマークした。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:57:15 GMT)
Striking a Balance: An Optimal Mechanism Design for Heterogenous Differentially Private Data Acquisition for Logistic Regression [7.5] プライバシに敏感な販売者のデータを用いて機械学習タスクを解決するという課題に対処する。
データは非公開なので、支払いと引き換えに販売者にデータを提供するインセンティブを与えるデータ市場を設計します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:09:51 GMT)
RGB to Hyperspectral: Spectral Reconstruction for Enhanced Surgical Imaging [7.3] そこで本研究では,RGBデータから高スペクトル信号の再構成を行い,画像診断の精度向上を図る。
畳み込みニューラルネットワーク(CNN)とトランスフォーマーモデルに基づく各種アーキテクチャの評価を行った。
変換器モデルはRMSE、SAM、PSNR、SSIMの点で優れた性能を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:05:41 GMT)
Efficient Function Placement in Virtual Networks: An Online Learning Approach [7.2] 本稿では,仮想関数配置問題のモデルと,マルチアームバンディットに基づくアイデアを用いた新しいアルゴリズムを提案する。
これらのアルゴリズムは最適な配置ポリシーを迅速に学習し、その後悔は高い確率で実現可能性制約を尊重しながら、少なくとも$O(N M sqrtTln T )$で増大する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:03:43 GMT)
Debiasing Large Vision-Language Models by Ablating Protected Attribute Representations [7.1] 本稿では,テキスト生成時のバイアス属性を直接評価することで,LVLMのための新しい脱バイアスフレームワークを提案する。
本手法では, トレーニングを必要とせず, 比較的少数の代表バイアス出力が要求される。
我々の実験は、LVLMが保護属性に関連するテキストを生成することの妥当性を最小化できるだけでなく、合成データを使ってアブレーションを知らせることさえできることを示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:02:31 GMT)
PORTAL: Scalable Tabular Foundation Models via Content-Specific Tokenization [7.0] 我々は、クリーニングや前処理を必要とせずに、様々なデータモダリティを処理するフレームワーク、 Portal(Pretraining One-Row-at-a-Time for All tabLes)を紹介します。
オンラインにコンパイルされたデータセットで効果的に事前トレーニングされ、複雑な分類と回帰タスクに関する最先端の手法に適合するように微調整される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:05:44 GMT)
Investigating Chain-of-thought with ChatGPT for Stance Detection on Social Media [7.0] バックプロパゲーショントレーニングを必要としないChain-of-Thought(CoT)アプローチが,有望な代替手段として現れている。
本稿では,CoTの姿勢検出における有効性について検討し,その精度を実証し,関連する課題について議論する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:35:00 GMT)
Hiformer: Hybrid Frequency Feature Enhancement Inverted Transformer for Long-Term Wind Power Prediction [6.9] ハイブリット周波数特徴強調変換器(ハイフォーマ)という新しい手法を提案する。
Hiformerは、気象条件と風力発電の相関関係のモデリングを強化するために、信号分解技術と気象特徴抽出技術を統合する。
最先端の手法と比較して、(i)予測精度を最大52.5%向上させ、(ii)計算時間を最大68.5%削減することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:00:36 GMT)
CCUP: A Controllable Synthetic Data Generation Pipeline for Pretraining Cloth-Changing Person Re-Identification Models [6.9] 衣服交換者再識別(CC-ReID)はコンピュータビジョンにおいて重要かつ困難な研究課題である。
CC-ReIDデータの構築コストが高いため、既存のデータ駆動モデルは、限られたデータで効率的にトレーニングするのは難しい。
制御可能かつ高品質な合成データを生成するための低コストで効率的なパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:04:02 GMT)
Cross-Rollup MEV: Non-Atomic Arbitrage Across L2 Blockchains [6.9] 本研究では,レイヤ2(L2)ブロックチェーン上での非原子MEVのポテンシャルを,クロスロールとDEX-CEXの仲裁機会を測定することによって定量化する。
L2のスワップコストと価格不一致のクロスロールアップとDEX-CEXを解析することにより、50万以上の未探索仲裁機会を特定する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:02:16 GMT)
Adversarial Neural Networks in Medical Imaging Advancements and Challenges in Semantic Segmentation [6.9] 人工知能(AI)の最近の進歩は、医療画像のパラダイムシフトを引き起こしている。
本稿では,脳画像のセマンティックセグメンテーションへの深層学習(AIの主分野)の統合を体系的に検討する。
敵対的ニューラルネットワークは、自動化するだけでなく、セマンティックセグメンテーションプロセスを洗練する、新しいAIアプローチである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:05:05 GMT)
Game of Coding: Sybil Resistant Decentralized Machine Learning with Minimal Trust Assumption [6.9] 本稿では,コーディングフレームワークのゲームにおけるノード数の増加がもたらす意味について検討する。
敵ノード数の増加による敵ノードの柔軟性の増大にもかかわらず、敵ノードのパワー向上は敵ノードにとって有益ではないことを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:35:34 GMT)
A Diffusion-based Xray2MRI Model: Generating Pseudo-MRI Volumes From one Single X-ray [6.8] 単一のX線画像から擬似MRIボリュームを生成することができる新しい拡散型Xray2MRIモデルを提案する。
実験により,X線からの情報を付加的な入力データと統合することにより,実際のMRIスキャンを近似した擬似MRIシーケンスを生成することができることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:36:38 GMT)
Leveraging LLM Embeddings for Cross Dataset Label Alignment and Zero Shot Music Emotion Prediction [6.8] 本稿では,複数データセットにまたがるラベルアライメントと,新たなカテゴリにおけるゼロショット予測にLarge Language Model (LLM)埋め込みを利用する音楽感情認識の新しい手法を提案する。
我々は,新たなデータセットに対してゼロショット推論を行うことにより,新たなトレーニングを伴わずに,未知のラベルに一般化できることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:18:14 GMT)
ORCHID: A Chinese Debate Corpus for Target-Independent Stance Detection and Argumentative Dialogue Summarization [6.7] オーラル・チャイナ・ディベート(Oral Chinese Debate)は、標的非依存の姿勢検出と議論の要約をベンチマークする最初の中国のデータセットである。
このデータセットは、中国語で476のユニークなトピックについて行われた1,218の現実世界の討論から成り、その内容は2,436のスタンス固有の要約と14,133の完全注釈付き発話を含む。
その結果、データセットの難易度が示され、議論対話の要約にスタンス検出を組み込むことの可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:28:27 GMT)
MCQG-SRefine: Multiple Choice Question Generation and Evaluation with Iterative Self-Critique, Correction, and Comparison Feedback [6.7] 医療事例を高品質なUSMLEスタイルの質問に変換する枠組みを提案する。
MCQG-SRefineは、専門家主導のプロンプトエンジニアリングと反復的な自己批判と自己補正フィードバックを統合している。
複雑でコストのかかる専門家評価プロセスを置き換えるため, LLM-as-Judge を用いた自動計測手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:38:29 GMT)
From Babbling to Fluency: Evaluating the Evolution of Language Models in Terms of Human Language Acquisition [6.6] 本稿では,LMの能力を評価するための3段階のフレームワークを提案する。
言語研究の手法を用いて, LMの生成能力を評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:31:49 GMT)
Whisker-Inspired Tactile Sensing: A Sim2Real Approach for Precise Underwater Contact Tracking [6.6] ピンニペットのような水生哺乳動物は、ウイスキーを使って物体を検出し、識別し、水の動きを分析する。
ファイバブラッググレーティング(FBG)技術を用いた水中ウイスキーセンサの設計と応用について述べる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:19:01 GMT)
Variational Source-Channel Coding for Semantic Communication [6.6] 現在の意味コミュニケーションシステムは一般にオートエンコーダ(AE)としてモデル化されている
AEは、チャネルダイナミクスを効果的にキャプチャできないため、コミュニケーション戦略とAI原則の深い統合を欠いている。
本稿では,従来のコミュニケーションとセマンティックコミュニケーションを区別するデータ歪みの包含について検討する。
意味コミュニケーションシステムを構築するために,VSCC法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:20:08 GMT)
Preserving Cardiac Integrity: A Topology-Infused Approach to Whole Heart Segmentation [6.5] 全心セグメンテーション(WHS)は、心臓血管疾患の診断、疾患のモニタリング、治療計画、予後をサポートする。
本稿では,深層ニューラルネットワークに統合された新しいトポロジ保存モジュールを提案する。
この実装は、学習したトポロジ保存フィールドを用いて、完全に3次元の畳み込みに基づいており、3次元のボクセルデータに対して非常に効果的である、解剖学的に妥当なセグメンテーションを実現する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:07:02 GMT)
Preserving Cardiac Integrity: A Topology-Infused Approach to Whole Heart Segmentation [6.5] 全心セグメンテーション(WHS)は、心臓血管疾患の診断、疾患のモニタリング、治療計画、予後をサポートする。
本稿では,深層ニューラルネットワークに統合された新しいトポロジ保存モジュールを提案する。
この実装は、学習したトポロジ保存フィールドを用いて、完全に3次元の畳み込みに基づいており、3次元のボクセルデータに対して非常に効果的である、解剖学的に妥当なセグメンテーションを実現する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:07:02 GMT)
MinRank Gabidulin encryption scheme on matrix codes [6.5] 行列符号とMinRank問題に対するMcElieceスキームとNiederreiterフレームの一般化を提案する。
我々の新しいアプローチは、古典的なMcEliece方式よりも、暗号文と公開鍵とのトレードオフを良くすることを可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:03:24 GMT)
DiffImp: Efficient Diffusion Model for Probabilistic Time Series Imputation with Bidirectional Mamba Backbone [6.4] 現在のDDPMに基づく確率的時系列計算手法は2種類の課題に直面している。
計算効率の良い状態空間モデルであるMambaをDDPMのバックボーンデノシングモジュールとして統合する。
提案手法では,複数のデータセット,異なるシナリオ,欠落率に対して,最先端の時系列計算結果が得られる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:48:52 GMT)
Three-Input Ciphertext Multiplication for Homomorphic Encryption [6.4] ホモモルフィック暗号化(HE)は、暗号文上で直接計算することができる。
HEは、ニューラルネットワーク推論、診断、財務データ分析など、プライバシ保護コンピューティングに不可欠である。
本稿では,計算の複雑さを低減するために,3入力暗号文の乗算を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:40:49 GMT)
From Single to Multi: How LLMs Hallucinate in Multi-Document Summarization [6.4] 複数の文書からトピック特化情報を要約する際に,大規模言語モデル (LLM) において幻覚がどのように現れるかを検討する。
平均して、LLM生成サマリーの最大75%は幻覚化され、要約の終わりに幻覚が生じる可能性が高い。
これらの幻覚の特徴を理解するために、手動で700以上の洞察を評価し、ほとんどのエラーは指示に従わなかったり、過度に総合的な洞察が得られなかったりする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:38:53 GMT)
LLMs are Biased Teachers: Evaluating LLM Bias in Personalized Education [6.4] パーソナライズされた教育環境において,大きな言語モデル(LLM)をバイアスとして評価する。
我々は、異なる人口集団に合わせた教育コンテンツをモデルが生成し、選択する方法について、重大なバイアスを明らかにした。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:27:44 GMT)
Measuring Non-Hermitian Topological Invariants Directly from Quench Dynamics [6.3] 非エルミタン(NH)位相相と現象は様々な量子系で観測されている。
奇数次元系における様々なNHトポロジ不変量の直接測定のための汎用的で統一的なフレームワークを提案する。
この研究は、量子系におけるNHトポロジカル不変量の直接測定の道を開いた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:48:45 GMT)
Finding Logic Bugs in Spatial Database Engines via Affine Equivalent Inputs [6.3] 空間データベース管理システム(SDBMS)は、空間データを保存、操作、検索することを目的としている。
SDBMSのロジックバグの存在は、誤った結果をもたらす可能性がある。
SDBMSのロジックバグの検出は、誤った結果を特定するための基礎的な真実が欠如しているため、難しい。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:23:09 GMT)
Goal Inference from Open-Ended Dialog [6.2] 本稿では,多様なユーザ目標を学習し,達成するためのエンボディエージェントのオンライン手法を提案する。
大規模言語モデルとの対話から自然言語目標表現を抽出する。
その結果,制約のない対話に基づいて,複雑な目標に対する不確実性を表現できることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:30:52 GMT)
The Moral Case for Using Language Model Agents for Recommendation [6.2] 既存のレコメンデーターは、大量監視、集中力、狭い行動主義に陥り、ユーザーエージェンシーを侵害する。
自然言語で表現されたユーザの好みや値にマッチしたコンテンツのソースとキュレートには,言語モデル(LM)エージェントを使用します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:06:32 GMT)
GeoReasoner: Geo-localization with Reasoning in Street Views using a Large Vision-Language Model [6.1] 本研究は,大規模視覚言語モデル(LVLM)を用いた新しいパラダイムによる地理的局在化の課題に取り組む。
既存のストリートビューデータセットには、視覚的な手がかりがなく、推論に理由がない多くの低品質画像が含まれていることが多い。
データ品質の問題に対処するため、我々はCLIPベースのネットワークを考案し、街路ビュー画像がどこにあるかを定量化する。
推論の精度を高めるために,実地局所化ゲームから得られた外部知識を統合し,価値ある人間の推論能力を活用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:25:47 GMT)
Lost in Tracking: Uncertainty-guided Cardiac Cine MRI Segmentation at Right Ventricle Base [6.1] 本稿では,CMRセグメンテーションにおける未解決問題,特にRVベースに対処することを提案する。
本稿では,時間的アンコヒーレンスを利用して平面間動きの発生時にセグメンテーションを通知する新しいデュアルエンコーダU-Netアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:43:29 GMT)
Lost in Tracking: Uncertainty-guided Cardiac Cine MRI Segmentation at Right Ventricle Base [6.1] 本稿では,CMRセグメンテーションにおける未解決問題,特にRVベースに対処することを提案する。
本稿では,時間的アンコヒーレンスを利用して平面間動きの発生時にセグメンテーションを通知する新しいデュアルエンコーダU-Netアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:43:29 GMT)
Optimizing Probabilistic Conformal Prediction with Vectorized Non-Conformity Scores [6.1] 本研究では,まず非整合性スコアをランク付きサンプルでベクトル化し,次に同じランクのサンプルに対して定量値を変化させることで,予測値の形状を最適化することにより,効率を向上させる新しいフレームワークを提案する。
提案手法は,不連続かつ効率的な予測セットを生成しながら,有効なカバレッジを提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:37:03 GMT)
A Diffusion-based Xray2MRI Model: Generating Pseudo-MRI Volumes From one Single X-ray [6.0] 単一X線画像から擬似MRIボリュームを生成することができる新しい拡散型Xray2MRIモデルを提案する。
実験の結果,提案手法は実際のMRIスキャンを近似した擬似MRIシーケンスを生成することができることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:36:38 GMT)
A new approach for fine-tuning sentence transformers for intent classification and out-of-scope detection tasks [6.0] 仮想アシスタントシステムでは,システムの範囲外にあるユーザクエリを拒否あるいはリダイレクトすることが重要である。
スコープ外拒否(OOS)の最も正確なアプローチの1つは、スコープ内クエリにおける意図分類のタスクと組み合わせることである。
本研究は,自己エンコーダを用いて学習した顕微鏡内埋め込み型再構成損失を用いて,クロスエントロピー損失を正規化することを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:15:12 GMT)
DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMs [6.0] 大規模言語モデル(LLM)は様々なタスクに優れるが、ハードウェアの制約によりデプロイメントの課題に直面している。
重み付き重み付き量子化(DAQ)を提案する。
LLaMAとLLaMA-2の実験では、DAQが最良基準法より一貫して優れていることが示されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:10:52 GMT)
Novelty-based Sample Reuse for Continuous Robotics Control [6.0] 強化学習では、エージェントは環境相互作用を通じて国家情報と報酬を収集する。
従来のアルゴリズムは、通常、一組のサンプルを処理した後、環境に再侵入する。
不均一なサンプル利用に対処するために,新規誘導型サンプル再利用(NSR)を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:34:37 GMT)
Fast Estimation of Partial Dependence Functions using Trees [6.0] 我々は,任意の部分依存関数を効率的に推定する木に基づく新しい推定器,textttFastPDを提案する。
任意の特徴部分集合に対するPD関数を推定することにより、 textttFastPD は SHAP や PD プロット、高次相互作用効果などの PD ベースの解釈を抽出することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:21:47 GMT)
TabSeq: A Framework for Deep Learning on Tabular Data via Sequential Ordering [5.9] この作業では、機能のシーケンシャルな順序付けのための新しいフレームワークであるTabSeqを紹介している。
このような機能の最適なシーケンス順序を見つけることで、ディープラーニングモデルの学習プロセスを改善することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:10:36 GMT)
Pose-Based Sign Language Appearance Transfer [5.8] 本稿では,手話の骨格ポーズにおいて,手話の内容を保持しながら手話の外観を伝達する手法を提案する。
このアプローチは、アイデンティティを難読化しながらポーズベースのレンダリングとサインステッチを改善する。
実験の結果,シグナ識別精度は低下するが,シグナ認識性能はわずかに低下することがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:33:54 GMT)
OAH-Net: A Deep Neural Network for Hologram Reconstruction of Off-axis Digital Holographic Microscope [5.8] 本稿では, 深層学習とオフ軸ホログラフィの物理原理を融合した新しい再構成手法を提案する。
我々のオフ軸ホログラムネットワーク(OAH-Net)は、ハードウェアに起因する測定誤差範囲内にある誤差のある位相および振幅画像を取得する。
この能力は、生物学的および医学の両方でオフ軸ホログラフィーの応用をさらに拡大する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:25:18 GMT)
FDF: Flexible Decoupled Framework for Time Series Forecasting with Conditional Denoising and Polynomial Modeling [5.8] 時系列予測は多くのWebアプリケーションにおいて不可欠であり、業界全体で重要な意思決定に影響を与える。
我々は拡散モデルが大きな欠点に悩まされていることを論じる。
予測性能を向上させるために,高品質な時系列表現を学習するフレキシブルデカップリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:20:43 GMT)
How Initial Connectivity Shapes Biologically Plausible Learning in Recurrent Neural Networks [5.7] リカレントニューラルネットワーク(RNN)の学習における初期接続性の影響について検討した。
その結果,初歩重みは生物学的に妥当な学習規則の学習性能に著しく影響を及ぼすことがわかった。
我々は,リアプノフ指数を正規化する最近提案された勾配フロス法を生物学的に妥当な学習に拡張した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:11:34 GMT)
Leveraging Fine-Tuned Language Models for Efficient and Accurate Smart Contract Auditing [5.7] 本稿では,スマートコントラクト監査において,より小型で微調整されたモデルを用いて,同等あるいは優れた結果が得られる可能性について検討する。
本稿では,スマートコントラクト監査のための費用対効果の高い特化モデルの開発を目的としたFTSmartAuditフレームワークを紹介する。
コントリビューションには,(1)データ準備,トレーニング,評価,継続的な学習を効率化するシングルタスク学習フレームワーク,(2)ドメイン固有知識蒸留を利用した堅牢なデータセット生成手法,(3)モデルの正確性と堅牢性を維持するための適応型学習戦略などが含まれている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:09:09 GMT)
Deep Smart Contract Intent Detection [5.6] textscSmartIntentNNは、スマートコントラクトにおける開発意図を自動的に検出するように設計されたディープラーニングモデルである。
実世界の4万以上のスマートコントラクトからなるデータセット上で,TextscSmartIntentNNをトレーニングし,評価した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:48:51 GMT)
Best in Tau@LLMJudge: Criteria-Based Relevance Evaluation with Llama3 [5.5] そこで本稿では,大規模言語モデル (LLM) を付加する代替手法を提案する。
基準レベルのグレードを関連ラベルに集約する様々な方法を検討する。
2024年夏に発生した LLMJudge Challenge のデータをもとに,我々のアプローチを実証的に評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:37:08 GMT)
Graph Neural Flows for Unveiling Systemic Interactions Among Irregularly Sampled Time Series [5.5] 我々は不規則な時間点で観測された時系列の系統的相互作用を明らかにするグラフベースモデルを開発した。
時系列分類や予測など,いくつかの課題に対するアプローチの有効性を検証し,その有効性を実証する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:10:39 GMT)
Degraded Polygons Raise Fundamental Questions of Neural Network Perception [5.4] 我々は、30年以上前に人間の視覚の認識・コンポーネント理論で導入された、劣化中の画像の復元作業を再考する。
周辺劣化した正多角形の大規模データセットを高速に生成するための自動形状復元テストを実装した。
この単純なタスクにおけるニューラルネットワークの振舞いは、人間の振舞いと矛盾する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:27:09 GMT)
Scalable Training of Trustworthy and Energy-Efficient Predictive Graph Foundation Models for Atomistic Materials Modeling: A Case Study with HydraGNN [5.4] 我々はHydraGNNを用いて、スケーラブルで信頼性があり、エネルギー効率の高い予測グラフ基盤モデル(GFMs)の開発とトレーニングを行う。
HydraGNNは、トレーニングスケールとデータの多様性の両方において、グラフニューラルネットワーク(GNN)計算の境界を拡張する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:46:46 GMT)
Interpreting Inflammation Prediction Model via Tag-based Cohort Explanation [5.4] 本稿では,局所的特徴重要度スコアに基づいて,データセット内のコホートを識別する新しいフレームワークを提案する。
食品ベースの炎症予測モデル上での枠組みを評価し,その枠組みがドメイン知識に合致する信頼性のある説明を生成できることを実証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:22:59 GMT)
Reducing the Transformer Architecture to a Minimum [5.4] トランスフォーマーは、特に自然言語処理(NLP)とコンピュータビジョン(CV)において、広く成功しているモデルアーキテクチャである。
注意機構自体は、その内部的な類似度測定によって非線形である。
MNISTとCIFAR-10という,広範なCVベンチマークを試験して,その基盤を築き上げた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:36:14 GMT)
Learning a Stable, Safe, Distributed Feedback Controller for a Heterogeneous Platoon of Autonomous Vehicles [5.3] 異種小隊のための安定で安全な分散制御系を学習するためのアルゴリズムを提案する。
シミュレーションで自律小隊を訓練し、4台のF110車両からなる小隊によるハードウェアの性能評価を行う。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:45:57 GMT)
Probability Distribution Learning: A theoretical framework for Deep Learning [5.3] 本稿では,新しい理論学習フレームワークである確率分布(PD)学習を紹介する。
PD学習は、単純なx内で分解された変数としてモデル化される、基礎となる分布確率に焦点を当てる。
本稿では、標準損失関数と勾配構造制御(GSC)アルゴリズムを導入し、この関数を用いることで、標準誤差と構造誤差の最適化が可能であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:23:49 GMT)
CohEx: A Generalized Framework for Cohort Explanation [5.3] コホートの説明は、特定のグループや事例のコホートにおける説明者の振る舞いに関する洞察を与える。
本稿では,コホートの説明を測る上でのユニークな課題と機会について論じる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:36:18 GMT)
Red and blue language: Word choices in the Trump & Harris 2024 presidential debate [5.3] 我々は、トランプとハリスの言語が、以下の意味的・実践的な特徴とどのように異なるかを分析する。
ハリス氏は回復と権限強化に関してしばしば議論するが、トランプ氏は危機と衰退に焦点を当てることが多い。
候補者の反応の特異性には有意な差はなかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:19:03 GMT)
Learning to Ask Informative Questions: Enhancing LLMs with Preference Optimization and Expected Information Gain [5.2] 大型言語モデル (LLM) は、しばしば情報的質問を生成するのによく機能する。
そこで本研究では,20種類のゲーム対話におけるLLM生成質問の情報性向上手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:43:21 GMT)
A Systematic Analysis of Large Language Models as Soft Reasoners: The Case of Syllogistic Inferences [5.1] 我々は、論理学と認知心理学において広範囲に研究されている誘因的推論の領域であるシロメトリクス推論の事例を考察する。
思考の連鎖的推論,文脈内学習,教師付き微調整がシロメトリクス的推論に及ぼす影響について検討した。
以上の結果から,事前学習したLSMの行動は認知科学によって説明できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:12:21 GMT)
Large Language Models are Easily Confused: A Quantitative Metric, Security Implications and Typological Analysis [5.0] 言語融合(Language Confusion)とは、大言語モデル(LLM)が所望の言語でもなく、文脈的に適切な言語でもテキストを生成する現象である。
我々は,この混乱を計測し定量化するために設計された,新しい計量であるLanguage Confusion Entropyを導入する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:43:30 GMT)
Tensor Decomposition with Unaligned Observations [5.0] アンアラインな観測モードは、再生カーネルヒルベルト空間(RKHS)の関数を用いて表現される
本稿では,2値型,整数値型,正値型など,データの種類を効果的に説明できる多元的損失関数を提案する。
また、$ell$ロス関数を使用する際の効率向上のためにスケッチアルゴリズムも導入された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:39:18 GMT)
RAMPA: Robotic Augmented Reality for Machine Programming and Automation [5.0] 本稿では,RAMPA(Robotic Augmented Reality for Machine Programming)を紹介する。
RAMPAは最先端のARヘッドセット、例えばMeta Quest 3の能力を利用するシステムである。
提案手法は,ユーザの物理的環境内で直接,スキルデモのその場でのデータ記録,可視化,微調整を可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:21:28 GMT)
Bidirectional Emergent Language in Situated Environments [5.0] マルチエージェントポンとコレクターの2つの新しい協調環境を紹介した。
最適なパフォーマンスには通信プロトコルの出現が必要ですが、適度な成功はそれなしで達成できます。
エージェントは意味のあるメッセージのみを生成し、調整なしでは成功できない状態の受信メッセージに作用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:55:35 GMT)
Quantum-classical correspondence of non-Hermitian spin-orbit coupled bosonic junction [4.9] 対称性を破る相転移点の近傍では、古典的(平均場)と量子力学の対応が崩壊しがちであることを示す。
平均場と多粒子モデルの両方において、SOC効果はスピンアップ成分とスピンダウン成分の間の同期周期振動を大幅に促進することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:58:17 GMT)
An Exposition of Pathfinding Strategies Within Lightning Network Clients [4.9] Lightning Networkは、Bitcoinのスケーラビリティ問題に対処するために設計されたピアツーピアネットワークである。
本稿では,Lightning Network ノード実装におけるパスフィンディング戦略の違いについて検討する。
成功率,手数料,パス長,タイムロックなど,さまざまなパスフィニング戦略の有効性を評価した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:21:45 GMT)
Analyzing Deep Transformer Models for Time Series Forecasting via Manifold Learning [4.9] トランスフォーマーモデルは、自然言語処理やコンピュータビジョンといった様々な領域において、一貫して顕著な成果を上げてきた。
これらのモデルをよりよく理解するための継続的な研究努力にもかかわらず、この分野はいまだに包括的な理解を欠いている。
画像やテキスト情報とは異なり、時系列データは解釈し分析することがより困難である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:32:35 GMT)
Let Students Take the Wheel: Introducing Post-Quantum Cryptography with Active Learning [4.8] ポスト量子暗号(PQC)は、既存のソフトウェアシステムをセキュアにするためのソリューションとして認識されている。
本研究は,PQCを大学生や大学院生に教える上での,新たなアクティブラーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:52:03 GMT)
Fairness-Enhancing Ensemble Classification in Water Distribution Networks [4.8] 配水ネットワーク(WDN)等の社会経済的関連インフラへのAIの適用について検討する。
本稿では、既存の定義の拡張として、WDNにおける保護されたグループとグループフェアネスの適切な定義を提案する。
本研究では,非微分可能なアンサンブル分類法にも適用可能な公平性を高めるための治療法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:53:02 GMT)
DiRecNetV2: A Transformer-Enhanced Network for Aerial Disaster Recognition [4.7] 災害評価における航空画像処理のための人工知能(AI)モデルと無人航空機の統合には、例外的な精度、計算効率、リアルタイム処理能力が必要である。
伝統的に、畳み込みニューラルネットワーク(CNN)は局所的特徴抽出の効率を示すが、大域的文脈解釈の可能性によって制限される。
視覚変換器(ViT)は、注意機構を用いることで、グローバルな文脈解釈の改善を約束するが、それでもUAVベースの災害対応アプリケーションでは未検討である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:25:13 GMT)
Towards Inducing Document-Level Abilities in Standard Multilingual Neural Machine Translation Models [4.6] この研究は、訓練済みのNMTモデルを絶対正弦波のPEから相対的なPEに移行するという課題に対処する。
パラメータ効率のよい微調整は,少量の高品質なデータしか利用せず,この遷移をうまく促進できることを示す。
いくつかの言語における少量の長文データが、言語間長の一般化に十分であることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:59:37 GMT)
LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning [4.6] Low-Rank Adaptation (LoRA) は、大規模な更新パラメータをフル微調整で処理する問題に対処しようと試みている。
トレーニング可能なパラメータを2600倍に削減する,PEFT(Suboptimal-Efficient Fine-Tuning)アプローチであるLoLDUを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:51:17 GMT)
Change Detection in Multivariate data streams: Online Analysis with Kernel-QuantTree [4.5] Kernel-QuantTree指数重み移動平均(KQT-EWMA)
Kernel-QuantTree (KQT)ヒストグラムとEWMA統計を組み合わせた非パラメトリックな変化検出アルゴリズム。
合成および実世界のデータセットの実験では、KQT-EWMAが$ARL_0$を制御でき、最先端の手法に匹敵する検出遅延を達成できることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:17:38 GMT)
Improving Discrete Optimisation Via Decoupled Straight-Through Gumbel-Softmax [4.4] 提案手法は,複数のタスクやデータセットにまたがる広範な実験を通じて,元のST-GSを大幅に向上することを示す。
本研究は,ディープラーニングにおける離散最適化の改善に寄与する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:44:57 GMT)
Multi-Conditional Ranking with Large Language Models [4.4] 大規模言語モデルを用いて項目をランク付けすることは、レコメンデーションと検索システムにおいて一般的なアプローチとなっている。
しかし、現実のシナリオは、比較的小さな項目のセットをランク付けするなど、異なる課題を呈することが多い。
本稿では, 条件を抽出し, ソートし, 項目を反復的にランク付けする, 分割推論手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:37:19 GMT)
BUNDL: Bayesian Uncertainty-aware Deep Learning with Noisy training Labels for Seizure Detection in EEG [4.3] Scalp EEGは高いノイズレベルに影響を受けやすいため、発作のタイミングや特徴の不正確なアノテーションにつながる。
本稿では,ラベル曖昧性の深層学習モデルを示す新しい統計フレームワークを提案する。
BUNDLはラベルの曖昧さに対処するために特別に設計されており、てんかん評価のための信頼性と信頼性のあるモデルのトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:19:39 GMT)
Decoding quantum color codes with MaxSAT [4.3] 我々は,LightsOut パズルに基づく MaxSAT 問題として定式化を用いた量子カラーコードのための新しいデコーダを提案する。
提案するデコーダの復号化性能は,カラーコード上での最先端の復号化性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:53:38 GMT)
Preserving Cardiac Integrity: A Topology-Infused Approach to Whole Heart Segmentation [4.2] 全心セグメンテーション(WHS)は、心臓血管疾患の診断、疾患のモニタリング、治療計画、予後をサポートする。
本稿では,深層ニューラルネットワークに統合された新しいトポロジ保存モジュールを提案する。
この実装は、学習したトポロジ保存フィールドを用いて、完全に3次元の畳み込みに基づいており、3次元のボクセルデータに対して非常に効果的である、解剖学的に妥当なセグメンテーションを実現する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:07:02 GMT)
MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment [4.1] 本研究では,高強度流路を有する高密度海洋環境における無人表面車両(USV)の航法問題について検討する。
静的および動的障害物から生じる複雑さと、電流の流れによって引き起こされる乱れの力により、既存の航法プロトコルは安全を確保できず、海上での衝突を避けるのに不十分である。
安全かつ効率的なロボットポリシーを学習するために,エージェントの静的・移動障害と環境からの流れの乱れを空間的・時間的に捉えるために,注意機構を活用する手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:57:15 GMT)
LieRE: Generalizing Rotary Position Encodings [4.1] LieRE は n 次元入力をサポートするために Rotary Position Embeddings (RoPE) を超える。
2次元および3次元画像分類タスクにおけるLieREの性能を評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:06:18 GMT)
H2OVL-Mississippi Vision Language Models Technical Report [4.1] H2OVL-Mississippiは3700万の画像テキスト対で訓練された2組の視覚言語モデルである。
H2OVL-Mississippi-0.8Bは、テキスト認識に特化した0.8億のパラメータを持つ小さなモデルである。
H2OVL-Mississippi-2Bは、一般的なユースケースのための20億のパラメータモデルであり、非常に競争力のある指標を示しています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:46:34 GMT)
Data Complexity Estimates for Operator Learning [4.1] 我々は,演算子学習のデータ複雑性を研究する理論を開発した。
より狭い演算子のクラスにおいて、チューナブルパラメータの数の観点からFNOによって効率的に近似されることで、効率的な演算子学習がデータ複雑性においても達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:55:36 GMT)
Data-driven rainfall prediction at a regional scale: a case study with Ghana [4.0] 最先端の数値天気予報(NWP)モデルは、アフリカの熱帯地域で熟練した降雨予測を作成するのに苦労している。
2つのU-Net畳み込みニューラルネットワーク(CNN)モデルを開発し、12時間と30時間リード時の24時間降雨を予測する。
また,従来のNWPモデルとデータ駆動モデルを組み合わせることにより,予測精度が向上することがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:07:53 GMT)
Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland [4.0] ヘッドノートの自動作成は、スイスだけで何十万もの意思決定を、より容易に行えるものにする可能性がある。
これを開始するために、スイスリード決定要約データセットを紹介します。
この言語横断的な資料にはドイツ語、フランス語、イタリア語の18K裁判所判決とドイツ語の見出しが記載されている。
我々の分析では、プロプライエタリなモデルはゼロショットとワンショット設定でよく機能するが、微調整された小さなモデルは依然として強力な競争力を持つ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:34:07 GMT)
Probing-RAG: Self-Probing to Guide Language Models in Selective Document Retrieval [4.0] 本稿では,言語モデルの中間層からの隠れ状態表現を利用して,与えられたクエリに対する追加検索の必要性を適応的に決定するProbing-RAGを提案する。
Probing-RAGはモデルの内部認識を効果的に捉え、外部文書の取得に関する信頼性の高い意思決定を可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:48:54 GMT)
Precipitation Nowcasting Using Diffusion Transformer with Causal Attention [3.9] 現在のディープラーニング手法は、条件と予測結果の効果的な依存関係を確立するのに不足している。
因果アテンションモデルを用いた拡散変圧器を用いた降雨キャスティングを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:10:41 GMT)
Block-Attention for Efficient RAG [3.9] Block-Attentionは、Retrieval-Augmented Generation(RAG)シナリオにおける推論遅延の増加とコストに対処する。
各パスをブロックとして定義することで、Block-Attentionは、これまで見てきたパスのKV状態の再利用を可能にします。
4つのRAGベンチマークの実験では、ブロックの微調整後、Block-Attentionモデルが自己注意モデルに匹敵するパフォーマンスを達成することが示されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:27:30 GMT)
Block-Attention for Efficient RAG [3.9] Block-Attentionは、Retrieval-Augmented Generation(RAG)シナリオにおける推論遅延の増加とコストに対処する。
各パスをブロックとして定義することで、Block-Attentionは、これまで見てきたパスのKV状態の再利用を可能にします。
4つのRAGベンチマークの実験では、ブロックの微調整後、Block-Attentionモデルが自己注意モデルに匹敵するパフォーマンスを達成することが示されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:27:30 GMT)
Generalization for Least Squares Regression With Simple Spiked Covariances [3.9] 勾配降下によって訓練された2層ニューラルネットワークの一般化特性はいまだよく分かっていない。
最近の研究は、隠れた層における特徴行列のスペクトルを記述することで進展した。
しかし、スパイク共分散を持つ線形モデルの一般化誤差は以前には決定されていない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:46:51 GMT)
Sliding Puzzles Gym: A Scalable Benchmark for State Representation in Visual Reinforcement Learning [3.8] Sliding Puzzles Gym (SPGym) は従来の15タイルパズルをグリッドサイズと観測空間で拡張したベンチマークである。
SPGymは、潜在環境の動的性とアルゴリズム的問題を固定しつつ、表現学習課題のスケーリングを可能にする。
モデルフリーとモデルベース両方のRLアルゴリズムを用いた実験では、表現課題がスケールするにつれて、SPGymはその能力に基づいてエージェントを効果的に区別できることが示されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:23:03 GMT)
Phase retrieval: Global convergence of gradient descent with optimal sample complexity [3.8] 本稿では,$m(O)$の測定値から信号ベクトルを復元することを目的とした位相探索問題に対処する。
我々は、m(O)$測定が、高い確率で、目的関数が良質なグローバルな風景を持つことを保証するのに十分であることを証明した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:31:36 GMT)
Global convergence of gradient descent for phase retrieval [3.8] 位相探索におけるベニグアランドスケープのテンソルに基づく基準を提案し,勾配軌道の有界性を確立する。
これは、勾配降下がほとんどすべての初期点に対して大域最小値に収束することを意味する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:31:36 GMT)
Enhanced Prompt-leveraged Weakly Supervised Cancer Segmentation based on Segment Anything [3.8] がんなどの疾患の病理診断は、従来、医師や病理医による形態学的特徴の評価に頼っていた。
近年,診断支援ツールとしてコンピュータ支援診断(CAD)システムの進歩が注目されている。
本稿では,クラスアクティベーションマップとSAMに基づく擬似ラベルを組み合わせ,弱教師付きセマンティックセマンティックセグメンテーション(WSSS)モデルを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:55:09 GMT)
Stage-Aware Learning for Dynamic Treatments [3.7] 動的治療体制のための新しい個別化学習法を提案する。
観測軌道が最適処理と完全に一致しなければならないという制約を緩和することにより,本手法はIPWE法における試料効率と安定性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:59:19 GMT)
Eyelid Fold Consistency in Facial Modeling [3.7] ヒトのまぶたは外見が多様で、皮膚の折りたたみや表皮の折りたたみ形態は個人によって様々である。
既存のパラメトリックフェースモデルは眼の形状の変化をある程度表現しているが、多様な個人にわたって十分な類似性を保っていない。
アイライドフォールド整合性の新しい定義を提案し, 統一トポロジーにおける多様なアイライド形状をモデル化するための幾何処理手法を実装した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:55:14 GMT)
signwriting-evaluation: Effective Sign Language Evaluation via SignWriting [3.5] 本稿では,SignWritingに特化して設計された評価指標を総合的に紹介する。
シングルサインの評価と継続的署名の課題に対処する。
以上の結果から,各指標の長所と短所が明らかとなり,今後の進歩に有意義な洞察が得られた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:28:45 GMT)
Deep Generative Models Unveil Patterns in Medical Images Through Vision-Language Conditioning [3.4] 深部生成モデルでは、データセットのサイズと品質を向上することにより、医療画像解析が大幅に進歩している。
画像合成プロセスの指針として,臨床データとセグメンテーションマスクを組み合わせることによって,ハイブリッド条件による生成構造を用いる。
我々のアプローチは、画像と臨床情報の視覚的相関が低いため、従来の医療報告誘導合成よりも困難であり、課題である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:48:36 GMT)
The Influence of Generative AI on Content Platforms: Supply, Demand, and Welfare Impacts in Two-Sided Markets [3.4] 本稿では、生成的人工知能が、人間とAIの両方がコンテンツを生成するオンラインプラットフォームにどのように影響するかを考察する。
我々は、生産的AIが供給と需要をどのように変化させ、交通分布に影響を与え、社会福祉に影響を及ぼすかを理解するためのモデルを開発する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:14:12 GMT)
Towards Multilingual LLM Evaluation for European Languages [3.4] ヨーロッパ言語に適した多言語評価手法を提案する。
ヨーロッパ21言語にまたがる40のLLMの能力を評価するために,広く使用されている5つのベンチマークの翻訳版を採用した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:58:53 GMT)
Towards Cross-Lingual LLM Evaluation for European Languages [3.4] ヨーロッパ言語に適した言語間評価手法を提案する。
ヨーロッパ21言語にまたがる40のLLMの能力を評価するために,広く使用されている5つのベンチマークの翻訳版を採用した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:58:53 GMT)
Co-Segmentation without any Pixel-level Supervision with Application to Large-Scale Sketch Classification [3.3] 画像の集合における共通物体の画素レベルの局所化という,オブジェクトの分離のための新しい手法を提案する。
この方法は、同じレベルの監督で訓練された方法のうち、最先端のパフォーマンスを達成する。
大規模スケッチ認識の課題において,提案手法の利点をさらに示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:16:45 GMT)
Universal quantum operations and ancilla-based readout for tweezer clocks [3.3] 我々は、中性原子の超狭光遷移に対する普遍量子演算とアンシラに基づく読み出しを示す。
我々の研究は、中性原子を持つハイブリッドプロセッサクロックデバイスの基礎を築き、量子センサーにリンクされた量子プロセッサの実用的応用の可能性を示唆している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:16:50 GMT)
Pyramid-Driven Alignment: Pyramid Principle Guided Integration of Large Language Models and Knowledge Graphs [3.3] 大きな言語モデル(LLM)は印象的な推論能力を持っているが、誤った情報を生成する傾向があり、しばしば幻覚と呼ばれる。
既存の手法は主に外部知識グラフ(KG)を静的知識リポジトリとして扱い、KGとLLMの知識の重大な相違を見越す。
本稿では,LLMとKGをシームレスに統合する新しいフレームワークであるPDAを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:00:37 GMT)
Detecting AI-Generated Texts in Cross-Domains [3.2] ベースラインモデルとして,RoBERTa-Rankerというランキング分類器を訓練する。
次に、新しいドメインで少量のラベル付きデータしか必要としないRoBERTa-Rankerを微調整する手法を提案する。
実験により、この微調整されたドメイン認識モデルは、一般的なTectGPTとGPTZeroより優れていることが示された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:43:30 GMT)
Comparative Analysis of Extrinsic Factors for NER in French [3.1] 名前付きエンティティ認識(NER)は構造化情報の識別を目的とした重要なタスクである。
本稿では,NERモデルの性能向上のために,モデル構造,コーパスアノテーション,データ拡張手法などの諸要因について検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:50:02 GMT)
Augmentation Policy Generation for Image Classification Using Large Language Models [3.0] 本稿では,大規模言語モデルを用いて効率的な拡張ポリシーを自動生成する戦略を提案する。
提案手法は医用画像データセットを用いて評価され,最先端の手法よりも明確な改善が見られた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:26:10 GMT)
PiLocNet: Physics-informed neural network on 3D localization with rotating point spread function [3.0] これまでに導入したローカライゼーションニューラルネットワークであるLocNetの新たな拡張を提案する。
改良されたネットワークは、我々がPiLocNetと呼ぶ物理インフォームドニューラルネットワーク(PINN)である。
本論文は3次元ソース位置のエンコードにシングルローブ回転型PSFを用いることに焦点を当てるが,他のPSFや画像問題にも広く適用できると期待している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:49:23 GMT)
Context Matters: Leveraging Contextual Features for Time Series Forecasting [3.0] 既存の予測モデルにマルチモーダルなコンテキスト情報を外科的に統合する新しいプラグイン・アンド・プレイ手法であるContextFormerを導入する。
ContextFormerは、カテゴリ、連続、時間変化、さらにはテキスト情報を含む、リッチなマルチモーダルコンテキストから予測固有の情報を効果的に蒸留する。
エネルギー、交通、環境、金融ドメインにまたがるさまざまな実世界のデータセットにおいて、SOTA予測モデルを最大30%上回ります。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:46:29 GMT)
SBI-RAG: Enhancing Math Word Problem Solving for Students through Schema-Based Instruction and Retrieval-Augmented Generation [3.0] そこで本研究では,学生が課題をその構造に基づいて分類し,課題解決の精度を向上させるためのフレームワークを提案する。
我々のアプローチは、ソリューション生成をガイドするためにスキーマを活用することで、ステップバイステップの推論を強調します。
GSM8Kデータセットの性能評価を行い,GPT-4およびGPT-3.5 Turboと比較した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:46:49 GMT)
Linguistically Grounded Analysis of Language Models using Shapley Head Values [2.9] 最近提案されたシェープヘッド値(SHV)を用いた言語モデル探索手法を利用した形態素合成現象の処理について検討する。
英語のBLiMPデータセットを用いて、BERTとRoBERTaという2つの広く使われているモデルに対して、我々のアプローチを検証し、言語構造がどのように扱われるかを比較する。
以上の結果から,SHVに基づく属性は両モデルにまたがる異なるパターンを明らかにし,言語モデルがどのように言語情報を整理・処理するかの洞察を与える。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:48:08 GMT)
Hybrid bundle-adjusting 3D Gaussians for view consistent rendering with pose optimization [2.9] 本稿では,ポーズ最適化によるビュー一貫性レンダリングを実現するハイブリッドなバンドル調整3Dガウスモデルを提案する。
このモデルは、画像ベースとニューラルな3D表現を共同で抽出し、前方のシーン内でビュー一貫性のある画像とカメラのポーズを同時に生成する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:13:00 GMT)
FaithBench: A Diverse Hallucination Benchmark for Summarization by Modern LLMs [2.9] 本稿では,10の現代LSMによる難解な幻覚を含む要約幻覚ベンチマークであるFaithBenchを紹介する。
その結果, GPT-4o と GPT-3.5-Turbo が最も幻覚が少ないことが判明した。
最高の幻覚検出モデルでさえ、FaithBenchには50%近い精度があり、将来の改善の余地がたくさんあることを示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:30:46 GMT)
A Pattern to Align Them All: Integrating Different Modalities to Define Multi-Modal Entities [2.8] マルチモーダル知識グラフは、エンティティと可能なモーダル表現を関連付けることによって、従来の知識グラフを拡張する。
本稿では,エンティティとそれが伝達する情報との間の関心事の分離を捉える新しいデザインパターンを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:41:04 GMT)
MuJo: Multimodal Joint Feature Space Learning for Human Activity Recognition [2.8] HAR(Human Activity Recognition)は、医療、スポーツ、フィットネス、セキュリティなど、幅広い分野で応用されているAIの長年の問題である。
本研究では,HAR 性能を向上させるため,総合的な Fitness Multimodal Activity データセット (FiMAD) を導入する。
MM-Fit,myoGym, MotionSense, MHEALTH などの実HARデータセット上で,FiMAD で事前学習した分類器の性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:08:13 GMT)
Quantum computational complexity of matrix functions [2.7] 2つの原始問題の計算複雑性について検討する。
単項関数、チェビシェフ関数、時間発展関数、逆関数の4つの関数を考える。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:00:03 GMT)
Enhancing Fact Retrieval in PLMs through Truthfulness [2.7] 事前訓練された言語モデル(PLM)は、文中の次の単語または欠落単語を予測するために訓練される前訓練段階における世界に関する様々な事実を符号化する。
近年の研究では、PLMの隠れ状態を利用して、PLMの入力の真性を決定することが示されている。
本研究では,ファクト検索を改善するためのヘルパーモデルについて検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:00:13 GMT)
Vision-Language-Action Model and Diffusion Policy Switching Enables Dexterous Control of an Anthropomorphic Hand [2.7] 微調整された視覚・言語・行動モデルと拡散モデルの相対的利点を組み合わせたハイブリッド制御法を提案する。
VLAモデルのみを使用する場合と比較して,このモデル切替手法は80%以上の成功率を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:49:45 GMT)
Recursive deep learning framework for forecasting the decadal world economic outlook [2.7] 我々は、世界経済のGDP成長率を10年にわたって予測する深層学習フレームワークを開発する。
先進国,開発途上国において,優れた深層学習モデルを検証し,従来の計量モデルと比較した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:50:03 GMT)
On estimating the trace of quantum state powers [2.6] 量子状態のトレースを推定する計算複雑性を、$n$-qubit混合量子状態$rho$に対して$texttr(rhoq)$で調べる。
我々の高速化は、正のパワー関数の計算可能な一様近似を量子特異値変換に効率よく導入することで達成される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:57:13 GMT)
Fast-forwarding quantum algorithms for linear dissipative differential equations [2.6] truncated Dyson級数に基づく量子アルゴリズムは、コスト$widetildemathcalO(log(T) (log (1/epsilon)) 2 )$で散逸したODEの履歴状態を時間$T$まで作成できることを示す。
応用として、量子アルゴリズムは散逸性非エルミート量子力学と熱過程を高速な複雑性サブ線形時間でシミュレートできることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:33:47 GMT)
Measuring and Modifying the Readability of English Texts with GPT-4 [2.5] GPT-4 Turbo と GPT-4o mini の可読性評価は, 人間の判断と相対的に高い相関性を示した。
事前登録された人間の実験では、Turboがテキストを確実に読みやすくするか、読みにくいかを尋ねる。
この仮説を支持する証拠は見つかっているが、人間の判断にかなりのばらつきは説明されていない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:04:28 GMT)
Quantity vs. Quality of Monolingual Source Data in Automatic Text Translation: Can It Be Too Little If It Is Too Good? [2.5] 本研究は, モノリンガルデータも少なすぎるか, 品質に基づく削減が翻訳モデルの性能に与える影響について検討する。
実験により、英語とドイツ語の低リソースNMTでは、利用可能なすべてのデータを利用するよりも、品質やテストデータ領域に基づいて、最も有用な追加データのみを選択する方がよいことが示されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:20:40 GMT)
Federated scientific machine learning for approximating functions and solving differential equations with data heterogeneity [2.4] 本稿では、複素関数を近似し微分方程式を解くためのFLとSciMLの統合について検討する。
非独立かつ同一に分散したデータ(非ID)の度合いを制御できる様々なデータ生成手法を提案する。
提案手法の有効性を実証するため,FedPINN上のPDE問題2,FedDeepONet上でのPDE問題5,PDE問題3の10実験を行った。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:57:04 GMT)
Conformal Prediction for Federated Graph Neural Networks with Missing Neighbor Information [2.4] 本研究は,連合グラフ学習へのコンフォーマル予測の適用性を拡張した。
分散サブグラフにおけるリンク不足問題に対処し、CPセットサイズに対する悪影響を最小限に抑える。
本稿では,欠落したデータに対する負の影響を軽減するために,変分オートエンコーダに基づく近隣住民の再構築手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:22:25 GMT)
Unleashing Artificial Cognition: Integrating Multiple AI Systems [2.4] 本稿では,人工知能の認知を解き明かすために,言語モデルとクエリ解析技術の革新的な融合を提案する。
我々のシステムは、Chessエンジンを言語モデルとシームレスに統合し、動きを予測し、戦略的説明を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:54:23 GMT)
Unleashing Artificial Cognition: Integrating Multiple AI Systems [2.4] 本稿では,人工知能の認知を解き明かすために,言語モデルとクエリ解析技術の革新的な融合を提案する。
導入されたオープンソースのAIシステムは、Chessエンジンを言語モデルとシームレスに統合し、動きを予測し、戦略的説明を提供する。
本システムは,医療診断から財務予測に至るまで,多様な応用を約束する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:54:23 GMT)
Enhancing Graph U-Nets for Mesh-Agnostic Spatio-Temporal Flow Prediction [2.4] 非定常流場予測のためのグラフU-Netの可能性を探る。
グラフU-Netを用いたメッシュ非依存時間ロバスト性予測の一貫した流れ場を改善するための新しい手法を提案する。
Graph U-Netアーキテクチャの主要な拡張は、ノードの動的モデリングにおける柔軟性の向上を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:44:07 GMT)
Comparing the Utility, Preference, and Performance of Course Material Search Functionality and Retrieval-Augmented Generation Large Language Model (RAG-LLM) AI Chatbots in Information-Seeking Tasks [2.4] 本研究の目的は,最近の大規模言語モデル(LLM)を学生支援機構として活用することであった。
実験室で実施したユーザスタディでは、参加者がWebソフトウェア開発コースのタスクに取り組みました。
以上の結果から,どちらの支援機構も有用であり,特定のタスクでは有効であるが,他のタスクではあまり役に立たないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:37:25 GMT)
Simplifying Subgraph Representation Learning for Scalable Link Prediction [2.3] 部分グラフ表現学習アプローチ (SGRL) はリンク周辺のグラフ分類にリンク予測を変換する。
SGRLは計算コストが高く、高価なサブグラフレベルの演算のために大規模グラフには拡張性がない。
スケーラブルSGRL(Scalable Simplified SGRL)と呼ばれる新しいSGRLのクラスを提案する。
S3GRLは、各リンクのサブグラフにおけるメッセージパッシングとアグリゲーション操作を単純化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:13:54 GMT)
Evaluating Contextualized Representations of (Spanish) Ambiguous Words: A New Lexical Resource and Empirical Analysis [2.3] スペイン語の単言語モデルと多言語BERTモデルを用いて、文脈におけるスペイン語のあいまいな名詞の意味表現を評価する。
様々な BERT ベースの LM の文脈的意味表現は、人間の判断に多少の違いがあるが、ヒトのベンチマークには及ばない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:06:26 GMT)
Material Fingerprinting: Identifying and Predicting Perceptual Attributes of Material Appearance [2.2] 本稿では,動的視覚刺激から得られる知覚的特徴を符号化することで,物質識別への新たなアプローチを提案する。
心理物理学的な実験を行い,347本の映像から得られた16個の重要な知覚特性を選定し,検証した。
次に、各材料について20人以上の被験者から属性評価を収集し、各材料固有の知覚特性を符号化する「材料指紋」を作成しました。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:47:53 GMT)
Ab initio nonparametric variable selection for scalable Symbolic Regression with large $p$ [2.2] シンボリック回帰(SR)は、データの非線形関係を特徴付けるシンボリック表現を発見するための強力な手法である。
既存のSR法は、多くの入力変数を持つデータセットにスケールしないが、これは現代の科学的応用で一般的である。
本稿では,Ab初期非パラメトリック変数選択とSRを組み合わせたPAN+SRを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:41:06 GMT)
GUS-Net: Social Bias Classification in Text with Generalizations, Unfairness, and Stereotypes [2.2] 本稿では,バイアス検出の革新的なアプローチであるGAS-Netを紹介する。
GUS-Netは、(G)エナラライゼーション、(U)nfairness、(S)tereotypesの3つの重要な種類のバイアスに焦点を当てている。
本手法は,事前学習したモデルの文脈エンコーディングを組み込むことにより,従来のバイアス検出手法を強化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:33:28 GMT)
GUS-Net: Social Bias Classification in Text with Generalizations, Unfairness, and Stereotypes [2.2] 本稿では,バイアス検出の革新的なアプローチであるGAS-Netを紹介する。
GUS-Netは、(G)エナラライゼーション、(U)nfairness、(S)tereotypesの3つの重要な種類のバイアスに焦点を当てている。
本手法は,事前学習したモデルの文脈エンコーディングを組み込むことにより,従来のバイアス検出手法を強化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:33:28 GMT)
Balancing Label Quantity and Quality for Scalable Elicitation [2.2] スケーラブルな監視は、人間の判断が信頼できない、あるいは高価であるドメインにおけるAIシステムのトレーニングと評価の方法を研究する。
Burns et al. (2023) による最近の研究は、インターネットスケールコーパスで事前訓練された言語モデル(LM)が正しい回答を生み出すための帰納的バイアスを示すことを示唆している。
本稿では,NLP分類タスクにおける量品質トレードオフのミクロ経済性について検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:39:58 GMT)
Multi-style conversion for semantic segmentation of lesions in fundus images by adversarial attacks [2.1] 本稿では,多様なデータベースにまたがるアノテーションスタイルの標準化の欠如に対処するため,逆変換と呼ばれる新しい手法を提案する。
統合データベース上で単一のアーキテクチャをトレーニングすることにより、モデルは入力に応じて自発的にセグメンテーションスタイルを変更する。
その結果,モデルの改良,不確実性推定,連続的一般化の道程として,データセットの組み合わせによる有意な質的,定量的な評価が得られた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:48:17 GMT)
Ornstein-Uhlenbeck Adaptation as a Mechanism for Learning in Brains and Machines [2.1] システムのパラメータと大域的強化信号のノイズを利用する新しい手法を提案する。
連続的に動作し、学習の一般的なメカニズムとしてオルシュタイン・ウレンベック適応(OUA)が提案されている。
OUAは、ニューロモルフィックコンピューティングに潜在的に応用可能な、従来の勾配に基づく手法に代わる実行可能な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:00:18 GMT)
Latent Image and Video Resolution Prediction using Convolutional Neural Networks [2.1] 本稿では,この問題を定式化し,トレーニングと評価のためのデータセットを構築し,いくつかの機械学習アルゴリズムを導入する。
実験の結果,提案手法によって約95%の精度で映像解像度を予測できることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:27:44 GMT)
From Measurement Instruments to Data: Leveraging Theory-Driven Synthetic Training Data for Classifying Social Constructs [2.1] 理論駆動型総合学習データの社会構造測定における可能性について検討する。
政治トピック分類におけるラベル付きデータの必要性を低減するために,合成データが極めて有効であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:28:45 GMT)
Large-Scale MPC: Scaling Private Iris Code Uniqueness Checks to Millions of Users [2.1] 生体認証システムは通常、機密データのサーバ側処理を必要とする。
我々は、与えられたIris Codeが与えられたデータベースに含まれるものと似ているかどうかを問合せできるソリューションを設計します。
すべてのクエリとデータセットは、セキュアなマルチパーティ計算を使用して保護されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:52:55 GMT)
Postselection technique for optical Quantum Key Distribution with improved de Finetti reductions [2.0] 我々は,光量子鍵分布プロトコルにポストセレクション手法を厳格に適用するために,複数のステップを踏襲する。
本稿では, ポストセレクション法を厳密な数学的基礎の上に配置し, ポストセレクション法における技術的欠陥を修正した。
提案手法の適用性は,デ・フィネッティ・リダクション(デ・フィネッティ・リダクション,デ・フィネッティ・リダクション,デ・フィネッティ・リダクション)を用いて拡張する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:36:50 GMT)
Exogenous Matching: Learning Good Proposals for Tractable Counterfactual Estimation [2.0] 本稿では, 抽出可能かつ効率的な対実表現推定のための重要サンプリング手法を提案する。
対物推定器の共通上限を最小化することにより、分散最小化問題を条件分布学習問題に変換する。
構造因果モデル (Structure Causal Models, SCM) の様々なタイプと設定による実験による理論的結果の検証と, 対実推定タスクにおける性能の実証を行った。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 03:08:28 GMT)
Clustering and Data Augmentation to Improve Accuracy of Sleep Assessment and Sleep Individuality Analysis [2.0] 本研究の目的は,就寝時の頻繁な動きによる睡眠不足など,エビデンスに基づく評価を提供する機械学習ベースの睡眠評価モデルを構築することである。
睡眠音イベントの抽出,VAEを用いた潜時表現の抽出,GMMによるクラスタリング,主観的睡眠評価のためのLSTMトレーニングは94.8%の精度で睡眠満足度を識別した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:02:19 GMT)
REAL: Response Embedding-based Alignment for LLMs [2.0] 本稿では,最も情報に富む応答ペアの獲得に焦点をあてた,高品質なトレーニングデータセットのサンプリング戦略を提案する。
実験結果から, 異なる応答対を選択することにより, LLMの直列化が促進されることが示唆された。
以上の結果から,LLMアライメントの効率が向上し,アノテータの作業の最大65%が省力化できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:35:30 GMT)
REAL: Response Embedding-based Alignment for LLMs [2.0] 本稿では,最も情報に富む応答ペアの獲得に焦点をあてた,高品質なトレーニングデータセットのサンプリング戦略を提案する。
実験結果から, 異なる応答対を選択することにより, LLMの直列化が促進されることが示唆された。
以上の結果から,LLMアライメントの効率が向上し,アノテータの作業の最大65%が省力化できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:35:30 GMT)
Experimental composable key distribution using discrete-modulated continuous variable quantum cryptography [1.9] 構成可能な有限サイズの鍵を生成する4状態DM CVQKDシステムの最初の実験例を示す。
この達成は、高度なセキュリティ証明を使用することで実現される。
結果は、実用的で高性能でコスト効率が高く、セキュアな量子鍵分散ネットワークの大規模展開に向けた重要な一歩である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:05:08 GMT)
Measuring kinetic inductance and superfluid stiffness of two-dimensional superconductors using high-quality transmission-line resonators [1.9] 本研究では, 高温超伝導共振器を用いた運動インダクタンス測定手法を提案する。
等価回路モデルを用いて, 複素導電率の運動インダクタンス, 超硬度, 貫入深さ, 虚部および実部の比を抽出する。
本手法は超伝導物理学,材料科学,量子センシングの分野の実践者にとって有用である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:21:17 GMT)
Combating Phone Scams with LLM-based Detection: Where Do We Stand? [1.9] 本研究では,大規模言語モデル(LLM)による不正通話の検出の可能性について検討する。
LLMをベースとした検出器は、潜在的な詐欺の発生を検知し、ユーザに対して即時保護を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:58:57 GMT)
Automatically Interpreting Millions of Features in Large Language Models [1.8] スパースオートエンコーダ(SAE)は、活性化を高次元の潜在空間に変換するために用いられる。
SAEの機能に関する自然言語の説明を生成・評価するためのオープンソースのパイプラインを構築します。
我々の大規模分析は、SAE潜伏剤がニューロンよりもはるかに解釈可能であることを確認しています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:56:01 GMT)
A theory of time based on wavefunction collapse [1.8] 時間の経過は、ゲージ不変状態に向かって崩壊する瞬間状態の連続過程である。
結果として生じる時間進化のユニタリティと指向性は、宇宙論のミニスーパースペースモデルとして実証される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:56:03 GMT)
A theory of time based on wavefunction collapse [1.8] 時間の経過は、ゲージ不変状態に向かって崩壊する瞬間状態の連続過程である。
結果として生じる時間進化のユニタリティと指向性は、宇宙論のミニスーパースペースモデルとして実証される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:56:03 GMT)
FLOPS: Forward Learning with OPtimal Sampling [1.7] 勾配に基づく計算手法は、最近、クエリとも呼ばれる前方通過のみによる学習に焦点が当てられている。
従来の前方学習はモンテカルロサンプリングによる正確な勾配推定のために各データポイントで膨大なクエリを消費する。
本稿では,評価精度と計算効率のバランスを良くするために,訓練中の各データに対して最適なクエリ数を割り当てることを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:15:39 GMT)
FLOPS: Forward Learning with OPtimal Sampling [1.7] 勾配に基づく計算手法は、最近、クエリとも呼ばれる前方通過のみによる学習に焦点が当てられている。
従来の前方学習はモンテカルロサンプリングによる正確な勾配推定のために各データポイントで膨大なクエリを消費する。
本稿では,評価精度と計算効率のバランスを良くするために,訓練中の各データに対して最適なクエリ数を割り当てることを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:15:39 GMT)
Enhancing Sentiment Analysis with Collaborative AI: Architecture, Predictions, and Deployment Strategies [1.7] 大規模言語モデル(LLM)に基づく人工知能技術は、特に感情分析においてゲームチェンジャーとなっている。
しかし、複雑なマルチモーダルデータを処理するための多様なAIモデルの統合と、それに伴う機能抽出の高コストは、大きな課題を呈している。
本研究では,様々なAIシステムにまたがるタスクを効率的に分散・解決するための協調型AIフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:14:34 GMT)
Behavior Alignment: A New Perspective of Evaluating LLM-based Conversational Recommender Systems [1.7] 大言語モデル (LLM) は対話型レコメンダシステム (CRS) において大きな可能性を証明している。
LLMは、しばしば柔軟で受動的に見え、十分な調査なしに推奨タスクを完了するために急いでいる。
この振る舞いの不一致は、推奨の精度を低下させ、ユーザの満足度を低下させる可能性がある。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:59:18 GMT)
Tri-Cam: Practical Eye Gaze Tracking via Camera Network [1.6] 本稿では,3つの安価なRGBウェブカメラを用いた,実践的なディープラーニングベースの視線追跡システムであるTri-Camを紹介する。
効率的なトレーニングのための分割ネットワーク構造と、分離された視線追跡タスクを処理するための指定されたネットワーク設計を備えている。
我々は、最先端の商用アイトラッカーであるTobiiに対するTri-Camの評価を行い、より広い自由移動領域をサポートしながら、同等の精度を実現した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:34:55 GMT)
Modeling the Human Visual System: Comparative Insights from Response-Optimized and Task-Optimized Vision Models, Language Models, and different Readout Mechanisms [1.5] 視覚入力を用いた応答最適化モデルでは,早期・中期の視覚領域において,より優れた予測精度が得られることを示す。
言語的記述では捉えられない入力の知覚的特徴に敏感な視覚野の3つの異なる領域を同定する。
本稿では,意味的内容に基づいて受容場や特徴マップを変調し,既存のSOTAよりも3~23%精度が向上する手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:11:13 GMT)
Context-Aware Full Body Anonymization using Text-to-Image Diffusion Models [1.5] 匿名化は、現実世界のデータセットにおける個人の賢明な情報を保護する上で重要な役割を担っている。
本稿では,Stable Diffusionを生成バックエンドとして利用する全身匿名化のためのワークフローを提案する。
提案手法は,画像品質,解像度,インセプションスコア(IS),Frechet Inception Distance(FID)に対して,最先端の匿名化パイプラインよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:04:01 GMT)
Context-Aware Full Body Anonymization using Text-to-Image Diffusion Models [1.5] 匿名化は、現実世界のデータセットにおける個人の賢明な情報を保護する上で重要な役割を担っている。
本稿では,Stable Diffusionを生成バックエンドとして利用する全身匿名化のためのワークフローを提案する。
提案手法は,画像品質,解像度,インセプションスコア(IS),Frechet Inception Distance(FID)に対して,最先端の匿名化パイプラインよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:04:01 GMT)
Benchmarking Transcriptomics Foundation Models for Perturbation Analysis : one PCA still rules them all [1.5] 転写学的シークエンシングの最近の進歩は、価値ある洞察を明らかにする新しい機会を提供する。
摂動解析におけるこれらの上昇モデルの有効性をしっかり評価するためのベンチマークは行われていない。
本稿では,生物学的に動機づけた新しい評価フレームワークと摂動解析タスクの階層について述べる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:27:51 GMT)
Data Driven Environmental Awareness Using Wireless Signals for Efficient Spectrum Sharing [1.5] 屋内機器と屋外機器の区別は信頼性を高め、既存の屋外機器との共存性を向上させる。
本研究では、デバイスが直面している電波環境が屋内と屋外とでかなり異なるという事実を活用して、頑健な屋内・屋外の分類手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:28:09 GMT)
Towards Hybrid Intelligence in Journalism: Findings and Lessons Learnt from a Collaborative Analysis of Greek Political Rhetoric by ChatGPT and Humans [1.5] この章は、感情分析、分極、ポピュリズム、トピック検出、名前付きエンティティ認識(NER)など、政治的言論分析の様々な側面を掘り下げている。
このプロジェクトは、デジタルヒューマニティーの世界における人間とAIのコラボレーションの革新的な例であり、将来のイニシアチブに貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:54:54 GMT)
From PINNs to PIKANs: Recent Advances in Physics-Informed Machine Learning [1.4] 物理インフォームドニューラルネットワーク(PINN)は、2017年に導入されて以来、サイエンティフィック機械学習の重要なツールとして現れてきた。
本稿では,ネットワーク設計,機能拡張,最適化技術,不確実性定量化,理論的洞察の改善に焦点を当てる。
また, バイオメディシン, 流体・固体力学, 物理, 力学系, 熱伝達, 化学工学など, 様々な分野の応用について検討した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:30:59 GMT)
Mapping Bias in Vision Language Models: Signposts, Pitfalls, and the Road Ahead [1.4] 5つのモデルと6つのデータセットの人口統計バイアスを分析します。
UTKFaceやCelebAといったポートレートデータセットは、バイアス検出に最適なツールです。
より厳格な評価のために、より難しいバージョンのVisoGenderを紹介します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:03:27 GMT)
Performance of Gaussian Mixture Model Classifiers on Embedded Feature Spaces [1.3] CLIPとImageBindによるデータ埋め込みは、マルチメディアおよび/またはマルチモーダルデータの分析に強力な機能を提供する。
本稿では,Gaussian Mixture Model (GMM) ベースの層を標準のSoftmaxレイヤの代替として利用して,それらの性能を分類するために評価する。
その結果,GMMの1つのガウス成分が各クラスを捕捉するのに十分である場合が多く,これらの組込み空間の訓練に使用される対照的な損失が原因である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:43:43 GMT)
LLM-Rank: A Graph Theoretical Approach to Pruning Large Language Models [1.3] 本稿では,グラフ理論からの集中度測定を利用した新しいプルーニング手法を提案し,これらのモデルの計算要求とメモリフットプリントの両方を削減した。
さらに,デコーダのみのトランスモデルを拡張してLLMRankと呼ぶ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:55:47 GMT)
Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition [1.3] シーンテキスト認識(STR)において、教師なしドメイン適応(UDA)がますます普及している。
本稿では,StrDA(Stratified Domain Adaptation)アプローチを導入し,学習プロセスにおける領域ギャップの段階的エスカレーションについて検討する。
本稿では,データサンプルの分布外および領域判別レベルを推定するために,領域判別器を用いる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:08:08 GMT)
Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition [1.3] シーンテキスト認識(STR)において、教師なしドメイン適応(UDA)がますます普及している。
本稿では,StrDA(Stratified Domain Adaptation)アプローチを導入し,学習プロセスにおける領域ギャップの段階的エスカレーションについて検討する。
本稿では,データサンプルの分布外および領域判別レベルを推定するために,領域判別器を用いる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:08:08 GMT)
Measurement-free, scalable and fault-tolerant universal quantum computing [1.3] 本稿では,アルゴリズム実行時の測定を必要とせず,フォールトトレラントな普遍量子コンピューティングのための完全なツールボックスを提案する。
我々は、2Dと3Dのカラーコード間で符号化情報を転送するための新しいフォールトトレラントで計測不要なプロトコルを開発した。
我々の測定不要なアプローチは、最先端の量子プロセッサ上での普遍量子コンピューティングのための実用的でスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:04:14 GMT)
Testing Causal Explanations: A Case Study for Understanding the Effect of Interventions on Chronic Kidney Disease [1.2] 我々は大規模な電子健康記録データセットを用いた方法論を開発した。
回帰不連続性の原理は、専門家主導の介入をテストするためにランダム化されたデータサブセットを導出するために用いられた。
この方法論は、実際のEHRデータを用いて、人口レベルの洞察を提供し、医療提供の改善を知らせる方法を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:40:48 GMT)
Transformer Guided Coevolution: Improved Team Formation in Multiagent Adversarial Games [1.2] そこで本稿では,Masked Language Modelトレーニングを用いたトランスフォーマーに基づくディープニューラルネットワークを用いて,トレーニング対象者の最適なチームを選択するアルゴリズムを提案する。
我々は,マルチエージェント対逆ゲーム「Marine Capture-The-Flag」で本アルゴリズムを検証した結果,BERTeam が非自明なチーム構成を学習し,見知らぬ相手に対して良好に動作していることが判明した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:06:41 GMT)
CL3: A Collaborative Learning Framework for the Medical Data Ensuring Data Privacy in the Hyperconnected Environment [1.2] ハイパーコネクテッドな環境では、医療機関は機密性の高い患者情報を共有・送信する際にデータプライバシに関心を持つ。
トランスファー、フェデレーション、インクリメンタルラーニングを含む協調学習フレームワークは、効率的でセキュアでスケーラブルなモデルを生成することができる。
本研究の目的は、CL3と呼ばれる協調学習フレームワークを用いて、胸部X線画像を用いたCOVID-19の検出に対処することである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:33:40 GMT)
CL3: A Collaborative Learning Framework for the Medical Data Ensuring Data Privacy in the Hyperconnected Environment [1.2] トランスファー、フェデレーション、インクリメンタルラーニングを含む協調学習フレームワークは、効率的でセキュアでスケーラブルなモデルを生成することができる。
本研究の目的は、CL3と呼ばれる協調学習フレームワークを用いて、胸部X線画像を用いたCOVID-19の検出に対処することである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:33:40 GMT)
The Mystery of the Pathological Path-star Task for Language Models [1.2] 最近導入されたパススタータスクは、言語モデルの能力に対する制限を実証するために設計された最小限のタスクである。
代替設定で教師の強制でタスクが学習可能であることを実証し、一部は表現によるものであることを示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:18:30 GMT)
Retrieval-Enhanced Named Entity Recognition [1.2] RENERは、In-Context Learningと情報検索技術に基づく自己回帰言語モデルを用いたエンティティ認識手法である。
実験の結果,CrossNERコレクションでは,提案手法を用いて最先端の性能を実現することができた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:12:48 GMT)
Self Supervised Deep Learning for Robot Grasping [1.1] 畳み込みニューラルネットワーク(CNN)を学習する自己教師型ロボット構成を提案する。
ロボットはトレーニングプロセス中にデータをラベル付けして収集する。
ロボットは数百時間にわたって大規模なデータセットで訓練され、訓練されたニューラルネットワークはより大きな把握ロボットにマッピングされる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:26:55 GMT)
Dynamic Topic Language Model on Heterogeneous Children's Mental Health Clinical Notes [1.1] 本研究では、新型コロナウイルス感染拡大に伴う小児のメンタルヘルスの進展について検討する。
臨床医は、性同一性に関連する子供のメンタルヘルスの格差を認識するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:38:00 GMT)
Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring [1.0] 本研究では,UAVによる600フレーム画像を含むSTVD(S-Temporal Vehicle Detection dataset)を提案する。
YOLOオブジェクト検出アルゴリズムが拡張され、時間的ダイナミクスが組み込まれ、単一のフレームモデルよりも性能が向上する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:49:37 GMT)
The Role of Community Building and Education as Key Pillar of Institutionalizing Responsible Quantum [1.0] 量子コンピューティングは、社会に対する肯定的かつ否定的な影響がまだ完全には分かっていない新興技術である。
政府、個人、機関、企業は、その影響を期待し、その結果に備え、最も良いことを可能にし、最も害を及ぼすことを防げるように、その発展を推し進めなければならない。
本稿は、量子コンピューティングの提案と文献の責任についてレビューし、これらを実装する上での課題を強調し、この技術の責任を負う開発を支援するために、IBMが開発した多様なユーザと利害関係者のコミュニティを構築するための戦略を提示する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:34:40 GMT)
Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [1.0] 本研究は, 商業果樹園における緑果検出のためのYOLOv8, YOLOv9, YOLOv10, YOLO11の全構成(Total 22)を対象に, You Only Look Once (YOLO) オブジェクト検出アルゴリズムを広範囲に評価した。
この研究は、iPhoneとマシンビジョンセンサーを使って、Scifresh、Scilate、Honeycrisp、Cosmic Crispの4種類のリンゴをフィールドで数えたことも検証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:11:43 GMT)
Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [1.0] 本研究は, 商業果樹園における緑果検出のためのYOLOv8, YOLOv9, YOLOv10, YOLO11の全構成(Total 22)を対象に, You Only Look Once (YOLO) オブジェクト検出アルゴリズムを広範囲に評価した。
この研究は、iPhoneとマシンビジョンセンサーを使って、Scifresh、Scilate、Honeycrisp、Cosmic Crispの4種類のリンゴをフィールドで数えたことも検証した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:11:43 GMT)
Variational Quantum Framework for Nonlinear PDE Constrained Optimization Using Carleman Linearization [0.9] 非線形偏微分方程式(PDE)制約最適化問題に対する新しい変分量子フレームワークを提案する。
我々はカールマン線形化(CL)を用いて、通常の微分方程式の系をODEの無限だが線型な系に変換する。
計算誤差と複雑性の詳細な解析を行い、適切な仮定の下では、提案するフレームワークが古典的手法よりも潜在的に有利であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:51:41 GMT)
Deterministic Creation of Identical Monochromatic Quantum Emitters in Hexagonal Boron Nitride [0.9] 著者らは、非定常hBNフレーク上にマスク状炭素イオン注入を用いた同一室温量子エミッタの決定論的生成を報告した。
本法により作製した量子エミッタは590.7+-2.7nmの放射中心波長分布で熱的に制限された単色性を示した。
本手法は,hBN系量子エミッタのキャラクタリゼーションおよび製造研究のための信頼性の高いプラットフォームを提供し,hBNにおける単一光子放出挙動の起源を明らかにする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:52:01 GMT)
Feed-Forward Probabilistic Error Cancellation with Noisy Recovery Gates [0.8] 我々は、FFPEC(Feed-Forward PEC)と呼ばれるゲート挿入によるノイズを考慮したPECの改良版を提案する。
FFPECは、リカバリゲートによって誘導されるノイズをキャンセルすることで、期待値の偏りのない推定器を提供する。
FFPECは従来のPEC法と比較して,解析的評価により精度の高い予測値が得られることを示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:03:39 GMT)
A Cost-Efficient FPGA Implementation of Tiny Transformer Model using Neural ODE [0.8] Transformerは画像認識タスクに採用され、トレーニングコストと計算複雑性に悩まされているが、CNNやRNNよりも優れていた。
本稿では,ResNetの代わりにNeural ODEをバックボーンとして使用する軽量ハイブリッドモデルを提案する。
提案モデルは,エッジコンピューティングのための最小サイズのFPGAデバイス上に展開される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:44:51 GMT)
Privacy-Preserving Decentralized AI with Confidential Computing [0.8] 本稿では、Atoma Network内のCC(Confidential Computing)を用いた分散人工知能(AI)におけるプライバシ保護について述べる。
CCはハードウェアベースのTrusted Execution Environments (TEE)を活用して、機密データ処理の分離を提供する。
私たちはどのようにしてTEEをAtomaの分散フレームワークに統合できるかを検討します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:50:48 GMT)
Can Large Language Models Generate High-quality Patent Claims? [0.8] 大規模言語モデル(LLM)は、様々なテキスト生成タスクで例外的なパフォーマンスを示している。
本稿では,特許クレーム生成における現在のLCMの性能を評価するためのデータセットを構築した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:53:12 GMT)
Modified Landauer's principle: How much can the Maxwell's demon gain by using general system-environment quantum state? [0.7] 修正されたランダウアーの原理は,システムと環境が当初相関していたとしても,まだ保たれていることを示す。
これはマックスウェル・デーモンズ・アーセナルで最も一般的な量子力学的に許容される操作である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:08:17 GMT)
Pragmatic Competence Evaluation of Large Language Models for the Korean Language [0.7] 本研究では,Large Language Models (LLMs) が,特に韓国語における実践的視点から,文脈依存表現をいかによく理解しているかを評価する。
自動評価にはMultiple-Choice Questions(MCQ)と、専門家によるOEQ(Open-Ended Questions)の両方を用いる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:14:21 GMT)
MACK: Mismodeling Addressed with Contrastive Knowledge [0.6] 機械学習モデルはより複雑になるにつれて、このシミュレーションと実験によって収集された実際のデータの違いにますます敏感になる。
本稿では、この負の効果を大幅に軽減できるコントラスト学習に基づく一般的な方法論を提案する。
大型ハドロン衝突型加速器におけるジェットタグの課題を用いたこの手法の有効性を実証するが、高エネルギー物理学の分野内外における幅広いタスクに適用できる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:18:41 GMT)
Your Interest, Your Summaries: Query-Focused Long Video Summarization [0.6] 本稿では,ユーザクエリとビデオ要約を密接に関連付けることを目的とした,クエリ中心のビデオ要約に対するアプローチを提案する。
本稿では,本課題のために設計された新しいアプローチであるFCSNA-QFVS(FCSNA-QFVS)を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:37:58 GMT)
Transformer-Based Approaches for Sensor-Based Human Activity Recognition: Opportunities and Challenges [0.6] トランスフォーマーは自然言語処理とコンピュータビジョンに優れており、センサーに基づくヒューマンアクティビティ認識(HAR)への道を開いた。
従来の研究では、トランスフォーマーは豊富なデータを利用したり、計算集約的な最適化アルゴリズムを使用したりした場合に、排他的よりも優れていることが示されていた。
しかし、これらのシナリオは、この分野のデータ不足と、リソース制約されたデバイスでのトレーニングと推論を頻繁に行う必要があるため、センサーベースのHARでは実現できない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:39:55 GMT)
Reproducibility study of "LICO: Explainable Models with Language-Image Consistency" [0.6] 本稿では, Lei et al. (2023) が提案手法であるlicOについて, ポストホック解釈可能性の向上のために行った主張について検討する。
licOは,解釈可能性の定量的・定性的な尺度の分類性能の向上や改善に一貫して寄与しているとは見出されていない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:41:34 GMT)
On uniqueness of the set of k-means [0.6] 非特異性の設定に適応した経験的k平均の整合性を評価する。
k-平均集合の特異性に対するブートストラップ試験を導出する。
結果は、異なる種類の非特異性の例で示される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:40:56 GMT)
Data-Augmented Predictive Deep Neural Network: Enhancing the extrapolation capabilities of non-intrusive surrogate models [0.6] 本稿では、カーネル動的モード分解(KDMD)を用いて、畳み込みオートエンコーダ(CAE)のエンコーダ部が生成する潜伏空間のダイナミクスを進化させる新しいディープラーニングフレームワークを提案する。
KDMD-decoder-extrapolated dataを元のデータセットに追加した後、この拡張データを用いてフィードフォワードディープニューラルネットワークと共にCAEをトレーニングする。
トレーニングされたネットワークは、トレーニング外のパラメータサンプルでトレーニング時間間隔外の将来の状態を予測できる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:26:14 GMT)
DamFormer: Generalizing Morphologies in Dam Break Simulations Using Transformer Model [0.6] 深層学習技術を用いて, 各種構造形状に影響を及ぼす波面の動的変化について検討する。
複雑なインタラクションを学習し、シミュレートするために設計された、新しいトランスフォーマーベースのモデルであるDamFormerを紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:18:13 GMT)
CFTS-GAN: Continual Few-Shot Teacher Student for Generative Adversarial Networks [0.5] GANでは、過度なフィットと破滅的な忘れ込みという、2つのよく知られた課題に直面しています。
本稿では,2つの課題を同時に考えるCFTS-GANのための連続的Few-shot Teacher-Student手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:49:08 GMT)
Trans-Bifurcation Prediction of Dynamics in terms of Extreme Learning Machines with Control Inputs [0.5] 対象とする1-パラメータ系の分岐の全体構造は,数パラメータ値のみを用いて過渡的ダイナミクスのトレーニングによってほぼ再現可能であることを示す。
我々は,この卓越した学習能力を説明するためのメカニズムを提案し,Kimらによって得られた結果と類似した結果との関係について論じる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:34:23 GMT)
Railway LiDAR semantic segmentation based on intelligent semi-automated data annotation [0.5] 本稿では,スキャンと画像の併用による2DPassネットワークアーキテクチャに基づくポイントワイズ3次元セマンティックセマンティックセマンティックセマンティクスのアプローチを提案する。
また,ドイツの鉄道線路に記録された必要なデータセットを効率よく正確にラベル付けするために,半自動のインテリジェントデータアノテーション手法を提案する。
我々は、鉄道環境からのカメラやLiDARデータを含むレールデータを注釈し、画像セグメンテーションネットワークを用いて生のLiDAR点雲を転送し、アクティブラーニングを効率的に活用する最先端の3DLiDARセグメンテーションネットワークを訓練する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:36:19 GMT)
Generative Model for Constructing Reaction Path from Initial to Final States [0.5] 本稿では,ニューラルネットワークを用いた反応経路の初期推定手法を提案する。
提案手法は、初期状態の座標を入力し、その後、その構造を進行的に変化させることによって開始される。
この幾何学的手法の応用は、有機反応によって示される複雑な反応経路にまで及ぶ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:15:27 GMT)
Gradual Domain Adaptation via Manifold-Constrained Distributionally Robust Optimization [0.5] 本稿では、多様体制約データ分布のクラスにおける段階的領域適応の課題に対処する。
本稿では,適応的なワッサースタイン半径を持つ分布ロバスト最適化(DRO)を基礎とした手法を提案する。
我々のバウンダリは、新たに導入されたそれとの互換性尺度に依存しており、シーケンスに沿ったエラー伝搬のダイナミクスを完全に特徴付けています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:07:25 GMT)
Training Compute-Optimal Vision Transformers for Brain Encoding [0.5] 脳エンコーディングのための視覚変換器の最適トレーニングは、モデルサイズ、データサイズ、計算資源の3つの要素に依存する。
本研究では、データスケーリング、時間モデルスケーリング、高性能コンピューティングが脳エンコーディング結果に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:54:50 GMT)
Context-aware adaptive personalised recommendation: a meta-hybrid [0.4] 機械学習を用いて最適なアルゴリズムを予測するメタハイブリッドレコメンデータを提案する。
提案モデルに基づいて、どのレコメンデータがユーザに最も正確なレコメンデーションを提供するかを予測できる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:24:40 GMT)
Virtual Sensing for Real-Time Degradation Monitoring of Nuclear Systems: Leveraging DeepONet for Enhanced Sensing Coverage for Digital Twin-Enabling Technology [0.4] 本稿では,AP-1000加圧水炉(PWR)の高温脚の熱水理パラメータを予測するために,デジタルツイン(DT)フレームワークにおけるDeepONet(DeepONet)の利用について検討する。
以上の結果から,DeepONetは平均二乗誤差と相対L2誤差で精度の高い予測を行い,従来の有限要素シミュレーション(FE)の160,000倍の精度で予測を行うことができた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:56:04 GMT)
Probabilistic U-Net with Kendall Shape Spaces for Geometry-Aware Segmentations of Images [0.3] セグメント化の幾何学を組み込んだ確率的画像分割モデルを提案する。
我々のモデルはまた、Kendall形状変化自動エンコーダ(citevadgama2023kendall)を採用して、Kendall形状空間をエンコードする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:32:43 GMT)
Learning Metadata-Agnostic Representations for Text-to-SQL In-Context Example Selection [0.3] In-context Learning(ICL)は、大きな言語モデル(LLM)がプロンプトに追加されたタスクデモの恩恵を受ける強力なパラダイムである。
本稿では,自然言語質問の表現と,共有埋め込み空間におけるクエリの表現を整列する手法を提案する。
我々の手法はMARLOと呼ばれ、クエリ構造を用いてデータベースメタデータを過剰にインデクシングすることなくクエリインテントをモデル化する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:45:55 GMT)
Undecidability of the spectral gap in rotationally symmetric Hamiltonians [0.3] 格子量子スピン系におけるスペクトルギャップの存在を決定する問題は、強い対称性の制約を持つハミルトニアンには決定できない。
この問題に対して正の答えを与える: 4-体(プラケット)相互作用を持つモデルの場合、回転を満足するが反射はしない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:23:58 GMT)
Entanglement flow in the Kane-Fisher quantum impurity problem [0.3] ルッティンガー液体中の局所不純物の問題は、異方性近藤問題(厳密には従兄弟である)と同様に、多くの物理系を記述している。
2つの部位間の結合強度を改良したXXZスピン鎖で提供されるKe Fisherクラスの実現を利用して、システムの残りの部分と長さ$ell$の領域の絡み合いエントロピーの差を探索する。
驚くべきことに、この差$delta Sequiv Se-So$は熱力学の極限で$O(1)$であり、上昇する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:58:50 GMT)
Unsupervised Skull Segmentation via Contrastive MR-to-CT Modality Translation [0.3] CTスキャンによる頭蓋骨のセグメンテーションは、すでに解決されている問題であると見なすことができる。
MRでは、骨ではなく軟部組織の存在により、このタスクは著しく複雑になる。
MR画像上で直接セグメント化を行うのではなく,MR-to-CT変換による合成CTデータ生成を行う。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:51:08 GMT)
From Barriers to Tactics: A Behavioral Science-Informed Agentic Workflow for Personalized Nutrition Coaching [0.3] 本稿では,パーソナライズされた栄養指導を実現するために,LSMを利用した新しいエージェントワークフローを提案する。
特殊なLDMエージェントは、意図的に患者の食事障害の根本原因を調査し、特定する。
個別のLLMエージェントは、患者コンテキストでこれらの特定の障壁を克服するために設計された調整された戦術を提供する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:35:07 GMT)
Accelerating Object Detection with YOLOv4 for Real-Time Applications [0.3] 畳み込みニューラルネットワーク(CNN)は、ほとんどの問題に対して画像コンテンツとコンピュータビジョンアプローチを認識する強力なツールとして登場した。
本稿では、畳み込みニューラルネットワーク(CNN)のようなディープラーニングとオブジェクト検出フレームワークの簡単な紹介を紹介する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:44:57 GMT)
Inadequate contrast ratio of road markings as an indicator for ADAS failure [0.2] ADASによる不適切な車線認識は,道路標識のコントラスト比が非常に低かった。
特定の最小コントラスト比値が見つからなかったが、これはADASアルゴリズムの複雑さによるものであった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:23:09 GMT)
Synthetic Augmentation for Anatomical Landmark Localization using DDPMs [0.2] 拡散型生成モデルは近年,高品質な合成画像を生成する能力に注目が集まっている。
ランドマークマッチングのためのマルコフランダムフィールド(MRF)モデルと統計的形状モデル(SSM)を用いて,生成画像の品質を評価する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:03:34 GMT)
Continuous Wavelet Transformation and VGG16 Deep Neural Network for Stress Classification in PPG Signals [0.2] 本研究は,光胸腺X線信号によるストレス分類における画期的なアプローチを提案する。
連続ウェーブレット変換(CWT)を実証されたVGG16に組み込むことで,ストレス評価精度と信頼性を向上させる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:29:52 GMT)
Machine-learning prediction of tipping with applications to the Atlantic Meridional Overturning Circulation [0.2] 非線形力学系における将来的なチップの予測のための汎用的なデータ駆動型機械学習手法を開発した。
応用として、Atlantic Meridional Overturning Circulation (AMOC)の潜在的な崩壊を予測する問題に対処する。
我々の予測では、2040年から2065年の間、現在の文献の結果と一致して、潜在的に崩壊する窓を設置しています。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:22:48 GMT)
Quasi-quantum states and the quasi-quantum PCP theorem [0.2] 準量子状態上の$k$-局所ハミルトニアンを解くことは、古典的な$k$-局所CSP上の代入の分布を最適化することと同値であることを示す。
我々の主な結果は、準量子状態上の$k$-局所ハミルトニアンに対するPCP定理である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:43:18 GMT)
TinyClick: Single-Turn Agent for Empowering GUI Automation [0.2] 視覚言語モデル Florence-2-Base を用いたグラフィカルユーザインタフェース(GUI)インタラクションタスクのためのシングルターンエージェントを提案する。
エージェントの主なタスクは、ユーザのコマンドに対応するUI要素の画面座標を特定することである。
これはScreenspotとOmniActで強力なパフォーマンスを示し、コンパクトサイズは0.27Bパラメータと最小レイテンシを維持している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:03:19 GMT)
Exploiting recursive structures for the design of novel quantum primitives [0.1] 本稿では,新しい量子プリミティブの生成に焦点を当てる。
これらの構造をどのように利用して新しい、潜在的に有利な量子アルゴリズムを設計できるかを示す。
量子アルゴリズム、数値解析、信号処理に対する潜在的な影響についてコメントする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:45:50 GMT)
DPFedBank: Crafting a Privacy-Preserving Federated Learning Framework for Financial Institutions with Policy Pillars [0.1] 本稿では、金融機関が協調して機械学習モデルを開発できるようにする革新的なフレームワークDPFedBankについて述べる。
DPFedBankは、金融データに関連するユニークなプライバシとセキュリティ上の課題に対処するために設計されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:51:56 GMT)
Commuting Local Hamiltonians Beyond 2D [0.1] 通勤するハミルトンの複雑さを解析するための新しい手法を提案する。
通勤する局所ハミルトニアンのより大きな族がNPであることを示す。
局所ハミルトニアンを通勤する3Dの族がNPに含まれるのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:34:53 GMT)
Commuting Local Hamiltonians Beyond 2D [0.1] 通勤するハミルトンの複雑さを解析するための新しい手法を提案する。
通勤する局所ハミルトニアンのより大きな族がNPであることを示す。
局所ハミルトニアンを通勤する3Dの族がNPに含まれるのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:34:53 GMT)
Commuting Local Hamiltonians Beyond 2D [0.1] 通勤するハミルトンの複雑さを解析するための新しい手法を提案する。
通勤する局所ハミルトニアンのより大きな族がNPであることを示す。
局所ハミルトニアンを通勤する3Dの族がNPに含まれるのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:34:53 GMT)
Toward a Real-Time Digital Twin Framework for Infection Mitigation During Air Travel [0.1] シミュレーション結果を新しい地理的、文化的、時間的文脈に一般化することは困難である。
ビデオフィードのようなリアルタイムデータに依存するデジタルツインは、この制限を解決することができる。
データ同化による歩行者動態は,十分な精度で歩行者軌跡を予測できることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:34:03 GMT)
Large Language Models as Narrative-Driven Recommenders [0.1] 大規模言語モデル(LLM)は、一般的な自然言語クエリの処理に優れていることが示されている。
映画レコメンデーション設定において,38個のオープンソース LLM とクローズドソース LLM のパフォーマンスを比較した。
以上の結果から,LLMがコンテキストに関連のある映画レコメンデーションを生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:39:24 GMT)
Automatic Mapping of Anatomical Landmarks from Free-Text Using Large Language Models: Insights from Llama-2 [0.0] 解剖学的ランドマークは、ナビゲーションと異常検出のための医療画像に不可欠である。
現代の大言語モデル(LLM)は、自由テキストラジオグラフィーレポートでこれらのランドマークを画像データの対応する位置にマッピングすることを約束する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:52:30 GMT)
Weak local measurements reproduce the measurement time of strong measurements on entangled systems [0.0] 純粋に弱い測定によって重要な結果を再現できることが示される。
この結果は、自然に弱い測定が全ての物理測度の基礎にあるという仮説の自己整合性を裏付けるものである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:30:45 GMT)
Weak local measurements reproduce the measurement time of strong measurements on entangled systems [0.0] 純粋に弱い測定によって重要な結果を再現できることが示される。
この結果は、自然に弱い測定が全ての物理測度の基礎にあるという仮説の自己整合性を裏付けるものである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:30:45 GMT)
Verification of Quantitative Temporal Properties in RealTime-DEVS [0.0] リアルタイムDEVSは、定量的な時間的要求を伴うシステムをモデル化することができる。
RT-DEVSモデルに現れる反復的量的時間特性のクラスを検証するために、モデルチェッカーUppaalを使用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:23:12 GMT)
Variational Scarring in Graphene Quantum Dots [0.0] 単層グラフェン上に作製した楕円量子ドットにおいて, 変分スカーリングが発生することを示す。
また,これらの傷跡の指紋は走査型トンネル顕微鏡で検出できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:26:58 GMT)
Unraveling the Nuances of AI Accountability: A Synthesis of Dimensions Across Disciplines [0.0] 我々は、複数の分野にわたる現在の研究をレビューし、AIの文脈における説明責任の重要な側面を特定する。
13の次元と追加の説明責任ファシリテータを持つ6つのテーマを明らかにする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:22:11 GMT)
Unraveling the Nuances of AI Accountability: A Synthesis of Dimensions Across Disciplines [0.0] 我々は、複数の分野にわたる現在の研究をレビューし、AIの文脈における説明責任の重要な側面を特定する。
13の次元と追加の説明責任ファシリテータを持つ6つのテーマを明らかにする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:22:11 GMT)
Tri-Cam: Practical Eye Gaze Tracking via Camera Network [0.0] 本稿では,3つの安価なRGBウェブカメラを用いた,実践的なディープラーニングベースの視線追跡システムであるTri-Camを紹介する。
効率的なトレーニングのための分割ネットワーク構造と、分離された視線追跡タスクを処理するための指定されたネットワーク設計を備えている。
我々は、最先端の商用アイトラッカーであるTobiiに対するTri-Camの評価を行い、より広い自由移動領域をサポートしながら、同等の精度を実現した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:34:55 GMT)
Tri-Cam: Practical Eye Gaze Tracking via Camera Network [0.0] 本稿では,3つの安価なRGBウェブカメラを用いた,実践的なディープラーニングベースの視線追跡システムであるTri-Camを紹介する。
効率的なトレーニングのための分割ネットワーク構造と、分離された視線追跡タスクを処理するための指定されたネットワーク設計を備えている。
我々は、最先端の商用アイトラッカーであるTobiiに対するTri-Camの評価を行い、より広い自由移動領域をサポートしながら、同等の精度を実現した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:34:55 GMT)
Toward a Unified Graph-Based Representation of Medical Data for Precision Oncology Medicine [0.0] 本稿では,医学知識を持つ患者の遺伝情報と医療記録を一意の知識グラフで組み合わせた,医用データの統一的な表現を提案する。
このアプローチは、各データセットを別々に見ることによって、利用できない意味のある情報や説明を推測することを可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:43:48 GMT)
Topological quantum slinky motion in resonant extended Bose-Hubbard model [0.0] 共振条件下での1次元Bose-Hubbardモデルについて検討する。
一連の量子スリンキー振動は、ボソン数$nin lbrack 2,infty )$の2サイト系で起こる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:20:09 GMT)
Time-dependent Aharonov-Bohm type topological effects on dipoles [0.0] AB型実験装置における時間依存性トポロジカル効果について検討した。
まず, 磁場源ソレノイドの周囲の閉軌道上での磁気双極子移動の影響を解析した。
最後に、統合的な視点から位相間の同一性と双対性を考慮することで、位相効果の特性について考察する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:01:47 GMT)
Third moments of qudit Clifford orbits and 3-designs based on magic orbits [0.0] 局所$d$が奇素次元であるとき、qudit Clifford群は2-次元であるが3-次元ではない。
この区別とクリフォード軌道への拡張は、量子情報処理における多くの応用に深い意味を持つ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:11:37 GMT)
The observer effect in quantum: the case of classification [0.0] 感覚情報は観測状態と複雑に絡み合っていることを示す。
この枠組みは、観測者効果の量子確率に基づく理解の基礎となる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:41:45 GMT)
The Magic in Qudit Shadow Estimation based on the Clifford Group [0.0] 量子ビット上のqudit影推定のオーバーヘッドは、qudit番号$n$とは独立な$mathcalO(d)$のみであることを示す。
単一のマジックゲートは、quditシャドウ推定における$mathcalO(d)$オーバーヘッドを排除し、キュービット設定からギャップを埋めることができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:08:05 GMT)
The 2-divisibility of divisors on K3 surfaces in characteristic 2 [0.0] 標数 2 の K3 曲面は、ピカール群において和が 2 で割り切れるような、n$ の滑らかな有理曲線の集合を許容できることを示す。
すべての値は超特異な K3 面上で発生し、例外はアルティン不変量 1 と 10 のみである。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:37:04 GMT)
Super-activating quantum memory by entanglement-breaking channels [0.0] 絡み合いは様々な量子情報処理に欠かせない資源である。
実際には、絡み合いはシステムの進化の間に非常に脆弱である。
放送シナリオに2つの絡み合うチャンネルを組み込むことで、絡みを維持できることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:45:25 GMT)
Solving eigenvalue problems obtained by the finite element method on a quantum annealer using only a few qubits [0.0] 量子コンピューティングにおける実用的な量子優位性を達成する上での大きな障害の1つは、量子ハードウェアで現在利用可能な量子ビットの数が比較的少ないことである。
有限要素法による固有値問題の文脈でこの問題を回避する方法について述べる。
例えば、AQAEは、電磁磁気学、音響学、地震学など、幅広い文脈で関係する固有値問題に適用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:39:03 GMT)
Socioeconomic factors of national representation in the global film festival circuit: skewed toward the large and wealthy, but small countries can beat the odds [0.0] 本研究では,グローバル・フィルム・フェスティバル・サーキットにおいて,各国の経済・人口・地理的要因がどのように表現されるかを分析する。
カンヌ映画市場からのフェスティバルプログラミング情報を含む、いくつかのオープンアクセスデータベースの組み合わせに依存している。
このデータセットは、世界中の約600のフェスティバルから10年間に2万本以上のユニークな映画で構成されており、合計で3万本以上の映画祭のエントリーがある。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:38:27 GMT)
Shavette: Low Power Neural Network Acceleration via Algorithm-level Error Detection and Undervolting [0.0] 本稿では,Deep Neural Network(DNN)アクセラレータの,単なるソフトウェア修正による低電圧動作を実現するための簡単なアプローチを紹介する。
18%から25%の省エネ効果を示したが,精度の低下やスループットの低下は認められなかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:29:15 GMT)
Semi-Hadronic Charge-Parity Violation Interaction Constants in CsAg, FrLi and FrAg molecules [0.0] 我々は、次世代の電荷-パリティ違反源探索のための候補分子における核子-電子テンソル-擬似テンソル(Ne-TPT)相互作用について検討した。
考慮された分子は、すべてレーザー冷却された原子から組み立てることができるが、フランシウム-銀分子(FrAg)はこの集合においてシッフモーメント相互作用に最も敏感であることが示されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:29:32 GMT)
Selection of Filters for Photonic Crystal Spectrometer Using Domain-Aware Evolutionary Algorithms [0.0] 本研究は, 微量ガス測定装置の最適フィルタ選択の課題に対処するものである。
最適化問題と比較して問題を定式化し,ノイズを伴うガス検索を模倣するシミュレータを開発した。
フィルタ選択の空間のメトリクスを利用する新しい距離駆動拡張を用いて、見いだされたトップパフォーマンスアルゴリズムを改善することを目指している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:20:22 GMT)
Segmentation of Pediatric Brain Tumors using a Radiologically informed, Deep Learning Cascade [0.0] 小児におけるDiffuse Intrinsic Pontine Glioma (DIPG) およびDiffuse Midline Glioma (DMG) 脳腫瘍のモニタリングが治療効果の評価の鍵となる。
RAPNOガイドラインは、MRIボリュームチャレンジを用いてこれらの腫瘍を測定することを推奨している。
最近の研究は、小児脳腫瘍セグメンテーションのための既存のnnU-Netアプローチの新たな適応を提示する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:46:13 GMT)
Research on Travel Route Planing Problems Based on Greedy Algorithm [0.0] 欲求アルゴリズムに基づく経路計画問題は、与えられた開始点と終了点の間の最適経路またはほぼ最適経路を見つける方法である。
本稿ではまず,都市評価指標の次元性を低減し,主要成分を抽出するPCA法と,データの次元性を低減するKMOアルゴリズムとTOPSISアルゴリズムを用いる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:17:01 GMT)
Reply to Comment on "Neutrino oscillations originate from virtual excitation of Z bosons" and "Neutrinos produced from $β$ decays of neutrons cannot be in coherent superpositions of different mass eigenstates" [0.0] この反応では、ニュートリノの質量と他の自由度の間の量子的絡み合いが質量固有状態の間の量子的コヒーレンスを破壊することを指摘した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:06:15 GMT)
Reference-Based Post-OCR Processing with LLM for Diacritic Languages [0.0] コンテンツ中心の電子書籍を参照ベースとして活用し、不完全なOCR生成テキストを訂正する手法を提案する。
この技術は、ダイアクリティカル言語のための高精度な擬似ページ・ツー・ページラベルを生成する。
パイプラインは、古いドキュメントから様々な種類のノイズを排除し、欠落した文字、単語、乱れたシーケンスといった問題に対処する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:05:02 GMT)
Rapid and Automated Alloy Design with Graph Neural Network-Powered LLM-Driven Multi-Agent Systems [0.0] マルチエージェントAIモデルは、新しい金属合金の発見を自動化するために使用される。
MLをベースとした原子間ポテンシャルをモデルとした立方晶(bcc)合金のNbMoTa族に着目した。
LLMをベースとしたエージェントの動的協調により、GNNの予測力を相乗化することにより、システムは巨大な合金設計空間を自律的にナビゲートする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:06:26 GMT)
RECOVAR: Representation Covariances on Deep Latent Spaces for Seismic Event Detection [0.0] 生波形から地震を検出することを学習する地震検出の教師なし手法を開発した。
パフォーマンスは、いくつかの最先端の教師付きメソッドと同等であり、場合によっては同等である。
このアプローチは、他のドメインからの時系列データセットに有用である可能性がある。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:19:26 GMT)
Quasi-Perfect State Transfer in Spin Chains via Parametrization of On-Site Energies [0.0] 我々は、正確な量子情報伝達を容易にするために、オンサイトエネルギーを変更する可能性について検討する。
以上の結果から,XYハミルトニアンの対角要素を標的に調整し,遺伝的アルゴリズムを活用することにより,準完全状態移動が達成できることが示唆された。
この研究は、実用的な量子情報システムにおけるスピン鎖の多様な応用を解き放つための大きな進歩を示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:48:50 GMT)
Quantum dynamics of atoms in number-theory-inspired potentials [0.0] いくつかの数理論にインスパイアされた原子ポテンシャルのエネルギー準位間の原子の遷移を研究する。
対数自然周波数の摂動によってパラメトリックに駆動される対数自然スペクトルを持つ一体トラップがそのような量子システムを提供することがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:39:15 GMT)
QuL: Programming Library for Computational Cooling of Qubits [0.0] 量子コンピュータの成功の鍵となるハードルは、量子ビットを純粋な状態に初期化する能力である。
量子ビットの計算冷却は、量子ビットのサブセットが他の量子ビットを加熱するために冷却されるので、量子ビットを効果的に冷却するルートを提供する。
本稿では,様々な計算冷却プロトコルのための量子回路の生成,解析,テストに使用できるプログラミングライブラリQuLを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:32:02 GMT)
Programmable adiabatic demagnetization for systems with trivial and topological excitations [0.0] 量子コンピュータや量子シミュレータ上で任意のハミルトニアンの低エネルギー状態を作成するためのプロトコルを提案する。
このプロトコルは、固体システムを極低温に冷却するために使用される断熱脱磁性技術にインスパイアされている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:39:57 GMT)
Probing hidden topology with quantum detectors [0.0] 静的Unruh-DeWitt検出器の遷移速度を2$ (2+1)$Dのブラックホール時空で考える。
検出器の遷移速度が2つの時空を区別していることが数値的に示される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:49:19 GMT)
Predicting Breast Cancer Survival: A Survival Analysis Approach Using Log Odds and Clinical Variables [0.0] 本研究は、乳がん患者の生存確率の予測を促進するために、Cox比例ハザードやパラメトリックサバイバルモデルなどの生存分析技術を用いている。
ナイジェリアのイバダンにあるUniversity College Hospitalが提供するデータセットから、乳がん患者1557人のデータを得た。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:01:22 GMT)
Post-measurement Quantum Monte Carlo [0.0] 量子モンテカルロ (Quantum Monte Carlo, QMC) を用いて, 多数の測定値が多体量子基底および熱状態に与える影響について検討する。
測定後のSSE'は,測定熱密度行列に寄与する演算子弦のサンプリングに基づいている。
相関を効率的に計算できる測位後状態のクラスと、SU(2)対称測度がQMC符号問題を生成する状態のクラスを同定する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:57:11 GMT)
PixLore: A Dataset-driven Approach to Rich Image Captioning [0.0] 本研究では,標準商用GPU上でのLoRa法を用いてBLIP-2モデルの微調整によりクエリ変換を行う新しい手法であるPixLoreを紹介する。
続くアプローチでは、ChatGPTが組み合わせて拡張した最先端のコンピュータビジョンモデルから、慎重に組み立てられたデータセットをトレーニングする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:53:51 GMT)
Photonic Simulation of Localization Phenomena Using Boson Sampling [0.0] 室内温度で演奏するコンパクトな合成プラットフォームとしてボソンサンプリングを提案する。
ハミルトン粒子の時間進化ユニタリを連続可変ゲート分解により干渉計にマッピングすることにより、単一粒子の局在特性の実証・実証結果を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:00:05 GMT)
Photon Entangled States and Atomic Correlations in Superradiance from Multilevel Atoms [0.0] マルチレベル原子超放射過程によって放出されるフォトニック状態は、モード自由度において絡み合っていることを示す。
また,モード非依存光子源についても検討した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:19:54 GMT)
Perceptions of Discriminatory Decisions of Artificial Intelligence: Unpacking the Role of Individual Characteristics [0.0] 個人差(デジタル自己効力性、技術的知識、平等への信念、政治的イデオロギー)は、AIの成果に対する認識と関連している。
デジタル自己効力と技術的知識は、AIに対する態度と肯定的に関連している。
リベラルイデオロギーは、結果信頼、より否定的な感情、より大きな懐疑主義と負の関連がある。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:18:26 GMT)
Path integral Monte Carlo in a discrete variable representation with Gibbs sampling: dipolar planar rotor chain [0.0] 離散化された連続的な自由度と拒絶のないギブズサンプリングに基づくパス積分モンテカルロ(PIMC)アプローチを提案する。
従来のMetroplolis-Hastings法と比較して,Gibbs法が有効であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:04:39 GMT)
Orthogonal polynomial approximation and Extended Dynamic Mode Decomposition in chaos [0.0] 拡張動的モード分解(EDMD)は、ダイナミックスの予測とモデル縮小のためのデータ駆動型ツールである。
特に、EDMDがカオスシステムが作用する微分可能な関数のクラスをどのように扱うかは明らかになっていない。
我々は、カオス写像の最も単純な例に基づいて、EDMDの汎用的で厳密な理論を初めて開発する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:52:56 GMT)
On-device Federated Learning in Smartphones for Detecting Depression from Reddit Posts [0.0] ソーシャルメディアの投稿は個人の精神状態に関する貴重な情報を提供している。
本研究では,スマートフォン上での分散学習を容易にするために,フェデレートラーニング(FL)を採用した。
トレーニングプロセスを最適化するために、すべてのクライアントデバイスで共通のトークン化ツールを活用します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:09:32 GMT)
On-chip cryogenic multiplexing of Si/SiGe quantum devices [0.0] 我々は、同じチップ上に古典回路とSi/SiGe量子デバイスを統合し、量子ビットスケールアップのテストベッドを提供する。
このセットアップを利用して、16ホールバーの配列6x6mm$2$のデバイス特性を探索する。
これらの結果に基づいて,制御接続数が少ない大規模シリコン量子プロセッサにおける読み出しのビジョンを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:26:41 GMT)
On the stability of solutions to Schrödinger's equation short of the adiabatic limit [0.0] 我々は、典型的な断熱極限より短い時間スケールで適用される断熱定理を証明する。
摂動のクロスサブスペース効果を特徴付けるが、これは典型的には摂動の作用素ノルムによって示唆されるよりもはるかに少ない。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:20:35 GMT)
Object Pose Estimation Using Implicit Representation For Transparent Objects [0.0] レンダリング・アンド・コンペア法は、オブジェクトを複数のビューからレンダリングし、与えられた2D画像と比較する。
物体がニューラルラジアンス場(NeRF)の形で暗黙(ニューラル)表現として表現されている場合、実際のシーンをよりリアルに表現できることが示される。
我々は、透過的なデータセット上でのレンダリング・アンド・コンペア法のNeRF実装を評価し、現在の最先端結果を上回る結果を得た。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:51:12 GMT)
New approach to template banks of gravitational waves with higher harmonics: Reducing matched-filtering cost by over an order of magnitude [0.0] 我々は重力波テンプレートバンクに高次モード(HM)を組み込む新しい戦略を開発した。
異なるモードの組み合わせを含むテンプレートを作る代わりに、$(2,2)$, $(4,4)$と$(4,4)$モードに対応する正規化されたテンプレートを別々に保存します。
一致したフィルタリング段階では、各モードをデータと別々にフィルタリングし、信号対雑音比(SNR)のタイムリーを収集することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:12:39 GMT)
Moments of Clarity: Streamlining Latent Spaces in Machine Learning using Moment Pooling [0.0] モーメント・ポーリング(Moment Pooling)はディープ・セット・ネットワークの自然な拡張であり、これらのネットワークの潜在空間次元を劇的に減少させる。
クォーク/グルーオンジェット分類のコライダー物理タスクにおけるモーメントプーリングの実証を行った。
潜時次元が 1 のモーメントEFNは、高い潜時次元の通常のEFNと同様の働きをする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:23:42 GMT)
Modeling offensive content detection for TikTok [0.0] 本研究では,攻撃内容を含むTikTokデータの収集と解析を行う。
攻撃的なコンテンツ検出のための一連の機械学習とディープラーニングモデルを構築している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:30:39 GMT)
Mitigating Biases to Embrace Diversity: A Comprehensive Annotation Benchmark for Toxic Language [0.0] 本研究では、人文科学研究に基礎を置く規範的ベンチマークを導入し、攻撃的言語の一貫性のないラベル付けを確実にする。
我々は、人間と言語モデル(LLM)アノテーションのアノテーション間のより高いアノテータ合意を達成するために、2つの新しいアノテートデータセットをコントリビュートする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:10:24 GMT)
Metacognitive Monitoring: A Human Ability Beyond Generative Artificial Intelligence [0.0] 大規模言語モデル(LLM)は、人間の認知過程と顕著に一致している。
本研究は,ChatGPTがヒトに類似したメタ認知モニタリング能力を持っているかを検討する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:42:30 GMT)
Machine-Learning Analysis of Radiative Decays to Dark Matter at the LHC [0.0] 高輝度大型ハドロン衝突型加速器(HL-LHC)の主目的の一つは、弱い相互作用を持つ物質粒子(WIMP)の探索である。
この作業では、機械学習(ML)技術を使用して、WIMP放射減衰を超対称フレームワークのダークマター(DM)候補に探索します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:38:44 GMT)
LifeGPT: Topology-Agnostic Generative Pretrained Transformer Model for Cellular Automata [0.0] 本稿では,デコーダのみによる事前学習型トランス (GPT) モデルを用いて,トロイドグリッド上でのコンウェイのゲーム・オブ・ライフ (Life) のシミュレーションを行う。
我々の結果は,大規模言語モデルフレームワーク内での真の普遍計算への道筋をたどる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:55:02 GMT)
Lecture II: Communicative Justice and the Distribution of Attention [0.0] アルゴリズム仲介者は、そのアーキテクチャ、増幅アルゴリズム、モデレーションの実践を通じて、デジタルパブリックスフィアを統治する。
誤情報や感情の分極からヘイトスピーチや過激化まで、デジタル公共圏の多くの病理は、彼らがより良くできることを証明している。
政治哲学は、デジタル公共分野におけるコミュニケーションの統治の仕方について、緊急に説明責任を負う。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:03:35 GMT)
Lecture I: Governing the Algorithmic City [0.0] 政治哲学の中心的な課題は、私たちが一緒に生きる方法を決めるのを助けることである。
私は、アルゴリズムによる統治が政治哲学の新たな課題をいかに引き起こすかを示します。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:02:06 GMT)
Learning to sample fibers for goodness-of-fit testing [0.0] 離散指数族モデルに対する完全適合性テストを構築することの問題点を考察する。
この問題をマルコフ決定プロセスに変換し、サンプリングのための「よい動きを学ぶための強化学習アプローチ」を示す。
提案アルゴリズムは,評価可能な収束性を持つアクタ・クリティカル・サンプリング方式に基づいている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:48:34 GMT)
Label-free prediction of fluorescence markers in bovine satellite cells using deep learning [0.0] ウシの衛星細胞(BSC)の質を評価することは、養殖肉産業にとって不可欠である。
本研究は, 深層学習を用いた孤立BSCにおける蛍光マーカー予測のためのラベルフリー手法を開発することを目的とする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:47:12 GMT)
LLM Agent Honeypot: Monitoring AI Hacking Agents in the Wild [0.0] 我々は,自律型AIハッキングエージェントを監視するシステムであるLLM Honeypotを紹介する。
公開環境での数週間のトライアルで、80,000のハッキングと6人のAIエージェントを収集しました。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:25:28 GMT)
L1-Regularized ICA: A Novel Method for Analysis of Task-related fMRI Data [0.0] 本研究では,高次元データから適切な特徴を抽出するために,独立成分分析法(ICA)を提案する。
提案手法の有効性について, 合成データおよび実機能的磁気共鳴画像データに適用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 02:54:01 GMT)
Interaction-induced dissipative quantum phase transition in a head-to-tail atomic Josephson junction [0.0] ヘッド・ツー・テールのボース・ジョセフソン接合における散逸相転移を提案する。
原子間相互作用強度が減衰パラメータの役割を担っていることを示す。
我々は、準1次元の原子ガスの密閉により絶縁相に到達することができると主張している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 01:58:06 GMT)
Integrating Large Language Models and Reinforcement Learning for Non-Linear Reasoning [0.0] LLM(Large Language Models)は長期計画に苦慮している。
本稿では,強化学習エージェントがLLMの空間探索を案内するアーキテクチャを提案する。
我々は、このアーキテクチャをプログラム等価タスクで評価し、思考のチェーン(CoT)と思考のツリー(ToT)と比較する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:47:31 GMT)
Increasing Interference Detection in Quantum Cryptography using the Quantum Fourier Transform [0.0] 量子フーリエ変換(QFT)を利用した2つの量子暗号プロトコルを提案する。
これらのプロトコルの最も重要な点は、このQFTの有効性を活用する新しいQKD手法である。
さらに、既存の量子暗号化手法をQFTベースのアプローチで拡張して、盗聴検出を改善する方法について述べる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:57:38 GMT)
Holographic Non-Hermitian Lattices and Junctions with PT-Restoring RG Flows [0.0] Inhomogenoeus non-Hermitian strong linked holographic field theory。
PTを自発的に破壊する解と、そうでない解を見つける。
このことは、arXiv:2110.05289の摂動的なセットアップで観測されたものと同様、IRにPT対称性の復元が存在すると主張する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:20:26 GMT)
High-rate continuous-variable measurement device-independent quantum key distribution with finite-size security [0.0] 連続可変(CV)測定デバイス独立(MDI)QKDは、様々な量子ネットワークトポロジーを作成する上で有望な候補である。
本稿では,CV MDI-QKDシステムによる集団攻撃に対する安全な鍵レート2.6Mbit/sを実現するための,最初の実験的検証を行った。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:08:35 GMT)
Guided Multi-objective Generative AI to Enhance Structure-based Drug Design [0.0] 構造に基づく医薬品設計のための拡散と多目的最適化を組み合わせた生成化学AIであるIDOLproについて述べる。
IDOLproは、各テストセットにおける次の最先端メソッドよりも10%から20%以上の結合親和性で生成する。
我々は、IDOLproが、仮想スクリーンにあるどの分子よりも結合親和性と合成アクセシビリティが良く、様々な重要な疾患関連ターゲットの分子を生成できることを示した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:00:37 GMT)
GPTreeO: An R package for continual regression with dividing local Gaussian processes [0.0] 本稿では,スケーラブルなガウスプロセス(GP)回帰のための柔軟なRパッケージであるGPTreeOを紹介する。
GPTreeOはDividing Local Gaussian Processes (DLGP)アルゴリズムに基づいており、ローカルGP回帰器のバイナリツリーを動的に構築する。
我々は,GPTreeOの特徴が連続学習環境における回帰性能に与える影響を示すための感度解析を行った。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:45:16 GMT)
GPTreeO: An R package for continual regression with dividing local Gaussian processes [0.0] 本稿では,スケーラブルなガウスプロセス(GP)回帰のための柔軟なRパッケージであるGPTreeOを紹介する。
GPTreeOはDividing Local Gaussian Processes (DLGP)アルゴリズムに基づいており、ローカルGP回帰器のバイナリツリーを動的に構築する。
我々は,GPTreeOの特徴が連続学習環境における回帰性能に与える影響を示すための感度解析を行った。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:45:16 GMT)
From Distributional Robustness to Robust Statistics: A Confidence Sets Perspective [0.0] クルバック・リーブラーの発散と全変動距離に基づくDRO曖昧性集合は、一様最小であることを示す。
パラメトリックな仮定が未知の分布に課されるとき、あいまいさ集合はハッバーが提案した最適推定器に基づく信頼集合よりも大きくなることが証明される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:20:42 GMT)
Formal Security Analysis of the AMD SEV-SNP Software Interface [0.0] AMD Secure Encrypted 技術は、仮想マシンをハイパーバイザのような特権の高いソフトウェアから保護することによって、機密計算を可能にする。
我々は、SEV Secure Nested Paging (SEV-SNP) と呼ばれる、最新のSEVイテレーションにおけるソフトウェアインターフェースの最初の包括的シンボリックモデルを開発する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:25:46 GMT)
Few-sample Variational Inference of Bayesian Neural Networks with Arbitrary Nonlinearities [0.0] 3つの決定論的サンプルだけで任意の非線形性を通して統計モーメントを伝播する単純かつ効果的な手法を実証する。
そこで本研究では,BNNの出力ノードに物理インフォームド事前情報を注入する非線形アクティベーション関数を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 19:58:31 GMT)
Extractable energy from quantum superposition of current states [0.0] 空間閉スピンネットワークにおける2つの電流状態の重畳は、抽出可能なエネルギーの特定のピークによって特徴づけられることを示す。
多体状態のダイナミクスは、制御された方法で進化するエルゴトロピーに関係している。
我々が提案する実装は、Rydberg-atomプラットフォームに基づいている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:00:02 GMT)
Exploring the role of polarization in fiber-based quantum sources [0.0] 光ファイバにおける3次パラメトリックダウンコンバージョンと4波混合の偏光効果が検出方法の強化にどのように利用されるかを示す。
マイクロ構造化ソリッドコアファイバにおける4波混合の定量的研究は、実験設計における偏光の役割に重要な影響を及ぼす。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:19:35 GMT)
Estimating Atmospheric Variables from Digital Typhoon Satellite Images via Conditional Denoising Diffusion Models [0.0] 本研究では,台風分野における拡散モデルの適用について検討する。
この研究の焦点は台湾であり、台風に非常に脆弱な地域である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:23:54 GMT)
Ensemble-based, large-eddy reconstruction of wind turbine inflow in a near-stationary atmospheric boundary layer through generative artificial intelligence [0.0] 本研究では,大気の大渦シミュレーションモデルに根ざした時間分解インフロー再構成手法を開発した。
我々の「大規模渦再構築」技術は拡散モデル機械学習アルゴリズムを用いて観測と大気モデル情報をブレンドする。
我々は,3つの合成フィールドキャンペーンにおいて,この手法の2秒間再構築能力を検証する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 20:53:04 GMT)
Enhancing the efficiency of polariton OLEDs in and beyond the single-excitation subspace [0.0] 有機分子の25%の電子状態しか電気的励起によって発光することができず、OLEDの効率は制限される。
強力な光マター結合は、鏡を使ってOLED内で光を閉じ込めることによって達成され、偏光子として知られるハイブリッド光マター状態を生成する。
本研究では,三重項-分極子遷移と逆系間交差および三重項-三重項消滅の導出速度について検討した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:16:40 GMT)
Enhancing Text Generation in Joint NLG/NLU Learning Through Curriculum Learning, Semi-Supervised Training, and Advanced Optimization Techniques [0.0] 本研究では,NLG(Natural Language Generation)とNLU(Natural Language Understanding)の併用によってテキスト生成を改善する手法を開発した。
データは、クリーニング、トークン化、ストーミング、ストップワード削除など、注釈付きデータセットの収集と前処理によって作成される。
トランスフォーマーベースのエンコーダとデコーダ、長距離依存関係のキャプチャ、ソースターゲットシーケンスモデリングの改善。
政策勾配手法による強化学習、半教師付きトレーニング、注意機構の改善、および異なる近似を用いて、モデルを微調整し、複雑な言語タスクを効果的に処理する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 12:43:49 GMT)
Enhancing Retail Sales Forecasting with Optimized Machine Learning Models [0.0] 小売売上高予測では、在庫管理と戦略的計画にとって、将来の売上を正確に予測することが不可欠である。
機械学習(ML)の最近の進歩は、より堅牢な代替手段を提供する。
この研究はML、特にランダムフォレスト(RF)、グラディエントブースティング(GB)、サポートベクター回帰(SVR)、XGBoostの力の恩恵を受けている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:11:33 GMT)
Enhancing Generalization in Sparse Mixture of Experts Models: The Case for Increased Expert Activation in Compositional Tasks [0.0] 本研究では,スパースミキチャー・オブ・エキスパート(SMoE)モデルにおけるスパースアクティベーションに関する従来の知恵に挑戦する。
より多くの専門家を活性化することで、タスクの複雑さでスケーリングする専門家の最適な人数で、難しいタスクのパフォーマンスが向上することを示す。
この結果から,SMoEをベースとした大規模言語モデルは,構成課題に挑戦する専門家数を増やすことで,より優れた結果が得られることがわかった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:40:48 GMT)
Enhancement of Opto-Electro-Mechanical Entanglement through Three-Level Atoms [0.0] 3レベル原子を含むオプトエレクトロメカニカルシステムにおいて, 動的バイパートライトの絡み合いに対処する。
その結果, 各サブシステム間の絡み合いは, 原子注入速度とともに増加することが示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:21:29 GMT)
Efficient, High-Fidelity Single-Photon Switch Based on Waveguide-Coupled Cavities [0.0] 2レベルエミッタを埋め込んだ導波管結合型キャビティは,高効率な単一光子スイッチとして機能することを示す。
単一導波路結合キャビティは入力された光子波パケットをほぼ均一効率と忠実度でルーティングできることがわかった。
このような効率的で高忠実な単一光子ルーティングは、スケーラブルなフォトニック量子技術に不可欠である。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:03:09 GMT)
Efficient Retrieval of Temporal Event Sequences from Textual Descriptions [0.0] TPP-LLM-Embeddingは、自然言語記述に基づくイベントシーケンスの埋め込みと検索のための統一モデルである。
我々のモデルはイベントタイプと時間の両方をエンコードし、プールを通してシーケンスレベルの表現を生成します。
TPP-LLM-Embeddingは効率的な検索を可能にし、多様なデータセットのベースラインモデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:35:55 GMT)
Does the oscillatory behavior of the Momentum Spectrum depend on the basis in the Post-Transient Stage? [0.0] 空間的に均一で時間に依存する電場によるペア生成は、量子電磁力学の枠組みの中で研究されている。
本稿では,ボゴリューボフ変換法を用いて,単粒子分布関数を断熱的に計算する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 21:34:25 GMT)
Do LLMs Have Political Correctness? Analyzing Ethical Biases and Jailbreak Vulnerabilities in AI Systems [0.0] 我々は,PCJailbreakの概念を導入し,これらの安全性に起因したバイアスによって引き起こされる固有のリスクを強調した。
生成前に防御プロンプトを注入することでジェイルブレイクを防ぎ,効率的な防御手法であるPCDefenseを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:46:09 GMT)
DivShift: Exploring Domain-Specific Distribution Shift in Volunteer-Collected Biodiversity Datasets [0.0] 約800万のiNaturalist植物画像のキュレートされたデータセットであるDivShift-NAWC(DivShift-NAWC)を紹介した。
モデル性能を既知の4つのバイアスで比較し、それらが実際にモデル性能を損なうことを観察する。
我々は、気候変動が世界の生物多様性に与える影響を監視するために、データセットをキュレートしてディープラーニングモデルを訓練する実践的戦略を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 23:56:30 GMT)
Disjointness Violations in Wikidata [0.0] ウィキデータにおける解離の現在のモデル化について分析する。
我々は、SPARQLクエリを使用して、不一致違反の原因となる各犯人を特定し、矛盾する情報を特定し、修正するための公式をレイアウトする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 16:07:51 GMT)
Deterministic multipartite entanglement via fractional state transfer across quantum networks [0.0] 本稿では,エミッタの励起が部分的に量子通信チャネルを介して伝達される分数量子状態伝達を提案する。
現在の実験プラットフォームでは, 真のマルチパーティの絡み合った状態が忠実に準備できることが示される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:14:52 GMT)
Deep-learning recognition and tracking of individual nanotubes in low-contrast microscopy videos [0.0] 本研究は, その場ホモダイン偏光顕微鏡(HPM)を用いたカーボンナノチューブの成長速度解析の課題に対処する。
ResNet-50バックボーンで強化されたMask-RCNNアーキテクチャは、顕微鏡ビデオで個々のナノチューブを認識し追跡するために使用された。
この方法はコントラストを高めるための一連のビデオ処理ステップを含み、低信号と高速な運動量を管理するために差分処理技術を使用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:28:11 GMT)
Cost-Effective Realization of n-Bit Toffoli Gates for IBM Quantum Computers Using the Bloch Sphere Approach and IBM Native Gates [0.0] コスト効率の良いnビットトフォリゲートが提案され、IBM量子コンピュータのレイアウト(線形、Tライク、Iライク)とnビットの物理量子ビット数に基づいて実現される(あるいはトランスパイルされる)。
レイアウトを意識したnビットトフォリゲートは、ブロッホ球の視覚的アプローチを用いて設計されている。
トランスパイル後、提案したレイアウト対応のnビットトフォリゲートは、従来のnビットトフォリゲートよりもはるかに低いトランスパイル量子コストを持つ。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 00:29:29 GMT)
Consumer Segmentation and Participation Drivers in Community-Supported Agriculture: A Choice Experiment and PLS-SEM Approach [0.0] 地域農業(CSA)は、消費者と生産者との強いつながりを育む上で重要な役割を担っている。
本研究の目的は,日本における CSA 参加の可能性を特定し,既存の CSA 参加理論を検証することである。
本研究は, 環境・社会的影響におけるCSAの役割を強調することにより, 日本におけるCSAの促進が最も効果的である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:37:28 GMT)
Concentration inequalities for high-dimensional linear processes with dependent innovations [0.0] Weibull を置換したベクトル線型過程の $l_infty$ ノルムに対する濃度不等式を開発する。
これらの不等式を、大次元VAR(p)システムのスパース推定とヘテロレダスティック性および自己相関整合性(HAC)高次元共分散推定に適用する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:31:22 GMT)
Computational Approaches to Arabic-English Code-Switching [0.0] 我々は,現代標準アラビア語およびアラビア語-英語NERタスクの最先端技術を提案し,適用する。
NERタスクのための最初の注釈付きCSアラビア英語コーパスを作成しました。
すべての手法がCSデータ上でNERタグガーの性能を改善した。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:20:29 GMT)
Comparing Surface Landmine Object Detection Models on a New Drone Flyby Dataset [0.0] 従来の方法による地雷検出は遅く、危険であり、違法に高価である。
ディープラーニングに基づくオブジェクト検出アルゴリズムを使用することで、ドローンビデオは有望だが、最近普及した地表地雷の小さなソーダ缶サイズのために、複数の課題を抱えている。
この研究は地雷画像、ビデオデータセット、Jupyterノートのモデルに貢献し、地雷検出の今後の研究を可能にしている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 05:30:00 GMT)
Co-designing Transmon devices for control with simple pulses [0.0] 本研究では,おもちゃのアルゴリズムが必要とするゲートセットを最適制御ツールを用いて導出する。
我々は、与えられたプラットフォーム上の2量子ゲートの探索に柔軟性を提供するために、完全エンタングル理論を用いる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:51:39 GMT)
ClickAgent: Enhancing UI Location Capabilities of Autonomous Agents [0.0] ClickAgentは、自律エージェントを構築するための新しいフレームワークである。
ClickAgentでは、MLLMが推論とアクションプランニングを処理し、別のUIロケーションモデルが画面上の関連するUI要素を識別する。
本評価は,Androidスマートフォンエミュレータと実際のAndroidスマートフォンの両方で実施し,タスク成功率をエージェント性能測定の指標として用いた。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:12:31 GMT)
Certifying steady-state properties of open quantum systems [0.0] オープン量子系の定常状態特性を推定することは量子技術において重要な問題である。
本稿では、任意の可観測体の期待値に基づいて、半定値プログラミング認定境界を用いて、スケーラブルな方法で導出する方法を示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:13:12 GMT)
Central Charge in Quantum Optics [0.0] 一つの指数の表現は、新しい要素の導入を犠牲にしてのみ可能であることを示す。
この現象を光らせる量子光学実験が提案されている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 13:56:07 GMT)
Can LLMs advance democratic values? [0.0] LLMは、形式的な民主的意思決定プロセスから明確に守るべきである、と我々は主張する。
非公式な公共の場を強化するのに役立てることができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:04:48 GMT)
Can LLMs advance democratic values? [0.0] LLMは、形式的な民主的意思決定プロセスから明確に守るべきである、と我々は主張する。
非公式な公共の場を強化するのに役立てることができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:04:48 GMT)
Bumpified Haar Wavelets and Tsirelson's Bound: Some Mathematical Properties and Insights from Block Toeplitz Matrices [0.0] 本稿では,ベル・クレーザー=ホルン=シモニー=ホルト不等式に対する明示的な違反を示すために,膨らんだハールウェーブレットを用いた最近の構成について検討する。
完全な証明はいまだ解明されていないが、我々はそれを支持するためにさらに説得力のある証拠を提示している。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:14:39 GMT)
Benchmarking Data Efficiency in $Δ$-ML and Multifidelity Models for Quantum Chemistry [0.0] この研究は、$Delta$-ML、MFML、最適化されたMFML(o-MFML)に関連するデータコストを比較する。
以上の結果から,マルチ忠実度法は,多くの予測を行う場合の標準$Delta$-ML手法を超えることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:12:53 GMT)
Be My Donor. Transfer the NLP Datasets Between the Languages Using LLM [0.0] 私たちはDEFTコーパスを翻訳する英語とロシア語のペアを使用します。
コアLLMとしてChatGPT3.5-turboとLlama-3.1-8bを用いたアノテーション転送のためのパイプラインを提供する。
最後に、翻訳データセット上でBERTベースのモデルをトレーニングし、ベースラインを確立する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 22:46:53 GMT)
BANTH: A Multi-label Hate Speech Detection Dataset for Transliterated Bangla [0.0] 我々は,37.3kサンプルからなるバングラヘイト音声データセットであるBanTHを紹介する。
サンプルはYouTubeコメントからソースされ、各インスタンスに1つ以上のターゲットグループをラベル付けする。
実験により、さらに事前訓練されたエンコーダが、BanTHデータセット上で最先端のパフォーマンスを実現していることが明らかになった。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:15:15 GMT)
Automating IETF Insights generation with AI [0.0] IETF Insightsプロジェクトは、Internet Engineering Task Force (IETF) Working Groupsの活動に関する包括的なレポートの作成を合理化している。
このシステムは、ミーティング分、参加者リスト、ドラフト、アジェンダを含む様々なIETFソースからのデータを収集、統合、分析する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 07:59:05 GMT)
Automatic Translation Alignment Pipeline for Multilingual Digital Editions of Literary Works [0.0] 本稿では,アレッサンドロ・マンゾニのイタリア語小説「I promessi sposi」の多言語デジタル版(MDE)作成における翻訳アライメントアルゴリズムの適用について検討する。
我々は、MDEが読者体験と翻訳学習のサポートの両方を改善するための重要な要件を特定した。
本稿では,文語翻訳のアライメントを評価するための新しい指標を提案し,今後の分析のための可視化手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 06:21:38 GMT)
Automated Model Discovery for Tensional Homeostasis: Constitutive Machine Learning in Growth and Remodeling [0.0] キネマティック成長とホメオスタティック表面を組み込むことで,非弾性構成型ニューラルネットワーク(iCANN)を拡張した。
実験により得られた組織等価データから材料点レベルで学習するネットワークの能力を評価する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 15:12:55 GMT)
Approximating Auction Equilibria with Reinforcement Learning [0.0] 本稿では,ベイズ・ナッシュ均衡を近似する高度なアルゴリズムを用いた自己学習型強化学習手法を提案する。
自己プレイを通じて、これらのアルゴリズムは、既知の平衡を持つオークションにおいて、堅牢でほぼ最適な入札戦略を学習することができる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:34:57 GMT)
Adversarial Testing as a Tool for Interpretability: Length-based Overfitting of Elementary Functions in Transformers [0.0] 本研究では, シーケンス・ツー・シーケンス変換器の動作を解釈するために, 定義された誤り指標を用いて基本的な編集関数について検討する。
短い列への一般化がしばしば可能であることを示すが、長い列は非常に問題であることを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:39:46 GMT)
Advancing RVFL networks: Robust classification with the HawkEye loss function [0.0] 本稿では,Randomベクトル関数リンク(RVFL)フレームワークにHawkeEye損失(H-loss)関数を組み込むことを提案する。
H-loss関数は、滑らかさと有界性を含む優れた数学的特性を特徴とし、同時に非感性ゾーンを組み込む。
提案したH-RVFLモデルの有効性は、UCIおよびKEELレポジトリから40ドルのデータセットで実験することで検証される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:12:54 GMT)
Advancing RVFL networks: Robust classification with the HawkEye loss function [0.0] 本稿では,Randomベクトル関数リンク(RVFL)フレームワークにHawkeEye損失(H-loss)関数を組み込むことを提案する。
H-loss関数は、滑らかさと有界性を含む優れた数学的特性を特徴とし、同時に非感性ゾーンを組み込む。
提案したH-RVFLモデルの有効性は、UCIおよびKEELレポジトリから40ドルのデータセットで実験することで検証される。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 10:12:54 GMT)
Accurate Checkerboard Corner Detection under Defoucs [0.0] 本稿では,チェス盤角検出のための特徴抽出の強化に焦点をあてる。
本稿では,視光カメラの精度を向上する対称性に基づく,新しいサブピクセル改良手法を提案する。
提案手法は,既存技術よりも精度が向上し,性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 09:23:30 GMT)
About rescaling, discretisation and linearisation of $\mathtt{RNN}$ [0.0] 本稿では、リカレントニューラルネットワーク(mathtRNN$s)の数学的基礎と、時間的再スケーリング、離散化、線形化の3つの基本的な手順について考察する。
これらの技術は$mathttRNN$sの振る舞いを特徴づける重要なツールを提供し、時間力学、実用的な計算実装、解析の線形近似に関する洞察を可能にする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 14:04:26 GMT)
ASTM :Autonomous Smart Traffic Management System Using Artificial Intelligence CNN and LSTM [0.0] 本稿では,AIを用いて交通流量を改善する自律型スマートトラヒック管理システムを提案する。
このシステムは、交通管理画像中の車両を検出するために、YOLO V5 Convolutional Neural Networkを使用している。
また、長い短期記憶を備えたリカレントニューラルネットワークを使用して、次の12時間の車両数を予測する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 08:10:53 GMT)
A.I. go by many names: towards a sociotechnical definition of artificial intelligence [0.0] 人工知能(AI)の定義は永続的な課題であり、技術的曖昧さと様々な解釈に悩まされることが多い。
このエッセイは、研究に明快さを必要とする研究者にとって必須の、AIの社会技術的定義について論じている。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 11:25:50 GMT)
A Fourier analysis framework for approximate classical simulations of quantum circuits [0.0] 本稿では,グループパラメータを符号化した構造を持つ回路に対して,グループを調和解析するフレームワークを提案する。
また、同次空間への一般化、疑似システム、および既約表現の行列係数を用いてランダム回路を解析する方法についても論じる。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:34 GMT)
A Deep Learning Method for Predicting Mergers and Acquisitions: Temporal Dynamic Industry Networks [0.0] 効果的なM&A予測モデルは、アドホックな機能エンジニアリングやデータリバランスを必要とせずに、取引レベルの予測を提供するべきである。
M&Aイベントのばらつきのため、既存のモデルはデータリバランシングを必要とし、バイアスを導入し、現実の応用性を制限する。
本稿では、時間点過程と深層学習を利用して複雑なM&A相互依存を捕捉する時間動的産業ネットワーク(TDIN)モデルを提案する。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 18:48:12 GMT)
A Comprehensive Analysis of Routing Vulnerabilities and Defense Strategies in IoT Networks [0.0] IoT(Internet of Things)はさまざまなドメインに革命をもたらし、相互接続性の向上とデータ交換を通じて大きなメリットを提供している。
しかし、IoTネットワークに関連するセキュリティ上の課題は、その固有の脆弱性のため、ますます顕著になっている。
本稿では、IoTアーキテクチャにおけるネットワーク層の詳細分析を行い、ルーティングアタックによる潜在的なリスクを明らかにする。
論文参考訳(メタデータ) (Thu, 17 Oct 2024 04:38:53 GMT)