Language Model Alignment in Multilingual Trolley Problems [138.6] Moral Machine 実験に基づいて,MultiTP と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。
分析では、19の異なるLLMと人間の判断を一致させ、6つのモラル次元をまたいだ嗜好を捉えた。
我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:37:26 GMT)
ComPO: Community Preferences for Language Model Personalization [122.5] ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。
ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:02:40 GMT)
xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs [112.4] ビデオ用マルチモーダル言語モデルであるxGen-MM-Vid(B-3-Video)を提案する。
BLIP-3-Videoは、従来のビジュアルトークン化器に加えて「時間エンコーダ」を利用する。
BLIP-3-Videoは、より大規模な最先端モデルに匹敵するビデオ質問応答精度が得られることを実験的に確認する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:59:11 GMT)
A Survey on Knowledge Distillation of Large Language Models [99.1] 知識蒸留(KD)は、高度な能力をオープンソースモデルに転送するための重要な方法論である。
本稿では,大規模言語モデル(LLM)の領域におけるKDの役割を包括的に調査する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:22:33 GMT)
Mitigating Hallucinations of Large Language Models in Medical Information Extraction via Contrastive Decoding [92.3] 医療情報抽出タスクにおける幻覚の問題を解決するために,ALCD(ALternate Contrastive Decoding)を導入する。
ALCDは, 従来の復号法に比べて幻覚の解消に有意な改善が見られた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:19:19 GMT)
TuneTables: Context Optimization for Scalable Prior-Data Fitted Networks [90.0] 事前データ対応ネットワーク(PFN)は、事前学習とコンテキスト内学習を利用して、1つのフォワードパスで新しいタスクの強力なパフォーマンスを実現する。
我々は、大規模なデータセットをより小さな学習コンテキストに圧縮するPFNのパラメータ効率の良い微調整戦略であるTuneTablesを紹介した。
我々は、TuneTablesを解釈可能性ツールとして使用することができ、公平性目標を最適化することでバイアスを軽減することができることを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:48:06 GMT)
A Realistic Threat Model for Large Language Model Jailbreaks [87.6] 本研究では,ジェイルブレイク攻撃の原理的比較のための統一的脅威モデルを提案する。
私たちの脅威モデルは、パープレキシティの制約を組み合わせることで、ジェイルブレイクが自然のテキストからどれだけ逸脱するかを測定します。
我々は、この新しい現実的な脅威モデルに人気のある攻撃を適用する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:27:01 GMT)
LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection [87.4] テキストが人間の書いたものなのか、機械で作られたものなのかを判断するのは、しばしば困難である。
細粒度検出のためのLLM-DetectAIveを提案する。
i) 人書き、ii) 機械生成、(iii) 機械書、次いで機械書、(iv) 人書き、そして機械ポリッシュの4つのカテゴリをサポートする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:26:20 GMT)
Improve Vision Language Model Chain-of-thought Reasoning [86.8] 視覚言語モデル(VLM)におけるチェーン・オブ・シント(CoT)推論は、解釈可能性と信頼性を向上させるために不可欠である。
我々は,より詳細な回答を必要とする推論タスクに対して,短時間でVLMを訓練することはよくないことを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:00:06 GMT)
Gradient Rewiring for Editable Graph Neural Network Training [84.8] underlineGradient underlineRewiringメソッドは、textbfGREという、アンダーライン編集可能なグラフニューラルネットワークトレーニングのためのものだ。
そこで本稿では,textbfGRE という名前のアンダーライン編集可能なグラフニューラルネットワークトレーニングのための,シンプルで効果的なアンダーライングラディエントアンダーラインリスイッチ法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:01:50 GMT)
Any2Point: Empowering Any-modality Large Models for Efficient 3D Understanding [83.6] 我々は,Any2Pointというパラメータ効率のよい大規模モデル(ビジョン,言語,音声)を3次元理解に活用する手法を紹介した。
入力された3Dポイントと元の1Dまたは2D位置との相関関係を示す3D-to-any (1Dまたは2D)仮想プロジェクション戦略を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:54:55 GMT)
SeaDAG: Semi-autoregressive Diffusion for Conditional Directed Acyclic Graph Generation [83.5] 方向性非巡回グラフ(DAG)の条件生成のための半自己回帰拡散モデルSeaDAGを紹介する。
グローバルグラフ構造を欠いた従来の自己回帰生成とは異なり,本手法は拡散ステップ毎に完全なグラフ構造を保持する。
本研究では,現実的なDAGを生成する拡散モデルの能力を高めるために,条件損失を伴うグラフ条件学習を明示的に訓練する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:47:03 GMT)
AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting [82.5] ストロークベースのレンダリング(SBR)は、入力画像をパラメータ化されたストロークのシーケンスに分解することを目的としており、入力画像に似た絵に描画することができる。
単一ステップのニューラルペイントのための効率よく適応的なモデルであるAttentionPainterを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:36:45 GMT)
1-bit AI Infra: Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs [81.7] bitnetは1ビットのLarge Language Modelの可能性を最大限に活用するために設計されたソフトウェアスタックです。
実験では、bitnetはxCPUの2.37xから6.17x、ARMの1.37xから5.07xまでの大幅なスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:14:57 GMT)
MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs [81.0] 大規模言語モデル(LLM)は、高い精度で算術語問題を解くことができるが、訓練された言語よりも複雑な問題にどのように一般化するかは、ほとんど分かっていない。
本研究では、任意に複雑な算術証明問題に対する LLM の評価フレームワーク、MathGAP を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:58:30 GMT)
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree [79.3] SAM2Longは、トレーニング不要のビデオオブジェクトセグメンテーションを改良した手法である。
各フレーム内のセグメンテーションの不確実性を考慮し、複数のセグメンテーション経路からビデオレベルの最適結果を選択する。
SAM2Longは、24の頭対頭比較で平均3.0点の改善を実現している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:59:19 GMT)
Mini-InternVL: A Flexible-Transfer Pocket Multimodal Model with 5% Parameters and 90% Performance [78.5] Mini-InternVL は 1B から 4B までのパラメータを持つ一連の MLLM であり、パラメータの 5% しか持たない性能の90% を達成している。
我々は,ダウンストリームタスクにおける特化モデルの転送と性能向上を可能にする,Mini-InternVLの統一適応フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:58:20 GMT)
Compute-Constrained Data Selection [77.1] コスト対応ユーティリティ関数を用いてデータ選択の問題を定式化し、その問題をトレーニングのための初期選択コストのトレーディングとしてモデル化する。
複数のタスク、微調整トークンのスケーリングによる計算予算、モデルサイズ、データ選択計算など、包括的な実験を網羅的に実施しています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:11:21 GMT)
On the token distance modeling ability of higher RoPE attention dimension [76.6] 本研究では,注目ヘッドの隠蔽次元と長距離依存の捕捉への寄与との関係について検討する。
我々は、様々な長さ計測モデルから特定の種類の注意ヘッドを同定し、位置頭部と命名した。
これらのヘッドは、長距離情報相互作用に強く焦点を合わせ、長い入力処理において重要な役割を担っている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:49:18 GMT)
On the token distance modeling ability of higher RoPE attention dimension [76.6] 本研究では,注目ヘッドの隠蔽次元と長距離依存の捕捉への寄与との関係について検討する。
我々は、様々な長さ計測モデルから特定の種類の注意ヘッドを同定し、位置頭部と命名した。
これらのヘッドは、長距離情報相互作用に強く焦点を合わせ、長い入力処理において重要な役割を担っている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:49:18 GMT)
HAICOSYSTEM: An Ecosystem for Sandboxing Safety Risks in Human-AI Interactions [76.4] 本稿では,多様な複雑な社会的相互作用におけるAIエージェントの安全性を調べるフレームワークであるHAICOSYSTEMを提案する。
私たちは7つの領域(医療、金融、教育など)にわたる92のシナリオに基づいて1840のシミュレーションを実行します。
我々の実験は、最先端のLSMは、プロプライエタリかつオープンソースの両方で、50%以上のケースで安全リスクを示すことを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:47:54 GMT)
HAICOSYSTEM: An Ecosystem for Sandboxing Safety Risks in Human-AI Interactions [76.4] 本稿では,多様な複雑な社会的相互作用におけるAIエージェントの安全性を調べるフレームワークであるHAICOSYSTEMを提案する。
私たちは7つの領域(医療、金融、教育など)にわたる92のシナリオに基づいて1840のシミュレーションを実行します。
我々の実験は、最先端のLSMは、プロプライエタリかつオープンソースの両方で、50%以上のケースで安全リスクを示すことを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:47:54 GMT)
Wireless Human-Machine Collaboration in Industry 5.0 [75.8] ワイヤレス・ヒューマン・マシン・コラボレーションは産業5.0にとって重要な進歩である。
安定性解析は、閉ループ系がモデルランダム性の下でどのように振る舞うかを証明している。
本稿では,マシンと人体制御のための2つの無線ループを組み込んだ基本WHMCモデルを確立する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:56:03 GMT)
CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution [74.4] textbfJudger-1は、最初のオープンソースのtextbfall-in-one judge LLMである。
CompassJudger-1は、優れた汎用性を示す汎用LLMである。
textbfJudgerBenchは、様々な主観評価タスクを含む新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:56:51 GMT)
VipAct: Visual-Perception Enhancement via Specialized VLM Agent Collaboration and Tool-use [74.4] 視覚言語モデル(VLM)を強化するエージェントフレームワークであるVipActを提案する。
VipActは、タスク要求の分析、計画、調整を管理するオーケストレータエージェントと、特定のタスクを処理する専門エージェントで構成される。
様々な視覚認知タスクを特徴とするベンチマーク上でのVipActの評価を行い,実験結果から大幅な性能向上が得られた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:10:26 GMT)
Managing Bandwidth: The Key to Cloud-Assisted Autonomous Driving [73.6] 自動運転車のようなリアルタイム制御システムにクラウドを頼らなければならない、と私たちは主張する。
時間に敏感な計算と遅延クリティカルな計算の一部をクラウドにオフロードする機会を特定します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:32:36 GMT)
Towards Optimal Adapter Placement for Efficient Transfer Learning [73.1] PETLは、トレーニング済みモデルを新しい下流タスクに適用し、微調整されたパラメータの数を最小化することを目的としている。
PETLの一般的なアプローチであるアダプタは、低ランクのプロジェクションを組み込むことで、既存のネットワークにさらなる容量を注入する。
本稿では,アダプタの配置と性能の関係について検討する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:37:17 GMT)
XForecast: Evaluating Natural Language Explanations for Time Series Forecasting [72.6] 時系列予測は、特に正確な予測に依存するステークホルダーにとって、意思決定を支援する。
伝統的に説明可能なAI(XAI)メソッドは、機能や時間的重要性を基盤とするものであり、専門家の知識を必要とすることが多い。
時系列データにおける複雑な因果関係のため,予測NLEの評価は困難である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:19:40 GMT)
Bayesian scaling laws for in-context learning [72.2] In-context Learning(ICL)は、言語モデルをトレーニング更新なしで複雑なタスクを実行するための強力なテクニックである。
我々は、ICCがベイズ学習者を近似し、ICCのための新しいベイズスケーリング法則のファミリーを開発することを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:45:22 GMT)
Superposed Decoding: Multiple Generations from a Single Autoregressive Inference Pass [72.1] Superposed Decodingは、1つの自己回帰推論パスのコストで$k$のドラフトを生成する新しい復号アルゴリズムである。
Superposed Decodingは、他のデコード戦略と組み合わせることで、推論時間計算のスケーリング時に普遍的なカバレッジが向上する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:56:06 GMT)
Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation [71.3] この研究は、記号的突然変異を通じて形式的な定理を構成するデータ合成のフレームワークであるAlchemyを提案する。
マドリブにおける各候補定理について、書き直しや適用に使用できるすべてのイベーシブルな定理を同定する。
その結果、マドリブの定理の数は110kから6Mへと桁違いに増加する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:04:21 GMT)
ViMoE: An Empirical Study of Designing Vision Mixture-of-Experts [71.1] 我々は、MoE構造をViT(Vision Transformer)に統合し、ViMoEと命名し、MoEを視覚に適用する可能性を探る。
性能はMoE層の構成に敏感であり,設計を慎重に行わずに最適な結果を得ることが困難である。
これを解決するために、共有専門家を導入し、共通情報を学習し、取得し、安定したViMoEを構築する効果的な方法として役立てる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:51:17 GMT)
LLaVA-KD: A Framework of Distilling Multimodal Large Language Models [70.2] 本稿では,l-MLLMからs-MLLMへ知識を伝達する新しいフレームワークを提案する。
具体的には,l-MLLMとs-MLLMの視覚的テキスト出力分布のばらつきを最小限に抑えるために,MDist(Multimodal Distillation)を導入する。
また,S-MLLMの可能性を完全に活用するための3段階学習手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:41:28 GMT)
Automated Proof Generation for Rust Code via Self-Evolution [69.3] 私たちは、Rustコードの自動証明生成を可能にする、人間による証明の欠如を克服する新しいフレームワークであるSAFEを紹介します。
GPT-4oに比べて効率と精度が優れていた。
この進歩により性能が大幅に向上し、人間の専門家によるベンチマークで70.50%の精度が達成された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:15:45 GMT)
Selection-p: Self-Supervised Task-Agnostic Prompt Compression for Faithfulness and Transferability [67.8] 本稿では,非形式的トークンを識別する統一圧縮法を開発するために,大規模言語モデルの能力について検討する。
実験により、Selection-pは様々な分類タスクで最先端のパフォーマンスを達成することが示された。
以前の作業と比べて、異なるモデルに対して優れた転送性を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:11:44 GMT)
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.1] LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:26:41 GMT)
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.1] LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:26:41 GMT)
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.1] LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:26:41 GMT)
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.1] LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:26:41 GMT)
Cardiac Copilot: Automatic Probe Guidance for Echocardiography with World Model [66.4] 心臓の複雑な構造と重要な手術上の課題のため、経験豊富なソノグラフィーが不足している。
本稿では,リアルタイムなプローブ移動誘導が可能なCardiac Copilotシステムを提案する。
中心となるイノベーションは、心臓の空間構造を表現するためのデータ駆動の世界モデル、Cardiac Dreamerの提案である。
実世界の超音波データとそれに対応するプローブの動きを,3人のソノグラフィーによる151Kサンプル対を用いた110の定期的な臨床スキャンからトレーニングする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:25:57 GMT)
Faster Cascades via Speculative Decoding [66.2] カスケードと投機的復号化は、言語モデルの推論効率を改善するためのアプローチである。
提案手法は,投機的実行による推論規則を実装した新しい投機的カスケード手法である。
我々の手法は、カスケードや投機的復号化ベースラインよりもコスト品質のトレードオフが優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:12:44 GMT)
AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models [65.9] 大型言語モデル(LLM)は、しばしば誤った知識や時代遅れの知識による幻覚を示す。
パラメータに適用する前に、保存された知識のnull空間に摂動を投影する新しいソリューションであるAlphaEditを紹介する。
我々は,この予測が保存知識を問うと,後編集後のLLMの出力が変化しないことを理論的に証明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:32:56 GMT)
AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models [65.9] 大型言語モデル(LLM)は、しばしば誤った知識や時代遅れの知識による幻覚を示す。
パラメータに適用する前に、保存された知識のnull空間に摂動を投影する新しいソリューションであるAlphaEditを紹介する。
我々は,この予測が保存知識を問うと,後編集後のLLMの出力が変化しないことを理論的に証明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:32:56 GMT)
LLM-based Optimization of Compound AI Systems: A Survey [64.4] 複合AIシステムでは、LLMコール、レトリバー、コードインタプリタ、ツールなどのコンポーネントが相互接続される。
近年の進歩により, LLM を用いたパラメータのエンドツーエンド最適化が可能となった。
本稿では,複合AIシステムのLCMに基づく最適化の原理と動向について述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:06:25 GMT)
BPO: Staying Close to the Behavior LLM Creates Better Online LLM Alignment [64.4] 選好からの直接アライメント(DAP)は、事前コンパイルされたオフライン選好データセットからヒトデシダラタに大型言語モデル(LLM)をアライメントするための有望なパラダイムとして登場した。
オンライントレーニングのパワーをフル活用するために、特定のオンラインDAPアルゴリズムを開発する必要性を強調します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:54 GMT)
Selecting Influential Samples for Long Context Alignment via Homologous Models' Guidance and Contextual Awareness Measurement [62.9] 本稿では,長距離依存関係に富む影響力のある,高品質なサンプルを識別する新しいフレームワークを提案する。
我々は、長距離依存を効果的にフレーム化するために、影響力のあるデータとして最も難しいサンプルを選択する。
実験により, GATEAUは長距離依存関係に富んだサンプルを効果的に同定し, これらのサンプルに基づいて訓練したモデルにより, より優れた指示追従と長文理解能力を示すことが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:30:53 GMT)
PUMA: Empowering Unified MLLM with Multi-granular Visual Generation [62.7] 統一MLLMと多言語視覚生成を併用したPUMAを提案する。
PUMAはMLLMの入力と出力の両方としてマルチグラニュラ視覚特徴を統一する。
この研究は、様々な視覚的タスクの粒度要求に適応できる真に統一されたMLLMに向けた重要なステップである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:42:46 GMT)
Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.7] 時間差差(TD)学習は、おそらく政策評価に最も広く使用されるものであり、この目的の自然な枠組みとして機能する。
本稿では,Polyak-Ruppert平均化と線形関数近似によるTD学習の整合性について検討し,既存の結果よりも3つの重要な改善点を得た。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:34:44 GMT)
Chain of Ideas: Revolutionizing Research in Novel Idea Development with LLM Agents [62.4] 科学文献の急激な増加は、研究者が最近の進歩と意義ある研究方向を見極めるのを困難にしている。
大規模言語モデル(LLM)の最近の発展は、新しい研究のアイデアを自動生成するための有望な道のりを示唆している。
本研究では, チェーン構造に関連文献を整理し, 研究領域の進展を効果的に反映する, LLMベースのエージェントであるChain-of-Ideas(CoI)エージェントを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:36:05 GMT)
Granularity Matters in Long-Tail Learning [62.3] より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:06:21 GMT)
Long-distance Geomagnetic Navigation in GNSS-denied Environments with Deep Reinforcement Learning [62.2] 既存の地磁気航法の研究は、事前保存された地図や広範囲な探索に依存しており、探索されていない地域での適用性や航法効率の低下に繋がる。
本稿では,特に長距離地磁気航法における深部強化学習(DRL)に基づくメカニズムについて述べる。
設計されたメカニズムは、プリストアドマップや広範囲で高価な探索アプローチではなく、地磁気ナビゲーションのための磁気受容能力を学ぶようにエージェントを訓練する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:57:42 GMT)
LiOn-XA: Unsupervised Domain Adaptation via LiDAR-Only Cross-Modal Adversarial Training [61.3] LiOn-XAは、LiDAR-Only Cross-Modal (X)学習と3D LiDARポイントクラウドセマンティックセマンティックセグメンテーションのためのAdversarial Trainingを組み合わせた、教師なしドメイン適応(UDA)アプローチである。
3つの現実的適応シナリオに関する実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:50:17 GMT)
Gradient Normalization with(out) Clipping Ensures Convergence of Nonconvex SGD under Heavy-Tailed Noise with Improved Results [60.9] 本稿では,NSGDCを含まない勾配正規化(NSGDC-VR)について検討する。
両アルゴリズムの理論的結果の大幅な改善について述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:40:42 GMT)
Towards Realistic Data Generation for Real-World Super-Resolution [58.9] RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:57:29 GMT)
Beyond Browsing: API-Based Web Agents [58.4] APIベースのエージェントはWebArenaの実験でWebブラウジングエージェントを上回っている。
ハイブリッドエージェント(Hybrid Agents)は、タスク全体にわたって、ほぼ均一にパフォーマンスを向上する。
結果から,APIが利用可能であれば,Webブラウジングのみに依存するという,魅力的な代替手段が提示されることが強く示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:46:06 GMT)
RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives [58.2] 本稿では,RACCooNを提案する。
ビデオ生成モデルは、自動生成された物語や指示を取り入れて、生成されたコンテンツの質と精度を高める。
提案フレームワークは,ビデオ・パラグラフ生成,映像コンテンツ編集において優れた多機能性を示し,さらに拡張するために他のSoTAビデオ生成モデルに組み込むことができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:18:37 GMT)
Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient [58.0] 大規模言語モデルを用いた最適化に基づく構造解析手法を提案する。
我々は,プルーニングモデルの損失を最適化することにより,確率空間におけるプルーニングマスクを直接学習する。
A100 GPUで13Bモデルに対して約35GBのメモリで2.7時間動作させる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:39:32 GMT)
Raising the Stakes: Performance Pressure Improves AI-Assisted Decision Making [57.5] 日常の人が共通のAI支援タスクを完了すると、パフォーマンスプレッシャーがAIアドバイスへの依存に与える影響を示す。
利害関係が高い場合には、AIの説明の有無にかかわらず、利害関係が低い場合よりもAIアドバイスを適切に使用することが分かりました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:39:52 GMT)
Warped Diffusion: Solving Video Inverse Problems with Image Diffusion Models [56.7] 我々は、フレームを2次元空間における連続関数と見なし、ビデオは異なるフレーム間の連続的なワープ変換の列と見なす。
この観点から,画像上でのみ関数空間拡散モデルを訓練し,時間的に相関した逆問題を解くことができる。
本手法により,ビデオ逆問題を解決するために,安定拡散XLのような最先端の潜伏拡散モデルを展開することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:19:34 GMT)
Weighted Diversified Sampling for Efficient Data-Driven Single-Cell Gene-Gene Interaction Discovery [56.6] 本稿では,遺伝子・遺伝子相互作用の探索に先進的なトランスフォーマーモデルを活用する,データ駆動型計算ツールを活用した革新的なアプローチを提案する。
新たな重み付き多様化サンプリングアルゴリズムは、データセットのたった2パスで、各データサンプルの多様性スコアを算出する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:35:23 GMT)
Sketch2Code: Evaluating Vision-Language Models for Interactive Web Design Prototyping [56.0] 初歩的なスケッチのWebページプロトタイプへの変換を自動化する上で,最先端のビジョン言語モデル(VLM)を評価するベンチマークであるSketch2Codeを紹介した。
我々は、既存のVLMではSketch2Codeが困難であることを示す10の商用およびオープンソースモデルを分析した。
UI/UXの専門家によるユーザ調査では、受動的フィードバックの受信よりも、積極的に質問を行うのがかなり好まれている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:39:49 GMT)
Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages [55.4] 本稿では,39言語にまたがる多様な6M命令データセットに基づいて訓練された多言語多言語多言語大言語モデル(MLLM)であるPangeaを紹介する。
P Pangeaは、多言語設定や多様な文化的コンテキストにおいて、既存のオープンソースモデルよりも大幅に優れています。
我々は、包括的で堅牢な多言語MLLMの開発を容易にするために、データ、コード、訓練されたチェックポイントを完全にオープンソースにしています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:19:41 GMT)
CinePile: A Long Video Question Answering Dataset and Benchmark [55.3] 我々は、CinePileという新しいデータセットとベンチマークを提示する。
包括的データセットは305,000の多重選択質問(MCQ)から構成されており、様々な視覚的・マルチモーダル的な側面をカバーしている。
トレーニングスプリットに関して、オープンソースのVideo-LLMを微調整し、データセットのテストスプリット上で、オープンソースとプロプライエタリなビデオ中心LLMの両方を評価しました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:08:08 GMT)
Time series and the meaning of quantum non-locality [55.2] ベルの不等式の導出は、量子非局所性の概念に正確な意味を与える。
また、光信号よりも高速に使用するのがなぜ不可能なのかも明らかである。
ベルの不等式に違反したとしても、一連の結果は常に実データと反実データに埋め込まれることが示されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:49:47 GMT)
Can Large Audio-Language Models Truly Hear? Tackling Hallucinations with Multi-Task Assessment and Stepwise Audio Reasoning [55.2] 大規模な音声言語モデル (LALM) は、音声および音声情報の理解と推論に優れた能力を示している。
これらのモデルは、既存の音のイベントを幻覚させ、音のイベントの順序を誤認し、誤って音源を帰属させるなど、依然として課題に直面している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:55:27 GMT)
To the Globe (TTG): Towards Language-Driven Guaranteed Travel Planning [54.9] To the Globe(TTG)は、ユーザから自然言語要求を受け取り、それをシンボリックフォームに変換するリアルタイムのデモシステムである。
システム全体の応答に5秒を要し、保証されたイテナリでユーザ要求に応答する。
ユーザによる評価では、TTGは生成した繰り返しで35-40%のネットプロモータースコア(NPS)を一貫して達成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:30:05 GMT)
Pre-training Distillation for Large Language Models: A Design Space Exploration [54.7] 予習蒸留は、大きな教師モデルからより小さな学生モデルに知識を移すことを目的としている。
我々は, プレトレーニング蒸留の設計空間を探索し, より良い構成を求める実験を行った。
我々は, 設計分野の探究が, 予修蒸留の今後の実践に影響を及ぼすことを期待している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:16:13 GMT)
Surprise! Uniform Information Density Isn't the Whole Story: Predicting Surprisal Contours in Long-form Discourse [54.1] 話者は、階層的に構造化された談話モデル内の位置に基づいて、情報率を変調する。
階層的予測器は談話の情報輪郭の重要な予測器であり,深い階層的予測器は浅い予測器よりも予測力が高いことがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:42:37 GMT)
Zero-Shot Scene Reconstruction from Single Images with Deep Prior Assembly [54.0] ゼロショット方式で1枚の画像からシーンを再構成するための大規模モデルから多様な奥行きを組み立てる新しいフレームワークであるDeep Pre Assemblyを提示する。
深い事前アセンブリは、タスクで3Dまたは2Dデータ駆動のトレーニングを一切必要とせず、オープンワールドシーンへの事前の一般化において優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:58:19 GMT)
Generating Physically-Consistent Satellite Imagery for Climate Visualizations [53.6] 我々は,将来的な洪水や森林再生イベントの合成衛星画像を作成するために,生成的敵ネットワークを訓練する。
純粋なディープラーニングベースのモデルでは、洪水の可視化を生成することができるが、洪水の影響を受けない場所では幻覚的な洪水が発生する。
我々は,地球観測におけるセグメンテーションガイドによる画像と画像の変換のためのコードとデータセットを公開している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:50:51 GMT)
A Comprehensive Survey of Data Augmentation in Visual Reinforcement Learning [53.4] データ拡張(DA)は、サンプル効率と一般化可能なポリシーを取得するために視覚的RLで広く使われている技術である。
本稿では、視覚的RLで使用されている既存の拡張技法の原則的な分類法を提案し、拡張データをどのように活用するかを詳細に議論する。
視覚的RLにおけるDAに関する最初の総合的な調査として、この研究は、この新興分野に貴重なガイダンスを提供するものと期待されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:11:42 GMT)
Decomposing and Interpreting Image Representations via Text in ViTs Beyond CLIP [53.2] 私たちは、CLIP以外のViTにおける様々なコンポーネントの役割を識別できる一般的なフレームワークを紹介します。
また,特定の特徴について重要な要素をランク付けするための新しいスコアリング機能も導入する。
フレームワークをさまざまなViT変種に適用することで、特定の画像機能に関するさまざまなコンポーネントの役割について、洞察を得ることができます。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:25:44 GMT)
On conditional diffusion models for PDE simulations [53.0] スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:31:04 GMT)
SHIELD: LLM-Driven Schema Induction for Predictive Analytics in EV Battery Supply Chain Disruptions [52.9] ShiELDは、大型言語モデル(LLM)とEVバッテリサプライチェーンリスクアセスメントのためのドメインの専門知識を組み合わせたものだ。
365の資料(2022-2023)から12,070段落を評価したところ、ShiELDは破壊予測においてベースラインGCNとLLM+prompt法より優れていた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:17:41 GMT)
Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces [52.6] 連続オフライン強化学習(CORL)は拡散に基づく生涯学習システムにおいて顕著な能力を示した。
本稿では,Vector-Quantized Continual diffuser(VQ-CD)を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:13:45 GMT)
A Comprehensive Survey of Datasets, Theories, Variants, and Applications in Direct Preference Optimization [52.4] DPO(Direct Preference Optimization)は、アライメントのための有望なアプローチとして登場した。
DPOの様々な進歩と固有の制限にもかかわらず、これらの側面の詳細なレビューは現在、文献に欠けている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:27:24 GMT)
Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.4] 双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。
BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:27:00 GMT)
DMM: Distributed Matrix Mechanism for Differentially-Private Federated Learning using Packed Secret Sharing [51.3] フェデレーテッド・ラーニング(FL)は最近、産業とアカデミックの両方で多くの注目を集めています。
FLでは、機械学習モデルは、複数のラウンドにまたがって委員会に配置されたさまざまなエンドユーザのデータを使用して訓練される。
このようなデータは、しばしばセンシティブであるため、FLの主な課題は、モデルの実用性を維持しながらプライバシを提供することである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:25:14 GMT)
PointSeg: A Training-Free Paradigm for 3D Scene Segmentation via Foundation Models [51.2] 我々は、市販の視覚基盤モデルを利用して、3Dシーン認識タスクに対処する学習自由パラダイムであるPointSegを提案する。
PointSegは正確な3Dプロンプトを取得してフレーム間で対応するピクセルを調整することで、任意の3Dシーンを分割することができる。
ScanNet、ScanNet++、KITTI-360データセット上の14.1$%、12.3$%、12.6$%のmAPは、最先端のトレーニングフリーモデルを大きく上回っている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:44:01 GMT)
Multi-IF: Benchmarking LLMs on Multi-Turn and Multilingual Instructions Following [51.2] Multi-IFは,大規模言語モデルの習熟度を多元的および多言語的指示に従って評価するための新しいベンチマークである。
Multi-IF 上での14の最先端 LLM の評価結果から,既存のベンチマークよりもはるかに難しい課題であることが判明した。
非ラテン文字(ヒンディー語、ロシア語、中国語)を持つ言語は一般的に高いエラー率を示し、モデルの多言語能力の潜在的な制限を示唆している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:59:47 GMT)
On the Role of Context in Reading Time Prediction [50.9] 我々は,リアルタイム言語理解において,読者がコンテキストをどのように統合するかについて,新たな視点を提示する。
提案手法は,言語単位の処理作業が文脈内情報の内容のアフィン関数であることを示す素因的理論に基づいている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:22:58 GMT)
On the Role of Context in Reading Time Prediction [50.9] 我々は,リアルタイム言語理解において,読者がコンテキストをどのように統合するかについて,新たな視点を提示する。
提案手法は,言語単位の処理作業が文脈内情報の内容のアフィン関数であることを示す素因的理論に基づいている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:22:58 GMT)
AssistantBench: Can Web Agents Solve Realistic and Time-Consuming Tasks? [50.4] 言語エージェントがWeb上で現実的で時間を要するタスクを実行できるかどうかを調査する。
自動評価が可能な214の現実的なタスクからなる新しいベンチマークであるAssistantBenchを紹介する。
我々は,AssistantBenchが,言語モデルや検索拡張言語モデルなど,現在のシステムの限界を明らかにすることを発見した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:45:31 GMT)
Automatic AI Model Selection for Wireless Systems: Online Learning via Digital Twinning [50.3] AIベースのアプリケーションは、スケジューリングや電力制御などの機能を実行するために、インテリジェントコントローラにデプロイされる。
コンテキストとAIモデルのパラメータのマッピングは、ゼロショット方式で理想的に行われる。
本稿では,AMSマッピングのオンライン最適化のための一般的な手法を紹介する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:07:13 GMT)
The formation of Schrodinger cat-like states in the process of spontaneous parametric down-conversion [50.2] 自然パラメトリックダウンコンバージョン過程(SPDC)におけるSchrodinger cat-like状態の形成について述べる。
非散逸的および散逸的体制下での基本モードおよび第二高調波モードにおけるシュロディンガー猫様状態の形成を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:11:43 GMT)
Log Probabilities Are a Reliable Estimate of Semantic Plausibility in Base and Instruction-Tuned Language Models [50.2] 意味的妥当性を評価するため,LogProbsの有効性と基本的なプロンプトを評価した。
LogProbsは、直接ゼロショットプロンプトよりも、より信頼性の高いセマンティックな妥当性を提供する。
我々は,プロンプトベースの評価の時代においても,LogProbsは意味的妥当性の有用な指標である,と結論付けた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:25:48 GMT)
CausalGraph2LLM: Evaluating LLMs for Causal Queries [49.3] 因果関係は科学研究において不可欠であり、研究者は変数間の真の関係を解釈することができる。
近年のLarge Language Models (LLMs) の発展に伴い,因果推論の能力を探究することへの関心が高まっている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:12:21 GMT)
Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.7] 本稿では,人間とロボットの協調学習システムについて紹介する。
これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。
これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:56:23 GMT)
Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.7] 本稿では,人間とロボットの協調学習システムについて紹介する。
これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。
これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:56:23 GMT)
Long Term Memory: The Foundation of AI Self-Evolution [48.5] GPTのような大規模な言語モデル(LLM)は、膨大なデータセットに基づいてトレーニングされており、言語理解、推論、計画において印象的な能力を示している。
ほとんどの研究は、より強力な基盤モデルを構築するために、より大規模なデータセットをトレーニングすることで、これらのモデルを強化することに重点を置いている。
大規模なトレーニングとは異なり、推論中にモデルを進化させることは、AIの自己進化(self-evolution)と呼ばれるプロセスと同等に重要である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:09:30 GMT)
Pruning Foundation Models for High Accuracy without Retraining [48.3] 基礎モデルや大規模言語モデル(LLM)の展開は、膨大なパラメータと計算量のために困難である。
ワンショットでLLMを再訓練せずにプルーンする訓練後プルーニング法が提案されている。
本実験は,SOTAベースラインと比較して提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:23:34 GMT)
InternLM2.5-StepProver: Advancing Automated Theorem Proving via Expert Iteration on Large-Scale LEAN Problems [47.9] InternLM2.5-SteperはMiniF2F、Lean-Workbook-Plus、ProofNet、Patnamベンチマークのオープンソースステート・オブ・ザ・アートを実現している。
MiniF2Fテストでは65.9%をパスし、Lean-Workbook-Plusの17.0%の問題を証明(あるいは否定)している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:18:23 GMT)
Limit Theorems for Stochastic Gradient Descent with Infinite Variance [47.9] この勾配降下アルゴリズムは、適切なL'evy過程によって駆動されるオルンシュタイン-ルンシュタイン過程の定常分布として特徴付けられることを示す。
また、これらの結果の線形回帰モデルおよびロジスティック回帰モデルへの応用についても検討する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:39:10 GMT)
Large Deviations and Improved Mean-squared Error Rates of Nonlinear SGD: Heavy-tailed Noise and Power of Symmetry [47.7] 本研究では,オンライン環境における非線形凸勾配法の一般的な枠組みを,大偏差と平均二乗誤差(MSE)で保証する。
重騒音対称密度関数の存在下での広帯域ステップサイズに対する強い結果を与える。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:50:57 GMT)
A Statistical View of Column Subset Selection [47.7] 大規模データセットから代表変数の小さなサブセットを選択することの問題点を考察する。
提案手法では,(1)元のデータセットからの要約統計データのみを用いてCSSを効率的に実行する方法,(2)欠落データや検閲データの存在下でCSSを実行する方法,(3)仮説テストフレームワークでCSSのサブセットサイズを選択する方法を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:07:11 GMT)
A call for frugal modelling: two case studies involving molecular spin dynamics [47.4] 理論家にとって、これはアルゴリズムを最適化し、計算効率を向上させるだけでなく、モデリングに厳密なアプローチを採用することを含む。
どちらの例でも、計算的に高価なバージョンのモデルが公開された。
コミュニティとして、この方向に改善の余地はたくさんあります。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:41:42 GMT)
MNIST-Nd: a set of naturalistic datasets to benchmark clustering across dimensions [46.7] 実世界のデータセットの重要な特性を共有する合成データセットの集合であるMNIST-Ndを提案する。
MNIST-NdはMNIST上で2から64の潜伏次元を持つ混合変分オートエンコーダによって得られる。
MNIST-Ndの予備的な共通クラスタリングアルゴリズムベンチマークは、ライデンが成長する次元に対して最も堅牢であることを示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:51:30 GMT)
Point-PEFT: Parameter-Efficient Fine-Tuning for 3D Pre-trained Models [46.4] 我々は、最小限の学習可能なパラメータを持つポイントクラウド事前学習モデルに適用するための新しいフレームワークであるPoint-PEFTを紹介する。
具体的には、事前訓練された3Dモデルに対して、パラメータの大部分を凍結し、新たに追加されたPEFTモジュールを下流タスクでチューニングする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:49:59 GMT)
Provable Acceleration of Nesterov's Accelerated Gradient for Rectangular Matrix Factorization and Linear Neural Networks [46.0] 我々はネステロフの加速勾配が複雑性$O(kappalogfrac1epsilon)$に達することを証明している。
特に,NAGが線形収束速度を加速できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:33:44 GMT)
Provable Acceleration of Nesterov's Accelerated Gradient for Rectangular Matrix Factorization and Linear Neural Networks [46.0] 我々はネステロフの加速勾配が複雑性$O(kappalogfrac1epsilon)$に達することを証明している。
特に,NAGが線形収束速度を加速できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:33:44 GMT)
Joint Sensing and Semantic Communications with Multi-Task Deep Learning [45.6] 本稿では,協調センシングとコミュニケーションのための深層学習技術の統合と,セマンティックコミュニケーションの拡張について検討する。
統合システムは、無線チャンネル上で動作し、ノイズやフェーディングを受ける送信機と受信機とを備える。
送信機はディープニューラルネットワーク(DNN)、すなわちエンコーダを使用し、ソース符号化、チャネル符号化、変調のジョイント操作を行う。
受信機は別のDNN、すなわちデコーダを使用して、復調、チャネル復号、ソース復号のジョイント操作を行い、データサンプルを再構築する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:30:03 GMT)
Low-degree learning and the metric entropy of polynomials [45.0] 少なくとも$Omega(sqrtvarepsilon)2dlog n leq log mathsfM(mathscrF_n,d,|cdot|_L,varepsilon)は2辺の推定値$c(1-varepsilon)2dlogを満たす。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:58:20 GMT)
Hierarchical analytical approach to universal spectral correlations in Brownian Quantum Chaos [45.0] 量子カオスの0次元ブラウンモデルにおけるスペクトル形状因子と時間外順序相関器の解析的アプローチを開発する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:56:49 GMT)
Cryogenic Control and Readout Integrated Circuits for Solid-State Quantum Computing [45.0] 低温集積回路(ICs)は、室温エレクトロニクスの代替となる可能性がある。
低温で作動すると 電子ノイズが抑制され クビット制御精度が向上する
CMOS ICでは、低温電界効果トランジスタの信頼性が低いため、回路設計の不確かさが生じる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:15:45 GMT)
Efficient Few-shot Learning for Multi-label Classification of Scientific Documents with Many Classes [44.5] FusionSentは、多くのクラスで科学文書を数ショットで分類するための効率的かつ迅速なアプローチである。
実験の結果、FusionSentは平均6.0$$F_1$labelポイントで強いベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:41:54 GMT)
Efficient Few-shot Learning for Multi-label Classification of Scientific Documents with Many Classes [44.5] FusionSentは、多くのクラスで科学文書を数ショットで分類するための効率的かつ迅速なアプローチである。
実験の結果、FusionSentは平均6.0$$F_1$labelポイントで強いベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:41:54 GMT)
Efficient Few-shot Learning for Multi-label Classification of Scientific Documents with Many Classes [44.5] FusionSentは、多くのクラスで科学文書を数ショットで分類するための効率的かつ迅速なアプローチである。
実験の結果、FusionSentは平均6.0$$F_1$labelポイントで強いベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:41:54 GMT)
SMART: Self-learning Meta-strategy Agent for Reasoning Tasks [44.5] SMART(Self-learning Meta-Strategy Agent for Reasoning Tasks)は、LMが様々な推論タスクの最も効果的な戦略を学習し、選択できる新しいフレームワークである。
我々は、戦略選択プロセスをマルコフ決定プロセスとしてモデル化し、強化学習による継続的自己改善を活用する。
実験の結果,SMARTは外部ガイダンスを使わずに最適な戦略を選択する能力を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:55:04 GMT)
FoundTS: Comprehensive and Unified Benchmarking of Foundation Models for Time Series Forecasting [44.3] 時系列予測(TSF)は、金融、気象サービス、エネルギー管理など、多くの分野で重要な機能である。
ファンデーションモデルは、新しいまたは見えないデータで有望な推論機能を示す。
そこで我々は,そのようなモデルの徹底的かつ公平な評価と比較を可能にする新しいベンチマーク FoundTS を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:11:07 GMT)
A Survey of Conversational Search [44.1] 会話検索における最近の進歩と今後の方向性について検討する。
これらのシステムの拡張において,大規模言語モデル(LLM)の統合を強調した。
我々は,現実のアプリケーションに対する洞察と,現在の対話型検索システムの堅牢な評価を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:54:46 GMT)
Simplicity Bias via Global Convergence of Sharpness Minimization [43.7] ラベルノイズSGDは、2層ネットワークにおける損失ゼロのモデル多様体のシャープネスを常に最小化することを示す。
また、ゼロ損失多様体上の近似定常点における損失のヘッセンのトレースの新たな性質も見いだす。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:10:37 GMT)
Fool Me Once? Contrasting Textual and Visual Explanations in a Clinical Decision-Support Setting [43.1] 視覚的説明(可用性マップ)、自然言語の説明、両方のモダリティの組み合わせの3種類の説明を評価した。
テキストに基づく説明は、高い信頼度をもたらすことが分かっており、従順マップと組み合わせることで軽減される。
また、説明の質、すなわち、それがどれだけ事実的に正しい情報であり、それがAIの正しさとどの程度一致しているかが、異なる説明タイプの有用性に大きく影響していることも観察します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:11:11 GMT)
Mitigating Biases of Large Language Models in Stance Detection with Counterfactual Augmented Calibration [43.0] 大規模言語モデル (LLM) は、スタンス検出を含む様々な自然言語処理タスクにおいて顕著な進歩を示している。
姿勢検出におけるそれらの性能は、データ駆動性に起因するバイアスと刺激的な相関によって制限される。
本稿では,LCMの姿勢予測における潜在的なバイアスをキャリブレーションする新たなキャリブレーションネットワークであるFACTUALを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:42:55 GMT)
One2set + Large Language Model: Best Partners for Keyphrase Generation [43.0] キーワード生成(KPG)は、与えられたドキュメントの中核概念を表すフレーズの集合を自動的に生成することを目的としている。
KPGを2つのステップに分解するジェネレータ-then-selectフレームワークを導入し、候補を生成するために12setベースのモデルをジェネレータとして採用し、LLMをセレクタとして使用し、これらの候補からキーフレーズを選択する。
我々のフレームワークは最先端のモデル、特にキーフレーズの欠如をはるかに上回っている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:43:50 GMT)
One2set + Large Language Model: Best Partners for Keyphrase Generation [43.0] キーワード生成(KPG)は、与えられたドキュメントの中核概念を表すフレーズの集合を自動的に生成することを目的としている。
KPGを2つのステップに分解するジェネレータ-then-selectフレームワークを導入し、候補を生成するために12setベースのモデルをジェネレータとして採用し、LLMをセレクタとして使用し、これらの候補からキーフレーズを選択する。
我々のフレームワークは最先端のモデル、特にキーフレーズの欠如をはるかに上回っている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:43:50 GMT)
How Well Do LLMs Handle Cantonese? Benchmarking Cantonese Capabilities of Large Language Models [42.8] 8500万人以上の人々が話していた カントン語のような表現不足言語は 著しい発展のギャップに直面しています
広範に使われているにもかかわらず、カントン語はNLP研究において、特に同様の発展途上国の他の言語と比較して、スカンプト表現を持っている。
我々は、現在のカントンNLP法の概要と、実数生成、数学的論理、複素推論、およびカントンにおける一般知識におけるLLMの性能を評価するために設計された新しいベンチマークを紹介する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:30:07 GMT)
Diffusion Models as Constrained Samplers for Optimization with Unknown Constraints [42.5] 拡散モデルを用いてデータ多様体内で最適化を行う。
目的関数の微分可能性に応じて,2つの異なるサンプリング手法を提案する。
提案手法は,従来の最先端のベースラインよりも優れた,あるいは同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:06:02 GMT)
Do Audio-Language Models Understand Linguistic Variations? [42.2] Open-vocabulary Audio Language Model (ALM)は、自然言語クエリを用いた音声テキスト検索の新しいパラダイムである。
本稿では,言語変化に対する音声表現を学習するための新しい,計算効率の高い手法であるRobostCLAPを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:55:33 GMT)
Unconstrained Model Merging for Enhanced LLM Reasoning [42.1] 複数のエキスパートモデルをひとつの大きな言語モデルにマージする可能性について検討する。
等質なモデルアーキテクチャと異質なモデルアーキテクチャの両方に対応可能な,制約のないモデルマージフレームワークを提案する。
7つのベンチマークと9つの推論最適化LDMで、推論がマージから出現する重要な発見を明らかにする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:12:26 GMT)
Motion Segmentation for Neuromorphic Aerial Surveillance [42.0] イベントカメラは優れた時間分解能、優れたダイナミックレンジ、最小限の電力要件を提供する。
固定間隔で冗長な情報をキャプチャする従来のフレームベースのセンサーとは異なり、イベントカメラは画素レベルの明るさ変化を非同期に記録する。
本稿では,イベントデータと光フロー情報の両方に自己監督型視覚変換器を利用する動き分割手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:34:04 GMT)
Domain-Adaptive Neural Posterior Estimation for Strong Gravitational Lens Analysis [41.9] 非教師なし領域適応(UDA)と併用した神経後部推定(NPE)の有効性について検討した。
UDAとNPEを組み合わせることで,推定精度が1~2桁向上することがわかった。
この組み合わせによって、NPEモデルの実際の観測データへの将来的な応用が期待できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:12:39 GMT)
A Theoretical Understanding of Chain-of-Thought: Coherent Reasoning and Error-Aware Demonstration [41.9] ステップワイズICLと比較して、前段からの推論が統合された場合、トランスフォーマーはより優れた誤り訂正能力とより正確な予測が得られることを示す。
実演において,正しい推論経路と誤った推論経路の両方を組み込むことにより,CoTの改善を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:07:20 GMT)
MagicPIG: LSH Sampling for Efficient LLM Generation [41.8] 以上の結果から,TopKの注意力自体が特定の下流タスクの品質低下に悩まされていることが分かる。
局所感性ハッシュ(LSH)に基づく異種システムMagicPIGを提案する。
MagicPIGは、さまざまなタスクに対して高い精度を維持しながら、注意の負荷を大幅に削減する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:44:51 GMT)
Latent Skill Discovery for Chain-of-Thought Reasoning [41.4] Chain-of-Thoughting(CoT)プロンプトは、大規模言語モデル(LLM)のための一般的なコンテキスト内学習手法である。
本稿では、教師なし学習を用いて有理数の潜在空間表現を生成するLaRS(Lalatnt Reasoning Skills)という新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:21:59 GMT)
Identifying Sub-networks in Neural Networks via Functionally Similar Representations [41.0] 我々は、異なるサブネットワークの存在を調査し、ネットワークの理解を自動化するための一歩を踏み出した。
我々のアプローチは、人間と計算コストを最小限に抑えたニューラルネットワークの振る舞いに関する有意義な洞察を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:19:00 GMT)
Agent-to-Sim: Learning Interactive Behavior Models from Casual Longitudinal Videos [39.8] Agent-to-Sim(ATS)は、カジュアルな縦長ビデオコレクションから3Dエージェントの対話的行動モデルを学ぶためのフレームワークである。
本研究では,標準3次元空間を通してエージェントとカメラを時間とともに追跡する粗大な登録手法を開発した。
次に,4次元再構成から検索したエージェントの知覚と運動のペアデータを用いて,エージェント行動の生成モデルを訓練する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:57:50 GMT)
TALoS: Enhancing Semantic Scene Completion via Test-time Adaptation on the Line of Sight [39.8] 本稿では,セマンティック・シーン・コンプリートのための新しいテスト時間適応手法であるTALoSを紹介する。
我々は、ある瞬間に行われた観察が、別の瞬間にシーン完了のためのグラウンド・トゥルース(GT)として機能することに焦点を当てる。
本稿では,将来の観測が実現するまで更新を遅らせるモデルを用いた2つの最適化手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:37:13 GMT)
Numerical evaluation of orientation averages and its application to molecular physics [39.6] 分子物理学では、可観測物質を計算する際に分子の向きを平均化する必要があることが多い。
配向平均値の最良の2次法を選択するためのガイドラインを導出する。
また、様々な二次メソッドに柔軟なインターフェースを提供するPythonパッケージも提示する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:18:06 GMT)
INSIDE: LLMs' Internal States Retain the Power of Hallucination Detection [39.5] 本稿では,textbfinternal textbfStates内に保持される密接な意味情報について,HoluctextbfInation textbfDEtectionについて検討する。
応答の自己整合性をよりよく評価するために、単純で効果的な textbfEigenScore メトリクスが提案されている。
内部状態における極端なアクティベーションを阻害するために,テスト時間特徴クリッピング手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:10:50 GMT)
The First VoicePrivacy Attacker Challenge Evaluation Plan [39.3] First VoicePrivacy Attacker Challengeは、VoicePrivacyイニシアチブの一部として組織された新しいタイプのチャレンジであり、SP Grand ChallengeとしてICASSP 2025が支援している。
これは、VoicePrivacy 2024 Challengeに提出された一連の匿名化システムに対して評価される音声匿名化に対する攻撃システムの開発に焦点を当てている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:37:02 GMT)
The First VoicePrivacy Attacker Challenge Evaluation Plan [39.3] First VoicePrivacy Attacker Challengeは、VoicePrivacyイニシアチブの一部として組織された新しいタイプのチャレンジであり、SP Grand ChallengeとしてICASSP 2025が支援している。
これは、VoicePrivacy 2024 Challengeに提出された一連の匿名化システムに対して評価される音声匿名化に対する攻撃システムの開発に焦点を当てている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:37:02 GMT)
Exploring the Potential of Large Language Models for Heterophilic Graphs [38.8] 大規模言語モデル(LLM)を用いた異種グラフモデリングのための2段階フレームワークを提案する。
第1段階では、LLMを微調整して、ノードのテキスト内容に基づいて、同好および異好のエッジをより正確に識別する。
第2段階では,ノードの特徴,構造,ヘテロ親和性,ホモ親和性といった特徴に基づいて,異なるエッジタイプに対するGNNのメッセージ伝搬を適応的に管理する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:59:18 GMT)
Playground v3: Improving Text-to-Image Alignment with Deep-Fusion Large Language Models [38.5] 最新のテキスト・画像モデルであるPlayground v3(PGv3)を紹介します。
複数のテストベンチマークで最先端(SoTA)パフォーマンスを実現している。
テキストプロンプトの順守、複雑な推論、正確なテキストレンダリングが優れている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:01:13 GMT)
Generalizing Motion Planners with Mixture of Experts for Autonomous Driving [38.0] State Transformer-2は拡張性のあるデコーダのみのモーションプランナで、ViTエンコーダとMoE(Mix-of-experts)因果トランスフォーマーアーキテクチャを使用している。
我々は、ViTエンコーダとMix-of-experts(MoE)因果変換アーキテクチャを用いたスケーラブルでデコーダのみのモーションプランナであるStateTransformer-2(STR2)を紹介する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:36:25 GMT)
RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style [38.0] RM-Benchは、微妙な内容の違いに対する感度とスタイルバイアスに対する耐性に基づいて報酬モデルを評価するために設計された新しいベンチマークである。
RM-Bench上で40近い報酬モデルを評価し,最先端モデルでさえ平均性能は46.6%に過ぎなかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:48:26 GMT)
Algorithms and Sum-of-Squares Certificates for Qudit Hamiltonians Over Maximally Entangles States [38.0] 最大エンタングルメント問題の基底状態エネルギーを証明し、エンタングルメント境界のモノガミーを証明する。
単純なマッチングに基づくアルゴリズムは、一般グラフの基底状態エネルギーの少なくとも1/d$のエネルギーを出力する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:10:51 GMT)
No more hard prompts: SoftSRV prompting for synthetic data generation [37.6] 我々は、ターゲットとする合成テキストシーケンスを生成するためのソフトプロンプトベースの新しいフレームワーク、SoftSRVを提案する。
提案するフレームワークは,対象分布からサンプルを抽出し,データ駆動損失最小化を用いてパラメータ化した"コンテキスト"ソフトプロンプトを訓練する。
We found that SoftSRV improve on hard-prompting baselines, generated data with superior fine-tuning performance。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:48:49 GMT)
A Human-in-the-Loop Fairness-Aware Model Selection Framework for Complex Fairness Objective Landscapes [37.5] ManyFairHPOはフェアネスを意識したモデル選択フレームワークで、実践者が複雑でニュアンスのあるフェアネスの客観的な風景をナビゲートすることを可能にする。
我々は,複数のフェアネス目標のバランス,自己充足的予言などのリスク軽減,公平性を考慮したモデリング決定における利害関係者の導出のための解釈可能な洞察の提供などにおけるMaryFairHPOの有効性を実証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:00:06 GMT)
LDAdam: Adaptive Optimization from Low-Dimensional Gradient Statistics [37.2] 大規模なモデルをトレーニングするためのメモリ効率のよい勾配であるLDAdamを紹介する。
LDAdamは,言語モデルの精密かつ効率的な微調整と事前学習を可能にする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:31:06 GMT)
DISCO: Efficient Diffusion Solver for Large-Scale Combinatorial Optimization Problems [37.2] DISCOは、大規模な組合せ最適化問題に対する効率的な拡散解法である。
サンプリング空間は、解残基によって導かれるより有意義な領域に制約され、出力分布のマルチモーダルな性質は保たれる。
大規模なトラベリングセールスマン問題や最大独立セットのベンチマークに挑戦し、他の拡散手段よりも最大5.28倍の速度で推論を行う。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:38:48 GMT)
Towards Combating Frequency Simplicity-biased Learning for Domain Generalization [36.8] ドメイン一般化手法は、未知のターゲットドメインによく一般化できるソースドメインから、転送可能な知識を学習することを目的としている。
近年の研究では、ニューラルネットワークはしばしば、特定の周波数セットに対する過度な信頼につながる単純さに偏った学習行動に悩まされていることが示されている。
本稿では,データセットの周波数特性を協調的かつ適応的に調整する2つの効果的なデータ拡張モジュールを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:17:01 GMT)
Does your LLM truly unlearn? An embarrassingly simple approach to recover unlearned knowledge [36.5] 未学習のモデルに量子化を適用することで、「忘れられた」情報を復元できることを示す。
実用性制約のある未学習の手法では、未学習モデルは、意図された忘れられた知識の21%を完全な精度で保持する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:28:37 GMT)
LLM4GRN: Discovering Causal Gene Regulatory Networks with LLMs -- Evaluation through Synthetic Data Generation [36.5] 遺伝子制御ネットワーク(GRN)は、単一細胞RNAシークエンシング(scRNA-seq)データにおける転写因子(TF)と標的遺伝子間の因果関係を表す。
GRN発見のための大規模言語モデル(LLM)の可能性を検討する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:46:37 GMT)
CartesianMoE: Boosting Knowledge Sharing among Experts via Cartesian Product Routing in Mixture-of-Experts [36.4] Mixture-of-Experts(MoE)モデルは、トレーニングや推論コストを大幅に高めることなく、モデルのサイズを拡大可能にする。
MoEモデルは、専門家間の知識共有に関する課題に直面し、そのパフォーマンスをルーティング精度に何らかの敏感にする。
本稿では,より効果的な知識共有を実現するCartesianMoEを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:55:59 GMT)
On The Global Convergence Of Online RLHF With Neural Parametrization [36.2] Reinforcement Learning from Human Feedback (RLHF)は、大きな言語モデルと人間の価値を結びつけることを目的としている。
RLHFは、教師付き微調整、報酬学習、政策学習を含む3段階のプロセスである。
本稿では、パラメータ化設定におけるAIアライメントのための2段階の定式化を提案し、この問題を解決するための一階法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:13:35 GMT)
STAR: A Simple Training-free Approach for Recommendations using Large Language Models [36.2] 大規模言語モデル(LLM)の最近の進歩は、レコメンデーションシステム(RecSys)タスクに有望な新しいアプローチを提供する。
LLMを利用するフレームワークを提案し、微調整を必要とせずに様々なレコメンデーションタスクに適用できる。
本手法はHits@10のパフォーマンスが23.8%,Toys and Gamesが37.5%,Sports and Outdoorsが1.8%であった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:34:40 GMT)
A gradient-based approach to fast and accurate head motion compensation in cone-beam CT [35.4] 本稿では,勾配に基づく最適化アルゴリズムを用いたCBCT動作推定の新しい手法を提案する。
従来の手法に比べて19倍の速さで動き推定を劇的に高速化する。
運動補償後の初期平均3mmから0.61mmまでの再投射誤差を低減させる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:45:54 GMT)
Reward Maximization for Pure Exploration: Minimax Optimal Good Arm Identification for Nonparametric Multi-Armed Bandits [35.4] グッドアーム識別(グッドアームアイソレーション、英: Good Arm Identification、IGA)は、腕をできるだけ早くしきい値以上の手段でラベル付けすることを目的とした、実用的なバンドイット推論の目的である。
本稿では,報奨最大化サンプリングアルゴリズムと新たな非有意シーケンシャルテストを組み合わせることで,GAを効率よく解くことができることを示す。
我々の実験結果は、ミニマックス設定を超えるアプローチを検証し、すべての停止時間におけるサンプルの期待数を、合成および実世界の設定で少なくとも50%削減する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:19:23 GMT)
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections [35.1] 大規模言語モデル(LLM)は、最近、多くの言語処理タスクに対処するための強力なツールとして登場した。
勾配勾配勾配を用いた効率的なモデル収束に必要な重要な成分を同定し,特徴付ける。
この結果から, 微調整と事前学習の両方のための, 安価かつメモリ効率のよいアルゴリズムが得られた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:53:21 GMT)
Interactive Concept Learning for Uncovering Latent Themes in Large Text Collections [34.9] 本稿では,単なる単語分布以上のテーマの定義を拡大する。
本稿では,専門家のフィードバックをさまざまなレベルの抽象化で受け取り,エンコードする対話型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:34:27 GMT)
Improving the Multi-label Atomic Activity Recognition by Robust Visual Feature and Advanced Attention @ ROAD++ Atomic Activity Recognition 2024 [34.9] Road++ Track3は、トラフィックシナリオにおけるマルチラベルのアトミックアクティビティ認識タスクを提案する。
視覚的特徴抽出の堅牢性は依然として重要な課題である。
テストセットの最終mAPは58%で、チャレンジベースラインよりも4%高い。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:10:14 GMT)
Position: Challenges and Opportunities for Differential Privacy in the U.S. Federal Government [34.3] 我々は、連邦政府設定内での差分プライバシーの課題と機会の解明を目指しています。
我々は、現在米国政府における差分プライバシーの使用を制限している3つの重要な課題を強調します。
差分プライバシーが政府機関の能力を高める2つの例を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:46:05 GMT)
Linking Model Intervention to Causal Interpretation in Model Explanation [34.2] 直感的なモデル介入効果が因果解釈を持つ場合の条件について検討する。
この研究はモデルの介入効果とモデルの因果解釈を結びつける。
半合成データセットの実験は、定理を検証し、モデルの解釈にモデル介入効果を使用する可能性を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:16:59 GMT)
Reducing Hallucinations in Vision-Language Models via Latent Space Steering [34.1] 幻覚は、アプリケーションに大規模な視覚言語モデル(LVLM)を配置する上での課題である。
本稿では,視覚的特徴の安定性を高めるために,視覚とテクスチュアル・インターベンション(VTI, Visual and Textual Intervention)を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:42:30 GMT)
Causally Testing Gender Bias in LLMs: A Case Study on Occupational Bias [34.0] 生成言語モデルにおけるバイアス測定のための因果的定式化を導入する。
我々はOccuGenderというベンチマークを提案し、職業性バイアスを調査するためのバイアス測定手法を提案する。
以上の結果から,これらのモデルでは職業性バイアスがかなり大きいことが示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:55:36 GMT)
Information-Theoretic Minimax Regret Bounds for Reinforcement Learning based on Duality [33.9] エージェントの目的が堅牢なポリシーを見つけることにある未知の環境で行動するエージェントについて検討する。
我々は,異なる環境パラメータに対する最大後悔を最小化するエージェントについて検討し,ミニマックス後悔の研究につながった。
本研究はマルコフ決定過程におけるミニマックス後悔に対する情報理論的境界の導出に焦点を当てる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:45:02 GMT)
Unleashing the Potential of Multi-Channel Fusion in Retrieval for Personalized Recommendations [33.8] Recommender System(RS)の重要な課題は、大量のアイテムプールを効率的に処理して、厳格なレイテンシ制約の下で高度にパーソナライズされたレコメンデーションを提供することだ。
本稿では,各チャネルに最適化された重みを割り当てることで,先進的なチャネル融合戦略を検討する。
当社の手法はパーソナライズと柔軟性を両立させ,複数のデータセット間で大幅なパフォーマンス向上を実現し,現実のデプロイメントにおいて大きな成果を上げている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:58:38 GMT)
Diffusion Lens: Interpreting Text Encoders in Text-to-Image Pipelines [33.5] テキスト間拡散モデル(T2I)は、テキストプロンプトの潜在表現を用いて、画像生成プロセスを導く。
本稿では,その中間表現から画像を生成することによって,T2Iモデルのテキストエンコーダを解析するDiffusion Lensを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:38:03 GMT)
CARLA Drone: Monocular 3D Object Detection from a Different Perspective [33.3] この研究は、異なるカメラ視点で3D検出フレームワークを拡張評価することを提唱している。
我々は、CDroneというCARLA Droneデータセットを導入し、ドローンビューをシミュレートし、既存のベンチマークにおけるカメラ視点の多様性を大幅に拡大する。
我々は、GroundMixと呼ばれる効果的なデータ拡張パイプラインを開発し、その識別要素は、トレーニング画像の3D一貫性向上のためのグラウンドの利用である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:49:56 GMT)
End-to-End Rate-Distortion Optimized 3D Gaussian Representation [33.2] 本稿では,コンパクトな3次元ガウス学習をエンドツーエンドのレート・ディストーション最適化問題として定式化する。
動的プルーニングとエントロピー制約ベクトル量子化(ECVQ)を導入し、同時に速度と歪みを最適化する。
RDO-Gaussianが40倍の3Dガウスサイズを大幅に縮小することを示すため,実シーンと合成シーンの両方で本手法の有効性を確認した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:11:29 GMT)
ToW: Thoughts of Words Improve Reasoning in Large Language Models [33.1] 我々は,単語の思考(ToW)を導入し,次の単語予測のための訓練時間データ拡張手法を提案する。
ToWは、次の単語予測を中核的推論タスクとみなし、次の単語が何であるべきかを説明するきめ細かい思考を注入する。
モデル推論性能を平均で7%から9%改善し、モデル幻覚を最大10%低減する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:41:11 GMT)
BenTo: Benchmark Task Reduction with In-Context Transferability [32.6] 本稿では,大規模言語モデル(LLM)のベンチマークに使用するタスクを効率的に削減する方法を検討する。
In-context Learning (ICL) による2つのタスク間の伝達可能性を推定する実用的な指標を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:37:48 GMT)
DriveDreamer4D: World Models Are Effective Data Machines for 4D Driving Scene Representation [32.2] 本稿では,世界モデルの先行モデルを利用した4次元運転シーン表現を強化するDriveDreamer4Dを紹介する。
具体的には、実世界の運転データに基づいて、新しい軌跡映像を合成するために、ワールドモデルをデータマシンとして利用する。
われわれの知る限り、DriveDreamer4Dは、運転シナリオにおける4D再構成を改善するためにビデオ生成モデルを利用する最初の企業である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:15:37 GMT)
Aligning Translation-Specific Understanding to General Understanding in Large Language Models [32.0] 大規模言語モデル(LLM)は、複雑なテキストを理解する際、顕著な能力を示した。
本研究は,LLMにおける翻訳固有の理解と一般理解の相違を明らかにする。
本稿では, 難解な翻訳過程である DUAT (Difficult words Understanding Aligned Translation) を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:19:41 GMT)
Timetable Nodes for Public Transport Network [31.8] 時間依存トランスポートネットワークにおける高速パスフィニングは、ナビゲーションシステムにおいて重要かつ困難な問題である。
本稿では,計算幾何学と異なる最適化手法を用いて,グラフベースのアプローチを進化させる手法を提案する。
我々のソリューションは他の時間依存ネットワークに適合し、他のパスフィンディングアルゴリズムに統合できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:34:04 GMT)
Multi-head Sequence Tagging Model for Grammatical Error Correction [31.5] 文法的誤り訂正(英: Grammatical Error Correction, GEC)は、ソースシーケンスとターゲットシーケンスのマッピングである。
現在のシーケンスタギングアプローチでは、あるタスクにレーザーを集中させることで、幅広い文法的誤りを処理できるという問題がある。
本稿では,学習データを効果的に活用し,関連する課題訓練信号からの情報を活用するための,新しいマルチヘッド・マルチタスク学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:01:06 GMT)
Self-Contradictory Reasoning Evaluation and Detection [31.5] 本稿では,自己矛盾推論(Self-Contra)について考察する。
LLMは文脈情報理解や常識を含むタスクの推論において矛盾することが多い。
GPT-4は52.2%のF1スコアで自己コントラを検出できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:16:09 GMT)
Order-Optimal Global Convergence for Average Reward Reinforcement Learning via Actor-Critic Approach [31.3] これらの問題に対処するために,マルチレベルモンテカルロのNatural Actor-Critic (MLMC-NAC)アルゴリズムを導入する。
我々の手法は、混合時間の知識を必要とせず、初めて$tildemathcalO (1/sqrtT)$のグローバル収束率を達成したものである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:45:13 GMT)
R2I-rPPG: A Robust Region of Interest Selection Method for Remote Photoplethysmography to Extract Heart Rate [31.0] 新型コロナウイルス(COVID-19)のパンデミックは、接触のないバイタルサインを測定するための低コストでスケーラブルなアプローチの必要性を強調している。
遠隔検診(remote photoplethymography, R)は、健康なボランティアのクローズアップビデオに適用した場合の心拍数(HR)を正確に推定することができる。
医療におけるrの実践的応用における重要な障壁の1つは、関心領域の正確な局在である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:27:57 GMT)
WHoW: A Cross-domain Approach for Analysing Conversation Moderation [30.8] WHoWは、異なるドメイン/シナリオ間でモデレーターのファシリテーション戦略を分析するための評価フレームワークである。
我々は,テレビ討論会とラジオパネル討論という2つの領域から,5,657文を人間裁判官で,15,494文をGPT-4oで注視した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:54:31 GMT)
Refusal-Trained LLMs Are Easily Jailbroken As Browser Agents [30.8] 大規模言語モデル(LLM)は、危険な活動を支援するなど、有害なユーザ命令を拒否するように訓練されている。
我々は,非チャットおよびエージェントのユースケースに対して,所望の安全性の拒絶が一般化されるか,というオープンな問いについて検討する。
チャットボットとは異なり、LLMエージェントはウェブブラウザやモバイルデバイスのような汎用ツールを備えており、現実世界に直接影響を及ぼすことができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:06:58 GMT)
Extracting Spatiotemporal Data from Gradients with Large Language Models [30.8] グラデーションデータから更新できる最近のアップデートは、フェデレートされた学習における重要なプライバシーの約束を破る。
我々は,連合学習における攻撃を軽減するための適応型防衛戦略を提案する。
提案した防衛戦略は,時間的・時間的連合学習の有用性を効果的に保護し,有効に維持できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:48:34 GMT)
Enhancing SNN-based Spatio-Temporal Learning: A Benchmark Dataset and Cross-Modality Attention Model [30.7] 高品質なベンチマークデータセットは、ニューラルネットワーク(SNN)の発展に非常に重要である
しかし、SNNベースのクロスモーダル融合はまだ未定である。
本研究では,SNNの時間的特性をよりよく活用できるニューロモルフィックデータセットを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:59:04 GMT)
Quantum Algorithms for Non-smooth Non-convex Optimization [30.6] 本稿では、リプシッツ連続目的の$(,epsilon)$-Goldstein定常点を求める問題を考える。
代理オラクル関数に対するゼロ階量子推定器を構築する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:52:26 GMT)
Visual Representation Learning Guided By Multi-modal Prior Knowledge [30.0] 分布シフト下での一般化を改善するために,知識誘導型視覚表現学習(KGV)を提案する。
我々は,1)階層的および関連性を持つ知識グラフ(KG),2)KGで意味的に表現された視覚要素の合成画像を生成する。
KGVは全ての実験のベースラインよりも高い精度とデータ効率を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:06:38 GMT)
Mellivora Capensis: A Backdoor-Free Training Framework on the Poisoned Dataset without Auxiliary Data [29.8] 本稿では,現実シナリオにおけるバックドア攻撃対策の課題について述べる。
本稿では,モデルトレーナーが有毒なデータセット上でクリーンなモデルをトレーニングできるようにする,堅牢でクリーンなデータのないバックドア防御フレームワークであるMellivora Capensis(textttMeCa)を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:52:01 GMT)
Dullahan: Stealthy Backdoor Attack against Without-Label-Sharing Split Learning [29.8] 本稿では,非ラベル共有型スプリットラーニングアーキテクチャに適した,ステルスなバックドア攻撃戦略を提案する。
我々のSBATは、訓練中の中間パラメータの変更を控えることで、より高い攻撃ステルスネスを達成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:00:04 GMT)
Conflict-Aware Adversarial Training [29.8] 我々は、重み付け平均法は、標準的な性能と対向ロバスト性に対する最良のトレードオフを提供していないと論じる。
テキストbf競合認識適応訓練(CA-AT)という,標準と対向的損失の凸結合のための競合認識因子を用いた対向的トレーニングのための新たなトレードオフパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:44:03 GMT)
DiffNorm: Self-Supervised Normalization for Non-autoregressive Speech-to-speech Translation [29.8] 非自己回帰変換器(NAT)は音声から音声への直接変換システムに適用される。
拡散に基づく正規化戦略であるDiffNormを導入し、NATモデルをトレーニングするためのデータ分散を簡単にする。
CVSSベンチマークでは,英語・スペイン語(En-Es)では+7ASR-BLEU,英語・フランス語(En-Fr)では+2ASR-BLEUが顕著に改善した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:09:22 GMT)
Concentration of the Langevin Algorithm's Stationary Distribution [29.2] 任意の非自明な段数 $eta > 0$ に対して、$pi_eta$ はポテンシャルが凸であるときに部分指数であることを示す。
また、これらの濃度境界がランゲヴィンアルゴリズムの軌道に沿って全ての反復に広がることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:38:10 GMT)
StrucText-Eval: Evaluating Large Language Model's Reasoning Ability in Structure-Rich Text [29.0] 我々はStrucText-Evalという,構造化テキストによる大規模言語モデルの理解と推論の精度を評価するベンチマークを紹介した。
オープンソース LLM が標準データセットで74.9% の最大精度を達成する一方で、そのパフォーマンスはより難しいデータセットで45.8% に大幅に低下していることを示す。
対照的に、人間の参加者はStrucText-Eval-Hardで92.6%の精度に達し、複雑な構造情報を扱うLLMの現在の限界を強調している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:06:06 GMT)
Theoretical Limitations of Ensembles in the Age of Overparameterization [29.0] 最近の実証研究により、現代のニューラルネットワークのアンサンブルは、単一だが大きなニューラルネットワークに対して固有の一般化の利点を与えない可能性がある。
パラメータ化されたRF回帰器の無限アンサンブルが(単一の)無限幅RF回帰器と同値であることを証明する。
その結果、アンサンブルメンバー間の予測的ばらつきを特徴付けることができ、キャパシティの増大による期待効果を定量化できることを実証できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:03:20 GMT)
BIG5-CHAT: Shaping LLM Personalities Through Training on Human-Grounded Data [28.9] BIG5-CHATは、人間がいかに人格をテキストで表現するかのモデルを構築するために設計された10万の対話を含む大規模なデータセットである。
提案手法は,BFIやIPIP-NEOなどの人格評価に優れ,特徴相関は人的データとより密に一致している。
実験の結果,高良性,高良性,低外転,低神経障害を訓練したモデルでは,推論タスクの性能が向上することが判明した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:32:27 GMT)
How to Find the Exact Pareto Front for Multi-Objective MDPs? [28.7] 多目的マルコフ決定プロセス (MDPs) は、現実の意思決定問題は、単一目的のMDPでは対応できない相反する目的を伴うことが多いため、注目を集めている。
Paretoのフロントは、支配できないポリシーの集合を特定し、様々な好みに効率的に適応できる最適なソリューションを見つけるための基盤を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:03:54 GMT)
Onboard Satellite Image Classification for Earth Observation: A Comparative Study of ViT Models [28.7] 本研究は,衛星データ処理における土地利用分類において,最も効果的な事前学習モデルを特定することに焦点を当てた。
我々は、従来のCNNベース、ResNetベース、および様々な事前学習された視覚変換器モデルの性能を比較した。
特にMobileViTV2とEfficientViT-M2は,スクラッチからトレーニングしたモデルよりも精度と効率が優れていた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:15:51 GMT)
Joint Top-Down and Bottom-Up Frameworks for 3D Visual Grounding [28.6] 本稿では,テキスト記述に基づく3Dポイントクラウドシーンにおいて,特定の物体を位置決めする3次元視覚的グラウンディングの課題に取り組む。
既存のメソッドは、トップダウンとボトムアップの2つのカテゴリに分類される。
本稿では,効率を向上しながら性能を向上させることを目的とした,共同トップダウンとボトムアップのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:33:13 GMT)
Who's Who: Large Language Models Meet Knowledge Conflicts in Practice [28.5] 我々は、知識衝突状況におけるモデルの振る舞いを調べるためのベンチマークデータセットWhoQAを紹介する。
我々は、同じ名前のエンティティ間で共通の性質を問うことで対立を誘発し、その結果、最大8つの独特な答えが得られた。
実験の結果,WhoQA質問の単純さにもかかわらず,知識の矛盾はRAG設定におけるLLMの性能を著しく低下させることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:56:45 GMT)
Policy-driven Knowledge Selection and Response Generation for Document-grounded Dialogue [28.4] 文書地下対話(DGD)は、文書を対話生成のための外部知識として利用する。
本稿では,DGDにおける対話理解を支援するための対話ポリシーを提案する。
本稿では,DGDにおける2つのコアタスクに対して,対話ポリシーを利用した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:58:03 GMT)
RGMDT: Return-Gap-Minimizing Decision Tree Extraction in Non-Euclidean Metric Space [28.3] オラクルの専門家政策と最適決定木政策のリターンギャップの上限について紹介する。
これにより、各エージェントの局所的な観測と行動値空間上で、DT抽出問題を新しい非ユークリッドクラスタリング問題に再キャストすることができる。
また,Return-Gap-Minimization Decision Tree (RGMDT)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:19:49 GMT)
Generalized Group Data Attribution [28.1] データ属性法は、個々のトレーニングデータポイントがモデル出力に与える影響を定量化する。
既存のDAメソッドはしばしば計算集約的であり、大規模な機械学習モデルに適用性を制限する。
本稿では,GA(Generalized Group Data Attribution, GGDA)フレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:36:35 GMT)
Generalized Group Data Attribution [28.1] データ属性法は、個々のトレーニングデータポイントがモデル出力に与える影響を定量化する。
既存のDAメソッドはしばしば計算集約的であり、大規模な機械学習モデルに適用性を制限する。
本稿では,GA(Generalized Group Data Attribution, GGDA)フレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:36:35 GMT)
Building Better: Avoiding Pitfalls in Developing Language Resources when Data is Scarce [27.9] 与えられた言語のデータは、トークンの集まり以上のものと見なすべきである。
優れたデータ収集とラベル付けのプラクティスは、より人間中心で社会的に意識した技術を構築する上で鍵となる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:28:12 GMT)
Deconstructing The Ethics of Large Language Models from Long-standing Issues to New-emerging Dilemmas: A Survey [27.7] 大規模言語モデル(LLM)は近年,多種多様な言語モデリングタスクにおいて,相容れない成功を収めている。
本稿では,著作権侵害などの長年の課題から,真偽や社会規範といった新たな問題まで,LLMに関連する倫理的課題を包括的に調査する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:08:11 GMT)
MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework [27.5] マルチエージェントコラボレーションに効率的な人間を取り入れた,革新的なメタプログラミングフレームワークであるMetaGPTを紹介する。
MetaGPTは、より合理化された検証のために、SOP(Standardized Operating Procedures)をプロンプトシーケンスにエンコードする。
協調ソフトウェアエンジニアリングベンチマークでは、MetaGPTは従来のチャットベースのマルチエージェントシステムよりも一貫性のあるソリューションを生成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:22:45 GMT)
Building A Coding Assistant via the Retrieval-Augmented Language Model [27.5] 本研究では,コーディング中の人間の知識探索行動を模倣してコードアシスタントを構築するための検索補助言語モデル(CONAN)を提案する。
コード構造対応検索器(CONAN-R)とデュアルビューコード表現に基づく検索拡張生成モデル(CONAN-G)で構成される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:34:39 GMT)
Griffon-G: Bridging Vision-Language and Vision-Centric Tasks via Large Multimodal Models [27.5] CCMD-8Mを導入し、視覚中心のタスクと視覚言語タスクを統一する際のデータ障壁を克服する。
また、Griffon-Gは、単一のエンドツーエンドパラダイム内の視覚中心タスクと視覚言語タスクの両方に対処する一般的な大規模マルチモーダルモデルである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:30:29 GMT)
Scalable Data Ablation Approximations for Language Models through Modular Training and Merging [27.4] 本稿では,学習コーパスのサブセット上で個々のモデルを訓練するデータ短縮を効果的に近似する方法を提案する。
任意の評価セットが与えられた場合、候補データに基づいてトレーニングされた単一モデルのパープレキシティスコアは、そのデータの異なる分割に基づいてトレーニングされたモデルのパラメータ平均のパープレキシティスコアと強く相関していることが分かる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:03:49 GMT)
START: A Generalized State Space Model with Saliency-Driven Token-Aware Transformation [27.3] ドメイン一般化(Domain Generalization, DG)は、複数のソースドメインから学習することで、モデルが対象ドメインを見えないように一般化できるようにすることを目的としている。
本稿では,最新技術(SOTA)のパフォーマンスを達成し,CNNやViTと競合する代替手段を提供するSTARTを提案する。
我々のSTARTは、SSMの入力依存行列内の有意なトークンのドメイン固有の特徴を選択的に摂動し、抑制することができるため、異なるドメイン間の差異を効果的に低減できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:50:32 GMT)
SETA: Semantic-Aware Token Augmentation for Domain Generalization [27.3] ドメイン一般化(DG)は、ターゲットドメインにアクセスすることなく、ドメインシフトに対するモデルを強化することを目的としている。
トークンベースのモデルに対する従来のCNNベースの拡張手法は、全体的な形状情報を学ぶためのモデルへのインセンティブが欠如しているため、亜最適である。
本研究では,グローバルな形状を保ちながら局所的なエッジキューを摂動することで特徴を変換するセマンティック・アウェア・トークン拡張(SETA)法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:42:16 GMT)
mbrs: A Library for Minimum Bayes Risk Decoding [27.2] mbrsは最小ベイズリスク(MBR)デコーディングのライブラリである。
MBRはテキスト生成タスクの決定ルールであり、従来の最大値(MAP)復号よりも優れている。
私たちはMITライセンスのオープンソースプロジェクトとしてmbrsを公開しました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:48:08 GMT)
OpenMU: Your Swiss Army Knife for Music Understanding [27.2] 音楽理解のためのマルチモーダル言語モデルをトレーニングするためのベンチマークスイートであるOpenMU-Benchを紹介する。
OpenMU-Benchは、歌詞理解と音楽ツールの使用によって、音楽理解の範囲を広げる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:36:42 GMT)
Interventional Speech Noise Injection for ASR Generalizable Spoken Language Understanding [27.0] 我々は、SLUモデルをASRシステムでよく見られる雑音に曝すことにより、ASRエラーに耐えるように訓練する。
本稿では,任意のASRシステムに適用可能な雑音を導入するための,新しい,バイアスの少ない拡張手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:13:22 GMT)
Kernel PCA for Out-of-Distribution Detection [26.5] ディープニューラルネットワーク(DNN)の信頼性には,アウト・オブ・ディストリビューション(OoD)検出が不可欠である
我々は、OoD検出にKernel PCA(KPCA)のフレームワークを活用し、主成分が分散する部分空間におけるInDとOoDデータの分離性を主張する適切な非線形カーネルを求める。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:32:01 GMT)
Distribution Learning with Valid Outputs Beyond the Worst-Case [25.8] 妥当性に制約のある分布学習は、学習された分布が、空間の無効な部分において、その質量の確率的に小さな部分を持つことを要求することによって、この問題に対処しようとする。
データ分散がモデルクラスに置かれ、ログロスが最小化されると、妥当性を保証するために必要なサンプルの数は、妥当性要求に弱いことが示される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:56:09 GMT)
Small Contributions, Small Networks: Efficient Neural Network Pruning Based on Relative Importance [25.6] 本稿では,アクティベーション統計に基づく直感的で解釈可能なプルーニング手法を提案する。
我々は,データセット全体にわたる重み付けの分布を構築し,そのパラメータを用いて刈り取りプロセスのガイドを行う。
提案手法は,いくつかのベースラインおよび最先端プルーニング技術より一貫して優れる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:18:31 GMT)
Look, Listen, and Answer: Overcoming Biases for Audio-Visual Question Answering [25.6] 本稿では,公開データセット(MUSIC-AVQA)のテストスプリット内での質問の表現と,分割された質問に対する分散シフトの導入という,2つのステップで構築された新しいデータセットMUSIC-AVQA-Rを提案する。
実験の結果、このアーキテクチャはMUSIC-AVQA-Rの最先端性能を実現し、特に9.32%の大幅な改善が得られた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:23:37 GMT)
Revealing and Mitigating the Local Pattern Shortcuts of Mamba [25.2] この問題に対処するために,グローバルな選択モジュールをMambaモデルに導入する。
提案手法では,4M余剰パラメータの導入により,分散情報を用いたタスクにおいて,Mambaモデル(130M)が大幅な改善を実現することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:42:11 GMT)
Yeah, Un, Oh: Continuous and Real-time Backchannel Prediction with Fine-tuning of Voice Activity Projection [24.7] yeah"や"oh"といった短いバックチャネルの発話は、スムーズでエンゲージメントな対話を促進する上で重要な役割を担っている。
本稿では,微調整音声活動予測モデルを用いて,リアルタイムかつ連続的なバックチャネル予測を行う手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:57:56 GMT)
Diverse Policies Recovering via Pointwise Mutual Information Weighted Imitation Learning [24.6] 本稿では,専門家データから多様な警察を回収する手法を提案する。
特に,軌道の潜在スタイルを推測あるいは割り当てた後,重み付け機構を組み込んだバニラの挙動クローニングを強化する。
提案手法の有効性を実験的に検証し,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:33:14 GMT)
The Age of DDoScovery: An Empirical Comparison of Industry and Academic DDoS Assessments [24.6] 我々はまず、2022年の商業利害関係者の観測からトレンドや一貫性を抽出する24の業界レポートを分析した。
そして、業界と学術ソースにまたがる10のデータセットを4年(2019-2023)にわたって分析し、不一致を発見し説明します。
2021-2022年のスプーフ型リフレクション増幅攻撃で、業界が報告した相対的な減少を調査するために、学術データソースを使用します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:33:10 GMT)
Show-o: One Single Transformer to Unify Multimodal Understanding and Generation [24.6] マルチモーダル理解と生成を統一する統一変換器,すなわちShow-oを提案する。
完全自己回帰モデルとは異なり、Show-oは自己回帰と(離散的な)拡散モデリングを統一し、様々な混合モダリティの入力と出力を適応的に処理する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:33:23 GMT)
Show-o: One Single Transformer to Unify Multimodal Understanding and Generation [24.6] マルチモーダル理解と生成を統一する統一変換器,すなわちShow-oを提案する。
完全自己回帰モデルとは異なり、Show-oは自己回帰と(離散的な)拡散モデリングを統一し、様々な混合モダリティの入力と出力を適応的に処理する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:33:23 GMT)
Federated Stochastic Approximation under Markov Noise and Heterogeneity: Applications in Reinforcement Learning [24.6] フェデレーション強化学習は、N$エージェントが協力してグローバルモデルを学ぶためのフレームワークである。
この連立固定点問題の解法において, エージェントの綿密な協調によって, グローバルモデルのN$倍の高速化が期待できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:30:29 GMT)
Why Transformers Need Adam: A Hessian Perspective [24.4] SGDはトランスフォーマーのかなりの差でAdamよりもパフォーマンスが悪いが、その理由は不明だ。
我々はヘッセンのレンズを通して説明する:トランスフォーマーは「異種」である
SGDは、ブロック間の不均一性を扱うことができないため、全てのブロックに1つの学習率を適用するため、性能が低下することがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:27:23 GMT)
Analyzing Social Biases in Japanese Large Language Models [24.4] 本稿では,英語バイアスベンチマークBBQに基づいて,質問回答のための日本語バイアスベンチマークデータセット(JBBQ)を構築した。
日本語大言語モデル(LLM)における社会的バイアスの分析
社会的バイアスに関する警告と、モデルアウトプットにおけるバイアスの影響を減らそうとするChain-of-Thought。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:33:13 GMT)
Multimodal Learning for Embryo Viability Prediction in Clinical IVF [24.3] In-Vitro Fertilization (IVF) では、妊娠成功の可能性を高めるために、最も生存可能な胚を同定することが重要である。
伝統的に、このプロセスは胚学者が光顕微鏡を用いて、特定の間隔で胚の静的な形態的特徴を手動で評価することを含む。
この手作業による評価は、専門的な分析を必要とするため、時間集約的でコストがかかるだけでなく、本質的に主観的でもあるため、選択プロセスにおける可変性がもたらされる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:58:26 GMT)
Tokenization as Finite-State Transduction [24.2] 正規言語の全てのトークン化を効率的にエンコードできる有限状態フレームワークを導入する。
そのByte-Pairを示します。
Match(BPE)とMaxPiece(WordPiece)がこのフレームワークに適合する。
これの応用は、あるパターンにマッチするように言語モデルの出力を制約するガイド付き生成である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:10:07 GMT)
LucidFusion: Generating 3D Gaussians with Arbitrary Unposed Images [24.0] 我々はRelative Coordinate Map(RCM)を活用したフレキシブルなエンドツーエンドフィードフォワードフレームワークであるLucidFusionを紹介した。
LucidFusionは、画像と3Dワールドの徹底的なポーズを結びつける従来の方法とは異なり、RCMを使って幾何学的特徴を異なる視点に整合させる。
LucidFusionは、オリジナルのシングルイメージから3Dパイプラインとシームレスに統合され、詳細な3Dガウシアンを512倍の512ドルの解像度で生成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:47:01 GMT)
Analysing the Residual Stream of Language Models Under Knowledge Conflicts [24.0] 大規模言語モデル(LLM)は、そのパラメータに大量の事実知識を格納することができる。
しかし、それらのパラメトリック知識は、文脈で提供される情報と矛盾する可能性がある。
これは、古い情報や誤った情報への依存など、望ましくないモデル行動を引き起こす可能性がある。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:12:51 GMT)
ProbTS: Benchmarking Point and Distributional Forecasting across Diverse Prediction Horizons [24.0] 本稿では,基本的な予測ニーズを評価するための統一プラットフォームとして設計されたベンチマークツールであるProbTSを紹介する。
異なる予測条件から生じる特徴的データの特徴を識別する。
本稿では, 時系列予測の最新モデルについて検討し, 方法論的強度と弱点の分析も適用可能であることを明らかにする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:45:04 GMT)
TexPro: Text-guided PBR Texturing with Procedural Material Modeling [23.9] TexProはテキストプロンプトを入力した3Dメッシュの高忠実度材料生成のための新しい手法である。
我々はまず,最新のテキスト・画像モデルを用いて入力されたテキスト・プロンプトからマルチビュー・リファレンス・イメージを生成する。
我々は最近の異なる手続き材料を用いたレンダリングに基づく最適化によりテクスチャマップを導出する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:10:07 GMT)
Steinmetz Neural Networks for Complex-Valued Data [23.8] 並列実値デッツワークと結合出力からなるDNNを用いて複素値データを処理する新しい手法を提案する。
提案するアーキテクチャのクラスは、Steinmetz Neural Networksと呼ばれ、多視点学習を利用して、潜在空間内でより解釈可能な表現を構築する。
提案手法は,これらのネットワークがベンチマーク・データセットや合成例で実現した改良性能と付加雑音を示す数値実験である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:21:51 GMT)
Disambiguating Monocular Reconstruction of 3D Clothed Human with Spatial-Temporal Transformer [22.9] そこで我々は,3次元布地復元のための空間-時間変換器ネットワークを提案する。
空間変換器を用いて、正規地図予測のためのグローバル情報を抽出する。
時間的特徴の組み入れにより、暗黙のネットワークにおける入力特徴の精度が向上する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:40:27 GMT)
Label Filling via Mixed Supervision for Medical Image Segmentation from Noisy Annotations [22.9] 本稿では,LF-Net と呼ばれるシンプルで効果的なラベルフィリングフレームワークを提案する。
トレーニング中にノイズの多いアノテーションのみを付与した、基礎的なセグメンテーションラベルを予測する。
5つのデータセットの結果から、LF-Netは最先端の手法と比較して、すべてのデータセットのセグメンテーション精度を向上することが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:36:36 GMT)
Fully Explicit Dynamic Gaussian Splatting [22.9] 3D Gaussian Splattingは、高密度な3D事前表現と明示的な表現を活用することで、静的シーンにおける高速かつ高品質なレンダリング結果を示している。
本稿では,Ex4DGSの収束性を改善するためのプログレッシブトレーニング手法とポイントバックトラッキング手法を提案する。
2080TiのGPU上で62fpsの高速レンダリングを実現するため,様々な場面での総合的な実験を行った。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:25:43 GMT)
Machine Unlearning in Forgettability Sequence [22.5] 未学習の難易度と未学習アルゴリズムの性能に影響を及ぼす要因を同定する。
本稿では,RankingモジュールとSeqUnlearnモジュールからなる一般の未学習フレームワーク RSU を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:28:18 GMT)
Machine Unlearning in Forgettability Sequence [22.5] 未学習の難易度と未学習アルゴリズムの性能に影響を及ぼす要因を同定する。
本稿では,RankingモジュールとSeqUnlearnモジュールからなる一般の未学習フレームワーク RSU を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:28:18 GMT)
Deep Correlated Prompting for Visual Recognition with Missing Modalities [22.4] 大規模マルチモーダルモデルでは、ペア化された大規模マルチモーダルトレーニングデータを用いて、一連のタスクに対して優れた性能を示す。
しかし、プライバシーの制約やコレクションの難しさのために、この単純な仮定が現実の世界で常に成り立つとは限らない。
そこで本研究では,大規模事前学習型マルチモーダルモデルを用いて,欠落事例を異なる入力タイプとして扱うことで,欠落したモダリティシナリオに対処する学習手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:11:54 GMT)
Deep Correlated Prompting for Visual Recognition with Missing Modalities [22.4] 大規模マルチモーダルモデルでは、ペア化された大規模マルチモーダルトレーニングデータを用いて、一連のタスクに対して優れた性能を示す。
しかし、プライバシーの制約やコレクションの難しさのために、この単純な仮定が現実の世界で常に成り立つとは限らない。
そこで本研究では,大規模事前学習型マルチモーダルモデルを用いて,欠落事例を異なる入力タイプとして扱うことで,欠落したモダリティシナリオに対処する学習手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:11:54 GMT)
Deep Correlated Prompting for Visual Recognition with Missing Modalities [22.4] 大規模マルチモーダルモデルでは、ペア化された大規模マルチモーダルトレーニングデータを用いて、一連のタスクに対して優れた性能を示す。
しかし、プライバシーの制約やコレクションの難しさのために、この単純な仮定が現実の世界で常に成り立つとは限らない。
そこで本研究では,大規模事前学習型マルチモーダルモデルを用いて,欠落事例を異なる入力タイプとして扱うことで,欠落したモダリティシナリオに対処する学習手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:11:54 GMT)
Deep Correlated Prompting for Visual Recognition with Missing Modalities [22.4] 大規模マルチモーダルモデルでは、ペア化された大規模マルチモーダルトレーニングデータを用いて、一連のタスクに対して優れた性能を示す。
しかし、プライバシーの制約やコレクションの難しさのために、この単純な仮定が現実の世界で常に成り立つとは限らない。
そこで本研究では,大規模事前学習型マルチモーダルモデルを用いて,欠落事例を異なる入力タイプとして扱うことで,欠落したモダリティシナリオに対処する学習手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:11:54 GMT)
Improve Dense Passage Retrieval with Entailment Tuning [22.4] 検索システムの鍵となるのは、クエリとパスペアの関連スコアを計算することである。
我々は、NLIタスクにおけるエンテーメントの概念と、関連性の主要なクラスが一致していることを観察した。
我々は,高密度レトリバーの埋め込みを改善するために,エンテーメントチューニングと呼ばれる手法を設計する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:18:30 GMT)
Erasing Undesirable Concepts in Diffusion Models with Adversarial Preservation [22.3] 拡散モデルは、テキストから視覚的に印象的なコンテンツを生成するのに優れています。
本稿では,パラメータ変化によって最も影響を受ける概念を同定し,保存することを提案する。
安定拡散モデルを用いて本手法の有効性を実証し, 不要なコンテンツの除去において, 最先端の消去方法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:40:29 GMT)
Security of Language Models for Code: A Systematic Literature Review [22.0] CodeLM(Code Language Model for Code)は、コード関連のタスクのための強力なツールとして登場した言語モデルである。
CodeLMはセキュリティ上の脆弱性の影響を受けやすく、ソフトウェア工学、人工知能、サイバーセキュリティといった分野から研究の注目を集めている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:27:41 GMT)
NetSafe: Exploring the Topological Safety of Multi-agent Networks [22.0] 本稿では, トポロジ的観点からのマルチエージェントネットワークの安全性に着目した。
マルチエージェントネットワークが誤情報、偏見、有害な情報を含む攻撃にさらされる際のいくつかの重要な現象を同定する。
高度に接続されたネットワークは敵の攻撃の拡散の影響を受けやすく、スターグラフのトポロジーにおけるタスクパフォーマンスは29.7%低下している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:54:27 GMT)
Generating Less Certain Adversarial Examples Improves Robust Generalization [22.0] 本稿では,対人訓練における頑健なオーバーフィット現象を再考する。
我々は、敵の例を予測する際の過信が潜在的な原因であると主張している。
本稿では, モデルが予測するロジットの分散を, 逆数例で捉えた逆数確かさの形式的定義を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:12:02 GMT)
Analyzing Context Contributions in LLM-based Machine Translation [22.0] 大規模言語モデル(LLM)は機械翻訳(MT)において最先端の性能を達成した
本研究は,LLM が翻訳文を生成する際に,少数ショット例やソーステキストなど,様々な文脈をどう利用するかを検討する。
我々の研究は、標準エンコーダ・デコーダMTモデルで知られているものを超えるLCMベースのMTの内部動作に光を当てた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:51:41 GMT)
PIR: Remote Sensing Image-Text Retrieval with Prior Instruction Representation Learning [21.9] 本稿では,視覚とテキスト表現の適応学習を指導するために,事前知識に基づく事前指示表現(PIR)学習パラダイムを提案する。
包括的実験により、PIRは視覚とテキスト表現を強化し、クローズドドメインとオープンドメイン検索の最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:49:58 GMT)
Explainability of Highly Associated Fuzzy Churn Patterns in Binary Classification [21.4] 本研究では,多変量パターンの同定と,直観的解釈のためのソフト境界の設定の重要性を強調した。
主な目的は、機械学習モデルと、トップテキストのHUIMを用いたファジィセット理論を使用して、顧客の混乱の高度に関連付けられたパターンを特定することである。
その結果、顧客チャーン予測モデルの説明可能性と有効性を改善する革新的なアプローチが導入された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:44:37 GMT)
MAL: Motion-Aware Loss with Temporal and Distillation Hints for Self-Supervised Depth Estimation [21.3] Motion-Aware Loss(モーション・アウェア・ロス)は、複数フレームの自己監督型単眼深度推定手法にシームレスに統合するために設計された新しいプラグアンドプレイモジュールである。
MALは、KITTIとCityScapesベンチマークでそれぞれ4.2%と10.8%の深さ推定誤差を減少させる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:13:20 GMT)
An Asymptotically Optimal Algorithm for the Convex Hull Membership Problem [21.3] 純粋な探査環境における凸船体構成問題について検討する。
我々はThompson-CHMというアルゴリズムを初めて提案し、そのモジュラー設計は停止規則とサンプリング規則から構成される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:02:20 GMT)
Utilizing Large Language Models in An Iterative Paradigm with Domain Feedback for Molecule Optimization [21.3] 本稿では,シンプルなドメインフィードバックプロバイダである$textRe2$DFを提案する。
$textRe2$DFは、修飾された分子が化学的に無効である場合、分子を処理するために外部ツールキットRDKitを使用する。
20の単価目標に対して、$textRe2$DFは、それぞれ緩やかな閾値と厳格な閾値の下で、ヒット率を16.95%、20.76%向上させる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:38:07 GMT)
Learning from others' mistakes: Finetuning machine translation models with span-level error annotations [21.3] このような注釈付きデータに基づいて機械翻訳モデルを直接訓練するために、ターゲットスパンを用いたトレーニングと呼ばれる単純な微調整アルゴリズムを開発した。
英語とドイツ語と中国語の機械翻訳の実験では、TWAは品質のためにフィルタリングされたシーケンス上のSupervised FineTuningのようなベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:00:47 GMT)
MiCEval: Unveiling Multimodal Chain of Thought's Quality via Image Description and Reasoning Steps [21.3] 本稿では,各推論ステップと記述の質を評価することによって,推論チェーンの正しさを評価するためのフレームワークを提案する。
MiCEvalは詳細なデータセット上に構築されており、各ステップを正確性、妥当性、情報性に応じて評価するアノテーションを備えている。
実験の結果、MiCEvalを用いた段階的評価は、既存の方法に比べて人間の判断とより密接に一致していることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:42:46 GMT)
The Effect of Personalization in FedProx: A Fine-grained Analysis on Statistical Accuracy and Communication Efficiency [21.2] FedProxは、モデルパーソナライゼーションの正規化を可能にする、シンプルだが効果的なフェデレーション学習手法である。
我々は、FedProxが純粋なローカルトレーニングより優れ、最小限の最適統計率を達成する方法を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:57:53 GMT)
The Effect of Personalization in FedProx: A Fine-grained Analysis on Statistical Accuracy and Communication Efficiency [21.2] FedProxは、モデルパーソナライゼーションの正規化を可能にする、シンプルだが効果的なフェデレーション学習手法である。
我々は、FedProxが純粋なローカルトレーニングより優れ、最小限の最適統計率を達成する方法を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:57:53 GMT)
Neural Collapse versus Low-rank Bias: Is Deep Neural Collapse Really Optimal? [21.1] ディープニューラルネットワーク(DNN)は、ニューラル崩壊(NC)と呼ばれる最終層に驚くべき構造を示す
多クラス分類において、任意の深さの非線形モデルに焦点をあて、驚くべき定性的シフトを明らかにする。
主な原因は、多層正規化スキームの低ランクバイアスである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:54:16 GMT)
SINGAPO: Single Image Controlled Generation of Articulated Parts in Object [21.0] 本稿では,単一画像から音声オブジェクトを生成する手法を提案する。
提案手法は,入力画像と視覚的に一致した音声オブジェクトを生成する。
実験の結果,本手法は音声によるオブジェクト生成における最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:41:32 GMT)
MultiRC: Joint Learning for Time Series Anomaly Prediction and Detection with Multi-scale Reconstructive Contrast [20.9] 異常予測と検出の連立学習のための再構成学習とコントラスト学習を統合したMultiRCを提案する。
異常予測と検出の両方のタスクに対して、MultiRCは既存の最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:28:28 GMT)
Bench4Merge: A Comprehensive Benchmark for Merging in Realistic Dense Traffic with Micro-Interactive Vehicles [20.8] 我々は,統合シナリオにおける動作計画能力を評価するためのベンチマークを開発する。
我々のアプローチには、微小な行動特性を持つ大規模データセットで訓練された他の車両が含まれる。
大規模な実験は、この評価ベンチマークの高度な性質を実証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:35:33 GMT)
Open-World Continual Learning: Unifying Novelty Detection and Continual Learning [20.8] CILを成功させるためには,学習タスクセット内の各タスクに対して優れたOOD検出が必要であることを示す。
そして、この理論を、オープンワールドのCILに一般化または拡張し、オープンワールドでCILを実行し、将来のOODデータやオープンワールドのOODデータを検出することができることを証明した。
新たなCIL法も設計されており、CILの精度やOOD検出における高いベースラインを大きなマージンで上回る。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:05:25 GMT)
Beyond 2:4: exploring V:N:M sparsity for efficient transformer inference on GPUs [20.6] V:N:Mスパシティは2:4スパシティの制限に対処する上で有望である。
V:N:Mのスパーシリティに関連する特定の問題、例えば適切なVとMの値をどうやって選択するかは未解決のままである。
本稿では,V:N:Mスパース変換器の適用性と精度を高めるための3つの重要な手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:00:04 GMT)
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) [20.5] この第2回説明可能なAI for the Arts(XAIxArts)に関する国際ワークショップは、HCI、インタラクションデザイン、AI、説明可能なAI(XAI)、デジタルアートの研究者のコミュニティを集めて、XAI for the Artsの役割を探求した。
第16回 ACM Conference on Creativity and Cognition (C&C 2024) でワークショップを開催した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:24:04 GMT)
Generation through the lens of learning theory [20.3] 統計的学習理論のレンズを通して生成を研究する。
仮説クラスの2つの性質は両立していることが示される - 生成可能ではあるが予測不可能なクラスがあり、その逆も成り立つ。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:21:16 GMT)
MvDrag3D: Drag-based Creative 3D Editing via Multi-view Generation-Reconstruction Priors [20.0] 既存の3Dドラッグベースの編集方法は、重要なトポロジ変更の処理や、さまざまなオブジェクトカテゴリにまたがる新しいテクスチャの生成に不足している。
我々は、より柔軟で創造的なドラッグベースの3D編集のための新しいフレームワークMVDrag3Dを紹介する。
MVDrag3Dは3Dドラッグベース編集のための正確で生成的で柔軟なソリューションであることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:59:53 GMT)
Solvation Free Energies from Neural Thermodynamic Integration [19.9] 我々は、2つのターゲットハミルトニアン間を補間する神経ネットワークポテンシャルに沿って解離自由エネルギーを計算する。
いくつかのベンチマークシステムで解答自由エネルギーを計算する方法を検証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:28:46 GMT)
SSMT: Few-Shot Traffic Forecasting with Single Source Meta-Transfer [19.8] 本稿では,交通予測に単一ソース市にのみ依存するSSMT(Single Source Meta-Transfer Learning)を提案する。
提案手法は, 限られたデータを持つ都市において, この伝達された知識を活用して, 数発の交通予報を可能にする。
我々は、ソースシティからの多様な時間的トラフィックパターンを活用することで、正弦波位置符号化の考え方を拡張し、メタラーニングタスクを確立する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:17:25 GMT)
Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering [19.7] 大規模言語モデル(LLM)は、そのパラメータに大量の事実知識を格納することができる。
LLMは、中間層における知識衝突のシグナルを内部的に登録することができる。
我々は,事前訓練されたスパースオートエンコーダを用いた表現工学手法であるtextscSpAREを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:30:47 GMT)
Isotuning With Applications To Scale-Free Online Learning [19.5] 私たちは、高速で適応性があり、いつでも、スケールフリーなオンライン学習アルゴリズムを設計するために、文学のいくつかのツールを拡張し、組み合わせています。
最初の、そして主要なツールであるisotuningは、後悔のトレードオフをバランスさせる適応的な学習率を設計するというアイデアの一般化です。
第2のツールはオンラインの修正であり、多くのアルゴリズムで中心となる境界を得ることができ、後悔する境界が空白にならないようにする。
最後のツールはnullアップデートであり、アルゴリズムが過度に大規模な更新を行うのを防ぐ。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:26:39 GMT)
Paths-over-Graph: Knowledge Graph Empowered Large Language Model Reasoning [19.4] 我々は,KGから知識推論経路を統合することで,Large Language Models(LLM)推論を強化する新しい手法であるPaths-over-Graph(PoG)を提案する。
PoGは3段階の動的マルチホップパス探索を通じて、マルチホップとマルチエンタリティの問題に取り組む。
実験では、GPT-3.5-TurboのPoGは、GPT-4のToGを最大23.9%上回った。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:22:16 GMT)
Toxicity Detection is NOT all you Need: Measuring the Gaps to Supporting Volunteer Content Moderators [19.4] 我々はHugging Faceでモデルレビューを行い、様々なモデレーションルールとガイドラインをカバーするモデルの有効性を明らかにする。
テストに最先端のLLMを配置し、これらのモデルが特定のフォーラムからプラットフォームルールに違反していると警告する上で、いかにうまく機能するかを評価します。
概して、未発達のモデルとLLMは、ルールのかなりの部分で中程度から低い性能を示すため、非自明なギャップを観察する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:48:18 GMT)
Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning [19.4] 視覚言語モデル (VLM) は、幅広い下流タスクにおいて印象的なパフォーマンスを示している。
タスクにおける空間的推論の多くは2次元(2次元)環境で起こる。
本稿では,VLM内の2次元空間推論を基礎空間能力のモデルで訓練することで効果的に拡張する手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:26:09 GMT)
Forecasting Company Fundamentals [19.4] 実企業データに基づく予測モデルについて,22の決定論的・確率的企業基盤を評価した。
ディープラーニングモデルは,従来のモデルよりも優れた予測性能を提供する。
これらの高品質な予測が、自動株式配分にどのような恩恵をもたらすかを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:21:43 GMT)
Arithmetic Transformers Can Length-Generalize in Both Operand Length and Count [19.1] トランスフォーマーはしばしば長さの一般化に苦しむため、トレーニング中に遭遇したものよりも長いシーケンスに一般化できない。
本研究は,算術変換器で最初に達成された2~3倍の長さのタスクを一般化する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:49:51 GMT)
A Troublemaker with Contagious Jailbreak Makes Chaos in Honest Towns [19.0] エージェントの重要なコンポーネントはメモリであり、重要な情報を格納するが、ジェイルブレイク攻撃の影響を受けやすい。
既存の研究は主に単一エージェント攻撃と共有メモリ攻撃に焦点を当てている。
本稿では,大規模なマルチエージェント・マルチトポロジーテキストによる攻撃評価フレームワークであるTMCHTタスクを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:21:24 GMT)
ARTS: Semi-Analytical Regressor using Disentangled Skeletal Representations for Human Mesh Recovery from Videos [18.7] ARTSは、一般的なベンチマークにおけるフレーム単位の精度と時間的一貫性の両方において、既存の最先端のビデオベースの手法を超越している。
ビデオから3Dスケルトンを推定するために,スケルトン推定およびアンタングルメントモジュールを提案する。
回帰器は、Temporal Inverse Kinematics (TIK), bone-guided Shape Fitting (BSF), Motion-Centric Refinement (MCR)の3つのモジュールで構成されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:06:43 GMT)
Adaptive $Q$-Network: On-the-fly Target Selection for Deep Reinforcement Learning [18.6] 我々は、追加のサンプルを必要としない最適化手順の非定常性を考慮するために、Adaptive $Q$Network (AdaQN)を提案する。
AdaQNは理論上は健全で、MuJoCo制御問題やAtari 2600のゲームで実証的に検証されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:32:24 GMT)
Nova: Generative Language Models for Assembly Code with Hierarchical Attention and Contrastive Learning [18.5] 本研究は,セマンティクスをより効果的に捉えるために,注目要約を構築する階層的注意機構を提案する。
これらの技法を取り入れたこの研究は、アセンブリコードのためのジェネレーティブLLMであるNovaを開発した。
Novaは、バイナリコードの逆コンパイルに関する既存のテクニックを14.84 -- 21.58%(絶対パーセンテージポイントの改善)より高いPass@1とPass@10で上回り、最新のバイナリコード類似性検出テクニックを最大6.17%のRecall@1で上回ります。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:28:13 GMT)
Pairing Analogy-Augmented Generation with Procedural Memory for Procedural Q&A [18.5] 本稿では,LangChainチュートリアルから作成したLCStepという新しい手続き型知識データセットを提案する。
この手続き的知識を活用して新しい課題を解決するために、類推強化世代(AAG)を提案する。
AAGは、過去の経験を同化して馴染みのない問題を解決する人間の能力からインスピレーションを得ている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:49:41 GMT)
Truth is Universal: Robust Detection of Lies in LLMs [18.1] 大きな言語モデル(LLM)は自然言語処理に革命をもたらし、印象的な人間的な能力を示している。
本研究では,LLMが横になっていることを検知するロバストな手法を開発することを目的とする。
我々は、真と偽の文の活性化ベクトルを分離できる2次元部分空間の存在を実証する。
この発見は普遍的であり、Gemma-7B、LLaMA2-13B、Mistral-7B、LLaMA3-8Bなど様々なLLMを保有している。
我々の分析は、過去の研究で観察された一般化の失敗を説明し、さらなる段階を定めている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:55:49 GMT)
R2Gen-Mamba: A Selective State Space Model for Radiology Report Generation [18.1] R2Gen-Mambaは、新しい自動放射線診断報告ジェネラオン法である。
R2Gen-Mambaはトレーニングと推論効率を高めるだけでなく、高品質なレポートを生成する。
R2Gen-Mambaのエフェクト効果を示すために,210,000枚のX線画像レポートペアを用いた2つのベンチマークデータセットの実験結果を得た。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:35:34 GMT)
Susu Box or Piggy Bank: Assessing Cultural Commonsense Knowledge between Ghana and the U.S [17.9] AMAMMER$epsilon$は、英語のLLMの常識知識を評価するために設計された525の多重選択質問からなるテストセットである。
我々は、ガーナ人と米国の参加者による調査を含む多段階のプロセスを使用する。
単体では、モデルはガーナのアノテーターよりもアメリカのアノテーターの好みに沿った答えの選択を好む。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:25:31 GMT)
From Hospital to Portables: A Universal ECG Foundation Model Built on 10+ Million Diverse Recordings [17.8] ECG Foundation Model (ECGFounder)は、Harvard-Emory ECG Databaseから150のラベルカテゴリを持つ1000万以上のECGをトレーニングしている。
ECGFounderは、12リードのECGと1リードのECGの両方で、内部検証セットのエキスパートレベルのパフォーマンスを達成する。
微調整されたECGFounderは、人口統計学的検出、臨床イベント検出、心拍数横断診断において、ベースラインモデルを上回っている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:56:37 GMT)
An Electrocardiogram Foundation Model Built on over 10 Million Recordings with External Evaluation across Multiple Domains [17.8] 我々はECG解析の診断能力を拡大するECGファウンデーションモデル(ECGFounder)を導入する。
ECGFounderは、Harvard-Emory ECG Databaseから150のラベルカテゴリを持つ1000万以上のECGでトレーニングされた。
AUROCは80の診断で0.95を超える。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:56:37 GMT)
Hotel Booking Cancellation Prediction Using Applied Bayesian Models [17.7] 36,285の観測と17の特徴を持つKaggleデータセットを使用して、ベイジアン・ロジスティック・回帰とベータ・バイノミカル・モデルが実装された。
12の特徴と5,000のランダムに選択された観測結果に適用されたロジスティック・モデルは、予測精度でベータ・ビノミカル・モデルを上回った。
主な予測者は、大人、子供、滞在時間、リードタイム、駐車場、ルームタイプ、特別リクエストなどであった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:18:30 GMT)
Deep Learning and Machine Learning -- Object Detection and Semantic Segmentation: From Theory to Applications [17.6] 本は、機械学習とディープラーニングにおける最先端の進歩をカバーしている。
畳み込みニューラルネットワーク(CNN)、YOLOアーキテクチャ、DeTRのようなトランスフォーマーベースのアプローチに重点を置いている。
また、人工知能(AI)技術と拡張オブジェクト検出のための大規模言語モデルの統合も検討している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:10:49 GMT)
CA*: Addressing Evaluation Pitfalls in Computation-Aware Latency for Simultaneous Speech Translation [17.5] 同時音声翻訳(SimulST)システムは、翻訳品質と応答時間とのバランスをとる必要がある。
現在のメトリクスは、非セグメンテッドなストリーミング設定で非現実的に高いレイテンシ測定をもたらすという、長年にわたって信じられてきた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:42:19 GMT)
DARES: Depth Anything in Robotic Endoscopic Surgery with Self-supervised Vector-LoRA of the Foundation Model [17.4] ロボット内視鏡手術(DARES)におけるDepth Anythingの導入
DAM V2における新しい適応手法であるローランド適応(LoRA)は、自己教師付き単眼深度推定を行う。
近年の最先端の自己監督型単分子深度推定法よりも, 新たな手法が優れていることが検証された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:01:46 GMT)
Joker: Conditional 3D Head Synthesis with Extreme Facial Expressions [17.3] 極端な表現を伴う3次元頭部の条件合成法であるJokerを紹介する。
3次元形態素モデル(3DMM)とテキスト入力による表現の制御を行う。
本手法は,視認性極端舌調音を初めて達成した手法である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:07:33 GMT)
Is Prior-Free Black-Box Non-Stationary Reinforcement Learning Feasible? [17.2] 本研究では,非定常強化学習(NS-RL)の問題点を,システムの非定常性に関する事前知識なしで研究する。
MASTERとして知られる最先端のブラックボックスアルゴリズムは、その目標を達成するための条件を特定することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:05:19 GMT)
Robust Feature Learning for Multi-Index Models in High Dimensions [17.2] ニューラルネットワークで対向的に堅牢な特徴学習を理解するための第一歩を踏み出します。
逆向きの堅牢な学習は、標準的な学習と同じくらい簡単であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:20:34 GMT)
Accounting for Missing Covariates in Heterogeneous Treatment Estimation [17.1] 生態学的推論に基づく新しい部分的識別戦略を導入する。
私たちのフレームワークは、他の方法では不可能であるよりもずっと厳密な境界を生成できることを示します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:47:07 GMT)
TimeMixer++: A General Time Series Pattern Machine for Universal Predictive Analysis [17.1] 時系列解析は多くのアプリケーションにおいて重要な役割を担い、予測、分類、異常検出、計算などのタスクをサポートする。
本研究では,高機能な表現とパターン抽出機能を通じて,幅広い時系列タスクを最適化するモデルである時系列パターンマシン(TSPM)を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:06:53 GMT)
DEPT: Decoupled Embeddings for Pre-training Language Models [16.8] DEPTはグローバルな語彙を共有しないトレーニングを可能にする。
我々は、13億パラメータモデルの第一語彙非依存フェデレーションによる多言語事前学習を通じて、DEPTのポテンシャルを実証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:41:21 GMT)
DEPT: Decoupled Embeddings for Pre-training Language Models [16.8] DEPTは、共有グローバル語彙に縛られることなく、モデルをトレーニングすることができる。
我々は,13億パラメータモデルの最初の語彙に依存しないフェデレーション付き多言語事前学習を行うことにより,DEPTの可能性を証明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:41:21 GMT)
DEPT: Decoupled Embeddings for Pre-training Language Models [16.8] DEPTは、共有グローバル語彙に縛られることなく、モデルをトレーニングすることができる。
我々は,13億パラメータモデルの最初の語彙に依存しないフェデレーション付き多言語事前学習を行うことにより,DEPTの可能性を証明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:41:21 GMT)
One-Versus-Others Attention: Scalable Multimodal Integration for Biomedical Data [16.7] 我々は新しいドメインニュートラルなアテンション機構であるOne-Versus-Others(OvO)アテンションを提案する。
本手法は,計算コストを削減しつつ,一般的な融合技術と比較して性能を向上する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:47:27 GMT)
Are Language Model Logits Calibrated? [16.5] 我々はLanguage Modelsの出力確率がテキストコンテキストに調整されているかどうかをテストする。
単純な設定であっても、最高のLMはキャリブレーションが不十分であることがわかった。
また、命令調整されたモデルでは、1つのオプションで確率質量を過度に割り当てることがある。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:41:15 GMT)
Improving Neural Optimal Transport via Displacement Interpolation [16.5] 最適輸送(OT)理論は、ソース分布をターゲット分布に移動させるコスト最小化輸送マップを考察する。
本稿では, 安定度を向上し, 変位を利用した OT Map の近似性を向上する手法を提案する。
画像から画像への変換タスクにおいて,DIOTMが既存のOTベースモデルより優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:54:04 GMT)
Improving Neural Optimal Transport via Displacement Interpolation [16.5] 最適輸送(OT)理論は、ソース分布をターゲット分布に移動させるコスト最小化輸送マップを考察する。
本稿では, 安定度を向上し, 変位を利用した OT Map の近似性を向上する手法を提案する。
画像から画像への変換タスクにおいて,DIOTMが既存のOTベースモデルより優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:54:04 GMT)
Can LLMs Recognize Toxicity? A Structured Investigation Framework and Toxicity Metric [16.4] 本稿では,Large Language Models (LLMs) に基づくロバストなメトリクスを導入し,与えられた定義に従って毒性を柔軟に測定する。
以上の結果から,F1スコアの従来の指標を12ポイント改善し,有毒度を測定できることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:56:26 GMT)
Adversarial Inception for Bounded Backdoor Poisoning in Deep Reinforcement Learning [16.4] 本稿では,Deep Reinforcement Learning (DRL)アルゴリズムに対する新たなバックドア攻撃法を提案する。
これらの攻撃は、エージェントの報酬を最小限に変更しながら、アートパフォーマンスの状態を達成します。
次に、拘束された報酬制約の下での事前攻撃を著しく上回るオンラインアタックを考案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:27:48 GMT)
On-Device LLMs for SMEs: Challenges and Opportunities [16.3] 本稿では,中小企業(中小企業)の文脈における大規模言語モデル(LLM)をデバイス上で展開するためのインフラ要件に焦点を当てる。
ハードウェアの観点から、GPUやTPUなどの処理ユニットの利用、効率的なメモリとストレージソリューション、効率的なデプロイメント戦略について議論する。
ソフトウェアの観点から、我々は、フレームワークの互換性、オペレーティングシステムの最適化、リソース制約のある環境に適した特別なライブラリの使用について検討する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:48:35 GMT)
Can Knowledge Editing Really Correct Hallucinations? [16.3] 大規模言語モデル(LLM)は、タスクにまたがる優れた能力にもかかわらず、生成されたコンテンツの非現実的な情報を参照しながら幻覚に悩まされる。
知識編集は,LLMで符号化された誤った事実知識を,スクラッチからリトレーニングを避けるという利点によって補正する,新しい一般的なパラダイムとして開発された。
実世界の幻覚を正すための知識編集手法を全体ベンチマークするために,HaluEditBenchを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:55:54 GMT)
PromptExp: Multi-granularity Prompt Explanation of Large Language Models [16.3] OurToolは、トークンレベルの洞察を集約することで、複数の粒度をプロンプトするフレームワークである。
OurToolは、ホワイトボックスとブラックボックスの説明の両方をサポートし、説明をより高いレベルまで拡張し、柔軟な分析を可能にします。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:54:34 GMT)
Enabling Energy-Efficient Deployment of Large Language Models on Memristor Crossbar: A Synergy of Large and Small [16.2] 大規模言語モデル(LLM)は、様々な分野において有望な応用が期待されているため、大きな注目を集めている。
メムリスタクロスバーは、小さなフットプリントと驚くほど高いエネルギー効率を示す、有望な解決策として現れている。
本稿では,最新のLCMを単一チップやパッケージに展開可能な,メムリスタクロスバーの新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:04:44 GMT)
ChangeGuard: Validating Code Changes via Pairwise Learning-Guided Execution [16.1] ChangeGuardは、学習誘導型実行を使用して、修正された関数の実行動作を比較するアプローチである。
提案手法は,77.1%の精度で,69.5%のリコールで意味的変化を識別する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:13:32 GMT)
A multi-task deep learning approach for lane-level pavement performance prediction with segment-level data [16.0] 本研究では,レーンレベルの舗装性能を予測するため,マルチタスク深層学習手法を開発した。
統一予測フレームワークは、車線間の固有の相関と差異を効果的に解決することができる。
提案した予測フレームワークは、他のアンサンブル学習や浅い機械学習手法をほぼすべての車線で上回っている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:51:57 GMT)
RANSAC Back to SOTA: A Two-stage Consensus Filtering for Real-time 3D Registration [15.8] 対応ベースのポイントクラウド登録(PCR)は、ロボット工学とコンピュータビジョンにおいて重要な役割を果たす。
我々は、RANSACを最先端(SOTA)の速度と精度に高める2段階のコンセンサスフィルタリング(TCF)を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:46:49 GMT)
Toeing the Party Line: Election Manifestos as a Key to Understand Political Discourse on Twitter [15.7] 手動のアノテーションを必要とせずに、テキスト表現を微調整するための信号としてハッシュタグを使用します。
提案手法は,全ての候補のつぶやきのあるシナリオにおいて,マニフェスト位置を反映した安定した位置決めを実現する。
これはアクターが手動のアノテーションで相対的な位置を確実に分析できることを示唆している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:01:46 GMT)
NETS: A Non-Equilibrium Transport Sampler [15.6] 我々は、Non-Equilibrium Transport Sampler (NETS)と呼ばれるアルゴリズムを提案する。
NETSはJarzynskiの平等に基づいて、重要サンプリング(AIS)の亜種と見なすことができる。
このドリフトは、様々な目的関数の最小化であり、全て偏りのない方法で推定できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:22:05 GMT)
NETS: A Non-Equilibrium Transport Sampler [15.6] 我々は、Non-Equilibrium Transport Sampler (NETS)と呼ばれるアルゴリズムを提案する。
NETSはJarzynskiの平等に基づいて、重要サンプリング(AIS)の亜種と見なすことができる。
このドリフトは、様々な目的関数の最小化であり、全て偏りのない方法で推定できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:22:05 GMT)
How Important are Data Augmentations to Close the Domain Gap for Object Detection in Orbit? [15.6] 宇宙空間におけるコンピュータビジョンの領域ギャップを埋めるためのデータ拡張の有効性について検討する。
本稿では,軌道画像に観察される視覚効果をエミュレートするために開発された2つの新しいデータ拡張法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:24:46 GMT)
Resource-Efficient Federated Multimodal Learning via Layer-wise and Progressive Training [15.5] LW-FedMMLは,学習プロセスを複数の段階に分解する階層型多モーダル学習手法である。
提案手法の有効性を検証するため,様々なFLおよびマルチモーダル学習環境にまたがる広範囲な実験を行った。
具体的には、LW-FedMMLはメモリ使用量を最大2.7Times$、計算処理(FLOP)を2.4times$、通信総コストを2.3times$に削減する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:58:53 GMT)
A Data-driven Crowd Simulation Framework Integrating Physics-informed Machine Learning with Navigation Potential Fields [15.4] 本研究では,物理インフォームド・機械学習(PIML)とナビゲーションポテンシャル場を統合した,新しいデータ駆動クラウドシミュレーションフレームワークを提案する。
具体的には,革新的な物理インフォームドS時間グラフ畳み込みネットワーク(PI-STGCN)を,歩行者の移動傾向を予測するデータ駆動モジュールとして設計する。
本フレームワークでは,PI-STGCNにより予測される移動傾向に基づいて,ナビゲーション電位場を動的に計算し,更新する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:56:17 GMT)
Flat Posterior Does Matter For Bayesian Model Averaging [15.4] この研究では、BNNが平らさを捉えるのにしばしば苦労していることを実証的に示しています。
ニューラル・ダイバージェンス(英語版)を計算することによって平坦な後部を求める小説であるシャープネス・アウェア・ベイズモデル平均化(SA-BMA)を提案する。
本研究は,SA-BMAが数発の分類と分布シフトにおいて一般化性能を向上させる効果を検証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:22:17 GMT)
Simulating quantum emitters in arbitrary photonic environments using FDTD: beyond the semi-classical regime [15.3] 本稿では,量子二値系(TLS)を有限差分時間領域フレームワークに統合する数値アルゴリズムを提案する。
本手法は, 単励起状態に着目し, 自己相互作用を排除するために全フィールド入射場(TF-IF)技術を用いる。
このアルゴリズムはまた、共鳴エネルギー移動、超放射能、真空ラビ分裂などの複雑な現象をモデル化することに成功した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:46:50 GMT)
Explaining Provenance-Based GNN Detectors with Graph Structural Features [15.3] 本稿では,MLモデルの決定境界を代理DTの解釈可能な特徴空間に変換することで,セキュリティに配慮した説明を提供するフレームワークであるPROVEXPLAINERを紹介する。
我々のフレームワークは、主にGNNを使用して構築されたセキュリティモデルの説明に焦点を当てている。
PROVEXPLAINER は SOTA GNN の説明器と比較して最大 9.14% と 6.97% の精度で再現できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:24:01 GMT)
Building Conformal Prediction Intervals with Approximate Message Passing [15.0] 等角予測は、分布のない方法で有効な予測間隔を構築するための強力なツールである。
本稿では,予測間隔の計算を高速化するために,AMP(Adroximate Message Passing)に基づく新しいアルゴリズムを提案する。
提案手法では,基準値に近い予測間隔が生成され,精度は桁違いに向上した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:34:33 GMT)
Exploring Continual Fine-Tuning for Enhancing Language Ability in Large Language Model [14.9] CFT(Continuous Fine-tuning)は、LLMを逐次微調整することで、モデルが下流のタスクに適応できるようにするプロセスである。
多言語データセット上で英語のみの細調整LDMを逐次微調整する2相CFTプロセスについて検討する。
第2相タスクと第1相タスクの類似性'''がLCMの適応性を決定することを観察する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:39:03 GMT)
Dual-Label Learning With Irregularly Present Labels [14.8] 本研究は,2ラベル学習に焦点をあて,新たなトレーニングおよび推論フレームワークであるデュアルラベル学習(DLL)を提案する。
提案手法は,F1スコアやMAPEの10%向上により,ベースライン手法よりも一貫した予測を行う。
また,ラベルの欠落率を60%に抑えることで,ラベルの欠落率を10%に抑えることができた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:28:32 GMT)
LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec [14.7] LSCodecは低話者分離能力と低話者分離能力を持つ離散音声である。
再構成実験により、LSCodecは、単一のコードブックだけで、ベースラインよりも語彙サイズが小さい、優れた知性およびオーディオ品質を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:23:31 GMT)
Centrality-aware Product Retrieval and Ranking [14.7] 本稿では,ユーザの検索クエリに関連する製品ランキングを強化することで,eコマースプラットフォーム上でのユーザエクスペリエンス向上の課題に対処する。
eBayのサンプルをキュレートし、購入者中心の関連スコアと集中度スコアを手作業でアノテートしました。
本稿では,既存モデルに対するユーザインテリジェンス中心性最適化(UCO)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:59:14 GMT)
TS-ACL: A Time Series Analytic Continual Learning Framework for Privacy-Preserving and Class-Incremental Pattern Recognition [14.6] 本稿では,TS-ACLと呼ばれる時系列解析連続学習フレームワークを提案する。
解析学習にインスパイアされたTS-ACLは、ニューラルネットワークの更新を勾配のない線形回帰問題に変換する。
我々のフレームワークはリアルタイムアプリケーションや大規模データ処理に非常に適しています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:34:02 GMT)
How to Build a Pre-trained Multimodal model for Simultaneously Chatting and Decision-making? [14.6] 私たちは、VLA4CD(Chatting and Decision Making)のためのVisual Language Action Modelと呼ばれる新しいモデルアーキテクチャを開発した。
我々はLoRAを利用して、言語、視覚、行動をカバーする複数のモダリティのデータを用いて、事前訓練されたLLMを微調整する。
これらの設計により、VLA4CDはテキスト応答を出力しながら連続的に評価されたアクション決定を提供することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:02:42 GMT)
Convex Relaxations for Isometric and Equiareal NRSfM [14.6] 本研究では,NRSfMの準等尺性への挑戦に対処するために凸緩和法を提案する。
我々は、よく知られたベンチマークを含む複数の実合成データに対して、本手法の有効性を検証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:07:42 GMT)
Understanding and Alleviating Memory Consumption in RLHF for LLMs [14.5] RLHF(Reinforcement Learning with Human Feedback)を用いた微調整は,大規模言語モデル(LLM)の整合に不可欠である
この研究は、RLHFコンテキストにおけるメモリ使用量を調べ、様々なメモリ管理戦略を探求し、過剰なメモリ消費の背景にある理由を明らかにした最初のものである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:23:42 GMT)
Finite-Sample and Distribution-Free Fair Classification: Optimal Trade-off Between Excess Risk and Fairness, and the Cost of Group-Blindness [14.4] グループフェアネス制約下の二項分類におけるアルゴリズムフェアネスとグループブレンドネスの強制効果を定量化する。
制御された過剰リスクを伴う分布自由かつ有限サンプルフェアネスを保証するフェア分類のための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:04:17 GMT)
Massimo: Public Queue Monitoring and Management using Mass-Spring Model [14.4] 交通渋滞を回避し、顧客満足度を向上させるために、公共空間における待ち行列制御と規制の効率的なシステムが非常に重要である。
本稿では、インテリジェントなシステムの統合と、公共の場所での待ち行列の効率的なシステム構築に基づく詳細なロードマップを提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:43:02 GMT)
RAG4ITOps: A Supervised Fine-Tunable and Comprehensive RAG Framework for IT Operations and Maintenance [14.3] 検索型拡張生成(RAG)に基づく汎用的・包括的枠組みを提案する。
ステージ1では,2つの負のサンプリング戦略を持つ対照的な学習手法を用いて,埋め込みモデルを微調整する。
ステージ2では、QAシステムの効率的なプロセスがサービスのために構築されます。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:22:29 GMT)
Leveraging CORAL-Correlation Consistency Network for Semi-Supervised Left Atrium MRI Segmentation [14.3] 半教師付き学習(SSL)は、ラベル付き画像とラベルなし画像の両方から学習するために広く使われている。
現在のSSLベースのセグメンテーションメソッドの多くは、ラベル付きデータとラベルなしデータの類似した特徴を識別するためにピクセル値を直接使用する。
我々は,グローバルな構造形状と左房の局所的詳細を捉えるために,CORAL(Correlation-Aligned)-Correlation Consistency Network (CORN)を導入した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:46:28 GMT)
AROMA: Preserving Spatial Structure for Latent PDE Modeling with Local Neural Fields [14.2] 本稿では、局所的なニューラルネットワークを用いた偏微分方程式(PDE)のモデリングを強化するためのフレームワークであるAROMAを提案する。
我々のフレキシブルエンコーダ・デコーダアーキテクチャは、様々なデータタイプから空間物理場のスムーズな遅延表現を得ることができる。
拡散型定式化を用いることで、従来のMSEトレーニングと比較して安定性が向上し、ロールアウトが長くなる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:37:16 GMT)
Test-time Adaptation for Cross-modal Retrieval with Query Shift [14.2] クロスモーダル検索(TCR)のためのテスト時間適応法を提案する。
本稿では,クエリシフトがクエリモダリティの均一性(すなわちモダリティ内散乱)を低下させるだけでなく,クエリとギャラリーのモダリティのギャップを増幅する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:08:19 GMT)
LMHaze: Intensity-aware Image Dehazing with a Large-scale Multi-intensity Real Haze Dataset [14.1] 本稿では,大規模で高品質な実世界のデータセットLMHazeを紹介する。
LMHazeは、屋内および屋外の多様な環境で撮影された、ヘイズフリーとヘイズフリーの2つの画像で構成されている。
そこで本研究では,Mambaをベースとした混合実験モデルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:20:02 GMT)
NutrifyAI: An AI-Powered System for Real-Time Food Detection, Nutritional Analysis, and Personalized Meal Recommendations [14.0] 本稿では,先進的なコンピュータビジョン技術と栄養分析を組み合わせた総合システムを提案する。
予備的な結果は、即時かつ正確な食事の洞察を提供することによって、システムの有効性を示し、食品認識精度は80%近くである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:50:51 GMT)
Elucidating the design space of language models for image generation [14.0] 画像トークンはテキストトークンと比較してランダム性が高いことを示す。
また, 画像生成における局所的情報の重要性を, 全てのモデルで把握できたが, より小さなモデルでは, グローバルな文脈を捉えるのに苦労していることがわかった。
我々の研究は、視覚生成における言語モデルの最適化挙動を初めて分析し、他の領域にLMを適用する際に、より効果的な設計を刺激できると考えている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:57:04 GMT)
Fine-grained and Explainable Factuality Evaluation for Multimodal Summarization [13.7] マルチモーダル要約は入力テキストと画像に基づいて簡潔な要約を生成することを目的としている。
マルチモーダル要約モデルの現実性を評価するために,2つのきめ細かな説明可能な評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:58:43 GMT)
Do Large Language Models Have an English Accent? Evaluating and Improving the Naturalness of Multilingual LLMs [13.6] 大規模言語モデル (LLM) は主に英語を基本言語として設計されている。
多言語である少数の人々でさえ、強い英語中心の偏見を示す傾向がある。
本稿では,多言語出力の語彙的および構文的自然性を評価するための新しい自動コーパスレベル指標を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:34:17 GMT)
TIPS: Text-Image Pretraining with Spatial Awareness [13.4] 自己教師付き画像のみの事前訓練は、多くの視覚的応用にとって依然としてゴートな方法である。
本稿では,高密度かつ大域的な視覚タスクに有効な汎用画像テキストモデルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:05:04 GMT)
MAC Revivo: Artificial Intelligence Paves the Way [13.4] IoT(Internet of Things)におけるWi-FiおよびBluetooth機能の導入は、産業、科学、医療(ISM)バンドにおいて大きな干渉と混雑を引き起こしている。
従来の Wi-Fi Medium Access Control (MAC) の設計は、ネットワーク品質・オブ・サービス(QoS)の性能を確保しながら、ますます複雑な無線環境を管理する上で大きな課題に直面している。
AI-MACは、機械学習アルゴリズムを用いて、ネットワーク条件の変化に動的に適応し、チャネルアクセスを最適化し、干渉を緩和し、決定論的レイテンシを確保する革新的なアプローチである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:36:53 GMT)
Long-time Integration of Nonlinear Wave Equations with Neural Operators [13.4] ニューラル演算子による非線形波動方程式の長期統合に焦点をあてる。
我々は,これらの非線形波動方程式の本質的な特徴,例えば保存法則や正当性を利用して,アルゴリズム設計を改善する。
数値実験により,不規則領域上のKdV方程式,Sine-Gordon方程式,半線形波動方程式のこれらの改善について検討した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:36:34 GMT)
Can Transformers In-Context Learn Behavior of a Linear Dynamical System? [13.3] 本研究では,関連するプロセスとそれに関連するパラメータがコンテキストとして与えられたとき,トランスフォーマーがランダムなプロセスを追跡することを学べるかどうかを検討する。
変圧器の頑健性に関するさらなる研究により、モデルパラメータが部分的に保持されていない場合でも、その性能が維持されていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:18:10 GMT)
3DGS-Enhancer: Enhancing Unbounded 3D Gaussian Splatting with View-consistent 2D Diffusion Priors [13.2] 新規ビュー合成は、複数の入力画像やビデオからシーンの新しいビューを生成することを目的としている。
3DGS-Enhancerは、3DGS表現の表現品質を向上させるための新しいパイプラインである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:59:09 GMT)
You Only Sample Once: Taming One-Step Text-to-Image Synthesis by Self-Cooperative Diffusion GANs [13.1] YOSOは、高速でスケーラブルで高忠実なワンステップ画像合成のための新しい生成モデルであり、高いトレーニング安定性とモードカバレッジを持つ。
提案手法は,一段階のモデルトレーニングをスクラッチから行うことができ,競争性能が向上することを示す。
特に、YOSO-PixArt-$alpha$は、512の解像度でトレーニングされた1ステップで画像を生成することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:32:04 GMT)
Acoustic Model Optimization over Multiple Data Sources: Merging and Valuation [13.0] 本稿では,音声認識分野の課題を解くための新しいパラダイムを提案する。
最初の段階では、完全な音声データの異なるサブセットに基づいて複数の音響モデルを訓練する。
第2段階では、2つの新しいアルゴリズムを用いて高品質な音響モデルを生成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:48:23 GMT)
Stepwise Alignment for Constrained Language Model Policy Optimization [13.0] 大規模言語モデル(LLM)を用いたAIシステムの現実的な応用には、安全性と信頼性が不可欠である
本稿では、安全制約下での報酬を最大化するために、言語モデルポリシーの最適化問題として、人間の価値アライメントを定式化する。
SACPOの背景にある重要な考え方の1つは、報酬と安全を取り入れた最適な政策は、報酬に整合した政策から直接得ることができるということである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:42:51 GMT)
Will Trump Win in 2024? Predicting the US Presidential Election via Multi-step Reasoning with Large Language Models [12.9] 選挙予測は、限られた有権者レベルのデータ、急速に変化する政治情勢、複雑な人間の振る舞いをモデル化する必要性など、ユニークな課題を生んでいる。
政治分析のための多段階推論フレームワークを提案する。
われわれのアプローチは、2016年と2020年のアメリカ大統領選挙研究(ANES)の実際のデータに基づいて検証されている。
我々は,2024年アメリカ合衆国大統領選挙の結果を事前に予測するために,我々の枠組みを適用した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:18:53 GMT)
Deep Multimodal Learning with Missing Modality: A Survey [12.9] 欠落したモダリティを扱うために設計されたマルチモーダル学習技術は、これを緩和することができる。
本調査は,Multimodal Learning with Missing Modality (MLMM)の最近の進歩を概観する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:14:47 GMT)
Learning to Synthesize Graphics Programs for Geometric Artworks [12.8] 本稿では,一連の描画ツールを実行可能なプログラムとして扱うアプローチを提案する。
この方法は最終画像を得るための一連のステップを予測する。
プログラムシンセサイザーArt2Progは複雑な入力画像を包括的に理解できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:28:11 GMT)
DeepIcon: A Hierarchical Network for Layer-wise Icon Vectorization [12.8] 近年,イメージをベクトル形式に変換する学習ベース手法では,不完全形状,冗長な経路予測,オリジナルコンテンツのセマンティクスの保存における精度の欠如が頻発している。
本稿では,画像入力に基づいて可変長アイコングラフを生成する階層型画像ベクトル化ネットワークDeepIconを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:20:19 GMT)
Rolling the DICE on Idiomaticity: How LLMs Fail to Grasp Context [12.8] 我々は、LLMが文脈を効果的に利用して慣用的意味を曖昧にすることができるかどうかをテストするために設計された、新しい対照データセットを構築した。
以上の結果から, LLMは周囲の状況に適応する必要がある場合, 慣用性の解決に失敗することが多いことが判明した。
コードとデータセットを公開しています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:47:37 GMT)
ABCFair: an Adaptable Benchmark approach for Comparing Fairness Methods [12.8] 実世界の問題設定のデシラタに適応できるベンチマーク手法であるABCFairを紹介する。
我々はABCFairを、大規模、伝統的両方のデータセットとデュアルラベル(バイアス付き、バイアスなし)データセットの両方で事前、内、および後処理の手法に適用する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:35:36 GMT)
HaHeAE: Learning Generalisable Joint Representations of Human Hand and Head Movements in Extended Reality [12.7] HaHeAEは、XRにおける手と頭の動きの一般化可能な関節表現を学習するための、新しい自己指導手法である。
提案手法は, 再建品質の点で, 一般的な自己管理手法よりも74.0%高い性能を示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:50:16 GMT)
SMILES-Prompting: A Novel Approach to LLM Jailbreak Attacks in Chemical Synthesis [12.6] 本稿では,化学分野における大規模言語モデル(LLM)のセキュリティ脆弱性について検討する。
我々は,レッドチーム,明示的プロンプト,暗黙的プロンプトなど,いくつかのプロンプトインジェクション攻撃法の有効性を評価する。
本稿では, SMILES-prompting という, 化学物質を参照するための簡易な分子入力線入力システム (SMILES) を用いた新しい攻撃手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:01:50 GMT)
QUIDS: Query Intent Generation via Dual Space Modeling [12.6] 本稿では,検索意図の理解を説明するために,返却文書における意味的関連性および無関係情報を利用する二重空間モデルを提案する。
提案手法は高品質な問合せインテント記述を生成し,既存の手法と最先端の問合せベース要約手法を比較検討する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:05:47 GMT)
Enhancing Multimodal Affective Analysis with Learned Live Comment Features [12.4] ライブコメント(ライブコメント、Danmaku)は、ビデオコンテンツと同期されたユーザー生成メッセージである。
まず、英語と中国語のビデオのライブコメントを含むLive Comment for Affective Analysisデータセットを構築した。
次に、コントラスト学習を用いてビデオエンコーダを訓練し、マルチモーダルな感情コンテンツ分析の強化のための合成ライブコメント機能を生成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:19:09 GMT)
HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers [12.4] 大型ビジョンランゲージ・アクション(VLA)モデルは、その印象的な一般化能力のためにロボット制御において有望であることが示されている。
数十億のパラメータを持つVLMバックエンドへの依存は、高い計算コストと遅延推定につながる。
本稿では,柔軟な周波数・性能トレードオフを実現する階層型ロボットトランスフォーマフレームワークであるHiRTを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:50:05 GMT)
HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers [12.4] 大型ビジョンランゲージ・アクション(VLA)モデルは、その印象的な一般化能力のためにロボット制御において有望であることが示されている。
数十億のパラメータを持つVLMバックエンドへの依存は、高い計算コストと遅延推定につながる。
本稿では,柔軟な周波数・性能トレードオフを実現する階層型ロボットトランスフォーマフレームワークであるHiRTを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:50:05 GMT)
AEPL: Automated and Editable Prompt Learning for Brain Tumor Segmentation [12.3] 脳腫瘍の分節は正確な診断と治療計画に不可欠である。
既存の10の方法は、腫瘍学級のような医学領域の知識を効果的に取り入れることに失敗する。
本稿では,腫瘍学級をセグメンテーションプロセスに統合する自動編集型プロンプト学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:29:44 GMT)
Nonparametric Bayesian networks are typically faithful in the total variation metric [12.3] 与えられたDAG$G$に対して、任意の結果空間を持つベイズネットワークのすべての観測的分布のうち、忠実な分布は典型的であることを示す。
その結果、忠実な分布の集合は空でなく、不誠実な分布は濃密ではない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:38:04 GMT)
Improving Galileo OSNMA Time To First Authenticated Fix [12.3] 我々は、一般的なOSNMA対応受信機と、OSNMAガイドラインで要求されるよりも時間同期の厳しい受信機に利用できるTFAF最適化について検討する。
テストベクトルの平均 TTFAF は 60.9 秒, 68.8 秒, オープンスキーシナリオは それぞれ 68.8 秒 である。
これらの最適化は、GitHubのオープンソースOSNMAlibライブラリの一部として利用可能になった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:01:12 GMT)
Mesa-Extrapolation: A Weave Position Encoding Method for Enhanced Extrapolation in LLMs [12.3] 位置がない理由を研究する。
(NoPE)は、その有効範囲外では故障し、位置のパワーを検査する。
(PE)。
本稿では,チャンクベースの三角アテンション行列を用いて,最終チャンクの管理にStair-Extrapolationを適用する,新しいウィーブPE手法であるMesaExtrapolationを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:39:05 GMT)
From Tokens to Materials: Leveraging Language Models for Scientific Discovery [12.2] 本研究では, 材料科学における材料特性予測のための言語モデル埋め込みの適用について検討した。
本研究では、ドメイン固有モデル、特にMatBERTが、複合名や材料特性から暗黙的な知識を抽出する際の汎用モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:31:23 GMT)
A Rainbow in Deep Network Black Boxes [12.1] ディープラーニングにおける中心的な疑問は、ディープネットワークによって学習された機能を理解することである。
このようなランダムな特徴モデルの深い拡張を提供し、レインボーモデルと呼ぶ。
レインボーネットワークは無限幅極限において決定論的(階層的)カーネルを定義することを証明している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:59:50 GMT)
Topology-Aware Exploration of Circle of Willis for CTA and MRA: Segmentation, Detection, and Classification [12.1] ウィリスの円 (Circle of Willis, CoW) は、脳の主要な循環を繋ぐために重要である。
TopCow24は125組のCTA-MRAデータセットをCoWの分析のために提供した。
独立強度前処理を用いて普遍的データセットを構築し,次に連成再サンプリングと正規化を行う。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:33:09 GMT)
Pantograph: A Machine-to-Machine Interaction Interface for Advanced Theorem Proving, High Level Reasoning, and Data Extraction in Lean 4 [12.1] PantographはLean 4の証明アシスタントに汎用的なインターフェースを提供するツールである。
Pantographはモンテカルロ木探索のような強力な探索アルゴリズムによる効率的な証明検索を可能にする。
PantographはLean 4の推論ステップをより堅牢に扱えるようにすることで、高いレベルの推論を可能にします。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:49:28 GMT)
Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion [11.9] 長距離接触リッチな操作は、離散接触モードと連続物体運動の両方の推論を必要とするため、長い間難しい問題であった。
本稿では,オブジェクトと環境間の一連の接触関係を規定する神経記述子のシーケンスを生成する拡散モデルであるImplicit Contact diffuser(ICD)を紹介する。
ICDは、ケーブルルーティングやノートブックの折り畳みといった、複雑で長い水平なコンタクトリッチな操作タスクにおいて、ベースラインよりも優れています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:07:48 GMT)
Improving Neuron-level Interpretability with White-box Language Models [11.9] 我々は、CRATE(Coding RAte TransformEr)という、ホワイトボックストランスフォーマーのようなアーキテクチャを導入する。
包括的実験では、ニューロンレベルの解釈可能性において、顕著な改善(最大103%の相対的な改善)が見られた。
CRATEの解釈可能性の向上は、関連するトークンを一貫して一意に活性化する能力の強化によるものである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:12:33 GMT)
HeightFormer: A Semantic Alignment Monocular 3D Object Detection Method from Roadside Perspective [11.8] 本研究では,空間的前駆体とVoxel Pooling formerを統合した3次元物体検出フレームワークを提案する。
Rope3DとDAIR-V2X-Iデータセットを用いて実験を行い、提案アルゴリズムが車とサイクリストの両方を検知する際の性能を実証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:12:38 GMT)
HeightFormer: A Semantic Alignment Monocular 3D Object Detection Method from Roadside Perspective [11.8] 本研究では,空間的前駆体とVoxel Pooling formerを統合した3次元物体検出フレームワークを提案する。
Rope3DとDAIR-V2X-Iデータセットを用いて実験を行い、提案アルゴリズムが車とサイクリストの両方を検知する際の性能を実証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:12:38 GMT)
CamI2V: Camera-Controlled Image-to-Video Diffusion Model [11.8] 本稿では,明示的な物理的制約をモデル設計に統合する必要性を強調した。
ノイズ条件の新たな視点から,すべてのクロスフレーム関係をモデル化するためのエピポーラアテンションを提案する。
領域外画像への強い一般化を維持しつつ、RealEstate10K上でのカメラ制御性を25.5%向上させる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:36:27 GMT)
Unleashing the Potential of Vision-Language Pre-Training for 3D Zero-Shot Lesion Segmentation via Mask-Attribute Alignment [11.7] Maleniaは、新しいマルチスケールの病変レベルのマスク属性アライメントフレームワークである。
3次元ゼロショット病変セグメンテーション用に特別に設計されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:01:58 GMT)
Privacy-Preserving Community Detection for Locally Distributed Multiple Networks [11.7] 多層ブロックモデルにおけるコンセンサスコミュニティの検出と推定のための新しい手法を提案する。
分散スペクトルクラスタリング(ppDSC)と呼ばれる新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:21:36 GMT)
Students Rather Than Experts: A New AI For Education Pipeline To Model More Human-Like And Personalised Early Adolescences [11.6] 本研究は,仮想学生エージェントをモデル化するための文脈としての言語学習に焦点を当てた。
教師と生徒の個人的交流のデータセットを様々な性格特性でキュレートすることにより,多次元的評価実験を行う。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:18:24 GMT)
Conditional Dependence via U-Statistics Pruning [11.6] 本稿では,次数2の不完全偏り統計を用いた条件依存の新しい尺度を提案する。
これにより、共同設立者自身の観察に従ってデータをプルークすることができるため、行列の逆転を完全に回避できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:06:09 GMT)
On the Geometry of Regularization in Adversarial Training: High-Dimensional Asymptotics and Generalization Bounds [11.3] 本研究では, 正規化ノルム $lVert cdot rVert$ を二項分類のための高次元対角訓練の文脈で選択する方法について検討する。
我々は、摂動サイズと$lVert cdot rVert$の最適選択との関係を定量的に評価し、データ不足状態において、摂動が大きくなるにつれて、正則化のタイプが敵の訓練にとってますます重要になっていることを確認する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:53:12 GMT)
Training Better Deep Learning Models Using Human Saliency [11.3] 本研究では、画像の正常領域に関する人間の判断が、ディープ畳み込みニューラルネットワーク(DCNN)トレーニングにどのように導入できるかを考察する。
本稿では,ConveYs Brain Oversight to raise Generalization (CYBORG) における損失関数の新たな構成要素を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:52:44 GMT)
Amortized Planning with Large-Scale Transformers: A Case Study on Chess [11.2] 本稿では,AIにおける画期的な計画問題であるチェスを用いて,計画課題の性能評価を行う。
ChessBenchは、Stockfishが提供する法的行動と価値アノテーション(1500億ポイント)を備えた1000万のチェスゲームの大規模なベンチマークである。
極めて優れた近似を教師付き学習により大規模変圧器に蒸留することは可能であるが, 完全蒸留は依然として到達範囲を超えている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:37:12 GMT)
Harnessing physical entropy noise in structurally metastable 1T' molybdenum ditelluride for true random number generation [11.1] 構造準安定な1T'モリブデンジテルリド(MoTe2)の導電性ノイズを利用する
このノイズは低温でも低温でも頑丈な物理的エントロピーノイズとして証明される。
ニューラルネットワークにおける生体情報保護のためのマスクとして乱数を用いた生体情報保護手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:39:36 GMT)
An Efficient System for Automatic Map Storytelling -- A Case Study on Historical Maps [11.0] 歴史地図は、過去の貴重な情報と知識を提供する。
しばしば非標準的な投影、手描きのスタイル、芸術的要素を特徴としているため、非専門家がそれらを識別し解釈することは困難である。
既存の画像キャプション手法は、自然画像において顕著な成功を収めており、地図上でのパフォーマンスは、事前学習過程において地図が不足しているため、最適以下である。
テキスト認識や地図キャプションにおけるGPT-4の最近の進歩にもかかわらず、地図内のテキストが欠落したり不正確になったりした場合のパフォーマンスが低下するため、地図に対する理解は限られている。
意味のある字幕のみを生成する新しい決定木アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:45:26 GMT)
Self-Supervised Learning of Disentangled Representations for Multivariate Time-Series [11.0] TimeDRLは多変量時系列表現学習のためのフレームワークである。
TimeDRLの特徴は, []トークン戦略を用いたタイムスタンプレベルおよびインスタンスレベルの埋め込み, (ii)表現学習のためのタイムスタンプ予測およびインスタンスコントラストタスク, (iii)帰納的バイアスを取り除くための拡張手法の回避である。
予測と分類データセットの実験では、TimeDRLは既存の手法よりも優れており、ラベル付きデータに制限のある半教師付き設定でさらなる検証が行われている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:27:47 GMT)
GazeMoDiff: Gaze-guided Diffusion Model for Stochastic Human Motion Prediction [11.0] 本稿では、人間の動きを生成するための新しい視線誘導型微分拡散モデルGazeMoを提案する。
提案手法はまず視線エンコーダを用いて視線と運動の特徴を抽出し,その特徴を融合させるグラフアテンションネットワークを用いる。
提案手法は,マルチモーダルな最終誤差の点で,最先端の手法よりも高い性能を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:45:37 GMT)
Learning to Generate and Evaluate Fact-checking Explanations with Transformers [11.0] XAI(Explainable Artificial Antelligence)の研究
我々は,人間のアクセス可能な説明を生成することによって,意思決定を文脈化し,正当化するトランスフォーマーベースの事実チェックモデルを開発した。
我々は人工知能(AI)による説明と人間の判断を一致させる必要性を強調した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:22:51 GMT)
Boosting Jailbreak Transferability for Large Language Models [10.9] 不整合出力を削減するために,シナリオ誘導テンプレート,最適化された接尾辞選択,および再接尾辞攻撃機構の統合を提案する。
提案手法は,様々なベンチマーク実験において優れた性能を示し,攻撃実行と転送可能性の両方において100%近い成功率を達成した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:11:19 GMT)
Reflection-Bench: probing AI intelligence with reflection [10.8] 反射は、知的システムの世界との相互作用の根幹である。
大規模言語モデル(LLM)のインテリジェンスに関する議論に対処するため,リフレクション・ベンチを提案する。
我々は,OpenAI o1, GPT-4, Claude 3.5 Sonnetなど13の著名なLLMの性能評価を行った。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:59:50 GMT)
Neural Search Space in Gboard Decoder [10.7] Gboard Decoderは、コンテキスト認識検索空間上の入力タッチポイントに最もよくマッチするパスを探すことによって提案を生成する。
我々は,N-gram LM をニューラルネットワーク LM (NN-LM) に置換し,復号時に動的に検索空間を構築する textbfNeural Search Space を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:50:59 GMT)
A practical, fast method for solving sum-of-squares problems for very large polynomials [10.6] 正方形最適化(SOS:Sum of squares)は、 as の正則性を強制しなければならない問題を解くための強力な手法である。
私たちのゴールは、現在より大きく、より複雑な問題に対処できるアプローチを考案することにあります。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:47:42 GMT)
CL-HOI: Cross-Level Human-Object Interaction Distillation from Vision Large Language Models [10.6] 視覚言語モデル(VLLM)は、本質的には画像レベルでの相互作用を認識・推論できるが、計算的に重く、インスタンスレベルのHOI検出には設計されていない。
手動のアノテーションを必要とせずに,VLLMのイメージレベルの理解からインスタンスレベルのHOIを蒸留するクロスレベルHOI蒸留(CL-HOI)フレームワークを提案する。
本手法は,視覚情報から言語情報への変換を行う文脈蒸留と,対話認知ネットワーク(ICN)が空間的,視覚的,文脈的関係を推論する相互作用蒸留の2段階を含む。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:51:51 GMT)
Teach Multimodal LLMs to Comprehend Electrocardiographic Images [10.6] 我々は、100万以上のサンプルからなる総合的なECGイメージインストラクションチューニングデータセットであるECGInstructを紹介する。
また,心電図の理解に適したMLLMであるPULSEを開発した。
実験の結果,PULSEは従来のMLLMよりも15%から30%の精度向上を実現した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:26:41 GMT)
Towards Next-Level Post-Training Quantization of Hyper-Scale Transformers [10.6] ポストトレーニング量子化(PTQ)は、モバイルやテレビなどのエッジデバイスにハイパースケールモデルをデプロイするための有望なソリューションとして登場した。
本稿では,精度と効率のバランスをとる新しいPTQアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:49:53 GMT)
PlaneSAM: Multimodal Plane Instance Segmentation Using the Segment Anything Model [10.5] 我々は、RGBバンド(スペクトルバンド)とDバンド(幾何学バンド)の情報を完全に統合できるPlaneSAMと呼ばれる平面インスタンスセグメンテーションネットワークを提案する。
主により単純な分岐学習Dバンド機能と、より複雑な分岐学習RGBバンド機能を備えています。
実験の結果,提案したPlaneSAMはScanNetデータセット上で新たなSOTA性能を設定し,従来のSOTAアプローチよりも2D-3D-S, Matterport3D, ICL-NUIM RGB-Dデータセットでのゼロショット転送に優れていた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:16:37 GMT)
Non-local detection of coherent Yu-Shiba-Rusinov quantum projections [10.4] 超伝導体表面の角膜の固有モードを用いた磁気不純物誘起のユ・シバ・ルシノフ量子状態のコヒーレント投影を実験的に実現した。
本研究は,超伝導体ハイブリッド量子状態検出のための非局所的制御手法であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:30:28 GMT)
In-Trajectory Inverse Reinforcement Learning: Learn Incrementally From An Ongoing Trajectory [10.4] 逆強化学習(IRL)は報酬関数とそれに対応するポリシーを学習することを目的としている。
現在のIRLの作業は、学習するために少なくとも1つの完全な軌跡を集めるのを待つ必要があるため、進行中の軌跡から漸進的に学習することはできない。
本稿では,現在進行中の軌跡の初期状態対を観察しながら,報酬関数と対応する政策を学習する問題について考察する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:16:32 GMT)
Critical Example Mining for Vehicle Trajectory Prediction using Flow-based Generative Models [10.4] 本稿では,トラジェクトリの希少性を推定するデータ駆動手法を提案する。
観測の希少度を全軌跡と組み合わせることで,予測が比較的難しいデータのサブセットを効果的に同定する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:02:30 GMT)
Guardians of Discourse: Evaluating LLMs on Multilingual Offensive Language Detection [10.1] 非英語文脈におけるタスクに対する異なるプロンプト言語と拡張翻訳データの影響を評価する。
本稿では, LLMにおける固有バイアスと, センシティブなトピックに関する誤予測におけるデータセットの影響について論じる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:08:16 GMT)
Shorter Is Different: Characterizing the Dynamics of Short-Form Video Platforms [10.1] われわれは中国最大のショートフォームビデオプラットフォームであるKuaishouの大規模データ駆動分析を行っている。
あらゆるカテゴリーでアップロードされた2億4800万本のビデオに基づいて、長大なビデオプラットフォームとの違いを識別する。
ビデオはKaishou上で複数回短縮され、興味に基づくビデオではなく、生活関連ビデオによって過剰に表現される特徴的なカテゴリー分布が示される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:37:26 GMT)
Improving Parallel Program Performance Through DSL-Driven Code Generation with LLM Optimizers [9.9] 計算処理をプロセッサにマッピングし、メモリを割り当てることは、並列プログラミングのパフォーマンスを最大化するために重要である。
これらのマッピング決定は、パフォーマンスエンジニアによって作成されたmapperと呼ばれる特殊な低レベルのシステムコードの開発を通じて管理される。
我々は,近年のLLMに基づくマッパー設計の進歩を生かしたアプローチを提案する。
10分以内で、科学的応用における人間の専門家設計を超えるマッパーを最大1.34倍のスピードアップで自動的に発見する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:08:37 GMT)
A Low-Cost Privacy-Preserving Digital Wallet for Humanitarian Aid Distribution [9.9] 本稿では,プライバシ保護のためのデジタルウォレットを提案する。
当社のソリューションにより、受給者は、異なるベンダーで事前に定義された予算を使って、必要なアイテムを入手することができます。
当社のソリューションのセキュリティとプライバシ特性を証明し,大規模に運用可能であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:15:03 GMT)
WildOcc: A Benchmark for Off-Road 3D Semantic Occupancy Prediction [9.6] オフロード環境は幾何学的情報に富んでいるため、3Dセマンティック占有予測タスクに適している。
オフロード3Dセマンティック占有予測タスクに密接な占有アノテーションを提供する最初のベンチマークであるWildOccを紹介する。
本稿では, より現実的な結果を得るために, 粗大な再構成を用いた基礎的真理生成パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:02:40 GMT)
Large language models enabled multiagent ensemble method for efficient EHR data labeling [9.5] 本研究では,MLにおける重要な課題であるデータラベリングに対処するため,LLMを用いた新しいマルチエージェントアンサンブル手法を提案する。
アンサンブルLLMと自然言語処理を用いて、推定精度98.2%の623,566ECGのMIMIC-IV ECGデータセットをラベル付けした。
我々は,1,405EHR臨床ノートの社会史セクションからSDOHを同定するために,アンサンブルLLMs法を適用し,競争性能も向上した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:12:00 GMT)
BI-EqNO: Generalized Approximate Bayesian Inference with an Equivariant Neural Operator Framework [9.4] 一般化されたベイズ近似のための同変ニューラル演算系であるBI-EqNOを導入する。
BI-EqNOは、データ駆動トレーニングを通じて、条件付き観測データに基づいて事前を後方に変換する。
BI-EqNO の応用例は,(1) 回帰のための一般化ガウス過程 (gGP) と(2) 逐次データ同化のためのアンサンブルニューラルフィルタ (EnNF) の2つである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:39:16 GMT)
Bayesian Concept Bottleneck Models with LLM Priors [9.4] 概念ボトルネックモデル (CBM) は、ホワイトボックスモデルとブラックボックスモデルの間の妥協として提案されており、精度を犠牲にすることなく解釈性を実現することを目的としている。
BC-LLM はベイズフレームワーク内の潜在的無限の概念を反復的に探索し、Large Language Models (LLM) が概念抽出のメカニズムと事前の両方として機能する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:00:33 GMT)
Exploring the Zero-Shot Capabilities of LLMs Handling Multiple Problems at once [9.2] 各種LLMのゼロショットMPP性能を6分類と12の推論ベンチマークで検討した。
LLMは、与えられたクラスラベルのテキストのインデックスの選択と、複数の混合ソース推論問題により、一貫して悪化する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:09:33 GMT)
SeisLM: a Foundation Model for Seismic Waveforms [9.1] 本稿では地震波形解析モデルである地震言語モデル(SeisLM)を紹介する。
SeisLMは、自己監督型コントラスト損失を用いて、オープンソースの地震データセットの大規模なコレクションに事前訓練されている。
微調整された場合、SeesLMはイベント検出、フェーズピッキング、オンセット時間回帰、フォアソック・アフターショック分類といった地震学的なタスクに優れる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:24:44 GMT)
Spiking Neural Networks as a Controller for Emergent Swarm Agents [8.8] 既存の研究では、バイナリセンサーとシンプルだが手書きのコントローラー構造のみを備えたロボット群における創発的行動について検討している。
本稿では,特に創発的行動をもたらす局所的相互作用規則を見つけるために,スパイクニューラルネットワークを訓練する可能性について検討する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:41:35 GMT)
Impact of Dataset Properties on Membership Inference Vulnerability of Deep Transfer Learning [8.8] クラスごとの例やクラスの数など、プライバシの脆弱性とデータセットプロパティの関係を分析します。
シャドーモデルから算出したスコア分布と統計量から,MIA単位の脆弱性を導出する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:19:12 GMT)
OAEI-LLM: A Benchmark Dataset for Understanding Large Language Model Hallucinations in Ontology Matching [8.7] 大規模言語モデル(LLM)の幻覚は、オントロジーマッチング(OM)で例外なく、ドメイン固有の下流タスクで一般的に発生する。
OAEI-LLMデータセットは、オントロジーアライメント評価イニシアチブ(OAEI)データセットの拡張版であり、OMタスクにおけるLSM固有の幻覚を評価する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:54:33 GMT)
OAEI-LLM: A Benchmark Dataset for Understanding Large Language Model Hallucinations in Ontology Matching [8.7] 大規模言語モデル(LLM)の幻覚は、オントロジーマッチング(OM)で例外なく、ドメイン固有の下流タスクで一般的に発生する。
OAEI-LLMデータセットは、オントロジーアライメント評価イニシアチブ(OAEI)データセットの拡張版であり、OMタスクにおけるLSM固有の幻覚を評価する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:54:33 GMT)
OAEI-LLM: A Benchmark Dataset for Understanding Large Language Model Hallucinations in Ontology Matching [8.7] 大規模言語モデル(LLM)の幻覚は、オントロジーマッチング(OM)で例外なく、ドメイン固有の下流タスクで一般的に発生する。
OAEI-LLMデータセットは、オントロジーアライメント評価イニシアチブ(OAEI)データセットの拡張版であり、OMタスクにおけるLSM固有の幻覚を評価する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:54:33 GMT)
Evaluating the Performance of a D-Wave Quantum Annealing System for Feature Subset Selection in Software Defect Prediction [8.6] D-Wave Quantum Processing Unit (QPU) を特徴量選択のためのQAソルバとして使用する。
AEEM、データセット、NASAプロジェクトからの複数のソフトウェア欠陥を用いてこのアプローチの性能を評価する。
実験の結果,QAに基づく機能サブセットの選択により,ソフトウェアの欠陥予測が向上することが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:58:25 GMT)
Contamination Report for Multilingual Benchmarks [8.5] 汚染は、ベンチマークの膨らませたスコアにつながり、評価結果を損なう可能性がある。
大言語モデル(LLM)における多言語ベンチマークの汚染について検討する。
私たちの発見は、コミュニティがマルチ言語評価に最適なベンチマークセットを決定するのに役立ちます。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:49:35 GMT)
A new general quantum state verification protocol by the classical shadow method [8.5] 従来の量子状態検証の枠組みでは、各タイプの状態に対して最適なプロトコルや効率的なプロトコルを精巧に設計する必要がある。
本稿では,従来の枠組みにもとづく仮説検証の用語を用いて,この新たなプロトコルを再構築する。
従来のフレームワークとシャドーオーバーラッププロトコルの考え方を組み合わせた新しいプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:55:24 GMT)
A New Approach to Solving SMAC Task: Generating Decision Tree Code from Large Language Models [8.5] StarCraft Multi-Agent Challenge (SMAC)は、マルチエージェント強化学習(MARL)において最もよく使われる実験環境の1つである。
従来のMARLアルゴリズムは、モデルをトレーニングするために最大100万ステップの環境と対話する必要があることが多い。
本稿では,LLM-SMACと呼ばれるSMACタスクの解法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:58:38 GMT)
Learning Language Structures through Grounding [8.4] 言語構造を基礎として学習することを目的とした機械学習タスクのファミリーを考察する。
パートIでは,視覚的接地を通して構文解析を学習することを検討する。
第2部では文を対応する意味構造にマッピングする2つの実行対応手法を提案する。
パートIIIでは、他の言語のアノテーションから言語構造を学習する手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:58:45 GMT)
IoT-Based Preventive Mental Health Using Knowledge Graphs and Standards for Better Well-Being [8.4] デジタル技術は持続可能な開発目標3をサポートすることができる。
健康と幸福」は健康な生活を保証し、あらゆる年齢の幸福を促進する。
燃え尽き症候群やうつ病は 予防的健康を増すことで減らせる
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:55:31 GMT)
Assisted Physical Interaction: Autonomous Aerial Robots with Neural Network Detection, Navigation, and Safety Layers [8.4] 本稿では,産業環境における安全かつ自律的な航空物理相互作用のための新しい枠組みを提案する。
エッジコンピューティングによって強化された、オンボードでの計算負荷を減らすニューラルネットワークベースのターゲット検出システムと、安全かつ正確な操作を行うための制御バリア機能(CBF)ベースのコントローラの2つの主要コンポーネントから構成される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:20:33 GMT)
Language Models are Symbolic Learners in Arithmetic [8.3] 大規模言語モデル(LLM)は、言語モデリングと数値計算の間に固有の違いがあるため、算術学習に苦慮していると考えられている。
まず,算術学習において LLM が部分積を利用するかどうかを検討する。
LLMは学習後にいくつかの部分積を識別できるが、算術的なタスクには利用できない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:57:16 GMT)
PromptHive: Bringing Subject Matter Experts Back to the Forefront with Collaborative Prompt Engineering for Educational Content Creation [8.3] 本稿では,プロンプトオーサリングのための協調インターフェースであるPromptHiveについて紹介する。
本研究は,数学の専門家10名を対象に評価研究を行い,358人の学習者を対象に,2つの共同筆記セッションと358人の学習者による学習成績研究を通じて設計を検証した。
本研究は,AIの専門家以外の専門家が,人為的な資料に匹敵するコンテンツを生成するプロンプトを作成できるように,プロンプトの反復プロセスを解明し,ツールのユーザビリティを検証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:18:24 GMT)
Generative Design of Functional Metal Complexes Utilizing the Internal Knowledge of Large Language Models [8.3] 大規模言語モデル(LLM)を進化最適化フレームワーク(LLM-EO)に導入する。
LLM-EOは, 事前学習中に得られたLSMの化学的知識を活用することで, 従来の遺伝的アルゴリズムを超越していることがわかった。
化学および材料設計におけるLCMに基づく進化的最適化の幅広い応用を予見する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:24:34 GMT)
Distributed Learning for UAV Swarms [8.2] フェデレートラーニング(FL)は、UAVが生データを共有せずにグローバルモデルを協調的にトレーニングすることを可能にする。
FLは、UAVが生データを共有せずに協調的にグローバルモデルを訓練することを可能にするが、UAVが収集したデータの非独立性と独立性(非IID)の性質のため、課題が発生する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:01:44 GMT)
Scene-Segmentation-Based Exposure Compensation for Tone Mapping of High Dynamic Range Scenes [8.2] マルチ露光画像融合(MEF)に基づくトーンマッピングのためのシーン分割に基づく新しい露出補償法を提案する。
提案手法は,入力されたHDR画像から異なる露光画像のスタックを生成し,それらを単一の画像に融合する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:50:02 GMT)
Traffic Matrix Estimation based on Denoising Diffusion Probabilistic Model [8.1] 本稿では分散確率モデル(DDPM)を分散学習に活用する。
我々は,各ODフローのデータバラツキを維持しつつ,TMの次元を小さくする前処理モジュールを設計する。
DDPMの雑音要因をパラメータ化し,TME問題を勾配差最適化問題に変換する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:34:17 GMT)
Exploring Pretraining via Active Forgetting for Improving Cross Lingual Transfer for Decoder Language Models [8.0] 大規模言語モデル(LLM)は、多数のNLPタスクにおいて例外的な機能を示す。
英語以外の言語に対するそのようなモデルの有効性は制限されることが多い。
能動的忘れを前提としたLLMは,新しい言語や目に見えない言語に適応する上で非常に有効であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:33:16 GMT)
Kaninfradet3D:A Road-side Camera-LiDAR Fusion 3D Perception Model based on Nonlinear Feature Extraction and Intrinsic Correlation [7.9] AI支援運転の開発に伴い、エゴ車両の3D知覚タスクのための多くの手法が登場した。
グローバルな視点と広いセンシング範囲を提供する能力によって、道端の視点は発展する価値がある。
本稿では,特徴抽出と融合モジュールを最適化したKaninfradet3Dを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:28:42 GMT)
A Kernelizable Primal-Dual Formulation of the Multilinear Singular Value Decomposition [7.8] MLSVD(Multilinear Singular Value Decomposition)はPCAとSVDの両方の特殊なケースとして回復する。
本稿では,特徴写像を用いたMLSVDの非線形拡張を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:33:05 GMT)
A Kernelizable Primal-Dual Formulation of the Multilinear Singular Value Decomposition [7.8] MLSVD(Multilinear Singular Value Decomposition)はPCAとSVDの両方の特殊なケースとして回復する。
本稿では,特徴写像を用いたMLSVDの非線形拡張を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:33:05 GMT)
Designing a Dataset for Convolutional Neural Networks to Predict Space Groups Consistent with Extinction Laws [7.8] 本稿では,一次元粉末回折パターンからなるデータセットを用いて,畳み込みニューラルネットワークを学習し,空間群を予測する。
結晶データベースから生成する従来の戦略ではなく,格子パラメータと排他法則に基づいて回折パターンを計算した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:32:39 GMT)
MBPU: A Plug-and-Play State Space Model for Point Cloud Upsamping with Fast Point Rendering [7.8] 我々は,Mambaアーキテクチャ上に構築されたMBPUというネットワークを導入する。
我々は同時に3次元位置ずれと1次元ポイント・ツー・ポイント距離を回帰量として予測し、グローバルな特徴を制約する。
高速点描画の利点により、MBPUは表面ノイズを効果的に排除し、高品質なアップサンプリングされた点雲が得られることに注意されたい。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:13:43 GMT)
TrafficGamer: Reliable and Flexible Traffic Simulation for Safety-Critical Scenarios with Game-Theoretic Oracles [7.6] 本稿では,一般的な道路運転をマルチエージェントゲームとして見ることにより,ゲーム理論的な交通シミュレーションを容易にするTrafficGamerを紹介する。
実世界のさまざまなデータセットにおける経験的パフォーマンスの評価において、TrafficGamerはシミュレートされたシナリオの忠実性と悪用性の両方を保証する。
結果は、TrafficGamerが様々なコンテキストにまたがって非常に柔軟なシミュレーションをしていることを示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:32:57 GMT)
Improving Instance Optimization in Deformable Image Registration with Gradient Projection [7.6] 変形可能な画像登録は本質的に多目的最適化問題である。
これらの矛盾する目的は、しばしば最適化結果の貧弱につながる。
ディープラーニングの手法は、大規模なデータセット処理の効率化により、最近この領域で人気を博している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:27:13 GMT)
Observation of the non-Hermitian skin effect and Fermi skin on a digital quantum computer [7.6] 汎用量子プロセッサ上での非エルミタンスキン効果(NHSE)の最初の観測を報告する。
複数のアンシラ量子ビットを選択後,このような非単体手術が体系的に実現可能であることを示す。
我々の研究は、今日の量子コンピュータにおける非エルミート格子現象の量子シミュレーションにおける重要なマイルストーンである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:47:17 GMT)
The effect of fine-tuning on language model toxicity [7.5] オープンモデルの普及に伴い、微調整言語モデルの人気が高まっている。
我々は、微調整が異なるオープンモデルの有害なコンテンツを出力する確率にどのように影響するかを評価する。
低ランク適応による開発者の調整モデル上でのパラメータ効率の微調整は,これらの結果を大きく変更できることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:39:09 GMT)
FSL-Rectifier: Rectify Outliers in Few-Shot Learning via Test-Time Augmentation [7.5] FSL(Few-shot-learning)は通常、トレーニング中に目に見えないクラスに属する画像(クエリ)を識別するモデルを必要とする。
生成画像コンバインダを用いて、原サンプルと適切な列車クラスサンプルを組み合わせることで、追加のテストクラスサンプルを生成する。
我々は、平均化によってより典型的な表現をもたらす拡張子を介して平均化された特徴を得る。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:06:15 GMT)
Wasserstein Gradient Flow over Variational Parameter Space for Variational Inference [7.4] 変分推論(VI)は、変分パラメータを調整し、変分分布を真の後部と密に整合させる最適化問題である。
この最適化問題に対処するためのワッサーシュタイン勾配降下法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:33:15 GMT)
Large Language Models in Computer Science Education: A Systematic Literature Review [7.2] 大規模言語モデル(LLM)は、幅広い自然言語処理タスク(NLP)において、ますます良くなっている。
最近、これらのモデルは、自然言語(NL)とプログラミング言語(PL)のギャップを埋めて、その能力をコーディングタスクに拡張した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:49:50 GMT)
On the VC dimension of deep group convolutional neural networks [7.2] 本稿では,グループ畳み込みニューラルネットワーク(GCNN)のReLU活性化機能を用いた一般化機能について検討する。
層数,重み,入力次元などの因子がVapnik-Chervonenkis(VC)次元にどのように影響するかを分析する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:16:06 GMT)
Natural Language Processing for Human Resources: A Survey [7.2] ヒューマン・リソース・ドメイン(HR)は自然言語処理(NLP)技術に関連する幅広いタスクを含む。
NLPの最近のブレークスルーは、この領域における工業的応用に大きな関心を惹き付けている。
同時に、HRドメインはNLP研究の最先端を駆動するユニークな課題も提示できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:41:00 GMT)
On metric choice in dimension reduction for Fréchet regression [7.2] ランダム応答とユークリッド予測器の回帰に対する次元減少部分空間の推定に対する計量選択の影響について検討した。
連続グルコースモニタリングデータに基づく血糖分布の分析により, 測定値の選択が実際の応用における発見にどのように影響するかが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:39:35 GMT)
On metric choice in dimension reduction for Fréchet regression [7.2] Fr'echetレグレッションは、非伝統的なデータ型を分析するために、現代のデータ分析において主要な存在になりつつある。
これは特に、継続的なモニタリングやイメージングデータのような複雑な健康データの分析に有用である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:39:35 GMT)
CPE-Pro: A Structure-Sensitive Deep Learning Model for Protein Representation and Origin Evaluation [7.2] 我々は,タンパク質構造の起源を表現・識別するために,構造に敏感な教師付き深層学習モデルであるCrystal vs Predicted Evaluator for Protein Structure (CPE-Pro)を開発した。
CPE-Proはタンパク質の構造情報を学習し、構造間の差異を捉え、4つのデータクラスの正確なトレーサビリティを実現する。
我々は Foldseek を用いてタンパク質構造を「構造配列」にエンコードし、タンパク質構造配列言語モデル SSLM を訓練した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:21:56 GMT)
HYGENE: A Diffusion-based Hypergraph Generation Method [7.0] 本稿では, 局所展開の進展による課題に対処する拡散型ハイパーグラフ生成(HYGENE)手法を提案する。
実験では、ハイジェネの有効性を示し、ハイパーグラフの様々な特性を忠実に模倣する能力を示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:47:29 GMT)
SPINACH: SPARQL-Based Information Navigation for Challenging Real-World Questions [6.9] 本稿では,Wikidata の "Request a Query" フォーラムでの議論から収集した KBQA データセットである SPINACH データセットを紹介する。
これらの内部クエリの複雑さはKBQAシステムと呼ばれるもので、大きく、しばしば不完全なスキーマを動的に探索し、それらについて推論することができる。
また、人間の専門家が難解な問題に対処するためにどのようにSPARQLを書くかを模倣する、SPINACHとも呼ばれる、コンテキスト内学習KBQAエージェントも導入しています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:17:56 GMT)
Sample Optimal and Memory Efficient Quantum State Tomography [6.8] サンプル最適性を保ちながらメモリ効率も高い量子状態トモグラフィーアルゴリズムを提案し,解析する。
私たちの仕事は、一元的なSchurサンプリングの形式で構築されており、サンプルへのストリーミングアクセスのみを必要とします。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:24:08 GMT)
CaTs and DAGs: Integrating Directed Acyclic Graphs with Transformers and Fully-Connected Neural Networks for Causally Constrained Predictions [6.7] CFCN(Causal Fully-Connected Neural Networks)とCaT(Causal Transformers)を紹介する。
CFCNsとCaTsは、DAG(Directed Acyclic Graph)によって規定された、予め定義された因果制約の下で動作する
これらのモデルは、基盤となる構造的制約に固執しながら、従来のニューラルネットワークの強力な関数近似能力を保持します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:26:40 GMT)
FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors [6.7] FrugalNeRFは,複数スケールにわたる重み共有ボクセルを利用してシーンの詳細を効率よく表現する,数発のNeRFフレームワークである。
我々の重要な貢献は、スケールをまたいだ再射誤差に基づいて擬似基底真理深さを選択する、クロススケールな幾何適応スキームである。
LLFF、DTU、RealEstate-10Kの実験では、FrugalNeRFは他の数発のNeRF法よりも優れ、トレーニング時間を大幅に短縮した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:59:53 GMT)
Diffusion-TS: Interpretable Diffusion for General Time Series Generation [6.6] Diffusion-TSは、高品質な時系列サンプルを生成する新しい拡散ベースのフレームワークである。
各拡散ステップのノイズの代わりにサンプルを直接再構成するようにモデルを訓練し、フーリエに基づく損失項を組み合わせた。
その結果,Diffusion-TSは時系列の様々な現実的解析において最先端の結果が得られることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:38:08 GMT)
Near-Optimal Algorithm for Non-Stationary Kernelized Bandits [6.4] 時変ベイズ最適化(英語版)とも呼ばれる非定常カーネル化バンドイット問題(KB)について検討する。
我々は,2乗指数およびマタン核を持つ非定常KBに対して,アルゴリズムに依存しない最初のリフレッシュローバウンドを示す。
本稿では,ランダムな置換による位相除去を再開する手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:28:26 GMT)
KatzBot: Revolutionizing Academic Chatbot for Enhanced Communication [6.3] KatzBotは、ドメイン固有の学術データに基づいてトレーニングされた、カスタムLarge Language Model(LLM)である。
オープンソースのLLMよりも優れており、高い精度とドメイン関連性を実現している。
KatzBotはユーザフレンドリーなインターフェースを提供し、現実世界のアプリケーションにおけるユーザの満足度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:01:08 GMT)
The Illusion of Competence: Evaluating the Effect of Explanations on Users' Mental Models of Visual Question Answering Systems [6.3] 我々は、AIシステムの限界が、完璧に実行できないタスクに遭遇したとき、ユーザーがどのように認識するかを検討する。
我々は、視覚的な入力を操作することでAIシステムの制限を制御する視覚的質問応答と説明タスクを採用する。
私たちのゴールは、参加者がシステムの限界を認識できるかどうかを決定することです。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:17:20 GMT)
Estimating Individual Dose-Response Curves under Unobserved Confounders from Observational Data [6.2] 本稿では,連続治療の因果効果を推定するための新しいフレームワークであるContiVAEについて述べる。
ContiVAEは既存の手法を最大62%上回り、その堅牢性と柔軟性を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:24:26 GMT)
Does quantum lattice sieving require quantum RAM? [6.2] 量子格子シービングにおける量子ランダムアクセスメモリ(QRAM)の要件について検討する。
特に、QRAMなしでは量子スピードアップは不可能である。
さらなる改善には、QRAMを使うための新しい方法が必要であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:22:59 GMT)
Comparing Differentiable and Dynamic Ray Tracing: Introducing the Multipath Lifetime Map [6.1] これらの課題に対処するために、微分可能および動的レイトレーシングフレームワークが登場した。
この2つのテクニックの概要と、NVIDIAのUniBoの3DSCATとSionnaの2つの最先端ツールの比較分析について述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:28:25 GMT)
A Theoretical Study of Neural Network Expressive Power via Manifold Topology [6.0] 実世界のデータに関する一般的な仮定は、それが低次元多様体の上または近くにあるということである。
本研究では,潜在データ多様体のネットワーク表現力について検討する。
本稿では,ReLUニューラルネットワークのサイズ上限について述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:10:24 GMT)
Deep Learning and Data Augmentation for Detecting Self-Admitted Technical Debt [6.0] Self-Admitted Technical Debt (SATD)は、開発者がテキストアーティファクトを使用して、既存の実装が最適でない理由を説明する状況を指す。
SATD と BERT のバイナリ識別に BiLSTM アーキテクチャを用い,様々な SATD の分類を行った。
異なるアーティファクトから派生した様々なデータセットからSATDを識別・分類するための2段階のアプローチを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:22:16 GMT)
Modeling dynamic neural activity by combining naturalistic video stimuli and stimulus-independent latent factors [6.0] 本稿では,刺激非依存の潜伏因子とともに映像入力を組み込んだ確率論的モデルを提案する。
マウスV1ニューロン反応のトレーニングとテストを行った結果、ビデオのみのモデルよりもログライクな結果が得られた。
その結果,学習した潜伏因子はマウスの行動と強く相関していることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:01:39 GMT)
TabSeq: A Framework for Deep Learning on Tabular Data via Sequential Ordering [5.9] この作業では、機能のシーケンシャルな順序付けのための新しいフレームワークであるTabSeqを紹介している。
このような機能の最適なシーケンス順序を見つけることで、ディープラーニングモデルの学習プロセスを改善することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:21:56 GMT)
Experimental observation of counter-intuitive features of photonic bunching [5.9] 区別不能なボソンは古典的で区別可能な粒子よりも反故意に束ねられることがある。
この設定では、区別不能な光子が実際に束縛される確率を最小化していることを示す。
これらの反直感現象の観察は、光子をルーティングするより効率的な方法を考案する際、ニュースの視点を開放する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:01:44 GMT)
LLM-TS Integrator: Integrating LLM for Enhanced Time Series Modeling [5.9] 天気予報や異常検出などの動的システムでは時系列モデリングが不可欠である。
近年,大規模言語モデル(LLM)をTSモデリングに利用し,その強力なパターン認識機能を活用している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:29:46 GMT)
Evaluating the Posterior Sampling Ability of Plug&Play Diffusion Methods in Sparse-View CT [5.8] Plug&Play(R)拡散モデルはCT再構成における最先端の手法である。
我々は,多くの投射を持つシングラムからの圧縮可能な流れ画像に興味を持ち,その結果,後部分布はピークやマルチモーダルにすらならない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:39:03 GMT)
Final Report for CHESS: Cloud, High-Performance Computing, and Edge for Science and Security [5.8] 継続プラットフォームの構築、ワークフロータスクのオーケストレーション、データセットのキュレーションといった方法は、パフォーマンス、エネルギ、セキュリティ、信頼性に関する科学的要件を達成できない。
報告では、オープンサイエンスの観点から、CHESSの結果と成功について述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:16:00 GMT)
XAI-FUNGI: Dataset resulting from the user study on comprehensibility of explainable AI algorithms [5.8] 本稿では、説明可能な人工知能(XAI)アルゴリズムの理解度に関するユーザ研究の結果であるデータセットを紹介する。
研究参加者は149人の候補者から募集され, 菌学領域の専門家を代表する3つのグループを結成した。
データセットの主な部分には39のインタビュー書が含まれており、参加者は、食べられるキノコと食べられないキノコを区別するために訓練された機械学習モデルの意思決定の解釈に関する一連のタスクと質問を完了するよう求められた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:37:58 GMT)
User-centric evaluation of explainability of AI with and for humans: a comprehensive empirical study [5.8] この研究はHuman-Centered Artificial Intelligence (HCAI)にある。
一般的に使用されるeXplainable Artificial Intelligence (XAI)アルゴリズムのユーザ中心評価の結果に焦点を当てている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:32:39 GMT)
Subword Embedding from Bytes Gains Privacy without Sacrificing Accuracy and Complexity [5.8] 本稿では,Bytes (SEB) からのSubword Embeddingを提案し,深層ニューラルネットワークを用いてサブワードをバイト列にエンコードする。
我々のソリューションは、効率や精度を犠牲にすることなく、プライバシを保ち、従来の手法よりも優れています。
機械翻訳、感情分析、言語モデリングにおいて、SEBは標準的なサブワード埋め込み手法よりも同等でより良い結果が得られることを検証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:25:24 GMT)
Cups and Gates I: Cohomology invariants and logical quantum operations [5.7] 微分階数代数の特定の性質を緩和する構造を持つ量子符号の装備方法を示す。
このアプローチから得られる論理ゲートは、一定の深さのユニタリ回路で実装することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:53:17 GMT)
LiteVLoc: Map-Lite Visual Localization for Image Goal Navigation [5.7] LiteVLocは、環境を表現するために軽量のトポメトリックマップを使用する視覚的ローカライゼーションフレームワークである。
学習に基づく特徴マッチングと幾何学的解法を利用して、メートル法ポーズ推定をすることで、ストレージオーバーヘッドを低減する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:35:08 GMT)
LiteVLoc: Map-Lite Visual Localization for Image Goal Navigation [5.7] LiteVLocは、環境を表現するために軽量のトポメトリックマップを使用する視覚的ローカライゼーションフレームワークである。
学習に基づく特徴マッチングと幾何学的解法を利用して、メートル法ポーズ推定をすることで、ストレージオーバーヘッドを低減する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:35:08 GMT)
GReFEL: Geometry-Aware Reliable Facial Expression Learning under Bias and Imbalanced Data Distribution [5.6] 信頼性のある表情学習には、表情の特徴を効果的に学習することが含まれる。
現在のシステムは、独特の顔の構造、動き、トーン、人口統計などにより、人の表情のばらつきが原因で、FELタスクに苦慮している。
我々はGReFELを導入し、視覚変換器と顔形状認識アンカーベースの信頼性バランスモジュールを導入した。
本手法は, クラス内差, クラス間類似性, スケール感度による偏りとラベルのずれを調整し, 包括的, 正確, 信頼性の高い表情予測を行う。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:55:06 GMT)
LiMTR: Time Series Motion Prediction for Diverse Road Users through Multimodal Feature Integration [5.6] 我々はPointNet基盤モデルアーキテクチャに基づく動き予測の新しい手法を開発した。
私たちはLiMTRモデルのコードをオープンソースにしています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:35:57 GMT)
Observation of anomalous information scrambling in a Rydberg atom array [5.6] 量子情報スクランブル(quantum information scrambling)は、局所情報の伝播と効果的な損失を記述する。
本稿では,原子型ツイーザアレイに衝突する異常情報の実験的観察を報告する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:40:25 GMT)
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization [5.6] 混合精度量子化は重要なパラメータと重要でないパラメータを区別する。
既存の手法は定性的分析と手動実験によってのみ重要なパラメータを識別できる。
本稿では,パラメータの重要性を総合的に評価する定量的枠組みを構築するために,いわゆる「精度アライメント」という新しい基準を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:06:01 GMT)
PALMS: Plane-based Accessible Indoor Localization Using Mobile Smartphones [5.5] PALMSはモバイルスマートフォンにおける革新的なグローバルローカライゼーションと再ローカライゼーションシステムである。
本システムでは,1つの瞬時観測と計測データを考慮した動的局所化方式を採用している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:05:07 GMT)
Efficient Neural Network Training via Subset Pretraining [5.4] ニューラルネットワークのトレーニングでは、バッチ上で計算された部分勾配を使用するのが一般的である。
トレーニングセットの損失最小限は、そのサブセットのミニマによって適切に近似されることが期待できる。
実験の結果 従来の訓練に匹敵する結果に 達できることが確認されました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:31:12 GMT)
Du-IN: Discrete units-guided mask modeling for decoding speech from Intracranial Neural signals [5.3] エレクトロコルチコグラフィー(ECoG)を用いた脳-コンピュータインタフェースは,医療応用における高性能音声復号化を約束している。
離散コーデックス誘導マスクモデリングにより,領域レベルのトークンに基づくコンテキスト埋め込みを抽出するDu-INモデルを開発した。
本モデルでは,61ワードの分類タスクにおいて,すべてのベースラインを越えながら最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:10:20 GMT)
Self-Explained Keywords Empower Large Language Models for Code Generation [5.2] 大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを達成した。
Sek(textbfSelf-textbfExplained textbfKeywords)は、LLM自体による問題記述における重要な用語を抽出し、説明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:52:03 GMT)
Focus Where It Matters: Graph Selective State Focused Attention Networks [5.2] 本稿では,グラフ構造化データに対するGSAN(Graph Selective States Focused Attention Networks)に基づくニューラルネットワークアーキテクチャを提案する。
GSANは、MHMSA(Multi-head masked self-attention)層と選択状態空間モデリング(S3M)層によって実現されている。
S3M層は、目に見えない構造の一般化を促進し、ノード状態がリンクの重要性にどのように影響するかを解釈する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:25:52 GMT)
GFlowNets for Hamiltonian decomposition in groups of compatible operators [5.2] 現在の量子アルゴリズムは、ハードウェアの制限と、化学的精度を達成するために必要な測定回数の増加によって制約されている。
本稿では,GFlowNets を用いて,与えられたハミルトニアン内における完全 (FC) あるいは qubit-wise commuting (QWC) 項をグループ化する確率的フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:14:29 GMT)
A Quantum Optimization Algorithm for Optimal Electric Vehicle Charging Station Placement for Intercity Trips [5.2] 電気自動車(EV)は輸送システムの持続可能性を高める上で重要な役割を果たしている。
大規模輸送ネットワークにおける最適充電ステーション位置の発見は、よく知られたNPハード最適化問題を示す。
本稿では,このNP-hard問題の解法効率を高めるために,量子探索に基づく最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:37:38 GMT)
Distributed Thompson sampling under constrained communication [5.2] ガウス過程を代理モデルとして用いた分散トンプソンサンプリングをマルチエージェントベイズ最適化問題に適用する。
分散トンプソンサンプリング実装では、各エージェントが隣人からサンプルポイントを受け取り、そこで通信ネットワークはグラフに符号化される。
ベイズ的単純回帰(Bayesian Simple Regret)の理論的境界を示し、この境界は通信グラフの最大の完全部分グラフのサイズに依存する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:00:31 GMT)
Modelling Concurrent RTP Flows for End-to-end Predictions of QoS in Real Time Communications [5.2] 本稿では,QoS(Quality of Service)メトリクスを予測するための新しいディープラーニングフレームワークであるPacket-to-Prediction (P2P)を提案する。
我々は,無制限のRTPフローを処理可能な合理化アーキテクチャを実装し,マルチタスク学習パラダイムを用いて4つの重要なメトリクスを1ショットで予測する。
我々の研究は、実ビデオ通話中に収集された広範囲なトラフィックに基づいており、P2Pは予測性能と時間効率の両方で比較モデルに優れています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:16:56 GMT)
A Survey of Decomposition-Based Evolutionary Multi-Objective Optimization: Part I-Past and Future [5.1] 進化的多目的最適化の文脈では分解は適切に研究されなかった。
MoEA/Dは、この領域の最新の開発をレビューするために、分解ベースのEMOの代表である。
第1部では,MOEA/Dの発展を起源から現在までの包括的調査を行う。
最終段階では、今後の発展に向けての新たな方向性に光を当てています。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:13:24 GMT)
Error-Mitigated Quantum Random Access Memory [5.1] 本稿では,ZNE (Zero-Noise Extrapolation) の修正版を提案する。
以上の結果から,ZNEにおける外挿機能の役割が示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:41:09 GMT)
UNetMamba: An Efficient UNet-Like Mamba for Semantic Segmentation of High-Resolution Remote Sensing Images [5.0] UNetMambaは、MambaをベースにしたUNetに似たセマンティックセグメンテーションモデルである。
UNetMambaは、mIoUによる最先端の手法よりも、LoveDAでは0.87%、ISPRS Vaihingenでは0.39%向上している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:04:16 GMT)
Focus on BEV: Self-calibrated Cycle View Transformation for Monocular Birds-Eye-View Segmentation [4.9] Birds--EyeView (BEV)セグメンテーションは、視点からトップビューへの空間マッピングを確立することを目的としている。
近年の研究では、画像空間におけるBEV非依存的特徴の破壊により、ビュートランスフォーメーションの困難に直面している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:00:52 GMT)
Learning How to Vote With Principles: Axiomatic Insights Into the Collective Decisions of Neural Networks [4.8] 我々は、好みを集約するニューラルネットワークを構築し評価するフレームワークである、公理的なディープ投票を提案する。
1) ニューラルネットワークは, 精度が高いにもかかわらず, 投票規則の中核となる公理と一致せず, 結果の模倣と推論の解離が明らかになることが多い。
単に公理満足度を最適化することによって、ニューラルネットワークは、しばしば既存のものと大きく異なる新しい投票規則を合成することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:35:58 GMT)
Do Large Language Models Need a Content Delivery Network? [4.8] 我々は、LLMエンジンや他の計算および記憶資源間でKVキャッシュのストレージ、転送、構成を動的に最適化する知識配信ネットワーク(KDN)を構想する。
我々は、KDNプロトタイプをhttps://github.com/LMCache/LMCacheでオープンソース化しました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:59:18 GMT)
Do Large Language Models Need a Content Delivery Network? [4.8] 我々は、LLMエンジンや他の計算および記憶資源間でKVキャッシュのストレージ、転送、構成を動的に最適化する知識配信ネットワーク(KDN)を構想する。
我々は、KDNプロトタイプをhttps://github.com/LMCache/LMCacheでオープンソース化しました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:59:18 GMT)
Tokenization and Morphology in Multilingual Language Models: A Comparative Analysis of mT5 and ByT5 [4.8] トークン化の影響を、mT5とByT5という2つの多言語言語モデルと対比して捉えた。
4つのタスクと17の言語でこれらのモデルに符号化された形態学的知識を解析した結果、モデルが他の言語よりも優れた形態学系を学習していることが判明した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:49:33 GMT)
Patrol Security Game: Defending Against Adversary with Freedom in Attack Timing, Location, and Duration [4.8] パトロール・セキュリティ・ゲーム(Patrol Security Game、PSG)は、ロボットパトロール問題である。
我々の目標は、攻撃者の時間的地平線を最小化する合成スケジュールを考案することである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:53:18 GMT)
High-efficiency quantum Monte Carlo algorithm for extracting entanglement entropy in interacting fermion systems [4.8] 物理パラメータに沿ったインクリメンタル手法に基づくフェルミオン量子モンテカルロアルゴリズムを提案する。
アルゴリズムの有効性を示し、高い精度を示す。
このシミュレーションでは、エントロピーのエントロピーの計算されたスケーリング挙動は、フェルミ面とゴールドストーンモードの異なる位相を解明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:36:55 GMT)
High-efficiency quantum Monte Carlo algorithm for extracting entanglement entropy in interacting fermion systems [4.8] 物理パラメータに沿ったインクリメンタル手法に基づくフェルミオン量子モンテカルロアルゴリズムを提案する。
アルゴリズムの有効性を示し、高い精度を示す。
このシミュレーションでは、エントロピーのエントロピーの計算されたスケーリング挙動は、フェルミ面とゴールドストーンモードの異なる位相を解明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:36:55 GMT)
Federated Learning with MMD-based Early Stopping for Adaptive GNSS Interference Classification [4.7] フェデレートラーニング(FL)は、複数のデバイスがローカルサーバ上のデータを維持しながら、グローバルモデルを協調的にトレーニングすることを可能にする。
本稿では,グローバルサーバ上でのモデルの重み付けと数ショット学習を用いたFL手法を提案する。
FLの模範的な応用は、グローバルナビゲーション衛星システム(GNSS)受信機からのスナップショットに基づいた干渉分類のために、高速道路に沿って機械学習モデルを編成することである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:43:04 GMT)
This Too Shall Pass: Removing Stale Observations in Dynamic Bayesian Optimization [4.6] 我々は、データセットから無関係な観測をその場で除去できるDBOアルゴリズムを構築した。
We establish the superiority of W-DBO which is outperforming state-of-the-art method by a comfortable margin。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:40:09 GMT)
Comparative Study of Multilingual Idioms and Similes in Large Language Models [4.6] 本研究は, チェーン・オブ・ソート, 少数ショット, 英語翻訳プロンプトなど, 迅速なエンジニアリング戦略の有効性について検討する。
これらのデータセットの言語をペルシア語にも拡張し、2つの新しい評価セットを構築します。
本研究により, 迅速な工学手法は一般的に有効であるが, その成功は図形型, 言語, モデルによって異なることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:40:05 GMT)
Mean-Field Simulation-Based Inference for Cosmological Initial Conditions [4.5] フーリエ空間における対角ガウス場に対する初期物質密度場の後方分布をモデル化したベイズ場再構成法を提案する。
トレーニングとサンプリングは非常に速い(トレーニング: $sim 1, Mathrmh$ on a GPU, sample: $lesssim 3, Mathrms$ for 1000 sample at resolution $1283$)。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:23:50 GMT)
Analyzing Closed-loop Training Techniques for Realistic Traffic Agent Models in Autonomous Highway Driving Simulations [4.5] 我々は,高速道路走行シミュレーションのための閉ループ手法に着目し,異なる訓練原理の広範な比較分析を行う。
我々は, (i) オープンループ対クローズドループマルチエージェントトレーニング, (ii) 逆逆対決定論的指導トレーニング, (iii) 強化損失の影響, (iv) ログ再生エージェントと併用したトレーニングの影響を実験的に比較し, 現実的なエージェントモデリングに適したトレーニングテクニックを同定した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:16:58 GMT)
Visual Motif Identification: Elaboration of a Curated Comparative Dataset and Classification Methods [4.4] 映画では、視覚的なモチーフは、芸術的または美的な意味を持つ反復的な図形的構成である。
私たちのゴールは、これらのモチーフを認識して分類することであり、その目的にカスタムデータセットを使用する新しい機械学習モデルを提案することです。
CLIPモデルから抽出した機能を、浅いネットワークと適切な損失を用いて、20の異なるモチーフに分類し、驚くほど良い結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:50:00 GMT)
Multi-Sensor Fusion for UAV Classification Based on Feature Maps of Image and Radar Data [4.4] 本稿では,すでに処理されているマルチセンサデータを新しいディープニューラルネットワークに融合させて,UAV検出のための分類精度を高めるシステムを提案する。
このモデルは、熱、光、レーダーデータに関連する個々の物体の検出と分類モデルから抽出された高レベル特徴を融合する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:12:37 GMT)
Fixed-Point Automatic Differentiation of Forward--Backward Splitting Algorithms for Partly Smooth Functions [4.4] 近位分割アルゴリズムの固定点反復にインプリシット(ID)と自動微分(AD)を適用する。
これらのアルゴリズムによって生成される列のADが解写像の微分に収束することを示す。
FPAD(Fixed-Point Automatic Differentiation)と呼ばれる自動微分の変種については、逆モードADのメモリオーバーヘッド問題を改善する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:28:18 GMT)
Automatic Differentiation of Optimization Algorithms with Time-Varying Updates [4.4] 本研究では, 時間変化した反復過程に非回転あるいは自動微分を適用し, 導関数の収束保証を行う。
我々はこれらの収束結果に適応し、部分スムーズな問題を解く際に、可変ステップサイズとFISTAによる近位勾配降下に適用する。
理論的および数値的な結果は,アルゴリズムの収束速度が微分イテレートに反映されていることを示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:53:49 GMT)
Leveraging Retrieval-Augmented Generation for Culturally Inclusive Hakka Chatbots: Design Insights and User Perceptions [4.4] 本研究は台湾のハッカ文化の豊かな遺産を推進・保護するための画期的なアプローチを紹介する。
外部データベースと生成AIモデルを統合することで、RAGテクノロジはこのギャップを埋める。
これは、デジタルプラットフォームが文化的アイデンティティを希薄にする時代において特に重要である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:36:08 GMT)
Towards a Reliable Offline Personal AI Assistant for Long Duration Spaceflight [4.4] 本稿では, GPT, Retrieval-Augmented Generation (RAG), Knowledge Graphs (KGs), Augmented Reality (AR)を統合したMETISなどの拡張システムを提案する。
そのアイデアは、宇宙飛行士が自然言語のクエリを使って、より直感的に自分のデータと対話し、ARでリアルタイム情報を視覚化できるようにすることだ。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:08:42 GMT)
MoRE: Multi-Modal Contrastive Pre-training with Transformers on X-Rays, ECGs, and Diagnostic Report [4.3] 我々は,X線,心電図(ECG),放射線学・心臓医学報告を相乗的に組み合わせた,新しいマルチモーダルコントラスト事前学習フレームワークを提案する。
我々はLoRA-Peftを用いて、LLMにおけるトレーニング可能なパラメータを著しく削減し、視覚変換器(ViT)に最近の線形アテンション降下戦略を取り入れ、よりスムーズなアテンションを実現する。
我々の知る限り、我々はX線、心電図、放射線学・医学レポートをこの手法と組み合わせた統合モデルを提案している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:42:41 GMT)
AutoTrain: No-code training for state-of-the-art models [4.2] AutoTrain Advancedはオープンソースのライブラリで、カスタムデータセット上でモデルをトレーニングするためのベストプラクティスを提供する。
完全にローカルモードまたはクラウドマシンで使用することができ、Hugging Face Hubで共有される数万のモデルで動作する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:53:32 GMT)
Habaek: High-performance water segmentation through dataset expansion and inductive bias optimization [4.2] 本研究では,ADE20K や RIWA などのデータセットを用いたデータ拡張によるセグメンテーションのためのセグフォーマーモデルの改良を提案する。
提案するHabaekモデルは, 0.9 1986 から 0.94397 までの IoU (Intersection over Union) で, 現在のモデルよりも高い性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:06:13 GMT)
Increasing Interpretability of Neural Networks By Approximating Human Visual Saliency [4.1] 近年の進歩は、個々の画像内の人間の定義した塩分濃度領域への誘導モデルが、性能と解釈可能性を大幅に向上させることを示している。
そこで本研究では,人体塩分からの解釈可能性と性能向上を維持しつつ,80%の人体アノテーションデータを削減するために,人体塩分取り込みと能動的学習の組み合わせ戦略を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:42:27 GMT)
Distributed Online Life-Long Learning (DOL3) for Multi-agent Trust and Reputation Assessment in E-commerce [4.1] eコマースのような市民中心の環境におけるサービス提供者の信頼と評価は、エージェント間の相互作用の整合性を維持するために不可欠である。
本稿では,信頼度と評価スコアをリアルタイムに学習する分散オンラインライフロングラーニング(DOL3)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:37:55 GMT)
Implicit Regularization for Tubal Tensor Factorizations via Gradient Descent [4.0] 遅延学習体制を超えて過度にパラメータ化されたテンソル分解問題における暗黙正則化の厳密な解析を行う。
勾配流ではなく勾配降下の種別の最初のテンソル結果を証明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:52:01 GMT)
Enabling Asymmetric Knowledge Transfer in Multi-Task Learning with Self-Auxiliaries [4.0] 本研究では,知識伝達が他者の学習を妨げることなく,特定のタスクの学習を支援する非対称なタスク関係について検討する。
本研究では,非対称にタスク間の知識を柔軟に伝達する学習プロセスに,自己辞書と呼ばれる追加のクローンタスクを含む最適化戦略を提案する。
非対称な知識伝達は、ベンチマークコンピュータビジョン問題における既存のマルチタスク最適化戦略と比較して、性能が大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:57:25 GMT)
Scalable Simulation-free Entropic Unbalanced Optimal Transport [4.0] エントロピック・アンバランス・オプティマルトランスポート(EUOT)問題を解くために,スケーラブルでシミュレーション不要なアプローチを導入する。
これらの特性を活用することにより、シミュレーションフリーEUOT(SF-EUOT)と呼ばれるEUOTを解くシミュレーションフリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:50:35 GMT)
Scalable Simulation-free Entropic Unbalanced Optimal Transport [4.0] エントロピック・アンバランス・オプティマルトランスポート(EUOT)問題を解くために,スケーラブルでシミュレーション不要なアプローチを導入する。
これらの特性を活用することにより、シミュレーションフリーEUOT(SF-EUOT)と呼ばれるEUOTを解くシミュレーションフリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:50:35 GMT)
A Bi-consolidating Model for Joint Relational Triple Extraction [4.0] リレーショナルトリプルを抽出する現在の手法は、エンティティ認識に依存することなく、生文の可能なエンティティペアに基づいて直接予測を行う。
このタスクは、複数の関係三重項が文中に1つまたは2つの実体を共有するという深刻な意味的重なり合う問題に悩まされる。
関係三重関係に関連する局所的・大域的意味的特徴を同時に強化することにより、この問題に対処するバイコンソリデーションモデルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:29:44 GMT)
MIK: Modified Isolation Kernel for Biological Sequence Visualization, Classification, and Clustering [3.9] 本研究は,ガウスカーネルの代替として,改良分離カーネル (MIK) と呼ばれる新しいアプローチを提案する。
MIKは適応密度推定を用いて局所構造をより正確に捉え、ロバストネス対策を統合する。
局所的および大域的な構造の保存を改善し、組込み空間におけるクラスタとサブクラスタのより良い可視化を可能にする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:57:09 GMT)
Semidefinite optimization of the quantum relative entropy of channels [3.9] 本稿では,チャネルの量子相対エントロピーを計算する方法を提案する。
これは、任意の所望の精度で真の値をサンドイッチする効率的な計算可能な上界と下界を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:01 GMT)
On the Design and Performance of Machine Learning Based Error Correcting Decoders [3.8] まず, 単一ラベル型ニューラルネットワーク (SLNN) とマルチラベル型ニューラルネットワーク (MLNN) のデコーダについて検討した。
次に、エラー訂正符号変換器(ECCT)とクロスアテンションメッセージパッシング変換器(CrossMPT)という、2つのトランスフォーマーベースのデコーダに注目します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:23:23 GMT)
Towards Kriging-informed Conditional Diffusion for Regional Sea-Level Data Downscaling [3.8] 地球規模の気候モデルや衛星データから粗解射影を推定すると、下降問題は、より詳細な地域気候データを推定することを目的としている。
この問題は、気候変動による重大なリスクに対する効果的な適応、緩和、レジリエンスに社会的に不可欠である。
そこで本稿では, 空間的変動を抑えつつ, 微細な特徴を保ちながら, 空間的変動を捉えるためのKriging-informed Conditional Diffusion Probabilistic Model (Ki-CDPM)を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:24:10 GMT)
Enhanced Prompt-leveraged Weakly Supervised Cancer Segmentation based on Segment Anything [3.8] がんなどの疾患の病理診断は、従来、医師や病理医による形態学的特徴の評価に頼っていた。
近年,診断支援ツールとしてコンピュータ支援診断(CAD)システムの進歩が注目されている。
本稿では,クラスアクティベーションマップとSAMに基づく擬似ラベルを組み合わせ,弱教師付きセマンティックセマンティックセグメンテーション(WSSS)モデルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:29:23 GMT)
Dynamics of Moral Behavior in Heterogeneous Populations of Learning Agents [3.7] 本研究では、道徳的に異質な集団が社会的ジレンマ環境で相互作用する学習力学について研究する。
我々は、親社会と反社会的エージェント間のいくつかの非自明な相互作用を観察する。
ある種の道徳的エージェントは、より協調的な行動に向けて利己的なエージェントを操ることができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:47:44 GMT)
On Divergence Measures for Training GFlowNets [3.7] 生成フローネットワーク(Generative Flow Networks, GFlowNets)は、構成可能なオブジェクト上の非正規分布のサンプルとして設計された、償却推論モデルである。
伝統的に、GFlowNetsのトレーニング手順は、提案(フォワードポリシー)とターゲット(バックポリシー)の分布の対数二乗差を最小限にすることを目指している。
我々は、Renyi-$alpha$'s, Tsallis-$alpha$'s, reverse and forward KL'sという4つの分岐測度を概観し、GFlowNetsの学習文脈における勾配に対する統計的に効率的な推定器を設計する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:27:30 GMT)
On Divergence Measures for Training GFlowNets [3.7] 生成フローネットワーク(Generative Flow Networks, GFlowNets)は、構成可能なオブジェクト上の非正規分布のサンプルとして設計された、償却推論モデルである。
伝統的に、GFlowNetsのトレーニング手順は、提案(フォワードポリシー)とターゲット(バックポリシー)の分布の対数二乗差を最小限にすることを目指している。
我々は、Renyi-$alpha$'s, Tsallis-$alpha$'s, reverse and forward KL'sという4つの分岐測度を概観し、GFlowNetsの学習文脈における勾配に対する統計的に効率的な推定器を設計する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:27:30 GMT)
Comparing the information content of probabilistic representation spaces [3.7] 確率的表現空間は、データセットに関する情報を伝達し、トレーニング損失やネットワークアーキテクチャなどの要因の影響を理解するために、そのような空間の情報内容を比較する。
ここでは、ポイントベースの比較尺度に基づいて構築する代わりに、ハードクラスタリングに関する文献から古典的な手法に基づいて構築する。
本稿では,データセットのサンプルを用いて表現空間をフィンガープリントする手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:50:10 GMT)
Behavior-Inspired Neural Networks for Relational Inference [3.7] 最近の研究は、エージェント間の関係を、その身体行動の観察に基づいて分類することを学ぶ。
エージェントの観測可能な振る舞いと,その動作を決定する潜在カテゴリの抽象化レベルを導入する。
エージェントの身体的近さと嗜好を非線形意見力学モデルに統合し、相互排他的潜在カテゴリを特定し、エージェントの時間的進化を予測し、エージェントの身体的挙動を制御するメカニズムを提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:16:51 GMT)
A physics-informed neural network framework for modeling obstacle-related equations [3.7] 物理インフォームドニューラルネットワーク(PINN)は、スパースデータとノイズデータに基づいて偏微分方程式を解く魅力的なツールである。
ここでは、PINNを拡張して障害物関連PDEを解くことで、計算上の大きな課題を提示します。
提案したPINNの性能は、正規および不規則な障害物を受ける線形および非線形PDEの複数のシナリオで実証される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:29:32 GMT)
Disease Outbreak Detection and Forecasting: A Review of Methods and Data Sources [3.6] 感染症の早期発見と追跡は、死亡率を低下させる可能性がある。
多くの国が感染症監視システムを導入しており、疫病の発見が主な目的となっている。
インターネットとソーシャルメディアは、ユーザが好みや関係に関する情報を共有する重要なプラットフォームになっている。
本稿では,時系列データを用いたアウトブレイク検出のための研究者による既存の標準手法について概説する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:20:06 GMT)
Promoting cross-modal representations to improve multimodal foundation models for physiological signals [3.6] マスク付きオートエンコーディング目標を用いて,マルチモーダルモデルの事前学習を行う。
このモデルでは,様々な下流タスクに対して線形に探索できる表現を学習できることが示されている。
クロスモダリティを誘導する明示的な手法は、マルチモーダル事前訓練戦略を強化する可能性があると論じる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:47:36 GMT)
Can Large Language Models Invent Algorithms to Improve Themselves? [3.6] 大規模言語モデル(LLM)は、顕著なパフォーマンス向上を示し、業界で急速に採用されている。
LLMが自律的にモデル改善アルゴリズムを生成・学習することを可能にするセルフ開発フレームワークを提案する。
数学的推論タスクでは、Self-Developingはシードモデルを超えたモデルを生成するだけでなく、人間が設計したアルゴリズムで作成したモデルよりも一貫して優れている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:57:09 GMT)
ReLU neural network approximation to piecewise constant functions [3.6] 3層ReLU NNは任意の定数関数を正確に近似するのに十分であることを示す。
不連続界面が凸であれば、正確な重みと偏りを持つReLU NN近似の分析式が提供される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:58:34 GMT)
Language Model Council: Democratically Benchmarking Foundation Models on Highly Subjective Tasks [3.6] 言語モデル協議会(LMC: Language Model Council)では、LLMのグループが協力してテストを作成し、それに反応し、お互いの反応を評価してランキングを作成する。
感情的インテリジェンスに関する詳細なケーススタディでは、対人対立に対するオープン・エンド・レスポンスにおいて、20の最近のLCMを相互にランク付けするために配置する。
以上の結果から, LMCは, より分離性が高く, より堅牢なランキングを作成でき, ユーザスタディにより, 個々のLCM審査員よりも人的評価に整合性があることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:32:51 GMT)
Efficient and Universally Accessible Cross-Chain Options without Upfront Holder Collateral [3.6] 本稿では,効率的なオプション取引のためのプロトコルを提案する。
当社のプロトコルの普遍性によって、textitany$のアセットに約$textitany$を含む、クロスチェーンオプションが2つの異なるブロックチェーンで可能になる。
オプションライターから保証を導入することで、我々のプロトコルは保持者から事前の担保の必要性を排除します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:43:20 GMT)
A Trust-Region Method for Graphical Stein Variational Inference [3.6] スタイン変分法 (SVI) は、サンプル位置を情報理論尺度に共同最適化してサンプルセットを生成するサンプルベースの近似推論手法である。
本稿では,これらの課題に対処する新しい信頼条件付きアプローチを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:59:01 GMT)
Learning Personalized Scoping for Graph Neural Networks under Heterophily [3.5] 異種ノードが接続する傾向がある不テロ親和性グラフは、グラフニューラルネットワーク(GNN)に挑戦する
我々は、ノード分類におけるGNN過度適合を克服する、個別のスコープ分類問題としてパーソナライズされたスコーピングを形式化する。
本稿では,GNN推論のみに参加する軽量なアプローチであるAdaptive Scope (AS)を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:07:06 GMT)
Vulnerabilities in Machine Learning-Based Voice Disorder Detection Systems [3.5] 分類を逆転させ、信頼性を損なう攻撃の可能性を探る。
個人の健康情報の重要性を考えると、攻撃の種類が効果的であるかを理解することは、このようなシステムのセキュリティを改善するための第一歩となる。
以上の結果から,医療領域で使用される機械学習システムにおいて,これらの脆弱性に対処する必要性が指摘され,最も効果的な攻撃戦略が明らかになった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:14:44 GMT)
Developing Retrieval Augmented Generation (RAG) based LLM Systems from PDFs: An Experience Report [3.5] 本稿では,PDF文書を主データ源とする検索拡張生成システム(RAG)の開発経験報告について述べる。
RAGアーキテクチャは、Large Language Models (LLM) の生成能力と情報検索の精度を組み合わせたものである。
この研究の実際的な意味は、様々な分野における生成AIシステムの信頼性を高めることである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:21:49 GMT)
The Social Cost of Growth: Evaluating GMV-Centric and Welfare-Centric Strategies in Online Food Delivery Platforms [3.4] GMV戦略は、短期的な取引の急速な成長を促すが、不均一な福祉の分配につながる。
福祉中心の戦略は、消費者、レストラン、配達労働者の間でよりバランスよく公平な利益分配を促進する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:55:59 GMT)
ZK-DPPS: A Zero-Knowledge Decentralised Data Sharing and Processing Middleware [3.3] 従来のZKPを必要としないゼロ知識通信を実現するフレームワークであるZK-DPPSを提案する。
プライバシは、計算のためのFHE(Fully Homomorphic Encryption)と鍵再構成のためのSMPC(Secure Multi-Party Computations)を組み合わせることで保持される。
シミュレーションサプライチェーンシナリオによるZK-DPPSの有効性を実証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:23:37 GMT)
Back-in-Time Diffusion: Unsupervised Detection of Medical Deepfakes [3.3] 拡散モデルに基づく医用画像のための新しい異常検出法を提案する。
モデルに疑似画像上の拡散を逆転させることにより、類似したプロセスを用いて合成内容を検出する方法を示す。
本手法は非監視検出器の他の状態よりも有意に優れており,AUCは0.79から0.9、除去用0.91から0.96から0.9に増加した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:57:56 GMT)
Resource-Efficient Medical Report Generation using Large Language Models [3.3] 医療報告生成は胸部X線画像の放射線診断レポートを自動作成する作業である。
本稿では,医療報告生成のタスクに視覚対応大規模言語モデル(LLM)を活用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:08:18 GMT)
Contrastive random lead coding for channel-agnostic self-supervision of biosignals [3.1] 本稿では, チャネルに依存しない生体信号の自己超越に対して, CRLC(Contrative random lead coding)を導入する。
脳波と心電図のデータに基づいてモデルを事前学習し、下流のタスクのためにそれらを微調整することで、我々のアプローチを検証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:33:45 GMT)
Gradient-Free Supervised Learning using Spike-Timing-Dependent Plasticity for Image Recognition [3.1] スパイキングニューラルネットワークにおける教師あり学習へのアプローチは、画像認識のためのスパイクタイピング依存の可塑性と組み合わせて、勾配のない手法を用いて提示される。
提案するネットワークアーキテクチャは、複数の層にスケーラブルであり、より複雑で深いSNNモデルの開発を可能にする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:32:17 GMT)
Universal time evolution of string order parameter in quantum critical systems with boundary invertible or non-invertible symmetry breaking [3.1] 系が平衡から外れた場合,対称性を破る境界や界面の影響について検討する。
文字列順序パラメータの時間的進化により,境界対称性や界面対称性の破れが検出可能であることを示す。
より明確に言えば、境界や界面対称性の破れの存在下では、弦の順序パラメータは、大域的な量子クエンチの後に指数関数的に減衰する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:12:47 GMT)
Rulebreakers Challenge: Revealing a Blind Spot in Large Language Models' Reasoning with Formal Logic [3.1] 本研究では,論理的含意が現実的に許容できる推論から分岐する事例を指す「ルールブレーカー(rulebreaker)」の概念を紹介する。
RULEBREAKERSは,ルールブレーカーと非ルールブレーカーを区別する大規模言語モデルの能力を評価するための新しいデータセットである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:48:16 GMT)
Theoretical Insights into Line Graph Transformation on Graph Learning [3.1] 線グラフ変換はグラフ理論において広く研究されており、線グラフの各ノードは元のグラフのエッジに対応する。
これは、変換された線グラフに適用された一連のグラフニューラルネットワーク(GNN)にインスピレーションを与え、様々なグラフ表現学習タスクに有効であることが証明された。
本研究では,Weisfeiler-Leman (WL) テストに挑戦することが知られている2種類のグラフ,Cai-F"urer-Immerman (CFI) グラフと強い正則グラフに着目した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:04:50 GMT)
Addressing Spectral Bias of Deep Neural Networks by Multi-Grade Deep Learning [3.0] ディープニューラルネットワーク(DNN)は、関数の低周波成分の学習を優先し、その高周波の特徴を捉えるのに苦労する傾向を示す。
本稿では、複数のSNNを構成することで高周波成分を含む関数を学習し、それぞれが与えられたデータから特定の低周波情報を学ぶことを提案する。
本研究は,MGDLが高周波情報を含む機能に優れていることを明らかにする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:34:33 GMT)
Reinforcement Learning for Molecular Dynamics Optimization: A Stochastic Pontryagin Maximum Principle Approach [3.0] 分子動力学を最適化する新しい強化学習フレームワークを提案する。
われわれのフレームワークは、最終的な分子構成だけでなく、軌道全体に焦点を当てている。
本手法は, 創薬や分子設計などの分野への応用に適している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:46:52 GMT)
Beware of Words: Evaluating the Lexical Diversity of Conversational LLMs using ChatGPT as Case Study [3.0] 対話型大言語モデル(LLM)が生成するテキストの語彙的リッチ性の評価と,それがモデルパラメータにどのように依存するかを検討する。
その結果、語彙豊かさがChatGPTのバージョンと、そのパラメータのいくつか、例えば存在ペナルティやモデルに割り当てられた役割にどのように依存しているかが示される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:02:00 GMT)
Reducing annotator bias by belief elicitation [3.0] アノテーションやインスタンスの数を必要とせずに、アノテーションのバイアスを処理するための簡単な方法を提案する。
我々は、アノテータが他のアノテータのインスタンスに対する判断に対する信念について、これらの信念が判断よりもより代表的なラベルを提供するかもしれないという仮説の下で尋ねる。
その結果、アノテータの2つのグループ間の体系的な差異として定義されるバイアスは、判断の代わりに信念を求める際に一貫して減少することが示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:44:01 GMT)
Using a quantum SWAP engine to experimentally validate thermodynamic uncertainty relations [3.0] 我々は核磁気共鳴装置に量子SWAPエンジンを実験的に実装した。
量子SWAPエンジンは熱エンジンと冷凍機の両方で動作可能であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:37:32 GMT)
Geographical Node Clustering and Grouping to Guarantee Data IIDness in Federated Learning [2.9] フェデレートラーニング(FL)の大きな課題は、非IIDデータセットの問題である。
本稿では,モバイルIoTノードを適切にクラスタリングし,グループ化することで,データのIID性を確保する新しい手法を提案する。
本機構は, グループ単位のデバイス数とグループ単位のデバイス数との結合コストにおいて, ベンチマークグループ化アルゴリズムを少なくとも110倍に向上させる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:03:15 GMT)
Deep Graph Attention Networks [2.8] グラフ注意ネットワーク(GAT)に属するノードのクラスを予測する手法として,DeepGAT(DeepGAT)を提案する。
異なるクラスのノードが各レイヤで似ていないことを保証することで、GATのオーバースムーシングを回避する。
DeepGATは、大きなネットワークのトレーニングによって、少数のレイヤを持つネットワークに類似した注意係数を取得できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:58:33 GMT)
Contrastive Learning with Auxiliary User Detection for Identifying Activities [2.8] 我々は、外的環境設定を考慮に入れた上で、自然的ユーザアクションパフォーマンスの違いの影響に対処することが重要であると論じている。
CLAUDIAはこれらの問題に対処するために設計された新しいフレームワークである。
実世界の3つのCA-HARデータセットに対する評価は、大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:04:23 GMT)
UADA3D: Unsupervised Adversarial Domain Adaptation for 3D Object Detection with Sparse LiDAR and Large Domain Gaps [2.8] 3次元物体検出(UADA3D)のための教師なし反転領域適応法について紹介する。
様々な適応シナリオにおいて有効性を示し、自動運転車と移動ロボットの両方の領域で顕著に改善されていることを示す。
私たちのコードはオープンソースで、まもなく利用可能になります。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:34:27 GMT)
Solving Sparse \& High-Dimensional-Output Regression via Compression [2.8] MOR(Multi-Output Regression)は、意思決定のための科学的データ分析に広く用いられている。
出力の次元性の増大は、現代のMORアプリケーションに対する解釈可能性と計算スケーラビリティに関する大きな課題を生じさせる。
本稿では,出力の解釈可能性を解決するために,余剰条件を付加することで,スパース&高次元出力回帰モデルを提案する。
提案手法は,任意のサンプルセット条件や比較的弱いサンプルセット条件下でのトレーニング損失と予測損失を,同じ順序で維持しながら,計算的にスケーラブルであることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:21:25 GMT)
How Can We Diagnose and Treat Bias in Large Language Models for Clinical Decision-Making? [2.7] 本研究では,大規模言語モデル(LLM)におけるバイアスの評価と緩和について検討する。
本稿では,JAMAクリニカルチャレンジから得られた新しいCPVデータセットについて紹介する。
このデータセットを用いて、複数の選択質問(MCQ)とそれに対応する説明を併用し、バイアス評価のためのフレームワークを構築した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:14:10 GMT)
Software Frugality in an Accelerating World: the Case of Continuous Integration [2.7] 私たちは、GitHubで実装された継続的インテグレーションパイプラインのエネルギーフットプリントを、初めて大規模に分析します。
パイプラインの平均単位エネルギーコストは10Whで比較的低い。
地域Wh-to-CO2推定値に基づくCO2排出量の評価では, 平均CO2排出量は10.5kgである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:29:50 GMT)
Metric as Transform: Exploring beyond Affine Transform for Interpretable Neural Network [2.7] ユークリッド距離の局所的影響に比べ,大域的影響の少ない点積ニューロンが発見されている。
我々は,解釈可能なローカル辞書に基づくニューラルネットワークを開発し,それを用いて敵の例を理解し,否定する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:22:19 GMT)
Negative Sampling in Knowledge Graph Representation Learning: A Review [2.7] 知識グラフ表現学習(KGRL)は知識構築や情報検索といったAIアプリケーションに不可欠である。
既存の知識グラフから高品質な負のサンプルを生成することは難しい。
本報告では, 各種陰性サンプリング法とそのKGRL成功への貢献について, 系統的に検討する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:30:50 GMT)
On Uncertainty Quantification for Near-Bayes Optimal Algorithms [2.6] 本研究では, タスク分布によって定義されたベイズ後続部を, アルゴリズムを用いてマーチンゲール後続部を構築することにより, 未知だが最適であるベイズ後続部を復元可能であることを示す。
様々な非NNアルゴリズムとNNアルゴリズムに基づく実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:26:52 GMT)
Voice-Enabled AI Agents can Perform Common Scams [2.6] 我々は、音声対応AIエージェントが、共通の詐欺を行うために必要なアクションを実行可能であることを示す。
我々の結果は、音声対応AIエージェントの広範な展開に関する疑問を提起する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:22:54 GMT)
Scalability of memorization-based machine unlearning [2.6] 機械学習(MUL)は、事前訓練されたモデルからデータの特定のサブセットの影響を取り除くことに焦点を当てている。
記憶に基づく未学習法が開発され、未学習の品質に関して例外的な性能を示した。
我々は、一連の記憶スコアプロキシを用いて、最先端の記憶型MULアルゴリズムのスケーラビリティに挑戦する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:18:39 GMT)
Exploring Stronger Transformer Representation Learning for Occluded Person Re-Identificatio [2.6] 我々はトランスフォーマーに基づく人物識別フレームワークであるSSSC-TransReIDを組み合わせた新しい自己監督・監督手法を提案した。
我々は、ネガティブなサンプルや追加の事前学習なしに、人物の再識別のための特徴表現を強化することができる自己教師付きコントラスト学習ブランチを設計した。
提案モデルでは, 平均平均精度(mAP) とランク1の精度において, 最先端のReID手法よりも優れたRe-ID性能が得られ, 高いマージンで性能が向上する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:17:25 GMT)
Hacking the Fabric: Targeting Partial Reconfiguration for Fault Injection in FPGA Fabrics [2.5] 本稿では,FPGA再構成の過程において,部分ビットストリームに持続的障害注入を生じさせる新しいフォールト攻撃手法を提案する。
この攻撃は電力浪費を利用しており、リコンフィグレーションマネージャを通じてFPGAにロードされるときにビットストリームに障害を注入する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:40:02 GMT)
Incorporating Navigation Context into Inland Vessel Trajectory Prediction: A Gaussian Mixture Model and Transformer Approach [2.5] 船舶の移動がフェアウェイ内で制限されている内陸輸送では、航行コンテキスト情報は不可欠である。
本研究では,多モード分布曲線を生成するためにAISと放電測定の融合データセットを適用した。
これらの分布特徴を組み込むことで予測精度が向上する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:58:59 GMT)
Large Language Models Know What To Say But Not When To Speak [2.4] ターンテイクは人間のコミュニケーションにおける基本的なメカニズムであり、スムーズでコヒーレントな会話を保証する。
近年のLarge Language Models (LLM) の進歩は,音声対話システムのターンテイク能力の向上にその利用を動機付けている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:20:25 GMT)
Efficient thermalization and universal quantum computing with quantum Gibbs samplers [2.4] 関連した「サーモフィールドダブル」状態の診断的準備について述べる。
システムサイズにおける逆温度に対する散逸進化のこのファミリの実装は、標準的な量子計算と計算的に等価であることを示す。
この結果から、準局所散逸進化の族は量子多体状態の大規模なクラスを効率的に生成することを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:31:21 GMT)
Transforming Blood Cell Detection and Classification with Advanced Deep Learning Models: A Comparative Study [2.4] 本研究は,Roboflowデータに基づいて訓練されたYOLOv10モデルを用いて,様々なエポックに640×640ピクセルの画像を再現した。
その結果,トレーニングエポックの増大は,特にリアルタイムな血液細胞検出・分類において,精度,精度,リコールを著しく向上させることが明らかとなった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:23:13 GMT)
Redefining Finance: The Influence of Artificial Intelligence (AI) and Machine Learning (ML) [2.4] 技術の急速な変革により、金融における人工知能(AI)と機械学習(ML)の融合はエコシステム全体を混乱させています。
金融機関は、リテールバンキング、ウェルスマネジメント、コーポレートバンキングと決済のエコシステムに大きく影響を受けている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:32:17 GMT)
AI-Driven Innovations in Modern Cloud Computing [2.4] 本稿では,AIとクラウドコンピューティングがアプリケーションモダナイズのためのトランスフォーメーション機能を実現するためにどのように相互作用するかを考察する。
AIとクラウドの両技術の組み合わせによって、テクノロジプロバイダはインテリジェントなリソース管理、予測分析、自動デプロイメントとスケーリングを活用できるようになった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:45:10 GMT)
Are Large-scale Soft Labels Necessary for Large-scale Dataset Distillation? [2.4] ImageNet-condensationでは、補助ソフトラベルのストレージは、凝縮データセットのストレージを30倍以上上回る。
縮合されたデータセットのクラス内における高い類似性は、大規模ソフトラベルの使用を必要とすることを示す。
画像の多様性を改善する重要な利点は、単純なランダムプルーニングによってソフトラベル圧縮を実現することができることである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:49:10 GMT)
Random Token Fusion for Multi-View Medical Diagnosis [2.3] 多視点医療データセットでは、ディープラーニングモデルは診断性能を改善するために、異なる画像の観点から情報を融合することが多い。
既存のアプローチは過度に適合する傾向があり、ビュー固有の機能に大きく依存する。
本研究では,マルチビュー医療用トランスを用いた画像解析技術を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:19:45 GMT)
Multispectral Texture Synthesis using RGB Convolutional Neural Networks [2.3] 最先端のRGBテクスチャ合成アルゴリズムは、深い特徴の統計によって計算されるスタイル距離に依存している。
本稿では,これらの手法をマルチスペクトルイメージングに拡張する2つの方法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:49:54 GMT)
A Paradigm Shift in Mouza Map Vectorization: A Human-Machine Collaboration Approach [2.3] 現在の手動のデジタル化手法は時間と労力がかかる。
本研究では,デジタル化プロセスの効率化と,時間と人的資源の節約を目的とした半自動化手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:47:36 GMT)
Shotluck Holmes: A Family of Efficient Small-Scale Large Language Vision Models For Video Captioning and Summarization [2.3] 本稿では,映像の要約とキャプションを促進するために,多言語視覚モデル(LLVM)のファミリーを提案する。
Shotluck Holmes は Shot2Story ビデオキャプションと要約タスクの最先端結果よりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:52:10 GMT)
Residual vector quantization for KV cache compression in large language model [2.3] KVキャッシュ圧縮法は主にデコード時のメモリ要求を減らすスカラー量子化技術に依存している。
本研究では,大規模言語モデル(LLM)におけるKVキャッシュの圧縮に,高忠実度音声圧縮に広く用いられている残差ベクトル量子化を適用した。
我々は指数移動平均を用いてコードブックを学習し、ベクトル量子化設定に通常使用される入力と出力のプロジェクションを含む他の学習可能なパラメータは存在しない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:20:41 GMT)
Revisiting Deep Feature Reconstruction for Logical and Structural Industrial Anomaly Detection [2.3] 産業異常検出は品質管理と予測維持に不可欠である。
既存の手法では、深層学習ネットワークから抽出された画像パッチから複数スケールの特徴を活用することで、デントやスクラッチなどの構造異常を一般的に検出する。
構造異常を検出するためのメモリと計算効率のよいアプローチであるDeep Feature Restruction (DFR) に注目し,これらの制約に対処する。
我々はさらに、DFRをUDSADと呼ばれる統一されたフレームワークに拡張し、構造的および論理的異常の両方を検出する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:56:47 GMT)
TEXEL: A neuromorphic processor with on-chip learning for beyond-CMOS device integration [2.3] TEXELは、オンチップ学習回路と新しい2端子および3端子デバイスの統合を探求するために設計された混合信号ニューロモルフィックアーキテクチャである。
本稿では,総合的なチップ計測とシミュレーションによるデバイス統合のためのTEXELの準備について述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:30:24 GMT)
Rethinking State Management in Actor Systems for Cloud-Native Applications [2.3] 我々はアクターシステムのための新しいデータ管理層であるSmSaを開発した。
開発者は、外部キーやデータレプリケーションなど、アクター間で切断された依存関係を宣言できる。
SmSaは、コンポーネント間の依存関係が頻繁にアプリケーションロジックやパフォーマンスを損なうような、コアデータ管理タスクをサポートします。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:48:34 GMT)
Balancing Label Quantity and Quality for Scalable Elicitation [2.2] 本研究では,NLP分類タスクにおける量品質トレードオフのミクロ経済性について検討する。
教師付き微調整を用いた事前学習モデルから分類知識を抽出する3つの方法について検討した。
固定ラベル付予算において,教師付き微調整の精度を最大5ポイント向上できることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:32:37 GMT)
Benchmarking Pathology Foundation Models: Adaptation Strategies and Scenarios [2.2] 14のデータセットと2つのシナリオ整合性評価と柔軟性評価の4つの病理特異的基盤モデルをベンチマークする。
その結果、パラメータ効率のよい微調整手法は、同じ下流タスク内の多様なデータセットに病理学固有の基礎モデルを適用するのに効率的かつ効果的であることが判明した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:10:18 GMT)
Trace-Distance based End-to-End Entanglement Fidelity with Information Preservation in Quantum Networks [2.2] 絡み合いは、量子ノード間の距離が増加するにつれて、フィリティが指数関数的に減少する。
この現象は、高忠実な絡み合ったペアを生成し、量子ネットワークで情報を保存することを困難にしている。
量子ネットワーク内での高忠実な絡み合ったペアと情報保存を確保するための2つの戦略を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:02:26 GMT)
A Unified Approach to Extract Interpretable Rules from Tree Ensembles via Integer Programming [2.1] 木アンサンブル法は、教師付き分類と回帰タスクにおいて有効であることが知られている。
我々の研究は、訓練された木アンサンブルから最適化されたルールのリストを抽出することを目的としており、利用者に凝縮された解釈可能なモデルを提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:43:39 GMT)
On Creating an English-Thai Code-switched Machine Translation in Medical Domain [2.1] 医療領域における機械翻訳(MT)は、医療の質の向上と医療知識の普及に重要な役割を果たしている。
英語とタイ語によるMT技術の進歩にもかかわらず、一般的なMTアプローチは、医学用語を正確に翻訳できないため、医療分野では不十分であることが多い。
我々の研究は翻訳精度の向上だけでなく、英語の医学用語の維持も優先している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:25:32 GMT)
Deep Active Learning with Manifold-preserving Trajectory Sampling [2.1] アクティブラーニング(AL)は、アノテーション(ラベル付け)のためのラベルなしデータの選択を最適化するための方法である
既存のディープALメソッドは、間違いなく、ラベル付きデータによって引き起こされるバイアスに悩まされ、ALコンテキストにおけるラベルなしデータよりもはるかに低い割合で処理される。
我々は,より正確な多様体を表現するためにラベル付きデータから学習した特徴空間を強制することを目的とした,manifold-Preserving Trajectory Smpling (MPTS) という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:04:09 GMT)
DefVerify: Do Hate Speech Models Reflect Their Dataset's Definition? [2.1] DefVerifyは、ユーザーが指定したヘイトスピーチの定義を符号化する3段階の手順である。
DefVerifyを使用して、一般的な6つのヘイトスピーチベンチマークデータセットに適用した場合、定義とモデル動作のギャップを見つけます。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:33:18 GMT)
Exploring how deep learning decodes anomalous diffusion via Grad-CAM [2.0] 本研究では,説明可能なAI,すなわちGrad-Class Activation Map(Grad-CAM)の実現を目的とした,十分に実装された手法を用いる。
以上の結果から,Grad-CAMは異常拡散のメカニズムについて重要な情報を保持する軌跡の一部を明らかにした。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:17:49 GMT)
Moonshine: Speech Recognition for Live Transcription and Voice Commands [2.0] Moonshineは、ライブの文字起こしと音声コマンド処理に最適化された音声認識モデルのファミリーである。
Moonshineはエンコーダ・デコーダ変換アーキテクチャをベースにしており、従来の絶対位置埋め込みの代わりにロータリー位置埋め込み(Rotary Position Embedding, RoPE)を採用している。
OpenAIのWhisper small.enとベンチマークすると、Moonshine Tinyは10秒の音声セグメントを変換するための計算要求を5倍削減することを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:13:20 GMT)
Generating Fock-state superpositions from coherent states by selective measurement [2.0] ターゲット共振器のコヒーレント状態から任意のフォック状態を生成するための量子計測のためのプロトコルを提供する。
このプロトコルは、共振器と補助量子ビットのジョイントフリー進化のシーケンスで効率的に構築することができる。
我々は,デコヒーレンスの存在下でのプロトコルの結果の忠実度と成功確率を算出する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:03:34 GMT)
Exploring Singularities in point clouds with the graph Laplacian: An explicit approach [2.0] グラフラプラシアンを用いて、基礎となるデータセットの多様体の幾何学を解析する理論と手法を開発する。
我々の理論は、基礎多様体の特異点に近く定義された函数に作用するとき、グラフラプラシアンの函数形式に関する理論的な保証と明示的な境界を与える。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:06:49 GMT)
Large Body Language Models [2.0] 本稿では,LBLM(Large Body Language Models)とLBLM-AVA(LBLMアーキテクチャ)を紹介する。このアーキテクチャは,Transformer-XL大言語モデルと並列化拡散モデルを組み合わせて,マルチモーダル入力(テキスト,音声,ビデオ)からヒューマンライクなジェスチャーを生成する。
LBLM-AVAは、Frecheのジェスチャー距離(FGD)を30%削減し、Frecheの知覚距離(Inception Distance)を25%改善し、ライフライクで文脈的に適切なジェスチャーを生成する上で、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:48:24 GMT)
Allo-AVA: A Large-Scale Multimodal Conversational AI Dataset for Allocentric Avatar Gesture Animation [2.0] Allo-AVAは、テキストとオーディオ駆動のアバタージェスチャーアニメーションのための、アロセントリックな(3人目の視点)コンテキストで特別に設計されたデータセットである。
このリソースは、より自然でコンテキスト対応のアバターアニメーションモデルの開発と評価を可能にする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:50:51 GMT)
Exogenous Matching: Learning Good Proposals for Tractable Counterfactual Estimation [2.0] 本稿では, 抽出可能かつ効率的な対実表現推定のための重要サンプリング手法を提案する。
対物推定器の共通上限を最小化することにより、分散最小化問題を条件分布学習問題に変換する。
構造因果モデル (Structure Causal Models, SCM) の様々なタイプと設定による実験による理論的結果の検証と, 対実推定タスクにおける性能の実証を行った。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:50:00 GMT)
QUIS: Question-guided Insights Generation for Automated Exploratory Data Analysis [2.0] 質問生成による洞察生成(ISGen)と質問生成(QUGen)の2段階で動作する完全自動化EDAシステムQUISを紹介する。
ISGenモジュールはデータを分析して、各質問に対する複数の関連する洞察を生成し、事前のトレーニングを必要とせず、QUISが新しいデータセットに適応できるようにする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:13:45 GMT)
QUIS: Question-guided Insights Generation for Automated Exploratory Data Analysis [2.0] 質問生成による洞察生成(ISGen)と質問生成(QUGen)の2段階で動作する完全自動化EDAシステムQUISを紹介する。
ISGenモジュールはデータを分析して、各質問に対する複数の関連する洞察を生成し、事前のトレーニングを必要とせず、QUISが新しいデータセットに適応できるようにする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:13:45 GMT)
QUIS: Question-guided Insights Generation for Automated Exploratory Data Analysis [2.0] 質問生成による洞察生成(ISGen)と質問生成(QUGen)の2段階で動作する完全自動化EDAシステムQUISを紹介する。
ISGenモジュールはデータを分析して、各質問に対する複数の関連する洞察を生成し、事前のトレーニングを必要とせず、QUISが新しいデータセットに適応できるようにする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:13:45 GMT)
MI-VisionShot: Few-shot adaptation of vision-language models for slide-level classification of histopathological images [1.9] MI-VisionShot(MI-VisionShot)は、スライドレベルのラベルを予測するための視覚言語モデル上のトレーニングフリー適応手法である。
我々のフレームワークは、VLMの優れた表現学習を利用してプロトタイプベースの分類器を作成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:01:20 GMT)
Event-based contextuality theory [1.9] 本稿では、いくつかの既知の文脈性理論が直面する課題を分析し、これらを克服するために部分ブール代数を用いた事象ベースの文脈性理論を確立する。
この理論は一般的なプロジェクタと可観測物からなるシナリオを扱うことができ、量子テクスチュアリティの階層を調査するための統一された数学的構造を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:55:43 GMT)
Information for Conversation Generation: Proposals Utilising Knowledge Graphs [1.9] LLMは会話生成のためのツールとしてよく使われる。
追加情報がないと、LLMは低い品質の応答を生成することができる。
本稿では,LLM生成を向上させるために知識グラフを利用する3つの提案を紹介する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:59:25 GMT)
Enhancing Personalised Cybersecurity Guidance for Older Adults in Ireland [1.8] 1990年代半ばに「デジタル・ディバイド」という用語が登場し、新興技術にアクセスできる人と非対応者との間のギャップを浮き彫りにした。
この研究は、アイルランドの高齢者がオンラインでより安全と感じられるかに焦点を当てた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:36:46 GMT)
Private, Efficient and Scalable Kernel Learning for Medical Image Analysis [1.8] OKRA(Orthonormal K-fRAmes)は、カーネルベースの機械学習のための新しいランダム化符号化ベースのアプローチである。
現在の最先端ソリューションと比較して、スケーラビリティとスピードが大幅に向上します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:03:03 GMT)
Foundation Models for Slide-level Cancer Subtyping in Digital Pathology [1.8] 本研究の目的は,MIL フレームワークを用いて,WSI 上の癌サブタイプのための事前訓練戦略に基づいて開発された様々な特徴抽出器の性能を比較することである。
その結果、6種類の皮膚がんの亜型を予測するために、イメージネットが事前訓練したモデルを超える基礎モデルの有効性が示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:04:58 GMT)
Simulating the Economic Impact of Rationality through Reinforcement Learning and Agent-Based Modelling [1.8] 我々はエージェントベースモデル(ABM)の能力を拡大するためにマルチエージェント強化学習(RL)を活用している。
RLエージェントは、市場競争のレベルと合理性に応じて、利益を最大化するための3つの異なる戦略を自発的に学習することを示します。
また、独立した政策を持つRLエージェントと、相互にコミュニケーションする能力のないエージェントは、自発的に異なる戦略グループに分離することを学び、市場力と全体的な利益を増大させます。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:20:29 GMT)
Pre-processing and Compression: Understanding Hidden Representation Refinement Across Imaging Domains via Intrinsic Dimension [1.7] 医用画像モデルは,ネットワークの早期に表現IDがピークとなることを示す。
また、このピーク表現IDと入力空間内のデータのIDとの強い相関関係も見出す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:18:39 GMT)
Optimizing BioTac Simulation for Realistic Tactile Perception [1.7] まず,温度,力,接触点位置を用いてセンサ出力を予測するバイオタックシミュレーションについて検討する。
また,BioTac温度測定によるトレーニングでは,展開中に正確なセンサ出力予測が得られないことを示した。
入力ベクトルのウィンドウサイズを詳細に検討し, 温度測定を行なわずにこれらのモデルを訓練する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:28:20 GMT)
DomainSum: A Hierarchical Benchmark for Fine-Grained Domain Shift in Abstractive Text Summarization [1.7] DomainSumは抽象的な要約において、きめ細かいドメインシフトをキャプチャするために設計された階層的なベンチマークである。
これらの変化をジャンル,スタイル,トピックという3つのレベルに分類し,階層構造に従うような総合的なベンチマーク分析を通じて示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:55:35 GMT)
Principles of semantic and functional efficiency in grammatical patterning [1.6] 数や性別などの文法的特徴は、人間の言語において2つの中心的な機能を持つ。
数と性別は、数奇性やアニマシーのような有能な意味的属性を符号化するが、予測可能な単語のリンクによる文処理コストをオフロードする。
文法は多種多様な言語にまたがって一貫した組織パターンを示しており、しばしば意味論的基盤に根ざしている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:49:54 GMT)
Defending Against Attack on the Cloned: In-Band Active Man-in-the-Middle Detection for the Signal Protocol [1.6] 我々はSignalに対するアクティブなMan-in-the-Middle(MitM)攻撃に対する解決策を提案する。
本ソリューションは,ユーザの介入に頼ることなく,鍵確認プロセスを自動化する。
Signalの既存のセキュリティ保証を維持しながら、新しいセキュリティ保証を文書化します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:23:58 GMT)
Are Large Language Models Chameleons? An Attempt to Simulate Social Surveys [1.6] 大規模言語モデル(LLM)が主観的な質問に答えるよう求められたシミュレーションを数百万回実施した。
欧州社会調査(ESS)データと異なるLDM応答の比較は、プロンプトがバイアスや変動性に与える影響が基本であることを示唆している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:05:15 GMT)
Differentiable Optimization of Similarity Scores Between Models and Brains [1.5] 線形回帰、CKA(Centered Kernel Alignment)、正規化バーレス類似度(NBS)、角状プロクリスト距離といった類似度は、この類似度を定量化するためにしばしば用いられる。
本稿では、類似度の高いスコアと「良い」スコアを構成するスコアについて調査する新しいツールについて紹介する。
驚くべきことに、高い類似度スコアは、ニューラルデータと整合した方法でタスク関連情報を符号化することを保証していない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:34:48 GMT)
Surprising Patterns in Musical Influence Networks [1.5] ベイジアンサプライズを音楽効果ネットワークの進化を追跡するために応用する。
アーティストの影響の1つと、カバー、リミックス、サンプルの2つのネットワークを使用することで、ネットワーク構造に大きな変化が見られました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:27:29 GMT)
Insights and Current Gaps in Open-Source LLM Vulnerability Scanners: A Comparative Analysis [1.5] 本稿では,対話型大規模言語モデル(LLM)のためのオープンソースの脆弱性スキャナの比較分析を行う。
我々の研究は、脆弱性を公開するために赤いチームのプラクティスを適用する著名なスキャナー、Garak、Giskard、PyRIT、CyberSecEvalを評価した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:36:03 GMT)
Anderson impurity solver integrating tensor network methods with quantum computing [1.5] アンダーソン不純物モデルの解法として,古典量子と古典量子のハイブリッドアルゴリズムを提案する。
第1ステップは、テンソルネットワーク基底状態を得るために、古典的なコンピュータを用いて実行される。
第2ステップは量子コンピュータ上で実行され、グリーン関数を得る。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:12:16 GMT)
Findings of the Third Shared Task on Multilingual Coreference Resolution [1.4] 本稿では,CRAC 2024ワークショップの一環として開催されている多言語コア参照解決に関する共有タスクの第3版の概要について述べる。
以前の2版と同様に、参加者はアイデンティティ・コア推論に基づいて参照を識別しクラスタリングできるシステムを開発するよう求められた。
今年の版では、参加者にゼロアナフォラのための金のスロットを提供しないことによって、タスクの複雑さとリアリズムを増大させることで、現実世界の応用に向けて別の一歩を踏み出した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:30:44 GMT)
Offline reinforcement learning for job-shop scheduling problems [1.4] 本稿では,複雑な制約を伴う最適化問題に対して,新しいオフラインRL法を提案する。
我々のアプローチは、エッジ属性のアクションを符号化し、専門家ソリューションの模倣と期待される報酬のバランスをとる。
本手法がジョブショップスケジューリングおよびフレキシブルジョブショップスケジューリングベンチマークに与える影響を実証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:33:42 GMT)
Improved prediction of ligand-protein binding affinities by meta-modeling [1.4] 我々は,力場に基づく実証ドッキングとシーケンスに基づくディープラーニングモデルを統合するフレームワークを開発した。
メタモデルの多くがベースモデルに対する親和性予測を大幅に改善していることを示す。
我々の最高のメタモデルは、3D構造のみに基づく最先端のディープラーニングツールに匹敵する性能を達成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:22:54 GMT)
Limpeh ga li gong: Challenges in Singlish Annotations [1.4] 本稿では,Singlish文のPOSタグ付けという,自然言語処理の基本タスクについて検討する。
そこで本研究では,ネイティブなSinglish話者による翻訳とPOSアノテーションを用いて,直接英訳とPOSタグを含む並列Singlishデータセットを構築した。
自動トランジションおよびトランスフォーマーベースのタグは、人名付きPOSラベルに対して評価すると、たったの$sim 80%の精度で実行される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:21:45 GMT)
Natural GaLore: Accelerating GaLore for memory-efficient LLM Training and Fine-tuning [1.4] GaLoreは、よりメモリ効率の良いフル教師付き学習を可能にする。
本研究はNatural GaLoreを導入し,低ランク勾配に対する逆経験的漁業情報行列を効率的に適用する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:05:06 GMT)
A Simple Model of Inference Scaling Laws [1.4] スケーリング法則を推論の文脈で研究し、特に複数の推論による性能向上について検討する。
我々の単純なフレームワークは、推論スケーリングを他の既知のスケーリング法則に組み込むための基盤となる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:06 GMT)
AUTALIC: A Dataset for Anti-AUTistic Ableist Language In Context [1.3] AUTALICは、文脈における反音響的有能言語の検出に特化した最初のベンチマークデータセットである。
データセットはRedditから収集された2,400の自閉症関連文からなり、周囲の文脈を伴い、神経多様性の背景を持つ訓練された専門家によって注釈付けされている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:21:29 GMT)
Integrated Image-Text Based on Semi-supervised Learning for Small Sample Instance Segmentation [1.3] 本稿では,既存情報の利用を最大化する観点から,新しいサンプルインスタンス分割法を提案する。
まず、ラベルのないデータを学習して擬似ラベルを生成し、利用可能なサンプルの数を増やすことで、モデルが完全に活用するのに役立つ。
第二に、テキストと画像の特徴を統合することにより、より正確な分類結果を得ることができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:44:08 GMT)
FusionLungNet: Multi-scale Fusion Convolution with Refinement Network for Lung CT Image Segmentation [1.3] 肺がんの早期発見は治療の成功率を高める。
新しい肺分画法は画像成分間の長距離関係の同定に困難に直面している。
本稿では,鍵成分を持つ多層構造を持つFusionLungNetネットワークを用いたハイブリッド手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:27:51 GMT)
Optimal s-boxes against alternative operations and linear propagation [1.3] いくつかの拡散層は、差分暗号解析の脆弱性に対して置換置換ネットワークを公開することができる。
4ビットのs-ボックスを持つ暗号の並列な代替操作において線形性を示す拡散層を分類する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:51:59 GMT)
Modelling 1/f Noise in TRNGs via Fractional Brownian Motion [1.3] この論文は、原子時計物理学者バーンズとアランの基礎研究に基づいている。
TRNG(True Random Number Generators)において、1/fのノイズをモデル化し、暗号化セキュリティを評価するための、高度にスケーラブルで数値的に正確なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:53:04 GMT)
How the Internet Facilitates Adverse Childhood Experiences for Youth Who Self-Identify as in Need of Services [1.3] 児童福祉・少年司法制度にかかわる青年は、サービスニーズの最も脆弱な子供と見なされている。
我々は、オンラインピアサポートプラットフォームを通じて支援を求めたリスクの高い若者のうち、1,160人を特定した。
我々の研究は、安全なオンライン空間を推進し、レジリエンスを高め、逆境のサイクルを壊すための調整されたサポートシステムを求めている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:59:11 GMT)
Artificial intelligence for partial differential equations in computational mechanics: A review [1.2] 本稿では、偏微分方程式(PDE)に対するAIの研究について概観する。
PDEのためのAIのコアはデータとPDEの融合であり、ほぼすべてのPDEを解決できる。
本稿では、固体力学、流体力学、生体力学を含む計算力学におけるPDEへのAIの適用について論じる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:12:33 GMT)
Calibration of ordinal regression networks [1.2] 近年の研究では、ディープニューラルネットワークは十分に校正されておらず、自信過剰な予測が得られていないことが示されている。
順序対応キャリブレーションを導入した新しい損失関数を提案する。
ソフト・オーディショナル・エンコーディングとラベル・スムーシングに基づく正規化を取り入れ、キャリブレーションと一様性の両方を強制する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:56:31 GMT)
GIG: Graph Data Imputation With Graph Differential Dependencies [1.2] グラフ差分依存(GDD)に依存するGIGと呼ばれるグラフデータ計算手法を提案する。
GDDを活用することで、GIGはデータ計算プロセスに意味的な知識を取り込み、より信頼性と説明性を高めます。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:04:21 GMT)
Model Mimic Attack: Knowledge Distillation for Provably Transferable Adversarial Examples [1.2] この研究は、分類ニューラルネットワークに対する知識蒸留に基づく攻撃の成功に関する証明可能な保証を提供する最初のものである。
学生モデルに十分な学習能力がある場合、教師モデルに対する攻撃は、有限個の蒸留イテレーションで見つかることが保証される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:06:56 GMT)
Mislabeled examples detection viewed as probing machine learning models: concepts, survey and extensive benchmark [1.2] 誤ラベル検出手法のほとんどを、訓練された機械学習モデルの探索とみなすことができる。
これらのメソッドを含むモジュラーフレームワークを4つのビルディングブロックでパラメータ化します。
我々は,既存の手法を (人工) Completely At Random (NCAR) と (現実) Not At Random (NNAR) のラベル付きノイズでベンチマークする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:32:02 GMT)
A Comprehensive Comparative Study of Individual ML Models and Ensemble Strategies for Network Intrusion Detection Systems [1.2] 本稿では,ネットワーク侵入検知タスクにおける個々のモデルとアンサンブル手法を評価するためのアンサンブル学習フレームワークを提案する。
本フレームワークは,入力データセットのロード,個々のモデルとアンサンブル手法のトレーニング,評価指標の生成を含む。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:44:58 GMT)
A Rotating-Wave Comagnetometer Detector for Particle Physics [1.2] 我々は、目標信号に対する高感度を維持しながら、可変周波数での磁気ノイズを抑制する技術を開発した。
この研究は、新しい物理を探すことを目的とした新しいテーブルトップ実験の道を開く。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:01 GMT)
1024m at SMM4H 2024: Tasks 3, 5 & 6 -- Ensembles of Transformers and Large Language Models for Medical Text Classification [1.1] ソーシャルメディアは、ユーザーが情報を報告し、その健康状態や、さまざまなことがそれらにどのような影響を及ぼしたかについて、非常に優れたデータ源である。
本稿ではトランスフォーマーと大規模言語モデルを用いた様々なアプローチとそのアンサンブルについて述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:29:08 GMT)
A roadmap for generative mapping: unlocking the power of generative AI for map-making [1.1] 本稿では,地図作成における生成AIのキーとなる応用について述べる。
それは、必要な特定の技術と、現在のメソッドを使用する際の課題を特定する。
地図作成をより使いやすくするための生成マッピングシステム(GMS)を開発するためのロードマップを提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:29:43 GMT)
Learning signals defined on graphs with optimal transport and Gaussian process regression [1.1] 計算物理学において、機械学習は工学研究における効率的な候補設計を探索するための強力な補完ツールとして登場した。
本稿では,入力が大きく,連続ノード属性を持つ疎グラフと,関連する入力のノード上で定義された信号が出力となるガウス過程回帰の革新的な戦略を提案する。
信号予測の実現に加えて,提案手法の要点は,不確実性や能動学習に欠かせないノード値に対する信頼区間を持つことである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:39:44 GMT)
Few-shot target-driven instance detection based on open-vocabulary object detection models [1.1] オープンボキャブラリオブジェクト検出モデルは、同じ潜在空間において、より近い視覚的およびテキスト的概念をもたらす。
テキスト記述を必要とせずに,後者をワンショットあるいは少数ショットのオブジェクト認識モデルに変換する軽量な手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:03:15 GMT)
Unsupervised Replay Strategies for Continual Learning with Limited Data [1.1] 限られたデータで訓練したモデルにおいて、睡眠相の導入により精度が大幅に向上したことを示す。
数回のタスクが連続的にトレーニングされたとき、新しいタスクトレーニングの後、悲惨なほど忘れていた学習情報を、スリープ再生が救われた。
本研究は,ANNにおける学習効率の向上と継続学習の促進における睡眠再生の多面的役割を強調した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:21:09 GMT)
Whither Bias Goes, I Will Go: An Integrative, Systematic Review of Algorithmic Bias Mitigation [1.0] 機械学習(ML)モデルは不平等をバイアスし、持続し、悪化させる可能性があるという懸念が高まっている。
本稿では,MLアセスメントを開発し,バイアス軽減手法を適用した4段階モデルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:32:14 GMT)
High-Fidelity Transfer of Functional Priors for Wide Bayesian Neural Networks by Learning Activations [1.0] トレーニング可能なアクティベーションが,BNN上で複雑な関数空間にどのように対応できるかを示す。
本稿では,識別可能性,損失構成,対称性などの重要な学習課題について論じる。
実験により,単一の広層層を有するBNNであっても,高忠実度関数空間を効果的に実現できることが判明した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:42:10 GMT)
Circuit Quantisation in Hamiltonian Framework: A Constraint Analysis Approach [1.0] 我々は、超伝導量子回路(SQC)の解法として、ディラックの制約解析(DCA)を適用する。
SQCのラグランジアンは、ハミルトンフレームワークに分類される制約を明らかにする。
ヌルベクトルやループ電荷のような他のアイデアの集合とは異なり、DCAの堅牢性を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:56:58 GMT)
Procedural Content Generation in Games: A Survey with Insights on Emerging LLM Integration [1.0] プロシージャコンテンツ生成(PCG)は、アルゴリズムを用いてゲームコンテンツの自動生成として定義される。
プレイヤーのエンゲージメントを高め、ゲームデザイナーの仕事を楽にする。
PCGにおけるディープラーニングアプローチの最近の進歩は、研究者や実践者がより洗練されたコンテンツを作成できるようにしている。
大規模言語モデル (LLMs) が登場し、PCGの進歩の軌跡を本当に破壊した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:10:13 GMT)
Ablation Studies for Novel Treatment Effect Estimation Models [1.0] 本稿では,ベイジアンカウサルフォレスト(BCF)モデルを検討することにより,アブレーション研究の重要性を強調した。
我々は,$hatpi(x_i)$を除くと,平均および条件平均処理効果の推定や不確実性定量化におけるモデルの性能が低下しないことを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:05:24 GMT)
GenGMM: Generalized Gaussian-Mixture-based Domain Adaptation Model for Semantic Segmentation [1.0] 一般化ガウス混合(GenGMM)ドメイン適応モデルを導入する。
実験は我々のアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:21:09 GMT)
From FDG to PSMA: A Hitchhiker's Guide to Multitracer, Multicenter Lesion Segmentation in PET/CT Imaging [0.9] 本稿では,ResEncL アーキテクチャを用いた nnU-Net フレームワークを用いたマルチトラス,マルチセンタの一般化を目的とした AutoPET III チャレンジの解決策を提案する。
主なテクニックは、CT、MR、PETデータセット間での誤調整データ拡張とマルチモーダル事前トレーニングである。
Diceスコアが57.61となったデフォルトのnnU-Netと比較して、Diceスコアが68.40であり、偽陽性(FPvol: 7.82)と偽陰性(FNvol: 10.35)が減少している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:15:30 GMT)
A Lindbladian for exact renormalization of density operators in QFT [0.9] arXiv:1609.03493では、著者らは量子場理論(QFT)において、正確な再正規化群(ERG)を任意の波動関数に拡張した。
この定式化を適用すると、密度行列のERGフローがリンドブラッドマスター方程式によって与えられることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:51:50 GMT)
3D-GANTex: 3D Face Reconstruction with StyleGAN3-based Multi-View Images and 3DDFA based Mesh Generation [0.8] 本稿では,StyleGAN と 3D Morphable Models を用いた単一画像からのテクスチャ推定手法を提案する。
その結果, 生成したメッシュは質が高く, テクスチャ表現がほぼ正確であることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:42:06 GMT)
A Fusion-Driven Approach of Attention-Based CNN-BiLSTM for Protein Family Classification -- ProFamNet [0.8] 本研究では1D-CNN, BiLSTM, および注意機構の融合によるタンパク質ファミリーの分類モデルを提案する。
提案したモデル(ProFamNet)は450,953のパラメータと1.72MBのコンパクトサイズで優れたモデル効率を実現した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:33:18 GMT)
Authenticity and exclusion: social media algorithms and the dynamics of belonging in epistemic communities [0.8] 本稿では,ソーシャルメディアプラットフォームとそのレコメンデーションアルゴリズムが,少数派の研究者の専門的視認性と機会をいかに形成するかを検討する。
まず、これらのアルゴリズムは少数派の研究者の専門的な可視性を著しく損なう。
第二に、これらの少数派グループの中では、アルゴリズムは多数派に近づき、プロの可視性を犠牲にして同化を動機付ける。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:47:57 GMT)
Near-Optimal Quantum Algorithm for Finding the Longest Common Substring between Run-Length Encoded Strings [0.8] 2つのラン長符号化(RLE)文字列間の最長コモン(LCS)問題に対して、近似量子アルゴリズムを提案する。
我々のアルゴリズムのコストは$tildemathcalO(n2/3/d1/6-o(1)cdotmathrmpolylog(tilden))$ timeであるのに対し、問題のクエリの下限は$tildeOmega(n2/3/d1/6)$である。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:52:08 GMT)
Do LLMs write like humans? Variation in grammatical and rhetorical styles [0.8] 大規模言語モデル(LLM)の修辞形式について検討する。
ダグラス・ビーバーの語彙的・文法的・修辞的特徴セットを用いて, LLMと人間との系統的差異を同定した。
このことは、高度な能力にもかかわらず、LLMは人間のスタイルに合うのに苦労していることを示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:35:44 GMT)
Integrating Reinforcement Learning with Foundation Models for Autonomous Robotics: Methods and Perspectives [0.7] 強化学習(Reinforcement Learning, RL)は、エージェントがインタラクションやフィードバックを通じて学習することを可能にする。
このシナジーは、ロボティクスを含む様々な分野に革命をもたらしている。
本稿では,アクションプランナとしてのファンデーションモデルの利用,ロボット固有のファンデーションモデルの開発,およびFMとRLを組み合わせることによる相互利益について分析する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:27:48 GMT)
Crowdsourcing with Difficulty: A Bayesian Rating Model for Heterogeneous Items [0.7] 応用統計学と機械学習では、訓練に使用される「金の標準」はしばしば偏りがあり、ほとんど常にうるさい。
DawidとSkeneの人気の高いクラウドソーシングモデルは、レーダ(コーダ、アノテータ)の感度と特異性を調整するが、トレーニングのために収集されたレーティングデータの分布特性を捉えない。
本稿では,難易度,差別性,推測可能性に項目レベルの効果を加えることで,コンセンサスカテゴリを推測できる汎用計測エラーモデルを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:43:27 GMT)
GreenEye: Development of Real-Time Traffic Signal Recognition System for Visual Impairments [0.6] グリーンアイシステムは交通信号の色を認識し、歩行者が横断歩道をリアルタイムで横断する時間を伝える。
データ不均衡は低い精度をもたらし、異なるクラス間の画像数を安定させるために追加のラベル付けとデータベース形成が行われた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:27:22 GMT)
Fine-Tuning LLMs for Reliable Medical Question-Answering Services [0.6] LLMを用いたQAサービスへの先進的なアプローチを提案する。
我々の研究はLLaMA-2やMistralのようなモデルの最適化に重点を置いており、正確で信頼性の高い医療回答を提供する上で大きな可能性を秘めている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:12:20 GMT)
Data Matters: The Case of Predicting Mobile Cellular Traffic [0.6] 本研究では, スマート道路に着目し, セルラー交通の発生過程をモデル化するための道路交通対策について検討する。
実験では、道路の流れと速度を利用することで、セルラーネットワークのメトリクスに加えて、セルラーロード予測エラーを最大56.5%削減できることを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:30:13 GMT)
Probing electron quadrupling order through ultrasound [0.6] 最近の実験では、Ba$_1-x$K$_x$Fe$$As$$の四重対凝縮体である新しい物質の状態の形成が指摘されている。
状態は自然に時間反転対称性を破り、2つの臨界点の間に挟まれ、超伝導状態と通常の金属状態とを分離する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:18:14 GMT)
Discrete transforms of quantized persistence diagrams [0.5] 永続化ダイアグラムをベクトル化する新奇でシンプルな方法Qupidを紹介する。
主要な特徴は、永続化ダイアグラムの対角線付近に含まれる情報を強調するログスケールグリッドの選択である。
我々はQupidの詳細な実験分析を行い、本手法の単純さは計算コストを極端に低くすることを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:50:05 GMT)
DeepVigor+: Scalable and Accurate Semi-Analytical Fault Resilience Analysis for Deep Neural Network [0.5] 本稿では,DNNにおける信頼性測定の効率的な代替手段として,スケーラブルで高速かつ高精度な半解析手法であるDeepVigor+を紹介する。
結果は、DeepVigor+が、1%未満の誤差と14.9の誤差を持つDNNモデルの脆弱性係数(VF)を、最もよく知られた最先端統計FIの26.9倍のシミュレーションで取得していることを示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:01:08 GMT)
Extended local ergotropy [0.5] システム環境化合物のフリー進化を利用した拡張局所エルゴトロピーの概念を導入する。
局所エルゴトロピーとの分散では、拡張された局所エルゴトロピーが増加し、時間の経過とともに増加せず、作業抽出のポテンシャルを活性化する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:12:57 GMT)
Augmenting Finite Temperature Tensor Network with Clifford Circuits [0.5] 近年の研究では、量子多体系をシミュレートするための非常に効果的なフレームワークとして、ネットワーク手法と安定化器形式の組み合わせを強調している。
本研究では,このパラダイムを時間依存変分原理の枠組みを用いて有限温度シミュレーションに適用する。
計算の結果,クリフォード回路は有限温度シミュレーションの効率と精度を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:30:59 GMT)
ER = EPR is an operational theorem [0.5] Alice と Bob はそれぞれの局所時空における点の位相的識別から一夫一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一婦一
我々の構成は直ちに、この運用環境では、時空の局所位相が観測値に相対的であることを示唆している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:38:32 GMT)
QuickBind: A Light-Weight And Interpretable Molecular Docking Model [0.5] 機械学習手法の最近の進歩は、モデルランタイムのコストでポーズ品質を改善することに焦点が当てられている。
軽量ポーズ予測アルゴリズムQuickBindを開発した。
QuickBindは、そのシンプルさによって、有効な仮想スクリーニングツールと、新しいモデルアーキテクチャやイノベーションを探求するための最小限のテストベッドの両方として機能する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:01:24 GMT)
Hypergraph: A Unified and Uniform Definition with Application to Chemical Hypergraph and More [0.5] 本稿では,非指向性,指向性,ネスト性を持つハイパーグラフの概念を統一するハイパーグラフの新たな定義を提案する。
具体的には、ハイパーエッジを単純なハイパーエッジ、ネストハイパーエッジ、あるいは有向ハイパーエッジと定義する。
この新たな定義の統一性とパワーは、可視化とともに、高次相関を表現するためにハイパーグラフを使うことを促進するべきである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:34:08 GMT)
Secure Computation and Trustless Data Intermediaries in Data Spaces [0.4] 本稿では,データ空間におけるセキュアな計算のための高度な暗号技術の統合について検討する。
We exploit the introduced secure method、すなわち Secure Multi-Party Computation (MPC) と Fully Homomorphic Encryption (FHE) を利用する。
我々は、航空交通管理、製造、二次データ利用など、実世界のユースケースを通じてソリューションを提示する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:10:53 GMT)
YOLO11 and Vision Transformers based 3D Pose Estimation of Immature Green Fruits in Commercial Apple Orchards for Robotic Thinning [0.4] 商業用果樹果樹における未熟リンゴ(フルーツレット)の3次元ポーズ推定法を開発した。
YOLO11オブジェクト検出とポーズ推定アルゴリズムとViT(Vision Transformers)を併用して深度推定を行う。
YOLO11nは、ボックス精度と精度の点で、YOLO11とYOLOv8のすべての構成を上回った。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:00:03 GMT)
CoTCoNet: An Optimized Coupled Transformer-Convolutional Network with an Adaptive Graph Reconstruction for Leukemia Detection [0.4] 白血病の分類のためのCoTCoNet(Coupled Transformer Convolutional Network)フレームワークを提案する。
我々のフレームワークは、包括的グローバル特徴とスケーラブルな空間パターンを捉え、複雑で大規模な血液学的特徴の同定を可能にする。
それぞれ0.9894と0.9893のF1スコアレートを達成している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:45:23 GMT)
Fair Bilevel Neural Network (FairBiNN): On Balancing fairness and accuracy via Stackelberg Equilibrium [0.3] バイアスを緩和する現在の方法は、情報損失と精度と公平性のバランスが不十分であることが多い。
本稿では,二段階最適化の原理に基づく新しい手法を提案する。
私たちのディープラーニングベースのアプローチは、正確性と公平性の両方を同時に最適化します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:53:39 GMT)
Runtime Reduction in Linear Quantum Charge-Coupled Devices using the Parity Flow Formalism [0.3] 2ビット演算の総数を増やすことなく、線形ハードウェアアーキテクチャにおいて物理SWAPゲートを除去できることを示す。
これは線形量子電荷結合デバイスにおける量子回路の実行時間に大きな影響を与える。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:29 GMT)
Multimodal Flare Forecasting with Deep Learning [0.3] 色圏およびコロナUVおよびEUV放射の異なる波長での予測能力を比較するために、深層学習を採用している。
以上の結果から,EUVの波長は,視線磁図と同等以上の識別力が得られることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:42:47 GMT)
Hydra-LSTM: A semi-shared Machine Learning architecture for prediction across Watersheds [0.3] Hydra-LSTMプロセス変数は、いくつかのキャッチメントでのみ使用されるすべてのキャッチメントと変数で使用され、一般的なトレーニングとキャッチメント固有のデータの使用を可能にする。
我々は、マルチキャッシュやシングルキャッシュのLSTMよりも精度の高い中央値および量子予測を生成する。
我々は,ヒドラ・LSTMの河川流出をキャッチメント固有入力として導入することにより,キャッチメント固有データを組み込む能力をテストする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:30:44 GMT)
A Dual Process VLA: Efficient Robotic Manipulation Leveraging VLM [0.3] VLA(Vision-Language-Action)モデルでは、視覚コンテキストと言語コマンドを統合することで、ロボットが複雑なタスクを実行できる。
これを解決するために,デュアルプロセス理論に着想を得た階層型フレームワークであるDual Process VLA(DP-VLA)を提案する。
RoboCasaデータセットの実験結果は、DP-VLAがより高速な推論とより高いタスク成功率を達成することを示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:36:02 GMT)
A 300 mm foundry silicon spin qubit unit cell exceeding 99% fidelity in all operations [0.2] 先進的な300mmウエハスケールの金属-酸化物-半導体ファクトリー(CMOS)ファクトリーにおける量子プロセッサの製作は、商業的に実現可能な量子コンピューティングへのユニークなスケーリング経路を提供する。
そこで本研究では,300mm半導体プロセスラインで作製したシリコン2量子デバイスの正確な量子ビット演算について述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:18:35 GMT)
Enhancing Trust and Safety in Digital Payments: An LLM-Powered Approach [0.2] 本稿では,インドにおけるUPI(Unified Payments Interface)とGoogle Pay(GPay)をユースケースとして,詐欺検出の包括的アプローチを提案する。
このアプローチはLarge Language Models(LLM)を活用して、詐欺の分類精度を高め、不正行為の特定と軽減にヒトレビュアーを支援するデジタルアシスタントを設計する。
この結果は、既存の機械学習モデルを強化し、詐欺レビューの効率、正確性、品質、一貫性を改善し、最終的により安全でセキュアなデジタル支払いのランドスケープに寄与する可能性を実証している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:21:11 GMT)
Undecidability in Physics: a Review [0.2] 物理学から生じる問題における決定不可能性の研究は、主に量子情報問題に関連して、新たな関心を集めている。
まず、数学と計算機科学における不決定性に関する必要な結果を説明する。
次に、大半が80年代から90年代初頭に現れた物理学における不決定性に関する最初の結果について概説する。
最後に、多くのボディシステムと量子情報問題という2つの主要なカテゴリに分けられる最新のコントリビューションに焦点を当てる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:47:11 GMT)
Adaptive Contrastive Search: Uncertainty-Guided Decoding for Open-Ended Text Generation [0.2] コントラスト探索を拡張した新しい復号法であるアダプティブコントラスト探索を導入する。
この結果から,異なるモデルアーキテクチャとデータセットの両面でのパフォーマンス向上が示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:43:41 GMT)
Semiconductor Circuits for Quantum Computing with Electronic Wave Packets [0.2] 固体量子半導体回路で伝播する飛行電子波パケットを利用した代替手法を提案する。
クビットはオンデマンドで作成でき、共通のハードウェア要素で操作できるため、ハードウェア要件は大幅に削減される。
このランドマークは、コンパクトでスケーラブルなアーキテクチャでフォールトトレラントな量子コンピューティングの基礎を築いた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:51:13 GMT)
An Explainable Contrastive-based Dilated Convolutional Network with Transformer for Pediatric Pneumonia Detection [0.1] 胸部X線写真を用いた早期診断は一般的であるが、未処理画像の放射線レベルが低いことやデータ不均衡の問題などが制限されている。
小児肺炎検出のための新規なXCCNet(Explainable Contrastive-based Dilated Convolutional Network)を提案する。
XCCNetは、拡張畳み込みの空間的パワーと、コントラストベースの変換器からのグローバルな洞察を有効機能改善に活用する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:14:50 GMT)
CoTCoNet: An Optimized Coupled Transformer-Convolutional Network with an Adaptive Graph Reconstruction for Leukemia Detection [0.1] 白血病の分類のためのCoTCoNet(Coupled Transformer Convolutional Network)フレームワークを提案する。
我々のフレームワークは、包括的グローバル特徴とスケーラブルな空間パターンを捉え、複雑で大規模な血液学的特徴の同定を可能にする。
それぞれ0.9894と0.9893のF1スコアレートを達成している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:45:23 GMT)
Competency-Aware Planning for Probabilistically Safe Navigation Under Perception Uncertainty [0.1] 知覚に基づくナビゲーションシステムは、複雑な地形における無人地上車両(UGV)のナビゲーションに有用である。
本研究では,確率的・再構成型能力推定法(PaRCE)を開発し,入力画像との親しみ度を推定する。
総合能力スコアは, 正しく分類され, 誤分類され, アウト・オブ・ディストリビューション (OOD) のサンプルを正確に予測できることがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:16:09 GMT)
Opportunities and Challenges of Generative-AI in Finance [0.1] 本稿では,金融分野におけるGen-AI技術の応用について概観する。
特に、金融におけるGen-AI技術の利用にかかわる機会と課題について述べる。
我々はまた、Gen-AIのトレーニングに使用できる様々な方法論を説明し、金融エコシステムにおけるGen-AI技術の様々な応用分野を提示する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:30:39 GMT)
AI-Driven Approaches for Glaucoma Detection -- A Comprehensive Review [0.1] コンピュータ支援診断システム(CADx)は、臨床医が早期に緑内障の正確な診断を支援するための有望なツールとして登場した。
本稿では,緑内障の診断にCADxシステムで使用されるAI技術の概要を概観する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:26:53 GMT)
Did somebody say "Gest-IT"? A pilot exploration of multimodal data management [0.1] 本稿では,マルチモーダルコーパスの構築,管理,解析をパイロットで行う。
Gest-ITリソースは、視覚障害者と視覚障害者の会話におけるジェスチャー作成パターンの変化を調査することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:42:13 GMT)
GenAI Assisting Medical Training [0.1] この研究は、生成的AI手法を統合して、獣医や缶詰などの医療処置に対するリアルタイムフィードバックを提供することによって、学生のスキル獲得を支援することを目的としている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:31:16 GMT)
A Psycholinguistic Evaluation of Language Models' Sensitivity to Argument Roles [0.1] 我々は,人間の議論的役割処理に関する心理言語学的研究を再現することにより,大規模言語モデルの議論的役割に対する感受性を評価する。
言語モデルでは,動詞とその先行する引数の関係から,可否が決定されるような,可否的かつ不可解な文脈で現れる動詞を識別することができる。
このことは、言語モデルが動詞の可読性を検出する能力は、人間のリアルタイム文処理の基盤となるメカニズムから生じるものではないことを示唆している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:05:58 GMT)
Integer linear programming for unsupervised training set selection in molecular machine learning [0.1] 提案アルゴリズムは,既存の教師なし学習セット選択手法よりも優れていることを示す。
この研究は、物理に着想を得た機械学習モデルの性能を改善するための実用的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:50:04 GMT)
Systematic Review: Text Processing Algorithms in Machine Learning and Deep Learning for Mental Health Detection on Social Media [0.0] 本稿では,ソーシャルメディア上での抑うつ検出のための機械学習モデルの評価を行う。
モデルの信頼性と一般化可能性に影響を及ぼす重要なバイアスが見つかった。
否定のような言語的なニュアンスに明示的に対応した研究はわずか23%で、正確な感情分析に欠かせないものだった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:05:50 GMT)
Work Sum Rule for Open Quantum Systems [0.0] オープン量子系の熱力学における重要な問題は、エントロピー、仕事、内部エネルギーなどの熱力学量をシステムと環境の間でどのように分配するかである。
エントロピーが非特異である唯一のパーティションはヒルベルト空間のパーティションに基づいており、システムと環境の結合を半分に、環境を半分に割り当てている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:10:51 GMT)
We Urgently Need Intrinsically Kind Machines [0.0] 優しさに対する本質的な動機は、これらのモデルが人間的価値と本質的に一致していることを保証するために不可欠である、と我々は主張する。
本手法では,会話をシミュレートすることで,基礎モデルに優しさを埋め込むためのフレームワークとアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:40:22 GMT)
WKB Methods for Finite Difference Schrodinger Equations [0.0] 我々は、任意のhbar-correctionを取得し、一般的な量子運動量を構築するために、全順序のWKBアルゴリズムを開発する。
次に、最も単純な非自明な例、線型ポテンシャルケースおよびベッセル函数について研究する。
これらの接続公式を用いて、様々な有限差分シュロディンガー問題の離散スペクトルを構成する問題の選択を分析する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:37:06 GMT)
Vernacularizing Taxonomies of Harm is Essential for Operationalizing Holistic AI Safety [0.0] AI倫理と安全原則とフレームワークの運用は、潜在的な利益を実現し、AIシステムによる潜在的な害を軽減するために不可欠である。
我々はまた、専門分野に特化したAI安全運用において容易に実施できるように、分類学を地域カテゴリーに移行する必要があると論じている。
人権に関する人類学の新たな理論から、我々は「白化」のプロセスがこのギャップを埋めるのに役立つと提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:47:48 GMT)
Using GPT Models for Qualitative and Quantitative News Analytics in the 2024 US Presidental Election Process [0.0] 本稿では,検索拡張生成(RAG)によるニュースの質的,定量的分析に,Google Search APIとGPT-4oモデルを用いたアプローチを検討する。
その結果、GPTモデルを用いて情報分析を行い、選挙プロセスのさらなる分析に応用できる重要な洞察を提供することができた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:02:18 GMT)
Two-stage Learning-to-Defer for Multi-Task Learning [0.0] 分類タスクと回帰タスクの両方を包含するマルチタスク学習のためのLearning-to-Deferアプローチを提案する。
我々の2段階のアプローチでは、事前訓練された共同回帰モデルと1つ以上の外部の専門家のうち、最も正確なエージェントに決定を下すリジェクターを使用します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:44:57 GMT)
Trust or Bust: Ensuring Trustworthiness in Autonomous Weapon Systems [0.0] 本稿では,自律兵器システム(AWS)における信頼の多面的性質について考察する。
バイアス、運用上の障害、説明責任に関連するリスクを軽減するために、信頼性と透明性を備えたシステムを確立する必要性を強調します。
技術者、倫理学者、軍事戦略家を含む協力的なアプローチを提唱し、現在進行中の課題に対処する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:22:13 GMT)
Trust or Bust: Ensuring Trustworthiness in Autonomous Weapon Systems [0.0] 本稿では,自律兵器システム(AWS)における信頼の多面的性質について考察する。
バイアス、運用上の障害、説明責任に関連するリスクを軽減するために、信頼性と透明性を備えたシステムを確立する必要性を強調します。
技術者、倫理学者、軍事戦略家を含む協力的なアプローチを提唱し、現在進行中の課題に対処する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:22:13 GMT)
Trust or Bust: Ensuring Trustworthiness in Autonomous Weapon Systems [0.0] 本稿では,自律兵器システム(AWS)における信頼の多面的性質について考察する。
バイアス、運用上の障害、説明責任に関連するリスクを軽減するために、信頼性と透明性を備えたシステムを確立する必要性を強調します。
技術者、倫理学者、軍事戦略家を含む協力的なアプローチを提唱し、現在進行中の課題に対処する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:22:13 GMT)
TrojanForge: Generating Adversarial Hardware Trojan Examples with Reinforcement Learning [0.0] ハードウェアトロイの木馬問題は、攻撃者とディフェンダーの間の連続したゲームと考えることができる。
機械学習は近年、HT研究の進展において重要な役割を担っている。
TrojanForgeはHT検出器を倒す敵の例を生成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:09:29 GMT)
Toward Routing River Water in Land Surface Models with Recurrent Neural Networks [0.0] 陸面モデル(LSM)における河川ルーティングのためのリカレントニューラルネットワーク(RNN)の性能について検討する。
観測された降水の代わりに、LSM-RNNは物理モデルから計算された瞬時流出を入力として使用する。
LSM-RNNの予測と既存の物理モデルとの類似したデータセットを比較し,LSM-RNNが物理モデルより優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:34:22 GMT)
Thermalization and hydrodynamic long-time tails in a Floquet system [0.0] 古典的流体力学場理論が多粒子量子系の長時間力学を予測できるかどうかを考察する。
場の理論的解析と対称性の議論に基づいて、スピンモデルの各作用素を流体力学の対応する場にマッピングする。
これらの知見は、隣接する4つの場所で定義できる255個のエルミート作用素の時間発展を研究することで説明できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:47:33 GMT)
Thermal state preparation of the SYK model using a variational quantum algorithm [0.0] 本研究では, Sachdev-Ye-Kitaev (SYK) モデルを用いて, 密度とスパースの熱状態の測定を行った。
我々は,高密度SYKモデルのベンチマーク計算を$N = 6$で行い,正確な結果とよく一致したことを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:31:31 GMT)
Systematic Exploration of Dialogue Summarization Approaches for Reproducibility, Comparative Assessment, and Methodological Innovations for Advancing Natural Language Processing in Abstractive Summarization [0.0] 本稿では,対話要約モデルの再現と評価について述べる。
本研究は、AMIデータセットを用いた対話要約モデルの徹底的な検討を含む。
主な目的は、人的評価を通じて、これらのモデルによって生成された要約の有意性と品質を評価することである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:47:57 GMT)
Supersonic shear waves in dipolar supersolids [0.0] 三角構造とハニカム構造を有する双極子超固体における横波パケット伝搬について検討した。
注目すべきは、ハニカム超固体は異常な分散を示し、音の逆速度よりも高速に進行する波を支えることである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:39:40 GMT)
StochGradAdam: Accelerating Neural Networks Training with Stochastic Gradient Sampling [0.0] 我々はAdamアルゴリズムの新たな拡張であるStochGradAdamを紹介し、勾配サンプリング手法を取り入れた。
StochGradAdamは、イテレーション毎の勾配更新が少ない場合でも、Adamに匹敵する、あるいは優れたパフォーマンスを実現している。
その結果,このアプローチは大規模モデルやデータセットに特に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:54:46 GMT)
State Estimation Using Sparse DEIM and Recurrent Neural Networks [0.0] 本稿では,再帰型ニューラルネットワークを用いて,スパース観測時系列からカーネルベクトルを推定するデータ駆動手法を提案する。
数値的な例を用いて、この機械学習アプローチがS-DEIMと共にほぼ最適な状態推定をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:12:22 GMT)
Stacking Small Language Models for Generalizability [0.0] 大規模言語モデル(LLM)は、異なる自然言語ベンチマークで強いパフォーマンスを一般化する。
本稿では,言語モデルの微調整スタック (FSLM) と呼ばれる新しいアプローチを提案する。
特定のタスクを実行するために各SLMを微調整することにより、このアプローチは、特定のSLMが責任を負う複数の低レベルステップに高レベル推論を分解する。
その結果、FSLMはトレーニングと推論のコストを低減し、各SLMが後続のSLMと自然言語を介して通信するので、モデルの解釈性を向上させることができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:27:29 GMT)
Spatio-temporal Multivariate Cluster Evolution Analysis for Detecting and Tracking Climate Impacts [0.0] 本稿では,統計的に重要な影響を検出するための,新しい,効率的な教師なしデータ駆動手法を提案する。
提案手法は, 既知の事後影響・事象を検出することができることを示す。
さらに,NLPを用いて,作業後影響/事象の有意義なシーケンスを抽出する手法についても述べる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:13:09 GMT)
Simultaneous cooling of qubits via a quantum absorption refrigerator and beyond [0.0] 我々は、異なる磁化でラベル付けされた系のフルヒルベルト空間の異なる部分空間上の作用素を用いた相互作用ハミルトニアンのエンジニアリングを提案する。
局所的および大域的量子マスター方程式を用いて、これらの相互作用ハミルトニアンを用いて標的量子ビットの集合を同時に冷却できることを実証する。
また、この設計をハイゼンベルク相互作用を介して相互作用する量子ビットの星ネットワークに拡張し、3つまたは2つの熱浴に接触し、この装置を用いて標的量子ビットの冷却について議論する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:55:42 GMT)
Signed Rényi Entropy and Quantum Second Laws [0.0] 我々は、署名されたR'enyiエントロピーがシステムの非古典性を目撃していることを示す。
古典的進化の下では、R'enyi $2k$-entropy が非減少であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:04:26 GMT)
Separations in query complexity for total search problems [0.0] 本稿では,全探索問題のクラスTFNPの問合せ複雑性の類似について検討する。
特定の条件下で部分関数を全探索問題に変換する方法を提供する。
また、探索問題を部分関数に変換する方法も提供します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:51:24 GMT)
Search for New Particles with Flying Quantum Sensors in Space [0.0] 標準モデルを超えて超軽量な新しい粒子を探索するための空間型量子センシングの実装を提案する。
中心となる考え方は、宇宙量子センサーのスピンアンサンブルと地球内部に存在する粒子の間の長距離相互作用を探索することである。
我々の予測した探索感度は、地上実験と提案の両方の感度を最大7桁まで上回ることができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:15:29 GMT)
Satellite monitoring uncovers progress but large disparities in doubling crop yields [0.0] ルワンダの15,000の村々で、2030年までに2倍の生産性を達成するために、トラックを行き来する地域を発見しました。
この機械学習によって実現された分析は、空間的に明示的な生産性目標を設計するために使われ、誰も置き去りにすることなく、国家の目標を同時に確保する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:59:02 GMT)
Resilient Temporal GCN for Smart Grid State Estimation Under Topology Inaccuracies [0.0] 本稿では,電力系統における状態推定のための時間グラフ畳み込みネットワーク(TGCN)の性能に対する不確実性の影響について検討する。
TGCNモデルの修正は、測定データに基づいて生成された知識グラフを組み込むために提案される。
知識グラフを統合するためにTGCNアーキテクチャの2つのバリエーションを導入し、その性能を評価し、不確実性に対するレジリエンスの向上を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:41:27 GMT)
Recipe for observing immediate entanglement death-birth transition through Bell states with environmental Heisenberg exchange [0.0] 環境は、絶滅と絡み合いの両面で二重の役割を果たすことが知られており、絡み合い突然死(ESD)と絡み合い突然死(ESB)につながる。
本研究では,2つの量子ビットの初期状態のレシピを提案し,その間にESD,ESB,あるいは有限持続時間(TFD)の遷移を行う。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:04:48 GMT)
Reality of the Eigenvalues of the Hilbert-Pólya Hamiltonian [0.0] Hilbert-P'olya Conjecture の候補であるハミルトニアンが導入された。
ここでは、候補ハミルトニアンの well-defined similarity transformation の存在をエレガントに示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:46:34 GMT)
Reality of the Eigenvalues of the Hilbert-Pólya Hamiltonian [0.0] Hilbert-P'olya Conjecture に対してハミルトニアンを提案する。
変換作用素の固有函数は二乗可積分であり、決定的に固有値が実であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:46:34 GMT)
Quantum inspired factorization up to 100-bit RSA number in polynomial time [0.0] 我々はシュノーアの数学的枠組みに基づくRSA因子化ビルディングを攻撃した。
我々は、量子システムにおける最適化問題を符号化する最大256ビットのRSA数を分解する。
結果は現在の通信インフラのセキュリティを損なうものではない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:00 GMT)
Quantum control without quantum states [0.0] 量子不変量と最適制御の分野からのアイデアを組み合わせることで、最適な量子制御ソリューションを設計できることが示される。
状態は、それらが固有状態である作用素の観点でのみ暗黙的に指定される。
結果のアプローチの数値的な取り組みのスケーリングは、時間進化した量子状態の仕様化に必要な、典型的には指数関数的に増加する努力によって与えられるものではない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:24:42 GMT)
Quantum State Behavior at Exceptional Points and Quantum Phase Transitions [0.0] 量子相転移における例外点と臨界点の量子状態は破壊されないことを示す。
例外点、量子相転移、古典的なブラックホール事象の地平線との類似性を探求する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:38:31 GMT)
Quantum Convolutional Neural Network: A Hybrid Quantum-Classical Approach for Iris Dataset Classification [0.0] 本稿では,4量子ビット量子回路と古典的ニューラルネットワークを組み合わせた,分類タスクのためのハイブリッド量子古典型機械学習モデルを提案する。
このモデルは20エポック以上で訓練され、16エポックに設定されたIrisデータセットテストで100%の精度を達成した。
この研究は、ハイブリッド量子古典モデルの研究の活発化と、実際のデータセットへの適用性に寄与する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:15:12 GMT)
Quantifying the advantages of applying quantum approximate algorithms to portfolio optimisation [0.0] 本稿では、離散的大域的最小分散ポートフォリオモデルを解決するために、エンドツーエンドの量子近似最適化アルゴリズム(QAOA)を提案する。
このモデルでは、取引された資産の個数に最もリスクが低いリスク資産のポートフォリオを見出す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:59:05 GMT)
QIXAI: A Quantum-Inspired Framework for Enhancing Classical and Quantum Model Transparency and Understanding [0.0] ディープラーニングモデルは、解釈可能性の欠如によってしばしば妨げられ、それらを"ブラックボックス"にする。
本稿では、量子インスピレーションによるニューラルネットワークの解釈性向上のための新しいアプローチであるQIXAIフレームワークを紹介する。
このフレームワークは量子システムと古典システムの両方に適用され、様々なモデルにおける解釈可能性と透明性を改善する可能性を示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:55:09 GMT)
Projective Quantum Eigensolver with Generalized Operators [0.0] PQEフレームワークにおける閉形式残留方程式の観点から一般化作用素を決定する手法を開発する。
いくつかの分子系への応用により、アンザッツは単体、二重体、三重体を含む(異方性)UCCと同様の精度を達成できることを実証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:40:22 GMT)
Programmable entangled qubit states on a linear-optical platform [0.0] 線形光学量子情報処理のための実験プラットフォームを提案する。
任意の2ビットデュアルレール符号化状態を生成する能力を実証する。
我々はベル状態に比して98.5%の高忠実度量子状態の準備に成功した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:10:08 GMT)
Positive Conserved Quantities in the Klein-Gordon Equation [0.0] 我々は、クライン=ゴルドン方程式を時間的に一階の結合方程式に埋め込む。
これらの結合方程式は、シュレディンガー方程式よりも時間の1階微分方程式にクライン=ゴルドン方程式を十分還元する。
クライン=ゴルドン方程式には2つの正の積分が保存されていることが示される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:13:02 GMT)
Positive Conserved Quantities in the Klein-Gordon Equation [0.0] 我々は、クライン=ゴルドン方程式を時間的に一階の結合方程式に埋め込む。
これらの結合方程式は、シュレディンガー方程式よりも時間の1階微分方程式にクライン=ゴルドン方程式を十分還元する。
クライン=ゴルドン方程式には2つの正の積分が保存されていることが示される。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:13:02 GMT)
Polynomially restricted operator growth in dynamically integrable models [0.0] 各ハミルトニアンが同値関係を定義することを示し、作用素空間を同値類に分割する。
本稿では,同値クラスの次元を判定し,木上のXY$チェインやキタエフモデルなど,様々なモデルに対して評価する手法を提案する。
我々の手法は、自由フェルミオンに還元できない$XY$-$ZZ$モデルを含む、シミュラブル量子力学の新しいケースを明らかにするために用いられる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:31:41 GMT)
PixelBytes: Catching Unified Embedding for Multimodal Generation [0.0] PixelBytes Embeddingは、統一マルチモーダル表現学習のための新しいアプローチである。
Image Transformers、PixelCNN、Mamba-Bytesといった最先端のシーケンスモデルにインスパイアされたPixelBytesは、さまざまなデータ型を統合するという課題に対処することを目指している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:57:08 GMT)
PixelBytes: Catching Unified Embedding for Multimodal Generation [0.0] PixelBytes Embeddingは、統一マルチモーダル表現学習のための新しいアプローチである。
Image Transformers、PixelCNN、Mamba-Bytesといった最先端のシーケンスモデルにインスパイアされたPixelBytesは、さまざまなデータ型を統合するという課題に対処することを目指している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:57:08 GMT)
Phonon Dephasing, Entanglement and Exchange-Only Toffoli Gate Sequence in Quantum Dot Spin Chains [0.0] 量子ドットスピン鎖システムは、量子シミュレーションと集合電子の挙動の研究に不可欠である。
第1章では、拡張されたハバードモデル、二重量子ドットシステム、電子-フォノンカップリングに焦点を当てた重要な概念を紹介している。
第3章では、拡張ハバードモデルによって記述された多電子量子ドットスピンチェーンの絡み合いエントロピーについて検討する。
第4章はハイゼンベルクモデルで定義された9スピン9量子ドット系の操作列を探索する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:10:40 GMT)
Phonon Dephasing, Entanglement and Exchange-Only Toffoli Gate Sequence in Quantum Dot Spin Chains [0.0] 量子ドットスピン鎖システムは、量子シミュレーションと集合電子の挙動の研究に不可欠である。
第1章では、拡張されたハバードモデル、二重量子ドットシステム、電子-フォノンカップリングに焦点を当てた重要な概念を紹介している。
第3章では、拡張ハバードモデルによって記述された多電子量子ドットスピンチェーンの絡み合いエントロピーについて検討する。
第4章はハイゼンベルクモデルで定義された9スピン9量子ドット系の操作列を探索する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:10:40 GMT)
Phase space distributions in information theory [0.0] Shannon, Wehrl, Renyiのエントロピー, 相違点, 相互情報, その他の相関指標について検討する。
ウィグナー分布に関連するエントロピーはフシミ分布よりも低いことが観察された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 06:43:23 GMT)
Performance of Parity QAOA for the Signed Max-Cut Problem [0.0] パリティアーキテクチャにおける量子近似アルゴリズムの最適化性能(パリティQAOA)について検討する。
固定回路深さでのアルゴリズムの比較により、Parity QAOAはSWAPネットワークに基づく従来のQAOA実装よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:44:21 GMT)
Performance of Parity QAOA for the Signed Max-Cut Problem [0.0] パリティアーキテクチャにおける量子近似アルゴリズムの最適化性能(パリティQAOA)について検討する。
固定回路深さでのアルゴリズムの比較により、Parity QAOAはSWAPネットワークに基づく従来のQAOA実装よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:44:21 GMT)
PROMPTHEUS: A Human-Centered Pipeline to Streamline SLRs with LLMs [0.0] PROMPTHEUSは、システム文学レビューのためのAI駆動パイプラインソリューションである。
システム検索、データ抽出、トピックモデリング、要約など、SLRプロセスの重要な段階を自動化する。
高い精度を実現し、一貫性のあるトピック組織を提供し、レビュー時間を短縮します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:05:33 GMT)
P-YOLOv8: Efficient and Accurate Real-Time Detection of Distracted Driving [0.0] 引き離された運転は重大な安全上の問題であり、世界中で多くの死者と負傷につながっている。
本研究では、注意をそらされた運転行動を検出するための効率的でリアルタイムな機械学習モデルの必要性に対処する。
リアルタイムオブジェクト検出システムを導入し、速度と精度の両方に最適化する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:56:44 GMT)
Online Pseudo-Label Unified Object Detection for Multiple Datasets Training [0.0] オンライン擬似ラベル統一オブジェクト検出方式を提案する。
本手法では,周期的に更新された教師モデルを用いて,各サブデータセット内の未ラベルオブジェクトの擬似ラベルを生成する。
また,地域提案ネットワーク(PRN)のリコール率を改善するために,カテゴリ別ボックス回帰と擬似ラベルRPNヘッドを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:23:42 GMT)
On-demand acoustic shaping of Mossbauer gamma-ray photons [0.0] 我々は、放射能M"オスバウアーガンマ線源によって放射される準単色単光子波パケットの強度を、単一バーストを含む任意の数のバーストを持つ短いバースト列に変換する。
この技術は、必要に応じて、バースト出現の瞬間と、各バーストのピーク強度、持続時間、形状を個別に独立に制御することができる。
提案手法は,14.4-keVリコイルレス光子を用いて,Co-57源およびFe-57吸収体を用いて,現在利用可能な機器に基づいて実装可能であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:21:55 GMT)
On the Bisognano-Wichmann entanglement Hamiltonian of nonrelativistic fermions [0.0] 一次元の半無限領域に対する自由非相対論的フェルミオンの基底状態絡みハミルトニアンについて検討する。
我々は、ハミルトニアンの絡み合いのビソニャーノ・ヴィヒマン形式が正確であることを証明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:55:23 GMT)
Neural Quantum Propagators for Driven-Dissipative Quantum Dynamics [0.0] 我々は、駆動散逸型量子力学を解く普遍的なニューラルネットワークフレームワークである、駆動型量子プロパゲータ(NQP)を開発した。
NQPは任意の初期量子状態を処理することができ、様々な外部フィールドに適応し、より短い時間窓で訓練された場合でも、長時間のダイナミクスをシミュレートすることができる。
スピンボソンモデルと3状態遷移ガンマモデルを用いて,本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:13:17 GMT)
Natural Language Querying System Through Entity Enrichment [0.0] 本稿では,データベース上のドメインエキスパートクエリシステムについて述べる。
クライアント向けの自然言語インターフェースの提供に関心のある、フランスの企業向けに設計されたソリューションを提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:11:47 GMT)
Multipartite Entanglement Measure : Genuine to Absolutely Maximally Entangled [0.0] 我々は,GME-AMEマルチパーティ・エンタングルメント尺度と呼ばれる新しい尺度を導入する。
我々の測度は、4つの粒子の絡み合った状態の分類において堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:49:50 GMT)
Multifractality in monitored single-particle dynamics [0.0] 繰り返し測定した単一粒子の時間発展におけるマルチフラクタル特性について検討した。
どちらの場合も、マルチフラクタルの挙動は波動関数のアンサンブルや、測定結果に条件付けられた確率分布に現れる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:33:01 GMT)
Multi-product Zeno effect with higher order convergence rates [0.0] 量子ゼノ効果は、希望部分空間に収束する任意の量子演算により、投影されたハミルトンあるいはリンドブラディアンの力学を近似する。
多積公式を用いて1/nK+1$の任意のパワーを達成し、修正されたチェルノフ・レムマ、修正されたダンフォード・セガル近似、および正則関数計算を用いる。
本稿では, ボソニックキャットコードと, システムと環境を分離するBang-Bang法によって制御された広い範囲の例を用いて, このスキームを簡潔に解説する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:58:01 GMT)
Multi-copy activation of genuine multipartite entanglement in continuous-variable systems [0.0] 真のマルチパート・エンタングルメント(GME)のマルチコピー・アクティベーションは、2つの分離可能だが完全に分離不能な状態の複数のコピーがGMEを示す現象である。
GME-activatable non-Gaussian state の例を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:40:46 GMT)
Molecular Quantum Control Algorithm Design by Reinforcement Learning [0.0] 分子イオンを1つの純粋な量子状態に合成する汎用的,強化学習設計の量子論理手法を提案する。
制御アルゴリズムの性能はCaH$+$イオンの場合で数値的に示され、96個の固有状態を持つ。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:28:12 GMT)
Modelling Structured Data Learning with Restricted Boltzmann Machines in the Teacher-Student Setting [0.0] 本稿では,教師のRBMが教師のRBMから生成された構造化データを学習する学習環境について検討する。
その結果,教師のパターンを学習するのに要するデータ量は,その数と相関によって減少することがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:18:19 GMT)
Measuring spin-noise correlation function via time reversal [0.0] スピンノイズの自己相関関数を乗算に基づいて簡易に測定し、2つのディジタル信号トレースを平均化する手法を提案する。
セシウム蒸気中のスピンノイズの測定にこの手法をうまく応用した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:30:13 GMT)
Maximally entangled gluons for any $x$ [0.0] 極性ハドロン内部の小さなx$での個々のクォークとグルーオンはベル状態と見なすことができる。
この観測を0x1$のすべての値に一般化し、グルーオンをqubitとquditの間の最大絡み合った状態として記述する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:00:59 GMT)
Magnetic transport due to a translationally invariant potential obstacle [0.0] 荷電粒子が平面に垂直な均一磁場に曝される2次元システムを考える。
ランダウ準位が絶対連続スペクトルに変化するような摂動に関するいくつかの条件を導出する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:10:00 GMT)
LightFusionRec: Lightweight Transformers-Based Cross-Domain Recommendation Model [0.0] LightFusionRecは、新しいクロスドメインレコメンデーションシステムである。
DistilBERTをテキストの特徴抽出に、FastTextをジャンル埋め込みに統合する。
多くのメディアフォーマットに対して、正確で文脈的に関係のあるレコメンデーションを生成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:49:40 GMT)
Learning-to-Defer for Extractive Question Answering [0.0] 質問応答の文脈で言語モデルを再訓練することなく、人間の専門家や大規模モデルへの選択的推論を可能にすることにより、意思決定を強化する2段階の学習・判断機構を適応的に導入する。
その結果,最小限のクエリを遅延させることで,計算効率を保ちながら,より大規模なクエリに匹敵する性能を実現することができた。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:21:00 GMT)
Learning to generate high-dimensional distributions with low-dimensional quantum Boltzmann machines [0.0] 低次元完全可視QBMは高次元システムに典型的に関連付けられた分布を生成することができることを示す。
我々は,非交換項とハミルトン接続がQBMの学習能力を向上させることを発見した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:01 GMT)
Learning junta distributions and quantum junta states, and QAC$^0$ circuits [0.0] 本稿では,量子ジャンタ分布の学習問題,量子カウンター部,量子ジャンタ状態,QAC$0$回路について考察する。
誤差$varepsilon$を全変動距離で学習できることが示される。
また、$Omega(4k+log (n)/varepsilon2)$コピーの低い境界も証明します。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:39:20 GMT)
Large Language Models for Cross-lingual Emotion Detection [0.0] 本稿では,言語間感情検出に着目したWASSA 2024タスク2のシステム記述について述べる。
大規模言語モデル(LLM)とそれらのアンサンブルを組み合わせて、異なる言語間の感情を効果的に理解し分類する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:00:09 GMT)
LLM-based SPARQL Query Generation from Natural Language over Federated Knowledge Graphs [0.0] バイオインフォマティクス知識グラフ(KGs)上でユーザ質問を正確なSPARQLクエリに変換するための検索型拡張生成(RAG)システムを提案する。
クエリ生成における精度の向上と幻覚の低減を目的として,クエリ例やスキーマ情報を含むメタデータをKGから活用し,生成したクエリの修正に検証ステップを組み込んだ。
このシステムは chat.expasy.org で公開されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:13:48 GMT)
LLM-based SPARQL Query Generation from Natural Language over Federated Knowledge Graphs [0.0] バイオインフォマティクス知識グラフ(KGs)上でユーザ質問を正確なSPARQLクエリに変換するための検索型拡張生成(RAG)システムを提案する。
クエリ生成における精度の向上と幻覚の低減を目的として,クエリ例やスキーマ情報を含むメタデータをKGから活用し,生成したクエリの修正に検証ステップを組み込んだ。
このシステムは chat.expasy.org で公開されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:13:48 GMT)
LLM-based SPARQL Query Generation from Natural Language over Federated Knowledge Graphs [0.0] バイオインフォマティクス知識グラフ(KGs)上でユーザ質問を正確なSPARQLクエリに変換するための検索型拡張生成(RAG)システムを提案する。
クエリ生成における精度の向上と幻覚の低減を目的として,クエリ例やスキーマ情報を含むメタデータをKGから活用し,生成したクエリの修正に検証ステップを組み込んだ。
このシステムは chat.expasy.org で公開されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:13:48 GMT)
Kinetic uncertainty relations for quantum transport [0.0] 電流の精度は、古典的極限における活性として解釈できる粒子電流雑音の関数によって制限されることを示す。
完全量子極限では、系がフェルミオンかボソニックかによって、活性制約を修正できる精度境界が見つかる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:27:11 GMT)
Kinetic uncertainty relations for quantum transport [0.0] 電流の精度は、古典的極限における活性として解釈できる粒子電流雑音の関数によって制限されることを示す。
完全量子極限では、系がフェルミオンかボソニックかによって、活性制約を修正できる精度境界が見つかる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:27:11 GMT)
Integration of Cobalt Ferromagnetic Control Gates for Electrical and Magnetic Manipulation of Semiconductor Quantum Dots [0.0] ナノスケールドット・ツー・マグネットピッチを用いた多ゲートFD-SOIナノワイヤへのナノサイズのコバルト制御ゲートの統合
マルチゲートナノワイヤの電気的特性は、室温から10mKまでの全ての強磁性ゲートのフルフィールド効果を示す。
薄膜とパターン制御ゲートの磁気特性に対する洞察は、試料磁気計測と電子ホログラフィー測定によって得られる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:43:14 GMT)
Increasing the clock speed of a thermodynamic computer by adding noise [0.0] 得られた熱力学コンピュータプログラムは、元のコンピュータプログラムと等価であるが、クロック速度は高い。
このアプローチは、計算の忠実性を保ちながら熱力学計算の速度を向上する方法を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:47:17 GMT)
In Search of the Successful Interpolation: On the Role of Sharpness in CLIP Generalization [0.0] textitzero-shot と textitfine-tuned のモデルを補間する textttRFT がこの問題に対処するために提案されている。
我々は,テキストtRFTのOOD精度の一般化と,テクスタイトレイヤーワイドシャープネスの相関性を示す。
また,textttRFT におけるtextitstraggler 層内の疎結合を誘導することにより,textitfailure モード現象を緩和できることを実証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:03:42 GMT)
IGMaxHS -- An Incremental MaxSAT Solver with Support for XOR Clauses [0.0] IGMaxHS は iMaxHS と GaussMaxHS をベースとしているが, XOR の制約は GaussMaxHS よりも少ない。
IGMaxHSは、不正な不満足な判断も、不正なモデルも、一貫性のないコストモデルの組み合わせも報告していない唯一の解決法である。
IGMaxHSは,ミュンヘン量子ツールキットを用いたシミュレーションにより,量子カラーコードを復号化可能であることを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:21:21 GMT)
Hybrid Quantum-HPC Solutions for Max-Cut: Bridging Classical and Quantum Algorithms [0.0] 我々は,ハイブリッドシステムにおける時間的複雑性,スケーラビリティ,通信オーバーヘッドを分析する理論的モデルを構築した。
小型のMax-Cutインスタンス上でのQAOAの性能を評価する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 04:10:54 GMT)
Hybrid Architecture for Real-Time Video Anomaly Detection: Integrating Spatial and Temporal Analysis [0.0] 本研究では,空間的・時間的分析を組み合わせることで人間の行動にインスパイアされた映像データにおけるリアルタイム異常検出のための新しいアーキテクチャを提案する。
時間解析には、繰り返し畳み込みネットワーク(CNN + RNN)を使用し、ビデオシーケンスを処理するためにVGG19とGRUを関連付ける。
空間解析については、YOLOv7を用いて個々の画像を解析する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:32:46 GMT)
How much secure randomness is in a quantum state? [0.0] 量子状態からどれだけの暗号的にセキュアなランダム性を抽出できるか?
本稿では,情報源と測定装置の双方について,量子側情報を持つ相手を対象とする汎用逆数モデルについて考察する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:16:56 GMT)
Hiding in Plain Sight: Reframing Hardware Trojan Benchmarking as a Hide&Seek Modification [0.0] 本研究は,ハードウェアトロイジャン検出(HT)の現実的問題を明確に定義することにより,ハードウェア設計分野におけるセキュリティ研究の進展に焦点を当てる。
目的は、HT検出をより現実世界に密にモデル化することであり、すなわち、回路がHTに感染しているかどうかを検知剤が認識していないようなThe Seeker's Dilemmaと記述することである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:45:20 GMT)
Hidden quantum correlations in cavity-based quantum optics [0.0] 多重モード光学系において、スペクトル共分散行列はガウス状態の二次状態の間の量子相関に関する全ての情報を符号化する。
近年の研究では、従来考えられていたよりも一般的であるシナリオでは、これらの相関の一部が標準ホモダイン検出方式に到達できないことが判明している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:08:18 GMT)
Hidden exceptional point, localization-delocalization phase transition in Hermitian bosonic Kitaev model [0.0] エルミートボソニック・キータエフモデル(英語版)は例外点(EP)を持つ非エルミートコア行列をサポートする。
等価系における隠れEPと局在化・非局在化遷移の関連性を示す。
時間進化の数値シミュレーションはEPにおける明確な遷移点を明らかにする。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:52:18 GMT)
Gravity from entropy [0.0] 重力はエントロピー的作用結合物質場と幾何学から導かれる。
物質場は時空を曲線とし、物質場によって誘導される計量を定義する。
この場の理論の正準量子化は、量子重力に対する新たな洞察をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:20:30 GMT)
Geometrical Perspective on Spin-Lattice Density-Functional Theory [0.0] 有限相互作用スピン格子系に対する密度汎関数理論の基礎に関する最近の見解を述べる。
これはホヘンベルク・コーンの定理と v-表現可能性を完全に幾何学的に記述することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 12:07:59 GMT)
Generalized Probabilistic Attention Mechanism in Transformers [0.0] GPAM(Generalized Probabilistic attention mechanism)と呼ばれる新しい注意機構を導入する。
従来のアテンション機構とは異なり、GPAMは固定総和を保持しながら負のアテンションスコアを許容する。
提案した二重注意GPAMは,ランク崩壊問題と勾配消滅問題の両方を効果的に緩和する理論的証拠を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 01:55:52 GMT)
General recipe for immediate entanglement death-birth transitions via Bell states: environmental Heisenberg exchange as an example [0.0] 環境は、絶滅と絡み合いの両面で二重の役割を果たすことが知られており、絡み合い突然死(ESD)と絡み合い突然死(ESB)につながる。
本研究では,2つの量子ビットの初期状態のレシピを提案し,その間にESD,ESB,あるいは有限持続時間(TFD)の遷移を行う。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:04:48 GMT)
Further Applications of the Generalised Phase Kick-Back [0.0] 前回の研究で、一般化位相キックバック (Generalized Phase Kick-Back, $GPK$) と呼ばれる量子アルゴリズムの手法を定義した。
本稿では、$mathbfy$- Balanced関数の概念を定義し、より一般化されたDeutsch-Jozsa問題を一般化する新しい問題を解く。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 10:23:59 GMT)
Forecasting Opioid Incidents for Rapid Actionable Data for Opioid Response in Kentucky [0.0] 我々は、ケンタッキー州の救急医療機関(EMS)が記録した未来のオピオイド過剰摂取事故の数を正確に予測する機械学習と時系列予測の分野における取り組みについて述べる。
提案手法は, EMSオピオイド過剰摂取の地域レベルと地域レベルアグリゲーションを用いて, 毎月の日数予測を行う。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:45:13 GMT)
Few-sample Variational Inference of Bayesian Neural Networks with Arbitrary Nonlinearities [0.0] 3つの決定論的サンプルだけで任意の非線形性を通して統計モーメントを伝播する単純かつ効果的な手法を実証する。
そこで本研究では,BNNの出力ノードに物理インフォームド事前情報を注入する非線形アクティベーション関数を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:26:32 GMT)
Fast storage of photons in cavity-assisted quantum memories [0.0] 理想的な量子メモリは、任意の光パルスを単位効率で保存することができる。
これは、パルスがメモリの帯域幅よりも長い時間を持つ断熱的な状態で動作する必要がある。
我々は、パルスの持続時間に関係なく、記憶・検索プロセスの効率を最適化するための効果的な戦略を同定する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:59:56 GMT)
FAMOUS: Flexible Accelerator for the Attention Mechanism of Transformer on UltraScale+ FPGAs [0.0] Transformer Neural Network(TNN)は、自然言語処理(NLP)、機械翻訳、コンピュータビジョン(CV)など、幅広いアプリケーション領域に応用されている。
本稿では、フィールドプログラマブルゲートアレイ(FPGA)上でのTNNの重み付きマルチヘッドアテンション計算のためのフレキシブルハードウェアアクセラレータである textitFamous を提案する。
並列性を改善し、レイテンシを低減するために、処理要素とオンチップメモリの高利用に最適化されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:34:04 GMT)
FAMOUS: Flexible Accelerator for the Attention Mechanism of Transformer on UltraScale+ FPGAs [0.0] Transformer Neural Network(TNN)は、自然言語処理(NLP)、機械翻訳、コンピュータビジョン(CV)など、幅広いアプリケーション領域に応用されている。
本稿では、フィールドプログラマブルゲートアレイ(FPGA)上でのTNNの重み付きマルチヘッドアテンション計算のためのフレキシブルハードウェアアクセラレータである textitFamous を提案する。
並列性を改善し、レイテンシを低減するために、処理要素とオンチップメモリの高利用に最適化されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 05:34:04 GMT)
Extending the European Competence Framework for Quantum Technologies: new proficiency triangle and qualification profiles [0.0] 2024年のバージョン2.5のアップデートでは、新しい熟練度三角形と資格プロファイルが追加されている。
熟練度三角形は、3つの熟練度領域に対して6つの熟練度レベルを提案する。
9つの資格プロファイルは、量子産業に関連する原型的資格または職種を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:00:33 GMT)
Extending the European Competence Framework for Quantum Technologies: new proficiency triangle and qualification profiles [0.0] 2024年のバージョン2.5のアップデートでは、新しい熟練度三角形と資格プロファイルが追加されている。
熟練度三角形は3つの熟練度領域に対して6つの熟練度レベルを提案し、各レベルの知識とスキルを指定する。
9つの資格プロファイルは、量子産業に関連する原型的資格または職種を示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:00:33 GMT)
Experimental simulation of daemonic work extraction in open quantum batteries on a digital quantum computer [0.0] 我々は、量子回路として対応するダイナミクスの実装方法を示し、最終条件フィードバックのユニタリ進化を含む。
本研究では, 得られたデーモン抽出作業の実験値が, いわゆるデイモンエルゴトロピーによって定量化された理論上界にどのように近いかを示す作業抽出プロトコルを実験的にシミュレートした。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:56:24 GMT)
Exact full-RSB SAT/UNSAT transition in infinitely wide two-layer neural networks [0.0] 我々は,典型的な状態の重なり合いの有無にかかわらず,グラディエントDescentはキャパシティに到達できないことを示す。
この発見は勾配に基づくアルゴリズムが極めて非定型な状態に偏っていることを示唆している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:45:30 GMT)
Exact full-RSB SAT/UNSAT transition in infinitely wide two-layer neural networks [0.0] 勾配に基づくアルゴリズムは、アルゴリズムのしきい値を決定するような非定型な状態に偏りがあることが示される。
その結果、最近開発されたいくつかの定理の根底にある仮説は、近似メッセージパッシング(AMP)ベースのアルゴリズムが一般には成立しないというものである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:45:30 GMT)
ExDBN: Exact learning of Dynamic Bayesian Networks [0.0] 本稿では,データから因果学習を行うためのスコアベースの学習手法を提案する。
提案手法は, 最大25の時系列の小型・中規模の合成インスタンスに適用した場合, 優れた結果が得られた。
バイオサイエンスとファイナンスにおける2つの興味深い応用は、この方法を直接適用することで、高度に正確でグローバルに収束した解法を開発する機会をさらに強調するものである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:27:18 GMT)
Enhancing PAC Learning of Half spaces Through Robust Optimization Techniques [0.0] PACは、一定の悪意のある雑音下でハーフスペースを学習し、トレーニングデータのごく一部が逆向きに破損する。
半宇宙学習における雑音耐性を考慮に入れた理論的枠組みを拡張した,新しい効率的なアルゴリズムを提案する。
本稿では,従来の最先端手法と比較して,悪質な雑音に対して優れた頑健性を示すアルゴリズムの性能を包括的に分析する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:08:17 GMT)
Enhanced microscale NMR spectroscopy of low-gyromagnetic ratio nuclei via hydrogen transfer [0.0] NV中心を用いた低磁気比核における微小スケールでの化学シフトとJカップリングを検出する方法を提案する。
提案プロトコルは,13ドルCを含むシナリオに対して,1桁以上の感度向上を実現し,より低いジャイロ磁気比を持つ原子核の感度向上を実現している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 15:31:57 GMT)
Efficient Terminology Integration for LLM-based Translation in Specialized Domains [0.0] 特許、金融、バイオメディカルドメインなどの専門分野において、用語は翻訳に不可欠である。
本稿では,用語翻訳の精度を保ちながら,少ない量のデータで効率的にモデルを訓練する手法を提案する。
この手法は、専門用語を扱うモデルの能力を高め、高品質な翻訳を保証する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 07:01:25 GMT)
Domain-Adaptive Pre-training of Self-Supervised Foundation Models for Medical Image Classification in Gastrointestinal Endoscopy [0.0] ビデオカプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供することで、消化管内視鏡(GIE)の診断を変換した。
ビデオカプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供することで、消化管内視鏡(GIE)の診断を変換した。
しかし、そのポテンシャルは、画像処理中に生成される画像の量によって制限されており、それは6~8時間で最大100万枚の画像を生成することができる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:52:25 GMT)
DisQ: A Markov Decision Process Based Language for Quantum Distributed Systems [0.0] 本研究では,分散バージョンへの量子アルゴリズムの書き直しを容易にするフレームワークとしてDisQを提案する。
DisQはChemical Abstract Machine(CHAM)とMarkov Decision Processs(MDP)の概念を組み合わせることで、量子的並列性と分散挙動を明確に区別することを目的としている。
分散バージョンに等価な書き直しを示すために、量子加算やショアのアルゴリズムなどのいくつかのケーススタディを示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:52:20 GMT)
Digital quantum simulation of a (1+1)D SU(2) lattice gauge theory with ion qudits [0.0] 動的物質を持つ(1+1)D SU(2)非アーベル格子ゲージ理論の量子シミュレーション戦略を提案する。
我々は、このモデルが単純ではあるが、非アーベル場の理論に特有の物理的関連性を示すことを数値的に示す。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 23:00:35 GMT)
Digital Product Passport Management with Decentralised Identifiers and Verifiable Credentials [0.0] ESPRは製品関連データの収集と管理における一連の要件を解決している。
本稿では、ESPRの要件を分析し、DIDとVCを用いてそれらがどのように達成されるかを説明する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 08:18:52 GMT)
Deterministic entanglement concentration assisted by generalized XZ basis [0.0] 本稿では,キュービット量子状態の任意の個数から,キュービット量子系の絡み合いを集中させるプロトコルを提案する。
このプロトコルを適用して、任意の2量子状態と不等な絡み合いを用いて絡み合いを集中させ、このプロセスで生成される多量子状態の絡み合い特性について議論する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:12:52 GMT)
Designing Robust Cyber-Defense Agents with Evolving Behavior Trees [0.0] 本研究では,学習可能なコンポーネントを用いた行動木を用いた自律型サイバー防御エージェントの設計手法を開発する。
学習可能なコンポーネントは、様々なサイバー攻撃に適応し、セキュリティメカニズムをデプロイするために最適化されている。
EBTをベースとしたエージェントは、適応型サイバー攻撃に対して堅牢であり、その決定と行動の解釈に高レベルな説明を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:38 GMT)
Defining coherent states: why must they be eigenstates of the annihilation operator? [0.0] 我々は、粒子を標準量子ブラウン運動モデル内の環境に結合させることによって引き起こされるデコヒーレンス過程により、コヒーレント状態が最も古典的な状態として選択されることを示す。
また、素粒子を標準量子ブラウン運動モデル内の環境に結合させることによって引き起こされるデコヒーレンス過程により、コヒーレント状態が最も古典的な状態として選択される理由が、上記の2つの定理の妥当性によって正確に示されていることも示している。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 20:18:20 GMT)
Deep Radiomics Detection of Clinically Significant Prostate Cancer on Multicenter MRI: Initial Comparison to PI-RADS Assessment [0.0] 本研究は,2010年から2020年の間に取得した4つのデータセットから615例(平均年齢63.1+/-7歳)のバイパラメトリック(T2WおよびDW)前立腺MRI配列を分析した。
深部放射線学の機械学習モデルは, 病変レベルではなく, csPCa検出において, PI-RADSアセスメントに匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:41:58 GMT)
Data Augmentation of Multivariate Sensor Time Series using Autoregressive Models and Application to Failure Prognostics [0.0] 本研究では,非定常多変量時系列に対する新しいデータ拡張解とその故障診断への応用について述べる。
限られたサンプルから鍵情報を抽出し、PHM溶液の性能を向上させる方法として新しい合成サンプルを生成するために使用できる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:38:07 GMT)
Comprehensive benchmarking of large language models for RNA secondary structure prediction [0.0] RNA-LLMはRNA配列の大規模なデータセットを使用して、自己教師付き方法で、意味的に豊かな数値ベクトルで各RNA塩基をどう表現するかを学ぶ。
その中で、二次構造を予測することは、RNAの機能的機構を明らかにするための基本的な課題である。
本稿では,いくつかの事前学習されたRNA-LLMの総合的な実験解析を行い,それらを統合されたディープラーニングフレームワークにおけるRNA二次構造予測タスクと比較する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:12:06 GMT)
Comparative Analysis of Human Mobility Patterns: Utilizing Taxi and Mobile (SafeGraph) Data to Investigate Neighborhood-Scale Mobility in New York City [0.0] 本研究では,ニューヨーク市近郊におけるタクシー旅行記録とSafeGraphデータセットを用いた移動性の違いについて検討した。
以上の結果から,タクシーの需要が常に高いロウアー・マンハッタンなどの場所からの移動度は,タクシーのデータによって把握される傾向が示唆された。
対照的にSafeGraphのデータは、自家用車での通勤が一般的であるが、歩行者の多い地域での旅行を過小評価する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:40:23 GMT)
Combining Theory of Mind and Kindness for Self-Supervised Human-AI Alignment [0.0] 現在のAIモデルは、安全よりもタスク最適化を優先しており、意図しない害のリスクにつながっている。
本稿では,これらの諸問題に対処し,競合する目標の整合化を支援することを目的とした,人間に触発された新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 22:04:44 GMT)
CoT-TL: Low-Resource Temporal Knowledge Representation of Planning Instructions Using Chain-of-Thought Reasoning [0.0] CoT-TLは、自然言語仕様を表現に変換するためのデータ効率のよいインコンテキスト学習フレームワークである。
CoT-TLは、ローデータシナリオで3つの多様なデータセット間で最先端の精度を達成する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:10:43 GMT)
Closed-channel parameters of Feshbach resonances [0.0] フェシュバッハ共鳴に関連する2体の観測物は、閉じたチャネルの性質に敏感である。
これは超低温原子における全ての磁気フェシュバッハ共鳴のケースである。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:37:54 GMT)
Claim Check-Worthiness Detection: How Well do LLMs Grasp Annotation Guidelines? [0.0] ファクトチェックを必要とするテキストセグメントを識別するために、ゼロショットと少数ショットのLCMプロンプトを使用する。
各種領域の5つのCD/CWデータセットに対して,LLMの予測精度と校正精度を評価した。
提案手法により, 最適急進的冗長性はドメイン依存であり, 文脈の追加は性能を向上しないことがわかった。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 11:33:33 GMT)
Cancer Cell Classification using Deep Learning [0.0] 悪性腫瘍には良性腫瘍と悪性腫瘍の2種類がある。
今日のオンライン環境で生産されるデータのほとんどは、医療やソーシャルメディアに関連するウェブサイトから来ている。
本研究は, 細菌細胞を種々の深層学習アルゴリズムを用いて良性又は癌性に分類する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:21:16 GMT)
Bosonic Mpemba effect with non-classical states of light [0.0] ムペンバ効果(Mpemba effect)は、ある条件下では、遠方平衡状態が平衡に近い状態よりも早く平衡に向かって緩和できるという驚くべき観察を指す。
光の古典的状態を利用した量子光学におけるMpemba効果の出現を予測する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 19:41:13 GMT)
Boosted Bell-state measurements for photonic quantum computation [0.0] フォールトトレラント核融合に基づくフォトニック量子コンピューティング(FBQC)は、核融合と呼ばれる2光子測定の絡み合いに依存している。
線形光射影型ベル状態測定(BSM)は成功確率50%に制限される。
光子対と4x4マルチポート干渉計を利用する強化BSM法が提案されている。
この強化されたBSMスキームでは、個々の光子損失確率1.4%が許容され、非ボス化BSMは光子損失閾値0.45%となる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 18:00:11 GMT)
Augmenting Legal Decision Support Systems with LLM-based NLI for Analyzing Social Media Evidence [0.0] 本稿は,NLLP 2024におけるL-NLI(Lawal Natural Language Inference)の共有タスクのシステム記述とエラー解析について述べる。
このタスクは、レビューと苦情の関連性を示す、関係を関連づけられ、矛盾し、中立的なものに分類することを必要とした。
当システムでは, 勝訴として出現し, 他の項目を著しく上回り, 法的テキスト分析におけるアプローチの有効性を実証した。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:20:15 GMT)
Asymmetries in Financial Spillovers [0.0] 我々は、米国ベースの金融ショックに対する国際的反応が、これらの次元に沿って非対称であることを示します。
悪いショックは、良心的なショックよりも、生産、インフレ、株式市場の低下を強く引き起こすことがわかりました。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 17:14:58 GMT)
Anomalous radiation reaction in a circularly polarized field [0.0] 異常な放射線反応は、光子放出に対する1ループQED補正から生じる。
強いレーザー場における電子について、この現象の可能性が議論されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:11:42 GMT)
All You Need is an Improving Column: Enhancing Column Generation for Parallel Machine Scheduling via Transformers [0.0] 本稿では,並列マシンスケジューリング問題に対するニューラルネットワーク強化カラム生成(CG)アプローチを提案する。
ニューラルネットワークをオフラインでトレーニングし、推論モードで使用することにより、負の削減コスト列を予測することにより、計算時間を大幅に削減できる。
大規模インスタンスの場合,提案手法は目標値の80%を500秒未満で改善する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:53:37 GMT)
Adversarial Consistency and the Uniqueness of the Adversarial Bayes Classifier [0.0] 逆代理リスクの最小化は、堅牢な分類器を学習するための一般的な手法である。
妥当な分布仮定の下では、凸代理損失は逆学習において統計的に整合であることが示され、逆ベイズ分類器は特異性の特定の概念を満たす。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 03:22:02 GMT)
ADAM-SINDy: An Efficient Optimization Framework for Parameterized Nonlinear Dynamical System Identification [0.0] 本稿では,ADAM-SINDyと呼ばれるSINDyフレームワークの新たな手法を提案する。
ADAM-SINDyはADAM最適化アルゴリズムを用いて確立されたアプローチの強みを合成する。
その結果、パラメータ化力学系を同定する際の大幅な改善が示された。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 21:36:17 GMT)
A quantitative Robbins-Siegmund theorem [0.0] 我々は、Robins-Siegmund の定理の定量的バージョンを提供し、Tao の意味での転移性の領域を見つけるために、どこまで遠くを見る必要があるかという境界を定めている。
我々の証明は、Doobの定理のメタスタブルな類似で$L_$-supermartingalesと、プロセスの和や積を通じて量的情報がどのように伝播するかを正確に示す一連の技術的補題を含んでいる。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 13:16:29 GMT)
A memory and gate efficient algorithm for unitary mixed Schur sampling [0.0] Unitary Schur sample は、入力 $m qudit 状態の Young ラベルと Unitary group register を測定するプロセスである。
我々はこのタスクを、最近導入された混合シュル=ワイルアルゴリズムを説明するために一般化する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:03:48 GMT)
A Simulation Environment for the Neuroevolution of Ant Colony Dynamics [0.0] 創発的集団行動の研究を促進するためのシミュレーション環境を導入する。
現実世界のデータを活用することで、環境はターゲットのアリの跡をシミュレートし、制御可能なエージェントが複製を学ばなければならない。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 02:15:42 GMT)
A Plug-and-Play Fully On-the-Job Real-Time Reinforcement Learning Algorithm for a Direct-Drive Tandem-Wing Experiment Platforms Under Multiple Random Operating Conditions [0.0] Concerto Reinforcement Learning Extension (CRL2E)アルゴリズムが開発された。
このプラグ・アンド・プレイのリアルタイム強化学習アルゴリズムは、新しい物理インスパイアされたルールベースのポリシー構成戦略を取り入れている。
ハードウェアテストでは、最適化された軽量ネットワーク構造が、リアルタイムの制御要件を満たす、重み付けと平均推論時間に優れていることが示されている。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 00:59:50 GMT)
A PID-Controlled Non-Negative Tensor Factorization Model for Analyzing Missing Data in NILM [0.0] 非侵入負荷モニタリング(NILM)は、スマートグリッドとエネルギー管理において欠かせないツールとなっている。
線形および行列因数分解のような従来の計算法は非線形関係に苦慮し、スパースデータに敏感である。
本稿では, パラメータ勾配を動的に調整し, 収束性, 安定性, 正確性を向上する, テンソルモデル(PNLF)の非負潜在因数分解法を提案する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:53:11 GMT)
A Hybrid Approach to Mitigate Errors in Linear Photonic Bell-State Measurement for Quantum Interconnects [0.0] ベル状態測定のための新しいハイブリッド検出手法を提案する。
量子テレポーテーションとエンタングルメントスワッププロセスの明確な忠実さを導出する。
この研究は、線形光学スキームのための新しいツールを提供し、量子状態工学と量子相互接続への応用を提供する。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 09:52:06 GMT)
A Framework for Evaluating Predictive Models Using Synthetic Image Covariates and Longitudinal Data [0.0] 患者データを縦断的観察で合成するための新しい枠組みを提案する。
提案手法は,各データモダリティを生成する潜在空間における制御的関連性を導入する。
光コヒーレンストモグラフィー(OCT)スキャンを用いて,本フレームワークの実証を行った。
論文参考訳(メタデータ) (Mon, 21 Oct 2024 16:43:16 GMT)