The SkatingVerse Workshop & Challenge: Methods and Results [137.8] SkatingVerse Workshop & Challengeは、人間の行動理解のための新規で正確な方法の研究を促進することを目的としている。
SkatingVerse Challengeで使用されるデータセットが公開された。
世界中から参加する約10チームがSkatingVerse Challengeに出場した。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:12:07 GMT)
Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection [133.7] 現在のメトリクスはサイズに敏感で、大きなオブジェクトが集中し、小さなオブジェクトが無視される傾向があります。
サイズに基づくバイアスは、追加のセマンティック情報なしでは不適切であるため、評価はサイズ不変であるべきだと論じる。
我々は,この目標に適した最適化フレームワークを開発し,異なる大きさのオブジェクトの検出において,大幅な改善を実現した。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:31:48 GMT)
An Introduction to Vision-Language Modeling [128.6] 視覚言語モデル(VLM)の応用は、我々の技術との関係に大きな影響を与えるだろう。
VLMとは何か、どのように動作するのか、どのようにトレーニングするかを紹介します。
本研究は,主に画像から言語へのマッピングに焦点を当てるが,ビデオへのVLMの拡張についても論じる。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:01:23 GMT)
Thermalization and Criticality on an Analog-Digital Quantum Simulator [118.1] 本稿では,69個の超伝導量子ビットからなる量子シミュレータについて述べる。
古典的Kosterlitz-Thouless相転移のシグネチャと,Kibble-Zurekスケール予測からの強い偏差を観測する。
本システムは, 対角二量体状態でディジタル的に調製し, 熱化時のエネルギーと渦の輸送を画像化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:40:39 GMT)
BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [116.4] 我々は,新たな実験を設計し,その成果の理由を判断し,仮説空間を効率的にナビゲートし,望ましい解を得るエージェントであるBioDiscoveryAgentを開発した。
BioDiscoveryAgentは、機械学習モデルをトレーニングしたり、取得関数を明示的に設計することなく、新しい実験を独自に設計することができる。
5つのデータセットで所望の表現型を検出することで平均18%の改善を実現している。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:57:17 GMT)
MIPI 2024 Challenge on Nighttime Flare Removal: Methods and Results [108.9] 我々はMIPI 2024のナイトタイムフレア除去トラックを要約し、レビューする。
170人の参加者が登録され、14チームが最終テストフェーズで結果を提出した。
この課題で開発されたソリューションは、夜間フレア除去における最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:14:34 GMT)
Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model [108.4] 本稿では,包括的3次元理解のための新しい大規模言語モデルReason3Dを紹介する。
拡張シーン内の小さな物体を見つけるための階層型マスクデコーダを提案する。
大規模なScanNetとMatterport3Dデータセットにおいて、Reason3Dが顕著な結果が得られることを検証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:41 GMT)
Towards Calibrated Robust Fine-Tuning of Vision-Language Models [97.2] 視覚言語モデル(VLM)におけるOOD精度と校正誤差の両方を改善する頑健な微調整法を提案する。
この知見に基づいて,最小の特異値を持つ制約付きマルチモーダルコントラスト損失を用いて微調整を行う新しいフレームワークを設計する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:16 GMT)
Zero-Shot Video Semantic Segmentation based on Pre-Trained Diffusion Models [97.0] 本稿では,事前学習した拡散モデルに基づくビデオセマンティック(VSS)の最初のゼロショット手法を提案する。
予め訓練された画像とビデオ拡散モデルに基づくVSSに適したフレームワークを提案する。
実験により,提案手法は既存のゼロショット画像セマンティックセグメンテーション手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:39:38 GMT)
Energy-Guided Continuous Entropic Barycenter Estimation for General Costs [95.3] 任意のOTコスト関数に対して連続的エントロピーOT(EOT)バリセンタを近似する新しいアルゴリズムを提案する。
本手法は、弱いOTに基づくEOT問題の二重再構成に基づいている。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:24:19 GMT)
Relative Preference Optimization: Enhancing LLM Alignment through Contrasting Responses across Identical and Diverse Prompts [95.1] Relative Preference Optimization (RPO) は、同一のプロンプトと関連するプロンプトの両方から、より多く、あまり好まれない応答を識別するように設計されている。
RPOは、大きな言語モデルをユーザの好みに合わせて調整し、トレーニングプロセスにおける適応性を改善する優れた能力を示している。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:05:03 GMT)
RLAIF-V: Aligning MLLMs through Open-Source AI Feedback for Super GPT-4V Trustworthiness [94.0] 我々は,MLLMを超GPT-4V信頼性のための完全なオープンソースパラダイムに整合させるフレームワークであるRLAIF-Vを紹介する。
RLAIF-Vは、高品質なフィードバックデータとオンラインフィードバック学習アルゴリズムを含む、2つの観点から、オープンソースフィードバックを最大限活用する。
実験により、RLAIF-Vは、他のタスクのパフォーマンスを犠牲にすることなく、モデルの信頼性を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:37:01 GMT)
Temporal Spiking Neural Networks with Synaptic Delay for Graph Reasoning [91.3] スパイキングニューラルネットワーク(SNN)は、生物学的にインスパイアされたニューラルネットワークモデルとして研究されている。
本稿では,SNNがシナプス遅延と時間符号化とを併用すると,グラフ推論の実行(知識)に長けていることを明らかにする。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:53:30 GMT)
ChatIE: Zero-Shot Information Extraction via Chatting with ChatGPT [89.5] ゼロショット情報抽出(IE)は、注釈のないテキストからIEシステムを構築することを目的としている。
大規模言語モデル(LLMs、GPT-3、ChatGPT)に対する最近の取り組みは、ゼロショット設定での有望なパフォーマンスを示している。
ゼロショットIEタスクを2段階フレームワーク(ChatIE)でマルチターン質問応答問題に変換する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:08:31 GMT)
Segment Any 3D Gaussians [85.9] 本稿では, 3次元ガウススプレイティング(3D-GS)に基づく高効率3Dプロンプト可能なセグメンテーション法であるSAGAについて述べる。
入力として2D視覚的プロンプトが与えられたとき、SAGAは対応する3Dターゲットを4ミリ秒以内に3Dガウスで表現できる。
我々は,SAGAが最先端の手法に匹敵する品質で,リアルタイムな多粒度セグメンテーションを実現することを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:24:31 GMT)
PromptFix: You Prompt and We Fix the Photo [84.7] 言語モデルを備えた拡散モデルは、画像生成タスクにおいて優れた制御性を示す。
多様な命令追跡データの欠如は、ユーザカスタマイズ命令を効果的に認識し実行するモデルの開発を妨げている。
PromptFixは、拡散モデルが人間の指示に従って様々な画像処理タスクを実行できるフレームワークである。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:13:28 GMT)
Discrete Probabilistic Inference as Control in Multi-path Environments [84.7] 本稿では,離散分布と構造化分布からサンプリングする問題を逐次決定問題として考察する。
我々は,GFlowNetが,フローの保存を強制することによって,報酬に比例してオブジェクトをサンプリングするポリシーを学習していることを示す。
また、GFlowNetの文献で見られるフローマッチングの目的が、精度の高いMaxEnt RLアルゴリズムと等価であることも証明した。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:58:38 GMT)
Best Arm Identification for Stochastic Rising Bandits [84.6] SRB(Rising Bandits)は、選択される度に選択肢の期待される報酬が増加する、シーケンシャルな意思決定の問題をモデル化する。
本稿では,SRBの固定予算ベストアーム識別(BAI)問題に焦点をあてる。
R-UCBE と R-SR の2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:35:39 GMT)
Compressed-Language Models for Understanding Compressed File Formats: a JPEG Exploration [82.9] 我々は、圧縮における鍵概念の共通性と代表性を考慮して、JPEGフォーマットを代表的CFFとして重視する。
我々は、CLMがJPEGフォーマットを理解するかどうかを、固有のファイルプロパティの認識、異常のあるファイルの扱い、新しいファイルの生成という、3つの軸に沿って実行する能力を調べて検証する。
結果から,CFFが生成するファイルのバイトストリームを直接操作する場合,圧縮データのセマンティクスをCLMで理解できることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:09:23 GMT)
CausalCite: A Causal Formulation of Paper Citations [80.8] CausalCiteは紙の意義を測定するための新しい方法だ。
これは、従来のマッチングフレームワークを高次元のテキスト埋め込みに適応させる、新しい因果推論手法であるTextMatchに基づいている。
科学専門家が報告した紙衝撃と高い相関性など,各種基準におけるCausalCiteの有効性を実証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:31:14 GMT)
A Dynamical Model of Neural Scaling Laws [79.6] ネットワークトレーニングと一般化の解決可能なモデルとして,勾配降下で訓練されたランダムな特徴モデルを分析する。
我々の理論は、データの繰り返し再利用により、トレーニングとテスト損失のギャップが徐々に増大することを示している。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:21:13 GMT)
ClassDiffusion: More Aligned Personalization Tuning with Explicit Class Guidance [78.4] 新しい概念を学ぶ際に,意味的保存損失を利用して概念空間を明示的に制御する手法であるClassDiffusionを提案する。
その単純さにもかかわらず、これはターゲット概念を微調整する際のセマンティックドリフトを避けるのに役立つ。
CLIP-T測定値の非効率な評価に対して,BLIP2-T測定値を導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:50:10 GMT)
Hawk: Learning to Understand Open-World Video Anomalies [77.0] ビデオ異常検出(VAD)システムは、障害を自律的に監視し、識別し、手作業や関連するコストを削減できる。
我々は,インタラクティブな大規模ビジュアル言語モデル(VLM)を利用して,ビデオの異常を正確に解釈する新しいフレームワークであるHawkを紹介する。
言語記述による8000以上の異常ビデオを注釈付けし、さまざまなオープンワールドシナリオでの効果的なトレーニングを可能にしました。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:08:58 GMT)
HDR-GS: Efficient High Dynamic Range Novel View Synthesis at 1000x Speed via Gaussian Splatting [76.6] 既存のHDR NVS法は主にNeRFに基づいている。
既存のHDR NVS法は主にNeRFに基づいており、長いトレーニング時間と遅い推論速度に悩まされている。
我々は,新しいHDRビューを効率よくレンダリングできる新しいフレームワークであるHigh Dynamic Range Gaussian Splatting (-GS)を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:31:36 GMT)
Transformers Can Do Arithmetic with the Right Embeddings [75.7] 算術演算における変換器の性能向上について述べる。
たった20桁の数値で1日1GPUでトレーニングすれば、最先端のパフォーマンスに到達できます。
これらの数的増加は、ソートや乗算を含む他の多段階の推論タスクの改善を解放する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:49:18 GMT)
Selecting Large Language Model to Fine-tune via Rectified Scaling Law [74.8] 制約のあるリソースを前提に、すべてのモデルを微調整し、その後の選択は非現実的である。
微調整スケーリング曲線は、よく知られた「パワーフェーズ」だけでなく、これまで観測されていなかった「プリパワーフェーズ」も含む。
本法則を利用して,資源消費の数百倍少ない最適モデルを選択する新しいLCM選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:11:22 GMT)
ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models [74.6] 活性化スパーシリティ(Activation sparsity)とは、活性化出力の間に弱い分散要素が存在することを指す。
本稿では,PLMを高活性化空間にプッシュするために,"ProSparse" という,シンプルで効果的なスペース化手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:49:58 GMT)
MambaVC: Learned Visual Compression with Selective State Spaces [74.3] 本稿では,SSMに基づくシンプルで強力で効率的な圧縮ネットワークであるMambaVCを紹介する。
MambaVC は2次元選択的走査 (2DSS) モジュールを備えた視覚状態空間 (VSS) ブロックを各ダウンサンプリング後の非線形活性化関数として開発する。
圧縮ベンチマークデータセットでは、MambaVCはより低い計算とメモリオーバーヘッドでより優れたレート歪み性能を達成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:09:31 GMT)
Improving Machine Translation with Large Language Models: A Preliminary Study with Cooperative Decoding [73.3] 大きな言語モデル(LLM)は、優れた翻訳品質を達成する可能性を示す。
我々は,NMTシステムを事前翻訳モデルとして扱うCooperative Decoding(CoDec)と,MT指向LLMを補足解として提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:52:38 GMT)
DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows [72.4] 我々は、研究者が強力な大規模言語モデルを実装することができるオープンソースのPythonライブラリであるDataDreamerを紹介した。
DataDreamerはまた、オープンサイエンスを促進するために提案するベストプラクティスに研究者が従うのを助ける。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:54:44 GMT)
Reasons to Reject? Aligning Language Models with Judgments [72.4] 言語フィードバックを用いた大規模言語モデル(LLM)の整合性について検討する。
本稿では,不適切なコンテンツ検出と判断に基づく修正が可能なコントラスト型異種訓練(Contrastive Unlikelihood Training, CUT)を提案する。
この結果から、CUTは175BのDaVinci003を破り、AlpacaEvalの48.51ポイントを抜いた。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:22:14 GMT)
GaussianFormer: Scene as Gaussians for Vision-Based 3D Semantic Occupancy Prediction [70.7] 3Dのセマンティック占有予測は,周囲のシーンの3Dの微細な形状とセマンティックスを得ることを目的としている。
本稿では,3Dシーンを3Dセマンティック・ガウシアンで表現するオブジェクト中心表現を提案する。
GaussianFormerは17.8%から24.8%のメモリ消費しか持たない最先端のメソッドで同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:51 GMT)
Collaborative Video Diffusion: Consistent Multi-video Generation with Camera Control [70.2] コラボレーション型ビデオ拡散(CVD)は、ビデオ生成のための最先端のカメラ制御モジュール上で訓練される。
CVDは、異なるカメラ軌跡からレンダリングされた複数のビデオを、ベースラインよりもはるかに優れた一貫性で生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:58:01 GMT)
Q-value Regularized Transformer for Offline Reinforcement Learning [70.1] オフライン強化学習(RL)における最先端化のためのQ値正規化変換器(QT)を提案する。
QTはアクション値関数を学習し、条件付きシーケンスモデリング(CSM)のトレーニング損失にアクション値を最大化する用語を統合する
D4RLベンチマークデータセットの実証評価は、従来のDP法やCSM法よりもQTの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:12:39 GMT)
Prompt Optimization with Human Feedback [70.0] 人間のフィードバックによる迅速な最適化問題(POHF)について検討する。
我々は自動POHF(Automatic POHF)というアルゴリズムを導入する。
その結果、APOHFは、少数の好みフィードバックインスタンスを用いて、効率的に適切なプロンプトを見つけることができることがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:49:29 GMT)
MotionLLM: Multimodal Motion-Language Learning with Large Language Models [69.6] 我々は,シングルヒューマン,マルチヒューマンモーション生成およびモーションキャプションを実現するために,MotionLLMを提案する。
具体的には、動作を離散LLM理解可能なトークンにエンコードし、量子化し、その結果、動作トークンとテキストトークンの両方からなる統一語彙が生成される。
我々のアプローチはスケーラブルで柔軟性があり、シングルヒューマンモーションの自動回帰生成によるマルチヒューマンモーション生成を容易に拡張できる。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:57:51 GMT)
TrojFM: Resource-efficient Backdoor Attacks against Very Large Foundation Models [69.4] TrojFMは、非常に大きな基礎モデルに適した、新しいバックドア攻撃である。
提案手法では,モデルパラメータのごく一部のみを微調整することでバックドアを注入する。
広範に使われている大規模GPTモデルに対して,TrojFMが効果的なバックドアアタックを起動できることを実証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:10:57 GMT)
LARM: Large Auto-Regressive Model for Long-Horizon Embodied Intelligence [68.3] エンボディエージェントのための大規模自己回帰モデル(LARM)を導入する。
LARMはテキストとマルチビューの両方を入力として使用し、後続のアクションを自動回帰的に予測する。
LARMは2段階の訓練体制を採用し、Minecraftで魔法の装置の収穫に成功した。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:32 GMT)
Provably Efficient Reinforcement Learning with Multinomial Logit Function Approximation [67.8] 本稿では,MNL関数近似を用いたMDPの新しいクラスについて検討し,状態空間上の確率分布の正当性を保証する。
その利点にもかかわらず、非線形関数近似を導入することは、計算効率と統計効率の両方において大きな課題を提起する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:31:54 GMT)
MixBCT: Towards Self-Adapting Backward-Compatible Training [66.5] そこで本研究では,単純かつ高効率な後方互換性学習法であるMixBCTを提案する。
大規模顔認識データセットMS1Mv3とIJB-Cについて実験を行った。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:17:51 GMT)
PivotMesh: Generic 3D Mesh Generation via Pivot Vertices Guidance [66.4] 汎用的でスケーラブルなメッシュ生成フレームワークであるPivotMeshを紹介します。
PivotMeshは、ネイティブメッシュ生成を大規模データセットに拡張する最初の試みである。
PivotMeshは,様々なカテゴリにまたがって,コンパクトでシャープな3Dメッシュを生成することができることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:13:13 GMT)
EM Distillation for One-step Diffusion Models [65.6] 最小品質の損失を最小限に抑えた1ステップ生成モデルに拡散モデルを蒸留する最大可能性に基づく手法を提案する。
本研究では, 蒸留プロセスの安定化を図るため, 再パラメータ化サンプリング手法とノイズキャンセリング手法を開発した。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:55:22 GMT)
Adapting LLaMA Decoder to Vision Transformer [65.5] 本研究は,LLaMAなどのデコーダのみのトランスフォーマーをコンピュータビジョン分野に適用できるかどうかを検討する。
まず、LLaMAのアーキテクチャと整合する標準的なViTを「LLaMAfy」と呼び、自己注意に因果マスクを直接適用することで、注意崩壊の問題が生じる。
我々は,訓練開始時の自己注意に因果マスクを徐々に導入し,最適化行動を容易にするソフトマスク戦略を開発する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:13:26 GMT)
Latent Energy-Based Odyssey: Black-Box Optimization via Expanded Exploration in the Energy-Based Latent Space [65.4] ブラックボックス関数の高次元かつ高マルチモーダルな入力設計空間は、既存の手法に固有の課題をもたらす。
設計値の結合空間の圧縮的かつ正確な表現として機能する潜在空間の発見を検討する。
本稿では, 高精度潜時空間モデルの変分学習のための雑音強調型テレスコープ密度比推定法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:11:53 GMT)
Navigating the Safety Landscape: Measuring Risks in Finetuning Large Language Models [65.1] 我々は,安全景観をナビゲートすることで,大規模言語モデル(LLM)の微調整のリスクを測定することを目的としている。
我々は、人気のあるオープンソースLLMのモデルパラメータ空間において、普遍的に観察される新しい現象を発見した。
整列モデルの安全性の景観を可視化することで,モデルからモデルを引き離すことによって,微調整がいかに安全性を損なうかを理解することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:31:56 GMT)
Adapting to Continuous Covariate Shift via Online Density Ratio Estimation [64.8] 分散シフトへの対処は、現代の機械学習における中心的な課題の1つだ。
歴史的情報を適切に再利用するオンライン手法を提案する。
我々の密度比推定法は, ダイナミックなリセットバウンドを楽しむことにより, 良好に動作できることが証明された。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:18:12 GMT)
Balancing User Preferences by Social Networks: A Condition-Guided Social Recommendation Model for Mitigating Popularity Bias [64.7] ソーシャルレコメンデーションモデルは、ユーザに対してユニークなパーソナライズされたレコメンデーション結果を提供するために、ソーシャルインタラクションをデザインに織り込む。
既存のソーシャルレコメンデーションモデルは、人気バイアスや社会的情報の冗長性の問題に対処できない。
本稿では,モデルの人気バイアスを軽減するための条件付きソーシャルレコメンデーションモデル(CGSoRec)を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:45:01 GMT)
Cutting through buggy adversarial example defenses: fixing 1 line of code breaks Sabre [64.6] SabreはIEEE S&P 2024で受け入れられた敵の例に対する防御である。
まず,勾配マスキングの明確な兆候を示す評価の重大な欠陥を明らかにする。
次に、このマスキング勾配の原因を示す:元の評価コードにバグがある。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:41:06 GMT)
Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery [62.4] 複雑な重み付き再帰的アーキテクチャの計算上の優位性について論じる。
本稿では,反復的制約満足度を実現する完全畳み込みオートエンコーダSynCxを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:47:03 GMT)
ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.2] ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:42:33 GMT)
G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering [61.9] 現実のテキストグラフを対象とするフレキシブルな問合せフレームワークを開発した。
一般のテキストグラフに対する最初の検索拡張生成(RAG)手法を提案する。
G-Retrieverは、このタスクをSteiner Tree最適化問題として定式化し、グラフ上でRAGを実行する。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:04:40 GMT)
TokenUnify: Scalable Autoregressive Visual Pre-training with Mixture Token Prediction [61.3] TokenUnifyは、ランダムトークン予測、次のトークン予測、次のトークン予測を統合する新しい事前学習手法である。
TokenUnifyと共同で,超高解像度の大規模電子顕微鏡画像データセットを構築した。
このデータセットには1億2000万以上の注釈付きボクセルが含まれており、これまでで最大のニューロンセグメンテーションデータセットとなっている。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:45:51 GMT)
Spectral Greedy Coresets for Graph Neural Networks [61.2] ノード分類タスクにおける大規模グラフの利用は、グラフニューラルネットワーク(GNN)の現実的な応用を妨げる
本稿では,GNNのグラフコアセットについて検討し,スペクトル埋め込みに基づくエゴグラフの選択により相互依存の問題を回避する。
我々のスペクトルグレディグラフコアセット(SGGC)は、数百万のノードを持つグラフにスケールし、モデル事前学習の必要性を排除し、低ホモフィリーグラフに適用する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:52:12 GMT)
Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View [60.8] 本稿では,理論的洞察を用いた実用実験により,現代NLPシステム間の協調機構を解明する。
我々は, LLMエージェントからなる4つの独特な社会をつくり, それぞれのエージェントは, 特定の特性(容易性, 過信性)によって特徴づけられ, 異なる思考パターン(議論, ふりかえり)と協調する。
以上の結果から, LLMエージェントは, 社会心理学理論を反映した, 適合性やコンセンサスリーディングといった人間的な社会的行動を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:12:45 GMT)
Unified Editing of Panorama, 3D Scenes, and Videos Through Disentangled Self-Attention Injection [60.5] 本稿では,基本的な2次元画像テキスト・ツー・イメージ(T2I)拡散モデルのみを利用して,両手法の長所を結合した新しい統合編集フレームワークを提案する。
実験結果から,3次元シーン,ビデオ,パノラマ画像など,様々なモダリティの編集が可能であることが確認された。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:44:36 GMT)
NoteLLM-2: Multimodal Large Representation Models for Recommendation [60.2] マルチモーダルなアイテム・ツー・イテムレコメンデーションにおけるマルチモーダル表現を強化するための大規模言語モデルの可能性について検討する。
1つの実現可能な方法は、表現タスクのためにMLLM(Multimodal Large Language Models)を転送することである。
マルチモーダル表現に特化して設計された新しいトレーニングフレームワークNoteLLM-2を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:24:01 GMT)
Smoke and Mirrors in Causal Downstream Tasks [59.9] 本稿では,治療効果推定の因果推論課題について考察する。
ランダム化比較試験において,高次元画像として記録される2値効果を仮定する。
最先端のビジュアルバックボーンから微調整された6つの480モデルを比較した。
その結果,サンプリングとモデリングの選択が因果推定の精度に大きく影響していることが判明した。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:26:34 GMT)
UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.4] Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:52:13 GMT)
Hardness-Aware Scene Synthesis for Semi-Supervised 3D Object Detection [59.3] 3次元物体検出は、自律運転知覚の基本的なタスクとして機能する。
ポイントクラウドデータのための高品質なアノテーションを得るためには、コストがかかる。
本稿では,適応型合成シーンを生成するために,ハードネス対応シーン合成(HASS)手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:23 GMT)
Synergy and Diversity in CLIP: Enhancing Performance Through Adaptive Backbone Ensembling [58.5] コントラスト言語-画像事前学習(CLIP)は画像表現学習において顕著な手法である。
本稿では,CLIPを訓練した視覚バックボーンの違いについて検討する。
方法によって、最高の単一のバックボーンよりも39.1%の精度が著しく向上する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:59:35 GMT)
Hamiltonian Mechanics of Feature Learning: Bottleneck Structure in Leaky ResNets [58.5] 我々は、ResNets(tildeLtoinfty$)とFully-Connected nets(tildeLtoinfty$)の間を補間するLeaky ResNetsを研究する。
無限深度極限において、'representation geodesics'の$A_p$:continuous paths in representation space(NeuralODEsに類似)を研究する。
この直感を利用して、以前の研究で見られるように、ボトルネック構造の出現を説明する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:15:05 GMT)
A Method for Auto-Differentiation of the Voronoi Tessellation [57.6] ボロノイテッセルレーション(英: Voronoi tessellation)またはボロノイ図(英: Voronoi diagram)は、重要な計算幾何学手法である。
本稿では,2次元ヴォロノイテッセルレーションの自動微分法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:49:08 GMT)
Learning Personalized Decision Support Policies [56.9] $texttModiste$は、パーソナライズされた意思決定支援ポリシーを学ぶためのインタラクティブツールである。
パーソナライズされたポリシは、オフラインポリシよりも優れており、コストを意識した環境では、パフォーマンスの低下を最小限に抑えて、発生したコストを削減することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:10:24 GMT)
Anonymization Prompt Learning for Facial Privacy-Preserving Text-to-Image Generation [56.5] 我々は、テキストから画像への拡散モデルのための学習可能なプロンプトプレフィックスをトレーニングし、匿名化された顔のアイデンティティを生成するよう強制する。
実験では,非同一性固有の画像生成の品質を損なうことなく,特定の個人を匿名化するAPLの匿名化性能を実証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:38:26 GMT)
Benchmarking and Improving Bird's Eye View Perception Robustness in Autonomous Driving [55.9] 本稿では,BEVアルゴリズムのレジリエンスを評価するためのベンチマークスイートであるRoboBEVを紹介する。
検出,マップセグメンテーション,深さ推定,占有予測といったタスクにまたがる33の最先端のBEVベースの知覚モデルを評価する。
また, 事前学習や深度自由なBEVトランスフォーメーションなどの戦略が, アウト・オブ・ディストリビューションデータに対するロバスト性を高める上で有効であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:39 GMT)
SmartBook: AI-Assisted Situation Report Generation for Intelligence Analysts [55.7] この研究は、状況報告生成におけるAI支援のためのインテリジェンスアナリストの実践と嗜好を特定する。
本稿では,大量のニュースデータから状況報告を自動生成するフレームワークSmartBookを紹介する。
我々は,SmartBookの総合的な評価を行い,ユーザによるコンテントレビューと編集調査を併用し,正確な状況報告を生成する上でのSmartBookの有効性を明らかにした。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:40:26 GMT)
Improving Token-Based World Models with Parallel Observation Prediction [55.4] トークンベースの世界モデル(TBWM)は、最近サンプル効率のよい方法として提案されている。
想像の中で、次の観測のシーケンシャルなトークン・バイ・トークンの生成は深刻なボトルネックをもたらす。
我々は、このボトルネックを解決するために、新しい並列観測予測(POP)機構を考案した。
POPは、我々の強化学習環境に合わせて、新しいフォワードモードでRetentive Network(RetNet)を拡張します。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:18:18 GMT)
HeNCler: Node Clustering in Heterophilous Graphs through Learned Asymmetric Similarity [55.3] HeNClerは、Heterophilous Node Clusteringの新しいアプローチである。
HeNClerは異種グラフコンテキストにおけるノードクラスタリングタスクの性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:04:05 GMT)
On the Role of Information Structure in Reinforcement Learning for Partially-Observable Sequential Teams and Games [55.2] 逐次的意思決定問題において、情報構造とは、異なる時点に発生するシステム内の事象が相互にどのように影響するかを記述するものである。
対照的に、現実のシーケンシャルな意思決定問題は通常、システム変数の複雑で時間的な相互依存を伴う。
情報構造を明示する新しい強化学習モデルを定式化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:19:40 GMT)
Exploring and steering the moral compass of Large Language Models [55.2] 大規模言語モデル(LLM)は、様々な分野における自動化と意思決定の推進の中心となっている。
本研究は,その道徳的特徴を評価するために,最も先進的なLCMの総合的比較分析を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:49:22 GMT)
EM-GANSim: Real-time and Accurate EM Simulation Using Conditional GANs for 3D Indoor Scenes [55.2] 実時間電磁伝搬のための新しい機械学習手法(EM-GANSim)を提案する。
実際には、3D屋内環境のあらゆる場所で数ミリ秒で信号強度を計算することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:19:02 GMT)
A Closer Look at Time Steps is Worthy of Triple Speed-Up for Diffusion Model Training [55.2] そこで本研究では,時間ステップの近さをベースとして,拡散モデル学習のための新しい高速化手法を提案する。
プラグアンドプレイでアーキテクチャに依存しないアプローチとして、SpeeDは、さまざまな拡散アーキテクチャ、データセット、タスクにわたる3回のアクセラレーションを一貫して達成している。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:51:36 GMT)
Injecting Hamiltonian Architectural Bias into Deep Graph Networks for Long-Range Propagation [55.2] グラフ内の情報拡散のダイナミクスは、グラフ表現学習に大きな影響を及ぼす重要なオープン問題である。
そこで我々は(ポート-)Hamiltonian Deep Graph Networksを紹介した。
我々は,非散逸的長距離伝播と非保守的行動の両方を,単一の理論的・実践的な枠組みで調整する。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:36:50 GMT)
BDC-Occ: Binarized Deep Convolution Unit For Binarized Occupancy Network [55.2] 既存の3D占有ネットワークは重要なハードウェアリソースを必要としており、エッジデバイスの配備を妨げている。
本稿では,バイナライズド・ディープ・コンボリューション(BDC)ユニットを提案し,バイナライズド・ディープ・コンボリューション・レイヤの数を増やしつつ性能を効果的に向上させる。
我々のBDC-Occモデルは既存の3D占有ネットワークをバイナライズするために提案したBDCユニットを適用して作成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:44:05 GMT)
DINO-SD: Champion Solution for ICRA 2024 RoboDepth Challenge [54.7] 本稿では,新しいサラウンドビュー深度推定モデルであるDINO-SDを紹介する。
我々のDINO-SDは追加のデータを必要とせず、強い堅牢性を持っている。
DINO-SDは、ICRA 2024 RoboDepth Challengeのトラック4で最高のパフォーマンスを得られる。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:21:31 GMT)
Part123: Part-aware 3D Reconstruction from a Single-view Image [54.6] Part123は、一視点画像から部分認識された3D再構成のための新しいフレームワークである。
ニューラルレンダリングフレームワークにコントラスト学習を導入し、部分認識機能空間を学習する。
クラスタリングに基づくアルゴリズムも開発され、再構成されたモデルから3次元部分分割結果を自動的に導出する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:10:21 GMT)
Memorize What Matters: Emergent Scene Decomposition from Multitraverse [54.5] 3次元ガウス写像は3次元ガウス写像をベースとしたカメラのみのオフラインマッピングフレームワークである。
3DGMは、同じ領域から複数のRGBビデオをガウスベースの環境マップに変換し、同時に2D短命なオブジェクトセグメンテーションを実行する。
We build the Mapverse benchmark, sourced from the Ithaca365 and nuPlan datasets, to evaluate our method in unsupervised 2D segmentation, 3D reconstruction, and Neural rendering。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:11:17 GMT)
GlORIE-SLAM: Globally Optimized RGB-only Implicit Encoding Point Cloud SLAM [53.6] フレキシブルなニューラルポイントクラウド表現シーンを用いたRGBのみの高密度SLAMシステムを提案する。
また,単分子深度とともに暗黙のポーズと深さを最適化する新しいDSPO層を導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:55:00 GMT)
Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent [53.6] 任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。
バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:15:23 GMT)
Federated Full-Parameter Tuning of Billion-Sized Language Models with Communication Cost under 18 Kilobytes [53.5] 事前訓練された大規模言語モデル(LLM)は、自然言語命令に対する応答性を改善するために微調整が必要である。
FedKSeedは、ランダムシードの有限セットによるゼロ階最適化を採用している。
サーバとクライアント間の通信要求を大幅に減らし、ランダムなシードをわずかに減らします。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:31:47 GMT)
GOI: Find 3D Gaussians of Interest with an Optimizable Open-vocabulary Semantic-space Hyperplane [53.4] 3Dオープンボキャブラリのシーン理解は、拡張現実とロボット応用の推進に不可欠である。
GOIは2次元視覚言語基礎モデルから3次元ガウススプラッティング(3DGS)に意味的特徴を統合するフレームワークである。
提案手法では,特徴空間内の超平面分割として特徴選択処理を扱い,クエリに関連性の高い特徴のみを保持する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:57:18 GMT)
NeurTV: Total Variation on the Neural Domain [51.8] ニューラルドメイン上に定義された新しいテレビレギュラー化を提案する。
ニューラルドメイン(NeurTVと呼ばれる)上の提案されたテレビには2つの利点がある。
NeurTVはメッシュグリッドに限らず、メッシュグリッドと非メシュグリッドの両方のデータに適している。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:57:58 GMT)
Mixture of Modality Knowledge Experts for Robust Multi-modal Knowledge Graph Completion [51.8] マルチモーダル知識グラフ補完(MMKGC)は、与えられたマルチモーダル知識グラフ(MMKG)において、新しい知識トリプルを自動的に発見することを目的としている。
既存の手法は、エレガントなエンティティワイドなマルチモーダル融合戦略の構築に重点を置いている傾向にあるが、様々な関係文脈下でモダリティ内に隠されたマルチパースペクティブな特徴の利用を見落としている。
本稿では,Mixture of Modality Knowledge Expert (MoMoK) を用いたMMKGCフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:36:17 GMT)
Do Vision-Language Transformers Exhibit Visual Commonsense? An Empirical Study of VCR [51.7] Visual Commonsense Reasoning (VCR)は、視覚的なシーンに対する質問応答の背後にある説明的推論を要求する。
ベンチマークデータセットの進歩は、Vision-Language Transformers(VL Transformers)の最近の進歩に大きく起因している。
本稿では、VLトランスフォーマーは、VCRの鍵となる視覚的コモンセンスを示さないことを仮定する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:26:58 GMT)
Transformer In-Context Learning for Categorical Data [51.2] 我々は、分類結果、非線形基礎モデル、非線形注意を考慮し、文脈内学習のレンズを通してトランスフォーマーを理解する研究を機能データで拡張する。
我々は、ImageNetデータセットを用いて、この数発の学習方法論の最初の実世界の実演であると考えられるものを提示する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:03:21 GMT)
Safe LoRA: the Silver Lining of Reducing Safety Risks when Fine-tuning Large Language Models [51.2] カスタマイズされたデータセット、ドメイン固有のタスク、その他のプライベートニーズに対するパフォーマンスを高めるためには、微調整された大きな言語モデル(LLM)が必要である。
Safe LoRAは、選択したレイヤからのLoRA重みのプロジェクションを安全に整合したサブスペースに導入することで、オリジナルのLoRA実装のワンラインパッチである。
我々の実験は、純粋に悪意のあるデータに対して微調整を行う場合、Safe LoRAは元のアライメントモデルと同様の安全性を保っていることを示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:04:05 GMT)
FuseChat: Knowledge Fusion of Chat Models [51.0] FuseChatは、チャット言語モデルのための知識融合フレームワークである。
微調整前後のパラメータ行列の変動率に基づいて, マージ重量を決定する新しい手法を提案する。
様々なチャット領域にまたがる実験結果から、7Bおよび34BスケールのチャットLLMにおけるFuseChat-7Bの優位性が示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:16:51 GMT)
Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [51.0] 本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:42:54 GMT)
GPT-HateCheck: Can LLMs Write Better Functional Tests for Hate Speech Detection? [50.5] HateCheckは、合成データに対してきめ細かいモデル機能をテストするスイートである。
GPT-HateCheckは,スクラッチからより多彩で現実的な機能テストを生成するフレームワークである。
クラウドソースのアノテーションは、生成されたテストケースが高品質であることを示しています。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:14:12 GMT)
Revisiting the Power of Prompt for Visual Tuning [50.1] 本研究では,プロンプトとパッチトークンの相互関係について検討した。
プロンプトトークンはパッチトークンと高い相互情報を共有する傾向にあるという観測から着想を得て,下流トークンのプロトタイプを用いた初期化プロンプトを提案する。
本手法は, 自己指導型プレトレーニングの適応性を著しく向上させ, 少なくとも10%から30%のタスク性能向上を実現した。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:51:07 GMT)
Unveiling Linguistic Regions in Large Language Models [49.3] 大規模言語モデル (LLM) は言語間アライメントと一般化能力を示す。
本稿では,LLMの言語能力に関するいくつかの調査を行う。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:35:25 GMT)
Exact dynamics of quantum dissipative $XX$ models: Wannier-Stark localization in the fragmented operator space [49.2] 振動と非振動崩壊を分離する臨界散逸強度において例外的な点が見つかる。
また、演算子部分空間全体の単一減衰モードにつながる異なるタイプの散逸についても記述する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:11:39 GMT)
Enhancing Fast Feed Forward Networks with Load Balancing and a Master Leaf Node [49.1] 高速フィードフォワードネットワーク(FFF)は、入力空間の異なる領域が広いネットワークのニューロンの異なるサブセットを活性化する観察を利用する。
本稿では,FFFアーキテクチャにロードバランシングとマスタリーフ技術を導入し,性能向上とトレーニングプロセスの簡素化を図る。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:06:24 GMT)
Gradient Compressed Sensing: A Query-Efficient Gradient Estimator for High-Dimensional Zeroth-Order Optimization [48.8] 我々は,1ステップあたり$Obig(slogfrac dsbig)$クエリのみを使用する勾配のクエリ効率と精度の高い推定器を提案する。
Indyk-Price-Woodruff (IPW) アルゴリズムを線形測定から非線形関数への圧縮センシングにおいて一般化した。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:52:53 GMT)
ALPINE: Unveiling the Planning Capability of Autoregressive Learning in Language Models [48.6] 自動回帰学習機構を用いてトランスフォーマーに基づく言語モデルにおける計画機能の開発について検討する。
我々の研究は、自己回帰学習の内部メカニズムがネットワークにおける計画をどのように実現しているかについて、新たな光を当てた。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:25:05 GMT)
Graph Condensation for Open-World Graph Learning [48.4] グラフ凝縮(GC)は、グラフニューラルネットワーク(GNN)を効率的に訓練するための有望な加速ソリューションとして登場した。
既存のGCメソッドは、単に観測された静的グラフ分布と凝縮グラフの整合性に制限される。
しかし、現実のシナリオでは、グラフは動的で常に進化しており、新しいノードとエッジが継続的に統合されている。
グラフパターンの進化をシミュレートするために構造対応分散シフトを統合する,堅牢なGCフレームワークであるOpenGCを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:47:09 GMT)
LCM: Locally Constrained Compact Point Cloud Model for Masked Point Modeling [47.9] 本研究では,局所的制約付きコンパクトエンコーダと局所的制約付きマンバ型デコーダからなる局所的制約付きコンパクトポイントクラウドモデル(LCM)を提案する。
以上の結果から,我々のコンパクトモデルは既存のTransformerモデルよりも性能と効率の両面で大幅に上回っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:19:23 GMT)
Adversarial Attacks on Both Face Recognition and Face Anti-spoofing Models [47.7] 顔認識(FR)システムに対するアドリアック攻撃は、純粋なFRモデルの妥協に非常に効果的であることが証明されている。
本稿では, FR モデルと Face Anti-Spoofing (FAS) モデルの両方を同時に攻撃する新しい設定を提案する。
我々は、FRモデルとFASモデルの両方に対するブラックボックス攻撃のキャパシティを改善するために、スタイル整列分散バイアス(SDB)と呼ばれる新しいアタック手法を導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:30:29 GMT)
S-Eval: Automatic and Adaptive Test Generation for Benchmarking Safety Evaluation of Large Language Models [47.7] 大規模な言語モデルは、その革命的な能力にかなりの注目を集めている。
安全性に関する懸念も高まっている。
S-Evalは,多次元かつオープンな安全評価ベンチマークである。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:27:29 GMT)
Non-stochastic Bandits With Evolving Observations [47.6] 既存のモデルを統一し一般化する新しいオンライン学習フレームワークを導入する。
我々は,全情報設定と帯域幅設定の両方に対して,後悔の最小化アルゴリズムを提案する。
我々のアルゴリズムは、多くの特別なケースにまたがる既知の後悔境界と一致し、以前にも知られていない境界も導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:32:46 GMT)
GenWarp: Single Image to Novel Views with Semantic-Preserving Generative Warping [47.4] 一つの画像から新しいビューを生成するための意味保存型生成ワープフレームワークを提案する。
提案手法は,ソースビューイメージに生成モデルを条件付けすることで,既存の手法の限界に対処する。
我々のモデルは、ドメイン内シナリオとドメイン外シナリオの両方において、既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:07:04 GMT)
Training-free Editioning of Text-to-Image Models [47.3] テキスト・ツー・イメージ・モデルのための新しいタスク、すなわち、トレーニング不要のエディションを提案する。
我々は,リトレーニングを伴わずに,ベースとなるテキスト・ツー・イメージモデルのバリエーションを作成することを目的としている。
提案したエディションのパラダイムにより、サービスプロバイダはベースモデルを"cat edition"にカスタマイズすることができます。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:40:50 GMT)
Sync4D: Video Guided Controllable Dynamics for Physics-Based 4D Generation [47.2] そこで我々は, カジュアルにキャプチャした参照ビデオを用いて, 3次元ガウシアンにおける制御可能なダイナミックスを作成する新しい手法を提案する。
提案手法は,参照ビデオから様々なカテゴリで生成された様々な3Dガウスにオブジェクトの動きを転送する。
本手法は, 形状整合性と時間的整合性の両方を維持しながら, 特異かつ高品質な運動伝達を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:49:12 GMT)
Rethinking Transformers in Solving POMDPs [47.1] 本稿では、部分的に観測可能なマルコフ決定プロセス(POMDP)における一般的なアーキテクチャ、すなわちトランスフォーマーの有効性を精査する。
Transformersがモデル化に苦労する正規言語は、POMDPに再現可能である。
このことはトランスフォーマーがPOMDP固有の帰納バイアスを学習する上で大きな課題となる。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:02:35 GMT)
Towards Weakly-Supervised Hate Speech Classification Across Datasets [47.1] そこで本研究では,テキスト分類モデルの有効性について検討した。
また,HS分類モデルの一般化性の低さの原因について,詳細な定量的,定性的な分析を行った。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:23:27 GMT)
Match, Compare, or Select? An Investigation of Large Language Models for Entity Matching [47.0] 複数戦略と大規模言語モデル(LLM)の合成を利用するコンポジションエンティティマッチング(ComEM)フレームワークを提案する。
ComEMは様々なデータセットで大幅なパフォーマンス向上を実現しているが、現実のアプリケーションではLCMベースのエンティティマッチングのコストも低減している。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:05:27 GMT)
Ancilla quantum measurements on interacting chains: Sensitivity of entanglement dynamics to the type and concentration of detectors [46.8] 我々は、自由度(検出器')に結合した量子多体格子系を考える。
鎖内の密度と絡み合いエントロピーのダイナミクスを、$rho_a$と$M$の様々な値で探求する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:39:13 GMT)
Fair Recommendations with Limited Sensitive Attributes: A Distributionally Robust Optimization Approach [46.6] 本稿では,推薦システムにおける公平性を確保するために,分散ロバスト公正最適化(DRFO)を提案する。
DRFOは、欠落した機密属性の潜在的な確率分布に対する最悪の不公平性を最小化する。
我々は,提案手法が推薦システムの公平性を効果的に確保できることを示す理論的,実証的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:33:45 GMT)
LoRA Training in the NTK Regime has No Spurious Local Minima [46.5] 低ランク適応(LoRA)は,大規模言語モデルのパラメータ効率向上のための標準手法となっている。
理論的には、ニューラルネットワークカーネルシステムにおけるLoRA微調整を$N$のデータポイントで解析する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:35:26 GMT)
Unisolver: PDE-Conditional Transformers Are Universal PDE Solvers [46.2] 広範にPDEを解くことができるUniversal PDEソルバ(Unisolver)を提案する。
私たちの重要な発見は、PDEソリューションが基本的に一連のPDEコンポーネントの制御下にあることです。
Unisolverは3つの挑戦的な大規模ベンチマークにおいて、一貫した最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:34:35 GMT)
Reinforcement Learning from Bagged Reward [46.2] 強化学習(RL)では、エージェントが取るアクション毎に即時報奨信号が生成されることが一般的である。
多くの実世界のシナリオでは、即時報酬信号は得られず、代わりにエージェントは部分的なシーケンスや完全な軌道に付随する単一の報酬を受け取る。
本稿では,文脈ニュアンスを解釈するための双方向アテンション機構を用いたトランスフォーマーベースの報酬モデルReward Bag Transformerを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:23:31 GMT)
Double Correction Framework for Denoising Recommendation [46.0] 暗黙のフィードバックでは、ノイズの多いサンプルが正確なユーザの好みの学習に影響を与える可能性がある。
一般的なソリューションは、モデルトレーニングフェーズでノイズの多いサンプルをドロップすることに基づいている。
提案手法では,勧告を記述するための二重補正フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:29:40 GMT)
Decoupled Sequence and Structure Generation for Realistic Antibody Design [45.7] 本稿では, 配列生成と構造予測を分離した抗体配列構造デカップリング(ASSD)フレームワークを提案する。
また、広く使われている非自己回帰生成器は、過度に繰り返されるトークンを含むシーケンスを促進する。
以上の結果から,ASSDは既存の抗体設計モデルより一貫して優れていることが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:24:55 GMT)
An Investigation of Conformal Isometry Hypothesis for Grid Cells [45.7] 本稿では、格子細胞の応答マップにおける六角形周期パターンの出現の潜在的説明として、共形アイソメトリ仮説を考察する。
我々は,この仮説が格子細胞の六角形周期パターンの下にあることを示す数値実験を行った。
さらに、格子セルの繰り返しニューラルネットワークが共形等尺性仮説を自動で満たすように、エージェントの入力速度の共形変調を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:31:39 GMT)
PRoLoRA: Partial Rotation Empowers More Parameter-Efficient LoRA [45.4] 部分回転型低ランク適応(PRoLoRA)は層内共有機構である。
PRoLoRAはその利点を保ち、ピアパラメータ共有手法の欠点を効果的に回避する。
実験によりPRoLoRAのパラメータ効率が著しく向上した。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:24:25 GMT)
Interaction-Force Transport Gradient Flows [45.1] 本稿では,非負および確率測度上の新しい勾配流の原理的構成による動機付けについて述べる。
本稿では、ワッサーシュタインおよび球面MDD計量テンソルの非有限畳み込みによる相互作用力輸送勾配流とその球面変種を提案する。
球面IFT勾配流は、MDDとKLエネルギーの両方に対して、大域的な指数収束保証を提供することで、両方の世界のベストを享受できることを証明した。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:46:14 GMT)
CoCoGesture: Toward Coherent Co-speech 3D Gesture Generation in the Wild [44.4] CoCoGestureは、目に見えない人間の音声プロンプトから鮮明で多様なジェスチャー合成を可能にする新しいフレームワークである。
私たちの重要な洞察は、カスタム設計のトレーニングパラダイムに基づいています。
提案するCoCoGesture は,ゼロショット音声・ジェスチャー生成における最先端手法よりも優れる。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:47:14 GMT)
Unified Hallucination Detection for Multimodal Large Language Models [44.3] マルチモーダル大言語モデル(MLLM)は幻覚の重要な問題に悩まされている。
本稿では,幻覚検出手法の進歩を評価するために,メタ評価ベンチマークであるMHaluBenchを提案する。
我々は,幻覚の発生を確実に検証するために,一連の補助ツールを活用する,新しい統合型マルチモーダル幻覚検出フレームワークUNIHDを公表した。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:52:56 GMT)
Think Before You Act: Decision Transformers with Working Memory [44.2] 決定変換器に基づく意思決定エージェントは、複数のタスクにまたがる一般化能力を示している。
この非効率性は、モデルがトレーニングを通してパラメータの振る舞いを記憶する忘れ現象に起因していると我々は主張する。
ダウンストリームタスクの情報を格納、ブレンド、検索するためのワーキングメモリモジュールを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:00:31 GMT)
PoCo: Policy Composition from and for Heterogeneous Robot Learning [44.1] 現在のメソッドは通常、1つのポリシーをトレーニングするために、1つのドメインからすべてのデータを収集し、プールします。
多様なモダリティやドメインにまたがる情報を組み合わせるための,ポリシ・コンポジションと呼ばれる柔軟なアプローチを提案する。
提案手法はタスクレベルの構成をマルチタスク操作に使用することができ,分析コスト関数を用いて推論時のポリシー動作を適応させることができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:29:57 GMT)
CLAQ: Pushing the Limits of Low-Bit Post-Training Quantization for LLMs [44.0] 大規模言語モデル(LLM)の量子化は近年,メモリコストの削減と計算効率の向上に注目が集まっている。
既存のメソッドは、低ビット(例えば2ビットから3ビット)のシナリオではパフォーマンスが悪い。
カラムレベル適応重み量子化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:49:39 GMT)
SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams [44.0] スパイクカメラは、動きの特徴を捉え、この不適切な問題を解くのに有効であることが証明されている。
既存の手法は教師付き学習パラダイムに陥り、現実のシナリオに適用した場合、顕著なパフォーマンス劣化に悩まされる。
本研究では,スパイク誘導動作の劣化に対する最初の自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:05:07 GMT)
RB-Modulation: Training-Free Personalization of Diffusion Models using Stochastic Optimal Control [44.0] 拡散モデルの学習自由なパーソナライズのための新しいプラグアンドプレイソリューションを提案する。
RB-Modulationは、スタイル記述子が所望の属性をエンコードする新しい最適コントローラ上に構築されている。
クロスアテンションに基づく特徴集約方式により、RB変調は参照画像から内容とスタイルを分離することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:51:08 GMT)
Neighboring Perturbations of Knowledge Editing on Large Language Models [43.9] 本稿では,大規模言語モデル (LLM) に対する新たな知識の更新が,その内部にカプセル化された近隣の知識を乱すかどうかを考察する。
適応知識の摂動評価(PEAK)と呼ばれるベンチマークは、新しい知識を追加する際に隣り合う知識に摂動の程度を評価するために構築される。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:52:43 GMT)
DreamMat: High-quality PBR Material Generation with Geometry- and Light-aware Diffusion Models [43.9] テキスト記述から高品質なPBR材料を生成する革新的な手法であるDreamMatを紹介する。
まず、所定の照明環境における新しい光認識2次元拡散モデルを作成し、この特定の照明環境におけるシェーディング結果を生成する。
物質蒸留に同じ環境光を適用することで、DreamMatは、与えられた幾何学と整合するだけでなく、アルベドの焼き込みシェーディング効果のない高品質のPBR材料を生成することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:55:08 GMT)
SA-GS: Semantic-Aware Gaussian Splatting for Large Scene Reconstruction with Geometry Constrain [43.8] セマンティック・アウェアな3Dガウス・スプラットを用いた細粒度3次元幾何再構成のためのSA-GSという新しい手法を提案する。
我々はSAMやDINOのような大きな視覚モデルに格納された事前情報を利用してセマンティックマスクを生成する。
我々は,新しい確率密度に基づく抽出法を用いて点雲を抽出し,ガウススプラッツを下流タスクに不可欠な点雲に変換する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:15:10 GMT)
Mitigating Noisy Correspondence by Geometrical Structure Consistency Learning [43.8] ノイズ対応は、人間の注釈付きまたはWebクローリングデータセットで広く使われている。
本稿では,真の対応性を推定するための幾何学的構造整合性(GSC)手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:42:52 GMT)
Transfer Learning for Diffusion Models [43.1] 拡散モデルは高品質な合成サンプルを一貫して生成する。
コレクションコストや関連するリスクのため、現実のアプリケーションでは実用的ではありません。
本稿では,従来の微調整法や正規化法とは異なる新しいアプローチであるTransfer Guided Diffusion Process (TGDP)を紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:48:58 GMT)
PatchScaler: An Efficient Patch-independent Diffusion Model for Super-Resolution [43.0] 拡散モデルは、その印象的なコンテンツ生成機能により、超解像の品質を著しく向上させる。
近年、サンプリングステップの数を削減すべく、合理的な推論アクセラレーションについて検討されているが、各ステップが全画像上で実行されるため、計算コストは高いままである。
本稿では,パッチ非依存拡散に基づく単一画像超解像法であるPatchScalerを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:31:46 GMT)
Experimental Evaluation of Road-Crossing Decisions by Autonomous Wheelchairs against Environmental Factors [42.9] 追跡性能の微調整と屋外環境要因に対する実験的評価に焦点をあてる。
本手法は,屋外環境要因に対する映像追跡とイベント検出の堅牢性を評価するために適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:43:26 GMT)
Split-Ensemble: Efficient OOD-aware Ensemble via Task and Model Splitting [42.6] 不確実性推定は、機械学習モデルがアウト・オブ・ディストリビューション(OOD)入力を検出するために不可欠である。
本研究では,代替の Split-Ensemble 法を用いたOODデータや追加の推論コストを使わずに不確実性推定を改善する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:59:06 GMT)
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability [42.5] 本稿では,高忠実度かつ多目的な制御性を有する一般化可能な運転世界モデルであるVistaを提案する。
本稿では,移動インスタンスと構造情報の学習を促進するために,新たな2つの損失を提案する。
動作制御性には,高レベルな意図から低レベルな操作に至るまで,多種多様な制御が組み込まれている。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:49:15 GMT)
DOF-GS: Adjustable Depth-of-Field 3D Gaussian Splatting for Refocusing,Defocus Rendering and Blur Removal [42.4] 3次元ガウススプラッティング技術は近年,高品質なリアルタイムレンダリングを実現するため,3次元シーン再構成と新しいビュー合成が進歩している。
これらのアプローチは、画像のモデリングにおいて基礎となるピンホールカメラの仮定によって本質的に制限されており、したがって、All-in-Focus (AiF) のシャープイメージ入力にのみ有効である。
これは、撮像素子の深度(DOF)が制限されているため、画像がしばしばデフォーカスのぼやけを示す現実世界のシナリオにおいて、それらの適用性に大きく影響する。
調整可能なDOFエフェクトのレンダリング、デフォーカスのぼかしの除去、および3Dシーンの再フォーカスを可能にするDOF-GSを導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:54:49 GMT)
Towards Ultra-High-Definition Image Deraining: A Benchmark and An Efficient Method [42.3] 本稿では,4K解像度で13,000枚の画像対を含む4K-Rain13kの大規模UHD画像デライニングデータセットについて述べる。
我々は,この課題をより効果的かつ効率的な視覚ベースアーキテクチャ (UDR-Mixer) を開発した。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:45:08 GMT)
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models [42.2] We present a new efficient LLVM, Mamba based traversal of rationales (Meteor)
豊富な情報を含む長大な論理を埋め込むために,線形時間複雑性を伴う逐次データ処理が可能なMambaアーキテクチャを用いる。
その後、バックボーン・マルチモーダル言語モデル (MLM) を訓練し、合理性の助けを借りて回答を生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:27:23 GMT)
Mitigating the Curse of Dimensionality for Certified Robustness via Dual Randomized Smoothing [42.2] 本稿では,2次元平滑化による高次元入力に対する$ell$認証ロバスト性の実現可能性について検討する。
提案したDual Smoothing (DRS)は入力イメージを2つのサブイメージにダウンサンプルし、下位次元で2つのサブイメージを滑らかにする。
広汎な実験は、確立された方法論と統合する顕著な能力を示すDSSの一般化性と有効性を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:23:37 GMT)
A Framework for Multi-modal Learning: Jointly Modeling Inter- & Intra-Modality Dependencies [42.2] 我々は、モーダリティ間の依存にのみ依存する従来のアプローチは、一般的に最適ではないかもしれないと論じる。
モーダリティ間の依存を捕捉・統合する言語間・モダリティ間モデリング(I2M2)フレームワークを提案する。
現実の医療と最先端のモデルを用いたビジョン・アンド・ザ・アーティカルなデータセットを用いて、我々のアプローチを評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:22:41 GMT)
Learning the mechanisms of network growth [42.1] 動的ネットワークのための新しいモデル選択法を提案する。
データは9つの最先端のランダムグラフモデルをシミュレートすることによって生成される。
提案された機能は、計算しやすく、分析的に抽出可能で、解釈可能である。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:52:07 GMT)
Solomon equations for qubit and two-level systems: Insights into non-Poissonian quantum jumps [41.9] 離散2レベルシステム(TLS)環境に結合したキュービットの結合緩和度を測定し,モデル化する。
もしTLSがクォービットよりもずっと長寿命であれば、非指数緩和と非ポアソン量子ジャンプが観察できる。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:44:08 GMT)
Bayesian RG Flow in Neural Network Field Theories [41.9] ニューラルネットワーク場理論対応(NNFT)は、ニューラルネットワーク(NN)アーキテクチャから統計場理論(SFT)の空間へのマッピングである。
我々は、NNとSFTの空間を探索する強力な新しいフレームワークを形成するためにBRG-NNFTを作成した。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:00 GMT)
Rethinking Independent Cross-Entropy Loss For Graph-Structured Data [41.9] グラフニューラルネットワーク(GNN)は、グラフ構造化データの学習において顕著なパフォーマンスを示した。
本研究では,各ノードと対応するクラスタの結合分布をモデル化する,共同クラスタ型学習という新しいフレームワークを提案する。
このようにして、ローカルクラスタから抽出されたデータラベル参照信号は、ターゲットノード上の識別能力を明示的に強化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:42:32 GMT)
Scorch: A Library for Sparse Deep Learning [41.6] 我々は,効率的なスパーステンソル計算をPyTorchエコシステムにシームレスに統合するライブラリであるScorchを紹介する。
Scorcherはスパーステンソルのためのフレキシブルで直感的なインターフェースを提供し、多様なスパースデータ構造をサポートする。
複数のドメインにわたる多様なディープラーニングモデルにおいて、Scorchの使いやすさとパフォーマンス向上を実証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:59:20 GMT)
On the Noise Robustness of In-Context Learning for Text Generation [41.6] 本研究では、テキスト生成タスクにおいて、ノイズの多いアノテーションがテキスト内学習の性能を著しく損なうことを示す。
この問題を回避するために,LPR(Local Perplexity Ranking)と呼ばれるシンプルで効果的なアプローチを提案する。
LPRは「騒々しい」候補者を、より清潔である可能性が高い隣人に置き換える。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:22:58 GMT)
Are Machines Better at Complex Reasoning? Unveiling Human-Machine Inference Gaps in Entailment Verification [41.3] 本研究は,多文前提における係り受け検証問題について考察する。
一貫性のないモデル生成有理数の検出などの現代のNLP問題は、複雑なマルチホップ推論を必要とする。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:44:14 GMT)
Beyond Random Augmentations: Pretraining with Hard Views [40.9] Hard View Pretraining (HVP)は、SSL事前トレーニング中にモデルをより難しく、より困難なサンプルに公開する学習不要の戦略である。
HVPは、100と300のエポック事前学習において、ImageNetの平均で1%の線形評価精度の向上を実現している。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:19:55 GMT)
Soft Preference Optimization: Aligning Language Models to Expert Distributions [40.8] SPOは、Large Language Models (LLMs)のような生成モデルと人間の好みを整合させる手法である。
SPOは、選好損失をモデル全体の出力分布全体にわたる正規化項と統合する。
本稿では,SPOの方法論,理論的基礎,および単純さ,計算効率,アライメント精度における比較優位性について紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:59:00 GMT)
RICE: Breaking Through the Training Bottlenecks of Reinforcement Learning with Explanation [40.8] RICEは強化学習のための革新的な精製手法である。
トレーニングボトルネックを突破するための説明手法が組み込まれている。
様々なRL環境と実世界のアプリケーションでRICEを評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:37:40 GMT)
Evaluation of Resource-Efficient Crater Detectors on Embedded Systems [40.7] 火星のクレーターのリアルタイム分析は、ミッションクリティカルな運用に不可欠である。
火星クレーターデータセットを用いて複数のYOLOネットワークをベンチマークした。
我々はこのプロセスを、コスト効率の良い商用オフ・ザ・シェルフベースの小型衛星の新しい波に最適化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:45:57 GMT)
Accelerating Greedy Coordinate Gradient via Probe Sampling [40.5] 大規模言語モデルの安全性(LLM)は、その急速な進歩から重要な問題となっている。
我々は、GCGの時間コストを削減するために$ttexttProbe sample$という新しいアルゴリズムを研究している。
プローブサンプリングは、他のプロンプト最適化手法や逆法を高速化することも可能である。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:02:28 GMT)
InvertAvatar: Incremental GAN Inversion for Generalized Head Avatars [40.1] 本稿では,複数フレームからの忠実度向上を目的としたアルゴリズムを用いて,アバター復元性能を向上させる新しいフレームワークを提案する。
本アーキテクチャでは,画素対応画像-画像変換を重要視し,観測空間と標準空間の対応を学習する必要性を緩和する。
提案手法は,1ショットと数ショットのアバターアニメーションタスクにおける最先端の性能を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:54:54 GMT)
Functional Protein Design with Local Domain Alignment [39.8] 本稿では,タンパク質データベースから抽出したテキストアノテーションを組み込んだマルチモーダルなタンパク質設計フレームワークであるProtein-Alignment Generation (PAAG)を提案する。
具体的には、マルチレベルアライメントモジュール内でPAAGは、対応するドメインアノテーションに条件付けられた特定のドメインを含むタンパク質を明示的に生成することができる。
実験の結果,PAAGのタンパク質表現が7つの予測タスクよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:23:26 GMT)
ReflectionCoder: Learning from Reflection Sequence for Enhanced One-off Code Generation [39.8] 我々は,コンパイラフィードバックを統合して構築したリフレクションシーケンスを効果的に活用し,ワンオフコード生成性能を向上させる新しい手法であるReflectionCoderを提案する。
また,HumanEval(+),MBPP(+),MultiPl-Eの3つのベンチマーク実験により,本手法で微調整したモデルが最先端の性能を発揮することを示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:27:00 GMT)
A Theoretical Framework for Partially Observed Reward-States in RLHF [39.4] 部分的に観察された報酬状態(PORRL)を用いた強化学習のモデル化
フィードバックは2種類あり、$-$ cardinal と dueling の2種類があります。
両方のフィードバック設定において、我々のモデルと保証が既存のモデルを一般化し拡張することを示します。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:20:41 GMT)
PlatoLM: Teaching LLMs in Multi-Round Dialogue via a User Simulator [39.4] 本研究では,人間の行動をより良くシミュレートするパラダイムを提案し,マルチターン会話に人間的な質問を組み込むことのメリットを探求する。
具体的には、真の人間と機械の会話から抽出した人間の質問を学習目標とし、ソクラティックと呼ばれる新しいユーザシミュレータを提供する。
MT-Bench における LLaMA ベースの 7B モデル間でのSoTA 性能について検討した。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:32:16 GMT)
Exploring Prompting Methods for Mitigating Class Imbalance through Synthetic Data Generation with Large Language Models [39.3] 大規模言語モデル (LLMs) は、様々な領域にまたがるコンテキスト内学習能力を示す。
そこで本研究では,クラス不均衡を緩和する現実的なデータ生成におけるLLMの有効性について検討した。
この結果から, CSV形式, バランスクラス, ユニークな変数マッピングを用いることで, 現実的で信頼性の高いデータを生成できることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:29:18 GMT)
Human4DiT: Free-view Human Video Generation with 4D Diffusion Transformer [38.9] 本稿では,1枚の画像から高画質の時間的コヒーレントな人間ビデオを生成するための新しい手法を提案する。
本フレームワークは, 正確な条件注入と変圧器拡散のためのU-Netの強度を組み合わせたものである。
我々は,現実的,一貫性のある,自由視点の人間の映像を合成する手法の能力を実証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:53:29 GMT)
Language-guided Skill Learning with Temporal Variational Inference [38.7] 専門家によるデモンストレーションからスキル発見のためのアルゴリズムを提案する。
以上の結果から,本手法を応用したエージェントが,学習の促進に役立つスキルを発見できることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:31:38 GMT)
LoRA Meets Dropout under a Unified Framework [38.5] 大規模言語モデル(LLM)は、多くのNLPアプリケーションにおいて重要な要素として現れている。
様々なドロップアウト手法は、当初は全てのパラメータを更新した完全な微調整のために設計されていたが、過剰なパラメータ冗長性に関連する過度な適合を緩和した。
我々は,これらの手法を,落下位置,構造パターン,補償基準に基づいてインスタンス化する総合的な調査のための統一的な枠組みを導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:16:43 GMT)
NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models [38.4] NV-Embedモデルに様々なアーキテクチャ設計とトレーニング手順を導入する。
我々のモデルは、MTEB(Massive Text Embedding Benchmark)で1位、69.32の最高スコアを記録した。
私たちはこのモデルを、https://face.co/EIR/NV-Embed-v1.comでオープンソース化しました。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:45 GMT)
Partial Models for Building Adaptive Model-Based Reinforcement Learning Agents [37.6] 部分モデルの概念的にシンプルなアイデアにより、深層モデルに基づくエージェントがこの課題を克服できることを示す。
我々は、ディープダイナQ、PlaNet、Dreamerなどのエージェントで部分モデルを使用することで、環境の局所的な変化に効果的に適応できることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:46:36 GMT)
TiC: Exploring Vision Transformer in Convolution [37.5] マルチヘッド・セルフアテンション・コンボリューション(MSA-Conv)を提案する。
MSA-Convは、標準、拡張された、深みのあるものを含む一般的な畳み込みの中に自己認識を組み込んでいる。
本稿では,MSA-Convを用いた画像分類の概念実証として,TiC(Vision Transformer in Convolution)を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:37:59 GMT)
From Sparse to Soft Mixtures of Experts [37.5] 専門家アーキテクチャ(MoE)の疎結合は、トレーニングや推論コストを大幅に増加させることなく、モデルのキャパシティをスケールする。
トレーニングの不安定性、トークンのドロップ、専門家の数をスケールできないこと、非効率な微調整などだ。
我々は、これらの課題に対処しつつ、MoEの利点を維持しながら、完全に微分可能なスパーストランスであるSoft MoEを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:44:51 GMT)
A Bayesian Approach to Online Learning for Contextual Restless Bandits with Applications to Public Health [36.8] RMABに対するオンラインRLアプローチであるBCoR(Bayesian Learning for Contextual RMABs)について述べる。
BCoRの重要な強みは、腕内と腕間の共有情報を利用して、未知のRMAB遷移ダイナミクスを素早く学習する能力である。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:03:41 GMT)
Efficient multi-prompt evaluation of LLMs [36.5] PromptEvalは,多数のプロンプトに対して性能を推定する手法である。
PromptEvalは一貫して性能分布を推定し,その有効性を実証的に証明する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:24:47 GMT)
Make Me Happier: Evoking Emotions Through Image Diffusion Models [36.4] そこで本研究では,感情を刺激するイメージを合成し,本来のシーンのセマンティクスと構造を保ちながら,感情を刺激するイメージを合成することを目的とした,感情誘発画像生成の新たな課題を提案する。
感情編集データセットが不足しているため、34万対の画像とその感情アノテーションからなるユニークなデータセットを提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:05:50 GMT)
Cross-Modal Safety Alignment: Is textual unlearning all you need? [36.3] テキスト領域のみの未学習は、モダリティ間の安全アライメントに有効であることを示す。
実験の結果,マルチモーダルデータセットを用いたアンラーニングでは潜在的なメリットは得られず,計算要求が大幅に増加することがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:29:13 GMT)
Experts Don't Cheat: Learning What You Don't Know By Predicting Pairs [35.9] モデルに$p(Y|X)$を近似させる戦略を提案し、$widehatp_theta(Y|X)$と$p(Y|X)$の間の残りのギャップを推定する。
提案手法では,曖昧な画像分類,(合成)言語モデリング,部分観測可能なナビゲーションタスクなどにおいて,モデルがどの程度の知識を持っていないかを正確に推定する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:40:04 GMT)
XFormParser: A Simple and Effective Multimodal Multilingual Semi-structured Form Parser [35.7] 本研究では, 単純だが効果的な textbfMultimodal と textbfMultilingual semi-structured textbfFORM textbfXForm フレームワークを提案する。
textbfXFormは、包括的な事前訓練された言語モデルに固定されており、革新的にエンティティ認識とリレーショナルREである。
本フレームワークは,マルチ言語およびゼロショットの両文脈において,タスク間の性能を著しく向上させる。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:37:17 GMT)
CopyNE: Better Contextual ASR by Copying Named Entities [35.4] 我々は、NE辞書からエンティティをコピーできるCopyNEと呼ばれる体系的なメカニズムを設計する。
実験により、CopyNEは従来のアプローチと比較して、エンティティの翻訳精度を一貫して改善することが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:35:36 GMT)
Vidu4D: Single Generated Video to High-Fidelity 4D Reconstruction with Dynamic Gaussian Surfels [35.3] 単一生成ビデオから4D表現を正確に再構成する新しい再構成モデルVidu4Dを提案する。
Vidu4Dのコアとなるのは、提案した動的ガウスサーフェス(DGS)技術である。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:43:44 GMT)
Taiyi-Diffusion-XL: Advancing Bilingual Text-to-Image Generation with Large Vision-Language Model Support [35.2] 中国語と英語のバイリンガル・テキスト・ツー・イメージ・モデルであるTaiyi-Diffusion-XLを提案する。
CLIPとStable-Diffusion-XLの能力をバイリンガル連続事前学習のプロセスにより拡張する。
両言語画像テキスト検索においてCLIPモデルが優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:13:52 GMT)
Multi-Task Dense Prediction via Mixture of Low-Rank Experts [35.1] MLoRE(Mixture-of-Low-Rank-Experts)と呼ばれる,マルチタスクの高密度予測のためのデコーダに着目した新しい手法を提案する。
グローバルなタスク関係をモデル化するために、MLoREは元のMoE構造に汎用的な畳み込みパスを追加し、各タスク機能は、明示的なパラメータ共有のためにこのパスを通ることができる。
実験の結果,MLoREは従来のすべてのメトリクスの最先端手法に比べて優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:09:48 GMT)
Ego-Foresight: Agent Visuomotor Prediction as Regularization for RL [34.7] エゴフォレスト(Ego-Foresight)は、エージェントと環境を移動と予測に基づいて切り離す自己管理手法である。
本稿では,エージェントのビジュモータ予測がRLアルゴリズムの正規化に役立ち,動作が予測可能な範囲内に留まるよう促すことを示す。
Ego-ForesightとモデルフリーなRLアルゴリズムを統合し、ロボット操作のシミュレーションを解くことで、効率が23%向上し、性能が8%向上した。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:32:43 GMT)
The Uncanny Valley: Exploring Adversarial Robustness from a Flatness Perspective [34.6] 損失面の平坦性は、一般化と正の相関を持つだけでなく、対向的堅牢性にも関係している。
本稿では,1層のパラメータに対する逆例と相対平坦度の関係を実証的に解析する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:10:46 GMT)
Trajectory Data Suffices for Statistically Efficient Learning in Offline RL with Linear $q^π$-Realizability and Concentrability [34.5] H$-horizon Markov decision process(MDPs)におけるオフライン強化学習(RL)
トラジェクトリデータでは、$textpoly(d,H,C_textconc)/epsilon2$のデータセットは、$epsilon$-optimal Policyを導出するのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:59:13 GMT)
On Mesa-Optimization in Autoregressively Trained Transformers: Emergence and Capability [34.4] いくつかの説では、トランスフォーマーはオートレアトレーニング中にmesa-optimizerを学習する。
データモーメントに関する強い仮定は、学習されたメザ最適化器が実行可能な十分な必要条件であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:41:06 GMT)
Empowering Character-level Text Infilling by Eliminating Sub-Tokens [34.4] FIM-SEは"Fill-In-the-Middle"の略で、開始文字と終了文字の制約がある。
本稿では,FIM-SEについて紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:21:48 GMT)
Perturbation-Restrained Sequential Model Editing [33.5] 現在のモデル編集手法は、編集数が増加するにつれて、大きな言語モデル(LLM)の一般的な能力を損なう。
編集用上層部における摂動抑制フレームワーク(PRUNE)を提案する。
PRUNEは、シーケンシャルモデル編集において、編集性能を効果的に維持しながら、かなりの汎用性を維持できる。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:40:56 GMT)
Adaptive Batch Normalization Networks for Adversarial Robustness [33.1] 敵防衛訓練(Adversarial Training、AT)は、現代の敵防衛の標準的基盤である。
テスト時間領域適応の最近の進歩に触発された適応バッチ正規化ネットワーク(ABNN)を提案する。
ABNNは、デジタルおよび物理的に実現可能な攻撃に対する敵の堅牢性を一貫して改善する。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:38:08 GMT)
Spectral regularization for adversarially-robust representation learning [32.8] 下流の分類タスクにおけるブラックボックスの対角ロバスト性を促進する表現学習のための新しいスペクトル正規化器を提案する。
本手法は, ネットワークのすべての層を正規化する手法よりも, テスト精度とロバスト性の向上に有効であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:01:42 GMT)
Stochastic Two Points Method for Deep Model Zeroth-order Optimization [32.5] 本稿では,勾配自由状態下での効率的な2点(S2P)アプローチを提案する。
一般および緩和された滑らか性仮定の下で、S2Pの理論収束性を示す。
我々は、VS2Pが深層モデルの目的を最適化するのに非常に効果的であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:56:01 GMT)
FedHPL: Efficient Heterogeneous Federated Learning with Prompt Tuning and Logit Distillation [32.3] フェデレートラーニング(FL)は、分散クライアントが中央サーバーでモデルを協調訓練できるプライバシー保護パラダイムである。
我々はパラメータ効率の高い$textbfFed$erated Learning framework for $textbfH$eterogeneous settingsを提案する。
我々のフレームワークは最先端のFLアプローチより優れており、オーバーヘッドもトレーニングラウンドも少なくなっている。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:25:32 GMT)
Explore until Confident: Efficient Exploration for Embodied Question Answering [32.3] 我々は、大きな視覚言語モデルの強力な意味推論機能を活用して、質問を効率的に探索し、答える。
深度情報とVLMの視覚的プロンプトに基づいて,まずシーンのセマンティックマップを構築する手法を提案する。
次に、コンフォメーション予測を用いて、自信に答えるVLMの質問を校正し、いつ探索を中止するかをロボットが知ることができるようにする。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:47:11 GMT)
VoCoT: Unleashing Visually Grounded Multi-Step Reasoning in Large Multi-Modal Models [32.1] 本稿では,LMMを用いた推論に適した多段階の視覚的対象中心連鎖推論フレームワークであるVoCoTを提案する。
VoCoTの特徴は,(1)オブジェクト中心の推論経路,(2)オブジェクト概念を多モードのインターリーブ・アライメントで視覚的に表現する,という2つの特徴である。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:12:00 GMT)
Understanding Linear Probing then Fine-tuning Language Models from NTK Perspective [32.0] ニューラル・タンジェント・カーネル(NTK)理論に基づく分類モデルにおけるLP-FTのトレーニングダイナミクスを解析する。
LP中におけるリニアヘッドノルムの顕著な増加は,クロスエントロピー(CE)損失によるトレーニングから生じている。
自然言語処理タスクのトランスフォーマーモデルによる実験により,我々の理論解析が検証され,LP-FTの有効性が実証された。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:31:40 GMT)
Optimistic Safety for Online Convex Optimization with Unknown Linear Constraints [31.5] 我々はOptimistically Safe OCOと呼ぶアルゴリズムを導入し、$tildemathcalO(sqrtT)$ regretと制約違反がないことを示す。
静的線型制約の場合、これは以前の最もよく知られた $tildemathcalO(T2/3)$ regret をわずかに強い仮定で改善する。
時間的制約の場合、当社の作業は、$mathcalO(sqrtT)$ regretと$mathcalを示す既存の結果を補完します。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:07:51 GMT)
Exploiting the Layered Intrinsic Dimensionality of Deep Models for Practical Adversarial Training [31.5] 対人訓練(AT)は、2つの主要な理由から実践的なAIシステムに展開されることはめったにない。
ATはビジョンモデルにおける一般化の減少をもたらすが、エンコーダベースの言語モデルでは一般化は改善されるか変化しない。
SMAATは標準的なATに比べて25~33%のGPU時間しか必要とせず、全アプリケーションにおけるロバスト性は著しく向上している。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:48:30 GMT)
Context-Former: Stitching via Latent Conditioned Sequence Modeling [31.3] コンテキスト情報に基づく模倣学習(IL)とシーケンスモデリングを統合したContextFormerを導入する。
実験では、ContextFormerは複数のIL設定で競合的なパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:38:18 GMT)
Augmenting Textual Generation via Topology Aware Retrieval [30.9] トポロジを意識した検索型検索生成フレームワークを開発した。
このフレームワークは、トポロジ的関係に基づいてテキストを選択する検索モジュールを含む。
我々は,確立したテキスト配信ネットワークをキュレートし,本フレームワークの有効性を検証するための総合的な実験を行った。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:02:18 GMT)
Multiple-policy Evaluation via Density Estimation [30.9] 本稿では,この問題に対して$mathrmCAESAR$というアルゴリズムを提案する。
低次かつ対数的な$mathrmCAESAR$は、$tildeOleft(fracH4epsilon2sum_h=1Hmax_kin[K]sum_s,afrac(d_hpik(s,a))2mu*_h(s,a)right)$である。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:57:02 GMT)
HEART-felt Narratives: Tracing Empathy and Narrative Style in Personal Stories with LLMs [30.6] 共感は、社会的な行動を可能にするための基盤となり、物語の中で個人的な経験を共有することによって引き起こされる。
共感は物語の内容に影響されるが、直感的には物語の語り方にも反応する。
我々は, LLMと大規模クラウドソーシング研究を用いて, スタイルと共感の関係を実証的に検証し, 定量化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:00:38 GMT)
Debiased Distribution Compression [30.6] 本稿では, バイアス入力シーケンスによる圧縮に適した新しい圧縮手法を提案する。
バーンイン,近似マルコフ連鎖モンテカルロ,テンパリングによるバイアスを克服しつつ,簡潔かつ正確な後続サマリーを提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:47:25 GMT)
Self-Corrected Multimodal Large Language Model for End-to-End Robot Manipulation [30.5] MLLM (Multimodal Large Language Models) は、視覚的指示において有望であることを示す。
自己補正(SC)-MLLMを導入し、エンドエフェクタのポーズを予測するだけでなく、障害行動の自律的認識と修正も行う。
SC-MLLMは従来の最先端ロボットMLLM(ManipLLM)と比較して操作精度を著しく向上させる
論文参考訳(メタデータ) (Mon, 27 May 2024 17:58:48 GMT)
Convex Relaxation for Solving Large-Margin Classifiers in Hyperbolic Space [29.6] 双曲空間はデータ処理における優れた性能で認識されている。
勾配降下法を用いてこの問題を解こうとする以前の試みは失敗に終わった。
本稿では,緩やかな緩和モーメントを用いて最適解を効果的に近似する方法を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:19:53 GMT)
Masked Face Recognition with Generative-to-Discriminative Representations [29.0] 本研究では,マスク付き顔認識を容易にするために,生成と識別の表現を学習するための統合されたディープネットワークを提案する。
まず,顔の塗り絵に予め訓練された生成エンコーダを利用して,顔のマスクをカテゴリ認識記述子に表現する。
我々は,多層畳み込みネットワークを識別的再構成器として組み込んで,カテゴリ対応記述子をアイデンティティ対応ベクトルに変換することを学習する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:20:55 GMT)
Cost-efficient Knowledge-based Question Answering with Large Language Models [28.8] 知識に基づく質問応答(KBQA)は、ドメイン知識を必要とする多くのシナリオで広く使われている。
大規模言語モデル(LLM)はKBQAに機会をもたらすが、そのコストは著しく高く、事前トレーニング中にドメイン固有の知識が欠如している。
我々は,KBQA と LLM のコスト効率を向上する新しい戦略である Coke を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:37:34 GMT)
SCSim: A Realistic Spike Cameras Simulator [28.7] SCSimは、包括的ノイズモデルを備えた、新しくより現実的なスパイクカメラシミュレータである。
SCSimは、自律的に駆動シナリオを生成し、対応するスパイクストリームを合成するのに適している。
評価の結果,SCSimはスパイクストリームの生成において,既存のシミュレーション手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:24:34 GMT)
Unsupervised Generative Feature Transformation via Graph Contrastive Pre-training and Multi-objective Fine-tuning [28.7] 教師なし特徴変換学習のための測定-事前訓練-ファネチューンパラダイムを開発した。
教師なし特徴集合の実用性測定のために,特徴値の整合性維持の観点から提案する。
生成的変換ファインタニングでは,特徴集合を特徴クロスシーケンス,特徴変換を逐次生成とみなす。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:50:00 GMT)
$\textit{Trans-LoRA}$: towards data-free Transferable Parameter Efficient Finetuning [28.7] 低ランクアダプタ(LoRA)とその変種はパラメータ効率の良い微調整技術として人気がある。
ベースモデルを新しいモデルに置き換える必要がある場合、関連するすべてのLoRAモジュールを再トレーニングする必要がある。
LoRAモジュールとベースモデルがサービスプロバイダによってホストされている商用クラウドアプリケーションには特に問題があります。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:15:08 GMT)
Open Ad Hoc Teamwork with Cooperative Game Theory [28.6] アドホックなチームワークは、事前の調整や共同トレーニングなしに、チームメイトと協力するエージェントの設計を必要とする、困難な問題を引き起こします。
有望な解決策の1つは、制限のない数のエージェントを扱うためにグラフニューラルネットワークの一般化性を活用することである。
我々は、協調ゲーム理論の観点から、共同Q値表現を理解するための新しい理論を確立する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:48:35 GMT)
DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution [28.6] 本研究では, 事前学習モデルの微調整のための動的低ランク適応法(DoRA)を提案する。
DoRAは、高ランクのLoRA層を構造化シングルランクコンポーネントに分解し、パラメータ予算の動的プルーニングを可能にする。
実験結果から,LORAやフルモデルファインチューニングと比較して,DoRAの競争性能が向上することが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:02:27 GMT)
Towards Stability of Parameter-free Optimization [28.0] 我々は、新しいパラメータフリー勾配、textscAdamG(黄金のステップサイズを持つアダム)を提案する。
textscAdamGは優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:46:21 GMT)
Learning Social Welfare Functions [27.9] 本研究では,有能な家族に属する社会福祉機能を学習する上での課題について考察する。
社会福祉情報の比較が騒々しくても, どちらの場合においても, パワー平均関数は複雑に学習可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:16:52 GMT)
Tamed Langevin sampling under weaker conditions [27.9] ログコンケーブではなく,弱い散逸性しか持たない分布から抽出する問題について検討する。
そこで本研究では,対象分布の成長と崩壊特性に合わせたテイミング手法を提案する。
提案したサンプルに対して,Kulback-Leiblerの発散,全変動,ワッサーシュタイン距離といった条件で明確な非漸近保証を与える。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:00:40 GMT)
MoSca: Dynamic Gaussian Fusion from Casual Videos via 4D Motion Scaffolds [27.8] 野生でカジュアルに撮影されたモノクロビデオから動的シーンの新たなビューを再構築し、合成するために設計された神経情報処理システムである4D Motion Scaffolds(MoSca)を紹介した。
動的レンダリングベンチマークでは、最先端のパフォーマンスが実証されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:07 GMT)
Exploring Backdoor Attacks against Large Language Model-based Decision Making [27.3] 大規模言語モデル(LLM)は、特定のアプリケーションで微調整された場合、意思決定タスクにおいて大きな可能性を示している。
これらのシステムは、微調整の段階でかなりの安全性とセキュリティ上のリスクにさらされている。
LLM対応意思決定システムに対するバックドアアタックの最初の包括的フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:43 GMT)
A Separation in Heavy-Tailed Sampling: Gaussian vs. Stable Oracles for Proximal Samplers [27.1] 重み付きサンプリングの複雑さについて検討し,高い精度と低い精度の保証を得るという観点から分離結果を示す。
本研究は,ガウス神託に基づく近位サンプリング器が,重尾ターゲット群からのサンプリングにおいて,必ずしも低精度保証しか達成できないという根本的な障壁があることを示唆する。
対照的に、安定オラクルに基づく近位サンプリング器は高い精度の保証を示し、上記の制限を克服する。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:04:28 GMT)
Stochastic optimization on matrices and a graphon McKean-Vlasov limit [26.9] 同じ置換を用いて行と列の置換の下で不変である適当な関数の大きい対称行列の空間上の勾配降下を考える。
行列の次元が無限大になるにつれて、これらのランダム曲線の決定論的極限を確立する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:34:26 GMT)
LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding [26.9] ビジュアルグラウンドティングは、ユーザが提供するテキストクエリと、画像内のクエリ固有の領域を結びつける重要なツールである。
LLM-Opticは,Large Language Models (LLMs) を光学レンズとして利用し,既存の視覚的接地モデルを強化する革新的な手法である。
提案手法は,任意の言語入力によって指定された任意のオブジェクトを検出可能な,普遍的な視覚的接地を実現する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:23:08 GMT)
NormAd: A Benchmark for Measuring the Cultural Adaptability of Large Language Models [26.6] 我々は75カ国の社会的・文化的規範を表す新しい物語のデータセットであるNormAdを紹介した。
我々は,大規模言語モデルが社会的・文化的文脈の粒度の異なるレベルに適応する能力を評価する。
NormAdデータセットとその関連コードはGitHubでリリースしています。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:06:31 GMT)
Diagnosing the Compositional Knowledge of Vision Language Models from a Game-Theoretic View [26.5] 視覚言語モデル(VLM)は、構成的推論に関して十分な知識を欠いている。
本稿では,VLMの脆弱性を構成的理解の異なる側面から評価するために,新しいゲーム理論的視点による評価手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:22:03 GMT)
DPN: Decoupling Partition and Navigation for Neural Solvers of Min-max Vehicle Routing Problems [26.5] 本稿では、分割とナビゲーションのための異なる埋め込みを学習する、新しいアテンションベースのパーティション・アンド・ナビゲーション・エンコーダ(P&N)を提案する。
エージェント置換対称損失関数(APS)を開発した。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:33:16 GMT)
Unlocking the Secrets of Linear Complexity Sequence Model from A Unified Perspective [26.5] LCSM(Linear Complexity Sequence Model)は、線形複雑性を伴う様々なシーケンスモデリング手法を単位とする。
これらのモデルのモデリングプロセスは、拡張、Oscillation、Shrinkの3つの異なるステージに区分する。
異なるステージ設定が言語モデリングおよび検索タスクに与える影響を分析する実験を行う。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:38:55 GMT)
MindMerger: Efficient Boosting LLM Reasoning in non-English Languages [26.3] 推論能力は大規模言語モデル(LLM)にとって不可欠である
我々は,多言語モデルからLLMと外部言語理解機能を融合したMindMergerを提案する。
MindMergerは、特に低リソース言語において、すべてのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:41:54 GMT)
Your decision path does matter in pre-training industrial recommenders with multi-source behaviors [26.0] データリッチシナリオから振る舞いを転送することで、高品質な表現を学ぶために、クロスドメインレコメンデーションが導入される。
クロスドメインレコメンデーションのための新しい階層化経路拡張表現学習HIERを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:49:07 GMT)
DD-RobustBench: An Adversarial Robustness Benchmark for Dataset Distillation [25.8] 我々は,蒸留したデータセットの対角的堅牢性を統一的に評価する上で,これまでで最も広範囲なベンチマークを導入する。
TESLAやSRe2Lといった最新の進歩を取り入れることで,これまでの取り組みを大きく拡張する。
また, 蒸留したデータを元のデータセットのトレーニングバッチに組み込むことで, 堅牢性の向上が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:11:08 GMT)
Dual VC Dimension Obstructs Sample Compression by Embeddings [25.6] 本研究は、特に極端クラスに焦点を当てた、良好なVCクラスに任意のVCクラスを組み込むことについて研究する。
すべての$d$に対して、$d$の指数よりも小さい任意の極端なVC次元のクラスに組み込むことができないVC次元の$d$を持つクラスが存在することを証明している。
この結果は学習理論において重要な意味を持ち、長期にわたるサンプル圧縮予想に対処するための最も広範囲に研究されたアプローチの1つの基本的限界を明らかにする。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:38:25 GMT)
Unsupervised Evaluation of Code LLMs with Round-Trip Correctness [25.6] 代替評価法としてラウンドトリップ正当性(RTC)を導入する。
RTCはモデルに予測を依頼できるという考えに基づいている。
コード合成と編集の評価にRTCを用いる方法を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:55:06 GMT)
Accelerating Parallel Sampling of Diffusion Models [25.3] 自己回帰過程を並列化することにより拡散モデルのサンプリングを高速化する新しい手法を提案する。
これらの手法を適用したParaTAAは、普遍的でトレーニング不要な並列サンプリングアルゴリズムである。
実験により、ParaTAAは一般的なシーケンシャルサンプリングアルゴリズムで要求される推論ステップを4$sim$14倍に削減できることを示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:23:24 GMT)
A Best-of-both-worlds Algorithm for Bandits with Delayed Feedback with Robustness to Excessive Delays [25.0] 本稿では,フィードバックが可変に遅延するバンディットのためのベスト・オブ・ボス・ワールドス・アルゴリズムを提案する。
我々のアルゴリズムは任意の過剰な遅延を許容し、$T$をオーダーすることができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:30:57 GMT)
DSP: Dynamic Sequence Parallelism for Multi-Dimensional Transformers [25.0] シーケンス並列性の新しい抽象化として動的シーケンス並列性(DSP)を提案する。
DSPは通信コストの大幅な削減、モジュール間の適応性、最小限の制約による実装の容易性を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:51:52 GMT)
Alignment is Key for Applying Diffusion Models to Retrosynthesis [24.9] 拡散モデル(diffusion model)は、保温後の条件付けと、生成時の速度品質のトレードオフを可能にする、有望なモデリングアプローチである。
数学的には、置換同変デノイザはグラフ拡散モデルの表現性を著しく制限し、したがってそれらの逆合成への適応性を示す。
我々の新しいデノイザは、USPTO-50k上のテンプレートフリーおよびテンプレートベースのメソッドで最高1$の精度(54.7$%)を達成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:57:19 GMT)
Dynamics Harmonic Analysis of Robotic Systems: Application in Data-Driven Koopman Modelling [24.7] 我々は,対称ロボットシステムの状態空間を異型部分空間に分解するために調和解析を導入する。
線形力学では、この分解が各部分空間上の独立線型系への力学の分割にどのように繋がるかを特徴づける。
本アーキテクチャは, 合成システムと四足歩行ロボットの運動力学に基づいて, 一般化, サンプル効率, 解釈可能性の向上を図っている。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:58:39 GMT)
Collage is the New Writing: Exploring the Fragmentation of Text and User Interfaces in AI Tools [24.7] このエッセイでは、最近のAI記述ツールのユーザインターフェース設計を分析するための分析レンズとしてColllageを採用している。
批判的な視点は、作家が歴史的に文学的コラージュを通して表現した懸念とAI書記ツールに関するものである。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:35:17 GMT)
Asymptotic Gaussian Fluctuations of Eigenvectors in Spectral Clustering [24.6] 一般スパイクランダム行列モデルの信号$$$のノイズ構造は、対応するGramカーネル行列の固有ベクトルに転送される。
このCLTライクな結果は、スペクトルクラスタリングの分類性能を正確に予測する最後の欠落点であった。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:44:57 GMT)
Position: Foundation Agents as the Paradigm Shift for Decision Making [24.6] 我々は,エージェントの学習パラダイムの変革的変化として,基礎エージェントの構築を提唱する。
我々は,大規模な対話型データ収集や生成から自己指導型事前学習,適応に至るまで,基礎エージェントのロードマップを定めている。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:54:50 GMT)
Learning Commonality, Divergence and Variety for Unsupervised Visible-Infrared Person Re-identification [24.5] 教師なし可視人物再識別(USVI-ReID)は、赤外線画像中の特定人物と、アノテーションなしで可視画像とをマッチングすることを目的としており、その逆も目的である。
既存のほとんどの手法はクラスタベースのコントラスト学習を用いてUSVI-ReID問題に対処する。
UVI-ReIDのためのマルチプロトタイプ(PCLMP)法によるプログレッシブコントラスト学習を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:45:21 GMT)
Why Transformers Need Adam: A Hessian Perspective [24.4] SGDはトランスフォーマーのかなりの差でAdamよりもパフォーマンスが悪くなっている。
ヘシアンレンズを用いたトランスフォーマーにおけるSGDの悪い性能について説明する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:53:18 GMT)
RLHF from Heterogeneous Feedback via Personalization and Preference Aggregation [24.4] 人間からのフィードバックからの強化学習(RLHF)は、AIシステムを人間の価値と整合させる効果的な手法である。
本稿では、人間の嗜好に固有の異質性や、フィードバックの提供における潜在的な戦略的行動から、この問題に対処することに焦点を当てる。
本研究では, 個人化に基づく手法と集約に基づく手法の2つの枠組みを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:08:40 GMT)
From Obstacle to Opportunity: Enhancing Semi-supervised Learning with Synthetic Data [24.1] 半教師付き学習(SSL)では、ラベルのないデータを使ってモデルの性能を向上させることができる。
本稿では,この問題を解決するために,Real and Synthetic hybrid SSL (RS-SSL) という新たなタスクを構築した。
我々は、現在のSSLメソッドが合成データを十分に活用することができず、時に負の影響を受けることを発見した。
合成画像による問題を分析することにより,RS-SSL問題に対処する新たなSSL手法 RSMatch を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:24:42 GMT)
DC-Gaussian: Improving 3D Gaussian Splatting for Reflective Dash Cam Videos [24.0] 本稿では,車載ダッシュカムビデオから新しいビューを生成する手法であるDC-Gaussianを提案する。
本手法は,新規なビュー合成における最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:38:10 GMT)
Salutary Labeling with Zero Human Annotation [23.9] 本稿では,ヒトのアノテーションを使わずに最も有益なラベルを最も有益なサンプルに自動的に割り当てるサルタラベリングを提案する。
9つのベンチマークデータセットで行った実験は、従来のアクティブな学習戦略よりも有意なラベル付け手法の優れた性能を示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:49:18 GMT)
Calibrated Dataset Condensation for Faster Hyperparameter Search [23.8] 最先端のアプローチは、実データと合成データの間のモデル勾配のマッチングに依存する。
本稿では,ハイパーパラメータ探索を対象とする異なる凝縮目標について考察する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:55:01 GMT)
NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation [23.7] NaVidは、ヴィジュアル・アンド・ランゲージナビゲーションのためのビデオベースの大型視覚言語モデル(VLM)である。
NaVidはシミュレーション環境と現実世界で最先端のパフォーマンスを実現し、優れたクロスデータセットとSim2Real転送を実現している。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:47:03 GMT)
TIE: Revolutionizing Text-based Image Editing for Complex-Prompt Following and High-Fidelity Editing [23.5] マルチモーダルな大言語モデルの頑健な推論とローカライズ機能を活用した,革新的な画像編集フレームワークを提案する。
提案モデルでは,複雑なプロンプトを理解し,対応する画像を生成する能力が向上し,生成前後の画像の忠実度と一貫性が向上した。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:50:37 GMT)
RAG-RLRC-LaySum at BioLaySumm: Integrating Retrieval-Augmented Generation and Readability Control for Layman Summarization of Biomedical Texts [23.5] 本稿では,RAG-RLRC-LaySumフレームワークについて紹介する。
RAG-RLRC-LaySumフレームワークは、科学的知識を効果的に民主化し、生物医学的な発見への公的な関与を高める。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:55:22 GMT)
SUNY: A Visual Interpretation Framework for Convolutional Neural Networks from a Necessary and Sufficient Perspective [23.2] 本稿では,より優れた人間の理解に向けた説明を合理化するための因果関係駆動型フレームワークSUNYを提案する。
CNNモデルの入力特徴や内部フィルタを仮説的原因として用いて、SUNYは必要な視点と十分な視点の両方について双方向の定量化による説明を生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:11:49 GMT)
EMERGE: Integrating RAG for Improved Multimodal EHR Predictive Modeling [22.9] EMERGEは、マルチモーダルEHR予測モデリングの強化を目的とした、検索拡張生成駆動フレームワークである。
提案手法は,大規模言語モデルにより時系列データと臨床メモの両方からエンティティを抽出する。
抽出した知識は、患者の健康状態のタスク関連サマリーを生成するために使用される。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:53:15 GMT)
Dual-Delayed Asynchronous SGD for Arbitrarily Heterogeneous Data [22.9] 我々は、中央サーバのオーケストレーションの下で、複数のワーカにまたがるデータによる分散学習問題を考察する。
データ繰り返しの悪影響を考慮に入れたテキスト遅延非同期SGD(DuDe-ASGD)アルゴリズムを提案する。
DuDe-ASGDは非同期トレーニング中にすべてのワーカーからの静的な勾配をフルに利用し、モデルパラメータとサーバで使用されるデータサンプルに2つの時間ラグをもたらす。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:00:30 GMT)
The Collusion of Memory and Nonlinearity in Stochastic Approximation With Constant Stepsize [22.9] 本稿では,データのマルコフ的依存性と非線形更新規則の同時性について考察する。
我々は,SA 反復 $theta_k$ と Markovian データ $x_k$ の相関関係を詳細に解析する。
我々は、$mathbbE[theta_infty]-thetaast=alpha(b_textm+b_textn+b_textc)+で与えられるSA繰り返しの偏りを正確に評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:23:42 GMT)
Incremental Sequence Labeling: A Tale of Two Shifts [22.8] インクリメンタルシーケンスラベリングタスクは、以前のクラスに関する知識を維持しながら、時間とともに新しいクラスを継続的に学習する。
調査では、E2O(モデルが古いエンティティを非エンティティと誤ってラベル付けする)とO2E(モデルが非エンティティまたは古いエンティティを新しいエンティティとラベル付けする)という2つの重要なセマンティックシフトを特定した。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:23:17 GMT)
BIOSCAN-CLIP: Bridging Vision and Genomics for Biodiversity Monitoring at Scale [22.5] 画像,DNAバーコード,テキストデータを統合埋め込み空間に整列させるために,CLIPスタイルのコントラスト学習を併用したマルチモーダルアプローチを提案する。
本手法は,ゼロショット学習タスクにおいて,従来の単一モダリティ手法を11%以上精度で上回る。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:57:48 GMT)
Recurrent Early Exits for Federated Learning with Heterogeneous Clients [22.4] フェデレーテッド・ラーニング(FL)は、プライバシを保存する方法で、複数のクライアントにまたがるモデルの分散学習を可能にした。
FLの主な課題の1つは、クライアントに様々なハードウェア能力を持たせることである。
本稿では,異なるサブモデルの特徴を1つの共有分類器に融合するReeFLという早期終了手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:11:22 GMT)
Disentanglement Learning via Topology [22.3] マルチスケールなトポロジ的損失項を付加することにより,不整合表現を学習するTopDisを提案する。
ディスタングルメントは、ディープラーニングモデルの説明可能性と堅牢性にとって重要なデータ表現の重要な特性である。
提案した位相損失を用いて,訓練されたGANにおいて不整合方向を求める方法を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:33:56 GMT)
RefDrop: Controllable Consistency in Image or Video Generation via Reference Feature Guidance [22.3] RefDropを使えば、ユーザーは直接的かつ正確な方法で参照コンテキストの影響を制御できる。
また,本手法は,複数の主題を一貫した生成など,より興味深い応用を可能にする。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:23:20 GMT)
Enhancing Global Sensitivity and Uncertainty Quantification in Medical Image Reconstruction with Monte Carlo Arbitrary-Masked Mamba [22.3] マンバは視覚表現の学習において優位性を示している。
新しいArbitrary Scan Masking(ASM)機構は、不確実性推定のためのランダム性を導入するために''の冗長情報をマスクする。
複数の代表的な医用画像再構成タスクに対する総合的な実験が実施されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:04:43 GMT)
ReFusion: Improving Natural Language Understanding with Computation-Efficient Retrieval Representation Fusion [22.2] 言語モデルに外部データベースからの知識を取り入れた検索ベース拡張(RA)は,様々な知識集約(KI)タスクに大きく成功している。
既存の作業は、モデル性能を改善するために、検索と入力を結合することに焦点を当てている。
本稿では,二段階最適化を用いた計算効率の高い検索表現Fusionである textbfReFusion の新たなパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:04:19 GMT)
Grokked Transformers are Implicit Reasoners: A Mechanistic Journey to the Edge of Generalization [22.0] 我々は、トランスフォーマーがパラメトリック知識よりも暗黙的に推論できるかどうかを研究する。
我々は2つの代表的な推論タイプ、構成と比較に焦点を当てる。
トランスフォーマーは暗黙の推論を学習できるが、それはグルーキングでしか学べない。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:55:35 GMT)
UniTable: Towards a Unified Framework for Table Recognition via Self-Supervised Pretraining [22.0] テーブル認識のトレーニングパラダイムとトレーニング目標を統合するためのトレーニングフレームワークであるUniTableを提案する。
本フレームワークは,3つのTRタスクの学習目標を,タスク非依存の訓練目標である言語モデリングに統一する。
UniTableのテーブル解析機能は、既存のTRメソッドと一般的な視覚言語モデルの両方を上回っている。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:39:51 GMT)
Learn or Recall? Revisiting Incremental Learning with Pre-trained Language Models [22.0] 殆どの人は、破滅的な忘れが優れたIL性能を達成するための最大の障害であると仮定している。
PLMを用いたILのためのSEQ*と呼ばれるフラストレーションに簡単な手法を提案する。
その結果,SEQ* は最先端 (SOTA) IL 法と比較して,競争力や性能に優れていた。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:53:32 GMT)
Accurate LoRA-Finetuning Quantization of LLMs via Information Retention [21.9] 本稿では,LoRAを用いて量子化LLMを情報保持により高精度にプッシュする新しいIR-QLoRAを提案する。
実験の結果、IR-QLoRA は LLaMA と LLaMA2 の2-4ビット幅での精度を大幅に向上できることがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:20:35 GMT)
Understanding Forgetting in Continual Learning with Linear Regression [21.9] 連続的な学習は、複数のタスクを逐次学習することに焦点を当てており、近年大きな注目を集めている。
線形回帰モデルにおいて, 線形回帰モデルをグラディエント・ディッセンス(Gradient Descent)を用いて, 忘れることの一般的な理論的解析を行う。
十分なデータサイズを考慮に入れれば、集団データ共分散行列の固有値が大きいタスクが後で訓練されるようなシーケンス内のタスクの配置は、忘れが増す傾向にあることを実証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:33:37 GMT)
Glauber Generative Model: Discrete Diffusion Models via Binary Classification [21.8] 離散拡散モデルの新しいクラスであるグラウバー生成モデル(GGM)を紹介する。
GGMはマルコフ連鎖を展開させ、離散トークンの共分散からサンプルにノイズトークンの列を分解する。
言語生成や画像生成において,既存の離散拡散モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:42:13 GMT)
Can Large Language Models Faithfully Express Their Intrinsic Uncertainty in Words? [21.8] 大規模言語モデル(LLM)は,自然言語における本質的な不確実性を表現できることが示唆された。
我々は、モデル固有のアサーションに対する信頼のギャップと、それらが伝達される決定性に基づいて、忠実な応答の不確実性を定式化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:56:23 GMT)
Simultaneous Deep Learning of Myocardium Segmentation and T2 Quantification for Acute Myocardial Infarction MRI [21.2] 本稿では,TransformerとConvolutional Neural Network(CNN)を統合したデュアルタスクネットワークであるSQNetを提案する。
SQNetは、定量分析のためのT2リファインフュージョンデコーダを備え、Transformerのグローバル機能を活用している。
タイトな結合モジュールは、CNNとTransformerブランチの機能を調整してヒューズし、SQNetが心筋領域に集中できるようにする。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:20:06 GMT)
ContrastAlign: Toward Robust BEV Feature Alignment via Contrastive Learning for Multi-Modal 3D Object Detection [21.1] 異種モダリティのアライメントを高めるための新しいContrastAlignアプローチを提案する。
MAPは70.3%であり, nuScenes 検証セットでは BEVFusion を 1.8% 上回っている。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:43:12 GMT)
Demystifying amortized causal discovery with transformers [21.1] 観測データからの因果発見のための教師付き学習アプローチは、しばしば競争性能を達成する。
本研究では,CSIvAについて検討する。CSIvAは,合成データのトレーニングと実データへの転送を約束するトランスフォーマーモデルである。
既存の識別可能性理論とギャップを埋め、トレーニングデータ分布の制約がテスト観測の事前を暗黙的に定義していることを示します。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:17:49 GMT)
WASH: Train your Ensemble with Communication-Efficient Weight Shuffling, then Average [21.0] ウェイト平均化手法は、アンサンブルの一般化と単一モデルの推論速度のバランスをとることを目的としている。
WASHは,最新の画像分類精度を実現するために,平均化のためのモデルアンサンブルを学習するための新しい分散手法である。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:02:57 GMT)
FlexiDreamer: Single Image-to-3D Generation with FlexiCubes [20.9] FlexiDreamerは、マルチビュー生成イメージから高品質なメッシュを直接再構築する新しいフレームワークである。
提案手法では,1つの画像から3次元の下流タスクにおいて,約1分で高忠実度3Dメッシュを生成することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:51:37 GMT)
R-ODE: Ricci Curvature Tells When You Will be Informed [20.8] 情報拡散予測は、オンラインソーシャルネットワークの構造と組織を理解するのに不可欠である。
本稿では,RODE(Ricci-curvature Regulation Ordinary Equation)を提案する。
R-ODEのパーソナライズされた時間予測能力を評価し,RODE-が最先端のベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:46:52 GMT)
Federated Learning with Blockchain-Enhanced Machine Unlearning: A Trustworthy Approach [20.7] 我々は、ブロックチェーンをフェデレートされた学習と融合させるフレームワークを導入し、未学習の要求とアクションの不変記録を確実にする。
私たちの重要なコントリビューションは、アンラーニングプロセスの認証機構、データセキュリティとプライバシの強化、データ管理の最適化などです。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:35:49 GMT)
Systematic Literature Review of Commercial Participation in Open Source Software [20.7] 92件の論文を収集し,研究テーマに基づいて整理した。
企業のモチベーションは、主に経済、技術、社会的側面から見出された。
また、商用参加がOSS開発にどのように影響するかについても調査した。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:50:01 GMT)
LEGO: Learning and Graph-Optimized Modular Tracker for Online Multi-Object Tracking with Point Clouds [20.7] 本稿では,データアソシエーション性能を向上させるための学習とグラフ最適化(LEGO)モジュールトラッカーを提案する。
提案するLEGOトラッカーは,グラフ最適化と自己認識機構を統合し,アソシエーションスコアマップを効率的に定式化する。
提案手法は,他のオンライントラッキング手法と比較して,優れた性能を示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:12:50 GMT)
Dual-State Personalized Knowledge Tracing with Emotional Incorporation [20.6] 本稿では,感情内包モデルを用いた二状態パーソナライズド・ナレッジ・トレーシングを提案する。
まず,感情情報を知識状態のモデリングプロセスに組み込んだ結果,知識状態ブースティングモジュールが誕生した。
第2に,学生のパーソナライズされた感情状態を監視するための感情追跡モジュールを設計し,感情予測手法を提案する。
最後に,学生の反応予測を強化するために,予測された感情を適用した。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:39:34 GMT)
MIntRec 2.0: A Large-scale Benchmark Dataset for Multimodal Intent Recognition and Out-of-scope Detection in Conversations [20.5] MIntRec 2.0は、マルチパーティ会話におけるマルチモーダルインテント認識のための大規模なベンチマークデータセットである。
1,245の対話と15,040のサンプルがあり、それぞれが30のきめ細かいクラスからなる新しい意図的分類に注釈付けされている。
各発話における話者の包括的情報を提供し、多人数会話研究に活用する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:14:08 GMT)
Confidence-aware Self-Semantic Distillation on Knowledge Graph Embedding [20.5] 信頼を意識した自己知識蒸留(CSD)はモデル自体から学習し、KGEを低次元空間で強化する。
CSDは、前のイテレーションに埋め込まれた知識を抽出し、次のイテレーションでモデルの学習を監督するために使用される。
特定のセマンティックモジュールは、以前に学習した埋め込みの信頼度を推定することにより、信頼できる知識をフィルタリングする。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:11:10 GMT)
CHAMP: Conformalized 3D Human Multi-Hypothesis Pose Estimators [20.5] CHAMPは2次元キーポイントからシーケンス・ツー・シーケンス・マルチ・ハイプセシスの人間のポーズを学習する新しい方法である。
この結果から, 共形予測フィルタによる仮説に対する単純な平均アグリゲーションを用いることで, 競合する結果が得られることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:42:38 GMT)
BWArea Model: Learning World Model, Inverse Dynamics, and Policy for Controllable Language Generation [20.4] 大規模言語モデル(LLM)は自然言語処理のパラダイムシフトを触媒としているが、制御性の制限は下流アプリケーションにとって大きな課題となっている。
我々は、人間の脳の神経機構、特にBrocaとWernickeの領域からインスピレーションを得て、この問題に対処することを目指している。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:45:49 GMT)
Clip Body and Tail Separately: High Probability Guarantees for DPSGD with Heavy Tails [20.4] Differentially Private Gradient Descent (DPSGD)は、ディープラーニングにおけるトレーニングデータのプライバシを保護するために広く利用されている。
DPSGDは、標準への勾配をクリップし、訓練手順に校正されたノイズを注入する。
本稿では,2つの重要な反復を含む新しい手法であるDPSGDを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:30:11 GMT)
Future You: A Conversation with an AI-Generated Future Self Reduces Anxiety, Negative Emotions, and Increases Future Self-Continuity [20.4] 将来的な自己継続性を改善するために設計された,インタラクティブで簡潔な,単一セッションのディジタルチャット介入である“Future You”を紹介する。
我々のシステムでは、ユーザーは、将来の目標と個人的品質に合わせた、相対性がありながらAIで動くバーチャルバージョンとチャットできる。
フューチャーユー」のキャラクターとの短い対話の後、ユーザーは不安を減らし、将来的な自己継続性を高めたと報告した。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:39:30 GMT)
Finding good policies in average-reward Markov Decision Processes without prior knowledge [19.9] 平均回帰決定(MDP)における$varepsilon$-Optimal Policyの同定を再考する。
直径推定法を用いて,$(varepsilon,delta)$-PAC-PACポリシー識別のための最初のアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:24:14 GMT)
Content-Style Decoupling for Unsupervised Makeup Transfer without Generating Pseudo Ground Truth [19.8] モデルトレーニングを指導する真の目標が存在しないことは、メイクアップ転送タスクの大きな問題の1つである。
既存の手法の多くは擬似基底真理(PGT)によってこの問題に対処している。
本稿では,CSD-MT(Content-Style Decoupled Makeup Transfer)法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:57:40 GMT)
SMR: State Memory Replay for Long Sequence Modeling [19.8] 本稿では並列畳み込み計算における互換性の限界を克服する新しい非再帰的非一様サンプル処理戦略を提案する。
本研究では,学習可能な記憶を利用する状態記憶再生(SMR)を導入し,学習データと異なるサンプリングポイントでの一般化のために,現在の状態を多段階情報で調整する。
自己回帰言語モデリングとLong Range Arenaにおける長距離モデリングタスクの実験は、一連のSSMモデルに対するSMRメカニズムの一般的な効果を実証している。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:53:32 GMT)
ED-Copilot: Reduce Emergency Department Wait Time with Language Model Diagnostic Assistance [19.7] 救急部(ED)では、診断前にトリアージと複数回の検査を行った。
この時間のかかるプロセスは、患者の死亡率、医療ミス、スタッフの燃え尽きなどを引き起こす。
本研究は,人工知能システムを活用した費用対効果診断支援を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:30:46 GMT)
Extended Flow Matching: a Method of Conditional Generation with Generalized Continuity Equation [19.7] 条件生成は 生成モデルの最も重要な応用の1つです
行列場を通して条件生成に帰納バイアスを導入することができることを示す。
条件生成におけるEMFの競争性を支持する実験結果とともに,本理論を提示する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:38:08 GMT)
Accelerating Transformer Pre-training with 2:4 Sparsity [19.6] NVIDIA Ampere GPUは、細粒度の2:4スパース行列乗算を、その密度の高い等価値の2倍の速さで実行することができる。
そこで本研究では,スパース精製ストレートスルー推定器を改良し,温暖化段階における分解係数を推定し,モデルの品質を向上させる3つの手法を提案する。
提案アルゴリズムは,複数の変圧器事前学習タスクにおいて,密集学習アルゴリズムと類似の収束性を実現する一方,変圧器ブロックの異なる形状で実際の加速度を観測することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:34:44 GMT)
Various Lengths, Constant Speed: Efficient Language Modeling with Lightning Attention [19.6] 固定メモリ使用時の各種シーケンス長のトレーニング速度を一定に維持する最初の線形アテンション実装であるLightning Attentionを提案する。
有効性を保ちながら精度を高めるために,我々の雷の注意に合わせた新しいアーキテクチャであるTransNormerLLM(TNL)を導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:38:13 GMT)
Galaxy: A Resource-Efficient Collaborative Edge AI System for In-situ Transformer Inference [19.6] トランスフォーマーベースのモデルは、エッジに多数の強力なインテリジェントなアプリケーションをアンロックした。
従来のデプロイメントアプローチでは、推論ワークロードをリモートクラウドサーバにオフロードする。
我々は、異種エッジデバイスにまたがるリソース壁を壊す、協調的なエッジAIシステムであるGalaxyを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:01:04 GMT)
Advancing Medical Image Segmentation with Mini-Net: A Lightweight Solution Tailored for Efficient Segmentation of Medical Images [19.6] Mini-Netは医療画像用に設計された軽量セグメンテーションネットワークである。
パラメータが38,000未満のMini-Netは、高周波数と低周波数の両方を効率的にキャプチャする。
DRIVE, STARE, ISIC-2016, ISIC-2018, MoNuSegなど,様々なデータセット上でMini-Netを評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:41:48 GMT)
Superpixelwise Low-rank Approximation based Partial Label Learning for Hyperspectral Image Classification [19.5] キャプチャーされたハイパースペクトル画像(HSI)シーンの十分な事前知識は、専門家や自動ラベルシステムに誤ったラベルや曖昧なラベルを提供する可能性がある。
本稿では,新しい超画素単位の低ランク近似(LRA)に基づく部分ラベル学習法,SLAPを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:26:49 GMT)
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations [19.4] 3次元拡散政策(DP3)は、新しい視覚模倣学習手法である。
実験では、DP3は10のデモでほとんどのタスクを処理し、24.2%の相対的な改善でベースラインを超えた。
実際のロボット実験では、DP3は頻繁に行う基準法とは対照的に、安全要件にほとんど違反しない。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:50:22 GMT)
Benchmarking General Purpose In-Context Learning [19.4] インコンテキスト学習(ICL)の能力は、汎用知能の構築にますますアピールしている。
本稿では,GPICLの機能の訓練と評価を目的とした2つのベンチマークを紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:50:42 GMT)
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning [19.2] Generative Trajectory Augmentation (GTA) は、トラジェクトリを高次かつ動的に検証可能なように拡張することで、オフラインデータを豊かにするように設計されている。
以上の結果から,GTAは汎用データ拡張戦略として,高密度かつ疎度な報酬設定において,広く使われているオフラインRLアルゴリズムの性能を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:55:45 GMT)
Training Language Models to Generate Text with Citations via Fine-grained Rewards [19.2] 大型言語モデル(LLM)は幻覚を起こす傾向があり、信頼できる情報源への参照が欠如しているため、その応答は信頼性に欠けることが多い。
本研究では,LLMに高い支援力と関連性のある引用を生成するための,微粒な報酬を用いた効果的な学習フレームワークを提案する。
LLaMA-2-7Bでは、細粒度の報酬がGPT-3.5-turboを上回り、ベースラインの中で最高の性能を達成している。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:32:15 GMT)
Fast Samplers for Inverse Problems in Iterative Refinement Models [19.1] 逆問題に対する効率的なサンプル作成のためのプラグイン・アンド・プレイフレームワークを提案する。
提案手法は,5段階の条件付きサンプリングステップで高品質なサンプルを生成でき,20~1000段の基準ラインよりも優れる。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:50:16 GMT)
Ensembling Diffusion Models via Adaptive Feature Aggregation [18.9] より強力な生成能力を生み出すために複数の高品質モデルを活用することは価値があるが、広く研究されていない。
既存のメソッドは主にパラメータマージ戦略を採用して、新しい静的モデルを生成する。
本稿では,様々な状態に応じて複数のモデルのコントリビューションを動的に調整するアダプティブ・フィーチャー・アグリゲーション(AFA)を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:55:35 GMT)
BeamVQ: Aligning Space-Time Forecasting Model via Self-training on Physics-aware Metrics [18.7] 本研究では、ベクトル量子化(BeamVQ)によるemphBeam探索を提案し、データ駆動時空予測モデルの物理的アライメントを強化する。
BeamVQは、物理を意識したメトリクスでフィルタリングされた自己生成サンプルのモデルを訓練する。
実験によると、BeamVQは5つのデータセットで10のバックボーンに対して平均的な統計スキルスコアを32%以上向上させただけでなく、物理学を意識したメトリクスを大幅に強化した。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:07:47 GMT)
GarmentCodeData: A Dataset of 3D Made-to-Measure Garments With Sewing Patterns [18.5] 縫製パターンを用いた3次元計測服の大規模合成データセットについて述べる。
GarmentCodeDataには115,000のデータポイントがあり、さまざまなデザインをカバーしている。
高速なXPBDシミュレータに基づくオープンソースの3D衣料ドレーピングパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:14:46 GMT)
OED: Towards One-stage End-to-End Dynamic Scene Graph Generation [18.4] ダイナミックシーングラフ生成(DSGG)は、ビデオの空間時間領域内の視覚的関係を特定することに焦点を当てている。
本稿では,DSGGパイプラインを合理化する一段階のエンドツーエンドフレームワークOEDを提案する。
このフレームワークは、設定された予測問題としてタスクを再構成し、ペアワイズ機能を活用してシーングラフ内の各対象物対を表現する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:18:41 GMT)
Gradients of Functions of Large Matrices [18.4] 数値線形代数のワークホースを効率的に区別する方法を示す。
以前は知られていなかったLanczosとArnoldiのイテレーションのアジョイントシステムをJAXで実装し、結果として得られるコードがDiffraxと競合することを示す。
これらはすべて、問題固有のコードなしで実現されます。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:39:45 GMT)
How Do Recommendation Models Amplify Popularity Bias? An Analysis from the Spectral Perspective [18.2] 勧告システム(RS)は、しばしば人気バイアスに悩まされる。
本研究は,本現象の根本原因を明らかにするための包括的実験および理論的解析を行う。
本稿では、スペクトルノルム正規化器を利用して主特異値の大きさをペナルティ化する新しいデバイアスング戦略を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:28:57 GMT)
Finding and Exploring Promising Search Space for the 0-1 Multidimensional Knapsack Problem [18.2] 我々は,0-1 MKPを解くために,進化計算と正確なアルゴリズムを組み合わせた新しいアルゴリズムを提案する。
一連のソリューションを維持し、人口の情報を利用して、優れた部分的な割り当てを抽出する。
既存のアルゴリズムよりも優れた解を見つけ、大規模で難しい10のインスタンスに新しい下位境界を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:19:04 GMT)
Hacking Task Confounder in Meta-Learning [18.2] 本稿では,メタ学習コーサル表現(MetaCRL)を提案する。
我々の研究は、ベンチマークデータセット上での最先端(SOTA)性能を達成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:29:21 GMT)
E2USD: Efficient-yet-effective Unsupervised State Detection for Multivariate Time Series [18.0] 本稿では,効率的な非教師付き状態検出を可能にするE2Usdを提案する。
E2UsdはFast Fourier TransformベースのTime SeriesとDecomposed Dual-view Embedding Moduleを利用している。
また,偽陰性の影響を抑えるために,偽陰性キャンセレーションコントラスト学習法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:14:20 GMT)
O$n$ Learning Deep O($n$)-Equivariant Hyperspheres [18.0] 我々は、$n$Dの反射と回転の変換の下で、深い特徴同変を学習するためのアプローチを提案する。
すなわち、任意の次元$n$に一般化する球面決定曲面を持つ O$(n)$-同変ニューロンを提案する。
我々は理論的貢献を実験的に検証し、O$(n)$-equivariantベンチマークデータセットの競合する手法よりもアプローチの方が優れていることを発見した。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:50:10 GMT)
CARL: A Framework for Equivariant Image Registration [18.0] 画像登録は、一対の画像間の空間対応を推定する。
形式的には、推定子は所望の画像変換のクラスに同値であるべきである。
本稿では,多段階$[W,U]$等分散を座標アテンション機構と変位予測層を併用して実現する方法を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:06:58 GMT)
Empowering Large Language Models to Set up a Knowledge Retrieval Indexer via Self-Learning [17.8] Pseudo-Graph Retrieval-Augmented Generation (PG-RAG) という事前検索フレームワークを提案する。
PG-RAGは、LLMを学生として、豊富な原材料を提供することで概念化している。
PG-RAGは、検索フェーズの間、ノートをめくると人間の行動を模倣する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:26:45 GMT)
Stop! In the Name of Flaws: Disentangling Personal Names and Sociodemographic Attributes in NLP [17.7] 名前と命名に関する学際的背景を示す。
社会デマログラフィーの属性と名前の関連付けに固有の問題を調査する。
我々は、妥当性と倫理的落とし穴を避けるために、規範的な勧告とともに指針質問を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:33:29 GMT)
Exploring the Impact of Synthetic Data for Aerial-view Human Detection [17.4] 航空ビューによる人間の検出は、より多様な人間の外観を捉えるために、大規模なデータに対する大きな需要がある。
合成データはデータを拡張するのに十分なリソースだが、実際のデータとのドメインギャップは、トレーニングで使用する上で最大の障害である。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:22:15 GMT)
Universal Adversarial Defense in Remote Sensing Based on Pre-trained Denoising Diffusion Models [17.3] 深部ニューラルネットワーク(DNN)は、地球観測のための多数のAIアプリケーション(AI4EO)において重要なソリューションとして注目されている。
本稿では、リモートセンシング画像(UAD-RS)における新しいユニバーサル・ディフェンス・アプローチを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:23:21 GMT)
$\text{Di}^2\text{Pose}$: Discrete Diffusion Model for Occluded 3D Human Pose Estimation [17.3] 本稿では,3次元ポーズ推定のための新しいフレームワークであるDigital Diffusion Pose(textDi2textPose$)を紹介する。
$textDi2textPose$は2段階のプロセスを採用している。
この方法論的な革新は、物理的に実行可能な構成への探索空間を限定的に制限する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:01:36 GMT)
FreeTuner: Any Subject in Any Style with Training-free Diffusion [17.2] FreeTunerは、フレキシブルでトレーニングのない、作曲のパーソナライズのためのメソッドで、任意のユーザが提供する対象を、ユーザが提供するスタイルで生成することができる。
提案手法では, 生成過程を2段階に分けて, 概念の絡みを効果的に緩和する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:14:02 GMT)
A One-Layer Decoder-Only Transformer is a Two-Layer RNN: With an Application to Certified Robustness [17.1] ARC-Tranは、任意の摂動空間に対してデコーダのみの変換器の堅牢性を検証する新しい手法である。
本評価の結果,ARC-Tran 列車は既存の手法よりも任意の摂動空間に頑健なモデルであることがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:10:04 GMT)
FinRobot: An Open-Source AI Agent Platform for Financial Applications using Large Language Models [16.8] FinRobotは、複数の金融専門のAIエージェントをサポートする、オープンソースのAIエージェントプラットフォームである。
FinRobotは、高度な財務分析に強力なAI技術を利用するために、プロ級のアナリストとレイパーの両方にハンズオンを提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:43:42 GMT)
WirelessLLM: Empowering Large Language Models Towards Wireless Intelligence [16.7] 大規模言語モデル(LLM)は、無線通信システムに革命をもたらす可能性への関心を喚起している。
無線システム用LLMの既存の研究は、通信言語理解の直接的な応用に限られている。
本稿では,無線通信ネットワークのユニークな課題と要件に対処するため,LLMの適応と拡張のための総合的なフレームワークである WirelessLLM を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:18:25 GMT)
Variational DAG Estimation via State Augmentation With Stochastic Permutations [16.6] ベイズネットワークの構造を観測データから推定することは統計的かつ計算的に難しい問題である。
確率的推論の観点から、主な課題は(i) DAG 制約を満たすグラフ上の分布を表すこと、(ii) 基礎空間上の後方を推定することである。
そこで本稿では,DAGと置換の強化空間上に共同分布を定式化することにより,これらの課題に対処するアプローチを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:25:19 GMT)
Policy Space Response Oracles: A Survey [16.4] この調査は、Physal Space Response Oracles (PSRO)として知られる大規模なゲームのためのフレームワークの概要を提供する。
PSROは,戦略の十分なサブセットに注目することで,スケーラビリティ向上を約束している。
我々はPSROの戦略探索問題に焦点をあてる: 計算コストを最小に抑えながらオリジナルのゲームを表現する戦略の効果的なサブセットを組み立てることの課題である。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:49:18 GMT)
Conditioning on Time is All You Need for Synthetic Survival Data Generation [16.4] 本稿では,イベント時間に条件付き共変数を生成し,インジケータを検閲することにより,合成生存データを生成するための簡単なパラダイムを提案する。
提案手法は,サバイバルデータの生成において,複数の競争ベースラインを上回りながら,トレーニングした下流サバイバルモデルの性能を向上し,実データでテストする。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:34:18 GMT)
Aligning LLMs through Multi-perspective User Preference Ranking-based Feedback for Programming Question Answering [16.4] Code Community Question Answering (CCQA)は、プログラミング関連の問題に取り組み、ソフトウェア工学と学術研究の生産性を高める。
RLHF(Reinforcement Learning from Human Feedback)の最近の進歩は、Large Language Models(LLM)の微調整プロセスを変え、人間の振る舞いを忠実に模倣する応答を生み出している。
本稿では,マルチパースペクティブなユーザ嗜好ランク付けに基づくプログラミング質問回答(ALMupQA)に基づくALMupQA(Aligning LLMs)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:21:31 GMT)
Convolutional Neural Networks Rarely Learn Shape for Semantic Segmentation [16.3] 形状学習は、対象物体が特定の形状を持つ場合、畳み込みニューラルネットワーク(CNN)の望ましい特性である可能性がある。
我々は,CNNが形状情報を利用する範囲を測定するための新しい行動指標を提案する。
我々は、CNNが典型的な設定で形状を学習するのではなく、興味のある対象を特定するために利用可能な他の機能に依存していると結論付けている。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:11:00 GMT)
Privacy-Aware Visual Language Models [16.3] 本稿では,プライバシに敏感な情報を扱うVisual Language Modelの理解を深めることを目的としている。
パスポートや指紋などの8つの機密カテゴリの画像を含む新しいベンチマークであるPrivBenchを導入する。
このベンチマークで10の最先端のVLMを評価し、一般的にはプライバシの理解が限定されていることを観察し、モデル改善のための重要な領域を強調した。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:25 GMT)
Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents [16.2] LLM(Large Language Models)は、高レベルの命令を提供することによって、シーケンシャルな意思決定タスクに対処することができる。
LLMは、特にリアルタイムな動的環境において、特定のターゲット問題に対処する専門性を欠いている。
LLMベースの教師エージェントからの指示を用いて、より小規模で専門的なRLエージェントを訓練することで、これらの課題に対処する新しいフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:00:23 GMT)
Learning with User-Level Local Differential Privacy [16.2] まず、平均推定問題を解析し、最適化、分類、回帰に応用する。
特に、すべてのプライバシレベルで最適なパフォーマンスを達成するための適応戦略を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:52:24 GMT)
Understanding differences in applying DETR to natural and medical images [16.2] トランスフォーマーベースの検出器は、自然画像を用いたコンピュータビジョンタスクで成功している。
医用画像データには、非常に大きな画像サイズ、興味の少ない領域の小さい領域、微妙な違いによってのみ区別できるオブジェクトクラスなど、固有の課題がある。
本研究は, 検診用マンモグラフィーデータセットに適用した場合に, これらのトランスフォーマーに基づく設計選択の適用性を評価するものである。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:06:42 GMT)
Scalable Visual State Space Model with Fractal Scanning [16.1] State Space Models (SSM) はTransformerモデルの効率的な代替品として登場した。
本稿では, フラクタル走査曲線を用いたパッチシリアライゼーションを提案する。
画像分類,検出,セグメンテーションタスクにおいて,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:26:47 GMT)
SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.1] 本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:55:18 GMT)
Exploring Fairness in Educational Data Mining in the Context of the Right to be Forgotten [16.0] 教育データマイニング(EDM)コミュニティでは、機械学習が教育上の課題に対処するパターンや構造を発見することに成功している。
忘れられる権利の需要が高まっているため、機密データとその影響を忘れる機械学習モデルの必要性が高まっている。
予測精度を維持しつつ,学習モデルの公平性を損なうような,新たな選択的忘れ攻撃のクラスを導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:35:50 GMT)
Leveraging Offline Data in Linear Latent Bandits [16.0] 我々は、$textitevery$ exchangeable and coherent stateless decision process is a latent bandit.
本稿では,この部分空間を短いオフライン軌道から保証付きで学習する方法を提案する。
LOCAL-UCBとProBALL-UCBの2つの方法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:23:34 GMT)
TAGA: Text-Attributed Graph Self-Supervised Learning by Synergizing Graph and Text Mutual Transformations [15.9] Text-Attributed Graphs (TAG)は、自然言語記述によるグラフ構造を強化する。
本稿では,TAGの構造的・意味的次元を統合した,新たな自己教師型学習フレームワークであるText-And-Graph Multi-View Alignment(TAGA)を紹介する。
本フレームワークは,8つの実世界のデータセットを対象としたゼロショットおよび少数ショットシナリオにおいて,強力なパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:40:16 GMT)
Causal Bayesian Optimization via Exogenous Distribution Learning [15.8] 既存の因果ベイズ最適化(CBO)法は、報酬を最大化するために因果構造を変更するハード介入に依存する。
学習内因性分布を利用した新しいCBO法を開発した。
異なるデータセットとアプリケーションの実験により,提案手法の利点が示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:03:07 GMT)
Occlusion Handling in 3D Human Pose Estimation with Perturbed Positional Encoding [15.8] 固有基底から一貫した正規成分を抽出する新しい位置符号化手法PerturbPEを提案する。
実験結果では,Human3.6Mデータセットで最大12%のパフォーマンス向上が観測された。
我々の新しいアプローチは、2つのエッジが欠落しているシナリオのパフォーマンスを大幅に向上させ、最先端のベンチマークを新たに設定する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:48:54 GMT)
THREAD: Thinking Deeper with Recursive Spawning [15.8] 大規模言語モデル(LLM)のための思考再帰的・動的(ThReaD)を提案する。
ThReaDは、実行のスレッドとしてモデル生成をフレーム化し、コンテキストに基づいて、完了まで実行したり、新しいスレッドを動的に生成することができる。
我々は、エージェントタスクの多様なベンチマークとデータ基底型質問応答を用いて、数ショットの学習アプローチを用いて実装されたTHREADをテストする。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:51:24 GMT)
Infrared Image Super-Resolution via Lightweight Information Split Network [15.8] LISN(Lightweight Information Split Network)と呼ばれる,新しい,効率的で高精度な単一赤外線画像SRモデルを提案する。
LISNは、浅部特徴抽出、深部特徴抽出、高密度特徴融合、高分解能赤外線画像再構成の4つの主要成分からなる。
このモデルにおける重要な革新は、深い特徴抽出のための軽量情報分割ブロック(LISB)の導入である。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:18:13 GMT)
INSIGHT: End-to-End Neuro-Symbolic Visual Reinforcement Learning with Language Explanations [15.5] 構造化状態と象徴的政策を共同で学習するための枠組みを提案する。
鍵となるアイデアは、ビジョン基礎モデルをスケーラブルな知覚モジュールに蒸留し、ポリシー学習中にそれを洗練することだ。
我々はまた、大きな言語モデルを用いてポリシーや決定のための言語説明を生成するパイプラインを設計する。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:30:01 GMT)
Guiding Enumerative Program Synthesis with Large Language Models [15.5] 本稿では,形式的合成ベンチマークを解くための大規模言語モデルの能力を評価する。
ワンショット合成が失敗すると,新しい列挙合成アルゴリズムを提案する。
形式的合成のためのスタンドアロンツールとしてGPT-3.5は,最先端の形式的合成アルゴリズムにより容易に性能が向上することがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:18:40 GMT)
Survival of the Fittest Representation: A Case Study with Modular Addition [15.5] ニューラルネットワークが、タスクを解決するために、異なる表現間で「選択」する方法について検討する。
高い初期信号と勾配の周波数である「最適」が生き残る可能性が高くなる。
種間の力学を記述するロトカ・ボルテラ方程式に着想を得た結果、円の力学は線形微分方程式の集合によってうまく特徴づけられることが判明した。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:04 GMT)
PyGS: Large-scale Scene Representation with Pyramidal 3D Gaussian Splatting [15.4] 我々はNeRF初期化によるピラミッド型3次元ガウススプラッティング(PyGS)を提案する。
我々はこれらのピラミッドのガウスをクラスタに分類し、各クラスタのピラミッドレベルの影響を動的に決定するために、コンパクトな重み付けネットワークを使用する。
提案手法は,複数の大規模データセットにまたがる大幅な性能向上を実現し,現在の最先端手法の400倍以上のレンダリング時間を実現する。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:52:21 GMT)
Consistency Regularisation for Unsupervised Domain Adaptation in Monocular Depth Estimation [15.3] 整合性に基づく半教師付き学習問題として,単眼深度推定のための教師なし領域適応を定式化する。
複数の拡張ビューにまたがって一貫性を保ちながら、ソースドメイン上の予測を規則化するペアワイズ損失関数を導入する。
実験では, KITTI と NYUv2 の標準深度推定ベンチマークを用いて,最先端の結果を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:32:06 GMT)
Entity Alignment with Noisy Annotations from Large Language Models [15.2] 我々は,大規模言語モデル(LLM)をエンティティアライメント(EA)に有効活用する統一フレームワーク LLM4EA を提案する。
具体的には、最も価値の高いエンティティを優先順位付けすることで、アノテーション空間を大幅に削減するために、新しいアクティブな学習ポリシーを設計する。
基本EAモデルからのフィードバックに基づいて、ポリシーを反復的に最適化します。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:52:55 GMT)
Exploring the Performance of Continuous-Time Dynamic Link Prediction Algorithms [14.8] ダイナミックリンク予測(DLP)は、進化するネットワークにおける将来のリンクの予測に対処する。
本研究では,このような総合的な評価を行うためのツールをコントリビュートする。
評価時に使用可能な陰性サンプリング手法の網羅的な分類法について述べる。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:03:28 GMT)
SCAFFLSA: Taming Heterogeneity in Federated Linear Stochastic Approximation and TD Learning [14.7] 我々は,FedLSAの通信複雑性が,所望の精度の逆でスケールすることを示した。
重要な発見は、Scaffnewの既存の結果と比較して、サンプルの複雑さはエージェント数の逆でスケールするということである。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:13:02 GMT)
InversionView: A General-Purpose Method for Reading Information from Neural Activations [14.6] この情報は、同様のアクティベーションを引き起こす入力のサブセットによって具現化されていると我々は主張する。
InversionViewを提案し、アクティベーションに条件付きトレーニングされたデコーダモデルからサンプリングすることで、このサブセットを実際に検査することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:53:22 GMT)
On Fairness of Low-Rank Adaptation of Large Models [14.5] 大規模モデルの低ランク適応、特にLoRAは、その計算効率のために勢いを増している。
LoRAが実用性、キャリブレーション、および異なるサブグループ間でのメンバシップ推論に対する抵抗に未検討の影響があるかどうかを問う。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:37:43 GMT)
Human-in-the-loop: Towards Label Embeddings for Measuring Classification Difficulty [14.5] 教師付き学習では、トレーニングプロセスの第1段階、つまりアノテーションフェーズにおいて、すでに不確実性が発生する可能性がある。
この研究の主な考え方は、基礎となる真理ラベルの仮定を捨て、代わりにアノテーションを多次元空間に埋め込むことである。
本稿では,複数のアノテータが独立してインスタンスをラベル付けする,様々な状況に展開する手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:53:01 GMT)
Leveraging Unknown Objects to Construct Labeled-Unlabeled Meta-Relationships for Zero-Shot Object Navigation [14.3] ゼロショットオブジェクトナビゲーション(ZSON)は、エージェントがトレーニングセットに存在しない未確認オブジェクトにナビゲートする状況に対処する。
ラベルのない物体を訓練手順に導入し、エージェントの知識基盤を識別可能だが、これまで見過ごされていた情報で強化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:39:39 GMT)
CoSLight: Co-optimizing Collaborator Selection and Decision-making to Enhance Traffic Signal Control [14.1] 既存の作業は主に近隣の交差点を協力者として選択している。
我々は,共同作業者選択を学習すべき第2の方針として分離することを提案する。
具体的には、リアルタイムで選択ポリシーは、フェーズレベルと交差点レベルの特徴に応じて、最適なチームメイトを適応的に選択する。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:26:59 GMT)
Towards Human-AI Complementarity with Predictions Sets [14.1] 予測セットに基づく意思決定支援システムは、人間の専門家が分類タスクを解くのに役立つことが証明されている。
共形予測を用いて構築された予測集合は、一般に平均精度の点で準最適であることを示す。
我々は,多種多様な専門家モデルと非最適スコアに対して,同等あるいはより優れた性能を提供する予測セットを見つけることが保証される,欲求的アルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:00 GMT)
Timely Fusion of Surround Radar/Lidar for Object Detection in Autonomous Driving Systems [14.0] レーダーとライダーセンサーのデータは、その補完的な利点を十分に活用し、周囲をより正確に再現することができる。
既存のレーダ/リダ融合法は、サラウンドレーダの低周波で動作する必要がある。
本稿では,Radar/Lidar周辺を高速なLidarのみに制限された作業周波数でヒューズする手法を開発した。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:09:43 GMT)
Symmetric Reinforcement Learning Loss for Robust Learning on Diverse Tasks and Model Scales [13.8] 強化学習(RL)トレーニングは、移動目標や高勾配分散などの要因により本質的に不安定である。
本研究では,雑音データに対する教師付き学習から逆クロスエントロピー(RCE)を適用し,対称的なRL損失を定義することにより,RLトレーニングの安定性を向上させる。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:28:33 GMT)
A Cross-Dataset Study for Text-based 3D Human Motion Retrieval [13.7] すべてのデータセットに対して統一的なSMPLボディフォーマットを採用しており、1つのデータセットでトレーニングを実行し、もう1つのデータセットでテストし、データセットの組み合わせでトレーニングすることができます。
以上の結果から,HumanML3D,KIT Motion-Language,BABELなどの標準テキストモーションベンチマークにはデータセットバイアスが存在することが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:58:20 GMT)
F-3DGS: Factorized Coordinates and Representations for 3D Gaussian Splatting [13.7] ニューラルレイディアンス場(NeRF)のレンダリング手法の代替として,F3DGS(Facterized 3D Gaussian Splatting)を提案する。
F-3DGSはレンダリング画像に匹敵する品質を維持しながら、ストレージコストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:55:49 GMT)
Perceiving Longer Sequences With Bi-Directional Cross-Attention Transformers [13.5] BiXTは、計算コストとメモリ消費の観点から、入力サイズと線形にスケールする。
BiXTはPerceiverアーキテクチャにインスパイアされているが、反復的な注意を効率よく双方向のクロスアテンションモジュールに置き換える。
効率性とフルトランスフォーマーアーキテクチャの汎用性と性能を組み合わせることで、BiXTはより長いシーケンスを処理できる。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:56:01 GMT)
OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators [13.4] オフライン政策評価(OPE)により、新たなシーケンシャルな意思決定方針のパフォーマンスを評価し、見積もることができる。
統計的手法を用いた明示的な選択に頼ることなく,データセットに与えられたOPE推定器の集合を適応的にブレンドするアルゴリズムを提案する。
我々の研究は、オフラインRLのための汎用的、推定対象に依存しない、非政治評価フレームワークの使いやすさの向上に寄与する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:51:20 GMT)
NuwaTS: a Foundation Model Mending Every Incomplete Time Series [13.4] 時系列計算のための言語訓練フレームワークであるNuwaTSを紹介する。
NuwaTSは、欠落したパターンを持つ任意のドメインからの不完全な時系列上の計算タスクに適用することができる。
既存のドメイン固有モデルよりも優れた1対全計算モデルを得る。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:01:44 GMT)
Model-Agnostic Zeroth-Order Policy Optimization for Meta-Learning of Ergodic Linear Quadratic Regulators [13.3] エルゴード線形二次規制器における不確実性と不均一性を扱うためにメタラーニングを用いることの問題点について検討する。
本稿では,不均一だが類似の線形力学系を学習するタスクに適用可能なポリシヘシアンの推定を省略するアルゴリズムを提案する。
メタオブジェクトの勾配の有界性と滑らかさを解析することにより、正確な勾配降下過程の収束結果を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:26:36 GMT)
Faithful Attention Explainer: Verbalizing Decisions Based on Discriminative Features [13.3] 本稿では,参加機能に関する忠実なテキスト説明を生成できるフレームワークであるFAEを提案する。
提案モデルでは,キャプションの品質指標と,2つのデータセットに対する忠実な意思決定関連指標において,有望な性能を実現する。
また,FAEは,人間の目が人間の意思決定に使用する差別的特徴を示すため,視線に基づく人間の注意を解釈できることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:20:52 GMT)
Reference Neural Operators: Learning the Smooth Dependence of Solutions of PDEs on Geometric Deformations [13.2] 任意の形状の領域上の偏微分方程式に対して、ニューラル作用素の既存の研究は、幾何学から解への写像を学ぼうとする。
本稿では、幾何学的変形に対する解の滑らかな依存を学習するために、参照ニューラル演算子(RNO)を提案する。
RNOはベースラインモデルの精度を大きなリードで上回り、最大80%のエラー低減を達成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:50:17 GMT)
Avoiding Pitfalls for Privacy Accounting of Subsampled Mechanisms under Composition [13.2] 我々は、サブサンプルの差分秘密機構の構成に対する厳密なプライバシー保証の計算の問題を考える。
近年のアルゴリズムでは、プライバシーパラメータを任意の精度で数値計算できるが、慎重に適用する必要がある。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:30:12 GMT)
Leveraging Logical Rules in Knowledge Editing: A Cherry on the Top [13.0] 知識編集(KE)におけるマルチホップ質問回答(MQA)は,大規模言語モデル(LLM)において重要な課題である
本稿では, RULE-KE をベースとした知識編集フレームワーク RULE-KE を提案する。
既存のデータセットと新しいデータセットを用いた実験的評価では、RULE-KEはパラメータベースのソリューションとメモリベースのソリューションの両方のパフォーマンスを、それぞれ92%と112.9%に向上させる。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:24:59 GMT)
EASI-Tex: Edge-Aware Mesh Texturing from Single Image [12.9] 本稿では,オブジェクトのテクスチャを与えられた3Dメッシュオブジェクトにシームレスに転送する条件付き拡散モデルを用いて,単一画像に対する新しいアプローチを提案する。
2つの対象が同じ圏に属しているとは仮定せず、たとえそうであるとしても、その割合と部分比で相違があると仮定する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:46:22 GMT)
A Recipe for Unbounded Data Augmentation in Visual Reinforcement Learning [12.9] Q$-learningアルゴリズムは、視覚的な観察からトレーニングされた時に、過度に適合し、不安定を訓練する傾向がある。
そこで本研究では,より広範に拡張可能な一般化されたレシピであるSADAを提案する。
提案手法は,RLエージェントのトレーニング安定性と一般化を,多種多様な拡張セットで大幅に向上させる。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:58:23 GMT)
AI-based analysis of super-resolution microscopy: Biological discovery in the absence of ground truth [12.9] 超解像顕微鏡への弱教師付きパラダイムの適用と、細胞内高分子とオルガネラのナノスケールアーキテクチャの迅速な探索を可能にする可能性について述べる。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:31:37 GMT)
Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization [12.9] 大規模言語モデル(LLM)は、特定のクエリに対する不正確な応答を生成する傾向がある。
我々は, LLMのトークン化に挑戦するために, $textbfADT (TokenizerのAdrial dataset)$という逆データセットを構築した。
GPT-4o, Llama-3, Qwen2.5-maxなど, 先進LLMのトークン化に挑戦する上で, 当社のADTは極めて有効であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:39:59 GMT)
3D Reconstruction with Fast Dipole Sums [12.9] マルチビュー画像から高忠実度表面を再構成する手法を提案する。
本手法では,点雲内の点当たりの属性を任意のものにするために,巻線数を一般化する双極子和という新しい点ベース表現を用いる。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:23:25 GMT)
LoReTrack: Efficient and Accurate Low-Resolution Transformer Tracking [12.7] 低分解能トランストラッカー(LoReTrack)
256x256解像度のLoReTrackは、同じ解像度のベースラインを一貫して改善し、384x384高解像度のTransformerトラッカーと比較して、競争力またはさらに良い結果を示す。
128x128の解像度で、LaSOT/LaSOTextで64.9%/46.4%のSUCスコアを持つCPU上で25fpsで動作する。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:19:04 GMT)
P4: Towards private, personalized, and Peer-to-Peer learning [12.6] パーソナライズの主な課題は、クライアントクラスタリングとデータのプライバシである。
P4(Personalized Private Peer-to-Peer)は、各クライアントがパーソナライズされたモデルを受け取ることを保証する手法である。
P4は微分プライベートP2Pの最先端性能を最大40%向上させる。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:04:37 GMT)
Controllable Longer Image Animation with Diffusion Models [12.6] 動画拡散モデルを用いた動き先行画像を用いたオープンドメイン制御可能な画像アニメーション手法を提案する。
本手法は動画から運動場情報を抽出することにより移動領域の運動方向と速度を正確に制御する。
本稿では,画像アニメーションタスクに特化して最適化されたノイズ再スケジュールに基づく,効率的な長周期ビデオ生成手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:08:00 GMT)
SDL-MVS: View Space and Depth Deformable Learning Paradigm for Multi-View Stereo Reconstruction in Remote Sensing [12.5] マルチビューステレオタスクにおける変形性学習手法を再検討し、ビュースペースと深さ変形性学習(SDL-MVS)に基づく新しいパラダイムを提案する。
我々のSDL-MVSは、異なる視点空間における特徴の変形可能な相互作用を学習し、高精度な深さ推定を可能にするために、深さ範囲と間隔を変形的にモデル化することを目的としている。
LuoJia-MVSとWHUデータセットの実験により、我々のSDL-MVSが最先端の性能に達することが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:59:46 GMT)
Listenable Maps for Zero-Shot Audio Classifiers [12.4] 我々はZero-Shotコンテキストで初めてLMAC-Z(Listenable Maps for Audio)を紹介した。
提案手法は,異なるテキストプロンプトとよく相関する有意義な説明を生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:25:42 GMT)
InterAct: Capture and Modelling of Realistic, Expressive and Interactive Activities between Two Persons in Daily Scenarios [12.3] 我々は、2人の人物がシーケンス全体にわたって現実的なシナリオを実行する241のモーションシーケンスをキャプチャする。
両方の人の音声、身体の動き、表情はすべて、私たちのデータセットでキャプチャされます。
また,音声のみから2人の対話的動きを直接推定する拡散モデルに基づく最初のアプローチを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:32:30 GMT)
Enhancing Adverse Drug Event Detection with Multimodal Dataset: Corpus Creation and Model Development [12.3] 有害薬物イベント(ADEs)の採掘は、患者の安全性を高めるために薬物移動において重要な役割を担っている。
従来のADE検出方法は信頼性が高いが遅く、大規模な操作に容易に適応できない。
以前のADE鉱業研究は、視覚的な手がかりを見越して、テキストベースの方法論に焦点を当ててきた。
我々は、ADE関連テキスト情報を視覚支援と組み合わせたMMADE(MultiModal Adverse Drug Event)検出データセットを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:55:45 GMT)
Efficient Ensembles Improve Training Data Attribution [12.2] トレーニングデータ帰属法は、データ中心AIにおける幅広い応用により、個々のデータポイントがモデル予測に与える影響を定量化することを目的としている。
この分野の既存の手法は、リトレーニングベースとグラデーションベースに分類されるが、有害なトレードオフ帰属効果に苦慮している。
近年の研究では、複数の独立に訓練されたモデルのアンサンブルによる勾配に基づく手法の強化が、より優れた帰属を達成できることが示されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:58:34 GMT)
Exploring Loss Design Techniques For Decision Tree Robustness To Label Noise [12.1] 決定木の堅牢性向上に深層学習損失設計の考え方を応用できるかどうかを検討する。
両手法とも損失補正と対称損失は有効ではないことを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:49:57 GMT)
Gaussian Embedding of Temporal Networks [12.1] TGNE (textbfTemporal textbfGaussian textbfNetwork textbfEmbedding)は、Latent Space Models (LSM)citeHoff2002および時間グラフ機械学習を介してネットワークの統計解析を橋渡しする。
元のグラフを再構成し、不確実性をモデル化するTGNEの有効性を評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:07:57 GMT)
Federating Dynamic Models using Early-Exit Architectures for Automatic Speech Recognition on Heterogeneous Clients [12.0] フェデレートラーニング(Federated Learning)とは、異なるクライアント上でデータをローカルに保ちながら、共有予測モデルを共同で学習するテクニックである。
本稿では, 早期解を用いた動的アーキテクチャを用いて, 入力や動作条件に応じて, その処理を適応させることができることを提案する。
このソリューションは、部分的なトレーニングメソッドの領域に該当し、2つのメリットをもたらす。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:32:37 GMT)
MultiOOD: Scaling Out-of-Distribution Detection for Multiple Modalities [11.9] 我々は,多種多様なデータセットサイズと様々なモダリティの組み合わせを特徴とする,第一種ベンチマークであるMultiOODを紹介する。
我々はまず,既存のOOD検出アルゴリズムをMultiOOD上で評価した。
本稿では,近隣クラスからの情報を活用することで,より広い特徴空間を探索する新しいアウトリー合成手法NP-Mixを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:02 GMT)
Laboratory-Scale AI: Open-Weight Models are Competitive with ChatGPT Even in Low-Resource Settings [11.9] 非営利のクローズドウェイトモデルは、透明性、プライバシ、適応性、証拠の標準の要件と互換性がないと考えています。
GPT-4-Turboをゼロショット、少数ショット、微調整で置き換えるために、より小型でオープンウェイトなモデルを使用することの可能性を評価する。
比較的低い労力、非常に低い絶対的な金銭的コスト、そして微調整のための比較的少ないデータによって、小さなオープンウェイトモデルが競争的なパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:38:10 GMT)
Bivariate Causal Discovery using Bayesian Model Selection [11.7] ベイズ的枠組みに因果仮定を組み込む方法について述べる。
これにより、現実的な仮定でモデルを構築することができます。
その後、幅広いベンチマークデータセットにおいて、従来の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:43:50 GMT)
Any-step Dynamics Model Improves Future Predictions for Online and Offline Reinforcement Learning [11.7] 本稿では,ブートストラップ予測を直接予測に還元することにより,合成誤差を軽減するAny-step Dynamics Model (ADM)を提案する。
ADMは、頻繁なブートストラップなしで将来の状態を予測するための入力として可変長プランを使用することができる。
ADMPO-ONとADMPO-OFFの2つのアルゴリズムを設計し、オンラインおよびオフラインのモデルベースフレームワークにADMを適用する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:33:53 GMT)
RCDN: Towards Robust Camera-Insensitivity Collaborative Perception via Dynamic Feature-based 3D Neural Modeling [11.4] 我々は、新しい堅牢なカメラ非感受性問題、すなわち、失敗したカメラの視点によって引き起こされる問題を克服する方法を導入する。
本稿では,ロバストカメラ非感度協調認識システムであるRCDNと,新しい動的特徴に基づく3Dニューラルモデリング機構を提案する。
コードとデータセットは近く公開されます。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:35:55 GMT)
Tensor and Matrix Low-Rank Value-Function Approximation in Reinforcement Learning [11.3] 値関数近似は強化学習(RL)の中心的な問題である
本稿では、低ランクアルゴリズムを用いてVF行列をオンラインおよびモデルフリーで推定する、擬似非パラメトリック手法を提案する。
VFは多次元である傾向があるため、従来のVF行列表現をテンソル表現に置き換え、PARAFAC分解を用いてオンラインモデルフリーテンソル低ランクアルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:58:52 GMT)
QUB-Cirdan at "Discharge Me!": Zero shot discharge letter generation by open-source LLM [11.2] 本稿では,Llama3 8B量子化モデルを用いて「Brief Hospital Course」と「Discharge Instructions」のセクションを生成する手法を提案する。
我々は、簡潔で文脈的に正確な要約を生成するために、ゼロショット法とRAG(Retrieval-Augmented Generation)を併用する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:55:36 GMT)
LoRA-XS: Low-Rank Adaptation with Extremely Small Number of Parameters [11.2] パラメータ効率向上のための新しいアプローチであるLoRA-XS (Low-Rank Adaptation with eXtremely Small number of parameters)を紹介する。
LoRA-XSは、LoRAと比較して、トレーニング可能なパラメータを7Bモデルで100倍以上削減する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:07:13 GMT)
Interpretable Robotic Manipulation from Language [11.2] 本稿では,操作タスクに特化して設計された,Ex-PERACTという説明可能な行動クローニングエージェントを紹介する。
トップレベルでは、モデルは個別のスキルコードを学ぶことを任務とし、下位レベルでは、ポリシーネットワークは問題をボクセル化されたグリッドに変換し、離散化されたアクションをボクセルグリッドにマップする。
提案手法は,RLBenchベンチマークを用いた8つの操作課題にまたがって評価し,Ex-PERACTが競合する政策性能を達成するだけでなく,複雑な環境下でのヒューマンインストラクションとマシン実行のギャップを効果的に橋渡しすることを示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:02:21 GMT)
Physical Implementability for Reversible Magic State Manipulation [11.2] 本研究では,奇数次元における魔法状態の操作のための可逆的枠組みを提案する。
可逆性を維持することの難しさとコストを特徴付ける物理実装性の概念を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:02:16 GMT)
WeiPer: OOD Detection using Weight Perturbations of Class Projections [11.1] 入力のよりリッチな表現を生成する最終完全連結層にクラスプロジェクションの摂動を導入する。
我々はOpenOODフレームワークの複数のベンチマークで最先端のOOD検出結果を得る。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:38:28 GMT)
Exploring the LLM Journey from Cognition to Expression with Linear Representations [10.9] 本稿では,大規模言語モデル(LLM)における認知的・表現的能力の進化と相互作用について,詳細な検討を行う。
人間のフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)の3つの重要なフェーズにまたがる線形表現を通して、モデルの認知的・表現的能力を定義し、探求する。
SFT, RLHFでは, 認知能力が発達する傾向がみられ, 認知能力が発達する傾向がみられた。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:57:04 GMT)
A Retrospective of the Tutorial on Opportunities and Challenges of Online Deep Learning [10.9] 我々は,ECML PKDD 2023で開催されるオンライン深層学習の機会と課題」と題したチュートリアルを振り返る。
本稿では,ニューラルネットワークをオンライン学習環境に適用する上での潜在的な落とし穴についても概説する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:40:03 GMT)
Sok: Comprehensive Security Overview, Challenges, and Future Directions of Voice-Controlled Systems [10.9] Voice Control Systemsをスマートデバイスに統合することで、セキュリティの重要性が強調される。
現在の研究では、VCSの脆弱性が多数発見され、ユーザのプライバシとセキュリティに重大なリスクが提示されている。
本稿では,VCSの階層的モデル構造を導入し,既存の文献を体系的に分類・分析するための新しいレンズを提供する。
我々は,その技術的原則に基づいて攻撃を分類し,その方法,目標,ベクトル,行動など,さまざまな属性を徹底的に評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:18:46 GMT)
A Large Language Model-based multi-agent manufacturing system for intelligent shopfloor [10.8] 本研究では,知的店舗用大規模言語モデル(LLM)多エージェント製造システムを提案する。
このシステムは多様なエージェントを記述し、それらのメソッドを定義する。
BAとBIAの交渉は、製造資源をつなぐ上で最も重要なステップである。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:10:04 GMT)
Diffusion Bridge AutoEncoders for Unsupervised Representation Learning [10.7] Diffusion Bridge AuteEncoders (DBAE)を導入し、フィードフォワードアーキテクチャを通じてz依存のエンドポイントxT推論を可能にする。
そこで本稿では,DBAEの再構築と生成モデリングを両立させる目的関数を提案し,その理論的正当性について述べる。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:28:17 GMT)
AutoCV: Empowering Reasoning with Automated Process Labeling via Confidence Variation [10.7] 我々は,textbfConfidence textbfVariation (textbftextscAutoCV) を用いた textbf Automated Process Labeling という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:44:24 GMT)
Advancing Spiking Neural Networks towards Multiscale Spatiotemporal Interaction Learning [10.7] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)のエネルギー効率の良い代替品として機能する
我々は、マルチスケールの時間的相互作用情報をキャプチャするスパイキング・マルチスケール・アテンション(SMA)モジュールを設計した。
われわれのアプローチは、主流のニューラルネットワークで最先端の結果を得た。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:11:53 GMT)
Generalized Category Discovery with Large Language Models in the Loop [10.4] トレーニングループにLarge Language Modelを導入する,エンドツーエンドのアクティブラーニングフレームワークであるLoopを提案する。
ループはSOTAモデルよりも大きなマージンで優れており、検出されたクラスタの正確なカテゴリ名を生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:27:57 GMT)
Efficient Model Compression for Hierarchical Federated Learning [10.4] フェデレートラーニング(FL)は、分散ラーニングシステム内のプライバシを保護する能力のために、大きな注目を集めている。
本稿では,クラスタ化FLとモデル圧縮の利点を統合した新しい階層型FLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:17:47 GMT)
EF-Calib: Spatiotemporal Calibration of Event- and Frame-Based Cameras Using Continuous-Time Trajectories [10.3] イベントカメラはフレームベースのカメラと融合する見込みがある。
本稿では,固有カメラとフレームベースカメラを併用したステレオビジョンシステムの校正フレームワークEF-Calibを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:40:24 GMT)
A Multi-Perspective Analysis of Memorization in Large Language Models [10.3] 大規模言語モデル(LLM)は様々な分野で前例のない性能を示す。
LLMはそれらをトレーニングするのと同じコンテンツを生成することができる。
この研究は、様々な観点から記憶を包括的に議論した。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:41:02 GMT)
VB-LoRA: Extreme Parameter Efficient Fine-Tuning with Vector Banks [10.3] ローランク適応(LoRA)とその派生型は、かなりのストレージと送信コストを発生させる。
行列次元,モジュール,レイヤ間の低ランク分解の障壁を断ち切る「分割共有」パラダイムを導入する。
VB-LoRAは、最先端PEFT法と比較して、同等または優れた性能を維持しながら、極端なパラメータ効率を達成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:51:57 GMT)
LabObf: A Label Protection Scheme for Vertical Federated Learning Through Label Obfuscation [10.2] 垂直連合学習における最も一般的なアーキテクチャの1つである分断学習は、業界で広く使われている。
悪意のある参加者は、アップロードされた埋め込みからラベル情報を推測し、プライバシーの漏洩につながる可能性がある。
本稿では,従来の1ホットベクトルラベルを複数の数値ソフトラベルにランダムにマッピングする,LabObf'と呼ばれる新しいラベル難読化防御戦略を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:54:42 GMT)
Structured Graph Network for Constrained Robot Crowd Navigation with Low Fidelity Simulation [10.2] 低忠実度シミュレータを用いた群集ナビゲーションにおける強化学習(RL)ポリシーの適用可能性について検討した。
動的環境の表現を導入し,人間と障害物の表現を分離する。
この表現は、低忠実度シミュレーターで訓練されたRLポリシーを、シム2リアルギャップを減らして現実世界に展開することを可能にする。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:53:09 GMT)
Tensor Low-rank Approximation of Finite-horizon Value Functions [10.2] 本稿では,有限水平MDPの最適VFを近似する非パラメトリック低ランクアルゴリズムを提案する。
低ランクPARAFACモデルのサイズは各次元に対して加法的に成長し、我々のアプローチを効率的にする。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:52:00 GMT)
Matrix Low-Rank Trust Region Policy Optimization [10.2] 強化学習の方法は、ポリシーグラディエントアプローチを使用して、アクションにマップするパラメトリックポリシーを学ぶ。
Trust Region Policy Optimization (TRPO)のようなトラストリージョンアルゴリズムは、ポリシー更新のステップを制約し、モノトニックな改善を保証する。
本稿では,TRPOアルゴリズムのパラメータを効率的に推定する手段として,低ランク行列モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:46:31 GMT)
Matrix Low-Rank Approximation For Policy Gradient Methods [10.2] 行動にマップする政策を推定することは、強化学習における中心的な問題である。
本稿では,勾配法アルゴリズムのパラメータを効率的に推定する低ランク行列モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:49:08 GMT)
A Multi-resolution Low-rank Tensor Decomposition [10.2] 階層的な方法でテンソルを記述するために,多分解能の低ランクテンソル分解を提案する。
分解の中心的な考え方は、テンソルを複数の低次元テンソルに再キャストし、異なる解像度で構造を利用することである。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:44:29 GMT)
Partitioned Hankel-based Diffusion Models for Few-shot Low-dose CT Reconstruction [10.2] 分割ハンケル拡散(PHD)モデルを用いた低用量CT再構成法を提案する。
反復再構成段階では、反復微分方程式解法とデータ一貫性制約を併用して、取得した投影データを更新する。
その結果,PHDモデルを画像品質を維持しつつ,アーチファクトやノイズを低減し,有効かつ実用的なモデルとして検証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:44:53 GMT)
WateRF: Robust Watermarks in Radiance Fields for Protection of Copyrights [10.1] 我々はNeRFの両表現に利用できる革新的な透かし手法を提案する。
これは、NeRFを微調整してバイナリメッセージをレンダリングプロセスに埋め込むことによって実現される。
提案手法は,2次元レンダリング画像に埋め込まれた透かしの容量,可視性,堅牢性の3つの異なる側面で評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:48:37 GMT)
SymbolicAI: A framework for logic-based approaches combining generative models and solvers [9.8] 生成過程における概念学習とフロー管理に論理的アプローチを取り入れた,汎用的でモジュール化されたフレームワークであるSybolicAIを紹介する。
我々は,大規模言語モデル(LLM)を,自然言語命令と形式言語命令の両方に基づいてタスクを実行する意味的解決器として扱う。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:05:13 GMT)
Blind Data Adaptation to tackle Covariate Shift in Operational Steganalysis [9.6] Image Steganographyにより、個人は疑念を喚起することなく、デジタル画像に違法な情報を隠すことができる。
内因性コミュニケーションのための操作画像の検出を可能にする効果的なステガナリシス法を開発することが重要である。
ステガナリシスにおける特定の目標に沿ったソースをエミュレートする新しい手法であるTADを開発した。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:55:22 GMT)
MVMS-RCN: A Dual-Domain Unfolding CT Reconstruction with Multi-sparse-view and Multi-scale Refinement-correction [9.5] スパースビューCTは、低線量へのプロジェクションビューの数を減少させる。
既存の深層学習(DL)と深部展開スパルスCT再構成法では,プロジェクションデータを完全には利用していない。
本稿では,スパルス・ビュー・トモグラフィー再構成のための数学的アイデアと最適DLイメージングアルゴリズムの設計を目的とする。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:01:25 GMT)
Harnessing the Power of Vicinity-Informed Analysis for Classification under Covariate Shift [9.5] 転送学習は、ソース分布からのデータを活用することにより、ターゲット分布の予測精度を向上させる。
本稿では,周辺情報,すなわちデータポイントの局所的構造を利用した新しい異種性尺度を提案する。
提案手法を用いて過大な誤差を特徴付けるとともに,従来の手法と比較して高速あるいは競合的な収束率を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:55:27 GMT)
Evaluation of Multi-task Uncertainties in Joint Semantic Segmentation and Monocular Depth Estimation [9.5] マルチタスク学習が不確実性推定の質にどのように影響するかを,両タスクを別々に解くのと比較して検討した。
マルチタスク学習は,両タスクを別々に解くことに比べ,不確実性推定の品質に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:12:26 GMT)
Mixed Dynamics In Linear Networks: Unifying the Lazy and Active Regimes [9.4] 遅延状態と平衡状態の両方の特別な場合を含む学習行列の進化の公式を提供する。
混合状態では、ネットワークの一部が遅延し、他方がバランスを取る。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:29:23 GMT)
The Poisson Midpoint Method for Langevin Dynamics: Provably Efficient Discretization for Diffusion Models [9.4] ランゲヴィン・モンテカルロ(Langevin Monte Carlo、LMC)は、最も単純かつ最も研究されたアルゴリズムである。
本稿では, ステップサイズが大きい小型LCCを近似したPoisson Midpoint Methodを提案する。
DDPMは,わずか50~80のニューラルネットワークコールで1000件のニューラルネットワークコールで品質を維持し,同様の計算でODEベースの手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:40:42 GMT)
Test-Time Adaptation for Depth Completion [9.3] いくつかの(ソース)データセットでトレーニングされたモデルを転送して、ドメイン間のギャップによってテストデータをターゲットにする場合、パフォーマンスの劣化を観測することが一般的である。
本稿では,1枚の画像とそれに伴うスパース深度マップから高密度深度マップを推定するタスクである深度完成のためのオンラインテスト時間適応手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:39:45 GMT)
FUGNN: Harmonizing Fairness and Utility in Graph Neural Networks [9.3] グラフニューラルネットワーク(GNN)は、フェアネスの優先順位付けが利便性を損なう可能性があるため、難しいトレードオフに直面していることが多い。
我々は、スペクトルグラフ理論のレンズを通して公正性を再検討し、スペクトルグラフ学習の枠組みの中で公正性と有用性を再構築することを目的としている。
フェアネスとユーティリティの対立を調和させる新しいスペクトルグラフ学習手法であるFUGNNを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:40:21 GMT)
Local Model Reconstruction Attacks in Federated Learning and their Uses [9.1] 局所的なモデル再構築攻撃は、敵が他の古典的な攻撃をより効果的に引き起こすことを可能にする。
局所モデル再構成攻撃を利用したフェデレート学習におけるモデルベース属性推論攻撃を提案する。
我々の研究は、FLのプライバシーリスクを効果的に定量化するために、強力で説明可能な攻撃を設計するための新しい角度を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:04:34 GMT)
Assessment of Left Atrium Motion Deformation Through Full Cardiac Cycle [9.1] 左心房(LA)は、より薄い心筋壁、複雑で不規則な形態、および個々の構造における多様性など、固有の課題を呈する。
我々は,高解像度の3次元Cine MR画像を用いて,LAの動きを自動的に解析する4次元登録モデリングのための総合的な技術ワークフローを初めて提示する。
本研究は, 左心房運動追跡・変形のための新しいバイオマーカーを臨床医に提供するために, エンド・ツー・エンドの枠組みが提案される可能性を示している。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:31:24 GMT)
Enhancing Graph Transformers with Hierarchical Distance Structural Encoding [9.1] 本稿では,グラフ内のノード距離をモデル化するための階層的距離構造(HDSE)手法を提案する。
本稿では,既存のグラフ変換器の注意機構にHDSEをシームレスに統合する新しいフレームワークを提案する。
我々は,HDSEを用いたグラフトランスフォーマーがグラフ分類,7つのグラフレベルのデータセットの回帰,11の大規模グラフのノード分類において優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:04:29 GMT)
CNN-based Compressor Mass Flow Estimator in Industrial Aircraft Vapor Cycle System [9.0] 蒸気サイクルシステムでは、質量流センサは異なる監視と制御のために重要な役割を果たす。
他の標準センサーをベースとしたバーチャルセンサーのコンセプトは、良い選択肢だ。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:49:47 GMT)
SoK: Leveraging Transformers for Malware Analysis [9.0] トランスフォーマーの導入は、生成AIの基礎となるトランスフォーマーとして、AI研究と応用にとって重要なブレークスルーとなった。
トランスフォーマーのための有望なアプリケーションドメインはサイバーセキュリティ、特にマルウェアドメイン分析である。
本論文は,マルウェア解析用に設計されたトランスフォーマーベースのアプローチを包括的に分析することを目的としている。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:14:07 GMT)
ExtremeMETA: High-speed Lightweight Image Segmentation Model by Remodeling Multi-channel Metamaterial Imagers [9.0] 本稿では,ExtremeC3Netに基づくカーネル軽量セグメンテーションモデルExtremeMETAを提案する。
その結果、最適化された効率的な設計により、mIoUでのセグメンテーション性能は92.45から95.97に向上し、計算FLOPは461.07 MMacから166.03 MMacに低下した。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:03:37 GMT)
Scaling Law for Time Series Forecasting [9.0] 大規模データセット、複雑なモデル、強化されたデータの粒度に報いるスケーリング法則は、ディープラーニングの様々な分野において観察されている。
しかし、時系列予測の研究は、時系列予測のためのディープラーニング手法のスケーリング行動に疑問を投げかけている。
本稿では,このような異常な振る舞いを説明できる時系列予測法則のスケーリング理論を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:02:08 GMT)
Exploring Spatial Schema Intuitions in Large Language and Vision Models [8.9] 大規模言語モデル(LLM)が言語ブロック構築に関する暗黙の人間の直感を効果的に捉えているかどうかを検討する。
驚くべきことに、モデル出力と人間の反応の相関が出現し、具体的体験と具体的なつながりのない適応性が明らかになる。
本研究は,大規模言語モデルによる言語,空間経験,計算間の相互作用の微妙な理解に寄与する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:29:31 GMT)
Physics informed cell representations for variational formulation of multiscale problems [8.9] 偏微分方程式(PDE)を解くための有望なツールとして物理情報ニューラルネットワーク(PINN)が登場している
PINNはマルチスケールの特徴を持つPDEの解決には適していない。
本稿では,多層パーセプトロン(MLP)と結合した多層多層格子からなるセルベースモデルアーキテクチャを提案する。
本質的には,セルベースモデルと並列小クダnライブラリにより,コンバージェンス速度と数値精度が向上する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:42:16 GMT)
TIMA: Text-Image Mutual Awareness for Balancing Zero-Shot Adversarial Robustness and Generalization Ability [8.9] この研究は、大規模基礎モデルにおけるゼロショット一般化を保ちながら、ゼロショット対逆ロバスト性を達成するという課題に対処する。
本稿では,ゼロショット対向性と一般化のバランスをとるテキスト・イメージ相互認識(TIMA)手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:10:17 GMT)
Transport of Algebraic Structure to Latent Embeddings [8.7] 機械学習はしばしば、より大きく抽象的な数学的空間にある入力の潜在的な埋め込みを生成することを目的としている。
アソシエーションを尊重しながら、その潜在埋め込みだけを使って2つの集合を「統一」する方法をどうやって学べるか。
本稿では、入力空間上の法則と確実に一致した潜在空間演算をパラメータ化するための一般的な手順を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:24:57 GMT)
Generative Query Reformulation Using Ensemble Prompting, Document Fusion, and Relevance Feedback [8.7] GenQREnsembleとGenQRFusionはゼロショット命令のパラフレーズを利用して複数のキーワードセットを生成し、検索性能を向上させる。
検索前設定ではnDCG@10で最大18%,検索後設定では9%の精度で検索効率を向上できることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:03:26 GMT)
Ecosystem of Large Language Models for Code [8.5] 本稿では,コードモデルエコシステムの先駆的分析を紹介する。
まず、人気があり影響力のあるデータセット、モデル、コントリビュータを特定します。
最も人気のある3つの再利用タイプは、微調整、アーキテクチャ共有、量子化である。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:31:30 GMT)
Beyond Concept Bottleneck Models: How to Make Black Boxes Intervenable? [8.4] 本稿では,設計によって解釈できない事前学習型ニューラルネットワークに対して,概念に基づく介入を行う手法を提案する。
我々は、インターベンタビリティの概念を概念に基づく介入の有効性の尺度として定式化し、この定義を微調整ブラックボックスに活用する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:07:49 GMT)
Verifying Properties of Binary Neural Networks Using Sparse Polynomial Optimization [8.3] 本稿では,バイナリニューラルネットワーク(BNN)の特性検証手法について検討する。
フル精度のBNNと同様、入力の摂動にも敏感だ。
スパース多項式最適化から導かれる半有限プログラミング緩和を用いた代替手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:03:48 GMT)
Boosting Robustness by Clipping Gradients in Distributed Learning [8.3] State-of-the-art (SOTA) robust distributed gradient descent (Robust-DGD) 法は最適であることが証明されている。
その結果,低境界を回避し,学習性能を向上させることが可能であることが示唆された。
我々は、適応ロバストクリッピング(ARC)と呼ばれる新しいスキームを用いて、労働者の勾配の事前集約クリッピングを提案し、これを証明した。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:25:40 GMT)
Automatic Domain Adaptation by Transformers in In-Context Learning [8.2] 本稿では、テキスト内学習フレームワークにおいて、与えられたデータセットに対するドメイン適応手法を近似し、選択できるTransformerモデルを提案する。
数値的な結果から、文脈内学習は既存の手法を超越した適応的領域適応を示すことが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:33:53 GMT)
Sharp Generalization of Transductive Learning: A Transductive Local Rademacher Complexity Approach [8.1] 本稿では,トランスダクティブ学習手法の一般化性能を解析するための新しいツールであるTransductive Local Complexity (TLC)を紹介する。
我々の研究は、LRC(Local Rademacher Complexity)の概念をトランスダクティブ・セッティングに拡張しています。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:23:03 GMT)
Towards One Model for Classical Dimensionality Reduction: A Probabilistic Perspective on UMAP and t-SNE [8.1] 本稿では,ProbDR で導入された一般化 Wishart モデルに対応する MAP 推論手法として,次元削減手法である UMAP と t-SNE を概ね再キャスト可能であることを示す。
この解釈はこれらのアルゴリズムについてより深い理論的洞察を与え、類似の次元減少法を研究できるツールを導入している。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:57:12 GMT)
MetaOptimize: A Framework for Optimizing Step Sizes and Other Meta-parameters [8.1] 本稿ではメタファクタを動的に調整するメタフレームワークについて紹介する。
より具体的には、Metaは任意の一階最適化アルゴリズムをラップし、特定の形態の後悔を最小限に抑えるために、ステップサイズの調整をオンザフライで行うことができる。
また、複数の最適化アルゴリズムへの適応性とともに、手作り学習率の最高のスケジュールに匹敵する性能を示すメタの低複雑性な変種も導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:52:56 GMT)
Automated discovery of symbolic laws governing skill acquisition from naturally occurring data [8.0] 本稿では,大規模学習ログデータからスキル学習の法則を明らかにすることを目的とする。
2段階のアルゴリズムは、観測不能な認知状態と探索におけるアルゴリズム的爆発の問題に対処するために開発された。
実験結果から, 連続的なフィードバック設定において, ノイズ範囲内における事前設定された法則を精度良く復元できることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:48:09 GMT)
Searching by Code: a New SearchBySnippet Dataset and SnippeR Retrieval Model for Searching by Code Snippets [7.9] コードスニペットをクエリとして使用して、バグフィックス命令やコードサンプルを探すことは、従来の技術ではカバーされていない自然なユースケースである、と私たちは主張する。
StackOverflowデータに基づく検索・バイ・コード・ユースケースを実装した新しいSearchBySnippetデータセットを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:44:48 GMT)
Functional Programming Paradigm of Python for Scientific Computation Pipeline Integration [7.9] 本稿では,Pythonアーキテクチャとプログラミング実践における関連スイートに基づく,新しい関数型プログラミングパラダイムを提案する。
このソリューションは、科学計算フローの統合を目的としている。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:46:57 GMT)
MAML MOT: Multiple Object Tracking based on Meta-Learning [7.9] MAML MOTは、マルチオブジェクト追跡のためのメタラーニングベースのトレーニングアプローチである。
マルチオブジェクト追跡のためのメタラーニングに基づくトレーニング手法であるMAML MOTを紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:30:44 GMT)
An integral algorithm of exponential observables for interacting fermions in quantum Monte Carlo simulation [7.8] 指数オブザーバブルは、$log langle ehatXrangle$として定式化され、$hatX$は膨大な量であり、量子多体系の研究において重要な役割を果たす。
相互作用するフェルミオン系における観測可能量の定量化のための包括的アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:22:09 GMT)
Assessing the significance of longitudinal data in Alzheimer's Disease forecasting [7.7] 我々は、アルツハイマー病(AD)の進行を予測するための縦断的患者データの重要性を特徴付けるために、トランスフォーマーエンコーダモデルを用いている。
アルツハイマー病の縦断予測モデル (LongForMAD) は, 患者訪問の順序に埋め込まれた包括的時間的情報を活用する。
本研究は,ADの早期検出とモニタリングを促進するため,臨床環境における経時的データの導入を支援する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:55:48 GMT)
Can We Trust LLMs? Mitigate Overconfidence Bias in LLMs through Knowledge Transfer [7.7] この研究は、LLMの信頼性を改善するために、過信バイアスを軽減することを検討する。
そこで我々は,「大きな」LLMが,詳細かつシーケンシャルな推論経路を通じて,「小さな」LLMに知識を与えるような,思考の連鎖を利用した知識伝達(KT)手法を提案する。
この方法は、より大規模なモデルの高度な推論を使用して、より小さなモデルを微調整し、より正確な予測をキャリブレーションされた信頼性で作成することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:06:36 GMT)
PASTA: Pathology-Aware MRI to PET Cross-Modal Translation with Diffusion Models [7.7] 本研究では,条件付き拡散モデルに基づく新しい画像翻訳フレームワークであるPASTAを紹介する。
サイクル交換一貫性とボリューム生成戦略は、高品質な3DPETスキャンを生成するPASTAの能力を高める。
アルツハイマー分類では、合成スキャンの性能はMRIよりも4%向上し、実際のPETの性能にほぼ達する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:33:24 GMT)
DualContrast: Unsupervised Disentangling of Content and Transformations with Implicit Parameterization [7.6] 形状に着目した画像データセットにおけるコンテンツと変換を教師なしで切り離すための,新しい自己教師型手法であるDualContrastを開発した。
本実験は,既存の自己監督的・明示的パラメータ化手法よりもDualContrastの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:31:14 GMT)
Breaking of brightness consistency in optical flow with a lightweight CNN network [7.6] この研究では、軽量ネットワークを用いて、強い不変性を持つ堅牢な畳み込み特徴やコーナーを抽出する。
畳み込み特性の整合性に対する光学流法の典型的な輝度の整合性を変化させると、光ローバストハイブリッド光流法が得られる。
VINS-Monoの光学フロー法を置き換えることにより,より正確な視覚慣性システムを構築する。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:41:33 GMT)
A re-calibration method for object detection with multi-modal alignment bias in autonomous driving [7.6] 自律走行における多モード物体検出は、異なるセンサからの補完情報を融合させることにより、大きなブレークスルーを達成した。
実際には、キャリブレーション行列は車両が工場を出る際に固定されるが、振動、バンプ、データラグはキャリブレーションバイアスを引き起こす可能性がある。
我々は,SOTA検出方式EPNet++の実験を行い,キャリブレーションの偏りをわずかに示し,性能を著しく低下させることを示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:46:37 GMT)
Theories of synaptic memory consolidation and intelligent plasticity for continual learning [7.6] シナプスの可塑性機構は 内部状態を維持し 進化させなければならない
可塑性アルゴリズムは 内部の状態を利用して 個々のシナプスで 可塑性をインテリジェントに制御する必要がある
論文参考訳(メタデータ) (Mon, 27 May 2024 08:13:39 GMT)
Physics-guided Full Waveform Inversion using Encoder-Solver Convolutional Neural Networks [7.6] フルウェーブフォーム・インバージョン(Full Waveform Inversion, FWI)は、与えられた領域における波動速度分布を推定する逆問題である。
我々は畳み込みニューラルネットワークに基づくエンコーダ-ソルバ事前条件の学習プロセスを開発する。
高周波データを用いた2次元物理モデルを用いてFWI問題の解法を実証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:03:21 GMT)
Socially-Aware Shared Control Navigation for Assistive Mobile Robots in the Built Environment [7.6] この研究は、モバイルロボットプラットフォームを支援するための、新しいソーシャルな共有自律型ナビゲーションシステムを導入している。
ナビゲーションフレームワークはGlobal PlannerとLocal Plannerで構成されています。
ローカルプランナに対しては,動的制御バリア関数を用いた共有制御に基づくモデル予測制御を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:40:34 GMT)
Retrieve, Merge, Predict: Augmenting Tables with Data Lakes [7.4] 結合可能なテーブルを検索し、情報をマージし、結果のテーブルと予測する。
データレイクとして、論文ではYADL(Yet Another Data Lake)と、よく参照された実際のデータレイクであるOpen Data USを使用している。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:21:05 GMT)
Model Ensembling for Constrained Optimization [7.4] 下流最適化に使用される多次元出力予測のためのモデルを組み立てたいという設定について検討する。
より正確には、状態空間を多次元実数値予測にマッピングする多くのモデルが与えられていると想像する。
これらの予測は、指定された制約の下で最適化したい線形対象の係数を形成する。
証明可能かつ収束性の高い2つのアルゴリズムに導かれる多重校正手法を適用した。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:48:07 GMT)
Oracle-Efficient Reinforcement Learning for Max Value Ensembles [7.4] 大または無限の状態空間における強化学習(RL)は、理論上、実験的に困難である。
この作業では、$textitmax-following Policy$と競合することを目指しています。
我々の主な成果は、構成ポリシーのみにアクセスすると、最大フォローポリシーと競合する効率的なアルゴリズムである。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:08:23 GMT)
Controllable Text Summarization: Unraveling Challenges, Approaches, and Prospects -- A Survey [7.4] 我々は、制御可能なテキスト要約(CTS)タスクを形式化し、それらの共有特性と目的に応じて制御可能な属性を分類し、各カテゴリ内の既存のデータセットとメソッドを徹底的に検証する。
この結果から, CTSの潜在的な解決策と今後の方向性を探りながら, 限界と研究ギャップを明らかにした。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:36:38 GMT)
Deblurring 3D Gaussian Splatting [7.3] MLP(Multi-Layer Perceptron)を用いた3次元ガウス平滑化のための新しいリアルタイムデブロアリングフレームワークを提案する。
Deblurring 3D Gaussian Splattingはリアルタイムレンダリングを楽しめるが、ぼやけた画像から細かで鋭いディテールを再構築することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:50:21 GMT)
For Better or For Worse? Learning Minimum Variance Features With Label Augmentation [7.2] 本研究では,データ拡張手法のラベル拡張の側面が果たす役割を解析する。
まず、ラベル拡張で訓練されたバイナリ分類データの線形モデルが、データ内の最小分散特性のみを学ぶことを証明した。
次に, 非線形モデルや一般データ分布においても, ラベルの平滑化や混合損失はモデル出力分散の関数によって低く抑えられることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:58:55 GMT)
PRISM: Leveraging Prototype Patient Representations with Feature-Missing-Aware Calibration for EHR Data Sparsity Mitigation [7.1] PRISMは、類似した患者のプロトタイプ表現を活用することで、データを間接的にインプットするフレームワークである。
PRISMには、ステータスの欠如を考慮した各機能の信頼性を評価する機能信頼モジュールも含まれている。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:44:17 GMT)
Spectral-Refiner: Fine-Tuning of Accurate Spatiotemporal Neural Operator for Turbulent Flows [7.0] 本稿では,ボヒナー空間間のマップを学習する新しい時間的ニューラル演算子(SFNO)と,これらの問題に対処する新しい学習フレームワークを提案する。
この新しいパラダイムは、従来の数値PDE理論と技法の知恵を利用して、一般的に採用されているエンドツーエンドのニューラル演算子のトレーニングと評価のパイプラインを洗練する。
2次元NSEのための一般的なベンチマークの数値実験は、エンドツーエンド評価や従来の数値PDEソルバと比較して計算効率と精度の両方が大幅に向上した。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:33:06 GMT)
Surprise-Adaptive Intrinsic Motivation for Unsupervised Reinforcement Learning [6.9] 教師なし強化学習(RL)のエントロピー最小化とエントロピー最大化は異なる環境において有効であることが示されている。
マルチアームバンディット問題としての選択をフレーミングすることで、エントロピー条件に応じて、その目的をオンラインで適応できるエージェントを提案する。
我々は,このようなエージェントがエントロピーを制御し,高エントロピーと低エントロピーの両体制において創発的な行動を示すことを実証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:58:24 GMT)
Pretraining with Random Noise for Fast and Robust Learning without Weight Transport [6.9] ランダムノイズを伴う事前学習ニューラルネットワークは、学習効率を向上し、重量輸送を伴わない一般化能力も向上することを示す。
ランダムノイズとデータの両方による連続的なトレーニングは、データのみによるトレーニングよりもシナプス的なフィードバックに近い重みをもたらす。
この事前正規化により、ネットワークは低ランクの単純な解を学習でき、その後の訓練における一般化損失を減らすことができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:12:51 GMT)
Jump-teaching: Ultra Efficient and Robust Learning with Noisy Label [6.8] そこで本研究では,トレーニング中のラベルのずれを識別する新しい手法を提案する。
インタープレイを分離し、損失からより多くのセマンティック情報をマイニングするために、ジャンプ方式の更新を行うネットワークは1つだけです。
提案手法は, ピークメモリフットプリントの高速化, ピークメモリフットプリントの0.56タイム, 各種ノイズ設定による最先端処理よりも優れたロバスト性を実現する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:54:09 GMT)
Explainable machine learning multi-label classification of Spanish legal judgements [6.8] 本稿では,判断文(文)の多ラベル分類に機械学習を適用し,説明目的の視覚的・自然言語的記述を行うハイブリッドシステムを提案する。
我々のソリューションは、法の専門家によって注釈付けされたラベル付きデータセット上で85%以上のマイクロ精度を達成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:16:42 GMT)
PP-SAM: Perturbed Prompts for Robust Adaptation of Segment Anything Model for Polyp Segmentation [6.7] 本稿では,ポリプ分割タスクに限定的な画像で適応できる頑健な微調整手法PP-SAMを提案する。
ポリプセグメンテーションベンチマーク実験により, 可変BBP摂動がモデルレジリエンスを著しく改善することが明らかとなった。
以上の結果から, PP-SAMの他の医用画像処理への応用は限定的であった。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:13:01 GMT)
Efficient Visual Fault Detection for Freight Train via Neural Architecture Search with Data Volume Robustness [6.6] 貨物列車の視覚的故障検出のためのNASに基づく効率的な枠組みを提案する。
まず,頭部の有効受容場を発見するためのスケールアウェア検索空間を設計する。
第2に、特に設計された検索空間に基づいて、検索コストを削減するために、データボリュームの堅牢性について検討する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:47:49 GMT)
A Machine Learning Approach to Analyze the Effects of Alzheimer's Disease on Handwriting through Lognormal Features [6.4] 本稿では,Sigma-lognormalモデルから抽出した手書き機能に機械学習を適用した手法を提案する。
本研究の目的は、アルツハイマーの診断と研究を支援する支援システムを開発することである。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:54:11 GMT)
Deep Feature Gaussian Processes for Single-Scene Aerosol Optical Depth Reconstruction [6.3] AOD再建のための既存の方法は時間情報に依存している。
高空間分解能のリモートセンシングデータでは、多時間観測は利用できないことが多い。
ディープラーニングを使用することで、変数をより説明可能なパワーで特徴空間に変換する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:20:40 GMT)
Crystalline invariants of fractional Chern insulators [6.3] 部分回転の基底状態期待値を用いて結晶不変量を抽出する方法を示す。
位相的順序を考えると、ホール導電率、充填率、部分回転不変量がシステムを完全に特徴づけていることが示される。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:59 GMT)
P-split formulations: A class of intermediate formulations between big-M and convex hull for disjunctive constraints [6.3] P-スプリット」の定式化は、各不定形内の凸制約を伴う不定形制約に対して導出される。
P-スプリットの定式化は、大質量M等式から始まり、凸殻に収束する階層を形成する。
344 の試験インスタンス上での P-split の定式化と Big-M および convex の定式化を計算的に比較した。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:41:17 GMT)
Characterising Developer Sentiment in Software Components: An Exploratory Study of Gentoo [6.3] 共同ソフトウェア開発はチーム内で行われ、共有された成果物に協力し、オンラインプラットフォーム上での開発について議論する。
以前の研究では、特にオープンソース環境では、チームメンバー間のコミュニケーションが極めて有害になる可能性があることが示されています。
我々の研究は、近年、Gentoo開発者間のコミュニケーションにおいて、負の感情が一般的に減少していることを示している。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:22:47 GMT)
Rigorous Simulation-based Testing for Autonomous Driving Systems -- Targeting the Achilles' Heel of Four Open Autopilots [6.2] 本稿では,シナリオを単純なものに分割した厳密なテスト手法を提案する。
クリティカルな状況において、車両をテスト対象とするクリティカルな構成のテストケースを生成します。
テストケースでは、Apollo、Autoware、CarlaとLGSVLのオートパイロットに重大な欠陥が見られる。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:06:21 GMT)
A Gentle Approach to Multi-Sensor Fusion Data Using Linear Kalman Filter [6.2] この研究論文はLKF(Linear Kalman Filter)を掘り下げ、複数のセンサーからのデータをマージすることの重要性を強調した。
我々の焦点は、LKFのシステム力学、測定ノイズ、初期条件に関する仮定による線形力学系である。
この融合は多様な感覚入力を統合するために不可欠であり、それによって状態推定の精度と信頼性が向上する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:46:58 GMT)
A Library for Automatic Natural Language Generation of Spanish Texts [6.1] 本稿では,スペイン語文の自然言語生成システム(NLG)について,意味のある単語の最小セットから提案する。
システムは、ユーザが提示した主語セットから完全で一貫性があり、正しく綴られた文を生成することができる。
設計によって他の言語に容易に適応でき、広範囲のデジタルデバイスに統合することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:44:06 GMT)
Schroedinger's Threshold: When the AUC doesn't predict Accuracy [6.1] エリアアンダーカーブ測度(AUC)は、様々なモデルを評価し比較する傾向にある。
我々は,AUCが,アプリケーションで観測される実際の精度と誤認できる,学術的で楽観的な精度の概念を導出することを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:33:40 GMT)
TEII: Think, Explain, Interact and Iterate with Large Language Models to Solve Cross-lingual Emotion Detection [5.9] 言語間感情検出により,グローバルな傾向,世論,社会現象を大規模に分析することができる。
我々のシステムは0.16F1スコアの絶対値でベースラインを上回り、競合するシステムの中では2位にランクインした。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:47:40 GMT)
Interpretable Prognostics with Concept Bottleneck Models [5.9] 概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、概念的説明に基づいて本質的に解釈可能なニューラルネットワークアーキテクチャである。
CBMはドメインの専門家がテスト時にコンセプトアクティベーションに介入できるようにする。
ケーススタディでは,CBMの性能がブラックボックスモデルと同等か優れていることが示されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:15:40 GMT)
Towards Causal Physical Error Discovery in Video Analytics Systems [5.9] ディープラーニングモデルに基づくビデオ分析システムは、しばしば不透明で不安定である。
現在のモデル説明システムは、ピクセル寄与の観点からの行動のリテラル説明に非常に適している。
本稿では、回帰不連続設計(Regress discontinuity design)と呼ばれる単純な形態の因果推論を用いて、複数の重要な性能指標の変化と実世界の現象を関連付けることができるという考えを紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:40:33 GMT)
Speck: A Smart event-based Vision Sensor with a low latency 327K Neuron Convolutional Neuronal Network Processing Pipeline [5.9] 我々は、イベントベースのカメラと低消費電力非同期スパイク畳み込みニューラルネットワーク(sCNN)コンピューティングアーキテクチャを単一チップ上に組み込んだ、チップ上のスマートビジョンセンサシステム(SoC)を提案する。
センサと処理を1つのダイに組み合わせることで、ユニット生産コストを大幅に削減できる。
非同期アーキテクチャ、個々のブロック、およびsCNN処理原理と他のsCNN対応プロセッサに対するベンチマークを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:06:35 GMT)
Self-Training: A Survey [5.8] 半教師付きアルゴリズムは、ラベル付き観測の小さなセットとラベルなし観測の大きなセットから予測関数を学習することを目的としている。
近年,自己学習手法が注目されていることは確かである。
本稿では,バイナリクラスとマルチクラス分類のための自己学習手法と,その変種と関連する2つのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:27:47 GMT)
MCGAN: Enhancing GAN Training with Regression-Based Generator Loss [5.8] 高忠実度データを生成する強力なツールとして,GAN(Adversarial Network)が登場している。
我々はモンテカルロガン(MCGAN)と呼ばれるアルゴリズムを提案する。
このアプローチは、革新的生成損失関数、すなわち回帰損失を利用して、回帰タスクとしてジェネレータトレーニングを再構成する。
本手法は, 有効発電機訓練のために, 判別器に弱い条件を必要とすることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:15:52 GMT)
Simple-RF: Regularizing Sparse Input Radiance Fields with Simpler Solutions [5.7] ニューラル・ラジアンス・フィールド(NeRF)は、シーンのフォトリアリスティックなフリービューレンダリングにおいて印象的なパフォーマンスを示す。
TensoRFやZipNeRFといったNeRFの最近の改良は、最適化とレンダリングの高速化のために明示的なモデルを採用している。
放射場によって推定される深度を監督することは、より少ない視点で効果的に学習することに役立つことを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:02:05 GMT)
Polyhedral Complex Derivation from Piecewise Trilinear Networks [5.6] 神経表面表現学習の発展は、非線形位置符号化を取り入れている。
これは、Continuous Piecewise Affine関数に基づいたメッシュ抽出技術を適用する際の課題である。
本稿では,超曲面から平面への変換を示す理論的洞察と解析メッシュ抽出について述べる。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:50:32 GMT)
EPPS: Advanced Polyp Segmentation via Edge Information Injection and Selective Feature Decoupling [5.5] We propose a novel model named Edge-Prioritized Polyp (EPPS)。
具体的には,ポリプのエッジを正確に抽出することを目的としたエッジマッピングエンジン(EME)を組み込んだ。
また,Selective Feature Decoupler (SFD) と呼ばれるコンポーネントを導入し,モデルに対するノイズや外的特徴の影響を抑える。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:47:27 GMT)
Cosmological Bell Tests with Decoherence Effects [5.4] 本研究では,原曲率摂動に着目した。
曲率摂動は重力から生じるため、その作用はギボンズ・ホーキング・ヨーク境界項を含む。
この過程をベルテスト曲線'で記述し、宇宙論的摂動の量子起源をテストするための5e折りの窓を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:19:34 GMT)
Predict joint angle of body parts based on sequence pattern recognition [5.4] エルゴノミストは、職場の視覚的観察に基づいて人間工学的リスクアセスメントを使用する。
作業員の身体の一部は、カメラの視野にはないかもしれない。
画像に写っていない場合、身体部分の位置を予測することは困難である。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:24:11 GMT)
LLM-Based Cooperative Agents using Information Relevance and Plan Validation [5.3] 多エージェント協調は、3Dシーンと相互作用し、複雑な部分的な観察の下で分散エージェントと協調する。
現在のシステムは、観測を通して取得した情報を管理するのに非効率であることを示す。
空間データを意思決定プロセスに組み込むことの失敗は、エージェントが最適化された軌跡を構築する能力を制限する。
GPT-3.5を利用した新しい認知アーキテクチャREVECA(Relevance and Validation-Enhanced Cooperative Language Agent)を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:47:14 GMT)
TimeMIL: Advancing Multivariate Time Series Classification via a Time-aware Multiple Instance Learning [5.2] 時系列内の関心パターンとモデリング時間依存性のより優れたローカライズを実現するために,MIL(Multiple-instance Learning)フレームワークを導入する。
TimeMILは、タイムアウェアなMILプール内で時間的相関と順序を定式化し、トークン化トランスフォーマーと特別な学習可能なウェーブレット位置トークンを利用する。
提案手法は26種類の最先端手法を超越し,MTSCにおける弱教師付きTimeMILの有効性を実証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:26:21 GMT)
From Neurons to Neutrons: A Case Study in Interpretability [5.2] 高次元ニューラルネットワークはトレーニングデータの低次元表現を学習することができると我々は主張する。
このことは、解釈可能性に対するそのようなアプローチが、問題を解決するために訓練されたモデルから問題に対する新しい理解を導き出すのに有用であることを示している。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:59:35 GMT)
The CAP Principle for LLM Serving: A Survey of Long-Context Large Language Model Serving [5.2] 本研究では,大規模言語モデル (LLM) を探索し,コスト効率と精度の関係を解明する。
この分野での作業は、コンテクスト長(C)の改善、A(A)の改善、P(P)向上という3つの異なる目標に沿って最適化されていることが判明した。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:09:07 GMT)
Reinforcement Learning Approaches for the Orienteering Problem with Stochastic and Dynamic Release Dates [5.1] 我々は、eコマースキャリアが直面しているシーケンシャルな意思決定問題について検討する。
目的は、サービス時間中に配信される予定のパーセル数を最大化することです。
本稿では,この問題を解決するための2つの強化学習手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:03:48 GMT)
Think Before You Act: A Two-Stage Framework for Mitigating Gender Bias Towards Vision-Language Tasks [5.1] 視覚言語モデル(VLM)における性バイアスは、有害なステレオタイプや差別を強化することができる。
本稿では,ジェンダーバイアスを軽減するためのタスク依存生成フレームワークGAMAを提案する。
物語生成の際、GAMAは全面的だが性的に難解な物語を産み出す。
回答推論の間、GAMAは画像、生成された物語、タスク固有の質問プロンプトを統合し、異なる視覚言語タスクに対する回答を推測する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:20:58 GMT)
DMPlug: A Plug-in Method for Solving Inverse Problems with Diffusion Models [5.0] 本稿では,事前学習拡散モデル (DM) を用いた逆問題 (IP) の解法を提案する。
DMPlugは、多様体の実現可能性と測定可能性の問題を原則的に解決する。
DMPlugは、特に非線形IPにおいて、最先端の手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:38:30 GMT)
Cross-modal Diffusion Modelling for Super-resolved Spatial Transcriptomics [5.0] 空間転写学は、発見研究のための組織内の空間遺伝子発現を特徴づけることができる。
超高分解能アプローチは、組織像とプロファイルされた組織スポットの遺伝子発現を統合することでSTマップを強化することを約束する。
本稿では, 組織像の誘導による超解像STマップのクロスモーダル拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:43:30 GMT)
Are Self-Attentions Effective for Time Series Forecasting? [5.0] 時系列予測は、複数のドメインやさまざまなシナリオにわたるアプリケーションにとって不可欠である。
近年の研究では、より単純な線形モデルは、複雑なトランスフォーマーベースのアプローチよりも優れていることが示されている。
我々は、従来のTransformerフレームワークを再考する新しいアーキテクチャ、Cross-Attention-only Time Series transformer (CATS)を導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:49:39 GMT)
The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control [5.0] 2024年は、分析翻訳品質評価のための多次元品質指標フレームワークの10周年である。
本稿では,最新のMQM開発について詳述し,3つのサンプルサイズ範囲にわたる翻訳品質測定への普遍的アプローチを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:06:24 GMT)
Model-Driven Engineering for Quantum Programming: A Case Study on Ground State Energy Calculation [4.9] 本研究では、ゲートベースの量子コンピューティングと量子アニーリングという2つの主要な量子プログラミング手法を組み合わせた新しいフレームワークを紹介する。
量子プログラムの適応性、設計、拡張性を高め、様々なコンピューティングプラットフォームにおける設計と運用を容易にすることを目的としている。
この研究の顕著な成果は、ゲートベースの量子コンピュータと量子アニールの間のプログラムのマッピング方法の開発である。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:37:20 GMT)
Unifying Demonstration Selection and Compression for In-Context Learning [4.9] ICL フレームワーク UniICL を提案する。このフレームワークは,実演選択と圧縮を統一し,単一の凍結 LLM による最終応答生成を行う。
UniICLは、プロジェクション層から派生した17Mのトレーニング可能なパラメータのみを含む、パラメータ効率のよいフレームワークである。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:31:58 GMT)
SelfCP: Compressing Long Prompt to 1/12 Using the Frozen Large Language Model Itself [4.9] ロングプロンプトは、Large Language Models (LLMs) を使用する場合、ハードウェアコストを大幅に削減する。
本稿では,LLM textbfitself を用いて textbfCompress long textbfPrompt 仮想トークンを提案する。
その結果、圧縮された仮想トークンは、12倍の価格のオリジナルプロンプトを効果的に置き換えることができた。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:14:55 GMT)
Peer2PIR: Private Queries for IPFS [4.9] プライベート情報検索(PIR)が我々のタスクに最も適したツールであると主張する。
我々は、新しいプライベートプロトコルを提示し、今日のIPFSと比較して最小限のオーバーヘッドを発生させることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:09:25 GMT)
Entanglement signature in quantum work statistics in the slow-driving regime [4.9] ゆるやかに駆動される古典システムでは、作業量は量であり、その確率分布は、作業のゆらぎと散逸の関係を満たすことが知られている。
複数のシステムを備えた設備における作業変動の非古典的特徴について検討する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:39:08 GMT)
Dissecting Query-Key Interaction in Vision Transformers [4.7] 視覚変換器における自己注意はしばしば、トークンが同様の埋め込みを持つ他のトークンに付随する知覚的なグループ化を行うと考えられている。
問合せキーの相互作用を解くために,Singular Value Decompositionを提案する。
初期層は類似したトークンに,後期層は異種のトークンに注意を向ける傾向が見られた。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:31:56 GMT)
A Real-Time Voice Activity Detection Based On Lightweight Neural [4.6] 音声活動検出(Voice Activity Detection, VAD)は、音声ストリーム中の音声を検出するタスクである。
最近のニューラルネットワークベースのVADでは、パフォーマンスの低下がある程度軽減されている。
我々は,カジュアルかつ深さ分離可能な1次元畳み込みとGRUを利用するMagicNetという,軽量でリアルタイムなニューラルネットワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:31:16 GMT)
Pre-training with Synthetic Data Helps Offline Reinforcement Learning [4.5] 性能向上には言語が不可欠ではないことを示す。
次に、人気のあるオフラインDRLアルゴリズムである保守的Q-Learning(CQL)について検討する。
驚くべきことに、少数の更新のための単純な合成データによる事前トレーニングにより、CQLも改善される。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:16:03 GMT)
Tracking Small Birds by Detection Candidate Region Filtering and Detection History-aware Association [4.5] 本論文は,パノラマ映像に現れる小鳥の追跡に焦点をあてる。
追跡対象のサイズが小さければ(小さめの物体追跡)、素早く動き、物体の検出と関連が苦しむ。
本稿では,検出対象領域を減らす適応スライシング支援ハイパー推論 (Adaptive Slicing Hyper Inference, Adaptive SAHI) と,検出履歴に基づいて連続フレーム内のオブジェクトを正確に関連付ける検出履歴認識類似度基準 (DHSC) を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:22:38 GMT)
Learning Latent Space Hierarchical EBM Diffusion Models [4.5] エネルギーベース先行モデルと多層ジェネレータモデルの学習問題について検討する。
近年,エネルギーベースモデル(EBM)を第2段階の補完モデルとして学習し,ギャップを埋める研究が進められている。
本研究では,EBMサンプリングの負担を軽減するために拡散確率スキームを活用することを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:05:55 GMT)
Improved Generalization Bounds for Communication Efficient Federated Learning [4.4] 本稿では,一般化境界の探索と表現学習によるフェデレーション学習の通信コストの低減に焦点をあてる。
我々は、一般化境界と表現学習分析に基づいて、適応的局所ステップ付きフェデレートラーニング(FedALS)アルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:20:52 GMT)
Enhancing Accuracy in Generative Models via Knowledge Transfer [4.3] 本研究では,Kullback-Leiblerの分散化など,分散指標下での伝達学習のための新しいフレームワークを提案する。
提案理論は,共有構造が目標タスクの生成精度を向上させることを示唆している。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:10:49 GMT)
Advancing Cultural Inclusivity: Optimizing Embedding Spaces for Balanced Music Recommendations [4.3] 音楽レコメンデーションシステムにおける人気バイアスは、人口統計や文化の軸に沿って伝播することができる。
我々は,これらのバイアスを,プロトタイプベースの行列分解法において,表現不足の文化的グループからアーティストへの推薦において識別する。
本研究は,音楽レコメンデーションにおける人気バイアスの低減と,人口・文化の公平性向上に寄与することを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:12:53 GMT)
Worldwide Federated Training of Language Models [4.3] フェデレーションのフェデレーションに基づく世界規模のフェデレーション言語モデルトレーニング(Worldwide Federated Language Model Training, WorldLM)システムを提案する。
我々はWorldLMが標準フェデレーションを最大1.91Times$で上回り、完全ローカルモデルのパーソナライズされたパフォーマンスにアプローチし、プライバシー強化技術の下でこれらのアドバンテージを維持することを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:59:22 GMT)
Rethinking Intermediate Layers design in Knowledge Distillation for Kidney and Liver Tumor Segmentation [4.3] 医用イメージングタスクのための階層型層選択型フィードバック蒸留(HLFD)を提案する。
HLFDは、中間層から以前の層への知識を戦略的に蒸留し、最終層の知識を特徴レベルと画素レベルの中間層に伝達する。
腎臓セグメンテーションタスクでは、HLFDは学生モデル(KDなし)を10%以上上回り、腫瘍特異的な特徴への焦点を著しく改善する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:27:16 GMT)
Does Diffusion Beat GAN in Image Super Resolution? [4.2] 本稿では,GANモデルを用いてDiffusionモデルに匹敵する結果が得られることを示す。
テキストコンディショニングや拡張などの設計選択がISRモデルの性能に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:19:59 GMT)
Reframing the Relationship in Out-of-Distribution Detection [4.2] 本稿では,エージェントパラダイムをアウト・オブ・ディストリビューション(OOD)検出タスクに統合する新しいアプローチを提案する。
提案手法であるConcept Matching with Agent (CMA) は、CLIPに基づくOOD検出プロセスを強化するために、中性プロンプトをエージェントとして利用する。
実験結果から, ゼロショット法とトレーニング要求法の両方よりもCMAの方が優れた性能を示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:27:28 GMT)
Surface reconstruction of sampled textiles via Morse theory [4.2] サンプル繊維表面の直接トポロジカルな研究に基づく再構成アルゴリズムを提案する。
中間三角法や局所暗黙の方程式は使われず、再建によって引き起こされる工芸品を避ける。
このアルゴリズムは、任意の次元の周囲空間に埋め込まれた境界の有無にかかわらず滑らかな曲面に適用することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:14:47 GMT)
Simplicity Bias of Two-Layer Networks beyond Linearly Separable Data [4.1] 重みが小さい2層ニューラルネットワークの文脈における一般データセットの単純さバイアスを特徴付け、勾配流を訓練する。
XORのようなパターンを持つデータセットに対しては、学習した特徴を正確に識別し、後続のトレーニング段階で単純さのバイアスが強まることを示す。
これらの結果から,訓練中期に学習した特徴がOOD伝達に有用である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:00:45 GMT)
On the Distance from Calibration in Sequential Prediction [4.1] キャリブレーション距離から予測器を評価可能な逐次二分予測条件について検討する。
キャリブレーション距離は、完全キャリブレーションから逸脱する自然で直感的な尺度である。
我々は,逆選択された$T$バイナリ結果の列に対して,予測において$O(sqrtT)$キャリブレーション距離を達成できる予測アルゴリズムが存在することを証明した。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:25:05 GMT)
CudaSIFT-SLAM: multiple-map visual SLAM for full procedure mapping in real human endoscopy [4.1] CudaSIFT-SLAMは人間の大腸全摘をリアルタイムで処理できる最初のV-SLAMシステムである。
我々は,C3VDファントム結腸データセットと,Endomapperデータセットからの完全な実大腸内視鏡で本システムをベンチマークした。
我々のシステムは,C3VDデータセットのフレームの88%をリアルタイムでマッピングすることに成功した。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:26:19 GMT)
What's the Opposite of a Face? Finding Shared Decodable Concepts and their Negations in the Brain [4.1] 我々は、自然視画像観察中に脳の反応をCLIP埋め込みにマッピングする非常に正確なコントラストモデルを訓練する。
次に、DBSCANクラスタリングアルゴリズムの新たな適応を用いて、参加者固有のコントラストモデルパラメータをクラスタリングする。
各SDCクラスタに最も多く,最も関連付けられていない画像を調べることで,各SDCのセマンティック特性についてさらなる知見が得られる。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:28:26 GMT)
Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model [4.1] 異なるビットレートで画像を圧縮する可変レート生成NICモデルを提案する。
提案手法を取り入れることで,ビットレート,歪み,リアリズムを1つのモデルで調整することができる。
我々の手法は、最先端の単一レート NIC モデルの性能と一致するか、上回っている。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:22:25 GMT)
LLM meets Vision-Language Models for Zero-Shot One-Class Classification [4.1] ゼロショットワンクラス視覚分類の問題を考える。
本稿では、視覚的に混乱するオブジェクトに対して、まず大きな言語モデルをクエリする2段階のソリューションを提案する。
我々は,そのラベルのみを用いて,あるカテゴリと他のセマンティック関連カテゴリを識別する能力を初めて示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:53:15 GMT)
Accelerating Simulation of Two-Phase Flows with Neural PDE Surrogates [3.9] 二相流問題のスケーリングシミュレーションを支援するツールとして,ニューラルPDEソルバを検討・拡張する。
この問題に対する既存の数値解法を、領域の様々な測度を含むより複雑な設定に拡張する。
その結果,最大3桁の速さで液滴力学を正確にモデル化できることがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:18:12 GMT)
Class Distribution Shifts in Zero-Shot Learning: Learning Robust Representations [3.9] シフトの原因となる属性が事前に不明であると仮定するモデルを提案する。
提案手法は,シミュレーションと実世界のデータセットの両方において,多様なクラス分布の一般化を改善する。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:19:20 GMT)
Graph Neural Networks on Quantum Computers [3.9] グラフニューラルネットワーク(GNN)は、グラフとして表される構造化データを分析するための強力な機械学習モデルである。
本稿では,量子コンピュータ上でGNNを実装するためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:31:08 GMT)
Estimating Depth of Monocular Panoramic Image with Teacher-Student Model Fusing Equirectangular and Spherical Representations [3.8] 本研究では, 単眼パノラマ画像の深度を, 正方形および球形表現を融合した教師学生モデルを用いて推定する手法を提案する。
実験では、よく知られた360度単分子深度推定ベンチマークを用いて、提案手法を検証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:11:16 GMT)
Towards Optimizing with Large Language Models [3.8] 各種タスクやデータサイズにまたがるLLMの最適化能力の評価を行う。
様々な視点からタスクパフォーマンスの総合評価を行うために,3つの異なる指標を紹介した。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:13:26 GMT)
SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs [3.7] 自動運転におけるトレイ予測は、運転シーンのすべての関連状況の正確な表現に依存している。
本稿では,交通シーングラフの推論によるマルチモーダル軌道の予測手法であるSemanticFormerを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:56:12 GMT)
Kronecker-Factored Approximate Curvature for Physics-Informed Neural Networks [3.7] PINN損失に対するKronecker-factored almost curvature (KFAC)を提案する。
我々のKFACベースの勾配は、小さな問題に対する高価な2階法と競合し、高次元のニューラルネットワークやPDEに好適にスケールし、一階法やLBFGSを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:23:46 GMT)
SiNGR: Brain Tumor Segmentation via Signed Normalized Geodesic Transform Regression [3.7] 本稿では,脳腫瘍近傍の不確かさを捉えるために,新しい基底真理ラベル変換を提案する。
このアイデアを、高次元出力空間における効果的な回帰学習を可能にするFocal-like regression L1-lossと組み合わせる。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:14:20 GMT)
Image-level Regression for Uncertainty-aware Retinal Image Segmentation [3.7] 本稿では,網膜画像を画像レベルの回帰タスクとしてキャストする,シンプルで効果的な手法を提案する。
この目的のために,まず,新しい不確実性認識変換(SAUNA)を導入する。
ソフトラベルでモデルをトレーニングするために、提案したジャカード計量損失を任意のハイパーキューブに一般化する。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:17:10 GMT)
Multi-qubit Lattice Surgery Scheduling [3.7] 量子回路は、唯一の非クリフォード多ビットゲートの列に変換できる。
本研究では, トランスパイレーションにより, テストした回路の回路長が大幅に減少することを示す。
結果として生じるマルチキュービットゲート回路は、シリアル実行よりも期待される回路実行時間を短縮する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:41:41 GMT)
Survey of Graph Neural Network for Internet of Things and NextG Networks [3.6] グラフニューラルネットワーク(GNN)は、洞察を効果的にモデル化し抽出するための有望なパラダイムとして登場した。
この調査は、GNNの用語、アーキテクチャ、および異なるタイプのGNNについて、詳細な説明を提供する。
次に、GNNがネットワークシステムや戦術システムにどのように活用されているかについて詳細な説明を行う。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:10:49 GMT)
Uncertainty Management in the Construction of Knowledge Graphs: a Survey [3.6] 知識グラフ(KG)は、データ表現の柔軟性のおかげで、企業にとって重要な資産です。
KGを構築するには、様々な異種情報源から知識を抽出する自動手法に頼るのが一般的である。
騒々しく不確実な世界では、知識は信頼できないかもしれないし、データソース間の衝突が起こるかもしれない。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:22:52 GMT)
EDEFuzz: A Web API Fuzzer for Excessive Data Exposures [3.5] Excessive Data Exposure(EDE)は2019年で3番目に重大なAPI脆弱性である。
このような問題を効果的に発見し、修正する自動化ツールが、研究や業界でもほとんどありません。
EDEFuzzと呼ばれる最初のファジィツールを構築し、EDEを体系的に検出します。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:49:43 GMT)
Improving Data-aware and Parameter-aware Robustness for Continual Learning [3.5] 本報告では, オフラヤの非効率な取扱いから, この不整合が生じることを解析する。
本稿では,ロバスト連続学習(RCL)手法を提案する。
提案手法は, 堅牢性を効果的に維持し, 新たなSOTA(State-of-the-art)結果を得る。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:21:26 GMT)
Oblivious Monitoring for Discrete-Time STL via Fully Homomorphic Encryption [3.5] 本稿では,サーバから算術データを隠蔽するオンラインモニタリングプロトコルを提案する。
このプロトコルは、例えば、距離、速度などを組み合わせた安全測定を計算できるように、暗号化された値上での操作を可能にする。
本プロトコルは,信号時間論理(STL)に対する離散時間実数値信号のオンラインモニタリングを可能にする。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:32:16 GMT)
CoBra: Complementary Branch Fusing Class and Semantic Knowledge for Robust Weakly Supervised Semantic Segmentation [3.4] 本稿では,クラス(CNN)とセマンティック(ViT)の相補的知識を提供する2つの異なるアーキテクチャからなる新しい2つの分岐フレームワークを提案する。
我々のモデルはCoBraを通じてCNNとViTの補完的な出力を融合し、クラス情報とセマンティック情報の両方を効果的に統合する堅牢な擬似マスクを生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:00:41 GMT)
CrEIMBO: Cross Ensemble Interactions in Multi-view Brain Observations [3.4] CrEIMBO (Cross-Ensemble Interactions in Multi-view Brain Observations) は、セッションごとの神経アンサンブルの構成を同定する。
CrEIMBOはセッション固有とグローバルな(セッション不変)計算を区別し、異なるサブ回路がアクティブであるかを探索する。
合成データ中の真理成分を復元し、意味のある脳動力学を明らかにするCrEIMBOの能力を実証する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:48:32 GMT)
Physics-Informed Real NVP for Satellite Power System Fault Detection [3.4] 本稿では,AIに基づく障害検出手法を提案し,ADAPTデータセット上での性能評価を行う。
本研究では,物理インフォームド(PI)実数値非体積保存(Real NVP)モデルを宇宙システムにおける故障検出に適用することに焦点を当てた。
その結果,我々の物理インフォームド・アプローチは既存の故障検出方法よりも優れており,衛星EPSサブシステム障害の課題に対処できる可能性が示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:42:51 GMT)
SWAT: Scalable and Efficient Window Attention-based Transformers Acceleration on FPGAs [3.3] スライディングウィンドウベースの静的スパースアテンションは、入力トークンのアテンションスコープを制限することで問題を緩和する。
本稿では,データフローを意識したFPGAベースのアクセラレーション設計であるSWATを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:25:08 GMT)
The Over-Certainty Phenomenon in Modern UDA Algorithms [3.3] 我々は、ニューラルネットワークが観測するデータの認識に関連して、決定境界を再検討することを目指している。
精度を向上するだけでなく,モデルのキャリブレーションも保証するUDAアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:58:00 GMT)
The MQT Handbook: A Summary of Design Automation Tools and Software for Quantum Computing [3.3] Munich Quantum Toolkit (MQT) は、ミュンヘン工科大学のChair for Design Automationによって開発された、量子コンピューティングのためのソフトウェアツールの集合体である。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:00 GMT)
Mixtures of Unsupervised Lexicon Classification [3.3] 本稿では,ディリクレプロセスの組み込みによる,モーメント・オブ・モーメント・アン教師付き語彙分類の混合バージョンを提案する。
本稿では,モーメント・アン教師付き辞書分類法とディリクレ法を組み合わせる。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:33:47 GMT)
The Scaling Law in Stellar Light Curves [3.1] 本稿では,天文時系列データから学習する際の法則のスケーリングについて,自己監督的手法を用いて検討する。
自己教師付きトランスフォーマーモデルは,最先端の教師付き学習モデルと比較して,サンプル効率を3~10倍に向上させる。
本研究は,大規模自己回帰生成モデルを用いて恒星の光度曲線を解析するための基礎研究である。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:31:03 GMT)
Probabilistic Verification of Neural Networks using Branch and Bound [3.1] ニューラルネットワークの確率的検証は、入力の確率分布の下で、ニューラルネットワークの出力を正式に解析することに関わる。
本稿では,ニューラルネットワークの確率的検証を計算アルゴリズムに基づいて定量化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:03 GMT)
Unicode Normalization and Grapheme Parsing of Indic Languages [3.0] インド語の表記体系は、一意の水平単位として、複素グラフエム(complex graphemes)としても知られる正書法音節を持つ。
提案した正規化器は、以前使用したIndic normalizerよりも効率的で効果的なツールである。
本研究では,7言語スクリプトのパイプラインを報告し,さらに多くのスクリプトを統合するためのフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:48:00 GMT)
Almost sure convergence rates of stochastic gradient methods under gradient domination [3.0] 大域的および局所的な勾配支配特性は、強い凸性のより現実的な置き換えであることが示されている。
収束率 $f(X_n)-f*in obig(n-frac14beta-1+epsilonbig)$ は勾配降下の最終反復である。
教師付き学習と強化学習の両方において,本研究結果をトレーニングタスクに適用する方法を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:43:50 GMT)
Is it Possible to Modify Text to a Target Readability Level? An Initial Investigation Using Zero-Shot Large Language Models [2.9] 読みやすさを制御した新しいテキスト修正タスクを提案する。
このタスクでは、各入力テキストに対して、様々なターゲット可読レベルで8つのバージョンを生成する必要がある。
ソーステキストとターゲットテキストのセマンティクスや語彙的類似性が低下し,可読性が大きく変化した。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:05:31 GMT)
Container pre-marshalling problem minimizing CV@R under uncertainty of ship arrival times [2.9] コンテナ事前マーシャリングの問題は、格納領域内のコンテナを移動させることで、再シャッフルすることなく、効率よく船にロードできるようにすることである。
最適なコンテナレイアウトを見つけるために,混合整数線形最適化モデルを導出する。
大規模問題に対処するための切削平面法に基づく正確なアルゴリズムを考案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:19:09 GMT)
Semi-supervised Multimodal Representation Learning through a Global Workspace [2.9] グローバルワークスペース」は2つの入力モダリティの共有表現である。
このアーキテクチャは、サイクル一貫性による自己教師型トレーニングに適しています。
このようなアーキテクチャは、一致したデータを必要とすることがほとんどなく、2つのモダリティを調整し、翻訳するように訓練できることを示します。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:43:02 GMT)
Novel Approaches for ML-Assisted Particle Track Reconstruction and Hit Clustering [2.8] 軌道再構成は高エネルギー物理学(HEP)の重要な側面であり、主要な実験において重要な役割を果たしている。
我々は、簡易なシミュレータ(REDVID)を使用して、簡易性のために特別に構成されたトレーニングデータを生成する。
我々は、ヒットシーケンスをヒットシーケンスとして扱い、シーケンス変換問題をトラックする。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:23:50 GMT)
Continuous Diffusion for Mixed-Type Tabular Data [2.8] 混合型タブラリデータのための連続拡散モデルCDTDを提案する。
我々は、異なる適応的なノイズスケジュールを持つ混合型のデータに固有の高い不均一性に対処する。
実験の結果,CDTDは最先端のベンチマークモデルより一貫して優れていた。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:07:39 GMT)
TSIS with A Comparative Study on Linear Molecular Representation [2.8] フラグメントに基づく線形分子表現として,t-SMILESファミリーに符号化アルゴリズムTSISを導入する。
TSISはTSIDに匹敵する性能を示し、SMILES、SELFIES、SAFEを大きく上回っている。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:07:17 GMT)
Laurel: Generating Dafny Assertions Using Large Language Models [2.7] 本稿では,大規模な言語モデル(LLM)を用いて,Dafnyプログラムのヘルパーアサーションを自動的に生成するツールであるLaurillを提案する。
Laurelは数回の試行で、必要なヘルパーアサーションの50%以上を生成することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:26:01 GMT)
Unifying Perspectives: Plausible Counterfactual Explanations on Global, Group-wise, and Local Levels [2.7] 説明可能なAI(xAI)における有望なテクニックとして、CF(Counterfactual Explanations)が登場している。
本稿では, 局所的, グループ的, グローバルな対実的説明を識別可能な分類モデルに対して生成するための統一的アプローチを提案する。
我々の研究は、AIモデルの解釈可能性と説明可能性を大幅に向上させ、透明なAI追求の一歩を踏み出した。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:32:09 GMT)
DSU-Net: Dynamic Snake U-Net for 2-D Seismic First Break Picking [2.7] 地震探査において、第1破片(FB)の同定は地下速度モデルを確立する上で重要な要素である。
本稿では,2次元地震FBピッキングタスクのための新しいセマンティックセグメンテーションネットワークを提案し,U-Netに動的ヘビ畳み込みを導入する。
具体的には,ショット集合の浅部における水平連続特性を抽出できる新しいDSConvモジュールを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:22:22 GMT)
Isotropy, Clusters, and Classifiers [2.6] 我々は、等方性がクラスタの存在と互換性のない埋め込み空間に要求を課すことを強調する。
我々は、この事実を数学的にも経験的にも証明し、文献の以前の結果に光を当てるために使用します。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:21:08 GMT)
User Decision Guidance with Selective Explanation Presentation from Explainable-AI [2.6] IDSSがユーザーの意思決定を強化するための説明をどうやって選ぶべきかは、未解決の問題である。
本稿では,XAI説明を選択的に提示するX-セレクタを提案する。
これによりIDSSは、AIが推奨する決定に戦略的にユーザーを導くことができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:40:54 GMT)
Identifiability of total effects from abstractions of time series causal graphs [2.6] 本研究では,観測時系列からの介入による全効果の同定可能性の問題について検討する。
我々は、拡張された要約因果グラフと要約因果グラフの2つの抽象概念を考察する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:10:40 GMT)
Discriminant audio properties in deep learning based respiratory insufficiency detection in Brazilian Portuguese [2.5] 本研究では,音声分析により呼吸不全(RI)を検出する人工知能(AI)システムについて検討する。
パンデミックの第1段階で、新型コロナウイルス患者からRIデータ(P1)を収集した。
我々は、AIベースのRI検出を拡張すべく、COVID-19以外のいくつかの原因からRI患者データ(P2)を収集した。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:04:49 GMT)
Generating Likely Counterfactuals Using Sum-Product Networks [2.5] 提案手法では,多くのデシラタを満足する最も可能性の高い説明の探索を混合整数最適化 (MIO) を用いてモデル化できることが示されている。
本プロセスでは,SPN(Sum-Product Network)のMIO定式化を提案し,SPNを用いて逆実数の可能性を評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:17:08 GMT)
A note on the error analysis of data-driven closure models for large eddy simulations of turbulence [2.5] データ駆動型乱流閉鎖モデルを用いた流路予測における誤差伝搬の数学的定式化について述べる。
データ駆動クロージャモデルを用いて予測誤差の上限を求める。
また, この誤差は, ロールアウト時間とシステムジャコビアン上界とともに指数関数的に伝播することを示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:20:22 GMT)
GRAPES: Learning to Sample Graphs for Scalable Graph Neural Networks [2.4] グラフニューラルネットワークは、隣人からの情報を集約することでノードを表現することを学ぶ。
いくつかの既存手法では、ノードの小さなサブセットをサンプリングし、GNNをもっと大きなグラフにスケールすることで、この問題に対処している。
本稿では,GNNのトレーニングに不可欠なノードの集合を識別する適応サンプリング手法であるGRAPESを紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:37:04 GMT)
PanoTree: Autonomous Photo-Spot Explorer in Virtual Reality Scenes [2.4] ソーシャルVRでは、VRシーン内の写真は訪問者の活動を示す重要な指標である。
我々は、VRシーンにおける自動写真スポットエクスプローラーであるPanoTreeを提案する。
ディープスコアリングネットワークは、ソーシャルVRプラットフォームが収集した大量の写真をトレーニングし、人間が同様の写真を撮るかどうかを判断する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:54:05 GMT)
Analysis of Multiscale Reinforcement Q-Learning Algorithms for Mean Field Control Games [2.4] MFCG(Mean Field Control Games)は、多数のエージェント間の競争ゲームである。
MFCGを解くために,3次元強化Q-Learning (RL) アルゴリズムの収束性を証明する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:01:52 GMT)
Study of Robust Direction Finding Based on Joint Sparse Representation [2.3] スパース信号回復(SSR)に基づく新しいDOA推定法を提案する。
グリッドミスマッチの問題に対処するために、交互最適化アプローチを用いる。
シミュレーションの結果,提案手法は大きな外れ値に対してロバスト性を示すことがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:26:37 GMT)
Locally Testing Model Detections for Semantic Global Concepts [2.3] 本稿では,グローバルな概念エンコーディングを単一ネットワーク入力の局所処理にリンクするフレームワークを提案する。
提案手法は,セマンティック概念のモデル内符号化を完全に網羅する利点がある。
その結果, 個々のグローバルな概念エンコーディングの局所的認識と使用法に大きな違いが認められた。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:52:45 GMT)
Low-Rank Approximation of Structural Redundancy for Self-Supervised Learning [2.3] 本研究では,その有効性に光を当てるために,再構成SSLのデータ生成機構について検討する。
ラベル付きサンプルの無限の量で、完全線形近似に十分かつ必要な条件を提供する。
この条件により、低ランク因子化による冗長成分の近似を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:11:00 GMT)
PlaceFormer: Transformer-based Visual Place Recognition using Multi-Scale Patch Selection and Fusion [2.3] PlaceFormerは、視覚的位置認識のためのトランスフォーマーベースのアプローチである。
PlaceFormerは、トランスフォーマーからのパッチトークンを使用して、グローバルなイメージ記述子を生成する。
イメージ内のタスク関連領域に対応するパッチを選択する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:18:45 GMT)
Computational Complexity of Preferred Subset Repairs on Data-Graphs [2.3] データ値を持つグラフデータベースを優先的に修復する問題について検討する。
本稿では,標準的なサブセット修復セマンティクスに基づいて,いくつかの選好基準を示す。
優先基準が適用できない場合と同様の計算複雑性を維持可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:24:32 GMT)
A Correlation- and Mean-Aware Loss Function and Benchmarking Framework to Improve GAN-based Tabular Data Synthesis [2.2] 本稿では,GAN(Generative Adversarial Network)のための新しい相関と平均認識損失関数を提案する。
提案した損失関数は、真のデータ分布をキャプチャする既存の手法よりも統計的に有意な改善を示す。
ベンチマークフレームワークは、強化された合成データ品質により、下流の機械学習タスクのパフォーマンスが向上することを示している。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:08:08 GMT)
The second-order zero differential uniformity of the swapped inverse functions over finite fields [2.2] 置換された逆関数の2階ゼロ微分均一性について検討する。
この論文は、偶数標数で 4 に等しい二階ゼロ微分均一性を持つ非パワー関数の類を特徴づける最初の結果である。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:11:57 GMT)
Time Elastic Neural Networks [2.2] 時間弾性ニューラルネットワーク(teNN)という,非定型ニューラルネットワークアーキテクチャの導入と詳細化について述べる。
古典的ニューラルネットワークアーキテクチャと比較して新しいのは、時間ゆがみ能力を明確に組み込んでいることだ。
トレーニング過程において,TENNは各細胞に必要となるニューロン数を減少させることに成功した。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:01:30 GMT)
Effective Learning with Node Perturbation in Multi-Layer Neural Networks [2.1] node perturbation (NP) は、ネットワークアクティベーションにノイズを注入することで学習を提案する。
NPは、非誘導ノイズに基づく探索プロセスのため、データ非効率で不安定である。
各層での入力デコリレーションと指向性デリバティブとの密接なアライメントはNP学習の性能を強く向上させる。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:15:45 GMT)
Convergence of SGD with momentum in the nonconvex case: A novel time window-based analysis [2.0] モーメントを伴う勾配降下法の収束挙動を解析するための時間窓に基づく新しい解析手法を提案する。
我々は、Kka-Lojasiewicz (KL) 特性の下でSGDMの最初の反復結果を確立する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:46:28 GMT)
Biological Neurons Compete with Deep Reinforcement Learning in Sample Efficiency in a Simulated Gameworld [2.0] 我々は,in vitro生物ニューラルネットワークの学習効率と最先端深部強化学習(RL)アルゴリズムを比較し,ゲームポンの簡易シミュレーションを行った。
複数の種類の情報入力でテストしても、生物学的ニューロンは、すべての深層強化学習エージェントよりも学習が速かった。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:38:17 GMT)
CHESS: Contextual Harnessing for Efficient SQL Synthesis [2.0] 我々は,関連するデータとコンテキストを検索し,効率的なスキーマを選択し,正確で効率的なクエリを合成する新しいパイプラインを提案する。
提案手法は,BIRDデータセットの領域横断における最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:54:16 GMT)
Triple-CFN: Restructuring Concept Spaces for Enhancing Abstract Reasoning Process [1.8] 画像から概念と特徴を別々に抽出する新しいフレームワークであるCross-Feature Network (CFN)を紹介した。
抽出した概念と特徴をCFN内に組み込んだ期待最大化プロセスを統合することで,顕著な結果を得た。
また、RPM問題に適した概念空間を明示的に構築した、Triple-CFNの先進バージョンであるMeta Triple-CFNについても紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:21:18 GMT)
D4C Glove-train: Solving the RPM and Bongard-logo Problem by Circumscribing and Building Distribution for Concepts [1.8] 本稿では,RPM問題を解決する新しいベースラインモデルLico-Netを紹介する。
我々は、分布を通して抽象的推論問題において基礎となる概念を提唱するD3Cアプローチを推進している。
我々は、我々の方法論をD4Cに拡張し、さらに概念境界を洗練させるために敵対的手法を適用した。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:25:47 GMT)
The Peripatetic Hater: Predicting Movement Among Hate Subreddits [1.8] 我々は、ヘイト・サブレディットを分類するために新しい方法を使用し、それらが分離するアイデンティティを分類する。
ユーザーの最初のヘイトサブレディットでアクティブになることは、異なるカテゴリーのヘイトサブレディットに追加のヘイトサブレディットでアクティブになる可能性があることを示す。
また、ヘイトサブレディットの追加に参加するユーザー、特に異なるカテゴリーのユーザーが、ヘイトサブレディット全体でより活発になることもわかりました。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:57:05 GMT)
Protecting Federated Learning from Extreme Model Poisoning Attacks via Multidimensional Time Series Anomaly Detection [1.7] FLANDERSは,大規模モデル中毒に対するFL耐性を示す新しいプレアグリゲーションフィルタである。
FLANDERSは、FLANDERSが標準およびロバストな既存のアグリゲーション手法と組み合わせることで、幅広い攻撃範囲にわたるロバスト性を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:30:37 GMT)
R2D2 image reconstruction with model uncertainty quantification in radio astronomy [1.7] Residual-to-Residual'(R2D2)アプローチは、天文学におけるRI(Radio-Interferometric)イメージングのために最近導入された。
R2D2の再構成は、ディープニューラルネットワーク(DNN)の出力として反復的に推定される一連の残像として形成される
本稿では,R2D2画像推定プロセスのロバスト性について,その一連の学習モデルに関連する不確実性について検討する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:14:55 GMT)
Pseudomagic Quantum States [1.7] 非安定化性(Notions of nonstabilizerness)とは、非古典的な量子状態が正確にどのようにあるのかを定量化したものである。
量子状態の「擬似的」アンサンブルは、非安定化性は低いが、非安定化性が高いものとは計算的に区別できない。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:19:29 GMT)
Advancements in Tactile Hand Gesture Recognition for Enhanced Human-Machine Interaction [1.6] 本研究は,直感的物理的ヒューマン・マシーンインタラクション(HRI/HVI)の強化への関心が高まっている。
導電性繊維で構築した大面積触覚触覚インタフェース(タッチインターフェース)に対して,手動作認識のアプローチを総合的に評価した。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:44:27 GMT)
Sketch-and-Project Meets Newton Method: Global $\mathcal O(k^{-2})$ Convergence with Low-Rank Updates [1.6] 高速な$mathcal O(k-2)$大域収束率を持つスケッチ・アンド・プロジェクトニュートン法を提案する。
SGNは、スケッチ・アンド・プロジェクト方式の安価なイテレーションコスト、最先端の$mathcal O(k-2)$フルランクニュートン方式のグローバル収束率、減衰ニュートン方式のアルゴリズム単純さの3つを継承している。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:10:06 GMT)
How Does Perfect Fitting Affect Representation Learning? On the Training Dynamics of Representations in Deep Neural Networks [1.6] トレーニング中に深層ニューラルネットワーク(DNN)の表現がどのように進化するかを明らかにする。
深層層での表現は、エポックな2重降下が起こると、より深く進化することを示す。
Vision Transformerでは、完全整合しきい値がすべてのエンコーダブロックにおける表現の進化の遷移をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:33:03 GMT)
Fusing uncalibrated IMUs and handheld smartphone video to reconstruct knee kinematics [1.6] 本稿では,ハンドヘルドスマートフォンの映像とウェアラブルセンサデータの完全な時間分解能を両立させる手法を提案する。
歩行障害のない人,下肢義肢使用者,脳卒中歴のある人を対象に,これを検証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:23:16 GMT)
Approximate complex amplitude encoding algorithm and its application to data classification problems [1.5] 古典的なデータベクトルを量子状態にロードするタスクは指数的な数の量子ゲートを必要とする。
量子状態の振幅に与えられた実数値データベクトルを大まかにロードする変動手段を用いた近似振幅符号化(AAE)法は,近距離デバイスを中心にこの問題に対する一般的なアプローチとして最近提案されている。
本研究では, AAEを拡張して, 複素数値データベクトルを扱えるようにする。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:20:11 GMT)
Loss Landscape of Shallow ReLU-like Neural Networks: Stationary Points, Saddle Escaping, and Network Embedding [1.5] 経験的二乗損失を学習したReLU様活性化関数を持つ一層ニューラルネットワークの損失状況について検討した。
アクティベーション関数は微分不可能であるため、固定点を完全に特徴づける方法は今のところ不明である。
定常点が一階条件で定義される「エスケープニューロン」を含まない場合、局所最小値でなければならないことを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:08:59 GMT)
Mechanistic Interpretability of Binary and Ternary Transformers [1.4] 完全精度の変圧器ネットワークと比較して,二進変圧器ネットワークと三進変圧器ネットワークが明らかに異なるアルゴリズムや類似のアルゴリズムを学習するかどうかを検討する。
これは、Large Language Modelsの設定において、より解釈可能な代替手段としてバイナリと3次ネットワークを使用する可能性を示す証拠を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:22:23 GMT)
Beyond static AI evaluations: advancing human interaction evaluations for LLM harms and risks [1.3] ヒューマンインタラクション評価」は、人間-モデルインタラクションの評価に焦点を当てている。
安全に焦点を当てた3段階のHIE設計フレームワークを提案する。
我々は,HIEのコスト,複製性,非表現性に関する懸念に対処するための具体的な勧告で締めくくっている。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:09:57 GMT)
Annotation and Classification of Relevant Clauses in Terms-and-Conditions Contracts [1.2] 本稿では,契約条件と契約条件の異なる節を分類するアノテーション手法を提案する。
検証作業において,79~95の精度を達成し,カテゴリの自動分類の実現可能性を示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:06:41 GMT)
A novel framework for systematic propositional formula simplification based on existential graphs [1.1] 本稿では、パースの実在グラフの推論と含意グラフの規則から導かれる命題論理の単純化計算について述べる。
我々の規則は、ネスト形式の命題論理式に適用でき、同値保存であり、単調に減少する変数、節、リテラルの数を保証し、構造的問題情報の保存を最大化することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:42:46 GMT)
Video Enriched Retrieval Augmented Generation Using Aligned Video Captions [1.1] 並べられた視覚キャプション」は、大きなコーパス内のビデオの視覚的および音声的内容を表す。
視覚的なキャプションは、オリジナルの基礎モデル/キャプタに特定の視覚的詳細や微調整を促すことで、特定のユースケースに適応することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:39:17 GMT)
Unveiling Themes in Judicial Proceedings: A Cross-Country Study Using Topic Modeling on Legal Documents from India and the UK [1.1] 過去の事例をサブグループに体系的に分類することが重要である。
この取り組みの主な焦点は、ラテントディリクレ割当、非負行列分解、ベルトトピックといったトピックモデリングアルゴリズムを用いて、ケースをアノテートすることであった。
インドからの症例の時系列分析は、長年にわたって支配的なトピックの進化を明らかにするために行われた。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:26:50 GMT)
Why are Sensitive Functions Hard for Transformers? [1.1] トランスアーキテクチャでは,ロスランドスケープは入力空間の感度によって制約されていることを示す。
我々は,この理論が変圧器の学習能力とバイアスに関する幅広い経験的観察を統一することを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:01:29 GMT)
Recurrent and Convolutional Neural Networks in Classification of EEG Signal for Guided Imagery and Mental Workload Detection [1.0] 本稿では,26名の学生を対象に,高密度アレイ脳波増幅器を用いたガイド画像緩和技術と精神作業負荷に関する調査を行った。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:49:30 GMT)
HiddenSpeaker: Generate Imperceptible Unlearnable Audios for Speaker Verification System [1.0] 学習音声サンプルに知覚不能な摂動を埋め込んだHiddenSpeakerというフレームワークを提案する。
以上の結果から,HiddenSpeakerは学習不可能なサンプルでモデルを騙すだけでなく,摂動の知覚能力を高めることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:33:22 GMT)
Phase Transitions in the Output Distribution of Large Language Models [0.9] 物理系において、温度などのパラメータの変化は、ある物質の状態から別の状態への急激な変化である相転移を誘導することができる。
相転移を識別するタスクは、人間の分析とシステムの事前理解を必要とし、どの低次元特性をモニターし分析するかを絞り込む。
近年,データから位相遷移を自動的に検出する統計手法が物理学界で提案されている。
統計的距離を用いて生成した出力の分布変化を定量化し、次点上の確率分布にアクセスして効率的に推定する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:04:36 GMT)
Facilitating Advanced Sentinel-2 Analysis Through a Simplified Computation of Nadir BRDF Adjusted Reflectance [0.9] sen2nbar は Sentinel-2 (S2) Surface Reflectance (SR) データを Nadir BRDF Adjusted Reflectance (NBAR) に変換するために作られた Python パッケージである。
Sen2nbarは、多様なデータフォーマット要求を処理する柔軟なツールとして開発されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:40:54 GMT)
The Expressive Capacity of State Space Models: A Formal Language Perspective [0.9] 線形状態空間モデル(SSM)に基づくリカレントモデルは、言語モデリング(LM)において有望な性能を示した。
本稿では,変換器や従来のRNNと比較して,そのようなSSMの容量に関する包括的理論的研究を行う。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:46:57 GMT)
Enhancing the analysis of murine neonatal ultrasonic vocalizations: Development, evaluation, and application of different mathematical models [0.8] ネズミは、社会コミュニケーションに幅広い超音波発声(USV)を使用する。
本稿では,USV分類のための異なるタイプのニューラルネットワークを初めて体系的に評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:42:45 GMT)
BaboonLand Dataset: Tracking Primates in the Wild and Automating Behaviour Recognition from Drone Videos [0.8] 本研究では,バブーン検出,追跡,行動認識のための,ドローンビデオからの新たなデータセットを提案する。
Baboon検出データセットは、ドローンビデオにすべてのbaboonをバウンディングボックスで手動でアノテートすることで作成されている。
行動認識データセットは、各動物を中心としたビデオサブリージョンであるミニシーンにトラックを変換することで生成される。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:09:37 GMT)
Can Generative Models Improve Self-Supervised Representation Learning? [0.8] 本稿では、生成モデルを利用して意味論的に一貫した画像拡張を生成することによって、自己指導型学習パラダイムを充実させる新しいフレームワークを提案する。
その結果,下流タスクにおいて,学習した視覚表現の精度を最大10%向上させることができた。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:49:10 GMT)
Quantum Parity Detectors: a qubit based particle detection scheme with meV thresholds for rare-event searches [0.8] 量子パリティ検出器(QPD)は、超伝導量子ビットの膨大な感度を利用して準粒子トンネル現象を検知する。
我々は,QPDの動作機構,ノイズ源,および予測感度を,電荷量子タイプと読み出し機構のスペクトルに基づいて明らかにした。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:17:33 GMT)
Tilt your Head: Activating the Hidden Spatial-Invariance of Classifiers [0.8] ディープニューラルネットワークは、日々の生活の多くの領域に適用されている。
これらは、空間的に変換された入力信号に頑健に対処するなど、依然として必須の能力が欠如している。
本稿では,ニューラルネットの推論過程をエミュレートする新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:09:08 GMT)
Performance evaluation of Reddit Comments using Machine Learning and Natural Language Processing methods in Sentiment Analysis [0.8] 我々は、Reddit上で58,000のコメントを寄せ集め、感情分析手法を評価した。
我々の研究は、様々なモデルの配列を評価することによって、範囲を広げる。
以上の結果から,RoBERTaモデルはベースラインモデルよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:59:28 GMT)
Practical limitations on robustness and scalability of quantum Internet [0.7] 量子インターネットのスケーリングとロバスト性に関する限界について検討する。
本稿では,セキュアな通信,デリゲートコンピューティング,および終端ノード間のリソース分布の現実的なボトルネックについて述べる。
量子ネットワークのいくつかの例では、異なる量子ネットワークタスクを実行するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:29:47 GMT)
Analysis of Internet of Things Implementation Barriers in the Cold Supply Chain: An Integrated ISM-MICMAC and DEMATEL Approach [0.7] コールドサプライチェーンにおけるIoT実装に対する重要な障壁が特定される。
IoT採用戦略の主要な要因は、“規則順守”と“コールドチェーンネットワーク”である。
この調査の結果は、業界関係者、政府、組織にIoT採用の大きな推進力を与え、これらの障壁を克服する。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:13:33 GMT)
Generation and human-expert evaluation of interesting research ideas using knowledge graphs and large language models [0.7] SciMuseは5800万以上の科学論文から構築された知識グラフを利用して、パーソナライズされた研究アイデアを生成するシステムである。
データ効率のよい機械学習は、高い精度で研究の関心を予測でき、生成した研究のアイデアの関心レベルを最適化できる。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:00:51 GMT)
Saturated absorption spectroscopy and frequency locking of DBR laser on the D2 transition of rubidium atoms [0.7] Rb原子のLD2遷移に0.5MHz線幅を有する狭帯域DBRレーザーの飽和吸収分光(SAS)および周波数同期(FL)を実験的に報告した。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:37:35 GMT)
EnCoMP: Enhanced Covert Maneuver Planning with Adaptive Threat-Aware Visibility Estimation using Offline Reinforcement Learning [0.7] 本研究では,多様な屋外環境下でロボットが隠ぺいにナビゲートできるように改良されたナビゲーションフレームワークであるEnCoMPを提案する。
我々は、LiDAR点雲からカバーマップ、潜在的な脅威マップ、高さマップ、ゴールマップを含む高忠実度マルチマップ表現を生成する。
物理的ジャカルロボット上での手法の能力を実証し,多様な地形で実験を行った。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:07:28 GMT)
PAE: LLM-based Product Attribute Extraction for E-Commerce Fashion Trends [0.6] 本稿では,PDF形式のテキストと画像からなる今後のトレンドレポートのための製品属性抽出アルゴリズムであるPAEを提案する。
a) 構造化されていないデータ(テキストと画像)から属性を抽出する効率的なフレームワークであるPAEを開発する; (b) 今後の属性値を用いて既存の属性を検出するためのBERT表現に基づくカタログマッチング方法論を提供する; (c) PAEが有効で柔軟性があり、同等以上の(92.5% F1-Score)フレームワークであることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:50:25 GMT)
Wigner's Theorem for stabilizer states and quantum designs [0.6] 系の任意の数$n$および任意の素局所次元$d$に対する安定化器ポリトープの対称性群を記述する。
クォービットの場合、対称性群は線型および反線型クリフォード作用素と一致する。
我々はハインリヒとグロスの観測を拡張し、エルミート作用素のかなり一般的な集合の対称性が特定の瞬間によって制約されていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:13 GMT)
Collective Perception Datasets for Autonomous Driving: A Comprehensive Review [0.5] 本稿では,自律運転の文脈における集合認識データセットの包括的レビューを行う。
この研究は、すべてのデータセットの重要な基準を特定し、その強さ、弱点、異常を提示することを目的としている。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:08:55 GMT)
Synergistic Dynamical Decoupling and Circuit Design for Enhanced Algorithm Performance on Near-Term Quantum Devices [0.5] 動的デカップリングは、短期量子デバイスにおけるエラーを軽減するための有望な手法である。
ハードウェアの特徴とアルゴリズム設計がDDの有効性にどのように影響するかを分析する。
その結果,DDの有効性とアルゴリズム固有の性能との逆関係が明らかとなった。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:48:05 GMT)
Dual feature reduction for the sparse-group lasso and its adaptive variant [0.5] スパース群ラッソは、変数選択とグループ選択の両方を行い、ラッソとグループラッソの強度を同時に利用する。
遺伝子学の分野では、スパース集団のペナルティが原因で、高次元データの分析を常用する分野として広く用いられている。
スパース群ラッソと適応スパース群ラッソの強いスクリーニング規則を用いて、最適化前の入力空間を減少させる新しい二重特徴量削減法であるデュアル特徴量削減法(DFR)を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:10:07 GMT)
How Ready Are Generative Pre-trained Large Language Models for Explaining Bengali Grammatical Errors? [0.5] 高度な生成人工知能(AI)を利用した文法的誤り訂正(GEC)ツール。
しかし、それらはしばしば、本質的な自然言語の説明の提供に不足する。
このような言語では、文法的誤り説明(GEE)システムは正しい文だけでなく、誤りの説明も提供すべきである。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:56:45 GMT)
Robust kernel-free quadratic surface twin support vector machine with capped $L_1$-norm distance metric [0.5] 本稿では,L_normカーネルフリーサーフェスツインサポートベクトルマシン(CL_QTSVM)を提案する。
キャップ付きL_norm距離メートル法を用いることで, モデルのロバスト性をさらに向上する。
提案手法を効率よく解くために反復アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:23:52 GMT)
Approximately-symmetric neural networks for quantum spin liquids [0.4] 本稿では,量子スピン液体問題に対するほぼ対称なニューラルネットワーク群の提案と解析を行う。
我々の研究は、解釈可能なニューラルネットワークアーキテクチャにおける量子スピン液体問題の研究への道を開いた。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:00 GMT)
Resummation-based Quantum Monte Carlo for Entanglement Entropy Computation [0.4] エンタングルメントエントロピーを計算するために,ResumEEと呼ばれる新しいアルゴリズムを開発した。
我々のResumEEアルゴリズムは、SU($N$)スピンモデルの絡み合いエントロピーを連続$N$で正確に評価するのに効率的である。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:19:17 GMT)
U-Flow: A U-shaped Normalizing Flow for Anomaly Detection with Unsupervised Threshold [0.4] 画像中の異常セグメンテーションのための一級自己教師方式を提案する。
現代の機械学習アプローチと、より古典的な統計的検出理論の恩恵を受けている。
提案手法は、すべてのメトリクスとすべてのデータセットに対して最先端の結果を生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:34:15 GMT)
Saturn: Sample-efficient Generative Molecular Design using Memory Manipulation [0.4] 創薬のための分子設計は、最近実験的な検証の波に到達した。
下流の成功の最も重要な要因は、シリコオラクルが所望の端点とよく相関しているかどうかである。
本稿では,Augmented Memoryアルゴリズムを活用し,生成分子設計におけるMambaアーキテクチャの最初の応用例を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:37:36 GMT)
Fast ML-driven Analog Circuit Layout using Reinforcement Learning and Steiner Trees [0.4] 本稿では,アナログICのレイアウトフェーズにおいてしばしば発生するボトルネックを軽減するために,人工知能による手法を提案する。
フロアプランニング問題をマルコフ決定プロセスとして構成し、確立したトポロジカル制約の下での自動配置生成のための強化学習を活用する。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:42:42 GMT)
A Systematic Review of Low-Rank and Local Low-Rank Matrix Approximation in Big Data Medical Imaging [0.3] 医療画像データセットの膨大な量と複雑さは、ストレージ、送信、処理のボトルネックである。
低ランク行列近似(LRMA)とその誘導体である局所LRMA(LLRMA)はポテンシャルを示した。
本稿では、LRMAとLLRMAが、欠落したエントリを持つ正規データに対してどのように適用できるかと、欠落した値の予測における不正確さの影響について論じる。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:00:15 GMT)
Generative Plant Growth Simulation from Sequence-Informed Environmental Conditions [0.3] 植物成長シミュレーションは、植物または植物系の再構成された視覚表現として特徴付けられる。
本研究では、条件付き生成モデルを用いて、植物表現の分布を暗黙的に学習するシーケンスインフォームド植物成長シミュレーションフレームワーク(SI-PGS)を提案する。
我々は,SI-PGSが時間的依存を捕捉し,植物の成長の現実的なフレームを連続的に生成できることを実証した。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:35:49 GMT)
A mechanism-driven reinforcement learning framework for shape optimization of airfoils [0.3] 翼形状最適化のための機構駆動強化学習フレームワークを提案する。
強化学習法では、定常方程式の効率的な解法が用いられる。
ニューラルネットワークアーキテクチャは、気翼形状の微妙な変化に学習プロセスをより敏感にするために、注意機構に基づいて設計されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 02:21:28 GMT)
Bounding Random Test Set Size with Computational Learning Theory [0.3] 私たちは、この質問に答えるための確率論的アプローチが、テストコンテキストにどのように適用できるかを示します。
私たちは、ソースコードのカバレッジターゲットの数だけを知ることで、これを最初に実現しています。
大規模なJavaユニットと自律運転システムで、この境界を検証します。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:15:16 GMT)
Analytical derivation and extension of the anti-Kibble-Zurek scaling in the transverse field Ising model [0.3] ランダウ・ツェナーモデルの遷移確率に及ぼす白色雑音の影響を解析的に検討した。
分析の結果,導入したノイズが小さい場合には,従来知られていたアンチ・キブル・ズールクスケーリングに追従するモデルが得られた。
一方、ノイズの増加に伴い、新しいスケーリング動作が出現する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:28:55 GMT)
Forecasting Four Business Cycle Phases Using Machine Learning: A Case Study of US and EuroZone [0.3] ビジネス・サイクル(ビジネス・サイクル)とは、長期にわたる経済活動の拡大と縮小のパターンをいう。
経済分析は本質的に複雑で、無数の要因(マクロ経済指標、政治的決定など)を取り入れている
本研究では,機械学習モデルによる経済状況の自動解析能力について検討した。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:49:24 GMT)
High fidelity distribution of triggered polarization-entangled telecom photons via a 36km intra-city fiber network [0.2] 単位[780]nmからのQD放射をテレコム波長に変換するために、双方向偏光保存量子周波数変換(QFC)を用いる。
実世界の応用に向けてのステップとして、ユニット[35.8]フィールドを設置した標準単一モードファイバリンクに沿って絡み合ったペアの1つの光子が伝播した後、高い絡み合いの忠実度を報告する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:11:25 GMT)
Free-Space Optical Channel Turbulence Prediction: A Machine Learning Approach [0.2] 我々は、追加のセンサーハードウェアを使わずにチャネル乱流レベルを予測するための機械学習の適用について検討する。
光ビットストリームは、6つの異なる乱流レベルの下で、研究室の制御されたチャネルを介して送信された。
MLに基づく乱流レベル分類では,複数のMLトレーニングパラメータで98%の精度が得られたが,乱流レベル間の変化の時間スケールに大きく依存していた。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:08:36 GMT)
Renal digital pathology visual knowledge search platform based on language large model and book knowledge [0.1] 我々は,60冊の腎病理書をもとに,画像分割と対応するテキスト記述のペア化を行った。
GPT2, gemma, LLma, Qwenを含む4大モデルの意味的特徴について検討した。
テキスト記述に基づく病理画像検索のための意味検索システムを構築し,RppDと命名した。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:03:12 GMT)
RTL-Repo: A Benchmark for Evaluating LLMs on Large-Scale RTL Design Projects [0.0] 大きな言語モデル (LLM) はレジスタ転送レベル (RTL) の設計タスクを支援する可能性を実証している。
実際のRTLプロジェクトの複雑さを正確に反映したベンチマークには、大きなギャップがある。
本稿では,大規模RTL設計プロジェクトにおけるLCM評価のためのベンチマークRTL-Repoを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:36:01 GMT)
Zooming in on discrete space [0.0] 空間離散性の効果を等級数で増幅する可能性を検討する。
この分析は、現在の技術にはまだ及ばないが、通常予想されるよりも大きなスケールで空間(時間)の離散性のヒントを見ることができることを示唆している。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:04:44 GMT)
YOLOv9 for Fracture Detection in Pediatric Wrist Trauma X-ray Images [0.0] 本稿では, YOLOv9アルゴリズムモデルをコンピュータ支援診断(CAD)として骨折検出タスクに適用した最初の例である。
実験の結果、現在の最先端(SOTA)モデルのmAP 50-95と比較して、YOLOv9モデルは42.16%から43.73%に上昇し、3.7%の改善が見られた。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:01:15 GMT)
Vector Ising Spin Annealer for Minimizing Ising Hamiltonians [0.0] スピンハミルトニアンで符号化された複雑な最適化問題を解くために光物質相互作用を利用するゲインベースコンピューティングのフレームワークであるベクトルイジングスピンアニール(VISA)を紹介する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:31:11 GMT)
Utilising a Quantum Hybrid Solver for Bi-objective Quadratic Assignment Problems [0.0] この研究は、最適化問題に対する量子と量子ハイブリッドの解法の適用について検討する。
我々は、異なるIsingマシンに関する以前の研究と一致した結果を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:03:26 GMT)
UstanceBR: a multimodal language resource for stance prediction [0.0] この研究は、ターゲットベースの姿勢予測のためのブラジルのTwitterドメインのマルチモーダルコーパスであるUstanceBRを紹介する。
コーパスは、選択された対象トピックに対する86.8kのラベル付きスタンスと、これらのスタンスをソーシャルメディアで公開したユーザに関する広範なネットワーク情報で構成されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:38:46 GMT)
Using Schroedinger cat quantum state for detection of a given phase shift [0.0] 原理的には、与えられた位相シフトを曖昧に検出することができる。
この位相シフトの値は古典キャリアとシュレーディンガーの猫状態の振幅に逆比例する。
出力されるダークポートの光子数を測定することで、「偽陽性」確率で位相シフトを検出することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:32:32 GMT)
UIT-DarkCow team at ImageCLEFmedical Caption 2024: Diagnostic Captioning for Radiology Images Efficiency with Transformer Models [0.0] 本研究は, 診断キャプション(診断キャプション)と呼ばれる放射線画像からの自動テキスト生成の開発に焦点をあてる。
目的は、報告の質と効率を高めるツールを提供することであり、臨床実習とディープラーニング研究の両方に大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:46:09 GMT)
Twisted charged particles in the uniform magnetic field with broken symmetry [0.0] 本研究では, 軌道角運動量(OAM)の非ゼロ射影を持つ荷電粒子を, 軸対称が破れた一様磁場中で理論的に記述する。
代数的な観点から非対称ハミルトニアンを解析し、ねじれ状態のOAM射影が対称性の破れによってどのように修正されるかを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:13:24 GMT)
Truncated Modular Exponentiation Operators: A Strategy for Quantum Factoring [0.0] 本稿では、ワークレジスタが$vert 1 rangle$で始まるという単純な観察に依存するME演算子を構築する方法を提案する。
しかし、ME演算子は極めて寛容であり、レベルが省略された近似形式は、正確な演算子と同様に、要因を抽出できることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:20:49 GMT)
The surprising efficiency of temporal difference learning for rare event prediction [0.0] 我々は,強化学習における政策評価のための時間差(TD)学習,あるいはモンテカルロ(MC)推定器を用いて,時間差(TD)学習の効率を定量化する。
LSTD は MC よりも高い効率で相対精度が得られることを示す。
LSTDは、希少事象の時間スケールとMC推定器の相対精度の両方が、状態数で指数関数的に大きい場合でも、相対精度の一定レベルを維持する。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:18:20 GMT)
The set of Kirkwood-Dirac positive states is almost always minimal [0.0] カークウッド・ディラック分布の古典状態の集合は極小の単純ポリトープであることを示す。
この結果は、ほとんどすべてのKD分布が、自由状態が小さく単純な集合を形成するような資源理論を持っていることを示唆している。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:04 GMT)
The last Dance : Robust backdoor attack via diffusion models and bayesian approach [0.0] 拡散モデルは、前方と後方の学習原理に基づいて訓練された最先端のディープラーニング生成モデルである。
人工知能研究の世界で人気のあるフレームワークであるHugging Faceから派生したオーディオトランスフォーマーに対するバックドア攻撃の可能性を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:23:01 GMT)
The Influence Functional in open holography: entanglement and Rényi entropies [0.0] 我々は、ファインマン・ヴァーノン影響関数(IF)の助けを借りて、オープン量子場理論の例を研究する。
我々は、IFの存在下で、未観測環境の効果を捉えることができるオープン有効場理論としてシステムを解釈する。
IFの処方薬の1つがユニタリ進化と一致し、もう1つは標準結果のみを再現していることが示される。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:55:08 GMT)
The Economic Implications of Large Language Model Selection on Earnings and Return on Investment: A Decision Theoretic Model [0.0] 我々は、異なる言語モデルによる金銭的影響を比較するために、決定論的アプローチを用いる。
この研究は、より高価なモデルの優れた精度が、特定の条件下でどのようにしてより大きな投資を正当化できるかを明らかにしている。
この記事では、テクノロジの選択を最適化しようとしている企業のためのフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 20:08:41 GMT)
Structured Partial Stochasticity in Bayesian Neural Networks [0.0] 本稿では,ニューロン置換対称性を除去する重みの決定論的サブセットを選択するための構造的手法を提案する。
大幅に単純化された後続分布により,既存の近似推論方式の性能は大幅に向上した。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:40:31 GMT)
Strategic Code: A Unified Spatio-Temporal Framework for Quantum Error-Correction [0.0] QECC(Quantum error-correcting code)は、フォールトトレラントな量子情報処理の中心的な要素である。
動的QECCのパラダイムは、時間的にも空間的にも論理情報をしっかりとエンコードできることを示している。
動的Qがフォールトトレランスをいかに達成するかという大まかな理論が欠落している。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:03:00 GMT)
Solar Panel Segmentation :Self-Supervised Learning Solutions for Imperfect Datasets [0.0] 本稿では,パネルセグメンテーションの課題,特に注釈付きデータの不足,および教師あり学習のための手動アノテーションの労働集約性について論じる。
これらの課題を解決するために、自己監視学習(SSL)を探求し、適用します。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:59:33 GMT)
SIC-POVMs and the Knaster's Conjecture [0.0] 我々は、SIC-POVMのブロッホ球面表現を用いて、SIC-POVMの幾何学に対するクナスター予想を証明する。
また、一般化された SIC-POVM の連続族の存在を証明し、行列の$(n2-1)$ は$Tr(rhok)$ と同じ値を持つ。
論文参考訳(メタデータ) (Mon, 27 May 2024 00:31:03 GMT)
SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks [0.0] 本研究では,一意に効率的な残差ネットワークであるEfficient-ResNetを用いたエンコーダデコーダアーキテクチャを提案する。
アテンションブーティングゲート(AbG)とアテンションブーイングモジュール(AbM)は、グローバルコンテキストの出力の等価サイズで同変および特徴に基づく意味情報を融合することを目的として展開される。
我々のネットワークは、挑戦的なCamVidとCityscapesのデータセットでテストされており、提案手法により、残余ネットワークに対する大幅な改善が示されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 19:05:00 GMT)
SCaRL- A Synthetic Multi-Modal Dataset for Autonomous Driving [0.0] 本稿では、自律運転ソリューションのトレーニングと検証を可能にするために、合成生成された新しいマルチモーダルデータセットであるSCaRLを提案する。
SCaRLはCARLA Simulatorに基づく大規模なデータセットであり、多様な動的シナリオとトラフィック条件のためのデータを提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:31:26 GMT)
Rise and Fall of Anderson Localization By Lattice Vibrations: A Time-Dependent Machine Learning Approach [0.0] 格子振動の波動特性を強調する量子音響学は、以前はチャージされていなかった電子-格子相互作用の領域の探索を可能にした。
本稿では,電子の微妙な相互作用と動的格子地形の相互作用を分類するための機械学習手法の適用について紹介する。
全体として、我々の研究は、過渡的な局在化のようなFr"オーリッヒモデル内の力学スペクトルを照らし、これは奇妙な金属を取り巻く謎に寄与する重要な要因として示唆されている。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:07:31 GMT)
Retro: Reusing teacher projection head for efficient embedding distillation on Lightweight Models via Self-supervised Learning [0.0] 本研究では,教師のプロジェクションヘッドを学生に再利用するtextscRetroを提案する。
実験結果から, 軽量モデルにおける最先端モデルに対して, 大幅な改善が得られた。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:22:52 GMT)
Reinforcement Learning Based Escape Route Generation in Low Visibility Environments [0.0] 本稿では, 消防士の最適な探索経路と市民の避難経路を, 環境計測に基づいてリアルタイムで決定するシステムを提案する。
そこで本稿では, 避難者の早期避難を支援するため, 消防士の最適な捜索経路と市民の避難経路をリアルタイムで決定するシステムを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 23:00:57 GMT)
Recent advances in text embedding: A Comprehensive Review of Top-Performing Methods on the MTEB Benchmark [0.0] MTEB(Massive Text Embedding Benchmark)におけるテキスト埋め込みの最高性能に着目したユニバーサルテキスト埋め込みモデルの進歩について概説する。
詳細な比較と分析を通じて、この分野における重要な貢献と限界を強調し、将来的な研究の方向性を示唆する。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:52:54 GMT)
Radiative processes of single and entangled detectors on circular trajectories in (2+1) dimensional Minkowski spacetime [0.0] 2つの絡み合った検出器は、(2+1)$2次元ミンコフスキー時空で円軌道上を移動している。
ミンコフスキー真空中および熱浴中における検出器の遷移確率を算出した。
有限時間間隔でスイッチオンした場合の検出器の遷移確率率を評価する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:36:49 GMT)
RAGSys: Item-Cold-Start Recommender as RAG System [0.0] 大規模言語モデル(LLM)は現実世界のアプリケーションにとって大きな約束を持っているが、それらの一般的な知識はドメイン固有のニーズに欠けることが多い。
In-Context Learning (ICL)は、Retrieval-Augmented Generation (RAG)を活用して、数ショットの学習タスクに関連したデモを提供する代替手段を提供する。
この文脈でのICL検索は、アイテムコールドスタートレコメンデータシステムに似ており、発見の優先順位付けと厳密な関連性よりも情報の獲得を最大化している。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:40:49 GMT)
Quantum violations of simultaneous reality [0.0] 量子力学は、非可換可観測物が一般に現実の同時的要素となるのを実際に防いでいることを示す。
量子現象の新たな解釈法が示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:02:29 GMT)
Quantum kernels for classifying dynamical singularities in a multiqubit system [0.0] 量子カーネルを用いて、多ビット系に対するレート関数の動的特異点を分類する。
以上の結果から,この量子力学臨界問題を物理的にインスピレーションされた量子カーネルを用いて効率的に解くことが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:48:17 GMT)
Quantum Equation of Motion with Orbital Optimization for Computing Molecular Properties in Near-Term Quantum Computing [0.0] 本稿では,量子コンピュータ上での期待値の計算による分子特性の計算のための量子アルゴリズム(oo-VQE-qEOM)を提案する。
提案アルゴリズムは従来のCeF計算の結果を再現可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:22:04 GMT)
Predicting from a Different Perspective in Re-ranking Model for Inductive Knowledge Graph Completion [0.0] ルール推論モデルは、目に見えないエンティティからなる知識グラフ上でテストされる。
本稿ではReDistLPと呼ばれる再ランク付けモデルを提案する。
これにより、初期レトリバーと再ランカとの予測の差を利用して、再ランク付けの有効性を高める。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:50:09 GMT)
Point-JEPA: A Joint Embedding Predictive Architecture for Self-Supervised Learning on Point Cloud [0.0] 我々は、ポイントクラウドデータに特化して設計された統合埋め込み予測アーキテクチャであるPoint-JEPAを紹介する。
ターゲット選択やコンテキスト選択の際のインデックスに基づいて,トークンの近接を効率的に計算し,利用するために,ポイントクラウドトークンを順序付けするシーケンサを導入する。
提案手法は,入力空間の再構成や追加のモダリティを回避しつつ,最先端の手法による競合的な結果を得る。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:01:26 GMT)
Persistent non-Gaussian correlations in out-of-equilibrium Rydberg atom arrays [0.0] 本稿では,Rydberg 原子配列の初期状態が,大域的クエンチの後に持続的な非ガウス的相関を維持する機構を提案する。
これらの長期間の非ガウス状態は、量子記憶や量子情報プロトコルの安定な資源として実用的に応用できるかもしれない。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:32:09 GMT)
Optimizing topology for quantum probing with discrete-time quantum walks [0.0] 歩行者の内的自由度で関心のパラメータが符号化されるシナリオにおいて、DTQWを量子プローブとして利用する方法について検討する。
特に、直線上の歩行器の回転によるパラメータの符号化を検討し始め、量子フィッシャー情報(QFI)と位置フィッシャー情報(FI)を評価する。
これにより、位置空間における干渉の役割を理解し、最適位相を導入し、コインパラメータのQFIを最大化し、位置FIをQFIに等しくする。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:57:27 GMT)
Optimized thread-block arrangement in a GPU implementation of a linear solver for atmospheric chemistry mechanisms [0.0] 地球系モデル (ESM) は、大気化学プロセスを解決するために重要なハードウェア資源とエネルギー消費を必要とする。
最近の研究では、GPUアクセラレータ上でこれらのモデルを実行することで、パフォーマンスが改善されている。
本研究は,Block-cellsと呼ばれるGPU上でのケミカルソルバの計算負荷の最適化分布を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:12:59 GMT)
Operator representation of spatiotemporal quantum correlations [0.0] 空間と時間にまたがる一般量子相関に対する演算子表現は存在しないことを証明している。
四重項系の場合、この結果を用いて、光タッチ可観測値と対称、情報完全、正の演算子評価測度との間の興味深い関係を示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:02 GMT)
Ontology-Enhanced Decision-Making for Autonomous Agents in Dynamic and Partially Observable Environments [0.0] この論文では、自律エージェントのためのオントロジー強化意思決定モデル(OntoDeM)を紹介している。
OntoDeMはエージェントのドメイン知識を充実させ、予期せぬイベントを解釈し、目標を生成または適応させ、より良い意思決定を可能にする。
OntoDeMは従来の学習アルゴリズムや高度な学習アルゴリズムと比較して、動的で部分的に観察可能な環境におけるエージェントの観察と意思決定を改善する上で優れた性能を示している。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:52:23 GMT)
Non-coherent evolution of closed weakly interacting system leads to equidistribution of probabilities of microstates [0.0] 弱い相互作用を持つ系に対して、このような進化はマルコフ過程であることを示す。
単粒子状態における粒子の平均数の時間依存性を探索し、仮定の下ではボルツマン積分衝突によって支配される。
この理論では、非コヒーレンス(non-coherence)は、時間的に可逆なユニタリ進化を時間的に可逆な進化に変換するメカニズムである。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:12:54 GMT)
NCIDiff: Non-covalent Interaction-generative Diffusion Model for Improving Reliability of 3D Molecule Generation Inside Protein Pocket [0.0] 非共有結合パターン(NCI)はタンパク質-リガンド複合体全体の普遍的なパターンである。
提案モデルであるNCIDiffは,NCIタイプのタンパク質リガンドエッジと,サンプリング中にリガンド分子の3次元グラフを同時に認識する。
NCI生成戦略により,本モデルは信頼性の高いNCIを生成する。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:26:55 GMT)
Multi-view Disparity Estimation Using a Novel Gradient Consistency Model [0.0] 本稿では,線形化の有効性を評価するために,勾配一貫性情報を用いることを提案する。
この情報は、解析的にインスパイアされたグラディエント一貫性モデルの一部として、データ項に適用される重みを決定するために使用される。
グラディエント一貫性モデルが標準粗大なスキームよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:30:59 GMT)
Multi-task learning via robust regularized clustering with non-convex group penalties [0.0] マルチタスク学習(MTL)は、関連するタスク間で共通情報を共有することにより、推定性能を向上させることを目的としている。
この仮定に基づく既存のMTLメソッドは、しばしば外れたタスクを無視する。
MTLRRC(MultiTask Regularized Clustering)と呼ばれる新しいMTL手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:37:12 GMT)
Multi-qubit quantum state preparation enabled by topology optimization [0.0] 逆設計のナノフォトニックキャビティにより、量子エミッタのペアとトリプルの純状態が作成できる。
我々の研究成果は、多ビット量子状態の効率的かつ迅速な準備に向けての道を開くものである。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:06:44 GMT)
Modified Six State Cryptographic Protocol with Entangled Ancilla Component States [0.0] 障害が十分に大きい場合でも,アリスとボブの間に秘密鍵が生成可能であることを示す。
我々は,イヴが絡み合ったアンシラ状態を操作した場合,アリスとイヴの無秩序な相互情報を導出する。
変更した6状態QKDプロトコルがシークレットキーを生成できる領域において、Brussの6状態QKDプロトコルは秘密鍵を生成できなかったことを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:02:20 GMT)
Low frequency signal detection via correlated Ramsey measurements [0.0] 時間タグ付き相関したラムゼイ系列は、目標信号の振幅と位相情報を同時に追跡することを示す。
これにより、後処理における測定を関連付けることができ、効率的なスペクトル再構成がもたらされる。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:50:49 GMT)
Locality, Correlations, Information, and non-Hermitian Quantum Systems [0.0] 局所非エルミタン(NH)量子系は、リーブ・ロビンソン(LR)境界の分解を総称的に示す。
エルミート系において、$deltarho = rho-rho_Aotimesrho_B$ は CC の線型結合として記述できることを示す。
局所性を回復する形でCCをNH系に拡張し、計量形式を用いて局所性だけでなくLR境界も回復する改良CCを導出する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:32:26 GMT)
Linear Function Approximation as a Computationally Efficient Method to Solve Classical Reinforcement Learning Challenges [0.0] 本稿では,Natural Policy Gradient法によるアクター更新を用いたNatural Actor Criticアルゴリズムの実装について述べる。
我々は,我々のアルゴリズムが複雑なニューラルネットワークアーキテクチャよりもはるかに高速に学習し,同等あるいはそれ以上の結果が得られることを観察する。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:51:58 GMT)
Leveraging small language models for Text2SPARQL tasks to improve the resilience of AI assistance [0.0] 10億未満のパラメータを持つ言語モデルは、微調整後に自然言語をSPARQLクエリに変換するために使用できることを示す。
目標は、セマンティックWeb技術のユーザに対して、安価なコモディティハードウェアでAIアシストを使用することで、外部要因に対する耐性を高めることだ。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:47:21 GMT)
Large Deviations of Gaussian Neural Networks with ReLU activation [0.0] 我々は、ガウス重みと(最も線形に成長する)活性化関数を持つディープニューラルネットワークに対して、大きな偏差原理を証明した。
実際には、ReLUのような線形に増加する活性化関数が最も一般的に用いられる。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:53:24 GMT)
Kondo-Zeno crossover in the dynamics of a monitored quantum dot [0.0] 金属浴に結合した量子ドットの力学について検討し, 電荷密度の連続モニタリングを行った。
浴槽に突如結合した初期偏極スピンの崩壊時間スケールは, 相互作用によって一生制御された近藤検層から量子ゼノ効果へのクロスオーバーを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:53:42 GMT)
KSW: Khmer Stop Word based Dictionary for Keyword Extraction [0.0] 本稿では,Khmer固有のキーワード抽出手法であるKSWについて紹介する。
KSWはこの問題に対処するため、調整済みの停止語辞書を開発し、停止語を削除するための前処理手法を実装した。
実験により、KSWは従来の手法に比べて精度と妥当性が大幅に向上したことが示された。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:42:54 GMT)
Joint Prediction Regions for time-series models [0.0] IIDデータの場合、JPR(Joint Prediction Region)の計算は容易である。
このプロジェクトは、JPRを構築するWolfとWunderliのメソッドを実装し、他のメソッドと比較することを目的としている。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:52:39 GMT)
Is Cambodia the World's Largest Cashew Producer? [0.0] 本研究ではカンボジアのカシュープランテーションにおける詳細な土地利用データのギャップについて考察する。
カンボジア全体で8万以上の訓練ポリゴンを収集し、正確なカシュープランテーションマッピングのための畳み込みニューラルネットワークをトレーニングしました。
カンボジアは耕作面積で上位5位、世界のカシュー生産では上位3位にランクインしている。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:20:50 GMT)
Inherent quantum resources in the stationary spin chains [0.0] 様々なスピン-1/2鎖の固有状態に多体ベル相関が本質的に存在することを示す。
特に,Lipkin-Meshkov-Glickモデルの固有状態と熱状態が多体ベル相関を持つことを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:11:10 GMT)
Imaginary past of a quantum particle moving on imaginary time [0.0] 小さな交流場における断熱極限は、障壁を横切るのに要する時間として$|mathcal T|$を指す。
我々は、送信された粒子の歴史を調査し、磁場の過去の振る舞いを「記憶する」ことを発見した。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:01:22 GMT)
Hypergraph Laplacian Eigenmaps and Face Recognition Problems [0.0] 顔認識は、データサイエンスとバイオメトリックセキュリティ研究領域において非常に重要なトピックである。
本稿では,新しいハイパーグラフ Laplacian Eigenmaps と k 近傍法と/またはカーネルリッジ回帰法を組み合わせて,顔認識問題の解法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:35:14 GMT)
HyperInterval: Hypernetwork approach to training weight interval regions in continual learning [0.0] 埋め込み空間内でのインターバル演算を利用する技術であるHyperIntervalを紹介する。
我々は、連続したタスクに対するインターバル埋め込みを訓練し、ハイパーネットワークをトレーニングし、これらの埋め込みをターゲットネットワークの重みに変換する。
トレーニングの終わりに、すべてのタスク専用の1つのネットワークを生成するために、1つの普遍的な埋め込みを選択することができます。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:22:58 GMT)
Hydrodynamics and the eigenstate thermalization hypothesis [0.0] 固有状態熱化仮説(ETH)は、固有エネルギー基底における局所作用素の対角行列および対角行列要素の性質を記述する。
本研究では, エネルギー密度の関数として, (i) エネルギー差の小さいETHの対角部分の特異な挙動と (ii) エネルギー密度の関数としてのETHの対角部分の滑らかな形状の関係について述べる。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:13:58 GMT)
Hunting for Polluted White Dwarfs and Other Treasures with Gaia XP Spectra and Unsupervised Machine Learning [0.0] 太陽系外惑星物質によって汚染された白色小星 (WD) は、太陽系外惑星の内部を観測する機会を与える。
大気中の複数の金属を含むWDの数を大幅に増やすことを目標としている。
この選択法により, 大気中の5種以上の金属種を含む既知のWDの数が, 桁違いに増加する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:44:14 GMT)
Heisenberg-limited sensitivity in the estimation of two parameters in a Mach-Zehnder interferometer [0.0] 我々は,マッハ・ツェンダー干渉計における2つの未知位相パラメータの同時推定において,ハイゼンベルク限界感度に到達するための実験的に実現可能なスキームを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:33:36 GMT)
Growth in products of matrices: fastest, average, and generic [0.0] ランダム行列積に関する3つの疑問に答える。
第3の質問に対して、リャプノフ指数の上界を生成する非常に単純な方法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:33:27 GMT)
Geometric Phase in Kitaev Quantum Spin Liquid [0.0] 量子スピン液体は、基底状態において多数のスピン絡み合いを持ち、絡み合いエントロピーによって評価することができるが、後者は実験によって直接観察することはできない。
密度行列に存在し、エンタングルメントエントロピー、スピン相関関数、および他の物理観測可能性に影響を及ぼす亜幾何位相に拡張する。
論文参考訳(メタデータ) (Mon, 27 May 2024 03:58:51 GMT)
Generic ETH: Eigenstate Thermalization beyond the Microcanonical [0.0] 固有状態熱化仮説(ETH)は、高エネルギー・凝縮物質群集の最近の進歩において重要な役割を担っている。
我々は、保存された準局所電荷を持つ量子格子系を設計し、一般化された固有状態熱化の形式を検証する。
また、電荷とエネルギーの双方のマイクロカノニカルウィンドウの外側の状態における熱化の原型的シグネチャも観察する。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:36:01 GMT)
Generation and robustness of non-local correlations induced by Heisenberg XYZ and intrinsic decoherence models: (x,y)-spin-orbit interactions and $x$- magnetic field [0.0] ハイゼンベルク XYZ と x,y スピン軌道相互作用は、弱い外部磁場の存在下で非局所的相関を高める能力が高い。
スピンスピン相互作用を強化することにより、NLCs世代を劣化させることが可能である。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:31:28 GMT)
Fisher-information-based estimation of optomechanical coupling strengths [0.0] 量子推定理論の定式化を光学系における結合強度の推定に適用する。
我々の推定シナリオはキャビティ出力場の平衡ホモダイン光検出に基づく。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:26:51 GMT)
Finding Pareto Efficient Redistricting Plans with Short Bursts [0.0] この研究ノートは、最近提案された多重基準ケースを扱うための単一基準最適化手法を拡張している。
本研究では,本手法の実証的な性能を現実的な環境で検証し,期待通りに振る舞うことができ,アルゴリズム的パラメータにはあまり敏感でないことを示す。
論文参考訳(メタデータ) (Mon, 27 May 2024 22:19:04 GMT)
Exploring UMAP in hybrid models of entropy-based and representativeness sampling for active learning in biomedical segmentation [0.0] 医療セグメント化におけるアクティブラーニングの文脈におけるエントロピーベースおよび代表性サンプリング手法のハイブリッドモデルについて検討した。
その結果,Entropy-UMAPサンプリング手法のハイブリッド組み合わせにより,ランダムなベースラインに対して統計的に有意なDiceスコアの優位性が得られた。
このことは、エントロピーに基づく手法と UMAP 手法の間には、前者が後者に先行してアクティブラーニングのハイブリッドモデルが存在するという興味深い相乗効果が存在するという予備的な証拠を与える。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:09:54 GMT)
Explaining Explanations in Probabilistic Logic Programming [0.0] ほとんどのアプローチでは、システムはアンフブラックボックスと見なされており、適切な説明を生成することは困難である。
本稿では,新しいクエリ駆動推論機構の定義に基づく説明法について述べる。
証明木と選択式の組み合わせにより、因果構造を持つ理解可能なクエリ正当性を生成することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:38:10 GMT)
Enhancing Music Genre Classification through Multi-Algorithm Analysis and User-Friendly Visualization [0.0] 本研究の目的は,異なる種類の音楽の認識方法をアルゴリズムに教えることである。
アルゴリズムはこれまでこれらの歌を聴いていないので、それぞれの歌をユニークにする方法を理解する必要があります。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:57:20 GMT)
Enhanced repetition codes for the cross-platform comparison of progress towards fault-tolerance [0.0] 繰り返し符号は、クロスプラットフォームの比較を可能にする実験の一般的な基礎となっている。
本稿では,繰り返しコード実験を拡張・改善する手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 10:31:02 GMT)
Enhanced Droplet Analysis Using Generative Adversarial Networks [0.0] この研究は、DropletGANという画像生成装置を開発し、ドロップレットの画像を生成する。
また、合成データセットを用いた光液滴検出器の開発にも用いられている。
我々の知る限りでは、この研究は初めて、液滴の検出を増強するための生成モデルを用いたものである。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:33:36 GMT)
Efficient mid-term forecasting of hourly electricity load using generalized additive models [0.0] 本稿では,解釈可能なP-スプラインから構築され,自己回帰後処理によって強化された一般化付加モデル(GAM)を用いた新しい予測手法を提案する。
提案手法は欧州24カ国の負荷データに基づいて評価される。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:41:41 GMT)
Efficient Biomedical Entity Linking: Clinical Text Standardization with Low-Resource Techniques [0.0] 複数の用語は、臨床エンティティと呼ばれることができる同じコア概念を参照することができる。
UMLS(Unified Medical Language System)のようなオントロジーは、何百万もの臨床エンティティを格納するために開発・維持されている。
そこで本稿では,エンティティの曖昧さを解消するために,コンテキストベースとコンテキストレスの省力化手法を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 01:36:38 GMT)
Effective Layer Pruning Through Similarity Metric Perspective [0.0] ディープニューラルネットワークは、認知タスクを解決する機械学習において、主要なパラダイムとなっている。
これらのモデルから構造を抽出することは、ネットワークの複雑さを減らすための簡単なアプローチである。
層プルーニングは、しばしば高い圧縮速度でネットワーク予測能力(すなわち精度)を損なう。
この研究は、プルーニング手法によって追求されるすべての基礎特性を満たす効果的なレイヤ・プルーニング戦略を導入する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:54:51 GMT)
Effective Hamiltonian approach to the exact dynamics of open system by complex discretization approximation for environment [0.0] 本稿では,複素ガウス二次数を用いた複素平面における離散化近似法の正規一般化を提案する。
有効ハミルトニアンは非エルミート的であり、負の虚部を持つ複素エネルギーモードを証明できる。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:50:05 GMT)
Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification [0.0] 本研究では,乳がんの新たな分類法であるDual-Activated Lightweight Attention ResNet50モデルを提案する。
トレーニング済みのResNet50モデルと軽量なアテンション機構を統合し、ResNet50の第4層にアテンションモジュールを埋め込む。
DALAResNet50法は,40X,100X,200X,400Xの乳がん組織像を用いて,それぞれ98.5%,98.7%,97.9%,94.3%の検診を行った。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:14:43 GMT)
Detecting Deceptive Dark Patterns in E-commerce Platforms [0.0] ダークパターン(ダークパターン)は、電子商取引サイトがウェブサイトに利益をもたらす方法でユーザーの振舞いを操作するために使う偽のユーザーインターフェースである。
既存のソリューションとしては、コンピュータビジョンと自然言語処理を使用するUIGuardや、検出可能性に基づいてダークパターンを分類するアプローチ、あるいはデータセットに基づいてトレーニングされた機械学習モデルを使用するアプローチなどがある。
我々は,Webスクレイピング手法と細調整されたBERT言語モデルを組み合わせることを提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:32:40 GMT)
Deep Learning Calabi-Yau four folds with hybrid and recurrent neural network architectures [0.0] 約100万の完全交点Calabi-Yau 4-folds (CICY4) のデータセットにディープラーニングを適用し、4つの数字を機械学習する。
h1,1,h2,1,h3,1,h2,2$の予測精度は72%のトレーニング率で,CNN-LSTM-400が最適である。
トレーニング率72%と比較すると、大幅な改善がある。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:55:05 GMT)
Dataset-learning duality and emergent criticality [0.0] 訓練不能変数の部分空間と訓練可能変数の部分空間との間の双対写像を示す。
双対性を用いて臨界性の出現、あるいはトレーニング可能な変数のゆらぎのパワー-法則分布を研究する。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:44:33 GMT)
Dark excitons and hot electrons modulate exciton-photon strong coupling in metal-organic optical microcavities [0.0] ポラリトンは、光による物質の強いハイブリッド化の結果として形成される。
彼らの理解は最重要事項であるが、光学分光学におけるその非絡み合いは、これまでは達成不可能であった。
ダークエキシトンは励起子-光子結合の強さに影響を与え、ファノ様の極性ゲインロススペクトルとして表される。
論文参考訳(メタデータ) (Mon, 27 May 2024 13:39:31 GMT)
Cyclic Quantum Teleportation of Two-Qubit Entangled States by using Six-Qubit Cluster State and Six-Qubit Entangled State [0.0] 周期的に3つの未知の2ビット状態を完全に伝達するサイクル量子テレポーテーション方式が提案されている。
3人の参加者のそれぞれがその後、古典的なチャネルを使って、自分の望む2量子状態を取得することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:35:30 GMT)
Coupling Light with Matter for Identifying Dominant Subnetworks [0.0] 我々は、複雑なニューラルネットワークを使用して、支配的な作業を特定し、より大きなネットワーク内の間接的相関を明らかにする、新しいライトマタープラットフォームを提案する。
このアプローチは、低消費電力、高速な処理速度、および後処理を行わない共値ノードと逆制御ノードの即時同定など、大きな利点を提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 16:00:21 GMT)
Complexity is not Enough for Randomness [0.0] ブラウン系におけるランダムネスの動的生成を、ハミルトニアンの局所性の度合いの関数として研究する。
高度に非局所的な時間依存ハミルトニアンによって支配されるシステムであっても、ランダムネスの生成はシステムサイズにおいて指数関数的に長時間持続する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:00 GMT)
Comparative Study of Machine Learning Algorithms in Detecting Cardiovascular Diseases [0.0] 機械学習技術を用いた心血管疾患(CVD)の検出は、医学的診断において大きな進歩を示している。
本研究では,ロジスティック回帰,決定木,ランダムフォレスト,グラディエントブースティング,サポートベクトルマシン(SVM),K-Nearest Neighbors(KNN),XGBoostなど,さまざまな機械学習アルゴリズムの比較分析を行った。
本研究は,アンサンブル法と高度なアルゴリズムを用いて信頼性の高い予測を行い,CVD検出のための包括的枠組みを提供する。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:29:54 GMT)
Clustering-based Learning for UAV Tracking and Pose Estimation [0.0] 本研究は,UAV追跡と2種類のLiDARを用いたポーズ推定のためのクラスタリングに基づく学習検出手法であるCL-Detを開発する。
まず、Livox AviaデータとLiDAR 360データのタイムスタンプを調整し、その後、関心のあるオブジェクト(OOI)のポイントクラウドを環境から分離します。
提案手法は,CVPR 2024 UG2+ Challengeの最終リーダーボードにおいて,競争力のあるポーズ推定性能を示し,第5位にランクインする。
論文参考訳(メタデータ) (Mon, 27 May 2024 06:33:25 GMT)
Classifying One-Dimensional Quantum States Prepared by a Single Round of Measurements [0.0] 測定から決定的に生成できる多体絡みのパターンを特徴付ける。
これにより行列積状態が生成され、準備可能性のための必要かつ十分なテンソル条件が特定される。
準備可能な絡み合いスペクトルの豊かさと相関関数の間のトレードオフが発見され、ある量子状態を作成するためのノーゴー定理が導かれる。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:59:07 GMT)
Classifying 2D topological phases: mapping ground states to string-nets [0.0] 格子ハミルトニアンの2つのギャップ状の基底状態は、一定の深さの量子回路で接続できる場合、物質の同じ量子相(位相相)にある。
レヴィン=ウェンの弦-ネットモデルは、ギャップ可能な境界を持つすべての可能なギャップ付き位相を消し去ると推測され、これらの位相はユニタリモジュラーテンソル圏によってラベル付けされる。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:36:17 GMT)
Chip-Scale Point-Source Sagnac Interferometer by Phase-Space Squeezing [0.0] 相空間のスクイージングは原子の有利な源であることが示され、運動量の拡散は減少する。
回転検出が可能な点源原子干渉計(PSI)におけるそのような音源の影響を解析する。
圧縮PSI(SPSI)が短サイクル時間と高い繰り返し率を促進しつつ、感度とダイナミックレンジを向上させる方法について述べる。
論文参考訳(メタデータ) (Mon, 27 May 2024 09:08:16 GMT)
Building a temperature forecasting model for the city with the regression neural network (RNN) [0.0] 天気予報モデルの研究は、2000年頃に始まったばかりである。
コンピュータ科学の進歩と共に、数学的モデルは、より正確で信頼性の高い予測モデルを作成するために、機械学習技術で構築され、応用されている。
本稿では,都市温度の予測にリカレントニューラルネットワークを適用するための研究とソリューションについて概説する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:32:36 GMT)
Bayesian Safe Policy Learning with Chance Constrained Optimization: Application to Military Security Assessment during the Vietnam War [0.0] ベトナム戦争で採用されたセキュリティアセスメントアルゴリズムを改善できるかどうかを検討する。
この経験的応用は、アルゴリズムによる意思決定においてしばしば発生するいくつかの方法論的課題を提起する。
論文参考訳(メタデータ) (Mon, 27 May 2024 14:39:43 GMT)
Assessing LLMs Suitability for Knowledge Graph Completion [0.0] 大きな言語モデル(LLM)は知識グラフに関連するタスクを解決するために使用できる。
LLMは、答えを幻覚させることや、結果を非決定論的に出力することが知られている。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:04:50 GMT)
Analysis of Atom-level pretraining with Quantum Mechanics (QM) data for Graph Neural Networks Molecular property models [0.0] 量子力学(QM)データを用いた原子レベルの事前トレーニングは、トレーニングデータとテストデータ間の分布類似性に関する仮定違反を軽減することができることを示す。
隠れ状態の分子表現を解析し、QMデータに対する分子レベルと原子レベルの事前学習の効果を比較するのは、これが初めてである。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:56:06 GMT)
An NLP Crosswalk Between the Common Core State Standards and NAEP Item Specifications [0.0] 項目仕様とコンテンツ標準の横断歩道を確立する際に,NLPをベースとした手法について述べる。
この手順は、数学の共通中核状態標準(Common Core State Standards)を、2026年の国家教育進歩評価(National Assessment of Educational Progress)の項目仕様に適合させるために用いられる。
論文参考訳(メタデータ) (Mon, 27 May 2024 15:47:46 GMT)
AbstractBeam: Enhancing Bottom-Up Program Synthesis using Library Learning [0.0] AbstractBeamは、ライブラリ学習を利用してプログラムの繰り返しを識別する、プログラム合成フレームワークである。
我々の実験は、AbstractBeamがLambdaBeam整数リスト操作ドメインにおけるLambdaBeamのパフォーマンスを著しく改善することを示した。
論文参考訳(メタデータ) (Mon, 27 May 2024 08:31:12 GMT)
AUTONODE: A Neuro-Graphic Self-Learnable Engine for Cognitive GUI Automation [0.0] オンラインニューログラフィック操作と深部探索によるユーザインタフェースの自律的変換
我々のエンジンはエージェントが複雑に理解し実装し、非並列な効率で動的Web環境に適応することを可能にする。
AUTONODEの汎用性と有効性は一連の実験を通じて実証され、様々なWebベースのタスクを管理する能力を強調している。
論文参考訳(メタデータ) (Mon, 27 May 2024 05:03:09 GMT)
A note on degeneracy of excited energy levels in massless Dirac fermions [0.0] 我々は、平面の制限領域に局在した磁束$Phi$の存在下で、質量を持たないディラック・ワイル方程式の固有値と固有関数を構築する。
0 と 1 のエネルギー準位は同じ$N+1$退化性を持ち、$N$ は $fracPhi2pi$ の整数部分である。
論文参考訳(メタデータ) (Mon, 27 May 2024 17:04:31 GMT)
A minimal completion theorem and almost everywhere equivalence for Completely Positive maps [0.0] そのような完備化が可能であればいつでも、一意に最小限の完備化が存在することが示されている。
この定理は、いくつかの非常に一般的な条件下では、準純写像とほぼ至る所で完全に正の写像が実際にその写像と等しいことを示すために用いられる。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:07:42 GMT)
A deep-learning algorithm to disentangle self-interacting dark matter and AGN feedback models [0.0] 本研究では,ダークマターの自己反応が天体物理学的フィードバックとどのように異なるのかを「学習」する機械学習手法を提案する。
我々は、流体力学シミュレーションから銀河団の画像に畳み込みニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Mon, 27 May 2024 18:00:49 GMT)
A Taxmans guide to taxation of crypto assets [0.0] Bitcoinやその他の暗号通貨資産の台頭は、人々が分散化されたネットワーク上で価値を交換し、伝達する方法の根本的な変化を示している。
このことは、政府や税務当局が、この革新的で革新的で、急進的な技術に対する政策対応を理解し、提供するために、規制と税政策の盲点を生み出している。
本稿では、暗号資産が機能する原理と、その基盤技術と、このエコシステム内で生じる税問題や課税可能な事象との関連について説明する。
論文参考訳(メタデータ) (Mon, 27 May 2024 07:42:56 GMT)
A Short Introduction to Basic Principles of Quantum Navigation Based-on Rb Cold Atom Interferometry [0.0] レーザー分光法はより精密な加速度計やジャイロスコープを実現することができる。
衛星を持たない自己校正ナビゲーションシステムを実現することができる。
論文参考訳(メタデータ) (Mon, 27 May 2024 04:40:06 GMT)
A GRASP-based memetic algorithm with path relinking for the far from most string problem [0.0] FAR MOST STRING PROBLEM (FFMSP) は文字列選択問題である。
FFMSPに対処するメメティックアルゴリズム(MA)を提案する。
論文参考訳(メタデータ) (Mon, 27 May 2024 21:33:15 GMT)
A Concept-Value Network as a Brain Model [0.0] 本稿では,脳様モデルの物理的実体と概念的実体の関係を記述するための統計的枠組みを提案する。
この論文は、化学接続も可能であるが、電気配線が特徴である可能性を示唆している。
論文参考訳(メタデータ) (Mon, 27 May 2024 12:50:58 GMT)
"It depends": Configuring AI to Improve Clinical Usefulness Across Contexts [0.0] 本稿では、異なる文脈における臨床的有用性のためにAIを設計する方法を考察する。
デンマークとケニアの7つの臨床施設の放射線技師13名を対象に,19回のデザインセッションを行った。
我々は,意図した臨床状況に合わせて設定しなければならない4つの技術的側面を概念化した。
論文参考訳(メタデータ) (Mon, 27 May 2024 11:49:05 GMT)