Causal Distillation for Alleviating Performance Heterogeneity in Recommender Systems [142.3] 歴史的相互作用の不均一な分布とレコメンダモデルのバイアス付きトレーニングを示す。
デバイアスドトレーニングの鍵は、ユーザの過去の行動と次の行動の両方に影響を与える共同創設者の影響を取り除くことである。
本稿では,非保守的共同設立者に対応するために,因果多教師蒸留フレームワーク(CausalD)を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:31:00 GMT)
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis [118.1] Video-MMEは、ビデオ解析におけるMLLMの完全なマルチモード評価ベンチマークである。
我々は,GPT-4シリーズやGemini 1.5 Pro,オープンソース画像モデルなど,最先端のMLLMを幅広く評価した。
我々の実験によると、Gemini 1.5 Proは最も優れた商用モデルであり、オープンソースモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:59:47 GMT)
TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.7] 奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:51:58 GMT)
Empowering Visual Creativity: A Vision-Language Assistant to Image Editing Recommendations [109.7] IER(Image Editing Recommendation)の課題を紹介する。
IERは、入力画像から多様なクリエイティブな編集命令を自動生成し、ユーザの未指定の編集目的を表すシンプルなプロンプトを作成することを目的としている。
本稿では,Creative-Vision Language Assistant(Creativity-VLA)を紹介する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:22:29 GMT)
Context-aware Difference Distilling for Multi-change Captioning [106.7] マルチチェンジキャプションは、自然言語でイメージペア内の複雑で結合的な変化を記述することを目的としている。
そこで本稿では, 文収量に対する真の変化をすべて捉えるための, 文脈認識型差分蒸留ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:07:39 GMT)
Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.2] 既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:21:04 GMT)
Cooperate or Collapse: Emergence of Sustainability Behaviors in a Society of LLM Agents [101.2] GovSimは、大規模言語モデル(LLM)における戦略的相互作用と協調的意思決定を研究するために設計された生成シミュレーションプラットフォームである。
最強のLLMエージェントを除く全てのエージェントが、GovSimの持続可能な平衡を達成できないことがわかった。
我々は、道徳的思考の理論である普遍化に基づく推論を活用するエージェントが、持続可能性を大幅に向上できることを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:03:10 GMT)
Learning to Model the World with Language [100.8] 人間と対話し、世界で行動するためには、エージェントは人々が使用する言語の範囲を理解し、それを視覚の世界に関連付ける必要がある。
私たちのキーとなるアイデアは、エージェントが将来を予測するのに役立つ信号として、このような多様な言語を解釈すべきである、ということです。
我々は、将来のテキストや画像表現を予測するマルチモーダル世界モデルを学ぶエージェントであるDynalangでこれをインスタンス化する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:32:02 GMT)
MASA: Motion-aware Masked Autoencoder with Semantic Alignment for Sign Language Recognition [94.6] 本研究では,リッチモーションキューとグローバルセマンティック情報を統合したセマンティックアライメント(MASA)を用いたMotion-Awareマスク付きオートエンコーダを提案する。
我々のフレームワークは,包括的手話表現のための局所的な動きの手がかりとグローバルな意味的特徴を同時に学習することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:06:05 GMT)
A Survey on Diffusion Models for Time Series and Spatio-Temporal Data [92.1] 時系列データの研究は、時間とともにトレンドや異常を理解するために不可欠であり、様々な分野にわたる予測的な洞察を可能にする。
近年,拡散モデルが時系列やS時間データマイニングに広く応用されている。
時系列およびS時間データにおける拡散モデルの利用について概説し、それらをモデルカテゴリ、タスクタイプ、データモダリティ、実用的なアプリケーションドメインで分類する。
本調査は,医療,レコメンデーション,気候,エネルギー,オーディオ,交通など,さまざまな分野の応用を幅広くカバーしている。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:44:31 GMT)
ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks [91.6] 本稿では,LLMベースのフレームワークであるReEvalについて述べる。
本稿では、ChatGPTを用いてReEvalを実装し、2つの人気のあるオープンドメインQAデータセットのバリエーションを評価する。
我々の生成したデータは人間可読であり、大きな言語モデルで幻覚を引き起こすのに役立ちます。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:46:24 GMT)
Amortizing intractable inference in diffusion models for vision, language, and control [89.7] 本稿では,p(mathbfx)$以前の拡散生成モデルとブラックボックス制約,あるいは関数$r(mathbfx)$からなるモデルにおいて,データ上の後部サンプルである $mathbfxsim prm post(mathbfx)propto p(mathbfx)r(mathbfx)$について検討する。
我々は,データフリー学習目標である相対軌道バランスの正しさを,サンプルから抽出した拡散モデルの訓練のために証明する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:18:46 GMT)
Nearest Neighbor Speculative Decoding for LLM Generation and Attribution [87.3] Nearest Speculative Decoding (NEST)は、任意の長さの実世界のテキストスパンをLM世代に組み込むことができ、それらのソースへの属性を提供する。
NESTは、様々な知識集約タスクにおいて、基本LMの生成品質と帰属率を大幅に向上させる。
さらに、NESTは、Llama-2-Chat 70Bに適用した場合の推論時間において1.8倍のスピードアップを達成することにより、生成速度を大幅に改善する。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:41:49 GMT)
Reconstructing Graph Diffusion History from a Single Snapshot [87.2] A single SnapsHot (DASH) から拡散履歴を再構築するための新しいバリセンターの定式化を提案する。
本研究では,拡散パラメータ推定のNP硬度により,拡散パラメータの推定誤差が避けられないことを証明する。
また、DITTO(Diffusion hitting Times with Optimal proposal)という効果的な解法も開発している。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:25:07 GMT)
Generalized Semi-Supervised Learning via Self-Supervised Feature Adaptation [87.2] 従来の半教師付き学習は、ラベル付きデータとラベルなしデータの特徴分布が一貫したものであると仮定する。
本稿では,ラベル付きおよびラベルなしデータの分散によるSSL性能向上のための汎用フレームワークであるセルフ・スーパービジョン・フィーチャー・アダプテーション(SSFA)を提案する。
提案するSSFAは擬似ラベルベースのSSL学習者に適用可能であり,ラベル付き,ラベルなし,さらには目に見えない分布における性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:13:45 GMT)
Primal Dual Continual Learning: Balancing Stability and Plasticity through Adaptive Memory Allocation [86.8] 制約付き最適化問題を直接実行することは可能かつ有益であることを示す。
メモリベースのメソッドでは、以前のタスクからのサンプルの小さなサブセットをリプレイバッファに格納できる。
両変数は,制約摂動に対する連続学習問題の最適値の感度を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:11:27 GMT)
Any2Point: Empowering Any-modality Large Models for Efficient 3D Understanding [83.6] 我々は,Any2Pointというパラメータ効率のよい大規模モデル(ビジョン,言語,音声)を3次元理解に活用する手法を紹介した。
入力された3Dポイントと元の1Dまたは2D位置との相関関係を示す3D-to-any (1Dまたは2D)仮想プロジェクション戦略を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:36:53 GMT)
Bootstrap3D: Improving 3D Content Creation with Synthetic Data [80.9] 重要なボトルネックは、詳細なキャプションを備えた高品質な3Dアセットの不足である。
本稿では,任意の量のマルチビュー画像を自動的に生成する新しいフレームワークBootstrap3Dを提案する。
我々は高画質合成多視点画像100万枚を高密度記述キャプションで生成した。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:59:56 GMT)
Improved Techniques for Optimization-Based Jailbreaking on Large Language Models [78.3] Greedy Coordinate Gradient (GCG)攻撃の成功は、最適化ベースのジェイルブレイク技術の研究への関心が高まっている。
我々はGCGのような最適化ベースのジェイルブレイクにいくつかの改良(経験的)技術を提案する。
改良された技術は、GCGが最先端のジェイルブレイク攻撃より優れ、100%近い攻撃成功率を達成するのに役立ちます。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:07:15 GMT)
BioT5+: Towards Generalized Biological Understanding with IUPAC Integration and Multi-task Tuning [77.9] 本稿では,BioT5フレームワークの拡張であるBioT5+を紹介する。
BioT5+ には、分子理解のための IUPAC 名の統合、bioRxiv や PubChem などのソースからの広範なバイオテキストと分子データの統合、タスク間の汎用性のためのマルチタスク命令チューニング、数値データの処理を改善する数値トークン化技術など、いくつかの新機能が含まれている。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:07:00 GMT)
ContextGS: Compact 3D Gaussian Splatting with Anchor Level Context Model [77.7] 我々は3DGS表現のアンカーレベルにコンテキストモデルを導入し,バニラ3DGSと比較して100倍以上のサイズの縮小を実現した。
我々の研究は3DGS表現のためのアンカーレベルのコンテキストモデルを開拓し、バニラ3DGSに比べて100倍以上、そして最新の最先端のScaffold-GSに比べて15倍の大幅なサイズ縮小を実現した。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:23:39 GMT)
Sign is Not a Remedy: Multiset-to-Multiset Message Passing for Learning on Heterophilic Graphs [77.4] 我々は、Multiset to Multiset GNN(M2M-GNN)と呼ばれる新しいメッセージパッシング機能を提案する。
M2M-GNNは上述のSMPの限界を効果的に緩和し, 比較性能が向上することを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:39:22 GMT)
ReasonPix2Pix: Instruction Reasoning Dataset for Advanced Image Editing [77.1] 本稿ではReasonPix2Pixを紹介した。
データセットの特徴は,1)推論命令,2)細かなカテゴリのよりリアルな画像,3)入力画像と編集画像のばらつきの増大である。
教師付き条件下でのデータセットの微調整では、タスクが推論を必要とするか否かに関わらず、命令編集タスクにおいて優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:24:55 GMT)
Learning Syntax Without Planting Trees: Understanding When and Why Transformers Generalize Hierarchically [75.0] 自然言語データに基づいて訓練されたトランスフォーマーは、その階層構造を学習し、目に見えない構文構造を持つ文に一般化することが示されている。
本研究では,変圧器モデルにおける帰納バイアスの発生源と,そのような一般化行動を引き起こす可能性のあるトレーニングについて検討する。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:47:15 GMT)
Spectrum-Aware Parameter Efficient Fine-Tuning for Diffusion Models [73.9] 生成モデルのための新しいスペクトル対応適応フレームワークを提案する。
本手法は,事前学習した重みの特異値とその基底ベクトルを調節する。
本稿では,計算効率と表現能力のバランスをとるスペクトルオーソ分解適応(SODA)を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:43:35 GMT)
Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.7] ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:11:51 GMT)
Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation [73.5] パノラマ的セマンティックセマンティックセグメンテーションは2つの重要な課題により未探索である。
まず、変形性パッチ埋め込み(DPE)と変形性(DMLPv2)モジュールを備えたパノラマセマンティックトランス4PASS+を改良したトランスフォーマーを提案する。
第2に、教師なしドメイン適応パノラマセグメンテーションのための擬似ラベル修正により、Mutual Prototypeal Adaptation(MPA)戦略を強化する。
第3に、Pinhole-to-Panoramic(Pin2Pan)適応とは別に、9,080パノラマ画像を用いた新しいデータセット(SynPASS)を作成します。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:04:07 GMT)
Two Optimizers Are Better Than One: LLM Catalyst for Enhancing Gradient-Based Optimization [70.0] 我々は,勾配に基づく最適化と大規模言語モデル(MsLL)が相互補完的であることを示し,協調的な最適化手法を提案する。
私たちのコードはhttps://www.guozix.com/guozix/LLM-catalystでリリースされています。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:13:34 GMT)
LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models [69.7] 暗黙的および明示的な信頼マーカーを校正するリスナー対応微調整法 (LACIE) を提案する。
我々は,LACIEがリスナーをモデル化し,回答が正しいかどうかだけでなく,リスナーに受け入れられるかどうかを考察する。
LACIEによるトレーニングの結果、正しい回答の受け入れレベルを維持しながら、誤った回答が受け入れられる割合が47%減少することがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:16:38 GMT)
StrucTexTv3: An Efficient Vision-Language Model for Text-rich Image Perception, Comprehension, and Beyond [68.0] 我々は、テキストリッチな画像のための様々なインテリジェントなタスクに取り組むために、効率的な視覚言語モデルStrucTexTv3を開発した。
学習を通してStrucTexTv3の知覚と理解能力を高める。
提案手法は,テキストに富んだ画像認識タスクでSOTAを達成し,理解タスクの性能を大幅に向上させた。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:55:04 GMT)
Generalization Beyond Data Imbalance: A Controlled Study on CLIP for Transferable Insights [67.7] 大規模なデータ不均衡は、Webスケールの視覚言語データセットの間に自然に存在する。
事前学習したCLIPは、教師付き学習と比較してデータ不均衡に顕著な堅牢性を示す。
本研究は,データ不均衡を超えてCLIPの一般化可能性のメカニズムを明らかにし,研究コミュニティに伝達可能な洞察を提供する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:57:24 GMT)
One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models [67.5] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を改善するための有望な方法である。
本稿では,RAGのためのスケーラブルでプラガブルな仮想トークンを学習する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:56:56 GMT)
Use Your INSTINCT: INSTruction optimization for LLMs usIng Neural bandits Coupled with Transformers [66.8] 大規模言語モデル (LLM) は命令追従能力に優れ、様々なアプリケーションで優れた性能を発揮している。
最近の研究は、ブラックボックスLLMに与えられる命令を自動的に最適化するために、クエリ効率のよいベイズ最適化(BO)アルゴリズムを用いている。
NNサロゲートによりBOのGPを置換し,ブラックボックスLLMの命令を最適化するニューラルバンディットアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:27:53 GMT)
Extreme Miscalibration and the Illusion of Adversarial Robustness [66.3] 敵の訓練は、しばしばモデルの堅牢性を高めるために使用される。
我々は、この観測されたロバストネスの利得はロバストネスの錯覚(IOR)であることを示した。
我々は,NLPコミュニティに対して,試験時間温度のスケーリングを堅牢性評価に組み込むよう促す。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:09:56 GMT)
Diffusion Policies creating a Trust Region for Offline Reinforcement Learning [66.2] 本稿では,拡散信頼型Q-Learning (DTQL) という2つの政策アプローチを導入する。
DTQLは、トレーニングと推論の両方において反復的なデノレーションサンプリングの必要性を排除し、計算的に極めて効率的である。
DTQLは、D4RLベンチマークタスクの大部分において、他のメソッドよりも優れているだけでなく、トレーニングや推論速度の効率性も示すことができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:23:55 GMT)
OR-Bench: An Over-Refusal Benchmark for Large Language Models [65.3] 大きな言語モデル(LLM)は、悪意のある出力を防ぐために慎重に安全アライメントを必要とする。
「本研究は、一見有毒なプロンプトの大規模集合を自動生成する新しい方法を提案する。」
次に,8つのモデルファミリーにまたがる25のLLMの過剰拒絶量を測定するための総合的研究を行った。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:44:33 GMT)
Long-Span Question-Answering: Automatic Question Generation and QA-System Ranking via Side-by-Side Evaluation [65.2] 大規模言語モデルにおける長文文の活用について検討し,本書全体の読解データを作成する。
我々の目的は、長いテキストの詳細な理解を必要とする問題を分析し、理解し、推論するLLMの能力をテストすることである。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:15:10 GMT)
GS-Phong: Meta-Learned 3D Gaussians for Relightable Novel View Synthesis [63.6] 本稿では,3次元ガウス点の集合を用いて,点光で照らされたシーンを表現する手法を提案する。
Blinn-Phongモデルにインスパイアされた我々の手法は、シーンを周囲、拡散、および特異成分に分解する。
照明条件に依存しない幾何学的情報の分解を容易にするため,新しい二段階最適化に基づくメタラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:48:54 GMT)
Neural Network Verification with Branch-and-Bound for General Nonlinearities [63.4] ブランチ・アンド・バウンド(BaB)は、ニューラルネットワーク(NN)検証の最も効果的な方法の一つである。
我々は、一般的な計算グラフにおける一般的な非線形性に対してBaBを実行するための一般的なフレームワークGenBaBを開発した。
我々は、Sigmoid、Tanh、Sine、GeLUなどの活性化機能を持つネットワークを含む幅広いNNの検証におけるGenBaBの有効性を実証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:51:07 GMT)
Deciphering RNA Secondary Structure Prediction: A Probabilistic K-Rook Matching Perspective [63.4] RFoldは、与えられたシーケンスから最もよく一致するK-Rook解を予測する方法である。
RFoldは、最先端のアプローチよりも競争性能とおよそ8倍の推論効率を達成する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:18:31 GMT)
Re3: A Holistic Framework and Dataset for Modeling Collaborative Document Revision [62.1] 共同文書リビジョンを共同で分析するためのフレームワークであるRe3を紹介する。
本稿では,Re3-Sciについて紹介する。Re3-Sciは,その行動と意図に応じて手動でラベル付けされた科学的論文の大規模なコーパスである。
我々は,新しいデータを用いて,学術領域における共同文書改訂に関する実証的研究を行った。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:19:09 GMT)
Exploratory Machine Learning with Unknown Unknowns [60.8] 本稿では,他のラベルと誤認識されたトレーニングデータに未知のクラスが存在するという,新たな問題設定について検討する。
本研究では,潜在的に隠蔽されたクラスを発見するために,機能空間を積極的に拡張することにより,学習データを調べ,調査する探索機械学習を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:11:57 GMT)
Generative AI for Deep Reinforcement Learning: Framework, Analysis, and Use Cases [60.3] 深部強化学習(DRL)は様々な分野に広く適用されており、優れた成果を上げている。
DRLは、サンプル効率の低下や一般化の低さなど、いくつかの制限に直面している。
本稿では、これらの問題に対処し、DRLアルゴリズムの性能を向上させるために、生成AI(GAI)を活用する方法について述べる。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:25:40 GMT)
Improving Text Embeddings with Large Language Models [59.9] 合成データと1k以下のトレーニングステップのみを用いて,高品質なテキスト埋め込みを実現するための,新しい簡易な手法を提案する。
我々は、93言語にまたがる数十万のテキスト埋め込みタスクのための多様な合成データを生成するために、プロプライエタリなLLMを活用している。
実験により,ラベル付きデータを使わずに,高度に競争力のあるテキスト埋め込みベンチマークにおいて高い性能が得られることが示された。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:22:01 GMT)
Learning to Use Tools via Cooperative and Interactive Agents [59.7] ツール学習は、大きな言語モデル(LLM)をエージェントとして、その能力を拡張するために外部ツールを使用する権限を与える。
既存の手法では、1つのLCMベースのエージェントを使用してツールを反復的に選択し実行し、その結果を次のアクション予測に組み込む。
本研究では,協調型対話型エージェントフレームワークであるConAgentsを提案し,ツール学習のワークフローをグラウンディング,実行,監視エージェントにモジュール化する。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:42:44 GMT)
BECoTTA: Input-dependent Online Blending of Experts for Continual Test-time Adaptation [59.2] 連続テスト時間適応(CTTA)は、学習済みの知識を維持しながら、継続的に見えない領域に効率的に適応するために必要である。
本稿では,CTTAの入力依存かつ効率的なモジュール化フレームワークであるBECoTTAを提案する。
提案手法は, トレーニング可能なパラメータを98%少なく抑えながら, 整合性や漸進性などの複数のCTTAシナリオに優れることを確認した。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:14:42 GMT)
Federated Compositional Deep AUC Maximization [58.3] 本研究では,曲線(AUC)のスコアを直接最適化することにより,不均衡なデータに対する新しいフェデレート学習法を開発した。
私たちの知る限りでは、このような好ましい理論的な結果を達成した最初の作品である。
論文参考訳(メタデータ) (Fri, 31 May 2024 04:02:22 GMT)
Large Language Models Enhanced Sequential Recommendation for Long-tail User and Item [58.0] 大規模言語モデル(LLM)の出現は、セマンティックな観点からこれらの課題に対処するための有望な道を示す。
本研究では,Large Language Models Enhancement framework for Sequential Recommendation (LLM-ESR)を紹介する。
提案する拡張フレームワークは,既存手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:24:42 GMT)
Fair Allocation in Dynamic Mechanism Design [57.7] 競売業者が各ラウンドで2つのグループに分けない商品を、合計で$T$のラウンドで販売する問題を考える。
競売人は、各グループの最低平均配分を保証する公正な制約に固執しつつ、割引された全体の収益を最大化することを目的としている。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:26:05 GMT)
When MOE Meets LLMs: Parameter Efficient Fine-tuning for Multi-task Medical Applications [57.3] 我々はMOELoRAと呼ばれるマルチタスク医療応用のためのパラメータ効率の良い微調整フレームワークを提案する。
MOEとLoRAを統一するために、トレーニング可能なパラメータとして複数の専門家を考案し、トレーニング可能なパラメータの小さなサイズを保持するために、各専門家は2つの低ランク行列から構成される。
マルチタスク医療データセットを用いて実験を行い、MOELoRAが既存のパラメータを効率よく微調整する手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:56:08 GMT)
Why Not Transform Chat Large Language Models to Non-English? [57.2] 非英語データの不足は、非英語大言語モデル(LLM)の開発を制限する
TransLLMは、転送問題を変換チェーン・オブ・シント(translation chain of-of- Thought)でいくつかの一般的なサブタスクに分割する。
本手法は,シングルターンデータのみを用いて,マルチターンベンチマークMT-benchにおいて,強いベースラインとChatGPTより優れる。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:22:45 GMT)
Prune at the Clients, Not the Server: Accelerated Sparse Training in Federated Learning [56.2] クライアントのリソース制約と通信コストは、フェデレートラーニングにおける大規模モデルのトレーニングに大きな問題を引き起こす。
Sparse-ProxSkipを導入し、スパース環境でのトレーニングとアクセラレーションを組み合わせた。
Sparse-ProxSkipの優れた性能を広範な実験で実証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:21:12 GMT)
Mixed Diffusion for 3D Indoor Scene Synthesis [55.9] 混合離散連続拡散モデルアーキテクチャであるMiDiffusionを提案する。
シーンレイアウトを2次元のフロアプランとオブジェクトの集合で表現し、それぞれがそのカテゴリ、場所、サイズ、方向で定義する。
実験により,MiDiffusionは床条件下での3次元シーン合成において,最先端の自己回帰モデルや拡散モデルよりもかなり優れていることが示された。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:54:52 GMT)
4Diffusion: Multi-view Video Diffusion Model for 4D Generation [55.8] 現在の4D生成法は, 高度な拡散生成モデルの助けを借りて, 有意義な有効性を実現している。
モノクロビデオから空間的・時間的に一貫した4Dコンテンツを生成することを目的とした,新しい4D生成パイプライン,すなわち4Diffusionを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:18:39 GMT)
Arbitrary Length Generalization for Addition [55.2] 本稿では,2桁の数値を未知の桁数に加算することを一般化する,小さなトランスフォーマーモデルを提案する。
提案手法では, 右から左へ処理を行う自己回帰生成手法を用いて, 多数の値を追加するための共通手動手法を模倣する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:01:16 GMT)
Equivariant Deep Weight Space Alignment [54.7] 本稿では,ウェイトアライメント問題を解決するための学習を目的とした新しいフレームワークを提案する。
まず、重み調整が2つの基本対称性に一致することを証明し、それからこれらの対称性を尊重する深いアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:53:26 GMT)
Modeling User Preferences via Brain-Computer Interfacing [54.4] 我々はBrain-Computer Interface技術を用いてユーザの好みを推測し、その注意力は視覚的コンテンツと感情的体験との関連性に相関する。
我々はこれらを,情報検索,生成モデルのパーソナライズされたステアリング,感情経験のクラウドソーシング人口推定など,関連するアプリケーションにリンクする。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:57:30 GMT)
DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [54.1] 拡散先行型IQA(DP-IQA)と呼ばれる新しいIQA法を提案する。
トレーニング済みの安定拡散をバックボーンとして使用し、復調するU-Netから多レベル特徴を抽出し、それらをデコードして画質スコアを推定する。
上記のモデルの知識をCNNベースの学生モデルに抽出し、適用性を高めるためにパラメータを大幅に削減する。
論文参考訳(メタデータ) (Fri, 31 May 2024 11:39:33 GMT)
Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Models [54.1] 本稿では,RLによる報酬モデルの最適化により,最先端拡散モデルを微調整するハイブリッド手法を提案する。
我々は、報酬モデルの補間能力を活用し、オフラインデータにおいて最良の設計を上回るアプローチの能力を実証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:34:35 GMT)
R$^2$-Gaussian: Rectifying Radiative Gaussian Splatting for Tomographic Reconstruction [53.2] 3次元ガウススプラッティング(3DGS)は画像のレンダリングと表面再構成において有望な結果を示した。
本稿では,Sparse-viewトモグラフィ再構成のための最初の3DGSベースのフレームワークであるR2-Gaussianを紹介する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:39:02 GMT)
Robust Collaborative Perception without External Localization and Clock Devices [52.3] 複数のエージェントをまたいだ一貫した空間的時間的調整は、協調的な知覚の基礎である。
従来の手法は、ローカライゼーションとクロック信号を提供するために外部デバイスに依存している。
本稿では,様々なエージェントの知覚データに内在する幾何学的パターンを認識して整列する手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:58:20 GMT)
Multilinear Mixture of Experts: Scalable Expert Specialization through Factorization [52.0] Mixture of Experts (MoE) パラダイムは、密度の高い層をより小さくモジュール化された計算に分解する強力な方法を提供する。
大きな課題は、きめ細かい特殊化を達成するのに十分な専門家の数をスケーリングする計算コストである。
視覚モデルに焦点をあて、この問題に対処するため、Multilinear Mixture of Experts(mu$MoE)層を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:04:05 GMT)
MeshXL: Neural Coordinate Field for Generative 3D Foundation Models [51.2] 本稿では,現代の大規模言語モデルを用いた3次元メッシュ生成のプロセスに対処する,事前学習型自己回帰モデルの生成ファミリを提案する。
MeshXLは高品質な3Dメッシュを生成することができ、さまざまなダウンストリームアプリケーションの基盤モデルとしても機能する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:35:35 GMT)
Bayesian Design Principles for Offline-to-Online Reinforcement Learning [51.0] オフラインからオンラインへの微調整は、探索にコストがかかる、あるいは安全でない、現実世界のアプリケーションにとって極めて重要です。
本稿では,オフラインからオフラインまでの微調整のジレンマに対処する:エージェントが悲観的のままであれば,より良いポリシーを習得できないかもしれないが,楽観的になった場合,性能が突然低下する可能性がある。
このようなジレンマを解決するにはベイズ設計の原則が不可欠であることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:31:07 GMT)
Bayesian Program Learning by Decompiling Amortized Knowledge [51.0] 本稿では,ニューラルサーチポリシーを直接活用し,その記憶された知識を効果的に「分解」し,関連するプログラムコンポーネントを抽出する,新たな学習手法を提案する。
これにより、より強力な償却推論が実現され、探索幅を減らすために学習した償却知識も探索深度を減らすために使用されるようになった。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:14:58 GMT)
Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.8] 本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:29:13 GMT)
Open the Data! Chuvash Datasets [50.6] Chuvash言語用の包括的データセットを4つ紹介する。
これらのデータセットには、モノリンガルデータセット、ロシア語による並列データセット、英語による並列データセット、オーディオデータセットが含まれる。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:51:19 GMT)
Flow matching achieves minimax optimal convergence [50.4] フローマッチング (FM) は, シミュレーションのない生成モデルとして注目されている。
本稿では、分布差の尺度である$p$-ワッサーシュタイン距離の観点から、FMの収束特性について論じる。
FM が 1 leq p leq 2$ で minmax の最適収束率を達成することを証明し、FM が拡散モデルに匹敵する収束率に到達できるという最初の理論的証拠を提示する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:54:51 GMT)
Towards Spoken Language Understanding via Multi-level Multi-grained Contrastive Learning [50.1] 音声言語理解(SLU)はタスク指向対話システムにおける中核的なタスクである。
本稿では,発話レベル,スロットレベル,単語レベルを含む3段階のコントラスト学習を実現するためのマルチレベルMMCLフレームワークを提案する。
本フレームワークは,2つの公開マルチインテリジェントSLUデータセットに対して,最先端の新たな結果を実現する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:34:23 GMT)
Quantum Information Processing with Molecular Nanomagnets: an introduction [49.9] 本稿では,量子情報処理の導入について紹介する。
量子アルゴリズムを理解し設計するための基本的なツールを紹介し、分子スピンアーキテクチャ上での実際の実現を常に言及する。
分子スピンキュートハードウェア上で提案および実装された量子アルゴリズムの例を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:43:20 GMT)
Relaxed Contrastive Learning for Federated Learning [49.0] 本稿では,フェデレート学習におけるデータ不均一性の課題に対処する,新しいコントラスト学習フレームワークを提案する。
当社のフレームワークは,既存のフェデレート学習アプローチを,標準ベンチマークにおいて大きなマージンで上回ります。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:23:42 GMT)
Aya 23: Open Weight Releases to Further Multilingual Progress [47.7] Aya 23は、Ayaモデルの最新リリース("Ust"un et al., 2024)の上に構築されており、高性能で事前訓練されたモデルと、最近リリースされたAyaコレクションとのペアリングに焦点を当てている。
その結果、23の言語を提供する強力な多言語大言語モデルとなり、最先端の言語モデリング能力を世界の人口の約半分にまで拡張した。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:47:55 GMT)
You Only Scan Once: Efficient Multi-dimension Sequential Modeling with LightNet [47.5] 我々は,新しい再帰性に基づいて,LightNetと呼ばれる効率的な多次元逐次モデリングフレームワークを開発した。
MD-TPEとMD-LRPEという2つの新しい多次元線形相対的位置符号化手法を提案し,多次元シナリオにおける位置情報の識別能力を高める。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:09:16 GMT)
Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation [47.1] オフ・プライシ・データにおいても,ブートストラップ値推定の収束条件が弱くなることを証明する。
計算結果をトラジェクトリによる学習に拡張し、小さな修正を施した全てのタスクに対して収束が達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:36:16 GMT)
N-Dimensional Gaussians for Fitting of High Dimensional Functions [46.2] 本稿では,ガウス混合モデルに基づく明示表現の課題に取り組む。
局所性感性ハッシュにインスパイアされたN-Dガウスを効率的に束縛する高次元カリング方式を提案する。
適応的洗練とコンパクト化を両立させるため,付加能力の使用を漸進的に導く損失適応密度制御方式を導入する。
これらのツールを使えば、位置や視角を超えた多くの入力次元に依存する複雑な外観を初めて表現することができます。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:11:24 GMT)
ToxVidLLM: A Multimodal LLM-based Framework for Toxicity Detection in Code-Mixed Videos [46.1] 本稿では,YouTubeから収集した931の動画と4021のコード混成ヒンディー語発話からなるベンチマークデータセットを提案する。
大規模言語モデル(LLM)を利用したビデオコンテンツ中の毒性検出のための高度なマルチモーダルマルチタスクフレームワークを開発した。
実験の結果,複数モーダルを組み込むことで有毒なコンテンツ検出性能が著しく向上することが判明した。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:40:56 GMT)
Self-supervised Feature-Gate Coupling for Dynamic Network Pruning [46.1] 特徴とゲートの分布を整列する特徴ゲート結合(FGC)手法を提案する。
FGCはプラグアンドプレイモジュールであり、反復的な自己管理方式で2つのステップが実行される。
実験結果から,提案手法がベースラインアプローチを著しく改善することを確認した。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:32:49 GMT)
TensorKrowch: Smooth integration of tensor networks in machine learning [46.1] PyTorch上に構築されたオープンソースのPythonライブラリであるKrowchを紹介します。
ユーザは任意のテンソルネットワークを構築してトレーニングし、より複雑なディープラーニングモデルにレイヤとして統合することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:39:03 GMT)
Hierarchical World Models as Visual Whole-Body Humanoid Controllers [44.7] ヒューマノイドの全身制御は、この問題の高次元の性質と二足歩行形態の固有の不安定性のために困難である。
本稿では,ハイレベルエージェントが実行すべき低レベルエージェントの視覚的観察に基づいてコマンドを生成する階層的世界モデルを提案する。
提案手法は, 56-DoFヒューマノイドを模擬した8つのタスクにおいて, ヒトに広く好まれる動作を合成しながら, 高い性能の制御ポリシーを生成する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:03:00 GMT)
Provably Efficient Interactive-Grounded Learning with Personalized Reward [44.6] インタラクティブ・グラウンドド・ラーニング(Interactive-Grounded Learning, IGL)は、学習者が観測不能な報酬を最大化することを目的とした強力なフレームワークである。
我々は、実現可能性の下でサブ線形後悔を伴う最初の証明可能な効率のよいアルゴリズムを提供する。
本稿では,探索-テーマ-露光に基づく2つのアルゴリズムと,逆ギャップ重み付けに基づく2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:21:09 GMT)
SemRel2024: A Collection of Semantic Textual Relatedness Datasets for 13 Languages [44.0] textitSemRelは13言語にまたがるネイティブスピーカーによって注釈付けされた新しいセマンティック関連データセットである。
これらの言語は5つの異なる言語族の出身であり、主にアフリカとアジアで話されている。
SemRelデータセットの各インスタンスは、2つの文間の意味的テキスト関連性の度合いを表すスコアに関連付けられた文対である。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:57:58 GMT)
Fourier123: One Image to High-Quality 3D Object Generation with Hybrid Fourier Score Distillation [43.7] 我々は、3次元の新規なビュー生成拡散モデルからの幾何的先行と、2次元画像生成法からの外観先行を利用して最適化プロセスの導出を行う。
さらに,Fourier123という高品質な3Dオブジェクトを1分以内で生成する画像から3D生成パイプラインを開発した。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:11:25 GMT)
VQ-HPS: Human Pose and Shape Estimation in a Vector-Quantized Latent Space [43.4] この研究は、ヒューマン・ポースと形状推定の問題に対処する新しいパラダイムを導入している。
身体モデルパラメータを予測する代わりに、提案した離散潜在表現を予測することに重点を置いている。
提案モデルであるVQ-HPSはメッシュの離散潜在表現を予測する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:48:46 GMT)
A Framework for Spatio-Temporal Graph Analytics In Field Sports [43.1] 本研究では,フィールドスポーツのためのタイムウィンドな空間活動グラフ(TWG)を構築するためのアプローチを提案する。
ゲーリックフットボールの試合から得られたGPSデータを用いて,我々のアプローチをどのように活用できるかを実証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:28:03 GMT)
Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models [43.0] CDD は LLM の出力分布による汚染検出の略である。
評価におけるデータ汚染の影響を軽減するため、TED:出力分布による信頼に値する評価も提示する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:49:03 GMT)
Position Coupling: Leveraging Task Structure for Improved Length Generalization of Transformers [42.9] 本稿では,タスクの構造をトランスフォーマーの位置エンコーディングに組み込む,シンプルで効果的な位置結合法を提案する。
1桁から30桁の加算で訓練された小さな(1層)トランスフォーマーが最大200桁の加算を一般化できることを示す。
また,複数サマンドの追加,Nx2乗算,コピー/リバース,二次元タスクなど,他のアルゴリズムタスクにも位置カップリングが適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:13:35 GMT)
Tsang's resolution enhancement method for imaging with focused illumination [42.4] いずれの方法よりも優れた横方向分解能と画像品質を実験的に示す。
この結果は、空間分解を既存の顕微鏡に統合する方法を舗装する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:25:05 GMT)
SNED: Superposition Network Architecture Search for Efficient Video Diffusion Model [41.8] 本稿では,効率的な映像拡散モデルのための重ね合わせネットワークアーキテクチャ探索手法SNEDを提案する。
提案手法では,様々なモデルコストと解像度の選択肢をターゲットにしたスーパーネットトレーニングパラダイムを採用している。
当社のフレームワークは、高い効率で、さまざまなモデルオプションに匹敵する結果を一貫して生成しています。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:12:30 GMT)
Unleashing the Potential of Diffusion Models for Incomplete Data Imputation [41.6] 本稿では,データ計算の欠如に対する反復的手法であるDiffPuterを紹介する。
欠損したデータをモデルトレーニング中に更新可能な隠れ変数として扱うことで、欠落したデータ計算タスクをEM問題として扱う。
DiffPuterは,最も競争力のある既存手法と比較して,MAEの8.10%,RMSEの5.64%の平均改善を実現している。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:35:56 GMT)
Ovis: Structural Embedding Alignment for Multimodal Large Language Model [41.3] Ovisは、視覚とテキストの埋め込みを構造的に整列するように設計された新しいMLLMアーキテクチャである。
Ovisは学習可能なビジュアル埋め込みテーブルをビジュアルエンコーダのプロセスに統合する。
この構造的アプローチは、テキスト埋め込みを生成するために使われる手法を反映している。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:59:18 GMT)
An Efficient and Multi-private Key Secure Aggregation for Federated Learning [41.3] フェデレート学習のための効率的かつ多目的な鍵セキュアアグリゲーション手法を提案する。
具体的には、変種ElGamal暗号を巧みに修正し、同型加算演算を実現する。
高次元深層モデルパラメータに対しては,多次元データを1次元に圧縮する超増進シーケンスを導入する。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:29:20 GMT)
Robust Entropy Search for Safe Efficient Bayesian Optimization [40.6] 我々は、ロバスト・エントロピー・サーチ(RES)と呼ばれる効率的な情報ベース獲得機能を開発する。
RESは、堅牢で最先端のアルゴリズムよりも確実に最適である。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:45:53 GMT)
Fast yet Safe: Early-Exiting with Risk Control [40.4] 早期排他ニューラルネットワーク(EENN)は中間層を脱出させ、早期に予測を生成することによって推論を加速する。
しかし、EENNの根本的な問題は、パフォーマンスを著しく低下させることなく、いつ終了するかを決定する方法である。
リスクコントロールは、EENNのエグジットメカニズムをチューニングし、アウトプットが十分な品質の場合にのみ発生する、分散のないポストホックソリューションを提供する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:21:44 GMT)
NoiseBoost: Alleviating Hallucination with Noise Perturbation for Multimodal Large Language Models [40.1] NoiseBoostは、人間の評価により、密度のキャプション精度を8.1%向上させる。
NoiseBoostは先駆的にMLLMの半教師付き学習を可能にし、ラベルなしデータのパワーを解放する。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:40:04 GMT)
Fast Inference of Removal-Based Node Influence [39.7] 本稿では,ノードの除去による学習GNNモデルの予測変化を計測するノードの影響評価手法を提案する。
我々は,ノード除去に伴うノードやエッジの変化をシミュレート可能な代理モデルとして,GNNを使用している。
ノード除去の影響を近似するために勾配情報を利用するNOde-Removal-based fAst GNN推論(NORA)を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:36:34 GMT)
The Point of View of a Sentiment: Towards Clinician Bias Detection in Psychiatric Notes [39.7] 本研究の目的は, 精神科臨床ノートに表される感情を, 読者の視点に基づいて識別することである。
提案手法は,3つの大言語モデルを用いて文によって伝達される感情を,提供者や非提案者の観点から分類する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:28:41 GMT)
Enhancing Noise Robustness of Retrieval-Augmented Language Models with Adaptive Adversarial Training [39.2] 大型言語モデル(LLM)は、幻覚、時代遅れの知識、追跡不能な推論プロセスなどの課題に遭遇する重大な能力を示す。
Retrieval-augmented Generation(RAG)は、これらの課題を軽減するために、外部データベースからの知識を統合する、有望なソリューションとして登場した。
本稿では,RAAT(Retrieval-augmented Adaptive Adrial Training)として知られる新しいRAGアプローチを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:24:53 GMT)
URDFormer: A Pipeline for Constructing Articulated Simulation Environments from Real-World Images [39.1] そこで本研究では,実世界の画像からキネマティック構造と動的構造を合成したシミュレーションシーンを生成するエンドツーエンドパイプラインを提案する。
そこで本研究は,大規模シミュレーション環境のためのパイプラインと,ロバストなロボット制御ポリシをトレーニングするための統合システムの両方を提供する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:44:06 GMT)
SpeechVerse: A Large-scale Generalizable Audio Language Model [38.7] SpeechVerseは堅牢なマルチタスクトレーニングおよびカリキュラム学習フレームワークである。
学習可能なパラメータの小さなセットを通じて、事前訓練された音声とテキスト基礎モデルを組み合わせる。
実験により、我々のマルチタスクSpeechVerseモデルは、従来のタスク固有のベースラインよりも11タスク中9タスクの方が優れていることが判明した。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:47:40 GMT)
Enabling Weak LLMs to Judge Response Reliability via Meta Ranking [38.6] 我々は、$textitMeta Ranking$ (MR) と呼ばれるクロスクエリベースの新しい手法を提案する。
MRは、ターゲットクエリ-レスポンスペアを複数の参照クエリ-レスポンスペアにペアでランク付けすることで、信頼性を評価する。
MRはモデルカスケーディングとインストラクションチューニングの2つの実用的応用において、強力なLLMの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:25:42 GMT)
Retrieval-Augmented Generation for AI-Generated Content: A Survey [38.5] このような課題に対処するためのパラダイムとして,レトリーバル拡張生成(RAG)が登場している。
RAGは情報検索プロセスを導入し、利用可能なデータストアから関連オブジェクトを検索することで生成プロセスを強化する。
本稿では,RAG手法をAIGCシナリオに統合する既存の取り組みを概観的にレビューする。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:56:39 GMT)
Scaling White-Box Transformers for Vision [38.2] CRATEは、圧縮およびスパース表現を学習するために設計されたホワイトボックストランスフォーマーアーキテクチャである。
我々はCRATE-$alpha$を提案し、CRATEアーキテクチャ設計におけるスパースコーディングブロックの戦略的かつ最小限の修正を特徴としている。
CRATE-$alpha$は、より大きなモデルサイズとデータセットで効果的にスケールできることを示します。
論文参考訳(メタデータ) (Fri, 31 May 2024 06:56:51 GMT)
LSTM-based Deep Neural Network With A Focus on Sentence Representation for Sequential Sentence Classification in Medical Scientific Abstracts [37.5] 文レベルでの包括的文表現に焦点をあてたLSTMに基づくディープラーニングネットワークを提案する。
提案システムでは,最先端システムと比較して高い競争力が得られる。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:37:04 GMT)
Rethinking Open-World Semi-Supervised Learning: Distribution Mismatch and Inductive Inference [37.4] オープンワールド半教師付き学習(OWSSL)は、ラベルなしデータセットの新たなカテゴリを考慮して、従来の半教師付き学習をオープンワールドシナリオに拡張する。
本研究は,既存の文献と比較すると,実際のOWSSLには異なるトレーニング設定,評価方法,学習戦略が必要であることを示唆している。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:21:00 GMT)
An Overview of Quantum Software Engineering in Latin America [36.3] この研究は、ラテンアメリカの文脈における量子ソフトウェア工学の進歩、課題、そして機会に関する情報を提供することを目的としている。
本研究は,先進的イニシアチブの創始とラテンアメリカの研究者の協力的努力を促進するための潜在的刺激として,この急成長分野における最先端開発に関するより深い理解を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:55:19 GMT)
Trajectory Forecasting through Low-Rank Adaptation of Discrete Latent Codes [36.1] トラジェクトリ予測は、一連のエージェントの将来の動きを予測できるため、ビデオ監視分析に不可欠である。
本稿では,離散潜在空間を用いたベクトル量子変分オートエンコーダ(VQ-VAEs)を導入し,後方崩壊問題に対処する。
このような2段階のフレームワークは、インスタンスレベルの離散化によって強化され、正確で多様な予測につながることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 10:13:17 GMT)
Tailoring with Targeted Precision: Edit-Based Agents for Open-Domain Procedure Customization [36.1] 庭の植え方などのハウツー手順は、今や何百万人ものユーザーが利用している。
例えば、殺虫剤を使わずに庭を植えることなどである。
我々のゴールは、このようなカスタマイズを行うLLMの能力の測定と改善です。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:32:23 GMT)
4DHands: Reconstructing Interactive Hands in 4D with Transformers [36.0] 4DHandsは,対話型ハンドメッシュとそのモノクラー入力からの相対移動を回復するための頑健なアプローチである。
我々は新しいトークン化と機能融合戦略を備えたトランスフォーマーベースのアーキテクチャを開発する。
提案手法の有効性を,いくつかのベンチマークデータセットで検証した。
論文参考訳(メタデータ) (Fri, 31 May 2024 10:52:56 GMT)
No-Regret Learning for Fair Multi-Agent Social Welfare Optimization [35.4] オンラインマルチエージェント・ナッシュ社会福祉(NSW)の課題について考察する。
アルゴリズムがサブ線形後悔を達成できないことを示す。
また,異なる武器に無関心なエージェントが1つ存在する場合,対数的後悔が可能であることも示している。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:21:11 GMT)
Entangled Relations: Leveraging NLI and Meta-analysis to Enhance Biomedical Relation Extraction [35.3] そこで我々は,NLIの原理を応用し,関係抽出を強化したMetaEntail-REを提案する。
我々のアプローチは、関係クラスをクラス指示仮説に言語化することで過去の研究に追従する。
実験の結果,MetaEntail-REはバイオメディカルドメインと一般ドメインの両方で性能向上を示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:05:04 GMT)
Studying K-FAC Heuristics by Viewing Adam through a Second-Order Lens [34.7] 我々は,K-FACの減衰と学習率選択技術を組み合わせたオプティマイザAdamQLRについて検討した。
我々はAdamQLRを様々なスケールで様々な回帰・分類タスクで評価する。
チューニングされていないAdamQLR設定を見つけることで、チューニングされたベンチマークに対して、実行時と同等のパフォーマンスを実現することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:31:38 GMT)
End-to-End Training Induces Information Bottleneck through Layer-Role Differentiation: A Comparative Analysis with Layer-wise Training [34.3] エンド・ツー・エンド(E2E)トレーニングでは、エラーのバックプロパゲーションを通じてモデル全体を最適化し、ディープラーニングの進歩を根本的に支援する。
E2E訓練のパフォーマンスにはまだ一致しないため、実用性に乏しい。
本稿では,エラーを局所的に設定する非E2E手法であるレイヤワイドトレーニングとの比較により,E2Eトレーニングが優れた性能を示す理由を再考する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:15:06 GMT)
Popularity-Aware Alignment and Contrast for Mitigating Popularity Bias [34.0] 協調フィルタリング(CF)は通常、現実のデータセットにおけるアイテムの不均一な分布のため、人気バイアスの課題に悩まされる。
このバイアスは、人気アイテムと不人気アイテムの間にかなりの精度のギャップをもたらす。
本稿では,2つの課題に対処するために,PAAC(Popularity-Aware Alignment and Contrast)を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:14:48 GMT)
Mastering Long-Tail Complexity on Graphs: Characterization, Learning, and Generalization [33.9] マルチタスク学習方式で問題を定式化することにより,グラフ上の長い尾の分類のための一般化を提案する。
理論的には, 長期分類の一般化性能は, 全体の損失範囲とタスクの複雑さに支配されている。
理論的な知見に基づいて,グラフ上の長い尾の分類のための新しい汎用フレームワークHierTailを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:02:37 GMT)
Effective Interplay between Sparsity and Quantization: From Theory to Practice [33.7] 空間性と量子化は、モデル精度を保ちながら計算量とメモリフットプリントの大幅な削減を個別に示す2つの顕著な圧縮手法である。
これら2つの手法間の相互作用を調査し、それらの組み合わせが最終的なモデルの精度に影響を及ぼすかどうかを評価する。
我々の研究結果は、リソース制限された計算プラットフォームにおける大規模モデルの効率的なデプロイと、サービスコストの削減にまで及んでいる。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:34:13 GMT)
Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training [33.6] アクションベースのコントラスト自己学習は、多ターン会話におけるサンプル効率のよい対話ポリシー学習を可能にする。
ACTは、教師付き微調整とDPOのための標準的なアプローチよりも、相当な会話モデリングの改善を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:44:48 GMT)
MEGA: Masked Generative Autoencoder for Human Mesh Recovery [33.3] 単一のRGB画像からのHuman Mesh Recovery(HMR)は非常に曖昧な問題である。
ほとんどのHMR法はこの曖昧さを無視し、関連する不確実性を考慮せずに単一の予測を行う。
我々は、画像と部分的な人間のメッシュシーケンスから人間のメッシュを復元するために訓練されたMaskEd生成自動エンコーダMEGAを紹介する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:03:07 GMT)
ESM All-Atom: Multi-scale Protein Language Model for Unified Molecular Modeling [32.7] ESM-AA(ESM All-Atom)は原子スケールと残基スケールの統一分子モデリングを可能にする新しいアプローチである。
実験結果から,ESM-AAはタンパク質分子タスクの従来の手法を超越していることが示唆された。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:28:40 GMT)
DAFNet: Dynamic Auxiliary Fusion for Sequential Model Editing in Large Language Models [32.6] 動的補助核融合ネットワーク(DAFNet)は、シーケンス全体の事実知識間の意味的相互作用を強化するように設計されている。
DAFNetはシングルターンとシーケンシャルな編集において、強いベースラインを著しく上回っている。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:56:49 GMT)
Fairness Without Harm: An Influence-Guided Active Sampling Approach [32.2] 我々は、モデルの精度に害を与えることなく、グループフェアネスの格差を軽減するモデルを訓練することを目指している。
公正なアクティブな学習アプローチのような現在のデータ取得方法は、通常、アノテートセンシティブな属性を必要とする。
トレーニンググループアノテーションに依存しない抽出可能なアクティブデータサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:11:10 GMT)
Self-planning Code Generation with Large Language Models [32.0] 本稿では,大規模言語モデルを用いた自己計画型コード生成手法を提案する。
計画段階では、モデルは意図から簡潔な解決手順と数発のプロンプトを組み合わせることを計画している。
実装フェーズでは、モデルが前のソリューションステップでガイドされたステップごとにコードを生成する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:50:23 GMT)
Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality [32.0] Mamba のような状態空間モデル (SSM) は,小型・中規模での変換器の整合性や性能向上が示されている。
我々の状態空間双対性(SSD)フレームワークは、コア層が2~8倍高速なMambaの選択SSMの精細化である新しいアーキテクチャ(Mamba-2)を設計することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:50:01 GMT)
Mamba: Linear-Time Sequence Modeling with Selective State Spaces [32.0] ファンデーションモデルは、ほぼ普遍的にTransformerアーキテクチャとコアアテンションモジュールに基づいている。
このようなモデルの重大な弱点は、コンテンツベースの推論を実行できないことである。
我々はこれらの選択的なSSMを、注意やブロック(Mamba)を使わずに、単純化されたエンドツーエンドニューラルネットワークアーキテクチャに統合する(Mamba)。
一般的なシーケンスモデルバックボーンとして、Mambaは言語、オーディオ、ゲノミクスといったいくつかのモードで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:55:27 GMT)
Data-Efficient 3D Visual Grounding via Order-Aware Referring [32.0] 3Dビジュアルグラウンドティングは、自然言語記述によって参照される3Dポイントクラウドシーン内でターゲットオブジェクトを特定することを目的としている。
我々は、注文認識参照を介して、新しいデータ効率のよい3DビジュアルグラウンドフレームワークであるVigorを紹介した。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:24:43 GMT)
Direct Alignment of Language Models via Quality-Aware Self-Refinement [31.8] そこで本研究では,本研究における本質的知識の活用について検討し,相対的特性の獲得と損失関数の高度化に寄与する。
構築された精細化関数は、軽度の仮定の下で損失関数を自己再定義するのに役立つことを示す。
実験は、DPOやIPOよりも細調整されたモデルの性能を向上させることができることを示している。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:31:18 GMT)
SocialNLP Fake-EmoReact 2021 Challenge Overview: Predicting Fake Tweets from Their Replies and GIFs [31.6] NAACL 2021とともに第9回SocialNLPワークショップで開催されたFake-EmoReact 2021 Challengeの概要を紹介する。
この課題は、EmotionGIFデータセットから返信コンテキストと拡張GIFカテゴリを使用して、ツイートの真正性を予測することである。
この挑戦に参加するために24チームが登録され、5チームが評価フェーズに成果を提出しました。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:14:11 GMT)
Accuracy Booster: Enabling 4-bit Fixed-point Arithmetic for DNN Training [31.5] 算術密度を最大化しながら、トレーニング精度を維持するにはシングルレベルスケーリングが十分であることを示す。
本稿では,4ビットマンティッサをトレーニング中の算術演算の99%以上に使用する混合マンティッサHBFP手法であるAccuracy Boosterを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:47:25 GMT)
Quantum quench dynamics as a shortcut to adiabaticity [31.1] 本研究では,クエンチステップを組み込んだ量子アルゴリズムを,変分するアディバティック・タイムスケールに対する対策として開発・テストする。
実験の結果,本手法は断熱アルゴリズムよりも有意に優れていることがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:07:43 GMT)
Superlatives in Context: Explicit and Implicit Domain Restrictions for Superlative Frames [31.1] 重ね合わせは、最大/最小の性質を持つ要素を選別するために用いられる。
重ね合わせは暗黙の現象や談話制限を研究するのに理想的な現象である。
現代のモデルでは、文脈における最上級のセマンティクスの微粒化が困難であることが示される。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:14:06 GMT)
Grammar-Aligned Decoding [31.0] LLM(Large Language Models)は、プログラムコード、数学的公式、整形されたマークアップなどの高度に構造化された出力を確実に生成するのに苦労する。
制約付き復号法は、LLMが出力できるトークンを各ステップで厳格に制限し、出力が与えられた制約と一致することを保証することによってこの問題を軽減する。
本稿では,GCD技術がLLMの分布を歪め,文法的だがLLMに比例しない確率で現れる出力を導出することを示す。
我々は、出力が保証される復号アルゴリズムである近似予測未来(ASAp)を用いた適応サンプリングを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:39:15 GMT)
Learning Gaze-aware Compositional GAN [30.7] ラベル付きおよびラベルなしデータソースの利点を活用して、注釈付き視線データを作成するための生成フレームワークを提案する。
本稿では,ETH-XGazeデータセットにおける領域内画像拡張と,CelebAMask-HQデータセット領域における領域間画像拡張による視線推定トレーニングの有効性を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:07:54 GMT)
No Free Lunch Theorem for Privacy-Preserving LLM Inference [30.6] 本研究では,プライバシ保護型大規模言語モデル(LLM)を推定するためのフレームワークを開発する。
プライバシー保護とユーティリティの相互作用を調べるための、しっかりとした理論的基盤を築いている。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:22:53 GMT)
API Pack: A Massive Multi-Programming Language Dataset for API Call Generation [30.5] API Packは、100万以上の命令APIコールペアを含む、大規模なマルチプログラミング言語データセットである。
API Packの微調整により、1つの言語で大量のデータと、他の言語からの少量のデータを活用することで、クロスプログラミング言語の一般化が可能になる。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:31:38 GMT)
Diversifying Query: Region-Guided Transformer for Temporal Sentence Grounding [30.3] 時間的文接地のための地域ガイド型TRansformer(RGTR)を提案する。
学習可能なクエリを使う代わりに、RGTRは一連のアンカーペアをモーメントクエリとして採用して、明示的な地域ガイダンスを導入している。
大規模な実験は、データセット上で最先端の手法より優れたRGTRの有効性を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:13:09 GMT)
SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning [30.3] 大規模言語モデル(LLM)は、データ規則や倫理的AIプラクティスに従うための効果的な非学習メカニズムの必要性を強調している。
LLMs unlearningは、望ましくないデータの影響と関連するモデル機能を取り除くことを目的としている。
SOULは、さまざまな未学習タスク、モデル、メトリクスにわたって、従来の一階法よりも一貫して優れています。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:38:51 GMT)
ACE: A Model Poisoning Attack on Contribution Evaluation Methods in Federated Learning [30.0] フェデレートラーニング(FL)では、クライアントのセットが、ローカルトレーニングデータを共有することなく、機械学習モデル(グローバルモデルと呼ばれる)を協調的にトレーニングする。
本研究は, FL におけるコントリビューション評価手法であるACE を用いた第1モデル毒殺攻撃を提案する。
その結果,ACEは5つの最先端コントリビューション評価手法を効果的に,かつ効果的に認識していることがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:21:55 GMT)
Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game [30.0] 当社の価格体系は、消費者、プラットフォーム、販売者の利益を考慮し、これら3人の参加者の利益満足度を同時に達成する。
既存の固定価格モードとは異なり、我々が提案するPBTの価格メカニズムはより柔軟で多様なものであり、現実のシナリオのトランザクション要求に応じている。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:01:32 GMT)
PUAL: A Classifier on Trifurcate Positive-Unlabeled Data [29.6] 非対称損失(PUAL)を有するPU分類器を提案する。
我々は、PUALが非線形決定境界を得ることを可能にするカーネルベースのアルゴリズムを開発した。
シミュレーションと実世界の両方のデータセットの実験を通して、PUALはトリフルケートデータの良好な分類を実現できることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:18:06 GMT)
SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales [29.3] SaySelfは、大規模言語モデルに、より正確なきめ細かな信頼推定を表現するためのトレーニングフレームワークである。
さらに、SaySelf は LLM に対して、パラメトリック知識のギャップを明確に識別する自己反射的合理性を生成するよう指示する。
生成した自己反射的理性は合理的であり、キャリブレーションにさらに貢献できることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:21:16 GMT)
Dynamic Context Pruning for Efficient and Interpretable Autoregressive Transformers [29.3] 本稿では,モデル表現性を保ちながら文脈情報を動的に生成する手法を提案する。
本手法では,文脈からどの非形式的トークンをドロップできるかを学習可能なメカニズムを用いて決定する。
我々の参照実装は、推論スループットの増大とメモリの節約を最大2ドルまで達成します。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:02:24 GMT)
Open Ad Hoc Teamwork with Cooperative Game Theory [28.6] アドホックなチームワークは、事前の調整や共同トレーニングなしに、チームメイトと協力するエージェントの設計を必要とする、困難な問題を引き起こします。
現実の有望な解決策の1つは、グラフニューラルネットワークの一般化可能性を活用して、制限のない数のエージェントを処理することである。
我々は、OAHTの合同Q値表現を理解するための新しい理論を確立し、その学習パラダイムを検証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:28:10 GMT)
einspace: Searching for Neural Architectures from Fundamental Operations [28.3] 本稿では,パラメータ化された確率的文脈自由文法に基づく検索空間であるeinspaceを紹介する。
競合アーキテクチャはゼロから検索することで得ることができ、強力なベースラインで検索を初期化する際には、常に大きな改善が得られます。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:25:45 GMT)
Extreme Point Supervised Instance Segmentation [28.2] 本稿では,各オブジェクトの極端点,左極端点,最下極点,右極端点を用いて,インスタンスセグメンテーションを学習するための新しいアプローチを提案する。
これらの点は、正確なセグメンテーションのための強力な手がかりを提供しながら、現代のバウンディングボックスアノテーションプロセスで容易に利用可能である。
本モデルでは,対象物を複数の部品に分けた場合に高品質なマスクを生成する。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:37:39 GMT)
DeCo: Decoupling Token Compression from Semantic Abstraction in Multimodal Large Language Models [28.0] 本研究では,MLLM内の視覚言語意味の流れを解釈し,プロジェクタモジュールについて検討する。
その結果,圧縮プロジェクタはオブジェクトや属性などの限られた意味概念の集合に視覚パッチを抽象化し,結果として「二重抽象化」現象が生じることがわかった。
本稿では,プロジェクタによるパッチレベルで視覚トークン番号を圧縮する「抽象化からのデカップル圧縮(Decouple Compression from Abstraction, DeCo)」について,重要な知見を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:31:38 GMT)
Streamflow Prediction with Uncertainty Quantification for Water Management: A Constrained Reasoning and Learning Approach [28.0] 本稿では、論理的制約として表される物理法則を、ディープニューラルネットワークの層として統合する制約付き推論と学習(CRL)アプローチについて検討する。
そこで本研究では,深層モデルの一般化精度を向上させるため,理論的に基礎的なトレーニング手法を開発した。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:53:53 GMT)
Calibrated Self-Rewarding Vision Language Models [27.7] LVLM(Large Vision-Language Models)は、訓練済みの大規模言語モデル(LLM)と視覚モデルを統合することで、指導チューニングを通じて大幅に進歩した。
LVLMは、しばしば幻覚現象を示し、生成されたテキスト応答は言語的に妥当に見えるが、入力画像に矛盾する。
本稿では,候補応答を反復的に生成し,各応答に対する報酬を評価し,微調整のための選好データをキュレートすることで,モデルの自己改善を可能にするCalibrated Self-Rewarding(CSR)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:37:53 GMT)
Outliers and Calibration Sets have Diminishing Effect on Quantization of Modern LLMs [27.4] 学習後量子化(PTQ)は大規模言語モデル(LLM)の効率を向上させる
PTQにおける校正セットの役割,特に隠れ活性化に対する効果について検討する。
我々の分析では、利用可能なモデル間で量子化の有効性に顕著なコントラストが示される。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:24:33 GMT)
Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling [27.1] 本稿では,Adamスタイルにおける最適学習率とバッチサイズとの関係について検討する。
最適学習率が最初に上昇し、バッチサイズが大きくなるにつれて低下することを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:01:56 GMT)
Towards Imbalanced Motion: Part-Decoupling Network for Video Portrait Segmentation [26.9] 本稿では,大規模マルチシーン映像ポートレートデータセットMVPSを提案する。
データセットには多様なシーンと複雑な背景環境がある。
本稿では,映像のポートレートセグメンテーションのためのPart-Decoupling Network (PDNet)を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:00:18 GMT)
MedFLIP: Medical Vision-and-Language Self-supervised Fast Pre-Training with Masked Autoencoder [26.8] 本稿では,医療分析のための高速言語画像事前学習手法であるMedFLIPを紹介する。
交差ドメインを用いたゼロショット学習のためのMAEを探索し、限られたデータから学習するモデルの能力を向上する。
最後に,医療画像解析におけるゼロショット性能の向上を言語を用いて検証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:12:59 GMT)
Decentralized Multi-Level Compositional Optimization Algorithms with Level-Independent Convergence Rate [26.7] 分散化されたマルチレベル最適化は、マルチレベル構造と分散通信のために困難である。
マルチレベル構成問題を最適化する2つの新しい分散最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:23:18 GMT)
The Common Intuition to Transfer Learning Can Win or Lose: Case Studies for Linear Regression [26.5] 本稿では,学習対象パラメータと学習対象パラメータとの距離を正規化した線形回帰最適化として,対象タスクへの伝達学習アプローチを定義する。
十分関連するタスクに対して、最適に調整された転送学習手法が最適に調整されたリッジ回帰法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:35:18 GMT)
Realization of a cold atom gyroscope in space [26.5] 原子干渉計(AI)は2022年に中国宇宙ステーションで打ち上げられた。
この研究は、宇宙における最初のAIベースのジャイロスコープを実行し、将来の宇宙ベースのAI実験の道を開く。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:52:11 GMT)
Information Maximization via Variational Autoencoders for Cross-Domain Recommendation [26.1] 我々は、情報最大化変分オートエンコーダ(textbftextttIM-VAE)という新しいCDSRフレームワークを導入する。
ここでは、下流の細粒度CDSRモデルに対するユーザのインタラクション履歴入力を強化するために擬似シーケンス生成器を提案する。
我々の知る限りでは、オープンワールドレコメンデーションシナリオにおける擬似シーケンスの情報のゆがみとデノベーションを考慮に入れた最初のCDSR作品である。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:07:03 GMT)
Textual Inversion and Self-supervised Refinement for Radiology Report Generation [25.8] 放射線学レポート作成のためのテキスト・インバージョン・セルフ・教師付きリファインメント(TISR)を提案する。
TISRは、画像を擬似語として表現することで、テキストと画像を同じ空間に投影し、相互モデリングのギャップをなくす。
広範に利用されている2つの公開データセットの実験を行い、様々なベースラインで大幅に改善した。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:47:44 GMT)
$μ$LO: Compute-Efficient Meta-Generalization of Learned Optimizers [25.7] 学習(LO)は、ニューラルネットワークのウォールクロックトレーニング時間を著しく短縮することができる。
LOは、特にメタトレーニング中に見られるものよりも大きなトレーニングネットワークの場合、しばしばメタ汎用性の低下に悩まされる。
我々は最近提案された最大更新パラメトリゼーション(mu$P)を使ってこの問題に対処する。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:28:47 GMT)
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models [25.3] Retrieval-augmented Large Language Models (RALMs) は、元の検索自由言語モデル (LMs) を一貫して上回るものではない。
提案実験により, この例レベルの性能不整合性は, 検索強化と検索不要のLMの間だけでなく, 異なる検索者の間にも存在することが明らかとなった。
本稿では,異なる知識ソースから適応的に検索し,予測不能な読み出し誤りを効果的に低減できるトレーニング可能なフレームワークであるEnsemble of Retrievers(EoR)を紹介する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:22:49 GMT)
G-Transformer for Conditional Average Potential Outcome Estimation over Time [25.1] G-transformer(GT)は,条件付き平均電位結果(CAPOs)を時間とともに推定する,新しいニューラルエンド・ツー・エンドモデルである。
我々のGTは、時間変化条件下でCAPOに対して回帰に基づく反復的なG-計算を行う最初のニューラルモデルである。
この研究は、電子健康記録からパーソナライズされた意思決定への重要な一歩である。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:52:51 GMT)
All Your Tokens are Belong to Us: Demystifying Address Verification Vulnerabilities in Solidity Smart Contracts [24.9] 検証のプロセスにおける脆弱性は、大きなセキュリティ問題を引き起こす可能性がある。
静的EVMオペコードシミュレーションに基づく軽量なテナントアナライザであるAVVERIFIERの設計と実装を行う。
500万以上のスマートコントラクトを大規模に評価した結果,コミュニティが公表していない812の脆弱性のあるスマートコントラクトを特定しました。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:02:07 GMT)
Unity by Diversity: Improved Representation Learning in Multimodal VAEs [24.7] ハード制約をソフト制約に置き換えることで、より優れた潜伏表現が得られることを示す。
既存の手法と比較して、学習した潜在表現の改善と欠落したデータモダリティの計算結果を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:14:43 GMT)
360Loc: A Dataset and Benchmark for Omnidirectional Visual Localization with Cross-device Queries [24.3] 本稿では,視覚的ローカライゼーションのための地平線ポーズを持つ360$circ$画像からなる新しいベンチマークデータセットである360Locを紹介する。
360$circ$画像から低FoVクエリフレームを生成するための仮想カメラ手法を提案する。
一方向の視覚的ローカライゼーションは、対称性と繰り返し構造を持つ大規模シーンに挑戦する上で、より堅牢であることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:38:08 GMT)
Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games [24.0] 本稿では,ポントリャーギンモード型ニューラルオペレータが,パラメトリック状態制約のあるゲーム間での安全性能において,現在最先端のハイブリッドPINNモデルより優れていることを示す。
私たちの重要な貢献は、前方と後方のコストトロールアウトの相違について定義されたコストト損失の導入です。
状態制約違反を反映できるコストトダイナミクスにより,大きなリプシッツ定数を持つ微分可能な値の学習が効果的に可能であることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:53:47 GMT)
Transformers Learn Higher-Order Optimization Methods for In-Context Learning: A Study with Linear Models [23.9] In-context linear regression の高次最適化法を学習することを示す。
文脈内線形回帰では、トランスフォーマーはイテレーティブニュートン法と同様の収束率を共有する。
また、Transformerは、Gradient Descentが苦戦するがIterative Newtonが成功するような環境で、不調なデータを使ってコンテキストで学習できることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:37:54 GMT)
Towards Climate Variable Prediction with Conditioned Spatio-Temporal Normalizing Flows [23.9] 予測的不確実性推定と効率的な推論の正確な可能性のような、その望ましい性質により、手法が選択される。
発見は時間モデリングの分野の正規化に重要な洞察をもたらし、潜在的な応用は様々な科学分野にまたがる。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:58:08 GMT)
Heterophilous Distribution Propagation for Graph Neural Networks [23.9] グラフニューラルネットワークのための異種分布伝播(HDP)を提案する。
すべての近隣から情報を集約する代わりに、HDPは隣人をホモ親和性および不テロ親和性の部分に適応的に分離する。
我々は、異なるレベルのホモフィリーを持つ9つのベンチマークデータセットに対して広範な実験を行う。
論文参考訳(メタデータ) (Fri, 31 May 2024 06:40:56 GMT)
Augmentation-based Unsupervised Cross-Domain Functional MRI Adaptation for Major Depressive Disorder Identification [23.6] メジャー・うつ病(Major depressive disorder、MDD)は、一般的に人の気分、認知、行動、身体的健康に影響を及ぼす一般的な精神障害である。
本研究では,MDDの自動診断のための拡張型非教師付きクロスドメインfMRI適応フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:55:33 GMT)
Graph Convolutions Enrich the Self-Attention in Transformers! [23.5] 本稿では,グラフフィルタに基づく自己注意法(GFSA)を提案する。
GFSAはコンピュータビジョン,自然言語処理,グラフ回帰,音声認識,コード分類など,様々な分野におけるトランスフォーマーの性能向上を実証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:42:19 GMT)
The Earth is Flat because...: Investigating LLMs' Belief towards Misinformation via Persuasive Conversation [23.4] 大規模な言語モデル(LLM)は膨大な量の知識をカプセル化しているが、それでも外部の誤情報に弱いままである。
説得的対話におけるLLMの信念変化を追跡するためのテストフレームワークを開発する。
LLMの事実知識に対する正しい信念は、様々な説得的戦略によって容易に操作できることがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:13:33 GMT)
Locking Machine Learning Models into Hardware [23.3] ロック機構は、モデル表現の効率を目標にするか、ハードウェアの特定の特性にモデル操作を結びつけることで実現可能である。
ロックには無視可能な作業とレイテンシのオーバーヘッドが伴い、その結果、未許可のハードウェア上でのモデルのユーザビリティを著しく制限することを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:35:29 GMT)
FedSheafHN: Personalized Federated Learning on Graph-structured Data [22.8] 我々はFedSheafHNと呼ばれるモデルを提案し、各クライアントのローカルサブグラフをサーバ構築コラボレーショングラフに埋め込む。
我々のモデルは複雑なクライアント特性の統合と解釈を改善します。
また、高速なモデル収束と効果的な新しいクライアントの一般化も備えている。
論文参考訳(メタデータ) (Fri, 31 May 2024 11:44:39 GMT)
Waveform Design for Over-the-Air Computing [22.5] 我々は、時サンプリングエラーやシンボル間干渉(ISI)など、現在のデジタル通信トランシーバで遭遇する実用的課題について検討する。
我々は,時間サンプリング誤差とISIの下でのOTA伝送性能を向上させるために,新しいディープニューラルネットワーク(DNN)に基づく設計手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:52:58 GMT)
Enhancing Jailbreak Attack Against Large Language Models through Silent Tokens [21.9] 既存のジェイルブレイク攻撃では、人間の専門家か、複雑なアルゴリズムを使ってプロンプトを作らなければならない。
eosトークンのみを活用する単純な攻撃であるBOOSTを導入する。
LLMがジェイルブレイク攻撃に対して脆弱であることが判明し、強力な安全アライメントアプローチの開発が動機となった。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:41:03 GMT)
Rethinking the Starting Point: Collaborative Pre-Training for Federated Downstream Tasks [21.8] CoPreFLはモデルに依存しないメタラーニング(MAML)プロシージャで、異種および目に見えないFLシナリオを忠実に模倣するようにグローバルモデルを調整する。
当社のMAML手順では,パフォーマンスの分散をメタオブジェクト関数に組み込んで,クライアント間でパフォーマンスのバランスをとる。
我々は,任意の下流FLタスク間の平均精度と分散の両面で,CoPreFLが大幅に改善されることを実証した。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:16:17 GMT)
Enhancing Efficiency of Safe Reinforcement Learning via Sample Manipulation [21.8] サンプル操作による安全なRLの効率を向上させる新しいアプローチとして,効率的なポリシー最適化(ESPO)を提案する。
ESPOでは,報酬の最大化,コストの最小化,両者間のトレードオフのバランスという,3つのモードの最適化フレームワークを採用している。
ESPOは、報酬複雑性と制約満足度の観点から、既存の原始的ベースと原始的ベースラインを著しく上回る。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:44:05 GMT)
Latent Intrinsics Emerge from Training to Relight [21.8] 本稿では,データ駆動型リライト方式について述べる。
我々はアルベドを例を使わずに我々の潜伏した内生生物から回収できることを示し, 回収したアルベドはSOTA法と競合することを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:59:12 GMT)
SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation [21.7] 本研究では,データ・テキスト生成における合成一般化のための総合的・実践的な評価手法であるSPORを提案する。
2つの異なるデータセット上でSPORを実証し、LLMを含む既存の言語モデルを評価する。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:22:42 GMT)
Federated Graph Analytics with Differential Privacy [21.5] 我々は、差分プライバシー下での協調グラフ分析の新しい問題であるフェデレーショングラフ分析を定義する。
まず,フェデレートグラフ解析フレームワークFEATを提案する。
次に、提案した次数に基づく分割アルゴリズムFEAT+に基づく最適化フレームワークを導入し、真の局所部分グラフを活用することにより、全体の有用性を向上する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:09:43 GMT)
Generative AI Voting: Fair Collective Choice is Resilient to LLM Biases and Inconsistencies [21.4] 異なるLLMには、複雑な優先投票形式におけるバイアスと重大な矛盾があることが示される。
興味深いことに、平等な株式のような公正投票の集計手法は、より公平なAI表現を持つ人間に対するより公平な投票結果として、勝利を証明している。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:41:48 GMT)
Flexible inference in heterogeneous and attributed multilayer networks [21.3] 我々は任意の種類の情報を持つ多層ネットワークで推論を行う確率的生成モデルを開発した。
インド農村部における社会支援ネットワークにおける様々なパターンを明らかにする能力を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:21:59 GMT)
Climate Variable Downscaling with Conditional Normalizing Flows [21.3] 気候変動ダウンスケーリングの課題に条件付き正規化フローを適用した。
本手法により, 標準偏差による予測不確かさを, 条件分布平均から推定できることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:20:33 GMT)
Multi-Agent Reinforcement Learning for Offloading Cellular Communications with Cooperating UAVs [21.2] 無人航空機は、地上のBSからデータトラフィックをオフロードする代替手段を提供する。
本稿では,地上BSからデータオフロードを行うために,複数のUAVを効率的に利用するための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:10:28 GMT)
FinGen: A Dataset for Argument Generation in Finance [21.1] 我々は、この方向の探索はまだNLP研究の初期段階にあると論じる。
実験結果から,これらの課題はまだ代表モデルにとって大きな課題であることがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:00:43 GMT)
Vision-Language Meets the Skeleton: Progressively Distillation with Cross-Modal Knowledge for 3D Action Representation Learning [20.3] クロスモーダル・コントラッシブ・ラーニングに基づく新しいスケルトンベースのトレーニング・フレームワークを提案する。
我々は、視覚言語知識プロンプトを通じて、視覚言語行動概念空間を確立する。
そこで本研究では,モーダル内自己相似性とモーダル間相互整合性を軟化するターゲットを,モーダル間コントラストプロセスにおいて提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:40:15 GMT)
Improving Reward Models with Synthetic Critiques [20.2] リワードモデル(RM)は、人間のフィードバックからの強化学習を通じて言語モデルを整合させる上で重要な役割を担っている。
本稿では,大規模言語モデルが生成する合成自然言語批判を用いて,新たなフィードバックを提供する手法を提案する。
本研究では,異なる事前学習モデルによるRMの性能とデータ効率の向上を実証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:33:07 GMT)
CoMoFusion: Fast and High-quality Fusion of Infrared and Visible Image with Consistency Model [20.0] 現在の生成モデルに基づく融合法は、しばしば不安定なトレーニングと遅い推論速度に悩まされる。
CoMoFusionは高品質な画像を生成し、高速な画像推論速度を実現する。
また、融合した画像のテクスチャや鮮やかな情報を高めるために、画素値選択に基づく新規な損失も設計する。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:35:06 GMT)
Explaining Predictions by Characteristic Rules [20.0] 差別的ルールよりも解釈可能性を改善する能力について、特徴的なルールが提唱されている。
複数の説明を集約するために関連ルールマイニングを利用するCEGAと呼ばれる新しい説明手法が提案されている。
その結果, 特徴的説明規則は, 標準識別方式の規則と相反することが明らかとなった。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:44:40 GMT)
clembench-2024: A Challenging, Dynamic, Complementary, Multilingual Benchmark and Underlying Flexible Framework for LLMs as Multi-Action Agents [20.0] 大きな言語モデルは、特定の能力を探索する会話ゲームに"セルフプレイ"するよう促すことができる。
本稿では,このようなゲームプレイ環境を構築するためのフレームワークの1つを取り上げ,その有効性を評価機器として検証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:43:31 GMT)
How In-Context Learning Emerges from Training on Unstructured Data: On the Role of Co-Occurrence, Positional Information, and Noise Structures [19.8] トランスフォーマーのような大きな言語モデル(LLM)は、インコンテキスト学習(ICL)機能を備えている。
構造化されていないデータに対する教師なしトレーニングからICLがどのように現れるかを検討する。
我々は、ICLを未知のデータに一般化するための位置情報とノイズ構造の必要性を確立する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:46:06 GMT)
Robust Planning with LLM-Modulo Framework: Case Study in Travel Planning [19.8] 本稿では,大規模言語モデルの多種多様な計画・推論活動への統合を促進する枠組みを提案する。
我々は,OSU NLPグループによる旅行計画ベンチマークを用いて,有効な旅程作成におけるLLMの性能評価を行う。
LLM-Modulo framework for TravelPlanning Domainの運用により、GPT4-Turboの4.6倍、GPT3.5-Turboのような古いモデルでは0%から5%のベースライン性能が向上した。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:23:35 GMT)
Disrupting Diffusion: Token-Level Attention Erasure Attack against Diffusion-based Customization [19.6] 悪意のあるユーザは、DreamBoothのような拡散ベースのカスタマイズメソッドを誤用して、偽画像を作った。
本稿では,拡散モデル出力を阻害する新しい逆攻撃法であるDisDiffを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:45:31 GMT)
Active Inference and Reinforcement Learning: A unified inference on continuous state and action spaces under partial observability [19.6] 多くの実世界の問題は、部分的に観測可能な決定過程(POMDP)として定式化された部分的な観察を含む。
これまでの研究では、過去の行動や観察の記憶を取り入れたり、環境の本当の状態を推測することで、PMDPのRLに取り組みました。
アクティブ推論(AIF)と強化学習(RL)の理論的関係を確立する統一原理を提案する。
実験により,連続的な空間を部分的に観測可能なタスクを解く上で,本手法の優れた学習能力を実証した。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:40:03 GMT)
Information limits and Thouless-Anderson-Palmer equations for spiked matrix models with structured noise [19.5] 定型スパイクモデルに対するベイズ推定の問題を考える: 低ランク信号は付加雑音によって劣化する。
本稿では,一般的なトレースアンサンブルから引き出された原型雑音行列に対する情報理論の限界を初めて特徴づける。
これらの極限は、適応的Thouless-Anderson-Palmer(TAP)方程式の理論にインスパイアされた効率的なアルゴリズムによって達成される。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:38:35 GMT)
Identifying while Learning for Document Event Causality Identification [19.4] 事象因果同定(ECI)は、文書に2つの事象の間に因果関係が存在するかどうかを検出することを目的としている。
既存の研究では、学習パラダイムの後、イベントの表現が最初に学習され、その識別に使用される、ある種の識別が採用されている。
我々は、因果方向のケアを行い、ECIタスクの学習モードにおいて、新たな識別法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:48:00 GMT)
Spoken Question Answering and Speech Continuation Using Spectrogram-Powered LLM [19.4] 本稿では,事前学習された大規模言語モデル(LLM)を適応させて,音声質問応答(QA)と音声継続を行う新しいアプローチであるSpectronを提案する。
我々のアプローチの鍵は、音声認識、テキスト継続、音声合成を共同で監督する訓練目標である。
提案手法は話者保存とセマンティック・コヒーレンスにおいて既存の言語モデルを上回る。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:29:27 GMT)
HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios [19.2] 本稿では,強化学習エージェントとReeds-Shepp曲線を統合したHybrid POlicy Path PlannEr(HOPE)を提案する。
ネットワーク構造としてトランスフォーマーを用いて、環境情報を融合し、計画された経路を生成する。
実験の結果,本手法は一般的なルールベースアルゴリズムや従来の強化学習法よりも優れていた。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:17:51 GMT)
A Sim2Real Approach for Identifying Task-Relevant Properties in Interpretable Machine Learning [19.0] 本稿では,シリコのタスク関連説明特性を一般化し,コスト効率を向上する手法を提案する。
提案手法は,3つの実例に対して関連するプロキシを同定し,実ユーザによるシミュレーションの有効性を検証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:08:35 GMT)
Revisiting Mutual Information Maximization for Generalized Category Discovery [18.7] 本稿では,情報カテゴリのレンズ(InfoMax)による一般カテゴリー発見の課題を再考する。
我々は、新しいInfoMaxベースの正規化パラメトリックInfoMax(RPIM)を提案する。
RPIMは未知のクラスに関するパフォーマンスを大幅に改善し、最先端の手法を平均マージン3.5%上回った。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:07:15 GMT)
Reward Machines for Deep RL in Noisy and Uncertain Environments [18.4] Reward Machinesは、命令、安全性の制約、その他の時間的に拡張された報酬に値する振る舞いを指定するための、オートマチックにインスパイアされた構造を提供する。
本稿では,雑音および不確実な環境における深部RLに対するReward Machinesの利用について検討する。
ドメイン固有語彙の不確定な解釈の下でタスク構造を利用するRLアルゴリズムの組を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:22:09 GMT)
Memory Consolidation Enables Long-Context Video Understanding [18.4] メモリ統合型視覚変換器(MC-ViT)は、そのコンテキストを過去まで拡張する。
MC-ViTは、Ego、Perception Test、Diving48の長文ビデオ理解の最先端を新たに設定する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:22:58 GMT)
Experimental Design for Active Transductive Inference in Large Language Models [18.3] 適応的なプロンプト設計にアクティブラーニングを使用し、それをアクティブ・インコンテクスト・プロンプト・デザイン(AIPD)と呼ぶ。
テストセットの性能を最適化するために、トレーニングセットから少数ショット例を適応的に選択し、LCMプロンプトを設計する。
GOとSALの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:37:10 GMT)
Decentralized Sporadic Federated Learning: A Unified Algorithmic Framework with Convergence Guarantees [18.2] 分散分散学習(DFL)は、(i)モデル更新と(ii)モデルアグリゲーションの両方をクライアントが中央サーバなしで実行するFL設定をキャプチャする。
DSpodFLは、さまざまなシステム設定下でのベースラインと比較して、一貫して速度を達成している。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:36:30 GMT)
Not Just Novelty: A Longitudinal Study on Utility and Customization of an AI Workflow [18.2] ジェネレーティブAIは、日々のタスクで人々を助ける、斬新で印象的な能力を提供します。
新規性が低下した後、生成AIがどれほど有用かは定かではない。
我々は,科学コミュニケーションのための生成AIツールの慣れ親しみとカスタマイズを理解するために,12人のユーザを対象に3週間の縦断的研究を行った。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:00:05 GMT)
Scale-Invariant Feature Disentanglement via Adversarial Learning for UAV-based Object Detection [18.1] 本稿では,スケール不変の特徴を学習することで,単段階推論の精度を向上させることを提案する。
3つのベンチマークデータセット上で、最先端の3つの軽量検出フレームワークに適用する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:08:23 GMT)
LLM-RankFusion: Mitigating Intrinsic Inconsistency in LLM-based Ranking [18.0] 大規模言語モデル(LLM)によるランク付けは、現代の情報検索(IR)システムにおいて有望な性能を達成することができる。
ソートに基づく手法では、パスを正しくソートするには一貫した比較が必要であり、LCMがしばしば違反することを示す。
LLMベースのランキングフレームワークであるLLM-RankFusionを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:29:42 GMT)
Action-OOD: An End-to-End Skeleton-Based Model for Robust Out-of-Distribution Human Action Detection [17.9] Action-OODは、アクション検出のための新しいエンドツーエンドスケルトンベースのモデルである。
注意に基づく特徴融合ブロックを導入し、未知のクラスを認識するモデルの能力を高める。
提案手法の最先端手法と比較して,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:49:37 GMT)
Iterative Feature Boosting for Explainable Speech Emotion Recognition [17.6] 本稿では,効率的な特徴工学手法に基づく新しい教師付きSER手法を提案する。
特徴の関連性を評価し,特徴セットを洗練させるために,結果の説明可能性に特に注意を払っている。
提案手法は,TESSデータセット上での感情認識において,ヒトレベルのパフォーマンス(HLP)および最先端の機械学習手法より優れる。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:59:20 GMT)
Optimal Design for Human Feedback [17.5] 学習嗜好モデルにおけるデータ収集の問題について検討する。
提案するアイデアの一般性を示すため,リストの絶対的フィードバックと相対的フィードバックの両方について検討する。
設定と解析の両方に効率的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:04:44 GMT)
Non-Federated Multi-Task Split Learning for Heterogeneous Sources [17.5] 異種データソースのマルチタスク学習を効率的に行うための新しいアーキテクチャと方法論を提案する。
MTSLは,サーバとクライアントの学習率を調整することで,高速収束を実現することができることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:27:03 GMT)
Graph Machine Learning based Doubly Robust Estimator for Network Causal Effects [17.4] 本稿では,グラフ機械学習アプローチとダブル機械学習フレームワークを組み合わせた新しい手法を提案する。
提案手法は,広範囲なシミュレーション研究を通じて,正確で堅牢でスケーラブルであることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:38:53 GMT)
ParSEL: Parameterized Shape Editing with Language [17.3] ParSELは、自然言語から高品質な3Dアセットを制御可能な編集を可能にするシステムである。
プログラムパラメータを調整することで、ユーザーは編集の規模を正確に制御して形状のバリエーションを探索できる。
論文参考訳(メタデータ) (Fri, 31 May 2024 04:09:41 GMT)
Multivariate Probabilistic Time Series Forecasting with Correlated Errors [17.2] 本稿では,ガウス分布誤差を持つ自己回帰モデルに対して,複数ステップにわたる誤差の共分散構造を学習するプラグイン・アンド・プレイ手法を提案する。
学習された共分散行列は、観測された残差に基づいて予測を校正するのに使うことができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:49:11 GMT)
The Road to Trust: Building Enclaves within Confidential VMs [17.1] NestedSGXは仮想マシン特権レベル(VMPL)を活用するフレームワークである。
それは、悪質なコードのロードを信頼していないゲストOSだと考えている。
これは、エンクレーブ内で実行される信頼され測定されたコードだけがリモートで検証可能であることを保証します。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:33:05 GMT)
S4Fusion: Saliency-aware Selective State Space Model for Infrared Visible Image Fusion [17.0] 画像融合のためのS4Fusion(Saliency-aware Selective State Space Fusion Model)を提案する。
S4Fusionは、両方のモダリティからのグローバルな空間情報に焦点を合わせながら、それらの相互作用を促進する。
両方の画像から適切なターゲットを適応的に強調する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:55:31 GMT)
TrojanRAG: Retrieval-Augmented Generation Can Be Backdoor Driver in Large Language Models [16.7] 大規模言語モデル(LLM)は、自然言語処理(NLP)において顕著なパフォーマンスにもかかわらず、潜在的なセキュリティ脅威に対する懸念を提起している。
バックドア攻撃は当初、LLMがあらゆる段階で重大な損害を受けていることを証明したが、コストとロバスト性は批判されている。
本稿では,Retrieval-Augmented Generationにおいて,共同でバックドア攻撃を行うTrojanRAGを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:59:17 GMT)
An Accelerated Gradient Method for Convex Smooth Simple Bilevel Optimization [16.7] 下層問題の解集合を局所的に近似する新しい双レベル最適化法を提案する。
我々は,提案手法の性能を,最適度と不実現可能性の誤差の観点から測定する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:20:29 GMT)
Hard Cases Detection in Motion Prediction by Vision-Language Foundation Models [16.5] 本研究は、自動運転におけるハードケースの検出におけるビジョン・ランゲージ・ファンデーション・モデル(VLM)の可能性を探るものである。
設計したプロンプトで逐次画像フレームを供給し,課題のあるエージェントやシナリオを効果的に識別する,実現可能なパイプラインを提案する。
NuScenesデータセット上で、パイプラインを最先端の手法に組み込むことの有効性と可能性を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:35:41 GMT)
MegActor: Harness the Power of Raw Video for Vivid Portrait Animation [16.0] MegActorは生のビデオの力を利用して、鮮やかな肖像画のアニメーションを作る。
本稿では,一貫した動きと表情を持つビデオを生成するための合成データ生成フレームワークを提案する。
さらに,運転映像への参照画像の外観の移動を図り,運転映像における顔の詳細の影響を排除した。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:33:13 GMT)
Simulation of open quantum systems on universal quantum computers [15.9] 量子コンピュータを用いてオープンな量子システムをシミュレートする,革新的でスケーラブルな手法を提案する。
共役密度行列を真の密度行列と定義し、混合ユニタリ量子チャネルに還元する。
正確な長時間シミュレーションも随伴密度行列として達成でき、真の散逸した行列は同じ状態に収束する。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:07:27 GMT)
Improving Generalization and Convergence by Enhancing Implicit Regularization [15.8] Inlicit Regularization Enhancement (IRE)フレームワークは、ディープラーニングにおけるフラットソリューションの発見を加速する。
IREは、平坦な方向と鋭い方向のダイナミクスを分離し、平坦な方向に沿って鋭さを減少させる。
計算オーバーロードを伴わずに,IREをエムジェネリックベースに事実上組み込むことができることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:32:34 GMT)
LInK: Learning Joint Representations of Design and Performance Spaces through Contrastive Learning for Mechanism Synthesis [15.8] 本稿では,性能と設計空間のコントラスト学習と最適化手法を統合する新しいフレームワークであるLInKを紹介する。
マルチモーダルおよび変換不変のコントラスト学習フレームワークを活用することで、LInKは複雑な物理学と設計表現をキャプチャする共同表現を学ぶ。
以上の結果から,LInKは機構設計の分野を進展させるだけでなく,他の工学分野へのコントラスト学習や最適化の適用性も拡大することが示された。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:04:57 GMT)
Compact Optimality Verification for Optimization Proxies [15.8] 近年、パラメトリック最適化問題の入出力マッピングを近似する機械学習モデルへの関心が高まっている。
本論文は,計算効率の優れた最適性検証のためのコンパクトな定式化を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:11:39 GMT)
II-MMR: Identifying and Improving Multi-modal Multi-hop Reasoning in Visual Question Answering [15.7] VQA(Visual Question Answering)におけるマルチモーダルマルチホップ推論の同定と改善のための新しいアイデアであるII-MMRを提案する。
II-MMRは、画像でVQA質問を受け取り、2つの新しい言語プロンプトを使用して答えに到達するための推論経路を見つける。
II-MMRは、ゼロショット設定と微調整設定の両方において、すべての推論ケースで有効性を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:30:13 GMT)
Towards a General GNN Framework for Combinatorial Optimization [14.3] 本稿では,グラフ上のCO問題の解法として,複雑なフィルタバンクと局所的注意機構を活用する新しいGNNアーキテクチャを提案する。
提案手法が従来のGNNベースのCOソルバとどのように差別化され,最大傾き,最小支配セット,最大カット問題に効果的に適用可能であるかを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:02:07 GMT)
Attention-aware Semantic Communications for Collaborative Inference [14.1] 本稿では,エッジ推論分野におけるコミュニケーション効率のよい協調推論フレームワークを提案する。
我々のフレームワークはエッジデバイス上で軽量なViTモデルを使用し、サーバは複雑なViTモデルをデプロイする。
提案した協調推論フレームワークは,ImageNetデータセットのサーバモデルと比較して,最小限の精度で通信オーバーヘッドを68%削減できることを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:23:09 GMT)
ADESSE: Advice Explanations in Complex Repeated Decision-Making Environments [14.1] この研究は、インテリジェントなエージェントが人間の意思決定者にアドバイスを提供するような問題設定について考察する。
我々は,人的信頼と意思決定を改善するためのアドバイザーエージェントの説明を生成するために,ADESSEというアプローチを開発した。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:59:20 GMT)
ImplicitTerrain: a Continuous Surface Model for Terrain Data Analysis [14.0] ImplicitTerrainは、高解像度の地形を連続的に微分的にモデル化するための暗黙の神経表現(INR)アプローチである。
本実験では, 表面適合精度, 有効トポロジカル特徴抽出, 各種トポロジカル特徴抽出について検討した。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:05:34 GMT)
EPIDetect: Video-based convulsive seizure detection in chronic epilepsy mouse model for anti-epilepsy drug screening [14.0] 抗てんかん効果が顕著な薬剤候補は、慢性てんかんモデルマウスにおける自然再発性けいれん(SRS)の長期抑制を示す。
慢性てんかんマウスにおけるCSの自動検出のためのカメラベースのシステムは、抗てんかん薬をスクリーニングするために最初に確立された。
論文参考訳(メタデータ) (Fri, 31 May 2024 04:06:11 GMT)
SecureBoost+ : A High Performance Gradient Boosting Tree Framework for Large Scale Vertical Federated Learning [14.0] グラディエントブースティング決定木(GBDT)は、業界で広く使われているアンサンブルアルゴリズムである。
SecureBoostは、クロスサイロのプライバシ保存モデリングで使用される最も一般的なアルゴリズムの1つである。
SecureBoost+は、いくつかの暗号文計算最適化とエンジニアリング最適化を統合している。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:39:50 GMT)
Universal evaluation and design of imaging systems using information estimation [13.9] 物理的制約を考慮に入れる上での課題に対処する枠組みを導入する。
本研究では,雑音測定のデータセットのみを用いて,情報を推定する手法を開発した。
また、最大情報キャプチャのための画像ハードウェア設計を最適化する手法である、情報駆動分析学習についても紹介する。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:57:58 GMT)
Stochastic Optimal Control for Diffusion Bridges in Function Spaces [13.5] 無限次元空間に合わせた最適制御の理論を提案する。
我々は、Doob の $h$-transform が SOC の観点から導出され、無限次元に拡張されることを示す。
2つの無限次元分布間のブリッジの学習と、無限次元分布からの標本化のための生成モデルを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:42:47 GMT)
Performative Reinforcement Learning in Gradually Shifting Environments [13.5] 強化学習(RL)エージェントが実際にデプロイされると、環境に影響を与え、そのダイナミクスを変える可能性がある。
本稿では,この現象をモデル化するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:59:44 GMT)
Recurrent neural networks: vanishing and exploding gradients are not the end of the story [13.4] リカレントニューラルネットワーク(RNN)は長期記憶の学習に苦慮している。
状態空間モデル(SSM)の最近の成功は、我々の理論的理解を困難にしている。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:53:00 GMT)
Decision Mamba: Reinforcement Learning via Hybrid Selective Sequence Modeling [13.3] テキスト内強化学習のための決定マンバ・ヒブリッド(DM-H)を提案する。
DM-Hは、マンバモデルを介して長期記憶から高価値のサブゴールを生成する。
長期タスクにおけるDM-Hのオンラインテストは、トランスフォーマーベースのベースラインよりも28$times$speedである。
論文参考訳(メタデータ) (Fri, 31 May 2024 10:41:03 GMT)
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning [13.2] オフライン強化学習(RL)では、価値関数の過大評価を防ぐために、配布外動作を管理する必要がある。
拡散雑音回帰問題としてクルバック・リブラー (KL) 制約ポリシーの繰り返しを定式化する拡散アクタ・クリティカル (DAC) を提案する。
提案手法はD4RLベンチマークで評価され,ほぼすべての環境において最先端の手法よりも優れている。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:41:04 GMT)
Learning on Large Graphs using Intersecting Communities [13.1] MPNNは、各ノードの隣人からのメッセージを集約することで、入力グラフ内の各ノードの表現を反復的に更新する。
MPNNは、あまりスパースではないため、すぐに大きなグラフの禁止になるかもしれない。
本稿では,入力グラフを交差するコミュニティグラフ (ICG) として近似することを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:26:26 GMT)
EvoluNet: Advancing Dynamic Non-IID Transfer Learning on Graphs [13.0] グラフ上の動的非IID移動学習のための一般化を提案する。
理論的結果に触発されて,EvoluNetという新しい汎用フレームワークを導入する。
EvoluNetは最先端のモデルを最大12.1%上回っている。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:58:20 GMT)
Dynamic Conditional Optimal Transport through Simulation-Free Flows [13.0] 我々は条件最適輸送(COT)の幾何学を研究し、ベナモ・ブレニエ定理を一般化する動的定式化を証明した。
条件付き生成モデルのためのシミュレーション不要なフローベース手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:43:54 GMT)
A Perspective Study on Chinese Social Media regarding LLM for Education and Beyond [12.9] この研究は、現在最も強力で人気のあるAIツールであるChatGPTを用いて、中国国民が教育と一般的な目的のために大規模言語モデル(LLM)の可能性をどのように認識するかを分析する代表的な例である。
この研究は、AI技術がより高度でインテリジェントになるにつれて、世論の変化を調査する最初の試みでもある。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:25:30 GMT)
Perimeter Control with Heterogeneous Metering Rates for Cordon Signals: A Physics-Regularized Multi-Agent Reinforcement Learning Approach [12.9] 過飽和環境下での都市道路網の制御に対処するための周辺制御(PC)戦略が提案されている。
本稿では,MARL(Multi-Agent Reinforcement Learning)に基づく交通信号制御フレームワークを活用し,PC問題を分解する。
MARLフレームワークの物理正則化手法は,分散コードン信号制御装置がグローバルネットワークの状態を認識していることを確実にするために提案される。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:44:52 GMT)
Visual Attention Analysis in Online Learning [12.8] オンライン授業中に収集した眼球運動データを可視化・解析するツールを開発した。
このツールはVAAD(Visual Attention Analysis Dashboardの頭字語)と名付けられた。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:35:36 GMT)
Coherence in resonance fluorescence [12.8] 2レベルエミッタの共鳴蛍光(RF)は、励起強度に関係なく持続的に反膨らみを示す。
最近の理論では、レーザーのようなスペクトルが不整合に散乱した光と干渉するのに対して、アンチバンチングが原因である。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:23:00 GMT)
Advancing Financial Risk Prediction Through Optimized LSTM Model Performance and Comparative Analysis [12.6] 本稿では、金融リスク予測におけるLSTMモデルの適用と最適化に焦点を当てる。
最適化LSTMモデルは、ランダムフォレスト、BPニューラルネットワーク、XGBoostと比較して、AUC指数において大きな利点を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:31:17 GMT)
Gameplay Filters: Safe Robot Walking through Adversarial Imagination [12.5] 脚のあるロボットの移動のための既存のソリューションはまだ単純化されたダイナミクスに依存しており、ロボットが予め定義された安定した歩行から離れていれば失敗する可能性がある。
本稿では,オフラインゲーム理論の強化学習を活用し,高次非線形力学のための高堅牢な安全フィルタを合成する一般手法を提案する。
ゲームプレイ安全フィルタは、手動チューニングや計算設計なしで、sim-to-realギャップに固有の堅牢性を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:26:47 GMT)
HD Maps are Lane Detection Generalizers: A Novel Generative Framework for Single-Source Domain Generalization [12.5] 単一ソース領域一般化のためのHDマップを用いた新しい生成フレームワークを提案する。
我々のフレームワークは、+3.01%pの精度で、ドメイン適応モデルMLDAよりも優れていることを検証します。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:26:39 GMT)
Fuzzychain: An Equitable Consensus Mechanism for Blockchain Networks [12.4] Fuzzychainは、PoS(Proof of Stake)の欠点に対する解決策として提案されている。
ファイトセマンティクスを定義するためにファジィセットを導入し、分散化された分散処理制御を促進する。
以上の結果から,Fuzzychainは機能的にPoSに適合するだけでなく,バリデータ間の利害関係の公平な分布も確保できることがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:07:14 GMT)
Can Machine Learning Assist in Diagnosis of Primary Immune Thrombocytopenia? A feasibility study [12.4] 原発性免疫性血小板減少症(ITP)は末梢血血小板の免疫学的破壊を特徴とする稀な自己免疫疾患である。
疾患を確認するための確立された検査はなく、治療と結果に対する反応を予測できるバイオマーカーも存在しない。
日常的な血液検査と人口統計データを用いて, 機械学習をIPPの診断に効果的に適用できるかどうかを, 非急性外来で検討する。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:04:46 GMT)
Selective Knowledge Sharing for Personalized Federated Learning Under Capacity Heterogeneity [12.3] Pa3dFLは、容量不均一なモデル間で知識を分離し、選択的に共有することで、局所モデルの性能を向上させるために設計された新しいフレームワークである。
本研究では,Pa3dFLの有効性を評価するために,3つのデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:59:25 GMT)
TRAM: Benchmarking Temporal Reasoning for Large Language Models [12.1] 10個のデータセットからなる時間的推論ベンチマークであるTRAMを紹介する。
GPT-4やLlama2のような一般的な言語モデルをゼロショットや少数ショットのシナリオで評価する。
以上の結果から,最も優れたモデルラグは人的パフォーマンスに大きく遅れていることが示唆された。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:36:09 GMT)
Passage-specific Prompt Tuning for Passage Reranking in Question Answering with Large Language Models [12.1] オープンドメイン質問応答(PSPT)における再ランク付けのためのパス固有プロンプトチューニングを提案する。
PSPTは、学習可能なパス固有のソフトプロンプトを微調整するパラメータ効率の手法である。
我々は,Llama-2-chat-7Bモデルを用いた3つの公開領域質問応答データセットの広範な実験を行った。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:43:42 GMT)
InsightSee: Advancing Multi-agent Vision-Language Models for Enhanced Visual Understanding [12.1] 本稿では,複雑な視覚理解シナリオを扱う上で,視覚言語モデルの能力を高めるためのマルチエージェントフレームワークであるInsightSeeを提案する。
このフレームワークは、視覚情報解釈のプロセスを洗練するために統合される記述エージェントと、2つの推論エージェントと決定エージェントとを含む。
このフレームワークは、9つのベンチマークテストのうち6つで最先端のアルゴリズムよりも優れており、マルチモーダル理解が大幅に進歩している。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:56:55 GMT)
Benchmarking and Improving Detail Image Caption [12.1] 視覚言語モデル (LVLM) は視覚理解の基本的な課題とされてきた。
本稿では,人間専門家が注釈付けした高品質な評価データセットをキュレートすることで,詳細な画像キャプションタスクのベンチマークを行う。
また、CAPTUREと呼ばれるより信頼性の高いキャプション評価指標も設計する。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:56:37 GMT)
UniBias: Unveiling and Mitigating LLM Bias through Internal Attention and FFN Manipulation [12.0] フィードフォワードニューラルネットワーク(FFN)とアテンションヘッドが大規模言語モデル(LLM)のバイアスをもたらすかを検討する。
これらのバイアスを軽減するために,推定のみの手法であるUniBiasを導入し,バイアス付きFFNベクトルとアテンションヘッドを効果的に識別・除去する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:59:15 GMT)
Correlation-aware Coarse-to-fine MLPs for Deformable Medical Image Registration [12.0] 変形可能な医用画像登録のための相関対応登録ネットワーク(CorrMLP)を提案する。
当社のCorrMLPでは,新しい粗大な登録アーキテクチャにおいて,相関性を考慮したマルチウィンドウブロックを導入している。
7つの公開医療データセットによる実験により、私たちのCorrMLPは最先端の変形可能な登録方法よりも優れています。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:25:23 GMT)
LCQ: Low-Rank Codebook based Quantization for Large Language Models [12.0] 大規模言語モデルに対する低ランクコードブックに基づく量子化を提案する。
実験の結果,LCQ はストレージコストが比較的高い既存手法よりも精度がよいことがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:21:05 GMT)
DORY: Deliberative Prompt Recovery for LLM [12.0] Deliberative PrOmpt Recovery (DORY)は、不確実性を利用してプロンプトを正確に回収する新しいアプローチである。
DORYは出力からのドラフトを再構築し、ヒントでそれらを精製し、不確実性に基づいてノイズを除去する。
評価の結果,DORYは既存のベースラインを上回る性能を示し,約10.82%の性能向上を実現している。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:51:16 GMT)
Learning to Stabilize Unknown LTI Systems on a Single Trajectory under Stochastic Noise [11.7] 本研究では,未知雑音の線形時間不変系(LTI)を単一軌道上で安定化させる学習の課題について検討する。
安定な部分空間からLTIシステムの不安定な部分空間を分離する新しいアルゴリズムを開発した。
状態ノルムが2O(k log n)$に達する前に系が安定化されることを証明し、k$は不安定部分空間の次元である。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:38:51 GMT)
Application based Evaluation of an Efficient Spike-Encoder, "Spiketrum" [11.6] スパイクベースのエンコーダは、情報をスパイクまたはパルスのシーケンスとして表現し、ニューロン間で伝達される。
Spiketrumエンコーダはスパイクトレインまたはコードセットを使用して入力データを効率よく圧縮する。
この論文は、Spketrumハードウェアとそのソフトウェアの両方を、最先端で生物学的に証明可能なエンコーダに対して広範囲にベンチマークしている。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:23:09 GMT)
Data Cleaning and Machine Learning: A Systematic Literature Review [11.6] 我々は,2016年から2022年の間に公刊された論文を包括的に体系的な文献レビューを行う。
我々は機械学習(ML)におけるさまざまな種類のデータクリーニング活動を特定する。
我々のレビューでは、さらなる拡張が可能な多くの有望なデータクリーニング技術に注目している。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:39:49 GMT)
A Tale of Tails: Model Collapse as a Change of Scaling Laws [11.6] 私たちは、合成データがトレーニングコーパスに導入される必然的な体制において、スケーリング法はどのように変化するのか?
スケーリング法則のレンズによるモデル崩壊の理論的枠組みを開発する。
我々は、広範囲の崩壊現象を発見し、スケーリングの損失を分析し、世代ごとにスケールをシフトさせ、スキルの「アンラーニング」を行い、人間と合成データを混在させながらグルーキングを行う。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:27:52 GMT)
Knowledge Enhanced Multi-intent Transformer Network for Recommendation [11.5] 我々は,KGTN(Knowledge Enhanced Multi-intent Transformer Network for Recommendation)という新しいアプローチを提案する。
Graph Transformerを使用したGlobal Intentsは、ユーザ-item-relation-entityインタラクションからグラフトランスフォーマーへのグローバルシグナルを取り入れることで、学習可能なユーザ意図の取得に重点を置いている。
インテント下での知識コントラストの認知は、正確で堅牢な表現を学ぶことに集中している。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:07:37 GMT)
Reward-based Input Construction for Cross-document Relation Extraction [11.5] クロスドキュメント関係抽出(RE)は自然言語処理の基本的な課題である。
本稿では,Reward-based Input Construction (REIC)を提案する。
REICはリレーショナルエビデンスに基づいて文を抽出し、REモジュールが効率的に関係を推測することを可能にする。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:30:34 GMT)
Dynamic Multi-Objective Lion Swarm Optimization with Multi-strategy Fusion: An application in 6R robot trajectory [11.4] 本研究では,MF-DMOLSO(MF-DMOLSO)を用いた動的多目的ライオン群最適化手法を提案する。
評価の結果,MF-DMOLSOは既存のアルゴリズムより優れており,比較アルゴリズムの90%を超える精度が得られた。
MF-DMOLSOは走行時間と最大加速をそれぞれ8.3sと0.3pi rad/s2に最適化し、設定カバレッジ率は70.97%に達した。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:05:47 GMT)
Open Ko-LLM Leaderboard: Evaluating Large Language Models in Korean with Ko-H5 Benchmark [11.4] 本稿では,韓国の大規模言語モデル(LLM)を評価する上で重要なツールとして,Open Ko-LLM LeaderboardとKo-H5ベンチマークを紹介する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:05:45 GMT)
Unveiling the Lexical Sensitivity of LLMs: Combinatorial Optimization for Prompt Enhancement [11.4] 大規模言語モデル(LLM)は,タスク命令の語彙変化に対して過敏であることを示す。
プロンプト語彙強調(COPLE)のためのブラックボックス組合せ最適化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:53:59 GMT)
Query Provenance Analysis for Robust and Efficient Query-based Black-box Attack Defense [11.3] 我々は、より堅牢で効率的なステートフルディフェンスモデル(SDM)のための新しいアプローチ、QPA(Query Provenance Analysis)を提案する。
QPAは、クエリ間の履歴関係をシーケンスの特徴としてカプセル化し、良性クエリシーケンスと逆性クエリシーケンスの基本的な違いをキャプチャする。
我々は,6つのクエリベースのブラックボックスアタックアルゴリズムを用いて,広く使用されている4つのデータセットに対して,2つのベースラインであるBlackLightとPIHAと比較した。
論文参考訳(メタデータ) (Fri, 31 May 2024 06:56:54 GMT)
Robustifying Safety-Aligned Large Language Models through Clean Data Curation [11.3] 大きな言語モデル(LLM)は、有害なコンテンツを含むデータセットでトレーニングされた場合、脆弱性がある。
本稿では,両シナリオにおける敵対的影響に対処するためのデータキュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:09:51 GMT)
Visions of a Discipline: Analyzing Introductory AI Courses on YouTube [11.2] われわれはYouTubeで最も視聴された20のAIコースを分析した。
導入型AIコースは、AIの倫理的または社会的課題に有意義に関わっていない。
我々は、よりバランスのとれた視点を示すために、AIの倫理的課題を強調しておくことを推奨する。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:48:42 GMT)
Online Learning with Bounded Recall [11.0] 本研究では,繰り返しゲーム研究に人気がある「バウンド・リコール」環境において,オンライン学習の完全情報化の課題について検討する。
オンライン学習アルゴリズム $mathcalA$ が$M$-$textitbounded-recall$ であるとき、$t$ の出力が$M$以前の報酬の関数として記述できる。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:55:56 GMT)
SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation [11.0] 我々はSparseDriveという新しいエンドツーエンドの自動運転パラダイムを提案する。
SparseDriveは対称なスパース認識モジュールとパラレルモーションプランナーで構成されている。
動作予測と計画について,これら2つの課題の相似性を概観し,運動プランナの並列設計に繋がる。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:40:55 GMT)
Generation of subnatural-linewidth orbital angular momentum entangled biphotons using a single driving laser in hot atoms [11.0] 軌道角運動量(OAM)の絡み合った光子対は、物質の光と量子状態の相互作用において重要な役割を果たす。
我々は, 単一駆動ビームを85ドルRb原子蒸気セルに使用することにより, 狭い帯域幅でOAM絡み合った光子対を生成する方法を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:46:55 GMT)
SLIM: a Scalable Light-weight Root Cause Analysis for Imbalanced Data in Microservice [11.0] 既存のフォールトローカライゼーションの最先端手法では、変更サービスにおける不均衡なフォールト分類を考慮することは稀である。
本稿では,高不均衡なデータを扱うために決定ルールセットを利用する新しい手法を提案する。
我々のアルゴリズムは、変更サービスの不均衡な障害シナリオに適応し、理解し、検証し易い障害原因を解釈できる。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:32:31 GMT)
Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles [11.0] ポリシースペース対応 Oracleはゼロサムゲームのための効果的な強化学習フレームワークである。
我々はモデル融合を用いてBRの近似を改善するためのポリシーを初期化するFusion-PSROを提案する。
NEのTop-k確率により、我々は高品質のベースポリシーを選択し、モデル平均化を通じてそれらを新しいBRポリシーに融合する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:16:29 GMT)
MotionGS : Compact Gaussian Splatting SLAM by Motion Filter [11.0] NeRFベースのSLAMは急増しているが、3DGSベースのSLAMは希薄である。
本稿では, 深部視覚特徴, 二重選択, 3DGSを融合した新しい3DGSベースのSLAM手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:56:29 GMT)
Iris-SAM: Iris Segmentation Using a Foundation Model [10.9] 基礎モデルviz., Segment Anything Model (SAM) から画素レベルの虹彩分割モデルを開発する。
この研究の主な貢献は、眼画像上のSAMの微調整中に異なる損失関数を統合することである。
ND-IRIS-0405、CASIA-Iris-Interval-v3、IIT-Delhi-Irisデータセットの実験は、虹彩セグメンテーションのタスクに対する訓練されたモデルの有効性を伝達する。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:58:44 GMT)
AutoSAT: Automatically Optimize SAT Solvers via Large Language Models [10.9] 本稿では,SATソルバの自動最適化のための新しいフレームワークであるAutoSATを紹介する。
AutoSATは、コードの自動生成が可能なLarge Language Models (LLM)に基づいている。
AutoSATはプラグイン・アンド・プレイベースで動作し、広範なエンタープライズおよびモデルトレーニングの必要性を排除している。
論文参考訳(メタデータ) (Fri, 31 May 2024 11:38:00 GMT)
Interpretable Knowledge Tracing via Response Influence-based Counterfactual Reasoning [10.8] 知識追跡は、コンピュータ支援教育と知的学習システムにおいて重要な役割を担っている。
現在のアプローチでは、より説明可能な予測を達成するために心理的影響を調査している。
RCKTは,新しい応答型インフルエンサー・インフルエンサー・インフルエンス・インフルエンサー・ナレッジ・トレース・フレームワークである。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:19:03 GMT)
GAD-Generative Learning for HD Map-Free Autonomous Driving [10.8] 本稿では,自律運転の現実的な応用におけるルールベース手法の欠如を克服する試みとともに,予測,決定,計画モジュールをもたらすディープラーニングベースのアプローチを提案する。
この方法は、工場対応のセンサーセットと計算プラットフォームを変更することなく、ジユーテストカーに展開される。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:55:20 GMT)
There and Back Again: The AI Alignment Paradox [10.7] AIモデルを私たちの価値観と整合させるほど、敵がモデルを誤アライズすることが容易になります。
AIの現実世界への影響が増大しているため、研究者の広いコミュニティがAIアライメントパラドックスを認識していることが不可欠である。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:06:24 GMT)
Responsible AI for Earth Observation [10.4] 私たちはAIとEOの交差点を体系的に定義し、責任あるAIプラクティスに重点を置いています。
学術と産業の両面からこの探究を導く重要な要素をいくつか挙げる。
本稿は、今後の研究成果に価値ある洞察を提供するとともに、今後の可能性と新たなトレンドを探求する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:47:27 GMT)
Pursuing Overall Welfare in Federated Learning through Sequential Decision Making [10.4] 従来のフェデレートラーニングでは、単一のグローバルモデルはすべてのクライアントに対して等しく機能することができない。
我々の研究は、既存の公正を意識したアグリゲーション戦略をオンライン凸最適化フレームワークに統合できることを明らかにした。
AAggFFは、両方の実践的な設定において、既存のメソッドよりもクライアントレベルの公平性が高い。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:15:44 GMT)
HQ-DiT: Efficient Diffusion Transformer with FP4 Hybrid Quantization [10.3] 拡散変換器(DiT)は、最近、優れた視覚生成能力に対して大きな注目を集めている。
DiTは高いパラメータカウントと実装コストを持ち、携帯電話などのリソース制限されたデバイスでの使用を著しく制限している。
4ビット浮動小数点(FP)の精度をDiT推論の重みとアクティベーションの両面に利用した,効率的なポストトレーニング量子化法であるDiT(HQ-DiT)のハイブリッド浮動小点量子化を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:48:05 GMT)
Collective Variable Free Transition Path Sampling with Generative Flow Network [10.2] 我々は,集団変数(CV)に頼ることなく,生成フローネットワーク(GFlowNets)を用いて遷移経路のサンプルを作成することを提案する。
TPS-GFNと呼ばれる我々の手法は、従来のCVフリー機械学習手法よりも現実的で多様な遷移経路を生成する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:18:35 GMT)
Uncertainty Quantification for Bird's Eye View Semantic Segmentation: Methods and Benchmarks [10.2] 本稿では,BEVセグメンテーションにおける予測不確実性定量化のためのベンチマークを提案する。
誤分類および非分布画素の識別における予測不確実性の有効性と校正に焦点が当てられている。
本研究では,不均衡なデータに対する不確実性-局所-クロス-エントロピー損失を提案し,セグメンテーションの品質とキャリブレーションを継続的に改善する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:32:46 GMT)
CARTE: Pretraining and Transfer for Tabular Learning [10.2] このような対応を必要としないニューラルアーキテクチャを提案する。
結果として、マッチしていないバックグラウンドデータに基づいて事前トレーニングを行うことができる。
ベンチマークでは、CARTEが学習を促進し、ベースラインの堅実なセットを上回ることが示されている。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:03:11 GMT)
Direct Cardiac Segmentation from Undersampled K-space Using Transformers [10.1] 変換器(DiSK)を用いたスパースk空間サンプルから分割を導出する新しい手法を提案する。
我々のモデルは、示されるすべてのサンプリングレートに対して、Dice と Hausdorff の距離の基底線を常に上回る。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:54:12 GMT)
Physics-enhanced Neural Operator for Simulating Turbulent Transport [9.9] 本稿では、偏微分方程式(PDE)の物理知識を取り入れた物理強化型ニューラル演算子(PENO)について、正確に流れのダイナミクスをモデル化する。
提案手法は,2つの異なる3次元乱流データに対して,その性能評価を行う。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:05:17 GMT)
NLP Verification: Towards a General Methodology for Certifying Robustness [9.9] 検証された部分空間のセマンティック・ジェネリシビリティの技術的課題について論じる。
埋め込みギャップの効果を解析するための一般的な手法を提案する。
我々は,NLP検証パイプラインの一部として報告すべきもう一つの基本指標として,意味的部分空間のファルシフィビリティの尺度を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:11:15 GMT)
Understanding and Improving Model Averaging in Federated Learning on Heterogeneous Data [9.8] We study the loss landscape of model averaging in Federated Learning (FL)。
我々は,グローバルモデルの損失を,クライアントモデルに関連する5つの要因に分解する。
我々は,IMAを訓練後期のグローバルモデルに利用して,期待する速度からの偏差を低減することを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:57:28 GMT)
DYNA: Disease-Specific Language Model for Variant Pathogenicity [9.7] そこで我々は, シームズニューラルネットワークを用いたDYNA:病原性微調整を提案する。
各種の心血管疾患に焦点をあて, 機能低下と機能回復の関係が疾患特異的VEPを規定する。
非コーディングVEPでは、DYNAをRNAスプライシングの転写後調節軸に応用し、確立された臨床VEPガイドラインにおいて最も一般的な非コーディング病原性機構である。
DYNAファインチューニングモデルでは、保持されたまれな変種テストセットにおいて優れた性能を示し、さらに大きな、臨床的に関連のある変種アノテーションで複製される。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:52:17 GMT)
eXponential FAmily Dynamical Systems (XFADS): Large-scale nonlinear Gaussian state-space modeling [9.5] 非線形状態空間グラフィカルモデルのための低ランク構造化変分オートエンコーダフレームワークを提案する。
我々のアプローチは、より予測的な生成モデルを学ぶ能力を一貫して示している。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:05:37 GMT)
Online Cascade Learning for Efficient Inference over Streams [9.5] 大規模言語モデル(LLM)は、データストリームに関する複雑なクエリに応答する自然な役割を持つ。
この課題に対処する最初のアプローチであるオンラインカスケード学習を提案する。
我々は,オンラインでカスケードを学習するタスクを模倣学習問題として定式化する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:59:34 GMT)
EM-Assist: Safe Automated ExtractMethod Refactoring with LLMs [9.5] 提案を生成し、その後検証し、拡張し、ランク付けするIntelliJ IDEAプラグインであるEM-Assistを紹介します。
オープンソースプロジェクトで実施された1,752の現実世界の評価では、EM-Assistのリコール率はトップ5の中で53.4%であり、以前のベストインクラスのツールでは39.4%だった。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:32:04 GMT)
Multimodal Cross-Domain Few-Shot Learning for Egocentric Action Recognition [9.5] マルチモーダル入力とラベルなしターゲットデータを用いた,エゴセントリックな行動認識のための新しいドメイン間数ショット学習課題に対処する。
本稿では,対象領域への適応性を向上し,推論速度を向上させるために,ドメイン適応的で効率的なアプローチであるMM-CDFSLを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:29:13 GMT)
How Robust is your Fair Model? Exploring the Robustness of Diverse Fairness Strategies [9.4] 本稿では,様々な公正度最適化戦略のロバスト性(ロバスト性比)を測定するための新しい基準を提案する。
我々は,5つのベンチマークフェアネスデータセットに対して,最もポピュラーなフェアネス戦略の3つを用いて,最もポピュラーなフェアネス定義の4つについて,広範な実験を行った。
実験により, しきい値の最適化に依存するフェアネス法は, 評価された全てのデータセットのノイズに非常に敏感であることが実証された。
これは他の2つの手法とは対照的であり、低騒音のシナリオではより公平ではなく、高騒音ではより公平である。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:31:00 GMT)
KerasCV and KerasNLP: Vision and Language Power-Ups [9.4] KerasCVとKerasNLPはコンピュータビジョンと自然言語処理のためのKeras APIの拡張である。
これらのドメインパッケージは、使いやすさとパフォーマンスを重視した高速な実験を可能にするように設計されている。
ライブラリは完全にオープンソース(Apache 2.0ライセンス)で、GitHubから入手できる。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:33:45 GMT)
A Novel Ranking Scheme for the Performance Analysis of Stochastic Optimization Algorithms using the Principles of Severity [9.3] 複数の単目的最適化問題に対してアルゴリズムをランク付けする新しいランキング方式を提案する。
アルゴリズムの結果は、ロバストなブートストラップに基づく仮説テスト手法を用いて比較される。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:35:34 GMT)
Learning to Learn for Few-shot Continual Active Learning [9.3] 継続的な学習は、新しいドメインで可塑性を示しながら、以前見たタスクを解く際の安定性を確保するために努力する。
連続学習の最近の進歩は、特にNLPドメインにおいて、主に教師付き学習環境に限られている。
我々はメタラーニングを活用し,メタコンチネンタルアクティブラーニングと呼ばれる手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:07:23 GMT)
An Empirical Study of Developers' Challenges in Implementing Workflows as Code: A Case Study on Apache Airflow [9.2] 開発者の課題と根本原因を理解するために,9,591のAirflow関連質問から得られたStack Overflowポストを調査した。
ワークフローを定義し実行する際に、最も大きな障害が発生することが分かっています。
分析では,不正な設定,複雑な環境設定,Airflowとそれと相互作用する外部システムに関する基本的な知識の欠如など,課題の背後にある10の根本原因を特定した。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:16:03 GMT)
IncomeSCM: From tabular data set to time-series simulator and causal estimation benchmark [9.0] 本稿では,観測データを逐次構造因果モデルに変換するための戦略を提案する。
tt IncomeSCMシミュレータを構築するために、これらのアイデアをよく知られた成人所得データセットに適用する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:25:58 GMT)
Online Convex Optimisation: The Optimal Switching Regret for all Segmentations Simultaneously [8.9] スイッチング後悔は、トライアルシーケンスの任意のセグメンテーションに対して定義され、各セグメンテーションの静的後悔の和に等しい。
我々のアルゴリズムは非常に効率的で、時間軸の対数的な空間と時間単位の複雑さを持つ。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:16:52 GMT)
Reinforcement Learning for Sociohydrology [8.7] 本稿では,強化学習が社会水理問題の解決に有効な枠組みを提供する方法について論じる。
本稿では,ランオフ低減問題におけるRLの実装を実証するための簡単なケーススタディを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:28:37 GMT)
Improving Paratope and Epitope Prediction by Multi-Modal Contrastive Learning and Interaction Informativeness Estimation [8.4] パラトピーおよびエピトープ予測のためのマルチモーダル・コントラスト学習とインタラクション情報度推定に基づく新しい手法MIPEを提案する。
MIPEはマルチモーダルなコントラスト学習戦略を実装し、各モーダル内の結合残基と非結合残基の表現を最大化する。
空間的相互作用情報を利用するために、MIPEは抗体と抗原の相互作用行列を推定する相互作用情報性推定も組み込んでいる。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:09:36 GMT)
QuanTA: Efficient High-Rank Fine-Tuning of LLMs with Quantum-Informed Tensor Adaptation [8.4] QuanTAは、大規模事前学習言語モデルのための推論オーバーヘッドのない、実装が容易で微調整の手法である。
従来の手法と比較して,QuanTAはコモンセンス推論,算術推論,拡張性を著しく向上させることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:47:30 GMT)
Statistical inference for case-control logistic regression via integrating external summary data [8.4] ケースコントロールサンプリングは、バイナリデータの不均衡構造を緩和するために一般的に使用される振り返りサンプリング設計である。
内部ケース制御データと外部情報を組み込んでロジスティックモデルを推定するために,実証的可能性に基づくアプローチを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:47:38 GMT)
Parameter identification in linear non-Gaussian causal models under general confounding [8.3] このようなモデルが潜伏変数を含む場合の線形係数の同定について検討する。
我々の主な成果は、直接的な因果効果の一般的な識別可能性を決定するのに必要かつ十分であるグラフィカルな基準である。
同定結果に基づいて推定を報告し、フィードバックループを持つモデルへの一般化を探索し、因果グラフの識別可能性に関する新たな結果を提供する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:39:14 GMT)
From CNNs to Shift-Invariant Twin Models Based on Complex Wavelets [7.8] 我々は第1層の組み合わせを "real-valued convolutions + max pooling" に置き換える。
我々は、CModとRMaxが、畳み込みカーネルが帯域通過で向き付けられたときに、同等の出力を生成すると主張している。
提案手法は,ImageNetとCIFAR-10の分類タスクにおいて,優れた精度を実現する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:08:21 GMT)
MVAD: A Multiple Visual Artifact Detector for Video Streaming [7.8] ヴィジュアルアーティファクトは、しばしば、コンテンツ制作と配信の間、一般的な条件のために、ストリーミングされたビデオコンテンツに導入される。
既存の検出方法は、単一の種類のアーティファクトに焦点を当て、客観的な品質指標をしきい値にすることで、アーティファクトの存在を判断することが多い。
本稿では,ビデオストリーミングのためのマルチビジュアルアーティファクト検出器 MVAD を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:56:04 GMT)
Fairness in Autonomous Driving: Towards Understanding Confounding Factors in Object Detection under Challenging Weather [7.7] 本研究では,最先端の変圧器を用いた物体検出装置において,歩行者の公正さを実証的に分析する。
古典的メトリクスに加えて,オブジェクト検出の様々な複雑な特性を測定するために,新しい確率ベースのメトリクスを導入する。
筆者らによる定量的分析では、現場の人口分布、天気の重大さ、歩行者のAV接近など、これまで見過ごされていた直感的な要因が、物体検出性能にどのように影響しているかを明らかにした。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:35:10 GMT)
Self-degraded contrastive domain adaptation for industrial fault diagnosis with bi-imbalanced data [7.7] 両不均衡データの下でのドメインの不一致を処理するための自己劣化コントラスト型ドメイン適応フレームワークを提案する。
モデルプルーニングに基づく非バランス対応コントラスト学習により,まず特徴抽出器を事前訓練する。
そして、教師付き対照的なドメインの敵対的学習に基づいて、サンプルをドメイン境界から遠ざけます。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:51:57 GMT)
BackdoorIndicator: Leveraging OOD Data for Proactive Backdoor Detection in Federated Learning [7.5] FL(Federated Learning)システムでは、分散データオーナ(クライアント)が、ローカルにトレーニングされたモデルを中央サーバにアップロードして、グローバルモデルを共同でトレーニングすることが可能になる。
悪意のあるクライアントは、有害なローカルモデルをアップロードすることでバックドアをグローバルモデルに配置し、攻撃者が定義したトリガーに遭遇したときにターゲットクラスに誤分類を引き起こす可能性がある。
既存のバックドアディフェンスは、特に悪意のある更新が統計的に良質なものに近づいた場合に、異なるシステムと敵対的な設定下での一貫性のないパフォーマンスを示す。
我々は,サーバがグローバルモデルにインジケータタスクをインジェクタとしてインジェクタをインジェクタインジェクタにインジェクタインジェクタをインジェクタインジェクタにインジェクタインジェクタインジェクタにインジェクタインジェクタインジェクタインジェクタインジェクタをインジェクタインジェクタインジェクタにインジェクタインジェクタインジェクタインジェクタインジェクタインジェクタインジェクタイン
論文参考訳(メタデータ) (Fri, 31 May 2024 14:44:57 GMT)
A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction [7.5] シングルビュー画像から3Dシーン表現を学習することは、コンピュータビジョンにおける長年の根本的な問題である。
本稿では,1つの画素が1つ以上の3次元ガウス値を持つ階層型スプラッター画像法を提案する。
提案手法は,ShapeNet-SRNおよびCO3Dデータセットを用いて,最先端の性能を検証した。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:27:52 GMT)
Quasi-Nambu-Goldstone modes in many-body scar models [7.5] 縮退限界における多体スカーモデルにおける集合的・コヒーレントな励起モードの普遍的存在を示す。
これらのモードの数は、それらによってもたらされる量子数と同様に、ハミルトニアンの対称性によってではなく、スカータワーの準対称性によって与えられる。
論文参考訳(メタデータ) (Fri, 31 May 2024 04:10:48 GMT)
High-dimensional robust regression under heavy-tailed data: Asymptotics and Universality [7.4] 重み付き雑音の存在下での頑健な回帰推定器の高次元特性について検討する。
整合性にもかかわらず、最適に調整された位置パラメータ$delta$は高次元状態において最適であることを示す。
隆起回帰の余剰リスクに対する崩壊率を導出する。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:25:31 GMT)
Is machine learning good or bad for the natural sciences? [7.4] MLの導入によって、強い、望ましくない統計バイアスがもたらされる状況が示されている。
例えば、MLモデルを用いて物理(または第一原理)シミュレーションをエミュレートすると、検証バイアスが増幅される。
別の例として、データセットのラベル付けに表現的回帰を使用する場合、これらのラベルは下流のバイアスを取らなければ使用できない。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:28:18 GMT)
TotalVibeSegmentator: Full Torso Segmentation for the NAKO and UK Biobank in Volumetric Interpolated Breath-hold Examination Body Images [7.4] 本稿では, 容積補間呼吸保持検査(VIBE)画像に基づいて, 大規模な疫学データセットのためのトルソセグメンテーションネットワークを提案する。
NAKO(85名)とUK Biobank(16名)のサブセットを用いて, ホールドアウトセット(12名)におけるDice-scoreの評価を行った。
腹部のDiceスコアは0.90点,膵は0.70点であった。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:32:46 GMT)
Directly Estimating Mixed-State Entanglement with Bell Measurement Assistance [7.3] 絡み合いは量子物理学と情報処理において基本的な役割を果たす。
ここでは、フォトニックシステムにおけるランダムなユニタリ進化を用いた混合状態の絡み合いを直接推定する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:43:38 GMT)
Preemptive Answer "Attacks" on Chain-of-Thought Reasoning [7.2] 大きな言語モデル(LLM)は、Chain-of-Thoughtプロンプトと組み合わせることで、印象的な推論機能を示す。
本稿では, LLMが推論に係わる前に解答を得る, プリエンプティブな解答という新しいシナリオを紹介する。
実験により、プリエンプティブな回答は、さまざまなCoTメソッドと幅広いデータセットにわたるモデルの推論能力を著しく損なうことが明らかになった。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:15:04 GMT)
Enhancing Class Fairness in Classification with A Two-Player Game Approach [7.1] ツープレイヤーゲーム(FACT)を用いたFAir分類手法を提案する。
まず,データ拡張を伴う分類器のトレーニングを,対戦型2プレーヤゲームとして記述可能な公平な最適化問題として定式化する。
この定式化に続いて,クラスに対して公平な解に収束できることを理論的に証明する,新しい乗法重み最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:56:43 GMT)
Enhancing Counterfactual Image Generation Using Mahalanobis Distance with Distribution Preferences in Feature Space [7.0] 人工知能(AI)の領域では、説明可能な人工知能(XAI)の重要性がますます認識されている。
1つの注目すべきシングルインスタンスXAIアプローチは、モデルの決定を理解するのに役立つ、反ファクトな説明である。
本稿では,ブラックボックスモデルの特徴空間における特徴量の重要性を計算するための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:26:53 GMT)
Revisiting and Maximizing Temporal Knowledge in Semi-supervised Semantic Segmentation [7.0] 平均教師と共同学習に基づくアプローチは、確認バイアスと結合問題を緩和するために用いられる。
これらのアプローチは、複雑なトレーニングパイプラインとかなりの計算負担を伴うことが多い。
本稿では,トレーニングプロセス中に得られた時間的知識を最大限活用することにより,制約を効果的に緩和するPrevMatchフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:54:59 GMT)
Learning to Estimate System Specifications in Linear Temporal Logic using Transformers and Mamba [7.0] 仕様マイニングは システムトレースから 時間論理式を抽出する
トレースから線形時間論理式を生成するオートレモデルを導入する。
生成した公式の特異性の指標と,構文制約を強制するアルゴリズムを考案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:21:53 GMT)
Improved Out-of-Scope Intent Classification with Dual Encoding and Threshold-based Re-Classification [7.0] 現在の手法は、予測不可能なアウトリーチ分布で困難に直面している。
本稿では,これらの課題に対処するため,Dual for Threshold-Based Re-Classification (DETER)を提案する。
我々のモデルは以前のベンチマークより優れており、未知のインテントに対するF1スコアの13%と5%に向上しています。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:54:24 GMT)
AI-Powered Autonomous Weapons Risk Geopolitical Instability and Threaten AI Research [7.0] 自律兵器システム(AWS)開発における機械学習の最近の採用は、地政学的な安定性とAI研究におけるアイデアの自由交換に深刻なリスクをもたらす、と我々は主張する。
MLはすでに、多くの戦場で、人間の兵士のためのAWSの代替を可能にしている。
さらに、AWSの軍事的価値は、AIによる軍備競争の投機と、AI研究に対する国家安全保障上の制限の誤った適用を提起する。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:28:13 GMT)
Zipper: A Multi-Tower Decoder Architecture for Fusing Modalities [7.0] 独立に訓練された単調デコーダから多モード生成モデルを柔軟に構成するマルチトワーデコーダアーキテクチャを提案する。
提案アーキテクチャは,テキスト音声データに制限のあるシナリオにおいて,非常に競争力のある性能を示す。
出力モダリティが音声であるTTS(text-to-Speech Generation)のようなクロスモーダルなタスクでは、事前訓練された音声バックボーンを使用することで、ベースラインよりも優れたパフォーマンスが得られることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:42:53 GMT)
P4: Towards private, personalized, and Peer-to-Peer learning [6.7] パーソナライズの主な課題は、クライアントクラスタリングとデータのプライバシである。
P4(Personalized Private Peer-to-Peer)は、各クライアントがパーソナライズされたモデルを受け取ることを保証する手法である。
P4は微分プライベートP2Pの最先端性能を最大40%向上させる。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:47:52 GMT)
Gradient descent in matrix factorization: Understanding large initialization [6.4] このフレームワークは信号対雑音比の概念と帰納的議論に基づいている。
その結果、GDにおける暗黙的な漸進的な学習現象が明らかとなり、大きなシナリオにおけるそのパフォーマンスをより深く理解することが可能になる。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:59:59 GMT)
Query2CAD: Generating CAD models using natural language queries [6.3] 本稿では,CAD設計のための新しいフレームワークであるQuery2CADを紹介する。
このフレームワークは大きな言語モデルを使用して実行可能なCADマクロを生成する。
Query2CADは、LLMをジェネレータと精錬器の両方として使用して、教師付きデータや追加のトレーニングなしで動作する。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:17:00 GMT)
Position: Stop Making Unscientific AGI Performance Claims [6.3] 人工知能(AI)分野の発展は、人工知能(AGI)の「スパーク」を観察するための「完璧な嵐」を生み出した。
我々は、モデルの潜在空間における有意義なパターンの発見は、AGIを支持する証拠とは見なされないことを議論し、実証的に実証した。
我々は、モデル表現と興味のある変数の間の相関が、モデルが根底にある「真実」の関係について理解していることから「原因」であるとの誤解に対して、AIの方法論的設定と一般的な公開イメージの両方が理想的であると結論付けている。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:16:21 GMT)
An Attention-Based Multi-Context Convolutional Encoder-Decoder Neural Network for Work Zone Traffic Impact Prediction [6.1] ワークゾーンは、非リカレント交通渋滞や道路事故の主な原因の1つである。
多様なプラットフォームからのワークゾーンとトラフィックデータの利用を向上させるデータ統合パイプラインを提案する。
計画された作業ゾーンイベントにおける交通速度と事故発生確率を予測するための新しい深層学習モデルを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:38:49 GMT)
Unified Directly Denoising for Both Variance Preserving and Variance Exploding Diffusion Models [6.1] 本稿では、分散保存(VP)と分散爆発(VE)の両方のケースに対して、1ステップ/複数ステップで画像を生成する統合DDDMフレームワークを提案する。
我々は、uDDDMsが、VPとVEの両方でCIFAR-10で利用できる最高のパフォーマンスの手法に匹敵するFIDスコアを達成できることを実証した。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:49:51 GMT)
Exfiltration of personal information from ChatGPT via prompt injection [5.4] ChatGPT 4と4oは、攻撃者がユーザーの個人情報を照会できるプロンプトインジェクション攻撃の影響を受けやすい。
この脆弱性は、ChatGPTのメモリ機能の導入によって悪化している。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:21:19 GMT)
Out-of-plane magnetic phase diagram of Kitaev quantum spin liquid candidate Na2Co2TeO6 [5.3] 我々はハニカム磁石Na2Co2TeO6とCo3d7の相図を平面外磁場でマッピングした。
データは単一イオン異方性を持つXXZモデルと、おそらく小さな北エフとガンマの交換相互作用によって説明できる。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:56:38 GMT)
Autonomous Driving with Spiking Neural Networks [5.2] スパイキング自律運転(SAD)は、自律運転システムで直面するエネルギー問題に対処する最初の統合スパイキングニューラルネットワーク(SNN)である。
SADはエンドツーエンドでトレーニングされており、知覚、予測、計画という3つの主要なモジュールで構成されている。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:35:31 GMT)
Robust Infidelity: When Faithfulness Measures on Masked Language Models Are Misleading [5.1] 繰り返しマスキングは、それと同等のトランスフォーマーエンコーダテキスト分類器間の忠実度スコアに大きな変化をもたらすことを示す。
本稿では,反復型マスキングを用いた解釈可能性比較の原則的比較を損なうタスク固有の考察を考察する。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:41:54 GMT)
Machine Learning Who to Nudge: Causal vs Predictive Targeting in a Field Experiment on Student Financial Aid Renewal [5.0] 53,000人以上の大学生を対象に,大規模フィールド実験におけるターゲットの価値を分析した。
低ベースライン結果に基づくターゲティングが最も有効であることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:59:02 GMT)
An Organic Weed Control Prototype using Directed Energy and Deep Learning [5.0] このロボットは、雑草処理に新しい分散配列ロボット(DAR)ユニットを使用する。
このロボットは、完全に有機的でUV-Cフリーな、特許を付与されたエネルギープラントの根絶のレシピを使っている。
深層学習は、自然環境下でのダイズ畑の雑草8種を最大98%の精度で分類することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:47:22 GMT)
The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data [5.0] バックドア攻撃は、ディープニューラルネットワーク(DNN)のトレーニングプロセスに深刻なセキュリティ上の脅威をもたらしている
The Victim and The Beneficiary (V&B) は有毒なモデルを利用して、余分な良性サンプルを使わずにクリーンなモデルを訓練する。
本フレームワークは,良質な試料の性能を維持しつつ,バックドア注入の防止と各種攻撃に対する堅牢化に有効である。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:59:32 GMT)
Bi-Directional Transformers vs. word2vec: Discovering Vulnerabilities in Lifted Compiled Code [5.0] 本研究では,Word2vec,BERT,RoBERTaを用いた自然言語処理(NLP)埋め込み技術を用いて脆弱性検出を行う。
長い短期記憶(LSTM)ニューラルネットワークは、Julietデータセットから約118kのLLVM関数を使用して生成されたエンコーダからの埋め込みをトレーニングした。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:57:19 GMT)
The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control [5.0] 2024年は、分析翻訳品質評価のための多次元品質指標フレームワークの10周年である。
本稿では,最新のMQM開発について詳述し,3つのサンプルサイズ範囲にわたる翻訳品質測定への普遍的アプローチを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:15:55 GMT)
VENI, VINDy, VICI: a variational reduced-order modeling framework with uncertainty quantification [4.8] 我々は、低次モデル(ROM)を構築するためのデータ駆動型非侵入型フレームワークを提案する。
詳細は、縮小座標の分布を特定するための変分SINIで構成されている。
トレーニングされたオフラインで、特定されたモデルは、新しいパラメータインスタンスと、対応するフルタイムソリューションを計算するための新しい初期条件のためにクエリすることができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:16:48 GMT)
Meta-Learning Linear Quadratic Regulators: A Policy Gradient MAML Approach for Model-free LQR [4.8] LQR問題に対する政策勾配に基づくメタラーニング(MAML)アプローチの安定性とパーソナライズ保証を特徴付ける。
我々の理論的保証は、学習したコントローラが見えないLQRタスクに効率的に適応できることを示しています。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:54:20 GMT)
FORML: A Riemannian Hessian-free Method for Meta-learning on Stiefel Manifolds [4.8] 本稿では、スティーフェル多様体上の微分の1次近似を用いたヘッセンフリーアプローチを提案する。
本手法は計算負荷とメモリフットプリントを大幅に削減する。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:34:33 GMT)
Factors Influencing Performance of Students in Software Automated Test Tools Course [4.7] 自動テストコースでは,どの要因が学生のパフォーマンスに影響を与えているのかを理解することが重要である。
このテストコースで学生のパフォーマンスを予測するために考慮されているさまざまな指標は、学生のエンゲージメント、個々の納品品の格付け、前提条件のコースである。
このデータセットには2021年から2022年までの学生の記録が含まれており、5つの異なる学区の情報で構成されていた。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:46:57 GMT)
Experimental demonstration of a fault-tolerant qubit encoded on a hyperfine-coupled qudit [4.7] 複数の物理量子ビットに冗長性を導入して1つのエラー保護論理量子ビットを符号化するプロトコルは理論的には有効であるが、リソースのオーバーヘッドが大きいことを示唆している。
高スピン磁気核と凝縮物質電子スピン量子ビットを結合してフォールトトレラントメモリを実装するための提案が浮上している。
酸化亜鉛の高コヒーレントなマンガン欠陥のアンサンブルにおいて,スピン準位の部分空間内に電子核二重共鳴を用いた符号化を実装した。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:19:57 GMT)
Relevant long-range interaction of the entanglement Hamiltonian emerges from a short-range system [4.7] エンタングルメントハミルトニアン (EH) は、実際には仮想エッジ上の元のハミルトニアンとあまり似ていない。
結果はメルミン=ワグナーの定理に反し、EHには関連する長距離項が存在するはずである。
これは、Li-Haldane-Poilblanc予想が、完全に異なる物理を導く可能性があるEHに必要な補正を無視していることを明らかにする。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:46:03 GMT)
Liver Fat Quantification Network with Body Shape [4.6] 生体形状のみを用いて肝脂肪の割合を推定するディープニューラルネットワークを提案する。
提案手法は,フレキシブルベースラインネットワークと軽量アテンションモジュールから構成される。
その結果,Root平均二乗誤差(RMSE)が5.26%,R-二乗値が0.8。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:48:18 GMT)
Anatomical Region Recognition and Real-time Bone Tracking Methods by Dynamically Decoding A-Mode Ultrasound Signals [4.6] 本稿では,Aモード超音波信号を用いた解剖学的領域認識と骨追跡のためのディープラーニング手法を提案する。
このアルゴリズムは、同時に骨追跡を行い、Aモード超音波トランスデューサが置かれた解剖学的領域を特定することができる。
この実験は解剖学的領域の分類において97%の精度を示し、動的追跡条件下では0.5$pm$1mmの精度を示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 11:31:12 GMT)
Federated Generative Learning with Foundation Models [4.5] 本稿では,新しいフェデレーション学習フレームワークを提案する。
このフレームワークでは、各クライアントがローカルデータに適したテキスト埋め込みを作成し、サーバに埋め込みを送信することができる。
次に、これらの埋め込みを用いた基礎生成モデルを用いて、情報的トレーニングデータをサーバ上で遠隔で合成することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:49:21 GMT)
LSPI: Heterogeneous Graph Neural Network Classification Aggregation Algorithm Based on Size Neighbor Path Identification [4.4] 本稿では3つの一般的なデータ集合におけるメタパスについて検討し、異なるメタパスによって接続される隣人の数に大きな違いがあることを見出した。
同時に、大きなボルパスに含まれる騒音情報は、モデル性能に悪影響を及ぼす。
本稿では,大小隣接経路アイデン整形に基づく不均一なグラフニューラルネットワークの分類と集約アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:03:48 GMT)
Large Language Models are Zero-Shot Next Location Predictors [4.3] 大規模言語モデル(LLM)は、ゼロショットの次位置予測器として機能する。
LLMの精度は32.4%までで、洗練されたDLモデルに比べて600%以上向上している。
本稿では,データ汚染を検査する他の研究に触発された枠組みを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:07:33 GMT)
Greed is All You Need: An Evaluation of Tokenizer Inference Methods [4.3] 4つの異なるアルゴリズムと3つの語彙サイズにまたがる7つのトークン化手法の制御解析を行う。
我々は,最もよく使われているトークン化剤に対して,グリーディ推論が驚くほどよく機能し,最近導入された文脈的にインフォームドされたトークン化剤であるSaGeが,形態的アライメントにおいて他の全てより優れていることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:07:45 GMT)
HoSNN: Adversarially-Robust Homeostatic Spiking Neural Networks with Adaptive Firing Thresholds [4.2] スパイキングニューラルネットワーク(SNN)は、有望なニューラルインスパイアされた計算モデルを提供する。
本稿では,ニューロホメオスタシスからインスピレーションを得て,しきい値適応型集積・発火ニューロンモデルの設計を行う。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:45:57 GMT)
Optimally Improving Cooperative Learning in a Social Setting [4.2] 個人所有の分類器を持つネットワークエージェントの集合を動的に更新する協調学習シナリオを考察する。
本稿では,集合目的関数を最適化するための時間アルゴリズムを示し,平等目的関数の最適化がNPハードであることを示す。
全てのアルゴリズムの性能は数学的解析によって保証され、合成データと実データの実験によって裏付けられている。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:07:33 GMT)
Beyond Conventional Parametric Modeling: Data-Driven Framework for Estimation and Prediction of Time Activity Curves in Dynamic PET Imaging [4.1] 本研究では、リアクション拡散システムにインスパイアされた、革新的なデータ駆動型ニューラルネットワークベースのフレームワークを紹介する。
本手法は, dPETのTACに適応的に適合し, 観測データから拡散係数と反応項を直接キャリブレーションすることができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:09:07 GMT)
Paying to Do Better: Games with Payments between Learning Agents [4.1] 競売のような繰り返しゲームでは、プレイヤーは通常、学習アルゴリズムを使用してアクションを選択する。
本稿では,エージェントのアルゴリズムに金銭的移転を取り入れたプレイヤーの影響について検討する。
このようなシナリオを捉えるための単純なゲーム理論モデルを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:55:11 GMT)
Fast Evaluation of S-boxes with Garbled Circuits [4.0] ガーブリングスキームは、プライバシ保護プロトコルとセキュアな双方向計算のための重要なプリミティブである。
本稿では,XORと単射影ゲートからなる回路において,2n$の値をワイヤに割り当てる射影ガーブリング方式を提案する。
置換置換置換暗号の評価により,提案方式の性能解析を行う。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:07:44 GMT)
Intelligent and Miniaturized Neural Interfaces: An Emerging Era in Neurotechnology [4.0] 組込み型またはウェアラブルデバイスに信号処理を組み込んだ知的神経義肢の3つのカテゴリの開発における最新の進歩を概観する。
1)閉ループ症状追跡と応答性刺激のためのニューラルインターフェース,2)精神疾患などのネットワーク関連疾患に対するニューラルインターフェースなどである。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:00:36 GMT)
It is Simple Sometimes: A Study On Improving Aspect-Based Sentiment Analysis Performance [4.0] タスク記述にNLP関連タスクプレフィックスを付加することにより、命令学習パラダイムの拡張であるPFInstructを提案する。
この単純なアプローチは全てのテストされたSemEvalサブタスクのパフォーマンスを改善し、ATEサブタスク(Rest14)の以前の状態(SOTA)を+3.28 F1スコア、AOOEサブタスクの平均+5.43 F1スコアで上回った。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:57:09 GMT)
A Robot Walks into a Bar: Can Language Models Serve asCreativity Support Tools for Comedy? An Evaluation of LLMs' Humour Alignment with Comedians [3.9] オーディエンスの前でライブショーを行う20人のプロコメディアンに,人工知能を芸術的プロセスで使用するインタビューを行った。
「我が研究は、片手、有害な言論、他方、抵抗、風刺、パンチアップの実践としての「攻撃」の言葉の微妙な相違に関する学問を拡げている。」
論文参考訳(メタデータ) (Fri, 31 May 2024 15:55:51 GMT)
The Explanation Necessity for Healthcare AI [3.9] そこで本研究では,4つの異なる説明のクラスを持つ新たな分類体系を提案する。
評価プロトコルの堅牢性、専門家による観察の変動性、アプリケーションの表現次元性という3つの重要な要素が考慮されている。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:20:10 GMT)
Certifying Global Robustness for Deep Neural Networks [3.9] グローバルなディープニューラルネットワークは、すべての意味のある入力に対する摂動に抵抗する。
現在のロバストネス認証手法は、局所ロバストネスを強調し、スケールと一般化に苦慮している。
本稿では,ディープニューラルネットワークのグローバルロバスト性を評価・検証するための体系的かつ効率的な手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:46:04 GMT)
Consensus Focus for Object Detection and minority classes [3.7] 半教師付きおよび長い尾を持つ物体検出のための修正されたコンセンサス焦点を提案する。
実験では,NMS,ソフトNMS,WBFよりも信頼性が高く,バウンディングボックスの精度が高かった。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:36:50 GMT)
Comparing information content of representation spaces for disentanglement with VAE ensembles [3.7] Disentanglementは、機械学習を使用してデータセットに関する情報を意味のある断片に分割する試みである。
繰り返し学習の合奏によって学習された情報の断片として,学習チャネルを集合的に研究する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:33:07 GMT)
CLIP-QDA: An Explainable Concept Bottleneck Model [3.6] 本稿では,高速かつ説明可能な画像分類を行うマルチモーダル基礎モデルから設計した説明可能なアルゴリズムを提案する。
我々の説明は計算を高速化しながら既存のXAI手法と競合する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:07:31 GMT)
Investigating and unmasking feature-level vulnerabilities of CNNs to adversarial perturbations [3.5] 本研究では,畳み込みニューラルネットワーク(CNN)に対する対向摂動の影響について検討する。
本稿では,CNNの脆弱性を逆方向の摂動に対して調査するために,逆方向干渉フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:14:44 GMT)
Just Rewrite It Again: A Post-Processing Method for Enhanced Semantic Similarity and Privacy Preservation of Differentially Private Rewritten Text [3.4] 本稿では,書き直したテキストを元のテキストと整合させることを目標とした,簡単な後処理手法を提案する。
以上の結果から,このような手法は,従来の入力よりも意味論的に類似した出力を生成するだけでなく,経験的プライバシ評価において平均的なスコアがよいテキストを生成することが示唆された。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:24:55 GMT)
CWRCzech: 100M Query-Document Czech Click Dataset and Its Application to Web Relevance Ranking [3.2] CWRCzechは、Seznam.czの検索エンジンログから収集されたユーザ行動データと関連性ランキングのための1億のクエリドキュメントチェコのクリックデータセットである。
検索結果の文書位置とユーザーの行動に関する情報を提供する:2760万クリックされた文書と108万ダウエル時間。
我々は、十分な規模で自動的に活用されるデータに基づいてトレーニングされたモデルが、人間の注釈付きデータに基づいてトレーニングされたモデルの性能を上回ることができることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:38:54 GMT)
Permutation Decision Trees [3.1] Effort-To-Compress (ETC) は、新しい不純物尺度として初めて複雑性尺度である。
置換決定木と様々な実世界のデータセットにおける古典的決定木の性能比較を行う。
論文参考訳(メタデータ) (Fri, 31 May 2024 11:30:31 GMT)
ImplicitSLIM and How it Improves Embedding-based Collaborative Filtering [3.1] ImplicitSLIMはスパース高次元データのための新しい教師なし学習手法である。
SLIMのようなモデルからの埋め込みを、計算的に安価でメモリ効率の良い方法で抽出することで、埋め込みベースのモデルを改善する。
我々は,ImplicitSLIMが性能を向上し,従来の協調フィルタリング手法と最先端のコンバージェンスを高速化することを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:19:41 GMT)
Hardware-Efficient EMG Decoding for Next-Generation Hand Prostheses [3.0] 現在の商用のロボット義手(RPH)は、基本的なオン/オフコマンドによる限定的な制御を提供する。
機械学習の最近の進歩は、より高い自由度で指の動きを復号できる。
本稿では,次世代携帯型RPHのオンチップ動作復号化を実現するために,新たなアトラクタベースニューラルネットワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:50:25 GMT)
GUIDE: Guidance-based Incremental Learning with Diffusion Models [3.0] GUIDEは,拡散モデルからサンプルのリハーサルを誘導する,新しい連続学習手法である。
実験の結果,GUIDEは破滅的忘れを著しく減らし,従来のランダムサンプリング手法より優れ,生成的再生を伴う継続的な学習における最近の最先端の手法を超越した。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:31:16 GMT)
ABodyBuilder3: Improved and scalable antibody structure predictions [3.0] 我々はImmuneBuilderに基づいた改良されたスケーラブルな抗体構造予測モデルであるABodyBuilder3を紹介する。
我々は,言語モデル埋め込みを利用して,CDRループのモデリングにおいて,新しい最先端の精度を実現する。
予測された局所距離差分試験をモデル出力に組み込んで、不確実性をより正確に推定する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:45:11 GMT)
Students' Perspective on AI Code Completion: Benefits and Challenges [2.9] 学生の視点から,AIコード補完のメリット,課題,期待について検討した。
その結果,AIコード補完は,正しい構文提案を提供することで,学生の生産性と効率を向上させることがわかった。
将来的には、AIコード補完は説明可能であり、教育プロセスを強化するための最高のコーディングプラクティスを提供するべきである。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:12:07 GMT)
Adv-KD: Adversarial Knowledge Distillation for Faster Diffusion Sampling [2.9] 拡散確率モデル(DPM)は、深層生成モデルの強力なクラスとして登場した。
それらは、サンプル生成中にシーケンシャルなデノイングステップに依存している。
モデルアーキテクチャに直接位相を分解する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:19:44 GMT)
Aligning Multiclass Neural Network Classifier Criterion with Task Performance via $F_β$-Score [2.9] マルチクラスニューラルネットワーク分類器は通常、クロスエントロピー損失を用いて訓練される。
クロスエントロピーの使用が、意図されたアプリケーション固有のパフォーマンス基準に適合する分類器が得られるかどうか疑問である。
提案手法は,マクロ-$F_beta$のソフトセットに基づく近似の最適化に利用できることを示す理論解析である。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:54:01 GMT)
Benchmarking the Communication Competence of Code Generation for LLMs and LLM Agent [2.8] 大規模言語モデル(LLM)は、コード生成の分野でタスクを実行する能力を大幅に改善した。
LLMが有能なプログラマであることと、最上位のソフトウェアエンジニアであることの間にはまだギャップがある。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:06:18 GMT)
ChemScraper: Leveraging PDF Graphics Instructions for Molecular Diagram Parsing [2.8] 本稿では,デジタルPDFプリミティブを入力として利用する新しいモデルを提案する。
モデルは高速で正確であり、光学文字認識(OCR)やベクトル化を必要としない。
画像のアノテートにパーシングを使用し、画像中の分子を認識するために新しいマルチタスクニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:53:06 GMT)
Improving code-mixed hate detection by native sample mixing: A case study for Hindi-English code-mixed scenario [2.8] ヘイト検出は長年、NLPコミュニティにとって難しい課題だった。
我々は、ヒンディー語と英語のコード混合設定をケーススタディとみなす。
コード混合トレーニングセットにネイティブなヘイトサンプルを追加することで、少量であっても、コード混合ヘイト検出の混合性能が改善された。
論文参考訳(メタデータ) (Fri, 31 May 2024 11:43:31 GMT)
Kernel Ridge Riesz Representers: Generalization Error and Mis-specification [2.7] 私はカーネルバランスウェイトをカーネルリッジリース表現器(KRRR)と解釈する。
KRRRはカーネルリッジ回帰とカーネルリッジバランスウェイトを正確に一般化したものである。
私はKRRRを用いて、資産に対する401(k)の非均一な処理効果を年齢によって推測する。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:24:23 GMT)
A-PETE: Adaptive Prototype Explanations of Tree Ensembles [2.7] 機械学習モデルの解釈の必要性は、ツリーアンサンブルのコンテキスト内でのプロトタイプ説明を通じて解決される。
A-PETE (Adaptive Prototype Explanations of Tree Ensembles) と呼ばれるアルゴリズムが提案され、これらの分類器のプロトタイプの選択を自動化する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:29:39 GMT)
FineRadScore: A Radiology Report Line-by-Line Evaluation Technique Generating Corrections with Severity Scores [2.4] FineRadScoreは、生成された胸部X線(CXR)レポートの自動評価指標である。
FineRadScoreは、候補からゼロトゥルースレポートに進むのに必要な行ごとの修正の最小数を提供します。
我々はFinRadScoreの補正と誤差重大度スコアが放射線学者の意見と一致していることを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 04:05:09 GMT)
Quantum state preparation for multivariate functions [2.3] 振幅が多変量関数をエンコードする量子状態を作成するためのプロトコルを開発する。
我々は、実用的かつ短期的資源の観点から、要件を解析する。
我々は、24量子ビットと最大237個の2量子ビットゲートを量子化されたH2-1量子プロセッサ上で使用する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:49:27 GMT)
Nonparametric regression on random geometric graphs sampled from submanifolds [2.3] ランダムな基底展開により設計したベイズ以前の分布から生じる後部分布の頻繁な挙動を解析する。
これらの手法の後方収縮速度は任意の正の滑らか度指数に対して最小値(対数係数まで)であることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:18:44 GMT)
Shotluck Holmes: A Family of Efficient Small-Scale Large Language Vision Models For Video Captioning and Summarization [2.3] 本稿では,映像の要約とキャプションを促進するために,多言語視覚モデル(LLVM)のファミリーを提案する。
Shotluck Holmes は Shot2Story ビデオキャプションと要約タスクの最先端結果よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:30:24 GMT)
Principal-Agent Multitasking: the Uniformity of Optimal Contracts and its Efficient Learning via Instrumental Regression [2.3] 本研究はマルチタスクプライマリエージェント問題を研究する。
私はまず一様性の結果を示します。
次に、各タスクの限界効用が不明な環境で研究します。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:01:49 GMT)
That's Optional: A Contemporary Exploration of "that" Omission in English Subordinate Clauses [2.2] 均一情報密度仮説は、話者が情報のスパイクを避けることによって発話のコミュニケーション特性を最適化することを示唆している。
本稿では,UIDの原則が統語的還元に与える影響について検討し,特に英語の従属節におけるコネクタ「 that」の省略点に着目した。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:23:30 GMT)
RASE: Efficient Privacy-preserving Data Aggregation against Disclosure Attacks for IoTs [2.2] センサデバイスが生み出すデータを収集・保護する新たなパラダイムについて検討する。
データアグリゲーションとプライバシ保護の共同設計に関するこれまでの研究は、信頼されたフュージョンセンターがプライバシ体制に準拠していることを前提としている。
本稿では,3段階の逐次手順,雑音付加,ランダムな置換,パラメータ推定に一般化可能な新しいパラダイム(RASE)を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:21:38 GMT)
Quantum Theory and Application of Contextual Optimal Transport [2.2] 本稿では、文脈化された輸送計画の記憶的最適化のための、第一種量子コンピューティングの定式化を提案する。
従来のニューラルOTアプローチと一致しない性能を報告する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:14:11 GMT)
Image captioning in different languages [2.1] 本論文は、2024年5月現在)非英語画像キャプションデータセットのリストを提供する。
このデータセットには23の異なる言語しか表示されていない。
本稿では、ビジョン&ランゲージの分野について、いくつかのオープンな質問で締めくくります。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:37:54 GMT)
Mixed-Integer Optimal Control via Reinforcement Learning: A Case Study on Hybrid Electric Vehicle Energy Management [2.1] 本稿では,2つの遅延深い決定論的アクターQ(TD3AQ)を最適制御問題に適用するハイブリッドアクション強化学習(HARL)アルゴリズムを提案する。
TD3AQはアクター批判とQ-ラーニングの両方の利点を組み合わせ、離散的かつ連続的なアクション空間を同時に扱うことができる。
提案手法はプラグインハイブリッド電気自動車(PHEV)のエネルギー管理問題に対して評価される。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:07:42 GMT)
Enhancing Generative Molecular Design via Uncertainty-guided Fine-tuning of Variational Autoencoders [2.1] 事前学習された生成分子設計モデルにとって重要な課題は、下流の設計タスクに適するように微調整することである。
本研究では,生成不確実性デコーダ(VAE)に基づくGMDモデルに対して,アクティブな環境下での性能フィードバックによる新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:00:25 GMT)
Flexible and Efficient Surrogate Gradient Modeling with Forward Gradient Injection [2.1] 例えば、PyTorchは、後方メソッドをオーバーライドすることで、オペレーションの後方パスのカスタム仕様を可能にする。
これらのメソッドは一般的なプラクティスであり、通常はうまく動作しますが、柔軟性の制限、ソースコードのオーバーヘッドの追加、ユーザビリティの低下、自動モデル最適化手順の有効性に対する潜在的にネガティブな影響など、いくつかの欠点があります。
本稿では、代理勾配を定式化する別の方法、すなわちフォワード勾配注入(FGI)を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:14:35 GMT)
Photonic simulation of Majorana-based Jones polynomials [2.0] ジョーンズ環は、位相的に異なるリンクを区別するための道具として導入された。
最近では、非アベリア異性体をブレイディングすることで、トポロジカル量子計算の中心的構成要素として出現した。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:53:04 GMT)
GANcrop: A Contrastive Defense Against Backdoor Attacks in Federated Learning [2.0] 本稿では,GANcrop という,協調学習におけるバックドア攻撃に対する防御機構について紹介する。
実験的には、特に非IIDシナリオにおいて、ガンクロップはバックドア攻撃に対して効果的に保護されていることが示されている。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:33:16 GMT)
Cross-Temporal Forecast Reconciliation at Digital Platforms with Machine Learning [1.9] 非線形階層的予測整合法を導入し,時間的相互整合予測を直接的かつ自動的に生成する。
ヨーロッパの主要なオンデマンドデリバリプラットフォームと、ニューヨーク市の自転車共有システムから、独自の大規模ストリーミングデータセットを試験的にテストしています。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:44:30 GMT)
Solving partial differential equations with sampled neural networks [1.9] 偏微分方程式(PDE)に対する解の近似は計算科学や工学において重要な問題である。
データに依存しない確率分布から、アンザッツネットワークの隠れた重みとバイアスをサンプリングすることで、両課題を進展させる方法について論じる。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:24:39 GMT)
Analysis of clinical, dosimetric and radiomic features for predicting local failure after stereotactic radiotherapy of brain metastases in malignant melanoma [1.8] 本研究の目的は, 病変特異的な予後予測における臨床, ドシメトリー, 治療前MRIの特徴について検討することであった。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:18:37 GMT)
Resampling methods for Private Statistical Inference [1.8] 我々は、信頼区間を異なるプライバシーで構築する作業について検討する。
データのパーティション上で実行される複数の"小さな"ブートストラップの結果の中央値をプライベートに計算する,非パラメトリックブートストラップの2つのプライベート変種を提案する。
固定された差分プライバシーパラメータ$epsilon$に対して、我々のメソッドは、サンプルサイズ$n$の対数係数内の非プライベートブートストラップと同じエラー率を享受します。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:59:36 GMT)
A new multivariate primitive from CCZ equivalence [1.8] 2つの秘密アフィン可逆$mathcal S,mathcal T$が$mathcalF$の集合に適用される。
等価値 $mathcal G$ と $mathcal F$ はアフィン同値であると言われている。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:15:02 GMT)
Large Language Models: A New Approach for Privacy Policy Analysis at Scale [1.8] 本研究は,大規模プライバシポリシから効果的かつ効率的にプライバシプラクティスを抽出する代替手段として,LLM(Large Language Models)の適用を提案する。
我々はChatGPTやLlama 2といった有名なLLMを活用し、プロンプト、パラメータ、モデルの最適設計に関するガイダンスを提供する。
評価では、ドメイン内のいくつかの有名なデータセットをベンチマークとして、その例外的な性能を評価し、F1スコアが93%を超えた。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:12:33 GMT)
Network Analytics for Anti-Money Laundering -- A Systematic Literature Review and Experimental Evaluation [1.7] 本稿では、アンチマネーロンダリング(AML)のためのNA(Network Analytics)に関する文献を網羅し、体系的にレビューする。
Web of Science と Scopus データベースの97論文を特定し分析した結果,Bockel-Rickermann らによる不正分析フレームワークによるアプローチの分類が得られた。
このフレームワークは一般公開されているEllipticデータセットに適用され、手動機能エンジニアリング、ランダムウォークベースのメソッド、ディープラーニングGNNを実装している。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:29:26 GMT)
From Symbolic Tasks to Code Generation: Diversification Yields Better Task Performers [1.7] コードに関連するタスクを超えて、より多様な命令セットがコード生成のパフォーマンスを向上させることを示す。
我々の観察から,命令調整セットのより多様な意味空間が,命令に従う能力とタスクの実行能力を大幅に向上させることが示唆された。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:23:41 GMT)
Quantum linear algebra is all you need for Transformer architectures [1.7] フォールトトレラント量子コンピューティングのレンズ下でのトランスフォーマーアーキテクチャについて検討する。
我々は,ソフトマックス関数の行ワイド適用のための新しいサブルーチンを用いて,自己アテンション行列のブロック符号化の仕方を示す。
我々のサブルーチンは変換器出力の振幅エンコーディングを作成し、予測値を得るために測定することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:34:57 GMT)
Generative Adversarial Networks in Ultrasound Imaging: Extending Field of View Beyond Conventional Limits [1.7] TTE超音波イメージングは、特に視野(FoV)と解像度のトレードオフなど、固有の限界に直面している。
本稿では,条件付きジェネレーティブ・アドバイザリ・ネットワーク(cGAN)の新たな応用について紹介する。
提案したcGANアーキテクチャーはエコーGANと呼ばれ、アウトペイントにより現実的な解剖学的構造を生成する能力を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:26:30 GMT)
Transformer neural networks and quantum simulators: a hybrid approach for simulating strongly correlated systems [1.6] 本稿では、数値データや実験データによるデータ駆動事前学習と、ハミルトン駆動最適化の第2段階を含む、ニューラル量子状態(NQS)のハイブリッド最適化手法を提案する。
我々の研究は、ニューラル量子状態の信頼性と効率的な最適化の道を開いた。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:55:27 GMT)
Mamba State-Space Models Can Be Strong Downstream Learners [1.6] マンバ状態空間モデル(SSM)は、最近様々なタスクにおいて最先端(SLLM)を上回っている。
混合精度(MPFT)と微細チューニング(PEFT)は低評価である。
我々は,MPFTとPEFTを組み合わせることで,最大で毎秒215倍,メモリあたり65.5%のトークンを削減できることを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:46:23 GMT)
FedLPPA: Learning Personalized Prompt and Aggregation for Federated Weakly-supervised Medical Image Segmentation [1.6] フェデレートラーニング(FL)は、ポリシーやプライバシの懸念によって引き起こされるデータサイロの課題を効果的に緩和する。
従来の集中型FLモデルは、特に医学的文脈において、多様なマルチセンターデータに対応している。
医用画像セグメンテーションのための不均一な弱い監督を均一に活用するために,学習可能なプロンプトとアグリゲーション(FedLPPA)を備えた新規なパーソナライズFLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:19:08 GMT)
Verification of Neural Network Control Systems in Continuous Time [1.6] 本研究では,連続的なニューラルネットワーク制御系に対する最初の検証手法を開発した。
ニューラルネットワークコントローラをモデル化するための抽象化レベルを追加することで、これを実現する。
視覚に基づく自律型飛行機タクシーシステムに適用することで,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:39:48 GMT)
From Structured to Unstructured:A Comparative Analysis of Computer Vision and Graph Models in solving Mesh-based PDEs [1.5] 本稿では,メッシュに基づく偏微分方程式の解法におけるコンピュータビジョンとグラフベースモデルの適用について検討する。
この研究は、3つのコンピュータビジョンベースモデルの性能と計算効率を、3つのデータセットにわたる3つのグラフベースモデルと比較した。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:21:26 GMT)
An Efficient Multi Quantile Regression Network with Ad Hoc Prevention of Quantile Crossing [1.5] 本稿では,高度な量子回帰モデルであるSorting Composite Quantile Regression Neural Network (SCQRNN)について述べる。
トレーニングにおいてアドホックソートを統合することで、SCQRNNは非交差量子化を保証するとともに、モデルの信頼性と解釈可能性を高める。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:04:54 GMT)
Communication-Efficient Distributed Deep Learning via Federated Dynamic Averaging [1.5] Federated Dynamic Averaging (FDA)は通信効率の良いDDL戦略である。
FDAは従来の通信効率の高いアルゴリズムと比較して、通信コストを桁違いに削減している。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:34:11 GMT)
Language Augmentation in CLIP for Improved Anatomy Detection on Multi-modal Medical Images [1.5] ヴィジュアル言語モデルは、医療領域におけるマルチモーダル分類問題に挑戦するための強力なツールとして登場した。
既存の研究は、特定のモダリティや身体領域の臨床的記述に焦点を当てており、全身のマルチモーダル記述を提供するモデルにギャップを残している。
本稿では,マルチモーダルMRIおよびCT画像において,全身の標準化された体局と臓器のリストの自動生成により,このギャップに対処する。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:59:11 GMT)
Class-Based Time Series Data Augmentation to Mitigate Extreme Class Imbalance for Solar Flare Prediction [1.4] 時系列データは、さまざまな領域において重要な役割を担い、意思決定と予測モデリングに価値がある。
機械学習(ML)とディープラーニング(DL)はこの点において有望だが、パフォーマンスはデータ品質と量に依存している。
データ拡張技術は、これらの課題に対処するための潜在的な解決策を提供するが、多変量時系列データセットに対するそれらの効果は、まだ探索されていない。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:03:19 GMT)
A comparison of correspondence analysis with PMI-based word embedding methods [1.4] 我々は、対応解析(CA)とポイントワイド相互情報(PMI)行列の分解を関連付ける。
本稿では,単語コンテキスト行列の分解に成功しているCAの変種について述べる。
実験により, ROOT-CAとROOT-CAの総合結果はPMI法に比べて若干良いことがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:04:15 GMT)
Superfast Selection for Decision Tree Algorithms [1.4] 最適分割」を選択するための,超高速選択という,新しい体系的手法を提案する。
この方法は、時間的複雑さを減らし、単一機能の分割選択を高速化する。
実験によると、UDTは1秒以内にKDD99-10%データセット(41のフィーチャを持つ494Kのサンプル)で1回のトレーニングを終えることができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:18:05 GMT)
Deep Learning without Weight Symmetry [1.4] バックプロパゲーション(BP)は、ニューラルネットワークをトレーニングするための基礎アルゴリズムである。
BPはしばしば生物学的に不溶であると考えられている。
ここでは、製品フィードバックアライメント(PFA)アルゴリズムを紹介する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:11:19 GMT)
Weak Robust Compatibility Between Learning Algorithms and Counterfactual Explanation Generation Algorithms [1.3] 擬似説明生成は、説明可能な人工知能の強力な方法である。
過去の文献は入力インスタンスの摂動に基づく堅牢性について広く研究してきた。
本稿では,説明力の観点から,より合理的なWak Robust Compatibility(Wak Robust Compatibility)を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:03:52 GMT)
Shape Constraints in Symbolic Regression using Penalized Least Squares [1.3] 記号回帰のパラメータ推定段階における形状制約の追加とその考慮について検討する。
形状制約は、他の未知のモデル関数の形状に関する事前知識をSRに導入する手段として用いられる。
勾配に基づく数値最適化を用いたパラメータ推定における形状制約違反の最小化を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:01:12 GMT)
Unpacking the Black Box: Regulating Algorithmic Decisions [1.3] 本稿では,貸付,医療検査,雇用などの高額なアプリケーションで使用される「ブラックボックス」アルゴリズムの監視モデルを提案する。
複雑なアルゴリズムを許すことは、福祉を改善することができるが、その利益は規制当局の規制方法に依存する。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:47:21 GMT)
Navigating Tabular Data Synthesis Research: Understanding User Needs and Tool Capabilities [1.3] タブラルデータ合成(TDS)における技術の現状について調査する。
機能要件と非機能要件のセットを定義することにより,ユーザのニーズを検討する。
我々はユーザがアプリケーションに適したTDSツールを見つけるのを助けるための意思決定ガイドを開発した。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:00:43 GMT)
TENNs-PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [1.2] 低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
我々は3つのイベントベースのベンチマークを実験し、メモリと計算コストを大幅に削減した大きなマージンで3つすべてに対して最先端の結果を得た。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:29:13 GMT)
GAMedX: Generative AI-based Medical Entity Data Extractor Using Large Language Models [1.1] 本稿では,Large Language Models(LLMs)を利用した名前付きエンティティ認識(NER)アプローチであるGAMedXを紹介する。
この方法論は、NERのためのオープンソースのLCMを統合し、特殊な医学用語の複雑さをナビゲートするために、連鎖プロンプトとピダンティックスキーマを構造化出力に利用している。
その結果, 評価データセットの1つに対して, 98%の精度でROUGE F1の有意なスコアが得られた。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:53:22 GMT)
Multilingual Text Style Transfer: Datasets & Models for Indian Languages [1.1] 本稿では,ヒンディー語,マガヒ語,マラヤラム語,マラタイ語,パンジャービ語,オディア語,テルグ語,ウルドゥー語など,インド諸言語の感情伝達に焦点を当てた。
これらの8言語それぞれに対して、1000の正と1000の負のスタイルパラレル文からなる専用データセットを導入する。
次に、並列性、非並列性、言語横断性、共有学習アプローチに分類される様々なベンチマークモデルの性能を評価する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:05:27 GMT)
Sampling-based Distributed Training with Message Passing Neural Network [1.1] ドメイン分割に基づくメッセージパッシングニューラルネットワーク(MPNN)のための分散トレーニングと推論手法を提案する。
我々はDS-MPNN(DとSは分散してサンプリングされる)と呼ばれるスケーラブルなグラフニューラルネットワークを提案し、最大$O(105)のノードをスケーリングできる。
論文参考訳(メタデータ) (Fri, 31 May 2024 22:39:26 GMT)
Concentration Bounds for Optimized Certainty Equivalent Risk Estimation [1.1] 我々は,OCE(Optimized Certainty Equivalent)リスクを,独立かつ同一に分布するサンプルから推定する問題を考察する。
OCEの古典的なサンプル平均近似(SAA)については、平均二乗誤差と濃度境界を導出する(準ガウス性を想定して)。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:32:43 GMT)
On the referential capacity of language models: An internalist rejoinder to Mandelkern & Linzen [1.0] 最近の論文で、Mandelkern & Linzen (2024) は言語モデル(LM)の単語が参照するかどうかという問題に対処している。
彼らの議論は、哲学的意味論における外部主義の伝統から引かれており、これは「「言葉と世界」を結び付ける」言葉の能力であると見なしている。
このコメンタリーでは、まずM&Lの主張を、自然言語表現の狭いクラスに適用するものとして評価する。
それらの公式化によって、LMにおける参照に関する不確実な一般化がもたらされることを示唆する。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:43:20 GMT)
Advancing Ear Biometrics: Enhancing Accuracy and Robustness through Deep Learning [1.0] 生体認証は、個々の身体的特徴や行動的特徴に基づいて個人を検証するための信頼性の高い方法である。
本研究は,耳の生体認証に焦点をあて,その特徴を精度,信頼性,ユーザビリティの向上に活用する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:55:10 GMT)
Pre- to Post-Contrast Breast MRI Synthesis for Enhanced Tumour Segmentation [1.0] 本研究は, GAN(Generative Adversarial Network)を用いて, コントラスト前T1強調脂肪飽和乳房MRIを対応する第1DCE-MRIシーケンスに翻訳することにより, 合成コントラスト増強の実現可能性について検討した。
定量的な画像品質指標を用いて生成したDCE-MRIデータを評価し、3D乳房切片の下流タスクに適用する。
以上の結果から, 造影後DCE-MRI合成が乳房のセグメンテーションモデルの堅牢性向上に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:15:01 GMT)
Dirac spin liquid in quantum dipole arrays [0.9] ギャップレス(1)$ディラックスピンが自然に2次元量子アレイに現れると予測する。
本稿では,短期摂動モードに適した量子シミュレータを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:00:01 GMT)
Scalable Bayesian Learning with posteriors [0.9] ベイズ学習の汎用実装をホストするPyTorchライブラリであるPostorsを導入する。
実験によりベイズ近似の有効性を実証・比較し,寒冷後部効果と大規模言語モデルを用いた応用について検討した。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:00:12 GMT)
LLMs achieve adult human performance on higher-order theory of mind tasks [0.8] 本稿では,手書きテストスイートであるMulti-Order Theory of Mind Q&Aを導入することで,先行作業の基盤となる。
5つの大きな言語モデルの性能を、新しく集まった成人のベンチマークと比較する。
We found that GPT-4 and Flan-PaLM reach to adult-level and near adult-level performance on ToM task。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:45:50 GMT)
MpoxSLDNet: A Novel CNN Model for Detecting Monkeypox Lesions and Performance Comparison with Pre-trained Models [0.8] 本研究は,サルポックス病変の早期発見と分類を容易にするため,MpoxSLDNet(Monkeypox Skin Lesion Detector Network)を提案する。
MpoxSLDNetは、VGG16、ResNet50、DenseNet121といった従来のトレーニング済みモデルと比較して、精度、リコール、F1スコア、精度、AUCなどの優れたパフォーマンス指標を提供する。
検証精度は86.25%、84.38%、VGG16、DenseNet121、ResNet50の67.19%に対して94.56%に達した。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:05:59 GMT)
Power of Cooperative Supervision: Multiple Teachers Framework for Enhanced 3D Semi-Supervised Object Detection [0.7] 多様な都市環境とオブジェクト特性を反映したマルチクラス3次元LiDARデータセットを構築した。
我々は,複数の教師の枠組みに基づく頑健な3次元半教師対象検出(SSOD)を開発した。
マルチクラスのLiDARデータセットとソースコードをGithubリポジトリで公開する予定です。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:23:25 GMT)
Masked Language Modeling Becomes Conditional Density Estimation for Tabular Data Synthesis [0.7] 非パラメトリック条件密度推定を考案し,新しい合成データ生成手法MaCoDEを提案する。
提案モデルでは,再トレーニングを必要とせず,データプライバシレベルの調整を可能にする。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:26:42 GMT)
A Geometry of entanglement and entropy [0.7] 我々は、量子力学におけるその重要な役割を強調する、絡み合いの包括的概要を提供する。
本稿では,幾何学的視点による絡み合いの定量化と特徴化について論じる。
状態テレポーテーションのタスクに必要なリソースとしての絡み合いの例を最後に示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 06:19:44 GMT)
Sifting through the Noise: A Survey of Diffusion Probabilistic Models and Their Applications to Biomolecules [0.7] 拡散確率モデルは、多くの著名なアプリケーションに導入されている。
本稿では,これらのモデルの背後にある理論と研究の現状について概説する。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:39:51 GMT)
GenMix: Combining Generative and Mixture Data Augmentation for Medical Image Classification [0.7] 我々はGenMixと呼ばれる新しいデータ拡張手法を提案する。
両方の手法の強みを利用するために、生成的アプローチと混合的アプローチを組み合わせる。
我々はGenMixが様々な生成モデルの性能を向上させることを実証した。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:32:31 GMT)
CoDeGAN: Contrastive Disentanglement for Generative Adversarial Network [0.5] 解釈可能な機械学習において重要な関心事であるディスタングルメントもまた、コンピュータビジョンコミュニティから大きな注目を集めている。
我々はtextttCoDeGAN を提案し、画像領域から特徴領域への切り離しに関する類似性制約を緩和する。
我々はCoDeGANに自己教師付き事前学習を統合して意味表現を学習し、教師なしの絡み合いを著しく促進する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:50:18 GMT)
Federated Random Forest for Partially Overlapping Clinical Data [0.5] 本研究は,臨床データセットにおける特徴と不完全データの一部を重複させることによって生じる課題に対処することを目的とする。
ランダムフォレストのようなほとんどの標準的なアルゴリズムでは、全てのデータセットが同じパラメータを持つことが不可欠である。
フェデレーションされたグローバルに最適化されたモデルを集約するためには、各サイトでローカルに利用可能な機能のみを使用することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 10:07:24 GMT)
Representation of preferences for multiple criteria decision aiding in a new seven-valued logic [0.5] 複数基準決定処理の領域において,7値論理を用いて好みを表現する方法を示す。
特に,不完全な選好情報を考慮した複数の基準を集約した,新たな格付けと値関数選好モデルを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:59:24 GMT)
Female mosquito detection by means of AI techniques inside release containers in the context of a Sterile Insect Technique program [0.4] SIT(Sterile Insect Technique)は、個体群を管理対象とする昆虫の無菌雄の環境への放散に基づく生物害虫防除技術である。
本報告では,SITプログラム用蚊放流槽におけるメスの発見について述べる。
容器は実験装置に収められ、内部の蚊の飛行音を録音することができた。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:20:24 GMT)
Automatic Counting and Classification of Mosquito Eggs in Field Traps [0.4] 蚊が卵を挿入するフィールドトラップの解析は、不妊虫技術(SIT)が適切に機能していることを確認するのに不可欠である。
これは、ハッチした卵の数は、不妊オスが野生の卵と競合していないことを示唆している可能性があるためである。
トラップの研究は顕微鏡で手作業で行われ、非常に時間がかかり、ヒューマンエラーを起こしやすい。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:48:48 GMT)
Searching for internal symbols underlying deep learning [0.4] ディープラーニング(DL)は、ディープニューラルネットワーク(DNN)が、指示や指針なしに、与えられた例から複雑なタスクやルールを自動的に学習することを可能にする。
1つの研究は、DNNが概念を学習し、高いレベルの特徴が人間に認識できることを示唆している。
基礎セグメンテーションモデルと教師なし学習を組み合わせて、内部コードを抽出し、抽象コードの可能性を特定し、DLの決定をより信頼性と安全性を高める。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:39:26 GMT)
Having Second Thoughts? Let's hear it [0.4] ディープラーニングモデルは、低次知覚領域から高次認知領域へのボトムアップ信号経路を緩やかに模倣する。
訓練後、DLモデルはいくつかのドメイン固有のタスクにおいて人間より優れているが、意思決定プロセスは容易に破壊されることが知られている。
本稿では,DLモデルをより堅牢にできるかどうかを,選択的注意と検査を模倣した認証プロセスを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:53:36 GMT)
LightCPPgen: An Explainable Machine Learning Pipeline for Rational Design of Cell Penetrating Peptides [0.3] 我々は,機械学習(ML)と最適化アルゴリズムの長所を活かして,CPPのデノボ設計に革新的なアプローチを導入する。
私たちの戦略はLight CPPgenと呼ばれ、LightGBMベースの予測モデルと遺伝的アルゴリズム(GA)を統合しています。
GAソリューションは、元の非貫通ペプチドとの類似性を最大化しつつ、候補配列の透過性スコアを特にターゲットとしている。
論文参考訳(メタデータ) (Fri, 31 May 2024 10:57:25 GMT)
On the Completeness and Complexity of the Lifted Dynamic Junction Tree Algorithm [0.3] 時空昇降型動的ジャンクションツリーアルゴリズム(LDJT)の最初の完全性および複雑性解析に寄与する。
時間的側面を効率的に扱うため、LDJTは条件付き独立性を使用して時間内に進行し、除去命令に制限を与える。
これらの制限がドメインリフタビリティの結果に影響を及ぼし、時間内に進行する特定のケースがFO12から除外されなければならないことを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:15:38 GMT)
NoticIA: A Clickbait Article Summarization Dataset in Spanish [0.3] スペインの850のニュース記事からなるデータセットであるNoticIAを紹介します。
このタスクは高度なテキスト理解と要約能力を必要とし、様々な情報を推測し接続するモデルの能力に挑戦する。
このデータセットを使って、タスク固有のモデルであるClickbaitFighterをトレーニングします。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:19:18 GMT)
Fisher information susceptibility for multiparameter quantum estimation [0.2] ノイズは量子技術の性能に影響を及ぼし、そのため、作業上のメリットの数値を解明することが重要である。
量子気象学において、フィッシャー情報計測ノイズの感受性の導入により、測定の堅牢性を定量化できるようになった。
半定値プログラムの形式でその数学的定義を提供する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:35:10 GMT)
Anomaly Detection in Dynamic Graphs: A Comprehensive Survey [0.2] 本稿では,動的グラフを用いた異常検出の包括的,概念的概要について述べる。
既存のグラフベースの異常検出(AD)技術とその動的ネットワークへの応用に焦点を当てる。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:54:00 GMT)
The University of California San Francisco Brain Metastases Stereotactic Radiosurgery (UCSF-BMSR) MRI Dataset [0.2] UCSF Brain Metastases Stereotactic Radiosurgery データセットは、412人の患者の560個の脳MRIからなる、パブリック、臨床、マルチモーダルな脳MRIデータセットである。
データセットは、https://imagingdatasets.ucsf.edu/dataset/1.com/commercial で無料で利用できる。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:37:03 GMT)
Maximum Temperature Prediction Using Remote Sensing Data Via Convolutional Neural Network [0.1] 本研究では,Sentinel-3衛星からのデータと気象予報,リモートセンシング入力を併用する新しい機械学習モデルを提案する。
実験の結果、2023年の平均絶対誤差(MAE)は209°Cで、解像度は1ピクセルあたり20mである。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:39:41 GMT)
Automatic Channel Pruning for Multi-Head Attention [0.1] マルチヘッドアテンション機構を考慮した自動チャネルプルーニング手法を提案する。
ImageNet-1Kでは、FLatten Transformerにプルーニング法を適用し、いくつかのMACの精度が向上した。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:47:20 GMT)
Early Stopping Criteria for Training Generative Adversarial Networks in Biomedical Imaging [0.1] GAN(Generative Adversarial Networks)は、複雑なアーキテクチャをトレーニングするための計算コストが高い。
本研究は, バイオメディカル画像によるトレーニング問題を定量的に検出し, トレーニングを中止し, 計算コストを削減できる新しい早期停止基準を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:33:20 GMT)
New and improved bounds on the contextuality degree of multi-qubit configurations [0.1] 我々は,量子的文脈性を明らかにし,文脈性度を評価するアルゴリズムとCコードを提案する。
この論文はまずアルゴリズムとC符号を記述し、次に2から7の範囲のシンプレクティック極空間の多くの部分空間にその力を示す。
i) 文脈が次元 2 以上の部分空間である構成の非コンテキスト性、(ii) 次元 3 以上の負の部分空間の非存在性。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:26:48 GMT)
The rising costs of training frontier AI models [0.0] 最も計算集約的なモデルをトレーニングするための償却コストは、2016年以来、年間2.4倍のペースで急上昇している。
GPT-4やGeminiのような主要フロンティアモデルでは、最も重要な費用はAIアクセラレータチップとスタッフコストである。
開発コストの増加傾向が続くなら、2027年までに最大のトレーニングランは10億ドル以上になる。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:04:18 GMT)
The Structure and Dynamics of Knowledge Graphs, with Superficiality [0.0] 本稿では,事実を独立に生成する関係の重なり合いを制御する,超現実性の概念を紹介する。
これは知識グラフの構造と力学の最初のモデルである。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:32:44 GMT)
Weak-Form Inference for Hybrid Dynamical Systems in Ecology [0.0] 捕食や環境の脅威にさらされる種は、長い期間にわたって、人口ブームや乱獲の変動周期を示すのが一般的である。
生態学の分野で人気が高まっているモデリングパラダイムは、短期的な連続的なダイナミクスと長期的な離散的な更新を結合することである。
弱形式方程式学習を利用したデータ駆動型手法を開発し、人口動態のハイブリッドな支配方程式を抽出する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:03:27 GMT)
Unveiling the Potential of AI for Nanomaterial Morphology Prediction [0.0] 本研究は、データ可用性制約におけるナノ粒子の形態を予測するAIの可能性について検討する。
我々はまず,類似研究の2倍の大きさのマルチモーダルデータセットを作成した。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:16:07 GMT)
Unusual Diffusivity in Strongly Disordered Quantum Lattices: Random Dimer Model [0.0] 超伝導量子ビットを用いた量子格子の研究を行った。
我々の予測は、強い障害下での非コヒーレントホッピングの従来の理解に挑戦する。
これにより、光電気および量子情報技術のための混乱したシステムを最適化する新たな洞察が得られる。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:09:48 GMT)
Unravelling the Use of Digital Twins to Assist Decision- and Policy-Making in Smart Cities [0.0] 本稿では,公共セクターにおけるディジタルツインベースの意思決定支援フレームワークの今後の展開の基盤となる,体系的な文献レビューについて述べる。
この研究の最終目的は、スマートシティにおける意思決定プロセスを支援するために、コンテキスト固有のデジタルツインをモデル化することである。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:21:51 GMT)
Uncertainty Quantification for Deep Learning [0.0] ディープラーニングのための完全かつ統計的に一貫した不確実性定量化を提供する。
それぞれの不確実性源を体系的に定量化する方法を実証する。
また、すべてのエラーソースを初めて組み込んで組み合わせる、迅速かつ実用的な方法も導入しています。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:20:19 GMT)
Training on the Edge of Stability Is Caused by Layerwise Jacobian Alignment [0.0] 我々は指数的解法を用いて、安定性の端に入ることなくニューラルネットワークを訓練する。
実験により,ヘッセン行列の鋭さの増加は,ネットワークの層状ジャコビアン行列の整合性によって引き起こされることを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:37:06 GMT)
Training neural networks with structured noise improves classification and generalization [0.0] ノイズの多いトレーニングデータに構造を加えることで,アルゴリズムの性能が大幅に向上することを示す。
また,Hebbian Unlearning(ヘビアン・アンラーニング・ルール)と呼ばれる規則は,雑音が最大値である場合のトレーニング・ウィズ・ノイズ・アルゴリズムと一致することを証明した。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:01:45 GMT)
Towards a Fluid computer [0.0] 1991年、ムーア [20] は流体力学が計算を行うことができるかどうかという疑問を提起した。
2016年、Tao [25]は流体の流れを含む機械システムが普遍的なチューリングマシンをシミュレートできるかどうか尋ねた。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:41:36 GMT)
Toward Quantum Analogue Simulation of Many-Body Supersymmetry with Rydberg Atom Arrays [0.0] 量子アナログシミュレータにおけるウィッテン指数を推定する平均化法を提案する。
光学的ツイーザーアレイに閉じ込められたRydberg原子の研究によって動機付けられた、関連する超対称XXZスピンモデルを考える。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:58:15 GMT)
Topological signatures of a p-wave superconducting wire through light [0.0] 一次元の位相的p波超伝導体の$mathbbZ_2$トポロジカル指数が古典的ベクトルポテンシャルで駆動するときにどのように明らかにできるかを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:57:05 GMT)
To be or not to be, but where? [0.0] 伝統的なアプローチは、古典的な量子系と時空で局所化された量子系を関連付ける。
正準線型化量子重力はゲージ不変な局所代数の形成を阻止することによって、この枠組みを妨害する。
これは初期の宇宙の宇宙論、重力-絡み合いの実験をモデル化するための大きな障害を示し、量子重力の包括的理論に向けて重要な障害となる。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:22:39 GMT)
The Role of Bases in Quantum Optimal Control [0.0] 量子最適制御(QOC)は、パルスレベルで問題に取り組むことで量子技術の進歩を支援する。
応用基底の選択が最適化の品質に影響を及ぼすかどうかを問うため、基底関数の観点から異なるパラメトリを考察する。
問題依存に基づく基本選択はQOC効率に影響を及ぼす要因であり、そのアプローチに対するアドバイスを提供すると結論付けている。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:01:54 GMT)
The EarlyBird Gets the WORM: Heuristically Accelerating EarlyBird Convergence [0.0] Early Bird仮説は、畳み込みニューラルネットワークで当選した宝くじを見つけるための効率的なアルゴリズムを提案する。
WORMは, 静的群を利用して勾配を計算し, モデルが他のニューロンに頼らざるを得ない手法である。
実験の結果、WORMはより高速なチケット識別トレーニングを実現し、計算オーバーヘッドの増大にもかかわらずFLOPを少なくすることがわかった。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:13:02 GMT)
Systematic Solutions to Login and Authentication Security Problems: A Dual-Password Login-Authentication Mechanism [0.0] 認証盗難とリモート攻撃は、ユーザー認証機構に対する最も深刻な脅威である。
ユーザの選択した秘密のログインパスワードを,認証不能なパスワードに変換する,デュアルパスワードのログイン認証機構を設計する。
ログインパスワードの認証可能な機能と認証パスワードのタイプ可能な機能は無効または無効にすることができ、クレデンシャル盗難やリモート攻撃を防止することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:45:35 GMT)
Statistical signatures of quantum contextuality [0.0] 量子コンテキスト性(Quantum contextuality)とは、異なる測定コンテキストで観測された統計が、システムの独立した現実によって説明できない状況を指す。
非文脈統計量の境界に反する5つの測定コンテキストの関係に基づく再構成手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:43:59 GMT)
Standards for Belief Representations in LLMs [0.0] 我々は、信念のように数えられるように記入する表現の妥当性を論じる。
理論的考察と実践的制約のバランスをとるための4つの基準を確立する。
提案する基準は,精度,コヒーレンス,均一性,使用性である。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:21:52 GMT)
Spiketrum: An FPGA-based Implementation of a Neuromorphic Cochlea [0.0] 本稿では,汎用スパイク符号化アルゴリズムであるSpketrumを活用するFPGAベースのニューロモルフィック・コクリーを提案する。
コチェリーモデルは、音波振動を生物学的に現実的な音波スパイク列車に変換するのに優れている。
音波形を超えて様々な感覚情報をエンコードする能力は、現在と将来のスパイクベースのインテリジェントコンピューティングシステムにとって有望な感覚入力として位置づけられている。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:31:13 GMT)
Spatial light mode analogues of generalized quantum coherent states [0.0] 光モードの空間的自由度を用いて、エルミートモードとラゲール・ガウスモードの量子コヒーレント状態の光学的アナログを構成する。
我々の光学アナログは、その振幅と位相分布に符号化された量子対の統計的性質を保存している。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:05:22 GMT)
SNeurodCNN: Structure-focused Neurodegeneration Convolutional Neural Network for Modelling and Classification of Alzheimer's Disease [0.0] 認知症の主要な形態であるアルツハイマー病(AD)は、世界的な課題となっている。
現在の臨床診断は、放射線技師の専門家による解釈に依存しており、これは人間の誤りを招きやすい。
本稿では,SNeurodCNNという新しい構造に着目した神経変性CNNアーキテクチャを含むディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 01:10:42 GMT)
RAG Does Not Work for Enterprises [0.0] Retrieval-Augmented Generation (RAG)は、知識検索を取り入れた大規模言語モデル出力の精度と妥当性を向上させる。
企業におけるRAGの実装は、データセキュリティ、正確性、スケーラビリティ、統合に関する課題を引き起こす。
本稿では、エンタープライズRAGのユニークな要件について検討し、現在のアプローチと限界を調査し、セマンティック検索、ハイブリッドクエリ、最適化された検索の潜在的な進歩について考察する。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:30:52 GMT)
Quantum-assisted Rendezvous on Graphs: Explicit Algorithms and Quantum Computer Simulations [0.0] 我々は,単純なグラフ上での一段階のランデブーゲームにおいて,ノイズの多い中間スケール量子(NISQ)プロセッサを用いて量子優位性について検討した。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:32:52 GMT)
Quantum control of a cat-qubit with bit-flip times exceeding ten seconds [0.0] ビットフリップ回数が10秒を超える猫量子ビットを実装した。
これは、以前のキャットキュービット実装よりも4桁の大幅な改善である。
この実験は、前例のないレベルで量子制御と固有のビットフリップ保護の互換性を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:12:23 GMT)
Quantum computation with hybrid parafermion-spin qubits [0.0] 量子ドットスピン量子ビットを$mathbbZ_2m$パラフェルミオン量子ビットに結合して形成したハイブリッド量子ビット上に作用する単一および2量子ビット量子ゲートの普遍的集合を提案する。
我々の定式化はフォックパラフェルミオンを利用し、ハイブリッドパラフェルミオン-スピン系の透明な処理を容易にする。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:50:46 GMT)
QuST: QuPath Extension for Integrative Whole Slide Image and Spatial Transcriptomics Analysis [0.0] 我々は、H&E WSIとST分析タスクのギャップを埋めるために設計されたQuPath拡張QuSTを紹介する。
本稿では,病の理解におけるDLベースのWSI分析とST分析の統合の重要性を強調した。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:08:09 GMT)
Psychological Antecedents to Emergence of Team Autonomy in Agile Scrum Teams [0.0] 本研究の目的は,ソフトウェア組織におけるアジャイルプロジェクトの成功につながるアジャイルチームの自律性の出現に,重要な心理的要因が与える影響を研究することである。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:53:46 GMT)
Predicting solvation free energies with an implicit solvent machine learning potential [0.0] 本稿では,小さな有機分子に対する暗黙の溶媒MLポテンシャルをパラメータ化するために,Solvation Free Energy Path Reweighting (ReSolv) フレームワークを導入する。
トップダウン(実験的な水和自由エネルギーデータ)とボトムアップ(真空中の分子の初期データ)の学習の組み合わせにより、ReSolvは明示的なバルク溶媒中の分子の難解なアブ初期データの必要性を回避した。
FreeSolvデータセットでは、ReSolvは平均的な実験の不確実性に近い平均的な絶対誤差を達成する。
論文参考訳(メタデータ) (Fri, 31 May 2024 20:28:08 GMT)
Practical Modelling with Bigraphs [0.0] グラフはグラフィカルフォーマットでの配置と接続関係を簡単に表現できる汎用的なモデリング形式である。
本稿では,バイグラフモデルの開発,実行,推論を行うための実践的かつ詳細なガイドを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 10:17:46 GMT)
Perceived Social Influence on Vaccination Decisions: A COVID-19 Case Study [0.0] 予防接種を受けた人口は、予防接種を受けていない人口よりも社会的サークルの影響を受けやすいことが判明した。
集団間の社会的影響と合意の明確な違いにもかかわらず、大多数の参加者は、決定においてすべての社会的グループから社会的影響を受けていないと認識した。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:59:50 GMT)
Optimizing EPR pulses for broadband excitation and refocusing [0.0] 我々は、ハーンエコー振幅を最大化するブロードバンドパルス形状を数値的に最適化する。
パルスはニューラルネットワーク(NN)、非線形振幅制限フーリエ級数(FS)、離散時系列(DT)としてパラメータ化される
論文参考訳(メタデータ) (Fri, 31 May 2024 15:41:19 GMT)
On the universality of $S_n$-equivariant $k$-body gates [0.0] 本稿では,QNNジェネレータにおける対称性と$k$-bodynessの相互作用が,その表現性に与える影響について検討する。
我々の結果は、同変QNNの能力と限界をよりよく理解するための一歩を踏み出した。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:04:30 GMT)
Non-hermitian topology and entanglement in an optomechanical superlattice [0.0] 空間的に変調された外部駆動と消散によって、機械的および光学的励起に対して位相的に非自明な状態が生じるオプティメカルセットアップを示す。
このような絡み合いは、非低温浴の存在に関して堅牢であることを示し、その絡み合いを実験的に観察するためのプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:58:38 GMT)
Nash states versus eigenstates for many-body quantum systems [0.0] ハミルトニアンのような観測可能な天体の固有状態は、量子力学において中心的な役割を果たす。
単一可観測体の固有状態の一般化として、複数の可観測体の「ナッシュ状態」を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:52:27 GMT)
Monte Carlo Tree Search Satellite Scheduling Under Cloud Cover Uncertainty [0.0] 本稿では,マルチサテライトコレクションスケジューリング問題(m-SatCSP)に対処する。
雲などの不確実な条件下での衛星群上のタスクスケジューリングを最適化することを目的としている。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:50:46 GMT)
Model Interpretation and Explainability: Towards Creating Transparency in Prediction Models [0.0] 説明可能なAI(XAI)には、モデル説明可能性と呼ばれる分析モデルがある。
クレジットカード会社からの融資のデータセットを分析し、4つの異なる予測手法を実行・比較し、現在の文献で最もよく知られた説明可能性手法をモデルトレーニングセットに適用し、特徴重要度(FI)を識別する(静的ケース)。
静的ケースと動的ケースのFI識別に矛盾が認められた。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:54:25 GMT)
Methods to Estimate Cryptic Sequence Complexity [0.0] 本稿では,デジタルゲノム内の暗号適応部位を定量化するために,ノックアウトに基づく3つのアッセイ手法を提案する。
本研究では, サイト適合性を考慮した簡易ゲノムモデルを用いて, これらの手法の初期試験を行った。
論文参考訳(メタデータ) (Fri, 31 May 2024 13:59:27 GMT)
Magnetically generated spin-orbit coupling for ultracold atoms with slowly varying periodic driving [0.0] 振動する磁場のオンオフを適切に行うことにより、磁気誘導型SOCに生じるマイクロモーションをバイパスする方法を示す。
システムの正確なダイナミクスを考察し、全体的なダイナミクスがマイクロモーションに免疫できることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:42:09 GMT)
Leveraging Large Language Models for Entity Matching [0.0] 本稿では,大規模言語モデル(LLM)のエンティティマッチング(EM)への応用について検討する。
LLMは、高度なセマンティック理解とコンテキスト能力を活用して、EMにトランスフォーメーションポテンシャルを提供する。
我々は,弱い監督と教師なしのアプローチをEMに適用する関連研究をレビューし,LLMがこれらの手法をどのように拡張できるかを強調した。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:22:07 GMT)
Learning Exemplar Representations in Single-Trial EEG Category Decoding [0.0] 一つのオブジェクトに関する試行がトレーニングセットとテストセットの両方に現れると、ほとんどすべての分類アルゴリズムがカテゴリラベルのみを与えられたオブジェクトの表現を学習できることを示す。
我々は、単純な分類アルゴリズムと高度なディープラーニングモデルの両方の能力を示し、カテゴリラベルのみを与えられたオブジェクト表現を学習する。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:51:10 GMT)
Lattice-induced wavefunction effects on trapped superfluids [0.0] 相関粒子間の局所的相互作用に対するブロッホ波動関数効果を記述するゲージ独立テンソルを提案する。
光学格子中の超低温ボソンに対する有効流体力学理論を導出する。
我々の発見は、現代のバンド理論と量子多体物理学のつながりを前進させる。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:38:02 GMT)
Joint Embeddings for Graph Instruction Tuning [0.0] 本研究は,Large Language Models (LLMs) におけるグラフモダリティの統合について検討する。
グラフの埋め込みによって基礎となるLLMを強化し、それを理解できるように訓練するディープラーニングモデルを作ることを目標としている。
このアプローチは、グラフからテキストへのアプローチよりもはるかに優れており、大きなグラフであっても一貫性が保たれている。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:26:47 GMT)
Investigating Calibration and Corruption Robustness of Post-hoc Pruned Perception CNNs: An Image Classification Benchmark Study [0.0] 畳み込みニューラルネットワーク(CNN)は多くのコンピュータビジョンタスクで最先端のパフォーマンスを達成した。
高い計算とストレージの要求は、リソースに制約のある環境への展開を妨げる。
モデルプルーニングは、モデルのサイズを小さくし、優れたパフォーマンスを維持しながら、これらの制限を満たすのに役立つ。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:52:49 GMT)
Introducing sgboost: A Practical Guide and Implementation of sparse-group boosting in R [0.0] 本稿では,高次元データモデリングのためのスパースグループブースティングを実装したSgboostパッケージをRで紹介する。
このパッケージは、個人およびグループベースラーナーの自由度に基づく正規化技術を使用する。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:29:51 GMT)
Interferometry of quantum correlation functions to access quasiprobability distribution of work [0.0] 我々は、カークウッド・ディラック準確率分布の再構成に補助的なシステムによって支援された干渉計方式を用いる。
本研究は,量子熱力学の文脈における作業準確率分布の物理的意義を明らかにするものである。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:32:02 GMT)
Incommensurable matter-wave jets in quasi-1D geometry [0.0] 準一次元幾何学における高次ジェットの形成とそれに対応する非可測密度波について検討する。
本研究では, 幅広い変調振幅と周波数に対して, 実験的および理論的にジェット生成の過程について検討する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:26:52 GMT)
How Random is Random? Evaluating the Randomness and Humaness of LLMs' Coin Flips [0.0] GPT 4 と Llama 3 は、この文脈でテストしたほとんど全ての人間のバイアスを増悪するが、GPT 3.5 はよりランダムな振る舞いを示す。
ランダム性やヒューマネスのこの二分法は、LLMの基本的問題として提案され、どちらの行動も異なる状況で有用である可能性がある。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:56:07 GMT)
Good Modelling Software Practices [0.0] 私たちは、モデルライフサイクルの実装の初期段階において、単純で簡単なプラクティスのリストをフォローする習慣を主張します。
本研究は, 海洋生物群集の事例として, 海洋生物群集の例を示したものである。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:43:59 GMT)
Formal Verification of Ecosystem Restoration Requirements using UML and Alloy [0.0] 国連は、現在の10年間(2021-2030年)を「生態系再生に関する国連の10年」と宣言した。
本稿では,モデル駆動工学の観点から形式的手法を用いた生態系要求モデリングのための厳密なアプローチを提案する。
このアプローチの概念とアクティビティは、修復されたCosta Ricanエコシステムの現実的な実行例であるCRESTOで説明されています。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:25:40 GMT)
Fast characterization of multiplexed single-electron pumps with machine learning [0.0] 単一電子ポンプデバイスを現在の量子化方式にチューニングするための機械学習に基づく効率的な自動化フレームワークを提案する。
GaAs/AlGaAsマルチプレクサアレイに配列された28個のデバイスを特徴付けることで,フレームワークのロバスト性を示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:44:33 GMT)
Explaining Explanations in Probabilistic Logic Programming [0.0] ほとんどのアプローチでは、システムはブラックボックスと見なされており、適切な説明を生成することは困難である。
確率論的論理プログラミング(PLP)は、知識表現のための論理プログラミングと不確実性をモデル化する確率を組み合わせたパラダイムである。
本稿では,証明に「選択表現」をラベル付けした PLP の新しいクエリ駆動推論機構の定義に基づく説明法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:45:22 GMT)
Exact time-evolving scattering states in open quantum-dot systems with an interaction: Discovery of time-evolving resonant states [0.0] クーロン相互作用を持つオープンダブル量子ドット系の時間進化多電子状態について検討する。
量子ドット上の局在電子の初期状態について、我々は新しいタイプの正確な時間進化状態を見つけ、これを時間進化共鳴状態と呼ぶ。
論文参考訳(メタデータ) (Fri, 31 May 2024 16:32:27 GMT)
Exact real time dynamics with free fermions in disguise [0.0] 我々は、ジョルダン・ウィグナー変換とその一般化とは異なる、隠れた自由フェルミオン構造を持つ量子スピン鎖を考える。
量子コンピュータ上に実装可能な量子回路を構築する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:23:20 GMT)
Entanglement witness and nonlocality in confidence of measurement from multipartite quantum state discrimination [0.0] 局所的な操作や古典的コミュニケーションでは達成できない世界的最大信頼度は、絡み合いの証人の存在に強く依存していることを示す。
我々は、非局所的な最大信頼度を持つ量子状態アンサンブルを構築するために、絡み合いの証人の観点から方法を確立する。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:54:55 GMT)
Enhancing Vision Models for Text-Heavy Content Understanding and Interaction [0.0] 画像エンコーディングのためのCLIPとMassive Text Embedding Benchmarkのモデルを統合したビジュアルチャットアプリケーションを構築した。
プロジェクトの目的は、複雑な視覚的テキストデータ相互接続データの理解において、先進視覚モデルの能力を高め、強化することである。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:17:47 GMT)
Don't Buy it! Reassessing the Ad Understanding Abilities of Contrastive Multimodal Models [0.0] 従来の研究では、広告説明検索タスクにおいて、対照的な視覚・言語モデルの印象的なゼロショット精度が報告されていた。
ここでは, コントラストのあるVLMが, 接地を利用して解けることを示す。
本稿では, 対向的根拠を持つ新たな評価テストセットを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:31:46 GMT)
Distributed agency in second language learning and teaching through generative AI [0.0] ChatGPTは、テキストまたは音声形式のチャットを通じて非公式な第二言語プラクティスを提供することができる。
インストラクタはAIを使って、さまざまなメディアで学習と評価材料を構築することができる。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:17:17 GMT)
Cyclic image generation using chaotic dynamics [0.0] 訓練されたジェネレータの繰り返し適用は、異なるカテゴリ間で遷移する画像のシーケンスを生成する。
生成された画像シーケンスは、元のトレーニングデータセットと比較して画像空間のより限られた領域を占める。
その結果, 深部生成モデルによって定義される画像空間のカオス力学が生成した画像の多様性に寄与することが示唆された。
論文参考訳(メタデータ) (Fri, 31 May 2024 09:14:36 GMT)
CycleFormer : TSP Solver Based on Language Modeling [0.0] 本稿では,CycleFormerと呼ばれるトラベリングセールスマン問題(TSP)に対するトランスフォーマーモデルを提案する。
限定的で静的な典型的な言語モデルのトークンセットとは異なり、TSPのトークンセット(ノード)は無制限で動的である。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:42:52 GMT)
Coupling conduction-band valleys in SiGe heterostructures via shear strain and Ge concentration oscillations [0.0] エンジニアリング伝導バンド・バレー結合は、Siベースのスピン量子ビットにとって鍵となる課題である。
近年の研究では、谷のカップリングを強化する最も信頼性の高い方法は、量子井戸にGe濃度の振動を加えることである。
本稿では,2次結合プロセスにより長波長構造において短波長発振の主な利点が得られることを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 17:17:38 GMT)
Correlated Dynamics in Marketing Sensitivities [0.0] 階層的動的因子モデルを用いて相関ダイナミクスをキャプチャするフレームワークを提案する。
驚くほどのダイナミックな不均一性は、わずかにグローバルな傾向によって説明できる。
また、消費者の感性がカテゴリーによってどのように進化していくかというパターンを特徴付けます。
論文参考訳(メタデータ) (Fri, 31 May 2024 02:00:12 GMT)
Continuous momentum state lasing and cavity frequency-pinning with laser-cooled strontium atoms [0.0] レーザー冷却した8,8$Sr原子をリングキャビティに装填し, 長時間連続洗浄する様子を報告する。
空洞周波数変化に対する溶出周波数の感度は、原子損失機構により120倍に抑制される。
この研究は連続キャビティQED量子シミュレーション実験と連続超放射光レーザーの道を開く。
論文参考訳(メタデータ) (Fri, 31 May 2024 15:51:14 GMT)
Conditioning GAN Without Training Dataset [0.0] ディープラーニングアルゴリズムは、数十万以上のサイズのトレーニング可能なパラメータを多数持っている。
GANは、互いに競合する2つのディープラーニングネットワークを使用する生成ニューラルネットワークである。
目的は、"未条件の事前訓練されたジェネレータネットワークと事前訓練された分類器があれば、トレーニングデータセットに頼らずに条件付きジェネレータを開発することは可能か?
論文参考訳(メタデータ) (Fri, 31 May 2024 08:31:26 GMT)
Comparison of Point Process Learning and its special case Takacs-Fiksel estimation [0.0] 本稿では,Takacs-Fiksel推定におけるポイントプロセス学習(PPL)について検討する。
クロスバリデーション体制を離脱する傾向にある場合,特定の損失を有するPLは,タカカス・フィッシャー推定に機能的に低下することを示した。
論文参考訳(メタデータ) (Fri, 31 May 2024 07:12:01 GMT)
Comparison of Access Control Approaches for Graph-Structured Data [0.0] グラフ構造化データは、その複雑な構造のために高度な、柔軟な、きめ細かいアクセス制御を必要とする。
いくつかの研究は、プロパティグラフ構造データ保護、きめ細かいアクセス制御、そしてそれらの概念の実現可能性と適用性を証明することに焦点を当てている。
我々は,近年のデータベースモデルに加えて,さまざまなデータベースモデルの認証とアクセス制御に関する体系的な文献レビューから,論文を選択する。
論文参考訳(メタデータ) (Fri, 31 May 2024 12:31:05 GMT)
Capturing Climatic Variability: Using Deep Learning for Stochastic Downscaling [0.0] 気候変動に適応するには、正確な局地的な気候情報が必要である。
ダウンスケーリング中の変動のキャプチャは、不確実性を推定し、極端な事象を特徴づけるのに不可欠である。
本稿では,GANのキャリブレーションを3つの方法で改善する手法を提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 03:04:10 GMT)
CF Recommender System Based on Ontology and Nonnegative Matrix Factorization (NMF) [0.0] この作業は、レコメンダシステムのデータ空間と精度の問題に対処する。
実装されたアプローチは、CF提案の空白度を効果的に削減し、その正確性を改善し、より関連性の高い項目を推奨する。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:50:53 GMT)
An iterated learning model of language change that mixes supervised and unsupervised learning [0.0] 反復学習モデルは、教師から生徒に言語が伝達される言語変化のエージェントベースモデルである。
従来のモデルは、人工ニューラルネットワークデコーダを使用して、信号から意味へのエージェントのマッピングを実装していた。
ここでは、デコーダとエンコーダの両方がニューラルネットワークであり、教師なし学習を通じて個別に訓練され、教師なし学習によってオートエンコーダの形で訓練される新しいモデルを示す。
論文参考訳(メタデータ) (Fri, 31 May 2024 14:14:01 GMT)
An NLP Crosswalk Between the Common Core State Standards and NAEP Item Specifications [0.0] 項目仕様とコンテンツ標準の横断歩道を確立する際に,NLPをベースとした手法について述べる。
この手順は、数学の共通中核状態標準(Common Core State Standards)を、2026年の国家教育進歩評価(National Assessment of Educational Progress)の項目仕様に適合させるために用いられる。
論文参考訳(メタデータ) (Fri, 31 May 2024 21:30:44 GMT)
ADEP: A Novel Approach Based on Discriminator-Enhanced Encoder-Decoder Architecture for Accurate Prediction of Adverse Effects in Polypharmacy [0.0] 本稿では,識別器とエンコーダデコーダモデルを組み合わせた新しい手法であるADEPを紹介する。
ADEPは多薬効の悪影響を予測するために、複数の分類方法を含む3部モデルを採用している。
論文参考訳(メタデータ) (Fri, 31 May 2024 18:20:17 GMT)
A Survey of Deep Learning Audio Generation Methods [0.0] 本稿では、音声生成のためのディープラーニングモデル開発における3つの異なる側面において使用される典型的な手法について概説する。
まず最初に,基本的音声波形から始まる音声表現について解説する。
そして、人間の聴覚特性に重点を置いて周波数領域に進み、最終的に比較的最近の展開を導入する。
論文参考訳(メタデータ) (Fri, 31 May 2024 19:20:27 GMT)
A Novel Review of Stability Techniques for Improved Privacy-Preserving Machine Learning [0.0] 機械学習モデルは、最近、サイズと人気が大幅に増加した。
データ漏洩に対処するため、さまざまなプライバシーフレームワークは、機械学習モデルの出力がトレーニングデータを損なわないことを保証している。
本稿では, 機械学習における民営化の悪影響を最小限に抑えるため, 安定性向上のための様々な手法について検討する。
論文参考訳(メタデータ) (Fri, 31 May 2024 00:30:29 GMT)
A Lightweight Method for Defending Against UAF Vulnerabilities [0.0] UAF(Use-After-Free)脆弱性は、ソフトウェアセキュリティに深刻な脅威をもたらす。
ダングリングポインタを排除してUAFの脆弱性を防御する既存の方法は、プログラムの実行を中断する必要がある。
この欠点を克服するために、LightDEと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 31 May 2024 08:47:24 GMT)
A Comparative Study of CNN, ResNet, and Vision Transformers for Multi-Classification of Chest Diseases [0.0] ビジョントランスフォーマー(ViT)は、そのスケーラビリティと大量のデータを処理する能力のため、強力なツールである。
NIH Chest X-rayデータセットを用いて、ImageNetで事前トレーニングされたモデルと、スクラッチからトレーニングされたモデルである2種類のViTモデルを微調整した。
本研究は,14の異なる疾患の多ラベル分類において,これらのモデルの性能を評価するものである。
論文参考訳(メタデータ) (Fri, 31 May 2024 23:56:42 GMT)
"Forgetting" in Machine Learning and Beyond: A Survey [0.0] この調査は、さまざまな機械学習サブフィールドにまたがる、忘れることの利点とその応用に焦点を当てる。
本稿では,機械学習モデルへの忘れるメカニズムの統合に関する現状の課題,今後の方向性,倫理的考察について論じる。
論文参考訳(メタデータ) (Fri, 31 May 2024 05:10:30 GMT)