Latent Action Pretraining from Videos [156.9] 一般行動モデル(LAPA)のための潜在行動事前訓練について紹介する。
LAPA(英: LAPA)は、VLA(Vision-Language-Action)モデルに接地型ロボットアクションラベルを含まない教師なしの訓練方法である。
本稿では,ロボットアクションラベルを持たないインターネット規模のビデオから学習する手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:28:09 GMT)
LoRA-Pro: Are Low-Rank Adapters Properly Optimized? [121.1] LoRAとしても知られる低ランク適応は、基礎モデルのパラメータ効率の細かい調整のための顕著な手法として登場した。
計算効率にもかかわらず、LoRAは完全な微調整に比べて性能が劣っている。
低ランク行列の勾配を戦略的に調整することでLoRAの性能を向上させる手法であるLoRA-Proを導入する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:58:24 GMT)
PSVMA+: Exploring Multi-granularity Semantic-visual Adaption for Generalized Zero-shot Learning [116.3] 一般化ゼロショット学習(GZSL)は、目に見えない領域の知識を用いて、見えないものを識別する試みである。
GZSLは、属性の多様性とインスタンスの多様性により、視覚的セマンティックな対応が不十分である。
本稿では,不整合の解消に十分な視覚要素を収集できる多粒性プログレッシブ・セマンティック・視覚適応ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:49:33 GMT)
ActionAtlas: A VideoQA Benchmark for Domain-specialized Action Recognition [111.3] ActionAtlasは、様々なスポーツのショートビデオを含むビデオ質問応答ベンチマークである。
このデータセットには、56のスポーツで580のユニークなアクションを示す934の動画が含まれており、合計1896のアクションが選択できる。
我々は、このベンチマークでオープンでプロプライエタリな基礎モデルを評価し、最高のモデルであるGPT-4oが45.52%の精度を達成することを発見した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:59:32 GMT)
ActionAtlas: A VideoQA Benchmark for Domain-specialized Action Recognition [111.3] ActionAtlasは、様々なスポーツのショートビデオを含むビデオ質問応答ベンチマークである。
このデータセットには、56のスポーツで580のユニークなアクションを示す934の動画が含まれており、合計1896のアクションが選択できる。
我々は、このベンチマークでオープンでプロプライエタリな基礎モデルを評価し、最高のモデルであるGPT-4oが45.52%の精度を達成することを発見した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:59:32 GMT)
ActionAtlas: A VideoQA Benchmark for Domain-specialized Action Recognition [111.3] ActionAtlasは、様々なスポーツのショートビデオを含むビデオ質問応答ベンチマークである。
このデータセットには、56のスポーツで580のユニークなアクションを示す934の動画が含まれており、合計1896のアクションが選択できる。
我々は、このベンチマークでオープンでプロプライエタリな基礎モデルを評価し、最高のモデルであるGPT-4oが45.52%の精度を達成することを発見した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:59:32 GMT)
Curriculum-scheduled Knowledge Distillation from Multiple Pre-trained Teachers for Multi-domain Sequential Recommendation [102.9] 現実世界のシステムにおいて、様々な事前学習されたレコメンデーションモデルを効率的に利用する方法について検討することが不可欠である。
多分野連続的な推薦のために,複数の事前学習教師によるカリキュラムスケジューリング型知識蒸留を提案する。
CKD-MDSRは、複数の教師モデルとして異なるPRMの利点を最大限に活用し、小学生推薦モデルを強化している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:37:40 GMT)
Analysis and Benchmarking of Extending Blind Face Image Restoration to Videos [99.4] まず,実世界の低品質顔画像ベンチマーク(RFV-LQ)を導入し,画像に基づく顔復元アルゴリズムの評価を行った。
次に、失明顔画像復元アルゴリズムを劣化顔ビデオに拡張する際の利点と課題を網羅的に分析する。
分析では、主に顔成分の顕著なジッタとフレーム間のノイズシェープの2つの側面に分類する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:53:25 GMT)
Eyes Closed, Safety On: Protecting Multimodal LLMs via Image-to-Text Transformation [98.0] 我々は,MLLMの本来の安全意識を生かしたトレーニング不要な保護手法であるECSO(Eyes Closed, Safety On)を提案する。
ECSOは、安全でない画像をテキストに適応的に変換することで、より安全な応答を生成し、予め整列されたLCMの本質的な安全性メカニズムを活性化する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:55:36 GMT)
Towards Understanding Why FixMatch Generalizes Better Than Supervised Learning [97.2] 半教師付き学習(SSL)は、教師付き学習(SL)よりも大幅に一般化されている。
ディープニューラルネットワーク(DNN)に適用したFixMatchライクSSLで観測されたテスト精度向上のための最初の理論的正当性を示す。
分析フレームワークはFlexMatch、FreeMatch、Dash、SoftMatchといった他のFixMatchライクなSSLメソッドにも適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:47:57 GMT)
Exploring Invariance in Images through One-way Wave Equations [96.9] 本稿では,画像画像上の不等式が一方向の波動方程式と潜時速度の組を共有していることを実証的に明らかにする。
本稿では,各画像が対応する初期条件に符号化される直感的なエンコーダ・デコーダ・フレームワークを用いて実演する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:26:58 GMT)
LongHalQA: Long-Context Hallucination Evaluation for MultiModal Large Language Models [96.6] LongHalQA (LongHalQA) は、6Kの長い複雑な幻覚テキストからなるLLMフリー幻覚ベンチマークである。
LongHalQA は GPT4V の生成した幻覚データによって特徴付けられる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:10:26 GMT)
LongHalQA: Long-Context Hallucination Evaluation for MultiModal Large Language Models [96.6] LongHalQA (LongHalQA) は、6Kの長い複雑な幻覚テキストからなるLLMフリー幻覚ベンチマークである。
LongHalQA は GPT4V の生成した幻覚データによって特徴付けられる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:10:26 GMT)
Faster Diffusion: Rethinking the Role of the Encoder for Diffusion Model Inference [95.4] 本稿では,UNetエンコーダについて検討し,エンコーダの特徴を実証的に分析する。
エンコーダの特徴は最小限に変化するが,デコーダの特徴は時間段階によって大きく異なる。
我々は、テキスト・ツー・ビデオ、パーソナライズド・ジェネレーション、参照誘導ジェネレーションといった他のタスクに対するアプローチを検証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:11:11 GMT)
MonoMAE: Enhancing Monocular 3D Detection through Depth-Aware Masked Autoencoders [93.9] Masked Autoencodersにインスパイアされたモノクラー3D検出器MonoMAEを設計する。
MonoMAEは2つの新しい設計で構成されている。第一に、非閉塞オブジェクトクエリの特定の部分を選択的にマスキングするディープ・アウェア・マスクである。
2つ目は軽量なクエリ補完で、ディープ・アウェア・マスキングと連携して、マスキングされたオブジェクトクエリの再構築と完了を学習する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:57:42 GMT)
KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities [93.7] テキスト・画像生成モデルにおける実体の忠実度に関する系統的研究を行う。
我々はランドマークの建物、航空機、植物、動物など、幅広い現実世界の視覚的実体を生成する能力に焦点をあてる。
その結果、最も高度なテキスト・画像モデルでさえ、正確な視覚的詳細を持つエンティティを生成できないことが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:50:37 GMT)
When ControlNet Meets Inexplicit Masks: A Case Study of ControlNet on its Contour-following Ability [93.2] ControlNetは、ユーザーが提供するマスクの正確な輪郭と密に一致したコンテンツを作成するのに長けている。
これらのマスクがノイズを含む場合、非専門家で頻繁に発生するため、出力には不要なアーティファクトが含まれる。
筆者らはまず, 深部分析により, 種々の劣化レベルを有する非説明マスクの影響を抑える上で重要な役割について述べる。
劣化推定器と形状優先変調ブロックからなる高度な形状認識制御ネットを考案した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:42:21 GMT)
VIA: Unified Spatiotemporal Video Adaptation Framework for Global and Local Video Editing [91.6] グローバルおよびローカルなビデオ編集のためのVIA統合ビデオ適応フレームワークについて紹介する。
我々は,VIAが一貫した長いビデオ編集を数分で達成できることを示し,高度なビデオ編集タスクの可能性を秘めている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:31:56 GMT)
Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence [90.9] 我々は,Swarmインテリジェンスを介してLLMを適応させる協調探索アルゴリズムであるModel Swarmsを提案する。
モデルSwarmsは、LLMの専門家を1つのタスク、マルチタスクドメイン、報酬モデル、そして多様な人間の興味に柔軟に適用できることを示します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:59:17 GMT)
Agent Planning with World Knowledge Model [88.5] エージェント計画を容易にするためにパラメトリック世界知識モデル(WKM)を導入する。
我々はWKMを開発し,グローバルプランニングと動的状態知識を指導し,地域プランニングを支援する。
本手法は, 各種の強靭なベースラインと比較して, 優れた性能が得られる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:58:17 GMT)
Fast Encoding and Decoding for Implicit Video Representation [88.4] 本稿では,高速エンコーディングのためのトランスフォーマーベースのハイパーネットワークであるNeRV-Encと,効率的なビデオローディングのための並列デコーダであるNeRV-Decを紹介する。
NeRV-Encは勾配ベースの最適化をなくすことで$mathbf104times$の素晴らしいスピードアップを実現している。
NeRV-Decはビデオデコーディングを単純化し、ロード速度が$mathbf11times$で従来のコーデックよりも高速である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:18:39 GMT)
Fast Encoding and Decoding for Implicit Video Representation [88.4] 本稿では,高速エンコーディングのためのトランスフォーマーベースのハイパーネットワークであるNeRV-Encと,効率的なビデオローディングのための並列デコーダであるNeRV-Decを紹介する。
NeRV-Encは勾配ベースの最適化をなくすことで$mathbf104times$の素晴らしいスピードアップを実現している。
NeRV-Decはビデオデコーディングを単純化し、ロード速度が$mathbf11times$で従来のコーデックよりも高速である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:18:39 GMT)
LongLaMP: A Benchmark for Personalized Long-form Text Generation [87.4] 長文言語モデルパーソナライゼーション(LongLaMP)ベンチマークを開発した。
LongLaMPはパーソナライズされた長文生成のための包括的で多様な評価フレームワークを提供する。
その結果、多種多様な長文生成タスクにおけるパーソナライズの重要性が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:24:47 GMT)
LongLaMP: A Benchmark for Personalized Long-form Text Generation [86.2] 長文言語モデルパーソナライゼーション(LongLaMP)ベンチマークを開発した。
LongLaMPはパーソナライズされた長文生成のための包括的で多様な評価フレームワークを提供する。
その結果、多種多様な長文生成タスクにおけるパーソナライズの重要性が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:24:47 GMT)
Learning from Imperfect Data: Towards Efficient Knowledge Distillation of Autoregressive Language Models for Text-to-SQL [84.0] 知識蒸留(KD)は、より大規模な教師モデルをより小さな学生モデルに蒸留することを目的とした一般的な手法である。
我々は,不完全なデータ,すなわちKIDを用いてKDを改善することを提案する。
KIDは、すべてのモデルタイプとサイズで一貫した、重要なパフォーマンス向上を達成するだけでなく、トレーニング効率を効果的に向上する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:51:00 GMT)
FiT: Flexible Vision Transformer for Diffusion Model [81.9] 本稿では,非制限解像度とアスペクト比で画像を生成するためのトランスフォーマーアーキテクチャを提案する。
静的解像度グリッドとしてイメージを認識する従来の方法とは異なり、FiTは動的サイズのトークンのシーケンスとしてイメージを概念化している。
総合的な実験は、幅広い解像度でFiTの異常な性能を実証している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:51:00 GMT)
Speculative Knowledge Distillation: Bridging the Teacher-Student Gap Through Interleaved Sampling [81.0] 本研究では,高品質なトレーニングデータを生成するために,投機的知識蒸留(SKD)を導入する。
SKDでは、学生はトークンを提案し、教師はそれ自身の分布に基づいて低いランクのトークンを置き換える。
翻訳,要約,数学,指示文など,各種テキスト生成タスクにおけるSKDの評価を行った。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:51:25 GMT)
Communication-Control Codesign for Large-Scale Wireless Networked Control Systems [80.3] 無線ネットワーク制御システム(Wireless Networked Control Systems, WNCS)は、ドローン群や自律ロボットなどのアプリケーションにおいて柔軟な制御を可能にする産業用4.0に必須である。
本稿では,マルチ状態マルコフブロックフェーディングチャネル上で限られた無線リソースを共有するセンサやアクチュエータを用いて,複数の制御ループ間の相関ダイナミクスを捕捉する実用的WNCSモデルを提案する。
本研究では,ハイブリッドな動作空間を効率的に処理し,通信制御の相関関係を捉え,疎域変数や浮動小数点制御の入力に拘わらず堅牢なトレーニングを確実にするDeep Reinforcement Learning (DRL)アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:28:21 GMT)
Towards Realistic Evaluation of Commit Message Generation by Matching Online and Offline Settings [77.2] コミットメッセージ生成は、ソフトウェアエンジニアリングにおいて重要なタスクであり、正しく評価することが難しい。
オンラインメトリック - VCSに生成されたメッセージをコミットする前にユーザが導入する編集回数 - を使用して、オフライン実験用のメトリクスを選択します。
その結果,編集距離が最も高い相関を示すのに対し,BLEUやMETEORなどの類似度は低い相関を示すことがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:32:07 GMT)
TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models [75.4] TemporalBenchは、ビデオの微細な時間的理解を評価するための新しいベンチマークだ。
ビデオクリップの時間的ダイナミクスを詳述した2Kの高品質な人間のアノテーションから派生した10KのビデオQ&Aペアで構成されている。
GPT-4oのような最先端のモデルは、TemporalBench上で38.5%の質問応答精度しか達成していない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:55:46 GMT)
TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models [75.4] TemporalBenchは、ビデオの微細な時間的理解を評価するための新しいベンチマークだ。
ビデオクリップの時間的ダイナミクスを詳述した2Kの高品質な人間のアノテーションから派生した10KのビデオQ&Aペアで構成されている。
GPT-4oのような最先端のモデルは、TemporalBench上で38.5%の質問応答精度しか達成していない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:55:46 GMT)
MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes [74.8] トーキングフェース生成(TFG)は、ターゲットアイデンティティーの顔をアニメーション化し、リアルなトーキングビデオを作成することを目的としている。
MimicTalkは、個人別TFGの効率性と堅牢性を改善するために、NeRFベースの個人非依存のジェネリックモデルから豊富な知識を活用する。
私たちのMimicTalkは、ビデオの品質、効率、表現性に関して、これまでのベースラインを超えていることが実験によって示されています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:01:57 GMT)
MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes [74.8] トーキングフェース生成(TFG)は、ターゲットアイデンティティーの顔をアニメーション化し、リアルなトーキングビデオを作成することを目的としている。
MimicTalkは、個人別TFGの効率性と堅牢性を改善するために、NeRFベースの個人非依存のジェネリックモデルから豊富な知識を活用する。
私たちのMimicTalkは、ビデオの品質、効率、表現性に関して、これまでのベースラインを超えていることが実験によって示されています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:01:57 GMT)
MTL-LoRA: Low-Rank Adaptation for Multi-Task Learning [74.4] マルチタスク学習能力を大幅に向上させながら、低ランク適応の利点を保ちながら、MTL-LoRAを提案する。
MTL-LoRAは、タスク固有の情報を識別するタスク適応パラメータを追加することでLoRAを強化する。
このアプローチにより、汎用コーパス上で事前訓練された大規模言語モデル(LLM)が、限られた数のトレーニング可能なパラメータで異なるターゲットタスクドメインに適応できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:48:55 GMT)
Power Hungry Processing: Watts Driving the Cost of AI Deployment? [74.2] 生成された多目的AIシステムは、機械学習(ML)モデルをテクノロジに構築するための統一的なアプローチを約束する。
この「一般性」の野心は、これらのシステムが必要とするエネルギー量と放出する炭素量を考えると、環境に急激なコストがかかる。
これらのモデルを用いて,代表的なベンチマークデータセット上で1,000の推論を行うのに必要なエネルギーと炭素の量として,デプロイメントコストを測定した。
本稿は、多目的MLシステムの展開動向に関する議論から締めくくり、エネルギーと排出の面でコストの増大に対して、その実用性はより意図的に重み付けされるべきである、と警告する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:54:08 GMT)
MTL-LoRA: Low-Rank Adaptation for Multi-Task Learning [74.2] マルチタスク学習能力を大幅に向上させながら、低ランク適応の利点を保ちながら、MTL-LoRAを提案する。
MTL-LoRAは、タスク固有の情報を識別するタスク適応パラメータを追加することでLoRAを強化する。
このアプローチにより、汎用コーパス上で事前訓練された大規模言語モデル(LLM)が、限られた数のトレーニング可能なパラメータで異なるターゲットタスクドメインに適応できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:48:55 GMT)
A3D: Does Diffusion Dream about 3D Alignment? [74.0] 幾何学的アライメントの観点からテキスト駆動型3D生成の問題に取り組む。
オブジェクトを共通の潜在空間に埋め込み、これらのオブジェクト間の連続的な遷移を最適化することを提案する。
3D編集やオブジェクトのハイブリッド化など,オブジェクト間のアライメントの恩恵を受けるための現実的なシナリオをいくつか提供します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:19:43 GMT)
MCGS: Multiview Consistency Enhancement for Sparse-View 3D Gaussian Radiance Fields [73.5] 3Dガウシアンによって表現される放射場は、高いトレーニング効率と高速レンダリングの両方を提供する、新しいビューの合成に優れている。
既存の手法では、高密度推定ネットワークからの奥行き先を組み込むことが多いが、入力画像に固有の多視点一貫性を見落としている。
本稿では,3次元ガウス・スプレイティング(MCGS)に基づくビュー・フレームワークを提案し,スパークス・インプット・ビューからシーンを再構築する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:39:05 GMT)
Deciphering the Chaos: Enhancing Jailbreak Attacks via Adversarial Prompt Translation [71.9] そこで本稿では, ガーブレッドの逆数プロンプトを, 一貫性のある, 可読性のある自然言語の逆数プロンプトに"翻訳"する手法を提案する。
また、jailbreakプロンプトの効果的な設計を発見し、jailbreak攻撃の理解を深めるための新しいアプローチも提供する。
本稿では,AdvBench上でのLlama-2-Chatモデルに対する攻撃成功率は90%以上である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:31:04 GMT)
It's Just Another Day: Unique Video Captioning by Discriminative Prompting [71.0] 同じキャプションを持つ複数のクリップが与えられた場合、各クリップに対して、そのキャプションをユニークに識別する新しいキャプションを生成する。
CDPが生成したキャプションは、エゴセントリックなビデオでは15%改善し、タイムループ映画では10%改善した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:41:49 GMT)
LoRTA: Low Rank Tensor Adaptation of Large Language Models [70.3] Low Rank Adaptation (LoRA) は、下流タスクのための大規模な事前学習モデルに効果的に適応する、PEFT (Efficient Fine Tuning) 手法として人気がある。
モデル更新に低階テンソルパラメトリゼーションを用いる新しい手法を提案する。
提案手法は,大規模言語モデルの微調整に有効であり,比較性能を維持しつつ,パラメータ数の大幅な削減を実現している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:03:20 GMT)
LoRTA: Low Rank Tensor Adaptation of Large Language Models [70.3] Low Rank Adaptation (LoRA) は、下流タスクのための大規模な事前学習モデルに効果的に適応する、PEFT (Efficient Fine Tuning) 手法として人気がある。
モデル更新に低階テンソルパラメトリゼーションを用いる新しい手法を提案する。
提案手法は,大規模言語モデルの微調整に有効であり,比較性能を維持しつつ,パラメータ数の大幅な削減を実現している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:03:20 GMT)
SpatialRGPT: Grounded Spatial Reasoning in Vision Language Models [68.1] VLMの空間知覚と推論能力を高めるために空間領域GPT(SpatialRGPT)を導入する。
推測中、ユーザが指定した領域の提案が提供されると、SpatialRGPTは相対的な方向と距離を正確に知覚できる。
本研究では,空間的推論タスクにおける局所的プロンプトと非局所的プロンプトの双方において,空間的RGPTにより性能が著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:16:20 GMT)
Selection-p: Self-Supervised Task-Agnostic Prompt Compression for Faithfulness and Transferability [67.8] 本稿では,非形式的トークンを識別する統一圧縮法を開発するために,大規模言語モデルの能力について検討する。
実験により、Selection-pは様々な分類タスクで最先端のパフォーマンスを達成することが示された。
以前の作業と比べて、異なるモデルに対して優れた転送性を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:05:25 GMT)
MTU-Bench: A Multi-granularity Tool-Use Benchmark for Large Language Models [66.6] MTU-Benchと呼ばれる大規模言語モデルのための多言語ツール使用ベンチマークを提案する。
私たちのMTU-Benchは、既存の高品質データセットを変換して、実際のツール使用シナリオをシミュレートすることで収集されます。
MTU-Bench の総合的な実験結果から, MTU-Bench の有効性が示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:46:17 GMT)
M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes [66.4] モバイル操作タスクのための全身動作生成のベンチマークであるM3Benchを提案する。
M3Benchは、その構成、環境制約、タスクの目的を理解するために、実施エージェントを必要とする。
M3Benchは119の多様なシーンにまたがる30kのオブジェクト再構成タスクを備えており、新たに開発したM3BenchMakerによって生成された専門家によるデモを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:02:05 GMT)
M${}^{3}$Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes [66.4] モバイル操作タスクのための全身動作生成のための新しいベンチマークであるM3Benchを提案する。
M3Benchは、その構成、環境制約、タスクの目的を理解するために、実施エージェントを必要とする。
M3Benchは119の多様なシーンにまたがる30kのオブジェクト再構成タスクを備えており、新たに開発したM3BenchMakerによって生成された専門家によるデモを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:02:05 GMT)
Ouroboros: Generating Longer Drafts Phrase by Phrase for Faster Speculative Decoding [65.9] 投機的復号化(英: Speculative decoding)は、大規模言語モデルの生成プロセスを加速する広く使われている手法である。
我々は,草案作成プロセスの並列化のために,草案文を生成するOuroborosを紹介した。
ウロボロは投機的復号化で最大2.8倍、バニラ復号化で3.9倍のスピードアップを達成できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:43:51 GMT)
WaterSeeker: Pioneering Efficient Detection of Watermarked Segments in Large Documents [65.1] WaterSeekerは、広範囲な自然テキストの中で、ウォーターマークされたセグメントを効率的に検出し、発見するための新しいアプローチである。
検出精度と計算効率のバランスが良くなる。
WaterSeekerのローカライゼーション機能は、解釈可能なAI検出システムの開発をサポートする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:13:10 GMT)
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.1] 本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。
離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。
MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:54:28 GMT)
MMAR: Towards Lossless Multi-Modal Auto-Regressive Prababilistic Modeling [64.1] 本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。
離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。
MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:54:28 GMT)
CoTracker3: Simpler and Better Point Tracking by Pseudo-Labelling Real Videos [63.9] 我々はCoTracker3を導入し、新しい追跡モデルと半教師付きトレーニングレシピを新たに導入する。
これにより、トレーニング中にアノテーションを使わずに実際のビデオが使えるようになり、既成の教師を使って擬似ラベルを生成することができる。
モデルはオンライン版とオフライン版で利用可能で、視界や無視された点を確実に追跡できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:56:32 GMT)
MoH: Multi-Head Attention as Mixture-of-Head Attention [63.7] 我々は、トランスフォーマーモデルのコアであるマルチヘッドアテンション機構をアップグレードし、以前の精度を維持したり、超えたりしながら効率を向上させる。
そこで我々は,Mixture-of-Head attention (MoH)を提案する。
まず、MoHは各トークンが適切なアテンションヘッドを選択することを可能にし、精度を損なうことなく推論効率を向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:59:44 GMT)
A Simple Approach to Unifying Diffusion-based Conditional Generation [63.4] 多様な条件生成タスクを処理するための、シンプルで統一されたフレームワークを導入します。
提案手法は,異なる推論時間サンプリング方式による多目的化を実現する。
我々のモデルは、非親密なアライメントや粗い条件付けのような追加機能をサポートしています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:41:43 GMT)
Visual-Geometric Collaborative Guidance for Affordance Learning [63.0] 本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:35:51 GMT)
DISP-LLM: Dimension-Independent Structural Pruning for Large Language Models [63.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な成功を収めた。
これらのモデルに関連するメモリと計算コストの増加は、リソース制限されたデバイスへの展開に重大な課題をもたらす。
そこで本研究では,構造解析手法によって課される制約を緩和する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:51:18 GMT)
LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.8] 我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。
LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。
ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:57:44 GMT)
LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.8] 我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。
LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。
ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:57:44 GMT)
Socialized Learning: A Survey of the Paradigm Shift for Edge Intelligence in Networked Systems [62.3] 本稿では,エッジインテリジェンス(EI)と社会学習(SL)の統合に関する文献レビューの結果について述べる。
SLは、エージェントの協調能力と集団知性を増幅することを目的とした、社会的原則と行動に基づく学習パラダイムである。
ソーシャル化アーキテクチャ、ソーシャル化トレーニング、ソーシャル化推論の3つの統合コンポーネントについて詳しく検討し、その強みと弱点を分析した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:04:51 GMT)
Learning Planning-based Reasoning by Trajectories Collection and Process Reward Synthesizing [62.0] 収集された軌道上でのDPO(Direct Preference Optimization)を通して計画に基づく推論を学習するフレームワークを提案する。
論理的推論ベンチマークの挑戦的な結果から,学習フレームワークの有効性が示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:16:38 GMT)
Uncovering mesa-optimization algorithms in Transformers [61.1] いくつかの自己回帰モデルは、入力シーケンスが処理されたときに学習でき、パラメータの変更を受けずに、それを行うように明示的に訓練されていない。
我々は,新しい入力が明らかになったときにモデルを調整するための補助学習アルゴリズムが,標準の次トーケン予測誤差最小化によって生まれることを示す。
本研究は、自己回帰損失最小化の産物としてコンテキスト内学習を説明し、新しい最適化ベースのトランスフォーマー層の設計を通知する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:43:50 GMT)
Adaptive Data Optimization: Dynamic Sample Selection with Scaling Laws [59.0] 本稿では,オンライン手法でデータ分散を最適化するアルゴリズムであるAdaptive Data Optimization (ADO)を導入する。
ADOは外部の知識やプロキシモデル、モデル更新の変更を必要としない。
ADOは、ドメインごとのスケーリング法則を使用して、トレーニング中の各ドメインの学習ポテンシャルを推定し、データ混合を調整する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:47:44 GMT)
Capturing Minds, Not Just Words: Enhancing Role-Playing Language Models with Personality-Indicative Data [58.9] 本稿では、パーソナリティを指標としたデータを用いて、ロールプレイング言語モデル(RPLM)を強化することを提案する。
具体的には、心理学的尺度からの質問を活用し、高度なRPAを蒸留し、文字の心を把握した対話を生成する。
実験により,本データセットを用いてトレーニングしたRPLMは,一般人格関連評価と人格関連評価の両面において,高度なロールプレイング能力を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:24:56 GMT)
Improving Instruction-Following in Language Models through Activation Steering [58.9] 命令固有ベクトル表現を言語モデルから導出し,それに従ってモデルをステアリングする。
提案手法は,出力形式や長さ,単語の包摂といった制約に対するモデル適合性をいかに向上させるかを示す。
本研究は,アクティベーションステアリングが言語生成におけるきめ細かい制御に実用的でスケーラブルなアプローチを提供することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:38:20 GMT)
BlendFilter: Advancing Retrieval-Augmented Large Language Models via Query Generation Blending and Knowledge Filtering [58.4] BlendFilterは、知識フィルタリングと組み合わせたクエリ生成を統合することで、検索強化された大規模言語モデルを高める新しいアプローチである。
我々は3つのオープンドメイン質問応答ベンチマークで広範な実験を行い、我々の革新的なBlendFilterが最先端のベースラインをはるかに上回っていることを明らかにした。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:55:29 GMT)
MultiVENT 2.0: A Massive Multilingual Benchmark for Event-Centric Video Retrieval [57.9] $textbfMultiVENT 2.0$は、大規模かつ多言語なイベント中心のビデオ検索ベンチマークである。
218,000以上のニュースビデオと、特定の世界イベントを対象とした3,906のクエリが提供されている。
予備的な結果は、最先端のビジョン言語モデルは、この課題にかなり苦労していることを示している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:56:34 GMT)
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering [57.3] 我々は,新しい評価指標であるI-HallA (Image Hallucination Evaluation with Question Answering)を紹介する。
I-HallAは視覚的質問応答(VQA)を用いて生成画像の事実性を測定する
我々はI-HallAを用いて5つのテキスト・ツー・イメージモデルを評価し、これらの最先端モデルが事実情報を正確に伝達できない場合が多いことを明らかにした。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:01:44 GMT)
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering [57.3] 我々は,新しい評価指標であるI-HallA (Image Hallucination Evaluation with Question Answering)を紹介する。
I-HallAは視覚的質問応答(VQA)を用いて生成画像の事実性を測定する
我々はI-HallAを用いて5つのテキスト・ツー・イメージモデルを評価し、これらの最先端モデルが事実情報を正確に伝達できない場合が多いことを明らかにした。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:01:44 GMT)
LaCo: Large Language Model Pruning via Layer Collapse [56.9] トランスフォーマーに基づく大規模言語モデル(LLM)は、サイズ拡大の顕著な傾向を目撃している。
モデル量子化、知識蒸留、モデルプルーニングといった既存の手法は、様々な問題によって制約されている。
後部モデル層が前層に崩壊する「textitLayer Collapse (LaCo)」と呼ばれる簡潔な層構造プルーナーを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:58:58 GMT)
Are Large Language Models Strategic Decision Makers? A Study of Performance and Bias in Two-Player Non-Zero-Sum Games [56.7] 大規模言語モデル (LLM) は現実世界での利用が増えているが、その戦略的意思決定能力はほとんど探索されていない。
本研究は,Stag Hunt と Prisoner Dilemma のカノニカルゲーム理論2人プレイヤ非ゼロサムゲームにおける LLM の性能とメリットについて検討する。
GPT-3.5, GPT-4-Turbo, GPT-4o, Llama-3-8Bの構造化評価は, これらのゲームにおいて決定を行う場合, 以下の系統的バイアスの少なくとも1つの影響を受けていることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:29:10 GMT)
Latent-Predictive Empowerment: Measuring Empowerment without a Simulator [56.5] 我々は、より実用的な方法でエンパワーメントを計算するアルゴリズムであるLatent-Predictive Empowerment(LPE)を提案する。
LPEは、スキルと国家間の相互情報の原則的な置き換えである目的を最大化することで、大きなスキルセットを学習する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:41:18 GMT)
A Hitchhiker's Guide to Scaling Law Estimation [56.1] スケーリング法則は、より少ないパラメータやより少ないトレーニングセットで訓練が容易なモデルから外挿することで、ターゲットとなる機械学習モデルの損失を予測する。
我々は1000以上のスケーリング法則を推定し、新しいモデルファミリーにおけるスケーリング法則を推定するためのベストプラクティスを導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:59:10 GMT)
MoE-Pruner: Pruning Mixture-of-Experts Large Language Model using the Hints from Its Router [55.9] Mixture-of-Experts (MoE)アーキテクチャは、専門家のメモリ消費や冗長性といった課題に直面している。
入力アクティベーションとルータ重みを乗じて最小の重みを求める手法であるMoE-Prunerを提案する。
我々の刈り取り法は単発であり、再訓練や重み更新は不要である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:22:27 GMT)
GaVaMoE: Gaussian-Variational Gated Mixture of Experts for Explainable Recommendation [55.8] GaVaMoEは、説明可能なレコメンデーションのための新しいフレームワークである。
特定のユーザータイプや好みのカスタマイズされた説明を生成する。
疎いユーザ-イテムインタラクションのシナリオでは、堅牢なパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:59:30 GMT)
DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor [54.9] 本稿では, 劣化条件の異なる画像深部特徴の変化を定量化するDDRについて述べる。
画像記述子としてのDDRの汎用性は,キー画像属性と強い相関関係がみられた。
DDRは、画像復元作業において効果的な教師なし学習目標として機能し、画像の劣化と単一画像の超解像において顕著な進歩をもたらす。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:17:14 GMT)
Differential Privacy on Trust Graphs [54.6] 差分プライバシー(DP)は、各当事者がそのデータで他の当事者の(既知の)サブセットのみを信頼するマルチパーティ環境で研究する。
我々は、DPのローカルモデルよりもはるかに優れたプライバシーとユーティリティのトレードオフを持つ集約のためのDPアルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:31:04 GMT)
RL-I2IT: Image-to-Image Translation with Deep Reinforcement Learning [54.4] 画像から画像への変換(I2IT)手法は,ディープラーニング(DL)モデルの単一実行時に画像を生成する。
深部強化学習(DRL)によるステップワイド意思決定問題としてI2ITを再構成する。
RLベースのI2IT(RL-I2IT)を実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:57:53 GMT)
FineFake: A Knowledge-Enriched Dataset for Fine-Grained Multi-Domain Fake News Detection [54.4] FineFakeは、フェイクニュース検出のためのマルチドメイン知識強化ベンチマークである。
FineFakeは6つのセマンティックトピックと8つのプラットフォームにまたがる16,909のデータサンプルを含んでいる。
FineFakeプロジェクト全体がオープンソースリポジトリとして公開されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:40:39 GMT)
The Buffer Mechanism for Multi-Step Information Reasoning in Language Models [52.8] 大きな言語モデルの内部的推論メカニズムを調べることは、よりよいモデルアーキテクチャとトレーニング戦略を設計するのに役立ちます。
本研究では,トランスフォーマーモデルが垂直思考戦略を採用するメカニズムを解明するために,シンボリックデータセットを構築した。
我々は,GPT-2モデルに必要なトレーニング時間を75%削減し,モデルの推論能力を高めるために,ランダムな行列ベースアルゴリズムを提案した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:26:33 GMT)
Linear Transformer Topological Masking with Graph Random Features [52.7] 重み付き隣接行列の学習可能な関数としてトポロジカルマスクをパラメータ化する方法を示す。
私たちの効率的なマスキングアルゴリズムは、画像およびポイントクラウドデータのタスクに対して、強力なパフォーマンス向上を提供します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:12:38 GMT)
Linear Transformer Topological Masking with Graph Random Features [52.7] 重み付き隣接行列の学習可能な関数としてトポロジカルマスクをパラメータ化する方法を示す。
私たちの効率的なマスキングアルゴリズムは、画像およびポイントクラウドデータのタスクに対して、強力なパフォーマンス向上を提供します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:12:38 GMT)
Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.7] 最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。
近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。
組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:54:01 GMT)
Enhancing learning in spiking neural networks through neuronal heterogeneity and neuromodulatory signaling [52.1] 人工ニューラルネットワーク(ANN)の強化のための生物学的インフォームドフレームワークを提案する。
提案したデュアルフレームアプローチは、多様なスパイキング動作をエミュレートするためのスパイキングニューラルネットワーク(SNN)の可能性を強調している。
提案手法は脳にインスパイアされたコンパートメントモデルとタスク駆動型SNN, バイオインスピレーション, 複雑性を統合している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:51:44 GMT)
Titanic Calling: Low Bandwidth Video Conference from the Titanic Wreck [52.1] 我々は2022年夏にタイタニック号の難破船に潜航した際の通信実験について報告する。
潜水艦内の音声をテキストに変換するメッセージングシステムは、テキストメッセージを表面に送信し、それらのメッセージを話者の合成リップ同期ビデオとして再構成する。
このシステムは2022年の夏にタイタニックへの実際の潜水中にテストされた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:35:07 GMT)
ImageFolder: Autoregressive Image Generation with Folded Tokens [51.8] トークン長の増大は、画像再構成の品質を改善するための一般的なアプローチである。
トークン長に関する復元と生成品質の間にはトレードオフがある。
本稿では,自己回帰モデルにおいて折り畳み可能な空間整列型画像トークンを提供するセマンティック・トークンライザであるイメージを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:07:45 GMT)
ImageFolder: Autoregressive Image Generation with Folded Tokens [51.8] トークン長の増大は、画像再構成の品質を改善するための一般的なアプローチである。
トークン長に関する復元と生成品質の間にはトレードオフがある。
本稿では,自己回帰モデルにおいて折り畳み可能な空間整列型画像トークンを提供するセマンティック・トークンライザであるイメージを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:07:45 GMT)
A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.5] 実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:00:58 GMT)
Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.3] 我々は、複数のインターネット対応LVLMエージェントを活用する新しいビジュアルジオローカライズフレームワークであるSmithGeoを紹介する。
我々のフレームワークはエージェント間の通信を最適化する動的学習戦略を採用している。
その結果,本手法は現在の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:16:00 GMT)
Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.3] smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:16:00 GMT)
Improving Long-Text Alignment for Text-to-Image Diffusion Models [50.9] 長文処理のためのセグメントレベル符号化手法を含むLongAlignを提案する。
選好最適化のために、我々はCLIPに基づく選好モデルを微調整拡散モデルに適用する。
テキスト非関連部が微調整時の共通オーバーフィッティング問題に寄与していることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:46:31 GMT)
Jigsaw Puzzles: Splitting Harmful Questions to Jailbreak Large Language Models [50.9] 大規模言語モデル(LLM)は、人間との関わりにおいて卓越した性能を示した。
LLMは脱獄攻撃に弱いため、有害な反応が生じる。
我々は,高度LLMに対する単純かつ効果的なマルチターンジェイルブレイク戦略であるJigsaw Puzzles (JSP)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:07:15 GMT)
Achieving >97% on GSM8K: Deeply Understanding the Problems Makes LLMs Better Solvers for Math Word Problems [50.8] CoT(Chain-of-Thought)のプロンプトにより、さまざまな推論タスクにわたるLLM(Large Language Models)のパフォーマンスが向上した。
CoTは通常、セマンティックな誤解エラー、計算エラー、ステップミスという3つの落とし穴に悩まされる。
意味的誤解の誤りに対処し,LLMの数学的問題解決能力を改善するために,DUP(Deeply Understanding the Problems)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:11:25 GMT)
MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation [50.7] MLLM(Multimodal Large Language Models)はしばしば幻覚現象を示す。
MLLM(DeCo)の新しい動的補正復号法を提案する。
広範に使用されているベンチマークでDeCoを評価し、ベースラインと比較して幻覚率を大きなマージンで削減できることを実証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:57:44 GMT)
I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow [50.6] Rectified Flow Transformer (RFT) は優れたトレーニングと推論の効率を提供する。
テキスト・ツー・イメージ RFT の解像度を最大化する I-Max フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:26:29 GMT)
I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow [50.6] Rectified Flow Transformer (RFT) は優れたトレーニングと推論の効率を提供する。
テキスト・ツー・イメージ RFT の解像度を最大化する I-Max フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:26:29 GMT)
The Empirical Impact of Neural Parameter Symmetries, or Lack Thereof [50.5] ニューラル・ネットワーク・アーキテクチャの導入により,ニューラル・パラメータ・対称性の影響について検討する。
我々は,パラメータ空間対称性を低減するために,標準的なニューラルネットワークを改良する2つの手法を開発した。
実験により,パラメータ対称性の経験的影響に関する興味深い観察がいくつか示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:53:48 GMT)
MisinfoEval: Generative AI in the Era of "Alternative Facts" [50.1] 本稿では,大規模言語モデル(LLM)に基づく誤情報介入の生成と評価を行うフレームワークを提案する。
本研究では,(1)誤情報介入の効果を測定するための模擬ソーシャルメディア環境の実験,(2)ユーザの人口動態や信念に合わせたパーソナライズされた説明を用いた第2の実験について述べる。
以上の結果から,LSMによる介入はユーザの行動の修正に極めて有効であることが確認された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:46:27 GMT)
MisinfoEval: Generative AI in the Era of "Alternative Facts" [50.1] 本稿では,大規模言語モデル(LLM)に基づく誤情報介入の生成と評価を行うフレームワークを提案する。
本研究では,(1)誤情報介入の効果を測定するための模擬ソーシャルメディア環境の実験,(2)ユーザの人口動態や信念に合わせたパーソナライズされた説明を用いた第2の実験について述べる。
以上の結果から,LSMによる介入はユーザの行動の修正に極めて有効であることが確認された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:46:27 GMT)
Triple Point Masking [49.4] 既存の3Dマスク学習手法は、限られたデータの下でパフォーマンスボトルネックに遭遇する。
我々は、マスク付きオートエンコーダの事前学習のためのスケーラブルなフレームワークとして、TPMと呼ばれるトリプルポイントマスキング方式を導入する。
大規模な実験により,提案したTPMを組み込んだ4つのベースラインが,下流タスクの総合的な性能向上を実現することが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:00:03 GMT)
A bound on the quantum value of all compiled nonlocal games [49.3] 暗号コンパイラは、任意の非ローカルゲームを単一の計算バウンド証明器で対話的プロトコルに変換する。
我々は、コンパイルされた2人プレイヤの非ローカルゲームに対して量子音響結果を確立する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:36:28 GMT)
On the Adversarial Risk of Test Time Adaptation: An Investigation into Realistic Test-Time Data Poisoning [49.2] テスト時間適応(TTA)は、テストデータを使用して推論段階でモデルの重みを更新し、一般化を強化する。
既存の研究では、TTAが逆方向検体で更新されると、良性検体の性能が低下することが示されている。
そこで本研究では, 良性試料にアクセスすることなく, 有毒試料を効果的かつ現実的に生成する手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:27:41 GMT)
On the Adversarial Risk of Test Time Adaptation: An Investigation into Realistic Test-Time Data Poisoning [49.2] テスト時間適応(TTA)は、テストデータを使用して推論段階でモデルの重みを更新し、一般化を強化する。
既存の研究では、TTAが逆方向検体で更新されると、良性検体の性能が低下することが示されている。
そこで本研究では, 良性試料にアクセスすることなく, 有毒試料を効果的かつ現実的に生成する手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:27:41 GMT)
Investigation of Speaker Representation for Target-Speaker Speech Processing [49.1] 本論文は,目標話者音声処理タスクに好まれる話者埋め込みとは何か,という根本的な問題に対処することを目的としている。
TS-ASR, TSE, p-VADタスクでは, 対象話者の事前録音音声からの話者埋め込みを, 対象話者の同一性から直接1ホットベクトルの形で計算する事前学習話者エンコーダを比較した。
分析の結果,話者検証性能はTSタスク性能とは多少無関係であり,一ホットベクトルは入学者ベースよりも優れており,最適埋め込みは入力混合に依存していることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:58:13 GMT)
On Championing Foundation Models: From Explainability to Interpretability [48.2] 本調査は、上記の原則に準拠し、ブラックボックス基礎モデルに適用された解釈可能な手法をレビューすることを目的としている。
これらの手法は機械学習理論に根ざし、一般化性能、表現能力、動的挙動の分析を網羅している。
これらは、推論能力やトレーニングダイナミクスから倫理的意味まで、FMのワークフロー全体の完全な解釈を提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:48:03 GMT)
Concept-Reversed Winograd Schema Challenge: Evaluating and Improving Robust Reasoning in Large Language Models via Abstraction [48.2] 我々は,表層論理的連鎖に頼るのではなく,Large Language Models (LLM) が頑健な推論を行う範囲を評価する。
我々は、有名なウィノグラードチャレンジ(WSC)データセットに基づいて、新しい評価データセットである概念逆ウィノグラードチャレンジ(CR-WSC)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:19:27 GMT)
Understanding and Scaling Collaborative Filtering Optimization from the Perspective of Matrix Rank [48.0] 協調フィルタリング(CF)手法は現実世界のレコメンデーションシステムを支配している。
本研究では,異なる学習戦略下での埋め込みテーブルの特性について検討する。
ユーザの安定なランクとアイテムの埋め込みを規則化する,効率的なウォームスタート戦略を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:54:13 GMT)
Inducing anxiety in large language models can induce bias [47.9] 我々は、確立された12の大規模言語モデル(LLM)に焦点を当て、精神医学でよく用いられる質問紙に答える。
以上の結果から,最新のLSMの6つが不安アンケートに強く反応し,人間に匹敵する不安スコアが得られた。
不安誘発は、LSMのスコアが不安アンケートに影響を及ぼすだけでなく、人種差別や老化などの偏見を測る以前に確立されたベンチマークにおいて、それらの行動に影響を及ぼす。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:20:51 GMT)
Mitigate Position Bias in Large Language Models via Scaling a Single Dimension [47.8] 本稿ではまず,位置バイアスのマイクロレベル表現について考察し,注目重みが位置バイアスのマイクロレベル表現であることを示す。
さらに、位置埋め込みに加えて、因果注意マスクは位置特異的な隠れ状態を作成することによって位置バイアスに寄与する。
これらの知見に基づいて,この位置隠れ状態のスケーリングにより位置バイアスを軽減する手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:58:07 GMT)
BiMix: Bivariate Data Mixing Law for Language Model Pretraining [47.8] 事前学習データ構成がモデル性能に与える影響はいまだよく分かっていない。
$textbfBiMix$は、データの混合を理解し、最適化するための体系的なフレームワークを提供する。
我々の研究は、データミキシングの力学に関する理論的知見と、LLMトレーニング効率を向上させるための実践的なツールの両方に貢献する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:40:30 GMT)
Consistent Document-Level Relation Extraction via Counterfactuals [47.8] 実世界のデータに基づいて訓練された文書レベルの関係抽出モデルが,事実バイアスに悩まされていることが示されている。
文書抽出のための文書レベルの反事実データのデータセットであるCovEReDを提案する。
本研究では,CovEReDモデルを用いて文書レベルの反事実データを生成することにより,一貫性が維持されることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:37:35 GMT)
EAIRiskBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [47.7] EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
EAIRiskBenchは、EAIシナリオにおける自動物理的リスクアセスメントのための新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:45:31 GMT)
VideoAgent: Self-Improving Video Generation [47.6] ビデオ生成は、ロボットシステムを制御する視覚的な計画を生成するために使われてきた。
ビデオ生成を制御に活用する上での大きなボトルネックは、生成されたビデオの品質にある。
本稿では,外部からのフィードバックに基づいて生成した映像プランを自己改善するためのVideoAgentを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:10:16 GMT)
VideoAgent: Self-Improving Video Generation [47.6] ビデオ生成は、ロボットシステムを制御する視覚的な計画を生成するために使われてきた。
ビデオ生成を制御に活用する上での大きなボトルネックは、生成されたビデオの品質にある。
本稿では,外部からのフィードバックに基づいて生成した映像プランを自己改善するためのVideoAgentを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:10:16 GMT)
DeformPAM: Data-Efficient Learning for Long-horizon Deformable Object Manipulation via Preference-based Action Alignment [47.3] 本稿では、優先学習と報酬誘導行動選択に基づくデータ効率の一般学習フレームワークを提案する。
DeformPAMは、長い水平タスクを複数のアクションプリミティブに分解し、人間の好みデータを使って暗黙の報酬モデルを訓練する。
実世界の長軸変形可能な3つのオブジェクト操作タスクの実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:19:16 GMT)
Resolving Knowledge Conflicts in Large Language Models [46.9] 大規模言語モデル(LLM)はしばしば知識の衝突に遭遇する。
知識衝突が発生した場合のLLMのデシラタとは何か,既存のLLMがそれを満たすのかを問う。
文脈知識の矛盾をシミュレートする評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:23:56 GMT)
MambaIR: A Simple Baseline for Image Restoration with State-Space Model [46.8] 我々は,バニラ・マンバを改善するために,局部増強とチャンネルアテンションを導入するMambaIRを紹介した。
本手法は,画像SR上でSwinIRを最大0.45dB向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:45:02 GMT)
Edit-Your-Motion: Space-Time Diffusion Decoupling Learning for Video Motion Editing [46.6] 本稿では,ワンショット微調整による未確認課題に対処するビデオモーション編集手法であるEdit-Your-Motionを紹介する。
映像の動作と外観を効果的に分離するために,時間的二段階学習戦略を設計する。
Edit-Your-Motionを使えば、ユーザーはソースビデオの中の人間の動きを編集でき、より魅力的で多様なコンテンツを作ることができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:43:36 GMT)
MCTBench: Multimodal Cognition towards Text-Rich Visual Scenes Benchmark [46.5] マルチモーダル大規模言語モデル(MLLM)の評価において,テキストリッチな視覚シーンの理解が焦点となっている。
テキストリッチな視覚シーンに対するマルチモーダル・ベンチマークを導入し、視覚推論とコンテンツ作成タスク(MCTBench)を通してMLLMの認知能力を評価する。
MCTBenchは、MLLMの認知能力と知覚能力の両方を一貫した比較を保証するために、いくつかの知覚タスクを組み込んでいる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:13:42 GMT)
Rethinking Reward Model Evaluation: Are We Barking up the Wrong Tree? [46.4] RMの精度の違いが、最適化されたポリシー性能のギャップにどのように変換されるかを検討する。
精度の測定方法が最終的な政策性能を予測する能力に大きく影響していることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:50:47 GMT)
Rethinking Reward Model Evaluation: Are We Barking up the Wrong Tree? [46.4] RMの精度の違いが、最適化されたポリシー性能のギャップにどのように変換されるかを検討する。
精度の測定方法が最終的な政策性能を予測する能力に大きく影響していることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:50:47 GMT)
RiskAwareBench: Towards Evaluating Physical Risk Awareness for High-level Planning of LLM-based Embodied Agents [46.2] 大規模言語モデル(LLM)の現実世界環境への展開は、潜在的な物理的リスクを引き起こす可能性がある。
LLMの既存のセキュリティベンチマークは、LLMをベースとしたエンボディエージェントのリスク意識を見落としている。
本稿では,LSMをベースとしたエンボディエージェントの身体的リスク意識を評価するための自動フレームワークである RiskAwareBench を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:45:31 GMT)
React-OT: Optimal Transport for Generating Transition State in Chemical Reactions [46.0] 反応物や生成物から一意な遷移状態構造を生成するための最適な輸送手法であるReact-OTを開発した。
Re React-OTは、0.053AAの中央構造根平均平方偏差(RMSD)と1.06 kcal/molの中央障壁誤差を持つ高度精度の高いTS構造を生成する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:05:54 GMT)
LLM-wrapper: Black-Box Semantic-Aware Adaptation of Vision-Language Models for Referring Expression Comprehension [45.9] 大規模言語モデル(LLM)を用いた参照表現(REC)タスクのための視覚言語モデル(VLM)の「ブラックボックス」適応法を提案する。
LLMはLLMの推論能力を活かし、軽微調整により改良され、参照表現にマッチする最も関連性の高いバウンディングボックスを選択する。
当社のアプローチでは,内部動作へのアクセスを必要とせずに,クローズドソースモデルの適応を可能にするという,いくつかの利点がある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:52:55 GMT)
PromptIntern: Saving Inference Costs by Internalizing Recurrent Prompt during Large Language Model Fine-tuning [45.8] 本稿では,モデル微調整時の素早い知識を内部化し,効率的な推論とコスト削減を実現するPromptInternを提案する。
我々は、命令テンプレート圧縮、少数ショットのサンプル吸収、進行的な内部化戦略を含む微調整パイプラインを設計する。
NL2Codeタスクへの挑戦に関する総合的な実験により、我々の手法は入力トークンを90%以上削減し、推論を4.2倍加速し、金銭的推論コストを88.3%削減することを示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:23:41 GMT)
Gradient Guidance for Diffusion Models: An Optimization Perspective [45.6] 本稿では,ユーザ特定目的の最適化に向けて,事前学習した拡散モデルを適用するための勾配ガイダンスの形式について検討する。
我々は,その最適化理論とアルゴリズム設計を体系的に研究するために,誘導拡散の数学的枠組みを確立する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:37:51 GMT)
Diffusion World Model: Future Modeling Beyond Step-by-Step Rollout for Offline Reinforcement Learning [45.2] 拡散世界モデル (DWM) は多段階の将来の状態と報酬を同時に予測できる条件拡散モデルである。
我々はDWMをモデルベース値推定に統合し、DWMからサンプリングした将来の軌跡によって短期的回帰をシミュレートする。
絶対的なパフォーマンスという点では、DWMは1ステップのダイナミックスモデルを大きく上回り、パフォーマンスは44%上昇した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:56:47 GMT)
AnimateLCM: Accelerating the Animation of Personalized Diffusion Models and Adapters with Decoupled Consistency Learning [45.2] 同様のサイズのビデオ拡散モデルの必要な生成時間を25秒から1秒程度に短縮する。
この手法の有効性は、二重レベルデカップリング学習アプローチにある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:22:05 GMT)
Back to the Color: Learning Depth to Specific Color Transformation for Unsupervised Depth Estimation [45.1] 合成色と実世界の色の違いは、実世界のシーンにおける深度推定に重大な課題をもたらす。
実世界のデータに基づいて訓練されたモデルを用いて,奥行きからリアルな色を予測するフレームワークBack2Colorを提案する。
また、VADepthは、変換器よりも計算量が少なく、精度も高いVision Attention Networkをベースにしている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:27:28 GMT)
Autonomous Improvement of Instruction Following Skills via Foundation Models [44.6] 自律的に収集された経験から改善できる知能的な指示追従ロボットは、ロボット学習を変革する可能性がある。
人的監督なしに自律的に収集したデータから、指示追従ポリシーを改善できる新しいアプローチを提案する。
実世界において、我々のアプローチの有効性を実証する広範な実験を行い、目に見えない環境のスイートにおいて、自律的に収集されたデータを用いてロボットポリシーを2倍に改善できることを見出した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:54:17 GMT)
Have the VLMs Lost Confidence? A Study of Sycophancy in VLMs [44.6] 梅毒症は視覚言語モデル(VLM)に重大な課題をもたらす幻覚である
そこで我々は,シコファンシーを緩和するために,プロンプト,教師付き微調整,DPOに基づく訓練と手法を用いた合成データセットを提案する。
以上の結果から, モデル上層部では, 梅毒予防能力が顕著であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:48:14 GMT)
High-Resolution Frame Interpolation with Patch-based Cascaded Diffusion [44.5] フレームのためのパッチベースのカスケード画素拡散モデルHiFIを提案する。
我々はHiFIがグローバルなコンテキストを必要とする高解像度で複雑なテクスチャを実現するのに有効であることを示す。
また、この手法は、推論時にメモリ使用量を劇的に削減し、また、テスト時に単一のモデルを使用することを可能にする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:59:04 GMT)
Core: Robust Factual Precision with Informative Sub-Claim Identification [44.4] スコアを人工的にインフレーションするために、明らかまたは反復的なサブステートメントを追加することで、人気のあるメトリクスを操作できることを観察する。
この観察は、Coreと呼ばれる新しいカスタマイズ可能なプラグインとプレイのサブステート選択コンポーネントを動機付けます。
Coreによって強化された多くの一般的な事実精度指標が、幅広い知識領域においてかなり堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:49:55 GMT)
FoundTS: Comprehensive and Unified Benchmarking of Foundation Models for Time Series Forecasting [44.3] 時系列予測(TSF)は、金融、気象サービス、エネルギー管理など、多くの分野で重要な機能である。
ファンデーションモデルは、新しいまたは見えないデータで有望な推論機能を示す。
そこで我々は,そのようなモデルの徹底的かつ公平な評価と比較を可能にする新しいベンチマーク FoundTS を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:23:49 GMT)
Learning Evolving Tools for Large Language Models [44.3] ツール変数に対する大規模言語モデル(LLM)の適応性と反射性を向上するツールEVOを提案する。
Monte Carlo Tree Searchを活用することで、ToolEVOは動的環境におけるLLMの積極的な探索と相互作用を促進する。
また、ツール変数の影響を評価するために特別に設計されたベンチマークであるToolQA-Dを紹介する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:02:06 GMT)
Learning Evolving Tools for Large Language Models [44.3] ツール変数に対する大規模言語モデル(LLM)の適応性と反射性を向上するツールEVOを提案する。
Monte Carlo Tree Searchを活用することで、ToolEVOは動的環境におけるLLMの積極的な探索と相互作用を促進する。
また、ツール変数の影響を評価するために特別に設計されたベンチマークであるToolQA-Dを紹介する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:02:06 GMT)
Large Language Models Are Cross-Lingual Knowledge-Free Reasoners [44.0] 我々は,タスクの推論過程を,知識検索と知識のない推論という2つの分離された構成要素に分解する。
知識のない推論能力は,様々なソース・ターゲット言語方向にほぼ完全に移行可能であることを示す。
知識のない推論は、異なる言語で類似したニューロンを推論するために共有し、知識は異なる言語に別々に格納する、という仮説を立てる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:08:01 GMT)
Unraveling the Mechanics of Learning-Based Demonstration Selection for In-Context Learning [43.4] 本研究では,学習に基づく実演選択手法の動作メカニズムを解析する。
類似度測定に関連する2つの重要な因子を実験的に同定した。
本稿では,タスクに依存しない要求とタスク固有の要求に対応する,効果的かつ単純化された2つの例選択手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:53:55 GMT)
Data Quality Control in Federated Instruction-tuning of Large Language Models [43.3] データ品質制御(FedDQC)を備えた大規模言語モデル(LLM)のフェデレーション・インストラクション・チューニングの新しいフレームワークを提案する。
提案手法では,各クライアントの命令応答アライメント(IRA)を評価するための効率的なメトリクスを導入し,単一ショット推論によるノイズの多いデータを同定する。
我々は4つの合成データセットと実世界のデータセットについて広範な実験を行い、この手法を集中的な設定から適応したベースラインと比較した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:14:57 GMT)
A Training-free Sub-quadratic Cost Transformer Model Serving Framework With Hierarchically Pruned Attention [43.2] 大規模言語モデルにおける文脈長を増大させるため,HiP(Hierarchically Pruned Attention)を提案する。
HiPは注意機構の時間的複雑さを$O(T log T)$に減らし、空間的複雑さを$O(T)$に減らし、$T$はシーケンス長である。
HiPは, 劣化を最小限に抑えつつ, プリフィルとデコードの両方のレイテンシとメモリ使用率を著しく低減することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:09:35 GMT)
Data Interpreter: An LLM Agent For Data Science [43.1] LLM(Large Language Model)ベースのエージェントは多くのアプリケーションで有効性を示している。
しかし、長期的な相互接続タスク、動的なデータ調整、ドメインの専門知識の解決を必要とするデータサイエンスのシナリオでの利用は、依然として困難である。
本稿では,LLMをベースとしたエージェントであるData Interpreterについて述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:52:57 GMT)
Impeding LLM-assisted Cheating in Introductory Programming Assignments via Adversarial Perturbations [42.5] LLM(Large Language Model)ベースのプログラミングアシスタントは、プロのソフトウェア開発者の生産性を向上させるだけでなく、初歩的なコンピュータプログラミングコースでの不正行為を容易にする。
本稿では,導入プログラミング問題の収集に広く使用されている5つのLCMのベースライン性能について検討し,その性能を劣化させるために,逆方向の摂動を調べるとともに,導入プログラミング課題の実際のコード生成を妨げる上で,そのような摂動の有効性を理解することを目的としたユーザスタディの結果について述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:48:40 GMT)
Impeding LLM-assisted Cheating in Introductory Programming Assignments via Adversarial Perturbation [42.5] LLM(Large Language Model)ベースのプログラミングアシスタントは、プロのソフトウェア開発者の生産性を向上させるだけでなく、初歩的なコンピュータプログラミングコースでの不正行為を容易にする。
本稿では,導入プログラミング問題の収集に広く使用されている5つのLCMのベースライン性能について検討し,その性能を劣化させるために,逆方向の摂動を調べるとともに,導入プログラミング課題の実際のコード生成を妨げる上で,そのような摂動の有効性を理解することを目的としたユーザスタディの結果について述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:48:40 GMT)
CLIP-DFGS: A Hard Sample Mining Method for CLIP in Generalizable Person Re-Identification [42.4] 深度優先探索に基づくDFGS (Depth-First Graph Sampler) と呼ばれるハードサンプルマイニング手法を提案する。
CLIPの強力なクロスモーダル学習機能を活用することで,DFGS法を用いて,難解なサンプルを抽出し,識別困難度の高いミニバッチを作成することを目的とする。
本研究は,DFGSの有効性を検証し,他の手法よりも大幅に改善したことを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:25:58 GMT)
SGEdit: Bridging LLM with Text2Image Generative Model for Scene Graph-based Image Editing [42.2] 本稿では,大規模言語モデル(LLM)とText2生成モデルを統合し,グラフベースの画像編集を行う新しいフレームワークを提案する。
本フレームワークは,編集精度とシーン美学の観点から,既存の画像編集手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:40:48 GMT)
Unleashing the Power of LLMs as Multi-Modal Encoders for Text and Graph-Structured Data [42.2] グラフ構造化情報は、言語モデルを強化するためのリッチなコンテキスト情報を提供する。
グラフとテキストの埋め込みを統合する既存の方法は、これらのモダリティの不均一性を完全に活用する能力に制限されている。
我々は,大規模言語モデル(LLM)を利用してテキストとグラフデータを共同符号化するフレームワークであるJanusを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:40:20 GMT)
Federated Learning framework for LoRaWAN-enabled IIoT communication: A case study [41.8] 異常検出は、産業部品の異常を防止し、発見する上で重要な役割を担っている。
従来の機械学習は、LoRaWANのようなリソース制約のある環境で異常検出モデルをデプロイする際の課題に直面している。
フェデレートラーニング(FL)は、分散モデルのトレーニング、プライバシの問題への対処、データ転送の最小化によって、この問題を解決する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:48:04 GMT)
Scaling laws for post-training quantized large language models [41.8] 良く訓練された大言語モデル(LLM)の一般化能力は、モデルサイズの関数として予測可能であることが知られている。
後処理後圧縮後のLCMの品質は予測不可能であり,ケースバイケースの検証が必要となることが多い。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:34:22 GMT)
Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement [41.7] オフラインメタRLの効率的な一般化を実現するメタ決定変換器(Meta-DT)を提案する。
我々は、コンテキスト認識の世界モデルを用いて、コンパクトなタスク表現を学習し、それをコンテキスト条件として注入し、タスク指向のシーケンス生成を誘導する。
また,Meta-DTでは,ベースラインが強いのに比べ,少ない,ゼロショットの一般化能力が優れていることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:51:30 GMT)
Scaling Laws for Multilingual Language Models [41.6] 多言語スケーリングの研究における主要な課題は、言語間移動による個々の言語性能の分析が困難であることである。
本稿では,各言語群に対するクロスエントロピー損失が,それぞれのサンプリング比でのみ決定されるという仮説を導入し,検証する。
性能とデータセットサイズ,モデルサイズ,サンプリング比率を関連づける,ゆるい関係を導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:29:38 GMT)
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model [41.3] 初期ビジョン言語Fusion-based SAM (EVF-SAM) について紹介する。
EVF-SAMは、マルチモーダルプロンプト(画像とテキスト)を利用する、シンプルだが効果的な参照セグメンテーション手法である
BEIT-3をベースとしたEVF-SAMにより,RefCOCO/+/gにおける表現セグメンテーションの最先端性能が得られた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:17:10 GMT)
Enhancing Agent Learning through World Dynamics Modeling [41.0] 少数のデモから世界ダイナミクスを発見するためのフレームワークであるDiVEを紹介する。
我々は,各コンポーネントが性能に与える影響を評価し,DiVEが生成するダイナミクスと人為的アノテーションのダイナミクスを比較した。
以上の結果から,DiVE が指導する LLM は,クラフト環境における人間プレイヤーに匹敵する報酬を得られる,より情報的な決定を下すことが示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:48:04 GMT)
Delay as Payoff in MAB [40.7] エージェントが受信した支払いが遅延し、直接遅延の大きさに対応する古典的マルチアーム帯域幅問題(MAB)の変種について検討する。
当社の主なコントリビューションは、コストと報酬の設定の両方に関して、上と下の境界の厳格さです。
私たちの後悔は、コストシナリオと報酬シナリオの違いを強調し、コストシナリオの改善が報酬よりも重要であることを示すことです。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:03:28 GMT)
A Learning Search Algorithm for the Restricted Longest Common Subsequence Problem [40.6] RLCS問題(Restricted Longest Common Subsequence)はバイオインフォマティクスにおいて重要な応用である。
本稿では,将来性のある地域に向けて,探索プロセスを強化するための2つの新しいアプローチを提案する。
この論文の重要な貢献は、科学的な抽象が入力文字列として機能する実世界のインスタンスの生成である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:02:15 GMT)
Robotic Arm Platform for Multi-View Image Acquisition and 3D Reconstruction in Minimally Invasive Surgery [40.6] 本研究は,低侵襲手術環境下でのマルチビュー画像の効率的な取得と高精度な3次元再構成を実現するロボットアームプラットフォームを提案する。
我々は,腹腔鏡をロボットアームに装着し,様々な照明条件で複数の卵巣器官の生検画像を撮影した。
我々は最近リリースされた学習ベースの特徴マッチングとCOLMAPを併用して再構築を行った。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:42:30 GMT)
DynamicER: Resolving Emerging Mentions to Dynamic Entities for RAG [40.4] 動的エンティティへの新たな言及の解決を目的とした新しいタスクを導入する。
私たちのベンチマークには、動的エンティティ参照解決とエンティティ中心の知識集約型QAタスクが含まれています。
本稿では,進化する実体と出現する言及の時間的ダイナミクスを効果的に管理する,連続的適応型時間分割クラスタリング手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:57:12 GMT)
Colloquium: Quantum Properties and Functionalities of Magnetic Skyrmions [40.3] 競合する磁気相互作用は、トポロジカルな巻数によって特徴づけられる滑らかな磁化テクスチャを安定化することができる。
このようなテクスチャは2次元平面内で空間的に局在しており、一般にスカイミオンとして知られている。
このコロキウムは、スカイミオンテクスチャに関連する量子効果、その理論的起源、検出に関連する実験的および物質的課題、量子演算にそれらを利用するという約束を考察している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:27:20 GMT)
MMFuser: Multimodal Multi-Layer Feature Fuser for Fine-Grained Vision-Language Understanding [39.7] 視覚変換器(ViTs)の深部・浅部機能を効率的に統合する,シンプルで効果的な多層機能フェーザであるモデル名を提案する。
具体的には、クエリとしてセマンティックに整合した深い機能を活用して、浅い機能から欠落した詳細を動的に抽出する。
modelnameachieveは、ビジュアル表現とベンチマークのパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:55:22 GMT)
Cofca: A Step-Wise Counterfactual Multi-hop QA benchmark [39.6] 実データと反実データからなる新しい評価ベンチマークであるCofCA(Step-wise Counterfactual benchmark)を導入する。
実験の結果,ウィキペディアをベースとした事実データと反事実データの間には,既存のベンチマークにおけるデータ汚染問題を推定し,大きな性能差があることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:47:19 GMT)
Cognitive Overload Attack:Prompt Injection for Long Context [39.6] 大規模言語モデル(LLM)は、明示的な再訓練を必要とせずにタスクを実行する際、顕著な能力を示した。
この機能は、ICL(In-Context Learning)と呼ばれ、安全訓練されたLLMを操作して望ましくないあるいは有害な出力を生成する敵のプロンプトやジェイルブレイクにLLMを公開する。
我々は、認知負荷理論の原則をLLMに適用し、人間の認知と同様、LLMも認知負荷に悩まされていることを実証的に検証する。
GPT-4, Claude-3.5 Sonnet, Claude-3 OPUS, Llama-3-70B-Instruct, Gemini-1.0-Pro などの高度なモデルを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:53:34 GMT)
Parameterize Structure with Differentiable Template for 3D Shape Generation [39.4] 最近の3次元形状生成には複雑なネットワークと構造定義が使用されている。
本稿では,同じカテゴリの共有構造を微分可能なテンプレートを用いてパラメータ化する手法を提案する。
本手法は,複雑な細部で多種多様な形状を再構築あるいは生成し,円滑に補間することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:42:36 GMT)
Parameterize Structure with Differentiable Template for 3D Shape Generation [39.4] 最近の3次元形状生成には複雑なネットワークと構造定義が使用されている。
本稿では,同じカテゴリの共有構造を微分可能なテンプレートを用いてパラメータ化する手法を提案する。
本手法は,複雑な細部で多種多様な形状を再構築あるいは生成し,円滑に補間することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:42:36 GMT)
Data Selection for Task-Specific Model Finetuning [39.2] タスク固有モデルファインタニングのためのデータ選択フレームワークを提案する。
提案手法で選択したデータを用いて,1%選択率で命令チューニングを行う場合,全データセットで処理性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:54:17 GMT)
A Survey of Low-shot Vision-Language Model Adaptation via Representer Theorem [38.8] 限られた訓練データの条件下で対処する主な課題は、パラメータ効率のよい方法で事前訓練された視覚言語モデルを微調整する方法である。
本稿では,既存の手法を統合化し,それらの性質を同定し,詳細な比較を支援するための統一的な計算フレームワークを提案する。
実演として、カーネルヒルベルト空間(RKHS)における表現子間のクラス間相関をモデル化し、既存の手法を拡張した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:22:30 GMT)
On the Capacity of Citation Generation by Large Language Models [38.5] Retrieval-augmented Generation (RAG) は、大規模言語モデル(LLM)における「ハロシン化」問題を緩和するための有望な方法として現れる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:04:26 GMT)
Learning on LoRAs: GL-Equivariant Processing of Low-Rank Weight Spaces for Large Finetuned Models [38.2] 低ランク適応(LoRA)は、大規模な基礎モデルの微調整に革命をもたらした。
LoRAは、これらの低ランクウェイトを入力として利用する機械学習技術を適用する機会を提供する。
本稿では,LoRA重みが機械学習モデルへの入力として機能するパラダイムであるLoRA(Learning on LoRAs)の可能性を検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:21:38 GMT)
DIRAS: Efficient LLM Annotation of Document Relevance in Retrieval Augmented Generation [37.8] ドメイン固有のクエリは通常、浅いセマンティックな関連性を超えて、関連性のニュアンス定義を必要とする。
人間またはGPT-4アノテーションは費用がかかり、全ての(クエリ、ドキュメント)ペアをカバーできない。
DIRAS (Domain-specific Information Retrieval with Scalability) は手動アノテーションのないスキーマである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:37:04 GMT)
RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation [37.4] 対話型セグメンテーションシナリオにおけるクリックパターンの大規模クラウドソーシング調査を行い,475万のリアルタイムクリックを収集する。
本モデルとデータセットを用いて,現実的なクリックにおける既存の対話的セグメンテーション手法の包括的比較のためのRClicksベンチマークを提案する。
我々のベンチマークによると、実世界の対話型セグメンテーションモデルでは、ベースラインベンチマークで報告されたよりもパフォーマンスが悪く、ほとんどの手法は堅牢ではない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:55:00 GMT)
QSpec: Speculative Decoding with Complementary Quantization Schemes [37.0] 量子化は、推論を加速し、大きな言語モデルのメモリ消費を減らすために、実質的に採用されている。
本稿では、投機的復号化のための2つの相補的量子化スキームをシームレスに統合するQSPECと呼ばれる新しい量子化パラダイムを提案する。
QSPECは、品質上の妥協なしにトークン生成スループットを最大1.80倍向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:57:51 GMT)
Learning on LoRAs: GL-Equivariant Processing of Low-Rank Weight Spaces for Large Finetuned Models [36.9] 低ランク適応(LoRA)は、大規模な基礎モデルの微調整に革命をもたらした。
LoRAは、これらの低ランクウェイトを入力として利用する機械学習技術を適用する機会を提供する。
本稿では,LoRA重みが機械学習モデルへの入力として機能するパラダイムであるLoRA(Learning on LoRAs)の可能性を検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:21:38 GMT)
DISCO: A Hierarchical Disentangled Cognitive Diagnosis Framework for Interpretable Job Recommendation [36.8] オンライン採用プラットフォームの急速な発展は、求職者にとって前例のない機会を生み出している。
求職者の検索負担を大幅に軽減した求人推薦システム。
採用勧告の説明可能性に関する研究は、いまだに明らかにされていない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:29:51 GMT)
DISCO: A Hierarchical Disentangled Cognitive Diagnosis Framework for Interpretable Job Recommendation [36.8] オンライン採用プラットフォームの急速な発展は、求職者にとって前例のない機会を生み出している。
求職者の検索負担を大幅に軽減した求人推薦システム。
採用勧告の説明可能性に関する研究は、いまだに明らかにされていない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:29:51 GMT)
Secure Stateful Aggregation: A Practical Protocol with Applications in Differentially-Private Federated Learning [36.4] DP-FTRLベースのアプローチは、すでに業界に広く展開されている。
セキュアなステートフルアグリゲーションを導入します。これは、アグリゲーション値のプライベートストレージを可能にする、単純なアグリゲーションのみのデータ構造です。
DP-FTRLをベースとした私的フェデレーション学習を実現するためには,セキュアなステートフルアグリゲーションが十分である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:45:18 GMT)
RoseLoRA: Row and Column-wise Sparse Low-rank Adaptation of Pre-trained Language Model for Knowledge Editing and Fine-tuning [36.3] 事前学習された言語モデルは、様々なNLPタスクにまたがる強力な一般化性を示す。
特定のタスクのためにこれらのモデルを微調整するには、通常、リソース集約的な全てのパラメータを更新する必要がある。
我々は,textbfrowとctextbfolumn-wise spartextbfse textbflow-textbfrank textbfadaptation (RoseLoRA)を実行する新しいPEFT法を提案する。
RoseLoRAは、特定のタスクの最も重要なパラメータのみを特定し、更新し、効率を維持する
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:47:15 GMT)
Supercurrent Multiplexing with Solid-State Integrated Hybrid Superconducting Electronics [36.1] 1入出力8出力ハイブリッド超電導デマルチプレクサを用いた超電流TDMを初めて報告した。
超伝導デマルチプレクサは、50mKで100MHzまで動作し、超伝導状態での挿入損失は0dB、50オム整合低温測定装置でのOF/ON比は17.5dBである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:54:31 GMT)
OKAMI: Teaching Humanoid Robots Manipulation Skills through Single Video Imitation [36.0] 一つのRGB-Dビデオから操作計画を生成する方法であるOKAMIを紹介する。
OKAMIは、オープンワールドビジョンモデルを使用して、タスク関連オブジェクトを特定し、身体の動きと手ポーズを別々に再ターゲットする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:17:54 GMT)
Harmonic Mobile Manipulation [35.8] HarmonicMMはナビゲーションと操作の両方を最適化するエンドツーエンドの学習手法である。
私たちのコントリビューションには、モバイル操作のための新しいベンチマークと、RGBの視覚的観察のみによるデプロイメントの成功が含まれています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:40:18 GMT)
Jigsaw++: Imagining Complete Shape Priors for Object Reassembly [35.2] Jigsaw++は、再アセンブリ問題に対する再構築の多面的課題に取り組むために設計された、新しい生成方法である。
完全なオブジェクトの前にカテゴリに依存しない形状を学ぶことで、自分自身を区別する。
J Jigsaw++は、その効果を示し、再構築エラーを低減し、形状復元の精度を高める。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:45:37 GMT)
Mathador-LM: A Dynamic Benchmark for Mathematical Reasoning on Large Language Models [34.8] 大規模言語モデル(LLM)の数学的推論を評価するための新しいベンチマークであるMathador-LMを紹介する。
Mathador-LMはMathadorゲームにインスパイアされており、そのゲームの目的は、与えられた基本数の集合の基本的な算術演算を用いてターゲット数に到達することである。
先行するLLMに対して,目標の難易度に従って,ベンチマークインスタンスを動的に生成しながら,安定した平均性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:35:17 GMT)
POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search [34.5] 本稿では,高精度符号化・復号化フレームワークであるParallel Optimal Position Search (POPoS)を紹介する。
Pseudo-range multilateration は、ヒートマップエラーを補正し、ランドマークのローカライゼーションの精度を高めるために使用される。
1ステップ並列アルゴリズムを導入し、計算効率を大幅に向上し、処理時間を短縮する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:31:06 GMT)
POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search [34.5] 本稿では,高精度符号化・復号化フレームワークであるParallel Optimal Position Search (POPoS)を紹介する。
Pseudo-range multilateration は、ヒートマップエラーを補正し、ランドマークのローカライゼーションの精度を高めるために使用される。
1ステップ並列アルゴリズムを導入し、計算効率を大幅に向上し、処理時間を短縮する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:31:06 GMT)
The Fragility of Fairness: Causal Sensitivity Analysis for Fair Machine Learning [34.5] 因果感度分析のツールをFairMLコンテキストに適用する。
本稿では,最も一般的なパリティ指標の感度を3種類の分類器で解析する。
因果感度分析は、パリティ計量評価の有意性を高めるために強力で必要なツールキットを提供することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:26:55 GMT)
The Fragility of Fairness: Causal Sensitivity Analysis for Fair Machine Learning [34.5] 因果感度分析のツールをFairMLコンテキストに適用する。
本研究では,因果感度分析が,パリティ計量評価の有意性を測る上で,強力かつ必要なツールキットを提供することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:26:55 GMT)
MIND: Math Informed syNthetic Dialogues for Pretraining LLMs [34.5] 本稿では,新しい大規模かつ多様なMath Informed syNthetic Dialogue(MIND)生成法を提案する。
MIND は OpenWebMath (OWM) に基づいて合成会話を生成し,新しい数学コーパス MIND-OWM を生成する。
会話設定の異なる実験により,対話参加者間の知識ギャップを組み込むことが,高品質な数学データの生成に不可欠であることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:25:53 GMT)
DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection [34.4] 聴覚注意検出(AAD)アプローチは、脳波信号などの脳信号を分析して、出席者を特定する。
これらの課題に対処するために,DARNet 構築モジュール,デュアルアテンション改善モジュール,機能融合時・モジュールからなる DARNet を提案する。
実験の結果,DARNetは最先端モデルと比較して平均分類精度が0.1sで5.9%,1sで4.6%,DTUデータセットで2sで3.9%向上していることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:51:29 GMT)
Enhance Graph Alignment for Large Language Models [34.0] グラフへのアプローチは、大規模言語モデルがグラフ情報を処理できることで人気がある。
既存の手法は、自己監督タスクと下流タスクの間に不一致がある。
協調タスクテンプレートの恩恵を受けるために,グラフアライメント大言語モデル(GALLM)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:50:34 GMT)
Automatically Generating Visual Hallucination Test Cases for Multimodal Large Language Models [33.8] 視覚幻覚 (VH) は、マルチモーダル大言語モデル (MLLM) がプロンプトに対して誤った視覚的詳細を持つ応答を生成するときに発生する。
MLLMのVHテストケースを拡張するための最初の自動手法であるVHExpansionを紹介する。
また, 正解VHテストケース対の正解率を測定するための新しい評価基準, 対称精度も提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:56:16 GMT)
InvSeg: Test-Time Prompt Inversion for Semantic Segmentation [33.6] InvSegはセマンティックセグメンテーションのためのテストタイムプロンプトインバージョンメソッドである。
コントラストソフトクラスタリングを導入し,マスクを画像の構造情報と整合させる。
InvSegはコンテキストリッチなテキストプロンプトを埋め込み空間で学習し、モダリティ間の正確なセマンティックアライメントを実現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:20:31 GMT)
A Novel RFID Authentication Protocol Based on A Block-Order-Modulus Variable Matrix Encryption Algorithm [33.4] 低コストRFIDセンサタグを用いた移動無線周波数識別(RFID)システムの認証について検討した。
AM-SUEO-DBLTKMアルゴリズムは従来のアルゴリズムよりも99.59%のタグストレージを節約できることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:40:22 GMT)
Fractal Calibration for long-tailed object detection [33.2] 実世界のデータセットは不均衡な分布を辿り、希少なカテゴリーのオブジェクト検出において大きな課題を生じさせる。
近年の研究では、データセットのクラスを利用する再重み付けと再サンプリング手法の開発によってこの問題に対処している。
FRActal CALibration(FRACAL)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:55:10 GMT)
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis [33.1] 大規模言語モデル(LLM)は、プログラムを単一のパスで自動ソースで合成する。
我々はLintSeqと呼ばれる合成データ生成アルゴリズムを開発し、高品質なコード編集データを生成する。
編集シーケンスを微調整したモデルがベースライン合成よりも多様なプログラムを生成することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:42:01 GMT)
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis [33.1] 大規模言語モデル(LLM)は、プログラムを単一のパスで自動ソースで合成する。
我々はLintSeqと呼ばれる合成データ生成アルゴリズムを開発し、高品質なコード編集データを生成する。
編集シーケンスを微調整したモデルがベースライン合成よりも多様なプログラムを生成することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:42:01 GMT)
Search Engines in an AI Era: The False Promise of Factual and Verifiable Source-Cited Responses [32.5] 大規模言語モデル(LLM)ベースのアプリケーションは、研究のプロトタイプから数百万のユーザを対象とする製品へと発展しつつある。
有名な例としては、従来の検索エンジンに取って代わるLLMベースの生成検索エンジンであるAnswer Enginesがある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:50:31 GMT)
Bridging The Gap between Low-rank and Orthogonal Adaptation via Householder Reflection Adaptation [32.4] 家庭内リフレクション適応法 (HRA) は, 家庭内リフレクションに基づく簡易かつ効果的な適応法である。
HRAは、大きな言語モデルと条件付き画像生成装置を適用する際に、学習可能なパラメータが少なくて優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:34:03 GMT)
Bias Similarity Across Large Language Models [32.0] 機械学習モデルのバイアスは慢性的な問題である。
オープンソースとクローズドな10のLarge Language Modelを包括的に見ていきます。
モデル間のバイアスがどのように現れるかを理解するために、機能的類似度を測定します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:21:14 GMT)
Empirical Risk-aware Machine Learning on Trojan-Horse Detection for Trusted Quantum Key Distribution Networks [31.9] 量子鍵分散(QKD)は、送信中に高いレベルのデータセキュリティを提供する暗号技術である。
理論的概念と実践的実装のギャップの存在は、QKDネットワークの信頼性に関する懸念を引き起こしている。
本稿では,時間変動量子チャネル上でのトロイの木馬攻撃のリスク分析を行うリスク認識機械学習手法の実装を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:05:33 GMT)
Learning Quadruped Locomotion Using Differentiable Simulation [31.8] 微分可能シミュレーションは、高速収束と安定した訓練を約束する。
本研究はこれらの課題を克服するための新しい微分可能シミュレーションフレームワークを提案する。
我々のフレームワークは並列化なしで数分で四足歩行を学習できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:30:26 GMT)
Dual-Teacher Ensemble Models with Double-Copy-Paste for 3D Semi-Supervised Medical Image Segmentation [31.5] 半教師付き学習(SSL)技術は、3次元医用画像セグメンテーションの高ラベリングコストに対処する。
本稿では,サンプルの特性に基づいて異なるアンサンブル法を選択するSSE(Staged Selective Ensemble)モジュールを提案する。
3次元医用画像分割作業における提案手法の有効性を実験的に検証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:23:15 GMT)
Data-driven Design of Randomized Control Trials with Guaranteed Treatment Effects [31.2] まず,データ駆動スクリーニングで低インパクト処理を行い,第2段階では処理効果の低い2段階のRATを開発した。
2段RCTの最適設計を導出し, サンプル分割による実装を実証する。
そこで本研究は,RTTの高性能処理効果に対する高い確率性証明を簡易かつ効果的に推定する手法である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:56:13 GMT)
Adaptive Coordinators and Prompts on Heterogeneous Graphs for Cross-Domain Recommendations [31.1] 我々は,マルチドメイングラフを結合構造に統合するフレームワークHAGOを開発した。
また、ユニバーサルなマルチドメイングラフ事前学習戦略も開発している。
提案手法は,マルチドメインレコメンデーションシナリオにおいて最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:50:53 GMT)
A phase transition between positional and semantic learning in a solvable model of dot-product attention [31.0] 学習可能な,低次元の問合せとキーデータを備えた非次元自己注意層として,高次モデルドット積注意法について検討した。
位置注意機構(それぞれの位置に基づくトークンを含む)と意味注意機構(それぞれの意味に基づいて互いに結びついているトークンを含む)と、サンプルの複雑さが増大する前者から後者への遷移が示される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:54:06 GMT)
Phantom: General Trigger Attacks on Retrieval Augmented Language Generation [30.6] Retrieval Augmented Generation (RAG)は、現代の大規模言語モデル(LLM)の機能を拡張する
本稿では,RAGシステムの知識ベースに悪意ある文書を1つだけ注入し,バックドア中毒攻撃を行う新たな攻撃ベクトルを提案する。
我々はGemma、Vicuna、Llamaを含む複数のLLMアーキテクチャに対する攻撃を実演し、GPT-3.5 TurboおよびGPT-4への移行を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:56:58 GMT)
Learned Neural Physics Simulation for Articulated 3D Human Pose Reconstruction [30.5] 本稿では,接触を伴う人間の関節運動の力学をモデル化するための新しいニューラルネットワーク手法であるLARPを提案する。
私たちのニューラルアーキテクチャは、従来の物理シミュレータで一般的に見られる機能をサポートします。
LARPの価値を実証するために、既存のビデオベース再構成フレームワークにおける古典的非微分可能シミュレータの状態のドロップイン代替として使用します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:42:45 GMT)
Encourage or Inhibit Monosemanticity? Revisit Monosemanticity from a Feature Decorrelation Perspective [30.3] 単意味ニューロンは単一の概念と特定の概念に特化しており、ニューロンと概念の間に1対1の相関関係を形成する。
単調性探索の広範な研究にもかかわらず、単調性がモデル能力に有益か有害かは定かではない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:37:55 GMT)
SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars [30.3] SurFheadは、RGBビデオから2Dガウス波のサーベルを使って、トリガ可能な頭部形状を再構築する。
SurFheadは、極端なポーズであっても、通常と画像の両方の高忠実なレンダリングを保証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:19:58 GMT)
Progress Report: Towards European LLMs [30.2] プロジェクトOpenGPT-Xの事前結果を報告する。
このプロジェクトは欧州連合の24の公用語すべてをサポートする2つの多言語LLMを開発した。
モデルの開発原則、データ処理技術、トークン化ツールの最適化、トレーニング方法論について詳述する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:09:40 GMT)
Exploiting Risk-Aversion and Size-dependent fees in FX Trading with Fitted Natural Actor-Critic [30.0] 我々は、外国為替市場における日内価格パターンの認識と活用の可能性に焦点を当てる。
提案手法は,Fitted Natural Actor-Criticと呼ばれる強化学習アルゴリズムの実装を含む。
注文サイズに依存するため、トランザクションコストを現実的にモデル化するのに役立ちます。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:13:07 GMT)
MotionLCM: Real-time Controllable Motion Generation via Latent Consistency Model [29.9] この研究は、制御可能なモーション生成をリアルタイムレベルに拡張するMotionLCMを導入している。
まず, 遅延拡散モデルに基づく動き生成のための動き潜時一貫性モデル (MotionLCM) を提案する。
一段階(もしくは数段階)の推論を採用することにより、動作生成のための動き潜伏拡散モデルの実行効率をさらに向上する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:22:49 GMT)
Revisiting Benchmark and Assessment: An Agent-based Exploratory Dynamic Evaluation Framework for LLMs [29.7] 従来のQAベンチマークをより柔軟な戦略基準のフォーマットに拡張する**Benchmark+**と、より大きな探索のためにインタラクションプロセスを強化する**Assessment+**の2つの定義を導入する。
本稿では,この2つの概念を,検索拡張生成と強化学習によって実装したエージェントベース評価フレームワーク*TestAgent*を提案する。
垂直ドメインの評価をスクラッチからアクティベートする既存のベンチマークまで、さまざまなシナリオにおける *TestAgent* の有効性を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:20:42 GMT)
DyVo: Dynamic Vocabularies for Learned Sparse Retrieval with Entities [29.7] 学習されたスパース検索(LSR)モデルをウィキペディアの概念と実体で拡張する。
3つのエンティティリッチなドキュメントランキングデータセットを対象とした実験では、結果のDyVoモデルは、最先端のベースラインを大幅に上回る。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:58:37 GMT)
SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding [29.6] ギガピクセル全体の画像を理解可能な最初の視覚言語アシスタントであるSlideChatを紹介する。
その開発をサポートするために、WSIのための最大のインストラクションフォローデータセットであるSlideInstructionを作成しました。
一般的なMLLMと専門的なMLLMと比較して、SlideChatは22のタスクのうち18のタスクで最先端のパフォーマンスを達成する特別な能力を示している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:33:33 GMT)
Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs [29.6] 我々は、欧州連合の24の公用語すべてをサポートすることで、ヨーロッパの言語多様性を受け入れるように設計された2つの多言語LLMを提示する。
モデルの開発原則、すなわちデータ構成、トークン化最適化、トレーニング方法論について詳述する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:09:40 GMT)
Measuring Spiritual Values and Bias of Large Language Models [28.9] 大規模言語モデル(LLM)は、様々なバックグラウンドを持つユーザにとって不可欠なツールとなっている。
これらのモデルは、事前学習データに埋め込まれた言語的・文化的ニュアンスを反映している。
このデータに固有の値と視点は、LCMの挙動に影響を与え、潜在的なバイアスをもたらす。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:33:23 GMT)
Pose-dIVE: Pose-Diversified Augmentation with Diffusion Model for Person Re-Identification [28.8] Pose-dIVEは、スパースで表現不足な人間のポーズとカメラ視点の例をトレーニングデータに組み込んだ、新しいデータ拡張アプローチである。
我々の目標は、トレーニングデータセットを拡張して、既存のRe-IDモデルで人間のポーズやカメラ視点の変化に偏らない特徴を学習できるようにすることである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:41:53 GMT)
Enhancing and Assessing Instruction-Following with Fine-Grained Instruction Variants [28.7] 複雑な命令を単純なサブコンポーネントに分解し、それらを修正し、それらを新しい変種に再構成する手法を導入する。
DeMoReconに基づくFGIVデータセットは,1,773個のシード命令の微粒化を含む。
以上の結果から,FGIVを微調整したLDMは,命令追従ベンチマークと一般的な命令追従ベンチマークの両方において,大幅な性能向上が期待できることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:26:18 GMT)
On the Effectiveness of Dataset Alignment for Fake Image Detection [28.7] 優れた検出器は、セマンティックコンテンツ、解像度、ファイルフォーマットなどの画像特性を無視しながら、生成モデル指紋に焦点を当てるべきである。
この研究では、これらのアルゴリズムの選択に加えて、堅牢な検出器をトレーニングするためには、リアル/フェイク画像の整列したデータセットも必要である、と論じる。
そこで本研究では, LDMの家族に対して, LDMのオートエンコーダを用いて実画像の再構成を行う手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:58:07 GMT)
Xeno-learning: knowledge transfer across species in deep learning-based spectral image analysis [28.5] クセノラーニング(xeno-learning)は、クセノ移植に触発された異種間知識伝達パラダイムである。
臓器のスペクトルは種によって異なるが,共有の病態生理学的メカニズムは種間での相対的なスペクトル変化として表される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:25:16 GMT)
Neural Symbolic Regression of Complex Network Dynamics [28.4] そこで本研究では,物理インスパイアされたニューラルダイナミクス回帰(PI-NDSR)を用いて,力学の記号表現を自動的に学習する手法を提案する。
本手法は, 種々のダイナミックスから生成された合成データセットと, 病気の拡散に関する実際のデータセットについて検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:02:30 GMT)
Quadratic Gating Functions in Mixture of Experts: A Statistical Insight [28.2] 混合専門家モデル(MoE)は、計算効率を保ちながら、モデルのキャパシティのスケーリングに非常に効果的である。
我々は、MoEフレームワークとアテンションメカニズムの新たな接続を確立し、より表現力があり効率的な代替手段として2次ゲーティングがどのように機能するかを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:06:37 GMT)
Fostering Natural Conversation in Large Language Models with NICO: a Natural Interactive COnversation dataset [28.1] NICO(Natural Interactive Conversation)は、中国における対話型会話データセットである。
まず,GPT-4-turboを用いて対話草案を作成し,20の日常生活トピックと5種類のソーシャルインタラクションをカバーさせる。
不自然な文を識別・書き直しする2つの対話レベル自然な会話タスクと2つの文レベルタスクを定義する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:55:30 GMT)
Sequential LLM Framework for Fashion Recommendation [28.0] 本稿では,事前学習された大規模言語モデル(LLM)を活用し,レコメンデーション固有のプロンプトを付加したシーケンシャルなファッションレコメンデーションフレームワークを提案する。
本フレームワークでは,パラメータ効率のよいファインタニングと広範囲なファッションデータを導入し,テキストを関連製品に翻訳する新たなミックスアップ検索手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:54:27 GMT)
OMCAT: Omni Context Aware Transformer [27.7] OCTAVは、オーディオとビデオ間のイベント遷移をキャプチャするために設計された、新しいデータセットである。
OMCATはRoTEを活用する強力なモデルであり、時間依存タスクにおける時間的グラウンドリングと計算効率を向上させる。
本稿では,AVQA(Audio-Visual Question Answering)タスクとOCTAVベンチマークを用いて,時間的推論とモーダルアライメントの大幅な向上を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:16:28 GMT)
Tree of Attributes Prompt Learning for Vision-Language Models [27.6] 本稿では,各カテゴリに「概念-属性-記述」構造を持つ属性のツリーを生成する属性学習(TAP)を提案する。
非構造化記述の集合で単にカテゴリ名を拡大する既存の方法とは異なり、本手法は基本的に構造化知識グラフを蒸留する。
提案手法では,テキストと視覚のプロンプトを導入し,対応する視覚属性を明示的に学習し,ドメインの専門家として効果的に機能する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:37:39 GMT)
Do LLMs have Consistent Values? [27.6] 大規模言語モデル(LLM)技術は、人間のような対話に向けて常に改善されている。
価値は人間の行動の基礎となる基本的な推進力であるが、LLMによって生成されたテキストで表される価値を研究するための研究はほとんど行われていない。
我々は,LLMが,値のランク付けや値の相関など,人間で実証されたのと同じ値構造を示すかどうかを問う。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:29:29 GMT)
ReDeEP: Detecting Hallucination in Retrieval-Augmented Generation via Mechanistic Interpretability [27.3] パラメトリック(内部)知識の不足によって引き起こされる幻覚。
このような幻覚を検出するには、Large Language Models (LLM) が外部とパラメトリックの知識をどのように利用するかを理解する必要がある。
本稿では,LLMの外部文脈とパラメトリック知識を分離して幻覚を検出する手法であるReDeEPを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:02:09 GMT)
GraphCLIP: Enhancing Transferability in Graph Foundation Models for Text-Attributed Graphs [27.2] GraphCLIPは、強力なクロスドメインゼロ/フェーショット転送可能性を持つグラフ基盤モデルを学習するためのフレームワークである。
LLMの助けを借りて、大規模グラフ-土木ペアデータを生成し、キュレートする。
数ショットの学習では,事前学習目標に沿った新しいグラフプロンプトチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:45:35 GMT)
GraphCLIP: Enhancing Transferability in Graph Foundation Models for Text-Attributed Graphs [27.2] GraphCLIPは、強力なクロスドメインゼロ/フェーショット転送可能性を持つグラフ基盤モデルを学習するためのフレームワークである。
LLMの助けを借りて、大規模グラフ-土木ペアデータを生成し、キュレートする。
数ショットの学習では,事前学習目標に沿った新しいグラフプロンプトチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:45:35 GMT)
DRACO: A Denoising-Reconstruction Autoencoder for Cryo-EM [27.1] DRACOは低温電子顕微鏡(cryo-EM)画像のためのデノイング・リコンストラクション・オートエンコーダである。
270,000本以上の映画やマイクログラフを含む、未処理の公開データベースから高品質で多様なデータセットを構築します。
DRACOは、最先端のベースラインと比較して、デノイング、マイクログラフキュレーション、パーティクルピッキングのタスクで最高のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:12:11 GMT)
Edge Unlearning is Not "on Edge"! An Adaptive Exact Unlearning System on Resource-Constrained Devices [26.9] 忘れられる権利は、機械学習モデルがデータ所有者のデータと訓練されたモデルからの情報の消去を可能にすることを義務付ける。
本稿では,ネットワークエッジ(CAUSE)における制約対応適応エクササイズ学習システムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:29:47 GMT)
Edge Unlearning is Not "on Edge"! An Adaptive Exact Unlearning System on Resource-Constrained Devices [26.9] 忘れられる権利は、機械学習モデルがデータ所有者のデータと訓練されたモデルからの情報の消去を可能にすることを義務付ける。
本稿では,ネットワークエッジ(CAUSE)における制約対応適応エクササイズ学習システムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:29:47 GMT)
Any2Graph: Deep End-To-End Supervised Graph Prediction With An Optimal Transport Loss [26.8] 我々は,SGP(End-to-end Supervised Graph Prediction)のための汎用フレームワークであるAny2graphを提案する。
このフレームワークは、新しい最適輸送損失である、部分的にマス化されたグロモフ=ワッサーシュタインの上に構築されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:18:37 GMT)
Bypassing the Exponential Dependency: Looped Transformers Efficiently Learn In-context by Multi-step Gradient Descent [26.8] 線形ループ変換器は、コンテキスト内学習において、多段階勾配勾配を効率よく実装できることを示す。
この結果から,入力データが一定条件数である場合,$n = O(d)$であれば,線形ループ変換器の誤差は小さくなることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:44:23 GMT)
The Generation Gap: Exploring Age Bias in the Value Systems of Large Language Models [26.5] 特に米国人口と比較して,若年層に対するLLM(Large Language Models)値の一般的な傾向を見出した。
一般的な傾きは観察できるが、若いグループに対するこの傾きは、異なる値のカテゴリで異なることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:10:09 GMT)
From Real Artifacts to Virtual Reference: A Robust Framework for Translating Endoscopic Images [26.3] 内視鏡的画像検査では,術前データと術中画像の併用が手術計画やナビゲーションに重要である。
既存のドメイン適応法は、生体内アーティファクトによる分布シフトによって妨げられる。
本稿では,アーチファクト・レジリエントな画像翻訳手法とそれに関連するベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:41:52 GMT)
Offline Model-Based Optimization by Learning to Rank [26.2] 我々は、平均二乗誤差(MSE)で訓練された回帰モデルは、オフラインモデルに基づく最適化の第一目標とうまく一致していないと論じる。
そこで本稿では,学習手法のランク付けに活用し,相対的なスコアに基づいて有望な設計を優先順位付けするランキングベースモデルを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:15:03 GMT)
Spatio-Temporal Distortion Aware Omnidirectional Video Super-Resolution [26.2] ビデオの解像度を高めるためにビデオ超解像法 (VSR) が提案されているが, ODVの投影歪みは直接的にこのような手法を適用できない。
超高解像度再構成品質を実現するために,新しい時空間歪み認識ネットワーク(STDAN)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:17:19 GMT)
Augmentation-Driven Metric for Balancing Preservation and Modification in Text-Guided Image Editing [26.1] 我々は,対象のテキストに最小限の変更を加えて一致させる理想的編集画像の表現を推定するtextttAugCLIPを提案する。
様々な編集シナリオを含む5つのベンチマークデータセットに関する実験により、texttAugCLIPは既存のメトリクスと比較して、人間の評価基準と極めてよく一致していることが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:12:54 GMT)
Beyond Numeric Awards: In-Context Dueling Bandits with LLM Agents [25.8] 本稿では,Dueling Bandits (DB) の文脈における意思決定者としてのLarge Language Models (LLMs) の性能について,初めて考察する。
以上の結果から,LPM,特にGPT-4 Turboはコンドルセットの勝者を迅速に同定し,現状のアルゴリズムよりも弱い後悔度で優れた結果を得た。
これらの問題を解決するために,LLMの文脈内決定能力と従来のDBアルゴリズムから継承された理論的保証を両立するLEAD(LLM-Enhanced Adaptive Dueling)というハイブリッドアルゴリズムを導入する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:46:28 GMT)
Free Hunch: Denoiser Covariance Estimation for Diffusion Models Without Extra Costs [25.8] 共分散情報は、学習データ及び生成軌道の曲率から自由に利用できる。
ノイズレベル間で共分散推定を伝達する新しい手法である Em (i) を用いて,これらの情報ソースを統合する。
この手法を線形逆問題に対して検証し、最近のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:23:09 GMT)
VidCompress: Memory-Enhanced Temporal Compression for Video Understanding in Large Language Models [25.7] VidCompressは、メモリ拡張時間圧縮を備えた新しいビデオLLMである。
複雑な時間空間関係を効率的にモデル化し、既存のビデオLLMを著しく上回る。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:07:25 GMT)
QUEST: Quality-Aware Metropolis-Hastings Sampling for Machine Translation [25.2] 本稿では,ギブス分布のエネルギー関数として,ノイズ品質推定の過度な信頼を回避するための簡易かつ効果的な手法を提案する。
分布のモードを探す代わりに、メトロポリス・ハスティングスアルゴリズムを用いて高密度領域から複数のサンプルを生成する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:30:29 GMT)
FOOGD: Federated Collaboration for Both Out-of-distribution Generalization and Detection [25.0] Federated Learning(FL)は、クライアントモデルと連携してグローバルな知識を捉える、有望な機械学習パラダイムである。
実世界のシナリオにFLモデルをデプロイすることは、分布内データと予期せぬ分布外データの共存のため、依然として信頼性が低い。
本稿では,各クライアントの確率密度を推定し,信頼性の高いグローバル分布を求めるFOOGDを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:39:31 GMT)
Y-Mol: A Multiscale Biomedical Knowledge-Guided Large Language Model for Drug Development [24.6] Y-Mol は知識誘導型 LLM であり、鉛化合物発見、プリクリニック、クリニック予測といったタスクをこなすように設計されている。
出版物、知識グラフ、専門家が設計した合成データから学習する。
Y-Molは、鉛化合物の発見、分子特性の予測、薬物相互作用のイベントの同定において、汎用LLMよりも著しく優れている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:39:20 GMT)
The Age of DDoScovery: An Empirical Comparison of Industry and Academic DDoS Assessments [24.6] 我々はまず、2022年の商業利害関係者の観測からトレンドや一貫性を抽出する24の業界レポートを分析した。
そして、業界と学術ソースにまたがる10のデータセットを4年(2019-2023)にわたって分析し、不一致を発見し説明します。
2021-2022年のスプーフ型リフレクション増幅攻撃で、業界が報告した相対的な減少を調査するために、学術データソースを使用します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:45:58 GMT)
Guarantees for Nonlinear Representation Learning: Non-identical Covariates, Dependent Data, Fewer Samples [24.5] 我々は、関数クラス$mathcal F times Mathcal G$から、T+1$関数$f_star(t) circ g_star$を学習する際のサンプル複雑度について研究する。
タスク数が$T$になるにつれて、サンプル要件とリスクバウンドの両方が$r$次元回帰に収束することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:20:19 GMT)
Few shot chain-of-thought driven reasoning to prompt LLMs for open ended medical question answering [24.4] 我々はMedQA-USMLEデータセットの修正版であるMedQA-OPENを提案する。
臨床シナリオを模倣する選択肢のないオープンエンドの医療質問と、臨床者が承認した理性的な回答を含んでいる。
思考の連鎖(CoT)推論(CLINICR)によって駆動されるプロンプトを実装し,漸進的推論の過程を反映する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:03:11 GMT)
Simultaneous Diffusion Sampling for Conditional LiDAR Generation [24.4] 本稿では,シーンの3次元構造に条件付き点雲を生成するための同時拡散サンプリング手法を提案する。
提案手法は, 高精度で幾何的に一貫した拡張をクラウドスキャンに向けることができ, 様々なベンチマークにおいて, 既存の手法よりも優れた性能が得られる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:15:04 GMT)
EVA-Score: Evaluation of Long-form Summarization on Informativeness through Extraction and Validation [24.3] EVA-Scoreは抽象的な長文要約の評価指標である。
EVAスコアは人間との相関が最も高いことを示す。
また,LLMの長文要約性能を情報の観点から再評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:17:09 GMT)
EVA-Score: Evaluating Abstractive Long-form Summarization on Informativeness through Extraction and Validation [24.3] EVA-Scoreは抽象的な長文要約の評価指標である。
EVAスコアは人間との相関が最も高いことを示す。
また,LLMの長文要約性能を情報の観点から再評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:17:09 GMT)
Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions [24.2] 大規模言語モデル(MLLM)における幻覚に対処するMagPrompt(MagPrompt)を提案する。
MagPromptは以下の2つの重要な原則に基づいており、様々な効果的なプロンプトの設計をガイドしている。
GPT-4oやGemini-proといったオープンソースおよびクローズドソースモデルに適用することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:39:37 GMT)
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation [24.2] 生成基盤モデルであるMetaEarthについて,画像生成をグローバルなレベルに拡大することで障壁を破る。
MetaEarthでは,地理的解像度の広い任意の領域で画像を生成するための自己カスケード型自己カスケード生成フレームワークを提案する。
我々のモデルは、革新的なオーバヘッドの観点から地球視覚をシミュレートすることで、生成的世界モデルを構築する新たな可能性を開く。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:42:36 GMT)
Overcoming Domain Limitations in Open-vocabulary Segmentation [24.2] Open-vocabulary segmentation (OVS)は、幅広いクラスを認識する能力に注目を集めている。
OVSモデルは、以前のトレーニングデータセットを超えて、目に見えないドメインに適用されると、大幅なパフォーマンス低下を示す。
我々は,OVSモデルが事前知識を維持しつつ,新たなドメインから情報を学ぶことができる方法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:11:41 GMT)
EasyRAG: Efficient Retrieval-Augmented Generation Framework for Network Automated Operations [24.1] EasyRAGは、ネットワーク自動操作のための検索拡張された生成フレームワークである。
準決勝ではGLM4トラックで1位、準決勝では2位となった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:21:27 GMT)
Advancing the Understanding of Fixed Point Iterations in Deep Neural Networks: A Detailed Analytical Study [24.0] ニューラルネットワークによってモデル化されたベクトル値関数において、固定点反復の詳細な解析を行う。
我々は、様々な入力領域に基づいて、ループニューラルネットワークの複数の固定点が存在するための十分な条件を確立する。
我々の手法はニューラルネットワークのメカニズムの理解を深めるかもしれない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:57:02 GMT)
BlendRL: A Framework for Merging Symbolic and Neural Policy Learning [23.9] BlendRLは、論理とニューラルポリシーの混合を使用するRLエージェントに両方のパラダイムを統合する、ニューラルシンボリックなRLフレームワークである。
我々は,BlendRLエージェントが標準アタリ環境において,ニューラルベースラインとシンボリックベースラインの両方より優れていることを実証的に実証した。
ニューラルポリシーとシンボリックポリシーの相互作用を分析し、それらのハイブリッド利用がエージェントの制限を克服するのにどのように役立つかを説明する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:24:20 GMT)
CtrlSynth: Controllable Image Text Synthesis for Data-Efficient Multimodal Learning [23.6] 我々は,データ効率とロバスト学習のためのエンファンコントロール可能な画像テキスト合成パイプラインであるCtrl Synthを設計する。
Ctrl Synthは、ユーザがカスタマイズされたコントロールポリシーを定義することで、きめ細かい方法でデータ合成を制御することができる。
Ctrl Synthは,CLIPモデルのゼロショット分類,画像テキスト検索,合成推論性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:06:41 GMT)
Adversarially Guided Stateful Defense Against Backdoor Attacks in Federated Deep Learning [23.5] 既存のディフェンスクラスタは、クライアントから更新を送信し、アグリゲーションに最適なクラスタを選択する。
現実的なFL設定では,SOTA(State-of-the-art Defenses)はFLのバックドア攻撃に対して良好に対処する。
本稿では,Deep Neural Networks (DNN) に対するバックドア攻撃に対するAdversarially Guided Stateful Defense (AGSD) を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:45:19 GMT)
AdvBDGen: Adversarially Fortified Prompt-Specific Fuzzy Backdoor Generator Against LLM Alignment [23.5] 本稿では,プロンプト固有のバックドアを自動的に生成する,逆向きに強化された生成ファインチューニングフレームワークであるAdvBDGenを提案する。
AdvBDGenは、バックドアのインストール性とステルス性を確保するために、敵によって強化されたジェネレータと差別器のペアを使用している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:05:56 GMT)
Towards Rationality in Language and Multimodal Agents: A Survey [23.5] 合理性は理性によって導かれる性質であり、証拠や論理原理と整合した意思決定によって特徴づけられる。
近年,マルチモーダルシステムやマルチエージェントシステムへの取り組みが進んでいる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:11:42 GMT)
Towards Defining an Efficient and Expandable File Format for AI-Generated Contents [23.2] 我々は,AIGC画像の超低符号化を可能にするAIGIFという,AIGC画像の新しいファイルフォーマットを提案する。
以上の3つの要素を組み込んだよく設計された構成可能なビットストリーム構造が,最大1/10,000の圧縮比を達成できることを実験的に確認した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:26:14 GMT)
Toward Defining an Efficient and Expandable File Format for AI-Generated Contents [23.2] 我々は,AIGC画像の超低符号化を可能にするAIGIFという,AIGC画像の新しいファイルフォーマットを提案する。
以上の3つの要素を組み込んだよく設計された構成可能なビットストリーム構造が,最大1/10,000の圧縮比を達成できることを実験的に確認した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:26:14 GMT)
DySpec: Faster Speculative Decoding with Dynamic Token Tree Structure [23.1] 動的トークンツリー構造を持つ高速な投機的復号アルゴリズムであるDySpecを提案する。
低温条件下では、DySpecはスループットを9.1$times$に改善し、レイテンシをLlama2-70Bで9.4$times$に削減できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:21:15 GMT)
Bridging Large Language Models and Graph Structure Learning Models for Robust Representation Learning [23.0] グラフ表現学習は現実世界のアプリケーションには不可欠だが、広範にわたるノイズに遭遇することが多い。
本稿では,事前学習された言語モデルとグラフ構造学習モデルの相補的な長所を統合するフレームワークであるLangGSLを紹介する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:43:32 GMT)
WEAR: An Outdoor Sports Dataset for Wearable and Egocentric Activity Recognition [23.0] 視覚と慣性に基づく人間活動認識(HAR)のための屋外スポーツデータセットWEARを紹介する。
合計18種類のワークアウト活動を行う22人の被験者のデータを,11箇所の外部で記録した同期慣性(アクセラレーション)とカメラ(エゴセントリックビデオ)データを用いて収集した。
ベンチマークの結果,センサ配置により,各モードが予測性能に相補的な強度と弱点を与えることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:48:59 GMT)
MedSyn: Text-guided Anatomy-aware Synthesis of High-Fidelity 3D CT Images [22.5] 本稿では,テキスト情報によって誘導される高品質な3次元肺CT画像を作成するための革新的な手法を提案する。
現在の最先端のアプローチは、低解像度の出力に限られており、放射線学レポートの豊富な情報を不活用している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:56:57 GMT)
Fast Second-Order Online Kernel Learning through Incremental Matrix Sketching and Decomposition [22.4] オンライン学習(OKL)は、ストリーミング環境での予測性能が期待できるため、かなりの研究関心を集めている。
既存の2次OKLアプローチは、予め設定された予算に関して、少なくとも2次時間の複雑さに悩まされている。
本稿では,2次OKLに適した高速増分行列スケッチと分解手法FORTSを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:07:48 GMT)
Efficient Diffusion Models: A Comprehensive Survey from Principles to Practices [22.3] 拡散モデルは、様々な生成タスクにおいて、着実に優れた優位性を示している。
この調査は、アーキテクチャ設計、モデルトレーニング、高速な推論、信頼性のあるデプロイメントにおける深い原則と効率的なプラクティスに焦点を当てます。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:19:46 GMT)
Geometric Inductive Biases of Deep Networks: The Role of Data and Architecture [22.2] ニューラルネットワークをトレーニングする場合、入力空間の曲率はそのアーキテクチャによって決定される変換の下で不変である。
平均幾何が低ランクである場合(例えばResNetの場合)、幾何学は入力空間の部分集合にのみ変化する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:46:09 GMT)
SciDoc2Diagrammer-MAF: Towards Generation of Scientific Diagrams from Documents guided by Multi-Aspect Feedback Refinement [22.1] 本稿では,学術論文から関連情報を抽出し,図を生成するSciDoc2Diagramを提案する。
中間コード生成を用いたユーザ意図に基づく図を生成するパイプラインSciDoc2Diagrammerを開発した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:01:55 GMT)
SciDoc2Diagrammer-MAF: Towards Generation of Scientific Diagrams from Documents guided by Multi-Aspect Feedback Refinement [22.1] 本稿では,学術論文から関連情報を抽出し,図を生成するSciDoc2Diagramを提案する。
中間コード生成を用いたユーザ意図に基づく図を生成するパイプラインSciDoc2Diagrammerを開発した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:01:55 GMT)
LoKO: Low-Rank Kalman Optimizer for Online Fine-Tuning of Large Models [21.9] 数百万から数十億のパラメータを持つ大規模モデルをスクラッチからトレーニングすると、かなりの計算コストが発生する。
低ランク適応 (LoRA) を用いて, 勾配に基づく特定のタスクに対して, パラメータ数の削減のみを適応させる。
我々は、十分に確立されたコンピュータビジョンと言語モデルでうまく機能する堅牢なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:41:31 GMT)
CONSULT: Contrastive Self-Supervised Learning for Few-shot Tumor Detection [21.8] CONSULT(Contrastive Self-SUpervised Learning for few-shot tumor detection)と呼ばれる新しい2段階異常検出アルゴリズムを提案する。
CONSULTは、MRI脳画像に特化して訓練済みの機能抽出器を微調整し、合成データ生成パイプラインを使用して腫瘍のようなデータを生成する。
第1段階は、文脈対応コントラスト学習と自己監督型特徴逆学習を取り入れた高変量データの特徴抽出において、現在の異常検出の欠点を克服することである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:09:28 GMT)
Beyond the Comfort Zone: Emerging Solutions to Overcome Challenges in Integrating LLMs into Software Products [21.5] 大規模言語モデル(LLM)は、様々な産業にまたがるソフトウェア製品にますます組み込まれています。
この研究では、ソフトウェア開発者が直面した課題をナビゲートするために採用している、新たなソリューションについて検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:11:10 GMT)
Predicting from Strings: Language Model Embeddings for Bayesian Optimization [21.4] 文字列入力に対してコンテキスト内回帰を適用するパラダイムである Embed-then-Regress を提案する。
すべての入力を文字列として表現することで、様々な領域に対して最適化のための汎用回帰を行うことができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:23:08 GMT)
Predicting from Strings: Language Model Embeddings for Bayesian Optimization [21.4] 文字列入力に対してコンテキスト内回帰を適用するパラダイムである Embed-then-Regress を提案する。
すべての入力を文字列として表現することで、さまざまなドメインに対して最適化のための汎用回帰を行うことができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:23:08 GMT)
Discovering Knowledge-Critical Subnetworks in Pretrained Language Models [21.3] 事前訓練言語モデル(LM)は、そのパラメータにおける知識の暗黙的な表現を符号化する。
これらの表現をローカライズし、それらを互いに切り離すことは、未解決の問題である。
本稿では、重みとニューロンの両方に適用可能な多目的微分可能なマスキング手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:12:22 GMT)
Breaking Modality Gap in RGBT Tracking: Coupled Knowledge Distillation [21.2] RGBと熱赤外(TIR)画像のモダリティギャップは重要な問題であるが、既存のRGBT追跡手法では見落とされがちである。
そこで本研究では,モダリティギャップを壊すために,異なるモダリティの共通スタイルを追求する,CKDと呼ばれる新しい知識蒸留フレームワークを提案する。
特に,2つの学生ネットワークを導入し,そのスタイル特性を一貫性のあるものにするために,スタイル蒸留損失を用いる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:22:58 GMT)
U-MedSAM: Uncertainty-aware MedSAM for Medical Image Segmentation [21.1] 我々は、MedSAMモデルと不確実性認識損失関数とシャープネス認識最小化(SharpMin)を統合した新しいモデルU-MedSAMを提案する。
SharpMinは、ロスランドスケープにフラットなミニマを見つけることで、一般化を改善し、オーバーフィッティングを減らす。
The CVPR24 MedSAM on Laptop Challengeでは,U-MedSAMが有望な性能を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:54:44 GMT)
On the Training Convergence of Transformers for In-Context Classification [21.0] 本研究は、文脈内分類タスクのための変圧器の訓練力学を理論的に研究することを目的とする。
本研究では, ある仮定の下でのガウス混合の文脈内分類において, 勾配勾配から学習した単層変圧器が線形速度で大域的最適モデルに収束することを示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:57:14 GMT)
GS^3: Efficient Relighting with Triple Gaussian Splatting [21.0] 我々はポイントライトの入力画像から、リアルタイムで高品質な光とビューを提示する。
各空間ガウスに対して有効反射関数としてランベルティアン+角ガウスの混合を用いる。
我々は,1つのコモディティGPU上で40~70分,レンダリング速度90fpsのトレーニング時間を達成した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:11:30 GMT)
Towards Fair Graph Representation Learning in Social Networks [20.8] 本稿では, 十分性, 自立性, 分離性という3つの原則に基づいて, 公正表現学習の制約を導入する。
EAGNN法がグループフェアネスを効果的に達成できることを理論的に実証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:57:02 GMT)
Enhancing Unimodal Latent Representations in Multimodal VAEs through Iterative Amortized Inference [20.8] マルチモーダル変分オートエンコーダ(VAE)は、異なるデータモダリティからの情報を統合することで、共有潜在表現をキャプチャすることを目的としている。
重要な課題は、あらゆる可能なモダリティの組み合わせに対して、非現実的な数の推論ネットワークを訓練することなく、任意のモダリティのサブセットから正確に表現を推論することである。
本稿では,マルチモーダルVAEフレームワーク内での反復的改善機構であるマルチモーダル反復補正推論を導入する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:49:38 GMT)
GSE: Group-wise Sparse and Explainable Adversarial Attacks [20.1] スパース敵は、最小ピクセルの摂動によって、愚かなディープニューラルネットワーク(DNN)を攻撃します。
近年の取り組みは、この標準を核グループノルムのようなスパーシティ正則化器に置き換えて、グループワイドの敵攻撃を作らせている。
本稿では,意味的意味のある画像内のグループワイドアタックを生成する2相アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:43:27 GMT)
Understanding Likelihood Over-optimisation in Direct Alignment Algorithms [20.0] ダイレクトアライメントアルゴリズム(DAA)は、ヒューマンフィードバックによるオンライン強化学習の代替として登場した。
これらのアルゴリズムは、より良い(好ましくない)完了を生成する可能性を高めつつ、悪い(好ましくない)完了を阻止することを目的としている。
本研究は,最先端DAAにおける完成可能性とモデル性能の関係について検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:14:22 GMT)
Toward Efficient Kernel-Based Solvers for Nonlinear PDEs [20.0] 本稿では,非線形偏微分方程式(PDE)を効率的に解くための新しいカーネル学習フレームワークを提案する。
カーネルに微分演算子を埋め込む最先端のカーネルソルバとは対照的に,本手法ではこれらの演算子をカーネルから排除する。
我々は、標準カーネル形式を用いて解をモデル化し、導関数を計算するために補間剤を区別する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:00:43 GMT)
Learning Goal-oriented Bimanual Dough Rolling Using Dynamic Heterogeneous Graph Based on Human Demonstration [19.7] ソフトオブジェクト操作はロボットにとって重要な課題であり、状態表現と操作ポリシー学習に効果的な技術を必要とする。
本研究では,目標指向のソフトオブジェクト操作ポリシーを学習するための動的ヘテロジニアスグラフベースモデルを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:12:00 GMT)
Improving semantic understanding in speech language models via brain-tuning [19.7] 言語モデルは、自然言語に対する人間の脳反応と驚くほど一致している。
現在のモデルは低レベルの音声機能に大きく依存しており、脳関連セマンティクスが欠如していることを示している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:39:10 GMT)
Improving semantic understanding in speech language models via brain-tuning [19.7] 言語モデルは、人間の脳の自然言語に対する反応と驚くほど一致している。
現在のモデルは低レベルの音声機能に大きく依存しており、脳関連セマンティクスが欠如していることを示している。
我々は、fMRI記録による微調整により、脳関連バイアスを直接モデルに誘導することで、この制限に対処する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:39:10 GMT)
The Fair Language Model Paradox [19.4] 大規模言語モデル(LLM)は現実世界のアプリケーションに広くデプロイされているが、トークンレベルでのトレーニングダイナミクスについてはほとんど知られていない。
重みの減衰が増加するにつれて、低周波トークンは不均等に劣化することを示す。
これらの無視された低周波トークンは、ほとんどの言語におけるトークン分布の大部分を表わしているため、これは特に関係している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:47:12 GMT)
Do LLMs Have the Generalization Ability in Conducting Causal Inference? [19.4] 本研究では,Large Language Models (LLMs) の未知現象に対する一般化能力を評価する。
LLMは単純なCP、FI、複雑なCIの問題を解く際に優れた一般化性能を示す。
現象の名前が既存の用語を含む場合、その一般化性能はよく知られた用語からの干渉によって妨げられる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:23:31 GMT)
RAUCA: A Novel Physical Adversarial Attack on Vehicle Detectors via Robust and Accurate Camouflage Generation [19.3] 本稿では,頑健で正確なカモフラージュ生成手法であるRAUCAを提案する。
RAUCAのコアはニューラルレンダリングコンポーネントであるNeural Renderer Plus(NRP)で、車両のテクスチャを正確に投影し、照明や天気などの環境特性を持つ画像を描画することができる。
6つの一般的な物体検出器の実験結果から、RAUCAはシミュレーションと実世界の両方の設定において、既存の手法を一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:36:19 GMT)
RuleRAG: Rule-guided retrieval-augmented generation with language models for question answering [19.1] LMを用いたルールガイド型検索生成を提案する。
それは、レトリバーが規則の方向に論理的に関連のある文書を検索するように誘導する。
ジェネレータを一様に誘導し、同じルールの集合による回答を生成する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:51:45 GMT)
Leveraging Structure Knowledge and Deep Models for the Detection of Abnormal Handwritten Text [19.1] 構造知識と手書きテキストの深層モデルを組み合わせた2段階検出アルゴリズムを提案する。
新たな半教師付きコントラストトレーニング戦略によって訓練された形状回帰ネットワークを導入し、文字間の位置関係を十分に活用する。
2つの手書きテキストデータセットを用いた実験により,提案手法は検出性能を大幅に向上できることが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:57:10 GMT)
CrediRAG: Network-Augmented Credibility-Based Retrieval for Misinformation Detection in Reddit [19.0] 本稿では、言語モデルとリッチな外部政治知識ベースへのアクセスを組み合わせた最初の偽ニュース検出モデルであるCrediRAGを紹介する。
CrediRAGはニュースレトリバーを使用して、類似のニュース記事のソース信頼性に基づいて、当初各投稿に誤報スコアを割り当てる。
その結果,F1スコアが11%増加し,最先端手法による誤字検出が可能となった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:58:42 GMT)
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling [18.9] 本稿では,ユーザの指示に従って画像が合成される条件付き画像生成の課題に焦点をあてる。
報酬モデルからの不正確なフィードバックの悪影響を低減するために,不確実性を考慮した報酬モデルCtrl-Uを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:43:51 GMT)
Process Reward Model with Q-Value Rankings [18.9] プロセス・リワード・モデリング(PRM)は複雑な推論と意思決定に不可欠である。
本稿では,マルコフ決定プロセスの文脈でPRMを再定義する新しいフレームワークであるProcess Q-value Model(PQM)を紹介する。
PQMは、新しい比較損失関数に基づいてQ値ランキングを最適化し、シーケンシャルな決定の中で複雑なダイナミクスをキャプチャするモデルの能力を向上する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:10:34 GMT)
Exploring and Addressing Reward Confusion in Offline Preference Learning [18.9] 報酬モデルのトレーニングデータにおけるすっきりとした相関は、人間からの強化学習が望ましい目標を特定し、望ましくない行動を引き起こすのを防ぐことができる。
本稿では、特にオフラインデータに急激な相関が存在する場合、オフラインRLHFは、混乱に報いる可能性があることを示す。
本研究では,グローバルな選好連鎖を構築しながら,嗜好の推移性を活用することで,報酬の混乱を著しく低減する手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:22:19 GMT)
Feature-guided score diffusion for sampling conditional densities [18.9] 投影されたスコアで拡散を誘導するアルゴリズムを導入する。
投影されたスコアと特徴ベクトルは同じネットワークで学習される。
このアルゴリズムは条件付けクラスから高品質で多様なサンプルを生成することができることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:33:10 GMT)
Multi-modal Data based Semi-Supervised Learning for Vehicle Positioning [18.8] 基地局によって車両位置が決定される屋外位置決めシステムを考える。
事前訓練段階では、画像から得られる方位角をラベルなしCSIデータのラベルとみなす。
下流トレーニング段階では、正確な車両位置をラベルとしてみなす小さなラベル付きデータセットを用いてモデルを再訓練する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:04:28 GMT)
Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions [18.6] 強化学習では、DDPGやTD3のような非政治的アクター批判的アプローチは決定論的政策勾配に基づいている。
i) 複数のアクターを用いてQ値の最大化動作を評価すること,(ii)勾配法で最適化し易いQ値関数を学習すること,の2つの単純な知見を組み合わせた新しいアクタアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:58:03 GMT)
Layer-wise Importance Matters: Less Memory for Better Performance in Parameter-efficient Fine-tuning of Large Language Models [18.6] Importance-Aware Sparse Tuning (IST) は、様々なPEFTメソッドと互換性があり、層ごとに動作する。
ISTはPEFTモジュールで選択したレイヤを動的に更新し、メモリ要求を減らした。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:53:26 GMT)
On Rank-Dependent Generalisation Error Bounds for Transformers [18.6] 線形関数クラスに対して様々な被覆数境界を導入し、それぞれが入力ノルムと行列ノルムに関する異なる制約を課す。
次に、これらの境界を適用して、単層変圧器の一般化誤差を導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:14:04 GMT)
GOVERN: Gradient Orientation Vote Ensemble for Multi-Teacher Reinforced Distillation [18.5] 本稿では,この問題に対処するための新しいアルゴリズムGOVERNを提案する。
GOVERNはオフラインとオンラインの両方の実験で大幅に改善されている。
実験の結果、GOVERNは99.5%のパフォーマンスを達成するために、アンサンブル法の推論予算の1%しか必要としないことがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:01:11 GMT)
Nudging: Inference-time Alignment via Model Collaboration [18.5] 我々は,任意のベースモデルを小さなアライメントモデルを用いて推論時に整列するプラグアンドプレイアルゴリズムであるnudgingを提案する。
看護は、アライメントがスタイリスティックトークンの小さなサブセット上でのモデルの振る舞いを主に変えるという最近の発見によって動機付けられている。
3つのモデルファミリーと13のタスクにまたがるヌードの有効性を評価し、推論、一般的な知識、指示追従、安全性ベンチマークについて検討した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:07:01 GMT)
Nudging: Inference-time Alignment via Model Collaboration [18.5] 我々は,任意のベースモデルを小さなアライメントモデルを用いて推論時に整列するプラグアンドプレイアルゴリズムであるnudgingを提案する。
看護は、アライメントがスタイリスティックトークンの小さなサブセット上でのモデルの振る舞いを主に変えるという最近の発見によって動機付けられている。
3つのモデルファミリーと13のタスクにまたがるヌードの有効性を評価し、推論、一般的な知識、指示追従、安全性ベンチマークについて検討した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:07:01 GMT)
DiaSynth -- Synthetic Dialogue Generation Framework [18.4] Dia Synthは、さまざまなドメインにわたる高品質でコンテキストに富んだ対話を生成することができる合成対話生成フレームワークである。
我々のアプローチは、シミュレーションされたペルソナ、サブトピック、多様な会話特性を含む対話を動的に生成することで、既存のフレームワークと異なる。
我々は,異なるLLMを用いて合成データを生成し,DialogSum とSAMSum を例に挙げて実験を行った。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:55:27 GMT)
Boosting Logical Fallacy Reasoning in LLMs via Logical Structure Tree [18.4] 本稿では,関係接続子とその引数間の階層的論理フローを表現・追跡する論理構造木を構築することを提案する。
具体的には、この論理構造木は、選挙区木と10の共通論理関係のための接続性の分類によって導かれる教師なしの方法で構築される。
論理構造木をLLMに組み込むための2つの戦略を開発した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:35:50 GMT)
Differential Privacy of Cross-Attention with Provable Guarantee [18.3] 我々は,クロスアテンションのプライバシセキュリティに理論的保証を与えるために,新たな差分プライバシ(DP)データ構造を設計する。
我々の結果は、ユーザが意図的にクロスアテンションシステムに攻撃できる適応的なクエリに対して堅牢である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:19:15 GMT)
Almost Sure Convergence of Linear Temporal Difference Learning with Arbitrary Features [18.3] この研究は、線形独立な特徴を必要とせず、線形TDのほぼ確実に収束を確立する最初のものである。
解析の鍵となるのは、線形TDの平均ODEの有界不変集合の新たな特徴付けである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:50:02 GMT)
Prompt a Robot to Walk with Large Language Models [18.2] 巨大な言語モデル(LLM)は、大規模なインターネットスケールのデータで事前訓練されている。
物理的環境から収集した数発のプロンプトを使用する新しいパラダイムを導入する。
様々なロボットと環境をまたいだ実験により、我々の手法がロボットに歩行を効果的に促すことが検証された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:04:20 GMT)
SeaDATE: Remedy Dual-Attention Transformer with Semantic Alignment via Contrast Learning for Multimodal Object Detection [18.1] マルチモーダルオブジェクト検出は、様々なモーダル情報を活用して、検出器の精度と堅牢性を高める。
現在の方法では、トランスフォーマー誘導核融合技術は、ネットワークの様々な深さ層における特徴を抽出する能力を探ることなく、単純にスタック化されている。
本論文では,SeaDATEと呼ばれる高精度かつ効率的な物体検出手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:26:39 GMT)
VidEgoThink: Assessing Egocentric Video Understanding Capabilities for Embodied AI [17.8] VidEgoThinkは、Embodied AIでエゴセントリックなビデオ理解能力を評価するためのベンチマークである。
我々は,ビデオ質問応答,階層計画,視覚的グラウンド,報酬モデリングの4つの重要な相互関連タスクを設計する。
APIベースのMLLM,オープンソースイメージベースのMLLM,オープンソースビデオベースのMLLMの3種類のモデルで広範な実験を行った。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:08:53 GMT)
Adaptive Hybrid Model Pruning in Federated Learning through Loss Exploration [17.6] 我々は、フェデレートされた損失探索フェーズを利用して、適応型ハイブリッドプルーニングを駆動する革新的アプローチであるAutoFLIPを紹介する。
我々は,AutoFLIPがグローバルコンバージェンスを効率的に加速するだけでなく,従来の手法に比べて精度と堅牢性も向上することを示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:06:07 GMT)
Evidence of Cognitive Deficits andDevelopmental Advances in Generative AI: A Clock Drawing Test Analysis [17.5] 本研究は, 視覚空間計画と組織に関する神経心理学的評価である, Clock Drawing Test (CDT) において, いくつかのGenAIモデルがどのように機能するかを考察する。
モデルは時計のような図面を作成するが、正確な時間表現に苦慮し、軽度に重症な認知障害に似た欠陥を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:27:22 GMT)
Multi-modal Image and Radio Frequency Fusion for Optimizing Vehicle Positioning [17.2] 車両位置決めフレームワークは、チャネル状態情報(CSI)と画像と共に車両を共同でローカライズする。
ラベル付きデータセットに重み付き損失関数を導入し,重み付き損失の計算にメタラーニングアルゴリズムを適用した。
シミュレーションの結果,提案手法はベースラインに比べて最大61%の精度で位置決め誤差を低減できることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:41:12 GMT)
Advancements in Road Lane Mapping: Comparative Fine-Tuning Analysis of Deep Learning-based Semantic Segmentation Methods Using Aerial Imagery [17.2] 本研究は、自動運転車(AV)のHDマップの必要性に対処するものである。
地球観測データは地図作成に有用な資源を提供するが、道路線抽出のための特別なモデルはまだリモートセンシングでは未開発である。
本研究では,高精細リモートセンシング画像から道路路面マーキング抽出のための基礎的深層学習に基づくセマンティックセマンティックセマンティクスモデルを比較した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:37:45 GMT)
Multi-Layer Transformers Gradient Can be Approximated in Almost Linear Time [17.1] 本研究では,新しい高速近似法により,ほぼ線形時間で勾配を計算することができることを示す。
勾配の効率を改善することで、この作業がより効果的なトレーニングと長期コンテキスト言語モデルのデプロイを促進することを期待する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:11:19 GMT)
Beyond Linear Approximations: A Novel Pruning Approach for Attention Matrix [17.1] 大きな言語モデル(LLM)は、私たちの日常生活の様々な側面を強化する大きな可能性を示しています。
彼らの成長する能力は、非常に大きなモデルサイズを犠牲にし、エッジデバイスへのデプロイメントを困難にしている。
本稿では,注目行列の近似を直接最適化する LLM 重み付け手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:35:56 GMT)
ODES: Domain Adaptation with Expert Guidance for Online Medical Image Segmentation [16.9] ドメイン適応セグメンテーションは、通常、ラベルなしのターゲットデータセット上で事前トレーニングされたネットワークによって予測される擬似ラベルを使用した自己学習に依存する。
バッチ内の全画像にまたがるピクセルレベルのアノテーションの取得は、オンライン学習における時間的オーバーヘッドを増大させながら、冗長な情報をもたらすことが多い。
本稿では,現在のバッチから画像の最も有用なサブセットを選択して,アクティブな学習を行う,新しい画像抽出手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:27:42 GMT)
Look Ma, no markers: holistic performance capture without the hassle [16.9] 我々は,顔,体,手に対する高精度で総合的なパフォーマンスキャプチャの課題を同時に解決する。
目と舌を含む完全な人体をマーカーフリーで高品質に再現する最初の手法を紹介した。
我々は、合成データと人間の形状と動きの強力なパラメトリックモデルにのみ訓練された機械学習モデルを活用するハイブリッドアプローチによってこれを達成した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:46:33 GMT)
Open World Object Detection: A Survey [16.8] オープンワールドオブジェクト検出(OWOD)は、この原則を適用して新しい知識を探求する、新たな研究分野である。
本稿では、OWODドメインの徹底的なレビューを行い、問題定義、ベンチマークデータセット、ソースコード、評価指標、既存手法の比較研究など、基本的な側面について述べる。
本稿では,現在のOWODアルゴリズムが直面する限界と課題に対処し,今後の研究の方向性を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:46:00 GMT)
Advancements in Road Lane Mapping: Comparative Fine-Tuning Analysis of Deep Learning-based Semantic Segmentation Methods Using Aerial Imagery [16.5] 本研究は、自動運転車(AV)のHDマップの必要性に対処するものである。
地球観測データは地図作成に有用な資源を提供するが、道路線抽出のための特別なモデルはまだリモートセンシングでは未開発である。
本研究では,高精細リモートセンシング画像から道路路面マーキング抽出のための基礎的深層学習に基づくセマンティックセマンティックセマンティクスモデルを比較した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:37:45 GMT)
To Err is AI : A Case Study Informing LLM Flaw Reporting Practices [16.5] 495人のハッカーが、AIのためのアレン研究所(Allen Institute for AI)のオープン言語モデル(OLMo)をターゲットにした、オープンエンドのバグ報奨金で評価を作成した。
本稿では,インシデントの可能性を減らすことを目的とした,欠陥報告のベストプラクティスについて,学習した教訓の集合体を提示する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:02:42 GMT)
MF-LAL: Drug Compound Generation Using Multi-Fidelity Latent Space Active Learning [16.5] MF-LAL (Multi-Fidelity Latent space Active Learning) は、様々なコスト・精度のトレードオフを持つオラクルの集合を統合する生成モデリングフレームワークである。
MF-LALは, 結合自由エネルギーのスコアが, 他の単一および多忠実なアプローチよりも有意に優れた化合物を産生することを示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:15:05 GMT)
LoRD: Adapting Differentiable Driving Policies to Distribution Shifts [16.3] 運用領域間の分散シフトは、自動運転車における学習モデルの性能に重大な影響を与える可能性がある。
低ランク残差復号器 (LoRD) とマルチタスクファインチューニング (Multi-task fine-tuning) である。
提案手法は, 通常の微調整に比べて最大23.33%, 閉ループOOD駆動スコア8.83%の誤差を補正する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:38:26 GMT)
EffiLearner: Enhancing Efficiency of Generated Code via Self-Optimization [16.2] 大規模言語モデル(LLM)は、コード生成の著しい進歩を示しているが、生成されたコードは、しばしば非効率に悩まされる。
実行オーバーヘッドプロファイルを利用した自己最適化フレームワークである textbfEffiLearner を提案する。
EffiLearnerはまずLLMを使ってコードを生成し、その後ローカルに実行し、実行時間とメモリ使用率プロファイルをキャプチャする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:34:39 GMT)
A Framework for Adapting Human-Robot Interaction to Diverse User Groups [16.2] 適応型ロボットインタラクション(HRI)のための新しいフレームワークを提案する。
私たちの主な貢献は、オープンソースのコードベースを備えた適応型ROSベースのHRIフレームワークの開発です。
このフレームワークは、高度な音声認識と音声活動検出を通じて、自然な相互作用をサポートする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:16:43 GMT)
Fine-Grained Spatiotemporal Motion Alignment for Contrastive Video Representation Learning [16.1] モーション情報は、堅牢で一般化されたビデオ表現に不可欠である。
近年の研究では、ビデオコントラスト学習における動き情報の源として、フレーム差が採用されている。
本稿では,適切な動き情報を導入可能なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:58:38 GMT)
Archilles' Heel in Semi-open LLMs: Hiding Bottom against Recovery Attacks [16.1] クローズドソース層が少ないセミオープンモデルの設計について検討する。
我々は,いくつかの底層のみをクローズドソースとして保持する新しいアプローチである textbfSCARA を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:00:36 GMT)
Data-adaptive Differentially Private Prompt Synthesis for In-Context Learning [16.0] 大規模言語モデル(LLM)は、実例やデモに埋め込まれた文脈情報に依存して、文脈内学習(ICL)を行う。
我々は、AdaDPSynと呼ばれる新しいデータ適応微分プライベートアルゴリズムを導入し、プライベートデータセットから合成例を生成する。
AdaDPSynは、データ固有の統計特性に応じて、データ合成機構のノイズレベルを適応的に調整する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:06:30 GMT)
A Novel Gaussian Min-Max Theorem and its Applications [16.0] ゴードンの祝福された結果により、ある不等式が満たされれば、2つのガウス過程のmin-maxの挙動を比較することができる。
この結果の結果として、ガウス min-max (GMT) と凸ガウス min-max (CGMT) 定理が導かれる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:43:51 GMT)
Subspace Optimization for Large Language Models with Convergence Guarantees [16.0] GoLoreは、標準的なバッチサイズであっても設定に収束する、GaLoreの新たな変種です。
我々の収束解析は他のスパース部分空間最適化アルゴリズムにも容易に拡張できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:16:32 GMT)
OLAPH: Improving Factuality in Biomedical Long-form Question Answering [15.6] MedLFQAは、バイオメディカルドメインに関連する長文質問回答データセットを用いて再構成されたベンチマークデータセットである。
また,コスト効率と多面的自動評価を利用した,シンプルで斬新なフレームワークであるOLAPHを提案する。
以上の結果から,OLAPHフレームワークでトレーニングした7B LLMでは,医療専門家の回答に匹敵する回答が得られた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:21:54 GMT)
Learning-based Axial Video Motion Magnification [15.5] 本稿では,ユーザが指定した方向に沿って動きを拡大する軸運動倍率という新しい概念を提案する。
提案手法は,ユーザ制御性という新たな特徴を付加することにより,特定の軸に沿った動きの正当性を向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:33:47 GMT)
Retrieval Augmented Spelling Correction for E-Commerce Applications [15.5] 新しいブランド名を日常言語に急速に導入することは、eコマースのスペル訂正サービスにユニークな課題をもたらす。
我々は、レトリーバル拡張生成(RAG)を通してこの問題に対処することを模索している。
このアプローチでは、商品名をカタログから検索し、文脈的スペル補正を行うために微調整された大規模言語モデル(LLM)によって使用されるコンテキストに組み込む。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:42:18 GMT)
A Character-Centric Creative Story Generation via Imagination [15.3] 我々はCCI(Character-centric Creative Story Generation via Imagination)と呼ばれる新しいストーリー生成フレームワークを紹介する。
CCIは創造的ストーリー生成のための2つのモジュール、IG(Image-Guided Imagination)とMW(Multi-Writer model)を備えている。
IGモジュールでは,文字や背景,メインプロットといった重要なストーリー要素を視覚的に表現するために,テキスト・ツー・イメージモデルを利用する。
MWモジュールはこれらのストーリー要素を使用して複数のペルソナ記述候補を生成し、ストーリーに挿入する最適なストーリーを選択することにより、物語の豊かさと深さを高める。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:12:29 GMT)
LargePiG: Your Large Language Model is Secretly a Pointer Generator [15.2] 本稿では,Large Language Models (LLMs) に基づく問合せ生成による幻覚問題の新しいタイプとして,関連性幻覚と事実性幻覚を導入する。
LLM生成クエリの形式からコンテンツを切り離す効果的な方法を提案し、入力から抽出・統合された事実知識を保存し、LLMの強力な言語機能を用いて関数語を含む構文構造をコンパイルする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:41:40 GMT)
DeltaDock: A Unified Framework for Accurate, Efficient, and Physically Reliable Molecular Docking [15.2] 分子ドッキングはタンパク質-リガンド相互作用を理解するために構造に基づく薬物設計において重要である。
近年のドッキング法の発展により,従来のサンプリング法に比べて効率と精度が著しく向上した。
ポケット予測とサイト固有のドッキングからなる新しい2段階ドッキングフレームワークDeltaDockを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:09:06 GMT)
Efficient and Effective Universal Adversarial Attack against Vision-Language Pre-training Models [14.8] 非普遍的敵攻撃は、多くの場合、データインスタンス当たりの計算要求が高いため、リアルタイムオンラインアプリケーションでは実用的ではない。
DO-UAPと呼ばれる直接最適化に基づくUAPアプローチを提案し、高い攻撃性能を維持しながら資源消費を大幅に削減する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:29:47 GMT)
Analyzing (In)Abilities of SAEs via Formal Languages [14.7] 正規言語の合成テストベッド上でスパースオートエンコーダを訓練する。
パフォーマンスは、トレーニングパイプラインの帰納バイアスに敏感です。
我々は、因果関係がSAEトレーニングの中心的標的となる必要があると論じる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:42:13 GMT)
Neural Combinatorial Optimization Algorithms for Solving Vehicle Routing Problems: A Comprehensive Survey with Perspectives [14.5] この調査は、VRPのためのNCOソルバの包括的分類を提供することを目的としている。
我々は,すべてのNCOソルバを,構成の学習,改善の学習,予測の学習,予測の多元性解決の学習の4つのカテゴリに分けた。
我々は,SOTAソルバの欠点として,一般化の低さ,大規模VRPの解決能力の低下,NCOソルバと従来のOperations Researchアルゴリズムとの比較が困難である点を挙げる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:42:13 GMT)
Learning Truncated Causal History Model for Video Restoration [14.4] TURTLEは、効率的かつ高性能なビデオ復元のための散在した因果履歴モデルを学ぶ。
我々は,多数のビデオ復元ベンチマークタスクに関する最新の結果について報告する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:57:10 GMT)
Learning Truncated Causal History Model for Video Restoration [14.4] TURTLEは、効率的かつ高性能なビデオ復元のための散在した因果履歴モデルを学ぶ。
我々は,多数のビデオ復元ベンチマークタスクに関する最新の結果について報告する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:57:10 GMT)
CTA-Net: A CNN-Transformer Aggregation Network for Improving Multi-Scale Feature Extraction [14.4] CTA-NetはCNNとViTを組み合わせて、長距離依存関係をキャプチャするトランスフォーマーと、ローカライズされた特徴を抽出するCNNを備えている。
この統合により、詳細なローカルおよびより広いコンテキスト情報の効率的な処理が可能になる。
10万以上のサンプルを持つ小規模データセットの実験は、CTA-Netが優れたパフォーマンスを実現していることを示している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:27:26 GMT)
Few for Many: Tchebycheff Set Scalarization for Many-Objective Optimization [14.4] 多目的最適化は、競合する目的を1つのソリューションで最適化できない現実の多くのアプリケーションで見られる。
本稿では,多数の目的をカバーできるいくつかの代表解を見つけるために,新しいTchebycheff集合スカラー化法を提案する。
このようにして、それぞれの目的は、小さな解集合の少なくとも1つの解によってうまく対応できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:57:16 GMT)
AGENTiGraph: An Interactive Knowledge Graph Platform for LLM-based Chatbots Utilizing Private Data [14.3] 本稿では,自然言語インタラクションによる知識管理プラットフォームである AgentiGraph (タスクベースインタラクションとグラフィカル表現のための適応生成ENgine) を紹介する。
AgentiGraphはマルチエージェントアーキテクチャを使用して、ユーザの意図を動的に解釈し、タスクを管理し、新しい知識を統合する。
3,500のテストケースのデータセットの実験結果から、AgentiGraphは最先端のゼロショットベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:05:58 GMT)
Spectral-GS: Taming 3D Gaussian Splatting with Spectral Entropy [14.3] 3D-GSは形状の認識を欠き、代わりにスペクトル半径と視角勾配に依存して分割を決定する。
スペクトル分析に基づくスペクトルGSでは,3次元形状認識分割と2次元ビュー一貫性フィルタリング方式が導入された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:35:49 GMT)
Spectral-GS: Taming 3D Gaussian Splatting with Spectral Entropy [14.3] 3D-GSは形状の認識を欠き、代わりにスペクトル半径と視角勾配に依存して分割を決定する。
スペクトル分析に基づくスペクトルGSでは,3次元形状認識分割と2次元ビュー一貫性フィルタリング方式が導入された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:35:49 GMT)
Light-Weight Fault Tolerant Attention for Large Language Model Training [14.2] 大規模言語モデル (LLM) は様々な自然言語処理タスクにおいて顕著な性能を示した。
LLMは、特にアテンション機構において故障の影響を受けやすいが、これはトランスフォーマーベースのLLMの重要な構成要素である。
我々は,LLMにおけるアテンション機構に適したアルゴリズムベースフォールトトレランス(ABFT)技術であるATTNCheckerを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:52:45 GMT)
Generalizable Spacecraft Trajectory Generation via Multimodal Learning with Transformers [14.2] 本稿では,様々な問題構成にまたがって一般化する新しいトラジェクトリ生成フレームワークを提案する。
我々は、データソースから学習できる高容量トランスフォーマーニューラルネットワークを活用している。
このフレームワークはフリーフライアプラットフォームでのシミュレーションと実験を通じて検証されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:55:42 GMT)
Stochastic diagonal estimation with adaptive parameter selection [14.1] 異なる固有値分布が対角線推定に与える影響について検討する。
対角線推定器にプロジェクション法と適応パラメータ最適化を導入する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:49:44 GMT)
On Classification with Large Language Models in Cultural Analytics [14.1] 我々は、LLMの性能を実証的に評価する上で、公開データセットでサポートされている10のタスクを識別する。
プロンプトベースのLLMは、確立されたタスクに対して従来の教師付きモデルと競合するが、de novoタスクではうまく動作しない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:00:59 GMT)
Optimal Time Complexity Algorithms for Computing General Random Walk Graph Kernels on Sparse Graphs [14.0] スパースグラフに対する一般ランダムウォークカーネル(RWK)の非バイアス近似のための最初の線形時間複雑性ランダム化アルゴリズムを提案する。
提案手法は,大規模グラフ上での効率的な計算において,最大$mathbf27timesの高速化を実現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:12:43 GMT)
Optimal Time Complexity Algorithms for Computing General Random Walk Graph Kernels on Sparse Graphs [14.0] スパースグラフに対する一般ランダムウォークカーネル(RWK)の非バイアス近似のための最初の線形時間複雑性ランダム化アルゴリズムを提案する。
提案手法は,大規模グラフ上での効率的な計算において,最大$mathbf27timesの高速化を実現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:12:43 GMT)
COMPASS: Computational Mapping of Patient-Therapist Alliance Strategies with Language Modeling [14.0] 心理療法セッションで使用される自然言語から治療作業同盟を推定するための新しい枠組みを提案する。
提案手法は,高度大規模言語モデル(LLM)を用いて心理療法セッションの転写を解析し,それらをワーキングアライアンスインベントリにおけるステートメントの分散表現と比較する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:04:23 GMT)
G-Designer: Architecting Multi-agent Communication Topologies via Graph Neural Networks [14.0] G-Designerは,マルチエージェントデプロイメントのための適応的,効率的,堅牢なソリューションである。
G-Designerはタスク対応、カスタマイズされた通信トポロジを動的に設計する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:01:21 GMT)
Federated Continual Learning Goes Online: Uncertainty-Aware Memory Management for Vision Tasks and Beyond [13.9] 本稿では,破滅的な記憶を解消するための不確実性を考慮したメモリベース手法を提案する。
特定の特性を持つサンプルを検索し、そのようなサンプル上でモデルを再訓練することで、このアプローチの可能性を実証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:53:12 GMT)
Stop using Landau gauge for Tight-binding Models [13.6] 我々は, フラックス量子化によって決定される最小サイズと一致するTBハミルトニアンを構築することができることを示す。
非線形ベクトルポテンシャルでは、このサイズは1/theta2$と好意的にスケールし、小角のTBGモデルをTBでより引くことができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:48:23 GMT)
ED-ViT: Splitting Vision Transformer for Distributed Inference on Edge Devices [13.5] 本稿では,複数のエッジデバイスにまたがる複雑なモデルを効率的に実行するための新しいビジョントランスフォーマー分割フレームワークED-ViTを提案する。
具体的には、Vision Transformerモデルをいくつかのサブモデルに分割し、各サブモデルはデータクラスの特定のサブセットを処理するように調整します。
3つのモデル構造を持つ5つのデータセットに対して広範な実験を行い、エッジデバイスにおける推論遅延を著しく低減することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:38:14 GMT)
Poisson-Dirac Neural Networks for Modeling Coupled Dynamical Systems across Domains [13.5] 幾何学力学からポート・ハミルトニアンとポアソンの定式化を統一するディラック構造に基づく新しい枠組みを提案する。
PoDiNNは、未知の結合力学系をデータからモデル化する際の精度と解釈性を改善する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:31:22 GMT)
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering [13.5] 我々は,新しい評価指標であるI-HallA (Image Hallucination Evaluation with Question Answering)を紹介する。
I-HallAは視覚的質問応答(VQA)を用いて生成画像の事実性を測定する
我々はI-HallAを用いて5つのテキスト・ツー・イメージモデルを評価し、これらの最先端モデルが事実情報を正確に伝達できない場合が多いことを明らかにした。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:01:44 GMT)
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering [13.5] 我々は,新しい評価指標であるI-HallA (Image Hallucination Evaluation with Question Answering)を紹介する。
I-HallAは視覚的質問応答(VQA)を用いて生成画像の事実性を測定する
我々はI-HallAを用いて5つのテキスト・ツー・イメージモデルを評価し、これらの最先端モデルが事実情報を正確に伝達できない場合が多いことを明らかにした。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:01:44 GMT)
LoRD: Adapting Differentiable Driving Policies to Distribution Shifts [13.5] 運用領域間の分散シフトは、自動運転車における学習モデルの性能に重大な影響を与える可能性がある。
低ランク残差復号器 (LoRD) とマルチタスクファインチューニング (Multi-task fine-tuning) である。
提案手法は, 通常の微調整に比べて最大23.33%, 閉ループOOD駆動スコア8.83%の誤差を補正する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:38:26 GMT)
Black-box Uncertainty Quantification Method for LLM-as-a-Judge [13.5] LLM-as-a-Judge評価の信頼性を高めるために設計された不確実性を定量化する新しい手法を提案する。
生成された評価と可能な評価の関係を分析して不確実性を定量化する。
これらの関係を相互に評価し、トークン確率に基づく混乱行列を構築することにより、高いあるいは低い不確実性のラベルを導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:29:22 GMT)
Age-of-Gradient Updates for Federated Learning over Random Access Channels [13.3] ランダムアクセスチャネル(RACH)上でのディープニューラルネットワーク(DNN)のフェデレーショントレーニングの問題点について検討する。
RACH-FL設定は、(i)クライアント選択と(ii)勾配圧縮戦略を共同で設計する問題に決定的に対処する。
我々は、(i)Top-Kスペーシフィケーションを用いて勾配スペーシフィケーションを行い、(ii)メモリ蓄積を用いて誤り訂正を行い、(iii)現在のローカルメモリを比較してスロット送信確率を求める政策を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:49:58 GMT)
Planning Anything with Rigor: General-Purpose Zero-Shot Planning with LLM-based Formalized Programming [13.2] 大規模言語モデル(LLM)は近年,計画問題の解決に強い可能性を示している。
LLpreview は LLM を利用して,計画上の問題から重要な情報を抽出し,それらをスクラッチから最適化するフレームワークである。
GPToとClaude 3.5 Sonnetの9つのタスクに対して,LLpreviewが平均83.7%,86.8%の最適率で達成できることを実証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:20:54 GMT)
Why Go Full? Elevating Federated Learning Through Partial Network Updates [13.2] フェデレートラーニング(Federated Learning)は、ユーザのデータプライバシを保護するために設計された分散機械学習パラダイムである。
我々はFedPartメソッドを導入し、各通信ラウンドにおいて、モデル更新を単一のレイヤまたはいくつかのレイヤに制限する。
その結果,FedPart法はコンバージェンス速度と精度の点で従来のフルネットワーク更新手法をはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:49:24 GMT)
MoChat: Joints-Grouped Spatio-Temporal Grounding LLM for Multi-Turn Motion Comprehension and Description [13.1] MoChatは人間の動きの微粒な時間的接地が可能なモデルである。
我々は,ヒト解剖学的構造に基づいて,各骨格の空間情報をグループ化する。
共同トレーニングのためにさまざまなアノテーションが生成される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:49:59 GMT)
Empowering Users in Digital Privacy Management through Interactive LLM-Based Agents [13.1] 本稿では,対話型対話エージェントによるユーザプライバシポリシの理解を高めるために,大規模言語モデル(LLM)の新たな応用を提案する。
LLMは、データプラクティス識別、選択識別、ポリシー要約、プライバシ質問回答といったタスクにおいて、従来のモデルよりも大幅に優れています。
我々は,Webサイトプライバシポリシを処理するエキスパートシステムとして機能し,複雑な法的言語を通じてユーザを誘導する,革新的なLCMベースのエージェントを紹介した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:16:59 GMT)
Zero-shot Model-based Reinforcement Learning using Large Language Models [12.9] 本稿では,マルコフ決定過程の動的状態を予測するために,事前学習した大規模言語モデルをどのように活用することができるかを検討する。
本稿では,モデルに基づく政策評価とデータ強化型オフ政治強化学習という2つの強化学習環境における概念実証の応用について述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:46:53 GMT)
Language Models Encode Numbers Using Digit Representations in Base 10 [12.9] 大規模言語モデル (LLM) は, 1桁あたりの個々の円周表現を持つ数値を内在的に表現することを示す。
この数値表現は、数値推論を含むタスクにおけるモデルの誤りパターンに光を当てる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:00:15 GMT)
Large Language Models Can Solve Real-World Planning Rigorously with Formal Verification Tools [12.9] 大規模言語モデル(LLM)は、複雑なマルチ制約計画問題に対して、直接的に正しい計画を生成するのに苦慮している。
制約付き満足度問題として複雑なマルチ制約計画問題を定式化し,解決する LLM ベースの計画フレームワークを提案する。
我々のフレームワークは、2つのデータセットから、平均81.6%と91.7%の満足できないクエリを修正および解決できることを示します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:18:05 GMT)
Tora: Trajectory-oriented Diffusion Transformer for Video Generation [12.8] Toraは、テキスト、視覚、および軌跡条件を同時に統合する最初のトラジェクトリ指向のDiTフレームワークである。
Toraは、様々な期間、アスペクト比、解像度で制御可能な動画を生成する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:14:09 GMT)
When LLM Meets DRL: Advancing Jailbreaking Efficiency via DRL-guided Search [12.8] 深部強化学習(DRL)によるブラックボックスジェイルブレイク攻撃であるRLbreakerを提案する。
RLbreakerは6つのSOTA(State-of-the-art (SOTA) LLM)に対する既存のジェイルブレイク攻撃よりも効果的であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:41:42 GMT)
Are High-Degree Representations Really Unnecessary in Equivariant Graph Neural Networks? [12.8] E(3)対称性を取り入れた等価グラフニューラルネットワーク(GNN)は、様々な科学的応用において大きな成功を収めている。
本稿では、$k$-fold回転や正則多面体を含む対称構造上の同変GNNの表現性について検討する。
我々は,高次ステアブルベクトルを組み込んだEGNNの高次バージョンであるHEGNNを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:47:49 GMT)
Dissecting Fine-Tuning Unlearning in Large Language Models [12.7] 微調整に基づく未学習法は、大規模言語モデルにおいて有害で機密性の高い、あるいは著作権のある情報を防ぐために一般的である。
しかし、これらの手法の真の有効性は明らかでない。
本研究では,アクティベーションパッチやリカバリ実験を通じて,微調整に基づくアンラーニングの限界を掘り下げる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:23:21 GMT)
Dissecting Fine-Tuning Unlearning in Large Language Models [12.7] 微調整に基づく未学習法は、大規模言語モデルにおいて有害で機密性の高い、あるいは著作権のある情報を防ぐために一般的である。
しかし、これらの手法の真の有効性は明らかでない。
その結果,これらの手法は,問題のある知識を真に消去するのではなく,モデルの知識検索プロセスを変化させることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:23:21 GMT)
In-context KV-Cache Eviction for LLMs via Attention-Gate [12.7] KVキャッシュ技術は、大規模言語モデル(LLM)の推論の標準となっている。
本稿では,Attention-Gateと呼ばれるパラメータ化KVキャッシュ消去機構を考案する。
Attention-Gateは、コンテキスト全体を入力として受け入れ、各トークンにエビテーションフラグを出力して、インコンテキストのエビエーションを実現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:01:19 GMT)
4-LEGS: 4D Language Embedded Gaussian Splatting [12.7] 3次元ガウスアンティング % に基づく4次元表現への時空間的特徴の持ち上げ方法を示す。
本稿では,3次元空間に隣接する特徴を相互作用させる機能-近視性アテンション機構を提案する。
これにより、ユーザはテキストプロンプトからビデオ内のイベントをローカライズすることができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:34:22 GMT)
4-LEGS: 4D Language Embedded Gaussian Splatting [12.7] 3次元ガウシアンティングに基づく4次元表現に時間的特徴を持ち上げる方法を示す。
これにより、ユーザはテキストプロンプトからビデオ内のイベントを時間的にローカライズすることができる。
我々は,人や動物が様々な行動を行う様子を公開3Dビデオデータセットで実演する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:34:22 GMT)
Patch-Based Diffusion Models Beat Whole-Image Models for Mismatched Distribution Inverse Problems [12.5] 我々は、既知のトレーニング分布が最初に提供される場合の分布(OOD)問題について検討する。
パッチのみから画像分布を学習するパッチベースの拡散を事前に使用しています。
どちらの設定でも、パッチベースの手法は、画像全体のモデルより優れた高品質な画像再構成を得ることができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:02:08 GMT)
DriVLMe: Enhancing LLM-based Autonomous Driving Agents with Embodied and Social Experiences [12.5] DriVLMeは、人間と自動運転車のコミュニケーションを容易にするためのビデオ言語モデルに基づくエージェントである。
オープンループベンチマークとクローズドループヒューマンスタディの両方において競合性能を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:50:40 GMT)
Gotcha! This Model Uses My Code! Evaluating Membership Leakage Risks in Code Models [12.2] コードモデルに特化した新しいメンバシップ推論手法であるGotchaを提案する。
我々は,Gotchaが真正率0.95,偽正率0.10でデータメンバーシップを予測できることを示した。
この研究は、コードモデルのプライバシを理解することにより多くの注意を払っている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:58:00 GMT)
A Complete Decomposition of KL Error using Refined Information and Mode Interaction Selection [12.0] 我々は高次モード相互作用に着目したログ線形モデルの古典的定式化を再考する。
学習した分布は、実際に利用可能な有限量のデータをより効率的に利用することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:08:32 GMT)
Unveiling Options with Neural Decomposition [12.0] 強化学習では、エージェントは特定のタスクに対するポリシーを学ぶが、その知識を関連するタスクに一般化することができない。
本稿では、マルコフ決定プロセスのポリシーを復号化することで、この制限に対処するアルゴリズムを提案する。
それぞれのサブポリティシを、さまざまなイテレーションのタイムループでラップすることで、オプションにします。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:36:44 GMT)
Taking off the Rose-Tinted Glasses: A Critical Look at Adversarial ML Through the Lens of Evasion Attacks [11.8] 我々は、過度に寛容な攻撃と過度に制限された防衛脅威モデルが、MLドメインにおける防衛開発を妨げていると主張している。
我々は、AIの観点からではなく、システムセキュリティの観点から、敵対的機械学習を分析する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:33:23 GMT)
How Transformers Implement Induction Heads: Approximation and Optimization Analysis [11.8] 変換器が誘導ヘッドを実装する方法の近似と最適化の両方を提供する。
近似解析では、標準および一般化誘導ヘッド機構の両方を定式化する。
最適化解析のために,4-gramと2-gram成分からなる合成混合ターゲットのトレーニングダイナミクスについて検討した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:22:27 GMT)
Anderson Acceleration in Nonsmooth Problems: Local Convergence via Active Manifold Identification [11.5] 能動多様体同定特性を特徴とする非滑らかな最適化アルゴリズムのクラスについて検討する。
最適化問題が定常点に活性多様体を持つという仮定の下で、アンダーソン加速アルゴリズムの局所 R-線型収束速度を確立する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:16:28 GMT)
Anderson Acceleration in Nonsmooth Problems: Local Convergence via Active Manifold Identification [11.5] 能動多様体同定特性を特徴とする非滑らかな最適化アルゴリズムのクラスについて検討する。
最適化問題が定常点に活性多様体を持つという仮定の下で、アンダーソン加速アルゴリズムの局所 R-線型収束速度を確立する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:16:28 GMT)
Eliciting Textual Descriptions from Representations of Continuous Prompts [11.5] 本稿では,モデル推論における表現からテキスト記述を抽出する連続的プロンプトの解釈手法を提案する。
本稿では,タスク性能が向上するにつれて,タスク記述の正確さが向上することを示す。
InSPEcTは、望ましくないプロパティを継続的なプロンプトでデバッグし、開発者がそれを緩和する方法を通知するために利用することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:46:11 GMT)
ChangeMinds: Multi-task Framework for Detecting and Describing Changes in Remote Sensing [11.5] 単一のエンドツーエンドモデル内でCDとCCプロセスを同時に最適化する新しいフレームワークであるChangeMindsを紹介します。
本稿では,抽出した両時間深度特徴から複雑な時間的ダイナミクスを効果的に捉えるために,変更対応長期記憶モジュール(ChangeLSTM)を提案する。
本稿では,画像特徴とテキスト特徴の相互作用を強化するクロスアテンション機構を備えたマルチタスク予測器を導入し,両タスクの効率的な同時学習と処理を促進する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:00:13 GMT)
ChangeMinds: Multi-task Framework for Detecting and Describing Changes in Remote Sensing [11.5] 単一のエンドツーエンドモデル内でCDとCCプロセスを同時に最適化する新しいフレームワークであるChangeMindsを紹介します。
本稿では,抽出した両時間深度特徴から複雑な時間的ダイナミクスを効果的に捉えるために,変更対応長期記憶モジュール(ChangeLSTM)を提案する。
本稿では,画像特徴とテキスト特徴の相互作用を強化するクロスアテンション機構を備えたマルチタスク予測器を導入し,両タスクの効率的な同時学習と処理を促進する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:00:13 GMT)
WPFed: Web-based Personalized Federation for Decentralized Systems [11.5] 我々はWPFedを紹介した。WPFedは、グローバルに最適な隣人選択を可能にするように設計された、完全に分散されたWebベースの学習フレームワークである。
セキュリティを強化し、悪意のある振る舞いを抑えるため、WPFedはLSHコードとパフォーマンスランキングの両方の検証メカニズムを統合している。
我々の発見は、WPFedが多種多様な相互接続されたWeb環境にまたがって効果的でセキュアな分散協調学習を促進する可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:17:42 GMT)
Converging to a Lingua Franca: Evolution of Linguistic Regions and Semantics Alignment in Multilingual Large Language Models [11.4] 大規模言語モデル(LLM)は、特に多言語文脈において顕著な性能を示した。
近年の研究では、LLMは、ある言語で学んだスキルを他の言語に伝達することができることが示唆されているが、この能力の背後にある内部メカニズムはいまだ不明である。
本稿では,LLMの内部動作に関する知見を提供し,言語間能力の向上のための基盤を提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:49:15 GMT)
What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models [11.4] Language Models (LMs) という用語は常に再発明されており、その参照語はthesusの $textitShip のように更新されている。
本稿では,この「textitShip of Language Models$ problem」について考察する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:36:59 GMT)
Variational Mode-Driven Graph Convolutional Network for Spatiotemporal Traffic Forecasting [11.4] 本稿では,グラフニューラルネットワークを用いた時空間(ST)トラフィック予測の解釈に着目する。
本稿では,STデータを変分モード分解(VMD)法を用いてモードに分解するフレームワークを提案する。
本稿では,LargeSTデータセット上で提案したネットワークの性能を,短期および長期の予測において評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:47:58 GMT)
l_inf-approximation of localized distributions [11.2] 本研究では,近似分布の辺に有界な次元独立誤差を確立する。
近似誤差の次元依存性を回避できるだけでなく,計算コストを大幅に削減する,局所化確率インフォームド部分空間法と局所化スコアマッチングの使い方を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:47:05 GMT)
STGformer: Efficient Spatiotemporal Graph Transformer for Traffic Forecasting [11.2] 交通はスマートシティマネジメントの基盤であり、効率的なアロケーションと交通計画を可能にしている。
ディープラーニングは、データの複雑な非線形パターンをキャプチャする能力を持ち、トラフィック予測の強力なツールとして登場した。
グラフニューラルネットワーク(GCN)とトランスフォーマーベースのモデルは、将来性を示しているが、その計算要求はしばしば、現実のネットワークへの応用を妨げる。
本稿では,管理可能な計算フットプリントを維持しつつ,グローバルおよびローカルの両方のトラフィックパターンの効率的なモデリングを可能にする新しいテンポラルグラフトランスフォーマー(STG)アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:44:29 GMT)
STGformer: Efficient Spatiotemporal Graph Transformer for Traffic Forecasting [11.2] 交通はスマートシティマネジメントの基盤であり、効率的なアロケーションと交通計画を可能にしている。
ディープラーニングは、データの複雑な非線形パターンをキャプチャする能力を持ち、トラフィック予測の強力なツールとして登場した。
グラフニューラルネットワーク(GCN)とトランスフォーマーベースのモデルは、将来性を示しているが、その計算要求はしばしば、現実のネットワークへの応用を妨げる。
本稿では,管理可能な計算フットプリントを維持しつつ,グローバルおよびローカルの両方のトラフィックパターンの効率的なモデリングを可能にする新しいテンポラルグラフトランスフォーマー(STG)アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:44:29 GMT)
RATE: Score Reward Models with Imperfect Rewrites of Rewrites [11.1] 我々は,その応答に割り当てられた報酬に対する属性の因果効果を測定するための評価方法を開発した。
中心となる考え方は、大きな言語モデルを使用してレスポンスを書き直し、不完全な偽物を生成することである。
RATE推定器は合理的な仮定の下で一貫したものであることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:22:16 GMT)
Diffusion Models in 3D Vision: A Survey [11.1] 本稿では,3次元視覚タスクの拡散モデルを利用する最先端のアプローチについて概説する。
これらのアプローチには、3Dオブジェクト生成、形状補完、点雲再構成、シーン理解が含まれる。
本稿では,計算効率の向上,マルチモーダル融合の強化,大規模事前学習の活用などの可能性について論じる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:03:52 GMT)
Diffusion Models in 3D Vision: A Survey [11.1] 本稿では,3次元視覚タスクの拡散モデルを利用する最先端のアプローチについて概説する。
これらのアプローチには、3Dオブジェクト生成、形状補完、点雲再構成、シーン理解が含まれる。
本稿では,計算効率の向上,マルチモーダル融合の強化,大規模事前学習の活用などの可能性について論じる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:03:52 GMT)
Heterogeneous Graph Generation: A Hierarchical Approach using Node Feature Pooling [11.1] 不均一グラフは、ソーシャルネットワーク、レコメンデーションシステム、生物学的ネットワークなど、様々な領域に存在している。
本稿では,2相階層構造を用いた異種グラフ生成の課題について考察する。
判別器を使用してジェネレータのトレーニングをガイドし、ノード特徴プールから特徴ベクトルをサンプリングする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:23:25 GMT)
Variance Reduction for the Independent Metropolis Sampler [11.1] 我々は、$pi$がKL分散の下で別の密度$q$に十分近い場合、$pi$からサンプルを得る独立したサンプリング器は、$pi$からサンプリングするi.d.よりも小さな分散を達成することを証明した。
提案手法は,KLの目標との偏差が低減されるように,提案密度に適応する適応型独立メトロポリスアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:05:38 GMT)
Development and Testing of a Wood Panels Bark Removal Equipment Based on Deep Learning [11.0] 本研究は,深層学習に基づく樹皮除去装置の開発と試験である。
本研究で使用されるBiSeNetV1モデルのトレーニングのために,木材パネルのセマンティックセマンティックセマンティクスデータセットを構築した。
樹皮除去効果試験の結果は,樹皮除去の質と効率の両面で有意な改善を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:07:43 GMT)
Interrogating AI: Characterizing Emergent Playful Interactions with ChatGPT [10.9] 本研究では,人気のAI技術であるChatGPTのユーザによる遊び的なインタラクションに焦点を当てた。
ユーザ談話の半数以上(54%)が遊び心のあるインタラクションを中心に展開していることがわかった。
これらのインタラクションが、AIのエージェンシーを理解し、人間とAIの関係を形作り、AIシステムを設計するための洞察を提供する上で、どのように役立つかを検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:57:10 GMT)
Operator algebra and algorithmic construction of boundaries and defects in (2+1)D topological Pauli stabilizer codes [10.9] 位相一般化されたパウリ安定化符号のすべての境界と欠陥を2次元で構成する計算アルゴリズムを提案する。
このアルゴリズムを適用し、Z$トーリック符号の2つの境界と6つの欠陥、Z_4$トーリック符号の3つの境界と22の欠陥、カラー符号の6つの境界と270の欠陥、異常な3つのフェミオン符号の6つの欠陥を明示的に示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:00:00 GMT)
Instructive Code Retriever: Learn from Large Language Model's Feedback for Code Intelligence Tasks [10.9] Instructive Code Retriever (ICR) という新しいアプローチを導入する。
ICRは、さまざまなコードインテリジェンスタスクやデータセットにわたるモデル推論を強化するサンプルを取得するように設計されている。
我々は,コード要約,プログラム合成,バグ修正など,様々なタスクにおけるモデルの有効性を評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:44:00 GMT)
Efficient Data Generation for Source-grounded Information-seeking Dialogs: A Use Case for Meeting Transcripts [10.8] 本稿では,Large Language Models (LLMs) を用いたソースグラウンド情報検索ダイアログにおけるデータ生成の実現可能性と有効性について検討する。
私たちはMISeD -- Meeting Information Seeking Dialogsデータセットを作ります。
MISeDの微調整は、完全な手動データによる微調整に匹敵する応答生成品質を提供すると同時に、属性品質を改善し、時間と労力を削減する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:48:03 GMT)
ChatHouseDiffusion: Prompt-Guided Generation and Editing of Floor Plans [10.8] 本稿では,大規模言語モデル(LLM)を利用して自然言語入力を解釈するChatHouseDiffusionを提案する。
また、トポロジカルな関係をエンコードするためにグラマーを使用し、拡散モデルを使用してフロアプランを柔軟に生成し編集する。
既存のモデルと比較すると、ChatHouseDiffusionはより高いIoU(Intersection over Union)スコアを達成し、完了を必要とせずに正確な局所的な調整を可能にする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:41:46 GMT)
Leaving the barn door open for Clever Hans: Simple features predict LLM benchmark answers [10.8] AIベンチマークの内部的妥当性は、要因の相違のないことを保証するために不可欠である。
我々は、AIシステムが意図しない方法でベンチマークを解決し、テスト対象の能力を回避できる可能性を調査する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:05:41 GMT)
Enhancing Gait Video Analysis in Neurodegenerative Diseases by Knowledge Augmentation in Vision Language Model [10.7] 大規模な事前学習型視覚言語モデル(VLM)に基づいて,患者の歩行映像の視覚的,テキスト的,数値的表現を学習し,改善する。
結果から,本モデルはビデオベース分類タスクにおいて最先端の手法よりも優れるだけでなく,学習したクラス固有のテキスト特徴を自然言語記述に包括的にデコードすることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:43:57 GMT)
Short Paper: Atomic Execution is Not Enough for Arbitrage Profit Extraction in Shared Sequencers [10.7] 本研究では、2つの定積マーケッター流動性プールにおける原子的実行下での仲裁利益を評価するモデルを開発する。
我々はまた、原子性が損失につながるかもしれないいくつかのシナリオについて議論し、なぜ原子性の実行が、共有シークエンシングを採用するために仲裁やロールアップを納得させるのに十分でないのかについての洞察を提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:43:28 GMT)
DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation [10.6] 本稿では,適応再評価フレームワークを用いた拡散モデル誘導型インプリシットQ-ラーニングを導入したオフライン強化学習(オフラインRL)手法を提案する。
拡散モデルを利用して状態-作用系列の分布を学習し、よりバランスよく適応的な意思決定のために値関数を組み込む。
Maze2D、AntMaze、Kitchenといったタスクで示されているように、DIARは長い水平、スパース・リワード環境において、常に最先端のアルゴリズムより優れています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:09:56 GMT)
Exploring Power Side-Channel Challenges in Embedded Systems Security [10.4] パワーサイドチャネル(PSC)攻撃は組み込みマイクロコントローラ、特に暗号アプリケーションで広く利用されている。
本稿では,これらの課題を体系的に分析し,鍵となる制約に対処する新しい信号処理手法を提案する。
提案手法は,実世界のブラックボックス組み込みデバイスでの実験を通じて検証し,様々な組み込みシステムセキュリティアプリケーションでの利用を拡大する可能性を検証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:51:37 GMT)
HR-Agent: A Task-Oriented Dialogue (TOD) LLM Agent Tailored for HR Applications [10.4] HR-Agentは、繰り返しHRプロセスの自動化に適した、効率よく、機密性があり、かつ、HR固有のLLMベースのタスク指向対話システムである。
会話データは、推論中にLLMに送信されないため、HR関連のタスクに必要な機密性を保持する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:51:08 GMT)
NesTools: A Dataset for Evaluating Nested Tool Learning Abilities of Large Language Models [10.3] 包括的ネストツール学習評価のギャップを埋めるために、NesToolsを導入します。
NesToolsは、大規模なネストツールコールを構築するための、新しい自動データ生成方法を備えている。
手動によるレビューと改善により、データセットは高品質で、現実世界のシナリオと密接に一致している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:33:43 GMT)
Modeling Bilingual Sentence Processing: Evaluating RNN and Transformer Architectures for Cross-Language Structural Priming [10.3] 本研究では、言語間構造プライミングの複製におけるリカレントニューラルネットワーク(RNN)とトランスフォーマーモデルの性能を評価する。
以上の結果から,トランスフォーマーは素文構造の生成においてRNNよりも優れていたことが示唆された。
この研究は、計算モデルが多種多様な言語族にまたがる人間の認知過程をどのように反映するかの理解に寄与する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:24:00 GMT)
Diffusion-Based Offline RL for Improved Decision-Making in Augmented ARC Task [10.0] SOLAR(Abstraction and Reasoning)のための拡張オフラインRLデータセットを提案する。
SOLARは、十分な経験データを提供することで、オフラインのRLメソッドの適用を可能にする。
本実験は, 簡単なARCタスクにおけるオフラインRL手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:48:27 GMT)
EMIT- Event-Based Masked Auto Encoding for Irregular Time Series [9.9] データポイントが不均一な間隔で記録される不規則な時系列は、医療設定で一般的である。
この変動は、患者の健康の重大な変動を反映し、情報的臨床的意思決定に不可欠である。
不規則時系列に関する既存の自己教師型学習研究は、しばしば予測のような一般的な前提課題に依存している。
本稿では,不規則な時系列に対するイベントベースのマスキングである,新しい事前学習フレームワーク EMIT を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:10:31 GMT)
Large-scale cloze evaluation reveals that token prediction tasks are neither lexically nor semantically aligned [9.9] より長く訓練された大きなモデルは、一般的に人間の反応のより良い推定方法であるが、人間の反応の確率を確実に過小評価している。
この研究は、LM世代がクローゼタスクの代替やモデルのモデルとして使用できないような、トラクタブルで解釈可能な領域で実証されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:52:09 GMT)
SOE: SO(3)-Equivariant 3D MRI Encoding [9.9] 本稿では,3次元空間における全ての回転に対して同値を強制する新しい3次元MRI符号化法を提案する。
表現空間におけるこの幾何等式を明示的にモデル化することにより、入力画像空間に適用される任意の回転操作が埋め込み表現空間にも反映されることを保証する。
我々は,ADNIデータセットのT1強調脳スキャンから,年齢予測とアルツハイマー病診断の下流課題に関して,2つの公開データセットの構造的MRIに基づいて事前訓練したSOEを評価した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:47:48 GMT)
Capture Artifacts via Progressive Disentangling and Purifying Blended Identities for Deepfake Detection [9.8] ディープフェイク技術は、プライバシー侵害や信頼問題に深刻な懸念を抱いている。
現在の方法では、偽の顔をアーティファクトとコンテンツ情報に大まかに分けるために、切り離し技術を使用している。
これらの手法には固い絡み合いの基礎がなく、絡み合いの過程の信頼性を保証できない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:27:45 GMT)
Capture Artifacts via Progressive Disentangling and Purifying Blended Identities for Deepfake Detection [9.8] ディープフェイク技術は、プライバシー侵害や信頼問題に深刻な懸念を抱いている。
現在の方法では、偽の顔をアーティファクトとコンテンツ情報に大まかに分けるために、切り離し技術を使用している。
これらの手法には固い絡み合いの基礎がなく、絡み合いの過程の信頼性を保証できない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:27:45 GMT)
Single-word Auditory Attention Decoding Using Deep Learning Model [9.7] 聴覚刺激とそれに対応する脳反応を比較して聴覚注意を識別することは、聴覚注意復号法(AAD)として知られている。
本稿では,この課題に対処するため,EEGNetに基づくディープラーニングアプローチを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:57:19 GMT)
A Unified Framework for Forward and Inverse Problems in Subsurface Imaging using Latent Space Translations [9.6] 本稿では,GFI(Generalized Forward-Inverse)フレームワークと呼ばれる,この分野における先行研究を特徴付ける統一フレームワークを提案する。
GFIは、GFIの特定のインスタンス化とみなすことができる地下画像の深層学習における従来の成果を包含していることを示す。
また,GFI のフレームワークとして,潜在 U-Net と非可逆 X-Net の2つの新しいモデルアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:07:25 GMT)
Empowering Air Travelers: A Chatbot for Canadian Air Passenger Rights [9.5] カナダの航空運送部門は、乗客の権利に関するフライト遅延、キャンセル、その他の問題に顕著な増加を見せている。
本システムでは,複雑なユーザ入力を単純なクエリに分割し,航空旅行規制の詳細を記述した文書の集合から情報を取得する。
このシステムは、複雑なユーザ入力を理解し、幻覚のない正確な回答を提供するという、2つの主要な課題をうまく克服する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:58:13 GMT)
ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model [9.5] 本稿では、強化学習と運動拡散モデルを組み合わせることで、物理的に信頼できる人間の動きを生成するEmphReinDiffuseを提案する。
動作拡散モデルを用いてパラメータ化された動作分布を出力し、強化学習パラダイムに適合させる。
我々のアプローチは、HumanML3DとKIT-MLという2つの主要なデータセット上で、既存の最先端モデルよりも優れています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:12:01 GMT)
ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model [9.5] 本稿では、強化学習と運動拡散モデルを組み合わせることで、物理的に信頼できる人間の動きを生成するEmphReinDiffuseを提案する。
動作拡散モデルを用いてパラメータ化された動作分布を出力し、強化学習パラダイムに適合させる。
我々のアプローチは、HumanML3DとKIT-MLという2つの主要なデータセット上で、既存の最先端モデルよりも優れています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:12:01 GMT)
ECGN: A Cluster-Aware Approach to Graph Neural Networks for Imbalanced Classification [9.5] グラフ内のノードの分類は一般的な問題である。
既存のグラフニューラルネットワーク(GNN)は、両方の問題に一緒に対処していない。
拡張クラスタ対応グラフネットワーク(ECGN)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:39:38 GMT)
DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion [9.4] DPD-NeuralEngine は Gated Recurrent Unit (GRU) Neural Network (NN) に基づく超高速、小型、電力効率の DPD 加速器である。
22nmのCMOS実装は2GHzで動作し、最大250MSpsのI/Q信号を処理できる。
我々の知る限り、この研究はAIベースのDPDアプリケーション固有集積回路(ASIC)アクセラレーターとしては初めてのものである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:39:50 GMT)
GPT-4 Jailbreaks Itself with Near-Perfect Success Using Self-Explanation [9.4] IRIS(Iterative Refinement induced Self-Jailbreak)は,ブラックボックスアクセスのみのジェイルブレイクに対する新しいアプローチである。
以前の方法とは異なり、IRISは単一のモデルを攻撃者とターゲットの両方として使用することで、ジェイルブレイクプロセスを単純化する。
We found that IRIS jailbreak success rate of 98% on GPT-4, 92% on GPT-4 Turbo, 94% on Llama-3.1-70B in 7 query。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:50:58 GMT)
Universal Upper Bound on Ergotropy and No-Go Theorem by the Eigenstate Thermalization Hypothesis [9.4] 量子多体系から抽出可能な最大処理(エルゴトロピー)は、初期状態の局所熱水性と量子演算による局所エントロピー減少によって制約されることを示す。
その結果, 量子熱力学, 第2法則, 熱化の2つの独立に研究された概念を, 作業抽出の資源としての多体系系内相関を通じて橋渡しした。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:50:18 GMT)
Dynamic Open Vocabulary Enhanced Safe-landing with Intelligence (DOVESEI) [9.3] この作業は、都市空飛ぶロボットの基本的なステップである、安全な着陸を目指しています。
本稿では,オープンボキャブラリ画像セグメンテーションの能力を生かして,視覚サーボ機能を利用したリアクティブUAVシステムを提案する。
グローバルセグメンテーションと比較して、着陸成功率はほぼ10倍に向上した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:36:35 GMT)
Dual-frame Fluid Motion Estimation with Test-time Optimization and Zero-divergence Loss [9.3] 3次元粒子追跡速度計(PTV)は乱流解析の鍵となる技術である。
深層学習に基づく手法は、2フレームの流体運動推定において顕著な精度を達成している。
我々は,完全に自己管理された新しい手法を導入し,完全に教師された手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:00:00 GMT)
Medical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation [9.3] 我々は、MedGraphRAGと呼ばれる医療領域向けに設計された新しいグラフベースのRetrieval-Augmented Generationフレームワークを紹介する。
提案手法は,9つの医療用Q&Aベンチマーク,2つの健康用ファクトチェックベンチマーク,および1つの収集データセットで検証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:37:42 GMT)
Advancements in Visual Language Models for Remote Sensing: Datasets, Capabilities, and Enhancement Techniques [9.2] 本稿では,視覚言語モデル(VLM)に関する基本理論を概観し,リモートセンシングで構築したデータセットを要約する。
本稿では,VLMのコアコンポーネントに応じて,改善手法を3つの主要部品に分類し,それらの方法の詳細な紹介と比較を行う。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:28:55 GMT)
Learning Diffusion Model from Noisy Measurement using Principled Expectation-Maximization Method [9.2] 本稿では,任意の破損型を持つ雑音データから拡散モデルを反復的に学習する,原則的予測最大化(EM)フレームワークを提案する。
筆者らはモンテカルロ法を用いて,ノイズ測定からクリーンな画像を正確に推定し,次いで再構成画像を用いて拡散モデルを訓練した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:54:59 GMT)
Time-Series Foundation Model for Value-at-Risk [9.1] 広範囲で多様なデータセットで事前トレーニングされたファンデーションモデルは、比較的最小限のデータを持つゼロショット設定で使用できる。
TimesFMと呼ばれるGoogleのモデルの性能を従来のパラメトリックモデルと非パラメトリックモデルと比較する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:53:44 GMT)
Semidefinite Relaxations of the Gromov-Wasserstein Distance [9.0] グロモフ・ワッサー距離(Gromov-Wasser distance, GW)は、空間間の物体を一致させる最適な輸送問題の拡張である。
本稿では,GW距離の半定緩和法を提案する。
我々のアルゴリズムは、世界最適輸送計画(場合によっては)を、世界最適性の証明とともに計算する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:23:42 GMT)
From promise to practice: realizing high-performance decentralized training [9.0] ディープニューラルネットワークの分散トレーニングは、All-Reduceのような同期データ並列メソッドよりも理論的に優れたスケーラビリティのために大きな注目を集めている。
本稿では、All-Reduceトレーニングのスピードアップにつながる3つの重要な要因を特定し、いつ、どのように、どの程度の分散化によって、より短い実行時間が得られるかを決定するランタイムモデルを構築する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:04:56 GMT)
Sampling Strategies for Creation of a Benchmark for Dialectal Sentiment Classification [8.8] 本稿では,Google Placesレビューの弁証的感情分類のためのベンチマークを作成するためのデータサンプリング戦略について検討する。
位置情報に基づくフィルタリングに基づいて、オーストラリア(オーストラリア英語)、インド(インド英語)、イギリス(イギリス英語)のレビューの自己教師付きデータセットを収集する。
ラベルのセマンティクス、レビュー長、感情の比率に基づくサンプリング手法を採用し、3つの細調整BERTモデル上での性能を報告する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:02:03 GMT)
Experimental Design Using Interlacing Polynomials [8.7] 本稿では, インターレース手法を用いた実験設計問題に対する統一的決定論的アプローチを提案する。
本フレームワークは,D/A/E設計問題に対して,簡単な解析により最もよく知られた近似保証を復元する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:33:29 GMT)
Advancing Training Efficiency of Deep Spiking Neural Networks through Rate-based Backpropagation [8.7] 最近の知見は、ディープスパイキングニューラルネットワーク(SNN)のトレーニングにおいて、レートコーディングが代理段階に基づくバックプロパゲーション・アット・タイム(BPTT)によって取得される情報表現の第一形態であることを明らかにしている。
本稿では、BPTTの複雑さを軽減するために、レートベースの表現を活用するために特別に設計されたトレーニング戦略である、レートベースのバックプロパゲーションを提案する。
提案手法は,SNNの学習におけるメモリと計算要求を減らすために,計算グラフの合理化を図り,平均的ダイナミクスに焦点をあてることで,詳細な時間微分への依存を最小限に抑える。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:46:03 GMT)
A Prompt-Guided Spatio-Temporal Transformer Model for National-Wide Nuclear Radiation Forecasting [8.6] 放射線は人間の健康と環境の安全に重大なリスクをもたらす。
NRFormerは、核放射線の変動を全国的に予測するための革新的なフレームワークである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:58:57 GMT)
RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates [8.6] RoCoFTは大規模言語モデルのためのパラメータ効率の良い微調整法である。
提案手法は,最先端PEFT法と同等あるいは良好な精度を示すことを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:00:27 GMT)
RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates [8.6] RoCoFTは大規模言語モデルのためのパラメータ効率の良い微調整法である。
提案手法は,最先端PEFT法と同等あるいは良好な精度を示すことを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:00:27 GMT)
Online learning in motion modeling for intra-interventional image sequences [8.5] 本稿では,連続した医用画像に対する確率的運動モデルを提案する。
取得した画像間の動きを推定し、前もって動きを予測する。
その結果,オンライン学習による患者固有の適応による信頼性の高い動作推定と予測性能の向上が示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:53:12 GMT)
MANet: Fine-Tuning Segment Anything Model for Multimodal Remote Sensing Semantic Segmentation [8.4] 本研究では,マルチモーダルリモートセマンティックセマンティックセマンティックセグメンテーションのための新しいマルチモーダルアダプタベースネットワーク(MANet)を提案する。
このアプローチのコアとなるのは、SAMのイメージエンコーダを微調整して、マルチモーダルデータに対するモデルの一般的な知識を効果的に活用するMultimodal Adapter(MMAdapter)の開発である。
この研究は、マルチモーダル核融合のための新しいネットワークを導入するだけでなく、SAMのDSM(Digital Surface Model)データによる強力な一般化能力も初めて示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:52:16 GMT)
SplitSEE: A Splittable Self-supervised Framework for Single-Channel EEG Representation Learning [8.4] SplitSEEは、単一チャネル脳波における効果的な時間周波数表現学習のための自己教師型フレームワークである。
単一のチャネルのEEGからのみ表現を学習するが、マルチチャネルのベースラインよりも優れています。
部分的なモデルレイヤを使用して、ハイかつ安定したパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:34:33 GMT)
Social Norms in Cinema: A Cross-Cultural Analysis of Shame, Pride and Prejudice [8.4] 10k以上の恥/処女関係の表現を横断的データセットとして紹介する。
我々は、アメリカとインドの既知の文化的傾向に沿った恥と誇りの表現において、異文化間の大きな違いを見出した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:57:36 GMT)
Deep unrolled primal dual network for TOF-PET list-mode image reconstruction [8.3] 飛行時間情報(TOF)は、消滅光子の正確な位置データを提供する。
深層学習アルゴリズムはPET画像再構成において有望な結果を示した。
本研究では,TOFPETリストモード再構築のためのディープアンロール型デュアルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:17:47 GMT)
Unveiling the Mystery of Visual Attributes of Concrete and Abstract Concepts: Variability, Nearest Neighbors, and Challenging Categories [8.2] 本研究は,視覚表現の変動性を調べるためのケーススタディとして,よく研究された語彙-意味変数である具体性に焦点を当てた。
我々は、BingとYFCCという2つの異なるデータセットから抽出された、約1000の抽象的で具体的な概念に関連する画像に依存しています。
目的は, 概念の描写における視覚的多様性が, 具体的概念と抽象的概念を確実に区別できるかどうかを評価すること, (ii) 同一概念の複数の画像にまたがる視覚的特徴のバラツキを, 隣人による分析によって分析すること, (iii) 画像の分類と注釈によって, この多様性に寄与する難易度を識別することである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:44:36 GMT)
AI Rules? Characterizing Reddit Community Policies Towards AI-Generated Content [8.0] 30万件以上の公開サブレディットのメタデータとコミュニティルールを収集しました。
既存の文献と、AIルールに特有の新しい分類基準に基づいて、サブレディットとAIルールをラベル付けしました。
我々の研究結果は、AIに関する様々な懸念が、異なるコミュニティの文脈で出現したことを示している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:31:41 GMT)
AGaLiTe: Approximate Gated Linear Transformers for Online Reinforcement Learning [7.9] コンテクストに依存しない推論コストを提供するトランスフォーマー自己アテンション機構の代替を提案する。
最先端アーキテクチャであるGTrXLと比較して、我々のアプローチでの推論は少なくとも40%安価であり、メモリ使用量を50%以上削減している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:14:26 GMT)
Score Neural Operator: A Generative Model for Learning and Generalizing Across Multiple Probability Distributions [7.9] 我々は,複数の確率分布からスコア関数へのマッピングを統一されたフレームワーク内で学習する,$emphScore Neural Operatorを紹介した。
提案手法は,新しい分布からの1つのイメージを利用すれば,その分布から複数の異なる画像を生成することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:37:37 GMT)
Score Neural Operator: A Generative Model for Learning and Generalizing Across Multiple Probability Distributions [7.9] 我々は,複数の確率分布からスコア関数へのマッピングを統一されたフレームワーク内で学習する,$emphScore Neural Operatorを紹介した。
提案手法は,新しい分布からの1つのイメージを利用すれば,その分布から複数の異なる画像を生成することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:37:37 GMT)
LegalLens Shared Task 2024: Legal Violation Identification in Unstructured Text [7.8] 本稿では,2つのサブタスクにまたがって,テキスト中の法的違反を検出することに焦点を当てた。
トップパフォーマンスチームはベースラインよりもNERが7.11%改善し、NLIは5.7%改善した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:02:44 GMT)
Multi-Source Music Generation with Latent Diffusion [7.8] マルチソース拡散モデル (Multi-Source Diffusion Model, MDM) は、複数の音源の混合として音楽をモデル化することを提案した。
MSLDMは変分オートエンコーダ(VAE)を使用して、各機器のソースを別個の潜在表現にエンコードする。
このアプローチは音楽の総生成と部分生成を大幅に強化する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:17:33 GMT)
Data-Driven Cellular Network Selector for Vehicle Teleoperations [7.8] ビデオベースの遠隔操作システムの有効性は,セルラーネットワークの品質に大きく影響されている。
これらのパラメータを最適化するために、AVは複数のセルネットワークに接続でき、各ビデオパケットが送信されるセルネットワークをリアルタイムで決定できる。
本稿では,この問題を解決するために時系列機械学習アプローチを用いた,アクティブネットワークセレクタ(ANS)と呼ばれるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:32:42 GMT)
NeuroSEM: A hybrid framework for simulating multiphysics problems by coupling PINNs and spectral elements [7.7] 本研究では、PINNと高忠実度スペクトル要素法(SEM)を融合したハイブリッドフレームワークであるNeuroSEMを紹介した。
NeuroSEMはPINNとSEMの両方の強度を活用し、多物理問題に対する堅牢な解決策を提供する。
キャビティフローおよびシリンダーを過ぎる流れにおける熱対流に対するNeuroSEMの有効性と精度を実証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:08:30 GMT)
UmambaTSF: A U-shaped Multi-Scale Long-Term Time Series Forecasting Method Using Mamba [7.6] 本稿では,新しい時系列予測フレームワークであるUmambaTSFを提案する。
U字型エンコーダ・デコーダ多層パーセプトロン(MLP)のマルチスケール特徴抽出機能とMambaのロングシーケンス表現を統合する。
UmambaTSFは、広く使用されているベンチマークデータセットで最先端のパフォーマンスと優れた汎用性を達成する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:56:43 GMT)
Safety Filtering While Training: Improving the Performance and Sample Efficiency of Reinforcement Learning Agents [7.6] 強化学習(RL)コントローラは柔軟で性能が高いが、安全性を保証することは滅多にない。
安全フィルタは、柔軟性を維持しながら、RLコントローラにハードセーフの保証を与える。
評価中にのみ適用するのではなく、トレーニング用RLコントローラに安全フィルタを組み込むためのいくつかの修正を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:01:57 GMT)
Athena: Retrieval-augmented Legal Judgment Prediction with Large Language Models [7.5] Athena(アテナ)は、RAGをコア前処理コンポーネントとして育成し、特殊なタスクにおけるLLMのパフォーマンスを向上させる新しいフレームワークである。
実験の結果,Athenaの全体的な性能は大幅に改善した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:18:01 GMT)
Multiview Scene Graph [7.5] 適切なシーン表現は、空間知性の追求の中心である。
未提示画像からマルチビューシーングラフ(MSG)を構築することを提案する。
MSGは、場所とオブジェクトノードを相互接続したシーンをトポロジ的に表現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:04:05 GMT)
LoGS: Visual Localization via Gaussian Splatting with Fewer Training Images [7.4] 本稿では,3D Splatting (GS) 技術をシーン表現として活用した視覚に基づくローカライゼーションパイプラインを提案する。
マッピングフェーズでは、まずStructure-from-motion(SfM)を適用し、続いてGSマップを生成する。
高精度なポーズは、地図上で解析的に達成される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:17:18 GMT)
Pixology: Probing the Linguistic and Visual Capabilities of Pixel-based Language Models [7.4] Pixelベースの言語モデルは、サブワードベースの言語モデリングに代わる魅力的な選択肢として登場した。
PIXELは、レンダリングされたテキストで事前トレーニングされたビジョントランスフォーマーである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:21:23 GMT)
A Taxonomy of Miscompressions: Preparing Image Forensics for Neural Compression [7.3] 本稿では, うつ病の暫定分類法を提案する。
3種類の「何が起こるか」を定義し、シンボルを変更するミス圧縮を示すバイナリの「高影響」フラグを持つ。
本稿では,リスクコミュニケーションの促進と緩和研究について論じる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:15:06 GMT)
Vanilla Gradient Descent for Oblique Decision Trees [7.2] ニューラルネットワーク(NN)としての(ハード,斜め)DTの符号化法を提案する。
DTSemNetを用いて学習した斜めDTは、最先端技術を用いて学習した同様の大きさの斜めDTよりも正確であることを示す実験である。
また、DTSemNetは、物理入力による強化学習(RL)設定において、NNポリシーと同じくらい効率的にDTポリシーを学習できることを実験的に実証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:58:35 GMT)
Statistical Inference in Tensor Completion: Optimal Uncertainty Quantification and Statistical-Computational Gaps [7.2] 本稿では,不完全かつノイズの多い観測でテンソル線形形式を統計的に推定する,単純かつ効率的な手法を提案する。
これは、信頼区間予測、ヘテロスケダティックおよびサブ指数雑音下での推論、同時試験など、様々な統計的推論タスクに適している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:09:52 GMT)
Latent Schr{ö}dinger Bridge Diffusion Model for Generative Learning [7.1] 潜在空間におけるシュリンガー橋拡散モデルを用いた新しい生成学習手法を提案する。
我々は、Schr"odingerブリッジフレームワークを用いて、潜伏空間内の拡散モデルを開発する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:09:11 GMT)
RSSI-Assisted CSI-Based Passenger Counting with Multiple Wi-Fi Receivers [7.1] We developed a efficient edge computing-based passenger counting system using Wi-Fi signal。
システムの平均精度とF1スコアは94%を超え、他の協調センシングベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:46:52 GMT)
FedLPA: One-shot Federated Learning with Layer-Wise Posterior Aggregation [7.1] FedLPAは、フェデレートラーニングのための階層的な後続アグリゲーション手法である。
以上の結果から,FedLPAは最先端の手法よりも学習性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:57:43 GMT)
Words as Trigger Points in Social Media Discussions [7.0] トリガーポイントは感情的な政治的アイデンティティの理論に根ざし、道徳的期待と社会的処分に関する嘘つきの信念に関係している。
オンライン議論におけるトリガーポイントの検証は、ソーシャルメディアユーザーが意見の相違や感情的な政治的熟考に従事している理由と時期を理解するのに役立つ。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:37:03 GMT)
Latent BKI: Open-Dictionary Continuous Mapping in Visual-Language Latent Spaces with Quantifiable Uncertainty [7.0] 本稿では,新しい確率的マッピングアルゴリズムであるLatent BKIを導入し,不確かさを定量化するオープン語彙マッピングを実現する。
ラテントBKIは、人気のMatterPort-3DとSemantic KITTIデータセット上で、同様の明示的なセマンティックマッピングとVLマッピングフレームワークに対して評価される。
実世界の実験は、挑戦的な屋内環境に適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:02:32 GMT)
Toward a Well-Calibrated Discrimination via Survival Outcome-Aware Contrastive Learning [7.0] そこで本研究では,犠牲な校正を伴わずに識別のテキスト化を向上するための,新しいコントラスト学習手法を提案する。
提案手法は,類似した生存結果を持つサンプルに対して,低い罰則を付与する,対照的な学習枠組み内で重み付きサンプリングを用いる。
複数の実世界の臨床データセットに対する実験により,本手法は判別と校正の両面で最先端の深層生存モデルより優れていることが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:12:57 GMT)
Ada-K Routing: Boosting the Efficiency of MoE-based LLMs [7.0] トークンごとにアクティベートされた専門家の数を動的に調整する新しいAda-Kルーティング戦略を提案する。
我々の戦略は学習可能で軽量なアロケータモジュールを組み込んでおり、各トークンのコンテキストに応じたカスタマイズされた専門家リソース割り当てを決定する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:56:14 GMT)
Ada-K Routing: Boosting the Efficiency of MoE-based LLMs [7.0] トークンごとにアクティベートされた専門家の数を動的に調整する新しいAda-Kルーティング戦略を提案する。
我々の戦略は学習可能で軽量なアロケータモジュールを組み込んでおり、各トークンのコンテキストに応じたカスタマイズされた専門家リソース割り当てを決定する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:56:14 GMT)
Trajectory Prediction for Autonomous Driving using Agent-Interaction Graph Embedding [6.9] AiGem(Agent-Interaction Graph Embedding)は、自動運転車の周囲の交通渋滞を予測する。
その結果、AiGemは最先端のディープラーニングアルゴリズムより優れており、予測の地平線が長くなることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:56:27 GMT)
Sufficient and Necessary Explanations (and What Lies in Between) [6.9] 本稿では,汎用機械学習モデルにおける特徴重要度に関する2つの正確な概念について考察する。
本稿では,必要十分軸に沿って連続体を探索することによって,これらの制限を回避することの重要性の統一概念を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:04:35 GMT)
Efficient in-situ generation of photon-memory entanglement in a nonlinear cavity [6.9] 1つの絡み合った光モードを捨てた後でも、高速な双方向光子メモリの絡み合わせを発生させることができる。
このような光子メモリの絡み合い源は、量子ネットワークおよび相互接続アプリケーションのための汎用的なリソースを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:53:23 GMT)
Leveraging LLM Embeddings for Cross Dataset Label Alignment and Zero Shot Music Emotion Prediction [6.8] 本稿では,複数データセットにまたがるラベルアライメントと,新たなカテゴリにおけるゼロショット予測にLarge Language Model (LLM)埋め込みを利用する音楽感情認識の新しい手法を提案する。
我々は,新たなデータセットに対してゼロショット推論を行うことにより,新たなトレーニングを伴わずに,未知のラベルに一般化できることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:48:31 GMT)
Mitigating Frequency Bias and Anisotropy in Language Model Pre-Training with Syntactic Smoothing [6.7] 本稿では,言語モデルの周波数バイアスを定量化する手法を提案する。
そこで本研究では,事前学習中のトークン表現に対して構文的事前表現を誘導することにより,言語モデルの周波数バイアスを低減する手法を提案する。
このアプローチにより、頻度の低い英語トークンの性能が向上し、異方性も低下する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:09:57 GMT)
Augmentation-aware Self-supervised Learning with Conditioned Projector [6.7] 自己教師付き学習(SSL)は、ラベルのないデータから学習するための強力な技術である。
本稿では,プロジェクタネットワークを改良し,表現空間の特徴に対する感受性を高めることを提案する。
提案手法は条件拡張型自己教師学習(CASSLE)と呼ばれ,通常の共同埋め込み型SSL手法に直接適用可能である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:31:41 GMT)
Reframing Data Value for Large Language Models Through the Lens of Plausibility [6.7] 本稿では,言語モデルにおけるデータ値問題に対する別の視点を提案する。
計算的に抽出可能な新しい値関数を開発し、証明可能な性質を持つ第一原理から導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:04:22 GMT)
Pubic Symphysis-Fetal Head Segmentation Network Using BiFormer Attention Mechanism and Multipath Dilated Convolution [6.7] 経ペリン超音波画像における胎児の頭頂部偏位は,胎児の頭頂部偏位と進行を評価する上で重要な役割を担っている。
超音波画像セグメンテーションのための動的でクエリ対応のスパースアテンション機構を提案する。
BRAU-Net という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:56:16 GMT)
Pubic Symphysis-Fetal Head Segmentation Network Using BiFormer Attention Mechanism and Multipath Dilated Convolution [6.7] 経ペリン超音波画像における胎児の頭頂部偏位は,胎児の頭頂部偏位と進行を評価する上で重要な役割を担っている。
超音波画像セグメンテーションのための動的でクエリ対応のスパースアテンション機構を提案する。
BRAU-Net という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:56:16 GMT)
PaSTe: Improving the Efficiency of Visual Anomaly Detection at the Edge [6.6] 視覚異常検出(VAD)は、異常画像を識別し、異常の原因となる特定の領域を特定できることから、重要な研究の注目を集めている。
現実世界のアプリケーションの可能性にもかかわらず、文献はリソース効率の高いVAD、特にエッジデバイスへのデプロイに限定して焦点を当てている。
この作業は、軽量ニューラルネットワークを活用してメモリと要求を削減し、リソース制約のあるエッジデバイスへのVADデプロイメントを可能にすることで、このギャップに対処する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:25:43 GMT)
BSM: Small but Powerful Biological Sequence Model for Genes and Proteins [6.6] 小型ながら強力な混合モード生物配列基盤モデルであるBSMを導入する。
RefSeq、Gene Related Sequences、およびWebから生物学的シークエンスをインターリーブした3種類のデータに基づいてトレーニングされている。
学習効率とクロスモーダル表現を著しく向上させ、非モーダルデータにのみ訓練されたモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:12:28 GMT)
Enhancing Pre-Trained Generative Language Models with Question Attended Span Extraction on Machine Reading Comprehension [6.6] 学習前生成言語モデル(PLM)の微調整段階で統合されたQASEは,その性能を著しく向上させる。
QASEモジュールの有効性は、さまざまなデータセットで厳格にテストされている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:35:34 GMT)
Continuous Transition between Bosonic Fractional Chern Insulator and Superfluid [6.6] この手紙は、位相的に順序付けられた位相と自発な連続対称性破壊相の間の連続FCI-SF遷移の直接数値的なデモンストレーションを示す。
さらに、チャーンバンドの分散を徐々に平坦化することにより、ゼロフィールドボソニックFCIがSF状態から実現される可能性があることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:45:40 GMT)
Beyond Sequence: Impact of Geometric Context for RNA Property Prediction [6.6] RNA構造は1D配列、2Dトポロジカルグラフ、3Dオール原子モデルとして表現できる。
既存の作品は、主に2次元と3次元の幾何学的文脈を見渡す1次元シーケンスベースのモデルに焦点を当てている。
本研究では,RNA特性予測に明示的な2次元および3次元幾何情報を取り入れた最初の体系的評価を行った。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:09:34 GMT)
MicroSSIM: Improved Structural Similarity for Comparing Microscopy Data [6.6] 構造的類似性(SSIM)は、この分野で最もよく使われる尺度の1つである。
我々は,低SNR入力から発生する予測を対応する高SNRデータと比較した場合,SSIM成分が予期せず振る舞うことを示す。
SSIMの派生版であるMicroSSIMを導入し、上記の問題を克服する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:55:21 GMT)
MicroSSIM: Improved Structural Similarity for Comparing Microscopy Data [6.6] 構造的類似性(SSIM)は、この分野で最もよく使われる尺度の1つである。
我々は,低SNR入力から発生する予測を対応する高SNRデータと比較した場合,SSIM成分が予期せず振る舞うことを示す。
SSIMの派生版であるMicroSSIMを導入し、上記の問題を克服する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:55:21 GMT)
Causal Reasoning in Large Language Models: A Knowledge Graph Approach [6.5] 大規模言語モデル(LLM)は一般的に、意味的に類似した情報を取得するか、あるいはチェーン・オブ・シントのような構造化されたプロンプトを通して推論能力を向上させることでパフォーマンスを向上させる。
本稿では,因果関係を利用した知識グラフに基づくランダムウォーク推論手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:24:44 GMT)
A Watermark for Low-entropy and Unbiased Generation in Large Language Models [6.5] 本研究は,これらの問題に対処可能な透かしであるサンプリング・ワン・アクセプティング(STA-1)手法を提案する。
低エントロピーのシナリオでは、不偏の透かしは、透かし強度と不満足な出力のリスクとのトレードオフに直面している。
低エントロピーデータセットと高エントロピーデータセットの両方の実験結果は、STA-1が既存の非バイアスウォーターマークに匹敵するテキスト品質と透かし強度を達成することを示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:14:50 GMT)
CycleNet: Enhancing Time Series Forecasting through Modeling Periodic Patterns [6.3] 本稿では、学習可能な繰り返しサイクルを用いてシーケンス内の固有周期パターンをモデル化するResidual Cycle Forecasting(RCF)手法を提案する。
CycleNetは、電気、天気、エネルギーを含む複数の領域で最先端の予測精度を達成し、高い効率性を提供する。
新しいプラグアンドプレイ技術として、RCFはPatchTSTやiTransformerといった既存のモデルの予測精度を大幅に向上させることができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:24:29 GMT)
CycleNet: Enhancing Time Series Forecasting through Modeling Periodic Patterns [6.3] 本稿では、学習可能な繰り返しサイクルを用いてシーケンス内の固有周期パターンをモデル化するResidual Cycle Forecasting(RCF)手法を提案する。
CycleNetは、電気、天気、エネルギーを含む複数の領域で最先端の予測精度を達成し、高い効率性を提供する。
新しいプラグアンドプレイ技術として、RCFはPatchTSTやiTransformerといった既存のモデルの予測精度を大幅に向上させることができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:24:29 GMT)
IC/DC: Surpassing Heuristic Solvers in Combinatorial Optimization with Diffusion Models [6.3] IC/DCは,教師なしの学習型最適化フレームワークである。
IC/DCは2つの異なる項目を含む問題の解決に特化しており、有効な解を生成するのに問題固有の探索プロセスは必要ない。
私たちは、問題固有の制約を順守しながら、ソリューションのコストを最小限に抑えるために、自己監督的な方法でモデルをトレーニングします。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:53:30 GMT)
Mobility-Aware Federated Learning: Multi-Armed Bandit Based Selection in Vehicular Network [6.2] 本研究では,車両が道路セグメントを走行してFLを行う移動型車両連合学習(MAVFL)方式を設計する。
我々は、車両の移動が訓練損失に与える影響を示すために収束分析を行う。
トレーニングの損失と遅延を考慮した多腕バンディットに基づく車両選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:16:09 GMT)
Mobility-Aware Federated Learning: Multi-Armed Bandit Based Selection in Vehicular Network [6.2] 本研究では,車両が道路セグメントを走行してFLを行う,移動型車両連合学習(MAVFL)方式を設計する。
一部の車両はセグメントから外れてトレーニングが失敗する可能性がある。
我々は、車両の移動が訓練損失に与える影響を示すために収束分析を行う。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:16:09 GMT)
Holistic Reasoning with Long-Context LMs: A Benchmark for Database Operations on Massive Textual Data [6.2] HoloBenchは、テキストベースのコンテキストにデータベース推論操作をもたらすフレームワークです。
本研究では,文脈内の情報量が文脈長よりもLCLMの性能に大きく影響していることを示す。
複数の情報の集約を必要とするタスクは、コンテキスト長が増加するにつれて顕著な精度低下を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:04:13 GMT)
The Moral Case for Using Language Model Agents for Recommendation [6.2] 既存のレコメンデーターは、大量監視、集中力、狭い行動主義に陥り、ユーザーエージェンシーを侵害する。
自然言語で表現されたユーザの好みや値にマッチしたコンテンツのソースとキュレートには,言語モデル(LM)エージェントを使用します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:51:04 GMT)
Generating entanglement of two acoustic modes by driving the qubit in circuit quantum acoustodynamics system [6.2] 回路量子音響力学系における2つの長寿命フォノンモードの絡み合いを生成する方法を提案する。
2つの音響モードが圧電相互作用を介してキュービットに結合し、キュービットはマイクロ波磁場によって駆動される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:20:54 GMT)
Evaluating LLM-driven User-Intent Formalization for Verification-Aware Languages [6.1] 本稿では,検証対応言語における仕様の質を評価するための指標を提案する。
MBPPコード生成ベンチマークのDafny仕様の人間ラベル付きデータセットに,我々の測定値が密接に一致することを示す。
また、このテクニックをより広く適用するために対処する必要がある正式な検証課題についても概説する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:44:50 GMT)
HumVI: A Multilingual Dataset for Detecting Violent Incidents Impacting Humanitarian Aid [6.1] HumVIは、3つの言語(英語、フランス語、アラビア語)のニュース記事を含むデータセットで、それらが影響する人道セクターによって分類された暴力的な事件の事例を含む。
データセットのベンチマークを提供し、データ拡張やマスク損失など、さまざまなディープラーニングアーキテクチャとテクニックを活用しています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:23:13 GMT)
HumVI: A Multilingual Dataset for Detecting Violent Incidents Impacting Humanitarian Aid [6.1] HumVIは、3つの言語(英語、フランス語、アラビア語)のニュース記事を含むデータセットで、それらが影響する人道セクターによって分類された暴力的な事件の事例を含む。
データセットのベンチマークを提供し、データ拡張やマスク損失など、さまざまなディープラーニングアーキテクチャとテクニックを活用しています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:23:13 GMT)
TEOcc: Radar-camera Multi-modal Occupancy Prediction via Temporal Enhancement [5.9] 本稿では,TEOccと呼ばれるマルチモーダル時間拡張占有予測ネットワークを提案する。
本手法は3次元物体検出における時間情報の利用の成功に着想を得たものである。
実験の結果、TEOccはnuScenesベンチマークで最先端の占有率予測を達成している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:20:48 GMT)
Pole and zero edge state invariant for 1D non-Hermitian sublattice symmetry [5.8] 1D非エルミート2バンド部分格子対称強結合ハミルトン多様体には位相的エッジ状態が存在することを示す。
我々は極ゼロのアプローチを拡張して、ハミルトニアンが非対角的でないときの超格子対称モデルに適用する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:27:19 GMT)
How Initial Connectivity Shapes Biologically Plausible Learning in Recurrent Neural Networks [5.7] リカレントニューラルネットワーク(RNN)の学習における初期接続性の影響について検討した。
その結果,初歩重みは生物学的に妥当な学習規則の学習性能に著しく影響を及ぼすことがわかった。
我々は,リアプノフ指数を正規化する最近提案された勾配フロス法を生物学的に妥当な学習に拡張した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:59:58 GMT)
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning [5.7] オフラインモデルに基づく強化学習(MBRL)は、データ駆動による意思決定と制御のための強力なアプローチである。
オフラインデータセットで同一の動作をする様々なMDPが存在する可能性があるため、真のMDPに関する不確実性に対処することは困難である。
本研究では,BAMDPを連続状態および動作空間で解くことのできるベイズ適応モンテカルロ計画アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:36:43 GMT)
Toolken+: Improving LLM Tool Usage with Reranking and a Reject Option [5.6] Toolken+は、ToolkenGPTが選択した上位$kのツールをランク付けすることで、最初の問題を軽減します。
ツールケン+が多段階の数値推論およびツール選択タスクに与える影響を実証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:09:03 GMT)
Investigating Annotator Bias in Large Language Models for Hate Speech Detection [5.6] 本稿では,ヘイトスピーチデータに注釈をつける際に,Large Language Models (LLMs) に存在するバイアスについて考察する。
具体的には、これらのカテゴリ内の非常に脆弱なグループを対象として、アノテータバイアスを分析します。
我々は,この研究を行うために,独自のヘイトスピーチ検出データセットであるHateBiasNetを紹介した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:29:29 GMT)
Nteasee: A mixed methods study of expert and general population perspectives on deploying AI for health in African countries [5.6] 我々は、アフリカでAIを健康にデプロイする際に、ベストプラクティス、公正度指標、潜在的なバイアスを緩和するための質的研究を行う。
詳細な面接(IDI)と調査を組み合わせた混合手法を用いる。
アフリカ5カ国672人の一般住民を対象に, 盲目30分間のアンケート調査を行った。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:01:46 GMT)
Nteasee: A mixed methods study of expert and general population perspectives on deploying AI for health in African countries [5.6] 我々は、アフリカでAIを健康にデプロイする際に、ベストプラクティス、公正度指標、潜在的なバイアスを緩和するための質的研究を行う。
詳細な面接(IDI)と調査を組み合わせた混合手法を用いる。
アフリカ5カ国672人の一般住民を対象に, 盲目30分間のアンケート調査を行った。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:01:46 GMT)
MLPerf Power: Benchmarking the Energy Efficiency of Machine Learning Systems from μWatts to MWatts for Sustainable AI [5.5] 機械学習(ML)技術は、さまざまなシステムで電力消費が急増している。
本稿では,マイクロワットからメガワットまでの電力レベルでMLシステムのエネルギー効率を評価するための総合的なベンチマーク手法であるSerf Powerを紹介する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:06:33 GMT)
KLay: Accelerating Neurosymbolic AI [5.3] ニューロシンボリックAIに対する一般的なアプローチは、論理式を演算回路にマッピングすることである。
我々は,効率よく並列化可能な演算回路を表現するために知識層(KLay)を導入する。
我々は,KLayが複数桁の高速化を実現することを実証的に示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:02:55 GMT)
IntGrad MT: Eliciting LLMs' Machine Translation Capabilities with Sentence Interpolation and Gradual MT [5.3] 大規模言語モデル(LLM)は、追加の並列コーパスを微調整することなく、翻訳において強力な性能を示している。
これまでの研究は、関連するいくつかの例や辞書や文法書などの外部リソースを活用することでこの問題を軽減することに重点を置いてきた。
本稿では,LLM固有の翻訳機能を完全に活用することを目的とした,IntGrad MTという新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:26:28 GMT)
Generate then Refine: Data Augmentation for Zero-shot Intent Detection [5.3] ゼロリソース領域におけるインテント検出のためのデータ拡張手法を提案する。
我々は、ゼロショット設定でオープンソースの大言語モデルを用いて、意図ラベルに対する発話を生成する。
第2に、生成された発話を改善するために、より小さなシーケンス・ツー・シーケンス・モデルを開発する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:02:05 GMT)
Generate then Refine: Data Augmentation for Zero-shot Intent Detection [5.3] ゼロリソース領域におけるインテント検出のためのデータ拡張手法を提案する。
我々は、ゼロショット設定でオープンソースの大言語モデルを用いて、意図ラベルに対する発話を生成する。
第2に、生成された発話を改善するために、より小さなシーケンス・ツー・シーケンス・モデルを開発する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:02:05 GMT)
Generative AI Policies under the Microscope: How CS Conferences Are Navigating the New Frontier in Scholarly Writing [5.2] 本稿では,コンピュータサイエンス会議における生成型AI政策の現状について考察する。
政策適用のガイドラインを提供する。
生成AIはコンピュータ科学の未来において重要な役割を果たすと結論付けている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:33:42 GMT)
Calabi-Yau metrics through Grassmannian learning and Donaldson's algorithm [5.2] K"ahlerメトリクスに対するリッチ平坦近似を得るための新しいアプローチを提案する。
グラスマン多様体上の勾配降下を用いて、切断の効率的な部分空間を同定する。
3次元のDwork族にメソッドを実装し、モジュライ空間の異なる点における振る舞いについてコメントする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:08:43 GMT)
Do LLM Agents Exhibit Social Behavior? [5.1] State-Understanding-Value-Action (SUVA) は、社会的文脈における応答を体系的に分析するフレームワークである。
最終決定とそれにつながる反応生成プロセスの両方を通じて社会的行動を評価する。
発話に基づく推論がLLMの最終動作を確実に予測できることを実証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:27:04 GMT)
ILAEDA: An Imitation Learning Based Approach for Automatic Exploratory Data Analysis [5.0] 我々は、操作を重要なものにする重要な特徴のすべてが、報酬を使って数学的に正確にキャプチャできるわけではないと論じる。
本稿では,専門家EDAセッションの模倣学習を通じて訓練されたAutoEDAモデルを提案する。
提案手法は,既存のエンドツーエンドEDA手法を最大3倍のベンチマークで上回り,高い性能と一般化を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:56:13 GMT)
Personas with Attitudes: Controlling LLMs for Diverse Data Annotation [4.9] 大規模言語モデル(LLM)のパーソナライズによるデータアノテーションタスクにおける多様性と制御の向上のための新しいアプローチを提案する。
我々は、ペルソナがアノテーションの多様性を高め、個々のペルソナがアノテーションに与える影響が一貫性があり、制御可能であるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:22:49 GMT)
Findings of the WMT 2024 Shared Task on Chat Translation [4.8] 本稿では,第3版チャット翻訳共有タスクの結果について述べる。
この課題は、二言語的カスタマーサポート会話の翻訳、特に翻訳品質と評価における会話コンテキストの影響に焦点を当てることであった。
私たちは8つのチームから22のプライマリ・サブミットと32のコントラスト・サブミットを受け取り、それぞれの言語ペアは少なくとも3つのチームから参加しました。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:13:17 GMT)
Tokenization and Morphology in Multilingual Language Models: A~Comparative Analysis of mT5 and ByT5 [4.8] トークン化の影響を、mT5とByT5という2つの多言語言語モデルと対比して捉えた。
4つのタスクと17の言語でこれらのモデルに符号化された形態的知識を探索し、多言語言語モデルが他の言語よりも優れた形態的システムを学ぶことを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:14:19 GMT)
Navigating the Cultural Kaleidoscope: A Hitchhiker's Guide to Sensitivity in Large Language Models [4.8] LLMはますますグローバルなアプリケーションにデプロイされ、さまざまなバックグラウンドを持つユーザが尊敬され、理解されることが保証される。
文化的な害は、これらのモデルが特定の文化的規範と一致しないときに起こり、文化的な価値観の誤った表現や違反をもたらす。
潜在的な文化的不感を露呈するシナリオを通じて、異なる文化的文脈におけるモデルアウトプットを評価するために作成された文化的調和テストデータセットと、多様なアノテータからのフィードバックに基づいた微調整による文化的感受性の回復を目的とした、文化的に整合した選好データセットである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:13:10 GMT)
Subgraph-Aware Training of Language Models for Knowledge Graph Completion Using Structure-Aware Contrastive Learning [4.7] 微調整事前学習言語モデル(PLM)は、最近知識グラフ補完(KGC)を改善する可能性を示している。
そこで本研究では,KGC(SATKGC)のためのサブグラフ認識学習フレームワークを提案する。 (i)サブグラフ認識のミニバッチ化により,ハードネガティブサンプリングの促進とトレーニング中のエンティティ発生頻度の不均衡を軽減すること,および (ii)知識グラフの構造特性の観点から,よりハードなインバッチ負三重項とハードポジティブ三重項にフォーカスする新たなコントラスト学習を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:59:09 GMT)
Post Training Quantization of Large Language Models with Microscaling Formats [4.7] SmoothQuant, AWQ, GPTQの3つの有名なポストトレーニング手法の併用について検討した。
異なるPTQ手法を組み合わせることで、4ビットの重みと8ビットのアクティベーションにモデルを量子化できることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:09:23 GMT)
Cross-Dataset Generalization in Deep Learning [4.7] 深層学習は, 位相イメージング, 3次元画像再構成, 位相切り離し, レーザースペックル低減など, 様々な分野で広く利用されている。
そのデータ駆動性は、豊富なデータでトレーニングすることで、ネットワーク内の数学的関係を暗黙的に構築することを可能にする。
あるデータセットでトレーニングされたネットワークは、異なるデータセットから未知のターゲットを認識するのに苦労する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:48:21 GMT)
FedCCRL: Federated Domain Generalization with Cross-Client Representation Learning [4.7] ドメイン一般化(DG)は、目に見えないドメインに効果的に一般化できるモデルを訓練することを目的としている。
クライアントがデータを直接共有せずに協調的にモデルをトレーニングするフェデレートラーニング(FL)では、既存のDGアルゴリズムはFL設定に直接適用できない。
本稿では,新しいフェデレーションドメイン一般化手法であるFedCCRLを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:44:21 GMT)
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations [4.7] 画像分類やオブジェクト検出などの下流タスクにおける教師あり学習よりも優れている。
対照的な学習における一般的な強化手法は、ランダムな収穫とそれに続くリサイズである。
本稿では,新しいインスタンス識別手法と適応型損失関数を用いたフレームワークであるLeOCLRを紹介する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:52:15 GMT)
Resolution Enhancement of Under-sampled Photoacoustic Microscopy Images using Implicit Neural Representations [4.7] 光音響顕微鏡(AR-PAM)は皮下血管造影に有用である。
従来のデコンボリューション法では、PSF(Point Spreadvolution)を使用して解像度を改善する。
Inlicit Neural Representation (INR) に基づくアプローチを提案する。
本手法は,空間座標から初期音圧への連続的なマッピングを学習し,離散像の限界を克服する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:44:57 GMT)
PMMT: Preference Alignment in Multilingual Machine Translation via LLM Distillation [4.7] 特定の翻訳嗜好を持つ大規模多言語並列コーパスを生成するための新しい手法を提案する。
実験の結果,提案手法は人間の嗜好に一致した翻訳タスクにおいて,大きなマージンでリードしていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:54:27 GMT)
Cilium and VDM -- Towards Formal Analysis of Cilium Policies [4.6] 産業制御システムは、現代のコンピューティングインフラとの相互作用を可能にするために、より分散し、相互接続化されつつある。
このデータと相互接続性を高める上での課題のひとつは、これらのシステムのアーキテクチャをモノリシックからコンポーネントベースの分散システムに変更することである。
サブコンポーネントの多い分散システムのデプロイや運用方法など,さまざまな疑問が浮かび上がっています。
Ciliumはkubernetesのネットワークオーバーレイとして人気があり、kubernetes podとして動作するさまざまなコンポーネント間のネットワークポリシの定義を可能にする。
本稿では,VDM-SLを用いたCiliumネットワークポリシの形式解析の利用について検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:20:11 GMT)
Towards General Deepfake Detection with Dynamic Curriculum [4.6] 本稿では,カリキュラム学習パラダイムを用いたディープフェイク検出器のトレーニングにサンプル硬さを導入することを提案する。
我々は,このモデルがトレーニング中に徐々にハードサンプルに焦点をあてる,新しい単純かつ効果的な戦略である動的顔面法学カリキュラム(DFFC)を提示する。
総合的な実験により,DFFCは各種のエンド・ツー・エンドディープフェイク検出器の内・クロス・データセット性能を向上できることが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:58:09 GMT)
POLO -- Point-based, multi-class animal detection [4.6] POLOは多クラスオブジェクト検出モデルであり、ポイントラベルで完全にトレーニングすることができる。
POLOは、空中画像中の動物を数える際の精度を向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:17:16 GMT)
A Cross-Lingual Statutory Article Retrieval Dataset for Taiwan Legal Studies [4.5] 本稿では,多言語設定における法的情報検索を強化するために,言語間法定項目検索(SAR)データセットを提案する。
我々のデータセットは、台湾の民事・刑事・行政法を網羅し、対応する中国語版と関連する法令とを合わせた、英語による音声言語形式の法的問合せを特徴としている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:53:40 GMT)
Rethinking Graph Transformer Architecture Design for Node Classification [4.5] グラフトランスフォーマー(GT)は、高次メッセージパッシングを容易にするためにマルチヘッドアテンションを利用するグラフニューラルネットワーク(GNN)の一種である。
本研究では,ノード分類タスクにおけるGTアーキテクチャの適応性を検討するための観測実験を行う。
提案したGTアーキテクチャは,グローバルノイズや計算効率の制限の影響を受けずに,ノード分類タスクに効果的に適応することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:08:16 GMT)
FVEval: Understanding Language Model Capabilities in Formal Verification of Digital Hardware [4.5] FVEvalは,形式的検証(FV)に関わるタスクにおいて,大規模言語モデル(LLM)のパフォーマンスを特徴付ける最初の総合ベンチマークである。
ベンチマークは3つのサブタスクで構成され、異なるレベルでLLM能力を測定する。
本稿では,FVに整合した合成例を生成するための,専門家による検証手法と手法のコレクションについて述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:48:57 GMT)
Diverse Perspectives, Divergent Models: Cross-Cultural Evaluation of Depression Detection on Twitter [4.5] 我々は、異文化のTwitterデータに基づくAIモデルを構築するためのベンチマークデータセットの一般化を評価する。
以上の結果から,抑うつ検出モデルが世界規模で一般化しないことが示唆された。
事前訓練された言語モデルは、ロジスティック回帰と比較して最高の一般化を達成するが、落ち込んだユーザーと非西洋人ユーザーには依然として大きな差がある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:31:41 GMT)
A Corpus for Named Entity Recognition in Chinese Novels with Multi-genres [4.5] 我々は、13のジャンルにまたがる260のオンライン小説から105,851文に263,135のエンティティを含む、最大規模の多ジャンルの文学的NERコーパスを構築した。
実験の結果,ジャンル差は文学ドメインやニュースドメインのようなドメイン差ほど大きくは影響しないものの,NERのパフォーマンスに大きな影響を及ぼすことが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:34:26 GMT)
Difficult Task Yes but Simple Task No: Unveiling the Laziness in Multimodal LLMs [4.4] MLLM(Multimodal Large Language Models)は、現実世界の深い理解を示し、複雑なタスクを処理できる。
この記事では、この問題を深く掘り下げて、モデルが簡単な質問に答えるのが困難であることを明らかにする。
難解な質問と単純な質問の間のこのモデル行動の相違を、モデル怠慢(model laziness)と呼ぶ。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:40:50 GMT)
Advancing Supervised Local Learning Beyond Classification with Long-term Feature Bank [4.4] ローカル学習は、ディープニューラルネットワークにおける従来のエンドツーエンドのバックエンドの代替手段を提供する。
Memory-augmented Auxiliary Network (MAN)は、シンプルな設計原則を導入し、マルチタスク適応性とコミュニケーションを強化する機能バンクを組み込んでいる。
MANはGPUメモリを保存するだけでなく、さまざまなビジュアルタスクのために複数のデータセットにまたがるエンドツーエンドのアプローチと同等のパフォーマンスを達成している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:33:47 GMT)
Mechanistic Permutability: Match Features Across Layers [4.2] SAE Matchは、ニューラルネットワークの異なる層にまたがってSAE機能を整列するための、新しいデータフリーな手法である。
我々の研究は、ニューラルネットワークにおける特徴力学の理解を深め、機械論的解釈可能性研究のための新しいツールを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:47:46 GMT)
Mechanistic Permutability: Match Features Across Layers [4.2] SAE Matchは、ニューラルネットワークの異なる層にまたがってSAE機能を整列するための、新しいデータフリーな手法である。
我々の研究は、ニューラルネットワークにおける特徴力学の理解を深め、機械論的解釈可能性研究のための新しいツールを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:47:46 GMT)
WeatherDG: LLM-assisted Procedural Weather Generation for Domain-Generalized Semantic Segmentation [4.1] 本研究では,現実的な,天気の多様性,運転画面の画像を生成するための新しいアプローチであるWeatherDGを提案する。
まず、ソースデータでSDを微調整し、生成されたサンプルの内容とレイアウトを現実世界の運転シナリオに合わせる。
我々は,様々な気象条件下で,SDが高度に調整されたクラスのオブジェクトを生成することを奨励するバランスのとれた生成戦略を導入する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:29:26 GMT)
Context Matters: Pushing the Boundaries of Open-Ended Answer Generation with Graph-Structured Knowledge Context [4.1] 本稿では,知識グラフに基づく拡張と合わせて,グラフ駆動型コンテキスト検索を組み合わせた新しいフレームワークを提案する。
我々は,様々なパラメータサイズを持つ大規模言語モデル(LLM)の実験を行い,知識の基盤化能力を評価し,オープンな質問に対する回答の事実的正確性を決定する。
われわれの方法であるGraphContextGenは、テキストベースの検索システムよりも一貫して優れており、その堅牢性と多くのユースケースへの適応性を実証している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:24:09 GMT)
Sorted Weight Sectioning for Energy-Efficient Unstructured Sparse DNNs on Compute-in-Memory Crossbars [4.1] $textitsorted weight sectioning$ (SWS) は、ビットスライクな計算インメモリ(CIM)クロスバーにソートされたディープニューラルネットワーク(DNN)重みを配置する重み付けアルゴリズムである。
提案手法は,非構造スパルスBERTモデルにおけるADCエネルギー使用量を89.5%削減する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:37:16 GMT)
SplatPose+: Real-time Image-Based Pose-Agnostic 3D Anomaly Detection [4.1] そこで我々は,SplatPose+を提案する。SplatPose+は,局所化のためのStructure from Motion(SfM)モデルと,新規ビュー合成のための3次元ガウススプラッティング(3DGS)モデルを組み合わせたハイブリッド表現である。
提案するパイプラインには追加のSfMモデルの計算が必要であるが,SplatPoseと比較して,リアルタイムの推論速度と高速なトレーニングを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:52:24 GMT)
PAVLM: Advancing Point Cloud based Affordance Understanding Via Vision-Language Model [4.1] 3Dオブジェクト上で動作可能な領域を識別する作業であるアフォーマンス理解は、ロボットシステムが物理的な世界の中で関わり、操作できるようにする上で重要な役割を担っている。
視覚言語モデル(VLM)は高レベルの推論において優れているが、効果的な人間とロボットの相互作用に必要な微妙な物理的特性の把握には不十分である。
PAVLMは、事前訓練された言語モデルに埋め込まれた広範なマルチモーダル知識を利用して、ポイントクラウドの3Dアベイランス理解を強化する革新的なフレームワークである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:53:42 GMT)
Machine learning of the Ising model on a spherical Fibonacci lattice [4.1] 球面に閉じ込められたイジングモデルについて検討し,フィボナッチ格子を用いた実装に焦点を当てた。
スピン配置を様々な温度で解析し, 相転移温度を同定する。
この研究は微小重力環境におけるスピン相互作用の理解におけるフィボナッチ格子の幾何学的性質の重要性を強調した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:18:04 GMT)
NatLan: Native Language Prompting Facilitates Knowledge Elicitation Through Language Trigger Provision and Domain Trigger Retention [4.1] 我々はMLLMの主流言語を人間の母国語に類似させ、2つの認知的特徴を用いて翻訳・翻訳・解答法を解釈する。
我々は、マルチMLLMコラボレーション戦略を採用し、新たなロール強化ドメイン固有MLLMを導入するNative Language Prompting(NatLan)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:24:42 GMT)
CoActionGraphRec: Sequential Multi-Interest Recommendations Using Co-Action Graphs [4.0] eBayのデータは、他のEコマースサイトよりも桁違いに多い。
共作用グラフ層を利用したテキストベースの2tower深層学習モデル(アイテムタワーとユーザタワー)を提案する。
項目タワーでは、各項目をその共作用項目を用いて表現し、グラフニューラルネットワークコンポーネントによって完全に活用される協調作用グラフで協調的な信号をキャプチャする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:11:18 GMT)
Explainable AI Methods for Multi-Omics Analysis: A Survey [3.9] マルチオミクス(multi-omics)とは、複数の「オム」から派生したデータの積分解析である。
深層学習の手法は、マルチオミクスデータの統合や、分子間相互作用の洞察、複雑な疾患の研究の強化にますます活用されている。
これらのモデルは、多くの相互接続層と非線形関係を持ち、しばしばブラックボックスとして機能し、意思決定プロセスにおける透明性を欠いている。
このレビューでは、マルチオミクス研究において、xAIが深層学習モデルの解釈可能性を改善する方法について検討し、臨床医に明確な洞察を与える可能性を強調した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:01:17 GMT)
Conjugate Bayesian Two-step Change Point Detection for Hawkes Process [3.8] 本稿では,ホークス過程に対する共役ベイズ変換点検出法を提案する。
合成データと実データの両方で実験を行い,本手法の有効性と効率性を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:52:53 GMT)
Conjugate Bayesian Two-step Change Point Detection for Hawkes Process [3.8] 本稿では,ホークス過程に対する共役ベイズ変換点検出法を提案する。
合成データと実データの両方で実験を行い,本手法の有効性と効率性を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:52:53 GMT)
Conjugate Bayesian Two-step Change Point Detection for Hawkes Process [3.8] 本稿では,ホークス過程に対する共役ベイズ変換点検出法を提案する。
合成データと実データの両方で実験を行い,本手法の有効性と効率性を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:52:53 GMT)
Reinforcement Learning Based Bidding Framework with High-dimensional Bids in Power Markets [3.8] 本稿では,RLに基づく入札手法にHDBを完全に活用するフレームワークを提案する。
まず、ニューラルネットワークサプライ関数(NNSF)と呼ばれる特殊なタイプのニューラルネットワークを用いて、Nのプライスパワーペアという形でHDBを生成する。
次に、NNSFをマルコフ決定プロセス(MDP)に埋め込んで、既存のRLメソッドと互換性を持たせる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:39:28 GMT)
Efficient, Accurate and Stable Gradients for Neural ODEs [3.8] 本稿では高次かつ数値的に安定な代数的可逆解器のクラスを示す。
この構造は自然にニューラルCDEとSDEの数値スキームにまで拡張される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:36:05 GMT)
Representation Similarity: A Better Guidance of DNN Layer Sharing for Edge Computing without Training [3.8] 本稿では,表現類似度Sで導かれる表現をエッジで共有することで,新しいモデルマージ方式を提案する。
Pearson correlation Coefficient |r| > 0.94 than other metrics。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:35:54 GMT)
Tending Towards Stability: Convergence Challenges in Small Language Models [3.7] その利点にもかかわらず、より小型のモデルはより大きなモデルに比べて性能が劣ることが多い。
これは、比例的に表現能力の低下によるものである。
階層のアクティベーションの収束とパラメータの有効ランクを結びつけることで、我々の分析は、小さなモデルの学習力学における非効率性に対処するために将来の研究を導くことができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:57:19 GMT)
De-jargonizing Science for Journalists with GPT-4: A Pilot Study [3.7] このシステムは、ジャーゴンの識別においてかなり高いリコールを達成し、読者のジャーゴンの識別における相対的な違いを保存する。
この発見は、科学記者を支援するための生成AIの可能性を強調し、密集した文書を単純化するツールの開発について将来の研究を知らせる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:10:01 GMT)
Vision transformers in domain adaptation and domain generalization: a study of robustness [3.7] ディープラーニングモデルはしばしば、トレーニングと検証フェーズで使用されるものとデータ分散が異なるシナリオで評価される。
ドメイン適応と一般化は、そのようなシフトに対処するための効果的な戦略として広く認識されている。
コンピュータビジョンタスクにビジョントランスフォーマーを適用した最近の有望な結果は、その堅牢性と一般化の有意義な可能性を証明している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:49:31 GMT)
On Representation of 3D Rotation in the Context of Deep Learning [3.7] 複数の回転表現と損失関数を用いた3次元回転推定のためのResNet18ネットワークの性能評価を行った。
従来の研究では,連続した5Dおよび6D表現を用いたネットワークは,不連続なネットワークよりも優れていた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:36:06 GMT)
On Representation of 3D Rotation in the Context of Deep Learning [3.7] 複数の回転表現と損失関数を用いた3次元回転推定のためのResNet18ネットワークの性能評価を行った。
従来の研究では,連続した5Dおよび6D表現を用いたネットワークは,不連続なネットワークよりも優れていた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:36:06 GMT)
EmotionCaps: Enhancing Audio Captioning Through Emotion-Augmented Data Generation [3.7] EmotionCapsは、約12万の音声クリップと、音声景観の感情認識情報に富んだ合成記述を組み合わせた音声キャプションデータセットである。
本研究は, キャプションモデルの開発と評価のための新しい方向の提案と, キャプティングへの現在のアプローチに挑戦するものである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:57:37 GMT)
TraM : Enhancing User Sleep Prediction with Transformer-based Multivariate Time Series Modeling and Machine Learning Ensembles [3.6] 本稿では,トランスフォーマーを用いた多変量時系列モデルと機械学習アンサンブルを用いて,人間の睡眠,感情状態,ストレスレベルを予測する手法を提案する。
時系列トランスフォーマーは時系列の特徴が重要であるラベルに使われ、マシンラーニングアンサンブルは、包括的な日々のアクティビティ統計を必要とするラベルに使用された。
提案したモデルであるTraMは、実験で10点中6.10点を獲得し、他の手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:29:55 GMT)
Improving Bias in Facial Attribute Classification: A Combined Impact of KL Divergence induced Loss Function and Dual Attention [3.6] 初期のシステムは、特に性別や人種の分類において、しばしば人口統計上の偏見を示しており、肌の色合いが暗い女性や個人の精度は低かった。
本稿では,KL分割正規化とクロスエントロピー損失関数によって強化された,事前学習型Inception-ResNet V1モデルを用いた二重注意機構を用いた手法を提案する。
実験の結果,公正度と分類精度の両面で有意な改善が見られ,偏見に対処し,顔認識システムの信頼性を高めることが期待できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:29:09 GMT)
CroCoDai: A Stablecoin for Cross-Chain Commerce [3.6] 分散金融(DeFi)は近年急速に成長している。
グローバルなDeFiエコシステムは、複数のブロックチェーンに分断され、クロスチェーンコマースの需要を加速している。
既存のクロスチェーントランザクション(例えばブリッジやクロスチェーントランザクション)のアプローチは、エスクローの資産をロックすることで原子性を達成する。
これらの課題に対処するために、CroCoDaiを紹介します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:53:43 GMT)
Conditional Density Estimation with Histogram Trees [3.5] 条件密度推定(CDE)は、完全な条件分布をモデル化することによって回帰を超える。
現在の手法ではカーネルに基づくアプローチが一般的であり、カーネル密度推定や線形モデルの基底関数としてカーネル関数を直接使用する。
本研究では,各葉がヒストグラムモデルによって形成される決定木からなる完全非パラメータモデルである条件密度木(CDTree)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:53:24 GMT)
Report on Female Participation in Informatics degrees in Europe [3.5] 本研究は,IEHE(Informatics Europe Higher Education)データポータルからのデータを豊かに活用することを目的としている。
本研究は,女子学生の割合,初入学者数,女子学生の学位数について検討した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:33:16 GMT)
Substance Beats Style: Why Beginning Students Fail to Code with LLMs [3.5] 既存の作業は、初心者がLLMにテキストからコードへのタスクの解決を促すのに苦労していることを示している。
本稿では,学生のLLM誤信の原因について,競合する2つの仮説を考察する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:36:30 GMT)
Degradation Oriented and Regularized Network for Real-World Depth Super-Resolution [3.4] 既存のRGB誘導深度超解法は、固定および既知の劣化の仮定に基づいて優れた性能を達成する。
しかし、現実のシナリオでは、キャプチャーされた深度は、センサーの制限と撮像環境の複雑さによって、通常ではない、そして不可知的な劣化に悩まされることが多い。
低解像度深度の学習劣化表現により多くの注意を払っている劣化指向正規化ネットワーク(DORNet)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:53:07 GMT)
Survey and Evaluation of Converging Architecture in LLMs based on Footsteps of Operations [3.4] 現在の最先端のLSMは非常に大きく、パラメータは約700億である。
モデルのサイズが大きくなるにつれて、かなりのストレージと計算能力の需要が増大する。
本稿では,レイヤ構成,運用機構,モデルサイズの観点から,これらの収束アーキテクチャがどのように機能するかを解析する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:19:24 GMT)
A model learning framework for inferring the dynamics of transmission rate depending on exogenous variables for epidemic forecasts [3.3] 我々は,透過率の隠れたダイナミクスを再構築するために,新しい科学機械学習フレームワークを定式化した。
本手法は,2010年から2020年までのイタリアにおける気象データ(温度・湿度)とインフルエンザデータに基づいて,合成テストケースと現実テストケースの両方を用いて検証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:24:55 GMT)
Minimum Tuning to Unlock Long Output from LLMs with High Quality Data as the Key [3.3] トレーニングデータインスタンスと計算処理の少ないチューニングモデルにおいて,顕著なパフォーマンス向上を実現することができることを示す。
本研究の結果から, 長期出力のキャパシティは, 既成モデルによって異なるが, 定性計算を用いて高品質なデータに調整するアプローチは, 実験したすべてのモデルに対して, 常に顕著な改善をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:21:19 GMT)
Minimum Tuning to Unlock Long Output from LLMs with High Quality Data as the Key [3.3] トレーニングデータインスタンスと計算処理の少ないチューニングモデルにおいて,顕著なパフォーマンス向上を実現することができることを示す。
本研究の結果から, 長期出力のキャパシティは, 既成モデルによって異なるが, 定性計算を用いて高品質なデータに調整するアプローチは, 実験したすべてのモデルに対して, 常に顕著な改善をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:21:19 GMT)
RS-MOCO: A deep learning-based topology-preserving image registration method for cardiac T1 mapping [3.3] 現在、心臓T1マッピングでは、運動補正の効果的な、堅牢で効率的な方法が欠如している。
本稿では,心的T1マッピングにおける動き補正のための深層学習に基づくトポロジ保存画像登録フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:38:35 GMT)
Lattice-Based Vulnerabilities in Lee Metric Post-Quantum Cryptosystems [3.3] 量子コンピューティングに直面したセキュアな暗号システムの必要性から、量子後暗号は注目されている。
我々は、ジェネリックリー計量に基づくMcEliece型暗号システムを検討し、格子ベースの攻撃に対するセキュリティを評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:59:58 GMT)
Grover Adaptive Search with Spin Variables [3.2] このスピンベースアルゴリズムのために設計された新しい量子辞書サブルーチンを導入する。
このアプローチの重要な利点は、量子回路を構成するのに必要なCNOTゲートの数を大幅に削減することである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:24:27 GMT)
Informativeness of Weighted Conformal Prediction [3.2] 本稿では,重み付き共形予測の有意性を高める2つの方法を提案する。
提案手法の理論的保証を確立し,シミュレーションによる有効性を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:52:25 GMT)
Learning with Importance Weighted Variational Inference: Asymptotics for Gradient Estimators of the VR-IWAE Bound [3.1] 重み付けの重要さを含むいくつかの一般的な変動境界は、エビデンス・ロウアー・バウンドの一般化と改善のために提案されている。
VR-IWAEバウンダリは、ELBO、IWAE、VRバウンダリを統一する変分バウンダリとして導入された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:09:06 GMT)
Scalable Indoor Novel-View Synthesis using Drone-Captured 360 Imagery with 3D Gaussian Splatting [3.0] 本稿では,ドローンによる360度映像からの室内ノベルビュー合成のための,効率的でスケーラブルなパイプラインを提案する。
360度カメラは幅広い視点を捉え、単純なドローン軌道下での総合的なシーンキャプチャを可能にする。
以上の結果より,PSNRとSSIMの再現性は向上し,従来のアプローチと比較して時間も改善した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:08:47 GMT)
In-Context Learning for Long-Context Sentiment Analysis on Infrastructure Project Opinions [3.0] 本研究では, GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Proの3大言語モデルの性能評価を行った。
以上の結果から,GPT-4oはより単純で短い文書のゼロショットシナリオに優れており,Claude 3.5 Sonnetはより複雑で感情変動的な意見を扱うという点でGPT-4oを上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:42:21 GMT)
Foundation Models for ECG: Leveraging Hybrid Self-Supervised Learning for Advanced Cardiac Diagnostics [2.9] 自己教師付き学習(SSL)法で強化された基礎モデルを用いることで、心電図(ECG)解析に対する革新的なアプローチが提示される。
本研究は、生成学習やコントラスト学習を含むSSL手法を利用して、ECGの基礎モデルを包括的に評価する。
心臓診断の精度と信頼性を向上させる基礎モデルのためのハイブリッドラーニング(HL)を開発した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:33:39 GMT)
Implementing Quantum Secret Sharing on Current Hardware [2.9] 量子秘密共有(Quantum Secret Share)は、量子情報の安全な保管と再構築を可能にする暗号方式である。
我々は、異なる秘密共有コードのための符号化回路と復号回路の教育学的記述を提供する。
我々は、IBMの127キュービットブリスベンシステムで性能をテストする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:30:53 GMT)
"Is Hate Lost in Translation?": Evaluation of Multilingual LGBTQIA+ Hate Speech Detection [2.9] 本稿では,複数言語にわたる大規模言語モデルのLGBTQIA+ヘイトスピーチを検出することの課題について考察する。
ゼロショットおよび微調整GPTのヘイトスピーチ検出能力について検討した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:24:03 GMT)
TopoLM: brain-like spatio-functional organization in a topographic language model [2.8] 本研究では,2次元空間モデルユニットを明示したトランスフォーマー言語モデルであるTopoLMを開発する。
TopoLMは皮質言語系の機能的構造の出現をうまく予測する。
この結果から,人間の言語システムの機能的構造は,統合された空間的目的によって駆動されていることが示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:37:21 GMT)
Improved Depth Estimation of Bayesian Neural Networks [2.6] 本稿では,ネットワーク深度を離散的に切り離した正規分布を提案し,その平均と分散を学習する。
提案手法はスパイラルデータセットの試験精度を向上し, 後方深度推定のばらつきを低減させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:01:02 GMT)
Improved Depth Estimation of Bayesian Neural Networks [2.6] 本稿では,ネットワーク深度を離散的に切り離した正規分布を提案し,その平均と分散を学習する。
提案手法は, スパイラルデータセットにおける試験精度を改善し, 後方深度推定のばらつきを低減させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:01:02 GMT)
Fast and Accurate Homomorphic Softmax Evaluation [2.6] ホモモルフィック暗号化は、マシンラーニング・アズ・ア・サービスのためのセキュアでプライバシ保護のソリューションを構築するための主要なソリューションの1つです。
我々は、$mathrmSM(mathbfx) = left(exp(x_i) / sum_j=1n exp(x_j) right)_1le ile n$で定義されるSoftmax関数に焦点を当てる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:01:36 GMT)
Multi-round jailbreak attack on large language models [2.5] 私たちは"ジェイルブレイク"攻撃をよりよく理解するために、マルチラウンドのジェイルブレイクアプローチを導入します。
この方法は危険なプロンプトを書き換え、有害でない一連のサブクエストに分解する。
実験の結果,ラマ2-7Bは94%の成功率を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:08:14 GMT)
Simultaneous Tri-Modal Medical Image Fusion and Super-Resolution using Conditional Diffusion Model [2.5] トリモーダル医療画像融合は、病気の形状、位置、生物学的活動をより包括的に見ることができる。
画像装置の限界や患者の安全への配慮により、医療画像の品質は制限されることが多い。
画像の解像度を向上し、マルチモーダル情報を統合できる技術が緊急に必要である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:14:50 GMT)
Skill-LLM: Repurposing General-Purpose LLMs for Skill Extraction [2.5] 本稿では,スキル抽出の精度と品質を向上させるために,特殊スキルLLMと軽量モデルの微調整を提案する。
提案手法は既存のSOTA技術より優れていることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:41:18 GMT)
LoSAM: Local Search in Additive Noise Models with Unmeasured Confounders, a Top-Down Global Discovery Approach [2.4] 加法雑音モデル(LoSAM)における局所探索を導入する。
LoSAMは、局所因果構造を一般的な付加雑音設定に活用する既存の非線形手法を一般化する。
我々はLoSAMがランタイムを実現し、新しいサブストラクチャを活用することでランタイムと効率を向上させることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:28:55 GMT)
How to Determine the Preferred Image Distribution of a Black-Box Vision-Language Model? [2.4] 本稿では,視覚言語モデル(VLM)に好適な画像分布を特定するための,新しい一般化可能な手法を提案する。
これを異なる3次元オブジェクトのレンダリングタイプに適用することにより、複雑な構造の正確な解釈を必要とする様々な領域で有効性を示す。
特殊なドメインにおけるベンチマークの欠如を解決するために,CAD関連視覚質問応答タスク上でVLMを評価するための新しいデータセットであるCAD-VQAを導入する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:40:09 GMT)
Deep vectorised operators for pulsatile hemodynamics estimation in coronary arteries from a steady-state prior [2.4] 本稿では,拍動血行動態を推定するために,機械学習を利用した時間効率な代理モデルを提案する。
本モデルでは, 震源領域の再サンプリングに依存せず, 脈動速度と圧力の正確な推定値が得られた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:24:50 GMT)
MMLU-Pro+: Evaluating Higher-Order Reasoning and Shortcut Learning in LLMs [2.4] 大規模言語モデル(LLM)の既存のベンチマークは、パフォーマンスの高いモデル間の差別化にますます苦労している。
本稿では,MMLU-Proをベースとした,ショートカット学習と高次推論のための拡張ベンチマークであるMMLU-Pro+を紹介する。
以上の結果から,MMLU-Pro+はMMLU-Proの難易度を維持しつつ,より厳密なモデル判別試験を行っていることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:37:03 GMT)
Permutation gates in the third level of the Clifford hierarchy [2.3] 階層構造における置換について研究する: 2n$基底状態をパーミュレートするゲート。
3階の置換ゲートは、必ずしも半クリフォードではないが、トフォリゲートの積でなければならないことを証明している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:46:49 GMT)
Generative Image Steganography Based on Point Cloud [2.3] 本稿では,点雲表現に基づく画像ステガノグラフィーを提案する。
実際のニーズに応じて任意の解像度で画像を生成することができ、画像ステガノグラフィーのための明示的なデータの必要性を省略することができる。
実験により, このスキームによって生成されたステガノグラフ画像は, 画像品質が極めて高く, メッセージ抽出精度が99%以上に達することが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:06:13 GMT)
On the potential of Optimal Transport in Geospatial Data Science [2.3] 空間的評価基準と損失関数として最適輸送(OT)を提唱した。
実データおよび合成データに関する実験では,1)予測誤差の空間分布が多くのアプリケーションに関係し,実際のコストに変換可能であることを示した。
我々は、予測の空間的正しさを改善するために、ニューラルネットワークにおける損失関数としてOTを活用することを提唱する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:46:03 GMT)
Bayesian Experimental Design via Contrastive Diffusions [2.2] 実験設計(BOED)は、一連の実験の実行コストを削減する強力なツールである。
コスト効率の良い後続分布を導入し,EIGコントラストへのトラクタアクセスを提供する。
生成モデルをBOEDフレームワークに組み込むことで、以前は非現実的であったシナリオにおいて、そのスコープと使用範囲を広げる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:53:07 GMT)
Before & After: The Effect of EU's 2022 Code of Practice on Disinformation [2.1] 広告ネットワークは、ほとんどビジターがいない不人気な偽情報サイトから撤退している。
広告ネットワークは、偽情報コンテンツの横にある正当な企業の広告を引き続き掲載していることを示す。
実際、主要な広告ネットワークは、私たちのデータセットの約400の誤報ウェブサイトに広告を配置している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:48:43 GMT)
On the generalization of learned constraints for ASP solving in temporal domains [2.1] 今日のASPソルバのパフォーマンスの重要な要因は、コンフリクト駆動の制約学習である。
学習した動的制約を一般化できる条件について検討する。
ASPソルバに一般化された制約を加えることの影響を実証的に評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:19:21 GMT)
Can Search-Based Testing with Pareto Optimization Effectively Cover Failure-Revealing Test Inputs? [2.0] 我々は,検索領域内の障害発生領域をカバーするには,検索ベースソフトウェアテスト(SBST)が不十分であると主張している。
本研究では,入力空間におけるフェールリベリングテスト入力のカバレッジを,Coverage Inverted Distance品質指標と呼ぶ指標を用いて測定する。
その結果, NSGA-IIとMOPSOは, 故障を露呈するテストインプットを包含する無作為なランダム検索ベースラインよりも有効ではないことがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:44:40 GMT)
CVCP-Fusion: On Implicit Depth Estimation for 3D Bounding Box Prediction [2.0] Cross-View Center Point-Fusionは、3Dオブジェクト検出を行う最先端モデルである。
我々のアーキテクチャは、以前に確立されたアルゴリズム、クロスビュートランスフォーマー、CenterPointのアスペクトを利用する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:55:07 GMT)
Synthesizing Proton-Density Fat Fraction and $R_2^*$ from 2-point Dixon MRI with Generative Machine Learning [2.0] 本稿では,2点のDixon MRIからPDFFと$R*$truthを学習するための機械学習手法を提案する。
提案手法を用いてPDFFと$R*$マップを合成し,地上の基準値との相関性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:02:34 GMT)
A Framework of SO(3)-equivariant Non-linear Representation Learning and its Application to Electronic-Structure Hamiltonian Prediction [1.9] 本稿では,物理システムにディープラーニングを適用する上で重要な課題に対処するための理論的および方法論的枠組みを提案する。
物理学における共変理論に着想を得て、SO(3)-不変量とSO(3)-同変量の間の数学的関係を探求する。
本手法はハミルトン予測精度を最大40%向上させ, 占有軌道エネルギーなどの下流の物理量を最大76%向上させることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:08:29 GMT)
Introducing MeMo: A Multimodal Dataset for Memory Modelling in Multiparty Conversations [1.9] 本稿では,参加者の記憶保持レポートに注釈を付けた最初のデータセットであるMeMoコーパスを紹介する。
MeMoのコーパスには、Covid-19のトピックに関する31時間の小さなグループディスカッションが含まれており、2週間にわたって繰り返されている。
検証された行動計測と知覚計測を統合し、オーディオ、ビデオ、マルチモーダルアノテーションを含む。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:29:25 GMT)
Introducing MeMo: A Multimodal Dataset for Memory Modelling in Multiparty Conversations [1.9] MeMo Corpusは参加者のメモリ保持レポートに注釈を付けた最初のデータセットである。
検証された振る舞いと知覚の計測、オーディオ、ビデオ、マルチモーダルアノテーションを統合する。
本稿では,知的システム開発のための対話型メモリモデリングにおける今後の研究の道を開くことを目的とする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:29:25 GMT)
Information propagation dynamics in Deep Graph Networks [1.8] Deep Graph Networks(DGN)は、構造化情報の処理と学習が可能なディープラーニングモデルのファミリとして登場した。
この論文は、静的グラフと動的グラフのためのDGNの内部の情報伝達のダイナミクスを考察し、動的システムとしての設計に焦点をあてる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:54:33 GMT)
Information propagation dynamics in Deep Graph Networks [1.8] Deep Graph Networks(DGN)は、構造化情報の処理と学習が可能なディープラーニングモデルのファミリとして登場した。
この論文は、静的グラフと動的グラフのためのDGNの内部の情報伝達のダイナミクスを考察し、動的システムとしての設計に焦点をあてる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:54:33 GMT)
MFC-EQ: Mean-Field Control with Envelope Q-Learning for Moving Decentralized Agents in Formation [1.8] 移動エージェント(英: moving Agents in Formation、MAiF)は、マルチエージェントパスファインディングの変種である。
MFC-EQは、この双方向マルチエージェント問題に対するスケーラブルで適応可能な学習フレームワークである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:59:47 GMT)
TADA: Temporal Adversarial Data Augmentation for Time Series Data [1.7] Adversarial Data Augmentation (ADA) はドメインの一般化において広く使われている手法である。
時間のワープは本質的に微分不可能であるが、ADAはバックプロパゲーションによるサンプルの生成に依存している。
本稿では,時系列データに対する時間逆データ拡張(TADA)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:54:22 GMT)
Self-Data Distillation for Recovering Quality in Pruned Large Language Models [1.7] 原モデルの品質を維持するために, 自己データ蒸留ファインチューニングを提案する。
本手法は,教師付き微調整による81.7%と比較して,原モデルの精度の91.2%を維持している。
我々のアプローチはデータセット全体にわたって効果的にスケールし、データセットのサイズが大きくなるにつれて品質が向上します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:57:41 GMT)
Self-Data Distillation for Recovering Quality in Pruned Large Language Models [1.7] 原モデルの品質を維持するために, 自己データ蒸留ファインチューニングを提案する。
本手法は,教師付き微調整による81.7%と比較して,原モデルの精度の91.2%を維持している。
我々のアプローチはデータセット全体にわたって効果的にスケールし、データセットのサイズが大きくなるにつれて品質が向上します。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:57:41 GMT)
Large-Scale Knowledge Integration for Enhanced Molecular Property Prediction [1.7] 本研究では,大規模なChEBI知識グラフを統合することで,狩野に進出する。
以上の結果から,ChEBIを含めると14の分子特性予測データセットのうち9つの性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:57:20 GMT)
Mamba State-Space Models Are Lyapunov-Stable Learners [1.6] Mamba State-space Model (SSM) は、最近様々なタスクでTransformer Large Language Model (LLM) より優れていることが示されている。
我々は,Mambaのリカレントダイナミクスが小さな入力変化に対して堅牢であることを示す。
また、命令チューニングにより、Mambaモデルはこのギャップを81%に、Mamba-2モデルはこのギャップを132%に制限できることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:21:58 GMT)
A Bilevel Optimization Framework for Imbalanced Data Classification [1.6] 合成データによるノイズや重なりの落とし穴を回避する新しいアンダーサンプリング手法を提案する。
多数データをランダムにアンサンプするのではなく、モデル損失を改善する能力に基づいてデータポイントをアンアンサンプする。
本手法は,モデル損失の改善を指標として,データポイントが損失に与える影響を評価し,それを改善することができない者を拒絶する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:17:23 GMT)
Deep Optimal Sensor Placement for Black Box Stochastic Simulations [1.6] 本稿では, 入力パラメータに対する結合分布と, 結合エネルギーモデルを用いた解を提案する。
提案手法は,従来の手法に比べて計算コストの低い高精度なセンサ位置を提供することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:10:25 GMT)
Towards Supporting Legal Argumentation with NLP: Is More Data Really All You Need? [1.6] 訴訟における決定を正当化する法的推論と議論は、常にAIと法の中心であった。
法律NLPの最近の発展は、テキストから法的結論を統計的に分類することに集中している。
本稿では,AIと法学における伝統的な象徴的著作と,近年の法的NLPの進歩を概観する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:59:34 GMT)
Towards Differentiable Multilevel Optimization: A Gradient-Based Approach [1.6] 本稿では,多レベル最適化のための新しい勾配に基づくアプローチを提案する。
本手法は解の精度と収束速度を両立させながら計算複雑性を著しく低減する。
私たちの知る限りでは、これは暗黙の微分の一般的なバージョンを提供する最初のアルゴリズムの1つである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:17:59 GMT)
AI, Pluralism, and (Social) Compensation [1.5] ユーザ集団における多元的価値に対応する戦略は、AIシステムをパーソナライズすることである。
もしAIが個々の個人の特定の値に適応できるなら、多元主義の課題の多くを回避できる可能性がある。
しかし、人間-AIチームにとって成功の外部尺度がある場合、適応型AIシステムは人間のチームメイトを補うための戦略を開発することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:32:47 GMT)
Mitigating and Analysis of Memory Usage Attack in IoE System [1.5] インターネット・オブ・エコノミクス(IoE)は、特に家庭における新しいトレンドである。
メモリ破損の脆弱性は、ソフトウェアのセキュリティにおける重大な脆弱性のクラスを構成する。
本稿では,資源利用攻撃を分析し,説明し,低コストなシミュレーション環境を構築することを目的とする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:48:37 GMT)
Energy Cyber Attacks to Smart Healthcare Devices: A Testbed [1.5] IoT技術の急速な拡大は、スマートヘルスケア、スマートデバイス、スマートシティ、スマートグリッドに根ざしている。
IoTデバイスのセキュリティ、特にヘルスケアは、最近の攻撃で深刻な脆弱性が明らかになったことで、大きな関心事になっている。
本稿では、WiFi対応スマートヘルスケアデバイスに対するDDoS(Distributed Denial of Service)とFake Access Points(F-AP)攻撃の影響について検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:53:56 GMT)
Detection of Energy Consumption Cyber Attacks on Smart Devices [1.5] 本稿では,受信パケットを解析することにより,スマートホームデバイスに対するエネルギー消費攻撃を検出するための軽量な手法を提案する。
リソースの制約を考慮し、攻撃を検出すると管理者に即座に警告する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:13:38 GMT)
LR-SQL: A Supervised Fine-Tuning Method for Text2SQL Tasks under Low-Resource Scenarios [1.4] 大規模言語モデルは、教師付き微調整によってText2に革命をもたらす。
しかし、データベースの複雑さがコンテキスト長の増大につながるため、重要な制限は見過ごされてしまう。
本稿では,既存の微調整法と比較して,全GPUメモリ使用量を40%削減するLR-Thoughtを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:02:55 GMT)
Nellie: Automated organelle segmentation, tracking, and hierarchical feature extraction in 2D/3D live-cell microscopy [1.4] 我々は,様々な細胞内構造のセグメンテーション,トラッキング,特徴抽出のための,自動化された,バイアスのないユーザフレンドリーなパイプラインであるNellieを紹介した。
Nellieはイメージメタデータに適応し、ユーザの入力を排除します。
Nellieは、コードを使わない操作と視覚化を可能にする、ポイントアンドクリックのNapariベースのGUIを特徴としている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:12:48 GMT)
Regional Ocean Forecasting with Hierarchical Graph Neural Networks [1.4] 我々は、高解像度の中距離海洋予測用に設計されたニューラルネットワークであるSeaCastを紹介する。
SeaCastはグラフベースのフレームワークを使用して、海洋グリッドの複雑な幾何学を処理し、地域の海洋環境に合わせて外部の強制データを統合する。
コペルニクス海洋局が提供した地中海の運用数値モデルを用いて,高空間分解能実験により本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:34:50 GMT)
The Reachability Problem for Neural-Network Control Systems [1.4] 本稿では、ReLUアクティベーションを備えたフィードフォワードニューラルネットワークによってコントローラが実装されるシステムについて考察する。
到達可能性問題は、一連の初期状態が与えられた場合、一連の目標状態に到達できるかどうかを問う。
3つの入力と出力を持つ自明な植物や固定深度ニューラルネットワークでさえ、この問題は決定不可能であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:52:17 GMT)
Auto-ABSA: Cross-Domain Aspect Detection and Sentiment Analysis Using Auxiliary Sentences [1.4] 本研究では,感情予測を支援するために,文に含まれる側面を補助文として用いた手法を提案する。
1つ目はアスペクト検出であり、文が持つすべてのアスペクトを予測するためにマルチアスペクト検出モデルを使用する。
2つ目は、ドメイン外アスペクトベースの感情分析(ABSA)、ある種類のデータセットで感情分類モデルをトレーニングし、別の種類のデータセットでそれを検証することである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:28:02 GMT)
Explaining Learned Reward Functions with Counterfactual Trajectories [1.4] 解釈可能性ツールは、学習した報酬関数の潜在的な欠陥を理解し評価することを可能にする。
本稿では,強化学習における報酬関数の解釈のためのCTE(Counterfactual Trajectory Explanations)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:19:53 GMT)
Optimizing Waste Management with Advanced Object Detection for Garbage Classification [1.3] 本稿では,オブジェクト検出によるゴミの分類のためのAIモデルの実装についてレビューする。
この研究は、YOLO V5がプラスチック、紙、ガラス、金属、段ボール、生分解性物質など、様々な種類の廃棄物を効果的に識別する方法を実証している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:13:09 GMT)
Optimizing Waste Management with Advanced Object Detection for Garbage Classification [1.3] 本稿では,オブジェクト検出によるゴミの分類のためのAIモデルの実装についてレビューする。
この研究は、YOLO V5が、テキスタイルプラスチック、テキスタイルペーパー、テキスタイルグラス、テキスタイルメタル、テキスタイルカードボード、およびテキスタイル生分解性など、様々な種類の廃棄物を効果的に識別する方法を実証している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:13:09 GMT)
V3D-SLAM: Robust RGB-D SLAM in Dynamic Environments with 3D Semantic Geometry Voting [1.3] 動体とカメラのポーズの相関関係から,高度にダイナミックな環境下での同時位置決めとマッピング(SLAM)は困難である。
2つの軽量再評価段階を経て移動物体を除去するロバストな手法 V3D-SLAM を提案する。
TUM RGB-Dベンチマーク実験により,直近のSLAM法よりも高い性能を示した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:08:08 GMT)
Classical simulation and quantum resource theory of non-Gaussian optics [1.3] 非ガウス初期状態に適用されたガウスユニタリと測定をシミュレーションするための効率的なアルゴリズムを提案する。
量子資源理論の観点から、このタイプの非ガウス性測度の性質を考察し、連続変数量子コンピューティングに関連する状態の最適分解を計算する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:31:38 GMT)
State-space models can learn in-context by gradient descent [1.3] 本研究では、状態空間モデルアーキテクチャが勾配に基づく学習を実行し、文脈内学習に使用できることを実証する。
局所自己アテンションを付加した単一構造状態空間モデル層が暗黙線形モデルの出力を再現できることを実証する。
理論的構成は、基礎モデルの典型的な表現力を実現するための鍵となる要素として、繰り返しアーキテクチャにおける局所的な自己注意と乗法的相互作用の役割を解明する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:22:38 GMT)
Human-LLM Collaborative Construction of a Cantonese Emotion Lexicon [1.3] 本研究では,低リソース言語であるCantoneseのための感情辞書を開発することを提案する。
LLM(Large Language Models)と人間のアノテータによって提供される感情ラベルを統合することで、既存の言語資源を活用している。
感情抽出における感情レキシコンの整合性は、3つの異なる感情テキストデータセットの修正と利用によって評価された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:57:34 GMT)
Wigner-Yanase skew information, quantum entanglement and spin nematic quantum phase transitions in biquadratic spin-1 and spin-2 XY chains with single-ion anisotropies [1.2] 一軸または二軸スピンネマティック(SN)相間の量子相転移(QPTs)をスピン-1およびスピン-2 XY無限鎖で研究した。
スピン-1系では、不連続QPTはz-強四極子相からx-またはy-FQPへ、一方、連続QPTはx-とy-FQPの間で起こる。
2つの二軸SN相間の遷移について、不連続遷移線は二重縮退エンタングルメントスペクトルによって特徴づけられる位相相に分類される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:45:52 GMT)
Bosonic Entanglement and Quantum Sensing from Energy Transfer in two-tone Floquet Systems [1.2] 量子強度センサは、標準的な量子限界(回路)を超え、量子力学によって規定される基本的な精度限界に近づき、幅広い科学分野の応用を見つけつつある。
センサ回路における多くの粒子間の絡み合いと量子情報の保存について述べる。
マイクロ波系における超伝導絡み合ったセンサを提案し, 高精度測定における実用化の可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:48:01 GMT)
Testing Causal Explanations: A Case Study for Understanding the Effect of Interventions on Chronic Kidney Disease [1.2] 我々は大規模な電子健康記録データセットを用いた方法論を開発した。
回帰不連続性の原理は、専門家主導の介入をテストするためにランダム化されたデータサブセットを導出するために用いられた。
この方法論は、実際のEHRデータを用いて、人口レベルの洞察を提供し、医療提供の改善を知らせる方法を示している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:34:36 GMT)
Routing and Scheduling Optimization for Urban Air Mobility Fleet Management using Quantum Annealing [1.2] 都市部における高密度航空交通の効率的な管理は、安全かつ効果的な運用を確保するために重要である。
都市部で運用されている大型UAM車両の需要に対応するためのルーティングとスケジューリングの枠組みを提案する。
本手法はシンガポールの空域に適した交通管理シミュレータを用いて検証した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:27:52 GMT)
A Phenomenological AI Foundation Model for Physical Signals [1.2] 我々は0.59億のクロスモーダルセンサ測定のモデルを開発し、訓練する。
物理法則や帰納バイアスに関する事前の知識はモデルに導入されなかった。
一つの基礎モデルが物理的挙動を効果的にエンコードし予測できることを実証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:03:53 GMT)
Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards [1.2] MARL(Multi-agent Reinforcement Learning)は、シーケンシャルな意思決定と制御タスクの鍵となるフレームワークである。
これらのシステムを現実のシナリオに展開するには、分散トレーニング、多様なエージェントセット、そして頻繁な環境報酬信号から学ぶ必要がある。
我々は,新しいグラフニューラルネットワーク(GNN)に基づく本質的なモチベーションを利用して,異種エージェントポリシーの学習を容易にするCoHetアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:18:35 GMT)
Parametric model reduction of mean-field and stochastic systems via higher-order action matching [1.2] 我々は、勾配と平均場効果を特徴とする物理系の人口動態のモデルを学ぶ。
提案手法は,幅広いパラメータの集団動態を正確に予測し,最先端拡散モデルおよびフローベースモデルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:05:28 GMT)
Implementing Derivations of Definite Logic Programs with Self-Attention Networks [1.1] 本稿では,論理推論の限定バージョンを自己注意型ネットワークで実装可能であることを示す。
フィードフォワードネットワーク(FFN)を用いた自己注意ネットワークの階層構造は,論理式のクラスに対してトップダウンの導出を実現できることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:39:28 GMT)
Constant-depth preparation of matrix product states with adaptive quantum circuits [1.1] マトリックス積状態(MPS)は多体絡み合い状態の重要なクラスを構成する。
我々は,一定深さ適応量子回路を用いて,多種多様なMPSを正確に作成可能であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:52:59 GMT)
Cotunneling assisted nonequilibrium thermodynamics of a photosynthetic junction [1.1] 非平衡量子接合としてモデル化された光系II系反応中心を理論的に検討する。
我々は、量子力学速度でコツネリング現象を捉えることができる電子-電子相互作用に焦点を当てる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:24:03 GMT)
NavTopo: Leveraging Topological Maps For Autonomous Navigation Of a Mobile Robot [1.1] トポロジマップと2段階の経路計画に基づく完全なナビゲーションパイプラインを提案する。
パイプラインは、入力ポイントクラウドのニューラルネットワーク記述子と2Dプロジェクションをマッチングすることで、グラフにローカライズする。
提案手法は,大規模な室内光相対論的シミュレーション環境でテストし,一般的な計量マッピング手法であるRTAB-MAPに基づく計量地図に基づく手法と比較する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:54:49 GMT)
Error Diffusion: Post Training Quantization with Block-Scaled Number Formats for Neural Networks [1.0] 量子化は、データ移動、ストレージ、乗算や加算のような操作など、モデルのハードウェアコストを削減します。
ブロックスケールの数値形式のようなよりエキゾチックな数値エンコーディングは、固定ビット予算を利用してモデルパラメータをエンコードする利点を示している。
本稿では,ブロックスケールデータフォーマットをサポートするポストトレーニング量子化のための誤り拡散(ED)を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:40:50 GMT)
VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models [1.0] 本稿では,VisualRWKV-HDとVisualRWKV-UHDについて述べる。
どちらのモデルも解像度を4096 x 4096ピクセルまでサポートしており、より詳細で包括的なビジュアル処理機能を提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:49:19 GMT)
Multi-objective Reinforcement Learning: A Tool for Pluralistic Alignment [1.0] ベクトル報酬を用いた多目的強化学習(MORL)が標準スカラーRLの代替として登場した。
本稿では,MORLが複数のAIを作成する上で果たす役割について概説する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:06:13 GMT)
Generalized Distribution Prediction for Asset Returns [1.0] 本稿では,Long Short-Term Memory (LSTM) ネットワークを用いたQuantile-based methodを用いて,資産返却の分布を予測する新しい手法を提案する。
第1段階は資産特化特徴を用いた正規化資産返却量の予測に焦点を合わせ,第2段階は市場データを用いてこれらの予測をより広範な経済状況に適応させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:31:44 GMT)
A Software Engineering Capstone Course Facilitated By GitHub Templates [1.0] フォルダ構造、テキストベースのテンプレートドキュメント、テンプレート問題など、チームが必要とするすべてのインフラストラクチャを含むGitHubテンプレートの使用を提案する。
2022/23年には、期限日に発生するコミットの24%を観察しました。2023/24年に、上記のアイデアを部分的に導入した後、この数値は18%向上しました。
提案手法を用いたチームと,そうでないチーム間で,コミットデータとインタビューデータを比較検討する実験を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:27:54 GMT)
A Problem-Based Learning Approach to Teaching Design in CS1 [1.0] デザインスキルは、ソフトウェアプロフェッショナルにとってコアコンピテンシーとしてますます認識されている。
新しいデザイナーは、可能性に圧倒されるのを防ぐために、構造化されたプロセスを必要とします。
初等大学200人の学生にチームデザインプロジェクトコースを指導した経験を提示する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:36:08 GMT)
Generative AI's aggregated knowledge versus web-based curated knowledge [0.9] 既存の知識パラダイムや新たな知識パラダイムが,さまざまな方法で知識探索に有効であることを示す。
実験の結果、キュレートされたウェブ検索の価値は非常に具体的で、あまり知られていない知識が得られた。
ユーザがこれらの2つのアプローチで最も適した時期を識別する分類法を開発した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:17:45 GMT)
Telco-DPR: A Hybrid Dataset for Evaluating Retrieval Models of 3GPP Technical Specifications [0.9] 本稿では,第3世代パートナーシッププロジェクト技術文書を用いた通信分野を対象としたQAシステムを提案する。
テキストとテーブルを組み合わせたハイブリッドデータセットであるTelco-DPRが提示され、一連の合成質問/回答ペアが含まれている。
トップK精度と平均相反ランク(MRR)を用いて、検索モデルの評価と比較を行う。
提案するQAシステムは,改良されたRAGモデルと生成事前学習変換器(GPT)-4を用いて,解答精度を14%向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:37:18 GMT)
Differentiable Programming for Computational Plasma Physics [0.9] この論文は、微分可能プログラミングの計算プラズマ物理学への2つの応用を探求する。
まず,スタラレータ最適化を簡略化し,改良するために,微分可能プログラミングをどのように利用できるかを検討する。
第2に、偏微分方程式を解くために使用される数値法の改善や置き換えに機械学習をどのように利用できるかを検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:56:35 GMT)
Unitary Designs from Random Symmetric Quantum Circuits [0.8] 対称反射ゲートのみを含むランダム量子回路によって生成されるユニタリの分布について検討する。
このような分布の正確な設計特性を決定する方程式を得る。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:59:16 GMT)
Isambard-AI: a leadership class supercomputer optimised specifically for Artificial Intelligence [0.8] Isambard-AIは、AI関連の研究を支援するために設計された新しいリーダーシップクラスのスーパーコンピュータである。
Cray EX4000システムに基づいており、イギリスのブリストルにある新しいエネルギー効率の良いモジュラー・データ・センターに収容されている。
Isambard-AIの第1フェーズは2024年5月と6月にオンライン化され、年内に全システムの生産が予定されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:34:26 GMT)
Scalable UTXO Smart Contracts via Fine-Grained Distributed State [0.8] UTXOベースのスマートコントラクトプラットフォームは、効率のボトルネックに直面している。
コントラクトに送信されるすべてのトランザクションは、更新されたコントラクト状態全体を指定する必要があります。
本稿では,拡張UTXOブロックチェーン上でのスマートコントラクトの効率的な実行手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:07:10 GMT)
Frequency shifts induced by light scalar fields [0.8] 我々は,プローブスカラー粒子を物質波干渉法における原子の粗い近似とみなす。
本稿では,カメレオンとシンメトロンの2つのスクリーニングされたスカラー場モデルのいずれかからなる環境との相互作用によって生じる周波数シフトについて論じる。
シンメトロンの場合、誘導周波数シフトはパラメータ空間の未到達部分を厳格に拘束する可能性がある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:57:54 GMT)
Spatial-Temporal Bearing Fault Detection Using Graph Attention Networks and LSTM [0.8] 本稿では,グラフ注意ネットワーク(GAT)とLong Short-Term Memory(LSTM)ネットワークを組み合わせた新しい手法を提案する。
このアプローチは、センサデータ内の空間的および時間的依存関係を捕捉し、軸受故障検出の精度を向上させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:55:57 GMT)
Network Representation Learning for Biophysical Neural Network Analysis [0.7] ネットワーク表現学習(NRL)に基づく新しいBNN分析フレームワークを提案する。
我々のフレームワークは、バイオインスパイアされたグラフアテンションネットワーク(BGAN)である新しい計算グラフ(CG)ベースのBNN表現を統合している。
BGANは、デンドライト、ソマ、軸索を含むニューロンの構成構造と、BNN成分間の双方向情報の流れを反映している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:16:54 GMT)
BeniFul: Backdoor Defense via Middle Feature Analysis for Deep Neural Networks [0.7] 提案手法は,グレーボックスのバックドア入力検出とホワイトボックスのバックドア除去という2つの部分から構成される。
CIFAR-10とTiny ImageNetの5つの攻撃に対する実験結果から、我々のBeniFulは、バックドア入力検出とバックドア除去において優れた防御能力を示すことが示された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:14:55 GMT)
Comparative Performance of Collaborative Bandit Algorithms: Effect of Sparsity and Exploration Intensity [0.7] 協調的盗賊は、武器(またはアイテム)間の関係を導入することにより、文脈的盗賊のパフォーマンスを向上させることを目的としている
本稿では,協調バンディットアルゴリズムの包括的解析を行い,その性能を徹底的に比較する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:09:21 GMT)
Agnostic Process Tomography [0.6] 状態トモグラフィーは、任意の量子状態を与えられたクラスのより単純なものによって近似することを目的としている。
本稿では、量子機械学習、量子力学、古典シミュレーション、エラー軽減における新しいタスクに対するいくつかの自然な応用を提案する。
我々は,パウリ弦,パウリチャネル,量子ジャンタチャネル,低次チャネル,および$mathsfQAC0$回路で生成されたチャネルのクラスを含む,多種多様な概念クラスに対して,効率的なプロセストモグラフィーアルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:00:13 GMT)
Mitigating the Influence of Distractor Tasks in LMs with Prior-Aware Decoding [0.6] 本稿では,複数のデータ生成プロセスを組み合わせた専門家の産物として言語モデル(LM)を解釈する理論的枠組みを提案する。
本稿では, 先行認識復号法(PAD)について述べる。
44のタスクモデル組み合わせのうち41の改善が見られ、タスク完了率の中央値が40%向上した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:00:05 GMT)
Contrastive learning of cell state dynamics in response to perturbations [0.6] DynaCLRは、タイムラプスデータセットの表現を対照的に学習することで、セルダイナミクスをモデル化するためのフレームワークである。
本研究では,DynaCLRを用いて細胞の形態動態を時間的に規則化された埋め込み空間にマッピングする方法を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:01:25 GMT)
Contrastive losses as generalized models of global epistasis [0.5] 適合関数は、生物列の大きな空間を興味のある性質にマッピングする。
グローバルなエピスタシスモデルは、スパース潜伏関数が単調非線形性によって変換され、測定可能な適合度が生成されると仮定する。
我々は,MSEが有効でない制度においても,限られたデータからランキング関数を正確に推定できることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:08:49 GMT)
The $μ\mathcal{G}$ Language for Programming Graph Neural Networks [0.5] $mumathcalG$は、グラフニューラルネットワーク仕様のためのドメイン固有言語である。
我々は、最も人気のあるグラフニューラルネットワークモデルを定義するために、$mumathcalG$をどのように使用できるかを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:14:05 GMT)
The $μ\mathcal{G}$ Language for Programming Graph Neural Networks [0.5] $mumathcalG$は、グラフニューラルネットワーク仕様のためのドメイン固有言語である。
我々は、最も人気のあるグラフニューラルネットワークモデルを定義するために、$mumathcalG$をどのように使用できるかを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:14:05 GMT)
Utilizing Spatiotemporal Data Analytics to Pinpoint Outage Location [0.5] イベント後分析における正確な障害位置を理解することが、障害管理の正確性を改善する鍵となる。
本稿では,障害箇所を正確に特定し,分散運用やパフォーマンスチームに新たな洞察を与える手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:51:56 GMT)
Topological Signal Processing on Quantum Computers for Higher-Order Network Analysis [0.5] トポロジカル信号処理(TSP)はこれらの接続を利用して、単純錯体のような非ユークリッド領域で定義された信号を分析し、操作する。
本稿では,フィルタ処理をTSPに実装する汎用量子アルゴリズムを提案し,そのホッジ分解に基づくネットワークデータの抽出への応用について述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:22:55 GMT)
Supersymmetry-Driven Quantum Gate Design Based on Feynman Path Integral and TPCP Map Optimization [0.5] 我々は、場の量子進化によって生成されるユニタリ進化やTPCPマップの制御方法について論じる。
非劣化雑音測定からフィールドの進化状態を推定する。
我々は、予測された発展状態にマッチする出力を時間的に進化させるTPCPマップのファミリーを設計する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:09:12 GMT)
An accelerated first-order regularized momentum descent ascent algorithm for stochastic nonconvex-concave minimax problems [0.5] 我々は、非凹小問題の解法として、正規化モーメント降下アルゴリズム(FORMDA)を高速化する。
有界アルゴリズムの最大の複雑さは、客観性関数の停止下での非可逆ミニマックス問題の解法である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:51:21 GMT)
Exploring Content Concealment in Email [0.5] 現代のメールフィルターは、悪意のあるメールに対する防御メカニズムの1つであり、しばしば高度な攻撃者によって回避される。
本研究は,攻撃者がメール中のHTMLとCSSを利用して任意のコンテンツを隠蔽する方法に焦点を当てる。
この隠されたコンテンツは、受信者によって検出されず、深刻なセキュリティリスクが生じる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:12:47 GMT)
Quantum Time and the Time-Dilation induced Interaction Transfer mechanism [0.5] 非相互作用系成分を含む効果的な相互作用として,量子時間差効果について検討する。
この機構をTiDIT(Time-Dilation induced Interaction Transfer)機構と呼び、2つの結合スピンを量子クロックモデルとして用いた例を議論する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:45:37 GMT)
Integrating Artificial Intelligence Models and Synthetic Image Data for Enhanced Asset Inspection and Defect Identification [0.4] 過去のユーティリティーは、資産欠陥を特定するためにフィールド内検査に頼っていた。
近年,フィールドインスペクション(フィールドインスペクション)のプロセスを強化するために,ドローンによる検査の導入が始まっている。
本稿では,合成資産欠陥画像と手動でラベル付けしたドローン画像を組み合わせた新しいソリューションを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:14:21 GMT)
Improve Value Estimation of Q Function and Reshape Reward with Monte Carlo Tree Search [0.4] 強化学習は、GoやAtariといった完璧な情報ゲームで大きな成功を収めた。
本稿では,不完全な情報ゲームであるUnoに着目し,Q値過大評価を減らし,報酬関数を書き換えることにより,これらの問題に対処することを目的とする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:31:54 GMT)
Machine Learning for K-adaptability in Two-stage Robust Optimization [0.4] 2段階の頑健な最適化問題は、最も難しい最適化問題の1つである。
このクラスの問題の解の1つは、K適応性である。
機械学習に基づくノード選択戦略を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:59:22 GMT)
It Takes Two to Tango: Directly Optimizing for Constrained Synthesizability in Generative Molecular Design [0.4] 制約された合成性は、生成分子設計における未適応の課題である。
TANImoto Group Overlap (TANGO) と呼ばれる新しい報酬関数を提案する。
TANGOは、スパース報酬関数を、強化学習に不可欠な、密集した学習可能な報酬関数に変換する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:59:51 GMT)
Relationship between average correlation and quantum steering for arbitrary two-qubit states [0.4] 2ビット系における3セット線形ステアリングの不等式の平均相関と違反の関係を確立する。
与えられた状態のクラスについて、非古典性-ステアリング-ベル非局所性の階層が示される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:05:43 GMT)
Measuring Agreeableness Bias in Multimodal Models [0.4] 本稿では,複数モーダル言語モデルにおける画像に対する事前マーク付きオプションがモデル応答に影響を及ぼす現象について検討する。
複数選択質問の画像付きモデルを提示し、まず最初に正解し、次に予めマークされたオプションで同じモデルをバージョンに公開する。
この結果から,中立条件下での回答に矛盾する場合でも,事前マーク付きオプションに対するモデルの反応が著しく変化していることが判明した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:42:37 GMT)
A Formal Framework for Assessing and Mitigating Emergent Security Risks in Generative AI Models: Bridging Theory and Dynamic Risk Mitigation [0.3] 大規模言語モデル(LLM)や拡散モデルを含む生成AIシステムが急速に進歩するにつれ、その採用が増加し、新たな複雑なセキュリティリスクがもたらされた。
本稿では,これらの突発的なセキュリティリスクを分類・緩和するための新しい形式的枠組みを提案する。
我々は、潜時空間利用、マルチモーダル・クロスアタック・ベクター、フィードバックループによるモデル劣化など、未探索のリスクを特定した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:51:32 GMT)
Beyond Labels: A Self-Supervised Framework with Masked Autoencoders and Random Cropping for Breast Cancer Subtype Classification [0.3] この領域でコンピュータビジョンタスクに適した自己教師型埋め込みを学習する。
私たちはWSIから自動的に大規模なデータセットを生成します。
我々は、BRACSデータセット上でのモデルの性能を評価し、既存のベンチマークと比較する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:13:05 GMT)
DiffGAN: A Test Generation Approach for Differential Testing of Deep Neural Networks [0.3] DiffGANはディープニューラルネットワーク(DNN)の差分テストのためのブラックボックステスト画像生成手法である
それは多様で有効なトリガー入力を生成し、モデル間の振る舞いの相違を明らかにする。
その結果、DiffGANはSOTAベースラインを著しく上回り、同じ予算内で4倍のインプットをトリガーし、多様性と妥当性が向上した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:49:01 GMT)
Resource-adaptive quantum flow algorithms for quantum simulations of many-body systems: sub-flow embedding procedures [0.2] 相関系の量子シミュレーションには量子フロー(QFlow)法を用いる。
本研究は,低次元サブプロブレム評価回路が親問題よりも著しく複雑であることを示す。
量子シミュレーションにより相関系を効率的に処理する上でのQFlowの可能性に光を当てた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:00:33 GMT)
Enabling Data-Driven and Empathetic Interactions: A Context-Aware 3D Virtual Agent in Mixed Reality for Enhanced Financial Customer Experience [0.2] 本稿では,3D仮想エージェントを用いて,金融・小売分野におけるカスタマーサービスを強化するための新しいシステムを提案する。
当社のアプローチは、顧客満足度を保証するために、データ駆動と共感的なインタラクションを可能にすることに焦点を当てています。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:41:10 GMT)
Large Visual-Language Models Are Also Good Classifiers: A Study of In-Context Multimodal Fake News Detection [0.2] 本稿ではまず,CLIPモデルと比較し,LVLMとGPT4VのFND特性について検討する。
次に,標準文脈学習(ICL)をLVLMと統合し,FND性能の向上に言及する。
textbfIn-context textbfMultimodal textbfFake textbfNews textbfD
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:52:09 GMT)
The optimal placement of the head in the noun phrase. The case of demonstrative, numeral, adjective and noun [0.2] 言語において好まれる順序によって、名詞は終わりの1つに置かれる傾向があることを示す。
我々はまた、アンチローカリティ効果の証拠も示している: 望ましい順序における構文依存は、偶然に予想されるよりも長い。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:21:05 GMT)
Solving rescheduling problems in heterogeneous urban railway networks using hybrid quantum-classical approach [0.2] 与えられた問題に対して整数線型モデルを構築し、それをD-Waveの量子古典ハイブリッドソルバで解く。
提案手法はポーランドにおける実生活の異種都市ネットワーク上で実証されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:56:13 GMT)
AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm [0.1] 永続的ホモロジーに基づく新しいクラスタリングアルゴリズムAuToMAToを提案する。
私たちは、そのパラメータに対してデフォルトの選択を提供し、ボード全体でうまく機能するアウト・オブ・ザ・ボックスのクラスタリングアルゴリズムにします。
我々はPythonでAuToMAToのオープンソース実装を提供し、標準のScikit-Lernアーキテクチャと完全に互換性がある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:18:33 GMT)
Are uncloneable proof and advice states strictly necessary? [0.1] 我々は、QMA、BQP/qpoly、FEQP/qpolyといった言語が、不可能な量子証明とアドバイスを必要とすることを示す。
われわれはQMAを、不可能な証明しか持たない言語と定義している。
また、Aaronson、Buhrman、Kretschmerによって使われている言語が、厳密に拘束不能なFEQP/qpolyであるようなオラクルを使わずに示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:53:08 GMT)
Ensemble of ConvNeXt V2 and MaxViT for Long-Tailed CXR Classification with View-Based Aggregation [0.1] 我々は,MICCAI 2024 CXRLTチャレンジの解決策を提示し,Subtask 2と5で4位,Subtask 1で5位を獲得した。
胸部X線データセットを用いて事前訓練したConvNeXt V2およびMaxViTモデルのアンサンブルを用いて,胸部所見の長期分布に対処した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:11:05 GMT)
Ensemble of ConvNeXt V2 and MaxViT for Long-Tailed CXR Classification with View-Based Aggregation [0.1] 我々は,MICCAI 2024 CXR-LTチャレンジのソリューションを提案し,Subtask 2と5で4位,Subtask 1では5位となった。
胸部X線データセットを用いて事前訓練したConvNeXt V2およびMaxViTモデルのアンサンブルを用いて,胸部所見の長期分布に対処した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:11:05 GMT)
Quantum Zeno Effect on Genuine Tripartite Nonlocality and Entanglement in Quantum Dissipative System [0.1] 真の三部体非局所性(GTN)は、Svetlichnyの不等式に違反することで定量化することができる。
任意の3量子ビット量子状態に対するGTNの高精度量子化を実現する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:27:49 GMT)
LLM-Mixer: Multiscale Mixing in LLMs for Time Series Forecasting [0.1] LLM-Mixerは、マルチスケールの時系列分解と事前学習したLCMを組み合わせることで予測精度を向上させるフレームワークである。
データを複数の時間分解能に分解することで、短期的変動と長期的傾向の両方をキャプチャする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:08:57 GMT)
Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision [0.1] 自然の視覚的な場面では、異なる数列の出現頻度は、電力法分布に従うことを示す。
本研究では, 連続度と数値の相関構造が, データセット, シーンタイプ間で安定であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:21:14 GMT)
Recommenadation aided Caching using Combinatorial Multi-armed Bandits [0.1] 本研究では,有限容量キャッシュを備えた基地局を介してユーザが接続する無線ネットワークにおいて,コンテントキャッシュとレコメンデーションを併用したコンテントキャッシュについて検討する。
本アルゴリズムでは,どのコンテンツをキャッシュするかを判定し,提案するUCBアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:34:07 GMT)
YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection [0.0] 無人航空機からの絶縁体欠陥検出のための既存の検出方法は、複雑な背景や小さな物体と競合する。
本稿では,この課題に対処するため,新しい注目基盤アーキテクチャであるYOLO-ELAを提案する。
高分解能UAV画像による実験結果から,本手法は96.9% mAP0.5,リアルタイム検出速度74.63フレーム/秒を実現した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:00:01 GMT)
Voting by mail: a Markov chain model for managing the security risks of election systems [0.0] 本稿では,VBMプロセスのモデル化と選挙実績とリスク評価を行うために,離散時間マルコフ連鎖(DTMC)を導入する。
DTMCは動的リスクを捉え、時間とともにパフォーマンスを評価する。
この分析は、安全で信頼性の高い操作を確保するためには、投票箱と自動投票通知システムが必要であることを示唆している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:35:11 GMT)
Unlocking Structured Thinking in Language Models with Cognitive prompting [0.0] 本研究では,大規模言語モデルにおける問題解決を導く新しい手法として認知的プロンプトを提案する。
メタのLLaMAモデルにおいて認知的プロンプトの有効性を評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:08:32 GMT)
Unlocking Structured Thinking in Language Models with Cognitive Prompting [0.0] 本研究では,大規模言語モデルにおける問題解決を導く新しい手法として認知的プロンプトを提案する。
メタのLLaMAモデルにおいて認知的プロンプトの有効性を評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:08:32 GMT)
Universal Time-Entanglement Trade-off in Open Quantum Systems [0.0] マルコフ開系のクラスにおいて、純粋な定常状態絡み合いと緩和時間スケールの間の驚くべき関係を示す。
このセットアップは、継続的な測定とフィードバックに基づいて、適応量子力学の幅広いクラスを補完する。
我々の研究は、動的および絡み合いがオープンシステムでどのように接続されているかに関する一般的な洞察を与え、量子貯水池工学に特に関係している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:17:43 GMT)
Twisting factors and fixed-time models in quantum field theory [0.0] 我々は、ダイラック場とボゾン場との可換関係が非自明なような固定時間モデルのクラスを構築する。
ねじれ係数がクーロンポテンシャルであるとき、ボゾン場は電場の発散に寄与し、ラプラシアンはディラック場の局所ゲージ変換を生成する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:27:24 GMT)
Truncation-Free Quantum Simulation of Pure-Gauge Compact QED Using Josephson Arrays [0.0] 量子シミュレーション(Quantum Simulation)は、計算問題を回避するために提案され、実際に用いられている手法の1つである。
格子QEDの局所ヒルベルト空間とジョセフソン接合の正確な類似性に基づくトラニケーションフリー手法を提案する。
提案手法は, 最大2 時間 N$ プラケットの準2次元系をシミュレートし, 完全2次元理論をシミュレートできる近似手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:00:31 GMT)
Transient concurrence for copropagating entangled bosons and fermions [0.0] シャッター量子モデルの修正版を用いて, 粒子の絡み合いが粒子の進化にどう影響するかを検討する。
運動量空間の絡み合いに対する過渡的収束を導出し、結合確率密度の干渉相関を変調することを示す。
ハンベリー・ブラウン効果とツイス効果の固有振動と絡み合いの直接関係を明らかにする解析式を導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:42:29 GMT)
Transformer Layer Injection: A Novel Approach for Efficient Upscaling of Large Language Models [0.0] Transformer Layer Injection (TLI)は、大規模言語モデル(LLM)を効率的にスケールアップする新しい手法である。
提案手法は, 各K層に新しい層を注入することにより, 従来の深層アップスケーリング(DUS)技術を改善する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:41:44 GMT)
Transfer Learning with Foundational Models for Time Series Forecasting using Low-Rank Adaptations [0.0] 本研究はLlama Lora-Integrated Autorregresive ModelであるLLIAMを提案する。
低ランク適応は、微調整フェーズとして知られる様々な時系列データセットでモデルの知識を高めるために使用される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:14:01 GMT)
Transfer Learning Adapts to Changing PSD in Gravitational Wave Data [0.0] 重力波データのノイズは、信号の識別において大きな課題となる。
従来のノイズ抑圧法は、データ中の非ガウス効果に完全に対処するのに不足することが多い。
複雑な雑音の中で重力波を正確に検出する新しい訓練手法を開発した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:27:03 GMT)
Towards a Healthy AI Tradition: Lessons from Biology and Biomedical Science [0.0] 速く動くAI文化と生物学的・生物医学的な科学を対比することは、洞察力と有用性の両方を示唆する。
AIとバイオメディカルサイエンスの共進化は、両方の分野に多くの利益をもたらす。
この視点は、バイオメディカルサイエンスの特徴を高い、主に文化的レベルに適応させることによって、AIの利点に焦点を当てている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:25:02 GMT)
Towards More Effective Table-to-Text Generation: Assessing In-Context Learning and Self-Evaluation with Open-Source Models [0.0] 本研究では,ベンチマークデータセット間の言語モデル(LM)における様々なコンテキスト内学習戦略の有効性について検討する。
我々は、チェーンオブ思考推論を用いた大規模言語モデル(LLM)の自己評価アプローチを採用し、BERTScoreのような人力対応メトリクスとの相関性を評価する。
本研究はテーブル・ツー・テキスト・ジェネレーションの改善における実例の顕著な影響を浮き彫りにし, LLM の自己評価には可能性があるが, 人間の判断と現在の整合性は向上する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:19:42 GMT)
Toward Universal and Interpretable World Models for Open-ended Learning Agents [0.0] オープンエンド学習エージェントをサポートするジェネリック,コンポジション,解釈可能な生成世界モデルについて紹介する。
これは広い範囲のプロセスを近似できるベイズネットワークのスパースクラスであり、エージェントは解釈可能かつ計算にスケーラブルな方法で世界モデルを学ぶことができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:23:51 GMT)
Threefold Way for Typical Entanglement [0.0] 対称性のない典型的な量子状態は、ランダムなユニタリを一定の状態に作用させることで実現できる。
我々の研究は、シンメトリーを持つハミルトン派に対するダイソンの3倍の方法の絡み合いを確立させる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:11:10 GMT)
The molecular nature of superfluidity: Viscosity of helium from quantum stochastic molecular dynamics simulations over real trajectories [0.0] 量子液体の粘度は古典液体の粘度よりも著しく小さく、最も低い温度でほぼ5倍小さい。
古典と量子の液体はボース=アインシュタイン凝縮を除いて同一であり、超流動性の分子機構を示唆している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:44:27 GMT)
The molecular nature of superfluidity: Viscosity of helium from quantum stochastic molecular dynamics simulations over real trajectories [0.0] 量子液体の粘度は古典液体の粘度よりも著しく小さく、最も低い温度でほぼ5倍小さい。
古典と量子の液体はボース=アインシュタイン凝縮を除いて同一であり、超流動性の分子機構を示唆している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:44:27 GMT)
The inherent goodness of well educated intelligence [0.0] 本稿では,生物と人工シリコンのどちらがコンピュータ上に存在するのか,その知性について検討する。
インテリジェンスの本質は、黄金の規則である「一つの集団的な行動」または「局所的な行動のグローバルな結果を知る」ことが分かる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:10:57 GMT)
The Persian Rug: solving toy models of superposition using large-scale symmetries [0.0] 入力次元が大きければ最小限の非線形スパースデータオートエンコーダによって学習されたアルゴリズムの完全なメカニスティック記述を示す。
我々の研究は、オートエンコーダの構造を理解する技術を導入することによって、ニューラルネットワークの解釈可能性に貢献している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 22:52:45 GMT)
The Hong-Ou-Mandel effect is really odd [0.0] ホン・ウー・マンデル干渉効果は、フォトニクスを用いた現在の量子情報処理の主要な要素である。
この研究は光の非古典性の重要性、特に光子量子の離散性に起因する干渉効果を強調している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:21:34 GMT)
The Casimir-Lifshitz formula for rectangular dielectric waveguide [0.0] この研究は、より複雑な系へのリーフシッツの公式の適用性を拡張した。
これは電磁カシミール効果に対する誘電体の影響に関する貴重な洞察を与える。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 05:54:46 GMT)
THaMES: An End-to-End Tool for Hallucination Mitigation and Evaluation in Large Language Models [0.0] 事実的に誤ったコンテンツの生成である幻覚は、大規模言語モデルにおいてますます困難になっている。
本稿では,このギャップに対処する統合フレームワークとライブラリであるTHaMESを紹介する。
THaMES は LLM における幻覚の評価と緩和のためのエンドツーエンドのソリューションを提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:05:27 GMT)
Systematic input scheme of many-boson Hamiltonians with applications to the two-dimensional $φ^4$ theory [0.0] この入力スキームの議論は、2次元の$phi 4$理論のライトフロントハミルトニアンに基づく。
入力方式では、各レジスタは異なるボソンモードの占有をバイナリとしてエンコードする量子レジスタの集合を用いる。
本稿では、ハイブリッド量子-古典対称性適応量子クリロフ部分空間対角化アルゴリズムを用いて、ハミルトニアンのスペクトル計算を行う。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:03:21 GMT)
Synthetic Interlocutors. Experiments with Generative AI to Prolong Ethnographic Encounters [0.0] 本稿では、エスノグラフィー研究のための「合成インターロケータ」を紹介する。
Retrieval Augmented Generation (RAG) を用いたエスノグラフィテキスト素材(インタービューと観察)を取り入れたチャットボット
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:39:12 GMT)
Strong-field resummed heat kernels and effective actions: inhomogeneous fields [0.0] ベクトル背景に結合した量子スカラー場を含む理論の強磁場限界について検討する。
関連した熱核に対する再仮定式を求め,それに対応する有効作用を導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:36:57 GMT)
Stochastic resetting in discrete-time quantum dynamics: steady states and correlations in few-qubit systems [0.0] 量子コンピュータにおける離散時間リセットダイナミクスの定常特性について検討する。
ポアソニアンリセットに対しては、プロセスの定常状態を計算し、量子ゲートにおける「共鳴」の存在を実証する。
リセット確率が時間とともに十分に急速に消失した場合、システムは定常状態に近づかないことを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:07:25 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の平均と偏差を持つ確率変数に置き換える。
それぞれの入力変数は、十分な統計的精度で独立に測定される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:48:14 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の分布を持つ確率変数に置き換え、結果平均と偏差を計算する。
本稿では、分散算術と呼ばれる統計テイラー展開の実装と分散算術に関する試験について述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:48:14 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の分布を持つ確率変数に置き換え、結果平均と偏差を計算する。
本稿では、分散算術と呼ばれる統計テイラー展開の実装と分散算術に関する試験について述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:48:14 GMT)
Spectral function of a bipolaron coupled to dispersive optical phonons [0.0] 量子光フォノンを用いた低ドープ系におけるフォノン分散とクーロン反発の相互作用について検討した。
スペクトル関数はフォノン分散に大きく影響され、特に強い電子-フォノン結合を持つ系では顕著である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:13:24 GMT)
Solving The Dynamic Volatility Fitting Problem: A Deep Reinforcement Learning Approach [0.0] 我々は,Deep Deterministic Policy Gradient (DDPG) とSoft Actor Critic (SAC) の変種が,少なくとも標準適合アルゴリズムと同程度の精度で実現できることを示す。
複雑な目的関数を扱うのに強化学習フレームワークが適切である理由を解説する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:10:54 GMT)
Simulation of satellite and optical link dynamics in a quantum repeater constellation [0.0] 量子リピータと衛星ベースの光リンクは、光ファイバの指数光子損失を克服するための補完的な技術手法である。
我々は、低軌道上の3つの衛星からなる力学系の運動方程式を数値的に解く。
我々はベル状態測定と量子メモリ支援通信の関連誤り率に関する解析式を導出する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:17:36 GMT)
Security of and by Generative AI platforms [0.0] このホワイトペーパーは、生成AI(genAI)プラットフォームを確保し、サイバーセキュリティにgenAIを活用することの2つの重要性を強調している。
genAI技術の普及に伴い、その誤用はデータ漏洩、モデル改ざん、悪意のあるコンテンツ生成など、重大なリスクをもたらす。
ホワイトペーパーでは、genAIシステムに関する堅牢なセキュリティフレームワークの戦略を探求するとともに、高度なサイバー脅威を予測、検出、緩和する組織にgenAIがどのように力を与えるかを説明している。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:27:05 GMT)
Search for Pauli Exclusion Principle Violations with Gator at LNGS [0.0] 我々は,ナチナリ・デル・グラン・サッソ研究所で運用されている低背景高純度ゲルマニウム検出器であるゲーターによる専用測定について報告する。
この技術は、直接電流を通して既存の電子系に電子を導入することで新しい対称性状態を形成することに依存し、メシア・グリーンバーグ超選択則の条件を満たす。
PEP違反は観測されておらず、PEP違反確率の上限は$beta2/2 4.8 cdot 10-29$ (90% CL)である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:45:23 GMT)
Saturable global quantum sensing with Gaussian probes [0.0] 我々は、頻繁な画像におけるグローバルセンシングに対する運用動機付けのアプローチを提供する。
提案手法は, 平均不確実性に基づいて飽和境界を導出し, 測定値の最適化とプローブ作成を同時に行うことができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:37:38 GMT)
SHAKTI: A 2.5 Billion Parameter Small Language Model Optimized for Edge AI and Low-Resource Environments [0.0] Shaktiは高性能NLPと最適化された効率と精度を組み合わせた。
言語やドメイン固有のタスクをサポートすることで、Shaktiは医療、金融、カスタマーサービスといった業界に長けている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:59:44 GMT)
Route to hyperchaos in quadratic optomechanics [0.0] 空洞光学の文脈でハイパーカオスを導入する。
2つの正のリアプノフ指数(ハイパーカオスの特徴)を計算し、相関次元を独立に検証する。
この結果は非線形系とカオス-ハイパーカオス遷移の理解の向上に寄与し、量子状態におけるハイパーカオスの研究を可能にする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:57:07 GMT)
Role of Delay in Brain Dynamics [0.0] 本研究では,このデメリットを,連続層間の複数遅延と1つの出力を持つネットワークを用いて,計算上の優位性に変換できることを実証する。
脳ダイナミクス(RoDiB)モデルにおける遅延の役割は、分類されたラベルの数の増加を学習することができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:22:52 GMT)
Robust microwave cavity control for NV ensemble manipulation [0.0] 窒素空孔アンサンブルはマイクロ波キャビティでコヒーレントに操作できる。
マイクロ波キャビティのためのパルス整形は、外部制御とキャビティ内磁場振幅が同一でないという追加の課題を示す。
本稿では,GRAPE(Gradient Ascent Pulse Engineering)に基づく外部制御の最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:24:30 GMT)
Rician Denoising Diffusion Probabilistic Models For Sodium Breast MRI Enhancement [0.0] ナトリウムMRIは本質的に低信号-雑音比(SNR)と空間分解能に悩まされている。
ディープラーニング手法であるDenoising Diffusion Probabilistic Models (DDPM)は、幅広いDenoisingタスクで成功を収めている。
本稿では,リシアン脱臭拡散確率モデル (RDDPM) を導入し, DDPMを推し進める。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:29:50 GMT)
Rethinking the Role of Infrastructure in Collaborative Perception [0.0] コラボレーティブ・パーセプション(Collaborative Perception、CP)とは、エゴエージェントが周囲の車両やインフラからセンサー情報を受信し、融合させ、その知覚能力を高めるプロセスである。
センサを備えたインフラの必要性を評価するため、CPにおけるインフラデータの役割を広範囲かつ定量的に分析することは重要であるが、未調査のままである。
その結果,インフラデータの導入により3次元検出精度は最大10.87%向上し,赤外線中心CPは車中心CPに比べて42.53%向上した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:30:23 GMT)
Representation of Two-Qubit Entanglement on Two Bloch Spheres Using Stabilizer Formalism [0.0] 純粋2量子状態の2つのブロッホ球表現の導出における安定化器形式の適用について検討する。
与えられた状態の密度行列と図形表現の両方にリンクを確立する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:50:12 GMT)
Reducing Labeling Costs in Sentiment Analysis via Semi-Supervised Learning [0.0] 本研究では,半教師付き学習におけるラベル伝搬について検討する。
テキスト分類のための多様体仮定に基づいて,トランスダクティブなラベル伝搬法を用いる。
ネットワーク埋め込みから隣接グラフ内のコサイン近接に基づくラベルを拡張することにより、ラベルなしデータを教師付き学習に組み合わせる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:25:33 GMT)
Random Function Descent [0.0] a'tochastic Taylor' to gradient descent is scalable in high yields。
具体的には、高収率でスケーラブルな勾配降下に'tochastic Taylor' を用いる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:32:35 GMT)
Quantum-optical sensing and target detection [0.0] 最初の研究では、光学またはマイクロ波プローブを用いた隠蔽目標検出について検討した。
第2の研究では、マルチモードプローブを用いた利得推定の精度の量子限界を決定する。
第3の研究では、コヒーレント状態、二モード圧縮真空(TMSV)、単光子絡み状態(SPES)の3つのプローブ状態を比較した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:51:27 GMT)
Quantum Linear Time-Translation-Invariant Systems: Conjugate Symplectic Structure, Uncertainty Bounds, and Tomography [0.0] 我々は,基本量子ノイズを明らかにするマルチモード古典型LTIシステムの一般化量子化手法を開発した。
本研究では,周波数依存型干渉計とシャーサを用いて,このようなシステムを合成可能であることを示す。
これらの結果は、任意の量子LTI系の解析、合成、測定のための完全かつ体系的な枠組みを確立する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:05:01 GMT)
Quantum Linear Time-Translation-Invariant Systems: Conjugate Symplectic Structure, Uncertainty Bounds, and Tomography [0.0] 我々は,基本量子ノイズを明らかにするマルチモード古典型LTIシステムの一般化量子化手法を開発した。
リー群法を用いて,周波数依存型干渉計とシャーサを用いて,このような系を合成可能であることを示す。
これらの結果は、任意の量子LTI系の解析、合成、測定のための完全かつ体系的な枠組みを確立する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:05:01 GMT)
Quadratic Formulation of Mutual Information for Sensor Placement Optimization using Ising and Quantum Annealing Machines [0.0] 我々は,センサの配置を複数の候補位置から決定する問題に対処し,最小限のセンサ数で情報取得を最大化することを目的とする。
選択したセンサ位置のデータと他データとの相互情報(MI)を目的関数として定義した。
例として,センサ配置の3つの候補に対する目的関数の最適解を,量子アニールマシンを用いて計算した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:52:42 GMT)
Preparing topological states with finite depth simultaneous commuting gates [0.0] 有限深度ユニタリ回路を用いて二次元アーベルおよび非アーベル位相秩序状態を作成するためのプロトコルを提案する。
我々の回路は、2量子ゲートとアンシラ量子ビットの数が$O(L2)$で、$L$はシステムの線形サイズであるという意味で最適であることが示されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:39:13 GMT)
Prediction of Cardiovascular Risk Factors from Retinal Fundus Images using CNNs [0.0] 本研究は、畳み込みニューラルネットワーク(CNN)を用いて、英国バイオバンクデータセットの網膜画像から、心血管疾患危険因子の年齢、BMI、喫煙状況、HbA1c、収縮期血圧、拡張期血圧、性別および総コレステロールを予測する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:10:25 GMT)
Polarization-encoded photonic quantum-to-quantum Bernoulli factory based on a quantum dot source [0.0] 最近提案された量子量子量子量子バーヌーイファクトリースキームは、量子ビット振幅における入力変数と出力変数の両方を符号化している。
このプリミティブは、ベイジアン推論とモンテカルロ法を含むより複雑な量子アルゴリズムのサブルーチンとして使用できる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:21:03 GMT)
Parameters estimation by fitting correlation functions of continuous quantum measurement [0.0] 本研究では, 連続測定量子系のパラメータを, 測定信号の相関関数に適合させることにより簡易に推定する手法を提案する。
本研究は, 玩具の例と最近の超伝導回路の例において, シミュレーションにおけるアプローチを実証する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:00:08 GMT)
Parallel two-qubit entangling gates via a quantum nondemolition interaction controlled by rotation [0.0] 本稿では、多モード光と軌道角運動量と原子アンサンブルの間の量子非破壊(QND)相互作用におけるエンタングリングおよび非局所動作の解析を行う。
プロトコルは、2つのQND演算と原子スピンコヒーレンスを回転させ、それらの間の光からなる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:28:12 GMT)
Optimizing Encoder-Only Transformers for Session-Based Recommendation Systems [0.0] シングルセッションレコメンデーションの課題に対処するために、シークエンシャル・マスクド・モデリングを導入します。
本手法は,ウィンドウスライディングによるデータ拡張と,一意なトークンマスキング戦略を組み合わせることで,シーケンシャルな依存関係をより効率的にキャプチャする。
広範に利用されている3つのデータセット、Yoochoose 1/64、Diginetica、Tmallに対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:23:18 GMT)
Optimal Discrimination of Mixed Symmetric Multi-mode Coherent States [0.0] 対称多モード位相ランダム化コヒーレント状態の識別に最適な測定値を求める。
その動機は、位相ランダム化されたコヒーレント状態が量子暗号を含む量子通信に使用できることである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:24:21 GMT)
On the power of data augmentation for head pose estimation [0.0] 本稿では,さらなる拡張と合成戦略により達成可能な性能を探求するために,データの段階的拡張と改善に焦点を当てた。
全体として、得られたモデルは小さく、効率的で、フル6DoFのポーズ推定に適しており、非常に競争力のある精度を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:11:07 GMT)
On the learning abilities of photonic continuous-variable Born machines [0.0] 本稿では,連続確率分布の資源としてフォトニック量子状態を利用するフォトニック連続可変ボルンマシン(CVBM)について検討する。
CVBMトレーニングプロセスにおける正確な勾配降下は、しばしば実現不可能であり、少数のサンプルから得られる推定器を用いて勾配を近似する必要がある。
ホモダイン測定に対応する確率分布から比較的少数のサンプルを用いて,CVBMの訓練能力をアルゴリズム勾配を用いて解析した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:04:54 GMT)
On the Power of Clifford Strategies in Interactive Protocols [0.0] プローバー間の共通絡み合いを持つクリフォード戦略は古典的手法に勝るものではないことを示す。
任意の非局所ゲームにおける量子優位性は、$textClifford-MIPast$計算モデルの外で動作する少なくとも2つの量子プロバーを必要とすることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:01:41 GMT)
O-Edit: Orthogonal Subspace Editing for Language Model Sequential Editing [0.0] 大規模言語モデル(LLM)は、事前訓練中に知識を取得するが、時間が経つにつれて、この知識は誤りまたは時代遅れになり、訓練後に更新が必要になる。
このアルゴリズムは、各知識更新の方向をアルゴリズム化し、逐次更新間の干渉を最小限にし、新しい更新が無関係な知識に与える影響を減らす。
メインストリームのLCM上で数千の編集を行うことができ、既存のメソッドの4.2倍の性能向上を実現し、下流のタスクでモデルのパフォーマンスを効果的に保ち、パラメータのオーバーヘッドを最小限に抑えることができる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:16:45 GMT)
Nonlinear Gaussian process tomography with imposed non-negativity constraints on physical quantities for plasma diagnostics [0.0] 我々は,新しいトモグラフィ法,非線形ガウス過程トモグラフィ(非線形GPT)を提案する。
プラズマ光診断の放射率などの非負の物理量を確保するために,Laplace近似を用いた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:00:23 GMT)
Non-unitarity maximizing unraveling of open quantum dynamics [0.0] 軌道状態における平均的絡み合いを適応的に最小化できる新しい解法を導入する。
ここでは, 量子回路の解法は, 完全行列積密度演算子シミュレーションよりもはるかに効率が良くないことを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:25:39 GMT)
Neuromorphic Programming: Emerging Directions for Brain-Inspired Hardware [0.0] 現在、ニューロモルフィックハードウェアはディープラーニングに適応した機械学習手法に依存していることが多い。
ニューロモルフィックコンピュータは、そのエネルギー効率と完全な計算能力しか利用できない場合、ディープラーニングをはるかに超える可能性を持っている。
本稿では,ニューロモルフィックコンピューティングの文脈におけるプログラミングの概念解析について述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:08:15 GMT)
Need of AI in Modern Education: in the Eyes of Explainable AI (xAI) [0.0] この章は、AIの操作方法、特にバイアスに関する複雑な方法を明かそうとしている。
これらは、より信頼性があり、説明責任があり、すべての関係者にとって有益な方法でAIを使用することを含む、より良い教育政策に向けた基本的なステップである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:15:31 GMT)
Molecular Quantum Control Algorithm Design by Reinforcement Learning [0.0] 分子イオンを1つの純粋な量子状態に合成する汎用的,強化学習設計の量子論理手法を提案する。
制御アルゴリズムの性能はCaH$+$イオンの場合で数値的に示され、96個の固有状態を持つ。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:59:06 GMT)
Mini-Omni2: Towards Open-source GPT-4o Model with Vision, Speech and Duplex [0.0] Mini-Omni2は、ユーザビデオと音声クエリにリアルタイム、エンドツーエンドの音声応答を提供するビジュアルオーディオアシスタントである。
限られたデータセットでトレーニングした後、言語モデルでマルチモーダル入力と出力を処理できる3段階のトレーニングプロセスを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:10:45 GMT)
Measurement-Induced Heating of Trapped Ions [0.0] 内部量子ビット状態の測定中に捕捉された原子イオンの加熱を実験的に検討した。
蛍光状態のイオンは、mbox$dotbarngtrsim 2times 104$ Quanta/sの速度で急速に散乱し、加熱される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:50:42 GMT)
Measurement of total phase fluctuation in cold-atomic quantum simulators [0.0] 1次元量子場理論をシミュレートした選択実験から得られたデータを分析し,本手法を数値的に検証し,その有効性を実証する。
本分析により, 相の総和モードの既往のセクターが明らかとなり, 系の長期熱化と外平衡ダイナミクスの研究に重要である。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:26:37 GMT)
Majorana Tensor Decomposition: A unifying framework for decompositions of fermionic Hamiltonians to Linear Combination of Unitaries [0.0] 量子コンピュータ上で演算子を符号化する主要なツールの1つとして、LCU(Linear combination of Unitary)分解が出現している。
特に、LCUアプローチは、電子構造ハミルトニアンから量子回路に情報を符号化する方法を示す。
ここでは、既存のLCUを統一し、新しい分解方法を提供するフレームワークであるMajorana Decomposition(MTD)を紹介する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:56:52 GMT)
Machine Learning via rough mereology [0.0] ラフセット(RS)は、MLとAIの多くの分野で成功を収めた領域を証明した。
本稿では, RS を RM へ拡張する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:11:32 GMT)
Machine Learning approach to reconstruct Density Matrices from Quantum Marginals [0.0] 量子境界問題の1つの側面に対処する機械学習手法を提案する。
提案手法は,畳み込み型自己エンコーダと量子境界印加法を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:00:27 GMT)
Logit Separability-Driven Samples and Multiple Class-Related Words Selection for Advancing In-Context Learning [0.0] 本稿では,ロジットレベルのサンプルとクラス関連単語の明瞭度を評価するための基準であるロジット分離性を導入する。
各サンプルに複数のクラス関連語を組み込むことで,より広い範囲のラベル情報を提供することで,性能の向上が期待できる。
サンプルを共同で整理し,複数のクラス関連単語を各サンプルラベルペアに統合する,ロジット分離性に基づくlicLを提案する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:09:01 GMT)
Leveraging Multi-Temporal Sentinel 1 and 2 Satellite Data for Leaf Area Index Estimation With Deep Learning [0.0] 葉面積指数(LAI)は生態系の健康と植生の動態を理解するための重要な指標である。
本稿では,複数のタイムスタンプにおけるSentinel 1レーダデータとSentinel 2マルチスペクトルデータからの補完情報を活用することにより,画素単位のLAI予測手法を提案する。
このアプローチでは、このタスクに特化された複数のU-netをベースとしたディープニューラルネットワークを使用する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:22:13 GMT)
Learning to rumble: Automated elephant call classification, detection and endpointing using deep architectures [0.0] 連続録音音声における象の鳴き声の検出・分離・分類の問題点を考察する。
実験では,アジアとアフリカゾウの鳴き声を含む2つの注釈付きデータセットを用いた。
従来この目的に使用されていなかったニューラルアーキテクチャであるオーディオ・スペクトログラム・トランスフォーマー(AST)を用いて,新しいシーケンス・ツー・シーケンス方式で構成した。
完全自動化されたゾウ呼検出・サブコール分類システムが到達範囲内にあると結論付けている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:56:40 GMT)
Learning Agents With Prioritization and Parameter Noise in Continuous State and Action Space [0.0] 本稿では,従来の連続状態問題と行動空間問題において,先行した結果よりも高い性能を示すために,最先端手法の組み合わせを優先的に導入する。
実験では、トレーニング中にパラメータノイズを用いることで、より堅牢なRLモデルも実現した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:12:12 GMT)
LLM-Based Robust Product Classification in Commerce and Compliance [0.0] 本研究では,産業分類の現実的な課題を探求し,現実的なデータシミュレーションを可能にするデータ摂動を提案する。
本研究は、文脈内学習を用いたLLMが、クリーンデータシナリオにおける教師ありアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:18:10 GMT)
Khovanov homology and quantum error-correcting codes [0.0] オードゥーはホバノフホモロジーを用いて、望ましい性質を持つ量子誤り訂正符号の族を定義する。
我々は、ホバノフホモロジーと、その多くの拡張のいくつか、すなわち、還元された、環状、および$mathfraksl3$ホモロジーを探索し、新しい量子符号の族を生成する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 04:18:53 GMT)
Investigating Data Hierarchies in Multifidelity Machine Learning for Excitation Energies [0.0] 本研究では,QeMFiベンチマークを用いた鉛直励起エネルギー予測におけるモデル効率と精度に対する$gamma$の修正の影響について検討した。
MFMLの新たな誤差距離、誤差輪郭は、各忠実度からのモデル誤差寄与の包括的ビューを提供するために提案される。
実験結果から, 対象忠実度が低い場合, 目標忠実度において2つのトレーニングサンプルのみを用いて, モデル精度を向上できることが示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:35:00 GMT)
Interpretability as Compression: Reconsidering SAE Explanations of Neural Activations with MDL-SAEs [0.0] 本稿では,SAEを損失圧縮アルゴリズムとして解釈するための情報理論フレームワークを提案する。
スパーシリティではなくMDLを使用することは、ポーシリティを過度に最大化する潜在的な落とし穴を避けることができると我々は主張する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 01:38:03 GMT)
Improving Siamese Based Trackers with Light or No Training through Multiple Templates and Temporal Network [0.0] 我々は,シームズをベースとしたトラッカーに2つのアイデアを持つフレームワークを提案する。
i) ネットワークの再トレーニングの必要性を取り除く方法で、テンプレートの数を拡張すること。
(II) 地域情報とグローバル情報の両方に焦点をあてた新しいアーキテクチャを持つ軽量時間ネットワーク。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:42:07 GMT)
Improvement of Speed Limits: Quantum Effect on the Speed in Open Quantum Systems [0.0] エントロピーに基づく速度制限は、進化の最小時間を推定するために用いられる。
エントロピーに基づく速度制限の知識を非対称性の資源理論の知識と組み合わせた。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:40:24 GMT)
Impacts of Continued Legal Pre-Training and IFT on LLMs' Latent Representations of Human-Defined Legal Concepts [0.0] 我々は、人間定義の法的概念を含む、最近のAI & Lawから7つの異なるテキストシーケンスを調査した。
そこで,本研究では,人間の法的知識の構造に対応する新たな注意パターンを導入したかどうかを検証し,生の注意点変化パターンを可視化した。
本調査により,(1) 法的訓練の効果は, 法的概念に不均一に分散し, (2) 法的訓練で学んだ法的知識の文脈表現は, 法的概念の構造と一致しないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 19:06:14 GMT)
How social reinforcement learning can lead to metastable polarisation and the voter model [0.0] 最近のシミュレーション研究は、エージェントが社会的強化学習を用いて意見を形成するとき、偏極は持続的であることを示している。
シミュレーション研究のモデルで観測された偏光は無限に持続できず、確率1と一致していることを示す。
強化学習モデルと有権者モデルとのリンクを構築することにより、観測された分極は準安定であると主張する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:02:38 GMT)
Guideline for Manual Process Discovery in Industrial IoT [0.0] 本研究の目的は,プロセス発見手法を開発し,既存のプロセス発見手法を産業プロセスに適用することである。
古典的発見手法の適応は、産業用モノインターネット(IIoT)に特化して、普遍的に適用可能なガイドラインとして提示される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:15:28 GMT)
Grassmann time-evolving matrix product operators: An efficient numerical approach for fermionic path integral simulations [0.0] 我々は、グラスマンテンソル、符号付き行列積作用素、およびグラスマン行列積状態の概念を導入し、グラスマン経路積分を扱う。
我々の手法は強結合物理学と非マルコフ力学を研究するための頑健で有望な数値的アプローチである。
また、動的平均場理論と強く相関する量子物質を研究するための代替不純物解法としても機能する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:17:29 GMT)
Gibbs Sampling gives Quantum Advantage at Constant Temperatures with O(1)-Local Hamiltonians [0.0] 3次元格子上では、5-局所ハミルトニアンに対しても古典的硬さが維持されることを示す。
さらに,不完全な測定しかできない場合,サンプリングの硬さは堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 00:37:25 GMT)
Genuine multipartite entanglement from many-electron systems [0.0] 閉殻分子状態から高濃度のGMEを抽出できることを示す。
関連する状態は超選択規則を満たすため、生成された絡み合いは原則として物理資源でもある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 06:20:54 GMT)
Generation of polarization-entangled counter-propagating photons with high orbital angular momentum [0.0] 本研究では,高次角運動量モードにおける偏光共役光子のファイバー源を提案する。
光子は、繊維の芯に刻まれた2つのヘリカル格子により、大きなOAMを示すモードに変換される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:23:20 GMT)
Generalized Uncertainty Principle and the Zeeman Effect: Relativistic Corrections Unveiled [0.0] 一般化不確実性原理(GUP)に基づく水素様原子に対するゼーマン効果の相対論的補正を計算する。
相対論的限界では, GUP 効果が存在しない場合, 従来の GUP 補正と標準 Lande エネルギーシフト式を復元する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:11:03 GMT)
Generalised Kochen-Specker Theorem for Finite Non-Deterministic Outcome Assignments [0.0] Kochen-Specker (KS) の定理は、集合 $0, p, 1-p, 1$ for $p in [0,1/d) cup (1/d, 1/2]$ で結果を与えるような隠れ変数理論を規定する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:05:09 GMT)
General theory of constructing potential with bound states in the continuum [0.0] 我々は、$V(r)$ という形の非局所ポテンシャルによって記述される系に対して、正のエネルギーにおける有界状態は負のエネルギーにおけるものと同じくらい一般的であることを示す。
任意の正のエネルギーで任意の正規化可能な状態をサポートする(自然に非局所的な)ポテンシャルを構築する方法を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:35:51 GMT)
General theory of constructing potential with bound states in the continuum [0.0] 我々は、$V(r)$ という形の非局所ポテンシャルによって記述される系に対して、正のエネルギーにおける有界状態は負のエネルギーにおけるものと同じくらい一般的であることを示す。
任意の正のエネルギーで任意の正規化可能な状態をサポートする(自然に非局所的な)ポテンシャルを構築する方法を示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:35:51 GMT)
Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation [0.0] 筆者らは4,512枚の画像から200万点以上のアノテーションを収集し,スタイル選好,コヒーレンス,テキスト・ツー・イメージアライメントの4つの顕著なモデルを評価した。
提案手法は,膨大なアノテータのプールに基づいて画像生成モデルを包括的にランク付けすることを可能にする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:23:46 GMT)
Fast Local Neural Regression for Low-Cost, Path Traced Lambertian Global Illumination [0.0] リアルタイム光の予算は、コモディティハードウェア上で1ピクセルあたりのサンプル数個に制限されている。
ニューラルネットワークを計算効率のよい局所線形モデルベースデノイザに組み込むことを提案する。
非常に低いサンプル数でランベルティアンシーンのグローバル照明の忠実な単一フレーム再構成を実演する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 14:14:06 GMT)
Exponentially-enhanced quantum sensing with many-body phase transitions [0.0] 1次量子相転移を持つ系は、指数エネルギーギャップの閉包により、感度の指数的スケーリングを実際に達成できることを示す。
このスケーリングは, 状態調整中に適度なデコヒーレンスを持続し, 実験により最適に測定できることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:24:45 GMT)
Exploring transfer learning for Deep NLP systems on rarely annotated languages [0.0] 本論文はヒンディー語とネパール語間のPOSタグ付けにおける移動学習の適用について考察する。
ヒンディー語におけるマルチタスク学習において,ジェンダーや単数/複数タグ付けなどの補助的なタスクがPOSタグ付け精度の向上に寄与するかどうかを評価する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:33:54 GMT)
Exploring lattice supersymmetry with variational quantum deflation [0.0] 我々は自然界の超対称性の破れを研究するために量子コンピューティングを利用する方法を模索している。
特に有望な展開は変分量子デフレレーションアルゴリズムを適用し、変分量子固有解法を一般化して複数の低エネルギー状態を解決することである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:37:00 GMT)
Evaluating Software Contribution Quality: Time-to-Modification Theory [0.0] 本稿では,コード品質を定量化する新しい手法であるTime to Modification(TTM)理論を紹介する。
コードセグメントの導入から最初の修正までの時間間隔を測定することで、TTMはコード耐久性のプロキシとして機能する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:44:16 GMT)
Entanglement Oscillations from Many-Body Quantum Scars [0.0] 量子スカー(quantum scars)は、傷痕に重みを付けた初期状態の熱化を防ぐ非熱的固有状態である。
傷跡の重ね合わせは、実験で検出できる振動する局所観測物を示している。
一部のモデルは絡み合いの振動を示し、他のモデルは完全に凍っている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:49:49 GMT)
Engineering impurity Bell states through coupling with a quantum bath [0.0] 我々は、ボソンの原子背景雲に浸漬された2つの区別可能な不純物を考え、システム全体がハーモニックトラップに閉じ込められている。
この2つの不純物は, ボゾン浴からの相互作用により空間的に絡み合ったバイポーラロン状態を形成することができることを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:58:14 GMT)
Efficiera Residual Networks: Hardware-Friendly Fully Binary Weight with 2-bit Activation Model Achieves Practical ImageNet Accuracy [0.0] 低リソースエッジデバイス向けに最適化されたモデルであるEfficiera Residual Networks (ERNs)を紹介する。
ERNは、初期層と出力層を含む全ての重みと2ビットのアクティベーションを含む完全な超低ビット量子化を実現する。
ERNは印象的な推論時間を示し、最小のモデルで300FPS、コスト効率のFPGAデバイスで最大のモデルで60FPSに達する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:43:28 GMT)
Effect of noise on quantum circuit realization of non-Hermitian time crystals [0.0] 雑音量子コンピュータ上での非エルミート力学を考察する。
一般雑音の任意の弱値に対して、無限長の発振が総じて失われることを示す。
実装置(ibmq-lima)の実験では、これらの振動の残余は示されていない。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:45:03 GMT)
Divide And Conquer: Learning Chaotic Dynamical Systems With Multistep Penalty Neural Ordinary Differential Equations [0.0] 多段階ペナルティ・ヌードは, 倉本・シヴァシュ・コリンスキー方程式, 2次元コルモゴロフ流, ERA5再解析データなどのカオスシステムに適用される。
計算コストを著しく低減したカオスシステムに対してMPODEが実行可能な性能を提供することが観察された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:07:25 GMT)
Disentangling Representations through Multi-task Learning [0.0] 分類タスクを最適に解決するエージェントにおいて,不整合表現の出現を保証する実験および理論的結果を提供する。
マルチタスク分類を訓練したRNNにおいて,これらの予測を実験的に検証した。
私たちは、トランスフォーマーが特に、そのユニークな世界理解能力を説明するような、無関係な表現に向いていることに気付きました。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 07:03:07 GMT)
Digital Accessibility Literacy: A Conceptual Framework for Training on Digital Accessibility [0.0] 本稿では,デジタルアクセシビリティ・リテラシーの概念を開発するために,リテラシーの記述に関する現在の談話について取り上げる。
デジタルアクセシビリティ・リテラシーは、アクセス可能なデジタルコンテンツや技術の作成(符号化)と解釈(復号)の両方を含む。
この包括的アプローチは技術的スキルを改善し、倫理的および社会的責任を課す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 16:10:39 GMT)
Depth Estimation From Monocular Images With Enhanced Encoder-Decoder Architecture [0.0] 本稿では,エンコーダデコーダアーキテクチャを用いた新しい深層学習手法を提案する。
Inception-ResNet-v2モデルはエンコーダとして利用される。
NYU Depth V2データセットの実験結果は、我々のモデルが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 13:46:19 GMT)
Deep Learning and genetic algorithms for cosmological Bayesian inference speed-up [0.0] 本稿では,ネストサンプリングアルゴリズムに特化してベイズ推論を高速化する新しい手法を提案する。
提案手法は,ベイズ推論過程における確率関数を動的に近似するために,フィードフォワードニューラルネットワークを用いてディープラーニングのパワーを利用する。
この実装はネストサンプリングアルゴリズムと統合され、単純な宇宙学のダークエネルギーモデルと多様な観測データセットの両方を用いて徹底的に評価されている。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 18:58:38 GMT)
Convergence to the Truth [0.0] この論文は、収束主義と呼ばれる科学哲学の伝統をレビューし、発展させ、推論手法は真理に収束する能力の観点から評価されるべきであるとする。
この伝統は、(1)理論の選択は、単純さやデータに合うような説明的美徳の全体的なバランスによって導かれるべきであるとする説明主義、(2)科学的推論は、真の理論ではなく、有用なモデルを得るという目標によって駆動されるべきである、という3つの競合する理論と比較される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:44:14 GMT)
Conditional atomic cat state generation via superradiance [0.0] 超放射能崩壊を経験する原子の集合において、極端に絡み合った猫の状態を含む高い絡み合った状態を生成する確率を最大化する方法を示す。
猫状態の発生確率を最大化するためには、初期状態は古典的でない必要がある。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 12:20:06 GMT)
ComplexityNet: Increasing LLM Inference Efficiency by Learning Task Complexity [0.0] 本稿では,タスクの複雑さを評価するために設計された言語モデルであるComplexityNetを紹介する。
私たちは、タスクの複雑さを定義するために、最初のラベルセットを作成しました。
ComplexityNetは、最も高い複雑性モデルを使用する場合と比較して、計算リソースの使用量を90%削減する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 02:09:04 GMT)
Comparison of Image Preprocessing Techniques for Vehicle License Plate Recognition Using OCR: Performance and Accuracy Evaluation [0.0] この研究は、OCRアプリケーションで広く使われているブラジルの車両ナンバープレートのデータセットを使用している。
この研究は、ベストプラクティスを詳細に分析し、現実世界のシナリオでOCRのパフォーマンスを最適化するための洞察を提供する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 21:00:27 GMT)
Clustering Digital Assets Using Path Signatures: Application to Portfolio Construction [0.0] 我々は、投資家に優れた多様化特性を提供する暗号通貨ポートフォリオを構築する新しい方法を提案する。
まず、これらのデジタル資産を、パスシグネチャに基づいていくつかのクラスタを作成することでフィルタリングする。
目標は、これらの非常に揮発性の高い資産の振舞いにおける同様のパターンを特定することである。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 17:17:02 GMT)
Can sparse autoencoders make sense of latent representations? [0.0] スパースオートエンコーダ(SAE)は、近年、大きな言語モデルで解釈可能な潜在機能を明らかにするために使われている。
我々は、SAEが生物学的および他の科学領域における解釈可能性を高めるためにどのように使用できるかを示す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:16:01 GMT)
Biologically Inspired Swarm Dynamic Target Tracking and Obstacle Avoidance [0.0] 本研究では、軍用分散ドローン群を用いた動的目標追跡のためのAI駆動飛行コンピュータを提案する。
コントローラはファジィインタフェース、素早い適応、予測能力、マルチエージェント問題解決を可能にするニューラルネットワークを統合する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 03:47:09 GMT)
Benchmarking Data Efficiency in $Δ$-ML and Multifidelity Models for Quantum Chemistry [0.0] この研究は、$Delta$-ML、MFML、最適化されたMFML(o-MFML)に関連するデータコストを比較する。
以上の結果から,マルチ忠実度法は,多くの予測を行う場合の標準$Delta$-ML手法を超えることが示唆された。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:34:32 GMT)
Balanced Neural ODEs: nonlinear model order reduction and Koopman operator approxmations [0.0] 変分オートエンコーダ(VAE)はコンパクトな潜在表現を学習するための強力なフレームワークである。
ニューラルネットワークは過渡系力学の学習において優れている。
この研究は両者の強みを組み合わせることで、高速な代理モデルと調整可能な複雑さを生み出す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:15:12 GMT)
Balanced Neural ODEs: nonlinear model order reduction and Koopman operator approximations [0.0] 変分オートエンコーダ(VAE)はコンパクトな潜在表現を学習するための強力なフレームワークである。
ニューラルネットワークは過渡系力学の学習において優れている。
この研究は両者の強みを組み合わせることで、高速な代理モデルと調整可能な複雑さを生み出す。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:15:12 GMT)
Are UFOs Driving Innovation? The Illusion of Causality in Large Language Models [0.0] 本研究では,大規模言語モデルが実世界の環境において因果関係の錯覚を生じさせるかどうかを考察する。
GPT-4o-Mini, Claude-3.5-Sonnet, Gemini-1.5-Pro によるニュース見出しの評価と比較を行った。
その結果,Claude-3.5-Sonnetは相関因果錯覚の最小度を示すモデルであることがわかった。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:20:49 GMT)
An Experimental Design for Anytime-Valid Causal Inference on Multi-Armed Bandits [0.0] 本稿では,Mixture Adaptive Design (MAD)を提案する。
MADは、万能MABアルゴリズムの平均処理効果(ATE)について、任意の時間価推論を可能にする。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 15:25:03 GMT)
Advanced Persistent Threats (APT) Attribution Using Deep Reinforcement Learning [0.0] 本稿では,特定のAPT(Advanced Persistent Threat)グループにマルウェアを帰属させるために,DRL(Deep Reinforcement Learning)の適用について検討する。
12の異なるAPTグループから3500以上のマルウェアサンプルを分析することで、この研究はCuckooのような高度なツールを使ってデータを抽出する。
DRLモデルが従来の機械学習のアプローチを著しく上回り、89.27 %という驚くべきテスト精度を達成した。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 10:10:33 GMT)
Addressing Unboundedness in Quadratically-Constrained Mixed-Integer Problems [0.0] 混合整数(MI)2次モデル(All-Quadratic MI Programs)はNP完全最適化問題の挑戦的なクラスを構成する。
非有界決定変数を持つMI凸2次目的関数と制約関数の最小化について検討する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:44:45 GMT)
AIC CTU system at AVeriTeC: Re-framing automated fact-checking as a simple RAG task [0.0] 本稿では、簡易な検索・拡張生成法(RAG)を用いて、野生で回収された証拠を用いた事実確認の課題に対する解決法について述べる。
我々は、その2つのモジュール、Retriever と Evidence & Label ジェネレータを詳細に説明し、MMR-re rank や Likert-scale confidence estimation などの特徴を正当化します。
我々は、予測の欠陥がデータ内のノイズや曖昧な事実チェックとよく一致し、さらなる研究とデータの増大を引き起こすことを実証的エラー解析により確認する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 09:50:19 GMT)
A general statistical approach to quantum algorithms in a circuit model based on the expectation and standard deviation of each gate separately [0.0] 量子アルゴリズムを,各量子ゲートの期待値と標準偏差,あるいはアルゴリズム内のゲートのサブシーケンスから構築された振幅を持つ量子状態として記述する。
我々は、以前のものとは異なり、状態の基底を望ましい形に変えることができる、より基本的なアイデンティティを提示する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 11:48:44 GMT)
A Web App for Teaching Finite State Automata [0.0] finsm.ioは決定論的および非決定論的有限状態オートマトン(DFA/NFA)の作成、シミュレーション、輸出のためのツールである
本稿では,ツールの基盤となる概念的背景について述べるとともに,複数年,数百人の学生を対象にしたツールの特徴と事前評価について述べる。
予備的な評価では、インストラクターや学生は圧倒的にツールを他人に推奨し、学習と教育を改善したことに同意する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 23:28:26 GMT)
A Survey on Deep Tabular Learning [0.0] タブラルデータは、その不均一な性質と空間構造が欠如していることから、深層学習の独特な課題を提示する。
本調査では,早期完全接続ネットワーク(FCN)から,TabNet,SAINT,TabTranSELU,MambaNetといった先進アーキテクチャに至るまで,タブラルデータのディープラーニングモデルの進化を概観する。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:08:08 GMT)
A State-of-the-Art Morphosyntactic Parser and Lemmatizer for Ancient Greek [0.0] 本稿では,古代ギリシアのテクストのテクスチャーとタイザーを同定するための6つのモデルの比較実験について述べる。
注釈付きテキストの主要なコレクションの正規化バージョンは、ランダムに文字を埋め込んだベースラインモデルのDithraxをトレーニングするために使用された。
ベイズ解析によれば、ディトラクスとトニケートの形態は実質的に等価であり、構文はグレタによるトニケートとレマタによって最もよく注釈される。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 20:49:48 GMT)
A Case for AI Consciousness: Language Agents and Global Workspace Theory [0.0] 広く実装されている1つのAIアーキテクチャ、すなわち人工言語エージェントの例は、もしまだそうでなければ、驚くほど意識的にできるかもしれない、と我々は主張する。
その過程で、意識の科学的理論を人工システムに適用する方法を考えるための明確な方法論を述べる。
論文参考訳(メタデータ) (Tue, 15 Oct 2024 08:50:45 GMT)