Fugu-MT: arxivの論文翻訳(概要)

Do Generalised Classifiers really work on Human Drawn Sketches? [122.1]
本稿では,人間のスケッチ理解を伴う大規模基礎モデルについて述べる。一般的なスケッチ表現学習という観点からのパラダイムシフトです。我々のフレームワークは、ゼロショットと少数ショットの両方で一般的なスケッチ表現学習アルゴリズムを超越している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:37:08 GMT)
Hadamard Adapter: An Extreme Parameter-Efficient Adapter Tuning Method for Pre-trained Language Models [108.1]
事前訓練された言語モデル(PLM)は大量のパラメータを持ち、微調整は高価で時間を要することが多い。ダウンストリームタスクにおける性能を損なうことなく、微調整時にPLMのパラメータを減らすためのパラメータ効率のアプローチを採用する必要がある。本稿では, PLMにおける自己注意出力のみに作用する新しいアダプタを設計する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:21:28 GMT)
RoScenes: A Large-scale Multi-view 3D Dataset for Roadside Perception [98.8]
RoScenesは、最大規模のマルチビューロードサイド認識データセットである。私たちのデータセットは、驚くべき21.13Mの3Dアノテーションを64,000$m2$で達成しています。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:14:18 GMT)
MS2SL: Multimodal Spoken Data-Driven Continuous Sign Language Production [93.3]
我々は,手話と非手話のユーザ間のコミュニケーションを緩和する,連続手話生成のための統一フレームワークを提案する。テキストや音声から抽出した埋め込みを利用したシーケンス拡散モデルを作成し、段階的にサイン予測を生成する。 How2SignとPHOENIX14Tデータセットの実験により、手話生成において、我々のモデルが競合性能を達成することを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:53:50 GMT)
LLM-jp: A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs [90.3]
本稿では,LLM-jpについて紹介する。LLM-jpは,日本語大言語モデル(LLM)の研究・開発のためのクロスオーガナイゼーションプロジェクトである。この執筆時点で、学界や産業界から1,500人以上の参加者がこの目的のために協力している。最新のアクティビティについては、https://llm-jp.nii.ac.jp/en/.com/を参照してください。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:33:03 GMT)
Measuring Orthogonality in Representations of Generative Models [81.1]
教師なしの表現学習において、モデルは高次元データから低次元の学習表現に不可欠な特徴を蒸留することを目的としている。独立した生成過程の切り離しは、長い間、高品質な表現を生み出してきた。我々は、IWO(Importance-Weighted Orthogonality)とIWR(Importance-Weighted Rank)の2つの新しい指標を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:21:54 GMT)
PECTP: Parameter-Efficient Cross-Task Prompts for Incremental Vision Transformer [76.4]
インクリメンタルラーニング(IL)は、シーケンシャルタスクの深いモデルを継続的に学習することを目的としている。近年の大規模事前訓練モデル (PTM) は, 従来の試料を含まない実用ILにおいて, 即時的手法により優れた性能を発揮している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:37:58 GMT)
Can Pre-trained Language Models Understand Chinese Humor? [75.0]
本論文は,事前学習言語モデル(PLM)のユーモア理解能力を体系的に研究する最初の論文である。提案した評価フレームワークのすべてのデータ要件を完全に満たす中国の総合的ユーモアデータセットを構築した。中国のユーモアデータセットに関する実証的研究は、ユーモア理解と生成におけるPLMの将来の最適化に非常に役立つ貴重な観察結果をもたらす。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:13:38 GMT)
Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset [74.7]
Emotion and Intent Joint Understanding in Multimodal Conversation (MC-EIU)は、マルチモーダルな会話履歴に現れる意味情報をデコードすることを目的としている。 MC-EIUは多くのヒューマン・コンピュータ・インタフェースのテクノロジーを実現している。 MC-EIUデータセットは,7つの感情カテゴリー,9つの意図カテゴリ,3つのモダリティ,すなわちテキスト,音響,視覚的内容,および英語とマンダリンの2つの言語を特徴とする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:13:24 GMT)
MAPO: Boosting Large Language Model Performance with Model-Adaptive Prompt Optimization [73.8]
異なるプロンプトを異なるLarge Language Models (LLM) に適応させることで,NLP の様々な下流タスクにまたがる機能の向上が期待できる。次に、下流タスクにおける各LLMに対して、元のプロンプトを最適化するモデル適応プロンプト(MAPO)手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:39:59 GMT)
Benchmarking Complex Instruction-Following with Multiple Constraints Composition [72.8]
大規模言語モデル(LLM)の複雑な命令追従能力の評価方法が重要な研究課題となっている。既存のベンチマークは主に、異なる制約の構成を無視しながら、人間の指示で異なるタイプの制約をモデル化することに焦点を当てている。複数の制約からなる複雑な命令に従うLLMの能力を総合的に評価するためのベンチマークである ComplexBench を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:50:45 GMT)
Query-oriented Data Augmentation for Session Search [71.8]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:08:33 GMT)
MultiIoT: Benchmarking Machine Learning for the Internet of Things [70.7]
次世代の機械学習システムは、物理的世界に対する知覚と相互作用に長けなければならない。運動、熱、位置情報、深度、無線信号、ビデオ、オーディオからの知覚データは、物理環境の状態をモデル化するためにますます使われています。既存の取り組みは、しばしば単一の感覚的モダリティまたは予測タスクに特化している。本稿は、12のモダリティと8つの現実世界タスクから115万以上のサンプルを含む、これまでで最も拡張的で統一されたIoTベンチマークであるMultiIoTを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:16:47 GMT)
Hallucination Detection: Robustly Discerning Reliable Answers in Large Language Models [70.2]
大規模言語モデル(LLM)は様々な自然言語処理タスクで広く採用されている。それらは、入力源から逸脱する不信または矛盾したコンテンツを生成し、深刻な結果をもたらす。本稿では,LLMの生成した回答の幻覚を効果的に検出するために,RelDという頑健な識別器を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:47:42 GMT)
Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization [70.1]
テキストプロンプトから音声を生成することは、音楽や映画産業におけるそのようなプロセスの重要な側面である。我々の仮説は、これらのオーディオ生成の側面が、限られたデータの存在下でのオーディオ生成性能をどのように改善するかに焦点を当てている。我々は、各プロンプトが勝者の音声出力と、拡散モデルが学習するための敗者音声出力を持つ選好データセットを合成的に作成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:37:35 GMT)
Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions [70.0]
Vision-and-Language Navigation (VLN)は、人間の指示に基づいてナビゲートするエンボディエージェントを開発することを目的としている。本稿では,人間の動的活動を取り入れ,従来のVLNを拡張したHuman-Aware Vision-and-Language Navigation (HA-VLN)を紹介する。本稿では, クロスモーダル融合と多種多様なトレーニング戦略を利用して, エキスパート・スーパーモーダル・クロスモーダル (VLN-CM) と非エキスパート・スーパーモーダル・ディシジョン・トランスフォーマー (VLN-DT) のエージェントを提示する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:25:21 GMT)
Mixture of Cluster-conditional LoRA Experts for Vision-language Instruction Tuning [68.9]
クラスター条件のLoRAエキスパート(MoCLE)の混合 MoCLEは、命令クラスタに基づいてタスクカスタマイズされたモデルパラメータを活性化するために設計された、新しいMixture of Expertsアーキテクチャである。 InstructBLIPとLLaVAの実験はMoCLEの有効性を示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:55:57 GMT)
Cross-Dimensional Medical Self-Supervised Representation Learning Based on a Pseudo-3D Transformation [68.6]
擬似3D変換(CDSSL-P3D)に基づく新しい三次元SSLフレームワークを提案する。具体的には、2D画像を3Dデータに整合したフォーマットに変換するim2colアルゴリズムに基づく画像変換を提案する。この変換は2次元および3次元データのシームレスな統合を可能にし、3次元医用画像解析のための相互教師あり学習を容易にする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:05:36 GMT)
KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization [67.7]
LLMは、大きなコンテキストウィンドウを必要とするドキュメント分析や要約のようなアプリケーションでの利用が増えている。 KVキャッシュアクティベーションは、推論中のメモリ消費の主要な要因である。量子化はKVキャッシュアクティベーションを圧縮するための有望なアプローチである。 KVアクティベーションを定量化する新しい手法を取り入れたKVQuantを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:00:01 GMT)
Open-Vocabulary Camouflaged Object Segmentation [66.9]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:56:21 GMT)
Unlocking the Potential of Model Merging for Low-Resource Languages [66.8]
大規模言語モデルを新しい言語に適応させるには、通常、継続事前訓練(CT)と、教師付き微調整(SFT)が含まれる。我々は低リソース言語の代替としてモデルマージを提案し、異なる機能を持つモデルを追加トレーニングなしで単一のモデルに組み合わせる。 Llama-2-7Bをベースとした実験により、モデルマージはタスク解決能力の低い低リソース言語に対して、極めて少ないデータを持つシナリオにおいて、CT-then-SFTよりも優れていることが実証された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:14:17 GMT)
4K4DGen: Panoramic 4D Generation at 4K Resolution [66.3]
本研究では,360度画像に一貫したアニメーション化を実現するために,汎用的な2次元拡散に適応するパノラマデノイザを提案する。高品質なパノラマから4D生成を(4096$times$2048)初めて達成しました。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:13:27 GMT)
MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.8]
MetaDesignerは、Large Language Models(LLM)の強みを活用して、ユーザエンゲージメントを中心としたデザインパラダイムを推進することによって、芸術的なタイポグラフィに革命をもたらす。総合的なフィードバックメカニズムは、マルチモーダルモデルとユーザ評価からの洞察を活用して、設計プロセスを反復的に洗練し、拡張する。実証的な検証は、MetaDesignerが様々なWordArtアプリケーションに効果的に機能し、審美的に魅力的でコンテキストに敏感な結果を生み出す能力を強調している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:47:40 GMT)
Multi-Convformer: Extending Conformer with Multiple Convolution Kernels [64.4]
我々は,マルチコンバータを導入し,複数のコンバータカーネルをゲーティングと合わせてコンバータの畳み込みモジュール内で利用する。我々のモデルは、よりパラメータ効率の良いCgMLPやE-Branchformerといった既存のConformerと性能的に競合する。我々は4つの異なるデータセットと3つの異なるモデリングパラダイムにまたがって、我々のアプローチをConformerとその変種と経験的に比較し、最大8%の相対的な単語誤り率(WER)の改善を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:08:12 GMT)
Reinforced In-Context Black-Box Optimization [64.3]
RIBBOは、オフラインデータからエンドツーエンドでBBOアルゴリズムを強化学習する手法である。 RIBBOは、複数の動作アルゴリズムとタスクによって生成される最適化履歴を学習するために、表現的なシーケンスモデルを使用している。提案手法の中心となるのは,テキストレグレット・ツー・ゴートークンによる最適化履歴の増大である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:41:44 GMT)
Systematic Task Exploration with LLMs: A Study in Citation Text Generation [63.5]
大規模言語モデル(LLM)は、複雑な創造的自然言語生成(NLG)タスクの定義と実行において、前例のない柔軟性をもたらす。本稿では,系統的な入力操作,参照データ,出力測定からなる3成分研究フレームワークを提案する。我々はこのフレームワークを用いて引用テキスト生成を探索する。これは一般的なNLPタスクであり、タスク定義と評価基準に関するコンセンサスを欠いている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:41:08 GMT)
Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion [61.0]
拡散強制(Diffusion Forcing)は、拡散モデルをトレーニングし、トークンの集合に独立した音レベルを付与する、新たなトレーニングパラダイムである。因果的次トーケン予測モデルを訓練して1つまたは複数の未来のトークンを生成することで、シーケンス生成モデルに拡散強制を適用する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:51:10 GMT)
KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.2]
大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:31:38 GMT)
Oracle Bone Inscriptions Multi-modal Dataset [58.2]
オラクルの骨碑文(Oracle bone inscriptions, OBI)は中国最古の書記体系であり、初期の上海の歴史や古史の貴重な実例を記している。本稿では,10,077個のオラクル骨の注釈情報を含むOracle Bone Inscriptions Multi-modalデータセットを提案する。このデータセットは、OBIの文字検出と認識、ラビングDenoising、キャラクタマッチング、キャラクタ生成、読み込みシーケンス予測、ミスキャラクタ補完タスクなど、OBIの分野に関連するさまざまなAI関連研究タスクに使用することができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:47:32 GMT)
Certifiably Robust Image Watermark [57.5]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:56:04 GMT)
A Review of Modern Recommender Systems Using Generative Models (Gen-RecSys) [57.3]
この調査は、ジェネレーティブモデル(Gen-RecSys)を用いたレコメンデーションシステムにおける重要な進歩を結びつける。対話駆動生成モデル、自然言語レコメンデーションのための大規模言語モデル(LLM)とテキストデータの使用、RSにおける画像やビデオの生成と処理のためのマルチモーダルモデルの統合。我々の研究は、Gen-RecSysの影響と害を評価するために必要なパラダイムを強調し、オープンな課題を特定します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:06:42 GMT)
NegotiationToM: A Benchmark for Stress-testing Machine Theory of Mind on Negotiation Surrounding [55.4]
現在、マインド評価の理論は、機械生成データやゲーム設定を用いたテストモデルに焦点を合わせており、ショートカットや素早い相関が生じる傾向にある。我々は,多次元精神状態を取り巻く実世界の交渉において,ストレステストマシンToMのための新しいベンチマークであるNegotiationToMを紹介する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:14:38 GMT)
Collection, usage and privacy of mobility data in the enterprise and public administrations [55.2]
個人のプライバシーを守るためには、匿名化などのセキュリティ対策が必要である。本研究では,現場における実践の洞察を得るために,専門家によるインタビューを行った。我々は、一般的には最先端の差分プライバシー基準に準拠しない、使用中のプライバシー強化手法を調査した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:29:27 GMT)
Relative Difficulty Distillation for Semantic Segmentation [54.8]
我々は,Relative Difficulty Distillation (RDD) というセマンティックセグメンテーションのための画素レベルのKDパラダイムを提案する。 RDDにより、教師ネットワークは、追加の最適化目標を伴わずに、学習焦点に対する効果的なガイダンスを提供することができる。我々の研究は、RDDが既存のKDメソッドと統合して、上位パフォーマンスバウンダリを改善できることを示します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:08:25 GMT)
Fast Learning of Signed Distance Functions from Noisy Point Clouds via Noise to Noise Mapping [54.4]
点雲から符号付き距離関数を学習することは、3Dコンピュータビジョンにおいて重要な課題である。クリーンポイントクラウドや地上の真理監督を必要としないノイズ・ノイズマッピングを用いてSDFを学習することを提案する。我々の新しい特徴はノイズ・ト・ノイズマッピングにあり、1つの物体やシーンの高精度なSDFを、その多重または単一ノイズの観測から推測することができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:35:02 GMT)
Geodesic Optimization for Predictive Shift Adaptation on EEG data [53.6]
ドメイン適応メソッドは、$X$と$y$で分散シフトが同時に発生したときに苦労する。本稿では,GOPSA(Geodesic Optimization for Predictive Shift Adaptation)と呼ばれる新しい手法を提案する。 GOPSAは、脳波のバイオメディカル応用のための混合効果モデリングと機械学習を併用する可能性を持っている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:15:42 GMT)
LLM Roleplay: Simulating Human-Chatbot Interaction [52.0]
LLM-Roleplayは、人間とチャットボットの相互作用をシミュレートする多様なマルチターン対話を自動的に生成する、目標指向のペルソナベースの手法である。我々は、異なる社会デマログラフグループから自然な人間-チャットボット対話を収集し、実際の人間-チャットボット対話と生成された対話を比較し、人間の評価を行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:49:46 GMT)
HAF-RM: A Hybrid Alignment Framework for Reward Model Training [51.6]
報酬モデルトレーニングのためのハイブリッドアライメントフレームワークHaF-RMを提案する。報酬モデルのパフォーマンスとアライメントを高めるための、原則的で効果的なアプローチを提供する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:26:56 GMT)
Solutions to Deepfakes: Can Camera Hardware, Cryptography, and Deep Learning Verify Real Images? [51.3]
信頼性の高い合成データから実際のデータを分離する手法を確立することが不可欠である。この文書は、どの画像が本物かを検証するために使用できる検出と暗号に関する既知の戦略を提示することを目的としている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:01:21 GMT)
PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.2]
私たちはaを提案します。フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:00:25 GMT)
Planning with Large Language Models for Conversational Agents [51.1]
自律会話エージェント(CA)の制御性と能動性は重要な性質である大規模言語モデル(LLM)を利用した計画型対話エージェントのための新しいフレームワークを提案する。実験の結果,PCA-Dで微調整されたLCMは性能を著しく向上し,未確認領域に一般化できることがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:23:02 GMT)
Investigating the Role of Instruction Variety and Task Difficulty in Robotic Manipulation Tasks [50.8]
本研究は、そのようなモデルの一般化能力における命令と入力の役割を体系的に検証する包括的評価フレームワークを導入する。提案フレームワークは,極度の命令摂動に対するマルチモーダルモデルのレジリエンスと,観測的変化に対する脆弱性を明らかにする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:36:49 GMT)
View-Consistent 3D Editing with Gaussian Splatting [50.6]
画像編集プロセスに3DGSをシームレスに組み込むフレームワークであるView-Consistent Editing (VcEdit)を導入する。一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:23:04 GMT)
Hybrid Quantum-Classical Machine Learning with String Diagrams [49.2]
本稿では,文字列ダイアグラムの観点からハイブリッドアルゴリズムを記述するための公式なフレームワークを開発する。弦図の特筆すべき特徴は、量子古典的インタフェースに対応する関手ボックスの使用である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:37:16 GMT)
Stephanie: Step-by-Step Dialogues for Mimicking Human Interactions in Social Conversations [48.6]
本研究では,人間の会話の動的な性質を模倣する新しいテキストbf-by-Step Dialogue Paradigm (Stephanie)を提案する。デュアルラーニング戦略と,さらに分割した後編集手法を用いて,高品質なステップバイステップ対話データセットを作成した。従来の単段階対話のパラダイムと比較して,その効果を評価するために,自動評価と人的評価を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:59:41 GMT)
Benchmark on Drug Target Interaction Modeling from a Structure Perspective [48.6]
薬物と標的の相互作用の予測は、薬物の発見と設計に不可欠である。グラフニューラルネットワーク(GNN)やトランスフォーマーに基づく最近の手法は、さまざまなデータセットで例外的なパフォーマンスを示している。我々は,GNNベースと暗黙的(トランスフォーマーベース)構造学習アルゴリズムを多用することにより,構造の観点からの薬物-標的相互作用モデリングの総合的な調査とベンチマークを行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:56:59 GMT)
What Does the Bot Say? Opportunities and Risks of Large Language Models in Social Media Bot Detection [48.6]
ソーシャルボット検出における大規模言語モデルの可能性とリスクについて検討する。本稿では,多様なユーザ情報モダリティを分割し,克服するための混合異種エキスパートフレームワークを提案する。実験により、1000の注釈付き例に対する命令チューニングは、最先端のベースラインよりも優れた特殊なLLMを生成することが示された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:37:40 GMT)
CLIP-DR: Textual Knowledge-Guided Diabetic Retinopathy Grading with Ranking-aware Prompting [48.5]
糖尿病網膜症(英: Diabetic retinopathy, DR)は、糖尿病の合併症の一つで、視力低下のレベルに達するのに何十年もかかる。現在のDRグレーディング手法のほとんどは、データのばらつきに不十分な堅牢性に悩まされている。 3つの観測結果に基づく新しいDRグレーティングフレームワークCLIP-DRを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:14:18 GMT)
Improving Self-supervised Pre-training using Accent-Specific Codebooks [48.4]
自己教師型学習のためのアクセント認識適応技術 Mozilla Common Voiceデータセットでは、提案手法は他のアクセント適応手法よりも優れています。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:33:52 GMT)
Contemporary Software Modernization: Perspectives and Challenges to Deal with Legacy Systems [48.3]
2000年代初頭に研究テーマとして「ソフトウェア近代化」が登場した。文学では膨大な量の著作があるにもかかわらず、かなりの限界がある。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:49:52 GMT)
A Survey of Temporal Credit Assignment in Deep Reinforcement Learning [47.2]
クレディ・アサインメント問題(Capital Assignment Problem, CAP)とは、強化学習(Reinforcement Learning, RL)エージェントが長期的な結果と行動を関連付けるための長年にわたる課題を指す。我々は、最先端のアルゴリズムの公平な比較を可能にする信用の統一形式性を提案する。我々は、遅延効果、転置、行動への影響の欠如に起因する課題について論じ、既存の手法がそれらにどう対処しようとしているのかを分析した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:32:18 GMT)
Using LLMs for the Extraction and Normalization of Product Attribute Values [47.1]
本稿では,大規模言語モデル(LLM)を用いて,製品タイトルや記述から属性値の抽出と正規化を行う可能性について検討する。実験のために、Web Data Commons - Product Attribute Value extract (WDC-PAVE)ベンチマークデータセットを紹介します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:12:38 GMT)
7th ABAW Competition: Multi-Task Learning and Compound Expression Recognition [46.7]
本稿では,第7回ABAWコンペティションについて述べる。 ABAWコンペティションは、人間の表現と行動を理解するための新しい課題に対処する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:04:29 GMT)
L+M-24: Building a Dataset for Language + Molecules @ ACL 2024 [46.5]
ACL 2024で共有されたLanguage + Molecules Workshopのために作成された$textitL+M-24$データセットについて詳述する。特に、$textitL+M-24$は、分子設計における自然言語の3つの重要な利点(合成性、機能、抽象)に焦点を当てるように設計されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:21:48 GMT)
Lateralization LoRA: Interleaved Instruction Tuning with Modality-Specialized Adaptations [45.8]
LeafInstructは、10以上のドメインで30,000以上の高品質なインスタンスを持つ最初のオープンソースインターリーブ型インストラクションチューニングデータである。本稿では,脳の側方化の概念に触発された新しいモダリティ特化適応法である横方向化LoRAを提案する。本稿では,LeafInstruct データセット上で,Larialization LoRA を用いて VLG (EMU2) の命令チューニングを行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:28:22 GMT)
DiffRetouch: Using Diffusion to Retouch on the Shoulder of Experts [45.7]
DiffRetouch という拡散型リタッチ方式。 4つの画像属性を調整可能とし、ユーザフレンドリーな編集機構を提供する。テクスチャ歪みと制御感度の問題をそれぞれ扱うために,アフィン二元格子とコントラスト学習方式を導入する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:09:42 GMT)
Low-Rank Bandits via Tight Two-to-Infinity Singular Subspace Recovery [45.6]
本稿では,政策評価,最良政策識別,後悔の最小化のための効率的なアルゴリズムを提案する。政策評価と最良の政策識別のために,我々のアルゴリズムは最小限に最適であることを示す。提案アルゴリズムは、まずスペクトル法を利用して、低ランク報酬行列の左特異部分空間と右特異部分空間を推定する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:17:38 GMT)
Compressed Latent Replays for Lightweight Continual Learning on Spiking Neural Networks [45.5]
我々は、スパイキングニューラルネットワーク(SNN)のためのLR(Latent Replay)ベースのCLの最初のメモリ効率実装を紹介する。 LRは、新しいサンプルと以前に学習したデータの潜在表現を組み合わせることで、忘れを緩和する。サンプルタスクとクラスインクリメンタルタスクを用いたハイデルベルクSHDデータセットの実験は、それぞれ92.5%と92%のTop-1精度に達した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:07:18 GMT)
A Computer Vision Approach to Estimate the Localized Sea State [45.5]
本研究では,リアルタイム海況認識のためのコンピュータビジョン(CV)と深層学習の新たな応用法を提案する。特に,本研究は,船橋に設置した静止カメラ1台で捉えた作業封筒内の海像の活用に重点を置いている。海の状態を認識するために,様々なコンピュータビジョンタスクで有用な特徴を持つ4つの最先端ニューラルネットワークを用いた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:07:25 GMT)
Heterogeneous Hypergraph Embedding for Recommendation Systems [45.5]
知識強化ヘテロジニアスハイパーグラフレコメンダシステム(KHGRec)について紹介する。 KHGRecは、相互作用ネットワークとKGの両方のグループワイド特性を捉え、KGの複雑な接続をモデル化する。入力グラフからの信号を、クロスビューで自己教師付き学習とアテンションメカニズムで融合する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:09:11 GMT)
Scalable Learned Model Soup on a Single GPU: An Efficient Subspace Training Strategy [45.5]
モデルスープの変種であるLearned-Soupは、パフォーマンスを大幅に改善するが、メモリと時間コストが大幅に低下する。本稿では,この問題に対処するために,メモリ効率の高いハイパープレーン学習スープ(MEHL-Soup)を提案する。テスト精度ではMEHL-Soup(+)がLearred-Soup(+)より優れており,メモリ使用量も13ドル以上削減されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:23:22 GMT)
Core: Robust Factual Precision Scoring with Informative Sub-Claim Identification [44.4]
幻覚は、大きな言語モデルの適用に挑戦する。 FActScoreデータセットを拡張して,実測値の設計と分析を行う。これは、Coreと呼ばれる新しいカスタマイズ可能なプラグインとプレイのサブステート選択コンポーネントを動機付けます。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:51:38 GMT)
NeurDB: An AI-powered Autonomous Data System [44.1]
我々は、主要なシステムコンポーネントにAI設計を完全に取り入れるように設計されたAI駆動の自律データシステムであるNeurDBを提示する。我々はNeurDBの概念的およびアーキテクチャ的概要を概説し、その設計選択と重要なコンポーネントについて議論し、その現況と今後の計画について報告する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:48:45 GMT)
Towards Efficient Pixel Labeling for Industrial Anomaly Detection and Localization [43.5]
本稿では,新しいインタラクティブ画像(IIS)アルゴリズムであるADClickを紹介する。 ADClickは、実際の欠陥画像に対して「地中真実」の異常マスクを効率よく生成する。我々は ADClick の能力を ADClick-Seg に拡張する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:28:05 GMT)
Guidance with Spherical Gaussian Constraint for Conditional Diffusion [43.1]
拡散モデルの最近の進歩は、訓練を必要とせず、異なる損失関数をガイダンスに利用することで条件付き生成タスクを処理しようとするものである。これらの手法は一定の成功を収めたが、しばしばサンプルの品質を妥協し、小さなガイダンスのステップサイズを必要とする。本稿では, 損失誘導を行う際に, サンプリング過程における多様体偏差の基本的な問題を明らかにする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:58:36 GMT)
TieBot: Learning to Knot a Tie from Visual Demonstration through a Real-to-Sim-to-Real Approach [42.9]
この研究は、ロボットがネクタイを結びつくことを学べるリアルタイムの学習システムTieBotを紹介している。実演ビデオからネクタイのメッシュ列を推定する階層的特徴マッチング手法を提案する。実世界の実験では、デュアルアームロボットがネクタイを結び、10回の試験で50%の成功率を達成した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:03:54 GMT)
Uncertainty-Guided Optimization on Large Language Model Search Trees [42.7]
ビームサーチ(ビームサーチ)は、最大確率の列を見つけるための標準的な木探索アルゴリズムである。よりデータ効率のよい探索手法を実現するために,非ミオピー的ベイズ最適化型取得関数を提案する。本手法は,ビームサーチよりも少ないノードを拡張しながら,同じあるいは高い可能性を達成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:08:50 GMT)
Semantic Grouping Network for Audio Source Separation [41.5]
本稿では,SGNと呼ばれる新しいセマンティックグルーピングネットワークを提案する。 MUSIC, FUSS, MUSDB18, VGG-Sound という,音楽のみと普遍的な音分離ベンチマークについて広範な実験を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:37:47 GMT)
"My Answer is C": First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models [40.9]
言語生成のオープンな性質は、大規模言語モデル(LLM)の評価を困難にしている。 1つの一般的な評価手法は、応答空間を制限するためにMulti-choice Question (MCQ) を用いる。そこで本研究では,テキストの出力を数次元で評価する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:51:29 GMT)
KG-Rank: Enhancing Large Language Models for Medical QA with Knowledge Graphs and Ranking Techniques [40.7]
KG-Rankは、医療領域における長文質問応答(QA)の事実性を改善するためのフレームワークである。質問を受けると、KG-Rankは質問内の医療エンティティを自動的に識別し、関連するトリプルを検索する。 KG-RankはKGの最初の応用であり、医学的QAのランキングモデルと組み合わせて長い回答を生成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:45:07 GMT)
Unified Medical Image Pre-training in Language-Guided Common Semantic Space [39.6]
我々はUnified Medical Image Pre-Trainingフレームワーク(UniMedI)を提案する。 UniMedIは、診断レポートを一般的な意味空間として使用し、医療画像の多様なモダリティの統一表現を作成する。 10種類のデータセットにまたがる2次元画像と3次元画像の性能評価を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:56:00 GMT)
High-quality entangled photons source by symmetric beam displacement design [39.6]
絡み合った光子源は、量子通信、計算、センシングの進展において重要である。この研究は、0型自発パラメトリックダウンコンバージョンを利用する偏光共役光子源を導入する。平均的絡み合いの可視性は99%以上であった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:29:47 GMT)
Evaluation of phase shifts for non-relativistic elastic scattering using quantum computers [39.6]
本研究は, 量子コンピュータ上での一般相対論的非弾性散乱過程の位相シフトを求めるアルゴリズムの開発を報告する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:11:05 GMT)
Perception-Guided Quality Metric of 3D Point Clouds Using Hybrid Strategy [38.9]
フルリファレンスポイントクラウド品質評価(FR-PCQA)は、歪んだポイントクラウドの品質を利用可能なリファレンスで推測することを目的としている。既存のFR-PCQAメトリクスのほとんどは、人間の視覚システム(HVS)が様々な歪みレベルに応じて視覚情報に動的に取り組むという事実を無視している。本稿では,2つの視覚的戦略を歪み度に関して適応的に活用し,点雲の質を予測するための知覚誘導ハイブリッド計量(PHM)を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:23:39 GMT)
Occupancy as Set of Points [38.9]
Occupancy as Set of Points (OSP)は、ポイントベースの3D占有率予測のための新しいフレームワークである。 OSPは既存のメソッドと比較して高いパフォーマンスを実現し、トレーニングや推論の点で優れています。 Occ3D nuScenes占有ベンチマークの実験によると、OSPはパフォーマンスと柔軟性が強い。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:46:22 GMT)
DART: Deep Adversarial Automated Red Teaming for LLM Safety [38.4]
大規模言語モデル(LLM)における安全性の脆弱性を検出するために,DART(Deep Adversarial Automated Red Teaming)フレームワークを提案する。実験により、DARTは目標LLMの安全性を著しく低下させることが示された。人間によるArthhropic Harmlessデータセットの評価では、DARTは違反リスクを53.4%削減している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:14:27 GMT)
DSMix: Distortion-Induced Sensitivity Map Based Pre-training for No-Reference Image Quality Assessment [38.0]
画像品質評価(IQA)は画像理解の基本的な課題である。 IQAフィールドにおける大量のラベル付きデータの欠如は、これらの手法のさらなる進歩を妨げている。本稿では,IQAタスクに特化して設計された新しいデータ拡張手法であるDSMixを紹介する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:25:11 GMT)
Bias of Stochastic Gradient Descent or the Architecture: Disentangling the Effects of Overparameterization of Neural Networks [37.0]
本稿では,学習ミスをゼロにするランダムネットワークとSGD最適化ネットワークを研究することによって,一般化に影響を与える要因を解消することを目的とする。実験により, 低試料状態下では, 幅の増大によるパラメータ化が一般化に有用であることが確認された。深度を増大させるため、パラメータ化は一般化には有害であるが、ランダムおよびSGD最適化ネットワークも同様に振る舞うので、これはアーキテクチャ上のバイアスに起因する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:29:50 GMT)
Beyond Pixels: Semi-Supervised Semantic Segmentation with a Multi-scale Patch-based Multi-Label Classifier [37.0]
マルチスケールパッチベースマルチラベル(MPMC)を導入する。 MPMCはパッチレベルの監視を提供し、パッチ内の異なるクラスのピクセル領域の識別を可能にする。 MPMCは、教師のうるさい疑似ラベル監督の影響を軽減するためにパッチレベルの分類を用いて、適応的な擬似ラベル重みを学習する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:21:29 GMT)
PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments [37.0]
PreAffordは、ポイントレベルのアベイランス表現とリレートレーニングアプローチを取り入れた、新しいプレグラピング計画フレームワークである。提案手法は適応性を大幅に向上させ,多様な環境やオブジェクトタイプに対して効果的な操作を可能にする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:13:57 GMT)
Score Distillation Sampling with Learned Manifold Corrective [37.0]
損失を異なる要因に分解し,ノイズ勾配の原因となる成分を分離する。オリジナルの定式化では、ノイズを考慮に入れた高いテキストガイダンスが使用され、過飽和や繰り返し詳細といった不要な副作用が生じる。我々は,画像拡散モデルの時間依存性周波数バイアスを模倣した浅層ネットワークを訓練し,これを効果的に導出する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:21:58 GMT)
SeiT++: Masked Token Modeling Improves Storage-efficient Training [37.0]
近年のDeep Neural Network(DNN)モデルでは,コンピュータビジョンタスクのパフォーマンスが大幅に向上している。高度に一般化可能で高性能なビジョンモデルを実現するには、拡張データセットが必要である。 SeiTによる最近のブレークスルーは、Vector-Quantized (VQ)特徴ベクトル(トークン)を視覚分類のためのネットワーク入力として使用することを提案した。本稿では,自己指導型事前学習のためのMasked Token Modeling (MTM)を統合し,SeyTを拡張した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:31:03 GMT)
SegGen: Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis [36.8]
SegGenは画像セグメンテーションのための高効率なトレーニングデータ生成方法である。 MaskSynはテキスト・ツー・マスク生成モデルとマスク・ツー・マスク生成モデルを用いて新しいマスク・イメージ・ペアを合成する。 ImgSynはマスク・ツー・イメージ生成モデルを用いて既存のマスクに基づいて新しい画像を合成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:59:18 GMT)
Time-bin entangled Bell state generation and tomography on thin-film lithium niobate [36.6]
ニオブ酸リチウム(Lithium niobate-on-insulator)は、高速な古典的通信のための革命的プラットフォームとして登場した。我々は、リチウムニオブ酸イオン絶縁体フォトニクスを用いて、時間ビンベースで最大エンタングルド量子状態を生成する。我々の結果は、ニオブ酸リチウムの電気光学帯域の確立と相まって、繊維結合型高速時間ビン量子通信モジュールの実現に最適な候補であることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:43:36 GMT)
UltraPixel: Advancing Ultra-High-Resolution Image Synthesis to New Peaks [36.6]
カスケード拡散モデルを用いて高画質画像を複数解像度で生成する新しいアーキテクチャであるUltraPixelを提案する。後半の認知段階における低分解能画像のセマンティクスに富んだ表現を用いて、高精細高分解能画像の全生成を導く。我々のモデルは、データ要求を減らして高速なトレーニングを行い、フォトリアリスティックな高解像度画像を生成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:11:19 GMT)
Bayesian Optimization with Formal Safety Guarantees via Online Conformal Prediction [36.1]
ブラックボックスゼロ階最適化は、金融、物理学、工学といった分野における応用において中心的な原始である。本稿では,提案手法の安全性に関するフィードバックも提供するシナリオについて検討する。制約関数の性質に関わらず、安全要件を満たす新しいBOベースのアプローチが導入された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:23:05 GMT)
Spherical Mask: Coarse-to-Fine 3D Point Cloud Instance Segmentation with Spherical Representation [35.9]
球面表現に基づく新しい粗粒化手法である球面マスクを紹介する。具体的には、中心距離と半径距離の予測を用いて、各ケースを3次元ポリゴンで推定する。 ScanNetV2,S3DIS,LS3Dの3つのデータセットによる実験結果から,提案手法が既存手法より優れていることが示された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:29:32 GMT)
An Information Bottleneck Perspective for Effective Noise Filtering on Retrieval-Augmented Generation [35.8]
情報ボトルネック理論を検索強化世代に導入する。提案手法では,圧縮と地盤出力の相互情報を同時に最大化することにより,ノイズのフィルタリングを行う。我々は,情報ボトルネックの定式化を導出し,新たな包括的評価を行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:21:39 GMT)
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking [35.4]
大きな言語モデル(LLM)は、一般的でない言及を解釈する上で、より堅牢である。 LLM-Augmented Entity Linking LLMAELは,エンティティリンクを強化するためのプラグイン・アンド・プレイ方式である。 6つの標準データセットの実験では、ほとんどの場合、バニラLLMAELはベースラインELモデルよりも優れていた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:55:13 GMT)
TongGu: Mastering Classical Chinese Understanding with Knowledge-Grounded Large Language Models [35.4]
古典中国語は古代中国の豊かな遺産と知恵の入り口であるが、その複雑さは重大な理解障壁となっている。大規模言語モデル(LLM)は自然言語処理(NLP)において顕著な能力を示している。本稿は,CCU 固有の LLM である textbfTongGu を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:52:23 GMT)
A Systematic Survey and Critical Review on Evaluating Large Language Models: Challenges, Limitations, and Recommendations [35.1]
大規模言語モデル(LLM)は、その顕著な能力により、最近大きな注目を集めている。我々はこれらの不整合や信頼できない評価を引き起こす主要な課題と限界を体系的にレビューする。批判的なレビューに基づいて、LLM評価が再現可能で、信頼性があり、堅牢であることを保証するために、私たちの視点と勧告を提示します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:15:37 GMT)
ROER: Regularized Optimal Experience Replay [34.5]
優先経験リプレイ(PER)は、時間差(TD)誤差によって経験を過度に再現する。経験優先化と占有最適化の関連性を示す。正規化された最適体験再生(ROER)は、難易度の高いAntmaze環境において顕著な改善を実現する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:14:57 GMT)
Meta-optimized Angular Margin Contrastive Framework for Video-Language Representation Learning [34.3]
以前のデータにおけるビデオテキストペアは通常、完全に一致しないため、クロスモーダルなセマンティクスを正確に反映しないビデオ言語表現につながる可能性がある。完全類似性を達成するために, モーダル表現を正則化するために, 狭義の角辺を持つ対照的な対象を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:52:17 GMT)
Generalizing Graph Transformers Across Diverse Graphs and Tasks via Pre-Training on Industrial-Scale Data [34.2]
PGT(Pre-trained Graph Transformer)と呼ばれるスケーラブルなトランスフォーマーベースのグラフ事前学習フレームワークを導入する。本フレームワークは,産業用データセットと公共用データセットの両方で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:14:09 GMT)
Explicitly Guided Information Interaction Network for Cross-modal Point Cloud Completion [34.1]
本稿では,ビュー誘導ポイントクラウドコンプリートタスクのモデルであるEGIInet(Explicitly Guided Information Interaction Network)を紹介する。 EGIInetは、完了タスクの幾何学的性質を活用することにより、2つのモードからの情報を効率的に結合する。本稿では,ネットワークが画像内の重要な情報を特定するのに役立つ情報インタラクション戦略を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:57:47 GMT)
Ultrafast jet classification on FPGAs for the HL-LHC [33.9]
3つの機械学習モデルを用いてジェット起源分類を行う。これらのモデルは、フィールドプログラム可能なゲートアレイデバイスにデプロイするために最適化されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:39:20 GMT)
Topological phase transitions via attosecond x-ray absorption spectroscopy [33.7]
位相位相を二階ホッピングで調整したチャーン絶縁体を考える。我々は、円偏光IRポンプパルスとアト秒X線プローブパルスを用いた超高速スキームを用いる。レーザー誘起二色性スペクトルは、位相相転移の明確な兆候を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:41:57 GMT)
Improving Sample Efficiency of Reinforcement Learning with Background Knowledge from Large Language Models [33.5]
低サンプリング効率は強化学習(RL)の持続的課題である環境の背景知識を抽出するために,大規模言語モデルを利用するフレームワークを導入する。実験により, 下流タスクのスペクトルにおいて, サンプル効率が著しく向上することが確認された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:33:47 GMT)
Attribute First, then Generate: Locally-attributable Grounded Text Generation [33.4]
本稿では,簡潔な属性を優先する局所帰属型テキスト生成手法を提案する。 Attribute First, then Generate"と名付けられたこの手法は,従来のエンドツーエンド生成プロセスを3つの直感的なステップに分解する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:07:58 GMT)
Is Aggregation the Only Choice? Federated Learning via Layer-wise Model Recombination [33.1]
我々はFedMR(Federated Model Recombination)という新しいFLパラダイムを提案する。 FedMRの目標は、フラットな領域に向けてトレーニングされる組換えモデルをガイドすることである。最先端のFL手法と比較して、FedMRは各クライアントのプライバシを公開することなく、推論精度を大幅に向上させることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:22:01 GMT)
M^3:Manipulation Mask Manufacturer for Arbitrary-Scale Super-Resolution Mask [32.1]
インターネット上の画像(Baidu TiebaのPS Barなど)は様々な技術を用いて操作される。操作された画像を原画像から抽出するだけで得られるマスクには、様々なノイズが含まれている。変化検出の分野に触発されて、元の画像と操作された画像を、同じ画像の時間経過とともに変化として扱う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:30:41 GMT)
VEGS: View Extrapolation of Urban Scenes in 3D Gaussian Splatting using Learned Priors [32.0]
本研究では,左,右,下などの視界の再構成を評価することで,外挿ビュー合成(EVS)問題に対処する。我々の知る限りでは、都市景観再建におけるESV問題に最初に取り組む人物である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:27:15 GMT)
CS3: Cascade SAM for Sperm Segmentation [31.1]
精子重複問題に対処するために設計された無監督のアプローチであるCascade SAM for Sperm(CS3)を提案する。主要な医療機関と共同で約2000枚の未ラベル精子画像からなるデータセットを作成した。実験の結果,既存手法と比較してCS3の性能は優れていた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:32:34 GMT)
Biometric Authentication Based on Enhanced Remote Photoplethysmography Signal Morphology [31.0]
リモート・フォトプレソグラフィー (Remote Photoplethhymography) は、顔画像から心臓の信号を計測する非接触法である。近年の研究では、各個人が生体認証識別子として使用できる独自のc信号形態を持っていることが示されている。提案手法では,rの認証モデルをトレーニングするために,対象ID付き顔画像のみを識別する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 19:00:34 GMT)
Improving Accented Speech Recognition using Data Augmentation based on Unsupervised Text-to-Speech Synthesis [31.0]
本稿では、アクセント付き音声認識を改善するためのデータ拡張手法として、教師なし音声合成(TTS)の使用について検討する。 TTSシステムは、手書き文字起こしではなく、少量のアクセント付き音声訓練データとそれらの擬似ラベルで訓練される。この手法により,アクセント付き音声認識のためのデータ拡張を行うために,手書きの書き起こしを伴わないアクセント付き音声データを使用することが可能である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:42:24 GMT)
FAIR: Filtering of Automatically Induced Rules [29.8]
本稿では,多数の自動生成ルールからルールをフィルタリングするアルゴリズムを提案する。本稿では,既存のルールフィルタリング手法と比較して,統計的に有意な結果が得られることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:06:22 GMT)
Camera-LiDAR Cross-modality Gait Recognition [29.7]
本稿では,カメラとLiDAR,すなわちCL-Gait間の最初の相互モダリティ歩行認識フレームワークを提案する。私たちの知る限りでは、これはモダリティ間の歩行認識に対処する最初の試みである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:02:06 GMT)
Securing Multi-turn Conversational Language Models Against Distributed Backdoor Triggers [29.6]
マルチターン会話型大規模言語モデル(LLM)は、バックドア攻撃に影響を及ぼすデータに対して脆弱である。 LLMは、バックドアのトリガーが複数の発話にまたがる、より有害でステルス的なバックドア攻撃の危険にさらされている。本稿では,より困難なマルチターン対話設定のための新しい防衛戦略を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:57:06 GMT)
Real-time Cyberattack Detection with Collaborative Learning for Blockchain Networks [29.5]
ブロックチェーンネットワークを保護するために,効率的な協調型サイバー攻撃検出モデルを提案する。提案する検出モデルは,ブロックチェーンネットワークにおける攻撃を最大97%の精度で検出できる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:39:49 GMT)
Learning Video Temporal Dynamics with Cross-Modal Attention for Robust Audio-Visual Speech Recognition [29.4]
音声-視覚音声認識は、音声とビデオの両方のモダリティを用いて人間の音声を転写することを目的としている。本研究では,映像データ中の3つの時間的ダイナミクスを学習することにより,映像特徴の強化を図る。 LRS2 と LRS3 の AVSR ベンチマークにおいて,ノイズ優越性設定のための最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:25:20 GMT)
MineNetCD: A Benchmark for Global Mining Change Detection on Remote Sensing Imagery [29.4]
リモートセンシング画像を用いた地球規模の地雷検出のためのベンチマークであるMineNetCDを紹介する。まず,両時間高分解能リモートセンシング画像の70万枚以上のパッチを用いたグローバルな地雷変化検出データセットを構築した。次に,変更対応のFast Fourier Transform (ChangeFFT) モジュールをベースとした新しいベースラインモデルを提案する。第3に、13以上の高度な変更検出モデルを統合する統合された変更検出フレームワークを構築する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:45:44 GMT)
SpikeGS: Reconstruct 3D scene via fast-moving bio-inspired sensors [28.7]
Spike Gausian Splatting (SpikeGS)は、スパイクストリームを3DGSパイプラインに統合し、素早く動くバイオインスパイアされたカメラで3Dシーンを再構築するフレームワークである。 SpikeGSは、高時間分解能から詳細な幾何学とテクスチャを抽出するが、スパイクストリームを欠いたテクスチャは、1秒でキャプチャされた3Dシーンを再構成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:32:12 GMT)
ChartGemma: Visual Instruction-tuning for Chart Reasoning in the Wild [28.6]
本稿では,PaliGemma上で開発された新しいチャート理解と推論モデルであるChartGemmaを紹介する。基礎となるデータテーブルに頼るのではなく、ChartGemmaは、チャートイメージから直接生成されたインストラクションチューニングデータに基づいて訓練される。我々の単純なアプローチは、チャートの要約、質問応答、ファクトチェックにまたがる5ドルのベンチマークで最先端の結果を得る。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:16:40 GMT)
Q-Adapter: Training Your LLM Adapter as a Residual Q-Function [28.4]
本稿では,人間フィードバックからの強化学習によって事前訓練された大規模言語モデル(LLM)を下流の嗜好データに適用する問題について考察する。既存の能力を維持しつつLCMをカスタマイズするために,Q-Adapterという新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:42:36 GMT)
MiniGPT-Med: Large Language Model as a General Interface for Radiology Diagnosis [28.4]
MiniGPT-Medは、大規模言語モデルから派生したヴィジュアル言語モデルであり、医学的応用に適したものである。医療報告生成、視覚的質問応答(VQA)、医療画像内の疾患識別などのタスクを実行することができる。医療報告生成の最先端性能は,従来の最良モデルよりも19%高い精度で達成される。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:21:10 GMT)
DexCap: Scalable and Portable Mocap Data Collection System for Dexterous Manipulation [28.4]
人間の手の動きデータからの模倣学習は、現実世界の操作タスクにおいて、人間のような器用さでロボットを倒すための有望な道を示す。携帯型ハンドモーションキャプチャシステムであるDexCapとDexILを紹介する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:35:04 GMT)
Orchestrating LLMs with Different Personalizations [28.3]
本稿では,大規模言語モデル(LLM)と個人の嗜好を一致させる新しいアプローチを提案する。有用性、簡潔性、ユーモアなど、複数の次元に沿って記述された嗜好を踏まえると、ゴールは、この仕様に最もよく準拠する再訓練をせずにLLMを作成することである。 1つの特定の選好次元で訓練された専門的なLSMから始め、各トーケンレベルで出力をマージするブラックボックス法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:55:02 GMT)
Timestep-Aware Correction for Quantized Diffusion Models [28.3]
本稿では,量子化誤差を動的に補正する量子化拡散モデルの時間ステップ対応補正法を提案する。提案手法を低精度拡散モデルに応用することにより,出力品質の大幅な向上が期待できる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:22:31 GMT)
A Comprehensive Survey and Taxonomy on Point Cloud Registration Based on Deep Learning [28.1]
ポイントクラウド登録(PCR)は、1つのポイントクラウドを別のポイントクラウドにアライメントする厳格な変換を決定することを伴う。優れた深層学習(DL)ベースの登録法が提案されているにもかかわらず、DLベースのPCR技術に関する包括的で体系的な研究はいまだに不足している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:45:32 GMT)
Hyperbolic Knowledge Transfer in Cross-Domain Recommendation System [28.0]
CDR(Cross-Domain Recommendation)は、異なるドメインからの知識を活用して、ターゲットのレコメンデーションドメインにおけるデータ空間の問題を軽減する。現在のほとんどのメソッドはユークリッド空間のユーザやアイテムを表していますが、これは長い尾の分散データを扱うには理想的ではありません。我々は,各ドメインのユニークな特徴を捉えるために,Hyperbolic Contrastive Learning (HCTS)と呼ばれる新しいフレームワークを導入する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:54:07 GMT)
Aligning Neural Machine Translation Models: Human Feedback in Training and Inference [27.8]
RLHF(Reinforcement Learning from Human feedback)は、言語モデルによって生成されたテキストの品質を向上させる技術である。人間のアノテーションからトレーニングされたメトリクスを報酬モデルとして容易に利用できる機械翻訳(MT)では、最小ベイズリスクデコーディングと再ランクを用いた手法が最終品質の向上に成功している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:16:35 GMT)
Emergent Interpretable Symbols and Content-Style Disentanglement via Variance-Invariance Constraints [26.5]
生の観察から効果的に学習し、潜在空間を内容とスタイル表現に分解する教師なしの方法。本手法は,コンテンツとスタイルのドメイン一般統計的差異の洞察に基づく。実験結果から、V3は2つの異なる領域を異なるモジュラリティで一般化することが示された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:52:02 GMT)
Short-Long Policy Evaluation with Novel Actions [26.2]
逐次意思決定タスクの短期的政策評価のための新しい設定を提案する。提案手法は,HIV治療,腎臓透析,バッテリ充電のシミュレーターにおいて,従来よりも有意に優れていた。また、新しい意思決定ポリシーが過去のポリシーよりも大幅にパフォーマンスが低下する可能性があることを素早く特定することで、AI安全性のアプリケーションに有効な方法を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:42:21 GMT)
Concept Bottleneck Models Without Predefined Concepts [26.2]
入力に依存した概念選択機構を導入し、すべてのクラスで小さな概念のサブセットが使用されることを保証します。提案手法は, ダウンストリーム性能を改善し, ブラックボックスモデルの性能ギャップを狭めるものである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:34:50 GMT)
Do Pre-trained Models Benefit Equally in Continual Learning? [26.0]
既存の継続学習(CL)の研究は主に、ゼロから訓練されたモデルのアルゴリズムの開発に費やされている。コントリビュートベンチマークのパフォーマンスは高いが、これらのアルゴリズムは現実のシナリオで劇的なパフォーマンス低下を示す。本稿では,CLに対する事前学習の体系的導入を提唱する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:25:36 GMT)
SkateFormer: Skeletal-Temporal Transformer for Human Action Recognition [25.3]
我々はSkateFormer(SkateFormer)と呼ばれる新しい手法を提案する。 SkateFormerは、さまざまなタイプの骨格と時間の関係に基づいて関節とフレームを分割する。アクション適応的な方法で、アクション認識に不可欠なキージョイントやフレームに選択的にフォーカスすることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:12:20 GMT)
Visualizing Dialogues: Enhancing Image Selection through Dialogue Understanding with Large Language Models [25.1]
本稿では,大規模言語モデル(LLM)の頑健な推論機能を活用して,正確な対話関連視覚記述子を生成する手法を提案する。ベンチマークデータを用いて行った実験は、簡潔で正確な視覚記述子の導出における提案手法の有効性を検証した。本研究は,多様な視覚的手がかり,多様なLCM,異なるデータセットにまたがる手法の一般化可能性を示すものである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:50:30 GMT)
Solving Zebra Puzzles Using Constraint-Guided Multi-Agent Systems [25.0]
本稿では,大言語モデルとオフ・ザ・シェルフ定理証明器を統合したマルチエージェントシステムZPSを紹介する。このシステムは、問題をより小さく管理可能な部分に分割することで、複雑なパズル解決作業に取り組む。また,問題解の正当性を評価するための自動グリッドパズルグレーダを導入し,ユーザスタディで評価することで,自動グレーダが信頼性が高いことを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:22:25 GMT)
TALENT: A Tabular Analytics and Learning Toolbox [24.9]
本稿では,表型手法の活用,分析,比較を行うためにTALENT (Tabular Analytics and LEarNing Toolbox) という汎用的なディープラーニングツールボックスを提案する。 TALENTは、様々なエンコーディングおよび正規化モジュールに関連する、20以上の深い表層予測手法の広範なコレクションを含んでいる。本稿では,ツールボックスの設計と機能について述べるとともに,その実践的応用をいくつかのケーススタディを通じて説明し,ツールボックスをベースとした各種手法の性能について検討する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:57:14 GMT)
DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning [24.7]
本稿では,数理推論にコードアシストと自己補正を併用した思考の分解を利用した大規模言語モデル(LLM)について紹介する。 DotaMathモデルは複雑な数学的タスクに対処し、それらをより単純な論理的なサブタスクに分解し、コードを利用してこれらのサブタスクを解決する。そこで我々は,DotaMathQAの模倣学習を用いて,オープンソースのLLMと比較して優れた性能を示すDotaMathモデルを訓練した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:39:16 GMT)
Robust Learning under Hybrid Noise [24.4]
本稿では,データリカバリの観点からハイブリッドノイズに対処するため,新たな統合学習フレームワーク"Feature and Label Recovery"(FLR)を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:13:25 GMT)
Learning Visual Conditioning Tokens to Correct Domain Shift for Fully Test-time Adaptation [24.3]
トランスを用いた画像分類では、第1変圧器エンコーダ層のクラストークンを学習して、テスト時間適応時のターゲットサンプルのドメイン固有の特性をキャプチャすることができる。本稿では,ドメイン固有の特徴の長期的変動を捉えつつ,インスタンス固有の特徴の局所的変動を調節する二段階学習手法を提案する。提案手法により,テスト時間適応性能を最大1.9%向上させることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:54:44 GMT)
Serialized Output Training by Learned Dominance [24.2]
SOT(Serialized Output Training)は,多話者音声認識において最先端の性能を示す。ラベル置換の問題に対処するため、従来の手法はPIT(Permutation Invariant Training)とFIFO(First-In-First-Out)のどちらかに依存している。本研究では,アテンション・デコーダアーキテクチャに補助モジュールを組み込んだモデルベースシリアライズ戦略を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:36:02 GMT)
Mitigating Low-Frequency Bias: Feature Recalibration and Frequency Attention Regularization for Adversarial Robustness [23.8]
本稿では,HFDR(High-Frequency Feature Disentanglement and Recalibration)と呼ばれる新しいモジュールを提案する。 HFDRは、特徴を高周波成分と低周波成分に分離し、高周波特徴を再検討し、潜在有用なセマンティクスをキャプチャする。大規模な実験は、様々なホワイトボックス攻撃、転送攻撃、および強力な一般化能力に対する我々のアプローチの持つ大きな可能性と優位性を示している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:46:01 GMT)
In-Context Learning State Vector with Inner and Momentum Optimization [23.3]
大規模言語モデル(LLM)は、わずか数例からICL(In-Context Learning)を実行する素晴らしい能力を示した。近年の研究では、ICLが学習した関数は変換器から得られる圧縮ベクトルで表現できることが示されている。本稿では,これらの圧縮ベクトルの包括的解析,勾配降下法で訓練されたパラメータの並列化,状態ベクトルの概念について述べる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:52:11 GMT)
When Good and Reproducible Results are a Giant with Feet of Clay: The Importance of Software Quality in NLP [23.3]
本稿では,最先端コンフォーマーアーキテクチャの実装で広く使用されている3つのバグを特定し,修正するケーススタディを提案する。我々は、ニューラルネットワークのテスト専用のライブラリである、コード品質チェックリストとリリースパンゴリNNを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:16:22 GMT)
C$^3$DG: Conditional Domain Generalization for Hyperspectral Imagery Classification with Convergence and Constrained-risk Theories [23.2]
ハイパースペクトル画像(HSI)分類は、ハイパースペクトルモノスペクトルの課題である。共同空間スペクトル特徴抽出はこの問題に対する一般的な解法である。本稿では,収束性および誤差制約付き条件付き領域一般化法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:03:45 GMT)
Enabling Discriminative Reasoning in LLMs for Legal Judgment Prediction [23.0]
人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。 ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:28:46 GMT)
Beyond Viewpoint: Robust 3D Object Recognition under Arbitrary Views through Joint Multi-Part Representation [22.8]
Part-Aware Network (PANet) は、航空機の翼や尾などの3Dオブジェクトの異なる部分のローカライズと理解を目的としている。提案手法は,任意のビュー下での3次元オブジェクト認識処理において,既存のビューベースアグリゲーションベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:16:47 GMT)
EMPL: A novel Efficient Meta Prompt Learning Framework for Few-shot Unsupervised Domain Adaptation [22.6]
本稿では,FS-UDAのためのメタプロンプト学習フレームワークを提案する。このフレームワークでは、事前訓練されたCLIPモデルを機能学習ベースモデルとして使用しています。 5-way 1-shotでは少なくとも15.4%,5-way 5-shotでは8.7%の大幅な改善が得られた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:13:06 GMT)
Resampled Datasets Are Not Enough: Mitigating Societal Bias Beyond Single Attributes [22.4]
我々は、保護されたグループと画像属性の急激な相関を取り除き、画像テキストデータセットの社会的バイアスに取り組む。テキスト誘導インペイントモデルを用いることで、すべての属性から保護されたグループ独立を保証し、データフィルタリングによるインペイントバイアスを軽減する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:06:43 GMT)
Improved Implicit Neural Representation with Fourier Reparameterized Training [21.9]
Inlicit Neural Representation (INR)は、近年様々なコンピュータビジョンタスクにおいて、強力な表現パラダイムとして成功している。既存の手法では、INRの精度を向上させるため、位置符号化や周期的アクティベーション関数といった高度な手法が研究されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:24:03 GMT)
CQIL: Inference Latency Optimization with Concurrent Computation of Quasi-Independent Layers [21.9]
大規模言語モデルは、ほぼすべての自然言語処理タスクで前例のないパフォーマンスを実現している。圧倒的な複雑さは、ユーザエクスペリエンスに悪影響を及ぼす高い推論遅延を引き起こします。推定遅延を著しく低減するために並列に計算できる準独立層を同定することを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:17:15 GMT)
Using generative AI to investigate medical imagery models and datasets [21.8]
AIベースのモデルの信頼性を高めるには、説明が必要だ。本稿では,チームベースの専門知識を活用した視覚的自動説明手法を提案する。 3つの医用画像モダリティにまたがる8つの予測課題について実験を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:45:05 GMT)
Unveiling Scoring Processes: Dissecting the Differences between LLMs and Human Graders in Automatic Scoring [21.8]
大規模言語モデル(LLM)は、構築された応答評価のための自動スコアリングを行う上で、強力な可能性を示している。人間によってランク付けされた構築された応答は、通常、与えられた格付けされたルーリックに基づいているが、LSMがスコアを割り当てる方法はほとんど不明である。本稿では,理科の課題に対する学生の書面回答と人間のスコアとの整合性を評価するために,LLMが用いたグレーディングルーブリックを明らかにする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:26:20 GMT)
Is Your AI-Generated Code Really Safe? Evaluating Large Language Models on Secure Code Generation with CodeSecEval [21.0]
大規模言語モデル(LLM)は、コード生成とコード修復に大きな進歩をもたらした。しかし、GitHubのようなオープンソースのリポジトリから無防備なデータを使用したトレーニングは、セキュリティ上の脆弱性を必然的に伝播するリスクを増大させる。我々は,コードLLMのセキュリティ面を正確に評価し,拡張することを目的とした総合的研究を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:59:31 GMT)
LEGO: Learning and Graph-Optimized Modular Tracker for Online Multi-Object Tracking with Point Clouds [20.7]
本稿では,データアソシエーション性能を向上させるための学習とグラフ最適化(LEGO)モジュールトラッカーを提案する。提案するLEGOトラッカーは,グラフ最適化と自己認識機構を統合し,アソシエーションスコアマップを効率的に定式化する。提案手法は,他のオンライントラッキング手法と比較して,優れた性能を示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:18:04 GMT)
POSTURE: Pose Guided Unsupervised Domain Adaptation for Human Body Part Segmentation [20.7]
Hunderlineuman Body Paunderlinert Sunderlineegmentation に対する POSTURE: UnderlinePose Guided Ununderlinesupervised Domain Adapunderlinetation について紹介する。これは、ラベルのないターゲットデータのセグメンテーション性能を改善するために設計された、革新的な擬似ラベリング手法である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 00:06:59 GMT)
Diverse and Fine-Grained Instruction-Following Ability Exploration with Synthetic Data [20.5]
本稿では,細粒度で多彩なインストラクションフォロー評価データセットであるINGOを紹介する。実世界のユーザリクエストから派生した130ノードからなる、手動で注釈付き、きめ細かな、マルチレベルのカテゴリツリーに基づいている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:54:41 GMT)
Reduced-Order Neural Operators: Learning Lagrangian Dynamics on Highly Sparse Graphs [20.3]
流体流動, 粒状流, 弾塑性などのラグランジアン力学をシミュレートするニューラル演算子アーキテクチャを提案する。我々のモデルであるGIOROMは、時間的ダイナミクスを低次設定で学習し、高度にスパースなグラフ表現から空間的特徴をキャプチャする。 10万点の点雲は、$sim$1000のスパースグラフから推測でき、時間的変化は無視できる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:37:26 GMT)
A Survey of Data Synthesis Approaches [20.2]
1)多様性の向上,2)データバランシング,3)ドメインシフトへの対応,4)エッジケースの解決。本稿では, 合成データの今後の方向性と, 重要な3つの方向性についても論じる: 1) 品質, 2) 合成データの評価, 3) マルチモデルデータ拡張。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:37:09 GMT)
Multi-Time Scale Service Caching and Pricing in MEC Systems with Dynamic Program Popularity [20.1]
モバイルエッジコンピューティングシステムでは、ベースステーション(BS)は、タスク実行時間を短縮するためにコンピューティングサービスを提供する。 BSは自身の利益を最大化するためにユーザ需要に基づいてサービスプログラムを価格設定し、ユーザは価格に基づいてオフロード戦略を決定してコストを最小化する。サービスキャッシング,価格設定,タスクオフロードを共同で最適化する,2段階のスケールフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:23:56 GMT)
Continual Learning Optimizations for Auto-regressive Decoder of Multilingual ASR systems [20.1]
継続学習(CL)は、事前学習されたデータの性能を維持しながら、新しいデータで訓練済みモデルを微調整する。自動回帰デコーダのMASRモデルにおける4つの最適化を提案する。 Common VoiceデータセットからWhisperを10の未確認言語に適応させる実験では、これらの最適化により、事前訓練された言語の平均単語誤り率(AWER)が、Experience Replayと比較して14.2%から12.4%に低下することが示されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:35:47 GMT)
Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.9]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:01:10 GMT)
Robust Validation: Confident Predictions Even When Distributions Shift [19.3]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:42:03 GMT)
Pseudo-Labeling by Multi-Policy Viewfinder Network for Image Cropping [19.1]
我々は,ラベル付きデータとラベルなしデータの両方を併用して,画像収穫モデルのトレーニングデータの規模を拡大する可能性を探る。このアイデアは、教師モデルによってラベルのないデータのための擬似ラベルを作成し、これらの擬似ラベルで学生モデルを訓練する、擬似ラベル方式で実装することができる。本稿では,教師からの擬似ラベルの誤りを正すために,多種多様な修正ポリシーを提供する多言語ビューファインダーネットワーク(MPV-Net)を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:52:38 GMT)
Feedback-guided Domain Synthesis with Multi-Source Conditional Diffusion Models for Domain Generalization [19.0]
ドメイン一般化技術は、トレーニング中に新しいデータ分布をシミュレートすることで、モデルロバスト性を高めることを目的としている。拡散モデルを用いて新しい領域のサンプルを合成する新しい戦略であるFDSを提案する。元のサンプルでトレーニングされたモデルに分類課題を呈する画像と、元のデータセットを併用することにより、幅広い分布スペクトルにまたがるトレーニングセットの生成を確実にする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:45:29 GMT)
Decision-Focused Evaluation of Worst-Case Distribution Shift [19.0]
本稿では,予測資源割り当て設定における最悪の分散シフトを特定するための新しいフレームワークを提案する。本稿では,この問題を部分モジュラー最適化問題として再定義し,最悪の場合の損失を効率的に近似できることを示す。実データに私たちのフレームワークを適用すると、あるメトリクスによって識別される最悪のケースシフトが、他のメトリクスによって識別される最悪のケース分布と著しく異なるという経験的な証拠が得られます。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:00:53 GMT)
Towards Arbitrary-Scale Histopathology Image Super-resolution: An Efficient Dual-branch Framework via Implicit Self-texture Enhancement [18.9]
Inlicit Self-Texture Enhancement-based dual-branch framework (ISTE) を提案する。 ISTEには、まずピクセルの特徴とテクスチャの特徴を学習するテクスチャ学習ブランチと、画素学習ブランチが含まれている。我々はISTEが既存の固定スケールおよび任意のスケールのアルゴリズムを複数の倍率で上回ることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:41:53 GMT)
GPT-4 vs. Human Translators: A Comprehensive Evaluation of Translation Quality Across Languages, Domains, and Expertise Levels [18.8]
本研究では,人間の翻訳者に対するLarge Language Models(LLMs)の翻訳品質を包括的に評価する。また, GPT-4は, 中高の翻訳者よりも遅れが小さいため, 中高の翻訳者に対して同等に機能することがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:58:04 GMT)
Line Drawing Guided Progressive Inpainting of Mural Damage [18.8]
線画ガイドによるプログレッシブ壁画の塗装法を提案する。塗装工程は、構造復元と色補正の2段階に分けられる。提案手法は,現在の画像塗装法に対して評価される。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:15:22 GMT)
Deep Temporal Sequence Classification and Mathematical Modeling for Cell Tracking in Dense 3D Microscopy Videos of Bacterial Biofilms [18.6]
そこで我々はDenseTrackという新しいセル追跡アルゴリズムを提案する。 DenseTrackは、ディープラーニングと数学的モデルベースの戦略を統合して、連続するフレーム間の対応を確立する。固有分解に基づく細胞分裂検出戦略を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:58:27 GMT)
CLIcK: A Benchmark Dataset of Cultural and Linguistic Intelligence in Korean [18.5]
韓国における1,995対のQAペアからなる文化・言語知能のベンチマークについて紹介する。 CLIcKは、公式の韓国の試験と教科書からデータを入手し、質問を言語と文化の2つの主要なカテゴリで11のカテゴリに分けている。 CLIcKを用いて、13の言語モデルを用いて、パフォーマンスを評価する。評価では、カテゴリ間でのパフォーマンスに関する洞察と、その理解に影響を与えるさまざまな要因を明らかにする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:08:19 GMT)
Robust Adaptation of Foundation Models with Black-Box Visual Prompting [18.2]
本研究は,大規模事前学習モデル (PTM) を効率的に適応するブラックボックス視覚プロンプト (Black-box visual prompting, BlackVIP) を提案する。 BlackVIPは、(1)座標と(2)勾配補正による同時近似(SPSA-GC)の2つの成分を持つ。 19のデータセットの実験では、BlackVIPは、最小限のメモリ要件で、さまざまなドメインやタスクへの堅牢な適応を可能にすることが示されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:35:00 GMT)
Object-Centric Relational Representations for Image Generation [18.1]
本稿では,オブジェクト中心のリレーショナル表現に基づく条件画像生成手法を提案する。このようなアーキテクチャバイアスには,生成過程の操作と条件付けを容易にする特性が伴うことを示す。また,関係表現と組み合わせた画像の合成データセットからなる画像生成のための新しいベンチマークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:27:33 GMT)
Robust Pivoting Manipulation using Contact Implicit Bilevel Optimization [17.7]
汎用的な操作には、ロボットが新しいオブジェクトや環境と対話する必要がある。不確実性の存在下でのピボット操作計画のための頑健な最適化について検討する。操作中の物理特性の推定における不正確さを補うために、摩擦をどのように活用できるかについての知見を提示する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:51:09 GMT)
MobileExperts: A Dynamic Tool-Enabled Agent Team in Mobile Devices [17.7]
本稿では,ツールの定式化とマルチエージェントコラボレーションを初めて導入するMobileExpertsを紹介する。我々は,専門家同士の協調関係を確立するための二重層計画機構を開発する。実験の結果,MobileExpertsはすべてのインテリジェンスレベルにおいて優れた性能を示し,推論コストの22%削減を実現している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:12:19 GMT)
AutoSplat: Constrained Gaussian Splatting for Autonomous Driving Scene Reconstruction [17.6]
AutoSplatは、自動走行シーンの高度に現実的な再構築を実現するために、ガウシアンスプラッティングを使用したフレームワークである。本手法は,車線変更を含む課題シナリオの多視点一貫したシミュレーションを可能にする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:18:54 GMT)
MRIR: Integrating Multimodal Insights for Diffusion-based Realistic Image Restoration [17.5]
マルチモーダルなインサイトを持つ拡散型復元法であるMRIRを提案する。テキストレベルでは、訓練済みのマルチモーダル大言語モデルのパワーを利用して、低品質の画像から意味のある意味情報を推測する。視覚レベルでは、主にピクセルレベルの制御に焦点を合わせ、Pixelレベルのプロセッサと制御ネットを用いて空間構造を制御する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:55:14 GMT)
Improved Operator Learning by Orthogonal Attention [17.4]
我々は、カーネル積分作用素の固有分解と固有関数のニューラル近似に基づいて注意を喚起する。我々の手法は、競合するベースラインを十分なマージンで上回ることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:20:40 GMT)
Using Large Language Models to Assist Video Content Analysis: An Exploratory Study of Short Videos on Depression [17.4]
我々は,Large Language Models (LLMs) を用いたマルチモーダルコンテンツ分析の新しいワークフローに従って,ケーススタディを実施している。 LLMのビデオアノテーション機能をテストするために,うつ病に関する25の短いビデオから抽出した203を解析した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:47:41 GMT)
AViTMP: A Tracking-Specific Transformer for Single-Branch Visual Tracking [17.1]
本稿では,AViTMP(Adaptive ViT Model Prediction Tracker)を提案する。この方法は、初めて識別モデルで単一ブランチネットワークをブリッジする。 AViTMPは、特に長期追跡とロバスト性の観点から、最先端のパフォーマンスを実現していることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:37:57 GMT)
Slice-100K: A Multimodal Dataset for Extrusion-based 3D Printing [16.9]
Gコード(Geometric code)またはRS-274は、最も広く使われているコンピュータ数値制御(CNC)および3Dプリンティング言語である。現在、加法製造用のGコードファイルとともに、キュレートされたCADモデルの大規模なリポジトリは存在しない。本稿では,10000以上のGコードファイルからなる最初期のデータセットであるSLICE-100KとCADモデルについて述べる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:52:25 GMT)
A New Optimization Model for Multiple-Control Toffoli Quantum Circuit Design [16.8]
本稿では,可逆ブール関数に対するMCT量子回路設計問題について紹介する。新しい最適化モデルと対称性を破る制約を導入し、最大2桁の解時間を改善する。最大7量子ビットと最大15個の量子ゲートを使った実験は、いくつかの新しいよく知られた回路をもたらす。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 19:37:44 GMT)
EffiBench: Benchmarking the Efficiency of Automatically Generated Code [16.2]
EffiBenchは1,000の効率クリティカルコーディング問題のあるベンチマークである。それぞれの問題は、実行可能な人間記述の標準解とペアリングされる。我々は42の大規模言語モデルによる効率的なコード生成能力を実証的に検証した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:55:05 GMT)
FedCross: Towards Accurate Federated Learning via Multi-Model Cross-Aggregation [16.0]
フェデレートラーニング(FL)は、ユーザのプライバシを損なうことなく、データサイロ問題に対処するために注目を集めている。我々はFedCrossという名前の効率的なFLフレームワークを提案する。このフレームワークは、提案したマルチモデルクロスアグリゲーションアプローチに基づいた、新しいマルチツーマルチFLトレーニングスキームを使用する。 We show that FedCross can significantly improve FL accuracy in both IID and non-IID scenarios without causing additional communication overhead。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:58:58 GMT)
On the Effectiveness of Acoustic BPE in Decoder-Only TTS [16.0]
音声をトークン化しデコーダのみのモデルで生成することは、テキスト音声(TTS)と音声言語モデリング(SLM)にとって有望な方向である。音声トークンのシーケンス長を短くするため、SLMでは、自己教師付き意味表現から音声トークンを文字として扱い、さらにトークンシーケンスを圧縮する音響バイトペア符号化(BPE)が出現している。意味的音声トークンを持つデコーダのみのTSモデルにおいて,音響的BPEの様々な設定について検討を行い,その有効性を検討した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:35:32 GMT)
MSfusion: A Dynamic Model Splitting Approach for Resource-Constrained Machines to Collaboratively Train Larger Models [16.0]
我々は,資源制約マシン上で大規模モデルを学習するための,効果的かつ効率的な協調学習フレームワークであるMSfusionを紹介する。各トレーニングラウンドでは、各参加者は、ローカルデータをトレーニングするためにモデルパラメータのサブセットを割り当て、共通のパラメータ上の他のピアのサブモデルで集約される。画像およびNLPタスクの実験は、大規模モデルのトレーニングにおいて、MSfusionの性能と効率において重要な利点を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:06:24 GMT)
Defense Against Syntactic Textual Backdoor Attacks with Token Substitution [15.5]
トレーニング段階では、慎重に選択されたトリガを犠牲者モデルに組み込んで、特定のクラスと同じトリガを含む入力を誤って予測する。本稿では,構文ベースと特別なトークンベースのバックドア攻撃を効果的に対処する新しいオンライン防御アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:48:57 GMT)
PhotoBot: Reference-Guided Interactive Photography via Natural Language [15.5]
PhotoBotは、ハイレベルな人間の言語指導とロボット写真家との相互作用に基づく、完全な自動写真取得のためのフレームワークである。視覚言語モデル(VLM)とオブジェクトマニピュレータを用いて参照画像の特徴付けを行う。また、ユーザの言語クエリに基づいて、関連する参照画像を取得するために、LLM(Big Language Model)も使用しています。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:08:38 GMT)
Contrastive Neural Ratio Estimation for Simulation-based Inference [15.4]
Likelihood-to-evidence ratio Estimation は通常、バイナリ (NRE-A) またはマルチクラス (NRE-B) の分類タスクとしてキャストされる。バイナリ分類フレームワークとは対照的に、現在のマルチクラスバージョンの定式化は本質的で未知のバイアス項を持つ。我々は,NRE-Bに固有のバイアスを最適に含まないマルチクラスフレームワークを提案し,実践者が依存する診断を行う立場に置かれる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:34:31 GMT)
Spatio-Temporal Adaptive Diffusion Models for EEG Super-Resolution in Epilepsy Diagnosis [15.0]
HDデバイスは頭皮により多くの電極を配置することで脳波の空間分解能を向上させる。この技術は、高い取得コストや限られた使用量といった課題に直面している。本稿では,空間SR再構成を実現するために拡散モデルを用いた適応拡散モデルを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:11:57 GMT)
CLASH: Complementary Learning with Neural Architecture Search for Gait Recognition [14.9]
本研究では,高密度時空間場 (DSTF) とニューラルアーキテクチャ検索に基づく補完学習 (NCL) フレームワークを用いた歩行パターン型歩行記述法を提案する。具体的には、DSTFはスパース境界の表現を、ピクセルレベルでの歩行パターンに敏感な、密度の高い距離ベースのテクスチャに変換する。最新のIn-theldデータセットでは、それぞれGait3DとGREWで、最新のシルエットベースのメソッドを16.3%、19.7%上回りました。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:51:01 GMT)
Functional Faithfulness in the Wild: Circuit Discovery with Differentiable Computation Graph Pruning [14.6]
本稿では、DiscoGPとともにCircuit Discoveryと呼ばれるタスクを包括的に再構築する。 DiscoGPは、回路発見のための識別可能なマスキングに基づく、新しく効果的なアルゴリズムである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:42:25 GMT)
A Semantic-Aware Multiple Access Scheme for Distributed, Dynamic 6G-Based Applications [14.5]
本稿では,無線スペクトルへの多重アクセス問題に対する新しい定式化を提案する。その目的は、$alpha$-fairnessメトリックを使用して、使い勝手のトレードオフを最適化することにある。 Semantic-Aware Multi-Agent Double and Dueling Deep Q-Learning (SAMA-D3QL) 手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:48:25 GMT)
Malla: Demystifying Real-world Large Language Model Integrated Malicious Services [14.3]
我々は、212の現実世界のMallasに関する最初の体系的研究を行い、地下市場におけるその増殖を明らかにした。我々の研究は、Mallaエコシステムを明らかにし、その大きな成長と今日の公共LLMサービスへの影響を明らかにします。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 19:25:47 GMT)
CoMix: A Comprehensive Benchmark for Multi-Task Comic Understanding [14.2]
我々は,コミック分析におけるモデルのマルチタスク能力を評価するために,新しいベンチマークであるCoMixを導入する。本ベンチマークは,マルチタスク評価をサポートするアノテーションを拡張した既存の3つのデータセットからなる。マンガスタイルのデータの過剰表現を緩和するために、慎重に選択されたアメリカの漫画スタイルの本を新たにデータセットとして組み込んだ。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 00:07:50 GMT)
Dissipative time crystal in a strongly interacting Rydberg gas [14.1]
室温の原子ガス中におけるそのような散逸時間結晶秩序の実験的観察を報告する。観測された極限サイクルは、Rydberg成分間の共存と競合から生じる。振動の非脱落自己相関は、時間的ノイズに対する頑健性とともに、真の長距離時間的秩序の確立を示している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:59:56 GMT)
Stark: Social Long-Term Multi-Modal Conversation with Persona Commonsense Knowledge [14.0]
マルチモダリティフォーマット、時間間隔、イメージで、幅広いソーシャルペルソナをカバーするデータセットであるStarkを紹介した。 Starkを自動構築するために,新しいマルチモーダル文脈化フレームワークであるMcuを提案する。 Starkを使ってマルチモーダルな会話モデルUltron 7Bをトレーニングします。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:26:49 GMT)
Entity-Level Sentiment: More than the Sum of Its Parts [13.8]
文レベルでの感情の算術的アグリゲーションとは,エンティティに対する読者の知覚的感情がしばしば異なることを示す。我々のデータセットは、長いテキストでエンティティ固有の感情の複雑さを明らかにします。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:21:07 GMT)
A Survey on Statistical Theory of Deep Learning: Approximation, Training Dynamics, and Generative Models [13.3]
本稿では3つの観点から,ニューラルネットワークの統計理論に関する文献をレビューする。ニューラルネットワークの過剰なリスクに関する結果は、回帰または分類の非パラメトリックフレームワークでレビューされる。本稿では、GAN(Generative Adversarial Networks)、拡散モデル、Large Language Models(LLMs)におけるICL(In-context Learning)などの生成モデルにおける最新の理論的進歩について概説する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:36:06 GMT)
LoRA+: Efficient Low Rank Adaptation of Large Models [13.1]
低ランク適応(LoRA)は,大幅モデル(埋め込み次元)の最適下微細化につながることを示す。そこで, このLoRAの準最適性は, 適応行列 A と B の学習率を良好に設定することで, 簡単に補正可能であることを示す。我々の実験では、LoRA$+$は、LoRAと同じ計算コストで性能(1-2$%の改善)と微調整速度($sim$2X SpeedUpまで)を改善する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:33:00 GMT)
GVDIFF: Grounded Text-to-Video Generation with Diffusion Models [12.7]
本稿では,GVDIFFと呼ばれるグラウンドドテキスト・ビデオ生成フレームワークを提案する。対象物と接地条件を結びつける空間時空間接地層を導入し,空間時空間領域における接地生成能力を持つモデルを実現する。我々は、GVDIFFの基底生成能力を広く評価し、長距離ビデオ生成、シーケンシャルプロンプト、オブジェクト固有の編集など、その汎用性を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:54:12 GMT)
Improving Efficiency of Diffusion Models via Multi-Stage Framework and Tailored Multi-Decoder Architectures [12.7]
拡散モデルは強力な深層生成ツールとして登場し、様々な応用に優れている。しかし、その顕著な生成性能は、遅いトレーニングとサンプリングによって妨げられている。これは、広範囲の前方および逆拡散軌道を追跡する必要があるためである。本稿では,これらの課題に対処するための経験的知見から着想を得た多段階フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:52:58 GMT)
CRiM-GS: Continuous Rigid Motion-Aware Gaussian Splatting from Motion Blur Images [12.6]
画像のぼやけた画像からリアルタイムレンダリング速度で正確な3Dシーンを再構成するために, 連続的な剛性運動対応ガウススプラッティング(CRiM-GS)を提案する。我々は、剛体変換を利用して、物体の形状と大きさを保存し、適切な正則化でカメラの動きをモデル化する。さらに,textitSE(3)フィールドに連続的な変形可能な3次元変換を導入し,剛体変換を実世界の問題に適用する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:37:04 GMT)
Looking for Tiny Defects via Forward-Backward Feature Transfer [12.4]
そこで本研究では,従来の高解像度画像と地中トラスマスクの手法を評価する新しいベンチマークを提案する。私たちのベンチマークには、欠陥サイズに関する堅牢性をキャプチャするメトリクスが含まれています。提案手法は,欠陥サイズに対する高いロバスト性,高速動作,最先端セグメンテーション性能を特徴とする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:59:26 GMT)
A framework for annotating and modelling intentions behind metaphor use [12.4]
本稿では,9つのカテゴリーから構成されるメタファーに起因した意図の新たな分類法を提案する。また、メタファの使用の背後にある意図に注釈を付けた最初のデータセットもリリースしました。このデータセットを用いて、メタファー使用の背景にある意図を、ゼロテキストおよびインコンテキストの少数ショット設定で推測する際の、大きな言語モデル(LLM)の機能をテストする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:13:57 GMT)
UniPlane: Unified Plane Detection and Reconstruction from Posed Monocular Videos [12.3]
単眼ビデオから平面検出と再構成を統一する新しい手法であるUniPlaneを提案する。我々はトランスフォーマーベースのディープニューラルネットワークを構築し、環境のための3D機能ボリュームを共同で構築する。実世界のデータセットの実験では、UniPlaneは平面検出と再構成の両方において最先端の手法より優れていることが示されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:02:27 GMT)
Privacy-Preserving Heterogeneous Federated Learning for Sensitive Healthcare Data [12.3]
我々は、AAFV(Abstention-Aware Federated Voting)と呼ばれる新しいフレームワークを提案する。 AAFVは、データのプライバシを同時に保護しながら、共同で機密的に異質なローカルモデルをトレーニングすることができる。特に,提案手法では,不均一な局所モデルから高信頼投票を選択するために,しきい値に基づく棄権方式を採用している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:10:00 GMT)
ALOHA: from Attention to Likes -- a unified mOdel for understanding HumAn responses to diverse visual content [12.3]
ALOHA - 人間の反応を注目から好意へ理解するための統一モデルを提案する。 ALOHAは、アテンションヒートマップ、スキャンパス、視聴順序などの異なる人間の反応を予測し、主観的評価/評価を行う。潜在的なアプリケーションには、UI/デザイン/イメージの有効性に関する即時フィードバックの提供や、視覚コンテンツ生成をさらに最適化するための報酬モデルとしての役割などが含まれる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:01:48 GMT)
Hierarchical Gaussian Mixture Normalizing Flow Modeling for Unified Anomaly Detection [12.1]
本稿では,一貫した異常検出を実現するための新しい階層型ガウス混合流れモデリング法を提案する。我々のHGADは,クラス間ガウス混合モデリングとクラス内混合クラスセンター学習の2つの重要な構成要素から構成されている。提案手法を4つの実世界のADベンチマークで評価し,従来のNFベースのAD手法を大幅に改善し,SOTA統合AD手法よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:07:12 GMT)
On the Workflows and Smells of Leaderboard Operations (LBOps): An Exploratory Study of Foundation Model Leaderboards [12.0]
本研究は、これらのFMリーダーボードが現実世界のシナリオでどのように動作するかを理解することに焦点を当てる("clainboard operations")。 5つのユニークなワークフローパターンを特定し、FMリーダーボード内で必要不可欠なコンポーネントとその相互作用を概説するドメインモデルを構築します。次に、LBOpsで8種類のリーダーボードの匂いを識別します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:12:00 GMT)
RareBench: Can LLMs Serve as Rare Diseases Specialists? [11.8]
Generalist Large Language Models (LLMs) は、医学的診断を含む様々な領域において有望であることを示している。世界中で約3億人に影響を及ぼす希少な疾患は、しばしば不満足な臨床診断率を持つ。 RareBenchは、希少疾患の領域における4つの重要な次元におけるLSMの能力を評価するために設計された先駆的なベンチマークである。 GPT-4の診断能力と専門医との総合的な比較検討を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:10:17 GMT)
Out-of-distribution forgetting: vulnerability of continual learning to intra-class distribution shift [11.6]
連続学習(CL)は、人工ニューラルネットワークをオープン環境で動作させるための重要な技術である。共同学習において、意図的な攻撃や環境摂動はネットワークの一般化能力を著しく損なう。連続学習環境におけるOOD問題によって引き起こされた破滅的忘れの特殊な形態を報告する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:56:44 GMT)
Generative Technology for Human Emotion Recognition: A Scope Review [11.6]
本調査は,2024年6月までに320以上の研究論文を総合的に分析し,既存の文献のギャップを埋めることを目的としている。異なる生成モデルと一般的に使用されるデータセットの数学的原理を導入する。様々なモダリティに基づいて、生成技術がどのように感情認識に対処するかを詳細に分析する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:22:55 GMT)
Hierarchical Tree-structured Knowledge Graph For Academic Insight Survey [11.6]
調査は、研究トレーニングを欠いている初心者研究者にとって、常に課題となっている。本研究は,階層的な木構造知識グラフを確立することにより,初心者研究者を対象とした研究インサイトサーベイを支援することを目的とする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:54:25 GMT)
Long-range Meta-path Search on Large-scale Heterogeneous Graphs [11.5]
プログレッシブサンプリング(LMSPS)による長距離メタパス探索(Long-range Meta-path Search)と呼ばれる,異種グラフへの長距離依存を利用した自動フレームワークを提案する。サンプリング評価戦略により、LMSPSは特殊かつ効果的なメタパス選択を行い、効果的なメタパスのみを用いて再訓練し、コストと過度なスムーシングを緩和する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:09:06 GMT)
Reliable Projection Based Unsupervised Learning for Semi-Definite QCQP with Application of Beamforming Optimization [11.4]
本稿では,半定値制約を持つ特殊2次クラス(QCQP)について検討する。本稿では,高い性能の制約解を得るための有望な手法としてニューラルネットワーク(NN)を提案する。教師なし学習が使用されるため、NNはラベルなしで効果的に利用することができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:26:01 GMT)
The Solution for the CVPR2023 NICE Image Captioning Challenge [11.4]
我々はZero-shot Image Captioning Challengeの新たなフロンティアにソリューションを提示する。この課題には、多くのドメインからの新しい視覚的概念が含まれる。データレベルでは、Laion-5Bから外部トレーニングデータを収集する。モデルレベルでは、大規模な視覚言語事前学習モデルであるOFAを使用する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:56:16 GMT)
Breaking-Good: Explaining Breaking Dependency Updates with Build Analysis [11.4]
依存関係の更新は、新しい依存関係バージョンが既存のクライアントコードと互換性のない変更を導入したときに、コンパイルエラーを引き起こすことが多い。 Breaking-Goodは、更新を壊すための説明を自動的に生成するツールです。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:20:26 GMT)
MedRAT: Unpaired Medical Report Generation via Auxiliary Tasks [11.2]
本稿では、2つの異なるデータセットで利用可能な情報を活用する新しいモデルを提案する。我々のモデルはMedRATと呼ばれ、従来の最先端の手法を超越している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:31:47 GMT)
Logistics Hub Location Optimization: A K-Means and P-Median Model Hybrid Approach Using Road Network Distances [11.0]
ロジスティックハブは、最終マイルの配送距離において重要な役割を果たす。電子商取引業界は、都市環境における資源配分の最適化の必要性を強めている。本研究では,ロジスティックハブの配置を最適化するためにハイブリッドアプローチを用いる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:36:48 GMT)
Seeing Like an AI: How LLMs Apply (and Misapply) Wikipedia Neutrality Norms [11.0]
大規模言語モデル(LLM)は広義のコーパスで訓練され、特殊な規範を持つコミュニティで使用される。我々は,ウィキペディアのニュートラル・ポイント・オブ・ビュー(NPOV)ポリシーに従って,バイアス付きウィキペディア編集の検出と修正能力を評価する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:05:58 GMT)
SynA-ResNet: Spike-driven ResNet Achieved through OR Residual Connection [10.7]
スパイキングニューラルネットワーク(SNN)は、その生物学的忠実さとエネルギー効率のよいスパイク駆動操作を実行する能力のために、脳のような計算にかなりの注意を払っている。 ORRC(Residual Connection)を通じて大量の冗長情報を蓄積する新しいトレーニングパラダイムを提案する。次に,SynA(SynA)モジュールを用いて冗長情報をフィルタリングし,背骨における特徴抽出を促進するとともに,ショートカットにおけるノイズや無駄な特徴の影響を抑える。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:55:58 GMT)
M$\mathbf5$ -- A Diverse Benchmark to Assess the Performance of Large Multimodal Models Across Multilingual and Multicultural Vision-Language Tasks [10.7]
M5は多言語コンテキストにおける様々な視覚・運動タスクのLMMを評価するために設計された最初の総合ベンチマークである。ハイソース言語と低リソース言語のタスクに依存しないパフォーマンスの相違を強調した。より大規模なモデルは、多言語環境では必ずしもより小さなモデルよりも優れているとは限らないことを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:55:04 GMT)
Quantifying Prediction Consistency Under Model Multiplicity in Tabular LLMs [10.5]
微調整された大きな言語モデルは、同じ入力で矛盾する予測を行うような、テクティファインチューニングの多重性につながる可能性がある。これにより、Tabular LLMの堅牢性と信頼性に関する重要な懸念が持ち上がる。本研究は,コストのかかるモデル再訓練を伴わずに個々の予測の堅牢性を定量化する新しい指標を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:22:09 GMT)
Neural Probabilistic Logic Learning for Knowledge Graph Reasoning [10.5]
本稿では,知識グラフの正確な推論を実現するための推論フレームワークを設計することを目的とする。本稿では,組込みネットワークの表現力を効果的に向上するスコアリングモジュールを提案する。我々は,変分推論に基づくマルコフ論理ネットワークを組み込むことにより,モデルの解釈可能性を向上させる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:45:46 GMT)
Can Bell inequalities be tested via scattering cross-section at colliders ? [10.5]
粒子生成と崩壊を標準量子論と同じ散乱断面積で再現できる特定のLHVMを提案する。散乱断面によるスピン相関の再構成は、LHVMの幅広いクラスを除外できる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:06:55 GMT)
Evaluating Language Model Context Windows: A "Working Memory" Test and Inference-time Correction [10.4]
大規模言語モデルは現実世界のアプリケーションで顕著に使われ、しばしば大量の文書を推論する。本稿では,標準テストの限界に対処する評価フレームワークであるSWiMを提案する。また,この効果を緩和する,単純かつ効果的なトレーニングフリーアプローチであるメドイド投票を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:46:20 GMT)
Bridging Data Gaps in Healthcare: A Scoping Review of Transfer Learning in Biomedical Data Analysis [10.2]
低リソース環境における臨床および生医学的な研究は、有効なモデルを構築するのに十分なサンプルサイズを持つ高品質なデータを必要とするため、しばしば課題に直面している。これらの制約は、堅牢なモデルトレーニングを妨げ、研究者は、関連する研究から既存の知識を活用して新しい研究活動を支援する方法を模索する。機械学習技術であるトランスファーラーニング(TL)は、事前訓練されたモデルからの知識を活用して、新しいモデルの性能を向上させることで、強力なソリューションとして現れる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:34:20 GMT)
ReDiFine: Reusable Diffusion Finetuning for Mitigating Degradation in the Chain of Diffusion [10.2]
拡散モデルは画像の生成モデリングにおいて著しく改善されている。画像の品質はしきい値に達し、合成画像を再利用して機械学習モデルを再び訓練することができる。本稿では,事前訓練されたテキスト・画像拡散モデルが,一連の合成画像を用いて反復的に微調整される現実的なシナリオに焦点を当てる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:41:54 GMT)
Unsupervised Analysis of Alzheimer's Disease Signatures using 3D Deformable Autoencoders [10.1]
MORPHADEは3次元T1重み付き脳画像の解析に変形を利用する新しい教師なし学習手法である。これは、深い教師なし学習による変形を初めて検出し、またアルツハイマー病(AD)による脳の構造変化の重症度を局所化し評価する。提案手法は,AD検出において0.80のAUROCを達成し,教師なしベースラインや教師なしベースラインよりも優れていた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:52:44 GMT)
An Uncertainty-guided Tiered Self-training Framework for Active Source-free Domain Adaptation in Prostate Segmentation [10.1]
Source-free Domain Adaptation (SFDA)は、プライバシとセキュリティ上の問題に対処するために、深いセグメンテーションモデルを適用するための有望なテクニックである。安定したドメイン適応を実現するための新しい不確実性誘導型自己学習(UGTST)フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:11:49 GMT)
Practical asynchronous measurement-device-independent quantum key distribution with advantage distillation [10.0]
アドバンスト蒸留法は量子鍵分布(QKD)の性能向上に有効であることが証明された。我々は最近提案された非同期計測デバイス非依存QKDプロトコルにAD法を導入し、有限キー効果を考慮した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:51:21 GMT)
Text2TimeSeries: Enhancing Financial Forecasting through Time Series Prediction Updates with Event-Driven Insights from Large Language Models [10.0]
本稿では,関連事象に関するテキスト情報を組み込んだ協調モデリングフレームワークを提案する。我々は、将来の変更に関する大規模言語モデルの直感を活用して、実数時系列の予測を更新する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:21:38 GMT)
On Temperature Scaling and Conformal Prediction of Deep Classifiers [10.0]
この目的のための2つの一般的なアプローチは、(1)最大値が正当性確率をより正確に推定するように分類器のソフトマックス値を変更すること、(2)整形予測(CP):真のラベルを含む候補ラベルの予測セットをユーザ特定確率で生成することである。実際には、どちらの種類の表示も望ましいが、今のところ両者の相互作用は研究されていない。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:59:21 GMT)
First Place Solution of 2023 Global Artificial Intelligence Technology Innovation Competition Track 1 [9.9]
我々は,グローバル人工知能技術革新コンペティショントラック1のチャンピオンソリューションを提示する。我々はテキスト生成タスクのベースモデルとしてCPT-BASEを選択する。驚いたことに、我々のシングルモデルはリーダーボードAで2.321点を獲得し、複数のモデル融合スコアはAとBのリーダーボードで2.362点と2.320点である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:53:07 GMT)
Vision Mamba for Classification of Breast Ultrasound Images [9.9]
MambaベースのモデルであるVMambaとVimは、最近のビジョンエンコーダのファミリーであり、多くのコンピュータビジョンタスクで有望なパフォーマンス改善を提供する。本稿では,マンバをベースとしたモデルと従来の畳み込みニューラルネットワーク(CNN)と乳房超音波BUSIとBデータセットを用いた視覚変換器(ViT)を比較した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 00:21:47 GMT)
Understanding Biases in ChatGPT-based Recommender Systems: Provider Fairness, Temporal Stability, and Recency [9.9]
本稿では,ChatGPTに基づく推薦システムにおけるバイアスについて考察し,提供者フェアネス(イテム側フェアネス)に着目した。最初の実験では、トップK推薦の精度と公平性について、7つの異なるプロンプトシナリオを評価した。フェアネスを「フェアレコメンデーターとしての行動」のようなシステムの役割に組み込むことは、プロンプト内のフェアネスディレクティブよりも効果的であることが証明された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:59:01 GMT)
Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.8]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:28:52 GMT)
Distributed Exact Generalized Grover's Algorithm [9.7]
本稿では,汎用探索問題の解法として,分散Exactized Grover's Algorithm (DEGGA)を提案する。我々のアルゴリズムは、目標状態が100%$の理論的確率で精度を保証します。我々の方法は合計$n$ qubitsを必要とし、補助的なqubitsは不要である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:39:46 GMT)
Classification-Based Automatic HDL Code Generation Using LLMs [9.6]
大規模言語モデル(LLM)は、デジタル回路用のハードウェア記述言語(HDL)コードを生成する能力を実証している。 LLMは幻覚の問題に悩まされ、誤ったHDLコードの生成や仕様の誤解につながる。我々は,LLMの幻覚を緩和し,HDLコード生成の性能を向上させるために,人間の専門性に着想を得た手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:00:13 GMT)
Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.6]
連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:29:05 GMT)
Holistic view of the road transportation system based on real-time data sharing mechanism [9.5]
本稿では,リアルタイム共有機構に基づく道路交通システムの時空グローバルビューを構築する。道路利用者と管理者の両方が、近くの車両の運転意図や道路インフラのリアルタイム状態にタイムリーにアクセスできる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:47:50 GMT)
Quantum phase transition in a quantum Rabi square with next-nearest-neighbor hopping [9.5]
4つの量子ラビ系のうち、最も近い隣り合う光子ホッピングと次の隣り合う光子ホッピングを許容する量子ラビ正方形モデルを提案する。反強磁性超ラジアント相とフラストレーションされた超ラジアント相との1次相転移を実現する。量子シミュレーションや量子材料を応用した量子制御を実現するために,次のアレスト近傍ホッピングがゲージ位相の代替となる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:45:22 GMT)
Augmenting LLMs to Repair Obsolete Test Cases with Static Collector and Neural Reranker [9.4]
本稿では, TROCtx の精密かつ簡潔な構築により, 旧来の検査ケースを自動的に修復する新しい手法である SynBCIATR を提案する。開発者のプログラミングプラクティスに触発されて、クラスコンテキスト、使用コンテキスト、環境コンテキストの3つのタイプのTROCtxを設計しました。 SynBCIATRによるTROCtxの増強により、幻覚は57.1%減少する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:24:43 GMT)
reBEN: Refined BigEarthNet Dataset for Remote Sensing Image Analysis [9.3]
BigEarthNetは、リモートセンシング画像解析のためのディープラーニング(DL)研究を支援するために構築された、大規模でマルチモーダルなリモートセンシングデータセットである。 reBENデータセットは、Sentinel-1とSentinel-2の画像パッチの549,488対で構成されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:48:28 GMT)
BasisN: Reprogramming-Free RRAM-Based In-Memory-Computing by Basis Combination for Deep Neural Networks [9.2]
本研究では,任意のクロスバー上のディープニューラルネットワーク(DNN)をリプログラミングせずに高速化するBasisNフレームワークを提案する。その結果, クロスバーに再プログラミングを適用する場合と比較して, 推論毎のサイクルとエネルギー遅延生成物は1%以下に削減された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:47:05 GMT)
Orthogonal Constrained Minimization with Tensor $\ell_{2,p}$ Regularization for HSI Denoising and Destriping [9.2]
ハイパースペクトル画像(HSI)は、ガウスノイズ、デッドライン、ストライプなどの混合ノイズによって汚染されることが多い。我々は,NLTL2pと呼ばれるHSIデノベーションとデトリップのための新しいアプローチを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:33:19 GMT)
Registration by Regression (RbR): a framework for interpretable and flexible atlas registration [9.1]
本稿では, レジストレーションによるレジストレーション(RbR)を提案する。 RbR は入力スキャンの各ボクセルのアトラス座標(すなわち、各ボクセルはキーポイント)を予測し、その後、クローズドフォーム式を使用して変換を迅速に適合させる。独立した公開データセットの実験は、RbRが競合するキーポイントアプローチよりも正確な登録を得ることを示している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:20:45 GMT)
Artificial Intelligence and Algorithmic Price Collusion in Two-sided Markets [9.1]
両市場において,Qラーニングを用いたAIエージェントが暗黙の共謀にどのように関与するかを検討する。我々の実験によると、AI駆動プラットフォームはBertrandの競合よりも高いコラシオンレベルを実現している。ネットワークの外部性の向上は、共謀を著しく向上させ、AIアルゴリズムがそれらを活用して利益を最大化することを示唆している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:57:56 GMT)
Is LLM-as-a-Judge Robust? Investigating Universal Adversarial Attacks on Zero-shot LLM Assessment [8.9]
LLM(Large Language Models)は、筆記試験やベンチマークシステムなどの実世界の状況で使用される強力なゼロショットアセスメントである。本研究では,LLMを判断し,膨らませたスコアを判断するために,短い普遍的対数句を欺くことができることを示す。判定-LLMは,絶対スコアリングに使用する場合,これらの攻撃に対して有意に感受性が高いことが判明した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:34:44 GMT)
Continuous-time q-Learning for Jump-Diffusion Models under Tsallis Entropy [8.9]
我々は,Tsallisエントロピー正規化の下で,q-関数とq-学習アルゴリズムを特徴付けることで,制御されたジャンプ拡散モデルの連続時間強化学習について検討した。これに対し、Tsallisエントロピーの下でq関数のマーチンゲール特性を確立し、ラグランジュ乗算器を明示的に導出できるか否かに応じて2つのq-ラーニングアルゴリズムを考案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:26:31 GMT)
Addressing Membership Inference Attack in Federated Learning with Model Compression [8.8]
機械学習のプライバシ保護ソリューションとしてフェデレートラーニング(FL)が提案されている。最近の研究によると、FLはメンバーシップ推論攻撃によってプライベートクライアントデータを漏洩させることができる。これらの攻撃の有効性は、クライアントのデータセットのサイズとモデルの複雑さと負の相関関係があることを示します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:33:33 GMT)
Fully Fine-tuned CLIP Models are Efficient Few-Shot Learners [8.7]
視覚言語モデル全体(VLM)の精巧な精細化によるタスク固有情報の取得について検討する。これらの問題を緩和するために,識別的視覚テキストタスクを設計するCLIP-CITEというフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:22:54 GMT)
On the Benchmarking of LLMs for Open-Domain Dialogue Evaluation [8.7]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な機能を示した。本稿では,現在の評価ベンチマークを批判的に検討し,従来の応答生成器の使用と品質面が,現代のチャットボットの機能を正確に反映できないことを強調した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:14:47 GMT)
STOC-TOT: Stochastic Tree-of-Thought with Constrained Decoding for Complex Reasoning in Multi-Hop Question Answering [8.5]
マルチホップ質問応答(MHQA)は、複雑な質問に答えるために複数の通路から情報を検索し統合するモデルを必要とする。近年のシステムでは、大規模言語モデルのパワーを活用し、証拠検索と推論のプロンプトを統合している。 MHQAの制約付き復号法であるSTOC-TOTを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:17:53 GMT)
Socialz: Multi-Feature Social Fuzz Testing [8.4]
Socialzはソーシャルファズテストの新しいアプローチである。我々は,ソーシャルテストツールを皆の手に置き,世界中のソーシャルネットワークの信頼性とセキュリティを向上させることを目的としている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:33:55 GMT)
DSLR: Document Refinement with Sentence-Level Re-ranking and Reconstruction to Enhance Retrieval-Augmented Generation [8.3]
textittextbfDSLRは、検索した文書を文に分解し、無関係な文をフィルタリングし、それらを再び一貫性のある文に再構成する、教師なしのフレームワークである。我々は,複数のオープンドメインQAデータセットに対してtextitDSLRを実験的に検証し,その結果から従来の固定サイズパスよりもRAG性能を著しく向上させることを示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:30:04 GMT)
Improving Self Consistency in LLMs through Probabilistic Tokenization [8.0]
本稿では,現代言語モデルの複数トークン化機能を活用する新しい手法を提案する。確率的トークン化を利用する場合, LLMは論理的に多様な推論経路を生成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:52:48 GMT)
Zero-shot Persuasive Chatbots with LLM-Generated Strategies and Information Retrieval [7.9]
大規模言語モデル(LLM)の一般化可能性と本質的な説得能力を活用する手法を提案する。提案手法は,まず LLM を用いて応答を生成し,次にフライ時に使用する戦略を抽出し,応答における不確定なクレームを,その戦略をサポートする検索事実に置き換える。シミュレーションと人間の会話に関する実験は、ゼロショットのアプローチが以前の作業よりも説得力があることを示している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:28:21 GMT)
Evaluation of Activated Sludge Settling Characteristics from Microscopy Images with Deep Convolutional Neural Networks and Transfer Learning [7.6]
本研究では, 活性汚泥沈降特性を評価するために, コンピュータビジョンに基づく革新的な手法を提案する。深層畳み込みニューラルネットワーク(CNN)モデルの伝達学習の実装により,既存の定量的画像解析技術の限界を克服することを目的とした。 Inception v3, ResNet18, ResNet152, ConvNeXt-nano, ConvNeXt-S などのCNNアーキテクチャを用いて, 汚泥沈降特性の評価を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:19:47 GMT)
Behavioural gap assessment of human-vehicle interaction in real and virtual reality-based scenarios in autonomous driving [7.6]
我々は,VR実験に携わる参加者の行動の相違を,等価な実世界の状況と比較して捉える概念である行動ギャップ(obactiveal gap)と呼ぶものを評価するための,最初の,革新的なアプローチを提案する。実験では、歩行者は異なる運転スタイルと外部ヒューマン・マシン・インタフェース(eHMI)の存在下で道路を横断しようとする。結果は、参加者がVRに対してより慎重で好奇心を持ち、そのスピードと判断に影響を与え、VRインターフェースが行動に大きく影響していることを示している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:20:17 GMT)
Modelling Quantum Transduction for Multipartite Entanglement Distribution [7.5]
超伝導とフォトニック技術は、量子インターネットにおいて重要な役割を果たすと想定されている。これらの技術のハイブリッド化は、超伝導量子ビットをネットワークを介して伝播可能な「フライング」量子ビットに変換する機能量子トランスデューサを必要とする(逆逆)。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:45:38 GMT)
Detect Closer Surfaces that can be Seen: New Modeling and Evaluation in Cross-domain 3D Object Detection [7.5]
本研究では,エゴ車両のセンサに近接する表面を検出する3次元物体検出モデルの能力を測定するための2つの指標を提案する。また、学習可能な近接面にもっと焦点を合わせるために、EdgeHeadという改良ヘッドも提案しています。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:06:16 GMT)
ParamNet: A Dynamic Parameter Network for Fast Multi-to-One Stain Normalization [7.4]
静止正規化は、デジタル病理画像の色と明るさの差を効果的に低減することができる。本研究では,動的パラメータネットワークを導入し,ParamNetと呼ばれる新しい染色正規化法を提案する。その結果、ParamNetは25秒で10万×100,000のスライド画像(WSI)を正規化できることがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:17:46 GMT)
Characteristics and prevalence of fake social media profiles with AI-generated faces [7.4]
生成人工知能(AI)の最近の進歩は、偽のソーシャルメディアアカウントを偽造する可能性を懸念している。本稿では,GAN(Generative Adrial Networks)が生成した人物のプロフィール画像を用いたTwitterアカウントの体系的解析を行う。我々は、詐欺、スパム、調整されたメッセージの増幅など、不正行為の拡散に使われていることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 00:30:41 GMT)
When LLM Meets Hypergraph: A Sociological Analysis on Personality via Online Social Networks [7.3]
本稿では,個人レベルのデータマイニングではなく,環境を考慮した視点で人格を社会学的に分析する枠組みを提案する。ハイパーグラフノードをユーザとし,ハイパーグラフのハイパーエッジをソーシャル環境とする,効果的なハイパーグラフニューラルネットワークを設計する。ユーザプロファイルデータ、性格特性、実世界のソーシャルプラットフォームから検出されたいくつかの環境を含む有用なデータセットを提供する。
論文参考訳（メタデータ） (Thu, 04 Jul 2024 01:43:52 GMT)
Filtered Direct Preference Optimization [7.1]
人間からのフィードバックからの強化学習(RLHF)は、言語モデルと人間の嗜好の整合において重要な役割を果たす。本稿では、直接選好最適化(DPO)に着目して、選好データセットにおけるテキスト品質の問題に対処する。フィルタされた直接選好最適化(fDPO)と呼ばれるDPOの拡張を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:40:53 GMT)
Stochastic Processes: From Classical to Quantum [7.0]
古典的プロセスの理論からいくつかのリマインダーから始めます。次に、量子力学と場の量子論を概観する。ボソンフォック空間とその計算に量子過程を導入する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:26:35 GMT)
A Survey on Natural Language Counterfactual Generation [7.0]
自然言語カウンターファクト生成は、修正されたテキストが別のクラスに分類されるように、与えられたテキストを最小限に修正することを目的としている。生成手法を4つのグループに分類する新たな分類法を提案し、生成品質を評価するための指標を体系的に要約する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:13:59 GMT)
Self Adaptive Threshold Pseudo-labeling and Unreliable Sample Contrastive Loss for Semi-supervised Image Classification [6.9]
擬似ラベルに基づく半教師付きアプローチは、画像分類において2つの問題に悩まされる。我々は,各クラスの閾値を動的に調整し,信頼性の高いサンプル数を増やす自己適応型閾値擬似ラベル戦略を開発した。しきい値以下でラベル付けされていないデータを効果的に活用するために、信頼できないサンプルコントラスト損失を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:04:56 GMT)
Attention Normalization Impacts Cardinality Generalization in Slot Attention [6.9]
Slot Attentionは、インプットイメージに対して教師なしのオブジェクト中心のシーン分解を実行するモジュールである。注目アーキテクチャにおける集約値の正規化に関する設計決定は、スロット注意の能力にかなりの影響を及ぼすことを示す。本稿では,スロットアテンションの一般化能力を,スロット数やオブジェクト数に拡張する代替正規化手法を提案し,検討する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:09:01 GMT)
Embodied AI in Mobile Robots: Coverage Path Planning with Large Language Models [6.9]
移動体エージェントのためのLLM方式の経路計画フレームワークを提案する。提案する多層アーキテクチャは,経路計画段階におけるLPMを用いて,移動エージェントの低レベルアクチュエータと統合する。本実験により,LLMの2次元平面推論能力と完全カバレッジパス計画タスクを改善することができることが示された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:42:58 GMT)
NutriBench: A Dataset for Evaluating Large Language Models in Carbohydrate Estimation from Meal Descriptions [6.7]
我々はNutriBenchについて紹介する。NutriBenchは、初めて公開された自然言語による食事記述に基づく栄養ベンチマークである。ヌトリベンチは、炭水化物、タンパク質、脂肪、カロリーを含む、マクロ栄養成分のラベルで、5,000人の人間によって検証された食事記述で構成されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:10:51 GMT)
A fast neural hybrid Newton solver adapted to implicit methods for nonlinear dynamics [6.6]
本稿では,厳密な時間進化非線形方程式に対する非線形時間ステップシステムのこの解を高速化するための,ニュートン法に基づく新しい演算子学習法を提案する。ニュートン法における量的改善率を示し、教師なし学習戦略の一般化誤差の上限を解析する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:02:10 GMT)
CardioSpectrum: Comprehensive Myocardium Motion Analysis with 3D Deep Learning and Geometric Insights [6.4]
従来のニューラルネットワークは微妙な接尾辞の動きを予測するのが難しい。この問題に対処するための包括的アプローチを提案する。私たちの3Dディープラーニングアーキテクチャは、ARFlowモデルに基づいて、複雑な3Dモーション分析タスクに最適化されています。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:57:44 GMT)
AutoBench: Automatic Testbench Generation and Evaluation Using LLMs for HDL Design [6.4]
テストベンチはシミュレーションベースのハードウェア検証の基礎となる。 LLM(Large Language Models)は、回路設計フローの自動化の可能性を実証している。デジタル回路設計のための最初のLCMベースのテストベンチジェネレータであるAutoBenchを紹介する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:33:56 GMT)
Green Multigrid Network [6.4]
グリーンラーニングネットワーク(GL)は物理空間におけるグリーン関数を学習し、偏微分方程式(PDE)の未知解作用素を捉えるための解釈可能なモデルとなる本論文では,グリーン関数の特異性を考慮した演算子学習アルゴリズムであるGreen Multigrid Network (GreenMGNet) を提案する。先駆的なGLと比較すると、新しいフレームワークは精度と効率が向上し、大幅な改善を実現している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:02:10 GMT)
Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions [6.3]
拡散モデル(DM)は画像データ拡張のための強力なツールとして登場した。 DMは、基礎となるデータ分布を学習することで、現実的で多様な画像を生成する。この分野における現在の課題と今後の研究方向性について論じる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:06:48 GMT)
CNG-SFDA: Clean-and-Noisy Region Guided Online-Offline Source-Free Domain Adaptation [6.2]
Source-Free Domain Adaptation (SFDA)は、ソースドメインのトレーニングされたモデルをターゲットドメインに採用することを目的としている。ターゲットドメインでの偽ラベルの扱いは、モデルのパフォーマンスに悪影響を及ぼすため、非常に重要です。オンライン/オフラインのSFDA設定において、複数のデータセットに対して広範な実験を行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:42:09 GMT)
Generalized Robust Fundus Photography-based Vision Loss Estimation for High Myopia [6.2]
VF推定の一般化ロバスト性を高めるための新しいパラメータ効率フレームワークを提案する。本手法は, RMSE, MAE, 係数相関において, 内部および外部の検証において, 既存の手法よりも優れていた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:39:19 GMT)
Presence or Absence: Are Unknown Word Usages in Dictionaries? [6.2]
我々は,フィンランド語,ロシア語,ドイツ語の共用課題であるAXOLOTL-24の評価を行った。未知の単語使用量と辞書エントリ間のマッピングを予測するために,グラフベースのクラスタリング手法を用いる。私たちのシステムはフィンランド語とドイツ語で第1位、ロシア語で第2位、Subtask 2テストフェーズのリーダーボードで第2位にランクインします。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:23:35 GMT)
ASteISR: Adapting Single Image Super-resolution Pre-trained Model for Efficient Stereo Image Super-resolution [6.2]
ステレオ画像超解像(SteISR)の領域に、事前訓練されたシングルイメージ超解像(SISR)トランスフォーマネットワークを転送する方法を提案する。具体的には、事前訓練されたSISRトランスネットワークに組み込まれたステレオアダプタと空間アダプタの概念を紹介する。このトレーニング手法を用いることで、Flickr1024データセット上のステレオ画像を正確に0.79dBの精度で推測するSISRモデルの能力を向上する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:12:05 GMT)
TrackPGD: A White-box Attack using Binary Masks against Robust Transformer Trackers [6.1]
トランスフォーマーバックボーンを持つオブジェクトトラッカーは、ビジュアルオブジェクト追跡データセットで堅牢なパフォーマンスを達成した。バックボーンの違いにより、対象追跡のために提案された敵対的ホワイトボックス攻撃は、あらゆる種類のトラッカーに転送できない。我々は,ロバストなトランスフォーマートラッカーを攻撃するために,予測対象のバイナリマスクに依存するTrackPGDという新しいホワイトボックス攻撃を提案している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:02:12 GMT)
The Structure of Financial Equity Research Reports -- Identification of the Most Frequently Asked Questions in Financial Analyst Reports to Automate Equity Research Using Llama 3 and GPT-4 [6.1]
この研究は72のERRの文を文単位で分析し、48.7%の文を169の質問アーチタイプに分類した。我々は質問を事前に定義しなかったが、ERRの声明からのみ派生した。この研究は、現在のERRの書き込みプロセスが、さらなる自動化、品質と効率の改善の恩恵を受ける可能性があることを裏付けている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:58:02 GMT)
It Ain't That Bad: Understanding the Mysterious Performance Drop in OOD Generalization for Generative Transformer Models [6.1]
大規模言語モデル (LLM) は多様な問題を解決するのに優れた能力を発揮している。しかし、それらの一般化能力は必ずしも満足しておらず、一般化問題は一般に生成トランスモデルに共通である。 n-digit操作のトレーニングモデルでは,n-digit入力に対してモデルが正常に一般化されるが,もっと長い,見えないケースではフェールすることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:32:57 GMT)
Feelings about Bodies: Emotions on Diet and Fitness Forums Reveal Gendered Stereotypes and Body Image Concerns [6.1]
我々は、ダイエット、フィットネス、関連するメンタルヘルス問題に関連する46のRedditディスカッションフォーラムを分析した。以上の結果から,女性指向のコミュニティは,特に薄めプロモーティングフォーラムにおいて,よりネガティブな感情を表現することが示唆された。また,心的健康問題に対する感情指標の性別パターンを明らかにするとともに,薄さ指向のコミュニティとより緊密に連携する深刻な問題について議論した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 00:11:27 GMT)
$\texttt{metabench}$ -- A Sparse Benchmark to Measure General Ability in Large Language Models [6.0]
大きな言語モデル(LLM)は、様々なタスクでその能力が異なる。これらのベンチマークを測る共通基盤能力の小さなセットがあることが示される。スパースベンチマークである$textttmetabench$を蒸留します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:57:38 GMT)
PFGS: High Fidelity Point Cloud Rendering via Feature Splatting [5.9]
スパースポイントから高品質な画像をレンダリングする新しいフレームワークを提案する。この手法はまず3次元ガウス格子と点雲のレンダリングを橋渡しする。異なるベンチマーク実験により、レンダリング品質と主成分の必要性の観点から、我々の手法の優位性を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:42:54 GMT)
HERA: High-efficiency Matrix Compression via Element Replacement [5.9]
大規模言語モデル(LLM)は、機械翻訳、テキスト生成、感情分析などの高度な自然言語処理タスクを持つ。数十億のパラメータで構成されるその大きなサイズは、ストレージ、計算、デプロイメントの課題を提起する。本稿では,行列の圧縮に Element Replacement を用いる新しいアルゴリズム HERA を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:13:58 GMT)
Query-Guided Self-Supervised Summarization of Nursing Notes [5.8]
本稿では,看護ノート要約のためのクエリ誘導型自己教師型ドメイン適応フレームワークQGSummを紹介する。本手法は,基準要約に頼らず,高品質で患者中心の要約を生成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:54:30 GMT)
Continuous-variable quantum digital signatures against coherent attacks [5.8]
量子デジタルシグネチャ(QDS)は、量子法則に基づく古典的メッセージの真正性、完全性、非再考を保証する。我々は,最先端の忠実度テスト関数を用いて,一般的なコヒーレント攻撃に耐えるように設計されたCV QDSプロトコルを提案する。その結果、メガビットメッセージ署名タスクにおいて、6桁以上の署名長が大幅に削減された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:39:59 GMT)
Establishing Provenance Before Coding: Traditional and Next-Gen Signing [5.7]
ソフトウェアエンジニアは、サードパーティのコンポーネントをアプリケーションに統合する。その結果、ソフトウェアサプライチェーンは脆弱である。攻撃面を減らすために、コンポーネント(性能)の起点を付加する前に検証できる。この記事では、従来の署名、その課題、次世代の署名プラットフォームによって導入された変更について説明する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:07:50 GMT)
Argument Mining in Data Scarce Settings: Cross-lingual Transfer and Few-shot Techniques [5.7]
また、Argument Miningでは、データ転送の方がモデル転送よりも優れた結果が得られることを示す。数秒間、タスクの種類(シーケンスの長さと複雑さ)とサンプリングメソッドが重要であることが証明されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:59:17 GMT)
Protecting Deep Learning Model Copyrights with Adversarial Example-Free Reuse Detection [5.7]
ディープニューラルネットワーク(DNN)の再利用と複製は、モデル所有者に著作権侵害と経済的損失をもたらす可能性がある。既存のホワイトボックステストベースのアプローチは、モデルアーキテクチャが変更される一般的な異種再利用ケースに対処できない。神経機能解析に基づく再利用検出装置であるNFARDを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:21:59 GMT)
Leveraging Topic Specificity and Social Relationships for Expert Finding in Community Question Answering Platforms [5.7]
本稿では,エキスパート検索のためのトピック指向ユーザインタラクションモデルTUEFを提案する。 TUEFは、多層グラフを構築することで、コンテンツとソーシャルデータを統合する。実験の結果、TUEFはP@1で42.42%、NDCG@3で32.73%、R@5で21.76%、MRRで29.81%という最低パフォーマンスで全てのライバルを上回った。
論文参考訳（メタデータ） (Thu, 04 Jul 2024 15:50:18 GMT)
A Survey of Controllable Learning: Methods and Applications in Information Retrieval [5.6]
制御可能な学習(CL)は、信頼できる機械学習において重要な要素として現れる。我々はCLの形式的定義を提供し、情報検索におけるその応用について議論する。学習、評価、タスク設定、オンライン環境への展開など、CLが直面している課題を特定します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:50:50 GMT)
The Solution for the GAIIC2024 RGB-TIR object detection Challenge [5.6]
RGB-TIRオブジェクト検出は、RGBとTIRの両方の画像を、検出中に補完情報として利用する。提案手法はAとBのベンチマークでそれぞれ0.516と0.543のmAPスコアを得た。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:08:36 GMT)
Cognitive Modeling with Scaffolded LLMs: A Case Study of Referential Expression Generation [5.6]
本稿では,参照表現生成のアルゴリズム的認知モデルのニューラルシンボリック実装について検討する。私たちのハイブリッドアプローチは認知的に妥当であり、複雑な状況下ではうまく機能します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:28:48 GMT)
Alice's Adventures in a Differentiable Wonderland -- Volume I, A Tour of the Land [5.5]
ニューラルネットワークは、大きな言語モデル、音声書き起こしシステム、分子発見アルゴリズム、ロボット工学など、私たちを取り巻くものです。このプライマーは、Alice(アリス)氏のような、この奇妙な異なる不思議の国に足を踏み入れた人のために想像された、この魅力的な分野の紹介だ。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:52:11 GMT)
Large Language Models can Share Images, Too! [5.5]
本稿では,GPT-4 や LLaMA 2 などの大規模言語モデル (LLM) のゼロショット設定における画像共有機能について検討する。私たちは、リッチなインテント、文のトリガー、画像記述、健全な情報を含むPhotoChat++データセットを紹介します。広汎な実験により、ゼロショットプロンプトにおいてLDMを備えたDribeRの画像共有能力を解放する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:55:33 GMT)
Purification Of Contaminated Convolutional Neural Networks Via Robust Recovery: An Approach with Theoretical Guarantee in One-Hidden-Layer Case [5.4]
畳み込みニューラルネットワーク(CNN)は多くの機械学習タスクにおいて優れたパフォーマンスを実現している。 CNNは、自然騒音や、バックドア攻撃のような人工的に注入された騒音によって容易に汚染される。汚染される可能性のあるCNNからノイズを取り除くための頑健なリカバリ手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:43:23 GMT)
DiCTI: Diffusion-based Clothing Designer via Text-guided Input [5.3]
DiCTI (Diffusion-based Clothing Designer via Text-guided Input)は、デザイナーがテキスト入力のみを使用してファッション関連のアイデアを素早く視覚化できるようにする。テキスト入力に条件付けされた強力な拡散ベースの塗装モデルを活用することで、DICTIは、さまざまな衣料デザインで、説得力のある高品質な画像を合成することができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:48:36 GMT)
WANCO: Weak Adversarial Networks for Constrained Optimization problems [5.3]
まず、拡張ラグランジアン法を用いてミニマックス問題をミニマックス問題に変換する。次に、それぞれ原始変数と双対変数を表すために、2つの(または複数の)ディープニューラルネットワークを使用します。ニューラルネットワークのパラメータは、敵のプロセスによって訓練される。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:37:48 GMT)
The Price of Prompting: Profiling Energy Use in Large Language Models Inference [5.3]
本稿では,大規模言語モデル推論プロセスにおいて消費されるエネルギーを監視し,分析するフレームワークであるMELODIを紹介する。 MELODIを使用して生成されたデータセットは、幅広いLLMデプロイメントフレームワーク、複数の言語モデル、広範なプロンプトデータセットを含んでいる。その結果,エネルギー効率の相違が指摘され,持続可能対策の最適化と導入の十分な範囲が示唆された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:16:28 GMT)
DocXplain: A Novel Model-Agnostic Explainability Method for Document Image Classification [5.2]
本稿では,高解釈性特徴属性マップの生成に特化して設計された新しいモデルに依存しない説明可能性手法であるDocXplainを紹介する。 4つの異なる評価指標を用いて,文書画像分類の文脈において提案手法を広範囲に評価した。著者の知識を最大限に活用するために、本研究は、特に文書画像に適した、モデルに依存しない属性に基づく説明可能性法を初めて提示する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:59:15 GMT)
When can weak latent factors be statistically inferred? [5.2]
本稿では、主成分分析(PCA)のための新しい包括的推定と推論理論を確立する。我々の理論は断面次元$N$と時間次元$TT$の相対的な成長速度によらず適用可能である。注目すべき技術的革新は、PCAベースの推定器のクローズドフォームの1次近似であり、様々な統計的テストの道を開くものである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:59:52 GMT)
ADAPT: Multimodal Learning for Detecting Physiological Changes under Missing Modalities [5.1]
本稿では,AnchoreD MultimodAl Physiological Transformer (ADAPT)を紹介した。本研究は,2つの実生活シナリオにおける生理的変化を検出することに焦点を当て,特定のトリガーによって誘発される個人におけるストレスと,$g$-forcesによって誘発される意識喪失に焦点を当てた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:05:14 GMT)
CaseGPT: a case reasoning framework based on language models and retrieval-augmented generation [5.1]
CaseGPTは、Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)を組み合わせた革新的なアプローチである。 CaseGPTは、関連するケースデータを取得するだけでなく、既存のケースデータから識別されるパターンに基づいて、洞察に富んだ提案やレコメンデーションを生成する。この機能は、医学診断、法的な前例研究、ケースストラテジーの定式化といったタスクに特に有用である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:26:51 GMT)
Learning Non-Linear Invariants for Unsupervised Out-of-Distribution Detection [5.0]
非線型不変量学習が可能な正規化フロー様アーキテクチャからなるフレームワークを提案する。提案手法は, 広範囲なU-OODベンチマークにおいて, 最先端の結果を得る。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:01:21 GMT)
ScreenAI: A Vision-Language Model for UI and Infographics Understanding [4.9]
UIとインフォグラフィックの理解を専門とする視覚言語モデルであるScreenAIを紹介する。この混合の核心は、モデルがUI要素のタイプと位置を識別しなければならない新しいスクリーンアノテーションタスクである。これらのテキストアノテーションを使用して、画面を大規模言語モデルに記述し、質問応答(QA)、UIナビゲーション、要約トレーニングデータセットを大規模に生成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:08:15 GMT)
Over the Edge of Chaos? Excess Complexity as a Roadblock to Artificial General Intelligence [4.9]
我々は、AIの性能が臨界複雑性しきい値を超えると不安定になるかもしれない複雑なシステムにおける位相遷移に類似した臨界点の存在を仮定した。我々のシミュレーションは、AIシステムの複雑さの増加が、より高い臨界閾値を超え、予測不可能なパフォーマンス行動を引き起こすことを実証した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:46:39 GMT)
Simul-LLM: A Framework for Exploring High-Quality Simultaneous Translation with Large Language Models [4.9]
数十億のパラメータを持ち、大量のデータに事前訓練された大規模言語モデル(LLM)は、さまざまな下流自然言語処理タスクにおいて、最先端の性能に近いかそれ以上の性能を持つようになった。 Simul-LLMは、SimulMTにフォーカスしたLLMのためのオープンソースのファインチューニングおよび評価パイプライン開発フレームワークである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:05:48 GMT)
Sparsest Models Elude Pruning: An Exposé of Pruning's Current Capabilities [4.8]
プルーニングは大規模モデルを圧縮するための有望なアプローチとして現れてきたが、モデルの範囲を回復する効果はまだ検討されていない。我々は485,838の実験を行い、キュビストスパイラルと名付けられた合成データセットに最先端のプルーニングアルゴリズムを適用した。そこで本研究では,新たな探索アルゴリズムによって同定した,理想的なスパースネットワークと比較して,性能の差が顕著であった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:33:15 GMT)
Natively neuromorphic LMU architecture for encoding-free SNN-based HAR on commercial edge devices [4.8]
ニューロモルフィックモデル(Neuromorphic model)は、ヒトの脳からインスピレーションを受ける。本稿では,L2MUについて述べる。L2MUはLeaky Integrate-and-Fireニューロンに依存している。 L2MUを手動のアクティビティからスマートウォッチの信号にベンチマークし、圧縮されたバージョンで3つの異なる商用エッジデバイスにデプロイしました。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:35:12 GMT)
10 Years of Fair Representations: Challenges and Opportunities [4.7]
私たちは、Fair Representation Learningの最初の10年間を振り返る。ディープラーニング理論における最近の研究は、ニューラルネットワーク表現における情報除去の難しさを示している。自動機械学習(AutoML)を使用して、公正な表現を意図した機密情報を敵対的に“マイニング”する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:04:26 GMT)
Mapping the Challenges of HCI: An Application and Evaluation of ChatGPT and GPT-4 for Mining Insights at Scale [4.7]
テキストコーパスから洞察を抽出する実世界の課題に対して,ChatGPTとGPT-4の組み合わせを評価した。 2023CHI会議の議題100件以上で4,392件の研究課題を抽出した。また,ChatGPTとGPT-4の組み合わせは,テキストコーパスを大規模に解析するためのコスト効率に優れた手段である,という結論を得た。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:47:23 GMT)
An Empirical Study on Capability of Large Language Models in Understanding Code Semantics [4.6]
コードのための大規模言語モデル(コードLLM)は、様々なソフトウェア工学(SE)タスクで顕著なパフォーマンスを示している。本稿では,コード意味論の理解におけるLLMの能力を評価するためのフレームワークであるEMPICAを紹介する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:40:58 GMT)
A polynomial-time dissipation-based quantum algorithm for solving the ground states of a class of classically hard Hamiltonians [4.5]
我々は、ハミルトン群の基底状態を解決するための量子アルゴリズムを与える。我々のアルゴリズムに現れた指数的スピードアップのメカニズムは、オープン量子系における散逸に由来する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:27:33 GMT)
Pathological Semantics-Preserving Learning for H&E-to-IHC Virtual Staining [4.4]
仮想ステイニングのための病的セマンティックス保存学習法を提案する。 PSPStainは分子レベルのセマンティック情報を取り入れ、セマンティックス相互作用を強化する。 PSPStainは現在の最先端H&E-to-IHC仮想染色法より優れている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:54:00 GMT)
Adversarial Robustness of VAEs across Intersectional Subgroups [4.4]
可変オートエンコーダ (VAEs) は, 決定論的AEよりも逆方向の摂動に強い抵抗を示す。本研究は,非標的敵攻撃に対するVAEの堅牢性を評価する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:53:51 GMT)
An Axiomatic Definition of Hierarchical Clustering [4.4]
個体群階層的クラスタリングを定義するための公理的アプローチを, 断片的一定密度に対して行う。我々の公理的定義は、ハルディガンのクラスタツリーの定義に繋がる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:53:23 GMT)
Towards Automating Text Annotation: A Case Study on Semantic Proximity Annotation using GPT-4 [4.4]
本稿では、自動プロンプトを設計するための注釈付きデータとともに、人間のアノテーションガイドラインを再利用する。オープンソースのテキストアノテーションツールにプロンプト戦略を実装し、OpenAI APIによるオンライン利用を容易にします。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 19:16:44 GMT)
Online estimation of the inverse of the Hessian for stochastic optimization with application to universal stochastic Newton algorithms [4.4]
本稿では,期待値として記述された凸関数の最小値推定のための2次最適化について述べる。 Robbins-Monro 法を用いて逆 Hessian 行列の直接帰納的推定手法を提案する。とりわけ、普遍的なニュートン法を開発し、提案手法の効率性を調べることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:40:14 GMT)
Seamless Monitoring of Stress Levels Leveraging a Universal Model for Time Sequences [4.3]
本稿では,時系列の普遍モデルUniTSに基づくスマートウォッチからのストレス検出手法を提案する。提案モデルが3つのベンチマークデータセット上での上位12の手法をかなり上回っていることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:46:09 GMT)
Semantic Graphs for Syntactic Simplification: A Revisit from the Age of LLM [4.3]
記号文の意味表現は、NLPタスクを単純化する表現的および構造化された意味グラフを提供する。構文的単純化における意味グラフの位置を再考し,その意味を保ちながら文構造を単純化する作業について述べる。本稿では, AMR グラフ上での記号的推論のために LLM をエミュレートする AMRCoC プロンプトを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:13:38 GMT)
Limited-View Photoacoustic Imaging Reconstruction Via High-quality Self-supervised Neural Representation [4.3]
HIgh-quality Self-supervised Neural representation (HIS) と呼ばれる自己教師ネットワークを導入する。 HISは、限られた視点で取得したセンサデータから高品質な光音響画像を再構成するために、光音響イメージングの逆問題に取り組む。その結果,提案したHISモデルは,光音響画像再構成によく用いられる3つの手法と比較して,画質が優れていることがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:07:54 GMT)
Quantum spectral method for gradient and Hessian estimation [4.2]
勾配降下は連続最適化問題を解くための最も基本的なアルゴリズムの1つである。本稿では、クエリの複雑さを$widetildeO (1/varepsilon)$とすることで、その勾配の$varepsilon$-approximationを返す量子アルゴリズムを提案する。また、ニュートン法の量子アナログを改善することを目的としたヘッセン推定のための2つの量子アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:03:48 GMT)
ALPINE: An adaptive language-agnostic pruning method for language models for code [4.1]
コードの言語モデルは、様々なソフトウェアエンジニアリングとソースコード解析タスクで最先端のパフォーマンスを示している。 ALPINEは、これらのモデルの計算オーバーヘッドを大幅に削減するために設計された適応型プログラミング言語に依存しないプルーニング技術である。 CodeBERT、GraphCodeBERT、UnixCoderの2つのソフトウェアエンジニアリングタスクの実験では、ALPINEはFLOPの最大50%の削減、メモリフットプリントの58.1%の削減、平均スループットの28.1%の改善を実現している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:42:51 GMT)
Towards Statistically Significant Taxonomy Aware Co-location Pattern Detection [4.1]
目的は、統計的に重要な特徴タイプや両親のサブセットを見つけることである。この問題は、分類学によって生成される候補コロケーションパターンの指数的な数によって、計算的に困難である。本稿では,コロケーションパターンの統計的意義を取り入れ,評価する2つの手法を提案する。
論文参考訳（メタデータ） (Thu, 04 Jul 2024 05:11:10 GMT)
NeuroSteiner: A Graph Transformer for Wirelength Estimation [4.0]
WL推定のコスト-精度フロンティアをナビゲートするために、最適なRSMTソルバであるGeoSteinerを蒸留するニューラルネットワークであるNeuroSteinerを提案する。 NeuroSteinerはGeoSteinerによってラベル付けされた合成ネットでトレーニングされており、実際のチップ設計でトレーニングする必要がなくなる。 ISPD 2005と2019では、NeuroSteinerはGeoSteinerよりも60%速く、0.2%と30%のエラーを得られる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:55:22 GMT)
Convergence of variational Monte Carlo simulation and scale-invariant pre-training [4.0]
ニューラルネットワークの波動関数を最適化するために,変分モンテカルロ法(VMC)の収束バウンダリを提案する。エネルギー最小化に先立って一般的に用いられるエネルギー最小化相と教師付き事前学習相の両方について検討する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:39:00 GMT)
RobQuNNs: A Methodology for Robust Quanvolutional Neural Networks against Adversarial Attacks [4.0]
Quanvolutional Neural Networks (QuNN) は量子層と古典層を統合している。本研究は,QuNNの敵攻撃に対する堅牢性を高める新しい手法であるRobQuNNを紹介する。その結果、QuNNはMNISTデータセットの古典的ネットワークに比べて最大60%高いロバスト性を示すことがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:13:52 GMT)
Policy Gradient Algorithms with Monte Carlo Tree Learning for Non-Markov Decision Processes [3.9]
政策勾配 (PG) は、勾配上昇を用いたパラメータ化政策モデルを最適化する強化学習 (RL) アプローチである。 PGは非マルコフ環境でもうまく機能するが、高原やピークネスの問題に遭遇することがある。本稿では、まず、オンラインRLのためのMCTSの適応であるモンテカルロ木学習(MCTL)を紹介し、その強みを活用するためにPGとMCTLの政策アプローチについて検討する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:22:01 GMT)
The Mysterious Case of Neuron 1512: Injectable Realignment Architectures Reveal Internal Characteristics of Meta's Llama 2 Model [3.8]
Injectable Realignment Model (IRM)は、言語モデルの解釈可能性と説明可能性に対する新しいアプローチである。ニューラルプログラミングインタフェースに関する以前の研究に触発された私たちは、感情に基づくアライメントを誘導するために、小さなネットワーク(IRM)を構築してトレーニングします。訓練されたIRMの出力の分析では、興味深いパターンが明らかになっている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:05:19 GMT)
Finetuning End-to-End Models for Estonian Conversational Spoken Language Translation [3.8]
本稿では,エストニア語とエストニア語とロシア語の会話音声テキスト翻訳におけるエンドツーエンドモデルの微調整について検討する。エストニア語のための音声翻訳データが限られているため、機械翻訳を用いた音声認識データセットからWebスクレイピングと合成により、追加のトレーニングデータを作成しました。以上の結果から,合成データによる微調整により,SeamlessM4Tのマッチングや音声翻訳システムの超過により翻訳精度が向上することが示唆された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:33:12 GMT)
Learning Interpretable Differentiable Logic Networks [3.8]
解釈可能な微分可能論理ネットワーク(DLN)を学習するための新しい手法を提案する。我々はこれらのネットワークを、入力の双対化、二項論理演算、ニューロン間の接続を通じて、個々の成分の軟化と差別化によって訓練する。 20の分類タスクの実験結果は、従来のNNと同等かそれ以上の精度で、微分可能な論理ネットワークが達成可能であることを示している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:58:26 GMT)
Assessing Consensus of Developers' Views on Code Readability [3.8]
開発者はコードレビューに多くの時間を費やし、コード理解におけるコード可読性の重要性を強調している。以前の調査では、既存のコード可読性モデルは開発者の考えを表現する上で不正確であった。同じようなコーディング経験を持つ10人のJava開発者を調査して、コード可読性評価と関連する側面について、彼らのコンセンサスを評価しました。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:54:42 GMT)
How AI Ideas Affect the Creativity, Diversity, and Evolution of Human Ideas: Evidence From a Large, Dynamic Experiment [3.8]
実験では、参加者がChatGPTまたは以前の実験参加者から得た創造的アイデアを観察し、そのアイデアをブレインストーミングした。我々は,AI生成例数(無,低,高露出)と,その例を「AI」とラベル付けした場合(開示)に変動した。高いAI暴露は、個々のアイデアの創造性に影響を与えるものではなく、集団的アイデアの多様性の平均的量と変化率を増加させることを発見した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:14:24 GMT)
Question-Analysis Prompting Improves LLM Performance in Reasoning Tasks [3.7]
質問分析プロンプティング(QAP)と呼ばれる新しいプロンプト戦略を提案する。算術データセット GSM8K, AQuA, SAT および常識データセット StrategyQA を用いて, GPT 3.5 Turbo と GPT 4 Turbo でQAPを評価した。 QAPはテストの75%で常にトップ2のプロンプトにランクインしている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:19:50 GMT)
Optimal Estimation of Generic Dynamics by Path-Dependent Neural Jump ODEs [3.7]
本稿では,NJ-ODE(Neural Jump ODE)フレームワークの経路依存拡張を用いた一般プロセスの予測問題について検討する。 PD-NJ-ODEは古典的なフィルタリング問題や順序帳(LOB)データにうまく適用可能であることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:02:36 GMT)
From First Patch to Long-Term Contributor: Evaluating Onboarding Recommendations for OSS Newcomers [3.7]
オープンソースソフトウェア(OSS)プロジェクトへの新参者推奨に関する2つの重要な研究ギャップがある。まず、既存のレコメンデーションのほとんどは限られた数のプロジェクトに基づいています。第二に、これらのレコメンデーションが経験豊富なコントリビュータにも当てはまるかどうかは不明です。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:25:19 GMT)
AXOLOTL'24 Shared Task on Multilingual Explainable Semantic Change Modeling [3.6]
AXOLOTL'24は、多言語で説明可能なセマンティックチェンジモデリング共有タスクである。本稿では,フィンランド語とロシア語に対する意味変化データセットについて述べる。 AXOLOTL'24のセットアップはセマンティック・チェンジ・モデリング・フィールドにとって新しいものである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:41:32 GMT)
Operational Quantum Mereology and Minimal Scrambling [3.5]
系の動的法則から生じる自然量子サブシステムとは何か? まず、可観測性の観点から一般化テンソル積構造(gTPS)を演算子$cal A$とその可換体の双対として定義する。本稿では,gTPSを動的に選択するために,短時間でスクランブルする最小限の情報量に関する運用基準を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:06:06 GMT)
Quantum Measurement Encoding for Quantum Metrology [3.5]
量子メートル法は, 量子測定によってデコヒーレンス効果が得られない場合に研究する。この場合、推定パラメータは量子測定によって量子状態に符号化される。非エルミートセンシングにおいて、精度保存条件が違反した場合の精度損失の普遍式を導出する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:31:14 GMT)
NLP-KG: A System for Exploratory Search of Scientific Literature in Natural Language Processing [3.4]
NLP-KGは、未知の自然言語処理分野の研究文献の探索を支援するために設計された機能豊富なシステムである。セマンティック検索に加えて、NLP-KGは興味のある分野への簡単な紹介を提供する調査論文を簡単に見つけることができる。フィールド・オブ・スタディ(Fields of Study)階層グラフにより、ユーザーはフィールドとその関連領域に慣れることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:51:43 GMT)
The $s$-value: evaluating stability with respect to distributional shifts [3.3]
実際には、場所と時間の間で分布が変化するため、データセット間で伝達される知識の収集が困難になる。本論文では,Kulback-Leibler分散に対する統計的パラメータの分布不安定度を定量化する不安定度尺度を提案する。提案手法の有効性を実データ上で評価し,パラメータの分布不安定性をあるシフトに対して解明可能であることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:56:06 GMT)
VoxAct-B: Voxel-Based Acting and Stabilizing Policy for Bimanual Manipulation [3.2]
本稿では,VoxAct-Bを提案する。我々はこのボクセルグリッドをバイマニュアル操作ポリシーに提供し、動作と安定化の動作を学ぶ。シミュレーションにおいて、VoxAct-Bは、細粒度バイマニュアル操作タスクにおいて、強いベースラインを上回ります。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:58:20 GMT)
Continuous-time quantum optimisation without the adiabatic principle [2.9]
最適化問題に対する連続時間量子アルゴリズムは、これまで断熱原理によって動機付けられてきた。我々はプランクの原理を、連続時間量子アルゴリズムの基盤となる物理的動機として捉えている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:07:56 GMT)
Machine Learning for Economic Forecasting: An Application to China's GDP Growth [2.9]
本稿は、中国における四半期ごとのGDP成長を予測するために、さまざまな機械学習モデルを用いている。これらのモデルのパフォーマンスの違いに寄与する要因を分析します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:04:55 GMT)
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary [2.8]
強化学習(RL)と大規模言語モデル(LLM)を組み合わせた新しい注釈手法を提案する。本システムでは,RLを利用して複雑なカード再生シナリオを生成し,LLMを用いて対応する注釈文を生成する。オープンソース LLM に適用した場合,提案する注釈フレームワークによって達成される性能の大幅な向上を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:47:22 GMT)
A Fully Parameter-Free Second-Order Algorithm for Convex-Concave Minimax Problems with Optimal Iteration Complexity [2.8]
凸凹極小最適化問題の解法として,Lipschitz-free Cubal regularization (LF-CR)アルゴリズムを提案する。また,この問題のパラメータを必要としない完全パラメータフリー立方正則化(FF-CR)アルゴリズムを提案する。我々の知る限り、FF-CRアルゴリズムは凸凹極小最適化問題の解法として初めて完全にパラメータフリーな2次アルゴリズムである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:46:07 GMT)
Contrastive Chain-of-Thought Prompting [2.8]
思考の連鎖は言語モデル推論の大幅な改善につながった。我々は、文脈認識復号(CAD)からインスピレーションを得て、思考の連鎖によって引き起こされる推論のタイプをさらに促進する。データセットやモデル間でこれらの結果を安定化する作業は継続するが、文脈を考慮した推論のための入力ベースのステアリング手法に関するさらなる調査が保証されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:20:31 GMT)
VITAMIN: A Compositional Framework for Model Checking of Multi-Agent Systems [2.7]
本稿では,マルチエージェントシステム (MAS) の形式的検証をモジュール的かつ多目的に行う手法を提案する。 MASの既存の検証手法やフレームワークとは異なり、VITAMINは様々なロジックに対応するために容易に拡張するために構築されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:10:06 GMT)
Kernel Ridge Riesz Representers: Generalization, Mis-specification, and the Counterfactual Effective Dimension [2.7]
私はカーネルバランスウェイトをカーネルリッジリース表現器(KRRR)と解釈する。 KRRRはカーネルリッジ回帰の正確な一般化である。私はKRRRを用いて、資産に対する401(k)の非均一な処理効果について、年齢によって不確実性を定量化します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:09:15 GMT)
Mechanisms for Data Sharing in Collaborative Causal Inference (Extended Version) [2.7]
本稿では,共通学習課題に対する各当事者のデータ貢献度を評価するための評価手法を提案する。データの品質に応じてエージェントを公平に報酬するために、あるいはすべてのエージェントのデータコントリビューションを最大化するために利用することができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:32:32 GMT)
Object Recognition from Scientific Document based on Compartment Refinement Framework [2.7]
膨大な資源から貴重な情報を効率的に抽出することがますます重要になっている。科学文書の現在のデータ抽出方法は、ルールベース(RB)または機械学習(ML)アプローチを用いるのが一般的である。我々はCTBR(Compartment & Text Blocks Refinement)と呼ばれる新しい文書レイアウト分析フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:51:31 GMT)
gFlora: a topology-aware method to discover functional co-response groups in soil microbial communities [2.7]
機能的共応答群:共応答効果が機能的変数と統計的によく関連している分類群を学習することを目指している。土壌微生物群集を分類群をノードとした生態共起ネットワークとしてモデル化する。我々は、この共起ネットワーク上でグラフ畳み込みを用いて、グループ間の共応答効果を得るgFloraと呼ばれる手法を設計する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:43:53 GMT)
POLAFFINI: Efficient feature-based polyaffine initialization for improved non-linear image registration [2.7]
本稿では,非線形画像登録を初期化するための効率的な特徴ベース手法を提案する。従来の反復アルゴリズムと最近の一発ディープラーニング(DL)ベースの選択肢の両方において、初期変換の優れた見積が不可欠である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:36:29 GMT)
An applied Perspective: Estimating the Differential Identifiability Risk of an Exemplary SOEP Data Set [2.7]
基本的統計的クエリの集合に対して,リスクメトリックを効率的に計算する方法を示す。実世界の科学的データセットに基づいた実証分析は、現実的な条件下でのリスクの計算方法に関する知識を拡大します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:50:55 GMT)
High-probability minimax lower bounds [2.6]
ミニマックス量子化の概念を導入し、その量子化レベルへの依存を明確にする。我々は、古典的なル・カム法とファノ法の高確率変種を開発し、局所的なミニマックスリスクの下限をミニマックス量子化上の下限に変換する技術を開発した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:08:50 GMT)
Semantic Communication Networks Empowered Artificial Intelligence of Things [2.6]
本稿では,セマンティック通信システムにおけるセキュリティとプライバシの脅威を包括的に調査する。この急成長する分野において、さらなる調査を保証している重要なオープンな問題を特定します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:39:28 GMT)
Exploring Diachronic and Diatopic Changes in Dialect Continua: Tasks, Datasets and Challenges [2.6]
我々は3つの言語族(スラヴ語、ロマンス語、ゲルマン語)から5つの方言にまたがる9つのタスクとデータセットを批判的に評価する。本稿では,方言使用の経時的変化,方言データセットの信頼性,話者特性の重要性,方言の限られた範囲,データ収集における倫理的配慮に関する5つのオープンな課題を概説する。言語の種類や方言の包括的計算手法やデータセットに関する今後の研究に光を当てることを願っています。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:38:38 GMT)
FedSat: A Statistical Aggregation Approach for Class Imbalaced Clients in Federated Learning [2.6]
フェデレートラーニング(FL)は、プライバシを保存する分散機械学習のための有望なパラダイムとして登場した。本稿ではFedSatについて紹介する。FedSatは様々なデータ不均一性を同時に扱うために設計された新しいFLアプローチである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:50:24 GMT)
Minimising surface-code failures using a color-code decoder [2.5]
偏極雑音モデルにより生じる誤差に対する低重補正演算子を求める表面符号のデコーダを提案する。デコーダは、表面符号のシンドロームをカラー符号のシンドロームにマッピングすることで得られる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:24:27 GMT)
An Autoencoder Architecture for L-band Passive Microwave Retrieval of Landscape Freeze-Thaw Cycle [2.5]
温暖化に伴う永久凍土の応答を理解するためには,北半球の景観と土壌凍土の動態を推定することが重要である。深部畳み込み自己エンコーダニューラルネットワークに基づくLバンドマイクロ波ラジオメトリーを用いたFTサイクル検索のための新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:40:50 GMT)
BonnBot-I Plus: A Bio-diversity Aware Precise Weed Management Robotic Platform [2.4]
本稿では, ボン大学クライン・アルテンドルフ校における雑草管理アルゴリズムの最近の進歩と, bbotの実際の性能について述べる。本報告では,BonnBot-Is雑草監視部における新たなローリングビュー観測モデルについて述べる。われわれは、精密雑草ロボットが、雑草のシナリオに挑戦する上で、生物多様性に配慮した懸念をどのように考慮するかを初めて示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:49:51 GMT)
Multi-domain improves out-of-distribution and data-limited scenarios for medical image analysis [2.3]
特殊ドメインの代わりに複数のドメインを組み込んだモデルを用いることで、特殊モデルで観測される制限が大幅に軽減されることを示す。臓器認識では、従来の特殊なモデルと比較して、マルチドメインモデルは精度を最大8%向上させることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:20:59 GMT)
Multi-level projection with exponential parallel speedup; Application to sparse auto-encoders neural networks [2.3]
ell_1,infty$ノルムの時間複雑性は、$mathbbRntimes m$の行列に対して$mathcalObig(n m big)$のみであることを示す。実験により、我々の予測は、実際の最速のユークリッドアルゴリズムの2倍高速であることが示されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:58:17 GMT)
DGR-MIL: Exploring Diverse Global Representation in Multiple Instance Learning for Whole Slide Image Classification [2.2]
多様なグローバル表現(DGR-MIL)に基づく新しい多重インスタンス学習法を提案する。提案モデルは,CAMELYON-16とTCGA肺がんデータセットにおいて,最先端のMIL集約モデルよりもかなり優れている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:58:30 GMT)
Latent Diffusion Model for Generating Ensembles of Climate Simulations [2.1]
我々は、広範囲の気候シミュレーションに基づいて、新しい生成的深層学習アプローチを訓練する。潜在空間表現を利用することで、我々のモデルは最小限のメモリを必要とする大規模なアンサンブルをオンザフライで迅速に生成できる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:43:52 GMT)
What to do if language models disagree? Black-box model ensembling for textual and visual question answering [2.1]
我々は、既存のブラックボックスモデルから勝者を選ぶことを学ぶデータ効率で軽量なアンサンブル手法であるInfoSelを紹介する。我々は,F1スコアにおいて,スタンドアローンLLMと比較して,最大5.27%の絶対的な増加を実現していることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:59:10 GMT)
Aspect-Based Sentiment Analysis Techniques: A Comparative Study [2.1]
Aspect-based Sentiment Analysis (ABSA) は人工知能(AI)の進歩に支えられている本研究では、2つのベンチマークデータセット(Restaurant14とLaptop-14)でABSAのディープNN手法を比較した。 FAST LSA は 87.6% と 82.6% の精度で最高の結果を得るが、それぞれ 90.33% と 86.21% の精度で LSA+DeBERTa を通過しない。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:57:37 GMT)
Mining Invariance from Nonlinear Multi-Environment Data: Binary Classification [2.1]
本稿では,一般的な非線形データ生成機構に光を放つバイナリ分類に着目する。環境上で不変なモデルをトレーニングできるような、バイナリ設定にのみ存在するユニークな不変性の形式を特定します。本稿では,実データと合成データを用いた予測手法の提案と実験を行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:15:38 GMT)
QueryMamba: A Mamba-Based Encoder-Decoder Architecture with a Statistical Verb-Noun Interaction Module for Video Action Forecasting @ Ego4D Long-Term Action Anticipation Challenge 2024 [2.0]
本稿では,マンバをベースとした新しいエンコーダデコーダアーキテクチャについて述べる。このアーキテクチャは、歴史的データに基づいて動詞や名詞の発生を予測するだけでなく、それらの共同発生も予測精度を向上させるために考慮している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:13:06 GMT)
Conditional and Modal Reasoning in Large Language Models [2.0]
205大言語モデルが論理的に正しい推論と誤った推論を区別できる範囲を探索する。 GPT-4 モデルファミリー以外はすべて条件付きで基本的なミスを犯すことが多い。ほぼ全てのモデルは、人間の判断と一致しない文献で広く議論されているある種の複雑な条件推論に対する答えを与える。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:12:25 GMT)
Pseudorandom Permutations from Random Reversible Circuits [2.0]
固定された最寄りのアーキテクチャにおいて,各層が$approx n/3$のランダムゲートからなる深さ$n cdot tildeO(k2)$のランダム回路がほぼ$k$の独立な置換をもたらすことを示す。また、擬似乱数関数からの擬似乱数置換のLuby-Rack-off構成は可逆回路で実装可能であることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:51:17 GMT)
Online Non-Stationary Stochastic Quasar-Convex Optimization [1.9]
近年の研究では、線形系やロジスティック系の同定などの応用において、クエーサー活性化関数が見つかることが示されている。動的環境におけるクエーサーにインスパイアされた設計問題を利用するアルゴリズムを開発した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:24:27 GMT)
PythonSaga: Redefining the Benchmark to Evaluate Code Generating LLMs [1.9]
我々はPythonコード生成のベンチマークを2つ評価し、その多様性と難易度を分析した。我々の発見は、限られたプログラミング概念に対する批判的な偏見を示し、他の概念のほとんどを無視した。我々は,38のプログラミング概念をバランスよく表現した185個の手作りプロンプトを特徴とする新しいベンチマークPythonSagaを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:40:42 GMT)
Sampling Hybrid Climate Simulation at Scale to Reliably Improve Machine Learning Parameterization [1.9]
サブグリッドプロセスの機械学習(ML)パラメータ化は、いつか従来のパラメータ化を置き換えるかもしれない。本研究は,ハイブリッドシミュレーションの大規模アンサンブルを用いた全物理MLパラメータ化の結合挙動について検討する。オフラインとオンラインのパフォーマンスに明らかな改善をもたらす設計上の決定を特定します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:21:12 GMT)
Future Events as Backdoor Triggers: Investigating Temporal Vulnerabilities in LLMs [1.9]
現在の大規模言語モデル(LLM)は過去の出来事と将来の出来事を区別できることを示す。時間的分布シフトによって引き起こされるバックドアでモデルを訓練する。モデルの内部表現を表すアクティベーションステアリングベクトルが,バックドアアクティベーションの速度に影響を与えることがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:24:09 GMT)
Noise-adapted recovery circuits for quantum error correction [1.9]
一般のノイズ適応リカバリマップに対して量子回路を提示するが、これはしばしばペッツマップと呼ばれる。また、符号化された状態と復元された状態との間の忠実度を直接推定できる回路を提案する。ノイズ適応型回復回路の有効性は, 理想的, 雑音的シミュレーションによって実証される。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:55:43 GMT)
Charging Ahead: A Hierarchical Adversarial Framework for Counteracting Advanced Cyber Threats in EV Charging Stations [1.9]
電気自動車(EV)は、より高い充電優先度を得るために偽情報を提供し、グリッド不安定を引き起こす可能性がある。本稿では,EV充電ステーションにおける盗難サイバー攻撃を効果的に検出するDRL(HADRL)を用いた階層的対向フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:23:03 GMT)
Logical Operators and Fold-Transversal Gates of Bivariate Bicycle Codes [1.8]
量子低密度パリティチェック(qLDPC)符号は、一定のオーバーヘッドを持つスケーラブルなフォールトトレラント量子計算への有望な経路を提供する。近年の進歩により、qLDPC符号は、短期ハードウェアでも表面符号の量子メモリ能力より優れていることが示されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:49:35 GMT)
Dancing to the State of the Art? How Candidate Lists Influence LKH for Solving the Traveling Salesperson Problem [1.7]
トラベリングセールスパーソン問題(TSP)の解決はいまだに永続的な課題である。ヒューリスティックな解法は、高品質な解を見つけるための需要を効果的に解決する。これらの解法の中で、Lin-Kernighan-Helsgaun(LKH)は遺伝的アルゴリズムの性能を補完するものとして際立っている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:38:19 GMT)
Low-latency machine learning FPGA accelerator for multi-qubit state discrimination [1.7]
本研究では、ニューラルネットワーク(NN)をフィールドプログラマブルゲートアレイ(FPGA)に展開するための統合アプローチを利用する。周波数多重読み出しのための完全連結ニューラルネットワークアクセラレータの設計と実装は実用的であることを示す。ハードウェアアクセラレータは、RFSoC ZCU111FPGA上で、5つの超伝導量子ビットを50 ns未満で周波数多重読み出しを行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:34:43 GMT)
SRAS: Self-governed Remote Attestation Scheme for Multi-party Collaboration [1.7]
マルチパーティクラウドコンピューティングでは、各パーティのTEEを検証し、機密データを相互にリークするのを避けるために、Relying Partyを選択する方法が未解決の問題である。本稿では,TEEと計算資産の信頼性を検証するための検証機能を備えた,オープンな自己管理型遠隔検定手法SRASを提案する。我々はSRASのオープンソースプロトタイプ実装を提供し、クラウドユーザや開発者によるこの技術の採用を容易にします。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:57:18 GMT)
Variational Gibbs State Preparation on NISQ devices [1.7]
本稿では,量子多体系のギブス状態を作成するための変分量子アルゴリズム(VQA)を提案する。我々のVQAの新規性は、2つの異なる接続された量子レジスタに作用するパラメータ化量子回路を実装することである。逆場 Ising と Heisenberg XXZ モデルの Gibbs 状態を作成して VQA をベンチマークし,高い忠実度を実現する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:42:50 GMT)
ELCC: the Emergent Language Corpus Collection [1.7]
Emergent Language Corpus Collection (ELCC)は、緊急通信システムのオープンソース実装から収集されたコーパスのコレクションである。各コーパスには、ソースコードの特徴を記述したメタデータと、コーパスの分析スイートが添付されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:23:18 GMT)
Use of Mobile Devices in the Classroom to Increase Motivation and Participation of Engineering University Students [1.6]
本研究の目的は,教室でモバイルデバイスを用いた場合,学生の参加が増加するかどうかを検討することである。学生参加行動の量を測定した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:46:05 GMT)
Learning Decentralized Linear Quadratic Regulators with $\sqrt{T}$ Regret [1.5]
本稿では,システムのモデルが未知な場合,分散線形二次制御系を適応的に設計するオンライン学習アルゴリズムを提案する。我々のコントローラは、部分的にネストされた情報パターンの場合、時間軸の$T$で$sqrtT$までスケールする期待された後悔を楽しんでいます。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 06:50:53 GMT)
Deep Learning Based Apparent Diffusion Coefficient Map Generation from Multi-parametric MR Images for Patients with Diffuse Gliomas [1.5]
拡散強調(DWI)MRIから得られたADCマップは、組織内の水分子に関する機能的測定を提供する。本研究では,多パラメータMR画像からADCマップを合成するディープラーニングフレームワークを開発することを目的とする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:36:16 GMT)
A Quantum Approach to Synthetic Minority Oversampling Technique (SMOTE) [1.5]
本稿では,機械学習データセットにおけるクラス不均衡の問題を解くために,Quantum-SMOTE法を提案する。量子SMOTEはスワップテストや量子回転といった量子プロセスを用いて合成データポイントを生成する。このアプローチは、Telecom Churnの公開データセットでテストされ、その影響と、さまざまな合成データの比率を決定する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:06:23 GMT)
Ariadne and Theseus: Exploration and Rendezvous with Two Mobile Agents in an Unknown Graph [1.5]
モバイルコンピューティングにおける2つの基本的な問題、探索とランデブーについて検討する。そこで本研究では,時間段階の集合探索を実現するアルゴリズムを提案する。また,少なくとも frac32m$ の時間ステップでレンデブーを保証するアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:40:49 GMT)
Meta-prompting Optimized Retrieval-augmented Generation [1.4]
下流タスクにおける大規模言語モデルの性能を活かすため、検索拡張世代は外部ソースから取得したコンテンツに頼っている。本稿では,メタプロンプト最適化を利用して,検索したコンテンツをプロンプトに含める前に洗練する手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:20:12 GMT)
Convergence rates for the Trotter-Kato splitting [1.4]
強い作用素位相において、トロッター-加藤の収束速度は$eA+L = lim_n to infty (eL/n eA/n)n$である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:37:54 GMT)
Gene Set Summarization using Large Language Models [1.3]
我々はGPTモデルを用いて遺伝子セット関数の要約を行う手法を開発した。これらの手法は,遺伝子セットのGO項リストを,有用かつ生物学的に有効に作成できることを示す。しかし、GPTベースのアプローチでは、信頼できるスコアやp値が得られず、統計的に重要でない項を返すこともしばしばある。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:16:11 GMT)
PINNSim: A Simulator for Power System Dynamics based on Physics-Informed Neural Networks [1.3]
より大きな時間ステップを踏むことができるシミュレータを提案する。電力系統における単一成分の動的解の解法として物理インフォームドニューラルネットワーク(PINN)を基礎としている。 9-busシステム上でPINNSimを実演し,PINNSimの時間ステップサイズを台形積分法と比較した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:03:35 GMT)
Mixture of A Million Experts [1.2]
本稿では,多彩な専門家プールからのスパース検索に製品キー技術を利用する新しい層設計PEERを紹介する。言語モデリングタスクの実験では、PEER層が高密度FFWや粗粒のMoEよりもパフォーマンス・計算トレードオフの点で優れていることが示された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:59:20 GMT)
High-dimensional variable clustering based on maxima of a weakly dependent random process [1.2]
本稿では,Asymptotic Independent Block (AI-block)モデルと呼ばれる,変数クラスタリングのための新しいモデルのクラスを提案する。このモデルのクラスは特定可能であり、つまり、分割の間に部分的な順序を持つ極大要素が存在し、統計的推測が可能であることを意味する。また,変数のクラスタを列挙するチューニングパラメータに依存するアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:13:29 GMT)
LOGIC-LM++: Multi-Step Refinement for Symbolic Formulations [1.0]
本稿では Logic-LM++ を改良した Logic-LM++ を提案する。 LLMの機能をペアで比較し、LLMが提案する改善点の評価を可能にする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:49:07 GMT)
Instantaneous, Comprehensible, and Fixable Soundness Checking of Realistic BPMN Models [1.0]
私たちはBPMNモデルのエラーを瞬時に識別できる新しい音質チェックツールを導入しました。ツールの音質チェックは,500ms未満の即時性であることを示す。このツールはオープンソースで、モジュール化され、発見され、人気のあるBPMNモデリングツールに統合されています。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:34:52 GMT)
Entanglement Polygon Inequalities for A Class of Mixed States [1.0]
多粒子高次元系の一般化されたWクラス状態の密度行列である混合状態のクラスの性質を考察する。まず、混合状態のクラスが、Tsallis-q の絡み合いの観点から、絡み合いポリゴンの不等式を満たすことを示し、Tsallis-q の絡み合いの観点から、混合状態のより厳密な不等式のクラスを提案する。最終的に混合状態の不等式が得られ、これは二部交絡関係と見なすことができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:46:46 GMT)
FemQuest -- An Interactive Multiplayer Game to Engage Girls in Programming [0.9]
本稿では,女子の3Dゲーム環境をモチベーションに利用したマルチプレイヤーゲームについて述べる。ワークショップ評価では,女子235名,コーチ50名,ゲーム内分析では20名であった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:42:22 GMT)
Google Topics as a way out of the cookie dilemma? [0.9]
本稿では,広告目的における情報処理と個人情報処理の法的要件と意義について論じる。クッキーの設定には個人の明示的な同意を得ることが必要だと強調している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:28:29 GMT)
Robust CATE Estimation Using Novel Ensemble Methods [0.9]
本研究は,多種多様なシナリオにまたがって,因果林や多種多様なメタラーナーなどの共通手法の性能を評価する。提案手法では,X-Learnerをモデルスタック化してニュアンス関数を推定し,CBA(Consensus Based Averaging)を用いて内部一致度の高いモデルのみを平均化する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:23:02 GMT)
Deep Content Understanding Toward Entity and Aspect Target Sentiment Analysis on Foundation Models [0.9]
Entity-Aspect Sentiment Triplet extract (EASTE)は、Aspect-Based Sentiment Analysisタスクである。本研究は,EASTEタスクにおける高性能化を目標とし,モデルサイズ,タイプ,適応技術がタスクパフォーマンスに与える影響について検討する。最終的には、複雑な感情分析における詳細な洞察と最先端の成果を提供する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:48:14 GMT)
ConText at WASSA 2024 Empathy and Personality Shared Task: History-Dependent Embedding Utterance Representations for Empathy and Emotion Prediction in Conversations [0.9]
WASSAは、相互作用における共感と感情予測に関するタスクを共有しており、これらのタスクに対するアプローチをベンチマークする機会を提供する。我々は、会話における各発話の共感、感情の極性、感情の強さを、会話の文脈とともに分類される発話をフィードすることによってモデル化する。また,会話からのすべての発話と,その共感を予測しているインターロケータを識別するトークンを入力して,各インターロケータの相手共感をモデル化する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:44:59 GMT)
Women for Quantum -- Manifesto of Values [0.8]
私たちは、現在の科学的リーダーシップ、資金、権威のモデルが、私たちの多くを表現できないと信じています。それは、異なる種類の力と、全員の参加を求める真の変革の時です。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:33:29 GMT)
Real HSI-MSI-PAN image dataset for the hyperspectral/multi-spectral/panchromatic image fusion and super-resolution fields [0.8]
ハイパースペクトル画像(HSI)融合実験のほとんどは、異なる融合法を比較するためのシミュレーションデータセットに基づいている。 HSI/MSI/PAN画像データセットを公開し、ハイパースペクトル画像融合の分野の開発を促進する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:59:54 GMT)
HYBRINFOX at CheckThat! 2024 -- Task 2: Enriching BERT Models with the Expert System VAGO for Subjectivity Detection [0.8]
HYBRINFOX法は評価データからマクロF1スコア0.7442で1位にランク付けした。本稿では,我々のハイブリッドアプローチの原理を説明し,その手法を英語以外の言語にも適用する方法を概説する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:29:19 GMT)
HYBRINFOX at CheckThat! 2024 -- Task 1: Enhancing Language Models with Structured Information for Check-Worthiness Estimation [0.8]
本稿では,2024年 - タスク1コンペティションのためのHYBRINFOXチームの実験と結果について要約する。本稿では,RoBERTaのような言語モデルに三重項による埋め込みを組み込む手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:33:54 GMT)
TwinLab: a framework for data-efficient training of non-intrusive reduced-order models for digital twins [0.8]
本研究では,2つのデータセットしか持たないニューラル-ODE型リダクションオーダモデルの,効率的かつ高精度なトレーニングフレームワークであるTwinLabを提案する。トレーニングに最適なデータセットをひとつ見つけた後、類似性とエラー対策の助けを借りて第2のデータセットを求め、トレーニングプロセスを効果的に強化する。発見: トレーニングプロセスに適切な第2のトレーニングデータセットを追加すると、テストエラーが最大49%削減される。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:37:13 GMT)
On Simulation of Power Systems and Microgrid Components with SystemC-AMS [0.8]
マイクログリッドのようなサイバー物理システムは、相互接続されたコンポーネント、局所的な電力システム、分散エネルギー資源から構成される。電力系統変換器とその制御ループは、グリッドを安定化し、メイングリッドとマイクログリッドの対面において重要な役割を果たす。本稿では,SystemC-AMSを用いたマイクログリッド部品の電磁過渡応答を高速にシミュレーションする手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:42:29 GMT)
Predictive Coding Networks and Inference Learning: Tutorial and Survey [0.8]
機械学習(ML)における予測符号化ネットワーク(PCN)の神経科学的枠組みに着目した。 PCNは推論学習 (IL) で訓練されており、従来のフィードフォワードニューラルネットワーク (FNN) に対してバックプロパゲーションで訓練された潜在的な利点がある。我々は、包括的レビューとPCNの正式な仕様、特に近代的なMLメソッドの文脈にそれらを配置する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:39:20 GMT)
Tackling Erosion in Variant-Rich Software Systems: Challenges and Approaches [0.7]
我々は,変種リッチソフトウェアシステム内の浸食現象を詳細に調査する。浸食に対処する上での現在の課題には、浸食の理解と定義に関するコンセンサスの欠如などが含まれる。変種リッチソフトウェアシステムにおける浸食対策のための最初のアプローチを概説する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:13:45 GMT)
Continuous optimization by quantum adaptive distribution search [0.7]
量子適応分布探索(QuADS)を導入する。 QuADSはGrover Adaptive Search(GAS)と共分散行列適応-進化戦略(CMA-ES)を統合した。数値実験により、QuADSはGASとCMA-ESの両方に優れていた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:54:34 GMT)
Improving Computer Vision Interpretability: Transparent Two-level Classification for Complex Scenes [0.7]
本稿では,透明性問題に対処する2段階の分類手法を提案する。この手法を、14万枚以上の画像からなる新しいデータセットに適用し、政治的抗議を示すものを検出する。オブジェクトを知ることは、抗議的なイメージと非抗議的なイメージを区別する分析を可能にする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:48:58 GMT)
SOWA: Adapting Hierarchical Frozen Window Self-Attention to Visual-Language Models for Better Anomaly Detection [0.7]
私たちはCLIPモデルに基づくウィンドウ自己認識機構を導入し、学習可能なプロンプトと組み合わせてマルチレベル機能を処理する。提案手法は5つのベンチマークデータセットでテストされ,20項目中18項目をリードすることで,優れた性能を示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:54:03 GMT)
Scoping Review of Active Learning Strategies and their Evaluation Environments for Entity Recognition Tasks [0.6]
我々は62の関連論文を分析し、106のアクティブラーニング戦略を特定した。エクスプロイトベース(60倍)、探索ベース(14倍)、ハイブリッド戦略(32倍)の3つのカテゴリに分類した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:40:35 GMT)
Autonomous Control of a Novel Closed Chain Five Bar Active Suspension via Deep Reinforcement Learning [0.6]
本稿では,シャーシ安定化に着目したアクティブサスペンションシステムについて述べる。 SACをPID(Proportional Integral Derivative)コントロールと併用してシャシーを安定化した。モデルは、周囲の障害物からの距離、障害物の高さ、シャシーの向きを利用して、サスペンションの制御リンクを正確に作動させる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:12:25 GMT)
Generation of intraparticle quantum correlations in amplitude damping channel and its robustness [0.6]
種々の脱コヒーレンスチャネル下での2つの自由度間の粒子内相関について検討した。振幅減衰流の特異な特徴を観察し, 絡み合いが分離状態から始まることを示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:47:12 GMT)
Overdispersion in gate tomography: Experiments and continuous, two-scale random walk model on the Bloch sphere [0.6]
既存のノイズモデルでは,アルゴリズムのランタイム上でのノイズ効果の凝集を適切に捉えることができないことを示す。ゲート操作数の関数として読み出し確率のノイズモデルを開発する。過分散を考慮した2番目のランダムウォークを複数の読み出しスケールで重畳する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:44:53 GMT)
Content-Based Image Retrieval for Multi-Class Volumetric Radiology Images: A Benchmark Study [0.6]
非医用画像上の事前訓練された教師なしモデルからの埋め込みに対して、医用画像上の事前訓練された教師なしモデルからの埋め込みをベンチマークした。ボリューム画像の検索には,テキストマッチングにインスパイアされた遅延インタラクションのランク付け手法を採用する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:00:32 GMT)
Black Box Model Explanations and the Human Interpretability Expectations -- An Analysis in the Context of Homicide Prediction [0.6]
説明可能な人工知能(XAI)に基づく戦略は、ブラックボックスモデルの結果のより良い人間の解釈可能性を促進する。本研究は、殺人予測に関連する現実世界の分類問題に対処する。 6つの異なるXAI手法を使って説明をし、6つの異なる人間の専門家を作成した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:39:08 GMT)
SfM on-the-fly: Get better 3D from What You Capture [0.6]
Structure from Motion (SfM) は、フォトグラメトリー、コンピュータビジョン、ロボティクスなどの分野で、常に研究のホットスポットとなっている。この作業は、オリジナルのSfMの上に構築され、アップデートされたバージョンには3つの新しい進歩があり、より優れた3Dをキャプチャから得ることができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:52:37 GMT)
StreamLTS: Query-based Temporal-Spatial LiDAR Fusion for Cooperative Object Detection [0.6]
我々は、広く使われているデータセットOPV2VとDairV2Xを適応させる、TA-COOD(Time-Aligned Cooperative Object Detection)を提案する。実験結果から, 最先端の高密度モデルと比較して, 完全スパースフレームワークの優れた効率性が確認された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:56:10 GMT)
Craftium: An Extensible Framework for Creating Reinforcement Learning Environments [0.5]
本稿では,リッチな3次元視覚的RL環境を探索・作成するための新しいフレームワークであるCraftiumについて述べる。 Craftiumは、Minetestゲームエンジンと人気のあるGymnasium APIの上に構築されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:38:02 GMT)
Position Paper: Think Globally, React Locally -- Bringing Real-time Reference-based Website Phishing Detection on macOS [0.5]
最近のフィッシング攻撃の急増は、従来の反フィッシング・ブラックリストのアプローチの有効性を弱め続けている。デバイス上でのフィッシング防止ソリューションは、ローカルで高速なフィッシング検出を提供するため、人気が高まっている。コンピュータビジョンとデバイス上の機械学習モデルを組み合わせてウェブサイトをリアルタイムで分析するフィッシング検出ソリューションを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:37:24 GMT)
A Comprehensive View of Personalized Federated Learning on Heterogeneous Clinical Datasets [0.5]
フェデレートラーニング(FL)は、データサイロを克服する上で重要なアプローチである。本研究は,臨床応用に焦点を当てたFL研究の進展に寄与する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:04:06 GMT)
Markerless Multi-view 3D Human Pose Estimation: a survey [0.5]
3D人間のポーズ推定は、複数の関節を検知することで、シーン内のすべての個人の骨格を再構築することを目的としている。 3Dポーズの再構築に関わるすべての課題を解決する方法はまだない。さらに、高い精度の3Dポーズを計算コストで迅速に推測できるアプローチを開発するためには、さらなる研究が必要である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:44:35 GMT)
Adaptive Step-size Perception Unfolding Network with Non-local Hybrid Attention for Hyperspectral Image Reconstruction [0.4]
FISTAアルゴリズムに基づく深層展開ネットワークであるASPUNを提案する。さらに,非局所的ハイブリッドアテンショントランス (NHAT) モジュールを設計し,コンバータの受容場特性をフル活用する。実験の結果, ASPUNは既存のSOTAアルゴリズムよりも優れ, 最高の性能が得られることがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:09:52 GMT)
Piecemeal Quantum Telescope with Super Efficiency [0.4]
ビット・バイ・ビット・イテレーションによる高効率の量子望遠鏡を提案する。恒星角の検出において、少数の入射単光子のみを指数関数的に要求する精度を向上させる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:57:22 GMT)
Zero-failure testing of binary classifiers [0.4]
本稿では,ゼロフェイルテストから得られた性能指標を用いてバイナリ分類器の評価を行う。提案手法の主な特徴は2種類の誤差の非対称な処理である。本稿では,対象者が法定年齢閾値を超えているかどうかを判断するための年齢推定問題に関する提案手法について述べる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:51:10 GMT)
Comparing YOLOv8 and Mask RCNN for object segmentation in complex orchard environments [0.4]
本研究では,一段階のYOLOv8と二段階のMask R-CNN機械学習モデルとの比較を行った。 YOLOv8はMask R-CNNより優れており、信頼性閾値0.5で両方のデータセット間で良好な精度とほぼ完璧なリコールを実現している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:00:58 GMT)
Deterministic entanglement swapping of W states [0.3]
2つのリモートパーティ間での共有3ビットW状態を生成するための決定論的絡み合わせプロトコルを提案する。本稿では,Qiskitシミュレータを用いて実装した量子回路の設計について述べる。提案プロトコルの有効性を実証し,実世界の量子通信シナリオにおける高忠実度W状態生成のための実用的なソリューションを提供する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:27:12 GMT)
Annotating Control-Flow Graphs for Formalized Test Coverage Criteria [0.3]
制御フローグラフにグラフ自体から推測される決定情報をアノテートする方法を示す。我々は,一般的なコンパイラから出力されるCFGを自動的にアノテートするツールとして,アルゴリズムを実装した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:13:03 GMT)
BSH for Collision Detection in Point Cloud models [0.3]
本稿では,Voxel,Octrees and bounding spheres Hierarchies (BSH) を用いた大点雲モデルに対する新しい衝突検出アルゴリズムを提案する。衝突検出アルゴリズムは,境界ボリュームチェックや更新数を削減できるため,ポイントクラウドモデル間の交点を効果的に検出できることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:00:59 GMT)
Digital twin with automatic disturbance detection for real-time optimization of a semi-autogenous grinding (SAG) mill [0.3]
デジタルツインは、閉ループシステムの挙動をエミュレートする3つの相互接続モジュールから構成される。このモデルは68時間の運用に対応するデータで訓練され、8時間の試験データで検証された。デジタルツインは、専門家制御システムで操作されるSAGミルを良好に監督することができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:20:36 GMT)
Quantum references [0.3]
我々は、より大きな量子系のサブシステムを指して、その部分の変更/測定を可能にする「量子参照」の理論を提示する。我々のモデリングは、定理プローバーの形式化や量子プログラムにおける変数のモデル化の基盤として好適である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:59:55 GMT)
TartuNLP @ AXOLOTL-24: Leveraging Classifier Output for New Sense Detection in Lexical Semantics [0.2]
AXOLOTL-24共有タスクに提案する。このタスクは2つのサブタスクから構成される: 単語が時間とともに得られる新しい感覚を識別し、識別された新しい感覚の定義を生成する。適応型バイナリ分類モデルをトレーニングし、使用例とグルースを一致させ、モデルの確率出力を利用して新しい感覚を識別した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:46:39 GMT)
CT2Rep: Automated Radiology Report Generation for 3D Medical Imaging [0.2]
胸部CTを対象とする3次元医用画像のラジオグラフィーレポート作成法について紹介する。比較手法が存在しないことから,医用画像における高度な3次元視覚エンコーダを用いたベースラインを構築し,本手法の有効性を実証する。我々は,CT2Repをクロスアテンションベースのマルチモーダル融合モジュールと階層メモリで拡張し,縦型マルチモーダルデータの取り込みを可能にした。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:04:32 GMT)
A Multivariate Unimodality Test Harnessing the Dip Statistic of Mahalanobis Distances Over Random Projections [0.2]
線形ランダムプロジェクションとポイント・ツー・ポイント・ディスタンシングにより、一次元の一様性原理を多次元空間に拡張する。我々の手法は$alpha$-unimodalityの仮定に根ざし、泥ッドと呼ばれる新しい一様性試験を提示する。理論的および実証的研究は,多次元データセットの一様性評価における本手法の有効性を確認した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:51:38 GMT)
Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.2]
このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:52:48 GMT)
LeDNet: Localization-enabled Deep Neural Network for Multi-Label Radiography Image Classification [0.1]
マルチラベルラジオグラフィー画像分類は、長い間ニューラルネットワーク研究における関心のトピックであった。胸部X線画像を用いて胸部疾患を診断する。胸部疾患を高精度に予測するために,LDNetと呼ばれる局所化アルゴリズムと深層学習アルゴリズムの組み合わせを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:46:30 GMT)
PaSE: Parallelization Strategies for Efficient DNN Training [0.1]
ディープニューラルネットワーク(DNN)のトレーニングには、かなりの計算とメモリの要求が必要である。標準的なプラクティスは、単純さのためにデータ並列性を使用することです。専門家が設計した戦略は、ドメイン固有の知識を使ってケースバイケースで提案されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:21:20 GMT)
HyperSpace: Hypernetworks for spacing-adaptive image segmentation [0.1]
本稿では,ハイパーネットを用いたボクセル間隔のセグメンテーションモデルを提案する。当社のアプローチでは,画像のネイティブ解像度や,ハードウェアや時間制約に調整された解像度で,推論時に画像の処理が可能である。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:09:23 GMT)
Reviewers of Educational Immersive and Extended Reality (XR) experiences: Who is creating these reviews and why? [0.1]
本稿では,教育用没入型・拡張型現実(eduXR の経験と理由)を誰がレビューしているかを検討するために,スコーピングによる文献のレビューを行う。 eduXRのユーザにとって、経験のレビューは、学習ニーズを満たすかどうかを判断するための情報を提供することができる。 eduXRには確立されたレビューシステムはないが、真剣なゲームレビューには関連性があり、一部には重複があるが、すべてではない。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:45:56 GMT)
Narrow Transformer: Starcoder-Based Java-LM For Desktop [0.1]
本稿では,StarCoderBase-1.1B上に構築されたオープンソース専用プログラミング言語NT-Java-1.1Bについて述べる。 NT-Java-1.1Bは、MultiPL-EのJavaコードベンチマークで、ベースモデルと同様のサイズのモデルの大半を上回り、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:54:24 GMT)
Anthropocentric bias and the possibility of artificial cognition [0.0]
大きな言語モデル(LLM)の認知能力を評価するには、人間中心のバイアスを克服する必要がある。本稿では,LLMの能力に拘わらず,補助的要因がLLMのパフォーマンスにどのような影響を与えるかを見極めるとともに,人間の能力と異なるLCMの機械的戦略を排除した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:44:28 GMT)
\boldmath $SU(\infty)$ Quantum Gravity: Emergence of Gravity in an Infinitely Divisible Quantum Universe [0.0]
SU(infty)$-QGRは、重力に対する基本的な量子的アプローチである。宇宙全体のヒルベルト空間は対称性群 $SU(infty)$ を表すと仮定する。我々は、大域的な$SU(infty)$対称性が、宇宙の他の部分系との絡み合いを通して現れることを示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:19:28 GMT)
Wood Surface Inspection Using Structural and Conditional Statistical Features [0.0]
本研究では,木面画像のガウス応答のマグニチュードとラプラシアンからの支持領域抽出に基づく解を提案する。木材表面の自動検査システムを大規模データセット上でテストし,有望な結果を得た。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:44:06 GMT)
When big data actually are low-rank, or entrywise approximation of certain function-generated matrices [0.0]
我々は、特定の分析関数のクラスに対して、そのような行列は$m$に依存しないランクの正確なエントリーワイズ近似を許容する、という文献の議論に反論する。 n × n$ の関数生成行列が次数 $varepsilon$ のエントリーワイド誤差で階数 $mathcalO(log(n) varepsilon-2 Mathrmpolylog(varepsilon-1)$ で近似できる関数のより狭い3つのクラスを記述する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:56:45 GMT)
What AIs are not Learning (and Why): Bio-Inspired Foundation Models for Robots [0.0]
現在のスマートロボットは、手動プログラミング、数学的モデル、計画フレームワーク、強化学習を使って作成されている。 2足歩行ロボットの高コスト(ボディ)は、研究と展開の両方において大きな障害となる。本稿では、人間互換サービスロボットが知っておくべきことに焦点を当てる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:12:26 GMT)
VDMA: Video Question Answering with Dynamically Generated Multi-Agents [0.0]
Ego Challenge 2024は、ビデオクリップに関する質問に対する最も適切な応答を特定することを目的としている。動的生成型マルチエージェント(VDMA)を用いたビデオ質問応答を提案する。本報告では, アプローチの段階, 採用ツール, 実験結果について詳述する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 03:40:36 GMT)
Unlocking the Potential of Metaverse in Innovative and Immersive Digital Health [0.0]
メタバースは、患者のケア、医療教育、そして教育/学習と研究の方法を変えることによって、医療を変革する大きな可能性を秘めている。本稿では、医療の文脈におけるMetaverseの長所と短所について検討し、その可能性を技術とAIの観点から分析する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:08:38 GMT)
Universal work statistics in long-range interacting quantum systems [0.0]
本研究では, 様々な外部駆動に対する長距離システムの応答について検討し, 動的励振に対する頑健さを強調した。本研究は、量子熱力学応用のための長距離相互作用媒質を組み込むことの利点を実証するものである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:04:05 GMT)
True image construction in quantum-secured single-pixel imaging under spoofing attack [0.0]
我々は、スプーフィング攻撃に耐えられるように設計されたQS-SPI(quantum-Secured Single-Pixel Imaging)技術を導入する。動作を制限するしきい値エラーレートを課した従来の量子セキュリティプロトコルとは異なり、我々のアプローチはスプーフ攻撃を識別するだけでなく、真のイメージの再構築を容易にする。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:19:12 GMT)
The role of initial system-environment correlations in the accuracies of parameters within spin-spin model [0.0]
本研究では,環境パラメータの推定を改善するために,初期システム環境相関の効果について検討する。温度推定では, 推定精度を桁違いに向上できるので, 結果が期待できる。結合強度の場合, 相関の場合と非相関の場合において, 連続的に精度が上昇していることが明らかとなった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:25:51 GMT)
The p-Adic Schrödinger Equation and the Two-slit Experiment in Quantum Mechanics [0.0]
p-進量子力学はディラック・ヴォン・ノイマン公理から構成される。 p進量子力学は、空間が離散的な性質を持つ場合、標準量子力学で何が起こるかという問題によって動機付けられている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:05:05 GMT)
Support Vector Based Anomaly Detection in Federated Learning [0.0]
異常検出は、サイバーセキュリティから産業システムまで、様々な領域において重要な役割を果たす。従来の集中型アプローチは、データプライバシに関する課題に遭遇することが多い。この研究は、フェデレートされた環境での異常検出のための2つの革新的なアルゴリズムを導入している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:32:17 GMT)
SineKAN: Kolmogorov-Arnold Networks Using Sinusoidal Activation Functions [0.0]
本稿では,B-Spline 活性化関数の学習可能なグリッドを,重み付けされた正弦関数のグリッドに置き換えるモデルを提案する。 MNISTベンチマークでは,B-Spline Kanモデルよりも優れた,あるいは同等の数値性能を示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 20:53:19 GMT)
Reinforcement learning-based architecture search for quantum machine learning [0.0]
量子機械学習モデルは符号化回路を使用して、データを量子ヒルベルト空間にマッピングする。本稿では,問題固有の符号化回路を生成するために,強化学習技術を用いた新しい手法を提案する。本研究は,QMLモデルの性能向上における問題固有符号化回路の有効性を強調した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:59:22 GMT)
Quantum dynamics of frustrated Josephson junction arrays embedded in a transmission line: an effective XX spin chain with long-range interaction [0.0]
我々は理論的には、散逸のない伝送路に埋め込まれたジョセフソン接合のフラストレーションされたソートゥース鎖に生じる様々な集合量子相について研究する。透過線への$pi$-Josephson接合の直接埋め込みにより、よく分離された細胞の(反)渦の間の短距離および長距離の相互作用を確立することができる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:40:08 GMT)
Quantum Convolutional Neural Network for Phase Recognition in Two Dimensions [0.0]
量子畳み込みニューラルネットワーク(Quantum Convolutional Neural Network, QCNN)は、物質の量子位相を低コストで認識するための量子回路である。ここでは,2次元の位相認識が可能なQCNNを構築し,トーリック符号相から常磁性相への位相遷移を正確に同定する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:38:06 GMT)
Psychology of Artificial Intelligence: Epistemological Markers of the Cognitive Analysis of Neural Networks [0.0]
アシモフが1950年に予言した人工知能の心理学は、このAIの探索と説明可能性に敏感な物質の研究を目的としている。後者を調べるための前提条件は、その現象学に起因する認知状態に関するいくつかのマイルストーンを明らかにすることである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:53:05 GMT)
Physics-Aware Multifidelity Bayesian Optimization: a Generalized Formulation [0.0]
MFBO(Multifidelity Bayesian Method)は、クエリのサブセレクションのみに対して、コストの高い高忠実度応答を組み込むことができる。 State-of-the-artメソッドは純粋にデータ駆動型検索に依存しており、物理的なコンテキストに関する明示的な情報は含まない。本稿では、これらのデータ駆動探索を高速化するために、工学的問題の物理領域に関する事前知識を活用することができることを認めた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:44:12 GMT)
On the performance of sequential Bayesian update for database of diverse tsunami scenarios [0.0]
本研究の目的は,多様なデータベースを用いた津波シナリオ検出フレームワークの性能評価である。シナリオ重畳の有効性を,従来最も可能性の高いシナリオ検出手法と比較した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:46:09 GMT)
On the mathematical description of combined PMD PDL effects in optical communications and how their induced impairments can be minimized [0.0]
PMD-PDL効果は、スピン1/2ゼロ質量粒子に作用するローレンツ変換と正式に同一であることが示されている。 PMD-PDL誘発障害を著しく低減する手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:03:22 GMT)
On temporal entropy and the complexity of computing the expectation value of local operators after a quench [0.0]
本研究では, 1次元量子システムにおける局所演算子の時間依存期待値をシミュレーションする計算複雑性について検討する。時間的行列積状態を用いた局所演算子の時間依存期待値の計算は,同じ量の計算に対して有利である可能性が示唆された。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:18:36 GMT)
On Krylov Complexity [0.0]
この本は、クリロフ複雑性を量子カオスのプローブとして、ホログラフィック複雑性の候補として扱う。ランツォスアルゴリズム、その性質、関連する代数構造、およびその実践的実装に関する技術的な詳細を幅広く紹介する。二重スケールSYKモデルの低エネルギー状態における無限温度熱場二重状態のクリロフ複雑性と重力理論におけるバルク長との正確な解析的対応性を確立する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:57:29 GMT)
Nonperturbative cavity quantum electrodynamics: is the Jaynes-Cummings model still relevant? [0.0]
キャビティ量子電磁力学の研究において,Jaynes-Cummingsモデルが占める役割を簡潔に論じる。非摂動型光物質結合系においても,Jaynes-Cummingsモデルが重要な役割を担っていることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:05:41 GMT)
Non-Myopic Multifidelity Bayesian Optimization [0.0]
本稿では,この最適化の今後のステップから長期報酬を把握するための,非筋電多忠実ベイズフレームワークを提案する。提案アルゴリズムは,一般的なベンチマーク最適化問題において,標準的なマルチ忠実ベイズフレームワークよりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 14:50:57 GMT)
Non-Markovian environment induced anomaly in steady state quantum coherence [0.0]
環境誘起定常量子コヒーレンス(SSQC)は、従来のデコヒーレンスの理解に挑戦する捕食現象である。本研究では, SSQCの環境記憶効果, 浴槽温度, システムバス結合強度, スクイーズパラメータに対する依存性について検討した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:56:43 GMT)
Noise analysis of a quasi-phase-matched quantum frequency converter and higher-order counter-propagating SPDC [0.0]
量子周波数変換(QFC)は、将来の量子技術において欠かせない要素である。ここでは、CW 1064 nmレーザーで励起される周波数コンバータの雑音スペクトルについて検討する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:27:57 GMT)
Network-based Neighborhood regression [0.0]
生物学的モジュールの現在の統計分析は、ネットワークデータを用いることなく、生物学的ネットワーク内の機能モジュールを検出するか、または生物学的特徴のサブグループ回帰を検出することに焦点を当てている。本稿では,グローバルなコミュニティレベルの情報と,エンティティ間のローカル接続構造に依存する,新たなネットワークベースの地区回帰フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:08:40 GMT)
Meta-Learning and representation learner: A short theoretical note [0.0]
メタ学習は機械学習のサブフィールドであり、目標は様々なタスクから学習できるモデルとアルゴリズムを開発することである。特定のタスクを学習することに焦点を当てた従来の機械学習手法とは異なり、メタラーニングは、過去のタスクからの経験を活用して将来の学習を強化することを目的としている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:47:10 GMT)
Measuring multipartite quantum correlations by thermodynamic work extraction [0.0]
本稿では,大域演算と局所演算と古典通信による抽出可能な熱力学的作業の差に基づく,多部量子相関の尺度を提案する。多部量子相関に対する熱力学的アプローチの際立った特徴は、量子相関の度合いと明確な操作的意味を比較することができることである。これは、多部量子相関と量子熱力学の基本的な関係を浮き彫りにするだけでなく、量子多体系の構造を効率的に計算可能なプローブとしても機能することを示している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:58:30 GMT)
Magic spreading in random quantum circuits [0.0]
Calderbank-Shor-Steane entropy は非安定化剤の尺度である。我々の主な発見は、マジックリソースがシステムサイズNにおける時間スケールの対数に等しくなることである。本研究は, カオス多体系における非安定化剤成長の現象を概説するものである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 13:43:46 GMT)
Light-weight End-to-End Graph Interest Network for CTR Prediction in E-commerce Search [0.0]
本稿では,ユーザの検索関心を効果的にマイニングするために,ライトウェイト・エンド・エンド・エンド・グラフ・関心ネットワーク (EGIN) という新しいアプローチを提案する。提案するEGINは,問合せ項目のヘテロジニアスグラフ,軽量グラフサンプリング,多目的ネットワークという3つの部分から構成される。提案したEGINの有効性を実証するため,公立および工業用両方のデータセットについて広範な実験を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:52:06 GMT)
Interacting Circular Rydberg Atoms Trapped in Optical Tweezers [0.0]
円状のリドバーグ原子(CRA)は、理想的には長いコヒーレンス時間と強い相互作用を結合する。両CRA間の共振双極子-双極子相互作用の測定と特性について報告する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:24:53 GMT)
Integrating Randomness in Large Language Models: A Linear Congruential Generator Approach for Generating Clinically Relevant Content [0.0]
本研究は,AIを用いたコンテンツ生成と組み合わせて,系統的事実選択に線形コングルシデント生成法を用いる。消化管生理学と病理学の独自の組み合わせを複数回にわたって確保し,これらの事実をGPT-4oに組み込んで臨床的に有意なビグネットスタイルのアウトプットを創出した。 14ラウンド以上で98のユニークな出力が生成され、LCGが多種多様な高品質なコンテンツを制作する効果を示した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:21:47 GMT)
Implicit Hypersurface Approximation Capacity in Deep ReLU Networks [0.0]
本稿では,ReLUアクティベーションを用いたディープフィードフォワードニューラルネットワークの幾何近似理論を開発する。幅$d+1$の深い完全連結ReLUネットワークは、そのゼロ輪郭として暗黙的に近似を構成することができることを示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 11:34:42 GMT)
How to Evaluate Games in Education: A Literature Review [0.0]
我々は、異なる科学分野で行われた制御実験を要約し、評価することを目的として、異なる研究をレビューし、分析する。本研究は,非実験条件の記述の明確さに焦点をあて,制御グループの活動に使用される教育方法が不十分であることを示す。計算機科学と工学の分野での研究は、一般に、他の分野よりも明らかに結果を報告している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:18:42 GMT)
Holography of Transmission Lines: Insights of Continuous MERA and AdS/CFT [0.0]
我々はAdS空間における伝送線路の量子化と相互作用を分析する。その結果、量子回路における複雑な現象の扱いと制御に関する新たな洞察が得られた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 22:09:31 GMT)
Historical Ink: 19th Century Latin American Spanish Newspaper Corpus with LLM OCR Correction [0.0]
本稿は,19世紀のラテンアメリカのプレステキストのデータセットを新たに提示し,この地域での歴史的・言語学的分析のための特別なコーパスの欠如に対処するものである。大規模言語モデルを用いて,OCR誤り訂正と言語表面形状検出のためのフレームワークをデジタルコーパスで導入する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:10:18 GMT)
GraphCNNpred: A stock market indices prediction using a Graph based deep learning system [0.0]
我々は,テキストS&textP 500,NASDAQ,DJI,NYSE,RASELの指標の傾向を予測するために,さまざまなデータソースに適用可能なグラフニューラルネットワークベースの畳み込みニューラルネットワーク(CNN)モデルを提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:14:24 GMT)
Generalized group designs: overcoming the 4-design-barrier and constructing novel unitary 2-designs in arbitrary dimensions [0.0]
ユニタリ設計は、いくつかの量子情報プロトコルにおいて必須のツールである。本稿では,グループ設計を高度に一般化するための新しい構成法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:23:26 GMT)
General-relativistic wave$-$particle duality with torsion [0.0]
ディラック粒子の4次元速度はその相対論的波動関数に$ui=barpsigammaipsi/barpsipsi$で関連していることを示す。この相対論的波$-$粒子双対関係は、平時時における平面波に関連する自由粒子に対して示される。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:42:22 GMT)
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs [0.0]
FunAudioLLMは、人間と大規模言語モデル(LLM)の間の自然な音声相互作用を強化するために設計されたモデルファミリーである中心となる2つの革新的なモデルとして、多言語音声認識、感情認識、音声イベント検出を処理するSenseVoiceと、複数の言語、音色、話し方、話者識別を制御した自然言語生成を容易にするCosyVoiceがある。 SenseVoiceとCosyVoiceに関連するモデルは、GitHubでリリースされたトレーニング、推論、微調整コードとともに、ModelscopeとHuggingfaceでオープンソース化されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 16:49:02 GMT)
From Data to Commonsense Reasoning: The Use of Large Language Models for Explainable AI [0.0]
本研究では,大規模言語モデル(LLM)の有効性について検討した。モデルが異なるデータセット上で人間より優れており、LLMがコモンセンスで推論できることを実証する。回答者の66%がGPT-3.5の説明を「良い」か「優れている」と評価した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:38:49 GMT)
Finite Operator Learning: Bridging Neural Operators and Numerical Methods for Efficient Parametric Solution and Optimization of PDEs [0.0]
本稿では,ニューラルネットワーク,物理情報処理機械学習,およびPDEを解くための標準的な数値法を組み合わせた手法を提案する。データのない方法で偏微分方程式をパラメトリックに解き、正確な感度を与えることができる。本研究では, 不均一材料中の定常熱方程式に着目した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 21:23:12 GMT)
Feedback-Generation for Programming Exercises With GPT-4 [0.0]
本稿では,プログラミングタスク仕様と学生が入力として提出した入力の両方を含むプロンプトに対して,GPT-4 Turboが生成する出力の品質について検討する。アウトプットは, 正当性, パーソナライゼーション, フォールトローカライゼーション, その他の特徴について質的に分析した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:30:22 GMT)
Federated Hierarchical Tensor Networks: a Collaborative Learning Quantum AI-Driven Framework for Healthcare [0.0]
今日の文脈では、フェデレーテッド・ラーニング(FL)は、分散機械学習の急速な進歩を助長する重要な治療法として際立っている。本稿では,多体量子物理学の原理を応用した量子テンソルネットワークに基づく連合学習フレームワークを提案する。一般的な医用画像データセットを用いた実験により、連合量子テンソルネットワークモデルは、曲線(ROC-AUC)の平均受信特性領域を0.91-0.98の範囲で達成した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 01:27:00 GMT)
Fault-tolerance of the [[8,1,3]] non-CSS code [0.0]
本稿では,フォールトトレラントな非CSS量子誤り訂正符号を提案し,その論理誤差率について検討する。本研究の2種類のノイズモデルを考えると,Brownらによって提示された素アンシラ法の手順を採用する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:03:37 GMT)
FIPGNet:Pyramid grafting network with feature interaction strategies [0.0]
本稿では,特徴相互作用戦略を持つピラミッドグラフトネットワークである新しいサリエンスオブジェクト検出フレームワーク (FIPGNet) を提案する。具体的には,空間エージェントのクロスアテンションを革新的に導入する,注目機構に基づく機能インタラクション戦略(FIA)を提案する。提案手法は,4つの指標に対して,現在の12個の有意な物体検出法より優れていた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:53:37 GMT)
Experimental demonstration of the equivalence of entropic uncertainty with wave-particle duality [0.0]
光の軌道角運動量(OAM)状態を用いた波動-粒子双対性とエントロピー不確実性関係の等価性を実験的に実証した。この結果から,情報の観点からの相補性原理に関する基本的な知見が得られ,量子技術の幅広い分野への示唆がもたらされる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 10:01:42 GMT)
EvolBA: Evolutionary Boundary Attack under Hard-label Black Box condition [0.0]
研究によると、ディープニューラルネットワーク(DNN)には、敵対的事例(AE)の誤認識につながる脆弱性がある。本研究では, HL-BB条件下での共分散行列適応進化戦略 (CMA-ES) を用いて, AE を生成するための EvolBA という逆攻撃手法を提案する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:58:36 GMT)
Differentiating between human-written and AI-generated texts using linguistic features automatically extracted from an online computational tool [0.0]
本研究の目的は,AIが人間の文章をエミュレートする能力を評価することにある。人間の発話を模倣したAI生成テキストが現れるにもかかわらず、結果は複数の言語的特徴に有意な差が認められた。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 05:37:09 GMT)
Deep learning architectures for data-driven damage detection in nonlinear dynamic systems [0.0]
本研究は,非線形力学系におけるデータ駆動型損傷検出に応用した深層学習について詳細に検討する。 1次元畳み込みニューラルネットワークを利用するオートエンコーダ(AE)とジェネレーティブ・敵ネットワーク(GAN)が実装されている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:40:02 GMT)
Convolutional vs Large Language Models for Software Log Classification in Edge-Deployable Cellular Network Testing [0.0]
最大20万文字のコンテキストウインドウを提供する小型畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。私たちのモデルは、テスト実行中の欠陥を特定し、それらを関連する部門(以前は手動のエンジニアリングプロセス)にトリガする能力を持っています。我々のモデルは専用のハードウェアを使わずにエッジデバイスにデプロイでき、様々な業界のソフトウェアログに広く適用できます。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 09:12:08 GMT)
Controlling Many-Body Quantum Chaos: Bose-Hubbard systems [0.0]
この研究は、光学格子に閉じ込められた超低温のボゾンガスに対する多体量子カオスの量子制御応用を開発する。ターゲティングとして知られるテクニックでは、制御の障害ではなく、不安定がリソースとなる。量子多体傷のカスタム状態準備と安定化への明示的な応用を1次元および2次元格子で示す。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 12:29:39 GMT)
Constant search time algorithm via topological quantum walks [0.0]
本研究では,探索確率を極端に改善した探索時間量子アルゴリズムの実現が可能であることを示す。具体的には,2次元分割型量子ランダムウォークによって実現された空間探索アルゴリズムについて検討する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:03:33 GMT)
Complementarity-based complementarity [0.0]
量子系が提示できる相補性の量は、どの相補的性質を考慮しているかによって異なることを示す。この性質は初めて実験的に発見され、実験的な発見が量子情報効果を開示できることを実証した。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:57:34 GMT)
Collective transition quenching in the presence of multiple competing decay channels [0.0]
集合遷移クエンチング(collective transition quenching)は、複数の崩壊チャネルを持つ系で起こる量子多体散逸現象である。置換対称性の存在下では、この問題は任意の競合するチャネルに対して正確に解決可能であることを証明している。本研究は,量子システムの構築と制御における多体戦略の新たな道を開くものである。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 19:13:48 GMT)
Can Base ChatGPT be Used for Forecasting without Additional Optimization? [0.0]
本研究では,OpenAI の ChatGPT-3.5 と ChatGPT-4 が今後の事象を予測できるかどうかを検討する。私たちは、直接予測と将来の物語と呼ばれる2つの促進戦略を採用しています。 100の試行を解析した結果,将来の物語はChatGPT-4の予測精度を大幅に向上させることがわかった。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 23:03:45 GMT)
CATT: Character-based Arabic Tashkeel Transformer [0.0]
タシュケル(Tashkeel)は、アラビア語のテキストの理解を大幅に強化する。本稿では,ATDモデルのトレーニングに新たなアプローチを提案する。 11の商用およびオープンソースモデルとともに、当社のモデルを評価します。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:06:33 GMT)
Bias Correction in Machine Learning-based Classification of Rare Events [0.0]
オンラインプラットフォームビジネスは、Webスクラッドテキストを使用して識別することができる。これは自然言語処理とまれな事象検出の要素を組み合わせた分類問題である。ここでは、偽陽性を減らす機械学習ベースのテキスト分類手法の開発について述べる。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:02:34 GMT)
BM25S: Orders of magnitude faster lexical search via eager sparse scoring [0.0]
BM25Sは、NumpyとScipyのみに依存する、効率的なPythonベースのBM25の実装である。最も人気のあるPythonベースのフレームワークと比較して最大500倍のスピードアップを実現している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 04:01:05 GMT)
Autoencoded Image Compression for Secure and Fast Transmission [0.0]
本稿では,画像圧縮のためのオートエンコーダアーキテクチャを提案する。提案アーキテクチャは、再生した画像に対して97.5%のSSIMを実現し、平均遅延時間を87.5%削減する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:07:39 GMT)
Application of Magnus expansion for the quantum dynamics of $Λ$-systems under periodic driving and assessment of the rotating wave approximation [0.0]
2つの正弦波時間依存場によって駆動される$Lambda$-systemの量子力学計算を行う。閉系力学について、ヒルベルト空間とリウヴィル空間における力学の同値性を数値的に確認する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 02:02:37 GMT)
Advanced Artificial Intelligence Strategy for Optimizing Urban Rail Network Design using Nature-Inspired Algorithms [0.0]
本研究では,インド・タミル・ナドゥ州チェンナイの都市環境におけるメトロネットワークルート計画の革新的方法論を紹介する。改良型Ant Colony Optimization (ACO)法の比較分析により, 改良型Ant Colony Optimization (ACO)法と, 改良型Ant Colony Optimization (ACO)法との比較を行った。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 17:57:39 GMT)
AI in Remote Patient Monitoring [0.0]
この章では、遠隔患者モニタリング(RPM)におけるAIの統合について説明する。本稿では、AIが監視精度、予測分析、パーソナライズされた治療計画を強化する方法について概説する。この章では、この分野における課題と今後の方向性についても論じている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:33:57 GMT)
A quantum approach for optimal control [0.0]
非線形最適制御問題のクラスを解くための新しい変分量子アプローチを提案する。我々のアプローチは、ディラックの力学系の正準量子化と非エルミートハミルトニアン基底状態の解を統合する。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 07:14:55 GMT)
A Quantum Information Perspective on Many-Body Dispersive Forces [0.0]
我々は, エンタングルメントとエネルギーの関係を解析的に決定し, エンタングルメント分布が分散結合をいかに支配するかを示した。このことは、絡み合いのモノガミーが多部分散結合エネルギーの偏差を説明することを示唆している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 18:30:40 GMT)
A Formal Analysis of Iterated TDD [0.0]
テスト駆動開発(TDD)と呼ばれるソフトウェア方法論を正式に分析します。反復されたTDDが、反復されたコードチャーンの観点から安定しながら、'証明可能な正しいコード'を確実に生成するコンテキストを見つけます。我々は、以前の研究で見いだされた'有効'の反復TDDの発見は、この文脈を欠いたことによるものであり、'有効'の反復TDDの発見は、誤ってコンテキストに落ちたり、単にプラセボに落ちてしまうことによるものである、と論じている。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 08:07:35 GMT)
A Critical Assessment of Interpretable and Explainable Machine Learning for Intrusion Detection [0.0]
本稿では,過度に複雑で不透明なMLモデル,不均衡なデータと相関した特徴,異なる説明法における不整合な影響特徴,そして説明の不可能な有用性について検討する。具体的には、Deep Neural Networksのような複雑な不透明モデルを避け、代わりにDecision Treesのような解釈可能なMLモデルを使用することを推奨する。機能ベースのモデル説明は、多くの場合、異なる設定で矛盾している。
論文参考訳（メタデータ） (Thu, 4 Jul 2024 15:35:42 GMT)