Do Generalised Classifiers really work on Human Drawn Sketches? [122.1] 本稿では,人間のスケッチ理解を伴う大規模基礎モデルについて述べる。
一般的なスケッチ表現学習という観点からのパラダイムシフトです。
我々のフレームワークは、ゼロショットと少数ショットの両方で一般的なスケッチ表現学習アルゴリズムを超越している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:37:08 GMT)
Hadamard Adapter: An Extreme Parameter-Efficient Adapter Tuning Method for Pre-trained Language Models [108.1] 事前訓練された言語モデル(PLM)は大量のパラメータを持ち、微調整は高価で時間を要することが多い。
ダウンストリームタスクにおける性能を損なうことなく、微調整時にPLMのパラメータを減らすためのパラメータ効率のアプローチを採用する必要がある。
本稿では, PLMにおける自己注意出力のみに作用する新しいアダプタを設計する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:21:28 GMT)
RoScenes: A Large-scale Multi-view 3D Dataset for Roadside Perception [98.8] RoScenesは、最大規模のマルチビューロードサイド認識データセットである。
私たちのデータセットは、驚くべき21.13Mの3Dアノテーションを64,000$m2$で達成しています。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:14:18 GMT)
MS2SL: Multimodal Spoken Data-Driven Continuous Sign Language Production [93.3] 我々は,手話と非手話のユーザ間のコミュニケーションを緩和する,連続手話生成のための統一フレームワークを提案する。
テキストや音声から抽出した埋め込みを利用したシーケンス拡散モデルを作成し、段階的にサイン予測を生成する。
How2SignとPHOENIX14Tデータセットの実験により、手話生成において、我々のモデルが競合性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:53:50 GMT)
LLM-jp: A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs [90.3] 本稿では,LLM-jpについて紹介する。LLM-jpは,日本語大言語モデル(LLM)の研究・開発のためのクロスオーガナイゼーションプロジェクトである。
この執筆時点で、学界や産業界から1,500人以上の参加者がこの目的のために協力している。
最新のアクティビティについては、https://llm-jp.nii.ac.jp/en/.com/を参照してください。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:33:03 GMT)
Measuring Orthogonality in Representations of Generative Models [81.1] 教師なしの表現学習において、モデルは高次元データから低次元の学習表現に不可欠な特徴を蒸留することを目的としている。
独立した生成過程の切り離しは、長い間、高品質な表現を生み出してきた。
我々は、IWO(Importance-Weighted Orthogonality)とIWR(Importance-Weighted Rank)の2つの新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:21:54 GMT)
Can Pre-trained Language Models Understand Chinese Humor? [75.0] 本論文は,事前学習言語モデル(PLM)のユーモア理解能力を体系的に研究する最初の論文である。
提案した評価フレームワークのすべてのデータ要件を完全に満たす中国の総合的ユーモアデータセットを構築した。
中国のユーモアデータセットに関する実証的研究は、ユーモア理解と生成におけるPLMの将来の最適化に非常に役立つ貴重な観察結果をもたらす。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:13:38 GMT)
Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset [74.7] Emotion and Intent Joint Understanding in Multimodal Conversation (MC-EIU)は、マルチモーダルな会話履歴に現れる意味情報をデコードすることを目的としている。
MC-EIUは多くのヒューマン・コンピュータ・インタフェースのテクノロジーを実現している。
MC-EIUデータセットは,7つの感情カテゴリー,9つの意図カテゴリ,3つのモダリティ,すなわちテキスト,音響,視覚的内容,および英語とマンダリンの2つの言語を特徴とする。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:13:24 GMT)
MAPO: Boosting Large Language Model Performance with Model-Adaptive Prompt Optimization [73.8] 異なるプロンプトを異なるLarge Language Models (LLM) に適応させることで,NLP の様々な下流タスクにまたがる機能の向上が期待できる。
次に、下流タスクにおける各LLMに対して、元のプロンプトを最適化するモデル適応プロンプト(MAPO)手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:39:59 GMT)
Query-oriented Data Augmentation for Session Search [71.8] 本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:08:33 GMT)
MultiIoT: Benchmarking Machine Learning for the Internet of Things [70.7] 次世代の機械学習システムは、物理的世界に対する知覚と相互作用に長けなければならない。
運動、熱、位置情報、深度、無線信号、ビデオ、オーディオからの知覚データは、物理環境の状態をモデル化するためにますます使われています。
既存の取り組みは、しばしば単一の感覚的モダリティまたは予測タスクに特化している。
本稿は、12のモダリティと8つの現実世界タスクから115万以上のサンプルを含む、これまでで最も拡張的で統一されたIoTベンチマークであるMultiIoTを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:16:47 GMT)
Hallucination Detection: Robustly Discerning Reliable Answers in Large Language Models [70.2] 大規模言語モデル(LLM)は様々な自然言語処理タスクで広く採用されている。
それらは、入力源から逸脱する不信または矛盾したコンテンツを生成し、深刻な結果をもたらす。
本稿では,LLMの生成した回答の幻覚を効果的に検出するために,RelDという頑健な識別器を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:47:42 GMT)
Unlocking the Potential of Model Merging for Low-Resource Languages [66.8] 大規模言語モデルを新しい言語に適応させるには、通常、継続事前訓練(CT)と、教師付き微調整(SFT)が含まれる。
我々は低リソース言語の代替としてモデルマージを提案し、異なる機能を持つモデルを追加トレーニングなしで単一のモデルに組み合わせる。
Llama-2-7Bをベースとした実験により、モデルマージはタスク解決能力の低い低リソース言語に対して、極めて少ないデータを持つシナリオにおいて、CT-then-SFTよりも優れていることが実証された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:14:17 GMT)
Systematic Task Exploration with LLMs: A Study in Citation Text Generation [63.5] 大規模言語モデル(LLM)は、複雑な創造的自然言語生成(NLG)タスクの定義と実行において、前例のない柔軟性をもたらす。
本稿では,系統的な入力操作,参照データ,出力測定からなる3成分研究フレームワークを提案する。
我々はこのフレームワークを用いて引用テキスト生成を探索する。これは一般的なNLPタスクであり、タスク定義と評価基準に関するコンセンサスを欠いている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:41:08 GMT)
KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.2] 大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。
現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。
このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:31:38 GMT)
Oracle Bone Inscriptions Multi-modal Dataset [58.2] オラクルの骨碑文(Oracle bone inscriptions, OBI)は中国最古の書記体系であり、初期の上海の歴史や古史の貴重な実例を記している。
本稿では,10,077個のオラクル骨の注釈情報を含むOracle Bone Inscriptions Multi-modalデータセットを提案する。
このデータセットは、OBIの文字検出と認識、ラビングDenoising、キャラクタマッチング、キャラクタ生成、読み込みシーケンス予測、ミスキャラクタ補完タスクなど、OBIの分野に関連するさまざまなAI関連研究タスクに使用することができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:47:32 GMT)
A Review of Modern Recommender Systems Using Generative Models (Gen-RecSys) [57.3] この調査は、ジェネレーティブモデル(Gen-RecSys)を用いたレコメンデーションシステムにおける重要な進歩を結びつける。
対話駆動生成モデル、自然言語レコメンデーションのための大規模言語モデル(LLM)とテキストデータの使用、RSにおける画像やビデオの生成と処理のためのマルチモーダルモデルの統合。
我々の研究は、Gen-RecSysの影響と害を評価するために必要なパラダイムを強調し、オープンな課題を特定します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:06:42 GMT)
NegotiationToM: A Benchmark for Stress-testing Machine Theory of Mind on Negotiation Surrounding [55.4] 現在、マインド評価の理論は、機械生成データやゲーム設定を用いたテストモデルに焦点を合わせており、ショートカットや素早い相関が生じる傾向にある。
我々は,多次元精神状態を取り巻く実世界の交渉において,ストレステストマシンToMのための新しいベンチマークであるNegotiationToMを紹介する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:14:38 GMT)
Collection, usage and privacy of mobility data in the enterprise and public administrations [55.2] 個人のプライバシーを守るためには、匿名化などのセキュリティ対策が必要である。
本研究では,現場における実践の洞察を得るために,専門家によるインタビューを行った。
我々は、一般的には最先端の差分プライバシー基準に準拠しない、使用中のプライバシー強化手法を調査した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:29:27 GMT)
Fast Learning of Signed Distance Functions from Noisy Point Clouds via Noise to Noise Mapping [54.4] 点雲から符号付き距離関数を学習することは、3Dコンピュータビジョンにおいて重要な課題である。
クリーンポイントクラウドや地上の真理監督を必要としないノイズ・ノイズマッピングを用いてSDFを学習することを提案する。
我々の新しい特徴はノイズ・ト・ノイズマッピングにあり、1つの物体やシーンの高精度なSDFを、その多重または単一ノイズの観測から推測することができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:35:02 GMT)
Geodesic Optimization for Predictive Shift Adaptation on EEG data [53.6] ドメイン適応メソッドは、$X$と$y$で分散シフトが同時に発生したときに苦労する。
本稿では,GOPSA(Geodesic Optimization for Predictive Shift Adaptation)と呼ばれる新しい手法を提案する。
GOPSAは、脳波のバイオメディカル応用のための混合効果モデリングと機械学習を併用する可能性を持っている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:15:42 GMT)
HAF-RM: A Hybrid Alignment Framework for Reward Model Training [51.6] 報酬モデルトレーニングのためのハイブリッドアライメントフレームワークHaF-RMを提案する。
報酬モデルのパフォーマンスとアライメントを高めるための、原則的で効果的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 23:26:56 GMT)
Solutions to Deepfakes: Can Camera Hardware, Cryptography, and Deep Learning Verify Real Images? [51.3] 信頼性の高い合成データから実際のデータを分離する手法を確立することが不可欠である。
この文書は、どの画像が本物かを検証するために使用できる検出と暗号に関する既知の戦略を提示することを目的としている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:01:21 GMT)
PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.2] 私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:00:25 GMT)
Planning with Large Language Models for Conversational Agents [51.1] 自律会話エージェント(CA)の制御性と能動性は重要な性質である
大規模言語モデル(LLM)を利用した計画型対話エージェントのための新しいフレームワークを提案する。
実験の結果,PCA-Dで微調整されたLCMは性能を著しく向上し,未確認領域に一般化できることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:23:02 GMT)
Investigating the Role of Instruction Variety and Task Difficulty in Robotic Manipulation Tasks [50.8] 本研究は、そのようなモデルの一般化能力における命令と入力の役割を体系的に検証する包括的評価フレームワークを導入する。
提案フレームワークは,極度の命令摂動に対するマルチモーダルモデルのレジリエンスと,観測的変化に対する脆弱性を明らかにする。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:36:49 GMT)
View-Consistent 3D Editing with Gaussian Splatting [50.6] 画像編集プロセスに3DGSをシームレスに組み込むフレームワークであるView-Consistent Editing (VcEdit)を導入する。
一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:23:04 GMT)
Stephanie: Step-by-Step Dialogues for Mimicking Human Interactions in Social Conversations [48.6] 本研究では,人間の会話の動的な性質を模倣する新しいテキストbf-by-Step Dialogue Paradigm (Stephanie)を提案する。
デュアルラーニング戦略と,さらに分割した後編集手法を用いて,高品質なステップバイステップ対話データセットを作成した。
従来の単段階対話のパラダイムと比較して,その効果を評価するために,自動評価と人的評価を行った。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:59:41 GMT)
Benchmark on Drug Target Interaction Modeling from a Structure Perspective [48.6] 薬物と標的の相互作用の予測は、薬物の発見と設計に不可欠である。
グラフニューラルネットワーク(GNN)やトランスフォーマーに基づく最近の手法は、さまざまなデータセットで例外的なパフォーマンスを示している。
我々は,GNNベースと暗黙的(トランスフォーマーベース)構造学習アルゴリズムを多用することにより,構造の観点からの薬物-標的相互作用モデリングの総合的な調査とベンチマークを行う。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:56:59 GMT)
What Does the Bot Say? Opportunities and Risks of Large Language Models in Social Media Bot Detection [48.6] ソーシャルボット検出における大規模言語モデルの可能性とリスクについて検討する。
本稿では,多様なユーザ情報モダリティを分割し,克服するための混合異種エキスパートフレームワークを提案する。
実験により、1000の注釈付き例に対する命令チューニングは、最先端のベースラインよりも優れた特殊なLLMを生成することが示された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 23:37:40 GMT)
Improving Self-supervised Pre-training using Accent-Specific Codebooks [48.4] 自己教師型学習のためのアクセント認識適応技術
Mozilla Common Voiceデータセットでは、提案手法は他のアクセント適応手法よりも優れています。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:33:52 GMT)
Contemporary Software Modernization: Perspectives and Challenges to Deal with Legacy Systems [48.3] 2000年代初頭に研究テーマとして「ソフトウェア近代化」が登場した。
文学では膨大な量の著作があるにもかかわらず、かなりの限界がある。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:49:52 GMT)
A Survey of Temporal Credit Assignment in Deep Reinforcement Learning [47.2] クレディ・アサインメント問題(Capital Assignment Problem, CAP)とは、強化学習(Reinforcement Learning, RL)エージェントが長期的な結果と行動を関連付けるための長年にわたる課題を指す。
我々は、最先端のアルゴリズムの公平な比較を可能にする信用の統一形式性を提案する。
我々は、遅延効果、転置、行動への影響の欠如に起因する課題について論じ、既存の手法がそれらにどう対処しようとしているのかを分析した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:32:18 GMT)
Using LLMs for the Extraction and Normalization of Product Attribute Values [47.1] 本稿では,大規模言語モデル(LLM)を用いて,製品タイトルや記述から属性値の抽出と正規化を行う可能性について検討する。
実験のために、Web Data Commons - Product Attribute Value extract (WDC-PAVE)ベンチマークデータセットを紹介します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:12:38 GMT)
DiffRetouch: Using Diffusion to Retouch on the Shoulder of Experts [45.7] DiffRetouch という拡散型リタッチ方式。
4つの画像属性を調整可能とし、ユーザフレンドリーな編集機構を提供する。
テクスチャ歪みと制御感度の問題をそれぞれ扱うために,アフィン二元格子とコントラスト学習方式を導入する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:09:42 GMT)
A Computer Vision Approach to Estimate the Localized Sea State [45.5] 本研究では,リアルタイム海況認識のためのコンピュータビジョン(CV)と深層学習の新たな応用法を提案する。
特に,本研究は,船橋に設置した静止カメラ1台で捉えた作業封筒内の海像の活用に重点を置いている。
海の状態を認識するために,様々なコンピュータビジョンタスクで有用な特徴を持つ4つの最先端ニューラルネットワークを用いた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:07:25 GMT)
Heterogeneous Hypergraph Embedding for Recommendation Systems [45.5] 知識強化ヘテロジニアスハイパーグラフレコメンダシステム(KHGRec)について紹介する。
KHGRecは、相互作用ネットワークとKGの両方のグループワイド特性を捉え、KGの複雑な接続をモデル化する。
入力グラフからの信号を、クロスビューで自己教師付き学習とアテンションメカニズムで融合する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:09:11 GMT)
Scalable Learned Model Soup on a Single GPU: An Efficient Subspace Training Strategy [45.5] モデルスープの変種であるLearned-Soupは、パフォーマンスを大幅に改善するが、メモリと時間コストが大幅に低下する。
本稿では,この問題に対処するために,メモリ効率の高いハイパープレーン学習スープ(MEHL-Soup)を提案する。
テスト精度ではMEHL-Soup(+)がLearred-Soup(+)より優れており,メモリ使用量も13ドル以上削減されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:23:22 GMT)
TieBot: Learning to Knot a Tie from Visual Demonstration through a Real-to-Sim-to-Real Approach [42.9] この研究は、ロボットがネクタイを結びつくことを学べるリアルタイムの学習システムTieBotを紹介している。
実演ビデオからネクタイのメッシュ列を推定する階層的特徴マッチング手法を提案する。
実世界の実験では、デュアルアームロボットがネクタイを結び、10回の試験で50%の成功率を達成した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:03:54 GMT)
Uncertainty-Guided Optimization on Large Language Model Search Trees [42.7] ビームサーチ(ビームサーチ)は、最大確率の列を見つけるための標準的な木探索アルゴリズムである。
よりデータ効率のよい探索手法を実現するために,非ミオピー的ベイズ最適化型取得関数を提案する。
本手法は,ビームサーチよりも少ないノードを拡張しながら,同じあるいは高い可能性を達成する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:08:50 GMT)
"My Answer is C": First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models [40.9] 言語生成のオープンな性質は、大規模言語モデル(LLM)の評価を困難にしている。
1つの一般的な評価手法は、応答空間を制限するためにMulti-choice Question (MCQ) を用いる。
そこで本研究では,テキストの出力を数次元で評価する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:51:29 GMT)
KG-Rank: Enhancing Large Language Models for Medical QA with Knowledge Graphs and Ranking Techniques [40.7] KG-Rankは、医療領域における長文質問応答(QA)の事実性を改善するためのフレームワークである。
質問を受けると、KG-Rankは質問内の医療エンティティを自動的に識別し、関連するトリプルを検索する。
KG-RankはKGの最初の応用であり、医学的QAのランキングモデルと組み合わせて長い回答を生成する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:45:07 GMT)
Unified Medical Image Pre-training in Language-Guided Common Semantic Space [39.6] 我々はUnified Medical Image Pre-Trainingフレームワーク(UniMedI)を提案する。
UniMedIは、診断レポートを一般的な意味空間として使用し、医療画像の多様なモダリティの統一表現を作成する。
10種類のデータセットにまたがる2次元画像と3次元画像の性能評価を行った。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:56:00 GMT)
Evaluation of phase shifts for non-relativistic elastic scattering using quantum computers [39.6] 本研究は, 量子コンピュータ上での一般相対論的非弾性散乱過程の位相シフトを求めるアルゴリズムの開発を報告する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 21:11:05 GMT)
Perception-Guided Quality Metric of 3D Point Clouds Using Hybrid Strategy [38.9] フルリファレンスポイントクラウド品質評価(FR-PCQA)は、歪んだポイントクラウドの品質を利用可能なリファレンスで推測することを目的としている。
既存のFR-PCQAメトリクスのほとんどは、人間の視覚システム(HVS)が様々な歪みレベルに応じて視覚情報に動的に取り組むという事実を無視している。
本稿では,2つの視覚的戦略を歪み度に関して適応的に活用し,点雲の質を予測するための知覚誘導ハイブリッド計量(PHM)を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:23:39 GMT)
Occupancy as Set of Points [38.9] Occupancy as Set of Points (OSP)は、ポイントベースの3D占有率予測のための新しいフレームワークである。
OSPは既存のメソッドと比較して高いパフォーマンスを実現し、トレーニングや推論の点で優れています。
Occ3D nuScenes占有ベンチマークの実験によると、OSPはパフォーマンスと柔軟性が強い。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:46:22 GMT)
DART: Deep Adversarial Automated Red Teaming for LLM Safety [38.4] 大規模言語モデル(LLM)における安全性の脆弱性を検出するために,DART(Deep Adversarial Automated Red Teaming)フレームワークを提案する。
実験により、DARTは目標LLMの安全性を著しく低下させることが示された。
人間によるArthhropic Harmlessデータセットの評価では、DARTは違反リスクを53.4%削減している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:14:27 GMT)
Bias of Stochastic Gradient Descent or the Architecture: Disentangling the Effects of Overparameterization of Neural Networks [37.0] 本稿では,学習ミスをゼロにするランダムネットワークとSGD最適化ネットワークを研究することによって,一般化に影響を与える要因を解消することを目的とする。
実験により, 低試料状態下では, 幅の増大によるパラメータ化が一般化に有用であることが確認された。
深度を増大させるため、パラメータ化は一般化には有害であるが、ランダムおよびSGD最適化ネットワークも同様に振る舞うので、これはアーキテクチャ上のバイアスに起因する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:29:50 GMT)
Spherical Mask: Coarse-to-Fine 3D Point Cloud Instance Segmentation with Spherical Representation [35.9] 球面表現に基づく新しい粗粒化手法である球面マスクを紹介する。
具体的には、中心距離と半径距離の予測を用いて、各ケースを3次元ポリゴンで推定する。
ScanNetV2,S3DIS,LS3Dの3つのデータセットによる実験結果から,提案手法が既存手法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:29:32 GMT)
An Information Bottleneck Perspective for Effective Noise Filtering on Retrieval-Augmented Generation [35.8] 情報ボトルネック理論を検索強化世代に導入する。
提案手法では,圧縮と地盤出力の相互情報を同時に最大化することにより,ノイズのフィルタリングを行う。
我々は,情報ボトルネックの定式化を導出し,新たな包括的評価を行う。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:21:39 GMT)
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking [35.4] 大きな言語モデル(LLM)は、一般的でない言及を解釈する上で、より堅牢である。
LLM-Augmented Entity Linking LLMAELは,エンティティリンクを強化するためのプラグイン・アンド・プレイ方式である。
6つの標準データセットの実験では、ほとんどの場合、バニラLLMAELはベースラインELモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:55:13 GMT)
TongGu: Mastering Classical Chinese Understanding with Knowledge-Grounded Large Language Models [35.4] 古典中国語は古代中国の豊かな遺産と知恵の入り口であるが、その複雑さは重大な理解障壁となっている。
大規模言語モデル(LLM)は自然言語処理(NLP)において顕著な能力を示している。
本稿は,CCU 固有の LLM である textbfTongGu を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:52:23 GMT)
A Systematic Survey and Critical Review on Evaluating Large Language Models: Challenges, Limitations, and Recommendations [35.1] 大規模言語モデル(LLM)は、その顕著な能力により、最近大きな注目を集めている。
我々はこれらの不整合や信頼できない評価を引き起こす主要な課題と限界を体系的にレビューする。
批判的なレビューに基づいて、LLM評価が再現可能で、信頼性があり、堅牢であることを保証するために、私たちの視点と勧告を提示します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:15:37 GMT)
Generalizing Graph Transformers Across Diverse Graphs and Tasks via Pre-Training on Industrial-Scale Data [34.2] PGT(Pre-trained Graph Transformer)と呼ばれるスケーラブルなトランスフォーマーベースのグラフ事前学習フレームワークを導入する。
本フレームワークは,産業用データセットと公共用データセットの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:14:09 GMT)
Explicitly Guided Information Interaction Network for Cross-modal Point Cloud Completion [34.1] 本稿では,ビュー誘導ポイントクラウドコンプリートタスクのモデルであるEGIInet(Explicitly Guided Information Interaction Network)を紹介する。
EGIInetは、完了タスクの幾何学的性質を活用することにより、2つのモードからの情報を効率的に結合する。
本稿では,ネットワークが画像内の重要な情報を特定するのに役立つ情報インタラクション戦略を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:57:47 GMT)
Ultrafast jet classification on FPGAs for the HL-LHC [33.9] 3つの機械学習モデルを用いてジェット起源分類を行う。
これらのモデルは、フィールドプログラム可能なゲートアレイデバイスにデプロイするために最適化されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:39:20 GMT)
Improving Sample Efficiency of Reinforcement Learning with Background Knowledge from Large Language Models [33.5] 低サンプリング効率は強化学習(RL)の持続的課題である
環境の背景知識を抽出するために,大規模言語モデルを利用するフレームワークを導入する。
実験により, 下流タスクのスペクトルにおいて, サンプル効率が著しく向上することが確認された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:33:47 GMT)
Attribute First, then Generate: Locally-attributable Grounded Text Generation [33.4] 本稿では,簡潔な属性を優先する局所帰属型テキスト生成手法を提案する。
Attribute First, then Generate"と名付けられたこの手法は,従来のエンドツーエンド生成プロセスを3つの直感的なステップに分解する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:07:58 GMT)
Is Aggregation the Only Choice? Federated Learning via Layer-wise Model Recombination [33.1] 我々はFedMR(Federated Model Recombination)という新しいFLパラダイムを提案する。
FedMRの目標は、フラットな領域に向けてトレーニングされる組換えモデルをガイドすることである。
最先端のFL手法と比較して、FedMRは各クライアントのプライバシを公開することなく、推論精度を大幅に向上させることができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:22:01 GMT)
VEGS: View Extrapolation of Urban Scenes in 3D Gaussian Splatting using Learned Priors [32.0] 本研究では,左,右,下などの視界の再構成を評価することで,外挿ビュー合成(EVS)問題に対処する。
我々の知る限りでは、都市景観再建におけるESV問題に最初に取り組む人物である。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:27:15 GMT)
CS3: Cascade SAM for Sperm Segmentation [31.1] 精子重複問題に対処するために設計された無監督のアプローチであるCascade SAM for Sperm(CS3)を提案する。
主要な医療機関と共同で約2000枚の未ラベル精子画像からなるデータセットを作成した。
実験の結果,既存手法と比較してCS3の性能は優れていた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:32:34 GMT)
Biometric Authentication Based on Enhanced Remote Photoplethysmography Signal Morphology [31.0] リモート・フォトプレソグラフィー (Remote Photoplethhymography) は、顔画像から心臓の信号を計測する非接触法である。
近年の研究では、各個人が生体認証識別子として使用できる独自のc信号形態を持っていることが示されている。
提案手法では,rの認証モデルをトレーニングするために,対象ID付き顔画像のみを識別する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 19:00:34 GMT)
Improving Accented Speech Recognition using Data Augmentation based on Unsupervised Text-to-Speech Synthesis [31.0] 本稿では、アクセント付き音声認識を改善するためのデータ拡張手法として、教師なし音声合成(TTS)の使用について検討する。
TTSシステムは、手書き文字起こしではなく、少量のアクセント付き音声訓練データとそれらの擬似ラベルで訓練される。
この手法により,アクセント付き音声認識のためのデータ拡張を行うために,手書きの書き起こしを伴わないアクセント付き音声データを使用することが可能である。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:42:24 GMT)
Securing Multi-turn Conversational Language Models Against Distributed Backdoor Triggers [29.6] マルチターン会話型大規模言語モデル(LLM)は、バックドア攻撃に影響を及ぼすデータに対して脆弱である。
LLMは、バックドアのトリガーが複数の発話にまたがる、より有害でステルス的なバックドア攻撃の危険にさらされている。
本稿では,より困難なマルチターン対話設定のための新しい防衛戦略を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 20:57:06 GMT)
Real-time Cyberattack Detection with Collaborative Learning for Blockchain Networks [29.5] ブロックチェーンネットワークを保護するために,効率的な協調型サイバー攻撃検出モデルを提案する。
提案する検出モデルは,ブロックチェーンネットワークにおける攻撃を最大97%の精度で検出できる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:39:49 GMT)
Learning Video Temporal Dynamics with Cross-Modal Attention for Robust Audio-Visual Speech Recognition [29.4] 音声-視覚音声認識は、音声とビデオの両方のモダリティを用いて人間の音声を転写することを目的としている。
本研究では,映像データ中の3つの時間的ダイナミクスを学習することにより,映像特徴の強化を図る。
LRS2 と LRS3 の AVSR ベンチマークにおいて,ノイズ優越性設定のための最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:25:20 GMT)
MineNetCD: A Benchmark for Global Mining Change Detection on Remote Sensing Imagery [29.4] リモートセンシング画像を用いた地球規模の地雷検出のためのベンチマークであるMineNetCDを紹介する。
まず,両時間高分解能リモートセンシング画像の70万枚以上のパッチを用いたグローバルな地雷変化検出データセットを構築した。
次に,変更対応のFast Fourier Transform (ChangeFFT) モジュールをベースとした新しいベースラインモデルを提案する。
第3に、13以上の高度な変更検出モデルを統合する統合された変更検出フレームワークを構築する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:45:44 GMT)
SpikeGS: Reconstruct 3D scene via fast-moving bio-inspired sensors [28.7] Spike Gausian Splatting (SpikeGS)は、スパイクストリームを3DGSパイプラインに統合し、素早く動くバイオインスパイアされたカメラで3Dシーンを再構築するフレームワークである。
SpikeGSは、高時間分解能から詳細な幾何学とテクスチャを抽出するが、スパイクストリームを欠いたテクスチャは、1秒でキャプチャされた3Dシーンを再構成する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:32:12 GMT)
ChartGemma: Visual Instruction-tuning for Chart Reasoning in the Wild [28.6] 本稿では,PaliGemma上で開発された新しいチャート理解と推論モデルであるChartGemmaを紹介する。
基礎となるデータテーブルに頼るのではなく、ChartGemmaは、チャートイメージから直接生成されたインストラクションチューニングデータに基づいて訓練される。
我々の単純なアプローチは、チャートの要約、質問応答、ファクトチェックにまたがる5ドルのベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:16:40 GMT)
Q-Adapter: Training Your LLM Adapter as a Residual Q-Function [28.4] 本稿では,人間フィードバックからの強化学習によって事前訓練された大規模言語モデル(LLM)を下流の嗜好データに適用する問題について考察する。
既存の能力を維持しつつLCMをカスタマイズするために,Q-Adapterという新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:42:36 GMT)
MiniGPT-Med: Large Language Model as a General Interface for Radiology Diagnosis [28.4] MiniGPT-Medは、大規模言語モデルから派生したヴィジュアル言語モデルであり、医学的応用に適したものである。
医療報告生成、視覚的質問応答(VQA)、医療画像内の疾患識別などのタスクを実行することができる。
医療報告生成の最先端性能は,従来の最良モデルよりも19%高い精度で達成される。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:21:10 GMT)
DexCap: Scalable and Portable Mocap Data Collection System for Dexterous Manipulation [28.4] 人間の手の動きデータからの模倣学習は、現実世界の操作タスクにおいて、人間のような器用さでロボットを倒すための有望な道を示す。
携帯型ハンドモーションキャプチャシステムであるDexCapとDexILを紹介する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:35:04 GMT)
Orchestrating LLMs with Different Personalizations [28.3] 本稿では,大規模言語モデル(LLM)と個人の嗜好を一致させる新しいアプローチを提案する。
有用性、簡潔性、ユーモアなど、複数の次元に沿って記述された嗜好を踏まえると、ゴールは、この仕様に最もよく準拠する再訓練をせずにLLMを作成することである。
1つの特定の選好次元で訓練された専門的なLSMから始め、各トーケンレベルで出力をマージするブラックボックス法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:55:02 GMT)
A Comprehensive Survey and Taxonomy on Point Cloud Registration Based on Deep Learning [28.1] ポイントクラウド登録(PCR)は、1つのポイントクラウドを別のポイントクラウドにアライメントする厳格な変換を決定することを伴う。
優れた深層学習(DL)ベースの登録法が提案されているにもかかわらず、DLベースのPCR技術に関する包括的で体系的な研究はいまだに不足している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:45:32 GMT)
Hyperbolic Knowledge Transfer in Cross-Domain Recommendation System [28.0] CDR(Cross-Domain Recommendation)は、異なるドメインからの知識を活用して、ターゲットのレコメンデーションドメインにおけるデータ空間の問題を軽減する。
現在のほとんどのメソッドはユークリッド空間のユーザやアイテムを表していますが、これは長い尾の分散データを扱うには理想的ではありません。
我々は,各ドメインのユニークな特徴を捉えるために,Hyperbolic Contrastive Learning (HCTS)と呼ばれる新しいフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:54:07 GMT)
Aligning Neural Machine Translation Models: Human Feedback in Training and Inference [27.8] RLHF(Reinforcement Learning from Human feedback)は、言語モデルによって生成されたテキストの品質を向上させる技術である。
人間のアノテーションからトレーニングされたメトリクスを報酬モデルとして容易に利用できる機械翻訳(MT)では、最小ベイズリスクデコーディングと再ランクを用いた手法が最終品質の向上に成功している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:16:35 GMT)
Emergent Interpretable Symbols and Content-Style Disentanglement via Variance-Invariance Constraints [26.5] 生の観察から効果的に学習し、潜在空間を内容とスタイル表現に分解する教師なしの方法。
本手法は,コンテンツとスタイルのドメイン一般統計的差異の洞察に基づく。
実験結果から、V3は2つの異なる領域を異なるモジュラリティで一般化することが示された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:52:02 GMT)
Do Pre-trained Models Benefit Equally in Continual Learning? [26.0] 既存の継続学習(CL)の研究は主に、ゼロから訓練されたモデルのアルゴリズムの開発に費やされている。
コントリビュートベンチマークのパフォーマンスは高いが、これらのアルゴリズムは現実のシナリオで劇的なパフォーマンス低下を示す。
本稿では,CLに対する事前学習の体系的導入を提唱する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 20:25:36 GMT)
SkateFormer: Skeletal-Temporal Transformer for Human Action Recognition [25.3] 我々はSkateFormer(SkateFormer)と呼ばれる新しい手法を提案する。
SkateFormerは、さまざまなタイプの骨格と時間の関係に基づいて関節とフレームを分割する。
アクション適応的な方法で、アクション認識に不可欠なキージョイントやフレームに選択的にフォーカスすることができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:12:20 GMT)
Visualizing Dialogues: Enhancing Image Selection through Dialogue Understanding with Large Language Models [25.1] 本稿では,大規模言語モデル(LLM)の頑健な推論機能を活用して,正確な対話関連視覚記述子を生成する手法を提案する。
ベンチマークデータを用いて行った実験は、簡潔で正確な視覚記述子の導出における提案手法の有効性を検証した。
本研究は,多様な視覚的手がかり,多様なLCM,異なるデータセットにまたがる手法の一般化可能性を示すものである。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:50:30 GMT)
Solving Zebra Puzzles Using Constraint-Guided Multi-Agent Systems [25.0] 本稿では,大言語モデルとオフ・ザ・シェルフ定理証明器を統合したマルチエージェントシステムZPSを紹介する。
このシステムは、問題をより小さく管理可能な部分に分割することで、複雑なパズル解決作業に取り組む。
また,問題解の正当性を評価するための自動グリッドパズルグレーダを導入し,ユーザスタディで評価することで,自動グレーダが信頼性が高いことを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:22:25 GMT)
TALENT: A Tabular Analytics and Learning Toolbox [24.9] 本稿では,表型手法の活用,分析,比較を行うためにTALENT (Tabular Analytics and LEarNing Toolbox) という汎用的なディープラーニングツールボックスを提案する。
TALENTは、様々なエンコーディングおよび正規化モジュールに関連する、20以上の深い表層予測手法の広範なコレクションを含んでいる。
本稿では,ツールボックスの設計と機能について述べるとともに,その実践的応用をいくつかのケーススタディを通じて説明し,ツールボックスをベースとした各種手法の性能について検討する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:57:14 GMT)
DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning [24.7] 本稿では,数理推論にコードアシストと自己補正を併用した思考の分解を利用した大規模言語モデル(LLM)について紹介する。
DotaMathモデルは複雑な数学的タスクに対処し、それらをより単純な論理的なサブタスクに分解し、コードを利用してこれらのサブタスクを解決する。
そこで我々は,DotaMathQAの模倣学習を用いて,オープンソースのLLMと比較して優れた性能を示すDotaMathモデルを訓練した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:39:16 GMT)
Robust Learning under Hybrid Noise [24.4] 本稿では,データリカバリの観点からハイブリッドノイズに対処するため,新たな統合学習フレームワーク"Feature and Label Recovery"(FLR)を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:13:25 GMT)
Mitigating Low-Frequency Bias: Feature Recalibration and Frequency Attention Regularization for Adversarial Robustness [23.8] 本稿では,HFDR(High-Frequency Feature Disentanglement and Recalibration)と呼ばれる新しいモジュールを提案する。
HFDRは、特徴を高周波成分と低周波成分に分離し、高周波特徴を再検討し、潜在有用なセマンティクスをキャプチャする。
大規模な実験は、様々なホワイトボックス攻撃、転送攻撃、および強力な一般化能力に対する我々のアプローチの持つ大きな可能性と優位性を示している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:46:01 GMT)
In-Context Learning State Vector with Inner and Momentum Optimization [23.3] 大規模言語モデル(LLM)は、わずか数例からICL(In-Context Learning)を実行する素晴らしい能力を示した。
近年の研究では、ICLが学習した関数は変換器から得られる圧縮ベクトルで表現できることが示されている。
本稿では,これらの圧縮ベクトルの包括的解析,勾配降下法で訓練されたパラメータの並列化,状態ベクトルの概念について述べる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:52:11 GMT)
When Good and Reproducible Results are a Giant with Feet of Clay: The Importance of Software Quality in NLP [23.3] 本稿では,最先端コンフォーマーアーキテクチャの実装で広く使用されている3つのバグを特定し,修正するケーススタディを提案する。
我々は、ニューラルネットワークのテスト専用のライブラリである、コード品質チェックリストとリリースパンゴリNNを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:16:22 GMT)
C$^3$DG: Conditional Domain Generalization for Hyperspectral Imagery Classification with Convergence and Constrained-risk Theories [23.2] ハイパースペクトル画像(HSI)分類は、ハイパースペクトルモノスペクトルの課題である。
共同空間スペクトル特徴抽出はこの問題に対する一般的な解法である。
本稿では,収束性および誤差制約付き条件付き領域一般化法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:03:45 GMT)
Enabling Discriminative Reasoning in LLMs for Legal Judgment Prediction [23.0] 人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。
ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。
広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:28:46 GMT)
Beyond Viewpoint: Robust 3D Object Recognition under Arbitrary Views through Joint Multi-Part Representation [22.8] Part-Aware Network (PANet) は、航空機の翼や尾などの3Dオブジェクトの異なる部分のローカライズと理解を目的としている。
提案手法は,任意のビュー下での3次元オブジェクト認識処理において,既存のビューベースアグリゲーションベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:16:47 GMT)
EMPL: A novel Efficient Meta Prompt Learning Framework for Few-shot Unsupervised Domain Adaptation [22.6] 本稿では,FS-UDAのためのメタプロンプト学習フレームワークを提案する。
このフレームワークでは、事前訓練されたCLIPモデルを機能学習ベースモデルとして使用しています。
5-way 1-shotでは少なくとも15.4%,5-way 5-shotでは8.7%の大幅な改善が得られた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:13:06 GMT)
Resampled Datasets Are Not Enough: Mitigating Societal Bias Beyond Single Attributes [22.4] 我々は、保護されたグループと画像属性の急激な相関を取り除き、画像テキストデータセットの社会的バイアスに取り組む。
テキスト誘導インペイントモデルを用いることで、すべての属性から保護されたグループ独立を保証し、データフィルタリングによるインペイントバイアスを軽減する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:06:43 GMT)
Using generative AI to investigate medical imagery models and datasets [21.8] AIベースのモデルの信頼性を高めるには、説明が必要だ。
本稿では,チームベースの専門知識を活用した視覚的自動説明手法を提案する。
3つの医用画像モダリティにまたがる8つの予測課題について実験を行った。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:45:05 GMT)
Unveiling Scoring Processes: Dissecting the Differences between LLMs and Human Graders in Automatic Scoring [21.8] 大規模言語モデル(LLM)は、構築された応答評価のための自動スコアリングを行う上で、強力な可能性を示している。
人間によってランク付けされた構築された応答は、通常、与えられた格付けされたルーリックに基づいているが、LSMがスコアを割り当てる方法はほとんど不明である。
本稿では,理科の課題に対する学生の書面回答と人間のスコアとの整合性を評価するために,LLMが用いたグレーディングルーブリックを明らかにする。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:26:20 GMT)
Is Your AI-Generated Code Really Safe? Evaluating Large Language Models on Secure Code Generation with CodeSecEval [21.0] 大規模言語モデル(LLM)は、コード生成とコード修復に大きな進歩をもたらした。
しかし、GitHubのようなオープンソースのリポジトリから無防備なデータを使用したトレーニングは、セキュリティ上の脆弱性を必然的に伝播するリスクを増大させる。
我々は,コードLLMのセキュリティ面を正確に評価し,拡張することを目的とした総合的研究を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:59:31 GMT)
LEGO: Learning and Graph-Optimized Modular Tracker for Online Multi-Object Tracking with Point Clouds [20.7] 本稿では,データアソシエーション性能を向上させるための学習とグラフ最適化(LEGO)モジュールトラッカーを提案する。
提案するLEGOトラッカーは,グラフ最適化と自己認識機構を統合し,アソシエーションスコアマップを効率的に定式化する。
提案手法は,他のオンライントラッキング手法と比較して,優れた性能を示した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:18:04 GMT)
POSTURE: Pose Guided Unsupervised Domain Adaptation for Human Body Part Segmentation [20.7] Hunderlineuman Body Paunderlinert Sunderlineegmentation に対する POSTURE: UnderlinePose Guided Ununderlinesupervised Domain Adapunderlinetation について紹介する。
これは、ラベルのないターゲットデータのセグメンテーション性能を改善するために設計された、革新的な擬似ラベリング手法である。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 00:06:59 GMT)
Diverse and Fine-Grained Instruction-Following Ability Exploration with Synthetic Data [20.5] 本稿では,細粒度で多彩なインストラクションフォロー評価データセットであるINGOを紹介する。
実世界のユーザリクエストから派生した130ノードからなる、手動で注釈付き、きめ細かな、マルチレベルのカテゴリツリーに基づいている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:54:41 GMT)
A Survey of Data Synthesis Approaches [20.2] 1)多様性の向上,2)データバランシング,3)ドメインシフトへの対応,4)エッジケースの解決。
本稿では, 合成データの今後の方向性と, 重要な3つの方向性についても論じる: 1) 品質, 2) 合成データの評価, 3) マルチモデルデータ拡張。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:37:09 GMT)
Multi-Time Scale Service Caching and Pricing in MEC Systems with Dynamic Program Popularity [20.1] モバイルエッジコンピューティングシステムでは、ベースステーション(BS)は、タスク実行時間を短縮するためにコンピューティングサービスを提供する。
BSは自身の利益を最大化するためにユーザ需要に基づいてサービスプログラムを価格設定し、ユーザは価格に基づいてオフロード戦略を決定してコストを最小化する。
サービスキャッシング,価格設定,タスクオフロードを共同で最適化する,2段階のスケールフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:23:56 GMT)
Continual Learning Optimizations for Auto-regressive Decoder of Multilingual ASR systems [20.1] 継続学習(CL)は、事前学習されたデータの性能を維持しながら、新しいデータで訓練済みモデルを微調整する。
自動回帰デコーダのMASRモデルにおける4つの最適化を提案する。
Common VoiceデータセットからWhisperを10の未確認言語に適応させる実験では、これらの最適化により、事前訓練された言語の平均単語誤り率(AWER)が、Experience Replayと比較して14.2%から12.4%に低下することが示されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:35:47 GMT)
Decision-Focused Evaluation of Worst-Case Distribution Shift [19.0] 本稿では,予測資源割り当て設定における最悪の分散シフトを特定するための新しいフレームワークを提案する。
本稿では,この問題を部分モジュラー最適化問題として再定義し,最悪の場合の損失を効率的に近似できることを示す。
実データに私たちのフレームワークを適用すると、あるメトリクスによって識別される最悪のケースシフトが、他のメトリクスによって識別される最悪のケース分布と著しく異なるという経験的な証拠が得られます。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:00:53 GMT)
Towards Arbitrary-Scale Histopathology Image Super-resolution: An Efficient Dual-branch Framework via Implicit Self-texture Enhancement [18.9] Inlicit Self-Texture Enhancement-based dual-branch framework (ISTE) を提案する。
ISTEには、まずピクセルの特徴とテクスチャの特徴を学習するテクスチャ学習ブランチと、画素学習ブランチが含まれている。
我々はISTEが既存の固定スケールおよび任意のスケールのアルゴリズムを複数の倍率で上回ることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:41:53 GMT)
GPT-4 vs. Human Translators: A Comprehensive Evaluation of Translation Quality Across Languages, Domains, and Expertise Levels [18.8] 本研究では,人間の翻訳者に対するLarge Language Models(LLMs)の翻訳品質を包括的に評価する。
また, GPT-4は, 中高の翻訳者よりも遅れが小さいため, 中高の翻訳者に対して同等に機能することがわかった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:58:04 GMT)
Line Drawing Guided Progressive Inpainting of Mural Damage [18.8] 線画ガイドによるプログレッシブ壁画の塗装法を提案する。
塗装工程は、構造復元と色補正の2段階に分けられる。
提案手法は,現在の画像塗装法に対して評価される。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:15:22 GMT)
Deep Temporal Sequence Classification and Mathematical Modeling for Cell Tracking in Dense 3D Microscopy Videos of Bacterial Biofilms [18.6] そこで我々はDenseTrackという新しいセル追跡アルゴリズムを提案する。
DenseTrackは、ディープラーニングと数学的モデルベースの戦略を統合して、連続するフレーム間の対応を確立する。
固有分解に基づく細胞分裂検出戦略を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:58:27 GMT)
CLIcK: A Benchmark Dataset of Cultural and Linguistic Intelligence in Korean [18.5] 韓国における1,995対のQAペアからなる文化・言語知能のベンチマークについて紹介する。
CLIcKは、公式の韓国の試験と教科書からデータを入手し、質問を言語と文化の2つの主要なカテゴリで11のカテゴリに分けている。
CLIcKを用いて、13の言語モデルを用いて、パフォーマンスを評価する。評価では、カテゴリ間でのパフォーマンスに関する洞察と、その理解に影響を与えるさまざまな要因を明らかにする。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:08:19 GMT)
Robust Adaptation of Foundation Models with Black-Box Visual Prompting [18.2] 本研究は,大規模事前学習モデル (PTM) を効率的に適応するブラックボックス視覚プロンプト (Black-box visual prompting, BlackVIP) を提案する。
BlackVIPは、(1)座標と(2)勾配補正による同時近似(SPSA-GC)の2つの成分を持つ。
19のデータセットの実験では、BlackVIPは、最小限のメモリ要件で、さまざまなドメインやタスクへの堅牢な適応を可能にすることが示されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:35:00 GMT)
MobileExperts: A Dynamic Tool-Enabled Agent Team in Mobile Devices [17.7] 本稿では,ツールの定式化とマルチエージェントコラボレーションを初めて導入するMobileExpertsを紹介する。
我々は,専門家同士の協調関係を確立するための二重層計画機構を開発する。
実験の結果,MobileExpertsはすべてのインテリジェンスレベルにおいて優れた性能を示し,推論コストの22%削減を実現している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:12:19 GMT)
AutoSplat: Constrained Gaussian Splatting for Autonomous Driving Scene Reconstruction [17.6] AutoSplatは、自動走行シーンの高度に現実的な再構築を実現するために、ガウシアンスプラッティングを使用したフレームワークである。
本手法は,車線変更を含む課題シナリオの多視点一貫したシミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:18:54 GMT)
Using Large Language Models to Assist Video Content Analysis: An Exploratory Study of Short Videos on Depression [17.4] 我々は,Large Language Models (LLMs) を用いたマルチモーダルコンテンツ分析の新しいワークフローに従って,ケーススタディを実施している。
LLMのビデオアノテーション機能をテストするために,うつ病に関する25の短いビデオから抽出した203を解析した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:47:41 GMT)
AViTMP: A Tracking-Specific Transformer for Single-Branch Visual Tracking [17.1] 本稿では,AViTMP(Adaptive ViT Model Prediction Tracker)を提案する。
この方法は、初めて識別モデルで単一ブランチネットワークをブリッジする。
AViTMPは、特に長期追跡とロバスト性の観点から、最先端のパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:37:57 GMT)
Slice-100K: A Multimodal Dataset for Extrusion-based 3D Printing [16.9] Gコード(Geometric code)またはRS-274は、最も広く使われているコンピュータ数値制御(CNC)および3Dプリンティング言語である。
現在、加法製造用のGコードファイルとともに、キュレートされたCADモデルの大規模なリポジトリは存在しない。
本稿では,10000以上のGコードファイルからなる最初期のデータセットであるSLICE-100KとCADモデルについて述べる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:52:25 GMT)
A New Optimization Model for Multiple-Control Toffoli Quantum Circuit Design [16.8] 本稿では,可逆ブール関数に対するMCT量子回路設計問題について紹介する。
新しい最適化モデルと対称性を破る制約を導入し、最大2桁の解時間を改善する。
最大7量子ビットと最大15個の量子ゲートを使った実験は、いくつかの新しいよく知られた回路をもたらす。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 19:37:44 GMT)
EffiBench: Benchmarking the Efficiency of Automatically Generated Code [16.2] EffiBenchは1,000の効率クリティカルコーディング問題のあるベンチマークである。
それぞれの問題は、実行可能な人間記述の標準解とペアリングされる。
我々は42の大規模言語モデルによる効率的なコード生成能力を実証的に検証した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:55:05 GMT)
FedCross: Towards Accurate Federated Learning via Multi-Model Cross-Aggregation [16.0] フェデレートラーニング(FL)は、ユーザのプライバシを損なうことなく、データサイロ問題に対処するために注目を集めている。
我々はFedCrossという名前の効率的なFLフレームワークを提案する。このフレームワークは、提案したマルチモデルクロスアグリゲーションアプローチに基づいた、新しいマルチツーマルチFLトレーニングスキームを使用する。
We show that FedCross can significantly improve FL accuracy in both IID and non-IID scenarios without causing additional communication overhead。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:58:58 GMT)
On the Effectiveness of Acoustic BPE in Decoder-Only TTS [16.0] 音声をトークン化しデコーダのみのモデルで生成することは、テキスト音声(TTS)と音声言語モデリング(SLM)にとって有望な方向である。
音声トークンのシーケンス長を短くするため、SLMでは、自己教師付き意味表現から音声トークンを文字として扱い、さらにトークンシーケンスを圧縮する音響バイトペア符号化(BPE)が出現している。
意味的音声トークンを持つデコーダのみのTSモデルにおいて,音響的BPEの様々な設定について検討を行い,その有効性を検討した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:35:32 GMT)
MSfusion: A Dynamic Model Splitting Approach for Resource-Constrained Machines to Collaboratively Train Larger Models [16.0] 我々は,資源制約マシン上で大規模モデルを学習するための,効果的かつ効率的な協調学習フレームワークであるMSfusionを紹介する。
各トレーニングラウンドでは、各参加者は、ローカルデータをトレーニングするためにモデルパラメータのサブセットを割り当て、共通のパラメータ上の他のピアのサブモデルで集約される。
画像およびNLPタスクの実験は、大規模モデルのトレーニングにおいて、MSfusionの性能と効率において重要な利点を示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:06:24 GMT)
Defense Against Syntactic Textual Backdoor Attacks with Token Substitution [15.5] トレーニング段階では、慎重に選択されたトリガを犠牲者モデルに組み込んで、特定のクラスと同じトリガを含む入力を誤って予測する。
本稿では,構文ベースと特別なトークンベースのバックドア攻撃を効果的に対処する新しいオンライン防御アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:48:57 GMT)
PhotoBot: Reference-Guided Interactive Photography via Natural Language [15.5] PhotoBotは、ハイレベルな人間の言語指導とロボット写真家との相互作用に基づく、完全な自動写真取得のためのフレームワークである。
視覚言語モデル(VLM)とオブジェクトマニピュレータを用いて参照画像の特徴付けを行う。
また、ユーザの言語クエリに基づいて、関連する参照画像を取得するために、LLM(Big Language Model)も使用しています。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:08:38 GMT)
Contrastive Neural Ratio Estimation for Simulation-based Inference [15.4] Likelihood-to-evidence ratio Estimation は通常、バイナリ (NRE-A) またはマルチクラス (NRE-B) の分類タスクとしてキャストされる。
バイナリ分類フレームワークとは対照的に、現在のマルチクラスバージョンの定式化は本質的で未知のバイアス項を持つ。
我々は,NRE-Bに固有のバイアスを最適に含まないマルチクラスフレームワークを提案し,実践者が依存する診断を行う立場に置かれる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:34:31 GMT)
Functional Faithfulness in the Wild: Circuit Discovery with Differentiable Computation Graph Pruning [14.6] 本稿では、DiscoGPとともにCircuit Discoveryと呼ばれるタスクを包括的に再構築する。
DiscoGPは、回路発見のための識別可能なマスキングに基づく、新しく効果的なアルゴリズムである。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:42:25 GMT)
A Semantic-Aware Multiple Access Scheme for Distributed, Dynamic 6G-Based Applications [14.5] 本稿では,無線スペクトルへの多重アクセス問題に対する新しい定式化を提案する。
その目的は、$alpha$-fairnessメトリックを使用して、使い勝手のトレードオフを最適化することにある。
Semantic-Aware Multi-Agent Double and Dueling Deep Q-Learning (SAMA-D3QL) 手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:48:25 GMT)
Malla: Demystifying Real-world Large Language Model Integrated Malicious Services [14.3] 我々は、212の現実世界のMallasに関する最初の体系的研究を行い、地下市場におけるその増殖を明らかにした。
我々の研究は、Mallaエコシステムを明らかにし、その大きな成長と今日の公共LLMサービスへの影響を明らかにします。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 19:25:47 GMT)
CoMix: A Comprehensive Benchmark for Multi-Task Comic Understanding [14.2] 我々は,コミック分析におけるモデルのマルチタスク能力を評価するために,新しいベンチマークであるCoMixを導入する。
本ベンチマークは,マルチタスク評価をサポートするアノテーションを拡張した既存の3つのデータセットからなる。
マンガスタイルのデータの過剰表現を緩和するために、慎重に選択されたアメリカの漫画スタイルの本を新たにデータセットとして組み込んだ。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 00:07:50 GMT)
Dissipative time crystal in a strongly interacting Rydberg gas [14.1] 室温の原子ガス中におけるそのような散逸時間結晶秩序の実験的観察を報告する。
観測された極限サイクルは、Rydberg成分間の共存と競合から生じる。
振動の非脱落自己相関は、時間的ノイズに対する頑健性とともに、真の長距離時間的秩序の確立を示している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:59:56 GMT)
Stark: Social Long-Term Multi-Modal Conversation with Persona Commonsense Knowledge [14.0] マルチモダリティフォーマット、時間間隔、イメージで、幅広いソーシャルペルソナをカバーするデータセットであるStarkを紹介した。
Starkを自動構築するために,新しいマルチモーダル文脈化フレームワークであるMcuを提案する。
Starkを使ってマルチモーダルな会話モデルUltron 7Bをトレーニングします。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:26:49 GMT)
Entity-Level Sentiment: More than the Sum of Its Parts [13.8] 文レベルでの感情の算術的アグリゲーションとは,エンティティに対する読者の知覚的感情がしばしば異なることを示す。
我々のデータセットは、長いテキストでエンティティ固有の感情の複雑さを明らかにします。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:21:07 GMT)
A Survey on Statistical Theory of Deep Learning: Approximation, Training Dynamics, and Generative Models [13.3] 本稿では3つの観点から,ニューラルネットワークの統計理論に関する文献をレビューする。
ニューラルネットワークの過剰なリスクに関する結果は、回帰または分類の非パラメトリックフレームワークでレビューされる。
本稿では、GAN(Generative Adversarial Networks)、拡散モデル、Large Language Models(LLMs)におけるICL(In-context Learning)などの生成モデルにおける最新の理論的進歩について概説する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:36:06 GMT)
LoRA+: Efficient Low Rank Adaptation of Large Models [13.1] 低ランク適応(LoRA)は,大幅モデル(埋め込み次元)の最適下微細化につながることを示す。
そこで, このLoRAの準最適性は, 適応行列 A と B の学習率を良好に設定することで, 簡単に補正可能であることを示す。
我々の実験では、LoRA$+$は、LoRAと同じ計算コストで性能(1-2$%の改善)と微調整速度($sim$2X SpeedUpまで)を改善する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:33:00 GMT)
ALOHA: from Attention to Likes -- a unified mOdel for understanding HumAn responses to diverse visual content [12.3] ALOHA - 人間の反応を注目から好意へ理解するための統一モデルを提案する。
ALOHAは、アテンションヒートマップ、スキャンパス、視聴順序などの異なる人間の反応を予測し、主観的評価/評価を行う。
潜在的なアプリケーションには、UI/デザイン/イメージの有効性に関する即時フィードバックの提供や、視覚コンテンツ生成をさらに最適化するための報酬モデルとしての役割などが含まれる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 21:01:48 GMT)
On the Workflows and Smells of Leaderboard Operations (LBOps): An Exploratory Study of Foundation Model Leaderboards [12.0] 本研究は、これらのFMリーダーボードが現実世界のシナリオでどのように動作するかを理解することに焦点を当てる("clainboard operations")。
5つのユニークなワークフローパターンを特定し、FMリーダーボード内で必要不可欠なコンポーネントとその相互作用を概説するドメインモデルを構築します。
次に、LBOpsで8種類のリーダーボードの匂いを識別します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:12:00 GMT)
RareBench: Can LLMs Serve as Rare Diseases Specialists? [11.8] Generalist Large Language Models (LLMs) は、医学的診断を含む様々な領域において有望であることを示している。
世界中で約3億人に影響を及ぼす希少な疾患は、しばしば不満足な臨床診断率を持つ。
RareBenchは、希少疾患の領域における4つの重要な次元におけるLSMの能力を評価するために設計された先駆的なベンチマークである。
GPT-4の診断能力と専門医との総合的な比較検討を行った。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:10:17 GMT)
Out-of-distribution forgetting: vulnerability of continual learning to intra-class distribution shift [11.6] 連続学習(CL)は、人工ニューラルネットワークをオープン環境で動作させるための重要な技術である。
共同学習において、意図的な攻撃や環境摂動はネットワークの一般化能力を著しく損なう。
連続学習環境におけるOOD問題によって引き起こされた破滅的忘れの特殊な形態を報告する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:56:44 GMT)
Generative Technology for Human Emotion Recognition: A Scope Review [11.6] 本調査は,2024年6月までに320以上の研究論文を総合的に分析し,既存の文献のギャップを埋めることを目的としている。
異なる生成モデルと一般的に使用されるデータセットの数学的原理を導入する。
様々なモダリティに基づいて、生成技術がどのように感情認識に対処するかを詳細に分析する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:22:55 GMT)
MedRAT: Unpaired Medical Report Generation via Auxiliary Tasks [11.2] 本稿では、2つの異なるデータセットで利用可能な情報を活用する新しいモデルを提案する。
我々のモデルはMedRATと呼ばれ、従来の最先端の手法を超越している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:31:47 GMT)
Logistics Hub Location Optimization: A K-Means and P-Median Model Hybrid Approach Using Road Network Distances [11.0] ロジスティックハブは、最終マイルの配送距離において重要な役割を果たす。
電子商取引業界は、都市環境における資源配分の最適化の必要性を強めている。
本研究では,ロジスティックハブの配置を最適化するためにハイブリッドアプローチを用いる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:36:48 GMT)
Seeing Like an AI: How LLMs Apply (and Misapply) Wikipedia Neutrality Norms [11.0] 大規模言語モデル(LLM)は広義のコーパスで訓練され、特殊な規範を持つコミュニティで使用される。
我々は,ウィキペディアのニュートラル・ポイント・オブ・ビュー(NPOV)ポリシーに従って,バイアス付きウィキペディア編集の検出と修正能力を評価する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 23:05:58 GMT)
SynA-ResNet: Spike-driven ResNet Achieved through OR Residual Connection [10.7] スパイキングニューラルネットワーク(SNN)は、その生物学的忠実さとエネルギー効率のよいスパイク駆動操作を実行する能力のために、脳のような計算にかなりの注意を払っている。
ORRC(Residual Connection)を通じて大量の冗長情報を蓄積する新しいトレーニングパラダイムを提案する。
次に,SynA(SynA)モジュールを用いて冗長情報をフィルタリングし,背骨における特徴抽出を促進するとともに,ショートカットにおけるノイズや無駄な特徴の影響を抑える。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:55:58 GMT)
M$\mathbf5$ -- A Diverse Benchmark to Assess the Performance of Large Multimodal Models Across Multilingual and Multicultural Vision-Language Tasks [10.7] M5は多言語コンテキストにおける様々な視覚・運動タスクのLMMを評価するために設計された最初の総合ベンチマークである。
ハイソース言語と低リソース言語のタスクに依存しないパフォーマンスの相違を強調した。
より大規模なモデルは、多言語環境では必ずしもより小さなモデルよりも優れているとは限らないことを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:55:04 GMT)
Quantifying Prediction Consistency Under Model Multiplicity in Tabular LLMs [10.5] 微調整された大きな言語モデルは、同じ入力で矛盾する予測を行うような、テクティファインチューニングの多重性につながる可能性がある。
これにより、Tabular LLMの堅牢性と信頼性に関する重要な懸念が持ち上がる。
本研究は,コストのかかるモデル再訓練を伴わずに個々の予測の堅牢性を定量化する新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:22:09 GMT)
Can Bell inequalities be tested via scattering cross-section at colliders ? [10.5] 粒子生成と崩壊を標準量子論と同じ散乱断面積で再現できる特定のLHVMを提案する。
散乱断面によるスピン相関の再構成は、LHVMの幅広いクラスを除外できる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:06:55 GMT)
Evaluating Language Model Context Windows: A "Working Memory" Test and Inference-time Correction [10.4] 大規模言語モデルは現実世界のアプリケーションで顕著に使われ、しばしば大量の文書を推論する。
本稿では,標準テストの限界に対処する評価フレームワークであるSWiMを提案する。
また,この効果を緩和する,単純かつ効果的なトレーニングフリーアプローチであるメドイド投票を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:46:20 GMT)
Bridging Data Gaps in Healthcare: A Scoping Review of Transfer Learning in Biomedical Data Analysis [10.2] 低リソース環境における臨床および生医学的な研究は、有効なモデルを構築するのに十分なサンプルサイズを持つ高品質なデータを必要とするため、しばしば課題に直面している。
これらの制約は、堅牢なモデルトレーニングを妨げ、研究者は、関連する研究から既存の知識を活用して新しい研究活動を支援する方法を模索する。
機械学習技術であるトランスファーラーニング(TL)は、事前訓練されたモデルからの知識を活用して、新しいモデルの性能を向上させることで、強力なソリューションとして現れる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 23:34:20 GMT)
ReDiFine: Reusable Diffusion Finetuning for Mitigating Degradation in the Chain of Diffusion [10.2] 拡散モデルは画像の生成モデリングにおいて著しく改善されている。
画像の品質はしきい値に達し、合成画像を再利用して機械学習モデルを再び訓練することができる。
本稿では,事前訓練されたテキスト・画像拡散モデルが,一連の合成画像を用いて反復的に微調整される現実的なシナリオに焦点を当てる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:41:54 GMT)
Unsupervised Analysis of Alzheimer's Disease Signatures using 3D Deformable Autoencoders [10.1] MORPHADEは3次元T1重み付き脳画像の解析に変形を利用する新しい教師なし学習手法である。
これは、深い教師なし学習による変形を初めて検出し、またアルツハイマー病(AD)による脳の構造変化の重症度を局所化し評価する。
提案手法は,AD検出において0.80のAUROCを達成し,教師なしベースラインや教師なしベースラインよりも優れていた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:52:44 GMT)
An Uncertainty-guided Tiered Self-training Framework for Active Source-free Domain Adaptation in Prostate Segmentation [10.1] Source-free Domain Adaptation (SFDA)は、プライバシとセキュリティ上の問題に対処するために、深いセグメンテーションモデルを適用するための有望なテクニックである。
安定したドメイン適応を実現するための新しい不確実性誘導型自己学習(UGTST)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:11:49 GMT)
Practical asynchronous measurement-device-independent quantum key distribution with advantage distillation [10.0] アドバンスト蒸留法は量子鍵分布(QKD)の性能向上に有効であることが証明された。
我々は最近提案された非同期計測デバイス非依存QKDプロトコルにAD法を導入し、有限キー効果を考慮した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:51:21 GMT)
Text2TimeSeries: Enhancing Financial Forecasting through Time Series Prediction Updates with Event-Driven Insights from Large Language Models [10.0] 本稿では,関連事象に関するテキスト情報を組み込んだ協調モデリングフレームワークを提案する。
我々は、将来の変更に関する大規模言語モデルの直感を活用して、実数時系列の予測を更新する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:21:38 GMT)
On Temperature Scaling and Conformal Prediction of Deep Classifiers [10.0] この目的のための2つの一般的なアプローチは、(1)最大値が正当性確率をより正確に推定するように分類器のソフトマックス値を変更すること、(2)整形予測(CP):真のラベルを含む候補ラベルの予測セットをユーザ特定確率で生成することである。
実際には、どちらの種類の表示も望ましいが、今のところ両者の相互作用は研究されていない。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:59:21 GMT)
First Place Solution of 2023 Global Artificial Intelligence Technology Innovation Competition Track 1 [9.9] 我々は,グローバル人工知能技術革新コンペティショントラック1のチャンピオンソリューションを提示する。
我々はテキスト生成タスクのベースモデルとしてCPT-BASEを選択する。
驚いたことに、我々のシングルモデルはリーダーボードAで2.321点を獲得し、複数のモデル融合スコアはAとBのリーダーボードで2.362点と2.320点である。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:53:07 GMT)
Vision Mamba for Classification of Breast Ultrasound Images [9.9] MambaベースのモデルであるVMambaとVimは、最近のビジョンエンコーダのファミリーであり、多くのコンピュータビジョンタスクで有望なパフォーマンス改善を提供する。
本稿では,マンバをベースとしたモデルと従来の畳み込みニューラルネットワーク(CNN)と乳房超音波BUSIとBデータセットを用いた視覚変換器(ViT)を比較した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 00:21:47 GMT)
Holistic view of the road transportation system based on real-time data sharing mechanism [9.5] 本稿では,リアルタイム共有機構に基づく道路交通システムの時空グローバルビューを構築する。
道路利用者と管理者の両方が、近くの車両の運転意図や道路インフラのリアルタイム状態にタイムリーにアクセスできる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:47:50 GMT)
Quantum phase transition in a quantum Rabi square with next-nearest-neighbor hopping [9.5] 4つの量子ラビ系のうち、最も近い隣り合う光子ホッピングと次の隣り合う光子ホッピングを許容する量子ラビ正方形モデルを提案する。
反強磁性超ラジアント相とフラストレーションされた超ラジアント相との1次相転移を実現する。
量子シミュレーションや量子材料を応用した量子制御を実現するために,次のアレスト近傍ホッピングがゲージ位相の代替となる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:45:22 GMT)
Augmenting LLMs to Repair Obsolete Test Cases with Static Collector and Neural Reranker [9.4] 本稿では, TROCtx の精密かつ簡潔な構築により, 旧来の検査ケースを自動的に修復する新しい手法である SynBCIATR を提案する。
開発者のプログラミングプラクティスに触発されて、クラスコンテキスト、使用コンテキスト、環境コンテキストの3つのタイプのTROCtxを設計しました。
SynBCIATRによるTROCtxの増強により、幻覚は57.1%減少する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:24:43 GMT)
On the Benchmarking of LLMs for Open-Domain Dialogue Evaluation [8.7] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な機能を示した。
本稿では,現在の評価ベンチマークを批判的に検討し,従来の応答生成器の使用と品質面が,現代のチャットボットの機能を正確に反映できないことを強調した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:14:47 GMT)
STOC-TOT: Stochastic Tree-of-Thought with Constrained Decoding for Complex Reasoning in Multi-Hop Question Answering [8.5] マルチホップ質問応答(MHQA)は、複雑な質問に答えるために複数の通路から情報を検索し統合するモデルを必要とする。
近年のシステムでは、大規模言語モデルのパワーを活用し、証拠検索と推論のプロンプトを統合している。
MHQAの制約付き復号法であるSTOC-TOTを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:17:53 GMT)
DSLR: Document Refinement with Sentence-Level Re-ranking and Reconstruction to Enhance Retrieval-Augmented Generation [8.3] textittextbfDSLRは、検索した文書を文に分解し、無関係な文をフィルタリングし、それらを再び一貫性のある文に再構成する、教師なしのフレームワークである。
我々は,複数のオープンドメインQAデータセットに対してtextitDSLRを実験的に検証し,その結果から従来の固定サイズパスよりもRAG性能を著しく向上させることを示した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:30:04 GMT)
Improving Self Consistency in LLMs through Probabilistic Tokenization [8.0] 本稿では,現代言語モデルの複数トークン化機能を活用する新しい手法を提案する。
確率的トークン化を利用する場合, LLMは論理的に多様な推論経路を生成する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:52:48 GMT)
Zero-shot Persuasive Chatbots with LLM-Generated Strategies and Information Retrieval [7.9] 大規模言語モデル(LLM)の一般化可能性と本質的な説得能力を活用する手法を提案する。
提案手法は,まず LLM を用いて応答を生成し,次にフライ時に使用する戦略を抽出し,応答における不確定なクレームを,その戦略をサポートする検索事実に置き換える。
シミュレーションと人間の会話に関する実験は、ゼロショットのアプローチが以前の作業よりも説得力があることを示している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:28:21 GMT)
Evaluation of Activated Sludge Settling Characteristics from Microscopy Images with Deep Convolutional Neural Networks and Transfer Learning [7.6] 本研究では, 活性汚泥沈降特性を評価するために, コンピュータビジョンに基づく革新的な手法を提案する。
深層畳み込みニューラルネットワーク(CNN)モデルの伝達学習の実装により,既存の定量的画像解析技術の限界を克服することを目的とした。
Inception v3, ResNet18, ResNet152, ConvNeXt-nano, ConvNeXt-S などのCNNアーキテクチャを用いて, 汚泥沈降特性の評価を行った。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:19:47 GMT)
Behavioural gap assessment of human-vehicle interaction in real and virtual reality-based scenarios in autonomous driving [7.6] 我々は,VR実験に携わる参加者の行動の相違を,等価な実世界の状況と比較して捉える概念である行動ギャップ(obactiveal gap)と呼ぶものを評価するための,最初の,革新的なアプローチを提案する。
実験では、歩行者は異なる運転スタイルと外部ヒューマン・マシン・インタフェース(eHMI)の存在下で道路を横断しようとする。
結果は、参加者がVRに対してより慎重で好奇心を持ち、そのスピードと判断に影響を与え、VRインターフェースが行動に大きく影響していることを示している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:20:17 GMT)
Modelling Quantum Transduction for Multipartite Entanglement Distribution [7.5] 超伝導とフォトニック技術は、量子インターネットにおいて重要な役割を果たすと想定されている。
これらの技術のハイブリッド化は、超伝導量子ビットをネットワークを介して伝播可能な「フライング」量子ビットに変換する機能量子トランスデューサを必要とする(逆逆)。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:45:38 GMT)
Detect Closer Surfaces that can be Seen: New Modeling and Evaluation in Cross-domain 3D Object Detection [7.5] 本研究では,エゴ車両のセンサに近接する表面を検出する3次元物体検出モデルの能力を測定するための2つの指標を提案する。
また、学習可能な近接面にもっと焦点を合わせるために、EdgeHeadという改良ヘッドも提案しています。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:06:16 GMT)
ParamNet: A Dynamic Parameter Network for Fast Multi-to-One Stain Normalization [7.4] 静止正規化は、デジタル病理画像の色と明るさの差を効果的に低減することができる。
本研究では,動的パラメータネットワークを導入し,ParamNetと呼ばれる新しい染色正規化法を提案する。
その結果、ParamNetは25秒で10万×100,000のスライド画像(WSI)を正規化できることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:17:46 GMT)
Characteristics and prevalence of fake social media profiles with AI-generated faces [7.4] 生成人工知能(AI)の最近の進歩は、偽のソーシャルメディアアカウントを偽造する可能性を懸念している。
本稿では,GAN(Generative Adrial Networks)が生成した人物のプロフィール画像を用いたTwitterアカウントの体系的解析を行う。
我々は、詐欺、スパム、調整されたメッセージの増幅など、不正行為の拡散に使われていることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 00:30:41 GMT)
When LLM Meets Hypergraph: A Sociological Analysis on Personality via Online Social Networks [7.3] 本稿では,個人レベルのデータマイニングではなく,環境を考慮した視点で人格を社会学的に分析する枠組みを提案する。
ハイパーグラフノードをユーザとし,ハイパーグラフのハイパーエッジをソーシャル環境とする,効果的なハイパーグラフニューラルネットワークを設計する。
ユーザプロファイルデータ、性格特性、実世界のソーシャルプラットフォームから検出されたいくつかの環境を含む有用なデータセットを提供する。
論文参考訳(メタデータ) (Thu, 04 Jul 2024 01:43:52 GMT)
Embodied AI in Mobile Robots: Coverage Path Planning with Large Language Models [6.9] 移動体エージェントのためのLLM方式の経路計画フレームワークを提案する。
提案する多層アーキテクチャは,経路計画段階におけるLPMを用いて,移動エージェントの低レベルアクチュエータと統合する。
本実験により,LLMの2次元平面推論能力と完全カバレッジパス計画タスクを改善することができることが示された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:42:58 GMT)
NutriBench: A Dataset for Evaluating Large Language Models in Carbohydrate Estimation from Meal Descriptions [6.7] 我々はNutriBenchについて紹介する。NutriBenchは、初めて公開された自然言語による食事記述に基づく栄養ベンチマークである。
ヌトリベンチは、炭水化物、タンパク質、脂肪、カロリーを含む、マクロ栄養成分のラベルで、5,000人の人間によって検証された食事記述で構成されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:10:51 GMT)
A fast neural hybrid Newton solver adapted to implicit methods for nonlinear dynamics [6.6] 本稿では,厳密な時間進化非線形方程式に対する非線形時間ステップシステムのこの解を高速化するための,ニュートン法に基づく新しい演算子学習法を提案する。
ニュートン法における量的改善率を示し、教師なし学習戦略の一般化誤差の上限を解析する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:02:10 GMT)
CardioSpectrum: Comprehensive Myocardium Motion Analysis with 3D Deep Learning and Geometric Insights [6.4] 従来のニューラルネットワークは微妙な接尾辞の動きを予測するのが難しい。
この問題に対処するための包括的アプローチを提案する。
私たちの3Dディープラーニングアーキテクチャは、ARFlowモデルに基づいて、複雑な3Dモーション分析タスクに最適化されています。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:57:44 GMT)
AutoBench: Automatic Testbench Generation and Evaluation Using LLMs for HDL Design [6.4] テストベンチはシミュレーションベースのハードウェア検証の基礎となる。
LLM(Large Language Models)は、回路設計フローの自動化の可能性を実証している。
デジタル回路設計のための最初のLCMベースのテストベンチジェネレータであるAutoBenchを紹介する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:33:56 GMT)
Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions [6.3] 拡散モデル(DM)は画像データ拡張のための強力なツールとして登場した。
DMは、基礎となるデータ分布を学習することで、現実的で多様な画像を生成する。
この分野における現在の課題と今後の研究方向性について論じる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:06:48 GMT)
Generalized Robust Fundus Photography-based Vision Loss Estimation for High Myopia [6.2] VF推定の一般化ロバスト性を高めるための新しいパラメータ効率フレームワークを提案する。
本手法は, RMSE, MAE, 係数相関において, 内部および外部の検証において, 既存の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:39:19 GMT)
Presence or Absence: Are Unknown Word Usages in Dictionaries? [6.2] 我々は,フィンランド語,ロシア語,ドイツ語の共用課題であるAXOLOTL-24の評価を行った。
未知の単語使用量と辞書エントリ間のマッピングを予測するために,グラフベースのクラスタリング手法を用いる。
私たちのシステムはフィンランド語とドイツ語で第1位、ロシア語で第2位、Subtask 2テストフェーズのリーダーボードで第2位にランクインします。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:23:35 GMT)
ASteISR: Adapting Single Image Super-resolution Pre-trained Model for Efficient Stereo Image Super-resolution [6.2] ステレオ画像超解像(SteISR)の領域に、事前訓練されたシングルイメージ超解像(SISR)トランスフォーマネットワークを転送する方法を提案する。
具体的には、事前訓練されたSISRトランスネットワークに組み込まれたステレオアダプタと空間アダプタの概念を紹介する。
このトレーニング手法を用いることで、Flickr1024データセット上のステレオ画像を正確に0.79dBの精度で推測するSISRモデルの能力を向上する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:12:05 GMT)
TrackPGD: A White-box Attack using Binary Masks against Robust Transformer Trackers [6.1] トランスフォーマーバックボーンを持つオブジェクトトラッカーは、ビジュアルオブジェクト追跡データセットで堅牢なパフォーマンスを達成した。
バックボーンの違いにより、対象追跡のために提案された敵対的ホワイトボックス攻撃は、あらゆる種類のトラッカーに転送できない。
我々は,ロバストなトランスフォーマートラッカーを攻撃するために,予測対象のバイナリマスクに依存するTrackPGDという新しいホワイトボックス攻撃を提案している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:02:12 GMT)
The Structure of Financial Equity Research Reports -- Identification of the Most Frequently Asked Questions in Financial Analyst Reports to Automate Equity Research Using Llama 3 and GPT-4 [6.1] この研究は72のERRの文を文単位で分析し、48.7%の文を169の質問アーチタイプに分類した。
我々は質問を事前に定義しなかったが、ERRの声明からのみ派生した。
この研究は、現在のERRの書き込みプロセスが、さらなる自動化、品質と効率の改善の恩恵を受ける可能性があることを裏付けている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:58:02 GMT)
It Ain't That Bad: Understanding the Mysterious Performance Drop in OOD Generalization for Generative Transformer Models [6.1] 大規模言語モデル (LLM) は多様な問題を解決するのに優れた能力を発揮している。
しかし、それらの一般化能力は必ずしも満足しておらず、一般化問題は一般に生成トランスモデルに共通である。
n-digit操作のトレーニングモデルでは,n-digit入力に対してモデルが正常に一般化されるが,もっと長い,見えないケースではフェールすることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:32:57 GMT)
Feelings about Bodies: Emotions on Diet and Fitness Forums Reveal Gendered Stereotypes and Body Image Concerns [6.1] 我々は、ダイエット、フィットネス、関連するメンタルヘルス問題に関連する46のRedditディスカッションフォーラムを分析した。
以上の結果から,女性指向のコミュニティは,特に薄めプロモーティングフォーラムにおいて,よりネガティブな感情を表現することが示唆された。
また,心的健康問題に対する感情指標の性別パターンを明らかにするとともに,薄さ指向のコミュニティとより緊密に連携する深刻な問題について議論した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 00:11:27 GMT)
$\texttt{metabench}$ -- A Sparse Benchmark to Measure General Ability in Large Language Models [6.0] 大きな言語モデル(LLM)は、様々なタスクでその能力が異なる。
これらのベンチマークを測る共通基盤能力の小さなセットがあることが示される。
スパースベンチマークである$textttmetabench$を蒸留します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:57:38 GMT)
PFGS: High Fidelity Point Cloud Rendering via Feature Splatting [5.9] スパースポイントから高品質な画像をレンダリングする新しいフレームワークを提案する。
この手法はまず3次元ガウス格子と点雲のレンダリングを橋渡しする。
異なるベンチマーク実験により、レンダリング品質と主成分の必要性の観点から、我々の手法の優位性を示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:42:54 GMT)
HERA: High-efficiency Matrix Compression via Element Replacement [5.9] 大規模言語モデル(LLM)は、機械翻訳、テキスト生成、感情分析などの高度な自然言語処理タスクを持つ。
数十億のパラメータで構成されるその大きなサイズは、ストレージ、計算、デプロイメントの課題を提起する。
本稿では,行列の圧縮に Element Replacement を用いる新しいアルゴリズム HERA を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:13:58 GMT)
Continuous-variable quantum digital signatures against coherent attacks [5.8] 量子デジタルシグネチャ(QDS)は、量子法則に基づく古典的メッセージの真正性、完全性、非再考を保証する。
我々は,最先端の忠実度テスト関数を用いて,一般的なコヒーレント攻撃に耐えるように設計されたCV QDSプロトコルを提案する。
その結果、メガビットメッセージ署名タスクにおいて、6桁以上の署名長が大幅に削減された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:39:59 GMT)
Establishing Provenance Before Coding: Traditional and Next-Gen Signing [5.7] ソフトウェアエンジニアは、サードパーティのコンポーネントをアプリケーションに統合する。その結果、ソフトウェアサプライチェーンは脆弱である。
攻撃面を減らすために、コンポーネント(性能)の起点を付加する前に検証できる。
この記事では、従来の署名、その課題、次世代の署名プラットフォームによって導入された変更について説明する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:07:50 GMT)
Argument Mining in Data Scarce Settings: Cross-lingual Transfer and Few-shot Techniques [5.7] また、Argument Miningでは、データ転送の方がモデル転送よりも優れた結果が得られることを示す。
数秒間、タスクの種類(シーケンスの長さと複雑さ)とサンプリングメソッドが重要であることが証明されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:59:17 GMT)
Protecting Deep Learning Model Copyrights with Adversarial Example-Free Reuse Detection [5.7] ディープニューラルネットワーク(DNN)の再利用と複製は、モデル所有者に著作権侵害と経済的損失をもたらす可能性がある。
既存のホワイトボックステストベースのアプローチは、モデルアーキテクチャが変更される一般的な異種再利用ケースに対処できない。
神経機能解析に基づく再利用検出装置であるNFARDを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:21:59 GMT)
Leveraging Topic Specificity and Social Relationships for Expert Finding in Community Question Answering Platforms [5.7] 本稿では,エキスパート検索のためのトピック指向ユーザインタラクションモデルTUEFを提案する。
TUEFは、多層グラフを構築することで、コンテンツとソーシャルデータを統合する。
実験の結果、TUEFはP@1で42.42%、NDCG@3で32.73%、R@5で21.76%、MRRで29.81%という最低パフォーマンスで全てのライバルを上回った。
論文参考訳(メタデータ) (Thu, 04 Jul 2024 15:50:18 GMT)
A Survey of Controllable Learning: Methods and Applications in Information Retrieval [5.6] 制御可能な学習(CL)は、信頼できる機械学習において重要な要素として現れる。
我々はCLの形式的定義を提供し、情報検索におけるその応用について議論する。
学習、評価、タスク設定、オンライン環境への展開など、CLが直面している課題を特定します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:50:50 GMT)
The Solution for the GAIIC2024 RGB-TIR object detection Challenge [5.6] RGB-TIRオブジェクト検出は、RGBとTIRの両方の画像を、検出中に補完情報として利用する。
提案手法はAとBのベンチマークでそれぞれ0.516と0.543のmAPスコアを得た。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:08:36 GMT)
Cognitive Modeling with Scaffolded LLMs: A Case Study of Referential Expression Generation [5.6] 本稿では,参照表現生成のアルゴリズム的認知モデルのニューラルシンボリック実装について検討する。
私たちのハイブリッドアプローチは認知的に妥当であり、複雑な状況下ではうまく機能します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:28:48 GMT)
Alice's Adventures in a Differentiable Wonderland -- Volume I, A Tour of the Land [5.5] ニューラルネットワークは、大きな言語モデル、音声書き起こしシステム、分子発見アルゴリズム、ロボット工学など、私たちを取り巻くものです。
このプライマーは、Alice(アリス)氏のような、この奇妙な異なる不思議の国に足を踏み入れた人のために想像された、この魅力的な分野の紹介だ。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:52:11 GMT)
Large Language Models can Share Images, Too! [5.5] 本稿では,GPT-4 や LLaMA 2 などの大規模言語モデル (LLM) のゼロショット設定における画像共有機能について検討する。
私たちは、リッチなインテント、文のトリガー、画像記述、健全な情報を含むPhotoChat++データセットを紹介します。
広汎な実験により、ゼロショットプロンプトにおいてLDMを備えたDribeRの画像共有能力を解放する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:55:33 GMT)
Purification Of Contaminated Convolutional Neural Networks Via Robust Recovery: An Approach with Theoretical Guarantee in One-Hidden-Layer Case [5.4] 畳み込みニューラルネットワーク(CNN)は多くの機械学習タスクにおいて優れたパフォーマンスを実現している。
CNNは、自然騒音や、バックドア攻撃のような人工的に注入された騒音によって容易に汚染される。
汚染される可能性のあるCNNからノイズを取り除くための頑健なリカバリ手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:43:23 GMT)
The Price of Prompting: Profiling Energy Use in Large Language Models Inference [5.3] 本稿では,大規模言語モデル推論プロセスにおいて消費されるエネルギーを監視し,分析するフレームワークであるMELODIを紹介する。
MELODIを使用して生成されたデータセットは、幅広いLLMデプロイメントフレームワーク、複数の言語モデル、広範なプロンプトデータセットを含んでいる。
その結果,エネルギー効率の相違が指摘され,持続可能対策の最適化と導入の十分な範囲が示唆された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:16:28 GMT)
CaseGPT: a case reasoning framework based on language models and retrieval-augmented generation [5.1] CaseGPTは、Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)を組み合わせた革新的なアプローチである。
CaseGPTは、関連するケースデータを取得するだけでなく、既存のケースデータから識別されるパターンに基づいて、洞察に富んだ提案やレコメンデーションを生成する。
この機能は、医学診断、法的な前例研究、ケースストラテジーの定式化といったタスクに特に有用である。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:26:51 GMT)
ScreenAI: A Vision-Language Model for UI and Infographics Understanding [4.9] UIとインフォグラフィックの理解を専門とする視覚言語モデルであるScreenAIを紹介する。
この混合の核心は、モデルがUI要素のタイプと位置を識別しなければならない新しいスクリーンアノテーションタスクである。
これらのテキストアノテーションを使用して、画面を大規模言語モデルに記述し、質問応答(QA)、UIナビゲーション、要約トレーニングデータセットを大規模に生成する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:08:15 GMT)
Over the Edge of Chaos? Excess Complexity as a Roadblock to Artificial General Intelligence [4.9] 我々は、AIの性能が臨界複雑性しきい値を超えると不安定になるかもしれない複雑なシステムにおける位相遷移に類似した臨界点の存在を仮定した。
我々のシミュレーションは、AIシステムの複雑さの増加が、より高い臨界閾値を超え、予測不可能なパフォーマンス行動を引き起こすことを実証した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:46:39 GMT)
Simul-LLM: A Framework for Exploring High-Quality Simultaneous Translation with Large Language Models [4.9] 数十億のパラメータを持ち、大量のデータに事前訓練された大規模言語モデル(LLM)は、さまざまな下流自然言語処理タスクにおいて、最先端の性能に近いかそれ以上の性能を持つようになった。
Simul-LLMは、SimulMTにフォーカスしたLLMのためのオープンソースのファインチューニングおよび評価パイプライン開発フレームワークである。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:05:48 GMT)
Sparsest Models Elude Pruning: An Exposé of Pruning's Current Capabilities [4.8] プルーニングは大規模モデルを圧縮するための有望なアプローチとして現れてきたが、モデルの範囲を回復する効果はまだ検討されていない。
我々は485,838の実験を行い、キュビストスパイラルと名付けられた合成データセットに最先端のプルーニングアルゴリズムを適用した。
そこで本研究では,新たな探索アルゴリズムによって同定した,理想的なスパースネットワークと比較して,性能の差が顕著であった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:33:15 GMT)
Natively neuromorphic LMU architecture for encoding-free SNN-based HAR on commercial edge devices [4.8] ニューロモルフィックモデル(Neuromorphic model)は、ヒトの脳からインスピレーションを受ける。
本稿では,L2MUについて述べる。L2MUはLeaky Integrate-and-Fireニューロンに依存している。
L2MUを手動のアクティビティからスマートウォッチの信号にベンチマークし、圧縮されたバージョンで3つの異なる商用エッジデバイスにデプロイしました。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:35:12 GMT)
10 Years of Fair Representations: Challenges and Opportunities [4.7] 私たちは、Fair Representation Learningの最初の10年間を振り返る。
ディープラーニング理論における最近の研究は、ニューラルネットワーク表現における情報除去の難しさを示している。
自動機械学習(AutoML)を使用して、公正な表現を意図した機密情報を敵対的に“マイニング”する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:04:26 GMT)
Mapping the Challenges of HCI: An Application and Evaluation of ChatGPT and GPT-4 for Mining Insights at Scale [4.7] テキストコーパスから洞察を抽出する実世界の課題に対して,ChatGPTとGPT-4の組み合わせを評価した。
2023CHI会議の議題100件以上で4,392件の研究課題を抽出した。
また,ChatGPTとGPT-4の組み合わせは,テキストコーパスを大規模に解析するためのコスト効率に優れた手段である,という結論を得た。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:47:23 GMT)
An Empirical Study on Capability of Large Language Models in Understanding Code Semantics [4.6] コードのための大規模言語モデル(コードLLM)は、様々なソフトウェア工学(SE)タスクで顕著なパフォーマンスを示している。
本稿では,コード意味論の理解におけるLLMの能力を評価するためのフレームワークであるEMPICAを紹介する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:40:58 GMT)
A polynomial-time dissipation-based quantum algorithm for solving the ground states of a class of classically hard Hamiltonians [4.5] 我々は、ハミルトン群の基底状態を解決するための量子アルゴリズムを与える。
我々のアルゴリズムに現れた指数的スピードアップのメカニズムは、オープン量子系における散逸に由来する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:27:33 GMT)
Adversarial Robustness of VAEs across Intersectional Subgroups [4.4] 可変オートエンコーダ (VAEs) は, 決定論的AEよりも逆方向の摂動に強い抵抗を示す。
本研究は,非標的敵攻撃に対するVAEの堅牢性を評価する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:53:51 GMT)
An Axiomatic Definition of Hierarchical Clustering [4.4] 個体群階層的クラスタリングを定義するための公理的アプローチを, 断片的一定密度に対して行う。
我々の公理的定義は、ハルディガンのクラスタツリーの定義に繋がる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:53:23 GMT)
Towards Automating Text Annotation: A Case Study on Semantic Proximity Annotation using GPT-4 [4.4] 本稿では、自動プロンプトを設計するための注釈付きデータとともに、人間のアノテーションガイドラインを再利用する。
オープンソースのテキストアノテーションツールにプロンプト戦略を実装し、OpenAI APIによるオンライン利用を容易にします。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 19:16:44 GMT)
Online estimation of the inverse of the Hessian for stochastic optimization with application to universal stochastic Newton algorithms [4.4] 本稿では,期待値として記述された凸関数の最小値推定のための2次最適化について述べる。
Robbins-Monro 法を用いて逆 Hessian 行列の直接帰納的推定手法を提案する。
とりわけ、普遍的なニュートン法を開発し、提案手法の効率性を調べることができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:40:14 GMT)
Seamless Monitoring of Stress Levels Leveraging a Universal Model for Time Sequences [4.3] 本稿では,時系列の普遍モデルUniTSに基づくスマートウォッチからのストレス検出手法を提案する。
提案モデルが3つのベンチマークデータセット上での上位12の手法をかなり上回っていることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:46:09 GMT)
Semantic Graphs for Syntactic Simplification: A Revisit from the Age of LLM [4.3] 記号文の意味表現は、NLPタスクを単純化する表現的および構造化された意味グラフを提供する。
構文的単純化における意味グラフの位置を再考し,その意味を保ちながら文構造を単純化する作業について述べる。
本稿では, AMR グラフ上での記号的推論のために LLM をエミュレートする AMRCoC プロンプトを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:13:38 GMT)
NeuroSteiner: A Graph Transformer for Wirelength Estimation [4.0] WL推定のコスト-精度フロンティアをナビゲートするために、最適なRSMTソルバであるGeoSteinerを蒸留するニューラルネットワークであるNeuroSteinerを提案する。
NeuroSteinerはGeoSteinerによってラベル付けされた合成ネットでトレーニングされており、実際のチップ設計でトレーニングする必要がなくなる。
ISPD 2005と2019では、NeuroSteinerはGeoSteinerよりも60%速く、0.2%と30%のエラーを得られる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:55:22 GMT)
Convergence of variational Monte Carlo simulation and scale-invariant pre-training [4.0] ニューラルネットワークの波動関数を最適化するために,変分モンテカルロ法(VMC)の収束バウンダリを提案する。
エネルギー最小化に先立って一般的に用いられるエネルギー最小化相と教師付き事前学習相の両方について検討する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:39:00 GMT)
RobQuNNs: A Methodology for Robust Quanvolutional Neural Networks against Adversarial Attacks [4.0] Quanvolutional Neural Networks (QuNN) は量子層と古典層を統合している。
本研究は,QuNNの敵攻撃に対する堅牢性を高める新しい手法であるRobQuNNを紹介する。
その結果、QuNNはMNISTデータセットの古典的ネットワークに比べて最大60%高いロバスト性を示すことがわかった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:13:52 GMT)
Policy Gradient Algorithms with Monte Carlo Tree Learning for Non-Markov Decision Processes [3.9] 政策勾配 (PG) は、勾配上昇を用いたパラメータ化政策モデルを最適化する強化学習 (RL) アプローチである。
PGは非マルコフ環境でもうまく機能するが、高原やピークネスの問題に遭遇することがある。
本稿では、まず、オンラインRLのためのMCTSの適応であるモンテカルロ木学習(MCTL)を紹介し、その強みを活用するためにPGとMCTLの政策アプローチについて検討する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:22:01 GMT)
The Mysterious Case of Neuron 1512: Injectable Realignment Architectures Reveal Internal Characteristics of Meta's Llama 2 Model [3.8] Injectable Realignment Model (IRM)は、言語モデルの解釈可能性と説明可能性に対する新しいアプローチである。
ニューラルプログラミングインタフェースに関する以前の研究に触発された私たちは、感情に基づくアライメントを誘導するために、小さなネットワーク(IRM)を構築してトレーニングします。
訓練されたIRMの出力の分析では、興味深いパターンが明らかになっている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:05:19 GMT)
Finetuning End-to-End Models for Estonian Conversational Spoken Language Translation [3.8] 本稿では,エストニア語とエストニア語とロシア語の会話音声テキスト翻訳におけるエンドツーエンドモデルの微調整について検討する。
エストニア語のための音声翻訳データが限られているため、機械翻訳を用いた音声認識データセットからWebスクレイピングと合成により、追加のトレーニングデータを作成しました。
以上の結果から,合成データによる微調整により,SeamlessM4Tのマッチングや音声翻訳システムの超過により翻訳精度が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:33:12 GMT)
Assessing Consensus of Developers' Views on Code Readability [3.8] 開発者はコードレビューに多くの時間を費やし、コード理解におけるコード可読性の重要性を強調している。
以前の調査では、既存のコード可読性モデルは開発者の考えを表現する上で不正確であった。
同じようなコーディング経験を持つ10人のJava開発者を調査して、コード可読性評価と関連する側面について、彼らのコンセンサスを評価しました。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:54:42 GMT)
How AI Ideas Affect the Creativity, Diversity, and Evolution of Human Ideas: Evidence From a Large, Dynamic Experiment [3.8] 実験では、参加者がChatGPTまたは以前の実験参加者から得た創造的アイデアを観察し、そのアイデアをブレインストーミングした。
我々は,AI生成例数(無,低,高露出)と,その例を「AI」とラベル付けした場合(開示)に変動した。
高いAI暴露は、個々のアイデアの創造性に影響を与えるものではなく、集団的アイデアの多様性の平均的量と変化率を増加させることを発見した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:14:24 GMT)
NLP-KG: A System for Exploratory Search of Scientific Literature in Natural Language Processing [3.4] NLP-KGは、未知の自然言語処理分野の研究文献の探索を支援するために設計された機能豊富なシステムである。
セマンティック検索に加えて、NLP-KGは興味のある分野への簡単な紹介を提供する調査論文を簡単に見つけることができる。
フィールド・オブ・スタディ(Fields of Study)階層グラフにより、ユーザーはフィールドとその関連領域に慣れることができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:51:43 GMT)
The $s$-value: evaluating stability with respect to distributional shifts [3.3] 実際には、場所と時間の間で分布が変化するため、データセット間で伝達される知識の収集が困難になる。
本論文では,Kulback-Leibler分散に対する統計的パラメータの分布不安定度を定量化する不安定度尺度を提案する。
提案手法の有効性を実データ上で評価し,パラメータの分布不安定性をあるシフトに対して解明可能であることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:56:06 GMT)
VoxAct-B: Voxel-Based Acting and Stabilizing Policy for Bimanual Manipulation [3.2] 本稿では,VoxAct-Bを提案する。
我々はこのボクセルグリッドをバイマニュアル操作ポリシーに提供し、動作と安定化の動作を学ぶ。
シミュレーションにおいて、VoxAct-Bは、細粒度バイマニュアル操作タスクにおいて、強いベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 20:58:20 GMT)
Continuous-time quantum optimisation without the adiabatic principle [2.9] 最適化問題に対する連続時間量子アルゴリズムは、これまで断熱原理によって動機付けられてきた。
我々はプランクの原理を、連続時間量子アルゴリズムの基盤となる物理的動機として捉えている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:07:56 GMT)
Machine Learning for Economic Forecasting: An Application to China's GDP Growth [2.9] 本稿は、中国における四半期ごとのGDP成長を予測するために、さまざまな機械学習モデルを用いている。
これらのモデルのパフォーマンスの違いに寄与する要因を分析します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:04:55 GMT)
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary [2.8] 強化学習(RL)と大規模言語モデル(LLM)を組み合わせた新しい注釈手法を提案する。
本システムでは,RLを利用して複雑なカード再生シナリオを生成し,LLMを用いて対応する注釈文を生成する。
オープンソース LLM に適用した場合,提案する注釈フレームワークによって達成される性能の大幅な向上を示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:47:22 GMT)
A Fully Parameter-Free Second-Order Algorithm for Convex-Concave Minimax Problems with Optimal Iteration Complexity [2.8] 凸凹極小最適化問題の解法として,Lipschitz-free Cubal regularization (LF-CR)アルゴリズムを提案する。
また,この問題のパラメータを必要としない完全パラメータフリー立方正則化(FF-CR)アルゴリズムを提案する。
我々の知る限り、FF-CRアルゴリズムは凸凹極小最適化問題の解法として初めて完全にパラメータフリーな2次アルゴリズムである。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:46:07 GMT)
VITAMIN: A Compositional Framework for Model Checking of Multi-Agent Systems [2.7] 本稿では,マルチエージェントシステム (MAS) の形式的検証をモジュール的かつ多目的に行う手法を提案する。
MASの既存の検証手法やフレームワークとは異なり、VITAMINは様々なロジックに対応するために容易に拡張するために構築されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:10:06 GMT)
An applied Perspective: Estimating the Differential Identifiability Risk of an Exemplary SOEP Data Set [2.7] 基本的統計的クエリの集合に対して,リスクメトリックを効率的に計算する方法を示す。
実世界の科学的データセットに基づいた実証分析は、現実的な条件下でのリスクの計算方法に関する知識を拡大します。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:50:55 GMT)
Multi-domain improves out-of-distribution and data-limited scenarios for medical image analysis [2.3] 特殊ドメインの代わりに複数のドメインを組み込んだモデルを用いることで、特殊モデルで観測される制限が大幅に軽減されることを示す。
臓器認識では、従来の特殊なモデルと比較して、マルチドメインモデルは精度を最大8%向上させることができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:20:59 GMT)
Multi-level projection with exponential parallel speedup; Application to sparse auto-encoders neural networks [2.3] ell_1,infty$ノルムの時間複雑性は、$mathbbRntimes m$の行列に対して$mathcalObig(n m big)$のみであることを示す。
実験により、我々の予測は、実際の最速のユークリッドアルゴリズムの2倍高速であることが示されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:58:17 GMT)
DGR-MIL: Exploring Diverse Global Representation in Multiple Instance Learning for Whole Slide Image Classification [2.2] 多様なグローバル表現(DGR-MIL)に基づく新しい多重インスタンス学習法を提案する。
提案モデルは,CAMELYON-16とTCGA肺がんデータセットにおいて,最先端のMIL集約モデルよりもかなり優れている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:58:30 GMT)
Latent Diffusion Model for Generating Ensembles of Climate Simulations [2.1] 我々は、広範囲の気候シミュレーションに基づいて、新しい生成的深層学習アプローチを訓練する。
潜在空間表現を利用することで、我々のモデルは最小限のメモリを必要とする大規模なアンサンブルをオンザフライで迅速に生成できる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:43:52 GMT)
What to do if language models disagree? Black-box model ensembling for textual and visual question answering [2.1] 我々は、既存のブラックボックスモデルから勝者を選ぶことを学ぶデータ効率で軽量なアンサンブル手法であるInfoSelを紹介する。
我々は,F1スコアにおいて,スタンドアローンLLMと比較して,最大5.27%の絶対的な増加を実現していることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:59:10 GMT)
QueryMamba: A Mamba-Based Encoder-Decoder Architecture with a Statistical Verb-Noun Interaction Module for Video Action Forecasting @ Ego4D Long-Term Action Anticipation Challenge 2024 [2.0] 本稿では,マンバをベースとした新しいエンコーダデコーダアーキテクチャについて述べる。
このアーキテクチャは、歴史的データに基づいて動詞や名詞の発生を予測するだけでなく、それらの共同発生も予測精度を向上させるために考慮している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 23:13:06 GMT)
Conditional and Modal Reasoning in Large Language Models [2.0] 205大言語モデルが論理的に正しい推論と誤った推論を区別できる範囲を探索する。
GPT-4 モデルファミリー以外はすべて条件付きで基本的なミスを犯すことが多い。
ほぼ全てのモデルは、人間の判断と一致しない文献で広く議論されているある種の複雑な条件推論に対する答えを与える。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:12:25 GMT)
Pseudorandom Permutations from Random Reversible Circuits [2.0] 固定された最寄りのアーキテクチャにおいて,各層が$approx n/3$のランダムゲートからなる深さ$n cdot tildeO(k2)$のランダム回路がほぼ$k$の独立な置換をもたらすことを示す。
また、擬似乱数関数からの擬似乱数置換のLuby-Rack-off構成は可逆回路で実装可能であることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 03:51:17 GMT)
Charging Ahead: A Hierarchical Adversarial Framework for Counteracting Advanced Cyber Threats in EV Charging Stations [1.9] 電気自動車(EV)は、より高い充電優先度を得るために偽情報を提供し、グリッド不安定を引き起こす可能性がある。
本稿では,EV充電ステーションにおける盗難サイバー攻撃を効果的に検出するDRL(HADRL)を用いた階層的対向フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:23:03 GMT)
Logical Operators and Fold-Transversal Gates of Bivariate Bicycle Codes [1.8] 量子低密度パリティチェック(qLDPC)符号は、一定のオーバーヘッドを持つスケーラブルなフォールトトレラント量子計算への有望な経路を提供する。
近年の進歩により、qLDPC符号は、短期ハードウェアでも表面符号の量子メモリ能力より優れていることが示されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:49:35 GMT)
Dancing to the State of the Art? How Candidate Lists Influence LKH for Solving the Traveling Salesperson Problem [1.7] トラベリングセールスパーソン問題(TSP)の解決はいまだに永続的な課題である。
ヒューリスティックな解法は、高品質な解を見つけるための需要を効果的に解決する。
これらの解法の中で、Lin-Kernighan-Helsgaun(LKH)は遺伝的アルゴリズムの性能を補完するものとして際立っている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:38:19 GMT)
ELCC: the Emergent Language Corpus Collection [1.7] Emergent Language Corpus Collection (ELCC)は、緊急通信システムのオープンソース実装から収集されたコーパスのコレクションである。
各コーパスには、ソースコードの特徴を記述したメタデータと、コーパスの分析スイートが添付されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 21:23:18 GMT)
Use of Mobile Devices in the Classroom to Increase Motivation and Participation of Engineering University Students [1.6] 本研究の目的は,教室でモバイルデバイスを用いた場合,学生の参加が増加するかどうかを検討することである。
学生参加行動の量を測定した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:46:05 GMT)
Learning Decentralized Linear Quadratic Regulators with $\sqrt{T}$ Regret [1.5] 本稿では,システムのモデルが未知な場合,分散線形二次制御系を適応的に設計するオンライン学習アルゴリズムを提案する。
我々のコントローラは、部分的にネストされた情報パターンの場合、時間軸の$T$で$sqrtT$までスケールする期待された後悔を楽しんでいます。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 06:50:53 GMT)
Deep Learning Based Apparent Diffusion Coefficient Map Generation from Multi-parametric MR Images for Patients with Diffuse Gliomas [1.5] 拡散強調(DWI)MRIから得られたADCマップは、組織内の水分子に関する機能的測定を提供する。
本研究では,多パラメータMR画像からADCマップを合成するディープラーニングフレームワークを開発することを目的とする。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:36:16 GMT)
Ariadne and Theseus: Exploration and Rendezvous with Two Mobile Agents in an Unknown Graph [1.5] モバイルコンピューティングにおける2つの基本的な問題、探索とランデブーについて検討する。
そこで本研究では,時間段階の集合探索を実現するアルゴリズムを提案する。
また,少なくとも frac32m$ の時間ステップでレンデブーを保証するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:40:49 GMT)
Convergence rates for the Trotter-Kato splitting [1.4] 強い作用素位相において、トロッター-加藤の収束速度は$eA+L = lim_n to infty (eL/n eA/n)n$である。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:37:54 GMT)
Gene Set Summarization using Large Language Models [1.3] 我々はGPTモデルを用いて遺伝子セット関数の要約を行う手法を開発した。
これらの手法は,遺伝子セットのGO項リストを,有用かつ生物学的に有効に作成できることを示す。
しかし、GPTベースのアプローチでは、信頼できるスコアやp値が得られず、統計的に重要でない項を返すこともしばしばある。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:16:11 GMT)
PINNSim: A Simulator for Power System Dynamics based on Physics-Informed Neural Networks [1.3] より大きな時間ステップを踏むことができるシミュレータを提案する。
電力系統における単一成分の動的解の解法として物理インフォームドニューラルネットワーク(PINN)を基礎としている。
9-busシステム上でPINNSimを実演し,PINNSimの時間ステップサイズを台形積分法と比較した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:03:35 GMT)
Mixture of A Million Experts [1.2] 本稿では,多彩な専門家プールからのスパース検索に製品キー技術を利用する新しい層設計PEERを紹介する。
言語モデリングタスクの実験では、PEER層が高密度FFWや粗粒のMoEよりもパフォーマンス・計算トレードオフの点で優れていることが示された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 20:59:20 GMT)
High-dimensional variable clustering based on maxima of a weakly dependent random process [1.2] 本稿では,Asymptotic Independent Block (AI-block)モデルと呼ばれる,変数クラスタリングのための新しいモデルのクラスを提案する。
このモデルのクラスは特定可能であり、つまり、分割の間に部分的な順序を持つ極大要素が存在し、統計的推測が可能であることを意味する。
また,変数のクラスタを列挙するチューニングパラメータに依存するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:13:29 GMT)
Entanglement Polygon Inequalities for A Class of Mixed States [1.0] 多粒子高次元系の一般化されたWクラス状態の密度行列である混合状態のクラスの性質を考察する。
まず、混合状態のクラスが、Tsallis-q の絡み合いの観点から、絡み合いポリゴンの不等式を満たすことを示し、Tsallis-q の絡み合いの観点から、混合状態のより厳密な不等式のクラスを提案する。
最終的に混合状態の不等式が得られ、これは二部交絡関係と見なすことができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:46:46 GMT)
FemQuest -- An Interactive Multiplayer Game to Engage Girls in Programming [0.9] 本稿では,女子の3Dゲーム環境をモチベーションに利用したマルチプレイヤーゲームについて述べる。
ワークショップ評価では,女子235名,コーチ50名,ゲーム内分析では20名であった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 08:42:22 GMT)
Google Topics as a way out of the cookie dilemma? [0.9] 本稿では,広告目的における情報処理と個人情報処理の法的要件と意義について論じる。
クッキーの設定には個人の明示的な同意を得ることが必要だと強調している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:28:29 GMT)
Robust CATE Estimation Using Novel Ensemble Methods [0.9] 本研究は,多種多様なシナリオにまたがって,因果林や多種多様なメタラーナーなどの共通手法の性能を評価する。
提案手法では,X-Learnerをモデルスタック化してニュアンス関数を推定し,CBA(Consensus Based Averaging)を用いて内部一致度の高いモデルのみを平均化する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:23:02 GMT)
Deep Content Understanding Toward Entity and Aspect Target Sentiment Analysis on Foundation Models [0.9] Entity-Aspect Sentiment Triplet extract (EASTE)は、Aspect-Based Sentiment Analysisタスクである。
本研究は,EASTEタスクにおける高性能化を目標とし,モデルサイズ,タイプ,適応技術がタスクパフォーマンスに与える影響について検討する。
最終的には、複雑な感情分析における詳細な洞察と最先端の成果を提供する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:48:14 GMT)
ConText at WASSA 2024 Empathy and Personality Shared Task: History-Dependent Embedding Utterance Representations for Empathy and Emotion Prediction in Conversations [0.9] WASSAは、相互作用における共感と感情予測に関するタスクを共有しており、これらのタスクに対するアプローチをベンチマークする機会を提供する。
我々は、会話における各発話の共感、感情の極性、感情の強さを、会話の文脈とともに分類される発話をフィードすることによってモデル化する。
また,会話からのすべての発話と,その共感を予測しているインターロケータを識別するトークンを入力して,各インターロケータの相手共感をモデル化する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:44:59 GMT)
Women for Quantum -- Manifesto of Values [0.8] 私たちは、現在の科学的リーダーシップ、資金、権威のモデルが、私たちの多くを表現できないと信じています。
それは、異なる種類の力と、全員の参加を求める真の変革の時です。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:33:29 GMT)
Real HSI-MSI-PAN image dataset for the hyperspectral/multi-spectral/panchromatic image fusion and super-resolution fields [0.8] ハイパースペクトル画像(HSI)融合実験のほとんどは、異なる融合法を比較するためのシミュレーションデータセットに基づいている。
HSI/MSI/PAN画像データセットを公開し、ハイパースペクトル画像融合の分野の開発を促進する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 01:59:54 GMT)
HYBRINFOX at CheckThat! 2024 -- Task 2: Enriching BERT Models with the Expert System VAGO for Subjectivity Detection [0.8] HYBRINFOX法は評価データからマクロF1スコア0.7442で1位にランク付けした。
本稿では,我々のハイブリッドアプローチの原理を説明し,その手法を英語以外の言語にも適用する方法を概説する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:29:19 GMT)
HYBRINFOX at CheckThat! 2024 -- Task 1: Enhancing Language Models with Structured Information for Check-Worthiness Estimation [0.8] 本稿では,2024年 - タスク1コンペティションのためのHYBRINFOXチームの実験と結果について要約する。
本稿では,RoBERTaのような言語モデルに三重項による埋め込みを組み込む手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:33:54 GMT)
TwinLab: a framework for data-efficient training of non-intrusive reduced-order models for digital twins [0.8] 本研究では,2つのデータセットしか持たないニューラル-ODE型リダクションオーダモデルの,効率的かつ高精度なトレーニングフレームワークであるTwinLabを提案する。
トレーニングに最適なデータセットをひとつ見つけた後、類似性とエラー対策の助けを借りて第2のデータセットを求め、トレーニングプロセスを効果的に強化する。
発見: トレーニングプロセスに適切な第2のトレーニングデータセットを追加すると、テストエラーが最大49%削減される。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:37:13 GMT)
On Simulation of Power Systems and Microgrid Components with SystemC-AMS [0.8] マイクログリッドのようなサイバー物理システムは、相互接続されたコンポーネント、局所的な電力システム、分散エネルギー資源から構成される。
電力系統変換器とその制御ループは、グリッドを安定化し、メイングリッドとマイクログリッドの対面において重要な役割を果たす。
本稿では,SystemC-AMSを用いたマイクログリッド部品の電磁過渡応答を高速にシミュレーションする手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:42:29 GMT)
Scoping Review of Active Learning Strategies and their Evaluation Environments for Entity Recognition Tasks [0.6] 我々は62の関連論文を分析し、106のアクティブラーニング戦略を特定した。
エクスプロイトベース(60倍)、探索ベース(14倍)、ハイブリッド戦略(32倍)の3つのカテゴリに分類した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:40:35 GMT)
Autonomous Control of a Novel Closed Chain Five Bar Active Suspension via Deep Reinforcement Learning [0.6] 本稿では,シャーシ安定化に着目したアクティブサスペンションシステムについて述べる。
SACをPID(Proportional Integral Derivative)コントロールと併用してシャシーを安定化した。
モデルは、周囲の障害物からの距離、障害物の高さ、シャシーの向きを利用して、サスペンションの制御リンクを正確に作動させる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:12:25 GMT)
Generation of intraparticle quantum correlations in amplitude damping channel and its robustness [0.6] 種々の脱コヒーレンスチャネル下での2つの自由度間の粒子内相関について検討した。
振幅減衰流の特異な特徴を観察し, 絡み合いが分離状態から始まることを示した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:47:12 GMT)
Overdispersion in gate tomography: Experiments and continuous, two-scale random walk model on the Bloch sphere [0.6] 既存のノイズモデルでは,アルゴリズムのランタイム上でのノイズ効果の凝集を適切に捉えることができないことを示す。
ゲート操作数の関数として読み出し確率のノイズモデルを開発する。
過分散を考慮した2番目のランダムウォークを複数の読み出しスケールで重畳する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 14:44:53 GMT)
Content-Based Image Retrieval for Multi-Class Volumetric Radiology Images: A Benchmark Study [0.6] 非医用画像上の事前訓練された教師なしモデルからの埋め込みに対して、医用画像上の事前訓練された教師なしモデルからの埋め込みをベンチマークした。
ボリューム画像の検索には,テキストマッチングにインスパイアされた遅延インタラクションのランク付け手法を採用する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:00:32 GMT)
Black Box Model Explanations and the Human Interpretability Expectations -- An Analysis in the Context of Homicide Prediction [0.6] 説明可能な人工知能(XAI)に基づく戦略は、ブラックボックスモデルの結果のより良い人間の解釈可能性を促進する。
本研究は、殺人予測に関連する現実世界の分類問題に対処する。
6つの異なるXAI手法を使って説明をし、6つの異なる人間の専門家を作成した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:39:08 GMT)
SfM on-the-fly: Get better 3D from What You Capture [0.6] Structure from Motion (SfM) は、フォトグラメトリー、コンピュータビジョン、ロボティクスなどの分野で、常に研究のホットスポットとなっている。
この作業は、オリジナルのSfMの上に構築され、アップデートされたバージョンには3つの新しい進歩があり、より優れた3Dをキャプチャから得ることができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:52:37 GMT)
TartuNLP @ AXOLOTL-24: Leveraging Classifier Output for New Sense Detection in Lexical Semantics [0.2] AXOLOTL-24共有タスクに提案する。
このタスクは2つのサブタスクから構成される: 単語が時間とともに得られる新しい感覚を識別し、識別された新しい感覚の定義を生成する。
適応型バイナリ分類モデルをトレーニングし、使用例とグルースを一致させ、モデルの確率出力を利用して新しい感覚を識別した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:46:39 GMT)
CT2Rep: Automated Radiology Report Generation for 3D Medical Imaging [0.2] 胸部CTを対象とする3次元医用画像のラジオグラフィーレポート作成法について紹介する。
比較手法が存在しないことから,医用画像における高度な3次元視覚エンコーダを用いたベースラインを構築し,本手法の有効性を実証する。
我々は,CT2Repをクロスアテンションベースのマルチモーダル融合モジュールと階層メモリで拡張し,縦型マルチモーダルデータの取り込みを可能にした。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:04:32 GMT)
A Multivariate Unimodality Test Harnessing the Dip Statistic of Mahalanobis Distances Over Random Projections [0.2] 線形ランダムプロジェクションとポイント・ツー・ポイント・ディスタンシングにより、一次元の一様性原理を多次元空間に拡張する。
我々の手法は$alpha$-unimodalityの仮定に根ざし、泥ッドと呼ばれる新しい一様性試験を提示する。
理論的および実証的研究は,多次元データセットの一様性評価における本手法の有効性を確認した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 17:51:38 GMT)
Reviewers of Educational Immersive and Extended Reality (XR) experiences: Who is creating these reviews and why? [0.1] 本稿では,教育用没入型・拡張型現実(eduXR の経験と理由)を誰がレビューしているかを検討するために,スコーピングによる文献のレビューを行う。
eduXRのユーザにとって、経験のレビューは、学習ニーズを満たすかどうかを判断するための情報を提供することができる。
eduXRには確立されたレビューシステムはないが、真剣なゲームレビューには関連性があり、一部には重複があるが、すべてではない。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:45:56 GMT)
Anthropocentric bias and the possibility of artificial cognition [0.0] 大きな言語モデル(LLM)の認知能力を評価するには、人間中心のバイアスを克服する必要がある。
本稿では,LLMの能力に拘わらず,補助的要因がLLMのパフォーマンスにどのような影響を与えるかを見極めるとともに,人間の能力と異なるLCMの機械的戦略を排除した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:44:28 GMT)
\boldmath $SU(\infty)$ Quantum Gravity: Emergence of Gravity in an Infinitely Divisible Quantum Universe [0.0] SU(infty)$-QGRは、重力に対する基本的な量子的アプローチである。
宇宙全体のヒルベルト空間は対称性群 $SU(infty)$ を表すと仮定する。
我々は、大域的な$SU(infty)$対称性が、宇宙の他の部分系との絡み合いを通して現れることを示した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:19:28 GMT)
Wood Surface Inspection Using Structural and Conditional Statistical Features [0.0] 本研究では,木面画像のガウス応答のマグニチュードとラプラシアンからの支持領域抽出に基づく解を提案する。
木材表面の自動検査システムを大規模データセット上でテストし,有望な結果を得た。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:44:06 GMT)
When big data actually are low-rank, or entrywise approximation of certain function-generated matrices [0.0] 我々は、特定の分析関数のクラスに対して、そのような行列は$m$に依存しないランクの正確なエントリーワイズ近似を許容する、という文献の議論に反論する。
n × n$ の関数生成行列が次数 $varepsilon$ のエントリーワイド誤差で階数 $mathcalO(log(n) varepsilon-2 Mathrmpolylog(varepsilon-1)$ で近似できる関数のより狭い3つのクラスを記述する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 10:56:45 GMT)
What AIs are not Learning (and Why): Bio-Inspired Foundation Models for Robots [0.0] 現在のスマートロボットは、手動プログラミング、数学的モデル、計画フレームワーク、強化学習を使って作成されている。
2足歩行ロボットの高コスト(ボディ)は、研究と展開の両方において大きな障害となる。
本稿では、人間互換サービスロボットが知っておくべきことに焦点を当てる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:12:26 GMT)
Unlocking the Potential of Metaverse in Innovative and Immersive Digital Health [0.0] メタバースは、患者のケア、医療教育、そして教育/学習と研究の方法を変えることによって、医療を変革する大きな可能性を秘めている。
本稿では、医療の文脈におけるMetaverseの長所と短所について検討し、その可能性を技術とAIの観点から分析する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 20:08:38 GMT)
Universal work statistics in long-range interacting quantum systems [0.0] 本研究では, 様々な外部駆動に対する長距離システムの応答について検討し, 動的励振に対する頑健さを強調した。
本研究は、量子熱力学応用のための長距離相互作用媒質を組み込むことの利点を実証するものである。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:04:05 GMT)
True image construction in quantum-secured single-pixel imaging under spoofing attack [0.0] 我々は、スプーフィング攻撃に耐えられるように設計されたQS-SPI(quantum-Secured Single-Pixel Imaging)技術を導入する。
動作を制限するしきい値エラーレートを課した従来の量子セキュリティプロトコルとは異なり、我々のアプローチはスプーフ攻撃を識別するだけでなく、真のイメージの再構築を容易にする。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:19:12 GMT)
The role of initial system-environment correlations in the accuracies of parameters within spin-spin model [0.0] 本研究では,環境パラメータの推定を改善するために,初期システム環境相関の効果について検討する。
温度推定では, 推定精度を桁違いに向上できるので, 結果が期待できる。
結合強度の場合, 相関の場合と非相関の場合において, 連続的に精度が上昇していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:25:51 GMT)
The p-Adic Schrödinger Equation and the Two-slit Experiment in Quantum Mechanics [0.0] p-進量子力学はディラック・ヴォン・ノイマン公理から構成される。
p進量子力学は、空間が離散的な性質を持つ場合、標準量子力学で何が起こるかという問題によって動機付けられている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:05:05 GMT)
Support Vector Based Anomaly Detection in Federated Learning [0.0] 異常検出は、サイバーセキュリティから産業システムまで、様々な領域において重要な役割を果たす。
従来の集中型アプローチは、データプライバシに関する課題に遭遇することが多い。
この研究は、フェデレートされた環境での異常検出のための2つの革新的なアルゴリズムを導入している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:32:17 GMT)
Quantum dynamics of frustrated Josephson junction arrays embedded in a transmission line: an effective XX spin chain with long-range interaction [0.0] 我々は理論的には、散逸のない伝送路に埋め込まれたジョセフソン接合のフラストレーションされたソートゥース鎖に生じる様々な集合量子相について研究する。
透過線への$pi$-Josephson接合の直接埋め込みにより、よく分離された細胞の(反)渦の間の短距離および長距離の相互作用を確立することができる。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:40:08 GMT)
Quantum Convolutional Neural Network for Phase Recognition in Two Dimensions [0.0] 量子畳み込みニューラルネットワーク(Quantum Convolutional Neural Network, QCNN)は、物質の量子位相を低コストで認識するための量子回路である。
ここでは,2次元の位相認識が可能なQCNNを構築し,トーリック符号相から常磁性相への位相遷移を正確に同定する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 18:38:06 GMT)
Psychology of Artificial Intelligence: Epistemological Markers of the Cognitive Analysis of Neural Networks [0.0] アシモフが1950年に予言した人工知能の心理学は、このAIの探索と説明可能性に敏感な物質の研究を目的としている。
後者を調べるための前提条件は、その現象学に起因する認知状態に関するいくつかのマイルストーンを明らかにすることである。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:53:05 GMT)
On the performance of sequential Bayesian update for database of diverse tsunami scenarios [0.0] 本研究の目的は,多様なデータベースを用いた津波シナリオ検出フレームワークの性能評価である。
シナリオ重畳の有効性を,従来最も可能性の高いシナリオ検出手法と比較した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 04:46:09 GMT)
On the mathematical description of combined PMD PDL effects in optical communications and how their induced impairments can be minimized [0.0] PMD-PDL効果は、スピン1/2ゼロ質量粒子に作用するローレンツ変換と正式に同一であることが示されている。
PMD-PDL誘発障害を著しく低減する手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:03:22 GMT)
On temporal entropy and the complexity of computing the expectation value of local operators after a quench [0.0] 本研究では, 1次元量子システムにおける局所演算子の時間依存期待値をシミュレーションする計算複雑性について検討する。
時間的行列積状態を用いた局所演算子の時間依存期待値の計算は,同じ量の計算に対して有利である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:18:36 GMT)
Nonperturbative cavity quantum electrodynamics: is the Jaynes-Cummings model still relevant? [0.0] キャビティ量子電磁力学の研究において,Jaynes-Cummingsモデルが占める役割を簡潔に論じる。
非摂動型光物質結合系においても,Jaynes-Cummingsモデルが重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 13:05:41 GMT)
Integrating Randomness in Large Language Models: A Linear Congruential Generator Approach for Generating Clinically Relevant Content [0.0] 本研究は,AIを用いたコンテンツ生成と組み合わせて,系統的事実選択に線形コングルシデント生成法を用いる。
消化管生理学と病理学の独自の組み合わせを複数回にわたって確保し,これらの事実をGPT-4oに組み込んで臨床的に有意なビグネットスタイルのアウトプットを創出した。
14ラウンド以上で98のユニークな出力が生成され、LCGが多種多様な高品質なコンテンツを制作する効果を示した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:21:47 GMT)
Implicit Hypersurface Approximation Capacity in Deep ReLU Networks [0.0] 本稿では,ReLUアクティベーションを用いたディープフィードフォワードニューラルネットワークの幾何近似理論を開発する。
幅$d+1$の深い完全連結ReLUネットワークは、そのゼロ輪郭として暗黙的に近似を構成することができることを示す。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 11:34:42 GMT)
How to Evaluate Games in Education: A Literature Review [0.0] 我々は、異なる科学分野で行われた制御実験を要約し、評価することを目的として、異なる研究をレビューし、分析する。
本研究は,非実験条件の記述の明確さに焦点をあて,制御グループの活動に使用される教育方法が不十分であることを示す。
計算機科学と工学の分野での研究は、一般に、他の分野よりも明らかに結果を報告している。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 12:18:42 GMT)
Holography of Transmission Lines: Insights of Continuous MERA and AdS/CFT [0.0] 我々はAdS空間における伝送線路の量子化と相互作用を分析する。
その結果、量子回路における複雑な現象の扱いと制御に関する新たな洞察が得られた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 22:09:31 GMT)
Historical Ink: 19th Century Latin American Spanish Newspaper Corpus with LLM OCR Correction [0.0] 本稿は,19世紀のラテンアメリカのプレステキストのデータセットを新たに提示し,この地域での歴史的・言語学的分析のための特別なコーパスの欠如に対処するものである。
大規模言語モデルを用いて,OCR誤り訂正と言語表面形状検出のためのフレームワークをデジタルコーパスで導入する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:10:18 GMT)
GraphCNNpred: A stock market indices prediction using a Graph based deep learning system [0.0] 我々は,テキストS&textP 500,NASDAQ,DJI,NYSE,RASELの指標の傾向を予測するために,さまざまなデータソースに適用可能なグラフニューラルネットワークベースの畳み込みニューラルネットワーク(CNN)モデルを提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:14:24 GMT)
Generalized group designs: overcoming the 4-design-barrier and constructing novel unitary 2-designs in arbitrary dimensions [0.0] ユニタリ設計は、いくつかの量子情報プロトコルにおいて必須のツールである。
本稿では,グループ設計を高度に一般化するための新しい構成法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:23:26 GMT)
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs [0.0] FunAudioLLMは、人間と大規模言語モデル(LLM)の間の自然な音声相互作用を強化するために設計されたモデルファミリーである
中心となる2つの革新的なモデルとして、多言語音声認識、感情認識、音声イベント検出を処理するSenseVoiceと、複数の言語、音色、話し方、話者識別を制御した自然言語生成を容易にするCosyVoiceがある。
SenseVoiceとCosyVoiceに関連するモデルは、GitHubでリリースされたトレーニング、推論、微調整コードとともに、ModelscopeとHuggingfaceでオープンソース化されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 16:49:02 GMT)
From Data to Commonsense Reasoning: The Use of Large Language Models for Explainable AI [0.0] 本研究では,大規模言語モデル(LLM)の有効性について検討した。
モデルが異なるデータセット上で人間より優れており、LLMがコモンセンスで推論できることを実証する。
回答者の66%がGPT-3.5の説明を「良い」か「優れている」と評価した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:38:49 GMT)
Finite Operator Learning: Bridging Neural Operators and Numerical Methods for Efficient Parametric Solution and Optimization of PDEs [0.0] 本稿では,ニューラルネットワーク,物理情報処理機械学習,およびPDEを解くための標準的な数値法を組み合わせた手法を提案する。
データのない方法で偏微分方程式をパラメトリックに解き、正確な感度を与えることができる。
本研究では, 不均一材料中の定常熱方程式に着目した。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 21:23:12 GMT)
Differentiating between human-written and AI-generated texts using linguistic features automatically extracted from an online computational tool [0.0] 本研究の目的は,AIが人間の文章をエミュレートする能力を評価することにある。
人間の発話を模倣したAI生成テキストが現れるにもかかわらず、結果は複数の言語的特徴に有意な差が認められた。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 05:37:09 GMT)
Deep learning architectures for data-driven damage detection in nonlinear dynamic systems [0.0] 本研究は,非線形力学系におけるデータ駆動型損傷検出に応用した深層学習について詳細に検討する。
1次元畳み込みニューラルネットワークを利用するオートエンコーダ(AE)とジェネレーティブ・敵ネットワーク(GAN)が実装されている。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 07:40:02 GMT)
Convolutional vs Large Language Models for Software Log Classification in Edge-Deployable Cellular Network Testing [0.0] 最大20万文字のコンテキストウインドウを提供する小型畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
私たちのモデルは、テスト実行中の欠陥を特定し、それらを関連する部門(以前は手動のエンジニアリングプロセス)にトリガする能力を持っています。
我々のモデルは専用のハードウェアを使わずにエッジデバイスにデプロイでき、様々な業界のソフトウェアログに広く適用できます。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 09:12:08 GMT)
Collective transition quenching in the presence of multiple competing decay channels [0.0] 集合遷移クエンチング(collective transition quenching)は、複数の崩壊チャネルを持つ系で起こる量子多体散逸現象である。
置換対称性の存在下では、この問題は任意の競合するチャネルに対して正確に解決可能であることを証明している。
本研究は,量子システムの構築と制御における多体戦略の新たな道を開くものである。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 19:13:48 GMT)
Can Base ChatGPT be Used for Forecasting without Additional Optimization? [0.0] 本研究では,OpenAI の ChatGPT-3.5 と ChatGPT-4 が今後の事象を予測できるかどうかを検討する。
私たちは、直接予測と将来の物語と呼ばれる2つの促進戦略を採用しています。
100の試行を解析した結果,将来の物語はChatGPT-4の予測精度を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 23:03:45 GMT)
Autoencoded Image Compression for Secure and Fast Transmission [0.0] 本稿では,画像圧縮のためのオートエンコーダアーキテクチャを提案する。
提案アーキテクチャは、再生した画像に対して97.5%のSSIMを実現し、平均遅延時間を87.5%削減する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 15:07:39 GMT)
Application of Magnus expansion for the quantum dynamics of $Λ$-systems under periodic driving and assessment of the rotating wave approximation [0.0] 2つの正弦波時間依存場によって駆動される$Lambda$-systemの量子力学計算を行う。
閉系力学について、ヒルベルト空間とリウヴィル空間における力学の同値性を数値的に確認する。
論文参考訳(メタデータ) (Thu, 4 Jul 2024 02:02:37 GMT)