PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views [116.1] PixelGaussianは、任意の視点から一般化可能な3Dガウス再構成を学習するための効率的なフレームワークである。
提案手法は,様々な視点によく一般化した最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:58 GMT)
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment [112.5] 本稿では,RealignDiffという2段階の粗大なセマンティックアライメント手法を提案する。
粗いセマンティックリアライメントフェーズにおいて、生成された画像キャプションと与えられたテキストプロンプトとのセマンティックな相違を評価するために、新しいキャプション報酬を提案する。
微妙なセマンティックリアライメントステージは、局所的な密集キャプション生成モジュールと再重み付けアテンション変調モジュールを用いて、局所的なセマンティックビューから生成された画像を洗練する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:14:22 GMT)
Taipan: Efficient and Expressive State Space Language Models with Selective Attention [100.2] 自然言語処理(NLP)における長文言語モデリングの課題
Mambaのような最近のステートスペースモデル(SSM)は、メモリ使用量を一定に抑える代替手段を提供するが、大規模なコンテキスト内検索を必要とするタスクでは性能が劣る。
我々は,Mamba-2と選択注意層(SAL)を組み合わせた新しいハイブリッドアーキテクチャであるTaipanを紹介する。
我々の実験は、様々なスケールやタスクにまたがる優れたパフォーマンスを示し、より効率的な長文言語モデリングのための有望なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:25:37 GMT)
PRACT: Optimizing Principled Reasoning and Acting of LLM Agent [96.1] 本稿では、軌道データから行動原理を学習し、強制するための新しい手法である、原則推論と行為(PRAct)フレームワークを紹介する。
我々は,行動原理を特定のタスク要求に適応させるため,新しい最適化フレームワークであるリフレクティブ原則最適化(RPO)を提案する。
4つの環境にまたがる実験の結果、PRActエージェントは、RPOフレームワークを活用し、効果的に学習し、パフォーマンスを高めるためにアクション原則を適用します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:21:51 GMT)
Analyzing Human Questioning Behavior and Causal Curiosity through Natural Queries [91.7] NatQuest(ナットクエスト)は、3つの異なるソースから自然発生の質問13,500件のコレクションである。
分析の結果,データセット内には因果的疑問(最大42%)が有意な存在であることが判明した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:21:38 GMT)
A Mean-Field Analysis of Neural Stochastic Gradient Descent-Ascent for Functional Minimax Optimization [90.9] 本稿では,超パラメトリック化された2層ニューラルネットワークの無限次元関数クラス上で定義される最小最適化問題について検討する。
i) 勾配降下指数アルゴリズムの収束と, (ii) ニューラルネットワークの表現学習に対処する。
その結果、ニューラルネットワークによって誘導される特徴表現は、ワッサーシュタイン距離で測定された$O(alpha-1)$で初期表現から逸脱することが許された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:38:19 GMT)
VideoGLUE: Video General Understanding Evaluation of Foundation Models [89.1] 我々は、慎重に設計された実験プロトコルを用いて、基礎モデル(FM)の映像理解能力を評価する。
一般的な映像理解タスクに適応する際のFMの目印と有効性について共同で検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:35:27 GMT)
Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback [87.4] アノテーションの品質向上のために,人間とLMの入力を組み合わせたルーティングフレームワークを提案する。
我々は、人間とLMアノテーションの任意の組み合わせで報酬モデルの性能を予測するために、性能予測モデルを訓練する。
選択したハイブリッド混合物は,一方のみ使用した場合と比較して,報奨モデルの性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:04:15 GMT)
Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3] コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:56:08 GMT)
VibeCheck: Discover and Quantify Qualitative Differences in Large Language Models [82.9] 大規模言語モデル(LLM)は、ユーザが直感的に認識するが定量化に苦慮する出力に微妙に特徴を呈することが多い。
本稿では,一対のLLMを自動比較するシステムであるVibeCheckを紹介する。
要約や数学,キャプションなど,さまざまなモデルやタスク上でVibeCheckを実行して,モデル動作の違いに関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:01:12 GMT)
Large Language Models Can Be Contextual Privacy Protection Learners [81.6] 我々は、微調整言語モデルのための新しいパラダイムであるコンテキストプライバシ保護言語モデル(CPPLM)を紹介する。
我々の研究はモデル設計の理論解析を提供し、コーパスキュレーション、ペナルティに基づくトレーニング損失の相違、命令に基づくチューニングなど様々な手法をベンチマークする。
特に,肯定例と否定例の両方を用いた指導指導は有望な手法であり,モデルの知識を高めつつ,個人データを効果的に保護する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:36:36 GMT)
Newton Losses: Using Curvature Information for Learning with Differentiable Algorithms [80.4] カスタム目的の8つの異なるニューラルネットワークのトレーニング方法を示す。
我々はその2次情報を経験的フィッシャー行列を通して活用する。
ロスロスロスシブルアルゴリズムを用いて、少ない微分可能アルゴリズムに対する大幅な改善を実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:02:11 GMT)
ToolFlow: Boosting LLM Tool-Calling Through Natural and Coherent Dialogue Synthesis [80.3] より関連性の高いツールの組み合わせをサンプリングするためのグラフベースのサンプリング戦略と、コヒーレントな対話の合成を導く計画を作成するための計画生成戦略を提案する。
ツールフローで生成した8000の合成対話を用いてLLaMA-3.1-8BにSFTを適用した。
その結果,GPT-4に匹敵するツールコール性能が得られた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:45:04 GMT)
Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.9] 大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:54:42 GMT)
What If the Input is Expanded in OOD Detection? [77.4] Out-of-distriion (OOD) 検出は未知のクラスからのOOD入力を特定することを目的としている。
In-distriion(ID)データと区別するために,様々なスコアリング関数を提案する。
入力空間に異なる共通の汚職を用いるという、新しい視点を導入する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:47:28 GMT)
Fast constrained sampling in pre-trained diffusion models [77.2] 拡散モデルは、大規模な生成画像モデルの分野を支配してきた。
本研究では,大規模な事前学習拡散モデルにおける高速拘束サンプリングのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:52:38 GMT)
VHELM: A Holistic Evaluation of Vision Language Models [75.9] 視覚言語モデル(VHELM)の全体的評価について述べる。
VHELMは、視覚的知覚、知識、推論、バイアス、公平性、多言語性、堅牢性、毒性、安全性の9つの側面の1つ以上をカバーするために、さまざまなデータセットを集約する。
私たちのフレームワークは軽量で自動で、評価の実行が安価で高速に行えるように設計されています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:17:36 GMT)
VHELM: A Holistic Evaluation of Vision Language Models [75.9] 視覚言語モデル(VHELM)の全体的評価について述べる。
VHELMは、視覚的知覚、知識、推論、バイアス、公平性、多言語性、堅牢性、毒性、安全性の9つの側面の1つ以上をカバーするために、さまざまなデータセットを集約する。
私たちのフレームワークは軽量で自動で、評価の実行が安価で高速に行えるように設計されています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:17:36 GMT)
TimeXer: Empowering Transformers for Time Series Forecasting with Exogenous Variables [75.8] TimeXerは外部情報を取り込み、内因性変数の予測を強化する。
TimeXerは、12の現実世界の予測ベンチマークで一貫した最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:13:24 GMT)
SafeBench: A Safety Evaluation Framework for Multimodal Large Language Models [75.7] MLLMの安全性評価を行うための総合的なフレームワークであるツールンを提案する。
我々のフレームワークは、包括的な有害なクエリデータセットと自動評価プロトコルで構成されています。
本研究では,広く利用されている15のオープンソースMLLMと6つの商用MLLMの大規模実験を行った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:14:40 GMT)
A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs [74.4] 大規模言語モデル(LLM)開発における最大の課題は、その面倒な事前トレーニングコストである。
本稿では,小言語モデル(SLM)を活用して,LLMの事前学習効率と品質を改善するための有望なパラダイムについて検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:31:52 GMT)
SPEED++: A Multilingual Event Extraction Framework for Epidemic Prediction and Preparedness [73.7] 多様な疾患や言語に対する流行イベント情報を抽出する,最初の多言語イベント抽出フレームワークを提案する。
各言語でデータに注釈を付けることは不可能であり、ゼロショット・クロスランガル・クロス・ディスリーズ・モデルを開発する。
われわれのフレームワークは、2019年12月初旬に中国のWeiboポストから、中国でのトレーニングなしに、新型コロナウイルスの流行を警告することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:03:54 GMT)
Large Language Models Reflect the Ideology of their Creators [73.3] 大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
異なるLLMや言語にまたがるイデオロギー的姿勢の顕著な多様性を明らかにする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:02:30 GMT)
Mixture of Parrots: Experts improve memorization more than reasoning [72.4] 専門家の数が増えるにつれて、推論能力が飽和している間に記憶性能が一貫して向上することを示す。
専門家の増加は知識集約的なタスクの解決に役立ちますが、推論タスクには同じようなメリットが得られません。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:54:41 GMT)
Irregular Tensor Low-Rank Representation for Hyperspectral Image Representation [71.7] 低ランクテンソル表現はスペクトル変動を緩和するための重要なアプローチである。
従来の低ランク表現法は、通常のデータキューブにのみ適用できる。
本稿では,不規則な3次元立方体を効率的にモデル化できる新しい不規則な低ランク表現法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:56:22 GMT)
Little Giants: Synthesizing High-Quality Embedding Data at Scale [71.4] SPEEDは,オープンソースの小型モデルと協調して大規模な埋め込みデータを効率的に生成するフレームワークである。
SPEEDはGPT API呼び出しの1/10未満しか使用せず、両者が合成データのみに基づいてトレーニングされている場合、最先端の埋め込みモデルE5_mistralよりも優れている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:47:30 GMT)
Monge-Ampere Regularization for Learning Arbitrary Shapes from Point Clouds [69.7] 任意の曲面型をモデル化するための新しい暗黙曲面表現であるスケールド2乗距離関数 (S$2$DF) を提案する。
S$2$DFは、ゼロレベルセットでのUDFの非微分可能性問題に効果的に対処しながら、内部領域と外部領域を区別しない。
S$2$DF はモンゲ・アンペア型の二次偏微分方程式を満たすことを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:56:34 GMT)
Schema-Guided Culture-Aware Complex Event Simulation with Multi-Agent Role-Play [69.6] 自然災害や社会と政治の対立といった複雑な出来事は、政府や社会からの迅速な対応を必要とする。
我々は、ドメイン知識を表すイベントスキーマの両方でガイドされる、制御可能な複雑なニュースイベントシミュレータを開発した。
ジオディバース・コモンセンスとカルチャー・ノルム・アウェア・ナレッジ・エンハンスメント・コンポーネントを導入する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:21:43 GMT)
Assessing the Brittleness of Safety Alignment via Pruning and Low-Rank Modifications [69.1] 大きな言語モデル(LLM)は、その安全性メカニズムに固有の脆さを示す。
本研究では, プルーニングと低ランク改造を利用した安全アライメントの脆性について検討した。
安全クリティカル領域への変更が制限された場合でも,LSMは低コストの微調整攻撃に対して脆弱であることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:21:52 GMT)
Unbounded: A Generative Infinite Game of Character Life Simulation [68.4] 生成モデルを用いて,有限なハードコードシステムの境界を超越したゲームである生成無限ゲームの概念を導入する。
我々は、生成AIの最近の進歩を活用して、生成モデルに完全にカプセル化されたキャラクターライフシミュレーションゲームUnboundedを作成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:31 GMT)
Why Does the Effective Context Length of LLMs Fall Short? [68.3] 本稿では,SifTed Rotray 位置埋め込み (STRING) について紹介する。
ストリングは、トレーニング中の元の非効率な位置を上書きするために、よく訓練された位置をシフトし、既存のトレーニング期間内でのパフォーマンスを向上させる。
実験結果から, STRINGは最新の大規模モデルの性能を劇的に向上させることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:51:50 GMT)
Decoding on Graphs: Faithful and Sound Reasoning on Knowledge Graphs through Generation of Well-Formed Chains [66.6] 知識グラフ(KG)は質問応答(QA)のための信頼できる知識ソースとして機能する。
我々は、LLMとKGの深い相乗効果を促進する新しいフレームワークであるDoG(Decoding on Graphs)を提案する。
様々なKGQAタスクに対して異なるバックグラウンドKGを用いた実験により、DoGが優れた、堅牢なパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:01:40 GMT)
Structure Language Models for Protein Conformation Generation [66.4] 伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:38:51 GMT)
Disentangled Representation Learning with the Gromov-Monge Gap [65.7] 乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:49:16 GMT)
Prototypical Hash Encoding for On-the-Fly Fine-Grained Category Discovery [65.2] カテゴリ対応プロトタイプ生成(CPG)とディスクリミカテゴリ5.3%(DCE)が提案されている。
CPGは、各カテゴリを複数のプロトタイプで表現することで、カテゴリ内の多様性を完全にキャプチャすることを可能にする。
DCEは生成されたカテゴリプロトタイプのガイダンスによってハッシュコードの識別能力を向上する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:51:40 GMT)
BoostAdapter: Improving Vision-Language Test-Time Adaptation via Regional Bootstrapping [64.8] 本稿では,テスト時間適応フレームワークを提案する。
我々は、インスタンスに依存しない履歴サンプルとインスタンスを意識したブースティングサンプルから特徴を検索するための軽量なキー値メモリを維持している。
理論的には,本手法の背後にある合理性を正当化し,アウト・オブ・ディストリビューションとクロスドメイン・データセットの両方において,その有効性を実証的に検証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:41:48 GMT)
Iterative Self-Tuning LLMs for Enhanced Jailbreaking Capabilities [63.6] 本稿では,対戦型LDMをジェイルブレイク能力に富んだ反復的自己調整プロセスであるADV-LLMを紹介する。
我々のフレームワークは,様々なオープンソース LLM 上で ASR を100% 近く達成しながら,逆接接尾辞を生成する計算コストを大幅に削減する。
Llama3のみに最適化されているにもかかわらず、GPT-3.5では99%のASR、GPT-4では49%のASRを達成している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:36:12 GMT)
Chain of Ideas: Revolutionizing Research in Novel Idea Development with LLM Agents [62.4] 科学文献の急激な増加は、研究者が最近の進歩と意義ある研究方向を見極めるのを困難にしている。
大規模言語モデル(LLM)の最近の発展は、新しい研究のアイデアを自動生成するための有望な道のりを示唆している。
本研究では, チェーン構造に関連文献を整理し, 研究領域の進展を効果的に反映する, LLMベースのエージェントであるChain-of-Ideas(CoI)エージェントを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:59:53 GMT)
Rectified Diffusion Guidance for Conditional Generation [62.0] CFGの背後にある理論を再検討し、組合せ係数の不適切な構成(すなわち、広く使われている和対1バージョン)が生成分布の期待シフトをもたらすことを厳密に確認する。
本稿では,誘導係数を緩和したReCFGを提案する。
このようにして、修正された係数は観測されたデータをトラバースすることで容易に事前計算でき、サンプリング速度はほとんど影響を受けない。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:41:32 GMT)
Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models [61.5] 集約精度を検査する際には、スキルワイドのパフォーマンスが不明確になる。
モデル生成論理を検査することで,任意の評価事例に関連する基礎的スキルを復元する自動手法を提案する。
私たちのスキルスライスとフレームワークは、モデル評価の新しい道を開き、スキル固有の分析を活用して、よりきめ細やかで実用的なモデル機能の理解を解き放ちます。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:27:22 GMT)
Sparse Diffusion Policy: A Sparse, Reusable, and Flexible Policy for Robot Learning [61.3] 我々はスパース・リユース・フレキシブル・ポリシー、スパース・ディフュージョン・ポリシー(SDP)を導入する。
SDPは、エキスパートとスキルを選択的に活性化し、モデル全体をトレーニングすることなく、効率的でタスク固有の学習を可能にする。
デモとコードはhttps://forrest-110.io/sparse_diffusion_policy/にある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:01:44 GMT)
Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction [61.0] 本稿では,空間的局所化とビュー予測を共同で扱う新しい自動回帰フレームワークである生成空間変換器(GST)を提案する。
本モデルでは,カメラのポーズを1つの画像から同時に推定し,新しいカメラのポーズから視点を予測し,空間認識と視覚予測のギャップを効果的に埋める。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:58:05 GMT)
Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.8] Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:24:56 GMT)
Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.8] Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:24:56 GMT)
Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.8] Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:24:56 GMT)
Every Component Counts: Rethinking the Measure of Success for Medical Semantic Segmentation in Multi-Instance Segmentation Tasks [60.8] 本稿では,新しいセマンティックセグメンテーション評価プロトコルであるConnected-Component (CC)-Metricsを提案する。
本研究は,全体PET/CTにおけるセマンティックセグメンテーションの一般的な医療シナリオにおいて,この設定を動機付けている。
既存のセマンティックセグメンテーションのメトリクスが、より大きな接続コンポーネントに対するバイアスにどのように悩まされているかを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:26:05 GMT)
CoLLM: Integrating Collaborative Embeddings into Large Language Models for Recommendation [60.3] 我々は,協調情報をLLMにシームレスに組み込んでレコメンデーションを行う,革新的なLLMRec手法であるCoLLMを紹介する。
CoLLMは、外部の伝統的なモデルを通して協調情報をキャプチャし、LLMの入力トークン埋め込み空間にマッピングする。
大規模な実験により、CoLLMはLLMに協調情報を包括的に統合し、レコメンデーション性能が向上することが確認された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:53:22 GMT)
ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.2] 合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。
拡散燃料SFRモデルであるtextID3$を紹介します。
textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:41:35 GMT)
Infogent: An Agent-Based Framework for Web Information Aggregation [59.7] 我々はWeb情報集約のための新しいフレームワークInfogentを紹介する。
異なる情報アクセス設定の実験では、Infogentが既存のSOTAマルチエージェント検索フレームワークを7%上回った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:01:28 GMT)
Read-ME: Refactorizing LLMs as Router-Decoupled Mixture of Experts with System Co-Design [59.0] 本稿では、事前学習された高密度LCMをより小さなMoEモデルに変換する新しいフレームワークRead-MEを提案する。
当社のアプローチでは,専門家の抽出にアクティベーション空間を用いる。
Read-MEは、同様のスケールの他の人気のあるオープンソース高密度モデルよりも優れています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:48:51 GMT)
STLLaVA-Med: Self-Training Large Language and Vision Assistant for Medical Question-Answering [58.8] STLLaVA-Medは、医療ビジュアルインストラクションデータを自動生成できるポリシーモデルを訓練するために設計されている。
STLLaVA-Medの有効性とデータ効率を3つの主要な医用視覚質問応答(VQA)ベンチマークで検証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:47:37 GMT)
White Men Lead, Black Women Help? Benchmarking Language Agency Social Biases in LLMs [58.3] 社会的偏見は言語機関に現れることがある。
本稿では,言語庁バイアス評価ベンチマークを紹介する。
我々は,最近の3つのLarge Language Model(LLM)生成コンテンツにおいて,言語エージェンシーの社会的バイアスを明らかにした。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:43:28 GMT)
PCP-MAE: Learning to Predict Centers for Point Masked Autoencoders [57.3] マスクされたパッチの中央をエンコーダからの情報を使わずにデコーダに直接送る場合、依然としてよく再構築されていることを示す。
ポイントマスキングオートエンコーダ(PCP-MAE)の予測センターへの学習という,シンプルで効果的な手法を提案する。
本手法は他の方法と比較して事前学習効率が高く,Point-MAEよりも大幅に向上する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:55:22 GMT)
SF-V: Single Forward Video Generation Model [57.3] そこで本稿では,単段階ビデオ生成モデルを得るための新しい手法を提案する。
実験により,提案手法は計算オーバーヘッドを大幅に低減した合成ビデオの競合生成品質を実現することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:50:24 GMT)
Head-wise Shareable Attention for Large Language Models [56.9] 大きな言語モデル(LLM)は膨大な数のパラメータに悩まされており、エッジデバイスへのデプロイメントを制限している。
ウェイトシェアリングは、ウェイト再利用を促進する有望なソリューションのひとつで、メモリ使用量を効果的に削減し、パフォーマンスを低下させる。
本稿では,大規模言語モデルにおける頭部的共通性に着目した視点を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:53:18 GMT)
ADELIE: Aligning Large Language Models on Information Extraction [55.6] 大規模言語モデル(LLM)は通常、情報抽出タスクで不足する。
本稿では,様々なIEタスクを効果的に解決する協調LLMであるADELIEを紹介する。
本稿では,オープンソースモデル間でのSoTA(State-of-the-art)性能について述べる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:41:23 GMT)
Enhancing Feature-Specific Data Protection via Bayesian Coordinate Differential Privacy [55.4] ローカル微分プライバシー(LDP)は、ユーザーが外部の関係者を信頼することなく、強力なプライバシー保証を提供する。
本稿では,ベイジアン・フレームワークであるベイジアン・コーディネート・ディファレンシャル・プライバシ(BCDP)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:39:55 GMT)
Pointer Networks with Q-Learning for Combinatorial Optimization [55.2] 我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:25:19 GMT)
ReasonAgain: Using Extractable Symbolic Programs to Evaluate Mathematical Reasoning [54.7] 既存の数学データセットは、最終回答または静的例から派生した中間推論ステップを用いて、大規模言語モデル(LLM)の推論能力を評価する。
モデルがプログラムへの様々な入力に対して常に正しい最終回答を生成できる場合、シンボルプログラムを自動評価の手段として利用したいと考えている。
提案手法は, 従来の静的な例と比較して, 精度の低下を観測し, 現状のLLMにおける数学推論の脆弱さを示唆する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:02:37 GMT)
BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.5] 多くの複雑な実世界のクエリは、関連する文書を特定するために詳細な推論を必要とする。
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:51:21 GMT)
BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.5] 多くの複雑な実世界のクエリは、関連する文書を特定するために詳細な推論を必要とする。
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:51:21 GMT)
Out-of-Distribution Detection with a Single Unconditional Diffusion Model [54.2] アウト・オブ・ディストリビューション(OOD)検出は、異常サンプルを特定しようとする機械学習において重要なタスクである。
従来、教師なし手法はOOD検出に深い生成モデルを用いていた。
本稿では,単一モデルが多様なタスクに対してOOD検出を行うことができるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:17:00 GMT)
Skywork-Reward: Bag of Tricks for Reward Modeling in LLMs [54.1] 高品質なオープンソース嗜好データセットをキュレートするための効率的なデータ選択とフィルタリング手法を提案する。
我々は80Kの選好ペアのみを含むSkywork-Rewardデータコレクションをキュレートした。
我々はSkywork-Rewardモデルシリーズ、Skywork-Reward-Gemma-27BとSkywork-Reward-Llama-3.1-8Bを開発した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:06:26 GMT)
Binocular-Guided 3D Gaussian Splatting with View Consistency for Sparse View Synthesis [53.7] 本稿では,ガウススプラッティングを用いたスパースビューから新しいビューを合成する新しい手法を提案する。
私たちのキーとなるアイデアは、両眼画像間の両眼立体的一貫性に固有の自己超越を探索することにあります。
我々の手法は最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:10:27 GMT)
RET-LLM: Towards a General Read-Write Memory for Large Language Models [53.3] RET-LLMは、大規模な言語モデルに一般的な読み書きメモリユニットを装備する新しいフレームワークである。
デビッドソンのセマンティクス理論に触発され、三重項の形で知識を抽出し保存する。
本フレームワークは,時間に基づく質問応答タスクの処理において,堅牢な性能を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:20 GMT)
Cutting Through the Noise: Boosting LLM Performance on Math Word Problems [53.0] 大規模言語モデルは数学用語の問題を解くのに優れるが、無関係な情報を含む現実世界の問題に苦戦する。
本稿では,無関係な変数を追加することで,MWPの逆変分を生成するプロンプトフレームワークを提案する。
敵の訓練インスタンスの微調整は、敵のMWPのパフォーマンスを8%向上させる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:02:14 GMT)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.9] 拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:43:00 GMT)
Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.3] バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:09:20 GMT)
VILLS -- Video-Image Learning to Learn Semantics for Person Re-Identification [51.9] VILLS (Video-Image Learning to Learn Semantics) は画像やビデオから空間的特徴と時間的特徴を共同で学習する自己教師型手法である。
VILLSはまず、意味的一貫性と頑健な空間的特徴を適応的に抽出する局所意味抽出モジュールを設計する。
そして、VILLSは、一貫した特徴空間における画像とビデオのモダリティを表現するために、統合された特徴学習および適応モジュールを設計する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:05:15 GMT)
How Far Have We Gone in Binary Code Understanding Using Large Language Models [51.5] バイナリコード理解におけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。
評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:35:43 GMT)
ODDN: Addressing Unpaired Data Challenges in Open-World Deepfake Detection on Online Social Networks [51.0] オープンワールドデータアグリゲーション(ODA)と圧縮・ディスカード勾配補正(CGC)を組み合わせたオープンワールドディープフェイク検出ネットワーク(ODDN)を提案する。
細粒度分析と粗粒度分析の両方により,ODAは圧縮試料と原試料の相関関係を効果的に集約する。
CGCは、オンラインソーシャルネットワーク(OSN)における多種多様な圧縮方法のパフォーマンス向上のために、圧縮・ディスカード勾配補正を組み込んだ。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:32:22 GMT)
Demystifying Large Language Models for Medicine: A Primer [50.8] 大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。
本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:41:56 GMT)
ESpeW: Robust Copyright Protection for LLM-based EaaS via Embedding-Specific Watermark [50.1] 組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。
編集はモデル抽出攻撃に対して脆弱であり、著作権保護の緊急の必要性を強調している。
そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:35:09 GMT)
What Matters When Repurposing Diffusion Models for General Dense Perception Tasks? [49.8] 最近の研究は、高密度知覚タスクのためのT2I拡散モデルを簡単に調整することで有望な結果を示す。
拡散前処理における伝達効率と性能に影響を及ぼす重要な要因を徹底的に検討する。
我々の研究は、濃密な視覚認知タスクに特化した効果的な決定論的ワンステップ微調整パラダイムであるGenPerceptの開発において頂点に達した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:36:13 GMT)
Gene-Metabolite Association Prediction with Interactive Knowledge Transfer Enhanced Graph for Metabolite Production [49.8] メタボリックグラフに基づく遺伝子メタボリック・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション
2474の代謝産物と1947年の2つの一般的な微生物の遺伝子を含む最初のベンチマークを提示する。
提案手法は,各種リンク予測フレームワークのベースラインを最大12.3%向上させる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:54:27 GMT)
Towards Visual Text Design Transfer Across Languages [49.8] マルチモーダル・スタイル翻訳(MuST-Bench)の新たな課題について紹介する。
MuST-Benchは、視覚テキスト生成モデルが様々な書き込みシステム間で翻訳を行う能力を評価するために設計されたベンチマークである。
そこで我々は,スタイル記述の必要性を解消する多モーダルなスタイル翻訳フレームワークであるSIGILを紹介した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:15:01 GMT)
LoGU: Long-form Generation with Uncertainty Expressions [49.8] 不確実性を伴う長文生成(LoGU)の課題について紹介する。
不確実性抑制と不確実性誤認の2つの主要な課題を特定します。
当社のフレームワークでは,原子的クレームに基づく不確実性を改善するため,分割・分散戦略を採用している。
提案手法が精度を向上し,幻覚を低減し,応答の包括性を維持できることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:26:39 GMT)
All models are wrong, some are useful: Model Selection with Limited Labels [49.6] 本稿では,事前学習した分類器をラベル効率で選択するフレームワークであるMODEL SELECTORを紹介する。
MODEL SELECTOR はラベル付きデータの必要性を劇的に減らし,最良あるいは最良に近い性能のモデルを選択することを示す。
モデル選択におけるMODEL SELECTORのロバスト性をさらに強調し, 最良モデルを選択する場合, ラベル付けコストを最大72.41%削減する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:31:14 GMT)
Taming Data and Transformers for Audio Generation [49.5] AutoCapは高品質で効率的なオーディオキャプションモデルである。
GenAuはスケーラブルなトランスフォーマーベースのオーディオ生成アーキテクチャである。
57Mの環境オーディオクリップをコンパイルし、最大のオーディオテキストデータセットであるAutoReCap-XLを作成します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:56:21 GMT)
SIKeD: Self-guided Iterative Knowledge Distillation for mathematical reasoning [49.3] 大きな言語モデル(LLM)は、推論スキルをより小さなモデルに転送することができる。
より小さなモデルは蒸留時に全ての戦略にLLM分布を適合させるほど表現力に乏しい。
この1つの戦略への依存は、より小さなモデルにおいて、望ましい戦略で困難な推論タスクを解決しようとするときに、課題となる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:29:18 GMT)
SkiLD: Unsupervised Skill Discovery Guided by Factor Interactions [48.0] この研究は、ローカル依存(スキルド)からのスキル発見を紹介します。
Skildは、環境内の異なる相互作用を誘発するスキルの習得を明示的に促進する、新しいスキル学習の目標を開発する。
本研究では,現実的なシミュレートされた家庭用ロボットドメインを含む,長期にわたる不利な報酬課題を伴う複数の領域におけるスキルドの評価を行った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:01:59 GMT)
Ferret-UI 2: Mastering Universal User Interface Understanding Across Platforms [48.0] Ferret-UI 2 は多言語大言語モデル (MLLM) であり、幅広いプラットフォームでUIを統一的に理解するために設計された。
Ferret-UI 2では、複数のプラットフォームタイプのサポート、適応スケーリングによる高解像度の認識、GPT-4oを使った高度なタスクトレーニングデータ生成、マークのセット・オブ・マークによる視覚的プロンプトの3つの重要なイノベーションが導入されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:58:31 GMT)
Distributed Blind Source Separation based on FastICA [48.0] 本稿では,元の信号源の同定を目的とした分散独立成分分析(ICA)アルゴリズムを提案する。
最もよく使われるICAアルゴリズムの1つはFastICAと呼ばれ、空間的な事前白化操作を必要とする。
我々は、いわゆる分散適応信号融合フレームワークの特性を活用することにより、ネットワーク全体の事前白化の明確なステップを回避することができることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:27:05 GMT)
Improving Model Factuality with Fine-grained Critique-based Evaluator [47.4] 我々は、請求レベルの事実性フィードバックをLMジェネレータに提供するファクトリティー評価器であるFenCEを訓練する。
本稿では、FenCEを活用してトレーニングデータを構築することにより、LMジェネレータの現実性を向上するフレームワークを提案する。
実験の結果,LLM-AggreFactでは評価器の精度が2.9%向上した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:41:02 GMT)
Spatiotemporal Implicit Neural Representation as a Generalized Traffic Data Learner [46.9] 時空間交通データ(STTD)は、マルチスケール交通システムの複雑な動的挙動を測定する。
本稿では,STTDを暗黙的ニューラル表現としてパラメータ化することで,STTD学習問題に対処する新しいパラダイムを提案する。
実世界のシナリオにおける広範な実験を通じて,その有効性を検証し,廊下からネットワークスケールへの応用を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:20:59 GMT)
You Only Look Around: Learning Illumination Invariant Feature for Low-light Object Detection [46.6] 低照度シナリオにおけるオブジェクト検出のための新しいフレームワークであるYOLAを紹介する。
ランベルト画像形成モデルを用いて照明不変の特徴を学習する。
実験により,低照度物体検出タスクの大幅な改善が示された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:23:50 GMT)
The Learning Stabilizers with Noise problem [46.6] 雑音のある学習パリティ(Learning Parity with Noise, LPN)問題は、雑音の存在下でランダムな線形コードを復号するタスクとみなすことができる。
LSNは特殊なケースとして含まれており、これは古典的なケースと同程度に難しいことを示唆している。
我々は、量子ビットスキームの構築から量子データからの学習の計算限界まで、LSN仮定のいくつかの応用を同定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:53:02 GMT)
LLM-driven Multimodal Target Volume Contouring in Radiation Oncology [46.2] 大規模言語モデル(LLM)は、テキスト情報と画像の統合を容易にする。
LLM駆動型マルチモーダルAI,すなわちLLMSegを提案する。
提案モデルでは,従来のユニモーダルAIモデルと比較して,性能が著しく向上していることが実証された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:10:26 GMT)
DreamClear: High-Capacity Real-World Image Restoration with Privacy-Safe Dataset Curation [46.2] 我々は、革新的なデータキュレーションパイプラインであるGenIRと、最先端の拡散変換器(DiT)ベースの画像復元モデルであるDreamClearの2つの戦略を提案する。
我々の先駆的な貢献であるGenIRは、既存のデータセットの制限を克服するデュアルプロンプト学習パイプラインです。
DreamClear は DiT ベースの画像復元モデルである。テキスト・ツー・イメージ(T2I)拡散モデルの生成先行と,マルチモーダル大言語モデル(MLLM)の堅牢な知覚能力を利用して復元を実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:57:20 GMT)
Smart ETL and LLM-based contents classification: the European Smart Tourism Tools Observatory experience [45.5] 本研究プロジェクトは、オンラインの欧州スマートツーリズムツール(STT)のコンテンツ更新の改善に焦点を当てている。
STTを記述する内容はPDFカタログから派生し、PDFスクレイピング技術はQRコード、画像、リンク、テキスト情報を抽出する。
STTを天文台にインポートするプロセスは、PDFスクラッピング技術とLarge Language Modelsを組み合わせてテキストコンテンツに基づく分類を行う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:10:54 GMT)
3D-Adapter: Geometry-Consistent Multi-View Diffusion for High-Quality 3D Generation [45.2] 3D-Adapterは、3D幾何学的認識を事前訓練された画像拡散モデルに注入するために設計されたプラグインモジュールである。
Instant3DやZero123++のようなテキスト・ツー・マルチビューモデルの幾何学的品質を大幅に向上させることを示す。
また,テキスト・ツー・3D,画像・ツー・3D,テキスト・トゥ・テクスチャ,テキスト・トゥ・アバタータスクにおいて,高品質な結果を示すことで,3D-Adapterの幅広い応用可能性を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:30 GMT)
Topological Order in the Spectral Riemann Surfaces of Non-Hermitian Systems [45.0] 非エルミート系の複素数値スペクトルにおいて位相的に順序づけられた状態を示す。
これらのモデルは、そのようなモデルのエネルギー面における特異な例外点が消滅したときに生じる。
非エルミート2バンドモデルにおける位相的に保護された状態の特性について述べる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:16:47 GMT)
MMAU: A Massive Multi-Task Audio Understanding and Reasoning Benchmark [44.7] MMAUは、人間の注釈付き自然言語の質問と回答とを合わせた、注意深く編集された10kのオーディオクリップで構成されている。
これには、情報抽出と推論の質問が含まれており、モデルは、ユニークで困難なタスクにまたがる27の異なるスキルを実証する必要がある。
我々は18のオープンソースおよびプロプライエタリなAudio-Language Modelを評価し、MMAUがもたらす重大な課題を実証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:20:10 GMT)
Aligning CodeLLMs with Direct Preference Optimization [44.3] この研究はまず、一般的に使われているPPOアルゴリズムがCodeLLMのアライメントに最適であることを示す。
好みデータペアのみに基づいて、DPOはモデルランクデータを自動でレンダリングすることができ、きめ細かい報酬パターンを生み出す。
本研究では,MBPPやHumanEvalなどのベンチマークにおいて,既存のCodeLLMの性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:36:13 GMT)
Graph Pre-Training Models Are Strong Anomaly Detectors [44.3] グラフ事前学習モデルは強力なグラフ異常検出器であることを示す。
具体的には、事前トレーニングが非常に競争力があり、最先端のエンドツーエンドトレーニングモデルよりも優れています。
グラフレベルの異常検出における事前学習の可能性について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:22:18 GMT)
Towards Aligning Language Models with Textual Feedback [43.6] ALT(Alignment with Textual feedback)は、言語モデルとユーザの好みをテキストで表わすアプローチである。
本稿では, 有害度低減, 要約, 対話応答生成など, さまざまなタスクにおけるテキストフィードバックの有効性と効率について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:43:21 GMT)
A Note on Shumailov et al. (2024): `AI Models Collapse When Trained on Recursively Generated Data' [43.4] 分布やモデルがデータに適合する影響について検討し,次に繰り返しサンプリングを行った。
以上の結果から, 結果が統計的現象であり, 避けられない可能性が示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:23:50 GMT)
Delta: A Cloud-assisted Data Enrichment Framework for On-Device Continual Learning [43.3] 我々は、豊富なクラウドサイドデータを活用して、デバイス上のデータ不足を補う可能性を探り、プライベートで効率的で効果的なデータ強化フレームワークDeltaを提案する。
具体的には、Deltaはまず、機密データを共有することなく、データエンリッチメント問題をデバイス側とクラウド側のサブプロブレムに分解するディレクトリデータセットを導入している。
次にDeltaは、デバイス側のサブプロブレムをスパースなユーザデータで効果的に解決するソフトなデータマッチング戦略と、計算複雑性の低いエンリッチメントのための最も適切なデータセットを取得するためのクラウドサーバのための最適なデータサンプリングスキームを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:38:09 GMT)
Scaling up Masked Diffusion Models on Text [43.2] 仮面拡散モデル(MDM)は、言語モデリングにおいて有望であるが、テキスト生成や言語理解といった中核的な言語タスクにおけるスケーラビリティと有効性は、未解明のままである。
本稿では,自動回帰モデル(ARM)に匹敵するスケーリング率と比較的小さな計算ギャップを実証し,MDMに対する最初のスケーリング法則を確立する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:01:22 GMT)
Provable Tempered Overfitting of Minimal Nets and Typical Nets [43.0] 完全連結深部ニューラルネットワーク(NN)の過適合挙動について検討する。
最小のNN(最小の重みを持つ)とランダム補間NNを併用することを検討する。
両方の学習ルールに対して、過剰適合が誘惑的であることを証明します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:51:56 GMT)
Meta-Learning with Heterogeneous Tasks [42.7] HeTRoM(Heterogeneous Tasks Robust Meta-learning)
双方向最適化に基づく効率的な反復最適化アルゴリズム
その結果,提案手法の柔軟性が示され,多様なタスク設定に適応できることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:32:23 GMT)
Schedule Your Edit: A Simple yet Effective Diffusion Noise Schedule for Image Editing [42.5] 効率的な編集では、ソースイメージを潜在空間に反転させる必要があり、このプロセスはDDIMの反転に固有の予測エラーによってしばしば妨げられる。
特異性を排除し、インバージョン安定性を改善し、画像編集のためのより良いノイズ空間を提供する新しいノイズスケジュールであるロジスティックスケジュールを導入する。
提案手法では追加のトレーニングは必要とせず,既存の編集手法と互換性がある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:07:02 GMT)
Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement [41.7] オフラインメタRLの効率的な一般化を実現するメタ決定変換器(Meta-DT)を提案する。
我々は、コンテキスト認識の世界モデルを用いて、コンパクトなタスク表現を学習し、それをコンテキスト条件として注入し、タスク指向のシーケンス生成を誘導する。
また,Meta-DTでは,ベースラインが強いのに比べ,少ない,ゼロショットの一般化能力が優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:17:51 GMT)
Cross Spline Net and a Unified World [41.7] クロススプラインネット(CSN)はスプライン変換とクロスネットワークの組み合わせに基づいている。
CSNは、上記の一連の非ニューラルネットワークモデルを同じニューラルネットワークフレームワークの下に配置する統合モデリングフレームワークを提供する。
CSNはパフォーマンスが高く、使いやすく、より複雑で、より解釈しやすく、堅牢であることを示します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:45:48 GMT)
On the Noise Robustness of In-Context Learning for Text Generation [41.6] 本研究では、テキスト生成タスクにおいて、ノイズの多いアノテーションがテキスト内学習の性能を著しく損なうことを示す。
この問題を回避するために,LPR(Local Perplexity Ranking)と呼ばれるシンプルで効果的なアプローチを提案する。
LPRは「騒々しい」候補者を、より清潔である可能性が高い隣人に置き換える。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:05:03 GMT)
On the Crucial Role of Initialization for Matrix Factorization [40.8] この研究は古典的低ランク行列分解問題を再考し、整合率の形成における初期化の重要な役割を明らかにする。
我々はNystrom NyGDを対称非対称行列分解タスクに導入し、ローランクアダプタ(LoRA)に拡張する。
提案手法は,大規模言語および拡散モデルにおいて,1Bから7Bパラメータに至るまで,様々なダウンストリームおよびモデルスケールで優れた性能を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:58:21 GMT)
"Vorbeşti Româneşte?" A Recipe to Train Powerful Romanian LLMs with English Instructions [40.6] ルーマニア語用にカスタマイズされたオープンソースのLLMを収集、翻訳し、評価し、リリースするのはこれが初めてです。
我々は,RoLLMsの有用性と高い性能について,各ボードにまたがって最先端の結果を得ることによって論じる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:29:13 GMT)
Delving into the Reversal Curse: How Far Can Large Language Models Generalize? [40.6] 主要な例として、最近議論された「逆の呪い」があり、これはモデルが「AはBである」という事実に基づいて訓練されたとき、この知識を一般化して「BはAである」と推測するのに苦労している。
本稿では,様々なタスクにまたがる逆の呪いの顕在化について検討し,LLMの一般化能力と問題解決機構について考察する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:55:09 GMT)
VideoWebArena: Evaluating Long Context Multimodal Agents with Video Understanding Web Tasks [40.5] ビデオ理解のための長文マルチモーダルエージェントの性能を評価するためのベンチマークであるVideoWebArenaを紹介する。
本ベンチマークでは,長文ビデオベースエージェントタスクの分類を,スキル保持と事実保持の2つの分野に焦点をあてて定義する。
このモデルでは, 実効保持作業で13.3%, 実効保持QAペアで45.8%を達成でき, それぞれ73.9%, 79.3%と極めて低い結果となった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:03:01 GMT)
Stable Consistency Tuning: Understanding and Improving Consistency Models [40.3] 拡散モデルは、より優れた生成品質を達成するが、復調の反復的な性質により、生成速度が遅くなる。
新しいジェネレーティブファミリーである一貫性モデルは、非常に高速なサンプリングで競争性能を達成する。
本稿では,拡散モデルの分解過程をマルコフ決定過程(MDP)としてモデル化し,時間差分学習(TD)による値推定としてフレーミング一貫性モデルのトレーニングを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:55:52 GMT)
ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment [40.1] 外科的スキル評価において、OATS(Objective Assessments of Technical Skills)とGRS(Global Rating Scale)は、訓練中の外科医を評価するための確立されたツールである。
最近の研究は、運動データ、ビデオ、またはそれらの組み合わせからGRSスコアを回帰することに焦点を当てている。
我々は,OSATSのスコアを集計し,外科的臨床試験において臨床的に有意な変動を見落としているため,GRSのみの回帰は限界であると主張している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:18:24 GMT)
No Argument Left Behind: Overlapping Chunks for Faster Processing of Arbitrarily Long Legal Texts [39.2] 我々は,TransformerとRecurrent Neural Networkアーキテクチャを組み合わせた,長い法律テキストを扱うハイブリッドモデル uBERT を紹介する。
以上の結果から, uBERT は BERT+LSTM よりも高い性能を示し, 長い法律文書処理において ULMFiT よりもはるかに高速であることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:33:30 GMT)
Paved or unpaved? A Deep Learning derived Road Surface Global Dataset from Mapillary Street-View Imagery [39.1] このデータセットは、グローバルな道路表面情報を300万km以上拡張する。
ほとんどの地域は中程度から高い舗装道路被覆率 (60-80%) を示したが、アフリカやアジアの特定の地域では顕著なギャップが見られた。
都市部は、ほぼ完全に舗装された面積を持つ傾向にあり、農村部はより多様性を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:32:53 GMT)
DN-4DGS: Denoised Deformable Network with Temporal-Spatial Aggregation for Dynamic Scene Rendering [39.0] 3D Gaussian Splatting (3DGS)は、優れたレンダリング品質とリアルタイムスピードのために、研究者の注目を集めている。
動的シーンレンダリング(DN-4DGS)のための時間空間アグリゲーションを用いたDenoized Deformable Networkを提案する。
具体的には、標準3次元ガウスの座標の分布を変化させ、雑音を抑制するためにノイズ抑制戦略を導入する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:21:01 GMT)
GCoder: Improving Large Language Model for Generalized Graph Problem Solving [38.9] 大規模言語モデル(LLM)は強力な推論能力を示しており、グラフ計算のような複雑なタスクに適している。
本稿では,一般化グラフ問題における問題解決の強化を目的とした,コードベースのLLMであるGCoderを紹介する。
本手法では,多種多様なグラフ形式とアルゴリズムを特徴とする広範囲なトレーニングデータセットであるGraphWildを構築する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:40:36 GMT)
Learning Global Object-Centric Representations via Disentangled Slot Attention [38.8] 本稿では,AIシステムに人間のような能力を持たせることによって,シーンを横断するオブジェクトを識別し,グローバルなオブジェクト中心表現の集合を学習することで,特定のオブジェクトを含む多様なシーンを生成する,新たなオブジェクト中心学習手法を提案する。
実験により,提案手法の有効性を実証し,グローバルなオブジェクト中心表現学習,オブジェクト識別,特定のオブジェクトを用いたシーン生成,シーン分解に顕著な習熟性を示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:57:00 GMT)
Distill Visual Chart Reasoning Ability from LLMs to MLLMs [38.6] マルチモーダル大言語モデル(MLLM)における複雑なチャートQ&Aタスクの解決には高度な視覚的推論能力が必要である
我々は,LLMからMLLMへの視覚的推論能力を蒸留するための費用効率,効率的,スケーラブルなデータ合成法であるCode-as-Intermediary Translation (CIT)を提案する。
我々は、テキストベースの合成技術を用いて、チャート作成コードを構築し、3kの推論集約チャートと20kのQ&Aペアを含むデータセットであるReachQAを作成した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:50:42 GMT)
Synth4Seg -- Learning Defect Data Synthesis for Defect Segmentation using Bi-level Optimization [37.8] 両レベル最適化に基づく合成欠陥データ生成フレームワークを提案する。
提案手法は, 合成欠陥の貼付に最も有効な位置の学習に有効であることを示す。
また、異なる拡張固有の欠陥データソースの重み付けを学習することで、最大2.6%のパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:25:12 GMT)
Multi-qubit entanglement swapping with squeezed modes [37.7] 本稿では,ハイブリッド型連続変数分散変数エンタングルメントスワッププロトコルを提案する。
信号ごとに多数の高忠実度ベルペアを生成することができる。
プロトコルの有効性は、スクイーズ強度によって決定される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:26:13 GMT)
Post-Training Attribute Unlearning in Recommender Systems [37.7] 既存の研究では、主にトレーニングデータ、すなわちモデル入力を未学習のターゲットとして使用している。
我々は、この未知の情報をtextitattribute と呼び、未学習のターゲットとして扱う。
ユーザのセンシティブな属性を保護するために、Attribute Unlearning(AU)は、ターゲット属性を識別不能にする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:15:32 GMT)
Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization [37.6] プルーニング(Pruning)は、余分な重みを取り除くことによってモデルサイズを減らす手法であり、より効率的なスパース推論を可能にする。
本稿では,5つの要約データセット,2つの最先端プルーニング手法,および5つの命令調整LDMに関する実証的研究を行う。
驚いたことに、幻覚はオリジナルのモデルに比べて、刈り取られたLLMからそれほど多くない。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:40:00 GMT)
RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation [37.4] 対話型セグメンテーションシナリオにおけるクリックパターンの大規模クラウドソーシング調査を行い,475万のリアルタイムクリックを収集する。
本モデルとデータセットを用いて,現実的なクリックにおける既存の対話的セグメンテーション手法の包括的比較のためのRClicksベンチマークを提案する。
我々のベンチマークによると、実世界の対話型セグメンテーションモデルでは、ベースラインベンチマークで報告されたよりもパフォーマンスが悪く、ほとんどの手法は堅牢ではない。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:48:41 GMT)
Remote Detection of Applications for Improved Beam Tracking in mmWave/sub-THz 5G/6G Systems [37.4] ビームトラッキングはミリ波(mmWave, 30-100 GHz)とサブテラヘルツ(サブTHz, 100-300 GHz)の5G/6Gシステムに不可欠な機能である。
基地局(BS)とユーザ機器(UE)の両方でアンテナ掃除を行う。
本稿では,エアインターフェースにおける適用形態の明示的なシグナリングがない場合,受信信号強度パターンに基づいて,BS側でリモートで検出する方法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:55:21 GMT)
FirmRCA: Towards Post-Fuzzing Analysis on ARM Embedded Firmware with Efficient Event-based Fault Localization [37.3] FirmRCAは、組み込みファームウェアに特化した実用的なフォールトローカライゼーションフレームワークである。
その結果,FirmRCAは,トップ10のインストラクション内において,クラッシュするテストケースの根本原因を効果的に特定できることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:12:08 GMT)
Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets [37.2] 二次活性化と損失$L$の2層ニューラルネットワークに対する解空間のリッチ代数構造を証明した。
私たちはこのフレームワークをCoGO(Composing Globals)として作りました。
2層ネットワークの隠蔽ノード数に対する重み空間は半環代数構造を備えており、最適化される損失関数は単項ポテンシャルから成り立っていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:35:48 GMT)
Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets [37.2] 二次活性化と損失$L$の2層ニューラルネットワークに対する解空間のリッチ代数構造を証明した。
私たちはこのフレームワークをCoGO(Composing Globals)として作りました。
2層ネットワークの隠蔽ノード数に対する重み空間は半環代数構造を備えており、最適化される損失関数は単項ポテンシャルから成り立っていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:35:48 GMT)
A Comprehensive Survey of Time Series Forecasting: Architectural Diversity and Open Challenges [37.2] 時系列予測は、さまざまな分野における意思決定の重要な情報を提供する重要なタスクである。
アック、CNN、RNN、GNNといったディープラーニングアーキテクチャが開発され、時系列予測問題に応用されている。
長期的な依存関係を扱うのに優れているトランスフォーマーモデルは、時系列予測のための重要なアーキテクチャコンポーネントとなっている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:43:55 GMT)
One-shot World Models Using a Transformer Trained on a Synthetic Prior [37.0] ワンショット世界モデル(英: One-Shot World Model、OSWM)は、純粋に合成データからコンテキスト内学習形式で学習されるトランスフォーマー世界モデルである。
OSWMは、シンプルなグリッド世界のダイナミクスや、CartPoleのジム、カスタムコントロール環境に迅速に適応できる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:57:44 GMT)
One-shot World Models Using a Transformer Trained on a Synthetic Prior [37.0] ワンショット世界モデル(英: One-Shot World Model、OSWM)は、純粋に合成データからコンテキスト内学習形式で学習されるトランスフォーマー世界モデルである。
OSWMは、シンプルなグリッド世界のダイナミクスや、CartPoleのジム、カスタムコントロール環境に迅速に適応できる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:57:44 GMT)
Democratizing Large Language Models via Personalized Parameter-Efficient Fine-tuning [36.9] 大規模言語モデル(LLM)のパーソナライゼーションはますます重要になっている。
1つのPEFT Per User (OPPU) は、パーソナライズされたパラメータ効率の微調整(PEFT)モジュールを使用して、ユーザ固有の行動パターンと好みを保存する。
OPPUは、LaMPベンチマークの7つのタスクで既存のプロンプトベースのメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:53:01 GMT)
Learning to Look: Seeking Information for Decision Making via Policy Factorization [36.9] 本研究では,情報検索政策と情報受信政策からなる二重政治ソリューションであるDiaMを提案する。
我々は、情報探索行動を必要とする5つの操作タスクにおいて、二重ポリシーソリューションの能力を実証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:58:11 GMT)
$C^2$: Scalable Auto-Feedback for LLM-based Chart Generation [36.9] 参照不要な自動フィードバックジェネレータを導入し,人的介入のコストを削減した。
最初の実験では、回答者の74%が強く好んでおり、10%がフィードバック後の結果を好んだ。
ChartUIE-8Kは、クエリ、データセット、チャートタイプを増やすことで、データの多様性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:32:00 GMT)
ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment [36.6] トレーニングセッションを通して外科医のパフォーマンスを出力するリカレントトランスモデルを開発した。
これらのスコアは、GRS予測を生成するために平均化され、集約される。
我々はSpearman's correlation Coefficient (SCC) を報告し、我々のモデルが全てのタスクにおいてSOTAモデルより優れていることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:18:24 GMT)
Textual Training for the Hassle-Free Removal of Unwanted Visual Data: Case Studies on OOD and Hateful Image Detection [36.3] ハッスルフリーテキストトレーニング(Hassle-Free Textual Training、HFTT)は、不要な視覚内容の検出器を取得できる合理化手法である。
HFTTは、人間のデータアノテーションへの関与を著しく減少させる革新的な客観的機能を備えている。
HFTTの独特な特徴は、その機能を従来のアウト・オブ・ディストリビューション検出を超えて拡張し、より抽象的な概念に対処するタスクに適用できるようにする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:18:01 GMT)
Textual Training for the Hassle-Free Removal of Unwanted Visual Data [36.3] ハッスルフリーテキストトレーニング(Hassle-Free Textual Training、HFTT)は、不要な視覚内容の検出器を取得できる合理化手法である。
HFTTは、人間のデータアノテーションへの関与を著しく減少させる革新的な客観的機能を備えている。
HFTTの独特な特徴は、その機能を従来のアウト・オブ・ディストリビューション検出を超えて拡張し、より抽象的な概念に対処するタスクに適用できるようにする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:18:01 GMT)
IMAN: An Adaptive Network for Robust NPC Mortality Prediction with Missing Modalities [36.1] 鼻咽喉頭癌(NPC)の予後予測は治療戦略の最適化と患者の予後改善に不可欠である。
従来の機械学習アプローチでは、不完全なデータに直面した場合、パフォーマンスが大幅に低下する。
IMAN: モダリティを欠いた堅牢なNPC死亡予測のための適応型ネットワークについて紹介する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:54:08 GMT)
From a Tiny Slip to a Giant Leap: An LLM-Based Simulation for Fake News Evolution [35.8] 大規模言語モデル(LLM)に基づくFake News evolution Simulation framEworkを提案する。
本研究では,情報伝達を行うスプレッダー,意見や解釈を提供するコメンテーター,情報や傍観者の正確性をチェックする検証者,参加せずに受動的に観察する傍観者という4種類のエージェントを定義した。
この領域における先行研究の欠如を踏まえ、偽ニュース進化過程における真ニュースからの逸脱を測定するためのFUSE-EVAL評価フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:17:16 GMT)
SMITE: Segment Me In TimE [35.6] 画像拡散モデルと追加の追跡機構に事前学習したテキストを用いて、ビデオ内のオブジェクトをセグメントする方法を示す。
提案手法は,様々なセグメンテーションシナリオを効果的に管理し,最先端の代替品より優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:38:20 GMT)
Evaluating and Improving Automatic Speech Recognition Systems for Korean Meteorological Experts [35.3] 本稿では,韓国の気象学者を対象とした自然言語クエリシステムへの自動音声認識の統合について検討する。
韓国の気象分野におけるASRシステム開発における課題に対処する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:40:07 GMT)
Zero-shot Object Navigation with Vision-Language Models Reasoning [35.3] 本稿では,L-ZSONのためのツリー・オブ・ソート・ネットワーク(VLTNet)を用いたビジョン言語モデルを提案する。
VLTNetは、視覚言語モデル理解、セマンティックマッピング、ツリーオブ思考推論と探索、ゴール識別の4つの主要なモジュールから構成されている。
ToT推論を用いたナビゲーションは、従来のフロンティア選択と比較して、必要であればマルチパス推論プロセスとバックトラックを行う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:24:07 GMT)
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering [35.2] MLE-benchは、AIエージェントが機械学習エンジニアリングでどのように機能するかを測定するためのベンチマークである。
われわれはKaggleから75のMLエンジニアリング関連のコンペを開催する。
私たちはKaggleが公開しているリーダーボードを使って、各競技の人間ベースラインを確立します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:35:50 GMT)
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering [35.2] MLE-benchは、AIエージェントが機械学習エンジニアリングでどのように機能するかを測定するためのベンチマークである。
われわれはKaggleから75のMLエンジニアリング関連のコンペを開催する。
私たちはKaggleが公開しているリーダーボードを使って、各競技の人間ベースラインを確立します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:35:50 GMT)
Investigating Labeler Bias in Face Annotation for Machine Learning [35.1] ラベル付け作業において,異なる民族や性別の人々のイメージを用いたラベル付けバイアスの存在について検討する。
その結果,参加者は意思決定プロセスに影響を与えるステレオタイプを持っていることがわかった。
ラベル付けバイアスがデータセットにどのように影響するかを論じ、その後、トレーニングしたモデルについて論じる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:38:34 GMT)
Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise [34.7] 微分拡散モデルの研究は、画像復元の分野への応用を拡大した。
本稿では,残余項を拡散前進過程に組み込むフレームワークであるResfusionを提案する。
Resfusionは, ISTDデータセット, LOLデータセット, Raindropデータセットに対して, わずか5つのサンプリングステップで競合性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:55:59 GMT)
PortLLM: Personalizing Evolving Large Language Models with Training-Free and Portable Model Patches [34.7] PortLLMはトレーニング不要のフレームワークで、ドメイン固有の知識をキャプチャするための、最初の軽量モデル更新パッチを作成する。
PortLLMは、最大12.2倍のGPUメモリ使用率でLoRAファインチューニングに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:58:52 GMT)
Sort-free Gaussian Splatting via Weighted Sum Rendering [33.9] 重み付き和とアルファブレンディングを近似した重み付きSum Renderingを提案し,ソートの必要性を排除した。
これは実装を単純化し、優れたパフォーマンスを提供し、ソートによって引き起こされる"ポーピング"アーティファクトを排除します。
この方法はモバイルデバイスのGPUで実装されテストされ、平均1.23時間で高速なレンダリングを実現した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:18:01 GMT)
Prompting and Fine-Tuning of Small LLMs for Length-Controllable Telephone Call Summarization [33.7] 本稿では,大規模言語モデル(LLM)を用いた電話要約システムの迅速な開発について検討する。
Llama-2-7Bの微調整による要約モデルでは,実測精度,完全性,簡潔性の観点から,GPT-4と同等に動作することがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:32:10 GMT)
SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment [33.5] 人間のデモからデモデータセットを生成する自動システムであるSkillMimicGenを提案する。
SkillGenは人間のデモを操作スキルに分割し、これらのスキルを新しいコンテキストに適応させ、自由空間の移動と移動運動を通じてそれらを縫い合わせる。
SkillGenの有効性は、わずか60個のヒトのデモンストレーションから18のタスク変種に24K以上のデモを生成して実証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:59:26 GMT)
Exactly solvable models for fermionic symmetry-enriched topological phases and fermionic 't Hooft anomaly [33.5] 対称性と位相的性質の相互作用は、現代物理学において非常に重要な役割を果たす。
格子モデルにおけるこれらのフェルミオンSET(fSET)相をどうやって実現するかは、難しい問題である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:52:27 GMT)
CoEvol: Constructing Better Responses for Instruction Finetuning through Multi-Agent Cooperation [33.3] 命令に対する応答を改善するためのLLMベースのマルチエージェント協調フレームワークであるCoEvolを提案する。
実証的には、CoEvolを搭載したモデルはMT-BenchとAlpacaEvalで評価された競争ベースラインを上回った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:59:46 GMT)
Spatial-Temporal Search for Spiking Neural Networks [32.9] スパイキングニューラルネットワーク(SNN)は、次世代人工知能の潜在的な候補と考えられている。
空間次元と時間次元の両方でSNNを最適化するための微分可能なアプローチを提案する。
本手法は,96.43%,78.96%,70.21%の精度でCIFAR10/100とImageNetの分類性能を比較検討した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:32:51 GMT)
Indication Finding: a novel use case for representation learning [32.7] 本稿では、自然言語処理と実世界のデータで開発された手法を活用して、行動機構(MoA)の潜在性、新しい指標を優先する手法を提案する。
具体的には、表現学習を用いて表示の埋め込みを生成し、その表示に近接してMoAの最も有効な証拠を優先する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:03:36 GMT)
A Survey of Multimodal Sarcasm Detection [32.7] サルカスム(Sarcasm)は、発音の文字通りの意味の反対を伝達するために用いられる修辞的な装置である。
これまでに,マルチモーダルサルカズム検出に関する総合的な調査が報告されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:17:47 GMT)
High-dimensional Analysis of Knowledge Distillation: Weak-to-Strong Generalization and Scaling Laws [32.6] 隆起のない高次元回帰のために, このプロセスの鋭い特徴付けを行う。
弱い特徴を捨てることの利点と限界を明らかにする最適代理モデルの形式を同定する。
我々は、リッジレス回帰とニューラルネットワークアーキテクチャの両方に関する数値実験の結果を検証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:22:53 GMT)
Learning Commonality, Divergence and Variety for Unsupervised Visible-Infrared Person Re-identification [32.5] 教師なし可視人物再識別(USVI-ReID)は、赤外線画像中の特定人物とアノテーションなしで可視画像とをマッチングすることを目的としており、その逆も目的である。
既存のほとんどのメソッドは、クラスタベースのコントラスト学習を使用してUSVI-ReIDに対処する。
我々は,USVI-ReIDのためのハードおよびダイナミックプロトタイプを用いたプログレッシブコントラスト学習を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:00:35 GMT)
A Huber Loss Minimization Approach to Mean Estimation under User-level Differential Privacy [32.4] 分散システムでは,サンプル全体のプライバシ保護が重要である。
ユーザレベルの差分プライバシに基づく推定におけるハマー損失最小化手法を提案する。
提案手法の理論的解析により,プライバシー保護に必要な雑音強度と平均二乗誤差の有界性が得られる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:26:18 GMT)
Cellpose+, a morphological analysis tool for feature extraction of stained cell images [31.9] 本稿では,機能抽出機能を備えた最先端のセルセグメンテーションフレームワークであるCellposeの適用範囲を拡大する。
また,本手法を適用したDAPIおよびFITC染色細胞のデータセットも導入した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:41:40 GMT)
ChatSearch: a Dataset and a Generative Retrieval Model for General Conversational Image Retrieval [31.7] オープンドメイン画像における一般会話画像検索の課題について検討する。
このタスクを進めるために、ChatSearchと呼ばれるデータセットをキュレートします。
本データセットは、ターゲット画像毎のマルチラウンド多モーダル会話コンテキストクエリを含む。
そこで我々はChatSearcherという生成的検索モデルを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:19:22 GMT)
Building Dialogue Understanding Models for Low-resource Language Indonesian from Scratch [31.5] 低リソース言語対話データの欠如を回避するために,Bi-Confidence-Frequency Cross-Lingual Transfer framework (BiCF)を提案する。
私たちのフレームワークは、手動で注釈付けされたインドネシアのさまざまなスケールで、信頼性とコスト効率を向上します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:33:14 GMT)
Bridge-Coder: Unlocking LLMs' Potential to Overcome Language Gaps in Low-Resource Code [31.5] LLM(Large Language Models)は、Pythonのような高リソースプログラミング言語(HRPL)のコードを生成する能力を示すが、RacketやDのような低リソースプログラミング言語(LRPL)と大きく競合する。
このパフォーマンスギャップは、デジタル格差を深くし、LRPLを使用する開発者がLLMの進歩から等しく利益を得るのを防ぎ、表現不足のプログラミングコミュニティにおけるイノベーションの格差を補強する。
LRPLの性能を高めるために,LLMの本質的な能力を活用したBridge-Coderという新しい手法を導入する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:55:03 GMT)
TabReD: Analyzing Pitfalls and Filling the Gaps in Tabular Deep Learning Benchmarks [30.9] 典型的産業応用における表型データの2つの共通特性は、通常文献で評価に使用されるデータセットに不足している。
運用環境におけるデータセットのかなりの部分は、広範なデータ取得と機能エンジニアリングパイプラインに由来する。
これは、学術的なデータセットと比較して、予測的、非形式的、相関的な特徴の絶対的および相対的な数に影響を与える可能性がある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:54:37 GMT)
A Random Matrix Theory Perspective on the Spectrum of Learned Features and Asymptotic Generalization Capabilities [30.7] 完全に接続された2層ニューラルネットワークは、単一だが攻撃的な勾配降下ステップの後、ターゲット関数にどのように適応するかを検討する。
これは、2層ニューラルネットワークの一般化における特徴学習の影響を、ランダムな特徴や遅延トレーニング体制を超えて、はっきりと説明してくれる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:24:34 GMT)
Benchmarking Graph Learning for Drug-Drug Interaction Prediction [30.7] 薬物・薬物相互作用の予測(DDI)は薬理学と医療において重要な役割を担っている。
近年,薬物と薬物の相互作用を予測するグラフ学習法が提案されている。
グラフ学習におけるDDI予測ベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:35:34 GMT)
Fundamental computational limits of weak learnability in high-dimensional multi-index models [30.5] 本稿では, 1次反復アルゴリズムを用いて低次元構造を弱めに復元するために必要な最小サンプル複雑性に着目した。
i) 自明な部分空間が任意の$alpha!>!0$; (ii) 自明な部分空間が空であれば、簡単な部分空間の存在に必要な必要十分条件を提供する。
限定的だが興味深い厳密な方向の集合において、-パリティ問題に似て-$alpha_c$が見つかる
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:58:59 GMT)
Cast vote records: A database of ballots from the 2020 U.S. Election [29.8] このデータベースには、大統領、知事、アメリカ合衆国上院、下院、および上下両院の投票記録が含まれている。
20州で2,204人以上の候補者を投票した有権者は4270万人である。
このデータを用いて、戦場の州では、堅実な共和党員の1.9%がジョー・バイデンのチケットを分割し、堅実な民主党員の1.2%がドナルド・トランプのチケットを分割した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:42:03 GMT)
Towards a complete classification of non-chiral topological phases in 2D fermion systems [29.8] 2+1D のすべての非キラルフェルミオン位相は、テンソルの集合 $(Nij_k,Fij_k,Fijm,alphabeta_kln,chidelta,n_i,d_i)$ によって特徴づけられる。
q型エノン励起のいくつかの例が議論され、例えば、Tambara-gami圏のフェルミオントポロジカル位相が$mathbbZ_2N$である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:02:23 GMT)
SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding [29.6] ギガピクセル全体の画像を理解可能な最初の視覚言語アシスタントであるSlideChatを紹介する。
その開発をサポートするために、WSIのための最大のインストラクションフォローデータセットであるSlideInstructionを作成しました。
一般的なMLLMと専門的なMLLMと比較して、SlideChatは22のタスクのうち18のタスクで最先端のパフォーマンスを達成する特別な能力を示している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:35:28 GMT)
LOGO -- Long cOntext aliGnment via efficient preference Optimization [29.5] LOGO(Long cOntext aliGnment via efficient preference optimization)は、長文アライメントのための優先最適化を導入するトレーニング戦略である。
たった0.3Bのデータを1台の8$times$A800 GPUマシンで16時間トレーニングすることで、LOGOはLlama-3-8B-Instruct-80KモデルをGPT-4と同等のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:27:26 GMT)
Versatile Motion Language Models for Multi-Turn Interactive Agents [28.7] 本稿では,言語と運動の両モードを統合したVersatile Interactive Motion言語モデルを提案する。
動作関連タスク,テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:47:56 GMT)
Versatile Motion Langauge Models for Multi-Turn Interactive Agents [28.7] 本稿では,言語と運動の両モードを統合したVersatile Interactive Motion言語モデルを提案する。
動作関連タスク,テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:47:56 GMT)
Versatile Motion Langauge Models for Multi-Turn Interactive Agents [28.7] 本稿では,言語と運動の両モードを統合したVersatile Interactive Motion言語モデルを提案する。
動作関連タスク,テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声・音声
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:47:56 GMT)
Weak-to-Strong Preference Optimization: Stealing Reward from Weak Aligned Model [28.6] この研究は弱強一般化に触発され、弱いモデルによって生成されるラベルに強いLMを微調整することで、弱いスーパーバイザーを一貫して上回る。
Weak-to-Strong Preference Optimization (WSPO)を提案し、弱いモデルのアライメント前後の分布差を学習することにより、強力なモデルアライメントを実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:06:29 GMT)
Unleashing Reasoning Capability of LLMs via Scalable Question Synthesis from Scratch [28.5] ScaleQuestはスケーラブルで斬新なデータ合成手法である。
複雑な拡張制約を持つシードデータを必要とせずに、スクラッチから質問を生成する。
主要なオープンソースモデルの性能を普遍的に向上させることができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:42:04 GMT)
FairQueue: Rethinking Prompt Learning for Fair Text-to-Image Generation [28.2] テキスト・トゥ・イメージ(T2I)生成のための最先端技術(SOTA)として、即時学習が登場している。
そこで本研究では,この素早い学習に基づくアプローチによって,サンプルの品質が劣化することを明らかにする。
品質問題に対処するため, (i) Prompt Queuing と (ii) Attention Amplification の2つのアイデアを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:16:09 GMT)
Mind Scramble: Unveiling Large Language Model Psychology Via Typoglycemia [27.7] 大規模言語モデル(LLM)の研究は、物理世界の複雑なタスクに対処する上で有望であることを示している。
GPT-4のような強力なLDMは、人間のような認知能力を示し始めていることが研究で示唆されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:49:36 GMT)
Mind Scramble: Unveiling Large Language Model Psychology Via Typoglycemia [27.7] 大規模言語モデル(LLM)の研究は、物理世界の複雑なタスクに対処する上で有望であることを示している。
GPT-4のような強力なLDMは、人間のような認知能力を示し始めていることが研究で示唆されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:49:36 GMT)
Mind Scramble: Unveiling Large Language Model Psychology Via Typoglycemia [27.7] 大規模言語モデル(LLM)の研究は、物理世界の複雑なタスクに対処する上で有望であることを示している。
GPT-4のような強力なLDMは、人間のような認知能力を示し始めていることが研究で示唆されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:49:36 GMT)
Extracting polygonal footprints in off-nadir images with Segment Anything Model [27.5] 我々は,多角形フットプリント予測のためのエンド・ツー・エンドおよびプロンプト可能なモデルであるOBMv2を提案する。
OBMと異なり、OBMv2は様々なビルディングタイプのパフォーマンスを向上させる新しいSOFA(Self Offset Attention)メカニズムを導入している。
屋上マスクやビルディングマスク,オフセットを効果的に活用し,フットプリントの正確な予測を行うマルチレベル情報システム(MISS)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:22:50 GMT)
BIFRÖST: 3D-Aware Image compositing with Language Instructions [27.5] Bifr"ostは、命令ベースの画像合成を実行するために拡散モデルに基づいて構築された、新しい3D対応フレームワークである。
Bifr"ostは、MLLMを2.5D位置予測器として訓練し、デプスマップを生成プロセス中に余分な条件として統合することで問題に対処する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:35:12 GMT)
Understanding When Tree of Thoughts Succeeds: Larger Models Excel in Generation, Not Discrimination [27.5] Tree of Thoughts (ToT) は、推論ステップを提案するジェネレータと、どのステップを実装するかを決定する識別器を使用する推論戦略である。
我々は、ToTが最も有益である条件をよりよく理解するために、ジェネレータと識別器の役割を別々に分析する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:01:31 GMT)
Radar and Camera Fusion for Object Detection and Tracking: A Comprehensive Survey [26.8] 我々は、レーダーカメラ融合知覚の基礎原理、方法論、および応用に焦点を当てる。
本稿では,レーダーおよびカメラ技術の文脈における物体検出と追跡に関する研究トピックを網羅する詳細な分類法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:37:57 GMT)
AgentStore: Scalable Integration of Heterogeneous Agents As Specialized Generalist Computer Assistant [26.6] AgentStoreは、コンピュータタスクを自動化するヘテロジニアスエージェントを動的に統合するために設計されたスケーラブルなプラットフォームである。
多様なエージェントを効率的に管理するための textbfAgentToken 戦略を用いた新しいコア textbfMetaAgent を提案する。
3つの挑戦的なベンチマークの実験では、AgentStoreは、制限のある以前のシステムの制限を超越している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:58:40 GMT)
Frenet-Serret Frame-based Decomposition for Part Segmentation of 3D Curvilinear Structures [26.5] 医用画像における正確な3次元キュビリニア構造のセグメンテーションは、複雑な形状のため、依然として困難である。
本稿では,Frenet-Serret Frame-based Decompositionを導入し,3次元曲線構造を大域(C2)連続曲線に分解する。
DenSpineEMの実験は、例外的なクロスリージョンおよびクロス種一般化を実証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:18:04 GMT)
ANAVI: Audio Noise Awareness using Visuals of Indoor environments for NAVIgation [26.5] より静かなロボット経路計画のためのNAVIgationのための室内視覚を用いた騒音認識手法を提案する。
我々は、模擬住宅の異なるリスナー場所で「インパルス」の音の大きさのデータを生成し、音響騒音予測器(ANP)を訓練する。
動作音響とANPを統合し,車輪付きロボット(Hello Robot Stretch)と脚付きロボット(Unitree Go2)を用いて,これらのロボットが環境の騒音制約に適合するように実験を行った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:19:53 GMT)
AutoRD: An Automatic and End-to-End System for Rare Disease Knowledge Graph Construction Based on Ontologies-enhanced Large Language Models [26.0] 希少な病気は世界中で数百万人に影響を与えるが、その頻度が低いため研究の焦点が限られていることが多い。
近年のLarge Language Models (LLMs) の進歩は, 医療情報の抽出を自動化することを約束している。
本稿では,まれな疾患に関する医療用テキストから情報を自動的に抽出するAutoRDというエンドツーエンドシステムを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:32:34 GMT)
HumanEval-V: Evaluating Visual Understanding and Reasoning Abilities of Large Multimodal Models Through Coding Tasks [26.0] HumanEval-Vは、コード生成による大規模言語モデルの視覚的理解と推論能力を評価するために設計されたベンチマークである。
HumanEval-Vには、CodeForcesやStack Overflowといったプラットフォームから派生した、108の慎重に構築されたエントリーレベルのPythonコーディングタスクが含まれている。
我々はHumanEval-Vを用いて19の最先端LMMを評価し、重要な課題を明らかにした。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:33:58 GMT)
OSCAR: Operating System Control via State-Aware Reasoning and Re-Planning [25.8] 我々はOSCAR: 状態認識推論と再計画によるオペレーティングシステム制御について述べる。
OSCARは、様々なデスクトップおよびモバイルアプリケーションと自律的にナビゲートし対話するように設計された汎用エージェントである。
我々は,デスクトップおよびモバイルプラットフォームにまたがる多様なベンチマーク実験を通じて,OSCARの有効性を実証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:58:08 GMT)
A Historical Trajectory Assisted Optimization Method for Zeroth-Order Federated Learning [25.4] フェデレートラーニングは分散勾配降下技術に大きく依存している。
勾配情報が得られない状況では、勾配をゼロ次情報から推定する必要がある。
勾配推定法を改善するための非等方的サンプリング法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:39:27 GMT)
Rethinking Softmax: Self-Attention with Polynomial Activations [25.2] 変圧器におけるソフトマックスアテンションは、トレーニング中に注意行列のフロベニウスノルムを暗黙的に正則化できることを示す。
次に、アテンション行列のフロベニウスノルムを正規化する代替アクティベーションを検討し、アテンションベースのアーキテクチャに適合する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:08:25 GMT)
Low-Rank Tensor Learning by Generalized Nonconvex Regularization [25.1] 低ランクテンソル学習の問題点について検討し, 基礎となるテンソルを観測するサンプルはごくわずかである。
非テンソル学習関数の族は、基礎となるテンソルの低ランク性を特徴づけるために用いられる。
結果の大量化最小化を解決するために設計されたアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:33:20 GMT)
Does Differential Privacy Impact Bias in Pretrained NLP Models? [24.6] 差分プライバシー(DP)は、訓練例の漏洩を制限するために、訓練済みの大規模言語モデル(LLM)を微調整する際に適用される。
実験分析により, LLMの偏りに対するDPの影響について検討した。
また,DPがバイアスに与える影響は,プライバシ保護レベルだけでなく,データセットの基本的な分布にも影響していることが示された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:59:03 GMT)
Navigable Graphs for High-Dimensional Nearest Neighbor Search: Constructions and Limits [24.6] グラフが任意の開始ノードから任意のターゲットノードへの移動に成功すれば、グラフはナビゲート可能である。
アプリケーションにとって重要な問題は、スペーサーグラフを構築することができるかどうかである。
任意の次元において、任意の距離関数に対して、平均次数$O(sqrtn log n )$の任意の$n$点に対してナビゲート可能なグラフを構築するための単純かつ効率的な方法を与える。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:21:36 GMT)
TEAM: Topological Evolution-aware Framework for Traffic Forecasting--Extended Version [24.5] 交通予測のためのトポロジカル進化認識フレームワーク(TEAM)には、畳み込みと注意が組み込まれている。
TEAMは、予測精度を損なうことなく、既存の方法よりもはるかに低い再訓練コストを削減できる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:50:21 GMT)
MazeNet: An Accurate, Fast, and Scalable Deep Learning Solution for Steiner Minimum Trees [24.2] 我々は,OARSMT(Obstacle Avoiding Rectilinear Steiner Minimum Tree)をデータから解くためのディープラーニングベースの手法であるMazeNetを提案する。
MazeNetの重要な特徴はスケーラビリティです – 少数の端末を持つ迷路上でRCNNブロックをトレーニングするだけでよいのです。
幅広い実験において、MazeNetはOARSMT解決の精度を完璧に達成し、従来の正確なアルゴリズムと比較してランタイムを大幅に削減し、最先端の近似アルゴリズムよりも多くの端末を処理することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:19:48 GMT)
A Historical Trajectory Assisted Optimization Method for Zeroth-Order Federated Learning [24.1] フェデレートラーニングは分散勾配降下技術に大きく依存している。
勾配情報が得られない状況では、勾配をゼロ次情報から推定する必要がある。
勾配推定法を改善するための非等方的サンプリング法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:39:27 GMT)
A Historical Trajectory Assisted Optimization Method for Zeroth-Order Federated Learning [24.1] フェデレートラーニングは分散勾配降下技術に大きく依存している。
勾配情報が得られない状況では、勾配をゼロ次情報から推定する必要がある。
勾配推定法を改善するための非等方的サンプリング法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:39:27 GMT)
FastSurvival: Hidden Computational Blessings in Training Cox Proportional Hazards Models [24.0] コックス比例ハザード(CPH)モデルは、解釈可能性、柔軟性、予測性能に広く利用されている。
CPHモデルをトレーニングする現在のアルゴリズムには欠点があり、CPHモデルを最大限に活用できない。
CPHモデルの隠れ数学的構造を利用した代理関数の構築と最小化による新しい最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:36:59 GMT)
ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery [23.8] 我々は、データ駆動科学発見のための言語エージェントを評価するための新しいベンチマークであるScienceAgentBenchを紹介する。
4つの分野において、44の査読論文から102のタスクを抽出する。
我々は、生成されたプログラム、実行結果、コストを調べるために、一連の評価指標を使用します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:37:05 GMT)
ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery [23.8] 44の査読論文から4つの分野の102の課題を抽出し,9つの課題の専門家による検証を行った。
我々は、各タスクのターゲット出力を、自己完結型のPythonプログラムファイルに統一する。
データ汚染の懸念を軽減するための2つの効果的な戦略を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:37:05 GMT)
Research on gesture recognition method based on SEDCNN-SVM [23.3] 異なるジェスチャーのsEMGを認識するためにSEDCNN-SVMを提案する。
SEDCNN-SVMは、改良されたディープ畳み込みニューラルネットワーク(DCNN)とサポートベクターマシン(SVM)から構成される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:02:56 GMT)
Task Calibration: Calibrating Large Language Models on Inference Tasks [23.3] 大規模言語モデル(LLM)は、推論タスクにおいて印象的なゼロショットのパフォーマンスを示した。
LLMは入力テキストと出力ラベルの間に急激な相関関係があり、それによって推論能力が制限される。
タスクキャリブレーション(TC: Task calibration)は、ゼロショットと推論のみのキャリブレーションであり、相互情報に触発されたキャリブレーション手法である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:18:32 GMT)
How Good Are LLMs for Literary Translation, Really? Literary Translation Evaluation with Humans and LLMs [23.2] LITEVAL-CORPUSは、複数の検証された人間の翻訳と9つの機械翻訳システムからの出力を含む並列コーパスである。
非文学的人為的MT評価におけるデファクトスタンダードである多次元品質指標(MQM)は、文学翻訳には不十分であることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:48:03 GMT)
MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision [23.1] モノクラーオープンドメイン画像から3次元形状を復元する強力なモデルであるMoGeを提案する。
一つの画像が与えられた場合、アフィン不変表現でキャプチャされたシーンの3Dポイントマップを直接予測する。
本稿では,高品質な幾何学を学習する上で,モデルに有効性を与える新しいグローバルおよびローカルな幾何学監督手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:29:02 GMT)
MoESD: Mixture of Experts Stable Diffusion to Mitigate Gender Bias [23.1] テキスト・ツー・イメージ・モデルにおいて、ジェンダーバイアスを軽減するためのMixture-of-Expertsアプローチを導入する。
画像品質を維持しながら, 性別偏見の軽減に成功していることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:28:27 GMT)
Probing Ranking LLMs: Mechanistic Interpretability in Information Retrieval [22.9] 我々は最先端の微調整型変圧器ネットワークの動作について検討する。
我々のアプローチは、LLM内のニューロンの探索に基づく層間層解析である。
ネットワークのアクティベーションの中で、既知の人間工学的・意味的な特徴の個人またはグループを特定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:20:10 GMT)
DMVC: Multi-Camera Video Compression Network aimed at Improving Deep Learning Accuracy [22.9] ユビキタスビデオデータの時代に適した最先端のビデオ圧縮フレームワークを提案する。
人間の視覚知覚を優先する従来の圧縮手法とは異なり、我々の革新的なアプローチは、深層学習の精度に重要な意味情報の保存に重点を置いている。
設計されたディープラーニングアルゴリズムに基づいて、冗長性から必然的に重要な情報を分離し、機械学習タスクに最も関連性の高いデータの供給を確実にする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:29:57 GMT)
CloudEye: A New Paradigm of Video Analysis System for Mobile Visual Scenarios [22.9] CloudEyeはリアルタイムで効率的なモバイル視覚認識システムである。
エッジサーバを備え、クラウドサーバと調整されたモバイルビジョンシステム環境において、エッジサーバ上のコンテンツ情報マイニングを使用する。
ネットワーク帯域幅を69.50%削減し、推論速度を24.55%向上させ、検出精度を67.30%向上させる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:27:05 GMT)
Latent Spatiotemporal Adaptation for Generalized Face Forgery Video Detection [22.5] 顔画像の一般的な検出を容易にするためのLatemporal Spatio(LAST)アプローチを提案する。
まず、各フレームの局所的な空間的特徴を抽出するために、軽量CNNを組み込むことで、ビデオの時間的パターンをモデル化する。
次に、静止空間ビデオの長期的表現を学習し、画素空間よりも多くの手がかりを含むべきである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:17:11 GMT)
Diffusion Attribution Score: Evaluating Training Data Influence in Diffusion Model [22.4] 拡散モデルに対する既存のデータ帰属法は、典型的にはトレーニングサンプルの寄与を定量化する。
拡散損失の直接的利用は,拡散損失の計算により,そのような貢献を正確に表すことはできない。
本研究の目的は, 予測分布と属性スコアとの直接比較を計測し, トレーニングサンプルの重要性を分析することである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:58:17 GMT)
Are LLMs Better than Reported? Detecting Label Errors and Mitigating Their Effect on Model Performance [21.9] 大きな言語モデル(LLM)は、アノテーションプロセスを強化する新しい機会を提供する。
合意、ラベルの品質、効率の点で、専門家、クラウドソース、LLMベースのアノテーションを比較します。
以上の結果から,ラベルエラーがかなり多く,修正されると,報告されたモデル性能が大幅に上向きに変化することが判明した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:27:03 GMT)
Infinity-MM: Scaling Multimodal Performance with Large-Scale and High-Quality Instruction Data [21.9] VLM(Vision-Language Models)は近年大きな進歩を遂げているが、オープンソースの命令データの規模や品質に制限があるため、その性能は損なわれている。
Infinity-MMは4000万のサンプルを持つ大規模マルチモーダル・インストラクション・データセットであり、厳密な品質のフィルタリングと重複によって強化されている。
また,詳細な画像アノテーションと多様な質問生成を用いた,オープンソースのVLMに基づく合成命令生成手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:03:48 GMT)
Fully Stochastic Primal-dual Gradient Algorithm for Non-convex Optimization on Random Graphs [21.7] 分散最適化アルゴリズムは、同期オーバーヘッドや断続的な通信といった問題に悩まされることが多い。
FSPDAは、非アンダーライン設定の下で正確に収束する最初のアルゴリズムである。
FSPDAの利点を示すために, 数値実験を行った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:26:58 GMT)
End-to-end Training for Recommendation with Language-based User Profiles [21.6] LangPTuneは、LLMをトレーニングして言語ベースのユーザプロファイルを生成するための、最初のエンドツーエンドの学習方法である。
我々は、LangPTuneが既存のプロファイルベースの手法を著しく上回っていることを示す。
最先端で透明性の低いレコメンデーションシステムに匹敵するパフォーマンスレベルにアプローチする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:57:17 GMT)
Does Data Contamination Detection Work (Well) for LLMs? A Survey and Evaluation on Detection Assumptions [20.5] 大規模言語モデル(LLM)は、様々なベンチマークで優れた性能を示し、汎用的なタスクソルバとしての可能性を示している。
トレーニングデータと評価データセットの重複がパフォーマンス評価を膨らませる。
データ汚染検出に関する47の論文を体系的にレビューし、基礎となる仮定を分類し、厳格に検証されたかどうかを評価する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:58:22 GMT)
Personalized Pieces: Efficient Personalized Large Language Models through Collaborative Efforts [20.5] Per-Pcsは、パーソナライズされたPEFTを安全に共有し、組み立てることを可能にするフレームワークである。
プライバシーを保護し、過剰なストレージや計算要求なしにきめ細かなユーザーモデリングを可能にする。
テストでは、Per-Pcsが非個人化およびPEFT検索ベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:46:35 GMT)
RSA-Control: A Pragmatics-Grounded Lightweight Controllable Text Generation Framework [20.3] RSA-Controlは、実用的なテキスト生成フレームワークである。
本稿では,文脈に基づく制御強度の自動調整を可能にする自己調整可能な合理性パラメータを提案する。
2種類のタスクタイプと2種類の言語モデルを用いて実験を行った結果,RSA-Controlは言語流速とコンテントの整合性を維持しつつ,強い属性制御を実現することが示された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:21:04 GMT)
Generation through the lens of learning theory [20.3] 統計的学習理論のレンズを通して生成を研究する。
仮説クラスが一様生成可能な特徴付けを提供する。
仮説クラスのこれらの2つの性質が両立していることが示される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:46:54 GMT)
Initialization Matters: On the Benign Overfitting of Two-Layer ReLU CNN with Fully Trainable Layers [20.3] 解析は、完全にトレーニング可能な層を持つ2層ReLU畳み込みニューラルネットワーク(CNN)に拡張する。
以上の結果から,出力層のスケーリングがトレーニングのダイナミックスに不可欠であることが示唆された。
どちらの設定でも、テストエラーの上限と下限にほぼ一致するものを提供します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:15:45 GMT)
XC-Cache: Cross-Attending to Cached Context for Efficient LLM Inference [20.2] インコンテキスト学習(ICL)アプローチは典型的には、参照情報に基づいて条件デコーダのみの言語モデルを生成するプロンプトを活用する。
この研究は、エンコーダ・デコーダアーキテクチャにインスパイアされたモデルを導入し、プロンプトなしで参照テキストの条件生成にクロスアテンションを使用することにより、これらの制限に対処する。
質問応答(QA)をテストベッドとして使用し、条件生成能力を評価し、ICLより優れており、微調整された誘導LDMと同等であり、標準KVキャッシュと比較して空間フットプリントを2桁の精度で大幅に削減する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:40:10 GMT)
Needle In A Video Haystack: A Scalable Synthetic Evaluator for Video MLLMs [20.2] ビデオ理解はマルチモーダル大言語モデル(LMLM)にとって重要な次のステップである
合成ビデオ生成によるベンチマーク構築フレームワークであるVideoNIAH(Video Needle In A Haystack)を提案する。
我々は、プロプライエタリモデルとオープンソースモデルの両方を包括的に評価し、ビデオ理解能力の重大な違いを明らかにする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:12:49 GMT)
Can Self Supervision Rejuvenate Similarity-Based Link Prediction? [20.1] 自己監督的類似性に基づくLP(3SLP)は、既知のリンクラベルの助けなしに、類似性に基づくLPの教師なし条件に適合する。
3SLPは、データ拡張とノード表現学習を備えた二重ビューコントラッシブノード表現学習(DCNRL)を導入している。
ベンチマークデータセットに対する大規模な実験は、3SLPの健全な改善を示し、従来の類似性に基づくLPのベースラインを最大21.2%上回った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:31:12 GMT)
Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion [20.0] Videoshopは、ローカライズされたセマンティック編集のためのトレーニング不要のビデオ編集アルゴリズムである。
ユーザーはオブジェクトの追加や削除、セマンティックな変更、ストック写真をビデオに挿入したり、場所や外観を細かくコントロールできる。
Videoshopは、評価基準10を用いて、2つの編集ベンチマークで6つのベースラインに対して高い品質の編集を行う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:10:30 GMT)
A Survey on LoRA of Large Language Models [19.9] 低ランク適応(LoRA)は、高密度ニューラルネットワーク層をプラグ可能な低ランク行列で更新し、パラメータ効率の良い微調整パラダイムの1つである。
本調査は,(1)ダウンストリーム適応の改善による下流タスクにおけるLoRAの性能向上,(2)複数のLoRAプラグインを混合してタスク間一般化を実現するクロスタスク一般化手法,(3)LoRAの計算効率を高める効率改善手法,(4)フェデレート学習にLoRAを使用するデータプライバシ保護手法,(5)アプリケーションの観点から,進捗を分類し,レビューする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:30:46 GMT)
Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning [19.5] i-QNは、アクション値関数の調整されたシーケンスを学習することで、複数の連続したベルマン更新を可能にする、原則化されたアプローチである。
i-QNは理論的に根拠があり、値ベースおよびアクター批判的手法でシームレスに使用できることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:50:57 GMT)
Revisiting Differentiable Structure Learning: Inconsistency of $\ell_1$ Penalty and Beyond [19.4] 微分可能な構造学習の最近の進歩は、連続的な最適化問題として、有向非巡回グラフを学習する問題の枠組みを定めている。
本研究では,微分可能な構造学習法における限界について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:17:14 GMT)
Retrieval-Augmented Diffusion Models for Time Series Forecasting [19.3] 検索時間拡張拡散モデル(RATD)を提案する。
RATDは埋め込みベースの検索プロセスと参照誘導拡散モデルという2つの部分から構成される。
当社のアプローチでは,データベース内の意味のあるサンプルを活用することで,サンプリングを支援し,データセットの利用を最大化することが可能です。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:14:39 GMT)
Transferring Knowledge from High-Quality to Low-Quality MRI for Adult Glioma Diagnosis [19.2] 本稿では,SSAアダルトグリオーマにおけるBraTS Challengeについて述べる。
我々は、BraTS-GLI 2021の勝利ソリューションからモデルを採用し、3つのトレーニング戦略で活用する。
結果は、BraTS-GLI 2021データセットの初期トレーニングに続いて、BraTS-Africaデータセットの微調整が最高の結果となったことを示している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:48:12 GMT)
Integrating Canonical Neural Units and Multi-Scale Training for Handwritten Text Recognition [19.1] 本稿では,新しい3次元アテンションモジュールとグローバルなコンテキスト情報を用いて,新しい認識ネットワークを提案する。
注意機構、完全接続層、再帰ユニット、畳み込み層を含む主要な正準神経ユニットを効率的にネットワークに編成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:33:12 GMT)
BioMistral-NLU: Towards More Generalizable Medical Language Understanding through Instruction Tuning [19.0] 汎用医療用NLUモデルであるBioMistral-NLUをMNLU-Instruct上で微調整して開発する。
我々のBioMistral-NLUはオリジナルのBioMistralよりも優れています。
多様なNLUタスクに対するデータセットに依存しないプロンプト戦略と命令チューニングのステップにより、多様な医療NLUタスク間のLLMの一般化性が向上する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:53:53 GMT)
PESFormer: Boosting Macro- and Micro-expression Spotting with Direct Timestamp Encoding [19.0] PESFormerは、ポイント・ツー・インターバル式スポッティングを実現するビジョン・トランスフォーマーアーキテクチャに基づくモデルである。
PESFormerは、アンカーを置き換えるために直接タイムスタンプ符号化(DTE)アプローチを採用し、各タイムスタンプのバイナリ分類を可能にする。
我々は、未編集のトレーニングビデオをゼロパディングして、一定期間の均一で長いビデオを作成する戦略を実装した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:45:25 GMT)
FedBaF: Federated Learning Aggregation Biased by a Foundation Model [18.9] ファンデーションモデルを新しいアプリケーションに適用するための既存のアプローチは、しばしばフェデレートラーニング(FL)に依存し、グローバルモデルの初期化に使用する際に、ファンデーションモデルの重みをクライアントに開示する。
本稿では,FedBaF(FedBaF)によるFederated Learning Aggregation Biasedを紹介する。FedBaFは,FLアグリゲーションフェーズにおいて,事前学習した基礎モデルの重みを動的に統合する手法である。
従来の方法とは異なり、FedBaFは基礎モデルの機密性を保ちながら、特に非IIDおよび敵のシナリオにおいて、より正確なモデルのトレーニングにその能力を活用している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:14:23 GMT)
Transformers need glasses! Information over-squashing in language tasks [18.8] 復号器のみの変換器における情報伝達について検討する。
変換器への入力の特定のシーケンスは、最終的なトークンにおいて任意にクローズな表現が得られることを示す。
また,デコーダのみのトランスフォーマー言語モデルでは,入力中の特定のトークンに対する感度が低下することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:12:55 GMT)
FedSPD: A Soft-clustering Approach for Personalized Decentralized Federated Learning [18.4] フェデレーション学習は、分散クライアントがローカルデータを使用して機械学習モデルを協調的にトレーニングするためのフレームワークである。
分散環境のための効率的パーソナライズされたフェデレーション学習アルゴリズムであるFedSPDを提案する。
低接続性ネットワークにおいてもFedSPDが正確なモデルを学ぶことを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:48:34 GMT)
Gradients of Functions of Large Matrices [18.4] 数値線形代数のワークホースを効率的に区別する方法を示す。
以前は知られていなかったLanczosとArnoldiのイテレーションのアジョイントシステムをJAXで実装し、結果として得られるコードがDiffraxと競合することを示す。
これらはすべて、問題固有のコードの最適化なしに実現されます。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:04:19 GMT)
Maintaining Plasticity in Continual Learning via Regenerative Regularization [18.4] 連続学習において、可塑性とは、エージェントが新しい情報に迅速に適応できる能力を指す。
損失関数 L2 を初期パラメータに対して正規化することにより,可塑性を維持するための簡単な手法 L2 Init を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:03:41 GMT)
Large Language Model for Table Processing: A Survey [18.3] 本調査では,テーブル関連タスクの概要について概観する。
テーブル質問応答やスプレッドシート操作やテーブルデータ分析といった新しいフィールドなど、従来のタスクをカバーしています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:26:36 GMT)
Approximation Rate of the Transformer Architecture for Sequence Modeling [18.2] 非線型関係のクラスを考察し、トランスフォーマーのジャクソン型近似率推定を明示するために、複雑性尺度の新たな概念を同定する。
この速度はトランスフォーマーの構造特性を明らかにし、それが近似に最も適しているシーケンシャルな関係のタイプを示唆する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:13:01 GMT)
A Riemannian Framework for Learning Reduced-order Lagrangian Dynamics [18.2] 本稿では,物理的に整合した低次動的パラメータを学習するための新しい幾何学的ネットワークアーキテクチャを提案する。
本手法は,剛性および変形性システムの高次元力学の高精度な長期予測を可能にする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:53:21 GMT)
Watermarking Large Language Models and the Generated Content: Opportunities and Challenges [18.0] 生成型大規模言語モデル(LLM)は知的財産権侵害や機械生成誤報の拡散に懸念を抱いている。
ウォーターマーキングは、所有権を確立し、許可されていない使用を防止し、LLM生成コンテンツの起源を追跡できる有望な手法として機能する。
本稿では,LLMをウォーターマークする際の課題と機会を要約し,共有する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:55:33 GMT)
MolMix: A Simple Yet Effective Baseline for Multimodal Molecular Representation Learning [17.9] 本稿では,マルチモーダル分子表現学習のためのトランスフォーマーベースラインを提案する。
我々は,SMILES文字列,2次元グラフ表現,分子の3次元コンフォメータの3つの異なるモダリティを統合する。
その単純さにもかかわらず、我々の手法は複数のデータセットにまたがって最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:34:50 GMT)
MolMix: A Simple Yet Effective Baseline for Multimodal Molecular Representation Learning [17.9] 本稿では,マルチモーダル分子表現学習のためのトランスフォーマーベースラインを提案する。
我々は,SMILES文字列,2次元グラフ表現,分子の3次元コンフォメータの3つの異なるモダリティを統合する。
その単純さにもかかわらず、我々の手法は複数のデータセットにまたがって最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:34:50 GMT)
Parameter-Efficient Fine-Tuning in Large Models: A Survey of Methodologies [17.9] 大規模なモデルでは、運用には相当な計算資源とGPUメモリが必要である。
PEFT (Efficient Fine-Tuning) は、様々な下流タスクに適合する大規模な事前学習モデルのパラメータを効率的に調整することで、実用的なソリューションを提供する。
本稿では,PEFTの予備知識,各種PEFTアルゴリズムの基本的な考え方と原理,PEFTの適用,今後の研究方向性について紹介する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:58:59 GMT)
GADT: Enhancing Transferable Adversarial Attacks through Gradient-guided Adversarial Data Transformation [17.4] 本稿では,DA に基づく攻撃アルゴリズム GADT を提案する。これは反復的アンタゴニズムにより適切な DA パラメータを識別し,これらのパラメータに基づいて後続推定を用いて AN を更新する。
GADTは、クエリベースの攻撃など、他のブラックボックス攻撃シナリオで利用することができ、現実世界のAIアプリケーションに対する攻撃を強化する新たな手段を提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:21:49 GMT)
The Road to Trust: Building Enclaves within Confidential VMs [17.1] NestedSGXは仮想マシン特権レベル(VMPL)を活用するフレームワークである。
それは、悪質なコードのロードを信頼していないゲストOSだと考えている。
これは、エンクレーブ内で実行される信頼され測定されたコードだけがリモートで検証可能であることを保証します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:02:40 GMT)
A Test of Time: Predicting the Sustainable Success of Online Collaboration in Wikipedia [17.1] 我々は,ウィキペディア記事の持続可能な成功を予測するために,機械学習モデルを開発した。
記事が高品質であると認識されるのに時間がかかるほど、時間とともにそのステータスを維持する可能性が高くなる。
我々の分析はウィキペディア以外の幅広い集団的行動に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:42:53 GMT)
Creativity in AI: Progresses and Challenges [17.0] 我々は,AIシステムの創造的能力について研究し,創造的な問題解決,言語的,芸術的,科学的創造性に注目した。
我々のレビューは、最新のAIモデルは言語的にも芸術的にも創造的なアウトプットを生成できるが、創造的な問題解決を必要とするタスクに苦労していることを示唆している。
プロセス駆動型で創造性のいくつかの側面を考慮した、包括的な創造性評価の必要性を強調します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:25:15 GMT)
Bonsai: Gradient-free Graph Distillation for Node Classification [17.0] グラフ蒸留は、GNNのスケーラブルなトレーニングを可能にするための有望な道として登場した。
本研究は, 現行のグラフ蒸留技術において, 重大な欠点を明らかにするものである。
本稿では,テキスト計算木がメッセージパッシングGNNの基本処理単位を形成するという観察により,新しいグラフ蒸留法であるボンサイについて述べる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:24:53 GMT)
Inference time LLM alignment in single and multidomain preference spectrum [16.8] 優先次元の符号化表現を学習する推論時間モデルアライメント手法を提案する。
これらの表現は、モデル編集のように、アライメントモデルからベースモデルのサブトラクションによって計算される。
好みの次元は様々なレベルにまたがることができるが、ここでは3つの専門領域にわたる3つの段階的な応答レベルに焦点を当てる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:31:39 GMT)
Scale Propagation Network for Generalizable Depth Completion [16.7] 入力から出力までのスケールを伝搬する新しいスケール伝搬正規化法(SP-Norm)を提案する。
また,SP-NormとConvNeXt V2のバックボーンをベースとした新しいネットワークアーキテクチャを開発した。
我々のモデルは、最先端の手法と比較して、高速かつ低メモリで常に最高の精度を達成している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:53:06 GMT)
Integrated spectrally multiplexed light-matter interface at telecom band [16.7] テレコムバンドにおける光物質インタフェースを統合システムで実証する。
Er3+:LiNbO3チップ上に5スペクトルチャネル原子周波数コムフォトニックメモリを作製する。
通信帯域における時間ビン絡み光子対からの信号光子をオンチップメモリに送信し、記憶時間152ns後にリコールする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:04:11 GMT)
Faster Algorithms for User-Level Private Stochastic Convex Optimization [16.6] ユーザレベルの差分プライバシー制約の下で,プライベート凸最適化(SCO)について検討する。
ユーザレベルのDP SCOの既存のアルゴリズムは多くの大規模機械学習シナリオでは実用的ではない。
我々は、最先端の過剰リスクと実行時保証を備えた新しいユーザレベルのDPアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:02:33 GMT)
Differentially Private Federated Learning without Noise Addition: When is it Possible? [16.5] Federated Learning with Secure Aggregation (SA)は、マシンラーニングモデルをトレーニングするためのプライバシ保護フレームワークとして注目されている。
近年の研究では、複数のトレーニングラウンドで集約モデルを通じて情報漏洩をバウンドすることで、FLとSAとのプライバシー保証を拡張している。
FLとSAが最短ケースの差分プライバシーを保証できる条件について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:49:14 GMT)
HUE Dataset: High-Resolution Event and Frame Sequences for Low-Light Vision [16.4] 低照度条件下での高分解能イベントとフレームシーケンスのコレクションであるHUEデータセットを紹介する。
私たちのデータセットには、屋内、都市景観、トワイライト、夜、運転、制御されたシナリオを含む106のシーケンスが含まれています。
我々は定性評価と定量的評価の両方を用いて、最先端の低照度化と事象に基づく画像再構成手法を評価する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:15:15 GMT)
Estimating the Spectral Moments of the Kernel Integral Operator from Finite Sample Matrices [16.3] 本稿では,カーネル積分作用素のスペクトルモーメントを無限入力と特徴の極限で非バイアスで推定するアルゴリズムを提案する。
動的プログラミングに基づく本手法は,演算子スペクトルのモーメントを推定できる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:47:20 GMT)
PnLCalib: Sports Field Registration via Points and Lines Optimization [16.3] 放送されたスポーツビデオのカメラキャリブレーションは、正確なスポーツフィールドの登録に多くの課題をもたらす。
従来の検索ベースの手法は初期カメラのポーズ推定に依存しており、非標準位置で苦労する可能性がある。
本稿では,3次元サッカー場モデルと予め定義されたキーポイントのセットを利用して,これらの制限を克服する最適化に基づくキャリブレーションパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:41:42 GMT)
Evaluating AI-Generated Essays with GRE Analytical Writing Assessment [16.0] 本研究は,10個のLLMが生成したエッセイを用いて,研究記録エグゼクティブ(GRE)の分析書面アセスメントについて検討する。
我々はこれらのエッセイを、GREスコアリングパイプラインで用いられるように、人間のレーダとe-rater自動スコアリングエンジンの両方を用いて評価した。
GPT-4oは平均4.78点、GPT-4oは4.67点だった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:34:47 GMT)
Predicting the Performance of Foundation Models via Agreement-on-the-Line [15.8] ラベルなしでOOD性能を確実に予測するために「アグリメント・オン・ザ・ライン」を利用することができる。
重み付けされた重みから最小限の微調整を行う基礎モデルを示す。
多様なアンサンブルを慎重に構築することにより,高精度な基礎モデルのOOD性能を予測するために,コンセンサス・オン・ザ・ライン方式を用いることができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:47:02 GMT)
Unsupervised Object Detection with Theoretical Guarantees [15.8] 我々は、教師なしオブジェクト検出アーキテクチャを開発し、学習された変数が、小さなシフトまでの真のオブジェクト位置に対応することを証明した。
理論的予測は個々のピクセルの精度まで検証する。
現行のSOTAオブジェクト検出法とは異なり,提案手法の予測誤差は常に理論的境界内にある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:09:47 GMT)
Interpretable Representation Learning from Videos using Nonlinear Priors [15.8] 本稿では,ビデオの非線形先行を指定可能なディープラーニングフレームワークを提案する。
我々は、単純な等方的ガウスから任意の非線形時間付加雑音モデル(ANM)に先立って変分オートエンコーダ(VAE)を拡張することでこれを実現している。
本手法は, 振り子, スプリング上の質量, 落下物, パルサーなどの実世界の物理映像で検証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:39:24 GMT)
Should We Really Edit Language Models? On the Evaluation of Edited Language Models [15.6] 既存の編集手法は、一般的なベンチマークで必然的にパフォーマンスが低下する。
インストラクションチューニングされたモデルは、編集がより堅牢で、編集後の一般的な知識に対するパフォーマンス低下が少ない。
その結果,現在の編集手法は,言語モデル内の小規模な知識更新にのみ適していることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:36:48 GMT)
MoMQ: Mixture-of-Experts Enhances Multi-Dialect Query Generation across Relational and Non-Relational Databases [15.6] クラウドサービスプロバイダは、複数の方言をサポートする統合データベースマネージャサービスを探している。
MoMQは、Mixture-of-Expertsベースの新しいマルチダイアレクトクエリ生成フレームワークである。
MoMQでは、それぞれの方言の専門家グループと、方言固有の知識を扱うための多レベルルーティング戦略を採用している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:42:43 GMT)
PointPatchRL -- Masked Reconstruction Improves Reinforcement Learning on Point Clouds [15.5] 本稿では,ポイントクラウド上での強化学習(RL)手法であるPointPatchRL(PPRL)を紹介する。
PPRLは、ポイントクラウドを重複パッチに分割し、トークン化し、トークンをトランスフォーマーで処理するという共通のパラダイムに基づいている。
本手法は,複雑な操作タスクにおける画像観察において,モデルフリー,モデルベースベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:51:09 GMT)
HardRace: A Dynamic Data Race Monitor for Production Use [15.5] データレースはマルチスレッドプログラムにおいて重要な問題であり、予測できない、破滅的な、診断が難しい問題を引き起こします。
我々は、十分なランタイムオーバーヘッドと高い検出能力を持ちながら、オンザフライでのレースを検出するデータレースモニターであるHardRaceを紹介した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:59:02 GMT)
Boosting Deductive Reasoning with Step Signals In RLHF [15.4] 我々は,帰納的推論データのためのMulti-step Deduction (MuseD) という自動手法を開発した。
MuseDは、マルチステップ推論のためのトレーニングとテストデータセットの作成を可能にしました。
トレーニングデータでは、ドメイン内推論タスクのいずれにおいても、論理的能力が大幅に向上した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:36:53 GMT)
Boosting Deductive Reasoning with Step Signals In RLHF [15.4] 我々は,帰納的推論データのためのMulti-step Deduction (MuseD) という自動手法を開発した。
MuseDは、マルチステップ推論のためのトレーニングとテストデータセットの作成を可能にしました。
トレーニングデータでは、ドメイン内推論タスクのいずれにおいても、論理的能力が大幅に向上した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:36:53 GMT)
Wildfire Risk Prediction: A Review [15.4] 森林火災は地球規模の植生、野生生物、人間に重大な影響を及ぼす。
山火事の予測は、回帰や機械学習の手法と組み合わせた様々な独立変数に依存している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:20:41 GMT)
Can Code-Switched Texts Activate a Knowledge Switch in LLMs? A Case Study on English-Korean Code-Switching [14.8] コードスイッチング(英語版) (CS) は微妙な文化的・言語的なニュアンスを伝えることができ、それ以外は翻訳で失われることがある。
近年の多言語大言語モデル(LLM)は,CSの理解など,様々な面で優れた多言語能力を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:14:03 GMT)
Rule Extrapolation in Language Models: A Study of Compositional Generalization on OOD Prompts [14.8] ルール外挿は、プロンプトが少なくとも1つのルールに違反するOODシナリオを記述する。
規則の交わりによって定義される形式言語に焦点を当てる。
我々はアルゴリズム情報理論に先立ってソロモノフに触発された規則外挿の規範的理論の最初の石を配置した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:30:33 GMT)
Rule Extrapolation in Language Models: A Study of Compositional Generalization on OOD Prompts [14.8] ルール外挿は、プロンプトが少なくとも1つのルールに違反するOODシナリオを記述する。
規則の交わりによって定義される形式言語に焦点を当てる。
我々はアルゴリズム情報理論に先立ってソロモノフに触発された規則外挿の規範的理論の最初の石を配置した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:30:33 GMT)
No Free Lunch: Fundamental Limits of Learning Non-Hallucinating Generative Models [14.5] 我々は,非ハロゲン化生成モデルの学習可能性を分析する理論的枠組みを開発する。
学習プロセスに実際の事実と整合した帰納的バイアスを組み込むことが重要であることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:57:11 GMT)
Bilinear Sequence Regression: A Model for Learning from Long Sequences of High-dimensional Tokens [14.4] トークン列の最も基本的なモデルの一つとして,双線形シーケンス回帰(BSR)を導入,研究する。
トークン列のベクトル化や単純な線形回帰による学習に関して、最適な学習がもたらす改善を定量化する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:44:03 GMT)
Reinforcement Learning with Model Predictive Control for Highway Ramp Metering [14.4] この研究は、交通フロー管理を強化するためのモデルベースと学習ベースの戦略の相乗効果について考察する。
制御問題は、適切なステージコスト関数を作成することにより、RLタスクとして定式化される。
RLアルゴリズムの関数近似として MPC 最適問題を利用する MPC ベースの RL アプローチを提案し,オンランプの効率的な制御について検討した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:01:51 GMT)
Tuning-free coreset Markov chain Monte Carlo [14.4] ベイズコアセット(英: Bayesian coreset)は、計算コストを削減するために推論中に全データを置き換えるデータセットの小さな重み付きサブセットである。
Coreset Markov chain Monte Carlo (Coreset MCMC) はコアセットをターゲットとした適応的なMarkov chainからのドローを使用してコアセットの重みをトレーニングする。
学習速度のない勾配最適化手法であるHot-start Distance over Gradient (Hot DoG)を提案する。
実験の結果,Hot DoGは他の学習速度非依存の勾配法よりも高品質な後部近似が得られた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:23 GMT)
DeCoRe: Decoding by Contrasting Retrieval Heads to Mitigate Hallucinations [14.0] 大きな言語モデル(LLM)は、しばしば幻覚を起こし、不信または事実的に誤った出力を生成する。
近年の研究では、検索ヘッドとして知られるTransformerアーキテクチャ内の特定の注意点が特定されている。
本稿では,新しい学習自由な復号法であるRetrieval Heads (DeCoRe) を用いた復号法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:44:33 GMT)
Cascading Failure Prediction via Causal Inference [14.0] 本稿では,送電網のカスケード故障を解析するための新しい枠組みを提案する。
新たな異常がシステム全体にどのように伝播するかを予測するための因果推論フレームワークを形式化する。
このフレームワークの有効性は、IEEE 14-bus、39-bus、および118-busシステムの関連する文献と比較して評価される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:22:08 GMT)
ChineseSafe: A Chinese Benchmark for Evaluating Safety in Large Language Models [13.9] 本研究は,大言語モデルのコンテンツ安全性に関する研究を容易にするため,中国語の安全性ベンチマーク( ChineseSafe)を提案する。
中国のインターネットコンテンツモデレーションの規制に合わせるために、ChinaSafeには4つのクラスと10のサブクラスにわたる205,034のサンプルが含まれています。
その結果、多くのLCMが特定の種類の安全問題に対する脆弱性を示しており、中国の法的なリスクにつながっていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:25:29 GMT)
Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances [13.7] 大規模なテキスト・ツー・イメージモデルは、編集中に埋め込まれた透かしを歪め、著作権保護に挑戦する。
We introduced W-Bench, a first comprehensive benchmark designed to evaluate the robustness of watermarking method。
本稿では,様々な画像編集技術に対するロバスト性を大幅に向上させる透かし手法であるVINEを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:28:32 GMT)
Perturbation-based Graph Active Learning for Weakly-Supervised Belief Representation Learning [13.3] 目標は、制約された予算内でラベル付けする価値のあるソーシャルメディアグラフ上で、価値あるメッセージを戦略的に特定することである。
本稿では、ラベル付けのためのメッセージを段階的に選択するグラフデータ強化型アクティブラーニング戦略(PerbALGraph)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:11:06 GMT)
FreCaS: Efficient Higher-Resolution Image Generation via Frequency-aware Cascaded Sampling [13.3] FreCaSはサンプリングプロセスをカスケードステージに分解し、分解能が徐々に増加し周波数帯域が拡大する。
FreCaSは、画像の品質と生成速度において最先端の手法を大幅に上回っている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:56:44 GMT)
Structured Diffusion Models with Mixture of Gaussians as Prior Distribution [13.1] 本研究では,従来の混合ガウス語の使用を円滑に適応する簡易な実践訓練手法を開発した。
提案手法は誤特定に対して堅牢であることが示され,特にトレーニングリソースの制限や,リアルタイムの迅速なトレーニングが望まれる状況に適している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:34:06 GMT)
Interpretable Bilingual Multimodal Large Language Model for Diverse Biomedical Tasks [13.0] 本研究の目的は,医学的MLLMの解剖学的領域全体を理解する能力を高めることである。
本稿では,最初のバイリンガル・ジェネリスト医療用AIシステムである領域認識型医療用MLLM MedRegAを提案する。
我々のモデルは、バイリンガル設定における様々な医療ビジョン言語タスクにおける強力なパフォーマンスを達成するだけでなく、マルチモーダル・メディカルスキャンにおける構造を認識し、検出することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:55:41 GMT)
MissNODAG: Differentiable Cyclic Causal Graph Learning from Incomplete Data [13.0] 周期因果グラフを学習するためのフレームワークであるMissNODAGを提案する。
提案フレームワークは,付加雑音モデルと予測最大化処理を統合し,出力不足値の交互化と観測データの可能性の最適化を行う。
合成実験によるMissNODAGの有効性と実世界の遺伝子摂動データへの応用を実証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:09:10 GMT)
Beyond Multiple-Choice Accuracy: Real-World Challenges of Implementing Large Language Models in Healthcare [13.0] LLM(Large Language Models)は、医療分野において人間レベルの能力に対して大きな注目を集めている。
本研究は,医学応用におけるLLMの課題を4つの側面から論じる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:12:03 GMT)
A Joint Representation Using Continuous and Discrete Features for Cardiovascular Diseases Risk Prediction on Chest CT Scans [12.7] 胸部CT画像から抽出した離散的量的バイオマーカーと連続的な深部特徴を統合した新しい関節表現法を提案する。
本手法はCVDリスク予測性能を大幅に改善し,各バイオマーカーの個人貢献分析を行う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:06:45 GMT)
A Geometric View of Data Complexity: Efficient Local Intrinsic Dimension Estimation with Diffusion Models [12.6] 低次元部分多様体の局所次元内在(LID)を推定することは長年の問題である。
本研究では,拡散モデルに付随するFokker-Planck方程式がLID推定器となることを示す。
FLIPDを合成LID推定ベンチマークに適用すると、完全に接続されたネットワークとして実装されたDMは、非常に効果的なLID推定器であることが分かる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:01:03 GMT)
MotionCLR: Motion Generation and Training-free Editing via Understanding Attention Mechanisms [12.6] 我々は,注目マップを操作することで,シンプルかつ効果的な動作編集手法を多目的に開発する。
提案手法は,優れた説明性を備えた優れた生成・編集能力を有する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:45 GMT)
ODTFormer: Efficient Obstacle Detection and Tracking with Stereo Cameras Based on Transformer [12.6] ODTFormerはTransformerベースのモデルで、障害検出と追跡の両方の問題に対処する。
我々は,最先端の障害物追跡モデルに匹敵する精度を報告し,そのコストはごくわずかである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:30:04 GMT)
Mesa-Extrapolation: A Weave Position Encoding Method for Enhanced Extrapolation in LLMs [12.3] 大規模言語モデル(LLM)はいまだに困難な外挿問題に悩まされている。
我々はなぜ位置がないのかをよりよく理解するために理論的分析を行う。
(NoPE)は、その有効範囲外では故障し、位置のパワーを検査する。
(PE)。
本稿では,チャンクベースの三角アテンション行列を用いて,最終チャンクの管理にStair-Extrapolationを適用する,新しいウィーブPE手法であるMesaExtrapolationを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:29:15 GMT)
Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use [12.2] 精神医学薬の副作用薬物反応(英: Adverse Drug Reactions, ADRs)は、精神疾患患者の入院の主要な原因である。
ADRに関連する問題を解決するための制限に直面している医療システムでは、LLM(Large Language Models)がこのギャップを埋める可能性がある。
我々の研究は、リスクの高いドメイン内の戦略駆動タスクにおけるLCMを評価するための総合的なベンチマークと評価フレームワークを提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:49:22 GMT)
Difficult for Whom? A Study of Japanese Lexical Complexity [12.0] このアノテーションを部分的に複製することで,近年の日本人LCPデータセットが対象とする個体群を代表していることを示す。
別の再注釈により、中国語話者は、日中語彙によって、複雑さを異なる形で知覚していることが示される。
グループで訓練されたモデルの平均は、CWIタスクの個々のモデルと似ているが、個人にとって優れたLCP性能を達成することは困難である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:18:53 GMT)
LanFL: Differentially Private Federated Learning with Large Language Models using Synthetic Samples [12.0] Federated Learning(FL)は、協調的なプライバシ保護機械学習フレームワークである。
数十億から数十億のパラメータを持つ最近の強力な大規模言語モデル(LLM)の出現は、従来のFLメソッドの単純な適用を非現実的にしている。
本稿では,LanFL という新しい LLM スキームを紹介し,LanFL は純粋にプロンプトベースであり,基礎となる LLM をブラックボックスとして扱う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:28:33 GMT)
The Fallacy of Minimizing Cumulative Regret in the Sequential Task Setting [11.8] 現実世界のRLアプリケーションでは、タスク間のヒューマン・イン・ザ・ループの決定は、しばしば非定常性をもたらす。
以上の結果から, 課題非定常性は, 累積後悔(CR)と単純後悔(SR)との間により制限的なトレードオフをもたらすことが明らかとなった。
これらの知見は,タスク変更に対応するためには,非定常環境における探索の増加が必要であることを示唆している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:04:43 GMT)
Generalizing Differentially Private Decentralized Deep Learning with Multi-Agent Consensus [11.4] 本稿では,分散ディープラーニングに差分プライバシーを組み込んだフレームワークを提案する。
本稿では,このフレームワークから派生したアルゴリズムの収束保証を証明し,その実用性を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:49:22 GMT)
Loss Landscape Characterization of Neural Networks without Over-Parametrization [11.4] 本稿では, 過度な過度なパラメータ化を必要とせず, 最新の深層モデルの損失を特徴付ける新しい関数のクラスを提案する。
この仮定の下で、勾配に基づく函数が収束の理論的保証を持つことを証明する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:38:58 GMT)
One-Step Effective Diffusion Network for Real-World Image Super-Resolution [11.3] 本稿では,Real-ISR問題に対する1ステップの効果的な拡散ネットワーク,すなわちOSEDiffを提案する。
トレーニング可能な層で事前学習した拡散ネットワークを微調整し、複雑な画像劣化に適応する。
我々のOSEDiffモデルは1つの拡散ステップでHQイメージを効率よく効果的に生成できる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:32:10 GMT)
The Implicit Bias of Structured State Space Models Can Be Poisoned With Clean Labels [11.3] 以前の研究は、構造化状態空間モデル(SSM)の暗黙のバイアスは、低次元の教師によってデータが生成される環境での一般化につながると主張した。
暗黙のバイアスは、多くのトレーニングデータの選択の下で一般化につながるが、トレーニングに含めると暗黙のバイアスが完全に歪む特別な例が存在することを証明している。
この失敗は、教師によってラベル付けされている特別なトレーニング例、すなわちクリーンなラベルを持つにもかかわらず発生します!
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:57:21 GMT)
The Implicit Bias of Structured State Space Models Can Be Poisoned With Clean Labels [11.3] 以前の研究は、構造化状態空間モデル(SSM)の暗黙のバイアスは、低次元の教師によってデータが生成される環境での一般化につながると主張した。
暗黙のバイアスは、多くのトレーニングデータの選択の下で一般化につながるが、トレーニングに含めると暗黙のバイアスが完全に歪む特別な例が存在することを証明している。
この失敗は、教師によってラベル付けされている特別なトレーニング例、すなわちクリーンなラベルを持つにもかかわらず発生します!
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:57:21 GMT)
ChuLo: Chunk-Level Key Information Representation for Long Document Processing [11.3] ChuLoは長い文書分類のための新しいチャンク表現法である。
提案手法は,情報損失を最小限に抑え,トランスフォーマーモデルの有効性を向上させる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:53:58 GMT)
CCI3.0-HQ: a large-scale Chinese dataset of high quality designed for pre-training large language models [11.3] CCI3.0-HQは、中国企業インターネット 3.0(CCI3.0)の高品質500GBサブセットであり、新しい2段階ハイブリッドフィルタリングパイプラインを用いて開発されている。
我々は、さまざまなデータセットにまたがる100Bトークンのスクラッチから0.5Bパラメータモデルをトレーニングし、ゼロショット設定で10のベンチマークで優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:50:07 GMT)
A contrastive-learning approach for auditory attention detection [11.3] 本稿では,参加音声信号の潜在表現と対応する脳波信号との差を最小化するために,自己教師付き学習に基づく手法を提案する。
この結果と以前に公表した手法を比較し,検証セット上での最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:13:53 GMT)
Nanoscale magnetic ordering dynamics in a high Curie temperature ferromagnet [11.2] 温度依存性のナノスケール磁気テクスチャのクラスター分析では, 相関長が$mathrmT_c$付近に分散した3次元クラスを指す。
この結果は, 臨界挙動の静的および動的側面の両方を捉え, 磁性材料の相転移を司る普遍性について考察した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:56:32 GMT)
Scale-tailored localization and its observation in non-Hermitian electrical circuits [11.2] 本研究では,長距離非対称結合に係わる新たな局所化現象を,スケール・テーラード・ローカライゼーション(scale-tailored localization)と呼ぶ。
長距離結合は、格子上に複数の連結経路を作成することにより、エネルギースペクトルと固有状態を根本的に再結合することを示す。
可変電圧フォロワとスイッチを用いた非エルミート電気回路におけるスケール調整型ローカライゼーションの実験的検討を行った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:31:18 GMT)
Knowledge-Assisted Privacy Preserving in Semantic Communication [11.2] 本稿では,SCネットワークにおけるデータプライバシ向上のための知識の活用について検討する。
まず、知識の分析に基づいてSCにおける攻撃の可能性を特定する。
本稿では、ソースメッセージを正確にエンコードし復号するためのデータ伝送層からなる、知識支援型プライバシ保護SCフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:05:20 GMT)
Characterizing Physician Referral Networks with Ricci Curvature [11.1] 本稿では,ネットワークの幾何学的トポロジカルな特性である曲率の新しい応用法をPhysian Referral Networksに導入する。
ネットワーク構造の表現力で知られているForman-RicciとOllivier-Ricciの曲率測定は,医療効果の変動を検出する上で有望な指標であることがわかった。
我々はまた、Ricci曲率やその他のネットワーク機能を利用したオープンソースツールであるAPPARENTを、地域物理学的参照ネットワーク構造、地域国勢調査データ、医療効果、患者結果の相関関係を調べるために提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:39:20 GMT)
G2D: From Global to Dense Radiography Representation Learning via Vision-Language Pre-training [10.8] 我々は、textbfDenseレベル表現学習(G2D)のための、textbfGlobalという新しい医用ビジョン言語事前学習フレームワークを提案する。
G2Dは,大域的視覚言語アライメントと並行して,擬似セグメンテーションタスクを通じて,密で意味的な画像表現を学習する。
G2Dは、6つの医療画像タスクと25の疾患、特にセマンティックセグメンテーションにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:01:44 GMT)
SAMG: State-Action-Aware Offline-to-Online Reinforcement Learning with Offline Model Guidance [10.8] 我々は,SAMGと呼ばれる新しいパラダイムを導入する: オフラインモデルガイダンスを用いたステート・アクション・コンディショナル・オフライン・オンライン強化学習。
オフラインデータを直接トレーニングするのではなく、SAMGはトレーニング済みのオフライン評論家を凍結して、各ステートアクションペアのオフライン値を提供して、コンパクトなオフライン情報を提供する。
このフレームワークでは、オフラインモデルのこれらの値を凍結して活用することで、オフラインデータで再トレーニングする必要がなくなる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:35:02 GMT)
SCANet: Correcting LEGO Assembly Errors with Self-Correct Assembly Network [10.8] 単一ステップのアセンブリエラー訂正タスクでは、誤って組み立てられたコンポーネントを特定し、修正する。
自己整合アセンブリネットワーク(SCANet)は、組み立てたコンポーネントをクエリとして扱い、手動画像の正確性を判断し、必要に応じて修正する。
結果は、SCANetがMEPNetの誤組立結果を識別し、修正できることを示し、アセンブリの正確性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:59:25 GMT)
Label Set Optimization via Activation Distribution Kurtosis for Zero-shot Classification with Generative Models [10.7] In-context Learning (ICL) のパフォーマンスは、迅速な設計に敏感だが、ゼロショット分類におけるクラスラベルオプションの影響は概ね見過ごされている。
本研究は,ラベルオプションがゼロショットICL分類性能にどのように影響するかを総合的に調査した最初の事例である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:59:23 GMT)
Evolution with Opponent-Learning Awareness [10.7] 学習エージェントの多種多様な集団が通常のゲームでどのように進化するかを示す。
進化シミュレーションに適した対向学習意識の高速で並列化可能な実装を導出する。
我々は,Hawk-Dove,Stag-Hunt,Rock-Paper-Scissorsの古典ゲームにおいて,20万エージェントのシミュレーションでアプローチを実証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:03:36 GMT)
Highly efficient non-rigid registration in k-space with application to cardiac Magnetic Resonance Imaging [10.6] 非剛性動作推定のためのローカル・オール・パス・アテンション・ネットワーク(LAPANet)と呼ばれる,自己教師型深層学習に基づく新しいフレームワークを提案する。
LAPANetは,種々のサンプリング軌跡と加速度速度で心運動推定を行った。
非剛性運動に対する高時間分解能(5ミリ秒未満)は、動的およびリアルタイムMRIアプリケーションにおける動きの検出、追跡、修正のための新しい道を開く。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:19:59 GMT)
RegExplainer: Generating Explanations for Graph Neural Networks in Regression Tasks [10.5] グラフ回帰モデル(XAIG-R)を解釈する新しい説明法を提案する。
本手法は分散シフト問題と連続順序決定境界問題に対処する。
回帰タスクにおいて連続的に順序付けられたラベルに取り組むための自己教師型学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:11:13 GMT)
Scalable Multi-Domain Adaptation of Language Models using Modular Experts [10.4] MoDEは、モジュール化されたドメインの専門家による一般的なPLMを強化する、エキスパートの混成アーキテクチャである。
MoDEは完全なパラメータの微調整に匹敵する目標性能を達成し、保持性能は1.65%向上した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:04:57 GMT)
Scalable Multi-Domain Adaptation of Language Models using Modular Experts [10.4] MoDEは、モジュール化されたドメインの専門家による一般的なPLMを強化する、エキスパートの混成アーキテクチャである。
MoDEは完全なパラメータの微調整に匹敵する目標性能を達成し、保持性能は1.65%向上した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:04:57 GMT)
WAFFLE: Multi-Modal Model for Automated Front-End Development [10.3] We introduced Waffle, a new fine-tuning strategy that using a structure-ware attention mechanism to improve LLMs's understanding of HTML's structure。
Waffleで微調整されたモデルでは、HTMLマッチが9.00pp(パーセント)、CW-SSIMが0.0982、CLIPが32.99pp、LLEMが27.12ppである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:49:49 GMT)
Learning Structured Compressed Sensing with Automatic Resource Allocation [10.3] 多次元データ取得には時間を要することが多く、ハードウェアやソフトウェアにとって大きな課題となる。
情報理論に基づく教師なし学習戦略を用いたSCOSARA(Structured Compressed Sensing with Automatic Resource Allocation)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:53:33 GMT)
Learning Mathematical Rules with Large Language Models [10.3] 本研究では,分散性や方程式の単純化など,特定の数学的規則を学習する大規模言語モデルの能力について検討する。
本稿では、これらのルールを一般化する能力と、単語問題を文脈で再利用する能力を実証的に分析する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:49:03 GMT)
Dynamic 3D Gaussian Tracking for Graph-Based Neural Dynamics Modeling [10.2] マルチビューRGBビデオからオブジェクトダイナミクスを直接学習するフレームワークを導入する。
グラフニューラルネットワークを用いて粒子ベース力学モデルを訓練する。
本手法は,初期設定の異なる物体の動きやロボットの動作を予測できる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:02:52 GMT)
Active Label Refinement for Robust Training of Imbalanced Medical Image Classification Tasks in the Presence of High Label Noise [10.2] 雑音ラベル(LNL)とアクティブラーニングを組み合わせた2段階のアプローチを提案する。
提案手法は,少数クラスからのクリーンなサンプルをノイズの多いサンプルとして誤識別しないことで,クラス不均衡を扱う従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:59:27 GMT)
Active Label Refinement for Robust Training of Imbalanced Medical Image Classification Tasks in the Presence of High Label Noise [10.2] 雑音ラベル(LNL)とアクティブラーニングを組み合わせた2段階のアプローチを提案する。
提案手法は,少数クラスからのクリーンなサンプルをノイズの多いサンプルとして誤識別しないことで,クラス不均衡を扱う従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:59:27 GMT)
CAMEL-Bench: A Comprehensive Arabic LMM Benchmark [10.2] 我々は,4億人以上の話者を対象とするアラビア語の総合的LMM評価ベンチマークを開発した。
提案するベンチマークは,マルチイメージ理解,複雑な視覚知覚,手書き文書理解,ビデオ理解,医用画像,植物病,リモートセンシングによる土地利用理解を含む8つのサブドメインと38のサブドメインから構成される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:38 GMT)
ArterialNet: Reconstructing Arterial Blood Pressure Waveform with Wearable Pulsatile Signals, a Cohort-Aware Approach [10.2] ArterialNetは、一般化されたパルサタイル-ABP信号変換と、ハイブリッド損失関数と正規化を用いたパーソナライズされた特徴抽出を統合している。
我々はMIMIC-IIIデータセットを用いてArterialNetを検証し,少なくとも標準偏差が58%低い5.41 mmHgの根平均二乗誤差(RMSE)を達成した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:35:23 GMT)
We Augmented Whisper With kNN and You Won't Believe What Came Next [10.2] 変換器のエンドツーエンド音声モデルであるWhisperが$k$NNの恩恵を受けていることを示す。
話者適応の意義について議論し、性別、アクセント、年齢による改善を分析した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:32:52 GMT)
Model Collapse in the Self-Consuming Chain of Diffusion Finetuning: A Novel Perspective from Quantitative Trait Modeling [10.2] 生成モデルは、出力が実際のデータと区別できないユニークなしきい値に達した。
トレーニングと生成の繰り返しループが発生すると、パフォーマンスの深刻な劣化が観察されている。
本稿では,遺伝子変異に触発された簡便かつ効果的な方法として,再利用可能な拡散微細構造(ReDiFine)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:03:46 GMT)
PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures [10.0] 実PIMシステム上でグラフニューラルネットワークを高速化する,効率的なMLライブラリであるPyGimを紹介する。
我々は、計算集約型およびメモリ集約型カーネルをプロセッサ中心およびメモリ中心のシステムで実行するハイブリッドGNN実行を提供する。
我々は、1992年のPIMコアを持つ実世界のPIMシステム上で、新しいGNNモデルを用いてPyGimを広範囲に評価し、Intel Xeonの最先端CPUを平均3.04倍に上回っていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:44:49 GMT)
Multi-objective Optimization in CPU Design Space Exploration: Attention is All You Need [10.0] 設計空間探索(DSE)により、建築家は様々な設計オプションを体系的に評価できる。
現代のCPUは、マイクロアーキテクチャパラメータの数を劇的に増加させ、全体的な設計空間を拡大した。
本研究では,アテンションDSEを導入し,アテンション機構を用いてマイクロアーキテクチャパラメータを直接マッピングし,予測性能を推定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:20:17 GMT)
Link, Synthesize, Retrieve: Universal Document Linking for Zero-Shot Information Retrieval [9.8] 本稿では,複数のデータセットにまたがる合成クエリ生成を促進するために,類似文書をリンクするUniversal Document Linking (UDL)アルゴリズムを提案する。
我々の実証研究は、多種多様なデータセットとIRモデルにまたがるUDLの有効性と普遍性を実証し、ゼロショットの場合の最先端手法を超越した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:52:19 GMT)
PRISM: A Methodology for Auditing Biases in Large Language Models [9.8] PRISMは、大規模言語モデルを監査するための柔軟な調査ベースの方法論である。
優先事項を直接調査するのではなく、タスクベースの調査を通じて間接的にこれらのポジションを照会しようとする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:57:20 GMT)
ServeFlow: A Fast-Slow Model Architecture for Network Traffic Analysis [9.5] ServeFlowは、ネットワークトラフィック分析タスクを対象とした機械学習モデルのソリューションである。
収集するパケットの数と、個々のフローに適用するモデルを選択して、最小のレイテンシ、高いサービスレート、高い精度のバランスを実現する。
16ms以下では76.3%のフローで推論が可能で、これは中央のエンドツーエンドのサービスレイテンシでは40.5倍のスピードアップである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:15:42 GMT)
From Blind Solvers to Logical Thinkers: Benchmarking LLMs' Logical Integrity on Faulty Mathematical Problems [9.5] 本稿では,豊富な多様性の数学問題を含むベンチマークデータセットであるFactyMathを提案する。
我々は、オープンソース、クローズドソース、数学特化モデルを含む幅広いモデルについて評価する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:10:39 GMT)
Panoptic-FlashOcc: An Efficient Baseline to Marry Semantic Occupancy with Panoptic via Instance Center [9.3] 我々は,リアルタイムなパノプティクスの占有を可能にする,単純かつ堅牢な2D機能フレームワークであるPanoptic-FlashOccを提案する。
本手法では,単一ネットワークにおけるセマンティック占有とクラス対応インスタンスクラスタリングを同時に学習する。
Panoptic-FlashOccは、汎視的占有率予測における顕著な成果を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:21:13 GMT)
AIM: Automated Input Set Minimization for Metamorphic Security Testing [9.2] 脆弱性検出機能を保ちながら、テストコストを削減するために入力を自動的に選択するアプローチであるAIMを提案する。
AIMにはクラスタリングベースのブラックボックスアプローチが含まれており、セキュリティ特性に基づいて同様の入力を識別する。
また、コストを最小化しながら、多様な入力を効率的に選択する新しい遺伝的アルゴリズムにも依存している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:13:48 GMT)
EchoApex: A General-Purpose Vision Foundation Model for Echocardiography [9.2] 本稿では,初の汎用視覚基礎モデルであるEchoApexを紹介し,様々な臨床応用について紹介する。
自己教師付き学習を活用して、EchoApexは11の臨床センターから2000万以上のエコー画像に事前訓練されている。
最先端のタスク固有のモデルと比較すると、EchoApexは統一されたイメージエンコーディングアーキテクチャでパフォーマンスが改善されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:57:00 GMT)
Assessing the Creativity of LLMs in Proposing Novel Solutions to Mathematical Problems [9.2] 本研究では,Large Language Models (LLMs) の数学的推論における創造的可能性について検討する。
本稿では,中学のカリキュラムからオリンピックレベルの競技までを含む新しいフレームワークとベンチマークであるCreativeMathを紹介する。
実験の結果, LLMは標準的な数学的なタスクではうまく機能するが, 創造的な問題解決能力は著しく異なることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:12:49 GMT)
A Survey of AI-Generated Video Evaluation [9.1] この調査はAI-Generated Video Evaluation(AIGVE)の新たな分野を特定する。
我々は,映像コンテンツの複雑さを扱える,より堅牢でニュアンスの高い評価フレームワークの開発を提唱する。
本調査は,産学界の研究者と産学界の実践者の両方にとって基礎的な知識基盤を確立することを目的としている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:08:39 GMT)
Creating and Repairing Robot Programs in Open-World Domains [8.9] 本稿では,プログラムの実行をエラーまで追跡し,繰り返し動作を最小限に抑えるLLM生成リカバリプログラムを実行するシステムを提案する。
我々は、回復プログラムの生成を必要とする様々なエラー条件を持つ11のタスクからなるベンチマークを作成する。
回収プログラムの効率を将来のエラーを予知する託宣で構築した計画と比較する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:30:14 GMT)
Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints [8.8] 線形制約が未知の多腕バンディットにおける純粋探索として問題を研究する。
まず、制約下での純粋な探索のために、サンプルの複雑さを低く抑えたラグランジアン緩和を提案する。
第二に、ラグランジアンの下界と凸の性質を利用して、トラック・アンド・ストップとガミファイド・エクスプローラー(LATSとLAGEX)の2つの計算効率の良い拡張を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:26:14 GMT)
System Safety Monitoring of Learned Components Using Temporal Metric Forecasting [8.8] 学習可能な自律システムにおいて、学習したコンポーネントの安全性監視は、その出力がシステムの安全性違反に結びつかないことを保証するために不可欠である。
本稿では,確率的時系列予測に基づく安全監視手法を提案する。
安全度と違反予測精度を実証的に評価し、4つの最先端モデルの推論遅延とリソース使用率について検討した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:49:11 GMT)
How much does AI impact development speed? An enterprise-based randomized controlled trial [8.8] 複雑なエンタープライズレベルのタスクに開発者が費やす時間に対する3つのAI機能の影響を見積もる。
また、コード関連のアクティビティに1日あたり何時間も費やす開発者は、AIがより速くなるという興味深い効果も見出しました。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:40:08 GMT)
An Open-Source Data Storage and Visualization Platform for Collaborative Qubit Control [8.7] 量子コンピューティング研究の要求に応えるために設計されたQubiCSV(Qubit Control Storage and Visualization)を紹介した。
オープンソースツールであるQubiCSVは、量子コンピューティングの効率的なデータ管理を容易にする。
複雑な量子実験を解釈し、量子ビット性能を最適化するために、洞察に富んだ可視化が開発された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:46:22 GMT)
IRCNN$^{+}$: An Enhanced Iterative Residual Convolutional Neural Network for Non-stationary Signal Decomposition [8.7] 反復残差畳み込みニューラルネットワーク(IRCNN)という新しい手法を提案する。
IRCNNは既存の手法よりも安定した分解を実現するが、計算コストの低い大規模信号のバッチ処理も行う。
本研究では,深層学習と最適化のいくつかの手法を駆使して,IRCNNをさらに改良することを目的としている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:05:54 GMT)
HorGait: Advancing Gait Recognition with Efficient High-Order Spatial Interactions in LiDAR Point Clouds [8.6] HorGaitは、LiDARからの3Dポイント雲の平面投影における歩行認識のためのTransformerアーキテクチャを備えたハイブリッドモデルである。
SUSTech1Kデータセット上のTransformerアーキテクチャメソッド間の最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:59:45 GMT)
HorGait: A Hybrid Model for Accurate Gait Recognition in LiDAR Point Cloud Planar Projections [8.6] HorGaitは、LiDARからの3Dポイント雲の平面投影における歩行認識のためのTransformerアーキテクチャを備えたハイブリッドモデルである。
SUSTech1Kデータセット上のTransformerアーキテクチャメソッド間の最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:59:45 GMT)
Exploiting Interpretable Capabilities with Concept-Enhanced Diffusion and Prototype Networks [8.4] 既存のアーキテクチャに概念情報を組み込んだ、概念に富んだモデルを作成します。
特に,概念の視覚的表現を生成できる概念誘導拡散条件と,概念誘導型プロトタイプネットワークを提案する。
これらの結果は、機械学習をより人間に理解しやすいものにするために、既存の情報を活用することによって、新たな研究の行を開放する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:07:56 GMT)
Conditional diffusions for neural posterior estimation [8.4] NPEの正規化フローの代替として条件拡散の有効性を示す。
その結果,より単純で浅いモデルであっても,安定性の向上,精度の向上,トレーニング時間の短縮が得られた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:13:13 GMT)
From Imitation to Introspection: Probing Self-Consciousness in Language Models [8.4] 自己意識は自己の存在と思考の内省である。
本研究は,言語モデルに対する自己意識の実践的定義を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:08:17 GMT)
1D Spontaneous Symmetry Breaking in thermal equilibrium via Non-Hermitian Construction [8.2] 自発的対称性の破れは、一般的に熱平衡における局所的な相互作用を持つ一次元系を回避している。
局所非エルミート構造を用いて一次元エルミートモデルの圏を解析する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:00:41 GMT)
GrammaMT: Improving Machine Translation with Grammar-Informed In-Context Learning [8.2] GrammaMTは、Interlinear Glossed Text (IGT) を用いた機械翻訳のための文法的に認識可能なプロンプト手法である
GrammaMTは、グロスショット、チェーングロス、モデルグロスの3つのプロンプト戦略を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:56:01 GMT)
Environment Maps Editing using Inverse Rendering and Adversarial Implicit Functions [8.2] 逆微分可能レンダリングアーキテクチャを用いたハイダイナミックレンジ環境マップの編集は複雑な逆問題である。
そこで本研究では,HDR環境マップを識別可能なレンダリングを用いて編集し,空間性や値のばらつきに対処する手法を提案する。
我々の手法は、新しい光源でレンダリングされた環境マップを推定するなど、興味深いタスクへの道を開くことができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:27:29 GMT)
On the Expressive Power of Tree-Structured Probabilistic Circuits [8.2] 我々は、$n$変数に対して、同じ確率分布を計算する同値木の大きさに準多項式上界$nO(log n)$が存在することを示す。
また,木面の深さ制限を考慮すれば,木面とDAG構造PCとの間には超ポリノミカルな分離が存在することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:15:42 GMT)
On the Expressive Power of Tree-Structured Probabilistic Circuits [8.2] 我々は、$n$変数に対して、同じ確率分布を演算する等価木の大きさに、部分指数上界$nO(log n)$が存在することを示す。
また,木面の深さ制限を考慮すれば,木面とDAG構造PCとの間には超ポリノミカルな分離が存在することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:15:42 GMT)
Review of wavelet-based unsupervised texture segmentation, advantage of adaptive wavelets [8.1] 経験的ウェーブレットの適応性は,従来のウェーブレットよりも優れた結果が得られることを示す。
提案手法は,一般的なテクスチャ画像に基づいて,6つの古典的ベンチマークで検証される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:48:28 GMT)
Learning Coupled Subspaces for Multi-Condition Spike Data [8.1] 神経科学では、研究者は複数の条件下で実験を行い、高次元スパイクトレインデータセットの形で神経応答を得る。
実験条件空間上でスムーズなチューニング関数を学習するための非パラメトリックベイズ手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:44:28 GMT)
Search-Based Path Planning among Movable Obstacles [8.0] 本稿では,2つのPAMOの定式化について述べる。
完全性と解の最適性を保証する検索手法であるPAMO*を開発し,その2つの問題を解決する。
次に、PAMO* をハイブリッド状態 PAMO* に拡張し、ロボットとオブジェクト間の高忠実な相互作用を持つ連続空間で計画する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:02:58 GMT)
Gradient-based Discrete Sampling with Automatic Cyclical Scheduling [8.0] マルチモーダル離散分布における効率的かつ正確なサンプリングのための自動循環スケジューリングを提案する。
一般離散分布における非漸近収束と推論保証の証明を行う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:01:24 GMT)
Assured Automatic Programming via Large Language Models [8.0] 我々は,その意図に適合するコードを生成しつつ,プログラマの意図を発見することを目的としている。
本研究の目的は,ユーザ意図の理解を深めることによって,プログラム,仕様,テスト間の一貫性を実現することである。
提案手法によって発見された曖昧な意図が,検証可能な自動生成プログラムの割合をいかに高めるかを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:29:15 GMT)
Hierarchical Multi-agent Reinforcement Learning for Cyber Network Defense [8.0] 本稿では,サイバー防御タスクをネットワーク調査やホストリカバリといった特定のサブタスクに分解する階層的PPOアーキテクチャを提案する。
我々のアプローチは、ドメインの専門知識が強化されたPPOを使用して、各サブタスクのサブ政治を訓練することである。
これらのサブ政治は、複雑なネットワーク防御タスクを解決するためにそれらの選択を調整するマスターディフェンスポリシーによって活用される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:57:45 GMT)
Zero-shot Persuasive Chatbots with LLM-Generated Strategies and Information Retrieval [7.9] 説得は、健康介入から社会的善の促進まで幅広い応用において重要な役割を担っている。
社会的善のために責任を負うような説得力のあるチャットボットは、肯定的な個人的および社会的変化の実現要因となる。
本稿では,多言語モデル(LLM)に基づくゼロショットチャットボットPersuaBotを提案する。
シミュレーションおよび人的会話実験により、ゼロショットアプローチは従来の作業よりも説得力があり、最先端の知識指向チャットボットを超越した事実的精度を実現していることが示された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:03:21 GMT)
Inherently Interpretable Tree Ensemble Learning [7.9] 浅い決定木をベース学習として使用すると、アンサンブル学習アルゴリズムが本質的に解釈可能であることを示す。
木アンサンブルを固有の解釈可能性を持つ機能的ANOVA表現に変換する解釈アルゴリズムを開発した。
シミュレーションと実世界のデータセットを用いた実験により,提案手法はモデル解釈と予測性能のトレードオフを良くすることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:58:41 GMT)
DFEPT: Data Flow Embedding for Enhancing Pre-Trained Model Based Vulnerability Detection [7.8] 本稿では,脆弱性検出タスクにおける事前学習モデルの性能向上を目的としたデータフロー埋め込み手法を提案する。
具体的には,関数レベルのソースコードからデータフローグラフを解析し,DFGのノード特性として変数のデータ型を使用する。
我々の研究は、DFEPTが事前訓練されたモデルに効果的な脆弱性セマンティック情報を提供し、Devignデータセットで64.97%、Revealデータセットで47.9%のF1スコアを達成できることを示している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:05:07 GMT)
Research on Key Technologies for Cross-Cloud Federated Training of Large Language Models [7.8] クロスクラウドフェデレーショントレーニングは、単一のクラウドプラットフォームのリソースボトルネックに対処するための、新たなアプローチを提供する。
本研究では、データパーティショニングと分散、通信最適化、モデル集約アルゴリズム、異種クラウドプラットフォームとの互換性など、クロスクラウドフェデレーショントレーニングの重要技術について分析する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:57:17 GMT)
Effects of Scale on Language Model Robustness [7.7] 逆向きに訓練された大規模モデルは、より小さなモデルと比較して、訓練中に見えないような攻撃に対して、より速く、より良く一般化できることが示される。
また、計算量の増加による悪用/防御のバランスを分析し、ある設定で同等性を見つけ、他の設定で悪用する利点を見つけます。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:40:06 GMT)
Homomorphism Counts as Structural Encodings for Graph Learning [7.7] Graph Transformerは、よく知られたTransformerアーキテクチャをグラフドメインに拡張する、人気のあるニューラルネットワークである。
グラフ準同型をカウントした柔軟で強力な構造的符号化フレームワークとして、$textitmotif Structure encoding$ (MoSE)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:09:01 GMT)
CountCrypt: Quantum Cryptography between QCMA and PP [7.4] 我々は、BQP = QCMAであるが量子計算古典通信鍵交換、QCCCコミットメント、および2ラウンドの量子鍵分布が存在する量子オラクルを構築する。
また、QCCC鍵交換、QCCCコミットメント、および2ラウンドの量子鍵分布が、すべて片道パズルの構築に利用できることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:23:39 GMT)
Boosting X-formers with Structured Matrix for Long Sequence Time Series Forecasting [7.4] 本稿では,Surrogate Attention Blocks (SAB)とSurrogate Feed-Forward Neural Network Blocks (SFB)を統合してトランスフォーマーモデルを強化する新しいアーキテクチャフレームワークを提案する。
5つの異なる時系列タスクにわたる9つのトランスフォーマー変種の実験では、平均性能は9.45%向上し、モデルサイズは46%減少した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:52:17 GMT)
Applying Neural Monte Carlo Tree Search to Unsignalized Multi-intersection Scheduling for Autonomous Vehicles [7.3] 本稿では,車両のプラトンからの道路空間予約要求と競合する可能性のある道路空間予約要求のシーケンスを,ボードゲームのような一連の問題にマッピングする変換モデルを提案する。
我々はNMCTSを用いて、過去のアロケーションの文脈で最適な道路空間割り当てスケジュールを表すソリューションを探索する。
提案手法は,全交差点がPNMCTSの制御下にある場合,平均走行時間74.5%,総スループット16%のPNMCTSおよび最先端のRLベースのトラヒックライトコントローラよりも高い性能を示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:37:55 GMT)
Critical biblical studies via word frequency analysis: unveiling text authorship [7.3] 私たちは、聖書の最初の9冊にまたがる多くの章にまたがる3つの異なる著者を区別することを目指しています。
我々の分析は、最初の2人の著者(DとDtrH)が、専門家の評価と一致した事実であるPよりもはるかに密接な関係があることを示唆している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:08:38 GMT)
Neural-Rendezvous: Provably Robust Guidance and Control to Encounter Interstellar Objects [7.2] 本稿では、高速移動物体に遭遇するためのディープラーニングに基づくガイダンスおよび制御フレームワークであるNeural-Rendezvousを提案する。
スペクトル正規化ディープニューラルネットワークによってモデル化されたガイダンスポリシの上に、ポイントワイズで最小限のノルムトラッキング制御を使用する。
ニューラルレンデブースは、期待される宇宙船の配送誤差に比例して高い確率指数を与えることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:01:12 GMT)
Segmentation-aware Prior Assisted Joint Global Information Aggregated 3D Building Reconstruction [6.8] マルチビューステレオは、3Dモデリング、精密なエンジニアリングサーベイ、定量的分析、モニタリングとメンテナンスを促進することで、土木工学において重要な役割を担っている。
しかし,Multi-View Stereoアルゴリズムは,大規模ビルディングシーン内の弱テクスチャ領域を再構築する際の課題に直面している。
これらの領域では、画素のステレオマッチングがしばしば失敗し、不正確な深さ推定につながる。
本稿では,弱テクスチャ領域を正確に分割し,その平面前処理を高精度に構築するアルゴリズムを提案する。
この関数は、深さ推定更新プロセス中に幾何学的整合性に制約された事前候補セットのグローバル情報に基づいて最適平面事前情報を選択する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:59:44 GMT)
Whose fault is it anyway? SILC: Safe Integration of LLM-Generated Code [6.8] 本稿では,障害のローカライズのためのフレームワークであるSILCを提案し,メモリ問題を防止するための衛生義務を割り当てる。
特に,自動生成コードにおける暗黙的な非機能仮定を自動的に抽出する上で,不正確性ロジックが果たす役割を示す。
我々は、AIアシスタントが安全でないコードを生成することを実証的に示し、適切な非難と衛生義務を提案する上での我々のフレームワークの有用性を実証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:59:05 GMT)
3D Shape Completion with Test-Time Training [6.8] 署名された距離関数(DeepSDF)の予測に関する関連する研究によって動機付けられたデコーダネットワークを用いる。
断裂した部分への過度な適合は,ShapeNetデータセットの8つの異なる形状カテゴリーを,そのチャムハ距離で復元する上で大きな改善をもたらすことを実証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:59:32 GMT)
Optimizing Edge Offloading Decisions for Object Detection [6.7] 組込みデバイスが搭載オブジェクト検出器に依存しているシナリオを考えるが、より強力なエッジサーバに検出をオフロードするオプションがある。
我々のゴールは、リソース制約下での全体的な検出精度を最大化するために、どのイメージをオフロードするかを特定することである。
本稿では,個々の画像のオフロードによる潜在的な精度向上を定量化する報奨基準を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:09:37 GMT)
Least Squares Regression Can Exhibit Under-Parameterized Double Descent [6.6] 本研究では,学習データ点数,パラメータ数,モデルの一般化能力の関係について検討する。
ピークの位置は、スペクトルとサンプル共分散の固有ベクトルの両方の技術的性質に依存すると仮定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:32:20 GMT)
RediSwap: MEV Redistribution Mechanism for CFMMs [6.5] アプリケーションレベルでの最大抽出可能価値(MEV)の取得と,ユーザおよび流動性プロバイダ間での返金を目的とした,新たなAMMであるRediSwapを紹介した。
RediSwapの中核となるのは、AMMプール内の調停機会を管理するMEV再分配機構である。
我々は、我々のメカニズムがインセンティブに適合し、シビルに耐性があることを証明し、仲裁者が容易に参加できることを証明した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:11:41 GMT)
Using Parametric PINNs for Predicting Internal and External Turbulent Flows [6.4] 提案するRANS-PINNフレームワークは,シリンダー上の流れの予測にのみ焦点をあてたものである。
本研究では,内流と外流の双方に対して,関連する乱流変数を予測する際の精度について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:08:20 GMT)
STTATTS: Unified Speech-To-Text And Text-To-Speech Model [6.3] マルチタスク学習目標と共有パラメータを用いて, ASR と TTS を協調的に学習するためのパラメータ効率のよい手法を提案する。
評価の結果,マルチタスクモデルの性能は,個別に訓練したモデルに匹敵することがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:04:24 GMT)
Distribution-Aware Compensation Design for Sustainable Data Rights in Machine Learning [6.3] 本稿では,この課題をゲーム理論のレンズを通して見る革新的なメカニズムを提案する。
本手法は,包括的解析モデルによるデータ除去の波及効果を定量的に評価する。
我々は,主観的効用とシステム成果を測定する数学的基盤を確立する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:25:51 GMT)
DDF: A Novel Dual-Domain Image Fusion Strategy for Remote Sensing Image Semantic Segmentation with Unsupervised Domain Adaptation [6.2] 非教師なしドメイン適応(UDA)は、対象ドメインからの未分類情報を組み込む際に有利であることが証明されている。
本稿では,新しいデュアルドメイン画像融合戦略とともに,ハイブリッドトレーニング戦略を提案する。
提案手法の有効性は,ISPRS Vaihingen および Potsdam データセットを用いて行った広範囲なベンチマーク実験およびアブレーション研究によって実証された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:01:09 GMT)
Precision Soil Quality Analysis Using Transformer-based Data Fusion Strategies: A Systematic Review [6.2] 本稿では,農業リモートセンシング(RS)におけるトランスフォーマーを用いたデータ融合技術の最近の進歩を概観する。
2022年以降、トランスフォーマーは従来のディープラーニングと機械学習の手法を大きく上回っていることを実証した。
このレビューは、作物の生産性を最適化し、持続可能な農業慣行を確実にする上で、土壌条件の重要性から、特に土壌分析に焦点を当てている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:26:21 GMT)
Planning in a recurrent neural network that plays Sokoban [6.1] ニューラルネットワークが新しい状況にどのように一般化するかは、計画プロセスを通じて行動的を選択することを学習したかどうかに依存する。
我々は、Skobanをプレイするように訓練された繰り返しNNが計画しているように見え、RNNの成功率を改善する余分な計算ステップが得られた。
モデル手術を行い、畳み込みNNが10×10のアーキテクチャ限界を超えて一般化できるようにする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:06:19 GMT)
Learn 2 Rage: Experiencing The Emotional Roller Coaster That Is Reinforcement Learning [6.0] この研究は、AIcrowdが主催するLearn To Race Autonomous Racing Virtual Challenge 2022で優勝したチームの実験とソリューションの概要を示します。
Learn-to-Raceコンペティションの目的は、自動運転の安全性のメリットを達成することに焦点を当て、自動運転技術の境界を推し進めることである。
SAC(Soft Actor Critic)の変種の実装に焦点をあてた。
私たちのゴールは、視覚的特徴と幾何学的特徴のみからレースカーの非自明な制御を学習し、ピクセルを直接制御アクションにマッピングすることでした。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:16:52 GMT)
Binary Classification: Is Boosting stronger than Bagging? [5.9] 本稿では,バニラ・ランダム・フォレストの拡張である拡張ランダム・フォレストを紹介し,付加機能と適応サンプルおよびモデル重み付けについて述べる。
トレーニングサンプルの重み付けを適応するための反復アルゴリズムを開発し、最も難しい例を選好し、新しいサンプルごとに個別の木の重み付け手法を見つけるためのアプローチを開発した。
本手法は15の異なる二分分類データセットにまたがる通常のランダムフォレストを著しく改善し,XGBoostを含む他の木法よりも優れていた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:22:33 GMT)
Predicting Liquidity Coverage Ratio with Gated Recurrent Units: A Deep Learning Model for Risk Management [5.9] 本稿では、金融機関が流動性リスクをより効果的に管理できるように、ゲートリカレントユニット(GRU)ネットワークに基づく流動性カバレッジ比(LCR)予測モデルを提案する。
ディープラーニング技術におけるGRUネットワークを利用することで、モデルは過去のデータから複雑なパターンを自動的に学習し、将来しばらくの間LCRを正確に予測することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:43:50 GMT)
An LLM Agent for Automatic Geospatial Data Analysis [5.8] 大規模言語モデル(LLM)は、データサイエンスコード生成タスクで使われている。
複雑なデータ構造と空間的制約を組み込むのが困難であるため,空間空間データ処理への応用は困難である。
ジオアジェント(GeoAgent)は,LLMが地理空間データ処理をより効率的に処理できるように設計された対話型フレームワークである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:47:25 GMT)
Capsule Endoscopy Image Enhancement for Small Intestinal Villi Clarity [5.8] 本稿では,Wireless Capsule Endoscopy (WCE)画像における小腸ビリの明瞭度向上を目的とした画像強調手法を提案する。
実験により,WCE画像強調法と比較すると,本手法は小腸ビリル像の縁部の詳細をアクセントするだけでなく,ノイズ増幅を巧みに抑制することが明らかとなった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:09:35 GMT)
Low-Latency Video Anonymization for Crowd Anomaly Detection: Privacy vs. Performance [5.8] 本研究では,プライバシ保護とリアルタイムビデオ異常検出アプリケーションのための従来の匿名化ソリューションを再検討する。
本稿では,プライバシー保護を強化するために動的調整を施したVAD(LA3D)の軽量適応匿名化を提案する。
実験により, LA3Dは, VADの有効性を著しく低下させることなく, プライバシー匿名化能力を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:22:33 GMT)
FDF: Flexible Decoupled Framework for Time Series Forecasting with Conditional Denoising and Polynomial Modeling [5.8] 時系列予測は多くのWebアプリケーションにおいて不可欠であり、業界全体で重要な意思決定に影響を与える。
我々は拡散モデルが大きな欠点に悩まされていることを論じる。
予測性能を向上させるために,高品質な時系列表現を学習するフレキシブルデカップリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:27:06 GMT)
Attention-based Citywide Electric Vehicle Charging Demand Prediction Approach Considering Urban Region and Dynamic Influences [5.7] 電気自動車の充電需要予測のための注意に基づく異種データ融合手法(ADF)を提案する。
非ペアワイズ関係を学習するために、サービス領域を、その領域における関心点の種類と数によってクラスタ化する。
都市の異なる地域での予測結果に及ぼす動的影響の影響とクラスタリング手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:19:38 GMT)
ARBEx: Attentive Feature Extraction with Reliability Balancing for Robust Facial Expression Learning [5.6] ARBExはVision Transformerによって駆動される新しい注意的特徴抽出フレームワークである。
ラベル分布とマルチヘッド自己保持機構を備えた埋め込み空間において学習可能なアンカーポイントを用いて、弱い予測に対する性能を最適化する。
我々の戦略は、様々な文脈で実施された広範な実験により、現在の最先端の方法論よりも優れています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:32:17 GMT)
Classifier Clustering and Feature Alignment for Federated Learning under Distributed Concept Drift [5.6] 本研究では、条件分布が$P(Y|X)$変化する実ドリフトに焦点を当てる。
分類器クラスタリングと機能アライメントを備えたフェデレート学習フレームワークであるFedCCFAを提案する。
以上の結果から,FedCCFAは様々なコンセプトドリフト環境下での既存手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:04:52 GMT)
Provably Robust Watermarks for Open-Source Language Models [5.5] オープンソースの言語モデルに対する最初の透かし方式を紹介する。
我々のスキームはモデルのパラメータを変更することで機能するが、透かしはモデルの出力だけから検出できる。
おそらく驚くべきことに、我々の透かしは敵の知識に関する特定の仮定の下では取り除けないことを証明している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:44:34 GMT)
Causal Order Discovery based on Monotonic SCMs [5.5] 本稿では,根変数を反復的に検出することで因果順序を直接同定する新しいシーケンシャル手順を提案する。
この方法では、スパーシティ仮定と関連する最適化課題が不要になる。
本稿では,ルート変数の逐次探索におけるアプローチの有効性を,ヤコビアン空間を最大化する手法と比較する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:15:11 GMT)
Using Large Language Models to Generate Authentic Multi-agent Knowledge Work Datasets [5.5] 現在公開されている知識作業データコレクションには、多様性、豊富なアノテーション、ユーザとそのドキュメントに関するコンテキスト情報がない。
本稿では,我々のアプローチの設計とビジョンを紹介するとともに,大規模言語モデルを用いた知識ワーク文書の作成に焦点をあてる。
実際の文書の53%と74%を現実的に評価した人間レイパーによる調査は、我々のアプローチの可能性を実証している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:32:54 GMT)
AdaEDL: Early Draft Stopping for Speculative Decoding of Large Language Models via an Entropy-based Lower Bound on Token Acceptance Probability [5.4] AdaEDLは、静的なドラフト長の投機的デコーディングを10%から57%上回っている。
また、AdaEDLはこれらの技術よりも堅牢であり、高温シナリオにおける性能を保っていることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:13:43 GMT)
Equitable Federated Learning with Activation Clustering [5.1] フェデレートラーニング(Federated Learning)は、さまざまなクライアント間のコラボレーションを取り入れた、卓越した分散学習パラダイムである。
本稿では,クライアント同士の類似度に基づいて,クライアントを分類・クラスタ化する同値クラスタリングベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:36:39 GMT)
RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation [5.1] 本稿では,従来のリランカが行ったようなコンテキスト間の相対的関連性を提供する関連性推定器(RE)を提案する。
我々は,小型発電機(sLM)で訓練したREが,REとともに微調整されたsLMを改良するだけでなく,従来は未参照の大規模言語モデルも改善できることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:57:52 GMT)
Towards Personal Data Sharing Autonomy:A Task-driven Data Capsule Sharing System [5.1] 本稿では、個人データ共有自律性を実現するためのデータカプセルパラダイムに基づくタスク駆動型個人データ共有システムを提案する。
具体的には,データカプセルを独立かつセキュアな個人データストレージと共有のための最小単位とする,タンパー抵抗型データカプセルカプセルカプセル化法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:08:36 GMT)
Inverting Cryptographic Hash Functions via Cube-and-Conquer [5.1] Cube-and-Conquerは、MD4とMD5のステップレデュースバージョンに適用される。
第一のアルゴリズムはドブベルトの制約を徐々に修正することでMD4の逆問題を生成する。
第2のアルゴリズムは,キューブ・アンド・コンキュアのキューブ・アンド・コンキュアのカットオフしきい値の異なるキューブ・アンド・コンキュアのキューブ・フェーズを試行して,征服フェーズの最小実行時推定値を求める。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:43:53 GMT)
ConceptDrift: Uncovering Biases through the Lens of Foundational Models [5.0] 本研究では,線形プローブの重み解析手法であるConceptDriftを提案する。
提案手法の有効性を実証的に証明し, バイアス増進プロンプトによるゼロショット性能を著しく向上させることにより, 提案手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:16 GMT)
A complete continuous-variable quantum computation architecture based on the 2D spatiotemporal cluster state [5.0] 連続的な繰り返しに基づく量子計算は、実用的で拡張性があり、普遍的でフォールトトレラントな量子計算の候補である。
本研究では,クラスタ状態の準備,ゲート実装,エラー訂正を含む完全なアーキテクチャを実証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:39:19 GMT)
Operator entanglement in $\mathrm{SU}(2)$-symmetric dissipative quantum many-body dynamics [4.9] 対称性の存在は、オープン量子多体系における作用素の絡み合いの非自明なダイナミクスをもたらす可能性がある。
散逸性量子多体系における演算子絡み合いの遠方平衡力学を数値的に研究する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:33:15 GMT)
Exclusively Penalized Q-learning for Offline Reinforcement Learning [4.9] 制約に基づくオフライン強化学習(RL)は、分散シフトに起因する過大評価誤差を軽減するために、ポリシー制約や値関数に対する罰則を課す。
本稿では、ペナル化値関数を持つ既存のオフラインRL法における制限に着目し、値関数に導入される不要なバイアスによる過小評価バイアスの可能性を示す。
本稿では,推定誤差を誘導し易い状態を選択的にペナライズすることで,値関数における推定バイアスを低減する排他的罰則Q-ラーニング(EPQ)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:56:23 GMT)
Shortcomings of LLMs for Low-Resource Translation: Retrieval and Understanding are Both the Problem [4.8] 本研究では,機械翻訳パイプラインの自動化の一環として,事前学習された大言語モデル(LLM)が低リソース言語から高リソース言語への翻訳を指示する際の文脈内学習能力について検討する。
我々は南ケチュアをスペイン語に翻訳する一連の実験を行い、デジタル化された教育材料と平行コーパスの制約されたデータベースから得られた様々な種類の文脈の情報量について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:24:57 GMT)
Learning Geodesics of Geometric Shape Deformations From Images [4.8] 本稿では,画像から得られる変形場のジオデシックフローを初めて学習できるジオデシック・デフォルマブル・ネットワーク(GDN)という新しい手法を提案する。
特に,画像中の変形可能な形状の定量化と比較には,測地学を予測できるGDNの有用性が重要である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:49:59 GMT)
PSY: Posterior Sampling Based Privacy Enhancer in Large Language Models [4.8] ポストリアサンプリングをベースとしたPrivacYエンハンサーであるPSYをLoRAで使用することができる。
PSYは、プライバシー漏洩を中間情報から効果的に防止し、データ所有者のプライバシを保存する。
我々は,PSYで拡張したLoRAを,最先端のメンバシップ推論とデータ抽出攻撃に対して評価した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:15:42 GMT)
BATON: Enhancing Batch-wise Inference Efficiency for Large Language Models via Dynamic Re-batching [4.6] 本稿では,処理バッチを動的に調整し,効率的なバッチ単位のLLM推論手法であるBATONを提案する。
最先端のソリューションであるOrcaと比較して、BATONはクエリ処理を最大1.75倍改善する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:53:39 GMT)
Hierarchical Multimodal LLMs with Semantic Space Alignment for Enhanced Time Series Classification [4.6] HiTimeは階層的なマルチモーダルモデルであり、時間的情報を大きな言語モデルにシームレスに統合する。
本研究は, 時間的特徴をLCMに組み込むことにより, 時系列解析の進歩に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:32:19 GMT)
Towards Personal Data Sharing Autonomy:A Task-driven Data Capsule Sharing System [4.5] 本稿では、個人データ共有自律性を実現するためのデータカプセルパラダイムに基づくタスク駆動型個人データ共有システムを提案する。
具体的には,データカプセルを独立かつセキュアな個人データストレージと共有のための最小単位とする,タンパー抵抗型データカプセルカプセルカプセル化法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:08:36 GMT)
Multidimensional Electrical Networks and their Application to Exponential Speedups for Graph Problems [4.5] 我々は、オルタナティブ・キルヒホフの法則とオルタナティブ・オームの法則を定義することで、新しい多次元電気ネットワークを開発する。
正規グラフの一種におけるパスフィンディング問題に対する指数的量子スピードアップを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:43:45 GMT)
Enhancing MOTION2NX for Efficient, Scalable and Secure Image Inference using Convolutional Neural Networks [4.4] 我々は,C++ベースのMOTION2NXフレームワーク上に実装されたABY2.0 SMPCプロトコルを用いて,半正直なセキュリティを備えたセキュア畳み込みニューラルネットワーク(CNN)推論アプリケーションを開発した。
また、各CNN層における計算を複数のチャンクに分割する新しい分割アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:15:40 GMT)
Enhancing MOTION2NX for Efficient, Scalable and Secure Image Inference using Convolutional Neural Networks [4.4] この研究は、効率的でスケーラブルなオープンソースSecure Multi-Party Computationプロトコルの開発に寄与する。
我々は,C++ベースのMOTION2NXフレームワーク上に実装されたABY2.0 SMPCプロトコルを用いて,半正直なセキュリティを備えたセキュア畳み込みニューラルネットワーク(CNN)推論アプリケーションを開発した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:15:40 GMT)
Fixed-Point Automatic Differentiation of Forward--Backward Splitting Algorithms for Partly Smooth Functions [4.4] 近位分割アルゴリズムの固定点反復にインプリシット(ID)と自動微分(AD)を適用する。
これらのアルゴリズムによって生成される列のADが解写像の微分に収束することを示す。
FPAD(Fixed-Point Automatic Differentiation)と呼ばれる自動微分の変種については、逆モードADのメモリオーバーヘッド問題を改善する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:04:35 GMT)
Automatic Differentiation of Optimization Algorithms with Time-Varying Updates [4.4] 本研究では, 時間変化した反復過程に非回転あるいは自動微分を適用し, 導関数の収束保証を行う。
我々はこれらの収束結果に適応し、部分スムーズな問題を解く際に、可変ステップサイズとFISTAによる近位勾配降下に適用する。
理論的および数値的な結果は,アルゴリズムの収束速度が微分イテレートに反映されていることを示している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:03:31 GMT)
Is One GPU Enough? Pushing Image Generation at Higher-Resolutions with Foundation Models [4.3] 我々はPixelsmithを紹介した。これはゼロショットのテキスト・ツー・イメージ生成フレームワークで、1つのGPUで高解像度の画像をサンプリングする。
我々は,事前学習した拡散モデルの出力を1000倍に拡大できることを初めて示し,ギガピクセル画像生成への道を開いた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:31:09 GMT)
LoRANN: Low-Rank Matrix Factorization for Approximate Nearest Neighbor Search [4.2] 本稿では,内積近似が多出力回帰問題であることを示す観測に基づく新しい教師付きスコア計算法を提案する。
実験の結果,提案手法はクエリ待ち時間とメモリ使用量の両方においてPQよりも優れていることがわかった。
また,クラスタリングに基づくANNライブラリであるLoRANNを導入する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:13:39 GMT)
Adapting MLOps for Diverse In-Network Intelligence in 6G Era: Challenges and Solutions [4.2] 機械学習操作(MLOps)は、これらの課題に取り組むための体系的なアプローチを提供する。
我々は、強化学習操作(RLOPS)、連合学習操作(FedOps)、生成AI操作(GenOps)の3つの運用パイプラインを定式化する。
これらのパイプラインは、さまざまな学習/推論機能をネットワークにシームレスに統合する基盤となる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:47:28 GMT)
Scaling Law with Learning Rate Annealing [4.1] ニューラルネットワークモデルのクロスエントロピー損失曲線は、学習速度(LR)がトレーニングステップを上回り、スケーリング法則に準拠している。
LRアニールによるスケーリング法則の適用により、学習速度(LRS)の任意のステップにおける損失を正確に予測することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:56:14 GMT)
Approaching Code Search for Python as a Translation Retrieval Problem with Dual Encoders [4.1] この研究は、Pythonのコード検索を翻訳検索問題としてアプローチする。
デュアルエンコーダを使用することで、これらの2種類の言語シーケンスを共有埋め込み空間に投影する。
統一言語モデルは、アーティファクト間の単語のかなりの重複をモデルが活用するのに役立つ。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:11:05 GMT)
Approaching Code Search for Python as a Translation Retrieval Problem with Dual Encoders [4.1] この研究は、Pythonのコード検索を翻訳検索問題としてアプローチする。
デュアルエンコーダを使用することで、これらの2種類の言語シーケンスを共有埋め込み空間に投影する。
統一言語モデルは、アーティファクト間の単語のかなりの重複をモデルが活用するのに役立つ。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:11:05 GMT)
Beyond Color and Lines: Zero-Shot Style-Specific Image Variations with Coordinated Semantics [4.0] スタイルは、主に色、ブラシストローク、照明といった芸術的要素の観点から検討されてきた。
本研究では,コーディネート・セマンティクスを用いた画像変化のためのゼロショット・スキームを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:34:57 GMT)
ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation [4.0] ONCOPILOTは、全身を覆う約7,500個のCTスキャンに基づいて訓練された、インタラクティブな放射線基礎モデルである。
ポイントクリックやバウンディングボックスのような視覚的なプロンプトを使って3D腫瘍のセグメンテーションを行い、最先端のモデルより優れています。
ONCOPILOTは測定プロセスを加速し、リーダー間のばらつきを低減する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:35:58 GMT)
ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation [4.0] ONCOPILOTは、全身を覆う約7,500個のCTスキャンに基づいて訓練された、インタラクティブな放射線基礎モデルである。
ポイントクリックやバウンディングボックスのような視覚的なプロンプトを使って3D腫瘍のセグメンテーションを行い、最先端のモデルより優れています。
ONCOPILOTは測定プロセスを加速し、リーダー間のばらつきを低減する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:35:58 GMT)
ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation [4.0] ONCOPILOTは、全身を覆う約7,500個のCTスキャンに基づいて訓練された、インタラクティブな放射線基礎モデルである。
ポイントクリックやバウンディングボックスのような視覚的なプロンプトを使って3D腫瘍のセグメンテーションを行い、最先端のモデルより優れています。
ONCOPILOTは測定プロセスを加速し、リーダー間のばらつきを低減する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:35:58 GMT)
Characterizing conical intersections of nucleobases on quantum computers [3.9] 超伝導量子コンピュータを用いて, 生体分子シトシン中の円錐交叉(CI)の量子シミュレーションを行った。
我々は、縮約量子固有解法(CQE)を用いて、円錐交叉に付随する近接縮退基底と励起状態を計算する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:00:26 GMT)
A Cranial-Feature-Based Registration Scheme for Robotic Micromanipulation Using a Microscopic Stereo Camera System [3.9] 深度知覚の線形モデルにより強化された顕微鏡ステレオカメラシステム(MSCS)を導入する。
部分的に露出したマウス頭蓋表面に対して、CNNに基づく制約付きカラー化登録戦略を用いて正確な登録方式を開発する。
これらの方法は、ロボットマイクロマニピュレーションタスクのためのMSCSと統合されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:40:38 GMT)
SSP-RACL: Classification of Noisy Fundus Images with Self-Supervised Pretraining and Robust Adaptive Credal Loss [3.9] 基礎画像分類はコンピュータの診断タスクにおいて重要であるが、ラベルノイズはディープニューラルネットワークの性能を著しく損なう。
本稿では,ロバスト適応クレダルロス (SSP-RACL) を用いた自己監督型事前訓練(Self-Supervised Pre-training)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:25:40 GMT)
SSP-RACL: Classification of Noisy Fundus Images with Self-Supervised Pretraining and Robust Adaptive Credal Loss [3.9] 基礎画像分類はコンピュータの診断タスクにおいて重要であるが、ラベルノイズはディープニューラルネットワークの性能を著しく損なう。
本稿では,ロバスト適応クレダルロス (SSP-RACL) を用いた自己監督型事前訓練(Self-Supervised Pre-training)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:25:40 GMT)
SSP-RACL: Classification of Noisy Fundus Images with Self-Supervised Pretraining and Robust Adaptive Credal Loss [3.9] 基礎画像分類はコンピュータの診断タスクにおいて重要であるが、ラベルノイズはディープニューラルネットワークの性能を著しく損なう。
本稿では,ロバスト適応クレダルロス (SSP-RACL) を用いた自己監督型事前訓練(Self-Supervised Pre-training)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:25:40 GMT)
Making Social Platforms Accessible: Emotion-Aware Speech Generation with Integrated Text Analysis [3.8] 本稿では,エンドツーエンドの文脈認識型テキスト音声合成システムを提案する。
テキスト入力から伝達された感情を導き出し、自然な、表現力のある音声に対する感情と話者の特徴に焦点を当てた音声を合成する。
本システムでは,最先端のTSモデルと比較した場合の競合予測時間性能を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:18:02 GMT)
A Unimodal Speaker-Level Membership Inference Detector for Contrastive Pretraining [3.7] 既存のMIAは入力としてオーディオを必要とし、音声プリントの露出を危険にさらし、コストのかかるシャドウモデルを必要とする。
CLAPモデルのための一元的話者レベルメンバーシップ推論検出器USMIDを提案する。
さまざまなCLAPモデルアーキテクチャとデータセットの実験は、USMIDがテキストデータのみを使用してベースラインメソッドより優れていることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:26:57 GMT)
Less Discriminatory Alternative and Interpretable XGBoost Framework for Binary Classification [3.6] LDA-XGB1は、公平で解釈可能なバイナリ分類のための、識別の少ない代替(LDA)機械学習モデルである。
シミュレーションされた信用承認データセットであるSimuCreditと、実世界のレシビズム予測データセットであるCompASの2つのデータセット上でLDA-XGB1を評価する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:20:52 GMT)
Dispelling the Mirage of Progress in Offline MARL through Standardised Baselines and Evaluation [3.5] オフラインマルチエージェント強化学習(MARL)は、現実世界のアプリケーションに非常に有望な新興分野である。
オフラインMARLの研究の現状は、ベースラインと評価プロトコルの不整合に悩まされている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:49:49 GMT)
A novel quantum machine learning classifier to search for new physics [3.5] NPを探索するための変分量子探索近傍(VQSN)アルゴリズムを提案する。
その結果、VQSNは古典的なk-アネレスト近傍のアルゴリズムよりも優れた効率を示すことが示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:27:28 GMT)
Logarithmic-Depth Quantum Circuits for Hamming Weight Projections [3.5] 入力純状態上でのコヒーレントハミング重みの射影測定を実現する量子アルゴリズムを提案する。
我々は、対応する量子回路の深さ幅のトレードオフを分析し、より多くの制御量子ビットのコストで回路の深さの低減を可能にする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:02:43 GMT)
Understanding Players as if They Are Talking to the Game in a Customized Language: A Pilot Study [3.4] 本研究は,ゲームイベントシーケンスのモデル化における言語モデル(LM)の適用について検討する。
生イベントデータをテキストシーケンスに変換し、このデータ上でLongformerモデルを事前学習する。
これらの結果から,ゲームデザインやパーソナライズにおける自己監督型LMの可能性を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:59:10 GMT)
Local and Global Graph Modeling with Edge-weighted Graph Attention Network for Handwritten Mathematical Expression Recognition [3.4] エッジ重み付きグラフ注意機構(EGAT)を用いたエンドツーエンドモデルを導入し,ノードとエッジの同時分類を行う。
また,局所(LGM)情報とグローバル(GGM)情報の両方に対して,ストロークレベルのグラフモデリング手法を提案する。
本システムは,記号検出,関係分類,表現レベルの認識において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:59:27 GMT)
LLM-based Online Prediction of Time-varying Graph Signals [3.2] 時間変化グラフ信号の欠落を予測するために,大規模言語モデル(LLM)を利用する新しいフレームワークを提案する。
欠落した各ノードについて、その隣人とその前の見積もりは、欠落した観測を推測するためにLSMに入力され、処理される。
風速グラフ信号のオンライン予測のタスクに基づいて,我々のモデルは精度でオンライングラフフィルタリングアルゴリズムより優れています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:22:50 GMT)
From Efficiency to Equity: Measuring Fairness in Preference Learning [3.2] 不平等とロウルシアン正義の経済理論に触発された嗜好学習モデルの公平性を評価する。
Gini Coefficient, Atkinson Index, Kuznets Ratio を用いて,これらのモデルの公平性を定量化するための指標を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:25:56 GMT)
Multi-Stage Airway Segmentation in Lung CT Based on Multi-scale Nested Residual UNet [3.2] 深層学習は医用画像のセグメンテーションに大きな進歩をもたらしたが、気道の連続性を維持することは依然として困難である。
本稿では,小空路の複雑な詳細を効果的に把握し,情報フローを向上させるためのネスト残留フレームワークを提案する。
MNR-UNetのトレーニングを最適化する3段階セグメンテーションパイプラインを開発した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:10:09 GMT)
Rigid Single-Slice-in-Volume registration via rotation-equivariant 2D/3D feature matching [3.0] 本研究では,1つの2次元スライスと対応する3次元ボリュームを一致させる自己教師付き2D/3D登録手法を提案する。
NSCLC-Radiomics CTおよびKIRBY21 MRIデータセット上で,提案したスライス・イン・ボリューム登録の堅牢性を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:24:27 GMT)
Bio2Token: All-atom tokenization of any biomolecular structure with Mamba [3.0] 完全タンパク質,RNAおよび小分子構造の原子レベルのトークン化を学習する量子化オートエンコーダを開発した。
我々は、Mamba状態空間モデルアーキテクチャが比較的効率的であることを示し、競争力のある精度に達するのに必要なトレーニングデータ、パラメータ、計算のごく一部を必要とし、約10万の原子を持つシステムにスケール可能であることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:23:09 GMT)
Medical-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data [2.9] 我々は, 甲状腺癌, 大腸癌, 肺癌, 一般の話題に分類した, 1,874 の生医学的抄録を収集した。
我々の研究は、特にデータスカースシナリオにおいて、分類性能を改善するためにこのデータセットを活用することに焦点を当てている。
がん関連文書のセマンティック情報と構造的関係をキャプチャする複数のグラフアテンション層を備えたResidual Graph Attention Network(R-GAT)を導入する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:42:30 GMT)
Neural incomplete factorization: learning preconditioners for the conjugate gradient method [2.9] 我々は、効率的なプレコンディショナーの生成を加速するためのデータ駆動型アプローチを開発する。
一般的に手動のプリコンディショナーをグラフニューラルネットワークの出力に置き換える。
本手法は, 行列の不完全分解を発生させ, 神経不完全分解(NeuralIF)と呼ばれる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:06:40 GMT)
"Is Hate Lost in Translation?": Evaluation of Multilingual LGBTQIA+ Hate Speech Detection [2.9] 本稿では,複数言語にわたる大規模言語モデルのLGBTQIA+ヘイトスピーチを検出することの課題について考察する。
ゼロショットおよび微調整GPTのヘイトスピーチ検出能力について検討した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:04:27 GMT)
Guiding Empowerment Model: Liberating Neurodiversity in Online Higher Education [2.7] 本稿では,学習と機能に影響を与える動的要因のスペクトルを同定することにより,ニューロディバージェントと状況に制約のある学習者の公平なギャップを解消する。
本稿では,タスク管理のカスタマイズ,多様なコンテンツアクセスのガイド,マルチモーダルコラボレーションのガイドなどにより,このモードを適用することで,主要な学習障壁を取り除くことを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:05:38 GMT)
Explainable News Summarization -- Analysis and mitigation of Disagreement Problem [2.7] テキスト要約のための説明可能なAI(XAI)技術は、要約の生成方法に関する貴重な理解を提供する。
近年の研究では、不一致問題として知られるこの分野の大きな課題が浮き彫りになっている。
この問題は、異なるXAI手法が同じ入力記事から生成された要約について矛盾する説明を提供するときに発生する。
本稿では,文変換器とk平均クラスタリングアルゴリズムを用いて,まず入力項目を分割し,各セグメントで生成された要約の説明を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:07:44 GMT)
Language-Agnostic Modeling of Source Reliability on Wikipedia [2.6] 本稿では,ウィキペディアの複数の言語版にまたがる情報源の信頼性を評価するために,言語に依存しないモデルを提案する。
このモデルはソースの信頼性を効果的に予測し、英語のF1マクロスコアは約0.80に達する。
さまざまなリソースレベルの言語で一貫性のあるモデルパフォーマンスを維持するという課題を強調します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:52:21 GMT)
Monolingual and Multilingual Misinformation Detection for Low-Resource Languages: A Comprehensive Survey [2.5] 本調査は、低リソース言語誤報検出に関する現在の研究の概要を概観する。
これらの領域で使用されている既存のデータセット、方法論、ツールをレビューし、データリソース、モデル開発、文化的・言語的文脈、現実世界の応用、研究の取り組みに関する重要な課題を特定します。
本研究は,多様な言語・文化的文脈における誤情報に対処できる,堅牢で包括的なシステムの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:02:03 GMT)
Dear Diary: A randomized controlled trial of Generative AI coding tools in the workplace [2.5] ジェネレーティブAIコーディングツールは比較的新しいもので、開発者への影響は従来のコーディングメトリクスを超えて拡大している。
本研究の目的は、生成型AIツールに関する既存の信念、自己認識、そしてこれらのツールの定期的な使用がこれらの信念をどう変えるかを明らかにすることである。
その結果,ジェネレーティブなAIコーディングツールの導入と持続的使用は,これらのツールが有用かつ楽しいものであるという開発者の認識を著しく高めていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:07:27 GMT)
Uncovering Biases with Reflective Large Language Models [2.5] 人間のラベル付きデータのバイアスとエラーは、機械学習にとって重要な課題である。
本稿では,多種多様な視点を明らかにするために,構造化逆対話を利用した反射型LLM対話フレームワーク RLDF を提案する。
実験の結果、RDDFは人間のラベル付きデータの制限を露呈しながら、公開コンテンツの潜在的なバイアスを特定することに成功した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:09:43 GMT)
An Investigation on Machine Learning Predictive Accuracy Improvement and Uncertainty Reduction using VAE-based Data Augmentation [2.5] 深層生成学習は、特定のMLモデルを使用して、既存のデータの基盤となる分布を学習し、実際のデータに似た合成サンプルを生成する。
本研究では,変分オートエンコーダ(VAE)を用いた深部生成モデルを用いて,データ拡張の有効性を評価することを目的とする。
本研究では,拡張データを用いてトレーニングしたディープニューラルネットワーク(DNN)モデルの予測において,データ拡張が精度の向上につながるかどうかを検討した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:15:48 GMT)
Assessing Alcohol Use Disorder: Insights from Lifestyle, Background, and Family History with Machine Learning Techniques [2.5] 本研究は、ライフスタイル、個人的背景、家族歴が、アルコール使用障害(AUD)の発症リスクにどのように貢献するかを考察した。
AUDの主要な決定要因は、年収、レクリエーション薬の使用、居住期間、性/性別、婚姻状況、教育水準、家族歴などの決定木を用いて同定された。
決定木、ランダムな森林、ネイブベイズを含む機械学習技術を用いて、個人がAUDを開発する可能性を予測する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:30:54 GMT)
TripCast: Pre-training of Masked 2D Transformers for Trip Time Series Forecasting [2.5] TripCastは、トリップタイムシリーズを2Dデータとして扱い、マスキングと再構築プロセスを通じて表現を学ぶ。
TripCastは、ドメイン内の予測シナリオにおいて、他の最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:08:05 GMT)
An Unobtrusive and Lightweight Ear-worn System for Continuous Epileptic Seizure Detection [2.4] 難治性てんかんを患っている人の70%は、適切に診断し治療すれば無発作で生きられる。
頭皮ベースの脳波検査は費用がかかり、入院が必要で、熟練した専門家に手術を依頼し、ユーザーに不快感を与えている。
てんかん発作の発症を検出するための,新しい軽量で控えめで社会的に許容できる耳縫いシステムであるEarSDを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:11:53 GMT)
AlignCap: Aligning Speech Emotion Captioning to Human Preferences [2.3] 自然言語による音声感情の記述の方が効果的かもしれない。
既存のSECの手法はしばしば幻覚を発生させ、目に見えない音声の一般化を失う。
我々は,大言語モデル(LLM)に基づく音声の感情キャプションを人間の嗜好に適応させるAlignCapを提案する。
実験によると、AlignCapはZero-shot SECタスクの他の最先端メソッドよりもパフォーマンスが向上している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:05:31 GMT)
Simulating 2D lattice gauge theories on a qudit quantum computer [2.2] 二次元格子型量子電磁力学の基本構成ブロックの性質の量子計算を行う。
これは、トラップイオンのqudit量子プロセッサを使用することで可能となる。
クイディットは、自然に高次元であるゲージ場を記述するのに理想的に適している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:31:40 GMT)
Ultra precise determination of Cs($nS_{1/2}$) and Cs($nD_J$) quantum defects for sensing and computing: Evaluation of core contributions [2.2] 我々はCs Rydberg遷移の絶対周波数測定を行う。
測定されたリドベルグ級数に対する量子欠陥パラメータは、これまででもっとも正確なものである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:57:12 GMT)
VECTOR: Velocity-Enhanced GRU Neural Network for Real-Time 3D UAV Trajectory Prediction [2.2] シーケンスベースニューラルネットワークにおけるGRU(Gated Recurrent Units)を用いた新しいトラジェクトリ予測手法を提案する。
我々は、合成と実世界のUAV軌跡データの両方を使用し、幅広い飛行パターン、速度、機敏性を捉えています。
GRUベースのモデルは、平均二乗誤差(MSE)を2×10-8に抑えながら、最先端のRNNアプローチを著しく上回っている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:16:42 GMT)
Verifying Non-friendly Formal Verification Designs: Can We Start Earlier? [2.2] 本稿では,2つの主要なステップからなるメタモデリング技術に基づく自動手法を提案する。
まず、C++で書かれた未使用のアルゴリズム記述を、生成されたアサーションを使用して早期に検証する。
第2に、HLECとそのメタモデルパラメータを用いて、このアルゴリズム記述をシーケンシャルな設計に対して検証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:09:40 GMT)
Visual Text Matters: Improving Text-KVQA with Visual Text Entity Knowledge-aware Large Multimodal Assistant [2.2] 我々は、知識を意識したテキストベースの視覚的質問応答(Text-KVQA)を再考する。
ビジュアルテキストエンティティリンクを行うための原則的アプローチであるVisTELを提案する。
知識を意識した大規模マルチモーダルアシスタントKaLMAについて紹介する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:25:38 GMT)
Health Misinformation in Social Networks: A Survey of IT Approaches [2.1] 調査は、関連する研究の体系的なレビューを提供することを目的としている。
まず、ファクトチェックのための手動および自動アプローチを提案する。
次に、偽ニュースの検出方法、コンテンツ、伝搬機能、ソース機能、および誤情報拡散対策の緩和手法について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:00:51 GMT)
On Explaining with Attention Matrices [2.1] 本稿では,変圧器モデルにおける注目重み(AW)と予測出力との説明的リンクについて検討する。
我々は,AWが説明的役割を果たすタスクやモデルにおいて,注意行列の有効成分を分離する,効率的な注意力を導入し,効果的に計算する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:43:33 GMT)
Heterogeneous Random Forest [2.1] 不均一ランダムフォレスト(HRF)は、木多様性を有意義な方法で向上させるように設計されている。
HRFは、ほとんどのデータセットの精度において、他のアンサンブル手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:18:55 GMT)
Deep-MacroFin: Informed Equilibrium Neural Network for Continuous Time Economic Models [2.0] Deep-MacroFinは偏微分方程式を解くために設計されたフレームワークである。
ハミルトン・ヤコビ・ベルマン方程式と結合代数方程式でカプセル化された経済情報を用いて最適化される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:31:36 GMT)
Wavetable Synthesis Using CVAE for Timbre Control Based on Semantic Label [2.0] 本研究は,直感的かつ感受性の高い波形合成における音色制御手法を提案する。
条件付き変分オートエンコーダ(CVAE)を使用して、ユーザはウェーブテーブルを選択し、明るい、暖かい、リッチなラベルで音色を定義することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:37:54 GMT)
Doubly Non-Central Beta Matrix Factorization for Stable Dimensionality Reduction of Bounded Support Matrix Data [2.0] データ行列をタッカー表現に分解し、構成因子行列の列数が制約されないようにする。
タッカー分解のための計算効率の良いサンプリングアルゴリズムを導出する。
安定性の向上により、科学的仮説の生成とテストに構成因子が使用される場合の信頼性が向上する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:24:47 GMT)
Exogenous Matching: Learning Good Proposals for Tractable Counterfactual Estimation [2.0] 本稿では, 抽出可能かつ効率的な対実表現推定のための重要サンプリング手法を提案する。
対物推定器の共通上限を最小化することにより、分散最小化問題を条件分布学習問題に変換する。
構造因果モデル (Structure Causal Models, SCM) の様々なタイプと設定による実験による理論的結果の検証と, 対実推定タスクにおける性能の実証を行った。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:20:20 GMT)
Advancing Interpretability in Text Classification through Prototype Learning [2.0] ProtoLensはプロトタイプベースのモデルで、テキスト分類のための詳細なサブ文レベルの解釈機能を提供する。
ProtoLensは、Prototype-aware Span extractモジュールを使用して、関連するテキストスパンを識別する。
ProtoLensは、競争精度を維持しながら解釈可能な予測を提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:21:54 GMT)
Self-distributive structures in physics [1.9] 可観測性は変換を生成するという考え方を表現するのに必要な最小の数学的構造として、リー四角形を導入する。
リー四角形はリー代数の非線形一般化と考えることができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:07:45 GMT)
Recommendations for Comprehensive and Independent Evaluation of Machine Learning-Based Earth System Models [1.9] 機械学習(ML)は天気予報において最も目に見えるもので、現代の物理学ベースのモデルに匹敵する予測を生成する。
地球系モデル(ESM)の予測モデル開発に向けた取り組みが現在進行中である。
本稿では,信頼性を高め,幅広い利用を促進するための5つの勧告を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:01:12 GMT)
SFB-net for cardiac segmentation: Bridging the semantic gap with attention [1.8] 本稿では,Swin Filtering Block Network (SFB-net)について紹介する。
平均的なDiceスコアは、ACDCデータセットで92.4に達した。私たちの知る限り、この結果は、このデータセットに関する他の作業よりも優れています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:48:13 GMT)
How to correct Ehrenfest nonadiabatic dynamics in open quantum systems: Ehrenfest plus random force (E$+$$σ$) dynamics [1.8] ランダムな力(E$+$sigma$)を加えることで従来のエレンフェスト力学(ED)の精度を向上させる。
この研究において、ランダムな力の構成はマルコフ的および非マルコフ的シナリオにおいて考慮される。
E$+$sigma$モデルは依然としてEDの高効率を保ち、余分な計算を行わない。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:21:06 GMT)
Classification Using Global and Local Mahalanobis Distances [1.8] 競合クラスからの観測のマハラノビス距離に基づく新しい半パラメトリック分類器を提案する。
我々のツールは、これらの距離を異なるクラスの後部確率を推定する特徴として利用するロジスティックリンク関数を持つ一般化加法モデルである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:01:37 GMT)
Distance and Kernel-Based Measures for Global and Local Two-Sample Conditional Distribution Testing [1.7] 本研究の目的は,2サンプル条件分散テストのための距離法とカーネル法に基づく統一的なフレームワークを提供することである。
2つの条件分布の均一性を特徴付ける距離とカーネルに基づく測度を導入する。
我々は,グローバルレベルとローカルレベルにおける2つの条件分布の相違を検出するグローバルテストとローカルテストを開発する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:01:16 GMT)
PDL: A Declarative Prompt Programming Language [1.7] 本稿では,PDL(Prompt Declaration Language)を紹介する。
PDLは単純な宣言型データ指向言語であり、YAMLに基づいたプロンプトを前面に配置する。
大規模な言語モデル(LLM)やツールを呼び出すインタラクティブなアプリケーションの記述をサポートし、チャットボットやRAG、エージェントといった一般的なユースケースの実装を容易にする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:07:08 GMT)
Quantum Simulation of Spin-Boson Models with Structured Bath [1.7] トラップされたイオンは、オープン量子系の量子力学をシミュレートするための自然なプラットフォームを提供する。
完全プログラム可能な制御パラメータにランダム性を加えることにより,浴槽温度と連続スペクトル密度を調整する能力を示す。
実験結果は理論的な予測と密接に一致し、トラップイオン系を用いたオープン量子系のシミュレーションが成功したことを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:36:44 GMT)
A Note on Geometric Calibration of Multiple Cameras and Projectors [1.7] 実験室で使用される実世界の幾何的校正手順の重要な要素について論じる。
具体的には、キャリブレーションオブジェクトの設計と、取得した画像でそれを分析するために使用される画像処理パイプラインについて論じる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:54:49 GMT)
Deep Learning for Video-based Person Re-Identification: A Survey [1.6] 本稿では,ビデオリIDのためのディープラーニング手法の最新の進歩について紹介する。
制限付きの短いビデオリIDメソッド、技術的な課題による大きなマイルストーン、アーキテクチャ設計などについて説明する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:16:46 GMT)
Unsupervised semantic segmentation of urban high-density multispectral point clouds [1.6] 高度に正確な都市型空中レーザースキャン(ALS)データの提供は、将来的には急速に増加するだろう。
データ処理における現在の課題は、ほとんどのALSデータセットの限られたスペクトル情報と低点密度に関連している。
本研究では,教師なしの深層クラスタリング手法GroupSPを用いて,新しい高密度(平均平方メートル当たり1200点)のマルチスペクトルALSデータを意味的に分割することを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:11:34 GMT)
Modulated Adaptive Fourier Neural Operators for Temporal Interpolation of Weather Forecasts [1.5] 本研究では,その状態が分かっている時点での2点間の大気状態を再構成するモデルを提案する。
また,6時間以上の分解能データよりも,極端な気象事象の統計を再現できることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:48:32 GMT)
Encoded quantum gates by geometric rotation on tessellations [1.4] これらの符号は, 幾何的考察による解析により, 適切な誤り訂正特性を示すことを示す。
我々は、異なるテッセルレーションに関連付けられたそのような符号の様々な具体的な構成を提供し、異なる論理群を生み出します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:17:56 GMT)
DENEB: A Hallucination-Robust Automatic Evaluation Metric for Image Captioning [1.4] 本稿では,幻覚に対して頑健な新しい教師付き自動評価尺度であるDENEBを提案する。
DENEBを訓練するために,32,978枚の画像と人間の判断を組み合わせた多彩でバランスの取れた星雲データセットを構築した。
DeNEBはFOIL, Composite, Flickr8K-Expert, Flickr 8058K-CF, Nebula, PASCAL-50Sデータセット上で, 既存のLCMフリーメトリクスの最先端性能を実現している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:29:41 GMT)
DENEB: A Hallucination-Robust Automatic Evaluation Metric for Image Captioning [1.4] 本稿では,幻覚に対して頑健な新しい教師付き自動評価尺度であるDENEBを提案する。
DENEBを訓練するために,32,978枚の画像と人間の判断を組み合わせた多彩でバランスの取れた星雲データセットを構築した。
DeNEBはFOIL, Composite, Flickr8K-Expert, Flickr 8058K-CF, Nebula, PASCAL-50Sデータセット上で, 既存のLCMフリーメトリクスの最先端性能を実現している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:29:41 GMT)
Probabilistic Representation of Commutative Quantum Circuit Models [1.3] 可換量子回路では、ペアワイズ忠実度のフーリエ級数は確率変数の特性関数として表すことができる。
この構成をパウリ作用素の任意の可換集合に一般化する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:02:44 GMT)
CapsuleNet: A Deep Learning Model To Classify GI Diseases Using EfficientNet-b7 [1.2] Capsule Vision 2024 Challengeのために開発された深層学習モデルであるCapsuleNetについて述べる。
我々のモデルは、事前訓練されたEfficientNet-b7バックボーンを活用し、分類のための追加レイヤを調整し、PRELUアクティベーション関数で最適化する。
以上の結果から,CapsuleNetのようなCNNベースのモデルでは,特に推定時間が重要な因子である場合,GIトラクション病の分類に有効な解が得られることが示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:43:47 GMT)
Identifying Factors Contributing to Bad Days for Software Developers: A Mixed Methods Study [1.2] 摩擦の存在によって生産性が著しく低下し、フラストレーションが増大し、開発者のモラルが低下します。
本研究は,インタビュー,調査,日記研究,開発者テレメトリデータ分析などの混合手法を用いた。
発見は、開発者にとって"悪い日々"を引き起こし、彼らの仕事と幸福に大きな影響を及ぼす要因を明らかにした。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:43:33 GMT)
LLM as a code generator in Agile Model Driven Development [1.1] この研究は、これらの課題を克服するための実行可能な戦略としてモデル駆動開発(MDD)を擁護します。
我々は GPT4 をコードジェネレータとして利用する Agile Model Driven Development (AMDD) アプローチを提案する。
GPT4自動生成機能を適用すると、JADEおよびPADEフレームワークと互換性のあるJavaとPythonコードが生成される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:24:11 GMT)
Distributed and Secure Kernel-Based Quantum Machine Learning [1.1] 量子コンピューティングは機械学習に革命をもたらすことを約束し、クラスタリングや距離推定といったタスクにおいて、大幅な効率向上を提供する。
測定仮定や非閉定理といった基本的な原理を通じて、セキュリティを向上する。
セキュアな量子機械学習は注目に値するが、カーネルベースの機械学習技術のセキュアで分散的な量子アナログの開発はいまだに未調査である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:33:41 GMT)
Enriching GNNs with Text Contextual Representations for Detecting Disinformation Campaigns on Social Media [1.0] 本研究は,偽ニュース検出において,テキスト機能をグラフニューラルネットワーク(GNN)に組み込むことによる影響について検討する。
実験の結果,静的なマクロF1では9.3%,テキスト機能のないGNNでは33.8%,文脈表現では9.3%向上した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:57:17 GMT)
Adversarial Attacks on Large Language Models Using Regularized Relaxation [1.0] 大規模言語モデル(LLM)は、多くの実用的な用途に使われている。
敵攻撃法は、これらの脆弱性を研究し、理解するために広く使われている。
本稿では,正規化勾配を連続最適化法で活用することにより,これらの制限を克服する新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:01:45 GMT)
Ablation Studies for Novel Treatment Effect Estimation Models [1.0] 本稿では,ベイジアンカウサルフォレスト(BCF)モデルを検討することにより,アブレーション研究の重要性を強調した。
我々は,$hatpi(x_i)$を除くと,平均および条件平均処理効果の推定や不確実性定量化におけるモデルの性能が低下しないことを示した。
この研究は、モデル成分が必須であり、不要な複雑さを防ぐために、治療効果推定にアブレーション研究を日常的に使用することを提唱している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:12:25 GMT)
Neural Collaborative Filtering Classification Model to Obtain Prediction Reliabilities [1.0] 本稿では,評価予測と信頼性の両面から分類に基づくアプローチを提案する。
本稿では,提案したニューラルアーキテクチャを提案するとともに,その推奨結果の品質が,アートベースラインの状況に匹敵するものであることを検証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:01:56 GMT)
Comparative study of quantum methods in the resolution of track findings instances [1.0] トラック探索は、粒子物理学で最初に導入された複雑な最適化問題である。
本稿では,その影響と有効性の両方を評価するために,様々なモデリング手法について検討する。
本稿では,CPLEXと実D-Wave量子コンピュータで動作する2つの量子モデル,D-Waveシミュレータ上の1つの量子モデルについて述べる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:55:16 GMT)
Five Pitfalls When Assessing Synthetic Medical Images with Reference Metrics [1.0] 2つのイメージを客観的かつ定量的に比較するために、参照メトリクスが開発された。
基準指標の相関と品質に対する人間の知覚は、様々な種類の歪みに対して強く異なる。
予想外の,おそらく望ましくない基準スコアを示す5つの落とし穴を選択した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:15:16 GMT)
Exploring the Universe with SNAD: Anomaly Detection in Astronomy [1.0] SNADは、大規模な調査で天文異常を検出することに焦点を当てた国際プロジェクトである。
本稿では,SNADプロジェクトの概要と,チームによる数年にわたる成果について概説する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:05:11 GMT)
Edge state behavior of interacting Bosons in a Su-Schrieffer-Heeger lattice [1.0] 我々は、SSHのような格子上で超低温相互作用するボソンをモデル化する効果的なハミルトニアンを開発した。
境界状態を特定するために,仮想時間プロパゲータを一般化したアルゴリズムを開発した。
我々は,超低温のボソンのガスを,異なる深さの潜在的な井戸の配列に閉じ込めた実験的な物理装置と平行に描いている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:55:05 GMT)
Integrating Deep Feature Extraction and Hybrid ResNet-DenseNet Model for Multi-Class Abnormality Detection in Endoscopic Images [0.9] 本研究の目的は、血管拡張症、出血、潰瘍を含む10種類のGI異常分類の同定を自動化することである。
提案したモデルは、よく構造化されたデータセットで全体の94%の精度を達成する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:10:31 GMT)
Flow of dynamical causal structures with an application to correlations [0.9] 因果モデルは、グラフィカル因果構造を通して定性的かつ定量的に、因果関係をキャプチャする。
ここでは、古典的決定論的プロセスの動的側面を可視化し、探索するツール、すなわち因果構造の流れを紹介する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:40:02 GMT)
DL-Polycube: Deep learning enhanced polycube method for high-quality hexahedral mesh generation and volumetric spline construction [0.9] 本稿では,ディープラーニングをポリキューブ法(DL-Polycube)と統合し,高品質なヘキサヘドラル(ヘキサヘドラル)メッシュを生成するアルゴリズムを提案する。
深層ニューラルネットワークを用いて表面三角形メッシュを対応するポリキューブ構造に分類する。
ポリキューブ構造の深層学習と表面三角形メッシュのセグメンテーションのための教師なし学習を組み合わせることで、ヘックスメッシュの生成を大幅に加速する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:35:08 GMT)
Tailored-LLaMA: Optimizing Few-Shot Learning in Pruned LLaMA Models with Task-Specific Prompts [0.9] 我々はタスク固有のデータセットを使用し、50億と40億のパラメータを持つ2つのプルーニングLLaMAモデルを微調整する。
本稿では,LLaMAモデルをタスク特異性と即効性という2つの制約の下で微調整する手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:34:27 GMT)
Bayan Algorithm: Detecting Communities in Networks Through Exact and Approximate Optimization of Modularity [0.8] 最適性と近似保証を提供するアルゴリズムを含む30のコミュニティ検出手法を比較した。
他の29のアルゴリズムのパーティションと比較すると、最大モジュラリティパーティションは、記述の長さ、カバレッジ、パフォーマンス、平均コンダクタンス、クラスタ度に最も適している。
Bayan(bayanpy)のPython実装は、Pythonのパッケージインストーラを通じて公開されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:45:34 GMT)
Improving Small-Scale Large Language Models Function Calling for Reasoning Tasks [0.8] 本研究では,関数呼び出しにおいて,より小さな言語モデルを訓練するための新しいフレームワークを提案する。
特定の論理的および数学的推論タスクに焦点を当てている。
このアプローチは,関数呼び出しによるこれらのタスクの小型モデルの性能向上を目的としている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:27:35 GMT)
LLMs for Extremely Low-Resource Finno-Ugric Languages [0.8] 本稿では,Voro,Livonian,Komiに着目し,そのギャップに対処する。
データ収集からチューニング,評価に至るまで,LLM作成のサイクルのほとんどを網羅する。
本研究は,NLPの進歩によって,低リソースの言語が恩恵を受けることを保証するため,言語多様性を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:48:12 GMT)
Send Message to the Future? Blockchain-based Time Machines for Decentralized Reveal of Locked Information [0.8] 本稿では,条件情報公開システムの理解,設計,適用のブレークスルーを紹介する。
新たな実用的タイムド・リリース暗号システムと公開可否のある秘密共有方式を設計することにより、新しいデータ共有システムを考案した。
本稿では,この先駆的パラダイムの完全な評価ポートフォリオを提供し,解析結果,タマリン・プロバーにおけるロバスト性の評価,および世界中の実世界のオープンソース・プロトタイプの性能評価を行う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:39:08 GMT)
Learning of Hamiltonian Dynamics with Reproducing Kernel Hilbert Spaces [0.8] 本稿では,限られたデータ点からハミルトン力学を学習する手法を提案する。
ハミルトニアンベクトル場は、本質的にハミルトニアンであるベクトル場の再生核ヒルベルト空間上の正規化された最適化によって見つかる。
この手法の性能は2つのハミルトニアン系のシミュレーションで検証される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:16:58 GMT)
Learning dissipative Hamiltonian dynamics with reproducing kernel Hilbert spaces and random Fourier features [0.8] 本稿では,限定的かつノイズの多いデータセットから散逸的ハミルトン力学を学習するための新しい手法を提案する。
この手法の性能は、2つの散逸するハミルトン系のシミュレーションで検証される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:35:39 GMT)
Learning Hamiltonian Dynamics with Reproducing Kernel Hilbert Spaces and Random Features [0.8] この手法の性能は3つのハミルトニアン系のシミュレーションで検証される。
奇数のシンプレクティックカーネルを用いることで,予測精度とデータ効率が向上することが実証された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:01:00 GMT)
Complexity Matters: Effective Dimensionality as a Measure for Adversarial Robustness [0.7] 本研究では,モデルの有効次元性とロバスト性との関係について検討する。
YOLO や ResNet などの実環境でよく使用される商用規模のモデルで実験を行う。
実効次元と対向ロバスト性の間のほぼ直線的逆関係を明らかにし、低次元ロバスト性モデルがより良いロバスト性を示すことを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:01:34 GMT)
A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning [0.6] ツールの使用、計画、フィードバック学習は、現在、LLM(Large Language Model)ベースのエージェントを開発するための3つの重要なパラダイムである。
この調査では、これらのフレームワークを体系的にレビューし、議論するための統合された分類法を導入している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:07:43 GMT)
Realistic Cost to Execute Practical Quantum Circuits using Direct Clifford+T Lattice Surgery Compilation [0.6] 本稿では,Clifford+Tゲートセットを用いて表現された量子回路を表面コード格子手術命令セットに明示的にコンパイルする資源推定パイプラインについて報告する。
コンパイルされた回路からのマジック状態要求のケイデンスにより、ポストホック解析においてマジック状態の蒸留と貯蔵要求の最適化が可能となる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:18:48 GMT)
Functional Brain Network Identification in Opioid Use Disorder Using Machine Learning Analysis of Resting-State fMRI BOLD Signals [0.6] 本研究では、複数の時間点を表すrs-fMRI BOLD特徴のデータ駆動機械学習(ML)モデルを用いて、OUD被験者と健康制御(HC)を区別する関心領域を特定する。
次に,Boruta ML アルゴリズムを用いて OUD と OUD を区別する統計学的に重要な BOLD の特徴を同定し,DMN を OUD の最も有意な機能的ネットワークとして同定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:30:14 GMT)
Learning $k$-body Hamiltonians via compressed sensing [0.6] 我々は、必ずしも幾何学的に局所ではない、M$未知のパウリ項を持つ$k$ボディハミルトニアンを学習する問題を研究する。
ハミルトンの精度を$epsilon$と総進化時間で学習するプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:16:19 GMT)
Quantum Merlin-Arthur with an internally separable proof [0.6] 1つの量子証明を持つことは、EXP$ne$ NEXPと仮定して、2つの無絡証明を持つことよりは、厳密には強力ではない。
我々の修正は、各証明に*multipartite* unentanglementという形式を与えている: 1つのレジスタをトレースした後、少数のキュービットが残りの状態から分離可能である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:44:20 GMT)
ViConsFormer: Constituting Meaningful Phrases of Scene Texts using Transformer-based Method in Vietnamese Text-based Visual Question Answering [0.6] テキストベースのVQAの主な課題は、シーンテキストの意味と情報を活用することである。
近年の研究では、画像中のシーンテキストの空間的情報を考慮することでこの問題に対処している。
ベトナム語で書かれたシーンテキストからの情報を効果的に活用する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:53:35 GMT)
From English-Centric to Effective Bilingual: LLMs with Custom Tokenizers for Underrepresented Languages [0.6] そこで本研究では,二言語ベース大言語モデル (LLM) を開発するための,モデルに依存しないコスト効率のアプローチを提案する。
私たちは3つの言語で実験を行い、それぞれが非ラテン文字(ウクライナ語、アラビア語、グルジア語)を使用しました。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:20:54 GMT)
Supporting Assessment of Novelty of Design Problems Using Concept of Problem SAPPhIRE [0.5] 問題の新規性は、参照問題データベースにおける問題から最小距離として測定される。
ステークホルダーが収集したアーティファクトに関連する現在の問題のセットは、過去の一連の問題と比較された。
このアプローチは、現在のあらゆる問題の集合の斬新さの度合いをよりよく理解することを目的としている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:39:49 GMT)
Deep Insights into Cognitive Decline: A Survey of Leveraging Non-Intrusive Modalities with Deep Learning Techniques [0.5] 本研究は、ディープラーニング技術を用いて認知低下推定作業を自動化する最も関連性の高い手法についてレビューする。
トランスフォーマーアーキテクチャやファンデーションモデルのような最先端のアプローチを含む、各モダリティと方法論の重要な特徴と利点について論じる。
ほとんどの場合、テキストのモダリティは最良の結果を得ることができ、認知の低下を検出するのに最も関係がある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:59:21 GMT)
AI Readiness in Healthcare through Storytelling XAI [0.5] 我々は,マルチタスク蒸留と解釈可能性技術を組み合わせて,聴衆中心の説明可能性を実現する手法を開発した。
我々の手法は、責任あるAIを実現するために、ドメインエキスパートと機械学習エキスパートの両方の信頼を高める。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:30:18 GMT)
The Neuromorphic Analog Electronic Nose [0.5] 2つの異なる経路のパルス間の時間差でガス濃度を符号化する1つのMOxセンサのための単純なアナログフロントエンドを導入する。
一定の気流中に注入されたガスパルスに対して,嗅球内の2つの主出力ニューロン間のスパイク時間差と同様,パルス間の時間差はガス濃度の増加とともに減少することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:09:59 GMT)
Enumeration of all superconducting circuits up to 5 nodes [0.5] 超伝導回路は増幅器、トランスデューサ、量子ビットとして使用することができる。
キャパシタ,インダクタ,ジョセフソン接合からなる超伝導回路を列挙することで,この設計空間のカタログ化を目指す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:35:23 GMT)
Safe machine learning model release from Trusted Research Environments: The SACRO-ML package [0.5] 我々は,オープンソースPythonツールの統合スイートであるSACRO-MLを紹介し,公開リリース前に機密データに基づいてトレーニングされた機械学習(ML)モデルの統計的開示制御(SDC)を容易にする。
SACRO-MLは(i)訓練体制によって引き起こされる開示の脆弱性を評価することによって、一般的なMLモデルを拡張してアンテホックなSDCを提供するSafeModelパッケージと、(ii)訓練後の様々な模擬攻撃を通じてモデルの経験的開示リスクを厳格に評価することによって、ポストホックなSDCを提供するAttacksパッケージを組み合わせる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:33:53 GMT)
Adiabatic training for Variational Quantum Algorithms [0.4] 本稿では3要素からなる新しいハイブリッド量子機械学習(QML)モデルを提案する。
量子ニューラルネットワーク(QNN)を表す変分量子アルゴリズム(VQA)を実行するゲートベース量子コンピュータ
VQAの最適パラメータを見つけるために最適化関数が実行される断熱量子コンピュータ。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:17:48 GMT)
Large Language Models for Financial Aid in Financial Time-series Forecasting [0.4] 金融支援の時系列予測は、限られた歴史的データセットと高次元財務情報のために困難である。
我々は、従来のアプローチよりも優れた性能を示すために、事前訓練されたLPM(GPT-2をバックボーンとする)、トランスフォーマー、線形モデルなど、最先端の時系列モデルを用いている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:41:47 GMT)
Comparing YOLO11 and YOLOv8 for instance segmentation of occluded and non-occluded immature green fruits in complex orchard environment [0.4] 本研究は、果樹園における未成熟リンゴのYOLO11とYOLOv8のインスタンスセグメンテーション機能に焦点を当てた。
YOLO11n-セグはすべてのカテゴリーで最高のマスク精度を達成し、スコアは0.831であった。
YOLO11m-segは、ボックスとマスクのセグメンテーションで最高スコアを記録した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:12:20 GMT)
How To Save Fees in Bitcoin Smart Contracts: a Simple Optimistic Off-chain Protocol [0.4] 私たちはBitcoinにおけるスマートコントラクトの実行を検討します。
当社では,Bitcoin契約の実行の大部分をオフチェーンで実行するプロトコルを導入しています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:21:09 GMT)
A Comprehensive Overview and Comparative Analysis on Deep Learning Models: CNN, RNN, LSTM, GRU [0.4] 機械学習(ML)と人工知能(AI)の強力なサブセットとして、ディープラーニング(DL)が登場した
その影響は、音声認識、ヘルスケア、自動運転車、サイバーセキュリティ、予測分析など、さまざまな分野に及んでいる。
我々は、CNN、リカレントニューラルネットワーク(RNN)、生成モデル、深層強化学習(DRL)、深層移動学習など、さまざまなディープラーニングモデルの総合的な調査を行う。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:41:58 GMT)
Maximum a Posteriori Inference for Factor Graphs via Benders' Decomposition [0.4] 一般ベイズ因子モデルにおける最大a-ポストペリオーリ推定法を提案する。
ベイジアン・ガウス混合モデルと潜在ディリクレ割り当てに対するMAP推定アルゴリズムを導出する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:57:56 GMT)
Generalizable, Fast, and Accurate DeepQSPR with fastprop [0.4] 本稿では,DeepQSPRフレームワークであるFastpropを紹介した。このフレームワークは,分子レベル記述子のコジェントなセットを用いて,多様なデータセット上での学習表現の性能を劇的に向上させる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:18:47 GMT)
Generalizable, Fast, and Accurate DeepQSPR with fastprop [0.4] 本稿では,DeepQSPRフレームワークであるFastpropを紹介した。このフレームワークは,分子レベル記述子のコジェントなセットを用いて,多様なデータセット上での学習表現の性能を劇的に向上させる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:18:47 GMT)
A Novel Interpretability Metric for Explaining Bias in Language Models: Applications on Multilingual Models from Southeast Asia [0.3] 事前学習言語モデル(PLM)におけるバイアス行動に対するトークンレベルの寄与を測定するための新しい指標を提案する。
東南アジアのPLMにおいて性差別と同性愛バイアスの存在が確認された。
解釈可能性と意味分析は、PLMバイアスが犯罪、親密な関係、助けに関する言葉によって強く引き起こされることを示している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:58:57 GMT)
Noise Adaption Network for Morse Code Image Classification [0.3] モース符号画像の伝送は、様々なノイズや歪みのために困難に直面している。
既存の手法は主に、単一種類のノイズに影響されたモールス符号画像の分類に重点を置いている。
モース符号画像分類のための新しい2段階手法であるノイズ適応ネットワーク(NANet)を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:24:52 GMT)
Testing Deep Learning Recommender Systems Models on Synthetic GAN-Generated Datasets [0.3] GANRS(Generative Adversarial Networks for Recommender Systems)は、協調フィルタリングレコメンデーションシステムのためのデータセットを生成する。
我々は、ソースとして3つの異なる実データから複数の合成データセットを作成することにより、GANRS法を検証した。
また、比較性能とGANRS法の両方をテストするために、6つの最先端協調フィルタリング深層学習モデルを選択した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:57:04 GMT)
Retrieving Implicit and Explicit Emotional Events Using Large Language Models [0.2] 大規模言語モデル (LLM) は近年,その優れたパフォーマンスから注目されている。
本研究では,LLMのコモンセンスにおける感情検索能力について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:56:28 GMT)
Benchmarking quantum chaos from geometric complexity [0.2] 非ガウス量子力学系と相互作用する幾何学的複雑性を研究する新しい方法を考える。
いくつかの制限の中で、幾何学的複雑性は確かに量子カオスのよい指標である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:04:58 GMT)
How to Design a Quantum Streaming Algorithm Without Knowing Anything About Quantum Computing [0.2] 空間複雑性の利点は,従来のストリーミングモデルよりも量子アルゴリズムの方が優れていることを示す。
これらすべての結果を包含する簡単な量子スケッチを提供し、量子スケッチをブラックボックスとして使用して、完全に古典的なアルゴリズムから導出できるようにします。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:11:37 GMT)
Comparative Analysis of Indicators for Multiobjective Diversity Optimization [0.2] 我々は,多目的の指標に基づく進化アルゴリズム(IBEA)の観点から,多様な多様性指標について論じる。
種の単調性など,これらの指標の理論的,計算的,実用的性質について検討する。
我々は、Riesz s-Energy Subset Selection ProblemのNP-hardnessの証明を含む新しい定理を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:40:36 GMT)
Towards Better Open-Ended Text Generation: A Multicriteria Evaluation Framework [0.2] オープンエンドテキスト生成は自然言語処理において顕著な課題となっている。
復号法は、いくつかの指標で優れ、他の指標では性能が劣ることが多い。
本稿では,この多基準フレームワークにおける新たなランキング戦略を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:32:01 GMT)
Testing Support Size More Efficiently Than Learning Histograms [0.2] 分布のヒストグラムを$p$で学習するよりも, より効率的にテストを行うことができることを示す。
この証明は、チェビシェフ近似が良い近似であるように設計されている範囲外の分析に依存する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:05:34 GMT)
A spectral method for multi-view subspace learning using the product of projections [0.2] マルチビューデータに対する簡易かつスケーラブルな推定アルゴリズムを提案する。
特に、回転ブートストラップとランダム行列理論を用いて、観測されたスペクトルを結合、個人、ノイズ部分空間に分割する。
シミュレーションでは,既存の手法よりも高精度に結合部分空間と個々の部分空間を推定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:51:55 GMT)
A framework for GNSS-based solutions performance analysis in an ERTMS context [0.2] 主な課題は、厳格なアプリケーションに到達することだ。
局在関数は、今日、オドメトリーとバリスの両方で実行される。
将来のシステムは、受信機によるオンボードのローカライゼーションソリューションに基づいている。
動的環境でのパフォーマンスを評価するには?
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:53:47 GMT)
Ali-AUG: Innovative Approaches to Labeled Data Augmentation using One-Step Diffusion Model [0.1] Ali-AUGは、産業応用における効率的なラベル付きデータ拡張のための新しい単一ステップ拡散モデルである。
提案手法は, 正確な特徴挿入を伴う合成ラベル付き画像を生成することで, 限られたラベル付きデータの課題に対処する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:12:46 GMT)
Expanding AI Awareness Through Everyday Interactions with AI: A Reflective Journal Study [0.1] 技術プログラムの学生は、テクノロジーのプロデューサとユーザーの両方を兼ね備えている。
本稿では,学校と日常生活の文脈における,学生のAIに対する意識と関与について考察する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:26:34 GMT)
Dynamic Vocabulary Pruning in Early-Exit LLMs [0.1] 大きな言語モデル(LLM)のサイズが大きくなると、パフォーマンスが向上することが示されている。
これは、より遅く、より高価な推論のコストが伴う。
本稿では,各トークンに対して,テスト時に語彙を動的にプルーニングすることを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:52:31 GMT)
Visual Robustness Benchmark for Visual Question Answering (VQA) [0.1] 213,000枚の画像からなる最初の大規模ベンチマークを提案する。
複数のVQAモデルの視覚的堅牢性に挑戦し、現実的な視覚的腐敗の強さを評価する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:50:43 GMT)
GOAL: A Generalist Combinatorial Optimization Agent Learning [0.1] GOALは複数のハード最適化問題(COP)を効率的に解くことができるモデルである
ゴールは1つのバックボーンと、入力および出力処理用の軽量な問題固有のアダプタで構成されている。
GOALは,幅広いCOPを解く最初のマルチタスクモデルでありながら,特定のベースラインよりもわずかに劣っている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:52:15 GMT)
Anatomical feature-prioritized loss for enhanced MR to CT translation [0.0] 画像翻訳と合成の伝統的な方法は、一般的にグローバルな画像再構成に最適化されている。
本研究は、新しい解剖学的特徴優先化(AFP)損失関数を合成プロセスに導入する。
AFP損失関数は、グローバルな再構成手法を置き換え、補うことができ、グローバルなイメージの忠実さと局所的な構造的詳細の両方にバランスよく重点を置いている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:28:53 GMT)
Anatomical feature-prioritized loss for enhanced MR to CT translation [0.0] 画像翻訳と合成の伝統的な方法は、一般的にグローバルな画像再構成に最適化されている。
本研究は、新しい解剖学的特徴優先化(AFP)損失関数を合成プロセスに導入する。
AFP損失関数は、グローバルな再構成手法を置き換え、補うことができ、グローバルなイメージの忠実さと局所的な構造的詳細の両方にバランスよく重点を置いている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:28:53 GMT)
Knowledge Distillation Using Frontier Open-source LLMs: Generalizability and the Role of Synthetic Data [0.0] 大規模なオープンソース言語モデル(LLM)は、より小さなLLMよりも推論コストとレイテンシが高い。
知識蒸留は、これらの大規模で有能な教師モデルからの出力を使用して、より小さな学生モデルを訓練する方法を提供する。
Llama-3.1-405B-インストラクタとLlama-3.1-8B-インストラクタとLlama-3.1-70B-インストラクタを用いた蒸留の有効性を検討した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:37:23 GMT)
Weak ergodicity breaking transition in randomly constrained model [0.0] 熱と弱非エルゴードの遷移(有限個のLSS相を支持する)を見つける。
すると LLS のダイナミクスがヒルベルト空間の一部のみを探索することを示し、したがってヒルベルト空間の局所化に対応する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:42:16 GMT)
Volley Revolver: A Novel Matrix-Encoding Method for Privacy-Preserving Neural Networks (Inference) [0.0] 我々は,手書き画像分類のための畳み込みニューラルネットワークを実装した。
40のvCPUを持つパブリッククラウドでは、MNISTテストデータセット上の畳み込みニューラルネットワークの実装には、$sim$287秒かかります。
データ所有者は、これらの32の画像を暗号化した暗号文を1つだけパブリッククラウドにアップロードする必要がある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:05:36 GMT)
Variational Tensor Network Simulation of Gaussian Boson Sampling and Beyond [0.0] 一般連続変数サンプリング問題に対する古典的シミュレーションツールを提案する。
我々はサンプリング問題を、単純な少数体ハミルトンの基底状態を見つけるための問題として再定式化する。
我々はガウスボソンサンプリングをシミュレートして手法を検証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:43:06 GMT)
Uncertainty-Error correlations in Evidential Deep Learning models for biomedical segmentation [0.0] Evidential Deep Learningはバイオメディカルイメージセグメンテーションの文脈で応用される。
U-Netバックボーンを用いた証拠深層学習モデルでは,予測誤差と不確かさの相関が良好であることが判明した。
EDLモデルのこれらの優れた特徴は、大きなモデルエラーを検出する上で重要な感度を保証するセグメンテーションタスクに適している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:16:04 GMT)
Time-Varying Convex Optimization with $O(n)$ Computational Complexity [0.0] コスト関数が時間とともに変化する非拘束凸最適化の問題を考える。
提案アルゴリズムは,決定変数に対するコスト関数の1次微分のみを必要とする。
具体的には、提案アルゴリズムは、計算コストを1タイムステップあたり$(n3)$から$O(n)$に削減する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 20:09:31 GMT)
The complexity of entanglement embezzlement [0.0] プロセスの任意の精度を実現する状態列を用いて,エンベゾルメントの回路複雑性について検討する。
以上の結果から,回路の複雑度は完全なエンベゾルメントの物理的障害となることが示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:00:33 GMT)
The advent of fully variational quantum eigensolvers using a hybrid multiresolution approach [0.0] 第2量子化ハミルトニアンを表す軌道を変動的に最適化することで、電子構造問題に対する完全な変分的アプローチを示す。
次に、明示的な数値的プロトコルを示し、最適軌道基底を決定するための量子回路の影響を明らかにする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:37:16 GMT)
The Nature of Mathematical Modeling and Probabilistic Optimization Engineering in Generative AI [0.0] 我々は、生成AIモデルのいくつかの重要な基盤技術に対して、アート手法の現在の状況に対するさらなる拡張の可能性を探究し、議論する。
特に、バイトペア符号化(BPE)アルゴリズムと同様の初期設定に基づくサブワード符号化(SWE)の最適解を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 05:29:20 GMT)
The Empirical Watershed Wavelet [0.0] 本稿では、周波数領域の任意の分割に基づく2次元経験的ウェーブレットフィルタの構築を可能にする理論的結果を提供する。
また,高調波モードと流域変換の位置を推定するために,スケール空間表現を組み合わせて画像スペクトルからそのような分割を検出するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:36:43 GMT)
The Cat and Mouse Game: The Ongoing Arms Race Between Diffusion Models and Detection Methods [0.0] 拡散モデルは合成メディア生成を変革し、未整合のリアリズムとコンテンツ生成の制御を提供する。
それらは、ディープフェイク、誤報、著作権のある素材の不正な複製を促進することができる。
これに対し, 効果的な検出機構の必要性が高まっている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:51:04 GMT)
Temporally correlated quantum noise in driven quantum systems [0.0] 我々は、量子環境に弱結合した駆動系に対する量子マスター方程式を開発する。
本手法により, 発生した全ての減衰チャネルとその時間依存性の一般化速度を追跡することができる。
また、相関性および場依存性の散逸効果が単一量子ゲート演算の性能向上につながることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:54:37 GMT)
Target Strangeness: A Novel Conformal Prediction Difficulty Estimator [0.0] ターゲットストレンジネスは共形予測のための新しい難易度推定器である
非定型的な予測が近隣住民の目標分布の文脈内にあるかを評価することで、ターゲットストレンジネスは現在の最先端のパフォーマンスを上回ることができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:33:32 GMT)
Synthesis of Binary-Input Multi-Valued Output Optical Cascades for Reversible and Quantum Technologies [0.0] 本稿では,Sasao と Saraivanov の群論に基づく手法から分解を拡張し,2値入力型多値出力量子カスケードを設計する。
本手法は,3,5,7値の出力に対して提案するが,一般には奇素値の出力に対して用いることができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:19:59 GMT)
Suppressing chaos with mixed superconducting qubit devices [0.0] 超伝導量子ビットの線形配列における局所化と非局在化(カオス)状態の交叉について検討する。
交互無調性を持つ系では、局所化された状態は、量子ビット-量子結合強度の増加に対してより弾力性があることが示されている。
この結果は、より高いパフォーマンスを達成するために異なるキュービットタイプを組み込んだデバイスの設計をサポートする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:46:43 GMT)
Structuring Concept Space with the Musical Circle of Fifths by Utilizing Music Grammar Based Activations [0.0] スパイクネットワークなどの離散ニューラルネットワークの構造とピアノ作品の構成との興味深い類似性について検討する。
スパイクニューラルネットワークにおけるアクティベーションの制御に音楽文法を活用する新しい手法を提案する。
本稿では,本モデルにおける概念マップが5番目の音楽サークルによって構成されていることを示し,深層学習アルゴリズムにおける音楽理論の原理を活用する可能性を明らかにする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:14:04 GMT)
Stochastic optimal control of open quantum systems [0.0] オープン量子システムのための状態準備の一般的な問題を考える。
SOC問題はハミルトン・ヤコビ・ベルマン方程式の解を必要とする。
PI制御で解ける量子状態準備問題のクラスを導出する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:47:42 GMT)
Spin-dependent Force from an NV center Ensemble on a Microlever [0.0] テザリング振動子に付着したダイヤモンド結晶に埋め込まれた窒素空洞(NV)中心によって誘起されるスピン依存力の観察を報告する。
その結果, 市販のシリコンカンチレバーの先端に, 数十億のNV中心を含むマイクロダイアモンドが生成するスピン依存トルクを用いて得られた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:14:11 GMT)
Speech perception: a model of word recognition [0.0] 本稿では,音の相関効果を考慮した音声認識モデルを提案する。
このモデルの単語は、好適に選択された降下ダイナミクスの引力に対応する。
誤聴の有無で短い単語と長い単語を復号する方法について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:41:47 GMT)
Spatial averaging for light reflection and transmission through cold atom arrays [0.0] 原子配列からの弱い光の透過と反射において,原子の空間的拡散が果たす役割について検討する。
光が弱く、電子状態が時間スケールで進化しても、トラップ内の原子の発振周期よりも短い場合、コヒーレンスは関係がない。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:41:52 GMT)
Single-Shot Phase Diversity Wavefront Sensing in Deep Turbulence via Metasurface Optics [0.0] 自由空間光通信(FSOC)システムは、最小資本コストで高帯域幅でセキュアな通信を提供する。
従来の適応光学(AO)は、大気中のチャネル損失を減らすためにこれらのシステムに追加される。
位相多様性を用いた別の波面センサは、深部乱流における波面の再構築に成功することができる。
ナノ構造を持つ複屈折型準曲面光学を用いて、低遅延位相多様性波面検出をコンパクトなフォームファクターで実現する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:43:00 GMT)
Signatures of superradiance in intensity correlation measurements in a two-emitter solid-state system [0.0] ダイヤモンドナノピラーに埋め込まれた窒素空孔(NV)エミッタの強度相関測定を行った。
単項状態と三項状態の両方からの遷移速度が$approx 6$で増加するのを観察する。
2エミッタ系からの超放射能放射を観測データの最も可能性の高い説明として同定した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:46:45 GMT)
Self-Adaptive Physics-Informed Quantum Machine Learning for Solving Differential Equations [0.0] チェビシェフは、古典的および量子的ニューラルネットワークが微分方程式を解くための効率的なツールとして有望であることを示した。
我々は、このフレームワークを様々な問題に対して量子機械学習環境に適応し、一般化する。
その結果,量子デバイス上での微分方程式の短期的評価に対する有望なアプローチが示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:43:52 GMT)
Secure quantum-enhanced measurements on a network of sensors [0.0] サードパーティーのセキュアな量子リモートセンシング(SQRS)プロトコルは、盗聴者に対するセキュリティを保証するリモートロケーションでの量子強調測定を可能にする。
このアイデアは、ひとつのパーティが絡み合った状態を使用して、異なるノードのパラメータの関数を直接測定できるノードのネットワークにまで拡張することができる。
ここでは,任意の大きさのネットワーク上で量子強度の測定精度とセキュリティを達成するために,絡み合った状態と分離可能な状態の両方を利用するハイブリッドプロトコルにおいて,この問題が克服可能であることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:35:31 GMT)
Scikit-fingerprints: easy and efficient computation of molecular fingerprints in Python [0.0] skfpは、化学情報学の応用のための分子指紋の計算のためのPythonパッケージである。
skfpは業界標準のScikit-learnインターフェースを提供し、直感的な使用と機械学習パイプラインとの統合を容易にする。
また、柔軟性があり、非常に効率的で、完全にオープンソースです。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:08:56 GMT)
SUS-Lib: An automated tool for usability evaluation based on the Software Usability Scale from user feedback [0.0] ソフトウェアユーザビリティ尺度(SUS)のスコアを計算し,ユーザ入力に基づいて図形を生成することを目的とした,SUS-Libソフトウェアパッケージの導入と記述を行う。
SUS-Libは、Python環境とコマンドラインツールの基本的な知識とスキルだけを必要とするユーザフレンドリーなソフトウェアの必要性に応えている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:01:27 GMT)
SUS-Lib: An automated tool for usability evaluation based on the Software Usability Scale from user feedback [0.0] ソフトウェアユーザビリティ尺度(SUS)のスコアを計算し,ユーザ入力に基づいて図形を生成することを目的とした,SUS-Libソフトウェアパッケージの導入と記述を行う。
SUS-Libは、Python環境とコマンドラインツールの基本的な知識とスキルだけを必要とするユーザフレンドリーなソフトウェアの必要性に応えている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:01:27 GMT)
SU($N$) symmetry with ultracold alkali dimers: weak dependence of scattering properties on hyperfine state [0.0] 実験的にアクセス可能な分子は、ボゾン系とフェルミオン系の両方に対して大きな$N$を提供する。
研究された全ての分子がSU($N$)対称性に必要な性質を持つことを示す。
我々は、スピン依存の半古典モデルを開発し、テストし、それがうまく機能することを確かめる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:22:41 GMT)
Run-and-tumble exact work statistics in a lazy quantum measurement engine: stochastic information processing [0.0] バックアクションエネルギー入力による1量子ビット量子計測エンジンを導入する。
連続周期で抽出された作業は,過渡的異常拡散を伴うラン・アンド・タンブル法に類似した2次マルコフ法であることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:36:06 GMT)
Role of Quantum Coherence in Chirped Dynamic Nuclear Polarization [0.0] 動的核偏極(DNP)は、電子スピンからマイクロ波照射によって核スピンへの偏極を伝達することで、NMRとMRIを著しく高感度にすることで変換している。
単色連続波(CW)照射は、異種幅の広いEPR線を持つ系におけるDNPの効率を制限している。
チャープ照射のような広帯域技術は、特にそのような場合、ソリッドエフェクト(SE) DNP に解決策を提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:52:11 GMT)
Rethinking Randomized Smoothing from the Perspective of Scalability [0.0] ランダムな平滑化は、顕著な進歩の中で有望なテクニックとして現れている。
ランダム化平滑化の基礎となる概念を詳細に探求する。
我々は、敵の摂動に対する堅牢性を証明する理論的保証を強調した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:03:15 GMT)
Reproducing the effects of quantum deformation in the undeformed Jaynes-Cummings model [0.0] Jaynes-Cummings (JC) モデルでは、結合パラメータの時間依存性はラビ振動の形式の変化を許容する。
非変形JCにおける$kappa$-deformationの効果を再現する時間依存結合を得るために,逆問題手法 (IPA) を用いる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:40:04 GMT)
Reinforcement Learning the Chromatic Symmetric Function [0.0] この公式は、ある連結条件を満たすグラフ(Eschers)と呼ばれるグラフ内の特定の不連結なサイクルタプルを数える。
これらの条件は強化学習モデルによって識別され、特定の単位区間グラフとは独立であり、普遍的な数え上げ表現となる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:45:01 GMT)
RKHS, Berezin and Odzijewicz-type quantizations on arbitrary compact smooth manifold [0.0] Berezin と Odzijewicz 型の量子化では、まずこの量子化を $mathbb CPn$ に明示的に示す。
滑らかなコンパクトな埋め込み多様体上の量子化を$mathbb CPn$から誘導する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:28:58 GMT)
Quantum set theory: Equality and order of internal reals defined through different quantum conditionals [0.0] 量子論における実験的な概念の分析から条件の形式がどのように従うかを示す。
上記の条件のそれぞれについて、我々は以前に量子集合論の解釈を紹介した。
上述の3つの条件の中で、内部実数の外部的に定義された集合がそれぞれの選択に同一であることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:56:43 GMT)
Quantum circuit synthesis via a random combinatorial search [0.0] 我々はランダムな探索手法を用いて、完全な量子状態準備や任意のターゲットを持つユニタリ演算子合成を実装した量子ゲート列を求める。
完全忠実度量子回路の分数は、回路サイズが単位忠実度を達成するために必要な最小回路サイズを超えると、急速に増加することを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:38:18 GMT)
Quantum Theory, Gravity and Second order Geometry [0.0] 量子論の重力への一貫した結合は、通常の一階のリーマン幾何学の拡張を必要とする。
4次元時空の場合、接空間は18次元となる。
より高次微分が導入されたにもかかわらず、オストラグラスキー不安定性は避けられることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:53:09 GMT)
Quantum Theory, Gravity and Second Order Geometry [0.0] 量子論の重力への一貫した結合は、通常の一階のリーマン幾何学の拡張を必要とする。
4次元時空の場合、接空間は18次元となる。
より高次微分が導入されたにもかかわらず、オストラグラスキー不安定性は避けられることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:53:09 GMT)
Quantum State Tomography of Photonic Qubits with Realistic Coherent Light Sources [0.0] 量子状態トモグラフィ(QST)は、量子状態の特徴付けに欠かせない技術である。
本稿では,現実的な条件下でのQSTの効率をシミュレーションし,評価するための数値的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:00:00 GMT)
Quantum Probabilities Are Objective Degrees of Epistemic Justification [0.0] QBismは、量子力学の最も広く議論されている「主観的」解釈の1つである。
本稿では、QBismを出発点とするが、客観性はゲットゴーから入ることができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:07:34 GMT)
Quantum Many-Body Scars beyond the PXP model in Rydberg simulators [0.0] QMBSは、多体ハミルトニアンスペクトルの典型的な固有状態と共存する非熱的に励起された固有状態である。
ここで報告されたQMBSは、長距離リドベルク封鎖の状況下で、ライドベルク原子シミュレータを用いて実験的に調査される可能性がある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:04:42 GMT)
Quantifying the rotating-wave approximation of the Dicke model [0.0] 我々は、量子Rabiモデルの多原子一般化に対する回転波近似(RWA)の有効性に対する定量的、非摂動的境界を解析的に見出した。
我々の境界は本質的に状態依存であり、特に絡み合い状態や非絡み合い状態の場合とは大きく異なる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:43:09 GMT)
Programmable integrated source of polarization and frequency-bin hyperentangled photon pairs [0.0] 集積フォトニックデバイス上での分極および周波数結合光子対を生成することができる4つのリング共振器のシステムを提案する。
生成状態の密度演算子は、偏極および周波数2自由度における超絡み合った状態を表すことを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 03:15:02 GMT)
Privacy-Preserving Logistic Regression Training on Large Datasets [0.0] 我々は,同型暗号化(HE)を用いた大規模暗号化データに対するロジスティック回帰学習のための効率的なアルゴリズムを提案する。
また、データセットがあまりに大きく、ミニバッチ方式で暗号化する必要がある場合に、それらのメソッドのフルバッチバージョンを実装する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:08:02 GMT)
Predicting potato plant vigor from the seed tuber properties [0.0] ジャガイモの活力は、種子の塊茎の起源と生理的状態に依存する。
3年間の試験場における6種類のジャガイモ品種を用いた実験は、異なる試験場で栽培された同じ種子の植物の活量に73%-90%の相関関係を示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:05:38 GMT)
Practical implementation of a single-qubit rotation algorithm [0.0] Toffoliは重要な普遍量子ゲートであり、Cliffordゲートと共に将来のフォールトトレラント量子コンピューティングハードウェアで利用できるようになる。
我々はClifford+Toffoliゲートセットを用いて,最近提案された1量子回転アルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:53:21 GMT)
Oracle Separations for the Quantum-Classical Polynomial Hierarchy [0.0] 量子古典的階層 QCPH について検討する。これは、交互古典的量子化器の定数数で解ける言語のクラスである。
我々は、量子アルゴリズムに新しい切り換え補題を与えるが、これは独立した関心を持つかもしれない。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:12:03 GMT)
Optimizing Large Language Models for Dynamic Constraints through Human-in-the-Loop Discriminators [0.0] 大規模言語モデル(LLM)は、最近、様々な現実世界のアプリケーションにまたがる印象的な機能を実証した。
本稿では,LLMがシステムインターフェースと相互作用し,制約概念を要約し,性能指標を継続的に最適化するフレキシブルなフレームワークを提案する。
我々のフレームワークは、人間の識別器で7.78%のパスレート、LSMベースの識別器で6.11%のパスレートを達成した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:46:32 GMT)
Optimal Equivariant Architectures from the Symmetries of Matrix-Element Likelihoods [0.0] マトリックス要素法(MEM)は長年、高エネルギー物理学におけるデータ解析の基盤となっている。
幾何学的なディープラーニングは、既知の対称性を直接設計に組み込むニューラルネットワークアーキテクチャを可能にした。
本稿では、MEMにインスパイアされた対称性と、粒子物理解析のための同変ニューラルネットワーク設計を組み合わせた新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:56:37 GMT)
On high-dimensional modifications of the nearest neighbor classifier [0.0] 本稿では,これらの既存手法について考察し,新しい手法を提案する。
提案手法の実証的性能と既存手法との比較を行うため,いくつかのシミュレーションおよびベンチマークデータセットを分析した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:47:36 GMT)
On high-dimensional modifications of the nearest neighbor classifier [0.0] 本稿では,これらの既存手法について考察し,新しい手法を提案する。
提案手法の実証的性能と既存手法との比較を行うため,いくつかのシミュレーションおよびベンチマークデータセットを分析した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:47:36 GMT)
On Model-Free Re-ranking for Visual Place Recognition with Deep Learned Local Features [0.0] 記事は、標準的なローカルな視覚的特徴に基づいて、モデルフリーで再ランク付けすることに焦点を当てている。
これは、主に深層学習された局所的な視覚的特徴のために設計された3つの新しいモデルフリーなリグレード手法を導入している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:26:46 GMT)
Omics-driven hybrid dynamic modeling of bioprocesses with uncertainty estimation [0.0] この研究は、機械学習ツールを統合するオミクス駆動モデリングパイプラインを提示している。
ランダムフォレストと置換特徴の重要性は、オミクスデータセットをマイニングするために提案されている。
連続的かつ微分可能な機械学習関数は、減ったオミクス機能を動的モデルのキーコンポーネントにリンクするように訓練することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:50:35 GMT)
Network-Device-Independent Certification of Causal Nonseparability [0.0] 因果非分離性(英: Causal nonseparability)は、特定の因果順序と不整合な量子過程の基礎となる性質である。
本稿では, 因果非分離分散測定を誘導できるすべてのプロセスの因果非分離性を証明した, 観測された相関のみに基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:06:12 GMT)
NIDS Neural Networks Using Sliding Time Window Data Processing with Trainable Activations and its Generalization Capability [0.0] 本稿では,ネットワーク侵入検知システム(NIDS)のためのニューラルネットワークについて述べる。
ディープパケットインスペクションに頼らず、ほとんどのNIDSデータセットで見つからず、従来のフローコレクタから簡単に取得できる11の機能しか必要としない。
報告されたトレーニング精度は、提案手法の99%を超え、ニューラルネットワークの入力特性は20に満たない。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:36:19 GMT)
Multi-Class Abnormality Classification in Video Capsule Endoscopy Using Deep Learning [0.0] このレポートでは、Capsule Vision 2024 Challengeに対するTeam Seq2Cureのディープラーニングアプローチの概要を概説する。
畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのアーキテクチャのアンサンブルを多クラス異常分類に活用する。
提案手法は, 平均精度86.34パーセント, AUC-ROCスコア0.9908を検証セットで達成した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:13:06 GMT)
Moving Object Segmentation in Point Cloud Data using Hidden Markov Models [0.0] 我々は,移動物体を点クラウドデータにセグメント化するための頑健な学習自由アプローチを提案する。
提案手法はベンチマークデータセット上でテストされ、最先端の手法よりも一貫してパフォーマンスが向上する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:56:02 GMT)
More on the Operator Space Entanglement (OSE): Rényi OSE, revivals, and integrability breaking [0.0] 我々は、R'enyi Operator Spaceanglement(OSE$)エントロピー$S_n$のいくつかの1次元可積分およびカオスモデルに対するダイナミクスについて検討する。
R'enyi $OSE$ entropies of diagonal operator with nonzero trace saturate at long time。
有限サイズの可積分系では、$S_n$は強いリバイバルを示し、可積分性が破られたときに洗い流される。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:17:29 GMT)
Metro-scale QKD using multimode fiber [0.0] 記録破りの17kmのMMFを193kbits/sで位相符号化したデコイ状態BB84QKDプロトコルの原理的実現を報告する。
以上の結果から,QKDは大都市電信接続においてMMF上に展開可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:18:51 GMT)
Low-excitation transport and separation of high-mass-ratio mixed-species ion chains [0.0] 1つのベリリウムと1つのカルシウムイオンからなる2イオン結晶の低励起輸送と分離を実証した。
完全な分離は混合種連鎖の輸送を伴い、各イオンを別の電位井戸に分割し、検出前に各イオンを輸送する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:12:36 GMT)
LLM Tree Search [0.0] 本研究の目的は,AlphaGoパラダイムにヒントを得て,大規模言語モデル(LLM)で使用するための新しいシーケンス生成手法を検討することである。
提案手法では, モデル信頼度に基づいて, 異なる可能な補完点の探索木を作成し, それらの完成点を評価する。
このアプローチは、多様で一貫性のあるシーケンスの集合を生み出し、シーケンス生成における探索とエクスプロイトのバランスに関する洞察を提供することを期待しています。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:38:50 GMT)
Internal structure of gauge-invariant Projected Entangled Pair States [0.0] 投影された絡み合ったペア状態(PEPS)は、自然にグローバルまたはローカル(ゲージ)の対称性を符号化することができる。
局所対称性を持つPEPSは、格子ゲージ理論の非摂動的状態の研究にますます使われている。
射影対対状態の内部構造をゲージ対称性で研究する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:37:37 GMT)
Interação entre robôs humanoides: desenvolvendo a colaboração e comunicação autônoma [0.0] 本研究は,ヒューマノイドロボットNAOとPepperの相互作用について検討し,教育環境におけるその可能性を強調した。
プログラムされた一連のインタラクションを通じて、ロボットは自律的に行動のコミュニケーションとコーディネートを行う能力を実証した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:38:44 GMT)
Industrially fabricated single-electron quantum dots in Si/Si-Ge heterostructures [0.0] 本稿では,ヘテロ構造をベースとしたスピン量子ビットデバイスと産業用CMOS技術との互換性について報告する。
Infineonの200mm生産ラインで製造されたSi/Si-Ge量子ドットデバイスを、制限された熱予算内に備えている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:59:16 GMT)
IBAC Mathematics and Mechanics: The Case for 'Integer Based Access Control' of Data Security in the Age of AI and AI Automation [0.0] データアクセス制御の現在の方法、特にAIとAIの自動化は、適切なデータアクセスを保証するというユニークな課題に直面している。
RBAC(Role-Based Access Control)とABAC(Atribute-Based Access Control)の限界に対処する集約型アクセス制御(ABAC)を導入する。
IBACの数学的基盤は、リレーショナルおよび文書認証への適用を可能にする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:19:57 GMT)
Hybrid Quantum-Classical Feature Extraction approach for Image Classification using Autoencoders and Quantum SVMs [0.0] NISQ時代の量子コンピュータには、ノイズ、スケーラビリティ、読み出し時間、ゲート操作時間などの制限がある。
複雑なデータセットが量子機械学習パイプラインの全体的な効率に与える影響を軽減するために、戦略を考案する必要がある。
本稿では,ResNet10にインスパイアされた畳み込みオートエンコーダを用いた古典的特徴抽出手法を適用し,データセットの次元性を低減し,意味のある特徴を抽出する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:02:05 GMT)
How to integrate a miniature optical cavity in a linear ion trap: shielding dielectrics and trap symmetry [0.0] 光キャビティと複数のイオンを保持する線形トラップとの効率的な界面は、まだ解明されていない。
簡単な電気的導電性による繊維の遮蔽は、大きな利点をもたらす可能性がある。
小型光キャビティの集積を成功させるためには, 線形イオントラップに組み込むべき必須成分と設計戦略を同定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:32:55 GMT)
How to integrate a miniature optical cavity in a linear ion trap: shielding dielectrics and trap symmetry [0.0] 光キャビティと複数のイオンを保持する線形トラップとの効率的な界面は、まだ解明されていない。
簡単な電気的導電性による繊維の遮蔽は、大きな利点をもたらす可能性がある。
小型光キャビティの集積を成功させるためには, 線形イオントラップに組み込むべき必須成分と設計戦略を同定する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:32:55 GMT)
How High a Field Can Be and Has Been Achieved in Superconducting Bulk Niobium Cavities Across Different RRR Values? [0.0] このブリーフノートは、超伝導バルクニオブ(Nb)空洞における残留比(RRR)と最大表面磁場の関係について考察する。
1980年代から2020年代にかけてのRRR値(30~500)を、低臨界場(Bc1)、過熱場(Bsh)、熱流出場(Brun)などの理論的性能限界と比較した。
その結果,現代のNbキャビティはBrunに近づき,Bc1以上の転移性領域はRRR範囲全体ではBshの基本的な限界以下であることがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:10:11 GMT)
Harnessing PU Learning for Enhanced Cloud-based DDoS Detection: A Comparative Analysis [0.0] 本稿では、クラウド環境における分散型サービス拒否(DDoS)検出の強化に対する、Positive-Unlabeled(PU)学習の適用について検討する。
我々は,XGBoost,Random Forest,Support Vector Machine,Na"ive Bayesの4つの機械学習アルゴリズムを用いてPU学習を実装した。
その結果,XGBoostとRandom Forestは98%以上のスコアでF_1$を達成し,アンサンブル手法の優れた性能を示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 02:44:56 GMT)
Generation of Structured Light and Controlled-NOT Gate in Microwave Regime [0.0] 非ゼロ軌道角運動量を持つマイクロ波ビームを生成する理論的モデルを提案する。
我々は3レベル原子系に基づく制御NOTゲートを開発した。
マイクロ波領域におけるラゲール・ガウス場の生成は、無線通信における高度な情報処理の新しい可能性を開く。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:15:42 GMT)
Gate Efficient Composition of Hamiltonian Simulation and Block-Encoding with its Application on HUBO, Fermion Second-Quantization Operators and Finite Difference Method [0.0] 本稿では、ハミルトンシミュレーション技術を異なる分野から統一する単純な形式主義を提案する。
ゲートの分解とスケーリングは、通常の戦略とは異なる。
これにより、回転ゲート、マルチキュービットゲート、回路深さの量子回路数を大幅に削減することができる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:26:50 GMT)
From $SU(2)$ holonomies to holographic duality via tensor networks [0.0] スピンネットワーク状態のテンソルネットワーク表現を構築し、$SU(2)$ゲージ不変離散場理論に対応する。
スピンネットワーク状態は、プランクスケール物理学に対するループ量子重力(LQG)アプローチにおいて中心的な役割を果たす。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:59:35 GMT)
Forecasting trends in food security with real time data [0.0] 我々は,マリ,ナイジェリア,シリア,イエメンの4カ国で,60日間連続して食料消費の水準を予測する定量的手法を提案する。
この手法は、World Food Programmeのグローバルな飢餓モニタリングシステムから入手可能なデータに基づいて構築されている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:15:28 GMT)
Finite-Time Processes In Quantum Thermodynamics: The Limits Of Irreversibility [0.0] 物理過程における不可逆性の出現は、量子力学の可逆性にも拘わらず、物理学において未解決の問題である。
この論文は、量子力学と熱力学の複雑な関係を探求している。
量子力学の可逆的微視的枠組みから不可逆的熱力学挙動を導出する課題に取り組む。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:48:24 GMT)
Experimental observation of spin defects in van der Waals material GeS$_2$ [0.0] 六方晶窒化ホウ素(hBN)のような2次元(2次元)材料は、その潜在的な量子応用に大きな注目を集めている。
ここでは,2次元材料である二硫化ゲルマニウム(β$-GeS$$)について述べる。
その結果, 単結晶$beta$-GeS$$のスピン欠陥が2種類以上存在することがわかった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:29:05 GMT)
Experimental Quantum Simulation of Chemical Dynamics [0.0] 化学シミュレーションのための既存のデジタル量子アルゴリズムは、多くの論理量子ビットとゲートを必要とする。
ここでは, 化学反応の最初の量子シミュレーションを行うために, アナログ手法を用いる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:23:39 GMT)
Exact Thermal Eigenstates of Nonintegrable Spin Chains at Infinite Temperature [0.0] 非可積分スピン鎖の解析的熱固有状態を記述する。
我々は、EAP状態が固有状態であるハミルトニアンを同定し、これらのハミルトニアンのうちいくつかが非可積分であることを示す。
我々の結果は、固有状態熱化仮説の証明可能な例を提供するための潜在的な道筋を提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:14:06 GMT)
Evolving Voices Based on Temporal Poisson Factorisation [0.0] 本稿では、分解モデルの拡張として、時間的ポアソン分解モデル(TPF)を提案し、スパースカウントデータ行列をモデル化する。
米国上院における18セッションのスピーチの分析(1981-2016)におけるTPFモデルの詳細結果について論じる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:21:33 GMT)
Evolutionary Dispersal of Ecological Species via Multi-Agent Deep Reinforcement Learning [0.0] 本研究は,多エージェント強化学習(MARL)と深度Q-networks(DQN)を用いて,単一種と捕食者-捕食者の相互作用をシミュレートする。
我々のシミュレーションでは、進化的分散戦略を明らかにし、種分散機構の洞察を与え、伝統的な数学的モデルを検証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 10:21:23 GMT)
Estimating Reaction Barriers with Deep Reinforcement Learning [0.0] 複雑な系の安定状態は、関連するポテンシャルエネルギー表面上の局所ミニマに対応する。
たいていの場合、システムは局所的な最小値に近づき、希少な大きなゆらぎがミニマ間の遷移に繋がる。
本研究の目的は,システム状態空間における2つの安定状態間の最小エネルギー障壁をコスト最小化問題として求めることである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:37:08 GMT)
Error convergence of quantum linear system solvers [0.0] 線形問題の解法としてHHLアルゴリズム(Harrow-Hassidim-Lloyd Algorithm)の性能解析を行った。
量子ビット数が増加すると、変分アルゴリズムの計算誤差が常にゼロに収束しないことを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 13:41:29 GMT)
Entanglement dynamics for SCTS in the Jaynes-Cummings model with atoms in Werner state [0.0] 本稿では,Jaynes-Cummingsモデル(JCM)における絡み合いのダイナミクスについて検討する。
本研究では, 絡み合い突然死(ESD)現象, 原子インバージョン, 様々な相互作用がこれらの力学に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 06:28:05 GMT)
Entanglement Spectrum as a diagnostic of chirality of Topological Spin Liquids: Analysis of an $\mathrm{SU}(3)$ PEPS [0.0] 固定横運動量におけるエンタングルメントスペクトル(ES)におけるキラリティの特異な指標と対称性を同定する。
カイラル状態の ES において、非共役同型は、それらを分割する作用素($mathrmSU(3)$ の立方体カシミールに関連する)が禁じられるため、正確に退化する。
このような診断は、(2+1)次元のキラルおよび非キラルな位相状態を、その絡み合いスペクトルを介して識別する、曖昧で強力なツールを提供する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:51:53 GMT)
Enhancing pretraining efficiency for medical image segmentation via transferability metrics [0.0] 医用画像のセグメンテーションタスクでは、ラベル付きトレーニングデータの不足が大きな課題となっている。
本稿では,事前学習したモデルが対象データをいかに頑健に表現できるかを計測する,対照的な学習に基づく新しい伝達可能性指標を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:11:52 GMT)
Enhancing Graph Attention Neural Network Performance for Marijuana Consumption Classification through Large-scale Augmented Granger Causality (lsAGC) Analysis of Functional MR Images [0.0] 脳ネットワーク接続におけるマリファナの消費と変化の関係は、科学文献において認識されている事実である。
この研究は、lsAGCがこれらの変化を正確に識別する方法を探索する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 07:50:10 GMT)
Emergence of non-ergodic multifractal quantum states in geometrical fractals [0.0] 固有状態多フラクタル性(Eigenstate multifractality)は、非相互作用性不規則金属の目印であり、異常なスローダイナミクスによって特徴づけられる。
本研究では, 結晶格子に欠陥を反復的に導入することにより, 乱れのない非エルゴード多フラクタル状態を実現する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:05:00 GMT)
Emergence of Light Cones in Long-range Interacting Spin Chains due to Destructive Interference [0.0] 低温における長距離相互作用するハイゼンベルクスピン鎖の機構について, 絡み合い光円錐の出現に繋がる機構について述べる。
この機構は、特定光円錐の外側のスピンの絡み合いに寄与する量子効果の間の破壊的干渉から生じる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:02:15 GMT)
ERX: A Fast Real-Time Anomaly Detection Algorithm for Hyperspectral Line Scanning [0.0] 本稿では、高スペクトル線走査のための既存のRXに基づく異常検出手法の問題を解決するために、指数移動RXアルゴリズム(ERX)を提案する。
ERXはJetson Xavier NX計算モジュールを用いて評価され、速度と検出性能の最良の組み合わせを実現する。
本研究は, 異常物体の分類・配置, 適応的および自動しきい値選択, 実時間フィールドテストにおける今後の研究の道を開くものである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:57:51 GMT)
ERX: A Fast Real-Time Anomaly Detection Algorithm for Hyperspectral Line Scanning [0.0] 本稿では、高スペクトル線走査のための既存のRXに基づく異常検出手法の問題を解決するために、指数移動RXアルゴリズム(ERX)を提案する。
ERXはJetson Xavier NX計算モジュールを用いて評価され、速度と検出性能の最良の組み合わせを実現する。
本研究は, 異常物体の分類・配置, 適応的および自動しきい値選択, 実時間フィールドテストにおける今後の研究の道を開くものである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:57:51 GMT)
Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences [0.0] Diff-Instruct++ (DI++) は,1ステップのテキスト・ツー・イメージ・ジェネレータに対して,高速に収束し,画像データのない人間の嗜好アライメント手法である。
実験セクションでは,Diffusion 1.5 と PixelArt-$alpha$ を基準拡散プロセスとして使用した DI++ を用いて,UNet ベースと DiT ベースのワンステップジェネレータを連携させる。
結果のDiTベースのワンステップテキスト・ツー・イメージモデルは、検証プロンプトデータセット上で、6.19の強い美的スコアと1.24のイメージ・リワードを達成する
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:17:18 GMT)
Data Augmentation of Multivariate Sensor Time Series using Autoregressive Models and Application to Failure Prognostics [0.0] 本研究では,非定常多変量時系列に対する新しいデータ拡張解とその故障診断への応用について述べる。
限られたサンプルから鍵情報を抽出し、PHM溶液の性能を向上させる方法として新しい合成サンプルを生成するために使用できる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:48:48 GMT)
DCT-HistoTransformer: Efficient Lightweight Vision Transformer with DCT Integration for histopathological image analysis [0.0] 視覚変換器(ViTs)を用いた乳がんの新しい軽度分類法を提案する。
離散コサイン変換(DCT)アテンションとMobileConvの並列処理経路を組み込むことで、空間領域の画像データを周波数領域に変換し、画像内の高周波数をフィルタリングするといった利点を利用する。
提案モデルでは,バイナリ分類では96.00%$pm$0.48%,マルチクラス分類では87.85%$pm$0.93%の精度が得られた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:16:56 GMT)
Contextual Biasing to Improve Domain-specific Custom Vocabulary Audio Transcription without Explicit Fine-Tuning of Whisper Model [0.0] OpenAIのWhisper Automated Speech Recognitionモデルでは、さまざまなデータセットやドメインをまたいだ一般化が優れている。
モデルパラメータを明示的に微調整したり変更したりすることなく、転写精度を向上させる手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 01:58:11 GMT)
Classifying Bicycle Infrastructure Using On-Bike Street-Level Images [0.0] 多くの潜在的なサイクリストは、適切な安全なインフラが欠如しているため、サイクリングを控えている。
自転車用スマートフォンカメラデータから利用可能なサイクリングインフラを分類できるシステムを提案する。
この研究は、自転車に搭載された携帯電話カメラから収集されたストリートレベルの画像のみを使用して、サイクリングインフラを分類した最初のものである。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 22:58:31 GMT)
Casimir repulsion turned into attraction by the nonlocal response of salted water [0.0] シリカと金の相互作用を考察し,非局所応答の影響を受けるのはゼロ周波数寄与のみであり,100,rm nm$以上の距離において支配的であることを示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:57:48 GMT)
COOL: Efficient and Reliable Chain-Oriented Objective Logic with Neural Networks Feedback Control for Program Synthesis [0.0] 論理の連鎖(CoL)は、合成段階を連鎖に整理し、合成過程を正確に制御する。
我々のアプローチは、合成をモジュール化し、ニューラルネットワークの誤予測の影響を軽減します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:16:31 GMT)
Bose-Fermi $N$-polaron state emergence from correlation-mediated blocking of phase separation [0.0] 単位充填時の1次元格子ボゾン浴中におけるフェルミオン不純物$N$について検討した。
高い種間反発で相分離を置き換える$N$ポラロン基底状態が見つかる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:36:27 GMT)
Bose-Fermi $N$-polaron state emergence from correlation-mediated blocking of phase separation [0.0] 単位充填時の1次元格子ボゾン浴中におけるフェルミオン不純物$N$について検討した。
高い種間反発で相分離を置き換える$N$ポラロン基底状態が見つかる。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:36:27 GMT)
Block encoding of matrix product operators [0.0] 本稿では,その行列積演算子(MPO)表現に基づいてハミルトニアンをブロックエンコードする手法を提案する。
より具体的には、すべてのMPOテンソルを次元$D+2$でエンコードし、$D = lceillog(chi)rceil$ は、仮想結合次元と対数的にスケールする後に縮約された量子ビットの数である。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 15:52:26 GMT)
Bielik 7B v0.1: A Polish Language Model -- Development, Insights, and Evaluation [0.0] Bielik 7B v0.1はポーランド語処理のための生成テキストモデルである。
革新的手法による言語モデル開発における重要な課題に対処する。
RAG ReaderタスクではMistral-7B-v0.1に比べて平均スコアが9パーセント向上した。
また、特にReasoning (6.15/10) と Role-playing (7.83/10) のカテゴリーにおいて、ポーランドのMT-Benchを抜粋している。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 09:16:09 GMT)
Bell's inequality in relativistic Quantum Field Theory [0.0] 相対論的量子場理論におけるベルの不等式の簡潔かつ自己完結な導入について述べる。
実スカラーの質量場を例に、真空状態におけるベルの不等式と因果相補的くさびに対する違反を例証する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 19:05:05 GMT)
BanTH: A Multi-label Hate Speech Detection Dataset for Transliterated Bangla [0.0] 我々は,37.3kサンプルからなるバングラヘイト音声データセットであるBanTHを紹介する。
サンプルはYouTubeコメントからソースされ、各インスタンスに1つ以上のターゲットグループをラベル付けする。
実験により、さらに事前訓練されたエンコーダが、BanTHデータセット上で最先端のパフォーマンスを実現していることが明らかになった。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:56:06 GMT)
An Inverse Modeling Constrained Multi-Objective Evolutionary Algorithm Based on Decomposition [0.0] 本稿では,分解(IM-C-MOEA/D)に基づく逆モデリング制約付き多目的進化アルゴリズムを提案する。
提案手法は多種多様な実世界の問題(RWMOP1-35)に対して実験的に評価され、最先端の制約付き多目的進化アルゴリズム(CMOEA)よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 23:24:44 GMT)
Aggregated Knowledge Model: Enhancing Domain-Specific QA with Fine-Tuned and Retrieval-Augmented Generation Models [0.0] 本稿では,クローズドドメイン質問応答システム(QA)の新たなアプローチを提案する。
ローレンス・バークレー国立研究所(LBL)科学情報技術(ScienceIT)ドメインの特定のニーズに焦点を当てている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 00:49:46 GMT)
Adversarial Multi-Agent Evaluation of Large Language Models through Iterative Debates [0.0] 本稿では,対話エージェントのアンサンブル内で,大規模言語モデル(LLM)を提唱者として解釈するフレームワークを提案する。
このアプローチは、従来の人間ベースの評価や自動メトリクスと比較して、よりダイナミックで包括的な評価プロセスを提供します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:42:20 GMT)
Adversarial Multi-Agent Evaluation of Large Language Models through Iterative Debates [0.0] 本稿では,対話エージェントのアンサンブル内で,大規模言語モデル(LLM)を提唱者として解釈するフレームワークを提案する。
このアプローチは、従来の人間ベースの評価や自動メトリクスと比較して、よりダイナミックで包括的な評価プロセスを提供します。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:42:20 GMT)
Absorption of a twisted photon by an electron in strong magnetic field [0.0] この研究は、シュウィンガー極限までの強い磁場における相対論的電子によるねじれた光子の吸収を研究する。
入射光子の角運動量の増加と初期電子の角運動量の増加に伴い、全吸収断面積が減少することがわかった。
我々の発見は、天体物理学的な環境において、重要な分野におけるQEDプロセスの理解を改善するのに役立ちます。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 21:11:24 GMT)
A quantum computing approach to fixed-node Monte Carlo using classical shadows [0.0] 固定ノードモンテカルロ法を用いて指数関数的なスケーリングステップを回避する手法を提案する。
H$_4$, フェロセンおよびベンゼン分子を例に挙げる。
この手法は化学的精度に到達するのに利用できるが、それを実現するためのサンプリングコストは小さい活性空間でも高い。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 16:41:25 GMT)
A distributed and parallel $(k, n)$ QSS scheme with verification capability [0.0] 本稿では、$(k, n )$の量子秘密共有方式を導入し、検証能力を付与する。
新しいプロトコルの主な特徴は、完全に分散したセットアップで完全に並列に動作する能力にある。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 11:12:38 GMT)
A Systematic Survey on Instructional Text: From Representation and Downstream NLP Tasks [0.0] 現実世界のタスクには、現在のNLPシステムでは難しい複雑なマルチステップ命令が伴うことが多い。
本研究は、この新興分野におけるトレンド、課題、機会を特定する177の論文について検討する。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 08:22:59 GMT)
A Superconducting Single-Atom Phonon Laser [0.0] 我々は、単一原子レーザーの直接量子音響等価性を実験的に実証した。
高オーバトンバルク音響共振器に結合した単一の超伝導量子ビットを用いて、フォノンラシングの開始を駆動する。
本研究では, 急激な下部溶出しきい値と特徴的な上部溶出しきい値の欠如, 単原子溶出のユニークな予測を観察した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 12:17:14 GMT)
A Neural Phillips Curve and a Deep Output Gap [0.0] 本稿では,HNN (Hemisphere Neural Network) を提案する。
まず、HNNは、高次元の回帰器を潜在状態に変換する際に生じる非線形性の教師付き推定を行う。
これとは対照的に、HNNは2021年のインフレ上昇を捉え、2020年末以降に始まった大きなポジティブなアウトプットのギャップを要因としている。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 17:20:20 GMT)
A Generalized Framework for Multiscale State-Space Modeling with Nested Nonlinear Dynamics: An Application to Bayesian Learning under Switching Regimes [0.0] ネストされた非線形力学を組み込んだマルチスケール状態空間モデリングのための一般化されたフレームワークを提案する。
私たちのフレームワークは、システム内の高速プロセスと低速プロセスの間の複雑な相互作用をキャプチャします。
我々は,スイッチングダイナミクスに対応する潜在状態と指標を推定するベイズ学習手法を開発した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:31:20 GMT)
A Counterexample in Cross-Correlation Template Matching [0.0] 基礎関数が1次元空間的に制限されたピースワイド定数関数である場合、離散的な画像登録を考える。
関数のサンプルがノイズのある場合、画像登録はデータシーケンスのアライメントとセグメンテーションを必要とする。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 18:42:01 GMT)
A Combinatorial Approach to Neural Emergent Communication [0.0] このゲームで成功したコミュニケーションには1つか2つの効果的なシンボルが必要だと我々は主張する。
ルイスシグナリングゲームにおける通信 min(|M|) を成功させるための最小のシンボル数を決定するアルゴリズムを導入する。
実験により,訓練データに対する min(|M|) の増加は創発言語における有効記号の数を増加させることを示した。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 14:54:09 GMT)
A Causal Graph-Enhanced Gaussian Process Regression for Modeling Engine-out NOx [0.0] 本研究の目的は,ガウス過程回帰を用いたNOx排出予測モデルの開発と検証である。
入力ウィンドウを持つ標準ラジアル基底関数カーネルを持つ第1、時間的依存を捉えるために畳み込みニューラルネットワークを使用するディープカーネルを組み込んだ第2、グラフ畳み込みネットワークによって導出される因果グラフでディープカーネルを豊かにする第3の3つのガウスプロセスモデルを用いている。
実測値と定性値の両方を用いて,仮想ECMセンサと比較し,入力ウィンドウと深部カーネル構造を用いた場合の予測性能の向上が得られたと結論付けた。
論文参考訳(メタデータ) (Thu, 24 Oct 2024 04:23:57 GMT)