CriticEval: Evaluating Large Language Model as Critic [110.3] CriticEvalは、大規模言語モデルの批判能力を包括的かつ確実に評価するように設計された、新しいベンチマークである。
包括性を確保するため、CriticalEvalは9つの異なるタスクシナリオの4次元から批判能力を評価する。
信頼性を確保するため、多数の批判が注釈付けされ、参照として機能する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:32:25 GMT)
Intervention Lens: from Representation Surgery to String Counterfactuals [107.0] 言語モデル(LM)の表現空間をターゲットとした介入は、モデル行動に影響を与える効果的な手段として現れてきた。
表現反事実を文字列反事実に変換する方法を提案する。
結果として生じるカウンターファクトは、データ拡張による分類のバイアスを軽減するために使用することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:18:06 GMT)
Training Language Models to Critique With Multi-agent Feedback [102.4] MultiCritique パイプラインはマルチエージェントフィードバックを利用することで LLM の批判能力を向上させる。
パイプラインは、単一のモデルではなく、複数のエージェントからの高品質な批評を集約する。
我々の微調整された7Bモデルは、他の高度な7B-13Bオープンソースモデルを大きく上回っている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:57:45 GMT)
STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [94.0] テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:59:02 GMT)
BRIEF: Bridging Retrieval and Inference for Multi-hop Reasoning via Compression [91.2] BRIEF(Bridging Retrieval and Inference through Evidence Fusion)は、クエリ対応のマルチホップ推論を実行する軽量なアプローチである。
オープンソースモデルで構築した合成データに基づいて,BRIEFはより簡潔な要約を生成する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:24:16 GMT)
Tighter Performance Theory of FedExProx [85.9] 我々は最近提案した分散最適化法であるFedExProxを再検討し,外挿による並列アルゴリズムの収束特性の向上を図った。
非強凸二次問題に対して、より厳密な線形収束率を確立するための新しい解析フレームワークを開発する。
解析の応用性はPolyak-Lojasiewicz条件を満たす一般関数に拡張され、以前の強い凸解析よりも優れていた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:53:25 GMT)
UniRAG: Universal Retrieval Augmentation for Multi-Modal Large Language Models [76.3] そこで,UniRAGというプラグイン・アンド・プレイ技術を紹介した。
一般のエンティティを用いたMSCOCOデータセットによる評価結果から,GPT-4oやGemini-Proといったプロプライエタリモデルも,UniIRモデルのようなMMレトリバーが取得した関連情報を用いて入力プロンプトを拡張した場合,生成品質を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:49:18 GMT)
EF-3DGS: Event-Aided Free-Trajectory 3D Gaussian Splatting [76.0] 生物学的ビジョンにインスパイアされたイベントカメラは、時間分解能の高い画素の強度を非同期に記録する。
本稿では,イベントカメラの利点を3DGSにシームレスに統合するイベント支援フリートラジェクトリ3DGSを提案する。
提案手法を,パブリックタンクとテンプルのベンチマークと,新たに収集した実世界のデータセットであるRealEv-DAVISで評価した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:44:24 GMT)
Do RAG Systems Cover What Matters? Evaluating and Optimizing Responses with Sub-Question Coverage [74.7] サブクエストカバレッジに基づく新しいフレームワークを導入し、RAGシステムが質問の異なる面にどのように対処するかを計測する。
このフレームワークを使用して、You.com、Perplexity AI、Bing Chatの3つの商用生成応答エンジンを評価します。
すべての回答エンジンは、バックグラウンドやフォローアップよりも、コアサブクエストを頻繁にカバーしていますが、コアサブクエストの約50%を見逃しています。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:59:34 GMT)
Synergistic Dual Spatial-aware Generation of Image-to-Text and Text-to-Image [72.0] 空間イメージ・トゥ・テキスト (SI2T) と空間テキスト・トゥ・イメージ (ST2I) は、二重形態で現れる2つの基本的なタスクである。
既存のスタンドアローンSI2TやST2Iの手法では空間的理解が不十分である。
SI2TとST2Iを2つの学習フレームワークでモデル化することを検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:47:34 GMT)
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding [71.0] 長いテキスト理解は、言語イメージ事前学習モデルにおいて大きな要求である。
通常は短いキャプションと組み合わせられ、一部のトークンは有能なトークンによって容易に覆い隠される。
データを長いキャプションで再現するが、それを直接学習することで、短い文章の理解においてパフォーマンスが低下する可能性がある。
自己構築型大規模データセットを用いて,提案手法の有効性を検証する。
長文画像検索のタスクでは、11.1%改善した長文キャプションで競合相手に勝っている点が注目に値する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:36:04 GMT)
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding [71.0] 長いテキスト理解は、言語イメージ事前学習モデルにおいて大きな要求である。
データを長いキャプションで再現するが、それを直接学習することで、短い文章の理解においてパフォーマンスが低下する可能性がある。
自己構築型大規模データセットを用いて,提案手法の有効性を検証する。
長文画像検索のタスクでは、11.1%改善した長文キャプションで競合相手に勝っている点が注目に値する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:36:04 GMT)
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding [71.0] 長いテキスト理解は、言語イメージ事前学習モデルにおいて大きな要求である。
データを長いキャプションで再現するが、それを直接学習することで、短い文章の理解においてパフォーマンスが低下する可能性がある。
自己構築型大規模データセットを用いて,提案手法の有効性を検証する。
長文画像検索のタスクでは、11.1%改善した長文キャプションで競合相手に勝っている点が注目に値する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:36:04 GMT)
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding [71.0] 長いテキスト理解は、言語イメージ事前学習モデルにおいて大きな要求である。
データを長いキャプションで再現するが、それを直接学習することで、短い文章の理解においてパフォーマンスが低下する可能性がある。
自己構築型大規模データセットを用いて,提案手法の有効性を検証する。
長文画像検索のタスクでは、11.1%改善した長文キャプションで競合相手に勝っている点が注目に値する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:36:04 GMT)
ConU: Conformal Uncertainty in Large Language Models with Correctness Coverage Guarantees [68.3] 自己整合性理論に基づく新しい不確実性尺度を導入する。
次に,CPアルゴリズムに正当性に整合した不確かさ条件を組み込むことにより,適合性不確かさの基準を策定する。
実証的な評価は、我々の不確実性測定が過去の最先端手法よりも優れていることを示している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:17:20 GMT)
Cross-Modality Perturbation Synergy Attack for Person Re-identification [66.5] 相互モダリティReIDの主な課題は、異なるモダリティ間の視覚的差異を効果的に扱うことである。
既存の攻撃方法は、目に見える画像のモダリティの特徴に主に焦点を当てている。
本研究では,クロスモーダルReIDに特化して設計されたユニバーサル摂動攻撃を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:41:28 GMT)
Mind the Gap Between Prototypes and Images in Cross-domain Finetuning [65.0] プロトタイプと画像にそれぞれ異なる変換を適用するために,コントラスト型プロトタイプイメージ適応(CoPA)を提案する。
Meta-Datasetの実験では、CoPAが最先端のパフォーマンスをより効率的に達成できることが示されている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:25:18 GMT)
Unveiling and Consulting Core Experts in Retrieval-Augmented MoE-based LLMs [65.0] RAGシステムの有効性に寄与する内部メカニズムは未解明のままである。
実験の結果,複数のコアグループの専門家がRAG関連行動に主に関与していることが判明した。
本稿では,専門家の活性化を通じてRAGの効率性と有効性を高めるためのいくつかの戦略を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:08:54 GMT)
BoostAdapter: Improving Test-Time Adaptation via Regional Bootstrapping [64.8] 本稿では,テスト時間適応フレームワークを提案する。
我々は、インスタンスに依存しない履歴サンプルとインスタンスを意識したブースティングサンプルから特徴を検索するための軽量なキー値メモリを維持している。
理論的には,本手法の背後にある合理性を正当化し,アウト・オブ・ディストリビューションとクロスドメイン・データセットの両方において,その有効性を実証的に検証する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:58:43 GMT)
Model X-ray:Detecting Backdoored Models via Decision Boundary [62.7] バックドア攻撃はディープニューラルネットワーク(DNN)に重大な脆弱性をもたらす
図形化された2次元(2次元)決定境界の解析に基づく新しいバックドア検出手法であるモデルX線を提案する。
提案手法は,クリーンサンプルが支配する意思決定領域とラベル分布の集中度に着目した2つの戦略を含む。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:19:04 GMT)
LoRA-IR: Taming Low-Rank Experts for Efficient All-in-One Image Restoration [62.4] 高速なオールインワン画像復元を実現するために,コンパクトな低ランクの専門家を動的に活用する,フレキシブルなフレームワークであるLoRA-IRを提案する。
LoRA-IRは、劣化誘導前訓練とパラメータ効率の良い微調整の2つの訓練段階で構成されている。
LoRA-IRは14のイメージ復元タスクと29のベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:00:24 GMT)
Layout-your-3D: Controllable and Precise 3D Generation with 2D Blueprint [61.3] テキストプロンプトから制御可能で構成可能な3D生成が可能なフレームワークを提案する。
提案手法は2次元レイアウトを青写真として活用し,3次元生成の精密かつ確実な制御を容易にする。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:41:50 GMT)
LAVIB: A Large-scale Video Interpolation Benchmark [58.2] LAVIBは、Webから自動パイプラインを通じてソースされる高解像度ビデオの大規模なコレクションで構成されている。
各ビデオの運動の大きさ、輝度条件、フレームのシャープネス、コントラストについてメトリクスが計算される。
LAVIBには17KのUltra-HDビデオから283Kのクリップが含まれ、77.6時間に及ぶ。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:44:30 GMT)
Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.0] 身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:57:03 GMT)
FinerCut: Finer-grained Interpretable Layer Pruning for Large Language Models [54.8] FinerCutは変圧器ネットワークのための微細な層プルーニングの新たな形式である。
Llama3-8Bは25%の層を除去し,Llama3-70Bは95%の層を除去した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:10:25 GMT)
Semantic Segmentation in Satellite Hyperspectral Imagery by Deep Learning [54.1] 本稿では1D-Justo-LiuNetという軽量な1D-CNNモデルを提案する。
1D-Justo-LiuNetは、全てのテストモデルの中で最小のモデルサイズ (4,563 パラメータ) を持つ最大精度 (0.93) を達成する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:46:12 GMT)
CrossDF: Improving Cross-Domain Deepfake Detection with Deep Information Decomposition [53.9] クロスデータセットディープフェイク検出(CrossDF)の性能を高めるためのディープ情報分解(DID)フレームワークを提案する。
既存のディープフェイク検出方法とは異なり、我々のフレームワークは特定の視覚的アーティファクトよりも高いレベルのセマンティック特徴を優先する。
顔の特徴をディープフェイク関連情報と無関係情報に適応的に分解し、本質的なディープフェイク関連情報のみを用いてリアルタイム・フェイク識別を行う。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:06:55 GMT)
GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.7] ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 03:45:50 GMT)
Scene Graph Generation with Role-Playing Large Language Models [50.3] オープン語彙シーングラフ生成(OVSGG)に対する現在のアプローチは、CLIPのような視覚言語モデルを使用している。
シーン固有の記述に基づくOVSGGフレームワークであるSDSGGを提案する。
対象と対象の複雑な相互作用を捉えるために,相互視覚アダプタと呼ばれる軽量モジュールを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:40:31 GMT)
Tandem Transformers for Inference Efficient LLMs [49.8] これらの問題に対処するために,新しいアーキテクチャであるタンデム変換器を導入する。
このアーキテクチャは、小さな自己回帰モデルとブロックモードで動作する大きなモデルを組み合わせたものである。
PaLM2プレトレーニングデータセットでは、PaLM2-BisonとPaLM2-Geckoのタンデムが次点予測精度を3.3%改善している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:34:16 GMT)
A Survey of Hallucination in Large Visual Language Models [48.8] 幻覚の存在は、様々な分野におけるLVLMの可能性と実用性を制限している。
LVLMの構造と幻覚の発生の主な原因を紹介する。
LVLMの幻覚評価ベンチマークについて述べる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:58:58 GMT)
ContextDet: Temporal Action Detection with Adaptive Context Aggregation [47.8] 時間的行動検出(TAD)のための単一ステージContextDetフレームワークを提案する。
我々のモデルは、ピラミッド適応型コンテキスト拡張(ACA)アーキテクチャ、長いコンテキストのキャプチャ、行動識別性の改善を特徴としている。
ACAピラミッド全体にわたるこれらの大きなカーネルの長さを変えることで、我々のモデルは軽量で効果的なコンテキストアグリゲーションとアクション識別を提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:28:19 GMT)
CROPE: Evaluating In-Context Adaptation of Vision and Language Models to Culture-Specific Concepts [45.8] 文化固有の概念の知識を探索するための視覚的質問応答ベンチマークであるCROPEを紹介する。
いくつかの最先端のオープンビジョンと言語モデルの評価は、文化固有の概念と共通の概念の相違が大きいことを示す。
文脈知識を用いた実験は、モデルがマルチモーダル情報を効果的に活用し、文化固有の概念を描写に結びつけるのに苦労していることを示している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:31:19 GMT)
Keep Guessing? When Considering Inference Scaling, Mind the Baselines [45.2] 大規模言語モデルにおける推論計算のスケーリングは、サンプルの数が増えるにつれて、常にカバレッジ(問題解決の限界)を増大させる。
我々は、この観察された改善は、標準評価ベンチマークの回答分布が比較的小さな共通回答の集合に傾いていることによるものであると推測する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:43:05 GMT)
The Fermionic Entanglement Entropy and Area Law for the Relativistic Dirac Vacuum State [45.0] ミンコフスキー時空の有界空間領域における自由ディラック場に対するフェルミオンエンタングルメントエントロピーを考える。
領域法則は、体積が無限大に近づき、正規化の長さが0になるような制限の場合において証明される。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:47:41 GMT)
SemiCD-VL: Visual-Language Model Guidance Makes Better Semi-supervised Change Detector [43.2] Change Detection (CD) は、画像間のセマンティックな変化でピクセルを識別することを目的としている。
VLM誘導に基づく半教師付きCD手法,すなわちSemiCD-VLを提案する。
本稿では,VLMに基づく混合変化イベント生成(CEG)戦略を提案し,ラベルなしCDデータに対して擬似ラベルを出力する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:08:01 GMT)
Neural Normalized Compression Distance and the Disconnect Between Compression and Classification [43.0] 我々はNeural NCDを開発し、LLMをgzipのような古典的な汎用アルゴリズムと比較する。
分類精度は圧縮速度だけでは予測できない。
我々の結果は、ニューラルネットワークが圧縮する意味に関する我々の直感が、まだよく理解されていないことを示唆している」。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:31:56 GMT)
EVA: An Embodied World Model for Future Video Anticipation [42.9] 複雑なビデオ予測を4つのメタタスクに分解し、世界モデルがこの問題をよりきめ細かな方法で処理できるようにする。
本稿では,Embodied Video Precipation Benchmark (EVA-Bench) という新しいベンチマークを導入する。
本稿では,映像理解と生成を目的とした統合フレームワークであるEmbodied Video Precipator (EVA)を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:24:00 GMT)
Hey GPT, Can You be More Racist? Analysis from Crowdsourced Attempts to Elicit Biased Content from Generative AI [42.0] 本研究は,GenAIツールから偏りのあるアウトプットを抽出するプロンプトの設計に参加者が挑戦する大学レベルのコンペから得られた知見を提示する。
我々は、競争の提出を定量的に質的に分析し、GenAIにおける多様なバイアスと、GenAIにおけるバイアスを誘発する参加者の戦略を同定する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:44:45 GMT)
Robust RL with LLM-Driven Data Synthesis and Policy Adaptation for Autonomous Driving [41.9] 本稿では、政治強化学習エージェントを学習するための新しいフレームワークであるRAPIDを紹介する。
LLMベースの運転エージェントで合成されたデータとオンライン適応を用いて、警察のRLエージェントを専門に訓練する。
異なるタスクへの適応性を維持しながら、LLM知識の堅牢性を低減する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:35:34 GMT)
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers [41.8] Sanaは4096$times$4096解像度までの画像を生成できるテキスト・ツー・イメージのフレームワークである。
Sanaは、高解像度で高品質な画像を、強力なテキストイメージアライメントで驚くほど高速に合成し、ラップトップGPUにデプロイすることができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:35:31 GMT)
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers [41.8] Sanaは4096$times$4096解像度までの画像を生成できるテキスト・ツー・イメージのフレームワークである。
Sanaは、高解像度で高品質な画像を、強力なテキストイメージアライメントで驚くほど高速に合成し、ラップトップGPUにデプロイすることができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:35:31 GMT)
ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization [41.1] Online Reward Selection and Policy Optimization (ORSO)は、オンラインモデル選択問題として報酬選択を形作る新しいアプローチである。
ORSOは、人間の介入なしに有望な報酬関数を自動的に識別するために、原則化された探索戦略を採用している。
我々はIsaac Gymシミュレータを用いて,様々な連続制御タスクに対してORSOの有効性を示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:23:14 GMT)
IPO: Interpretable Prompt Optimization for Vision-Language Models [40.8] 本稿では,シンプルだが解釈可能なプロンプト(IPO)を紹介する。
IPOは大規模言語モデル(LLM)を使用してテキストプロンプトを動的に生成する。
画像記述を生成することで、視覚的内容の条件付けに大型マルチモーダルモデル(LMM)を組み込む。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:10:22 GMT)
Mitigating Forgetting in LLM Supervised Fine-Tuning and Preference Learning [40.4] SFTとRLHF/DPOのトレードオフの観点から,逐次後トレーニングが準最適であることを示す。
本稿では,理論収束保証と逐次後学習フレームワークの性能を実証的に向上した実践的後学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:38:41 GMT)
RoMemes: A multimodal meme corpus for the Romanian language [39.6] 複数のアノテーションレベルを持つ実ミームをルーマニア語でキュレートしたデータセットを導入する。
結果は、インターネットのミームに直面するとき、AIツールの処理能力を改善するためにさらなる研究が必要であることを示唆している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:26:53 GMT)
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers [38.4] モデルは、高解像度で高品質な画像を、強いテキストイメージアライメントで驚くほど高速に合成することができる。
Model-0.6Bは16GBのラップトップGPU上に展開でき、1秒未満で1024$times$1024の解像度画像を生成する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:35:31 GMT)
Causality for Large Language Models [37.1] 数十億または数兆のパラメータを持つ大規模言語モデル(LLM)は、膨大なデータセットでトレーニングされており、一連の言語タスクで前例のない成功を収めている。
近年の研究では、LLMは因果オウムとして機能し、因果知識を真に理解したり応用したりすることなくリサイクリングすることができることが強調されている。
本調査は, ライフサイクルのすべての段階において, 因果性がどのようにLCMを強化するかを検討することを目的としている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:22:23 GMT)
Heterogeneous Graph Reinforcement Learning for Dependency-aware Multi-task Allocation in Spatial Crowdsourcing [33.9] 本稿では,依存性を考慮したマルチタスクアロケーション(DMA)の問題点を公式に検討する。
Heterogeneous Graph Reinforcement Learning-based Task Allocation (HGRL-TA)として知られる、それを解決するためのよく設計されたフレームワークを提供する。
実験結果は、提案されたHGRL-TAのDMA問題を解決する効果と一般性を示し、メタヒューリスティック法を用いて達成したよりも21.78%高い平均利益をもたらす。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:00:45 GMT)
M-RewardBench: Evaluating Reward Models in Multilingual Settings [33.4] 我々は、M-RewardBenchというマルチリンガルRM評価ベンチマークを構築した。
M-RewardBenchは23の類型的に多様な言語に対する2.87kの好みのインスタンスで構成されている。
RMの性能が向上し,翻訳品質が向上したことを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:09:44 GMT)
Quality Prediction of AI Generated Images and Videos: Emerging Trends and Opportunities [32.0] AIが生成し、拡張されたコンテンツは、視覚的に正確で、意図された使用に固執し、高い視覚的品質を維持する必要がある。
AI生成および強化されたコンテンツの視覚的“品質”を監視し制御するひとつの方法は、画像品質アセスメント(IQA)とビデオ品質アセスメント(VQA)モデルをデプロイすることである。
本稿では,AIが生成・拡張した画像・映像コンテンツによる現状の問題点と可能性について検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:00:39 GMT)
Quality Prediction of AI Generated Images and Videos: Emerging Trends and Opportunities [32.0] AIが生成し、拡張されたコンテンツは、視覚的に正確で、意図された使用に固執し、高い視覚的品質を維持する必要がある。
AI生成および強化されたコンテンツの視覚的“品質”を監視し制御するひとつの方法は、画像品質アセスメント(IQA)とビデオ品質アセスメント(VQA)モデルをデプロイすることである。
本稿では,AIが生成・拡張した画像・映像コンテンツによる現状の問題点と可能性について検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:00:39 GMT)
Attention Is All You Need for LLM-based Code Vulnerability Localization [30.5] 手動のコード監査やルールベースのツールなど、従来の脆弱性のローカライゼーションの方法は、多くの場合、時間をかけてスコープに制限される。
本稿では,大規模言語モデルに固有の自己認識機構を活用する新しいフレームワークであるLOVAを紹介する。
LOVA は既存の LLM ベースのアプローチよりも大幅に優れており,F1 スコアの最大 5.3 倍の改善が達成されている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:02:18 GMT)
MIRA: A Method of Federated MultI-Task Learning for LaRge LAnguage Models [29.7] 大規模言語モデル(LLM)の微調整手法を提案する。
提案手法は,各クライアントモデルの構造を利用して,他のクライアントのタスクやデータ分散を考慮した学習手法を実現する。
実験結果は,異なるデータセットとモデルを用いて,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:24:40 GMT)
How Free is Parameter-Free Stochastic Optimization? [29.2] パラメータフリー最適化の問題について検討し、パラメータフリーな手法が存在するかどうかを問う。
既存の手法は、真の問題パラメータに関するいくつかの非自明な知識を必要とするため、部分的にはパラメータフリーとみなすことができる。
単純なハイパーサーチ手法により、より洗練された最先端アルゴリズムより優れたパラメータフリーな手法が実現できることを実証する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:36:13 GMT)
A Closer Look into Mixture-of-Experts in Large Language Models [26.5] エクササイズ・オブ・エクササイズ(Mixture-of-experts, MOE)は,その特性と顕著な性能から注目を集めている。
MoEアーキテクチャは計算効率を犠牲にすることなくモデルサイズを増大させることができる。
本稿は,MoEベースの大規模言語モデルの内部動作を理解するための最初の試みである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:21:53 GMT)
ConTReGen: Context-driven Tree-structured Retrieval for Open-domain Long-form Text Generation [26.4] 長い形式のテキスト生成には、幅と深さの両方で複雑なクエリに対処する一貫性のある包括的な応答が必要である。
既存の反復的な検索拡張生成アプローチは、複雑なクエリの各側面を深く掘り下げるのに苦労することが多い。
本稿では,コンテキスト駆動型木構造検索手法を用いた新しいフレームワークであるConTReGenを紹介する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 21:17:05 GMT)
Revisit, Extend, and Enhance Hessian-Free Influence Functions [26.1] 影響関数は、モデルの解釈、サブセットのトレーニングセットの選択などにおけるサンプルの影響を評価する重要なツールとして機能する。
本稿では,Trac として知られる特定の有効近似法を再検討する。
この方法は、ヘッセン行列の逆を恒等行列で置き換える。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:10:36 GMT)
Performance-Driven QUBO for Recommender Systems on Quantum Annealers [26.1] 我々は,個々の特徴と特徴の組み合わせがモデル性能に与える影響を測定するために,反実解析を用いる。
提案手法は, 量子アニーラーの係数行列を構成するために, 推奨系の最適特徴組合せを選択するために用いられる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:05:18 GMT)
Downstream Trade-offs of a Family of Text Watermarks [25.4] 多様なタスク群に対する3つの異なる戦略を用いて,LLMの性能評価を行った。
電子透かしは全てのタスクにおいて LLM の有効性を著しく低下させる可能性がある。
この結果から,透かしモデルを用いた場合,ユーザが認識すべきトレードオフが浮き彫りになった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:02:24 GMT)
Reverse Question Answering: Can an LLM Write a Question so Hard (or Bad) that it Can't Answer? [24.6] 過去のワークテストでは、個別にQAとRQAをテストしたが、それらを共同でテストし、それらの難しさを比較し、ベンチマーク設計を支援し、推論整合性を評価する。
1) 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA, 対数QA
論文参考訳(メタデータ) (Sun, 20 Oct 2024 21:17:49 GMT)
MedLogic-AQA: Enhancing Medical Question Answering with Abstractive Models Focusing on Logical Structures [24.3] 本稿では、文脈と質問から抽出した一階述語論理(FOL)に基づく規則を利用して、よく理解された回答を生成する新しい抽象QAシステムMedLogic-AQAを提案する。
この論理的推論と抽象的 QA との独特の融合は、論理的に健全で、関連性があり、係り合う答えを生み出すために我々のシステムに等しい。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:29:38 GMT)
Observation of quantum information collapse-and-revival in a strongly-interacting Rydberg atom array [24.0] Rydberg 原子アレイにおける時間外相関器とHolevo情報の最初の測定結果を示す。
これらのツールを利用することで、量子情報の新しい時間的崩壊・復活挙動を観察する。
我々の実験は、運動的制約のある多体システムにおけるユニークな情報力学に光を当てている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:44:39 GMT)
Back to School: Translation Using Grammar Books [23.8] 高資源言語のための機械翻訳システムは、非常によく機能し、高品質な翻訳を生成する。
ほとんどの言語は高い資源とはみなされず、そのようなシステムを訓練するのに必要な並列文の量が不足している。
しかし、これらの未表現言語はリソースを欠くものではなく、言語資料としてバイリンガル辞書や文法書が利用可能である。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 03:28:51 GMT)
ORLA*: Mobile Manipulator-Based Object Rearrangement with Lazy A Star [23.5] マルチオブジェクト再構成は移動マニピュレータにとって必須のスキルである。
我々の知る限り、移動マニピュレータのための時間最適多目的再構成ソリューションは、まだ未解決の研究方向である。
高品質なオブジェクトのピック・アンド・プレイスシーケンスの探索に遅延(遅延)評価を利用するORLA*を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:23:35 GMT)
Lossless KV Cache Compression to 2% [23.0] この研究は、KVキャッシュを元のサイズの2%未満に圧縮することを目的とした、新しいアーキテクチャであるCLLA(Cross-Layer Latent Attention)を導入している。
CLLAは、アテンションヘッド/ディメンション低減、レイヤ共有、量子化技術を結合的なフレームワークに統合する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:17:35 GMT)
CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-Judges [21.6] 推論中に選択バイアスを緩和する新しいラベルフリー手法であるCalibraEvalを紹介する。
CalibraEvalは、バイアスのない予測分布に合わせて観測された予測分布を調整するための最適化タスクとしてデバイアスを再構成する。
本稿では,CalibraEvalが選択バイアスを効果的に軽減し,既存のデバイアス法と比較して性能を向上させることを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:47:39 GMT)
Amortized Probabilistic Conditioning for Optimization, Simulation and Inference [20.3] Amortized Conditioning Engine (ACE)
興味のある潜伏変数を明示的に表現するトランスフォーマーベースのメタラーニングモデル。
ACEは、観測されたデータと解釈可能な潜伏変数の両方、実行時のプリエントを含めることができ、離散的かつ連続的なデータと潜伏変数の予測分布を出力する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:22:54 GMT)
Interpreting and Analyzing CLIP's Zero-Shot Image Classification via Mutual Knowledge [20.1] Contrastive Language-Image Pretraining (CLIP)は画像とテキストのクラス表現を共有埋め込み空間にマッピングすることでゼロショット画像分類を行う。
この研究は、2つのモード間の相互知識のレンズから、画像分類のためのCLIPモデルを解釈するための新しいアプローチを提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:38:09 GMT)
Hybrid Memory Replay: Blending Real and Distilled Data for Class Incremental Learning [19.7] インクリメンタルラーニング(IL)は、従来のタスクから学んだ知識を維持しつつ、現在のタスクから新しい知識を取得することを目的としている。
リプレイベースのILメソッドは、以前のタスクをバッファに格納し、新しいタスクを学ぶ際にそれらを再生する。
データ蒸留(DD)は、大規模な実データセットを、より情報に適合した合成例のセットに凝縮することで、模範バッファのサイズを減らすことができる。
本稿では,歴史に残るチェックポイントのスライディングウィンドウから合成データを蒸留するDDの革新的な改良を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:13:32 GMT)
Conditional Uncertainty Quantification for Tensorized Topological Neural Networks [19.6] グラフニューラルネットワーク(GNN)は,グラフ構造化データを解析するためのデファクトスタンダードとなっている。
近年の研究では、GNNによる不確実性推定の統計的信頼性に関する懸念が高まっている。
本稿では,交換不能なグラフ構造化データの不確かさを定量化する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 01:03:40 GMT)
Open-vocabulary vs. Closed-set: Best Practice for Few-shot Object Detection Considering Text Describability [19.5] 現実世界のアプリケーションでは、ターゲットクラスの概念をテキストで記述することはしばしば困難である。
マイクロショット物体検出(FSOD)の需要が高い。
OVDの利点は、テキストで記述するのが難しいオブジェクトクラスに対してFSODに拡張できるだろうか?
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:59:35 GMT)
EPIC: Efficient Position-Independent Context Caching for Serving Large Language Models [19.5] EPICは、大きな言語モデルのための位置非依存のコンテキストキャッシュを導入している。
EPICはTTFTの最大8倍のスループットと既存のシステムに対する7倍のスループットを提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:42:29 GMT)
"What is the value of {templates}?" Rethinking Document Information Extraction Datasets for LLMs [19.1] K2Qは、KIEからベスポークテンプレートを多用したプロンプト応答形式に変換された5つのデータセットの集合である。
K2Q上の7つのベースライン生成モデルの性能をゼロショットプロンプトと経験的に比較した。
多様な複雑なKIE質問を作成すれば,VRDUモデルの性能と堅牢性が向上することがわかった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:42:30 GMT)
Quantitative Certification of Bias in Large Language Models [18.9] 大規模言語モデル(LLM)は、表現障害を引き起こすバイアスのある応答を生成することができる。
提案するQuaCer-Bは,プロンプトの分布の偏りをLLMに認定する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:10:31 GMT)
IKDP: Inverse Kinematics through Diffusion Process [18.6] ロボット工学において、エンドポイントが空間内の特定の目標に達するように、ロボットの各関節の位置を特定することは一般的な問題である。
IK計算の解法を統合するために,条件付き脱ノイズ拡散確率モデルを用いる方法を示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:21:04 GMT)
Learning Capacity: A Measure of the Effective Dimensionality of a Model [18.5] モデルの有効次元の尺度である「学習能力」と呼ばれる量について検討する。
学習能力は、(a)テスト損失と相関し、典型的なデータセットでトレーニングされた多くのディープネットワークのパラメータのごく一部であるため、複雑さの有用な概念であることを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:11:49 GMT)
Fractional-order spike-timing-dependent gradient descent for multi-layer spiking neural networks [18.1] 本稿では,数次スパイクタイピング依存勾配勾配(FOSTDGD)学習モデルを提案する。
TheNISTとDVS128 Gestureデータセットでテストし、その精度を異なるネットワーク構造と分数順序で分析する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:31:34 GMT)
Towards Trustworthy Knowledge Graph Reasoning: An Uncertainty Aware Perspective [17.4] 我々は、新しい信頼できるKG-LLMフレームワーク、Uncertainty Aware Knowledge-Graph Reasoning (UAG)を提案する。
本研究では, 整合予測を利用した不確実性を考慮した多段階推論フレームワークを設計し, 予測セットに対する理論的保証を提供する。
提案するUAGは,予測セット/インターバルサイズを平均40%削減しながら,事前定義されたカバレッジ率を達成することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:35:09 GMT)
Towards Trustworthy Knowledge Graph Reasoning: An Uncertainty Aware Perspective [17.4] 我々は、新しい信頼できるKG-LLMフレームワーク、Uncertainty Aware Knowledge-Graph Reasoning (UAG)を提案する。
本研究では, 整合予測を利用した不確実性を考慮した多段階推論フレームワークを設計し, 予測セットに対する理論的保証を提供する。
提案するUAGは,予測セット/インターバルサイズを平均40%削減しながら,事前定義されたカバレッジ率を達成することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:35:09 GMT)
When and Where Did it Happen? An Encoder-Decoder Model to Identify Scenario Context [17.0] 情報抽出のコンテキスト化は、知識グラフとして集約する際の自動フィニングの有効性を調査するのに役立ちます。
提案手法では,エンコーダ・デコーダアーキテクチャをトレーニングするために,疫学論文のコーパス内で,高品質な時間と位置アノテーションのデータセットを使用する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:39:46 GMT)
When and Where Did it Happen? An Encoder-Decoder Model to Identify Scenario Context [17.0] 情報抽出のコンテキスト化は、知識グラフとして集約する際の自動フィニングの有効性を調査するのに役立ちます。
提案手法では,エンコーダ・デコーダアーキテクチャをトレーニングするために,疫学論文のコーパス内で,高品質な時間と位置アノテーションのデータセットを使用する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:39:46 GMT)
Faster-GCG: Efficient Discrete Optimization Jailbreak Attacks against Aligned Large Language Models [16.9] 本稿では,GCGの設計を深く掘り下げて,効率の良い逆ジェイルブレイク法であるFaster-GCGを提案する。
実験により、高速GCGは計算コストのたった1/10で元のGCGを超えることができることが示された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:27:41 GMT)
Physically Guided Deep Unsupervised Inversion for 1D Magnetotelluric Models [16.9] 我々は物理で導かれた新しいディープ・インバージョン・アルゴリズムを提案し、1Dマグネトロンモデル(MT)を推定する。
本手法では,コスト関数の最小化を物理的に導く,微分可能なモデリング演算子を用いる。
提案手法は, 異なる周波数でのフィールドデータと合成データを用いて検証し, 取得モデルが他の結果よりも精度が高いことを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:17:59 GMT)
Intermediate Representations for Enhanced Text-To-Image Generation Using Diffusion Models [16.8] 2つの段階に基づくテキスト・画像生成のための合成手法を提案する。
第1段階では,テキストに条件付けされた1つ以上の中間表現を生成する拡散に基づく生成モデルを設計する。
第2段階では、これらの表現をテキストとともに、別個の拡散ベース生成モデルを用いて最終出力画像にマッピングする。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:07:08 GMT)
Generating Intermediate Representations for Compositional Text-To-Image Generation [16.8] 2つの段階に基づくテキスト・画像生成のための合成手法を提案する。
第1段階では,テキストに条件付けされた1つ以上の中間表現を生成する拡散に基づく生成モデルを設計する。
第2段階では、これらの表現をテキストとともに、別個の拡散ベース生成モデルを用いて最終出力画像にマッピングする。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:07:08 GMT)
MMCS: A Multimodal Medical Diagnosis System Integrating Image Analysis and Knowledge-based Departmental Consultation [16.5] MMCSは、医療画像や患者の顔の詳細を認識できるシステムである。
第1の構成要素は、医療画像とビデオの分析である。
第2の要素は、専門的な医療反応の生成である。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:31:05 GMT)
LAC: Graph Contrastive Learning with Learnable Augmentation in Continuous Space [16.3] 直交連続空間における学習可能なデータ拡張を伴うグラフコントラスト学習フレームワークであるLACを紹介する。
拡張中にグラフデータ中の代表情報をキャプチャするために,連続的なビューオーグメンタを導入する。
本稿ではInfoBalという情報理論の原理を提案し,それに対応する前提課題を提案する。
実験の結果,LACは最先端のフレームワークよりも優れていた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:47:15 GMT)
Translation Canvas: An Explainable Interface to Pinpoint and Analyze Translation Systems [16.1] 本稿では,翻訳システムの性能をピンポイントし解析するための説明可能なインタフェースであるTranslation Canvasを紹介する。
エラースパンを説明付きで強調し、システムの予測を選択的に表示することで、きめ細かい分析をサポートする。
人間による評価によると、Translation CanvasはCOMETやSacreBLEUパッケージよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:10:57 GMT)
Dependency-Aware Semi-Structured Sparsity of GLU Variants in Large Language Models [15.6] 大規模言語モデルに対する依存性を意識した半構造化スパシティ(DaSS)を提案する。
DaSSは構造依存をマグニチュードベースのプルーニングに組み込む。
LLaMA2, Mistral, Gemmaモデルファミリーの実証評価では、DaSSはSparseGPTとWandaの両方でハードウェアフレンドリーなN:Mスペーサティパターンを実現している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:27:26 GMT)
Large Language Models for Autonomous Driving (LLM4AD): Concept, Benchmark, Simulation, and Real-Vehicle Experiment [15.5] 大規模言語モデル(LLM)は、自律運転システムの様々な側面を強化する可能性を秘めている。
本稿では,LLMを自動走行(LLM4AD)用に設計するための新しい概念とアプローチを紹介する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:36:19 GMT)
Can LVLMs Describe Videos like Humans? A Five-in-One Video Annotations Benchmark for Better Human-Machine Comparison [15.4] ビデオ記述は、ビデオ理解を評価するための基本的なタスクであり、空間的・時間的ダイナミクスの深い理解を必要とする。
ビデオ理解のための現在のベンチマークには、短いビデオの長さ、短いアノテーション、単一アノテーションの観点への依存など、注目すべき制限がある。
本稿では,LVLMと人間の理解の相違をより包括的に評価するための新しいベンチマークFIOVAを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 03:59:54 GMT)
When Machine Unlearning Meets Retrieval-Augmented Generation (RAG): Keep Secret or Forget Knowledge? [15.3] 大規模言語モデル(LLM)は、トレーニング中に機密情報や有害なコンテンツを不注意に学習し、保持することができる。
本稿では,RAG(Retrieval-Augmented Generation)技術に基づく軽量なアンラーニングフレームワークを提案する。
われわれはChatGPT, Gemini, Llama-2-7b-chat-hf, PaLM 2 など,オープンソースおよびクローズドソースモデルの広範な実験を通じてフレームワークを評価する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 03:51:01 GMT)
A Novel Characterization of the Population Area Under the Risk Coverage Curve (AURC) and Rates of Finite Sample Estimators [15.3] 重み付きリスク関数として解釈可能なAURCのより直接的な表現を導入し,モンテカルロプラグイン推定器を提案する。
複数のデータセットにまたがる包括的なベンチマークにおいて、この推定器の有効性を実証的に示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:14:51 GMT)
Generating Tabular Data Using Heterogeneous Sequential Feature Forest Flow Matching [15.1] フォレストフロー (FF) 法の限界を克服するために, 不均質なシークエンシャル・フィーチャー・フォレストフロー (HS3F) を開発した。
HS3Fはシーケンシャルに(機能ごとに)データを生成し、ノイズのある初期条件への依存を減らす。
25のデータセットによる実験では、HS3FはFFよりも高品質で多様な合成データを生成する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 21:55:07 GMT)
From Prohibition to Adoption: How Hong Kong Universities Are Navigating ChatGPT in Academic Workflows [14.9] 本稿では,香港の大学がChatGPTを禁止していた時期と,それが学術的プロセスに統合された時代を比較検討する。
技術における完全性や倫理的な問題に対する懸念から、機関はAIリテラシーと責任政策を採用する中心に向かって動き始めた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:22:01 GMT)
From Prohibition to Adoption: How Hong Kong Universities Are Navigating ChatGPT in Academic Workflows [14.9] 本稿では,香港の大学がChatGPTを禁止していた時期と,それが学術的プロセスに統合された時代を比較検討する。
技術における完全性や倫理的な問題に対する懸念から、機関はAIリテラシーと責任政策を採用する中心に向かって動き始めた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:22:01 GMT)
From Prohibition to Adoption: How Hong Kong Universities Are Navigating ChatGPT in Academic Workflows [14.9] 本稿では,香港の大学がChatGPTを禁止していた時期と,それが学術的プロセスに統合された時代を比較検討する。
技術における完全性や倫理的な問題に対する懸念から、機関はAIリテラシーと責任政策を採用する中心に向かって動き始めた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:22:01 GMT)
Diffusion Model Based Posterior Sampling for Noisy Linear Inverse Problems [14.8] 本稿では、簡単な閉形式近似を確率スコアに提案することにより、高速で効果的な解を提案する。
拡散モデルとフローベースモデルの両方において、様々な雑音線形逆問題に対して広範な実験を行う。
提案手法は,全ての基本手法よりもはるかに高速でありながら,高い競争力あるいはより優れた復元性能を示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:19:11 GMT)
SDP4Bit: Toward 4-bit Communication Quantization in Sharded Data Parallelism for LLM Training [14.7] 分散トレーニング、特にSharded Data Parallelism(ShardedDP)は、トレーニング時間とメモリ使用量を軽減する重要なテクニックとして登場した。
ShardedDPのスケーラビリティにおける大きな課題は、重みと勾配の集中的なコミュニケーションである。
本稿では,2つの新しい手法により,重みと勾配の通信を4ビット程度に効果的に削減するSDP4Bitを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:36:02 GMT)
A Remedy to Compute-in-Memory with Dynamic Random Access Memory: 1FeFET-1C Technology for Neuro-Symbolic AI [14.5] ニューロシンボリック人工知能(AI)は、ノイズや一般化されたパターンから学習し、論理的推論を行い、解釈可能な推論を提供する。
現在のハードウェアは、'neuro'と'symbolic'コンポーネント間の動的リソース割り当てを必要とするアプリケーションに対応するのに苦労している。
ニューロシンボリックAIの基本処理要素として強誘電体電荷領域計算メモリ(CiM)アレイを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:52:03 GMT)
Bayesian data fusion for distributed learning [14.4] 連邦学習(FL)の主な課題の1つは、非独立で同一に分散された(非IID)クライアントデータを扱うことである。
本稿では、クライアントをクラスタに関連付けるクラスタ化FLのための統一ベイズフレームワークを提案する。
この作業は、クライアントとクラスタの関連に関する洞察を提供し、新しい方法でクライアントの知識共有を可能にする。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:11:24 GMT)
Parenting: Optimizing Knowledge Selection of Retrieval-Augmented Language Models with Parameter Decoupling and Tailored Tuning [14.4] 本稿では,Large Language Models (LLMs) のパラメータ空間におけるアテンデンスとロバスト性を分離する新しいフレームワークであるParentingを提案する。
ペアレンティングでは、異なる能力を表すパラメータ単位に対して、特定のかつ適切な微調整手法を適用し、密着性と堅牢性のバランスよく向上することを目的として、タイプ誘導の調整戦略を採用している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:53:50 GMT)
Parenting: Optimizing Knowledge Selection of Retrieval-Augmented Language Models with Parameter Decoupling and Tailored Tuning [14.4] Retrieval-Augmented Generation (RAG) は、幻覚生成と知識の陳腐化において、Large Language Models (LLM) が直面する問題に対する効果的な解決策を提供する。
本稿では, 親和性と頑健性に関連するパラメータ部分空間を分離し, 識別し, 目的的に最適化する新しいフレームワークであるParentingを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:53:50 GMT)
TAGExplainer: Narrating Graph Explanations for Text-Attributed Graph Learning Models [14.4] 本稿では,TAG学習のための自然言語記述法であるTAGExplainerを提案する。
実世界のシナリオにおける注釈付き真実説明の欠如に対処するため,まず,サリエンシに基づく説明からモデルの判断を捉える擬似ラベルを生成することを提案する。
高品質な擬似ラベルを使用して、エンド・ツー・エンドの説明生成モデルを訓練する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 03:55:46 GMT)
Conditional Prediction ROC Bands for Graph Classification [14.2] 予測ROC(CP-ROC)バンドは、RCC曲線の不確実性定量化と、テストデータの分布シフトに対するロバスト性を提供する。
CP-ROCを局所交換性条件下で統計的に保証する。
これは、テストグラフ分布がトレーニングデータと異なる場合の信頼性を確保するため、非イド設定下でのROC曲線の不確実性に対処する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:44:59 GMT)
Improving 3D Medical Image Segmentation at Boundary Regions using Local Self-attention and Global Volume Mixing [14.1] ボリューム・メディカル・イメージ・セグメンテーションは、与えられた3次元ボリューム・メディカル・イメージをボクセルレベルの精度で正確に分類することを目的とする医用画像解析の基本的な問題である。
本研究では,3次元医用画像セグメンテーションにおける局所的およびグローバルな依存関係を明示的に捉えることを目的とした,階層型エンコーダデコーダベースの新しいフレームワークを提案する。
提案フレームワークは,局所的なボリュームベースの自己アテンションを利用して局所的な依存関係を高解像度でエンコードし,低解像度の特徴表現でグローバルな依存関係をキャプチャする新しいボリュームミキサを導入する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:08:38 GMT)
NetMamba: Efficient Network Traffic Classification via Pre-training Unidirectional Mamba [14.0] ネットワークトラフィックの分類は、サービス品質の向上、ネットワーク管理の効率化、サイバーセキュリティの強化を目的とした重要な研究分野である。
既存のアプローチは2つの大きな課題に直面している。まず、広く使われているTransformerアーキテクチャの2次複雑さのために、モデル非効率に苦しむ。
本稿では,包括的トラフィック表現方式を備えた線形時間空間モデルであるNetMambaを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:20:07 GMT)
Discriminating image representations with principal distortions [13.8] 本稿では,画像表現の集合を局所的な幾何学的に比較する枠組みを提案する。
このフレームワークを使って、初期の視覚システムの単純なモデルを比較します。
2つ目の例では、この手法を深層ニューラルネットワークモデルに適用し、アーキテクチャやトレーニングタイプに起因する局所的な幾何学の違いを明らかにする。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:04:37 GMT)
Allegro: Open the Black Box of Commercial-Level Video Generation Model [13.0] 品質と時間的一貫性を両立させる高度なビデオ生成モデルであるAllegroを紹介する。
本稿では,ハイパフォーマンスな商用レベルのビデオ生成モデルを学習するための包括的な方法論を提案する。
われわれのユーザー調査によると、Allegroは既存のオープンソースモデルやほとんどの商用モデルを上回っており、HaluoやKlingに次いでランクインしている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:51:35 GMT)
Learning-Augmented Algorithms for the Bahncard Problem [12.9] 本研究では,Bahncard問題に対する学習強化アルゴリズムについて検討する。
PFSUMは、オンライン意思決定を改善するために、歴史と短期の両方を取り入れている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:55:15 GMT)
Machine Translation Hallucination Detection for Low and High Resource Languages using Large Language Models [12.4] 本稿では,Large Language Models (LLM) を用いた文レベルの幻覚検出手法と多言語埋め込みにおける意味的類似性について述べる。
LLMは、いかなる機械翻訳タスクに対しても明示的に訓練されていないにもかかわらず、以前提案されたモデルと同等またはそれ以上の性能を達成することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:01:05 GMT)
YOLO-RD: Introducing Relevant and Compact Explicit Knowledge to YOLO by Retriever-Dictionary [12.4] この問題に対処するために,革新的なem textbfRetriever-emtextbfDictionary (RD) モジュールを導入する。
このアーキテクチャにより、YOLOベースのモデルは、データセットの洞察を含むDictionaryから機能を効率的に取得できる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:38:58 GMT)
DiffX: Guide Your Layout to Cross-Modal Generative Modeling [12.2] DiffXと呼ばれる一般的なレイアウト誘導型クロスモーダル生成のための新しい拡散モデルを提案する。
我々のDiffXは、拡散・復調処理を行う、コンパクトで効果的なクロスモーダル生成モデリングパイプラインを提供する。
我々の知る限り、DiffXはレイアウト誘導型クロスモーダル画像生成の最初のモデルである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:41:42 GMT)
Synthetic Data Generation for Residential Load Patterns via Recurrent GAN and Ensemble Method [12.2] 我々は,高忠実性合成住宅負荷データを生成するために,ERGAN(Ensemble Recurrent Generative Adversarial Network)フレームワークを開発した。
開発したERGANは, 様々な家庭で多様な負荷パターンを捕捉し, 生成した合成データの現実性と多様性を向上させる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:33:38 GMT)
Modality-Fair Preference Optimization for Trustworthy MLLM Alignment [11.8] 直接選好最適化(DPO)は,大規模言語モデル(LLM)の整合に有効である
しばしば画像情報よりもテキストを好んでおり、信頼できない出力や視覚幻覚をもたらす。
テキストと画像の嗜好のバランスをとるために,MFPO(Modality-Fair Preference Optimization)を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:56:52 GMT)
Deep Class-guided Hashing for Multi-label Cross-modal Retrieval [11.5] 本稿では,クラス内アグリゲーションとクラス間構造関係を両立させるDCGH法を提案する。
3つのベンチマークデータセットの比較実験は、DCGH法が同等またはそれ以上の性能を持つことを示している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:21:52 GMT)
DynaVINS++: Robust Visual-Inertial State Estimator in Dynamic Environments by Adaptive Truncated Least Squares and Stable State Recovery [11.4] 我々はmboxtextitDynaVINS++と呼ばれる堅牢なVINSフレームワークを提案する。
我々のアプローチは、突然の動的オブジェクトを含む動的環境における有望なパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:13:45 GMT)
Improving Generalization of Complex Models under Unbounded Loss Using PAC-Bayes Bounds [10.9] PAC-Bayes学習理論は、テストエラーの厳密な上限を確立することに重点を置いている。
PAC-Bayesトレーニングと呼ばれる最近提案されたトレーニング手順は、これらの境界を最小化するためにモデルを更新する。
このアプローチは理論的に健全であり、実際は、経験的リスク最小化(ERM)によって得られたものほど、テストエラーを達成していない。
PAC-Bayes トレーニングアルゴリズムを導入し,性能向上と事前チューニングへの依存度低減を実現した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 01:50:51 GMT)
SceneGraMMi: Scene Graph-boosted Hybrid-fusion for Multi-Modal Misinformation Veracity Prediction [10.9] SceneGraMMiを提案する。SceneGraMMi, Scene Graph-boosted Hybrid-fusion approach for Multi-modal Misinformation veracity prediction。
4つのベンチマークデータセットでの実験結果から、SceneGraMMiは最先端のメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 21:55:13 GMT)
Fairness Evaluation with Item Response Theory [10.9] 本稿では機械学習(ML)モデルにおける公平性を評価するための新しいFair-IRTフレームワークを提案する。
項目特性曲線(ICC)の詳細な説明は、特定の個人に対して提供される。
公平性評価ツールとしてのこのフレームワークの有効性を実証する実験を行った。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:25:20 GMT)
Symmetry Nonnegative Matrix Factorization Algorithm Based on Self-paced Learning [10.7] モデルのクラスタリング性能を向上させるために, 対称非負行列分解法を提案した。
全ての試料の難易度を測定できる重み変数を割り当てた。
実験の結果,提案アルゴリズムの有効性が示された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:33:02 GMT)
MedDiff-FM: A Diffusion-based Foundation Model for Versatile Medical Image Applications [10.3] 本稿では,MedDiff-FMという,様々な医療画像課題に対処するための拡散基盤モデルを提案する。
MedDiff-FMは、頭から腹部まで解剖学的領域をカバーする複数の公開データセットから3D CT画像を活用し、拡散基盤モデルを事前訓練する。
MedDiff-FMが下流の様々な医療画像タスクに有効であることを示す実験結果が得られた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:03:55 GMT)
Observation of quantum superposition of topological defects in a trapped ion quantum simulator [10.3] トラップイオン量子シミュレータにおけるトポロジカル欠陥の量子重ね合わせの観測について報告する。
我々の研究は、量子キブル・ズレーク物理学における非平衡力学のための有用なツールを提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:27:13 GMT)
How Aligned are Generative Models to Humans in High-Stakes Decision-Making? [10.2] 大規模生成モデル(LM)は、高い意思決定のためにますます検討されている。
この研究は、リシビズム予測の特定のケースにおいて、そのようなモデルが人間や予測AIモデルとどのように比較されるかを検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:00:59 GMT)
How much do contextualized representations encode long-range context? [10.2] 我々は、数千のトークンにまたがる長距離コンテキストを強調し、ニューラルネットワークの自己回帰言語モデルにおける文脈表現を分析する。
提案手法では,表現幾何学の観点から長距離パターンの文脈化の度合いを捉えるために,摂動セットアップと計量エンファンソトロピー・キャリブレーション・コサイン類似度を用いている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:32:43 GMT)
LlamaLens: Specialized Multilingual LLM for Analyzing News and Social Media Content [9.5] 大規模言語モデル(LLM)は、様々な分野にわたる汎用タスクソルバとして顕著な成功を収めている。
本研究では,LlamaLens という特殊な LLM を開発し,多言語でニュースやソーシャルメディアのコンテンツを分析することに焦点を当てた。
LlamaLensは16個のテストセットで現在の最先端(SOTA)よりも優れ、10個のテストセットで同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:37:37 GMT)
Generative AI Agents in Autonomous Machines: A Safety Perspective [9.0] 生成AIエージェントは、非並列機能を提供するが、ユニークな安全性上の懸念もある。
本研究では、生成モデルが物理自律機械にエージェントとして統合される際の安全要件の進化について検討する。
我々は、自律機械で生成AI技術を使用するための総合的な安全スコアカードの開発と実装を推奨する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:07:08 GMT)
Redefining Proactivity for Information Seeking Dialogue [9.0] Information-Seeking Dialogue (ISD) エージェントは、ユーザのクエリに対して正確な応答を提供することを目的としている。
生成した各反応の「積極性」を高めることに焦点を当てた新規な積極性定義を提案する。
2,000の単ターン会話からなるプロアクティブ対話データセットを構築し、応答のプロアクティブ性を評価するためにいくつかの自動メトリクスを導入する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:57:10 GMT)
Unsupervised feature selection algorithm framework based on neighborhood interval disturbance fusion [8.9] 多くの教師なし特徴選択アルゴリズムの普遍性と安定性はデータセット構造に大きな影響を与えている。
本稿では、データセットを前処理し、間隔法を用いてデータセットを近似し、新しい間隔データセットの利点と欠点を実験的に検証する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:39:04 GMT)
Explicit Differentiable Slicing and Global Deformation for Cardiac Mesh Reconstruction [8.7] 医用画像からの心臓解剖のメッシュ再構築は, 形状, 運動計測, 生体物理シミュレーションに有用である。
従来のボクセルベースのアプローチは、イメージの忠実さを損なう前処理と後処理に依存している。
そこで本稿では,メッシュのスライスからメッシュへの勾配バックプロパゲーションを可能にする,新しい識別可能なボキセル化とスライシング(DVS)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:43:30 GMT)
MAD: Move AI Decompiler to Improve Transparency and Auditability on Non-Open-Source Blockchain Smart Contract [8.6] Move AI Decompiler (MAD)は、Swi上のスマートコントラクトバイトコードを正しいソースコードに分解するWebアプリケーションである。
MADは論理的に正しいコードを生成し、元の単体テストに合格し、実世界のスマートコントラクト上で66.7%の再コンパイル成功率を達成している。
MADはブロックチェーンのスマートコントラクトの透明性、監査、教育に実践的な意味を持っている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:19:32 GMT)
Contextual Augmented Multi-Model Programming (CAMP): A Hybrid Local-Cloud Copilot Framework [8.3] 本稿では、Retrieval-Augmented Generation(RAG)を用いた局所モデルからなるマルチモデルAI支援プログラミングフレームワークであるCAMPを提案する。
RAGは、コンテキスト認識プロンプト構築を容易にするために、クラウドモデルからコンテキスト情報を取得する。
この方法論は、Appleソフトウェアエコシステム向けに開発されたAI支援プログラミングツールであるCopilot for Xcodeで実現されている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:51:24 GMT)
Concept Complement Bottleneck Model for Interpretable Medical Image Diagnosis [8.3] 本稿では,医用画像診断のための補完的ボトルネックモデルを提案する。
そこで本研究では,概念の相違点を抽出し,それぞれの注意チャンネルで概念をスコアリングするために,概念アダプタを利用することを提案する。
本モデルでは,概念検出と疾患診断の課題において,最先端の競争相手よりも優れていた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:52:09 GMT)
On the Growth of Mistakes in Differentially Private Online Learning: A Lower Bound Perspective [8.1] 我々は、差分的プライベート(DP)オンライン学習アルゴリズムに対して、より低いバウンダリを提供する。
我々の研究は、DP-オンライン学習の下位境界の設定に向けた最初の成果である。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:58:11 GMT)
Grammatical Error Correction for Low-Resource Languages: The Case of Zarma [8.1] 文法的誤り訂正(GEC)は、Zarmaのような低リソース言語のために書かれた材料を改善するために重要である。
本研究では,Zarma における GEC のためのルールベース手法,機械翻訳 (MT) モデル,および大規模言語モデル (LLM) を比較した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 23:51:36 GMT)
CompAct: Compressed Activations for Memory-Efficient LLM Training [7.8] CompActはGPU上でのピークメモリ利用を事前トレーニングで25~30%削減し、LLMの微調整で50%削減する技術である。
低ランクで圧縮されたアクティベーションを後方パスに格納することで、必要なメモリを大幅に削減する。
CompActの貯蓄は、より大きなモデルに対してさらに高いスケールを期待しています。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:24:38 GMT)
Fastrack: Fast IO for Secure ML using GPU TEEs [7.8] GPUベースのTrusted Execution Environments (TEE)はセキュアで高性能なソリューションを提供する。
CPU間通信のオーバーヘッドは性能を著しく損なう。
本稿では、Nvidia H100 TEEプロトコルを分析し、3つの重要なオーバーヘッドを特定する。
我々は,1)直接GPU TEE通信,2)並列化認証,3)PCI-e伝送による重複復号化を最適化したFastrackを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 01:00:33 GMT)
Hallucination Detox: Sensitive Neuron Dropout (SeND) for Large Language Model Training [7.7] 本研究は,幻覚の緩和を目的としたトレーニングプロトコルであるSensitive Neuron Dropout (SeND)を紹介する。
さらに,従来のEigenScoreを2倍の速度で近似する,教師なし幻覚検出尺度であるEfficient EigenScore(EES)を開発した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:18:23 GMT)
A Survey of Uncertainty Estimation in LLMs: Theory Meets Practice [7.7] 我々は、不確実性と信頼の定義を明確にし、それらの区別とモデル予測への含意を明らかにする。
本稿では,アプローチから導いた不確実性推定手法を分類する。
また,分布外検出,データアノテーション,質問の明確化など,多様なアプリケーションに不確実性をもたらす技術についても検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:55:44 GMT)
Query-OPT: Optimizing Inference of Large Language Models via Multi-Query Instructions in Meeting Summarization [7.7] 我々は,同一の入力コンテキストに対するクエリを1つのプロンプトで組み合わせて,繰り返し呼び出しを最小限に抑える方法が,要約の達成に有効かどうかを検討する。
予測フォーマットでの応答生成における100%の信頼性は、通常、特定のクローズドソース LLM に制限される。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:03:29 GMT)
Less yet robust: crucial region selection for scene recognition [7.3] 高次特徴を持つ最も重要かつロバストな領域を同定する適応的選択機構を提案する。
また,本モデルの有効性を評価するために,水中地形分類データセットを構築した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:01:17 GMT)
Less yet robust: crucial region selection for scene recognition [7.3] 高次特徴を持つ最も重要かつロバストな領域を同定する適応的選択機構を提案する。
また,本モデルの有効性を評価するために,水中地形分類データセットを構築した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:01:17 GMT)
Exponential quantum advantages for practical non-Hermitian eigenproblems [7.1] 我々は量子コンピューティングのパワーを一般のエルミート非エルミート固有確率に拡張する。
我々のアルゴリズムは広く応用されており、例えば、非エルミート物理学における2つの中心的な問題を考える。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:58:55 GMT)
FedLPA: One-shot Federated Learning with Layer-Wise Posterior Aggregation [7.1] FedLPAは、フェデレートラーニングのための階層的な後続アグリゲーション手法である。
以上の結果から,FedLPAは最先端の手法よりも学習性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:36:03 GMT)
ViSaRL: Visual Reinforcement Learning Guided by Human Saliency [7.0] ビジュアル・サリエンシ指導型強化学習(ViSaRL)を紹介する。
ViSaRLを用いて視覚表現を学習すると、RLエージェントの成功率、サンプル効率、一般化が大幅に向上する。
ViSaRLを用いて学習した視覚表現は、知覚ノイズやシーンの変動など、様々な視覚摂動の源泉に対して堅牢であることを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:04:15 GMT)
Taming Mambas for Voxel Level 3D Medical Image Segmentation [6.9] 近年,畳み込みニューラルネットワーク(CNN)を用いた深層学習モデルによって,3次元医用セグメンテーションの分野が支配されている。
トランスフォーマーは、十分なメモリ要件と、飢餓データによって妨げられているため、詳細なレベルで3Dの医療ボリュームを処理するには理想的ではない。
最近のブレークスルーは、ステートスペースモデル(SSM)に基づいたリカレントニューラルネットワーク(RNN)であるMambaである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:26:09 GMT)
HerO at AVeriTeC: The Herd of Open Large Language Models for Verifying Real-World Claims [6.8] 自動ファクトチェックの各ステップに,公開可能な大規模言語モデル(LLM)のみを利用するシステムを導入する。
証拠検索では、仮説的事実チェック文書を生成することにより、クエリを強化するために言語モデルが使用される。
HerOはAVeriTeCスコア0.57でリーダーボードで2位を獲得し、現実世界のクレームを検証するためのオープンLLMの可能性を示した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:57:50 GMT)
Semi-Classical Subspaces, The No Synchronization Law, and More [6.5] 本稿では,アルゴリズム情報理論と物理の交わりについて考察する。
量子世界と古典的領域の間の障壁を特徴づける定理について議論する。
ブラックホールのコルモゴロフ複雑性に関する今後の研究について考察する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:47:44 GMT)
Semi-Classical Subspaces, The No Synchronization Law, and More [6.5] 本稿では,アルゴリズム情報理論と物理の交わりについて考察する。
量子世界と古典的領域の間の障壁を特徴づける定理について議論する。
ブラックホールのコルモゴロフ複雑性に関する今後の研究について考察する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:47:44 GMT)
Diffusion-based Contrastive Learning for Sequential Recommendation [6.3] 本稿では,CaDiRecという,文脈対応拡散に基づく逐次推薦のためのコントラスト学習を提案する。
CaDiRecは、コンテキスト対応拡散モデルを使用して、シーケンス内の所定の位置に対する代替アイテムを生成する。
フレームワーク全体をエンドツーエンドでトレーニングし、拡散モデルとレコメンデーションモデルの間でアイテムの埋め込みを共有します。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:05:15 GMT)
log-RRIM: Yield Prediction via Local-to-global Reaction Representation Learning and Interaction Modeling [6.3] log-RRIMは、化学反応の収量を予測するために設計された革新的なグラフトランスフォーマーベースのフレームワークである。
本手法は,一意の局所的-グローバル的反応表現学習戦略を実装している。
反応剤-試薬相互作用の高度なモデリングと小さな分子断片への感受性により、化学合成における反応計画と最適化のための貴重なツールとなる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:35:56 GMT)
KTCR: Improving Implicit Hate Detection with Knowledge Transfer driven Concept Refinement [6.3] 社会的・政治的文脈の変化は、新しいタイプのヘイトコンテンツや、これまで認識されていなかったヘイトパターンにつながる。
本稿では,暗黙のヘイトサンプルに関する概念を洗練するための知識伝達駆動概念再定義法を提案する。
実験により、新しいヘイトパターンを反映した追加の暗黙のサンプルを概念改善を通じて組み込むことで、モデルの性能が向上することが示された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:53:04 GMT)
Multipartite entangling power by von Neumann entropy [6.2] 多部単位演算の量子絡み合い生成は、量子情報処理における鍵となる問題である。
我々は、モジュロワン複素数の最小凸和により、シュミットランク2マルチキュービットユニタリ演算の絡み合うパワーを解析的に導出した。
広義のマルチキュービットゲート,例えば$n$-qubit Toffoli ゲートのエンタングリングと補助エンタングリングのパワーは 1 ビットである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:18:36 GMT)
Dynamic Contrastive Learning for Time Series Representation [6.1] 時系列の教師なしコントラスト表現学習フレームワークDynaCLを提案する。
DynaCLは時系列から意味のあるクラスタにインスタンスを埋め込みます。
また、教師なしクラスタリングメトリクスの高得点は、下流タスクにおいて表現が有用であることを保証していないことも明らかにした。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:20:24 GMT)
Assessing Quantum Extreme Learning Machines for Software Testing in Practice [6.1] 量子ノイズが3つの産業的および実世界の古典的ソフトウェアテストケーススタディにおいてQELMに与える影響について検討する。
その結果,QELMは量子ノイズの影響が大きく,回帰タスクは250%,分類タスクは50%であった。
誤差軽減技術は耐雑音性を高めることができるが、平均3.0%の性能低下を達成することはできるが、その効果は文脈によって異なる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:17:58 GMT)
Multi-Feature Aggregation in Diffusion Models for Enhanced Face Super-Resolution [6.1] 超解像を生成するために,複数の低画質画像から抽出した特徴と組み合わせた低解像度画像を利用するアルゴリズムを開発した。
他のアルゴリズムとは異なり、我々のアプローチは属性情報を明示的に提供せずに顔の特徴を復元する。
これは、高解像度画像と低解像度画像を組み合わせて、より信頼性の高い超高解像度画像を生成するコンディショナーとして初めて使用される。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:13:54 GMT)
Automatic verification of Finite Variant Property beyond convergent equational theories [6.0] セキュリティプロトコルのほとんどの自動検証は、有限変数性(FVP)を満たす方程式理論に焦点を当てている。
本稿では,FVPの特定表現を必要とせずにFVPを証明し,E-convergentリライトシステムによって表現される理論を超越した理論のクラスについて,新たな半決定手順を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:11:30 GMT)
FoMo: A Foundation Model for Mobile Traffic Forecasting with Diffusion Model [6.0] モバイルトラフィック予測のための革新的なファンデーションモデル(FoMo)を提案する。
FoMoは、ネットワーク計画と最適化をサポートするために、複数の都市にまたがる短期・長期予測と分布生成の多様な予測タスクを処理する。
9つの実世界のデータセットに対する大規模な実験により、FoMoは多様な予測タスクやゼロ/フェーショット学習に関する現在のモデルより優れています。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:32:16 GMT)
Slicing for AI: An Online Learning Framework for Network Slicing Supporting AI Services [5.8] 6Gネットワークは、革新的なネットワークスライシング戦略を必要とするAI駆動サービスの新たな領域を受け入れる。
本稿では,AIサービスへの計算・通信資源の割り当てを最適化するオンライン学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:38:54 GMT)
Where to Build Food Banks and Pantries: A Two-Level Machine Learning Approach [5.4] 4400万人のアメリカ人が食料不足に苦しんでおり、そのうち1300万人が子供だ。
食料銀行とパントリーの場所を最適化することで、必死にそれを必要とする家族にとって、食料はよりアクセスしやすくなった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:31:24 GMT)
SuperPose: Improved 6D Pose Estimation with Robust Tracking and Mask-Free Initialization [5.3] 我々は,FoundationPose,SAM2,LightGlueを統合することで,産業アプリケーションにおけるリアルタイム6Dオブジェクト検出のための堅牢なソリューションを開発した。
アルゴリズムはターゲットオブジェクトのCADモデルのみを必要とし、ユーザは初期設定中にライブフィードの場所をクリックします。
YCBデータセットと漂白機やギアなどの産業用部品でテストされ、アルゴリズムは信頼性の高い6D検出と追跡を実証した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:57:05 GMT)
LTPNet Integration of Deep Learning and Environmental Decision Support Systems for Renewable Energy Demand Forecasting [5.2] 本稿では,ディープラーニング技術と環境意思決定支援システムを組み合わせた新しいアプローチを提案する。
このモデルはLSTMやTransformerなどの高度なディープラーニング技術とパラメータ最適化のためのPSOアルゴリズムを統合している。
結果から,本モデルが様々な指標で大幅な改善を達成できたことが示唆された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:53:50 GMT)
Janus graphene nanoribbons with a single ferromagnetic zigzag edge [5.2] ジグザグ縁グラフェンナノリボン(ZGNR)中のπ電子のトポロジー設計は、磁気量子現象とエキゾチック量子相をもたらす。
ZGNRにおけるクロスエッジ磁気カップリングの排除は、新しい種類の強磁性量子スピン鎖の実現を可能にする。
本稿では、2つの異なるエッジ構成を持つJanus GNRの形で、そのような強磁性GNRを設計および製造するための一般的なアプローチについて報告する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 03:34:37 GMT)
Generalized Multimodal Fusion via Poisson-Nernst-Planck Equation [5.0] 本稿では,Poisson-Nernst-Planck(PNP)方程式を用いた一般化多モード融合法(GMF)を提案する。
提案したGMFは,より少ないパラメータと計算資源を生かしながら,最先端(SOTA)の精度に近い結果が得られることを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:15:28 GMT)
FastSTI: A Fast Conditional Pseudo Numerical Diffusion Model for Spatio-temporal Traffic Data Imputation [4.9] 高時間トラフィックデータは、インテリジェントトランスポートシステム(ITS)とそのデータ駆動アプリケーションにとって不可欠である。
拡散確率モデルの最近の研究は、計算における深部生成モデルの優越性を証明している。
2種類の現実世界のトラフィックデータセットを高速に処理することで、高品質なサンプルをわずか6ステップでインプットできることが証明されている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 01:45:51 GMT)
Multiple Kernel Clustering via Local Regression Integration [4.9] 複数のカーネルメソッドは、複数のカーネルデータの固有の多様体構造をあまり考慮しない。
本稿ではまず,カーネル型局所回帰(CKLR)を用いたクラスタリング手法を提案する。
次に、マルチカーネルローカルレグレッション(CMKLR)を介してクラスタリングを行うように拡張する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:26:29 GMT)
A Concentration Inequality for Maximum Mean Discrepancy (MMD)-based Statistics and Its Application in Generative Models [4.8] 最大平均離散性(MMD)に基づく推定器群に対する一様濃度不等式を提案する。
我々の不等式はMDDに基づく生成モデルの理論的解析における効率的なツールとして機能する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:09:53 GMT)
Jailbreaking and Mitigation of Vulnerabilities in Large Language Models [4.6] 大規模言語モデル(LLM)は、自然言語の理解と生成を前進させることで、人工知能を変革した。
これらの進歩にもかかわらず、LSMは、特に注射と脱獄攻撃を急ぐために、かなりの脆弱性を示してきた。
このレビューでは、これらの脆弱性についての研究状況を分析し、利用可能な防衛戦略を提示する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:00:56 GMT)
On Cold Posteriors of Probabilistic Neural Networks: Understanding the Cold Posterior Effect and A New Way to Learn Cold Posteriors with Tight Generalization Guarantees [4.5] ベイズ深層学習では、ニューラルネットワークの重みは事前分布を持つランダム変数として扱われる。
PAC-ベイズ解析は、ランダム化された予測子に対する一般化境界を導出する頻繁なフレームワークを提供する。
観測データの影響と事前正規化のバランスをとることで、ベイズモデルにおける過度な適合や過度な適合の問題に温度調整が対処できる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:40:35 GMT)
Non-invasive Neural Decoding in Source Reconstructed Brain Space [4.5] 非侵襲的脳波復号法は通常、脳磁図/脳波計測(MEG/EEG)を入力として行う。
対照的に、fMRIスキャンは典型的な構造化された入力表現を持つボクセルグリッドである脳空間で直接取得される。
これにより、空間的帰納バイアス、空間的データ拡張、より良い解釈可能性、データセット間のゼロショット一般化、データ調和が可能となる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:26:45 GMT)
Anonymising Elderly and Pathological Speech: Voice Conversion Using DDSP and Query-by-Example [4.4] 音声の匿名化は、言語内容を保持しながら、音声中の個人識別子を変更することによって話者のアイデンティティを保護することを目的としている。
現在の方法では、高齢者や病的音声領域で見られる韻律や独特の音声パターンを維持できない。
可変ディジタル信号処理とクエリ・バイ・サンプルを用いた音声変換方式(DDSP-QbE)を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:40:56 GMT)
PAT: Pixel-wise Adaptive Training for Long-tailed Segmentation [4.4] 長い尾のセグメンテーションに適した革新的なPixel-wise Adaptive Training (PAT)技術を提案する。
PATには,(1)クラスワイド勾配等級均質化,2)ピクセルワイドクラス固有損失適応(PCLA)の2つの重要な特徴がある。
PATは、NyUデータセットで現在の最先端を2.2%上回る、大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:20:16 GMT)
Exploring sustainable pathways for urban traffic decarbonization in downtown Toronto [4.4] 本研究は,トロント市中心部の都市交通におけるマイクロシミュレートによる脱炭戦略について検討する。
変圧器を用いた予測モデルを用いて, 温室効果ガス (GHG) と窒素酸化物 (NOx) の排出を予測した。
キーとなる発見は、100%のバッテリ電気自動車(BEV)がGHG排出量を75%削減していることを示しているが、コストとインフラに関する課題に直面している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:21:04 GMT)
AssemblyComplete: 3D Combinatorial Construction with Deep Reinforcement Learning [4.4] ロボット工学における重要なゴールは、ロボットに現実世界の協調作業、特に自動組み立てに適応するように教えることである。
本稿では, ユニットプリミティブ(レゴブロック)を用いて実演した3次元組立工法を紹介する。
本研究では,ロボットに不完全な組立の目的を理解し,組立を完了するための建設方針を学ぶための2部構成の深層強化学習(DRL)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:51:17 GMT)
Phase-controlled bound states in giant atom waveguide QED setup [4.3] 連続体(BOC)の位相制御境界状態と連続体(BIC)の束縛状態は, 1次元フォトニック導波路を装った人工巨大原子中に存在する。
我々は原子とフォトニックの力学進化における量子ビートを予測する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:42:40 GMT)
ConSinger: Efficient High-Fidelity Singing Voice Generation with Minimal Steps [4.3] 最小ステップで高忠実度な歌声合成を実現するために,一貫性モデルであるConSingerに基づく歌声合成手法を提案する。
実験の結果,ConSingerは生成速度と品質の点で,ベースラインモデルと非常に競合していることがわかった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:32:03 GMT)
Exploring Social Desirability Response Bias in Large Language Models: Evidence from GPT-4 Simulations [4.2] 大規模言語モデル(LLM)は、社会調査において人間のような反応をシミュレートするために用いられる。
社会的望ましくない反応(SDR)バイアスのようなバイアスを生じているかどうかはまだ不明である。
この研究は、LLMを使って人間とLLMの双方の偏見を調査する潜在的な道筋を強調している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:28:24 GMT)
Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization [4.2] GFlowNetsは、与えられた報酬関数に比例したオブジェクトのサンプルを学習する生成モデルのファミリーである。
近年の研究では,GFlowNetトレーニングとエントロピー規則化強化学習問題との密接な関係が示されている。
本稿では,エントロピー規則化マルコフ決定プロセスにおいて,値関数を直接逐次的に適用する,シンプルな後方ポリシー最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:12:14 GMT)
Reinforcement Learning-Based REST API Testing with Multi-Coverage [4.1] MUCORESTは、Qラーニングを利用してコードカバレッジと出力カバレッジを最大化する、新しい強化学習(RL)ベースのAPIテストアプローチである。
MUCORESTは、発見されたAPIバグの数で、最先端のAPIテストアプローチを11.6-261.1%上回っている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:20:23 GMT)
Exploring Curriculum Learning for Vision-Language Tasks: A Study on Small-Scale Multimodal Training [4.1] 本研究では,BabyLMチャレンジの一環として,限られたデータ構造における3つのプライマリ変数の役割について検討する。
カリキュラム学習は,非カリキュラム学習モデルよりもマルチモーダルな評価に有効であることがわかった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 21:03:51 GMT)
Novel Actor-Critic Algorithm for Robust Decision Making of CAV under Delays and Loss of V2X Data [3.9] 本稿では,V2X環境における遅延および/またはロスデータによるロバストな駆動性能を保証する新しいBlind Actor-Criticアルゴリズムを提案する。
シミュレーション環境でのアルゴリズムの性能を評価し,ベンチマーク手法と比較した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:42:32 GMT)
Who is Undercover? Guiding LLMs to Explore Multi-Perspective Team Tactic in the Game [3.8] We use the language logic game Who is Undercover?' as a experimental platform to propose the Multi-Perspective Team Tactic (MPTT) framework。
MPTTは、LLMの人間的な言語表現ロジック、多次元思考、複雑なシナリオにおける自己認識の育成を目的としている。
予備的な結果は、MPTTとWIUが組み合わさって、LLMの認知能力を活用して、現実社会をシミュレートできる意思決定フレームワークを作成することを示している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:41:31 GMT)
Decoding Pedestrian Stress on Urban Streets using Electrodermal Activity Monitoring in Virtual Immersive Reality [3.6] 本稿では, 歩行者が道路を横断する際のストレスを, 異なる実験操作で系統的に検討する。
実験には合計171人の個人が参加し、信号制御なしで中間ブロックで双方向の道路を横断する任務を負った。
その結果,道路中央中央の道路が避難所として機能し,ストレスが著しく減少した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:23:59 GMT)
Dynamic Intelligence Assessment: Benchmarking LLMs on the Road to AGI with a Focus on Model Confidence [3.6] 我々は、AIモデルをテストするための新しい方法論であるDynamic Intelligence Assessment (DIA)を紹介する。
我々のフレームワークは、複数の試みにまたがってモデルの信頼性と信頼性を評価するために、4つの新しいメトリクスを導入します。
付随するDIA-Benchデータセットは、テキスト、PDF、コンパイルされたバイナリ、視覚パズルなど、さまざまなフォーマットで表示される。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:07:36 GMT)
A Heterogeneous Network-based Contrastive Learning Approach for Predicting Drug-Target Interaction [3.2] 薬物と標的の相互作用(DTI)の予測は、薬物開発と再配置に不可欠である。
HNCL-DTIと呼ばれる異種ネットワークに基づくコントラスト学習手法を提案する。
実験結果から,HNCL-DTIはベンチマークデータセット上で既存の高度なベースライン手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:57:24 GMT)
Informativeness of Weighted Conformal Prediction [3.2] 本稿では,重み付き共形予測の有意性を高める2つの方法を提案する。
提案手法の理論的保証を確立し,シミュレーションによる有効性を示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:18:43 GMT)
MDFI-Net: Multiscale Differential Feature Interaction Network for Accurate Retinal Vessel Segmentation [3.2] 本稿では,MDFI-Net という DPCN に基づく機能拡張型インタラクションネットワークを提案する。
提案したMDFI-Netは,公開データセットの最先端手法よりもセグメンテーション性能が優れている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:42:22 GMT)
Multimodal Policies with Physics-informed Representations [3.0] PDEシステムの制御問題では、その決定を下すためには観察が重要である。
我々はPDEシステムの制御におけるマルチモーダルポリシーのための物理情報表現(PIR)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 01:56:15 GMT)
PEAS: A Strategy for Crafting Transferable Adversarial Examples [3.0] ブラックボックス攻撃は、機械学習システムに重大な脅威をもたらす。
代用モデルで生成された逆例は、しばしばターゲットモデルへの限定的な転送可能性に悩まされる。
我々は,既存のブラックボックス攻撃の転送可能性を高める新しい戦略PEASを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:55:08 GMT)
Efficient Model Extraction via Boundary Sampling [3.0] 本稿では,新しいデータフリーモデル抽出攻撃を提案する。
これは、効率、正確性、有効性の観点から、現在の最先端を著しく向上させる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:56:24 GMT)
Enhancing License Plate Super-Resolution: A Layout-Aware and Character-Driven Approach [3.0] 本稿では, LPRタスク自体の性能だけでなく, 解像度, テクスチャ, 構造的詳細などの要因を考慮した新しい損失関数Layout and Character Oriented Focal Loss(LCOFL)を提案する。
我々は、変形可能な畳み込みと共有重み付けを用いた文字特徴学習を強化し、識別器として光学文字認識(OCR)モデルを用いたGANベースのトレーニングアプローチを採用する。
実験の結果, 文字再構成の精度は向上し, 定量化と定性化の両面で, 最先端の2つの手法に優れていた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:05:44 GMT)
Improving code-mixed hate detection by native sample mixing: A case study for Hindi-English code-mixed scenario [2.8] 本稿では,厳密な実証実験を通じてギャップを埋めようとしている。
我々は、ヒンディー語と英語のコード混合設定をケーススタディとみなす。
コード混合トレーニングセットにネイティブなヘイトサンプルを追加することで、少量であっても、コード混合ヘイト検出のための文学のパフォーマンスが改善された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:01:00 GMT)
The Best Defense is a Good Offense: Countering LLM-Powered Cyberattacks [2.7] 大規模言語モデル(LLM)は、間もなく自律的なサイバーエージェントにとって不可欠なものになるだろう。
我々は,LLM攻撃の脆弱性を生かした新たな防衛戦略を導入する。
以上の結果から, LLM脆弱性を防御戦略に変換する効果を実証し, 防衛成功率を最大90%とした。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:07:24 GMT)
Insights from the Usage of the Ansible Lightspeed Code Completion Service [2.6] Lightspeedは、自然言語プロンプトによってYAMLを生成するように設計されたサービスである。
光速は多線提案に対して49.08$%の強い受容率を達成することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:18:38 GMT)
Sparse Mamba: Reinforcing Controllability In Structural State Space Models [2.6] 我々は,自然言語処理(NLP)アプリケーションのためのSparse-Mamba(S-Mamba)において,制御可能性と可観測性の概念をMamba SSMのアーキテクチャに導入する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:39:08 GMT)
Asymmetric transfer matrix analysis of Lyapunov exponents in one-dimensional non-reciprocal quasicrystals [2.6] 非エルミチアン準結晶では、非相互ホッピングによって誘導される非エルミチアン効果は、局在中心の反対側に2つの異なるリャプノフ指数が現れる。
本研究では,非相互準結晶の局在特性と運動量エッジを総合的に検討する手法を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:55:59 GMT)
AgentClinic: a multimodal agent benchmark to evaluate AI in simulated clinical environments [2.6] シミュレーションされた臨床環境における大規模言語モデル(LLM)の評価のためのマルチモーダルエージェントベンチマークであるAgentClinicを紹介する。
我々は,AgentClinicの逐次決定形式におけるMedQA問題の解決が極めて困難であることに気付き,診断精度が元の精度の10分の1以下に低下することを発見した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:58:58 GMT)
EVINCE: Optimizing Adversarial LLM Dialogues via Conditional Statistics and Information Theory [2.5] $EVINCE$は、人工知能(AGI)を進化させる対話フレームワークである。
大規模言語モデル(LLM)の汎用性、適応性、推論を高める
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:34:23 GMT)
Event-based Sensor Fusion and Application on Odometry: A Survey [2.4] イベントカメラは、高速モーション、低照度、広ダイナミックレンジを特徴とする環境において利点がある。
これらの特性は、特にロボット工学とコンピュータビジョンにおけるセンサー融合に有効なイベントカメラをレンダリングする。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:32:25 GMT)
Toward Enhancing Vehicle Color Recognition in Adverse Conditions: A Dataset and Benchmark [2.3] 車両色認識(VCR)は、視覚的に区別可能な車両の属性であるため、重要な研究の関心を集めている。
このタスクの既存の手法の成功にもかかわらず、文献で使用されるデータセットの比較的低い複雑さは、ほとんど見過ごされてきている。
この研究は、より困難なVCRシナリオを表す新しいデータセットをコンパイルすることで、このギャップに対処する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:09:14 GMT)
Reset It and Forget It: Relearning Last-Layer Weights Improves Continual and Transfer Learning [2.3] この研究は、継続学習と転帰学習をより良く示す表現につながる単純な事前学習メカニズムを特定する。
最後の層における重みの繰り返しのリセットは、私たちが「ザッピング」と呼ぶもので、元々はメタコンチネンタル・ラーニング(メタコンチネンタル・ラーニング)の手順のために設計されていた。
メタラーニングと継続学習の両以上の多くの環境で驚くほど適用可能であることを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:23:22 GMT)
SNAP: Stopping Catastrophic Forgetting in Hebbian Learning with Sigmoidal Neuronal Adaptive Plasticity [2.1] ANNは破滅的な忘れ込みに悩まされており、そこでは新しいタスクの学習が、古いタスクの破滅的な忘れ込みを引き起こす。
Sigmoidal Neuronal Adaptive Plasticity (SNAP) はANNの長期増強に有効である。
次に、SNAPを線形重み成長と指数重み成長と比較し、SNAPがヘビアンラーニングの従来のタスクを忘れてはならないが、SGDベースラーニングには当てはまらないことを確認する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:20:33 GMT)
Hybrid Top-Down Global Causal Discovery with Local Search for Linear and Nonlinear Additive Noise Models [2.1] 関数因果モデルに基づく手法は、ユニークなグラフを識別することができるが、次元性の呪いや強いパラメトリックな仮定を課すことに苦しむ。
本研究では,局所的な因果構造を利用した観測データにおけるグローバル因果発見のための新しいハイブリッド手法を提案する。
我々は, 合成データに対する実証的な検証を行い, 正確性および最悪の場合の時間複雑度を理論的に保証する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:25:07 GMT)
Multi-modal clothing recommendation model based on large model and VAE enhancement [2.0] 本研究では,衣服推薦のためのマルチモーダルパラダイムを提案する。
衣料品記述テキストと画像を統合し、事前訓練された大きな言語モデルを利用する。
ユーザ情報と製品の関係を学習するために,変分エンコーダを用いる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:40:57 GMT)
Learning Color Equivariant Representations [2.0] 色変化に同値なグループ畳み込みニューラルネットワーク(GCNN)を導入する。
GCNNは、2次元と3次元の回転群からスケールのような半群への様々な幾何学的変換のために設計されている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 23:21:45 GMT)
Evaluating Consistencies in LLM responses through a Semantic Clustering of Question Answering [1.9] 本稿では,Large Language Model (LLM) のセマンティクスを評価するための新しいアプローチを提案する。
本稿では,LLM再応答が意味論的に一致しているかどうかを考察し,構文的に異なる文が同じ意味を持つ可能性があることを認識した。
TruthfulQAデータセットを用いてLLM応答を評価することにより、37のカテゴリにわたる意味的一貫性を測定するために、質問毎にNの応答を誘導し、意味的に等価な文をクラスタ化する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:21:25 GMT)
BERTtime Stories: Investigating the Role of Synthetic Story Data in Language pre-training [1.9] TinyStories を用いた言語事前学習における合成物語データの効果について検討した。
TinyStoriesのサブセット上でGPT-Neoモデルをトレーニングします。
1億語未満の単語にアクセスしても、モデルは与えられたストーリーに対して高品質でオリジナルな補完を生成することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:47:17 GMT)
AI Can Enhance Creativity in Social Networks [1.8] 我々は、意味的特徴とネットワーク構造的特徴を用いて、人々の思考性能を予測するモデルを訓練した。
SocialMuseは、予測パフォーマンスを最大化し、ピアレコメンデーションを生成する。
ソーシャルミューズを用いた治療ネットワークは,いくつかの創造性対策において,AIに依存しない制御ネットワークよりも優れていた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 03:33:25 GMT)
Dual-Model Distillation for Efficient Action Classification with Hybrid Edge-Cloud Solution [1.8] 我々は、より大規模で正確なクラウドベースモデルに必要に応じて遅延しながら、より小さなモデルのローカル処理効率を活用するハイブリッドエッジクラウドソリューションを設計する。
具体的には、エッジモデルの出力が不確かである場合に予測可能な軽量スイッチャーモデルをトレーニングするための、新しい教師なしデータ生成手法であるDual-Model Distillation(DMD)を提案する。
動作分類タスクの実験結果から,我々のフレームワークは計算オーバーヘッドを少なくするだけでなく,大規模モデルのみを使用する場合と比較して精度も向上することが示された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:59:09 GMT)
A Comprehensive Evaluation of Cognitive Biases in LLMs [1.6] 20の最先端大言語モデル(LLM)における認知バイアスの大規模評価について述べる。
我々のコントリビューションには、LSMの信頼性と大規模なテスト生成のための新しい汎用テストフレームワークが含まれている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:07:51 GMT)
GPT-4 Understands Discourse at Least as Well as Humans Do [1.3] GPT-4は、非常に高いレベルの人的性能を与えられたヒトよりも、わずかに、統計的に有意ではない。
GPT-4と人間は共に、物語に明記されていない情報について推論する強力な能力を示しており、これは理解の批判的なテストである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:11:18 GMT)
Neural Active Structure-from-Motion in Dark and Textureless Environment [1.3] 構造光(SL)システムのための同時形状再構成とポーズ推定手法を提案する。
提案手法は,投影されたパターンのみを観察した画像から,正確な形状復元とポーズ推定を行うことができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:29:01 GMT)
XAI-based Feature Ensemble for Enhanced Anomaly Detection in Autonomous Driving Systems [1.3] 本稿では,複数の Explainable AI (XAI) メソッドを統合する新しい機能アンサンブルフレームワークを提案する。
このフレームワークは、6つの多様なAIモデルにまたがって、これらのXAIメソッドによって識別されるトップ機能を融合することによって、異常の検出に不可欠な堅牢で包括的な機能のセットを生成する。
我々の技術は、AIモデルの精度、堅牢性、透明性の向上を示し、より安全で信頼性の高い自動運転システムに貢献します。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:34:48 GMT)
Data Augmentation via Diffusion Model to Enhance AI Fairness [1.3] 本稿では,AIフェアネスを改善するために合成データを生成する拡散モデルの可能性について検討する。
Tabular Denoising Diffusion Probabilistic Model (Tab-DDPM) を用いてデータ拡張を行った。
実験結果から,Tab-DDPMにより生成された合成データは,二項分類の公平性を向上させることが示された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:52:31 GMT)
ActiveNeuS: Neural Signed Distance Fields for Active Stereo [1.2] 本稿では,アクティブステレオシステムのためのニューラルサイン付き距離場を提案し,一般化された構造光における暗黙の対応探索と三角測量を可能にする。
本手法では,少ない撮影画像であっても,低光環境下でのテクスチャレス面や等価面の再構成に成功している。
このような厳しい条件下で, 提案手法が最先端の復元品質を達成できることを示す実験を行った。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:20:47 GMT)
An Improved Chicken Swarm Optimization Algorithm for Handwritten Document Image Enhancement [1.2] ニワトリ群最適化は,ニワトリの捕食行動を模倣する新しいメタヒューリスティックアルゴリズムである。
アルゴリズムの結果は、Cuckoo SearchやFirefly、人工蜂コロニーといった既存のメタアルゴリズムと比較される。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:10:13 GMT)
SEA: State-Exchange Attention for High-Fidelity Physics-Based Transformers [1.2] シーケンシャルネットワークを用いた最近のアプローチは、動的システムのフィールド変数の推定において有望であることを示している。
符号化されたフィールド間の情報交換を可能にするトランスフォーマーベースのモジュールである,ステート・エクスチェンジ・アテンション(SEA)モジュールを紹介する。
システムの他の状態に依存している状態変数に対して,SEAモジュールだけでエラーを97%削減できることを実証した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:25:01 GMT)
Integrating Symbolic Neural Networks with Building Physics: A Study and Proposal [1.2] Kolmogorov-Arnold Networks (KAN)のようなシンボリックニューラルネットワークは、事前知識とデータ駆動手法を統合する上で有望なアプローチを提供する。
本研究では, 予測モデリング, 知識発見, 連続学習に焦点をあて, 物理学構築におけるkanの適用について検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:30:19 GMT)
Predicting adaptively chosen observables in quantum systems [1.2] 本研究は、局所、パウリ、有界-フロベニウス-ノルム可観測という3つのクラスに対する適応的な設定について検討する。
我々は、任意に大きい未知の量子状態の$Omega(sqrtM)$サンプルが、適応的に選択された局所およびパウリ観測可能な$M$の期待値を予測するために必要であることを証明した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:45:10 GMT)
CoCoGen: Physically-Consistent and Conditioned Score-based Generative Models for Forward and Inverse Problems [1.1] この研究は生成モデルの到達範囲を物理的問題領域に拡張する。
基礎となるPDEとの整合性を促進するための効率的なアプローチを提案する。
各種物理課題におけるスコアベース生成モデルの可能性と汎用性を示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:18:03 GMT)
Comprehensive Evaluation and Insights into the Use of Deep Neural Networks to Detect and Quantify Lymphoma Lesions in PET/CT Images [1.0] 本研究はPET/CT画像からの悪性リンパ腫病変の分節に対する4つのニューラルネットワークアーキテクチャの包括的評価を行う。
内部試験では、SegResNetが中心的なDice類似度係数(DSC)が0.76、中心的な偽陽性量(FPV)が4.55mlであった。
TMTV範囲の145例( [0.10, 2480] ml)では、SegResNetは21.46 mlのDSCとFPVを達成し、UNetは0.41 mlのFNVを得た。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 23:41:43 GMT)
Gradient-flow adaptive importance sampling for Bayesian leave one out cross-validation with application to sigmoidal classification models [1.0] 勾配流誘導適応重要度サンプリング(IS)変換によるモンテカルロ近似の安定化
我々は、モデルヘッセンに関するヤコビ行列式に対して閉形式完全式を導出する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:42:57 GMT)
Comparative Analysis of LSTM, GRU, and Transformer Models for Stock Price Prediction [0.9] 本稿では、AIによる株価トレンド予測を中核研究とする。
2015年から2024年にかけて、有名なTesla車のモデルトレーニングデータセットを作成し、LSTM、GRU、Transformer Modelsと比較した。
その結果,LSTMモデルの精度は94%であった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:00:58 GMT)
Wireless Link Quality Estimation Using LSTM Model [0.9] 本稿では,シーケンシャルな情報を活用することで,無線ネットワークの通信品質を推定する新しいモデルを提案する。
提案手法はLong Short-Term Memory (LSTM)に基づいて,リンク品質の逐次的情報を考慮した高精度な推定を可能にする。
LSTMを用いたLQEモデルでは,LQE-SAEモデルよりも4.0%高い精度と4.6%高いマクロF1スコアが得られた。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:53:42 GMT)
A Robust Deep Learning System for Motor Bearing Fault Detection: Leveraging Multiple Learning Strategies and a Novel Double Loss Function [0.7] モータ軸受故障検出(MBFD)は、産業機械の信頼性と運転効率を維持するために重要である。
本稿では,教師付き,半教師付き,教師なしの学習を含む複数の学習戦略を取り入れた,MBFDのための堅牢な深層学習システムを提案する。
提案手法は, 機械的破壊防止技術協会(T), ケース・ウェスタン・リザーブ大学ベアリングセンター(CWRU), パダーボーン大学の電気機械駆動システム(PU)における軸受損傷の条件モニタリングによる評価を行った。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:46:53 GMT)
Human and LLM Biases in Hate Speech Annotations: A Socio-Demographic Analysis of Annotators and Targets [0.7] 我々は、アノテータとターゲットの両方の社会デマトグラフィー情報を豊富なデータセットで活用する。
分析の結果,その強度と有病率に基づいて定量的に記述し,特徴付ける広範囲なバイアスの存在が明らかになった。
私たちの研究は、ヘイトスピーチアノテーションにおける人間のバイアスに関する新しい、そして、AI駆動のヘイトスピーチ検出システムの設計に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:13:18 GMT)
Human and LLM Biases in Hate Speech Annotations: A Socio-Demographic Analysis of Annotators and Targets [0.7] 我々は、アノテータとターゲットの両方の社会デマトグラフィー情報を豊富なデータセットで活用する。
分析の結果,その強度と有病率に基づいて定量的に記述し,特徴付ける広範囲なバイアスの存在が明らかになった。
私たちの研究は、ヘイトスピーチアノテーションにおける人間のバイアスに関する新しい、そして、AI駆動のヘイトスピーチ検出システムの設計に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:13:18 GMT)
Human and LLM Biases in Hate Speech Annotations: A Socio-Demographic Analysis of Annotators and Targets [0.7] 我々は、アノテータとターゲットの両方の社会デマトグラフィー情報を豊富なデータセットで活用する。
分析の結果,その強度と有病率に基づいて定量的に記述し,特徴付ける広範囲なバイアスの存在が明らかになった。
私たちの研究は、ヘイトスピーチアノテーションにおける人間のバイアスに関する新しい、そして、AI駆動のヘイトスピーチ検出システムの設計に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:13:18 GMT)
Does ChatGPT Have a Poetic Style? [0.7] 我々は、GPT-3.5とGPT-4モデルに、24種類の詩形式とスタイルで英語詩を生成するよう促す。
得られた5.7k詩を分析し、これらを詩財団とアメリカ詩人アカデミーの3.7k詩のサンプルと比較する。
GPTモデル、特にGPT-4は、共通言語と非共通言語の両方で詩を作成できることがわかった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:01:34 GMT)
Engineering the Environment of a Superconducting Qubit with an Artificial Giant Atom [0.6] 本稿では、導波路量子力学から人工巨大原子を用いて超伝導量子ビットとその環境間の相互作用を調整するアーキテクチャを提案する。
このアプローチはPurcellの限界を超え、読み出し速度を維持しながらキュービットの寿命を10倍に拡張する。
我々のアーキテクチャは、量子技術応用におけるブリッジ回路と導波路量子電磁力学システムへの期待を保っている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:21:37 GMT)
Classical and Quantum Frequency Combs for Satellite-based Clock Synchronization [0.6] 次世代の宇宙ネットワークには、衛星内に埋め込まれた光時計が含まれる。
現在の実験では、古典的な周波数コムが遠隔の光時計を自由空間上で同期させる可能性を示している。
しかし、スクイーズや絡み合いのような量子的性質を示す量子周波数コムは、標準的な量子限界を超える経路を提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 23:09:45 GMT)
Economic Anthropology in the Era of Generative Artificial Intelligence [0.6] この研究は、C.A.L.L.O.N.(Conventionally Averated Late Liberal Ontology)とM.A.U.S.(More Accurate Understanding of Society and its Symbols)の2つのAIモデルを紹介した。
この研究は、人類学的な訓練がLLMの多様な経済システムや概念を認識する能力をいかに強化するかを強調している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 00:27:33 GMT)
Real-time Event Joining in Practice With Kafka and Flink [0.5] 本稿では,Apache KafkaとFlinkを使用した機械学習モデルのストリーミングパイプラインへの移行を特徴付ける。
イベント間の因果依存性の管理、イベント時間と処理時間のバランス、正確に1対1のデリバリ保証の保証といった課題に対処します。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 23:14:10 GMT)
QOPS: A Compiler Framework for Quantum Circuit Simulation Acceleration with Profile Guided Optimizations [0.4] 本研究は、量子回路シミュレーション加速のためのプロファイル誘導最適化(PGO)を可能にする量子コンパイラフレームワークQOPSを提案する。
シミュレータ固有のPGOをベンチマークに適用して、シミュレーション速度を1.19倍に加速することができる。
ハードウェア非依存のPGOでは、最適化されていないバージョンに対して21%の性能向上を達成しているブルートフォース機構と比較して、PGOは、ブルートフォースアプローチよりも63パーセント少ないコンパイル時間で16%のスピードアップを達成することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:29:00 GMT)
QOPS: A Compiler Framework for Quantum Circuit Simulation Acceleration with Profile Guided Optimizations [0.4] 本研究は、量子回路シミュレーション加速のためのプロファイル誘導最適化(PGO)を可能にする量子コンパイラフレームワークQOPSを提案する。
シミュレータ固有のPGOをベンチマークに適用して、シミュレーション速度を1.19倍に加速することができる。
ハードウェア非依存のPGOでは、最適化されていないバージョンに対して21%の性能向上を達成しているブルートフォース機構と比較して、PGOは、ブルートフォースアプローチよりも63パーセント少ないコンパイル時間で16%のスピードアップを達成することができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:29:00 GMT)
Multi-modal clothing recommendation model based on large model and VAE enhancement [0.3] 本研究では,衣服推薦のためのマルチモーダルパラダイムを提案する。
衣料品記述テキストと画像を統合し、事前訓練された大きな言語モデルを利用する。
ユーザ情報と製品の関係を学習するために,変分エンコーダを用いる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:40:57 GMT)
TRIZ Method for Urban Building Energy Optimization: GWO-SARIMA-LSTM Forecasting model [0.3] 本研究では, TRIZのイノベーション理論をGWO, SARIMA, LSTMと組み合わせたハイブリッドディープラーニングモデルを提案する。
本実験は,既存モデルと比較して予測誤差が15%減少することを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:46:42 GMT)
A Novel Interpretability Metric for Explaining Bias in Language Models: Applications on Multilingual Models from Southeast Asia [0.3] 本稿では,事前学習言語モデルにおけるバイアス行動に対するトークンレベルの貢献度を測定するための新しい指標を提案する。
東南アジアのPLMにおいて性差別と同性愛バイアスの存在が確認された。
解釈可能性と意味分析は、PLMバイアスが犯罪、親密な関係、助けに関する言葉によって強く引き起こされることを示している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:31:05 GMT)
In-Context Ensemble Learning from Pseudo Labels Improves Video-Language Models for Low-Level Workflow Understanding [0.3] 標準運用手順は、ビジネスソフトウェアワークフローのための低レベルのステップバイステップのガイドを定義する。
近年の大規模ビデオ言語モデルの進歩は、人間の実演記録を解析することにより、SOP生成を自動化する可能性を秘めている。
本研究では,SOP生成のためのビデオ言語モデルを用いたインコンテキスト学習について検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:45:08 GMT)
In-Context Ensemble Improves Video-Language Models for Low-Level Workflow Understanding from Human Demonstrations [0.3] Standard Operating procedureは、ビデオデモに基づいて、ビジネスソフトウェアワークフローのための低レベルのステップバイステップのガイドを定義する。
近年の大規模ビデオ言語モデルの進歩は、人間の実演記録を解析することにより、SOP生成を自動化する可能性を秘めている。
SOP生成のためのビデオ言語モデルを用いたテキスト内学習について検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:45:08 GMT)
In-Context Ensemble Improves Video-Language Models for Low-Level Workflow Understanding from Human Demonstrations [0.3] Standard Operating procedureは、ビデオデモに基づいて、ビジネスソフトウェアワークフローのための低レベルのステップバイステップのガイドを定義する。
近年の大規模ビデオ言語モデルの進歩は、人間の実演記録を解析することにより、SOP生成を自動化する可能性を秘めている。
SOP生成のためのビデオ言語モデルを用いたテキスト内学習について検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 10:45:08 GMT)
A hybrid quantum solver for the Lorenz system [0.3] 我々は,ロレンツ系を解くための古典量子ハイブリッド法を開発した。
フォワードオイラー法を用いて系を時間的に離散化し、方程式系に変換する。
本稿では,ハイブリッド法と古典的アプローチを比較し,ロレンツ系を解く数値計算結果について述べる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:20:28 GMT)
Optimizing adaptive sampling via Policy Ranking [0.2] 本稿では,計量式ランキングによる最適サンプリングポリシーの同定のためのフレームワークを提案する。
提案手法は,コンフォーメーション空間を効果的に探索する能力に基づいて,政策アンサンブルを体系的に評価し,政策のランク付けを行う。
本稿では,このランキングフレームワークを高速に近似する2つのサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 02:58:20 GMT)
Formalization of Differential Privacy in Isabelle/HOL [0.2] 本稿では,Isabelle/HOLライブラリを提案する。
我々の知る限り、これは連続確率分布をサポートする微分プライバシーの最初の形式化である。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:06:13 GMT)
BnSentMix: A Diverse Bengali-English Code-Mixed Dataset for Sentiment Analysis [0.1] 我々はBnSentMixを紹介した。BnSentMixは、Facebook、YouTube、およびeコマースサイトからの4ドルの感情ラベルを持つ20,000のサンプルからなるコードミックスベンガルの感情分析データセットである。
総合的精度は69.8%、F1スコアは69.1%である。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:59:30 GMT)
Improving Voice Quality in Speech Anonymization With Just Perception-Informed Losses [0.1] 音声匿名化は、話者のアイデンティティを曖昧にしつつ、その後のタスクに重要な情報を保持する必要がある。
本研究は,人間の聴覚システムにインスパイアされた損失関数の重要性を浮き彫りにする。
提案する損失関数はモデルに依存しず,手工芸と深層学習を併用して品質表現を効果的に把握する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:33:44 GMT)
Wide range quantum enhanced rotation sensing with 1+2 dimensional dynamical decoupling techniques [0.0] そこで本研究では,$pi$-phase シフトのシーケンスを利用して動力学的デカップリング手法を提案する。
回転中の粒子の2次元振動モードからスピンを完全に切り離すことにより、スピンコヒーレンス時間と位相蓄積を著しく増大させることができる。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:40:21 GMT)
Variational formulations of ODE-Net as a mean-field optimal control problem and existence results [0.0] 本稿では,ディープニューラルネットワーク(DNN)の連続体モデルであるODE-Netの数学的解析について述べる。
近年、機械学習の研究者たちは、DNNの深い構造をODEに置き換えるアイデアを連続的な制限として導入している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:13:21 GMT)
Variational autoencoders with latent high-dimensional steady geometric flows for dynamics [0.0] 我々は、エンコーダとデコーダによって開発された中間ラテント空間において、多様体の幾何学が学習されるようなVAEフレームワークを再開発する。
我々の手法は,提案したアーキテクチャで与えられた標準のVAEとVAEを最大25%のアウト・オブ・ディストリビューション(OOD)誤差で上回り,潜在的に大きい。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:46:52 GMT)
Variational autoencoders with latent high-dimensional steady geometric flows for dynamics [0.0] 我々はPDE型環境データに対する変分オートエンコーダ(VAE)の手法を開発し,幾何学的潜在力学を規則化する。
エンコーダとデコーダによって開発された中間ラテント空間において,幾何学的流れを考慮した多様体幾何学が学習されるようなVAEフレームワークを再開発する。
興味のあるデータセットで、我々の手法は、少なくとも従来のVAEと同様にパフォーマンスが良く、しばしばより良くなることを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 08:46:52 GMT)
Vacuum currents in curved tubes [0.0] 空間曲率とトポロジーが2次元曲面管上に局在した荷電スカラー場における真空状態に及ぼす影響について検討した。
管の固有半径の小さい値では、曲率半径と比較して真空電流に対する空間曲率の影響は弱い。
曲率の影響は、空間曲率半径よりも大きい管の適切な半径に不可欠である。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 05:44:05 GMT)
Upsampling DINOv2 features for unsupervised vision tasks and weakly supervised materials segmentation [0.0] 自己監督型視覚変換器(ViT)は、オブジェクトのローカライゼーションやセグメンテーションといった下流タスクに関連する強力な意味情報と位置情報を含んでいる。
最近の研究は、これらの機能をクラスタリングやグラフパーティショニング、リージョン相関といった従来の手法と組み合わせて、追加のネットワークを微調整したり訓練したりすることなく、印象的なベースラインを達成している。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:01:53 GMT)
Stabilizer entropies are monotones for magic-state resource theory [0.0] 我々は、純状態に制限されたマジック状態資源理論の文脈内で、$alpha geq 2$に対して安定化器エントロピーの単調性を確立する。
我々は, コンベックス屋根構造を介して, モノトンとして混合状態に安定化器エントロピーを拡張した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:48:06 GMT)
Reinforcement Learning for Dynamic Memory Allocation [0.0] 本稿では,RLエージェントがシステムとのインタラクションから連続的に学習し,メモリ管理の戦術を改善する枠組みを提案する。
その結果、RLは従来のアロケーション戦略にマッチし、超えるエージェントを訓練できることがわかった。
また,アロケータの複雑な要求パターン処理能力を高めるために,従来のアロケーション要求を利用した履歴対応ポリシの可能性についても検討する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:13:46 GMT)
Reflections on Disentanglement and the Latent Space [0.0] 画像生成モデルの潜在空間は、圧縮された隠された視覚的知識の多次元空間である。
本稿では,多次元の文化アーカイブとして,多次元のポテンシャル空間として,潜在空間の二重ビューを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:40:09 GMT)
Reflections on Disentanglement and the Latent Space [0.0] 画像生成モデルの潜在空間は、圧縮された隠された視覚的知識の多次元空間である。
本稿では,多次元の文化アーカイブとして,多次元のポテンシャル空間として,潜在空間の二重ビューを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:40:09 GMT)
Realistic photon-number resolution in Gaussian boson sampling [0.0] ガウスボソンサンプリング(英: Gaussian boson sample、GBS)は、非普遍的な量子計算のモデルであり、現在の技術の量子超越性を証明していると主張している。
一般検出器や光計測技術に応用可能なGBSスキームにおける光計測確率分布を導出する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:51:27 GMT)
Quenched large deviations of Birkhoff sums along random quantum measurements [0.0] 我々は、エルゴード過程によって駆動されるランダム量子測定の列に沿って、バーホフのような和に対する大きな偏差原理の待ち行列を証明した。
この結果は,2時間測定フレームワークにおけるエントロピー生成の研究に応用される。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 18:34:05 GMT)
Problem-tailored Simulation of Energy Transport on Noisy Quantum Computers [0.0] スピンと電荷は、量子多体系の挙動を特徴づけるのに基本的である。
今日の量子コンピュータはゲートエラーとコヒーレンス時間に悩まされている。
本稿では,これらの力学をシミュレートする新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:52:38 GMT)
Power Plays: Unleashing Machine Learning Magic in Smart Grids [0.0] 機械学習アルゴリズムは、スマートメーター、センサー、その他のグリッドコンポーネントから大量のデータを分析して、エネルギー分布の最適化、需要予測、潜在的な障害を示す不規則性の検出を行う。
予測モデルの使用は、機器の故障を予測し、エネルギー供給の信頼性を向上させるのに役立つ。
しかしながら、これらのテクノロジの展開は、データのプライバシやセキュリティ、堅牢なインフラストラクチャの必要性に関する課題も引き起こす。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:39:08 GMT)
PixelBytes: Catching Unified Representation for Multimodal Generation [0.0] PixelBytesは、統合マルチモーダル表現学習のためのアプローチである。
我々は,テキスト,音声,動作状態,画素画像の凝集表現への統合について検討する。
我々はPixelBytes PokemonデータセットとOptimal-Controlデータセットの実験を行った。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:08:31 GMT)
PixelBytes: Catching Unified Representation for Multimodal Generation [0.0] PixelBytesは、統一マルチモーダル表現学習のための新しいアプローチである。
画像変換器などの既存のシーケンスモデルにインスパイアされた本手法は,結束表現における多様な入力をキャプチャすることを目的としている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:08:31 GMT)
POSE: Pose estimation Of virtual Sync Exhibit system [0.0] その動機は、フィットネスリングで遊ぶときにジョイスティックやセンサーを使うのが不便であることです。
ジョイスティックを交換し,コストを削減するために,仮想アバターをポーズ推定により制御し,実際の人の動きを識別するプラットフォームを開発した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:34:15 GMT)
Onboard Health Estimation using Distribution of Relaxation Times for Lithium-ion Batteries [0.0] 健常高齢者5例とサイクリング高齢者17例のインピーダンススペクトロスコピー(EIS)データを用いて,SOH(State-of-Health)推定を行った。
10種類の異なるテストセットでテストすることでモデル性能を検証し、平均 RMSPE は1.69% である。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 04:04:53 GMT)
On the exact solutions of a one-dimensional Schrödinger equation with a rational potential [0.0] 我々は、有理ポテンシャルを持つ条件付き解決可能なシュル・オーディンガー方程式の正確な解を解析する。
正確な固有関数のノードから、他の孤立な完全固有値とハミルトン作用素の実際の固有値との間の接続を導出する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:45:19 GMT)
Multi-Layer Feature Fusion with Cross-Channel Attention-Based U-Net for Kidney Tumor Segmentation [0.0] U-Netベースのディープラーニング技術は、自動化された医用画像セグメンテーションのための有望なアプローチとして登場しつつある。
腎腫瘍の診断のためのCTスキャン画像のエンドツーエンド自動セマンティックセマンティックセグメンテーションのための改良されたU-Netモデルを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:02:41 GMT)
Machine-assisted quantitizing designs: augmenting humanities and social sciences with artificial intelligence [0.0] 大規模言語モデル(LLM)は、人文科学や社会科学におけるデータ分析をスケールアップする前例のない機会であることが示された。
設計原則を定量化し、変換し、言語学から特徴分析し、人間の専門知識と機械のスケーラビリティを透過的に統合する混合手法を構築します。
このアプローチは、1ダース以上のLDM支援ケーススタディで議論され、9つの多様な言語、複数の規律、タスクをカバーしている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:00:19 GMT)
Likelihood-Free Inference and Hierarchical Data Assimilation for Geological Carbon Storage [0.0] 炭素貯蔵のための階層型データ同化フレームワークを開発した。
モンテカルロに基づく近似ベイズ計算を用いる。
3次元リカレントR-U-Net深層学習サロゲートモデルを用いて計算コストを削減する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:15:56 GMT)
Large language models as linguistic simulators and cognitive models in human research [0.0] 人間のようなテキストを生成する大きな言語モデル(LLM)の台頭は、行動や認知研究における人間の参加者を置き換える可能性についての議論を巻き起こした。
心理学・社会科学における言語モデルの基本的有用性を評価するために,この代替視点を批判的に評価する。
この視点は、行動科学と認知科学における言語モデルの役割を再定義し、言語シミュレータや認知モデルとして機能し、マシンインテリジェンスと人間の認知と思考の類似点と相違点に光を当てている。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:13:29 GMT)
Kerr enhanced optomechanical cooling in the unresolved sideband regime [0.0] 動的バックアクション冷却は、機械振動子の運動量子基底状態を達成する方法として成功したことが示されている。
しかし, この非解決サイドバンド方式の冷却技術は, 非線形キャビティを利用することで, 著しく向上できることを実証する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:06:12 GMT)
Improving Clinical Documentation with AI: A Comparative Study of Sporo AI Scribe and GPT-4o mini [0.0] Sporo HealthのAI書式はOpenAIのGPT-4o Miniに対して評価された。
結果から,スポロAIはGPT-4o Miniを一貫して上回り,リコール率,精度,F1スコア全体を達成した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:48:40 GMT)
High-dimensional prediction for count response via sparse exponential weights [0.0] 本稿では,高次元カウントデータ予測のための新しい確率的機械学習フレームワークを提案する。
重要な貢献は、データ予測をカウントするために調整された新しいリスク尺度であり、PAC-ベイズ境界を用いた予測リスクの理論的な保証である。
以上の結果から,非漸近性オラクルの不等式や,空間性に関する事前知識を伴わない速度-最適予測誤差が示唆された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:45:42 GMT)
Geometric phase for mixed squeezed-coherent states [0.0] 本研究では, 2モード混合圧縮コヒーレント状態 (SCS) によって得られた幾何相について検討した。
SCSの異なる構成を特徴とする3つの異なる混合状態のGPを解析する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:37:14 GMT)
Floquet-Enriched Nontrivial Topology at Quantum Criticality [0.0] 非自明な位相を特徴とする新しいフロケ臨界のクラスを同定する。
カイラル対称性を持つジェネリック駆動マヨラナフェルミオン鎖に対しては、フロケ駆動が遷移点を豊かにすることができることを解析的に証明する。
フロケ臨界における非自明な位相のメカニズムについて直観的な物理的説明を提供する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:06:02 GMT)
Faster Quantum Simulation Of Markovian Open Quantum Systems Via Randomisation [0.0] ランダム化を用いたマルコフ開量子系シミュレーションのための新しい非確率的アルゴリズムを提案する。
本手法は,システムの進化の物理性を維持しつつ,量子シミュレーションのスケーラビリティと精度を高める。
この研究は、オープン量子系のシミュレーションにランダム化技術を適用し、より高速で正確なシミュレーションを可能にする可能性を強調した最初のものである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 07:35:34 GMT)
Extensions on low-complexity DCT approximations for larger blocklengths based on minimal angle similarity [0.0] 離散コサイン変換(DCT)は、KLT(Karhunen-Loeve transform)に関連があるため、画像とビデオの符号化の中心的なツールである。
16点, 32点, 64点のDCT近似を導入し, 精度の高いDCT行列列と近似変換によって誘導される行列との角度を最小化する。
高速アルゴリズムは低複雑さ変換のためにも開発され、性能と計算コストのバランスが良いと主張した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 01:20:35 GMT)
Explainability of Point Cloud Neural Networks Using SMILE: Statistical Model-Agnostic Interpretability with Local Explanations [0.0] 本研究は,深層ニューラルネットワーク用に設計された新たな説明可能性手法であるSMILEの実装を,ポイントクラウドベースモデルを用いて検討する。
このアプローチは、様々なカーネル幅、摂動数、クラスタリング構成における忠実度損失、R2スコア、ロバストネスの点で優れた性能を示す。
カテゴリの分類におけるデータセットバイアスをさらに特定し、安全クリティカルなアプリケーションにおいてより包括的なデータセットの必要性を強調した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:13:59 GMT)
Ethical AI in Retail: Consumer Privacy and Fairness [0.0] 小売業における人工知能(AI)の採用は、業界を大きく変革させ、よりパーソナライズされたサービスと効率的な運用を可能にした。
しかし、AI技術の急速な実装は、特に消費者プライバシと公正性に関する倫理的懸念を提起する。
本研究の目的は、小売業におけるAIアプリケーションの倫理的課題を分析し、競争力を維持しながらAI技術を倫理的に実装する方法を探究し、倫理的AIプラクティスに関する推奨を提供することである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 12:00:14 GMT)
Enhancing entanglement in nano-mechanical oscillators via hybrid optomechanical systems [0.0] 連続変数の絡み合いの4つの基準を比較し、ガウスの2モード状態の分離性を決定するのに十分な条件となる。
本研究の結果から, 特定パラメータ範囲内における類似の絡み合いパターンが認められたが, 絡み合いの程度は選択基準によって異なることが明らかとなった。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 09:37:30 GMT)
Energy conservation in quantum optical high harmonic generation [0.0] 高調波発生における光子交換の完全な量子光学的記述を示す。
量子光学的高調波発生におけるエネルギー保存に関する提案された解は、その辺縁に古典的でない性質を持つ光の強い絡み合った状態をもたらす。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 20:49:09 GMT)
Don't Push the Button! Exploring Data Leakage Risks in Machine Learning and Transfer Learning [0.0] 本稿では、意図しない情報がトレーニングデータを汚染し、モデルの性能評価に影響を与える機械学習(ML)における重要な問題に対処する。
新たなデータに対する評価と実際のパフォーマンスの相違は大きな懸念事項である。
データ漏洩と対処中の特定のタスクとの関係を調査し、Transfer Learningにおけるその発生を調査し、標準的なインダクティブMLとトランスダクティブMLフレームワークを比較します。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 11:35:47 GMT)
Determining Quantum Correlation through Nash Equilibria in Constant-Sum Games [0.0] 量子ゲーム理論は、量子相関の理解を深めるための有望な候補として浮上している。
このことから、純粋な戦略であるナッシュ均衡が量子相関を目撃し決定するメカニズムとして利用できることが証明された。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 14:27:01 GMT)
Construction numbers: How to build a graph? [0.0] 構成列はグラフの要素の一覧であり、各エッジはその両方のエンドポイントに従う。
グラフの構成数はそのようなシーケンスの数である。
この数は様々なグラフ族に対して決定される。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 17:23:45 GMT)
CASET: Complexity Analysis using Simple Execution Traces for CS* submissions [0.0] CS1 や CS2 コースで学生の提出を自動アップグレードする最も一般的な方法は、事前に定義されたテストスイートに対して実行し、結果と参照結果を比較することである。
この手法は、解の正しさが、結果を得るために使われるアルゴリズムのような単純な出力を超えると利用できない。
動的トレースと教師なし機械学習を用いてアルゴリズムの時間的複雑さを解析する新しいツールCASETを提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:29:50 GMT)
Bound entangled states are useful in prepare-and-measure scenarios [0.0] 両部有界絡み状態は, 準備・測定シナリオにおける相関不等式に違反する可能性があることを示す。
有界絡み合い状態によるベルの不等式違反とは対照的に, 準備・測定シナリオにおける違反は小さく, 耐雑音性が高いことが判明した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 13:23:14 GMT)
AttCDCNet: Attention-enhanced Chest Disease Classification using X-Ray Images [0.0] X線画像診断のための新しい検出モデルtextbfAttCDCNetを提案する。
提案されたモデルは、新型コロナウイルスのラジオグラフィーデータセットでそれぞれ94.94%、95.14%、94.53%の精度、精度、リコールを達成した。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 16:08:20 GMT)
Advancing Gasoline Consumption Forecasting: A Novel Hybrid Model Integrating Transformers, LSTM, and CNN [0.0] イランには豊富な炭化水素資源が供給されており、世界のエネルギー環境において重要な役割を担っている。
ガソリンは重要な燃料であり、国の交通セクターを大いに支えている。
本研究では,ハイブリッドトランスフォーマーLSTM-CNNモデルを用いて,毎月のガソリン消費量を予測する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 22:33:00 GMT)
Accelerated Sub-Image Search For Variable-Size Patches Identification Based On Virtual Time Series Transformation And Segmentation [0.0] 本論文は, 物体の所定の基準画像に対して, (i) 空中画像において特定される干し草ベールなどの固定サイズの物体と, (ii) スポットスプレーやハンドリングを必要とするフィールド上の領域などの可変サイズのパッチを, 所定の小型参照画像に対して画像中に識別する,という2つの課題に対処する。
類似のサブイメージの正確な数は、前兆とは知られていない。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:43:50 GMT)
ASTM :Autonomous Smart Traffic Management System Using Artificial Intelligence CNN and LSTM [0.0] 本稿では,AIを用いて交通流量を改善する自律型スマートトラヒック管理システムを提案する。
このシステムは、交通管理画像中の車両を検出するために、YOLO V5 Convolutional Neural Networkを使用している。
また、長い短期記憶を備えたリカレントニューラルネットワークを使用して、次の12時間の車両数を予測する。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 06:24:22 GMT)
AI Art Curation: Re-imagining the city of Helsinki in occasion of its Biennial [0.0] このプロジェクトは、2023年のヘルシンキ美術二年祭で、"New Directions May Emerge"と題されて開発された。
我々はヘルシンキ美術館(HAM)のコレクションを使って、機械認識のレンズを通してヘルシンキ市を再想像する。
人工的な360度パノラマを制作することで、各芸術作品が市内に居住する空間を変革する。
このプロジェクトの成果は、アートワークを想像上の物理的な空間に配置するAIキュレーションである。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 15:23:33 GMT)
A Lieb-Robinson bound for open quantum systems with memory [0.0] 空間的に局所的な非マルコフ開量子格子モデルのクラスを考える。
我々の研究は、かつてマルコフ極限でのみ確立されていた開量子系に対するリーブ・ロビンソン境界を一般化する。
特に、リーブ・ロビンソン境界の結果として、局所的な可観測物を正確に捉えるために必要なシステムサイトごとの環境モードの数は、システムのサイズとは無関係であることを示す。
論文参考訳(メタデータ) (Sun, 20 Oct 2024 19:34:59 GMT)