Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for
Language Models [153.1] GLAN(Generalized Instruction Tuning)は,Large Language Models(LLM)の汎用的かつスケーラブルなチューニング手法である。
GLANは、人間の知識と能力の事前分類を入力として利用し、あらゆる分野にわたる大規模な合成指導データを生成する。
サイラバスの全クラスセッションで詳述された、きめ細かい重要な概念により、私たちは、人間の知識とスキルの全範囲にわたって幅広い範囲をカバーする多様な命令を生成できる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:00:35 GMT)
StyleDubber: Towards Multi-Scale Style Learning for Movie Dubbing [130.6] フレームレベルから音素レベルへのダビング学習を切り替えるStyleDubberを提案する。
本研究は,(1) 音素レベルで動作するマルチモーダルスタイル適応器を用いて,参照音声から発音スタイルを学習し,ビデオで提示される顔の感情によって伝達される中間表現を生成すること,(2) メルスペクトル復号と中間埋め込みからの精製プロセスの両方を案内して全体のスタイル表現を改善する発話レベル学習モジュール,(3) 唇同期を維持するための音素誘導唇整合器,の3つの構成要素を含む。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:28:34 GMT)
MIDDAG: Where Does Our News Go? Investigating Information Diffusion via
Community-Level Information Pathways [114.4] 我々は、新型コロナウイルス関連のニュース記事によって引き起こされるソーシャルメディア上の情報伝達経路を可視化する、直感的でインタラクティブなシステムMIDDAGを提案する。
我々は,ユーザ間のコミュニティを構築し,伝播予測機能を開発し,情報の普及方法の追跡と理解を可能にする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:48:15 GMT)
Variator: Accelerating Pre-trained Models with Plug-and-Play Compression
Modules [112.0] Variatorは、プラグアンドプレイ圧縮プラグインによる計算効率を向上させるパラメータ効率加速法である。
Variatorはパラメータを0.9%追加するだけで計算コストを53%削減でき、性能低下は2%未満である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:54:23 GMT)
Instruction-tuned Language Models are Better Knowledge Learners [110.4] 文書の学習に先立って質問を指導する手法として,PIT(Pre-instruction-tuning)を提案する。
PIT は LLM が新しい文書から知識を吸収する能力を著しく向上させ、17.8% の標準命令チューニングを達成している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:20:32 GMT)
FlashTex: Fast Relightable Mesh Texturing with LightControlNet [110.0] 本稿では,ユーザプロンプトテキストに基づく3Dメッシュの自動入力手法を提案する。
本研究は, 表面材料/反射率から光を引き離す方法に適用する。
私たちのパイプラインは、従来のテキストテクスチャメソッドよりもはるかに高速です。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:59:00 GMT)
A Survey on Knowledge Distillation of Large Language Models [102.8] 本稿では,Large Language Models(LLMs)領域における知識蒸留技術(KD)の深層探査について述べる。
これは、GPT-4のようなプロプライエタリな巨人からLLaMAやMistralのような、アクセス可能なオープンソースのモデルに移行する上で、KDが重要な役割を担っていることを強調している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:17:37 GMT)
Identifying Semantic Induction Heads to Understand In-Context Learning [98.4] 自然言語に存在するトークン間の2種類の関係を,注目ヘッドが符号化するかどうかを検討する。
特定の注意ヘッドは、ヘッドトークンに出席する際、テールトークンをリコールし、テールトークンの出力ロジットを増加させるパターンを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:43:39 GMT)
Healthcare Copilot: Eliciting the Power of General LLMs for Medical
Consultation [96.2] 医療相談用に設計された医療コパイロットの構築について紹介する。
提案した医療コパイロットは,(1)効果的で安全な患者との対話に責任を負う対話コンポーネント,2)現在の会話データと過去の患者情報の両方を記憶する記憶コンポーネント,3)処理コンポーネント,そして,対話全体を要約し,報告を生成する。
提案したヘルスケア・コパイロットを評価するために,ChatGPT を用いた仮想患者とコーピロとの対話を行う仮想患者と,対話の質を評価するための評価器の2つの役割を自動評価する手法を実装した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:26:35 GMT)
Backward Lens: Projecting Language Model Gradients into the Vocabulary
Space [94.9] 勾配行列は、その前方および後方の入力の低ランク線形結合としてキャスト可能であることを示す。
次に、これらの勾配を語彙項目に投影する手法を開発し、新しい情報がLMのニューロンにどのように格納されているかのメカニズムを探索する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:57:08 GMT)
BiMediX: Bilingual Medical Mixture of Experts LLM [94.9] 英語とアラビア語の両方でシームレスに相互作用するように設計された、最初のバイリンガル医療混合物であるBiMediXを紹介する。
我々のモデルは、英語とアラビア語の幅広い医学的相互作用を促進し、さらに詳細を問い合わせるマルチターンチャットを含む。
そこで我々は,高品質な翻訳を保証するために,人間の洗練を図った英語からアラビア語への半自動翻訳パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:59:26 GMT)
Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.4] 複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:03:36 GMT)
Pseudo-Generalized Dynamic View Synthesis from a Video [91.7] モノクロビデオで見るシーンを、新しい視点から見るのは、難しい問題だ。
動的シーンにはシーン固有の最適化手法が存在するが、私たちの知る限り、与えられたモノクロビデオから動的新規ビューを合成するための一般化方法が現在存在しない。
シーン固有の外観最適化が不要な擬似一般化プロセスが可能であるが、幾何学的かつ時間的に一貫した深さ推定が必要である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:11:52 GMT)
On Context Utilization in Summarization with Large Language Models [91.6] 大きな言語モデル(LLM)は抽象的な要約タスクに優れ、流動的で関連する要約を提供する。
最近の進歩は、100kトークンを超える長期入力コンテキストを扱う能力を拡張している。
要約における文脈利用と位置バイアスに関する最初の総合的研究を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:14:44 GMT)
Code Needs Comments: Enhancing Code LLMs with Comment Augmentation [91.5] 本稿では、既存のコードに対するコメントを生成する新しいデータ拡張手法と、自然言語と相関の低いコードデータをフィルタリングするデータフィルタリング戦略を導入する。
我々は3つのコード中心の大規模言語モデルの実験を行い、2つの広く使われているプログラミングスキルベンチマークで一貫した性能向上を観察した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:56:38 GMT)
VideoPrism: A Foundational Visual Encoder for Video Understanding [91.3] VideoPrismは、単一の凍結モデルで多様なビデオ理解タスクに取り組む汎用ビデオエンコーダである。
我々は,36Mの高品質ビデオキャプチャ対と582Mの動画クリップを含む異種コーパス上で,VoicePrismを事前訓練した。
我々は、Webビデオ質問応答から科学用CVまで、ビデオ理解タスクの4つのグループでビデオPrismを広範囲にテストし、33の動画理解ベンチマークのうち30で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:29:49 GMT)
MuLan: Multimodal-LLM Agent for Progressive Multi-Object Diffusion [87.7] トレーニング不要なマルチモーダルLLMエージェント(MuLan)を開発し、複数のオブジェクトの画像を生成する。
MuLanは、大きな言語モデル(LLM)を使用して、サブタスクのシーケンスへのプロンプトを分解する。
結果は、ベースライン上の複数のオブジェクトを生成する際の MuLan の優位性を示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:14:30 GMT)
How Graph Neural Networks Learn: Lessons from Training Dynamics [86.3] グラフニューラルネットワーク(GNN)の関数空間におけるトレーニングダイナミクスについて検討する。
勾配降下によるGNNの最適化は暗黙的にグラフ構造を利用して学習した関数を更新する。
グラフ構造を用いて学習した関数を明示的に更新することで得られる単純で効率的な非パラメトリックアルゴリズムは、非線形GNNと一貫して競合することを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:10:59 GMT)
Enumerating Safe Regions in Deep Neural Networks with Provable
Probabilistic Guarantees [86.1] 安全プロパティとDNNが与えられた場合、安全であるプロパティ入力領域のすべての領域の集合を列挙する。
この問題の #P-hardness のため,epsilon-ProVe と呼ばれる効率的な近似法を提案する。
提案手法は, 許容限界の統計的予測により得られた出力可到達集合の制御可能な過小評価を利用する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:35:48 GMT)
GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object
with Gaussian Splatting [85.8] 高度にスパースな視点から3Dオブジェクトを再構成・レンダリングすることは、3Dビジョン技術の応用を促進する上で非常に重要である。
ガウススプラッティングで3Dオブジェクトを表現・描画するフレームワークを提案する。
提案手法は,MipNeRF360,OmniObject3D,OpenIlluminationなどの難易度データセットを用いて評価する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:19:46 GMT)
Cell Graph Transformer for Nuclei Classification [78.5] 我々は,ノードとエッジを入力トークンとして扱うセルグラフ変換器(CGT)を開発した。
不愉快な特徴は、騒々しい自己注意スコアと劣等な収束につながる可能性がある。
グラフ畳み込みネットワーク(GCN)を利用して特徴抽出器を学習する新しいトポロジ対応事前学習法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:01:30 GMT)
SoMeLVLM: A Large Vision Language Model for Social Media Processing [78.5] ソーシャルメディア処理のための大規模ビジョン言語モデル(SoMeLVLM)を提案する。
SoMeLVLMは、知識と理解、応用、分析、評価、作成を含む5つの重要な機能を備えた認知フレームワークである。
実験により,複数のソーシャルメディアタスクにおいて,SoMeLVLMが最先端のパフォーマンスを達成できることが実証された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:02:45 GMT)
NuScenes-QA: A Multi-modal Visual Question Answering Benchmark for
Autonomous Driving Scenario [77.1] NuScenesQAは、自動運転シナリオにおけるVQAの最初のベンチマークであり、34Kの視覚シーンと460Kの質問応答ペアを含んでいる。
既存の3D検出アノテーションを利用してシーングラフと質問テンプレートを手動で作成する。
先進的な3D検出とVQA技術を用いた一連のベースラインを開発する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:04:58 GMT)
Exact Hard Monotonic Attention for Character-Level Transduction [76.7] 非単調なソフトアテンションを用いたニューラルシークエンス・ツー・シーケンスモデルは、しばしば一般的な単調モデルよりも優れていることを示す。
我々は、厳密な単調性を強制し、トランスデューサの学習中に協調して潜時アライメントを学習するハードアテンションシーケンス・ツー・シーケンス・モデルを開発した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:41:14 GMT)
UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.1] ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:50:27 GMT)
The FinBen: An Holistic Financial Benchmark for Large Language Models [75.1] FinBenは、金融分野におけるLLMの能力を徹底的に評価するために設計された、初めての包括的なオープンソース評価ベンチマークである。
FinBenは、23の財務タスクにわたる35のデータセットを含み、Cattell-Horn-Carroll理論にインスパイアされた3つの難易度に分類されている。
GPT-4, ChatGPT, そして最新のGeminiを含む15の代表的なLCMを評価した結果, 金融分野におけるその強みと限界についての知見が得られた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:16:16 GMT)
CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the
Generalizability of Large Language Models [74.1] 本研究では,中国語に対する大規模言語モデル(LLM)の一般化性を評価するために,中国語命令追跡ベンチマーク(CIF-Bench)を導入する。
CIF-Benchは150のタスクと15,000の入力出力ペアで構成され、複雑な推論と中国の文化的ニュアンスをテストするためにネイティブスピーカーによって開発された。
28個のLCMを評価したところ,最高のモデルでは52.9%に過ぎず,顕著な性能差が認められた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:02:12 GMT)
WisdoM: Improving Multimodal Sentiment Analysis by Fusing Contextual
World Knowledge [73.8] 大規模視覚言語モデル(LVLM)から引き起こされる文脈的世界知識を利用してマルチモーダル感情分析を行うプラグインフレームワークWisdoMを提案する。
我々の手法は、いくつかの最先端手法よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:28:50 GMT)
Model Composition for Multimodal Large Language Models [73.7] 本稿では,既存のMLLMのモデル構成による新しいパラダイムを提案する。
我々の基本的な実装であるNaiveMCは、モダリティエンコーダを再利用し、LLMパラメータをマージすることで、このパラダイムの有効性を実証する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:38:10 GMT)
Advancing Large Language Models to Capture Varied Speaking Styles and
Respond Properly in Spoken Conversations [73.4] 現在の2つの旋回が同じ文であっても、異なるスタイルで話されるときの応答は相変わらず異なる。
本稿では,言語内容と発話スタイルをモデル化できるSpken-LLMフレームワークを提案する。
StyleTalkデータセットを使用してSpoken-LLMをトレーニングし、Spoken-LLMが話し方を学ぶのに役立つ2段階のトレーニングパイプラインを作成します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:51:43 GMT)
A Comprehensive Overview of Large Language Models [70.8] 大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。
本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:19:41 GMT)
Semi-Autoregressive Streaming ASR With Label Context [70.8] 本稿では,先行ブロックで出力されたラベルを付加コンテキストとして組み込んだストリーミング「半自己回帰型」ASRモデルを提案する。
実験の結果,既存のストリーミングNARモデルではTedlium2が19%,Librispeech-100が16%/8%,Switchboard(SWB)/Callhome(CH)テストセットが19%/8%であった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:06:16 GMT)
Federated Causal Discovery from Heterogeneous Data [70.3] 任意の因果モデルと異種データに対応する新しいFCD法を提案する。
FCD法は、特定可能な機能因果モデルや同質データ分布の潜在的に制限的な仮定によって制限される。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:53:53 GMT)
Spurious Correlations in Machine Learning: A Survey [69.9] 機械学習システムは、入力の偏りのある特徴と対応するラベルの間の急激な相関に敏感である。
これらの特徴とそのラベルとの相関は"spurious"として知られている。
我々は、機械学習モデルにおける素早い相関に対処する現在の最先端の手法の分類とともに、この問題を包括的にレビューする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:49:34 GMT)
Large Language Models: A Survey [69.7] 大規模言語モデル(LLM)は、広範囲の自然言語タスクにおける強力なパフォーマンスのために、多くの注目を集めている。
LLMの汎用言語理解と生成能力は、膨大なテキストデータに基づいて数十億のモデルのパラメータを訓練することで得られる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:33:49 GMT)
LESS: Selecting Influential Data for Targeted Instruction Tuning [69.5] 本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:24:09 GMT)
Stable Knowledge Editing in Large Language Models [69.0] 本稿では,知識ローカライゼーションではなく,知識増強に基づく知識編集手法であるStableKEを紹介する。
人間のラベル付けのコストを克服するため、StableKEは2つの自動知識増強戦略を統合している。
StableKEは、他の知識編集方法を超え、編集された知識とマルチホップ知識の両方の安定性を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:36:23 GMT)
RenderDiffusion: Image Diffusion for 3D Reconstruction, Inpainting and
Generation [68.1] 単分子2次元観察のみを用いて学習した3次元生成と推論のための最初の拡散モデルであるRenderDiffusionを提案する。
FFHQ,AFHQ,ShapeNet,CLEVRのデータセット上でRenderDiffusionを評価し,3Dシーンの生成と2D画像からの3Dシーンの推測の競合性能を示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:59:05 GMT)
Generalizable Chain-of-Thought Prompting in Mixed-task Scenarios with
Large Language Models [68.1] 大規模言語モデル(LLM)は、チェーン・オブ・ソート(CoT)のプロンプトを活用することで、顕著な推論機能を明らかにしている。
本稿では,入力質問の種類が不明な混合タスクシナリオにおいて,一般化可能なCoTプロンプト機構であるGeM-CoTを提案する。
この技術設計により、GeM-CoTは10の公開推論タスクと23のBBHタスクにおいて優れた一般化能力と優れたパフォーマンスを同時に享受する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:27:20 GMT)
A Glitch in the Matrix? Locating and Detecting Language Model Grounding
with Fakepedia [68.0] 大規模言語モデル(LLM)は、そのコンテキストで提供される新しい情報を引き出すという印象的な能力を持つ。
しかし、この文脈的基盤のメカニズムはいまだに不明である。
本稿では,Fakepedia を用いたグラウンドディング能力の研究手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:27:17 GMT)
Random Aggregate Beamforming for Over-the-Air Federated Learning in Large-Scale Networks [66.2] 本稿では,アグリゲーションエラーを最小限に抑え,選択したデバイス数を最大化する目的で,共同装置の選択とアグリゲーションビームフォーミング設計について検討する。
コスト効率のよい方法でこの問題に取り組むために,ランダムな集合ビームフォーミング方式を提案する。
また, 得られた集計誤差と, デバイス数が大きい場合に選択したデバイス数についても解析を行った。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:59:45 GMT)
Agent Alignment in Evolving Social Norms [65.5] 本稿では,エージェント進化とアライメントのための進化的フレームワークであるEvolutionaryAgentを提案する。
社会規範が継続的に進化する環境では、エージェントは現在の社会規範に適応し、生存と増殖の確率が高くなる。
進化的エージェントは、一般的なタスクにおいてその能力を維持しながら、進化する社会規範と徐々に整合できることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:24:55 GMT)
Hard Non-Monotonic Attention for Character-Level Transduction [65.2] 2つの弦間の多くの非単調なアライメントを余剰化するための厳密な指数時間アルゴリズムを導入する。
ソフト・モノトニック・アテンションとハード・ノン・モノトニック・アテンションを実験的に比較したところ、正確なアルゴリズムは近似よりも性能を著しく改善し、ソフト・アテンションよりも優れていた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:36:05 GMT)
InstaGen: Enhancing Object Detection by Training on Synthetic Dataset [63.8] 本稿では,オブジェクト検出機能の向上,例えばカテゴリ拡大や検出性能の向上など,新たなパラダイムを提案する。
インスタンスレベルの接地ヘッドを事前学習した生成拡散モデルに統合する。
InstaGenからの合成データセットのトレーニング中にオブジェクト検出器を拡張できることを実証するために、徹底的な実験を行った。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:35:04 GMT)
Soft Self-Consistency Improves Language Model Agents [63.0] 現在の「サンプルとセレクト」メソッドは、回答を得るために多数決に頼っている。
Soft Self-Consistency (Soft-SC) は、SCの不連続スコアをモデル確率から計算した連続スコアに置き換える。
ソフトSCは、bashプログラムの絶対的な成功率でSCを1.3%上回り、オンラインショッピングでは6.6%増、インタラクティブホームゲームでは4.7%増となっている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:22:38 GMT)
Chain of Thought Empowers Transformers to Solve Inherently Serial
Problems [62.9] 思考の連鎖(CoT)は、算術や記号的推論タスクにおいて、大きな言語モデル(LLM)の精度を向上させるための非常に効果的な方法である。
この研究は、表現性のレンズを通してデコーダのみの変換器に対するCoTのパワーを理論的に理解する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:11:03 GMT)
A Literature Review of Literature Reviews in Pattern Analysis and
Machine Intelligence [62.9] この分析は、様々な観点からPAMI分野のレビューを徹底的にレビューすることを目的としている。
書評を自動評価するために,大規模言語モデルを用いた書評指標を提案する。
新たに登場したAI生成の文献レビューも評価されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:28:50 GMT)
On the Stability of Gradient Descent for Large Learning Rate [62.2] ニューラルネットワークトレーニングにおいて、エッジ・オブ・安定性(EoS)は、エポック上での損失関数の非単調な減少を特徴とする。
2次損失関数の下で最適化された線形ニューラルネットワークは、第1の仮定および第2の仮定に必要な条件を満たすことを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:01:42 GMT)
An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.9] 本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:21:46 GMT)
Iterative Preference Learning from Human Feedback: Bridging Theory and
Practice for RLHF under KL-Constraint [59.2] 本稿では,RLHFによる強化学習を用いた生成モデルのアライメント過程の理論的枠組みについて検討する。
我々は、標準的な数学的定式化、RLHFの逆KL正規化文脈帯域を考える。
我々は、オフライン、オンライン、ハイブリッドの3つの異なる設定でその振る舞いを調査し、有限サンプル理論的保証を持つ効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:14:42 GMT)
How Easy is It to Fool Your Multimodal LLMs? An Empirical Analysis on
Deceptive Prompts [59.1] 提案するMAD-Benchは,既存オブジェクト,オブジェクト数,空間関係,視覚的混乱など,850の試験サンプルを6つのカテゴリに分けたベンチマークである。
GPT-4V, Gemini-Pro から LLaVA-1.5 や CogVLM などのオープンソースモデルに至るまで,一般的な MLLM を包括的に分析する。
GPT-4VはMAD-Benchで75.02%の精度を達成するが、実験中の他のモデルの精度は5%から35%である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:31:27 GMT)
Mechanistic Neural Networks for Scientific Machine Learning [59.0] 我々は、科学における機械学習応用のためのニューラルネットワーク設計であるメカニスティックニューラルネットワークを提案する。
新しいメカニスティックブロックを標準アーキテクチャに組み込んで、微分方程式を表現として明示的に学習する。
我々のアプローチの中心は、線形プログラムを解くために線形ODEを解く技術に着想を得た、新しい線形計画解法(NeuRLP)である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:23:24 GMT)
SemiReward: A General Reward Model for Semi-supervised Learning [58.5] 半教師付き学習(SSL)は、擬似ラベリングによる自己学習フレームワークの様々な改善により、大きな進歩をみせた。
主な課題は、高品質な擬似ラベルを確認バイアスと区別する方法である。
本稿では、報酬スコアを予測して高品質な擬似ラベルを評価・フィルタリングするセミ教師付きリワードフレームワーク(SemiReward)を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:02:18 GMT)
Stable Nonconvex-Nonconcave Training via Linear Interpolation [58.1] 本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:31:24 GMT)
SMC-NCA: Semantic-guided Multi-level Contrast for Semi-supervised
Temporal Action Segmentation [57.9] 本稿では,アクションセグメンテーションのための強力なフレームワイズ表現を抽出するために,近隣環境対応ユニット(SMC-NCA)を用いた新しいマルチレベルコントラスト方式を提案する。
我々のSMCは3つのベンチマークで他の最先端の手法よりも優れており、編集距離と精度の点で最大17.8%と12.6%の改善を提供している。
また,提案手法の有効性をパーキンソン病マウス行動データセットに示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:57:50 GMT)
The Wolf Within: Covert Injection of Malice into MLLM Societies via an
MLLM Operative [57.8] 本稿では,MLLM社会において,悪意のあるコンテンツの間接的伝播という新たな脆弱性について検討する。
MLLMの直接有害な出力生成とは違って,1つのMLLMエージェントを微妙に影響してプロンプトを生成する方法を示す。
この微妙で強力な間接的影響の手法は、MLLMに関連するセキュリティリスクを著しくエスカレーションしている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:08:21 GMT)
Estimating the Causal Effect of Early ArXiving on Paper Acceptance [56.5] 我々は,論文の審査期間(初期arXiving)前にarXivingが会議の受理に与える影響を推定する。
以上の結果から,早期のarXivingは,論文の受容に少なからぬ影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:37:12 GMT)
Efficient adjustment for complex covariates: Gaining efficiency with
DOPE [56.5] 共変量によって表現される情報のサブセットを調整可能なフレームワークを提案する。
理論的な結果に基づいて,平均処理効果(ATE)の効率的な評価を目的とした,デバイアスドアウトカム適応確率推定器(DOPE)を提案する。
その結果,DOPE は様々な観測環境において ATE 推定のための効率的かつ堅牢な手法を提供することがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:02:51 GMT)
STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.3] STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:00:21 GMT)
Textless Low-Resource Speech-to-Speech Translation With Unit Language
Models [56.1] 本稿では,テキストレス低音源音声合成システム(S2ST)を学習するための新しいフレームワークを提案する。
我々はS2STを単位から単位へのセク2セク翻訳タスクとして微調整し、大規模単言語音声データに対する事前学習から始める。
3つのドメインで英語、ドイツ語、マラティー語、英語の翻訳をトレーニングし、評価する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:55:52 GMT)
Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation [55.7] 本研究では,非テクスチャ化された「トリックテスト」と,現実的利用と有形効果に根ざした評価の対応について検討する。
本稿では,現在文献に適合している3つの非文脈評価と,長文コンテンツ生成に適用された3つの類似のRUTED評価を比較した。
トリックテストとRUTEd評価の対応は見つからなかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:49:15 GMT)
Does Collaborative Human-LM Dialogue Generation Help Information
Extraction from Human Dialogues? [55.3] 実際のアプリケーションにおける人間の対話の問題解決は、既存のWizard-of-Ozコレクションよりもはるかに複雑である。
本稿では,リアルな対話を合成できる人間間対話生成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:12:39 GMT)
Systematic Mapping Protocol -- UX Design role in software development
process [55.2] ソフトウェア開発プロセスにおけるUXデザイナの役割を調べるための体系的なマッピングプロトコルを提案する。
本研究は,地図作成に使用する研究課題,スコープ,ソース,検索戦略,選択基準,データ抽出,分析方法を定義する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:56:46 GMT)
WKVQuant: Quantizing Weight and Key/Value Cache for Large Language
Models Gains More [55.1] 大規模言語モデル (LLM) は、そのメモリ要求と自動回帰テキスト生成プロセスの計算要求のために、重要なデプロイメント課題に直面している。
本稿では、モデルパラメータとアクティベーションを低ビット整数に変換することでメモリ消費を低減する手法であるLCMの量子化に着目し、これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:48:24 GMT)
From Quantity to Quality: Boosting LLM Performance with Self-Guided Data
Selection for Instruction Tuning [54.2] 我々は大規模言語モデルのための自己誘導手法を導入し、大規模なオープンソースデータセットからサクラサンプルを自律的に識別し、選択する。
私たちの重要なイノベーションであるIFD(Instruction-Following Difficulty)メトリックは、モデルが期待する応答と自動生成技術との間の相違を識別するための重要なツールとして現れます。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:26:47 GMT)
Denoising Diffusion via Image-Based Rendering [54.2] 実世界の3Dシーンの高速かつ詳細な再構築と生成を可能にする最初の拡散モデルを提案する。
まず、大きな3Dシーンを効率よく正確に表現できる新しいニューラルシーン表現であるIBプレーンを導入する。
第二に,2次元画像のみを用いて,この新たな3次元シーン表現の事前学習を行うためのデノイング拡散フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:59:48 GMT)
Neuromorphic Synergy for Video Binarization [54.2] バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:43:51 GMT)
Bounding Reconstruction Attack Success of Adversaries Without Data
Priors [53.4] 機械学習(ML)モデルに対する再構成攻撃は、機密データの漏洩の強いリスクをもたらす。
本研究では,現実的な対角的環境下での再建成功に関する公式な上限を提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:52:30 GMT)
ArabicMMLU: Assessing Massive Multitask Language Understanding in Arabic [53.2] アラビア語に対する最初のマルチタスク言語理解ベンチマークであるアラビアMMLUを提示する。
我々のデータは、現代標準アラビア語(MSA)における40のタスクと14,575の多重選択質問からなる。
35モデルについて評価した結果,特にオープンソースモデルにおいて,改善の余地がかなり高いことが判明した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:07:41 GMT)
GumbelSoft: Diversified Language Model Watermarking via the
GumbelMax-trick [52.9] 大型言語モデル(LLM)は、人間のようなテキストを生成するだけでなく、フェイクニュースや学術的不正の誤用も懸念している。
デコードベースの透かし、特にGumbelMax-trickベースの透かし(GM透かし)は、機械生成テキストを保護するためのスタンドアウトソリューションである。
我々は,新しいタイプのGM透かし,Logits-Addition透かし,およびその3つの変種を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:05:47 GMT)
Can Fairness be Automated? Guidelines and Opportunities for
Fairness-aware AutoML [52.9] 本報告では、公平性に関連する害が発生する様々な方法の概要を概説する。
この方向に進むためには、いくつかのオープンな技術的課題を強調します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:36:11 GMT)
Bayesian Neural Networks with Domain Knowledge Priors [52.8] ドメイン知識の一般的な形式をBNNに組み込むためのフレームワークを提案する。
提案したドメイン知識を用いたBNNは,標準知識のBNNよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:34:53 GMT)
Effective and Efficient Conversation Retrieval for Dialogue State
Tracking with Implicit Text Summaries [51.9] LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:31:17 GMT)
A call for frugal modelling: two case studies involving molecular spin
dynamics [51.8] 我々は、モデリングに対するフラゴールアプローチの原理を提示し、批判的に説明する。
どちらの例でも、計算的に高価なバージョンのモデルが公開された。
コミュニティとして、この方向に改善の余地はたくさんあります。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:19:22 GMT)
Towards Distribution-Agnostic Generalized Category Discovery [51.5] データ不均衡とオープンエンドの分布は、現実の視覚世界の本質的な特性である。
我々は,BaCon(Self-Balanced Co-Advice contrastive framework)を提案する。
BaConは、対照的な学習ブランチと擬似ラベルブランチで構成され、DA-GCDタスクを解決するためのインタラクティブな監視を提供するために協力して動作する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:39:32 GMT)
MM-LLMs: Recent Advances in MultiModal Large Language Models [51.5] 過去1年間で、MM-LLM(MultiModal Large Language Models)が大幅に進歩している。
MM-LLMのさらなる研究を促進するための総合的な調査を行う。
本稿では,主要なベンチマークで選択したMM-LLMの性能を概観し,MM-LLMの有効性を高めるための鍵となるトレーニングレシピを要約する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:51:37 GMT)
Incentivized Exploration via Filtered Posterior Sampling [51.3] 情報非対称性を活用できる社会学習問題における「インセンティブ付き探索」(IE)について検討し、エージェントにインセンティブを与えて探索行動をとる。
我々は,IE の汎用的解法として,多腕バンディットの文献でよく知られるアルゴリズム的手法である後方サンプリングを同定する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:30:55 GMT)
PANDA: Preference Adaptation for Enhancing Domain-Specific Abilities of
LLMs [51.2] 大規模言語モデルは、しばしばドメイン固有の最先端モデルによって達成されるパフォーマンスに欠ける。
LLMのドメイン固有の機能を強化する1つの潜在的アプローチは、対応するデータセットを使用してそれらを微調整することである。
LLM(PANDA)のドメイン固有能力を高めるための優先度適応法を提案する。
実験の結果,PANDA はテキスト分類や対話型意思決定タスクにおいて LLM のドメイン固有性を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:02:55 GMT)
Seed-Guided Fine-Grained Entity Typing in Science and Engineering
Domains [51.0] 科学・工学分野において,シード誘導型細粒度エンティティタイピングの課題について検討する。
まず、ラベルのないコーパスから各タイプのエンティティを抽出し、弱い監視力を高めるSETypeを提案する。
そして、リッチなエンティティをラベルなしのテキストにマッチさせ、擬似ラベル付きサンプルを取得し、見知らぬ型と見えない型の両方に推論できるテキストエンテリメントモデルを訓練する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:50:46 GMT)
Identifying Factual Inconsistency in Summaries: Towards Effective
Utilization of Large Language Model [50.7] この研究は2つの重要な疑問に焦点をあてる: 現実の不整合検出に大規模言語モデル(LLM)を利用する最善の方法は何か、そして、どのようにしてより小さなLCMを高い効率と有効性で蒸留できるのか?
実験の結果、LLM自体が適切なパラダイム設計の下でこのタスクを無断で解決でき、訓練されたベースラインが平均2.8%を超えることが示唆された。
実用性をさらに向上するため,我々はより小型のオープンソースLCMを蒸留し,要約全体を高精度にまとめることを目指す訓練戦略を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:41:23 GMT)
Endowing Pre-trained Graph Models with Provable Fairness [49.8] 証明可能な公正性を持つ事前学習グラフモデル(GraphPAR)を実現する新しいアダプタチューニングフレームワークを提案する。
具体的には、各ノードに対して異なる属性意味を持つノード表現を拡張するために、ノード表現に対するセンシティブなセマンティックオーグメンタを設計する。
GraphPARでは、各ノードの公平性が証明可能であるかどうか、すなわち、予測が特定の機密属性セマンティクスの範囲内で常に公平であるかどうかを定量化する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:03:43 GMT)
LARA: A Light and Anti-overfitting Retraining Approach for Unsupervised
Anomaly Detection [49.5] 深部変分自動エンコーダに基づく時系列異常検出手法(VAE)のための光・反オーバーフィット学習手法(LARA)を提案する。
本研究の目的は,1) 再学習過程を凸問題として定式化し, 過度に収束できること,2) 履歴データを保存せずに活用するルミネートブロックを設計すること,3) 潜在ベクトルと再構成データの微調整を行うと, 線形形成が基底真実と微調整されたブロックとの誤りを最小に調整できることを数学的に証明することである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:33:02 GMT)
OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech
Recognition, Translation, and Language Identification [49.1] Connectionist Temporal Classification (CTC)に基づく新しいエンコーダのみの音声基礎モデルOWSM-CTCを提案する。
音声認識(ASR)、音声翻訳(ST)、言語識別(LID)のための180k時間の公開音声データをトレーニングする。
エンコーダデコーダOWSMと比較して,OWSM-CTCはASRとSTで最大25%の相対的改善を達成し,より堅牢で推論の3倍から4倍高速である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:04:38 GMT)
Emergence of Grid-like Representations by Training Recurrent Networks
with Conformal Normalization [49.0] ニューラルネットワークモデルに基づくグリッドセルの六角形格子パターンの出現について検討した。
本稿では、RNNの入力速度の単純かつ一般的な等角正規化を提案する。
我々は、六角形格子パターンの出現に共形正規化が不可欠であることを示す広範な実験を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:47:50 GMT)
Investigating the Impact of Model Instability on Explanations and
Uncertainty [48.6] テキスト入力における不確かさを推測時に雑音を導入することでシミュレートする。
高い不確実性は必ずしも説明可能性の低さを暗示しない。
このことは、ノイズ増強モデルが不確実性のあるトークンを特定するのに優れていることを示唆している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:41:21 GMT)
Understanding Multimodal Procedural Knowledge by Sequencing Multimodal
Instructional Manuals [48.6] 我々は、順序のないマルチモーダル命令を推論し、シーケンシングする機械学習モデルの能力をベンチマークする。
モデルの性能は人間より著しく劣るだけでなく、マルチモーダル情報の有効利用も不可能である。
本稿では,テキストと画像の逐次アライメント特性を利用した逐次性を考慮した事前学習手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:22:00 GMT)
QuanTest: Entanglement-Guided Testing of Quantum Neural Network Systems [48.5] 量子ニューラルネットワーク(QNN)は、ディープラーニング(DL)原理と量子力学の基本理論を組み合わせて、量子加速による機械学習タスクを実現する。
QNNシステムは従来の量子ソフトウェアと古典的なDLシステムとは大きく異なり、QNNテストにとって重要な課題となっている。
QNNシステムにおける潜在的誤動作を明らかにするために,量子絡み合い誘導型対向テストフレームワークであるQuanTestを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:11:28 GMT)
Unlocking Efficiency in Large Language Model Inference: A Comprehensive
Survey of Speculative Decoding [48.2] 投機的デコーディングは、LLM(Large Language Models)推論のための新しいデコーディングパラダイムとして登場した。
復号処理の各ステップにおいて、この手法はまず、複数の将来のトークンを効率的にドラフトし、それらを並列に検証する。
本稿では,この有望な復号化パラダイムの概観と解析について述べる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:24:57 GMT)
AdvGPS: Adversarial GPS for Multi-Agent Perception Attack [47.6] 本研究は,マルチエージェント認識システムにおいて,特定のGPS信号が容易に誤認できるかどうかを考察する。
我々は,システム内の個々のエージェントに対してステルス性を持つ逆GPS信号を生成可能なtextscAdvGPSを紹介する。
OPV2Vデータセットに対する実験により、これらの攻撃が最先端の手法の性能を著しく損なうことを示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:54:59 GMT)
In-Contextual Gender Bias Suppression for Large Language Models [47.2] 大きな言語モデル (LLM) は、性バイアスの心配レベルをエンコードしていると報告されている。
手動で設計したテンプレートから構築したプリアンブルを提供することにより,LLMのバイアス発生を防止するバイアス抑制を提案する。
その結果,HellaSwag と COPA による下流タスク性能にバイアス抑制が悪影響があることが判明した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:11:17 GMT)
How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey [46.7] 本稿では、放射場における最新の進歩のレンズによるSLAMの進展について概観する。
背景、進化の道、固有の強さと限界に光を当て、ダイナミックな進歩と特定の課題を強調するための基本的な参照として機能する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:59:57 GMT)
SLANG: New Concept Comprehension of Large Language Models [46.7] 大規模言語モデル(LLM)は、しばしばオンラインコミュニティの急速な言語進化の特徴に追従するために苦労する。
我々のベンチマークとアプローチは、文脈ビーコンとして機能する言語シフトの現実世界のインスタンスを理解することである。
我々の因果推論に基づくアプローチは、インターネットスラングやミームの理解において、精度と関連性の観点から、ベースライン手法よりも優れている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:54:50 GMT)
LPNL: Scalable Link Prediction with Large Language Models [46.7] この作業はリンク予測タスクに重点を置いており、大規模言語モデルに基づくフレームワークであるtextbfLPNL$ (Link Prediction via Natural Language)を導入している。
我々は、自然言語でグラフの詳細を記述したリンク予測のための新しいプロンプトを設計する。
本稿では,グラフから重要な情報を抽出するための2段階サンプリングパイプラインと,入力トークンを制御するための分割・分散戦略を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:53:06 GMT)
ClickPrompt: CTR Models are Strong Prompt Generators for Adapting
Language Models to CTR Prediction [46.7] クリックスルー率(CTR)の予測は、様々なインターネットアプリケーションにとってますます不可欠になっている。
従来のCTRモデルは、マルチフィールド分類データをワンホット符号化によりID特徴に変換し、特徴間の協調信号を抽出する。
我々は、CTRモデルを組み込んで対話対応ソフトプロンプトを生成する、新しいモデル非依存フレームワーク(ClickPrompt)を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:52:21 GMT)
Rethinking Adversarial Policies: A Generalized Attack Formulation and
Provable Defense in RL [46.3] 本稿では、訓練された被害者エージェントが他のエージェントを制御する攻撃者によって悪用されるマルチエージェント設定について考察する。
以前のモデルでは、攻撃者が$alpha$に対する部分的な制御しか持たない可能性や、攻撃が容易に検出可能な"異常"な振る舞いを生じさせる可能性を考慮していない。
我々は、敵がエージェントをどの程度制御できるかをモデル化する柔軟性を持つ汎用攻撃フレームワークを導入する。
我々は、時間的分離を伴う敵の訓練を通じて、最も堅牢な被害者政策への収束を証明可能な効率のよい防御を提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:05:36 GMT)
CoLLaVO: Crayon Large Language and Vision mOdel [46.1] 現在のビジョン言語モデルが本当に品質の高いオブジェクトレベルの画像理解能力を持っているかどうかは、まだ解明されていない。
その結果,現在のVLMのイメージ理解能力は,視覚言語(VL)タスクにおけるゼロショット性能と強く相関していることが判明した。
オブジェクトレベルの画像理解を強化するため,Crayon Large Language and Vision mOdel(CoLLaVO)を提案する。
本稿では,視覚的指導指導中に,オブジェクトレベルのイメージ理解を忘れずに維持するためのDual QLoRAの学習戦略を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:44:26 GMT)
A Novel Protocol Using Captive Portals for FIDO2 Network Authentication [45.8] FIDO2CAP: FIDO2 Captive-portal Authentication Protocolを紹介する。
本研究では,FIDO2CAP認証のプロトタイプをモックシナリオで開発する。
この研究は、FIDO2認証に依存する新しい認証パラダイムにネットワーク認証を適用するための最初の体系的なアプローチである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:55:20 GMT)
Unified Hallucination Detection for Multimodal Large Language Models [45.8] マルチモーダル大言語モデル(MLLM)は幻覚の重要な問題に悩まされている。
本稿では,幻覚検出手法の進歩を評価するために,メタ評価ベンチマークであるMHaluBenchを提案する。
我々は,幻覚の発生を確実に検証するために,一連の補助ツールを活用する,新しい統合型マルチモーダル幻覚検出フレームワークUNIHDを公表した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:47:16 GMT)
Handling Ambiguity in Emotion: From Out-of-Domain Detection to
Distribution Estimation [45.5] 感情に対する主観的な認識は、人間の注釈からの矛盾したラベルにつながる。
本稿では,あいまいな感情を扱う3つの方法について検討する。
分類器にラベルを付けない発話を付加クラスとして組み込むことで、他の感情クラスの分類性能が低下することを示す。
また,明快な深層学習を用いた感情分類における不確実性を定量化することにより,不明瞭な感情を伴う発話を領域外サンプルとして検出することを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:53:38 GMT)
Video ReCap: Recursive Captioning of Hour-Long Videos [45.4] Video ReCapは、1秒から2時間までの動画入力を劇的に異なる長さで処理し、複数の階層レベルで動画キャプションを出力することができる。
ビデオの階層構造を,クリップレベルのキャプションからセグメントレベルの記述に至るまで,カリキュラム学習方式を用いて学習する。
我々のモデルは、様々な階層レベルのキャプションを柔軟に生成できると同時に、他の複雑なビデオ理解タスクにも有用である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:58:54 GMT)
TGRL: An Algorithm for Teacher Guided Reinforcement Learning [45.4] 強化と教師の学習目標を最大限にするための政策を訓練することが一般的である。
私たちは、$textitprincipled$アプローチと、$textitdynamically$と$textitautomatically$の近似実装を示します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:12:37 GMT)
Causal influence versus signalling for interacting quantum channels [45.0] アリスとボブの量子エージェント間の因果関係は、必ずしも相互作用によって媒介される。
我々は、Cnotゲートの2つの量を直接計算することで、因果影響とシグナリングのミスマッチを証明した。
チャネルは、小さなシグナル伝達を可能にする因果影響フリップを持つ。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:20:55 GMT)
RealCompo: Dynamic Equilibrium between Realism and Compositionality
Improves Text-to-Image Diffusion Models [44.9] 本稿では,RealCompoという,トレーニング不要で移動しやすいテキスト・ツー・イメージ生成フレームワークを提案する。
テキスト・ツー・イメージモデルとレイアウト・ツー・イメージモデルの利点を活用して、生成した画像のリアリズムと構成性の両方を強化することを目的としている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:56:52 GMT)
Structure Guided Prompt: Instructing Large Language Model in Multi-Step
Reasoning by Exploring Graph Structure of the Text [44.8] 本稿では,大規模言語モデル(LLM)の多段階推論能力向上を目的としたフレームワークであるStructure Guided Promptを紹介する。
実験の結果,このフレームワークはLLMの推論能力を大幅に向上し,より広い範囲の自然言語シナリオを拡張できることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:56:23 GMT)
INTERVENOR: Prompting the Coding Ability of Large Language Models with
the Interactive Chain of Repair [44.7] InterVENORは、人間が観察するインタラクティブなコード修復プロセスをエミュレートするシステムである。
LLMはコード修復プロセスにおいて、コード学習者とコード教師の両方として機能し、異なる役割を担います。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:26:30 GMT)
TRAP: Targeted Random Adversarial Prompt Honeypot for Black-Box
Identification [44.3] BBIV(Black-box Identity Verification)の新たな問題点について述べる。
目標は、サードパーティアプリケーションがチャット機能を通じて特定のLLMを使用するかどうかを判断することである。
本稿では,TRAP (Targeted Random Adversarial Prompt) と呼ばれる,特定のLPMを識別する手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:20:39 GMT)
Learning in Mean Field Games: A Survey [44.2] 平均フィールドゲームズ(MFG)は、プレイヤーの数を無限に増やすために平均フィールド近似に依存する。
MFGにおけるリベリアと社会的最適化のための強化学習法に関する最近の研究
本稿では,MFGを正確に解くための古典的反復法に関する一般的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:56:29 GMT)
GraphTranslator: Aligning Graph Model to Large Language Model for
Open-ended Tasks [44.0] ChatGPTのような大規模言語モデル(LLM)は強力なゼロショットと命令追従機能を備えている。
GraphTranslatorは、GMを活用して、事前に定義されたタスクを効果的に処理し、LLMの拡張インターフェースを活用して、さまざまなオープンなタスクをGMに提供することを目的としている。
ノード表現を言語の一種として扱うことにより、提案したGraphTranslatorは、ノード表現と言語命令に基づいて予測を行うLLMの権限を与える。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:34:15 GMT)
Coupled Confusion Correction: Learning from Crowds with Sparse
Annotations [43.9] 2つのモデルで学習した融合行列は、他のモデルの蒸留データによって補正することができる。
我々は、類似の専門知識を共有するアノテータグループの'をクラスタ化し、それらの混乱行列を一緒に修正できるようにします。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:30:25 GMT)
OpenHEXAI: An Open-Source Framework for Human-Centered Evaluation of Explainable Machine Learning [43.9] 本稿では,XAI 手法を人間中心で評価するオープンソースフレームワーク OpenHEXAI について述べる。
OpenHEAXIは、XAIメソッドの人間中心ベンチマークを促進するための、最初の大規模なインフラ構築である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:17:59 GMT)
Reflect-RL: Two-Player Online RL Fine-Tuning for LMs [43.3] オンライン強化学習(RL)を用いた言語モデル(LM)の微調整システムであるReflect-RLを提案する。
ウォームアップSFTステージのデータを生成するために、負のサンプル生成を用いて反射モデルの誤差補正能力を向上する。
さらに,政策モデルをより効率的に学習できるように,シングルプロンプトアクション列挙とカリキュラム学習を適用した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:04:21 GMT)
LANS: A Layout-Aware Neural Solver for Plane Geometry Problem [43.2] 本稿では,マルチモーダルレイアウト対応言語モジュールとレイアウト対応統合アテンション(LA-FA)の2つの新しいモジュールを統合したレイアウト対応ニューラルソルバを提案する。
Geometry3K と PGPS9K によるデータセット実験では,既存の記号的およびニューラルな解法よりもレイアウト対応モジュールの有効性とLANSソルバの優れた問題解決性能が検証された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:35:46 GMT)
MiLe Loss: a New Loss for Mitigating the Bias of Learning Difficulties
in Generative Language Models [42.8] トークンによる学習難易度を緩和するMiLe Loss関数を提案する。
我々は468M,1.2B,6.7Bパラメータの異なるスケールで生成言語モデルを訓練する。
実験により、提案されたMiLe Lossを組み込んだモデルが下流ベンチマークで一貫したパフォーマンス向上を達成できることが明らかになった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:42:05 GMT)
Beyond Worst-case Attacks: Robust RL with Adaptive Defense via
Non-dominated Policies [42.7] 我々は、よく受け入れられた国家アドリアック・アタック・モデルの下で、政策の堅牢性について研究する。
本稿では,テクティトノン非推奨ポリシーを反復的に発見するための新しい学習時間アルゴリズムを提案する。
Mujoco subroutineの実証検証は、自然および堅牢な性能の観点から、我々のアプローチの優位性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:45:20 GMT)
VADv2: End-to-End Vectorized Autonomous Driving via Probabilistic
Planning [42.7] VADv2は確率計画に基づくエンドツーエンドの駆動モデルである。
ルールベースのラッパーなしでも、完全にエンドツーエンドで安定して実行される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:55:09 GMT)
Fast Rates in Online Convex Optimization by Exploiting the Curvature of
Feasible Sets [42.4] オンライン線形最適化では、損失関数の平均勾配が特定の値よりも大きい場合、実現可能な集合の曲率を利用することができる。
本稿では、損失関数の曲率に適応したアルゴリズムが、実現可能な集合の曲率を活用できることを明らかにする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:59:33 GMT)
Acquiring Weak Annotations for Tumor Localization in Temporal and
Volumetric Data [42.1] リソースが限られているため、大量のラベルのないデータに注釈を付ける際に、最適なタイプのアノテーションを決定するのは難しい。
我々はDrag&Dropと呼ばれる新しいアノテーション戦略を開発し、アノテーションプロセスのドラッグ&ドロップを簡単にする。
実験により,本手法は代替の弱いアノテーションよりも検出性能と局所化性能が優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:43:26 GMT)
Clockwork Diffusion: Efficient Generation With Model-Step Distillation [42.0] クロックワーク拡散(英: Clockwork Diffusion)は、1つ以上のステップで低解像度特徴写像を近似するために、前処理ステップからの計算を定期的に再利用する手法である。
画像生成と画像編集の両方において、Clockworkは計算の複雑さを大幅に減らし、知覚スコアを同等または改善することを示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:50:23 GMT)
Wavelet Scattering Transform for Bioacustics: Application to Watkins
Marine Mammal Sound Database [41.9] Watkins Marine Mammal Sound Database (WMMD)は、機械学習アプリケーションで使用される広範囲なラベル付きデータセットである。
この研究はまず、データセットの最先端ベンチマークの簡単なレビューに焦点を当てる。
標準手法の代わりにウェーブレット散乱変換(WST)の適用を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:36:23 GMT)
BuffGraph: Enhancing Class-Imbalanced Node Classification via Buffer
Nodes [41.8] グラフ構造データにおけるクラス不均衡は、グラフニューラルネットワーク(GNN)にとって重要な課題である。
グラフにバッファノードを挿入するBuffGraphを導入し、多数派クラスの影響を調整し、マイナークラス表現を改善する。
実世界の多様なデータセットを対象とした実験により,BuffGraphは,クラス不均衡ノード分類において,既存のベースライン手法よりも優れていたことが実証された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:11:59 GMT)
What if LLMs Have Different World Views: Simulating Alien Civilizations
with LLM-based Agents [41.7] コスモアジェント(CosmoAgent)は、人類と地球外文明の複雑な相互作用をシミュレートする人工知能の枠組みである。
目標は、善意の文明を脅かす可能性のあるリスクを考慮しつつ、平和的な共存の実現可能性を評価することである。
この興味深い研究分野のさらなる学術的な調査を可能にするために、コードとデータセットをリリースしました。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:49:46 GMT)
Generalization in Kernel Regression Under Realistic Assumptions [41.3] 共通カーネルや任意の正規化、ノイズ、任意の入力次元、サンプル数に対して厳密な境界を提供する。
以上の結果から,高入力次元における過剰適合,固定次元におけるほぼ誘電過剰適合,正規化回帰に対する明示的な収束率が示唆された。
副産物として、カーネルシステムで訓練されたニューラルネットワークの時間依存境界を得る。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:53:38 GMT)
SiLLM: Large Language Models for Simultaneous Machine Translation [41.3] 同時機械翻訳(SiMT)は、原文を読みながら翻訳を生成する。
既存のSiMT手法では、ポリシーを同時に決定し、翻訳を生成するために単一のモデルを採用している。
我々は2つのサブタスクを別々のエージェントに委譲するSiLLMを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:23:34 GMT)
S2R-ViT for Multi-Agent Cooperative Perception: Bridging the Gap from
Simulation to Reality [41.3] 本稿では,S2R-ViT と名付けられた新しい視覚変換器を用いて,マルチエージェント協調認識のための第1から第1の現実への変換学習フレームワークを提案する。
OPV2VとV2V4Realの公共マルチエージェント協調認識データセットに関する実験により,提案したS2R-ViTがシミュレーションから現実へのギャップを効果的に埋めることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:50:55 GMT)
Application of Quantum Extreme Learning Machines for QoS Prediction of
Elevators' Software in an Industrial Context [41.0] 本稿では、エレベータの文脈におけるQELMの産業応用について、QUELLと呼ばれるアプローチを提案する。
我々は、エレベータのスケジューリングソフトウェアに関連する待ち時間予測にQELMを使用し、ソフトウェア回帰テスト、エレベータデジタルツイン、リアルタイムパフォーマンス予測に応用する。
我々は,QUELLが待ち時間を効率的に予測できることを実証した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:31:33 GMT)
Fingerprint Presentation Attack Detector Using Global-Local Model [40.9] 本稿では,制限をある程度克服するグローバルローカルモデルベースPAD(RTK-PAD)手法を提案する。
LivDet 2017で評価した結果,提案したRTK-PADは平均分類誤差(ACE)が2.28%,真検出率(TDR)が91.19%,偽検出率(FDR)が1.0%であった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:47:12 GMT)
Graph Descriptive Order Improves Reasoning with Large Language Model [40.5] グラフ記述順序がLLMのグラフ推論性能に与える影響を明らかにする。
本稿では,LLMの性能をグラフサイズで評価するためのスケールドグラフ推論ベンチマークを提案する。
LLMのグラフ推論性能はグラフサイズの増加とともに単調に低下しないことがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:13:55 GMT)
ChatCell: Facilitating Single-Cell Analysis with Natural Language [40.4] ChatCellは、自然言語による単一セル分析を容易にするツールである。
ChatCellは単細胞生物学の深い専門知識を得た。
プロジェクトのホームページはhttps://zjunlp.io/project/ChatCell.orgで公開されています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:26:39 GMT)
Language Agents with Reinforcement Learning for Strategic Play in the
Werewolf Game [40.4] 我々は、柔軟な言語行動を生成し、強力な意思決定能力を有する戦略的言語エージェントを開発する。
言語行動の本質的バイアスを軽減するため,我々のエージェントはLLMを用いて推論を行い,多様な行動候補を生成する。
実験により,我々のエージェントは本態性バイアスを克服し,Werewolfゲームにおいて既存のLSMベースのエージェントより優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:21:23 GMT)
MVDiffusion++: A Dense High-resolution Multi-view Diffusion Model for
Single or Sparse-view 3D Object Reconstruction [40.4] 本稿では3次元オブジェクト再構成のためのニューラルネットワークMVDiffusion++を提案する。
MVDiffusion++は、カメラポーズなしで1つか数枚の画像が与えられたオブジェクトの高解像度で高解像度なビューを合成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:25:57 GMT)
GOOD: Towards Domain Generalized Orientated Object Detection [39.8] オブジェクト指向物体検出はここ数年で急速に発展してきたが、これらの手法のほとんどは、トレーニングとテスト画像は同じ統計分布下にあると仮定している。
本稿では,任意の対象領域上でのオブジェクト指向物体検出の一般化を探求する領域一般化オブジェクト指向物体検出の課題を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:12:22 GMT)
Slot-VLM: SlowFast Slots for Video-Language Modeling [39.5] ビデオ言語モデル(VLM)は,大規模言語モデル(LLM)の進歩によって実現される
本研究では,意味的に分解されたビデオトークンを生成するための新しいフレームワークであるSlot-VLMを紹介する。
Slot-VLMの有効性を実験的に検証し,ビデオ質問応答における最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:30:09 GMT)
Breaking Data Silos: Cross-Domain Learning for Multi-Agent Perception
from Independent Private Sources [39.2] マルチエージェント認識システムにおける多様なエージェントは、異なる企業のものかもしれない。各企業は、特徴抽出に同じ古典的ニューラルネットワークアーキテクチャベースのエンコーダを使用するかもしれない。
上記の分布ギャップによるデータサイロは、マルチエージェントの知覚において顕著な性能低下をもたらす可能性がある。
我々は、上記分布ギャップをマルチエージェント認識で緩和するために、クロスドメイン学習のためのFeature Distribution-Aware Aggregation (FDA)フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:46:28 GMT)
On the Convergence of Zeroth-Order Federated Tuning for Large Language
Models [38.9] Federated Learning and Large Language Models (LLMs) は、プライバシを保存する自然言語処理の新しい時代を支えている。
メモリ効率のゼロ階最適化は、FedMeZOと呼ばれる相乗効果である。
LLMの文脈でFedMeZOの理論的基盤を最初に検討した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:21:37 GMT)
Data Redaction from Conditional Generative Models [38.5] 我々は、すでに訓練済みの条件生成モデルをポスト編集して、高い確率で、望ましくない内容をもたらすような条件を再現する方法について研究する。
我々は,テキスト・ツー・イメージ・モデルにおけるリアクション・プロンプトと音声のリアクション・プロンプトについて実験を行った。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:35:32 GMT)
Go Static: Contextualized Logging Statement Generation [38.2] SCLoggerは、メソッド間の静的コンテキストを持つコンテキスト化されたロギングステートメント生成アプローチである。
SCLoggerは最先端のアプローチを8.7%のロギング精度、32.1%のレベル精度、19.6%の変数精度、138.4%のテキストBLEU-4スコアで上回っている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:22:59 GMT)
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic
Compositional Reasoning via Counterfactual Examples [37.9] 視覚言語合成推論能力を包括的に改善するフレームワークであるCounterCurateを提案する。
私たちはまず,CLIPやLLaVAといったマルチモーダルモデルの物理基底合成推論における近距離性能に注目した。
次に、グラウンドド画像生成モデルであるGLIGENを用いて単純なデータ拡張を適用し、微調整データを生成する。
我々は、高パフォーマンステキスト生成と画像生成モデル、特にGPT-4VとDALLE-3の能力を利用して、難解なセマンティックカウンターファクトをキュレートする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:59:55 GMT)
Towards an empirical understanding of MoE design choices [37.9] 我々は,Mixture of Experts (MoEs) における共通設計選択が検証性能に与える影響を評価する。
Tokenレベルのルーティングで観測される構文特化とは対照的に、シーケンスレベルのルーティングはトピック固有の弱い専門家特化をもたらす可能性があることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:31:44 GMT)
PWESuite: Phonetic Word Embeddings and Tasks They Facilitate [37.4] 音声による単語の埋め込みを構築するために,音声特徴を用いた3つの手法を開発した。
また、過去、現在、将来のメソッドを適切に評価するためのタスクスイートも提供します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:13:51 GMT)
MedAgents: Large Language Models as Collaborators for Zero-shot Medical
Reasoning [37.3] 大規模言語モデル(LLM)は医療や医療において重大な障壁に直面している。
本稿では,LLMをベースとしたエージェントをロールプレイング環境で活用する医療分野のための,新しい多分野連携(MC)フレームワークを提案する。
私たちの研究は、現実世界のシナリオに適用可能なゼロショット設定に焦点を当てています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:12:14 GMT)
Quantifying Privacy via Information Density [36.9] 本稿では,情報密度を利用したプライバシー指標の関係について検討する。
ローカル情報プライバシ,非対称なローカル情報プライバシ,ポイントワイド最大リーク,ローカル差分プライバシの新たな関係を確立する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:35:14 GMT)
Are Large Language Models (LLMs) Good Social Predictors? [36.7] 本研究では,大規模言語モデル (LLM) が,ショートカットを伴わない一般的な入力機能を与えられた場合,社会的予測において期待通りに機能しないことを示す。
本稿では,実世界の社会学習環境の入力とシミュレートに一般的な特徴を利用する新しい社会予測タスクであるSoc-PRF予測を導入する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:59:22 GMT)
XRL-Bench: A Benchmark for Evaluating and Comparing Explainable
Reinforcement Learning Techniques [36.3] 強化学習(Reinforcement Learning, RL)は、様々な分野において大きな可能性を証明しているが、その意思決定プロセスを理解することは、現在進行中の課題である。
本稿では, 説明可能なAI(XAI)のサブフィールドである説明可能なRL(XRL)について述べる。
我々の焦点は状態記述技術であり、XRL法における重要な部分集合であり、エージェントの行動にいつでも影響を及ぼす要因を明らかにすることである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:20:37 GMT)
SQL-CRAFT: Text-to-SQL through Interactive Refinement and Enhanced
Reasoning [36.2] InteRActive reFinemenTとPythonによるテキストからデータベースへの推論を提案する。
我々は2つのテキストデータセット、SpiderとBirdで実験を行い、単純プロンプト法と比較してパフォーマンスが5.7%向上した。
我々の手法は現在のスパイダーリーダーボードの最先端を超越し、我々のフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:57:55 GMT)
A Unified Taxonomy-Guided Instruction Tuning Framework for Entity Set
Expansion and Taxonomy Expansion [35.7] 3つの代表的タスクを使用して、既存の分類を新しいエンティティで自動的にポップアップさせることができる。
我々はこれらのタスクに必要な共通鍵スキルを分類学的構造の観点から同定する。
本稿では,これら3つの課題を協調的に解決する統合型分類誘導指導フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:19:56 GMT)
Positive Semidefinite Supermartingales and Randomized Matrix
Concentration Inequalities [35.6] 種々の尾条件下でのマルティンゲール依存あるいは交換可能なランダム対称行列に対する新しい濃度不等式を示す。
これらの不等式はしばしば、文学における既存の決定論的結果よりも厳密な方法でランダム化される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:35:24 GMT)
Me LLaMA: Foundation Large Language Models for Medical Applications [35.3] ChatGPTやLLaMAのような大規模言語モデル(LLM)は多くのAIアプリケーションで大きな可能性を示しています。
本研究では,基礎モデル-Me LLaMA 13/70Bとそのチャット強化バージョン-Me LLaMA 13/70B-chatを含む医療用LLMファミリーであるMe LLaMAを紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:37:31 GMT)
CMDAG: A Chinese Metaphor Dataset with Annotated Grounds as CoT for
Boosting Metaphor Generation [35.1] 本稿では,28Kの文からなる中国語メタファーコーパスについて紹介する。
アノテーションの正確性と一貫性を確保するため、包括的なガイドラインのセットを導入します。
伝統を破り、メタファー生成への我々のアプローチは、従来のテナーと車両の組み合わせよりも、その基盤と特徴を強調します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:00:41 GMT)
Defending Jailbreak Prompts via In-Context Adversarial Game [34.8] In-Context Adversarial Game(ICAG)を導入し、細調整を必要とせずにジェイルブレイクを防御する。
静的データセットに依存する従来の方法とは異なり、ICAGは防御エージェントと攻撃エージェントの両方を強化するために反復的なプロセスを採用している。
ICAGにより保護されたLSMがジェイルブレイクの成功率を大幅に低下させるICAGの有効性を実証した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:04:06 GMT)
Practical Kernel Tests of Conditional Independence [34.8] 条件付き独立テストの大きな課題は、競争力を維持しながら正しいテストレベルを取得することである。
本稿では,データ分割,補助データ,および(可能であれば)より単純な関数クラスに基づいて,テストレベルを補正するバイアス制御の3つの手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:07:59 GMT)
Realistic Human Motion Generation with Cross-Diffusion Models [34.7] クロスヒューマンモーション拡散モデル(クロスディフ)
拡散モデルのトレーニングでは,共有変圧器ネットワークを用いて3次元情報と2次元情報を統合する。
CrossDiffは、両方の表現の強みを効果的に組み合わせて、より現実的なモーションシーケンスを生成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:57:51 GMT)
Variational Flow Models: Flowing in Your Style [34.6] 結果のモデルを「変数フローモデル」と定義する。
我々は「線形」過程の後流を直列定速(SC)流れに変換する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:00:32 GMT)
PromptKD: Distilling Student-Friendly Knowledge for Generative Language
Models via Prompt Tuning [34.5] 本稿では,学生に親しみやすい知識を伝達する生成言語モデルを実現するために,PromptKDを提案する。
GPT-2モデルファミリを用いた命令追従データセットの実験により、PromptKDが最先端のパフォーマンスを達成することが示された。
さらに分析したところ、学生に親しみやすい知識の蒸留は、トレーニングプロセス全体を通して効果的に露光バイアスを軽減することが示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:10:08 GMT)
The Hidden Space of Transformer Language Adapters [34.2] トランスフォーマー言語アダプタは、新しいターゲット言語に予測を適用するために、凍結言語モデル上でトレーニングされた小さなモジュールである。
適応された予測は、モデルがトレーニングしたソース言語で主に進化し、ターゲット言語はモデルの最後の層でのみ発音される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:53:26 GMT)
Fair Classifiers Without Fair Training: An Influence-Guided Data
Sampling Approach [34.1] 我々は、機密情報の漏洩を避けるために、公正な訓練アルゴリズムを実装することなく、公正な分類法を学習する。
提案手法の有効性を理論的に検証し,適切な分布シフトを持つデータセット上での従来型トレーニングにより,公平性差の上限とモデル一般化誤差の両方を低減できることを示した。
そこで,本研究では, 学習中のトレーニングデータを段階的に段階的に変化させる, 学習において, 新たなデータの機密属性にアクセスできない, あるいはトレーニングに使用するような, 学習中のトレーニングデータを段階的に変化させる, トラクタブルなソリューションを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:57:38 GMT)
A User-Friendly Framework for Generating Model-Preferred Prompts in
Text-to-Image Synthesis [33.7] よく設計されたプロンプトは、素晴らしい画像を生成する際にテキストと画像のモデルをガイドする可能性を実証している。
初心者にとっては、手動でプロンプトを入力することで、望ましい結果を達成することは困難である。
本稿では,ユーザ入力プロンプトをモデル優先プロンプトに自動的に変換する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:58:49 GMT)
FGAD: Self-boosted Knowledge Distillation for An Effective Federated
Graph Anomaly Detection Framework [33.6] グラフ異常検出(GAD)は、他のグラフと大きく異なる異常グラフを特定することを目的としている。
既存のGADメソッドは通常、集中的なトレーニングで実行される。
本稿では,これらの課題に対処する効果的なフェデレーショングラフ異常検出フレームワーク(FGAD)を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:03:59 GMT)
Differentiable Mapper For Topological Optimization Of Data
Representation [33.3] 我々は,Mapperグラフに対する最初のフィルタ最適化スキームを提供するためにトポロジを組み込んだ最近提案されたフレームワークを構築した。
複数のデータセット上でMapperグラフ表現を最適化することで,提案手法の有用性を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:33:22 GMT)
Reasoning before Comparison: LLM-Enhanced Semantic Similarity Metrics
for Domain Specialized Text Analysis [33.0] 我々は,LLMをゼロショットテキスト識別とラベル生成に活用するフレームワークを開発した。
提案したフレームワークをMIMICデータ上でテストすることにより,GPT-4生成ラベルが意味的類似性評価を大幅に改善できることがわかった。
このフレームワークは放射線学レポートの類似性分析のために実装されているが、その概念は他の専門分野にも拡張することができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:23:42 GMT)
Learning Exceptional Subgroups by End-to-End Maximizing KL-divergence [33.0] Syflowは、例外的なサブポピュレーションを見つけるための、エンドツーエンドの最適化可能なアプローチである。
我々は、Syflowが洞察に富んだ説明を伴う非常に例外的な部分群を確実に見つけることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:29:57 GMT)
Multi-scale transformers with Adaptive Pathways for Time Series
Forecasting [32.9] 適応経路を持つマルチスケールトランスであるPathformerを提案する。
提案したPathformerは,時間分解能と時間差を統合してマルチスケールモデリングを行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:16:24 GMT)
Simpson's Paradox and the Accuracy-Fluency Tradeoff in Translation [32.8] 優れた翻訳は、ソースに忠実であり、対象言語の規範を尊重するべきである。
精度と流布度はコーパスのレベルで正の相関を示すが,個々のソースセグメントのレベルではトレードオフを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:37:16 GMT)
Kernel Single Proxy Control for Deterministic Confounding [32.7] 結果が確定的に生成される場合,一つのプロキシ変数が因果推定に十分であることを示す。
我々は、挑戦的な合成ベンチマークにおいて因果効果を回復できることを実証し、実証的に証明する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:08:31 GMT)
Bridging the Preference Gap between Retrievers and LLMs [32.3] 大規模言語モデル(LLM)は、幅広いタスクにおいて優れた結果を示している。
Retrieval-augmented Generation (RAG) は、関連する情報を見つけることでパフォーマンスを向上させる効果的な方法である。
しかしながら、RAGにおけるレトリバーとLLMの関係はまだ解明されていない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:11:23 GMT)
Writer-Defined AI Personas for On-Demand Feedback Generation [32.2] 著者が定義したAIペルソナを対象とする,オンデマンドのフィードバックを生成するコンセプトを提案する。
この研究は、AIツール設計における社会技術的視点を広げることで、AIでライターをサポートするというビジョンに寄与する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:20:32 GMT)
Statistical curriculum learning: An elimination algorithm achieving an
oracle risk [32.0] パラメトリックな予測設定において,カリキュラム学習(CL)の統計版を考える。
学習者は,受取側の情報レベルに応じて,3種類の学習者について検討する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:44:40 GMT)
Two-stage Synthetic Supervising and Multi-view Consistency
Self-supervising based Animal 3D Reconstruction by Single Image [31.0] 本研究では,2段階指導と自己監督訓練を組み合わせることで,動物による3Dスキャンの課題に対処する。
本研究は,鳥の3次元ディジタル化の定量的・定性的側面において,最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:57:30 GMT)
When and How: Learning Identifiable Latent States for Nonstationary Time
Series Forecasting [31.0] 識別可能なlatEnt stAtes (IDEA) を学習し、分布シフトの発生を検知する。
我々は、十分な観測仮定により、静止状態と非定常状態をさらに遠ざけている。
温和な条件下では、潜伏環境と定常・非定常変数が識別可能であることを示す。
これらの理論に基づいて,自己回帰型隠れマルコフモデルを用いて潜伏環境を推定するIDEAモデルを考案した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:16:12 GMT)
Understanding and Mitigating the Threat of Vec2Text to Dense Retrieval
Systems [30.8] テキスト埋め込みを反転させるテクニックであるVec2Textは、高密度検索システム内で深刻なプライバシー上の懸念を提起している。
本稿では,Vec2Textを用いたテキストの復元性に影響を与えるであろう埋め込みモデルの様々な側面について検討する。
そこで本研究では,テキスト復元可能性のリスクを軽減しつつ,同等のランク付け効率を確保できる埋め込み変換の修正を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:49:30 GMT)
MLIC++: Linear Complexity Multi-Reference Entropy Modeling for Learned
Image Compression [30.7] 我々はMEM++を導入し、潜在表現に固有の様々な相関関係をキャプチャする。
MEM++は最先端のパフォーマンスを実現し、PSNRのVTM-17.0と比較して、KodakデータセットのBDレートを13.39%削減した。
MLIC++はリニアGPUメモリを解像度で表示し、高解像度の画像符号化に非常に適している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:25:43 GMT)
A Touch, Vision, and Language Dataset for Multimodal Alignment [30.6] この研究は、GPT-4V (90%) の人による注釈付き英語ラベル(10%)とテキスト擬似ラベル(90%)による、44K in-the-wild Vision-touchペアの新しいデータセットを導入している。
このデータセットを用いて、オープン語彙分類のための視覚言語対応触覚エンコーダと、訓練されたエンコーダを用いたテキスト生成のためのタッチビジョン言語モデルをトレーニングする。
その結果, 触覚を取り入れることで, TVL モデルでは既存のモデルよりもタッチビジョン言語アライメント(+29%の分類精度)が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:47:56 GMT)
Comparing Inferential Strategies of Humans and Large Language Models in
Deductive Reasoning [30.4] 大規模言語モデル(LLM)では,人間の観察と類似した推論パターンが示される。
我々の研究は、モデルの構造と規模が、その好む推論方法に大きく影響していることを示します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:58:14 GMT)
Benchmarking Retrieval-Augmented Generation for Medicine [30.4] 大規模言語モデル(LLM)は、幅広い医療質問応答(QA)タスクにおいて最先端のパフォーマンスを達成した。
Retrieval-augmented Generation(RAG)は有望なソリューションであり、広く採用されている。
我々は、5つの医療QAデータセットから7,663の質問を含む第一種ベンチマークであるMIRAGE(Medicical Information Retrieval-Augmented Generation Evaluation)を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:44:06 GMT)
TofuEval: Evaluating Hallucinations of LLMs on Topic-Focused Dialogue
Summarization [30.2] 様々な大きさのLPMによって生成される話題中心の対話要約に関する新しい評価ベンチマークを提案する。
我々はこれらの要約の事実整合性に関する二項文レベルの人文アノテーションと、事実整合性のある文章の詳細な説明を提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:58:49 GMT)
Can Large Language Models be Good Emotional Supporter? Mitigating
Preference Bias on Emotional Support Conversation [30.0] この研究はESConv上での大規模言語モデル(LLM)の結果を分析した。
特定の戦略に対する高い嗜好を示すことは、効果的な感情的支援を妨げている。
その結果,(1) 特定の戦略に対する嗜好の低さは情緒的支援の進行を妨げること,(2) 外部援助は嗜好バイアスの軽減に役立つこと,(3) LLMだけでは感情的な支持者にはならないことが強調された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:21:32 GMT)
Exploring the Impact of Table-to-Text Methods on Augmenting LLM-based
Question Answering with Domain Hybrid Data [29.9] テーブル・トゥ・テキスト生成は、ハイブリッドデータの一様テキスト形式のコーパスへの変換を容易にする、有望なソリューションである。
現在、異なるテーブル・ツー・テキスト・メソッドによって生成されたコーパスがQAシステムの性能に与える影響について比較分析は行われていない。
本稿では,LLMベースのQAシステムをドメインハイブリッドデータで拡張するフレームワークに,テーブル・ツー・テキスト生成を革新的に統合する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:00:58 GMT)
Bayesian Reward Models for LLM Alignment [29.6] 大規模言語モデル(LLM)の応答は有用であり、無害である。
報酬の高いポリシー応答を選択する(ベスト・オブ・nサンプリング)
このプロセスは、過度な最適化やハッキングに対して脆弱である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:20:59 GMT)
UniEdit: A Unified Tuning-Free Framework for Video Motion and Appearance
Editing [29.6] ビデオモーションと外観編集の両方をサポートする、チューニング不要のフレームワークであるUniEditを提示する。
映像コンテンツを保存しながら動きの編集を実現するため,補助的な動き参照と再構成のブランチを導入する。
得られた特徴は、時間的および空間的自己注意層を介して、主編集経路に注入される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:52:12 GMT)
Guarantee Regions for Local Explanations [29.4] 局所的な説明が正しいと保証される領域を同定するアンカーベースアルゴリズムを提案する。
提案手法は,局所代理モデルの予測が予測モデルと一致するように保証される,解釈可能な特徴整合ボックスを生成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:04:44 GMT)
NL2Formula: Generating Spreadsheet Formulas from Natural Language
Queries [29.3] 本稿では,NL2Formulaと呼ばれる新しいベンチマークタスクを紹介する。
目的は、自然言語(NL)クエリを入力として、スプレッドシートテーブル上にグラウンドされた実行可能な式を生成することである。
我々は,70,799対のNLクエリと対応するスプレッドシート公式からなる包括的データセットを構築し,21,670のテーブルと37種類の公式関数を網羅した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:58:05 GMT)
Scaling Laws for Associative Memories [29.3] 本研究の目的は,連想記憶機構の研究である。
サンプルサイズとパラメータサイズに関して正確なスケーリング法則を導出し、異なる推定器の統計的効率について議論する。
本稿では,記憶された記憶関係の詳細な可視化を含む理論的結果の検証と解釈を行うための広範な数値実験を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:17:52 GMT)
Embedding Integer Lattices as Ideals into Polynomial Rings [29.2] さらに、イデアル格子の付加構造を研究し、その係数を埋め込むことで、与えられたイデアル格子をイデアルとして無限に多くの異なる環に埋め込むことができる。
Ding と Lindner のアルゴリズムには、ある理想的な格子をそれらのアルゴリズムで特定できない欠陥がある。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:08:05 GMT)
APT-Pipe: A Prompt-Tuning Tool for Social Data Annotation using ChatGPT [29.0] 自動的なプロンプトチューニングパイプラインであるAPT-Pipeを提案する。
12の異なるテキスト分類データセットでテストする。
APT-Pipeによって調整されたプロンプトは、ChatGPTが12つの実験データセットのうち9つでより高い重み付きF1スコアを達成するのに役立ちます。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:54:12 GMT)
Fair Ranking under Disparate Uncertainty [28.8] ランク付けのための新しい公正基準として平等ランク付け(EOR)を提案する。
EORは、異なる不確実性が存在する場合でも、関連する選択肢の中でグループワイズフェア宝くじに対応している。
比例ルーニー規則制約のような肯定的な行動介入とは対照的に、EORは不利な群の指定を必要としない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:52:50 GMT)
Reparo: Loss-Resilient Generative Codec for Video Conferencing [28.5] 本稿では,再生型ディープラーニングモデルに基づく損失耐性ビデオ会議フレームワークReparoを紹介する。
私たちのアプローチは、フレームやフレームの一部が失われたときに、行方不明の情報を生成することです。
公開されているビデオ会議データセットを用いた実験結果は、Reparoが最先端のFECベースのビデオ会議ソリューションより優れていることを示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:17:05 GMT)
Modality-Aware Integration with Large Language Models for
Knowledge-based Visual Question Answering [28.5] KVQA(MAIL)のための大規模言語モデル(LLM)との新たなモダリティ対応統合を提案する。
MAILは画像理解と知識推論の両方にマルチモーダル知識を慎重に活用する。
2つのベンチマークデータセットの実験は、リソースが24倍少ないMAILの優位性を示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:32:24 GMT)
EasyGen: Easing Multimodal Generation with a Bidirectional Conditional
Diffusion Model and LLMs [28.4] EasyGenはマルチモーダル理解と生成を強化するように設計されている。
拡散モデルと大言語モデル(LLM)の機能を利用する。
EasyGenは、データ効率のトレーニング、高品質な画像生成、拡張性に優れています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:54:50 GMT)
A Comprehensive Survey on Deep Learning Techniques in Educational Data
Mining [27.9] 教育データマイニング(EDM: Educational Data Mining)は、計算技術の力を利用して教育データを分析する研究分野として発展してきた。
ディープラーニング技術は、データの分析とモデリングに関わる課題に対処する上で、大きな利点を示してきた。
この調査は、Deep LearningによるEDMの最先端を体系的にレビューすることを目的としている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:38:11 GMT)
A Generative Pre-Training Framework for Spatio-Temporal Graph Transfer
Learning [27.8] 本稿では,STG転送学習のための新しい生成事前学習フレームワーク GPDiff を提案する。
我々はSTG転送学習を生成的ハイパーネットワークの事前学習として再考し、プロンプトで導かれる調整されたモデルパラメータを生成する。
データギャップと都市間の知識の一般化の複雑さから生じる課題に対処することで、我々のフレームワークは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:36:01 GMT)
Chain-of-Specificity: An Iteratively Refining Method for Eliciting
Knowledge from Large Language Models [27.6] 大きな言語モデル(LLM)は優れた生成能力を示し、貴重な情報を生成する。
既存のアプローチでは、入力命令を分解したり書き直したりすることでこの問題に対処しようとした。
本稿では,CoS(Chain-of-Specificity)という,シンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:03:05 GMT)
Reducing Privacy Risks in Online Self-Disclosures with Language Models [27.6] 我々は19の自己開示カテゴリの分類を開発し,4.8Kの注釈付き開示スパンからなる大きなコーパスをキュレートした。
検出のための言語モデルを微調整し、部分的なスパンを65%以上達成しました。
本稿では, 自己開示抽象化の課題について紹介する。これは, 情報開示を実用性を維持しつつ, あまり具体的でない用語に言い換えるものである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:04:04 GMT)
Will More Expressive Graph Neural Networks do Better on Generative
Tasks? [27.4] グラフニューラルネットワーク(GNN)アーキテクチャはしばしば過小評価される。
グラフ生成モデルの基盤となるGNNを、より表現力のあるGNNに置き換える。
高度なGNNは、他の17の非GNNグラフ生成アプローチで最先端の結果を達成することができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:56:41 GMT)
Hybrid Graph: A Unified Graph Representation with Datasets and
Benchmarks for Complex Graphs [27.2] ハイブリッドグラフの概念を導入し、ハイブリッドグラフベンチマーク(HGB)を紹介する。
HGBには、生物学、ソーシャルメディア、eコマースなど、さまざまな領域にわたる23の現実世界のハイブリッドグラフデータセットが含まれている。
HGB上でグラフニューラルネットワーク(GNN)のトレーニングと評価を容易にするための評価フレームワークと支援フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:43:38 GMT)
Enhancing Real-World Complex Network Representations with Hyperedge
Augmentation [27.2] 本稿では,仮想ハイパーエッジを生データに直接生成し,仮想ハイパーエッジ情報から抽出して補助ノード特徴を生成する新しいグラフ拡張手法を提案する。
我々の実証研究は、HyperAugがGNNベースラインや他のグラフ拡張手法を一貫して、著しく上回っていることを示している。
ソーシャルメディア,生物学,eコマースなど,さまざまな領域にまたがる23の新たな実世界のグラフデータセットを提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:18:43 GMT)
HyperMoE: Towards Better Mixture of Experts via Transferring Among
Experts [27.0] 言語モデルのMixture of Experts (MoE)は、各入力トークンを特定の専門家のサブセットに動的にルーティングすることで、モデルのキャパシティを増大させる効果が証明されている。
我々はHypernetworks上に構築された新しいMoEフレームワークであるHyperMoEを提案する。
このフレームワークは、マルチタスク学習における知識伝達の概念とMoEの計算処理を統合する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:09:55 GMT)
Referee-Meta-Learning for Fast Adaptation of Locational Fairness [26.8] 本稿では,深層ニューラルネットワークのメタトレーニングとメタテストを行うために,位置的メタ参照(Meta-Ref)を提案する。
また,Meta-Refは全体の予測品質を同等に保ちながら,位置の公平性を向上できることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:09:04 GMT)
Density and unitarity of the Burau representation from a non-semisimple
TQFT [26.7] フーラ表現の密度を、単位の4番目の根における非半単純TQFTの観点から検討する。
これにより、ブラウ表現上のスキーアのエルミート形式のTQFT構成が、おそらく混合シグネチャを持つ。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:54:56 GMT)
MARS: Meaning-Aware Response Scoring for Uncertainty Estimation in
Generative LLMs [26.6] 不確実性評価のための長さ正規化スコアリング(UE)の代替として,MARS(Meaning-Aware Response Scoring)を提案する。
MARSは、質問の文脈において生成されたシーケンスにおける各トークンのセマンティックコントリビューションを考慮に入れた、新しいスコアリング機能である。
UE手法にMARSを組み込むことにより,UE性能の普遍的かつ大幅な向上が期待できることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:12:09 GMT)
BFT-DSN: A Byzantine Fault Tolerant Decentralized Storage Network [26.6] 分散ストレージネットワーク(DSNs)は、分散アプリケーション(dApps)のための堅牢で分散ストレージサービスを提供する。
既存のDSNは、冗長ストレージの消去符号化を実装する際に、検証性を提供しない。
DSNの最適レジリエンスには、ビザンチンのフォールトトレラントなコンセンサスがない。
本稿では,これらの課題に対処すべく,ビザンチンのフォールトトレラント分散ストレージネットワークであるBFT-DSNを紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:33:45 GMT)
Visual Style Prompting with Swapping Self-Attention [26.5] 本稿では,特定のスタイル要素やニュアンスを維持しつつ,多様な画像を生成する新しい手法を提案する。
denoisingプロセスの間は、クエリを元の機能から保持し、キーと値を、後期の自己アテンション層にある参照機能と交換します。
このアプローチにより、視覚的なスタイルを微調整することなく、生成したイメージが忠実なスタイルを維持することができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:51:17 GMT)
LLMs as Narcissistic Evaluators: When Ego Inflates Evaluation Scores [26.5] 本研究は,LMに基づく評価指標が,要約タスクの文脈において,それぞれの基盤となるLMに対して有利なバイアスを示すかどうかを考察する。
以上の結果から, 金のサマリーを活用せずに, 基準のない手法で評価指標を用いた場合, 特に有意なバイアスがみられた。
これらの結果は、生成的評価モデルによって提供される評価は、本質的なテキスト品質を超える要因に影響される可能性があることを裏付けている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:21:51 GMT)
Improving Robustness for Joint Optimization of Camera Poses and
Decomposed Low-Rank Tensorial Radiance Fields [26.4] 本稿では,分解された低ランクテンソルで表現されるカメラポーズとシーン形状を共同で洗練するアルゴリズムを提案する。
また,スムーズな2次元監視手法,ランダムスケールカーネルパラメータ,エッジ誘導損失マスクを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:59:02 GMT)
Indiscriminate Data Poisoning Attacks on Pre-trained Feature Extractors [26.4] 本稿では,事前訓練した特徴抽出器を応用した下流タスクに対する無差別攻撃の脅威について検討する。
入力空間攻撃とは,(1)既存の攻撃を修正して入力空間に有毒なデータを作る攻撃と,(2)学習した特徴表現をデータセットとして扱うことで有毒な特徴を見つける攻撃である。
実験では、同じデータセット上の微調整やドメイン適応を考慮した転帰学習など、下流の一般的なタスクにおける攻撃について検討した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:12:59 GMT)
How do Hyenas deal with Human Speech? Speech Recognition and Translation
with ConfHyena [26.0] 本稿では,エンコーダの自己注意をハイエナの適応に置き換えたコンバータConfHyenaを提案する。
最高のConfHyenaモデルは、最小品質の劣化を犠牲にして、トレーニング時間を27%削減できることを示します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:19:08 GMT)
Addressing cognitive bias in medical language models [25.6] BiasMedQAは、医療タスクに適用された大規模言語モデル(LLM)の認知バイアスを評価するためのベンチマークである。
USMLE(US Medical Licensing Exam)ステップ1、2、3の1273の質問に対して、6つのモデルを試した。
GPT-4は認知バイアスの影響を受けないLlama 2 70B-chatとPMC Llama 13Bとは対照的に, バイアスに対する耐性が顕著であった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:45:43 GMT)
Cross-Domain Transfer Learning with CoRTe: Consistent and Reliable
Transfer from Black-Box to Lightweight Segmentation Model [25.3] CoRTeは、ブラックボックスソースモデルから信頼できる知識を抽出する擬似ラベリング関数である。
我々は,2つの合成から現実の環境でCoRTeをベンチマークし,ブラックボックスモデルを用いて目標データ分布の軽量モデルにおける知識を伝達する際,顕著な結果を示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:35:14 GMT)
OBMO: One Bounding Box Multiple Objects for Monocular 3D Object
Detection [25.0] 単分子3D物体検出は、単純な構成のため、多くの注目を集めている。
本稿では,単眼画像の異常な性質が奥行きの曖昧さに繋がることを見出した。
We propose a plug-and-play module, underlineOne underlineBounding Box underlineMultiple underlineObjects (OBMO)。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:07:46 GMT)
The Impact of Demonstrations on Multilingual In-Context Learning: A
Multidimensional Analysis [24.9] インコンテキスト学習(In-context learning)は、大規模言語モデルがいくつかのラベル付きデモを使用してタスクを解く一般的な推論戦略である。
実演の有効性は, モデル, タスク, 言語によって大きく異なることを示す。
また, Llama 2-Chat, GPT-3.5, GPT-4は実演の質にはほとんど敏感でないことがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:53:31 GMT)
PRewrite: Prompt Rewriting with Reinforcement Learning [24.8] より効率的なプロンプトに最適化されていないプロンプトを書き換える自動化手法であるPRewriteを提案する。
我々は、PRewriteの有効性を示す様々なベンチマークデータセットの実験を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:26:06 GMT)
MULTI: Multimodal Understanding Leaderboard with Text and Images [24.6] 我々は、複雑なテーブルや画像の理解、長いコンテキストでの推論においてMLLMを評価するための最先端ベンチマークとしてMultiを提案する。
Multiには18,000以上の質問と、公式の導出から画像の詳細分析、モダリティ間の推論まで、さまざまなタスクを持つMLLMの課題が含まれている。
GPT-4VはMultiで63.7%, 他のMLLMでは28.5%から55.3%であった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:55:52 GMT)
KVQ: Kwai Video Quality Assessment for Short-form Videos [24.5] 我々は,600本のユーザアップロードショートビデオと3600本のプロセッシングビデオからなる,最初の大規模KVQ(Kleidoscope short Video database for Quality Assessment)を構築した。
そこで我々は,KSVQEというビデオ品質評価装置を提案する。これにより,品質決定セマンティクスを大規模視覚言語モデルの内容理解とともに識別することができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:56:34 GMT)
How Temporal Unrolling Supports Neural Physics Simulators [24.5] 時間の経過とともにトレーニングトラジェクトリをアンロールすることは、ニューラルネットワーク強化された物理シミュレータの推論精度に影響を与える。
数値解法で支えられた非微分可能だが無回転のトレーニング設定は、完全に微分可能な予測設定よりも4.5倍の改善が得られる。
異なる設定が最適であるのに対して、時間勾配のないアンローリングの精度は比較的近い。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:40:31 GMT)
Add and Thin: Diffusion for Temporal Point Processes [24.5] ADD-THINは、時間点過程(TPP)ネットワークの確率的デノナイジング拡散モデルである。
イベントシーケンス全体で動作し、密度推定において最先端のTPPモデルと一致する。
合成および実世界のデータセットの実験において、我々のモデルは密度推定における最先端のTPPモデルと一致し、予測においてそれらを強く上回る。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:39:16 GMT)
MoELoRA: Contrastive Learning Guided Mixture of Experts on
Parameter-Efficient Fine-Tuning for Large Language Models [24.2] 本稿では,新しいPEFT手法であるMoELoRAを紹介する。
数学推論と常識推論のベンチマークにおいて,11のタスクについて実験を行った。
MoELoRAはLoRAよりも4.2%高い平均性能を達成し、いくつかのベンチマークで175B GPT-3.5と比較して競争性能を示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:30:48 GMT)
Underwater Acoustic Target Recognition based on Smoothness-inducing
Regularization and Spectrogram-based Data Augmentation [24.0] 不十分なデータは、複雑なモデリングをサポートする認識システムの能力を阻害する可能性がある。
限られたデータの場合,モデルの一般化能力を高めるための2つの戦略を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:00:05 GMT)
EX-FEVER: A Dataset for Multi-hop Explainable Fact Verification [23.8] マルチホップで説明可能な事実検証のための先駆的データセットを提案する。
2ホップと3ホップの推論を含む6万件以上の主張により、それぞれがハイパーリンクされたウィキペディア文書から情報を要約して修正することによって作成される。
提案するEX-FEVERデータセットをベースラインとして,文書検索,説明生成,クレーム検証を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:39:44 GMT)
A multimodal dynamical variational autoencoder for audiovisual speech
representation learning [23.7] MDVAE (Multimodal and dynamical VAE) は、教師なし音声・視覚的音声表現学習に適用される。
実験には、音声視覚音声の操作、音声視覚の表情の認知、音声視覚の感情認識などが含まれる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:18:45 GMT)
Towards Robust Graph Incremental Learning on Evolving Graphs [23.6] 本稿では,新たなタスクによって引き起こされるグラフ構造(構造変化)の進化を考慮に入れた誘導的NGIL問題に着目する。
本稿では, 構造シフト・リスク緩和(SSRM)と呼ばれる新しい正則化手法を提案し, 構造シフトが破滅的忘れに及ぼす影響を緩和する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:17:37 GMT)
Consistent123: One Image to Highly Consistent 3D Asset Using Case-Aware
Diffusion Priors [23.5] 本稿では,高整合性3次元アセット再構築のためのケース認識2段階手法であるConsistent123を提案する。
最初の段階では、Consistent123は十分な幾何学的利用のために3D構造上の先行しか利用していない。
第2段階では、2次元テクスチャ先行が導入され、徐々に支配的な指針の役割を担っている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:33:54 GMT)
Natural Counterfactuals With Necessary Backtracking [23.4] 本研究では, 実世界のデータ分布に関して, 自然の反事実の枠組みと, 自然の反事実の生成方法を提案する。
提案手法は, 因果的先行変数の変化が現実シナリオからの逸脱を最小限に抑えるために, 反実的推論を洗練させる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:14:06 GMT)
A Lower Bound and a Near-Optimal Algorithm for Bilevel Empirical Risk
Minimization [23.4] 本稿では、SARAHアルゴリズムの2レベル拡張を提案する。
我々は、このアルゴリズムが$varepsilon$-stationarityを達成するために$mathcalO((n+m)frac12varepsilon-1)$ Oracleコールを必要とすることを示した。
両レベル問題の目的関数のほぼ定常点を得るのに必要なオラクル呼び出し数に対して、より低い境界を与える。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:46:49 GMT)
Equivariant Pretrained Transformer for Unified Geometric Learning on
Multi-Domain 3D Molecules [23.2] Equivariant Pretrained Transformer (EPT)は、小さな分子やタンパク質の幾何学的学習を調和させるために設計された新しい事前学習フレームワークである。
EPTは、各原子のより広い文脈に到達できるブロック強化表現を通じて、多ドメイン分子の幾何学的モデリングを統一する。
EPTのもう1つの重要な革新はブロックレベルの事前訓練であり、小さな分子とタンパク質からなるデータセットで共同で事前訓練することができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:40:00 GMT)
Structural Knowledge Informed Continual Multivariate Time Series
Forecasting [23.2] 本稿では,連続学習パラダイム内で MTS 予測を行うための新しい構造知識情報連続学習(SKI-CL)フレームワークを提案する。
具体的には、グラフ構造学習に基づく予測モデルを構築し、学習した変数依存と構造知識の間に一貫性の規則化スキームを課す。
本研究では,MTSデータの時間的カバレッジを最大化し,各状態の時間的ダイナミクスと依存性構造を効率的に保存する表現マッチング型メモリ再生方式を開発した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:11:20 GMT)
Text-Guided Molecule Generation with Diffusion Language Model [23.2] 拡散言語モデル(TGM-DLM)を用いたテキストガイド型分子生成法を提案する。
TGM-DLMは、2相拡散生成プロセスを用いてSMILES文字列内にトークンの埋め込みをまとめ、反復的に更新する。
我々は、TGM-DLMが、追加のデータリソースを必要とせずに、自動回帰モデルであるMolT5-Baseより優れていることを実証する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:29:02 GMT)
Unfolding Local Growth Rate Estimates for (Almost) Perfect Adversarial
Detection [23.0] 畳み込みニューラルネットワーク(CNN)は、多くの知覚的タスクにおける最先端のソリューションを定義する。
現在のCNNアプローチは、システムを騙すために特別に作られた入力の敵の摂動に対して脆弱なままである。
本稿では,ネットワークの局所固有次元(LID)と敵攻撃の関係について,最近の知見を生かした,シンプルで軽量な検出器を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:36:28 GMT)
Generative AI Security: Challenges and Countermeasures [22.7] 生成的AIのフットプリントは、多くの業界で拡大しており、興奮と監視の増大につながっている。
本稿では、ジェネレーティブAIがもたらすユニークなセキュリティ課題について論じ、これらのリスクを管理するための潜在的研究の方向性を概説する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:51:05 GMT)
Revisiting the Information Capacity of Neural Network Watermarks: Upper
Bound Estimation and Beyond [22.6] 本稿では,情報理論の観点から,ディープニューラルネットワーク透かしの容量について検討する。
本稿では,チャネルキャパシティに類似したディープニューラルネットワーク透かしキャパシティの新たな定義を提案し,その特性を解析し,対向的上書きの下で上界を厳密に推定するアルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:05:28 GMT)
Semi-supervised Dense Keypoints Using Unlabeled Multiview Images [22.4] 本稿では,ラベルのないマルチビュー画像を用いて高密度なキーポイント検出器を学習するための,エンド・ツー・エンドの半教師付きフレームワークを提案する。
鍵となる課題は、複数のビューで密接なキーポイント間の正確な対応を見つけることである。
2つの望ましい性質を符号化する新しい確率的極性制約を導出する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:17:26 GMT)
How Does Selection Leak Privacy: Revisiting Private Selection and
Improved Results for Hyper-parameter Tuning [22.4] ハイパーパラメータチューニングにおける差分プライバシ(DP)の保証問題について検討する。
最近の研究でチューニングプロセスの汎用的なプライベートソリューションが提案されているが、根本的な疑問はまだ残っている。
本論は, 肯定的, 否定的回答の両方に寄与する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:29:49 GMT)
Interpretable Prototype-based Graph Information Bottleneck [22.3] 本稿では,PGIB(Interpretable Prototype-based Graph Information Bottleneck)と呼ばれる,説明可能なグラフニューラルネットワーク(GNN)の新たなフレームワークを提案する。
PGIBは、情報ボトルネックフレームワークにプロトタイプ学習を組み込んで、モデル予測に重要な入力グラフから重要な部分グラフをプロトタイプに提供する。
定性的分析を含む広範囲な実験により、PGIBは予測性能と説明可能性の両方の観点から最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:57:58 GMT)
Heterogeneous Graph Reasoning for Fact Checking over Texts and Tables [22.2] HeterFCは、非構造化情報および構造化情報に対するFact Checkingのための単語レベルの不均一グラフベースのモデルである。
我々は,レーショナルグラフニューラルネットワークによる情報伝達,クレームとエビデンス間の相互作用を行う。
本稿では,エビデンス検索における潜在的な不正確性を考慮したマルチタスク損失関数を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:10:40 GMT)
Thermometer: Towards Universal Calibration for Large Language Models [22.0] 大規模言語モデル(LLM)に適したキャリブレーション手法であるOMETERを提案する。
OMETERは、複数のタスクから与えられたデータに基づいて補助モデルを学び、LLMを校正する。
計算効率が高く、LLMの精度を保ち、新しいタスクに対してより良い校正された応答を生成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:13:48 GMT)
Adaptive Interventions with User-Defined Goals for Health Behavior
Change [21.6] ゴールセット(Goal-setting)は、モバイルヘルス介入のための適応アルゴリズムでは使われていない健康コーチングの重要な要素である。
本稿では、パーソナライズされた報酬関数を最適化することにより、個人化された目標設定に重点を置くトンプソンサンプリングアルゴリズムの修正を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:50:41 GMT)
Acknowledgment of Emotional States: Generating Validating Responses for
Empathetic Dialogue [21.6] 本研究は,共感的対話を有効活用するための最初の枠組みを紹介する。
本手法では,1)検証タイミング検出,2)ユーザの感情状態の同定,3)応答生成の検証を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:20:03 GMT)
CausalLM is not optimal for in-context learning [21.6] 最近の経験的証拠は、プレフィックス言語モデル(LM)を用いる場合、コンテクスト内学習に基づくトランスフォーマーがより優れていることを示している。
この結果は直感的であるが、理論的には理解されていない。
本研究では,あるパラメータ構成の下で,プレフィックスLMと因果LMの収束挙動を理論的に解析する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:48:06 GMT)
SynthScribe: Deep Multimodal Tools for Synthesizer Sound Retrieval and
Exploration [21.5] マルチモーダルディープラーニングを用いて,ユーザの意図をはるかに高いレベルで表現できるフルスタックシステムを実装した。
我々は,1)既存の音を探索すること,2)全く新しい音を作り出すこと,3)所定の音に意味のある修正を加えること,など,様々な課題に対処する機能を実装している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:18:31 GMT)
When Only Time Will Tell: Interpreting How Transformers Process Local
Ambiguities Through the Lens of Restart-Incrementality [21.5] 因果的モデルは1つの解釈を出力して継続せざるを得ないが、修正可能なモデルはあいまいさが解決されるにつれて、以前の出力を編集することができる。
本研究では、再起動・インクリメンタルトランスフォーマーが内部状態を構築・更新する方法について検討し、自動回帰モデルではリビジョンが不可能なプロセスが何を引き起こすかを明らかにする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:09:49 GMT)
SelectLLM: Can LLMs Select Important Instructions to Annotate? [21.4] 我々はSelectLLMを紹介した。これは大規模言語モデルで未記述の命令を選択的にアノテートするためのフレームワークである。
我々の実験では、SelectLLMは命令チューニングベンチマークにおいて、他の最先端の手法と一致し、性能が良くなることを示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:58:23 GMT)
Not All Weights Are Created Equal: Enhancing Energy Efficiency in
On-Device Streaming Speech Recognition [20.9] 本研究では,音声認識モデルにおける重みパラメータが,これらのモデル全体の消費電力に与える影響について検討する。
デバイス上での音声認識モデルの最適化を目的とした設計ガイドラインを開発した。
提案手法は,同様のモデル精度を維持しながら,最大47%のエネルギー消費削減を実現し,実時間係数を向上する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:22:25 GMT)
Vision-Language Interpreter for Robot Task Planning [20.8] 本稿では,2つのトレンド,すなわちマルチモーダル計画問題仕様を橋渡しする新しい課題を提案する。
目的は、プランナーが計画を見つけるために使用するマシン可読ファイルである問題記述(PD)を生成することである。
言語指導とシーン観察からPDを生成することで、言語誘導型フレームワークでシンボリックプランナーを駆動できる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:13:30 GMT)
Procedural Fairness Through Decoupling Objectionable Data Generating
Components [20.8] 我々は、しばしば見過ごされる、手続き上の不公平を装った問題を明らかにし、対処する。
ジョン・ロールズによる純粋手続き的正義の擁護に触発され、我々は自動意思決定を社会機関のマイクロコズムと見なしている。
本稿では,中立なデータ生成コンポーネントを分離するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:40:23 GMT)
Heterogeneous LoRA for Federated Fine-tuning of On-Device Foundation
Models [20.7] HetLoRAはクライアントデバイス間での不均一なランク付けを可能にし、これらの不均一なLoRAモジュールを効率的に集約し、配布する。
HetLoRAは同種LoRAに比べて収束速度と最終性能が向上する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:15:59 GMT)
DiffusionNOCS: Managing Symmetry and Uncertainty in Sim2Real Multi-Modal
Category-level Pose Estimation [20.7] 本研究では,部分物体形状の復元に不可欠な高密度正準写像を推定するために拡散に依存する確率モデルを提案する。
マルチモーダル入力表現を用いた拡散モデルの強度を活用することにより,性能向上のための重要なコンポーネントを導入する。
提案手法は, 生成した合成データのみに基づいて訓練されているにもかかわらず, 最先端の性能と前例のない一般化特性を達成している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:48:33 GMT)
Is RobustBench/AutoAttack a suitable Benchmark for Adversarial
Robustness? [20.7] 我々は, AutoAttack による l-inf, eps = 8/255 によるデータ交換が非現実的に強く, 対向サンプルの完全検出率に近いことを論じる。
また、同様の成功率を達成しながら、他の攻撃方法を検出するのがずっと難しいことも示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:43:48 GMT)
FLAIM: AIM-based Synthetic Data Generation in the Federated Setting [20.7] DistAIMとFLAIMは、プライベートデータの統計特性を反映した合成データを作成するために提案されている。
AIMを経口投与することにより,異質性の存在下での実用性は著しく低下する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:18:47 GMT)
More Discriminative Sentence Embeddings via Semantic Graph Smoothing [20.6] セマンティックグラフの平滑化を活用し,事前学習したモデルから得られた文の埋め込みを強化し,テキストクラスタリングと分類タスクの結果を改善する。
提案手法は、8つのベンチマークで検証され、一貫した改善を示し、教師なしおよび教師なし文書分類タスクにおける文埋め込みの改善における意味グラフの平滑化の可能性を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:34:19 GMT)
Bayes Security: A Not So Average Metric [20.6] セキュリティシステムのデザイナは、ディファレンシャルプライバシ(DP)から派生したような最悪のセキュリティ指標を好む。
本稿では,暗号の優位性に触発されたセキュリティ指標ベイズセキュリティについて検討する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:54:57 GMT)
Layout-to-Image Generation with Localized Descriptions using ControlNet
with Cross-Attention Control [20.5] レイアウト・ツー・イメージタスクにおけるControlNetの限界を示し、ローカライズされた記述を使えるようにする。
制御性を改善しつつ画像品質を維持するために,新しいクロスアテンション操作法を開発した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:15:13 GMT)
Mode Estimation with Partial Feedback [20.4] 弱教師付き・能動的学習の中核的な側面を簡単な問題で定式化する。
エントロピー符号化が部分フィードバックから最適な情報取得を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:24:21 GMT)
LLMind: Orchestrating AI and IoT with LLM for Complex Task Execution [20.2] 複雑なタスクを実行するためのIoTデバイス間で効果的なコラボレーションを可能にするAIエージェントフレームワークであるLLMindを提案する。
脳の機能的特殊化理論に触発されて、我々のフレームワークはLLMをドメイン固有のAIモジュールと統合し、その能力を高める。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:02:10 GMT)
ConVQG: Contrastive Visual Question Generation with Multimodal Guidance [20.0] 本研究では,コントラスト的視覚質問生成(ConVQG)を提案し,画像的,テキスト的,知識に富んだ質問を生成する。
知識認識と標準VQGベンチマークの実験は、ConVQGが最先端の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:20:30 GMT)
SGD with Clipping is Secretly Estimating the Median Gradient [19.7] 劣化ノードを用いた分散学習,トレーニングデータに大きな外れ値が存在すること,プライバシ制約下での学習,あるいはアルゴリズム自体のダイナミクスによるヘビーテールノイズなどについて検討する。
まず,サンプル間の中央勾配を計算し,重み付き状態依存雑音下でも収束できることを示す。
本稿では,反復の中央値勾配を推定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:54:07 GMT)
Everything You Always Wanted to Know About Storage Compressibility of
Pre-Trained ML Models but Were Afraid to Ask [19.6] 既存のデータ削減技術は、事前訓練されたモデル(PTM)データセットファイルのために特別に設計されていない。
本稿では,ストレージ圧縮性に関するPTMデータセットの現在までの総括的解析について述べる。
我々は、他のいくつかのデータ削減手法とともにELFを統合する圧縮フレームワークであるElvesを開発した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:45:37 GMT)
Right on Time: Revising Time Series Models by Constraining their
Explanations [19.6] 時系列データにおいて共同ファウンダーを緩和する問題に対処するため、Right on Time(RioT)を導入します。
RioTは時間領域と周波数領域の両方にわたるモデル説明との相互作用を可能にする。
私たちは、RioTがP2Sの間違った理由や一般的な時系列分類や予測データセットからモデルを効果的に誘導できることを実証的に実証した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:15:13 GMT)
Randomization Can Reduce Both Bias and Variance: A Case Study in Random
Forests [19.6] 我々は、しばしば見落とされがちな現象について研究し、最初はカテブレイマン2001randomで指摘され、ランダムな森林は、バッグングに比べて偏見を減らしているように見える。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:36:26 GMT)
FAST: An Optimization Framework for Fast Additive Segmentation in
Transparent ML [19.6] 高速加法セグメンテーションのための最適化フレームワークであるFASTを提案する。
FASTセグメントは、データセットの各機能に対して、断片的に一定の形状関数を分割して、透過的な加算モデルを生成する。
FASTは加法モデルの計算効率と解釈性を向上することを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:22:04 GMT)
SketchySGD: Reliable Stochastic Optimization via Randomized Curvature
Estimates [19.4] SketchySGDは、サブサンプルヘッセンに対するランダム化低ランク近似を用いることで、機械学習の既存の勾配法を改善する。
固定段数を持つSketchySGDが最適の周りの小さな球に線形に収束することを理論的に示す。
条件のない設定では、最小二乗問題に対してSketchySGDはSGDよりも高速に収束することを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:06:07 GMT)
Going Further: Flatness at the Rescue of Early Stopping for Adversarial
Example Transferability [19.4] 私たちは表現類似性のプロキシとして転送可能性を使用します。
損失値と損失シャープネスの両方を最小化する7つの最小化器を用いて訓練したサロゲートモデルを評価する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:29:34 GMT)
Denoising Task Routing for Diffusion Models [19.4] 拡散モデルは、多段階の復調過程を学習することにより、非常にリアルな画像を生成する。
拡散モデルとマルチタスク学習(MTL)の間に固有のつながりがあるにもかかわらず、ニューラルネットワークの設計には未解明領域が残っている。
本稿では,既存の拡散モデルアーキテクチャのためのシンプルなアドオン戦略であるDenoising Task Routing(DTR)について述べる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:35:19 GMT)
Best Arm Identification for Prompt Learning under a Limited Budget [19.4] この作業は、有限予算制約を即時学習に明示的に組み込む。
BAI-FBの能力を体系的に学習するための一般的な枠組みが提案されている。
GPT 3.5とLlama2を併用した複数の順応タスクの実験は、TRIPLEを以前のベースラインよりも大幅に改善したことを示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:35:36 GMT)
Best of Three Worlds: Adaptive Experimentation for Digital Marketing in
Practice [19.2] 適応的実験設計(Adaptive Experimental Design, AED)手法は、テストのスループットを向上したり、実験コストを削減したりするためのツールとして、業界でますます使われている。
本稿では,非定常な産業環境でのAEDシステム導入の課題について報告する。
そこで我々は,これらの経験に基づく実例推論のためのAEDフレームワークを開発し,商業環境でテストした。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:04:57 GMT)
Detecting AutoAttack Perturbations in the Frequency Domain [18.9] AutoAttackフレームワークによる画像分類ネットワークに対する敵対的な攻撃は、多くの注目を集めている。
本稿では,AutoAttackの空間及び周波数領域特性について検討し,代替防衛法を提案する。
ネットワークを強固にする代わりに、推論中の敵攻撃を検出し、操作された入力を拒否する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:42:11 GMT)
Towards Fair Allocation in Social Commerce Platforms [18.8] ソーシャルコマースプラットフォームは、ソーシャルネットワーク内の他の顧客に商品を宣伝する再販業者を通じて、生産者が製品を販売する新興企業である。
本研究では,ソーシャルコマースプラットフォームにおけるこのようなアロケーションの公平性に注目し,両面の基準条件の下では,不特定項目の公平な分割問題として再販売業者に商品を割り当てることの問題を定式化する。
我々の研究は、理論的・実験的両面から、ナッシュ社会福祉、1つの項目(EF1)までのエンビーフリーネス、最大1つの項目(EQ1)までのエクイティビリティなど、よく研究されたフェアネスのベンチマークを体系的に調査している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:58:00 GMT)
The Dimension of Self-Directed Learning [18.7] 本研究では,2進環境と多進環境の両方において,自己指向型学習の複雑さについて検討する。
我々は,任意の概念クラスに対して,自己指向型学習ミスバウンドを正確に特徴付ける次元である$SDdim$を開発する。
自己指向型学習モデルとオフラインシーケンス学習モデルを中心に,学習可能性のギャップをいくつも示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:59:41 GMT)
TreeEval: Benchmark-Free Evaluation of Large Language Models through
Tree Planning [18.6] TreeEvalは、大規模言語モデル(LLM)のベンチマークフリー評価手法である。
これにより、高性能なLLMが再現不可能な評価セッションをホストし、本質的にデータ漏洩を回避することができる。
パラメータサイズの異なるモデルに対して,7ドルB,13ドルB,33ドルBを含む6ドルモデルを評価し,約45ドルの質問でAlpacaEval2.0との相関係数を最大化する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:38:33 GMT)
Evolutionary Reinforcement Learning: A Systematic Review and Future
Directions [18.6] 進化強化学習(EvoRL)は、複雑な問題解決における強化学習と進化アルゴリズム(EA)の限界に対する解決策である。
EvoRLはEAと強化学習を統合し、知的エージェントを訓練するための有望な道を提供する。
この体系的なレビューは、EvoRLの現状に関する洞察を提供し、人工知能の進化を続ける風景において、その能力を向上させるためのガイドを提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:07:57 GMT)
Federated Multi-Task Learning on Non-IID Data Silos: An Experimental
Study [18.6] FMTL(Federated Multi-Task Learning)アプローチは、Federated Learning(FL)とMulti-Task Learning(MTL)の利点を統合する。
本稿では,FMTLパラダイムの体系的評価のための新しいフレームワークFMTL-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:13:44 GMT)
Humans or LLMs as the Judge? A Study on Judgement Biases [18.3] 本研究では, LLM と人間の判断に対する5種類のバイアスを調査するための新しい枠組みを提案する。
我々は、人間とLLMの裁判官が様々な程度に摂動に弱いこと、そして最も最先端の裁判官でさえかなりの偏見を持っていることを示します。
我々は,我々の研究が,頑健な評価システムの開発の緊急性だけでなく,摂動に対する人間とLLM-as-judgeの脆弱性のコミュニティに通知できることを願っている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:00:15 GMT)
Sample-and-Bound for Non-Convex Optimization [18.3] 我々はモンテカルロのベンチマークに適応して効率を向上する非次元目的最適化のための新しいサンプリング手法を提案する。
提案する高次ベースラインおよび競合ベンチマークアルゴリズムを積極的に評価する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:18:16 GMT)
Investigating the Histogram Loss in Regression [18.1] ヒストグラムロス(Histogram Loss)は、対象変数の条件分布を学習するための回帰手法である。
この設定における学習分布の利点は、より良い表現を学習するのではなく、最適化の改善によるものであることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:29:41 GMT)
EchoPrompt: Instructing the Model to Rephrase Queries for Improved
In-context Learning [18.1] EchoPromptは単純だが効果的なアプローチで、モデルに応答する前にクエリをリフレッシュする。
EchoPromptは、標準とチェーンのプロンプトを備えたゼロショットと少数ショットのインコンテキスト学習の両方に対応している。
実験の結果,EchoPromptは文脈内学習性能を向上させる効果的な手法であることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:07:16 GMT)
RhythmFormer: Extracting rPPG Signals Based on Hierarchical Temporal
Periodic Transformer [17.8] 本稿では,r周期性の準周期特性を明示的に活用することにより,r信号の完全エンドツーエンド変換手法を提案する。
融合ステムはr特徴に対する自己注意を効果的に導くために提案され、既存の手法に容易に移行し、その性能を著しく向上させることができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:56:02 GMT)
GRAPHGINI: Fostering Individual and Group Fairness in Graph Neural
Networks [17.5] 本稿では,GNNフレームワーク内で用いられる公平性の尺度として,Gini係数を組み込む手法を初めて紹介する。
我々の提案であるGRAPHGINIは、単一システムにおける個人とグループフェアネスの2つの異なる目標に対処する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:38:52 GMT)
Inferring interpretable dynamical generators of local quantum
observables from projective measurements through machine learning [17.3] マルチボディシステムにおける局所可観測物の進化を管理する動的生成器をノイズデータから推論するために,機械学習手法を用いる。
本手法は,多体システムから効率的な動的ジェネレータを抽出するだけでなく,量子シミュレーションや計算プラットフォームのデコヒーレンス機構の推測にも有効である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:51:26 GMT)
A Knowledge-enhanced Two-stage Generative Framework for Medical Dialogue
Information Extraction [17.1] 本稿では,医療対話(MD-TSPE)からの用語-統計対抽出に着目した。
我々は、MD-TSPEを2つのフェーズで統一した生成形式で完成させるために、単一のモデルを用いる。
提案した特別なステータスは、より多くの用語を提供し、第2フェーズのトレーニングデータを強化します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:24:16 GMT)
Data Pipeline Training: Integrating AutoML to Optimize the Data Flow of
Machine Learning Models [17.1] Data Pipelineは、マシンラーニングのモデリングやデータ製品の開発といったタスクにおいて、必須の役割を果たす。
本稿では,機械学習の自動化によるデータフローの最適化について検討する。
私たちは、AutoML技術を活用してData Pipelineのインテリジェンスを強化する方法について論じる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:06:42 GMT)
SMORE: Similarity-based Hyperdimensional Domain Adaptation for
Multi-Sensor Time Series Classification [17.1] マルチセンサ時系列分類のための新しい資源効率ドメイン適応(DA)アルゴリズムであるSMOREを提案する。
SMOREは、最先端(SOTA)のDNNベースのDAアルゴリズムよりも平均1.98%高い精度で18.81倍高速トレーニングと4.63倍高速推論を実現している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:48:49 GMT)
Radar-Based Recognition of Static Hand Gestures in American Sign
Language [17.0] 本研究では,先進レーダ線トレーシングシミュレータによる合成データの有効性について検討した。
シミュレータは直感的な材料モデルを採用し、データ多様性を導入するように調整することができる。
NNを合成データで専用にトレーニングしているにもかかわらず、実際の測定データでテストを行うと、有望な性能を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:19:30 GMT)
Near-Optimal Quantum Algorithm for Minimizing the Maximal Loss [16.9] 我々は量子アルゴリズムと下界の体系的な研究を行い、最大で$N$凸、リプシッツ関数を最小化する。
我々は、量子アルゴリズムが$tildeOmega(sqrtNepsilon-2/3)$クエリを1次量子オラクルに取らなければならないことを証明している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:23:36 GMT)
A Comprehensive Review of Machine Learning Advances on Data Change: A
Cross-Field Perspective [16.9] ドメインシフトとコンセプトドリフトの2つの主要な研究分野を同定する。
本稿では、ドメインシフトと概念ドリフトを単一の研究問題、すなわちデータ変更問題に再分類する。
本稿では,2つの技術分野における鍵となるアイデアをリンクする3相問題分類手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:16:01 GMT)
BMLP: Behavior-aware MLP for Heterogeneous Sequential Recommendation [16.7] 行動認識型多層パーセプトロン(BMLP)を用いた新しい多層パーセプトロン(MLP)シーケンシャルレコメンデーション法を提案する。
BMLPは、4つの公開データセットの最先端アルゴリズムよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:57:01 GMT)
Question Calibration and Multi-Hop Modeling for Temporal Question
Answering [16.7] 複雑なマルチホップ質問応答を解決するために,質問・マルチホップモデリング(QC-MHM)手法を提案する。
具体的には、まず、KGにおける質問と時間制約概念を融合させて、質問表現を校正する。
我々は,マルチホップメッセージパッシングを完了させるためにGNN層を構築し,最後に,GNNの埋め込み出力と組み合わせて最終予測を生成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:56:24 GMT)
HyperE2VID: Improving Event-Based Video Reconstruction via Hypernetworks [16.4] イベントベースビデオ再構成のための動的ニューラルネットワークアーキテクチャであるHyperE2VIDを提案する。
提案手法では,ハイパーネットワークを用いてコンテキスト融合モジュールによって誘導される画素ごとの適応フィルタを生成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:38:00 GMT)
ELAD: Explanation-Guided Large Language Models Active Distillation [16.2] LLM(Large Language Models)のデプロイメントと適用は、そのメモリ非効率性、計算要求、API推論の高コストによって妨げられている。
LLMの能力をより小さなモデルに伝達する伝統的な蒸留法は、知識が十分に伝達されているかどうかを判断できないことが多い。
本稿では,アノテーションコストとモデル性能のバランスを最適化するために,アクティブラーニング戦略を用いた説明誘導型ELAD(Explaination-Guided LLMs Active Distillation)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:47:59 GMT)
Federated Learning in the Presence of Adversarial Client Unavailability [16.2] フェデレートラーニング(Federated Learning)は、生データを公開せずにコラボレーティブモデルを可能にする、分散機械学習フレームワークである。
多様なハードウェアソフトウェアに制限があるため、クライアントはサーバからの計算要求に対して常に利用できるとは限らない。
戦場のような厳しい環境では、敵は特定のクライアントを選択的に黙らせることができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:38:31 GMT)
Enhanced Hallucination Detection in Neural Machine Translation through
Simple Detector Aggregation [16.0] 機械翻訳システムの実践的展開に関して、ハロシン翻訳は重大な脅威と安全上の懸念を生じさせる。
これまでの研究では、検出器は様々な種類の幻覚を検出するのに優れた相補的な性能の異なる検出器を示すことが確認されている。
本稿では,個々の検出器の限界に,それらを組み合わせることで対処し,複数の検出器を集約する簡単な方法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:19:47 GMT)
Skill or Luck? Return Decomposition via Advantage Functions [16.0] サンプル効率のよい強化学習には,非政治データからの学習が不可欠である。
その結果, 有利関数は, 反応が帰路に与える因果効果として理解できることが示唆された。
この分解により、直接アドバンテージ推定を外部設定に自然に拡張できます。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:09:00 GMT)
Smaug: Fixing Failure Modes of Preference Optimisation with DPO-Positive [16.0] 理論上、標準的なDPO損失は、モデルが好むサンプルの可能性のテキスト化に繋がることを示す。
DPO-Positive (DPOP) は,この障害モードを回避する新しい損失関数とトレーニング手順である。
意外なことに、DPOPはさまざまなデータセットや下流タスクでDPOを著しく上回ります。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:42:34 GMT)
Toward Fairness via Maximum Mean Discrepancy Regularization on Logits
Space [15.9] 本稿では,出力ロジットの制約を平均値の離散性で課すことにより,公平性を実現する新しいフレームワークであるLogits-MMDを提案する。
実験の結果,提案手法がフェアネス条件を効果的に達成できることを実証した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:56:28 GMT)
InteractOut: Leveraging Interaction Proxies as Input Manipulation
Strategies for Reducing Smartphone Overuse [15.4] モバイル端末上でのユーザジェスチャの自然な実行を弱く抑えるために,インタラクションプロキシを活用する暗黙的な入力操作技術であるInteractOutの設計と実装について述べる。
伝統的なタイムアウト技術と比較すると、InteractOutは参加者が選択したターゲットアプリで使用時間を15.6%削減し、周波数を16.5%短縮した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:04:40 GMT)
ICON: Improving Inter-Report Consistency of Radiology Report Generation
via Lesion-aware Mix-up Augmentation [15.3] 我々は,放射線学レポート生成のレポート間一貫性を改善するICONを提案する。
本手法は,入力画像からまず病変を抽出し,その特徴について検討する。
次に, 意味論的に等価な病変の表現が同一の属性と一致することを保証するために, 病変認識型ミックスアップ拡張手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:13:15 GMT)
Sharing Bell nonlocality of bipartite high-dimensional pure states using
only projective measurements [15.3] ベル非局所性(英: Bell nonlocality)は、デバイスに依存しない量子情報処理において重要な量子資源である。
アンシャープ測定は、複数のシーケンシャルオブザーバ間で絡み合った状態の非局所性を共有するために広く用いられている。
任意の高次元純二分項状態のベル非局所性を共有するには射影測定が十分であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:38:54 GMT)
Sentence Representations via Gaussian Embedding [15.2] GaussCSEは文埋め込みのための対照的な学習フレームワークである。
文間の非対称関係と、包含関係を識別するための類似度尺度を扱うことができる。
実験の結果,ガウスCSEは自然言語推論タスクにおける従来の手法と同じ性能を達成できた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:23:58 GMT)
Revitalizing Multivariate Time Series Forecasting: Learnable
Decomposition with Inter-Series Dependencies and Intra-Series Variations
Modeling [15.0] 動的傾向情報をより合理的に捉えるための学習可能な分解戦略を導入する。
また、シリーズ間の依存関係とシリーズ間のバリエーションを同時にキャプチャする2つのアテンションモジュールを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:45:59 GMT)
MapTrack: Tracking in the Map [15.0] Multi-Object Tracking (MOT) は、各ターゲットに対する安定トラジェクトリと未中断トラジェクトリの維持を目的としている。
ほとんどの最先端のアプローチは、まず各フレーム内のオブジェクトを検出し、次に新しい検出と既存のトラックの間のデータ関連を実装する。
本稿では,確率マップ,予測マップ,共分散適応カルマンフィルタの3つの軽量・プラグアンドプレイアルゴリズムからなる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:35:23 GMT)
FormulaQA: A Question Answering Dataset for Formula-Based Numerical
Reasoning [14.9] 中学校理科試験におけるフォーミュラQAと呼ばれる式に基づく数値推論のための質問応答データセットを提案する。
また,ゼロショットおよび少数ショットチェーン・オブ・ソート法を用いて,サイズが7Bから100Bを超えるLCMの評価を行った。
我々の経験的発見は、我々の複雑な式駆動型フォーミュラQAに適用した場合、既存のモデルの改善の有意な可能性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:39:49 GMT)
Rampo: A CEGAR-based Integration of Binary Code Analysis and System Falsification for Cyber-Kinetic Vulnerability Detection [14.7] Rampoはバイナリコード解析を行い、CPS内のサイバーキネティックな脆弱性を識別する。
当社のツールは,同じ数の脆弱性を計算しながら,3倍から98倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:36:08 GMT)
GraphKD: Exploring Knowledge Distillation Towards Document Object
Detection with Structured Graph Creation [14.5] ドキュメントにおけるオブジェクト検出は、構造的要素の識別プロセスを自動化するための重要なステップである。
文書画像中の文書オブジェクトを正しく識別し,ローカライズするための,グラフベースの知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:25:23 GMT)
CFMatch: Aligning Automated Answer Equivalence Evaluation with Expert
Judgments For Open-Domain Question Answering [14.4] 質問応答(QA)は、答えが正しいかどうかを知る場合にのみ進行する。
回答等価性(AE)を決定するための現在の評価基準は、しばしば人間の判断と一致しない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:37:18 GMT)
Explaining Relationships Among Research Papers [14.2] 本稿では,よりリッチな引用テキストを生成するための機能ベースのLLMプロンプト手法を提案する。
人間の好みと統合的書き方の間には強い相関関係がみられ,高いレベルの抽象的引用を好むことが示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:38:39 GMT)
Mapping topology-disorder phase diagram with a quantum simulator [14.2] 局所的および局所的なバルク状態を持つ様々な自明な位相位相をマップアウトし、同定する。
準周期性障害を伴う単純なSSHモデルにおける驚くほど豊富な位相の存在は、凝縮物質物理学における位相的および局在化現象の研究に新たな光を放つ。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:44:41 GMT)
Probing the Multi-turn Planning Capabilities of LLMs via 20 Question
Games [14.1] 大規模言語モデル(LLM)は、明らかに求められている質問に答えるのに効果的である。
不明瞭なクエリに直面した場合、予測不能に動作し、誤った出力を生成することができる。
このことは、曖昧さを効果的に解決するために明確化を問うことができる知的エージェントの開発の必要性を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:24:43 GMT)
DINOBot: Robot Manipulation via Retrieval and Alignment with Vision
Foundation Models [14.0] DINOBotはロボット操作のための新しい模倣学習フレームワークである。
DINOでトレーニングされたVision Transformersから抽出された機能の、画像レベルとピクセルレベルの機能を活用する。
視覚基盤モデルの画像レベルと画素レベルの両方の特性を利用することで、前例のない学習効率が得られることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:48:11 GMT)
ConSmax: Hardware-Friendly Alternative Softmax with Learnable Parameters [14.0] 自己アテンションメカニズムは、畳み込みと反復するニューラルネットワークとは別に、トランスフォーマーベースの大規模言語モデル(LLM)を設定する。
シリコン上でのリアルタイムLEM推定は、自己注意において広く使用されるSoftmaxのために困難である。
我々は,ソフトウェアハードウェアの共同設計であるConstant Softmax(ConSmax)を,効率的なSoftmax代替案として提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:52:42 GMT)
Realization of controlled Remote implementation of operation [14.0] 制御された遠隔操作実装(CRIO)は、強力なセキュリティを備えたリモート状態の操作を実装することができる。
我々は光子キャビティ原子系の量子ビットを絡み合わせることで実装を伝達する。
我々はアルカリ金属原子間の非断熱的ホロノミック制御ゲートを構築した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:00:29 GMT)
AICAttack: Adversarial Image Captioning Attack with Attention-Based
Optimization [14.0] 我々は,AICAttackと呼ばれる新たな敵攻撃戦略を提示する。
ブラックボックス攻撃シナリオ内で動作するため、我々のアルゴリズムはターゲットモデルのアーキテクチャ、パラメータ、勾配情報へのアクセスを必要としない。
複数の犠牲者モデルを用いたベンチマークデータセットの広範な実験により,AICAttackの有効性を実証する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:13:05 GMT)
Well begun is half done: Importance of Starting Right in Multi-Step Math
Reasoning [13.8] より小さなモデルでは、正しく開始するのに苦労することがあるが、修正された場合には、そうでなければ苦労するであろうタスクを解決できることが示される。
より小さなモデルが初期ガイダンスの恩恵を受けるための2つの方法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:25:30 GMT)
Martian time-series unraveled: A multi-scale nested approach with
factorial variational autoencoders [13.8] 教師なしのソース分離は、ミキシング演算子を通して記録された未知のソース信号のセットを解き放つことを伴う。
この問題は本質的に不適切であり、情報源によって提示される様々な時間尺度によって問題視されている。
ウェーブレット散乱スペクトルを利用した教師なしマルチスケールクラスタリングおよびソース分離フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:18:18 GMT)
Dynamics of quantum coherence in many-body localized systems [13.7] 量子コヒーレンス(quantum coherence)がマルチボディローカライゼーション(MBL)の特異な特徴であるデファジング(dephasing)の同定に有効なプローブであることを示す。
本研究は,MBLシステムにおける多体認知現象の理解に関する知見を提供し,実験におけるMBL位相の同定と特徴付けのための新しい実現可能な手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:54:50 GMT)
Scalable Decentralized Algorithms for Online Personalized Mean
Estimation [13.5] 本研究は,各エージェントが実数値分布からサンプルを収集し,その平均値を推定する,オーバーアーキシング問題の簡易版に焦点を当てた。
1つは信念の伝播からインスピレーションを得ており、もう1つはコンセンサスに基づくアプローチを採用している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:30:46 GMT)
Learning Domain-Invariant Temporal Dynamics for Few-Shot Action
Recognition [13.4] 少ないショットアクション認識は、トレーニング済みのモデルを新しいデータに迅速に適応することを目的としている。
主な課題は、事前訓練されたモデルから学んだ伝達可能な知識の特定と活用である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:09:58 GMT)
Heuristic-Driven Link-of-Analogy Prompting: Enhancing Large Language
Models for Document-Level Event Argument Extraction [13.4] 本稿では,Huristic-Driven Link-of-Alogy (HD-LoA)を導入し,サンプル選択の課題に対処する。
人間の類推的推論にインスパイアされ,LLMが新たな状況に対処できるリンク・オブ・アナロジー・プロンプトを提案する。
実験により,本手法は文書レベルのAEデータセット上で,既存のプロンプト手法や数発の教師付き学習手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:51:40 GMT)
Random Graph Set and Evidence Pattern Reasoning Model [13.2] Evidence Pattern Reasoning Model (EPRM)は、エビデンスに基づく意思決定のための統一されたソリューションを提供する。
競合分解決定と呼ばれるEPRMの実装により、平均速度決定よりも18.17%のケースが最適化された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:52:52 GMT)
SubIQ: Inverse Soft-Q Learning for Offline Imitation with Suboptimal
Demonstrations [13.1] オフライン模倣学習(英: offline mimicion learning, IL)は、環境とのさらなる相互作用を伴わずに、その実演から専門家の行動を模倣することを目的としている。
オフラインILの主な課題の1つは、専門家によるデモンストレーションの限られたサポートを扱うことである。
本稿では,逆ソフトQ学習に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:02:48 GMT)
Structured Chain-of-Thought Prompting for Few-Shot Generation of
Content-Grounded QA Conversations [13.1] 本稿では,構造化チェーン・オブ・シークレット (SCoT) を用いて,コンテントグラウンドによる質問応答会話を生成する手法を提案する。
実験の結果,SCoTによる幻覚の緩和は,文書の接地に対するエージェント忠実度を最大16.8%向上させることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:55:57 GMT)
Ethics in AI through the Practitioner's View: A Grounded Theory
Literature Review [12.9] 近年、AI開発における倫理的問題のプロファイルが高まり、私たちの日常生活におけるAI技術の普及に対する世間の懸念が高まっている。
我々は,AI実践者のAI倫理観を含む,38の初等実証研究の根拠的理論文献レビュー(GTLR)を行った。
我々は,AI倫理の異なる側面を特定し,理解する上で,実践者の視点からAI倫理の分類を提示する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:39:52 GMT)
Globally Interpretable Graph Learning via Distribution Matching [12.9] 我々は、まだ十分に研究されていない重要な質問に答えることを目指している。グラフ学習手順のグローバルな解釈を提供するには、どうすればよいのか?
我々は,この問題を,学習過程を支配する高レベルかつ人間の知能なパターンを蒸留することを目的とした,グローバルな解釈可能なグラフ学習として定式化する。
本稿では,解釈に基づいて学習したモデルの忠実度を評価するために,新しいモデル忠実度尺度を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:21:19 GMT)
Is Epistemic Uncertainty Faithfully Represented by Evidential Deep
Learning Methods? [12.9] 本稿では,顕在的深層学習の新たな理論的考察について述べる。
これは二階損失関数の最適化の難しさを強調している。
第二次損失最小化における識別可能性と収束性の問題に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:59:39 GMT)
Rethinking Information Structures in RLHF: Reward Generalization from a
Graph Theory Perspective [12.9] 本稿では,RLHFをテキスト分布上の自動符号化プロセスとして記述する理論的枠組みを提案する。
我々は、誘導ベイズネットワーク(IBN)であるRLHFの報酬モデリング段階における一般化をモデル化するための新しい手法を提案する。
本分析から得られた知見は,従来のRLHF法に比べ,報奨モデルにおける木に基づく情報構造の優位性である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:37:31 GMT)
Preemptive Motion Planning for Human-to-Robot Indirect Placement
Handovers [12.8] ロボットハンドオーバは,(1)直接ハンド・トゥ・ハンド,(2)間接ハンド・トゥ・プレイスメント・トゥ・ピックアップの2つのアプローチのどちらかを用いることができる。
このような怠慢な時間を最小化するためには、ロボットは、オブジェクトがどこに置かれるかという人間の意図を事前に予測する必要がある。
本稿では,ロボットが人間のエージェントの意図した配置位置へ先進的に移動できるようにする,新しい予測計画パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:33:12 GMT)
Large Language Models Can Learn Temporal Reasoning [12.7] 言語に基づく時間的推論のための新しいフレームワークTG-LLMを提案する。
具体的には、まずLLMにコンテキストを時間グラフ(TG)に変換するように教える。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:14:31 GMT)
The effect of Leaky ReLUs on the training and generalization of
overparameterized networks [12.6] 絶対値活性化関数に対応する$alpha =-1$は、トレーニングエラー境界に対して最適であることを示す。
数値実験は、理論によって導かれる実践的な選択を実証的に支持する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:33:58 GMT)
Towards Cross-Tokenizer Distillation: the Universal Logit Distillation
Loss for LLMs [12.4] 知識蒸留は、資源集約型の大規模モデルからより小さなモデルへの知識を圧縮することで解を提供する。
我々は,この制限に対処するため,最適輸送を前提としたユニバーサルロジット蒸留(ULD)損失を導入する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:46:03 GMT)
Improving Neural Radiance Fields with Depth-aware Optimization for Novel
View Synthesis [12.3] SfMNeRFは,新規な視点の合成と3次元シーン形状の再構成を行う手法である。
SfMNeRFは、エピポーラ性、光度整合性、深さの滑らかさ、および3Dシーン構造を明示的に再構成するためにマッチ位置制約を用いる。
2つの公開データセットの実験では、SfMNeRFが最先端のアプローチを上回ることが示されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:23:46 GMT)
Fairness Risks for Group-conditionally Missing Demographics [12.3] 既存のモデルでは、プライバシー、法的問題、個人の差別に対する恐怖のために実用的でないような、センシティブな特徴の完全な知識が必要である。
提案手法は,多変量オートエンコーダにおいて,グループ条件の欠落した確率を共同学習しながら,感度特性の確率論的衝動による一般フェアネスリスクを増大させる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:49:36 GMT)
Tackling Byzantine Clients in Federated Learning [12.2] 逆境(エム・ビザンティン)のクライアントは、連邦学習(FL)を任意に操作する傾向がある。
学習精度の向上は, サブサンプルクライアント数に対して著しく低下することを示す。
また、注意深いステップ選択の下では、ビザンティンのクライアントによる学習エラーは局所的なステップの数とともに減少する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:40:11 GMT)
LinkSAGE: Optimizing Job Matching Using Graph Neural Networks [12.1] 本稿では、グラフニューラルネットワーク(GNN)を大規模パーソナライズされたジョブマッチングシステムに統合する革新的なフレームワークであるLinkSAGEを紹介する。
当社のアプローチは、数十億のノードとエッジを持つ、業界最大の、そして最も複雑な、新しい求人市場グラフに乗じています。
LinkSAGEの重要なイノベーションは、そのトレーニングと提供の方法論である。これは、不均一で進化するグラフ上の帰納的グラフ学習とエンコーダ-デコーダGNNモデルとを効果的に組み合わせている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:49:25 GMT)
Cited Text Spans for Citation Text Generation [12.0] 自動引用生成システムは,2つの論文間の関係を簡潔かつ正確に記述することを目的としている。
科学的文書の長さのため、既存の抽象的アプローチは引用された論文の要約にのみ条件づけられている。
本稿では,抽象文の代替として,引用テキストスパン(CTS)を条件にすることを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:31:22 GMT)
ChatEL: Entity Linking with Chatbots [11.9] ChatELは、大規模言語モデルに正確な結果を返すための3段階のフレームワークである。
全体として、ChatELフレームワークは10データセットの平均F1パフォーマンスを2%以上改善している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:52:57 GMT)
Robust single divacancy defects near stacking faults in 4H-SiC under
resonant excitation [11.9] 本研究では,高分解能集束ヘリウムイオンビームを用いた4H-SiCにおける単一誘電率のスケーラブル化とターゲット化のためのプロトコルを提案する。
異なる多型多孔体に対する電離速度を測定した結果, 積層断層内の電離層は共鳴励起に対してより堅牢であることが判明した。
これらの知見は、オンチップ量子フォトニクスにおけるSiC誘電率の膨大なポテンシャルと、効率的なスピン-光子界面の構築を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:27:25 GMT)
AgentMD: Empowering Language Agents for Risk Prediction with Large-Scale
Clinical Tool Learning [11.8] 我々は,臨床電卓を様々な臨床状況でキュレートし,応用できる新しい言語エージェントであるAgentMDを紹介した。
AgentMDは、実行可能な機能と構造化ドキュメントを備えた2,164の多様な臨床電卓のコレクションを自動でキュレートした。
手作業による評価では、3つの品質指標に対して80%以上の精度を実現している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:37:19 GMT)
Analysis of Using Sigmoid Loss for Contrastive Learning [11.8] 本研究では,学習した埋め込みの幾何学的構造の観点から,比較学習におけるシグモイド損失を用いた理論的解析を行う。
コントラスト学習におけるシグモイド損失を最小化する最適埋め込みを数学的に解析する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:34:58 GMT)
PIP-Net: Pedestrian Intention Prediction in the Wild [11.8] PIP-Netは、現実の都市シナリオにおいて、AVによる歩行者横断意図を予測するために設計された新しいフレームワークである。
我々は、異なるカメラマウントとセットアップ用に設計された2種類のPIP-Netを提供する。
提案モデルでは、繰り返し時間的注意に基づく解を用いて、最先端の性能を向上する。
最初に、カスタマイズされた歩行者意図予測データセットであるUrban-PIPデータセットを提示する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:28:45 GMT)
PMET: Precise Model Editing in a Transformer [11.7] PMETはTransformer Component (TC) の隠蔽状態を同時に最適化するが、FFNの最適化されたTC隠蔽状態のみを用いてFFN重みを正確に更新する。
実験の結果,PMET は COUNTERFACT と zsRE の両方のデータセット上で最先端の性能を示すことがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:48:37 GMT)
Investigating Cultural Alignment of Large Language Models [11.7] LLM(Large Language Models)は,異なる文化で採用されている多様な知識を真にカプセル化していることを示す。
社会学的調査をシミュレートし、実際の調査参加者のモデル応答を参考として、文化的アライメントの定量化を行う。
本稿では,人類学的推論を活用し,文化的アライメントを高める新しい手法である人類学的プロンプティングを紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:47:28 GMT)
A Disruptive Research Playbook for Studying Disruptive Innovations [11.6] 本稿では、説得力があり社会的に関係のある研究課題を定式化するためのガイドを提供するための研究プレイブックを提案する。
私たちは、AIとAR/VRの2つの破壊的なテクノロジの影響を疑問視するために使用することができることを示しています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:13:36 GMT)
CFEVER: A Chinese Fact Extraction and VERification Dataset [11.4] CFEVERは、中国のウィキペディアのコンテンツに基づいて、30,012件のクレームを手作業で作成する。
ラベル付きデータセットは、Fleissのカッパ値0.7934を5方向のアノテータ間契約で保持する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:08:24 GMT)
A Dual-Prompting for Interpretable Mental Health Language Models [11.3] CLPsych 2024 Shared Taskは、Large Language Models (LLMs)の解釈可能性を高めることを目的としている。
i) 専門的アイデンティティと自殺辞書をメンタルヘルスに特有なLSMと組み合わせた知識認識型エビデンス抽出法と,(ii) LLMに基づく一貫性評価器を用いた要約手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:18:02 GMT)
Enhancing Modern Supervised Word Sense Disambiguation Models by Semantic
Lexical Resources [11.3] 現在、Word Sense Disambiguation (WSD) の監視モデルは、最も人気のあるベンチマークで最先端の結果をもたらす。
我々は、WordNetとWordNet Domainsという2つの人気のあるSLRを利用する「モダンな」教師付きWSDモデルを強化する。
本研究では,単語埋め込みやリカレントニューラルネットワークの混合によって符号化された局所的文脈との相互作用について,異なるタイプの意味的特徴の影響について検討する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:47:51 GMT)
A Simple but Effective Approach to Improve Structured Language Model
Output for Information Extraction [11.2] 大規模言語モデル(LLM)は、命令に従って非構造化自然言語を生成する際、印象的な能力を示した。
本稿では,その構造的テキスト生成能力を高めるために,効率的なG&O手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:42:02 GMT)
What Matters to Enhance Traffic Rule Compliance of Imitation Learning
for Automated Driving [11.1] クロスセマンティクス生成センサ融合技術を用いたペナルティに基づく模倣学習手法であるP-CSGを提案する。
本稿では,赤信号,停止標識,曲率速度ペナルティという3つの罰則を導入し,エージェントが交通規則に敏感になるようにした。
クロスセマンティクスの生成は、異なる入力モダリティからの共有情報を整列するのに役立ちます。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:29:57 GMT)
Incentive Compatibility for AI Alignment in Sociotechnical Systems:
Positions and Prospects [11.1] 既存の方法論は主に技術的側面に焦点を当てており、しばしばAIシステムの複雑な社会技術的性質を無視している。
Incentive Compatibility Sociotechnical Alignment Problem (ICSAP)
ICを実現するための古典的なゲーム問題として,機構設計,契約理論,ベイズ的説得の3つを論じ,ICSAP解決の視点,可能性,課題について論じる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:52:57 GMT)
Testing Calibration in Subquadratic Time [11.0] 特性試験のレンズによるモデル校正のアルゴリズム的側面について検討する。
近似線形計画法に基づくアルゴリズムを設計し、時間内に最適に(定数要素まで)情報キャリブレーションテストを行う。
また, テスト問題に対する耐性変異に対するアルゴリズムを開発し, 代替キャリブレーション距離に対するサンプル下限を与える。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:53:24 GMT)
SzCORE: A Seizure Community Open-source Research Evaluation framework
for the validation of EEG-based automated seizure detection algorithms [10.8] 本稿では,脳波を用いた発作検出アルゴリズムの標準化を目的とした統合フレームワークを提案する。
既存のガイドラインとレコメンデーションに基づいて、このフレームワークはデータセット、ファイルフォーマット、EEGデータ入力コンテンツ、アセプションアノテーション入力と出力、クロスバリデーション戦略、パフォーマンスメトリクスに関連する一連のレコメンデーションと標準を導入している。
また,公開データセットを標準フォーマットに変換する機械学習ベンチマークである,10~20回の発作検出ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:38:04 GMT)
Bridging or Breaking: Impact of Intergroup Interactions on Religious
Polarization [10.6] 重要事象に関するグループ間相互作用がソーシャルネットワークにおける多数派と少数派間の分極に影響を及ぼすかどうかを検討する。
私たちは、2020年中に新型コロナウイルス関連の談話に従事している70万人近いインド人Twitterユーザーの宗教的アイデンティティに関するデータを使用します。
政治的・社会的事象においては、集団間相互作用は分極を減少させるが、この減少は、グループに対してすでに高い適合性を示す極端の個人にとってより弱い。
対照的に、共同イベントの間、グループ間相互作用は群整合性を増加させる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:00:15 GMT)
APT-MMF: An advanced persistent threat actor attribution method based on
multimodal and multilevel feature fusion [10.6] 脅威俳優の帰属は、先進的持続的脅威(APT)と戦うための重要な防衛戦略である
本稿では,マルチモーダル・マルチレベル特徴融合(APT-MMF)に基づくAPTアクタ属性法を提案する。
提案手法は既存の手法より優れているだけでなく,帰属分析タスクに対する優れた解釈可能性も示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:19:55 GMT)
Xling: A Learned Filter Framework for Accelerating High-Dimensional
Approximate Similarity Join [10.5] 類似性結合は、与えられた距離閾値内のすべての閉点を見つける。
Xlingは、既存の回帰モデルで学習ベースのメトリックスペースフィルタを構築するための一般的なフレームワークである。
XJoinは、Xlingをベースにした最初のフィルタベースの類似結合メソッドの1つである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:57:03 GMT)
Lissard: Long and Simple Sequential Reasoning Datasets [10.4] 言語モデルは、数十万のトークンからなる長いシーケンスを扱う必要のあるタスクを解決することができる。
しかしながら、単純なルールを繰り返し使用する必要のあるタスクでは、トレーニング中に見られるものよりもはるかに短いシーケンスでも失敗することが多い。
Lissardは、7つのタスクからなるベンチマークで、その目標は、モデルが処理し、広範囲のシーケンス長を生成する能力を評価することである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:12:13 GMT)
State-independent geometric quantum gates via nonadiabatic and noncyclic
evolution [10.4] 滑らかな進化経路から純非断熱位相および非環状幾何位相を持つ普遍量子ゲートのスキームを提案する。
実装された幾何ゲートは、動的ゲートよりも強い強靭性を示し、循環経路を持つ幾何スキームを示す。
これらの高自明な量子ゲートは、大規模フォールトトレラント量子計算において有望である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:06:27 GMT)
OLViT: Multi-Modal State Tracking via Attention-Based Embeddings for
Video-Grounded Dialog [10.3] OLViTは、マルチモーダルアテンションベースのダイアログ状態トラッカー上で動作するビデオダイアログの新しいモデルである。
オブジェクト状態追跡器(OST)と言語状態追跡器(LST)の出力に基づいてグローバルなダイアログ状態を保持する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:00:59 GMT)
EvoGrad: A Dynamic Take on the Winograd Schema Challenge with Human
Adversaries [10.2] 私たちはEvoGradというオープンソースのプラットフォームを紹介します。これは、人間-イン-ザ-ループアプローチを利用して、変更したWSCインスタンスに合わせた動的データセットを作成します。
タスクインスタンスを182から3,691に拡張し、さまざまな常識推論データセットの新しいベンチマークを設定しました。
最高性能のLCMであるGPT-3.5でも平均誤差深さ7.2で65.0%の精度が得られる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:53:24 GMT)
Achieving Near-Optimal Regret for Bandit Algorithms with Uniform
Last-Iterate Guarantee [10.2] 本稿では,バンドレートアルゴリズムの累積性能と即時性能を両立させる,より強力な性能尺度,ULI(Universal Last-iterate)の保証を提案する。
以上の結果から, ほぼ最適なULI保証は, 上記の性能指標にまたがって, ほぼ最適な累積性能を直接的に示唆することを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:21:13 GMT)
Towards Trustworthy Reranking: A Simple yet Effective Abstention
Mechanism [10.1] 実世界の制約に合わせた軽量な禁制機構を提案する。
ブラックボックスシナリオにおける禁忌戦略を評価するためのプロトコルを導入し,その有効性を実証する。
実験複製と禁忌実装のためのオープンソースコードを提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:25:16 GMT)
Quantum computation of conical intersections on a programmable
superconducting quantum processor [10.1] 変分量子固有解法(VQESAF)に基づく量子古典的状態平均活性空間自己整合場法を実現する。
本稿では,VQE-SA-CFを用いた円錐交叉の定性的再現,量子ハードウェアの安定性の向上,変分回路の深さの低減,パウリ項のグループ化による測定の最小化,適切な誤差軽減など,異なる戦略の組み合わせが,円錐交叉の定性的に正しい再現につながることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:12:40 GMT)
RoCode: A Dataset for Measuring Code Intelligence from Problem
Definitions in Romanian [10.0] ルーマニア語で書かれた2,642問題からなる競合プログラミングデータセットであるRoCodeを紹介する。
我々は、英語以外の言語のためのコードモデルを開発する必要があると主張している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:32:47 GMT)
Order-Optimal Regret in Distributed Kernel Bandits using Uniform
Sampling with Shared Randomness [9.7] 我々はN$エージェントが未知の報酬関数を協調的に最大化する分散カーネルの帯域を考える。
我々は,通信コストが$N$と$T$に比例する,最適な後悔順序を達成するアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:49:10 GMT)
Are Large Language Models Rational Investors? [9.6] 大規模言語モデル(LLM)は、複雑な市場データとトレンドを解釈するための広範な知識基盤を活用するために、金融分析において徐々に採用されている。
しかし、金融分野におけるそれらの応用は、内在的バイアス(すなわちリスク参照バイアス)と表面的な市場の複雑さの把握によって挑戦される。
本研究では, LLMの経済的合理性を評価する新しい枠組みであるFinancial Bias Indicators(FBI)を紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:26:08 GMT)
SWAP: Sparse Entropic Wasserstein Regression for Robust Network Pruning [9.6] 本研究では,ニューラルネットワークプルーニングにおける経験的漁獲情報行列の計算における不正確な勾配問題に対処する。
本稿では,最適輸送問題の幾何学的特性を活かした,エントロピー的ワッサースタイン回帰(EWR)の定式化であるSWAPを紹介する。
提案手法は,ネットワークパラメータの4分の1未満のMobileNetV1において,精度が6%向上し,テスト損失が8%向上した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:29:13 GMT)
Diffusion Posterior Sampling is Computationally Intractable [9.5] 後方サンプリングは、塗装、超解像、MRI再構成などのタスクに有用である。
暗号における最も基本的な仮定では、一方通行関数が存在する。
また,指数時間回帰サンプリングは,指数時間で逆転する一方向関数が存在するという強い仮定の下で,本質的に最適であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:28:13 GMT)
Quantum fluctuations and unusual critical exponents in a quantum Rabi
Triangle [9.4] 量子ラビ三角形の量子揺らぎは、平均場理論を超えた解析的アプローチを用いて研究される。
局所光子数のゆらぎのスケーリング指数と臨界点近傍の位置分散に着目した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:33:37 GMT)
Intuitive or Dependent? Investigating LLMs' Behavior Style to
Conflicting Prompts [9.4] 本研究では,Large Language Models (LLM) の動作を,内部記憶と競合するプロンプトに直面する場合の挙動について検討する。
これにより、LLMの意思決定機構を理解し、検索強化生成(RAG)のような現実世界のアプリケーションにも役立つ。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:59:41 GMT)
Beyond Voice Assistants: Exploring Advantages and Risks of an In-Car
Social Robot in Real Driving Scenarios [9.3] ソーシャルロボットの存在は、実際の運転シナリオにおけるユーザエクスペリエンスにどのように影響しますか?
本研究は,車内VAの視点と運転体験への影響を理解するために,利用者調査から始まった。
次に、RAを用いてユーザエクスペリエンスを評価するために、選択した参加者と非自動運転およびオンロード実験を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:09:15 GMT)
TorchCP: A Library for Conformal Prediction based on PyTorch [9.3] TorchCPは、ディープラーニングモデルに関する共形予測研究のためのPythonツールボックスである。
ポストホックの様々な実装と、分類および回帰タスクの訓練方法を含んでいる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:14:47 GMT)
Phonotactic Complexity across Dialects [9.2] 言語型学における知恵の受け取りは、ある言語の構造がある次元においてより複雑になると、別の次元では単純化されるというものである。
オランダ語方言(366点以上)とミン方言(60点以上)の厳密に制御されたサンプルを用いて,この主張をマイクロレベルで研究する。
LSTMに基づく音声レベル言語モデルから,単語長と音韻的複雑性の計算量とのトレードオフの実証的証拠を求める。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:25:39 GMT)
Personalized Programming Guidance based on Deep Programming Learning Style Capturing [9.2] プログラミング学習スタイルを用いたプログラミング・エクササイズ・レコメンダ(PERS)という新しいモデルを提案する。
PERSは学習者の複雑なプログラミング行動をシミュレートする。
プログラミング学習スタイルをモデル化する合理性を検証するために,実世界の2つのデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:38:38 GMT)
Universal framework for simultaneous tomography of quantum states and
SPAM noise [8.9] 本稿では,量子状態と測定ノイズの同時トモグラフィーを行うアルゴリズムを提案する。
本手法は、ユニタリ演算によって誘導される線形作用素空間の特性の解析に基づく。
一般の場合、このゲージ自由度は避けられないが、状態やノイズ特性に関する事前の知識を用いて、この縮退性を破ることができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:58:10 GMT)
Finding Cross-rule Optimization Bugs in Datalog Engines [8.8] インクリメンタル・ルール・アセスメント(IRE)と呼ばれる自動テスト手法を提案する。
IREはテストのオラクルとテストケース生成の問題に取り組む。
We implement IRE as a tool named Deopt and evaluation it on four Datalog engine。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:54:52 GMT)
A new method of modeling the multi-stage decision-making process of CRT
using machine learning with uncertainty quantification [8.8] 本研究の目的は、心不全患者に対する心臓再同期療法(CRT)反応を予測するための多段階機械学習モデルを構築することである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:41:47 GMT)
CCFC++: Enhancing Federated Clustering through Feature Decorrelation [8.8] フェデレートされたクラスタリングでは、複数のデータ保持クライアントが生データを交換することなくデータを協調的にグループ化する。
CCFCはクライアント間での不均一なデータに悩まされ、貧弱で不正なパフォーマンスをもたらす。
これを解決するために, CCFCにデコリレーション正則化器を導入する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:31:03 GMT)
Collaborative Learning with Different Labeling Functions [8.5] 我々は、$n$のデータ分布ごとに正確な分類器を学習することを目的とした、協調型PAC学習の亜種について研究する。
データ分布がより弱い実現可能性の仮定を満たす場合、サンプル効率の学習は依然として可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:14:09 GMT)
IT Intrusion Detection Using Statistical Learning and Testbed
Measurements [8.5] 我々は、ITインフラにおける自動侵入検知、特に攻撃開始の特定の問題について研究する。
隠れマルコフモデル(HMM)、Long Short-Term Memory(LSTM)、Random Forest(RFC)などの統計的学習手法を適用した。
HMMとLSTMの両方が攻撃開始時間、攻撃タイプ、攻撃行動を予測するのに有効であることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:25:56 GMT)
Citadel: Enclaves with Microarchitectural Isolation and Secure Shared Memory on a Speculative Out-of-Order Processor [8.4] Citadelは、マイクロアーキテクチャーを分離した最初のエンクレーブプラットフォームである。
ハードウェア/ソフトウェアの共同設計を利用して,エンクレーブと信頼できないオペレーティングシステム間の共有メモリを実現する方法を示す。
MNISTでトレーニングされた小さなニューラルネットワークを組み込み、プライベートな推論エンクレーブを実行します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:31:24 GMT)
EvolMPNN: Predicting Mutational Effect on Homologous Proteins by
Evolution Encoding [8.3] 本稿では進化を意識したメッセージパッシングニューラルネットワークであるEvolMPNNを提案し,進化を意識したタンパク質の埋め込みを学習する。
我々のモデルは最先端の手法よりも最大6.4%良い結果を示し、大きな事前学習モデルと比較して36倍の高速化が得られる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:06:21 GMT)
Thresholded Oja does Sparse PCA? [8.3] Ojaのアルゴリズムの出力をしきい値にし、再正規化する単純なアルゴリズムが、ほぼ最適誤差率を得ることを示す。
解析は、非正規化 Oja ベクトルの成分の有界化を中心に行われる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:43:42 GMT)
DrBenchmark: A Large Language Understanding Evaluation Benchmark for
French Biomedical Domain [8.2] 我々はDrBenchmarkと呼ばれるフランスの生物医学言語理解ベンチマークを公開している。
名前付き認識、音声タグ付け、質問回答、意味的テキスト類似性、分類を含む20のタスクを含む。
一般およびバイオメディカル特化データに基づいて8つの最先端の事前訓練マスク付き言語モデル (MLM) を評価し, それらの言語間能力を評価する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:54:02 GMT)
YOLO-Ant: A Lightweight Detector via Depthwise Separable Convolutional
and Large Kernel Design for Antenna Interference Source Detection [8.2] 本稿では,アンテナ干渉源検出のための軽量CNNと変圧器ハイブリッド検出器であるYOLO-Antを紹介する。
本稿では,ネットワークの機能抽出能力を高めるために,奥行き分離可能な畳み込みと大きな畳み込みカーネルに基づくDSLK-Blockモジュールを提案する。
アンテナ検出における複雑な背景やクラス間の違いといった課題に対処するため,DSLKVit-Blockを構築した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:35:23 GMT)
MAPLE: Multilingual Evaluation of Parameter Efficient Finetuning of
Large Language Models [8.0] ファインチューニングは、膨大なリソースと計算を必要とせずに、言語モデルの性能を向上させることができる。
LLama-2-7B モデルと Mistral-7B モデルを2つの合成多言語命令チューニングデータセット上で微調整し、モデル性能に与える影響を判定する。
小型のオープンソースモデルのPEFTは、これらのモデルとより大きなモデルの間のギャップを埋めることがあるが、英語のパフォーマンスは打撃を受ける可能性がある。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:06:39 GMT)
VGMShield: Mitigating Misuse of Video Generative Models [8.0] VGMShieldは、フェイクビデオ生成のライフサイクルを通じて、単純だが先駆的な3つの緩和セットである。
まず、生成されたビデオにユニークさがあるかどうか、そしてそれらを実際のビデオと区別できるかどうかを理解する。
そこで本研究では,偽動画を生成モデルにマッピングするテクトニクス問題について検討する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:39:23 GMT)
Scalable and reliable deep transfer learning for intelligent fault
detection via multi-scale neural processes embedded with knowledge [7.7] 本稿では,グラフ畳み込みネットワーク(GTNP)を用いたニューラルプロセスを用いたディープトランスファー学習法を提案する。
提案手法の検証は3つのIFDタスクにまたがって行われ、他のDTL法と比較してGTNPの検出性能が優れていた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:39:32 GMT)
Semantic Image Synthesis via Class-Adaptive Cross-Attention [7.7] SPADEの代わりにクロスアテンション層を用いて形状型相関を学習し、画像生成プロセスの条件付けを行う。
我々のモデルはSPADEの汎用性を継承し、同時に最先端の世代品質を得るとともに、グローバルおよびローカルスタイルの転送を改善する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:56:01 GMT)
Clifford Group Equivariant Simplicial Message Passing Networks [7.6] Clifford Group Equivariant Simplicial Message Passing Networksを紹介する。
本手法は,クリフォード群同変層と単純メッセージパッシングの表現性を統合する。
本手法は,様々な幾何学的タスクにおいて,同変および単純グラフニューラルネットよりも優れた性能を示すことができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:12:49 GMT)
GRAFFORD: A Benchmark Dataset for Testing the Knowledge of Object
Affordances of Language and Vision Models [7.2] 事前学習言語モデル(LM)と事前学習型ビジョンランゲージモデル(VLM)における対象値の知識について検討する。
トランスフォーマーベースの大規模事前学習言語モデル(PTLM)は、大量の未ラベルテキストから文脈表現を学習する。
本研究は,言語基盤タスクのための新しいデータセットを提供し,LM能力に関する知見を提示する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:23:00 GMT)
Can GNN be Good Adapter for LLMs? [7.2] テキスト分散グラフ(TAG)は、ソーシャルメディアやレコメンデーションシステムなどに広く応用されている。
グラフニューラルネットワーク(GNN)を,大規模言語モデル(LLM)と協調してTAGに対処する上で,効率的なアダプタとして使用するGraphAdapterを提案する。
複数の実世界のTAGにわたる広範な実験を通じて、Llama 2に基づくGraphAdapterは、ノード分類の点で平均5%改善されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:13:13 GMT)
From Cloud to Edge: Rethinking Generative AI for Low-Resource Design
Challenges [7.1] 私たちは、エッジで設計するための生成AIの可能性、課題、そして有望なアプローチを検討します。
目的は、設計問題に対する目覚ましいソリューションを作成する際に、生成AIのパワーを活用することである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:59:27 GMT)
ProxyDet: Synthesizing Proxy Novel Classes via Classwise Mixup for
Open-Vocabulary Object Detection [7.1] Open-vocabulary Object Detection (OVOD)は、トレーニングセットにカテゴリが含まれていない新しいオブジェクトを認識することを目的としている。
本稿では,新しいクラス全体の分布を一般化する手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:57:58 GMT)
Harnessing Large Language Models as Post-hoc Correctors [7.1] 大規模言語モデル(LLM)は、機械学習(ML)モデルのパフォーマンスを最小限のコストで改善することができる。
提案するトレーニングフリーフレームワークLlmCorrにより,LLMがポストホックな修正器として機能し,任意のMLモデルの予測に対する修正を提案する。
実験の結果,LlmCorrは複数のモデルの性能を最大39%向上することがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:50:41 GMT)
Mitigating Gender Bias in Face Recognition Using the von Mises-Fisher
Mixture Model [7.0] 本研究では,ディープ顔認識ネットワークの性別バイアスについて検討する。
このバイアスを測定するために、$mathrmBFAR$と$mathrmBFRR$という2つの新しいメトリクスを導入します。
幾何学的考察により、新しいポストプロセッシング手法により性別バイアスを緩和する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:13:07 GMT)
Quantum tricriticality and universal scaling in a tricritical quantum
Rabi system [7.0] 共振器と3レベル原子とのカップリング比を調整するための非自明なパラメータを含む三臨界量子Rabiモデルについて検討する。
我々は三臨界点における相転移が従来の二次相転移を超えることを発見した。
我々の研究は、高次臨界点の研究のための有名なRabiモデルの一般化における興味深い方向を探究する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:52:45 GMT)
SymBa: Symbolic Backward Chaining for Multi-step Natural Language
Reasoning [7.0] 我々は,現在の後方連鎖実装の限界に対処するため,Symbic Backward Chaining(Symbolic Backward Chaining)を提案する。
SymBaでは、シンボリックトップダウンソルバが証明プロセス全体を制御し、LLMは、そのソルバがデッドエンドに遭遇したときのみ、単一の推論ステップを生成する。
この新しいソルバとLLMの統合により、SymBaは様々なマルチステップ推論ベンチマークにおいて、性能、証明忠実性、効率を大幅に改善する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:27:05 GMT)
exploreCOSMOS: Interactive Exploration of Conditional Statistical Shape
Models in the Web-Browser [6.9] ブラウザ上での統計形状モデルの簡便な探索を可能にする最初のツールを実演する。
この操作は部分的な観察を後部モデルで行う。
コードとアプリケーションはGitHubでリリースしています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:44:55 GMT)
CAMRA: Copilot for AMR Annotation [6.9] 我々は,自然言語テキストから抽象的意味表現(AMR)を構築するために設計された,最先端のWebベースツールであるCAMRAを紹介する。
CAMRAは、AMRのような深い語彙のセマンティクスアノテーションに対する新しいアプローチを提供し、AMRアノテーションはプログラミング言語のコーディングに類似している。
特に、CAMRAはAMRモデルを符号化コパイロットとして組み込んでおり、AMRアノテータの効率と精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:09:33 GMT)
Microstructures and Accuracy of Graph Recall by Large Language Models [6.7] グラフデータは、多くのアプリケーションにとって不可欠である。
以前のテキストで記述されたグラフを正確にリコールし、エンコードできることは、基本的だが重要な能力である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:23:49 GMT)
The Normalized Cross Density Functional: A Framework to Quantify
Statistical Dependence for Random Processes [6.6] 正規化クロス密度(NCD)と呼ばれる正定関数を用いて、2つのランダムプロセス(r.p.)間の統計的依存を測定する新しい手法を提案する。
NCDは2つのr.p.の確率密度関数から直接導出され、データ依存ヒルベルト空間、正規化クロス密度ヒルベルト空間(NCD-HS)を構成する。
我々は,FMCAがNCDの固有値と固有関数を直接実現したことを数学的に証明する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:47:44 GMT)
Two Quantum Paradigms, but Still No Signal [6.5] ほとんどの量子状態は、測定すると白色のノイズを発生させる。
ほとんどの非ポインター状態は、デコヒーレンスプロセス中は白色ノイズを発生させる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:36:59 GMT)
Television Discourse Decoded: Comprehensive Multimodal Analytics at
Scale [6.3] 我々は、インドでのプライムタイムニュース討論番組に焦点をあてて、テレビ放送された討論を分析するという複雑な課題に取り組む。
従来はテキストのみに頼っていたが、これらの議論のマルチメディアの本質をとらえるには不十分であった。
大規模マルチメディア分析に先進的なコンピュータビジョンと音声テキスト技術を用いる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:20:31 GMT)
Advancing GenAI Assisted Programming--A Comparative Study on Prompt
Efficiency and Code Quality Between GPT-4 and GLM-4 [6.0] 本稿では,GenAIをプログラミングツールとして活用するためのベストプラクティスについて検討する。
異なるレベルの複雑さで戦略のプロンプトを評価することで、最も単純で簡単なプロンプト戦略が最高のコード生成結果をもたらすことを確認できます。
その結果,GPT-4はGLM-4をわずかに上回っているが,平均的なユーザでは差は最小限であることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:47:39 GMT)
Learning to Check: Unleashing Potentials for Self-Correction in Large
Language Models [5.9] 大規模言語モデル(LLM)は推論能力において大きな進歩を遂げており、自己補正を通じて推論を洗練しようとしている。
近年の研究では、自己補正は外部の正確な知識がなければ限定的あるいは反生産的であることが示唆されている。
我々は,LLMの自己検査能力を向上させるために,訓練データを慎重に設計し,自己補正の精度を向上させることを目的とする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:23:23 GMT)
Choice Models and Permutation Invariance: Demand Estimation in
Differentiated Products Markets [5.8] ニューラルネットのような非パラメトリック推定器は、選択関数を簡単に近似できることを示す。
提案する関数は、完全にデータ駆動方式で、消費者の振る舞いを柔軟に捉えることができる。
我々の経験的分析により、推定器は現実的かつ同等の自己およびクロスプライス弾性を生成することが確認された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:17:45 GMT)
Improving the TENOR of Labeling: Re-evaluating Topic Models for Content
Analysis [5.8] 対話型タスクベース設定において,ニューラル,教師付き,古典的なトピックモデルの最初の評価を行う。
現在の自動メトリクスは、トピックモデリング機能の完全な図を提供していないことを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:10:58 GMT)
BronchoTrack: Airway Lumen Tracking for Branch-Level Bronchoscopic
Localization [5.7] BronchoTrackは、正確なブランチレベルのローカライゼーションのための革新的なリアルタイムフレームワークである。
気管支鏡下位置計測にマルチオブジェクトトラッキングを導入したのは,今回が初めてである。
本研究は,患者全体の一般化を確実にするため,訓練不要な気道関連手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:11:27 GMT)
Radio-astronomical Image Reconstruction with Conditional Denoising
Diffusion Model [5.7] 汚れた電波画像からスカイモデルを再構成することは、高赤方偏移で銀河の進化を研究するために不可欠である。
CLEANやPyBDSFのような現在の技術は、しばしばかすかなソースを検出するのに失敗する。
本研究では、ニューラルネットワークを用いて、汚れた画像から直接スカイモデルを再構築することを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:00:23 GMT)
On Sensitivity of Learning with Limited Labelled Data to the Effects of
Randomness: Impact of Interactions and Systematic Choices [5.6] そこで本研究では,相互作用を考慮したランダム性要因の効果について検討する。
本手法は,個々のランダム性係数の真の効果を測定するために,他の要因の影響を緩和し,複数の実行において性能がどのように変化するかを観察する。
1) 既存の作業におけるランダム性要因間の相互作用を無視することは, ランダム性要因の効果の誤った帰属に起因する不整合な発見であり, たとえサンプル順序に対しても, コンテキスト内学習の一貫性を否定するなど, ランダム性要因の効果の誤った帰属によるものである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:38:19 GMT)
Fine-Tuning, Prompting, In-Context Learning and Instruction-Tuning: How
Many Labelled Samples Do We Need? [5.6] 本研究は, 優れた性能を実現するために, 特化モデルに必要なラベル付きサンプル数について検討する。
専門化されたモデルでは、一般的なモデルと同等かそれ以上のサンプル(100~1000ドル)しか必要としないことが多い。
同時に、必要なラベル付きデータの量は、タスクの複雑さと結果のばらつきに強く依存する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:38:24 GMT)
Promoting Fair Vaccination Strategies Through Influence Maximization: A Case Study on COVID-19 Spread [5.5] 新型コロナウイルスのパンデミックの余波は、人種的少数派や経済的に奪われた地域社会にとってより深刻な結果をもたらした。
本稿では,人口動態の公平性を取り入れた予防接種戦略を新たに提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:54:18 GMT)
Integrating Active Learning in Causal Inference with Interference: A
Novel Approach in Online Experiments [5.5] ACI(Causal Inference with Interference)におけるアクティブラーニング手法について紹介する。
ACIはガウス過程を用いて、隣人の治療課題の連続的な測定の関数として直接的および余分な処理効果を柔軟にモデル化する。
データ要求の低減による精度の高い効果推定の実現可能性を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:13:59 GMT)
Prompt Stealing Attacks Against Large Language Models [5.4] 大規模言語モデル(LLM)に対する新たな攻撃を提案する。
提案したプロンプト盗難攻撃は、生成された回答に基づいて、これらのよく設計されたプロンプトを盗むことを目的としている。
実験の結果,提案した攻撃の顕著な性能を示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:25:26 GMT)
Mathematical Framework for Online Social Media Auditing [5.4] ソーシャルメディアプラットフォーム(SMP)は、報酬の最大化を目的として、ユーザのフィードを構成するコンテンツを選択する手段として、アルゴリズムフィルタリング(AF)を利用する。
ユーザのフィードに表示されるコンテンツを選択的に選択することは、ユーザの意思決定にある程度、マイナーまたはメジャーの影響を与える可能性がある。
我々は,この枠組みを数学的に定式化し,データ駆動型統計監査手法の構築に利用した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:37:21 GMT)
Assessing the Impact of Prompting Methods on ChatGPT's Mathematical
Capabilities [5.4] 本研究は,大規模言語モデル(LLM)の数学的推論能力を高める手法の有効性を批判的に評価する。
この分析はOpenAIのLLMであるChatGPT-3.5上で,MATH, GSM8K, MMLUデータセットからの広範な問題集合に対して行われる。
予想とは対照的に,本研究では,ChatGPT-3.5のベースライン性能に対して検討した手法が常に改善されていないことを実証分析により明らかにした。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:44:20 GMT)
Tree-Planted Transformers: Large Language Models with Implicit Syntactic
Supervision [5.2] そこで本研究では,トランスフォーマーLMの注意重みに木を暗黙的に「植木」することで,自然言語の構文構造を反映する,木植木という新しい手法を提案する。
具体的には、木移植で訓練されたトランスフォーマーLMはTree-Planted Transformer (TPT)と呼ばれ、木移植によって小さな木バンクの構文を学習し、構文的な足場による連続的な学習によって大きなテキストコーパスにスケールする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:37:24 GMT)
Integrating Deep Learning and Synthetic Biology: A Co-Design Approach
for Enhancing Gene Expression via N-terminal Coding Sequences [5.2] N末端コーディング配列(NCS)は翻訳開始率に影響を与えることで遺伝子発現に影響を与える。
合理的設計や統計誘導アプローチなどのNAS最適化の現在の手法は、労働集約的な収量改善に過ぎない。
本稿では,NCS最適化のための深層学習・合成生物学を共同設計した数発の訓練ワークフローを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:41:46 GMT)
Is the System Message Really Important to Jailbreaks in Large Language
Models? [5.0] ジェイルブレイク(jailbreak)とは、Large Language Models(LLM)が悪質な質問を誘発するときに発生する予期せぬ、潜在的に有害な応答のことである。
本稿では,脱獄プロンプトに耐性のあるシステムメッセージを生成するためのシステムメッセージアルゴリズム(SMEA)を提案する。
我々の研究はLLMのセキュリティを強化し、脱獄の限界を高め、この研究分野の進歩を育みます。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:39:40 GMT)
An Adaptive Tangent Feature Perspective of Neural Networks [4.9] 特徴量の線形変換を考察し、パラメータと双線型制約による変換を共同で最適化する。
ニューラルネットワークの構造に特化して、機能がどのように変化し、カーネル関数が変化するかについての洞察を得る。
実ニューラルネットワークのカーネルアライメントにおける理論的観察を検証する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:37:39 GMT)
HunFlair2 in a cross-corpus evaluation of biomedical named entity
recognition and normalization tools [4.9] バイオメディカルテキストマイニングツールを用いた企業名抽出のためのクロスコーパスベンチマークの結果について報告する。
以上の結果から,BTM ツールの利用者は,オリジナルの出版物と比較して性能低下を期待すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:10:27 GMT)
Scaling Laws Behind Code Understanding Model [4.8] コード理解タスクのスケーリング法則について,学習データ,モデルサイズ,計算資源を用いて検討する。
我々は、より多くのコンピューティングリソースを使用して、1.5Bパラメータを持つCoLSBERTという名前の大規模コード理解モデルを大規模データセットでトレーニングする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:31:42 GMT)
Gl\'orIA - A Generative and Open Large Language Model for Portuguese [4.8] ポルトガルの堅牢なデコーダLLMであるGl'orIAを紹介する。
Gl'orIAを事前訓練するために,様々なソースから35億個のトークンからなる包括的PT-PTテキストコーパスを組み立てた。
Gl'orIAは、言語モデリングにおいて、既存のオープンPTデコーダモデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:36:40 GMT)
CST: Calibration Side-Tuning for Parameter and Memory Efficient Transfer
Learning [4.8] 本稿では,サイドチューニングと呼ばれる軽量な微調整戦略を提案する。
アダプタチューニングとサイドチューニングの側面を取り入れて、ResNetで使用するトランスフォーマーで成功したテクニックを適応させる。
本稿は、複数の微調整戦略の分析を行い、ResNet内でそれらのアプリケーションを実装した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:01:31 GMT)
Characterizing losses in InAs two-dimensional electron gas-based gatemon
qubits [4.6] InAs2次元電子ガスを用いたゲートモン量子ビットとコプラナー導波路共振器の連続波・時間領域特性について述べる。
クビットは読み出し空洞と真空ラビ分裂し、クビット基底と第1励起状態の間のコヒーレントラビ振動を駆動することを示す。
本稿では,コプラナー導波路共振器の品質要因の系統的研究を通じて,これらの材料に存在する損失機構について詳述する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:49:09 GMT)
Double machine learning for causal hybrid modeling -- applications in
the Earth sciences [4.4] 本稿では、因果推論フレームワークを用いてハイブリッドモデルを推定するための新しいアプローチを提案する。
DMLに基づくハイブリッドモデリングは、エンドツーエンドのディープニューラルネットワーク(DNN)アプローチよりも因果パラメータの推定に優れていることを実証する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:19:56 GMT)
Unsupervised Optimisation of GNNs for Node Clustering [4.4] 我々は,GNN によるコミュニティにノードをクラスタ化できることを示す。
また,教師なしメートル法の性能が地中信頼度を予測できるかどうかについても検討した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:46:04 GMT)
Measuring Impacts of Poisoning on Model Parameters and Neuron
Activations: A Case Study of Poisoning CodeBERT [4.3] 大規模言語モデル(LLM)はソフトウェア開発プラクティスに革命をもたらしたが、その安全性に関する懸念が生まれている。
バックドア攻撃には、トレーニングデータにトリガーを挿入することが含まれており、攻撃者はモデルの振る舞いを悪意を持って操作することができる。
本稿では,コードモデルにおける潜在的なバックドア信号を検出するためのモデルパラメータの解析に焦点をあてる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:38:43 GMT)
Partial Search in a Frozen Network is Enough to Find a Strong Lottery
Ticket [4.3] ランダムに密集したネットワークは、ウェイトラーニングなしで高い精度を達成する--強い宝くじ(SLT)
本稿では,所望のSLT間隔に依存しない任意の比でSLT探索空間を縮小する手法を提案する。
実験により,提案手法は高密度あるいはランダムに切断されたソースネットワークから得られたSLTよりも精度が高く,モデルサイズのトレードオフも良好であることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:14:45 GMT)
The non-overlapping statistical approximation to overlapping group lasso [4.2] 重なり合う群ラスソペナルティの近似として分離可能なペナルティを提案する。
この分離性により, ペナルティに基づく正規化の計算は, 重なり合う群ラッソの計算よりもかなり高速である。
提案した分離性ペナルティに基づく推定値は,重なり合うグループラッソペナルティに基づく推定値と統計的に等価であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:58:24 GMT)
Static vs. Dynamic Databases for Indoor Localization based on Wi-Fi
Fingerprinting: A Discussion from a Data Perspective [4.1] データ中心の観点から, 屋内におけるWi-Fi指紋の時間変化が位置推定に与える影響を考察する。
我々は RSSI 測定に基づくXJTLU の IR ビルの3階を 44 日間にわたってカバーする動的データベースを構築した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:49:43 GMT)
Self-supervised Representation Learning on Electronic Health Records
with Graph Kernel Infomax [4.1] EHRのグラフィカル表現に対する自己教師付きグラフカーネル学習手法であるGraph Kernel Infomaxを提案する。
最先端とは違って、グラフ構造を変更して拡張ビューを構築することはできません。
我々のアプローチは、最先端を超える臨床下流課題にパフォーマンスをもたらす。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:36:08 GMT)
3D Kinematics Estimation from Video with a Biomechanical Model and
Synthetic Training Data [4.1] 2つの入力ビューから3Dキネマティクスを直接出力するバイオメカニクス対応ネットワークを提案する。
実験により, 提案手法は, 合成データにのみ訓練されたものであり, 従来の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:33:40 GMT)
Camera Calibration through Geometric Constraints from Rotation and
Projection Matrices [4.1] 本稿では,カメラの内在的・外在的パラメータを測定するための制約に基づく新たな損失を提案する。
我々の手法は、ニューラルネットワークの学習能力を利用して、望ましいパラメータを推定するハイブリッドアプローチである。
提案手法は,最新のSOTA(State-of-the-art)ベンチマークと比較して,全パラメータにまたがる改善を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:25:58 GMT)
Evaluating the Usability of Differential Privacy Tools with Data Practitioners [4.1] 差別化プライバシ(DP)は、プライバシを保存するデータ分析において、ゴールドスタンダードとなっているが、現実のデータセットやシステムに実装することは依然として困難である。
近年開発されているDPツールは,DPの実装を容易にすることを目的としているが,これらのDPツールのユーザビリティについて限定的な研究がなされている。
我々は,PythonベースのオープンソースDPツールであるDiffPrivLib,Tumult Analytics,PipelineDP,OpenDPのユーザビリティを評価した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:33:35 GMT)
Improving Knowledge Extraction from LLMs for Task Learning through Agent
Analysis [4.1] 大規模言語モデル(LLM)は、タスク学習の知識源として大きな可能性を秘めている。
プロンプト工学は、LLMから知識を引き出すのに有効であることが示されているが、同時に、新しいタスクを具現化したエージェント学習のための、適切な、状況に根ざした知識を得るには不十分である。
本稿では,認知エージェントアプローチであるSTARSについて述べる。これは,迅速なエンジニアリングを拡張し,その制限を緩和し,エージェントがネイティブ言語能力,具体化,環境,ユーザ嗜好に適合する新たなタスク知識を取得できるようにする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:34:14 GMT)
Evolving Genetic Programming Tree Models for Predicting the Mechanical Properties of Green Fibers for Better Biocomposite Materials [4.0] 本研究は, 天然繊維の力学特性を予測するために, 革新的な遺伝的プログラミングツリーモデルを提案する。
セルロース,ヘミセルロース,リグニンおよび水分含量および各種天然繊維の微動角を予測モデルとして検討した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:55:57 GMT)
CLIPping the Deception: Adapting Vision-Language Models for Universal
Deepfake Detection [3.8] 広汎な深度検出のための最近の適応手法と組み合わせた事前学習型視覚言語モデル(VLM)の有効性について検討する。
ディープフェイク検出にCLIPを適用するために、単一のデータセット(ProGAN)のみを使用します。
シンプルで軽量なPrompt Tuningベースの適応戦略は、以前のSOTAアプローチよりも5.01% mAPと6.61%の精度で優れている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:26:42 GMT)
Visual Reasoning in Object-Centric Deep Neural Networks: A Comparative
Cognition Approach [3.8] 視覚的推論の達成は、人工知能の長期的な目標である。
近年,視覚的推論を実現する手段として,オブジェクト指向表現学習が提唱されている。
オブジェクト中心モデルでは、多くのアウト・オブ・ディストリビューションの場合であっても、シーン内の異なるオブジェクトを分離できることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:48:14 GMT)
A new method for optical steel rope non-destructive damage detection [3.8] 本稿では,高高度(空中ロープウェイ)における鋼ロープの非破壊損傷検出のための新しいアルゴリズムを提案する。
RGBD-UNetという名前のセグメンテーションモデルは、複雑な背景から鋼のロープを正確に抽出するように設計されている。
VovNetV3.5と呼ばれる検出モデルは、通常の鋼ロープと異常鋼ロープを区別するために開発された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:17:24 GMT)
Touring sampling with pushforward maps [3.6] 本稿では、生成モデル設定における多くのサンプリングアプローチをレビューし、整理するために理論的スタンスをとる。
拡散モデルを用いたサンプリングにおける現在の課題のいくつかを克服するのに役立つかもしれない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:17:40 GMT)
Multi-Level ML Based Burst-Aware Autoscaling for SLO Assurance and Cost
Efficiency [3.6] 本稿では、複雑なワークロード下でコンテナ化されたクラウドサービスやアプリケーションのためのBurst-Aware AutoscalingフレームワークであるBAScalerを紹介します。
BAScalerには、予測可能な周期的なワークロードスパイクと実際のバーストを区別する、予測に基づく新しいバースト検出機構が組み込まれている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:28:25 GMT)
The practice of qualitative parameterisation in the development of
Bayesian networks [3.5] 構造開発は通常、質的な問題とパラメータ化の量的問題に重点を置いている。
最初の構造が開発された後に発生する一般的なステップは、粗いパラメータ化を実行することである。
これはより厳密なパラメータ化の前に行われ、構造が目的に適合することを保証します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:30:36 GMT)
Align Your Intents: Offline Imitation Learning via Optimal Transport [3.5] 模擬エージェントは,専門家の観察からのみ,望ましい行動を学ぶことができることを示す。
AILOT法では,データに空間距離を交互に組み込んだインテントの形で,状態の特殊表現を行う。
AILOTはD4RLベンチマークで最先端のオフライン模倣学習アルゴリズムより優れており、スパース・リワードタスクにおける他のオフラインRLアルゴリズムの性能を向上させる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:24:00 GMT)
Hybrid Training of Denoising Networks to Improve the Texture Acutance of Digital Cameras [3.4] 本稿では,自然画像と合成画像の両方に依存した画像復元ニューラルネットワークの混合訓練手法を提案する。
提案手法の有効性は,RGB画像のノイズ化とRAW画像のフル開発の両方において実証され,実際の撮像装置のテクスチャ精度の体系的改善への道のりが開かれた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:47:06 GMT)
Reply to "Comment on `Generalized James' effective Hamiltonian method'" [3.4] 我々の論文で与えられた3階ハミルトニアンは、ここで述べた条件の下でちょうどエルミート的である。
発散した実効ハミルトニアン(英語版)は、コメント(英語版)に示されるような時間依存的な状況下では確かに非エルミート的であるが、それは正確には非単体 truncated Dyson 級数に対応する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:59:57 GMT)
Reward Bound for Behavioral Guarantee of Model-based Planning Agents [3.3] 我々は、モデルベースの計画エージェントが特定の将来のステップで目標状態に達することを保証することに重点を置いている。
例えば、その報酬がその上限以下であれば、そのような保証を得ることは不可能である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:17:07 GMT)
News Recommendation with Attention Mechanism [3.3] 我々は,ニュースレコメンデーションのための注目に基づくアプローチであるNRAM(News Recommendation with Attention Mechanism)の実装について述べる。
評価の結果,NRAMは,デジタルニュースプラットフォーム上でのニュースコンテンツのパーソナライズ方法を大幅に改善する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:46:17 GMT)
An Efficient Quantum Circuit for Block Encoding a Pairing Hamiltonian [3.2] 我々は、原子核物理学で研究したペア化ハミルトンのブロック符号化のための効率的な量子回路を提案する。
本論文では、ペアハミルトニアンに対するブロック符号化回路に焦点をあてるが、この手法はより一般的な第二量子化ハミルトニアンを符号化するために拡張することができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:57:13 GMT)
Privacy Issues in Large Language Models: A Survey [3.2] これは、大規模言語モデル(LLM)におけるプライバシー問題に焦点を当てたAI研究の活発な領域に関する最初の調査である。
私たちは、プライバシのリスクを強調し、トレーニングや推論プロセスにプライバシを構築しようと試み、著作権の問題を軽減するために、レッドチームでモデルを設計する作業に重点を置いています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:26:08 GMT)
Toward TransfORmers: Revolutionizing the Solution of Mixed Integer
Programs with Transformers [3.1] 混合整数プログラムの課題に対処するために,トランスフォーマーデコーダモデルを用いた革新的なディープラーニングフレームワークを導入する。
提案手法は,MIP問題のバイナリ変数の予測にトランスフォーマーを用いた最初の手法である。
本稿では,変圧器ニューラルネットワークを用いてCLSPソリューションを学習する効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:13:38 GMT)
From Prejudice to Parity: A New Approach to Debiasing Large Language
Model Word Embeddings [3.1] DeepSoftDebiasは、ニューラルネットワークを使って'ソフトデバイアス'を実行するアルゴリズム
我々は、このアルゴリズムを様々なSOTAデータセット、精度メトリクス、難解なNLPタスクで徹底的に評価する。
DeepSoftDebiasは、性別、人種、宗教の偏見を減らし、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:57:34 GMT)
Softmax Probabilities (Mostly) Predict Large Language Model Correctness
on Multiple-Choice Q&A [3.1] 元のQ&Aタスクでよく機能するモデルの中で、我々の仮説の強い証拠を見出す。
本稿では,初期モデル応答のMSPに基づいて,選択的に停止することで,性能の向上を図ったマルチ選択型Q&Aタスクを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:24:47 GMT)
Learning Hierarchical Relational Representations through Relational
Convolutions [3.0] 我々は「関係畳み込みネットワーク」と呼ぶアーキテクチャフレームワークを提案する。
グラフレットフィルタが入力のパッチにマッチする関係畳み込み演算を形式化する。
また、下流タスクに関連するオブジェクトのグルーピングを明示的に学習するためのメカニズムも提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:21:18 GMT)
Patient-Centric Knowledge Graphs: A Survey of Current Methods,
Challenges, and Applications [2.9] 患者中心知識グラフ(PCKG)は、個別の患者ケアに焦点を当てた医療における重要なシフトである。
PCKGは様々な種類の健康データを統合し、患者の健康を包括的に理解する医療専門家に提供します。
本稿はPCKGに関する方法論,課題,機会について概説する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:07:55 GMT)
Model Editing at Scale leads to Gradual and Catastrophic Forgetting [2.9] 本稿では,ROMEとMEMITの2つの手法に焦点をあてて,現在のモデル編集手法を大規模に評価する。
モデルが複数の事実と逐次的に編集されるにつれて、以前編集された事実と下流タスクの実行能力を常に忘れていることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:24:03 GMT)
Master Equation Emulation and Coherence Preservation with Classical
Control of a Superconducting Qubit [2.9] 古典雑音を用いた特定の形式のマスター方程式をエミュレートする方法を示す。
また、非マルコフ雑音は量子系のコヒーレンスを拡張するための資源として利用できることを示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:47:27 GMT)
Demystifying Quantum Power Flow: Unveiling the Limits of Practical
Quantum Advantage [2.8] 量子コンピュータは、古典的コンピュータにとって難解な問題を解くことを約束する。
量子パワーフローアルゴリズムによるスピードアップは、最先端のアルゴリズムによって解決された古典的なPFと比較して指数関数であると主張される。
ゲートベース量子コンピュータの古典的手法と比較して,QPFの解法における実用的量子優位性(PQA)の可能性を検討する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:05:30 GMT)
Collaborative Control for Geometry-Conditioned PBR Image Generation [2.8] 本稿では,RGB 生成における測光的不正確さと,RGB から PBR を抽出する際の固有曖昧さを回避し,PBR 画像の直接分布をモデル化する。
既存のクロスモーダル微調整のパラダイムは、データの欠如と出力モードの高次元性の両方のため、PBR生成には適していない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:33:16 GMT)
Reliable LLM-based User Simulator for Task-Oriented Dialogue Systems [2.8] 本稿では,ドメイン対応ユーザシミュレータDAUSを紹介する。
タスク指向対話の実例について,DAUSを微調整する。
2つの関連するベンチマークの結果は、ユーザ目標達成の点で大幅に改善されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:57:47 GMT)
Magic Mirror on the Wall, How to Benchmark Quantum Error Correction
Codes, Overall ? [2.8] 量子誤り訂正符号(Quantum Error Correction Codes, QECCs)は、量子コンピューティングの進歩の基礎である。
本稿では,QECCをベンチマークするための新しい,包括的方法論を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:58:09 GMT)
Embed-Search-Align: DNA Sequence Alignment using Transformer Models [2.7] 3ギガ塩基(単一ハプロイド)のヒト基準ゲノム上にDNA読取を調整するための組込み検索タスクを提案する。
DNA-ESAは、250長の読みを3ギガ塩基(単倍体)のヒト基準ゲノムに合わせると97%正確である
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:59:16 GMT)
Observation of time crystal comb in a driven-dissipative system [2.6] 本稿では, 連続駆動型, 強く相互作用するRydberg熱ガス中の時間結晶コムの観察について報告する。
時間結晶と離散時間結晶と高次高調波発振相は、Rydberg励起Rabi周波数を調整して同じ系で観測される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:09:29 GMT)
Stabilizing the Maximal Entropy Moment Method for Rarefied Gas Dynamics
at Single-Precision [2.6] 最大エントロピーモーメント法(MEM)は、密度と希薄ガスの両方に有効な拡張された流体力学方程式を生成する。
MEMは、特に高速衝撃波のような流れに対して、数値精度が不十分なときに数値オーバーフローと分解を引き起こす。
本稿では,MEMの安定化を目標とし,一精度で最新のGPU上での非常に強い通常の衝撃波のシミュレーションを可能にする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:23:50 GMT)
Generating Context-Aware Contrastive Explanations in Rule-based Systems [2.5] 本稿では,ルールベースのシステムにおいて,ユーザが説明を求める状況において,潜在的なコントラストイベントを予測するアプローチを提案する。
提案手法では,説明が必要な状況を分析し,ユーザが観察したものではなく,ユーザが期待したであろう最も可能性の高いルールを選択する。
このコントラスト的なイベントは、ユーザに提示されるコントラスト的な説明を作成するために使用される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:31:12 GMT)
A Systematic Review of Data-to-Text NLG [2.5] この体系的なレビューは、データ・テキスト・ジェネレーションに関する最先端の研究を包括的に分析する。
評価指標とともに、データセットの使用状況、人気度、影響について光を当てました。
インクリシティに焦点をあてて、低リソース言語における研究の重要性を強調します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:26:21 GMT)
Particle Filter SLAM for Vehicle Localization [2.5] 本研究では,粒子フィルタSLAM法を用いてSLAMの課題に対処する。
提案手法は,車両動作の正確な推定を可能にするために,符号化データと光ジャイロ(FOG)情報を利用する。
これらのデータストリームの統合は、Particle Filter SLAMフレームワークの確立に繋がる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:42:33 GMT)
Digital Comprehensibility Assessment of Simplified Texts among Persons
with Intellectual Disabilities [2.4] 本研究は,タブレットコンピュータ上でドイツ語のテキストを読み取る知的障害を有する者を含むテキスト理解度の評価を行った。
複数選択的理解質問、難易度評価、応答時間、読解速度の4つの異なる方法について検討した。
知的障害者の対象群では,読解速度の分析が参加者の読解行動に有意な洞察を与える一方で,最も信頼性の高い尺度として理解的疑問が出現した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:37:08 GMT)
Q-Embroidery: A Study of Weaving Quantum Error Correction into the
Fabric of Quantum Classifiers [2.3] 本研究は, 量子誤り訂正符号(QECC)を複雑・多ビット分類タスクに適用することにより, 先駆的な貢献を行う。
本研究では,QECC,特にSteane符号,および2次元および4次元のデータセットを解析するための距離3および5曲面符号を用いた1量子および2量子量子分類器を実装した。
実際のシナリオにおけるQECCの有効性は、キュービットの可用性、所望の精度、特定のタイプの物理的エラーレベルなど、様々な要因に依存する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:01:38 GMT)
Few shot clinical entity recognition in three languages: Masked language
models outperform LLM prompting [2.3] 我々は,英語,フランス語,スペイン語で,ドメイン内(クリニカル)8個とアウトドメイン金標準コーパス6個を用いて,名前付きエンティティ認識を評価した。
100文に注釈付きデータの量を制限することで、数ショットのセットアップを作成します。
以上の結果から,より大型のプロンプトベースモデルでは,臨床領域外における名前付き実体認識のF値の競合が期待できる傾向にあるが,このレベルが臨床領域に及ばないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:20:49 GMT)
HumanEval on Latest GPT Models -- 2024 [2.3] このデータセットは、自然言語とプログラミング言語のデータに対してCODEGENと呼ばれる言語モデルで使用されるように初期開発された。
これらのトレーニングされたモデルの実用性は、HumanEvalタスク上のゼロショットPythonコード生成において、競争力のあるパフォーマンスを示すことで示される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:17:21 GMT)
Convergence of Batch Asynchronous Stochastic Approximation With
Applications to Reinforcement Learning [2.3] 近似 (SA) は $f(theta) = 0$ という形の方程式の解を見つけるための標準ツールとなっている。
強化学習(RL)における重要なテクニックである$Q$-learningのようなアプリケーションでは、$theta_t$の1つのコンポーネントのみが$t$ごとに更新される。
本研究の課題は textbfBlock Asynchronous SA (BASA) を各ステップで研究することである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:58:09 GMT)
Discriminant Distance-Aware Representation on Deterministic Uncertainty
Quantification Methods [2.3] 我々は、識別距離認識表現(DDAR)と呼ばれる、決定論的不確実性推定の新しい、効率的な方法を提案する。
DDARは、最適なトレーニング可能なプロトタイプよりも識別層を利用することで、識別可能な距離認識表現を学習することができる。
実験の結果,DDARは柔軟かつアーキテクチャに依存しない手法であり,距離依存性の指標を持つプラグ可能な層として容易に統合できることが判明した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:26:48 GMT)
Learning and Sustaining Shared Normative Systems via Bayesian Rule
Induction in Markov Games [2.3] 私たちは、組み込まれた人間の機関と柔軟に協力する学習エージェントを構築します。
共有規範を仮定することにより、新しく導入されたエージェントは、コンプライアンスと違反の観察から既存の人口の規範を推測することができる。
エージェントは規範に関する共通の知識をブートストラップできるため、このことは規範を広く定着させ、新しい参加者がこれらの規範を迅速に学習することを可能にする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:58:40 GMT)
Enhanced photon-pair generation under coherent control [2.3] 生成した2光子のノイズの特性について検討し、弱い励起領域と低い原子密度の領域において、光子相関の高次性を維持することを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:38:49 GMT)
Robustness of Algorithms for Causal Structure Learning to Hyperparameter
Choice [2.3] ハイパーパラメータチューニングは、どんなアルゴリズムでも最先端と予測性能の低さを区別することができる。
本稿では,ハイパーパラメータ選択が因果構造学習タスクに及ぼす影響について検討する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:09:19 GMT)
Optically-Trapped Nanodiamond-Relaxometry Detection of Nanomolar
Paramagnetic Spins in Aqueous Environments [2.2] 蛍光ナノダイアモンド(FNDs)の窒素空洞は、ナノスケールで温度、pH、常磁性種を感知する良い候補として浮上している。
光学的に捕捉されたFNDは、常磁性イオンに対して高い再現性を持つナノモル感度を実現する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:36:09 GMT)
SmartEx: A Framework for Generating User-Centric Explanations in Smart
Environments [2.2] 本稿では,ユーザ中心の説明をスマート環境に組み込むアプローチを提案する。
私たちの仕事は、スマートな環境でコンテキスト認識と詳細な説明を生成するための、最初の技術的ソリューションです。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:07:18 GMT)
Structure of activity in multiregion recurrent neural networks [2.2] 複数の相互接続領域を持つニューラルネットワークのダイナミクスについて検討する。
各領域内では、ニューロンはランダムなリカレント接続と構造化されたリカレント接続の組み合わせを持つ。
地域内の活動の複雑さに対処するためには,他の地域への信号のルーティングが不可欠であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:32:32 GMT)
Advancing Monocular Video-Based Gait Analysis Using Motion Imitation
with Physics-Based Simulation [2.1] 我々は、強化学習を用いて人間の動きの物理シミュレーションを制御し、ビデオで見られる動きを再現する。
これにより、推定された歩幅と歩行速度の精度を向上しつつ、推定された動きを物理的に可塑性にすることができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:48:58 GMT)
On the metric property of quantum Wasserstein divergences [2.0] 量子ワッセルシュタイン(英: Quantum Wasserstein)は、チャネルによって定義される量子ワッセルシュタインの修正版である。
我々は、任意の有限次元量子系に対する量子ワッサーシュタインの発散に対する三角形の不等式を証明する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:05:41 GMT)
Formal Verification for Blockchain-based Insurance Claims Processing [1.8] 保険請求処理には、マルチドメインエンティティとマルチソースデータが含まれる。
チェーンコードのフォーマリズムをシミュレートし,モデルチェックによるチェーンコードの漏洩解析を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:29:59 GMT)
Improve Cross-Architecture Generalization on Dataset Distillation [1.7] モデルプール"は、より大きな既存のデータセットから合成データセットを作成するための新しいアプローチである。
本研究は,テスト中のモデルプールアプローチの有効性を検証し,既存手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:42:36 GMT)
Normalized Orthography for Tunisian Arabic [1.7] チュニジア・アラビア語 (ISO 693-3: aeb) はチュニジア原産の言語品種である。
本研究は「チュニジア・アラビアのノーマライズド・オルソグラフィー(NOTA)」を紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:52:29 GMT)
Diagonalisation SGD: Fast & Convergent SGD for Non-Differentiable Models
via Reparameterisation and Smoothing [1.6] 微分不可能な関数を断片的に定義するための単純なフレームワークを導入し,スムース化を得るための体系的なアプローチを提案する。
我々の主な貢献は SGD の新たな変種 Diagonalisation Gradient Descent であり、滑らかな近似の精度を徐々に向上させる。
我々のアプローチは単純で高速で安定であり、作業正規化分散の桁数削減を実現している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:58:38 GMT)
Two-stage Rainfall-Forecasting Diffusion Model [1.6] TRDMは降雨予測のための2段階の手法である。
第1段階は、低解像度条件下で空間情報を保存しながら、堅牢な時間情報をキャプチャすることである。
第2段は、第1段で生成された低解像度画像を高解像度画像に再構成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:37:32 GMT)
wmh_seg: Transformer based U-Net for Robust and Automatic White Matter
Hyperintensity Segmentation across 1.5T, 3T and 7T [1.6] ホワイトマター・ハイパーインテンシティ(WMH)は神経変性疾患の最上位のバイオマーカーである。
最近のディープラーニングモデルでは、WMHセグメンテーションが約束されているが、依然として課題に直面している。
我々は、SegFormerのトランスフォーマーベースのエンコーダを活用した、新しいディープラーニングモデルであるwmh_segを紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:57:16 GMT)
Self-Supervised Pre-Training for Precipitation Post-Processor [1.6] 数値気象予測(NWP)モデルのための深層学習に基づく降水ポストプロセッサを提案する。
地域NWPデータセットの降水補正実験は,提案手法が他の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:45:22 GMT)
Remote Possibilities: Where there is a WIL, is there a Way? AI Education
for Remote Learners in a New Era of Work-Integrated-Learning [1.5] ポストパンデミックプラットフォームは、リモートとハイブリッドの学習に特化して設計されている。
本稿では、これまでの経験を概説し、コミュニティ主導のアプリケーションにAI教育をさらに統合する方法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:35:15 GMT)
Enhancing Self-Supervised Learning for Remote Sensing with Elevation
Data: A Case Study with Scarce And High Level Semantic Labels [1.5] 本研究は、地球観測下流タスクに適用された事前学習モデルに対する、教師なしと教師なしのハイブリッド学習手法を提案する。
我々は、事前訓練モデルに対する対照的なアプローチと画素単位の回帰事前テキストタスクを組み合わせることで、粗い標高マップを予測する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:29:37 GMT)
A Geometric Algorithm for Tubular Shape Reconstruction from Skeletal
Representation [1.5] 骨格表現から管状形状を復元するための新しいアプローチを提案する。
本手法では,全ての骨格点を全体として処理し,入力構造を複数のセグメントに分割する必要がない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:14:53 GMT)
Quantum Embedding with Transformer for High-dimensional Data [1.5] この研究には視覚変換器(ViT)が組み込まれ、量子的に重要な埋め込み能力が向上した。
この研究は、我々のトランスフォーマーベースのアーキテクチャが、現代の量子機械学習問題に対して非常に汎用的で実践的なアプローチであることを実証的な証拠を示し、分析する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:06:28 GMT)
On Generalization Bounds for Deep Compound Gaussian Neural Networks [1.4] Unrolled Deep Neural Network(DNN)は、標準的なDNNよりも優れた解釈性と優れた経験的パフォーマンスを提供する。
本稿では,複合ガウス事前情報に基づく非学習型DNNのクラスに対する新しい一般化誤差境界を開発する。
現実的な条件下では、最悪の場合、一般化誤差は信号次元で$mathcalO(nsqrt(n))$、ネットワークサイズで$mathcalO(($Network Size$)3/2)$である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:01:39 GMT)
An architecture for two-qubit encoding in neutral ytterbium-171 atoms [1.4] 我々は、中性イッテルビウム-171原子の光「時計」遷移と核スピン-1/2自由度の中で2つの量子ビットを符号化するアーキテクチャを提案する。
この4次元クォート空間内の全ての状態の高忠実度制御にインスパイアされた我々は、クォート内(単一原子)1と2のキュービットゲート、2つのクォート間(2つの原子)2と4つのキュービットゲート、量子非復調(QND)リードアウトのためのツールボックスを提示する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:49:52 GMT)
Choosing a Suitable Requirement Prioritization Method: A Survey [1.4] 時間と予算内で実装を完了するためには、強力な要求優先順位付け技術が最重要である。
本稿では, 優先順位付け手法を2つの主要なクラス, 相対的, 正確な優先順位付け手法のクラスに分類できる新しい分類法を提案する。
提案した分類基準に従って,15種類の要件優先順位付け手法の概要を提示し,整理した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:05:16 GMT)
Physics-based material parameters extraction from perovskite experiments
via Bayesian optimization [1.4] 我々は有機金属ペロブスカイト半導体の8つの基本材料パラメータを過渡発光実験から抽出できる分析プラットフォームを開発した。
熱劣化の例としては、ドーピング濃度とキャリア移動度の変化が支配的であり、欠陥エネルギー準位はほぼ変化していないことが示されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:34:58 GMT)
OPDAI at SemEval-2024 Task 6: Small LLMs can Accelerate Hallucination
Detection with Weakly Supervised Data [1.4] 本稿では,LLMの幻覚検出システムについて述べる。
SemEval-2024 Task 6のモデル非依存トラックで2位を獲得した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:01:39 GMT)
Unlocking Insights: Semantic Search in Jupyter Notebooks [1.3] 意味探索能力を高めるために,大規模言語モデルの応用について検討する。
我々の目的は、図や表、関連する関数やメソッド、その他の関連する情報など、生成された出力を取得することである。
本稿では,ノートの全内容の総合的なセマンティック理解を実現するセマンティック検索フレームワークについて紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:49:41 GMT)
Flag Gadgets based on Classical Codes [1.3] 我々は、古典的なコードを用いて、ガジェットのフラグを設計するためのフレームワークを開発する。
任意の距離の安定化符号に対してフォールトトレラントシンドローム抽出を行う方法を示す。
これらの小さな例は、小規模量子コンピュータの短期的な実験に関係しているかもしれない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:34:24 GMT)
KetGPT -- Dataset Augmentation of Quantum Circuits using Transformers [1.2] 量子回路として表現される量子アルゴリズムは、量子システムの性能を評価するためのベンチマークとして用いられる。
しかしランダム回路は、実際の量子アルゴリズム固有の性質を欠いているため、代表的なベンチマークではない。
この研究は、我々が「リアルに見える」回路と呼ぶものを生成することによって、既存の量子回路データセットを強化することを目的としている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:02:21 GMT)
The Uncanny Valley: A Comprehensive Analysis of Diffusion Models [1.2] 拡散モデル (DM) は高品質な画像の生成に大きな進歩をもたらした。
ノイズスケジュールやサンプル,ガイダンスなど,さまざまなDMアーキテクチャのキーとなる側面について検討する。
比較分析の結果,拡散確率モデル(DDPM)に基づく拡散力学はノイズ条件付きスコアネットワーク(NCSN)より一貫して優れていた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:49:22 GMT)
The Physics of Preference: Unravelling Imprecision of Human Preferences
through Magnetisation Dynamics [1.2] パラドックス的な意思決定行動は、不正確または騒々しい人間の嗜好から生じる。
人間の意思決定のダイナミクスを深く反映したモデルを開発する。
この物理学と心理学のブレンドは、人間の意思決定プロセスの正確さを理解するための新しい視点の道を開く。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:26:05 GMT)
dotears: Scalable, consistent DAG estimation using observational and
interventional data [1.2] 因果性遺伝子制御ネットワークはDAG(direct acyclic graph)によって表現できる
単一の因果構造を推論する継続的最適化フレームワークであるtexttdotears$[doo-tairs]を提示する。
我々は、$texttdotears$は、軽度の仮定の下で真DAGの証明可能な一貫した推定量であることを示した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:12:20 GMT)
SoftQE: Learned Representations of Queries Expanded by LLMs [1.2] 本稿では,Large Language Models (LLM) のクエリエンコーダへの統合について検討し,遅延やコストを増大させることなく高密度検索を改善する。
SoftQEは、入力クエリの埋め込みをLLM拡張クエリにマッピングすることで、LLMからの知識を取り入れている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:23:15 GMT)
A continuous-wave and pulsed X-band electron spin resonance spectrometer
operating in ultra-high vacuum for the study of low dimensional spin
ensembles [1.2] 本稿では, 連続波・パルスXバンド電子スピン共鳴(ESR)分光計の開発について報告する。
分光計は超高真空で動作し、単結晶Al$O$_3$基板上にエピナリー成長した銅膜を用いて実現した半直線マイクロストリップ共振器を利用する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:56:32 GMT)
CHATATC: Large Language Model-Driven Conversational Agents for
Supporting Strategic Air Traffic Flow Management [1.2] 非安全で重要な戦略的トラフィックフロー管理設定において、生成AIツールをどのようにデプロイできるかを検討する。
具体的には,2000~2023年の間,地上遅延プログラム(GDP)の大規模な歴史的データセットに基づいたLLM,CHATATCをトレーニングし,8万以上のGDP実装,改訂,キャンセルで構成されている。
私たちはCHATATCのクエリとレスポンス機能、成功の文書化(GDP率、期間、理由の提供など)、欠点(最上級の質問など)をテストする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:59:11 GMT)
Learning under Singularity: An Information Criterion improving WBIC and
sBIC [1.1] 我々は、Singularity(LS)の下での学習と呼ばれる新しい情報基準(IC)を導入する。
LSは規則性制約なしで有効であり、安定性を示す。
このアプローチは、規則性制約のないモデル選択に対して、柔軟で堅牢な方法を提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:09:39 GMT)
Virtual Reality for Understanding Artificial-Intelligence-driven
Scientific Discovery with an Application in Quantum Optics [1.1] 我々は、AI生成ソリューションの理解を深めるために、分析プロセスの一部を没入型バーチャルリアリティ環境に移行する方法を示す。
我々は,抽象グラフの解釈可能な構成を見つけるためのVRの有用性を実証し,量子光学実験を表現する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:48:01 GMT)
Towards MLOps: A DevOps Tools Recommender System for Machine Learning
System [1.1] MLOpsと機械学習システムは、要求の従来のシステムとは異なり、新しいデータで進化する。
本稿では,コンテキスト情報を処理するレコメンデーションシステムのためのフレームワークを提案する。
ルールベース,無作為林,決定木およびk-アネレスト近傍の4つの異なるアプローチについて検討した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:57:49 GMT)
Mind the Exit Pupil Gap: Revisiting the Intrinsics of a Standard
Plenoptic Camera [1.0] SPC画像における主眼球出口瞳孔の役割について検討した。
復号化光場に対する再焦点距離と再サンプリングパラメータとの接続を推定する。
我々は、レンズカメラ光学のより正確でニュアンスな理解に貢献することを目指している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:35:51 GMT)
Analyzing Operator States and the Impact of AI-Enhanced Decision Support
in Control Rooms: A Human-in-the-Loop Specialized Reinforcement Learning
Framework for Intervention Strategies [0.9] 複雑な産業・化学プロセス制御室では、安全性と効率性に効果的な意思決定が不可欠である。
本稿では,AIに基づく意思決定支援システムが人間と機械のインタフェース改善に取り入れた影響と応用について検討する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:31:27 GMT)
Tiny Reinforcement Learning for Quadruped Locomotion using Decision
Transformers [0.9] リソース制約のあるロボットプラットフォームは、低コストのハードウェア代替品を必要とするタスクに役立ちます。
本稿では,資源制約のあるロボットプラットフォーム上での模倣学習を実現する手法を提案する。
本手法は資源制約された四足歩行ロボットであるBittleの自然視運動を実現する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:10:39 GMT)
Autism Detection in Speech - A Survey [0.9] 自閉症を示す言語的・韻律的・音響的手がかりを考察する。
特に,言語や意味の流布,韻律的特徴,不適応や発話率といった観察結果に注目した。
結論として、すでに多くの研究が行われていますが、女性患者は過度に研究されているようです。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:18:18 GMT)
Dynamics of Symmetry-Protected Topological Matter on a Quantum Computer [0.8] トポロジカルエッジモードの制御は、外部ノイズに対して弾力的に量子情報を符号化するのに望ましい。
本研究は,現在の量子プロセッサ上での相互作用多体系の安定な長期実装への道筋を提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:17:30 GMT)
Ontological Smart Contracts in OASIS: Ontology for Agents, Systems, and
Integration of Services (Extended Version) [0.8] エージェント・システム・サービス統合のためのオントロジー (Ontology for Agents, Systems, and Integration of Services,略してOasis) と呼ばれる,エージェントとその相互作用をモデル化するためのオントロジーを拡張します。
OSCは、エージェント間の責任と承認を確立するためのスマートコントラクトのオントロジ表現であり、条件付きではエージェントのインタラクションを制限および制限し、エージェントアクションをトリガーするアクティベーションメカニズムを定義し、OSC上の制約とコントラクト用語を定義する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:37:17 GMT)
Quantum Wiretap Channel Coding Assisted by Noisy Correlation [0.7] 我々は、ユーザが共有量子状態のリソースにアクセス可能な量子通信路のプライベートな古典的容量について検討する。
我々は、与えられたリソースの状態を使って、秘密の古典的コミュニケーションのためのコードを構築する方法を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:05:55 GMT)
Harmful algal bloom forecasting. A comparison between stream and batch
learning [0.7] 有害なアルガルブルーム(HAB)は公衆衛生と貝類産業にリスクをもたらす。
本研究では,有毒なジノフラゲレートの細胞数を予測する機械学習ワークフローを開発した。
モデルDoMEは最も効果的で解釈可能な予測器として登場し、他のアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:01:11 GMT)
Bipartite mutual information in classical many-body dynamics [0.7] 両部情報を用いて1次元セルオートマトンにおける情報の拡散を解析する。
我々の研究は、MIのような情報理論ツールが、古典的な多体状態や力学のよりきめ細かい特徴付けを可能にする可能性を示唆している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:00:01 GMT)
OccFlowNet: Towards Self-supervised Occupancy Estimation via
Differentiable Rendering and Occupancy Flow [0.7] 本稿では,2次元ラベルのみを用いたニューラルレイディアンス場(NeRF)による占有率推定手法を提案する。
深度とセマンティックマップの予測や,2次元監視のみに基づく3次元ネットワークのトレーニングには,可変ボリュームレンダリングを用いる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:04:12 GMT)
PIRB: A Comprehensive Benchmark of Polish Dense and Hybrid Text
Retrieval Methods [0.6] ポーランド語情報検索ベンチマーク(PIRB, Polish Information Retrieval Benchmark)は、ポーランド語のための41のテキスト情報検索タスクを含む総合的な評価フレームワークである。
このベンチマークには、既存のデータセットに加えて、医学、法律、ビジネス、物理学、言語学など、さまざまなトピックをカバーする、10の新しい未発表データセットが含まれている。
我々は,20以上の密度・疎度検索モデルの評価を行い,そのベースラインモデルについて検討した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:53:36 GMT)
SDXL Finetuned with LoRA for Coloring Therapy: Generating Graphic Templates Inspired by United Arab Emirates Culture [0.5] 本稿では,機械学習技術を従来のエミラティモチーフと融合させる革新的な手法を提案する。
安定拡散XL (SDXL) モデルを用いて,ローランド適応 (LoRA) で拡張し,文化的に重要な着色テンプレートを作成する。
特にGAD(Generalized Anxiety Disorder)を標的として,本手法は関連する症状の軽減に有意な可能性を示唆している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:20:08 GMT)
Principle of least action for quasi-adiabatic state transfers with
dissipation [0.4] 準断熱状態転送プロトコルを最適化するための一般的な形式について論じる。
我々は,散逸と非断熱遷移の組み合わせによって引き起こされた残存忠実度損失を,古典的な行動の形で打ち出した。
応用として、強い散逸性量子バスを介して相互作用する2つの量子ビットの弱緩和とデファス化の系を解析する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:27:30 GMT)
The Ontology for Agents, Systems and Integration of Services: OASIS
version 2 [0.4] 本稿では,OASIS 2におけるエージェントの表現に関する主要なモデリング選択について報告する。
エージェントとそのコミットメントのための意味表現システムとコミュニケーションプロトコルを提供するための行動主義的アプローチに焦点を当てている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:40:20 GMT)
Patent Value Characterization -- An Empirical Analysis of Elevator Industry Patents [0.4] グローバルな特許出願数は着実に増加し、8年連続で成長を遂げている。
中国やインドなど一部の新興市場国は、特許分野において大きな成長を遂げている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:18:16 GMT)
Generative Sliced MMD Flows with Riesz Kernels [0.4] 最大平均誤差(MMD)フローは大規模計算において高い計算コストを被る。
Riesz カーネルの MMD フローが $K(x,y) = - |x-y|r$, $r in (0,2)$ であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:35:36 GMT)
Entanglement detection in postquench nonequilibrium states: thermal Gibbs vs. generalized Gibbs ensemble [0.4] 我々は、クエンチ状態における$XY$チェーンの絡み合いを検出するために、状態の絡み合いネガティビティに関連する絡み合いの証人を用いる。
絡み合いの負性は、分岐後の定常状態において一般化されたギブズアンサンブルによって記述される相関関係に関係している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:23:32 GMT)
MiCRO: Near-Zero Cost Gradient Sparsification for Scaling and
Accelerating Distributed DNN Training [0.3] 勾配スペーシフィケーションは分散ディープニューラルネットワーク(DNN)トレーニングのスケーリングと高速化のためのテクニックである。
既存のスペーサーは、勾配選択の計算コストが高いためスケーラビリティが低い。
そこで本研究では,MiCROと呼ばれる新しい勾配スカラー化手法を提案する。
我々の実験では、MiCROは卓越した収束率で最先端のスパリファイアよりも優れていた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:37:11 GMT)
Electron Scattering at a Potential Temporal Step Discontinuity [0.3] シュロディンガー方程式がこの問題における散乱を説明できないことを示す。
我々は、後方波が相対論的効果である、後向きおよび後向きの散乱確率を導出する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:07:45 GMT)
Understanding the Effects of Noise in Text-to-SQL: An Examination of the
BIRD-Bench Benchmark [0.2] 本研究では,広範に使用されているBIRD-Benchベンチマークにおいて,ノイズの分布と種類を詳細に解析する。
質問やゴールドクエリのノイズがデータセットに広まっており、ドメイン毎にさまざまな量があることがわかった。
誤ったゴールドクエリの存在は、誤ったゴールド回答を発生させ、ベンチマークの信頼性に大きな影響を及ぼす。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:07:49 GMT)
Multi-objective Binary Coordinate Search for Feature Selection [0.2] 大規模特徴選択問題の解法として,二元多目的座標探索(MOCS)アルゴリズムを提案する。
その結果,実世界の5つの大規模データセットにおいて,NSGA-IIよりも提案手法が優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 00:50:26 GMT)
Compact NSGA-II for Multi-objective Feature Selection [0.2] 特徴選択を,分類精度を最大化し,選択した特徴数の最小化を目的とした多目的バイナリ最適化タスクとして定義する。
最適な特徴を選択するために,2進圧縮型NSGA-II (CNSGA-II) アルゴリズムを提案する。
我々の知る限りでは、これは特徴選択のために提案された最初のコンパクトな多目的アルゴリズムである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:10:12 GMT)
Towards accelerating physical discovery via non-interactive and
interactive multi-fidelity Bayesian Optimization: Current challenges and
future opportunities [0.2] そこで我々は,従来の(データ駆動型)MFBOから始まり,構造化された(物理駆動型)sMFBOに始まり,適応的かつドメインの専門家による探索のためのループ型インタラクティブiMFBOを実現するためのインタラクティブなビルディングを探索する。
詳細な分析と比較は、探索の改善のための物理知識注入とオンザフライでの人間の決定の影響、現在の課題、そしてデータ、物理、およびリアルタイムの人間の決定を組み合わせたアルゴリズム開発の可能性を示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:12:33 GMT)
Quantitative causality, causality-guided scientific discovery, and
causal machine learning [0.2] このノートは、因果分析の厳密な形式主義を確立するための10年にわたる努力の簡単なレビューを提供する。
これには、主要な理論的結果のリスト、因果的な深層学習フレームワークのスケッチ、地球科学におけるいくつかの代表的な実世界の応用が含まれている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:38:46 GMT)
Training Artificial Neural Networks by Coordinate Search Algorithm [0.2] 本稿では、ニューラルネットワークのトレーニングのための勾配自由座標探索(CS)アルゴリズムの効率的なバージョンを提案する。
提案アルゴリズムは、微分不可能なアクティベーション関数で使用することができ、多目的/マルチロス問題に適合する。
ANNの重みに対する最適値を求めることは、大規模な最適化問題である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:47:25 GMT)
Deep Hedging with Market Impact [0.2] 本稿では,Deep Reinforcement Learning(DRL)に基づく新しい市場インパクト動的ヘッジモデルを提案する。
DRLモデルから得られた最適ポリシーは、いくつかのオプションヘッジシミュレーションを用いて分析され、デルタヘッジのような一般的な手順と比較される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:08:24 GMT)
Coherent Detection of Discrete Variable Quantum Key Distribution using
Homodyne Technique [0.2] ホモダイン検出法は、その使用方法の単純さ、誤り訂正の効率性、および現代の光通信システムに対する適合性によく用いられる。
本稿では,提案モデルに対するシステム効率と量子ビット誤り率(QBER)のシミュレーション結果を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:39:50 GMT)
Analytical Verification of Deep Neural Network Performance for
Time-Synchronized Distribution System State Estimation [0.2] 近年,ディープニューラルネットワーク(DNN)を用いた時間同期状態推定器の成功例が報告されている。
本稿では,入力測定における摂動関数として,その状態推定器の性能に関する解析的バウンダリを提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:37:08 GMT)
Force-free identification of minimum-energy pathways and transition
states for stochastic electronic structure theories [0.2] 代用ヘッセン線探索法を用いて, MEP および TS 構造を効率的に同定する手法を提案する。
力のない量子モンテカルロ法を用いてMEPとTSを同定できることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:58:43 GMT)
From Movements to Metrics: Evaluating Explainable AI Methods in
Skeleton-Based Human Activity Recognition [0.2] 本稿では,骨格型HAR領域におけるXAI評価指標の適用性と信頼性の欠如に対処する。
CAM(Class Activation Mapping)とGrad-CAM(Grad-CAM)で確立されたXAIメトリクスを検証した。
以上の結果から, 有効GCNモデルなど特定の文脈において, テキストフェースフルネスは信頼性に欠ける可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:58:04 GMT)
The optimal placement of the head in the noun phrase. The case of
demonstrative, numeral, adjective and noun [0.2] 言語において好まれる順序によって、名詞は終わりに置かれる傾向があることを示す。
我々はまた、アンチローカリティ効果の証拠も示している: 望ましい順序における構文依存は、偶然に予想されるよりも長い。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:50:49 GMT)
High Schmidt number concentration in quantum bound entangled states [0.1] 両部状態のクラスに対するシュミット数を計算するための効率的な解析ツールを導入する。
5次元系においてシュミット数3 PPT状態を構築し、奇数$d$次元系に対してシュミット数$(d+1)/2$を持つ状態の族を構成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:33:57 GMT)
Photovoltaic performances in a cavity-coupled double quantum dots
photocell [0.1] 電流電圧特性と電力電圧特性に基づいて、量子光電圧の性能を評価する。
その結果, キャビティ-DQD結合係数は太陽光発電性能において散逸的な役割を担っていることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:33:16 GMT)
UMBCLU at SemEval-2024 Task 1A and 1C: Semantic Textual Relatedness with
and without machine translation [0.1] 本稿では,SemEval-2024 Task 1, "Semantic Textual Relatedness for African and Asian Languages"のために開発したシステムについて述べる。
このタスクの目的は、対象言語の2つの文間の意味的テキスト関連性を識別できるモデルを構築することである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:46:29 GMT)
Game Design Inspired by Scientific Concepts of Quantum Physics [0.1] 我々は科学と技術にインスパイアされた新しい劇場、映画、ゲームを開発し、開発する。
量子ゲームプロジェクト(Quantum Games Project)は、カードゲームとデジタルゲームと没入感のある体験で構成されている。
量子物理学は、物質がサブ原子レベルで振る舞う反直感的で驚くべき方法を説明する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:53:16 GMT)
Design and Flight Demonstration of a Quadrotor for Urban Mapping and
Target Tracking Research [0.0] 本稿では,都市マッピング,ハザード回避,目標追跡研究のための画像センサを備えた小型四角形機のハードウェア設計と飛行実証について述べる。
車両には5台のカメラが装備されており、2対の魚眼ステレオカメラが装備されており、ほぼ一方向の視界と2軸ジンバルカメラが装備されている。
Robot Operating Systemソフトウェアを実行するNVIDIA Jetson Orin Nanoコンピュータがデータ収集に使用されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:06:00 GMT)
Vision System Prototype for Inspection and Monitoring with a Smart
Camera [0.0] 本稿では,コンベアベルト上の物体の自動検査・監視のための人工視覚システムプロトタイプの設計について述べる。
本発明のプロトタイプは、コンベアベルトと、システム制御用のArduino Megaカードに基づく組込みシステムから構成されており、スマートカメラ、直流モータ、光電センサ、LED照明及び各評価対象のステータス(良し悪し)を示すLEDを主周辺として備えている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:58:23 GMT)
User Modeling and User Profiling: A Comprehensive Survey [0.0] 本稿では,ユーザモデリングとプロファイリング研究の現状,進化,今後の方向性について調査する。
我々は、初期のステレオタイプモデルから最新のディープラーニング技術までの開発をトレースする、歴史的概要を提供する。
また、プライバシ保護技術に対する重要なニーズと、ユーザモデリングアプローチにおける説明可能性と公正性への推進にも対処する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:43:20 GMT)
Understanding the effects of language-specific class imbalance in
multilingual fine-tuning [0.0] 変換器をベースとしたLarge Language Model (LLM) を不均衡なデータセットで微調整すると性能が低下することを示す。
各言語ごとにクラス重みを別々に計算することで、従来のクラス重み付けアプローチを不均衡に修正する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:59:12 GMT)
Transformer tricks: Precomputing the first layer [0.0] 本稿では,RoPEを用いた変圧器の高速化手法について述べる。
第1変圧器層の大部分をプリ計算できるため、レイテンシがわずかに小さく、コスト対トーケンが低くなる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:34:56 GMT)
Towards quantum turbulence theory: A simple model with interaction of
the vortex loops [0.0] この力学系の量子化スキームは、著者によって提案された以前のアプローチに基づいている。
量子乱流理論への応用について論じる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:48:57 GMT)
The variational quantum eigensolver self-consistent field method within
a polarizable embedded framework [0.0] 偏光埋め込み(PE)と組み合わせた変分量子固有値自己整合場(VQE-SCF)アルゴリズムを定式化し,実装する。
我々は,量子シミュレータ上で得られたPE-VQE-SCFを検証し,通常のVQE-SCFと比較して,量子デバイス上の計算応力がわずかに増大していることを示す。
本稿では, PE-VQE-SCFが実際の化学系のモデル化にどのように貢献するかを, フルンとエチレン間のディールス・アルダー反応の反応障壁のシミュレーションを用いて示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:46:45 GMT)
The kinematics of multiple Compton scattering of two-photon systems [0.0] 任意の2光子系のコンプトン多重散乱に伴う断面を計算するStokes-Mueller法を提案する。
場の量子論に基礎を置いているにもかかわらず、この方法は典型的に複雑な前提条件の深い理解を必要としない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:42:53 GMT)
The challenges of massification in higher education in Africa [0.0] 大規模なグループ(一部のコースでは3,000人以上)の学生の数は、トレーニング品質とエクイティの問題を提起している。
この種の訓練には特別な訓練条件とインフラが必要で、開発途上国では必ずしも利用できない。
この研究は、同様のニーズを持つ他のアフリカ諸国に翻訳することができ、対面コースのためのインテリジェントな教室と類似したソリューションへの道を開くことができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:42:19 GMT)
The Unreasonable Effectiveness of Eccentric Automatic Prompts [0.0] 大規模言語モデル(LLM)は、目覚ましい問題解決と基本的な計算能力を示している。
本研究は,プロンプトのシステムメッセージに「肯定的思考」を取り入れた影響を定量化する試みである。
次に、最適「肯定的思考」プロンプトの性能を、系統的プロンプト最適化の出力と比較する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:03:00 GMT)
The Shape of a Benedictine Monastery: The SaintGall Ontology (Extended
Version) [0.0] 我々は、聖ギャル計画を表すOWL 2オントロジーを提示する。
これはベネディクト会修道院の理想的なモデルであり、多くのヨーロッパの修道院の設計に影響を与えた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:25:38 GMT)
Tests of macrorealism in meson oscillation physics [0.0] マクロリアリズム(Macrorealism)は、任意の時点で系が一定の状態を占めるという概念を定式化したものである。
非シグナリング・イン・タイム条件は違反することが判明し、中間子物理学の解析にマクロ現実的記述を適用することは不可能であることが判明した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:55:04 GMT)
Structure-informed Positional Encoding for Music Generation [0.0] トランスフォーマーを用いた音楽生成のための構造インフォームド位置符号化フレームワークを提案する。
我々は、次のステップ予測と伴奏生成という2つのシンボリックな音楽生成タスクでそれらをテストした。
提案手法は, 生成した部品の旋律的および構造的整合性を改善する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:41:35 GMT)
Stochastic Approximation Approach to Federated Machine Learning [0.0] 本稿では、近似(SA)フレームワークにおけるフェデレートラーニング(FL)について検討する。
FLは、さまざまな参加者やクライアント間でニューラルネットワークモデルをトレーニングする、協調的な方法である。
提案アルゴリズムは頑健であり,より信頼性の高い重み推定を行う。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:00:25 GMT)
Stein Boltzmann Sampling: A Variational Approach for Global Optimization [0.0] 我々は,Stein Boltzmann Sampling (SBS) と呼ばれるリプシッツ関数の大域的最適化のための新しいフローベース手法を提案する。
本手法は,最適化対象関数の最小値集合上で一様となるボルツマン分布からサンプリングする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 07:19:05 GMT)
Spontaneous-emission induced ratchet in atom-optics kicked rotor quantum
walks [0.0] 原子光によるローター量子ウォークの自然放出について検討した。
しかし、自然放出は非対称性の量子ウォークにおいて非対称性を引き起こす可能性がある。
このことは、ある条件下では、一見有害な効果が有益であると再解釈する可能性を強調している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:30:51 GMT)
Spectral and temporal metrology with bandlimited functions and
finite-time measurements [0.0] 時間周波数ベースのメロジカルプロトコルは空間領域から借りることができるが、その最終的な実用性は信号と測定の両方の帯域幅の制限によって制限される。
議論された制約の下で、量子クラムエルラオ境界の到達可能性に関する必要な操作基準を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:23:28 GMT)
Space and Time Continuous Physics Simulation From Partial Observations [0.0] 大規模機械学習に基づくデータ駆動方式は、より直接的かつ効率的に長距離依存関係を統合することにより、高い適応性を約束する。
我々は流体力学に焦点をあて、正規格子や不規則格子の形で計算と予測の固定的サポートに基づく文献の大部分の欠点に対処する。
本研究では,空間的・時間的領域の連続的な領域において,スパース観測を訓練しながら予測を行う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:31:47 GMT)
SolarPanel Segmentation :Self-Supervised Learning for Imperfect Datasets [0.0] 本稿では,パネルセグメンテーションの課題,特に注釈付きデータの不足,および教師あり学習のための手動アノテーションの労働集約性について論じる。
これらの課題を解決するために、自己監視学習(SSL)を探求し、適用します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:13:11 GMT)
Shifting Climates: Climate Change Communication from YouTube to TikTok [0.0] 我々は、情報発信者としてTikTokへの影響力を拡大した21人のYouTubeクリエーターが生み出したビデオコンテンツについて検討した。
クリエイターたちは、YouTubeよりも感情的に共鳴し、自己参照し、アクション指向の言語を使っていることがわかった。
また、ビデオとコメントのセマンティックな結びつきも強く、TikTokのコンテンツをYouTubeから多様化するクリエーターは、通常、生成されたコンテンツとより緊密に一致したレスポンスを受け取る。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:18:42 GMT)
Separability criteria based on the correlation tensor moments for
arbitrary dimensional states [0.0] 絡み合いは量子情報処理にとって重要な資源です
両部量子状態と多部量子状態の相関テンソルのモーメントを用いた2つの分離性基準を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:23:13 GMT)
Scaling physics-informed hard constraints with mixture-of-experts [0.0] 我々は、Mixture-of-Experts (MoE) を用いて、ハード物理制約を強制するためのスケーラブルなアプローチを開発する。
MoEは小さなドメインに対する制約を課し、それぞれが微分可能な最適化によって"専門家"によって解決される。
標準的な微分可能最適化と比較して、我々のスケーラブルなアプローチは、ニューラルPDEソルバ設定においてより精度が高い。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:45:00 GMT)
Scale-dependent heat transport in dissipative media via electromagnetic
fluctuations [0.0] 空間的に非局所的な熱伝導率テンソルを、任意の系に対して電磁的グリーン関数とポテンシャルの観点から導出する。
通常は高密度のバルク媒体では無視されるが、導電率の電磁成分は光学的に希薄な媒体では重要である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:54:44 GMT)
Scalable Pattern Matching in Computation Graphs [0.0] グラフの書き直しは、グラフ表現の最適化と修正に人気のあるツールである。
ポートグラフにおけるパターンマッチングの新しい解法を提案する。
我々のアルゴリズムは、10万の現実世界のパターンのデータセット上での現在の実装の20倍のスピードアップを提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:02:24 GMT)
SWoTTeD: An Extension of Tensor Decomposition to Temporal Phenotyping [0.0] 隠れ時間パターンを発見する新しい手法SWoTTeD(Sliding Window for Temporal Decomposition)を提案する。
我々は, 合成と実世界の両方のデータセットを用いて提案手法を検証し, パリ大病院のデータを用いた独自のユースケースを提案する。
その結果、SWoTTeDは最近の最先端テンソル分解モデルと同程度の精度で再現可能であることがわかった。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:10:29 GMT)
SCORPION Cyber Range: Fully Customizable Cyberexercises, Gamification
and Learning Analytics to Train Cybersecurity Competencies [0.0] サイバーセキュリティ能力を訓練する最も重要なツールの1つは、サイバーレンジだ。
本稿では,完全に機能的でモチベーションの高いサイバーレンジであるSCORPIONを紹介する。
さらにSCORPIONには、学生のモチベーションを改善するためのいくつかの要素が含まれている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:57:41 GMT)
Robust and fast microwave-driven quantum logic for trapped-ion qubits [0.0] マイクロ波駆動論理は、閉じ込められたイオンベースの量子プロセッサをスケールする際のレーザー制御の代替として有望である。
ここでは、43$Ca$+$超微細クロック量子ビット上にMolmer-Sorensen二量子ゲートを実装している。
我々は、典型的なレーザー駆動ゲートの性能にアプローチする、154 mu$s と 331 mu$s のゲート持続時間を達成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:20:23 GMT)
Rigor with Machine Learning from Field Theory to the Poincar\'e
Conjecture [0.0] 本稿では,機械学習を用いた自然科学における厳密性獲得手法について論じる。
非厳密な手法は、予想生成や強化学習による検証を通じて厳密な結果をもたらす可能性がある。
また、機械学習理論と数学または理論物理学の間に直接の橋渡しを構築することも想像できる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:00:59 GMT)
Relaxing Trust Assumptions on Quantum Key Distribution Networks [0.0] 我々は、リレー上の信頼前提(完全ではないとしても)を緩和することにより、QKDネットワーク内のシークレットを確実に中継する可能性を探る。
異なる信頼度に基づくQKD鍵管理システムの複数構成を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:51:30 GMT)
Regularization, early-stopping and dreaming: a Hopfield-like setup to
address generalization and overfitting [0.0] 正規化損失関数に勾配降下を適用し,最適ネットワークパラメータを求める。
この枠組みの中で、最適なニューロン相互作用行列は、繰り返し学習プロトコルによって修正されたヘビアン核に対応する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:27:05 GMT)
Quantum interferences and gates with emitter-based coherent photon
sources [0.0] 原子、結晶の欠陥、量子ドットなどの量子放出体は、量子技術にとって区別できない単一光子の優れた源である。
コヒーレント励起時に放出されたフォトニック状態は、1光子成分との量子重ね合わせにおける真空成分を含む。
ここでは、光子数コヒーレンスの存在が光子数コヒーレンス門の基礎をどのように変えているのかを実験的に理論的に研究する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:28:34 GMT)
Quantum graphs and microwave networks as narrow band filters for quantum
and microwave devices [0.0] 正規ポリゴンからなる量子グラフとマイクロ波ネットワークの伝送振幅特性について検討する。
同じ多角形からなるグラフに対して、長さ$l' l$の辺で区切られたグラフの伝送スペクトルは一般に対称ではない。
解析されたグラフとネットワークの特性は、量子および波動輸送を効果的に操作できることを示唆している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:20:50 GMT)
Quantum Sensing of Antiferromagnetic Magnon Two-Mode Squeezed Vacuum [0.0] ネール順序反強磁性体は、基底状態がマグノンフォック状態の非古典的な重ね合わせであるような2モードのスクイーズを示す。
このような結合は、励起状態のマグノン数依存レベル分割を誘導し、複数の系励起エネルギーをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:12:59 GMT)
Quantum Pseudorandomness Cannot Be Shrunk In a Black-Box Way [0.0] Pseudorom Quantum States (PRS) は、Ji, Liu, Songによって、Pseudorandom Generatorsと類似した量子として導入された。
対数サイズの出力を持つPSSであるショートPRSは、暗号アプリケーションとともに文献に導入されている。
ここでは、擬似ランダム性を維持しながら、2021年から対数量子ビット長までPSSの出力を縮小することは不可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:02:43 GMT)
Quantum Pair State Transfer on Isomorphic Branches [0.0] ハイゼンベルク$XY$ハミルトニアンの量子ネットワークにおけるある種のペア状態の進化は、ネットワークの局所構造にのみ依存する。
高忠実度状態移動を持つグラフは、高忠実度ペア状態移動を示すために、大きな量子ネットワークの基盤となるグラフの同型分岐と見なすことができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:46:31 GMT)
Quantum Imaging Beyond the Standard-Quantum Limit and Phase Distillation [0.0] 非線形干渉計を用いた量子センシングは、バイカラーイメージングの可能性を秘めている。
位相シフトアルゴリズムは、ノイズによって引き起こされる有害な効果に対してある程度頑健である。
非線形干渉計の自発性および高利得性について検討した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:54:28 GMT)
Quantum Control for Zeno effect with noises [0.0] 量子ゼノ効果(英: quantum Zeno effect)は、量子力学において特徴的な現象であり、頻繁な射影測定が量子系の進化を妨げる非自明な効果を記述するものである。
この研究は、ノイズの存在下での量子ゼノ効果の崩壊の物理的メカニズムを研究する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:08:16 GMT)
Quantized shift response in multi-gap topological phases [0.0] 我々は、チャーン・サイモンズ形式を構成する積分トーションテンソルと非アベリア・ベリー接続の観点から量子化を再キャストする。
非自明なバンドトポロジーによる別の電磁的直流応答が得られた。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:56:17 GMT)
Promoting the transition to quantum thinking: development of a secondary
school course for addressing knowledge revision, organization, and
epistemological challenges [0.0] 本稿では,古典的知識の改訂に伴う課題に対処するために,中等教育における量子力学のコースの開発について述べる。
このコースは、古典力学から量子力学への遷移における解析に依存する概念的変化に対する体系的なアプローチに基づいている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:49:43 GMT)
PRECISE Framework: GPT-based Text For Improved Readability, Reliability,
and Understandability of Radiology Reports For Patient-Centered Care [0.0] PreCISEは、より明瞭でアクセスしやすい胸部X線レポートを6グレードのレベルで提供する。
このフレームワークは500のレポートでテストされ、可読性、信頼性、理解性を大幅に改善した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 04:26:31 GMT)
Orbital-free functional with sub-milliHartree errors for slabs [0.0] 我々は、スラブのコーン・シャム電子に対するトーマス・フェルミ運動エネルギー近似の正確な補正を導出する。
この膨張近似は、標準半局所密度汎関数によって欠落する重要な量子振動を含む。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:56:23 GMT)
Optimal feature rescaling in machine learning based on neural networks [0.0] 遺伝的アルゴリズム(GA)により入力特徴の最適再スケーリング(OFR)を行う。
OFRは、トレーニングに使用される勾配ベースのアルゴリズムの条件付けを改善する入力空間を再設定する。
この手法は、実産業プロセスの結果をモデル化したFFNNでテストされている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:24:42 GMT)
On Defining Smart Cities using Transformer Neural Networks [0.0] 世界中の都市ではスマートテクノロジーが急速に採用され、都市生活が変化している。
この傾向にもかかわらず、「スマートシティ」の定義は広く受け入れられている。
我々は、産業、アカデミア、および様々な関連組織から60のスマートシティの定義をレビューした。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:34:24 GMT)
Non-maximally entangled mixed states of X and non-X types as
teleportation channels [0.0] ベル-CHSH不等式に違反する混合スピン-1/2状態はテレポーテーションに有用である。
ベル不平等に違反しない状態もあるが、それでもテレポーテーションチャネルとして有用である。
本研究では,テレポーテーションチャネルとしての有効性が研究されている非最大絡み合い型の混合状態のクラスを構築する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:49:39 GMT)
Non-interferometric rotational test of the Continuous Spontaneous
Localisation model: enhancement of the collapse noise through shape
optimisation [0.0] 最近の短距離重力実験で測定された回転騒音に対して連続自発局所化モデルのパラメータを上界に導出する。
テーブルトップ実験であるにもかかわらず, 崩壊パラメータの関連値については, LIGOの値よりも1桁も弱いことが判明した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:52:00 GMT)
Multivariate Functional Linear Discriminant Analysis for the
Classification of Short Time Series with Missing Data [0.0] 機能線形判別分析(FLDA)はLDAを介する多クラス分類を拡張する強力なツールである。
MUDRAは、欠落したデータの割合の大きなデータセットの解釈可能な分類を可能にする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:58:45 GMT)
Modular Assurance of Complex Systems Using Contract-Based Design
Principles [0.0] 我々は,契約ベース開発(CBD)を用いて,モジュール化による保証ケースの簡易化を提案する。
CBD(CBD)は、コンピュータ科学で開発された複雑性を管理する方法である。
本論文は,高品質なモジュール型保証ケースを開発する実践者を支援するために,親指の4つのルールを動機付けている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:23:06 GMT)
Model Stitching and Visualization How GAN Generators can Invert Networks
in Real-Time [0.0] 本稿では,1x1畳み込みを用いたGAN生成器を用いて分類とセマンティックセグメンテーションネットワークの活性化を再構築する手法を提案する。
我々はAFHQのワイルドデータセット、ImageNet1K、および染色組織サンプルの実際のデジタル病理スキャンから得られた動物の画像に対するアプローチを検証した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:47:56 GMT)
Measurement-induced phase transitions by matrix product states scaling [0.0] 固定結合次元の行列積状態(MPS)を介して連続的なモニタリングを受ける長い量子スピン鎖の時間発展について検討した。
本研究では, 比較的低い結合次元の値のスケーリング解析により, モニタリング強度の位相遷移が検出可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:22:36 GMT)
Learning on manifolds without manifold learning [0.0] 未知分布からランダムに描画されたデータに基づく関数近似は、機械学習において重要な問題である。
データは高次元ユークリッド空間の未知の部分多様体からサンプリングされると仮定する。
我々の手法は、その次元以外の多様体に関する情報を得るために、データの事前処理を必要としない。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:27:53 GMT)
Learning inducing points and uncertainty on molecular data by scalable
variational Gaussian processes [0.0] 分子記述子空間における誘導点の変動学習は、2つの分子動力学データセット上でのエネルギーと原子力の予測を改善することを示す。
本研究は大規模分子結晶系に拡張し, データセットのスパース表現を効率よく学習することにより, 原子間力の予測に優れた変動GPモデルを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 03:34:30 GMT)
Learning Generalization and Regularization of Nonhomogeneous Temporal
Poisson Processes [0.0] 学習一般化問題として,有限および限られたデータからNHPPを推定する問題を定式化する。
NHPPを推定するためには結合法が不可欠であるが,データ量に制限がある場合には過度に適合する恐れがあることが示されている。
本稿では,2つの新しい適応型およびデータ駆動型ビンニング手法を用いたNHPPの正規化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:27:50 GMT)
Inverse Boundary Value and Optimal Control Problems on Graphs: A Neural
and Numerical Synthesis [0.0] 現在のアーキテクチャにおける重要な要素は、境界を注入したメッセージパッシングニューラルネットワークです。
境界から離れたノードでの予測を安定化するのに役立つグラフィカル距離に基づく正規化手法が導入された。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:21:30 GMT)
Interpreting symplectic linear transformations in a two-qubit phase
space [0.0] ある離散ウィグナー函数に対して、シンプレクティック線型変換に従ってウィグナー函数の値を置換することは、状態に対してあるユニタリ変換を実行することと等価である。
位相空間の点のシンプレクティック線型置換とウィグナー函数のある種の再解釈はユニタリ変換と同値である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:01:25 GMT)
Interferometry with few photons [0.0] 平均照明強度の異なる点回折干渉計を用いて、異なる波面を実験的に再構成する。
興味のある2つの場合、d = 6 の均一位相領域からなる空間キュート符号化フェーズと、より一般的な連続位相により、読み出しノイズの低減は、再構成の質を明らかに向上させる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:21:06 GMT)
Inferring Non-Failure Conditions for Declarative Programs [0.0] 計算中の意図しない失敗は苦痛ですが、ソフトウェア開発では頻繁です。
意図しない引数で部分的に定義された操作を呼び出すような失敗のプログラミングは、ソフトウェアが正しいという仮定のため、しばしばキャッチされない。
本稿では,そのような仮定を検証するためのアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:25:36 GMT)
InMD-X: Large Language Models for Internal Medicine Doctors [0.0] InMD-Xは自然言語処理における画期的な発展である。
それは、内科領域の様々な側面のために微調整された言語モデルスイートを提供する。
InMD-Xの汎用性と適応性は、医療産業を改善するための貴重なツールである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 02:08:37 GMT)
Improving Neural-based Classification with Logical Background Knowledge [0.0] 本稿では,提案する背景知識を用いた教師付きマルチラベル分類のための新しい定式化を提案する。
推論時に意味条件付けと呼ばれる新しいニューロシンボリック手法を導入する。
本稿では、他の2つの一般的なニューロシンボリック技術に対する理論的および実践的優位性について論じる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:01:26 GMT)
Hamilton-Jacobi-Bellman equations for Rydberg-blockade processes [0.0] 本稿では,大域的に駆動されるRydberg原子を含む2つの計算装置のブロック限界における時間-最適制御問題について議論する。
我々は、CZおよびC相ゲートの既知の結果を取得し、[Physical Review Letters 131, 170601 (2023)]で導入された普遍量子スキームに関わるすべての基本過程に対する新しい最適パルスを求める。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 12:22:10 GMT)
Guarantees on Warm-Started QAOA: Single-Round Approximation Ratios for
3-Regular MAXCUT and Higher-Round Scaling Limits [0.0] 我々はFarhiの0.6924近似結果技術をウォームスタートQAOAに一般化する。
小さい$theta$の場合、その上限は1/theta$に大まかに比例する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:22:07 GMT)
Generalized Josephson effect in an asymmetric double-well potential at
finite temperatures [0.0] 非接触多粒子ボソニック系を非対称二重井戸電位に配置する。
我々は,実効密度行列に基づく形式主義を発達させることにより,グローバルコヒーレンス体制を超えていく。
我々のモデルは、所定の温度と粒子の総数に対するジョセフソン振動の最大振幅に制約をもたらす。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:29:53 GMT)
General classification of qubit encodings in ultracold diatomic
molecules [0.0] 分子量子ビット符号化は、量子ビット間の効果的な相互作用のタイプによって4つのクラスに分類できることを示す。
本手法は,量子情報ストレージおよび処理アプリケーションにおいて,分子量子ビット符号化の最適選択を通知するために設計されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:05:25 GMT)
Fostering Joint Innovation: A Global Online Platform for Ideas Sharing
and Collaboration [0.0] この記事では、プラットフォームが何をしようとしているのか、どのように機能し、何が特別なのか、詳細を明らかにします。
私たちのプラットフォームを差別化しているのは、多様なユーザーの脳力を統合できることです。
人々がアイデアを簡単に共有し、一緒に働く文化を促進することで、プラットフォームはイノベーションの仲間のように見えます。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:02:14 GMT)
Fast simulation for multi-photon, atomic-ensemble quantum model of
linear optical systems addressing the curse of dimensionality [0.0] 複数の光子上の時間進化作用素を、単一の光子に作用する時間進化作用素のグループに分解する。
提案手法は,光子の空間伝播を可視化し,量子化技術の実験設計を支援する知見を提供する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 05:16:31 GMT)
FIDLAR: Forecast-Informed Deep Learning Architecture for Flood
Mitigation [0.0] 洪水は、ダム、門、ポンプ、貯水池などの水圧構造で極端な気象現象の前に、戦略的に水を放出することで緩和または防止することができる。
地域水管理機関が使用する標準的なアプローチは「ルールベース」手法であり、歴史的およびタイムテストされた人間の経験に基づいて、所定のプレリリース水を指定する。
本研究では,正確な水事前リリースによる高速かつ最適な洪水管理を実現するための予測インフォームド深層学習アーキテクチャ (FIDLAR) を提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:53:04 GMT)
Exploring Conceptual Modeling Metaphysics: Existence Containers, Leibniz's Monads and Avicenna's Essence [0.0] ソフトウェア工学における要求仕様は、対象ドメインの概念モデルを開発することを含む。
多くのメタ物理的な研究は、モデル構築プロセスとして理解されるのが最適である。
その焦点は、静的性と動的性の2相の世界におけるTMモデリングの単一カテゴリとしてのチマクである。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:25:20 GMT)
Efficient Parameter Mining and Freezing for Continual Object Detection [0.0] 本稿では,ネットワークがシーケンシャルな更新にまたがって検出器の性能を維持する上で,どの層が最重要かを特定する効率的な方法を提案する。
これらの結果は,オブジェクト検出モデル内での漸進的な学習を容易にする上で,階層レベルのパラメータ分離の実質的なメリットを強調した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 01:07:32 GMT)
Discovering Behavioral Modes in Deep Reinforcement Learning Policies
Using Trajectory Clustering in Latent Space [0.0] 本稿では,DRLポリシーの行動モードを調査するための新しいアプローチを提案する。
具体的には, Pairwise Controlled Manifold Approximation Projection (PaCMAP) を次元減少に用い, TRACLUS を軌道クラスタリングに用いた。
本手法は,多種多様な行動パターンと準最適選択をポリシーによって識別し,目標とする改善を可能にする。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:50:50 GMT)
Denoising OCT Images Using Steered Mixture of Experts with Multi-Model
Inference [0.0] マルチモデル推論とオートエンコーダ(BM-SMoE-AE)を用いたブロックマッチングステアリング
本研究では,マルチモデル推論とオートエンコーダ(BM-SMoE-AE)を用いた新しいデノナイズアルゴリズム,Block-Matching Steered-Mixture of Expertsを紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:00:42 GMT)
Deep Reinforcement Learning for Controlled Traversing of the Attractor
Landscape of Boolean Models in the Context of Cellular Reprogramming [0.0] 我々は,再プログラミング戦略の同定を容易にする深層強化学習に基づく新しい計算フレームワークを開発する。
我々は,非同期更新モード下でのBNとPBNのフレームワークに対するセルリプログラミングの文脈における制御問題を定式化する。
また,擬似トラクタの概念と,訓練中に擬似トラクタの状態を特定する手順についても紹介する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 14:40:23 GMT)
Dealing with uncertainty: balancing exploration and exploitation in deep
recurrent reinforcement learning [0.0] 環境に関する不完全な知識は、不確実性の下で意思決定を行うエージェントを導く。
強化学習(Reinforcement Learning, RL)では、自律的なエージェントが2つの対照的なニーズのバランスを取る必要がある。
適応的手法は、探索と搾取の間のトレードオフを近似した方がよいことを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:11:42 GMT)
Counting atypical black hole microstates from entanglement wedges [0.0] 我々は、ブラックホールのエントロピー全体を説明するために、十分に多くの非絡み合ったマイクロステートが存在することを示した。
また、短距離相互作用を持つ一般量子多体系では、十分多くの領域法則が存在すると論じる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:27:36 GMT)
Controlling Large Electric Vehicle Charging Stations via User Behavior
Modeling and Stochastic Programming [0.0] 本稿では, スロット電力制限, 契約しきい値超過によるペナルティ, 電気自動車(EV)の早期切断など, 現実的な制約を取り入れた電気自動車充電ステーションモデルを提案する。
本稿では,ユーザが提供する情報,すなわちモデル予測制御と2段階プログラミングを利用する2つのマルチステージプログラミング手法を提案する。
この2つの手法の利点は、実世界のデータセットを用いた22日間のシミュレーションにおいて、2つの基準線に対して示される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:37:11 GMT)
Context-Aware Quantitative Risk Assessment Machine Learning Model for
Drivers Distraction [0.0] MDDRA(Multi-class Driver Distraction Risk Assessment)モデルは、旅行中の車両、運転者、環境データを考慮したモデルである。
MDDRAは、危険行列上のドライバーを安全、不注意、危険と分類する。
我々は、重度レベルに応じて運転者の気晴らしを分類し、予測するために機械学習技術を適用した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 23:20:36 GMT)
Complexity for one-dimensional discrete time quantum walk circuits [0.0] 1次元離散時間量子ウォーク(DTQW)から導かれる混合状態密度演算子の複雑性を計算する。
この複雑さは、混合状態の正準浄化から得られる2量子ビット量子回路を用いて計算される。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:47:00 GMT)
Comparison of Conventional Hybrid and CTC/Attention Decoders for
Continuous Visual Speech Recognition [0.0] 従来のDNN-HMMデコーダとその最先端CTC/Attentionの動作は,その推定に使用されるデータ量に依存する。
その結果、従来のパラダイムは、データ共有シナリオにおけるCTC/Attentionモデルを改善するための認識率に達した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:33:33 GMT)
Comment on a no-go theorem for $\psi$-ontic models [0.0] 最近の論文では、存在論的モデルのハリガン-スペケンスフレームワーク全体が量子論と矛盾していると主張している。
主クレームが誤っている程度に、彼らの議論におけるいくつかの重大な誤りを特定します。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:55:16 GMT)
Combining unsupervised and supervised learning in microscopy enables
defect analysis of a full 4H-SiC wafer [0.0] 自動画像解析パイプラインを作成するために,様々な画像解析とデータマイニング技術を組み合わせる。
これにより、KOHエッチングした4H-SiCウェハの顕微鏡画像中のすべての欠陥の型と位置を抽出することができる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 20:04:23 GMT)
Client Selection for Federated Policy Optimization with Environment
Heterogeneity [0.0] 政策反復(PI)は、強化学習(RL)の多くのアルゴリズムに影響を与えた。
本稿では,Approximate PI (API) のフェデレーションバージョンを調査し,そのエラー境界を導出する。
追加の近似誤差を軽減するために,クライアント選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:47:47 GMT)
Choi representation of completely positive maps: a technical
introduction [0.0] これは完全正の写像、すなわち量子チャネルのチョイ表現の簡単な導入である。
これは、完全な詳細を示すいくつかの有用な計算技術に焦点を当てている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:58:55 GMT)
Chaos and anomalous transport in a semiclassical Bose-Hubbard chain [0.0] 半古典期におけるボース・ハッバード鎖のカオス力学と異常輸送について検討した。
この系は、最大100個の井戸を持つ長い鎖であっても、レギュラー力学とカオス力学の両方と混合位相空間を持つ。
異常輸送は非常に普遍的であり、ほぼ完全にモデルのパラメータとは独立である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:35:05 GMT)
Causal Equal Protection as Algorithmic Fairness [0.0] 我々は、因果関係のレンズを通して誤分類のリスクの公平な配分をモデル化する、因果等保護という新しい原則を論じる。
平等な保護は、分類パリティに対する反例の多くを回避しているが、多くの一般的なシナリオにおいて道徳的直観をモデル化することができないことを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 22:53:23 GMT)
Can Large Language Models be Used to Provide Psychological Counselling?
An Analysis of GPT-4-Generated Responses Using Role-play Dialogues [0.0] メンタルヘルスは現代社会にとってますます深刻な課題となっている。
本研究は、専門家カウンセラーを含むロールプレイングシナリオを通じてカウンセリング対話データを収集した。
第三者カウンセラーは、ヒトカウンセラーとGPT-4で生成されたカウンセラーからの反応の適切性を評価した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:05:36 GMT)
Blockchains through ontologies: the case study of the Ethereum ERC721
standard in OASIS (Extended Version) [0.0] 本稿では,ブロックチェーン上に格納されたスマートコントラクトをソフトウェアエージェントとして意味表現する一般的な手段として,エージェント,システム,サービス統合のためのEmphOntologyを利用する方法について報告する。
ERC721標準による管理をケーススタディとして提示したNFT(Non-fungible tokens)に特に注意が払われる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:38:45 GMT)
Autonomous Reality Modelling for Cultural Heritage Sites employing
cooperative quadrupedal robots and unmanned aerial vehicles [0.0] 本稿では, バイオミメティックな四足歩行ロボットエージェントと, 適切なセンサーを備えたUAVを用いて, CHモニュメントのための自律3次元現実モデリング手法を提案する。
この自動化プロセスの結果は、デジタルツインプラットフォームに応用され、文化遺産や空間の安全な監視と管理が容易になる可能性がある。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:08:07 GMT)
Autoencoder with Ordered Variance for Nonlinear Model Identification [0.0] 本稿では、損失関数を分散正規化項で修正し、遅延空間の順序を強制する、順序分散(AEO)を持つ新しいオートエンコーダを提案する。
また, 教師なし環境における入力変数間の非線形関係抽出におけるAEOとRAEOの有効性について述べる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:34:19 GMT)
Assessing Uncertainty in Similarity Scoring: Performance & Fairness in
Face Recognition [0.0] ROC曲線は類似度スコアリング関数の公平性を評価する主要なツールである。
本稿では、類似度関数の実証的ROC曲線と、公正性を評価するのに有用な副産物メトリクスの保証を証明する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 19:23:08 GMT)
Are ELECTRA's Sentence Embeddings Beyond Repair? The Case of Semantic
Textual Similarity [0.0] ELECTRAの埋め込みを修復する新しいTMFT法を提案する。
TMFTはパラメータ効率を高めながら、スピアマン相関係数を8点以上改善する。
我々は分析を様々なモデルサイズと言語に拡張する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 16:43:20 GMT)
AnoMalNet: Outlier Detection based Malaria Cell Image Classification
Method Leveraging Deep Autoencoder [0.0] クラス不均衡の最も極端な場合にも対応できる,オフレイヤ検出に基づくバイナリ医用画像分類手法を提案する。
AnoMalNetという名前のオートエンコーダモデルは、最初は感染していない細胞イメージのみで訓練されている。
精度、精度、リコール、F1スコアはそれぞれ98.49%、97.07%、100%、98.52%に達した。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 18:54:36 GMT)
AnnoTheia: A Semi-Automatic Annotation Toolkit for Audio-Visual Speech
Technologies [0.0] 本稿では,シーンとそれに対応する書き起こしを検知するセミオートマチックなアノテーションツールキットAnnoTheiaを提案する。
興味のある言語のためのAnnoTheia作成の完全なプロセスを示すために,スペイン語に対するアクティブ話者検出のための事前学習モデルの適応についても述べる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 17:07:08 GMT)
Angular Bloch Oscillations and their applications [0.0] 本研究では,アジマス角に沿ってリング格子を有するトロイダルトラップに閉じ込められた超低温原子のダイナミクスについて検討した。
小さな角加速度の外部回転や2つのビーム間の所定の線形チャープの存在下では、閉じ込められた原子の角運動量の測定は、時間内に特定の周期的な挙動を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 08:50:07 GMT)
An LLM Maturity Model for Reliable and Transparent Text-to-Query [0.0] 本研究は,テキスト・ツー・クエリ・アプリケーションに適したLLM成熟度モデルを提案する。
この成熟度モデルは、単に正確さや精度以上の次元を組み込むことで、そのような応用におけるLCMの評価における既存の空白を埋めようとしている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 06:20:09 GMT)
Advancements in Point Cloud-Based 3D Defect Detection and Classification
for Industrial Systems: A Comprehensive Survey [0.0] 3Dポイントクラウド(PC)は、様々な分野にまたがる多様な応用により、注目されている。
ディープラーニング(DL)は、これまで2Dビジョンで遭遇した様々な課題に対処するために、3D PCを活用するのに有効であることが証明されている。
ディープニューラルネットワーク(DNN)の3DPC処理への応用は、独自の課題セットを示している。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:18:40 GMT)
A unifying primary framework for quantum graph neural networks from
quantum graph states [0.0] グラフ状態は、量子コンピュータ上の量子状態として数学的グラフを表現するために用いられる。
グラフ状態に基づいて量子グラフニューラルネットワークモデルを理解し,実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 13:32:00 GMT)
A thermodynamic approach to quantifying incompatible instruments [0.0] 不整合性のシグネチャを消し去るのに必要な最小熱化時間を使って、楽器がどの程度不整合であるかを測定する。
いくつかの作業抽出作業において,この尺度は明確な運用上の意味を持つことが示されている。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:24:29 GMT)
A quantum inspired approach to learning dynamical laws from
data---block-sparsity and gauge-mediated weight sharing [0.0] 複雑系の動的法則を復元するスケーラブルで数値的に堅牢な手法を提案する。
我々は、量子多体系における同様のアプローチにインスパイアされた、動的法則のブロックスパーステンソルトレイン表現を使用する。
3つの1次元システム上で数値的に手法の性能を示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 11:19:47 GMT)
A new simplified MOPSO based on Swarm Elitism and Swarm Memory: MO-ETPSO [0.0] Elitist PSO (MO-ETPSO) は多目的最適化問題に適用される。
提案アルゴリズムは、確立されたNSGA-IIアプローチからコア戦略を統合する。
このアルゴリズムの新たな側面は、SwarmメモリとSwarmエリート主義の導入である。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 09:36:18 GMT)
A Microstructure-based Graph Neural Network for Accelerating Multiscale
Simulations [0.0] 本稿では,この問題のマルチスケール性を維持するための代替的な代理モデル戦略を提案する。
我々は, 顕微鏡材料モデルを維持しながら, グラフニューラルネットワーク(GNN)を用いて, フルフィールドの顕微鏡歪みを予測した。
本研究では,サロゲートが複雑なマクロな応力-ひずみ経路を予測可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 15:54:24 GMT)
A Generative Model for Accelerated Inverse Modelling Using a Novel
Embedding for Continuous Variables [0.0] 材料科学において、望ましい性質を持つ急速プロトタイピングの課題は、しばしば適切な微細構造を見つけるために広範な実験を必要とする。
生成機械学習モデルを使用することは、計算コストの低減にも有効である。
これは、例えば、モデルへの条件付け入力として連続的なプロパティ変数を必要とするため、新しい課題が伴う。
本稿では,既存手法の欠点を考察し,浮動小数点数のバイナリ表現に基づく生成モデルの新たな埋め込み戦略と比較する。
これにより正規化の必要性を排除し、情報を保存し、生成モデルを条件付けするための汎用的な埋め込み空間を作成する。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 21:03:25 GMT)
A Bound on the Maximal Marginal Degrees of Freedom [0.0] 共通カーネルリッジレグレッションは、メモリ割り当てと計算時間において高価である。
本稿では,カーネルリッジ回帰に対する低階近似とサロゲートについて述べる。
論文参考訳(メタデータ) (Tue, 20 Feb 2024 10:25:44 GMT)