Flow Matching

2025年2月11日 · 529 字 · 3 分钟

生成模型是深度学习中的重要研究方向,其核心目标是学习复杂的数据分布并生成新样本。在过去的几年中,从VAE、GAN到Diffusion模型,研究者们提出了多种生成模型范式。本文将介绍一个新兴的生成模型方法:Flow Matching,并从其理论发展脉络出发,展现这一方法的独特优势。

在开始之前,让我们通过一个简单的例子来理解Flow Matching的核心思想:想象我们有一团云(简单的高斯分布),我们希望将它逐渐变形成一只猫(复杂的数据分布)。传统的方法可能需要精确计算这个变形过程中的概率变化,而Flow Matching则提供了一种更直观的方式:直接学习"云"变成"猫"的运动轨迹,就像给每个点标注一个"速度向量",告诉它该往哪个方向移动。

本文将按以下框架展开讨论:

  1. 首先介绍Normalizing Flow的基本原理及其局限性
  2. 然后探讨Flow Matching的动机和核心概念
  3. 最后对比Flow Matching与Diffusion Model的异同

NOTE: 引言由 Claude 生成。

2025年的一些计划(上)

2025年1月2日 · 27 字 · 1 分钟

博客很久没更新了。原计划能周更,没想到自从8月份建站以来,一转眼就是新的一年,也是该写点东西了。

本来想规划2025年的年度计划,盘算了下,一年这个尺度还是太长了,容易没有紧凑感。

所以,在这个相隔许久的博客里,做一下2025的上半年规划吧😊

如何让大语言模型听到声音(一)

2024年8月8日 · 245 字 · 2 分钟

本文介绍了音频数据的基本概念、音频信号的预处理流程、音频相关任务以及在深度学习领域,处理音频信号的两种常见架构。