stft

paddle.signal. stft ( x, n_fft, hop_length=None, win_length=None, window=None, center=True, pad_mode='reflect', normalized=False, onesided=True, name=None ) [源代码]

短时傅里叶变换。

短时傅里叶变换将输入的信号先进行分帧,然后逐帧进行离散傅的里叶变换计算,计算的公式如下:

\[X_t[f] = \sum_{n = 0}^{N-1} \mathrm{window}[n]\ x[t \times H + n]\ \exp(-{2 \pi j f n}/{N})\]

上式中符号的意义:

  • \(t\):第 \(t\) 帧输入信号;

  • \(f\):傅里叶变换频域的自变量,如果 onesided=False , \(f\) 取值范围是 \(0 \leq f < n\_fft\) , 如果 onesided=True,取值范围是 \(0 \leq f < \lfloor n\_fft / 2 \rfloor + 1\)

  • \(N\): n_fft 参数的值;

  • \(H\): hop_length 参数的值。

参数

  • x (Tensor) - 输入数据,是维度为 1D 或者 2D 的 Tensor,数据类型可为复数(复信号),其形状 为 [..., seq_length]

  • n_fft (int) - 离散傅里叶变换的样本点个数;

  • hop_length (int,可选) - 对输入分帧时,相邻两帧偏移的样本点个数,默认为 None (为 n_fft//4);

  • win_length (int,可选) - 信号窗的长度,默认为 None (为 n_fft);

  • window (int,可选) - 维度为 1D 长度为 win_length 的 Tensor,数据类型可为复数。 如果 win_length < n_fft,该 Tensor 将被补长至 n_fft。默认为 None (长度 为 win_length 幅值为 1 的矩形窗);

  • center (bool,可选) - 选择是否将输入信号进行补长,使得第 \(t \times hop\_length\) 个样本点在第 t 帧的中心,默认为 True

  • pad_mode (str,可选) - 当 centerTrue 时,确定 padding 的模式,模式 的选项可以参考 paddle.nn.functional.pad,默认为 "reflect";

  • normalized (bool,可选) - 是否将傅里叶变换的结果乘以值为 1/sqrt(n) 的缩放系 数;

  • onesided (bool,可选) - 当输入为实信号时,选择是否只返回傅里叶变换结果的一半的频点 值(输入信号和窗函数均为实数时,傅里叶变换结果具有共轭对称性)。如果输入的信号或者窗函数的 数据类型是复数,则此时不能设置为 True。默认为 True

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

返回

短时傅里叶变换的结果,复数 Tensor。当输入实信号和实窗函数,如果 onesidedTrue, 其形状为 [..., n_fft//2 + 1, num_frames];否则为 [..., n_fft, num_frames]

代码示例

import paddle
from paddle.signal import stft

# real-valued input
x = paddle.randn([8, 48000], dtype=paddle.float64)
y1 = stft(x, n_fft=512)  # [8, 257, 376]
y2 = stft(x, n_fft=512, onesided=False)  # [8, 512, 376]

# complex input
x = paddle.randn([8, 48000], dtype=paddle.float64) + \
        paddle.randn([8, 48000], dtype=paddle.float64)*1j  # [8, 48000] complex128
y1 = stft(x, n_fft=512, center=False, onesided=False)  # [8, 512, 372]

使用本API的教程文档