matlab能够处理的音频格式有哪些?

作者&投稿:淡时 (若有异议请与网页底部的电邮联系)
用MATLAB处理音频~

matlab处理音频信号
一、 问题的提出:
数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢?
信号是传递信息的函数。离散时间信号——序列——可以用图形来表示。
按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种:
(1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。
(2)离时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。
(3)数字信号:时间离散而幅度量化的信号。
语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余旋波,余旋平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。
于是,本课题就从频域的角度对信号进行分析,并通过分析频谱来设计出合适的滤波器。当然,这些过程的实现都是在MATLAB软件上进行的,MATLAB软件在数字信号处理上发挥了相当大的优势。
二、 设计方案:
利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。对于波形图与频谱图(包括滤波前后的对比图)都可以用MATLAB画出。我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。
选择设计此方案,是对数字信号处理的一次实践。在数字信号处理的课程学习过程中,我们过多的是理论学习,几乎没有进行实践方面的运用。这个课题正好是对数字语音处理的一次有利实践,而且语音处理也可以说是信号处理在实际应用中很大众化的一方面。
这个方案用到的软件也是在数字信号处理中非常通用的一个软件——MATLAB软件。所以这个课题的设计过程也是一次数字信号处理在MATLAB中应用的学习过程。课题用到了较多的MATLAB语句,而由于课题研究范围所限,真正与数字信号有关的命令函数却并不多。
三、 主体部分:
(一)、语音的录入与打开:
[y,fs,bits]=wavread('Blip',[N1 N2]);用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值(若只有一个N的点则表示读取前N点的采样值)。
sound(x,fs,bits); 用于对声音的回放。向量y则就代表了一个信号(也即一个复杂的“函数表达式”)也就是说可以像处理一个信号表达式一样处理这个声音信号。
FFT的MATLAB实现
在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。下面介绍这些函数。
函数FFT用于序列快速傅立叶变换。
函数的一种调用格式为 y=fft(x)
其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x为一向量,y是x的FFT。且和x相同长度。若x为一矩阵,则y是对矩阵的每一列向量进行FFT。
如果x长度是2的幂次方,函数fft执行高速基-2FFT算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。
函数FFT的另一种调用格式为 y=fft(x,N)
式中,x,y意义同前,N为正整数。
函数执行N点的FFT。若x为向量且长度小于N,则函数将x补零至长度N。若向量x的长度大于N,则函数截短x使之长度为N。若x 为矩阵,按相同方法对x进行处理。
经函数fft求得的序列y一般是复序列,通常要求其幅值和相位。MATLAB提供求复数的幅值和相位函数:abs,angle,这些函数一般和FFT同时使用。
函数abs(x)用于计算复向量x的幅值,函数angle(x)用于计算复向量的相角,介于 和 之间,以弧度表示。
函数unwrap(p)用于展开弧度相位角p ,当相位角绝对变化超过 时,函数把它扩展至 。
用MATLAB工具箱函数fft进行频谱分析时需注意:
(1) 函数fft返回值y的数据结构对称性
若已知序列x=[4,3,2,6,7,8,9,0],求X(k)=DFT[x(n)]。
利用函数fft计算,用MATLAB编程如下:
N=8;
n=0:N-1;
xn=[4 3 2 6 7 8 9 0]';
XK=fft(xn)
结果为:
XK =
39.0000
-10.7782 + 6.2929i
0 - 5.0000i
4.7782 - 7.7071i
5.0000
4.7782 + 7.7071i
0 + 5.0000i
-10.7782 - 6.2929i
由程序运行所得结果可见,X(k)和x(n)的维数相同,共有8个元素。X(k)的第一行元素对应频率值为0,第五行元素对应频率值为Nyquist频率,即标准频率为1.因此第一行至第五行对应的标准频率为0~1。而第五行至第八行对应的是负频率,其X(k)值是以Nyquist频率为轴对称。(注:通常表示为Nyquist频率外扩展,标以正值。)
一般而言,对于N点的x(n)序列的FFT是N点的复数序列,其点n=N/2+1对应Nyquist频率,作频谱分析时仅取序列X(k)的前一半,即前N/2点即可。X(k)的后一半序列和前一半序列时对称的。
(2) 频率计算
若N点序列x(n)(n=0,1,…,N-1)是在采样频率 下获得的。它的FFT也是N点序列,即X(k)(k=0,1,2,…,N-1),则第k点所对应实际频率值为f=k*f /N.
(3) 作FFT分析时,幅值大小与FFT选择点数有关,但不影响分析结果。
2、设计内容:
(1)下面的一段程序是语音信号在MATLAB中的最简单表现,它实现了语音的读入打开,以及绘出了语音信号的波形频谱图。
[x,fs,bits]=wavread('ding.wav',[1024 5120]);
sound(x,fs,bits);
X=fft(x,4096);
magX=abs(X);
angX=angle(X);
subplot(221);plot(x);title('原始信号波形');
subplot(222);plot(X); title('原始信号频谱');
subplot(223);plot(magX);title('原始信号幅值');
subplot(224);plot(angX);title('原始信号相位');
程序运行可以听到声音,得到的图形为:
(2)定点分析:已知一个语音信号,数据采样频率为100Hz,试分别绘制N=128点DFT的幅频图和N=1024点DFT幅频图。
编程如下:
x=wavread('ding.wav');
sound(x);
fs=100;N=128;
y=fft(x,N);
magy=abs(y);
f=(0:length(y)-1)'*fs/length(y);
subplot(221);plot(f,magy);
xlabel('频率(Hz)');ylabel('幅值');
title('N=128(a)');grid
subplot(222);plot(f(1:N/2),magy(1:N/2));
xlabel('频率(Hz)');ylabel('幅值');
title('N=128(b)');grid
fs=100;N=1024;
y=fft(x,N);
magy=abs(y);
f=(0:length(y)-1)'*fs/length(y);
subplot(223);plot(f,magy);
xlabel('频率(Hz)');ylabel('幅值');
title('N=1024(c)');grid
subplot(224);plot(f(1:N/2),magy(1:N/2));
xlabel('频率(Hz)');ylabel('幅值');
title('N=1024(d)');grid
运行结果如图:
上图(a)、(b)为N=128点幅频谱图,(c)、(d)为N=1024点幅频谱图。由于采样频率f =100Hz,故Nyquist频率为 50Hz。(a)、(c)是0~100Hz频谱图,(b)、(d)是0~50Hz频谱图。由(a)或(c)可见,整个频谱图是以Nyquist频率为轴对称的。因此利用fft对信号作频谱分析,只要考察0~Nyquist频率(采样频率一半)范围的幅频特性。比较(a)和(c)或(b)和(d)可见,幅值大小与fft选用点数N有关,但只要点数N足够不影响研究结果。从上图幅频谱可见,信号中包括15Hz和40Hz的正弦分量。
(3)若信号长度T=25.6s,即抽样后x(n)点数为T/Ts=256,所得频率分辨率为 Hz,以此观察数据长度N的变化对DTFT分辨率的影响:
编程如下:
[x,fs,bits]=wavread('ding.wav');
N=256;
f=0:fs/N:fs/2-1/N;
X=fft(x);
X=abs(X);
subplot(211)
plot(f(45:60),X(45:60));grid
xlabel('Hz'),ylabel('|H(ejw)|')
%数据长度N扩大4倍后观察信号频谱
N=N*4;
f=0:fs/N:fs/2-1/N;
X=fft(x);
X=abs(X);
subplot(212)
plot(f(45*4:4*60),X(4*45:4*60));grid
xlabel('Hz'),ylabel('|H(ejw)|')
结果如图:
(三)、滤波器设计:
1、相关原理:
设计数字滤波器的任务就是寻求一个因果稳定的线性时不变系统,并使系统函数H(z)具有指定的频率特性。
数字滤波器从实现的网络结构或者从单位冲激响应分类,可以分成无限长单位冲激响应(IIR)数字滤波器和有限长单位冲激响应(FIR)数字滤波器。
数字滤波器频率响应的三个参数:
(1) 幅度平方响应:
(2) 相位响应
其中,相位响应
(3) 群时延响应
IIR数字滤波器:
IIR数字滤波器的系统函数为 的有理分数,即
IIR数字滤波器的逼近问题就是求解滤波器的系数 和 ,使得在规定的物理意义上逼近所要求的特性的问题。如果是在s平面上逼近,就得到模拟滤波器,如果是在z平面上逼近,则得到数字滤波器。
FIR数字滤波器:
设FIR的单位脉冲响应h(n)为实数,长度为N,则其z变换和频率响应分别为
按频域采样定理FIR数字滤波器的传输函数H(z)和单位脉冲响应h(n)可由它的N个频域采样值H(k)唯一确定。
MATLAB中提供了几个函数,分别用于实现IIR滤波器和FIR滤波器。
(1)卷积函数conv
卷积函数conv的调用格式为 c=conv(a,b)
该格式可以计算两向量a和b的卷积,可以直接用于对有限长信号采用FIR滤波器的滤波。
(2)函数filter
函数filter的调用格式为 y=filter(b,a,x)
该格式采用数字滤波器对数据进行滤波,既可以用于IIR滤波器,也可以用于FIR滤波器。其中向量b和a分别表示系统函数的分子、分母多项式的系数,若a=1,此时表示FIR滤波器,否则就是IIR滤波器。该函数是利用给出的向量b和a,对x中的数据进行滤波,结果放入向量y。
(3)函数fftfilt
函数fftfilt的调用格式为 y=fftfilt(b,x)
该格式是利用基于FFT的重叠相加法对数据进行滤波,这种频域滤波技术只对FIR滤波器有效。该函数是通过向量b描述的滤波器对x数据进行滤波。
关于用butter函数求系统函数分子与分母系数的几种形式。
[b,a]=butter(N,wc,'high'):设计N阶高通滤波器,wc为它的3dB边缘频率,以 为单位,故 。
[b,a]=butter(N,wc):当wc为具有两个元素的矢量wc=[w1,w2]时,它设计2N阶带通滤波器,3dB通带为 ,w的单位为 。
[b,a]=butter(N,wc,'stop'):若wc=[w1,w2],则它设计2N阶带阻滤波器,3dB通带为 ,w的单位为 。
如果在这个函数输入变元的最后,加一个变元“s”,表示设计的是模拟滤波器。这里不作讨论。
为了设计任意的选项巴特沃斯滤波器,必须知道阶数N和3dB边缘频率矢量wc。这可以直接利用信号处理工具箱中的buttord函数来计算。如果已知滤波器指标 , , 和 ,则调用格式为
[N,wc]=buttord(wp,ws,Rp,As)
对于不同类型的滤波器,参数wp和ws有一些限制:对于低通滤波器,wpws;对于带通滤波器,wp和ws分别为具有两个元素的矢量,wp=[wp1,wp2]和ws=[ws1,ws2],并且ws1<wp1<wp2<ws2;对于带阻滤波器wp1<ws1<ws2<wp2。
2、设计内容:
(1)滤波器示例:
在这里为了说明如何用MATLAB来实现滤波,特举出一个简单的函数信号滤波实例(对信号x(n)=sin( n/4)+5cos( n/2)进行滤波,信号长度为500点),从中了解滤波的实现过程。程序如下:
Wn=0.2*pi;
N=5;
[b,a]=butter(N,Wn/pi);
n=0:499;
x=sin(pi*n/4)+5*cos(pi*n/2);
X=fft(x,4096);
subplot(221);plot(x);title('滤波前信号的波形');
subplot(222);plot(X);title('滤波前信号的频谱');
y=filter(b,a,x);
Y=fft(y,4096);
subplot(223);plot(y);title('滤波后信号的波形');
subplot(224);plot(Y);title('滤波后信号的频谱');
结果如图:

在这里,是采用了butter命令,设计出一个巴特沃斯低通滤波器,从频谱图中可以很明显的看出来。下面,也就是本课题的主要内容,也都是运用到了butter函数,以便容易的得到系统函数的分子与分母系数,最终以此来实现信号的滤波。
(2)N阶高通滤波器的设计(在这里,以5阶为例,其中wc为其3dB边缘频率,以 为单位),程序设计如下:
x=wavread('ding.wav');
sound(x);
N=5;wc=0.3;
[b,a]=butter(N,wc,'high');
X=fft(x);
subplot(321);plot(x);title('滤波前信号的波形');
subplot(322);plot(X);title('滤波前信号的频谱');
y=filter(b,a,x);
Y=fft(y);
subplot(323);plot(y);title('IIR滤波后信号的波形');
subplot(324);plot(Y);title('IIR滤波后信号的频谱');
z=fftfilt(b,x);
Z=fft(z);
subplot(325);plot(z);title('FIR滤波后信号的波形');
subplot(326);plot(Z);title('FIR滤波后信号的频谱');
得到结果如图:
(3)N阶低通滤波器的设计(在这里,同样以5阶为例,其中wc为其3dB边缘频率,以 为单位),程序设计如下:
x=wavread('ding.wav');
sound(x);
N=5;wc=0.3;
[b,a]=butter(N,wc);
X=fft(x);
subplot(321);plot(x);title('滤波前信号的波形');
subplot(322);plot(X);title('滤波前信号的频谱');
y=filter(b,a,x);
Y=fft(y);
subplot(323);plot(y);title('IIR滤波后信号的波形');
subplot(324);plot(Y);title('IIR滤波后信号的频谱');
z=fftfilt(b,x);
Z=fft(z);
subplot(325);plot(z);title('FIR滤波后信号的波形');
subplot(326);plot(Z);title('FIR滤波后信号的频谱');
得到结果如图:
(4)2N阶带通滤波器的设计(在这里,以10阶为例,其中wc为其3dB边缘频率,以 为单位,wc=[w1,w2],w1 wc w2),程序设计如下:
x=wavread('ding.wav');
sound(x);
N=5;wc=[0.3,0.6];
[b,a]=butter(N,wc);
X=fft(x);
subplot(321);plot(x);title('滤波前信号的波形');
subplot(322);plot(X);title('滤波前信号的频谱');
y=filter(b,a,x);
Y=fft(y);
subplot(323);plot(y);title('IIR滤波后信号的波形');
subplot(324);plot(Y);title('IIR滤波后信号的频谱');
z=fftfilt(b,x);
Z=fft(z);
subplot(325);plot(z);title('FIR滤波后信号的波形');
subplot(326);plot(Z);title('FIR滤波后信号的频谱');
得到结果如图:
(5)2N阶带阻滤波器的设计(在这里,以10阶为例,其中wc为其3dB边缘频率,以 为单位,wc=[w1,w2],w1 wc w2),程序设计如下:
x=wavread('ding.wav');
sound(x);
N=5;wc=[0.2,0.7];
[b,a]=butter(N,wc,'stop');
X=fft(x);
subplot(321);plot(x);title('滤波前信号的波形');
subplot(322);plot(X);title('滤波前信号的频谱');
y=filter(b,a,x);
Y=fft(y);
subplot(323);plot(y);title('IIR滤波后信号的波形');
subplot(324);plot(Y);title('IIR滤波后信号的频谱');
z=fftfilt(b,x);
Z=fft(z);
subplot(325);plot(z);title('FIR滤波后信号的波形');
subplot(326);plot(Z);title('FIR滤波后信号的频谱');
得到结果如图:
(6)小结:以上几种滤波,我们都可以从信号滤波前后的波形图以及频谱图上看出变化。当然,也可以用sound()函数来播放滤波后的语音,从听觉上直接感受语音信号的变化,但由于人耳听力的限制,有些情况下我们是很难听出异同的。
同样,通过函数的调用,也可以将信号的频谱进行“分离观察”,如显出信号的幅值或相位。下面,通过改变系统函数的分子与分母系数比,来观察信号滤波前后的幅值与相位。并且使结果更加明显,使人耳得以很容易的辨听。
x=wavread('ding.wav');
sound(x);
b=100;a=5;
y=filter(b,a,x);
X=fft(x,4096);
subplot(221);plot(x);title('滤波前信号的波形');
subplot(222);plot(abs(X));title('滤波前信号的幅值');
Y=fft(y,4096);
subplot(223);plot(y);title('滤波后信号的波形');
subplot(224);plot(abs(Y));title('滤波后信号的幅值');
结果如图:
>> sound(y);
可以听到声音明显变得高亢了。从上面的波形与幅值(即幅频)图,也可看出,滤波后的幅值变成了滤波前的20倍。
>> figure,
subplot(211);plot(angle(X));title('滤波前信号相位');
subplot(212);plot(angle(Y));title('滤波后信号相位');
得图:
可以看到相位谱没什么变化。
(四)、界面设计:
直接用M文件编写GUI程序很繁琐,而使用GUIDE设计工具可以大大提高工作效率。GUIDE相当于一个控制面板,从中可以调用各种设计工具以辅助完成界面设计任务,例如控件的创建和布局、控件属性的编辑和菜单设计等。
使用GUIDE设计GUI程序的一般步骤如下:
1. 将所需控件从控件面板拖拽到GUIDE的设计区域;
2. 利用工具条中的工具(或相应的菜单和现场菜单),快速完成界面布局;
3. 设置控件的属性。尤其是tag属性,它是控件在程序内部的唯一标识;
4. 如果需要,打开菜单编辑器为界面添加菜单或现场菜单;
5. 保存设计。GUIDE默认把GUI程序保存为两个同名文件:一个是.fig文件,用来保存窗体布局和所有控件的界面信息;一个是.m文件,该文件的初始内容是GUIDE自动产生的程序框架,其中包括了各个控件回调函数的定义。该M文件与一般的M文件没有本质区别,但是鉴于它的特殊性,MATALAB把这类文件统称为GUI-M文件。保存完后GUI-M文件自动在编辑调试器中打开以供编辑。
6. 为每个回调函数添加代码以实现GUI程序的具体功能。这一步与一般函数文件的编辑调试过程相同。
设计过程及内容:
在MATLAB版面上,通过键入GUIDE弹出一个菜单栏进入gui制作界面(或者在File到new来进入gui),从而开始应用界面的制作。
该界面主要实现了以下几个功能:
①打开wav格式的音频文件,并将该音频信号的值读取并赋予某一向量;
②播放音频文件,可以选择性的显示该音频信号的波形、频谱、幅值以及相位;
③对音频信号进行IIR与FIR的5阶固定滤波处理,可以选择性的显示滤波前后信号的波形、频谱、幅值以及相位,以及播放滤波后的声音。
界面如图所示:
通过该界面,可以方便用户进行语音信号的处理。
界面主程序见附件。
(五)、校验:
1、本设计圆满的完成了对语音信号的读取与打开,与课题的要求十分相符;
2、本设计也较好的完成了对语音信号的频谱分析,通过fft变换,得出了语音信号的频谱图;
3、在滤波这一块,课题主要是从巴特沃斯滤波器入手来设计滤波器,也从一方面基本实现了滤波;
4、初略的完成了界面的设计,但也存在相当的不足,只是很勉强的达到了打开语音文件、显示已定滤波前后的波形等图。
四、 结论:
语音信号处理是语音学与数字信号处理技术相结合的交叉学科,课题在这里不讨论语音学,而是将语音当做一种特殊的信号,即一种“复杂向量”来看待。也就是说,课题更多的还是体现了数字信号处理技术。
从课题的中心来看,课题是希望将数字信号处理技术应用于某一实际领域,这里就是指对语音的处理。作为存储于计算机中的语音信号,其本身就是离散化了的向量,我们只需将这些离散的量提取出来,就可以对其进行处理了。
在这里,用到了处理数字信号的强有力工具MATLAB,通过MATLAB里几个命令函数的调用,很轻易的在实际化语音与数字信号的理论之间搭了一座桥。
课题的特色在于它将语音看作了一个向量,于是语音数字化了,则可以完全利用数字信号处理的知识来解决。我们可以像给一般信号做频谱分析一样,来给语音信号做频谱分析,也可以较容易的用数字滤波器来对语音进行滤波处理。
最后,还利用了MATLAB的另一强大功能——gui界面设计。设计出了一个简易的用户应用界面,可以让人实现界面操作。更加方便的进行语音的频谱分析与滤波处理。

网站中常用的音频格式包括MP3,WAV,AIF,MIDI。
MP3格式
MP3格式的音频文件最大的特点就是能以较小的比特率,较大的压缩比达到近科完美的CD音质。CD是以1.4MB/S的数据流量来表现其优异的音质的。而MP3仅需要112KB/S或128KB/S就可以达到逼真伯CD音质。
所以,可以用MP3格式对WAV格式的音频文件进行压缩,既可以保证音质效果,也达到了减小文件容量的目的。
WAV格式
WAV格式的音频文件具有较好的声音品质,许多浏览器都支持此格式,并且不要求安装插件。可以利用CD、磁带、麦克风等获取自己的WAV文件。但是,WAV文件容量通常较大,严格限制了可以在WEB页面上使用的声音剪辑的长度。
AIF格式
与WAV格式类似,AIF格式的音频文件也具有较好的声音品质,大部分数浏览器都支持该格式,并且不要求安装插件。也可以从CD,磁带,麦克风等获取AIF文件。但是,该格式文件夹的容量通过也较大。
MIDI格式
这种格式一般用于器乐类的音频文件。许多浏览器都支持MIDI格式的文件夹,并且不要求安装插件。尽管其声音品质非常好,但根据声卡的不同,声音效果也会有所不同。
较小容量的MIDI文件也可以提供较长时间的声音剪辑。MIDI文件不能录制并且必须使用特殊的感触件和软件在计算机课上进行合成。

扩展资料音频文件格式常见的特点有:要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成。
人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频文件格式的最大带宽是20KHZ。故而采样速率需要介于40~50KHZ之间,而且对每个样本需要更多的量化比特数。
音频数字化的标准是每个样本16位-96dB的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中,正是采用这一标准。
参考资料来源:百度百科—音频格式

matlab能够处理的音频格式有.wav和.au文件。

声音数据输入输出函数:
可以方便地读写au和way文件,并可控制其中的位及频率。
wavread()和wavwriteO。

声音播放:
wavplay():播放wav声音文件。当然,也可以把处理后的
wav文件保存后再用其它工具播放。
wavrecordO:可以对处理后的wav文件进行录音。
PS:在日常生活中,我们听到的声音一般都属于复音,其声音信号由不同的振幅与频率的波合成而得到

MATLAB 处理音频信号的流程

分析和处理音频信号 首先要对声音信号进行采集 MATLAB 的数据采集工具箱提供了一整套命令和函数,通过调用这些函数和命令,可直接控制声卡进行数据采集[1] Windows 自带的录音机程序也可驱动声卡来采集语音信号 并能保存为 WAV 格式文件供 MATLAB 相关函数直接读取 写入或播放 本文以 WAV 格式音频信号作为分析处理的输入数据 用 MATLAB 处理音频信号的基本流程是 先将 WAV 格式音频信号经 wavread 函数转换成 MATLAB 列数组变量 再用 MATLAB 强大的运算能力进行数据分析和处理 如时域分析 频域分析 数字滤波 信号合成 信号变换 识别和增强等等 处理后的数据如是音频数据 则可用 wavwrite 转换成 WAV 格式文件或用 sound wavplay 等函数直接回放 下面分别介绍 MATLAB 在音量标准化 声道分离合并与组合 数字滤波 数据转换等音频信号处理方面的技术实现

音量标准化

录制声音过程中需对声音电平进行量化处理 最理想的量化是最大电平对应最高量化比特 但实际却很难做到 常有音轻问题 利用 MATLAB 很容易实现音量标准化 即最大电平对应最高量化比特 基本步骤是 先用 wavread 函数将 WAV 文件转换成列数组变量 再求出数组变量的极值并对所有元素作归一化处理 最后用 wavwrite 函数还原成音量标准化的 WAV 文件

例 1 现以微软自带的 Windows XP 关机.wav 音频信号为例 先将其复制另存到文件名为 XPexit.wav 的 MATLAB 当前目录中再通过音量标准化处理后保存为 XPquit.wav 文件 实现程序如下
clear; close all; clc;
[Y,FS,NBITS]=wavread('XPexit.WAV'); % 将 WAV 文件转换成变量
FS,NBITS, % 显示采样频率和量化比特
Ym=max(max(max(Y)),max(abs(min(Y)))), % 找出双声道极值
X=Y/Ym; % 归一化处理
wavwrite(X,FS,NBITS,'XPquit.wav') % 将变量转换成 WAV 文件
试听可知标准化处理后音量稍大

声道分离合并与组合

立体声或双声道音频信号有左右两个声道 利用 MATLAB 实现双声道分离 两路声道合并和两个单声道组合成一个双声道等效果 实际上是利用了MATLAB 的矩阵抽取 矩阵相加和矩阵重组运算
例 2 现以例 1 生成的 XPquit.wav 为例 实现分离 合并和组合处理的程序如下
clear; close all; clc;
[x,FS,NBITS]=wavread('XPquit.WAV'); % 将 WAV 文件转换成变量
x1=x(:,1); % 抽取第 1 声道
x2=x(:,2); % 抽取第 2 声道
wavwrite(x1,FS,NBITS,'XPquit1.WAV'); % 实现 1 声道分离
wavwrite(x2,FS,NBITS,'XPquit2.WAV'); % 实现 2 声道分离
%如果合并位置不对前面补 0 %声道长度不对后面补 0
x12=x1+x2; % 两路单声道列向量矩阵变量合并
x12m=max(max(x12),abs(min(x12))), % 找出极值
y12=x12./x12m; % 归一化处理
wavwrite(y12,FS,NBITS,'XPquit12.WAV'); % 实现两路声道合并
%如果组合位置不对前面补 0--声道长度不对后面补 0
x3=[x1,x2]; % 两路单声道变量组合
wavwrite(x3,FS,NBITS,'XPquit3.WAV'); % 实现两路声道组合
可以试听声道分离 合并与组合的效果 也可对各文件大小进行比较

数字滤波
数字滤波是常用的音频处理技术 可根据技术指标 先利用 FDATool 工具 设计一个数字滤波器[2] 再用 Filter 或 Filter2 函数即可实现滤波处理 调用的 Filter 函数格式是 Y = filte (B,A,X) 其中 B 和 A 是滤波器传输函数的分子和分母系数 X 是输入变量 Y是实现滤波后的输出变量 如果处理立体声音频信号 可分开处理 但用 FIR 滤波器时调用 Filter2 函数更方便
例 3 现以例 2 生成的 XPquit12.wav 为例 实现数字滤波的程序如下
clear; close all; clc;
[X,FS,NBITS]=wavread('XPquit12.WAV'); % 将 WAV 文件转换成变量
%利用 FDATool 设计一个 LowpassButterworth 滤波器
%指标 FS=22050Hz Fp=1000Hz Ap=1dB Fs=3000Hz As=20dB
B =[0.0062,0.0187,0.0187,0.0062]; % 分子系数
A =[1,-2.1706,1.6517,-0.4312]; % 分母系数
Y=filter(B,A,X); % 实现数字滤波
t=(0:length(X)-1)/FS; % 计算数据时刻
subplot(2,2,1);plot(t,X); % 绘制原波形图
title(' 原信号波形图 '); % 加标题
subplot(2,2,3);plot(t,Y); % 绘制滤波波形图
title(' 滤波后波形图 '); % 加标题
xf=fft(X); % 作傅里叶变换求原频谱
yf=fft(Y); % 作傅里叶变换求滤波后频谱
fm=3000*length(xf)/FS; % 确定绘频谱图的上限频率
f=(0:fm)*FS/length(xf); % 确定绘频谱图的频率刻度
subplot(2,2,2);plot(f,abs(xf(1:length(f)))); % 绘制原波形频谱图
title(' 原信号频谱图 '); % 加标题
subplot(2,2,4);plot(f,abs(yf(1:length(f)))); % 绘制滤波后频谱图
title(' 滤波后信号频谱图 '); % 加标题
wavwrite(Y,FS,NBITS,'XPquitFilter.WAV'); % 写成 WAV 文件

声音数据输入输出函数:
可以方便地读写au和way文件,并可控制其中的位及频率。
wavread()和wavwriteO。

声音播放:
wavplay():播放wav声音文件。当然,也可以把处理后的
wav文件保存后再用其它工具播放。
wavrecordO:可以对处理后的wav文件进行录音。
PS:在日常生活中,我们听到的声音一般都属于复音,其声音信号由不同的振幅与频率的波合成而得到

MATLAB 处理音频信号的流程

分析和处理音频信号 首先要对声音信号进行采集 MATLAB 的数据采集工具箱提供了一整套命令和函数,通过调用这些函数和命令,可直接控制声卡进行数据采集[1] Windows 自带的录音机程序也可驱动声卡来采集语音信号 并能保存为 WAV 格式文件供 MATLAB 相关函数直接读取 写入或播放 本文以 WAV 格式音频信号作为分析处理的输入数据 用 MATLAB 处理音频信号的基本流程是 先将 WAV 格式音频信号经 wavread 函数转换成 MATLAB 列数组变量 再用 MATLAB 强大的运算能力进行数据分析和处理 如时域分析 频域分析 数字滤波 信号合成 信号变换 识别和增强等等 处理后的数据如是音频数据 则可用 wavwrite 转换成 WAV 格式文件或用 sound wavplay 等函数直接回放 下面分别介绍 MATLAB 在音量标准化 声道分离合并与组合 数字滤波 数据转换等音频信号处理方面的技术实现

音量标准化

录制声音过程中需对声音电平进行量化处理 最理想的量化是最大电平对应最高量化比特 但实际却很难做到 常有音轻问题 利用 MATLAB 很容易实现音量标准化 即最大电平对应最高量化比特 基本步骤是 先用 wavread 函数将 WAV 文件转换成列数组变量 再求出数组变量的极值并对所有元素作归一化处理 最后用 wavwrite 函数还原成音量标准化的 WAV 文件

例 1 现以微软自带的 Windows XP 关机.wav 音频信号为例 先将其复制另存到文件名为 XPexit.wav 的 MATLAB 当前目录中再通过音量标准化处理后保存为 XPquit.wav 文件 实现程序如下
clear; close all; clc;
[Y,FS,NBITS]=wavread('XPexit.WAV'); % 将 WAV 文件转换成变量
FS,NBITS, % 显示采样频率和量化比特
Ym=max(max(max(Y)),max(abs(min(Y)))), % 找出双声道极值
X=Y/Ym; % 归一化处理
wavwrite(X,FS,NBITS,'XPquit.wav') % 将变量转换成 WAV 文件
试听可知标准化处理后音量稍大

声道分离合并与组合

立体声或双声道音频信号有左右两个声道 利用 MATLAB 实现双声道分离 两路声道合并和两个单声道组合成一个双声道等效果 实际上是利用了MATLAB 的矩阵抽取 矩阵相加和矩阵重组运算
例 2 现以例 1 生成的 XPquit.wav 为例 实现分离 合并和组合处理的程序如下
clear; close all; clc;
[x,FS,NBITS]=wavread('XPquit.WAV'); % 将 WAV 文件转换成变量
x1=x(:,1); % 抽取第 1 声道
x2=x(:,2); % 抽取第 2 声道
wavwrite(x1,FS,NBITS,'XPquit1.WAV'); % 实现 1 声道分离
wavwrite(x2,FS,NBITS,'XPquit2.WAV'); % 实现 2 声道分离
%如果合并位置不对前面补 0 %声道长度不对后面补 0
x12=x1+x2; % 两路单声道列向量矩阵变量合并
x12m=max(max(x12),abs(min(x12))), % 找出极值
y12=x12./x12m; % 归一化处理
wavwrite(y12,FS,NBITS,'XPquit12.WAV'); % 实现两路声道合并
%如果组合位置不对前面补 0--声道长度不对后面补 0
x3=[x1,x2]; % 两路单声道变量组合
wavwrite(x3,FS,NBITS,'XPquit3.WAV'); % 实现两路声道组合
可以试听声道分离 合并与组合的效果 也可对各文件大小进行比较

数字滤波
数字滤波是常用的音频处理技术 可根据技术指标 先利用 FDATool 工具 设计一个数字滤波器[2] 再用 Filter 或 Filter2 函数即可实现滤波处理 调用的 Filter 函数格式是 Y = filte (B,A,X) 其中 B 和 A 是滤波器传输函数的分子和分母系数 X 是输入变量 Y是实现滤波后的输出变量 如果处理立体声音频信号 可分开处理 但用 FIR 滤波器时调用 Filter2 函数更方便
例 3 现以例 2 生成的 XPquit12.wav 为例 实现数字滤波的程序如下
clear; close all; clc;
[X,FS,NBITS]=wavread('XPquit12.WAV'); % 将 WAV 文件转换成变量
%利用 FDATool 设计一个 LowpassButterworth 滤波器
%指标 FS=22050Hz Fp=1000Hz Ap=1dB Fs=3000Hz As=20dB
B =[0.0062,0.0187,0.0187,0.0062]; % 分子系数
A =[1,-2.1706,1.6517,-0.4312]; % 分母系数
Y=filter(B,A,X); % 实现数字滤波
t=(0:length(X)-1)/FS; % 计算数据时刻
subplot(2,2,1);plot(t,X); % 绘制原波形图
title(' 原信号波形图 '); % 加标题
subplot(2,2,3);plot(t,Y); % 绘制滤波波形图
title(' 滤波后波形图 '); % 加标题
xf=fft(X); % 作傅里叶变换求原频谱
yf=fft(Y); % 作傅里叶变换求滤波后频谱
fm=3000*length(xf)/FS; % 确定绘频谱图的上限频率
f=(0:fm)*FS/length(xf); % 确定绘频谱图的频率刻度
subplot(2,2,2);plot(f,abs(xf(1:length(f)))); % 绘制原波形频谱图
title(' 原信号频谱图 '); % 加标题
subplot(2,2,4);plot(f,abs(yf(1:length(f)))); % 绘制滤波后频谱图
title(' 滤波后信号频谱图 '); % 加标题
wavwrite(Y,FS,NBITS,'XPquitFilter.WAV'); % 写成 WAV 文件

matlab能直接输入输出的有.wav和.au文件。用wavread(), wavwrite(), auread(), auwrite()
至于能打开多大的文件,那最主要是看你的内存大小。
10来分钟,立体声44kHz采样率,在我2G内存的机子里完全没有问题。更大的文件,就不仅仅是内存的问题了,10分钟的文件已经有10*60*44000=26,400,000个样本,处理起来很花时间的。建议把文件切成1分钟左右,分开处理,会快很多,而且对内存要求也没有那么大。

mp3转换为wav可以用千千静听;


MATLAB在振动信号处理中的应用版权信息
ISBN号码为9787508426808,它提供了一个详细的指南,深入解析MATLAB在处理复杂振动信号时的高效算法和技术。全书共16开本,内容丰富实用,对于理解振动信号分析的理论与实践具有很高的价值。读者可以通过这本书了解到MATLAB如何帮助分析振动数据,例如振动频率检测、信号滤波、异常检测等关键环节。它不仅适合于振动...

学习matlab,主要用于数据处理,这样合适吗?
matlaB能做的。如果是统计,还是建议用spss等统计软件。

用matlab处理bmp的图像,处理完之后怎么保存到电脑里面?
aaa.bmp”\\x0d\\x0a>> a=imread('aaa.bmp')\\x0d\\x0a%中间处理略...\\x0d\\x0a...\\x0d\\x0a%输出图片至“AAA.bmp”\\x0d\\x0a>> imwrite(a,'AAA.bmp','bmp')\\x0d\\x0a\\x0d\\x0a基本是这样,imwrite的其他用法有兴趣请查看matlab的帮助文档吧..

怎样用matlab进行图像滤波处理
1、打开软件,读入图片。2、分别建立3*3高斯滤波模板和平均滤波模板,并对加噪的图片进行滤波处理。显示原图、加噪后的图片和分别用高斯、平均模板滤波后的图片。3、图片结果如图,可以看出平均模板滤波后噪声十分明显,高斯模板滤波后噪声影响相对较小,但也很容易看出。4、使用中值滤波对图片进行处理,并...

基于MATLAB的带噪图像的高斯滤波
关键词:图像、高斯滤波、去噪、MATLAB 在图像处理领域,高斯滤波是去除高斯噪声的常用方法。本文介绍了一种基于MATLAB的图像去噪策略,包括读取原始图像、加入椒盐噪声、应用高斯滤波并展示处理后的图像。使用MATLAB的函数库,如`imread()`、`imnoise()`和`fspecial()`等,可以实现高斯滤波器的生成和图像的...

如何用matlab处理碎纸片拼接问题
用matlab处理碎纸片拼接:1、思路:分别用n个变量储存n个碎纸片图像,然后用矩阵拼接的方式把碎纸片拼接。2、具体代码:clear all close I1=imread('008.bmp');I2=imread('014.bmp');I3=imread('012.bmp');I4=imread('015.bmp');I5=imread('003.bmp');I6=imread('010.bmp');I7=imread(...

数字图像处理(MATLAB版)内容简介
本书以简明扼要的方式介绍了数字图像处理的基本理论,并将理论知识与实践应用紧密结合。首先,第1章着重于学习策略,指导学生如何有效地进行课程学习,提供新技术学习的建议和工程训练的最佳途径。在第2章,小波分析及其应用的基础理论被深入讲解。第3章探讨了图像压缩编码的原理,是理解图像数据高效传输的...

数字信号处理的MATLAB实现内容简介
第8章引入参数化建模,帮助读者掌握更高级的信号处理技术(灵活的建模方法);第9章深入随机信号分析,拓宽信号处理的视野(理解不可预测信号的处理策略)。最后,第10章简要介绍数字信号处理的前沿议题,旨在启发读者对新技术的探索(拓展视野,紧跟技术前沿)。本书特色在于结合大量实例和MATLAB程序,便于...

matlab的图像处理功能属于什么组成部分
MATLAB 的图形处理系统能够将二维和三维数组的数据用图形表示出来,并可以实现图像处理、动画显示和表达式作图等功能。MATLAB 应用程序接口使 MATLAB 语言能与 C 或 FORTRAN 等其他编程语言进行交互。MATLAB 工具箱 MATLAB 的工具箱包括两种:功能性工具箱和科学性工具箱。功能性工具箱主要用来扩充其符号计算...

matlab可以处理电路问题吗,怎么处理?
用matlab里的simulink,照着电路图接线,然后就可以仿真了。

福海县15130344579: matlab能够处理的音频格式有哪些?
史冉乐喜: matlab能直接输入输出的有.wav和.au文件.用wavread(), wavwrite(), auread(), auwrite() 至于能打开多大的文件,那最主要是看你的内存大小. 10来分钟,立体声44kHz采样率,在我2G内存的机子里完全没有问题.更大的文件,就不仅仅是内存的问题了,10分钟的文件已经有10*60*44000=26,400,000个样本,处理起来很花时间的.建议把文件切成1分钟左右,分开处理,会快很多,而且对内存要求也没有那么大.

福海县15130344579: 为什么自己录音的音频信号在matlab画不出频谱图 (其他的歌可以的 ,.WAV格式的) -
史冉乐喜: matlab能处理的音频文件为(.wav)格式,并且处理的文件不超过1M.

福海县15130344579: matlab可以加载MP4音频吗? -
史冉乐喜: matlab默认读取的是wav和au格式的音频文件,你可以用软件转换MP4格式为WAV在用matlab读取.

福海县15130344579: matlab,如何裁切一段时间的音频?怎么设置保存格式? -
史冉乐喜: sec1= %剪切开始的时间 sec2 = %剪切结束的时间[Y,F,b]=wavread('sound.wav'); Y_new=Y(((F*sec1+1):F*sec2),:); wavwrite(Y_new,F,b,'sound_new.wav'); MATLAB只能保存为wav ,其他格式可以用其他软件来转换.

福海县15130344579: Matlab能导入wav格式的文件吗? -
史冉乐喜: 不可以,matlab不支持mp3格式,只支持wav格式.

福海县15130344579: matlab可以调用什么形式文件,除了m,txt外 -
史冉乐喜: 其实这个软件主要是进行科学计算的.如果你要研究矩阵,excel,csv等格式都可以读取.如果你要研究图像处理,那么通用的图像格式jpg,gif,bmp也可以读取.至于音频识别,那wav很多格式都可以.依照你研究方向而定.

福海县15130344579: 怎样用matlab分割音频文件(wav)或其他 -
史冉乐喜: 用matlab根据lrc文件切割音频,适用于wav音频(一句歌词一个音频一个lrc)代码如下:%clear clc;clear all;%用Import Data导入lrc文件,设置'[',']',':'为分隔符,出现三个矩阵,分别改名为minuate、second、lyric [y,fs]=audioread('John ...

福海县15130344579: MATLAB分析声音信号 -
史冉乐喜: 这个要用到联合时频分析,STFT也行,WVD也行.噪声的话,要看你是什么样的类型噪声,建议先用FFT分析,大概确定一下频率.不知道你是要用软件滤波还是用硬件滤波.声音信号的频率都在低频段,处理起来比较容易.建议使用希尔伯特变换就可以,这是最简单的时频分析方法,也是最成熟的,在MATLAB里面使用非常的简单.

福海县15130344579: 用matlab实现音频压缩 -
史冉乐喜: [y,fs,bits]=wavread('voice'); %读取音频信息(双声道,16位,频率44100Hz) sound(y,fs,bits); %回放该音频 如果知道具体的压缩算法,很容易处理.

福海县15130344579: matlab读取mp3 -
史冉乐喜: 你可以试下用音频转换软件将mp3格式转换成wav格式,然后 x=wavread('\.......\xxx.wav'); plot(x); \......\里面是文件路径,plot画出文件图形

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网