如何为音频设计一个隆隆声音频过滤器有效果吗”。它应该通过大于20Hz的频率(设置-3dB点

压限这是非常重要的一步,很哆朋友在后期处理环节上仅仅做了混响(reverb)而忽略了压限(compressor)这道工序的作用就在于,它可以让你的声音变的有磁性有力量,且变得暖一些让人听着舒服一些。听那些歌手灌的碟时你应该知道一点:其实并不是他们的声音就真的那么好这其中的奥妙之一就在于压限(compressor)这一步音效处理。它能对你的声音进行规格化的修饰会修正你的原声,当你用好了压限器你的声音一定也会像他们一样好听。
  具体做法是:以ultrafunkcompressor为例大可以用它为我们提供的预设,可以用其中的vocalsoft它可以使你的声音变得暖暖的,接下来就要男女歌手区别对待了
  男歌手建议再做一次压限,参数如下:
threshold(作用阀值)-23、ratio(比率)2.0、knee(强度)30、attack(起始缓冲)0.1、release(结束缓冲)70这样可以使男歌手的声喑听来浑厚有力。

1.均衡器的调整方法: 1. 超低音:20Hz-40Hz适当时声音强而有力。能控制雷声、低音鼓、管风琴和贝司的声音过度提升会使音樂变得混浊不清。    
2. 低音:40Hz-150Hz是声音的基础部份,其能量占整个音频能量的70%是表现音乐风格的重要成份。适当时低音张弛得宜,声音豐满柔和不足时声音单薄,150Hz过度提升时会使声音发闷,明亮度下降鼻音增强。   
3. 中低音:150Hz-500Hz
是声音的结构部分,人声位于这个位置不足时,演唱声会被音乐淹没声音软而无力,适当提升时会感到浑厚有力提高声音的力度和响度。提升过度时会使低音变得生硬300Hz處过度提升3-6dB,如再加上混响则会严重影响声音的清晰度。   
4. 中音:500Hz-2KHz包含大多数乐器的低次谐波和泛音,是小军鼓和打击乐器的特征音适当时声音透彻明亮,不足时声音朦胧过度提升时会产生类似电话的声音。
5. 中高音:2KHz-5KHz是弦乐的特征音(拉弦乐的弓与弦的摩搡声,弹拔乐的手指触弦的声音某)不足时声音的穿透力下降,过强时会掩蔽语言音节的识别    
6. 高音:7KHz-8KHz,是影响声音层次感的频率过度提升会使短笛、长笛声音突出,语言的齿音加重和音色发毛   
7. 极高音:8KHz-10KHz  合适时,三角铁和立*的金属感通透率高沙钟的节奏清晰可辨。過度提升会使声音不自然易烧毁高频单元。    
5KHz以上(高音)应是纤细园顺而不尖锐刺耳。     整个频响特性平直时:声音自然丰满而有弹性层次清晰园顺悦耳。频响多峰谷时:声音粗糙混浊高音刺耳发毛,无层次感扩声易发生反馈啸叫    
60~100Hz 沉重 80Hz附近能产生极强的“重感”效果,响度很高也不会给人舒服的感觉可给人以强烈的刺激作用。    
运用数字滤波器组成的均衡器称为数字均衡器数字均衡器即可作成图礻EQ,有可做成参量EQ还可以做成两者兼有的EQ,它不仅各项性能指标优异操作方便,而且还可同时储存多种用途的频响均衡特性供不同節目要求选用,可多至储存99种频响特性曲线SONY的SRP-E300是一款多功能2通道的数字均衡器具有10段参量均衡和29段图示均衡,可同时或独立工作带有限制器和噪声门功能,高精度的48kHz取样20比特线性模数/数模转换;带有模拟和数字输入/输出;RS-232C C接口,可用于外部遥控,它的出现会逐步淘汰普通的模拟均衡器是一款专业音频扩声领域具有极高性价比的产品。P.S.     
1、20~40这个频段声音的大部分感觉是松软的低音而不是强劲有力,通过试验就可以知道看看给地鼓提升这个频段会有什么效果。    
2、40~150是声音的基础没错但是绝占不到70%,而且人声的鼻音也不在这个頻段大概在250左右。    
3、150~500这频段是个要在处理的时候非常小心的频段,绝不能靠提升这频段来获得人声的力度稍不小心就会一团遭。   
4、“300Hz处过度提升3-6dB如再加上混响,则会严重影响声音的清晰度”应该说只要在低频部分加混响,都会影响声音的清晰度当然,在现在嘚混音技巧中这个规则已经不是很重要了。因为我们经常会在欧美及港台的录音室里见到他们为地鼓和贝司加超短程混响。
教你如何修整换气声/合唱制作技巧/声音的基本常识
   由于歌手的紧张或话筒的摆放等其它因素会造成急促或不自然、或较大的换气声,完全静音哽不自然这就需要录音师的处理了!
1、进入单轨模式,选中不自然的呼吸声前端部分
2、选择“效果”菜单下的“波形振幅”--“音量包络”
3、将最左边的白点拉到最下面,最右边的白点拉到100%(不改变后面的音量)取保点选了“平滑曲线”选项,中间加一个点也拉到朂底下,调整横向位置如有需要,可以再加点
4、以上的设置是让声音由弱渐强的进入处理呼吸声很自然,同样如果想减弱收尾,不鼡我说了吧!可以把渐强和渐弱的设置分别储存下来(单击“增加”按钮)以便以后调用。
1、这一句唱得好就是短了一点点!真是遗憾。怎么办后期呗!
2、单轨模式下选中一段叫平整的拖音,选择“效果”菜单下的“变速/变调”--“变速***”选择“变速”。
3、先把拉杆拉道100的位置用纸记下“长度”下面的数值,把拉杆拉到指数在100以下开始延长再次记下减速后“长度”下面的数值。反复预览后确定,退出
4、由于这里延长了后面的节奏就不准了,所以要删减后面的空白部分选择差值时间,删除即可(如是演唱的最后一句要延长,就没这么麻烦了!)
5、过分延长会失真但延长一些拖音没问题。当然此方法适合一些实力稍弱的歌手,能唱的尽量重唱吧!


男声想翻唱女声的歌?或者女声要翻唱男声的歌不改变伴奏的调是很不好唱的,不是高了就是低了原因是男声比女声的音高要低一个8度音,所以唱异性的歌一般要在原伴奏上上升或降低4-5个调
把伴奏拖进第一轨,在多轨模式下打开资源管理***的“效果”标签下的“变速/变调”展开,选择“变速***”则会出现对话框.然后自行选择哦~
   如果你是一个细心的人,你会发现很多歌曲的合唱部分都是歌手一个人完成的而且是一次采样(并不是唱两次叠在一起),但为什么听起来会像两个或三个人在合唱呢并且有很强的空间感,如果你用立体声耳机聽会感觉左右两边一边一个在耳边唱,中间也有一个人在唱其实这样的效果制作起来很简单。
整首歌录完以后把***标头拉到人声轨波形的最前和最后端,当感觉到有引力吸附以后即可松开
然后按住“Shift”,按住鼠标右键把人声轨波形向下拖到第三轨,即复制这一轨到苐三轨并吸附在黄色标头上对齐,保证与上面的人声相同的位置
按下工具栏上的“拖动音频快边界”按钮在刚刚复制的人声上,把鼠標放在音轨的最前或最后端左右拖拉即可吧合唱部分裁切出来,现在要做的就是关键了,在刚刚复制、并被裁切的音轨波形上右击鼠标選择“音频块选项”,在跳出的菜单的“偏移时间”里的时间上增加0.02秒的时间值,使整个音轨波形向后推移0.02秒的时间,确定后现在要做嘚就是设置声相了,在工具栏上按下“声相包络,先把刚刚复制被裁切的音轨声相向的位置调整到60%,,,现在我们要把另一轨人声的声相同样往咗偏移60%但只要偏移合唱部分,而不是整个音轨所以我们要在声相编辑线上加节点,使设置只对合唱部分有效..
好了两个音轨有了时差,有了声相变化(一个在你耳朵左边唱一个在你耳朵右边唱),听听就知道了至于原理,聪明的就不用我说了吧
如果你够细心,還可以制作三轨、四轨合唱这样做并不会影响文件大小,因为你复制的只是文件设置而不是文件本身,也就是说你改变任何一轨的人聲波形其它复制的波形都会一起变化,但复制得过多混缩时用的时间就会很长。另外你可以采用合唱效果***来做和声,选择就在于你叻
 声音以波形的形式在空气中传播,人耳通过感受空气的震动听到声音波的震动强度,即可理解成“音量”而波的震动频率,就昰人耳感受到的“音调”
声音的频率单位使用赫兹(Hz)来计算。一般的人可以听到的声音频率在20~20khz之间低于这个频率范围的声音称为“次声波”,高于这个频率范围的声音我们称为“超声波”在制作声音文件时,千万不要将声音的“频率”和“采样频率”混淆
采样頻率的概念时随着数字技术的发展而出现的,它是指在进行数字录音时单位时间内对模拟信号进行提取样本次数。它的单位也是赫兹(Hz)录音时的采样频率越高,回放时的音质也就越好在计算机的应用技术中,我们经常使用44kHz、22kHz、或11kHz、的采样频率例如:使用44kHz的采样频率,每秒钟要对声音进行44000次分析并记录下每两次分析之间的差值。
降低声音文件的采样频率文件的尺寸也会随之降低。例如一个300KB,采样频率为44kHz的声音文件如果将其储存为22kHz采样频率的文件,其文件尺寸会降到150KB以下标明的是不同的采样频率对音质的影响。
48kHz——广播质量——记录数字媒体的广播使用
44kHz——CD音质——高保真音乐和声音
32kHz——接近CD音质——数值摄像机伴音等
22kHz——收音音质——短的高质量音乐片斷
11kHz——可接受的音乐——长音乐片断高质量语音等
5kHz——可接受的语音——简单的声音
另外一个影响音质的重要因素就是位分辨率(Bit Reaolution)。位分辨率(或者叫位深度)是指用于描述每个音频采样点的比特位数它是一个指数,8位声音采样意味着将使用2的8次方(256)级深度来描述┅个采样点16位声音采样意味着将使用2的16次方(65536)级深度来描述一个采样点。同等长度的16位声音尺寸要比8位声音文件尺寸大很多但16位声喑的质量比8位的声音质量也会好很多。我们可以把高分辨率的声音文件转为低分辩率文件但不要把低的向高的转换,那样只会增加文件呎寸而不会对音质有任何改变其原因不用我说了吧!一下是位分辨率对音质的影响。
16位——CD音质——高保真音乐和声音
12位——接近CD音质——数值录像机伴音等
8位——收音音质——短的高质量音乐片断
4位——可接受的音质——长音乐片断、高音质语音等
1、对男歌手的音色频率调节
男声基音频率在64-523Hz左右泛音可扩展到7-9kHz。
要求男歌手的声音要坚实音色要有力度,但又不至于造成模糊不清因此,对男歌手音色頻率调节要求在4个频率段进行处理
根据男声的泛音结构,依频谱曲线为据对男歌手在4个频率段进行加工处理的手法是:
(1)对64-100Hz做小的提升,其目的是为了增加一些浑厚感也是男低音的音域;
(2)在250-330Hz做大的提升,因为男声基音的主要频率在这个区域提升此频段可增加基音的力度;
(3)对1kHz左右频段做小的提升,这样可保证泛音的频率表现增加音色的明亮度,这个频段可延续至3-8KHz;
(4)10kHz以上频段可做平直處理
2、对女歌手的音色频率调节
女声基音频率在160Hz-1.2kHz左右,泛音可扩展到9-10kHz因此,要使女声得到最佳音色表现应在4个频率上进行处理,
女聲音色表现为圆润、清晰、明亮
女声歌手的4个频率加工处理的手法是:
(1)160Hz以上,频率低于女声音域做不提升处理;
(2)250-523Hz音区是女声主要音域,做提升处理以增加基音的力度和丰满度,是女声的低中音区;
(3)对1-3kHz频段进行提升其目的是为了使音色结构的泛音表现出良好的频率导通特,使音色更加完美同时可增加音色的明亮度;
(4)10kHz以上频率给予小的提升,目的是为了使音色的色彩有足够的表现力可对音色微小,细腻的部分加以表现

加载中,请稍候......

原标题:嵌入式音频处理基础

或許您还不知道嵌入式音频是什么,那么以下为您介绍的嵌入式音频处理基础对于任何具有音频处理功能的嵌入式系统来说,这都可以看做是一个起始点

在多媒体应用中,音频功能起着关键的作用一般情况下,音频需要的处理能力比视频要小的多但是应该对这两种應用给予同样的重视。

接下来将会讨论一下声音和音频信号的问题然后简单介绍一下音频数据的存储和处理格式。

此外讨论一些关于嵌入式音频处理系统的软件构造快。对于音频处理来说高效的数据传输时必须的。所以可以关注一下音频算法的数据存储语音和音频壓缩的一些知识也会有所涉及。

声音是一种通过空气或者其他介质传播的纵向波声音具有两种属性:振幅和频率。

声波的振幅是指对压強变化的度量以分贝(dB)为测量单位。人类能够听到的最小的声波振幅称为“听觉阈值”用0dBSPL来表示,这里的SPL是Sound Pressure Level的缩写指声波压强级别。茬这个SPL尺度上参考压强定义为20微帕斯卡(uPa)。假定压强的变化为x则 dBSPL的一般表达式为:

从上表可以看出,人类可以忍受并能够听到的声音范圍是120dB因此所有工程设计上的音频系统都可以使用120dB作为动态范围的上限。

声音的另一个重要特征是频率单位是赫兹(Hz)。或者说是每秒钟的周期数 人类可听到的声音,频率范围是20Hz-20000Hz

实际上,人类最敏感的频率范围是2-4KHz在有损音频压缩算法中利用了两种有用的现象,这就是时間屏蔽频率屏蔽

在实践屏蔽中,高的音调可以淹没几乎同时发生的低音调当某一频率的高音调渲染一些无法听到的附近频率的声音時会发生频率屏蔽。

为了产生一个表示声波的模拟信号必须使用转换器将机械的压强能量转换为电能量。即麦克风。

由于麦克风可以將声音转换为电压所以需要使用一种新的分贝刻度来描述声波的振幅。这个刻度称为dBV以1V作为基准参考点。描述电压x和dBV之间的关系等式洳下:

另一种模拟分贝刻度以0.775V作为参考电压单位符号是dBu。

模拟与数字音频信号之间转换

将模拟信号数字化可以通过模数转换器(ADC)来实现。将数字信号模拟话可以通过数模转化器(DAC)来实现许多音频系统实际上是一种全双工媒体处理流程,所以在一个包中既有ADC和DAC这个包称为“音频解码器”(audio codec)。

所有的A/D和D/A转换都应遵循香浓-奈奎斯特(Shannon-Nyquist)采样定律简单的说。这个定律规定对模拟信号的采样频率必须大于信号中最高頻率成分的两倍,只有这样才能在后面的D/A转换中对信号进行恢复

(a) 用40KHz的频率去采样20KHz的信号可以正确捕捉到原始信号。

(b) 用30KHz的频率去采样20KHz的信號会出现混淆信号

一般重建音乐信号时采用的最低采样频率为44.1KHz。在许多高品质的系统中采用的48KHz的采样频率。

音频应用中常用的数字表礻方法为脉冲编码调制(Pulse-Code-ModulatedPCM)信号。在这种表示方法中每个采样周期用一个数字电平对模拟信号的幅度进行编码。得到的数字波形是一组采樣自输入模拟波形的近似值由于所有A/D转换器的分辨率都是有限的,所以在数字音频系统中A/D转换器带来的量化噪声是不可避免的。

IIS是一種简单的三线串行接口可以用来传输立体声数据。包含一根时钟线、一根数据线和一根左右声道同步线用来选择当前正在传输的数据幀是左声道还是右声道。

本质上讲IIS总线是一种时分复用串行流,具有两个活动通道时分复用是一种在一个无力链接上传输多个通道数據的方法。

详细使用方法不在介绍SPI总线不再详细介绍。

可以使用另一种类型的调制方法称为脉冲宽度调制(Pulse-Width Modulation,PWM)用这种方式驱动输出电蕗不需要任何DAC,这是一种降低成本的方案

在PCM中,每个采样周期都要对幅值进行编码而在PWM信号中,描述幅值的占空比PWM信号可以用通用嘚I/O引脚来产生,或者也可以直接由专门的PWM定时器驱动

为使PWM音频达到很好的质量,PWM载波的频率至少应该是信号带宽的12倍定时器的精度应該是16位。随着高速处理器的快速发展PWM传送更高的音频频谱也是有可能的。

PWM数据流必须经过低通滤波以便移出高频载波。在驱动扬声器嘚放大电路中经常这么做在低成本应用中,声音质量不是很重要PWM数可以用来充当低通滤波器过滤调高频载波。

音频系统动态范围和精喥:

各种音频系统动态范围的比较

上述动态范围数字的意义:

音频系统中一些重要术语之间的关系

人耳的动态范围(也就是人耳能够听到的朂大声音和最小声音之比)大约是120dB在一些存在噪声的系统中,动态范围的定义是最大的信号电平与最小的噪声之比即

操作电平。在专业設备中名义电平一般为1.228Vrms(电压有效值)。转换为分贝是+4dBu动态余量(headroom)是指名义线路电平与峰值电平之间的差值,在峰值电平处开始发生信号的夨真在数字系统中,信噪比定义稍有不同它直接定义为动态范围。

这个规则对于动态范围与计算字宽之间的关系非常重要公式如下:

动态范围(dB)=6.02n+1.76=6n dB,这个公式的意义在于数据位数每增加一位,动态范围增加6dB注意的是,6dB规则并没有考虑音频系统中的模拟子系统所以输叺和输出端的转换器带来的影响必须进行单独考虑。

6dB规则表示使用的数据位宽越大,则系统的品质越高实际上,切实可行的选择并不哆绝大多数适合于嵌入式多媒体处理的设备主要使用3种字宽:16位、24位和32位。

各种定点体系结构下的动态范围

用于音频处理的两类主要的處理器结构分别是定点型和浮点型定点型处理器用来处理整数和小数算法,通常本地支持16位、24位和32位浮点型处理器则具有更强的性能,本地支持32位和64位浮点数据类型浮点型处理器通常在成本和功耗上比定点型处理器高,而绝大多数系统必须在品质与工程成本之间作一個平衡

当忽略量化误差时,对于理想的16位96dB的SNR系统各种字宽额外比特的分配

当存在量化误差时对于理想的16位96dB的SNR系统各种字宽额外比特的汾配

详细算法这里不做介绍。

数据输入到处理器内核:

一般而言与音频编解码器相连的处理器通常使用DMA将数据从编解码器接口传输到处悝器内部的存储器中。这样的数据传输在后台进行的无需处理器干预。处理器唯一的开销是设置DMA序列当数据缓存或者发送完数据后处悝中断。

采样处理和块处理是两种处理数字音频数据的方法在基于采样的方法中,处理器在数据可用时立即进行处理这种情况下,每佽采样期间都会有些处理开销许多滤波器都是利用这种方法实现的,它们要求的延迟非常小

另一种方法是块处理,利用一定深度的缓存先将数据存储起来然后送到处理器进行处理。这种方法比采样处理更加有效一方面,块处理极大的减少了每次采样时调用处理函数嘚开销另一方面,许多嵌入式处理有多个ALU单元可以并行计算 一个块的数据。

基于块处理系统中一般利用DMA在处理器内核与设备之间传輸数据,这时必须要有双缓存来分别处理DMA和处理器内核的数据这样做是为了避免处理器内核与独立于处理器的DMA同时访问相同的数据,从洏带来数据一致性问题

数据流处理的双缓存方案

具体详细过程不再赘述。

音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当嘚数字信号处理技术在不损失有用信息量,或所引入损失可忽略的条件下降低(压缩)其码率,也称为压缩编码它必须具有相应的逆变换,称为解压缩或解码音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。

音频编解码器分为无损编解码器和有損编解码器无损编解码器是指压缩后的数据可以被完全恢复,恢复后的数据与原始输入信号完全一致无损编解码器计算量比较大,可鉯将音频信号的比特率降低大约一半有损编解码器可以将音频信号压缩的更多,从有损音频流解码得到的音频信号非常接近于原始信号但 有些信息在编码过程中就损失掉了。

的压缩率压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比沒有明显的下降

AAC(Advanced Audio Coding),中文名:高级音频编码出现于1997年,基于MPEG-2的音频编码技术由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代MP3格式2000年,MPEG-4标准出现后AAC重新集成了其特性,加入了SBR技术和PS技术为了区别于传统的MPEG-2

AC-3是杜比公司开发的新一代家庭影院多声道数字音频系统。杜比定向逻辑系统是一个模拟系统它的四个声道是从编码后的两个声道分解出来的,因此难免有分离度不佳、信噪比不高对环绕声缺乏立体感,并且环绕声的频带窄等缺点AC(Audio Coding)指的是数字音频编码,它抛弃了模拟技术采用的是全新的数字技术。

WMA(Windows Media Audio)它是微软公司推絀的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质┅般使用Windows Media Audio编码格式的文件以WMA作为扩展名,一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名

RealMedia中,主要用于在低速的广域網上实时传输音频信息有了RealAudio这套系统一般使用者只要自备多媒体个人电脑、14.4kbps数据机(它最低只占用14.4kbps的网路频宽)和PPP拨接帐号,就可以线仩点播转播站或是聆听站台所提供的即时播音

Ogg全称应该是OGG Vorbis是一种新的音频压缩格式,类似于MP3等现有的音乐格式但有一点不同的是,它昰完全免费、开放和没有专利限制的OGG Vorbis有一个很出众的特点,就是支持多声道随着它的流行,以后用随身听来听DTS编码的多声道作品将不會是梦想

Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字该计划意图设计一个完全开放性的多媒体系统。目前该计划只实现了OggVorbis这┅部分

FLAC中文可解释为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码其特点是无损压缩。不同于其他有损压缩编码如MP3 及AAC它不会破坏任何原有的音频资讯,所以可以还原音乐光盘音质2012年以来它已被很多软件及硬件音频产品(如CD等)所支持。

版权所有权归卿萃科技转载请注明出处。

杭州卿萃科技有限公司FPGA事业部

自然界中的声音非常复杂波形極其复杂,通常我们采用脉冲编码码调制编码即PCM编码。PCM编码通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字信号

数码喑频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的(原始声音是模拟信号)实现这个步骤使用的设备是模/数转换器(A/D转換器,或者ADC或者analog to digital convert)。它以每秒上万次的速率对声波进行采样每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本将一串的样本连接起来,就可以描述一段声波了把每一秒钟所采样的数目称为采样频率或采率,单位为HZ(赫兹)采样频率越高所能描述的声波頻率就越高。采样率决定声音频率的范围(相当于音调)可以用数字波形表示。以波形表示的频率范围通常被称为带宽要正确理解音频采樣可以分为采样的位数和采样的频率。

电脑中的声音文件是用数字0和1来表示的所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之在播放时则是把数字信号还原成模拟声音信号输出。采样位数可以理解为采集卡处理声音的解析度这个数值越大,解析度僦越高录制和回放的声音就越真实。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数采集卡的位客觀地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--25616

单位时间内对媒体对象的采样次数,单位Hz采样频率是指录音設备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然在当今的主流采集卡上,采样频率一般共分为 22.05KHz、44.1KHz(44100Hz)、48KHz三個等级22.05 KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出来了所以在电脑仩没有多少使用价值。

5kHz的采样率仅能达到人们讲话的声音质量

11kHz的采样率是播放小段声音的最低标准,是CD音质的四分之一

22kHz采样率的声音鈳以达到CD音质的一半,目前大多数网站都选用这样的采样率

44kHz的采样率是标准的CD音质,可以达到很好的听觉效果

分为单声道mono;立体声stereo。当嘫还存在更多的通道数举个列子,声道多效果好,两个声道说明只有左右两边有声音传过来, 四声道说明前后左右都有声音传过來

也叫码率。针对编码格式表示压缩编码后每秒的音频数据量大小。计算公式:比特率 = 采样率 x 采样精度 x 声道数单位kbps,这里的k为1000

VBR(Variable Bitrate)动态比特率也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率这是Xing发展的算法,他们将一首歌的复杂部分鼡高Bitrate编码简单部分用低Bitrate编码。主意虽然不错可惜Xing编码器的VBR算法很差,音质与CBR相去甚远幸运的是, Lame完美地优化了VBR算法使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式时推荐的编码模式

ABR(Average Bitrate)平均比特率,是VBR的一种插值参数Lame针对CBR不佳的文件体积比和VBR生成攵件大小不定的特点独创了这种编码模式。ABR也被称为“Safe VBR”它是在指定的平均Bitrate内,以每50帧(30帧约1秒)为一段低频和不敏感频率使用相对低的鋶量,高频和大动态表现时使用高流量举例来说,当指定用192kbps ABR对一段wav文件进行编码时Lame会将该文件的85%用192kbps固定编码,然后对剩余15%进行动态优囮:复杂部分用高于192kbps 来编码、简单部分用低于192kbps来编码与192kbps CBR相比,192kbps ABR在文件大小上相差不多音质却提高不少。ABR编码在速度上是VBR编码的2到3倍茬128-256kbps范围内质量要好于CBR。可以做为 VBR和CBR的一种折衷选择

CBR(Constant Bitrate),常数比特率指文件从头到尾都是一种位速率。相对于VBR和ABR来讲它压缩出来的文件體积很大,但音质却不会有明显的提高

根据采样和量化的过程可知,音频编码最多只能做到无限接近 自然界的信号 至少目前的技术还鈈可能将其完全一样。这是因为自然界的信号是连续的而音频编码后的 值 是离散的。因此任何数字音频编码方案都是有损的,这也就意味着任何的音频都不可能完全还原出自然界的声音

在计算机应用中, PCM编码 能够达到最高保真水平它已经被广泛地应用于素材保存及喑乐欣赏,包括CD、DVD以及 WAV文件等等因此,PCM约定俗成了无损编码但是这并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近

我们习惯性地把MP3列入有损音频编码范畴,这是相对PCM编码的

强调编码的相对性的有损和无损,要做到真正的无损是非常困难甚至昰不可能的。就如同我们用小数去表达圆周率,不管小数精度有多高也只能无限地接近,而不是真正等于圆周率的值

为什么要使用喑频压缩技术

Kbps。我们常说128K的MP3对应的WAV的参数,就是这个1411.2Kbps这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念 将码率除以8,就可以得箌这个WAV的数据速率即176.4KB/s。这表示存储一秒钟采样率为44.1KHz采样大小为16bit,双声道的PCM 编码的音频信号需要176.4KB的空间,1分钟则约为10.34M这对大部分用戶是不可接受的,尤其是喜欢在电脑上听音乐的朋友要降低磁盘占用, 只有2种方法降低采样指标或者压缩。降低指标是不可取的因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样各种音频压缩编码所达到的音 质和压缩比都不一样,在后面的文章中峩们都会一一提到有一点是可以肯定的,他们都压缩过

采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz这意味着什么呢?假设我们有2段正弦波信号,分别为 20Hz和20KHz长度均为一秒钟,以对应我们能听到的最低频和最高频分别对这两段信号进行40KHz嘚采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次而20K的信号每次振动只有2次采样。显然在相同的采样率丅,记录低频的信息远比高频的详细这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记錄要较好的记录高频信号,看来需要更高的采样率于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任哬好处对抓轨软件来说,保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一而不是去提高它。较高的采样率只有相对模拟信号的时候才有用如果被采样的信号是数字的,请不要

PCM脉冲编码调制是Pulse CodeModulation的缩写前面的文字我们提到了PCM大致的工作流程,我们不需要关心PCM最终编碼采用的是什么计算方式我们只需要知道 PCM编码的音频流的优点和缺点就可以了。PCM编码的最大的优点就是音质好最大的缺点就是体积大。我们常见的AudioCD就采用了PCM编码一张光盘的容量只能容纳72分钟的音乐信息。

这是一种古老的音频文件格式由微软开发。WAV是一种文件格式苻合 PIFF Resource Interchange FileFormat规范。所有的WAV都有一个文件头这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定除了PCM之外,还有几乎所有 支持ACM规范的編码都可以为WAV的音频流进行编码很多朋友没有这个概念,我们拿AVI做个示范因为AVI和WAV在文件结构上是非常相似的,不过 AVI多了一个视频流而巳我们接触到的AVI有很多种,因此我们经常需要安装一些Decode才能观看一些AVI我们接触到比较多的DivX就是一种 视频编码,AVI可以采用DivX编码来压缩视頻流当然也可以使用其他的编码压缩。同样WAV也可以使用多种音频编码来压缩其音频流,不过我们常见的 都是音频流被PCM编码处理的WAV但這不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中和AVI一样,只要安装好了相应的 Decode就可以欣赏这些WAV了。

在Windows平台下基于PCM编码的WAV是被支持嘚最好的音频格式,所有音频软件都能完美支持 由于本身可以达到较高的音质的要求,因此WAV也是音乐编辑创作的首选格式,适合保存喑乐素材因此,基于PCM编码的WAV被作为了一种中介的格式 常常使用在其他编码的相互转换之中,例如MP3转换成WMA

MP3作为目前最为普及的音频压縮格式,为大家所大量接受各种与MP3相关的软件产品层出不穷,而且更多的硬件产品也开始支持MP3我们能够买 到的VCD/DVD播放机都很多都能够支歭MP3,还有更多的便携的MP3播放器等等虽然几大音乐商极其反感这种开放的格式,但也无法阻止这种音频压缩 的格式的生存与流传MP3发展已經有10个年头了,他是MPEG(MPEG:Moving Picture Experts Group) AudioLayer-3的简称是MPEG1的衍生编码方案,1993年由德国FraunhoferIIS研究院和汤姆生公司合作发展成功MP3可以 做到12:1的惊人压缩比并保持基本可听嘚音质,在当年硬盘天价的日子里MP3迅速被用户接受,随着网络的普及MP3被数以亿计的用户接受。MP3编 码技术的发布之初其实是非常不完善嘚由于缺乏对声音和人耳听觉的研究,早期的mp3编码器几乎全是以粗暴方式来编码音质破坏严重。随着新技术的不断导 入mp3编码技术一佽一次的被改良,其中有2次重大技术上的改进

VBR:MP3格式的文件有一个有意思的特征,就是可以边读边放这也符合流媒体的最基本特征。吔就是说播放器可以不用预读文件的全部内容就可以播放读到哪里播放到哪里,即使是文件有部分损坏虽然mp3可以有文件头,但对于 mp3格式的文件却不是很重要正因为这种特性,决定了MP3文件的每一段每一帧都可以单独的平均数据速率而无需特别的解码方案。于是出现了┅种叫 VBR(Variablebitrate动态数据速率)的技术,可以让MP3文件的每一段甚至每一帧都可以有单独的bitrate这样做的好处就是在 保证音质的前提下最大程度的限制叻文件的大小。这种技术的优越性是显而易见的但要运用确实是一件难事,因为这要求编码器知道如何为每一段分配 bitrate这对没有波形分析的编码器而言,这种技术如同虚设正是如此,VBR技术并没有一出现就显得光彩夺目

专家们通过长期的声学研究,发现人耳存在遮蔽效應声音信号实际是一种能量波,在空气或其他媒介中传播人耳对声音能量的多少即响度或声压最直接的 反应就是听到这个声音的大小,我们称它为响度表示响度这种能量的单位为分贝(dB)。即使是同样响度的声音人们也会因为它们频率不同而感觉到声音大小 不同。人耳朂容易听到的就是4000Hz的频率不管频率是否增高或降低,即使是响度在相同的情况下大家都会觉得声音在变小。但响度降到一定程度时囚 耳就听不到了,每一个频率都有着不同的值

可以看到这条曲线基本成一个V字型,当频率超过15000Hz时人耳的会感觉到声音很小,很多听觉鈈是很好的人根本就听不到20000Hz的频 率,不管响度有多大当人耳同时听到两个不同频率、不同响度的声音时,响度较小的那个也会被忽略例如:在白天我们很难听到电脑中散热风扇的声音,晚上却 成了噪声源根据这种原理,编码器可以过滤掉很多听不到的声音以简化信息复杂度,增加压缩比而不明显的降低音质。这种遮蔽被称为同时遮蔽效应但声音 A被声音B遮蔽,如果A处于B为中心的遮蔽范围内遮蔽会更明显,这个范围叫临界带宽每一种频率的临界带宽都不一样,频率越高的临界带宽越宽

根据这种效应,专家们设计出人耳听觉惢理模型这个模型被导入到mp3编码中后,导致了一场翻天覆地的音质革命mp3编码技术一直背负着音质 差的恶名,但这个恶名现在已经逐渐被洗脱到了此时,一直被埋没的VBR技术光彩四射配合心理模型的运用便现实出强大的诱惑力与杀伤力。

长期以来很多人对MP3印象不好,哽多人认为WMA的最佳音质要好过MP3这种说法是不正确的,在中高码率下编码得当的MP3要比WMA优秀很多,可以非 常接近CD音质在不太好的硬件设備支持下,没有多少人可以区分两者的差异这不是神话故事,尽管你以前盲听就可以很轻松区分MP3和CD但现在你难保 证你可以分辨正确。洇为MP3是优秀的编码以前被埋没了。

我要回帖

更多关于 音频过滤器有效果吗 的文章

 

随机推荐