音频基础概念

作者&投稿:赫泰 (若有异议请与网页底部的电邮联系)
~

人类耳朵的听力有一个频率范围,大约是20Hz~20kHz

通过采样和量化技术获得的离散性(数字化)音频数据。计算机内部处理的是二进制数据,处理的都是数字音频,所以需要将模拟音频通过采样、量化转换成有限个数字表示的离散序列 (即实现音频数字化)

对于高质量的音频信号,其频率范围(人耳能够听到的频率范围)是20Hz~20kHz,所以采样频率一般为 44.1kHz ,这样就可以保证采样声音达到20kHz也能被数字化,从而使得经过数字化处理之后,人耳听到的声音质量不会被降低。而所谓的44.1kHz就是代表1秒会采样44100次。

量化是指在幅度轴上对信号进行数字化,比如用16比特的二进制信号来表示声音的一个采样。

表示一个样本的二进制的位数,即样本的比特数。量化是将经过 采样得到的离散数据转换成二进制数的过程 ,量化深度表示每个采样点用多少比特表示,在计算机中音频的量化深度一般为4、8、16、32位(bit)等。例如:量化深度为8bit时,每个采样点可以表示256个不同的量化值,而量化深度为16bit时,每个采样点可以表示65536个不同的量化值。量化深度的大小影响到声音的质量,显然, 位数越多,量化后的波形越接近原始波形 ,声音的质量越高,而需要的存储空间也越多

就是按照一定的格式记录采样和量化后的数字数据,比如 顺序存储或压缩存储。

==比特率==(它用于衡量音频数据单位时间内的容量大小)

是实现声波/数字信号相互转换的一种硬件。声卡的基本功能是把来自话筒、磁带、光盘的原始声音信号加以转换,输出到耳机、扬声器、扩音机、录音机等声响设备,或通过音乐设备数字接口(MIDI)使乐器发出美妙的声音。

==无损压缩== 是指解压后的数据可以完全复原。在常用的压缩格式中,用得较多的是有损压缩,

==有损压缩== 是指解压后的数据不能完全复原,会丢失一部分信息,压缩比越小,丢失的信息就越多,信号还原后的失真就会越大。

根据不同的应用场景(包括存储设备、传输网络环境、播放设备等),可以选用不同的压缩编码算法,如PCM、WAV、AAC、MP3、Ogg等。

<u> 压缩编码的原理实际上是压缩掉冗余信号,冗余信号是指不能被人耳感知到的信号 </u>

而WAV编码的一种实现(有多种实现方式,但是都不会进行压缩操作)就是 在PCM数据格式的前面加上44字节,分别用来描述PCM的采样率、声道数、数据格式等信息。

MP3具有不错的压缩比,使用LAME编码(MP3编码格式的一种实现)的中高码率的MP3文件,听感上非常接近源WAV文件,当然在不同的应用场景下,应该调整合适的参数以达到最好的效果。

特点 :音质在128Kbit/s以上表现还不错,压缩比比较高,大量软件和硬件都支持,兼容性好。

适用场合 :高比特率下对兼容性有要求的音乐欣赏。

AAC是新一代的音频有损压缩技术,它通过一些附加的编码技术(比如PS、SBR等),衍生出了LC-AAC、HE-AAC、HE-AAC v2三种主要的编码格式

特点 :在小于128Kbit/s的码率下表现优异,并且多用于视频中的音频编码。

适用场合 :128Kbit/s以下的音频编码,多用于视频中音频轨的编码。

Ogg是一种非常有潜力的编码,在各种码率下都有比较优秀的表现,尤其是在中低码率场景下。Ogg除了音质好之外,还是完全免费的,这为Ogg获得更多的支持打好了基础。Ogg有着非常出色的算法,可以用更小的码率达到更好的音质,

特点 :<u>可以用比MP3更小的码率实现比MP3更好的音质</u>,高中低码率下均有良好的表现,兼容性不够好,流媒体特性不支持。

适用场合 :语音聊天的音频消息场景。

(Moving Picture Experts Group,动态图像专家组)是ISO(International Standardization Organization,国际标准化组织)与IEC(International Electrotechnical Commission,国际电工委员会)于1988年成立的专门针对运动图像和语音压缩制定国际标准的组织。

Acc一个音频帧包含1024个采样点,MP3一个音频帧包含1152个采样点。

音频帧的播放时间

在音序器软件中看到的一条一条的平行“轨道” 。每条音轨分别定义了该条音轨的属性,如音轨的音色,音色库,通道数,输入/输出端口,音量等。

当使用音序器时,一条音轨对应于音乐的一个声部,它把 MIDI 或者音频数据记录在特定的时间位置。每一音轨可以定义为一种乐器的演奏。 所有的音序器都可以允许多音轨操作,这就意味着一首歌所有的音轨,无论是 MIDI 还是音频都能同时播放。

指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号 ,所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。

从双声道开始,声音在录制过程中被分配到两个独立的声道,从而达到了很好的声音定位效果。这种技术在音乐欣赏中显得尤为有用,听众可以清晰地分辨出各种乐器来自的方向,从而使音乐更富想象力,更加接近于临场感受。

记录声音时,如果每次生成一个声波数据,称为单声道;每次生成两个声波数据,称为双声道。使用双声道记录声音,能够在一定程度上再现声音的方位,反映人耳的听觉特性。

音频采样率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。在当今的主流采集卡上,采样频率一般共分为11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五个等级

频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富, 为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。




初中数学频数的概念
频数分布直方图的特点:①能够显示各组频数分布的情况;②易于显示各组之间频数的差别。相关概念:组数:在统计数据时,我们把数据按照不同的范围分成几个组,分成的组的个数称为组数。组距:每一组两个端点的差。制作频数分布直方图的步骤:(1)计算极差(即最大数据与最小数据之差)。(2)确定组距...

频数的概念是什么?
频数:是指在一系列重复的试验中,某一个参数发生的次数 如:投掷一枚硬币10000次,其中正面向上的次数为5000次,那么我们也可以说 正面向上的频数为5000

基频是什么意思
除了基频,音乐和声音处理领域还有很多其他的频率术语。例如,谐波是基频的整数倍,它们形成了声音信号的泛音列。此外,还有倍频、分数倍频等概念,它们都是用来描述声音信号中不同频率成分的重要指标。在音乐和声音处理领域,基频的测量和分析是一项重要的任务。通过测量基频,可以了解声音信号的基本特征和性质...

60hz什么意思
60Hz指的是频率。以下是详细解释:1. 基础概念:Hz是频率的单位,全称为赫兹。频率是指单位时间内周期性变化的次数。在电力系统和电子领域中,频率是描述交流电周期性变化快慢的一个参数。2. 60Hz的含义:60Hz表示交流电的周期性变化每秒发生60次。这是一个常见的频率标准,尤其在许多国家的电力系统,例如...

无线通信中所说的频率是一种什么概念?
频率是信号波形每秒钟内重复的次数,无线通信中的波形通常是正弦波。频率为1K的信号,就是每秒内,信号包含1000个正弦波 无线信号的频率有严格的划分,不能随便使用,比如手机只能使用800MHz等 而蓝牙只能使用2.4GHz 不同的频率,由于信号波长不同,波长=光速\/频率 特性也不同,分别用于不用的领域 ...

噪声频谱的基本概念是什么?
频谱定义:\\r\\n\\r\\n频谱就是频率的分布曲线,复杂振荡分解为振幅不同和频率不同的谐振荡,这些谐振荡的幅值按频率排列的图形叫做频谱。\\r\\n\\r\\n噪声的频谱:\\r\\n\\r\\n在弹性媒质中,物体的机械振动由近及远的传播过程称为声波。由于声源的振动,使的组成媒质的微粒在原有的杂乱运动中,附加一个...

什么是基频,倍频,合频,泛频峰
在构成一个复音的若干个音中,基音的频率最低,强度最大。基频的高低决定一个音的高低。在电子电路中,产生的输出信号频率是输入信号频率的整数倍称为倍频。合频,两个或两个以上的基频,或基频与倍频的结合。泛频峰,吸收峰称为差频峰,合频峰与差频峰统称为泛频峰。 ...

光流(Optical flow)-视频分析基础概念
光流 是空间运动物体在 观察成像平面 上的像素运动的 瞬时速度 ,是利用图像序列中像素在时间域上的变化以及相邻帧之间的 相关性 来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。一般而言,光流是由于场景中前景目标本身的移动、相机的运动,或者两者的共同运动所...

频率,频点,频点号各个是什么概念
频率:物质在1秒内完成周期性变化的次数叫做频率,常用f表示。(这里指无线信号的发射频率)频点是给固定频率的编号。频点号:取代频率来指定收发信机组的发射频率

频数和频率的概念,以及它们之间的关系
CPU主频,就是CPU运算时的工作频率,在单核时代它是决定CPU性能的最重要指标,一般以MHz和GHz为单位,如Phenom II X4 965主频是3.4GHz。由于CPU发展速度远远超出内存、硬盘等配件的速度,于是便提出外频和倍频的概念,它们的关系是:主频=外频x倍频。而我们常说的超频,就是通过手动提高外频或倍频来...

霍州市14797857172: 什么是低音,中音,高音,怎么区分,求解释,谢谢!
赵倩易妥: 20Hz~40Hz 超低音.能控制雷声,低音鼓等,能使声音强劲有力. 40Hz~150Hz 低音.是声音的基础部分,占整个音频能量的70%. 150Hz~500Hz 中低音.是声音的结构部分. 500Hz~2kHz 中音. 2kHz~5kHz 中高音.弦乐的特征音. 5kHz~8kHz 高音. 8kHz~20kHz 极高音.特征清澈纤细.

霍州市14797857172: 声音格式的基本概念是什么?
赵倩易妥: 简单地说,数字音频的编码方式就是数字音频格式,我们所使用的不同的数字音频设备一般都对应着不同的音频文件格式

霍州市14797857172: 请问什么是脉冲,什么是音频 -
赵倩易妥: 脉冲就是脉博的跳动冲击形成的波形,可以分为好多种,可以控制模拟电路和数字电路,大多常见的是汽车的里程脉冲和变频器的PAM控制.我们自以为知道什么是音频,可是我们所知道的音频将要永...

霍州市14797857172: 左音道和右音道是什么意思? -
赵倩易妥: 音响市场上的各种声道数的AV功放机,有5.1、6.1、7.1、8.2等.这些数字代表了什么?请详细给介绍下.答:5.1声道:即Dolby Digital5.1和DTS5.1两种数字多声道环绕声音频格式.它具有左右两路主声道、中置声道、左右两路环绕声道和一...

霍州市14797857172: 什么是5.1声道,2.0声道,是什么意思,是不是频率 -
赵倩易妥: 简单说2.1就是两个高音音箱+一个低音音箱5.1就是五个高音音箱+一个低 现在还有7.1的了 声道数 声卡所支持的声道数是衡量声卡档次的重要指标之一,从单声道到最新的环绕立体声,下面一一详细介绍: 1.单声道 单声道是比较原始的声音复...

霍州市14797857172: 音频编码基本概念介绍有哪些?
赵倩易妥: 不过,虽然参数编码的音质比较低,但是保密性很好,一直被应用在军事上

霍州市14797857172: 语音的基本概念 -
赵倩易妥: 语音即语言的声音,它是语言符号系统的载体. 语音由人的发音器官发出,负载着一定的语言意义. 语言依靠语音实现它的社会功能.

霍州市14797857172: 谁能讲解下音频剪辑的具体含义? -
赵倩易妥: 音频剪辑和视频剪辑其实都属于剪辑范畴之内,但是又略有不同. 如果说单独是剪辑的话,那只不过是将几段不同的音频素材拼接在一起,所以我认为那个公司要求你的应该是会音频编辑. 音频编辑其实蛮有趣的,它包括了上面说过的音频剪...

霍州市14797857172: 多媒体的定义 -
赵倩易妥: 多媒体的含义说来话长了,他的范围比较广,我认为很难甚至根本不能用一句话来准确定义,多媒体就是指很多媒体啊?关键词是媒体,只要搞懂媒体是什么就基本弄懂其含义了.我先用书上的原话表述一下媒体的基本概念: 媒体又称为媒介,...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网