视频会议的采集卡在采集摄像机输出的VGA信号等模拟信号转录到计算机内部让计算机处理视频信息时首先有一个视频信号的数模转换过。
视频采集卡是从动态视频中实时或非实时捕获图像并存储。它可以将摄像机、录像机和其它视频信号源的模拟视频信号转录到计算机内部,也可以用摄像机将现场的图像实时输入计算机。视频采集卡能在捕捉视频信息的同时获得伴音,使音频部分和视频部分在数字化时同步保存、同步播放。
视频的数字化过程AD转换
要让计算机处理视频信息,首先要解决的是视频数字化的问题。视频数字化是将模拟视频信号经模数转换和彩色空间变换转为计算机可处理的数字信号,与音频信号数字化类似,计算机也要对输入的模拟视频信息进行采样与量化,并经编码使其变成数字化图像。
视频会议把模拟音频转成数字音频的过程称作采样,简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。
在模拟视频中,采样率定义为帧频和场频,而不是概念上的像素时钟。
采样率和采样大小(位/bit)
频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。
采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级。
采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,单位用赫兹(Hz)来表示。采样频率的倒数是采样周期(也称为采样时间),它表示采样之间的时间间隔。
采样定理表明采样频率必须大于被采样信号带宽的2倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。
举个例子,假定信号的带宽是100Hz,那么为了避免出现混叠现象,采样频率必须大于200Hz。换句话说,采样频率必须至少是信号中最大频率分量频率的2倍,否则就不能从信号采样中恢复原始信号。
根据奈魁斯特(NYQUIST)采样定理,用2倍于一个正弦波的频率进行采样就能完全真实地还原该波形,因此一个数码录音波的采样频率的取值直接关系到它的最高还原频率指标。
例如用44.1KHZ的采样频率(采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级)进行采样,则可还原为最高22.05KHZ的频率-----这个数值略高于人耳的听觉极限44.1KHZ的还原频率足已记示和真实再现世界上所有人再能辩的声音,音频信号的频率一般达到20Hz,因此其采样频率一般需要40Hz。而人耳收听的范围只能到23Khz以下,所以CD的采样率才是44.1Khz。22Khz×2=44Khz,考虑到一定的余量采用44.1Khz.
所以CD音频的采样规格定义为16bit。常见的 CD,采样率为44.1kHz,
当然,即使在最理想的环境下用现实生活中几乎不可能制造的高精密电子元器件真实地实现了16bit的录音,仍然还是会受到滤波和声特定位等问题带来的干扰。人们从中还是能察觉出一些微小的失真,正因如此,很多专业数码音频系统目前已经开始使用18bit甚至24bit的采样规格进行录音和回放了。
在模拟视频中,采样率定义为帧频和场频,而不是概念上的像素时钟。图像采样频率是传感器积分周期的循环速度。由于积分周期远远小于重复所需时间,采样频率可能与采样时间的倒数不同。
* 50 Hz - PAL 视频
* 60 / 1.001 Hz - NTSC 视频
当模拟视频转换为数字视频的时候,出现另外一种不同的采样过程,这次是使用像素频率.
采样率和采样大小的值越大,记录的波形更接近原始信号。
比特率是指将数字声音由模拟格式转化成数字格式的采样率,采样率越高,还原后的音质就越好。比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大。也就是说越高文件越大,但是越加的清晰
采样率值×采样大小值×声道数bps
音频采样率、采样精度与每分钟记录波形文件大小的关系
采样率 16bit 24bit
11kHz单声道 1.3MB/min 1.9MB/min
11kHz立体声 2.5MB/min 3.8MB/min
22kHz单声道 2.8MB/min 3.8MB/min
22kHz立体声 5.0MB/min 7.6MB/min
44kHz单声道 5.0MB/min 7.6MB/min
44kHz立体声 10.1MB/min 15.1MB/min
48kHz单声道 5.5MB/min 7.6MB/min
48kHz立体声 11.0MB/min 16.5MB/min
96kHz单声道 11.2MB/min 16.5MB/min
96kHz立体声 22.0MB/min 33.0MB/min
192kHz单声道 22.0MB/min 33.0MB/min
192kHz立体声 44MB/min 66.0MB/min
一个采样率为44.1KHz,采样大小为16bit,双声道的 PCM编码的WAV文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3,对应的WAV的参数,就是这个1411.2 Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。
位速是指在一个数据流中每秒钟能通过的信息量;Kbps表示“每秒千字节数”,因此数值越大表示数据越多,位速越高,信息量越大!
将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M.