最简单的iOS 推流代码,视频捕获,软编码(faac,x264),硬编码(aac,h264),美颜,flv编码,rtmp协议,陆续更新代码解析,你想学的知识这里都有,愿意懂直播技术的同学快来看!!
源代码:https://github.com/hardman/AWLive
前面介绍了如何捕获音视频原始数据,介绍了yuv和pcm。
下面来介绍一下我们的想要转换的目标音视频格式:h264,aac,flv。
什么是h264?
这里就不贴名词解释了。
说明一下,为什么需要这种格式。
其实除了h264格式之外,视频格式有很多种,出现这些格式原因无非有3种。
1. 压缩尺寸。我们来计算一下:yuv420格式,宽度为480,高度为320的视频,每一帧 需要 480*320*3/2 = 230400 字节。假设视频每秒20帧,那么30秒的视频 是 230400 * 20 * 30 = 138240000 字节 大约138M。你可能觉得不是很大,但是这个分辨率同样清晰度的h264视频可能只需要1-2M左右(当然也跟码率和I帧数量等因素有关)。2. 为了与当前产品业务匹配,或者版权专利等原因,创造一种独特的格式。比如QuickTime,WMV等。3. 对当前技术的改进。h264正是对h263的改进。复制代码
h264 怎么压缩视频数据呢?
最重要的一点是将视频帧分为关键帧和非关键帧。
关键帧的数据是完整的。包含了所有的颜色数据。这样的视频帧称为I帧。
非关键帧数据不完整,但是它能够根据前面或者后面的帧数据,甚至自己的部分帧数据,将自身数据补充完整。这种视频帧被称为 B/P 帧。
总体来说,h264跟yuv相比,最大的不同就是它是压缩的(通常此过程称为编码,不只是简单的压缩)。
什么是aac
aac同h264性质一样,它也是pcm的压缩(编码)格式。
mp3大家都听说过,以前听歌保存到电脑里的歌曲90%都是mp3格式。
aac 相对 mp3来说,是更先进的压缩格式。
什么是flv
h264是视频编码格式。
aac是音频编码格式。
除了这两种格式之外,还有一种将视频和音频合成(muxer 这个词会在相关代码中经常出现)在一起的格式。
比如:mp4,avi,rmvb,flv。
flv 是一种简单的视频合成格式。
它支持指定的音视频格式,如:h263,h264,VP6 及 AAC,MP3,Nellymoser等。
简单说来,flv的组成如下:
flv header + script tag + video tag + audio tag + ... + video tag + audio tag复制代码
flv由 flv header 和无数的tag组成的。
flv header 内容是固定的。
一个tag就像是一个数组中的元素。是一个单独的储存了信息的数据块。
script tag 内存储了视频相关信息,如:宽高,码率,fps,文件大小,音频信息等等。
video tag 中 存储的是完整的视频压缩格式的一帧数据,如h264数据。
audio tag 中 存储的是完整的音频压缩格式的一帧数据,如 aac数据。
这样把所有数据拼接在一起,写入文件。这个文件就是flv格式。可以使用播放器播放了。
而flv刚好支持 h264 和 aac。
为什么介绍flv呢?
因为rtmp协议所传输的视频流,就要求是flv格式。
所以,程序从相机和麦克风捕获到音视频数据后,分别转成 aac和h264格式的音视频帧。
然后将aac和h264音视频帧合成flv格式的视频后发送到rtmp服务器。客户端就可以播放我们推的流了。
注:上述内容不一定够精确,以容易理解为上。