MPEG标准制定方法(mpeg编码标准)

小多多 • 2021年12月13日下午6:34 • 杂谈

mp3 编码

在MPEG文件中，没有主标头，因为MPEG的音频文件是由一系列被称为帧的较小部分组成的。每个帧都是一个具有自己标头和音频信息的数据块。

Layer II,II,III的音频帧头都是相同的，不同之处体现在音频数据的编码方式。帧本身是由slot组成的。Layer I的slot大小是4字节，其余情况是1字节。

除了Layer之外，MPEG音频本身也有3个版本，这个几个版本的不同之处体现在能处理的采样率不同(参考表2.1.2)。MPEG 1 (ISO/IEC 13818-3) 和MPEG2(ISO/IEC 11172-3)是ISO标准. MPEG2.5对MPEG2进行的非官方的扩展，它是为了支持更低的采样率。MPEG2/2.5 也常被简称为LSF（Low SamplingFrequencies），既低采样率

对于Layer I和Layer II，帧是完全彼此独立的，因此您可以剪切MEPG音频文件的任何部分并正确的播放。然后，播放器将从发现的第一个完整有效的帧开始播放。但是，Layer III,帧不总是独立的，因为它可能使用了byte resevoir，这是一种内部缓冲区，因此帧之间通常是相互依赖的。在最坏的情况下，可能至少需要输入9个帧才能解码单个帧。

如果你需要检索有关MPEG的音频文件的信息，那么可以简单的找到第一帧，然后从它的header中获取信息。除比特率外，其他帧中的信息应该与第一个帧是一致的，因为可能当前是VBR的文件。在VBR的文件中，可以在每个帧中更改比特率。例如，为了在整个文件中保持音乐的高质量，当音乐比较复杂时就需要更多的位来做编码

帧头本身的长度是32位的(4字节)。帧头的前十二位(在MPEG2.5扩展的情况下为前十一位)始终设置为1，称为帧同步。帧还可能有可选的CRC校验和。它长16位，如果存在，则紧跟在帧头之后。CRC之后就是音频数据。通过重新计算CRC并将值与文件中的值进行比较，就可以检查比特流在传输期间是否已经被更改。

一个文件可以被编码成恒定比特率（CBR）或可变比特率（VBR），这意味着每帧可以有不同的比特率。可变比特率的质量往往比恒定比特率编码的文件更高，因为他们可以在需要的地方使用更高的比特率。

MP3文件的整体结构:

[ID3 V2] | [APE 头]: 可选
- ID3 V2的头，大多数最新的MP3，都有这个头
- 用于APE格式的头，现在也用于MPEG
第一帧
- MPEG 音频头, 通常大小为4字节.（当Protection bit==0时，帧头后会有16bit=2byte的CRC，此时帧头大小为6字节）
- 边信息，9/17/32 字节
- [Xing 头]: 可选 8－120字节，如果是VBR，多数都有此Xing头，而且只有第一帧有
- 音频数据
第二帧
- 帧头
- 边信息
- 音频数据
第三帧
- 帧头
- 边信息
- 音频数据
最后一帧
- 帧头
- 边信息
- 音频数据
[TAG]: 可选。128字节的ID3 V1信息，如果没有前面的ID3 V2，多数都有这个ID3 V1的头

mp3帧头编码

起始位置0位高位开始

起始位置

大小

位置

描述

31-21

帧同步标识，11个‘1’。用于定位帧头起始位置

20-19

MPEG音频版本

18-17

Layer序列号

Protection bit

15,12

比特率

11-10

采样率

Padding bit的定义

保护位

7-6

channel模式

5-4

只用于Joint stereo 模式扩展

版权位 0:无版权 1:有版权

原始位 0:原始媒体的副本 1:原始媒体

1-0

Emphasis

MPEG音频版本

设置值

描述

MPEG version2.5

保留

MPEG version2

MPEG version1

Layer序列号

设置值

描述

保留

Layer III

Layer II

Layer I

Protection-bit

设置值

描述

protected by 16 bit CRC following header

no CRC

比特率

bits

V1,L1

V1,L2

V1,L3

V2,L1

V2, L2 & L3

0000

free

0001

0010

0011

0100

128

0101

160

0110

192

0111

224

112

1000

256

128

112

128

1001

288

160

128

144

1010

320

192

160

1011

352

224

192

176

112

1100

384

256

224

192

128

1101

416

320

256

224

144

1110

448

384

320

256

160

1111

bad

NOTES: All values are in kbps

V1: MPEG Version 1
V2: MPEG Version 2 and Version 2.5
L1: Layer I
L2: Layer II
L3: Layer III
“free”：: free fromat. free bitrate必须保持恒定，并且必须小于允许的最大的比特率. 解码器不需要支持free bitrate的流
“bad”: 意思是这个值是不被允许的.

MPEG文件可能具有可变的比特率(VBR)。每一个帧可以用不同的比特率来创建。这是可以在所有的layer中使用。Layer III必须这个方式，Layer I 和 Layer II 解码器可以选择支持针对Layer II，不允许使用比特率和模式的一些组合。下面是一些允许的组合

bitrate

单通道

立体声

intensity stereo

dual channe

free

yes

112

yes

128

yes

160

yes

192

yes

224

yes

256

yes

320

yes

384

yes

采样率

抽样速率指定每秒钟有多少个样本被记录。每个MPEG版本可以处理不同的samplingrates。

采样率索引

MPEG-1 (Hz)

MPEG-2 (Hz)

MPEG-2.5 (Hz)

44100

22050

11025

48000

24000

12000

32000

16000

8000

reserved

Padding-bit

如果设置了，则用一个slot填充数据(slot对框架大小的计算很重要) Layer I的slot大小是4字节，其余情况是1字节。

设置值

描述

没有填充

使用一个额外的slot填充数据

channel模式

设置值

描述

立体声

Joint stereo

Dual channel(2 mono channels)

Single channel(mono)

注意:双通道文件由两个独立的单声道组成。每一个都只使用了文件的一半比特率。大多数解码器将其输出为立体声，但情况并非总是如此。使用一个例子是在相同的比特流中承载了两个不同语言的语音，那么解码器需要仅解码所选择的语言进行播放

模式扩展

扩展模式被用来增加了一些没有在立体声效果使用的信息，从而减少了所需的位。这些位由在Joint stereo模式下的编码器动态的确定，每一个帧的Joint stereo都可以改变，甚至可以打开或者关闭

MPEG文件的整个的频率范围分为了多个子带，共有32个子带。对于Layer I和Layer II来说两个位确定了当应用intensity stereo时的频率范围（频带）。针对Layer III，这两个位决定了使用哪一种类型的joint stereo（intensity stereo或者m/s stereo）. 频率范围由解压缩算法来确定

设置值

Layer I & II

bands 4 to 31

bands 8 to 31

bands 12 to 31

bands 16 to 31

Layer III:

Intensity stereo

MS stereo

off

Emphasis

设置值

描述

none

50/15 ms

reserved

CCIT J.17

MP3边信息

边信息紧接着帧头。它包含了一些解码器会用到的一些信息，用于解码器控制音频流的播放，但不包含实际的音频数据。下表显示了所有Layer III文件的边信息的大小

模式

MPEG 1

MPEG 2/2.5 (LSF)

立体声,联合立体声,双通道

Mono

对于Layer I的文件，你必须考虑到扩展模式（见表2.1.6）。然后你可以以下公式计算出用于计算CRC的比特位的数量：

4 * ( 声道数 * bound of intensity stereo + (32 – bound of intensity stereo) );

这可以被读成两倍的立体声子带加上单子带的数量和结果乘以4。对于简单的mono帧，这等于128，因为通道的数目是1，而强度立体声的边界是32，这意味着没有强度立体声。对于立体帧，这是256。有关更多信息，请查看类CMPAFrame中的rc代码。

MP3解析的解析

基于MPG123库

核心数据结构

typedef struct mpstr_tag {    struct buf *head, *tail; /* buffer linked list pointers, tail points to oldest buffer */    int     vbr_header;      /* 1 if valid Xing vbr header detected */    int     num_frames;      /* set if vbr header present */    int     enc_delay;       /* set if vbr header present */    int     enc_padding;     /* set if vbr header present */    /* header_parsed, side_parsed and data_parsed must be all set 1       before the full frame has been parsed */    int     header_parsed;   /* 1 = header of current frame has been parsed */    int     side_parsed;     /* 1 = header of sideinfo of current frame has been parsed */    int     data_parsed;    int     free_format;     /* 1 = free format frame */    int     old_free_format; /* 1 = last frame was free format */    int     bsize;    int     framesize;    int     ssize;           /* number of bytes used for side information, including 2 bytes for CRC-16 if present */    int     dsize;    int     fsizeold;        /* size of previous frame, -1 for first */    int     fsizeold_nopadding;    struct frame fr;         /* holds the parameters decoded from the header */    struct III_sideinfo sideinfo;    unsigned char bsspace[2][MAXFRAMESIZE + 1024]; /* bit stream space used ???? */ /* MAXFRAMESIZE */    real    hybrid_block[2][2][SBLIMIT * SSLIMIT];    int     hybrid_blc[2];    unsigned long header;    int     bsnum;    real    synth_buffs[2][2][0x110];    int     synth_bo;    int     sync_bitstream;  /* 1 = bitstream is yet to be synchronized */    int     bitindex;    unsigned char *wordpointer;    plotting_data *pinfo;    lame_report_function report_msg;    lame_report_function report_dbg;    lame_report_function report_err;} MPSTR, *PMPSTR;

数据结构关键字段说明:

struct buf *head, *tail
- 这是一个字符串双向链表
- head 是外部请求输入的buffer
- tail 是获取的之前的buffer，解析的时候从tail开始。解析后会更新pos位置
wordpointer是指向bsspace的指针
- decodeMP3_clipchoice中每次计算出头的大小，side info的大小，data的大小，都会复制到这个指针的内存里面，使用copy_mp来复制，复制的源是tail中的数据
- 消费者在commong.c中的一系列的getbits函数，这些函数会更新bitindex以及wordpointer的指向getbitsgetbits_fastget_leq_8_bitsget_leq_16_bits
bsspace是位流的空间

decodeMP3_clipchoice是核心的入口函数

关键的流程解析：

addbuf
- 将输入的需要解码的数据，插入到head的buffer中

小多多创始人

0 0

网页设计与制作模板(视频网站设计的意义)

其实对于网站模板作技巧，目前有两种，一种是直接通过可视化网站编辑系统制作模板。另一种是直接在网上下载成型的模板进行修改就可以。那么网站模板制作技巧有什么呢？针对网站模板的制作技巧，…

小多多
杂谈 2021年12月13日
二次方程计算器过程（万能科学计算器在线使用）

2018年1月份五项学科竞赛的大幕开启，这对于关注学科竞赛是学子们来说都知道学科竞赛是锻炼人智力，超出课本范围的一种特殊的考试。而作为其中的一科化学竞赛，近几年的真题或者模拟题，都…

小多多
2021年12月13日 • 杂谈
北京市电子职称证书查询系统网址（怎么领取电子证书）

纸质版职称证书不慎遗失没来得及补办？刚考试合格纸质版的职称证书还没有去领取？关于启用电子版职称证书的好消息~~市人力社保局在官网公布了《北京市人力资源和社会保障局关于启用北京市电子…

季候
杂谈 2022年4月8日
赣州方特游乐园春节要门票吗

赣州方特游乐园春节是需要门票的，春节期间赣州方特游乐园属于正常营业时间段，标准票价为280元/人，老人和儿童票价为199元/人，每张成人票，可以携带一位1.1米以下的儿童入园。赣…

季候
杂谈 2022年4月6日
适合小县城的童装品牌(童装品牌排行榜有哪些)

美特斯·邦威 “美特斯·邦威”是美特斯邦威集团自主创立的本土休闲服品牌。美特斯邦威集团公司于1995年创建于中国浙江省温州市，主要研发、生产、销售美特斯·邦威品牌休闲系列服饰。品…

小多多
2021年12月13日 • 杂谈
苹果系统录屏怎么设置（苹果电脑录屏操作流程）

第一步：点击手机“设置” 第三步：点击“录制屏幕”前面的绿色➕ 第四步：手机屏幕最上面下拉打开控制界面，找到图中标记的按钮，点击就可以开始录制了，会有一个三秒倒计时不要着急。

小多多
杂谈 2021年12月13日
信用卡安全码在哪里(信用卡安全码查询方法)

信用卡安全码是进行网络或电话交易时信用卡的安全码。通常在信用卡上打印3或4位数字，并且不同类型的卡的打印位置会有所不同。通常用于验证交易过程中付款人是否拥有信用卡使用权，从而防止信用卡欺诈。信用卡安全码是信用卡上的一组3或4位数字。生成方法是银行提取卡的帐号，有效期和服务代码，进行排列，然后通过一系列复杂的算法进行计算。生成此组编号后，只有发卡行和银行卡持有人知道号码是多少。

小多多
杂谈 2022年2月13日
西安四大好玩景点你去过了吗（西安周边游推荐）

春暖花开，小伙伴们都安排好出去游玩的计划了吗？疫情期间，还是尽量去人少的地方比较安全，丝路君给大家整理了西安周边比较小众的旅游景点和线路，不用人挤人，还能看到好风景，收藏好了趁着空…

季候
2022年4月8日 • 杂谈
地图更新方法（2021最新版北斗高清卫星地图）

据外媒报道，谷歌今日宣布了对Live View（实时视图）的一些更新。Live View是谷歌应用去年正式推出的增强现实的步行指南。Live View通过使用用户手机的摄像头和GP…

小多多
杂谈 2021年12月13日
杂谈

js创建数组的几种方式（javascript定义数组的方法）

数组是用单一的变量名关联数值的一个序列，是串起数据的珍珠链。数组提供了一种快速、方便地管理一组相关数据的方法，通过数组可以对大量性质相同的数据进行存储、排序、插入及删除等操作。可…

小多多
2021年12月13日
肇庆新区西部华侨城发展進展如何

最近进展整体项目进度完成了30%，预计需要到2023年可以整体完工，并且给可以开业运营。肇庆新区西部华侨城项目里规划了卡乐星球、卡乐产业基地、岭南水街、高端人居等多元业态，是未来链…

季候
杂谈 2022年4月6日
一键将照片秒变卡通，怎么把照片一键变成漫画

近期爆火的照片变漫画效果该如何制作？今天就来教大家一个方法，无需Photoshop和绘图工具即可一键生成漫画，让照片充满高级感！话不多说，先上图！首先，我们需要借助一款功能强大的…

季候
2022年4月8日 • 杂谈
电脑主机功率计算(如何计算电脑功耗比较好)

工作中有同事问我，一台电脑一天能用几度电？我大概地给他说了一个数，然后考虑了一下就准备写一下这件事：一台电脑到底功耗是多少，也就是用多少度电。首先来看一下电脑耗电的几个主要部件：…

小多多
杂谈 2021年12月13日
郴州十大高中排行榜郴州市第二中学上榜第一风景秀美

　　教育对一个人的成长非常重要，我国拥有完善的义务教育体系，同时还有一流的教育基础和教育质量，尤其是有许多知名的高中学校，那么今天就让我们来一起看一看郴州十大高中排行榜吧！郴州十…

海淘直接
2022年6月22日 • 杂谈
嘉年华抖音多少钱主播能得多少，人民币3000元一个(主播能获得1400元)

抖音是目前许多人都经常使用的一款短视频软件，许多人都会在里面看直播，直播是可以给主播打赏礼物的，那么抖音直播礼物嘉年华抖音多少钱一个？其实3000元人民币才能够买到一个，打赏给主播…

海淘直接
杂谈 2022年7月16日

发表回复

登录后才能评论

MPEG标准制定方法(mpeg编码标准)

mp3 编码

mp3帧头编码

MPEG音频版本

Layer序列号

Protection-bit

比特率

采样率

Padding-bit

channel模式

模式扩展

Emphasis

MP3边信息

MP3解析的解析

相关推荐

发表回复