我两天前刚开始看,借这个贴子与大家探讨AAC(Mpeg2-AAC, MPEG4-AAC), AACplus(现在是V2). 我的Email是blacow86@yahoo.com.cn, 只接受文档资料.
愿意给我14496
AMD1,AMD2的朋友,我先谢过了.
MPEG4 AAC 在MPEG2 AAC上加了PNS(perceptual noise
substitution), 把听不大见的部分躁声发生器代替,
苹果只支持MPEG2 AAC. MPEG4 AAC可以播放MPEG2 AAC, 反之不行. 但PNS也是可选.
MPEG4 audio 与video类似,好象都想写成百科全书, 不是针对某一具体应用.
到part-10 也就是H.264又回复初衷,
AAC Plus也有类似意思,是具体应用.
http://sound.media.mit.edu/mpeg4/audio/general/
MPEG4 audio 有七个子集(MPEG4有八个部分):
1.
2. Speech coding – HVXC (话音:谐波矢量激励编码)
3. Speech coding – CELP (话音:码本激励线性预测)
4. General Audio coding(GA) – AAC,TwinVQ,BASC
5. Structured Audio(SA) (结构化声频工具组. 其中之一是MIDI)
6. Text to Speech Inte*ce (TTSI) (文本-话音接口)
7. Parametric Audio Coding – HILN (参数声频编码 - 谐波和谱线加躁声)
其中,通用编码器(GA)有三类方法可以混用的:
AAC – 是MPEG2 AAC加了PNS
TwinVQ –与AAC类似但用定速率矢量量化取代huffman
BASC – 与AAC类似但用算术编码取代huffman
MPEG4 AAC基于应用目标的不同有多种,这里的object有点象video的profile, 多半是MPEG2 AAC的同类再加MPEG4特有的PNS:
AAC- Main Object, MPEG2 AAC 叫main profile
AAC- Low Complexity, 无长时预测
AAC- Scalable Sampling Rate(SSR),
AAC – Long Term Predictor(LTP), 与Main比是用了MPEG4的长时预测, 运算量少
目标还有Scalable
object, TwinVQ object, CLEP object, HVXC, TTSI, Main Synthetic, Wavetable
Synthetic, General MIDI, Algorithm Synthesis and Audio FX. 上面任何一个加上error resilient又成了新的应用目标. 看得人眼花缭乱.
MPEG4 AAC的其一LC
AAC没有长时预测. 它加了SBR(spectral band replication)后是HE (high efficiency) AAC; MP3加了SBR后是MP3Pro.
SBR可译为"谱带复叠",是把一半的频带用半速AAC编码,另一半(高端)用低性能编码,反正只是色彩罢了.(我自己的话,
7KH以上的声音你听了就明白了). 加了参数编码的HE-AAC又被称为AACplus, 用参数编码这一半,
在AAC译码器中被扔掉, HE-AAC译码器则可用来恢复高端的谱.
在编码器中,是先在频域分析再合成,然后给AAC编码.
另外, 对于采样低于CD的,
1:2选抽和M/S立体声都不用,用参数立体声或单声道.
Core Technologies先提出SBR, 老英做了主观测试(在低码率下专家们推宠主观测试,因为S/N不行了)说是马塞地, 其实裁掉7KHz以上再用AAC已经是BMW了.
主观测试象体*裁判,只不过听众都是业余的,有的还觉得编码后的声音更好.
不管怎么样, 3gpp推崇CT, CT给了X86的源码- 其实关键的库都没给源码 - 等着收钱呢. http://www.3gpp.org
我要是定手机标准, 就不用这家伙,大不了我只用7KHz,
当年电子管收音机的频响不过7KHz. 再说参数编码都有几十年了. 比如Vorbis用VQ也很不错: http://en.wikipedia.org/wiki/Vorbis,
南韩也嫌贵不用,用了MPEG4 BSAC, AC也是要收钱的. 与humman的最小编码位数是1bit相比, AC用一个浮点数编码几个符号,具有更高效率.
- 评论[支持者: 0 人 ,反对者: 0 人,中立者: 0 人] 查看评论信息




