<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom"><title type="text">博客园_刘品</title><subtitle type="text">学以致用---博主简介：专注语音数字信号处理方面的研究以及算法在手机平台上面的移植和优化。涉及语音/音频编解码，语音增强，语音识别，语音音质客观评估，VOIP语音引擎 Qos算法模块和声音变速不变调和变调不变速等功能实现。熟悉ARM 各个系列的CPU，用ARMv4,ARMv5,ARMv6 and Cortex Neon 汇编优化相关算法代码，争取perforamance 最优。目前主要Windows mobile and Android platform上做相关speech/audio算法以及应用开发。(交流Email:liupin.2008@gmail.com)</subtitle><id>http://feed.cnblogs.com/blog/u/35276/rss</id><updated>2012-05-31T07:02:44Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><generator>feed.cnblogs.com</generator><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/"/><link rel="self" type="application/atom+xml" href="http://feed.cnblogs.com/blog/u/35276/rss"/><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/04/30/2477254.html</id><title type="text">DTS收购音频公司SRS</title><summary type="text">DTS + SRS</summary><published>2012-04-30T13:19:00Z</published><updated>2012-04-30T13:19:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/04/30/2477254.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/04/30/2477254.html"/><content type="html">&lt;p&gt;谈到DTS和SRS相必不少网友都有耳闻，二者的音频技术常被用于我们身边的众多电子产品中。近日，DTS发布消息以总价值1.48亿美元的现金加股票方式收购音频处理技术公司SRS Labs。合并后的新公司将拥有1000余项专利，相信以后新公司将为我们带来更加出色的声音效果。&lt;/p&gt;&lt;p&gt;根据双方最终收购协议，DTS将以每股9.50美元的价格收购SRS全部在外流通股，总价值共计约1.48亿美元。通过收购，DTS将获得SRS截止2011年12月31日时共计约3800万美元净现金额。&lt;/p&gt;&lt;p&gt;DTS收购报价较截止2012年4月16日时SRS收盘价格溢价38%。根据协议，现金和股票将各占收购支出比例的50%。其中DTS用于收购而新发行股票将计价每股30.52美元，这一报价与DTS普通股在2012年4月12日时收盘价格一致。所有SRS已授权但未到期股权和受限制股票将立即执行交割，行使合约价为每股9.50美元，交割将以现金结算。&lt;/p&gt;&lt;p&gt;DTS(全称：数码影院系统公司)是一家专注于发展高品质娱乐体验的音频数码高科技公司，于1993年成立。DTS属音响技术的后起之秀，虽创办时间仅仅十余年，但公司依靠科技研发优势创新强劲的多功能数码环绕音频编码技术，建立起用于电影业界的数码环绕音频编解码传送技术的参照标准。现已发展成为竞争力强、深具影响力的享誉全球的著名企业。&lt;/p&gt;&lt;p&gt;&lt;img src="http://pic002.cnblogs.com/images/2012/31718/2012043021174552.jpg" alt="" /&gt;&lt;/p&gt;&lt;p&gt;&lt;img src="http://pic002.cnblogs.com/images/2012/31718/2012043021180484.jpg" alt="" /&gt;&lt;/p&gt;&lt;p&gt;SRS Labs是音频领域的领导者，其技术已经被全球十亿多产品所采用。SRS Labs利用对人类听觉系统的最新研究所创造的技术，开发能够优化和改善听觉体验的先进音频及通讯技术。SRS Labs的音频和语音信号处理技术被众多产品所采用，包括高清电视、手机、个人电脑和车载娱乐设备，为处于各种环境中的各种型号设备提供最好的声音质量。SRS Labs的环绕声解决方案为专业广播和录音行业提供高性能的制作、回程、存储和传输功能。SRS Labs在美国、中国大陆、欧洲、日本、韩国和台湾地区拥有办事处，能够为全球制造商提供支持。&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2477254.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/04/30/2477254.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/04/24/2467812.html</id><title type="text">微软申请3D音效专利 可兼容现有音响设备(转)</title><summary type="text">3D音频实用化</summary><published>2012-04-24T04:13:00Z</published><updated>2012-04-24T04:13:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/04/24/2467812.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/04/24/2467812.html"/><content type="html">&lt;p&gt;&lt;img style="cursor: pointer;" src="http://articles.csdn.net/uploads/allimg/120423/119_120423102522_1.jpg" alt="" width="547" height="372" border="0" /&gt;&lt;/p&gt;&lt;p&gt;图为微软申请的3D音效专利&lt;/p&gt;&lt;p&gt;北京时间4月23日消息，微软上周四对外公布了该公司此前提出的一项3D音响系统效果专利申请技术详情，该专利主要针对微软Kinect体感控制器游戏用户，目的是提高此类用户的游戏音效体验。该专利还能够兼容玩家现有音响系统。&lt;/p&gt;&lt;p&gt;据悉，微软于2010年10月13日向美国专利商标局(USPTO)提交了这项专利申请。如果该专利获得批准，今后Kinect用户在玩游戏过程中，无论是原地不动还是变换位置，都能借助耳机或外置音响设备来感受优美的3D音效。&lt;/p&gt;&lt;p&gt;众所周知，虽然传统音响组合也能提供环绕立体声音质，但用户必须处于恰当位置才能感受到最佳效果。如果用户移动身体或变换位置，则音效将有所减弱。&lt;/p&gt;&lt;p&gt;微软在所提交专利申请文件中表示，该专利希望利用最新&amp;ldquo;增强现实&amp;rdquo;(augmented reality)技术，以向Kinect用户提供完美的3D音质，从而大幅提高Kinect用户的游戏体验。Kinect玩家在玩游戏过程中，需要频繁移动身体，导致音乐效果会受到影响。而微软上述技术专利申请中描述的解决方案，则能够对玩家的室内环境和玩家位置进行整体和追踪分析，然后再将完美的3D音质传输到玩家耳中。&lt;/p&gt;&lt;p&gt;微软还表示，上述3D音效既可通过用户佩戴耳机实现，也可以借助外置音响系统发出，同时能够兼容用户家中已有组合音响。业界人士认为，如果微软这项专利获得批准，该公司肯定会将这项技术授权给各音响设备和显示设备厂商。如此一来，该3D音效技术同3D视觉技术结合后，无疑将给游戏玩家们带来完美的视觉/听觉体验。&lt;/p&gt;&lt;p&gt;本文来自：&lt;a href="http://tech.qq.com/a/20120421/000159.htm" target="_blank"&gt;腾讯科技&lt;/a&gt;&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2467812.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/04/24/2467812.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/03/27/2419768.html</id><title type="text">各种声音的基本频域成份介绍</title><summary type="text">声音成份分析</summary><published>2012-03-27T08:26:00Z</published><updated>2012-03-27T08:26:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/03/27/2419768.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/03/27/2419768.html"/><content type="html">&lt;p&gt;1.地鼓((size)Kick Drum)：&lt;/p&gt;&lt;p&gt;地鼓是一首歌曲里最重要的部分之一，因为它推动着节奏向前进行。这里我们讨论如何处理常见的三种地鼓：第一种我称之为&amp;ldquo;80年代蓬头地鼓&amp;rdquo;，你一定熟悉的：强而有力、富含中频、含有重击的&amp;ldquo;砰&amp;ldquo;声，想得到这种比较怀旧的地鼓声音，可以先过滤掉60Hz以下的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，然后根据情况在78-84Hz提升3到6dB((size)Q值大约为1)，使之听起来象是敲在你的胸膛上。接下来在1.5-2.5kHz提升大约6dB来增加&amp;ldquo;砰&amp;ldquo;声((size)Q值在1.5-2.5比较适合)，最后在120Hz降大约4dB((size)Q值1.0)。第二种是当今最流行的&amp;ldquo;Bonham&amp;ldquo;摇滚地鼓，我通常在120-240Hz提升4dB或更多来得到这种声音，还需要过滤掉1.5kHz以上的所有&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，有时候可能需要在还有一种现在常用的地鼓：比较空、有摩擦声，想得到这种声音，你可以过滤掉100Hz以下的所有声音，在125Hz提升大约3dB，在250-350Hz提升大约4dB。然后过滤掉2kHz以上的所有&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;。&lt;/p&gt;&lt;p&gt;2.军鼓：&lt;/p&gt;&lt;p&gt;目前有两种使用最广泛的军鼓类型：一种紧凑、有力，另一种松散、比较长((size)通常用于ballads风格的歌曲)首先，任何军鼓都不需要150Hz以下的声音，所以把它们过滤掉。军鼓的中心&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;通常在1kHz附近数百Hz的频段内，所以在这一频段提升3-6dB通常会非常有益。对于紧凑型军鼓，你可以尝试分别提升中高频((size)5kHz附近)、部分高频((size)8-9kHz)，提升量可以从3dB开始逐渐上升，左右变化一下提升的频点直到得到理想的效果。过滤掉250Hz以下、11kHz以上的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;会使这种军鼓听起来很舒服。对于松散型军鼓，需要在低端((size)250Hz附近)进行一些提升，我通常提升6dB。高频不用象紧凑型军鼓那样大幅提升，但在7kHz附近略作提升通常会有益处，再往上的频段可以过滤掉。关键是中频，先把提升的频点在800Hz-2kHz之间移动，找到那个能引起共鸣的频点，然后调整一下提升的幅度和Q值。对于这种军鼓，往往需要加上启动时间((size)attack time)较长的压缩、较重的混响来与之配合。&lt;/p&gt;&lt;p&gt;3.钹((size)cymbal)：&lt;/p&gt;&lt;p&gt;对于这些富含高频的鼓件，可以降低4kHz以下的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，根据情况提升高频区((size)10-14kHz)大约3dB。&lt;/p&gt;&lt;p&gt;4.沙锤((size)shaker), 手铃((size)tambourine), 手鼓((size)conga)、拍手((size)hand clap)等：&lt;/p&gt;&lt;p&gt;沙锤((size)shaker)和手铃((size)tambourine)很相似，要明亮并且贯穿高频区，对于沙锤，我通常过滤掉2kHz以下的所有&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，略提升高频，比如在9kHz提升6dB;手铃要略带叮当声，所以我过滤掉800Hz以下的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，在1.5或2kHz提升4dB，在7kHz略作提升。对于手鼓((size)conga)，我通常用扫频的办法找到那个引起共鸣的频点，根据情况略作提升或降低。需要注意的是不能提升过多，尤其是共鸣频点较低的时候，可能与鼓和贝斯形成干扰。为了突出conga的冲击效果，我通常在中频((size)5kHz附近)略作提升，比如提升6dB。对于拍手声，可以通过提升中低频使之厚实，通常在250Hz提升2dB((size)Q值1.5)。同样为了加强冲击力，可以提升中频((size)在1.5kHz附近提升约4dB)和高频((size)在8kHz附近提升2-3dB)。&lt;/p&gt;&lt;p&gt;5.钢琴：&lt;/p&gt;&lt;p&gt;如果钢琴是主要乐器，只与人声或少量陪衬乐器构成音乐，这时可不必做太多调整，如果没有贝斯，我通常会略微提升低频((size)140Hz附近)，另外可以在高频区((size)8.5kHz附近)略作提升，比如3dB。如果钢琴与其他7-8种乐器一起构成非常丰满的音乐，则需要对钢琴做一些衰减的均衡处理。由于钢琴的弹奏多集中在中音区，因此你可能需要在中频区((size)3或4kHz)略作衰减使之听起来不那么&amp;ldquo;honky&amp;ldquo;。过滤掉140Hz以下的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，因为这段&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;毫无疑问会与底鼓和贝斯形成干扰。在8kHz附近略作提升可以使高音键听起来更明亮。另外尽量使中频到高频的过渡自然些。&lt;/p&gt;&lt;p&gt;6.电贝斯：&lt;/p&gt;&lt;p&gt;电贝斯的种类很多，处理的方法也不一样。我最喜欢的是这种贝斯：丰满、厚重、每个音符都很突出。对于这种贝斯我通常这样处理：过滤掉100Hz以下的所有频段，降低520Hz以上的频段，在260Hz提升6dB使音调变得丰满，在730Hz提升3dB来增加拨弦的噪声，然后再配合适当的压限效果器，就可以产生这种适用于多种音乐风格的贝斯声音了。对于击弦贝斯((size)slaps and punches)，处理方法大体同上，但有两处不太一样：不必从520Hz就开始降低高频，在中频((size)2kHz附近)提升4-6dB突出slap声;低频过滤点可以设在50Hz，以便保持足够的隆隆声。&lt;/p&gt;&lt;p&gt;7.电吉他：&lt;/p&gt;&lt;p&gt;与钢琴一样需要根据整个作品的配器来决定处理方法。如果只有一轨电吉他外加鼓与贝斯，可以让电吉他听起来响亮;如果有好几轨电吉他，另外还有钢琴、电钢琴、打击等乐器，就必须让电吉他在频谱中占据合理的位置，从而融入到音乐中。对于第一种情况，只要不与贝斯发生冲突，可以尽可能的响亮，我处理那种只有一个吉他手的小型摇滚乐队时，会尽可能提升电吉他的低频，通常会在160Hz提升3dB以上，同时注意与贝斯相融合。另外根据电吉他的声音特点可以在700-800Hz稍作提升。有时需要突出中频，可以在3kHz附近提升。如果想要得到那种压碎般的声音((size)crunchier)，可以在高频区((size)7kHz)提升6dB左右。同样，把不需要的低频和高频过滤掉&amp;mdash;&amp;mdash;这是一个好习惯，但要仔细听，以免过滤掉有用的泛音和谐音。对于第二种大型乐队的情况，假设还有另外两把电吉他。首先过滤掉200Hz以下和9kHz以上的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，重点是中频，可以先通过扫频来判断哪些频段需要提升、哪些频段需要衰减。我发现提升4kHz、衰减6kHz通常能取得好的效果，但有时却正好相反，主要取决于作品的整体要求。对于有多把电吉他同时演奏的情况，要确保其声音略有不同，否则听上去会非常刺耳。&lt;/p&gt;&lt;p&gt;8.木吉他与弦乐：&lt;/p&gt;&lt;p&gt;对于不同的混音作品，木吉他的均衡处理会有极大的不同。过滤掉90Hz以下的所有&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，在360Hz作了少许提升。在中频、高频作相当大的提升：在2kHz提升了10dB，在7.1kHz提升了9dB，这样处理后木吉他听起来的确比其他乐器都要明亮。弦乐的均衡处理与木吉他非常类似，在乐器很多的音乐里，我通常会过滤掉大部分低频，然后在中高频((size)7kHz)提升大约4dB，最后也许会在高频区((size)10kHz)用坡形曲线做提升来增加一些空气感。&lt;/p&gt;&lt;p&gt;9.铜管和木管乐器：&lt;/p&gt;&lt;p&gt;通常中频比较突出，处理好中频非常重要。对于象小号这样的乐器，低频过滤点可以设在200Hz甚至更高，在对中频进行处理时要注意避免混浊。对于那些低音突出的铜管乐器来说，情况正好相反，需要过滤掉高频部分，比如过滤掉9kHz以上，通常要提升中低频，比如1.5kHz附近。对于大号，记住一定要过滤掉40Hz以下的频段，以免引起某些音箱发出低频噪音。大多数木管乐器需要突出气流声，通常可以通过提升9kHz以上的频段来达到这一目的。巴颂管可以演奏非常低的音符，所以不要过滤掉它的低频。但对大多数木管乐器来说，过滤掉低频是有益的。&lt;/p&gt;&lt;p&gt;10.主唱：&lt;/p&gt;&lt;p&gt;往往需要在音乐里处于显著、靠前的位置，通常可以通过提升中频来实现。主唱是音乐最关键的部分，要求能听清每一个字又不让人感到烦扰。对于不同特点的人声，处理方法各不相同，需要通过多听来判断。有一点必须要注意，主唱：往往需要在音乐里处于显著、靠前的位置，通常可以通过提升中频来实现。主唱是音乐最关键的部分，要求能听清每一个字又不让人感到烦扰。对于不同特点的人声，处理方法各不相同，需要通过多听来判断。有一点必须要注意，男声和女声的处理方法有很大的不同，我前一阵刚完成一首男女声二重唱歌曲，男歌手和女歌手在同一个录音棚录音，用的都是U67话筒，但声音的差别让我大吃一惊。我对他们分别进行了均衡处理，见图8((size)抱歉在原文里没有找到图例)。男声我用坡形均衡曲线在高频区提升了1dB，女声我在8.8kHz衰减了3dB。由于男歌手那天感冒了，鼻音较重，所以我在5.1kHz衰减了5dB，在7.5kHz提升了2dB。女声的低频区我分别在733Hz和283Hz提升了4dB，目的是用女声低频来补充男声。有趣的是我对男声和女声都在2.5kHz作了提升，可见提升中频对于人声来说有多重要。&lt;/p&gt;&lt;p&gt;11.背景人声：&lt;/p&gt;&lt;p&gt;有两种类型的背景人声，一种是标准的高八度合唱，我通常使用与主唱相同的均衡设置;另一种是有3-4个不同声部的背景和声，声像范围跨越整个声场，这时我会使用不同的均衡设置，要让他们听起来富有空间感并且超凡脱俗：对于高声部和声，我通常过滤掉400Hz以下的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，对于低声部和声，过滤掉100Hz以下的&lt;a class="keywordlink" style="margin: 0px; font-family: Verdana, Arial, Helvetica, sans-serif; color: #666666; text-decoration: none; padding: 0px;" href="http://www.3ait.net/type/2_%B3%AC%B5%CD%D5%D5%B6%C8%B2%CA%C9"&gt;频率&lt;/a&gt;，在不丧失合唱清晰度的前提下尽可能的降低中频((size)1-4kHz)。在中高频和高频我做了较大提升，直到听前来犹如天使发出的声音。&lt;/p&gt;&lt;p&gt;12.念白：&lt;/p&gt;&lt;p&gt;对于那种不许要与音乐相融合的念白，可以让声音尽量厚重，尽可能保留更多的低频。如果想让宣讲者的声音听起来犹如上帝般宏亮，可以根据情况提升60Hz及120Hz。然后提升7kHz附近的高频。有时需要降低一点中频，但要注意不要丧失声音的清晰度。正确的均衡处理可以成就作品，而错误的均衡处理会毁掉作品。1、100Hz属于温暖段，如果使这部分加强能使低音部分更加的柔和温暖! 2、200Hz属于混浊低沉，调音色时可适当减弱本段!3、300Hz~1KHz属于大多数音乐中的主要频段，突出这一频带可以加强音色的骨骼，但有时突出这一区域会使音乐显得有些&amp;ldquo;粘&amp;rdquo;，主要是在300Hz~800Hz之间。4、1.5KHz~2KHz这一频段很容易有&amp;ldquo;嗡嗡&amp;rdquo;的声音，削弱该频带会使声音干净，但同时也失去一部分效果!5、2KHz~4KHz属于温暖而又不失亮度，非常适合吉他类的乐器。6、4KHz~5KHz属于音质比较粗糙的频段，这部分的过高会导致整体音量的上升!7、7KHz或7KHz以上，就属于高频段，音质上显得尖锐很有攻击性，很容易产生嘶嘶声音!8、8KHz~10KHz范围属于钗片的音色范围。&lt;/p&gt;&lt;p&gt;linking: www.scxichen.com&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2419768.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/03/27/2419768.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/03/15/2397481.html</id><title type="text">看看国外语音博士的招生要求和工作内容</title><summary type="text">Denmark Phd</summary><published>2012-03-15T01:42:00Z</published><updated>2012-03-15T01:42:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/03/15/2397481.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/03/15/2397481.html"/><content type="html">&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; Denmark 助听器在全球知名，就这一产品就给Denmark带来多少经济收入。我们人这么多，高校也这么多，我们都做什么了？发发牢骚而起，自己本人都没做好，也没能力去评说国内现状，但是我心急啊。&lt;/p&gt;&lt;p&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Two PhD positions are available at the Centre for Applied Hearing Research at the Technical University of Denmark. &amp;nbsp;These positions are part of the FP7 Marie Curie Initial Training Network Investigating Speech Processing In Realistic Environments (INSPIRE). This network provides research opportunities for 13 PhD students and 3 postdocs. As part of this program, you will become a member of an international team of researchers whose aim is to gain a better understanding of how listeners recognize speech, even under non-ideal circumstances. You will contribute to urgently needed solutions that help alleviate the serious communication problems that arise, especially for older and hearing-impaired persons, when different combinations of &amp;rsquo;adverse&amp;rsquo; conditions affect the speech processing system.&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Both projects with be supervised by Prof. Torsten Dau and carried out at the Centre for Applied Hearing Research (CAHR) at the Technical University of Denmark (DTU). At the centre, we conduct fundamental and applied research with a focus on human speech communication, auditory processing and perception, hearing impairment and hearing instruments. &amp;nbsp;For more information about CAHR, please visit our website:&lt;span class="Apple-converted-space"&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;a style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #1155cc; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" href="http://www.dtu.dk/centre/cahr/English.aspx" target="_blank"&gt;http://www.dtu.dk/centre/cahr/English.aspx&lt;/a&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Position 1: Modelling speech intelligibility based on the signal-to-noise ratio in the modulation domain&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Proposed starting date: August 1, 2012&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Closing date for applications: April 15, 2012&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Topic: As a PhD student you will investigate the modelling of speech intelligibility based on the signal-to-noise ratio in the modulation domain. &amp;nbsp;A major challenge is to solve the &amp;ldquo;noise reduction paradox&amp;rdquo; that refers to the mismatch between predicted and actual speech intelligibility following noise reduction signal processing. It is postulated here that the ratio of the speech-to-noise energy in the modulation domain at the output of auditory signal processing is an important indicator of speech intelligibility, in contrast to the STI that considers only effects on the (speech) signal. Various distortions in transmission channels and effects of hearing-instrument processing are analyzed in this framework. The work is relevant for the evaluation of hearing-instrument algorithms, but also in context- and listener-specific speech modification to improve communication with automatic dialogue systems for groups such as the elderly or non-natives in realistic conditions.&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;This position will also be co-supervised by Dr. Mark Huckvale (Department of Speech, Hearing and Phonetic Sciences, University College London). &amp;nbsp;As part of the project, you will also spend a few months at UCL.&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Position 2: Characterization and prediction of perceptual consequences of individual hearing loss&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Proposed starting date: September 1, 2012&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Closing date for applications: May 15, 2012&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;Topic: There are enormous differences in hearing performance across individual listeners. To choose the right compensation strategy one needs to understand what the sources of this variability are. In this project, you will characterize individuals&amp;rsquo; hearing loss based on estimates of sensitivity, amplitude compression, spectral and temporal resolution, cognitive capabilities, and their relation to speech intelligibility performance. A computational auditory model will be used to predict the consequences of individual deficits and to account for the variability in the data across listeners. The results are expected to have implications for advanced compensation strategies in hearing instrument technology.&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;This position will also be co-supervised by Dr Bert Cranen (&lt;/span&gt;&lt;a style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #1155cc; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" href="mailto:B.Cranen@let.ru.nl"&gt;B.Cranen@let.ru.nl&lt;/a&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;) , Centre for Language and Speech Technology (&lt;/span&gt;&lt;a style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #1155cc; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" href="http://www.let.ru.nl/" target="_blank"&gt;http://www.let.ru.nl/&lt;/a&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;), Radboud University, The Netherlands. As part of the project, you will also spend a few months at Radboud University.&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;To be eligible for either position you must meet the FP7 Marie Curie requirements for ITNs:&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;- You must not have resided or performed your main research activity in Denmark for more than 12 months in the last three years&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;- You must be willing to work in at least one other country in the INSPIRE network&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;- You must have fewer than 4 years of research experience since you obtained your Masters degree, and not hold a PhD&lt;/span&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;br style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" /&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;For further details regarding the positions and how to apply, please see the attached pdfs or email Prof. Torsten Dau (&lt;/span&gt;&lt;a style="widows: 2; text-transform: none; text-indent: 0px; font: 13px arial, sans-serif; white-space: normal; orphans: 2; letter-spacing: normal; color: #1155cc; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" href="mailto:tdau@elektro.dtu.dk"&gt;tdau@elektro.dtu.dk&lt;/a&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;).&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;&amp;nbsp; 国外高校做研究着眼于应用，国际化交流。国内的高校做科研绝大数着眼于论文和职称。&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;span style="widows: 2; text-transform: none; text-indent: 0px; display: inline !important; font: 13px arial, sans-serif; white-space: normal; orphans: 2; float: none; letter-spacing: normal; color: #222222; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;"&gt;&amp;nbsp; &lt;/span&gt;&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2397481.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/03/15/2397481.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/03/14/2395878.html</id><title type="text">Wav 头的封装</title><summary type="text">Wav 封装</summary><published>2012-03-14T06:27:00Z</published><updated>2012-03-14T06:27:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/03/14/2395878.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/03/14/2395878.html"/><content type="html">&lt;p&gt;除了PCM 封装成wav让一般的播放能正常播放外，然后Wav可以封装很多压缩的音频数据。如: ADPCM, DTS LPCM, 等。在这就收藏一些wav 封装ADPCM的头格式剖析信息&lt;/p&gt;&lt;p&gt;WAVE文件头作为&lt;a class="keyword" href="http://www.c114.net/keyword/%B6%E0%C3%BD%CC%E5" target="_blank"&gt;多媒体&lt;/a&gt;中使用的声波文件格式之一，它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写，每个WAVE文件的头四个字节便是&amp;ldquo;RIFF&amp;rdquo;。合理利用WAVE文件头可以更有效地进行语音解码。&lt;br /&gt;&lt;br /&gt;通常意义上说的语音编码都是指将8KHz采样、16比特量化的线性&lt;a class="keyword" href="http://www.c114.net/keyword/PCM" target="_blank"&gt;PCM&lt;/a&gt;语音信号压缩成其它格式的语音信号，解码时就将其它格式的语音信号变换成8KHz采样、16比特量化的线性PCM语音信号。一般说来，这个转换过程比较复杂，费时费力。如果对其它格式的语音信号直接加上对应的WAVE文件头就不用这个转换过程，用&lt;a class="keyword" href="http://www.c114.net/keyword/%CE%A2%C8%ED" target="_blank"&gt;微软&lt;/a&gt;自带的录音机就可解码语音。&lt;br /&gt;&lt;br /&gt;下面就分别剖析各种语音编码的WAVE文件头格式，用如下各个表（表1到表7）进行对比即可。&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;center&gt;&lt;strong&gt;表1　8KHz采样、16比特量化的线性PCM语音信号的WAVE文件头格式表（共44字节）&lt;/strong&gt;&lt;/center&gt;&lt;p&gt;&lt;br /&gt;&lt;br /&gt;偏移地址 字节数 数据类型 内容 文件头定义为&lt;br /&gt;00H 4 char "RIFF" char riff_id[4]="RIFF"&lt;br /&gt;04H 4 long int 文件总长-8 long int size0=文总长-8&lt;br /&gt;08H 8 char "WAVEfmt " char wave_fmt[8]&lt;br /&gt;10H 4 long int 10 00 00 00H(PCM) long int size1=0x10&lt;br /&gt;14H 2 int 01 00H int fmttag=0x01&lt;br /&gt;16H 2 int int channel=1 或2&lt;br /&gt;18H 4 long int 采样率 long int samplespersec&lt;br /&gt;1CH 4 long int 每秒播放字节数 long int bytepersec&lt;br /&gt;20H 2 int 采样一次占字节数 int blockalign=声道数*量化数/8&lt;br /&gt;22H 2 int 量化数 int bitpersamples=8或16&lt;br /&gt;24H 4 char "data" char data_id="data"&lt;br /&gt;28H 4 long int 采样数据字节数 long int size2=文长-44&lt;br /&gt;2CH 到文尾 char 采样数据 　&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;center&gt;&lt;strong&gt;表2　8KHz采样、8比特A律量化的PCM语音信号的WAVE文件头格式表（共58字节）&lt;/strong&gt;&lt;/center&gt;&lt;p&gt;&lt;br /&gt;&lt;br /&gt;偏移地址 字节数 数据类型 内容 文件头定义为&lt;br /&gt;00H 4 char "RIFF" char riff_id[4]="RIFF"&lt;br /&gt;04H 4 long int 文件总长-8 long int size0=文总长-8&lt;br /&gt;08H 8 char "WAVEfmt " char wave_fmt[8]&lt;br /&gt;10H 4 long int 12000000H(ALAW) long int size1=0x12&lt;br /&gt;14H 2 int 06 00H int fmttag=0x06&lt;br /&gt;16H 2 int 声道数 int channel=1 或2&lt;br /&gt;18H 4 long int 采样率 long int samplespersec&lt;br /&gt;1CH 4 long int 每秒播放字节数 long int bytepersec&lt;br /&gt;20H 2 int 采样一次占字节数 int blockalign=0x01&lt;br /&gt;22H 4 long int 量化数 long int bitpersamples=8&lt;br /&gt;26H 4 char "fact" char wave_fact="fact"&lt;br /&gt;2AH 8 char 0400000000530700H定 char temp&lt;br /&gt;32H 4 char "data" char wave_data="data"&lt;br /&gt;36H 4 long int 采样数据字节数 lont int size2=文长-58&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;center&gt;&lt;strong&gt;表3　8KHz采样、8比特U律量化的PCM语音信号的WAVE文件头格式表（共58字节）&lt;/strong&gt;&lt;/center&gt;&lt;p&gt;&lt;br /&gt;&lt;br /&gt;偏移地址 字节数 数据类型 内容 文件头定义为&lt;br /&gt;00H 4 char "RIFF" char riff_id[4]="RIFF"&lt;br /&gt;04H 4 long int 文件总长-8 long int size0=文总长-8&lt;br /&gt;08H 8 char "WAVEfmt " char wave_fmt[8]&lt;br /&gt;10H 4 long int 12000000H(ULAW) long int size1=0x12&lt;br /&gt;14H 2 int 07 00H int fmttag=0x07&lt;br /&gt;16H 2 int 声道数 int channel=1 或2&lt;br /&gt;18H 4 long int 采样率 long int samplespersec&lt;br /&gt;1CH 4 long int 每秒播放字节数 long int bytepersec&lt;br /&gt;20H 2 int 采样一次占字节数 int blockalign=0x01&lt;br /&gt;22H 4 long int 量化数 long int bitpersamples=8&lt;br /&gt;26H 4 char "fact" char wave_fact="fact"&lt;br /&gt;2AH 8 char 0400000000530700H定 char temp&lt;br /&gt;32H 4 char "data" char wave_data="data"&lt;br /&gt;36H 4 long int 采样数据字节数 lont int size2=文长-58&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;center&gt;&lt;strong&gt;表4　ADPCM语音编码后的WAVE文件头格式表（共90字节）&lt;/strong&gt;&lt;/center&gt;&lt;p&gt;&lt;br /&gt;&lt;br /&gt;偏移地址 字节数 数据类型 内容 文件头定义为&lt;br /&gt;00H 4 char "RIFF" char riff_id[4]="RIFF"&lt;br /&gt;04H 4 long int 文件总长-8 long int size0=文总长-8&lt;br /&gt;08H 8 char "WAVEfmt " char wave_fmt[8]&lt;br /&gt;10H 4 long int 32000000H(ADPCM) long int size1=0x32&lt;br /&gt;14H 2 int 02 00H int fmttag=0x02&lt;br /&gt;16H 2 int 声道数 int channel=1 或2&lt;br /&gt;18H 4 long int 采样率 long int samplespersec&lt;br /&gt;1CH 4 long int 每秒播放字节数 long int bytepersec&lt;br /&gt;20H 2 int 采样一次占字节数 int blockalign=声道数*量化数/8&lt;br /&gt;22H 2 int 量化数 int bitpersamples=4&lt;br /&gt;24H 34 char 固定字节 char temp1&lt;br /&gt;46H 4 char "fact" char wave_fact="fact"&lt;br /&gt;4AH 8 char 0400000004930600H定 char temp2&lt;br /&gt;52H 4 char "data" char wave_data="data"&lt;br /&gt;56H 4 long int 采样数据字节数 lont int size2=文长-90&lt;br /&gt;5AH 到文尾 采样数据 　 　&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;center&gt;&lt;strong&gt;表5　&lt;a class="keyword" href="http://www.c114.net/keyword/GSM" target="_blank"&gt;GSM&lt;/a&gt;语音编码后的WAVE文件头格式表（共60字节）&lt;/strong&gt;&lt;/center&gt;&lt;p&gt;&lt;br /&gt;&lt;br /&gt;偏移地址 字节数 数据类型 内容 文件头定义为&lt;br /&gt;00H 4 char "RIFF" char riff_id[4]="RIFF"&lt;br /&gt;04H 4 long int 文件总长-8 long int size0=文总长-8&lt;br /&gt;08H 8 char "WAVEfmt " char wave_fmt[8]&lt;br /&gt;10H 4 long int 14000000H(GSM) long int size1=0x14&lt;br /&gt;14H 2 int 31 00H int fmttag=0x31&lt;br /&gt;16H 2 int 声道数 int channel=1 或2&lt;br /&gt;18H 4 long int 采样率 long int samplespersec&lt;br /&gt;1CH 4 long int 每秒播放字节数 long int bytepersec&lt;br /&gt;20H 8 char 4100000002004001H定 char temp1&lt;br /&gt;28H 8 char 6661637404000000H定 char temp2&lt;br /&gt;30H 4 char 40 E2 05 00H定 char temp3&lt;br /&gt;34H 4 char "data" char wave_data="data"&lt;br /&gt;38H 4 long int 采样数据字节数 lont int size2=文长-60&lt;br /&gt;3CH 到文尾 采样数据 　 　&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;center&gt;&lt;strong&gt;表6　SBC语音编码后的WAVE文件头格式表（共58字节）&lt;/strong&gt;&lt;/center&gt;&lt;p&gt;&lt;br /&gt;&lt;br /&gt;偏移地址 字节数 数据类型 内容 文件头定义为&lt;br /&gt;00H 4 char "RIFF" char riff_id[4]="RIFF"&lt;br /&gt;04H 4 long int 文件总长-8 long int size0=文总长-8&lt;br /&gt;08H 8 char "WAVEfmt " char wave_fmt[8]&lt;br /&gt;10H 4 long int 12000000H(SBC) long int size1=0x12&lt;br /&gt;14H 2 int 71 00H int fmttag=0x71&lt;br /&gt;16H 2 int 声道数 int channel=1 或2&lt;br /&gt;18H 4 long int 采样率 long int samplespersec&lt;br /&gt;1CH 4 long int 每秒播放字节数 long int bytepersec&lt;br /&gt;20H 2 int 采样一次占字节数 int blockalign=0x25&lt;br /&gt;22H 4 long int 量化数 long int bitpersamples=16&lt;br /&gt;26H 4 char "fact" char wave_fact="fact"&lt;br /&gt;2AH 8 char 0400000076280400H定 char temp&lt;br /&gt;32H 4 char "data" char wave_data="data"&lt;br /&gt;36H 4 long int 采样数据字节数 lont int size2=文长-59&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;center&gt;&lt;strong&gt;表7　CELP语音编码后的WAVE文件头格式表（共58字节）&lt;/strong&gt;&lt;/center&gt;&lt;p&gt;&lt;br /&gt;&lt;br /&gt;偏移地址 字节数 数据类型 内容 文件头定义为&lt;br /&gt;00H 4 char "RIFF" char riff_id[4]="RIFF"&lt;br /&gt;04H 4 long int 文件总长-8 long int size0=文总长-8&lt;br /&gt;08H 8 char "WAVEfmt " char wave_fmt[8]&lt;br /&gt;10H 4 long int 12000000H(CELP) long int size1=0x12&lt;br /&gt;14H 2 int 70 00H int fmttag=0x70&lt;br /&gt;16H 2 int 声道数 int channel=1 或2&lt;br /&gt;18H 4 long int 采样率 long int samplespersec&lt;br /&gt;1CH 4 long int 每秒播放字节数 long int bytepersec&lt;br /&gt;20H 2 int 采样一次占字节数 int blockalign=0x0C&lt;br /&gt;22H 4 long int 量化数 long int bitpersamples=16&lt;br /&gt;26H 4 char "fact" char wave_fact="fact"&lt;br /&gt;2AH 8 char 0400000060520700H定 char temp&lt;br /&gt;32H 4 char "data" char wave_data="data"&lt;br /&gt;36H 4 long int 采样数据字节数 lont int size2=文长-58&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;链接:&lt;a href="http://market.c114.net/154/a189647.html"&gt;http://market.c114.net/154/a189647.html&lt;/a&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2395878.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/03/14/2395878.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/02/14/2350833.html</id><title type="text">可延长智能机电池寿命的多核技术</title><summary type="text">ARM 技术</summary><published>2012-02-14T04:09:00Z</published><updated>2012-02-14T04:09:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/02/14/2350833.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/02/14/2350833.html"/><content type="html">&lt;p&gt;智能手机和平板终端配备双核与四核处理器已成为一种趋势。新一代应用处理器的CPU内核将会如何发展？在CPU内核领域占有绝对市场份额的英国ARM公司，公开了今后几年内的多核技术发展蓝图。其战略是通过组合使用大小各异的内核，同时兼顾高性能和低功耗。而且，异质内核的并用将成为在移动领域引进虚拟化技术的基础。&lt;br /&gt;&lt;br /&gt;智能手机及平板终端用CPU内核开发商英国ARM公司2011年秋季发布的内核&amp;ldquo;Cortex-A7&amp;rdquo;，配备了很多乍一看有些奇特的功能。&lt;br /&gt;&lt;br /&gt;Cortex-A7是一款用于100美元以下低价位智能手机的CPU内核。在设计时最注重降低耗电量和成本，因此其电力效率与美国苹果公司&amp;ldquo;iPhone 4&amp;rdquo;中配备的ARM现有CPU内核&amp;ldquo;Cortex-A8&amp;rdquo;相比，提高至约5倍注1）。&lt;br /&gt;&lt;br /&gt;注1）ARM公司Cortex系列产品名称中的数字，代表该CPU内核的相对性能。而不是像苹果公司的应用处理器&amp;ldquo;A4&amp;rdquo;和&amp;ldquo;A5&amp;rdquo;那样，代表发布顺序和产品工艺。&lt;br /&gt;&lt;br /&gt;Cortex-A7内核彻底实现了&amp;ldquo;环保运行&amp;rdquo;，并配备了许多移动领域一般并不需要的先进技术和功能。包括虚拟化技术，用于主存储器的ECC功能，以及40bit的物理地址扩展（LPAE：Large Physical Address Extensions）等。&lt;br /&gt;&lt;br /&gt;即使为了彻底提高电力效率、削减电路面积，也没有必要在用于低价位智能手机的Cortex-A7中配备虚拟化技术等。为什么ARM公司要在Cortex-A7内核中配备这些功能呢？&lt;br /&gt;&lt;br /&gt;兼顾高性能和低功耗&lt;br /&gt;&lt;br /&gt;之所以在Cortex-A7中大量配备先进功能，是为了实现一项称为&amp;ldquo;big.LITTLE&amp;rdquo;的技术，该技术可在未来的智能手机中兼顾高性能和低功耗这两个完全相反的特性。这项技术是ARM公司在发布Cortex-A7的同时推出的，将注重电力效率的内核Cortex-A7与ARM公司性能最高的CPU内核&amp;ldquo;Cortex-A15&amp;rdquo;组合使用（见图1）。正如字面意思一样，同时采用了性能不同的&amp;ldquo;大小&amp;rdquo;两种内核。&lt;br /&gt;&lt;a href="http://laoyaoba.com/ss6/batch.download.php?aid=166061" target="_blank"&gt;&lt;img src="http://laoyaoba.com/ss6/attachments/2012/02/4876_2012021405464312NMg.jpg" alt="" border="0" /&gt;&lt;/a&gt;&lt;br /&gt;图1：2013年以后智能手机也将采用虚拟化技术&lt;br /&gt;图中是ARM公司的CPU内核&amp;ldquo;Cortex-A&amp;rdquo;系列，在用于智能手机等便携终端时的内核数量以及内核种类等。由本杂志根据ARM公司的资料制作而成。&lt;br /&gt;&lt;br /&gt;big.LITTLE技术可根据电力和性能等情况，将Cortex-A15和Cortex-A7动态地分开使用。比如，像浏览器的屏幕渲染等需要高性能时，就会通过并行性较高、拥有较长管线的CPU内核&amp;mdash;&amp;mdash;Cortex-A15来高速运行相关应用。反之当收发邮件等不需要太高性能时，则会切断Cortex-A15的电源，将整个系统转移到管线更短、电力效率较高的CPU内核&amp;mdash;&amp;mdash;Cortex-A7中运行（图2）注2）。&lt;br /&gt;&lt;a href="http://laoyaoba.com/ss6/batch.download.php?aid=166062" target="_blank"&gt;&lt;img src="http://laoyaoba.com/ss6/attachments/2012/02/4876_201202140546432ZFGj.jpg" alt="" border="0" /&gt;&lt;/a&gt;&lt;br /&gt;图2：通过异构多核实现节能的big.LITTLE技术&lt;br /&gt;ARM公司的big.LITTLE技术将注重性能的&amp;ldquo;A15&amp;rdquo;与注重耗电量的&amp;ldquo;A7&amp;rdquo;这两种CPU内核分开使用，由此可降低耗电量。CPU负荷较低时，将OS等整个系统转移到A7内核，并切断A15内核的电源（a、b）。由本杂志根据ARM公司的资料制作而成。&lt;br /&gt;&lt;br /&gt;注2）在何时将某个应用和OS转移至其他内核的判断，与动态控制CPU内核工作频率与电源电压的&amp;ldquo;DVFS（Dynamic Voltage And Frequency Scaling）&amp;rdquo;以相同的原理进行。如果Cortex-A15F的电源电压和工作频率降至下限，就会启动Cortex-A7并转移系统。无法从软件看到内核的切换。另外，big.LITTLE技术可实现同时持续驱动异质内核的SMP利用方式。&lt;br /&gt;&lt;br /&gt;在big.LITTLE技术中，两种内核间采用的SoC上的电源域（区域）和晶体管也不同。Cortex-A7的电路区域采用阈值电压较高的晶体管，通过降低电源电压来减少工作电流和漏电流。而Cortex-A15的电路区域则采用阈值电压较低的晶体管，通过提高电源电压来追求性能。&lt;br /&gt;&lt;br /&gt;架构完全兼容&lt;br /&gt;&lt;br /&gt;在big.LITTLE技术中，要想将在一个内核上运行的软件顺利转移到其他内核上，就需要大小两种CPU内核的架构和功能完全相同。&lt;br /&gt;&lt;br /&gt;因此，ARM公司使Cortex-A7的架构与Cortex-A15完全兼容。除了Cortex-A7的指令集架构（ISA）与Cortex-A15完全相同外，还将Cortex-A15中首次向ARM架构引进的虚拟化技术、ECC功能和LPAE等先进功能，直接移植到了用于低价位智能手机的Cortex-A7中。注重电力效率的Cortex-A7之所以配备许多乍看并不需要的先进功能，是为了实现big.LITTLE技术。&lt;br /&gt;&lt;br /&gt;异质架构成主流 &lt;br /&gt;&lt;br /&gt;big.LITTLE技术被定位为支撑今后智能手机和平板终端应用处理器的核心技术。ARM公司在2011年10月发布的64bit架构&amp;ldquo;ARMv8&amp;rdquo;，尚未发布支持的CPU内核，估计要在2014年以后才能配备在设备上。而big.LITTLE技术是已经可以使用的技术，不久的将来就可以实用化。&lt;br /&gt;&lt;br /&gt;目前双核架构的智能手机用SoC，基本上都采用可多个排列相同CPU内核的同质架构。同质架构可采用通过多个内核运行单个OS的SMP（Symmetrical Multi Processing）架构，因此从软件来看易于使用。但从电力效率来看，即使在不需要高性能的情况下，同质架构也不得不采用配备高速架构（可发挥峰值性能）的内核，这点与异质架构相比处于不利地位。&lt;br /&gt;&lt;br /&gt;big.LITTLE技术虽然在物理上采用异质架构，但就软件而言多个内核看起来就像一个。可以说是融合了异质架构与同质架构两者优点的技术。&lt;br /&gt;&lt;br /&gt;实际上，ARM公司公开的未来应用处理器发展蓝图，从中端到高端的智能手机都并用了Cortex-A15和Cortex-A7，因此估计会采用big.LITTLE技术（见图1）。由此，智能手机在具备高性能的同时，还可延长电池寿命。作为实现这一点的王牌，big.LITTLE技术可以说是很有用的。&lt;br /&gt;&lt;br /&gt;通过虚拟化技术掩盖微妙的不同&lt;br /&gt;&lt;br /&gt;big.LITTLE技术在内部也采用了颇有意思的封装方法。这就是利用了虚拟化技术。&lt;br /&gt;&lt;br /&gt;虽然Cortex-A7与Cortex-A15的ISA是相同的，但是两者在物理上是不同的内核。如果只统一ISA的话，那么内核间还是会存在无法掩盖的微妙不同。&lt;br /&gt;&lt;br /&gt;例如，ARM架构中有名为&amp;ldquo;CP15&amp;rdquo;的寄存区，可存储CPU内核的ID以及缓存构成的拓扑等信息。ID中包括封装有相关CPU内核的企业ID，以及与CPU内核产品名称相对应的型号等。关于这些信息，Cortex-A7与Cortex-A15必然不同。&lt;br /&gt;&lt;br /&gt;big.LITTLE技术通过应用虚拟化技术来掩盖这些不同。如前所述，Cortex-A7与Cortex-A15都采用了虚拟化技术。因此，在这些内核上运行的OS一旦访问CP15寄存器，根据虚拟化机构的原理，就会发生异常陷阱（Exception Trap）。于是，控制任务便会自动转移到OS以下模式运行的虚拟化软件（Hypervisor）上。在Hypervisor上向OS等提示与物理CP15寄存器等不同的信息，由此可以掩盖Cortex-A7与Cortex-A15之间在硬件上的不同。&lt;br /&gt;&lt;br /&gt;利用虚拟化原理在软件上&amp;ldquo;欺骗&amp;rdquo;OS和应用，由此看起来就像在完全相同的内核上运行一样。ARM公司总裁Tudor Brown表示，&amp;ldquo;big.LITTLE技术的精髓在于虽然内核的物理性质不同，但从软件来看却完全相同&amp;rdquo;。&lt;br /&gt;&lt;br /&gt;在Cortex-A7中封装虚拟化技术，不仅是为了与前面提到的Cortex-A15确保兼容性，还是为了最终通过Hypervisor消除两个内核间的微妙差异。&lt;br /&gt;&lt;br /&gt;加速虚拟化技术在智能手机上的普及&lt;br /&gt;&lt;br /&gt;ARM公司在2010年9月发布了该公司首款采用虚拟化技术的内核Cortex-A15，当时未必明确了在移动领域如何利用虚拟化技术。Cortex-A15不同于此前ARM公司的CPU内核产品，专门面向该公司近年着力发展的服务器领域。因此，估计是为了满足该领域的需求，才在Cortex-A15中采用了虚拟化技术。&lt;br /&gt;&lt;br /&gt;然而，big.LITTLE技术公布后发现，虚拟化技术实际上可以广泛用于智能手机和平板终端上。ARM公司表示，&amp;ldquo;最初big.LITTLE项目是与虚拟化技术分别推进的，中途我们认识到可以利用虚拟化技术，于是将两者融合在了一起&amp;rdquo;。以big.LITTLE技术以及Cortex-A7的引进为契机，此前一直与移动领域无缘的虚拟化技术，将标配在几乎所有的智能手机和平板终端上（见图1）。&lt;br /&gt;&lt;br /&gt;在集群间控制一致性 &lt;br /&gt;&lt;br /&gt;在big.LITTLE技术中，要想使某项任务顺利地从一个内核转移到另一个内核，需要在硬件方面进行改进。具体要求是在不同内核间确保缓存的一致性（Coherency）。&lt;br /&gt;&lt;br /&gt;在缓存的一致性控制方面，ARM公司网已经有了&amp;ldquo;MPCore&amp;rdquo;多核技术，可以对CPU内核内一次缓存的一致性进行控制。不过，MPCore以最大四核的同质架构多核为前提，不支持big.LITTLE技术这种异质架构多核。&lt;br /&gt;&lt;br /&gt;因此，ARM公司针对big.LITTLE技术这种异质架构，在SoC上新设立&amp;ldquo;集群&amp;rdquo;（Cluster）这个单位。通过MPCore技术构成的同质架构多核以集群为单位汇总，当在SoC上同时配备不同种类的CPU内核时，需要另外设置新的集群。比如，分别设置一个配备两个Cortex-A7的集群，以及配备两个Cortex-A15的集群（图2）。&lt;br /&gt;&lt;br /&gt;集群间的缓存一致性，采用专用的IP内核&amp;ldquo;CCI（Cache Coherent Tnterconnect）-400&amp;rdquo;来确保。CCI-400在内部配备了交叉开关。CPU内核内一次缓存的一致性由MPCore技术控制，集群间二级缓存的一致性由CCI-400控制（表1）。&lt;br /&gt;&lt;a href="http://laoyaoba.com/ss6/batch.download.php?aid=166063" target="_blank"&gt;&lt;img src="http://laoyaoba.com/ss6/attachments/2012/02/4876_201202140546433w6fN.jpg" alt="" border="0" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;由于可以在Cortex-A15与Cortex-A7之间维持缓存的一致性，因此big.LITTLE技术可在约20&amp;mu;s内完成两个内核间的任务转移。20&amp;mu;s是将CPU内核内部多项寄存器信息转移到其他内核上所需要的时间（图2）。利用基于CCI-400的一致性控制，二级缓存数据可与CPU内核处理并行，从而自动转移到其他内核上。&lt;br /&gt;&lt;br /&gt;英伟达也有类似技术&lt;br /&gt;&lt;br /&gt;根据负荷情况将阈值电压更高的节电型CPU内核进行切换使用的方法，其实除了ARM公司的big.LITTLE技术外还有其他技术。比如，美国英伟达（NVIDIA）在2011年9月发布的&amp;ldquo;vSMP（variable Symmetric Multi Processing）&amp;rdquo;技术。vSMP技术已经用于该公司2011年11月发布的应用处理器&amp;ldquo;Tegra 3&amp;rdquo;上，台湾华硕电脑（ASUSTeK Computer）的&amp;ldquo;Eee Pad TransformerPrime&amp;rdquo;等平板终端产品已经配备了&amp;ldquo;Tegra 3&amp;rdquo;。&lt;br /&gt;&lt;br /&gt;Tegra 3配备五个&amp;ldquo;Cortex-A9&amp;rdquo;，其中一个用作&amp;ldquo;协处理内核&amp;rdquo;，采用漏电流较小的低功耗制造技术形成。虽然不能像big.LITTLE技术那样同时采用微架构不同的内核，但在组合使用电力效率不同的内核这点上，双方是类似的（表1）。&lt;br /&gt;&lt;br /&gt;不过，vSMP没有big.LITTLE技术中的集群这一概念，协处理内核以及其他内核直接共享二级缓存。内核间切换所需时间在2ms以内，远远高于big.LITTLE技术的20&amp;mu;s。估计将来会改换成配备更先进系统的big.LITTLE之类的技术。（记者：进藤 智则，《日经电子）&lt;/p&gt;&lt;p&gt;Linking:&lt;a href="http://laoyaoba.com/ss6/html/53/n-287753.html"&gt;http://laoyaoba.com/ss6/html/53/n-287753.html&lt;/a&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;br /&gt;&amp;nbsp;&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2350833.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/02/14/2350833.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/02/13/2349531.html</id><title type="text">Audience新降噪技术或整合进iPad3的A6处理器</title><summary type="text">Audience</summary><published>2012-02-13T07:40:00Z</published><updated>2012-02-13T07:40:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/02/13/2349531.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/02/13/2349531.html"/><content type="html">&lt;p&gt;网易科技讯 2月6日消息，据国外媒体报道，市场调研机构Linley Group分析师林利&amp;middot;格文奈普（Linley Gwennap）近日在一份报告中指出，iPhone 4之所以不支持Siri语音助理服务，可能是因为其处理器并没整合Audience最新的EarSmart远场降噪技术。&lt;/p&gt;&lt;p&gt;1月，Audience在其IPO（首次公开招股）招股书中披露了其与苹果合作关系的细节。著名拆解网站iFixit 和Chipworks对iPhone 4拆解后，发现里面含有一个专门的Audience芯片，但据Audience的S-1文件显示，Audience的EarSmart技术是直接整合到iPhone 4S的A5处理器中的。&lt;/p&gt;&lt;p&gt;A5处理器尺寸很大，这引起了格文奈普的疑问。通常来说，尺寸较大的处理器成本和能耗都比较高，芯片设计者在设计过程中也会尽可能地缩小芯片尺寸。Audience的招股书解除了格文奈普的这一疑问。&lt;/p&gt;&lt;p&gt;&amp;ldquo;即使将双Cortex A9核心，以及尺寸很大的、含领先3D图像功能的GPU考虑在内，A5处理器仍显得很大，&amp;rdquo;格文奈普在报告中指出。&amp;ldquo;为了降低系统能耗，省去Audience芯片所占的额外空间，苹果与Audience达成了一项协议，将降噪技术直接整合到iPhone 4S的A5处理器中。&amp;rdquo;&lt;/p&gt;&lt;p&gt;Audience在提交的监管文件中表示，其用于iPhone 4的降噪技术仅在用户将手机靠到嘴边时才表现良好。而整合到iPhone 4S的Audience第二代降噪技术则性能更好。&lt;/p&gt;&lt;p&gt;格文奈普表示，&amp;ldquo;这也解释了苹果为什么不以系统升级的方式给iPhone 4提供Siri功能。尽管该旧款iPhone含有Audience芯片，但Audience随后已经对其技术进行改良，使得用户将iPhone 4S拿在一臂之远处也能进行语音控制，而不用将手机靠到嘴边使用。&amp;rdquo;&lt;/p&gt;&lt;p&gt;旧款iPhone对Siri的支持一直是一大争议。尽管一些破解者已经能够在旧款iPhone上使用Siri，但这在技术上非常复杂。&lt;/p&gt;&lt;p&gt;Audience在监管文件中称，它在2011年最后一个季度开始从与苹果之间的合作获得收益。它表示，&amp;ldquo;从截至2011年12月31日的季度开始，苹果将我们的处理器技术整合到部分手机当中；按照协议，苹果每个季度都要为每部使用我们的处理器技术的手机向我们支付授权费。&amp;rdquo;&lt;/p&gt;&lt;p&gt;Audience称第二代支持远场降噪的技术于2011年开始推出。iPhone 4在2010年便已上市，也就是远场降噪技术推出之前。&lt;/p&gt;&lt;p&gt;Audience第三代降噪技术目前正在研发当中，该公司也将向苹果授权该项技术。据传，该技术很可能会整合到iPad 3的A6处理器中。(乐邦)&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;Linking: &lt;a href="http://tech.163.com/12/0206/10/7PITF4HG000915BE.html"&gt;http://tech.163.com/12/0206/10/7PITF4HG000915BE.html&lt;/a&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2349531.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/02/13/2349531.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2012/01/13/2321232.html</id><title type="text">数字助听器的算法</title><summary type="text">数字助听器</summary><published>2012-01-13T01:40:00Z</published><updated>2012-01-13T01:40:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2012/01/13/2321232.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2012/01/13/2321232.html"/><content type="html">&lt;p&gt;目前国外对助听器研究发展的一个热点则是集中在中国，确切地讲是基于对汉语语言和语音研究，开发相关的语音识别技术和产品。为中心的中文听力学也不例外。我们已经知道听觉科学是一门发展迅速、知识更新很快的一门学科，它所研究的对象以人的听觉为中心，现在我们将介绍和讨论科学家和听力学家更关心的是怎样将听觉科学运用到中国人的听觉和言语实际中去。&lt;/p&gt;&lt;p&gt;汉语是具有特征化的音调性语言，与其他以拼音字母为主的语系，如斯拉夫语系等具有很明显的语音学差别。这种差别不仅仅在语言特征上非常明确，在具体使用时，区别也很大。是否不同语系的不同语音特征会影响听觉受损患者对言语的理解，尤其是在使用基于不同语系研究成果制作成的助听器时，这种语音的差异是否起到重要作用，最近已成为学术和科研的一个热门课题。比如国内研制的人工耳蜗的一个特点便是在设计其算法时考虑到中文语音特点。国外助听器厂商将在近期推出以中文语音为特征算法的助听器。加拿大在中国的一语音实验室通过多年的研究和实验，早在 2000 年运用领先的数字信号处理 (DSP) 技术，在其数字助听器中加入中文语音算法，并同时申请了相关专利。目前他们率先推出的以中文语音处理技术为核心的全新数字助听器 &amp;mdash;Intelligia ，在临床试验中得到受试者的认可，初步证明这种新型助听器对说以中文为母语的患者有益处。&lt;/p&gt;&lt;p&gt;目前研究的结果表明，不同的语系，如汉语和英语有各自特点，在听觉感知过程中有很大差别。英文和汉语在语音和口语上有重要区别， Ming-Xi Tsai el al （ 2000 ）认为汉语和英文语音在结构上特征区别很大。汉语的词、字、音节和声、韵母分节含有不同层次的信息，并保持复杂的关系。在口语中，汉语发音差异也很大，在不同会话条件下，受到这些结构中不同层次信息的影响。&lt;/p&gt;&lt;p&gt;对中文语音识别和中文语音音调的研究表现在人工耳蜗的算法上面。言语处理策略是人工耳蜗帮助患者理解语言核心技术，已有大量研究。但对于言语声尤其是声调、语调的研究，比如对以语调为基础的汉语研究还是很少。在最近的一个试验中，他们用澳大利亚人工耳蜗来观察对汉语语音理解的影响。结果表明在某些言语处理策略中汉语的使用的理解度要高于其他时间策略。如果能提高刺激率，加强对语音和音调的理解，他们也认为不同的言语处理策略对汉语说法也有理解。研究再次证明，汉语应该有一定的语音系统处理自己的语言，尤其是对听障人士尤为重要。&lt;/p&gt;&lt;p&gt;美国麻省理工学院研究者 Michael Qin 在其《在噪音背景发音和音调的辨认》的试验中，对汉语普通话音调的辨认和噪音的关系进行了研究。他认为不同的语言利用不同类型的声调使我们口语富于不同的意义，在噪音环境下这些有意义的声调会受到影响，因此他需要发现说普通话的中国人怎样在噪音环境里辨认不同的声调。在试验中他使用 6 个辅元音的音位，同时使用 4 个声调：阴阳上去。其结果表明在信噪比降低的情况下，对汉语声调和元音的识别受到很大影响，从而影响降低言语的理解能力。因此信噪比影响理解中文很重要的因素。这个试验对听觉康复和设计有针对性的助听器具有重要意义。&lt;/p&gt;&lt;p&gt;同时，最近美国成立了一个综合性专家研究小组，开始研制适合中文语音的助听器。该小组成员包括世界闻名的豪斯耳研究院、香港中文大学耳鼻喉科等。与上述研究类似。他们认为在聆听以声调作为识别语音和语义的语言时，如普通话、广东话和泰国语等，可能听觉更重要的是依靠基频相关的信息来理解语言，这是与别的语言不同的。因此，在研制助听器时，我们应该考虑到这些患者的语言特点。&lt;/p&gt;&lt;p&gt;当然，笔者最感兴趣的是最近由威耳康研究基金 (Wellcome Trust) 赞助的一项题为《中文普通话会话者在理解语言时比英文会话者用脑更多》的试验，其目的是使用影像技术来观察和研究中文母语和英文母语说话者大脑出现的不同活动。主持该项研究的心理学家索菲斯高特博士发现，当英语的受试者听到英文时，其左颞叶变得异常活跃，研究者认为这个区是把言语声组合在一起形成独立的字词。但是当中文受试者听到普通话时，其左右颞叶同时活跃起来。显然，由于说不同语言的受试者用他们大脑的不同区域对不同语言的刺激进行解码。这对我们理解这些理论产生了很大的影响。他们进一步认为中文受试者的左颞叶处理语音信号，而他们的右颞叶则处理声调，同时产生意义。言语声是非常复杂的声音，而正确理解言语传递的意思，在这种情况下，大脑会充分利用说话者抑扬顿挫的声调来对其言语进行解码，从而将口语变成有意义的信号。&lt;/p&gt;&lt;p&gt;大脑听觉区域很容易受外部影响，而改变对声音的分辩能力。一旦听觉受到损伤，必需进行康复，大脑需要重新连接和编码。大脑的可塑性是很强的。了解大脑对不同语言的反应，可以有效地帮助听觉患者重新恢复对语言的理解。重要的是基于这些研究，我们可以清楚地看到研制出具有中文语音特征的听力康复设备。记得在 2002 年北京大学和中国残联成立言语听觉中心的开幕式上，邓朴方先生在发言中专门谈到：他第一次听说中文语音处理特征对助听器使用者的影响，他认为这是一个重要课题，需做大量工作，而研制出以中文语音为特征的听觉康复设备将会有重要的意义。根据国际确认的听损发病率，中国有 10 ％的人口，即一亿三千万人有不同程度听力损失，因此，利用中文语音处理技术更有效地帮助听残患者具有非常重要的作用。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;一．中文语音技术处理原理 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;中文语音处理策略的英文词有 &amp;ldquo;Chinese speech processing strategy&amp;rdquo; 或 &amp;ldquo;Chinese speech recognition&amp;rdquo;, （ 中文语音识别 ） 和 &amp;ldquo;hearing aid algorithm&amp;rdquo; （ 助听器算法 ） 等。其中， algorithm ，即 &amp;ldquo; 算法 &amp;rdquo; 一词使用较多，尤其涉及到数字助听器的开发， &amp;ldquo; 算法 &amp;rdquo; 代表了某一特殊技术的核心。 &amp;ldquo; 算法 &amp;rdquo; 可以被简单地看作为实现某些特定信号处理功能的指令序列。中文语音特征可以通过算法研究来形成的。数字信号处理器和算法构成了数字助听器的 DSP 线路。包含多通道动态范围压缩、噪音衰减等处理，设计助听器的算法的主要目标是利用中文语音处理技术，即使在不同的听音环境中，须确保言语被听见并聆听舒适。同时，利用数字助听器改善汉语可懂度，使有听力损失的中国患者能更容易地理解汉语。&lt;/p&gt;&lt;p&gt;汉语是声调单字语言，声调是汉语的重要语音特征之一。声调特征主要体现在嗓音基频随时间变化的模式上。 Eady 技术 (1982) 曾考察过声调语言 &amp;mdash; 汉语的基频模式与重音语言 &amp;mdash; 英语有什么不同。汉语的声调在词语中具有辩意作用，在生活实践当中，大家也都能体会到声调有助于我们听懂别人的话，而 &amp;ldquo; 南腔北调 &amp;rdquo; 常表示不易听懂和不大好懂和不大好听的意思。&lt;/p&gt;&lt;p&gt;对于连续言语来说，长时间平均的正、负颤动因数，各种语言和男女发音人是差不多的。只是负颤动总是比正颤动大，而且出现频率也较高。 Eady 的测量结果表明，汉语的说话速度要比英语慢一些。这可能是由于说汉语时，说话人要花更大的努力在每一个音节上来控制声带运动，也就是说声调语言的音节喉运动控制有较大的语言学负荷，因而花的时间就多一些。结果就表现为说话慢一些。&lt;/p&gt;&lt;p&gt;因此，声调信息主要存在于基频随时间的变化中，强度变化对声调信息有补偿作用，以及清辅音的存在与否对声调清晰度是有一定的影响的。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;原理 &lt;/strong&gt;&lt;strong&gt;(Principles) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;本文介绍一种可应用于数字助听器的提高汉语可懂度的语音处理方法，其目标是使以汉语为母语的听残人士能更容易地理解语言。增强言语可懂度的思路来源于人们的实践经验。回想一下，当你为使一个有听力障碍的人更容易听懂自己说话时所采用的方法：你不仅仅要提高音量，而且还要改变发音方式，说得更慢和更清晰。一些研究表明清楚地读无意义的语句，比在日常会话句子，大约能提高 17% 的单词可懂度。这里所谓说得更清晰是指强调言语信号中的某些暗示，这些暗示有许多不同的形式，如特定音段的持续时间，元音的共振峰位置或者音素之间的过渡等。&lt;/p&gt;&lt;p&gt;不是所有人都会简单地、方便地对听力损失患者 &amp;ldquo; 清楚地 &amp;rdquo; 讲话。因此，我们要采用言语增强的方法就是在说话人和听话人中间构造一个处理模型，该模型能强调并突出语句中的特定成分，使语句听起来更清晰。&lt;/p&gt;&lt;p&gt;一切语音之所以能够表达意义，是由于各个音之间存在区别。这些区别产生于声腔内部的器官和肌肉等活动决定的发音方法和发音部位的差异，同时又表现为语音的声学特征的差异。本文提出的言语增强的方法正是通过对语音信号的重构来强化这些差异。所谓重构是指对语音信号中不同性质的信号进行识别并有针对性地予以处理，强调其中对人的感知起作用的特征，从而达到提高言语清晰度的目的。该方法可以简单地概括为：放大辅音、强调重音和突出声调 .&lt;/p&gt;&lt;p&gt;&lt;strong&gt;汉语语音信号的感知特点 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;声调&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 声调的调类&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 声调的感知&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 主要依据基频的变化&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 声调音高的变化对音长和音强都可能产生影响&lt;/p&gt;&lt;p&gt;&lt;strong&gt;重音 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 轻重音的声学特性&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 与实际音强有密切关系，但并不相等&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 还要受音色、音高和音长的制约&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 感知特点：分辨轻重音时，音强往往并不是决定性因素&lt;/p&gt;&lt;p&gt;&lt;strong&gt;1 ）辅音放大 (Consonant Amplification) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;言语知觉的心理实验证实了如下特点：人在言语感知过程中，对语音信号载荷的关于发音方法和发音部位的分辨信息的知觉能力存在强弱差别。总体上说，人对发音方法比对发音部位有更好的分辨能力。而方法清晰度与辅音清晰度的关系很相近。在汉语辅音的发音方法的知觉重要性中，存在清与浊、送气与不送气、摩擦与非摩擦的从强到弱的位次关系。研究表明，相对加强辅音有助于改善语音清晰度。&lt;/p&gt;&lt;p&gt;Kates 描述了放大辅音的方法，图1是其中被广为采用的一种模型。该系统把信号分解成几个波段，在每个波段检测短时谱形，根据谱形识别元音和辅音，对辅音则给予放大。需要指出的是，杜利民等提出了汉语语音导引特征的概念，从声学信息计算检测的角度为为汉语自动语音识别系统提供了一种辅助匹配结构。&lt;/p&gt;&lt;table border="0"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&lt;p&gt;&lt;img src="http://www.eeworld.com.cn/uploadfile/medical_electronics/uploadfile/200807/20080713083923415.gif" alt="" /&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&lt;strong&gt;图 1 辅音增强系统 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;2) &lt;/strong&gt;&lt;strong&gt;重音 &lt;/strong&gt;&lt;strong&gt;(Stress) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;组成一段语流的各音节声音响亮程度并不完全相等。有的音节在语流中听起来声音比其他音节响亮，这就是重音音节。有的重音和语义、语法有密切关系，如汉语普通话中的词重音。词重音出现在词中，是由于词的含义不同，重读音节的位置也不同。如 &amp;ldquo; 技术 &amp;rdquo; 和 &amp;ldquo; 计数 &amp;rdquo; ，重音分别在第一音节和第二音节。这种语意的区别是通过 &amp;ldquo; 超音段特征 &amp;rdquo; 来表达的。&lt;/p&gt;&lt;p&gt;在汉语中，重音对韵律特征参数的影响倍受关注。语流中 &amp;ldquo; 韵律特征 &amp;rdquo; （ prosodic feature ）是通过音高、音长和音强的变化，即 &amp;ldquo; 超音段特征 &amp;rdquo; 表现出来。从语图上观察，音域明显扩张重音的特点。高明明对普通话语句汇总强调重音的声学表现进行了研究，指出：（ 1 ） &amp;ldquo; 音高升高是普通话语句中强调重音的重要韵律特征 &amp;rdquo; 。（ 2 ）音高和时长对于强调重音的实现具有同样重要的作用。它们之间的关系是对立互补的。&lt;/p&gt;&lt;p&gt;语音合成的经验告诉我们，音高是调节重音最有效的手段，所以强化重音的方法主要是提高音高。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;3) 声调 (Tone and Internation) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;一个音节除了包括由元音和辅音按时间顺序排列成系列的音质单位以外，还必须包括一定的音高、音强和音长。在一些语言里，音高在音节中起的作用可以说是和元音、辅音同样重要，这种能区别音节的意义的音高就是 &amp;ldquo; 声调 &amp;rdquo; 。根据声调的有无可以把世界上的语言分为声调语言和非声调语言两大类。汉、藏语系语言最突出的一个特点就是有声调。&lt;/p&gt;&lt;p&gt;汉语普通话的声调起着构词辩意的作用。对于具有相同拼音的一个音节，由于声调不同，可以具有不同的含义。普通话单音节的声调变化共有四种模式，不同的声调反映在语音参数上是基音频率轨迹的变化不同。根据实验观察所定义的一些规则，可以认为基音频率轨迹的某一参数超越某一预先确定的门限时，则可判为某一声调类型。在此基础上，黄泽镇、杨行峻提出的识别模式采用基音轨迹曲线的一、二次斜率、谷点和平坦度对四种声调有很强的区别性，实验表明，这一算法的结果识别率可达到 99% 。&lt;/p&gt;&lt;p&gt;林茂灿指出声调信息主要存在于主要元音（及其声学过渡）上。考虑到声调音高的变化，对音长和音强都可能产生影响，即：去声最短、最强，上声最长，最弱，阴平和阳平举重，阳平又往往比阴平略长一些。声调的增强不能简单地对主要元音进行放大，而应该不同的声调在音高和音强上有不同的处理。实际应用中我们采取如下策略：（ 1 ）对去声增强音强（ 2 ）对上声加大音长（ 3 ）对阴平和阳平不改变。 图 3 展示的 4 条声学曲线分别描述了四声在不同时间里的频率特征。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;img style="width: 298px; height: 246px;" src="http://www.eeworld.com.cn/uploadfile/medical_electronics/uploadfile/200807/20080713083740412.jpg" alt="" width="358" height="277" /&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;图 3 汉语四声的声调声学特征&lt;/p&gt;&lt;p&gt;&lt;strong&gt;2. 方法 (Methodology) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;数字助听器的核心部分是增益计算，基于频域的处理过程，它建立了各频率段的输入瞬时能量与增益的函数关系，如图3所示，对每个频段的瞬时能量进行短时能量累计和长时间慢速平均可获得信号识别和分类所必要的数据。其中：&lt;/p&gt;&lt;p&gt;（ 1 ） E j (n)= a E j (n-1) 式中： a 是时间常数&lt;/p&gt;&lt;p&gt;（ 2 ）使用倒谱算法提取基频， 512 个点 FFT ， 40ms 汉明窗，窗移为 10ms&lt;/p&gt;&lt;p&gt;（ 3 ）用一个简单的滑动平均算法对每个音节测到的基频进行平滑处理，剔除那些平滑段内偏离均值过大的值。&lt;/p&gt;&lt;p&gt;（ 4 ）音高和音长分别进行归一化&lt;/p&gt;&lt;p&gt;（ 5 ）采用一个二次曲线在最小均方误差的意义下逼近基音轨迹。并计算曲线的一次斜率、二次斜率、谷点和平坦度。&lt;/p&gt;&lt;p&gt;上述算法采用基于 TOCCATA 指令系统的汇编语言实现。 14 位 A/D ，采样率设为 32KHz 。&lt;/p&gt;&lt;table border="0"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;图3 . 汉语言语增强系统处理结构图&lt;/p&gt;&lt;p&gt;&lt;strong&gt;1). 语音的切分 (Classifications of Phonemes) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;声波由音质（即音色）、音高、音强和音长四部分组成，这四部分在语音中起着不同的作用，但在时间上又是同时并存的。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 音质成分 &amp;mdash;&amp;mdash; 按音节划分，如元音、辅音&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 超音质成分 &amp;mdash;&amp;mdash; 由音高、音强和音长三部分组成，附着于一个音节或音段上。&lt;/p&gt;&lt;p&gt;从声波特性上看，可以由基频确定音高，根据振幅确定音强，根据时间确定音长。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;2). 处理原理 (Algorithm Principles) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;中文语音处理主要体现在 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 验配过程中&lt;/p&gt;&lt;p&gt;在验配过程的中，考虑中文语音长时间频谱覆盖的频率作加权处理，抬高目标曲线中言语频率的部分，可以达到加强语音理解的作用。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 助听器处理中&lt;/p&gt;&lt;p&gt;在助听器的信号处理程序中，对压缩控制器做特别的设置，使对高频的信号压缩的启动时间和释放时间很短 , 做到使辅音清晰化的效果，增强使用者对言语的理解度。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 在降噪处理的策略中&lt;/p&gt;&lt;p&gt;在降噪处理中，根据中文语音在噪音环境中的采样分析，得出了为中文语音优化的降噪策略。实验证实，该策略最高可以提高信噪比 18dB 。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;二．中文语音处理技术在涉及助听器的应用 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;下面是将中文语音技术应用到设计助听器的具体实例。这项技术采用了目前世界上最先进的 DSP 数字技术，包括低功耗的数字芯片。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;1. TOCCATA &lt;/strong&gt;&lt;strong&gt;数字信号处理系统 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;Toccata TM 系统是微型、超低功耗、高效率的数字信号处理系统。它包括一个高保真加权叠加滤波器组（ WOLA filter bank ）、一个 16 位 DSP 核心、两个 14 位 A/D 转换器、一个 14 位 D/A 转换器和其它外围设备。 Toccata TM 技术提供标准的软件可编程的 DSP 开发平台和采用 0.18 &amp;mu; 工艺制造的微型超大规模集成电路。它不但为音频处理系统制造商也为其它基于 DSP 的微型、低功耗产品的开发提供了便利。 [4]&lt;/p&gt;&lt;p&gt;&lt;strong&gt;a. &lt;/strong&gt;&lt;strong&gt;硬件结构 &lt;/strong&gt;&lt;strong&gt;(Hardware Structure) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;图4 硬件系统结构图 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;img src="http://www.eeworld.com.cn/uploadfile/medical_electronics/uploadfile/200807/20080713083742662.jpg" alt="" width="436" height="279" /&gt;&lt;br /&gt;&lt;br /&gt;TOCCATA 系统由三块芯片组成，一个 &amp;ldquo; 模拟 &amp;rdquo; 芯片（ ALPHA ），一个 &amp;ldquo; 数字 &amp;rdquo; 芯片（ DELTA ），和一个用于无电存储的 E 2 PROM 芯片。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;ALPHA &lt;/strong&gt;&lt;strong&gt;芯片 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;ALPHA 芯片包括输入和输出放大器，二个 A/D 转换器，一个 D/A 转换器，以及主时钟及供电系统。 &lt;br /&gt;&lt;br /&gt;&lt;strong&gt;DELTA &lt;/strong&gt;&lt;strong&gt;芯片 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;DELTA 芯片包括了 16 位软件可编程 DSP 核心，一个 WOLA 滤波器组协处理器，一个 DMA 控制器（输入输出处理器或 IOP ）和存储器（ RAM 和 ROM ）。可编程核心和灵活的滤波器的组合允许通过软件改变信号的处理方式。因而，该结构可以执行传统的音频处理系统处理方案（例如双通道压缩），当然通过 DSP 核心，也可以执行更强大的处理方案（例如 16 通道乃至更多通道的压缩，降噪，抑制反馈等）。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;DSP &lt;/strong&gt;&lt;strong&gt;核心和指令系统 &lt;/strong&gt;&lt;strong&gt;(DSP Core) &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;RCORE 是一个灵活的 DSP 核心，采用带单周期连乘累加操作和 40 位累加器的双哈佛结构。外围组件通过一个由扩展寄存器、存储器映象寄存器和共享存储器组成的复合体提供。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;信号路径 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;图5 . Toccata 系统提供的信号路径：&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;img src="http://www.eeworld.com.cn/uploadfile/medical_electronics/uploadfile/200807/20080713083743331.jpg" alt="" width="468" height="154" /&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;Intelligia &lt;/strong&gt;&lt;strong&gt;数字助听器结构 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;Intelligia 全数字助听器是基于上述介绍的芯片的技术特点设计的，其结构可由图 6 表明。尽管同模拟助听器一样，数字助听器也使用麦克风和接收器作为能量转换器，但在数字信号处理器中经 A/D 采样后，电平信号已被转化为数字编码。数字编码能够非常灵活地被加以利用来提供增益、改善频响，或按患者听力的要求作其它处理。当 DSP 算法完成后，数字编码又被 D/A 转换为电平信号，并经由接收器转换为声音。&lt;/p&gt;&lt;p&gt;数字助听器的关键在于具有信息处理系统，这里以一款基于现进数字信号处理系统 Toccata TM ，开发出的全数字助听器 Intelligia ，具有独特的中文语音处理功能。 Intelligia 助听器在设计中将信号分解成 16 个波段滤波处理，再将 16 个波段的信号组成 10 组通道，每个通道独立使用输入自动增益控制方法 (AGCi) ，对信号进行压缩处理，每个通道使用快慢两个时间侦测器，快速时间侦测器用以监视信号较快的变化，而慢速时间侦测器侦测较慢的信号变化，也就是音节的变化，并且选用与中文语音变化相匹配的压缩、释放时间常数，达到更好的听觉效果。&lt;/p&gt;&lt;p&gt;Intelligia&amp;trade; 全数码助听器技术特点&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;中文语音信号处理 &lt;/strong&gt;深入研究中文和其他声调语言的发声特征后，我们把独创的中文语音处理的技术置入 Intelligia&amp;trade; ，使它能大大提高在中文语言环境中听音的可懂度。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;更快 &lt;/strong&gt;Intelligia&amp;trade; 采用专为数字助听器设计的第 3 代数字助听器处理系统 TOCCATA ，它强大的运算能力使 Intelligia&amp;trade; 能快速处理各种语音信号。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;更省电 &lt;/strong&gt;Intelligia&amp;trade; 的工作电流不足 1 毫安，并且它能在无信号输入时自动进入省电模式，如此低的能耗免去配戴者经常更换电池之苦。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;完全可编程 &lt;/strong&gt;Intelligia&amp;trade; 通过其可编程的优点为听障者配置最适合的听力补偿程序和参数，从而保证配戴者可以获得最佳的听音效果。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;多通道独立压缩 &lt;/strong&gt;Intelligia&amp;trade; 把外界的声音按频率细分成多个波段和通道，并对每个波段和通道的信号进行不同的处理，从而保证配戴者听到更清晰、更逼真的声音。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;降噪处理 &lt;/strong&gt;Intelligia&amp;trade; 能有效地抑制环境噪音，提高辨别语言的能力，从而保证配戴者无论是在嘈杂的大街还是在喧闹的超市都能听到清晰的声音。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;方向性处理 &lt;/strong&gt;Intelligia&amp;trade; 可配置一个方向性麦克风系统和相应的软件，能使降噪的效果更好，从而保证配戴者听到更清晰、更自然的声音。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;声反馈抑制 &lt;/strong&gt;助听器在使用过程中容易引起啸叫，这种现象即声反馈。 Intelligia&amp;trade; 采用了声反馈抑制技术，能有效地抑制声反馈的出现，使配戴者听到更为舒适的声音。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; &lt;strong&gt;可轻松升级 &lt;/strong&gt;由于 Intelligia&amp;trade; 采用全开放的数字信号处理（ DSP ）平台 TOCCATA 技术，提供了可编程的能力，具有充分的适应性以及升级能力，因此，配戴者只要采用我们的软件，就可以立刻享受到最新的功能。下面是这款中文语音处理的技术指标对比 :&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;表 1 Intelligia&amp;trade; 中文语音技术处理助听器和其它助听器的技术比较 &lt;br /&gt;&lt;img src="http://www.eeworld.com.cn/uploadfile/medical_electronics/uploadfile/200807/20080713083747219.jpg" alt="" width="491" height="250" /&gt;&lt;br /&gt;&lt;br /&gt;在实验室中，具有中文言语增强方法的数字助听器 Intelligia ，初步实验的结果表明，中文语音处理技术的运用，可帮助以汉语为母语的患者更好地理解语言，提高康复水平。在临床使用中，佩带 Intelligia 助听器的病人感觉效果很好，尤其在噪声环境中，增强了语音清晰度。从某种意义上讲，病人感到理解语言的能力得到提高。当然，我们必须意识到中文语音处理技术在全数码助听器中的运用仍处在早期研究阶段。笔者认为听力学科学家和助听器专家应从下列几方面作更深入的研究：&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 应对以英文和汉语为基础的语音处理技术作深入的对比研究，尤其是在噪音环境中，观察两种技术分别对两种语音不同处理的效果。最理想的实验条件应是利用有双语能力的受试者参加。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 将中文语音处理技术和目前使用的非线性助听器验配法结合研究，观察以英文为基础制定的验配方法，是否在中文语音处理技术支持下，更有效地帮助以汉语为母语的患者在日常生活中提高言语理解能力。&lt;/p&gt;&lt;p&gt;&amp;bull;&amp;nbsp; 中文语音处理技术目前是人机对话的研究热门之一，其算法复杂多样，我们应该更深入地研究具有中文特色的助听器技术算法，充分发挥数码芯片的巨大潜力。&lt;/p&gt;&lt;p&gt;将中文语音处理技术运用到听力器设备中去才刚刚开始，这是一项非常复杂、涉及许多尚未解决的技术问题的课题。但是，笔者认为只有开发出具有汉语语音特色的助听器，才能更有效地帮助众多的以汉语为母语的听残者。&lt;/p&gt;&lt;p&gt;&lt;strong&gt;参考文献 &lt;/strong&gt;&lt;/p&gt;&lt;p&gt;Picheny, M., Durlach, N., and Braida, L. (1985). Speaking clearly for the hard of hearing. I: Intelligibility differences between clear and conversational speech. Journal of Speech and Hearing Research 28:96-103.&lt;/p&gt;&lt;p&gt;张家录，言语知觉反映论，中国科学， 1978 ； 5 ： 519-530&lt;/p&gt;&lt;p&gt;张家录、齐士钤、吕士楠，汉语辅音知觉结构初探，心理学报， 1981 ； 1 ： 76-85&lt;/p&gt;&lt;p&gt;Kates, J.M. (1984). Speech intelligibility enhancement. U.S. Patent 4,454,609.&lt;/p&gt;&lt;p&gt;杜利民、候自强，&amp;ldquo;汉语塞音选择性特征自动萃取的小波变换方法&amp;rdquo;， 声学学报。第 21 卷第 6 期&lt;/p&gt;&lt;p&gt;许洁萍、初敏、贺琳、吕士楠，&amp;ldquo;汉语语句重音对音高和音长的影响&amp;rdquo;，声学学报。第 25 卷第 4 期&lt;/p&gt;&lt;p&gt;赵开江，杨行峻，&amp;ldquo;汉语普通话孤立字的四声识别&amp;rdquo;，第三届语音、通信与图象处理论文集。&lt;/p&gt;&lt;p&gt;黄泽镇、杨行峻，&amp;ldquo;普通话孤立字四声的一种模式识别方法&amp;rdquo;，声学学报。第 15 卷第 1 期&lt;/p&gt;&lt;p&gt;林茂灿，&amp;ldquo;北京话声调分布区的知觉研究&amp;rdquo;，声学学报，第 20 卷第 6 期&lt;/p&gt;&lt;p&gt;10. Wang, Chao, Prosodic Modeling for Improved Speech Recognition and Understanding (2000), Doctoral dissertation,&lt;/p&gt;&lt;p&gt;11. Tsai, Ming-yi, Chou, Fu-chiang, Lee, Lin-shan, Pronunciation Variation Analysis with respect to Various Linguistic Levels and Contextual Conditions for Mandarin Chinese (2000)&lt;/p&gt;&lt;p&gt;12. Bo Xu Bing , Ma Shuwu Zhang, Fei Qu and Taiyi Huang, Speaker-independent Dictation of Chinese Speech with 32K Vocabulary (2000)&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 转自: &lt;a href="http://zou200904.spaces.eepw.com.cn/articles/article/item/49280"&gt;http://zou200904.spaces.eepw.com.cn/articles/article/item/49280&lt;/a&gt;#&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2321232.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2012/01/13/2321232.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2011/12/22/2298255.html</id><title type="text">如何防止话筒拾音的声学相位抵消?</title><summary type="text">设想一下你以单声道的模式为一个吉他歌手做扩声，一支话筒拾取人声，另一支话筒拾取箱琴。人声听起来比较古怪，有点“空”，同时有滤波器之类的效果声。为什么会这样？主唱话筒拾取歌手的演唱，同时拾取箱琴的话筒也串入了歌手的声音（见图1）。吉他话筒离主唱话筒的距离大概有一英尺。因此，吉他话筒中拾取的人声相对于主唱话筒有一定的延时。所以，有两个“人声”混合在一起，一个是直接声，一个是含有延时的声音。图1当两支话筒的声音混合在一起，等电平延时信号的中心频率将抵消。从频谱上看，在两个信号频率重合的地方会出现连续的凹陷，这里就是声音抵消频率。这种现象称作“梳状滤波器效应”，因为从频谱上看象是朝下的梳齿。一般来说，</summary><published>2011-12-22T10:02:00Z</published><updated>2011-12-22T10:02:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2011/12/22/2298255.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2011/12/22/2298255.html"/><content type="html">&lt;p&gt;设想一下你以单声道的模式为一个吉他歌手做扩声，一支话筒拾取人声，另一支话筒拾取箱琴。&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;人声听起来比较古怪，有点&amp;ldquo;空&amp;rdquo;，同时有滤波器之类的效果声。为什么会这样？主唱话筒拾取歌手的演唱，同时拾取箱琴的话筒也串入了歌手的声音（见图1）。吉他话筒离主唱话筒的距离大概有一英尺。因此，吉他话筒中拾取的人声相对于主唱话筒有一定的延时。所以，有两个&amp;ldquo;人声&amp;rdquo;混合在一起，一个是直接声，一个是含有延时的声音。&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;img style="cursor: hand;" title="点击放大" src="http://www.guitarscustom.com/admin/uploadray911/200753195052729.gif" alt="" name="photo" border="0" /&gt;&lt;br /&gt;&lt;br /&gt;图1&lt;br /&gt;&lt;br /&gt;当两支话筒的声音混合在一起，等电平延时信号的中心频率将抵消。从频谱上看，在两个信号频率重合的地方会出现连续的凹陷，这里就是声音抵消频率。这种现象称作&amp;ldquo;梳状滤波器效应&amp;rdquo;，因为从频谱上看象是朝下的梳齿。&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;一般来说，如果两支话筒以不同的距离拾取了同一个声源，而且它们的信号被混合到一个通道，就可能出现相位抵消。频谱上凹陷的位置，是声波中心频率反相的结果。声音听起来像是加了少量的柔软的flanging效果。&lt;br /&gt;事实上，我们分析一下flanger效果的原理就知道其中的道理。Flanger效果是通过一个0到20毫秒之间自动扫描的数字延时产生的，flanger效果就是&amp;ldquo;梳状滤波器效应&amp;rdquo;，在软件的频谱上看是一个上下滑动的滤波器。&lt;br /&gt;&lt;br /&gt;3:1原则&lt;br /&gt;&lt;br /&gt;为了减少两支话筒之间的相位抵消，我们必须遵守话筒摆位的3:1原则：话筒之间的距离不少于单个话筒与声源距离的3倍（见图2）。例如，两支话筒离声源的距离都是4英寸，那么话筒之间的距离至少是12英寸才可以避免相位抵消。&lt;br /&gt;&lt;br /&gt;&lt;img style="cursor: hand;" title="点击放大" src="http://www.guitarscustom.com/admin/uploadray911/20075319505251.gif" alt="" name="photo" border="0" /&gt;&lt;br /&gt;&lt;br /&gt;图2&lt;br /&gt;&lt;br /&gt;3:1原则是怎么被定义的？它是由下面这些事实决定的：&lt;br /&gt;&lt;br /&gt;当你将一个延时信号等电平的与直接声混合，将会产生一个严重的梳状滤波器效应。但是当你将直接声和延时信号按不同的电平来混合，梳状滤波器效应就会减小。&lt;br /&gt;&lt;br /&gt;&lt;img style="cursor: hand;" title="点击放大" src="http://www.guitarscustom.com/admin/uploadray911/200753195052299.jpg" alt="" name="photo" border="0" /&gt;&lt;br /&gt;一支话筒拾取的干净的声音，下载: 干净的声音音频文件&lt;br /&gt;&lt;a href="http://www.ogdev.net/download/2006/clear.rar" target="_blank"&gt;&lt;span style="color: #fc14b1;"&gt;http://www.ogdev.net/download/2006/clear.rar&lt;/span&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;span style="color: #fc14b1;"&gt;&lt;img style="cursor: hand;" title="点击放大" src="http://www.guitarscustom.com/admin/uploadray911/200753195052507.jpg" alt="" name="photo" border="0" /&gt;&lt;br /&gt;&lt;/span&gt;我对下面的通道加了5毫秒的延时,模拟两支话筒不同距离拾音时产生的梳状滤波器效应。下载: 梳状滤波器效应音频文件&lt;br /&gt;&lt;a href="http://www.ogdev.net/download/2006/kh0o_comb_filter_effects.rar" target="_blank"&gt;&lt;span style="color: #fc14b1;"&gt;http://www.ogdev.net/download/2006/kh0o_comb_filter_effects.rar&lt;/span&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;一般来说，当延时信号低于直接信号9dB的时候，梳状滤波器效应大概在+/- 1 dB左右，几乎听不出来。（穿插我以前的研究成果：在一次录音中，我突然发现了梳状滤波器效应，于是开始检查录音系统。后来我发现数字录像机的返回监听信号，又被按送入录像机。因为数字录像机的带后延时，就造成了梳状滤波器效应。经过研究，延时信号在低于直接信号12dB的情况下，梳状滤波器效应就已经不太明显。后来我在电视台做嘉宾访谈类节目录音的时候，就将这个研究成果应用到实践中。当某人讲话出现梳状滤波器效应的时候，我利用调音台上的Solo功能分析出哪个话筒过多串入了这个人的语言信号，并努力将这个串入的电平维持在低于说话人电平的12dB以下。）&lt;br /&gt;&lt;br /&gt;&lt;img style="cursor: hand;" title="点击放大" src="http://www.guitarscustom.com/admin/uploadray911/200753195052915.jpg" alt="" name="photo" border="0" /&gt;&lt;br /&gt;&lt;br /&gt;对延时信号通道衰减9dB，梳妆滤波器效应变的不明显。下载： 衰减9dB音频文件&lt;br /&gt;&lt;a href="http://www.ogdev.net/download/2006/nkdr_fu9dBu.rar" target="_blank"&gt;&lt;span style="color: #fc14b1;"&gt;http://www.ogdev.net/download/2006/nkdr_fu9dBu.rar&lt;/span&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;我们是如何确定那个远处话筒拾取的延时信号，低于近距离拾音话筒9dB？只要两支话筒符合3:1原则，根据反平方定律，当距离增加到三倍的时候电平衰减9.54 dB。（这里有个条件，两支话筒的增益和灵敏度完全一样。）&lt;br /&gt;&lt;br /&gt;所以3:1原则保证了远处话筒的拾取的延时电平低于9 dB，因此混合信号的梳状滤波在+/- 1 dB或更低，如果话筒的摆位按照4:1以上的比例声音会更好。3:1原则只是避免容易被听见的梳状滤波器效应的最低标准。&lt;br /&gt;&lt;br /&gt;设想一下下面的这种情况，主唱话筒近距离拾音，歌手的声音非常大，远处话筒拾取吉他，但吉他的声音很小。话筒虽然按照3:1原则摆放，但是你不得不增大吉他话筒的增益，因为吉他的声音太小。如果这样，你可能就破坏了9 dB的电平标准，因为吉他话筒的增益太高，歌手演唱的声音很大。&lt;br /&gt;&lt;br /&gt;这个时候就不光是3:1摆位原则可以解决的了。理想情况下，两支话筒拾取同一乐器的电平低于9 dB可以得到不错的音质。但9 dB只是最低要求，不是正好达到9 dB就可以获得好的效果。&lt;br /&gt;&lt;br /&gt;这里有一些避免两支话筒之间相位抵消的技巧&lt;br /&gt;&lt;br /&gt;-近距离拾音，利用EQ衰减过度的低频。&lt;br /&gt;-将乐器之间距离拉开。&lt;br /&gt;-利用拾音器代替话筒。&lt;br /&gt;-对主唱话筒做1毫秒的延时。主唱话筒和吉他话筒拾取的信号，在时间上就对位了。&lt;br /&gt;-使用指向性话筒，一支向上，一支向下。例如，主唱话筒从下往上，吉他话筒从上往下。-如果使用两支心型指向话筒，方向相反，两支话筒之间的距离在低于3:1原则的情况下，还是可以得到不错的音质。&lt;br /&gt;&lt;br /&gt;另外一些防止相位抵消的技巧：不要用两支话筒拾取一个声源。例如，只用一个话筒拾取演讲者的语言。在某些情况下，如果你必须使用两支话筒混合到一个通道，请将两支话筒的话筒头靠在一起。通过这样的方法，两支话筒之间没有延时，也就自然不会出现梳状滤波器效应。&lt;br /&gt;&lt;br /&gt;一些例外的情况&lt;br /&gt;&lt;br /&gt;什么情况下可以用两支话筒以不同的距离拾取同一声源？在立体声录音的时候。这时，你得到的不是相位抵消，是声像。乐器在音箱中的位置取决于两支话筒之间的延时，电平和你控制的声相位置。&lt;br /&gt;&lt;br /&gt;设想将一支话筒的声相放到极左，另外一支放到极右。如果两支话筒之间的延时位0毫秒，两支话筒的电平一样，声相将在两只音箱中间。如果有0.5毫秒的延时，声相将偏离中间一半的位置。如果延时达到1.5毫秒，声相将完全偏到某一只音箱。&lt;br /&gt;&lt;br /&gt;你即使只用一支话筒也无法防止相位抵消，想想为什么？&lt;br /&gt;&lt;br /&gt;(Bruce Bartlett是国际顶级的话筒技术工程师/自由撰稿人，同时他也是录音师，音频杂志记者。.)&lt;/p&gt;&lt;p&gt;转自: &lt;a href="http://www.guitarscustom.com/ztjz_show.asp?tid=ff6&amp;amp;ztid=67"&gt;http://www.guitarscustom.com/ztjz_show.asp?tid=ff6&amp;amp;ztid=67&lt;/a&gt;&lt;/p&gt;&lt;p&gt;&lt;br /&gt;&amp;nbsp;&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2298255.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2011/12/22/2298255.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry><entry><id>http://www.cnblogs.com/huaping-audio/archive/2011/12/15/2289109.html</id><title type="text">音箱的指向性(转)</title><summary type="text">音箱的指向性---相当不错的文章</summary><published>2011-12-15T08:47:00Z</published><updated>2011-12-15T08:47:00Z</updated><author><name>刘品</name><uri>http://www.cnblogs.com/huaping-audio/</uri></author><link rel="alternate" href="http://www.cnblogs.com/huaping-audio/archive/2011/12/15/2289109.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/huaping-audio/archive/2011/12/15/2289109.html"/><content type="html">&lt;p&gt;大部分音频方面的专家都了解，有些房间必须要安置具有指向性的音箱系统，还有一些则建议使用全向性的音箱系统。最终选择哪种系统将取决于两个因素，即音箱的位置和房间的内部结构，但总的来说，在反馈直接与音箱的指向性因数Q成比例的前提下，可以根据下面的等式得出最大的声波增益值。在下列等式中，Q指音箱在某一特定指向上传播声音，及防止声音散射的能力。特定情况下，Q等于从发声器到某一固定距离和特定方位的声压平方与同一距离所有方向上的声压平方平均值的比。Q与理想情况下音箱的水平方向和垂直方向辐射角度有关，计算公式为：Q=180/这里&amp;theta;=水平方向辐射角度，&amp;phi;=垂直方向辐射角度。&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="center"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/2007211726625.jpg" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 虽然Q在计算声音增益时是有用的，但知道不同频率下的有效水平和垂直辐射角度对于系统设计则更有帮助。刚才所提到的&amp;ldquo;不同频率&amp;rdquo;是一个关键因素，因为任何音箱或音箱系统的指向性总是随着频率的不同而有变化。下面我们将帮助你了解在不同频率时指向性的变化，并给出一个理想参数，以及关于指向性性能方面一些夸大的说辞，以免轻信产品厂商的广告。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd2220;"&gt;惠更斯定律&lt;br /&gt;&lt;/span&gt;&lt;/strong&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 任何在其表面具有恒定相位的声辐射器，如低频锥形喇叭或静电板式喇叭在低频下工作时，声音向四面散射，随着频率越高则指向性越强。具有指向性的原因可通过Huygen定律来解释，即任何反射表面都可被细分为由若干独立的小平面组成，每个小平面都是向四面反射。我们假设锥形表面的其中一处为A，另一处为B(如图2)，那么就可得出A和B到任意一个指定接听点P的声音传播效果。&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="center"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/2007211726281.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td&gt;&lt;p align="center"&gt;&amp;nbsp;&lt;span style="color: #dd2220;"&gt;&lt;strong&gt;图2：如何计算指向性&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 如果振膜表面的两点到接听点的距离相等，则这两点传输过来的声波在接听点将会叠加。如果在某个频率下，来自A点的声波传输时间比来自B点的声波传输时间多半个周期，则接听点处这两个声波的相位将互相抵消。通过对其微积分，就可得出在任何接听点处，锥形喇叭或任何喇叭的整体频响。在某一频率下，锥形喇叭的整体频响可被分解为不同的定向辐射模式(图4)。&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="center"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/2007211726437.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td&gt;&lt;p align="center"&gt;&lt;strong&gt;&lt;span style="color: #dd2220;"&gt;图4：辐射瓣的指向性 &lt;/span&gt;&lt;/strong&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 图4根据不同的ka值进行了分类，ka为锥形喇叭的半径和波数的乘积。(k=2&amp;pi;f/c，其中f是频率，c是声速)通过计算，我们发现ka只是周长与波长的比。我们知道，1kHz声波的波长约为1英尺，且波长与频率是成反比的，因此，对于1个15英寸的喇叭而言，周长约为4英尺，所以就可将ka等于1的图用在一个250Hz的15英寸喇叭上，如果是一个12英寸的喇叭，则相应的频率应为333Hz。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 要注意的是，当频率高于ka=1时的频率值时，声音才会具有指向性。通常来说，在ka&amp;lt;=1的频率下，锥形喇叭辐射声波时就像在进行活塞运动一样，整个振动表面以同相向外辐射声波。但当频率高于上面所提到的值时，现实中锥形喇叭整个振动面将不会同相辐射声波，所以ka&amp;gt;=1时图2的曲线图基本上在现实情况下是不适用的。&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="right"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/2007211727406.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 这样，在更高频率下，现实中锥形喇叭的指向性模式与相同尺寸的活塞式喇叭的理论模式是不同的。总的来说，在更高频率下，锥形喇叭的指向角度范围(锥形喇叭的不同部分相互之间是异相的)比真正的活塞式喇叭的辐射角度更广。同时，任何锥形音箱的指向性在频率增加时都会变的更窄。这就是著名的聚束效应。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd2220;"&gt;两种方法&lt;/span&gt;&lt;/strong&gt;&lt;br /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 为了控制声音的传播，我们希望喇叭的声波辐射具有指向性，现在有两种方法可以达到这种效果：号角形喇叭和阵列形喇叭。设计很好的号角形喇叭其阵膜做的很小，但性能却很强大，它生成一个球形波阵面，球形半径主要由喇叭的外型和出声口大小决定。阵列式喇叭采用一组更小辐射体形成的界面效应，来生成相同种类的波阵面。在两个例子中，指向性是频率的唯一控制标号，其波长等于或小于喇叭的周长。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;线性阵列喇叭中，线长必须约是波长的0.6倍，若需要产生指向性控制的话，则更长。两种方法没有一种可提供更好的手段来达到低频指向性的效果：事实上，同样尺寸的单个喇叭在最低频率下反而是效果最好的。然而，在更高的频率下，号角式或阵列式喇叭的指向性比单个驱动喇叭的指向性更好控制，且设计操作更方便。&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="right"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd2220;"&gt;无挡板音箱&lt;/span&gt;&lt;/strong&gt;&lt;br /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 另一个种类的辐射体可被用来满足指向性需求，且在低频率下也有作用，甚至无需大量的辐射体。该系列中最简单的一种就是无挡板音箱，也称为偶极辐射体。因为该音箱从喇叭两边辐射声音的幅度相同，但相位相反，在圆锥轴向的平面上相互正交，所有辐射声波都相互抵消了。这样，其指向性就如图8所示。如果将适当的声阻置于锥形喇叭的后面，就可得到其他指向性模式，如超心形或心形(象麦克风的模式)。对一个给定的低频输出量而言，该技术相应要付出的是高得多的锥形偏移。这种技术对音箱的机械性和温度设计有很高的要求。&lt;/p&gt;&lt;p align="center"&gt;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/200721173093.gif" alt="" border="0" /&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 喇叭是声音通过的通道，即从驱动端(喉)到辐射端(嘴)的一个逐渐扩大的横截面区域。在非常低的频率下，喇叭对声音而言是基本透明的，驱动端的动作就好象喇叭是不存在的一样。然而，当频率大于某个特定的频率阈值时，喇叭开始起到一个声音转换的作用，将低声阻(低压，大体积速率)的嘴端转换到高声阻(高压，低体积速率)的喉端。这种转换极大的增加了发射系统的效率，通常为12dB或更高，且减小了偏移和相关偏移失真(这是最常见的失真种类)。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 在嘴和喉之间，当声音穿过喇叭时，被放大了，在这种情况下，喇叭产生了低端阈值频率和指向性辐射。&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="center"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/200721173406.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 喇叭的指向性辐射可分成三个频率区域进行讨论(图6)。在最低频率区域，辐射从四散到确切的指向性。在中间区域，喇叭按你所希望的那样，通过检查其喇叭壁来指引声音：直平壁的指向性是恒定的，而弯曲的四散壁的指向性则随频率增加增加。在最高频率区域，由驱动器的半径来控制指向性。&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="center"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/200721173187.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td&gt;&lt;p align="center"&gt;&lt;strong&gt;&lt;span style="color: #dd2220;"&gt;图6：号角的指向性辐射&lt;/span&gt;&lt;/strong&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 但还有两个并不是很明显的特性，第一个是：在喇叭嘴控制区域以上，指向性缩窄了约半个八度，称之为&amp;ldquo;腰带&amp;rdquo;。第二个是，如果喇叭壁的形状不是直的，则喇叭需要在更高的频率才能工作。基本上，关于第一个半波传送，声波与喇叭壁表面是一致的。之后，即使喇叭壁分裂，由于是在一个指数曲线形喇叭中，所以声波不再与喇叭壁一致。这样，在喉端缓慢膨胀的喇叭在高频处比低频处更具指向性。&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="right"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/200721173500.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd2220;"&gt;放射性喇叭&lt;/span&gt;&lt;/strong&gt;&lt;br /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 所谓放射性喇叭，即通过在水平面维持一个恒定的圆锥形声波辐射，在垂直面则极大的脱离锥形面。这样，不同频率下的水平指向性几乎是恒定的，但在垂直平面上，喇叭的指向性则有很大不同。在有些应用场合，垂直指向角度只需10或20度就够了，但在水平方向却需要一个90或更广的指向角度，这时放射性喇叭就最适用了。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 喇叭指向性的最上限是由喉端的指向特性决定的，通常由压缩驱动器所在的开口处来定义。这样一个带25毫米驱动器的喇叭可以比一个50毫米驱动器喇叭拥有更广的高频辐射模式。当频率高于某个特定频率(即驱动器周长等于波长时的频率)，就会发生这种转换：25毫米驱动器为5kHz或50毫米驱动器为2.5kHz。(当然，在此频率时，转换的发生由喇叭的壁角和驱动器开口来决定。)&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 增大高频辐射角度的方法之一是在驱动器的相位插座前端使用&amp;ldquo;子弹&amp;rdquo;。模拟和测量喇叭工作时可以看出，这些器件增加了频率响应的不规则性。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 其底线是，一个90度*40度的喇叭在前面提到的中间频率区域仅有90度*40度的辐射范围。在喇叭能提供指向性控制的频率范围内，该范围内的最低频率值就是喇叭尺寸等于0.6倍波长时的频率。这样，一个在低价系统中常见的1英寸*10英寸喇叭，如果水平排成很长的一排，其具有指向性控制的最低频率值的近似计算方法为：垂直方向的长度=0.6*波长时的波长为4英寸/0.6=6.67英寸，则响应的频率为f=c/&amp;lambda;=13620英寸/6.67英寸=2257Hz。&lt;/p&gt;&lt;p&gt;水平长度为垂直高度的2.5倍时是最佳情况，所以频率比2.5倍(902Hz)更低。事实上，大多数喇叭所具有的是一个指数辐射面(即弯曲的喇叭壁)，所以他们在高频处辐射时，如10kHz时的指向性或许跌到40*20度。恒定指向性(CD)的喇叭其边壁相对更平坦，所以在10Hz-10kHZ的频率范围内指向性就不会有很大的差别。但是，一个CD喇叭的喉端设计经常包括一个在衍射槽中的狭窄沟道终端。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 通常，该沟道的大小将决定最高音频处的发射。对于在最高音频处拥有90-120度的较佳的水平辐射范围而言，一个插槽压缩高频音箱很难打破。通常，该插槽约1/2英寸宽，可避免在低于16KHZ的频率下传送声音。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 当多个喇叭排列在一起来覆盖同一个频率范围时，干扰的结果是在交叠区内引起不规则的响应(根据产生的频响曲度形状，称之为梳状滤波)。喇叭驱动器挨的越近，发生不规则的频率越高，且声音越让人觉得不愉快。在两个喇叭的音频覆盖区域，许多设计师都非常谨慎的垒叠喇叭的图形，因为轻微水平的下降(对听众而言意味着更低的回音比)要比由于干扰而引起的不规则频响舒服一些。&lt;br /&gt;&lt;br /&gt;&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="center"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/2007211742562.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td&gt;&lt;p align="center"&gt;&lt;strong&gt;&amp;nbsp;&lt;span style="color: #dd2220;"&gt;图8：线性信号源的指向辐射图&lt;/span&gt;&lt;/strong&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd2220;"&gt;近场、远场&lt;/span&gt;&lt;/strong&gt;&lt;br /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 任何声源辐射的声场状态根据接听距离不同而有区别。总的来说，接听距离可分为近场和远场。近场是从辐射源到下面距离：[L]，这里L是最大的辐射源尺寸和距离，L和&amp;lambda;是在同一单位中被测量的。在近场，将近场辐射距离扩展到无限远，如果声源是在室外的话，来自声源的声音等级以每双倍距离6dB的速率递减。在室内的话，由于房间的影响，衰减会慢一些，基本是以每双倍距离3-6dB的速率递减。这些影响对测量是很重要的，在这种情况下，麦克风为了可以精确的工作，在所有相关频率下都应该处在近场范围内。同样，这对于阵列音箱的评估和应用来说也非常重要。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd2220;"&gt;线性阵列&lt;br /&gt;&lt;/span&gt;&lt;/strong&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 在音频界，每隔几年就有人把会把一个40年代以前曾被研究和获得专利的理论进行重新研究，然后宣布有了重大突破，甚至会对其重新进行专利注册。线性阵列就是这样一个被重新发现的理论。一个真正的线性阵列是一个连续的条状辐射体，它可以是水平的或垂直的，通过其单元部件之间的干扰效果生成指向性控制。据本人所知，现仅有两种真正的线性阵列（一个公式）：&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 静电条状辐射体和电磁条(带)状辐射体。有许多公司生产了很多有或多或少线性阵列特性的产品，但这些不是真实的线性阵列。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 真正的线性阵列在其长度范围内一直都是同相辐射的。如果每个单独的辐射体输入的信号同相，且临近设备的中心间隔在最高频率的1/4波长范围之内，则可得到近似的线性阵列。不满足这个要求的阵列将表现出不规则的频响。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 图8描述的是真实线性阵列的指向特性。要注意的是，除了图中的主声瓣(在长度上比一个波长要长)外，最小的声瓣也可以显现出来。在这些角度内的听众将听到不规则的频响。但也要注意的是，与大瓣相比，小瓣的等级衰减的很厉害。近似的等式6可得出垂直线性阵列在纵向辐射区域的角度范围：q= (角度值为弧度)&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="left"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/2007211743906.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td&gt;&lt;p align="center"&gt;&lt;span style="color: #dd2220;"&gt;&lt;strong&gt;表面印有图画的Amina DML面板&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 另外，指向性随着频率不同而变化，但当频率增加时，指向性会变窄。在某些应用中，这个影响不是什么大问题。举一个例子，当一个线性阵列其中心安置在与听众耳朵一个平面上，则一个非常窄的垂直指向性是可以接受的，且所有听众可以非常清楚的听到所有频率范围的声音。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 关于线性阵列的一个改善是将阵列进行分割，所以辐射体的中心部分将处理所有频率范围，而远离中心的段将输入低通信号(其所具有的阈值频率更低)。这样，当以波长来测量时，阵列的有效长度应该保持一致，并生成一个更一致的指向性。该方法称为&amp;ldquo;频率阴影法&amp;rdquo;，它已经得到论证，即Bessel滤波器是用在频率阴影阵列中最佳的技术。Philips拥有Bessel阵列的专利。&lt;/p&gt;&lt;p&gt;在阵列设计上的另一个种类是曲线阵列，它可提供更低的高频发射。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 为了使线性阵列产生的声音可进行电子控制，阵列单元或驱动器可通过独立的放大器来输入信号，同时不同的阵列单元采用不同的信号延迟。大多厂商的环绕声系统都具有这种&amp;ldquo;可控制阵列&amp;rdquo;特性。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd2220;"&gt;从近场到远场的转换&lt;/span&gt;&lt;/strong&gt;&lt;br /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 另一个很少被提到的线性阵列应用是从近场到远场转换的影响。如果一个线性阵列以圆柱体来辐射声音，则当听者远离该阵列时，声音等级将以每双程距离3dB的速率衰减(假设处在消声或室外环境中)。如果在室内，衰减速率会更慢些。如果该阵列从室内的地板延伸到天花板上，那么它在所有频率范围内都将按真正的圆柱形辐射体来传送声波。在I&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="right"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/2007211759031.gif" alt="" border="0" /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 该阵列在200Hz时的垂直指向范围为40度，在远场的声压以每双程距离3dB的速率递减，在345Hz处时远场距离大于4米。在1kHz处，指向范围约10度，3米以外声压以每双程距离3dB的速率递减。因此，在10kHz听者的距离在约30米处时，才会有3dB速率的递减。要注意这种趋势。在高频处，当3dB的递减规则产生效应时，听者必须要远离该阵列。在近距离处，递减速率将从很小距离的0dB(每双程距离)变到远场距离的3dB速率，它是依据频率而变化的。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 在应用中，阵列要与预定频响互补，确认参考接听距是很有必要的，我们希望在这个距离可以听到一个平坦的响应，因为对不同的听者距离，响应平面将在几个dB范围内变化。当线性阵列被用于室内时，这个影响将会显著减小，因为室内反射的趋势是平衡不规则反射以达到某种程度的平衡。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;strong&gt;&lt;span style="color: #dd3330;"&gt;DML&lt;/span&gt;&lt;/strong&gt;&lt;br /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 几年前，一些音箱的新产品面市，即分布式音箱，或称为DML。这种音箱包含一个或多个小心安装在设计面板上的转换器。在使用中，转换器发出一个曲度波到面板，然后该面板将声波辐射到其周长距离，再反射回来，这样反复若干次直到其衰减到0。通过选择适当的面板材料，声音在面板的反射持续时间可得到精确控制，所以好的频响被保留下来。但声波是以不连贯的相位辐射的，所以界面影响可被消除，且面板可生成一个全面的平坦响应。通常使用的面板无背栏，在这种应用中，他们可在自由空间内进行360度的辐射。&lt;/p&gt;&lt;table style="width: 100px;" border="0" cellspacing="0" cellpadding="0" align="right"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td&gt;&lt;p align="left"&gt;&amp;nbsp;&lt;img src="http://www.ktv8848.com/uppic/resource/200721/200721170875.gif" alt="" border="0" /&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 当安装在墙附近时，他们生成一个将近180度(半球)的模式。更进一步，当在单一覆盖领域使用不仅一个面板时，他们的非相干辐射可使其免除有害的干扰影响(梳状滤波)。并且，他们比相关相位音箱更少震动房间。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 最后，由于面积很大(这对DML面板是很有用的)，辐射是分布式的，所以在所谓近场的听众不会被暴露在高声级下。例如，一个DML板可作为会议室白板和音箱双重功能使用，当演示者使用无线麦克风站在DML板附近时，很少会有反馈。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; 当然，DML并不是包治白病的良药。因为很少有应用场合需要如此高的指向性来提高听者的理解力。它不能产生音乐会的音响等级。它的顺态响应有时没有最高的高保真显著。但它特有的特性确实使其在某些特殊应用中可被采用，这些应用场合并不需要普通的音箱，对他们来说，普通即意为着无趣。&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;转自:&lt;a href="http://www.ktv8848.com/news/20072/10720.shtml"&gt;http://www.ktv8848.com/news/20072/10720.shtml&lt;/a&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;img src="http://www.cnblogs.com/huaping-audio/aggbug/2289109.html?type=1" width="1" height="1" alt=""/&gt;&lt;p&gt;&lt;a href="http://www.cnblogs.com/huaping-audio/archive/2011/12/15/2289109.html" target="_blank"&gt;本文链接&lt;/a&gt;&lt;/p&gt;</content></entry></feed>
