【第一參賽人/留學(xué)人員】XUEJING SUN
【留學(xué)國家】美國
【技術(shù)領(lǐng)域】新一代信息技術(shù)
【參賽屆次】第7屆
【所獲獎項(xiàng)】入圍
【項(xiàng)目簡介】
沉浸式全景聲技術(shù)是一種空間音頻技術(shù),目前在國外,基于對象的全景聲技術(shù)已經(jīng)應(yīng)用于全景聲制作領(lǐng)域。在我國,由于技術(shù)和播放平臺受限等原因,全景聲采集和播放一直以來處于探索階段。音頻領(lǐng)域的核心技術(shù)長時(shí)間以來由外國企業(yè)或科研機(jī)構(gòu)掌握。項(xiàng)目研究以基于全景聲場理念的Ambisonics技術(shù),它是一種聲道獨(dú)立的球形聲場再現(xiàn)技術(shù),Ambisonics 技術(shù)將拾取到的聲源信號通過一系列打包渲染算法轉(zhuǎn)換成傳輸編碼格式B格式(B-format)。根據(jù)階數(shù)不同,B-format 有不同的通道數(shù)要求。它除了可以還放水平面信息外,還能還放自下而上的高度信息,更真實(shí)的營造出四周由遠(yuǎn)及近的音效,呈現(xiàn)出動態(tài)的聲音效果、沉浸式的聽覺感受?;诼晥隼砟畹?Ambisonics技術(shù),包括采集端Twirling Capture SDK,單通道或多通道語音增強(qiáng)處理,回聲消除,聲源定位,均衡器調(diào)整,自動增益控制,波束成形;麥克風(fēng)陣列設(shè)計(jì)與定制,包括線性和環(huán)形陣列,不規(guī)則陣列定制,支持標(biāo)準(zhǔn)First Order Ambisonic(FOA),higher order ambisonic (Hoa)Omini Binaural,支持單指向和全向ECM以及MEMS麥克風(fēng);播放端Twirling Audio SDK,支持立體聲到VR聲場轉(zhuǎn)換,5.1/7.1環(huán)繞聲,最新的Ambisonic, Quad Binaural,分軌音頻對象(Object Audio),最新的物理和數(shù)學(xué)混響模型,獨(dú)有算法支持反射音、遮擋音,內(nèi)容自適應(yīng)算法優(yōu)化,高質(zhì)量低功耗。不僅如此,在最近的迭代中,增加了基于麥克風(fēng)陣列的降噪處理,語音喚醒、回聲消除、聲源定位、聲紋識別、波束成形、定向增強(qiáng)等核心算法,讓音質(zhì)更純粹干凈,帶來更好的臨場和空間沉浸感。項(xiàng)目廣泛應(yīng)用于金融銀行、智慧安防、工業(yè)檢測、網(wǎng)聯(lián)汽車等領(lǐng)域。
【展開】
【收起】