數字閱讀時(shí)代,有聲閱讀的工業(yè)化、智能化生產(chǎn)是趨勢,書(shū)籍的動(dòng)效、聽(tīng)書(shū)的音色等細節都影響著(zhù)用戶(hù)對于數字閱讀的交互感受。華為閱讀作為一款人性化的數字閱讀App,在HarmonyOS NEXT上提供了8款媲美真人的聽(tīng)書(shū)音色,給用戶(hù)帶來(lái)猶如真人閱讀的情感化感受。近日,華為閱讀升級了精品音色3.0,篩選40萬(wàn)+小時(shí)的高質(zhì)量數據訓練,從韻律、情感化、風(fēng)格化等層面,為用戶(hù)帶來(lái)高度擬人化、具有共情能力和風(fēng)格切換能力的聲音。
40萬(wàn)+小時(shí)大數據底座,充分激發(fā)精品音色優(yōu)勢
華為閱讀“精品女聲”音色的音源,是中國傳媒大學(xué)視聽(tīng)技術(shù)與智能控制系統文化和旅游部重點(diǎn)實(shí)驗室研究員、中國傳媒大學(xué)播音主持藝術(shù)學(xué)院副教授王宇紅。此次為華為閱讀提供的精品聲創(chuàng )新,源于實(shí)驗室研發(fā)的“藝術(shù)+技術(shù)情感體系”。通過(guò)破解智能語(yǔ)音交互過(guò)程中的多種擬態(tài)情境,該重點(diǎn)實(shí)驗室精心錄制了為機器輸入大量高質(zhì)量語(yǔ)料的數據集,再通過(guò)人工智能合成技術(shù)將機械聲音比人聲差的情感加上,讓機械聲音也有了人性化的溫度。
華為閱讀剛剛升級的精品音色3.0采用TTS技術(shù),即Text-to-Speech文字轉語(yǔ)音技術(shù),以華為的語(yǔ)音大模型底座為核心基礎架構,構建和優(yōu)化TTS技術(shù),融合實(shí)驗室研發(fā)的“藝術(shù)+技術(shù)情感體系”,篩選40萬(wàn)+小時(shí)的大數據訓練打底,專(zhuān)家演繹數據強化,形成一套對人類(lèi)語(yǔ)音的音色、語(yǔ)調、韻律等的精準建模。精品音色3.0將王宇紅副教授作為專(zhuān)業(yè)演播員的音色細節以技術(shù)手段充分保留和還原,帶來(lái)韻律豐富、重點(diǎn)突出、識別力強和能展現豐富場(chǎng)境、多種情緒態(tài)度的逼真音色、提高信息傳遞的效率。華為閱讀與中國傳媒大學(xué)視聽(tīng)技術(shù)與智能控制系統文化和旅游部重點(diǎn)實(shí)驗室的強強聯(lián)合,為用戶(hù)帶來(lái)身臨其境聆聽(tīng)國家級水平播音的聽(tīng)書(shū)體驗。
華為閱讀精品音色3.0引領(lǐng)數字閱讀情感化趨勢
王宇紅副教授在為華為閱讀錄制精品聲音時(shí),結合了自身30年的媒體教學(xué)、播音實(shí)踐工作經(jīng)驗,遵循數字化時(shí)代應該發(fā)揮有聲語(yǔ)言本身的個(gè)性化優(yōu)勢原則,兼顧了數字化智能語(yǔ)音的“傳播語(yǔ)境擬態(tài)化”、“音色特征通用性”、“感官體驗交流感”、“閱讀內容通識性”的特點(diǎn)。錄制時(shí)吐字清晰、發(fā)音標準、語(yǔ)氣語(yǔ)調豐富多樣,將演播者對文字語(yǔ)言的理解、感受轉化為有助于建構讀者心理體驗的停連、重音、語(yǔ)氣、節奏,同時(shí)兼顧在聲音傳達里建立與用戶(hù)的面對面、心貼心的“交流感”,讓精品聲音通過(guò)華為閱讀的技術(shù)能力轉化為聽(tīng)書(shū)音色后,可以適配不同的讀物需求和聽(tīng)書(shū)場(chǎng)景。無(wú)論是開(kāi)車(chē)時(shí)需要的送達感、抗干擾性;睡覺(jué)前需要的松弛感、伴隨性;兒童讀物需要的親切感、啟智性……都能為華為閱讀用戶(hù)帶來(lái)了高度擬人化、具有共情能力和風(fēng)格切換能力的聲音。
目前華為閱讀已經(jīng)上線(xiàn)精品音色3.0,華為用戶(hù)升級HarmonyOS NEXT后,即刻就能在華為閱讀體驗來(lái)自中國傳媒大學(xué)播音老師的專(zhuān)業(yè)音色。作為一款綜合類(lèi)閱讀應用,華為閱讀在不斷開(kāi)拓數字閱讀市場(chǎng)的同時(shí),也將與更多專(zhuān)業(yè)機構、專(zhuān)業(yè)人士合作,探索更多人性化交互體驗。