為跟客戶(hù)開(kāi)半小時(shí)的會(huì )議,一整天都耗在路上;一個(gè)緊急電話(huà),立即驅車(chē)數十公里趕往偏遠的下轄礦區;月總、季總一到,分布在全國各地的同事就得定期飛回來(lái),不僅鞍馬勞頓,還要花費大量的差旅費……這些經(jīng)歷,應該是許多人的共同記憶。
視頻會(huì )議的普及,給上述種種情況帶來(lái)不少“福音”,但遠程終究不是現場(chǎng),視聽(tīng)和互動(dòng)的感受,都會(huì )有所影響,在設備不達標的情況下,還會(huì )出現音畫(huà)不同步、聲音斷斷續續等一系列問(wèn)題,溝通效率大打折扣。
讓遠程協(xié)作的用戶(hù)體驗和效率,盡可能和現場(chǎng)的一模一樣,這是MAXHUB研發(fā)團隊在開(kāi)發(fā)V6系列會(huì )議平板時(shí),所肩負的一大使命。
今天,一起探究這背后的故事。
像面對面一樣交流,是音視頻設備的本位價(jià)值
“讓屏幕兩端的交流感更真切,擁有接近于面對面討論的逼真效果,我們認為音視頻設備理應為用戶(hù)帶來(lái)這樣的本位價(jià)值?!盡AXHUB視覺(jué)研究負責人騰哥如此說(shuō)道。
但當騰哥帶領(lǐng)技術(shù)團隊走訪(fǎng)企業(yè)、深入調研的時(shí)候,看到的卻是另外一番景象。
他們了解到很多中小型企業(yè)正在使用的視頻會(huì )議工具,居然是“電腦+云視頻會(huì )議軟件”這樣的組合,存在看不清、聽(tīng)不清和交互弱等一系列問(wèn)題,很大程度上影響著(zhù)溝通的效率和員工的積極性。而原因就是,一套專(zhuān)業(yè)級音視頻設備的價(jià)格動(dòng)輒幾十萬(wàn),他們沒(méi)有這么多的預算用于部署。
騰哥也發(fā)現,就算是在MAXHUB所專(zhuān)注的會(huì )議平板行業(yè),大部分產(chǎn)品的音視頻功能還有所欠缺,視頻會(huì )議的流暢性和清晰度,未能達到用戶(hù)預期的效果。
“所以,我們想去改變這個(gè)現狀,讓大家用會(huì )議平板就能進(jìn)行專(zhuān)業(yè)的視頻會(huì )議?!彬v哥補充道。
MAXHUB研發(fā)團隊的期盼中,這不僅是能夠解決視頻會(huì )議現狀的產(chǎn)品,更希望可以在行業(yè)中產(chǎn)生“鯰魚(yú)效應”,激勵上下游的廠(chǎng)商,共同來(lái)優(yōu)化用戶(hù)體驗。
我們花費一年半時(shí)間,造出了這顆雙攝
“看到這顆雙攝了不,它是4800萬(wàn)像素廣角與800萬(wàn)像素長(cháng)焦雙軸機械云臺組合而成的一體化雙攝,我們花了一年半的時(shí)間折騰出來(lái)的。單個(gè)鏡頭的時(shí)候,四五米遠的人像放大后效果不太理想,所以我們加了一個(gè)長(cháng)焦鏡頭,可以在人像特寫(xiě)的情況下,保證畫(huà)面清晰度?!彬v哥指了指位于MAXHUB V6科技版頂部的攝像機,自豪地介紹道。
可是,一體化雙攝的研發(fā)過(guò)程,遠遠不像描述中的那么輕松。
騰哥帶領(lǐng)的視覺(jué)研發(fā)團隊要攻克的第一個(gè)難關(guān),是如何把兩顆鏡頭、精密的磁編碼云臺和眾多零部件,高度集成在頂部邊框中。最先采用的是潛望式結構,但得到的鏡頭組體積較大,顯得有些突兀,影響整體的美觀(guān)性。經(jīng)過(guò)數十次推倒重來(lái)后,MAXHUB研發(fā)團隊參考專(zhuān)業(yè)云臺攝像機的架構進(jìn)行重新設計,實(shí)現了如今兼顧美感和小體積的雙攝方案。
隨之而來(lái)的,是小體積導致的溫升、轉動(dòng)精度問(wèn)題。
該雙攝采用4K級傳輸碼率,且內部空間小,故此容易發(fā)熱。為此,MAXHUB視覺(jué)研發(fā)團隊自己搭建了全新的風(fēng)道設計,并進(jìn)行1000多次熱學(xué)仿真實(shí)驗,不斷改進(jìn)風(fēng)道結構,讓散熱的效果實(shí)現最優(yōu)化。
受整體體積影響,內置的微型電機較難把控轉動(dòng)的精度,基于此,研發(fā)團隊自行設計電機的傳動(dòng)架構,以及采用高精度磁編碼器,使得微型電機可以精準轉動(dòng),讓攝像頭準確捕捉到相應的人像。
接下來(lái)的難點(diǎn),便是如何讓兩顆鏡頭默契配合,達到1+1>2的成像效果。
“最大的挑戰是,要讓一顆ISP芯片操控雙攝的圖像處理能力,跟單攝是一樣的,簡(jiǎn)單來(lái)說(shuō),就是當你的工作量變成雙倍的時(shí)候,你要把它做得跟之前一樣好。大家可能會(huì )有一個(gè)疑問(wèn),我們?yōu)槭裁床挥脙深w芯片?事實(shí)上,芯片增多后,它們之間的任務(wù)劃分、數據交換和數據通信,都會(huì )損耗時(shí)間并產(chǎn)生熱量,結果可能會(huì )適得其反?!彬v哥這種化繁為簡(jiǎn)的解釋,哪怕是視覺(jué)領(lǐng)域的技術(shù)小白,也能夠快速理解到其中的關(guān)鍵所在。
為此,MAXHUB視覺(jué)研發(fā)團隊設計了多套技術(shù)流方案來(lái)優(yōu)化ISP芯片的系統架構和功能單元的運作流程,并進(jìn)行大量的仿真計算,讓ISP芯片的性能充分發(fā)揮出來(lái),在工作量翻倍的情況下,依舊游刃有余。
“再分享一個(gè)小細節,我們主攝像頭的可視角是92°,這是一個(gè)畸變、透視和解析力都極為均衡的黃金角。為了得到這個(gè)數值,我們基于微軟Teams的標準,在82°到110°這個(gè)角度范圍內反復進(jìn)行了1500多場(chǎng)模擬測試,并邀請一些真實(shí)用戶(hù)來(lái)現場(chǎng)對比成像效果?!?/p>
在騰哥看來(lái),92°超廣角鏡頭帶來(lái)的實(shí)際體驗感還是非常令人滿(mǎn)意的,“鏡頭可視角調整后,視野范圍比以前擴大了37.3%,成像的效果非常清晰,這樣一來(lái),我們在很小的會(huì )議室也能夠進(jìn)行多人視頻,而大型講廳更是可以輕松拍齊整個(gè)會(huì )場(chǎng)?!?/p>
小而美的外觀(guān)結構、別出心裁的92°黃金角……這些背后藏著(zhù)的,是MAXHUB視覺(jué)研發(fā)人員對用戶(hù)的洞察及用心。
有了“千里眼”,就得有“順風(fēng)耳”來(lái)配
在視覺(jué)研發(fā)團隊埋頭攻克雙攝技術(shù)難關(guān)的同時(shí),以鄭工為主導的聲學(xué)研發(fā)團隊,則在跟如何提升會(huì )議平板的音頻處理能力較著(zhù)勁。
“視頻會(huì )議的時(shí)候,大家應該都體會(huì )過(guò),對方會(huì )場(chǎng)講的話(huà)傳到你耳邊摻雜著(zhù)鍵盤(pán)聲、關(guān)門(mén)聲、咳嗽聲等等噪音,而且有時(shí)候聲音還會(huì )時(shí)大時(shí)小……這很影響效率?!苯鉀Q這樣的用戶(hù)痛點(diǎn),是鄭工和他的團隊在堅持的事情。
MAXHUB聲學(xué)研發(fā)團隊很早前就自研了AI降噪技術(shù),讓麥克風(fēng)在收音的時(shí)候,可把常見(jiàn)的噪音都過(guò)濾掉。在開(kāi)發(fā)新的麥克風(fēng)模組時(shí),為了再度優(yōu)化AI降噪技術(shù),他們旁聽(tīng)了超過(guò)600多場(chǎng)會(huì )議,收集了1000多個(gè)小時(shí)的錄音,豐富了原有的音源數據庫和聲學(xué)模型體系。如今,MAXHUB的AI降噪技術(shù)可以過(guò)濾掉打字聲、開(kāi)關(guān)門(mén)聲、空調低頻振動(dòng)聲等各類(lèi)噪音。
“其實(shí),我們的AI降噪技術(shù)還有一個(gè)小缺點(diǎn),它會(huì )把歌聲也過(guò)濾掉,我們在這邊唱歌的時(shí)候,對方能看到口型,但聽(tīng)不到歌聲,這是因為當時(shí)沒(méi)考慮到大家可能會(huì )在會(huì )議室唱歌???我們后續的研究課題又多了一個(gè),期待大家以后用MAXHUB會(huì )議平板,來(lái)一次遠程歌唱比賽?!编嵐み@句幽默的話(huà)語(yǔ)中,詮釋的正是MAXHUB人不斷發(fā)現問(wèn)題、不斷改善、不斷探索的精神共識。
為了進(jìn)一步打造極致音頻體驗,MAXHUB聲學(xué)研發(fā)團隊還引入了騰訊天籟實(shí)驗室的領(lǐng)先技術(shù),在MAXHUB V6音視頻專(zhuān)業(yè)版上內置騰訊天籟inside音頻模組,采用全新升級8陣列麥克風(fēng),從而實(shí)現180度廣角、12米超清拾音,并基于深度學(xué)習模型智能消除超過(guò)300種噪聲,確保多人講話(huà)時(shí)每一個(gè)聲音都能聽(tīng)得清、聽(tīng)得真。
“如果把我們的一體化雙攝比作‘千里眼’的話(huà),那我們的麥克風(fēng)模組就是跟它絕配的‘順風(fēng)耳’。它們倆配合工作的原理也挺有趣的,講話(huà)人在走動(dòng)的情況下,攝像頭和麥克風(fēng)會(huì )聯(lián)合定位說(shuō)話(huà)人的位置,麥克風(fēng)波束就能自動(dòng)對準講話(huà)人,拾音口就能一直正向收音,確保拾音效果是最好的,我們把這叫做聲隨影動(dòng)?!编嵐を湴恋刂v解著(zhù)研發(fā)團隊帶來(lái)的最新成果,當然,這不是因為技術(shù)有多么領(lǐng)先、多么獨特,而是這些技術(shù)真的能為用戶(hù)提供更好的產(chǎn)品體驗和更高效的辦公助力。
“千里眼”和“順風(fēng)耳”默契無(wú)間,再搭配上MAXHUB所擅長(cháng)的云視頻會(huì )議軟件系統,一幅宛如同地的視頻會(huì )議畫(huà)面,就展示在眼前:雙方的動(dòng)作、表情和聲音都清晰傳遞給彼此,ppt、設計稿等等會(huì )議文件,也能通過(guò)軟件實(shí)時(shí)展示給對方,如果有哪個(gè)畫(huà)面講不清,我們就可以借助同步批注的功能,在這張圖上圈圈畫(huà)畫(huà),讓對方快速鎖定疑問(wèn)的出處。
對用戶(hù)來(lái)說(shuō),MAXHUB帶來(lái)價(jià)值,是讓組織間的遠程協(xié)作也能同步溝通,就像現場(chǎng)交流一樣高效,幫助減少出差的頻率。對會(huì )議平板行業(yè)而言,希望MAXHUB的視頻會(huì )議新技術(shù)能起到“燈塔效應”,為各大廠(chǎng)商帶來(lái)新的探索方向和技術(shù)原型。
垂髫年華的MAXHUB,才剛剛出發(fā),還很稚嫩,但這里有許許多多像上述兩位工程師一樣的滿(mǎn)懷熱忱和追逐夢(mèng)想的人,用行動(dòng)書(shū)寫(xiě)著(zhù)MAXHUB的未來(lái)和詩(shī)歌。