25位模型開(kāi)發(fā)者,聯(lián)手反擊李一舟 | 36氪專(zhuān)訪(fǎng)

業(yè)界
TIME
2024-03-05 10:10
36氪
分享

  文|周鑫雨

  編輯|蘇建勛

  一場(chǎng)針對“中國AI巨頭”李一舟的聲討,正在轟轟烈烈地上演。

  聲討者們,是圖像模型開(kāi)源社區LiblibAI上的模型創(chuàng )作者。2月21日,不少創(chuàng )作者發(fā)現,自己獨家授權給LiblibAI的開(kāi)源模型,未經(jīng)允許被搬運到了名為“一舟智能”的網(wǎng)站上——據統計,至少有97個(gè)模型,遭到了搬運。

  “一舟智能”的背后,則是彼時(shí)火遍全網(wǎng)的李一舟。當OpenAI的視頻生成模型Sora再次引爆輿論,李一舟以“AI教父”的形象出現在大眾面前,在直播間販賣(mài)199元的“每個(gè)人的人工智能課”和“只剩最后一個(gè)名額”的焦慮——當然,效果也是驚人的,據飛瓜數據統計,價(jià)值199的人工智能課一年內賣(mài)出約25萬(wàn)套,銷(xiāo)售額約5000萬(wàn)。

  但技術(shù)熱點(diǎn)造就的財富的B面,是李一舟經(jīng)不起推敲的學(xué)霸人設,和對開(kāi)源模型的涉嫌侵權。

  成立于2023年5月,迄今已聚集了1萬(wàn)多名模型創(chuàng )作者的LiblibAI,已經(jīng)是國內最大的AI繪畫(huà)模型分享社區。社區中的模型,大多是愛(ài)好者們基于Stable Diffusion(以下簡(jiǎn)稱(chēng)“SD”)的微調模型,通過(guò)不同數據集的訓練,模型能夠創(chuàng )作出特定風(fēng)格的圖像,比如被李一舟搬運的LEOSAM,主打3D寫(xiě)實(shí)。

  △LiblibAI社區中的模型。

  上傳模型的愛(ài)好者們,共同點(diǎn)是“用愛(ài)發(fā)電”。即便是基于SD的微調,這些模型前期依然要投入高昂的訓練時(shí)間和成本。

  LEOSAM的創(chuàng )作者“兔猻”曾公開(kāi)自己訓練模型付出的算力成本:在云計算平臺Autodl上租賃算力花費了大約兩萬(wàn)元,購買(mǎi)了英偉達4090和6000ada兩塊顯卡花了大概8萬(wàn)元。

  LiblibAI聯(lián)合創(chuàng )始人張子捷告訴36氪,不同模型作者訓練的方法不太相同,即便是最輕量化的微調模型LoRA,也要在訓練過(guò)程中用數天的時(shí)間標注的幾十至數百張圖片,后期還要通過(guò)大量的XYZ plot測試(一種測試模型生圖能力的方法),來(lái)檢驗訓練成果,以此對模型進(jìn)行調優(yōu)。

  “李一舟對模型的搬運讓人不適的點(diǎn)在于,一是他沒(méi)有得到作者本人的授權,二是他通過(guò)模型進(jìn)行了謀利。大家投入很多金錢(qián)和精力做出的模型,被李一舟用來(lái)賺錢(qián)?!?月21日,LiblibAI聯(lián)合創(chuàng )始人、運營(yíng)負責人梅子收到了創(chuàng )作者給她私發(fā)的一舟智能網(wǎng)站截圖,“令人費解的是,一舟智能專(zhuān)挑熱門(mén)模型搬運,甚至沒(méi)有標注原創(chuàng )作者信息?!?/p>

  △被搬運到一舟智能網(wǎng)站上的模型。圖源:B站UP主@朱尼醬等聯(lián)合創(chuàng )作者

  她發(fā)現,作者們授權(包括獨家授權)給LiblibAI的多個(gè)模型,出現在了一舟智能的模型社區中,點(diǎn)擊后就會(huì )跳轉到會(huì )員的購買(mǎi)頁(yè)面,每個(gè)月的訂閱費在39元-399元不等——而這些模型,在LiblibAI上均為免費開(kāi)源。

  在創(chuàng )作者們多次聯(lián)系一舟智能下架模型未果后,2月22日,LiblibAI代表作者發(fā)出聲明:作為主張開(kāi)源共享的社區,LiblibAI 允許用戶(hù)直接使用模型、甚至下載模型,但未經(jīng)創(chuàng )作者許可就搬運模型、甚至擅自用作商業(yè)化,則被平臺視為“侵權”。

  李一舟對開(kāi)源模型的“偷襲”,也將一個(gè)問(wèn)題拋到了行業(yè)面前:秉持著(zhù)人人可用、技術(shù)共享理念的開(kāi)源模型,使用的邊界到底在哪里?

  “開(kāi)源,不代表無(wú)版權?!睆堊咏莞嬖V36氪。他認為,站在模型創(chuàng )作者的角度,真正用于模型訓練的,是經(jīng)過(guò)標注的“數據對”,帶有極強的主觀(guān)性,微調模型可以被視作作者的二創(chuàng )。而站在平臺監管的角度,LiblibAI作為社區,也需要保證開(kāi)源模型被合規合法的使用,而不是隨意搬運。

  △LiblibAI上模型LEOSAM創(chuàng )作者“兔猻”關(guān)于使用權限的聲明。圖源:LiblibAI@LEOSAM是只兔猻

  不過(guò),證明開(kāi)源模型具有著(zhù)作權,依然困難重重。比如,如何對訓練模型的數據進(jìn)行溯源,如何認證標注后的訓練數據沒(méi)有對原數據作者構成侵權。

  但開(kāi)源模型社區的困境更在于:李一舟不是第一個(gè),也絕不會(huì )是最后一個(gè)。

  成立不到8個(gè)月,LiblibAI上的模型已經(jīng)經(jīng)歷了不下十次大規模的被搬運。一些個(gè)人用戶(hù)將模型下載后,又上傳到其他的社區。

  “李一舟甚至不是搬運最多的一次,但是影響最大的一次?!泵纷颖硎?。這幾天,她與25名被搬運的模型作者并行取證。作為平臺方,LiblibAI的兩個(gè)主張為:第一,李一舟對模型作者構成著(zhù)作權侵犯;第二,對LiblibAI構成不正當商業(yè)競爭。

  平臺和模型創(chuàng )作者們覺(jué)得,打贏(yíng)這場(chǎng)戰爭,對構建更有秩序的開(kāi)源生態(tài)至關(guān)重要。

用8萬(wàn)元和愛(ài)發(fā)電的模型,成了李一舟撈金的工具

  36氪:大家是怎么發(fā)現模型被搬運到李一舟的網(wǎng)站上的?

  梅子:我與模型作者有1V1建聯(lián)。上周三(2月21日),我們的作者截了一張李一舟網(wǎng)站上的圖,私發(fā)了我一份,也轉到了我們的原創(chuàng )作者交流群里。

  我們就覺(jué)得截圖中的模型非常眼熟,發(fā)現這些模型都是熟悉的作者,甚至有的是LiblibAI獨家的模型。作者們也很詫異,李一舟網(wǎng)站用的封面圖和LiblibAI的也一模一樣,都不帶改的。

  子捷:AI愛(ài)好圈的特色是彼此之間的交際非常緊密,大家有無(wú)數個(gè)小群。一旦有人收集整理被搬運的證據,這些截圖和資料就會(huì )傳播到各種群里,事情就開(kāi)始持續發(fā)酵。

  36氪:被搬運的模型一共多少個(gè)?

  子捷:一共是97個(gè)。最早的時(shí)候被搬運的模型其實(shí)有100多個(gè),個(gè)別模型作者和李一舟的工作人員私聊后,有一些模型就下架了。

  隨著(zhù)越來(lái)越多的作者向我們反應,平臺隨即開(kāi)始做侵權取證,比較各個(gè)群和渠道里面的截圖,并且給法院認證的網(wǎng)頁(yè)截屏做了“時(shí)間戳”,當時(shí)最終的計算結果是97個(gè)。

  36氪:開(kāi)源模型本身是可供各種用戶(hù)下載使用的,那么李一舟的哪些行為讓大家覺(jué)得自己的權益被侵犯了?

  梅子:有人分析過(guò)李一舟網(wǎng)站的付費模式,一旦觸發(fā)模型的生圖功能,就會(huì )跳轉到付費鏈接,價(jià)格也有不同的檔位。相當于這些開(kāi)源模型最終是為盈利目的搬運的。

  子捷:被搬運的都是熱門(mén)模型,基本上是LiblibAI首頁(yè)推薦中的,其中不少模型還是獨家授權給LiblibAI的,其他網(wǎng)站不得私自轉載。開(kāi)源模型的訓練和微調,也需要作者付出很多的腦力勞動(dòng)和資源,李一舟沒(méi)有獲得授權,就將模型作為牟利的手段,很不尊重創(chuàng )作者。

  △一舟智能的收費模式。圖源:B站UP主@朱尼醬等聯(lián)合創(chuàng )作者

  36氪:開(kāi)源模型的微調需要投入多少資源?

  子捷:具體的投入和模型的參數有關(guān)。一般而言,用一個(gè)非常小的微調模型LoRA,需要幾十到幾百張圖片,訓練會(huì )根據參數調整和內容需求的不同花費數個(gè)小時(shí)。但前期對圖片進(jìn)行采集標注,至少需要花三四天,訓練完后還要對模型進(jìn)行調優(yōu),做大量的XYZ plot測試(一種測試模型生圖能力的方法),時(shí)間可能會(huì )無(wú)限長(cháng)。

  梅子:模型LEOSAM的作者“兔猻”提到過(guò)自己在云計算平臺Autodl上租賃算力花費了大約兩萬(wàn)元,購買(mǎi)了英偉達4090和6000ada兩塊顯卡花了大概8萬(wàn)元。像他做Stable Diffusion XL的模型對算力的要求很高。

  △“兔猻”關(guān)于模型微調過(guò)程的分享。圖源:LiblibAI@LEOSAM是只兔猻

  36氪:有聯(lián)系上李一舟方面的人嗎?

  梅子:發(fā)現模型被搬運的當天,模型作者們嘗試與一舟智能相關(guān)的工作人員溝通,但是未達成一致的協(xié)商解決方案。

  和作者們確認細節后,我們是2月22日發(fā)的官方聲明。在此之前已經(jīng)有一些模型作者假裝普通用戶(hù),問(wèn)一舟智能的客服這些模型是否有授權,結果對方回答“有”。后來(lái)作者們亮出了真實(shí)身份,要求一舟智能立刻下架、道歉和賠償,客服才匆忙改口。

  但并不是所有的被侵權模型都立馬下了架。不少作者發(fā)現幾輪溝通后,自己的模型還是被掛在網(wǎng)站上,一舟智能也沒(méi)有公開(kāi)回應和道歉。所以我們就直接發(fā)了公開(kāi)聲明,給對方發(fā)了律師函。

  36氪:大家的訴求是什么?

  梅子:對于作者而言,李一舟應該下架所有侵權模型,賠償通過(guò)侵權所得的不正當收入,并且公開(kāi)道歉。對于LiblibAI而言,作者的訴求就是我們的訴求,平臺獲得了多少賠償反而沒(méi)那么重要。

開(kāi)源,不代表無(wú)版權

  36氪:發(fā)現模型被搬運后,大家采取了怎樣的維權措施?

  子捷:其實(shí)在最開(kāi)始的時(shí)候,我們平臺方比較謹慎和保守,和很多作者去了解情況。確認完后,我們再聯(lián)系了律師進(jìn)行咨詢(xún)。

  和律師溝通后,我們初步確定了維權的兩個(gè)方向:第一,李一舟對模型作者構成著(zhù)作權侵犯;第二,對LiblibAI構成不正當商業(yè)競爭。

  梅子:發(fā)現當天,被搬運模型的作者就拉了一個(gè)有小20人的群。我在里面逐一和作者們溝通,明確他們沒(méi)有把模型授權給李一舟使用。

  模型作者是被侵犯著(zhù)作權的直接主體,他們自己也在積極尋求法律途徑應對。我們作為平臺方,因為有得到模型的授權,所以我們認為有責任幫作者一起維權。但企業(yè)競爭和作者沒(méi)有關(guān)系,所以由平臺主動(dòng)發(fā)起有關(guān)不正當競爭的維權比較合適。

  36氪:開(kāi)源社區是否就意味著(zhù)上線(xiàn)的模型可以被使用?使用的邊界是什么?

  子捷:很多用戶(hù)會(huì )把開(kāi)源社區默認為無(wú)版權,上架模型可以隨意轉載使用。但并不是這樣的。

  從平臺的角度出發(fā),我們有責任對上線(xiàn)模型的使用進(jìn)行監管和規范,比如我們要限制用戶(hù)用開(kāi)源模型去做生成違法的內容。任意轉載將使平臺的內容風(fēng)險管控發(fā)生較大的隱患。

  從模型作者的角度出發(fā),作者會(huì )在社區明確規定模型的使用范圍,很多模型明確要求不得用于商業(yè)用途,僅供學(xué)習交流使用。擅自的轉載和商用,將使得作者創(chuàng )作研究模型的風(fēng)險陡然增高。

  36氪:在維權的過(guò)程中,有哪些難點(diǎn)?

  子捷:目前AI模型版權的歸屬與侵權等問(wèn)題尚無(wú)明確的判例給到一些支持,比如原創(chuàng )作者的模型受到哪些條例保護,是按照計算機程序保護還是作品著(zhù)作權等,所以平臺也要積極推動(dòng)立法上對于A(yíng)I模型知識產(chǎn)權的判定與保護。

  36氪:律師對維權的態(tài)度怎樣?勝算大嗎?

  梅子:我們咨詢(xún)了好幾個(gè)律師,他們的反饋都比較正向,給出的法律主張圍繞侵犯模型作者著(zhù)作權,以及對平臺的不正當競爭。

  同時(shí),之前AI繪畫(huà)侵權案是有判例的,當時(shí)案件結果明確表示AI繪畫(huà)的著(zhù)作權歸原作者所有,未經(jīng)授權搬運他人用AI生成的畫(huà)作構成侵權。這個(gè)判例給了我們很大的信心。

  △北京互聯(lián)網(wǎng)法院針對人工智能生成圖片(AI繪畫(huà)圖片)著(zhù)作權侵權糾紛作出一審判決,認定AI繪畫(huà)作者享有著(zhù)作權。

我們期待生態(tài)的豐富,但前提是保護和尊重

  36氪:這是LiblibAI上的模型第一次被侵權嗎?

  子捷:李一舟事件不是最大規模的一次搬運,卻是影響力最大的。

  其實(shí)從去年(2023年)5月平臺上線(xiàn)開(kāi)始,一直有不少AI愛(ài)好者把模型放在小社區上。

  梅子:沒(méi)有辦法,我們很難去追查。個(gè)別作者和我們反饋過(guò),在其他平臺看到獨家授權給LiblibAI的模型,大家一般會(huì )各自聯(lián)系對方申訴,要求他們下架,但從來(lái)都沒(méi)有像李一舟這一次一樣形成規模效應。

  36氪:但有時(shí)候,沒(méi)有搬運,就沒(méi)有影響力。

  子捷:我們對于普及AI知識的行為是比較開(kāi)放的,大家可以用我們的平臺給公眾授課。當然我們也歡迎他們和不同的作者聯(lián)系,得到模型上線(xiàn)的授權。但前提是要保護或尊重,提前與作者及平臺進(jìn)行溝通,在不涉及不正當競爭的前提下去進(jìn)行搬運。

  36氪:作為開(kāi)源社區,平臺方有哪些措施可以減少侵權的發(fā)生?

  梅子:我們會(huì )鼓勵作者在模型聲明里寫(xiě)明使用范圍,比如“未經(jīng)允許,不得商用”。同時(shí),平臺也會(huì )在模型詳情頁(yè)對作者的授權范圍進(jìn)行明確的展示。

  我們最近也在和技術(shù)聊,短期內我們在試驗能不能通過(guò)給模型加明暗水印的方式,來(lái)保護模型作者的權益。這個(gè)手段涉及技術(shù)方案的實(shí)現,也涉及模型作者的配合。但更長(cháng)期,平臺會(huì )投入更多精力關(guān)注并推動(dòng)法律上AI版權保護的進(jìn)一步明確。

開(kāi)源社區,創(chuàng )作者是核心

  36氪:LiblibAI的第一批創(chuàng )作者是怎么入駐的?

  子捷:毫不夸張地說(shuō),是我們早期運營(yíng)同學(xué)“肉搏”出來(lái)的,每個(gè)核心作者都得一個(gè)個(gè)定向邀請入駐。

  梅子:因為當時(shí)國內是沒(méi)有這樣的圖像模型分享社區,我們知道海外的AI社區Civitai上有很多中國作者苦于國內沒(méi)有渠道,所以我們根據他們的公開(kāi)聯(lián)系方式,比如B站賬號、QQ,只要能找到聯(lián)系方式的,我們就1V1定向邀請,然后向他們介紹說(shuō),我們是國內第一家AI模型分享社區,非常希望他能入駐。

  包括一些作者在北京或者上海,我們都會(huì )趕過(guò)去見(jiàn)面聊。比較欣慰的是大家熱情挺高,基本上只要建聯(lián)就能聊上,然后了解完我們想做什么之后,大家都會(huì )授權,再進(jìn)來(lái)建立賬號,把模型同步發(fā)到LiblibAI上。

  36氪:第一批入駐了多少模型?

  梅子:應該有幾百個(gè)。有的作者手里有非常多模型,當時(shí)我們站剛剛成立,他們上傳,我就覺(jué)得站子一下就滿(mǎn)了。

  36氪:目前LiblibAI的月活有多少?

  梅子:月訪(fǎng)問(wèn)量是200多萬(wàn)。因為早期的作者已經(jīng)在Civitai上有一些粉絲基礎,加之一些KOL自發(fā)宣傳國內有了新的模型站,當時(shí)帶動(dòng)了不少作者入駐。去年六七月的時(shí)候,我們就進(jìn)入了非常高速增長(cháng)的階段。

  36氪:LiblibAI應該是國內最早一家做作者激勵計劃的AI社區,當時(shí)是怎么考慮的?

  梅子:因為我們和作者綁定得很緊密,大家都是用開(kāi)源的精神去做模型,開(kāi)放給大家用。我們的激勵計劃其實(shí)就是基于模型對平臺的貢獻,每個(gè)月給一些補貼和激勵,可能不是特別多,只是對開(kāi)源精神的一種感謝,同時(shí)也希望各位模型創(chuàng )作者相信可以與平臺長(cháng)期共同發(fā)展。

  36氪:AI開(kāi)源社區能夠吸引作者的核心競爭力是什么?

  梅子:我認為會(huì )分為不同的階段,最早期的作者真的是和我們一起拓荒,更在意平臺的理念與是否與他們契合,包括是否尊重原創(chuàng )作者及平臺的運營(yíng)規劃;

  而目前,平臺的發(fā)展規模也十分重要,這些作者的模型值得被更多的用戶(hù)看到、使用,雙邊關(guān)系的建立和效率尤為重要;同時(shí),平臺的生態(tài)定位也很重要,需要比較開(kāi)放和多元。如果生態(tài)中只有一類(lèi)模型,那只能吸引一類(lèi)人。我們是垂類(lèi)最豐富的模型社區,有攝影的、設計的模型,也有動(dòng)漫的。不論偏好生產(chǎn)什么垂類(lèi)的模型作者都可以在LiblibAI上找到歸屬感。

  平臺的生態(tài)定位也很重要,需要比較開(kāi)放和多元。如果生態(tài)中只有一類(lèi)模型,那只能吸引一類(lèi)人。我們是垂類(lèi)最豐富的模型社區,有攝影的、設計的模型,也有動(dòng)漫的。

  子捷:我們認為,AI首先是一個(gè)生產(chǎn)力工具,而不是娛樂(lè )工具。海外的一些AI社區把AI當做娛樂(lè )工具,根據用戶(hù)的喜好想生成什么,就生成什么,導致社區的氛圍很混亂。

  所以我們在探索和扶持不同工業(yè)設計、建筑設計、室內設計等垂類(lèi)賽道的模型,甚至愿意用真金白銀去補貼。

  36氪:開(kāi)源社區如何商業(yè)化?

  子捷:平臺在最開(kāi)始的時(shí)候并沒(méi)有急著(zhù)商業(yè)化變現,因為我們覺(jué)得大多時(shí)候快速商業(yè)化靠的是情緒化的消費,比如李一舟的AI課就很會(huì )販賣(mài)焦慮。但這不是長(cháng)遠的。

  我們從Day 1起就在探索AI的跨模態(tài)表達應該用怎樣的方式解決,我們未來(lái)的產(chǎn)品和布局都是圍繞回答這個(gè)問(wèn)題去做的,當作為生產(chǎn)力工具的時(shí)機成熟了,在更多場(chǎng)景的應用真的行之有效了,我們相信商業(yè)化會(huì )是一個(gè)水到渠成的事情。

  36氪:你們覺(jué)得商業(yè)化合適的節點(diǎn)是?

  子捷:我們的商業(yè)化最終會(huì )圍繞作者。從2023年12月開(kāi)始我們進(jìn)行了初步商業(yè)化的探索,一方面是為了彌補算力的消耗,另一方面也是為了更好的補貼作者,優(yōu)質(zhì)內容的增長(cháng)需要有一個(gè)良性的回報機制。

  AI技術(shù)還處在不斷發(fā)展的階段,我們認為當一項產(chǎn)品或服務(wù)有恒定或者真正的價(jià)值出現,而不是通過(guò)販賣(mài)類(lèi)似于“不學(xué)AI就會(huì )被淘汰”的焦慮帶來(lái)的時(shí)候,正常的推進(jìn)商業(yè)化才會(huì )給行業(yè)帶來(lái)更新的動(dòng)力。

  我們覺(jué)得一個(gè)良性的商業(yè)化應該是長(cháng)期的,要尋找供給和需求的平衡,而不是情緒化的。不然就會(huì )像李一舟那樣,容易被反噬。

  歡迎交流!

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時(shí)通知我們。

相關(guān)熱點(diǎn)

  據國家發(fā)展改革委網(wǎng)站,根據近期國際市場(chǎng)油價(jià)變化情況,按照現行成品油價(jià)格形成機制,自2024年3月4日24時(shí)起,國內汽、柴油價(jià)格(標準品,下同)每噸分別提高125元、120元?! ?..
汽車(chē)
  近期,有關(guān)蘋(píng)果即將發(fā)布iOS17.4系統的消息引發(fā)了廣泛關(guān)注。據科技記者古爾曼透露,蘋(píng)果公司計劃于2024年3月底發(fā)布一款支持新款硬件的iOS17.4“特別版本”。這個(gè)版本之...
數碼

相關(guān)推薦

1
3
人人狠狠综合久久亚洲88_国产超薄丝袜足底脚交国产_日本wvvw高清中文字幕_97国产品香蕉在线观看