遙想2020年5月,公司完成上市之前的最后一輪融資(pre-IPO輪),合計6億元,彼時估值已經(jīng)達到130億元。上市價格低于pre-IPO價格,在A股非常罕見。
上市時距離上輪融資已過2年,公司發(fā)展和資本市場反饋均不及上一輪融資之時。云從科技一直未實現(xiàn)盈利。2019年~2021年,云從科技凈利潤分別為-6.92億元、-8.44億元、-6.64億元。財務(wù)指標有兩大特征:一是毛利率偏低,只有30%~40%;二是研發(fā)費用居高不下。
同為AI四小龍之一的商湯(00020.HK)面臨同樣的盈利困境。2018年~2021年商湯合計虧損376.89億元,同期營收合計僅130.26億元,虧損接近營收的3倍。而且虧損額還在逐年加大。
2022年6月末一級市場投資人解禁,商湯科技日跌幅近47%。2021年12月上市時,商湯發(fā)行價3.85港元/股。上市半年,價格最低跌到2.38港元/股。
2022年之前,國內(nèi)資本市場普遍看好一個方向:新技術(shù)改造傳統(tǒng)產(chǎn)業(yè),實現(xiàn)國際競爭中彎道超車。其中,人工智能替代人力投入的技術(shù)特征,契合了中國人口紅利末期產(chǎn)業(yè)升級的需求。而且,谷歌的Alpha Go持續(xù)刷新圍棋對戰(zhàn)紀錄,更讓市場看到了人工智能的無窮潛力。這些都催生了國內(nèi)人工智能的投資熱潮。
2015年~2017年我國新成立的人工智能公司占到近十年注冊量的50%,其中就包括大家耳熟能詳?shù)腁I四小龍。另一方面融資規(guī)模也在逐年加大,2015年~2021年行業(yè)融資金額每年以翻倍的增速上升,單筆融資額也從2015年不足1億元攀升都2021年接近3.5億元。這直接體現(xiàn)了人工智能行業(yè)不斷壯大、落地場景不斷豐富的特征。但也從側(cè)面反映出,行業(yè)發(fā)展依靠“燒錢”,自身造血能力弱。
人工智能行業(yè)2015年~2021年,合計融資超萬億元。雖然國家出臺各類支持政策,但是行業(yè)依舊處在大面積虧損狀態(tài)。一邊是投資熱潮、未來科技焦點,一邊是企業(yè)虧損、從業(yè)人員焦慮。
這讓我們不禁想要探求人工智能行業(yè)為什么虧損?這些企業(yè)是否真的能“燒”出一個未來?
一、成本端:成本剛性
人工智能企業(yè)為什么虧損?首先需要分析,為何相較一般軟件行業(yè),其毛利率較低。
開展一個人工智能項目,并非大家想象中從零開始搭建精密的算法模型。這樣開發(fā)周期和成本均不能掌控。行業(yè)發(fā)展至今,已經(jīng)形成了相對完備的模型庫。業(yè)務(wù)開發(fā)人員只需抽取相關(guān)模型,用特定數(shù)據(jù)進行訓練優(yōu)化即可。
所以從開發(fā)階段劃分來看,人工智能項目大致可以劃分為四個階段:
1. 數(shù)據(jù)處理;
2. 模型設(shè)計及優(yōu)化;
3. 模型評估及調(diào)整;
4. 實施部署。
各階段的成本也呈現(xiàn)出不同特點。數(shù)據(jù)處理階段主要為數(shù)據(jù)成本;模型設(shè)計及優(yōu)化階段主要為算法成本;最后兩個階段主要是交付成本。
1. 先看數(shù)據(jù)成本
數(shù)據(jù)處理環(huán)節(jié)內(nèi)容較為龐雜,不僅包括原始數(shù)據(jù)獲取或購買,還包括將數(shù)據(jù)整理成人工智能模型可識別的類型,甚至還要對數(shù)據(jù)進行裁剪、加粗等增強工作,形成適合的數(shù)據(jù)。
高質(zhì)量的數(shù)據(jù)是算法模型成功的重要保障,但是數(shù)據(jù)處理并非一個技術(shù)問題。處理過程雖然簡單,但往往是大量人力堆積的結(jié)果。數(shù)據(jù)標注行業(yè),業(yè)已成為經(jīng)濟相對落后地區(qū)的重點發(fā)展產(chǎn)業(yè)。
自然語言處理(NLP)是一類讓計算機理解人類語言,從而快速給出海量資料分析結(jié)果的人工智能基礎(chǔ)技術(shù)。一個常見的NLP模型,訓練數(shù)據(jù)樣本量在5萬~10萬/標簽,稍微復(fù)雜一些的模型,訓練數(shù)據(jù)樣本量要20萬個。
文本數(shù)據(jù)標注還算簡單,但是像人臉識別類模型,需要對圖像數(shù)據(jù)進行標注。單個樣本標注處理時間是文本數(shù)據(jù)3倍~5倍。訓練一個人臉識別模型大概需要10萬的樣本量,數(shù)據(jù)整理標注成本較高。如果樣本數(shù)據(jù)需要購買,整個數(shù)據(jù)成本要占到項目總成本的接近60%。從項目開發(fā)時間來看,數(shù)據(jù)采集、清洗、標注、增強等處理時間占到整個開發(fā)周期80%。
可惜的是,花費如此高的數(shù)據(jù)成本之后,所開發(fā)模型的通用性并不高。核心在于各場景下的數(shù)據(jù)標準很難統(tǒng)一。例如胡同交通和馬路交通都并不一致,同樣的識別模型在兩個場景切換時就會產(chǎn)生巨大的效果差異。
而修改模型的成本不亞于重新開發(fā)一個模型。模型訓練所需的數(shù)據(jù)質(zhì)量要求高、通用性弱,造成了數(shù)據(jù)部分成本頗為剛性。
2. 再看算法成本
算法成本,即具體應(yīng)用模型的設(shè)計及開發(fā)所產(chǎn)生的支出,主要體現(xiàn)在工程師的人力成本和模型訓練所必須的硬件投入。
一般來看,一個市場定價在5萬~10萬元的常用算法模型項目,開發(fā)時間約為100小時,需要1個~2個算法工程師。單個算法工程師單月產(chǎn)能為8萬~10萬元。按照常用模型平均復(fù)用率3次(即同一個模型可以銷售3次)來估算,其單月創(chuàng)收為20萬~30萬元。然而算法工程師當前薪酬5萬~8萬元/月,人力成本不可謂不高。這也難怪一些人工智能公司常常抱怨招不起人。
而且值得說明的是,人工智能當前依舊處在高速成長期,算法人才供不應(yīng)求,用工成本不會大幅下降。
模型訓練所需要硬件投入,相對數(shù)據(jù)、人力成本占比較低。而且作為固定資產(chǎn),其復(fù)用率也高。其投入主要就是CPU和GPU。一塊性能中等的CPU市場均價3000元左右,一般市場定價在5萬~10萬元的常用算力模型,大概需要4塊~6塊CPU。這方面投入額不到2萬元,且各個項目通用性高,成本平攤之后相對較低。
3. 最后看看交付成本
交付成本指的是在模型驗收和實施部署階段,不能一次性成功交付,需要反復(fù)調(diào)整而產(chǎn)生的支出。當前國內(nèi)一般項目一次性通過率不足60%。如果無法一次性成功交付,往往意味著需要補充數(shù)據(jù)和算法人員,甚至需要二次開發(fā)。這無疑會增加項目成本。
綜合來看,一般人工智能項目的成本構(gòu)成如下:數(shù)據(jù)成本占到60%,人力成本20%,硬件及后續(xù)調(diào)整20%。在各項成本中,人力成本因為供不應(yīng)求及市場競爭原因,短期內(nèi)不存在下降的可能。只要人工智能深度學習底層框架不變,數(shù)據(jù)成本就呈現(xiàn)絕對剛性。整體來看,成本可下降的空間有限。
二、收入端:單價難提,復(fù)用有限
既然成本端支出剛性,那么收入是否會有所改觀,從而提升毛利率呢?從項目收入角度看,提高毛利率無非兩條路徑,一是提高項目單價。這除了和人工智能項目定價機制有關(guān),也和采購客戶自身預(yù)算約束相關(guān);二是提高項目模型的復(fù)用率。即針對某一項目開發(fā)的模型,盡可能的多賣幾家,攤薄模型開發(fā)成本。
項目單價方面。人工智能企業(yè)單一項目的報價方式普遍采用“成本加成”模式,一般在名義成本上加成20%~30%。實際上企業(yè)會虛報一點成本,這樣毛利率就可以增加些許。但是在現(xiàn)實中,由于現(xiàn)階段人工智能技術(shù)遠沒有達到高效替代人工的作用,采購客戶往往是嘗試性的消費。該種模式下,客戶不接受人工智能企業(yè)過高的成本加成比例。這導(dǎo)致單價提升困難。
模型復(fù)用率方面。從人工智能公司客戶分類的角度看,大致可以分為政府客戶和一般企業(yè)客戶。
政府項目完全基于特定算法模型,定制化程度高,基本不復(fù)用。該類項目受政府預(yù)算影響,并非商業(yè)化主流。企業(yè)客戶才是人工智能規(guī)?;逃玫哪繕?,也是新技術(shù)助力傳統(tǒng)產(chǎn)業(yè)升級的價值體現(xiàn)。
針對企業(yè)客戶,人工智能企業(yè)的商業(yè)模式是,針對各類高度細分場景,開發(fā)通用型的算法模型,提供單次數(shù)據(jù)服務(wù)或者運營報告。
這類模式下,單次服務(wù)的市場報價一般保持在模型開發(fā)成本的15%~30%。如果企業(yè)項目毛利率要達到軟件行業(yè)平均的50%~60%,算法模型復(fù)用率要達到6次~10次,且每次復(fù)用模型的二次開發(fā)或者調(diào)整成本較低。
如此高的復(fù)用率就要求模型所針對的細分行業(yè)內(nèi)人工智能應(yīng)用較為普遍,這類細分行業(yè)一般具備以下特點:
1. 主要為簡單重復(fù)性工作;
2. 場景標準化程度高,數(shù)據(jù)差異小;
3. 依靠大量人力。
同時具備這三類特征的細分行業(yè)主要集中在工業(yè)生產(chǎn)領(lǐng)域。而且,具備高度自動化物理設(shè)備的環(huán)境,才能充分展現(xiàn)人工智能的價值。然而當前工業(yè)自動化水平不高,單獨的人工智能技術(shù)難以施展威力。
能夠具備以上三個特點的上游行業(yè)通常存在很強的規(guī)模效應(yīng),行業(yè)規(guī)模相對集中。例如視頻監(jiān)控領(lǐng)域。大規(guī)模視頻監(jiān)控產(chǎn)生了大量標準化的圖像識別需求,過往需要大量人力進行篩查,人工智能的出現(xiàn)能夠大幅提高效率。
智能分析企業(yè)相對視頻監(jiān)控企業(yè)集中度低,加之模型技術(shù)難度壁壘不高、競爭激烈,導(dǎo)致該類人工智能企業(yè)的市場話語權(quán)低。它們需要依附上游企業(yè),盈利能力被壓制。
綜合來看,人工智能使用效果不顯著,導(dǎo)致下游客戶嘗試型采購,項目單價難以提高。未來技術(shù)持續(xù)進步,項目單價可能帶來提升。但是從模型復(fù)用率看,人工智能高度依賴數(shù)據(jù)訓練,而下游各細分場景數(shù)據(jù)差異性大,導(dǎo)致模型普適性不高,單一模型復(fù)用率低,成本無法實現(xiàn)攤薄。
在當前技術(shù)階段,項目單價不能快速提高的客觀現(xiàn)實下,如何提高模型復(fù)用率成為人工智能企業(yè)盈利關(guān)鍵。
三、費用端:技術(shù)與資本合力推高
毛利率無法改善、收入難以提升、銷售費用率難以降低,一般企業(yè)已經(jīng)處在虧損邊緣。而企業(yè)居高不下的研發(fā)費用更讓這些企業(yè)雪上加霜。一般來說,當前行業(yè)普遍的研發(fā)費用達到銷售收入的20%以上。
人工智能企業(yè)融資的用途一般在兩項,一項是給即將交付的項目墊支,維持企業(yè)正常運行,另一項便是研發(fā)更高精度、適用場景更多的算法模型。
當前高比例的研發(fā)費用是技術(shù)博弈和現(xiàn)實融資要求共同作用的結(jié)果,企業(yè)很難削減該部分支出。
從技術(shù)上看,高額研發(fā)投入也是行業(yè)發(fā)展階段的必需?,F(xiàn)階段人工智能面臨各種各樣的問題,歸根到底還是技術(shù)水平不能滿足商業(yè)需要。
高額研發(fā)費用的持續(xù)投入成為企業(yè)博弈未來的必經(jīng)之路。作為典型技術(shù)驅(qū)動的行業(yè),技術(shù)迭代快速,如果企業(yè)在技術(shù)上不能保持相對領(lǐng)先地位,很快便會失去現(xiàn)有市場地位。
從企業(yè)生存角度來看,在企業(yè)尚不能自身造血的情況下,生存基本依賴外部融資。如何證明技術(shù)先進性,成為人工智能企業(yè)必須向外部投資人回答的問題。
本來當前算法研發(fā)迫切需要解決模型復(fù)用率低的問題,但單個企業(yè)無法解決此問題。
所以實際情況下,企業(yè)將更多的研發(fā)費用花費在算法精度提升上,參加各類人工智能競賽,博取名次。用比賽成績以及高精度量化指標,向資本市場展示其技術(shù)水平和技術(shù)持續(xù)進化的潛力。
現(xiàn)階段人工智能企業(yè)均配備高質(zhì)量研發(fā)團隊專門進行技術(shù)比賽,但是由于比賽場景和現(xiàn)實場景數(shù)據(jù)差異過大,其研發(fā)的模型與商業(yè)應(yīng)用相去甚遠。
四、人工智能企業(yè)的三種模式
當前算法模型對數(shù)據(jù)質(zhì)量及數(shù)量高度依賴,導(dǎo)致數(shù)據(jù)獲取及整理成本居高不下。再加上行業(yè)競爭加劇帶來的人才搶奪在不斷推高人力成本,成本較為剛性。
收入端因為人工智能技術(shù)的發(fā)展階段尚不能實現(xiàn)對人力大量替代,實用性需求不足,項目單價提升困難。而細分場景數(shù)據(jù)差異性大,導(dǎo)致已開發(fā)模型復(fù)用率低。
這些原因?qū)е氯斯ぶ悄苄袠I(yè)毛利率遠低于軟件行業(yè)。另一方面受行業(yè)本身技術(shù)發(fā)展要求以及后續(xù)融資的考慮,企業(yè)又不得不保持較高的研發(fā)投入。種種原因?qū)е铝诉@個在中國發(fā)展近十年的行業(yè),依舊普遍虧損。
在這種殘酷現(xiàn)實條件下,人工智能行業(yè)大致分化成三類企業(yè):
第一類企業(yè)專注于常用復(fù)用率較高的算法模型。這類項目所需技術(shù)簡單,對準確率以及速度要求不高。企業(yè)往往針對某一個項目開發(fā)模型,并將其進行大規(guī)模復(fù)用。其盈利模式也從單純的“項目制”一次性收費,轉(zhuǎn)向“運營制”按次數(shù)收費(提供咨詢報告模式)。
這類模式雖然實現(xiàn)自身造血,但是存在兩個方面的問題。一方面是模型復(fù)用率雖然有所提升,但是因為現(xiàn)實環(huán)境下數(shù)據(jù)復(fù)用的場景不多,企業(yè)需要不斷尋找細分落地場景。
另一方面是融資難,該類模式下所開發(fā)的模型均使用較為普遍型技術(shù)。在行業(yè)技術(shù)不斷迭代的階段,資本市場認可度差。這類企業(yè)為解決這個問題,往往會引入成建制的研發(fā)團隊專門打比賽刷模型數(shù)據(jù)。這類企業(yè)依舊保持巨額的研發(fā)費用支出,容易產(chǎn)生虧損。
第二類企業(yè)專注在政府項目,這往往是人工智能產(chǎn)業(yè)頭部企業(yè)。政府項目單價高,定制化程度也高,這些項目更偏向與行業(yè)內(nèi)知名公司合作。
這種模式雖然有利于公司擴大行業(yè)影響力,項目利潤率也高,但是缺點在于項目定制化程度高,所開發(fā)的模型基本不形成復(fù)用。
另外政府項目來源并不穩(wěn)定,很考驗企業(yè)渠道能力。近年來隨著人工智能企業(yè)不斷涌現(xiàn),獲取項目的競爭加劇。從企業(yè)經(jīng)營來看,前端項目來源不穩(wěn)定,后端人員成本支出剛性,再加上政府項目回款普遍較慢,企業(yè)需要大額流動資金。這類企業(yè)現(xiàn)金流會始終處在緊繃狀態(tài)。
第三類企業(yè)專注視頻圖像分析領(lǐng)域。這是為數(shù)不多的場景高度重復(fù)且市場規(guī)模較大的細分領(lǐng)域。從商業(yè)模式上看,上游數(shù)據(jù)源源不斷,算法模型可以實時訓練?;谶@些數(shù)據(jù)可以衍生很多服務(wù)項目,天然具備從單純的項目制收費轉(zhuǎn)向持續(xù)性運營收入。例如短視頻領(lǐng)域的信息流推薦系統(tǒng),推薦算法在短視頻平臺源源不斷的數(shù)據(jù)中進行不斷迭代,精準流量推送成為獲取高額廣告費用的保障,平臺與算法實現(xiàn)了高度契合。
近年來人工智能的創(chuàng)業(yè)多聚焦于此。但是該行業(yè)用戶的市場集中度高。監(jiān)控視頻領(lǐng)域??低?002415.SZ)和大華股份(002236.SZ)接近雙寡頭壟斷;互聯(lián)網(wǎng)領(lǐng)域也高度集中于少數(shù)幾家巨頭。這些企業(yè)把握核心數(shù)據(jù)流量,目前積極建立自己的人工智能團隊,打造新的業(yè)績增長點。第三方人工智能企業(yè)只能輔助應(yīng)用開發(fā),產(chǎn)業(yè)鏈話語權(quán)低。
結(jié)語
從2013年開始的人工智能投資熱潮,持續(xù)至今已將近十年,行業(yè)依舊面臨大額虧損。而且從已上市企業(yè)財務(wù)情況看,虧損逐年加大,生存高度依賴外部融資。
它們是否真的能夠“燒”出一個未來呢?
我們認為人工智能當前尚處發(fā)展初期,技術(shù)、產(chǎn)品、商業(yè)化均面臨重重矛盾。未來行業(yè)極有可能從基礎(chǔ)技術(shù)底層框架角度進行變革,當前領(lǐng)先的人工智能企業(yè)亦面臨技術(shù)迭代帶來的行業(yè)洗牌風險。
當前企業(yè)毛利率偏低且無法改善,技術(shù)持續(xù)迭代導(dǎo)致高額研發(fā)投入無法消減,行業(yè)實現(xiàn)盈利尚需時日。