星火是燎原還是“火災(zāi)”? 科大訊飛:往前看,別回頭
AI終端產(chǎn)品“遍地開花”的科大訊飛,終于拿出大模型這個“水壺”,向AI花園澆灌,用大模型的技術(shù)賦能旗下AI終端產(chǎn)品。
5月6日,科大訊飛發(fā)布了大模型星火,從大模型具備的能力來看,和此前其他大廠的大模型相差無異。同樣具備文本生成、語言理解,知識問答、邏輯推理等方面的技術(shù)能力。但值得一提的是,星火并不具備文生圖能力,無法通過語言轉(zhuǎn)換為圖片。
科大訊飛將星火定義為認(rèn)知大模型,和目前“大模型混戰(zhàn)”的主力軍語言大模型有所差異。
為了明確認(rèn)知和語言的具體區(qū)別,紫金財經(jīng)向星火提問,星火表示“認(rèn)知模型更關(guān)注人類語言的理解和生成過程,而語言模型更關(guān)注語言中詞匯、語法和語義等方面的規(guī)律。”
簡單來說,其他大廠發(fā)布的語言大模型,更偏重于語言本身的規(guī)律,而訊飛的星火則側(cè)重于人類語言的理解,俗稱更懂人說話的邏輯。
科大訊飛將大模型的研究方向定為認(rèn)知的原因,也不難理解。畢竟,2022年教育業(yè)務(wù)、開放平臺及消費(fèi)者業(yè)務(wù),合計為科大訊飛貢獻(xiàn)了超過50%的營業(yè)收入。這兩項(xiàng)業(yè)務(wù)的產(chǎn)品使用場景,也都導(dǎo)向了人類自然語言與AI的交互。
認(rèn)知大模型更符合科大訊飛的“調(diào)性”,畢竟在AI終端產(chǎn)品上深耕多年,科大訊飛具備一定的技術(shù)底色和用戶數(shù)據(jù),來支持大模型的研發(fā),同時產(chǎn)品亦能為大模型提供商業(yè)落地場景,讓技術(shù)不再飄在空中。
雖然內(nèi)部將大模型和產(chǎn)品融合,呈現(xiàn)良性驅(qū)動,但外部的競爭,不容小覷。
從宏觀的視角來看,此次科大訊飛加入的大模型混戰(zhàn),可謂是移動互聯(lián)網(wǎng)技術(shù)底色最濃的一次戰(zhàn)爭。海外有Chat GPT立標(biāo)桿,國內(nèi)各互聯(lián)網(wǎng)大廠投身熱潮,同屬于AI賽道的老對手商湯科技,已經(jīng)搶先一步發(fā)布大模型。
對于科大訊飛而言,這將是一場比拼韌勁的艱難戰(zhàn)爭。為了研發(fā)星火,科大訊飛投入的資金,使得今年Q1扣非歸母凈利潤大跌331.82%,這讓本就離不開補(bǔ)貼和融資的企業(yè),又增添了幾分現(xiàn)金流的危機(jī)感。
參戰(zhàn)大模型,不知道科大訊飛準(zhǔn)備了多少彈藥?
星火的“前世今生”
“今年10月24日,通用模型對標(biāo)ChatGPT(中文超越,英文相當(dāng))。”科大訊飛董事長劉慶峰豪言。
科大訊飛給自己定下的目標(biāo),可以說放在國內(nèi)所有大模型廠商中,都是很高的水準(zhǔn)了。百度創(chuàng)始人李彥宏曾在文心一言發(fā)布之際表示,距離ChatGPT還有兩個月的差距,而這兩個月的差距具體需要多久才能趕上是個未知數(shù)。
雖然距離科大訊飛兌現(xiàn)諾言的時候還有幾個月時間,但我們?nèi)钥梢詮倪^往和當(dāng)下,來還原科大訊飛所具備的技術(shù)積累,而這也是科大訊飛參戰(zhàn)大模型的基礎(chǔ)彈藥。
從大模型自身來看,廠商需要具備數(shù)據(jù)積累、核心算法、算法創(chuàng)新、算力支撐等方面能力。而這些能力代入到科大訊飛中,就離不開星火誕生之前,科大訊飛的努力。
這些技術(shù)沉淀,也可以看作是星火的“前世”。
2011年科大訊飛,承建了語音及語言信息處理國家工程實(shí)驗(yàn)室,當(dāng)時科大訊飛提出了讓機(jī)器像人一樣能聽會說。從如今的視角來看,這也是當(dāng)下認(rèn)知大模型語音和語言的核心能力的基礎(chǔ)條件。
在核心算法層面,GPT的核心算法支撐為Transformer(深度神經(jīng)網(wǎng)絡(luò)算法),這個算法起初是聚焦在自然語言處理領(lǐng)域,隨后發(fā)展至各個領(lǐng)域,也是目前AI主流的算法模型。
科大訊飛的星火模型,同樣是基于Transformer的,擁有超過1000億個參數(shù),是目前世界上最大的中文預(yù)訓(xùn)練語言模型。經(jīng)過多年的技術(shù)沉淀,目前科大訊飛已經(jīng)將Transformer深度神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于,語音識別、圖文識別、機(jī)器翻譯中。科大訊飛已開源6大類、超過40個通用領(lǐng)域系列的中文預(yù)訓(xùn)練語言模型,相關(guān)模型庫月均調(diào)用量超1000萬。
除了Transformer之外,在核心算法層面上,科大訊飛還創(chuàng)新性地提出了知識與大模型融合的統(tǒng)一理解框架X-Reasoner,有望彌補(bǔ)大模型的模糊記憶技術(shù)短板。X-Reasoner的基本技術(shù)是科大訊飛研發(fā)并應(yīng)用十幾年的DNN,早在2011年科大訊飛就上線了中文語音識別DNN系統(tǒng)。
X-Reasoner于2017年發(fā)布,是一款基于語義理解和推理的知識圖譜查詢系統(tǒng)。可以應(yīng)用在智能客服、智能問答系統(tǒng)等領(lǐng)域。在2022年科學(xué)常識推理挑戰(zhàn)賽OpenBookQA中,以準(zhǔn)確率94.2%的優(yōu)勢奪冠,常識推理單模型首超人類平均水平。
由此可見,科大訊飛多年來在AI領(lǐng)域的探索,已具備一定的算法能力,這也是如今星火大模型的技術(shù)底座。經(jīng)過十余年的發(fā)展,這些技術(shù)積累早已形成規(guī)模化的研發(fā),所以在算法創(chuàng)新和算力支撐層面都已十分成熟。
2017年,科大訊飛承建了中國首個認(rèn)知智能領(lǐng)域國家級重點(diǎn)實(shí)驗(yàn)室,設(shè)計了通用認(rèn)知大模型評測體系,評測體系利于科大訊飛推動認(rèn)知大模型的發(fā)展,也為日后創(chuàng)新夯實(shí)基礎(chǔ)。技術(shù)底座中的最后一環(huán),算力支撐是所有大模型廠商最棘手的問題之一。這方面,科大訊飛此前曾建立了AI數(shù)據(jù)中心,這也是大模型訓(xùn)練的硬件基石。
可以說,多年來在AI領(lǐng)域的“厚積”,才讓科大訊飛迎來星火這個“薄發(fā)”的機(jī)會。
但目前,科大訊飛的星火還存在很多不足之處,劉慶峰表示,目前訊飛星火認(rèn)知大模型技術(shù)還存在很多可改進(jìn)之處,比如新知識難以及時更新,事實(shí)類問答容易“張冠李戴”等。
紫金財經(jīng)在和星火進(jìn)行多輪對話時也發(fā)現(xiàn)了部分不足,例如在提問“以人工智能賦能各行各業(yè)為題,寫一篇市場報告”時,星火引用的資料出現(xiàn)了“根據(jù)相關(guān)報告顯示,全球智能物流市場規(guī)模將在XXXX年突破2000億美元”。這部分回答,星火給出了模糊的年份,暴露了模型對資料處理能力的欠缺。在提問“我本周找了十個客戶,沒有成交,請幫我寫一份周報”時,星火給出的回答出現(xiàn)了“找到了十個潛在客戶,其中七個被成功轉(zhuǎn)化為進(jìn)一步聯(lián)系機(jī)會。”這部分回答出現(xiàn)了回答和提問事實(shí)不符的狀況。
所以能看出,星火具備一定的技術(shù)實(shí)力,但隨機(jī)應(yīng)變的能力還需進(jìn)一步加強(qiáng)。
星火誕生,燎原終端
在科大訊飛的總部園區(qū)中心,立著一塊巨石,石頭上刻著“頂天立地”四個大字。
劉慶峰解釋道,“頂天”是指技術(shù)頂天,掌握源頭核心技術(shù)并處于全球領(lǐng)先地位;“立地”是指應(yīng)用落地,讓技術(shù)轉(zhuǎn)化為大眾切實(shí)可感受的產(chǎn)品。
應(yīng)用落地是科大訊飛自1999年成立以來,一直未變的戰(zhàn)略目標(biāo)。這或許也將是科大訊飛在大模型之戰(zhàn)中,差異化的競爭力。此前紫金財經(jīng)曾在《大廠集體搶灘ChatGPT:誰真的有實(shí)力,誰在試點(diǎn)商業(yè)化?》一文中闡述觀點(diǎn),沒有商業(yè)落地場景,那技術(shù)只能是空中樓閣。
科大訊飛在大模型商業(yè)落地環(huán)節(jié)先行一步,目前科大訊飛AI終端產(chǎn)品包括AI學(xué)習(xí)機(jī)、智能辦公本、翻譯機(jī)、語音轉(zhuǎn)換APP等,涵蓋了學(xué)習(xí)、辦公等多個使用場景。這些終端產(chǎn)品承接了星火大模型的落地,星火亦能帶動產(chǎn)品向更智能化的方向發(fā)展。
在星火發(fā)布當(dāng)天,科大訊飛推出了搭載星火大模型的AI學(xué)習(xí)機(jī)T20系列。從使用環(huán)節(jié)來看,星火率先在語數(shù)英主學(xué)科上落地,首批上線了中英文作文類人批改(學(xué)習(xí)機(jī)端)和生成(家長端)、數(shù)學(xué)個性化精準(zhǔn)學(xué)類人互動輔學(xué)、英語類人口語陪練等功能。
所謂類人批改,指的是通過基礎(chǔ)批改、高階批改、提升建議三個層次輔助,完成作文批改后,家長可在手機(jī)端APP上,查看完整批改報告。此外T20系列還上線了口語陪練的功能,通過陪伴式對話練習(xí),提升口語表達(dá)能力。
從科大訊飛的商業(yè)化進(jìn)程來看,首推AI學(xué)習(xí)機(jī)作為星火的落地應(yīng)用產(chǎn)品,是最能減少試錯成本的一次實(shí)驗(yàn)。
首先,科大訊飛在大教育領(lǐng)域早已從B端、C端兩方面進(jìn)行布局。以語音識別起家的科大訊飛,早在2015年,就聯(lián)合教育部門運(yùn)營了普通話機(jī)考、中英文作文評分等智慧教育解決方案。2022年,已經(jīng)覆蓋了到全國超31個省級行政區(qū)。
2016年智慧教育在科大訊飛的營收中占比27.44%,2022年已經(jīng)上升到29.19%,貢獻(xiàn)了23.28億的收入,成為科大訊飛商業(yè)化中不可或缺的一環(huán)。
多年來在教育B端領(lǐng)域的沉淀,是科大訊飛將星火融合到學(xué)習(xí)機(jī)中的最佳技術(shù)底氣。此外,C端的教育硬件布局,也能幫助科大訊飛減少用戶教育成本,能在最短的時間內(nèi),觸達(dá)更多C端用戶。
2022年,科大訊飛AI學(xué)習(xí)機(jī)授權(quán)專賣店預(yù)計新增到3000家左右;全品類官方直營店當(dāng)前累計布局70家。2022年上半年科大訊飛AI學(xué)習(xí)機(jī)銷售額增長超101%,去年的618購物節(jié)中,科大訊飛學(xué)習(xí)機(jī)穩(wěn)居淘寶、京東等平臺同品類第一名。
這些數(shù)據(jù)表明,科大訊飛在AI學(xué)習(xí)機(jī)品類上有一批種子用戶,同時也會有更多潛在用戶等待撬動。去年券商調(diào)研中,科大訊飛表示,在調(diào)研的上千個城市中,80%的城市已經(jīng)明確家長可以付費(fèi),意愿在600-1000元一學(xué)期不等。
由此可見,教育硬件可以讓科大訊飛星火“軟著陸”。
另一個關(guān)鍵點(diǎn)是,星火主要賦能的是數(shù)語外三大主科,這三個科目所涉及到的基本邏輯,也正是一個認(rèn)知模型的基礎(chǔ)。通過和用戶的使用交互,亦能為大模型迭代提供數(shù)據(jù)資產(chǎn)。
科大訊飛表示,1就是大模型底座,N指的是將認(rèn)知智能大模型技術(shù)應(yīng)用在教育、醫(yī)療、人機(jī)交互、辦公、翻譯等多個行業(yè)領(lǐng)域。這些領(lǐng)域中,科大訊飛早有C端產(chǎn)品布局,如今也迎來轉(zhuǎn)折之時。
在辦公領(lǐng)域,訊飛辦公本借助大模型能力,根據(jù)手寫要點(diǎn)自動生成會議紀(jì)要,將會議語音轉(zhuǎn)化成書面化文稿。“訊飛聽見”通過AI分析文字內(nèi)容,自動生成摘要、待辦、文案等。
辦公場景所涉及到的功能,其自然語言處理的基因,天然適合大模型應(yīng)用。這也是科大訊飛在大模型商業(yè)化上更迅速的原因之一。
目前,科大訊飛的翻譯機(jī)、語音轉(zhuǎn)換APP等產(chǎn)品雖然在細(xì)分賽道上都已交出不錯的答卷,但始終未完成破圈,尚未形成在大眾范圍里的影響力。何況這個領(lǐng)域中,還有網(wǎng)易等大廠也有產(chǎn)品與其競爭。如果未來將星火集成在C端產(chǎn)品中,有望助力科大訊飛在智能硬件市場的突破。
科大訊飛在終端硬件的產(chǎn)品線雖廣而全,但一直沒有網(wǎng)紅級產(chǎn)品,難以釋放太多商業(yè)價值。遍布AI草地的科大訊飛,或許比誰都需要AI這把火。
科大訊飛:往前看,別回頭
AI領(lǐng)域向來是一個長坡厚雪的賽道,賽道的特殊性表明,拔得頭籌并不是一朝一夕的事情。
尤其是在大模型領(lǐng)域,“貴”已經(jīng)成為所有參戰(zhàn)廠商頭頂上的“達(dá)摩克利斯之劍”。Open AI在推出GPT3的API之前,就已“燒”掉了數(shù)億美金,后在拿到了微軟百億美元的投資下,才使得GPT3面世。
所以想要對標(biāo)甚至趕超GPT,資金是必不可少的一環(huán)。
而這也是科大訊飛在持久戰(zhàn)層面,面臨的最棘手的問題。根據(jù)2022年財報顯示,科大訊飛營收188.20億元,同比微增2.77%;凈利潤5.61億元,同比下滑63.94%;扣非后歸母凈利潤4.18億元,同比下滑57.31%。
去年,科大訊飛已經(jīng)出現(xiàn)了營收微漲,但凈利潤腰斬的狀況。
對此科大訊飛解釋稱,一方面是由于社會經(jīng)濟(jì)的特殊環(huán)境,相關(guān)項(xiàng)目進(jìn)度有所延期;尤其在第四季度,公司有超過 20 個項(xiàng)目、超過 30 億元的合同延期。
除了客觀不可抗力因素影響外,自 2019 年科大訊飛被列入美國實(shí)體清單后,2022年10月7日,再次被極限施壓。強(qiáng)壓之下,對于科大訊飛整體的供應(yīng)鏈,也是一個不可忽視的挑戰(zhàn)。
資金層面更棘手的是,如今科大訊飛依賴政府補(bǔ)助的老問題依舊存在。2019年-2021年,計入當(dāng)期損益的政府補(bǔ)助分別為4.12億、4.26億和4.39億,占總利潤比例分別為50.24%、31.23%、28.21%。2022年,科大訊飛計入當(dāng)期損益的政府補(bǔ)助金額上升到了10億元。
簡單來說,在星火面世之前,科大訊飛已經(jīng)面臨來自供應(yīng)鏈、訂單等多維度的壓力。而這些壓力的最終也將體現(xiàn)在公司的現(xiàn)金流層面。
今年科大訊飛更是迎來動蕩時刻,2023年一季度,科大訊飛實(shí)現(xiàn)營業(yè)收入28.88億元,同比下降17.64%;歸母凈利潤-5.8億元,同比下降152.26%;扣非凈利潤-3.38億元,同比大跌331.82%。
對此科大訊飛表示,凈利潤受新增項(xiàng)目研發(fā)投入影響。這里指的新增項(xiàng)目就是星火,為了研發(fā)星火,2023年一季度,研發(fā)投入為7.16億元,去年同期的研發(fā)費(fèi)用為6.77億元。
營收、凈利潤雙重下降,勢必對現(xiàn)有賬面產(chǎn)生沖擊。截至2023年Q1季度,科大訊飛現(xiàn)金及現(xiàn)金等價物額為30.37億,環(huán)比2022年Q4的41.72億元,下降了11%。同比下降5.6%。
在財報電話會上,科大訊飛表示不會像OpenAI那樣需要耗費(fèi)百億美金,不會需要那么多人力資金。但并未具體透露研發(fā)成本。
只有取得高質(zhì)量營收增長,解決研發(fā)投入對公司利潤產(chǎn)生的沖擊,才能讓科大訊飛在大模型之戰(zhàn)中,找到長期支柱。已經(jīng)伸進(jìn)來了一只腳,只能往前看,別回頭!
總結(jié)
今年以來,市面上涌現(xiàn)了太多的大模型,無論是互聯(lián)網(wǎng)大廠還是AI企業(yè),亦或是初創(chuàng)公司,都紛紛投入到這場浪潮中。
誠然,大模型所帶來的將是產(chǎn)業(yè)級的重塑,對于相關(guān)產(chǎn)業(yè)的玩家而言,是一個不容忽視的機(jī)遇,甚至可以說成敗在此一舉。
但水能載舟、亦能覆舟。
大模型為企業(yè)帶來具備想象力的商業(yè)空間時,其所需的巨大投入,也將會拖累企業(yè)的長久發(fā)展腳步。新技術(shù)固然值得期待,但這條路不僅需要入局者仰望星空,更需要具備身子下沉、眼睛向下,腳踏實(shí)地一往無前的韌勁。
免責(zé)聲明:本網(wǎng)站所有文章僅作為資訊傳播使用,既不代表任何觀點(diǎn)導(dǎo)向,也不構(gòu)成任何投資建議。】
猜你喜歡
AI大模型洞察系列之二:星火大模型低級錯誤頻發(fā),科大訊飛還能頂住嗎?
近日,科大訊飛發(fā)布公告稱,公司擬將控股子公司訊飛醫(yī)療分拆至港股上市。堪比毒教材!科大訊飛學(xué)習(xí)機(jī)公然詆毀民族英雄
值得注意的是,該文章疑似是科大訊飛學(xué)習(xí)機(jī)生成的原創(chuàng)文章。扣非凈利潤首虧3.04億元 千億市值科大訊飛借AI風(fēng)口還能走多遠(yuǎn)?
2023年上半年,科大訊飛營收和歸母凈利潤雙雙下滑,其扣非后歸母凈利潤更是虧損3.04億元,銷售凈利率低至0.19%,應(yīng)收賬款高達(dá)108.75億元,是營收的1.39倍科大訊飛押注星火大模型:主業(yè)增長不夠,大模型來湊
無論是為了適應(yīng)全新階段目標(biāo),還是支撐估值可持續(xù),大模型一戰(zhàn),科大訊飛絕不能輸。
紫金財經(jīng)
共62篇文章
紫金財經(jīng)-聚焦最頭條的科技行業(yè)資訊,極具深度的科技行業(yè)新媒體.