星火是燎原還是“火災(zāi)”？科大訊飛：往前看，別回頭

紫金財經(jīng)鈺熙2023-05-10 14:54 數(shù)字產(chǎn)業(yè)

AI終端產(chǎn)品“遍地開花”的科大訊飛，終于拿出大模型這個“水壺”，向AI花園澆灌，用大模型的技術(shù)賦能旗下AI終端產(chǎn)品。

5月6日，科大訊飛發(fā)布了大模型星火，從大模型具備的能力來看，和此前其他大廠的大模型相差無異。同樣具備文本生成、語言理解，知識問答、邏輯推理等方面的技術(shù)能力。但值得一提的是，星火并不具備文生圖能力，無法通過語言轉(zhuǎn)換為圖片。

科大訊飛將星火定義為認(rèn)知大模型，和目前“大模型混戰(zhàn)”的主力軍語言大模型有所差異。

為了明確認(rèn)知和語言的具體區(qū)別，紫金財經(jīng)向星火提問，星火表示“認(rèn)知模型更關(guān)注人類語言的理解和生成過程，而語言模型更關(guān)注語言中詞匯、語法和語義等方面的規(guī)律。”

簡單來說，其他大廠發(fā)布的語言大模型，更偏重于語言本身的規(guī)律，而訊飛的星火則側(cè)重于人類語言的理解，俗稱更懂人說話的邏輯。

科大訊飛將大模型的研究方向定為認(rèn)知的原因，也不難理解。畢竟，2022年教育業(yè)務(wù)、開放平臺及消費(fèi)者業(yè)務(wù)，合計為科大訊飛貢獻(xiàn)了超過50%的營業(yè)收入。這兩項(xiàng)業(yè)務(wù)的產(chǎn)品使用場景，也都導(dǎo)向了人類自然語言與AI的交互。

認(rèn)知大模型更符合科大訊飛的“調(diào)性”，畢竟在AI終端產(chǎn)品上深耕多年，科大訊飛具備一定的技術(shù)底色和用戶數(shù)據(jù)，來支持大模型的研發(fā)，同時產(chǎn)品亦能為大模型提供商業(yè)落地場景，讓技術(shù)不再飄在空中。

雖然內(nèi)部將大模型和產(chǎn)品融合，呈現(xiàn)良性驅(qū)動，但外部的競爭，不容小覷。

從宏觀的視角來看，此次科大訊飛加入的大模型混戰(zhàn)，可謂是移動互聯(lián)網(wǎng)技術(shù)底色最濃的一次戰(zhàn)爭。海外有Chat GPT立標(biāo)桿，國內(nèi)各互聯(lián)網(wǎng)大廠投身熱潮，同屬于AI賽道的老對手商湯科技，已經(jīng)搶先一步發(fā)布大模型。

對于科大訊飛而言，這將是一場比拼韌勁的艱難戰(zhàn)爭。為了研發(fā)星火，科大訊飛投入的資金，使得今年Q1扣非歸母凈利潤大跌331.82％，這讓本就離不開補(bǔ)貼和融資的企業(yè)，又增添了幾分現(xiàn)金流的危機(jī)感。

參戰(zhàn)大模型，不知道科大訊飛準(zhǔn)備了多少彈藥？

星火的“前世今生”

“今年10月24日，通用模型對標(biāo)ChatGPT（中文超越，英文相當(dāng)）。”科大訊飛董事長劉慶峰豪言。

科大訊飛給自己定下的目標(biāo)，可以說放在國內(nèi)所有大模型廠商中，都是很高的水準(zhǔn)了。百度創(chuàng)始人李彥宏曾在文心一言發(fā)布之際表示，距離ChatGPT還有兩個月的差距，而這兩個月的差距具體需要多久才能趕上是個未知數(shù)。

雖然距離科大訊飛兌現(xiàn)諾言的時候還有幾個月時間，但我們?nèi)钥梢詮倪^往和當(dāng)下，來還原科大訊飛所具備的技術(shù)積累，而這也是科大訊飛參戰(zhàn)大模型的基礎(chǔ)彈藥。

從大模型自身來看，廠商需要具備數(shù)據(jù)積累、核心算法、算法創(chuàng)新、算力支撐等方面能力。而這些能力代入到科大訊飛中，就離不開星火誕生之前，科大訊飛的努力。

這些技術(shù)沉淀，也可以看作是星火的“前世”。

2011年科大訊飛，承建了語音及語言信息處理國家工程實(shí)驗(yàn)室，當(dāng)時科大訊飛提出了讓機(jī)器像人一樣能聽會說。從如今的視角來看，這也是當(dāng)下認(rèn)知大模型語音和語言的核心能力的基礎(chǔ)條件。

在核心算法層面，GPT的核心算法支撐為Transformer（深度神經(jīng)網(wǎng)絡(luò)算法），這個算法起初是聚焦在自然語言處理領(lǐng)域，隨后發(fā)展至各個領(lǐng)域，也是目前AI主流的算法模型。

科大訊飛的星火模型，同樣是基于Transformer的，擁有超過1000億個參數(shù)，是目前世界上最大的中文預(yù)訓(xùn)練語言模型。經(jīng)過多年的技術(shù)沉淀，目前科大訊飛已經(jīng)將Transformer深度神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于，語音識別、圖文識別、機(jī)器翻譯中。科大訊飛已開源6大類、超過40個通用領(lǐng)域系列的中文預(yù)訓(xùn)練語言模型，相關(guān)模型庫月均調(diào)用量超1000萬。

除了Transformer之外，在核心算法層面上，科大訊飛還創(chuàng)新性地提出了知識與大模型融合的統(tǒng)一理解框架X-Reasoner，有望彌補(bǔ)大模型的模糊記憶技術(shù)短板。X-Reasoner的基本技術(shù)是科大訊飛研發(fā)并應(yīng)用十幾年的DNN，早在2011年科大訊飛就上線了中文語音識別DNN系統(tǒng)。

X-Reasoner于2017年發(fā)布，是一款基于語義理解和推理的知識圖譜查詢系統(tǒng)。可以應(yīng)用在智能客服、智能問答系統(tǒng)等領(lǐng)域。在2022年科學(xué)常識推理挑戰(zhàn)賽OpenBookQA中，以準(zhǔn)確率94.2%的優(yōu)勢奪冠，常識推理單模型首超人類平均水平。

由此可見，科大訊飛多年來在AI領(lǐng)域的探索，已具備一定的算法能力，這也是如今星火大模型的技術(shù)底座。經(jīng)過十余年的發(fā)展，這些技術(shù)積累早已形成規(guī)模化的研發(fā)，所以在算法創(chuàng)新和算力支撐層面都已十分成熟。

2017年，科大訊飛承建了中國首個認(rèn)知智能領(lǐng)域國家級重點(diǎn)實(shí)驗(yàn)室，設(shè)計了通用認(rèn)知大模型評測體系，評測體系利于科大訊飛推動認(rèn)知大模型的發(fā)展，也為日后創(chuàng)新夯實(shí)基礎(chǔ)。技術(shù)底座中的最后一環(huán)，算力支撐是所有大模型廠商最棘手的問題之一。這方面，科大訊飛此前曾建立了AI數(shù)據(jù)中心，這也是大模型訓(xùn)練的硬件基石。

可以說，多年來在AI領(lǐng)域的“厚積”，才讓科大訊飛迎來星火這個“薄發(fā)”的機(jī)會。

但目前，科大訊飛的星火還存在很多不足之處，劉慶峰表示，目前訊飛星火認(rèn)知大模型技術(shù)還存在很多可改進(jìn)之處，比如新知識難以及時更新，事實(shí)類問答容易“張冠李戴”等。

紫金財經(jīng)在和星火進(jìn)行多輪對話時也發(fā)現(xiàn)了部分不足，例如在提問“以人工智能賦能各行各業(yè)為題，寫一篇市場報告”時，星火引用的資料出現(xiàn)了“根據(jù)相關(guān)報告顯示，全球智能物流市場規(guī)模將在XXXX年突破2000億美元”。這部分回答，星火給出了模糊的年份，暴露了模型對資料處理能力的欠缺。在提問“我本周找了十個客戶，沒有成交，請幫我寫一份周報”時，星火給出的回答出現(xiàn)了“找到了十個潛在客戶，其中七個被成功轉(zhuǎn)化為進(jìn)一步聯(lián)系機(jī)會。”這部分回答出現(xiàn)了回答和提問事實(shí)不符的狀況。

所以能看出，星火具備一定的技術(shù)實(shí)力，但隨機(jī)應(yīng)變的能力還需進(jìn)一步加強(qiáng)。

星火誕生，燎原終端

在科大訊飛的總部園區(qū)中心，立著一塊巨石，石頭上刻著“頂天立地”四個大字。

劉慶峰解釋道，“頂天”是指技術(shù)頂天，掌握源頭核心技術(shù)并處于全球領(lǐng)先地位；“立地”是指應(yīng)用落地，讓技術(shù)轉(zhuǎn)化為大眾切實(shí)可感受的產(chǎn)品。

應(yīng)用落地是科大訊飛自1999年成立以來，一直未變的戰(zhàn)略目標(biāo)。這或許也將是科大訊飛在大模型之戰(zhàn)中，差異化的競爭力。此前紫金財經(jīng)曾在《大廠集體搶灘ChatGPT：誰真的有實(shí)力，誰在試點(diǎn)商業(yè)化？》一文中闡述觀點(diǎn)，沒有商業(yè)落地場景，那技術(shù)只能是空中樓閣。

科大訊飛在大模型商業(yè)落地環(huán)節(jié)先行一步，目前科大訊飛AI終端產(chǎn)品包括AI學(xué)習(xí)機(jī)、智能辦公本、翻譯機(jī)、語音轉(zhuǎn)換APP等，涵蓋了學(xué)習(xí)、辦公等多個使用場景。這些終端產(chǎn)品承接了星火大模型的落地，星火亦能帶動產(chǎn)品向更智能化的方向發(fā)展。

在星火發(fā)布當(dāng)天，科大訊飛推出了搭載星火大模型的AI學(xué)習(xí)機(jī)T20系列。從使用環(huán)節(jié)來看，星火率先在語數(shù)英主學(xué)科上落地，首批上線了中英文作文類人批改（學(xué)習(xí)機(jī)端）和生成（家長端）、數(shù)學(xué)個性化精準(zhǔn)學(xué)類人互動輔學(xué)、英語類人口語陪練等功能。

所謂類人批改，指的是通過基礎(chǔ)批改、高階批改、提升建議三個層次輔助，完成作文批改后，家長可在手機(jī)端APP上，查看完整批改報告。此外T20系列還上線了口語陪練的功能，通過陪伴式對話練習(xí)，提升口語表達(dá)能力。

從科大訊飛的商業(yè)化進(jìn)程來看，首推AI學(xué)習(xí)機(jī)作為星火的落地應(yīng)用產(chǎn)品，是最能減少試錯成本的一次實(shí)驗(yàn)。

首先，科大訊飛在大教育領(lǐng)域早已從B端、C端兩方面進(jìn)行布局。以語音識別起家的科大訊飛，早在2015年，就聯(lián)合教育部門運(yùn)營了普通話機(jī)考、中英文作文評分等智慧教育解決方案。2022年，已經(jīng)覆蓋了到全國超31個省級行政區(qū)。

2016年智慧教育在科大訊飛的營收中占比27.44%，2022年已經(jīng)上升到29.19%，貢獻(xiàn)了23.28億的收入，成為科大訊飛商業(yè)化中不可或缺的一環(huán)。

多年來在教育B端領(lǐng)域的沉淀，是科大訊飛將星火融合到學(xué)習(xí)機(jī)中的最佳技術(shù)底氣。此外，C端的教育硬件布局，也能幫助科大訊飛減少用戶教育成本，能在最短的時間內(nèi)，觸達(dá)更多C端用戶。

2022年，科大訊飛AI學(xué)習(xí)機(jī)授權(quán)專賣店預(yù)計新增到3000家左右；全品類官方直營店當(dāng)前累計布局70家。2022年上半年科大訊飛AI學(xué)習(xí)機(jī)銷售額增長超101%，去年的618購物節(jié)中，科大訊飛學(xué)習(xí)機(jī)穩(wěn)居淘寶、京東等平臺同品類第一名。

這些數(shù)據(jù)表明，科大訊飛在AI學(xué)習(xí)機(jī)品類上有一批種子用戶，同時也會有更多潛在用戶等待撬動。去年券商調(diào)研中，科大訊飛表示，在調(diào)研的上千個城市中，80%的城市已經(jīng)明確家長可以付費(fèi)，意愿在600-1000元一學(xué)期不等。

由此可見，教育硬件可以讓科大訊飛星火“軟著陸”。

另一個關(guān)鍵點(diǎn)是，星火主要賦能的是數(shù)語外三大主科，這三個科目所涉及到的基本邏輯，也正是一個認(rèn)知模型的基礎(chǔ)。通過和用戶的使用交互，亦能為大模型迭代提供數(shù)據(jù)資產(chǎn)。

科大訊飛表示，1就是大模型底座，N指的是將認(rèn)知智能大模型技術(shù)應(yīng)用在教育、醫(yī)療、人機(jī)交互、辦公、翻譯等多個行業(yè)領(lǐng)域。這些領(lǐng)域中，科大訊飛早有C端產(chǎn)品布局，如今也迎來轉(zhuǎn)折之時。

在辦公領(lǐng)域，訊飛辦公本借助大模型能力，根據(jù)手寫要點(diǎn)自動生成會議紀(jì)要，將會議語音轉(zhuǎn)化成書面化文稿。“訊飛聽見”通過AI分析文字內(nèi)容，自動生成摘要、待辦、文案等。

辦公場景所涉及到的功能，其自然語言處理的基因，天然適合大模型應(yīng)用。這也是科大訊飛在大模型商業(yè)化上更迅速的原因之一。

目前，科大訊飛的翻譯機(jī)、語音轉(zhuǎn)換APP等產(chǎn)品雖然在細(xì)分賽道上都已交出不錯的答卷，但始終未完成破圈，尚未形成在大眾范圍里的影響力。何況這個領(lǐng)域中，還有網(wǎng)易等大廠也有產(chǎn)品與其競爭。如果未來將星火集成在C端產(chǎn)品中，有望助力科大訊飛在智能硬件市場的突破。

科大訊飛在終端硬件的產(chǎn)品線雖廣而全，但一直沒有網(wǎng)紅級產(chǎn)品，難以釋放太多商業(yè)價值。遍布AI草地的科大訊飛，或許比誰都需要AI這把火。

科大訊飛：往前看，別回頭

AI領(lǐng)域向來是一個長坡厚雪的賽道，賽道的特殊性表明，拔得頭籌并不是一朝一夕的事情。

尤其是在大模型領(lǐng)域，“貴”已經(jīng)成為所有參戰(zhàn)廠商頭頂上的“達(dá)摩克利斯之劍”。Open AI在推出GPT3的API之前，就已“燒”掉了數(shù)億美金，后在拿到了微軟百億美元的投資下，才使得GPT3面世。

所以想要對標(biāo)甚至趕超GPT，資金是必不可少的一環(huán)。

而這也是科大訊飛在持久戰(zhàn)層面，面臨的最棘手的問題。根據(jù)2022年財報顯示，科大訊飛營收188.20億元，同比微增2.77%；凈利潤5.61億元，同比下滑63.94%；扣非后歸母凈利潤4.18億元，同比下滑57.31%。

去年，科大訊飛已經(jīng)出現(xiàn)了營收微漲，但凈利潤腰斬的狀況。

對此科大訊飛解釋稱，一方面是由于社會經(jīng)濟(jì)的特殊環(huán)境，相關(guān)項(xiàng)目進(jìn)度有所延期；尤其在第四季度，公司有超過 20 個項(xiàng)目、超過 30 億元的合同延期。

除了客觀不可抗力因素影響外，自 2019 年科大訊飛被列入美國實(shí)體清單后，2022年10月7日，再次被極限施壓。強(qiáng)壓之下，對于科大訊飛整體的供應(yīng)鏈，也是一個不可忽視的挑戰(zhàn)。

資金層面更棘手的是，如今科大訊飛依賴政府補(bǔ)助的老問題依舊存在。2019年-2021年，計入當(dāng)期損益的政府補(bǔ)助分別為4.12億、4.26億和4.39億，占總利潤比例分別為50.24%、31.23%、28.21%。2022年，科大訊飛計入當(dāng)期損益的政府補(bǔ)助金額上升到了10億元。

簡單來說，在星火面世之前，科大訊飛已經(jīng)面臨來自供應(yīng)鏈、訂單等多維度的壓力。而這些壓力的最終也將體現(xiàn)在公司的現(xiàn)金流層面。

今年科大訊飛更是迎來動蕩時刻，2023年一季度，科大訊飛實(shí)現(xiàn)營業(yè)收入28.88億元，同比下降17.64%；歸母凈利潤-5.8億元，同比下降152.26%；扣非凈利潤-3.38億元，同比大跌331.82%。

對此科大訊飛表示，凈利潤受新增項(xiàng)目研發(fā)投入影響。這里指的新增項(xiàng)目就是星火，為了研發(fā)星火，2023年一季度，研發(fā)投入為7.16億元，去年同期的研發(fā)費(fèi)用為6.77億元。

營收、凈利潤雙重下降，勢必對現(xiàn)有賬面產(chǎn)生沖擊。截至2023年Q1季度，科大訊飛現(xiàn)金及現(xiàn)金等價物額為30.37億，環(huán)比2022年Q4的41.72億元，下降了11%。同比下降5.6%。

在財報電話會上，科大訊飛表示不會像OpenAI那樣需要耗費(fèi)百億美金，不會需要那么多人力資金。但并未具體透露研發(fā)成本。

只有取得高質(zhì)量營收增長，解決研發(fā)投入對公司利潤產(chǎn)生的沖擊，才能讓科大訊飛在大模型之戰(zhàn)中，找到長期支柱。已經(jīng)伸進(jìn)來了一只腳，只能往前看，別回頭！

總結(jié)

今年以來，市面上涌現(xiàn)了太多的大模型，無論是互聯(lián)網(wǎng)大廠還是AI企業(yè)，亦或是初創(chuàng)公司，都紛紛投入到這場浪潮中。

誠然，大模型所帶來的將是產(chǎn)業(yè)級的重塑，對于相關(guān)產(chǎn)業(yè)的玩家而言，是一個不容忽視的機(jī)遇，甚至可以說成敗在此一舉。

但水能載舟、亦能覆舟。

大模型為企業(yè)帶來具備想象力的商業(yè)空間時，其所需的巨大投入，也將會拖累企業(yè)的長久發(fā)展腳步。新技術(shù)固然值得期待，但這條路不僅需要入局者仰望星空，更需要具備身子下沉、眼睛向下，腳踏實(shí)地一往無前的韌勁。

【本文為合作媒體授權(quán)派財經(jīng)轉(zhuǎn)載，文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點(diǎn)，不代表派財經(jīng)立場，轉(zhuǎn)載請聯(lián)系原作者及原出處獲得授權(quán)。有任何疑問都請聯(lián)系（paicaijing314@126.com）。
免責(zé)聲明：本網(wǎng)站所有文章僅作為資訊傳播使用，既不代表任何觀點(diǎn)導(dǎo)向，也不構(gòu)成任何投資建議。】

科大訊飛