一手測評訊飛星火后,發(fā)現(xiàn)劉慶峰在發(fā)布會上說的都是“大實話”

自去年11月30日ChatGPT發(fā)布以來,認知大模型技術(shù)快速走完了市場驗證階段,短短一個多月全球用戶數(shù)破億,直接吸引了國內(nèi)眾多巨頭“參戰(zhàn)”。從技術(shù)形態(tài)看,ChatGPT是標準的AIGC(生成式AI)產(chǎn)品,利用現(xiàn)有文本、音頻或圖像技術(shù)生成新內(nèi)容,未來將朝著多模態(tài)融合路徑發(fā)展。 5月6日,科大訊飛召開了星火認知大模型成果發(fā)布會,其各項能力展示讓我看到了國產(chǎn)大模型的新希望。

雖然筆者無法親臨發(fā)布會現(xiàn)場,但也在當天第一時間注冊并體驗了產(chǎn)品。跟很多人一樣,當我用完訊飛星火后大吃一驚,沒想到它竟到了如此高度。據(jù)悉,訊飛星火認知大模型在文本生成和數(shù)學能力上,已經(jīng)國內(nèi)顯著領先,且相比ChatGPT也具有一定優(yōu)勢;在語言理解和知識問答方面也達到接近ChatGPT水平。同時科大訊飛根據(jù)認知智能全國重點實驗室牽頭設計的“通用認知智能大模型評測體系”測試得出了以上結(jié)論,該評測體系還獲得了中科院人工智能產(chǎn)學研產(chǎn)業(yè)聯(lián)盟與長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟的認可,這兩大聯(lián)盟分別側(cè)重源頭技術(shù)創(chuàng)新和產(chǎn)業(yè)鏈應用落地,在行業(yè)內(nèi)擁有舉足輕重的“話語權(quán)”。

當?shù)顷懶腔鹫J知大模型后,我主要圍繞知識問答、文本生成、和數(shù)學能力展開。第一題我就給它挖了一個大大的坑——“爆炒螺絲釘這道菜怎么做?”,之前用其他兩個國產(chǎn)大模型回答這道題,他倆雙雙入坑,真把“爆炒螺絲釘”理解為一道菜,還像模像樣的給出了菜譜做法。而星火就很聰明,它直接表明“爆炒螺絲釘”這道菜并不存在,并通過邏輯推理說明了緣由,因為螺絲釘是金屬制品無法烹飪和食用,最后還貼心地問我是不是想要了解螺螄粉或其他美食的做法,這回答太機智了。

再來一道文本生成的提問,我看發(fā)布會上劉慶峰透露了純大模型技術(shù)的待攻克缺陷,其中一點就有“新知識難以及時更新”,比如ChatGPT的訓練數(shù)據(jù)庫僅更新至2021年,而星火的訓練數(shù)據(jù)庫已更新至2022年,因此星火能給出去年五一游客量的提問。而我今年受《三體》電視劇影響,對外星人非常著迷,隨即讓星火寫一篇“浩瀚宇宙真的有外星人”的文章,結(jié)果它洋洋灑灑寫了一篇644字的小作文,不僅文筆流暢,而且還涵蓋了物理、地理等科學知識,不在“有沒有”上浪費口舌,而是用邏輯推理給出了多種合理解釋,令我信服。

再來一道困擾我很久的數(shù)學題,這道題在發(fā)布會上也有演示,那就是“股票昨天漲了10%,今天又跌了10%,最終到底是漲是跌”,我可以說90%的人都誤以為不賺不賠,但實際上呢?星火假設股票初始價格為100元,再通過兩組計算解出了正確答案,最終股票價格是跌了1元。作為一個8歲孩子的家長,我突然靈機一動,以后檢查孩子數(shù)學作業(yè),我不懂的數(shù)學題可以讓星火替我解題。這或許是劉慶峰那句“一個更美好的世界將始于我們每個人的提問,期待讓星火大模型成為每個人的AI助手”的生動寫照。當然,目前可供普通用戶使用的星火認知大模型,還沒有發(fā)布會上演示的菜單識別等功能。但可以預見的是,未來認知大模型一定是朝著文字、語音、圖片甚至視頻等多模態(tài)融合方向去發(fā)展,這樣就能讓星火更深入的參與藝術(shù)創(chuàng)作等領域。

在發(fā)布會上,劉慶峰還宣布了年內(nèi)星火大模型技術(shù)持續(xù)升級的三個關鍵里程碑節(jié)點:6月9日,將突破開放式問答、多輪對話能力明顯提升、數(shù)學能力再升級;8月15日,代碼能力升級以及多模態(tài)交互能力提升,希望能幫助到更多的合作伙伴及開發(fā)者團隊;10月24日,將實現(xiàn)通用模型對標ChatGPT,中文超越ChatGPT的當前版本,英文能做到相當水平,并在教育、醫(yī)療等領域做到業(yè)界領先。在實際使用星火過程中,我偶爾也會遇到星火出現(xiàn)大模型的通病,比如張冠李戴等,但看到科大訊飛公布的三個節(jié)點,就可以了解到星火還在不斷進化,那一些通病也是情有可原,整體來看,訊飛星火回答完整度和準確率還是很高的。

如果你也想體驗訊飛星火,可以直接用百度搜索“訊飛星火”關鍵詞,跳轉(zhuǎn)官網(wǎng)注冊后即可使用!

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )