山海上新:新增實(shí)時(shí)檢索功能,小程序同步升級(jí)

近日,山海大模型再迭新,各項(xiàng)性能持續(xù)增強(qiáng)的同時(shí),新增實(shí)時(shí)檢索功能,處理動(dòng)態(tài)、實(shí)時(shí)信息更得心應(yīng)手,一問一答更精準(zhǔn)高效,極大提升了用戶使用體驗(yàn)。

技術(shù)升級(jí),性能全面提升

相較于上一代,山海大模型在語義理解、邏輯推理以及指令遵循性能、對(duì)齊能力性能等方面顯著提升。

此次大模型升級(jí)中,云知聲引入自我演進(jìn)偏好學(xué)習(xí)技術(shù),使得大模型能夠通過自我對(duì)弈微調(diào)(SPIN)實(shí)現(xiàn)自我提升。

在基礎(chǔ)設(shè)施方面,云知聲升級(jí)自研Uniscale訓(xùn)練推理一體化框架,以支持千億級(jí)模型的偏好對(duì)齊訓(xùn)練。這一升級(jí)使得山海能夠處理更大規(guī)模的數(shù)據(jù)集,從而提高訓(xùn)練效率和模型性能。

在數(shù)據(jù)生成方面,云知聲采用指令自我迭代算法,生成了更加復(fù)雜和多樣的指令數(shù)據(jù)。為了降低高質(zhì)量人工偏好數(shù)據(jù)的高昂成本,其結(jié)合了RLHF(強(qiáng)化學(xué)習(xí)人類反饋)和RLAIF(強(qiáng)化學(xué)習(xí)人工智能反饋)方法,生成大量偏好數(shù)據(jù)。同時(shí),借鑒課程學(xué)習(xí)的思路,對(duì)偏好數(shù)據(jù)進(jìn)行重排,使模型能夠從簡(jiǎn)單任務(wù)逐步過渡到復(fù)雜任務(wù),有效提升了學(xué)習(xí)效率和效果。

在算法創(chuàng)新方面,SPIN技術(shù)通過自我對(duì)弈機(jī)制,讓LLM在迭代過程中自我生成訓(xùn)練數(shù)據(jù),并通過比較自生成響應(yīng)和人類標(biāo)注響應(yīng)來優(yōu)化其策略。這種方法不僅提升了大模型性能,也充分釋放了人工標(biāo)注數(shù)據(jù)在監(jiān)督微調(diào)(SFT)中的潛力。

新增實(shí)時(shí)檢索,讓答案觸手可及

為進(jìn)一步提升用戶體驗(yàn),此次升級(jí),山海大模型引入實(shí)時(shí)檢索功能,無論是最新資訊、熱點(diǎn)事件還是專業(yè)查詢,用戶的每一問,都將得到更精準(zhǔn)及時(shí)的回應(yīng)。

為了實(shí)現(xiàn)這一流程,云知聲自研Agent框架,充分釋放大模型推理和交互潛力,確保了用戶意圖的精準(zhǔn)理解、信息的高效獲取與總結(jié),以及生成高質(zhì)量回應(yīng)的可靠性。

應(yīng)用先進(jìn)的意圖理解和高效的實(shí)時(shí)信息獲取能力,山海能夠在極短的時(shí)間里對(duì)用戶的交互進(jìn)行意圖判斷,并依托對(duì)自身知識(shí)庫的深刻理解,精準(zhǔn)決策對(duì)話過程中是否需要額外信息的支持。這一過程不僅避免了無效的檢索,還顯著提升了對(duì)話生成的速度和準(zhǔn)確性。

當(dāng)山海判斷用戶的交互超出了自己的認(rèn)知時(shí),能夠迅速啟動(dòng)信息搜索機(jī)制,從互聯(lián)網(wǎng)的海量數(shù)據(jù)中迅速定位并提取相關(guān)話題內(nèi)容。通過高效的信息處理和總結(jié),為用戶提供準(zhǔn)確、及時(shí)且詳盡的答復(fù)。

目前,實(shí)時(shí)檢索功能已在山海小程序同步上線,歡迎大家體驗(yàn)試用,讓山海真正成為你工作生活中的隨身智能助手。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )