只需要回答幾個問題,就能生成個性化的簡歷,還提供優(yōu)化建議,安排AI模擬面試。這樣的效率神器,就出現第二屆百度搜索創(chuàng)新大賽的賽場上。
來自南京航空航天大學的“肝到凌晨”團隊,利用文心一言插件平臺“靈境矩陣”和百度搜索提供的平臺與技術,憑借AI簡歷助手“Linchance JOB”一舉獲得本次大賽賽道三的冠軍。
百度搜索創(chuàng)新大賽是百度搜索聯合NVIDIA英偉達、全國各大高校、社團、科研組織共同舉辦的一項全國性AI科技競賽。
9月7日正式啟動、以“新搜索·新奇點”為主題的第二屆百度搜索創(chuàng)新大賽,歷經3個月的角逐,最終吸引了2800多人報名,涵蓋了95所雙一流高校,最終28支團隊獲獎,5萬名同學直接參與相關課程學習,宣傳覆蓋100萬開發(fā)者群體。
每個優(yōu)秀成果的背后,無疑離不開優(yōu)秀人才的付出與努力,離不開行業(yè)的加持與探索。百度集團副總裁、百度搜索平臺負責人肖陽在頒獎典禮致辭時表示,“在這次還遠未到終局的大模型浪潮里,搜索的技術變革基因不僅要持續(xù)發(fā)揮作用,還需要自我進化。而這次的進化,更需要創(chuàng)新力量的支持。而得益于創(chuàng)新大賽這個平臺,搜索的技術變?基因,迅速和眾多年輕的血液產生了碰撞。 ”
對此,NVIDIA 全球副總裁何濤在大賽頒獎典禮致辭中也表示:“作為百度搜索創(chuàng)新大賽的技術合作伙伴,我們非常高興的看到百度搜索大賽共吸引了超過兩千多名優(yōu)秀選手參賽。這一年里,各行各業(yè)都在經歷從通用計算到加速計算和生成式AI的平臺轉型。也勉勵在場的各位同學,順應技術發(fā)展趨勢,把握機會,成為懂得使用AI的人,以掌握未來職業(yè)發(fā)展的主動權。”
五大賽道成果亮眼,28支團隊站上領獎臺
肖陽表示,人人都能成為開發(fā)者,搜索創(chuàng)新大賽這個競技場,就是成就卓越的最佳場地。本屆大賽設立了五大賽道,題目涉及搜索核心業(yè)務場景,如語義檢索、多模態(tài)、軟硬結合優(yōu)化等豐富的技術方向,并且開設了賽道三產品賽道,號召參賽者“洞察用戶在搜索場景的需求,并通過構建AI應用解決”。
最終有28支隊伍站上了領獎臺。
賽道一“搜索答案組織”,來自中國科學院大學的“None”團隊獲得了一等獎。該團隊通過精細調整Lora微調LLM方案,精選公開問答數據增強訓練,利用大模型蒸餾提升學習效果,并參照NEFTune進行噪聲嵌入增加模型魯棒性,使測試數據結果更符合用戶需求。每一個技術選型均給出了合理動機、扎實分析和可信結論。這體現了團隊對搜索答案組織問題的深度理解和出色的科研能力。
賽道二“基于向量交集的Topk搜索”,“晨曦”團隊獲得了頭獎。這個團隊只有一個人,還是位全職奶爸,不僅在機評結果中遙遙領先,在答辯中整體技術方案的創(chuàng)新性、通用性與先進性上也獲得了評委們的一致認可。
賽道三“設計一個解決搜索用戶需求的AI原生應用”,來自南京航空航天大學的“肝到凌晨”團隊憑借AI簡歷助手“Linchance JOB”獲得冠軍。只需要回答幾個問題,就能生成個性化的簡歷,還提供優(yōu)化建議,安排AI模擬面試。
賽道四“基于GPU的近似最近鄰檢索算法挑戰(zhàn)”則由杭州電子科技大學的“HDU01”團隊獲得一等獎。該團隊在調研業(yè)內的相關算法并深入分析開源版本的基礎上,做出了有意義的修改,使得最終版本的性能超過了開源版本的兩倍以上。
賽道五“可控圖片生成算法挑戰(zhàn)”,北京理工大學“幸運的深不見底的團隊”奪得一等獎。他們通過對數據的精心清洗與增強為模型訓練提供了穩(wěn)定基礎,采取的多模型融合策略體現了較好的理論實踐結合能力,最終使得生成圖片的相關性和質量有了顯著提升。
此次大賽還組織了線上線下共16次活動,提供了超 100 小時的知識培訓和交流機會,有5萬多同學直接參與,覆蓋了100W開發(fā)者群體。
技術變革的基因,?直植根于搜索
百度是全球最早推出生成式AI的大廠,3月16日發(fā)布文心一言內測版,8月31日正式向全社會開放。在10月份舉辦的百度世界2023上,百度推出了眾多重構后的產品與應用,其中重構后的百度搜索尤其引人關注。
被大模型重構的搜索,目前已經擁有極致滿足、推薦激發(fā)和多輪交互三個新能力。當用戶提出一個問題時,新搜索不再是提供一堆鏈接,而是通過對內容的理解,生成文字、圖片、動態(tài)圖表等多模態(tài)的答案,讓用戶一步獲得滿足,引領了搜索行業(yè)的代際變革。目前,在百度,每天已經有超過3億次的搜索需求,被生成式搜索滿足。搜索在首位能給出滿意答案的比例已經提升了近1倍。
NVIDIA 開發(fā)與技術部門亞太區(qū)總經理李曦鵬也闡述了自己“新搜索”的理解,“從最早書籍檢索、數據檢索,到了數字化過后內容的檢索,到現在如火如荼基于LLM生成式檢索,都在說明一個好的領域可以不斷地引領創(chuàng)新、不斷地產生創(chuàng)新、同時不斷地吸收創(chuàng)新。搜索業(yè)務本身是NLP、CV、語音這些最前沿Deep Learning的合集。基于此,大模型有創(chuàng)新,第一個落地場景就是搜索。對于大模型在搜索引擎里大放異彩,是非常值得期待的?!?/p>
搜索的技術變革基因,正在注入年輕的血液
肖陽在致辭中表示,“面對遠未到終局的大模型浪潮,搜索的技術變革基因不僅要持續(xù)發(fā)揮作用,還需要自我進化。而這次的進化,更需要創(chuàng)新力量的支持?!眲?chuàng)新力量指的就是人才,百度搜索創(chuàng)新大賽所構建的就是選拔人才的舞臺,就像業(yè)內所說,打造“搜索界的奧林匹克”。
憑借百度搜索創(chuàng)新大賽這個平臺,搜索的技術變革基因,正在注入年輕的血液。肖陽稱,“在接下來的?段時間內,百度搜索都會持續(xù)擁抱年輕?的靈感,為自己的技術基因注?新的活力。 ”
NVIDIA的開發(fā)者社區(qū),也是創(chuàng)新力量的匯聚之地。何濤表示,“NVIDIA也給開發(fā)者提供了許多學習交流的資源,NVIDIA 的開發(fā)者社區(qū),目前在全球已經有450萬開發(fā)者,CUDA加速庫下載量也超過4800萬次,我們非常歡迎廣大同學們和參賽選手加入 NVIDIA 開發(fā)者社區(qū),提升自我競爭力,加速你們的職業(yè)成功?!?/p>
構建起聚合創(chuàng)意、場景和技術的平臺,吸引更多新鮮的靈感、可落地的技術涌現,逐鹿AI原生時代,搜索就是天然的競技場。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )