第五屆全國人工智能大賽,由鵬城實驗室主辦,新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)承辦,華為技術(shù)有限公司、華為云計算技術(shù)有限公司、中國移動通信集團(tuán)有限公司、鵬城實驗室科教基金會協(xié)辦。
大賽設(shè)200余萬元獎金,圍繞真實產(chǎn)業(yè)難題發(fā)布賽題,吸引了來自中國、美國、德國、新加坡等全球10余個國家5346名選手參賽,在“AI+圖像編碼”、“AI+增強視頻質(zhì)量評價”、“AI+數(shù)智創(chuàng)新”三大賽道中產(chǎn)生了一批創(chuàng)新成果。賽后,大賽組委會對獲獎團(tuán)隊進(jìn)行了采訪。本期,我們一起看看三等獎團(tuán)隊的參賽分享。
細(xì)心研究,大膽探索|“CompressBit”團(tuán)隊
“CompressBit”團(tuán)隊隊長陳搏,是電氣工程博士,出于對“AI+圖像編碼”賽道技術(shù)領(lǐng)域的興趣選擇獨立參賽。他已多次參加全國人工智能大賽,曾在第四屆大賽獲得“AI+視覺特征編碼”賽道冠軍的好成績。
“CompressBit”團(tuán)隊在決賽現(xiàn)場
“在復(fù)賽最后幾天,大家突然發(fā)力、瘋狂沖榜,原來實時排行榜前三的團(tuán)隊甚至都被沖擊到十幾名之外,競爭非常激烈。研究排行榜分布后,我決定使用田忌賽馬的策略,短期內(nèi)放棄PSNR和SSIM指標(biāo),但努力把LPIPS和DISTS分?jǐn)?shù)拉到很高,使總名次適當(dāng)提升。”這個比賽策略,使陳搏得以順利入圍決賽。他繼續(xù)補充說:“深刻理解大賽規(guī)則、比賽任務(wù)是獲獎的關(guān)鍵,在初賽、復(fù)賽期間,我并沒有一味追求客觀分?jǐn)?shù),而是重點致力于提高人眼感知質(zhì)量,最終在決賽取得了不錯的MOS評分。”
為了提高開發(fā)效率,陳搏在本次比賽中創(chuàng)新性地探索了大模型和Agent工具的使用,保證短時間內(nèi)能夠深入理解賽題、充分開展試驗。“這次比賽讓我加深了對圖像壓縮問題的理解,發(fā)現(xiàn)可學(xué)習(xí)圖像壓縮算法較傳統(tǒng)算法在比特率上有明顯超越、潛力巨大。”陳搏表示會繼續(xù)研究,爭取為該領(lǐng)域進(jìn)步做出貢獻(xiàn)。
以賽促研,潛力無限|“風(fēng)調(diào)雨順”團(tuán)隊
“風(fēng)調(diào)雨順”團(tuán)隊的王闊音是氣象領(lǐng)域的一名高級工程師,也是獨立參賽。
“風(fēng)調(diào)雨順”團(tuán)隊在決賽現(xiàn)場
在初賽快結(jié)束時,王闊音才決定投入更多精力深入探索“AI+圖像編碼”賽道,因為時間緊張,那幾天他幾乎通宵加班。經(jīng)過對模型參數(shù)的不斷調(diào)試、持續(xù)優(yōu)化壓縮效果,最終在最后一刻完成了作品提交。他說:“雖然過程很累,但看到結(jié)果達(dá)到預(yù)期、成功晉級復(fù)賽時,真的非常激。這段經(jīng)歷讓我深刻體會到堅持和專注的力量,也讓我更加相信自己的技術(shù)能力。單人參賽雖然壓力大,但也鍛煉了我的獨立思考和解決問題的能力。”
王闊音的研究方向是氣象衛(wèi)星與雷達(dá)數(shù)據(jù)壓縮應(yīng)用,他表示,本次大賽讓他更深入掌握了圖像壓縮核心技術(shù),對他的研究具有重要價值。他期待壓縮算法在保障質(zhì)量的前提下進(jìn)一步提升效率,尤其看好深度學(xué)習(xí)在該領(lǐng)域的潛力,相信其在復(fù)雜數(shù)據(jù)處理和高壓縮需求場景中必將超越傳統(tǒng)方法,推動行業(yè)邁向更高水平。
志同道合,靈活遷移|“不知道叫啥”團(tuán)隊
不同于前兩個團(tuán)隊的孤軍奮戰(zhàn),“不知道叫啥”團(tuán)隊,由4名志同道合、熱愛AI與編碼的小伙伴組成。他們在科技園機緣巧合下認(rèn)識,相互學(xué)習(xí)、分享技術(shù)。大家都密切關(guān)注端到端圖像與視頻壓縮的前沿發(fā)展,留意到“AI+圖像編碼”賽道并投入研究,希望能夠讓AI改變生活。
“不知道叫啥”團(tuán)隊代表在決賽現(xiàn)場
“我們能獲獎的關(guān)鍵主要是成員們齊心協(xié)力,思維都比較開放,愿意積極探討。”團(tuán)隊隊長宋杰強調(diào),團(tuán)隊參賽時應(yīng)該盡可能發(fā)揮每個成員的能力,讓效率最大化,避免交叉冗余。要通過合理的安排,讓大家在有限的時間里盡可能多地做嘗試和實驗。
宋杰還表示,打比賽一定要有靈活遷移的能力。了解工業(yè)界、學(xué)術(shù)界的最新方法后,要結(jié)合賽題任務(wù)不斷思考,多考慮多嘗試其它方向的方法。遷移過來,也許就能有奇效。他舉例說:“面對低復(fù)雜度的要求,要不斷壓縮模型性能。為了在滿足復(fù)雜度的情況下包保持壓縮性能,我們團(tuán)隊嘗試了很多方法,最終是在超分領(lǐng)域相關(guān)的文章中受到啟發(fā),最終解決了問題。”
臨危不亂,以賽促學(xué)|“最是人間留不住”團(tuán)隊
“最是人間留不住”團(tuán)隊獲得了“AI+圖像編碼”賽道優(yōu)勝獎。該團(tuán)隊是由西安電子科技大學(xué)、華東交通大學(xué)組成的高校聯(lián)隊。成員學(xué)科背景多樣、知識結(jié)構(gòu)互補,具備良好的科研素養(yǎng)與實踐能力。
“最是人間留不住”團(tuán)隊在決賽現(xiàn)場
“打比賽要目標(biāo)清晰、分工明確、快速迭代,不僅要完成賽項任務(wù),更要在效果和工程實現(xiàn)之間找到最優(yōu)平衡。”團(tuán)隊隊長聶佳睿分享說:“一定要臨危不亂、快速調(diào)整!”比賽時,他們發(fā)現(xiàn)原模型在新測試數(shù)據(jù)上的表現(xiàn)很糟糕。時間緊迫,緊急討論后,我們果斷決定推翻原有方案并重構(gòu)模型。經(jīng)過連續(xù)幾天的高強度調(diào)整,終于在提交截止前做出了效果更好、運行更快的版本。”這段獨特經(jīng)歷,也讓他們真正體會到了團(tuán)隊協(xié)作和技術(shù)應(yīng)變的力量。
聶佳睿說:“通過比賽,我不僅加深了對圖像編碼技術(shù)和人工智能融合應(yīng)用的理解,也切實提高了自己在模型設(shè)計、數(shù)據(jù)處理和工程實現(xiàn)方面的能力。以往在課堂上學(xué)習(xí)的圖像處理和深度學(xué)習(xí)知識,大多停留在理論層面,而這次比賽讓我有機會將它們應(yīng)用到實際項目中,從數(shù)據(jù)預(yù)處理到模型訓(xùn)練,再到性能評估與優(yōu)化,每一個環(huán)節(jié)都讓我感受到技術(shù)與實際需求之間的緊密聯(lián)系。”
理性備賽,深度思考|“ABS-AITeam”團(tuán)隊
“ABS-AITeam”團(tuán)隊參加了“AI+增強視頻質(zhì)量評價”賽道并獲得三等獎。團(tuán)隊成員來自國家廣播電視總局廣播電視科學(xué)研究院和中國傳媒大學(xué),主要開展視頻質(zhì)量評價關(guān)鍵技術(shù)研究,具備扎實的理論基礎(chǔ)與豐富的實踐經(jīng)驗。
“ABS-AITeam”團(tuán)隊代表在答辯現(xiàn)場
談及比賽經(jīng)驗,團(tuán)隊隊長劉慶同說:“我們團(tuán)隊采用理論建模、數(shù)據(jù)優(yōu)化、算法迭代的技術(shù)攻關(guān)策略。在模型架構(gòu)設(shè)計階段,通過構(gòu)建多尺度時空注意力機制,有效融合視頻的局部細(xì)節(jié)與全局語義特征。針對訓(xùn)練數(shù)據(jù)不足的挑戰(zhàn),基于數(shù)據(jù)特性進(jìn)行旋轉(zhuǎn)、壓縮、超分等數(shù)據(jù)增強方法擴(kuò)充訓(xùn)練樣本。”
劉慶同還分享了他對技術(shù)的發(fā)展思考:“本次參賽,推動了我們團(tuán)隊在視覺感知建模領(lǐng)域的理論突破。從技術(shù)發(fā)展角度看,視頻質(zhì)量評價正呈現(xiàn)三個趨勢:(1)從全參考向無參考范式演進(jìn);(2)評價指標(biāo)與編碼標(biāo)準(zhǔn)的深度融合;(3)個性化QoE預(yù)測成為新方向。期待未來能建立開放動態(tài)的基準(zhǔn)平臺,支持基于用戶行為反饋的評價模型持續(xù)進(jìn)化,推動5G+8K時代超高清視頻技術(shù)的標(biāo)準(zhǔn)化進(jìn)程。”
剖析任務(wù),持續(xù)領(lǐng)先|“CMIT001”團(tuán)隊
“CMIT001”團(tuán)隊來自中移(動)信息技術(shù)有限公司智能交互數(shù)字人研發(fā)團(tuán)隊。他們?nèi)藛T結(jié)構(gòu)合理,技術(shù)能力全面,全面掌握了產(chǎn)品設(shè)計、架構(gòu)規(guī)劃、AI算法研發(fā)等全流程的研發(fā)能力。
“CMIT001”團(tuán)隊代表在答辯現(xiàn)場
該團(tuán)隊在“AI+數(shù)智創(chuàng)新”賽道的“AI+數(shù)智人能力及客服應(yīng)用”賽題中獲得三等獎。團(tuán)隊成員符殷銘說:“我們團(tuán)隊的策略是盡可能地提高賽題中的客觀分?jǐn)?shù)部分,著重優(yōu)化渲染生成圖像的人臉相似度、聲音復(fù)刻模塊的生成速度等關(guān)鍵指標(biāo)。”符殷銘繼續(xù)補充道:“我們在初賽階段就保持了較高的實時榜單分?jǐn)?shù),說明我們的策略是成功的。”
符殷銘對大賽賽道設(shè)置評價很高,他說:“本賽道賽題對于AIGC技術(shù)在3D數(shù)字人生產(chǎn)管線的生產(chǎn)應(yīng)用具有很高的價值,相當(dāng)于是對自動化生成3D數(shù)字人的Demo應(yīng)用開發(fā),也是對AIGC技術(shù)在3D數(shù)字人生產(chǎn)應(yīng)用的可行性探索。”
雙線作戰(zhàn),一舉智勝|“MediaAILab”團(tuán)隊
“MediaAILab”團(tuán)隊非常特別,在隊長薛子育的帶領(lǐng)下,同時參加了“AI+增強視頻質(zhì)量評價”和“AI+數(shù)智創(chuàng)新”賽道的“AI+數(shù)智空間”賽題,均獲得三等獎。
“MediaAILab”團(tuán)隊由國家廣播電視總局廣播電視科學(xué)研究院、南開大學(xué)、中國傳媒大學(xué)組成,專注于廣播電視和網(wǎng)絡(luò)視聽領(lǐng)域人工智能關(guān)鍵技術(shù)的研究與應(yīng)用,根據(jù)賽項的不同調(diào)整隊伍成員組成與分工。
“MediaAILab”團(tuán)隊代表在答辯現(xiàn)場
雙線作戰(zhàn)避免不了時間的緊張,隊長薛子育坦言,時間管理是最大的挑戰(zhàn)。“尤其是在決賽階段,需要在有限的時間內(nèi)完成功能實現(xiàn)、優(yōu)化和答辯準(zhǔn)備。我們通過細(xì)化任務(wù)清單、每日進(jìn)度復(fù)盤來提高效率,同時合理分配精力,避免過度消耗。尤為關(guān)鍵的是,保持冷靜的心態(tài),以應(yīng)對突發(fā)問題。”薛子育說:“當(dāng)然,也會造成一些遺憾。比如AI+增強視頻質(zhì)量賽道,未能嘗試更優(yōu)的解決方案;AI+數(shù)智空間賽題中,團(tuán)隊語義分割引導(dǎo)的紋理生成模塊未能充分優(yōu)化。面對時間不足,只能做出妥協(xié)和選擇。”
薛子育表示本次比賽對他的學(xué)習(xí)和工作都有很大幫助,不僅提升了技術(shù)實踐能力,還鍛煉了團(tuán)隊協(xié)作和抗壓能力。“更重要的是,這次比賽徹底刷新了我對三維數(shù)字化的認(rèn)知!”他繼續(xù)補充說:“參加數(shù)智空間賽題,讓我不僅掌握了神經(jīng)輻射場(NeRF)、高斯?jié)姙R(Gaussian Splatting)等前沿技術(shù),還驚喜得發(fā)現(xiàn)三維重建正從‘幾何還原’轉(zhuǎn)向‘語義理解’。”
智勝之后:創(chuàng)新永不落幕
第五屆人工智能大賽,既是一場技術(shù)比拼的盛會,也是一個觀察當(dāng)代青年技術(shù)人才的獨特窗口。從獨立攻關(guān)的孤勇者到多學(xué)科融合的聯(lián)合團(tuán)隊,從傳統(tǒng)算法突破到生成式AI的深度探索,從實驗室理論推演到產(chǎn)業(yè)痛點的精準(zhǔn)破解——這些獲獎團(tuán)隊的故事,無不體現(xiàn)著銳意創(chuàng)新與堅持不懈。
現(xiàn)場決賽選手合影留念
拼搏向前過、全力以赴過,獲得什么獎項已不是最重要的,畢竟參與大賽的經(jīng)歷本身就是一份特別的禮物。期待所有大賽選手,用數(shù)據(jù)與代碼編織智能時代的經(jīng)緯線,為中國人工智能技術(shù)發(fā)展與創(chuàng)新繼續(xù)前行!
關(guān)鍵詞: