人民網(wǎng)
人民網(wǎng)>>重慶頻道>>重慶

他們讓AI從“小白”成長為“全能王”

人工智能訓(xùn)練師未來有望來自各行各業(yè)

2024年08月05日07:38 | 來源:重慶日報網(wǎng)
小字號

8月2日,云從科技研究院產(chǎn)品總監(jiān)孫進(右二)和人工智能訓(xùn)練師進行真?zhèn)稳讼駭?shù)據(jù)采集。記者 張錦輝 攝/視覺重慶

8月2日,云從科技研究院產(chǎn)品總監(jiān)孫進(右二)和人工智能訓(xùn)練師進行真?zhèn)稳讼駭?shù)據(jù)采集。記者 張錦輝 攝/視覺重慶

如今,“遇事不決問AI(人工智能)”正成為越來越多人的習(xí)慣,而AIGC(生成式人工智能)產(chǎn)品,還能根據(jù)要求,自動生成視頻、文案、PPT等,堪稱“全能”。

其實,AI并非天生就這么全能,它的這些本領(lǐng),來自人工智能訓(xùn)練師的“教導(dǎo)”。這群專業(yè)人才能讓AI從啥也不懂的“小白”,成長為上知天文下知地理的“全面手”。

7月30日,記者來到重慶人工智能行業(yè)的頭部企業(yè)——重慶中科云從科技有限公司(以下簡稱云從科技),對這一新職業(yè)一探究竟。

訓(xùn)練不易

集眾人之力“教”AI思考

人工智能訓(xùn)練師,是指使用智能訓(xùn)練軟件,在人工智能產(chǎn)品實際使用過程中進行數(shù)據(jù)庫管理、算法參數(shù)設(shè)置、人機交互設(shè)計、性能測試跟蹤及其他輔助作業(yè)的人員。

AI沒有生命,不能用常規(guī)的方式去交流。它能執(zhí)行的,是一串串由0與1組成的二進制代碼。因此,人工智能訓(xùn)練師要用智能訓(xùn)練軟件,把人類的意圖“翻譯”成代碼,再傳遞給AI。

根據(jù)工作內(nèi)容的不同,人工智能訓(xùn)練師又可分為數(shù)據(jù)工程師、算法工程師、產(chǎn)品經(jīng)理、測試工程師等。AI的各種能力,就是他們“培養(yǎng)”出來的。

這是一個怎樣的過程?

“對AI應(yīng)用來說,‘訓(xùn)練’更類似于‘調(diào)試’?!痹茝目萍佳芯吭寒a(chǎn)品總監(jiān)孫進告訴記者,AI的核心是算法,可以理解為AI的“大腦”?!按竽X”懂得越多、轉(zhuǎn)得越快,AI的能力就越強。

“教”AI的任務(wù)主要由算法工程師承擔(dān),其過程可以簡單理解為“做題”。

開始“做題”前,數(shù)據(jù)工程師會為AI找來“教材”。這些“教材”來自數(shù)據(jù)工程師們采集的各個場景和行業(yè)的大數(shù)據(jù),并且他們會對數(shù)據(jù)進行標注,便于AI理解。

題目從約等于小學(xué)難度的數(shù)學(xué)題開始,當AI在反復(fù)訓(xùn)練中學(xué)會解法,算法工程師就會調(diào)整各項參數(shù),提高題目難度。

讓AI“做題”,目的是訓(xùn)練其人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)是對人類大腦的模擬,網(wǎng)絡(luò)越發(fā)達,AI的“大腦”就越好使。

“AI的‘刷題量’是人類難以匹敵的?!睂O進說,以大家熟知的ChatGPT大模型為例,GPT-3(即第三代)的模型參數(shù)量達到1750億,其中凝聚的知識量遠超人類的“最強大腦”。

經(jīng)歷海量“刷題”,具備解決問題的能力后,AI還只是停留在代碼層面,不能直接使用。這時,就輪到人機交互工程師登場了。他們要從產(chǎn)品設(shè)計的角度,為AI設(shè)計一套“皮膚”,便于用戶向AI下達指令,獲取結(jié)果。

最后,測試工程師和產(chǎn)品經(jīng)理分別從技術(shù)層面和用戶層面出發(fā),對AI進行評審。評審?fù)ㄟ^,代表著AI通過“期末考試”,從啥也不懂的“小白”成為掌握知識的“專家”。

目標不低

培養(yǎng)會思考能決策的AI

上述流程,快則幾個月,慢則需要幾年。其間,云從科技的研發(fā)團隊日夜“連軸轉(zhuǎn)”,隨時準備攻克技術(shù)問題。

記者在云從科技看到,大部分工作人員都在電腦前忙碌。會議室里,落地玻璃和白板上密密麻麻排列著手寫的公式、關(guān)鍵詞和各種示意圖。

“AI的訓(xùn)練和數(shù)學(xué)密不可分,所以我們經(jīng)常開著會就把墻壁當成了演算紙。”孫進笑稱,團隊的大多數(shù)頭腦風(fēng)暴,都伴隨著信手涂寫和計算。經(jīng)常是一個人寫完了思路,另一個人又提筆上去“對戰(zhàn)”。

不過,人工智能訓(xùn)練師的工作,并非只是坐在辦公室里就可以完成的。他們還需要跑現(xiàn)場、記場景、采集數(shù)據(jù)。在一次次奔忙中,他們也會變成半個人工智能行業(yè)的專家。

如今,云從科技的AI大模型已在多個行業(yè)落地。今年3月,云從科技自主研發(fā)推出國內(nèi)首款A(yù)I原生數(shù)據(jù)分析產(chǎn)品DataGPT,可實時分析會議對話,最快1秒生成報表。7月,云從科技又發(fā)布了智能審查大模型,3秒內(nèi)可以檢查法律文書中的460多項監(jiān)督點,還可高效糾錯。

孫進表示,云從科技正從單個AI產(chǎn)品研發(fā)轉(zhuǎn)向培養(yǎng)能思考、會工作的AI智能體。

也就是說,人工智能訓(xùn)練師此前是把AI產(chǎn)品從懂得少的“小白”培養(yǎng)成知識淵博、術(shù)業(yè)有專攻的“專家”,而培養(yǎng)AI智能體,則是打造一個懂得多、能干事的“全能王”。

比起AI應(yīng)用,AI智能體更像一個全能助理。例如,用戶向AI智能體提出“我要買火車票”的要求,AI智能體就會調(diào)用日歷、購票平臺、工作安排、用戶個人信息等應(yīng)用接口。當AI智能體發(fā)現(xiàn)購票指令的信息不夠,還會反問用戶“您想去哪里”,再根據(jù)目的地提供購票選擇。

在培養(yǎng)AI智能體的過程中,人工智能訓(xùn)練師又出現(xiàn)了一個新的細分崗位:提示詞工程師。他們會把用戶需求分解成若干個提示詞(即指令),讓AI根據(jù)提示詞進行下一步應(yīng)對。

門檻不高

未來各行業(yè)人才都可以擔(dān)任

成為人工智能訓(xùn)練師,門檻高不高?

孫進表示,人工智能訓(xùn)練師可以是學(xué)習(xí)人工智能專業(yè)的人才,也可以由其他相關(guān)專業(yè)人才“跨行”而來。例如,學(xué)習(xí)計算機、自動化、軟件等相關(guān)專業(yè)的人才,可以在經(jīng)過培訓(xùn)后成為人工智能訓(xùn)練師。

不僅如此,未來,人工智能訓(xùn)練師還有望來自各行各業(yè)。

為啥這么說?因為每個行業(yè)對AI的需求不一樣。比如,車企需要懂汽車的AI,金融機構(gòu)需要能當客服的AI,礦山需要能抓安全生產(chǎn)的AI……

要做一個深度融入行業(yè)的AI產(chǎn)品,項目工期可能只有幾個月,只懂AI技術(shù)的人工智能訓(xùn)練師很難在這期間真正摸透行業(yè)需求。

但如果從該行業(yè)中找一個具備計算機、自動化等知識背景的人,把他培養(yǎng)成行業(yè)的人工智能訓(xùn)練師,他就能訓(xùn)練出最符合行業(yè)和企業(yè)需求的AI。

目前,云從科技已開發(fā)出可以訓(xùn)練AI的AI產(chǎn)品,猶如“教練”。今后,行業(yè)人才只需指揮AI“教練”,就能對AI進行算法訓(xùn)練。

基于這一原理,云從科技還開發(fā)了AI中臺,可以布局在企業(yè),由員工來操作。不同企業(yè)也可以根據(jù)各自需求,通過AI中臺“定制”AI產(chǎn)品。

目前,重慶正在人工智能人才培養(yǎng)領(lǐng)域不斷發(fā)力。重慶大學(xué)、西南大學(xué)、重慶郵電大學(xué)等高校都開設(shè)了人工智能專業(yè)。同時,校企合作也越發(fā)緊密。例如,近年來,兩江新區(qū)持續(xù)推進哈工大、中軟卓越等“滿天星”人才超級工廠建設(shè),采取“機構(gòu)教學(xué)+企業(yè)實訓(xùn)”等模式,開發(fā)人工智能、大數(shù)據(jù)等專業(yè)“課程包”,培育實用型人才超2000人;又如,百度智能云(重慶)人工智能人才產(chǎn)業(yè)基地與上百家企業(yè)、院校建立合作關(guān)系,培訓(xùn)數(shù)字技能人才1600余人。(新重慶-重慶日報記者 申曉佳)

(責(zé)編:秦潔、劉政寧)

分享讓更多人看到

返回頂部