中國版ChatGPT并不遙遠 中國在數(shù)據(jù)、算法、算力都有良好基礎
經(jīng)濟日報刊文,近日,美國人工智能研究公司OpenAI推出的聊天機器人ChatGPT火爆全網(wǎng)。它能通過學習和理解人類語言進行自然語言對話,跟人類聊天時遇到敏感問題會“打太極”,還能替打工人生成頗具幽默感的辭職信。可以說,ChatGPT打開了自然語言處理技術(shù)商業(yè)化落地且成為消費端爆款的大門,具有劃時代的意義。
AI發(fā)展的三大要素是數(shù)據(jù)、算法、算力,中國在這三方面都有良好基礎。
AI的進步迭代需大量數(shù)據(jù)進行學習訓練,ChatGPT也不例外。ChatGPT的訓練使用了約45TB數(shù)據(jù),其中包含多達近1萬億個單詞的文本內(nèi)容。從大數(shù)據(jù)資源看,中國擁有全世界最大規(guī)模的網(wǎng)民數(shù)量,有豐富的應用場景,在數(shù)據(jù)積累方面優(yōu)勢明顯。
在算法方面,ChatGPT的技術(shù)底座是大型語言模型。GPT屬于自然語言處理NLP的范疇,本質(zhì)上仍是以深度學習為代表的人工智能技術(shù)長期發(fā)展和積累的結(jié)果,并未出現(xiàn)算法的革命性突破,發(fā)布于2020年的GPT-3是有1750億個參數(shù)的大模型,ChatGPT正是基于它的改進版本創(chuàng)建的。國內(nèi)也有NLP領域的大模型,并有智能客服、作詩機等實際應用。雖然目前全球還沒有能跟ChatGPT驚艷表現(xiàn)相抗衡的大模型,但是業(yè)界共識是差距在兩年左右。兩年的差距并非鴻溝,有趕超可能。
AI的訓練和使用需要強大的算力,算力的基礎是芯片,有人擔心中國在這方面會吃虧。實際上,芯片水平并不等同于算力水平,算力還需要廣闊的應用場景支撐,需要具備對千萬個芯片進行規(guī)模化調(diào)度運行的能力。《2021―2022全球計算力指數(shù)評估報告》顯示,美國計算力指數(shù)得分為77分,中國為70分,分列世界前兩位,中國算力水平與美國處于同一等級,差距并不大。
對于中國企業(yè)來說,ChatGPT的優(yōu)點值得學習,它的不足也正是我們參與競爭的機遇。
學習它提高AI智商的新路徑。ChatGPT的聰明表現(xiàn),源自讓AI從人類反饋中進行強化學習。在訓練過程中,人類訓練者扮演著用戶和助手的角色,這比過去AI大模型的“深度學習+人工標注”模式省時省力、效果更好。
在它表現(xiàn)欠佳的中文領域錯位競爭。ChatGPT的英文水平明顯高于中文水平,這是它在訓練階段被“喂”了更多英文素材的必然結(jié)果,也可以成為中國版ChatGPT應用的競爭切入點。
從它被詬病的倫理挑戰(zhàn)中尋得商機。ChatGPT會一本正經(jīng)地胡說八道,生成錯誤信息的能力遠超人類。它還會被人類不當使用,比如學生拿它寫作業(yè),黑客拿它寫代碼用于網(wǎng)絡攻擊,詐騙犯拿它開設“殺豬盤”。防范治理這些風險,一方面需要完善相關倫理法規(guī),另一方面也應考慮到人類處理信息的速度遠遜于AI的事實,開發(fā)自動判別并警示AI生成有害信息的技術(shù)。屆時,反ChatGPT技術(shù)也將成為新商機。
中國版ChatGPT并不遙遠,已有百度等多家公司宣布將進入此賽道。面對ChatGPT這個新晉AI網(wǎng)紅,我們應清醒分析其優(yōu)勢和不足,學優(yōu)補劣。
- 北京海淀區(qū)聯(lián)合多方發(fā)布“北京人工智能公共算力平臺生態(tài)網(wǎng)絡”
- 山東:加快算力供給、模型培育 激發(fā)人工智能發(fā)展活力
- 濟南的“算力”答卷:“數(shù)”無止境,見證數(shù)字化的力量
- 880萬架 算力產(chǎn)業(yè)量質(zhì)齊升
- 半島觀察丨哭窮后機票能降價?年輕人開始用大數(shù)據(jù)“算法”整活兒了
- 擬建設元宇宙智慧算力中心項目!青島市南東片區(qū)一地塊控規(guī)調(diào)整
- 領優(yōu)惠券總提示“來晚了”?四部門重拳整治這些算法問題
- 四部門:開展“清朗·網(wǎng)絡平臺算法典型問題治理”專項行動
- 三倍還是兩倍?國慶加班工資算法來了
- 半島調(diào)查丨騎手生存現(xiàn)狀:被“算法”追著跑,月入過萬有點難