遭斯坦福AI團(tuán)隊(duì)抄襲?面壁智能CEO李大海最新回應(yīng)來了
大模型領(lǐng)域,出現(xiàn)罕見一幕!
近日,斯坦福某AI團(tuán)隊(duì)(下稱:斯坦福團(tuán)隊(duì))被曝抄襲面壁智能開源成果,有“套殼”嫌疑:模型結(jié)構(gòu)和代碼“展現(xiàn)出驚人的相似度”。
針對(duì)此事,知乎CTO、面壁智能CEO李大海表示:我們對(duì)這件事深表遺憾!一方面感慨這也是一種受到國際團(tuán)隊(duì)認(rèn)可的方式,另一方面也呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。
對(duì)于“抄襲”行為本身,面壁智能方面也給出了補(bǔ)充介紹。
李大海介紹到,“經(jīng)過團(tuán)隊(duì)核實(shí),除了社區(qū)網(wǎng)友列出的證據(jù)外,我們還發(fā)現(xiàn) Llama3V展現(xiàn)出和小鋼炮一樣的清華簡識(shí)別能力,連做錯(cuò)的樣例都一模一樣,而這一訓(xùn)練數(shù)據(jù)尚未對(duì)外公開。這項(xiàng)工作是團(tuán)隊(duì)同學(xué)耗時(shí)數(shù)個(gè)月,從卷帙浩繁的清華簡中一個(gè)字一個(gè)字掃描下來,并逐一進(jìn)行數(shù)據(jù)標(biāo)注,融合進(jìn)模型中的。更加tricky的是,兩個(gè)模型在高斯擾動(dòng)驗(yàn)證后,在正確和錯(cuò)誤表現(xiàn)方面都高度相似。”
事件始于5月29日,斯坦福團(tuán)隊(duì)發(fā)布Llama3V項(xiàng)目,并宣稱500美元即可訓(xùn)練出一個(gè)多模態(tài)大模型,效果比肩GPT-4V、Gemini Ultra、Claude Opus等。
憑借著低廉的價(jià)格、優(yōu)秀的團(tuán)隊(duì)背景,上述模型發(fā)布的推文在X平臺(tái)(推特)獲得了較大關(guān)注。
大量關(guān)注下,隨即被眼尖的網(wǎng)友發(fā)現(xiàn),Llama3V項(xiàng)目與面壁智能最新發(fā)布的多模態(tài)模型MiniCPM-Llama3-V 2.5“雷同”。
面對(duì)越來越多的抄襲“質(zhì)疑”,斯坦福團(tuán)隊(duì)也從最初的“狡辯”,變成了“刪庫跑路”。至此,“抄襲”風(fēng)波漸息。
經(jīng)歷此事,李大海不無感慨,“?技術(shù)創(chuàng)新不易,每一項(xiàng)工作都是團(tuán)隊(duì)夜以繼日的奮斗結(jié)果,也是以有限算力對(duì)全世界技術(shù)進(jìn)步與創(chuàng)新發(fā)展作出的真誠奉獻(xiàn)。我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式。”




