遭斯坦福AI團隊抄襲?面壁智能CEO李大海最新回應(yīng)來了
大模型領(lǐng)域,出現(xiàn)罕見一幕!
近日,斯坦福某AI團隊(下稱:斯坦福團隊)被曝抄襲面壁智能開源成果,有“套殼”嫌疑:模型結(jié)構(gòu)和代碼“展現(xiàn)出驚人的相似度”。
針對此事,知乎CTO、面壁智能CEO李大海表示:我們對這件事深表遺憾!一方面感慨這也是一種受到國際團隊認可的方式,另一方面也呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。
對于“抄襲”行為本身,面壁智能方面也給出了補充介紹。
李大海介紹到,“經(jīng)過團隊核實,除了社區(qū)網(wǎng)友列出的證據(jù)外,我們還發(fā)現(xiàn) Llama3V展現(xiàn)出和小鋼炮一樣的清華簡識別能力,連做錯的樣例都一模一樣,而這一訓(xùn)練數(shù)據(jù)尚未對外公開。這項工作是團隊同學(xué)耗時數(shù)個月,從卷帙浩繁的清華簡中一個字一個字掃描下來,并逐一進行數(shù)據(jù)標注,融合進模型中的。更加tricky的是,兩個模型在高斯擾動驗證后,在正確和錯誤表現(xiàn)方面都高度相似。”
事件始于5月29日,斯坦福團隊發(fā)布Llama3V項目,并宣稱500美元即可訓(xùn)練出一個多模態(tài)大模型,效果比肩GPT-4V、Gemini Ultra、Claude Opus等。
憑借著低廉的價格、優(yōu)秀的團隊背景,上述模型發(fā)布的推文在X平臺(推特)獲得了較大關(guān)注。
大量關(guān)注下,隨即被眼尖的網(wǎng)友發(fā)現(xiàn),Llama3V項目與面壁智能最新發(fā)布的多模態(tài)模型MiniCPM-Llama3-V 2.5“雷同”。
面對越來越多的抄襲“質(zhì)疑”,斯坦福團隊也從最初的“狡辯”,變成了“刪庫跑路”。至此,“抄襲”風波漸息。
經(jīng)歷此事,李大海不無感慨,“?技術(shù)創(chuàng)新不易,每一項工作都是團隊夜以繼日的奮斗結(jié)果,也是以有限算力對全世界技術(shù)進步與創(chuàng)新發(fā)展作出的真誠奉獻。我們希望團隊的好工作被更多人關(guān)注與認可,但不是以這種方式。”