OpenAI再次顛覆行業!GPT4新版本,API降價2/3,還有AI版Appstore
在OpenAI開發者日前夕,WiFi公司Meter的天使投資者兼產品負責人Nikunj Kothari在X上寫道:“自最初的iPhone時代以來,從未見過這么多開發者興奮地談論即將推出的產品。”
毫無疑問,這場OpenAI第一次的開發者大會受關注的程度直指科技春晚蘋果秋季發布會,說是AI界春晚毫不為過。
大會剛開始,Sam Altman就列出了一串數字,表明OpenAI目前擁有200多萬開發人員,包括92%以上的財富500強公司用戶,以及一億周活用戶。這些官方數字直接證偽了自去年11月發布以來,ChatGPT的熱度正在逐漸消退的相關報道。
在秀完肌肉后,Sam Altman即刻端上了一道足以改變行業的大餐,以及一封爭奪AI應用分發權的戰書。
頭盤:GPT4 Turbo
開場就是重頭戲。Sam Altman在簡單講述完GPT版本更新歷史后,就放出了他們最強大模型GPT-4 的Turbo升級版本。他稱其“更強大,也更便宜”。而且從今天開始,純文本的模型可以通過API預覽,OpenAI表示計劃在“未來幾周”內全面提供包括多模態版本的GPT4-Turbo。
GPT4-Turbo的“更強大”體現在它的六大升級上。包括上下文長度提升,模型控制,更好的知識,新的多模態能力,模型自定義能力及更低的價格,更高的使用上限。
對于一般用戶體驗來講,上下文長度的增加,更好的知識和新的多模態能力是最核心的體驗改善。
1)上下文長度升級:這在過往是GPT4的一個軟肋。它會決定與模型對話過程中能接收和記住的文本長度。如果上下文長度限制較小,面對比較長的文本或長期的對話,模型就會經常“忘記”最近對話的內容,并開始偏離主題。GPT4基礎版本僅提供了8k token(字符)的上下文記憶能力,最近提供的拓展能力也僅僅能達到32k token,相比于主要競品Anthropic旗下 Claude 2 提供100k token的能力差距明顯。這使得GPT4在做文章總結等需要長文本輸入的操作時常常力不從心。但這次GPT-4 Turbo直接提供了一個128k token的上下文能力擴充,是GPT-4擴容版本的4倍,一舉提供了已商用大模型中最大的上下文容量,反超Claude 2。更形象的形容一下,128萬個token約10萬字或300頁書,可供參考的長度約為《呼嘯山莊》、《格列佛游記》和《哈利波特與阿茲卡班的囚徒》的長度。
2)更好的知識更新:GPT4-Turbo終于把知識庫更新到了2023年4月,不再讓我們停留在2年前的過去了。最初版本的GPT4的網絡實時信息調用只能到2021年9月。雖然隨著后續插件的開放,GPT4也可以獲得最新發生的事件知識。但相較于融匯在模型訓練里的知識而言,這類附加信息因為調用插件耗時久,缺乏內生相關知識的原因,效果并不理想。而現在,至少你可以獲得截止到今年四月前的新信息,獲取到很準確的答案了。
3)新的多模態能力:主要是指部分用戶已經體驗到的Dalle3文生圖功能,文本到語音(TTS)即最近被各路展示的語音對話功能,以及整合了這些的GPT4Turbo with Vison多模態功能,可以識別圖片和語音輸入并產出對應的生成內容。這些都不是全新的功能,但他們的API在活動當日就全部開放給了開發者,這意味著后續會有更多的應用,網站能把這些功能整合進日常運作中。
針對這些多模態功能的API使用,其定價也與純文字的Token定價不同,目前Vison的定價取決于輸入圖像的大小。例如,將1080×1080像素的圖像傳遞給GPT-4 Turbo需要0.00765美元。Dalle3根據不同格式和質量選項,生成每張圖像的起價為0.04美元。而TTS能力的接入價格從每輸入1000個字符0.015美元起。
在宣布多模態API開放的同時,Sam也提到了Whisper V3將會在近日發布,GPT家族的語音識別能力又可以大幅提升。
對于開發者和程序員們而言,另外兩個升級更加重要。
4)更高的控制性:為實現對模型產出內容更高的控制性,GPT Turbo提供了三個方面的升級。
一是函數調用更新,在技術文檔中,OpenAI解釋稱,函數調用允許用戶向模型描述應用程序或外部API的函數,并讓模型智能地選擇輸出包含參數的JSON對象來調用這些函數,以達到使用外部程序能力的作用。而且過往的函數調用,一次交互只能調用一個函數,即一個外部能力。但在GPT4 -Turbo中,一條指令可以平行調用多個操作,使得與外部應用結合的復雜功能實現變得更容易。
二是改進了指令跟隨,現在GPT4 Turbo能更好地理解限制性指令了。在需要仔細遵循指令的任務上,例如生成特定格式(例如,“始終以XML響應”)表現更佳。它甚至還提供新的“JSON模式”,它確保模型能生成語法正確的JSON對象,不正確的語法則直接被否定掉不執行。這在傳輸數據的網絡應用程序中很有用。
三是可再現輸出,過往大語言模型經常出現的一個問題是同一個問題的答案,問上幾次可能都會結果不同。為了保持模型的一致性,GPT4-Turbo可以通過種子參數讓大模型的回應變得統一且可重復。
這一部分的升級實際上為后續GPT-4 Turbo的自定義可能和AI 智能體化( AI Agent)提供了堅實的基礎。只有在調用外部工具變得更簡單,更穩定的前提下,AI才能更好地進行使用多工具完成復雜任務的工作。而這正是當下智能體所需要的。
5)模型自定義能力:在今年8月22日,OpenAI剛剛上線可微調的GPT3.5 Turbo版本,兩個月后GPT4的可微調版本Turbo也來了,這意味著開發者終于可以在GPT4的基礎上進行定制化調試訓練了。但這個工作似乎并不容易,OpenAI在博客文章中寫道:“初步結果表明,與GPT-3.5微調實現的實質性收益相比,GPT-4微調需要更多的工作來實現對基本模型的有意義的改進。”
針對這個困難,OpenAI提供了一個Plus版本的微調,即自定義模型。針對于那些需要比微調更多定制的組織(特別適用于擁有超大專有數據集的領域——至少有數十億個token),OpenAI給出內部工程師協助訓練模型,走完全程,從進行額外的特定領域的預訓練,到運行為特定領域量身定制的自定義RL后訓練過程。當然,OpenAI表示這個機會不會太多,而且非常貴。
6)加量降價:最后一個大升級就是大降價。OpenAI表示,GPT-4 Turbo對開發人員來說運行成本更低。與GPT-4上的0.03美元相比,每1000個代幣(LLM讀取的基本文本或代碼單位)的輸入成本僅為0.01美元。每個輸出成本為每1000個令牌0.03美元。總體而言,新版GPT-4-Tubo比原始版本便宜2.75倍。而開放給API的token吞吐量也提升了一整倍。
Sam Altman在開發者的歡呼聲之后表示,不光價格降了,同時GPT4 Turbo的速度也會大幅提升。今天一過,AI開發者集體降本增效了。
英偉達工程師Jim Fan對此表示,OpenAI規模效應帶來的價格優勢太可怕了。
沙拉:納德拉上臺,鞏固聯盟關系
上完了頭盤硬菜,Sam Altman邀請微軟CEO納德拉上場站臺。一番簡單寒暄過后,Sam詢問納德拉:微軟現在如何看待與OpenAI的合作關系?納德拉笑了大概3秒鐘才回應:我很愛你們,能和你們合作感覺很夢幻。但講到具體的合作時候,他更強調微軟當前的首要任務是要讓Azure更好的支持“包括你們模型在內”的大語言模型的訓練和基礎設施建設,讓開發者能更好的使用到AI帶來的技術革新。
針對Sam關于AI的未來會如何發展的第二個問題,納德拉依然是反躬自省。他強調微軟自認為是個平臺公司,軟件開發公司和合作商公司,后續的目標就是要提升算力和服務,支持自己和其他開發者利用大模型賦能機構和個人。不愧是公關大師,一套話術對兩個問題。
整個對話過程略顯尷尬,本來是為了強調合作關系的對話溝通卻始終彌漫著一種距離感。而且整段對話的基調都是OpenAI大步前沖,微軟自甘做個支持角色,多少有點適得其反。
正餐:GPTs,助手API及應用商店
如果說GPT4 Turbo的更新是個硬菜,它也就是個較硬的前菜。因為它的很多升級都是為GPTs這道主菜做引子。這才是這場發布會的主角。
1)GPTs
GPTs不是GPT的任何一個版本,而是屬于你的定制的GPT,一個能實現各種具體目的的智能體。
OpenAI提供了一個構建GPTs的工具,GPT Builder,它包含三個功能,指令、擴展知識和行動。有了這幾個功能,能完成任務而非僅僅對話的智能體就可以輕松被構建出來。而且通過自然語言就可以完成全流程。
在示范如何構建一個屬于Sam Altman個人的定制GPT,幫助他為別人提供創業指導的過程中,這三個功能都被展現得很明確。
指令部分即一步步下達指令構建GPTs。你說個GPT的應用目標,GPT Builder會幫你生成GPT名字,再生成logo(profile picture)。之后GPT Builder會通過詢問具體限制,相關資料,逐步完善指令流程,最終完成應用構建。你根本不用規劃流程,它會用問題引導你。這一切都可以用你的母語完成。
如果你對引導的結果還不滿意,還可以在設置中直接進行調節。
通過“知識擴展”部分,用戶可以直接上傳自定義數據,如DevDay事件時間表。
用戶還可以選擇是否調用模型模型能力,使GPT能訪問網頁瀏覽、DALL-E和OpenAI的代碼解釋器工具,用于編寫和執行軟件。
最后通過另一個名為Actions的功能,OpenAI允許GPTs調用函數,連接到外部服務,即訪問電子郵件、數據庫等數據,以完成復雜的工作組合。比如在后面的演示中出現的,回答用戶關于旅游地點信息的詢問時,調用谷歌地圖或機票信息。
通過已有的幾個GPTs,Sam還演示了GPTs具體定制化后會有什么不同的能力。
如Code.org的編程課教師,就可以多用比喻的手法讓學習者更好地理解抽象的編程邏輯。
CanavaGPT可以直接連接到外部的Canava(一個海報生成網站),來幫助你根據需求生成相關網站。
你所建立或訂閱的所有GPTs都會在GPT主界面的左邊欄中與ChatGPT并列存在,可見OpenAI對此功能所給予的重視及優先級。
當然這優先級是完全合理的。有著最新的模型接口,且將開發定制化智能體變得如此簡潔的GPTs,對于如AUtoGPT,Langchain之類過往提供基于AI的開發App的軟件平臺來講,就是降維打擊。而滿足各種調用功能的小型插件更是完全沒有了生存價值。對此,業內早有評價,稱OpenAI每次發布產品升級,都會直接干掉一大批初創公司。
這項GPT創建功能將在晚些提供給付費的ChatGPT Plus用戶和OpenAI企業客戶,他們可以為員工制作僅限內部的GPTs。
2)助手API
針對有著更復雜需求的開發者或公司,OpenAI還提供了一個GPT Builder的升級版本,即助手API。
相較于普通GPT,助理API有更長的上下文能力,還可以利用檢索組件,補充更多外部知識,并在內部進行檢索,連建庫都不需要,上傳就行。它還支持更強大的函數調用,使助手能夠調用開發人員定義的編程函數,并將響應包含在消息中。
3)應用商店
那我們如何應用這些已建好的GPT?OpenAI直接給出了一個GPT商店,它是這些GPT的分發平臺。與之前的插件商店不同,GPT應用商店的意義更為重大。
從這個商店的界面看,用戶可以直接訂閱各種GPTs。因此可以把它理解成一個承載著諸多AI小程序的集合體。而如果它成功地構建起了一套應用生態的話,OpenAI也會變成一個真正的應用平臺,一個AI時代的產品分發入口。而它的封閉性(里面只有基于OpenAI的模型開發的應用),也讓它多少有了些AI時代App Store的壟斷味道。
但這個地位并非只有OpenAI覬覦。各個大廠,包括微軟和蘋果都有自己的基于軟件的應用市場。想在這里面再建個獨立的小市場,壟斷AI的應用紅利,這很難不在后面引發和現在應用分發巨鱷們的深度沖突。
為了更快地達到這一目標,OpenAI也為GPTs應用開發者設定了完整的分成邏輯。Sam Altman表示,“本月晚些時候,我們將推出GPT商店,以經過驗證的建設者的創作為特色。一旦進入商店,GPT就會變得可搜索,并可能在排行榜上攀升。我們還將重點關注我們在生產力、教育和“只是為了好玩”等類別中遇到的最有用、最令人愉快的GPT。在接下來的幾個月里,你還可以根據有多少人使用你的GPT來賺錢。”
雖然這場AI春晚震撼到了很多人,但還是有一個人不太為之所動。馬斯克在看完發布會后發了條推繼續支持自家模型Grok,然后就去打暗黑四了。
猜你喜歡
剛剛,Sam Altman 反思來了:OpenAI將朝著超級智能邁進
在 2025 年,可能會看到首批 AI 智能體“加入勞動力市場”。