OpenAI再次顛覆行業！GPT4新版本，API降價2/3，還有AI版Appstore

騰訊科技郝博陽2023-11-07 09:56 大公司

今天凌晨，OpenAI搬出了新的武器庫。

在OpenAI開發者日前夕，WiFi公司Meter的天使投資者兼產品負責人Nikunj Kothari在X上寫道：“自最初的iPhone時代以來，從未見過這么多開發者興奮地談論即將推出的產品。”

毫無疑問，這場OpenAI第一次的開發者大會受關注的程度直指科技春晚蘋果秋季發布會，說是AI界春晚毫不為過。

大會剛開始，Sam Altman就列出了一串數字，表明OpenAI目前擁有200多萬開發人員，包括92%以上的財富500強公司用戶，以及一億周活用戶。這些官方數字直接證偽了自去年11月發布以來，ChatGPT的熱度正在逐漸消退的相關報道。

在秀完肌肉后，Sam Altman即刻端上了一道足以改變行業的大餐，以及一封爭奪AI應用分發權的戰書。

頭盤：GPT4 Turbo

開場就是重頭戲。Sam Altman在簡單講述完GPT版本更新歷史后，就放出了他們最強大模型GPT-4 的Turbo升級版本。他稱其“更強大，也更便宜”。而且從今天開始，純文本的模型可以通過API預覽，OpenAI表示計劃在“未來幾周”內全面提供包括多模態版本的GPT4-Turbo。

GPT4-Turbo的“更強大”體現在它的六大升級上。包括上下文長度提升，模型控制，更好的知識，新的多模態能力，模型自定義能力及更低的價格，更高的使用上限。

對于一般用戶體驗來講，上下文長度的增加，更好的知識和新的多模態能力是最核心的體驗改善。

1）上下文長度升級：這在過往是GPT4的一個軟肋。它會決定與模型對話過程中能接收和記住的文本長度。如果上下文長度限制較小，面對比較長的文本或長期的對話，模型就會經常“忘記”最近對話的內容，并開始偏離主題。GPT4基礎版本僅提供了8k token（字符）的上下文記憶能力，最近提供的拓展能力也僅僅能達到32k token，相比于主要競品Anthropic旗下 Claude 2 提供100k token的能力差距明顯。這使得GPT4在做文章總結等需要長文本輸入的操作時常常力不從心。但這次GPT-4 Turbo直接提供了一個128k token的上下文能力擴充，是GPT-4擴容版本的4倍，一舉提供了已商用大模型中最大的上下文容量，反超Claude 2。更形象的形容一下，128萬個token約10萬字或300頁書，可供參考的長度約為《呼嘯山莊》、《格列佛游記》和《哈利波特與阿茲卡班的囚徒》的長度。

2）更好的知識更新：GPT4-Turbo終于把知識庫更新到了2023年4月，不再讓我們停留在2年前的過去了。最初版本的GPT4的網絡實時信息調用只能到2021年9月。雖然隨著后續插件的開放，GPT4也可以獲得最新發生的事件知識。但相較于融匯在模型訓練里的知識而言，這類附加信息因為調用插件耗時久，缺乏內生相關知識的原因，效果并不理想。而現在，至少你可以獲得截止到今年四月前的新信息，獲取到很準確的答案了。

3）新的多模態能力：主要是指部分用戶已經體驗到的Dalle3文生圖功能，文本到語音（TTS）即最近被各路展示的語音對話功能，以及整合了這些的GPT4Turbo with Vison多模態功能，可以識別圖片和語音輸入并產出對應的生成內容。這些都不是全新的功能，但他們的API在活動當日就全部開放給了開發者，這意味著后續會有更多的應用，網站能把這些功能整合進日常運作中。

針對這些多模態功能的API使用，其定價也與純文字的Token定價不同，目前Vison的定價取決于輸入圖像的大小。例如，將1080×1080像素的圖像傳遞給GPT-4 Turbo需要0.00765美元。Dalle3根據不同格式和質量選項，生成每張圖像的起價為0.04美元。而TTS能力的接入價格從每輸入1000個字符0.015美元起。

在宣布多模態API開放的同時，Sam也提到了Whisper V3將會在近日發布，GPT家族的語音識別能力又可以大幅提升。

對于開發者和程序員們而言，另外兩個升級更加重要。

4）更高的控制性：為實現對模型產出內容更高的控制性，GPT Turbo提供了三個方面的升級。

一是函數調用更新，在技術文檔中，OpenAI解釋稱，函數調用允許用戶向模型描述應用程序或外部API的函數，并讓模型智能地選擇輸出包含參數的JSON對象來調用這些函數，以達到使用外部程序能力的作用。而且過往的函數調用，一次交互只能調用一個函數，即一個外部能力。但在GPT4 -Turbo中，一條指令可以平行調用多個操作，使得與外部應用結合的復雜功能實現變得更容易。

二是改進了指令跟隨，現在GPT4 Turbo能更好地理解限制性指令了。在需要仔細遵循指令的任務上，例如生成特定格式（例如，“始終以XML響應”）表現更佳。它甚至還提供新的“JSON模式”，它確保模型能生成語法正確的JSON對象，不正確的語法則直接被否定掉不執行。這在傳輸數據的網絡應用程序中很有用。

三是可再現輸出，過往大語言模型經常出現的一個問題是同一個問題的答案，問上幾次可能都會結果不同。為了保持模型的一致性，GPT4-Turbo可以通過種子參數讓大模型的回應變得統一且可重復。

這一部分的升級實際上為后續GPT-4 Turbo的自定義可能和AI 智能體化（ AI Agent）提供了堅實的基礎。只有在調用外部工具變得更簡單，更穩定的前提下，AI才能更好地進行使用多工具完成復雜任務的工作。而這正是當下智能體所需要的。

5）模型自定義能力：在今年8月22日，OpenAI剛剛上線可微調的GPT3.5 Turbo版本，兩個月后GPT4的可微調版本Turbo也來了，這意味著開發者終于可以在GPT4的基礎上進行定制化調試訓練了。但這個工作似乎并不容易，OpenAI在博客文章中寫道：“初步結果表明，與GPT-3.5微調實現的實質性收益相比，GPT-4微調需要更多的工作來實現對基本模型的有意義的改進。”

針對這個困難，OpenAI提供了一個Plus版本的微調，即自定義模型。針對于那些需要比微調更多定制的組織（特別適用于擁有超大專有數據集的領域——至少有數十億個token），OpenAI給出內部工程師協助訓練模型，走完全程，從進行額外的特定領域的預訓練，到運行為特定領域量身定制的自定義RL后訓練過程。當然，OpenAI表示這個機會不會太多，而且非常貴。

6）加量降價：最后一個大升級就是大降價。OpenAI表示，GPT-4 Turbo對開發人員來說運行成本更低。與GPT-4上的0.03美元相比，每1000個代幣（LLM讀取的基本文本或代碼單位）的輸入成本僅為0.01美元。每個輸出成本為每1000個令牌0.03美元。總體而言，新版GPT-4-Tubo比原始版本便宜2.75倍。而開放給API的token吞吐量也提升了一整倍。

Sam Altman在開發者的歡呼聲之后表示，不光價格降了，同時GPT4 Turbo的速度也會大幅提升。今天一過，AI開發者集體降本增效了。

英偉達工程師Jim Fan對此表示，OpenAI規模效應帶來的價格優勢太可怕了。

沙拉：納德拉上臺，鞏固聯盟關系

上完了頭盤硬菜，Sam Altman邀請微軟CEO納德拉上場站臺。一番簡單寒暄過后，Sam詢問納德拉：微軟現在如何看待與OpenAI的合作關系？納德拉笑了大概3秒鐘才回應：我很愛你們，能和你們合作感覺很夢幻。但講到具體的合作時候，他更強調微軟當前的首要任務是要讓Azure更好的支持“包括你們模型在內”的大語言模型的訓練和基礎設施建設，讓開發者能更好的使用到AI帶來的技術革新。

針對Sam關于AI的未來會如何發展的第二個問題，納德拉依然是反躬自省。他強調微軟自認為是個平臺公司，軟件開發公司和合作商公司，后續的目標就是要提升算力和服務，支持自己和其他開發者利用大模型賦能機構和個人。不愧是公關大師，一套話術對兩個問題。

整個對話過程略顯尷尬，本來是為了強調合作關系的對話溝通卻始終彌漫著一種距離感。而且整段對話的基調都是OpenAI大步前沖，微軟自甘做個支持角色，多少有點適得其反。

正餐：GPTs，助手API及應用商店

如果說GPT4 Turbo的更新是個硬菜，它也就是個較硬的前菜。因為它的很多升級都是為GPTs這道主菜做引子。這才是這場發布會的主角。

1）GPTs

GPTs不是GPT的任何一個版本，而是屬于你的定制的GPT，一個能實現各種具體目的的智能體。

OpenAI提供了一個構建GPTs的工具，GPT Builder，它包含三個功能，指令、擴展知識和行動。有了這幾個功能，能完成任務而非僅僅對話的智能體就可以輕松被構建出來。而且通過自然語言就可以完成全流程。

在示范如何構建一個屬于Sam Altman個人的定制GPT，幫助他為別人提供創業指導的過程中，這三個功能都被展現得很明確。

指令部分即一步步下達指令構建GPTs。你說個GPT的應用目標，GPT Builder會幫你生成GPT名字，再生成logo（profile picture）。之后GPT Builder會通過詢問具體限制，相關資料，逐步完善指令流程，最終完成應用構建。你根本不用規劃流程，它會用問題引導你。這一切都可以用你的母語完成。

如果你對引導的結果還不滿意，還可以在設置中直接進行調節。

通過“知識擴展”部分，用戶可以直接上傳自定義數據，如DevDay事件時間表。

用戶還可以選擇是否調用模型模型能力，使GPT能訪問網頁瀏覽、DALL-E和OpenAI的代碼解釋器工具，用于編寫和執行軟件。

最后通過另一個名為Actions的功能，OpenAI允許GPTs調用函數，連接到外部服務，即訪問電子郵件、數據庫等數據，以完成復雜的工作組合。比如在后面的演示中出現的，回答用戶關于旅游地點信息的詢問時，調用谷歌地圖或機票信息。

通過已有的幾個GPTs，Sam還演示了GPTs具體定制化后會有什么不同的能力。

如Code.org的編程課教師，就可以多用比喻的手法讓學習者更好地理解抽象的編程邏輯。

CanavaGPT可以直接連接到外部的Canava（一個海報生成網站），來幫助你根據需求生成相關網站。

你所建立或訂閱的所有GPTs都會在GPT主界面的左邊欄中與ChatGPT并列存在，可見OpenAI對此功能所給予的重視及優先級。

當然這優先級是完全合理的。有著最新的模型接口，且將開發定制化智能體變得如此簡潔的GPTs，對于如AUtoGPT，Langchain之類過往提供基于AI的開發App的軟件平臺來講，就是降維打擊。而滿足各種調用功能的小型插件更是完全沒有了生存價值。對此，業內早有評價，稱OpenAI每次發布產品升級，都會直接干掉一大批初創公司。

這項GPT創建功能將在晚些提供給付費的ChatGPT Plus用戶和OpenAI企業客戶，他們可以為員工制作僅限內部的GPTs。

2）助手API

針對有著更復雜需求的開發者或公司，OpenAI還提供了一個GPT Builder的升級版本，即助手API。

相較于普通GPT，助理API有更長的上下文能力，還可以利用檢索組件，補充更多外部知識，并在內部進行檢索，連建庫都不需要，上傳就行。它還支持更強大的函數調用，使助手能夠調用開發人員定義的編程函數，并將響應包含在消息中。

3）應用商店

那我們如何應用這些已建好的GPT？OpenAI直接給出了一個GPT商店，它是這些GPT的分發平臺。與之前的插件商店不同，GPT應用商店的意義更為重大。

從這個商店的界面看，用戶可以直接訂閱各種GPTs。因此可以把它理解成一個承載著諸多AI小程序的集合體。而如果它成功地構建起了一套應用生態的話，OpenAI也會變成一個真正的應用平臺，一個AI時代的產品分發入口。而它的封閉性（里面只有基于OpenAI的模型開發的應用），也讓它多少有了些AI時代App Store的壟斷味道。

但這個地位并非只有OpenAI覬覦。各個大廠，包括微軟和蘋果都有自己的基于軟件的應用市場。想在這里面再建個獨立的小市場，壟斷AI的應用紅利，這很難不在后面引發和現在應用分發巨鱷們的深度沖突。

為了更快地達到這一目標，OpenAI也為GPTs應用開發者設定了完整的分成邏輯。Sam Altman表示，“本月晚些時候，我們將推出GPT商店，以經過驗證的建設者的創作為特色。一旦進入商店，GPT就會變得可搜索，并可能在排行榜上攀升。我們還將重點關注我們在生產力、教育和“只是為了好玩”等類別中遇到的最有用、最令人愉快的GPT。在接下來的幾個月里，你還可以根據有多少人使用你的GPT來賺錢。”

雖然這場AI春晚震撼到了很多人，但還是有一個人不太為之所動。馬斯克在看完發布會后發了條推繼續支持自家模型Grok，然后就去打暗黑四了。

【本文為合作媒體授權博望財經轉載，文章版權歸原作者及原出處所有。文章系作者個人觀點，不代表博望財經立場，轉載請聯系原作者及原出處獲得授權。有任何疑問都請聯系（聯系（微信公眾號ID：AppleiTree）。免責聲明：本網站所有文章僅作為資訊傳播使用，既不代表任何觀點導向，也不構成任何投資建議。】

OpenAI