掃碼登錄
OpenAI CEO Sam Altman預(yù)告的“王炸”首批出爐:OpenAI推出了一款高端的GPT訂閱套餐ChatGPT Pro。它的收費(fèi)在OpenAI目前的各產(chǎn)品中最高,提供OpenAI旗下所有模型的無(wú)限使用權(quán),包括OpenAI最強(qiáng)推理模型o1及o1系列的一個(gè)升級(jí)版本。
美東時(shí)間12月5日周四,OpenAI確認(rèn)了稍早一些網(wǎng)傳的消息,正式推出名為ChatGPT Pro的套餐,每月訂閱收費(fèi)200美元。OpenAI稱,該套餐的訂閱用戶可以大規(guī)模訪問(wèn)OpenAI旗下最佳的模型和工具,包括無(wú)限制訪問(wèn)OpenAI最智能的模型 OpenAI o1以及同系列較小模型o1-mini、GPT-4o、類人的ChatGPT高級(jí)語(yǔ)音模式Advanced Voice。
此外,ChatGPT Pro的套餐中還可以包括名為o1 pro mode的新o1版本,也是ChatGPT Pro獨(dú)有的o1版本。OpenAI稱,這個(gè)新版本使用更多的計(jì)算,能更深入地思考,并為最困難的問(wèn)題提供更好的答案。希望未來(lái)為ChatGPT Pro添加更強(qiáng)大的計(jì)算密集型生產(chǎn)力功能。
Altman在社交媒體發(fā)帖介紹,OpenAI本周四有兩個(gè)新動(dòng)作,一是在ChatGPT Plus套餐中納入了o1,每月收費(fèi)20美元,二是推出每月收費(fèi)200美元的ChatGPT Pro,它可以讓訂閱者無(wú)限使用模型、甚至?xí)r更智能的o1。
Altman之前在社交媒體發(fā)帖預(yù)告,從本周四開始,OpenAI將進(jìn)行為期12天的OpenAI活動(dòng),每天都會(huì)有一個(gè)直播,包括最新技術(shù)或產(chǎn)品演示。有網(wǎng)友當(dāng)時(shí)預(yù)計(jì),OpenAI會(huì)推出所謂滿血o1,即正式版o1。本次Altman提到的ChatGPT Plus新納入o1就是這個(gè)正式版本。
正式版o1支持多模態(tài)輸入,具備視覺推理能力。相比o1 view版本,正式o1的平均響應(yīng)速度快了60%,OpenAI還發(fā)現(xiàn)正式版o1在推理時(shí)犯重大錯(cuò)誤的頻率比o1 preview減少34%。
OpenAI認(rèn)為,ChatGPT Pro為研究人員、工程師和其他每天使用研究級(jí)智能的個(gè)人提供了一種提高他們生產(chǎn)力的新方式,該方式讓他們能處于人工智能(AI)進(jìn)步的前沿。
OpenAI特別介紹了o1 pro mode,稱ChatGPT Pro提供了OpenAI“最智能模型的一個(gè)版本”,“該模型可以思考更長(zhǎng)時(shí)間,從而獲得最可靠的回應(yīng)?!痹谕獠繉<覝y(cè)試人員的評(píng)估中,o1 pro mode可以產(chǎn)生更可靠、更準(zhǔn)確、更全面的回應(yīng),尤其是在數(shù)據(jù)科學(xué)、編程和案例法分析等領(lǐng)域。
下圖顯示,在數(shù)學(xué)、科學(xué)和編碼等具有挑戰(zhàn)性的機(jī)器學(xué)習(xí)(ML)基準(zhǔn)測(cè)試中,o1 pro mode的表現(xiàn)均勝過(guò)o1 和 o1-preview。在數(shù)學(xué)方面,o1 pro mode得分86,o1 和 o1-preview分別為78和50,在編碼方面,o1 pro mode得分90,o1 和 o1-preview分別為89和62,在問(wèn)答博士級(jí)別的科學(xué)問(wèn)題方面,o1 pro mode得分79,后兩者分別為76和74。
為了突出o1 pro mode的主要優(yōu)勢(shì)——可靠性更高,OpenAI還提高了評(píng)估門檻,要求只有在四次嘗試中四次全部能夠正確回答問(wèn)題、而不是僅一次答對(duì)時(shí),才能算作模型解決了問(wèn)題。即使在這種高標(biāo)準(zhǔn)要求下,o1 pro mode的表現(xiàn)也明顯強(qiáng)于o1 和 o1-preview。
下圖可見,在以上四次答問(wèn)都必須正確的標(biāo)準(zhǔn)下,o1 pro mode相比o1 和 o1-preview的優(yōu)勢(shì)更大。數(shù)學(xué)方面,o1 pro mode得分80,o1 和 o1-preview分別為67和37,在編碼方面,o1 pro mode得分75,o1 和 o1-preview分別為64和26,在問(wèn)答博士級(jí)別的科學(xué)問(wèn)題方面,o1 pro mode得分74,后兩者分別為67和58。