国产精品久久久久久久小唯西川 _日韩中文字幕视频_欧美va亚洲va香蕉在线_国产91精品欧美

您的位置:首頁 > 滾動 >

環球熱門:挖掘GPT的隱藏實力就靠它了

2023-05-09 17:55:57 來源:亞設網

GPT-4回答的準確率從68%提高到85%。

編者按:本文來自微信公眾號“量子位”(ID:QbitAI),作者:克雷西,創業邦經授權發布。

GPT-4回答的準確率從68%提高到85%。


(資料圖片)

這個GitHub新項目,能讓ChatGPT完成復雜任務,GPT3.5和GPT-4都支持。

它通過將問題拆解,并調用外部資源,提高了GPT的工作能力。

在它的調教下,GPT-4回答的準確率從68%提高到了85%。

這個項目名叫SmartGPT,這個名字很直白地告訴了我們它的作用。

無論是直觀感受還是量化數據,GPT在它的加持之下回答正確率都有提高。

我們不妨看看幾個經典的問題。

晾干5件衣服需要5個小時,那么晾30件需要多長時間呢?

這是一個來自OpenAI Playground的經典問題。

只見GPT一頓操作猛如虎,又是推理又是列方程……

然而最后給出的答案是30個小時。

而經過SmartGPT調教之后,不僅得到了正確答案,還指出了此前的思路為什么會出錯。

再來舉個例子

,同樣是來自于OpenAI Playground的問題。

假設有6升和12升的罐子各一個,如何量取6升水?

GPT的答案嘛……麻煩不說,能不能解釋下第五步的2升是怎么剩下的?

經過調教之后嘛……雖然不理解為什么不直接用6升的,但也有很大進步了。

我們也用倒拔垂楊柳的問題進行了測試,提供了諸葛亮、孫悟空和林黛玉三個選項。

第一輪,GPT-4給出的答案是……孫悟空。

經過調教之后,GPT-4終于發現了三個選項都是錯誤的。

同時還指出了孫悟空雖然沒有倒拔垂楊柳但是有相似的情節。

(《西游記》第二十五回中,孫悟空在五莊觀因憤怒將人參果樹拔倒)

需要說明的是,由于沒有GPT-4的API,測試是按照開發者介紹的方法手工完成的。

當然了,個例并不能說明它的表現,還是要用數據集測試一下。

開發者使用了MMLU數據集分別對調教前后的GPT-4進行了測試。

結果顯示,未經調教的版本只答對了68%,而調教后的版本答對了85%。

順便提一句,真人專家在測試中的平均成績是89.8%。

數學方面,同樣使用MMLU數據集進行測試,開發者從中選擇了15個大學難度的數學問題。

雖然準確率只有60%,但也是及格了,而且比原版GPT的40%已經好了太多。

化整為零,逐步解決

開發者將SmartGPT中的環節形象地比作了職場中的角色:

“甲方”:SmartGPT用戶。“經理”:和“甲方”對接,把任務拆分成高級子任務并逐一匯報給“老板”。“老板”:制定計劃,將高級子任務再次拆分,并分發給“員工”。“員工”:接收任務,編寫偽代碼,交給“小黃人”執行。“小黃人”:將偽代碼優化成LUA腳本并運行。

作為“甲方”的用戶,需要做的只是像使用普通GPT一樣輸入自己的問題,而不必給出額外指令。

SmartGPT會幫助用戶把問題拆分,然后按照步驟提交給GPT。

此前有人發現,在輸入給GPT的指令中加入“let’s think step by step”可以提高回復的準確率。

同時,GPT-4具有回溯能力,能夠發現并指出自己此前回答中的錯誤。

以上兩個特性為SmartGPT的工作提供了重要支撐。

△ SmartGPT工作流程圖

在用戶輸入完指令后,SmartGPT對其進行處理拆分,包括添加“let’s think step by step”類似的表述。

然后它會將處理好的指令傳至GPT的API,并重復多次獲取不同的答案。

接著,SmartGPT會向API發送要求其回溯答案并選擇最優解的指令。

最后,將GPT自己選擇的最佳答案展示給用戶。

上述步驟受到了三篇學術論文的啟發(圖中白框)。

這三篇論文的內容分別關于“鏈式提示方式”、“動態記憶及讓LLM自我回溯”和“用對話提高LLM完成度”。

和其他工具相比,SmartGPT好在哪

AutoGPT等工具同樣可以用來優化GPT,SmartGPT比它們好在哪里呢?

由于其工作原理是將任務進行拆分,會形成邏輯鏈條,因此SmartGPT擁有更強大的推理能力。

實用性方面,SmartGPT由獨立的子模塊組成,使用者可以對它們進行任意排列、組合和刪改。

此外,無論對于用戶還是開發人員,SmartGPT的配置過程都更為簡單。

不過開發者也坦言,這個項目剛推出不久,因此穩定性有待考證,在內存優化方面還有所欠缺,消耗的環境資源也更多。

在項目推出之后,有網友表示我們低估了GPT的潛力,甚至包括OpenAI自己。

那么,你期待GPT未來的表現嗎?

SmartGPT目前暫無開箱可用版本,需要自行在Linux環境搭建,動手能力強的讀者可根據下面的項目頁面中的指示體驗:

項目地址:https://github.com/Cormanz/smartgpt

項目涉及到的論文:[1]. https://arxiv.org/abs/2305.02897[2]. https://arxiv.org/abs/2303.11366[3]. https://arxiv.org/abs/2303.17071

參考鏈接:

[1]. https://www.youtube.com/watch?v=wVzuvf9D9BU

[2]. https://www.reddit.com/r/singularity/comments/13axo1r/gpt_4_is_smarter_than_you_think_introducing/

本文(含圖片)為合作媒體授權創業邦轉載,不代表創業邦立場,轉載請聯系原作者。如有任何疑問,請聯系editor@cyzone.cn。

最近更新

国产精品久久久久久久小唯西川 _日韩中文字幕视频_欧美va亚洲va香蕉在线_国产91精品欧美
在线视频一区观看| 一区二区免费在线视频| 国产视频久久久久久久| 一区二区三区日韩欧美精品| 欧美久色视频| 一区二区高清在线观看| 国产精品久久久久久久久借妻| 一区二区三欧美| 国产精品久久中文| 欧美一区二区三区喷汁尤物| 狠狠色狠狠色综合日日tαg| 乱码第一页成人| 亚洲三级国产| 国产精品高清网站| 久久爱另类一区二区小说| 狠狠色丁香久久婷婷综合_中| 麻豆国产精品777777在线| 亚洲人成精品久久久久| 国产精品午夜视频| 久久在线免费观看视频| 日韩一区二区免费高清| 国产乱理伦片在线观看夜一区| 久久久久中文| 国产精品99久久久久久久久 | 翔田千里一区二区| 国产一区二区三区四区三区四| 久久综合狠狠综合久久综青草 | 巨乳诱惑日韩免费av| 最新中文字幕亚洲| 国产精自产拍久久久久久| 久久综合中文色婷婷| 亚洲一区二区三区免费视频| 精品福利电影| 国产精品综合av一区二区国产馆| 欧美成人dvd在线视频| 午夜精品在线视频| 99re8这里有精品热视频免费| 国内精品伊人久久久久av影院| 欧美日韩亚洲一区| 农夫在线精品视频免费观看| 亚洲综合精品四区| 日韩亚洲欧美成人| 在线播放亚洲| 国产一级久久| 国产精品亚洲综合久久| 欧美日韩精品一区二区三区| 久久亚洲国产成人| 欧美淫片网站| 午夜精品久久久久久久蜜桃app| 亚洲国产精品美女| 国产亚洲欧美日韩美女| 国产精品日韩精品| 欧美日韩综合不卡| 欧美成人一区二区三区| 免费看亚洲片| 美女国产一区| 麻豆av一区二区三区久久| 欧美在线|欧美| 欧美一区二区三区免费视| 亚洲欧美日韩精品久久奇米色影视| 日韩午夜电影| 一本一本久久a久久精品综合妖精| 亚洲丰满在线| 亚洲二区在线| 亚洲人成网站在线观看播放| 最新成人av在线| 亚洲麻豆av| 一区二区三区高清| 中文欧美在线视频| 性色av一区二区三区红粉影视| 午夜精品影院| 久久精品一区二区三区四区| 久久中文精品| 欧美凹凸一区二区三区视频| 欧美精品一区二区精品网 | 欧美激情国产日韩精品一区18| 玖玖精品视频| 欧美精品免费视频| 欧美性猛交xxxx乱大交蜜桃| 国产精品网曝门| 黑人巨大精品欧美一区二区| 在线欧美影院| 一区二区国产日产| 欧美一区二区三区精品| 久久精品夜色噜噜亚洲aⅴ| 美女精品在线观看| 欧美性猛交xxxx乱大交蜜桃| 国产农村妇女精品一二区| 狠狠色丁香婷综合久久| 亚洲精品一区二区在线观看| 亚洲图片在线观看| 久久99伊人| 欧美精品免费播放| 国产情人综合久久777777| 亚洲二区视频在线| 亚洲永久网站| 免费欧美在线视频| 国产精品免费观看视频| 韩国一区电影| 亚洲天天影视| 免费在线观看日韩欧美| 国产精品人人做人人爽| 在线观看视频日韩| 亚洲欧美视频一区| 欧美二区在线播放| 国产永久精品大片wwwapp| 亚洲免费av片| 久久一区欧美| 国产欧美一区二区白浆黑人| 亚洲欧洲在线一区| 欧美在线观看视频| 国产精品啊啊啊| 亚洲欧洲美洲综合色网| 久久精品在线播放| 国产精品美女久久久久av超清| 亚洲日本欧美日韩高观看| 久久免费视频网站| 国产视频亚洲| 亚洲欧美国产三级| 欧美日韩一区二区在线| 亚洲国产精选| 久久一区中文字幕| 国产婷婷一区二区| 亚洲欧美日韩一区二区三区在线观看 | 性欧美办公室18xxxxhd| 欧美精品国产精品| 在线观看视频一区| 久久精品夜色噜噜亚洲aⅴ| 国产精品你懂的在线| 亚洲伦理精品| 欧美电影免费观看高清| 激情亚洲成人| 久久精品亚洲国产奇米99| 国产精品入口日韩视频大尺度| 99亚洲精品| 欧美日韩国产不卡| 夜夜嗨av一区二区三区免费区| 欧美福利一区二区三区| 亚洲成人直播| 蜜桃av一区二区三区| 一区二区三区在线视频免费观看| 亚欧成人在线| 黄色工厂这里只有精品| 久久先锋资源| 在线观看一区| 欧美激情一区| 亚洲午夜av在线| 国产精品日韩一区| 欧美一级二区| 禁久久精品乱码| 美女脱光内衣内裤视频久久影院 | 国产精品www| 亚洲欧美成人一区二区在线电影| 欧美午夜久久| 午夜精品亚洲一区二区三区嫩草| 国产精品国产精品| 亚洲欧美精品在线观看| 国产日韩欧美一区二区三区在线观看| 亚洲欧美日韩直播| 国产一区免费视频| 免费在线观看成人av| 亚洲国产三级网| 欧美日韩免费看| 亚洲一区二区三区精品动漫| 国产精品久久久久久久久久免费 | 六月丁香综合| 亚洲欧洲一区二区天堂久久 | 亚洲图片欧洲图片日韩av| 国产精品揄拍500视频| 欧美中文在线免费| 亚洲高清三级视频| 欧美视频官网| 久久精品日产第一区二区三区| 亚洲国产视频a| 国产精品黄色在线观看| 久久久国产精品一区| 夜夜躁日日躁狠狠久久88av| 国产日韩精品一区观看 | 久久天堂成人| 在线一区日本视频| 激情一区二区三区| 国产精品成人播放| 麻豆亚洲精品| 亚洲欧美成人网| 91久久精品国产91久久性色| 国产精品久久久久久福利一牛影视 | 国产亚洲一区二区三区| 欧美freesex8一10精品| 亚洲在线免费观看| 亚洲电影第1页| 国产精品久久久久久亚洲毛片| 久久久精品一区| 亚洲私人影院在线观看| 影音先锋日韩有码| 国产精品久久久久婷婷| 国产日韩精品久久久| 午夜久久久久久| 亚洲高清一二三区| 国产精品乱码一区二区三区| 免播放器亚洲|