OpenAI改進(jìn)Codex釋出新版本,OpenAI Codex是一個能夠?qū)⒆匀徽Z言轉(zhuǎn)換成為程式碼的人工智慧系統(tǒng),也就是說,Codex能夠讓開發(fā)者用簡單的口語指令來編寫程式,現(xiàn)在OpenAI將Codex的API以私人Beta測試的形式對外釋出。
Codex是GitHub Copilot服務(wù)所使用的模型,而Copilot是GitHub在一個月前和OpenAI合作,所推出的人工智慧程式碼編寫工具,能夠提供開發(fā)者整行甚至是整個函式的程式碼編寫建議,相當(dāng)於提供用戶一個結(jié)對工程師(Pair Programmer)。Codex精通十幾種程式語言,而現(xiàn)在使用者可以將簡單的自然語言指令,轉(zhuǎn)換成為程式碼,也就是提供實現(xiàn)以自然語言介面開發(fā)應(yīng)用程式的方法。
OpenAI Codex是從模型GPT-3衍生改進(jìn)而來,訓(xùn)練資料包含自然語言,以及數(shù)十億行開源程式碼,包括公開的GitHub儲存庫中的程式碼,OpenAI Codex最擅長的語言是Python,但也精通JavaScript、Go、Perl、PHP、Ruby、Swift和TypeScript,甚至連殼層十幾種語言都難不倒他,而且由于Codex擁有14KB的Python程式碼記憶體,比起GPT-3只有4KB,在執(zhí)行任何工作時,Codex都能考慮GPT-3模型3倍以上的上下文資訊做決定。
GPT-3的能力主要是依據(jù)自然語言生成自然語言,而這代表GPT-3的影響力,來自于其閱讀人類的作品,而OpenAI Codex具有GPT-3大部分的自然語言理解能力,但是其輸出是程式碼,因此使用者可以用英文,對任何軟件API發(fā)出命令,Codex的價值在於,能夠讓電腦理解人類的意圖,進(jìn)而讓所有人都使用電腦完成更多的工作。
Codex是一個通用程式開發(fā)模型,因此可以應(yīng)用在任何程式開發(fā)任務(wù)上,官方提到,當(dāng)開發(fā)者明確知道要建構(gòu)什麼樣的程式,則撰寫程式的工作會被分類為,將問題分解成更簡單的問題,或是將簡單的問題,對應(yīng)到已經(jīng)存在的程式碼,像是函式庫、API和函式,接下來也是最無聊的實際程式碼編寫階段,而這正是OpenAI Codex最擅長的部分。
OpenAI已經(jīng)將Codex用於轉(zhuǎn)譯、解釋和重構(gòu)程式碼,而這些僅是Codex能力的冰山一角,OpenAI規(guī)劃要擴(kuò)大規(guī)模,并且免費(fèi)提供OpenAI Codex,而現(xiàn)在則是先提供私人測試版,官方提到,他們會繼續(xù)檢視安全性問題,并且了解該技術(shù)對於世界的影響。