驅(qū)動中國2024年5月13日消息,在科技界持續(xù)熱炒的人工智能領(lǐng)域,OpenAI公司即將于北京時間5月14日凌晨1點舉行一場備受矚目的線上發(fā)布會。雖然該公司CEO阿爾特曼明確表示,此次發(fā)布的不會是之前盛傳的GPT-5模型,但最新的泄露信息顯示,新的ChatGPT語音功能和GPT4-Lite引擎有望成為此次發(fā)布會的主角。

1e6f9753-6835-427e-8763-ce139a8c6d6f

近期,有關(guān)OpenAI的研究進展和技術(shù)動態(tài)不斷被媒體披露。從曝光的信息來看,OpenAI正在密集測試一款名為GPT4-Lite的新模型,并考慮將其作為搜索引擎原型的基礎(chǔ)。據(jù)悉,這一模型可能是對速度更快的GPT4進行的優(yōu)化,且代碼已悄然上傳至互聯(lián)網(wǎng)。

此外,OpenAI的搜索引擎設(shè)置中還出現(xiàn)了多個選項,包括是否開啟自動建議、選擇語言模型、選擇搜索引擎等。其中,除了已知的GPT3.5和GPT4模型外,新出現(xiàn)的GPT4-Lite引起了廣泛關(guān)注。同時,與微軟合作的Bing搜索引擎也名列其中,而Sydney和Fortis兩個選項的真實身份尚未揭曉,但推測可能與早期的Bing AI“里人格”有關(guān)。

31db6942-2668-4ad9-afd5-f82e5a1aa45e

在內(nèi)部搜索方面,代碼中的“拉布拉多”一詞暗示了可能使用了RAG技術(shù)(Retrieval Augmented Generation),意味著該功能或許能夠檢索ChatGPT內(nèi)的聊天記錄。這些傳統(tǒng)搜索引擎常用功能,如查詢天氣、體育比賽信息等,SearchGPT似乎也有意涉足。

最引人注目的是,OpenAI可能將推出一項新的語音功能,它不僅能理解人類語音中的停頓和語氣,還能判斷提問時的情緒色彩。結(jié)合之前申請的“Voice Engine”商標(biāo),外界普遍猜測OpenAI正開發(fā)一種端到端的神經(jīng)網(wǎng)絡(luò),它能直接根據(jù)語音輸入預(yù)測語音輸出,無需經(jīng)過語音到文本的轉(zhuǎn)換過程。

這項技術(shù)的推出,預(yù)示著未來的對話將更加流暢,延遲大幅降低,讓人聯(lián)想到電影《她》中的AI伴侶薩曼莎。阿爾特曼形容這項即將發(fā)布的功能“感覺像魔法”,而總裁菠蘿曼也公開為其造勢。

盡管發(fā)布會上的內(nèi)容尚未完全明朗,但OpenAI的這些最新技術(shù)動向已經(jīng)引發(fā)了業(yè)界的廣泛討論。從搜索引擎的原型到語音識別技術(shù)的進步,OpenAI的創(chuàng)新步伐顯示出其在人工智能領(lǐng)域的領(lǐng)導(dǎo)力量。隨著發(fā)布會的臨近,外界對于OpenAI將如何改變當(dāng)前人工智能應(yīng)用和服務(wù)的期待日益高漲。