北京時間5月14日凌晨,美國知名的人工智能研究公司Open AI在線上成功舉辦了「春季更新」活動。在活動中,Open AI正式推出了其全新旗艦?zāi)P汀窯PT-4o」,這款模型具備了在音頻、視覺和文本上實(shí)時推理的能力。據(jù)了解,GPT-4o使得ChatGPT能夠支持高達(dá)50種不同的語言,並在處理速度和結(jié)果質(zhì)量上均有了顯著提升。
GPT-4o被視為向更自然人機(jī)交互邁進(jìn)的關(guān)鍵一步,特別是在圖像和音頻理解方面,GPT-4o展現(xiàn)出了尤為出色的能力。Open AI提到,GPT-4o可以在最快232毫秒的時間內(nèi)響應(yīng)音頻輸入,平均響應(yīng)時間為320毫秒,這與人類在對話中的響應(yīng)時間相似。
據(jù)悉,ChatGPT的免費(fèi)用戶也能用上GPT-4o模型(更新前只能使用GPT-3.5)來進(jìn)行數(shù)據(jù)分析、圖像分析、互聯(lián)網(wǎng)搜索、訪問應(yīng)用商店等操作。這也意味著GPT應(yīng)用商店的開發(fā)者將面對海量的新增用戶。