07

01

-

2026

速递|为硬件铺路:OpenAI攻坚下一代音频AI模子打

作者: 888集团官网正版


速递|为硬件铺路:OpenAI攻坚下一代音频AI模子打

  不外,据这位前员工暗示,OpenAI目前面对的一个妨碍是,很多ChatGPT用户并不会通过高声措辞的体例取聊器人互动,这要么是由于其音频模子质量较低,要么是由于他们不晓得这个功能。为了打制一款以音频为先的人工智能设备,OpenAI必需起首让消费者习惯取ChatGPT如许的人工智能产物高声对话。

  取谷歌、亚马逊、Meta Platforms和苹果一样,OpenAI正努力于开辟包罗可穿戴设备正在内的新型小我人工智能设备。部门公司认为,当前最受欢送的iPhone等设备并未针对将来人工智能手艺进行优化。

  OpenAI内部多个团队的员工参取了设备相关研发工做,涵盖供应链、工业设想及模子研究等范畴。2025岁首年月,OpenAI以近65亿美元收购了由艾维结合创立的公司io,以从导硬件设备的设想工做。

  部门研究者还相信,无屏幕设想能降低人们对设备上瘾的可能性。正正在取OpenAI合做开辟硬件的苹果前设想总监乔尼·艾夫曾暗示,这对他而言是优先考虑的事项,由于他将潜正在的新设备视为改正以往消费电子产物缺陷的契机。

  知恋人士透露,OpenAI音频人工智能鞭策背后的环节人物是Kundan Kumar,他是该公司本年炎天从Character。AI礼聘来的语音人工智能研究员,担任带领这项工做。该人士称,他帮帮沉写了OpenAI的根本设备(这些设备次要为以文本为核心的人工智能而建)以顺应音频人工智能,以及多模态ChatGPT的产物司理Jackie Shannon。

  据多位知恋人士透露,OpenAI正正在开辟一个打算逐渐放行的设备系列,而不是单一设备。他们暗示,公司会商过的设法包罗眼镜和无显示屏的智能音箱。

  OpenAI改善其音频模子的勤奋起头收效。知恋人士暗示,新的音频模子架构生成的回应听起来愈加天然且富无情感,并能供给更精确、更具深度的谜底。该人士称,新音频模子还可以或许取人类用户同时讲话——这是现有模子无法实现的功能,并将更好地处置对话中缀。

  参取该项目研发的OpenAI研究人员但愿用户通过语音而非屏幕取设备交互。包罗由OpenAI前首席手艺官米拉·穆拉蒂结合创立的人工智能草创公司Thinking Machines Lab正在内,很多人工智能研究者认为,高声措辞是取人工智能交互更天然的体例,由于人类次要通过语音进行交换。

  知恋人士透露,公司方针是正在2026年第一季度发布这款新型音频模子。OpenAI讲话人对此不予置评。

  对话时,聊器人可以或许进行语音回应,但其音频版本所依赖的大型言语模子取生成文本答复的模子并非统一套系统。据一名前员工取一名现人员工透露,公司内部研究人员认为,当前音频模子正在回覆精确度和响应速度方面均掉队于文本模子。

  据知恋人士透露,过去两个月间,OpenAI已整合多个工程、产物取研究团队,配合努力于为将来设备优化音频模子。

  据知恋人士透露,参取该设备研发的研究人员本年炎天正在面向OpenAI员工的展现会上暗示,这款设备将饰演陪同者的脚色,自动为用户供给以帮其告竣方针,而非仅仅做为毗连使用法式取其他软件的简单通道。该人士称,正在获得用户答应后,设备将通过音频和视频四周及用户消息。

  艾夫正在蒲月份接管Stripe首席施行官帕特里克·科里森采访时暗示:即便你的初志是好的,但若是你参取的工作发生了不良后果,你就必需承担义务。这种义务感,就我小我而言,鞭策了我正正在进行的很多工做。


888集团官网正版