OpenAI将在ChatGPT推出新的语音和图像功能,几秒钟制作出逼真的合成语音,

OpenAI于官网宣布将在ChatGPT中推出新的语音和图像功能,允许用户进行语音对话、上传图像。

主要值得关注的点包括:

用户现在可以与ChatGPT进行语音交谈,它可以回复你。这个新功能由文本转语音模型提供支持,可以从文本和少量语音样本生成逼真的语音。

用户现在可以在ChatGPT中展示一张或多张图像,以获取相关帮助和见解。在移动应用上,可以使用绘图工具聚焦图像的特定部分。这些视觉能力由多模态GPT-3.5和GPT-4提供支持。

OpenAI正逐步推出这些新功能,以进行改进和风险缓解,并准备用户使用更强大的系统。考虑到语音和视觉能力带来的新风险,这种渐进策略尤为重要。

其中,官方给出了一些可能的应用场景:

当旅行时,拍下一处地标的图片,并就其有趣之处进行语音交谈。

在家时,拍下冰箱和食品柜的图片,弄清做什么晚餐(并提出后续问题获取步骤式食谱)。

晚餐后,通过拍照、圈画题目,并与孩子共享提示,帮助孩子解决数学问题。

也包括视频中的案例,指导用户选择正确的工具调节自行车座椅的高度。

据OpenAI官网9月25日消息,OpenAI宣布在接下来的两周内,将在ChatGPT中向Plus和Enterprise用户推出语音和图像。语音将在iOS和Android上推出(在您的设置中选择加入),图像将在所有平台上提供。

看到人工智能不断地进化,不少人的焦虑始终存在,进入到这个时代已经很难有什么工作是永恒不被替换的贴饭碗了, 人工智能很显然在不久的未来将替代绝大部分现有的工作, 如果你不想被淘汰那就拥抱人工智能吧, 关注他,学习他,使用他。

人工智能将会被应用到生活的方方面面,而这个过程你会计算机编程技术你就有一定的优势,虽然你不一定去喂数据,调模型,不过你却可以调接口,提高你的生产力和你所在企业的生产力。

W3Cschool编程狮是你很好的编程入门老师,这里有很多免费的教程和文档,可以帮助你快速入门和实践,当然如果你有马内,还有很多不错的视频,微课等形式的内容帮助你快速学习掌握。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。