OpenAI如何叩响AGI之门:12天12场直播,秀出哪些新肌肉-文本歌词

OpenAI如何叩响AGI之门:12天12场直播,秀出哪些新肌肉-文本歌词

发行日期:

本字幕由TME AI技术生成

科技一点通

时代新知

生活头条

欢迎收听人本智慧

凤凰FM出品的科技一点通

今天的主要内容是

openAI如何叩响AGI之门

十二天十二场直播

秀出哪些新肌肉

文章来自凤凰新闻

作者彭泰

新闻编辑

凤凰FMletterg

今日要闻

当地时间十二月五日至二十日

人工智能巨头openAI完成了连续十二个工作日的十二场直播

从首日的满血版o一模型重磅发布

再到期待许久的soonaturbo正式发布

最终又以新一代推理模型o三收官

openAICEO山姆奥特曼还在四场直播中现身站台

我们似乎离AGIartificialgeneralintelligence通用人工智能又更近了一步

CNBC评价称

这次连续上二天直播的噱头

是openAI将焦点转向其技术

并为其产品造势的一种方式

这是公司积极发展计划的一部分

因为它要与创业公司和科技巨头争夺生成是人工智能市场的更大份额

不过

这次活动在某些方面因其强有力的年终宣传而受到称赞

但也有人批评其炒作成分多于实质内容

纽约杂志评价称

目前openAI正面临内部领导层变动

与微软的资源紧张关系

以及对AGI进展的争论

此次活动在展示新产品和功能的同时

也表现出一定的防御性

让我们来一起回顾openAI叩响AGI之门的这十二天

第一天

当地时间十二月五日

推出满血版o一模型和chatTPTpro

正式把o一提升了推理逻辑能力

可以解决国际数学奥林匹克资格考试中百分之八十三的问题GPT四o在该测试中的得分只有百分之十三

响应时间得到改善

在演示中

研究人员向欧一提了一个问题

列出罗马帝国在公元二世纪的统治者

包含其在位时间和成就

o一花了将近十八秒来回答

远低于四o模型比o一preview的速度提高了约百分之六十

解锁多模态图像识别功能

能够转录笔记

测算相对大小

甚至可以解释如何将随机零件装入更大的机器中

同时

当天还推出了checkGPTpro订阅计划

每月二百美元

提供了无次数限制使用o一

高级语音模式等模型的权限

大部分评论对完整版o一的推出表现的较为积极

不过也有用户吐槽在缺少高级功能的现在

o一仍然只是一个预览版

也有用户对当天的更新中没有免免费产品表示了不满

对于chatTPTpro

有分析指出

这进一步证明了大模型的烧钱速度

在愈发激烈的AI竞赛中

openAI急需通过OE模型来证明自己

第二天

当地时间十二月六日

推出强化学习微调RFTreinforcementfinetuny

用户能够利用少量的训练数据

也能在特定领域快速构建专家级模型

openAI的研究员称

强化微调并不是单单教模型输出

它的运作方式是当模型发现一个问题的时候

研究者给模型空间仔细思考这个问题

然后评估模型给出的最终解答

运用强化学习

研究者可以强化产生正确答案的思路

抑制产生错误答案的思路

强化微调后的OEmini在topatone

正确答案在列表第一个位置的概率topatfive

正确答案在列表前五个位这的概率和topadmax输出中包含正确答案的概率指标上

表现都明显胜过性能更加强大的OE

openAI高级副总裁marktrong表示

强化微调能力预示着小体量模型也能从高中水平跃升至专家水平

为企业和科研单位提供了强大的工具

第三天

当地时间十二月九日

soraturbo正式发布

sroaaturbo可以生成幺零八零p最长二十秒的视频

支持横屏十六比九

正方形一比一和竖屏九比十六多种常见比例

并且可以对生成的视频进行vmix重混替换

删除或重构视频中的元素

recut重新切割

找到最佳的一帧再进行延展

循环剪辑混合

将两个视频进行无缝合并剪辑

故事版剪辑

精准指定每个帧的输入风格

预设预设创建视频的风格等操作

奥特曼表示

最令他兴奋的一点是与其他人共同创作的便捷性

感觉就像是一个有趣的新事物

大家可以将sara看作视频版的GPTE

尽据网友实测反馈

对物理规律的理解并不够好

仍会出现人的手步不自然

文字乱麻

动物跑着跑着就飞起来等情况

也有外媒指出

sara发布未能达到最初预期

尽管openAI努力推出更快更实惠的版本

但最终产品缺乏预期的高级功能

与checkGPT的早期阶段进行比较

sora目前更像视频编辑软件

而非突破性的AI

美联社则指出

像sora这样的文声视频AI工具

被认为是制作新的娱乐和营销视频时节省成本的方式

但也引发了人们对其在政治和其他领域是否容易冒充真人的担忧

openAI发布sroa限制了对人物的描绘

防止了如冒充和深度伪造等耐用情况的出现

第四天

当地时间十二月十日

canvas升级

canvas是openAI在今年十月推出的全新功能

openAI将其定义为使用checkGPT编写和编码的全新工作方式

canvas在单独的窗口中打开

用户和checkGPT就项目进行协作

不仅仅是通过对话

而是共同创作和完善想法

可以协作编辑文档

修改标题

添加表情符号

调整文本长度等

canvas还支持拍档

代码运行和调试

能直接查看文本和图形形出

并且checkGPT能辅助调试并提供修改建议

用户可以快速迭代代码

外媒对canvas都给予了积极评价

认为有效提升了用户与AI在写作和编码方面的协作体验

标志着AI工具在人机交互领域的又一进步

第五天

当地时间十二月十一日

chatGPT正式集成到苹果系统

用户可通过siri访问chatGPT功能

并支持语音控制设备

当siri判断chatGPT能够更好的满足用户请求时

会自动将请求转发给openAI的系统

用户操作前需先启用该功能

以便保障隐私

苹果的智能写作工具引入chatGPT能力

用户不仅能优化总结文档

提取规键信息

还能从零开始创作全新文档

甚至结合刀义图像生成技术

在撰写过程中融入图片

用户还可以清除苹果的相机控制

按季完成视觉智能相关任务

例如快速识别眼前物品

或深入了解所看到的内容

进行翻译总结等

路透社指出

此次发布正值圣诞节假日购物旺季

也是公司一年中销售利润最丰厚的时期

或许对于苹果产品的销售带来影响

目前苹果智能功能的推出速度缓慢

也引发了一些投资者对iphone十六销售周期力度的担忧

第六天

当地时间十二月十二日

增强checkGPT高级语音模式亮相GPT四o

增强多模态能力

推出实时视频语音功能

还推出现实圣诞老人语音模式

用户可直接输入音频

理解并直接输出音频

可以把手机图片或短信等展示给checkGPT

它将其解读并分析这些内容

协助用户回复消息

工作等

第七天

当地时间十二月十三日

projects功能发布

project支持用户将文件

聊天记录等信息集中到一个project中

与openAI竞争对手anthropic此前推出的cloud新功能有异曲同工之处

可进行文件上传

设定个性化指令等操作

也支持将过往聊天记录添加到项目中

定制checkTPT的对话

创建新对话时也能自动搜索项目中的其他信息

进行更精准的回答

此外还支持canvas界面

能通过通过chatGPTsearch轻松接入互联网

第八天

当地时间十二月十六日

chatGPTsearch向所有用户开放

chatGPTsearch优化了搜索速度和准确性

新增语音搜索功能

与地图集成

全球同步上线

提升实时信息获取体验

以更自然

更会话的方式提问

checkGPT可以选择用网络信息进行回复

如果深入追问

chatGPT会考虑您聊天的全部上下文

提供更好的答案

新媒体集团boxmedia总裁评价称

chatPPTsearch有望更好的突出值得信赖的新闻来源的信息

并对其进行归属

使受众受益

同时扩大提供优质新闻的出版商的影响力

第九天

当地时间十二月十七日

OEAPI正式版亮相

openAI称OEAPI为功能更强大的模型

新的定制工具

可提高性能

灵活性和成本效益的升级

支持海外数调用

结构化输出和视觉功能更新

支持低延迟自然对话体验

realtimeAPI可进行简单的webRTC集成

GPT四o音频的定价降百分之六十

GPT四omini音频费率降为十分之一

支持偏好微调

可根据用户和开发人员的偏好更轻松的定制模型

同时还推出了新的goal和javaSDK测试版

openAI给这一天的发布取名为为开发人员准备的日礼物

第十天

当地时间十二月十八日

推出chatGPT热线

checkGPT新加入了一个电话拨打的入口

无需checkGPT账号

只要拥有本地号码

美国用户就可通过拨打加一八零零chatGPT及加一八零零二四二八四七八与checkGPT进行交谈

每个月有十五分钟的免费语音通话额度

在openAI产品负责人的演示中

不仅非智能化的翻盖手机可以拨打

就连上个世纪流行起来的转盘电话也能够与与checkGPT通话

这意味着该功能对于通讯硬件本身并没有什么要求

有外媒试用了该服务后报道称

AI语音非常逼真

但通话时间限制为每月十五分钟

且或许会存在隐私安全问题

第十一天

当地时间十二月十九日

chefGPT桌面板新增跨应用访问功能

对chatGPT桌面版可读取其他应用程序中的数据

实现实时协作

新增了更多编程环境和生产力工具的支持

可以与applenotes等无缝对接

并支持在使用桌面应用时开启高级语音模式

该功能需要用户手动为每个应用开启

第十二天

当地时间十二月二十日

o三模型发布最新推理模型o三和o三mini

推理能力大幅提升

支持多模式推理

据介绍

在编码测试SWbenchverify中

o三性能比o一高出百分之二十二点八

在coforces竞技编程中得分为两千七百二十七分

相当于位列第一百七十五名的人类选手

甚至至超过opopenayi的首席科学家两千六百五十分分数

数学竞赛m二零二四专专家级科学问题基准测试GPUA

dimon中

成绩都得到明显提升

而在令很多AI和数学家都束手无策的最难数学和推理挑战frontiermah中

o三解决了百分之二十五点二的问题

其他模型均未超过百分之二

openAI还表示

正使用一种新技术慎重对齐deliberativeeleelement来使o三等模型符合其安全原则

RKHEI

通用人工智能抽象与推理语料库发起者

用python编写的高级神经网络APIcarrols之父弗朗索瓦

肖莱认为

虽然o三给人留下了深刻印象

是迈向AGI的一个重要里程碑

但并不就是AGI

仍然有相当多非常简单的RKAGI一的任务是o三无法解决的

同时还有迹象表明

RKGI二对o三来说仍极具挑战性

这表明在不涉及专业知识的情况下

创建对人类来说容易

但对人工智能来说不可能的不饱和

有趣的批准仍然是可行的

当创建这样的测试变得完全不可能时

我们将拥有AGI

路透社对此评价称

o三的发布表明了openAI与谷歌等竞争对手的竞争日趋激烈

双方都在努力创造能够解决复杂问题的更智能模型

谷歌在十二月早些时候发布了第二代人工智能模型gerina

旨在能够在人工智能技术竞赛中夺回领先地位

此外

在openAI发布o三后

华尔街日报发表了一篇名为人工智能的下一次重大飞跃落后于时间表

而且昂贵的令人发指的文章

指出openAI在其代号为猎户座的新人工智能项目中遇到了诸多问题

项目进度落后

而且耗资巨大

文章也指出了对于数据瓶颈的担忧

目前尚不清楚何时或能否成功

世界上可能没有足够的数据让他变得足够聪明

奥特曼则转发了该篇文章

表达了不满之情

第十三天的彩蛋

当地时间十二月二十二日

plus用户sara限时圣诞假期无限适用

奥特曼宣布

十二月下旬

随着圣诞假期的到来

人们从工作中解脱出来

openAI的算力将不再紧张

因此将在假期内为所有plus用户提供无限的sorroa访问权限

在openAI连续密集发布的新品中不难发现

checkGPTpro的推出进一步证明了大模型的烧钱速度

多模态

定制化

隐私这些安全应用相关内容被多次强调

也体现出openAI急需通过更强的模型产品来证明自己

可以看到的是

AI竞赛愈发激烈

谷歌

p卡等竞争对手也在这十二天内发布了各自的新产品进行狙击

而openAI面临的最大挑战莫过于曾经的联合创始人埃隆

马斯克

马斯克目前旗下拥有了人工智能初创公司XAI

并准备在特朗普政府中发挥重要影响

网罗业绩

要闻精选

融资动态

人本智慧

凤凰fm科技一点通

感谢您的收听