本字幕由TME AI技术生成
科技一点通
时代新知
生活头条
欢迎收听人本智慧
凤凰FM出品的科技一点通
今天的主要内容是
openAI如何叩响AGI之门
十二天十二场直播
秀出哪些新肌肉
文章来自凤凰新闻
作者彭泰
新闻编辑
凤凰FMletterg
今日要闻
当地时间十二月五日至二十日
人工智能巨头openAI完成了连续十二个工作日的十二场直播
从首日的满血版o一模型重磅发布
再到期待许久的soonaturbo正式发布
最终又以新一代推理模型o三收官
openAICEO山姆奥特曼还在四场直播中现身站台
我们似乎离AGIartificialgeneralintelligence通用人工智能又更近了一步
CNBC评价称
这次连续上二天直播的噱头
是openAI将焦点转向其技术
并为其产品造势的一种方式
这是公司积极发展计划的一部分
因为它要与创业公司和科技巨头争夺生成是人工智能市场的更大份额
不过
这次活动在某些方面因其强有力的年终宣传而受到称赞
但也有人批评其炒作成分多于实质内容
纽约杂志评价称
目前openAI正面临内部领导层变动
与微软的资源紧张关系
以及对AGI进展的争论
此次活动在展示新产品和功能的同时
也表现出一定的防御性
让我们来一起回顾openAI叩响AGI之门的这十二天
第一天
当地时间十二月五日
推出满血版o一模型和chatTPTpro
正式把o一提升了推理逻辑能力
可以解决国际数学奥林匹克资格考试中百分之八十三的问题GPT四o在该测试中的得分只有百分之十三
响应时间得到改善
在演示中
研究人员向欧一提了一个问题
列出罗马帝国在公元二世纪的统治者
包含其在位时间和成就
o一花了将近十八秒来回答
远低于四o模型比o一preview的速度提高了约百分之六十
解锁多模态图像识别功能
能够转录笔记
测算相对大小
甚至可以解释如何将随机零件装入更大的机器中
同时
当天还推出了checkGPTpro订阅计划
每月二百美元
提供了无次数限制使用o一
高级语音模式等模型的权限
大部分评论对完整版o一的推出表现的较为积极
不过也有用户吐槽在缺少高级功能的现在
o一仍然只是一个预览版
也有用户对当天的更新中没有免免费产品表示了不满
对于chatTPTpro
有分析指出
这进一步证明了大模型的烧钱速度
在愈发激烈的AI竞赛中
openAI急需通过OE模型来证明自己
第二天
当地时间十二月六日
推出强化学习微调RFTreinforcementfinetuny
用户能够利用少量的训练数据
也能在特定领域快速构建专家级模型
openAI的研究员称
强化微调并不是单单教模型输出
它的运作方式是当模型发现一个问题的时候
研究者给模型空间仔细思考这个问题
然后评估模型给出的最终解答
运用强化学习
研究者可以强化产生正确答案的思路
抑制产生错误答案的思路
强化微调后的OEmini在topatone
正确答案在列表第一个位置的概率topatfive
正确答案在列表前五个位这的概率和topadmax输出中包含正确答案的概率指标上
表现都明显胜过性能更加强大的OE
openAI高级副总裁marktrong表示
强化微调能力预示着小体量模型也能从高中水平跃升至专家水平
为企业和科研单位提供了强大的工具
第三天
当地时间十二月九日
soraturbo正式发布
sroaaturbo可以生成幺零八零p最长二十秒的视频
支持横屏十六比九
正方形一比一和竖屏九比十六多种常见比例
并且可以对生成的视频进行vmix重混替换
删除或重构视频中的元素
recut重新切割
找到最佳的一帧再进行延展
循环剪辑混合
将两个视频进行无缝合并剪辑
故事版剪辑
精准指定每个帧的输入风格
预设预设创建视频的风格等操作
奥特曼表示
最令他兴奋的一点是与其他人共同创作的便捷性
感觉就像是一个有趣的新事物
大家可以将sara看作视频版的GPTE
尽据网友实测反馈
对物理规律的理解并不够好
仍会出现人的手步不自然
文字乱麻
动物跑着跑着就飞起来等情况
也有外媒指出
sara发布未能达到最初预期
尽管openAI努力推出更快更实惠的版本
但最终产品缺乏预期的高级功能
与checkGPT的早期阶段进行比较
sora目前更像视频编辑软件
而非突破性的AI
美联社则指出
像sora这样的文声视频AI工具
被认为是制作新的娱乐和营销视频时节省成本的方式
但也引发了人们对其在政治和其他领域是否容易冒充真人的担忧
openAI发布sroa限制了对人物的描绘
防止了如冒充和深度伪造等耐用情况的出现
第四天
当地时间十二月十日
canvas升级
canvas是openAI在今年十月推出的全新功能
openAI将其定义为使用checkGPT编写和编码的全新工作方式
canvas在单独的窗口中打开
用户和checkGPT就项目进行协作
不仅仅是通过对话
而是共同创作和完善想法
可以协作编辑文档
修改标题
添加表情符号
调整文本长度等
canvas还支持拍档
代码运行和调试
能直接查看文本和图形形出
并且checkGPT能辅助调试并提供修改建议
用户可以快速迭代代码
外媒对canvas都给予了积极评价
认为有效提升了用户与AI在写作和编码方面的协作体验
标志着AI工具在人机交互领域的又一进步
第五天
当地时间十二月十一日
chatGPT正式集成到苹果系统
用户可通过siri访问chatGPT功能
并支持语音控制设备
当siri判断chatGPT能够更好的满足用户请求时
会自动将请求转发给openAI的系统
用户操作前需先启用该功能
以便保障隐私
苹果的智能写作工具引入chatGPT能力
用户不仅能优化总结文档
提取规键信息
还能从零开始创作全新文档
甚至结合刀义图像生成技术
在撰写过程中融入图片
用户还可以清除苹果的相机控制
按季完成视觉智能相关任务
例如快速识别眼前物品
或深入了解所看到的内容
进行翻译总结等
路透社指出
此次发布正值圣诞节假日购物旺季
也是公司一年中销售利润最丰厚的时期
或许对于苹果产品的销售带来影响
目前苹果智能功能的推出速度缓慢
也引发了一些投资者对iphone十六销售周期力度的担忧
第六天
当地时间十二月十二日
增强checkGPT高级语音模式亮相GPT四o
增强多模态能力
推出实时视频语音功能
还推出现实圣诞老人语音模式
用户可直接输入音频
理解并直接输出音频
可以把手机图片或短信等展示给checkGPT
它将其解读并分析这些内容
协助用户回复消息
工作等
第七天
当地时间十二月十三日
projects功能发布
project支持用户将文件
聊天记录等信息集中到一个project中
与openAI竞争对手anthropic此前推出的cloud新功能有异曲同工之处
可进行文件上传
设定个性化指令等操作
也支持将过往聊天记录添加到项目中
定制checkTPT的对话
创建新对话时也能自动搜索项目中的其他信息
进行更精准的回答
此外还支持canvas界面
能通过通过chatGPTsearch轻松接入互联网
第八天
当地时间十二月十六日
chatGPTsearch向所有用户开放
chatGPTsearch优化了搜索速度和准确性
新增语音搜索功能
与地图集成
全球同步上线
提升实时信息获取体验
以更自然
更会话的方式提问
checkGPT可以选择用网络信息进行回复
如果深入追问
chatGPT会考虑您聊天的全部上下文
提供更好的答案
新媒体集团boxmedia总裁评价称
chatPPTsearch有望更好的突出值得信赖的新闻来源的信息
并对其进行归属
使受众受益
同时扩大提供优质新闻的出版商的影响力
第九天
当地时间十二月十七日
OEAPI正式版亮相
openAI称OEAPI为功能更强大的模型
新的定制工具
可提高性能
灵活性和成本效益的升级
支持海外数调用
结构化输出和视觉功能更新
支持低延迟自然对话体验
realtimeAPI可进行简单的webRTC集成
GPT四o音频的定价降百分之六十
GPT四omini音频费率降为十分之一
支持偏好微调
可根据用户和开发人员的偏好更轻松的定制模型
同时还推出了新的goal和javaSDK测试版
openAI给这一天的发布取名为为开发人员准备的日礼物
第十天
当地时间十二月十八日
推出chatGPT热线
checkGPT新加入了一个电话拨打的入口
无需checkGPT账号
只要拥有本地号码
美国用户就可通过拨打加一八零零chatGPT及加一八零零二四二八四七八与checkGPT进行交谈
每个月有十五分钟的免费语音通话额度
在openAI产品负责人的演示中
不仅非智能化的翻盖手机可以拨打
就连上个世纪流行起来的转盘电话也能够与与checkGPT通话
这意味着该功能对于通讯硬件本身并没有什么要求
有外媒试用了该服务后报道称
AI语音非常逼真
但通话时间限制为每月十五分钟
且或许会存在隐私安全问题
第十一天
当地时间十二月十九日
chefGPT桌面板新增跨应用访问功能
对chatGPT桌面版可读取其他应用程序中的数据
实现实时协作
新增了更多编程环境和生产力工具的支持
可以与applenotes等无缝对接
并支持在使用桌面应用时开启高级语音模式
该功能需要用户手动为每个应用开启
第十二天
当地时间十二月二十日
o三模型发布最新推理模型o三和o三mini
推理能力大幅提升
支持多模式推理
据介绍
在编码测试SWbenchverify中
o三性能比o一高出百分之二十二点八
在coforces竞技编程中得分为两千七百二十七分
相当于位列第一百七十五名的人类选手
甚至至超过opopenayi的首席科学家两千六百五十分分数
数学竞赛m二零二四专专家级科学问题基准测试GPUA
dimon中
成绩都得到明显提升
而在令很多AI和数学家都束手无策的最难数学和推理挑战frontiermah中
o三解决了百分之二十五点二的问题
其他模型均未超过百分之二
openAI还表示
正使用一种新技术慎重对齐deliberativeeleelement来使o三等模型符合其安全原则
RKHEI
通用人工智能抽象与推理语料库发起者
用python编写的高级神经网络APIcarrols之父弗朗索瓦
肖莱认为
虽然o三给人留下了深刻印象
是迈向AGI的一个重要里程碑
但并不就是AGI
仍然有相当多非常简单的RKAGI一的任务是o三无法解决的
同时还有迹象表明
RKGI二对o三来说仍极具挑战性
这表明在不涉及专业知识的情况下
创建对人类来说容易
但对人工智能来说不可能的不饱和
有趣的批准仍然是可行的
当创建这样的测试变得完全不可能时
我们将拥有AGI
路透社对此评价称
o三的发布表明了openAI与谷歌等竞争对手的竞争日趋激烈
双方都在努力创造能够解决复杂问题的更智能模型
谷歌在十二月早些时候发布了第二代人工智能模型gerina
旨在能够在人工智能技术竞赛中夺回领先地位
此外
在openAI发布o三后
华尔街日报发表了一篇名为人工智能的下一次重大飞跃落后于时间表
而且昂贵的令人发指的文章
指出openAI在其代号为猎户座的新人工智能项目中遇到了诸多问题
项目进度落后
而且耗资巨大
文章也指出了对于数据瓶颈的担忧
目前尚不清楚何时或能否成功
世界上可能没有足够的数据让他变得足够聪明
奥特曼则转发了该篇文章
表达了不满之情
第十三天的彩蛋
当地时间十二月二十二日
plus用户sara限时圣诞假期无限适用
奥特曼宣布
十二月下旬
随着圣诞假期的到来
人们从工作中解脱出来
openAI的算力将不再紧张
因此将在假期内为所有plus用户提供无限的sorroa访问权限
在openAI连续密集发布的新品中不难发现
checkGPTpro的推出进一步证明了大模型的烧钱速度
多模态
定制化
隐私这些安全应用相关内容被多次强调
也体现出openAI急需通过更强的模型产品来证明自己
可以看到的是
AI竞赛愈发激烈
谷歌
p卡等竞争对手也在这十二天内发布了各自的新产品进行狙击
而openAI面临的最大挑战莫过于曾经的联合创始人埃隆
马斯克
马斯克目前旗下拥有了人工智能初创公司XAI
并准备在特朗普政府中发挥重要影响
网罗业绩
要闻精选
融资动态
人本智慧
凤凰fm科技一点通
感谢您的收听