行业分类:
加载中...
头条分类:
加载中...
亚马逊“盲眼”机器人30秒跑酷首秀惊艳!华人学者领衔
你见过这样的“盲眼”机器人demo吗? 它在完全看不见的情况下——没有摄像头、雷达或任何感知单元——主动搬起9斤重的椅子,爬上1米高的桌子,然后翻跟头跳下。 不光耍酷,干起活来,搬箱子也不在话下。 还能一个猛子跳上桌子。 手脚并用爬坡也照样OK。 这些丝滑小连招来自亚马逊机器人团队FAR(Frontier AI for Robotics)发布的首个人形机器人(足式)研究成果——OmniRetarget! OmniRetarget使强化学习策略能够在复杂环境中学习长时程的“移-操一体”(loco-manipulation)技能,并实现从仿真到人形机器人的零样本迁移。 网友表示:又能跑酷、还能干活,这不比特斯拉的擎天柱强10倍? 接下来,让我们一起看看他们是怎么做到的吧! 基于交互网格的动作重定向方法 总的来说,OmniRetarget是一个开源的数据生成引擎,它将人类演示转化为多样化、高质量的运动学参考,用于人形机器人的全身控制。 与通常忽略人-物体/环境之间丰富的交互关系的动作重定向方法不同,OmniRetarget通过一个交互网格(interaction mesh)来建模机器人、物体和地形之间的空间和接触关系,从而保留了必要的交互并生成运动学可行的变体。 此外,保留任务相关的交互使得数据能够进行高效的数据增强,进而从单个演示推广到不同的机器人本体、地形和物体配置,以减少不同变体的数据收集成本。 在与其他动作重定向方法的对比中,OmniRetarget在所有关键方面:硬约束、物体交互、地形交互、数据增强表现出了全面的方法优势。 接下来就让我们具体来看。 首先,OmniRetarget通过基于交互网格(interaction-mesh)的约束优化,将人类示范动作映射到机器人上。 在研究中,交互网格被定义为一个体积结构,用于保持身体部位、物体与环境之间的空间关系。 交互网格的顶点由关键的机器人或人类关节以及从物体和环境中采样的点组成。 通过收缩或拉伸该网格,研究可以在保持相对空间结构和接触关系的前提下,将人类动作映射到机器人上。 在交互网格的构建过程中,研究人员对用户定义的关键关节位置以及随机采样的物体和环境点应用德劳内四面体化(Delaunay tetrahedralization)。 (注:为了更精确地保持接触关系,物体和环境表面的采样密度高于身体关节的采样密度。) 研究通过最小化源动作(人类示范关键点及对象/环境采样点)与目标动作(机器人对应关键点及相同对象/环境点)之间的拉普拉斯形变能(Laplacian deformation energy),让机器人动作尽量保持与人类示范一致的空间和接触关系。 拉普拉斯坐标衡量每个关键点与其邻居点之间的相对关系,从而在重定向动作时保留局部空间结构和接触关系。 在每个时间帧,算法通过求解约束非凸优化问题来获得机器人配置,包括浮动底座的姿态和平移以及所有关节角度,同时满足碰撞避免、关节和速度限制,以及防止支撑脚滑动等硬约束。 优化则使用顺序二次规划风格的迭代方法,每帧以上一帧的最优解作为初值,以保证时间上的连续性和平滑性。 由此,基于交互网格的方法可适配不同机器人形态和多种交互类型,只需调整交互网格中的关键点对应关系和碰撞模型。 其次,每一次空间和形状的增强都被视为一个新的优化问题,从而生成多样化的轨迹。 具体来说,OmniRetarget通过参数化地改变物体配置、形状或地形特征,将单个人类演示转化为丰富多样的数据集。 对于每个新场景,研究都会使用固定的源动作集和增强后的目标动作集重新求解优化问题:通过最小化交互网格的形变,可以得到一组新的、运动学上有效的机器人动作,同时保留原始交互中的基本空间结构和接触关系。 在机器人-物体的交互中,研究通过增强物体的空间位置和形状来生成多样化的交互(位姿和平移进行增强,并在局部坐标系中构建交互网格)。 为避免整个机器人随物体发生简单刚体变换,研究还在优化中加入约束,将下半身固定到标称轨迹,同时允许上半身探索新的协调方式,从而生成真正多样化的交互动作。 在机器人-地形的交互中,研究通过改变平台的高度和深度,并引入额外约束来生成多样化的地形场景。 最后,在建立了高质量运动学参考的方法之后,研究使用强化学习来弥补动力学差异,即训练一个低层策略,将这些轨迹转化为物理可实现的动作,实现从仿真到硬件的零次迁移。 得益于干净且保留交互的参考数据,OmniRetarget仅需最小化奖励即可高保真跟踪,无需繁琐调参。 训练时,机器人无法直接感知明确的场景和物体信息,仅依赖本体感知和参考轨迹作为复杂任务的先验知识: 参考动作: 参考关节位置/速度,参考骨盆位置/方向误差 本体感受 : 骨盆线速度/角速度,关节位置/速度 先前动作: 上一时间步的策略动作 在奖励方面,研究使用五类奖励(身体跟踪、物体跟踪、动作速率、软关节限制、自碰撞)来保证动作质量,同时结合物体参数和机器人状态的领域随机化提升泛化能力。 此外,相似动作会分组训练以加快策略收敛,不同的任务(如搬箱和平台攀爬)则采用不同策略设置。 实验结论 在实验方面,研究团队首先展示了OmniRetarget能实现的复杂行为的广度,包括自然的物体操作和地形交互。 然后提供了针对最先进基线的定量基准测试,评估了在运动学质量指标和下游策略性能方面的表现。 正如我们开头所展示的,搭载OmniRetarget的宇树G1实现了一个类似波士顿动力的跑酷动作。 这个持续 30 秒、复杂的多阶段任务突显了OmniRetarget生成精确且通用参考动作的能力。 在可扩展性上,OmniRetarget在完整增强数据集上训练和评估成功率为79.1%,与仅使用标称动作的82.2%相近,说明运动学增强在不显著降低性能的情况下实质性扩大了动作覆盖范围。 最后,研究团队将OmniRetarget与PHC、GMR和VideoMimic等开源重定向基线进行了比较。 (注:实验使用OMOMO、内部MoCap和LAFAN1数据集进行评估) 实验结果显示,在运动学质量上,OmniRetarget在穿透、脚部打滑和接触保留指标上整体优于所有基线,即使偶尔轻微穿透也能被 RL 修复。 下游强化学习策略评估表明,高质量重定向动作直接提升策略成功率,OmniRetarget在所有任务中均领先基线 10% 以上,且表现更稳定。 One more thing 值得一提的是,OmniRetarget背后的Amazon FAR (Frontier AI & Robotics)成立仅七个多月,由华人学者领衔。 FAR的前身是著名机器人技术公司Covariant,创始人均为出自UCBerkeley的Pieter Abbeel、Peter Chen、Rocky Duan 和Tianhao Zhang。 (注:Pieter Abbeel是Rocky Duan和Tianhao Zhang的导师) 其中,Pieter Abbeel可谓是机器人领域的大佬,他是伯克利机器人学习实验室(Berkeley Robot Learning Lab)主任以及伯克利人工智能研究实验室(Berkeley AI Research, BAIR)的联合主任。 早在去年8月,亚马逊就与Covariant达成协议,获得该公司技术的“非排他性”许可,聘用Covariant四分之一的员工,同时Covariant的创始人Pieter Abbeel、Peter Chen、和Rocky Duan也将加入亚马逊。 目前,由Rocky Duan担任Amazon FAR研究负责人。 而OmniRetarget这次令人惊艳的亮相,正是Amazon FAR 在人形机器人(足式)领域的首次尝试。 不得不说,亚马逊(Amazon)的机器人,真的有点惊艳(Amazing)。 已经开始期待他们之后的工作了! 参考链接: [1]https://x.com/Thom_Wolf/status/1974774416815857779 [2]https://www.aboutamazon.com/news/company-news/amazon-covariant-ai-robots [3]https://analyticsindiamag.com/ai-news-updates/amazon-forms-frontier-ai-robotics-team-to-revolutionise-automation/ [4]https://OmniRetarget.github.io/
OpenAI前瞻ChatGPT终极形态:迈步“App Store”时代,搭积木式创建AI智能体
IT之家 10 月 7 日消息,科技媒体 The Decoder 昨日(10 月 6 日)发布博文,报道称在 OpenAI 2025 开发者日上,该公司首席执行官山姆・奥尔特曼(Sam Altman)宣布多项重大更新,推动 ChatGPT 从一个聊天工具向集应用与 AI 智能体于一体的综合性平台转型。 IT之家援引博文介绍,本次活动时长约 50 分钟,奥尔特曼主要介绍了以下 4 个新开发者工具: Apps SDK(应用软件开发工具包):一套由 OpenAI 提供的工具,让软件开发者可以像开发手机 App 一样,为 ChatGPT 创建功能丰富的内嵌应用。用户可以直接在聊天中使用这些应用,而无需跳转到其他网站。 AgentKit(智能体开发套件):OpenAI 推出的另一套工具,专门用于创建“AI 智能体”(AI Agent)。这种智能体可以像一个聪明的助手一样,自主理解用户需求并完成一系列复杂任务,而 AgentKit 提供的可视化界面让这个创建过程变得像搭积木一样简单。 Codex 编程助手正式上线:新版本增强了团队协作能力,增加了 Slack 集成与用于自定义工作流的 SDK。 扩展 API:GPT-5 Pro、gpt-realtime-mini 和 Sora 2 现已加入 API。 一、Apps SDK:ChatGPT 平台化,原生应用取代插件 OpenAI 在本次活动中推出全新的 Apps SDK(应用软件开发工具包),目标推动 ChatGPT 从一个聊天工具向一个成熟的第三方应用平台转型。 开发者利用该 SDK,可以直接在 ChatGPT 内部构建功能丰富的交互式应用,支持全屏模式、用户登录和支付协议。这意味着用户无需离开聊天界面,即可调用 Canva 设计海报、通过 Zillow 查找房产或使用 Spotify 播放音乐。 首批上线的应用包括 Booking.com、Canva、Expedia 等,预示着功能更集成、体验更无缝的原生应用将取代过去功能单一的插件。 二、AgentKit:可视化工具让人人都能构建 AI 智能体 OpenAI 推出了用于构建自主 AI 智能体的工具套件 AgentKit。其核心是 Agent Builder,一个可视化的拖拽式工具,允许开发者像搭建流程图一样组合工作流,快速创建、部署和优化能够自主执行复杂任务的智能体。 在现场演示中,一个推荐会议日程的智能体仅用八分钟便构建完成并发布。该套件还包含用于测试的 Evals 和管理数据接入的 Connector Registry 等组件,并内置了安全护栏,旨在大幅降低 AI 智能体的开发门槛。 三、Codex 正式上线,用户数据再创新高 在本次活动中,OpenAI 宣布其编程助手 Codex 正式上线(GA)。自 5 月推出云端智能体以来,Codex 的使用量增长了十倍。新版本增强了团队协作能力,增加了 Slack 集成与用于自定义工作流的 SDK。 OpenAI 公布了最新的运营数据:ChatGPT 的周活跃用户已超过 8 亿,平台开发者数量突破 400 万,API 流量更是达到了每分钟 60 亿 Token 的惊人水平。 四、API 模型矩阵更新:GPT-5 Pro 与 Sora 2 正式开放 OpenAI 开放了其迄今最先进的语言模型 GPT-5 Pro 的 API 接口,该模型专为处理复杂任务设计,支持文本和图像输入,并拥有高达 40 万 Token 的上下文窗口。同时,备受关注的文生视频模型 Sora 2 也已通过 API 提供。 为了满足不同场景的需求,OpenAI 还推出了两款高性价比模型:gpt-realtime-mini,比前代实时 API 便宜约 70%;以及 gpt-image-1-mini,将图像处理成本降低了约 80%,助力开发者以更低成本扩展应用规模。
AMD与OpenAI达成重磅合作:股价暴涨24% 市值增加4500亿
奥特曼与苏姿丰 凤凰网科技讯 北京时间10月7日,据彭博社报道,AMD与OpenAI周一达成了一项重磅协议,共同建设AI基础设施,这为该芯片制造商提供了一个机会,展示其有能力在AI计算领域向英伟达发起挑战。 在这项合作宣布后,AMD股价一度暴涨38%,创下近十年来的最大涨幅。截至周一收盘,AMD股价飙升24%,至203.71美元,市值增加了634亿美元(约合4514亿元人民币),达到3306亿美元,超过了可口可乐、通用电气和雪佛龙。 根据协议,OpenAI将在数年内部署相当于6吉瓦算力的AMD图形处理器(GPU),这一规模略超过其近期与英伟达达成协议的一半。该协议还为OpenAI收购AMD的大量股份铺平了道路。协议规定,OpenAI将有权以每股1美分的价格购买多达1.6亿股AMD股票,前提是合作项目达到特定里程碑。这相当于AMD已发行股份的约10%。 AMD股价暴涨24% AMD CEO苏姿丰在接受彭博电视采访时表示:“这无疑是我们迄今公布的最大规模芯片部署。我们正启动一项大规模扩建计划,这对我们、对股东以及对团队来说都是一件大事。” 这项交易对AMD而言是一场高风险的考验。它有望为公司带来数百亿美元的新收入,并提升AMD作为AI技术重要竞争者的地位。但是,这同时也存在风险:这将使AMD的前景更加依赖于一个被一些人担忧可能正处于泡沫中的AI市场。 这项协议是OpenAI最新的一笔大型数据中心合作。随着这家AI创业公司持续扩充算力规模,科技行业正押注一个前所未有的趋势:对高能耗AI工具的旺盛需求将持续不减。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
新品发布前兆?苹果美国商店iPad Pro与MacBook Pro库存告急
IT之家 10 月 7 日消息,彭博社的马克・古尔曼(Mark Gurman)今天(10 月 7 日)在 X 平台发布推文,观察发现苹果官网多款产品的库存正持续减少,这通常是硬件更新的前兆,预计苹果将在本月晚些时候发布新款 iPad 和 Mac 电脑。 具体来看,M4 iPad Pro 的缺货情况尤为明显。消费者在苹果美国官网选购时会发现,根据配置不同,部分型号的预计交付时间最长已达到三周。 与此同时,M4 MacBook Pro 产品线也出现了类似迹象,虽然 Pro / Max 和 16 英寸型号供应充足,但基础款 14 英寸型号的定制配置订单已积压,发货时间被推迟至十月底。 然而,并非所有产品都受到影响。此前有报道称将获得小幅规格提升的 Apple Vision Pro,其目前的库存状态基本保持稳定,未出现供应紧张,可能意味着其更新优先级较低或已完成备货。 IT之家注:至于新品的发布形式,苹果近年来交替采用举办线下发布会和直接线上发布新闻稿的方式,目前尚无确切消息表明此次将采用何种形式。 综合来看,当前 iPad Pro 和 MacBook Pro 的库存变化,强烈预示着苹果的新一轮产品发布已蓄势待发。除了这两大核心产品线,市场还普遍预期苹果将在今年年底前推出另外几款配件和家居设备,包括 AirTag 2、搭载 A17 Pro 芯片的新款 Apple TV 4K,以及 HomePod mini 2,共同构成苹果年底的产品阵容。
刚刚,奥特曼官宣ChatGPT“终极OS入口”!8分钟速搭智能体,8亿人狂欢
编辑:桃子 定慧 OpenAI 2025开发者日上,全场座无虚席。奥特曼重磅官宣四大更新:首发Apps SDK要把ChatGPT打造为「操作系统终极入口」,一键拖拽构建智能体AgentKit,无代码Codex开发,以及Sora 2等三大API登场。OpenAI的野心,彻底藏不住了。 一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发 OpenAI 2025开发者日,奥特曼的精彩演讲引爆全场! 现场,50分钟发布会,奥特曼重磅官宣了四项重大更新: Apps SDK:与外部应用无缝集成,OpenAI最大野心——把ChatGPT打造成未来的操作系统; AgentKit:无需编码,拖放搭建智能体。人人都可快速开发智能体,还能评估智能体能力; Codex全面可用:不写一行代码,打造爆款APP; API更新:三大API更新,Sora 2 API同步上线。 最最重磅的,还是Apps SDK,所有人皆可在ChatGPT中构建原生应用,其意义堪比2023年首发的GPTs。 这预示着,ChatGPT又将成为一个新时代的「APP Store」! 正如爆料所言,AgentBuilder让智能体构建变得像搭积木一样简单直观。现场,仅用8分钟拖拽,便一键完成了完整Agent的搭建。 自从2023年11月首届开发日以来,短短两年,OpenAI开发者规模已经从200万增长到400万,翻了1倍! ChatGPT周活也从1亿暴增超8亿,翻了8倍! 现在,OpenAI API每分钟都有近60亿token产生,相比此前的3亿token,翻了20倍! 这些里程碑的数字不仅代表增长,更意味着AI正在成为新的技术基础设施。 OpenAI未来的野心,全部藏在了这场发布会的四大核心发布中。 ChatGPT,下一代「操作系统」 首先,奥特曼带来首个重磅发布叫做——Apps SDK。 意味着你可以在ChatGPT直接调用其他APP。借助Apps SDK,ChatGPT可以集成各种应用。 这个功能完全反映了OpenAI的野心! 奥特曼想把ChatGPT打造成未来的操作系统。 现在我们的应用都是运行在MacOS、Windows、Linux等操作系统上。 未来,ChatGPT将成为更上级的「操作系统」,即使是专业APP,都可以直接「运行」在ChatGPT里。 ChatGPT的目标是成为「操作系统级」的入口,而不仅仅是一个「应用」! OpenAI的应用CEO Fidji Simo盛赞这个功能将「无法想象」,非常期待开发者打造的应用。 奥特曼想把ChatGPT变成每个人的「默认界面」,就像曾经Windows桌面是每个人的「默认界面」一样。 目前公布支持的APP包括:Booking.com、Canva、coursera、Expedia、Figma、Spotify和Zillow。 OpenAI的软件工程师Alexi现场展示了如何在ChatGPT直接调用这些外部应用。 比如只需要输入「Coursera」,ChatGPT就能自动识别并调用Coursera的功能。 可以直接在ChatGPT中要求「Canva」制作海报,而不需要额外跳转。 类似的,可以直接在ChatGPT中使用Zillow查询周边房价,并使用Zillow的UI来直接呈现。 奥特曼承诺,更多应用即将上线。 一键拖拽,8分钟搭一个Agent 第二个全新的功能就是此前剧透的可视化智能体构建平台。 新功能名为AgentKit,是面向开发者和企业的一整套构建、部署和优化智能体的工具。 AgentKit包含三个工具: Agent Builder:可视化画布 Connector Registry:管理数据和工具如何连接 ChatKit: 嵌入定制聊天界面的工具包 Agent Builder是一个全新的可视化拖拽平台,AI智能体的构建流程就像搭积木一样简单! ChatKit可以生成各种各样的聊天工具,提供独一无二的Chat体验。 此外,OpenAI这次还提供了评估智能体能力的Eval指标。 通过四个方面,数据集、跟踪评分、自动化提示和第三方模型支持,来评估新建智能体的能力。 关于如何定义Agents,什么是智能体的定义,奥特曼在这次大会也给出了一个答案: 「能够为你工作的系统」都可以称为智能体,Agents! 奥特曼现场展示了Albertsons如何构建智能体来分析销量。 比如,可以直接让ChatGPT出一个提高冰激淋销量的方案。 OpenAI平台体验部门的Christina Huang现场直播展示了,如何只用8分钟就构建一个完整的智能体! 使用Agent Builder无需写任何一行代码,全程只需要拖拽和参数配置。 现在Agent Builder功能已经在OpenAI Platform网站上线。 简单体验了下,构建过程非常的丝滑。 进入开发者平台,点击左侧的「Agent Builder」即可使用。 构建后,点击右上角Evaluate即可开始对新建智能体的评估。 不写一行代码,打造爆款APP 除了ChatGPT原生应用和智能体,AI在软件开发上,已带来颠覆性的变革。 谁曾想,如今,OpenAI内部每周70%的PR都由Codex完成。 就比如,在Codex加持下,拖放搭建智能体工具从0开发仅用6周完成。 奥特曼称,我们正进入一个全新时代,任何有想法的人,都能为自己、家人、社区构建一款应用。 在此,他举了几个鲜活的、发生在每个人身边的案例—— 一位89岁退休日本老人,用ChatGPT自学编程为老年用户开发了11款iPhone应用;西班牙的一位老人和流媒体成员,借助ChatGPT、Sora等,帮人们重拾记忆; 在ASU医学院,基于ChatGPT搭建的虚拟患者应用,帮助学习模拟练习如何和患者沟通;还有在法国凡尔赛宫,官方基于Realtime API打造的一款APP,让游客与艺术品和雕塑进行实时对话。 重点来了,今天起OpenAI Codex结束预览,正式进入通用可用阶段。 自今年初首次发布,到GPT-5 Codex的迭代后,Codex的每日消息量增长10倍,自发布处理了超40万亿token。 这一次,新增功能包括:Slack集成、Codex SDK、企业控制。 目前,思科在内部部署Codex后,代码审查速度提升50%,项目平均周期从数周缩短至数天。 现场,OpenAI开发者负责人Romain Huet带来了「舞台灯光控制器」的实时互动演示。 设计原型非常简单,一个控制面板——左侧是摄像头画面,右侧排列操作按钮。 全程无需手写一行代码,Codex快速生成一个功能齐全的界面。 「如何在Node.js中控制索尼FR7相机?」 面对C++ SDK的复杂性,Codex提出了更加优雅的解决方案——基于VISC协议集成控制功能。 几分钟内,Codex不仅生成了Node服务器代码,还解析了相机所需的UDP数据包,甚至发现了特定型号相机所需的特殊头部信息。 仅仅用按钮控制相机还不够,下一步,让Xbox无线手柄实现相机控制。 通过Codex IDE扩展发送指令,Codex便会迅速制定计划、分析文件,自动识别Xbox的输入逻辑,并将摇杆映射为控制的最佳方式。 运行服务器,现场摄像头画面屏幕闪现,台下所有人挥手打招呼。 更令人兴奋的是,它还集成了语音交互功能。 通过Codex的Realtime API和智能体语音,可以将自然语言引入这款应用。 只需说一句,「将灯光聚焦到观众席」,Codex便通过MCP服务器控制会场灯光系统,瞬间点亮观众席。 最后,Romain还用Codex SDK拍了一张全体照片,实现了一个「电影式结尾」——演职员表,将现场所有参会者的名字动态呈现。 这一切,全部通过语音指令完成。 Codex GA(General Availability)开放,标志着软件工程未来全新可能。 奥特曼现场表示,「它将最复杂的编码难题简化为自然语言指令,唯一的限制就是你的想象力」。 三大API,Sora 2也上线了 最后,奥特曼带来了三大API——GPT-5 Pro、gpt-realtime-mini、Sora 2。 开发者们可以抢先一步,享用最强GPT-5 Pro智能,其在指令遵循方面能力大幅提升,体验更优。 在处理那些高精度、深度推理复杂任务,GPT-5 Pro更拿手,尤其是在金融、法律、医疗保健等众多行业。 如今,OpenAI API即可支持GPT-5 Pro的调用。 它的训练截止时间是2024年9月30日,400k上下文窗口,最大支持272k token输出。 输入价格:15美元/百万token,输出价格:120美元/百万token。目前支持文本、图像输入,仅文本输出。 最新的API定价,再次刷新了价格天花板。 GPT-5 Pro输入价格是GPT-5 15倍,输出价格是GPT-5 12倍。 同时,OpenAI还在API中发布了一款语音模型——gpt-realtime-mini。 这是两个月前高级语音模型的缩小版,成本降低了70%,但语音质量和性能保持不变。 奥特曼称,「就我个人而言,我认为语音将成为人们与 AI 交互的主要方式之一。而这次发布正是迈向这一现实的一大步」。 值得一提的是,几天前刚刚上线的Sora 2,预览版的API也正式上线。 视频长度、宽高比、分辨率,全程可控。 这意味着,任何一款APP直接可以用Sora API,生成出令人惊叹的视频。 可控性,是Sora 2最大的优势。比如,拍摄iPhone视图,Sora即可扩展成一个全景电影宽镜头。 首次实现音画同步,Sora 2直出背景、环境音效。 甚至,人们还可以将现实世界的片段融入Sora。比如,将自家狗照片上传,就可以瞬间为它造出「赛博狗友」。 在电商广告中,Sora 2还可以做概念开发。 一个用户案例是,OpenAI联手MATTEL,将创意师的产品创意瞬间变为现实。 演讲的最后,奥特曼激动表示,「我们正见证一个前所未有的时代」。 曾几何时,开发一款软件需要数月,甚至数年的周期。 而今天,有了AI,一个想法可以在几分钟内落地成型。 开发者不再需要一个庞大的团队,只需一个好的创意,就能超越以往的速度,将灵感变为现实。 我们的愿景,是让AI真正为每一个人所用。 而这个愿景,离不开你们每一个人的参与。
突发!OpenAI入股AMD,签百亿订单,AMD股价飙升35%
作者 | ZeR0 编辑 | 漠影 智东西10月6日报道,刚刚,OpenAI和AMD宣布合作,OpenAI将根据多年、多代协议部署60亿瓦AMD GPU,并将于2026年下半年开始部署AMD InstinctMI450系列GPU,初始部署功率为10亿瓦。 OpenAI前脚刚跟英伟达达成协议,获得英伟达1000亿美元的巨额投资,后脚又跟英伟达在GPU和AI芯片领域的主要竞争对手AMD达成协议——通过收购AMD最多1.6亿股股票,OpenAI足以持有AMD约10%的股份。 AMD执行副总裁、首席财务官兼财务主管Jean Hu称:“我们与OpenAI的合作预计将为AMD带来数百亿美元的收入,同时加速OpenAI的AI基础设施建设。这项协议将为AMD和OpenAI带来重要的战略协同和股东价值,预计将大幅提升AMD的非公认会计准则每股收益。” 据外媒报道,由于该协议的连锁反应,AMD预计四年内将从OpenAI和其他客户那里获得超过1000亿美元的新收入。 美东时间周一早上盘前交易中,AMD股价飙升超过35%,英伟达、博通股价均下跌超过1%。 AMD最新市值为2672亿美元(约合人民币1.9万亿元),OpenAI最新估值为5000亿美元(约合人民币3.56万亿元)。 作为协议的一部分,为了进一步协调战略利益,AMD已向OpenAI发行了最多1.6亿股AMD普通股的认股权证,该认股权证将在实现特定里程碑时授予。 首批认股权证将在初始10亿瓦部署时授予,后续认股权证将随着采购规模扩大至60亿瓦而授予。 此外,授予还与AMD实现特定股价目标以及OpenAI实现AMD大规模部署所需的技术和商业里程碑挂钩。 AMD还可以为OpenAI提供额外资金,帮助其在未来几年内建设新的计算设施。 根据最终协议,OpenAI将作为AMD的核心战略计算合作伙伴,联手推动AMD技术的大规模部署,从AMD Instinct MI450系列和机架式AI解决方案开始,并延伸至未来几代产品。 通过分享技术专长来优化产品路线图,AMD和OpenAI正在深化从MI300X开始到MI350X系列的多代软硬件合作。 AMD董事长兼CEO苏姿丰博士谈道:“此次合作将AMD和OpenAI的优势融合在一起,实现真正的双赢,助力实现全球最雄心勃勃的AI建设,并推动整个AI生态系统的发展。” OpenAI联合创始人兼CEO Sam Altman说:“AMD在高性能芯片领域的领导地位将使我们能够加快进展,并更快地将先进AI的优势惠及每个人。” 据外媒报道,Altman在与苏姿丰的联合采访中谈道:“获得足够的计算能力变得多么困难,怎么说都不为过。我们希望它超级快,但这需要一些时间。” 两位CEO称,这笔交易将把两家公司紧密联系在一起,并激励他们致力于AI基础设施的蓬勃发展。 “我更担心我们会因为计算量太少而失败,而不是太多。”OpenAI联合创始人兼总裁Greg Brockman说。 两家公司均未透露该计划的预计总成本,但AMD称每十亿瓦计算能力的成本高达数百亿美元。 OpenAI与AMD达成的协议,是科技公司斥资数千亿美元建设新数据中心大潮的一个缩影。 据外媒报道,OpenAI、亚马逊、谷歌、Meta、微软等科技巨头计划仅在今年年底前在这些设施上投入超过3250亿美元(约合人民币2.31万亿元)。 马斯克的AI公司xAI将至少再花费180亿美元(约合人民币1282亿元)为其在孟菲斯数据中心项目再采购大约30万张英伟达芯片。 这些公司在芯片、数据中心和电力方面的投入,规模大到甚至超过了19世纪的铁路热潮,以及现代电网和光纤网络的建设,也加剧了人们对AI基础设施泡沫的担忧。 英伟达将于明年发布备受期待的Vera Rubin芯片,并承诺其性能将是当前一代Grace Blackwell芯片的2倍以上。瑞穗证券估计,英伟达控制着超过70%的AI芯片市场,其用于AI数据中心的最强大的组合芯片每颗售价可达6万美元(约合人民币43万元)。 英伟达仍然是AI公司首选的芯片供应商,但它也面临着愈发激烈的竞争。许多云计算巨头都在设计专用AI芯片,OpenAI最近与博通签署了一项价值100亿美元(约合人民币712亿元)的协议,以打造自研AI芯片。 今年9月,英伟达宣布将在未来十年向OpenAI投资1000亿美元(约合人民币7120亿元)。根据协议,OpenAI计划利用英伟达的资金购买英伟达的芯片,并在AI数据中心部署高达100亿瓦的计算能力。两家公司已签署意向书,但尚未在监管文件中披露具体条款。 OpenAI最近还与甲骨文签署了一项价值3000亿美元(约合人民币2.14万亿元)的巨额交易,将在五年内再购买45亿瓦的云计算能力。 目前尚不清楚OpenAI将如何支付其承诺的上千亿美元的基础设施投资。 据外媒报道,OpenAI近期告知投资者,今年仅租用计算服务器的费用就可能达到约160亿美元(约合人民币1139亿元),到2029年,这一数字可能会上升到4000亿美元(约合人民币2.85万亿元)。 OpenAI今年有望创造130亿美元(约合人民币926亿元)的营收。Altman透露,OpenAI将更加专注于能够利用其工具完成的盈利任务。
苹果iOS/iPadOS 26.1开发者预览版Beta 2发布:Slide Over多任务处理回归
苹果iOS/iPadOS 26.1开发者预览版Beta 2发布:闹钟新手势防误关、Slide Over多任务处理回归 IT之家 10 月 7 日消息,苹果今日向 iPhone 和 iPad 用户推送了 iOS / iPadOS 26.1 开发者预览版 Beta 2 更新(内部版本号:23B5059e),本次更新距离上次发布 Beta / RC 间隔 11 天。 IT之家查询公开资料,iOS / iPadOS 26.1 Beta 2 更新聚焦提升用户体验,进一步优化功能与调整界面,甚至撤销了此前的一些改动。 本次更新最值得关注的改进之一,就是优化闹钟与计时器。为了防止用户在睡眼惺忪时意外关闭闹钟,新版本用一个全新的“滑动以停止”手势取代了原有的“停止”按钮,降低了误触的概率。 针对 iPad 用户,iPadOS 26.1 Beta 2 带回了一项重要功能:Slide Over 多任务处理。该功能曾在 iPadOS 26 的大改版中被移除。 不过,新回归的 Slide Over 功能目前仅支持单个应用浮窗,而非此前的应用堆栈模式,但它依然能让用户轻松地将一个额外应用悬浮于工作区之上。 在专业功能方面,新版本也为内容创作者提供了便利。如果用户连接了外部麦克风,现在无需再借助第三方应用,可以直接通过控制中心的输入面板来调整“输入增益”。同时,系统还新增了自定义选项,允许用户自行设定本地音频录音文件的存储位置,提升了音频工作的灵活性。 本次更新还包含多项界面(UI)优化和调整。例如,应用文件夹的标题和“设置”应用内的标题头现在均改为左对齐。Apple Vision Pro 的应用图标也更新为一个 3D 模型,外界猜测这可能是在为 Vision Pro 2 的发布做准备。 苹果还撤销了 Beta 1 中的两项改动: 日历事件的颜色显示恢复为 iOS 26 的原始设计 iPad 端 Safari 浏览器的下载菜单也重新整合回地址栏。
相差2000元,小米17、小米17 Pro和小米17 Pro Max怎么选?
小米17系列于9月27日开售,销量表现十分亮眼。根据网上的猜测,开售仅5分钟,销量就突破80万台,销售额突破20亿,刷新2025年国产手机全价位段首销纪录。其中,小米17 Pro Max销量占比超50%,单款机型也打破今年国产手机全价位段首销纪录。三款机型在配置、功能和价格上存在差异,让不少消费者在选择时犯了难。下面,我们就从多个维度来分析这三款机型,帮助大家找到最适合自己的那一款。 1 性能:旗舰级体验,差异微乎其微 原神帧数 性能方面,三款机型都搭载了第五代骁龙8至尊版处理器,这是目前安卓阵营顶尖的芯片之一,无论是日常使用、多任务处理,还是大型游戏运行,都能提供流畅、强劲的性能表现。 存储组合上,均有12/16GBLPDDR5X + 256/512GB/1TB UFS 4.1的配置可选(小米17 Pro Max12GB版本起步存储为512GB),这样的存储规格也能很好地满足不同用户对内存和存储空间的需求。所以在性能核心层面,三款手机几乎没有差别,都能带来旗舰级的使用体验。 2 屏幕:尺寸与功能的进阶 小米17配备的是6.3英寸华星光电M10直屏,分辨率为2656x1220,峰值亮度3500nit,最低亮度1nit,支持1- 120Hz LTPO自适应刷新率、2160Hz高频调光+DC类调光,采用小米龙晶玻璃,显示效果出色,且兼顾了功耗控制。 小米17 Pro同样是6.3英寸华星光电M10直屏,参数与小米17基本一致,但额外配备了一块2.66英寸的背屏,可用于显示时间、通知等信息,甚至能进行一些简单的操作,增加了使用的趣味性和便捷性。 小米17Pro Max则升级为6.9英寸华星光电M10直屏,分辨率达到2608x1200,拥有超级像素(独占),视觉效果更加震撼,同时也配备了一块3.02.86英寸的背屏,尺寸更大,能展示的内容更多。对于喜欢大屏观影、游戏,或者希望背屏有更多玩法的用户,Pro和ProMax的双屏设计以及ProMax更大的主屏会更具吸引力。 3 续航与充电:大电池+ 快充,满足不同需求 电池和充电方面,小米17内置7000mAh金沙江电池,小米17Pro为6300mAh,小米17Pro Max则是7500mAh。充电均支持100W有线+50W无线,且都支持100WPPS通用快充协议。 小米17续航 小米17的大电池能带来更长久的续航时间,适合对续航要求极高,经常外出且不方便充电的用户。小米17Pro Max电池容量更大,续航更优。而小米17Pro的电池容量相对小一些,但也能满足大多数用户的日常使用,且在机身重量上控制得更好(192g),手感更轻盈。 4 影像:从实用到专业的跨越 后置主摄上,三款机型均为50MP,但传感器有所不同,小米17是光影猎人950,小米17Pro和ProMax则是光影猎人950L,ProMax的主摄传感器尺寸更大(1/1.28英寸),进光量更足,在夜景等场景下表现更优。 后置超广角均为50MP的OV50M,参数一致。 后置长焦是差异较大的部分,小米17为50MP浮动长焦(三星JN5),小米17Pro是50MP5X浮动潜望长焦(三星JN5),小米17ProMax则升级为50MP5X超聚光潜望长焦(GN8),且传感器尺寸更大(1/2英寸),光圈更大(f/2.6),还支持OIS光学防抖,在长焦拍摄的画质、防抖以及变焦能力上,ProMax优势明显,适合喜欢拍摄远处景物、对长焦画质要求高的用户,Pro的长焦也能满足一定的长焦需求,而小米17的长焦则相对基础一些。 前置均为50MP,满足日常自拍需求。 5 机身与其他:手感、特色功能的权衡 机身尺寸上,小米17为151.1x71.8x8.06mm,重191g;小米17Pro是151.1x71.8x8.0mm,重192g;小米17Pro Max为162.9x77.6x8.0mm,重219g。小米17和Pro手感较为轻盈,握持舒适,而ProMax由于尺寸和重量较大,握持感会稍差一些,但大屏带来的视觉体验也更出色。 配色方面,小米17有雪山粉、冰融蓝、白色;Pro和ProMax有冷烟紫、森野绿、白色,大家可根据自己的审美喜好选择。 其他方面,三款机型都支持NFC、Wi- Fi 7、蓝牙5.4、红外,解锁方式均为3D超声波指纹,防尘防水等级都是IP66+ IP68 +IP69。此外,都配备了立体双扬、X轴线性马达、立体环形冷泵散热系统、小米澎湃P3智能快充芯片、小米澎湃G1电池管理芯片、小米澎湃T1+ T1信号增强芯片,保证了出色的音频、振动、散热、快充、电池管理和信号表现。不过,Pro和Pro Max还支持USB3.2 Gen1 UWB超宽带互联技术,在设备互联等场景下更具优势。 6 价格:根据预算和需求选择 小米17:12GB+ 256GB 4499元,12GB+ 512GB 4799元,16GB+ 512GB 4999元。 小米17Pro:12GB+ 256GB 4999元,12GB+ 512GB 5299元,16GB+ 512GB 5599元,16GB+ 1TB 5999元。 小米17Pro Max:12GB+ 512GB 5999元,16GB+ 512GB 6299元,16GB+ 1TB 6999元。选购建议 预算有限,追求均衡实用:选择小米17。它在性能、屏幕、续航、影像等方面都达到了旗舰水准,能满足大多数用户的日常使用需求,且价格相对亲民,是三款中性价比很高的选择。 喜欢双屏设计,注重一定拓展性:选择小米17 Pro。其背屏增加了使用的趣味性和便捷性,长焦也能满足一些长焦拍摄需求,整体配置均衡,价格比Pro Max低不少。 追求顶级影像、大屏体验和极致续航:选择小米17 Pro Max。它的大尺寸屏幕、更强的长焦镜头、更大的电池容量,以及UWB超宽带互联技术等,都能带来更顶级、更专业的使用体验,适合预算充足,对手机各方面都有较高要求的用户。 总之,三款机型各有特色,大家可根据自己的预算、使用需求和偏好来做出选择。
OpenAI开发者日:ChatGPT应用生态亮相 直面8亿用户新蓝海
财联社10月7日讯(编辑 史正丞)随着周一的OpenAI发布会结束,一个崭新的问题摆在全球软件开发团队面前:是否要把自家服务直接接入用户数量猛增的AI聊天机器人? 作为背景,OpenAI在周一的开发者日上宣布ChatGPT开始内置第三方应用程序,开发者即日开始可以使用新版Apps SDK来构建这些应用。奥尔特曼也在发布会伊始透露,目前ChatGPT周活跃用户数已达8亿,而这个数字上个月才刚突破7亿。 简单来讲,此举将ChatGPT升格为系统平台,让应用开发者直接接入他们的服务。 首批“吃螃蟹”的平台——出行预订平台缤客网和Expedia、设计网站Canva和Figma、网络教育平台Coursera、音乐流媒体应用Spotify和房产交易平台 Zillow已经上线ChatGPT,向其服务覆盖的市场提供服务。 据OpenAI介绍,目前有两种情况可以在ChatGPT中调出第三方应用。 首先是直接在发给ChatGPT的信息中明确要求使用某个应用,例如要求Spotify给出“我喜欢的歌手最新推出的、我还没听过的歌单”。 或上传一段提纲,让Canva制作PPT。 也可以在ChatGPT内播放Coursera的网课,甚至可以让AI解释精确到某个时间节点的授课内容。 相较而言,在Expedia上订个机票,对于AI简直就是小菜一碟。 OpenAI透露,ChatGPT也会在聊天中主动推荐相关的应用。例如讨论买房话题时,ChatGPT可能会推荐Zillow应用,直接在AI聊天机器人内部展开交互式地图上,展现符合预算的房源列表。 奥尔特曼也在周一宣布,可汗学院、DoorDash、优步、塔吉特等11家公司也将在今年晚些时候接入ChatGPT。公司也将在今年晚些时候开始接受开发者提交应用以供审核和发布,并将分享更多开发者如何获利的信息。 奥尔特曼表示:“我们希望ChatGPT成为人们提升效率、激发创意、加速学习、优化生活各领域事务的卓越工具。(ChatGPT内置应用)将催生新一代可对话的交互式、自适应且个性化的应用程序。” 这一动态也是OpenAI打造开发者生态的最新尝试。ChatGPT已经推出GPT商店,但需要用户主动访问商店获取。周一发布的更新直接整合进ChatGPT的回复中,将为开发者带来应用分发渠道的新蓝海,也能为用户提供更加专业的服务。 OpenAI透露,如果用户已经订阅了某些应用的服务,他们也能够在ChatGPT内直接登陆账号来使用特定付费功能。通过ChatGPT刚推出的即时结账功能,OpenAI也将支持开发者在ChatGPT内变现。 其他更新速览 AgentKit:一套完整工具集,帮助开发者和企业构建、部署与优化智能体。包括可视化智能体构建器Agent Builder、对话工具包ChatKit,以及多项智能体评估功能。 Codex自动化编程智能体正式开放通用访问权限。 API更新:面向金融、法律等需要“高准确性和深度推理能力”应用的GPT-5 Pro、近期大火的Sora 2,以及更便宜但“质量与表现力相当”的语音模型gpt-realtime mini正式向开发者推出。
OpenAI苹果化:ChatGPT就是iOS,几分钟造出的Agent要代替App
作者|周一笑 邮箱|zhouyixiao@pingwest.com 当地时间10月6日,OpenAI在旧金山举办DevDay 2025开发者大会。在大会正式开场前5小时,AMD与OpenAI的合作消息公布,OpenAI将在未来数年部署高达6GW(千兆瓦)的AMD Instinct GPU。AMD已向OpenAI发行最高1.6亿股认股权证,行权条件与芯片部署进度及股价里程碑挂钩,如果OpenAI全额行权,可能获得AMD约10%的股权,AMD股价一度暴涨30%。 有开发者吐槽“又被资本操作抢戏”,也有人认为这是刻意编排,先讲底层算力,再讲上层工具,恰好符合OpenAI从芯片到模型到应用的一体化叙事。 回到这次DevDay上,OpenAI发布了Apps SDK(在ChatGPT内构建应用的完整框架)、AgentKit(快速构建AI Agent的工具套件)、Codex正式版以及GPT-5系列和Sora2等模型的API。Sam Altman开场公布了一组增长数据,开发者数量从2023年的200万增长到400万,翻了一番。ChatGPT的周活跃用户从1亿飙升至8亿,增长了8倍;API每分钟处理的token量从3亿暴涨到60亿,这是20倍的增长。 8亿周活意味着超级应用,这个体量已经具备了成为平台的基础设施。DevDay中Apps SDK是最值得关注的重点,它标志着ChatGPT更像一个平台和操作系统了。Altman的判断很直接,AI已经从人们玩耍的东西,变成了人们每天构建的东西。这次DevDay的目标,就是让更多开发者能直接在ChatGPT上构建应用和Agent,并且在这个拥有8亿用户的平台上开发和分发。 OpenAI开始苹果化了。 1 Apps SDK:在ChatGPT内做应用 OpenAI曾经尝试过让开发者在ChatGPT上构建应用,那就是2023年推出的GPTs。但GPTs本质上只是Prompt模板,能力有限且生态混乱,已经被OpenAI放弃。去年底Anthropic推出了MCP开放标准,试图为AI应用互操作性提供统一框架,而今天发布的Apps SDK,则是OpenAI基于MCP标准,再次尝试让ChatGPT成为一个应用平台。 Apps SDK是一个完整的开发框架,让开发者能在ChatGPT内部构建真正的交互式应用。开发者可以用TypeScript或JavaScript编写后端逻辑,通过MCP接口连接数据、触发操作,并渲染完全交互式的用户界面。这不是简单的API调用,而是在ChatGPT对话框里运行的“小程序”。 举几个现场演示的例子就能明白它的能力,Coursera应用可以在对话中嵌入视频播放器,用户边看课程边向ChatGPT提问;Zillow能展示可筛选的交互地图,用户说“找带院子的三居室”,地图实时过滤结果;Canva则能直接根据对话生成海报,并把海报转换成完整的PPT。 OpenAI还推出了应用对话(Talking to Apps)机制。Apps SDK提供了一套API,允许第三方应用将内部上下文实时暴露给ChatGPT。当你在Coursera应用里看到视频第5分钟,ChatGPT知道你正在学什么章节,当你在Zillow地图上点开某套房子,ChatGPT能准确理解你关注的是哪个地址、什么价位。深度集成让对话式交互真正有了实用价值。 现场演示中,当演示者说“Spotify,给我周五派对做个歌单”,ChatGPT自动调出Spotify应用,屏幕上显示“使用Spotify生成此答案”的提示,几秒后歌单就出现在对话框里,可以直接点击播放。整个过程流畅自然,就像在iOS上切换App一样。 首批合作应用包括Booking.com、Expedia、Figma、Spotify、Zillow、Canva和Coursera,未来几周还会加入DoorDash、Uber、Target、OpenTable等。Apps SDK今天开放预览版,开发者可以在Developer Mode中测试应用。今年晚些时候,OpenAI将开放正式提交通道,并提供应用目录供用户浏览。 面向Apps SDK开发者的设计规范配图 Altman还透露了商业化计划,Apps SDK未来将支持新的Agentic Commerce Protocol,允许用户直接在ChatGPT内部即时结账。 很多人会问GPTs不是已经失败了吗,Apps SDK会重蹈覆辙吗?GPTs门槛接近零代码,但能力也被局限,回复始终是一条条消息。 Apps SDK则是代码为中心。开发者需要在自己的服务器上编写真正的应用代码,实现MCP服务器接口,声明OAuth 2.0登录和交互式UI组件。ChatGPT只是把App嵌入对话流里,真正的逻辑、状态管理和数据存储都在开发者手中。Apps可以弹出富交互组件(地图、表单、视频播放器)、长时间保持session,并可在后台自行拉取和推送数据。换句话说,GPTs是模板,Apps in ChatGPT是完整的小程序。 GPTs和GPTStore既不像App Store那样标准化,也不像插件那样通用,多数GPT缺乏区别化价值,用户难以形成持续使用习惯,开发者又难以变现、用户难以发现优质内容,最终生态陷入空转。 Apps SDK则完全不同。开发者必须通过实名验证、服务器验证和功能测试才能上架。审核前置,并引入了年龄分级和权限管理,类似App Store的标准。Altman还暗示会有更正式的收入分成方案。 在ChatGPT上,一个新的iOS的雏形就这样长了出来。 1 AgentKit:8分钟造出的Agent Apps SDK构建的是ChatGPT的应用生态,而AgentKit则是OpenAI给开发者提供的Agent开发工具箱。Altman的判断是,AI已经从“你提问的系统”进化到“能为你做很多事情的系统”,也就是Agent。但他也坦言,符合定义的Agent成功落地的很少。 AgentKit是一个完整的工具套件,包含四个核心组件: Agent Builder,这是一个可视化画布平台,让开发者能像使用Canva一样拖拽设计Agent的逻辑、步骤和工作流。它建立在OpenAI的Responses API之上,支持if-else逻辑节点、循环、用户审批节点、文件搜索和数据转换等模块化组件。开发者可以从预设模板开始(如客服机器人、数据增强、文档对比),也可以从零搭建自定义流程。 ChatKit,一个可嵌入的聊天界面组件。开发者可以把这个界面集成到自己的网站或应用中,带来ChatGPT级别的对话体验,同时保留自己的品牌、工作流和产品特色。它能处理流式响应、管理对话线程、显示模型思考过程,让集成聊天UI的复杂工作变得简单。 Connector Registry,一个企业级的连接管理中心。管理员可以通过控制面板统一管理Agent如何连接内部工具和第三方系统,设置权限、监控使用情况,同时保证安全性和合规性。 Agent Evals(评估工具),提供性能测量和优化能力。包括逐步追踪评分(Trace Grading,理解Agent的决策步骤)、评估数据集、自动化提示词优化,以及在OpenAI平台上直接对外部模型运行评估的能力。 在现场OpenAI工程师Christina Huang8分钟的演示中。她从零开始,用Agent Builder构建了一个名为Ask Froge的DevDay网站Agent。快速地将一个静态的会议网站创建一个智能问答助手,以提升用户体验。 她先设置了Agent的基本指令,然后添加了预构建的Guardrails(防护栏)用于PII信息掩码,接着连接了DevDay的日程数据,最后加入了自定义Widget来显示会议时间表。整个过程不到8分钟,Agent就部署到了DevDay官网,观众可以现场访问使用。 企业案例中,零售巨头Albertsons用AgentKit构建了帮门店经理分析销量的Agent,当某个品类销量下降(比如冰淇淋),系统会基于季节性趋势、历史数据和外部因素(天气、节假日)给出诊断和建议。营销软件公司HubSpot则用它改进了Breeze AI客服工具,Agent能整合知识库、查找当地治疗方案和保险政策细节,生成更有针对性的回复。Box、Canva和Evernote也已开始使用该平台。 Altman说这是我们当初造第一个Agent时希望拥有的工具。降低门槛的逻辑很清晰,让更多人能造Agent,OpenAI才能抢占Agent开发生态的制高点。 而这个生态的门槛因为模型能力提升而足够低的时候,app就会被agent们替代。 1 Codex和模型更新 除了应用和Agent,OpenAI还宣布了一系列基础设施更新。 Codex正式可用,OpenAI的软件工程Agent Codex结束研究预览,进入通用可用(GA)阶段。Codex现在运行在专门训练的GPT-5-Codex模型上,这个模型在代码重构和代码审查等Agentic编程任务上表现更出色。自8月初以来,Codex的日均消息量增长了10倍,已处理超过40万亿个token。 过去两三个月里,开发者社区能明显感觉到Codex很火。一方面,OpenAI用GPT-5-Codex把"AI代码这条垂直赛道往前推了一步,在代码质量和推理能力上形成优势,另一方面,Codex提供了价格透明、场景统一、稳定可预期的开发体验。相比之下,不少开发者抱怨Claude Code存在限流、质量波动等问题,甚至有人已经把主要精力转到Codex上。这次正式发布,是OpenAI在代码生成领域持续发力的一步。 OpenAI展示了内部数据,工程师在使用Codex后,每周完成的Pull Request数量提升了70%,几乎所有OpenAI的PR都经过Codex审查。Codex还新增了三个企业功能:Slack集成(可以直接在团队频道里让Codex写代码或回答问题)、Codex SDK(让开发者在自己的工作流中嵌入Codex能力)、以及管理工具(包括环境控制、监控和分析仪表板)。 模型和API更新方面,GPT-5 Pro API向所有开发者开放,这是OpenAI目前最智能的模型,专为需要高精度和深度推理的场景设计,如金融建模、法律文件分析和医疗诊断,定价为每百万输入token 15美元、每百万输出token 120美元。 OpenAI刚刚发布全新的Sora 2模型及同名Sora App,应用上线后迅速走红,Sora 2、Sora 2 Pro API也进入预览阶段,这个新一代视频生成模型在可控性上有巨大飞跃,能根据详细指令生成风格化、构图精良的视频,还能配上丰富的声音景观、环境音频和同步音效。Sora 2 输出每秒 0.1 美元,Pro 输出每秒0.3 美元。 GPT-Realtime-Mini则是一个更小、更便宜的语音模型,比之前的高级语音模型便宜70%,但音质和表达力保持一致。OpenAI认为语音将成为人们与AI互动的主要方式之一,更经济的模型能让语音应用更快普及。 1 平台化的野心 这次DevDay最重要的信号是,ChatGPT不再只是一个Chatbot,而是正在成为一个完整的应用平台。Apps SDK让开发者能触达8亿用户,AgentKit降低了Agent开发门槛,Codex提升了软件开发效率。OpenAI正在构建一个从应用分发、开发工具到基础设施的完整生态。 从现场演示来看,这些Agent更像是对话式的App,它们依然需要后端逻辑、数据管理和UI交互,只是把入口从图标点击变成了自然语言对话。这是交互方式的革命,但软件开发的本质没有改变,你还是需要懂业务、懂技术、懂用户需求。 苹果推出App Store时,没人想到十年后会有几百万个App。OpenAI推出了Apps SDK,现在的问题不是Agent是否会替代App,而是开发者们是否真的会来,在ChatGPT上“Build something new”。
小米澎湃OS 3 OTA逻辑改进:优先手动检测、逐步放量
快科技10月7日消息,今年的小米澎湃OS 3进步很大,流畅性、功能性等多方面都大幅超越前代,很多用户都希望第一时间升级。 对此,小米公司应用软件部总监王乐专门发文解释了澎湃OS 3系统改进后的OTA逻辑,让大家更方便体验: 1.在大型软件工程体系下,所有软件产品的新版本发布都会遵循逐步放量的灰度策略 2.灰度策略有多种选择,比如招募一定的内测用户优先推送,或者随机放量慢慢扩大规模等 3.众所周知,小米澎湃OS 3不同机型会招募内测用户,同时采用了优先手动检测和随机放量融合的灰度策略,也就是说在一定的放量规模下,只要你手动检测就能收到更新 王乐表示,手快的用户率先收到更新,如果慢了一步也不怕,隔1到2天还会继续放量,继续手动检测即可。 需要注意的是,他强调同一时间频繁检测没用,每天抽空看一眼就行。 据悉,在国庆之前小米澎湃OS 3 Beta版实际升级用户就已经超过120万,远超内部最初规划的10倍。 澎湃OS 3 Beta第三批机型:小米MlX Fold 4、小米MIX Flip、小米14 Ultra/小米14 Ultra钛金属特别版、小米14 Pro/小米14 Pro钛金属特别版、小米14、REDMI K70 Pro、REDMI K70至尊版、REDMI K70、REDMI K70E、小米平板6S Pro 12.4。 根据官方公告,小米澎湃OS 3正式版将于10月15日开启首批存量机型推送,并陆续覆盖更多机型。 据了解,澎湃OS 3采用自研底层内核技术平台,深入微架构流水线,识别CPU空转时长,通过一体化调频技术提升效率,整体任务执行效率提升19%。 同时,澎湃OS 3终于登“岛”,命名为“小米超级岛”,支持三岛并存,能显示待取快递提醒、登机提示、天气预警、打车信息、导航、倒计时、手机状态等信息。
不藏了!OpenAI 2025开发者日:ChatGPT要变成操作系统,8分钟拖拽可构建超复杂Agent
今天OpenAI的开发者日简直太硬核了,OpenAI的开发者已经达到了惊人的400万,ChatGPT周活跃用户达到8亿,每分钟API处理的60亿token 主要有四个方面内容 1.在 ChatGPT 内部构建应用 :Apps inside ChatGPT,OpenAI推出自己的App SDK。这可以说是惊雷消息,OpenAI不但要革苹果Appstore的命,还要直接把ChatGPT变为操作系统,看大神怎么说: 2.直接拖拽构建Agent工具:AgentKit。这里有个8分钟拖拽演示,我把视频扒下来了并且翻译好了,大家直接看视频是最直观的,(可以玩了,链接:https://platform.openai.com/agent-builder/) 3.codex更新,关于codex最新能力演示视频,我也已经扒下来 4.API支持 :sora 2,gpt-5 pro Apps in ChatGPT:开启一个全新的应用分发与互动生态 我认为这是最震撼的,标志ChatGPT正式进军操作系统,简单来说,OpenAI的野心是以后你只需要一个应用够了,这个应用就是ChatGPT,这样ChatGPT就变成事实上操作系统了,苹果Appstore瑟瑟发抖,毫无疑问这是OpenAI战略性的赌注 自动播放 在过去,OpenAI 曾尝试通过 GPTs 和 MCP 等方式,将开发者的服务与 ChatGPT 连接起来。这些尝试有的成功,有的则不尽人意,但都为 OpenAI 积累了宝贵的经验。今天,OpenAI 迈出了决定性的一步,正式向开发者开放 ChatGPT,允许他们在其中构建原生应用 (Apps) 这将催生新一代的应用形态,它们具备三大核心特质:互动性 (interactive)、适应性 (adaptive) 和个性化 (personalized)。用户不再是单纯地与一个聊天机器人对话,而是可以直接在对话中与功能丰富的应用进行交互。为了实现这一点,OpenAI 推出了全新的 Apps SDK (软件开发工具包),现已开放预览 Apps SDK 为开发者提供了一套完整的全栈解决方案,其主要特性包括: 连接数据:开发者可以将自己的数据源和后端服务无缝接入 触发动作:应用可以执行具体的后端操作,例如创建一个设计、预订一个行程或分析一份数据 渲染完整 UI:开发者可以在 ChatGPT 的对话流中渲染完全互动的用户界面,而不仅仅是文本或卡片。这意味着视频播放器、互动地图、设计画板等复杂的 UI 都可以被直接嵌入 基于 MCP 标准:Apps SDK 建立在 MCP 这一开放标准之上,开发者对其后端逻辑和前端 UI 拥有完全的控制权。由于标准是公开的,任何人都可以将其整合到自己的平台 对于开发者而言,最大的吸引力在于分发渠道。一旦应用构建完成,它就有机会触及 ChatGPT 全球数亿的用户群体。这将极大地改变产品的规模化扩展方式。同时,OpenAI 也考虑到了商业化的需求。如果用户已经是开发者现有产品的订阅者,他们可以直接在对话中登录账户。未来,OpenAI 还将支持多种变现方式,包括新的Agentic Commerce Protocol (智能体商业协议),该协议将允许在 ChatGPT 内部实现即时结账 在现场演示中,软件工程师 Alexi 展示了几个首批合作伙伴的应用,生动地诠释了这种新模式的魔力: Coursera (在线课程平台):当用户想要学习某个主题时,可以直接呼叫 Coursera 应用。应用会在对话中直接嵌入课程视频,并支持画中画或全屏播放。与应用对话功能:当用户观看视频时,可以随时向 ChatGPT 提问关于视频当前内容的问题,例如“请解释一下他们现在正在说的概念”。由于 Apps SDK 允许应用将上下文 (context) 暴露给模型,ChatGPT 能够准确理解用户正在观看的视频片段,并给出精准的回答。这将学习体验提升到了全新的高度 Canva (设计平台):在一个为宠物狗遛弯业务进行头脑风暴的对话中,用户可以直接呼叫 Canva,并用自然语言下达指令,例如“Canva,用这个名字为我制作一个作品集,我希望它色彩丰富、异想天开、明亮,并使用无衬线字体”。Canva 应用会直接在对话中生成设计选项。用户还可以进一步迭代,比如将一张海报转化为一个用于种子轮融资的完整 Pitch Deck (简报)。整个创意流程在同一个对话窗口中无缝完成 Zillow (房地产平台):当对话延伸到业务扩张,ChatGPT 建议将新城市选在匹兹堡。用户可以接着呼叫 Zillow 应用,要求“显示那里的待售房屋”。Zillow 会在对话中嵌入一个互动地图。用户可以切换到全屏模式,浏览房屋详情,甚至可以直接在地图上发起预约看房。更强大的是,用户可以继续用自然语言对 Zillow 应用进行操作,例如“将地图筛选为仅显示带院子的三居室房屋”。ChatGPT 会理解指令并更新地图。此外,当用户选定一处房产时,可以询问“这处房产离狗狗公园有多远?”。ChatGPT 会将来自 Zillow 应用的房屋位置信息与其自身的搜索工具结合,提供综合性的答案 这些演示清晰地表明,Apps in ChatGPT 不仅仅是 API 的简单调用,而是将语言模型的理解能力与应用的丰富功能和互动界面深度融合,创造出前所未有的动态体验 目前,Apps SDK 已向开发者提供预览版。今年晚些时候,开发者将能够提交应用进行审核和发布,届时还会推出一个应用目录 (Directory) 供用户浏览。符合基本标准的应用都将被收录,而那些在设计和功能上表现更出色的应用,将会获得更显著的推荐位置,甚至在对话中被主动建议给用户 https://developers.openai.com/apps-sdk AgentKit:在几分钟内将智能体从原型带入生产环境 智能体 (Agent),即能够理解上下文、使用工具并自主完成任务的软件,被普遍认为是 AI 的下一个重要发展方向。然而,尽管围绕它的讨论非常火,但真正能投入生产并被大规模使用的智能体却寥寥无几。原因在于其开发过程异常复杂,开发者需要处理诸多难题:从选择合适的框架,到编排复杂的工作流、建立评估循环、连接各种工具,再到构建一个友好的用户界面,每一步都充满了挑战 为了解决这些痛点,让每位开发者都能更快速地将想法转化为可用的智能体,OpenAI 推出了全新的 AgentKit。这是一套内置于 OpenAI 平台中的完整构建模块,旨在帮助开发者以更少的时间和精力,完成从原型设计到生产部署的全过程 AgentKit 核心包含三大组件,以及一个强大的连接器生态系统: 1.Agent Builder (智能体构建器):这是一个可视化的工作流设计工具。开发者不再需要从头编写复杂的协调代码,而是可以通过拖拽节点的方式来设计智能体的逻辑步骤、测试流程。这些节点包括工具调用、需要人类介入的环节、安全护栏和逻辑判断等。它建立在已有数十万开发者使用的 Responses API 之上,对于平台老用户来说非常容易上手 2.ChatKit (聊天工具包):为了让智能体拥有一个精美的用户界面,OpenAI 提供了 ChatKit。它是一个简单、可嵌入的聊天界面组件,开发者可以轻松地将其集成到自己的应用中,并进行品牌化定制,例如修改颜色、Logo 和提示语。这让开发者可以专注于核心业务逻辑,而无需在前端界面上花费过多时间 3.Evals for Agents (智能体评估):衡量智能体的性能至关重要。AgentKit 提供了一套专门的评估功能,包括: Trace Grading (追踪评分):可以逐一审视智能体每一步的决策过程,深入理解其行为 Datasets (数据集):允许开发者针对工作流中的某个特定节点进行性能评估 Automated Prompt Optimization (自动化提示优化):帮助自动调整和改进提示词,以获得更好的性能 External Model Evals (外部模型评估):甚至支持在 OpenAI Evals 平台内直接对外部模型进行评估 Connector Registry (连接器注册中心):智能体需要安全地访问数据和工具。通过这个管理控制面板,企业可以安全地将智能体连接到内部工具和第三方系统,同时确保数据安全和权限可控 现场演示,Christina 发起一项挑战:在 8 分钟内为 DevDay 的官方网站构建并部署一个问答智能体 "Ask Froge" 我已经贴心的把这8分钟视频扒下来了,并且做好的翻译,大家就看吧,不用感谢我 自动播放 设计工作流 (在 Agent Builder 中): 1. 她首先拖入一个分类器节点,用来判断用户的提问是关于“会议日程”还是“一般信息”。 2. 接着,她创建了两个专门的智能体节点。一个是“日程智能体”,为其上传了包含所有会议信息的文档作为知识源;另一个是“DevDay 通用智能体”,为其提供了通用信息文件,并设定了其角色风格(像一只名为 Froge 的青蛙一样说话,会发出 "ribbit" 的声音)。 3. 为了让日程推荐更具视觉吸引力,她使用 **Widget Builder (小组件构建器)** 设计了一个精美的日程卡片,并将其附加到“日程智能体”的输出格式中。 4. 为了增强安全性,她添加了一个预置的 **Guardrail (护栏)** 节点,用于自动屏蔽个人身份信息 (PII)。 5. 整个工作流设计完成后,她在 Agent Builder 的预览窗口中进行了测试,确认其能够正确回答问题并以预期的方式呈现结果。 部署到网站: 1. 她点击“发布”,AgentKit 为这个工作流生成了一个唯一的 ID。 2. 然后,她来到 DevDay 网站的代码中,仅用了几行代码就完成了部署:她引入了 **ChatKit** 的 React 组件,将刚刚生成的工作流 ID 传入,并添加了一些自定义样式,如 Froge 主题的颜色和提示语。 3. 刷新网站,一个名为 "Ask Froge" 的聊天机器人已经出现在页面右下角,并完全可用。 整个过程从设计到部署,耗时不到 8 分钟。这个演示完美地展示了 AgentKit 如何将一个原本需要数周开发时间的复杂任务,缩短到几分钟。更重要的是,后续的迭代可以直接在可视化的 Agent Builder 中完成,修改后的智能体无需重新部署代码即可在网站上生效 Codex Codex更新 今天,Codex 正式结束研究预览,进入通用可用阶段。推出了一系列新功能: 1.Slack 集成:开发者可以直接在 Slack 的团队对话中要求 Codex 编写代码或回答问题 2.Codex SDK:一个新的开发工具包,帮助团队将 Codex 的能力扩展和自动化到自己的工作流中 3.新的管理工具和报告:包括环境控制、监控和分析仪表板,帮助企业更好地管理 Codex 的使用 现场演示codex强大的编程能力: Romain 展示了如何利用 Codex 和 OpenAI 的 API,将周围的物理世界变成可交互的软件 同样给大家奉上演示视频全过程: 自动播放 **从草图到 UI**:Romain 首先展示了一张他手绘的 UI 草图,然后使用 `Codex CLI` (命令行工具) 将其转换成一个带有摄像头画面的控制面板界面 **控制物理设备**:他的第一个挑战是发布会控制舞台上方的 Sony FR7 摄像机。他对如何开始一无所知,只知道这款摄像机有一个 C++ SDK。他直接向 Codex 下达了任务,Codex 自主研究了有 30 年历史的 VISCA 协议,并用 JavaScript 实现了控制逻辑。Romain 强调,Codex 能够不知疲倦地执行长达数小时的复杂任务 **实时添加新功能**:接着,Romain 在 VS Code 中向 Codex 插件下达了一个新任务:“将一个无线控制器连接起来以控制摄像机”。Codex 在后台开始分析现有代码,制定计划并实现功能。几分钟后,Romain 拿起一个 Xbox 手柄,成功地控制了摄像机的移动 **多模态与多工具协作**:演示的高潮是引入了语音控制。他利用 OpenAI 的实时语音 API 和 Agent SDK,为应用添加了语音交互能力。然后,他向 Codex 发出指令,要求为舞台的灯光系统创建一个 MCP 服务器,并提供了灯光系统的参考文档。Codex 在执行任务时,发现文档信息不全,于是自主上网搜索 GitHub 上的文档,补全了所需信息,最终成功创建了服务器 **人机协同编程的未来**:演示的最后,Romain 通过语音向应用下达指令:“让 Codex 显示一个类似电影结尾的演职员表,演员是现场的观众们”。应用中的语音智能体将这个请求转发给了 **Codex SDK**。Codex 实时地分析了前端应用的代码,注入了新的 React 组件,并在屏幕上滚动显示出了“演职员表” 这个现场演示展示codex开发全过程:从草图、物理设备、语音指令到实时应用重构,整个过程几乎没有手写一行代码。Codex 真正成为了一位能够理解意图、解决未知问题并与开发者并肩工作的智能队友 模型与 API 更新 GPT-5 Pro API 开放 GPT-Realtime-Mini API 开放 Sora 2 API 预览版发布 写在最后 DevDay 2025 的所有发布都指向一个共同的目标:OpenAI要为为这个新的开发者时代提供最好的平台。从在 ChatGPT 内部分发应用的 Apps SDK,到简化智能体开发的 AgentKit,再到 Codex,以及 GPT-5 Pro、Sora 2 和 Realtime-Mini 等更强大的模型 API,OpenAI 正在全方位地为开发者赋能 就像Sam Altman说的,软件开发曾经是一个需要数月甚至数年才能完成的漫长过程,但今天,我们亲眼见证了它可以在几分钟内完成。在这个新时代,你所需要的,仅仅是一个好的想法。 这是一个属于所有新开发者的黄金时代,注意是新开发者,我们都要问自己一句,我们属于这个新行列吗? 以上,谢谢你看我的文章。觉得还不错的话,点个赞/在看/转发就更好了~想第一时间收到更新,记得给我加个⭐星标。~我们,下次再见 .../作者:花不玩
特斯拉连发神秘预热短视频,低价Model Y终于要来了?
财联社10月6日讯(编辑 赵昊)特斯拉先后在社交媒体账号上发布了两段短视频,预告将在周二(10月7日)举办活动,并暗示可能在活动中发布新车型。 当地时间上周日(10月5日),特斯拉在X发布了一个时长8秒的视频。视频显示,一个带有特斯拉标志的风扇在转动,可能是一个轮毂。结尾处出现“10/7”,暗示周二将有活动举行。 周一(10月6日),特斯拉又公布了一个时长9秒的视频,可以看出是一辆汽车亮着白光的前灯——这让市场愈发期待公司将在活动上推出传闻中“较为实惠的车型”。 此前,特斯拉曾推迟在美国推出低价版Model Y。今年6月,公司表示已完成该车型的“首批生产”,计划在第四季度开始销售,但增产速度将慢于原计划。 据知情人士透露,这款简化版车型的生产成本将比改款后的Model Y降低约20%,预计到2026年在美国的年产能可达到25万辆。 分析认为,特斯拉推出实惠的车型是为了维持其销售势头,公司正面临车型老化的挑战,其最近一次发布的新车是电动皮卡Cybertruck,但市场数据反映的销量不佳。 今年第三季度,特斯拉共交付了497,099辆汽车,同比增长7.4%,刷新了季度交付纪录,几乎强于市场上所有预期。 但分析指出,这一数据得益于美国联邦税收抵免到期前加紧购车,税收抵免结束后纯电动汽车的需求可能会明显降低。 根据Visible Alpha的数据,华尔街预计,特斯拉明年的交付量将升至185万辆,其中平价新车型在2026年贡献约155,610辆。 也有网友在帖文下面猜测,特斯拉可能推出的是下一代Roadster跑车,并不是低价版Model Y。上月,马斯克曾回复过一句“新款Roadster不仅仅是一辆汽车”。
郭明錤分析OpenAI与AMD合作:对英伟达影响有限
OpenAI与AMD合作 凤凰网科技讯 北京时间10月7日,AMD宣布与OpenAI达成合作,从2026年开始的几年内部署相当于6吉瓦算力的AMD图形处理器。对此,天风国际证券知名分析师郭明錤认为,只要AI算力市场整体增长,OpenAI与AMD的合作对英伟达的影响应该有限。 OpenAI预计自2026下半年开始部署1吉瓦的AMD MI450图形处理器。郭明錤从供应链角度分析了这项合作对英伟达的影响。 郭明錤在X上指出,过去两周AMD的2026年CoWoS(芯片堆叠封装技术)订单无显著变化。部署1吉瓦的AMD MI450约等于5万片CoWoS-L。目前AMD 2026年的CoWoS订单推估为6-8万片(约80-90%用于MI400系列),所以无论是乐观还是谨慎,都可满足部署1吉瓦MI450的需求。 对于AMD的OpenAI订单,初步来看比较明显受益的是高带宽内存(HBM)与UALink(GPU互联技术)供应链。MI450 HBM4主要供应商是三星。完整的UALink规格要到2027年的MI500系列才能量产,但高订单前景会让相关供应商股价提前反应。 郭明錤表示,从英伟达做机柜级服务器的经验看,部署1吉瓦的MI450过程也不会轻松。英伟达能做的,就是在AMD的机柜级服务器顺利出货前,尽可能把竞争格局提升到另一个层次,确保接下来的优势。而很明显,英伟达早就在这么做了。只要AI算力市场整体增长,OpenAI与AMD的合作,对英伟达的影响应该有限。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
从30亿到1万亿,苏姿丰如何带领AMD后来居上叫板英伟达?
苏姿丰 凤凰网科技讯 北京时间10月7日,据《华尔街日报》报道,2014年,当苏姿丰(Lisa Su)接任AMD CEO时,公司市值不足30亿美元。如今,AMD的市值已超过3300亿美元,增长超过百倍。这一成就背后是AMD的成功战略转型:从主营游戏显卡和PC处理器,转向更加专注于推动AI革命的数据中心芯片。 周一,在AMD宣布与OpenAI达成伙伴关系后,该公司股价飙升了24%。根据协议条款,OpenAI将购买数万枚AMD芯片,以提供6吉瓦的推理计算能力,使其AI模型能够响应用户查询。 这笔合作为AMD股价注入强劲动力,也彰显出该公司与头号竞争对手英伟达一较高下的雄心。目前,英伟达在AI芯片领域占据主导地位。 1万亿美元市值 根据周一的协议,一旦OpenAI达到特定部署目标并且AMD股价上涨,OpenAI将获得1.6亿股AMD股票的认股权证,每股行权价仅为1美分。若AMD股价达到每股600美元,该公司将授予OpenAI最后一笔股票,届时AMD市值将达到1万亿美元。 目前,英伟达市值为4.5万亿美元,几乎是AMD的14倍。大多数分析师估计,英伟达在用于AI训练与推理的图形处理器(GPU)市场的份额超过75%。 AMD与OpenAI达成合作 但除了AMD之外,英伟达还面临其他公司的压力,例如为OpenAI等客户生产应用专用定制芯片的博通,甚至是一些大客户的竞争,这些客户已经开始自行设计芯片。 与OpenAI的合作或许在一定程度上改变了竞争格局,使天平开始向AMD倾斜。AMD能迎来这一战略转折点,既得益于精准的战略布局,也离不开恰到好处的市场时机。 苏姿丰在接受采访时表示:“过去几年,对我们来说重要的是理解那些真正推动下一代AI训练与推理的工作负载。此次合作将极大拓展我们正在推进的工作领域。” 挤垮英特尔 在过去十年的大部分时间里,AMD的主要竞争对手一直是英特尔,后者最近获得了英伟达和美国政府的大笔投资。但是,凭借为PlayStation和Xbox游戏主机设计的流行图形芯片,以及用于消费级PC的CPU,AMD多年来稳步蚕食了英特尔的市场份额。 与此同时,英特尔却因耗资巨大的芯片制造业务转型计划而举步维艰。AMD早在2009年就剥离了其制造业务,也就是如今的格芯。但是,尽管英特尔已在工艺技术上大幅落后于台积电等先进制造商,该公司却仍持续向亏损的代工业务投入资金。 成功转型 2018年,AMD敏锐地转向云计算领域,推出专为AI工作负载设计的首款数据中心GPU系列Instinct。但自那之后,AMD始终难以撼动英伟达的霸主地位,后者不仅主导AI芯片市场,更掌控着运行大型数据中心集群所需的软件系统。 过去几年,随着AI实验室竞相完善最新模型,市场对用于训练这些模型、处理数十亿甚至数万亿输入参数的高性能芯片的需求激增。如今,需求重点正从训练转向推理,各行业都在寻求能更好赋能商业、娱乐与研究领域的AI工具。这类应用往往也具有更可观的盈利前景。 AMD数据中心芯片 乔治城大学安全与新兴技术中心AI研究员雅各布·费尔戈伊兹(Jacob Felgoise)指出:“过去算力分配明显偏向训练端,但随着AI服务需求增长,未来重心将加速向推理倾斜。AMD一直在努力将自己定位为推理解决方案的首选提供商。” AMD CEO苏姿丰以及OpenAI高管们一致认为,推理需求将成为AI基础设施的主要驱动力,并认为随着AI产业的发展,任何为开发者提供算力的公司都将获得巨大收益。 AMD拥有一些关键优势,有助于其争夺更多英伟达市场份额。该公司的芯片通常比英伟达更便宜,同时效率和质量也在不断提升。另外一个关键因素是芯片可用性:由于英伟达的GPU被普遍认为是市场上最优秀的芯片,它的采购竞争异常激烈。需求的大幅增长为AMD提供了机会,使其能够将自家产品作为更实惠、且更易获取的替代方案提供给市场。 OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)表示:“我们坚信,世界低估了AI推理的需求,而我们正走向一个芯片不够用的世界。这个市场具有极强的正和效应(参与者都能受益),但现有产能远不能满足需求,芯片短缺将成为必然。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
AMD一夜暴涨4500亿,全球芯片的转折点来了?
摘要: 海外芯片巨头的历史性时刻,深度捆绑着OpenAI的阳谋。 凤凰网科技 出品 作者|Dale、姜凡 编辑|董雨晴 2025年10月6日,全球金融市场迎来了一场震动。 美股三大股指集体高开,纳斯达克指数上涨0.49%,标普500指数上涨0.28%,然而,最引人瞩目的却是AMD(超威半导体)股价飙升。当天,AMD股价一度暴涨超过30%。截至当日收盘,市值增加了634亿美元(约合4514亿元人民币),达到3306亿美元,超过了可口可乐、通用电气和雪佛龙。 这一波巨大的股价波动背后,隐藏着全球芯片行业正在迎来的“超级周期”,一个由人工智能(AI)带动的技术浪潮。 OpenAI带动芯片狂 AMD股价飙升,背后的推手是OpenAI。 OpenAI正在加紧“锁定”芯片供应商,10月6日,AMD发布公告称,向OpenAI发行认股权证,允许其以每股仅0.01美元的价格购买最多1.6亿股普通股。 这意味着,OpenAI将能以极低的成本持有AMD约10%的股份。 AMD CEO苏姿丰直言,AMD与OpenAI的合作将最大化双方优势,势必创造双赢局面。 此举引发了美国及全球范围内的半导体股普涨,美光科技、台积电、迈威尔科技、英特尔等芯片巨头也随之受益,股价均大幅上涨。 就在OpenAI宣布投资AMD前,英伟达此前也放出了重磅消息。9月23日,英伟达官网宣布,将与OpenAI达成一项“具有里程碑意义的人工智能基础设施合作伙伴关系”。根据计划,英伟达将通过数百万个GPU支撑的数千兆瓦(GW)数据中心,全面提升OpenAI的算力。 更重要的是,英伟达还将分阶段投资最多1000亿美元,投资金额将根据每千兆瓦的部署进度逐步释放。 通过与这两大芯片巨头的深度捆绑,OpenAI不仅为自己铺就了算力发展的高速公路,也将芯片制造商牢牢“绑在了战车上”,为未来海量计算需求铺平道路。 正因此,OpenAI通过较低价持有AMD股份的前提是,OpenAI必须按照约定在数据中心大规模部署AMD的芯片。 OpenAI表示,第一批股权归属将在最早的1吉瓦GPU部署时进行,随着购买规模扩大到6吉瓦,其他部分股权也将归属。 从寒武纪到摩尔线程,浮出水面的国产芯片 这一轮芯片超级周期,不光是海外企业受益,国产GPU同样迎来了巨大机遇。 摩尔线程、寒武纪、壁仞科技、燧原、沐曦等一批崛起于2020年前后的国产GPU企业在完成了前期技术积累后,正随着国产开源大模型的进阶,迎来市场爆发。 摩尔线程作为新国产芯片黑马,未上市已先火。在其9月26日正式过会前,还曾在资本市场引发概念股潮流,初灵信息、盈趣科技、和而泰、联美控股等多只与摩尔线程概念相关的股票连续多天大涨,其中,和而泰更是4天3板,联美控股2连板。 另一个国产芯片黑马寒武纪则是更早引发市场关注。 就在今年8月,寒武纪股价迎来两度跃升,总市值首次超过中芯国际,跃居科创板市值第一。此后,其股价甚至一度超越茅台,成为新晋股王。 国产芯片背后的伯乐正是DeepSeek。 2025年9月29日,DeepSeek-V3.2-Exp模型在Hugging Face平台发布并开源,凭借稀疏Attention架构实现计算资源消耗降低与推理效率提升,更引人注目的是,华为昇腾、寒武纪与海光同步发布消息,表示完成适配部署,意味着算力产业迎来新变量。 据披露,DeepSeek此次开源的新模型研究中设计和实现的GPU算子,含有TileLang 和 CUDA 两种版本。DeepSeek建议“社区在进行研究性实验时,使用基于 TileLang 的版本以方便调试和快速迭代”。 TileLang由北大计算机学院副研究员杨智团队主导开发,与国产硬件适配。 无论是英伟达、AMD的历史性合作,还是寒武纪、摩尔线程等公司的市值飙升。背后的驱动力,都是全球对计算力的迫切需求,而人工智能时代正以前所未有的速度席卷全球,带动了这一切的爆发式增长。 从OpenAI与AMD的战略合作,到摩尔线程和寒武纪等国内芯片企业的崛起,再到存储芯片市场的价格风暴,全球半导体行业正迎来一场由人工智能推动的超级周期。这场周期不仅会深刻改变全球芯片产业的格局,也将推动技术创新的不断升级。 然而,在这场盛大的“算力革命”背后,还存在诸多不确定性—供应链的压力、AI技术突破的难度以及市场竞争的加剧都将成为未来行业发展的挑战。如何在这场技术浪潮中脱颖而出,如何在全球化的竞争环境中获得更多的市场份额,将是每一个芯片企业必须面对的课题。 可以预见,未来几年,全球芯片产业将处于一个快速发展的黄金时期,而这一切的起点,正是当前席卷全球的人工智能热潮。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。