行业分类:
加载中...
头条分类:
加载中...
彭博社:中美主导AI模型竞赛 中东、欧洲“掉队”
阿联酋G42 CEO肖鹏与OpenAI CEO奥特曼 凤凰网科技讯 北京时间5月6日,彭博社周一发文称,在生成式AI热潮刚刚开始兴起时,中东、欧洲的一些公司曾经跃跃欲试,希望抓住这一机遇。但是现在,随着中国和美国的公司主导了AI竞赛,中东和欧洲的公司不再追求尖端模型的开发。 2022年底,ChatGPT横空出世。仅仅几个月后,阿联酋的研究实验室就声称开发出了能够与之叫板的竞品。其中最知名的是“Falcon”和“Jais”,前者是一款在阿联酋政府支持下构建的开源AI系统,后者则是一个以该国最高山峰命名的模型。 梦想很丰满、现实很骨感 “AI的未来并非遥不可及的梦想,而是一种当下已然存在的现实。”阿联酋科技巨头G42 CEO肖鹏曾在2023年表示,当时该公司刚刚推出了Jais大模型。 但如今,阿联酋打造本土具有竞争力AI模型的梦想仍遥不可及。Falcon在用户数量和性能公开排名方面远远落后于美国公司的领先模型。与此同时,G42也已从Jais项目中撤出资源,转而专注于在OpenAI等其他公司的AI模型基础之上开发定制功能。 G42开发的大模型Jais 肖鹏今年4月在接受彭博新闻采访时表示:“在早期阶段,我们根本不知道基础模型能走多远,也不知道要到达下一个阶段需要付出怎样的努力。以阿联酋的体量来说,自研大模型并不现实。” 在生成式AI热潮爆发两年多后,全球开发更尖端模型的竞赛越来越像是中美两个国家之间的竞争。少数美国公司继续在AI开发中处于领先地位,它们在芯片、数据中心和人才方面投入了数以十亿美元计资金,以打造最大、最强的模型。与此同时,中国正在迅速赶上,并通过向市场投放大量低成本、开源模型来扩大其影响力。而大多数其他国家,即便是像阿联酋这样富裕的国家,也大多处于中间位置,难以脱颖而出。 在中东和欧洲地区,越来越多曾经前景光明的AI项目要么失败了,要么几乎被放弃。德国的Aleph Alpha曾被誉为欧洲版的OpenAI,去年也做出了与G42类似的决定。英国的Stability AI是AI模型领域的早期开拓者之一,但是由于管理方面的问题,该项目已逐渐偃旗息鼓。就连法国Mistral这样获得大量风险投资支持、还受到本国政府大力扶持的企业,也几乎没有展现出它具备了强劲商业吸引力或者能够引发开发者兴趣的实力。 大模型已落后 和其他市场一样,中东地区的企业正在重新审视从头开始构建前沿AI模型的成本是否值得。G42云业务部门Core42主管基里尔·埃特米莫夫(Kiril Evtimov)表示,如果G42继续投资,Jais可能会成为一款有竞争力的“前沿模型”,“但这是否是我们抢占市场的正确商业策略?答案或许是否定的”。 2023年,阿联酋成立了一家新公司AI71,号称是专为Falcon打造的商业化平台。但是,该公司发言人表示,AI71最终效仿了G42和Aleph Alpha的做法,转向开发面向特定商业用途的AI工具,使用包括Falcon在内的多个模型。 尽管Falcon仍然是阿联酋最具竞争力的产品,但它难以跟上美国Meta和中国DeepSeek等开源替代品的发展步伐。2023年,Falcon背后的阿联酋技术创新研究所(TII)曾宣传,该AI系统在Hugging Face开源模型排行榜上排名第一。然而,截至上周,Falcon在该平台的排行榜上已进不去前500名了。 DeepSeek TII的一位代表称,Falcon模型目前已经被下载超过5500万次。和Meta的Llama系列模型下载量相比,这简直是小巫见大巫,因为Llama的下载量已超过10亿次。该代表还表示,他们将很快宣布Falcon与网络安全、机器人技术和云服务公司的整合。“一个模型的价值不仅体现在其最初的基准性能上,还在于它如何随着时间的推移促进并推动更广泛的创新。”该代表在声明中说道。 与此同时,G42还在探索其他途径来参与当前的AI热潮,而非仅仅依靠模型开发,其数据中心业务正在海湾地区扩张。该公司与人共同创立的投资基金MGX已经投资了美国的AI公司OpenAI和xAI。 主权模型 一些国家仍在试图在AI发展方面挑战美国和中国。今年1月,印度政府表示将支持 18项不同的提议来构建基础AI模型。一位部长承诺,这些基础模型将“与最顶尖的模型竞争”。去年,沙特AI机构还与IBM合作,通过该公司的云服务推出了其自研国家模型ALLaM。 牛津大学AI教授迈克尔·布朗斯坦(Michael Bronstein)在迪拜举行的“机器能看见”(Machines Can See)会议上表示,各国追求这些所谓的主权模型,是为了对AI 系统的训练方式拥有更多控制权,要么是为了影响其运行方式,要么是为了减少对外国技术的依赖。 但他同时指出,开源模型的盛行意味着这些方法几乎没有保持竞争力的可能。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
传苹果爆改iPhone发布节奏,首款折叠屏终于要来了
编译 | 王涵 编辑 | 漠影 苹果今年要搞大动作! 智东西5月6日消息,据外媒The Information报道,有知情人士透露,苹果或将在今年9月推出一款厚度约为5.5毫米的超薄iPhone,随后在2026年推出折叠屏手机。 此外,苹果还计划在明年改变新品的发布时间,高端机继续秋季秀肌肉,但更便宜的标准版要挪到次年春天“错峰出道”。 库克这波操作究竟是“憋大招”还是“玩心跳”? 一、苹果史上最薄手机:厚度仅5.5mm,无法插入实体SIM卡 与此前流出的对iPhone 17的爆料相一致,此款超薄iPhone预计厚度只有5.5mm(毫米)。该产品若能问世,将是苹果有史以来发布的最薄手机。 ▲超薄iPhone爆料图1 但“鱼和熊掌不可兼得”,追求超薄机型就不可避免地会在其功能与性能上有所妥协。据消息人士透露,超薄iPhone将只配备1个扬声器和1个摄像头,而不是2个扬声器+3个摄像头的常规组合。 除此之外,知情人士爆料其电池续航时间也将缩短。内部测试显示,超薄机型的电池续航时间不及旧款iPhone。能够在一天内不充电使用这款超薄手机的用户比例将在60%至70%之间,而其他机型的这一比例在80%至90%之间。知情人士还透露说,为了解决这个问题,苹果正在开发一款专为超薄机型设计的、包含电池组的手机壳。 ▲超薄iPhone爆料图2 由于近年苹果iPhone产品的迭代仅有小幅升级,用户换机意愿持续低迷。苹果“押宝”该款超薄手机有望重振iPhone销量增长并加速用户换机周期,毕竟iPhone的销售额占苹果总营收的一半还多。 变革意味着机遇,但也同时伴随风险。为了追求超薄,该机型没有留出实体SIM卡的空间,而中国法规尚未批准销售搭载e-SIM的智能手机。这一限制或将影响超薄iPhone在中国市场的销售表现。 此外,知情人士还说,由于这是一款全新的产品,没有历史需求可供参考,所以在9月开始预售之前,苹果无法预判制造商正在搭建的生产线能否满足需求,甚至难以判断是否会出现产能过剩。 另有两位知情人士称,基于上述原因,为该机型预留产能的制造商正在评估:若超薄机型市场表现不佳,他们能否迅速将生产线转向其他型号的生产。苹果在亚洲的制造合作伙伴仅能分配给超薄机型约10%的产能,其余大部分产能将保留给iPhone 17 Pro和Pro Max,这两款机型将分别占总产量的25%和40%左右,剩余产能将留给标准版iPhone 17。苹果发言人对此拒绝置评。 二、iPhone 18系列取消胶囊型切口:前置改为开孔式,为屏下摄像头过渡 超薄iPhone的发布将标志着苹果iPhone规划更大转变的开始。除了超薄机型外,爆料还透露了iPhone 18系列的更多变动。据悉,iPhone 18系列将包括超薄iPhone、Pro和Pro Max的迭代版本,以及新的折叠式iPhone。 知情人士透露,iPhone 18 Pro和iPhone 18 Pro Max的前置摄像头将为开孔式,仅在左上角开一个小孔。这一设计将成为至少一款2027年iPhone机型的前瞻性方案。该机型将把前置摄像头集成至屏幕下方,做到屏下前置摄像头,告别胶囊型切口,实现真正的全面屏。这一创新将恰逢初代iPhone发布20周年纪念。 据智东西此前报道,苹果有望计划明年发布首款折叠屏iPhone。一位参与制造的人士表示,这款书本式折叠设备的展开时内屏对角线尺寸略小于8英寸,闭合时外屏对角线尺寸略小于5.7英寸。 ▲iPhone折叠屏手机假想图 三、提振销量,优化产能,苹果调整新品发布窗口期 三位参与iPhone供应链的人士称,在2026年,苹果还计划将iPhone的不同机型错峰发布,即在当年秋季发布更高端、更昂贵的Pro机型,标准版iPhone和更加经济实惠的机型,即iPhone 18和更经济实惠的iPhone 16e的后续机型,推迟到次年春季发布。 其实在此之前,苹果通常也会在春季推出其入门级智能手机SE系列,只不过该系列机型更新周期较长,往往每隔数年才会迭代一次。例如,今年2月,苹果发布了iPhone SE的后续机型iPhone 16e。消息人士称,发布更高端的iPhone的5-6个月后,再发布下一代基础版可能会提振销量。市场分析公司Asymco创始人Horace Dediu也曾提到:“提前推出高端机型,稍后发布低端机型,可能会让早期采用者先购买更昂贵的机型。” 此番调整,还可能让苹果在提升多款机型产能时更加游刃有余。通过分阶段发布产品,苹果可以避免同时调动大量制造人力和设备,从而优化生产资源的配置。据曾在苹果供应链工作的人士透露,为保证秋季新品发布前储备充足库存,新iPhone通常在夏天就启动量产。由于假日购物季的订单高峰通常集中在冬季前,生产需求会在此期间达到峰值。而到了次年1月,随着订单量逐渐回落,苹果的制造合作伙伴往往难以全年维持同等规模的工人数量和设备运转效率。 结语:苹果的“创新突围”能否平衡创新与耐用性? 此次爆料中,有两个创新点较为引人注意,即超薄机身与屏下前置摄像头。 超薄iPhone纤薄至5.5毫米的机身设计,不禁让人联想到iPad Air系列曾因追求极致轻薄而付出的“代价”。作为苹果首款采用全金属一体化机身且厚度骤减至6.1毫米的平板电脑,初代iPad Air虽以“全球最薄平板”的称号惊艳市场,却因机身刚性不足导致用户在日常使用中频繁遭遇“折弯门”事件:仅需单手握持或轻微施压,机身便可能出现不可逆的弯曲变形,甚至有用户反馈将其放入背包后因挤压而永久变形。 而智能手机使用场景远比平板复杂,频繁单手操作、裤袋挤压、跌落冲击的风险大大增加。能否在纤薄与耐用性之间找到平衡点将是这款新机面临的最大挑战。 此外,进入全面屏时代后,智能手机厂商们为了追求更高的屏占比,开始研究前置摄像头的摆放位置以及形态变化,比如刘海屏、水滴屏、物理升降式结构的前置摄像头等,屏下前置摄像头也应运而生。 苹果虽非首家尝试将传感器与摄像头集成于显示屏下方的智能手机厂商,但就目前已经应用该技术的国内手机产品来看,其技术效果尚未达到理想状态。用户用肉眼仍能直接看到前置摄像头,并未能做到完全隐形,且自拍效果都有一定程度的折损。 苹果的屏下前置摄像头若能突破现有技术瓶颈,实现“真·全面屏”与影像质量的双重突破,或将再次掀起智能手机的技术创新浪潮。
意外泄露!谷歌Android新版设计语言细节曝光
编译 | 王涵 编辑 | 漠影 智东西5月6日消息,据谷歌官网发布的开发者大会日程及一篇意外流出的博客文章披露,该公司将在今年5月20日至21日举行的Google I/O开发者大会上推出新版Android设计语言。 此次发布的设计系统将从“Material 3”升级为“Material Design 3 Expressive(情感化设计)”,泄露的博客内容显示,新版设计将着力打造“能与用户建立情感连接”的交互界面,将通过“大胆的形态与色彩运用,创造令人愉悦的用户体验”。。 该博客最初由9to5Google发现,随后谷歌迅速撤下文章,现已被互联网档案馆保存。 一、加强情感共鸣,Material Design团队打破行业同质化 Material Design作为谷歌2014年推出的开源设计系统,详细规范了Android应用的视觉、动效及交互设计标准。其重大更新“Material You”(即Material 3)于2021年5月发布,首次实现界面风格随用户壁纸色彩自动适配的个性化功能。 Material 3 Expressive被谷歌称为“设计领域的大胆新方向”,是其设计系统“有史以来研究最充分的更新”。该设计倡导应用突破“整洁但乏味”的传统范式,打造能与用户建立情感连接的界面。除全称外,其也被简称为“M3 Expressive”或“情感化设计”。 与单纯依赖数据的传统方式不同,Material 3 Expressive源自跨学科协作研究。2022年,Material Design团队开始反思行业同质化现象:“为何所有应用都如此雷同乏味?难道不能增强情感共鸣吗?” 过去三年间,研究团队通过46项独立研究、数百轮设计迭代,并联合全球18000名用户开展多阶段测试,综合运用眼动追踪技术、定量问卷与焦点小组访谈、对照实验设计以及可用性任务测试评估等研究方法,最终构建了一套平衡美学与功能性的设计体系。 博客中提到,该体系的设计原则严格遵循实证研究结论,同时融合人机交互领域的经典方法论,确保设计师在应用创新组件时,既能实现设计创新,又能维持用户操作效率与体验的一致性。 二、创新造型,大胆配色,情感化设计要素提高用户体验 谷歌称:“情感化设计的根基在于色彩、形态、尺寸、动效与容器的创新运用”,其特征表现为“通过大胆的造型与色彩组合,创造愉悦的用户体验”。这些要素能有效引导用户关注界面关键区域:突出核心操作,合理归类相关元素。 例如本次更新的代表性创新之一的“浮动工具栏”。概念图中可见药丸状底栏不再占满屏幕宽度,留出边缘空间强化全屏设计感——类似当前Google Chat的界面处理。 博客中说,谷歌研究发现情感化设计使用户“识别关键操作速度提升4倍”,“导航效率显著提高”。在电子邮件应用的案例中,新版发送按钮采用更大尺寸、键盘上方定位及对比色设计,相较传统顶部工具栏布局,用户发现速度提升达四倍。 与此同时,研究及用户测试还发现,相较于严格遵循《iOS人机界面指南》的非表现性设计,各年龄段用户均更倾向于选择“运用得当的表现性设计”。谷歌称,表现性设计自带“酷感”,具体体现为品牌调性的提升。 研究数据显示,采用表现性设计后,品牌在用户认知维度呈现以下变化:亚文化契合度感知提升32%,反映该设计有助于增强品牌与特定用户群体的关联性;现代感指标增长34%,表明品牌形象更具新颖性与前瞻性;叛逆感指标增幅达30%,体现表现性设计可能强化品牌突破常规的差异化定位。 结语:Material 3 Expressive迭代聚焦包容性与开发适配 此次“Material 3 Expressive”虽非颠覆性变革,但标志着Material You设计语言的迭代升级。博客着重阐述了更新背后的研究依据:实验证明更具表现力的设计能显著提升可用性。谷歌提到,这种通过突出关键元素引导用户操作的设计模式,可带来“显著的性能提升”。 值得注意的是,博客中称该设计还能在一定程度上弥合“数字鸿沟”,降低老年人使用门槛,实现跨年龄层的公平体验。但谷歌同时强调,情感化设计并非“放之四海皆准”,应用开发者在定制界面时仍需遵循既有的设计规范与标准。 大会日程中“用Material 3 Expressive打造卓越用户体验”的环节证实,新版设计系统将于本月开发者大会正式亮相。根据环节说明,开发者将学习运用“新型情感化设计模式”来提升产品吸引力、易用性与用户黏性。谷歌计划同步发布设计资源与Alpha版本代码,以便开发者在正式发布前进行适配测试。 作为影响Android平台应用开发规范的核心设计体系,此类更新或将革新应用程序的构建方式与用户体验,进而升级Android设备的使用感受。
AI搞定所有家务!π0.5突破泛化极限,UC伯克利系出品
自动播放 【导读】具身智能最大的挑战在于泛化能力,即在陌生环境中正确完成任务。最近,Physical Intelligence推出全新的π0.5 VLA模型,通过异构任务协同训练实现了泛化,各种家务都能拿捏。 近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦桌子等复杂任务。但机器人面临的最大挑战并非灵活性,而是泛化能力——在新环境中正确完成任务的能力。 想象一个你家中的清洁机器人:每个家庭布局不同,物品摆放各异,机器人必须在多个层面上实现泛化。低层面上,它需学会如何抓起未曾见过的勺子或盘子;高层面上,它要理解任务语义,如衣服应放进洗衣篮、用何种工具擦拭溢出物。实现这种能力既依赖强大的操作技能,也需要常识理解,而现实中可用于训练的数据又极其有限,这进一步增加了困难。 即使近年来的机器人在灵巧性方面有所突破,往往也是基于特定场景和相似数据训练出来的。 因此,如果我们希望机器人成为我们日常生活的一部分,在我们的家中、杂货店、办公室、医院和其他“杂乱”的环境中工作,机器人就必须具备更加强大的泛化能力。 今天,美国具身智能公司 Physical Intelligence 推出了一个基于 π0 的视觉-语言-动作(VLA)模型 π0.5,其利用异构任务的协同训练来实现广泛的泛化,可以在全新的家中执行各种任务。 实验表明,这种知识迁移对于有效的泛化至关重要,而且他们首次证明,端到端学习型机器人系统可以在全新的家庭中执行长程灵巧操作技能,例如清洁厨房或卧室。 π0.5是如何工作的? π0.5 背后的主要原理是异构数据的共同训练:通过在各种不同的数据源上训练 VLA 模型,不仅可以教它如何物理地执行不同的技能,还可以教它如何理解每项技能的语义背景,推断任务的高级结构,甚至从其他机器人转移物理行为。 协同训练的概念很简单:由于 VLA 源自通用的视觉语言模型(VLM),因此它们可以在包含动作、图像、文本和其他多模态标注(例如边界框)的任意组合的示例上进行训练。这包括通用的多模态任务,如图像字幕、视觉问答或物体检测;面向机器人的任务,如带有动作的机器人演示;以及“高级”机器人示例,这些示例由带有适当语义行为标记的观察结果组成。演示还包含“口头指令”,即一个人通过自然语言一步步指导机器人完成一项复杂任务。该模型既可以对下一步要执行的语义步骤进行高级推理(类似于思路链推理),也可以进行低级预测,以向机器人的关节输出运动指令。 π0.5 的协同训练任务示意图,其中包括来自多种不同机器人类型的各种机器人数据源,以及包括高级子任务指令、指示和网络数据在内的多模态数据。 虽然协同训练的基本原理并非新事物,但训练一个能够广泛泛化的 VLA 需要合理地组合协同训练任务。VLA 需要由多种协同训练任务组成的“课程”,以便在所有必要的抽象层次上实现泛化。在实验中,他们训练了 π0.5 模型的不同版本,这些版本排除了完整训练混合的不同部分,只留下使用在实验中使用的相同机器人收集的移动操作数据(约 400 小时)。 评估完整的 π0.5 训练混合与排除各种数据源的消减相比。网络数据(WD)在泛化到分布外对象方面的差异最大,而来自其他机器人(ME 和 CE)的数据在所有评估条件下都很重要。 他们评估了两种实验条件:全面清洁任务;以及分布外泛化(OOD)评估,要求机器人将提示中指示的特定物体移入抽屉。对于这两种评估,都测量了成功率和语言理解率。在所有情况下,来自其他机器人(ME 和 CE)的数据对策略性能产生了巨大影响。在 OOD 案例中,他们还发现与包含网络数据(WD)的策略性能存在差异,这提高了机器人正确识别数据中未包含的新物体类别的能力。 为了更好地量化 π0.5 能够实现的泛化程度,他们进行了一项扩展研究,其中改变了训练数据中不同环境的数量。他们还在比较中加入了基线模型,该模型使用所有其他数据源的数据外,还直接使用来自测试环境的数据进行训练。该模型(用水平绿线表示)可以直观地了解,如果消除了泛化到新环境的挑战,VLA 在该场景中的表现如何。 评估在与训练混合中的其他数据集共同训练时,性能如何随训练环境的数量而变化。当使用所有可用的训练环境时(图中最右边一点),π0.5(黄色)与直接在测试环境(绿色)中训练的基线模型性能相似。 这些结果不仅表明,π0.5 的泛化性能会随着训练集中不同环境数量的增加而稳步提升,而且仅仅经过大约 100 个训练环境,它的性能就接近了直接在测试环境中训练的基线模型。 训练和推理 π0.5 构建于 π0 VLA 基础之上,经过联合训练,能同时输出动作和文本标签,因此可在高层和低层控制机器人。在运行时,它先生成一个文本形式的“高级”动作,再细化为一组连续的低级关节动作(每组称为一个 50 步的“动作块”)来执行该动作。 这一流程延续了他们此前的 Hi Robot 系统思路,不同之处在于 π0.5 将高级决策与低级控制统一由同一模型完成,类似于“思维链”模式。 模型本身包含离散自回归 token 解码和通过流匹配进行的连续解码,例如 π0。离散解码路径用于推断高级动作,而连续流匹配路径用于推断低级运动命令。 π0.5 使用的高层/低层推理程序。该模型首先生成一个用语言表达的高级动作,基本上是“告诉自己”应该采取什么步骤来完成任务,然后利用其流程匹配动作专家来选择运动指令。 如果换个房子试试呢? 他们通过让 π0.5 控制机械手,在训练数据中从未见过的新房屋中完成清洁任务,以评估其泛化能力。对 VLA 来说,这是极具挑战的测试。尽管 VLA 曾展现出出色的泛化能力,如理解语义指令、与人互动、组合技能等,但这些能力多在与训练环境相似的场景中实现。 此前,他们的 π0-FAST 虽能通过 DROID 系统推广到新环境,但仅限于如移动物体等简单任务。而此次实验中,π0.5 被放入全新家庭,需完成收拾碗碟、整理床铺、清洁地板等复杂任务。这些任务不仅耗时,还要求机器人执行如用海绵擦拭等复杂动作,理解任务语义,并将其拆解为多个环节,每步都需与正确的物体互动。 最后,π0.5 模型可以接受不同粒度的语言命令,从“把盘子放进水槽”这样的高级提示,到指示模型拾取特定物体或朝特定方向移动的详细单个命令。他们在下方视频中展示了一些语言跟随的示例。 下一步:更泛化的物理智能 这项工作表明,VLA 能够实现出色的泛化能力,即便面对如清洁厨房或卧室这样复杂且多变的机器人任务,也能有效应对。π0.5 能够让机器人完成在训练数据中从未遇到过的新家庭环境的清洁任务。 尽管 π0.5 还不够完美,常在高级语义推理和动作执行指令方面出现错误,但研究人员希望,通过让机器人从多样的知识来源中学习,π0.5 能够帮助我们更接近实现广泛泛化、灵活应变的物理智能。 目前,这些机器人可以通过语言反馈进行改进;未来,它们还可能借助自主经验,在更少监督的情况下不断优化,或在不熟悉的情境中主动请求帮助和建议。尽管如此,在知识迁移、模型构建技术,以及数据来源的多样性等方面,仍有大量进步空间。 参考资料: https://mp.weixin.qq.com/s/T3sufjvlfjW5oFtWhCf9-g
AI智能体,是不是可以慢一点?ToB产业观察
Manus爆火之后,产品过度营销曾使其一度饱受业内争议——不自研大模型,而是基于第三方大模型进行工程化包装,实现通用AI智能体(Agent)的能力。在创始团队看来,极致的套壳就是一种胜利。 大模型应用套壳其实是个微妙的话题。特别是在此之前,无论是DeepSeek还是OpenAI,亦或是加入基础大模型混战的知名科技企业、AI大模型创企,都以标榜自家的基础大模型自研技术能力为荣。 也因此,大模型研发作为一项需要卷算力、卷数据、卷算法的系统性底层工程,且赢者通吃,市场的聚光灯也始终聚焦于头部企业。对于只做上层应用的AI套壳或“借鉴”企业而言,尽管市场爆发的可能性高,但始终不掌握底层核心技术,往往被认为缺乏风险承受能力。金沙江创投主管合伙人朱啸虎甚至直言:“所有AI应用都是套壳应用,说有壁垒是忽悠人的。” 尽管如此,笔者注意到,仅在一个多月的时间内,部分大模型大厂已正快速下探到Manus所在的赛道——AI智能体。而另据外媒报道,Manus背后的公司“蝴蝶效应”获得了由美国风投Benchmark领投的一轮融资,融资金额达7500万美元。该轮融资让Manus的估值提升至近5亿美元。 这种迹象表明,市场需要借DeepSeek-R1大模型普及和Manus应用爆火的催化,去化解过去企业智能化转型过程中遗留的大量业务需求和技术空白。AI智能体在产品设计、商业化服务、安全治理等方面,既是新问题,也是老问题。 大厂下探AI智能体,很努力 目前大厂正加快布局AI智能体。 据相关媒体报道,Manus出圈前后,字节就搞了至少5个团队在开发不同AI智能体产品。而据百度官方,新上线的“心响”APP则由一群95后组成的团队,在30天内研发出来。 目前字节推出了智能体协作平台“扣子空间”,通过部署多类型AI智能体,调用精通各项技能的“通用实习生”与各行各业的“领域专家”两种专业身份处理任务。基于“扣子空间”,初步提供两种专家Agent,一是针对股票分析的“华泰A股观察助手”,另一个则是针对行研分析的“用户研究专家”。 而百度亮相的体“心响”APP,则是一款宣称对标Manus的通用AI智能体,涵盖超200个任务类型,包括日常的例行任务、城市旅游规划,专业性较强的深度研究、法律咨询、健康咨询等。 而与Manus合作密切的阿里也动作频频。最早在3月份,阿里就与Manus达成战略合作,双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。近日,阿里旗下AI智能体“心流”开启了高级研究模式公测,用户可填写问卷等待邀请。该智能体宣传称能像人类专家一样,自动帮做研究、写报告、写代码。 为了进一步达成AI智能体生态的构建,上述厂商也不约而同先后拥抱MCP机制。 4月9日,阿里云百炼上线业界首个全生命周期MCP服务,同日,腾讯云上线正式发布“AI开发套件”,蚂蚁集团旗下的OceanBase也已实现MCP协议的对接。百度则引入基于百度搜索的MCP Server发现平台和MCP Server服务。目前阿里百度腾讯字节旗下一部分AI智能体产品均支持MCP协议,大厂的生态作用也可进一步凸显。 民生证券指出,A2A协议主要聚焦于智能体之间的通信,而MCP则有助于连接工具和资源。基于类MCP协议+Agentic-based决策路径将成为未来AI智能体的主流范式,大厂有望通过MCP协议引入大量生态伙伴,推动国内AI智能体产业发展。 “我们是不是可以慢一点” 但一路向前狂奔的AI智能体技术是否在迎合当下用户的真正需求? 在安全风险性层面,安全往往是验证一项技术的关键。鉴于AI智能体的设计初衷是自主执行决策、任务或目标,并且理想情况下是在无人监督的情况下,因此风险更高,必须更加密切地关注其使用情境,以降低可预见的风险。 “从整个AI智能体的技术发展来说,它不管是在“攻”还是“防”,现在都是发展初期,没有看到特别多的案例。”Gartner研究高级总监赵宇告诉笔者。 从需求侧,最近一段时间与中国企业客户的交流中,赵宇发现,“客户现在整体的认知相对不足。至少有七成或更多的客户并不了解AI智能体是什么,更罔论与之相关的安全风险。” “虽然有一些甲方IT负责人已经认识到问题,但这样的声音还不太普遍。他们希望是不是可以放慢AI的步伐,把一些配套的安全治理、风险控制等能力补充起来。”赵宇说。 例如,AI本身的幻觉、提示注入攻击、数据泄露等带来的风险问题,在AI智能体的应用中可能会被进一步放大;AI智能体自主决策的风险,无论是被恶意攻击者利用还是其本身的完备性和能力,带来的是无法防控、不可预测的风险;物理环境层面的风险,同样不容忽视。 此外,随着多智能体协作运行模式的流行,这种模式确实提高了任务效率,但也导致访问控制漏洞的出现,比如访问控制级联失控,以及资源的竞争和冲突。多个智能体协同时,风险级别与安全管理的复杂度急剧上升,传统的安全工具将很难进行监控和异常行为检测。 “多智能体在交互过程中可能需要访问相同资源或者执行任务时,可能会产生一些冲突,那么就会导致系统资源被过度滥用或者任务执行效率降低,就会影响整体的业务和系统稳定性。”赵宇指出。 而在厂商侧,由于AI智能体自身的发展还处于初期,市面上对其安全风险和控制措施的研究同样处于早期阶段。 赵宇进一步指出,部分AI厂商、大模型厂商或AI智能体厂商,都没有配备相应专职的安全团队。厂商目前交付的产品是否可以通过安全测试,或者是否存在有被攻击者可利用的漏洞,等等这些在安全性上都是存疑的。其次,现在大部分企业不管是厂商还是甲方企业,还是比较关注短期的商业利益,所以对于长期安全风险的重视程度其实也不太够。 此外,AI安全可能也需要全局性工作,很难从单一厂商的安全措施就可以覆盖掉整个链条的风险。 正确认识AI智能体 技术常有常新,无需过度画饼。到底何为AI智能体?这个概念其实已经出现审美疲劳。更快速的变化在于,围绕AI智能体(Agent)延伸而出的Agentic AI、Agentic Workflow、MCP、A2A等新名词,已经成为最近一段时间更炙手的话题。 例如,Manus演示视频展示的是一个独立的智能体:AI智能体可在短短几秒钟内对简历进行分类、对候选人进行排名,以及在电子表格中格式化数据。用户还可用于分析股票市场趋势、从互联网上抓取数据,甚至可以从头开始创建一个网站。 按照微软的说法,以后每个人都会使用多个智能体,同时会有大量专业智能体,而不是只有一个超级智能体。那么,每个智能体都有自己的角色和职责,大量多个智能体需要通过通信和协作来达成目标。这也是Anthropic、谷歌两家公司分别提出MCP、A2A的原因,其本质上都是在解决智能体搭建的效率问题。 当下来看,业内对AI智能体的实践目标是使其真正意义上适应复杂的应用场景。AI智能体要构建一个能够自主决策、与环境交互的智能体,需要解决感知、理解、规划、执行等多个环节的技术难题,且各环节之间需要高度协同,从被动执行固定指令到主动进化,其技术架构和实现方式远比传统的软件系统复杂。 比如在自动驾驶领域,当前车企针对端到端自动驾驶系统的改造逻辑,正是对传统系统中的感知、融合、预测、规划、控制、定位等技术模块进行AI融合,在业务流程上体现出的不是简单模块间的拼接。 那么,AI智能体或多个AI智能体,在主动适应复杂工作流程的过程中,就不可能像RPA等技术在严格划分的场景中有效运作,而是基于动态环境和业务流程的变化,以最佳方式实现预期结果。 因此,在应用和实践AI智能体之前,对其原理、成本及风险性等诸多需要考量的关键因素进行解构。 可能对于有多年智能化探索经验的客户而言,希望“慢一点”的本质在于,在AI智能体领域的治理能力和认知的提升,重要的不是听一个个花式技术名词,而是怎么能在大量的实践和基础夯实中找到成功的故事共鸣。
iPhone 17 Pro 新配色曝光,苹果为何如此青睐蓝色?
蓝苹果 最新爆料称,今年 iPhone 17 Pro 将采用「天蓝色」的新配色,类似今年 M4 MacBook Air 上那种带有金属光泽的浅蓝色,将取代 iPhone 16 Pro 上的「沙漠色」。 从 5 年前的 iPhone 12 开始,每年的 iPhone 不会缺席的一个配色就是蓝色,几乎成为了黑白之外的常驻的第三色——前年的 iPhone 15 甚至没有白色,不少喜欢白色的用户都选择了那个低饱和的蓝色。 关于苹果的这个「天蓝色」,我们已经在 M4 MacBook Air 评测中专门聊过。这个色阶上最浅的蓝色,在不少环境中都更像是银灰色带了一抹蓝。 刚好去年 iPhone 16 Pro 的「沙漠色」,是一种偏金属质感的亮金色,可以大胆猜测今年的「天蓝色」的 iPhone 17 Pro,可能也会是以浅色钛金属为基底,带有一丝浅蓝的光泽。 不止 iPhone,蓝色已经遍布了 iPad、Mac 在内几乎每个苹果产品线,从鲜艳的「天蓝色」,到深邃的「午夜色」,以及 iPhone 16 上带有紫色调的「群青色」,同样都是蓝色为基底,但做出了相当迥异的观感,用不同的色阶适配不同的场景。 图源:小红书@电丸便利店 爱范儿在与苹果副总裁 Bob Borchers 的专访中也提到了这个有趣的现象,得到的答复如下: 我们为每款产品量身定制颜色。比如 MacBook Air 的天蓝色版本的妙处在于,它与工业设计产生了美妙的协同效果。当你观察它时,呈现出迷人的渐变效果。所以,我们选择颜色的标准是:既要彰显产品故事,突出设计语言,又要给用户多元选择。 蓝色并不是一种常见的「自然」色,自然界鲜少有动植物或者矿物自带蓝色,因此古时候要做出蓝色颜料,并不简单。不久前,Scott Alexander 写过一篇《她的外袍颜色》,其中就讲述了中世纪由于宝蓝色颜料相当稀有,因此在那个宗教盛行的时代,只能用来创作圣母玛利亚画像的外袍。 几个世纪以来,人类不断从植物、矿物甚至微生物中提取蓝色,直到科学家发明出更廉价的合成蓝颜料,梵高才能画出最经典的《星空》。因此,蓝色普及的过程,可以说折射了科学技术的发展道路,又因为这种色彩在生物中并不多见,很自然成为技术的代表色。 于是你会发现,《银翼杀手》中充满了蓝光,而日常生活中 Windows 会蓝屏,不管是 iOS、iPadOS 还是 macOS,UI 的主题色也主要以蓝色为主。 《爱死机》中的 Zima Blue,借蓝色讨论生命的终极意义 又因为我们潜意识中将其和大海、天空的深度绑定,蓝色天然传递出可靠性与专业度的感觉,并且冷色调能给人带来沉稳和理性的视觉观感,为科技品牌所青睐,当作品牌以及产品的代表颜色。 需要补充一个「蓝厂」vivo iPhone 在很长一段时间都走的「黑、白、灰」色系,但 5C 和 XR 这两次彩色系 iPhone 的探索,蓝色都没有缺席,并且除了 iPhone 11 代代都有蓝色。 图源:512 Pixels 除了色彩品味上的偏好,苹果总喜欢推出蓝色系产品,更是一种商业上的考量。 比起强烈吸睛的红色,带有一点性别刻板的粉色,蓝色是一种普适性很强的颜色,无论男女老少都不会排斥,可以说是在因人而异的主观审美之中,求得了一个较大的公约数。 自 2000 年潘通开启年度色评选以来,蓝色系的颜色上榜过六次,是最流行的色系之一,足以见其受欢迎程度。 但不是所有的蓝色都能被用户喜爱。越浓郁的颜色,传递出来的情绪会更丰富,因此观感上会更复杂,iPhone 12 和 iPhone 13 上的深蓝色,在刚推出的时候,就收到了用户的不少吐槽。 iPhone 12 上大名鼎鼎的克莱因蓝,被吐槽「像拖鞋」,图源:Tom's Guide 与之相对,饱和低更低的蓝色,会更受到欢迎。 这其中的代表,自然是 iPhone 13 Pro 淡淡的「远峰蓝」配色,这是苹果第一次在 iPhone 上尝试低饱和的蓝色,结果不仅叫好还叫座,第三方调查显示有 37% 的用户都选择了这个配色。 天蓝色或许会很接近远峰蓝,图源:Apple Insider 这种带有金属光泽的蓝色,和「天蓝色」非常相似,不仅兼顾了 iPhone Pro 系列一直以来比较极简的配色,保持专业性的冷峻同时,也带有一丝活泼,可谓是「克制的感性」。 对于 iPhone 而言,尽管每年的更新点都有所不同,但肉眼就可感知的配色更新,总是最能成为吸引用户热议的亮点。所以说,时隔 4 代重新回归 iPhone 17 Pro 的这抹淡蓝色,不只是设计的考量,更是一个吸引眼球的由头。 没办法,在产品没有突破性进展的年份,科技也只能以「换壳为本」。
马斯克现在拥有一座城市,他说这是人类登陆火星的起点
支持者们满怀期望 反对者们深深担忧 Space X 火箭公司在美国德克萨斯州南部的总部在 5 月 3 日正式成为了一个城市,它同时拥有了一个颇具科幻色彩和未来感的名字——「Starbase」。 如果翻译成中文的话,或许可以称呼为「星舰基地」。 根据当地官方公布的投票结果,在当地居住的 218 位选民中,共有 212 票支持了将星舰基地正式设立为城市的决议,其中大部分为 Space X 的员工。 这次投票同时选举出了星舰基地的市长 Bobby Peden(鲍比·佩登),他目前是 Space X 的副总裁,其余的两位市议员也在 Space X 工作。 这意味着,Space X 公司将获得对该地区更多控制权,主要集中在城市规划、土地开发和基础建设方面,但 Space X 火箭的发射和着陆仍需要获得美国联邦航空管理局的批准,火箭发射台的废水排放、环境评估以及重大设施建设也仍将受到监管。 Space X 的火箭正在升空 马斯克在社交平台上发帖庆祝了此事,称星舰基地「现在是一个真正的城市了!」。 根据《纽约时报》的介绍,Space X 在过去的几年里一直在其发射场周围——即德克萨斯州与墨西哥边境附近建造一个类似公司城镇(Company Towns)的地方。 注:公司城镇(Company Towns)特指工业革命时期企业掌控社区资源的模式,往往带有垄断争议。 Starbase 的城市区域及边界 图片来自:纽约时报 SpaceX 同时正在申请将年火箭发射次数从 5 次增至 25 次,并尝试获得附近海滩的管理授权。 Starbase 是 SpaceX 的发射基地,从 2019 年底开始,该地成为了 Space X 火箭的重要发射场地之一。但是由于每次发射火箭或者测试引擎时,公司都需要向县政府申请关闭公众海滩和附近道路,但是审批和评估手续往往复杂繁琐,如果获得批准,Space X 不再需要申请和审批就可以关闭道路和海滩,从而可以更频繁的进行实验和火箭发射。 Space X 发射台及附近海滩 图片来自:纽约时报 在外媒曝光的一些规划图中,我们能看到星舰基地目前正在规划建设更多的员工住房、火箭制造设施和一些商业建筑,目前得知的有超市、咖啡馆、寿司店和一所投资约 2000 万美元的私立学校「Ad Astra」(拉丁语,中文含义为奔向星辰,公司子女可优先入学)。 Starbase 的部分区域规划 图片来自:纽约时报 马斯克曾多次表示,星舰基地是「人类登陆火星的起点」。通过企业闭环管理,SpaceX 可以试验资源分配、公共治理等模型,为外星殖民地积累经验。这种「地球版火星城」的设想,还包括全自动驾驶交通和太阳能供电系统。 这次投票获得成功通过对马斯克本人也意义非凡。 在过去的几个月里,马斯克因深度介入了特朗普的选举和政治活动而受到猛烈抨击,其担任美国「政府效率部」负责人期间展开的大规模裁员和削减开支的活动也引发了美国各地对他本人和特斯拉公司的大规模抗议。 Starbase 附近的马斯克雕像 特斯拉今年第一季度的营收同比下降 9%,汽车业务收入同比下降 20%,净利润同比则暴跌 71%,同时也有消息传出由于股价下跌和部分投资者的不满,特斯拉董事会开始认真考虑寻找马斯克的继任者,这一说法被后来被特斯拉董事长罗宾·德诺姆否认。 在各种压力的作用下,马斯克在 4 月 22 日的公司财报电话会议上表示,从5月开始,他将大幅减少管理政府效率部的时间,将把更多时间投入特斯拉。同时,马斯克也正准备卸任其在政府效率部的官方职务。 针对特斯拉的抗议活动 当然,这一投票结果也招致了不少批评和抗议,自2019 年建成以来,Space X 发射场就不断受到当地居民和环保人员的抗议乃至诉讼。 2024 年,Space X 公司就因为倾倒废水而被美国环境保护署和德克萨斯州环境质量委员会罚款近 150000 美元。 火箭发射时的扬尘 反对者认为 Space X 在当地的活动对周边的自然环境和社区造成了负面影响,火箭发射或者爆炸时都会产生巨大的噪音、扬起大量的粉尘并造成严重的光污染,这不仅会引发附近的建筑和道路交通问题,也对附近濒危的海龟、豹猫、候鸟等野生动物和栖息地造成了干扰和破坏。 他们担心在星舰基地正式成为城市之后,Space X 会进一步获得对周边地区的控制权,甚至能在某种程度上绕过监管,让公共资源成为私产。 抗议者们的标语 在「X」软件上有两段评论很能反映支持者和反对者们的意见。 支持者们满怀期望,「我们怀着深邃的胸怀和热忱的愿望,站在人类文明变革时代的门槛上,通过踏上前往火星、月球和星星的大胆旅程,我们拥抱作为多行星物种和航天社会的命运。」 反对者们则深深担忧,「马斯克先生,请把海滩留给地球人——至少在我们学会呼吸火星空气之前!」 发射场及其周边 文|芥末
160人卖了217亿,AI应用首个大额套现项目,CEO解密成功秘诀
编译 | 陈骏达 编辑 | Panken 智东西5月6日报道,今天,据外媒披露,AI编程独角兽Windsurf将以30亿美元(约合人民币217亿元)的估值卖身OpenAI,这也成为OpenAI史上规模最大的收购。近日,在一场长达70分钟的深度采访中,Windsurf创始人兼CEO Varun Mohan回应了外界对这家创企的诸多好奇与疑问。 Mohan认为,AI真正值得深挖的差异化价值在应用层,Windsurf的目标是每隔半年到1年就颠覆现有产品的状态。不过,要打造具备竞争优势的AI应用,不能仅靠“套壳”,也需要长期稳定的技术投入与创新。 自2024年底发布同名AI原生IDE产品Windsurf以来,该公司经历了惊人的增长:4个月内用户数破百万、年度经常性收入(ARR)超过1亿美元、企业客户数量超过1000家。 与重技术轻营销的科技创业者不同,Mohan认为“企业销售很有价值”。其市场团队规模现已超过工程团队的规模,达到80人,这也是他们开拓摩根大通、戴尔等超大型客户的关键。 目前,Windsurf的团队仅有不到160人,遵循“精简公司”理念,招聘录取率低于0.6%。Mohan称:“我们希望找到那些真正具有高度主动性的人,因为如果不去创新,不去尝试一些疯狂的事情,公司就会停滞不前,甚至死亡。” Windsurf的工作强度极高,不欢迎投机取巧、搭便车的员工,会奖励用最少资源完成最疯狂项目的员工。只有当团队严重超负荷,达到近乎“脱水”的状态时,Windsurf才会招新。同时,团队间的人员和资源流动十分灵活,可根据需求自由调配。 在采访中,Mohan完整回顾了Windsurf由AI基建赛道转至AI编程赛道的创业历程,并分享了他的创业感悟。他还谈到了AI应用该如何避免沦为“GPT套壳软件”、自研模型与外部模型的选用逻辑和他眼中Windsurf与Cursor等竞争对手的差异化优势。 ▲左为Lenny’s Podcast主理人Lenny Rachitsky,右为Windsurf创始人兼CEO Varun Mohan 以下是Mohan接受科技播客节目Lenny’s Podcast采访视频(录制于今年4月)的完整编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改): 一、手握万卡集群转型AI编程,专攻To B市场 Lenny Rachitsky:请你简单分享一下Codeium的历史,以及Windsurf是如何从Codeium发展而来的。 Varun Mohan:公司是在4年前成立的。4年前AI编程这一概念尚未出现,ChatGPT也还没有诞生。我们公司最初是在开发GPU虚拟化和编译器软件。在此之前,我从事自动驾驶汽车领域的工作。我的联合创始人,也是我从初中就认识的朋友,在Meta从事AR、VR工作。 我们都相信深度学习会影响很多行业,不仅仅是自动驾驶汽车,还包括金融服务、国防、医疗健康等领域,而且我们认为这些深度学习应用很难构建。当时,我们的产品让用户能够在没有GPU的计算机上有效地运行这些复杂应用,我们会为用户处理使用GPU的复杂问题,并大幅优化这些工作负载。 到了2022年中期,我们已经有了几百万美元的收入,管理着超过1万块GPU。当时我们只有8个人,而且实现了自由现金流为正。但我认为,随着生成式AI模型开始变得越来越好,我们构建的很多东西不再那么有价值了。 这对公司来说是一个非常艰难的时刻。当时我们只有8个人,但我们在想,人们还会继续训练那些非常定制化的情感分类器模型(用于社交媒体推荐机制)吗?还是会直接问GPT:“这是积极还是消极的情感?”可能是后者。 在一个每个人都要运行生成式AI模型的世界里,一家基础设施公司能有什么差异化因素呢?最终每个人都会运行相同类型的基础设施。 我们决定相信,生成式AI会成为下一个互联网。在这种情况下,我们应该去构建下一代伟大的应用,就像谷歌、亚马逊那样。我们进行垂直整合,利用我们的基础设施、推理基础设施去构建了当时的Codeium。 我们公司是GitHub Copilot的早期用户,也意识到编程领域在未来几年将会受到AI的巨大冲击。我们利用了我们原有的基础设施,大规模运行我们自己的模型。 在最开始我们甚至训练了自己的模型,它非常简单,纯粹是一个自动补全模型,当用户在输入时,我们会补全接下来的1-4行代码。我们目前在所有开发者使用的IDE中免费提供这个产品,包括VS Code、JetBrains、Eclipse、Visual Studio、Vim、Emacs。 我们之所以能免费提供上述服务,是由于我们具备算力基础设施的技术背景,能够大幅优化这些工作负载。不久之后,我们建立了企业业务,与戴尔、摩根大通这样的大公司合作。 对他们来说,更重要的不仅仅是代码自动补全或者与代码库对话,而是能否提供一个安全的解决方案,同时针对公司内部所有私有数据进行个性化定制。我们利用我们的基础设施,投入大量资源确保我们能深入理解这些大公司的代码库。 这就是从Windsurf成立以来到大概半年前,我们所做的业务。目前,我们的这些业务并未终止,但我们已经意识VS Code等主流IDE限制了我们能为客户提供的AI服务的上限。因此,我们决定构建我们自己的IDE,加入一些新的Agent能力。 二、Transformer一统天下后,AI的差异化价值在应用 Lenny Rachitsky:你的回答中有很多有趣的线索。其中之一就是,AI的价值究竟会在哪个环节积累?很有趣的是,你们几乎是从最底层的GPU基础设施开始,然后转向了人们所说的“GPT套壳软件”(虽然实际上不是)。在这方面,你们公司有什么经验教训可供分享吗?你认为在AI世界中,在AI工具栈中,价值最终会在哪里? Varun Mohan:也许我可以先分享一下我对创业公司的一个深刻体会。通常情况下,你最初认定要做的事情很可能并不是最佳选择,这对创业公司的创始人来说是一个非常棘手的问题。 一方面,你需要有一种非理性的乐观,坚信自己正在做的事情具有独特的价值,否则你根本不会踏上这条创业之路。如果事情是显而易见的,那么大公司早就已经做了。 但另一方面,你又必须保持高度的现实主义,因为大多数非常规的想法往往是不可行的。所以,这就像是在走钢丝,你需要在这两者之间找到平衡。你要坚定地推动自己所相信的未来,但同时,当新的信息出现时,你又必须敢于否定自己原有的信念。 从基础设施的角度来说,我们最初的假设是模型架构会非常多样化和复杂,这主要是基于我们在自动驾驶汽车领域的经验。当时,存在许多不同类型的模型架构,比如卷积神经网络、图神经网络、循环神经网络、长短期记忆网络这样的轻量级神经网络,以及点推力网络等。我们可能需要处理十几种不同的架构。 在那个时候,我们觉得这种复杂性如此之高,如果有人能够帮助用户解决这种复杂性,那么这里面就会产生巨大的价值。 然而,到了2023年中期,情况发生了变化。看起来几乎所有的东西都将是基于Transformer架构的,这说明我们之前的假设是错误的。在这种情况下,我们意识到,大部分价值可能不会仅仅积累在基础设施层面,至少这是我们目前所相信的。 那么,真正的差异化价值究竟在哪里呢?我们相信,应用层是一个可以深度挖掘的领域。在这里,我们可以通过多种方式为开发者构建更好的用户体验和更高效的工作流程。我们坚信,在如何让开发者的生活变得更好的这一点上,是没有上限的。 Lenny Rachitsky:你提到的第二个点我觉得很有趣,就是你们是如何从已经在正常运转的商业模式中转型的。你们已经在赚钱了,人们都很喜欢你们的服务,有数百万美元的年度经常性收入。 你们是如何知道该追求什么新目标的呢?我听到的一个很有趣的观点是,一旦你建立想法的基础假设发生改变,就是时候重新思考这个想法,也许尝试其他东西了。 Varun Mohan:我认为,在创业过程中我们必须接受一个事实:我们会犯很多错误——这是不可避免的。对我们公司而言,有一个关键转折点:当时我们已经融资了2800万美元,却突然决定彻底转型,而且是一夜之间做出的决定。这不是渐进式的调整,因为我们深知创业公司最需要的是专注。 如果你同时做两块业务——一边做着你认为没有价值的工作,一边又想开拓新领域——你注定会在真正重要的事情上失败。这个道理看似简单,但关键在于:你必须从一开始就承认,你的大多数假设可能是错的。你要做的是全力验证这些假设,而不是固执己见。拥有一个好想法固然重要,但绝不能对它过度执着。 我们努力打造一个追求真理的企业文化。在公司里,每个人的想法都会不断被检验。比如当初开发Windsurf时,虽然不算彻底转型,但也是一个重大决策。创业就是不断下注:有时对,有时错。但最理想的状态是,即使决策失误,团队士气依然不受影响——这样你才有调整的余地。 有个例子可以说明我们的成长速度:今年一年的工程产出量,将超过公司成立至今的总和。这意味着每年都像一次新生,让我们能测试全新的假设。也许我们最初的假设本就是错的。 Lenny Rachitsky:这太令人振奋了,让我想起Ari Levine在播客上说的话,他的T恤上有一句话“爱上问题,而不是解决方案”。这感觉就是你所描述的态度。 三、开发者工作流转变,IDE同步升级 Lenny Rachitsky:让我们来谈谈Windsurf。对普通人来说,最简单的理解方式是什么? Varun Mohan:Windsurf本质上是一个IDE(集成开发环境)——也就是用来构建软件和应用程序的工具。但有趣的是,很多使用它的人可能根本不知道“IDE”这个概念,这点我们稍后再聊。 为什么要开发Windsurf?为什么不能直接用Visual Studio Code这类传统IDE呢?当我们观察到AI能力的爆发式增长时,我们意识到技术构建方式将发生根本性变革。 传统IDE就像个文本编辑器,开发者手动编写大量代码,而系统只能提供基础反馈,比如“这里有个bug”或“编译错误”。但AI时代完全不一样了——IDE应该能直接改写整段代码。这就是Windsurf的核心突破:它代表着开发工具与AI协作的全新范式。 未来,AI可能负责超过90%的软件开发工作,在这种情况下,开发者的角色和他们在IDE中做的事情可能是审查代码。我们需要在IDE中构建自定义的审查流程,使用户更容易去做这件事,因为开发者并非把所有时间都花在写代码上。 我们构建这个产品的基本前提是:过于基础的UI界面会严重限制产品的潜力。举个具体例子——我们的自动补全功能最初只能完成简单的代码补全。但当我们推出Windsurf Tab这个新产品时,情况发生了质的变化。 ▲Windsurf Tab功能 Windsurf Tab的创新之处在于能够提供内联式的代码重构建议。在Windsurf环境中,我们可以为此打造完全定制的交互界面。相比之下,在VS Code中由于API限制,我们不得不采用变通方案:需要在用户光标旁动态生成图像,因为平台无法支持更自然的展示和编辑方式。 ▲VS Code开发界面 这个差异带来的效果令人震惊:完全相同的机器学习模型给出的修改建议,在Windsurf环境中的用户接受率直接提升了3倍。这个数据给了我们重要启示:虽然底层技术确实至关重要,但如果用户无法有效获取技术创造的价值,那么技术优势就会被严重浪费。 这个案例让我们确信:有时候构建一个全新的交互界面和用户体验层(就像Windsurf所做的)可能才是释放技术潜能的正确方式。优秀的用户体验设计能够将技术优势转化为用户可感知的实际价值,这正是我们产品演进的关键方向。 四、自研模型与外部模型并行,拥有独特代码库演变数据 Lenny Rachitsky:Windsurf使用的模型是Claude Sonnet系列的吗? Varun Mohan:让我来解释一下Windsurf的工作机制。我们使用了一个非常强大的规划模型,比如Claude Sonnet系列模型,它在规划方面表现出色。GPT-4o也不错。我们会尝试让Anthropic的Claude Sonnet系列模型尽可能多地进行高级规划。 之后,我们会运行公司内部的模型,为Agent提供高质量的检索支持。Agent需要理解代码库的其余部分到底有什么功能,我们的自有模型会分解并理解整个代码库。 如果代码库有1亿行代码,我们不可能把它全部发送给Anthropic的模型。这不仅是因为它包含超过15亿个tokens,远远超出目前最大的上下文长度(超出三到四个数量级),而且从成本和延迟角度来说,这么做也不划算。 另一方面,我们的模型能够非常快速地对软件进行编辑。我们有一些基于流行开源模型进行后训练的定制模型,它们可以快速地对代码库进行编辑。我们选择这么做,是因为这样速度更快,而且这些模型能够在上下文中包含更多的代码库,从而比Anthropic的模型更好地应用更改。 我们的目标始终是构建最好的产品,尽可能提高上限。我们会根据需要构建和训练模型,但如果在某项任务上,开源模型或Anthropic的模型表现更好,我们就会直接使用它们。 Lenny Rachitsky:你们构建的模型,都是基于开源模型的吗? Varun Mohan:负责检索的模型是我们完全自主研发的。但很多负责其他功能的模型是基于开源模型的。负责编辑和自动补全的模型,这也是内部开发的。就像你在输入时,我们会做一些与自动补全相关的事情。 我想我们看待问题的方式是,我们能做到最好的部分,我们就去自行训练模型,但我们不会仅仅为了自尊心,而去做一些我们做不好的事情。 Lenny Rachitsky:有没有什么训练模型相关的趣事? Varun Mohan:一个有趣的事情是,我们从用户那里得到了大量反馈,每小时可能有数千万条。这些反馈包括用户对我们产品的喜好和不满,尤其是关于自动补全功能的偏好数据。这些数据很独特,因为它们来自用户输入时的代码片段,通常是不完整的,而不是像在GitHub上那样完整的代码版本。 我们拥有大量这种不完整的代码数据,这让我们在开发代码补全模型方面具备独到优势。现有的前沿模型很少接触这种类型的代码,所以我们利用这些偏好数据来训练模型,努力做得更好。 对于检索来说,情况也是一样的。我们可以通过用户是否接受检索后的代码更改来判断检索是否准确。这是一个很好的反馈信号。 我们的思路是,对于单纯的代码规划,AI很难提出一个连贯的论点,我们也没有特别的理由认为自己在这方面会做得最好。但如果是面对一个复杂的中间代码库,需要进行一些更改,我们就有优势了。因为我们看到了代码的演变,积累了数百万用户的代码演变数据,我们觉得自己可以在这方面做得很好。 Lenny Rachitsky:我觉得有趣的是,这是另一个差异化因素,也是公司在这个领域最终能够胜出的原因。如果你处于领先地位,你就会比其他公司拥有更多的数据。 Varun Mohan:是的,这也是我喜欢从零开始构建产品的原因。这是一个很有潜力的领域,但最终还是要看对代码的理解。否则,你就会陷入一个很模糊的境地,搞不清楚自己到底比别人强在哪里,公司也就很难找到明确的竞争优势和差异化的发展路径。 Lenny Rachitsky:如果只是简单地依赖像Claude这样的基础模型,和市面上那些只是给Claude套个壳的应用做同样的事情,那根本谈不上什么差异化。 Varun Mohan:这其实也取决于具体的做法。但如果只是处理一些很高级的网页元素,界面做到一定程度后,很难比现有的前沿模型做得更好。这种情况下,还不如直接接入这些现成的模型,直接拿来用。 五、AI编程解放工程师,回归工作本质 Lenny Rachitsky:你们当时做的一个大胆决定是,最初客户都在熟悉的现有IDE中工作,但后来发现这无法满足需求。于是你们决定说服大家切换到一个全新的东西,因为它会好得多。我觉得很多人可能没有意识到,说服工程师去使用一个全新的工具有多难。这确实是一个巨大的挑战。 Varun Mohan:是的,当然。Lenny,有一点很重要,很多开发者确实使用Visual Studio Code,但也有很多人用Java、C++等语言编程。他们可能用JetBrains家族的IDE,比如IntelliJ。 对我们来说,我们仍然会在这些平台上构建产品。我们只是觉得,Visual Studio Code虽然是一个主导性的IDE,但它限制了我们能给客户提供的用户界面。 Lenny Rachitsky:Windsurf目前的发展势头如何?我听到你们这个领域里其他竞争对手的数字都很惊人,你能分享一些数据,让大家了解一下吗? Varun Mohan:嗯,有几个数字可以分享。我们在4个月前推出了这个产品。在这段时间里,超过100万开发者试用了这个产品。当然,我们也有数十万的月活跃用户。 Lenny Rachitsky:你认为在未来几年的编程会是什么样子?会与今天有多大的不同? Varun Mohan:工程师主要做三个方面的工作,对吧?首先是“我应该解决什么问题?”,然后是“我应该如何解决它?”,最后就是“去解决它”。 每个在这个领域工作的人可能都越来越确信,所谓的“解决它”,其实就是“我知道该怎么做,然后就去做”。随着AI的发展,AI可能会处理绝大部分执行工作。 随着我们公司在理解代码库方面的工作日渐深入,这种“我应该如何解决”的问题也会逐渐清晰。如果你深入理解了组织内部的环境和代码库,并且考虑到最佳实践,那么“我应该如何解决它”就会变得更加明确。当公司也明确了这些问题后,整个解决方案也就水到渠成了。 所以我认为,工程开发最终会回归到最初希望工程师做的事情:我们需要解决哪些最重要的业务问题?我们的应用程序或产品需要具备哪些最重要的功能?去优先考虑这些,并做出正确的技术决策去实现它们。我认为这就是工程开发可能的发展方向。 六、计算机专业的价值,在于问题解决能力的培养 Lenny Rachitsky:这是否意味着没有人需要计算机科学学位呢? Varun Mohan:这个观点有些夸张了。现在很多构建全栈应用的开发者,至少在几年前,他们可能上过大学并学过操作系统课程。 理论上,他们并不是真的经常去深度使用操作系统,比如内核调度器之类的,但这些原理帮助更好地理解开发过程中遇到的问题,比如为什么他们的应用程序很慢?为什么某些设计决策比其他的设计更好? 这种对底层原理的理解,不仅使他们成为比其他工程师更好的工程师,而且也赋予了一群从未真正理解这些原理的人实际构建复杂系统的能力。这本身就是整个技术发展过程中一个值得注意的现象。 Lenny Rachitsky:我不知道你是否有孩子。假设你有孩子或者亲戚要上大学,你会建议他们学计算机科学吗? Varun Mohan:会的。我毕业于麻省理工学院,公司里工程团队的很多人都是校友。其实,我们在工程计算机科学中学得最多的并不完全是如何写代码,更多的是如何思考问题、如何分解问题的原则,以及如何用一种有趣的方式解决这些问题。 举个例子,我很喜欢的一门课是分布式系统课。这门课上要阅读文献,并理解一些设计决策是如何做出的。我认为这更像是一门解决问题的课程,这个专业也正是关于如何在当前计算机的约束条件下,解决具体问题。 比如这是内存运行的速度,这是你在1个周期或1秒内可以进行的运算数量。基于这些,你需要做出一些权衡并解决问题。在这种情况下,计算机科学几乎就是问题解决的代名词。 Lenny Rachitsky:我听到的是你仍然想要培养的技能,无论计算机科学专业如何演变,学生都需要构建关于计算机和系统如何工作的心智模型,了解并行处理、内存、硬盘、互联网之类的东西,然后就是解决问题的技能,能够解决有趣的问题。随着AI的兴起,你认为人们还应该投资哪些技能? Varun Mohan:我认为一个可能被低估的重要特质是主动性。在大学里,学生们往往被明确告知该做什么,沿着既定的路径前进。 然而,我认为在社会和学校中,我们可能没有足够重视那些真正具备主动性的人。这些人渴望去创造和建造,他们的目标不仅仅是从大学毕业,然后进入一家大科技公司,按照既定的指令去工作,比如在这个网站上把像素放在哪里。 我认为这种主动性在过去10年左右可能一直被低估。但如今,它正变得越来越重要。对于创业公司来说,这是一项至关重要的技能。显然,这也是我们正在寻找的特质。 我们希望找到那些真正具有高度主动性的人,因为我们深知,如果不去创新,不去尝试一些疯狂的事情,公司就会停滞不前,甚至死亡。所以,我们正在努力寻找这样的人才。 不过,我必须指出,对于大多数软件工程岗位来说,情况可能并非如此。只要看看某某大公司的招聘要求,以及一般的软件工程面试流程,你就会发现,这些场景中可能并不特别强调主动性。 七、遵循“精简公司”理念,团队超负荷才会招新 Lenny Rachitsky:让我们谈谈招聘,我知道你们公司试图保持精简,这是现在所有AI创业公司的共同主题,你如何知道什么时候该招聘某人? Varun Mohan:我喜欢精简公司的理念,但我不会把它神化。比如说,我们不会盲目追求成为那种凭借10%或20%规模,获得5000万、1亿、2亿这样的收入的企业——这不是我们在内部推崇的东西。我们真正推崇的是:成为能够实现我们野心所需的最小规模公司。这才是目标。 打个比方,Lenny,如果我告诉你:“嘿,我要造一辆自动驾驶汽车,而我的团队只有10个人。”你肯定会理所当然地说:“Varun,你不是认真的吧?”——你说得对,因为在那样的规模下,我确实不可能是认真的。所以关键在于:要实现你那个疯狂的雄心壮志,最少需要多少人? 我们正在尝试的项目,是要彻底改变软件的构建方式——我们在内部经常提到这一点。我们的目标是将开发应用程序所需的时间减少99%。这非常雄心勃勃,长远来看,我们不可能仅靠10%、20%、30%或40%规模的工程团队来实现它。我们认为这里的上限非常高,这是第一个关键点。 如果能成为一家规模很大、却依然像创业公司一样运作的企业,那才是真正的理想状态。这就是梦想。 在招聘理念上,我们的原则是:只有当某个职能确实超出我们的应对能力时,才会招人。比如我们正在开发推理技术——除非团队已经超负荷,否则我们不会轻易增加人手。原因很简单:如果你为一个职位招人,但并不真的需要他们,最终往往会产生一些奇怪的职场政治问题。 这并不是因为人们不好——大多数人的初衷都是好的。但当你招了并不真正需要的人时,会发生什么?他们会自己找点事情做,对吧?这是人之常情。他们会去说服组织:“这件事很重要。”但事实上,它可能并没那么关键。作为创业公司,我们根本没有精力应付这些。 对我来说,理想的状态是,每个人都像在举手求救,仿佛在说:“我真的撑不住了,我们真的需要多一个人。”这时候我们才会招人。我喜欢用一个比喻:我希望公司像一个脱水的实体,每次招聘就像补充一点水分——只有当我们再次脱水时,才会去招人。 八、公司凭借单点突破取胜,奖励用最少资源完成项目的员工 Lenny Rachitsky:我非常喜欢这个比喻。听起来很痛苦,你需要等到应付不过来,然后告诉老板,我快要“脱水而死”了,但我也知道这是一种非常令人兴奋的工作方式。 Varun Mohan:这种模式其实有很多优点。我们非常尊重和信任在公司工作的人,这反过来又迫使我们进行优先级排序。 团队永远不会要求去做不重要的事情。事实上,如果他们手上有两件事情,他们会告诉我:“嘿,我手上有两件事。我没办法同时做两件,我只能做一件。”然后他们会优先选择最重要的那件事。 这其实回到了一个我认为对创业公司和传统公司都适用的原则:你不是通过把10件事情都做得还行来获胜的,而是通过把一件事做得非常好来获胜。也许你在其他9件事情上会失败,但这并不重要。这是我经常告诉团队的事情。 这和学校很不一样。在学校里,你的目标是优化总GPA分数,但对公司来说,我只需要在最重要的那件事上拿到A+,其他事情上拿F都没关系。当然,这里的F并不是指做错事,而是说降低那些不重要事情的优先级。这种模式实际上迫使组织进行优先级排序,这真的非常好。 而且,Douglas(Windsurf联合创始人)和我,我们可以明确地告诉团队,这是目前最重要的两件事。但如果我们在说这两件事是最重要的同时,又让团队的工作量增加了20%,那最终会发生什么呢? 这几乎是一个强制机制,迫使我们进行优先级排序,确保公司内部的人员不会被过多的任务压垮,或者避免那些已经应接不暇的人被逼到极限。 Lenny Rachitsky:每个在大公司工作的听众肯定都能理解你说的情况。当公司人太多的时候,每个人都得找事情做,他们也会提出各种想法。你知道,他们都想展示自己的影响力,想在绩效评估中表现得更好。这就是大公司人多的典型现象。 当你们公司有人实在应付不过来的时候,他们是怎么向你表达招人的需求的? Varun Mohan:当面临在短时间内完成某件事情的压力时,我们有一个核心信念:对于软件开发来说,如果想做出真正伟大的成果,就不能简单地说“我想在一个月内完成”。 除非你认为自己比其他人聪明得多,否则按照这个时间尺度,根本打造不出拥有高复杂性和差异化的产品。 我们确实拥有一个非常优秀的工程团队,但我们也不认为我们的团队优秀到可以在三周内完成其他人需要6到9个月才能完成的事情。相信自己能做到这一点其实是有点愚蠢的。 我们的招聘流程有着极低的录取率,不太可能很快地找到合适的人才并让他们加入公司。这点所有人都很清楚,无论是那些想要更多人手的人,还是对我们自己。 我们还努力确保在工程团队中,一个人对公司创造的价值与他所在的团队规模无关。公司内部有一些项目是由直接负责的个人来推动的。如果一个项目很重要,那么人们可以从一个项目转移到下一个项目。 公司里不存在“某人拥有某个团队”的概念。公司最有价值的人是那些能够用尽可能少的人完成最疯狂项目的人,这才是我们应该在内部奖励的。 Lenny Rachitsky:目前Codeium有多少人? Varun Mohan:我们有接近160人,工程团队超过50人,市场营销团队规模也不小。 九、招聘实际录取率低于0.6%,工作强度极高 Lenny Rachitsky:我们谈到了如何判断什么时候该招聘,那你在面试和招聘的人身上寻找什么特质呢? Varun Mohan:我们在招聘时非常注重的一个关键点是,我们有很高的技术门槛。假设候选人确实达到了技术要求,我们真正寻找的是那些对我们实际要解决的使命充满热情,并且愿意努力工作的人。 我们不会试图说服人们:“我们是一家很轻松的公司,在这里工作很棒。”相反,我们会坦诚地说:“这是一个非常令人兴奋的领域,但竞争也非常激烈。如果公司的人不够努力,我们可能就会失败。” 我认为我听到的最大的警告信号之一是,当我问候选人:“你愿意多努力工作?”有些人最终会回答:“我更喜欢用巧劲(work smart),而不是单纯靠努力。” 这时,我通常会问他们一个问题:“如果我们的公司有很多聪明且努力工作的人,你的差异化在哪里?”这种候选人只会拖累团队。 公司就像一个巨大的团队项目。当公司有数百名工程师时,问题不在于那个不尽责的工程师本身,而在于他们所在的团队。团队会有疑问:“这就是公司内部的标准吗?这是我们的期望吗?” 如果告诉你,团队里其他四人都不在乎这个项目,你会觉得自己该有多在乎呢?肯定不会太多。 对我们来说,更重要的是打造协作文化,工作不是单打独斗,人们知道可以依靠其他人来完成复杂的任务。 Lenny Rachitsky:你问的问题本质就是:“你愿意多努力工作?”有许多人会追求工作与生活的平衡,他们会想:“你怎么敢要求我工作那么长时间?” 我很喜欢你们一开始就说明白:如果你在这里工作,就得非常努力,加班加点。这是一个竞争激烈的领域,我们靠聪明工作和努力拼搏来取胜。你之前提到过,你们工程师的录取率大概是候选人的0.6%? Varun Mohan:0.6%可能是完成面试题之后最终留下来的比例。面试题本身就筛选掉了可能10到15倍的人。 Lenny Rachitsky:我最近经常听到这样的问题——随着像Windsurf这样可以解决许多问题的工具出现,你们到底要如何进行面试工作? Varun Mohan:我们允许候选人使用AI工具,因为我们相信这些工具能大幅提升生产力。如果有人加入我们却不习惯使用这些工具,那会是个问题。 我们也会邀请候选人到公司现场,观察他们如何在白板上思考问题,以及他们的临场发挥能力。我们希望看到的,不是他们简单地把问题输入语音转换器,然后扔给ChatGPT来获取答案。我们有办法甄别这一点。 我的观点是,工具固然重要,但我们更看重的是解决问题的能力。如果一个人解决难题的唯一方式就是依赖ChatGPT,那对我们来说可能就不太合适了。 十、市场营销并不可耻,是ToB业务刚需 Lenny Rachitsky:好的,接下来谈谈你们的市场营销经验。和大多数人一样,你们一开始时没有销售团队,但你们意识到这是一个巨大的失误,也意味着机会。现在你们的销售团队和市场营销团队规模很大。 Varun Mohan:是的,我们在公司历史的早期就做出了这个决定。一年多前,我们聘请了一位销售副总裁,现在公司内部的市场营销团队已经超过80人(目前公司有近160人)。这在公司内部是一个相当大的职能部门。 这里有一点背景故事——当我们创立公司时,我们有几位天使投资人是市场营销从业者。其中一位是Carlos Delatorre,他曾是数据库公司MongoDB的首席营收官(Chief Revenue Officer)。 我们从来没有把销售看作是一件负面的事情。我认为销售其实很有趣。不过,有些创始人并不喜欢销售,他们觉得销售是业务流程中比较负面的部分,认为一切都应该靠产品自身来推动增长。 事情并不是非黑即白的,企业销售其实很有价值。不过,也许是因为我们当时是一家GPU虚拟化公司和基础设施公司,我并不知道如何扩大销售职能,所以没有雇用销售人员。当时,我就是那个负责销售产品的人。 说到底,如果我连逐步销售产品都做不好,那我就不知道我们如何能把销售变成一个可扩展的流程。如果我自己都做不到,又怎么能让别人来扩大规模呢? 另一方面,对于Codeium来说,有很多大企业主动找上门来。到了2023年中期,我们开始行动起来,我和公司其他几位同事一起开始着手销售产品。我们同时和大企业开展了数十个试点项目。通过这些项目,我们很快意识到,在这个领域,我们需要建立一个面向大型企业的运营模式。 到了2023年底,我们果断聘请了一位销售副总裁,随后很快就把销售团队扩大了。试想一下,如果你想把产品卖给财富500强企业,仅仅靠刷信用卡肯定是行不通的。 十一、产品可理解超大规模代码库,是重要差异化优势 Lenny Rachitsky:让我们谈谈Cursor。我不想在竞争对手身上花太多时间,但这是每个人在想到你们时总是会想到的。我认为你们在这个领域算是领先的玩家。你们与Cursor的不同之处是什么,以及你们认为如何能在这个领域长期领先? ▲Cursor开发界面 Varun Mohan:我可以分享几点。在产品方面,我们投入了大量精力,以确保对超大规模代码库的理解能达到非常高的质量水平。这其实也是我们最初的起点。 我们与世界上一些最大的公司合作,比如戴尔和摩根大通。像戴尔这样的公司,单个代码库就超过了1亿行代码。能够快速理解这些代码库并进行大规模修改,是我们花费了很多时间去攻克的难题。 为此,我们建立了一套自己的模型,能够在数千个GPU上并行处理这些庞大的代码库,并对它们进行排序,以便找出对任何代码库问题来说最重要的代码片段。基于我们的基础设施背景,我们搭建了大型分布式系统来完成这项工作。这可能是一点。 Lenny Rachitsky:我想补充一些,我认为人们可能会低估这点有多重要。之前我们播客也采访了Bolt和Lovable(均为AI编程创企)的创始人。这些公司的产品是为了从头开始构建产品,为你写代码。 相比之下,Windsurf可以加载数千万乃至上亿行代码,比如Airbnb或Uber所拥有的代码库,理解企业有什么代码、这些代码如何工作,哪些地方可以修改而不会出故障,这是非常困难的。这是一个很大的差异化因素,Windsurf现在正在这个优势上继续发展。 Varun Mohan:是的,没错。我们花了很多时间在理解代码库。另一件方面是要理解所有与代码库相关的用户交互。我们的服务不仅仅局限于Windsurf,也非常专注于支持像JetBrains这样的IDE。 70%到80%的Java开发者在基于JetBrains的IDE中编码,我们不需要去构建一个与JetBrains竞争的产品,JetBrains是一个非常可扩展的产品,而VS Code则不是。 对我们来说,我们的目标不仅仅是满足可以切换到我们IDE的用户子集,而是我们想给每个开发者这种Agent开发体验。如果这意味着有Java开发者在JetBrains中写代码,那也没问题。 Lenny Rachitsky:有趣。所以你是说JetBrains是一个非常大且可扩展的产品,你们不觉得有必要直接与它竞争。相反,你们想要增强开发者的体验,不管他们使用什么IDE。 Varun Mohan:没错。我们与许多拥有超过1万名开发人员的大企业合作,其中超过50%的开发人员使用JetBrains。JetBrains是一个非常庞大的产品。 JetBrains公司本身是一家私营企业,每年能创造数亿美元的收入。这是一家非常非常大的公司。对我们来说,这正是另一个关键点。我们希望在开发人员所在的地方与他们相遇,无论他们使用什么平台,我们都会提供支持。 我们在安全性方面也有优势,这对许多企业而言很重要。Windsurf获得了FedRAMP认证,这意味着我们可以向大型政府机构销售产品。 Windsurf还配备混合使用模式,这意味着所有存储在用户端的代码都保留在用户的管辖范围里,而代码是公司最重要的知识产权之一。从大公司的角度来看,我们具备处理复杂问题的经验。 十二、如何用好Windsurf?需求明确与耐心是关键 Lenny Rachitsky:好的,Varun,我们别再卖关子了。来做个Windsurf的现场演示,让大家看看它是什么样的。我会在演示过程中问你一些问题。 Varun Mohan:好的。先说一下背景:这是一个非常基础的React项目。现在里面什么都没有。如果你打开任何文件,它就是一个默认的React应用项目。 你可以给Windsurf发送一张图片,告诉它你希望项目看起来是什么样的。我这张草图画的就是一个“狗狗版Airbnb”网站。 Windsurf的优势之一就是可以在既有的项目上进行开发。我们要做的就是告诉它:“把这个React应用改造成一个基于这张图片的狗狗版Airbnb网站,并进行预览。” 它会开始执行代码,读取代码库。它不知道当前代码库的实际样子,所以它会去分析代码库,找出需要进行的更改。我们可以先等一等,看看它会怎么做。不过,我们也可以边等边继续聊天。 Lenny Rachitsky:我想问你一个问题,如果你能坐在每个第一次打开Windsurf的用户身边,在他们耳边悄悄说几句话,帮助他们更好地使用你的产品,你会说些什么? Varun Mohan:第一条建议就是要有耐心,既要耐心又要明确需求。当你要求应用程序去做一些更改时,它可能会做出许多不相关的更改。而我认为最能避免这种情况的就是尽可能明确你的需求。 我建议人们一开始先从小的更改开始。如果有一个很大的目录,不要一开始就重构整个目录,因为如果错了,它可能会破坏20个文件。用户会逐渐了解产品的优点和局限,并懂得怎么从中获取价值。不过,每3个月左右,产品能力就会需要重新评估。 Lenny Rachitsky:隐含的意思是,要对模型的能力有一个直观上的感觉——明白自己的需求该具体到什么程度,又可以抽象到什么程度。随着时间的推移,你会逐渐建立起这种感觉。 十三、AI深度理解用户行为,可准确预测用户意图 Varun Mohan:我们现在已经有了网页预览,不仅可以修改代码,还能指向不同的部分,进行针对性修改。比如让直接选中一个元素,让Windsurf将其背景改为红色。产品能够实时展示应用的构建过程,这一点很有帮助。 你可以完全在应用层里操作,甚至不需要查看代码。当然,这个修改看起来很糟糕,但从某种意义上说,如果我想这么做,我就可以去操作。 我们只有很多交互方式,不仅仅是通过点击来更改组件。就像我之前说的,AI的目标现在已经发生了很大变化,它现在可以为你修改大量的代码,而开发者的任务现在变成了审查AI生成的代码。 在这次播客中,我不会审查所有生成的代码,但假设我想修改其中一些代码。比如我想把变量从“title”改成“titleStr”,我只要手动修改一个,然后告诉AI继续执行。 Windsurf不仅知道Agent做了什么,它还知道用户做了什么。我们的目标是让用户所做的每一件事,AI也都知道,并且能够预测意图。因为它对代码库有深入的理解,它应该能够找到所有需要更改的地方。 它能够在应用空间操作,还能在用户的代码空间中进行操作,弥合两者之间的差距。它不仅为非技术人员构建应用提供了便利,也为亲自编写代码的开发人员提供了便利。 有趣的是,上方案例中的模板应用也是由Windsurf生成的。我们的大多数用户都是在0到1构建应用。 当我们推出Windsurf时,我们让公司里的每个人都用它构建一个应用,包括市场团队和销售团队。有一个令人惊讶的统计数据:我们节省了超过50万美元的SaaS产品费用,因为我们现在的市场团队已经用Windsurf构建了应用,而不是购买它们。 例如,我们的合作伙伴关系负责人没有购买合作伙伴门户产品,而是自己开发了一个。他以前从未开发过软件,但我们设法在公司内部安全地部署了这些应用,为我们公司开发高度定制化的软件,以更高效地运营。半年前我完全没有预料到这点。 十四、垂直领域软件将遭受AI猛烈冲击,本地开发模式不会消失 Lenny Rachitsky:你不需要说出具体的公司名字,但我想知道,有越来越多的开发者和公司自行打造产品,对SaaS企业来说,哪些领域你们最不看好? Varun Mohan:我的观点是,那些非常垂直化的细分产品将会面临巨大的竞争。以销售产品为例,在我们这样的公司内部,很难让顶尖工程师去构建一个世界级的销售产品。他们对这类任务没有足够的兴趣,或者去构建投资级的法律或金融软件产品对我们来说也非常困难。 这些SaaS企业的护城河在于,他们对打造这些软件有自己的想法,并且有足够的工程师去实现软件开发。而我们公司不愿意做这件事,所以以前我们总是出去购买软件,因为没有其他选择。 但现在有一个令人兴奋的变化:领域专家可以构建他们最终想要的工具。这些垂直领域的软件公司为什么能够存在呢,原因在于它们有很多功能。这种“大杂烩”的功能对很多公司来说都适用,但每个单独的公司可能只需要其中的10%的功能。 但问题是,每个单独的公司都没有能力维护或构建针对这10%功能的定制软件。但现在这一切都改变了,他们现在可以做到了。现在可能只需要5分钟,甚至可以更贴合你的系统。 Lenny Rachitsky:现在,业务人员不需要知道任何关于产品构建的知识。只要用一种很糟糕的方式描述一下,就像是一个糟糕的产品经理在向工程师提需求。但令人惊讶的是,AI真的能做出不错的产品。 Varun Mohan:完全正确。这表明能动性是很重要的。如果产品经理有一个想法,就没有理由不让这个想法更完善。其实有许多产品经理总是有想法,但他们对如何执行这些想法非常不确定。现在,那些有想法、有能动性的人,可以自己去证明他们想要的东西,而不需要任何外部资源。 Lenny Rachitsky:我想谈一个很重要的点。你提到Windsurf不需要从样板代码库开始,它不是一个抽象化的应用构建器,而是一个实际的IDE。它在本地机器上运行,而不是云端。这很重要,因为它允许用户在本地运行并使用所有必要的库。 Varun Mohan:是的,这很重要。很多开发者喜欢在本地构建,因为有些依赖项很难在云端安装,比如Nvidia的驱动程序。我们希望为用户提供在任何环境下都能高效构建的灵活性。本地IDE和开发方式已经存在了几十年,短期内不会消失。 十五、每隔半年到1年颠覆产品状态,永远都需要更多工程师 Lenny Rachitsky:你们的团队结构和运营方式很有意思。处于产品团队运作的前沿,每天都在探索未来,你们的团队结构、工程师、产品、设计等方面有什么独特之处吗? Varun Mohan:我们的核心工程团队没有传统的产品经理。因为我们为开发者构建产品,从某种意义上来说,我们的开发者更像传统的产品经理。如果我们的产品没有价值,那可能就是我们招错了人。 在企业端,我们需要与很多大型企业合作,这些需求不是工程师能直接理解的。比如,客户可能会要求FedRAMP合规性,这需要专门的产品战略人员来理解客户需求并结合我们的技术能力,以构建一个能够帮助客户大规模扩展的产品。 不过,大部分情况下,我们是一个以开发者为基础的产品。 Lenny Rachitsky:你们的工程团队结构是怎样的? Varun Mohan:我们的团队结构很扁平,尽量采用“两个披萨团队”的模式(亚马逊贝佐斯认为,如果两个披萨还不足以喂饱一个团队,那这个团队规模就太大了),保持小规模。 团队规模太大时,领导者很难深入了解技术细节,而在这个快速变化的领域,纸上谈兵是很危险的。我们的团队非常灵活,能够快速调整优先事项。 Lenny Rachitsky:你们有多少产品经理? Varun Mohan:我们有近160名员工,其中3人负责产品战略的工作。我们还有招聘、财务、营销等内部职能。 Lenny Rachitsky:你们还在招聘工程师,尽管有人说AI将编写90%的代码。这是否矛盾?会不会有一天你们不再需要这么多工程师? Varun Mohan:这取决于增加工程师是否能带来额外价值。AI编写了大部分代码,但这并不意味着工程师生产力提高了10倍。工程师的工作不仅仅是写代码,还包括审查、测试、调试、设计和部署。 即使AI提高了部分效率,但考虑到技术需求的复杂性,我们可能永远都需要更多工程师。 Lenny Rachitsky:对于像摩根大通这样的大公司,每年有170亿美元的软件预算和超过5万名工程师,你们的产品能帮助他们提高效率。 Varun Mohan:摩根大通这样的公司意识到,技术开发的回报率提高了,不投资更多技术的机会成本也增加了。这意味着他们需要招聘更多工程师,而不是减少。 Lenny Rachitsky:这是对工程师职业的一个有利信号。如果像你们这样的公司开始减少工程师招聘,那可能是行业的危险信号。 Varun Mohan:是的,目前大家都在积极招聘工程师。我认为进入工程领域仍然是一个很好的选择。 Lenny Rachitsky:在构建AI产品和Windsurf的过程中,你学到的最反直觉的事情是什么? Varun Mohan:一个奇怪的现象是,大家都在关注短期内的胜利,比如每周的更新。但我们公司内部更关注长期目标,比如3到9个月后的事情。我们的目标是每隔半年到1年就颠覆现有产品的状态。这种长期投入才是我们成功的关键。 Lenny Rachitsky:这让我想起Captions公司说他们有两份路线图:一份基于用户反馈和数据,另一份是基于对未来的押注。这是很明智的。在创立Codeium之前,有没有一件事,是你希望你能提前知道的? Varun Mohan:我希望我能更谦逊,更快地接受自己可能是错的这一事实。很多时候,我们事后发现,如果早几个月做出某个决定就好了。 虽然外部看来这些决定很及时,但内心总希望更早行动。我们需要更频繁地重新评估假设,即使这让人不舒服。 Lenny Rachitsky:在结束之前,你还有什么想和听众分享的吗? Varun Mohan:认为最好的办法是亲自去尝试这些工具。在未来一年里,能够充分利用这些工具的人将获得巨大优势。很多人甚至不知道这些工具的存在,他们将会非常低效。所以,尽快去尝试,看看这些工具如何帮助你和你的团队。 用它来构建应用,修改现有的代码库。如果你是一个产品经理,能够快速修改代码并推送更改,你会赢得工程师同事的尊重,也能完成更多工作。这个工具的潜力是无限的。 Lenny Rachitsky:这一点被低估了。Windsurf不仅可以构建新应用,还可以修改现有的代码库。比如在摩根大通这样的大公司,你可以直接用它来完成任务,然后推送到GitHub并发起拉取请求。 Varun Mohan:是的,现在一切都开放了,工作不再受限于角色。这是一个机会,让公司的基层到高层都能发挥作用,更高效地工作。
联合国开发署:AI成全球发展新曙光,中国领跑AI赛道
IT之家5月6日消息,联合国开发计划署今天(5月6日)发布《2025年人类发展报告 —— 抉择时刻:人工智能时代的人类与可能性》报告,指出人类发展进程正经历前所未有的放缓,而人工智能有望为发展注入新动能。 IT之家注:该报告综合健康、教育和收入水平等维度,用“人类发展指数”来评估全球发展进程。数据显示,2024年全球所有地区的人类发展指数增长均陷入停滞。 报告包含的一项最新调查显示,民众对人工智能带来的变革既保持理性认知,又怀有积极期待。 全球半数受访者认为自己的工作可能被自动化取代。而更大比例(十分之六)预期人工智能将为就业带来积极影响,创造当今尚未出现的新职业机会。 仅有13%的受访者担忧人工智能会导致失业。相比之下,在中低人类发展水平国家,70%的民众预计人工智能将提升工作效率,三分之二的人计划在未来一年内将人工智能手段应用于教育、医疗或工作领域。 报告指出中国在研究、机器人技术和数据生态系统领域占据核心地位,肯定了中国在人工智能研究领域所处的全球领先地位,尤其在机器人技术和计算机视觉方向表现卓越。 中国在留住顶级人工智能人才方面取得重大突破 ——2023年有47%的海外培养中国人工智能人才选择回国发展,较2019年29%的比例实现大幅提升。 与美国侧重自然语言处理和人工智能安全不同,中国的人工智能发展更加注重工业应用(如机器人技术),形成差异化发展路径。 开发署署长施泰纳表示: 过去数十年来,世界本有望在2030年前实现极高人类发展水平,但当前的发展减速对全球进步构成了真实威胁。 在人工智能快速渗透人类生活各个方面的当下,我们应该重视其促进发展的潜力。几乎每天都有新能力涌现,虽然人工智能并非万能灵药,但我们所做的选择将可能重燃人类发展之火,开辟新的道路与可能。
曝OpenAI史上最大收购敲定
作者 | 陈骏达 编辑 | Panken 智东西5月6日消息,今天,据彭博社报道,OpenAI已同意以约30亿美元(约合人民币217亿元)收购AI编程创企WindSurf(前身为Codeium),这将成为OpenAI迄今为止最大规模的收购案。 WindSurf成立于2021年,创始人为Varun Mohan,创始团队主要为一批毕业于麻省理工学院的工程师。WindSurf近期曾与凯鹏华盈(Kleiner Perkins)、General Catalyst等投资方洽谈融资事宜,估值达30亿美元(约合人民币217亿元),其估值较去年同期的12.5亿美元(约合人民币90亿元)增长了140%。 该公司原本专注于开发GPU虚拟化和编译器软件,后在2023年转型至AI编程赛道。去年年底,同名产品WindSurf正式发布。短短4个月内,这一工具就吸引了超过100万用户,成为最热门AI编程工具之一,它不仅能自动补全代码,还具备Agent开发体验,可根据用户需求自主开发应用、解决bug,尤其适合新手开发者。 目前,WindSurf公司团队规模有160余人,工程团队规模为50余人,年度经常性收入(ARR)突破1亿美元。 WindSurf旗下的AI IDE产品提供了更适应AI编程体验的用户界面。开发者不仅可以修改、编写代码本身,还可在可视化预览中直接点击应用元素,让AI代为修改。这一工具能实时理解、记忆用户行为,帮助用户完成许多重复性的工作,带来明显的生产力提升。 在开发这款产品时,WindSurf兼顾了安全性、稳定性,这让他们受到诸多大客户的青睐。截至目前,WindSurf拥有超1000家企业客户,其中不乏《财富》500强企业,如摩根大通、戴尔等。 与Cursor等同类产品不同,WindSurf的AI IDE产品具备理解亿级超大规模代码库的能力。基于该公司自持的万卡集群,WindSurf自研了多款AI编程模型,能够在数千个GPU上并行处理庞大代码库,并对代码库进行排序,实现高效、准确的代码库修改。 据WindSurf CEO Varun Mohan透露,WindSurf正在积极招募工程师,扩大公司规模。WindSurf没有传统的产品经理,正以开发者需求为基础打造产品,每隔半年到1年就会颠覆现有产品的形态。 目前,OpenAI与Windsurf均拒绝对这一收购案置评。 结语:AI编程赛道竞争加剧 AI编程工具带来的生产力提升有目共睹,这也让诸多企业客户争相采购相关服务,优化自身的软件开发流程,提升开发效率,降低成本。 需求的增长使AI编程成为当下最火热的AI应用赛道之一。Cursor、WindSurf等明星创企业屡获资本押注,而微软、亚马逊、字节等大厂也已推出AI编程服务与应用。AI编程赛道的竞争已愈演愈烈。
OpenAI宣布重大转型:调整公司架构,废除“利润上限”,转营利性公司为公益公司
编译 | ZeR0 编辑 | 漠影 智东西5月6日报道,今日,OpenAI宣布更新的公司组织架构重组计划,继续由非营利组织监督和控制。 OpenAI的营利性有限责任公司自2019年起一直隶属于非营利组织,将转型为公益公司(PBC)——一种以目标为导向的公司结构,必须考虑股东和使命的利益。其非营利组织将控制PBC并成为其大股东,从而为非营利组织提供更好的资源来支持多项福利。 在听取民间领袖的意见并与特拉华州总检察长办公室和加利福尼亚州总检察长办公室进行建设性对话后,OpenAI管理层决定让非营利组织保留对OpenAI的控制权,并期望其非营利组织“成为历史上规模最大、最有效的非营利组织”。 据《连线》报道,此举推翻了此前一项要求非营利组织将其权力移交给一家新成立公益公司的声明。拟议的公司结构必须在明年年初之前获得美国加州和特拉华州总检察长办公室的批准。日本软银集团和其他投资者将获得高达300亿美元的融资,但这取决于这项批准。这笔资金对于OpenAI 保持其在生成式AI领域的领先地位并为投资者带来更高的回报至关重要。此前,这些回报上限为原始投资的100倍。 OpenAI成立于2015年,最初是一家非营利性研究实验室,使命是“确保通用人工智能(AGI)造福全人类”。但由于构建先进人工智能(AI)系统所需的资金,这一理想主义的架构很快变得难以为继。试图将其转向营利性方向的调整招致大量反对。2024年,OpenAI联合创始人之一埃隆·马斯克(Elon Musk)起诉OpenAI违约,称其为了追求利润而放弃了最初的使命。 今年3月,一位美国联邦法官驳回了马斯克提出的阻止OpenAI让这家非营利组织放弃控制权计划的初步请求。但上周,她允许马斯克的许多诉讼进入庭审阶段。 前OpenAI员工托多尔·马尔科夫(Todor Markov)作为马斯克诉讼的一部分提交了一份法庭之友陈述书,他在一篇帖子中写道,OpenAI“在公众压力和总检察长介入后”修改了计划,这“令人遗憾”,但也称此举“对广大公众来说是一项胜利”。 2024年,OpenAI曾发表一篇博文,强调其公司架构调整的必要性。之后,许多倡导团体致信各州总检察长表示反对,称这些计划可能会将慈善基金转化为公司现金。现在,这些努力似乎取得了成效。 美国加州总检察长办公室发言人艾丽莎·佩雷斯(Elissa Perez)在一份声明中称,她的办公室也在审查这项新计划。 美国公民社会组织(Public Citizen)的联合主席罗伯特·韦斯曼(Robert Weissman)长期以来一直批评OpenAI的结构,他认为这家初创公司的计划仍然不尽如人意,目前似乎没有任何新的限制措施来确保这家营利性机构能够履行OpenAI的非营利使命,即用强大的AI工具造福全人类。 “这让我们陷入了目前的困境:一家非营利组织看似控制着一家营利性机构,却对后者没有任何明显的约束。”韦斯曼告诉《连线》杂志。 OpenAI的计划要求其新成立的非营利组织持有这家公益机构的股份。最新一轮融资使OpenAI的估值达到3000亿美元,因此,当该非营利组织出售或抵押这些股份时,这些股份可能带来丰厚的利润。加州慈善活动人士呼吁该非营利组织获得“公平价值”的股份,这可能使其成为有史以来资金最雄厚的基金会。他们还希望该非营利组织能够独立于OpenAI,以免商业利益腐蚀慈善捐赠。 OpenAI 发言人史蒂夫·夏普(Steve Sharpe)称,非营利组织将有权任命和罢免这家公益公司的董事会成员。 “转型为公益公司将取消利润上限结构,”他补充道,“公益公司将采用传统的资本结构,允许员工、投资者和非营利组织直接持有股权。” 以下是OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)致员工信全文: OpenAI不是一家寻常的公司,而且永远不会是。 我们的使命是确保AGI造福全人类。 创立OpenAI之初,我们对如何完成使命并没有一个清晰的思路。起初,我们只是围坐在餐桌旁,面面相觑,思考该做哪些研究。那时,我们尚未考虑产品和商业模式,无法想象AI在医疗建议、学习、生产力等领域的直接应用,也无法想象训练模型和服务用户所需的数千亿美元计算资源。 我们真的不知道AGI究竟该如何构建,又该如何应用。很多人或许会想象一个预言机,可以告诉科学家和总统该做什么。虽然这可能极其危险,但或许这少数人还是值得信赖的。 早期,OpenAI周围的许多人都认为AI应该只掌握在少数有能力“处理它”的可靠群体手中。如今我们看到了一种让AGI直接赋能每个人的方法,使其成为人类历史上最强大的工具。如果我们能做到这一点,我们相信人们将为彼此创造非凡的成果,并持续推动社会和生活质量的进步。 当然,它并非全都用于造福人类,但我们相信,造福人类的益处将远超其弊端。 我们致力于走AI民主化之路,希望将不可思议的工具交到每个人手中。用户使用我们的工具所创造的一切,以及他们如此渴望使用这些工具的热情,令我们惊叹。 我们希望开源性能卓越的模型。我们希望赋予用户极大的自由,让他们能在广泛的范围内使用我们的工具,即使我们并非总是共享相同的道德框架,并让用户自主决定ChatGPT的行为。 我们相信这是最佳前进之路——AGI应该让全人类互利共赢。我们意识到有些人持有截然不同的观点。 我们希望为世界构建一个大脑,让人们可以非常轻松地用它来做任何他们想做的事情(受到很少的限制;例如,自由不应侵犯别人的自由)。 人们正在使用ChatGPT来提高他们作为科学家、程序员等的工作效率。人们正在使用ChatGPT来解决他们面临的严峻医疗挑战,并学习到比以往任何时候都多的知识。人们正在使用ChatGPT获取有关如何应对困境的建议。我们非常自豪能够提供这项服务,为如此多的人带来如此多的益处;这是我们所能想到的最直接的使命实现方式之一。 但人们想要更多地利用AI;我们目前提供的AI远不能满足世界的需求,我们不得不限制系统使用量,降低运行速度。随着系统功能越来越强大,人们会想要更多地利用AI,去做更多奇妙的事情。 近十年前,我们成立研究实验室时,根本没料到世界会变成这样。但看到今日景象,我们激动不已。 现在是时候改进我们的架构了。我们想要实现三件事: 我们希望能够以这样的方式运营和获取资源,使我们的服务能够广泛惠及全人类。目前,这需要数千亿美元,最终可能需要数万亿美元。我们相信,这是我们履行使命的最佳途径,也是让人们利用这些新工具为彼此创造巨大利益的最佳途径。 我们希望我们的非营利组织成为历史上规模最大、最有效的非营利组织,致力于利用AI为人们带来最高效益。 我们希望提供有益的AGI。这包括为安全和协同做出贡献;我们为已发布的系统,已进行的协同研究、红队等流程,以及通过模型规范等创新实现的模型行为透明度感到自豪。随着AI的加速发展,我们对安全的承诺也愈发坚定。我们希望确保民主AI战胜专制AI。 在听取了民间领袖的意见并与加州和特拉华州总检察长办公室进行讨论后,我们决定由非营利组织继续掌控。我们期待与他们、微软以及我们新任命的非营利组织委员们继续沟通,推进该计划的细节。 OpenAI最初是一家非营利组织,如今也是一家监督和管理营利性组织的非营利组织,未来将继续是一家监督和管理营利性组织的非营利组织。这一点不会改变。 该非营利组织旗下的营利性有限责任公司将转型为秉持相同使命的公益公司 (PBC)。PBC已成为其他AGI实验室(例如Anthropic和X.ai)以及许多目标驱动型公司(例如Patagonia)的标准营利性结构。我们认为,这对我们来说也合情合理。 我们目前采用的复杂利润上限结构——在看似可能只有一家AGI公司占据主导地位时,这种结构还算合理,但在如今众多优秀的AGI公司中,情况并非如此——我们正在转向一种正常的资本结构,即每个人都持有股份。这不是出售,而是将结构转变为更简单的结构。 该非营利组织将继续控制PBC,并将成为PBC的大股东,其股东金额将由独立财务顾问提供支持,为非营利组织提供资源,用于支持其项目,使AI能够惠及众多不同群体,并与其使命保持一致。 随着PBC的发展,该非营利组织的资源也将增长,从而能够做得更多。我们很高兴很快能从非营利组织委员会获得建议,了解如何确保AI惠及所有人,而不仅仅是少数人。他们的想法将集中在我们的非营利组织工作如何支持更民主的AI未来,并在医疗、教育、公共服务和科学发现等领域产生真正的影响。 我们相信,这将帮助我们继续快速、安全地推进AI发展,并将卓越的AI交付给每个人。创造AGI是我们人类进步道路上的基石;我们迫不及待地想看到您接下来会助力。 萨姆·阿尔特曼 2025年5月
2025Q1 全球手机出货额:TOP5 中苹果增长最快
原标题:CounterPoint 报告 2025Q1 全球手机出货额:TOP5 中苹果增长最快 IT之家 5 月 6 日消息,市场调查机构 CounterPoint Research 于 5 月 2 日发布博文,报告称 2025 年第 1 季度全球智能手机市场出货额和出货量均同比增长 3%。 主要得益于持续的高端化趋势,2025 年第 1 季度全球手机平均售价(ASP)达到 364 美元(IT之家注:现汇率约合 2636 元人民币),同比上涨 1%,创下第 1 季度历史新高。 细分到厂商方面,从出货额来看,在 TOP5 OEM 厂商中,仅苹果和 vivo 实现收入增长。 苹果方面,尽管 iPhone 平均售价同比下降 9%,但凭借出货量 12% 的显著增长,收入未受影响,甚至成为前五品牌中增长最快的。 研究总监 Jeff Fieldhack 指出,iPhone 16e 虽然对平均售价造成下行压力,在本季度推出后,极大拉动了出货量增长,但这一策略被证明颇为成功。 vivo 则凭借在印度等市场的强劲表现,实现收入增长。而 OPPO 通过调整机型组合,提升高端机型占比,在 TOP5 OEM 中,是唯一一家平均售价实现增长的品牌。 在排名前五之外的品牌中,该机构特别指出华为和摩托罗拉的出货额在2025年第 1季度实现了2位数的同比增长。 在 2025 年第 1 季度全球智能手机市场出货量方面,三星公司继续占据主导地位,不过由于三星在其产品组合中增加低价位机型占比,因此平均售价降低 7%。
谷歌安卓新设计语言:界面更具表现力,聚焦情感连接
IT之家 5 月 6 日消息,科技媒体 TechCrunch 昨日(5 月 5 日)发布博文,报道称基于意外泄露的博客文章,谷歌计划升级“Material 3”,新设计语言名为“Material Design 3 Expressive”。 谷歌计划在 Google I/O 开发者大会(5 月 20~21 日举办)上,揭晓 Android 设计语言的最新版本“Material Design 3 Expressive”。 根据官网活动日程和一篇意外泄露的博客文章,新设计系统聚焦于通过大胆的形状和色彩运用,打造“令人愉悦的用户体验”,并在情感层面与用户建立更深层次的联系。 IT之家注:Material Design 是谷歌于 2014 年推出的开源设计系统,指导开发者如何为安卓应用设计视觉、动效和交互界面。 谷歌于 2021 年 5 月发布重大更新“Material You”(即 Material 3),引入自适应界面,让用户能个性化定制安卓体验,例如通过更换壁纸自动调整系统配色方案。 此次“Material Design 3 Expressive”更新规模可能不如此前,但仍是对现有设计语言的重要迭代。谷歌强调,新系统通过研究发现,用户更偏好富有表现力的设计,这种设计能突出关键元素,提升操作效率,尤其对老年用户友好,缩小不同年龄段用户的使用差距。 谷歌在 I/O 大会的议程标题“Build next-level UX with Material 3 Expressive”,已明确预告这一更新。大会上,开发者将学习如何运用“新的情感设计模式”提升产品吸引力、易用性和用户黏性。
美媒: iPhone涨价迫在眉睫,苹果美国用户终将尝到关税之痛
苹果零售店 凤凰网科技讯 北京时间5月6日,据《华尔街日报》报道,新iPhone很可能很快就会涨价。真正的问题在于:涨多少,苹果又将如何巧妙地实施这轮涨价? 苹果最新财报显示,该公司目前选择自行承担因美国对进口商品征收关税而增加的成本。但这种做法不太可能永远持续下去,尤其是考虑到苹果在华尔街是出了名的擅长保护利润率。 “展望未来,我们的基本预期是苹果将会上调价格,这在一定程度上有助于抵消关税带来的影响。”金融服务公司Raymond James分析师斯里尼·帕吉里(Srinik Pajjuri)上周在苹果第二财季财报发布后撰写的一份报告中表示。 目前为止,关税对苹果的影响实际上相当轻微。苹果CEO蒂姆·库克(Tim Cook)在上周四的财报电话会议上表示,公司预计将在截至6月的第三财季新增大约9亿美元关税成本。这将使得苹果的销售成本增加不到2%,低于华尔街的预期。 但是,几乎没人认为苹果的关税之痛就此结束。库克本人指出,第二财季业绩中包含了“某些独特因素”来抵消关税冲击。这是在强烈暗示,如果关税维持现状,未来几个季度的成本将会更高。此外,针对半导体产品的“行业性”关税会进一步增加苹果的成本。 “鉴于特朗普可能实施行业性关税,我们认为谨慎的做法是在6月份后的几个季度里,把销售成本在9亿美元基础上至少提高一倍。”金融研究公司Melius Research的分析师本·里泽斯(Ben Reitzes)表示。 苹果擅长涨价 虽然库克表示,苹果正从印度、越南进口大部分输美商品,但是从长期来看,对于一家主要依赖外国制造的硬件来获得收入的美国公司来说,涨价是最可能出现的情形。 iPhone平均销售价格走势 这对苹果来说并不是新鲜事。过去几年里,它已经找到了巧妙的方法来提高iPhone的平均售价。虽然自2017年以来,苹果每一年旗舰机型的起售价一直维持在999美元不变,但平均售价却上涨了。 苹果的涨价是通过推出更大内存配置以及更高端的iPhone机型实现的。根据数据分析平台Visible Alpha的数据,在苹果2019年末首次推出iPhone Pro系列之前,iPhone的平均售价约为755美元,而三年后,这一数字跃升至约963美元。 尽管如此,对于经济拮据、甚至连麦当劳消费都在缩减的消费者来说,他们对那些价格远超1000美元的智能手机的接受度终究是有限的。而且,苹果也很难再从电信运营商那里获得太多支持。这些运营商过去通过补贴和促销帮助消费者分担了部分价格压力。 Verizon CEO汉斯·韦斯特伯格(Hans Vestberg)在最近的财报电话会议上表示:“我们不会承担任何因关税所产生的手机价格大幅上涨。”就在他发表这番言论的前一天,AT&T的CEO也表达了类似观点。 苹果的顾客最终还是会感受到关税之痛。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。