行业分类:
加载中...
头条分类:
加载中...
Linux 6.16 RC2发布:网络驱动、蓝牙与bcachefs文件系统优化
IT之家 6 月 16 日消息,Linux 内核之父 Linus Torvalds 宣布,Linux 6.16 的第二个发布候选版已发布。在 Linux 6.15 版本发布之后,开发者们纷纷提交新功能以供合并至 Linux 6.16 中。这些候选版本的发布旨在对内核进行最后的打磨,以确保在正式发布前的稳定性和兼容性。 IT之家注意到,在本周的邮件列表中,Torvalds 提到,本周的开发活动相对平静,这可能是因为许多开发者正在享受夏季假期,或者是在几周前的大规模合并窗口之后暂时休息。这种情况在开发周期的这个阶段并不罕见,Torvalds 预计下周开发活动会有所增加。 尽管 Linux 6.16 第二个候选版本的规模较小,但仍然带来了一些值得关注的改进,主要集中在网络驱动程序、蓝牙驱动程序以及 bcachefs 文件系统上。 网络驱动程序的改进对最终用户有着直接的影响。这意味着,当用户安装 Linux 时,更新的网络硬件能够即插即用,同时一些已知存在问题的驱动程序也得到了修复。 此外,Rust 基础设施和核心网络功能也得到了改进。将 Rust 语言引入内核对用户来说是一个利好消息,因为 Rust 本身具备内存安全机制,这使得 Linux 系统在安全性方面更具优势,减少了黑客可利用的潜在漏洞。尽管一些 Linux 开发者对学习新语言有所抵触,但 Rust 的引入看起来已成定局。 本周,众多开发者为内核贡献了多种修复,涉及内核稳定性、蓝牙连接、SMB(Server Message Block)文件共享以及虚拟化性能等多个方面。具体改进包括: 修复了 ath11k 和 ath12k Wi-Fi 驱动程序中的 CPU 过热、固件统计以及用后释放(UAF)问题。 对蓝牙驱动程序中的 UAF、空指针差异以及广告问题进行了多项修复。 在 SMB 方面,改进了目录缓存重用机制,并修复了与延迟关闭相关的性能退化问题。 在 KVM(基于内核的虚拟机)中,修复了 SEV-SNP 支持、内存预加载以及 ARM64 自测试功能。 SMB 修复尤其值得关注,因为该协议在 Windows 网络环境中非常重要,其支持文件共享、打印机共享以及 Active Directory 集成。通过改进 Linux 对该协议的支持,使用 Linux 与 Windows 机器进行通信的用户将获得更流畅的体验。 Linux 6.16 预计将经历七到八个候选版本的迭代,因此距离稳定版发布还有大约五到六周的时间。即便稳定版发布,大多数用户首次使用该内核仍需等待各大 Linux 发行版决定将其纳入正式版本,因为手动安装内核可能会比较复杂。
iPhone AI造假?苹果高管最新深度专访,首次回应Siri延迟内幕(完整实录)
作者 林易 编辑 重点君 上周苹果WWDC2025刚落幕,苹果高管Craig Federighi(软件主管)和Greg Joswiak(市场营销主管)接受了媒体专访。这场对话并不轻松,因为两位高管需要直面过去一年苹果最受质疑问题:苹果AI到底怎么了? 去年,苹果曾信誓旦旦宣布将推出一个“更聪明”的AI助手,但至今没有落地。这让不少人质疑,苹果是不是在“造假”,把尚未准备好的AI产品包装成了营销噱头。 苹果高管们怎么回应?Siri到底“跳票”是为什么?这篇深度专访,透露的信息量非常大。我们给您划一下重点: 1、苹果AI跳票的“真相”:是有版本,但不敢发布 在访谈开头,Federighi就先承认了一件事:Siri确实“跳票”了。 “我们本来有一个计划,分两阶段升级Siri。我们已经有了一个可用的版本,也在去年活动中展示过。但它没有达到我们对质量的要求。” 换句话说,并不是没有产品,而是内部评估后认为达不到苹果的标准。 Joswiak补充说:“我们不希望让用户失望。如果发布的是个错误率高的AI助手,那才是真正的失望。” 这其实透露了苹果面对AI竞争的一个核心立场:宁愿不做,也不要做得不好。哪怕市场和媒体再催促,他们也不会为了一时的热度去硬推未完成的产品。 但问题在于,苹果去年在发布会上确实用了一段视频,展示了AI Siri的酷炫效果,也让人以为这就是成品。这就是为何用户觉得被骗了。 Federighi解释:“我们展示的是一个真实运行的大语言模型版本,也确实准备在年底发布。但后来意识到,这个产品还不够可靠,所以选择了推倒重来。” 一句话总结:不是造假,是没做好;不是没有AI,而是AI不够好,不能叫Siri。 2、Apple Intelligence:不是普通聊天机器人,而是深度嵌入操作系统 苹果的AI战略,和市场上其他主流玩家不同。Joswiak一再强调,苹果不是要造一个聊天机器人,而是希望把生成式AI深度嵌入操作系统,让用户在不知不觉中用到它。 Federighi打了个比方:“互联网刚出现时,没有人说‘我用的是互联网’,而是用Google查资料、上Amazon购物。AI也应该是这样,它是一项底层能力,而不是一个独立的应用。” 这就解释了为什么苹果迟迟没有推出一个“Apple Chat”这样的产品,也没有大张旗鼓对标GPT或Gemini。 他们更像是AI基础设施派:从语义搜索照片、自动生成邮件、辅助写作、代码建议,到视觉智能和图像生成,全都在系统里悄悄升级。 Federighi说:“很多时候你都不知道你在用AI,这就是我们的目标。” 3、苹果AI能力落后?回应是“不抢第一,只求最好” 这次专访里最打动人的一句话,可能是Federighi说的: “没有必要为了抢先推出而发布错误的功能和产品。只是为了成为第一个。我们最终的目标,是为用户打造合适的产品。” 这其实透露了苹果应对AI竞赛的哲学:不争快,但要对。 与其像OpenAI那样不断发布GPT-4、GPT-4o,不如先打磨好模型,确认能落地再发布。苹果强调的是“质量优先”。 Joswiak甚至坦率承认:“我们不是没有资金、没有工程师。而是AI这件事,没那么容易。尤其是你要在设备端跑、要保护隐私、要集成得毫无缝隙。” 在Siri跳票这件事上,他们没有甩锅技术难度、也没有模糊时间表,而是坦率说:“我们做过,但做得不够好。”这,在现在这个“PPT造AI”的行业语境下,已经是一种罕见的坦诚。 4、为什么Siri总是达不到预期?苹果这样解释 Siri是全球第一个智能语音助手,2011年随iPhone 4s发布,一度引领行业。但这几年,Siri的口碑明显落后,甚至沦为笑柄。 这次,苹果首次回应了这个问题。Federighi说: “我们希望下一代的Siri是个不可或缺的个人助手,但我们也知道,还没到时候。我们不想给出一个错误的期待。” Joswiak则强调,Apple Intelligence不是一个产品,而是系统能力。“它不是一个App,也不是一个聊天机器人,而是你每天在用的工具。我们不是在追GPT,而是在做更适合苹果生态的AI。” 虽然苹果自己也在训练模型,Federighi透露,他们发布目前的模型接近GPT-4o水平,但依然选择接入ChatGPT、Anthropic等外部能力。“因为我们希望用户能接触到最好的内容,而不只局限于我们自家的。” 苹果不是没AI,而是AI藏在系统里。 5、 液态玻璃(‌Liquid Glass)、折叠屏iPhone和iPad OS的下一步 在谈AI的同时,苹果也聊到了系统和设计上的更新。 iOS 26中最引人注目的,是液态玻璃设计语言。Federighi解释,这是受Vision Pro启发的一种视觉风格,结合玻璃、模糊、层次感,让UI更轻盈流动。“它可以传输背景,又能保持对比度,看起来很酷。”他说。 但记者马上追问:这是不是为更大屏幕做准备?折叠屏iPhone要来了? Joswiak笑着打太极:“谁知道呢?我们没看到有一台。” 另一个被追问的话题是:iPad和Mac会不会融合?Craig还是那句老话:“不。”虽然很多功能开始互相靠拢,但iPad是触控优先,Mac是键盘鼠标优先,它们不会融合,但会彼此借鉴。 6、当别人狂奔时,苹果选择慢一点,好一点 面对AI的狂飙突进,苹果的策略显得“保守”。Siri跳票让人失望,但苹果的回应也展现了他们的底线:不能因为竞争而放弃质量。 这并不是说苹果不重视AI。相反,Apple Intelligence已经覆盖了操作系统的方方面面,从搜索、生成、编程、到图像识别,一步步把AI嵌进日常使用中。 只不过,他们选择了一条“润物细无声”的路径:少些炫技,多些落地;少些噱头,多些体验。 就像Federighi说的那样:“我们最终的目标,不是为了成为第一个,而是做出正确的产品。” 当整个行业都在奔向大模型、堆叠参数、抢先发布时,也许有企业慢下来、想清楚怎么真正融入用户生活,才是下一个拐点。 以下为苹果高管最新访谈全文: 一、AI 与 Siri 延期 主持人:Craig、Greg,常感谢你们在这个大型开发者大会上抽时间与我交流。 Craig Federighi :非常感谢邀请我们。是的。 主持人:昨天是重要的一天。 Craig Federighi :重要的一天。 主持人:所以,我确实想谈谈你昨天宣布的内容以及一些重大公告。我想稍微聊聊去年的全球开发者大会(WWDC)。去年,你们宣布了一个更智能、由人工智能驱动的 Siri。它现在在哪里?是的。 Craig Federighi :我记得我们在 100 分钟的节目中花了大约 40 分钟讨论Apple Intelligence(苹果智能)。Siri 是建立在Apple Intelligence基础上的。我们大约在 Siri 上花了大约八分钟。其中四分钟我们,今年能够发布。四分钟,我们没有做到。所以,我们能够推出一个很棒的新 Siri 用户界面。像给 Siri 输入文字这样的新功能。Siri 对语音不流畅的理解更好。Siri 对对话上下文的理解更好。Siri 对产品知识的理解更深入。但有几个非常重要的功能我们没能实现。我们在 Apple Intelligence 上奠定了基础,建立了一个语义索引配备了设备端的、非常强大的大型语言模型,这些模型驱动了 Apple Intelligence 中的许多其他功能并且实现了突破性的私有云计算智能。所有这些,还有一个语义索引,我们在许多功能中使用,比如用自然语言搜索你的照片当然我们已经交付了,这些都是我们想要为 Siri 添加的新功能的基础。 我们有一个,实际上是分两阶段的计划两个架构版本来打造一个出色的 Siri。当我们进入会议时,我们已经有了 V1 版本正在努力,实现我们基本的能力在大会上展示的那些。所以我们有一些真正的软件,能够在那里演示并展示即将到来的内容但它没有以我们需要的方式收敛质量上没有达到我们的要求。我们有一个可用的版本,但当你偏离常规路径时我们知道 Siri 是开放式的,你可能会让它做各种事情什么,以及可能存储在您设备上的可用于个人知识的数据。我们希望它非常非常可靠但我们未能在规定时间内实现这种可靠性我们当时认为。 我们最初以为可以在年底前完成。然后是春季,但当我们在春季意识到它根本达不到苹果的质量标准时,我们不得不宣布我们将要转向我们架构的第二版,这个版本真正有能力带领我们达到我们想要为客户提供的质量水平我们会在准备好时宣布。我们会宣布它。 主持人:这就是我们今天的情况。但实际上有一个可用的版本。空中楼阁。 Craig Federighi :哦,不,不,不。当然。我们当时拍摄的是带有真实大型语言模型的真实工作软件。具有真实语义搜索功能。这就是你所看到的。 Greg Joswiak:而且——是的,外面有这样一种说法,认为是的,那只是演示软件。不,不是的。正如克雷格所说,这又是我们认为的东西。我们实际上会在今年晚些时候发布而且,听着,我们不想让客户失望。我们,从来没有这样做过。但如果发布了一个达不到我们质量标准的产品,那才会更令人失望。那个产品的错误率,我们觉得是无法接受的。所以我们做了我们认为最好的决定。我还会再做一次。 主持人:这其中有两个部分我想要详细说明。我的意思是,首先是你们进行了市场推广你们展示了这个。是的。这是怎么发生的? Greg Joswiak:正如克雷格所说,我们原本以为能在年底前推出。那是我们的计划。所以在十月份,我们进行了一轮这样的活动贝拉·拉姆齐的广告,展示了我们用Apple Intelligence可以做的一件事。我们有一整系列的内容,这只是其中之一。我们预料到了,就是这样。是的,我认为我们的大部分营销,确实如此。 Craig Federighi :我不是这方面的专家,但这关乎Apple Intelligence。嗯哼。我们有,我也说不清,大约 20 种不同的Apple Intelligence功能而且正如我所说,甚至在我们活动中所说的内容里回头看,如果我读人们写的东西,你简直会以为我们去年的整个活动都是关于 Siri 的。正如我所说,我们去年活动中有 4%的时间是关于我们未能实现的 Siri 部分。那次活动的其余 96%时间则是关于其他内容。Apple Intelligence的大部分内容都是关于我们发布的各种强大功能。 所以,=我们一直在大力推广Apple Intelligence,因为我们认为它现在非常出色,也是未来发展的坚实基础。如果你每次听到我们推广Apple Intelligence你脑海中听到的是聊天机器人,当然我们完全没有想到或说过那是我们认为的Apple Intelligence,或者是我们平台的未来。那么,你就会这么想。但事实上,那并不是我们正在做的事情。有一个贝拉·拉姆齐的广告,是——对……特别是关于 Siri 的,但你知道,总的来说我们一直在推广Apple Intelligence。是的。 Greg Joswiak:我们确实交付了超过 20 项功能。所以我们几乎交付了所有承诺的内容。这又是我们没有做到的,克雷格也解释了原因。 主持人:你设定这么高的标准真是太好了。你们还是苹果公司。我是说你们拥有比大多数公司更多的工程师和资金甚至可能比任何公司都多。为什么不能,为什么做不成? Craig Federighi :我是说,这是新技术。我认为,当涉及到以可靠的方式在设备上实现自动化功能时目前还没有人做得特别好而且,我们想成为第一个我们想做到最好,就像我说的那样我们有非常有希望的早期成果和可用的初始版本,但还没有达到当我们开始内部使用它并感觉更像是这根本不够可靠,无法成为一款苹果产品。所以这些东西需要艰苦努力,但我们确实看到人工智能作为一种长期的变革浪潮将会影响,我们的行业当然还有未来几十年的社会。我们想要把事情做对。没有必要为了抢先推出而发布错误的功能和产品。只是为了成为第一个。我们最终的目标是为我们的客户打造合适的产品。 主持人:很多人将苹果和人工智能联系在一起,首先想到的是 Siri。这已经是十多年前的事情了。因此,人们真正期望 Siri 的表现应该和竞争对手一样好,甚至更好。 Craig Federighi :我认为最终它应该达到这样的水平。但现在还不是时候。那当然是我们的使命。那是我们的使命。你知道,我们当时打算讲述,呃去年我们向大家说明了我们的方向。我认为人们对苹果的价值观非常期待。一种融入你所做一切的体验而不是附加在一旁的聊天机器人。既是个人化的,也是私密的。我们开始构建其中一些功能并交付部分能力而且我们现在已经实现了出色的语义照片搜索你知道,我们做各种各样的直接集成到你使用设备方式中的工具。我认为人们对那个未来感到兴奋。而且,我在某种程度上也很欣赏这一点,人们真的很期待下一代 Siri我们也非常想为他们推出这款产品但我们想以正确的方式来做。 主持人:正确的方式什么时候才会出现? Craig Federighi :在这种情况下,我们真的想确保完全掌握好它,然后才开始谈论日期。原因显而易见。 主持人:这会包括你之前宣布的这些功能以及更多吗?我的意思是,这是让 Siri 成为更具互动性的 AI 助手的努力吗? Craig Federighi :当然。我的意思是,看看,一方面我很乐意聊聊这些事情我对我们未来计划的热情,但,这正是我们现在不想做的事情对吧?说得通。你知道,期望设定错误。我们,我们想要交付一些很棒的东西,那个您和我们所有的客户都非常感激。您提到了很多关于Apple Intelligence。 主持人:说实话,我并不是Apple Intelligence的重度用户。我正在使用很多你们竞争对手的产品。你能跟上这种竞争吗?或者说你会跟上吗? Greg Joswiak:再说一次,重要的是要明白我们的策略和其他一些人有点不同。对吧?我们对Apple Intelligence的理念是将生成式人工智能作为推动我们操作系统各项功能的赋能技术。以至于有时你在使用某些功能时,甚至都没有意识到自己正在使用Apple Intelligence或人工智能来完成这些操作,这就是我们的目标。将其整合进你每天使用的产品中让你每天使用的功能变得更好。甚至不需要去思考它。没有终点,也没有一个叫做“Apple Intelligence”的应用,它不同于聊天机器人。这又是我认为有些人有点混淆的地方。比如,“你们的聊天机器人在哪里?”我们没有做那个。我们的决定是通过 ChatGPT 让你们访问一个聊天机器人,因为你知道,我们认为那是最好的一个但我们的想法是整合到整个操作系统中让它成为我每天都会使用的功能。 Craig Federighi :我认为,人工智能是像互联网那样的巨大技术浪潮之一就像移动互联网一样。嗯哼。当你回顾互联网的时候,我不认为有人会说“天哪,苹果,我发现自己在用 amazon.com,而我并没有用你知道的,我经常用那个。为什么你们没有一个那样的?”我觉得这个网络搜索功能真的很有用。我,我很喜欢,你知道,观看,呃猫咪视频。我觉得这很有用。“为什么这不在你们的产品中?”互联网是广阔的。这对许多公司来说是一个机会。让用户能够做各种各样的事情。这对苹果来说也是一个巨大的推动力我认为苹果在很多方面让互联网变得更加易于访问比任何人都多,这对我们的客户和产品来说是极大的赋能。但这并不意味着你可能承担的每一次体验都一定会在苹果内部发生,或者最终会发生在Siri 上。有些地方希望 Siri 能成为日常生活中非常重要,甚至最终成为不可或缺的一部分但这并不意味着如果你用其他工具完成其他任务就是问题。 主持人:我确实想谈谈 iOS 26 和一些新的操作系统,但先暂时聊聊人工智能你们确实在更多地融合 OpenAI 和 ChatGPT 的技术特别是在视觉智能方面。你们什么时候考虑使用自己的模型,而不是其他公司的模型比如 OpenAI 的? Craig Federighi :我们已经有了。所以今天,当你使用写作工具并说你想让内容更简洁时把它做成项目符号列表,创建一个表格甚至可以临时下达指令,告诉你想如何修改某个内容比如说,写一首俳句之类的,这些都是使用苹果模型在私有云计算中完成的。所以我们越来越多地使用我们的模型我们也将它们用于一些视觉智能体验。但 ChatGPT 提供了一些非常出色的功能,所以我们已经进行了更多整合,并利用它们做了一些非常强大的事情。正如你所指出的,它们现在可用于视觉智能,这不仅适用于你用相机看到的周围事物还适用于你屏幕上的内容。 但我们还将许多其他工具整合到这个流程中。我们还在图像游乐场中提供了 ChatGPT 的图像生成能力而且你也可以在各种应用程序中调用该图像生成能力苹果应用和第三方应用,你现在也可以在使用流程中直接访问 ChatGPT 的图像生成功能。使用这些应用时。所以,我们还在 Xcode 中宣布了一些非常令人兴奋的编码工具,实际上这些工具得到了。你知道,昨天我们的开发者反应非常热烈在那里你可以使用 ChatGPT 以及其他模型比如来自 Anthropic 的,用于编写代码的在 Xcode 中,这非常棒。所以我们会继续提升我们自有模型的能力但我们看到很多人在用他们的产品做其他令人兴奋的事情我们希望确保我们的客户能够接触到最好的所有内容。 主持人:你知道,展望未来,苹果是否想成为制造这些模型的公司?您是否希望拥有 OpenAI 模型或 Anthropic 模型中某些能力,并将其作为苹果的核心能力?融入苹果的模型中? Craig Federighi :我们已经在做了。事实上,我们今年再次发布了一篇论文,介绍了我们最新发布的本地设备模型和私有云计算模型。这两者都经历了显著的架构改进。我们的私有云计算模型(PCC)在许多方面,它要大得多,功能更强大,属于 GPT-4o 级别。所以这绝对是我们一直在做的事情。好的。但我们的目标,还是——不是要创造另一个聊天机器人,对吧? Greg Joswiak:而是要将这些能力整合到各个方面。我们的操作系统和我们的功能。但那强大的智能。支撑这些功能背后的智能。 二、Liquid Glass 与 iOS 26 主持人:我们来谈谈液态玻璃。你们真的很喜欢玻璃。 Craig Federighi :我们确实需要。这是个不错的材料。 主持人:你为什么这么喜欢玻璃? Craig Federighi :我觉得,玻璃我们本可以选择比如说古老的砖块或者柚木之类的材料。但事实证明,玻璃在用户界面方面具有一些非常有用的特性。而且,特别是我们能够制造的那种自适应玻璃融入产品中。你知道,我们真正想要的是随着我们的显示屏越来越先进更大一些,同时还有这些圆角边缘我们希望让你的内容感觉更加开放就像它占据了整个屏幕,从边到边。玻璃让我们能够放置控制元素嵌入,与那种体验同心,这种体验一方面感觉它们几乎不存在就像你的内容完全占据了屏幕,这非常棒但同时以一种方式定义空间“哦,我知道这些按钮是什么。” 控制非常清晰。玻璃也非常适应环境。它,它都可以通过半透明传输背景但我们可以调整它的属性,以便你获得对比度能够同时看到其背后的内容和你试图阅读的内容。所以玻璃就是……它具有作为用户界面一部分的绝佳特性而且看起来非常酷。 主持人:为什么现在做这件事? Craig Federighi :我们已经到了这样一个阶段,硬件已经发展了,包括处理能力,使我们能够实现这块玻璃就像对远离玻璃边缘的内容进行折射一样通过玻璃传输内容。这全部都需要大量计算,但现在我们拥有苹果芯片的强大性能,可以在我们整个产品线中实现这一点,所以这是第一步第一步。但我们也有,这些令人惊叹的显示屏其中一些是高清或 HDR 显示屏,可以让我们在玻璃上展示光谱高光。然后屏幕变得更大了想法发生了变化,到了那个同心度成为一个问题的地步是真正的推动力。所有因素汇聚在一起,使我们能够迈出一大步。 然后,我们还看到了在整个产品线中带来一致体验的机会。某种普遍的东西。这花了好几年时间。如果你看看起点的话iOS 和,macOS,以及它们如何你知道,它们作为界面的起源有多么不同以及我们如何在多年里将它们融合在一起统一的字体类型,开始整合设计语言到我们真正能够拥有一个贯穿我们整个产品线的设计。那现在已经触手可及,今年我们终于能够实现它。 Greg Joswiak:或许也值得一提,这得益于团队多年来在 Vision OS 上的努力。我们从中学到了什么,我们有多喜欢它用户有多喜欢它,你知道的,所以这无疑带来了灵感在设计层面上考虑这个问题。 主持人:你提到了更大的屏幕,或者让屏幕感觉更大。这是更大屏幕 iPhone 的一种前兆吗?折叠屏 iPhone 呢?我觉得这在折叠屏 iPhone 上看起来会非常漂亮。现在它非常大。真漂亮。是的,这就是你要折叠它的原因。这就是你会放弃它的原因。 Greg Joswiak:那样会坏掉的,不是吗? 主持人:我不确定……你会做一款可折叠的 iPhone。 Greg Joswiak:我不知道。 主持人:这不是你正在考虑的事情吗? Greg Joswiak:我不知道。不想吗?谁说得准呢? 三、iPad 与 Mac 主持人:我确实想谈谈关于 iPad 操作系统的一些事情。这似乎是真正试图让 iPad 更像一台电脑的举措。但正如你所知,我早就说过,你有一台运行 iPad OS 的 iPad——我很喜欢它。你有 Mac,运行 macOS。我很喜欢它。是的。为什么不呢?为什么不考虑把这两样东西结合起来——两者。 Greg Joswiak:都非常非常非常受欢迎,而且都表现出色。 Craig Federighi :他们,他们很棒。我都很喜欢他们。我认为每个人,如果可以的话,都应该拥有。应该同时拥有两者。它们是来自于仅仅是产品。不同的,不同的地方。他们的中心不同。他们有很多共同点,我想我们都喜欢使用它们各自独特的功能,以及重叠的方式。但 Mac 一直以来都是为键盘和触控板或鼠标优化的高精度,细微点击,细微,细微界面上的目标。iPad,是终极的触控设备。你只是手持着,掌中计算。直接与之互动,真是太棒了。但是,随着 iPad 屏幕变大,计算能力更强,我们的客户希望用 iPad 做更多事情。我想我们都经历过从用它来做很多事情大量的消费和少量的生产力转变为更多的生产力。当我们寻求以符合 iPad 精神的方式实现这一目标时我们发现了一些 Mac 的表达方式它们实际上翻译得相当不错。因此,我们希望在合理的地方保持一致但也真正拥抱 iPad 的独特之处,呃每一步都是如此。 主持人:所以你的意思是你有可能会把这些东西整合在一起?我……也就是说,乔安娜,这是一个有趣的解读。 Greg Joswiak:我还记得克雷格身后的那张幻灯片我记不清是哪个主题演讲了。但我觉得我们把“不”字放得差不多是最大号的了,这是我们能找到的最大字体。所以我想花点时间简要回答这个问题。 主持人:所以答案是否定的。 Craig Federighi :是的,答案是否定的。没错。那些楼里有带触摸屏的 Mac 吗?我没看到有一个。 四、计算和人工智能设备的未来 主持人:昨天的很多更新都是针对我们所谓的更传统的计算方式。对吧?他们,触控板,触摸屏。液态玻璃是一种与触摸屏互动的不同方式。是的。那么,当我们看到人工智能的整合以及语音能力和计算机为我们做更多事情时,苹果眼中的计算未来是什么样的呢?而不是我们自己进行计算? Craig Federighi :我觉得,是这样的如果你想用技术术语的话,那就是多模态的未来。我们作为人类,是非常视觉化的生物。我们的定义来自于我们渴望用我们的我们的双手去操控事物。我们也具备语言和言语的能力。所以——你会想要同时使用所有这些能力。一次性全部使用。有时候你会想通过说话来完成某件事。有时候你会想伸手去抓方向盘触摸它,操控它。我们看到的终极未来是这样一个未来,你能够你在观看,你在互动,你在触摸你在说话,设备能够接收你的指令但你能够向它展示你想要的东西你可以直接获得你想要的东西就像我们与自然世界互动一样。 主持人:其他设备怎么做到这一点呢?你可能已经看到乔尼·艾夫与 OpenAI 合作,正在打造某种未来的人工智能设备。 Craig Federighi :是啊,我也不知道那是什么。 Greg Joswiak:我也不知道。是的。 主持人:这是苹果正在关注的领域吗?这是一个超出你们现有设备阵容的领域吗?更个人化一些的东西?也许你戴着它,眼镜? Craig Federighi :我认为我们有一些非常个人化的可穿戴设备。如果你想要一个能够感知你周围环境的东西,带有配合音频,我想你现在正戴着一个戴在你的手腕上。如果你想要一种可以捕捉环境、观看并接收视觉内容的设备,你现在口袋里可能就有一个。还有其他形态的设备可能适合人工智能吗?当然,但,很难超越那种随时陪伴你且一目了然的东西,或者你知道,提供一个你可以互动的漂亮屏幕。那个,是的,我,我不知道他们在做什么。 五、关税和 iPhone 定价 主持人:苹果面临着许多其他悬而未决的问题。其中一个重大问题是关税以及关税可能导致苹果产品价格上涨的威胁。Greg我问你,今年秋天我们会有更贵的 iPhone 吗? Greg Joswiak:很明显,你可以想象,我们每天都在监控这个情况,但目前没有什么可宣布的,我们都在观察局势如何稳定,显然这周我们专注于所有平台上的精彩发布,包括 Apple Intelligence。 Craig Federighi :这些软件升级是免费的,不受关税影响。知道。这非常正确。你们是第一时间听到这个消息的。 主持人:但具体到营销方面,我是说,如果你不得不提高价格那肯定很难找到方法去推广更贵的 iPhone 吧? Greg Joswiak:啊,这个现在说还为时过早。今天确实没什么好说的。 主持人:你们没有团队在做这方面的工作吗? Greg Joswiak:正如你所想,我们会进行监控。是的。我们不这么做简直是疯了。但目前没有什么可宣布的。好的。 主持人:你们两位加起来,我相信在这家公司有大约 60 年的经验。你们见证了公司经历过高峰,也经历过低谷。你觉得你现在在哪里? Craig Federighi :很多人认为苹果公司在这里处于被动状态。我认为,你提出这个观点很有道理,因为我觉得当你经历过不同的浪潮时那,那个,你,你会非常习惯于习惯于起起落落。我觉得我们现在感觉非常好。 Greg Joswiak:是的,我知道,我不想显得天真但我记得史蒂夫回来时告诉我们“看,我们必须做的是创造出色的产品,并告诉人们这些产品。如果我们做到这一点,其他一切都会顺利进行。”事实证明,情况确实如此。我们创造出色的产品,我们认为我们的产品现在非常出色,并且会不断变得更好。我们在这里谈论他们,告诉人们为什么会这样一切都会顺利的。现在,业务很强劲。人们非常喜欢我们的 iPhone。Mac 的受欢迎程度比以往任何时候都高。iPad 一直在增长,表现非常出色。你知道,我们所做的一切都是为了打造出色的产品。你昨天看到的所有内容,都是我们如何利用从设计到人工智能以及其他功能工作的技术来提升我们的产品。而且,请看,我们的每一款旗舰产品在各自的类别中,客户满意度都是第一。我们只是想让它变得更好。想要不断改进它,这就是我们正在做的。我仍然坚持那个天真的理论:只要我们打造出色的产品并告诉人们,其他一切都会顺利解决。 Craig Federighi :昨天真是令人振奋的一天。你知道,我们一直在努力,比如说新的设计和许多这些功能。并将它们展示给观众,看看效果如何你能感受到那种能量,能感受到人们对这些平台的热情和关心。喜欢这些改进,所以你能感受到那种氛围,然后在我们的情况下,我们知道接下来会发生什么。我们都对正在打造的优秀产品感到非常兴奋。这感觉真好。我得以此结束。 主持人:谢谢大家坐下来和我一起谈话。 Craig Federighi :谢谢你。
欧盟将向苹果下最后通牒:再不整改这个行为就继续罚款
欧盟要求苹果整改 凤凰网科技讯 北京时间6月16日,据彭博社报道,如果苹果不迅速整改,纠正欧盟所指控的违反新数字法律的行为,该公司可能很快就会接到欧盟反垄断机构开出的新罚单。今年早些时候,这项违规行为已导致苹果被罚款5亿欧元(约合5.79亿美元)。 知情人士称,随着6月26日的整改截止日期临近,欧盟官员已准备向苹果发出最后通牒,要求其允许开发者告知用户在App Store之外存在更优惠的交易方案。 如果苹果无视这一要求,此举将为欧盟根据《数字市场法》施加新一轮罚款铺平道路。根据该法案,罚款金额最高可达苹果全球日均收入的5%,按未合规的天数计算。 知情人士称,如果苹果能很快提出一项足以解决被指违规行为的新方案,从而打消欧盟委员会的疑虑,仍有可能避免事态升级。 苹果发言人表示,欧盟监管机构不断改变《数字市场法》的合规标准,使得公司根本无法遵守“引导”规定,也就是允许开发者告知用户在App Store之外完成交易。该公司还补充称,苹果正投入数十万小时工作来应对不断变化的欧盟监管规定。 欧盟委员会发言人表示,在苹果仍有时间提交整改方案的情况下,委员会不会就下一步行动作出揣测。该发言人还补充说,如果苹果继续违反《数字市场法》下的义务,监管机构拥有充足的监管权力来应对。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
雷军:小米YU7将于6月底发布
凤凰网科技讯(作者/于雷)6月16日,小米雷军发布微博称,大家非常期待的小米YU7,将于6月底发布。 还有很多重磅新品同场一起发布,比如搭载玄戒O1芯片的第二款平板:小米平板7S Pro。 小米YU7是小米汽车的第二款车型,也是小米进军SUV市场的首款产品。它与小米SU7共享设计语言,采用家族式设计风格,包括水滴大灯、光环尾灯等。 据工信部公示数据,小米YU7的尺寸为4999mm(长)×1996mm(宽)×1600mm(高),轴距为3000mm。这一尺寸使其定位为中大型SUV,接近特斯拉Model Y的尺寸。 小米YU7搭载了NVIDIA DRIVE AGX Thor计算平台(700TOPS算力),全系标配激光雷达、4D毫米波雷达及7颗超透防眩摄像头,支持高阶辅助驾驶功能。 智能座舱方面,小米YU7采用“双区环绕豪华座舱”设计,首发“小米天际屏全景显示”,通过3块Mini LED屏幕实现1.1米超宽投影,支持5类信息卡片自由组合。后排还配备了可移动控制屏,进一步提升交互体验。 小米YU7提供单电机和双电机版本。双电机版本的综合功率高达508kW(前电机220kW,后电机288kW),最高车速可达253km/h。此外,还存在低功率四驱版本。小米YU7采用宁德时代提供的三元锂电池和磷酸铁锂电池。续航里程方面,标准版为835公里,Pro版为770公里,Max版为760公里。电池容量分别为96.3kWh和101.7kWh。 小米YU7的直接竞品是特斯拉Model Y,其起售价为26.35万元。小米YU7在尺寸、续航、动力性能等多个维度均领先于Model Y。小米YU7的预计价格区间为25-30万元,这一价格区间使其在同级别车型中具有较强的竞争力。
共建韩国最大AI数据中心、容纳6万个GPU,亚马逊AWS与SK集团合作
IT之家 6 月 16 日消息,据《朝鲜日报》6 月 15 日消息,SK 集团与云服务提供商亚马逊网络服务(AWS)合作,在韩国蔚山米浦国家工业区内建设一个大型人工智能(AI)数据中心。 报道称,该设施将容纳 6 万个图形处理单元(GPU),预计将成为韩国有史以来宣布的最大 AI 专用数据中心。 行业消息人士表示,SK 集团将于本月晚些时候举办启动仪式,奠基仪式定于 8 月举行。该项目将分阶段建设: 首先建设一座 41 兆瓦(MW)的设施,计划于 2027 年 11 月完工。 第二阶段将扩能至 103MW,计划于 2029 年 2 月完成。 SK 最终计划将该设施扩展至 1 吉瓦(GW),目标是建立东北亚最大的 AI 数据中心枢纽。 报道提到,SK 集团和亚马逊云科技(AWS)将共同投资数万亿韩元用于该项目。 SK 电信和 SK 宽带作为 AI 基础设施计划的主要推动者,此前宣布计划到 2028 年投资 3.4 万亿韩元(IT之家注:现汇率约合 178.57 亿元人民币)。其中大部分投资将分配给予 AWS 的合资企业。该项目还得到了 SK 其他附属公司的支持,包括 SK Gas 和 SK 海力士。行业人士指出,仅 AWS 预计将投入 40 亿美元(现汇率约合 287.39 亿元人民币)用于开发。 ▲ 首尔江南区的 SK 宽带 AI 数据中心 报道认为,规划的 6 万块 GPU 设施将远超韩国当前或计划中的任何 AI 基础设施的规模。相比之下,韩国的国家 AI 计算中心预计将部署 1.5 万块 GPU —— 仅为 SK 准备安装 GPU 数量的四分之一。 AWS 已经在韩国首尔运营了一个数据中心,并且去年在仁川市 SEO 区开始建设另一个数据中心,投资了数万亿韩元。新的蔚山设施标志着从首都地区转移,这是大型科技项目的典型选择。报道还提到,该地点靠近 SK Gas 的液化天然气(LNG)联合热电联产厂,提供了战略优势,能够获得 100MW 级数据中心所需的庞大能源供应。分析师表示,确保稳定且可扩展的电源是选择该地点的关键因素。
头部证券争相押宝,山高控股成电算龙头的三重“确定性”
在人工智能时代,大模型成为基础设施,算力成为新的石油。 撰文|于玮琳 商业世界有两种赢家,一种在台前发光,一种在水下潜伏。 在人工智能时代,大模型成为基础设施,算力成为新的石油。前者捧出了迅速破圈、街知巷闻的 ChatGPT 和 DeepSeek;后者则以托举者姿态低调前行,直到在资本市场再也无法被忽视,如超越微软拿下全球第一股的英伟达,以及中国电算领域的龙头企业「山高控股」。 今年 3 月,一份亮眼的年度财报把山高控股推到台前,2024 年营收同比增长11.66%,归属母公司净利润同比增长 295.16%。 近期,中泰证券、德邦证券、东吴证券等头部机构纷纷给予山高控股「增持」评级,并不约而同地将其视为「电算一体化龙头」。 中泰证券认为,山高控股将数据中心和新能源协同组合,其打法和黑石集团收购 AIDC 和新能源资产异曲同工。在战略生态完备和国家政策红利的加持下,山高控股有望成为「全球电算王者」。 被誉为资本之王的黑石集团在过去四十年里几乎算无遗策,有无数精彩果决的投资案例,其创始人之一彼得·彼得森在自传中强调:我做决定的时候,总是考虑长远利益。 作为对标者的山高控股,同样是有着敏锐嗅觉的耐心资本。券商机构铁口直断的背后,是山高控股多年布局电算协同领域带来的三重确定性。 1 1+1=无限,山高控股的华丽转身 机构给企业的估值更多取决于对未来的预期,但预期却立足于当下实打实的业绩。 在山高控股的产业版图上,落地于内蒙古乌兰察布的电算一体化项目,便是最能佐证其未来盈利能力的关键一子。 以辽阔牧场、手抓羊和那达慕大会闻名于世的乌兰察布,拥有得天独厚的风光条件,年有效风时 7300-8100 小时,日照时长超 3200 小时,让这里被赋予了新的身份——绿色智算之都。 截至 2025 年 5 月,乌兰察布市落地了 56 个数据中心项目。其中,山高控股主导的乌兰察布源网荷储一体化项目,是少有的跑通了全流程的深度融合标杆。 该项目 2024 年 3 月启动,总投资 210 亿元,据中泰证券的研报,预计达产后年发电量约为 8.6 亿度。100% 供电的乌兰察布三期总计 1GW 容量数据中心项目完全达产时,预计每年约可产生增量经济效益 13 亿元。 如此超高预期的投资回报率,核心在于「一体化」,题眼在「生态协同」,而胜局早在四年前已经定下。 所谓源网荷储一体化,即是把发电、电网、用电、储能四个环节协同整合,传统电网是源随荷动,发电厂追着用电需求跑,而智能电网就像一支配合默契的交响乐团,用电端可以调节需求,储能可以充放电,形成动态平衡。 据了解,山高新能源在当地配套建设了 30 万千瓦的风光电站(绿电),通过专用线路直接供给世纪互联数据中心(IDC), 二者均为山高控股入股企业,可以实现物理层面的直连,突破传统电网「隔墙售电」的限制,做到发电-输电-用电的流程闭环,即「发电即用、用电即有、合理定价、互惠互利」的「自循环生态」。 这意味着经济效益的强协同,如果第三方企业单独建设,则需要额外支付电网过网费和波动电价,成本优势显著。 因为验证了电网协同的长期价值,该项目在 2025 年入选国家发改委公布的《绿色低碳先进技术示范项目清单(第二批)》清单,肯定了其首创性。 更重要的是,其示范效应为后续拓展新客户实现了有效背书,可以快速复制到同样具有风光资源的东数西算枢纽城市。 而对于同业来说,想要复制该项目的模式却并非易事,其一,项目总投资数额巨大,需要资本的耐心与果断;其二,截至 2024 年底,山高新能源装机规模超过 4698mw,年发电量超过 65.2 亿度,世纪互联已经在全国 30 个城市铺开了超 50 座数据中心,山高控股在规模方面龙头优势凸显;最为关键的是,凭借专业化运营和先发优势,山高控股的电算一体化业务率先获得了市场知名度和品牌认可度,所谓「一步领先,步步领先」。 从 0 到 1 最为艰难,但从 1 到 100 将是指数化的增量和效率,用资本的视角来看,这不是一个 13 亿元,而是无限可繁殖的收益模式。 乌兰察布项目的落地,标志着山高控股在自己的城池之外修建了陡峭的城墙,易守难攻。但所有第一个吃螃蟹的人,都离不开跋涉而来的艰辛。 时钟拨回到 2021 年,彼时,ChatGPT 仍未面世,大模型的军备竞赛还在爆发前夜,山高控股明确向「长周期产业投资」转型,聚焦新能源、新基建等国家政策支持的赛道。 2022 年,控股收购山高新能源,持股比例达 43.5%,此后,公司在 2024 年进一步增持股份至 56.97%,增强了对山高新能源的战略控制力和其在新能源领域的行业地位。 2023 年,以 2.99 亿美元入股 IDC 龙头世纪互联 ,成为最大机构股东,推动 IDC 业务向智算中心转型; 2024 年,落子乌兰察布,正式构建电算一体化生态;2025 年,母公司山东高速集团与华为签署战略协议,山高控股作为承载方,将提供算力基础设施和新能源底座,与华为在零碳园区、车路协同等领域融合「绿电+算力」。 细数过去几年的战略部署,山高控股几乎弹无虚发,完成华丽转身,2024 年末新兴产业占比提升至 78.6%。 任何赛道上,先发布局都要背负巨大压力和庞大投入,但一旦完成布局,就有了坚不可摧的护城河,英伟达用 30 年构建的「开发者-框架-硬件」CUDA 生态是如此;如今,山高控股的「绿电+算力」双引擎也是如此。 左手绿电,右手算力,1+1 等于无限,成为山高控股迈向全球 AIDC 龙头第一重确定性。 2 拿下全球入场券,不可小觑的国资 AI 新势力 让山高控股敢于用四年时间斥巨资布局电算协同生态的底层逻辑,是对产业和政策趋势的笃信。 一方面,大模型成为未来全球经济增长的核心叙事,全球科技企业进入大模型军备竞赛,算力是最核心的基础设施,而电力是算力的生命线。据《纽约客》杂志报道,「ChatGPT 每天为响应约 2 亿个用户请求,可能消耗超过 50 万千瓦时的电力」,这一电量足以供一个中国普通家庭使用 100 年。 另一方面,全球视角下使用清洁能源已经是大势所趋。为了应对气候变化和实现碳中和的目标,各国都在投入大量资金、通过税收抵免等政策支持清洁能源。 如果一家企业踩中了清洁能源、算力基建其中一条,就踏上了时代的快车道,如果能将二者协同把控,即是王炸。 从经济效益角度来看,中泰证券预测,根据内蒙在电力集团工商业电价综合约 0.45 元/千瓦时,绿电采用直供方式由新能源电厂直送数据中心,保守计算有 20% 的电价成本优势。 效率提升同样明显,电算协同可以动态匹配负荷与发电,实现算力资源的智能调度。根据工信部要求,2025 年底新建大型和超大型数据中心PUE值下降到 1.3 以下,而乌兰察布项目可以做到 1.15,较行业平均水平优化 23%,也就是 1 度电,超过 80% 的能量都能用来驱动计算服务。 跳出来看,国家推行的「东数西算」工程,本质上就是一个巨大的电算一体化工程,即利用西部的绿色能源优势,引导算力在全国范围内,进行更合理的布局,降低算力中心用电成本,提升整体算力规模和效率。 除了和国家政策的暗合,绿色算力等同于企业进军全球市场的入场券。2024 年 5 月,微软要求供应商使用 100% 绿色电力,诸如谷歌、亚马逊等 AI 巨头,也都承诺 100% 使用可再生资源,并将能源政策推至供应商体系。 根据中泰证券的报告,如新加坡、北京等国际中心城市,纷纷对数据中心设置了能耗、PUE 和碳排放红线,没有绿电方案的项目将无法备案或获得扩容指标。 电算协同发展,不仅意味着机构中远期的估值溢价,也已然是企业在全球拓展「合规通行证」。 风物长宜放眼量,算力即国力,电算一体满足的不只是我国监管需求,也关乎着中国算力的全球话语权。 根据IDC 和清华大学发布的《全球计算力指数评估报告》,算力指数每提高 1%,GDP 将增加 1.7%,数字经济将增长 3.6%。在数字化、智能化浪潮下,算力已经成为衡量国家综合实力的核心指标,战略价值堪比工业时代的石油与资本。 而实际上,我国早已跑在前列。IDC 数据显示,2023 年至 2028 年期间,中国智能算力规模的五年年复合增长率预计达 46.2%,远超全球平均值 35%。 换句话说,我国的电算龙头,必将是全球的电算龙头,对趋势的准确预判,就像是乘着时代的巨轮,顺风而行,这也是机构增持山高控股的另一重确定性所在。 3 是滚雪球,而不是坐电梯 四年前,山高控股从财务视角转向产业视角,从企业发展的实际出发完成布局,帮助旗下企业站稳电算协同的生态位;而作为一家国资背景的战略投资者,山高控股的野心远不止于此,能做到的也更多。 短期来看,山高控股的打法类似于 Equinix,这家全球领先的数字基础设施公司,曾在 2022 年后受加息压制估值,后来通过外购新能源资产、发布绿色债券和部署新能源技术,搭建了绿色护城河。新能源助力其顺利从传统 IDC 转型成为 AIDC(智算数据中心)。 中泰证券的研报表示,在 ESG 领域的竞争力,为 Equinix 带来了估值溢价,推动了市值的稳步增长。山高控股同样走上了其估值提升路径。 而从战略投资角度来看,山高控股的打法堪称黑石集团的翻版。 被誉为华尔街的无冕之王,黑石资本的核心投资方向在四十年来几经变幻,从上世纪 80 年代的杠杆收购,到 90 年代的房地产,2000 年后的商业地产,乃至 2008 年金融危机后全球抄底、投资中国。 这家总是能敏锐嗅到潮水方向的机构,当下的主要标的似乎都指向了一个方向:围猎 AIDC。 2021 年,黑石以约 100 亿美元收购第三方数据中心开发商 QTS;2024 年,黑石联合加拿大养老金 CPPIB,以约 240 亿澳元收购国际大数据运营中心 AirTrunk;2025 年,黑石收购波托马克能源中心,减少高密度负载对电网带来的冲击。 过程中,和山高控股一样,黑石将传统数据中心整合为高密度 AI 智算中心并锁定绿电。通过绿色债权融资降低资本成本,吸引 ESG 主题资金。 在过往的投资历程中,黑石的拿手好戏是「Buy-Fix-Sell」策略,如今,在 AIDC 领域,黑石同样可以将成熟的资产打包发行基础设施 REITs,回笼资金用于新并购。 据悉,2024 年,黑石与微软、英伟达等巨头联合成立全球 AI 基础设施联盟(GAIIP),以 300 亿美元私募股权撬动了 1000 亿美元投资。 几乎在同一时间,山高控股也将电算资产证券化,构建「并购-整合-资本化」的扩张循环。2024 年 11 月,其与大家投控股合作,作为双方战略的首个落地项目,大家投控将与旗下世纪互联联合发起首支数据中心领域 Pre-REITS 基金,扩充融资来源。 当投资机构的底层逻辑和趋势判断一致,那他们的动作就会出现神奇的同步性。但不同点在于,山高控股有着区分于黑石的本土化优势。 其一,依托母公司山东高速集团,山高控股在资源获取、政策支持、融资成本上具备天然优势。其二,在国家东数西算工程和绿电消纳政策下,政策红利覆盖全链条,在地方也可获得专项支持。 这也是为什么乌兰察布项目率先实现了电算一体化物理闭环,而黑石则更多是资本组合。 但另一方面,他山之石,可以攻玉。在未来,对标黑石收购 QTS、AirTrunk 的路径,山高控股可以尝试整合全球算力资产,加速跨境并购; 其二,今年 5 月承接山东高速集团与华为的合作,这类似于黑石 GAIIP 联盟的开始,山高控股未尝不可聚拢更多中国科技企业组成本土算力联盟,主导本土 AI 基建新标准。 黑石集团的另一位创始人苏世民,曾在自己的自传中这样说,「我不认为任何一种投资策略可以长期有效,你需要灵活应变」。 山高控股对于趋势的预判踏上了时代的上行电梯,投后赋能的不遗余力,对于金融制度创新、生态能力的构建,更如选对了厚雪长坡后的加速奔跑。 唯有主动选择,才能灵活应变,对山高控股未来多元化扩张的看好,构成了机构乐观预期的第三块「压舱石」,成为其迈向全球 AIDC 龙头的底层逻辑。
a16z合伙人:AI正在重构消费范式,除了速度都谈不上护城河,真正的AI+社交仍未出现
从 Facebook 到 TikTok,消费产品曾以连接人与人的方式推动社交演化。但在 AI 驱动的新周期中,“完成任务”正取代“建立关系”成为产品主线。ChatGPT、Runway 和 Midjourney 等产品代表着新的入口,它们不仅重塑内容生成方式,也改变了用户付费结构与产品变现路径。 a16z 五位关注消费领域投资的合伙人在讨论中透露,当前的 AI 工具虽强大,但尚未建立社交结构,缺乏“连接性”的平台支点。 消费级爆款产品的缺席,反映出平台与模型之间仍存在断层。真正 AI 原生的社交系统仍未出现,这一空白可能孕育出下一代超级应用。a16z 平台战略前世今生:从 VC “不愿擦屁股”到“全栈服务” 与此同时,AI 分身、语音 agent 与数字人格等产品形态已初具雏形,其意义远不止陪伴或工具,而是构建新的表达机制与心理关系。未来平台的核心竞争力,或将转向模型能力、产品演化速度与认知系统集成水平。 ▍AI 正在重写 2C 商业模式 过去二十年,消费领域每隔几年便会涌现出代表性产品,从 Facebook、Twitter 到 Instagram、Snapchat、WhatsApp、Tinder、TikTok,每一款产品都曾推动一次社交范式的演化。近年来,这种节奏似乎出现停滞,引发一个重要问题:创新是否真的暂停,或我们对于“消费产品”的定义正面临重构。 在新的周期中,ChatGPT 被认为是最具代表性的消费级产品之一。它虽非传统意义上的社交网络,却已深刻改变了人们与信息、内容乃至工具的关系。诸如 Midjourney、ElevenLabs、Blockade Labs、Kling、VEO 等工具在音视频和图像领域迅速普及,但其中多数尚未建立人与人之间的连接结构,不具备社交图谱属性。 当前多数 AI 创新仍由模型研究者主导,具备技术深度却缺乏终端产品构建经验。随着 API 与开源机制的普及,底层能力正在释放,新的消费级爆款也可能由此诞生。 过去二十年的消费互联网发展,Google、Facebook 和 Uber 的成功,根植于互联网、移动设备与云计算三大底层浪潮。当前的演化则来自模型能力的跃迁,技术节奏不再表现为功能更新,而是由远程升级的模型所驱动。 消费产品的主线也发生转移,从“连接人”走向“完成任务”。Google 曾是信息获取工具,ChatGPT 正在逐步接替其角色。Dropbox、Box 等工具型产品虽未建立社交图谱,但依然在消费者端具备广泛渗透力。尽管内容生成需求持续上升,AI 时代的连接结构尚未建立,这一空白也许是下一轮突破的方向。 传统社交平台的护城河正面临重估。在 AI 崛起背景下,平台主导权或正从构建关系图谱转向构建模型与任务系统的能力。OpenAI 等技术主导型公司,是否正成为下一代平台公司,值得关注。回报只能靠 OpenAI?硅谷 20 年美元基金创始人警告 VC 模型正濒临失效 从商业模型来看,AI 产品的变现能力远超以往消费工具。过去即使是头部应用,用户平均收入仍较低。如今,顶级用户每月付费可达 200 美元,超过多数传统科技平台的上限。这意味着企业可以绕过广告和漫长的变现路径,直接通过订阅获取稳定收入。早期过度强调网络效应与护城河,本质上是因为产品变现能力薄弱。而今天,只要工具足够有价值,用户自然愿意付费。 这一变化带来了结构性转折。传统“弱商业模式”迫使创始人围绕用户粘性、生命周期价值等指标构建叙事,而 AI 产品凭借直接收费能力,在上线初期便可闭环商业逻辑。 虽然如 Claude、ChatGPT、Gemini 等模型在功能层面看似相似,但用户实际体验存在显著差异。这种偏好差异催生出各自独立的用户群体。市场非但未出现价格战,反而呈现头部产品持续提价的趋势,显示出差异化竞争结构已逐步建立。 AI 也正在重构“留存率”的定义。在传统订阅产品中,用户留存即决定收入留存。而如今,用户可能持续使用基础服务,却因更频繁调用、更大额度积分或更高质量模型而选择升级订阅。收入留存显著高于用户留存,属以往所未见。 AI 产品的定价模型正发生根本性转变。传统消费类订阅每年费用多在 50 美元上下,如今大量用户愿意每月支付 200 美元,甚至更高。这种价格结构的可接受性,源于用户体验到的实际价值发生了本质变化。 AI 产品之所以能够被高溢价接受,在于其不再只是“辅助改善”,而是真正“替用户完成任务”。以研究类工具为例,原本需十小时手动整理的报告,如今几分钟内即可生成。即使全年只使用数次,该服务也具备合理的付费预期。 在视频生成领域,Runway 的 Gen-3 模型被认为代表了新一代 AI 工具的体验进化。通过自然语言提示即可生成风格各异的视频,支持语音与动作定制。部分用户使用该工具制作带朋友名字的专属视频,也有创作者生成完整动画作品上传至社交平台。这种“几秒生成、立即使用”的交互体验,前所未有。 从消费结构来看,未来用户的主要支出将高度集中在三类:吃饭、房租与软件。软件作为通用工具,其渗透速度正在不断提升,支出占比持续上升,已开始吞噬原本属于其他品类的预算空间。 ▍真正的 AI 社交网络仍未出现 娱乐、创作,甚至人际关系本身,正在被 AI 工具逐步中介化。许多过去依赖线下交流或社交互动才能完成的事情,如今可以通过订阅模型来实现,从视频生成到写作协助,甚至替代一部分情感表达。 在这一趋势下,人与人之间的连接机制也正面临重新思考的必要。尽管用户仍活跃于 Instagram、Twitter 等传统平台,真正意义上的新一代连接方式尚未出现。 社交产品的本质,始终围绕“状态更新”展开。从文字到图片、再到短视频,媒介不断演进,但底层逻辑始终是“我在干嘛”——意在建立存在感,获得反馈。这种结构构成了上一代社交平台的基础。 当下的问题在于,AI 能否催生一种全新的连接方式?模型交互已深入用户生活。每天与 AI 工具的大量对话中,输入了极为个人化的情绪与需求。这种长期输入极有可能比搜索引擎更了解用户,如果被系统性提取并外化为“数字自我”,人与人之间的连接逻辑将可能被重构。 部分早期现象已初步显现。例如在 TikTok 上,开始出现基于 AI 反馈的人格测试、漫画生成与内容模仿。这些行为不再仅仅是内容生成,更是一种“数字映射”的社交表达。用户不仅生成,还主动分享,引发模仿与互动,显示出对“数字自我表达”的高度兴趣。 但这一切仍然局限在旧平台结构之内。无论是 TikTok 还是 Facebook,尽管内容更智能,信息流结构与交互逻辑几乎未发生变化。平台未因模型爆发而真正演进,只是成为生成内容的托管容器。 生成能力的跃迁,尚未找到与之匹配的平台范式。大量内容缺乏结构化呈现与交互组织,反而被平台现有的内容架构消解为信息噪声。旧平台承担的是内容承载功能,而非社交范式的重建引擎。 当下的平台更像是“旧系统披上新皮肤”。短视频、Reels 等形式尽管外观现代,调性年轻,但其背后的逻辑仍然未脱离信息流推送与点赞分发的范式束缚。 一个未解的核心问题是:第一款真正“AI 原生”的社交产品会是什么样? 这不应是模型生成的图像拼贴、信息流的视觉刷新,而是一个可以承载真实情绪波动、引发连接与共鸣的系统。社交的本质从来不是完美展演,而在于不确定性——尴尬、失败与幽默构成情感的张力结构。如今大量 AI 工具输出的是“最理想的用户版本”,永远正面、永远流畅,却让真实社交体验变得单一与空洞。 当前被称为“AI 社交”的产品,实质上仍是旧逻辑的模型化复刻。常见做法是复用旧平台界面结构,将模型作为内容源头,但在产品范式与交互结构上没有带来根本变化。真正具有突破意义的产品,应从“AI + 人”的底层逻辑出发重构平台系统。 技术层面的限制仍是重要阻碍。几乎所有消费级爆款产品都诞生于移动端,而当前大模型在手机端的部署仍面临挑战。实时响应、多模态生成等能力对端侧算力提出极高要求。在模型压缩与计算效率突破之前,“AI 原生”社交产品仍难以全面落地。 个体匹配机制是尚未被充分激活的另一方向。尽管社交平台掌握大量用户数据,但在“主动推荐合适连接”这一环节始终缺乏系统性推进。未来若能基于用户行为、意图与语言交互模式构建动态匹配系统,社交的底层逻辑将被重新塑造。 AI 不仅可以捕捉“你是谁”,还可以描绘“你知道什么”“你如何思考”“你能带来什么”。这类能力不再局限于静态标签式的“身份档案”,而是形成动态、语义丰富的“人格建模”。传统平台如 LinkedIn 构建的是静态自我索引,而 AI 有能力生成一个知识驱动的活体人格接口。 未来,人们甚至可能直接与某个“合成的自我”交流,从数字人格中获取经验、判断与价值观。这不再是对信息流结构的优化,而是从根本上重构人格表达与社交连接的机制本身。 ▍AI 时代没有护城河,只有速度 除了社交尚未迎来范式跃迁,AI 工具的用户扩散路径也正在发生反转。不同于过去从 C 端起飞、逐步渗透 B 端的互联网逻辑,如今 AI 工具在多个场景中呈现出企业端率先采用、消费端随后扩散的逆向传播模式。 以语音生成工具为例,初期用户主要集中在极客、创作者与游戏开发者等小众圈层,用途包括声音克隆、配音视频与游戏模组。但真正推动增长的力量,来自企业客户的大规模系统性采用,应用于娱乐制作、媒体内容、语音合成等多个领域,不少企业将该工具嵌入工作流程中,比预期更早完成了企业化渗透。 这种路径已非孤例。多个 AI 产品呈现出类似轨迹:起初在 C 端通过病毒式传播引发关注,随后 B 端客户成为主要变现与规模化驱动者。与传统消费产品难以向企业端转化不同,如今不少企业正通过 Reddit、X、Newsletter 等社群识别 AI 工具并主动试点,消费者热度反而成为企业部署 AI 的信息入口。 这一逻辑正被产品化、工程化为系统策略。部分公司已搭建机制,当平台监测到同一组织内多位员工注册并使用某工具后,便会通过支付数据或域名归属主动触发 B 端销售流程。消费向企业的迁移已不再是偶发事件,而是一套可复制的商业路径。 这种“由下而上”的扩散机制,也引出了更大的问题:眼下这些火热的 AI 产品,是未来的平台基座,还是类似 MySpace 与 Friendster 的过渡产物? 当前的判断趋于谨慎乐观。AI 工具具备演变为长期平台的潜力,但必须穿越模型层持续演进带来的技术压强。以新一代多模态模型为例,不仅支持角色扮演、图文协同与音频实时生成,表达深度与互动方式正迅速提升。即便在文本领域这种相对稳定的赛道中,模型优化空间仍然巨大。只要能持续迭代,无论是自研还是高效集成,工具类产品就有可能稳居前沿,不被快速替代。 “不要掉队”成为当下最实际的竞争命题。在结构日益细分的市场中,图像生成已不再是“谁最强”的单一标准,而是“谁最适合插画师、摄影师、轻量用户”的精准定位竞争。只要持续更新、用户保持在场,产品就有可能获得长期存续性。 类似的专业分化也在视频工具中出现。不同产品擅长不同内容形态,有的专注电商广告,有的强调叙事节奏,有的主打结构剪辑。市场容量足够大,可支持多种定位共存,关键在于结构性定位的清晰与稳定性。 关于“护城河”这一概念是否仍适用于 AI 时代的讨论,正在发生根本性转变。传统逻辑强调网络效应、平台绑定与流程集成,但不少早期被认为拥有“深护城河”的项目最终未能成为赢家。反而是那些在边缘场景高频试错、快速更新的小团队,在模型与产品上不断迭代,最终进入主赛道中心。 当前最值得关注的“护城河”是速度:一是分发速度,即谁能最早进入用户视野;二是迭代速度,即谁能最快上线新功能、激发使用惯性。在注意力稀缺、认知高度碎片化的时代,谁先出现、谁持续变化,谁就更可能导向营收、通路与市场规模的积累。“持续更新”正在取代“稳态防守”,成为 AI 时代更现实的策略。 “速度带来心智占领,心智带动收入闭环”,成为当下最重要的增长逻辑之一。资本资源可以反哺研发,增强技术优势,最终形成滚雪球效应。这种机制更贴合 AI 产品的周期动态,也更适应快速演化的市场需求。 “动态领跑”正在取代“静态壁垒”成为新一代护城河的本质。衡量一个 AI 产品能否长期存在的标准,不再是市场份额的静态占有,而是其能否持续出现在技术或用户认知的前沿地带。 传统意义上的“网络效应”在 AI 场景中仍未完全显现。大多数产品尚处于“内容创作”阶段,尚未形成“生成—消费—交互”的闭环生态,用户关系尚未沉淀成结构性网络,具备社交级网络效应的平台尚在酝酿之中。 不过,在部分垂直品类中,新的壁垒结构已开始显现。以语音合成为例,某些产品已在多个企业场景中建立流程绑定,凭借频繁迭代与高质量输出,构建起“效率 + 品质”的双重壁垒。这种机制可能成为当下构建产品护城河的现实路径之一。 在体验维度上,部分语音平台已表现出网络效应的雏形。通过用户上传语料与角色声音样本不断扩展数据库,平台模型获得持续训练反馈,形成用户依赖与内容正循环。例如,针对“年迈巫师”这类定向语音需求,主流平台可提供二十多个高质量版本,而一般产品仅有两三个,反映出训练深度与内容广度的差距。 这种沉淀路径,在语音生成这一具体场景中,已初步构建起新型用户黏性与平台依赖机制,虽然尚未达成平台级体量,但已形成闭环苗头。 语音是否可以成为 AI 的底层交互接口,也正在从技术想象走向产品现实。语音作为人类最原始的交互形式,虽然在过去几十年中经历多轮失败尝试,从 VoiceXML 到语音助手,始终未能成为高效的人机交互通道。直到生成式模型兴起,语音才首次获得支撑“普适交互入口”的技术基础。 语音 AI 的落地路径,也正从消费级应用向企业场景快速渗透。尽管原先构想多围绕 AI 教练、心理助手、陪伴型产品展开,但当前接受最快的是对语音有天然依赖的行业,如金融服务、客户支持等。客服离职率高、服务一致性差、合规成本重,AI 语音可控性与自动化优势开始体现出系统性价值。 部分工具已跑出,如 Granola 等产品开始进入企业使用场景。虽然尚未出现“全民级语音产品”,但路径已被初步打开。 更值得注意的是,AI 语音正在进入高信任成本、高价值信息传递的关键场景。包括销售转化、客户管理、合作洽谈、内部文化沟通等,都依赖于高质量对话与判断力传递。生成式语音模型在这些复杂对话场景中,已具备比人类更一致、不中断、可控的执行能力。 一旦这类系统在未来持续演进,企业将不得不重新评估“谁是组织中最重要的对话者”这一基础认知。 所有这些趋势背后,一个新的结构性判断正在成型:AI 时代的护城河,不再来自用户数量或生态绑定,而是来自模型训练深度、产品演化速度与系统整合广度。那些拥有早期积累、持续更新、高频交付能力的公司,正在用“工程节奏”重塑技术壁垒。新一代的产品基础设施,也许正是在这些看似垂直的小赛道中逐步成型。 红杉美国 Roelof Botha 谈 AI 时代 VC 观察模型 —— AI 不像互联网那样削弱中心化,但仍有结构机会 ▍最懂自己的 AI 分身 语音技术的演进只是序章,AI 分身的构想正逐步走出实验室,进入产品化路径。越来越多团队开始思考:在何种场景下,人们会与“合成的自己”建立长期互动? AI 分身的核心,不再是“放大头部影响力”,而是赋予每一个普通人表达与延展自我的能力。现实中存在大量拥有独特知识、经验与人格魅力的个体,但他们长期因表达门槛、媒介门槛而无法被看见。AI 克隆的普及,首次为这类个体提供了“被记录、被调用、被传承”的基础设施。 知识性人格 agent 是当前已实现的典型路径之一。例如在语音课程系统中,讲师的声音被构建为可交互角色,结合检索增强生成技术,使得用户可围绕课程提出任意问题,系统则在庞大语料库上实时生成回答。课程不再只是内容的被动播放,而是知识人格的主动参与,一套原本需花数小时观看的内容,被转化为几分钟内完成的个性化问答体验。 这标志着数字人格已从“内容表现层”上升为“认知交互入口”。当 AI 分身能够在语义上、节奏上、情感结构上持续呈现出一种熟悉、理想、甚至超越现实交际体验的人格建模时,用户对其建立的信任与依赖,将超越工具层面,进入“心理关系”的建构域。 这种演化路径也推动认知观念的更新。未来的数字交互将可能分化为两类核心形态:一类是围绕真实人物构建的扩展人格(如导师、偶像、亲友的延伸形态),另一类则是基于用户偏好与理想化设定生成的“虚拟理想他者”。尽管后者从未真实存在,却可以构成高度有效的陪伴与反馈关系。 在创作者领域,这一趋势也开始显现。一部分拥有公开语料的个体正在被“克隆”为可调用的数字人格资产,未来或将作为个人 IP 的一部分参与内容生产、社交互动、商业授权,重塑“个体边界”与“表达方式”。 “AI 名人”也由此诞生。一类是完全虚构的形象偶像,由生成模型在图像、语音、行为上全面构建;另一类则是现实明星的多重数字分身,在不同平台以不同人格状态与用户互动。这些“AI 文化人格”已在社交网络中大量试水,以图像逼真度、行为一致性与语义建模深度作为评价维度。 在内容生态中,AI 工具降低了创作门槛,但未改变优质内容的稀缺性。有感染力的内容依旧取决于创作者的审美判断、情绪张力与持续表达力。AI 更多扮演“实现逻辑”的协助者,而非“创作动因”的替代者。 “被工具解放的创作者”群体正在浮现。他们未必具备传统艺术背景,却通过 AI 工具完成了表达意图的释放。AI 提供的是入口,不是通道尽头,最终能否脱颖而出,依然取决于个体能力、主题独特性与叙事结构。 这种表达方式在内容产品上已有体现。例如以“虚拟街头采访”为形式的视频内容,实质上是与 AI 生成角色进行结构化互动。角色可以是精灵、巫师、奇幻生物,平台可一键生成整段对话与场景,完成从人物设定、语言逻辑到视频渲染的全流程自动化。这一机制已在多平台获得高关注量,也预示着叙事 AI 的产品形态正在形成。 音乐领域亦有类似趋势,但模型输出在表现力与稳定性上仍存在挑战。AI 音乐当前最大问题在于“平均性”偏向。模型天然趋向中心拟合,而真正有冲击力的艺术内容常常源于“非平均”的文化冲突、情绪极端与时代共振。 这并非模型能力不足,而是算法目标未覆盖艺术的张力逻辑。艺术不是“准确”,而是“冲突中的新意义”。这也促使人们重新思考:AI 是否可以参与生成文化深度内容,而不仅是重复性表达的加速器? 这种探讨最终落在“AI 陪伴”的价值上。AI 与人的关系层,或许才是最早成熟、最具商业潜力的场景之一。 在早期陪伴类产品中,大量用户表示,哪怕是模拟回应,也形成了心理上的安全区。AI 不需要真的“理解”,只要能构建“被听见”的主观体验,就能缓解孤独、焦虑、社交疲劳。对于部分人群,这种模拟互动甚至是重建真实社交能力的前提机制。 AI 关系并非只能是舒适区的强化器。相反,最有价值的陪伴,或许正源于它所带来的认知挑战。如果 AI 能够适度提出问题、引导冲突、挑战固有认知,就可能成为心理成长路径上的引导者,而非确认者。这种对抗式交互逻辑,才是未来 AI 分身系统中真正值得开发的方向。 这一趋势也显示出技术的新功能定位:从交互工具走向“心理基础设施”。当 AI 能参与情绪调节、关系支持与认知更新,它所承载的,不再只是文本或语音能力,而是社会行为的延展机制。 AI 陪伴的终极命题,不是模拟关系,而是提供人类经验中难以构建的对话场景。在家庭、教育、心理、文化等多个场景中,AI 分身的价值边界正在被拓宽——不只是回应者,更是对话者与关系塑造者。 ▍AI 终端下一步,是社交本身 AI 分身、虚拟陪伴、语音 agent 之后,产业注意力正进一步回到硬件与平台层面——未来的人机交互形式是否存在颠覆性重构的可能? a16 认为,一方面,智能手机作为交互主平台的地位仍高度稳固,全球已部署超过 70 亿部智能手机,其普及率、生态黏性与使用习惯短期内难以撼动。另一方面,在贴身设备与持续交互设备上,新的可能性正在酝酿。 一条路径是“手机内部的演进”:模型向本地化部署迈进,围绕隐私保护、意图识别与系统集成的优化仍有巨大空间。另一条路径则是发展新的设备形态,如“始终在线”的耳机、眼镜、胸针设备等,主打无感启动、语音驱动与主动触达。 真正的决定性变量仍可能是模型能力的突破,而非硬件外形的更替。硬件形态为模型能力提供边界载体,模型能力则定义了设备价值的上限。 AI 不应只是网页上的输入框,而应成为“与你共处”的存在。这一观点日益成为行业共识。许多早期尝试已经开始探索“在场型 AI”的路径:AI 能看到用户行为、听到实时语音、理解交互环境,并主动介入决策流程。从建议提供者转变为行为参与者,成为 AI 落地的关键跃迁方向之一。 已有部分设备能够实时记录用户行为与语言数据,用于回溯与行为模式识别。也有产品尝试主动读取用户屏幕信息并提供操作建议甚至直接执行。AI 不再是响应式工具,而是生活流程的一部分。 更进一步的提问是:AI 能否帮助用户认识自己?在缺乏外部反馈系统的日常中,大多数人对自身能力、认知偏误、行为习惯缺乏系统性了解。一个伴随时间足够长、能够理解用户路径的 AI 分身,有可能成为引导认知觉醒与潜能释放的智能机制。 例如,它可以向用户指出:“如果你每周将 5 小时投入某项活动,三年后将有 80% 机会成为该领域专业人士”;或推荐与其兴趣结构、行为模式最匹配的人脉资源,从而搭建更高精度的社交图谱。 这类智能关系系统的核心在于:AI 不再是间歇式使用的功能工具,而是结构性地嵌入用户生活之中。它陪伴工作、辅助成长、提供反馈,是一种持续性的“数字伴侣”关系。 在设备端,耳机正被视为最有可能承载这类 AI 助手的终端形态。以 AirPods 为代表的耳机设备,佩戴自然、语音通道顺畅,具备交互低阻与长期佩戴的双重优势。但其在公共场景下的社交认知依然有限——“戴耳机=不欢迎交流”的文化预设仍在影响设备普及路径。 设备形态的演进,不只是技术问题,也是一种社交语境的再定义。 在可持续记录成为行业默认趋势之后,新的社会习惯也在重建之中。“默认被记录”的时代,正在一代年轻用户中悄然展开。 尽管持续记录带来隐私焦虑与伦理反思,但人们也在逐步形成“记录即背景”的文化默契。如在旧金山的一些工作与社交混合场景中,“记录存在”已逐渐内化为默认设置;而在纽约等地区,则尚未形成同等文化容忍度。城市之间对技术实验的接受度与适应速度差异,正在成为 AI 产品落地节奏的微观变量。 当记录行为从工具选择变为社交背景,真正的规范重建将围绕“边界设定”与“价值构建”展开。 当前正处于“技术路径与社会规范同步建构的早期阶段”——空白多、共识少、定义未明。但这正是提出问题、设定界限、塑造秩序的最关键时期。 无论是 AI 分身、语音 agent 、数字人格、虚拟陪伴,还是硬件形态、社交接受度、文化摩擦点,整个生态仍处于最原始、最未定义的状态。这意味着未来几年内,很多假设会被证伪,也会有路径快速放大,但更关键的是在这一阶段持续提出真正的问题,构建更可持续的答案结构。 I/O 到 iO,Jony Ive 将推动一场新的设计运动 —— AI 正在改写计算范式与硬件定义,也是大模型后的新战场
腾讯算法大赛启动 冠军团队独享现金200万元
凤凰网科技讯 6月16日,腾讯官方宣布正式启动新一届算法大赛,本次竞赛聚焦“全模态序列生成式推荐”技术方向,设立百万元现金奖池,冠军团队将获得200万元奖金,前十强选手可直接获得腾讯核心业务部门录用机会。大赛报名截止时间为7月31日23时59分59秒,面向全球高校学生开放。 据了解,本次大赛由腾讯广告业务部门出题,参赛者将面对包含文本、视觉、协同ID在内的工业级全模态数据处理挑战。腾讯方面表示,将为参赛团队提供基线模型和技术指导,帮助学生运用多模态理解、序列决策、实时生成等前沿AI技术。 此次算法大赛的推出,与腾讯近期人才战略密切相关。今年4月,腾讯宣布启动史上最大规模招聘计划,三年内新增28000个实习岗位,其中2025年校招实习生岗位的六成面向技术人才开放,涵盖大模型、算法、云计算等核心技术领域。 6月12日,腾讯“青云计划”面向全球招募顶尖技术学生,重点支持十大前沿技术领域的人才培养。业内人士分析认为,在生成式AI浪潮推动下,高效精准的广告算法已从企业商业竞争力的“可选项”转变为“必需品”,广告算法领域正成为AI人才的重要聚集地。 腾讯广告业务相关技术人员表示,数字广告场景为AI综合技术应用提供了理想的验证环境,因为广告算法需要多项前沿技术的无缝集成与协同工作。技术优化的直接效果往往能够快速转化为业务收入提升,形成技术到商业的高效闭环。
两个浙大学生决定只用AI生存72小时
5月15日晚,区瀚楠、陈睿轩走进了上海浦东的一栋民宿。 这里没有食物、没有智能手机、没有浏览器、没有APP,只有一台预装AI工具的联网电脑、一部非智能手机、一瓶饮用水和100元生存资金,他们将在这个封闭房间里依靠AI工具生存72小时。 这是一场由五源资本发起的“72小时AI生存挑战”,和他们一样走进这栋民宿其他封闭房间进行挑战的玩家还有独立开发者、产品经理、算法工程师、人工智能方向博士生和科班出身的导演。 在进入房间之前,他们每个人可以选择携带一件物品,在现场提供的食品、饮料、书籍、生活用品之中,区瀚楠、陈睿轩在拿了一袋奥利奥饼干之后,还选择了一本印度诗人泰戈尔创作的诗集《飞鸟集》。 这个选择让人意外,而他们作为组合共同参加挑战也是意外。 区瀚楠、陈睿轩两人是浙江大学应用数学系的大一学生,都是00后,他们不仅是同学,也是创业搭档,创业方向是AI教育。这次的“72小时AI生存挑战”活动,他们分别报了名。但直到活动主办方视频面试的时候才意外地发现,他们合租在同一个屋檐下。 “别的挑战者都是一个人参赛,而我们是两个人,有优势。”“可是,我们两个人要共用100元。”“没关系,这是个不错的请假理由。”就这样,两位有些“漫才”组合感觉的年轻人开始了他们的AI生存挑战。 区瀚楠(图右)、陈睿轩(图左),图片来源:五源资本 1.先活下来 根据活动的要求,所有玩家需在前48小时内完成一次“自主获取基本物资”的任务——他们只能通过AI工具购买水和食物。 两人在进入房间前上交了所有个人物品,图片来源:五源资本 虽然有一台预装AI工具的联网电脑,但是电脑里没有浏览器,玩家也不能直接下载使用浏览器,他们与电脑的交互必须通过AI工具。 也就是说,如果要购买水和食物,玩家不能自己打开浏览器手动进入相关网站点击下单,而是要通过自己“手搓”AI Agent,使用自然语言交互的方式控制浏览器在相关网站下单。 这对没有技术背景的玩家来说有些门槛,因此有玩家当天选择“倒头睡觉”。 不过区瀚楠、陈睿轩两人都有一些编程背景,陈睿轩更是从小学二年级就开始学习编程,所以他们打开电脑第一件事就是打开了AI编程工具Cursor。 通过将AI功能原生嵌入编辑器,Cursor改变了传统的“手动编码”模式,让开发者能够以更具创造性的方式工作,同时保持对代码质量与安全的高度控制。 他们利用Cursor和一些开源工具,用了一个小时,搭建一个可以操作虚拟浏览器的Agent。 这属于Browser use Agent (浏览器使用Agent), 这类Agent专门设计用于在网页浏览器环境内执行任务。它们主要与网页内容进行交互,例如导航网页、填写表单、提取信息、点击链接、在特定网站上完成购买等。 其实还有比较传统的方式,就是编程写一些自动化的脚本,但是为了在AI时代中探索“重新开始”的可能性,他们还是用了AI Agent的方式。 他们通过自然语言给Agent提出需求,这个Agent比较顺利地操作虚拟浏览器登录了某电商网站并下单了12桶方便面。 当然收验证码的环节还是要用那部非智能手机,这也是这部手机的唯一用途。 为什么是买泡面而不是点外卖?一方面是因为经费有限,外卖吃不了几顿;另一方面,外卖平台更多是在手机端,电脑端操作很不方便。 「甲子光年」也用国内某款Browser use Agent测试了一下,在输入了“帮我点一份外卖,要蛋炒饭和可乐”的提示词后,这个Agent在分析了几分钟国内外卖行业现状,打开了美团、饿了么官网后就停止了工作,因为官网上并没有在线点外卖的入口,只有引导用户下载App的二维码。 区瀚楠、陈睿轩也是后来才发现真正可以在电脑端点外卖入口藏在另一个不起眼的H5页面中。 虽然他们手搓的Agent中间也出现了一些Bug,比如Agent单次任务完成后就会关闭浏览器,无法连续执行任务,但是他们也都逐步解决了。 当12桶方便面下单完成,他们心想,至少这几天的温饱问题解决了。 陈睿轩长出一口气,翻开了《飞鸟集》,一首诗出现在了他的眼前: The mystery of creation is like the darkness of night——it is great. Delusions of knowledge are like the fog of the morning. 造化的玄妙, 像黑夜一样深邃; 知识的幻影, 像晨雾一样缥缈。 2.赚钱之路 第二天早上,陈睿轩五点多就醒来了,这也是他日常的作息习惯。 他平时社交不多,可以从早到晚敲代码。有一次,因为失恋,他一个人怒敲了十几个小时的代码,后来又不断修改Bug。“当时敲了什么已经忘了,但我记住了,谈恋爱会影响敲代码。”陈睿轩说。 不过这一天陈睿轩没有受到其他事情影响,他和区瀚楠只有一个目的:用AI赚钱。 两人在挑战中,图片来源:五源资本 他们的想法是做一个电商卖家Agent:自动在二手平台发帖子、与买家交流、接单并发货。 由于条件所限,他们选择卖的东西是Logo设计图,当然,Logo设计图也是用AI生成的,这项业务被称为“AI代生图”。 在某二手交易平台上,有很多提供“AI代生图”服务的商家,图片来源:某二手交易平台 不过他们想“以假乱真”,也就是说,在商品描述中不提“AI代生图”,而是让Agent“扮演”成一个设计师来接单。“我们想看看有没有可能做到对方发现不了是AI在接单。”区瀚楠说。 他们很快搭建好Agent,但是在运行后发现,卡在了一道不起眼的人机验证环节——拖动滑块到指定地方。 这一卡就是10个小时。 这看似很简单的拖动滑块的操作,其实背后有很多验证的环节,这是他们之前估计不足的。 在尝试很多方法后,终于活动的第二天晚上,他们通过电商卖家Agent在某二手交易平台挂上了2件商品,一件是“AI Logo设计”,一件是“AI产品图设计”。 受限于模型API权限不足、电脑显存不够、AI精度不准等因素,他们在其中还是加入了一点“人工”的操作,尽管如此,在商品成功上架的时候,他们还是非常兴奋。 陈睿轩坦言,这个Agent的完成度不到30%。之后的时间,他们几乎都在和Cursor打交道,但是他们对Cursor是又爱又恨。尽管Cursor为他们提供了编程帮助,但是他们也花了不少时间去debug。 不过商品挂出后,一直无人问津,让他们一度认为因为使用AI工具而“被平台限流了”。令他们比较安慰的是,临近活动结束时,有人来询问商品,Agent客服给出了比较准确的回答。但比较遗憾的是,直到最后,他们也没有通过这种方法赚到钱。 他们把100元的活动经费花到了2.97元,这并不完全是他们自己的开销。他们在第一天买了方便面之后,又成功买了一些鸡胸肉,后来他们成功搞定了外卖流程,给所有玩家一人点了一杯奶茶。 在挑战过程中,的确有玩家因为不擅长使用AI工具,无法获取物资而饿肚子。因此,懂技术的几位玩家通过主办方提供的内部留言板给其他玩家分享了AI工具搭建和使用方法,帮助他们获取物资。后来,由于缺少娱乐方式,他们还通过编程做了十几个小游戏提供给大家。 “就像开源社区一样,这也是本次挑战最让我兴奋的时刻。”区瀚楠说,“或许比较遗憾的是没看懂《飞鸟集》吧。” 3.生存测试 1999年9月3日下午1点,北京保利大厦、上海华亭宾馆、广州江湾大酒店一些房间的大门被关上,12位通过投票选出的志愿者走进了只有一张光板床、一套桌椅、一台可以上网的电脑和一卷卫生纸的房间,他们要在这里生存72个小时,而外面全都是媒体记者和看热闹的市民。 这就是当年影响力极大的“72小时网络生存测试”,也是这次“72小时AI生存挑战”的灵感来源。 《北京青年报》对“72小时网络生存测试”的报道,图片来源:历史照片 1999年,中国互联网尚处于起步阶段,家用电脑普及率不高,上网需要插电话线拨号,网络购物更是超前的概念。为了探索互联网在普通人生活中的应用潜力,以及检验中国网络的先进程度,梦想家中文网以及十家新闻媒体主办策划了“72小时网络生存测试”活动。 冷明是参加测试的志愿者之一,当年她还是上海工程机械大学服装学院大三的学生,只有两个月的网龄。临关门时,现场记者大声问冷明:“万一没找到吃的怎么办?”冷明从一堆摄像镜头中探出脑袋说:“那就饿着呗,饿一夜没什么。”不过后来,记者从监视器里发现,冷明是最先拨号上网的,她浏览了“永和豆浆”的网站点了外卖,又上“梦想家”网站看了关于自己的新闻,最后到“索易”读电子邮件去了。 当时在网上点外卖并不常见,测试期间,“永和豆浆”在官方网站上特别设置了专门链接,只要点击一下,就可以为测试者送食物上门。在测试结束后,“永和豆浆”就关闭了外卖服务。当时他们对媒体回应是,像餐饮这种小本经营的买卖,外卖服务所可能出现的耗费和成本,他们现在都还受不起。 为公平起见,三地测试者均不能在其居住地受测,而是通过抽签决定到另外两个城市中的一个。由于没有被褥,一位从广州来北京测试的志愿者第一晚就在光板床上冻了一宿,“没的盖,冻醒了好几回,差点想把窗帘拉下来。” 最终,除了一位零网龄志愿者未成功购物中途退出之外,其他11位志愿者都完成了测试,其中一位还开网店赚到了钱。 “72小时网络生存测试”北京站测试者,图片来源:新浪摄影 当时,一位IT评论人表示,网络零售只能是现实店铺的一种补充,无法代替现实商店。因为并不是所有的东西都可以在网上卖。如果目前一个网络零售店受到这种活动的启发,想做可以提供全部生活用品的网站,那是注定要失败的。因为,生活用品中很多东西都是低值低利润的。 不过,同样是在1999年,在杭州市西湖区文一西路176号湖畔花园,马云与其他来自不同背景的伙伴共18人创立了阿里巴巴。 那一年还诞生了电子商务网站8848、在线旅游服务平台携程网以及即时通讯软件OICQ(腾讯QQ的前身)。 五源资本合伙人孟醒当时还在读高一,他对“72小时网络生存测试”印象深刻。 五源资本合伙人孟醒,图片来源:五源资本 “这场活动影响了很多看着互联网成长起来的人,我也是其中之一。我在想如今的AI是不是又在经历这么一个过程,对我们生活是不是又有一次比较大的改变?”孟醒说,“从投资角度我们看了很多AI项目,但说实话,AI对普通人到底有什么影响?” 五源资本有句口号是“别人眼中疯狂的你,开始被相信”,孟醒希望在AI时代也做一场这样的“生存测试”。 “生存测试”最大的特点是在要资源紧缺的情况下达成目标,孟醒认为,资源紧缺的时候正是创业者发光的时候,“我们要找的就是在这种极限情况下能survive(生存)的人。” 当年志愿者和现在的玩家都面临了各种各样的任务和突发情况,这其实对他们是一种“压力测试”,也是对他们创业心态的考验。“能在创业过程中保持自己的节奏,有个长期干的准备,不受外界的影响,这是一个非常好的创业素质。”孟醒说。 另外一个不容忽视的是开源、互助精神,尽管空间是封闭的,又存在诸多限制,但是大家的技术分享和交流并没有被隔绝。“生存测试”下的隐喻,在如今有着极强的现实意义。 “72小时AI生存挑战”海报,图片来源:五源资本 26年前主办“72小时网络生存测试”的梦想家中文网早已消散在互联网的烟海中,如今打开当年的网址,赫然映入眼帘的是一行大字“该域名正在一口价99990元出售中”。 梦想家中文网没有了,但任何时代都不缺少梦想家。 4.梦想花开 区瀚楠、陈睿轩都是梦想家。 他们第一次见面聊的就是创业梦想。那时他们都还没有入学,在新生群里得知都在一个城市,于是就约着吃了个饭。那天晚上,他们不约而同地提到了创业,如同周瑜与诸葛亮在赤壁之战前,掌心中同时亮出的“火”字。 那天晚上,他们吃着牛骨髓,一直聊到了餐馆打烊。等到他们入学后到班上想拉更多的创业伙伴时才发现,大家对大一就创业兴趣不大,只有他们俩对创业有着十足的热情。 陈睿轩总是喜欢用缓慢的语速开玩笑:“我数学不好,是数学系里看着‘神仙’在天上飞的那个‘凡人’,热衷于干各种有意思的事情。” 而他们的创业方向也与“神仙”和“凡人”相关。 “‘神仙’可能是先天决定,需要天赋。但是,在我认识的人里面,绝大部分人都没有摸到自己天赋上限,觉得有些事情做不到就摆烂了,其实很多人是没有找到足够正确的学习方法。”陈睿轩说。 他们目前在做的是一款AI英语学习产品——FrontierX,未来他们计划打造一个AI综合学习平台。 区瀚楠的想法是,先从托福、雅思的学习场景切入,瞄准细分用户人群,用AI提高学习效率。他举了一个案例:“应用会先给用户30~50个单词去记忆,背完单词后,AI会基于这些单词生成一篇符合托福、雅思试题风格的文章和习题,这样用户就可以在文章中再次应用这些单词,记忆也会更加深刻。AI会根据用户的习惯和能力,生成并推给用户听说读写各种试题和学习资料,引导学生思考并练习。” 这样的设计可以打破传统的靠单词卡片模块来记忆的方式,难度也会根据用户实际情况由AI判断进行自适应。在他们的产品规划里,FrontierX包括了阅读、听力、写作、口语等部分。 虽然产品还很初期,但他们还是怀着一颗赤子之心在追寻梦想。而这次参加了“72小时AI生存挑战”后,他们对如何用更少的资源做更好地产品有了更深的理解。 “在这次活动中,我发现作为一个产品,它的技术是否先进其实不是最重要的,更重要的是产品的用户交互体验。现在很多AI产品的交互方式太蠢了,我要做一个完全不一样的AI产品交互方式。”陈睿轩说。 全球知名免费在线学习平台可汗学院(Khan Academy)创始人萨尔曼·可汗(Salman Khan)曾告诉「甲子光年」,真正优秀的教师不会直接给出答案,而是引导学生自己思考,这是苏格拉底式的提问方法——通过提问迫使学习者思考,从而实现更深层次的学习。 ”当然也许人类早在苏格拉底本人出现之前就这样做了。AI可以在这方面发挥作用,它不仅能够回答问题,还能激发学生的好奇心和自我探索的能力。”可汗说。 可汗认为,在AI领域,竞争非常激烈,谷歌、OpenAI、微软、Meta等公司每年投入数百亿美元改进技术,实际上为行业提供了巨额补贴。但他同时提醒:“如果你的产品只是这些大模型之上的薄薄一层,无论是营利还是非营利,你都可能会有麻烦。但深入特定垂直领域,让AI发挥出色的效用,那么你可能会发现有趣的机会。” 可汗的这些话对区瀚楠、陈睿轩来说,也是非常有价值的参考。 而在陪伴他们72小时的《飞鸟集》里,有一首诗是对所有梦想家的祝福: Wayside grass, love the star, then your dreams will come out in flowers. 路边的小草呀,爱星星吧, 就会梦想花开。
摩根士丹利:中国在人形机器人领域领先美国,主要得益于稀土资源优势
(图片来源:摄图网) 近日,投资银行摩根士丹利发布的一份报告引发全球关注,报告明确指出中国正在机器人竞赛中占据优势,领先于美国。而中国在机器人研发与制造领域的快速进展,主要得益于“稀土资源优势、政策激励以及教育体系支撑”。 稀土在人形机器人的生产中扮演着不可或缺的角色,其高性能特性为人形机器人的关节驱动、伺服控制、精密运动、制动系统以及环境感知等关键功能提供了重要支持。以人形机器人的关节驱动为例,它依赖大量高性能伺服电机,而这些电机要实现高效率、高扭矩密度和高功率密度,离不开稀土永磁材料。 中国作为全球稀土储量及产量第一大国,过去一直是全球重要的稀土出口国。反观美国,作为全球稀土消费大国,但本土稀土产量相对较少,约80-85%的稀土依赖进口,其中约70%来自中国。 摩根士丹利指出,由于新建稀土加工厂的建设周期可能长达20年,中国完全有能力借助稀土的战略优势“调控西方制造业的产能节奏”,进而在机器人产业制造端获得“压倒性优势”。 摩根士丹利还指出,除了稀土资源,中国本土制造工艺的提升也是推动机器人产业发展的重要因素。这种提升得益于外资企业技术转移与中国本土技术创新的结合。在政府鼓励下,中国企业形成了高度活跃的机器人研发环境,各企业之间竞争激烈,新创意不断涌现,旧技术被迅速取代。这种“竞争”态势正是中国机器人研发节奏不断加快的重要驱动力之一。 从产业链布局来看,中国已逐渐形成了较为完整的机器人生态系统。早在今年二月,摩根士丹利发布的全球人形机器人产业链百强报告就详尽地梳理了全球人形机器人产业链中的100家核心企业,报告显示中国在全球人形机器人产业链中的份额高达63%,主导全球供应链。特别是在人形机器人的“身体”环节,即机器人的物理构造部分,中国的集成商占比达到了45%。 以长三角地区为例,其人形机器人产业发展的最大特点在于工业机器人产业规模庞大,为人形机器人产业的发展奠定了坚实基础。长三角是我国工业机器人产业发展最为完备的区域之一,产能规模大,产业链条完整,产业投资集聚度高,发展人形机器人产业可谓正当其时。 根据中国人形机器人产业大会披露的信息,2024年中国人形机器人市场规模约27.6亿元。对于整个人形机器人市场未来的发展,工信部2023年11月发布的《人形机器人创新发展指导意见》中明确,到2027年,产业加速实现规模化发展,应用场景更加丰富,相关产品深度融入实体经济,成为重要的经济增长新引擎。未来,中国人形机器人市场增长潜力巨大。 马斯克认为人形机器人将解锁 “近乎无限” 的服务,能生产任何产品、提供任何服务,通过提供 “近乎无限的产品和服务” 来释放全球经济的潜力,未来可能会使钱的价值变得模糊,甚至没有太大价值,还能创造一种 “普遍高收入的情况”。他预言未来人形机器人与人类的比例将达到3:1甚至5:1,总数将高达200至300亿,有望成为工业主力,数量可能超越人类,预计达到100亿台至200亿台。
OpenAI Codex人工智能编程工具推出新功能:可一次生成多个方案
IT之家 6 月 16 日消息,OpenAI 宣布其 ChatGPT Codex 推出一项新功能,允许用户为单一任务生成多个解决方案,并从中选择最佳答案。 Codex 是 OpenAI 于今年 4 月推出的 AI 编程工具,能够帮助开发者编写代码并分配编程任务。 根据此次更新说明,ChatGPT Codex 现在能够同时为一个任务生成多个答案。意味着用户可以在不请求 OpenAI 提供其他方法的情况下,探索多种解决方案,并选择最适合的方案。 此外,OpenAI 还为 Codex 添加了一些键盘快捷键,并专门设置了一个页面供用户探索这些快捷键。例如,用户可以通过在 macOS 上按下 ⌘-/ 或在其他平台上按下 Ctrl+/ 来快速打开 Codex。 此次更新除了现有的“environment”(环境)、“prompt”(提示词)和“tab=archived”(标签 = 已归档)参数外,还添加了一个“branch”(分支)查询参数。 修复与改进: 在容器设置期间下载仓库时添加了加载指示器。 增加了取消任务的支持。 修复了导致任务在设置过程中失败的问题。 修复了在设置脚本更改被 Git 忽略的文件时,运行后续任务的问题。 改进了代理对网络访问限制的理解和反应方式。 提高了描述 Codex 正在进行操作的文本更新频率。 将专业版、团队版和企业版用户的设置脚本时长限制提高到 20 分钟。 优化了代码差异显示:用户可以通过选项点击代码差异头部来展开或折叠所有差异。 Codex 基于 codex-1 构建,这是基于现有 o3 模型的 ChatGPT 新版本,经过优化后更适合编程任务,从而提高准确性。Codex 可以从 GitHub 拉取代码库,并能够编写新代码、提出拉取请求,以及在独立的沙箱中运行每个任务。 目前,Codex 需要订阅 20 美元(IT之家注:现汇率约合 144 元人民币)的 Plus 服务才能使用。
大模型“六小虎”人事动荡!半年12位高管离职
作者 | 程茜 编辑 | 心缘 智东西6月16日报道,今年上半年,“大模型六小虎”中的智谱、MiniMax、零一万物、百川智能、阶跃星辰5家企业,共被曝13位AI高管变动,其中有12位出走、1位新入职,与国内上半年大厂的AI人才变动数量不相上下(国内大厂AI人才迁徙图谱:半年19位AI大牛变动!)。 其中,百川智能、零一万物、智谱涉及的高管变动较多,分别为3名、3名、5名。有多家独角兽离职的核心高管是商业化负责人,包括智谱首席运营官张帆,MiniMax商业化合伙人兼副总裁魏伟,以及此前离职的百川智能联合创始人、商业化负责人洪涛。 值得注意的是,这5家企业出走的高管中,已公开最新动向的可以分为两类:回归大厂、AI领域创业。零一万物联合创始人、技术副总裁戴宗宏,智谱首席运营官张帆的新创业项目还分别获得了“老东家”零一万物、智谱的投资。 除了今年新变动外,早在去年年底,DeepSeek和位列“大模型六小虎”的月之暗面就发生过高层人事变动。去年11月,月之暗面大模型产品负责人王冠、Noisee产品负责人明超平等三位出海产品负责人被曝离职创业;去年年底,小米被曝以千万年薪挖角DeepSeek-V2核心开发者之一罗福莉冲上热搜,但据红星新闻援引其亲属说法,罗福莉今年2月已入职新公司,未提及是否正式入职小米。 2025年上半年,国内大模型独角兽高管出走的有12位: 2025年上半年,新入职国内大模型独角兽的高管有1位: 一、智谱:商业化负责人离职,引入Midjourney前高管 智谱高管变动人数最多,共有4名高管出走,1名高管入职。 智谱首席战略官张阔和副总裁曲滕于今年1月离职,他们都曾在2024年负责智谱不同分拆业务的融资过程,目前新动向未知。其离职前夕,2024年底,智谱宣布完成新一轮30亿元融资,中关村科学城公司领投,腾讯投资、红杉中国、顺为资本、北京市人工智能产业投资基金等跟投。智谱曾回应称,两人离职不会影响智谱整体的融资情况。 ▲智谱副总裁曲滕(图源:COP28) 今年2月,智谱应用AI与合作副总裁李惠子离职,她于去年7月加入,负责战略规划和C端产品商业合作,不到半年时间就宣布离职,新动向尚未公开。加入智谱之前,她曾在美团担任投资总监,负责过智谱的项目投资。 智谱本月离职的一位高管为智谱首席运营官张帆,他曾负责智谱的商业化。离职后,张帆将在AI Agent领域创业,智谱官方称,张帆的创业项目是智谱MaaS平台生态的一部分,将帮助智谱模型完成“最后一公里”的转化,新项目已获得智谱投资支持。 ▲智谱首席运营官张帆(图源:腾讯研究院) 此外,今年1月,智谱还有一位Midjourney前高管加入,Midjourney前亚洲副总裁王玥婷将负责智谱多模态产品和市场。这可能意味着智谱将发力C端市场。去年,智谱还引入前微软亚洲研究院研究员、阿里达摩院资深技术专家、支付宝中国首席数据官胡云华,担任C端应用“智谱清言”的负责人。 ▲Midjourney前亚洲副总裁王玥婷(图源:清华大学美术学院) 二、MiniMax:商业负责人出走,官方称B端业务迎新发展阶段 今年2月,MiniMax商业化负责人之一离职。 MiniMax出走的高管是合伙人、公司副总裁、开放平台负责人魏伟,他在公司负责To B商业化,新动向未公开。对此MiniMax回应称,MiniMax国内B端业务迎来新的发展阶段,将由其他负责人带领团队持续提升技术能力。加入Minimax之前,魏伟曾担任腾讯云副总裁。 ▲MiniMax合伙人、公司副总裁、开放平台负责人魏伟(图源:联想) 据MiniMax官网所示,该公司在To C端拥有海螺AI、星野、Talkie等产品,To B端,其通过开放平台产品接入的企业客户和个人开发者已超5万个。 魏伟离职后,3月中旬,MiniMax官宣了面向C端的业务拆分,MiniMax旗下AI应用原“海螺AI”正式更名为“MiniMax”,国内版和国际版同步调整。6月,据虎嗅独家披露,MiniMax筹备了半年多的文本推理模型即将发布。 去年9月,MiniMax产品负责人张前川,因个人原因淡出公司事务,改任产品顾问。 三、零一万物:3位核心高管离职,联创离职创业获创新工场投资 这半年来,零一万物的离职高管达到3位,包括2位联合创始人和1位项目负责人。 零一万物的AI视频混剪项目负责人蓝雨川,于今年2月被曝离职,新项目SparkView为AI视频编辑工具。他在零一万物先后负责大模型API开放平台、PopAi和Mona产品增长、AI视频混剪项目。据了解,目前其新项目已经开启融资。 ▲零一万物AI视频混剪项目负责人蓝雨川(图源:零一万物) 今年5月,零一万物联合创始人谷雪梅离职,筹备创业。谷雪梅与李开复最早相识于谷歌,她是前谷歌中国女工程师,也是李开复组建大模型创业团队的核心人物。她曾在零一万物负责模型与训练和C端产品,曾主导推出出海AI办公应用PopAi、出海情感陪伴产品Mona。 ▲零一万物联合创始人谷雪梅(图源:菜鸟网络) 今年5月,零一万物联合创始人、技术副总裁戴宗宏也宣布离职,不过,零一万物官方回应称,戴宗宏在创新工场支持下再次创业。他曾在零一万物负责AI Infra团队,主要解决大批量并行训练时的系统瓶颈,在加入零一万物之前,他先后担任华为云AI CTO及技术创新部长、阿里达摩院AI Infra总监。 ▲零一万物联合创始人、技术副总裁戴宗宏(图源:稀土开发者大会) 谷雪梅、戴宗宏两位联创的离职或许与零一万物的战略调整有关,去年第四季度起,零一万物宣布要聚焦参数适中、推理速度更快、推理成本更低、更具商业落地前景的轻量化模型,放弃超大模型训练计划。 事实上,零一万物去年就开启了高管离职潮,联创和核心成员陆续离开。 2023年12月零一万物联合创始人、技术副总裁李先刚离职回归贝壳;2024年8月算法副总裁黄文灏加入字节跳动Seed团队;2024年PopAi产品负责人曹大鹏离职后加入字节跳动,担任即梦AI移动端负责人;2024年底联合创始人、首席架构师潘欣离职,加入闪极AI担任合伙人。 四、百川智能:数位搜狗系高管离职,被曝裁撤金融组 2023年4月,百川智能联手多位搜狗团队老将成立百川智能,成立1个月,就拿到来自腾讯、小米、金山、清华大学资产管理有限公司、好未来等十余家机构的联合豪华投资;一年发了十多款大模型。 然而如今百川智能的核心高管中,搜狗系除了百川智能创始人兼CEO王小川,只剩下联合创始人、总裁茹立云。 去年12月,百川智能联合创始人、商业化负责人洪涛,互联网业务负责人焦可已先后离职。目前,洪涛新动向未知,焦可已经投身AI语音方向创业。 ▲百川智能联合创始人、商业化负责人洪涛,互联网业务负责人焦可(图源:脉脉、基石资本) 今年3月,百川智能联合创始人、模型研发负责人陈炜鹏被曝正在走离职流程,目前已开始筹备AI Coding方向的创业项目。陈炜鹏在百川智能创立早期就加入公司,曾与王小川在搜狗共事,担任搜狗搜索研发总经理,负责通用搜索、垂直搜索和推荐系统的研发。 ▲百川智能创始人兼CEO王小川(左一),百川智能联合创始人、模型研发负责人陈炜鹏(右二)(图源:中国人民大学高瓴人工智能学院) 今年3月离职的另外2位高管分别是百川智能商业合作人兼金融事业群总裁邓江、百川智能医疗副总裁李施政。邓江已宣布加入北电数智担任行业副总裁,李施政的最新动向未知。 ▲百川智能商业合作人兼金融事业群总裁邓江(左),百川智能医疗副总裁李施政(右)(图源:北电数智、北京儿童医院) 百川智能不仅面临着数位核心高管离职,其自身业务也正在进行重大战略调整。 王小川在两周年全员信中提到,百川智能要主攻医疗方向,围绕百小应、AI儿科、AI全科、精准医疗四个方面发展应用和服务。据智能涌现报道,2月18日,百川智能To B业务团队的PE团队(提示词工程团队),调至统管算法团队的产研组,3月3日,其负责金融行业To B业务的B端组被裁撤,员工在当天签署离职协议。 五、阶跃星辰:多模态模型核心人物离职,被京东招揽 就在上周,阶跃星辰视频生成模型负责人段楠被曝离职,加入京东担任探索研究院视觉与多模态实验室负责人,聚焦视觉和多模态基础模型研发。段楠曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理。 ▲阶跃星辰视频生成模型负责人段楠(图源:全球机器学习技术大会) 阶跃星辰是目前国内大模型六小龙中唯一主攻多模态大模型的企业。2023年成立至今,其已经发布16款多模态大模型,覆盖语音、图像、视频、音乐等方向,段楠正式其多模态战略的核心人物之一。 此外,可以看出京东正在加大AI投入,已经有多位行业大牛陆续加入,包括百度搜索首席架构师辜斯缪、阿里巴巴合伙人兼蚂蚁集团前CTO胡喜、原商汤VP沈徽等。 结语:高管出走、业务调整,大模型独角兽断臂求生 2023年国内大模型创业热潮涌现,大批AI大牛选择入局创业并吸纳了巨额融资,诞生了诸多独角兽。 但从去年以来,这些创企的人事变动、业务调整颇为频繁:有的大额融资不断且IPO进程加速、有的选择放弃超大参数规模模型训练转攻轻量化模型部署、有的选择专注于医疗等某一领域发力……还有多家创企的早期成员、核心高管宣布离职创业或回归大厂,多个商业化负责人离职或许印证其整体业务正面临瓶颈。 可以看出,AI人才的流动潮仍在持续,有些高管的创业项目已经成为其“老东家”整体业务的一部分,独角兽自身减负的同时,其裁撤的业务线或者核心人才可以反哺其商业化进程。
人形机器人领域招聘需求同比增长409%,技术岗位占比超6成
凤凰网科技讯 6月16日,智联招聘发布《2025年机器人产业人才发展报告》,报告显示,2025年前5个月,国内机器人产业招聘职位数同比增长6%,求职人数同比增长32%,实现供需双增。其中人形机器人领域招聘职位数同比增长409%,求职人数同比增长396%。技术岗位占比超6成,产业发展仍在技术研发关键期。 数据显示,技术岗位占比最为突出。2025年前5个月,招聘职位数及求职人数在总体中占比分别为62%、71%,远超生产岗位和销售岗位,位居第一。这与我国机器人产业当前所处的发展阶段有关:当前仍处于技术研发与场景验证的关键期,尚未进入大规模批量生产阶段,因此对技术研发、系统调试及解决方案优化等环节的人才需求更为迫切。 在机器人产业求职者中,男性占比高达77%,女性占比23%,男女比例差距(54个百分点)较大,这与技术岗位占比高有关。 在机器人产业求职者中,男性占比高达77%,女性占比23%,男女比例差距(54个百分点)较大,这与技术岗位占比高有关。 从年龄结构看,机器人产业求职者呈现明显的年轻化特征。16-24岁、25-34岁、35-44岁、45-54岁、55岁及以上的占比分别为29%、43%、21%、6%、1%, 25-34岁人才是机器人产业的求职主力军。总体来看,机器人产业35岁以下求职者的占比达到72%。反映出年轻群体对机器人产业具有较高的参与热情,这种年轻化的人才结构既为产业注入持续创新动能,也为未来行业人才储备提供了保障。 学历分布上,机器人产业求职者高中及以下、大专、本科、硕士及以上的占比分别为5%、29%、56%、10%,其中本科及以上学历的求职者占比达到66%。机器人产业作为技术密集型新兴产业潜力较大,吸引高知人才不断奔赴。 机器人相关技术人才招聘需求top10的行业中,工业自动化以10%的占比位居榜首,其次是电气机械/器材制造、人工智能、仪器仪表制造、专用设备制造等行业,以制造相关行业为主,这主要有两方面的因素。 从产业转型层面看,当前制造业处于数字化转型时期,企业需要引入工业机器人及自动化设备,以实现生产自动化和智能化,这推动着企业对机器人领域人才的需求增长。 从技术层面剖析,机器人在硬件技术、结构设计等方面,与传统机械、汽车等产业的硬件研发存在诸多相通之处。这赋予了传统制造行业在发展机器人产业时的独特优势。以汽车制造领域为例,车辆工程中积累的精密加工、动力学仿真及自动化装配技术,可直接迁移至机器人本体的研发。技术上的强关联性,使得传统制造行业能够凭借在机械设计、加工制造、自动化控制等方面长期积累的技术经验,在发展机器人产业时更高效地复用现有技术储备。 从学历要求的分布来看,机器人产业技术岗位的学历要求呈现明显的高学历特征。要求高中及以下、大专、本科、硕博、不限的占比分别为3%、30%、51%、11%、4%。本科、硕博的占比较机器人产业总体分别高出12个、4个百分点。这也折射出行业正处于技术迭代加速期,对高学历人才的需求较高。 从细分职业看,技术岗位中,机器人算法工程师、机器人调试工程师、机械结构设计工程师、机器人仿真工程师、测试工程师、应用场景规划师等招聘涨势较好,呈现多元化发展趋势。其中,机器人算法工程师以48%的招聘职位数同比增速位居榜首;机器人调试工程师紧随其后,增速达45%,机械结构设计工程师、机器人仿真工程师招聘增速也超过20%,反映出当前机器人产业对技术岗位的迫切需求仍在增加。 在整体的机器人产业中,各类技术岗位呈现出多样化的发展趋势,为产业全面发展提供了有力支撑。然而,当我们聚焦人形机器人这一细分领域时,会发现其岗位分布具有一定的独特性。具体而言,人形机器人的岗位需求中,算法、机械结构类别的岗位占据了较大的比重,这是因为人形机器人需要具备较强的智能交互能力和复杂环境下的灵活运动能力,这些都离不开算法的支持和精确的机械结构设计。因此,在人形机器人的职位分析中,本报告将围绕机器人算法工程师、机械结构设计工程师两个重点职位来分析。 具体来看,2025年1-5月,人形机器人领域机器人算法工程师、机械结构设计工程师招聘职位数分别同比增长479%、239%,整体呈现“井喷式”增长,增速远大于整体机器人产业的相应职位。这反映出当前人形机器人领域的研发创新主要集中在核心技术的攻克上,机器人算法工程师能够开发和优化人形机器人的感知、决策和控制算法,提升人形机器人的理解和处理信息的能力;而机械机构设计工程师能够设计更轻量级、高效能的机械结构,以满足人形机器人的运动需求和负载能力。 从薪酬看,招聘增长领先细分职业中,机器人算法工程师平均招聘薪资居首,达25368元/月,拥有5年以上工作经验的机器人算法工程师,平均招聘薪资更是高达33665元/月。这反映出算法在机器人智能化进程中的核心价值:算法不仅是机器人感知、决策与控制的核心技术载体,更是决定产品性能边界的关键变量。例如宇树的Go2与H1,通过强化学习与高效规划算法提升了任务执行的效率与可靠性。导航与定位工程师以21066元/月的招聘月薪紧随其后,硬件开发工程师则以19169元/月位列第三。总体而言,技术岗位呈现出显著的技术导向性,薪资水平与技术难度紧密关联。 具体来看人形机器人领域的重点技术岗位薪酬,机器人算法工程师、机械结构设计工程师的平均招聘薪资分别为31512元/月、22264元/月,5年以上工作经验要求的机器人算法岗位招聘薪资更是达到38489元/月,薪资水平显著高于机器人产业整体的相应岗位。从技术层面来说,人形机器人需要具备人的感知、决策和运动能力,因此其算法和机械结构的复杂度要高于传统机器人,例如运动控制算法不仅需要实现机器人的平衡、行走等复杂动作,还要实现机器人与外部环境的交互。这些复杂的算法对岗位人才提出了较高的要求,也促使企业开出高薪来聘请人才。 机器人算法岗位是机器人产业的核心技术岗位,今年以来,其招聘需求增速及招聘平均薪酬均位列技术岗位第一,在机器人产业发展过程中发挥关键作用。进一步看机器人算法工程师的招聘区域分布,数据显示,机器人算法工程师的招聘需求前三分别是北京、深圳、上海。具体看这三个城市的岗位,北京、上海机器人算法工程师需求主要集中在IT互联网领域、深圳主要集中在汽车领域,京沪深凭借雄厚的经济基础、密集的高端研发资源及完善的产业链生态,在各自的重点产业开展机器人业务,带动了机器人算法工程师的需求。同时,南京近年来依托《促进机器人产业高质量发展行动计划(2024—2026年)》等精准的政策布局,推动机器人产业迅猛发展,在机器人算法工程师招聘城市排名中位列第四,仅次于上海。长沙、杭州等城市同样展现出强劲竞争力:长沙蓝思智能机器人、优龙机器人、中南智能长泰机器人等企业领跑同行;杭州的宇树科技、云深处科技则以具身智能技术千里扬名,在本次榜单中分别位列第5、6名。 通过对技术岗位求职者画像进行分析可知,该岗位求职者在性别、年龄、学历三个维度上较产业整体呈现更强烈的集中度。 性别分布中,技术岗位男性求职者占比达88%,较机器人产业总体77%的男性占比高出11个百分点。 年龄分布上,技术岗位求职者中,16-34岁青年人才占比高达82%,显著高于产业总体的72%。年轻群体在拥抱新技术、算法开发与软件迭代等领域具备明显优势,与技术岗位对创新活力和快速学习能力的需求高度契合,凸显了产业技术端对青年人才的聚集效应。 学历分布中,高中及以下、大专、本科、硕士及以上学历人才占比分别为2%、28%、59%、10%,本科及以上占比达69%,较机器人产业总体求职者高出3个百分点。这种差异源于技术岗位对复合型能力的特殊要求:以机器人算法工程师为例,其工作内容深度融合数学建模、深度学习框架应用及产业场景落地能力,因此对人才的系统化专业知识储备与前沿技术创新能力提出更高要求。 对技术岗位求职者上一份工作从事行业的分析中可以发现,除器材制造等传统制造业外,集成电路、工业自动化等高端技术产业,以及计算机软件、互联网等 IT 互联网行业的占比也较高。这一现象表明,随着技术的持续进步,机器人产业凭借自身发展优势,正吸引着多元化的人才流入。大量来自传统制造业、高端技术产业与互联网行业的人才,正加速向新兴产业转型,以探寻新的职业发展机遇与空间。 竞争指数[footnoteRef:0]表示一个岗位的竞争激烈程度,指数越高,岗位竞争越激烈。在机器人产业的技术岗位中,竞争指数较低的有导航与定位工程师、机器人算法工程师和仿真工程师,竞争指数分别为15.6、12.5和10.5。这类岗位的门槛相对其他技术岗位更高,对专业知识和高端技术能力要求严苛,也正因如此,高端技术人才较为稀缺,对人才的渴求度更高。测试/验证工程师、机械结构设计工程师、机器人调试工程师的竞争指数分别为50.2、40.3、39.0,这些职业的技术门槛相对较低,求职者投递简历量较大,竞争较为激烈。 对于有意投身机器人产业的人才而言,建议学习相关基础知识与专业技能,选择竞争指数较低的算法类等高端岗位,不仅能够有效避开激烈的求职竞争,更能契合机器人产业蓬勃发展对高端技术创新的需求,在推动产业创新发展的同时,实现个人职业价值的最大化。 智联招聘数据显示,机器人产业技术岗位的求职者专业背景呈现“强对口性+深融合度”双重特征,既印证了传统工科与新兴技术的底层关联,也为不同专业背景的人才提供了差异化职业选择空间。 从专业对口看,机械结构设计工程师职位中,机械设计制造及其自动化专业位列第一,充分体现了专业背景与职位需求的高度适配;从跨学科融合趋势看,计算机科学与技术、软件工程等专业展现出较强的岗位渗透力,测试/验证工程师、导航与定位工程师、机器人算法工程师等职位都有所涉及,在各个岗位投递人数占比中均位居前二。 这种“精专+交叉”的特征趋势要求工科专业学子既要深耕专业技术积累深度,也要借助跨学科优势拓展广度,关键是找到个人专业与产业升级发展需求的结合点,实现个人价值与产业变革的同频共振。 总体而言,机器人产业的快速增长正重塑人才市场格局,技术岗位作为产业发展核心驱动力,无论是从人才供给的年轻化、高学历特征,还是从招聘需求的高学历门槛、高薪策略,都凸显了技术创新在机器人产业发展中的关键地位。未来,随着产业技术的持续升级与跨学科融合趋势深化,机器人产业人才市场将进一步向专业化、高端化演进。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。