行业分类:
加载中...
头条分类:
加载中...
VC、大厂、国资争先下注具身智能:泡沫狂欢,还是人机共存的黎明前夜?
做2025年下半年和2026年上半年会是一个产业交卷的窗口期。 文丨李佳晅 编辑丨张睿 2025年,热钱持续涌向具身智能。 DeepSeek横空出世,宇树机器人登上春晚舞台,兼具软件层面大脑能力与硬件层面制造能力的具身智能被推向了资本及舆论关注的新高潮。 IT桔子数据显示,2025年1月至7月10日,国内的具身智能&人形机器人领域共发生141起投融资事件,其中有121起来自机器人整机厂,20起来自机器人零部件企业。要知道,2024年全年具身智能领域的投融资事件共77起,数量远低于2025年上半年。 “物理AI和机器人正在飞速发展,可能会成为规模最大的产业。”英伟达CEO黄仁勋在GTC2025年度技术大会上表示。 今年,“具身智能”首次被写入政府工作报告,全国多地已开始布局具身智能等人工智能技术产业发展,比如北京市将加快实现具身智能科技创新和产业创新深度融合,利用三年时间,力争突破百余项关键技术,推动万台具身机器人规模落地,培育千亿级产业集群;苏州市提出以具身智能技术为核心,覆盖工业、医疗、物流等15个垂直领域,加速技术融合与场景落地,至2027年,苏州市人工智能相关产业规模预计突破3000亿元,其中具身智能被列为重点发展方向;深圳市将构建具身智能基座及垂直领域大模型等。 在热闹的具身智能领域,什么样的企业拿到融资?谁在为具身智能出资?热潮背后,行业面临的技术早期性、产品成熟度不足困境,具身智能企业交卷窗口期何时到来? 大量资金涌入: 51起融资单笔过亿 截至7月10日,2025年以来具身智能领域单笔过亿的融资事件共有51起。 点击查看完整清晰大图 其中,银河通用于2025年6月获得融资11亿元,成为具身智能领域单笔最高融资金额。该轮融资由宁德时代及溥泉资本领投,国开科创、北京机器人产业基金、纪源资本(GGV)等机构跟投。银河通用曾在2024年6月和11月,分别宣布超7亿元的天使轮融资和5亿元战略轮融资,目前累计融资金额已超过23亿元。 银河通用成立于2023年5月,从项目估值来看,与宇树科技、智元机器人一起位居国内具身智能赛道的第一梯队。2024年6月,银河通用发布了首款具身大模型机器人Galbot G1,采用“双臂+折叠+轮式底盘”的躯体结构,侧重上肢操作能力。 银河通用Galbot G1 2025年3月,银河通用发布人形机器人智慧零售解决方案,由轮式双臂机器人Galbot全天候在50平米的无人店铺内执行5000种商品种类、6000个货道、10000多盒商品的盘点、补货、取送、打包等自动化全流程。6月,公司宣布与全球工业巨头博世集团旗下博原资本共同成立合资公司,共同探索具身智能机器人在工业制造场景的应用。 头部具身智能企业融资的节奏在加快。2025年以来,完成两轮融资的具身智能企业21家,完成三轮融资的企业有6家,分别是自变量机器人、千诀科技、玄源科技、零次方、鹿明机器人,开普勒机器人完成四轮融资,星海图则在短短半年内完成5轮融资。 在已披露的融资金额中,累计最高的是它石智航——分别于2025年3月、7月完成的1.2亿美元天使轮融资和1.22亿美元的天使+轮融资,合人民币累计约15.73亿元。天使轮投资方包括蓝驰创投、启明创投、联想创投、线性资本、恒旭资本、高瓴创投等;天使+轮由美团战投领投,钧山投资、碧鸿投资、国汽投资、临港科创投、赛富投资基金、建发新兴投资共同跟投。 它石智航成立于2025年2月,创始人兼CEO陈亦伦曾任清华大学智能产业研究院智能机器人方向首席科学家,华为自动驾驶CTO,大疆机器视觉总工程师;首席科学家丁文超是具身智能领域青年科学家、复旦大学机器人研究院研究员,曾从0到1主导华为智驾端到端决策网络,打造复旦大学首个人形机器人;董事长李震宇曾任百度智能驾驶事业群总裁。 紧随其后的是星海图,在2025年完成累计A系列融资约12.5亿元。投资方包括美团龙珠、美团战投、北京机器人基金、亦庄国投、IDG资本、BV百度风投、凯辉基金、今日资本、襄禾资本、中金保时捷基金、襄禾资本、米哈游、无锡创投集团等。 星海图成立于2023年9月,产品包括通用仿人形机器人R1 Pro、轮式双臂移动平台R1 lite,构建了全链路具身智能开发平台EDP,2024年底以来,星海图轮式双臂机器人本体已交付至国内外百余家顶尖开发者客户,同构型本体出货量与开发者数量跃升至行业第一。 VC、国资、大厂争投 热钱来自何方? 当前具身智能领域在一级市场火爆的背后,热钱来自哪里? 通过梳理,亿邦动力发现当前在具身智能领域的投资方可以分成三大阵营:第一类是VC,注重具身智能企业的团队组成、技术突破以及商业化场景;第二类是互联网大厂、车企甚至电池巨头等产业玩家,能够为机器人在实训阶段提供工厂、仓储等应用场景“实习”;第三类则国家队和地方产业基金,为企业提供政策加持和产业链条资源,推动具身智能在工业制造、智慧物流等国家战略场景里落地。 VC疯狂抢位,仍难敌产业资本的现实吸引力 尽管年初金沙江创投合伙人朱啸虎唱衰人形机器人,但是主流人民币基金和美元基金都不愿意错过具身智能领域出手机会。 蓝驰创投管理合伙人陈维广认为,具身智能机会非常大,与其说逐一去分辨不同团队的技术组合,团队更大的判断是要重投入具身赛道。这背后的底层逻辑在于:中国发展具身智能在全球占优,尤其在供应链、工程效率上远优于美欧,就像当年押中智能驾驶一样,蓝驰创投相信这里能跑出下一代的全球性公司。 “当下,VC投科技已经成为行业共识。”华映资本创始管理合伙人季薇表示。华映资本今天已投资自变量机器人、魔法原子、星动纪元、云深处科技等多家处在不同发展阶段的具身智能企业。 然而在当下,VC却并不是头部机器人企业最青睐的投资方。季薇认为,企业更倾向于产投或大国资。前者能帮助机器人企业订单落地,后者可帮助企业资本化以及获取政府资源、行业资源。陈维广也表示:“如果入局晚了,就只能跟大厂拼资源了。” 美团半年出手4次,大厂密集参投独角兽 无论是美团、阿里、腾讯等互联网大厂,还是吉利、宁德时代、欣旺达等新能源车厂、电池厂,都已频频出现在具身智能投资方行列,而大厂投资既有财务投资,也有战略投资。 其中,美团对具身智能的投资最为激进,短短半年内投资4家企业。2025年6月,美团作为自变量机器人A轮融资的独家投资方,注入数亿元资金;2025年以来,美团还跟投了它石智航天使+轮融资,美团龙珠跟投星海图A+轮融资,妙动科技的天使轮融资。 腾讯则分别在2025年3月和6月入股智元机器人、宇树科技两家独角兽企业;加注宇树科技的还有阿里巴巴和蚂蚁集团,除宇树科技外,阿里巴巴还入股机器人企业源络科技,蚂蚁集团则投资灵巧手企业灵心巧手、钛虎机器人、星尘智能和星海图。百度风投则持续跟投星海图2025年的5轮融资。 新能源大厂方面,宁德时代入股银河通用,欣旺达成为阿米奥机器人天使轮独家投资方,吉利控股成为宇树科技C+轮投资方。 国资高频出手,押注具身智能产业卡位 国资及地方基金更为活跃:2025年以来,国投创合投资灵宝、星海图、智平方、智元机器人等企业;北京国管参与银河通用、小雨智造、星海图、宇树科技、云深处科技、自变量机器人等企业融资;上海国资多次加注智元机器人、傅利叶智能、开普勒等机器人企业;灵宝CASBOT获河南资产基金投资;跨维智能获四川发展产业引导基金、成都科创投资金等。据不完全统计,在2025年已经发生的141起融资事件中,国资及地方基金参与的超30起。 投资热潮背后: 具身智能下个赛点何时到来? 2025年至今,具身智能领域发生的天使轮、种子轮55起,A系列融资61起,占总融资数量的76%,B轮之后只有不到10%。由此可见,具身智能整个市场还处在典型的早期淘金热阶段,投资方用广撒网的方式疯狂下注,赛道处于技术爆发与生态构建期,市场活跃度极高。 大部分企业尚未到达需要验证商业模式和营收能力的B轮、C轮,真正能批量出货、跑通商业闭环的公司寥寥无几。但是也有头部企业在工业制造、商业服务、文旅展示等方面率先作出了商业化尝试。(点击《从实验室到工厂车间:具身智能卡位战,五大场景如何引爆1540亿市场?》查看更多详细内容) 《华兴一级市场温度指数报告-2025年Q2篇》显示,当下具身智能公司停留在demo阶段的公司普遍较多,且大多数公司在工业、商业等场景下的落地方案比较趋同、差异化不足,未来投资人会更加关注具身模型对真实任务的解决能力,以及其带来的高质量的商业化收入,投资人还会关注这些公司的技术领先性以及模型的持续迭代能力,以及如何解决数据获取的成本问题 此外,上半年具身智能赛道交易活跃度居首,但投资热情已经开始放缓。赛道各个技术路线目前仍处于高度非共识的状态,且分化对立的趋势愈加明显;具身公司是否获得了相对充足的资金储备会接下来的重要门槛,也就是说一批项目需要拿到更多的钱来渡过接下来可能变冷的行业周期。 具身智能涉及机器人运动控制、环境感知等硬核技术突破,大多数企业还处于在实验室调试机械臂灵敏度,或者在小范围场景里跑Demo的阶段。因此朱啸虎的话才引起诸多共鸣:“他们说的都是自己想象出来的客户,谁会花十几万买一个机器人去干这些活?” 蓝驰创投管理合伙人朱天宇表示,具身智能下一个赛点就是找到有客户买单、且愿意持续买单的场景。 人形机器人领域的第一大单于7月11日产生。中国移动采购与招标网显示,智元机器人和宇树科技分别中标中移(杭州)信息技术有限公司人形双足机器人代工服务采购项目。本次采购的项目总预算为1.2405亿元(含税)。智元机器人中标全尺寸人形双足机器人,预算为7800万元(含税);宇树科技中标小尺寸人形双足机器人、算力背包、五指灵巧手,预算为4605万元(含税)。 此外,智元机器人还于3月发布小尺寸人形机器人灵犀X2,可用于文娱表演、展厅讲解和科研教育场景。目前,灵犀X2已在中国移动展厅担任讲解员,未来还将入驻银行、汽车4s店、公园、学校,今年公司计划产量灵犀X2达数千台。 智元灵犀X2 7月8日,科创板上市公司上纬新材公告,智元机器人将收购公司约67%股份,控股股东变更为智元恒岳,智元CEO邓泰华将成为上纬新材实际控制人。虽然智元方面不断强调本次收购不是借壳上市,但获得一家科创板上市公司的实际控制权已是既定事实。 另一边,宇树科技创始人王兴兴在6月的夏季达沃斯论坛上透露,宇树科技年度营收已超10亿元人民币。在此之前,宇树科技发布通知,因公司发展需要,杭州宇树科技有限公司即日起名称变更为杭州宇树科技股份有限公司,外界纷纷猜测宇树科技正在为IPO上市铺路。 宇树科技Unitree G1 蓝驰创投合伙人曹巍认为,2025年下半年和2026年上半年会是一个产业交卷的窗口期。头部团队开始陆续提交阶段性成果,整个领域的发展走向将更加清晰。若头部团队能够交出优秀的市场答卷,这个市场还有可能继续火热;反之,如果大家发现2026年上半年答卷与预期相差甚远,例如机器人技术进步有限、无法实现产品应用场景落地,那么资本市场热度可能会有一定的回调。同时,具身智能公司很可能出现发展分化,有落地成绩的团队将获得更多关注和资源,脱颖而出。就如同新能源汽车早期发展阶段那样,尽管参与者众多,但是只有少数生存下来。
娃哈哈150亿遗产之争,我用秘塔版深度研究扒清了
作者 | 江宇 编辑 | 漠影 智东西AI前瞻7月15日报道,秘塔AI搜索“深度研究”,今日正式上线。 作为对“浅度研究”的迭代升级,深度研究上线后,新增“问题链”可视化方案,支持用户更清晰追踪模型的检索和分析过程,整体体验相比此前更加深入和可视化。 用户可通过metaso.cn或秘塔AI搜索App直接体验,选择“深度研究”,输入问题即可使用。 目前该功能按搜索积分使用,普通用户每天可免费使用3至5次,付费用户每日额度更高。 一、从“浅度”走向“深度”:更长链、更可视化、更少黑箱 1、产品功能:链路可视化、报告结构化和信源可控 秘塔AI“深度研究”模块,基于对复杂问题的分步拆解逻辑,支持从一个具体切口出发,自动完成广域信息检索和深度分析。 不同于传统AI搜索“一问一答”的模式,秘塔AI“深度研究”通过拆解任务,将大问题分解为一系列动态子任务,最终生成结构化、条理清晰的研究报告。 在具体功能上,“深度研究”包括三大亮点: “问题链”可视化: 每次深度研究均可追踪AI的拆解路径,信源、推理链路、各阶段结论均可清晰查看,提升结果的可验证性和可解释性。 互动式报告:支持完整报告与互动式报告双模式切换。 信源偏好设置:可自定义优先站点或屏蔽特定来源,进一步提升研究质量。 2、技术方案:分段强化学习,中文场景更适配 秘塔AI“深度研究”升级的核心是引入子任务拆解与分段强化学习(RL)方案,通过逐层任务推理,在算力资源有限的条件下有效提升了复杂问题的准确率。 此外,据官方透露,秘塔AI搜索“深度研究”在中文搜索场景下相较通义WebSailor Agent表现更优。 在BrowseComp(中英文)和xbench-DeepSearch两项评测中,秘塔AI“深度研究”均位列榜首,整体成绩高于DeepSeek-R1、QwQ-32B和GPT-4.1等主流模型。 ▲(来源:秘塔AI搜索官方) 二、体验:从“遗产大战”切入,秘塔AI如何梳理家族纷争? 本次体验,智东西以近期热议的“娃哈哈150亿遗产之争”为例,提出了一个实际问题,并让AI做出预测: 请梳理娃哈哈150亿遗产大战的来龙去脉,分析事件起因、诉讼焦点、信托资产争议和家族关系冲突,结合中国内地和香港的继承法律、信托法律,以及娃哈哈家族治理背景,归纳该事件对公司经营的潜在影响,并根据现有信息合理推测,这场遗产之争最终谁的胜算更大,为什么。 秘塔AI“深度研究”给出了完整路径——不仅复盘了事件起因和核心矛盾,还追踪到诉讼焦点、信托法律,用“问题链”梳理出一份逻辑闭环,给出“胜算预测和法律推演”。页面左侧实时显示token消耗与信源数量,底部是滚动任务进度条,主屏幕则是可动态展开、点开即查的“问题链”: 每个节点都配有信源出处,点击即跳转 缺失信息直接标红 研究报告可一键切换“全文报告”与“互动可视化” ▲(耗时8.8分钟,共耗费24万Tokens) 报告正文如下: 在“娃哈哈遗产之争”这个案例里,智东西体验发现,秘塔从最初追溯官方来源,到后续拆解遗产结构、梳理企业经营波动,每一条推理链路都有清晰的可视化展示。 用户在查证细节时,也不需要反复跳转搜索,可以顺着链路逐层点击,就能直接查看对应信源和结论。 互动研究报告如下: 跑完深度研究后,秘塔还可以自动生成互动网页,把核心信息按传播路径、关键节点、数据表格等分类整理,方便快速查阅。 类似热点话题,秘塔用一次深度研究基本能把整体脉络梳理清楚,用户用于整理素材或者直接截屏分享都比较省事。 整体页面布局也比较清晰,查完资料甚至直接拿去做汇报PPT,基础框架也能直接用上。 为了进一步了解效果,智东西也对比体验了Google Gemini的Deep Research功能,重点观察了两者在文本输出的长度、内容的覆盖深度和信源的丰富程度上的差异。 实际对比下来,Google Gemini的Deep Research在文本量、内容深度和广度上整体表现更优。无论是单次报告的字数,还是对多角度、多背景资料的覆盖,Gemini都明显更“堆料”,适合需要尽可能全面掌握背景信息的用户。 相比之下,秘塔AI“深度研究”的单次文本输出上限约为1万字,其篇幅更克制,在路径拆解、可视化链路、互动报告上的设计更偏向“查重点、看脉络”。 结语:不卷风口,要卷的是“真正被需要的产品” 当外界从“AI搜索”卷向“Agent大爆发”,秘塔AI将更多精力放在搜索体验本身,整体呈现出更扎实的完成度。 从产品成熟度来看,秘塔“深度研究”在可视化链路和交互体验上有明显优势,但在文本体量和信息覆盖广度上,仍存在一定差距。 从实际体验来看,当用户想查清一件事、梳理一套脉络时,“深度研究”类产品可以省去不少反复搜索和零散整理的时间。遇到复杂问题时,先跑一轮深度研究,而不是直接用传统搜索找答案,往往是更高效、更省力的方式。 下次刷到类似遗产争议、企业风波等复杂事件时,你可能也会想用‘深度研究’快速梳理清楚来龙去脉。
700元 我买了台毫米波显示器,这体验太欢乐了
线,线,线。 不管是理论上的,还是现实中的,我们每个人的人生,似乎都离不开“线”。 在安部公房的作品《绳》中,他曾表示,“绳索和棍棒是人类最早发明的工具。绳索可以留住美好,棍棒则可以驱赶危险。两者皆是我们最早的朋友,皆由我们创造。有人的地方,就有绳索与棍棒。” 这里的绳索,其实就是一种“线”。 而到了现实中,我们更是和“线”形影不离,从用于蔽体的衣服,到连接起全球的互联网,设备与电力的连接、设备与设备的连接,几乎可以说整个人类社会,本质上就是用“线”联系在一起的。 可是“线”一多,就会显得杂乱无章。 有的时候,看着那杂乱无章的桌面和四处散落的线缆,我的内心里真的会涌出一丝“干脆所有线缆都从世界上消失”的想法。 Wait a minute…… 动了这方面的心思之后,我去仔细查了一下,你别说,有这种想法的人可绝对不止我一个,目前市面上主打无线投屏的设备可真不少,除了传统Wi-Fi串流,各种新技术产品也是层出不穷。 (图源:Peakdo) 为此,我在二手平台上斥资近700元,拿下了初代的PeakDo无线HDMI便携屏,这款产品最大的特点在于毫米波无线传输,号称动态延迟可以低至0~2帧(32毫秒内),远超传统Wi-Fi串流方案。 那么现在,是时候品鉴一下真正的无“线”生活了? 从有线,到无线 不过呢,在开始之前,我们不妨来回顾一下那些年概念很美好,但用起来总差口气的“便携屏”。 在我印象里,最早接触到的能算得上“便携屏”雏形的,可能还是那些需要拖着根线,吃着笔记本USB口供电的便携显示器。 作为笔记本的“第二块屏幕”,它们最大的价值在于解决了“有无”问题,只需HDMI加USB供电/一根USB Type-C线就能点亮,让用户在移动办公时也能享受双屏带来的效率提升。 (图源:京东) 放在当时,能在咖啡馆掏出双屏工作的场景,对我这种数码爱好者来说,还是挺有吸引力的。 可惜“有线”这个原罪,始终是它们无法回避的痛点。 而且早期的产品,屏幕参数、色彩表现、亮度以及响应速度也往往不尽如人意,更别提触控这种“奢望”了。 用户对于摆脱线缆束缚的需求日益迫切,也刺激了一批厂商向着“无线化”探索。 在此基础上,第一批基于DLNA、Miracast无线显示标准协议的产品开始涌现。 就拿我曾经入手过的雕塑家4K OLED便携式显示器作为例子,这类产品一般都会采用相对高端的屏幕配置,那价格自然不会低廉,基于无线显示标准协议的多屏显示功能,往往只会成为高端化的一个卖点。 (图源:京东) 这些协议的出现,理论上使得手机、平板、笔记本的画面可以无线传输到便携屏上。但实际体验嘛,延迟高、连接不稳定、画质压缩严重是家常便饭,谁用谁知道,尤其对于动态画面或者游戏场景,几乎是不可用的状态。 想要打破这些问题,就必须打破无线显示标准协议的限制。 于是乎,主打毫米波(mmWave)低延迟技术/Wi-Fi 6/6E直连技术的一批无线便携屏就这样诞生了。 毫米波,“零延迟”? 接下来,该看看我手上这款Peakdo便携屏了。 初看这款PeakDo便携屏,扑面而来的便是一股小作坊手搓的廉价感。 整机采用了哑光黑的金属外壳,摸上去有一种微妙的廉价感,漆面本身不够工整之余,切口看起来也有一种纯手工打造的粗糙感,做工看着和正经量产的产品根本不是一条水平线的。 (图源:雷科技) 物理按键基本集中在机身顶部,从左到右依次为电源、菜单、音量增、音量减,最后是3.5mm耳机接口。 (图源:雷科技) 值得注意的是,机身侧边设计了两道滑轨,这个滑轨设计是参考初代Switch制作的,因此可以兼容大多数采用Joycon制式的手柄,PeakDo这款产品本身主打的也是和手柄联动的无线游戏体验。 (图源:雷科技) 翻到机身正面,映入眼帘的便是一块黑边超大的屏幕,事实上PeakDo的黑边比Switch OLED的黑边还要夸张不少,屏幕本身参数也不亮眼,1080P分辨率+60Hz刷新率,标称亮度达到500nits,实测74%NTSC色域。 (图源:雷科技) 嗯...只能说比廉价笔记本稍强一些。 观感上倒还好,毕竟大部分人也辨认不出更多的色彩细节,除了整体画面效果会显得颜色更深一些,偶尔暗部丢失细节之外,看图片、看视频甚至打游戏都没有什么大问题。 作为一款无线显示设备,PeakDo除了接收端,还有发射端。 (图源:雷科技) 发射端本身有点像U盘,把它插进设备的HDMI接口并供电,然后再把发射口和接收口中间的杂物尽量清理一下,我们就可以开始这款产品的体验测试了。 个人认为,对于无线显示设备来说,最重要的因素在于3点—— 串流范围、串流延迟、稳定性。 先来说说串流范围,我租住的出租屋是大单间,有一个隔出来的独立厨房和卫浴,大致就像下图这样,但是电脑和电视间有一个硕大的柜子隔断,直线距离大概在4-5m左右。 (图源:雷科技@豆包AI) 当我在把发射端接在PS5上,坐在电脑桌这边的时候,串流效果是很稳定的。 把直线距离加大一点,从门口到电脑桌,约摸着7-8m的范围,基本上也不会出现断联的现象。 但是只要离开这个大单间,哪怕只是踏进厨房一步,这个串流立刻就断了。 出现这种情况的原因很简单,毫米波本质上是波长为1~10mm的电磁波,优点就是波束更窄、速度更快,缺点就是信号穿透性差,发射器和屏幕之间最好不要有太多遮挡物,甚至人体遮挡都可能导致信号劣化或中断。有效传输距离也比较有限,稍微远一点或者角度刁钻一点,就可能出现卡顿或黑屏。 (图源:X) 只能说,相较于传统WiFi无线显示,毫米波在串流范围上确实不是强项。 当然,对于远程游玩来说,串流画面的延迟可能是更重要的一环。 在家居环境中,我没有刻意清理柜子等杂物,在近距离直接连接上PeakDo,最终测得显示延迟在60ms左右。 (图源:雷科技) 接下来,切换到PS5上,基于《GT赛车7》里计时赛的UI显示,可以看到PeakDo的串流延迟是60ms左右。 作为对比,在家庭网络环境中,实测PlayStation Portal的串流延迟在80ms左右。 (图源:雷科技) 事实上,当两款设备处在同一个环境中,传统Wi-Fi串流和毫米波串流之间的延迟差距远没有想象中那么大,考虑到PeakDo在连接手柄时还会增加一些延迟,可以说二者表现是在伯仲之间的。 除了《GT赛车7》,我又陆续测试了《宇宙机器人无线控制器使用指南》《怪物猎人》《审判之逝:湮灭的记忆》等各式各样的游戏作品,哪怕要进行「完美闪避」或「弹反」这样的精细操作也完全没问题,基本都可以无压力畅玩。 对延迟要求更高的音游,现在也都基本标配了矫正模式,实测用PeakDo游玩《节奏医生》的体验就蛮好的。 可以说,在单间室内环境下,基于500M的电信内网传输速度,两者的操作延迟几乎都是意识不到的,PeakDo并没有显著的提升。 那么问题来了,毫米波串流的优势到底表现在哪里? 答案是稳定性。 在成功连上之后,PeakDo只要能够放定在那里,就基本不会产生任何波动,画面稳定性和有线连接基本没有差别,你完全可以把它看成一块常规的便携屏——只是不需要接线而已。 实际游玩一个半钟《对马岛之魂》,整个远程串流体验可谓无可挑剔,连一次画面波动/连接中断的情况都没有出现过。 (图源:雷科技) 作为对比,传统Wi-Fi串流在很大程度上会受到网络波动的干扰,虽然在状况良好的情况下,二者可能表现差不了太多,但只要网络出现波动,传统Wi-Fi串流就会自动降低码率以保证画面的流畅。 从1080P一路降到240P,只能息屏重新连接的事情,我也不是第一次遇到了。 不过,如果是拿在手上玩的话,其实毫米波也遭不住就是了。 还是按需购买吧 经过这番测试,我可以打包票地说—— 这毫米波无线显示设备啊,确实是有他们的使用场景的,只是正经人可能这辈子也碰不上几次就是了。 (图源:雷科技) 如果你的家里拥有多款硬件设备,又希望在不同的显示设备上游玩的话。 那么选择购入毫米波设备,可能会比购买一条超长的HDMI/DP线缆都要更加稳定,毕竟我自己也是亲自购入过5m以上的DP线的,也不是第一次体验到信号断流导致屏幕亮了灭、灭了亮的感觉了。 不过,我并不推荐你购入这款产品,因为初代PeakDo便携屏的屏幕素质确实是有些微妙了,如果你的家里拥有显示素质上佳的屏幕的话,个人认为他们出品的毫米波无线投屏器或许会更加值得购入。 当然,传统Wi-Fi串流其实也蛮好用的就是了。 诶呀,如果你对画面的稳定性没有太大需求,Steam Link/PS Remote Play其实就够用了。
谷歌砸170亿抢人,华人创企捡漏:Windsurf 72小时闪电解体
编译 | 王涵 编辑 | 漠影 智东西7月15日消息,今日凌晨,自主AI工程师工具Devin所属公司Cognition与AI代码生成初创公司Windsurf在海外社交媒体X上发布联合视频,共同宣布Cognition已签署最终协议收购Windsurf剩余团队。 而就在3天前,谷歌花了24亿美元(约合人民币172.2亿元)挖走Windsurf前首席执行官Varun Mohan、联合创始人Douglas Chen以及编码工具研发团队的部分成员。据谷歌发言人透露,该Windsurf团队将加入谷歌DeepMind部门,主要致力于Gemini项目,专注于智能体编程。 ▲Cognition与Windsurf在海外社交媒体X上发布联合视频(来源:X) 在Cognition与Windsurf的联合视频中,Cognition首席执行官Scott Wu和Windsurf代理首席执行官Jeff Wang透露,他们将首先将Cognition的自主AI工程师Devin整合到Windsurf IDE中。 这种组合产品可以让开发人员能够规划任务、将代码生成委托给智能体并审查拉取请求,所有这些都在单一界面内完成。 回溯整个Windsurf收购事件,从与OpenAI的30亿美元(约合人民币215.2亿元)收购谈判搁浅,到谷歌 “只取核心团队” 的争议性操作,再到如今被Cognition接手剩余业务的 “一鱼两吃” 结局。Windsurf这一连串波折,正是硅谷AI人才大战白热化的缩影。 一、谷歌挖走联创,Cognition“包圆”产品和用户 据外媒CNBC报道,除了挖走联合创始人之外,谷歌还将支付24亿美元(约合人民币172.2亿元)作为选择Windsurf技术的非独家许可。该交易不包括对Windsurf的任何股权投资,也不包括对该公司的全面收购。与此同时,Windsurf保留了授权其技术的能力,并将继续独立运营。 谷歌发言人回复CNBC称:“我们很高兴欢迎Windsurf团队的一些顶尖AI编码人才加入谷歌DeepMind。” 今日凌晨,Cognition与Windsurf,在海外社交媒体X上发布会联合视频宣布:Cognition已签署最终协议收购Windsurf剩余团队,收购金额尚未公开披露,具体的交易条款也尚未公布(两家公司均为未上市初创公司)。此次收购使Cognition能够获得Windsurf的核心产品、品牌和剩余团队。 在一篇题为“The Next Chapter”的Windsurf博客文章中,Jeff Wang直接承认了内部的动荡:“上周,我们失去了我们的创始人和研究团队。” 他赞扬了剩余员工在过渡期间的专业精神,并强调尽管经历了一些混乱,但许多优秀品质依然完好无损。 Jeff Wang在博客中写道,Windsurf的企业收入继续环比翻番,并且保持着数十万的每日活跃用户。Cognition强调,该交易包括Windsurf员工的全面财务参与,包括免除悬崖和加速归属。 ▲Windsurf博客文章(来源:Windsurf官网) Windsurf内部信翻译如下: 各位同事: 首先,我想承认Windsurf最近确实经历了一段动荡时期。上周,我们的创始人和研究团队相继离职。感谢大家在这段时间表现出的专业态度,我知道这并不容易。 尽管经历了这些波折,但让我们引以为豪的核心优势依然存在。我们的业务增长势头强劲,企业收入每季度翻倍,与合作伙伴和政府机构建立了优质渠道,并拥有数十万日活跃用户。 今天,我非常高兴地告诉大家,Windsurf将被Cognition收购。我们的顶尖团队将与这家创造了首个自主软件工程师Devin的标杆企业强强联合。我们的现有客户和强劲的业务线将得到更好的支持,并享受前所未有的产品创新。同时,Windsurf的独特知识产权也将融入Cognition,助力联合团队继续推动AI编程能力的边界。 在众多优质选择中(再次感谢大家的才华和努力让我们走到今天),Scott和他的团队是我们毫无疑问的最佳选择。就像我之前半开玩笑说过的那样,他们是唯一让我们感到压力的竞争对手。在整个AI领域,Cognition确实是我们最尊敬的团队,也是带领Windsurf进入下一阶段的完美伙伴。 作为领先的应用型AI公司,Cognition的旗舰产品Devin已在多家世界500强企业的生产级代码库中部署。他们的收入增长速度甚至超过了我们的高速发展,目前已通过Founders Fund等机构融资超过3亿美元(约合人民币21.5亿元),最新估值达到40亿美元(约合人民币287.0亿元),拥有稳健的财务状况和更强劲的客户资源。 这也是产品层面的完美结合:我们开创了智能IDE,而Cognition打造了市场领先的自主智能体。未来,工程师可以在Windsurf中规划任务(借助Devin对代码库的深度理解),将模块化工作分配给Devin团队,同时通过Tab、Cascade等功能在Windsurf中亲自处理最具挑战性的部分——最终在同一环境中无缝整合。这就是我们将共同创造的未来。 通过这次交易,两支世界级团队将在共同愿景下携手并进,并拥有强大的发展动能。“智能体+IDE”的组合将成为极具竞争力的解决方案。最重要的是,我们现在能够更好地服务快速增长的用户群体——无论是创意编程爱好者、独立开发者还是大型企业团队。 最后,我要向忠实的客户、Cognition的新同事,以及每一位才华横溢且忠于使命的团队成员表示衷心的感谢。 二、Cognition+Windsurf=智能体+IDE Cognition的协议如今为Windsurf的运营方向带来了亟需的清晰指引。在宣布此次交易的视频中,Scott Wu描述了两个平台将如何整合:“想象一下,在Windsurf中规划任务,组建Devins团队,并在舒适的IDE中审查PR。” Devin可以自主完成修复错误和部署应用程序等软件任务,现在将直接嵌入到Windsurf的IDE中。两家公司认为,这种设置将使开发人员能够将重复性工作并行卸载到多个智能体,同时仍然保持对关键架构决策的控制。 Cognition将此视为构建协作式人机代理系统的下一步,并称Windsurf的IDE提供了缺失的界面层,使代理工作流程能够大规模实用。两家公司对此十分有信心,认为用户将受益于更流畅、更紧密集成的开发体验。 Windsurf博客文章还扩展了产品级计划,确认Windsurf现有的功能(如Tab和Cascade,用于手动高杠杆编码)将继续集成在IDE中。 开发人员可以把工作分配给“一组Devin团队”,同时仍然可以自己完成或编辑复杂的部分。“所有工作都可以在同一环境中无缝衔接。”Jeff Wang写道。 合并后的Cognition-Windsurf实体将与GitHub Copilot、Replit、Cursor和其他AI原生IDE厂商直接竞争。谷歌的Gemini平台和微软带有“智能体模式”的Visual Studio Code也在迅速向该领域扩张。 三、和OpenAI“黄”了,跟Anthropic“和好” Jeff Wang在视频中还特别提到了Claude制作商Anthropic:“当然,我们再次与Anthropic成为朋友。” 为什么是“再次”? 外媒彭博社在5月份报道称,OpenAI已就收购Windsurf展开独家谈判,谈判金额高达30亿美元(约合人民币215.2亿元)。 然而在这期间,Windsurf的沟通渠道一度陷入沉寂,其产品变得不稳定,有多个合作伙伴退出,其中最具破坏性的打击来自Anthropic:Anthropic于6月初取消了Windsurf对其Claude 3系列型号的许可。 Windsurf在其博客上发表的声明中证实,Anthropic在不到一周的时间内切断了几乎所有Claude 3.5 Sonnet、Claude 3.7 Sonnet和相关型号的第一方API容量。为了应对这种情况,Windsurf不得不通过第三方推理提供商重新路由流量,并限制免费套餐用户的访问。该公司还推出了Gemini Pro的促销价,作为临时替代方案。 Anthropic联合创始人Jared Kaplan在TechCrunch Sessions: AI 2025上解释了这一决定,称该公司认为通过中间层向其最大的竞争对手OpenAI提供其模型的访问权限十分不合理。 ▲Anthropic联合创始人Jared Kaplan(来源:TechCrunch) 考虑到竞争压力,又考虑到Anthropic有限的计算能力,他认为“我们把Claude卖给OpenAI会很奇怪。”Kaplan补充说,Anthropic更倾向于专注于“持久的合作伙伴关系”,就像它与Cursor保持的那种关系一样。 Windsurf在声明中表达了失望,并强调其平台不仅仅是提供模型访问。“Windsurf的魅力从未仅限于模型”该公司写道,并强调了其用户体验(UX)功能、企业集成和代理工作流程。 四、“人才收购”成监管灰色地带,谷歌、微软、Meta争相效仿 谷歌的意外收购与2024年8月达成的一项协议如出一辙,该协议旨在从聊天机器人初创公司Character.AI聘用关键员工。 包括微软在内的大型科技公司,亚马逊和Meta等公司也采取了类似的所谓收购租赁交易,一些人批评这种交易是为了逃避监管审查。 微软于2024年3月与Inflection AI达成6.5亿美元(约合人民币46.6亿元)的协议,使用这家AI初创公司的模型并聘用其员工,而亚马逊于去年6月聘请了AI公司Adept的联合创始人及其部分团队成员。 今年6月,Meta收购了Scale AI 49%的股份,并挖走了其联合创始人兼CEO Alexandr Wang(汪滔),这是迄今为止对这种日益增长的商业合作形式的最大考验。 与那些让买方获得控股权的收购不同,这些交易无需接受美国反垄断监管机构的审查。然而,如果监管机构认为交易的结构是为了规避这些要求或损害竞争,他们可能会对交易进行调查。 其中许多交易现已成为监管调查的对象。 结语:巨头盯上初创潜力股,硅谷AI人才争夺愈演愈烈 从Meta收购Scale AI 49%的股份,并挖走了其联合创始人兼CEO Alexandr Wang(汪滔)开始,硅谷AI人才争夺战愈演愈烈。 可以看到,自身技术迭代难以支撑科技巨头抢占AI技术潮头的野心,他们开始瞄准初创公司里的“潜力股”,试图借并购、整合带来的“鲇鱼效应”,激活企业内部,甚至搅动整个市场的活力。 硅谷愈演愈烈的AI人才争夺战,仍在持续升温,短时间内看不到平息的迹象。
比想象更严重 索尼Xperia 1 VII问题扩及全球:多地区停止销售
快科技7月15日消息,索尼旗舰手机Xperia 1 VII自上市以来便被寄予厚望,不仅搭载了最先进的骁龙处理器和全新的影像系统,还肩负着整合索尼在影像、音效与游戏等领域的战略任务。 然而,这款备受期待的手机却陷入了严重的质量问题风波,自7月初开始有用户反馈称,Xperia 1 VII出现了无预警自动重启、进入重启循环,偶发性电源异常关机,甚至无法开机变“砖”的问题。 这些问题不仅无法通过系统更新解决,用户也无法自行修复,甚至连官方恢复工具Xperia Companion也无法成功解决。 7月初,索尼在日本停止了Xperia 1 VII的销售和发货,随后,该公司在中国台湾和香港也宣布了相同的举措。 几天后,索尼通知英国消费者,公司正在调查问题的原因以及受影响库存的范围,此外,索尼还在芬兰停止了该手机的销售,并从芬兰网站以及当地零售商和运营商的网站上移除了Xperia 1 VII及其他型号的列表。 据爆料,此次Xperia 1 VII的大规模异常事件可能与生产工厂的变更相关,如果情况属实,整体调整与恢复正常出货至少需待至秋季以后,这意味着Xperia 1 VII若想重返市场,最快也要等待三至四个月。 如果最终复产延迟过久或消费者信心无法恢复,索尼可能直接中止Xperia 1 VII的全球销售计划,选择由下一代机型取而代之,不光如此,还有消息称索尼可能会终止手机业务。
2000元手机质感不行?这四款手机质感媲美高端旗舰
【CNMO科技导购】过去两年,中端手机市场经历了一场“质感革命”。曾经受限于成本,厂商往往在2000-3000元价位段采用大塑料机身、廉价涂层或粗糙的仿金属设计,但如今,旗舰机的材质和工艺正快速下放,让中端机也能拥有媲美高端机的精致触感。 一加Ace 5至尊版 2022年以前,中端机普遍采用塑料背板+塑料中框的组合,虽然性价比突出,但握持时的廉价感明显。而到了2023年,玻璃背板几乎成为中端机的标配,比如REDMI Note 12 Pro+、一加Ace 2等机型均采用AG磨砂玻璃,触感细腻且不易沾染指纹。此外,越来越多的旗舰级背板工艺开始下放,如荣耀X50、realme 11 Pro+等机型背板采用素皮材质,提供了更接近旗舰机的柔软触感,同时提升了产品的视觉档次。 过去,金属中框是旗舰机的专属,但近两年,越来越多的中端机开始采用金属材质。金属中框不仅提升了结构强度,还让整机握持更显高级。相比过去的塑料中框,金属中框的光泽和冰凉触感让中端机在质感上真正向旗舰靠拢。 真我Neo7 Turbo 接下来,就由CNMO为大家推荐四款2000元左右质感优秀的手机,它们分别是:一加Ace 5至尊版、荣耀400、红米K80至尊版和真我Neo7 Turbo。 相比于如今各种各样大面积的镜头模组,一加Ace 5至尊版的影像模组也算是别具一格。而且,Ace 5至尊版的这种影像模组设计在日常使用中不会影响到手机的握持手感。 一加Ace 5至尊版 一加Ace 5至尊版机身设计相当用心,摄像头模组采用竖排矩阵结构,占用面积不大,对于横屏游戏党而言,手指基本不会触碰,十分贴心。中框采用哑光金属材质,搭配圆润大R角设计,边缘顺滑,无论是横握还是竖握,都不会有硌手的感觉。手机厚度约8.10mm,重量约206g,轻薄机身加上1:1均衡配重,拿在手中轻盈舒适,长时间握持也不易感到疲惫。 在周边配置方面,一加Ace 5至尊版同样表现出色。它搭载6.83英寸1.5K电竞直屏,分辨率为2800×1272,像素密度达450ppi,显示极为细腻。该屏幕还支持最高144Hz刷新率、1400nit全局峰值亮度、3840Hz高频PWM调光与全亮度类DC调光。 性能上,一加Ace 5至尊版搭载天玑9400+旗舰芯片,配合16GB大运存以及UFS 4.0闪存,安兔兔综合跑分成绩突破322万分。此外,手机还配备了6700mAh的大电池,结合100W超级闪充,能够实现长久续航。 如果你正在寻找一款外观出众、质感上乘且周边配置强大的手机,一加Ace 5至尊版绝对是一个值得考虑的选择,它能为你带来全方位的优质体验。目前12GB+256GB版本价格为2039元。 荣耀400凭借轻薄的机身与优秀的外观设计,带来了堪比高端旗舰手机的质感。现在荣耀400的起售价为2124元。 荣耀400 荣耀400拥有精湛的制造工艺,机身采用超细腻金属中框,利落的棱线设计锋芒毕露,搭配精研雾面工艺,触感细腻且不易沾染指纹。196g的重量与7.8mm的厚度,在保证轻薄的同时,兼顾了握持的舒适感。更令人称道的是其“流光织锦”工艺,每一台手机背面的灵动纤维纹理都独一无二。无论是视觉还是触觉,荣耀400都能为用户带来高端旗舰般的体验。 荣耀400不仅外观出众,其硬件配置同样令人惊艳。其搭载2亿像素AI超清影像系统,主摄配备1/1.4"超大底传感器,支持OIS+EIS双重防抖,配合16合1像素融合技术,轻松捕捉清晰细腻的瞬间。112°超广角微距镜头和5000万像素前置摄像头,满足用户的拍摄需求。此外,荣耀400内置7200mAh青海湖大电池,搭配AI智能电量调度引擎,续航能力全天无忧。搭配80W有线超级快充,仅需15分钟即可充至39%。 此外,荣耀400在屏幕护眼方面同样表现出色,采用38840Hz超高频PWM调光,有效降低屏幕闪烁对眼睛的伤害,并通过德国莱茵TV无频闪认证。其独有的AI类自然光护眼和助眠显示技术,能够根据环境光线智能调节屏幕色温,缓解视觉疲劳,甚至提升褪黑素分泌,帮助用户获得更好的睡眠质量。 荣耀400凭借质感设计、强悍影像、持久续航和健康护眼,成为中高端市场的全能选手。无论是追求时尚的年轻人,还是注重实用性的上班族,都能在这款手机上找到心动的理由。 长久以来,红米手机给消费者的印象便是性能强大,外观质感一般。然而,红米K80至尊版的出现打破这一刻板印象。 红米K80至尊版 红米K80至尊版首次采用旗舰玻纤背板,不仅重量更轻、厚度更薄,还具备出色的强韧性和耐用性。机身背部搭配金属相机DECO,通过CNC金属材质与高精度精雕纹理工艺,呈现出细腻光泽与高级质感。四曲面包裹式金属中框采用整块铝箔CNC切割工艺,边缘平滑不硌手,握持舒适度大幅提升。超薄相机一体化设计进一步优化了机身线条,同时降低了跌落损伤的风险。 作为性能旗舰,红米K80至尊版搭载天玑9400+旗舰芯片,采用台积电3nm制程工艺,超大核主频高达3.75GHz,配合独立AI模块与PC级独显芯片D2,无论是高负载游戏还是多任务处理都能轻松应对。 红米K80至尊版在细节配置的堆叠上同样不留余力,搭载大师级同轴对称双扬声器,高低频同轴双单元设计带来全频段好音质,无论是游戏声效还是影音娱乐都能沉浸其中。超宽频赛博马达提供更强劲、更精准的振动反馈,触感体验媲美专业游戏手柄。此外,该机还支持Dolby Vision、HDR Vivid等超高清认证,影音表现全面升级。 如果你正在寻找一款兼具质感与性能的手机,红米K80至尊版无疑是2025年最值得入手的选择之一。目前国补后起售价为2209元(12GB+256GB)。 真我Neo7 Turbo自发布以来,就凭借独特的设计语言与极致的质价比吸引了众多消费者购买。目前,12GB+256GB版本到手价仅需1700元。 真我Neo7 Turbo 真我Neo7 Turbo以极具未来感的"透明新生设计"重新定义了智能手机的美学语言。手机背部采用独特的晶透背板工艺,将精密内部构造以艺术化的方式呈现,营造出悬浮立体的视觉奇观。透明灰与透明黑两种配色方案,完美平衡了科技感与高级感。背板精心雕刻的纹理在光线流转间展现出迷人的光影变化,与NFC灵透线圈、闪能DART标等设计元素相得益彰,让实用科技成为视觉美学的一部分。这种大胆创新的设计理念,让Neo7 Turbo在众多旗舰机型中脱颖而出,成为彰显个性的时尚单品。 在惊艳的外观之下,真我Neo7 Turbo搭载了天玑9400e旗舰芯片,配合LPDDR5X内存和UFS4.0闪存组成的满级存储组合,安兔兔综合跑分高达245万,轻松应对各类重度使用场景。特别配备的"电竞抢网芯"技术,可以确保在网络拥堵环境下依然保持稳定连接。此外,该机内置7200mAh超大容量泰坦电池,搭配100W光速秒充,实现超强的续航能力。 真我Neo7 Turbo配备了一块6.7英寸1.5K分辨率京东方Q10旗舰屏,采用先进的144Hz超高刷新率,配合1.3mm视觉等窄边框,带来沉浸式的视觉体验。这块屏幕不仅拥有6500nit的超高峰值亮度和1800nit的全局激发亮度,更搭载了领先业界的4608Hz超高频PWM调光技术,大幅降低频闪对眼睛的伤害。
瑞银预估苹果首款折叠iPhone定价1800~2000美元,物料成本759美元
IT之家 7 月 15 日消息,Fortune 昨日(7 月 14 日)发布博文,报道称瑞银(UBS)预估苹果首款折叠 iPhone 的物料成本(BoM)为 759 美元(IT之家注:现汇率约合 5444 元人民币),定价在 1800~2000 美元(现汇率约合 12911 ~ 14345 元人民币)之间,预估初期销量在 1000~1500 万部之间。 瑞银拆解了三星 Galaxy Z Fold 特别版,分析显示该折叠手机的物料成本大约为 790 美元(现汇率约合 5666 元人民币),并以此预估苹果首款折叠 iPhone,认为其物料成本要低 4%,为 759 美元(现汇率约合 5444 元人民币)。 此前报告指出苹果首款折叠 iPhone 售价可能为 2000~2400 美元,成为苹果迄今为止最昂贵的手机。而瑞银的这份评估报告,认为售价在 1800~2000 美元,贡献利润率在 53% 至 58% 之间。 iPhone Fold 的发布预计将对苹果的供应链产生积极影响,包括 Amphenol、Hirose、TDK、Avary 和 SDI 等公司。这些公司目前的交易价格低于历史平均估值,新产品的大量生产可能会提升市场情绪和股价。 该报告指出以下关键供应链信息: 显示面板:三星显示预计将是主要的供应商,具备年产 1500 万部 7 英寸折叠 OLED 面板的能力,而苹果正在多元化其供应商,LG 显示也可能参与其中。 外壳和铰链:设备可能会采用钛合金外壳和液态金属铰链,Lens Technology、Amphenol 和鸿海(富士康)等供应商将从更高的物料成本中获得更多份额。 EMS 供应商:鸿海预计将负责初期组装,立讯精密作为次要合作伙伴,反映了苹果利用其成熟的制造生态系统的策略。
“大模型六小虎”被曝获20亿融资,放出首个推理模型技术秘籍
作者 | 程茜 编辑 | 李水青 智东西7月15日消息,近日,“大模型六小虎”之一MiniMax新动向频发。 昨日,据晚点报道,MiniMax接近完成近3亿美元(折合人民币约21.5亿元)的新一轮融资,投后估值超过40亿美元(折合人民币约287亿元)。“大模型六小虎”中,智谱、百川智能、月之暗面估值均超200亿元,零一万物、阶跃星辰超100亿元。 上个月,MiniMax前脚宣布启动“发布周”,一口气发了推理模型MiniMax-M1、视频大模型海螺02、通用智能Agent MiniMax Agent、端到端视频创作Agent海螺视频Agent、语音设计工具;后脚外媒彭博社就爆料,MiniMax正在筹备赴港上市。 MiniMax成立于2021年11月,去年3月获得6亿美元A轮融资,当时估值约为25亿美元(约合人民币180亿元),该轮融资由阿里巴巴集团领投,红杉中国、高瓴资本参投。此前,腾讯、米哈游等公司也参与了MiniMax的融资。 今日,MiniMax放出了其在7月10日的M1全球技术闭门会的技术实录,M1团队与香港科技大学、滑铁卢大学、Anthropic、Hugging Face等技术人员,围绕RL(强化学习)训练、模型架构创新、长上下文展开探讨,主要干货信息如下: 1、针对有限上下文长度,RL能赋予模型新能力; 2、RL训练可以让模型获得范围广阔的知识; 3、只在数学和代码上进行RL训练,模型更容易产生幻觉; 4、Latent reasoning(隐性推理)可能是让模型用图像进行思考的一个方向; 5、Reward Modeling(奖励建模)、多智能体、AI自动化研究、非token空间推理是RL领域令人兴奋的挑战; 6、长上下文在Agent工作流中有巨大潜力; 7、混合架构将成为主流; 8、大模型领域,脱离硬件的纯粹算法研究正逐渐失去关注度。 如今大模型领域呈现出激烈的竞争态势,DeepSeek等模型引发行业震动的同时使得国产大模型格局深度洗牌,大模型六小虎纷纷调整战略求生存,在此背景下,MiniMax得到资本青睐,拿下大额融资、被曝冲刺IPO,其对于大模型在长文本处理能力、低成本训练等方面的有哪些创新点?这次技术闭门会有哪些独到见解能为业界提供参考?我们试图从其精华整理中找到答案。 一、揭秘M1背后闪电注意力机制,推理模型自我反思的关键是高效利用计算资源 今日放出的技术闭门会实录提到,MiniMax研究人员针对MiniMax-M1采用的混合线性注意力以及推理模型是否已经具备推理和自我反思能力进行了探讨。 MiniMax-M1是其发布周最先更新的模型,作为全球首个开源大规模混合架构的推理模型,参数规模达到4560亿,每个token激活459亿参数,原生支持100万上下文输入以及业内最长的8万token推理输出,输入长度与闭源模型谷歌Gemini 2.5 Pro一致,是DeepSeek-R1的8倍。此外,研究人员训练了两个版本的MiniMax-M1模型,其思考预算分别为40K和80K。 MiniMax在标准基准测试集上的对比显示,在复杂的软件工程、工具使用和长上下文任务方面,MiniMax-M1优于DeepSeek-R1和Qwen3-235B等开源模型。 其博客提到,在M1的整个强化学习阶段,研究人员使用512块H800训练了三周,租赁成本为53.74万美金(折合人民币约385.9万元),相比其一开始的成本预期少了一个数量级。 M1是基于MiniMax-Text-01模型开发,采用了混合专家(MoE)架构和闪电注意力机制。 M1的闪电注意力机制可以高效扩展测试时计算。例如,与DeepSeek-R1相比,M1在10万个token的生成长度下只需消耗25%的FLOP,使得M1适合于需要处理长输入和广泛思考的复杂任务。 对于混合线性注意力会如何影响使用RL的推理模型的性能,技术探讨会中提到,在训练过程中,当其扩展到可处理数万token上下文长度的模型时,遇到了RL训练停滞不前,奖励信号在仅几百步后就不再增长的问题。这与线性注意力架构在这种规模下固有的训练不稳定性有关,会导致某些层激活值爆炸等,并使模型在训练和推理时的行为出现严重错位。 这使得其发现混合线性注意力的一个根本性权衡:效率极高,单位token的计算成本非常低,但通常需要生成更多的 token(即更长的推理路径)才能达到与full attention模型相同的性能。其工作证明:通过适当规模的RL以及合适的推理时算力,混合注意力模型能实现媲美Full Attention(全注意力)架构性能。 这对未来架构设计的一个关键启示——评估方法的重要性。为了公平地比较混合模型与其他模型,研究人员应该基于在给定任务下、固定总计算预算内的性能来进行评估,而不仅仅是比较固定输出长度下的效果。 被问及推理模型是否已经具备了System 2推理和自我反思能力,研究人员称,System 2推理和自我反思,可以被理解为从大语言模型基本原理中涌现出的、可被观测的模式。 首先其核心驱动力,是有效利用更大的计算资源来获得更好性能的能力。高级推理能力,是扩展这些资源后的直接结果,而非其根本原因。本质上,为模型提供更多的计算能力去“思考”,使得这些复杂的模式得以涌现。 其次,这种高级推理可以被看作是一种自动化的Prompt Engineering。对于数学或编程等复杂任务,模型学会了生成自己的内部思考过程,这实际上取代了人类提供详尽、分步式指令的需要。 对于写作等任务,模型在思考过程中会先对问题进行分析,并对写作步骤进行专业化拆解。它会独立地执行诸如规划和对问题进行更深层次分析等操作。这使得模型能够通过创建详细推理路径来“像专家一样思考”。 因此System 2推理和自我反思,实质上是如何高效地利用并扩展计算预算(Computation Budget),同时也是模型自动深化用户问题的体现。 二、从MiniMax-M1到大模型产业核心议题:模型架构创新、RL训练、长上下文应用 从MiniMax-M1出发,MiniMax团队成员与其他技术专家还探讨了当下大模型行业的其他核心话题,如模型架构创新、RL训练、长上下文应用等领域探讨了当前的前沿话题,有以下8大核心要点: 1、RL训练可增强有限上下文长度模型能力 首先需要定义模型的基础能力:对于给定上下文长度的模型,在一组特定问题上无限次尝试下的通过率(pass@k, k→∞)是多少,如果通过率为1,就表示这个模型能解决这类问题,通过率为0,则表示模型解决不了。 如果模型的生成长度,即模型思考过程的长度无限,RL无法赋予模型新能力,所有能用自然语言表述的问题,理论上模型都可以通过有限次的采样尝试来解决。 如果针对有限上下文长度,RL能赋予模型新能力。因为RL所做的是改变模型输出的分布,预训练后,模型可能需要至少10W tokens才能解决某个问题,但经过RL微调后,它可能只需要10K tokens。如果模型有限上下文长度是50K tokens,那么RL的确赋予了模型新能力。 在有限上下文长度下, pass@k是一个好的衡量指标。K的取值很重要,这取决于如何定义模型能力,如果定义是“模型至少有一次能解决这个问题”,那么应该用尽可能大的k来衡量pass@k;但如果定义是“模型能否在4次尝试内解决问题”,那应该去衡量pass@4。 目前Reward(奖励)是RL scaling的核心瓶颈,特别是如何为那些不基于结果的奖励(Non-outcome-based Reward)进行建模,比如,人类可以从别人写的一段文字或反馈中获得正面或负面的感受,但目前并没有很好的方法来对这种主观感受进行建模。 2、预训练的价值在于更多样化的数据分布 原则上可以,只要有足够的信息源就可以用RL来替代任何过程。某种意义上,预训练只是RL的一种特例,任何监督学习都可以被看作是一种特殊的强化学习。现阶段,RL训练阶段的数据分布,要比预训练数据的分布狭窄得多,这正是目前进行预训练能带来的最大收益——它让模型获得了范围远为广阔的知识。 但在当前阶段,预训练的价值在于可以在预训练阶段接触到更多样化的数据分布。目前RL研究的核心挑战之一是如何拓展至Reward清晰的环境之外。奖励建模(Reward Modeling)可能是一种解决方案,但更为通用的奖励信号依然是行业在探索的方向。 3、只在数学和代码上做RL训练更易产生幻觉 关于通用推理,至少在今年二月左右,大多数RL数据都来自于数学或编程领域。事实上,只在数学和代码上进行RL训练,模型更容易产生幻觉。SimpleQA等事实性基准、MMLU等多学科问答基准上模型的性能都会显著下降。 因此研究人员做通用推理数据集的动机之一,就是创建更多样化的RL训练数据。WebInstruct-verified数据集旨在为所有领域构建更大规模的RL训练数据,以便模型能够在不同领域取得进步,而不仅是数学和编程。 现在MiniMax尝试进一步扩大这个规模,之前,通过在预训练数据集中搜索可用的RL数据来扩大规模,其已经将其扩展到50万量级,现在正尝试通过检索更大规模的预训练数据集,从中获取越来越多样的RL数据,并采用在Mid-training(中期训练)进行RL的范式,而不仅仅是作为后训练。 4、隐性推理是让模型用图像思考的可能方向 目前很多视觉推理范式,核心大都集中在文本形式的思维链上,视觉部分固化为一个ViT(Vision Transformer)编码器,无法让模型在编码图像上花费更多计算资源。像视觉语言模型Pixel Reasoner或其他研究,正试图帮模型重新审视图像的特定区域,并对其进行重新编码,从而在关键区域上投入更多算力。 但这并不是从底层提升模型能力的方法,现阶段更像是权宜之计。因为现有的视觉编码器太弱,无法很好处理高分辨率图像,所以才尝试用其他操作操纵图像表示,然后从输入中重新调用并在此基础上进行推理。现阶段,重新调用帧或高亮显示等工具,实际上都只是在增强感知能力。 其他更复杂的图像生成技术等工具,能从根本上改变图像,其已经超越了单纯增强感知的范畴,比如在几何问题中画辅助线。这种方法如果奏效,未来或成为“用图像思考”的更强大版本。 但仍需解决其根本的瓶颈问题:如何更好地编码视觉像素,以及如何以更好的方式在抽象潜在空间(Latent Space)中进行视觉推理。 Latent Reasoning(隐性推理)可能是一个方向。机器人或具身智能领域的视觉推理需要在空间中思考,在这些涉及空间感的场景下,很多推理过程是隐式的,无法被清晰地表述或言语化。 5、多智能体、AI自动化研究是RL领域挑战 RL面临挑战之一是Reward Modeling,特别是如何超越那些结果容易被评估的环境;另一个可能很重要的领域是多智能体,多智能体目前更多受限于基础设施,而非理论研究;另一个领域是AI自动化研究——让模型自己训练自己,这与AGI的定义相关,即当模型可以在没有人类干预的情况下,自我训练并自我提升;非token空间的推理也存在机会。 6、长上下文是Agent的破局点 长上下文在Agent工作流中有巨大潜力,Agent完成某个任务时,能将整个代码库、API参考文档、历史交互数据等等,全部一次性喂给它。这种任务不能分几次调用来处理,因为智能体完成任务时掌握的关于这个项目的信息越多,产出的质量就越高。 研究人员有望从目前在大多数情况下,只能处理相当孤立任务的智能体,发展到那些能够管理复杂项目、同时保持完整上下文感知的智能体。 M1超长上下文模型的真正价值在于解锁了全新的企业级应用场景。例如,法律行业客户需要把文件一块一块地喂给大语言模型,并用一些窍门来优化检索和上下文管理。这样问题在于,可能错过埋藏在某个随机法律文件某一页中的关键细节。1M token的上下文窗口就可以一次性处理整个案件历史、所有相关判例以及所有其他信息源。 7、混合架构将成为主流 对比纯线性注意力和Full Attention,混合注意力机制(Hybrid Attention)是最有前景的方案。纯线性注意力机制有很多根本性局限,因为它的状态大小是固定的,因此,在处理长序列建模问题时表现不佳。 Full Attention虽然提供了灵活性,但其代价也显而易见:KV缓存大小会随着序列长度线性增长,并且训练复杂度也是平方级的。当序列不断变长时,高昂的推理和训练复杂度就会成为瓶颈。 混合架构将会成为模型设计的主流,因为随着对大规模部署和低延迟需求的增长,人们会越来越关心推理效率和模型的推理能力。未来如何进一步拓展混合注意力架构的空间,研究人员可能需要探索不是简单地用固定的比例来交错堆叠Softmax注意力和线性注意力层,或许需要更多样的混合架构形式。 在大模型领域,脱离硬件的纯粹算法研究正逐渐失去关注度。如果一项技术无法规模化,或者不能被高效地部署,那它就很难获得关注、形成势能。一个算法不仅要在理论上站得住脚,还必须在硬件上——尤其是在GPU或TPU这类加速器上高效运行。如今的算法研究者们还应该掌握一些底层的GPU编程工具,这才是当今在大模型领域做算法研究的正确方向。 混合架构目前的瓶颈在于基础设施。混合模型的有效性在去年就已经得到了很好的验证,但没有公司投入更多资金进行大规模验证。 8、混合架构推理速度对现实应用至关重要 在推理层面,随着混合注意力架构越来越流行,为了在SGLang或其他推理引擎中充分利用缓存感知和缓存复用等特性,研究人员需要为普通架构和混合架构设计统一的抽象层,这样才能简单地将所有优化应用到混合模型上。 此外当前MiniMax模型7+1层交错的架构可能会带来一些工程挑战,特别是在用计算图优化(Graph Optimization)进行部署时,因为不同层的计算和内存访问模式是不同的,这会导致GPU利用率不平衡。可能需要用一些技术来解决它,比如批处理重叠(Batch Overlapping)或者更先进的Pipeline策略。 从支持混合架构的技术层面来说,首先需要一个混合分配器(Hybrid Allocator),有助于管理混合架构的KV缓存。这些状态的生命周期与全注意力层的KV缓存并不同步,所以需要设计如何让它与现有的缓存机制、预填充、解码等环节协同工作。 其次,批处理重叠(Batch Overlapping)会很有帮助。采用了混合架构后,如果能将两个微批次(Micro-batches)重叠起来处理,只要比例计算得当,理论上任意时刻都会有一个微批次在执行计算密集型的Full Attention 操作,从而最大化GPU利用率。 从生产部署的角度来看,混合架构的推理速度对现实应用至关重要。例如,有一个客户,需要并发处理多个几十万token的请求。但对于使用二次方复杂度注意力的传统模型,在这种输入大小和并发量下,生成速度都会变得极慢。 结语:“大模型六小虎”发力 作为MiniMax推出的首个推理模型,MiniMax-M1是其在模型架构、算法创新上的最新探索。未来大语言模型在测试或推理阶段,往往需要动态增加计算资源或计算步骤来提升模型性能,尤其在Agent发展加速的当下,模型需要进行数十到数百轮的推理,同时集成来自不同来源的长上下文信息,才能执行任务。MiniMax在M1上的技术探索,对于推理模型能力、长上下文处理能力的突破或许均有可复用性。 与此同时,“大模型六小虎”之一的月之暗面也放出了其最新一代MoE架构基础模型Kimi K2,总参数量达到1万亿(1T),在预训练阶段使用了“MuonClip”优化器实现万亿参数模型的训练优化。 可以看出,被DeepSeek冲击的“大模型六小虎”现在正在卯足劲头,竞相通过技术创新开发更实用、更低成本的模型。
百度萝卜快跑与Uber达成战略合作,全球部署数千辆无人驾驶汽车
IT之家 7 月 15 日消息,今日,百度萝卜快跑宣布与全球最大的移动出行服务平台 Uber 建立战略合作伙伴关系,将萝卜快跑拓展至全球多个市场,并部署数千台无人驾驶汽车,为更多用户提供安全可靠的无人驾驶出行服务。 ▲ 图源百度公众号 按照计划,今年年底前双方将率先在亚洲和中东地区部署萝卜快跑第六代无人驾驶汽车,未来将逐步扩展至全球更多市场。服务上线后,乘客可通过 Uber App 呼叫到由萝卜快跑提供服务的无人驾驶车辆。 百度创始人李彦宏表示:“我们致力于让更多市场和更多用户享受到无人驾驶技术的成果,与 Uber 的合作是萝卜快跑在全球范围内部署无人驾驶汽车的一个重要里程碑。我们将与 Uber 一同,为世界各地的乘客提供安全高效的出行方式。” “这一合作是全球最具代表性的两家科技公司强强联合,共同定义未来出行。”Uber 首席执行官达拉・科斯罗萨西(Dara Khosrowshahi)表示,“作为世界上最大的移动出行平台,Uber 业务涵盖出行、配送和货运,具有独特的优势,可以将萝卜快跑无人驾驶技术快速推向全球市场。” 目前,萝卜快跑已在全球部署了超 1000 台无人驾驶汽车,足迹遍布香港、迪拜、阿布扎比等 15 个城市,为全球用户提供了超过 1100 万次出行服务,累计安全行驶里程已超过 1.7 亿公里。
李想:泄密打乱了理想i8的发布节奏
凤凰网科技讯(作者/坨坨) 7月15日,理想汽车CEO李想在社交媒体平台发布动态,就理想i8的相关泄密情况作出回应。他表示,“泄密打乱了理想i8的发布节奏,按原计划今天不会发布内饰图。此次泄密与用户、媒体无关,是我们自己低估了理想i8潜在用户的‘求知欲望’。” 李想还附上了两张从其他渠道获取的理想i8内饰图,并建议网友关注理想汽车后续的官宣图。 随后理想汽车官方也放出了内饰图。 此外,李想透露,近期理想汽车会陆续在四个城市举办理想i8媒体品鉴活动,相关内容也会陆续释放。关于理想i8为何如此设计以及真实体验如何,消费者可以静待第三方专业媒体的解读。 此前有消息传出,理想i8的内饰图遭提前泄露,甚至有参与评测体验的博主透露,签订的保密协议金额高达1000万元,引发广泛关注。 理想i8采用六座布局,取消了双A柱设计,采用大角度倾斜前风挡、隐藏式门把手与半封闭式轮圈,车身尺寸为5085mm×1960mm×1740mm,轴距达3050mm;动力上,理想i8搭载自研碳化硅双电机四驱系统,最大综合功率达400千瓦;电池方面,新车全系标配5C三元锂电池,提供90.052kWh和97.842kWh两种容量选择,对应CLTC续航里程分别为670km和720km。 该车将于7月17日开启预订,7月29日正式上市。
华人工程师被疯抢,世界第一AI创业公司,走进覆灭前夜
OpenAI暂时还是世界上最牛的AI初创公司,但这家公司正面对科技巨头们的疯狂挤压,以及中国科技公司带来不确定性,挣脱牢笼,恐怕需要再重复一次ChatGPT的奇迹时刻。 数读社原创 作者 | 老牛 #1 “魅魔”华人工程师 Business Data Analysis Grok 4发布会上,马斯克身边出现了两个华人面孔。这两位华人坐在了C位,甚至将主角马斯克挤到了角落。 两人分别是吴宇怀和吉米·巴(Jimmy Ba),是马斯克xAI公司的创始团队成员。其中,吉米·巴师从“AI教父”杰弗里·辛顿,论文过去五年被引用22万次之多,是当之无愧的学术大牛。吴宇怀则是彻头彻尾的中国人,出生于杭州建德,9年义务教育在国内完成,如今刚满30岁。 2023年,马斯克公布了xAI公司的12人初创团队,华人几乎占据了半壁江山。除了上述二人,还有杨格、戴子航和张国栋三人。 杨格本科、硕士均毕业于哈佛大学数学系 ,曾在微软雷蒙德研究院当研究员。 戴子航本科毕业于清华,硕士和博士毕业于卡耐基梅隆大学,曾是谷歌的高级研究员。 张国栋本科毕业于浙江大学,多伦多大学博士,曾在谷歌和DeepMind工作。 从名字就能看出三人均是华人。 马斯克并不是唯一对华人情有独钟的大佬。就在近期,扎克伯格掀起的挖角大战,华人工程师同样广受关注。 挖角堪称疯狂,扎克伯格启动“超级智能团队”计划,领导者名为汪韬,此前是Scale AI首席执行官,工作地点紧邻扎克伯格本人,受重视程度极高。 在此基础上,扎克伯格还开启“BOSS直聘”,高薪挖角硅谷精英。 最知名的事件当属1亿美元薪酬挖角事件。据《连线》杂志,扎克伯格为顶级AI人才开出了四年、总额高达3亿美元的薪酬方案,其中第一年的薪酬就超过1亿美元。 天价薪酬的主角叫余家辉。 余家辉本科毕业于中国科学技术大学少年班,主修计算机科学专业。 他先后在Google Brain和OpenAI等顶尖AI研究机构任职,参与了多个里程碑式模型的研发工作。谷歌学术被引量已经达到了33000+。 1亿美元薪酬事件传出后,有人甚至将余家辉与足球明星C罗做了对比,用以凸显薪酬的疯狂程度。当然,Meta进行解释称,这一数字并非直接给到个人的年薪,而是包括各种福利和奖励在内的总包方案,侧面承认了天价年薪的真实性。 除了余家辉,苹果基础模型团队负责人庞若鸣(Ruoming Pang)也被挖角到Meta。他的薪酬传言更加离谱,有报道称他的薪酬水平达到了2亿美元。 庞若鸣曾经是谷歌首席软件工程师,1998年毕业于上海交大,随后取得美国南加州大学计算机科学硕士学位,以及美国普林斯顿大学计算机科学博士学位。 目前,在扎克伯格目前公布的“超级智能团队”中有14名成员,其中,8位是华人,且多数来自OpenAI和谷歌DeepMind。 华人工程师,已经成为全球AI产业的支柱力量,他们的流动,很可能会直接影响着科技巨头的AI进展。 万亿科技大厂争抢华人顶尖人才,AI军备战之下,有的企业展现手腕,有的企业则正在陷入前所未有的危机。 #2 第一AI公司的轮回 Business Data Analysis 扎克伯格挖角的主要“受害者”是OpenAI。有报道称,至少八名核心研究员集体跳槽到了Meta。 余家辉是其中之一。在OpenAI,他深度参与了GPT-4o、GPT-4.1等模型的研发。 常慧文(Huiwen Chang),本科清华,博士普林斯顿,GPT-4o图像生成的共同创建者。 任泓宇(Hongyu Ren),本科北大,博士斯坦福,是o3mini、o1mini等模型的创建者和核心贡献者。 赵晟佳(Shengjia Zhao),本科清华,博士斯坦福,参与了GPT4、o1等核心项目的研发。 林吉(Ji Lin),本科清华,博士MIT,参与构建o3/o4-mini、GPT-4o、GPT-4.1、GPT-4.5、4o-imagegen和Operator推理堆栈。 有报道称,这场挖角非常凶险。OpenAI内部的Slack群里,几个核心研究员的账号突然变灰。 核心成员一夜“叛逃”,激怒了研究主管Mark Chen,他在内部备忘录里写下了一句疯传硅谷的话:“我感觉五脏六腑都在翻腾,就好像有人闯进我们家,偷走了我们的东西。” OpenAI 招聘主管直接破防,连发多条推文,批评Meta挖角方式过于激进。 创始人奥特曼在内部群里称,Meta 的行为有些令人反感。据《连线》杂志,他吐槽扎克伯格说,“我已经记不清他们从这里挖了多少人来当首席科学家了。” 奥特曼还试图安抚人才,方式也非常“卑微”。他表示,Meta 更看重短期薪酬,而非长期创新文化。 另外根据公开的报道,奥特曼在接受采访时刻意表现得很豁达,但他是边说“fine”边摇头,在阐述留住人才策略时,他略带磕巴地说到,“有伟大的使命和真正有才华的人”。可见内心是有焦虑感的。 在这场挖角大战中,OpenAI变得非常被动。 OpenAI并不无辜,此前,他们还是挖角的主角。余家辉在加入OpenAI之前,曾经是谷歌的重要人才,他参与了谷歌Gemini的研发工作。常慧文在加入谷歌时一直在谷歌担任研究科学家。去年12月,OpenAI直接从谷歌DeepMind挖走了3名顶级工程师,其中就包含上文提到的翟晓华。 如今,风水轮流转,OpenAI成为了被挖角对象。 挖角并不是多么致命的问题,真正问题严重的OpenAI的管理问题。 #3 重蹈仙童半导体覆辙? Business Data Analysis 从名噪一时开始,管理问题一直是OpenAI最为烦恼的问题。 2022年11月,ChatGPT问世,名声大噪,开启了AI大模型时代。随后,OpenAI趁热打铁,发布了4.0版本。 就在全世界目光都聚焦到这家AI初创公司的时候,一场宫斗大戏上演。 2023年11月,首席科学家伊尔亚·苏茨克维和3位董事将CEO奥特曼和董事长格雷格·布洛克曼踢出局。故事并没有就此结束,包括微软在内的投资人和OpenAI内部诸多员工,敦促董事会撤销决议。 随后,700多名员工以辞职威胁,逼宫董事会请回奥特曼。 最终,宫斗落幕,首席科学家伊尔亚发声明表示后悔,奥特曼重回CEO宝座。 这次宫斗,看起来并未对OpenAI带来实质性影响,公司随后照常发布了多个版本的大模型。但实际上对内部的伤害巨大,人员流失也不可避免。 首席科学家伊尔亚宫斗失败后,灰头土脸地离开。计算机科学家约翰·舒尔曼宣布离职,产品副总裁Peter Deng、安全团队负责人詹·莱克也先后辞职。 OpenAI实际一直处在震荡当中。 据报道,首席科学家、首席技术官、首席研究官、Sora视频生成模型负责人、GPT-4o多模态模型负责人在内的至少十几位中高层领导已经先后更换,2015年帮助创立OpenAI的13人中,仅有3人还留在OpenAI。 OpenAI的管理难题,更多在于,这家公司的理想与现实产生了偏差。 2015年,奥特曼、彼得·蒂尔、里德·霍夫曼(Reid Hoffman)和马斯克等共同创立了OpenAI,最初这家公司定位于非营利组织,定位是“确保通用人工智能造福全人类”,公司也由此被架到了如此恢弘的目标上无法降低身段。 当大模型研发投入越来越高,OpenAI不得不面临抉择,究竟是继续当初的崇高理想,还是向现实屈服。 OpenAI选择了后者。2019年,OpenAI创建了限制性盈利实体,并随后引入了微软的10亿美元融资。 2022年的彻底爆发以及随后的惨烈竞争,让这家公司很难坚持当初的路线。保持领先需要更大的投入,引入投资者需要放弃一些理想主义,拥抱商业化。 2023年至今,OpenAI完成了三轮融资,分别是100亿美元、66亿美元以及400亿美元,其中,在软银主导的400亿美元投资中,OpenAI被要求从非营利架构向营利性实体的转型。 OpenAI希望竭力避免成为当年的仙童半导体。后者曾经聚集了半导体最顶尖的人才,一度成为世界上最富创造力的半导体企业,但由于母公司短视,内部人才流失,成为滋养硅谷的“西点军校”,没能兑现期待。 但实力强大的对手面前,OpenAI也许不是想不想的问题。 #4 东方力量 Business Data Analysis 今年年初,奥特曼罕见服软。 在接受采访时,他说道,OpenAI的闭源策略“站在了历史错误的一边”。逼迫奥特曼做出这样的表态,是因为来自东方的开源模型DeepSeek。 作为开源系统的DeepSeek,彻底打破了OpenAI筑起的高墙。 DeepSeek用557.6万美元的训练成本、算力受限的英伟达H800 GPU集群,在数学、代码、自然语言推理等任务上,比肩了投入数十亿美元的ChatGPT。彻底打破了大模型“越强越贵”的成本诅咒、“性能-成本-速度”的不可能三角。 短短几个周内,OpenAI不仅推出了类似的推理功能,还加快了在推理技术上的投入力度,以应对DeepSeek带来的巨大压力。 4月,奥特曼宣布将试水开源,几个月内发布“强大的带有推理能力的全新开放权重(open-weight)模型”。 这个模型原本是今年夏天最受期待的模型,然而,就在马斯克发布新模型的同一天,奥特曼推迟了开放模型的发布。此前,已经推迟了一个月,这一次是无限期推迟发布。 OpenAI迫切想证明其领先能力,但是硅谷有xAI、Google DeepMind 和 Anthropic等大厂,中国有DeepSeek、通义、豆包大模型,OpenAI的任务越来越艰巨。 美国科技大厂的挖角大战,让OpenAI面临巨大的人员流失,而中国工程师的与日俱增的影响力,让OpenAI即将面临另一个市场的巨大未知。 从DeepSeek以后,通义千问、豆包、Kimi相继推出了新版本,这对于OpenAI或许尚可应对,真正隐忧的还是人才。 能够看到,Meta挖角的众多华人工程师中,很多人的本科都是在国内完成,这侧面证明,中国高等教育输送的人才含金量已经非常高。如果中国AI公司能够给出更高待遇,未来截胡OpenAI,乃至xAI、Google DeepMind和Meta的情况很可能会发生。 事实上,这样的事情已经在上演。 为了应对AI竞争,字节挖来了谷歌DeepMind前副总裁吴永辉。 吴永辉是Google Fellow级别的人物。在谷歌,Google Fellow是终身荣誉,只有顶尖工程师才能享有这个称号,可谓凤毛麟角。 在AI领域,吴永辉是谷歌神经机器翻译项目及Rank Brain项目的主要贡献者之一。在2023年谷歌大脑和DeepMind合并之后,他曾参与到谷歌大模型Gemini的研发工作,是Gemini应用总技术负责人之一。前文所述的余文辉,是吴永辉的嫡系弟子。 能够挖来这样的技术大牛,可见中国科技公司也对这场竞争充满野心。这样千金买马骨的戏码,会吸引更多优秀人才。 这种背景下,OpenAI的后劲显得不足。 #5 穷兵黩武 Business Data Analysis 7月12日,谷歌 DeepMind 宣布收购Windsurf,其员工将专注于 DeepMind 的编程智能体和工具使用方面的 Gemini 项目。这家公司原本是OpenAI的猎物。 为了赢下AI之战,美国巨头之间已经撕下来表面和谐。 OpenAI也在变得愈发激进。 为了反制,OpenAI挖角了四位技术大牛,分别是:大卫·刘,曾在特斯拉担任软件工程副总裁12年;乌代·鲁达拉朱,xAI及X公司前基础设施工程主管;迈克·道尔顿xAI基础设施工程师;安吉拉·范,Meta AI的长期研究员。 实际上,为了留住人才,OpenAI已经非常疯狂。 其最新的财报数据显示,公司去年股权激励共烧了44亿美元,比全年营收还多出19%。占营收119%的股权激励,在所有科技公司中都是闻所未闻的。谷歌上市前股权激励占营收16%,Facebook是6%。 OpenAI把挣来的钱,还贴上了一些,塞给员工,为的就是防止他们跑路。 这样客观带来的结果是,早期投资者的份额被稀释成废纸,越来越难以拿到新的融资。 这像极了产业互联网时代的“烧钱”大战,只不过烧的钱落到了工程师们的口袋里。没有公司会停下来,OpenAI自然也停不下来。但面对万亿美元市值的科技巨头挖角,OpenAI能给到的诚意只有股权和很虚的“企业文化”,非常被动。 这不是长久之计,但OpenAI似乎没有更好的办法。 这家公司仍然是世界上最牛的AI初创公司,但这家公司正面对科技巨头们的疯狂挤压,以及中国科技公司带来不确定性,挣脱牢笼,恐怕需要再重复一次ChatGPT的奇迹时刻。
创始人套现9亿后退网,“扫地茅”转战港股求活?
摘要: 站在二次上市的重要节骨眼上,核心销售岗位换帅、董事长清空社交媒体,这家曾被称为“扫地茅”的公司到底在筹划什么? 凤凰网科技 出品 作者|周遐观 编辑 | 董雨晴 气势汹汹杀入洗衣机市场,石头科技很快被现实打了一巴掌。 近期有报道显示,石头科技围绕洗衣机事业部开启了裁员调整,包括南京的产品项目组从12人裁至4人、供应链团队从40余人裁至10人左右、深圳出海业务团队仅留4人等;此外,产品部、供应链等多部门负责人也被免职。 有知情人士告诉凤凰网科技:“南京和深圳两地都裁了不少人,同事在上周去了他们(石头科技)处理与亚马逊相关业务的办公区,位置空置了好多。” 不仅是创新业务出师不利,石头科技内部也在酝酿一场人员震动。半月前,据雷峰网报道,石头科技清洁产品业务单元总裁及全球销售主管钱启杰已宣布离职,王恺靖接任,其此前是石头科技市场总监。 凤凰网科技了解到,钱启杰是昌敬一手提拔起来的老人。2024年之前,钱启杰的职务集中于供应链与制造管理。2024年,原全球销售负责人程飞离职后,钱启杰才临时接任全球销售负责人一职。 王恺靖则是技术出身,本科与研究生均毕业于北京航空航天大学,研究方向则是卫星惯导组合导航。也因此,其在行业的争议点在于,“搞技术的人搞市场,不符合其专业定位”。 就在今年4月,昌敬还清空了微博、抖音等平台内容。社交媒体曾是昌敬对外发声的重要窗口,曾多次发布极石汽车的相关内容。创始人套现近9亿,却“劝投资人耐心一点”的言论也出自昌敬抖音。 6月27日,石头科技正式向港交所递交了招股书,开启其自2020年成功登陆科创板后的二次上市动作。 站在二次上市的重要节骨眼上,核心销售岗位换帅、董事长清空社交媒体,这家曾被称为“扫地茅”的公司到底在筹划什么? 洗衣机事业部大动干戈裁员,消费者懵了 “避雷石头H1 Neo洗烘一体机,它有严重设计缺陷,烘干功能寿命非常短,不到半年就烘不干衣服了。”“新买的石头小型洗衣机,不到一个月就发生故障。”“石头分子筛洗烘一体机H1 Air,首次使用就出现异响。”最近,有不少消费者吐槽石头科技的洗衣机产品。黄先生在某社交平台表示,他在去年1月购买的石头科技洗烘一体机,已经让售后上门维修3次。 图|黄先生的吐槽帖 类似这种问题反馈在黑猫投诉上也非常多。“今年3月20号,下单的石头分子筛洗烘一体机H1 Air,4月18号安装,首次使用就出现脱水震动异响;6月5号换货后再次安装,17号又出现同样的异响,维修师傅说修不好。”消费者Susie不满地说道。 值得注意的是,此前出现故障,消费者还可申请售后上门服务;但眼下,一则突发消息传出——南京石头科技洗衣机项目组突遭“大瘦身”。虽然,作为新兴品牌,石头在国内的部分售后一直是外包给海信爱家的,但如此大动干戈的裁员还是加重了消费者的售后焦虑。“本来,他们的售后体验就不怎么好。我买的迷你洗烘一体机M1S,外观上有瑕疵申请换货,处理了3天、换了几十个客服都没解决。现在还要大面积裁员,真不知后面遇到问题,能处理成什么样?”网友“10月的皮卡丘”告诉凤凰网科技。 针对消费者们最关心的,大范围裁员是否会影响洗衣机等产品的售后这一问题,截至发稿,石头科技官方并未给出回应。 曾因董事长言论引发不满 昌敬曾是石头科技的灵魂人物,也是个连续创业者。 早在2010年,乔布斯带着IPhone4火遍全球时,昌敬就瞧准了智能手机“拍照”的机会,开发了一款名为“魔图”的App,帮助用户P图。因为切中了用户爱美和分享的需求,该App一经面世,便大获成功,一年时间就收获了1000万用户,随后又被百度以1200万美元的价格收购。 创业2年,才30岁出头就实现财务自由的昌敬,转头又将注意力放在了扫地机器人上。 2014年的扫地机器人,还被叫“智障机器人”,因为采用的是“碰撞技术”,只有在碰到墙壁、家具等障碍物时,才能转换方向,使用体验极差。昌敬也抓住了这个痛点,用一份PPT说服了雷军,拿到了3000万融资款,誓要研发出一款真正智能的扫地机器人。 2016年,石头作为原始设计商,为小米研发出第一款扫地机“米家智能扫地机器人”,售价1699元。因为比竞品多了激光雷达和路径规划的功能,该机器一上市就打爆了市场。 图|石头智能扫地机器人 2020年2月顺利登陆科创板后,为了快速实现商业化和规模增长,石头与小米进一步切割。上市当年,石头实现营收45.3 亿元,净利润 13.69 亿元。虽然,营收和净利增速较此前有所下降,但仍旧是一个好开端。 此后的4年时间里,石头的业绩节节攀升,营收在2024年突破百亿大关,达到了119.18亿元,净利润也来到了19.77亿元。特别是海外市场,表现颇为亮眼,占总营收的比例超过了50%,产品在全球170多个国家有售卖。 但转折点也在这一年到来,据石头科技披露的2024年财报,全年实现营收119.4亿,同比增长38.03%;实现净利润19.77亿,同比却下滑了3.64%。其中,Q3\Q4是最为严峻的两个季度,Q3石头科技营收25.91亿元(同比+11.9%),但净利润仅3.5亿元(同比-43.4%),创上市以来最大单季度跌幅,此后Q4净利下滑26.99%,2025年Q1下滑32.92%,形成持续性颓势。 投资人对石头科技的业绩表达了强烈的不满,更令他们气愤的是,石头科技业绩大跌的同时,昌敬却在抖音平台发布了众多关于其个人参加“沙漠越野”活动的视频,引发了投资者对其“不务正业”的讨伐。 对于这些质疑,昌敬专门发布视频称,铺天盖地的评论为其带来了一定的困扰。他希望持有石头科技股票的投资者可以“耐心一点”,现在是一个战略的转型期,特别是一个阵痛期,势必会带来公司的一些变化,这些变化都是为了以后更长远的发展。 但就是劝投资人耐心一点的昌敬,2023年至2024年间却多次减持石头股票,累计262.82万股(占公司总股本约2.06%),累计套现金额8.88亿元。 减持期间石头科技股价持续下行,较2021年巅峰时期下跌超60%。尽管投资者们多次呼吁昌敬回购股份,但后者并不为所动。 二次上市,谁还敢买单? 就在裁员一事闹得沸沸扬扬之际,石头科技要登陆港股的消息也引发关注。 6月27日,石头科技正式向港交所递交了招股书,这家被称作“扫地茅”的科技公司,正式开启了自2020年成功登陆科创板后的二次上市征程。 至于此次赴港上市的考量,石头科技表示是为了拓展融资渠道与优化资本结构,为公司提供更广阔的融资平台,满足其业务扩张对资金的大量需求;同时引入新的投资者,优化公司的资本结构,增强财务稳健性。 不仅海外市场面临渠道拓展压力,国内市场同样有着不小的研发难题。 随着扫地机器人赛道天花板逼近,石头选定的跨界赛道,是洗衣机领域的洗烘一体机。其研发的 “分子筛技术” ,原本有望解决传统洗衣机烘干损伤衣物、机身高度难控制的痛点。 图|使用“分子筛技术”的石头热泵洗烘套装 Z1 Max Ultra。图源|企业官网 但传统白电市场早有海尔、美的垄断产业链数十年,原材料采购成本低、零部件供应稳定,在供应链上有着天然优势。而石头主要采用轻资产的代工模式,在供应链议价能力和整合能力上相对薄弱,成本控制难度大。 其次在渠道建设上也并不完善。传统白电厂商,早就建立了覆盖全国乃至全球的销售渠道和售后服务网络。而石头,正如前文消费者们所经历的那样,此前他主要依赖线上渠道,在线下渠道和售后服务体系搭建上,与传统大厂相比都存在较大差距,难以通过服务打动消费者。 更重要的是,虽然石头在扫地机器人领域有较高知名度,但在洗衣机领域,知名度远不如传统白电品牌。 目前,石头科技在洗衣机领域显现出的是极低的投入产出比。 2024年智能硬件板块中的 “外购配件 / 整机” 分项金额为 2.49 亿元,同比增长197.57%;而主要用于满足洗衣机业务需求的分项金额为 2.29 亿元,同比却大增 406.47%,是前者的2倍还多。 另外在研发上,2024年投入了9.71亿元,同比增长 56.93%,其中洗衣机品类研发投入就达到了 4 亿元。另外在渠道上,石头也在全国20个省份开出了113 家门店。 如此多的努力反映在收益上,洗衣机业务仅收获毛利率33%,远低于主业扫地机器人的52%。今年1季度录得净利润2.67 亿元,较上年同期下降32.92%。 招股书显示,本次“上市募资主要用于国际化业务拓展,产品研发拓展及产品组合扩充,运营资金补充及公司一般业务用途等”。但从更现实的角度来看,这也是在业务增速放缓的背景下,重构资本故事,寻找新一轮现金输血。 不过,石头科技的港股梦能否如愿,还要经受多轮考验。此前已有大量投资者信心受挫,直言 “买石头股票让我有抑郁情绪了”。 虽然有观点认为,石头科技此次裁员本质是战略试错后的紧急纠偏。但在资本压力与市场竞争双重挤压下,通过斩断洗衣机业务以保全现金流,全力冲击港股上市的目标能否实现,仍然是未知数。 更重要的是,如何修复消费者信任、稳定核心团队及重塑资本市场信心,仍是其发展路上的关键挑战。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。