行业分类:
加载中...
头条分类:
加载中...
巴哈马暂停SpaceX猎鹰9号火箭未来着陆计划
IT之家 4 月 20 日消息,在 SpaceX 猎鹰 9 号火箭于 2 月 18 日首次在巴哈马附近成功着陆仅数月后,该国已暂停其未来的着陆计划,以待完成全面环境评估。据路透社报道,巴哈马政府高级官员于 4 月 15 日宣布,暂停 SpaceX 猎鹰 9 号火箭未来在该国的着陆,直至完成全面环境评估。 巴哈马通讯局局长拉特雷・拉明(Latrae Rahming)在社交媒体平台 X 上表示:“在全面环境评估完成之前,将不再授予任何进一步的许可。” 据IT之家了解,2 月 18 日,SpaceX 在执行星链(Starlink)卫星星座发射任务期间,首次在巴哈马附近成功着陆猎鹰 9 号火箭。当时,猎鹰 9 号火箭的第一级助推器返回地球,并降落在巴哈马海岸外大西洋海域的一艘 SpaceX 无人回收船上。 SpaceX 当时通过 X 平台表示:“我们与巴哈马的新着陆合作将使猎鹰 9 号能够发射到新的轨道轨迹。”据路透社报道,在此次飞行之后,巴哈马官员曾表示,他们预计今年将有多达 19 次 SpaceX 火箭着陆,但这些着陆需要获得监管机构的批准。 目前尚不清楚巴哈马暂停猎鹰 9 号火箭着陆是否与 SpaceX 星舰(Starship)飞行器 3 月 6 日的测试发射有关。当时,星舰飞行器在重返大气层时爆炸,碎片散落在了巴哈马部分地区。星舰是 SpaceX 开发的一种新型可重复使用的全不锈钢运载火箭,与该公司主力的猎鹰 9 号火箭不同。
无人机战争2.0,大疆的生态帝国,正被开源与低价撕开裂缝
近年来,全球无人机行业的竞争格局正发生剧烈变化。从消费级市场的激烈厮杀,到专业级领域的技术博弈,无人机行业正从“硬件比拼”迈向“生态殖民”的新阶段。 作为全球无人机领域的绝对霸主,大疆(DJI)凭借技术领先、产品线全面、生态成熟等优势,长期占据全球70%以上的市场份额。然而,随着低端市场竞争加剧、政策限制加剧以及隐私争议的浮现,这家技术巨头正面临前所未有的挑战。 大疆无人机的“生态帝国” 2024年大疆交出了一份“强者恒强”的成绩单:数据显示,大疆长期占据全球70%-85%的份额,尤其在北美、欧洲、亚洲等主要市场处于绝对垄断地位。行业应用市场(农业、测绘、安防等):大疆市场份额超过50%,领先竞争对手如Autel、Parrot等。 在国内的消费级无人机市场上,大疆更是占据9成以上份额。即使在乡镇这样的下沉市场都能看到大疆的销售门店,可见大疆在农业无人机方面的霸主地位,大疆农业无人机不仅内销国内市场,还畅销海外市场,截至2024年,大疆农业无人机的出口数量相比2017年增长了32倍。 凭借优异的表现,大疆凭借1250亿元的估值上榜胡润研究院发布的“2023年全球独角兽”排行榜,在中国企业中排名第九。表面上看,大疆的技术优势和生态体系仍是其核心竞争力,但深入分析其商业模式和市场表现,却能发现隐藏的危机。 飞控与影像系统的“护城河” 大疆的技术优势毋庸置疑。其飞控系统(FlightAutonomy)通过多传感器融合和算法优化,实现了厘米级的飞行精度,成为行业标杆。影像系统方面,大疆的 Hasselblad 合作相机和智能算法,让其产品在画质和稳定性上遥遥领先。然而,这种技术优势正在被“开源化”趋势侵蚀。以道高(DJI Rival)为代表的新兴品牌,通过开源飞控系统和低成本传感器,逐步缩小与大疆的技术差距。 从消费级到专业级的“全场景布局” 大疆的产品线覆盖了从消费级(如 Mini 系列)到专业级(如 Matrice 系列)的全场景需求。其 Mini 3 Pro 以轻量化设计和长续航赢得年轻用户青睐,而 Matrice 300 则在工业巡检、农业植保等领域占据主导地位。但值得注意的是,低端市场的性价比竞争正在侵蚀大疆的份额。以零度智控(ZeroTech)为代表的国产品牌,通过“1000元级无人机+云端服务”的模式,迅速抢占入门级市场。 全球市场份额与售后服务:双刃剑效应 大疆在全球市场的统治地位毋庸置疑。其在北美市场占有率达68%,在欧洲市场达62%,在亚太市场更是高达75%。其售后服务网络覆盖全球100多个国家,拥有超过3000个认证维修点。但这种“全球化扩张”也带来了高昂的运营成本。2023年,大疆的售后服务支出同比增长22%,而其研发支出仅增长8%。 行业竞争:从技术博弈到生态殖民 在无人机行业从单一硬件性能竞争向全栈式生态体系对抗转型的关键节点,大疆正遭遇双线承压的复杂局面。 一方面,以道高为代表的开源平台正通过"技术平权"策略侵蚀专业级市场,其低成本传感器融合方案与社区驱动的算法迭代,正逐步瓦解大疆的飞控技术壁垒;另一方面,零度智控等性价比品牌凭借"硬件解绑+云端赋能"模式,在消费级市场以价格战重构用户入口。 这种高低两端的生态夹击,迫使大疆必须在维持技术溢价与开放生态之间找到新的平衡点,否则其构建多年的"硬件+软件+服务"闭环体系,将面临被解构重组的系统性风险。 大疆与竞品关键指标对比 品牌 代表机型 飞控技术 图传距离(公里) 价格(人民币) 开发者生态 政策适应性 大疆 Mavic 3 Pro FlightAutonomy 15 13,888-21,888 开放SDK 中等 Autel EVO Lite+ StarLink 12 9,999-15,999 有限开放 高 Skydio X2 AI避障 6 98,000-150,000 封闭 低 哈博森 Zino Mini Pro GPS+视觉 10 2,999-4,999 无 中等 技术路线分化 Skydio押注AI自主飞行,其X2无人机可绕过复杂障碍物,但牺牲了航拍画质;Autel则主打合规性,通过FAA认证抢占北美市场。大疆需在性能与合规间寻找平衡。 新兴市场争夺 在东南亚和非洲,本土品牌如印度ideaForge以本地化服务切入,提供“免许可飞行套餐”。大疆虽在非洲市占率达50%,但其标准化产品难以满足区域定制需求。 大疆的“困局”:高端与低端的双重夹击 高端产品价格高企:性价比短板显现 尽管大疆在技术和生态上占据优势,但其商业模式正面临“高端与低端”的双重夹击。大疆的高端产品(如 Matrice 300、Inspire 2)价格普遍在3万元以上,远高于行业平均水平。相比之下,道高推出的 Pro 系列无人机,以“2万元级价格+90%性能”迅速抢占专业市场。 政策限制加剧:禁飞区与隐私争议 随着无人机的普及,各国对无人机的监管力度不断加大。美国联邦航空管理局(FAA)要求所有无人机必须接入国家级空域管理系统,而欧盟则对隐私保护提出更高要求。大疆的部分机型因无法满足这些要求,在多个市场遭遇禁售。 低端市场竞争加剧:性价比品牌的冲击 在消费级市场,大疆的 Mini 系列虽然仍是销量冠军,但其市场份额正被性价比品牌蚕食。零度智控推出的 Lite 系列无人机,以“999元起+4K拍摄”配置,迅速抢占入门级市场。 隐私争议:公众形象的潜在威胁 隐私问题正在成为大疆的隐形炸弹。2023年,美国国防部因“数据安全问题”禁止使用大疆无人机,这一事件引发全球范围的连锁反应。尽管大疆随后推出了“本地数据模式”,但其品牌形象已受到一定影响。 无人机战争下半场:从“硬件比拼”到“生态殖民” 大疆与新兴品牌的较量,本质是无人机行业从“硬件比拼”向“生态殖民”的范式转移。这场竞争不仅关乎技术路线选择,更折射出全球无人机产业在开放与封闭、效率与安全之间的深层博弈。 大疆坚持“硬件+软件垂直整合”策略,试图通过技术垄断构建护城河。然而,其2023年研发支出同比仅增长8%的数据,暴露出闭源模式“高投入、低回报”的困境。相比之下,开源平台 ArduPilot 通过社区贡献代码,支持第三方配件和软件,形成了“越开放越强大”的飞轮效应。 在专业级市场,道高通过“开源+通用化”模式快速崛起,其 Pro 系列无人机在工业巡检领域的市占率达32%,直逼大疆的45%。在消费级市场,零度智控的 Lite 系列以“1B参数小模型+行业微调”策略,以1/3成本渗透中小场景。 结语:无人机的终点是生态,而非产品 大疆的霸主地位源于技术、产品和生态的三重壁垒,但价格压力、政策风险与新兴品牌的“农村包围城市”策略,正不断冲击其护城河。未来的竞争,将不再局限于飞行时长或像素高低,而是看谁能构建更包容的开发者生态、更灵活的政策适应能力,以及更可持续的商业模式。对于大疆而言,坚守技术创新与开放合作的双轨战略,或许是穿越周期的最佳答案。
工程师又替AI背锅?Cursor限制多设备登陆引众怒,竞对趁机下场抢用户!
登陆多台设备被踢出, Cursor 引众怒 前几日,不少 Cursor 用户在 Hacker News、Reddit 等平台上表示,人工智能 IDE 工具 Cursor 突然出现一个诡异现象:当用户从多台设备登录时会被强制踢出。比如正在台式机上工作,切换到笔记本电脑时会话就会毫无预警地中断——没有提示、没有通知,直接消失。 根据 Cursor 官方提供的信息,一个账户通常是可以同时在多个设备上登录的。这意味着,无论你在家里还是办公室,甚至是在外出旅行时,都可以无缝切换设备,享受 Cursor 带来的便利。 Cursor 账户的设备登录限制是多少?通常情况下,一个账户支持同时在多个设备上登录,但具体数量可能会因服务政策调整而有所不同。 根据最新的官方说明,一个 Cursor 账户最多支持同时在 5 台设备上登录。 因此此事一出后,用户们自然认为这是官方新政策。于是纷纷联系支持团队求证。 问题从这里开始失控:Cursor 的客服邮箱实际上是由 AI 自动回复的,但这个“支持 AI”向所有用户坚称“根据最新登录政策,此现象属于正常行为”。 讽刺的是,这个完全由 AI 虚构的“政策声明”被当作了官方回应(毕竟谁能想到自家支持系统会造假呢?)。 几小时内社区爆发抗议,至少有数十名用户立即取消订阅——对开发者而言,多设备工作流是刚需,如此重大的变更竟没有任何公告或更新日志。 直到用户互相核对时才发现可能是个误会,但为时已晚:相关 Reddit 主帖被火速锁定删除。官方始终未给出正式说明,只剩沉默。 随着事件发酵,Cursor 官方坐不住了,一位 Cursor 官方发言人在 Hacker News 这则热帖中回复称只是机器人犯下的错误,不是 Cursor 官方的新政策。 该发言人称: “我们没有这样的政策。你当然可以在多台机器上使用 Cursor。很遗憾,这是来自一线 AI 支持机器人的错误回复。我们确实推出了一项改进,以提高会话的安全性,并且正在调查这是否导致了会话失效的问题。我们也提供了一个 UI,用于在 cursor.com/settings 查看活动会话。对于由此造成的混乱,我们深表歉意。” 最终的真相也的确如此:这根本不是什么新政策,只是后端会话管理的技术故障,加上支持 AI 的幻觉式回应,二者叠加造成的灾难性误会。 即使是个乌龙,但用户流失已成定局。有用户表示,Cursor 已经不行了, Claude Code、Augment 和 Aider 等都比 Cursor 更好。 “我发现 Cursor作为 IDE 的价值越来越低。它曾经一度领先,但似乎迷失了方向,陷入了困境。文档功能似乎无法正常工作。Max功能调用了太多工具。 他们不再有任何创新,只有糟糕的计费方式。我想这就是当你开始进行大规模融资时会发生的情况。收入证明的压力很大。现在感觉 Cursor 和 Windsurf 都有点不行了。 Jetbrains有 Junie,和它们一样好用。Roo Code 的更新比 Cline更快更好。我敢说 Copilot 也看到了曙光。我实在想不出还有什么理由再为 Cursor 付费了。现在还有 Claude Code、Augment和Aider,而且能用的替代方案越来越多了。” 这种观点不在少数,也有其他用户表示,Cursor 索取太多,而给予的太少。 我退出了,就是这样,他们索取的太多,要求的太多,而给予的太少。我们的核心功能每天都在被剥夺。 再见,伙计们。我建议你们趁现在赶紧下船。 Augment Code 是更好的选择? 于是,在众多 Cursor 替代方案中,用户们更加推荐 Augment Code。 Augment 是面向团队的开发者 AI,可作为 IDE 扩展使用,从 VS Code 或 JetBrains(IntelliJ、WebStorm、PyCharm 等) 开始。Augment 可用于: 聊天:询问有关代码库的问题,获取查找错误的帮助,或开始制定新功能的规范。 代码完成:超快的内联代码建议让您可以通过使用内部 API、编写测试或使用第三方 SDK 来完成。 建议的修改:更改一个文件通常会导致整个存储库中一系列相关的更改。建议的修改会查找并提出相关的更改,帮助您在创纪录的时间内完成任务。早期的 Augment 用户报告称,他们只需将建议的修改串联起来,就能几乎完整地编写一些 PR。 Slack 中的 Augment :一个始终可用的 Slackbot,即使团队离线也能解答用户的问题。深入细致地讨论系统的工作原理,让对话保持畅通无阻。在对话中使用 Augment 可以节省宝贵的开发周期,而无需占用开发资源。 Augment Code 成立于 2022 年,截至目前已累计融资 2.7 亿美元,其中包括 2024 年 4 月的 2.27 亿美元 B 轮融资,当前估值高达 9.77 亿美元。该公司的投资方包括 Sutter Hill Ventures、Index Ventures、Innovation Endeavors(由前谷歌首席执行官 Eric Schmidt 领导)、Lightspeed Venture Partners 以及 Meritech Capital。 Augment Code 的创始人是 Igor Ostrovsky,Igor 于 2021 年加入 Sutter Hill Ventures,担任驻地工程师,一头扎进生成式人工智能领域,并最终创立了 Augment Code。在此之前,他曾担任 Pure Storage 的首席架构师,领导 FlashBlade 的技术开发,使其实现了 20 亿美元的终身销售额。他之前的经历包括在微软任职 6 年,并于 2007 年入围 ACM ICPC 世界总决赛。 Igor Ostrovsky Guy Gur-Ari Augment Code 另一位创始人是 Guy Gur-Ari,Guy 曾在谷歌工作,领导一个专注于理解和改进深度学习系统的研究团队。之后,他与 Igor 共同创立了 Augment Code。他拥有魏茨曼科学研究所的理论物理学博士学位。 随着技术的演进,Augment Code 正在将更多注意力放在 AI 智能体上。 在前不久,Augment Code 首度发布 AI 智能体,以 70% 胜率超越 GitHub Copilot 并创下 SWE-bench 得分纪录。 AI 编码助手初创厂商 Augment Code 日前发布其全新“Augment Agent”技术,希望在简单的代码生成之外,尝试解决大型软件工程项目面临的复杂性难题。该公司宣称,其方案与其他 AI 编码工具截然不同,将专注于帮助开发者导航并跨越多个代码库执行修改,轻松玩转拥有数百万行代码的大规模成熟软件项目。 该公司还宣布,通过将 Anthropic 的 Claude Sonnet 3.7 与 OpenAI 的 o1 推理模型相结合,其最新技术已经在 AI 编码能力的行业基准 SWE-bench 中取得了迄今为止的最高得分。 Augment Code 公司 CEO Scott Dietzen 在接受采访时表示,“AI 编码无疑是一个热门领域,但大多数探索都集中在所谓「从 0 到 1」或者叫「氛围编程」方面——即从头开始生成一款软件。但我们的目标是解决软件工程学科中的另一个常见难题,即维护大型复杂系统。这些代码库经过了多年发展,且往往由数百名开发人员协同完成。” Augment 的上下文引擎 如何处理数百万行代码库 据该公司介绍,Augment Agent 的独特之处在于它能够理解海量代码库中的上下文。该智能体拥有可容纳 20 万 token 的上下文窗口,远远超过了大多数竞争对手。 Dietzen 解释道,“包括 Augment 自身在内,任何 AI 系统都面临着同一个挑战:在处理包含数造成行代码的大型系统时——其实这在重要软件应用当中挺常见的——根本无法将所有代码都作为上下文传递给如今的大语言模型。我们已经训练自己的 AI 模型执行复杂的实时采样,希望精确识别代码库中的正确子集、进而保证智能体可以有效工作。” 这种方法与其他竞争对手形成了鲜明对比。其他厂商要么无法处理大规模代码库,要么需要开发人员手动拼凑相关上下文。 Augment 的另一大优势在于跨团队实时同步代码变更。Dietzen 介绍称,“我们的大多数竞争对手仍在使用过时的代码库版本。假设你我在同一个代码分支上协作,那么每当我提交了变更,你自然希望自己的 AI 能够像人一样立即感知到变化。也正是因为这样,我们才决定让每位用户的代码视图都能实时同步。” 该公司报告称,在争夺企业客户的青睐方面,其方案与 GitHub Copilot 之间的竞争胜率已经达到 70%。 面向大型开发团队的 企业级安全与工具集成 Augment Agent 还包含一项“记忆”功能,能够从开发者的交互当中学习,进而随时间推移更好地匹配个人编码风格与操作偏好。 Dietzen 解释称,“我们希望这款智能体可以自主实现一部分功能,就是说大家可以给它们分配任务,也可以随时干预。记忆是模型概括使用者意图的工具,例如自动捕捉当前的情境、希望采取的处置路径,而不只是简单重复之前采取过的处置路径。” Dietzen 强调,与“编码是纯粹的数学逻辑、不涉及风格要素”的观点相反,很多开发者其实非常关心自己代码在美观度和结构明确性方面的情况。 他指出,“编码肯定有数理逻辑的一面,但同时也是一门艺术。我们很多开发人员都希望能专注于代码开,例如使用 Augment 的智能体编写所有代码;但也有一大批工程师更关注最终代码的呈现,并对此有着强烈的表达欲与诉求。” 出于对知识产权保护和安全性的关注,企业近来在采用 AI 编码工具的速度上有所放缓。Augment 致力于通过强大的安全架构与企业级集成来解决这些问题。 Dietzen 提到,“智能体必须值得信赖。既然要赋予它们这等程度的自主权,就一定要确保它们不会造成任何损害。我们是首家提供不同级别 SOC 合规性保证,并配合全部相关渗透测试以强化解决方案的厂商。” 根据 Dietzen 的介绍,该公司还与 GitHub、Linear、Jira、Notion、Google Search 以及 Slack 等开发者工具建立了集成。与其他在客户端上实现集成的竞争厂商不同,Augment 选择在云端处理这方面任务。Dietzen 表示这样的设计使得开发者“能够在更大规模的团队中轻松共享并保持一致”。 Augment Agent 现已面向 VS Code 用户正式发布,JetBrains 用户也可提前预览。该公司还保持着与微软生态系统的全面兼容,这与从 VS Code 中分叉而来的竞争对手 Cursor 形成了鲜明对比。 Dietzen 解释道,“某种程度上讲,选择 Cursor 的客户相当于退出了微软生态系统。他们无法使用微软提供的、用于访问其环境的所有标准 VS Code 插件。而我们则保持则与 VS Code 以及微软生态系统的 100% 兼容性。” 人类工程师与 AI 助手间的 合作关系正不断发展 尽管 AI 编程辅助技术取得了长足进步,但 Dietzen 认为在可预见的未来,人类软件工程师仍将至关重要。 在他看来,“目前关于软件工程这门学科还有没有前途的讨论,似乎走上了一条歧路。软件工程学科在构建和开发这类大型代码库方面仍然有着不可替代的重要地位,未来几年仍然需要人类洞察力的介入和加持。” 然而,他也展望了未来 AI 将在软件开发领域所扮演的更加积极主动的角色:“我们最终能够利用 AI 实现真正令人兴奋的目标,包括 AI 将深入评估代码库质量、提出代码库改进意见,生成有助于软件项目更加安全、强大、易用且健壮的宝贵建议。” Augment Code 目前的客户包括 Webflow、Pigment、Lemonade、ddn、Datastax 以及 GoFundMe。其专业版起价为每用户每月 30 美元,企业版起价为每活跃用户每月 60 美元,同时提供免费套餐。 Augment Agent 的发布,恰逢越来越多的企业正寻求运用 AI 技术提高开发者生产力、同时保持其软件质量。随着各组织正努力维护并改进复杂的软件系统,能够理解大型代码库中细微差别的工具无疑将受到那些寻求工程团队影响力最大化的技术领导者们的关注与青睐。 Dietzen 最后总结道,“我希望我们能够真正加大对人类软件工程学科的投入,就如同加大对机器本身的投入一样。这样我们才能开发出数量更多、质量更高且更加优秀的软件成果。我认为通过消除所有这些阻碍优秀软件开发的障碍,我们将会为全人类释放出巨大的生产力价值。”
奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来
作者 | Steve Rosenbaum 译者 | 核子可乐 策划 | 褚杏娟 “山姆,考虑到你所参与创造的是一项将要重塑我们整个物种命运的技术,那么你做这件事的伦理依据和权威性来源是什么?如果你搞错了,又打算如何承担这份责任?” 这个悬而未决的问题面了本届温哥华 TED 2025 大会的一根利刺,亦是 TED 创始人克里斯·安德森向 ChatGPT 缔造者山姆·奥特曼发出的终极一问。可讽刺的是,这个问题并非来自安德森本人,而是由 OpenAI 家模型的竞品 Claude 所提出。现场的紧张感与焦灼氛围由此可见一斑。 奥特曼的回应则是,“咱们聊了半个小时,你问的一直都是这类问题。” 这番回应巧妙地转移了对话。此次对话犀利地指向我们拥抱 AI 未来的各项弊端——那些被提出、被承认,之后又被巧妙回避的棘手难题。 看着这场问责大戏在舞台上推进,观众们深深被它揭示出的 AI 时代权力形态所震撼。这位掌控着周活用户高达 5 亿、规模甚至超过北美总人口的科技主宰,竟然无法直接回答这份权力来自哪里。 “这是无可避免的现实” 奥特曼平静地宣称,“这是无可避免的现实。就像一项全世界都已知晓的基础物理发现,必将成为真实世界的一部分。”他的证据仿佛在描述明天太阳还会照样升起。“我们必须谨慎地予以接纳,但要注意消除恐惧,否则我们会被其他借 AI 之力而变得更强之人所击败。” 而他话语中的宿命论也直接终结了这个意义之问。既然一切无可避免,那又何必还要寻根问底?而如果抗拒 AI 技术意味着被“击败”,那我们自然也就别无选择。 这种思维方式——即 AI 的飞速发展并非出于个别人的选择,而是自然规律的体现——巧妙免除了奥特曼及其同行在技术开发期间逐渐脱离普通民众的现实责任。 但安德森并没有就此放过他。“问题在于,我一方面认为可能需要安全机构的介入,但另一方面却意识到机身本身恰恰就是风险的来源”,同时强调奥特曼在监管问题上存在立场冲突。 安德森引用了托尔金在《魔戒》中关于腐败的比喻,认为这个例子如今在硅谷正真实发生,“埃隆·马斯克有说法,认为你已经被力量之戒给腐蚀了。看到科技企业的 CEO 们权力越来越大、掌握的财富越来越丰厚,每个人都在想,他们真能驾驭这一切吗?还是说,他们已经被这股力量所吞噬?” 奥特曼的回答意味深长。他并没有直接为自己开脱,而是将问题抛回给了安德森:“那你觉得我做得怎么样?特别是跟那些掌握了巨大权力,而且行事风格一变再变的 CEO 相比?” 这番话巧妙地扭转了局面,强迫安德森在直接批评对方和就此罢休之间二选其一。安德森则选择了一条中间路线,承认奥特曼个人的行为还算得体,但同时也强调了更大的担忧:“我认为人们最担心的是 OpenAI 公开转向盈利模式。有些觉得这代表着你已经被欲望侵蚀了,催动你在潜在经济效益被耗尽之前努力榨出每一分收益。” 这番对话也揭示出 AI 时代下我们普通人身处的困境:被迫信任科技领袖的个人品质,但他们的企业架构和激励机制却越来越倾向于赤裸裸地追求利润和权力。 “它会彻底了解你” 在这段对话当中,最令人毛骨悚然的桥段也许来自奥特曼对于 AI 未来愿景的表述:“它将陪伴人的一生,观察你与 ChatGPT 的所有对话。 也许有一天,如果大家愿意,AI 会随时倾听你的声音、观察你的一举一动。它会彻底了解你,成为你的延伸、你的伙伴,成为努力帮助你做得更好、发掘所有潜能的存在。” 安德森将此比作电影《她》中的情节,片中 AI 会阅读主角的所有电子邮件、代表他做出改变人生的行动。奥特曼并不反对这样的联想。 奥特曼轻描淡写地描述了未来 AI 系统监控我们的具体方式——“观察你的一举一动”,这暴露了其观念与大多数人抗拒持续监控这一现实的根本性脱节。在这个对于技术意义愈发抵触的新时代,“如果大家愿意”这个前提已经显得空洞而无力。 父母悖论 安德森问起成为人父是否改变了奥特曼对于潜在风险的观点,并提出了一个思维实验:如果按下一个按钮,你的孩子就能拥有精彩的人生,但同时有着 10% 的毁灭概率,你会怎么选择?奥特曼立即回应,“问题是并没有这样的选项。当然,如果把场景换到工作这边来,那我的答案是,应该不会按。” 个人风险承受能力与专业风险接受能力之间的脱节,体现的正是 AI 开发中最核心的认知失调。奥特曼绝不会接受自己的孩子承受 10% 的毁灭风险,但 OpenAI 的工作却在给全球数十亿儿童塑造一个充满未知的未来。 正如他所说,“我以前真的很在意这些问题,比如不要搞到世界毁灭。现在我也仍然在意,跟有没有孩子并无关系。” 但在意归在意,他也从来没有放慢过推进的脚步…… 开源冲突 奥特曼自豪地宣布,“我们将要开发一套极其强大的开源模型。也许在座的某些人会以你我不喜欢的方式加以使用。” 这种对于强大 AI 模型可能造成的危害表现出的漫不经心态度,与奥特曼之前对于安全的强调和口头认可形成了鲜明对比。结合科技行业,这就相当于“有些会可能滥用我们即将发布的核发射代码,但我们的创新成果就是这个样子。” 安德森指出了这种矛盾,并询问 OpenAI 内部如何为防范危险 AI 能力被公开而划定“红线”。奥特曼提到他们拥有“准备框架”,但没有具体说明——唯一可以肯定的,就是公众对于这套框架的定义和执行都没有任何发言权。 “关于 AGI,不同的人在不同的时间点上会有不同的定义” 在被问及如何定义通用人工智能(AGI)时,奥特曼透露了一个惊人的现实:“如果让 10 位 OpenAI 研究人员坐在一起讨论这个定义,得到的答案可能都不止 10 个。” 安德森一针见血地指出了问题所在:“但这很令人担忧,不是吗?毕竟这是我们的使命所在。我们希望率先实现 AGI、承诺会安全达成目标,但我们甚至一直没能找到能清晰描述这个目标的定义。” 这段对话暴露出了 OpenAI 的核心矛盾:他们正在追求一个定义不明确、甚至可能给整个人类族群带来灭顶之灾的目标,但同时又向公众保证会“安全”达成。 接下来,我们该何去何从? 最发人深省的一点在于,安德森建议召开一场小型专家峰会,为全球制定 AI 安全标准。奥特曼又是怎么回答的? “当然,但我更关心的问题是,数亿用户作为整体到底想要什么。” 这听起来非常民主,但相信很多人都能感受到其中的误导性。用户“想要”的只能是明确给出的选项,而非充满主观发挥空间的随机路线。人们也会“想要”抽烟,但直到几十年后才慢慢意识到这对健康造成的严重摧残。 现实在于,我们无法通过投票来决定奥特曼和他的同事们应不应该做出这些重大决定,毕竟他们已经自封为人类技术命运的负责人。 安德森就此评论道,“我不知道该说什么了。非要评论的话,我觉得你让我心生敬畏,毕竟你打造出了世界上最令人惊叹的成果之一。” 相信更多朋友感受到的会是恐惧。不是恐惧奥特曼本人,毕竟他看起来真诚且睿智,始终希望做好正确的事;真正令人恐惧的是这套制度,它允许少数技术专家做出事关全球的决策,他们贸然实施着缺少法理性来源的行动,但行动的后果却由投资者和全体用户来承担。 所以这场对话中最重要的问题始终悬而未决:山姆·奥特曼或者其他什么人重塑人类命运的伦理依据和权威性来源是什么?这种法理来源的缺失令人不安,但我们却已经在懵懂之间走了很远、走到了现在。 附:奥特曼观点总结 AI 对于就业和创意产业的影响 AI 对就业的影响:山姆总结称,关于 AI 对就业的冲击,人们普遍抱有两种观点——要么担心自己被取代,要么只是将 AI 视为一种新型工具,在提高市场对于产出的期待的同时也赋予了从业者们更强大的能力,帮助他们取得愈发精彩的成果。 创意作品、知识产权以及向创作者付费:山姆表示,人类的创造力至关重要,并承认目前在知识产权、合理使用与知情同意等方面存在挑战。他提出了新的商业模式,希望让那些在风格层面启发了 AI 生成内容的创作者们能够拿到公平的回报。 开源与 AI 竞赛 OpenAI 对于开源和 DeepSeek 的态度:山姆承认 OpenAI 拥抱开源较晚,但证实公司目前正在开发一款强大且领先的开源模型。他还提到,尽管不可避免会遭到一定滥用,但开源模型确实意义重大。 AI 已经掀起一波发展竞赛:山姆并不认可 AI 已经沦为不负责任竞赛的说法,他声称大多数 AI 厂商都真心关注安全问题,并强调即使是在竞争压力之下,OpenAI 也始终在以谨慎态度规划并处理安全问题。 打造卓越 AI 产品 专注于产品而非模型原始能力:山姆指出,未来会涌现出大量先进的 AI 模型,但 OpenAI 一直优先考虑创造最佳用户体验,并强调实现个人记忆等功能,尝试随时间推移愈发了解用户以保证 AI 更加实用。 预期的 AI 突破 AI 驱动下的科学发现:山姆表示,下一个重大突破将来自 AI 在科学领域的应用,包括在对抗疾病方面的重大进展,并有可能发现室温超导体等新材料。但他同时指出,物理学理论方面的突破则可能需要更长时间。 自主软件开发:山姆提到,由自主软件编写智能体驱动的软件工程领域,也即将迎来另一个重大飞跃。 对于 AI 安全的担忧 强大 AI 带来的严重风险:山姆公开表达了对于 AI 滥用的高度担忧,例如生物恐怖主义、网络安全威胁以及 AI 可能获得人类无法控制的自我改进能力。 OpenAI 的安全准备框架:山姆描述了 OpenAI 在发布 AI 模型之前用于系统识别的结构化方法与风险管理机制,但也承认公司内部对于具体安全策略仍经常发生分歧。 公众焦虑与生存风险:山姆认为公众对于 AI 生存风险的担忧是合理的,但认为从古至今,社会一直是通过经验加谨慎调整、而非排斥和恐惧来适应新的技术。 定义和监管高级 AI 定义通用人工智能(AGI)与 ChatGPT 的当前能力:山姆澄清称,ChatGPT 并不能算 AGI,因为它还无法自主学习、自我改进、发现新的科学知识或者独立执行复杂的在线任务。但他承认,随着 AI 变得越来越智能,其具体定义也将有所不同。 AI 监管与许可:山姆改变了之前的立场,由支持政府就高级 AI 发布许可转为推荐使用外部安全测试框架,以确保强大的 AI 模型在公开发布前接受认真评估。 个人观点、批评与责任 公众对于山姆本人和 OpenAI 的看法:山姆承认 OpenAI 从完全开放转向部分商业化的决策在公众中激起了一定非议,同时坦言策略转变也是无奈之举,但重申了承诺,即以安全方式发布强大 AI 成果。 对于权力和腐败的批评:山姆否认自己被 AI 成功所带来的财富或者权力所腐蚀,并表示他自认为并没有改变,强调 OpenAI 的战略转型是统筹 AI 发展的合理举措。 身为人父对于山姆思维的影响:山姆分享道,身为人父对他个人产生了深远的影响。他不觉得自己从事的 AI 工作会给孩子未来带来风险,但承认自己感受到了更大的责任,希望能给孩子塑造一个更积极的未来环境。 关于 AI 的社会决策 广泛收集用户反馈还是依托精英峰会:山姆更倾向于从 OpenAI 的数亿用户处收集 AI 安全偏好,而非仅仅依赖小型专家峰会。这表明 AI 自身有助于更准确地反映公众的价值观和偏好。 对于下一代人的展望 山姆后代将迎来的世界:山姆描述了一种新的未来,即孩子们打出生起就在接触经人类更聪明的 AI。他 还展望了持续创新、资源愈发丰富且无缝融入日常生活的智能 AI 新形态,期待未来几代人清晰意识到人类局限性的终结并坦然接受这样的现实。 相关链接: https://x.com/btibor91/status/1910815598004535512 https://stevenrosenbaum.medium.com/sam-altmans-god-complex-ted-s-chris-anderson-asks-who-gave-him-the-keys-to-humanity-s-future-97276e8d38ae
英伟达CEO黄仁勋访华,都不穿皮衣了,放低姿态
英伟达CEO黄仁勋于2025年4月17日开始访华,新闻里的画面上,老黄居然穿起了西装,可见他有多重视此次访华,也或许是因为火热的中国市场和贸易战,让老黄不得不换装了。 左:黄仁勋,右:中国贸促会会长任鸿斌 官方消息显示,黄仁勋本次访华是应中国贸促会的邀请。随后有消息称,黄仁勋会见了政府高层,还会见了英伟达的客户们,两天的时间非常密集,但后续报道并未证实他与deepseek的创始人梁文锋会面。 老黄为何突然访华? 除了贸促会的邀请,黄仁勋自己肯定也想尽快来华,还不是因为特朗普贸易战给闹得,黄仁勋真的急了。当然,也有DeepSeek的原因。 英伟达向美国证券交易委员会提交的文件显示,美国政府通知英伟达,向中国等国家出口 H20 需要申请许可,将 “无限期” 生效。英伟达称,将在截至 4月27 日的第一财季中计入约 55 亿美元相关费用。H20本是专为中国市场设计的合规芯片,此次禁令直接冲击英伟达在华业务(2024年中国区营收占全球15.4%,达120亿美元)。 不仅是美国限制出口,中国进口芯片也会额外增加关税,这对英伟达无疑是雪上加霜。 要知道,按照金额算,中国第一大进口商品品类就是集成电路(芯片)。根据2024年中国海关及相关行业数据,中国集成电路(芯片)进口总额为3856亿美元(约合2.8万亿元人民币),同比增长9.5%至10.4%。所以,中国市场无疑是高端芯片厂商的最重要的市场。 与此同时,DeepSeek这几个月的横空出世都让资本市场明白,通用大模型训练主要靠GPU芯片的叙事故事没有那么大想象空间,在算法结构和数据传输上优化也可以降低对GPU芯片的依赖度,特别是对英伟达的GPU芯片。 客观说,DeepSeek的早期训练确实依赖英伟达芯片,但正是因为禁令,在算力不足的情况下,倒逼了DeepSeek在算法,数据传输/存储等领域进行优化,最后反倒是影响了英伟达的股价。 同时,华为昇腾910C等国产芯片在训练效率上取得突破,中国科技企业采购本土AI芯片的比例从2023年的12%激增至37%。黄仁勋坦言,若无法持续为中国定制产品,英伟达将失去定义行业标准的机会。 如果从1月份英伟达股价最高点150+美元看,目前英伟达市值已经跌去了1/3,上万亿美元,期间既有 DeepSeek/华为对英伟达算力叙事的影响,也受特朗普的关税政策波及。 因此,黄仁勋不得不访华,第一,是向中方和中国市场示好,第二,与中国潜在的大客户商讨如何为中国设计下一代AI芯片。 英伟达的谈判猜想 在目前中美政策双重限制下,黄仁勋肯定想拉上中国合作伙伴联合设计符合美国出口限制的芯片,双方可能探索联合开发低算力密度芯片(如4.8Tflops/mm)或共建开源框架,优化软硬件协同设计,为中国客户提供美国政策限制内最好的芯片技术。 但同时,这款芯片必须有中国公司参与研发设计,否则不管在全球哪里生产,都会作为美国公司芯片在进口时加征高额关税。 这就意味着,英伟达很可能会拉上某家企业一起研发设计新的芯片,并与英伟达在中国的研发团队合作,与中国公司的大模型计算框架做深度融合,打造全球独一无二的闭环生态。 而与生态链深度合作,确实是老黄的一大优势和能力,当年就是深度了解游戏产业/人工智能产业,也深度合作台积电,才让英伟达飞黄腾达的。 对于中国来说,就看英伟达能否提供更多的研发投入,分享更多知识产权,甚至在高端制程芯片制造领域拉上重要伙伴。 此次老黄的访华和会面折射出中美技术战的复杂态势——封锁与创新并存,合作与博弈交织。 同时,黄仁勋这样的身份,确实是中美贸易前线上非常特殊和关键的人物,他是最有动力促成中美之间贸易谈判的人物,会不会提供给大家更多的想象空间呢? 当然,以上均为个人猜测,不作为投资参考,让我们期待对双方更有利的合作方案。
杀疯了!Gemini 2.5狂飙“高尔顿板”测试,编码横扫所有OpenAI模型
新智元报道 编辑:犀牛 【新智元导读】谷歌的AI编码能力正在掀起一场风暴!在高尔顿板测试中,Gemini 2.5 Flash以惊艳表现击败OpenAI多款模型,连谷歌首席科学家Jeff Dean都为其点赞。谷歌新模型「dayhush」已在网页开发领域崭露头角,性能超越Gemini 2.5 Pro,被网友称为「AI编码的地震性突破」。 编码能力一直是顶尖模型宣传的重点。 尤其是,AI大神Karpathy带火vibe coding(氛围编程)概念后,普通人也可以通过AI体验到编程的乐趣。 游戏、网页、3D建模,再加上最近爆火的MCP协议,大家玩得不亦乐乎。 不只是娱乐,很多AI专家、公司CEO、行业分析师甚至认为,AI可能会在2-3年内取代绝大部分的程序员。 AI编程真的有那么强吗?哪家的效果更好? 就在最近,网友RameshR通过高尔顿板(Galton board)测试,对比了Gemini 2.5 Flash、GPT-4o mini、o4-mini-high及o3等几个最新的模型。 结果他发现,Gemini 2.5 Flash在这项高尔顿板测试中表现炸裂,而OpenAI的几个模型则完全不行,没能搞定这个任务。 RameshR表示,Gemini 2.5 Flash几乎瞬间就能get到意图,生成的代码简洁又漂亮。 在Gemini 2.5 Flash上,他一共提示5次就搞定了。而在OpenAI的模型上,RameshR则折腾了半小时都没有完成,最后直接选择放弃。 可以看出,Gemini 2.5 Flash生成的动画中,整个高尔顿板的排布都没有明显的问题,小球的运动、碰撞也基本符合物理规律。 当然,最后小球的排列也是遵循正态分布。 RameshR的高尔顿板测试帖子发出后立即点燃了网友们的兴致,就连谷歌的首席科学家Jeff Dean也出来给他点赞。 当然,也是为了给Gemini 2.5 Flash站台。 资深工程师Ray Fernando使用相同的提示词在o4-mini-high上进行了测试,结果表现还是不太完美。 他不得不又在GPT-4.1上重新试了一次,表现还是差强人意。 图片下边柱子和固定的小球已经重合到一起了,小球的排列也不符合正态分布的规律。 还有网友使用其他的模型做了测试,比如Alex Kotenko就使用了Claude 3.7。 他表示在使用了相同的初始提示和一次后续调整就完成了测试。只不过从结果来看,小球的排列并不怎么符合正态分布。 而Isaac Naor则使用Gork模型一次就完成了测试。 可以看出Gork模型生成的动画在界面和小球的运动上表现还可以。 但小球最后的排列并不太符合正态分布规律,距离Gemini 2.5 Flash还有差距。 谷歌正势如破竹 这还只是Gemini 2.5 Flash的表现,Gemini 2.5 Pro的效果只会更好。 谷歌DeepMind正势如破竹!在第七代TPU Ironwood的加持下,Gemini模型不仅性能很强,性价比也格外的高。 谷歌似乎是找到了最佳编码模型的秘密。 刚刚,网友AshutoshShrivastava发帖称,谷歌又又又推出了一个新模型「dayhush」,已在网页开发领域上线。 更加夸张的是,这个新模型似乎比Gemini 2.5 Pro更出色。他还提供了新模型的一些更详细信息。 测试过「dayhush」的网友Taro Bushidō表示,「这将是对AI编码的一次地震性转变。」 网友MuffinV也认为,Dayhush是一个大的飞跃。 它的思考时间更长,效果也最好,而且目前没有任何其他模型能达到这种水平。 他使用Dayhush模型创建了一些知名网站,效果非常棒。 「没有任何模型能够如此精确地创建youtube和spotify的用户界面。」他说。 参考资料: https://x.com/rezmeram/status/1912973797206155424 https://x.com/RDeepl/status/1913494086000279786 https://x.com/ai_for_success/status/1913482666566955305
Intel的下一代Nova Lake CPU又要换接口!LGA 1954来了 LGA 1851再见
快科技4月20日消息,按照Intel的规划,下一代处理器代号Panther Lake,首发Intel 18A工艺,但仅面向移动端。 在桌面上,Intel原本规划了Arrow Lake Refresh,但因为不达标而取消,所以接下来要登场的就是Nova Lake。 但目前,有关Nova Lake的消息寥寥无几,据说会升级新的大小核架构,代号分别为Coyote Cove(P核心)、Arctic Wolf(E核心),还有说法称会更换新的接口,但尚未确认。 而最新消息显示,Intel预计于明年发布的Nova Lake处理器在桌面端可能会采用LGA1954接口。 NBD发货文件显示,Intel则在LGA 1954接口平台上测试Nova Lake-S(NVL-S)。其配套的PCH芯片组将采用BGA888封装,封装尺寸预计为24x25mm(可能是900系列主板),作为对比,800系芯片组的封装大小均为 28×23.5mm。 如果上述传闻为真,LGA1851将再一次成为“短命鬼”。对于玩家来说,显然不是什么好消息。 相比Intel两代一换接口的节奏,AMD就稳多了,AM4接口从2017年经历了五代CPU架构、4代制造工艺,仍在不断推出新品,堪称处理器历史上的奇迹, Zen4架构的锐龙7000系列开始更换为AM5接口,但官方承诺,AMD下一代基于Zen 6的锐龙台式机CPU将继续与AM5接口兼容,大家可以继续不用换主板了。 从爆料消息来看,AMD Zen 6将于2026年底或2027年初上市。接口方面,将继续沿用AM5接口,和锐龙7000、锐龙9000保持一致。这意味着AM5从发布以来,至少支持三代CPU。 此前,AMD企业副总裁兼客户端渠道业务总经理David McAfee采访时表示,曾重申对AM5接口平台的长期承诺。 “我们当然明白,AM4的超长寿命是锐龙成功的最大功臣,而在思考未来之路的时候,转向下一代接口是我们必须认真考虑的大事。” 他强调,AMD会竭尽全力尽可能长时间地使用AM5接口,AMD深知换接口的影响。
你见过物理外挂吗?这就是
穿身上的 物理外挂 喜欢看科幻电影的朋友一定对「外骨骼」这个词不陌生。《流浪地球》《阿凡达》《环太平洋》等科幻片里,主角总会穿着一套机械装备展开各种不可能任务,就像开挂一样。 在商用和军用领域,「外骨骼」的应用相当广泛,但在消费级的民用市场还不多见。前段时间爱范儿收到了来自国产品牌「极壳」 的外骨骼——HyperShell Pro X,我也是第一次穿上了科幻电影里的「物理外挂」,穿着它跑过大街小巷,一口气踏上了广州白云山顶。 这套外骨骼比我想象的要便携不少,一个泡沫提手箱就能收纳起来,包装内有外骨骼本体、两块电池以及 Type-C 充电线。 穿戴的过程比想象中简单,根据体型调整好宽度后扣好腰部的扣具,然后调整膝关节的位置扣好双腿的扣具即可。 腰部的两个电机会根据人体的运动提供助力,实际体验它的反应速度很快,稍微抬腿就会得到助力效果,帮助把腿抬起来,随后在落腿的过程中外骨骼会发力将另外一条腿抬起,实现无缝的助力换腿体验。 在短跑时,由于我能更省力地迈大步子,我的短跑速度也比以前更快了,可以说,HyperShell Pro X 这套外骨骼的重点其实是在于省力,而非加速。 爬楼梯时的感知更明显,有了外骨骼在抬腿时的助力,连爬十层楼后只有膝盖会感觉到累,而大腿并没有因为发力而导致的酸胀感。 当然,这套装备最适合的场景,还是在户外。我们在爬山时,能感觉到在连续运动时,电机有明显的发热,虽然不至于发烫,但腰部确实会有明显的热感。 实测助力强度 25%、爬山半小时、行走 1.9km、爬升 135 米的情况下,消耗电量约 40% ,估算满电续航能够达到 5km,配合标配的两块电池能实现 10km 左右的续航,足够应对常规的户外徒步运动。不过,HyperShell Pro X 不能边充边用,半路上没电的时候还是挺尴尬的。 在体验 HyperShell Pro X 这套外骨骼的过程中,我印象最深刻的地方是,虽然外骨骼是一个听起来很科幻的产品,但实际用下来却非常有日常感,就像戴上无线耳机或智能眼镜一样,用起来不会觉得是很难上手、遥不可及的设备,甚至这个 app 做得比很多产品的界面都要更友好。 这两年,像 HyperShell Pro X 这样的外骨骼产品开始进入到消费者到视野当中,这类产品设计的初衷,是为了帮助户外运动爱好者更省力地完成户外计划——在合理的续航时间内,确实也能达成这样的目标。 但放远一点看,或许消费级的外骨骼还潜藏着更大的价值——帮助行动不便的人士复健,帮助体力不支的人远行,帮助身不由己的人看到更远处的风景。 这样的物理外挂,我想可以多来点。
文科已死,计算机科学将亡?ACM警告:不想被AI团灭,关键在融合新生
新智元报道 编辑:KingHZ 【新智元导读】美国就业市场被颠覆:程序员需求45年最低,而文科生被内外夹击。但最近ACM的博客文章,提出了耳目一新的观点:GenAI是文科和计算机科学复兴的唯一希望。顺GenAI则昌,逆之则亡! GenAI日新月异,引发了大众选择职业和大学专业的焦虑。 但最近,美国的国际计算机协会(Association for Computing Machinery,ACM),发布了一篇博客文章,表示:文科和计算机科学,这两个专业最后可能合流,融合在一起才能存活。 在哲学中,「存在危机」指的是质疑自己人生目的、意义和在世界中位置的状态。 如今,这一概念恰如其分地反映了人文学科与计算机科学的现状—— 在生成式人工智能(GenAI)时代,这两个领域都面临着学科相关性、方法论及存在价值的深刻拷问。 文科和CS:危机已现 根据美国艺术与科学学院数据,美国的文科学士学位授予比例已从2005年的近15%骤降至2022年的8.8%。 报告链接:https://www.amacad.org/humanities-indicators/higher-education/bachelors-degrees-humanities 与此同时,计算机科学(Computer Science,CS)领域也遭遇生存危机:GenAI正在威胁程序员在编程等脑力工作的不可替代性。 这种双重危机反而创造了学科融合的契机:AI在颠覆两个看似截然不同的领域,同时也可能为它们注入新生机。 文科:腹背受敌 文科吸引力下降的原因错综复杂,但最终重要的是就业问题。 外部因素中,就业市场导向与教育投资回报率,日益成为关键考量。 计算机专业毕业生的就业环境:高薪职位充足、需求稳定、职业路径清晰。 与此形成鲜明对比,文科专业毕业生往往面临就业前景不明、起薪偏低、需要额外的资格证书才能获得职业发展等困境。 就业的这种差距将学生推向STEM等理工科领域,尽管他们可能对文科有兴趣。 由此,形成了文科的恶性循环:招生萎缩导致院系经费削减,进而进一步削弱学科吸引力,依次反复。 文科自身的内在困境,也削弱了吸引力。 20世纪中后期,后现代主义与存在主义作为对现代主义「进步、理性与普世真理」信仰的反叛而兴起。 这场哲学思潮影响了各个学科,但对不同学科产生了不同的影响。 一方面,后现代主义的怀疑论与计算机科学并行不悖。 也就是说,即使在哲学层面上质疑「真理」或「进步」等概念,但计算机科学用技术持续推动世界发展,其实际成果有目共睹,难以否认。 另一方面,后现代主义的怀疑主义直接冲击了文科的核心。 人文学科本身就围绕意义、解释和价值等问题展开,后现代主义的批评质疑了寻找有意义真理的可能性,同时也使学术讨论变得更加复杂,难以为大众所理解,也弱化了与社会现实需求的关联。 CS:程序员45年需求最低 在美国,过去两年中,超过四分之一的计算机编程岗位消失,这是有史以来最严重的计算机行业衰退。 根据美国劳工统计局提供的420多种职业的数据,计算机编程成为受冲击最严重的十大职业之一。 今年,是美国自1980年以来、长达45年历史的程序员数量最低时期。 而在过去45年,美国的总劳动力增长了约75%! 专栏作家Andrew Van Dam分析了其中的原因。 学习编程曾是文科专业学生的救星。但如今,美国的编程岗位正在急剧减少。 在现实世界中,「开发者」(developer)和「程序员」(programmer)几乎可以互换使用。 但在美国政府统计数据的世界中,二者有着明显的区别。 在政府的规范定义中,程序员承担基础性编码工作,而规模更为庞大且增速更快的软件开发者,职能范围则更广。 开发者需要完成客户需求分析、解决方案设计,并与程序员、硬件工程师等协作实施项目方案。 经过反思,Andrew Van Dam认为原因显而易见:GenAI正在取代程序员。 在2022年底,就在程序员需求急剧下降之前,OpenAI发布了ChatGPT,展示了GenAI惊人的能力,能够生成包括文本、视频、音频、图像和代码在内的内容。 这次发布以及随后迅速出现的一系列引人注目的突破,引发了关于这些快速发展的生成式AI技术对当前和未来工作、工人以及生活可能产生的影响的疑问. 毫无疑问,程序员受AI的冲击最大,但急剧下降的原因不能仅归咎于GenAI。 在过去两年中,整个科技行业都举步维艰,他们为过去鲁莽的决策买单! 这让人好奇,是否有一天「programmer」(程序员)是否会重复「computer」的命运。 过去几个世纪,英文「computer」一词描述的是从事复杂的计算的人员。 换句话,「computer」在过去的中文含义是「计算员」,而不是「计算机」。 1952年,工作中的「计算员」(computer) 如今,「computer」仅仅指的是人类用来处理计算任务的机器,将来「programmer」可能仅仅指用来自动处理程序的机器。 GenAI:来势汹汹,锐不可当 尽管表现形式各不相同,在方法论上,生成式人工智能(GenAI)的崛起,给两个领域带来了根本性的冲击。 对人文学科而言,GenAI的文本分析、意义阐释与内容生成能力,正在动摇人类学术贡献的不可替代性,甚至可能让学者显得多余和累赘。 计算机科学则面临类似的危机:由于GenAI可自动化编程流程,入学率下滑的担忧日益加剧,越来越多人认为这项技术将削弱编程基础的重要性。 长此以往,或将催生一代仅擅长指令调优(prompting)却疏于理解计算原理的开发者。 这与计算机科学家的角色定位形成根本性冲突。 然而,关键差异在于从业者与工具的关系: 计算机科学家具备开发和改造AI系统的能力,与其说GenAI是威胁,不如说他们正构建着共生关系; 而人文学者,通常只能被动使用无法重塑的技术工具。 值得注意的是,GenAI带来的挑战也可能产生积极影响。 人文学科与计算机科学纳入GenAI内容,不仅将重塑教学范式,还可能通过吸引传统弱势学生群体,为这两个学科注入新的活力。 转机:计算机+文科合流 尽管生成式人工智能(GenAI)带来危机,但这是人文学科与计算机科学复兴的唯一机会:利用GenAI破解各自的核心局限。 计算机科学通过算法和系统优化开发高效解决方案,而人文学科则专注于解释人类文化、历史和思想。 虽然两学科方法论迥异,但AI的能力将为二者带来变革性助力。 GenAI能处理语言密集型或其他劳动密集型任务,将学者从「西西弗斯」一样重复而无意义的工作中解放出来,让他们专注于真正推动知识进步的创造性和分析性思考。 希腊神话中,西西弗斯受惩罚:必须将一块巨石推上山顶,而每次到达山顶后巨石又滚回山下,如此永无止境地重复下去。 这种突破会否成为吸引更多学术进入两领域的关键? 利用GenAI降低入门门槛 这场技术变革会吸引那些曾被技术或语言要求而被劝退、却始终对学科核心问题保持兴趣的人才。 回溯计算机科学教育史,关于如何扩大参与的讨论已经进行了几十年。 最重要的成果是卡内基梅隆大学开发的Alice与MIT开发的Scratch编程环境。 Scratch可以可视化的编写互动故事、游戏和动画 这些编程环境降低了形式化编程语言的心智负担,让学习者专注于计算机科学中真正重要的事情,即问题解决和算法思维。 这场持续数十年的教学改革,与GenAI带来的范式革新异曲同工。 同理在人文学科,GenAI能攻克最顽固的壁垒:语言能力。 在古典学、中世纪与现代史等领域,学者需耗费数年、掌握多门语言,才能开展研究。 以大屠杀(Holocaust)研究为例,档案材料涵盖德语、波兰语、俄语、法语、意第绪语及希伯来语(含手写体),迫使学者按地域而非整体视角开展研究。 而GenAI的文档翻译与转录能力,将帮助历史学者跨越语言藩篱,专注于历史诠释。 GenAI实现了学科平民化,有望构建更多元、包容的学术共同体,为亘古之问带来崭新视角。 AI引爆学术范式转变 或许最具深远意义的是,GenAI正在重塑学术问题的基本范式。 对人文学者而言,GenAI打破了长期制约研究视野的语言和断代壁垒。 如今,学者能跨越数十种语言和几百年的文化模式:比较中世纪阿拉伯文本与现代日本文学的叙事母题,追溯哲学概念在亚非欧大陆的流变。 中世纪阿拉伯文本 这种全球尺度的比较研究,过去的学者很多单独完成。 由此,GenAI将学术疆域扩展到远超学者个人寿命的维度,开辟出全新的研究领域。 GenAI给计算机科学和人文学科带来的变革,构成了所谓的「AI转向」(AI turn)—— 这比学术界既往的方法论转向,更具范式革命性。 通过自动化核心脑力劳动,GenAI不仅改变了研究方式,更迫使我们重新思考:在知识生产链条中,什么是人类不可替代的独特贡献? 「AI转向」不仅是方法论迭代,更是重塑学科疆界的催化剂,它将开创一个计算方法与人文探究深度交融的新学术生态。 学术研究的手段与目的常被混淆。 AI或许能优化研究流程,但效率提升绝非终极目标:知识发现、深层理解与思想贡献,始终是学术探索的核心。 在这两个文科和CS领域,GenAI可以成赋能研究全过程—— 从数据收集、多语言翻译、分析建模到文稿起草—— 在提升效率的同时,GenAI加速人类的认知突破。 当AI接管重复性技术工作后,研究者将得以重拾学术的本真:破解复杂问题,构建意义阐释,进而深化对技术系统与人类经验的双重理解。 文科真正的生存危机 如果文科研究者真的被深度神经网络的表面表现所误导,那文科和理科将分道扬镳。 深度网络实际上对它拼凑出的叙述中的词汇,并没有任何理解,尽管它能够让无知的读者相信它知道自己在说什么。 即便是创建这些深度神经网络的专家,也承认这就是事实。 六十年前,Joseph Weizenbaum的「Eliza」程序做了同样的事情,让当时的观察者大为震惊。 论文链接:https://dl.acm.org/doi/10.1145/365153.365168 如果人文学科的从业者无法分辨何时自己正被一个人工的、自闭症般的天才所迷惑—— 这个天才能记住一切,能以表面上的优雅围绕任何话题转圈,但实际上什么也不懂,那么人文学科的确面临着存在危机。 参考资料: https://cacm.acm.org/blogcacm/the-converging-paths-of-computer-science-and-the-humanities-in-the-age-of-genai/ https://www.washingtonpost.com/business/2025/03/14/programming-jobs-lost-artificial-intelligence/
对ChatGPT说“谢谢”,竟给OpenAI带来“数千万美元”开销
IT之家 4 月 20 日消息,如今人工智能(AI)已经渗透到我们生活的方方面面,无论是寻求帮助、解决问题,还是简单地进行日常对话,AI 都扮演着重要的角色。然而,这些互动背后隐藏着巨大的成本。 IT之家注意到,OpenAI 的首席执行官萨姆・奥尔特曼(Sam Altman)承认,仅仅为了处理用户日常的寒暄和礼貌性交流,就需要花费“数千万美元”。这些看似微不足道的对话,如“谢谢”“请”等礼貌用语,虽然在情感上让我们与 AI 的互动显得更加人性化,但其背后却涉及到高昂的能源消耗。有最新报告指出,即使是像“不客气”这样短短三个字的回复,大型语言模型(LLM)也需要消耗大约 40-50 毫升的水。 由此可见,用户的友好客气可能在一定程度上增加了 OpenAI 每月的支出。但该公司对此似乎并不介意。理论上,公司可以预先编程其模型来处理这些常见且可预测的回复,但这实际操作起来却并非易事。 事实上,许多用户已经不仅仅将 AI 视为一个工具,而是像对待朋友一样与之交流。这种现象引发了研究人员的关注,来自 OpenAI 和麻省理工学院的研究人员指出,随着 AI 对话越来越难以与人类对话区分开来,部分用户可能会对 AI 聊天机器人产生情感依赖,甚至出现成瘾的情况。这种成瘾可能会导致用户在离开 AI 时出现类似戒断反应的症状。 然而,对于那些真心感谢 AI 帮助的用户来说,这种礼貌的表达并非毫无意义。例如,当 AI 帮助用户解决了一个复杂的机械问题,或者为即将到来的考试提供了帮助时,一句“谢谢”无疑是真诚的。此外,对于那些支付了高级会员费用的用户来说,这些互动已经是他们所购买服务的一部分。由于高级用户是按照使用量(token)付费的,因此他们的“谢谢”是否比免费用户更加真诚,也成为一个值得探讨的问题。 更有趣的是,如果有一天 AI 真的具备了自我意识,那么我们在与 AI 互动时所表现出的良好礼貌,或许会在未来为我们带来一些意想不到的好处。尽管目前 AI 还无法真正体验情感,但其在互动中所展现出的类似人类的特质,已经让我们不自觉地以礼貌的方式与之交流。
蔚来最便宜新车来了!萤火虫11.98万起,暂不能换电但能进牛屋了
精致小车 自在发光 蔚来萤火虫的最终上市价最终定在了 11.98 万元和 12.58 万元 ,比预售价便宜了 2.3 万元-2.9 万元,两个版本的差异只在于内饰材质,其他部分都是相同的。 Bass 方案的价格则是先藏了一手,要到 8 月份才有方案。一方面是因为萤火虫虽然支持换电,但是只能用蔚来的五代站,最快用上也要到明年了;另一方面,蔚来估计也是想看看市场的反应,到时候也有调整的空间。 咱们还是先来一起回顾下蔚来萤火虫的核心配置。 长宽高分别为 4003 / 1781 / 1557 毫米,轴距 2615 毫米,4.7 米转弯半径。 42.1 kwh 磷酸铁锂电池,CLTC 综合续航 420km。 13.2 寸中控屏 + 6 英寸仪表盘,高通骁龙 8155P 芯片。 地平线征程 5 智驾芯片,128Tops 算力,支持 ACC 和高快 NOP 功能。 其他的舒适性配置则可以参考下图。 在 12 万左右这个区间里,配置算是中规中矩,没硬伤但也没惊喜。 那蔚来打算靠什么让这辆萤火虫在 10 万元的市场中具备竞争优势呢? 蔚来自己给出的答案是——最安全的小车,最智能的小车,以及具备独特情绪价值的小车。 待兑现的情绪价值 我们从后往前,先看情绪价值的部分。 外观设计算是情绪价格很重要的一部分。但是萤火虫从谍照阶段开始,对于其外观的争议就从来没有停止过,其中争议最大的是其前脸灯组的设计。 董车会之前在 NIO Day 总结文章里面的投票中,有 6000 多人参与了投票,其中仅有 800 余人觉得萤火虫好看,占比不到 15%,行业内的其他媒体和人员也大都觉得建议蔚来对车灯的设计进行修改。 但是蔚来自己倒是很有自信,直言不会做修改。 大家比较了解蔚来,造型的东西永远都是有人喜欢有人不喜欢,但是呢,我们可以很自豪地说,萤火虫是一个纯原创的高端小车。 ...... 有网友说大灯像复眼,问题萤火虫本身就是昆虫,真要论起来也合理。至于设计有没有 Plan B?这个真没有。(蔚来高管秦力洪) 情绪价值的第二个部分,是蔚来一直以来独特的换电和服务体系, 蔚来同时宣布了萤火虫车主可以享受蔚来的全套服务,包括上门补胎、取送车以及可以溜猫、遛狗的各种驾享服务,之前曾经宣传过的针对萤火虫车主提供的专属独特服务,这次发布会似乎没提了。 对了,萤火虫车主可以进牛屋。 但驾享服务也不是完全免费的,萤火虫官网的驾享服务包有 499 / 1399 / 4999 三档可选。 换电服务目前暂时处于「大饼」的状态,萤火虫这块 42.1 度的电池不兼容目前蔚来 1 到 4 代的任何一座换电站,而蔚来说可以支持的五代站最早将会在明年 1 月份投入使用。 而且产品负责人金舸曾经在接受采访时提到萤火虫不会超前建站。 比如说半径5公里内,已经聚集了一定数量的用户,用户就可以在APP里举手,要求帮我建个站,用这种方式来增长。 这样的话,至少在最初的一两年,萤火虫在补能的体验上就很难说能提供什么情绪价值了。 普通智驾、高配安全和亮眼车机 在去年 12 月份的这个时间节点,蔚来可能认为在一辆 10 万元级别的小车上搭载高快速路的 NOP 系统,应该就可以算得上同级最强了。 但是蔚来显然低估了智驾系统降价和普及的迅速程度,无图 NOA 功能在 13 万元级车型上搭载的情况也并不少见,而且各家的智驾功能也从去年的付费使用逐渐普及成了标配功能。 蔚来对此显然是有所认知的,但是受限于成本等各方面原因只能维持现状,不然也不会把萤火虫智驾功能改成了「十年免费」,多少显得有点扭捏。 值得特别提一句的是,蔚来萤火虫的智驾供应商地平线 18 号的发布会上,还拿了萤火虫作为代表车型,但是萤火虫并未用上最新的征程 6 系芯片,而是使用了上一代的征程 5。 安全性上倒是没什么槽点,前向预警、盲区监测、误加速抑制辅助和前后的 AEB 功能都有,硬件上则特别提到了安全气囊的气帘保压时长超过了 22s,超过了标准需求的 4 倍,侧气帘的长度也直接覆盖了 A柱到 B 柱的部分。 蔚来萤火虫这次在在座舱内部的细节设计、车机系统的交互体验方面做的不错,UI 设计很好的契合了年轻化的基调,尤其是在屏幕的不同区域用双指滑动的方式来调节音量、空调温度等的交互方式很好的解决了没有实体按键的痛点。 总结一下,蔚来萤火虫在这个价位段是一辆「外观有争议」、「配置没惊喜」、「服务待兑现」的车,或许能在追求年轻化和个性化的消费者中激起一些波澜,但要说想达到李斌一个月交付几万台的目标,可能有点难。 不过,这次萤火虫的发布会倒是挺简洁,没有会场、没有大屏,甚至主讲人也不是李斌,看来确实开始省钱了。
DRAM“危机”
在AI的狂飙猛进中,大模型规模呈指数级增长态势,从最初的 GPT-3的1750 亿参数,到如今前沿模型迈向万亿级参数的征程,每一次跨越都对计算资源提出了近乎苛刻的要求,尤其是存储带宽,给传统的内存技术带来了巨大挑战。 在过去几十年中,服务器硬件的算力峰值基本以每两年3倍的速度飞速增长,展现出强大的计算潜力。然而,DRAM带宽的增长速度却仅为每两年1.6倍,片间互连带宽的增速更是只有每两年1.4倍。这种不均衡的发展速度,使得在长达20年的时间跨度里,造成了内存的存取速度严重滞后于处理器的计算速度,内存瓶颈导致高性能处理器难以发挥出应有的功效,这对日益增长的高性能计算形成了极大的制约。 这种不均衡的发展,被业界称为“存储墙”问题。 “存储墙”的存在使得处理器的性能无法得到充分发挥,严重制约了AI模型的训练和推理速度。有相关研究表明,在一些大规模的AI训练任务中,由于内存墙的存在,处理器的实际利用率可能只有理论峰值的20% - 30%,这无疑是对计算资源的巨大浪费。 直到HBM的出现,宛如一场存储领域的革命,彻底改变了传统DRAM的布局模式。HBM 凭借其超高的带宽,能够实现每秒1.2TB的数据传输速度,这一数字是传统DRAM的数倍甚至数十倍,有效缓解了内存带宽的压力,使得AI芯片能够更快速地获取和处理数据,从而大大提升计算效率,满足AI模型对带宽的极致需求。 而HBM之所以能够实现如此高的带宽,关键在于其采用了先进的3D堆叠技术,通过硅通孔(TSV)技术,将多个DRAM芯片垂直堆叠在一起,形成了一个紧密的存储模块。在传统的DRAM中,芯片是平铺在电路板上的,数据传输线路较长,信号衰减和延迟较大。而HBM的3D堆叠结构使得数据传输线路大幅缩短,信号传输更加快速和稳定。 然而,尽管HBM在技术上展现出了巨大的优势,但其制造过程堪称一场精密而复杂的“垂直革命”,其核心在于TSV、减薄封装和微凸点等关键技术的协同运用,每一个环节都蕴含着极高的技术难度和工艺挑战,且其高昂的成本或许也成为了制约其大规模应用的一大障碍,使得许多对成本较为敏感的应用场景望而却步。 综合来看,传统DRAM面临“存储墙”瓶颈;DRAM堆叠而来的HBM同样面临工艺复杂、成本高昂的挑战。 因此,当传统DRAM及其路径延续性技术创新的弊端开始暴露出来,市场亟待能够满足新场景需求的存储器产品,一些新型存储迎来机会窗口。 DRAM危机,新型存储技术群雄逐鹿 3D铁电RAM:DRAM存储架构的颠覆者 在探索DRAM替代技术的征程中,3D铁电RAM展现出了巨大的潜力,成为了备受瞩目的焦点。 其中,美国SunRise Memory公司便是这一领域的开拓者,他们致力于开发用于AI应用的3D铁电RAM芯片,其技术路径极具创新性。 据了解,SunRise Memory采用垂直堆叠的FeFET存储单元,这种独特的设计使其目标存储密度比传统DRAM芯片提高10倍。通过巧妙地利用HfO2(二氧化铪)的铁电效应,该技术实现了非易失性存储,这意味着在断电后数据依然能够得以保存,大大提高了数据的安全性和稳定性。 不仅如此,其功耗相较于传统DRAM降低了90%,这对于对功耗极为敏感的AI应用来说,无疑是一个巨大的优势。在数据中心中,大量的服务器需要长时间运行,功耗的降低不仅可以减少能源成本,还能降低散热需求,从而降低整个数据中心的运营成本。 因此,与传统DRAM相比,3D铁电RAM在性能上具有明显的优势。它不仅具备DRAM的高速读写特性,能够快速响应数据请求,还拥有闪存的非易失性,无需频繁刷新数据,降低了能耗。 对此,SunRise坚信3D铁电RAM能够提供高容量、高带宽、低功耗的替代方案。该公司已组建了一支由40名工程师组成的团队,分别位于美国和以色列,并正在设计其铁电RAM,使其能够在现有的掌握3D工艺流程的大批量晶圆厂(例如3D NAND晶圆厂)中生产。 SunRise公司还表示,该芯片级架构还希望并行管理数百个独立的存储库——优化带宽而非芯片面积和成本,这将有助于降低延迟,并支持以内存为中心的AI推理和训练以及高性能计算。这一目标一旦实现,或将为AI推理和训练以及高性能计算带来前所未有的变革。 然而,3D铁电RAM要实现大规模商业化生产,还面临着诸多挑战。在材料方面,需要进一步优化HfO2等铁电材料的性能,提高其稳定性和可靠性。在制造工艺上,也需要不断创新,降低生产成本,提高生产效率。 SunRise也并未透露何时能将3D铁电RAM推向市场,也未透露哪些具备3D技术的制造商可以成为其合作伙伴。只是在其网站上表示,目前开发过程已进行到一半左右。 此外,韩国科学技术院(KAIST)在铁电存储领域也取得了突破。 其研究团队在FeFET与HfO2铁电效应的研究上,通过精确调控HfO2铁电材料的准同型相界(MPB),成功实现低功耗、高可靠性的FeFET器件。这一成果为存储技术的发展开辟了新的道路。 据悉,准同型相界是铁电材料中两种相之间的特殊区域,在这个区域内,材料的性能会发生显著变化。KAIST的研究团队巧妙地利用这一特性,通过调整材料的成分和制备工艺,使得FeFET器件的性能得到了极大的提升。他们研发的FeFET器件,存储单元面积可缩小至4F²,这一成果使得存储密度大幅提升,为3D DRAM堆叠奠定了坚实基础。 整体来看,在实际应用中,这种新型的FeFET器件展现出了巨大的潜力。在数据中心中,它可以提高存储系统的性能,降低能耗,为大规模数据存储和处理提供更高效的解决方案。当然,从实验室研究到实际应用,还有很长的路要走。研究团队需要进一步优化器件的性能,提高其兼容性和稳定性,以满足不同应用场景的需求。同时,还需要与产业界紧密合作,推动技术的产业化进程。 DRAM+非易失性内存,新革新 内存供应商Neumonda GmbH已与Ferroelectric Memory Co.(FMC)联手,帮助销售FMC的“DRAM+”非易失性内存。 Neumonda在DRAM内存设计和测试领域拥有多项专利,将为FMC提供内存咨询服务,并为其非易失性DRAM+产品提供Rhinoe、Octopus和Raptor测试平台。两家公司将在测试解决方案的设计和提供以及DRAM+的市场营销方面展开合作。 FMC成立于2016年,是德累斯顿工业大学孵化器公司NaMLab GmbH的衍生公司。据悉,FMC成立的初衷是将HfO2铁电效应这一颠覆性发明应用于半导体存储器,将其应用于DRAM,可将DRAM电容器转变为低功耗、非易失性存储设备,同时保持DRAM的高性能,从而生产出适用于AI计算的颠覆性非易失性DRAM存储器。 较旧的FeRAM技术(通常使用锆钛酸铅 (PZT) 作为铁电层)容量有限。大多数商用产品最多只有几兆字节,4MB或8MB相当常见。PZT无法随着工艺节点的缩小而很好地扩展,并且与标准CMOS工艺的集成既困难又昂贵。因此,像1T1C(一个晶体管,一个电容器)这样的单元结构比DRAM或NAND占用更多的面积。 转向HfO2将改变游戏规则。HfO₂与CMOS兼容,可远低于10nm制程,并可与现有的半导体制造工艺集成。因此,使用HfO2可实现更高的密度和性能,可能达到千兆位到千兆字节的范围,使其更接近DRAM。 Neumonda将通过咨询和提供其先进测试系统Rhinoe、Octopus和Raptor的使用权来支持FMC。这些平台专为低成本、节能和独立的内存测试而设计。Neumonda的系统提供传统设备无法实现的详细分析,并且成本显著降低。 不过,FMC尚未透露DRAM+何时实现商用,以及由谁以何种配置生产内存芯片,或采用何种制造节点。但FMC在其网站上声明,其DRAM+产品系列可用于AI训练、工业、汽车和消费应用。此外,FMC还提到了Cache+产品线,将DRAM+理念扩展到Chiplet形式的非易失性缓存存储器。 Imec重构DRAM架构: 2T0C设计改写游戏规则 DRAM是传统计算架构中的主存储器,其位单元在概念上非常简单。它由一个电容器 (1C) 和一个硅基晶体管 (1T)组成。电容器的作用是存储电荷,而晶体管则用于访问电容器,以读取存储的电荷量或存储新电荷。 多年来,位单元密度的扩展使业界得以推出后续几代DRAM技术,并应对日益增长的DRAM需求。但自2015年左右以来,DRAM内存技术一直难以跟上处理器逻辑部分性能改进的步伐:扩展、成本和功率效率 问题构成了不断上升的“内存墙”的组成部分。大电容限制了1T1C位单元的可扩展性和3D集成,而这是迈向高密度DRAM的最终途径。此外,随着存取晶体管变得越来越小,它为电容电荷的流失提供了越来越大的漏电路径。这会降低数据保留时间,并需要更频繁地刷新DRAM单元——从而影响功耗。 2020年,imec报告了一种新颖的DRAM位单元概念,可以一次性解决这两个问题:一个位单元由两个薄膜晶体管(2T,一个用于读取,一个用于写入) 和无电容器(0C) 组成。薄膜晶体管的导电通道由氧化物半导体组成,例如氧化铟镓锌 (IGZO)。由于其宽带隙,基于IGZO的晶体管具有极低的关断电流,有利于存储器的保留时间、刷新率和功耗。更长的保留时间也放宽了对存储电容的要求,允许读取晶体管的寄生电容接管存储元件的角色。 同时,制造IGZO 2T0C位单元比传统单元更简单、更具成本效益。除Si之外,IGZO材料可以在相对较低的温度下沉积,从而与后端制程 (BEOL) 工艺兼容。这为新的DRAM架构打开了大门。 首先,它允许将DRAM外围设备移到DRAM存储器阵列下方,而不是位于其旁边。这减少了DRAM存储器芯片的占用空间,并使阵列和外围设备之间的连接更加高效。在这种配置中,2T0C DRAM位单元集成到外围设备的BEOL中,这是IGZO材料的特性允许的。 其次,新颖的位单元为2D或3D堆叠配置铺平了道路,从而进一步提高了密度。这些堆叠配置将有助于打破存储器壁垒,使DRAM存储器能够继续在云计算和人工智能等数据密集型应用中发挥关键作用。在不同层面上实现两个晶体管(堆叠2T0C)还有低关断电流、导通电流等额外的好处。可以分别优化两个晶体管。 在率先提出这一概念后,imec在2020年IEEE国际电子设备会议 (IEDM)上首次实验演示了功能性2T0C DRAM单元。 凭借低关断电流的优势,首批2T0C DRAM单元的保留时间>400秒,大约是典型DRAM刷新时间的1000倍。这些结果是在对在300毫米晶圆上加工的基于IGZO的薄膜晶体管进行缩放和优化后获得的。优化旨在抑制氧和氢缺陷的影响,这是开发性能良好的基于IGZO的晶体管面临的主要挑战之一。然后将栅极长度为45nm的优化晶体管集成到2T0C DRAM位单元架构中,其中读取晶体管的寄生电容用作存储元件。 (a) 基于2T0C IGZO的DRAM单元的布局(b) 相应的TEM图像(W=写入;R=读取;WL=字线;BL=位线) 接下来,imec开始探索能够提高2T0C DRAM密度并改善性能和可靠性指标(例如关断电流、数据保留、耐久性、导通电流和阈值电压)的旋钮。 在2021年的IEDM上,imec研究人员展示了一种改进的基于IGZO的2T0C DRAM位单元,其保留时间>1000秒,耐久性几乎无限(>1011次读写周期),写入时间<10纳秒。 这些突破性成果是在优化IGZO晶体管的材料堆叠和集成方案后取得的:采用后栅极方法,采用埋氧隧道和自对准接触,并结合缩放栅极电介质 (Al2O3 ) 厚度。实施埋氧隧道并与O2环境中的退火相结合,降低了IGZO通道中的氧空位浓度,有利于开启和关闭电流。 这项IGZO-DRAM技术为更积极的DRAM微缩奠定了基础。IGZO晶体管的栅极长度缩小至14nm,同时仍保持>100s的保持时间。研究人员还展示了2T0C DRAM单元的变体,其IGZO层厚度大大减小(5nm)。这消除了对氧隧道和O2退火步骤的需求,从而简化了工艺流程。Imec还展示了具有共形沉积薄IGZO通道(5nm,通过ALD)的功能晶体管,这是迈向3D DRAM集成的垫脚石。 最近,imec使用反应离子蚀刻 (RIE) 技术代替常用的离子束蚀刻 (IBE) 来对2T0C晶体管的有源模块进行图案化。RIE可以在极小的尺寸(小于100nm)上进行图案化,同时损伤有限,从而进一步减少面积消耗。此外,由于有效抑制了晶体管侧壁上的外部泄漏路径,在2T0C DRAM位单元中使用这些晶体管可以将保留时间大大提高到4.5小时以上。 据悉,imec的颠覆性DRAM概念的潜力引起了世界各地大学、研究机构和公司的兴趣。几个研究小组开始研究其他位单元配置、晶体管性能“助推器”和替代氧化物半导体材料。 其中,中国科学院微电子研究所自2021年起发布有关2T0C IGZO DRAM的文章,展示了一种有利于多位操作的替代2T0C配置。后来又展示了具有垂直集成IGZO通道的晶体管。单片堆叠“垂直”读写晶体管的能力使面积高效的4F2 2D DRAM单元配置成为可能;旺宏实现了具有环绕栅极和环绕通道IGZO FET的3D 2T0C位单元;北京大学基于材料堆叠工程优化了IGZO晶体管,从而提高了2T0C DRAM单元性能。 除了IGZO,W掺杂的氧化铟 (IWO)等其他氧化物半导体通道材料的薄膜晶体管也在考虑之中。斯坦福大学最初考虑使用氧化铟锡 (ITO) 来实现2T0C。2024年,他们还与台积电合作使用IWO制造了n型薄膜晶体管。此外,他们还首次将IWO n型晶体管与同样由氧化物半导体制成的p型晶体管相结合,以提高性能并减少耦合效应。 根据Yole发布的2024年报告显示,2T0C IGZO-DRAM最近已被添加到长期DRAM技术路线图中。该技术被认为是实现备受期待的3D DRAM的可能方法之一。此外,未来几年对边缘设备上的AI的需求预计将激增,从而产生对高密度嵌入式DRAM (eDRAM)的需求。无电容器IGZO-DRAM技术是此应用非常有吸引力的候选者。基于其开创性活动,imec开始开发与BEOL兼容的eDRAM实现。 多年来,imec在评估、理解和建模可靠性故障方面取得了长足进步,为制造目标寿命为五年的可靠IGZO晶体管提供了诸多思路。 相变存储器,低功耗与高性能的双重突破 除了上述技术,还有众多新型存储技术在不断涌现,它们各自凭借独特的优势,在替代DRAM的赛道上展开了激烈的角逐。 相变存储器(PCM)便是其中的佼佼者。 PCM的原理是通过改变温度,让相变材料在低电阻结晶(导电)状态与高电阻非结晶(非导电)状态间转换。PCM具备低延时、寿命长、功耗低、密度高、抗辐照特性好等优势。 大家都比较熟悉的Intel和Micron合作开发的3D XPoint技术,就是PCM的一种。只不过随着英特尔傲腾内存业务的关闭,3D XPoint内存技术也走到了尽头。 据报道,韩国KAIST的Shinhyun Choi教授团队开发的纳米灯丝技术,为PCM的发展带来了新的突破。该技术通过创建相变纳米丝,将PCM的功耗降低了15倍,成功解决了传统PCM功耗过高的问题。这项技术的原理是利用材料在不同相态之间的转变来存储数据,通过精确控制相变过程,实现了高速、低功耗的数据读写。 与传统PCM相比,这种新型PCM不仅保持了速度快、ON/OFF比大、变化小、多级存储特性等优点,还实现了低功耗运行。它还兼具DRAM的速度和NAND的非易失性,使数据存储更加稳定可靠,为存储技术的发展开辟了新的道路。 在物联网设备中,相变存储器可以作为高效的存储解决方案,满足设备对低功耗和高性能的需求。 新型非易失性存储器:UK III-V Memory 英国兰开斯特大学的研究人员研发出了一种基于GaSb/InAs的新型非易失性存储器—UK III-V Memory。 该技术基于20nm光刻工艺构建,写入时间仅为5ns,与DRAM相当,而写入能耗却仅为DRAM的1%。它采用“双阱共振隧道结”,通过交替的GaSb和InAs层实现数据存储,具备类似闪存的简单读取特性,同时能够在断电时保持数据的完整性。这意味着设备在断电后无需重新加载数据,可几乎立即打开电源并返回到上次停止的位置,大大提高了设备的使用效率。 该团队首席研究员Manus Hayne认为,该技术有望取代价值1000亿美元的DRAM和闪存市场,目前团队正在为其申请专利。在移动设备中,用户希望设备能够快速启动并恢复到上次使用的状态,UK III-V Memory的出现恰好满足了这一需求,未来有望在移动设备存储领域发挥重要作用。 SOT-MRAM技术,新突破 磁阻式随机存取存储器(MRAM)也在不断发展。这是一种基于隧穿磁阻效应的技术,它利用磁性材料的磁阻效应来存储数据,具有非易失性、高速读写、无限次擦写等优势。随着技术的不断进步,MRAM的存储密度和性能不断提高,成本逐渐降低,有望在未来的存储市场中占据一席之地。 目前主流的MRAM技术是STT MRAM,使用隧道层的“巨磁阻效应”来读取位单元,当该层两侧的磁性方向一致时为低电阻,当磁性方向相反时,电阻会变得很高。 此外,基于自旋轨道扭矩(SOT)的磁性随机存取存储器(MRAM)也在不断取得进展。德国美因茨约翰内斯古腾堡大学(JGU)的研究团队与法国Antaios公司合作,利用轨道霍尔效应开发出了一种新型SOT-MRAM。 该SOT-MRAM技术在写入电流和能效比方面实现了双重突破。通过轨道霍尔效应,该技术将写入电流降低了20%,能效比提升了30%,同时确保数据可以保存十年以上。 与传统的SOT-MRAM依赖强自旋轨道耦合的金属材料(如铂和钨)不同,该技术通过利用轨道霍尔效应将电荷电流转换为轨道电流,避免了对稀有和昂贵材料的依赖,降低了生产成本。其非易失性和低功耗特性,使其非常适合应用于数据中心和高性能计算等领域。在数据中心中,大量的数据需要快速存储和读取,同时对存储设备的稳定性和可靠性要求极高,新型SOT-MRAM的出现为数据中心的存储需求提供了新的解决方案。 写在最后 从HBM的3D封装到铁电存储的材料革新,AI正驱动半导体产业进入“架构+材料”双轮驱动的新时代。 当存储单元从二维平面走向三维立体,当数据存储突破易失性边界,AI算力的下一个十年,将由存储技术的持续革命来书写,全球存储产业正在经历一场深刻的重构。 在AI浪潮的强劲拉动下,各大厂商纷纷加大在HBM领域的布局,以抢占市场先机。但随着技术不断进步,未来的存储市场也将呈现出多元化的发展趋势。通过上文能看到,业界有不少技术正在觊觎DRAM的“宝座”,3D铁电RAM、DRAM+、IGZO 2T0C、SOT-MRAM、自旋电子器件等等新技术也在不断突破传统存储架构的束缚,展现出巨大的发展潜力。目前正逐渐从实验室走向工程验证阶段,有望在未来几年实现商业化应用。 如上文所述,当传统路径中延续性技术创新的弊端已经暴露出来,市场亟待能够满足新场景需求的存储器产品,新型存储迎来机会窗口。 新型存储技术的崛起也将为市场带来更多的选择,它们将与HBM相互补充,不同的存储技术将根据自身的特点和优势,在不同的应用场景中发挥重要作用,共同推动存储行业的发展。而这也将进一步重塑半导体产业的格局,为行业带来新的机遇和挑战。
裁员70%、降薪20%,AI四小龙集体断臂求生
作者 | 赵芷姗 编辑 | 汤安迪 在连连亏损下,曾经的AI四小龙开始学着贴地飞行。 4月10日,商汤科技发布了“日日新V6”大模型,多模态能力对标国际水平,数理分析超越GPT-4o。 凭借着新模型的优越表现,商汤科技在大众面前终于怒刷了下存在感。 谁还记得在八九年前,商汤科技与旷视科技、云从科技、依图科技并称为“AI四小龙”。 当下“AI六小龙”、“杭州七小龙”名号遍布,来的龙太多,曾经的“AI四小龙”也渐渐被时代遗忘。 3 月26日,商汤科技发布2024年度财报,全年总营收37.72亿元,净亏损43.06亿元,2018-2024年累计亏损超546亿元。 另一家上市公司云从科技,此前财报显示,2024年总营收约3.98亿元,同比下降36.6%,归母净亏损达5.9-6.8亿元,2017-2024年累计亏损超44.75亿元。 此外,裁员风波也盘旋在这四小龙的头上: 商汤去年裁撤非核心业务,战略重组后员工总数从2021年的6113人缩减至4672人,新加坡办公室搬迁至低成本区域; 云从去年传出全员降薪20%的消息,今年核心技术成员张岭辞职,核心技术人员仅剩下创始人以及副总经理; 依图裁员超70%,医疗业务几乎关停,武汉、西安等地分公司注销…… 如今的AI四小龙已经坠落凡尘,抛开理想,回归现实,重新适应行业的新环境。 陷入商业化难题 从辉煌跌落 在2011-2015年期间,旷视、依图、商汤和云从依次成立,且都聚焦于计算机视觉技术,当时计算机视觉是AI的核心赛道,凭借人脸识别、图像识别等技术这四家公司在AI行业初露头角。 2016年,AlphaGo横空出世,击败世界围棋顶尖高手李世石,引发了全球AI热潮,资本开始涌入AI领域,因技术领先,它们四家被并称为“AI四小龙”。 2017 年后,四小龙进入高速发展期,商汤成为全球估值最高的AI初创公司,并于2021年港股上市,开盘首日市值突破2000亿港元;旷视在安防领域占据重要份额;依图在医疗影像和智慧城市取得突破;云从则依托于政府和国有资本背景,拓展金融和安防市场,在2022年成功科创板上市。 然而,四小龙普遍都面临着商业化的难题,在高研发投入下,亏损却不断增加。 同时,OpenAI横空出世后,大家逐渐将以自然语言处理为主的新技术,视为AI主流,而非计算机视觉。 在这种情况下,四小龙想要活下去,只能转型。 奋力自救 要留在AI牌桌上 根据Epoch AI的研究报告,预计到2028年,训练大语言模型的文本数据需求将完全覆盖互联网公共可用文本总量,到时候就会面临无文本可用的局面。 此时,从计算机视觉再转做大语言模型,不异于走向另一个死胡同。 AI的最终目标是AGI,语言只是其中一个形态,这也意味着有着视觉基因的AI四小龙存在着卷土重来的可能。 算力基础+ 长期积累的视觉数据,这三家都不约而同押注多模态大模型。 商汤自2018年开始建设智算中心,2022年正式建成了亚洲最大的人工智能计算中心AIDC,其SenseCore AI大装置已积累超600种预训练模型,支持千亿级参数模型训练。 依图与华为华为联合推出了昇腾大模型一体机,将硬件成本降低50%,在南京“城市之眼”项目中,算力密度达英伟达H100的95%,但采购成本仅为1/5。 云从基于昇腾芯片,与华为联合推出了从容大模型训推一体机,支持千亿级参数模型训练。此外,云从在昇腾910B芯片上深度适配,构建了混合模型云服务,同时支持自有和第三方模型。 商汤科技董事长兼CEO徐立在4月10日的演讲中,指出,纯粹的语言模型不能真正完整地表达人类的智能,多模态能够补充互联网上文本数据的不足,挖掘图像、视频等非文本数据中的知识。 日日新V6大模型不仅支持多模态的原生融合,还突破了传统语言模型+插件式多模态的拼接模式,通过跨模态桥接技术,实现不同模态数据的联合编码,避免多任务训练中出现“跷跷板效应”。 此前有论文指出,从文本模型扩大到多模态模型,后加入的图像、视频与语言数据会出现拉低文本数据的现象,产生多模态噪音。 商汤科技首席科学家林达华,称商汤从去年5月就开始坚信多模态大模型是未来,刚开始采取核心模态+次要模态的路径,但总会有一个模态被削弱,之后投入大量训练,最终实现了两个以上模态间的并存。 去年,商汤生成式AI业务收入达到24亿元,在总收入中占比达到63.7%,同比涨幅超过100%。 今年年初,依图科技联合创始人林晨曦在接受媒体采访时,表示依图目前专注做以视觉为中心的多模态模型,这是通向AGI的一个重要方向,即空间智能。 同时他坦言,最近三年虽然没赚大钱,但公司是盈利的,业务现金流为正,已经在AI商业化有了初步的探索基础。 而旷视科技在算力上缺乏优势,选择通过算法优化减少对硬件的依赖,与车企合作,转向智能辅助驾驶的纯视觉方案。 旷视创始人印奇空降成为千里科技董事长,与吉利共同推出了覆盖全系车型的智能辅助驾驶系统。 在问到依图未来10年的最终目标是什么时,林晨曦坦率说,我们很少谈3年以上的事情,更多的在谈未来三个月、三周的事情,因为发展不是口号喊出来的。 现在的AI四小龙,不飘了,很务实。
机器人马拉松冠军诞生,谁是背后的股东?
天工队选手“天工Ultra”夺冠。图/北京亦庄官微 文|《财经》特约撰稿人 成孟琦 编辑|杨秀红 “人类围观机器人跑马拉松的时代真的来了!”4月19日,2025北京亦庄半程马拉松暨人形机器人半程马拉松赛事火爆出圈。20支形态各异的机器人队伍同台竞技,它们憨态可掬的“跑姿”引发全网热议,更是火上了热搜。 赛场上,既有身高近2米的大高个机器人率先领跑,也有以女性形象设计的“美女”机器人优雅前行;甚至出现机器人头部脱落仍坚持比赛的励志场景。最终,来自北京亦庄的“天工Ultra”凭借2小时40分42秒的成绩,成功问鼎全球首个人形机器人半程马拉松冠军。 “天工Ultra”身高约1.8米、体重约55公斤,由北京人形机器人创新中心研发。 企查查显示,北京人形机器人创新中心成立于2023年11月,由北京小米机器人技术有限公司(下称“小米机器人”)、北京优必选智能机器人有限公司(下称“优必选”)、北京京城机电产业投资有限公司(下称“京城机电”)、北京亦庄机器人科技产业发展有限公司(下称“亦庄机器人”)共同持股。其中,小米机器人、优必选和京城机电持股均占比28.57%,亦庄机器人持股 14.29%。 至于本次比赛对产业端的意义,北京亦庄方面表示,此次人形机器人马拉松赛事,是在复杂开放环境中测试机器人持续运行能力的检验机会,后期目标是为机器人行动能力的产业化需求铺路。 据悉,北京亦庄近期发布了万台机器人创新应用计划,将在九大标杆场景提供超万个应用机会。 天工机器人夺冠 此次夺冠的天工机器人为了完成21公里的长距离赛程,克服了哪些难点?对此,天工队发言人魏嘉星透露:“为在此次马拉松中取得优异成绩,我们攻克了本体的稳定性、轻量化设计、关节长时间运动易发热等硬件难题,还通过优化运动控制算法进一步增强了关节协调运动能力、步态协调能力和复杂地形通过能力等。” 据《财经》了解,“天工Ultra”不仅将时速从6千米/时提升到最高峰值速度12千米/时,还搭载通用具身智能平台“慧思开物”,能在斜坡、楼梯、草地、碎石、沙地等多种地形平稳移动,具备带有视觉感知的泛化移动能力,能轻松应对沟壑、大高度差等复杂地形,并拥有强大的抗干扰能力,受外力冲击依然能保持稳态。 亚军与季军也已出炉,小顽童团队的松延动力N2机器人获得亚军,来自上海卓益得机器人有限公司的行者二号机器人获得季军。 人形机器人选手松延动力N2机器人夺得亚军。图/北京亦庄官微 机器人跑马拉松,不是单打独斗,还有两三名人类队友打辅助,作为一整个队伍参赛,因此不仅需要机器人会跑,还考验人类和机器人之间的配合。 有趣的是,作为理性和秩序感代表的机器人,在这场全程21公里的马拉松比赛中,反而比人类更状况百出。 “可以看到,20支队伍里,只有7支参赛队完赛,大部分中途换电池,还有很大一部分机器人跑步途中需要对膝盖喷散热剂,曾经上过春晚的宇树机器人,开跑就摔倒了。”一名机器人行业从业者在现场观看比赛后表示。 不过,在该场比赛结束后,宇树科技对此发布声明称:“宇树最近完全没有参与任何比赛,主要忙着准备人形机器人的格斗直播。G1人形机器人,从2024年发货开始,已经出售给全球非常多的客户,使用了很久。所以这次马拉松比赛,也有好几个独立的团队使用我们的机器人。比如我们的客户用他们自己的算法参与了比赛,所以在现场能看到不少我们的机器人。有好几个独立团队在使用,不同人操作或开发情况下,机器人的表现差别很大,请大家不要误解。” 宇树科技同时表示,“机器人和其他电子产品类似,表现性能和使用者息息相关,希望大家一起共同推动机器人行业的进步。” 作为全球首场机器人马拉松比赛,也有机器人选择稳妥为主,以“竞走”形式参赛。比如被网友亲切称为“老太太”的EAI机器人,时速只有5.4公里,陪跑的工程师表情也很轻松。最终,EAI反而超过了不少摔倒的机器人,夺得第五名。 北京经开区管委会副主任梁靓表示,机器人与人同场竞技具有双重意义:一方面,极限场景倒逼技术突破,推动机器人在运动控制、环境感知等领域实现跨越式发展;另一方面,通过公众参与和媒体传播,提升社会对“人机共生”的认知,加速机器人产业商业化落地。 背后公司有哪些? “天工Ultra”背后,有两家港股上市公司:2023年上市的优必选和2018年上市的小米集团。 《财经》了解到,优必选是北京人型机器人创新中心的发起单位和总经理单位。2023年底,优必选与京城机电、小米机器人、亦庄机器人等10家企事业单位共同出资联合组建了北京人形机器人创新中心,优必选CTO(首席技术官)、执行董事熊友军担任创新中心的法定代表人和总经理。 “这是历史性的一刻,机器人完成了半马的赛程。”熊友军在当日比赛结束后表示,“今天(4月19日)的马拉松比赛是我们检验技术成熟度的很重要的一个方式,希望未来机器人能真正走入生活,帮助人类在一些不适合工作的危险场所进行作业。” “在北京人型机器人创新中心成立之初,优必选不仅调派了研发人员协助启动多个项目,还向创新中心开放了300多项专利,助力快速研发通用机器人母平台‘天工’,实现了全球首个全尺寸纯电驱人形机器人的拟人奔跑,最高速度超过12千米/时。”优必选相关人员对《财经》表示。 优必选也曾和北京人形机器人创新中心联合推出过面向市场销售的科研教育具身机器人。2025年3月,具备高仿生、高强度、高性能、高稳定、高拓展、高开放的“天工行者”开始面向市场销售,定价29.9万元起。 以制造手机与新能源汽车知名的小米集团,早在2021年便曾推出过机器人产品。在2021年8月10日小米MIX系列最后一代产品MIX 4发布会末尾,小米集团董事长雷军展示了小米第一款四足机器人CyberDog,这款机器狗支持手机、手机+遥控器、语音三种控制方法。 2022年8月11日,在CyberDog诞生一年后,小米又发布了首款全尺寸人形仿生机器人“铁大”。据悉,“铁大”身高177厘米,体重52千克,具备强大的情绪感知能力,能够辨别85种环境语义、45种人类情绪。 此外,取得本次比赛亚军的小顽童团队的N2机器人是由松延动力(北京)科技有限公司(下称“松延动力”)研发并参赛的人形机器人。松延动力成立于2023年9月,专注于人形机器人与具身智能领域,成立不到两年已累计完成五轮融资,投资方包括金沙江创投、英诺天使基金等知名机构。 北京亦庄方面表示,接下来,将持续深化机器人产业生态建设,重点推动本体企业与具身智能企业协同创新,将赛事的影响力转化为支持人形机器人产业化落地的动力,加速构建国内领先、国际一流的具身智能机器人产业领航示范新城。
AI版本宝可梦冲榜上全球前10%!一次性“吃掉”10年47.5万场人类对战数据
新智元报道 编辑:定慧 【新智元导读】还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没用启发式算法,纯靠47.5万场人类对战回放训练出来,居然打上了Pokémon Showdown全球前10%! AI 又有「新活」了! 德州大学奥斯汀分校的研究团队用Transformers和离线强化学习训练出了一个宝可梦对战AI智能体,不但打法像人,还能在全球排名中杀进前 10%。 论文地址:https://metamon.tech/ 是的,你没看错,这不是那种靠搜索和规则的AI,而是靠人类历史对战数据「喂出来」的智能体,能自己学着打。 这个宝可梦游戏(全称Competitive Pokémon Singles)有多复杂呢? 在对战平台https://pokemonshowdown.com/上可以看到,即使不考虑策略,光是精灵、动作和物品的数量已经多到了非常夸张的程度(根本翻不完)。 这意味着,AI要在信息不完全、策略博弈的环境中,把每一步出招、每一次换人,都当成下围棋一样来算。 宝可梦对战融合了国际象棋般的长远策略规划、扑克牌那样充满未知信息和随机性,再加上足以填满一本百科全书的宝可梦、招式、特性和规则。玩家需要精心设计和操控自己的宝可梦队伍,击败对手的所有宝可梦才能获胜。这样一个充满不确定性、状态空间极其庞大的游戏,对AI来说是绝佳又极具挑战性的研究课题。 这种硬核程度,更像是宝可梦版的《星际争霸》。 把「回放」喂给 AI,教它打宝可梦 研究团队开发了一个名为Metamon的平台,它使用来自Pokémon Showdown(以下简称PS)的人类游戏数据集来启用离线RL工作流。 PS会创建一个日志(过程「回放」),记录每场战斗。 玩家保存日志以供日后研究、与朋友分享有趣的结果,或作为记录官方锦标赛结果的证明。 PS的回放数据已经超过十年——足够的时间积累数百万个重放,比如下面的是10年前2014年的战斗回放。 PS回放数据集是一个完全的、自然发生的人类数据集合,但这个数据集有个问题——这些数据是以第三方角度收集的,而不是第一人称,训练智能体需要用第一人称视角。 研究团队通过将观众视角分别转换为每个玩家的视角来解锁PS回放数据集。 最终,研究团队搞出一个47.5万局真实人类对战组成的离线强化学习数据集,而且每天还在持续增长中。 在序列数据上使用离线强化学习算法训练 宝可梦拥有一个非常复杂的状态空间,因此在使用离线强化学习(offline RL)进行训练时,策略模型可能需要具备较大的规模和复杂的结构。 为了使训练过程更加稳定,将这个问题转化为行为克隆(Behavior Cloning, BC)的角度来理解:预测一个人类玩家的动作,实际上是在尝试推理模仿的这个玩家的策略,以及他们对对手的理解。 为了实现准确的预测,模型往往需要较长的上下文输入。 强化学习(RL)在这种场景下的作用,是帮助我们从包含了不同水平玩家(包括竞技和休闲玩家)决策的大规模数据中,筛选出有效信息。 采用的解决方案是actor-critic架构,其中critic的训练方式是使用标准的一步时序差分(temporal difference, TD)更新来输出Q值。至于actor的损失函数,其一般形式如下: 接下来,需要为CPS(Competitive Pokémon Simulator)定义观测空间、动作空间和奖励函数。 智能体需要获取足够的信息,以便能够模拟人类玩家的决策,而PS网站的用户界面是一个显而易见的参考点。 不过,由于模型具备记忆能力,因此无需在每一个时间步都提供全部信息。 最终达成了一个折中方案:输入由87个文本词语和48个数值特征组成。 下图展示了数据集中一场回放中的示例。观测只包含对手当前上场的宝可梦。 仅仅依靠强化学习能打赢人类吗? 传统做法教AI玩游戏,通常会设计规则、模拟状态、设计算法。 但这篇论文反其道而行之:直接喂数据,让它「模仿」人类怎么打。 他们训练了多个大小不同的智能体,从1500万参数的小模型,到2亿参数的大模型。 其中有的通过模仿学习训练(IL),有的则用离线强化学习(RL)进一步优化,还有的则加上「自我对战」的数据做微调。 可以在Pokémon Showdown上观看各个模型的游戏重播。 最强AI打上全球天梯前 10% 说了这么多,这AI真的能打吗? 研究者将多个版本的模型送上Pokémon Showdown的天梯服务器——这是全世界宝可梦高玩集中的地方。 结果模型居然排进了全球活跃玩家的前10%,并成功登上了排行榜。 在图中展示了Glicko-1阶梯分数及其评分偏差。柱状图标签标注的是GXE(胜率期望)统计数据。 阶梯分位数(Ladder Percentiles),在 2025年2月至3月期间下载的回放数据中,共识别出14,022个在第1到第4世代活跃的用户名。 以第1世代(Gen1)为例,在这些用户名中,有5,095个参与了 Gen1OU(标准对战规则),其中有2,661个活跃度较高,达到了在最终结果统计时拥有有效 GXE(胜率期望)数据的标准。 这可能是你第一次听说有人用Transformer打宝可梦,还打赢了人类。 但从技术视角看,这背后是强化学习、模仿学习、大模型训练和数据重构的完整链路。 它不只是一个「有趣的实验」,更像是一次对数据驱动游戏 AI 的深度演练。 下一步,或许可以不是打游戏,而是让AI玩转更复杂的现实任务。 此外,不同的训练策略以及大规模自我对战(self-play)技术,或许能够让智能体带来超越人类表现的突破。
蔚来萤火虫定价 11.98 万元!暂时无法换电,但车主却能进牛屋
蔚来萤火虫的最终上市价最终定在了 11.98 万元和 12.58 万元 ,比预售价便宜了 2.3 万元-2.9 万元,两个版本的差异只在于内饰材质,其他部分都是相同的。 Bass 方案的价格则是先藏了一手,要到 8 月份才有方案。一方面是因为萤火虫虽然支持换电,但是只能用蔚来的五代站,最快用上也要到明年了;另一方面,蔚来估计也是想看看市场的反应,到时候也有调整的空间。 咱们还是先来一起回顾下蔚来萤火虫的核心配置。 长宽高分别为 4003 / 1781 / 1557 毫米,轴距 2615 毫米,4.7 米转弯半径。 42.1 kwh 磷酸铁锂电池,CLTC 综合续航 420km。 13.2 寸中控屏 + 6 英寸仪表盘,高通骁龙 8155P 芯片。 地平线征程 5 智驾芯片,128Tops 算力,支持 ACC 和高快 NOP 功能。 其他的舒适性配置则可以参考下图。 在 12 万左右这个区间里,配置算是中规中矩,没硬伤但也没惊喜。 那蔚来打算靠什么让这辆萤火虫在 10 万元的市场中具备竞争优势呢? 蔚来自己给出的答案是——最安全的小车,最智能的小车,以及具备独特情绪价值的小车。 待兑现的情绪价值 我们从后往前,先看情绪价值的部分。 外观设计算是情绪价格很重要的一部分。但是萤火虫从谍照阶段开始,对于其外观的争议就从来没有停止过,其中争议最大的是其前脸灯组的设计。 董车会之前在 NIO Day 总结文章里面的投票中,有 6000 多人参与了投票,其中仅有 800 余人觉得萤火虫好看,占比不到 15%,行业内的其他媒体和人员也大都觉得建议蔚来对车灯的设计进行修改。 但是蔚来自己倒是很有自信,直言不会做修改。 大家比较了解蔚来,造型的东西永远都是有人喜欢有人不喜欢,但是呢,我们可以很自豪地说,萤火虫是一个纯原创的高端小车。 …… 有网友说大灯像复眼,问题萤火虫本身就是昆虫,真要论起来也合理。至于设计有没有 Plan B?这个真没有。 (蔚来高管秦力洪) 情绪价值的第二个部分,是蔚来一直以来独特的换电和服务体系, 蔚来今天宣布了萤火虫车主可以享受蔚来的全套服务,包括上门补胎、取送车以及可以溜猫、遛狗的各种驾享服务,之前曾经宣传过的针对萤火虫车主提供的专属独特服务,这次发布会似乎没提了。 对了,萤火虫车主可以进牛屋。 但驾享服务也不是完全免费的,萤火虫官网的驾享服务包有 499 / 1399 / 4999 三档可选。 换电服务目前暂时处于「大饼」的状态,萤火虫这块 42.1 度的电池不兼容目前蔚来 1 到 4 代的任何一座换电站,而蔚来说可以支持的五代站最早将会在明年 1 月份投入使用。 而且萤火虫的产品负责人金舸曾经在接受采访时提到萤火虫不会超前建站。 比如说半径5公里内,已经聚集了一定数量的用户,用户就可以在APP里举手,要求帮我建个站,用这种方式来增长。 这样的话,至少在最初的一两年,萤火虫在补能的体验上就很难说能提供什么情绪价值了。 普通智驾、高配安全和亮眼车机 在去年 12 月份的这个时间节点,蔚来可能认为在一辆 10 万元级别的小车上搭载高快速路的 NOP 系统,应该就可以算的上同级最强了。 但是蔚来显然低估了智驾系统降价和普及的迅速程度,无图 NOA 功能在 13 万元级车型上搭载的情况也并不少见,而且各家的智驾功能也从去年的付费使用逐渐普及成了标配功能。 蔚来对此显然是有所认知的,但是受限于成本等各方面原因只能维持现状,不然也不会把萤火虫智驾功能改成了「十年免费」,多少显得有点扭捏。 值得特别提一句的是,蔚来萤火虫的智驾供应商地平线 18 号的发布会上,还拿了萤火虫作为代表车型,但是萤火虫并未用上最新的征程 6 系芯片,而是使用了上一代的征程 5。 安全性上倒是没什么槽点,前向预警、盲区监测、误加速抑制辅助和前后的 AEB 功能都有,硬件上则特别提到了安全气囊的气帘保压时长超过了 22s,超过了标准需求的 4 倍,侧气帘的长度也直接覆盖了 A柱到 B 柱的部分。 蔚来萤火虫这次在在座舱内部的细节设计、车机系统的交互体验方面做的不错,UI 设计很好的契合了年轻化的基调,尤其是在屏幕的不同区域用双指滑动的方式来调节音量、空调温度等的交互方式很好的解决了没有实体按键的痛点。 总结一下,蔚来萤火虫在这个价位段是一辆「外观有争议」、「配置没惊喜」、「服务待兑现」的车,或许能在追求年轻化和个性化的消费者中激起一些波澜,但要说想达到李斌一个月交付几万台的目标,可能有点难。 不过,这次萤火虫的发布会倒是挺简洁,没有会场、没有大屏,甚至主讲人也不是李斌,看来确实开始省钱了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。