行业分类:
加载中...
头条分类:
加载中...
辛选员工集体跑路,辛巴在崩溃边缘
麻烦缠身,问题不断,辛巴的日子不好过。 出品 | 电商派Pro 作者 | 李响 “忠诚六年命都快没了”。 快手头部主播蛋蛋此前在直播间表示,自己遭受了职业暴力,现在左耳永久失鸣,脑部也已受损,甚至胳膊和鼻子都曾骨折。 这位“快手一姐”,辛巴亲手培养的接班人,就此与辛选解约,和昔日恩师辛巴彻底决裂。 而在蛋蛋直播控诉不公没多久,辛选陷入了前所未有的震荡。辛巴老婆初瑞雪接管公司后,开始推行“铁腕改革”,要求月薪1万以上员工降薪3%-20%,不同意者可拿赔偿离职。 而不少拿到赔偿的员工,转身就投入蛋蛋新公司的怀抱。 这场轰轰烈烈的师徒反目,将那些隐藏在直播带货行业“家族化管理”制度下的矛盾与裂痕,彻底暴露在大众视野中。 徒弟蛋蛋出走,大量员工跑路,辛巴已经焦头烂额 辛巴和蛋蛋这对曾经的“金牌师徒”,为什么会走到这一步?下面就跟着李响一起来梳理这场震动直播圈的“师徒反目”大戏。 故事的伏笔,早在今年6月就已埋下。618大促落幕不久,身为“快手一姐”的蛋蛋突然停更所有社交账号,毫无征兆地从公众视野中消失。 这一消失,就是四个月。甚至在8月辛巴的退网直播中,蛋蛋也并未出现,辛巴直播间还直接屏蔽了“蛋蛋”等关键词。 明眼人都看得出来,这对师徒间的裂痕,已难以掩饰。 而矛盾的大爆发,始于10月。在这个月,蛋蛋接连注册两家新公司,自己持股99%绝对控股,用最直接的方式与辛选彻底割席。 紧接着,她正式复播。在直播过程中公开控诉称,在辛选期间她长期遭受职场暴力,不仅患上创伤性应激障碍,左耳更是永久失鸣,身上还有多处骨折。 图源:快手 “每次突然停播都是紧急就医,甚至要远赴国外治疗。”蛋蛋在直播间言辞激烈地问道,“如果是你的孩子、女儿呢?” 同时,蛋蛋还透露2019到2022年所有税后收入都被掌控,连私人积蓄都要上缴。仅仅迟交一天,就被迫消失四个月。目前,她已与辛选完成解约,但“独立”并非自己主动要求。 她表示,在辛巴退网之前,就已经把她独立出来了,后面所有人都会独立。 图源:微博 图源:快手 面对这番突如其来的控诉,辛选方面始终保持沉默,只有高管伽柏发声呼吁“默默支持蛋蛋”。 可蛋蛋显然不接受这种敷衍,直接喊话辛巴称,如果师傅不说出真相,她就自己说。 然而,她的发声也没能等到辛巴的正面回应,倒是间接引发了辛选内部的人员“地震”。 一位与辛选长期合作的商家透露,蛋蛋团队已经从广州迁回杭州,并且带走了不少辛选核心骨干。 他声称,辛选招商中心与商品中心的负责人职务均未发生变动,二者均属于辛巴的核心嫡系团队。不过自蛋蛋独立运营之后,这两大中心有不少业务人员转投至蛋蛋的新团队,比如现任蛋蛋团队招商负责人,此前正是辛选招商中心的副总监。 还有辛选员工爆料,“蛋蛋团队的工作节奏很可怕,但是蛋蛋出手也很大方,很多人过去都涨薪了。” 值得注意的是,虽然蛋蛋已独立运营,但经查询,她快手主账号的店铺主体仍为广州辛润网络科技有限公司。 图源:天眼查 不过,天眼查信息显示,该公司全资股东已从广东辛选控股有限公司变更为自然人季俊良,而季俊良正是蛋蛋新注册的两家公司(杭州润星娱乐有限公司、杭州润心娱乐有限公司)的法人,这两家公司均成立于今年10月,蛋蛋(杨润心)持股比例均为 99%,业务覆盖直播电商、供应链管理等核心领域。 图源:天眼查 如此看来,蛋蛋的确已经完成了从“辛选主播”到“独立创业”的实质改变,不仅在法律层面与辛选划清了界限,更手握了绝对的商业控制权。 目前,蛋蛋的新公司已经崭露头角。公开数据显示,双11蛋蛋首秀销售额直接突破55亿,新账号粉丝量也迅速突破千万,势头相当猛。 图源:微博 另据新浪科技透露,有辛选员工表示,目前辛选员工总数大概1000多人,而3年前还有4000多人。“大部队都在广州,只有不到百人在杭州,杭州主要是职能部门以及自营业务的员工。” 其中,不少从辛选离职的员工,最终都选择加入了蛋蛋的新公司,成为她创业路上的“主力军”。 或许是对蛋蛋独立一事有所不满,辛选旗下主播赵梦澈在近日的一场直播中表示,自己单场卖出20 亿的成绩,主要归功于师傅辛巴提供的热度,还特意强调,人不能轻易总结自己的能力和成功,尝到甜头时应反思真正的自我,而非将所得视为理所当然。 图源:赵梦澈快手 很快,这被外界解读为“隔空喊话蛋蛋”。 这场闹得沸沸扬扬的师徒反目大戏,显然还没有彻底结束。 需要注意的是,辛巴和蛋蛋的矛盾其实早已出现。 把时间拨回2019年,22 岁的蛋蛋加入辛选集团,被辛巴看中并钦定为“接班人”。 镜头前,辛巴曾多次公开表示要倾尽资源培养蛋蛋,师徒情深的画面曾感动无数粉丝。 力捧的效果也立竿见影。据新榜统计,2020年双11蛋蛋单场带货2.7亿,全年GMV达80亿;2023年她与辛巴共同创下300亿的业绩纪录,其中个人贡献达171亿;2024年9月19日,蛋蛋成为全网首个粉丝破亿女主播;今年4月,辛巴还公开表态要为蛋蛋成立独立公司。 图源:辛选官方微博 可谁能想到,表面和谐的师徒关系背后,却是另有隐情。 根据蛋蛋的说法,她不仅要承受身体上的伤害,连收入都被完全掌控,即便成为顶流主播,也始终没能拥有真正的自主权。 在辛巴构建的商业帝国内,她更像一个被精心打造的带货工具人,而非平等的合作伙伴,她的个人品牌价值再高,最终都会反哺到辛巴的主 IP 和辛选集团的商业版图中。 当然,这场师徒闹掰的戏码,也是网络时代的罗生门。目前所有的控诉都来自蛋蛋一方,辛选集团始终保持沉默,未给出任何官方回应或针对性反驳。 真相究竟是蛋蛋遭遇了不公的控制与职场暴力,还是师徒决裂后的利益博弈与舆论攻防,外界暂时无从考证。 但不可否认的是,这场单方面的发声,一定程度上也撕开了直播圈“家族化管理”的光鲜面具,暴露出背后权力失衡的真实现状。 后续,会不会有更多细节浮出水面,仍需持续关注。 MCN机构面临洗牌,去家族化或成必然 从行业角度看,蛋蛋与辛巴的决裂事件,加速了直播行业“去家族化”进程。头部主播“家族化”权力格局正在瓦解,平台流量从集中化向去中心化转型,为中腰部主播创造更多发展空间。 有业内人士表示,此次事件将成为直播电商行业的重要转折点,产生多重深远影响:一方面加速头部主播“家族化”权力格局的瓦解,另一方面倒逼MCN机构摒弃“吸血式分成”“高压管控”等粗放模式。 以辛选为例,在初瑞雪接棒后,其公司不仅推行裁员降薪,还将主播合作模式从签约制改为合伙制,主播分成提升至60%,但需成立独立公司,自负盈亏。 图源:微博 某种程度上,直播电商正在从依赖个人光环的草莽时代,走向规范化的下半场。 行业变革已至,那些靠师徒绑定撑起的直播帝国,明显已跟不上规范化的时代节奏,正在逐渐失去生存土壤。取而代之的,必然是更注重平等博弈、更强调规则边界的合作模式。 接下来,或许只有那些率先拥抱变化,搭建起规范化体系的玩家,才能行业发展下半场,抢占到真正的先机。
雷军甩出王炸!小米新模型比肩DeepSeek,我们试了试
作者 | 黄婉宜 编辑 | 周伟鹏 上个月,雷军以千万年薪挖角的95后AI才女罗福莉正式官宣入职小米,担任Xiaomi MiMo团队负责人。 她迎来入职后的首次公开亮相,她身着皮衣,带来了小米重磅产品——Xiaomi MiMo-V2-Flash开源MoE模型。 01 生成速度很快,性价比很高 12月17日,在人车家全生态合作伙伴大会上,罗福莉详细介绍了Xiaomi MiMo-V2-Flash,在多个Agent测评基准上进入全球开源模型Top 2,基准测试性能媲美DeepSeek-V3.2。 Xiaomi MiMo的核心亮点是高效推理与极高性价比。 据罗福莉介绍,“Xiaomi MiMo-V2-Flash是一个非常小的模型,总参数只有309B,激活参数只有15B。” 用通俗的方式理解,模型的总参数量相当于发动机总排量,活跃参数量则是实际干活输出的排量,小米这款模型以近乎一半的硬件成本,实现了更高效的性能。 而作为对比,DeepSeek-V3.2的对应数据分别为671B和37B。 这意味着小米模型处理任务时实际调动的资源仅为DeepSeek的一半左右,却能与DeepSeek-V3.2、Kimi-K2等头部开源模型同台竞技。 速度方面,Xiaomi MiMo-V2-Flash每秒能输出150个token,相当于“每秒打150个字”,远超DeepSeek-V3.2约每秒30个token的速度,带来更低延迟和更快的生成体验。 而且它的API服务每百万输入token收费0.7元,输出token每百万2.1元,比DeepSeek-V3.2便宜了一半。 作为DeepSeek前团队成员,罗福莉这次展示的小米大模型,也同样展现了对极致效率的追求,DeepSeek味很浓。 02 科小编亲自测试了一把 目前,该模型支持一键生成电商页、小游戏等HTML网页,所有内容已开源,大伙儿可以免费体验网页端,开发者还能享限时免费API调用。 那么实际体验到底如何?科小编亲自体验了一番。 进入Xiaomi MiMo官网,页面设计十分简洁,只有深度思考、联网搜索两个核心选项。 首先测试日常问答功能。 当被问及“朋友失恋了,我应该如何安慰她?”时,Xiaomi MiMo的响应速度最快,用时3.7秒。 而千问用时5秒,DeepSeek-V3.2则需要10秒,三者给出的回答内容相差不大。 再试试难点的,让它“找最近的AI新闻”,Xiaomi MiMo花了20秒才出来结果,而且新闻全是9月份的,有点滞后。 而DeepSeek-V3.2只花了13秒,找的都是12月份的最新消息,信息也更全。 翻译功能这块,Xiaomi MiMo就显得有点“直来直去”,之前测千问的时候,它给的译文十分优雅: 小米这款大模型在表达还得再下点功夫。 最后重点试了它的亮点功能——生成网页,我让它做一个“豪华互动圣诞树”的高保真3D网页,要求视觉效果拉满,但试了好几次都卡住了,生成不出来。 而这是官方生成的效果: 这可能是高保真3D网页需要大量的图形资源和实时渲染能力,而Xiaomi MiMo现在仍处于初期,服务器对单次生成的资源占用和算力分配有上限,遇到这种大体积的3D项目,就会因为算力不够、加载超时卡住。 豆包、DeepSeek-V3.2,面对同样的要求,只能给出文字描述,做不出实际的网页。 和豆包对比常用功能,Xiaomi MiMo仍然存在一些差距。 在能力上,Xiaomi MiMo在推理的过程中检索的网页比较少。 豆包则会关联多个网页,给出更加全面的信息。 而且豆包现在有很多功能,包括帮我写作、AI创作、打电话、豆包P图等等,而现在Xiaomi MiMo仅仅只有两个,分别是深度思考和联网搜索。 关掉深度思考功能后,Xiaomi MiMo 延迟明显变高,给出的回答基本没什么参考价值,而豆包即便关掉这个功能,也能提供一些可用信息。 值得关注的的是,这次模型首秀选在“人车家全生态” 大会上,这意味着 Xiaomi MiMo 未来会成为小米打通 “人车家” 生态的关键工具,让汽车、空调、灯光、音响等设备实现智能协同,给大家带来新的生活体验。 不过短期内,MiMo 可能只会在一些简单的场景落地,想要真正理解这其中的协同逻辑,还需要后续持续的技术迭代和优化。
全球最小全自主可编程机器人诞生:接近细菌尺度 成本仅1美分
快科技12月17日消息,美国宾夕法尼亚大学与密歇根大学的科研团队成功研制出世界上最小的全自主机器人,其尺寸仅为200 x 300×50微米,接近细菌尺度,却能通过编程在液体中自主执行复杂运动。 这项突破解决了微型机器人领域持续约40年的关键难题:制造尺寸小于1毫米、能独立运行且具备完整功能的机器人,一直因技术复杂而进展缓慢。 在微观尺度下,重力与惯性等宏观世界的主导力被流体阻力与粘滞力取代,传统机械运动方式难以适用。 为此,团队摒弃活动部件,创新性地通过产生电场驱动周围离子,借助水流反作用实现推进。这种设计使机器人结构坚固、寿命延长,且无需外部磁控或线缆牵引,仅依靠一束LED光即可持续运行数月。 更重要的是,团队在极低功耗下集成了处理器、内存与传感器,使机器人具备感知、决策与行动能力。它们能感知局部温度变化(精度达1/3摄氏度),并通过编码特定动作模式与环境交互,形成自主闭环,每颗机器人成本仅约一美分。 作为首款集处理器、内存、传感器与制动器于一体的亚毫米级全自主机器人,其应用前景广泛。凭借细胞级尺寸,它们有望进入人体,实时监测细胞健康状态,甚至实现靶向药物递送。 此外,通过编程控制,群体机器人可协同作业,在微观尺度上完成复杂结构的组装,为微机电系统、生物医学等领域带来新的可能。
YouTube将自2029年起面向全球免费直播奥斯卡颁奖典礼
美国电影艺术与科学学院宣布,自 2029 年起,奥斯卡金像奖颁奖典礼将正式登陆 YouTube 平台,并通过免费直播向全球观众开放,同时在美国地区通过 YouTube TV 播出。根据双方达成的协议,这一独家合作将至少持续至 2033 年,涵盖颁奖礼直播以及配套的各类扩展内容。在此之前,奥斯卡将继续由美国广播公司(ABC)负责转播至 2028 年第 100 届颁奖礼结束。 届时,YouTube 不仅会直播颁奖典礼全程,还将提供红毯秀、后台花絮以及理事会宴会(Governors Ball)等环节的内容,为观众呈现更完整、更具沉浸感的奥斯卡之夜。学院首席执行官比尔·克拉默(Bill Kramer)和学院主席莱奈特·豪威尔·泰勒(Lynette Howell Taylor)在声明中表示,与 YouTube 的合作将借助其庞大受众规模和技术能力,为奥斯卡及学院其他节目注入更多创新互动方式,同时延续和尊重奥斯卡这一传统品牌的历史遗产。 在合作正式敲定前,外界早在今年稍早时便有传闻称 YouTube 正积极洽谈奥斯卡版权事宜,如今随着协议公布,这一流媒体平台将接棒传统电视网络,成为这一顶级娱乐盛事在全球范围内的主要播出渠道。业内人士普遍将此视作好莱坞颁奖礼与互联网平台深度结合的重要里程碑,也反映出大型直播活动从线性电视向流媒体平台加速迁移的趋势。 值得一提的是,近年来其他流媒体平台也在加大对大型颁奖活动的投入。Netflix 就从 2024 年起通过其平台直播美国演员工会奖(SAG Awards),这是双方多年度合作协议的一部分。随着奥斯卡与 YouTube 牵手,这些流媒体平台正逐步构建起属于自己的重磅内容矩阵,在争夺观众注意力和广告资源方面同传统电视网络展开更直接的竞争。
Pornhub遭黑客勒索 此前大量高级会员搜索与观看记录被盗
成人视频网站 Pornhub 近日证实,其部分高级会员的搜索与观看活动数据在第三方分析服务商 Mixpanel 的安全事件中遭泄露,并被黑客团伙 ShinyHunters 用于敲诈勒索。 Pornhub 在上周发布的安全公告中表示,此次事件源于 Mixpanel 的一次网络攻击,涉事数据仅涉及“部分高级用户”,且并非 Pornhub 自身系统遭入侵,用户密码、支付信息及财务数据未被曝光。 根据早前披露的信息,Mixpanel 于 2025 年 11 月 8 日遭遇一次短信钓鱼攻击,黑客借此入侵其系统,导致部分客户数据泄露,OpenAI 和 CoinTracker 等公司此前已先后确认受到同一事件波及。 Pornhub 称,其自 2021 年起已不再使用 Mixpanel 服务,意味着目前被盗数据属于 2021 年及更早时期的历史分析数据。 Mixpanel 则表示,受影响的是“数量有限”的客户,并强调目前并无证据表明 Pornhub 此次被用于敲诈的那批数据源自 11 月的这起安全事件。 BleepingComputer 获悉,ShinyHunters 上周开始向多家 Mixpanel 客户发送勒索邮件,自报家门后威胁称,如不支付赎金,将公开所掌握的数据。 在发给 Pornhub 的勒索信中,该组织声称从 Mixpanel 窃取了 94GB 数据,包含超过 2 亿条与个人信息相关的记录。 ShinyHunters 随后向媒体进一步确认,这些数据涵盖 201211943 条 Pornhub 高级会员的历史搜索、观看和下载活动记录。 BleepingComputer 查看的一小部分样本显示,Pornhub 发送给 Mixpanel 的分析事件数据中,包含大量用户高度敏感的信息。 这些字段包括高级会员的邮箱地址、活动类型、地理位置信息、视频链接、视频标题、视频关联关键词以及具体的事件发生时间点。 已观测到的活动类型包括观看视频、下载视频以及浏览频道等,ShinyHunters 还表示,其中同样包含用户的搜索历史数据。 值得注意的是,Mixpanel 在回应中强调,当前没有发现这批用于敲诈的数据是在其 2025 年 11 月安全事件中被窃取,且相关数据在 2023 年最后一次由 Pornhub 母公司的一名合法员工账号访问。 Mixpanel 表示,如果这些数据如今落入未授权方之手,其原因“并非源于 Mixpanel 的安全事件”。 Pornhub 在被媒体问询时则未提供除公告之外的更多细节评论。 ShinyHunters 近年来频繁出现在多起重大数据泄露事件中,主要通过入侵各类与 Salesforce 集成的服务提供商,进而访问企业的 Salesforce 实例并窃取大量公司数据。 该组织与此前曝光的 Oracle E-Business Suite 零日漏洞(CVE-2025-61884)利用事件有关,也与针对 Salesforce/Drift 的攻击相关,这些攻击在今年早些时候影响了众多组织。 更近一步,ShinyHunters 还被指控入侵客户成功平台 GainSight,从而进一步窃取更多组织托管在 Salesforce 环境中的数据。 随着 ShinyHunters 被确认也是本次 Mixpanel 相关事件的幕后黑手,该组织已经成为 2025 年最具破坏力的数据泄露源之一,牵连的企业数量以百计。 同时,该团伙正打造名为 “ShinySp1d3r” 的新型勒索软件即服务平台,与 Scattered Spider 等威胁行为者合作开展更大规模的勒索攻击,使其在网络犯罪生态中的影响力进一步上升。
美参议院通过提名 马斯克盟友确认出任NASA新局长
艾萨克曼 凤凰网科技讯 北京时间12月18日,据科技网站TechCrunch报道,美国参议院确认,亿万富豪企业家贾里德·艾萨克曼(Jared Isaacman)将接任美国宇航局(NASA)局长。 艾萨克曼是SpaceX CEO埃隆·马斯克(Elon Musk)的盟友,也是一位私人宇航员、支付处理平台Shift4的创始人,他将接手一个在特朗普执政下面临巨大不确定性的机构。 在特朗普提名艾萨克曼一年多后,这项任命终获参议院确认。然而过去一年间,艾萨克曼的仕途可谓波折不断。特朗普因担心这位亿万富翁的“过往关联”,曾在今年6月撤回了对他的提名。艾萨克曼曾向民主党人士捐款,但是报道称特朗普首次提名时对此知情。 这场提名风波导致特朗普阵营与马斯克等艾萨克曼盟友展开了数月的相互攻击。马斯克曾公开质疑NASA代理局长肖恩·达菲(Sean Duffy)的公信力。特朗普最终于11月转变立场,重新提名了艾萨克曼为NASA局长。 艾萨克曼如今将掌管一个已“瘦身”的航天机构,并被特朗普要求推进重返月球任务。SpaceX虽已获得载人登月合同,但达菲此前曾威胁撤销该合同,并鼓励杰夫·贝佐斯(Jeff Bezos)旗下蓝色起源公司抢先马斯克完成登月计划。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
当OpenAI开搞AI社交,国内大厂还等什么
在硅谷的叙事体系里,所有的技术跃迁最终都要回归到“人与人的连接”这一终极命题上。 11月底,OpenAI在多个市场低调上线了ChatGPT的群聊功能(Group Chats)。 这一动作看似轻描淡写,实则暴露了这家AI巨头更大的野心 —— 它不再满足于做那个被动等待指令的工具,而是试图切入高频社交场景,成为工作甚至日常社交关系中不可或缺的节点。 图源:OpenAI 当AI chatbot开始拥有社交身份,原本泾渭分明的SaaS协作壁垒与社交网络护城河,都在这一刻出现了裂痕。 “提示词”祛魅,ChatGPT也要有“活人感” 长久以来,ChatGPT在企业与团队中的存在感,往往是通过一个个“中间人”体现的。 在传统的协作流中,总有一个擅长写提示词的人充当着中转站的角色。他们向AI获取方案,经过筛选与修饰,再分发给团队。 这种模式下,AI往往只是单点工具,同时也是效率的瓶颈。 知名科技分析师Ben Thompson不久前也指出过这种模式的低效: “我们距离那些可靠到可以‘完全放手让其独立工作’的智能体究竟还有多远,仍需拭目以待。然而,在此期间,我认为有一个巨大的、由AI赋能的机会目前正被所有主流模型厂商所错失:那就是‘人机协作智能体’(human-AI agents)。” 图源:德勤 OpenAI此次推出的群聊功能,本质上就是呼应上述判断的一次“去中介化”实验。 当ChatGPT作为一个独立账号出现在某个聊天群组里, 它就在物理层面上实现了“活人”化。 像是在一个20人的群组里,当AI给出了一个并不完美的回答,任何人都可以直接介入纠偏。这种协作关系的重构,直接消解了“信息不对称”。 对于Slack或微软Teams这样试图通过“叠加”AI来维持护城河的协作工具巨头而言,这是一个值得警惕的信号。 Teams内部的Copilot依然被层层菜单包裹, 而ChatGPT的群聊却是“AI原生”的——它的存在本身就是为了产生对话。 图源:网络 轻量级的切入,极有可能在非正式协作领域撕开一道口子。 比起在Teams里创建一个复杂的项目组,朋友间策划一次旅行、创业团队进行头脑风暴,直接拉个ChatGPT进群显然更加高效。 不需要审批流程,不需要复杂的权限配置,只需要一个邀请链接,AI就成为了团队的一员。当然这还是在工作层面, 一旦AI群聊进入到日常生活甚至社交层面,那或许会产生更大的波澜。 工具泛用性的终局,谁来做第一个国产“AI群友”? 如果说第一阶段的“百模大战”是在比拼参数与推理能力的硬肌肉,那么随着Gemini Nano Banana Pro、Sora、ChatGPT群聊功能的上线, 竞争正式进入了“场景渗透”的下半场。 OpenAI的这一步棋, 核心商业逻辑在于将AI从相对低频的生产力工具向更加高频的社交软件进行延展 ,不管对目前ChatGPT的模型能力有多大不满,但不可能否认的是,其产品能力依然相当领先。 而对应到国内激战正酣的AI格局,本身就在to C环节上迟迟打不开局面的各路玩家们,或许又有了一个新的竞争方向。 国内部分AI应用 让AI成为新一代的流量入口几乎已经成为了国内巨头们的共识,但到底应该怎么做,就目前来看似乎并没有一个完全统一的思路。 而让AI “进群”,更是尚未成为国内AI工具的标配功能。 目前来看最激进的攻势来自豆包。 作为目前C端AI工具日活的领跑者,近期备受关注的“豆包手机助手”,实际上是在试探AI介入社交的边界——通过屏幕感知技术,它试图在本身没有微信聊天权限的前提下,直接“看懂”你们的聊天内容并提供辅助。 这种系统级外挂的策略,是字节在无法打破微信社交壁垒下的极限微操: 既然进不去群聊,就在屏幕上“覆盖”群聊。 当然很快这种尝试就被微信所封死,从这个角度来看,豆包大概还是需要有更底层的社交能力,群聊功能大概不会来的太晚。 豆包手机助手 而元宝作为腾讯在AI正面战场的排头兵,经过了之前大规模投流出圈后下半年明显偃旗息鼓。但腾讯手上的微信其实才是尚未使用的王牌。 一旦微信官方开始在其社交功能中深度整合AI能力,它将直接接管微信内的搜索、支付、本地生活推荐等入口,基本上能够直接实现豆包手机助手想要实现的一切。 腾讯或许还在等待一个完美的“AI Super App”终极进化时刻。 而对于急于在C端找到存在感的千问,AI群聊或许是其助力阿里打破“社交魔咒”的唯一机会。 毕竟当下各家都还在大力宣传AI的解决问题的能力,但现实普通人日常或许并没有那么多问题需要靠AI来解决,反而跟AI一起扯闲篇以及做出一些生活小决策更符合当下大多数人的需求。 图源:网络 OpenAI已经打响了第一枪,证明了“AI进群”在技术和体验上的可行性。对于国内这些不可能放过任何一种AI可能性的巨头而言, 这大概也不是一个“做不做”的选择题,而是什么时候能第一时间先做出来并为普通消费者创造出新的“需求”。 毕竟,在互联网的历史上,每一次社交工具的代际升级,最终都会带来全新的商业前景,显然没人会想错过这一次。
谷歌祭出迄今最前沿模型Gemini 3 Flash!编程能力上反超Gemini 3 Pro,且更快更便宜
作者 | 冬梅 在大模型竞赛进入“效率与规模并重”的新阶段之际,谷歌正再次亮出王牌。 刚刚,谷歌发布最新模型 Gemini 3 Flash,据介绍,它拥有前沿智能,专为速度而生,可以帮助每个人更快地学习、构建和规划任何事物。 早在模型发布前,Google AI Studio 开发者平台 和 Gemini API 产品负责人 Logan Kilpatrick 就在 X 上发布了一条只有三个闪电符号的推文,当时就有大批网友猜测这意味着谷歌即将发布主打速度至上的 Flash 版本模型。 果然,今晚谷歌 Gemini 3 Flash 模型如约而至。 谷歌发布其迄今最快 AI 模型 过去一年,从 Gemini 1.5 到 3.0,谷歌持续强化其在多模态、长上下文和推理能力上的技术纵深,同时也在不断压低模型调用成本,试图在企业级应用和开发者生态中建立更具性价比的护城河。在这一背景下,主打高性能与低延迟的 Flash 系列被视为 Gemini 体系中最贴近真实业务场景的一条产品线。 随着外界对“更快、更便宜、更易部署”的模型呼声不断升高,谷歌今晚发布的 Gemini Flash 3,也被普遍认为是其在推理效率和规模化落地层面的一次关键落子。 谷歌称,从今天起,Gemini 3 Flash 将面向全球数百万用户推出: 适用于 Google AI Studio、Gemini CLI 和谷歌新的智能体开发平台 Google Antigravity 中的 Gemini API 开发者 所有用户均可通过 Gemini 应用和 AI 模式在搜索中使用。 适用于 Vertex AI 和 Gemini Enterprise 的企业 那么,这款模型性能到底怎样呢? 谷歌在其官网介绍称,Gemini 3 Flash 速度和规模无需以牺牲智能为代价。 它在博士级别的推理和知识基准测试(例如 GPQA Diamond 90.4%) 和 Humanity's Last Exam (33.7%,不使用工具)中均展现出前沿性能,足以媲美规模更大的前沿模型,并且在多项基准测试中显著超越了目前最佳的 2.5 版本模型 Gemini 2.5 Pro。 具体而言,Gemini 3 Pro 在不使用任何工具的情况下获得了 33.7% 的分数,Gemini 3 Pro 的得分为 37.5%,Gemini 2.5 Flash 的得分为 11%,而最新发布的 GPT-5.2 的得分为 34.5%。 Humanity's Last Exam 各模型得分排行情况 此外,它在 MMMU Pro 测试中也取得了令人瞩目的 81.2% 的成绩,与 Gemini 3 Pro 的性能相当。 除了前沿的推理能力和多模态处理能力外,Gemini 3 Flash 的设计目标是极高的效率,突破质量、成本和速度之间的帕累托极限。在最高思维水平下进行处理时,Gemini 3 Flash 能够灵活调整其思考时间。 性能优于 Gemini Pro 2.5,价格更低 对于更复杂的应用场景,它可能需要更长的思考时间,但根据典型流量的测试结果,它平均使用的 token 数量比 2.5 Pro 少 30%,从而以更高的性能更准确地完成日常任务。 Gemini 3 Flash 在性能、成本和速度方面突破了帕累托极限。 Gemini 3 Flash 的优势在于其极快的速度,它基于 Flash 系列产品打造而成。其性能超越 2.5 Pro,速度提升 3 倍(基于 Artificial Analysis 基准测试),而价格却低得多。 在定价方面,Gemini 3 Flash 相比前几代模型更具性价比。Gemini 3 Flash 的定价为每百万个输入 token 0.50 美元,每百万个输出 token 3 美元(音频输入价格仍为每百万个输入 token 1 美元)。 这比 Gemini Flash 2.5 的每百万个输入 token 0.30 美元和每百万个输出 token 2.50 美元略贵。但谷歌声称,新模型的性能优于 Gemini 2.5 Pro,速度更是其三倍。而且,在处理思维任务时,它平均比 2.5 Pro 少用 30% 的 token。这意味着,总体而言,在某些任务中,用户可能会节省 token 数量。 在编程性能上,Gemini 3 Flash 拥有 Gemini 3 专业级的编码性能,同时延迟极低——能够在高频工作流程中快速推理和解决任务。 在用于评估编码代理能力的基准测试 SWE-bench Verified 中,Gemini 3 Flash 的得分高达 78%,不仅超越了 2.5 系列,甚至超越了 Gemini 3 Pro。它在代理编码、生产就绪系统和响应式交互式应用程序之间实现了理想的平衡。 Gemini 3 Flash 在推理、工具使用和多模态功能方面的强大性能,非常适合希望进行更复杂的视频分析、数据提取和视觉问答的开发人员,这意味着它可以实现更智能的应用——例如游戏助手或 A/B 测试实验——这些应用既需要快速的答案,也需要深入的推理。 自动播放 Gemini 3 Flash 能够在手部追踪的“发射球益智游戏”中实现多模态推理,提供近乎实时的AI辅助。 自动播放 Gemini 3 Flash 可以近乎实时地构建和 A/B 测试新的加载旋转器设计,从而简化从设计到编码的过程。 自动播放 Gemini 3 Flash 使用多模态推理来分析图像并添加上下文 UI 叠加层,几乎可以实时地将静态图像转换为交互式体验。 自动播放 Gemini3 Flash 接受一条指令提示,并编码三种独特的设计变体。 此外,值得一提的是,Gemini 3 Flash 也开始作为搜索中 AI 模式的默认模型推出,全球用户均可使用。 基于 Gemini 3 Pro 的推理能力,Gemini 3 Flash 的 AI 模式能够更有效地解析用户问题的细微差别。它会考虑用户查询的每一个方面,提供周全且易于理解的答案——从网络各处提取实时本地信息和实用链接。最终,它能有效地将研究与即时行动相结合:用户将获得一份条理清晰、条理分明的分析报告以及具体的建议——速度堪比搜索。 谷歌方面表示,其将 Gemini Flash 的定位更偏向于“主力机型”,而非高端展示型模型。 Gemini Models 高级总监兼产品负责人 Tulsee Doshi 在接受 TechCrunch 简报时指出,如果对比价格表中输入和输出的定价,可以明显看到 Flash 在成本上要低得多,这使其更适合承担大规模、批量化的任务处理需求,能够切实帮助企业降低使用门槛和整体成本。 自 Gemini 3 发布以来,谷歌在其 API 上的处理规模迅速放大,目前每日处理的 token 数量已超过 1 万亿个。 同时,谷歌也正与 OpenAI 展开一场围绕新品发布节奏和模型性能的正面竞争。 有报道称,本月初,随着谷歌在消费者市场的份额上升,ChatGPT 的整体访问量出现下滑,OpenAI CEO Sam Altman 因此向内部团队发出了一份被称为“红色警报”的备忘录。 随后,OpenAI 接连发布了 GPT-5.2 以及一款新的图像生成模型,并强调其企业级应用需求持续增长。OpenAI 还披露,自 2024 年 11 月以来,ChatGPT 的消息量已增长约 8 倍。 尽管谷歌并未直接回应与 OpenAI 之间的竞争关系,但其认为,新模型的密集发布正在推动整个行业加速前进。 “目前整个行业的状态是,各类模型都在快速演进,相互竞争、不断突破性能边界,”Doshi 表示,“同样令人印象深刻的是,各家公司都在非常积极地推出新模型。” 她同时提到,谷歌也在持续引入新的基准测试体系和模型评估方法,这一趋势本身也让团队对行业的发展感到振奋。 网友评价如何? 谷歌新模型发布后在全球引发了热烈讨论。在 X 和 Reddit 等平台上,大量开发者与技术爱好者对 Gemini 系列模型,特别是 Flash 版本,表达了多元观点。 在X上,有些用户使用过Gemini 3 Flash 后认为Stagehand Agent 上它的准确度几乎与 Gemini 3 Pro 不相上下,但价格更低,速度更快。 Browserbase 创始人 Paul Klein IV 在 X 上发文称,他们提前获得了 Gemini Flash 的访问权限,当真正用起它的那一刻,我们就惊呆了。他感慨道: “Stagehand Agent 的准确度几乎与 Gemini 3 Pro 不相上下,但价格更低,速度更快。“ 在 Reddit 上,不禁有用户感叹,真是太疯狂了! 还有用户表示从没见过能力这么强的轻量级模型。 但也有用户指出,基准测试的成绩,并不能说明在真实场景中表现同样出色。 “因为基准测试的成绩,并不能很好地对应真实使用场景。尤其是在实际应用中,使用场景往往非常多样,也远比那些单轮对话的基准测试样本复杂得多。坦率地说,看到 Flash 这种定位更轻量的模型在评分上“击败” Pro 版本,反而让我对这种为了刷基准分数的做法产生了怀疑。 尤其是最近几周,我一直在同时使用 Gemini 3 Pro 和 Opus 4.5,这两款模型本身都非常出色。但如果只看基准测试,Gemini 理应整体表现更强,可在实际使用中它却一次次让我失望;相反,Opus 4.5 却不断带来惊喜。” 还有用户认为,谷歌最近几次发布已经充分彰显了行业领头羊地位,OpenAI 似乎已经被拍在沙滩上了。
谷歌杀疯了!Gemini 3 Flash 突袭:这个跑腿小弟差点打败了GPT-5.2
一个月前,谷歌发布了最新的 Gemini,从此我们进入了 Gemini 3 的时代。 那以后, Gemini 3 Pro 就成了我干活的主力。 但说实话,它反应是真慢,而且很多时候我只是问些简单问题,完全没必要深度思考。 所以,一直期待速度飞快的 Flash 系列重新回来。 终于,在今天,Gemini 3 Flash 来了! 图:谷歌 CEO 宣布 Gemini 3 Flash 发布 谷歌这一波操作属实把我惊到了。 官方号称它“比快更快”,而且智商不减反增。 本来是一个“小弟”人设,但你看看它排名,居然仅次于OpenAI 最新的模型 GPT 5.2了。(就差 2 分 ) 真让人情何以堪呐? 图:第三方机构评测 Gemini 3 Flash 的综合指标 废话不多说,咱们赶紧来扒一扒,这个新出的 Flash 到底香不香。 01 到底是个啥? 简单来说:把 Pro 的脑子,装进了 Flash 的身体里。 以前我们对“Flash(轻量级)”模型的印象是什么? 跑得快,便宜,但是……有点“笨”。处理复杂任务时经常翻车。 但这次 Gemini 3 Flash 彻底打破了这个刻板印象。 遇到闲聊、简单查询: 它就轻装上阵,秒回,省流又省钱; 遇到烧脑难题: 它能立马调动深层算力,像老教授一样深思熟虑。 它大脑似乎有个变速箱。 它甚至在性能、成本和速度方面突破了帕累托极限。(AI 界的性价比极限) 图:Gemini 3 Flash 在性能、成本和速度方面突破了帕累托极限 官方数据显示,它的 Token 消耗比 Gemini 2.5 Pro 少了 30%,但智商却在线。 说人话就是:多快好省! 图:Token 消耗率对比 这种“该省省,该花花”的 AI,谁不爱? 02 凭数据说话:这波“以下犯上”有点狠 咱们不整那些虚头巴脑的形容词,直接看跑分数据,谷歌这次是真的下了血本。 我看了一眼实测数据,甚至有点不敢相信:它在很多任务上接近自家最强的模型 3 Pro,甚至有些指标还干掉了Pro 版。(这样礼貌吗? ) 特别是那个让无数 AI 汗流浃背的 ARC-AGI-2 测试…… 还让人意想不到的是:Gemini 3 Flash 全面碾压了上一代的旗舰版本 2.5 Pro。(前浪死在沙滩上 ) 图: Gemini 3 Flash 的各项指标 先说说这个 ARC-AGI-2。 之前 GPT 5.2 发布让大家印象深刻,其中有一个原因就是这个指标碾压所有模型。 老粉都知道,ARC 评测集是 AI 圈最难啃的骨头,甚至没有之一, 主要测试模型到底有没有脑子。 它是由 Keras 之父 François Chollet 搞出来的,专门用来反死记硬背的。 比如这种题目: 图:ARC-AGI 2 题目 以前的模型,MMLU 这种考试能拿 90 分,一碰到 ARC 这种需要“举一反三”的智力题,立马现原形,得分低得可怜。 这项指标 Flash 竟然超过了自己的 Pro 大哥,仅次于 GPT-5.2! 这个小弟,要造反了有点脑子! 在另一项指标: GPQA Diamond(研究生级别的专家推理测试)里,它拿了 90.4 分。 意思就是智商堪比博士。 看这个数字,它的推理能力已经和那些大块头的前沿模型(Pro 版)平起平坐了。 在著名的“Humanity's Last Exam(人类最后一场考试)”这种地狱级难度的测试里,Gemini 3 Flash 居然考出了 43.5% 的高分(Tools on 模式)。 图:HLE 分数对比 它跟 GPT-5.2(45.5%)这种超级旗舰模型,只差了不到 2 分! 朋友们,别忘了,这可是一个 Flash 模型啊! 它的定位本来是“跑腿小弟”,结果一不小心把“业界大佬”们的饭碗给砸了。(面子?不存在的。 ) 这哪里是“轻量版”,这分明是“披着闪电侠外衣的超人”。 在多模态测试(MMMU Pro)中得分 81.2%,看图、看视频的能力基本和 Gemini 3 Pro 五五开。 也就是,眼神儿更好使。 图:MMMU-Pro 指标对比 最让我意外的是这个——在 SWE-bench Verified(代码智能体测试)中,它得分 78%。 直接超越了 Gemini 2.5 全系,甚至在某些这就需要改代码的任务上,比 Gemini 3 Pro 还要好用! 本来以为它动动嘴还行,没想到写代码更溜! 一句话总结:它不是“丐版”,它是“精简版战神”。 03 为什么我建议你立马换用 Flash? 作为这一年多几乎天天都在用 AI 的人,我觉得 Gemini 3 Flash 带来的改变是肉眼可见的: 1. 真的太快了!⚡️ 根据第三方测评(Artificial Analysis),它的速度是 2.5 Pro 的 3 倍。 自动播放 以前问 AI 一个问题,你可能还得切出去回个消息等它写完。 现在?你字刚打完,它答案就怼到你脸上了。 这种“跟手”的感觉,对于我们需要快速写文案、改代码的人来说,简直是救命。 2. 价格那是相当感人 💰 图:Gemini 3 Flash 价格 输入 100 万 Token 只要 0.5 美刀,输出只要 3 美刀。 想想看,它现在比 2.5 Pro 强太多了,但价格却只有它的 30-40%。 这基本就是白菜价了,对于开发者来说,成本焦虑直接减半。 3. 智商不掉线 既有速度,又有 Pro 级的推理能力。 处理复杂的长文档分析、视频理解,它完全都在行。 04 怎么用?能干啥? 好消息是,这玩意儿现在就是 Gemini 的“默认配置”。 不管你是普通用户还是开发者,现在就能上手玩。 普通玩家:直接打开 Gemini App 或者 Google 搜索,它已经在那里等你了(是的,免费用)。 我们打开 Gemini,会看到 Fast 和 Thinking 两个新增的模型。 它们就是 Gemini 3 Flash! 图:Gemini 3 Flash 开发者大佬:去 Google AI Studio 或者 Vertex AI 就能调 api。 因为它延迟极低,拿来做那种需要即时反馈的语音助手、视频分析工具简直完美。 05 写在最后 至此,Gemini 3 家族算是真正“齐活”了。 Pro 是全能六边形战士; Deep Think 是深思熟虑的扫地僧; Flash 则是身手敏捷的急先锋。 回顾这一年,不得不说谷歌是真听劝,也是真拼。 以前总有人吐槽大厂喜欢“挤牙膏”,但这几次发布,从 Pro 到 Deep Think 再到今天的 Flash(还有 Nano Banana Pro),每一次都是诚意满满的“硬菜”。 特别是今天的 Flash,说实话,虽然在谷歌家里它定位是“小弟”,但这性能、这智商,放在其他任何一家公司,高低得挂个“旗舰(Ultra/Pro)”的名号。 当然,神仙打架,受益的是咱们。你们打吧,我喜欢。
模型免费、推理翻倍:Gemini 3 Flash深夜炸场,发放智能体时代的“入场券”
AI竞技场开始清场。 就在刚刚,谷歌再次扣动扳机,正式推出了 Gemini 3 Flash。 这是继 Gemini 3 Pro 之后的又一次暴力输出。没有预告,没有任何铺垫,谷歌直接宣布 Gemini 3 Flash 现已成为 Gemini 应用中的默认模型,全面取代 2.5 Flash。这意味着,全球数亿用户无需支付任何费用,就能立刻体验到 Gemini 3 系列模型的推理能力。 如果说 Gemini 3 Pro 是为了尽情发挥 AI 算力的优势,那 Gemini 3 Flash 则打破了「高智」、「低成本」与「响应快」之间的不可能三角。 打开 Model Card,我们看到一组令人惊讶的数据:在评估编码代理能力的权威基准测试 SWE-bench Verified 中,Gemini 3 Flash 的得分高达 78%。这不仅把此前的 2.5 系列远远甩在身后,甚至在部分领域,比如说逻辑深度上还反超了自家老大哥 Gemini 3 Pro。更离谱的是,在提供这种「碾压级」性能的同时,它的价格竟然不到 Gemini 3 Pro 的四分之一。 这可能不仅是等等党们在性价比上获得了胜利,更像是谷歌一场不讲道理的「肌肉秀」。 相对来说,Gemini 3 Flash 更适合一些需要高频、极速的开发工作场景,有了极低的延迟,Gemini 3 Flash 就可以以几乎实时的速度更新应用程序。与过去主打等待长时间响应不同,Gemini 3 Flash 反应,已经可以成为在一个大规模复杂流中快速完成推理、纠错以及自我验证的「大脑」。 而对于普通用户,谷歌扔出了另一个「王炸」:零门槛语音建站。这意味着你不需要懂任何代码,只需要对着 Gemini 随口描述你的创意,Gemini 3 Flash 就能在几分钟内将那些零散的想法转化为一个功能齐全的应用程序。 尽管此前 Gemini 3 也能从一定程度上实现这一点,但有了 Gemini 3 Flash 后,价格成本更低,工作流更简便,时间成本也更低。目前,Gemini 3 Flash 的定价为每百万个输入 tokens 0.50 美元,每百万个输出tokens 3 美元,音频输入价格仍为每百万个输入 tokens 1 美元。 从视频分析、数据提取到视觉问答,Gemini 3 Flash 配合搜索算法的迭代,也正在重新定义 AI 的响应极限。它目前已通过 Google AI Studio、Gemini API 和 Vertex AI 同步上线。谷歌这一波「快准狠」的发布宣告了,在大模型竞技场上,速度与智能的最后一道屏障,已被拆除。新王已至,且无处不在。 Gemini 3 Flash 上线 Google AI Studio |图源:极客公园 01 这一次,「轻量」不再意味着「妥协」 Gemini 3 Flash 的发布,其核心价值并非仅仅是单纯的参数更迭,而是小模型也能在 Agent 核心能力上超越一些旗舰模型。在衡量智能体编码与长程工具调用的 SWE-bench 和 Toolathlon 测试中,Gemini 3 Flash 的得分不仅反超了自家老大哥 Gemini 3 Pro,甚至在特定维度上压制了 GPT 与 Claude 的顶级型号。 这也可以看出,在需要频繁交互和快速反馈的自动化工作场景中,更短的推理链路和更高的指令遵循敏感度,或许会比庞大的参数规模更具实战价值。 Gemini 3 Flash 在各项顶级基准测试中均展现出超高智能 | 图源:谷歌官网 当然,这也不一定说明参数大的模型已经没有了应用价值。虽然 Gemini 3 Flash 在 ARC-AGI-2 这种视觉推理谜题上实现了相较于 2.5 Pro 近 7 倍的提升,但在处理极其复杂的架构设计时,它与顶级 SOTA 模型之间仍存在一定的差距。这也意味着 Gemini 3 Flash 的定位并非全能,而是局部强化。 但更重要的是,Gemini 3 Flash 通过将输入成本压低至 0.50 美元并配合大幅度的缓存优惠,为即将到来的智能体时代提供了更低的准入门槛,也创造了爆发的条件。要知道,可能一年前,想要获得这种博士级推理能力的代价很高,如今却可以几近免费使用。这也可以看出,大模型在技术同质化竞争下仍然是逃不脱价格战,而显然,目前谷歌在这一局中占尽了优势。 具体性能上,根据第三方分析基准测试,Gemini 3 Flash 运行速度达到了 2.5 Pro 的整整 3 倍,逻辑进化配合极低的延迟,让其在处理高容量法律合同、提取定义条款等繁琐任务时,精准且迅速。 Gemini 3 Flash 在性能、成本和速度方面突破了帕累托极限 | 图源:谷歌官网 而在多模态领域,Gemini 3 Flash 在视频理解与复杂图表分析上展现出的显著统治力,证明了谷歌内部「感知即推理」的能力已趋于成熟。尤其是,它能以秒级速度将复杂的非结构化视频数据转化为可执行的商业计划,这意味着视觉信息已不再是 AI 的专项特长,而是底层逻辑的一部分。或许谷歌浏览器上大量沉寂的数据可以再次被激活为可流动的商业资产。 对于开发者和企业级用户而言,Gemini 3 Flash 通过极具竞争力的定价和上下文缓存技术,直接把前沿 AI 的部署门槛降至冰点。无论是支撑在线客服对话,还是通过 Google Antigravity 实现智能体自动编程,它都在证明:高性能、低延迟与极低成本,只要现在选择 Gemini 3 Flash 就可以同时拥有。 如今,Flash 系列模型也不再是一个为了折中妥协而存在的「备选方案」,而是成为了更适合大众开发者升级的武器。Gemini 3 Flash 的到来,或许会从一定程度上促进智能体大规模爆发,加速智能体应用时代到来。 02 搜索效率的暴力升级: 谷歌搜索的最后一块模型拼图 从今年下半年开始,搜索显然已经成为了谷歌的重点。Gemini 3 Flash 同样上线,就直接送入搜索体系。从某种程度上,我们也能看出现在的模型升级不再仅仅是某一个单一产品线的升级,而是整个 AI 产品生态联动提升。 首先,Gemini 3 Flash 将在全球范围内铺开,直接成为谷歌搜索 AI 模式的默认配置。 只要用户使用谷歌 AI 搜索,就会直接感受到 Gemini 3 系列模型的强大。 深度推理能力与即时响应速度之间的互斥,不再是模型永恒的难题。Gemini 3 Flash 在推理能力、工具调用及多模态处理上的提升,可以让系统在应对复杂约束条件下的细致追问时,也能够产出更具结构化且符合逻辑的回复,而无需牺牲搜索场景中至关重要的时效性。这也意味着,过去「高阶推理」正在转变为大众检索的标准化基础设施,AI 搜索也可以从简单的信息匹配迈向了复杂问题的实时解答。 与此同时,针对更高任务需求,Gemini 3 Pro 与 Nano Banana Pro 的引入搜索领域,也从一定程度上补齐了垂直领域的缺口。 结合当前谷歌在美国市场推出的「Thinking with 3 Pro」模式,可以看出,谷歌并非为了想要打造常规的 AI 检索,而是希望能够对复杂数学编程等重度计算任务进行动态可视化布局、交互式模拟呈现。加上 Gemini 3 Flash,谷歌已经针对用户需求进行了较为全面的模型产品布局:由 Flash 承担高频、极速的普惠性智能交互,由 Pro 承载低频但高价值的逻辑攻坚。很显然,未来的 AI 交互一定不会是是单一模型的单打独斗,而是根据任务复杂度进行的动态算力分配与智能分层。 Gemini 3 Flash 的出现,在客观上标志着小模型与大模型之间「智力差」的收缩,它证明了在算法优化到达一定阈值后,智能体验的瓶颈已不再是算力规模,而是如何将这种极速的智能感无缝编织进用户的日常决策流中。 随着「快速模式」与「思考模式」的并行提供,AI 交互已正式从「实验性对话」进化为一种工业级的辅助决策引擎。而作为技术底座的模型全家桶,谷歌已经早早为大家准备好了。 03 模型走出实验室后,谷歌生态再次拓宽边界 就在刚刚,AI 模型生态的天平再次倾斜。Gemini 3 Flash 的出现以及谷歌 Gemini 3 系列模型的全面铺开,意味着谷歌模型生态优势再次加强,并正在各垂直行业的任务循环中引发链式反应。 在软件工程领域,编码平台如 Cursor 和 Devin 发现,Gemini 3 Flash 的介入让 AI 的响应速度能跟上工程师的直觉,让「编码 Agent」从异步等待的过程变成了近乎实时的同步协作。 在法律与金融这种对精度有着近乎苛刻要求的场景下,Harvey 和 Box AI 的实践证明了 Gemini 3 Flash 能够在不牺牲速度的前提下,在复杂财务数据识别和长篇合同交叉引用等任务上实现 15% 的准确率提升。这也可以说明AI 终于能够以工业级水准处理高容量的非结构化数据,而不再让用户在「深度理解」与「实时反馈」之间做痛苦的取舍。 此外,深度伪造检测平台 Resemble AI 利用其多模态能力,将复杂的取证数据即时转化为简明情报,其分析速度比以往提升了 4 倍;而桥水基金则通过它在大规模多模态数据集中捕捉那些瞬息万变的概念理解。 甚至在游戏开发领域,Latitude 利用其近乎实时的推理性能,让游戏世界的角色逻辑从预设脚本转向了真正的自主智能。 图片来源:谷歌官网 可以看出,Gemini 3 Flash 成功跑通了从原型开发到大规模落地的最后一公里,证明了最好的技术不应只是少数人的优势,而应是推动一个时代迎接生产力大规模爆发的基石。
Gemini 3 Flash可能是谷歌最狠的一步棋
刚刚谷歌正式推出了Gemini 3 Flash,这可能是 Google 这几年最重要的一次模型发布 如果只看名字,Gemini 3 Flash 很容易被误解成一个阉割版,快但不聪明的模型。但实际情况恰恰相反——它可能是 Google 到目前为止,战略意义最大的一次模型选择 一句话先给结论: Gemini 3 Flash =前沿大模型智商 + 闪电级速度 + 超低成本的组合拳。 它不是缩水版,而是把快和强第一次真正合在了一起 不知道谷歌是怎么训练的,在复杂推理测试ARC-AGI-2和衡量真实编程能力测试SWE-bench Verified 基准中,Gemini 3 Flash都超过了Gemini 3 pro 过去两年,大模型世界里一直有一道隐形分界线:一边是能力最强、但又慢又贵的旗舰模型,另一边是响应快、成本低,但明显没那么聪明的轻量模型 Gemini 3 Flash 做的事情,就是把这条分界线直接抹掉了 它在多个博士级推理和多模态基准上,已经逼近甚至追平 Gemini 3 Pro 这样的重型选手,却同时保留了 Flash 系列最核心的特性——极低延迟和极高吞吐。更关键的是,在真实使用场景中,它平均比上一代 2.5 Pro 少用 30% 的 token,却把正确率做得更高 这件事对开发者的冲击尤其明显 在 Agent、自动编程、高频交互系统里,真正的瓶颈从来不是模型能不能想明白,而是想明白要不要等三秒。Gemini 3 Flash 在 SWE-bench 这类面向代码 Agent 的评测中,甚至跑赢了 Gemini 3 Pro,本质原因只有一个:它足够聪明,同时也足够快,快到可以被反复调用 而当这种能力开始变便宜,事情的性质就变了 Gemini 3 Flash 的定价已经低到一个明确的信号:它不是拿来偶尔用一次的,而是拿来当基础设施用的 Google 直接把它设成了 Gemini App 的默认模型,全球用户免费使用;同时,它也开始成为搜索里 AI Mode 的核心大脑。你在搜索里问一个复杂问题,它不只是给你答案,而是能拆解问题结构、结合实时信息,再给你一个可以立刻行动的方案,而这一切几乎和传统搜索一样快 这一步,其实比参数更重要 如果说前两年的竞争重点是谁的模型更像人类博士,那么 Gemini 3 Flash 代表的,是下一阶段的方向,谁能让这种水平的智能,真正跑在每一次点击、每一次调用、每一次搜索里 从这个角度看,Gemini 3 Flash 并不是一个Flash 模型,而是 Google 对 AI 规模化落地的一次明确表态:智能本身已经不是稀缺资源了,稀缺的是能被高频使用的智能 不得说谷歌TPU+强悍的研发能力已经成为事实上领先者了,Sam 昨天紧急推出的图像模型追Nano Banana Pro,接下里要追的可能就多了,这在几个月前甚至都不能想象
Pocket难以复制,因为大疆没走捷径
大疆怎么做产品。 创新很容易失败。跟随则风险小得多。一家消费电子公司如此总结做新品的方法论:瞄准行业第一品牌,一比一照搬设计,“如无必要,不做改动”;再针对一个可量化的关键性能指标投入研发,形成卖点。 大多数公司虽然没总结得这么清晰,但也以类似方法研发新品。手机、汽车、冲锋衣、口红眼影,甚至奶茶……各行各业都是如此。借助中国完备的供应链,追随特别便利。 这套行之有效的方法在进入大疆的主场时遇到了困难。 多个手机品牌和消费硬件公司或组建团队、或投资外部公司,研发手持云台相机。他们不能错过这个新市场。过去一年,大疆 Pocket 3 在全球卖了近千万台,售价与中高端 Android 机型相当,利润率则高出几倍。 做手机、做无线耳机甚至造车,可以去找苹果、特斯拉多年扶持的大批供应商。但拆开 Pocket 3,大部分元件都是大疆自己研发或定制——从镜头、云台、电机、ISP 芯片、运动算法到那块可以旋转的屏幕。一些最关键元件则完全由大疆研发,没有供应商能做到同等性能。 “我们之前就知道它很难做,做了之后发现它尤其难。” 一位深入调研过大疆 Pocket 3 的硬件公司产品人士对《晚点 LatePost》说,这时距他们立项已经过去一年。 大疆创造残酷竞争环境的能力像它做新奇产品一样有效。当追赶者产品将要完成时,大疆在 10 月把 Pocket 3 起价从 3499 元降到 2799 元。两位相关人士测算,自己造一个类似体验、性能的云台相机的成本不比 Pocket 3 的零售价低。而 Pocket 3 是两年多以前发布的产品。海外数码爆料网站已经在讨论可能很快到来的 Pocket 4。 消费无人机的每一位挑战者都尝过类似滋味,过去十年,大疆在消费无人机的市场份额未下过 70%。 大疆孵化创业者的能力也一样有效。他们普遍在消费电子领域带来创新:拓竹正在重新发明 3D 打印,做储能的正浩营收也已经接近百亿元。做无弦吉他的 LiberLive、做割草机的松灵机器人也默默做到数亿到十亿元以上的营收。 过去一个月,我们访谈了多位大疆产品经理、工程师,它的竞争对手以及已经离开大疆的人,从 Pocket 3 来理解大疆怎么做产品。 先跑 9 年,做一个没有短板的产品,等来市场爆发 2015 年,大疆工程师们发现一些用户买了无人机却不让它飞,而是拿在手上边走边拍视频——无人机的云台可以降低画面抖动。他们受此启发,做了灵眸 OSMO——在苹果大小的大疆无人机云台上,加上 4K 摄像头和手持握杆,用户把手机架在上面当屏幕,在走动中拍摄出稳定画面。 专业干活的人反馈不错,但普通消费者不想多带一个挺重的设备。“我当时出去旅游,背一个精灵无人机,手上一个 OSMO、一个微单,很重。” 当时作为工程师参与 OSMO 研发的舒修(化名)对《晚点 LatePost》说。OSMO 太大了,而且必须接手机才能用。2016 年,他和同事们提出做一个更小、可以独立工作的 OSMO。 他们画了 Pocket 1 最初的草图, 机身尺寸形状类似口红,让用户能直接塞进口袋。 2018 年底,第一代 OSMO Pocket 发布,相机、处理器、屏幕被塞进口红一般细的机身,上面伸出带云台的相机模块。按下开机键,低垂的相机模块在一秒内转身抬起,镜头直直盯住拍摄对象,像是唤醒了一个机器人。第一次拿起 Pocket,难免会觉得世界被按了一下快进键。 前两代 Pocket 虽然新奇,但都只卖了百万多台,更多是科技爱好者的玩具。第三代 Pocket 发布后的前半年,也没有引起太多波澜。 2024 年三季度,一家手机厂商例行调研消费电子市场发现,大疆 Pocket 3 销量短短几周内翻了 5 倍。更让他们意外的是,消费者几乎一半是女性——此前的大疆产品绝大多数卖给了男性。 “从来没见过哪个中国消费硬件产品增长如此陡峭,而且这么挣钱。” 一位供应链人士说。Pocket 3 不算便宜,3799 元的起售价够买一部中高端 Android 手机,利润则是好几倍。 现象级的流行总是跟外部环境有关——苹果等手机厂商多年改进视频功能、疫情让短视频成为十几亿人的日常消费、小红书在 2024 年支持 Live Photo 动态照片……当所有人试过拿起手机录一段什么,就会有一部分人发现自己喜欢拍视频,其中又有人需要一个比手机更趁手的设备。 经过四代改进, Pocket 3 赶上了视频需求的爆发,而它几乎没有短板。 首先,画面稳定。Pocket 3 区别于其它相机的地方是云台——大疆无人机的最核心技术之一,有一个专门的研发部门。 用 Pocket 3 拍摄十米外的目标,手部抖动造成的画面偏移只有 0.87 毫米,已经远低于人眼的感知范围。Pocket 系列的云台不断变得更灵巧,第三代一秒就可以转 180 度,比上一代快 50%。 在大疆无人机之前,其它公司并没有微型云台的需求。过去十几年,微型云台的结构、制造和算法的演进主要在大疆内部完成。这成了追赶者的一个大问题——市场上有做云台的供应商,但没有人能在相同体积下做到 Pocket 2 的性能和精度,哪怕它已经发布 5 年。 其次,云台控制算法强。振动发生时,算法要在短时间内精确控制三个电机的 “发力”,还要提前预测用户的移动意图,让云台旋转早于用户的移动。这需要大量经验和针对不同场景的算法调试,且考虑电机旋转时因为自重产生的惯性误差。 更难的是结构设计和制造工艺。 Pocket 云台有三个电机,串联电机信号、控制的线有 50 多根,每根线有 6 股,线材外部还有屏蔽层、保护层。这 300 多股线都要塞进火柴粗细的轴孔。云台旋转时,还要保证线材在每个角度发出的弹力一致。工程师花了一年才解决线材难题。 最后一步是摸索出质量标准,自建产线,培训熟练工人,让他们学会组装如此精密的云台,并在一年内生产出 1000 万个。富士康、立讯精密等每年组装十多亿台消费电子设备的制造公司也不具备这样的能力。 Pocket 2 之后,隔了三年才有下一代,主要因为镜头模组。 前两代 Pocket 发布的时候,画质都比手机领先些,“但半年到一年旗舰手机就能追上来。” 舒修说。在 Pocket 3 立项时,他已经是负责整个项目的产品经理,希望让新产品能够保持优势更久。 传感器越大,成像质量就越好。Pocket 3 用了索尼当时新推出的 1 英寸传感器(IMX989),实际感光面积是上一代的 1.8 倍。 虽然有几款高端 Android 手机也用了这款传感器,但手机因此变成 13mm 厚,且镜头模组的光学素质和抗震性能也有妥协。大疆判断绝大多数人不会选择如此厚重的手机,Pocket 形态产品可以保持相当长的领先优势。他们赌对了,Pocket 3 推出两年多,手机厂商没继续用更大的传感器。 为了装下 1 英寸传感器, Pocket 3 整体被放大了近四成,手柄大小从 “口红” 变成了 “羽毛球拍握把”。更大尺寸下,Pocket 3 的画质、云台性能、续航,甚至屏幕都有明显提升,不再有明显短板。 画质的质变对 Pocket 3 大卖起了关键作用。手机、微单拍视频,快门不能太慢,否则画面就糊了。但 Pocket 3 有云台,快门可以到 1/50 甚至更低,画面保留了自然的运动模糊,更接近人眼看运动物体的感受。在抖音、小红书,这样的画面常常被说成 “电影感”,而 Pocket 3 调整后的色调则被称为 “冷白皮”。 新入场对手更大的挑战是成本。 除了相机传感器、电源、电池,Pocket 3 大部分零部件为大疆自研或定制。传感器来自索尼,但镜头定制,整个相机模块由大疆自行封装、制造。模仿者很难直接买到性能规格类似的零件,需要重新开发。 大疆自研 ISP 芯片(图像信号处理器)并围绕它整合成 Pocket 3 主控芯片。Pocket 3 不像手机等产品有复杂的计算需求,围绕 ISP 设计主控芯片可以降低功耗和成本。一位供应链人士测算,Pocket 3 的芯片成本至少比采用成熟平台的产品低 30%——这一项就差几十元。 一位手机厂商人士估算,如果按降价后的 2799 元卖,自己做类 Pocket 3 产品几乎没有毛利润,但他怀疑大疆在这个价格还有近千元毛利润。“你做一英寸,不可能比他便宜;不做一英寸,性能不可能比他好。” 习惯复杂、习惯磕难题、习惯推翻重来 消费电子公司习惯在一个封闭的壳子里尽可能把电子元器件堆得更密,尽量规避会运动的机械部件,减少故障可能,也降低了组装成本。比如新能源车从仪表盘按钮到门把手都在用电子控制替代机械结构。 从无人机做起的大疆并不介意复杂。 Pocket 3 上的旋转屏像云台一样完全为大疆定制。市面上没有现成的 2 英寸 OLED 屏,大疆为了色彩丰富,专门找面板工厂定制。屏幕的旋转结构用了多块磁铁组合优化手感,还在中段做了限位,划过 45 度后,松手屏幕也会转到底,而不到 45 度则会自动返回原位。 翻转屏的手感对标了 Zippo 打火机,反复调试。舒修说,“我们希望用户觉得开机的瞬间比较解压,做成一个小小的仪式,让人开心。” 定制元器件比采购现成的更贵,但大疆习惯为了设计目标去定制。 大疆的全景相机 OSMO 360 用了 1:1 的方形传感器。之前市面上的产品通常用手机、运动相机常用的长方形传感器,这样成本更低,但没有尽可能全部发挥传感器的能力——全景相机拍出来的原始画面素材是圆形,长方形传感器会有更大比例没有发挥作用。 大疆创始人汪滔很少说 “不喜欢”,但他会更关心他喜欢的项目,然后对这些项目提更多的要求——他是产品开发复杂、磕难题和推翻重来的原因。 做电助力山地车时,汪滔经常晚上十一点空降产品线办公区,主导多个版本电助力单元的开发,最终把电助力单元的功率密度做到行业最高。 早年研发 RoboMaster 玩具坦克,为了让它更真实模拟对战,汪滔甚至要求工程师研发电子皮肤,铺在外壳上,感受被橡胶炮弹击中的力。 这些要求磨砺出了更好产品,也给了工程师锻炼机会。RoboMaster 项目结束后,研发电子皮肤的工程师创办了一个上百人的公司,给人形机器人公司供应触觉传感器,还曾参与特斯拉 Optimus 机器人的投标。 大疆的产品基本没有一两年固定更新节奏,要磨到产品有足够差异才发布。 前两代 Pocket 只间隔两年,但 Pocket 3 花了三年。舒修之前担任产品经理的 Action 2 磁吸分体设计相机等了四年才有下一代,因为 4 纳米的 ISP 芯片终于可以把发热降低到大疆现在对视频的硬要求——连续拍摄 4K60 视频不过热。此时他已经升任大疆影像业务负责人几年了。 分体状态的 OSMO Nano(2025)和 DJI Action 2(2021)。 最极端的例子可能是 ROMO 扫地机。扫地机早就是中国竞争最激烈的消费硬件市场。大疆的策略是把扫地机造得更自动化,减少人工干预率,让人省心。 扫地机基站的拖布清洗盘很容易被污物阻塞,需要人拆卸清理,又脏又臭。大疆的工程师一开始新设计了清洗盘和污水箱,让它更容易拆卸清洗。但后来他们彻底拿掉了可拆卸结构,改为完全自动清洗,并因此重新设计了大部分结构。 扫地机的传感器方案也换了好几次。大疆原本想把车、无人机上的激光雷达和点云技术用到扫地机上,一些工程师当时想 “在家居产品上用这么好的雷达,效果绝对炸裂、吊打。” 这版方案最后没用上,因为激光雷达太贵了。 2024 年 4 月,他们改用双摄像头加雷达的避障方案。此时,ROMO 已经迭代到第四版,随时可以量产上市,但被高层叫停再改。 我们了解到,在发布前,大疆高层认为扫地机创新点还是不够,需要在外观上有突破。 大部分扫地机是黑白灰的圆盘机身加正方基座设计。基座就像电脑机箱一样立在墙边。在汪滔的引导下,基站从白色长方体变成透明水母形,扫地机机体上方也做成全透明。最终的产品风格很像苹果的 Power Mac G5。 ROMO 扫地机外壳设计参考苹果初代 iMac 的透明水母造型。外露的零部件像苹果 Power Mac G5 的内部一样经过设计,不显杂乱。 透明带来未来感,也是大疆的审美偏好。他们此前曾推出透明的麦克风、Pocket、OSMO Nano,甚至无人机乐高模型都有透明款,但扫地机结构复杂得多。全透明意味着产品内部布线要更简洁,模块集成度更高,不能涂太多胶水,以及需要处理风、水、电各个复杂系统——不只是单纯展示电路板。 透明的要求让制造更难。原本可接受的内部划痕、瑕疵在包上透明亚克力板都变成制造缺陷。 扫地机团队近百位工程师继续投入一年,几乎重新设计了内部结构以及多数零部件,花了数百万元重新开模。 “在大疆做产品就是这样。” 一位工程师说,汪滔不能容忍一些别人觉得很小的问题,会让工程师重做,不管已经花了多少时间,“如果谁因此心态爆炸,说明他不适合大疆。” 从完全依赖年轻人,到有成熟体系的大公司 一位前几年离职创业的前大疆工程师将这家公司在无人机的壁垒、影像设备的领先优势归结为人:“本质上是汪滔和一群有技术追求、做事一丝不苟的技术人才的共同选择。” 大疆有非常浓厚的工程师文化,工程师有主导地位。另一位大疆前工程师回忆早年的公司氛围。即使是实习生,也可以在内网提想法,并被采纳,“可能汪滔就觉得这小伙子不错,直接拎出来现场转正。” 工程师以前还会在社交媒体上发新产品的设计,征集更好的解决方案。如果有人能在几张简单的说明图里呈现更好的想法,就会收到加入大疆的邀请,一起把它做出来。 大疆研发部门工程师有不同级别,但相互之间没有汇报关系。工程师的一部分工作是项目制,他们需要向业务线的项目经理汇报,项目经理再往上是事业部负责人和大产品经理,直接向汪滔汇报。 工程师们追求成为 “产品经理”,因为产品经理能主导一个新产品的诞生,印上 DJI 的标,“这个牛逼可以吹一辈子。” 一位前大疆工程师说。大疆的产品经理大部分从工程师做起,他们必须懂技术,知道一项技术的上限在哪,如何改进。 除了汪滔感兴趣,决定要做的项目,立项的产品多数设想来自产品经理和工程师。 Pocket 最初就是三个工程师提出设想,带着草图和样品,找到当时直接向汪滔汇报的大产品经理,开了一次会就很快立项。参与项目的舒修说,“说服老板不用几十分钟,用 demo 再加几个点就行。前提是确实能解决一些用户需求,以及让人听着就很嗨。” 汪滔曾说自己崇尚比较酷、比较美的东西。他认为,追求美会转化成一种战斗力,这种战斗力最终会做出好产品。酷或者美是一种品位,大疆作为一家公司的商业决策、产品设计、技术取舍 “最终都会落在品位上”。 2013 年 5 月,精灵无人机刚问世,大疆还未持续盈利,汪滔就提出要办一场 “机器人对抗射击” 的比赛,也就是后来的 RoboMaster。RoboMatser 主要面向大学生,参赛选手需要独立研发制作工程、步兵、英雄等多种地面和空中机器人,通过第一视角操控机器人发射弹丸攻击敌方以及防御。 RoboMaster 赛事对战场景。 RoboMaster 每年耗费 8000 万元,几乎没有收入,只是为了培养强调实践的工程师文化,以及发掘人才。汪滔在 2015 年的 RoboMaster 颁奖仪式上说,“用三辆车把这群人(参赛者)拉走,放在一个地方,可能几年以后就出来十家非常好的公司了。” 相当一部分获奖者被拉进了大疆。过去十多年,大疆靠 RoboMaster 赛事招聘了超过一千名工程师。宇树创始人王兴兴、妙动科技创始人高建荣和 CTO 杨硕以及多位特斯拉 Optimus 机器人团队的工程师都曾参与或曾为 RoboMaster 赛事工作。 直到现在,还有一些深圳硬件公司会在招聘机器人和运动控制工程师时明确要求应聘者要有 RoboMaster 参赛甚至获奖经历。 企业自有生命阶段。 一个大公司变大之后,不可避免地开始引入大公司的流程和管理,研发新品也不会像创业之初那么天马行空。 2018 年,大疆调查后发布内部公告称贪腐导致超过 10 亿元损失。多位前大疆员工说,在那之后,大疆增加了一些流程和管理。在此之前,有些项目工程师就能决定用哪家供应商。 双减政策落地后,RoboMaster 也取消了面向中学生的赛事,并停止研发、销售新的教育机器人。一些参与该项目的工程师离开了大疆。 据我们了解,大疆现有员工超 3 万人(含生产线与直营门店人员),已经完全是个大公司。其总部员工在深圳的大疆 “天空之城” 工作。两座 40 多层的双子塔外挂了 12 个由钢和玻璃混合构筑的巨型办公空间,由福斯特设计事务所和大疆团队共同设计。上一个福斯特参与设计的科技公司总部是飞碟状的 Apple Park。 大疆组织按产品线划分,每条产品线运作方式都相对独立,接近一个子公司。大产品经理负责该产品线的项目统筹与结果,他们可以跨部门调动资源,人员不足可申请校招名额,新材料、云台等可复用的底层能力,则由独立的平台部门建设并向各产品线供给。 做产品时,大疆执行严格的评审制,产品最终是集体决策的结果。如果出现重大失误、质量事故,大疆会追责项目组,不惩罚个人。 一项产品从立项到样品、修改、测试、上市,每个阶段完成转入下一阶段前,都需要经过评审,评审组完全独立于产品项目组。他们决定一个产品能否量产上市。评审组会确定几十项指标,类似结构强度、密封性、抗振性、外观等,然后交由对应的技术模块小组评审。模块小组成员来自各个部门的专业工程师,懂声学的就评审产品的声学指标,懂质量的就评审产品可靠性。 即便如此,一位曾在新能源汽车业和半导体产业工作过的大疆前工程师认为 “大疆仍然比中国绝大部分硬件厂商更开放。” 不止一位离开大疆的创业者对《晚点 LatePost》表示,大疆依然是非常适合工程师成长的环境。 但这家公司多年聚集、培养了一些怀念向往更自由氛围、寻求更激进挑战的人。一位大疆产品经理在 2020 年离职时创业时对同事说,自己的青春在消失,他要抓住最后一次做大事的机会。过去几年,前大疆员工创办的硬件公司在多个领域成为新星,有的则加入大疆的对手与之竞争。 消费无人机的战争早已结束,大疆进驻好莱坞电影以及广告产业的工作流程,几乎赢得整个市场。现在,它的无人机还在向农业、工业领域扩散。无人机产品发布像是现在的 iPhone 升级,依然领先,但不像早年那样令人激动。 靠无人机赚的钱,大疆推出 Pocket、Action 产品线、收购哈苏相机,撕开了影像硬件市场。GoPro 已经落败、主流相机品牌焦虑地等待着可能的大疆相机——依靠多年积累的技术和有动手能力的人,竞争也逐渐进入大疆的舒适区。今年盈利超过大疆的中国品牌一只手就能数完。 1997 年,乔布斯回到苹果后说,“PC 战争已经结束,微软赢了”。此后他进入一个又一个新领域,用做电脑赚的钱做 iPod,让苹果成为消费电子品牌;又用 iPod 赚的钱做了 iPhone,带来移动互联网革命。 像人一样,公司的活力也需要解决更难的问题——进入更有挑战的市场,给自己找些新麻烦。
高速突发“幽灵刹车”罪魁祸首竟然是车漆
最近的捷尼赛思,属实是喝凉水都塞牙。销量本来就够愁人,这下又整出个意想不到的瓜。它得在北美召回 483 辆 G90(捷尼赛思旗舰轿车),原因是这些车会毫无征兆地自己刹车。 这是什么情况? 有个 G90 车主就说,正常在高速上开着呢,前面没任何障碍物,车子会突然刹停了。向经销商反馈后,捷尼赛思那边效率也挺低,工程师折腾了好几个月,才揪出了幕后黑手,原来是萨维尔银车漆惹的祸。 这漆的铝粉含量特别高,混在漆里就和无数个小镜子似的。 看着是耀眼高级,但问题也来了,当车在低速或者是开启变道辅助的时候,这些铝粉反射的信号,会直接把前翼子板里的毫米波雷达给晃迷糊了。这让雷达误会是隔壁车道有车要撞过来,直接触发急刹,这还挺吓人的。 好在目前上报的案例,没有造成什么严重的后果。 召回后解决方法也挺简单,给车换新的前保险杠横梁组件,以此挡住那些散乱的雷达反射信号。除了召回,也暂停了选配萨维尔银车漆的订单,等问题彻底解决,才会重新开放下单。 其实捷尼赛思遇到的这个麻烦,在后市场的车衣界不算新鲜。 想必肯定有差友知道,如果你的车有“多雷达”,那在贴膜店选了那些含铝箔、铜层,或者带导电涂层的车衣之后,懂行的老板都会建议你别贴。 那遇到不懂行的,硬给你贴上以后,雷达的信号就直接被挡了,辅助驾驶功能就可能失灵。 之前就有不少贴电镀膜的车主,贴完后发现辅助驾驶功能用不了。最后要么重贴,要么割掉一块膜让毫米波雷达不受影响,这就有点巴黎世家乞丐风那味了,属实有点难评。 图片来源:玩蔚来的99 更有意思的是,金属油漆影响雷达信号这块,真没多少用得上的行业标准。 脖子哥查了查发现,目前国内外现行的标准,大多只规定雷达的探测距离、角度精度这些参数,基本没提车身材料和涂装对雷达的影响。 不过有个例外,工信部在2021年发布的《汽车雷达无线电管理暂行规定》,要求77-81GHz 频段(汽车毫米波雷达常用范围)雷达信号穿透车身材料的损耗不得超过 3dB,也就是至少 50% 信号能量能穿过去。 这算少有的,针对汽车雷达穿透损耗的强制性官方规定。 所以整个全球汽车行业,确实也缺少相关的规定来指导车企的研发测试,当下更多依赖的是车企的自觉性和技术积累。一旦车身设计部门和智驾团队没有对齐颗粒度,就有可能出现像捷尼赛思这种问题。 当然了,也是国内这边智驾发展的好,对这块的研究就多点。 比如一汽大众在2022年申请的专利《一种匹配油漆层的汽车毫米波雷达盖板设计方法和装置》,就是靠数学模型算出门道,自动匹配雷达盖板和油漆层的最佳厚度,让雷达波能顺畅穿透。 还有赛力斯在2024年发过一篇《汽车金属漆对毫米波雷达的影响研究》的文章,里面就有提到如何通过控制车漆配方减少信号干扰。这些都是车企各显神通,想着解决金属漆与雷达的兼容问题。 另外上游涂料厂商也没闲着,要是能直接做出对雷达信号干扰小的车漆,不就能从源头省不少事儿吗? 像 PPG、Axalta 这些全球知名的涂料巨头,已经就盯上了这个方向,都表示要推出专为ADAS系统优化的低雷达反射率金属漆,只不过还没大面积铺开用。 国内的坤彩科技,做了个Wavemaster系列珠光颜料,就是专门给带辅助驾驶的汽车、无人机这些设备用。它牛的地方是,没有金属层结构,却有超强的金属光泽,还不耽误毫米波雷达信号的高透过率。 脖子哥没查到哪款车在用Wavemaster的,但很显然,这会是未来的一个重要技术路径。像国内另一家涂料企业雅图高新,就在今年7月份,申请了个《一种雷达透视的汽车漆及其制备方法》的专利,也是为了让汽车漆不干扰雷达信号的传输。 挺好的,大家一起努力,办法总比困难多。 说回捷尼赛思召回这事,这哥们在国内卖得确实不多,所以这事算不上啥行业大地震,影响力有限。但它更像是一个信号,暴露了汽车发展过程中,那些容易被忽略的细节漏洞。 现在呢,大家都在拼智能驾驶的算力、算法,比拼雷达的探测距离和精度,却很少关注车漆、车身材料这种看似不起眼的环节,结果,还真捅出了意想不到的篓子。 而且光靠少数车企和涂料企业自己琢磨还不够,得有统一的规矩才行。所以啊,由咱们中国专家牵头的ISO 13389《道路车辆车外感知毫米波雷达探测性能试验方法》,在2024年就立项了。 这是专门规范车身材料、涂装对毫米波雷达影响的测试方法,而且将是全球首个通用的国际标准。当然,上线没法那么快,毕竟制定过程得联合全球几十位专家一起,自然是需要些时间,顺利的话2026、2027年就能发布。 你看,这才是真进步。中国如今不光能造出好用的车,还能牵头给行业定规范,把咱们实战的经验变成国际通用的标准。让全球汽车行业在辅助驾驶领域,少走弯路,也让用户用车更安心,少点“自刹”的惊魂时刻。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。