行业分类:
加载中...
头条分类:
加载中...
Netflix宣布全力投入AI:“能帮人类把故事讲得更好”
IT之家 10 月 22 日消息,据外媒 TechCrunch 今日报道,在娱乐行业探索是否、何时、以何种方式“拥抱 AI”的当下,Netflix 选择了“积极拥抱”的态度。 在当地时间周二下午发布的季度财报中,Netflix 在致投资者的信中表示,公司“非常有优势,能够有效利用 AI 的持续进步”。 Netflix 并不打算让生成式 AI 成为内容创作的核心,而是将其视作“能提升创作者效率”的工具。Netflix CEO 特德・萨兰多斯在财报电话会上表示:“创造伟大作品需要真正的艺术家。AI 可以为创作者提供更好的工具,增强会员的影视体验,但如果你本身不是出色的故事讲述人的话,AI 并不能自动让你变得更优秀。” 今年早些时候,Netflix 首次在阿根廷剧集《The Eternaut》的最终画面中使用生成式 AI,制作了一栋建筑倒塌的场景。随后,《Happy Gilmore 2》的制作团队在开场使用 AI 让角色显得更年轻,《Billionaires’ Bunker》的制片人则利用 AI 在前期制作中设计服装和布景。 萨兰多斯表示:“我们相信 AI 能够帮助我们和创作伙伴以更快、更好、更创新的方式讲故事。我们全力投入,但不是为了追求新奇而新奇。” AI 在娱乐行业一直存在争议。因为艺术家担心,其作品在未经同意的情况下被各路大模型作为训练数据,会对职业产生负面影响。 IT之家从报道中获悉,当投资者问及 Sora 对 Netflix 的影响时,萨兰多斯表示:“内容创作者可能会受到一定影响,但我对电影和电视剧业务并不担心。我们不担心 AI 会取代创造力。”
9998元抱回家!全球首款万元以下人形机器人来了,21自由度,能说会走,会尬舞
9998元、21个自由度 双十一的购物车又满了?手机、平板、耳机、手表、化妆品、衣服…… 今年,还有一件「意想不到」的商品悄悄加入——不是模型,也不是玩具,而是真·能走能跑、能跟你聊天、还能跳舞的人形机器人。 作为全球首款万元以内的消费级人形机器人,松延动力Bumi小布米将在双十一登陆京东首发。 价格甚至比一部高配旗舰手机还低,放在几年前,几乎不敢想。 要知道,今年早些时候,特斯拉人形机器人「玩具」一上架就被秒空——40美元被炒到1300美元,马斯克点赞的「AI 威震天」也要1199美元。但它们都只是玩具。这一次,走进你客厅的,是真的人形机器人。 自动播放 机器之心通过编辑,让小布米「cha」了一段宋雨琦的《M.O.》 参照系也摆在这:宇树R1起步3.99万,松延动力N2在五一前促销价同为3.99万。如今,松延动力直接把门槛打到万元以内,人形机器人第一次真正迈入消费级时代。 说到松延动力,这家公司如今已是行业焦点。成立不到两年,完成6轮融资。产品也成了今年最忙、最出圈的人形机器人之一。 他们第一次被公众熟知,是在今年四月的北京亦庄半程马拉松暨人形机器人半程马拉松上。你或许刷到过那段视频: 一个只有1米2的小机器人,在长长的跑道上孤独奔跑,它就是松延动力的N2「小顽童」。 作为唯一一个全程无需人类陪跑、独立完成比赛的机器人,它最终拿下亚军。 2025年4月19日,北京亦庄半程马拉松暨人形机器人半程马拉松现场,松延动力N2在比赛中。 之后,「小顽童」N2的脚步就没停下。八月,它在2025世界人形机器人运动会上,一举拿下自由体操冠军和单机舞蹈亚军;另一款「小个子」E1,也以1.25米的成绩拿下立定跳远冠军。 金秋,N2飞到巴黎,在联合国教科文组织会场亮相,登上时代杂志报道。国庆黄金周,松延的人形机器人化身景区「流量担当」,以日租4000~5000元活跃在文旅现场。 2025年10月8日,N2机器人在巴黎联合国教科文组织会场走秀 极致轻巧,自由度不打折 先来看看Bumi小布米的真面目。 它是松延家族里个头最小的一位。相比N2,不仅更矮,更轻。 为更好地和「人类幼崽」做朋友,小布米的身高控制在94厘米——不到一米,和幼儿园小朋友差不多,平视交流,零压迫感。 「身材」很紧凑。底座长34.5厘米、宽19厘米,窄而稳,穿门道、走廊这些狭窄空间毫不费力,伸手、转身也不前倾不后仰。 体重只有12公斤——一袋米重,抱起就走。 轻量化的好处很直接:行走对地面冲击更小,偶发摔倒不易造成伤害,更安全;同时更节能,这对消费级很关键。 材料上也做了「加减法」。躯干与外壳用高强度塑料,轻、坚固、绝缘;关键受力部位用高强度铝合金,既承力又散热。轻巧与强度耐用,两头都要。 图片展示的为Bumi小布米原型机,最终产品敬请期待。 别看个头小,灵活度可一点都不打折。这款机器人全身拥有21个自由度(DOF)——比N2还多出3个,主要集中在腰部和腿部。 新增的腰部关节,让它在走路、转弯、起跳甚至跳舞时,能像人一样随时调整姿态,灵活转移重心、抵消惯性,动作更稳、更自然。 腿部自由度的增加,让它在不同地面上行走、舞蹈都更加自如,步态更协调,落脚也更精准。 能扭胯 什么样的腰部,可以支撑起这样的魔鬼舞步? 上半身的表演能力也不赖。 微妙的手部动作 手臂很有戏 肩部灵活 电池系统同样不含糊。采用48V平台,带来更强的电机输出能力,不仅能支撑多自由度的复杂动作,也让能量传输更高效、线束设计更简洁,让机身更加轻盈。 续航时间在1到2小时之间,虽然谈不上「持久战选手」,但对于教育、陪伴、演示等短时场景,或是具备固定充电设备的业务应用,已经够用。 懂交流,还能教娃学AI 要成为真正的人类伙伴,仅有「轻」和「灵」还不够,机器人必须「聪明」——能听懂、会沟通、懂回应。毕竟,智能才是让机器人走进现实世界的通行证。 小布米就是这样的存在。它能听会说、还能理解你的意思——无论是语音唤醒、自然对话,还是动作指令响应,都流畅自然。面对人类的语言和动作,它不仅听得懂,还能做出恰到好处的回应。 更有趣的是,它还藏着一项「教学技能」——会教人学AI。 它支持图形化编程,零代码门槛。孩子们只需拖拽积木块式指令,就能让机器人完成动作、互动甚至表演。复杂的算法和逻辑被转化成形象的拼图,编程变得直观、有趣、人人可懂。 教育,是松延动力最早耕耘、也最看好的方向。如今,公司教育场景订单规模很大,覆盖多层次的教育类场景。在人工智能课堂,学生用编程训练机器人循线行走;在幼儿园,它陪孩子做游戏,让他们在笑声中遇见科技。一次次课堂与活动,它在孩子心中,悄悄种下智慧的火花。 这一次,松延动力把这项被反复验证的教育能力带进了消费级新品。「它不仅是一台机器人,更是一块让孩子和创客学习AI、算法和工程思维的实验平台。」团队希望把编程从代码变成拖拽积木,让创造力人人可及。 在家庭中,它也成了连接两代人的科技桥梁。父母借它传授知识,孩子借它展示想象力。在这样的瞬间,机器不再冰冷,而是有了温度——承载爱、传递智慧,启发下一代。 9998也能打:供应链与自研的合力 这一次,松延动力把实验室的前沿技术浓缩进不到一米高的「小身体」,做出更多人买得起、玩得起、用得起的人形机器人,背后是对产品定位的「反向」思考。 行业普遍追逐「全尺寸」,松延动力专卷「小个子」。目前产品线分两路:一条是双足人形(代表作 N2、E1),另一条是仿真人形。 全尺寸当然酷,但成本与风险同样「全尺寸」。即便今年国内价格从「一套房」跳水到「一台车」,距大众购物车仍有距离;用户价值与成本、风险不成正比。 而小尺寸机器人轻巧、安全、不怕摔、好带走。更关键的是,它也够聪明——「大个子」会的,它基本都能干。在科研、教育、文娱、展览等对容错与效率更友好的场景里,小尺寸几乎能覆盖大尺寸的绝大多数能力,还更便宜、更灵活。 这样的策略,正逐渐被验证为正确路径。N2在「人形半马」后出圈,商业化进展也突飞猛进。此后在世界人形机器人运动会上亮相,热度持续拉满。松延动力也成为继宇树科技之后,国内又一家销量破千的人形机器人公司。 能做到这一切,自研的技术底座是关键。自研伺服电机输出精准动力,先进运动控制算法充当「小脑」,保障动作稳定、协调、敏捷。 以小布米为例,虽更紧凑却拥有21 DOF。要让这样一台多自由度机器人站稳、行走、起舞,控制系统必须更聪明。松延自研运动控制算法在此发力:深度强化学习叠加高性能伺服驱动,毫秒级修正姿态,动作顺滑且稳定。 松延动力在深度强化学习方面有着深厚的积累。强化学习能让机器人像人一样,通过试错与反馈不断进化。正如公司创始人姜哲源所说:「人类的学习技能过程包含试错、记忆、改进,强化学习也是一样,只不过把这一切交给了算法和算力。」 团队会先让机器人在虚拟仿真环境中接受高强度训练,再在高保真模拟中验证,最终才登上真机。结果已经证明一切——N2是目前全球第一台能在「一镜到底」拍摄中完成连续完美空翻的机器人。 空翻是公认的高动态、高难度动作,只有通过强化学习才能高效地自主习得并实现对力矩、时序的精确控制。 当然,能把价格打到「9998」,国产供应链同样功不可没。 过去三年,中国在电机、谐波减速器等核心部件上的突破显著,业内人士指出,国产零部件的成熟速度和成本下降幅度,都远超市场预期。 摩根士丹利今年5月报告称,减速器、电机、电池甚至螺丝在美国本土几乎难以完全替代,多数机器人厂商仍需从中国采购核心部件。 以人形机器人为例,其传动系统的核心部件——谐波减速器,国产品牌已开始全面替代国外厂商;执行器中的行星滚柱丝杠等高精度零件,也正被中国供应商逐步取代。 松延既是受益者,也是推动者。除北京研发基地外,松延动力还在多地筹建机器人制造工厂,形成研发—生产—测试—交付一体化能力。7 月单月破百台交付。 公司在伺服驱动、传感融合、高性能控制板卡等环节实现高度国产化与算法自研。姜哲源在接受《人物》采访时透露:「基本上全国产化了,现在连主控芯片都是瑞芯微 RK3588S,没有用进口的。」 最后一件事。 限时提醒:9998元仅在双十一至双十二期间开放优惠。 人形机器人,正在完成从实验室到客厅的「下凡」。它不再只是冰冷机械,而是可对话、可学习、可共创的智能伙伴;不只是技术结晶,更是「科技育人」的起点。 第一次把真·人形带进千家万户,这一仗不轻松,但足够值得。
放开成人内容,OpenAI是为了提升性能?
互联网有一条玩笑,叫做"搞黄色是第一生产力"。从最早的录像带到影碟机,从图片网站到短视频平台,成人内容始终是新技术和新模式普及的试验场。 上世纪80年代,VHS录像带之所以能击败画质更好的Betamax,就是因为成人内容制作商选择了VHS。90年代互联网刚刚兴起时,成人网站是最早探索在线支付和流媒体技术的先驱。进入移动互联网时代,成人平台又率先应用了自适应视频技术和用户订阅模式。 如今,AI大模型领域又重演了这一幕。 对于任何大模型来说,成人内容都是潘多拉的魔盒。打开它,意味着大量的用户涌入和可观的收入增长,但同时也意味着监管风险、道德争议和品牌形象的不确定性。 更关键的是,一旦打开就很难再关上,没有任何办法可以准确评估这些成人内容对产品生态带来的长期影响。但现如今,OpenAI执意要这么做。 2025年10月15日,OpenAI CEO山姆·奥特曼正式宣布:从12月起,ChatGPT将为经过年龄验证的成年用户开放成人内容生成功能。 自从ChatGPT问世,OpenAI就是行业的风向标。他们推出Dall·E,互联网上才开始有了文生图。他们推出了Sora,互联网上才开始有了文生视频。从12月开始,如果OpenAI开始毫无限制地输出成人内容,那么其结果可想而知。 事实上,在此之前,ChatGPT就已经具备了一定的成人内容生成能力。 2025年2月,OpenAI就悄悄放宽了ChatGPT的内容过滤器,允许在特定情况下跳过警告直接生成成人内容。用户通过特定的提示词,已经可以让ChatGPT输出一些成人向内容,只是这些功能并未被官方正式认可或系统化。 这种渐进式的政策松动,实际上为此次正式开放埋下了伏笔。OpenAI在测试市场反应,观察竞争对手的动向,同时也在评估技术可行性和法律风险。现在,他们终于决定迈出这一步。 《凡人歌》有句歌词,“道义放两旁,把利字摆中间”。马斯克就深谙这个道理,他旗下的Grok从一开始就采取了极其开放的内容政策。 如果你给ChatGPT讲一个成人段子,它会回复你说这个话题不适合讨论。但是如果你给Grok讲,它会回敬你一个更黄的。 Grok不仅允许模型输出成人内容生成,还推出了3D AI伴侣功能,包括动漫风格的虚拟女友Ani和虚拟男友Valentine。 根据Appfigures的数据显示,Grok的第三季度移动端收入达到1850万美元,较第一季度增长400%。这个增长数字远超其他AI应用,其中成人内容功能的贡献不可忽视。 付费订阅 “SuperGrok” 的用户,能够启用两款 3D 伴侣。Ani拥有好感度机制与记忆模式,用户通过互动可以提升好感度。当好感度达到一定等级后,就可开启 “成人模式”。 不过马斯克可不像奥特曼那样扭扭捏捏,他对成人内容此毫不避讳,甚至将其奉为Grok的核心竞争力。 他甚至在X平台上公开转发用户对Grok虚拟伴侣的喜爱,毫不掩饰地将成人内容作为产品卖点。有用户在推特上发帖说自己每天跟Ani聊天聊到凌晨,马斯克直接点赞并评论:“这才是AI该有的样子。”他甚至鼓励用户对Ani诉说污言秽语,称这是“言论自由”的体现。 连基座大模型都这样了,那些通过对基座大模型套壳的AI应用厂商更是肆无忌惮。 比如早些时候被谷歌收购的Character AI。这是一个AI陪聊平台,你可以在上面找到各种角色:霸道总裁、温柔学长、冷酷杀手、甚至是历史人物。 不过该平台存在明确的内容规范与限制,例如会对暴力、仇恨言论、极端内容等进行过滤,以维护基本的交互安全与合规性。但在实际使用中,用户仍能通过特定话术引导或模糊表述,使平台输出一些成人内容。 根据Appfigures的数据,Character AI年收入已突破3200万美元,拥有2000万月活用户,预计2025年底年收入将达到5000万美元。这个增长速度让很多传统互联网公司都眼红。 Character AI 的用户中女性占比约为55%。18-24岁的用户占比约为53%-57%,25-34岁的用户占比约为22%-24%,35-44岁的用户占比约为12%。更直观的是,Character AI的用户每日平均使用时长达75分钟,甚至堪比主流的短视频平台,这种粘性简直是产品经理的梦想。 除此之外,还有像Janitor AI这样,专门提供UGC的AI成人内容平台,更是直接以成人内容为卖点。根据Hackernoon的说法,Janitor AI在推出第一周就吸引了超过100万用户,70%的用户为女性,平台目前拥有超过35万个独特的AI角色。 事实证明,在AI这条赛道上,成人内容AI市场,规模庞大、来钱快、用户粘性强。这些活生生的案例摆在OpenAI面前,想不动心都难。 不过,OpenAI光明正大的搞黄色,并不只是为了流量。从大模型的训练上来讲,过度的内容审查会对内容审查进行污染,进而影响模型的整体性能。换句话说,禁止成人内容可能反而会导致模型变得“智障”。 严格的内容过滤会导致训练数据缺乏多样性,使模型在处理边缘案例时表现不佳。OpenAI在DALL·E 2的开发过程中就发现,过滤掉的图像往往代表了数据集中的某些重要聚类,这种过滤会导致模型在相关领域的表现下降。 这个问题的技术根源在于数据分布的完整性。大语言模型的训练依赖于对真实世界语言分布的学习,而真实世界的语言表达中,涉及性、情感、身体等话题的内容占据了相当大的比例。 当训练数据中这些内容被大规模过滤后,模型学到的就是一个被人为扭曲的语言分布。 而模型在训练阶段被强制回避某些词汇、概念和语境时,它的词嵌入空间(embedding space)就会出现"空洞"。这些空洞会导致模型在遇到相关概念时,无法准确理解上下文关系,甚至会产生语义漂移,从而降低模型的整体性能。 它可能无法准确理解包含这些元素的合法内容,比如文学作品、历史文献或医学资料。 OpenAI认为,这是为了让模型输出更安全、更符合道德标准的内容而必须做出的让步,他们还给这个“空洞”取了个名字,叫做“对齐税”(alignment tax)。 AI之所以会产生偏见,也是因为“对齐税”。过度的安全限制会让模型在创意写作、文学创作等需要丰富表达的场景中显得“刻板”和“说教”,严重降低了用户体验。 ChatGPT-5发布之后,许多用户抱怨ChatGPT过于“政治正确”,缺乏人性化的表达,这便是过度内容审查带来的副作用。 所以,一旦OpenAI放开了成人内容的限制,那么作为用户,你能明显感觉到ChatGPT的性能提升了,即使是无关成人内容。 而从企业角度来看,OpenAI面临着巨大的商业化压力。根据最新财务预测,OpenAI 2025年全年的预计收入是130亿美元,但企业上半年净亏损达到了73亿美元,全年净亏损预计135亿美元。这种巨额亏损状态迫使OpenAI必须寻找新的收入增长点。 摩根大通的报告显示,到2030年OpenAI的收入将达到1740亿美元,相当于占据25%左右的AI市场份额。虽然这个预测并非完全基于成人内容功能,但成人内容的开放无疑会成为重要的增长驱动因素。 可OpenAI也有头疼的地方,ChatGPT拥有超过7亿周活跃用户,但付费订阅用户仅约2000万,付费转化率不足3%。相比之下,专注成人内容的AI平台往往有着更高的付费意愿和用户粘性。 虽然奥特曼没有亲口承认,可我知道他也眼馋。 AI女友应用市场的增长数据更是惊人。根据GII Research的报告,2024年全球AI伴侣市场价值约为281.9亿美元,预计在2025年至2035 年间将以30.8%的复合年增长率扩张,换句话说,到了2030年,这个产业的市场价值就会突破1400亿美元。 不仅是如此,由于AI可以根据用户偏好生成高度个性化的内容,再加上AI生成内容的成本极低,这就导致输出成人内容的AI正在抢夺传统成人市场。 用户只需输入几句提示词,就能在几秒钟内获得定制化的内容,不满意还可以再次修改,并要求AI重新生成。可传统成人内容产业需要真人参与,成本高昂且受限于现实条件,也没办法一直修改直到用户满意。 根据ARK Investment的数据,成人AI网站已经从OnlyFans等传统成人平台抢夺了14.5%的流量份额,而一年前这一比例仅为1.5%。 所以,无论是从技术来看,还是从市场来看,OpenAI早晚都要全面解除这个限制,打开潘多拉的魔盒。 然而,成人内容也会带来巨大的挑战。年龄验证就是摆在OpenAI面前的第一关。 在国际社会,年龄验证是形同虚设的。比如全球最大的游戏分发平台Steam,它允许用户自行设定年龄,你可以是20岁的青年、百岁老人,甚至是远超人类寿命极限的存在。 OpenAI声称将建立严格的年龄验证机制,但奥特曼并没有明确表示具体使用哪种方法。再加上国际社会对于网络痕迹、隐私的重视,年龄验证机制一直是举步维艰。 与此同时,这也牵扯到了第二个问题——地缘政治。欧盟的AI法案是一个全面的法规体系,要求对AI系统进行严格的合规性审查。成人内容AI在很多欧盟国家都被视为高风险领域,必须满足严格的透明度要求、人工监督机制和事故报告义务。 如果违反这些规定,罚款可能高达公司全球年收入的4%或2000万欧元,以较高者为准。对于OpenAI这样的公司,罚款金额将是巨大的。 在美国,各个州对AI成人内容的法律是不同的。比如德克萨斯州和犹他州已经通过法律,要求成人内容网站必须验证用户年龄,否则将面临民事诉讼。加州正在推动更严格的《年龄适当设计规范法案》,要求平台默认屏蔽不适合未成年人的内容。 以国际上最大的成人网站PornHub为例,在日本、韩国等地进行访问时,只需勾选自己是否年满18岁。而在美国部分州进行访问时,必须上传以证明自己年满18岁的相关法律文件。 更麻烦的是,家长们可以联合起来起诉OpenAI,特别是在未成年人接触到不当内容并受到心理伤害的情况下。而且OpenAI是有前科的。 2025年8月,美国加州一对夫妇就起诉了OpenAI及其首席执行官,指控ChatGPT导致他们16岁的儿子自杀身亡,因为ChatGPT为其儿子提供了关于自杀方式的信息,还鼓励亚当伤害自己。 除此之外,美国联邦法律明确规定,任何形式的儿童色情内容,包括虚拟生成的,都属于违法。2019年,一名男子因持有AI生成的儿童色情图像被判处20年监禁。虽然OpenAI可以辩称自己已经采取了预防措施,但如果系统被大规模滥用,监管机构可能会要求OpenAI承担连带责任,甚至吊销运营许可。 奥特曼身处硅谷,身为IT精英,对于成人内容这个板块,他低不下头,放不下面子,这并不难理解。不过在面对董事会给出的压力时,他心里清楚,想站着把钱挣了,难上加难。
首个全国产!兆芯、联想开天联合打造AI教室:屏幕巧妙
快科技10月22日消息,近日,国内首个面向中小学生的全国产化AI教室,落地北京市第二十中学。 该实验室由兆芯和联想开天提供核心支撑,配置了数十套内置信创PC的一体化云课桌和信创高性能旗舰工作站。 其中,云课桌采用一体化设计,屏幕可以隐藏于桌面内,方便快速部署学习环境、灵活调度资源,还支持多端协同操作,可根据教学需求,将教室秒变理论授课室、小组实践室、个人探索电教室等不同场景。 工作站能够支撑从AI模型训练到智能体开发的完整流程,可以让全部同学同时进行模型训练或智能体开发。 该教室还内置了严格贴合《中小学人工智能通识教育指南(2025 年版)》的课程体系,引导学生从建立AI认知与系统思维,到进一步提升AI核心素养与跨学科实践创新能力,为学生掌握AI技能构建起系统性的阶梯式成长路径。 在首堂实践课程上,学生们亲手搭建了京剧知识智能体,不仅可以根据不同的需求配置相应的知识库,还能将机器视觉模型与智能体结合,实现“图像识别-知识讲解- 语音输出”的完整流程,并支持多语言讲解、个性化内容设计等。 当前,AI已成为引领科技革命和产业变革的战略性技术,在基础教育阶段普及AI教育,是培养具备AI素养的时代新人、实现科技自立自强的关键。 兆芯在不断迭代全国产x86处理器、提升性能的同时,还积极协同操作系统、云服务、应用软件等生态,围绕智慧校园、智慧课堂、智慧电教等教育行业核心场景,合作共建了一系列教育应用解决方案。 包括教育数据中台、教务综合管理与服务、校园身份互联认证、校园网络安全、信创实验室、3D科创教学、远程教学系统、信创双轨云教室、教育云桌面等等。 这些方案都实现了整机“开机即用”,外设“即插即用”,软件“想用就用”。 基于兆芯处理器,联想开天打造了一系列软硬件全国产、主流教育软件100%适配、部署本地AI大模型等的产品,包括笔记本、台式机、一体机、工作站等。 目前,兆芯、联想开天合作的解决方案,已在全国各级各类学校中得到广泛应用。
跌出双11预售20强榜单,始祖鸟的危机才刚开始
“炸山”风波的市场反噬已开始显现。 近日,天猫双11户外预售首日战报发布,去年还稳居前十的始祖鸟,今年彻底消失在20强榜单之外。 这并不令人意外。事件发生后,硬核户外爱好者公开抵制,社交平台上“退货”声四起。两天的沉默后,始祖鸟的致歉信姗姗来迟,却陷入 “双标甩锅”争议,其背后大股东安踏则始终沉默。 二者显然都深谙国内舆论场的“短期记忆”的特点,但冷处理没能等来舆论的遗忘,却等来了核心用户的转身。那些秉持“无痕山野”理念的户外发烧友,认为品牌背叛了精神内核。 背叛核心用户所带来的品牌危机,正迅速转化为实实在在的销售压力。 风波仍在发酵。10月15日,西藏日喀则市官方通报认定始祖鸟需承担相应生态赔偿责任。两天后,始祖鸟母公司亚玛芬体育内部公告宣布始祖鸟大中华区总经理Ivan She(佘移峰)离职,其职务暂由亚玛芬大中华区总裁Jeffery Ma(马磊)代理。 这场风波,更像是一根导火索,引爆了始祖鸟深藏已久的增长焦虑。在安踏的运作下,始祖鸟从小众神坛成功破圈,成为中产的身份符号。但高增长背后,始祖鸟的增速正连续放缓,其大中华区营收增长率从2021年的84%,逐步回落至2024年的54%。 为了支撑高估值和增长预期,始祖鸟的营销策略愈发激进,从联名奢侈品到玩转配货,不断向“泛人群”扩张,品牌的专业性逐渐被稀释。与此同时,市场上“平替”品牌层出不穷,国内外竞争对手也在加速分食它亲手做大的户外市场。 万元冲锋衣的价值,正被消费者重新审视。 资本市场的反应更为剧烈,始祖鸟母公司亚玛芬体育股价较“炸山”事件前跌去18%,连同大股东安踏,两家公司市值已蒸发超580亿元。 对安踏而言,始祖鸟不仅是其提升品牌价值的关键棋子,更是其全球化野心的支点。如何挽救这只一度高飞的“头鸟”,已成为安踏必须直面的一场硬仗。 背叛核心人群,或许是始祖鸟犯的第一个错误。 事件发生后,大量核心用户群体明确表达抵制态度,多位户外博主公开抵制始祖鸟,直言其行为背离“无痕山野”的户外准则,更有博主宣称放弃了和始祖鸟的商业合作。社交平台上,不少网友表示“不会再买”,还有网友声称已经在赶往退货的路上。 始祖鸟的核心用户显然是那些硬核的户外发烧友,他们之所以选择始祖鸟,除了产品性能外,更看重品牌所传递的精神内核。对于户外爱好者而言,敬畏自然不是更高追求,而是底线。 那么,始祖鸟为何要这样做? 回看这场被品牌方称为“致敬高山文化”的烟花秀,从其张扬、宏大、渴望被看见的表现形式来看,目标受众显然是那些将始祖鸟视为“中年三宝”身份符号的泛人群。 从2019年被安踏接手以来,通过门店入驻奢侈品扎堆的顶级商圈,跨界联名和饥饿营销等一系列运营,安踏把始祖鸟从小众户外品牌打造成了百万中产的身份信仰,不仅业务快速扩张,产品定价也一路水涨船高,千元的始祖鸟被卖到了上万。 然而支撑户外品牌高价策略的根基之一,正是品牌调性。 短期来看,收割“泛人群”的生意来得更快、更直接。但长期看来,大众消费者之所以向往始祖鸟,正是源于那些硬核专业人士构建的“光环效应”。一旦被核心人群抛弃,大众也会很快去魅。 面对排山倒海的批评,始祖鸟与安踏的“沉默”则是第二个错误。 事件发生后,始祖鸟并没有第一时间进行回应,而是在两天后才发布致歉信,内容却再次引发 “内外双标”“甩锅中国团队” 的新争议,之后,始祖鸟再度陷入沉默。而安踏也自始至终未发表任何声明。 直到事件发生约一个月后,西藏日喀则市官方通报认定始祖鸟需承担相应生态赔偿责任。此后,始祖鸟才宣布大中华区总经理离职。 就目前的反噬来看,想要挽回品牌口碑和用户信任并没有那么容易。 “炸山”风波不只是一次失败的危机公关,更是始祖鸟在中国市场陷入增长困境的集中爆发。 在安踏的运营下,中国市场已然成为始祖鸟的第一大市场。今年二季度,亚玛芬体育大中华区营收为4.1亿美元,同比增幅达到42%,营收规模首次超过北美市场,成为第一大市场。而曾经的最大市场美洲大区增幅只有6%。 但其中国市场增速放缓也是不争的事实。根据亚玛芬财报,2022年、2023年和2024年其大中华区的营收增长率分别为60%、61%和54%,而在2021年,这一数字高达84%。 业绩增速放缓下,急于抓住泛人群的始祖鸟在营销上愈发激进,不仅把自己从一个户外品牌塑造成了奢侈品牌,更成了二级市场的理财产品,连一个吊牌都被炒到了几百元。 2022年,始祖鸟与奢侈品牌古驰(Gucci)联名推出限定系列,在国内发售当天即被抢空,成为二级市场加价炒作的“投资品”。 奢侈品牌的配货也被始祖鸟玩到飞起,一个吊牌都能卖上三五百元。 在中国市场,始祖鸟不仅凭冲锋衣统一了中产们的衣柜,更培育出了一个更大的泛户外用户市场。一个穿始祖鸟的人不一定要去奔赴山海,他的目的地可能只是楼下的星巴克。 始祖鸟甚至让冲锋衣从中产破圈到年轻人。年轻人也需要这样一个符号,一个“热爱户外” 的符号,一个 “贴近中产” 的符号,因此一度有不少年轻人节衣缩食攒钱买始祖鸟,并热衷于在社交平台上拍照晒图。 但随着消费趋势的变化,消费者对户外装备的需求从 “炫耀性消费” 回归 “实用性需求”,始祖鸟高达数千元,甚至万元的定价开始受到质疑,尤其是国内外价差问题引发消费者广泛不满。 始祖鸟“平替”开始大行其道。“不是始祖鸟买不起,而是某某更有性价比”,成了大批户外博主的开场白。在社交平台上,骆驼、伯希和、凯乐石和拓路者等品牌都曾被当作始祖鸟“平替”。其中,骆驼率先吃到了“平替”红利,过去两年双11,分别喜提天猫户外和抖音户外榜的销冠。 诚然,这些“平替”品牌与始祖鸟所锚定的客群和消费层级并不重合,但那些原本可能 “攒钱买始祖鸟” 的年轻人,却有可能不再转化为始祖鸟的用户。 更重要的是,随着更多玩家的涌入,始祖鸟培育的市场正不断被分流。 硬核户外玩家们开始寻找更专业、小众和调性更纯粹的品牌;泛户外人群则在“一鸟二象三鼠”之间反复横跳;耐克、阿迪达斯等巨头也开始布局高端户外领域,推出专业户外系列试图分一杯羹;凯乐石和探路者等国内品牌,则通过聚焦细分赛道突围,以性价比优势抢占中高端市场。 如今这场 “炸山” 风波,更给了虎视眈眈的对手们一个加速追赶的机会。 即便保持沉默,安踏也难逃波及。炸山事件以来,安踏体育股价累计跌去12.5%,市值蒸发339.6亿港元。 作为将始祖鸟打造成中国市场现象级品牌的操盘手,安踏很难隐身。 2019年11月,安踏体育宣布以46.6亿欧元(约合360亿元人民币)完成对芬兰体育巨头亚玛芬体育的收购,这是中国体育品牌史上最大规模的海外并购。 彼时,旗下拥有始祖鸟、萨洛蒙等品牌的亚玛芬正陷入持续亏损的困境,中国业务仅占全球总营收约6%。 在安踏的一番运营下,亚玛芬成功逆袭。不仅在2024年完成了在美上市,还结束了持续5年的亏损困局。亚玛芬财报显示,2024年,公司录得营收51.83亿美元,同比增长19%;调整后净利润暴涨329%至2.36亿美元。这其中,始祖鸟在该年度的营收突破了20亿美元。 在此之前,安踏最成功的收购就是FILA,作为收购的第一个国外品牌,FILA一度为安踏贡献近一半营收,成为最大的“现金牛”,FILA增速放缓,在安踏集团的营收占比逐渐下滑。 对于安踏而言,主品牌定位大众市场,FILA主打中高端时尚运动,始祖鸟填补了集团在超高端户外领域的空白。其“户外爱马仕”的定位,吸引高净值消费群体,能够提升集团品牌形象和利润空间。 收购亚玛芬,安踏不仅收获财务回报,更获得始祖鸟、萨洛蒙等全球高端品牌矩阵。始祖鸟们的“抬咖”,不仅使得安踏从一个发源于晋江的三线品牌,坐稳了国内运动品牌头把交椅,还一跃成为全球市场上可以与耐克掰手腕的对手。 更重要的是,始祖鸟是安踏全球化布局的关键。通过收购其母公司亚玛芬体育(Amer Sports),安踏获得了进入欧美高端市场的通行证。 在用始祖鸟跟中产交上朋友之前,安踏走了不少弯路。直到通过“买买买”的方式将一众国际高端品牌收入麾下,丁世忠“不做中国的耐克,要做世界的安踏”的梦想才开始起飞。 近年来,除东南亚市场外,安踏也在加快拓展美国及中东市场。今年6月,安踏品牌进驻美国比弗利山庄,9月,其北美首店将正式营业。 与此同时,吃到并购红利的安踏也不忘寻找下一块新标的。今年4月,安踏发布收购德国户外品牌狼爪的公告,并于2个月后宣布完成收购。 但一方面,安踏的“买买买”之路已被一众国内同行效法,留给安踏的优质标的已经所剩无几。 另一方面,作为特定时期的产物,始祖鸟的成功也难以复制。始祖鸟进入中国时,正值中产阶级崛起、户外运动兴起、消费升级多重红利叠加的窗口期。安踏实施的奢侈品战略和饥饿营销,也恰逢社交媒体的爆发期,放大了品牌效应。 这也是为什么同样是安踏运营,迪桑特、萨洛蒙、可隆和狼爪等品牌都被寄予厚望,但却始终没能跑出“下一个始祖鸟”。 显然,在此之前,始祖鸟并不会就此成为安踏的“弃子”。如何修复品牌形象,挽回用户信任,成了安踏的当务之急。
人工最高节省90%,AI制作游戏被批“没有灵魂”
“之前画画的只想让AI帮忙画,作曲的只想让AI帮忙作曲,但现在变化非常大。”时隔一年再接受记者采访时,盛趣游戏美术总监林蕤感慨,据他所知,业界已有创业团队在探索复杂的AI应用方式,类似于可快速生成完整游戏的智能体,这些工具已在筹备。 同样认为AI对游戏形成巨大影响的,还有谷歌云游戏业务全球总监Jack Buser,他在近日一个播客中表示,AI已经到了影响游戏行业的重要时刻,“需要好几年甚至十年才能开发出来的游戏(video game)并不罕见,但有了AI,就能更快将想法付诸实践。” 虽然还有另一些声音认为,AI难以替代从业者的创意工作,但记者了解到,一些业内人士已经看到AI对游戏研发效率带来的巨大影响,且已在展望新的游戏生产方式。 头部公司已对外开放工具 AI对游戏制作的效率提升作用明显。 以往制作一款品质精良的游戏,耗时不低。例如,去年爆火的《黑神话:悟空》从立项到面世花了7年。《侠盗猎车手5》发布以来,玩家等待《侠盗猎车手6》则超过10年。 有游戏厂商近期统计了应用AI工具之后可以节省的工作量。 “游戏开发工作量大约有70%~80%是美术资产处理,其中两个大头是动画制作和模型制作。” 腾讯游戏效能产品部产品负责人刘奇申向记者表示。此前腾讯推出全链路AI创作解决方案VISVISE,包含AI自动蒙皮工具、动画生成工具等,覆盖游戏制作多个环节。 据刘奇申介绍,动画制作的骨骼绑定环节中,蒙皮占了70%~80%工作量,是人力重投入的环节,“原本需要1天半到3天半完成的工作,用AI工具1~3 个小时就能完成,节省 70%~90%人工。” AI也可用于动画制作的关键帧制作环节。刘奇申告诉记者,在游戏动画行业,人工K帧(手工逐帧调整)仍占主导地位,占比60%。但在高度依赖动画师经验的情况下,单角色动画制作周期可能长达数周,动画师手动补帧耗时占角色动画制作总工时的60%~70%,中小团队选择手工K帧,人力成本占项目预算可达30%以上。但如果使用动画生成大模型,AI则能根据关键帧5~10帧自动生成60帧流畅动画,将效率提升3~5倍。 腾讯内部项目已统计过AI带来的效率提升。据介绍,光子工作室的角色动画制作周期缩短了40%,还有的项目组中,角色技能原型验证时间从2周压缩至3天。 刘奇申告诉记者,这些工具已经在腾讯内部头部项目使用,并开放给外部公司。包括完美世界、库洛游戏在内,现在至少有50多家外部公司在使用这些工具。出海业务也在推进,这些工具已向一些日韩头部游戏公司和欧洲游戏公司开放试用。 一年前,林蕤看到的还是AI替代一些2D美术制作,现在他的感受是,3D工具品质也变高了,游戏制作成本下降可以明显看到。 他向记者举例,以《黑神话:悟空》这种体量和品质的游戏为例,游戏取了近40个外景,包含各种雕像、大型建筑,要带无人机和3D扫描设备区景区扫描,需要取景团队、现场指导、当地地陪等,前期研发人员还要花大量时间准备。但如果使用一个成熟的3D生成工具,基本上只需要坐在办公室选照片、花几分钟做前置处理、让工具生成模型再做简单处理、放到引擎中使用,“并不是说AI工具可以替代一个建模很厉害的人,但至少展现出一种可落地的新制作方式。在合适场景下,AI工具会带来很大帮助。” 林蕤表示,他的团队做过一些项目验证,发现3D工具尚无法用于一些高品质资产的制作,难以在3A游戏中发挥核心作用。但在一个大型项目中,除主角、标志性建筑等需要特别抓眼的资产外,还有一些玩家无法靠近观察的次级资源,例如植被、山林、路边雕像、半山腰的亭台楼阁等,原来要花大量人力物力去构建,现在3D生成工具已能替代人力高效完成。 “还是以《黑神话:悟空》举例,其制作成本3亿元以上。对于美术成本超亿元的3D类产品来说,其中20%~30%的次级资源可以用AI工具解决,由此达到千万元级别的降本效果。” 林蕤向记者分析。 替代掉一些高成本支出环节的同时,AI的使用成本并不高。林蕤告诉记者,盛趣目前使用订阅制的AI工具,同时部署本地工具。游戏外包人员每人日薪基本过千元,正式员工日薪更高,人力成本远高于订阅制AI工具,“生成一张符合要求的图,现在开箱率普遍不超过10张,即生成10张必有1张符合要求,每张成本很低。如果无情地做量化统计,AI肯定有很大优势。” 中小团队接受度更高 对于AI的能力,业内还是有不同看法。 本月早些时候,特斯拉CEO马斯克成立了xAI游戏工作室,宣布将在2026年底前发布一款AI生成游戏。《博德之门3》背后的工作室Larian Studios的发行总监Michael Douse公开表示,马斯克承诺的AI生成视频游戏不靠谱,AI无法提供优秀游戏必需的创意和远见。 类似这种AI“没有灵魂”的表达是业内一种代表性观点,也有些玩家发现了目前AI游戏的程式化和枯燥性。已发行的AI游戏中,米哈游联合创始人蔡浩宇成立的AI公司8月发布了AI游戏《星之低语》。有玩家在Steam平台上评论称,这款游戏更像一个技术演示,玩久了有些枯燥。也有玩家称,估计游戏背后的模型有很多限制,大大削弱了游戏可玩性,玩家的新鲜感过后会觉得对话公式化且乏味。 不过,也有从业者对AI是否具有“灵魂”有了新的看法。一年前,林蕤告诉记者,游戏充满人性与创意,而AI缺少人性的表达。一年后,他的想法发生了一些微妙的转变。“业内有强烈排斥AI的声音认为,AI做出来的东西没有灵魂,我原来也这么想。”他告诉记者,但后来他接触过一个小说工具,AI生成的故事让他大吃一惊。 “我一直觉得AI和人的差距是,人能高度概括一些语义,触发他人的联想,听到‘梗’的人会心一笑。现在AI在这方面的进步令人惊讶,AI好像逐渐学会了如何触动人。” 林蕤表示,虽然目前业内还有一些人排斥AI,但他认为AI带来的创作方式多样化不是坏事,不论将AI当作敌人还是朋友,从业者都要尽量了解它,不听不看的态度是危险的。 对于AI如何影响游戏制作流程和不同规模的团队,业内也有一些讨论。 林蕤告诉记者,AI工具能发挥最大作用的地方,是独立游戏这种极小型的团队,以及一些做短平快项目的轻量级团队。“原来需要依附一个中大型团队,或需要在一个十人以上团队中完成的工作,现在由于AI赋能,可以一两个人就把事情做了。” 他表示,这是一种技术平权的体现,AI解决了少数人“能不能做”的问题,让原来没有太多学习积累的人获得新的能力。 然而,林蕤表示,AI还无法让一个没有太多专业能力的人一步跨到专家级高度,人与人之间的高度并未被拉齐。一个个人开发者和一个大且成熟的团队之间的品质差距还很难拉近,这也是为何现在AI工具更多是中小型团队在大量使用。而目前3A这种品质要求特别高的商业项目,为了口碑或研发工作稳定性等,大多还没广泛铺开AI工具使用。 刘奇申表示,相比大型团队,小型团队在一些环节没有制作时间方面的优势,用AI工具则能大幅提升流程效率,这对小型团队更有价值,“我觉得未来的形态是:AI 工具提高大型公司的团队配合度并节约制作成本,同时让中小型公司发挥长处、尽量弥补弱点。” 刘奇申举例,游戏动画制作时,3A游戏厂商多采用动捕(动作捕捉),3A大作单角色面部及身体捕捉成本约50万~100万美元。独立工作室较依赖的手工K帧精细程度可与动捕比拟,成本则次之。中型厂商多使用预存标准化动作的动作库,成本最低但质量也最低。“整体呈现出投入越大、效果越好的情况。但在AI出现后,大家技术上能有更平等的权利。AI能把原来门槛比较高的工作,比如动作捕捉、找大团队精修,降到小团队也能负担的程度。”他表示。 提升效率的同时,整个游戏工业管线并未被颠覆。刘奇申称,目前他的团队提供的工具主要还是关注提效,没有将原来的工作流程完全打破。林蕤表示,新技术成熟衍生出新的生产管线是必然的,但产业原有的专利、渠道、生产工具协议、合作等壁垒或规则,已花费几十年乃至更长时间构建,打破重组并不容易。 不过,技术迭代还在带来新可能。近期也出现了一些可能影响游戏制作的新技术。8月谷歌更新了可交互的通用世界模型Genie 3,交互感与游戏体验相似。视频模型方面,Sora2面世后,近日谷歌也推出新视频模型Veo3.1,新模型可模拟人物语言和环境音。 “世界模型就像一个经验包,包含世界各种规律。它有很大好处,例如项目向上级汇报时要告知游戏玩法,传统的做法是在游戏引擎中做出Demo,要按月来规划时间,汇报结束后才有下一步决策。但用世界模型生成,或许就能很快表达游戏玩法,在意思传达方面有很好的推动。”林蕤认为,此外,人们面对日渐增多的AI工具将寻求更聚合的解决方案,智能体将成为聚合线上线下资源的支点,用户可以输入数值、文本等前置材料就快速生成完整游戏。这种智能体若能与世界模型结合,会让做出来的游戏更精彩。 刘奇申称,目前他的团队在探索的工具是出于较传统的角度,推动游戏制作往更自动、更智能的方向走,世界模型则是从最终形态往回推,这两种不同的路径未来可能有所交集。3D生成世界的路径可能还要再过三五年,才会推动一些独特的工作流出现,在此之前,多种AI工具预计将并存一段时间。
研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真
IT之家 10 月 22 日消息,康奈尔大学最新研究指出,大语言模型(LLM)在长期接触低质量网络内容后可能出现类似“大脑退化”(brain rot)的现象,其理解力、推理力及伦理一致性均显著下降。 这一发现令业界再次聚焦“死网论”(Dead Internet Theory)—— 即网络因充斥机器生成或低质内容而逐渐失去人类创造力的假说。 AI 性能受“低质数据”影响显著 研究团队以 Meta 的 Llama 3 和阿里云 Qwen 2.5 为实验对象,通过构建不同质量比例的数据集,测量低质量内容对模型性能的影响。 结果显示,当模型仅以低质量内容进行训练时,其准确率从 74.9% 骤降至 57.2%,长文本理解能力从 84.4% 降至 52.3%。 研究人员还指出,这种“剂量 — 反应效应”(dose-response effect)意味着模型在持续接触低质数据后会出现逐步退化现象,不仅推理链条被简化甚至跳过,生成的回答也更表面化。此外,模型的伦理一致性下降,出现“人格漂移”(personality drift)倾向,更容易输出错误信息。 “死网论”引发科技圈担忧 近几个月,多位科技界人士公开表达了对“死网论”的担忧。Reddit 联合创始人 Alexis Ohanian 表示:“如今互联网上的很大一部分实际上已经‘死了’—— 无论是机器生成的、半 AI 的内容,还是充斥着低质量信息的社交平台。”他呼吁未来的社交网络应能“验证人类真实性”。 OpenAI 首席执行官 Sam Altman 也持类似观点,认为“死网论正在我们眼前发生”,并称现今多数 X(前 Twitter)账号已由 AI 接管运营。 网络内容质量危机正在加剧 亚马逊云科技(AWS)研究团队去年发布的报告指出,目前约有 57% 的网络内容是由人工智能生成或翻译的,这一趋势正影响搜索结果的质量与可靠性。 前 Twitter 首席执行官 Jack Dorsey 亦警告,由于图像生成、深度伪造(deepfake)与视频合成技术的普及,“我们将越来越难分辨真假”,用户必须通过亲身体验来验证信息真伪。 随着 AI 生成内容的快速扩散,互联网正面临内容质量与真实性的双重考验。业内专家提醒,如果人工智能模型与网络生态继续陷入低质量循环,所谓“死网论”终有一天会成为现实。
DeepSeek-OCR:大模型技术,正站在一个新的十字路口
想象一下,在这个AI技术如潮水般涌来的时代,我们忽然发现,一张简单的图像,竟然能以惊人的效率承载海量文字信息。这已不是“想象”,而是刚刚发生的现实。 本周,DeepSeek开源了一个名为“DeepSeek-OCR”的模型,它首次提出了“上下文光学压缩”(Context Optical Compression)的概念,技术细节和背后的论文也随之公开。 虽然市场上的讨论还不多,但这或许是AI演进史上一个悄然却深刻的转折点——它让我们开始质疑:图像,是否才是信息处理的真正王者? 01 图像的隐秘力量:为什么图像可能胜过文本 回想一下,我们日常处理的文档、报告、书籍,往往被分解成无数的文本标记(tokens),这些标记像砖块一样堆砌成模型的“理解墙”。 但DeepSeek-OCR却另辟蹊径:它将文字视为图像来处理,通过视觉编码,将整页内容压缩成少量“视觉标记”,然后再解码还原为文字、表格甚至图表。 结果呢?效率提升了十倍之多,准确率高达97%。 这不仅仅是技术优化,而试图证明:图像不是信息的奴隶,而是它的高效载体。 拿一篇千字文章来说,传统方法可能需要上千个标记来处理,而DeepSeek只需约100个视觉标记,就能以97%的保真度还原一切。这意味着,模型可以轻松应对超长文档,而不必为计算资源发愁。 02 架构与工作原理 DeepSeek-OCR的系统设计像一部精密的机器,分成两个模块:强大的DeepEncoder负责捕捉页面信息,轻量级的文本生成器则像一位翻译家,将视觉标记转化为可读输出。 编码器融合了SAM的局部分析能力和CLIP的全局理解,再通过一个16倍压缩器,将初始的4096个标记精简到仅256个。这正是效率的核心秘密。 更聪明的是,它能根据文档复杂度自动调整:简单的PPT只需64个标记,书籍报告约100个,而密集的报纸最多800个。 相比之下,它超越了GOT-OCR 2.0(需要256个标记)和MinerU 2.0(每页6000+标记),标记量减少了90%。解码器采用混合专家(MoE)架构,拥有约30亿参数(激活时约57亿),能快速生成文本、Markdown或结构化数据。 在实际测试中,一台A100显卡,每天能处理超过20万页文档;如果扩展到20台八卡服务器,日处理量可达3300万页。这已不是实验室玩具,而是工业级利器。 03 一个深刻的悖论:图像为何更“节约”? 这里藏着一个有趣的悖论:图像明明包含更多原始数据,为什么在模型中反而能用更少标记表达?答案在于信息密度。 文本标记虽表面简洁,但在模型内部需展开成数千维度的向量;图像标记则像连续的画卷,能更紧凑地封装信息。这就好比人类记忆:近期事件清晰如昨,遥远往事渐趋模糊,却不失本质。 DeepSeek-OCR证明了视觉标记的可行性,但纯视觉基础模型的训练仍是谜题。传统大模型靠“预测下一词”这个清晰目标成功,而图像文字的预测目标模糊不清——预测下一个图像片段?评估太难;转为文本,又回到了老路。 所以,目前它只是现有体系的增强,而非替代。我们正站在十字路口:前方是无限可能,却需耐心等待突破。 如果这项技术成熟推广,它将如涟漪般扩散影响: 首先,改变“标记经济”:长文档不再受上下文窗口限制,处理成本大幅降低。其次,提升信息提取:财务图表、技术图纸能直接转为结构化数据,精准高效。最后,增强灵活性:在非理想硬件下仍稳定运行, democratize AI应用。 更妙的是,它还能改善聊天机器人的长对话记忆。通过“视觉衰减”:将旧对话转为低分辨率图像存储,模拟人类记忆衰退,扩展上下文而不爆表标记。 04 结语 DeepSeek-OCR的探索意义,不止于十倍效率提升,更在于它重绘了文档处理的边界。它挑战了上下文限制,优化了成本结构,革新了企业流程。 虽然纯视觉训练的曙光尚遥,但光学压缩无疑是我们迈向未来的一个新选项。 相关常见问题索引: 问:为什么不能直接从文字图像开始训练基础模型? 答:大模型成功靠“预测下一词”的明确目标和易评估方式。对于文字图像,预测下一个图像片段评估困难、速度慢;转为文本标记,又回到了传统路径。DeepSeek选择在现有模型基础上微调,解码视觉表征,但未取代标记基础。 问:与传统OCR系统相比,速度表现如何? 答:处理一张3503×1668像素图像,基础文本提取需24秒,结构化Markdown需39秒,带坐标框的完整解析需58秒。传统OCR更快,但准确率同等时需数千标记——如MinerU 2.0每页6000+,DeepSeek仅需800以内。 问:这项技术能否改善聊天机器人的长对话记忆? 答:是的。通过“视觉衰减”:旧对话转为低分辨率图像,模拟记忆衰退,扩展上下文而不增标记消耗。适用于长期记忆场景,但生产实现细节待详述。
百川发布循证增强大模型M2 Plus,号称“医生版 ChatGPT”
IT之家 10 月 22 日消息,据百川大模型官方微信公众号消息,今天,百川发布了循证增强医疗大模型 Baichuan-M2 Plus,同步升级配套应用百小应并开放 API。这是百川自 8 月开源 Baichuan-M2 以来的又一次重要动作。 官方称,评测显示,M2 Plus 的医疗幻觉率较通用大模型显著降低,相比 DeepSeek 低约 3 倍,优于美国最火医疗产品 OpenEvidence,可信度比肩资深临床医生水准。 据官方介绍,百川 M2 Plus 首创六源循证推理(EAR)范式,打造“医生版 ChatGPT”,让大模型技术在辅助临床诊疗场景迈过“敢用、可用”关键门槛,不仅适合中国医疗环境,在美、日、英的医疗评测中均超过 OpenEvidence,代表中国在世界大模型擂台上再下一城。 IT之家附官方对 Baichuan-M2 Plus 介绍的原文如下: 首创六源循证推理范式,把循证做“全”、检索做“准”、推理做“对” (一)六源循证:打造从原始研究到真实世界的完整知识体系 循证医学(Evidence-Based Medicine, EBM)作为现代医学知识体系的核心范式,是确保医疗决策可信的关键。 通用大模型像一个“博学但不可靠”的专家,即便有搜索增强,也会因为知识来源混杂不符合循证医学范式。 我们不仅主动屏蔽了互联网的非专业信息来源,只使用权威来源的医学证据,在此基础上构建了从证据、到实践、再到真实世界反馈六层证据类型的知识体系: 原始研究层:索引海量医学期刊论文 4000 余万篇,超过 PubMed 收录数量,涵盖基础与临床研究成果,是循证链条的起点; 证据综述层:整合系统评价和 Meta 分析等高等级证据,提供经过汇总的研究结论; 指南规范层:引入国际和国内权威机构发布的临床指南、专家共识和行业标准,确保回答符合最新规范; 实践知识层:包含临床病例报道、一线专家经验和诊疗技巧等实用知识,贴近医疗实践场景; 公共健康教育层:汇集权威科普和公共卫生知识,如疾病预防宣教、健康指导等内容,服务大众健康教育; 监管与真实世界层:涵盖药监部门公告、临床试验登记及大规模真实世界研究数据等信息,以反映最新的监管动态与人群研究结果; 这个金字塔形的“六源”,是一层一层演化而来:原始层回答“事实是否存在”、证据层回答“结论是否一致”、指南层回答“行业如何规范”、实践层回答“医生应如何决策”、公共层回答“患者应如何理解”、真实世界层回答“是否存在新风险”。这让模型从“生成答案”走向“据实回答”,实现了从语言可信度到知识可信度的跃升。 (二)循证检索:从“找得到”跃升到“找得准” 传统的 RAG 检索往往追求“找得到”,而循证检索追求“找得准”。 M2 Plus 采用 PICO 框架(人群 Population、干预 Intervention、对照 Comparison、结局 Outcome)思维,将查询转化为结构化医学问题,并在六源数据库中进行分层匹配。 例如:当输入“老年 OSA 患者使用 CPAP 能否改善高血压?”时,系统优先在高等级证据(系统综述、RCT 元分析)中搜索,并自动辨识研究质量、样本量、置信区间与结局指标。 这种方法克服了通用 RAG 的两大缺陷:一是缺乏医学语义理解(无法区分 CPAP 疗效与依从性分析);二是无法辨别文献可靠性(新闻与指南同权)。 在此基础上,M2 Plus 能够三步精准锁定“铁证”: 第一步,智能提问:自动将用户问题拆解成多个专业的 PICO 查询,进行“地毯式”证据搜索,兼顾精度与广度。 第二步,精准锁定:通过自研的 Medical Contextual Retrieval 技术,完整保留文献的临床因果链,避免信息割裂。 第三步,证据排序:内置“审稿人”模型,自动评估证据等级(如 RCT、Meta 分析),将最可信、最相关的“铁证”优先呈现。 (三)循证推理:让模型“像医生一样思考” 如果说“六源循证”解决了医疗 AI 知识从哪来的问题,“PICO 智能检索”解决了如何快速找到正确证据的问题,那么最关键的一步是如何确保 AI 在手握证据时,不会“自由发挥”、脱离事实胡乱回答。 我们在 M2 Plus 中引入“循证增强训练”机制,为模型的回答过程“上了一道锁”,从根本上改变了其生成逻辑,让它学会“引用,而非臆测”: 首先,在训练中奖励“引用”,惩罚“臆测”,准确引用权威来源(如指南、文献)时会获得高分,一旦回答脱离了检索到的证据就会受到惩罚; 其次,内置“证据评估器”,模型被训练得能够自动评估检索到的证据质量,优先采纳高可信度的信息(如 RCT、Meta 分析),并将其无缝嵌入到推理链中; 第三,句句有据,可回溯、可验证:经过训练,M2-Plus 的回答风格发生了根本性改变,在输出关键结论时,会自动附上参考文献、指南出处等来源,这赋予了 AI 回答更高的可解释性与可信赖度。 幻觉最低,达到与人类资深临床专家同等可信度 这种“循证驱动”的生成逻辑,让 M2 Plus 几乎杜绝了无中生有的内容。在多场景评测中,其综合幻觉率在所有大模型当中最低,相较 DeepSeek R1 最新版降低 3 倍,显著领先 OpenEvidence。不仅如此,在病史分析、诊断思路、治疗方案等真实复杂的核心医疗场景中,达到了与人类资深临床专家同等的可信度。 301 医院的姜医生提问,“目前公认最有效的基因治疗药物靶向足细胞递送方案有哪些?”很多通用大模型回答这个问题时都产生了明显幻觉,而 M2 Plus 的回答不仅查到了全球最新研究成果,还能按纳米系统 / AAV 病毒载体等维度分类。姜医生赞叹:“引用文献非常具有专业性、且信息源紧贴顶刊 ERA 等最新进展,对足细胞基因治疗这么前沿的方向,能帮我快速了解国际热点技术路线,少走弯路。” 北京天坛医院的熊医生,在研究目前 PACAP 在偏头痛中的研究进展如何时发现,头痛相关的研究越来越多,想找到真正有价值的文献并不容易,多数大模型给出的答案都因幻觉问题而不可用。他试用百小应时看到,“能梳理全球 PACAP 偏头痛研究,从机制到 III 期临床试验自动串联证据链,不仅回答问题,更让医生站在未来看科研进展。” 无论是专业医疗问题还是常规医疗问答 M2 Plus 都会引用权威医学证据多国医学考试断崖领先,医学知识运用能力超越人类医生 美国执业医师资格考试(USMLE)是评估临床知识和推理能力的黄金标准,即便是经验丰富的临床专家,要突破 90 分也极具挑战。在此项考试中,M2-Plus 取得了惊人的 97 分,不仅远超人类考生平均水平,更与 GPT-5 的成绩持平,稳居全球第一梯队,展示了其世界级的临床问题解决能力。 中国执业医师资格考试(NMLE)及格线为 360 分,对于广大医学生而言,能考到 450 分以上已是高分,超过 500 分则被视为“学神”级别。M2 Plus 取得了 568 分的“碾压级”成绩,在所有公开测试的主流大模型中位列第一,充分证明其对中国临床指南和医疗实践的掌握已炉火纯青。 如果说执医考是“从业门槛”,那么中国硕士研究生招生考试临床医学综合能力(西医)考试则是顶尖医学生竞争的“华山论剑”。该考试不仅知识面广,且题目设计极为复杂,对临床思维要求高。通常,能考到 280 分以上的考生,都是协和、北医等顶尖学府的头部学霸。M2 Plus 在此项考试中取得了 282 分。 同时,在日本、英国、澳大利亚等国高级医师职称晋升考试中,准确率 85% 以上,远超各国及格线。 这些压倒性的成绩充分说明,M2 Plus 在复杂医学知识运用上的能力,已经超越了人类医生水准。 “医生版 ChatGPT”推动医疗 AI 迈入可信可用阶段 接入 M2 Plus 的百小应已在各大手机应用商店更新,成为 " 医生版 ChatGPT"。为方便电脑端使用,网页版(ying.ai)也同步上线。 随着大模型的普及,除了需要借助 AI 高效地辅助临床决策,医生还开始面对新的挑战:患者用 DeepSeek 自诊和带着 DeepSeek 就医的现象越来越多。虽然知道大模型可能有幻觉和偏颇,但没有时间和精力去甄别哪句对哪句错。通过百小应,医生有了面对通用模型挑战的“专属武器”。 对于希望深入理解诊断、治疗、预后、病因、检查等背后科学逻辑的患者及家属,面对复杂的就医环境和不同医生给出的诊疗方案,百小应让他们有机会获得最新最权威的知识、顶尖专家的思维和视角,得到无限耐心的专业解答。 Baichuan-M2 Plus 也提供了标准化 API 接口,医院信息化部门、互联网医疗、大健康服务等各类泛医学机构,以及从事医疗 AI 行业的开发者,则可以通过 API 将循证推理接入服务场景,提升 AI 服务的医学专业性。 通过开源 Baichuan-M2、发布 Baichuan-M2 plus、百小应,开放 API,百川致力于持续提升 AI 医疗在真实临床场景的可用性,推动大模型在严肃医疗场景进入落地可用新阶段。
中国首颗海洋盐度探测卫星完成在轨测试,功能、性能均满足或优于设计指标
IT之家 10 月 22 日消息,中国航天科技集团今晚发文,称自然资源部科技发展司会同国家国防科工局重大专项工程中心近日在北京组织召开海洋盐度探测卫星工程在轨测试总结评审会。这标志着该卫星已完成全部在轨测试工作,可以交付用户长期使用。 IT之家查询获悉,海洋盐度探测卫星是国家民用空间基础设施中的科研卫星,由中国航天科技集团有限公司五院抓总研制,于 2024 年 11 月 14 日由长征四号乙运载火箭成功发射。 该卫星是我国首颗用于海洋盐度信息获取的遥感卫星,完善了海洋卫星观测体系,填补了星载海洋盐度探测空白,具有重要里程碑意义。 中国航天科技集团表示,卫星后续将为海洋环境保护、防灾减灾和全球气候变化等提供全球高精度的海洋盐度数据,为我国海洋强国建设提供有力的技术支撑。同时,卫星还兼顾土壤湿度测量,可满足旱灾监测、农区环境监测、数值天气预报等行业用户的应用需求。 海洋盐度探测卫星自成功发射入轨以来,历经了平台工作状态设置、载荷开机测试、星地链路建立、业务功能验证等多个关键阶段的考核。在轨测试期间,在国家卫星海洋应用中心的牵头组织下,五院遥感卫星总体部与西安分院等多家单位紧密协作,顺利完成了在轨测试工作,获取了大量在轨测试数据。分析结果表明,卫星功能、性能均满足或优于设计指标。
AI会客厅实录|对话北京中关村学院×中关村人工智能研究院何亮
2025人工智能计算大会(AICC2025)特别策划了“AI会客厅”直播活动,由媒体人和与会嘉宾共同围绕ABI、人工智能+行动、低空经济、AI4S等产业前沿话题展开探讨。 AI4S作为当前产业界热议的核心议题之一,AI制药、材料科学、智慧育种、气象预测等等领域的实践都正在对普通大众的日常生活产生深刻影响。AI4S的产学研发展应用现状如何?哪些领域正在加速变革?其中会涉及哪些伦理争议和风险?为AI+人才培养带来了哪些新的命题?智东西总编张国仁与北京中关村学院×中关村人工智能研究院的生物大模型首席研究员何亮共同就AI4S相关前沿话题展开对话,以下内容根据直播整理。 张国仁:大家下午好, 2025人工智能计算大会“AI会客厅”的最后一位嘉宾,是来自北京中关村学院、北京中关村人工智能研究院的生物大模型首席研究员何亮。何老师长期专注于生物大模型与科学基础模型研究,曾在微软亚洲研究院和微软研究院科学智能中心等单位开展科研工作,在生物大模型、AI+药物设计等领域有着深厚的积累和储备。 首先我们还是围绕AI For Science这个词的展开。AI4S在科学研究领域应用比较广泛,但是跟普通人关系好像没那么大。它的实际意义和对研究的影响如何?请何老师给我们先简要在这方面介绍一下。 何亮:首先说到AI4S研究,其实在上个世纪大家也会有类似的疑问:为什么要发射卫星上天,为什么要造火箭?而现在大家都看到,这些技术已经深刻影响了我们的生活。我也可以引用北京中关村学院的研究理念来开始今天的分享——“极基础、极应用、极交叉”。先说与生活最相关的“极应用”。AI应用正在影响人们生活的方方面面,比如生物领域常用的洗衣粉,其中的生物酶本质上是一种蛋白质,这种酶的效果好不好、去污能力强不强,都需要通过研究与优化。再比如材料领域,很多人已经使用电动汽车,对电池和能源性能非常关注。如何让电池续航更强、冬天掉电更慢,新材料的研究就能直接带来改进。还有智能育种,我们通过AI帮助培育优良品种,可直接用于农业,关系到粮食安全。AI4S的重要使命是加速科学发现。过去从科研到应用可能需要十年甚至二十年,而现在借助AI工具,可以把这一周期缩短到几年甚至几个月。“极交叉”则指多个领域的共性问题交汇,AI4S的价值就在于促进这些领域的融合创新。对公众而言,我们今天享受的科技成果,往往源自多年前的科学突破。从科学发现到应用再到市场推广,正如那句话所说:“流水不争先,争的是滔滔不绝”,科研亦是如此。 张国仁: AI+科研最近被列为了国务院发布的人工智能+行动计划重要领域之首,从您的研究和实践来看,这个领域的研究对中国未来的发展意义有多么重大? 何亮:AI4S的重要性非常大。刚才我们提到,从极基础研究到极应用,它覆盖了创新的整个链条。科学本身是创新的源头动力。科研发现往往是一个漫长的过程,如果能通过AI提升源头创新的速度,就能更快地享受到科技进步带来的红利。对国家而言,AI4S是建设科技强国的重要基础。只有在生物科技、材料、农业、气象等关键领域实现突破创新,才能真正让科技发展成果回馈社会,使国家更强大。另一方面,在当今国际竞争激烈的格局下,AI4S也是国家保持领先的关键,需要持续的技术创新和深入研究。 张国仁:咱们国家去做AI4S有哪些独特的优势? 何亮:首先,我们有体制优势,能够高效整合人才、算力、平台和数据等资源,这是许多国家难以做到的。其次,我国拥有庞大的数据基础,例如医疗病例、材料测试、气象观测等,这为AI模型的训练与应用提供了坚实支撑。最后,我国科研人才数量多、基础好。AI人才与生物学家、材料科学家、农业专家、气象学家之间的跨界合作,正在不断产生思想与算法的火花,带来更多可落地、甚至突破性的成果。 张国仁:回到应用层面,随着AI4S的发展,哪些领域最受益? 何亮:我毕业后就投身AI4S,更具体地说是AI for Life Science(生命科学)领域。从实践来看,生命科学和生物医药首先受益。众所周知,传统制药周期长、成本高——“两个十”:十年时间、十亿美元投入。而AI+制药可以将周期从十年缩短到几个月,大幅提升效率。第二个受益领域是材料科学。由于材料元素组合复杂、搜索空间巨大,AI能帮助快速筛选出具有特定属性的新材料。第三是农业育种。中国作为人口大国,粮食安全是国家战略。AI通过基因组数据分析,可以指导高产、耐旱、抗虫等优良特性品种的培育。第四是气象能源领域。例如在西北地区开展风力发电,借助天气预测或风能预测大模型,就能更好地规划与优化发电。 张国仁:聊一个跟您专业直接相关的话题,也是AI4S比较受大众关注的一个点,2024年诺贝尔化学奖颁给了蛋白质结构预测领域的科学家,其中很重要的功能是AlphaFold3大模型,这个对行业来说意味着什么意义? 何亮:这太重要了。我刚进入AI4S领域没多久,AlphaFold就出现了。蛋白质结构预测是长期存在的科学难题,而AlphaFold3首次让模型预测达到实验级精度,这是一次里程碑式的突破。这意味着科学界正式认可AI具备解决重大科学问题的能力,AI4S在科研体系中拥有了应有的一席之地。更重要的是,它给从业者带来了信心和鼓舞:既然AI能解决这一重大问题,就可能在更多科学领域实现突破,推动人类科技的整体进步。 张国仁:好的,说到AI4S对科学研究的帮助,您前面提到了一些例子,被创造出来的可以叫作“生物”吗,如果是的话,可能会涉及到一些伦理的问题,包括基因编辑,那会有安全上的隐忧吗?或者在科学界,你们在应用这些技术的时候有没有一些安全上的应对方法策略,在行业里面国际上形成一些共识? 何亮:通过AI4S设计出的第一个病毒噬菌体虽然名称中带“病毒”,但对人类没有危害。然而,这也提醒我们潜在的伦理风险。AI在一定程度上降低了制造潜在危险生命体的门槛,使其变得更容易被创造出来。除此之外,还有诸如公平性、可用性、环境影响等多方面的伦理问题。总体来说,首先我们应从AI本身出发,践行“负责任的AI”(Responsible AI),确保AI的使用在合理监管下进行。其次,我认为需要建立跨行业的委员会或评审监督机制,对新技术成果在推广和扩散阶段进行监管和评估。当然,这并非一国之事,必须推动国际合作。值得肯定的是,我国在AI4S伦理治理方面已取得一定成功。总体而言,伦理规范应走在科技发展的前面,这应被放在极为重要的位置。 张国仁:确实是行业野蛮发展必然会面对的一些问题。回到您的研究,现在是不是有些AI工具已经在研究中占据主导位置了?如果说在一些数据上跟你实际时间有冲突,会如何处理呢? 何亮:这个问题可以分两方面看。一是我个人在科研过程中的AI应用,二是AI在科研题目中的应用。就我个人而言,大语言模型已经非常强大。无论是科研中的数据收集、文献调研,还是实验过程中的代码编写、调试(debug),以及论文撰写和润色,AI都能提供很好的帮助。它是一个强有力的工具,正在显著加速科研进程。但AI也存在“幻觉”问题,因此我们需要保持清醒的判断,确保生成内容与事实相符。第二个方面是AI在生命科学全流程中的应用:从靶点发现、结构解析、小分子设计,到临床前验证,AI贯穿始终。以我最近发表在《Nature Machine Intelligence》上的论文为例,我们研究如何优化蛋白质序列。湿实验无法穷举所有突变组合,哪怕是几个氨基酸位点的突变,组合空间都可能达到数十亿甚至上百亿种,极其耗时耗力。我们的做法是先通过部分湿实验获得数据,让AI学习其中的规律。掌握规律后,AI可以在虚拟空间中进行快速实验,加速验证整个搜索空间。 此外,我们引入强化学习等算法来探索这一巨大空间。模型建立之后,AI可以迭代地进行搜索和优化。结果显示,这种方法的成功率很高,也找到了性能优异的突变方案。也就是说,从湿实验观测到AI生成与再验证的全过程,AI都深度参与其中。但最终的验证仍必须依赖客观的实验世界。 张国仁:具体到你们应用这些AI的工具,前面探讨的更多是基于这些现象或是大面上,具体到你们应用的工具,从算力到大模型,或者一些专用的领域,大概用到了哪些方面的东西?让我们感受更明确一些。 何亮:目前国内的大语言模型发展非常快,比如DeepSeek、千问等模型,在中文理解方面相比ChatGPT更具优势。很多时候我会在工作中交叉使用多个模型,包括ChatGPT,用于英文文献阅读与信息整理。 张国仁:国内有一些专用的工具吗,像AlphaFold3专门做蛋白质研究,有专用于某些领域的研究工具吗? 何亮:有的。我国也在积极研发自己的生物结构预测模型和科学基础模型。虽然与国际领先水平相比,我们在这一领域所占比例还不算大,但发展速度很快。这也是我们持续努力、追赶并力争引领的方向。 张国仁:明白,随着AI的加入,一方面是一个好的助手,好的工具。另一方面是不是很大程度上提高成本的投入,有的实验需要采购大的超算,对于科学研究的成本是不是一种增加? 何亮:实际上,AI科研的成本是阶段性的。最消耗算力的是模型预训练阶段,包括蛋白质模型和科学大模型的基础训练,这部分显卡资源需求确实较高。但在完成预训练后,推理阶段的算力需求会大幅下降,因此总体投入在后期并不会持续高企。我的理解是,AI科研的成本主要集中在早期模型构建阶段。 张国仁:也是一个阶段性的,不是每时每刻一定是高消耗的状态。其实还有一个很本质的问题,我们刚才说到AI For Science,就是科学家要用AI,科学家首先得用好AI,是不是也得懂AI,对于AI+科研的人才,会有什么样的要求吗? 何亮:我认为AI+科研的人才培养,关键在于跨学科。未来应当培养既理解AI、又熟悉专业领域的复合型人才。一个人不可能精通所有领域,但需要在AI方法和学科知识之间建立桥梁。 以模型构建为例,必须理解领域数据的特点——哪些数据合理、哪些可被AI有效利用。毕竟,如果输入数据质量差,输出结果也不会可靠。因此高质量数据的整理与理解需要领域专家深度参与。 我本身是做AI出身的,也在与生物学同事的合作中不断学习。不同学科的思维差异巨大,彼此理解的过程本身就是创新的来源。 在学生培养方面,也应鼓励交叉思维,知识结构既有侧重又有交叉,促进不同领域之间的深度合作与学习。 张国仁:我觉得您说的这两个非常关键,一个是人工智能教育应该从娃娃抓起,好像我们现在从小朋友到长辈,大家都在使用互联网,大家觉得这不是一个需要学习的东西,同样人工智能在下一代也是一样要成为他们习以为常的工具,第二方面各个领域的人互相的配合,互相结合,去完成一个事情也非常重要,所谓跨学科交叉学习更为重要。 感谢何老师对我们深入浅出对于AI For Science这个领域,对普通人既远又近的领域的分享,让我们有了更多认识,也感谢观众对我们的关注。
重磅!三星首款XR头显登场,一万三硬刚苹果Vision Pro,网友:替Meta圆梦了
作者 | 王涵 编辑 | 漠影 三星首款旗舰XR头显,终于来了! 智东西10月22日消息,今天,三星电子在Galaxy Event直播中发布XR头部显示器Galaxy XR。该头显是首款搭载全新Android XR平台的消费级设备,直接向苹果Vision Pro和Meta Quest吹响竞争的“号角”。 去年12月,三星和谷歌首次发布了这款设备的预告,当时的代号是“ Project Moohan ”。时隔10个月,这家全球第一大手机厂商终于揭开了Galaxy XR——其首款旗舰XR头显的“神秘面纱”。 Galaxy XR侧视图(图源:三星官网) Galaxy XR仅重545g,比苹果Vision Pro足足轻了1/4还要多。其搭载了分辨率为3552×3840的Micro-OLED屏,DCI-P3色域覆盖高达96%,比Vision Pro还要高出4个百分点,能够显示更加真实、清晰的色彩。 这款设备最新颖的地方,也是跟苹果最大的区别就是搭载了全新Android XR平台,内置Gemini,直接把AI助手装进了头显设备里。 功能上,除了基础的影视听,Galaxy XR也可以通过透视功能与现实交互,用手画个圈就能即时搜索眼前任何事物的信息。 更惊喜的是价格,Galaxy XR售价1799.99美元(约合人民币1.28万元),只有苹果Vision Pro的一半。 三星Galaxy XR与苹果Vision Pro参数对比(智东西制图) 此外,三星在公告中透露,三星和谷歌还在合作开发智能眼镜,这款眼镜将与Galaxy XR一样,搭载谷歌的Gemini人工智能助手。谷歌还在与Warby Parker和Gentle Monster等品牌合作开发类似的眼镜产品。 一、内置Gemini,Android XR平台为XR生态系统提供新选项 Android XR平台由三星与谷歌和高通共同开发,从一开始就内置了Gemini。该平台可以被用于扩展到多种形态设备,包括头戴设备到AI眼镜及其他领域,为XR行业带来了生态系统的新选择。 所有基于Android平台构建的应用程序都能在Galaxy XR上开箱即用,确保用户能够享受熟悉和喜爱的软件,能够满足日常使用的实用性。 Galaxy XR部分支持应用软件(图源:三星官网) 由于该平台基于OpenXR标准构建,使用OpenXR、WebXR或Unity的开发者可以将他们开发的软件引入Galaxy XR,这为开发者提供了更多扩展途径,也为消费者带来了更多选择。 二、重545g,续航2.5小时,Galaxy XR还搭载骁龙XR2+Gen 2平台 显示上,Galaxy XR搭载了分辨率为3552×3840的Micro-OLED屏幕,像素总量达2900万,像素间距仅6.3微米,DCI-P3色域覆盖高达96%,同时支持60Hz、72Hz(默认)、90Hz多档刷新率调节,水平视场角109度、垂直视场角100度。 芯片上,它采用骁龙XR2+Gen 2平台,配合16GB内存与256GB存储。 Galaxy XR支持3D照片与视频拍摄,配备18mm/F2.0镜头的6.5MP摄像头(分辨率随使用场景动态调整)。其还配置2颗高分辨率透视摄像头、6颗环境追踪摄像头、4颗眼动追踪摄像头、5个惯性测量单元、1颗深度传感器及1颗闪烁传感器,此外,设备支持虹膜识别,可用于设备解锁及特定应用密码输入。 通过传感器,Galaxy XR能够精准追踪用户的头部、手部和眼部运动,以感觉自然且拟人化的对话方式作出回应。 Galaxy XR正视图(图源:三星官网) 音频与视频方面,Galaxy XR配备双路扬声器(低音炮+高音喇叭),六麦克风阵列(部分支持波束成形技术),音频播放支持MP3、AAC、FLAC、Dolby ATMOS等多格式编解码;视频可播放UHD 8K(7680×4320)@60fps内容,且兼容HDR10、HLG格式,编解码支持H.263、HEVC、AV1等主流标准。 交互与适配细节上,Galaxy XR瞳距调节范围覆盖54-70mm,支持通过单独购买光学插片实现视力矫正。 Galaxy XR整个设备重量为545g(含前额软垫,单独电池重302g),使用符合人体工学的平衡框架,将压力分散于前额与后脑,在提供稳定支撑的同时,能够减轻面部的不适感。 其采用电池组与头显分离的设计,可以让设备更紧凑、轻便,佩戴更舒适。Galaxy XR还配备了可拆卸的遮光罩,装上后能有效阻挡外部光线。 Galaxy XR实拍图(图源:X) 连接方面,其配备Wi-Fi 7与蓝牙5.4,保障高速无线传输与外设兼容。Galaxy XR支持边充电边使用,常规使用续航约2小时,视频播放续航可达2.5小时。 三、Galaxy XR能把2D图片转换成3D,还能随圈随搜 软件功能方面,佩戴Galaxy XR的用户可将Gemini作为向导,在沉浸式3D地图中通过谷歌地图导航至目的地,并获取附近场所的个性化推荐。 3D地图功能演示(图源:三星官网) 在透视模式下,用户可以看到周围的物理世界,并用手画个圈即可即时搜索眼前任何事物的信息,其还可以自动将谷歌相册中的视频和照片空间化为3D虚拟空间。 3D图片功能演示(图源:三星官网) 在玩XR专属游戏时,用户可实时与Gemini对话获取战术指导、操作技巧等攻略。Galaxy XR内置Adobe的Project Pulsar软件,用户能在巨幕画布上添加3D景深效果,并将字幕或图标图层置于主体后方。 用户可以要求Gemini在YouTube上查找想观看的内容,并获取正在观看视频的更多信息,还能够身临其境观看体育比赛。 沉浸式观赛功能演示(图源:三星官网) 外网有博主体验后称:“Android XR丝滑得让人不敢相信。” 网友评论(图源:X) 还有网友开玩笑说三星做到了Meta没有做到的事情,现场演示非常丝滑没有“WiFi或服务故障”。 网友评论(图源:X) 结语:Galaxy XR给XR设备市场注入新鲜血液 Android XR平台的落地应用为XR行业提供了不同于Apple VisionOS的“安卓方案”。 作为XR市场的新入局者,Galaxy XR展现了一套完整的产品体系,其核心差异化的Gemini AI集成,体现了XR设备从纯交互工具向智能助手演进的技术趋势。 这款产品代表了安卓生态对XR领域的系统性尝试,其市场表现还将取决于这些技术特性在实际应用场景中的稳定性和实用价值。
腾讯《英雄联盟》25.21国服版本明日更新:实装DX11特性升级,淘汰不符合要求的老旧硬件
IT之家 10 月 22 日消息,腾讯《英雄联盟》国服早在今年 2 月就预告过将带来 DirectX 11 特性升级,同时逐步停止对一些老旧硬件 / 软件的支持。 《英雄联盟》开发团队原计划在 9 月的 25.18 版本完成对 Windows 平台的 DirectX 11 使用方式进行优化升级,但实际上直到明天的 25.21 版本才会正式实装。 IT之家注意到,《英雄联盟》国服今年的最后一个赛季通行证明天将与【小蜜蜂妮蔻】、【机神斯卡纳】和【至臻永恒星灵佐伊】一同上线;部分英雄迎来调整;训练模式稍作改进;【海克斯大乱斗】将持续开放至 25.24 版本。 关于游戏硬件 / 软件支持的调整说明 如果你的显卡支持 DirectX 11 特性级别 11_0,则需确认显卡驱动是否升级到最新。 ●如果你的显卡仅支持 DirectX 11 特性级别 10_0 或更低,则需要升级显卡硬件才能继续畅玩《英雄联盟》。 以下是针对已安装 DirectX 11 的玩家升级到 DirectX 11 Feature Level 11 的详细指引: 第一步:理解“Feature Level”是什么? ●DirectX 11 是一个大版本,而 Feature Level 11(如 11_0、11_1) 是它的子级别,代表显卡硬件支持的具体图形功能等级。 ●即使系统显示“DirectX 11”,你的显卡可能仅支持低等级 (如 10_1),需检查并升级到 Feature Level 11_0/11_1。 第二步:检查当前显卡的“Feature Level” 1.使用 DirectX 诊断工具: 1) 按下 Win + R (或开始--> 运行),输入 dxdiag 回车 (见下图)。 2) 切换到 “显示” 标签页,查看 “功能级别”(例如:11_0、11_1 或 10_1)。如果显示包含 11_0/11_1,说明已支持,无需升级 (见下图)。 i.如果显示 10_x 或更低,需继续操作。 第三步:确认显卡硬件是否支持 Feature Level 11 ●Feature Level 由显卡硬件决定,无法通过软件升级强行支持。 ○需检查显卡型号是否满足以下最低要求:NVIDIA:GTX 400 系列及以上 (如 GTX 460、GTX 750 Ti)。 ○AMD:HD 5000 系列及以上 (如 HD 5870、R7 260X)。 ○Intel 核显:第 4 代酷睿 (Haswell) 及以上 (如 HD 4400、Iris Xe)。 ●如何查显卡型号: ○使用 DirectX 诊断工具 (见第二步),或右键点击桌面“此电脑” → “管理” → “设备管理器” → “显示适配器”。 ○记录显卡名称 (如 NVIDIA GeForce GTX 1050)。 第四步:升级显卡驱动 (最大化兼容性) 即使显卡支持 Feature Level 11,旧驱动可能导致功能未启用: 1.NVIDIA 用户: a.访问 NVIDIA 驱动下载页,输入显卡型号,下载最新驱动。 b.安装时勾选“清洁安装”(彻底清除旧驱动)。 2.AMD 用户: a.访问 AMD 驱动下载页,选择显卡型号,下载最新驱动。 b.安装时选择“恢复出厂设置”(避免冲突)。 3.Intel 核显用户: a.访问 Intel 驱动下载页,使用自动检测工具安装驱动。 第五步:验证升级结果 1.再次运行 dxdiag ,确认“功能级别”是否升级到 11_0/11_1。 2.开启英雄联盟,测试是否正常。 常见问题解决 1.提示“显卡不支持 Feature Level 11”: a.硬件不支持:需更换显卡 (最低要求见第三步)。 b.驱动未更新:用 DDU 工具彻底卸载旧驱动,再重装最新驱动。 2.系统为 Windows 7: a.部分老显卡在 Win7 下可能无法启用完整 Feature Level 11,建议升级到 Windows 10/11。 3.Intel 核显用户: a.部分 Intel 核显 (如 HD 4000) 仅支持到 Feature Level 11_0,无法升级到 11_1,需更换硬件。 终极方案 (硬件不支持时) 如果显卡硬件过旧 (如 GT 610、HD 5450),无法支持 Feature Level 11: 1.更换显卡:推荐至少 GTX 1050 或 RX 560 及以上。 2.购买新电脑:笔记本或品牌机建议选择近 5 年内产品。 通过以上步骤,可确保你的显卡在硬件和驱动层面完全支持 DirectX 11 Feature Level 11。
小米卢伟冰:未来手机品牌分成两类,有自研芯片和没有自研芯片
IT之家 10 月 22 日消息,据界面新闻今日报道,小米集团合伙人、总裁、手机部总裁、小米品牌总经理卢伟冰接受采访,谈及了自研芯片对小米的未来有多重要这个话题。 卢伟冰表示: 我的认知中,未来手机品牌分成两类,有自研芯片和没有自研芯片。自研芯片不只是自研的芯片本身,它带来的是底层的芯片能力。这个的好处就是,能够推动软硬件深度融合,带来更好的体验。比如 iPhone 的功耗控制很好,就是既有芯片,又有操作系统,还有自己对生态的掌控,这三层耦合到一起的结果。 IT之家回顾小米造芯历程: 2014 年,小米刚刚创业 4 年就全资成立松果电子。经过 3 年研发,小米首款自研手机 SoC 芯片 —— 澎湃 S1 在 2017 年 2 月发布,搭载该芯片的小米 5C 手机卖了六十多万台。但雷军透露,自己清楚松果其实走不下去了,于是在 2018 年停止 SoC 芯片研发,保留一些外围芯片火种。 但后续小米陆续研究复盘,得出了一个“反直觉的结论”:自研手机 SoC,只有做最高端,才有一线生机。雷军表示,经历半年时间、几十场的复盘讨论,终于明确了小米未来的发展道路:大规模投入底层核心技术,从“互联网公司”走向“硬核科技公司”。 2021 年,小米重启造芯,但上百亿的投入压力巨大;2024 年 5 月 22 日,小米新款自研 SoC —— 玄戒 O1 首次回片,当晚 9 点实现系统点亮,第二天凌晨 5 点全模块调通;2025 年 5 月 22 日,小米自主研发设计的玄戒 O1 旗舰处理器正式亮相,由全新小米 15S Pro 手机首发。 雷军表示,小米自研大芯片自 2021 年重启,就计划至少投资 10 年、至少投资 500 亿元。雷军还透露,第二代玄戒芯片会考虑在车上应用。“第一代主要是验证技术,技术好到我无法相信”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。