行业分类:
加载中...
头条分类:
加载中...
地方戏积极探索演出形式 沉浸式演绎请观众“入戏”
  图①:国风环境式新编楚剧《又从西厢过》剧照。   段 浩摄   图②:梨园戏《陈三五娘》沉浸式互动演绎剧照。   福建省梨园戏传承中心供图   湖北省武汉楚剧院创排《又从西厢过》   晴川阁前,和“张生莺莺”互动   记者  田豆豆   节奏慢?听不懂?太老套?不存在的。夜幕降临,湖北武汉晴川阁景区的一场楚剧表演,引得市民游客笑声掌声不断,一些开场前还在刷手机的年轻观众,不到5分钟就津津有味地沉浸在剧情中。   这出戏是武汉楚剧院的国风环境式新编楚剧《又从西厢过》。“这是我第一次看楚剧,没想到楚剧这么有趣!”来自河南的游客张女士说。演出中,她还主动举手“入戏”,为主角张生和崔莺莺的婚礼献上才艺表演。   《又从西厢过》编创的故事可看作《西厢记》“后记”,展现的是张生和崔莺莺婚后的日常生活。去年首演以来,该剧小剧场版演出获得好评。今年春节前后,该剧再次改编后进驻武汉地标晴川阁景区进行实景演出。   《又从西厢过》晴川阁实景版在剧中增加了一名丑角扮演的打更人角色,通过他的串场解说,不少过渡性情节被压缩成一句话,角色的身份、心情等也由他解说清楚。武汉楚剧院党委书记韩笑介绍,楚剧念白一般用武汉方言,但在此剧中,除主角外,配角特地改说“汉普”,也就是带有武汉口音的普通话,既保留了武汉方言独特的幽默感,又让观众更易听懂。   更大的创新在于演员与观众的频繁互动。大约每10分钟便有一次邀请观众“入戏”的情节。戏剧在张生和崔莺莺的婚礼中开场,打更人化身主持,请观众上台即兴表演,为婚礼助兴。张生在石磨倒地后,便从观众中寻找帮手:“有没有哪位壮士能搭把手,帮小生把它抬起来?”被选中的观众上台后“浑身是戏”,抬起泡沫塑料做的石磨却好像真有数百斤重,逗得其他观众哈哈大笑。   “楚剧本身的特点就是接地气,活泼、诙谐,实景演出中,我们更是充分发挥这些特点。”武汉楚剧院青年演出团团长、《又从西厢过》导演余维刚说,楚剧的诙谐和戏曲本身的唱念做打相得益彰。武丑将插科打诨与武戏表演融为一体,小旦们爽朗活泼,将花枪舞得虎虎生风,引来阵阵喝彩。   《又从西厢过》排演过多个版本,均由20多岁的青年演员担纲主演。“实景演出要与观众互动交流,对我们的临场应变能力提出了更高要求,刚开始我很紧张,但现在已经逐渐适应,在舞台上更加放松自如。”张生的扮演者、青年演员宋健说。   晴川阁是武汉著名景点。今年以来,许多来到武汉的游客在这里邂逅《又从西厢过》。“戏曲是传统的,但戏曲所表达的情感可以跨越时空。希望这出戏能与观众产生情感共鸣,真正拉近中华优秀传统文化与现代观众的距离。”余维刚说。   福建省梨园戏传承中心改编传统剧目   余庆楼里,与“陈三五娘”同游   记者  施  钰   背着书包、拖着行李箱,来自广东潮州的游客黄先生和朋友匆匆赶到福建泉州洛阳桥畔的余庆楼门口,他们准备在这里体验梨园戏《陈三五娘》沉浸式互动演绎。   “看了不少梨园戏,这种沉浸式演出还是第一次看。”还未到演出时间,就有不少像黄先生一样的年轻观众站在余庆楼前等待开场。   “梨园戏需要年轻观众。我们想打破传统舞台的‘框’,在更贴近观众的环境中,为观众创造一种全新的体验。”福建省梨园戏传承中心导演曾龙从2016年开始探索梨园戏在新空间内的演绎方式,努力让传统梨园戏走进更多年轻人的视野。   《陈三五娘》是梨园戏经典剧目,讲述了福建泉州的陈三与广东潮州的五娘在元宵节邂逅,历经波折最终喜结连理的爱情故事。这一民间传说在粤东、闽南地区广为流传。改编如何既引起年轻人看戏的兴趣,又不至于让老戏迷觉得陌生?   曾龙介绍,编剧提取了《陈三五娘》中最为精华的7个表演场景,保留了剧目的核心表达与原汁原味的传统形态。同时,在演出空间布局、结构形式、时长安排上作出相应改变,加入更多互动元素。为了便于更多观众理解,演出还加入3个引导人角色,用富有网感的语言介绍剧目背景、解说剧情发展。   自今年春节开始,每逢节假日,余庆楼里都会上演《陈三五娘》沉浸式互动演绎。在楼前空地,观众们化身元宵灯会上的路人,见证陈三与五娘灯下邂逅的浪漫场景;二楼连廊上,观众担当“助攻”,鼓励五娘对陈三抛下荔枝手帕、传达绵绵情意……楼内楼外、楼上楼下,1个小时的时间里,观众跟随演员的脚步穿行在古厝中,看戏人也成了戏中人。   “陈三五娘的故事我从小就听说过,没想到他们能把老剧目玩出新鲜感,这种实验性演绎很有意思。”黄先生一边欣赏,一边举起手机抓拍眼前的动人瞬间。   带来新鲜感的还有年轻的演员。《陈三五娘》沉浸式互动演绎的戏曲演员都是05后。今年18岁的郑怡萍扮演五娘一角,学习梨园戏7年,她第一次和观众离得这么近。郑怡萍说,为了把观众带入戏中情境,她在表演中更注重细节展现,“要更生动饱满地传递角色情绪”。   “我们一直坚持守正创新的理念。”曾龙说,近些年,福建省梨园戏传承中心做了不少创新尝试,单是《陈三五娘》这一个剧目,就推出了平行时空版、赛博朋克版、读剧版、音乐会版等具有实验性质的版本。“希望吸引更多人来了解梨园戏、爱上梨园戏,让这一古老剧种持续焕发新活力”。   链接   楚剧   楚剧是清代形成于湖北孝感、黄陂一带的地方戏,旧称哦呵腔、黄孝花鼓戏、西路花鼓戏,1926年定名为楚剧,2006年入选首批国家级非物质文化遗产名录。楚剧题材广泛、通俗易懂、乡土气息浓厚,表演生动活泼、朴实逼真,富有浓郁的生活情趣。楚剧有板腔、小调、高腔三大声腔,语言诙谐风趣、鲜活生动。代表剧目有《葛麻》《庵堂认母》《双玉蝉》《潇湘夜雨》等。   (湖北省武汉楚剧院提供)   梨园戏   梨园戏发源于宋元时期的福建泉州,距今已有约900年历史。梨园戏分为“上路”“下南”“小梨园”三大流派。“上路”大多搬演“忠孝节义”题材,保留了《朱文》《王魁》等许多南戏古剧目;“下南”大多搬演民间故事,有《李亚仙》等传统剧目;“小梨园”的“七子班”典雅精致,有《吕蒙正》等传统剧目。梨园戏表演程式古朴独特,保存许多唐宋古乐。2006年,梨园戏入选首批国家级非物质文化遗产名录。   (福建省梨园戏传承中心提供)
执掌英伟达30余年,黄仁勋缺乏明显接班人引发“关键人风险”
黄仁勋把英伟达打造成了全球市值最高公司 凤凰网科技讯 北京时间1月27日,据彭博社报道,黄仁勋(Jensen Huang)是硅谷任职时间最长的CEO。然而,英伟达缺乏明确的CEO接班人引发了“关键人物风险”。 近日,黄仁勋被问及自己是如何在这一职位上坚持了30多年。现年62岁的黄仁勋本月早些时候在拉斯维加斯的一次公司活动上说:“长期担任CEO的秘诀是:第一,不要被解雇;第二,不要感到厌倦。” 黄仁勋将英伟达打造成芯片巨头和全球市值最高的公司,短期内不太可能被解雇。他也丝毫没有表现出对工作失去兴趣的迹象:这位不知疲倦的高管穿梭于全球各地,不遗余力地宣传AI计算,还时不时抛出“老爸式冷笑话”,总能引来全场专注的目光。 无接班人 然而,即便是最有活力的CEO最终也需要为继任者让路。对于英伟达这样一家处于AI热潮中心、市值高达4.5万亿美元的公司而言,它几乎没有展现出自己已经为这一过渡做好准备。 在微软,比尔·盖茨(Bill Gates)之后有史蒂夫·鲍尔默(Steve Ballmer)。在苹果,史蒂夫·乔布斯(Steve Jobs)之后有蒂姆·库克(Tim Cook)。 但是,黄仁勋却没有明确的接班人,英伟达也未公开披露其长期领导层继任计划。 关键人物风险 在过去三年股价飙升842% 后,英伟达的投资者们无疑希望了解,公司董事会是否已长远地考虑过领导层过渡问题,而不是等到迫在眉睫时才着手应对。 “如果你是英伟达的投资者,却不担心‘关键人物风险’,那是不可能的。”NZS Capital基金经理乔恩·巴斯盖特(Jon Bathgate)表示。 黄仁勋与英伟达机器人 他表示,黄仁勋的管理风格是快速决策、组织架构高度扁平化,这正是让英伟达与众不同的核心所在。“如果公司不由黄仁勋掌舵,那它就必须转向更传统的企业架构。”巴斯盖特称。 潜在候选人有谁? 黄仁勋下月将年满63岁,是英伟达无可争议的“门面人物”,其旋风般的公开行程已使他个人与公司的公众形象密不可分。 当英伟达其他高管进入公众视野时,他们通常仅专注于自己的直接职责领域和技术话题。在讨论更广泛的议题时,他们更倾向于援引黄仁勋的观点。 巴斯盖特还表示,英伟达内部确实拥有像伊恩·巴克(Ian Buck)和布莱恩·卡坦扎罗(Bryan Catanzaro)这样声誉卓著的技术领袖。但他认为,目前并没有迹象表明他们已经做好准备,可以承担起公司层面的重大战略决策责任。 英伟达目前有四位执行副总裁。其中一位担任总法律顾问,另外两位已年过七旬。第四位是CFO科莱特·克雷斯(Colette Kress)。尽管她比黄仁勋年轻,目前接近60岁,但在科技巨头中,从财务部门选拔最高领导人并不常见。 “继任计划极少对外公开,企业通常出于竞争等原因,不会过早指定继任者。”投资管理公司Harding Loevner的投资组合经理穆恩·苏拉纳(Moon Surana)表示,“尽管如此,若公司能更多地展示其高层领导力与管理梯队,将有助于投资者评估其管理层的深度与继任准备情况。” 对于股东而言,他们的期望是黄仁勋能在CEO的职位上继续执掌英伟达很多年。“他打造了一家市值4万亿美元的公司,并一直是公司对外的主要‘门面人物’。我们希望在未来很长、很长的时间里,都不需要知道没有他公司会如何运作。”Evercore财富管理公司的投资组合经理迈克尔·柯克布里德(Michael Kirkbride)表示。 截至发稿,英伟达尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
Mete将在三大社交平台测试付费订阅 推独家功能整合Manus
Meta 凤凰网科技讯 北京时间1月27日,据科技网站TechCrunch报道,社交巨头Meta周一表示,计划测试新的订阅服务,为用户提供访问其应用独家功能的权限。Meta称,新订阅将释放更大生产力和创造力,并提供增强版AI功能。 Meta表示,未来几个月将在Instagram、脸书和WhatsApp上提供一项付费高级体验,让用户能使用特殊功能,并对自己的分享和连接方式拥有更多控制权,同时保持核心功能免费。Meta似乎并不局限于单一策略,指出公司将测试多种订阅功能和套餐组合,并且每个应用的订阅都将拥有一套独特的专属功能。 作为订阅计划的一部分,Meta计划将近期收购的AI智能体Manus进行规模化应用。Meta据称以20亿美元收购了Manus。 目前,Meta对Manus采取了一种双管齐下的策略。该公司一方面计划将Manus整合到Meta的现有产品中,另一方面也将继续向企业用户销售独立的订阅服务。根据经常发现未发布功能的逆向工程师亚历山德罗·帕卢齐(Alessandro Paluzzi)分享的截图,Meta已经被发现在Instagram上着手添加一个通往Manus AI的快捷入口。 此外,Meta计划测试AI功能订阅,例如Vibes视频生成工具。Vibes是Meta内置在其Meta AI应用中的、由AI驱动的短视频体验,允许用户创建和混编AI生成的视频。尽管自去年推出以来Vibes一直免费,但Meta现在计划为Vibes视频创作提供“免费增值”模式,用户可以选择订阅以每月解锁额外的视频创作机会。 尽管尚不清楚WhatsApp和脸书上的付费功能具体会是什么样子,但帕卢齐指出,Instagram的新订阅将允许用户创建不受限制的观众列表,查看没有互相关注的粉丝列表,以及选择在不被发布者看到的情况下浏览Story阅后即焚内容。 值得注意的是,这些新订阅服务将独立于“Meta认证”(Meta Verified)之外。Meta表示,将利用从“Meta认证”中获得的经验来发展其订阅业务,纳入更多它认为日常用户、创作者和企业会想要的服务。 Meta表示,计划在未来几个月开始推出这些订阅服务时,倾听其用户社区的反馈并收集意见。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
李彦宏接受《时代》专访:AGI可能不存在
李彦宏 凤凰网科技讯 北京时间1月27日,百度CEO李彦宏接受了美国《时代》杂志的专访,谈到了百度在AI领域的发展历程。李彦宏表示,他甚至不相信存在所谓的通用人工智能(AGI),没有一个模型能够“面面俱到”,OpenAI不行,谷歌也做不到。在模型发展上,中国落后得没那么多。 在百度北京庞大总部入口大厅的墙上,悬挂着一块镶嵌着金色数字“1417”的小木牌。这个数字取自北大对面的一间宾馆房间。正是在那里,李彦宏于2000年创立了这家市值500亿美元的公司。 在公司创立早期,李彦宏的重点是巩固百度作为中国领先搜索引擎的地位。然而,他早在本科阶段在北京大学和清华大学上课时,就对AI产生了浓厚兴趣。但是在1991年他赴美攻读研究生时,这份兴趣被暂时搁置。 “我对教授说,我对AI感兴趣,但他却说:‘别搞这个,否则你将来会找不到工作的!’”李彦宏笑着回忆道。 如今,事实证明了这位教授当年的判断大错特错。据估计,去年全球AI市场规模已达2440亿美元,而AI芯片先锋英伟达已成为全球市值最高的公司,价值超过4万亿美元。李彦宏早早地预见到了这一趋势,如今百度已成为中国领先的全栈式AI企业之一,提供从芯片、云基础设施,到模型、智能体、应用和消费产品的全套服务。 去年11月,《时代》在百度世界大会期间采访了李彦宏。以下是采访全文: 问:你在2000年创办百度时,有没有预料到AI能在今天发挥如此重要作用? 李彦宏:没有。当时我创办百度时,我意识到互联网将在中国成为一件大事,而搜索技术对于中国互联网的发展非常重要。但我当时并没有把AI和搜索引擎联系起来。大约在2010年,我们意识到机器学习(AI的一个分支)开始在搜索结果排名中发挥作用。我们大约在那时开始投资AI,以便研究有多少人会点击某个链接。随后在2012年,我们意识到深度学习将变得非常重要。它识别图像的精确度远超上一代技术。百度对AI的实质性大规模投资,正是从2012年左右开始的。 问:你曾提到,去年在将AI融入社会和经济各个领域方面,许多门槛已被打破。你认为2025年是AI普及的关键之年吗? 李彦宏:就应用而言,是的。因为在2023年或2024年,主要关注的还是基础模型。基础模型的能力不断提升,同时推理成本持续下降。但未来,人们必须考虑应用层面的增值。在过去大约半年里,我们已经看到,这波AI浪潮在应用层面创造价值的各种场景。 问:你最近发布了文心一言5.0,在多个指标上都能与ChatGPT、DeepSeek及其他大语言模型一较高下。但这是一个竞争非常激烈的领域。是什么让你觉得文心一言能够脱颖而出? 李彦宏:在开发我们的基础模型,也就是文心一言时,我们采取的是以应用为驱动的策略。特别是5.0版本,我们并不试图“面面俱到”,而是专注于我们非常关心的应用领域,例如搜索或数字人。在这些领域,无论基础模型层面需要哪些能力,我们都会训练模型在这些技能上表现出色。 举例来说,我认为我们的模型在指令执行和创意写作方面表现非常好,创意写作方面甚至被评为第一。因为这些能力可以用在数字人层,尤其是在数字人进行直播、电商销售时。要卖东西,你需要写出非常有说服力的脚本,让用户愿意为商品付费。因此,我们会针对这些应用场景优化模型。 我们认为,未来没有任何基础模型能够在每个方面都做到最好,OpenAI做不到,谷歌Gemini也做不到,我们自己也做不到。但我们会优化模型,使其在我们最关心的应用方向上表现更好。 问:你是否认为基础模型领域会像其他技术一样,很快进行整合,只剩下少数几个佼佼者? 李彦宏:我认为最终确实会如此。桌面互联网是这样,移动互联网是这样,AI也将会是这样。最终可能只会剩下少数几个基础模型,但在应用层,将会有许多在不同方向上取得成功的参与者。我认为那里蕴藏着最大的机遇,否则这一切只会成为一个泡沫,迟早会破裂。 问:你曾表示芯片的价值存在误导性,而应用层的附加值需要提升。作为一家全栈AI公司,百度在哪些应用领域看到了增长和收入的潜力? 李彦宏:这正是我的观点。我认为目前的格局像一个金字塔:大部分价值体现在芯片层面,模型层面可能只实现了十分之一,而应用层面实现的价值更少。这显然不健康。我之所以这么说,是因为自2023年初我们在开发基础模型时采取了非常不同的策略,当时大家的注意力都集中在文心一言上。我公开表示:“不要只关注模型,要关注应用。”这正是我们过去两三年坚持的方向。因为我坚信,必须在应用层创造更多价值,才能持续支撑对模型、芯片等底层技术的投入。 问:百度积极拥抱开源模型,你为何认为这是最佳选择? 李彦宏:我们一直支持开源社区,尤其是在深度学习框架层面。我们的飞桨开源深度学习平台有数千万开发者在使用,其影响力可与TensorFlow和PyTorch媲美。在模型层面,我们也认识到开源能吸引更多关注,让人们更愿意尝试并验证其效果。但必须说明的是,我不认为开源是价值创造的关键。准确地说,这并非真正的“开源”,而是“开放权重”。你可以获得模型所有权重参数,却无法知晓训练数据,因此难以完全复现模型开发者的成果。不过这并不重要:关键在于为你的应用提供最佳性能的模型。它可能是一个小型开源模型,也可能是昂贵的大型闭源模型。只要它能创造的价值远超过你在推理和训练上的投入,就值得采用。当前行业正处于模型爆发期,几乎每周甚至每天都有新模型发布。开发者拥有丰富的选择,但这种局面终将趋于稳定并走向成熟。当更多模型开发者转向应用层,为各类场景开发智能体时,生态系统便会真正成熟起来。 问:与上次交流时相比,我感受到一个显著变化是百度正坚定推进国际化扩张,特别是萝卜快跑自动驾驶出租车在中东和欧洲的布局。你们如何应对这一进程中监管与地缘政治方面的挑战? 李彦宏:无论在中国还是海外,这始终是充满挑战的领域。目前自动驾驶技术已到达临界点:我们完全具备在高度拥堵的城区大规模部署自动驾驶出租车的能力,但很多城市目前还不允许自动驾驶车辆上路。目前。萝卜快跑已在约22个城市运营,我们正快速扩大规模:持续增投车辆、提升订单量。因此,只要当地监管允许,我们都乐于推进部署。我们有时独立运营,有时与Uber、Lyft等各类本土伙伴合作。我们非常灵活,我认为我们的技术已经为此做好了准备。此外,由于中国拥有非常有竞争力的供应链,我们能够以低于西方车辆的成本制造自动驾驶出租车。因此,我们在全球大多数城市都能实现独特且健康的经济效益。这也是为什么只要监管允许,我们就准备好部署的原因。 问:中国在传感器、电池以及其他电动车零部件的供应链方面非常强大,但芯片是美国似乎牢牢掌控的一个领域。百度刚刚发布了新款M100芯片,并正在开发新的芯片集群。我们现在是否可以说,中国已经不再依赖美国芯片了? 李彦宏:不,在GPU或AI加速器方面,我认为我们可能落后美国两到三代。但这并不会阻碍我们开发非常有价值的应用。芯片层位于技术金字塔的最底层,其上是各种框架、基础模型,然后才是应用层。我们在芯片上可能落后几年的时间,但在模型层面并不算太远。而在模型之上,我们有很多其他地方找不到的应用场景。美国的人甚至都不知道这些问题需要被解决。这正是价值创造的地方。因此,我并不太担心芯片限制,虽然我非常希望能够使用最先进的英伟达芯片。 问:美国政策制定者讨论用“曼哈顿计划”式(美国研发首个原子弹的代号)的力量来推动AGI。而在中国,政策框架更多关注将AI技术普及到社会各领域。你觉得美国以军备竞赛的方式讨论AI有帮助吗? 李彦宏:在这个问题上,我们的看法非常不同。美国主流观点确实把它当作“曼哈顿计划”,国家投入巨资去实现所谓的AGI,以便领先中国和其他国家。而我们更关注应用。中国在制造业方面非常强大,我们有大量工厂,需要高效率、低成本地生产各种产品,而AI正是用来解决这些问题的。这才是我们更关心的。我甚至不认为所谓的AGI存在,也就是有一个模型能“包打天下”,在每个方面都优于其他模型。我认为,我们必须考虑实际应用。即使你像爱因斯坦一样聪明,如果你甚至都不知道某些事情存在,也很难去解决问题。 问:所以你们是把AGI放在一边,只专注于应用吗? 李彦宏:我并没有花很多时间去思考AGI。我们当然在训练模型,但训练模型的目的,是为了解决具体的应用问题。我并不认为我们应该去打造一个“无所不能、适合所有人的超级智能AI”。 问:在开发AI应用,并克服监管等阻碍以实现大规模普及方面,你认为最大的挑战是什么? 李彦宏:创新几乎总是需要处理前所未有的问题,尤其是当试图将技术部署到现实世界时。以自动驾驶出租车为例:道路上存在出租车司机和各类由人驾驶的车辆。这是一项新事物。总体而言,中国政府是支持创新的,他们常说“我们支持你的创新努力”。但另一方面,他们也需要顾及各利益相关方的种种关切。如果没有任何法规允许自动驾驶汽车上路,那就意味着它不能上路。这与美国的情况略有不同。在美国,如果没有法规说你不能让自动驾驶汽车上路,那么你就是被允许的。在得州或佐治亚州等地方,对自动驾驶出租车运营根本没有监管。但在中国,在AGI和基础模型方面,很多情况下你必须获得监管机构的许可。 早在2023年初,美国很多意见领袖就声称“AI非常危险,我们需要监管。我们需要将基础模型的发展推迟六个月,以确保其安全,或符合我们的价值体系”。但在中国,其实并没有发生类似的事情。我们并不经常讨论这类监管问题,但实际上,已经存在一整套引导新技术发展的监管规则。 问:现在看起来,美国在AI领域推动更多安全措施和护栏的努力已经消失。美国正全速推进、试图赢得他们所说的“AI 竞赛”。你觉得这是不是有些鲁莽?你认为美国是否应该退一步,像中国那样制定一些恰当的监管措施? 李彦宏:我对此会非常谨慎地看待。一方面,我确实认为应该有一定的护栏;但另一方面,由于技术发展得如此之快、进步如此迅猛,在制定监管规则时必须非常小心,避免伤害创新的节奏。我们很难指望监管者对技术有比基础模型开发者更深入、甚至更好的理解。如果采取一种过于“事先预防式”的态度,可能并不是一件好事。你希望监管它,但应该退后半步,观察它的演变,然后再制定恰当的法规。你不应该走在技术路线图的前面,哪怕只是领先一步或半步,因为那样做,它会成为创新的减速带。 问:对于那些担心AI取代工作、取代人类的人,你想说什么?你理解他们的担忧吗? 李彦宏:是的,中国和美国都面临类似的问题。从长远来看,人们普遍认为新技术将为人类创造更多的工作机会。但短期内,我们确实面临挑战。由于AI带来的生产力提升,就业将面临下行压力,我们需要找到方法来应对这个问题。在美国,人们讨论全民基本收入;在中国,我们则更多谈论新的就业机会,比如数据标注这类工作。百度就帮助许多城市建立了数据标注中心,雇佣了成千上万的人。我认为未来,我们将能够创造出许多我们从未设想过的全新工作岗位。 问:你如何看待数据中心能耗巨大的问题?这个问题如何解决? 李彦宏:这个问题我们很早就面对过,大概在10到15年前,当我们开始建设大规模数据中心时,就开始关注所谓的PUE(电源使用效率)。我们投入了大量精力来确保数据中心的能效。在中国,我们的数据中心可能仍是能效最高的。随着AI的扩展,我们确实需要更多的算力和电力。因此,这方面的努力变得越来越重要,也多少有些不同。在GPU时代,有很多不同的节能方法。但也许最明显的一个是让你的模型更小,推理成本更低。如果你能做到这一点,自然就会减少电力需求。在这方面,中国遥遥领先。我们能够开发出推理成本是美国同行十分之一甚至百分之一的模型。我认为美国更侧重于开发最强大的AI模型,而中国,可能因为我们的购买力较弱、竞争更激烈,我们总是不得不降低推理成本,顺带也节约了能源。 问:像DeepSeek这样的公司只花了600万美元就做出了V3 模型,而Meta却在AI上砸下了数十亿美元,成效却备受质疑。你怎么看?你是否认为美国正陷入一种泡沫,只是在不断往研发里砸钱,却并没有真正关注产出和回报? 李彦宏:我认为这是两条不同的发展路径。在中国这边,我们努力让模型变得更高效。我们必须这么做,因为我们无法获得最先进的芯片。而在美国这边,你们拥有更先进的芯片,也更愿意在前沿技术上进行大规模投入。我觉得这同样是好事,这有助于人类去探索技术的极限、可能性的边界。我对这方面的努力非常感兴趣,也一直在密切关注。正如我之前说的,我们可能无法在模型训练投入上与谷歌、OpenAI相匹敌,但我们离应用更近。我们更清楚要解决什么问题,也希望在美国意识到这些问题存在之前,就已经把它们解决掉了。 问:你认为在未来大约10年里,AI将以哪些最不被理解、或者最出人意料的方式改变社会? 李彦宏:这存在着巨大的不确定性,因为技术演进得实在太快了。要去想象10年之后会发生什么非常困难,甚至回头看一年前,我都无法想象今天的AI会如此强大。所以我们能做的,就是持续观察技术所能达到的可能性,并努力找到利用这些创新的方式。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
独家为微软最新AI芯片供应HBM SK海力士股价再创历史新高
周二,韩国存储芯片巨头SK海力士的股价再次创下历史新高,此前有报道称,该公司是美国科技巨头微软最新人工智能(AI)芯片所用先进内存的独家供应商。 当地时间周一,微软发布了新一代AI加速器Maia 200。该公司将Maia 200称为“所有超大规模云服务商中性能最强的自研芯片”,并透露该款芯片已在其位于爱荷华州的数据中心投入使用,未来还将部署到更多区域。 不过,微软当时没有说明哪家公司将为Maia 200提供HBM芯片。 据媒体援引业内人士的消息报道,SK海力士将独家向微软Maia 200提供HBM3E芯片,每颗Maia 200加速器都将使用六颗SK海力士的HBM3E内存。 据悉,Maia 200搭载的HBM3E内存总容量为216GB,其配备了六个12层HBM3E内存模块,每个模块容量为36GB。 SK海力士公司发言人通过短信回应称,无法确认或披露任何与客户相关的信息。 受上述消息刺激,SK海力士股价周二大涨,再度创下历史新高,抹平了早间因美国总统特朗普最新关税威胁而出现的跌幅。截至收盘,该股涨幅高达8.7%,报80万韩元。 目前,SK海力士的市值约为4000亿美元,其股价在过去三年内上涨了10倍,这在一定程度上得益于其与英伟达签订的早期供货协议。 争先恐后 眼下,SK海力士与其韩国本土竞争对手三星电子在专用集成电路(ASIC)领域的竞争愈发激烈。ASIC是指为特定应用场景而专门定制的芯片,谷歌、微软和亚马逊等企业均在自研相关芯片,如谷歌TPU。 本周有消息称,三星的HBM4芯片已通过英伟达和AMD的认证测试,将于下月开始向这两家公司供货。 与此同时,SK海力士正为HBM4产品的全面量产做准备,相关样品已交付给英伟达。
2026短剧出海:淘汰赛加速,谁主沉浮?
作者 | 李小天 风口与泡沫总是相伴相生,短剧出海亦是如此。 刚刚过去的2025年,短剧出海依然火爆,巨头入局、黑马崛起、AI带来新机遇;但虚火也同样刺眼:80%-90% 的项目无法回本,多数平台陷入 “增收不增利”,海外市场体量仅为国内的 1/5-1/6,90% 收入集中于美国,新兴市场渗透率不足一成,内容供给依赖译制剧、文化适配难题突出。 如今,站在2026年伊始,短剧出海,又会面临怎样的竞争格局与市场契机呢? 2025年短剧出海八大焦点事件 01 短剧在海外,刚上了“小孩桌” “全球90%的内容市场在海外。”枫叶互动副总裁南亚鹏在接受访谈时的这一观点,精准点出海外市场的巨大潜力。 2025年,短剧出海赛道迎来爆发式增长:谷歌预测全产业链规模(含应用内购、广告、品牌定制等全收入来源)达36亿美元,同比激增126%;Sensor Tower等权威机构数据显示,2025年海外微短剧App双端内购收入达20.3亿美元,同比增幅亦高达115.3%。 赛道规模扩容的同时,玩家阵营也持续壮大。2025年,ReelShort、DramaBox、GoodShort等老牌玩家稳居收入榜首,持续领跑;字节跳动密集加码,推出全球多地区覆盖的PineDrama、日本本土化的PikoShow等产品;迪士尼更是押注DramaBox,跨界入局;此外,诸多IAA(广告变现)模式应用后来居上,持续冲击行业竞争格局。值得关注的是,这些快速崛起的应用均以IAA模式为核心,印证了免费模式在海外用户规模扩张中的关键驱动作用。 但若对标2025年国内短剧在市场体量、爆款数量、商业价值与行业地位上的“全面上桌”,短剧出海的“上桌”之路仍道阻且长。 首先,市场体量差距显著。据DataEye研究院数据,2025年国内短剧(含真人剧与AI漫剧)综合产值约1000亿元,其中真人短剧(含免费与付费)规模达800亿元,较同期国内电影总票房(518.32亿元)高出近两倍;而海外短剧市场营收仅徘徊在20-25亿美元之间,与国内市场存在6-7倍的差距,整体仍处于早期发展阶段。 其次,市场渗透率不均,新兴市场待教育。目前海外短剧90%以上的收入集中于美国市场,东南亚、拉美、中东等新兴市场的用户对短剧认知度偏低,仍需长期的市场培育。根据霞光智库 2025 年 9 月发布的《2025 中国短剧出海报告》,目前全球短剧的月活跃用户约为 8000 万,但与近 9 亿的潜在用户规模相比,当前的渗透率仍不到一成。整体而言,海外短剧生态尚未成熟,广阔市场空间的开拓仍处于起步阶段。 其三,市场供给存在显著缺口。国内短剧供给端产能充沛,全年上线超20万部,播放破10亿作品超130部,30亿+头部精品佳作也有多部。反观海外市场,供给能力远难匹配需求:据DataEye 2025年海外微短剧行业报告,当前头部海外短剧App年上新量虽已提升至300部左右,但市场实际需求达数千部,供需缺口悬殊;海外本土短剧月产量仍不足200部,供给严重依赖进口,其中国产翻译剧占比高达80%-90%。 其四,产业链与商业成熟度不足。国内已形成短剧+电商、短剧+文旅、短剧+品牌定制等成熟商业模式,产业生态日趋完善;而海外市场虽已出现IAA(广告变现)、IAP(内购)、订阅并行的混合变现格局——以IAA获取免费用户,通过IAP/订阅收割高价值用户,借助订阅服务提升用户留存与ARPU值,但多元盈利模式仍处于探索期,尚未形成稳定闭环。 鬼手剪辑CEO张天佳向霞光社补充的三组数据对比,更直观凸显了海外短剧的发展差距:国内短剧市场规模已比肩爱奇艺、优酷、B站三大平台收入之和,而海外短剧总规模不及Netflix、迪士尼等海外流媒体巨头的二十分之一,甚至低于中国DTC品牌安克创新的海外营收,仅为日本动漫全球市场规模的十分之一;用户渗透层面,即便在核心的美国市场,短剧受众也未覆盖白人中产、华尔街精英等主流群体,仍局限于特定圈层。 不过,2025年海外短剧赛道也浮现诸多积极信号:迪士尼通过加速器投资DramaBox,OpenAI获迪士尼IP授权,短剧在YouTube平台的收益已超越中长剧,TikTok亦在积极引入剧方合作。这些动态均表明,海外巨头已开始关注并布局这一新兴赛道。进入2026年,短剧出海领域正酝酿着更多变革与突破。 02 淘汰赛加速:巨头入局、尾部出清,普遍增收不增利 2025年,短剧出海赛道的竞争已日趋白热化,行业格局正被加速改写。 一方面,手握IP资源的中国网文大厂与互联网巨头持续进场,冲击原有竞争格局:尽管ReelShort、DramaBox等老牌玩家仍稳守领先优势,但昆仑万维旗下Dramawave、麦芽传媒旗下NetShort、掌玩网络旗下FlickReels,以及字节系MiniShorts、Melolo等后起之秀已强势突围,在逆势增长中悄然重塑行业态势。 另一方面,海外本土势力与国际巨头纷纷入局,全球短剧市场彻底告别中国公司独大的局面,迈入群雄逐鹿的“战国时代”。数据直观印证了这一变化:2025年Q3 TOP30短剧应用中,中文应用下载量占比从95%骤降至67%,印度KukuTV、乌克兰Holywater、德国Galatea TV等本土平台快速攻城掠地。 尤其值得关注的是,2025年好莱坞势力的强势入局,更让竞争增添了关键变量:8月,由前迪士尼、派拉蒙高管贾娜·维诺格雷德掌舵的高端短剧工作室MicroCo正式登场,精准聚焦好莱坞流失粉丝的核心需求;10月,前米拉麦克斯CEO比尔·布洛克推出高品质罪案短剧平台GammaTime,凭借差异化定位斩获1400万美元种子轮投资;福斯娱乐亦同期收购乌克兰Holywater,计划为旗下My Drama平台制作200部竖屏短剧,全面覆盖欧美市场。此外,韩国推出Vigloo平台深耕全球市场,美、日、德等多国也纷纷打造本土短剧平台,全球玩家与中国短剧平台的全面竞逐已然展开。 激烈竞争下,行业分化趋势愈发明显。 其一,私域APP加速进入淘汰赛。 下载量与收入持续向头部应用集中,尾部应用加速出清;与此同时,2025年短剧融资事件较2024年骤减70%,涌入赛道的热钱逐步退潮。赛道门槛抬升背景下,2025年新出现的平台中,43%选择低门槛的IAA模式,印证了尾部应用撬动市场的被动处境。 其二,即便存活的平台,多数仍处于“花钱赚吆喝”的阶段。 多位制作人、平台负责人透露,80%-90%的出海短剧项目无法回本,部分平台需将每日近八成收入投入投流。2025年上半年A股相关公司半年报数据,也印证了短剧出海业务“增收不增利”的普遍态势:中文在线营收同比增长20%,但归母净亏损扩大至2.26亿元,旗下FlareFlow等平台的投流与内容成本高企,对利润影响幅度达20%;持股枫叶互动的公司,同期营收下降5%至27.6亿元,净亏损4651万元;拥有出海平台iDrama的掌阅科技,营收增长14.58%,但亏损额同比扩大226%;昆仑万维旗下Dramawave虽单月流水超2000万美元、短剧收入5.8亿元且毛利率达83%,但未披露核心投放费用,盈利真实性存疑。 显然,短剧出海仍处于“买量换市场”的开拓期,扩张阶段的短剧业务已对部分母公司业绩形成拖累。 LuckyShort CEO邓先耀直言,当前短剧行业赚钱的公司越来越少,头部玩家凭借先发优势和资本红利维持运转,中小平台则大多陷入亏损。核心症结在于:北美流量红利趋缓,IAP用户池被反复清洗,用户付费阈值持续提升;全球市场虽仍有增量空间,但新兴市场开拓需更强的本地化能力,而AI翻译、配音在小语种适配等方面仍存在明显短板。 不过,赛道中也浮现出部分新机会点:例如深耕YouTube渠道的短剧运营厂商,年利润已达千万美元级别;东南亚、拉美等新兴市场的付费潜力被逐步挖掘,成为中小玩家的突围方向。邓先耀预判,未来行业将形成“头部厂商攻坚高净值市场、中小玩家深耕中长尾区域”的格局,而本土化内容供给不足,仍是全行业亟待突破的核心痛点。 03 本土玩家逆袭短剧出海进入文化适配决胜期 2025 年,行业各方已形成共识:在海外打造短剧爆款,正变得越来越难。 一方面,海外短剧赛道深陷同质化困局。中小平台受限于资金储备与试错成本,普遍采取 “换汤不换药” 的翻拍模式 —— 以翻译剧的市场数据为导向,仅简单更换演员、职业与故事场景,核心的故事内核与冲突设置几乎照搬已验证的模板。这种创作模式直接导致内容套路化严重,观众审美疲劳加剧,模板的市场价值持续稀释,原创内容的稀缺性与含金量愈发凸显。说到底,这仍是一个尚未形成创新激励的行业,除非创新能被实实在在的收入增长所验证。 与此同时,深谙本土文化的玩家正在强势崛起,被福斯娱乐收购的乌克兰平台 MyDrama 便是典型代表。作为扎根东欧市场的本土平台,MyDrama 精准把握欧美及东欧受众的价值观、审美偏好与叙事节奏,其原创作品如《Too Young to Want her Professor》《Spark Me Tenderly》等,无需经历 “翻译 + 改编” 的本土化适配流程,就能自然契合当地用户的观剧需求,有效规避了中国平台出海时普遍遭遇的 “文化折扣” 难题。而 MyDrama 在原创与互动内容上的成功,已推动部分中国头部平台将重心向原创内容倾斜。 针对出海短剧难出爆款精品的行业困境,为出海平台提供一站式视频译制与剪辑工具的鬼手剪辑 CEO 张天佳指出,短剧精品化在海外落地,正面临两大核心挑战:一是成本高企,国内单部短剧 50 万 - 300 万元的制作预算,在海外市场需叠加汇率、本地化调研、本土团队搭建等多重成本,实际投入需乘以 7 倍,企业的投入意愿因此大幅受限;二是周期拉长,国内一个月即可完成的项目,在海外要兼顾供应链协调、本地化内容适配、本土演员档期磨合等环节,项目周期可能延长至原来的 7 倍,制作效率难以保障。此外,中外文化差异进一步抬高了精品化门槛,国内市场屡试不爽的剧情模式,在海外多元文化环境中难以复制成功。 “或许短剧平台可以借鉴 SHEIN 这类跨境电商品牌的成功经验,搭建数据洞察平台,实时捕捉目标市场的流行趋势与文化偏好,再结合快速打板、小单测试、批量生产的柔性创作模式,提升精品内容的成功率。” 张天佳补充道。 海外短剧在当地市场的影响力,远低于其他内容品类的爆款 04 AI 漫剧元年:国内如火如荼,海外难言乐观 业界普遍认为,AI 将成为重构短剧内容供给模式的核心变量。 2025 年堪称AI 漫剧爆发元年,行业规模被主流机构预估为 200-248 亿元,同比激增超 270%,核心驱动力正是 AI 技术带来的成本与效率革命。进入 2026 年,AI 漫剧市场规模有望突破 350-500 亿元,增速持续领跑真人短剧与出海短剧两大赛道。 对此,张天佳分析道,受制于成本压力,中国短剧制作团队赴海外实地拍摄、深度融入本土文化的难度颇高;而在翻译剧为出海主流的当下,几十亿美元的海外营收规模或已触及增长天花板。如今,AI 技术正重塑短剧全链路生产流程,打破线下协作的地域壁垒,不少企业已跳出单纯输出国内内容的模式,试水创作伊斯兰、泰国等本土化风格的漫剧及真人短剧。凭借对核心创作环节的掌控力与本土文化元素的精准适配,行业有望实现破圈发展与爆发式增长。 中文在线出品的 AI 漫剧《愤怒的吸血鬼》便是成功范本 —— 该剧在 TikTok 上线 3 天播放量即达 2.3 亿,登陆 Sereal + 平台后付费率高达 22%,超 HBO 同期水平 7 个百分点;与此同时,剧集单集制作成本从 20 万元降至 10 万元,降幅达 50%。这一成绩,直接验证了 “西幻题材 + AI 降本 + 文化适配” 的出海变现路径 的可行性。 更低的成本、更高的效率,正是 AI 漫剧能够快速崛起的关键。头部 AI 漫剧 / 短剧创作工具巨日禄创始人杰夫向霞光社透露,当前质量达标的 3D 效果内容,制作成本(含人工)已压缩至 1300 元 / 分钟;若对质量与题材不做严苛要求,成本甚至可低至 400 元 / 分钟。而在一年前,同类内容的制作成本还维持在 2000-5000 元 / 分钟的区间。 在杰夫看来,AI 漫剧的成本或已触达阶段性阈值,但行业竞争焦点将转向质量维度的深度角逐。“未来,3D 与真人短剧的每分钟制作成本,也有望快速下探至 400 元区间。当然,另一种可能性是资本入局后,通过工具补贴的方式进一步搅动市场格局。” 不过需要正视的是,当前 AI 漫剧与 AI 短剧的出海态势难言乐观。 实证数据显示,AI 漫剧的海外市场仍处于探索阶段,其在 YouTube、各类垂直短剧 App 等渠道的收益水平,远低于真人短剧。尽管 AI 技术简化了内容生产的工作流,且海外市场的成熟速度可能快于国内,但对于从零起步的入局者而言,其 ROI 表现与成本优势尚未完全凸显。 基于此,张天佳建议,短剧平台现阶段应优先深耕国内市场;若有意布局海外,可依托既有的海外客户资源,或借助 TikTok、YouTube 等自有流量矩阵降低拓展风险。 整体来看,AI 漫剧赛道的爆发目前仍局限于国内市场,其出海的实际成效,尚需半年至一年的周期来观察与验证。 05 运营与分发:公域成主场,流量玩法迭代 从分发模式上来看,诸多业界人士告诉霞光社,2025年,公域社媒成为增长新引擎。“原先做 APP 的客户较多,从2024年年底到2025年,很多客户转向 YouTube 和 TikTok,不少客户在 YouTube 上收益很好。” 巨头的下场更让社媒内容场平添变量——TikTok 正将国内短剧的 “内容生产 — 分发渠道 — 变现模式 — 生态服务” 全链路体系复刻到美国,核心通过 TikTok 端内专区 + 独立 App(PineDrama)双阵地,叠加流量扶持、多元变现与本土化适配,系统性重塑美国短剧市场格局。 从运营视角来看,行业竞争正从粗放的流量争夺,转向更精细化的内容运营。单一爆款难以支撑长期增长,未来的竞争优势将属于那些能够敏锐捕捉细分需求、打破内容定式、实现多形态内容联动的团队。例如,“小说-短剧-漫剧”等跨体裁开发模式,不仅可覆盖更广泛的用户场景,也在持续验证IP的长线价值,为构建IP生态奠定基础。与此同时,进一步挖掘内容的商业价值已成为行业共识,单部作品价值上限越高的企业,越能在未来市场中掌握主动权。 06 中东扛起增长大旗本土化破局成制胜关键 在全球短剧市场版图中,中东正跃升为增长势头最为突出的板块。 据 Snapchat《短剧营销实战手册》研究显示,美国与 MENA(中东和北非)地区是 Snapchat 平台上短剧用户活跃度与付费意愿双高的核心区域 —— 美国稳居短剧出海的基本盘,而 MENA 则是当之无愧的增长引擎。2025 年前 11 个月,MENA 地区短剧市场下载量突破 7018 万次,创收 7679 万美元,较去年同期分别实现 988%、586% 的爆发式增长,跻身全球增长最迅猛的市场行列。 分市场来看,土耳其表现尤为亮眼,收入同比激增 1018%,从 160.8 万美元飙升至 1799.3 万美元;沙特紧随其后,增速接近 884%。全球收入增长最快的十大市场中,中东独占四席,直观印证了该区域用户付费能力的快速释放。 主攻沙特等中东市场的 HRH TV 合伙人刘建华在接受霞光社采访时表示,以短剧为代表的新媒体内容出海,精准契合了移动互联网基建日趋完善、但本土娱乐内容供给相对匮乏的新兴市场需求。 这一需求的爆发,与中东国家的政策变革密切相关。2016 年 4 月,沙特颁布《沙特 2030 年愿景》,以 “活力社会”“繁荣经济”“雄心国家” 为三大主线,开启了一场堪称 “沙特版改革开放” 的深刻变革。2018 年 4 月 18 日,沙特第一家商业影院正式落地,漫威超级英雄电影《黑豹》成为首部公映影片,标志着当地娱乐消费市场的破冰。尽管沙特等中东国家的娱乐资源仍显贫瘠,但用户付费潜力不容小觑。行业权威数据测算显示,沙特 3650 万总人口中,手游玩家规模达 2650 万,超 68% 的用户具备付费意愿,其手游 ARPU(单个用户平均收入)更是以 290-300 美元的水平高居全球首位,为短剧付费市场奠定了坚实基础。 Snapchat《短剧营销实战手册》进一步指出,短剧市场的受众偏好存在显著地域差异:美国市场的核心受众为女性,占比高达 66%,浪漫题材是主流选择;而沙特市场的男性观众占比达 52%,更青睐家庭恩怨、道德冲突等厚重叙事,对复仇、逆袭等强冲突剧情有着天然的高接受度。 值得注意的是,中东短剧市场的潜力仍处于挖掘初期,行业正翘首以盼现象级爆款的出现,从而激活该区域的真实市场潜能。目前,阿拉伯文化的认知壁垒,成为打造爆款的最大阻力。数据显示,在沙特投放的短剧中,六成以上为译制作品,文化隔膜严重削弱了内容吸引力。 刘建华坦言,中东地区因文化鸿沟与宗教壁垒,短剧题材开发受限颇多,对内容本土化程度要求极高;同时,当地影视工业基础薄弱,寻找合适的本土演员与合作伙伴也面临不小挑战。 毫无疑问,精准的本土化布局,是短剧平台叩开海外市场大门的核心制胜要素。例如,某深耕中东市场多年的直播社交应用,凭借深厚的运营积淀,旗下短剧平台通过深度本土化内容创作与社交裂变式推广,成功撬动了当地用户的付费意愿,为行业提供了可借鉴的破局思路。 美国传播学著作《流媒体时代》一书中谈到:整个20世纪,娱乐行业的传统巨头能够牢牢控制整个行业,是因为他们掌握了两种稀缺资源:一个是上游制作环节需要的金融和技术资源,另一个是下游的发行和宣传渠道;而当下,在新技术的作用下,娱乐行业上下游环节中原本稀缺的资源不再稀缺了,如今真正稀缺的是,对消费者需求的理解,以及获得并管理消费者注意力的能力。这正是奈飞、亚马逊、苹果等互联网巨头拥有的,也是短剧这种内容形式所擅长的。 如今,中国短剧以技术迭代、载体焕新、话题创新,精准捕捉全球观众的情感共鸣,打造出独树一帜的叙事节奏与呈现方式。短剧出海的故事还能走多远?霞光社将持续关注中国短剧在海外的最新动态。
爱优腾芒长剧阵地战
文丨许俊浩 国内长视频平台的开年爆款之战已经打响。 被多平台寄予厚望的《太平年》即是一例。这部剧集于2026年1月23日上线,讲述的是五代末期吴越国“纳土归宋”的历史故事,在央视、爱奇艺、腾讯视频及芒果TV多平台播出。在豆瓣,该剧尽管还未开分,却已收获超过8000条剧评,目前是豆瓣电视剧实时热门榜单第一。 除了联播的《太平年》,各平台亦在独播剧上用力,特别是具备历史厚度或现实深度的正剧。比如定档2026年2月的《冬去春来》,爱奇艺出品,由《甄嬛传》导演郑晓龙执导,讲述的是北漂青年艺术追梦的群像故事。腾讯视频的《小城大事》则已于1月10日上线,剧集主创为《庆余年》导演孙皓与《大江大河》编剧袁克平。而且,《冬去春来》与《小城大事》也都在央视播出。 优酷、芒果TV则各展所长。优酷专注悬疑方向,于2025年12月29日推出刑侦悬疑剧《剥茧》,2026年1月23日又推出都市女性悬疑剧《暗恋者的救赎》。芒果TV发挥台网联动优势,着眼女性题材,2026年1月25日上线律政情感剧《女神蒙上眼》,剧集在湖南卫视与芒果TV双平台独播。 长剧的开年之争由来已久。 长视频平台试图打造爆款内容,以获取寒假及春节的流量红利,也力求为全年的内容质量与平台排名定调。据海克财经观察,往年不少现象级热门剧集都集中于这一档期,最为典型的是曾引发全民热议的《狂飙》,于2023年1月上线;还有2024年开年热剧《繁花》,于2023年12月底上线;2022年的年度高分剧集、豆瓣评分8.4分的《人世间》,于2022年1月上线。 如今长剧头部剧集的制作规格不断攀升,但如《狂飙》《繁花》等的现象级爆款却愈发可遇不可求。自2025年至2026年开年,在短视频,特别是短剧持续重塑用户娱乐习惯的当下,长剧集要获得口碑与流量双重认可的难度显著加大。这标志着,以长剧集为根基的长视频平台,竞争已进入一个更为复杂、更为漫长的相持阶段。 01 质量双收缩 国内长剧集热度整体有所下滑。 据影视数据平台云合数据发布的《2025年长剧集网播年度观察》,2025年头部长剧流量规模呈现收缩态势,长剧播放量的TOP20剧集,播放量总计296亿,同比减少20%;这20部作品中,排名前三的《藏海传》《大奉打更人》《许我耀眼》播放量均在21亿-23亿之间,排名第四至第六的《生万物》《国色芳华》等播放量在16亿-18亿间,其余14部作品播放量则在10亿-15亿;对比来看,在2024年长剧播放量的TOP20中,12部剧集播放量超过15亿,其中超过20亿的有6部之多,排名第一的《庆余年》第二季播放量为45亿,第二位的《与凤行》播放量31亿。 集均播放量这一核心数据的变化更为明显。 云合数据显示,2025年累计播放量最高的作品《藏海传》,集均30天内的有效播放量,也就是剧集上线后的30天内的追剧播放量,仅排名第六,为4351万。 需要说明的是,一般情况下,集均30天内播放量的排名应与全剧累计播放量排名一致,比如2024年《庆余年》第二季的集均和累计播放量排名均为第一。而《藏海传》的这两个数据排名相差较大,说明该剧累计播放数据并非来自实时追剧的用户,而更有可能来自剧集上线超过30天后粉丝的反复观看。 同据云合数据,2025年集均30天的有效播放量超过5000万的仅有《许我耀眼》和《漂白》两部,数据分别为6083万和5490万;2024年超过5000万的则有5部,榜首《庆余年》第二季集均播放量达1.1亿。 口碑问题同样明显。 以豆瓣评分8分及以上为高分,2025年高分长剧有9部,与2024年持平,但2025年的高分剧集分数整体分布更靠后——2024年高于8.5分的作品有4部,最高为评分9.6分的《山花烂漫时》;2025年则仅有两部作品高于8.5分,最高分为8.9分的《反人类暴行》。如果将时间拉长,高分剧集的数量下滑趋势则更为明显——2023年、2022年和2021年,豆瓣8分及以上剧集的数量分别为20部、17部、14部。 更重要的是,2025年的流量与口碑更为割裂。《山花烂漫时》评分人数超过24万,豆瓣评分9.4的2024年头部剧集《漫长的季节》评分人数为115万,但《反人类暴行》的评分人数目前仅6.5万。 事实上,提质减量已经成为长剧领域的行业共识,长视频平台不再追求规模扩张的大开大合,而转向聚焦投资回报精耕细作。 调研机构QuestMobile数据显示,腾讯视频、爱奇艺、优酷的播放量主要来自长剧集,长剧播放量占比超过83%;芒果TV则并重综艺和长剧,综艺播放量占比44.9%,长剧播放量占比33.9%;腾讯视频2025年上新110部,同比增加11.7%,其余各家2025年上新数量则基本与2024年持平。 如今的长视频平台在精品内容的创作与品控上日渐趋稳,头部平台在不同维度上各有所长,任何一方都并未在口碑和热度方面取得压倒性胜利,比拼的是精品内容持续产出能力。从高分剧集来看,2025年的9部高分剧集,爱奇艺、腾讯视频、优酷恰好各占3部;而影视数据平台灯塔数据显示,全网剧集正片播放量TOP10中,爱奇艺占5席,优酷3席,腾讯视频2席。 02 流量需爆款 在流量大盘整体收缩的背景下,长视频平台的挑战更为严峻。对以会员订阅制为核心商业模式的长视频平台而言,平台营收与用户规模、付费意愿直接绑定,当用户注意力被持续分流,商业模式的局限性与脆弱性便被进一步放大。 行业整体数据下滑,驱使平台的投资策略变得极度谨慎与挑剔。于是,平台将资源集中于少数相对安全的头部项目,大量中小型制作方或内容团队因无法获得输血而难以维系。这导致市场中活跃的创作主体减少,内容供给自然萎缩。 开机项目的夭折就颇为典型,此前《江山为聘》《风月不相关》《起落安妥》等多部剧集相继陷入停拍风波。《江山为聘》拍摄时频频登上热搜,从开机延期、番位争议,到最终因资金链断裂、拖欠薪资而实质性停摆,整个过程被网友戏称为“每10天传出一个坏消息”,相关词条还多次登上热搜。 行业收缩与平台的流量焦虑互为表里。 调研机构QuestMobile数据显示,2025年9月,在线视频APP行业MAU(月活跃用户数)TOP10的应用,前三分别为腾讯视频(3.5亿)、爱奇艺(3.2亿)、芒果TV(2.6亿),排名第四的则是短剧平台红果(2.4亿),然后是B站(2.3亿)与优酷(1.7亿);而在半年前,即2025年3月,腾讯视频(3.7亿)、爱奇艺(3.7亿)、芒果TV(2.8亿)、B站(2.2亿)和优酷(1.9亿)排在前五,红果(1.7亿)仅位列第六。 微短剧爆发的不止流量,还有质量与口碑。与9部高分长剧剧集并列的,还有一部名为《冒姓琅琊》的微短剧同样在豆瓣获得了8分的高分。 在长视频行业整体承压的背景下,头部内容的战略价值被进一步放大,在维系用户活跃度、提升用户粘性上有不可替代的关键作用。 平台高级别剧集上线时,往往能拉动数据形成峰值。QuestMobile数据显示,纵观2025年全年各长视频平台的DAU(日活跃用户)变化,高点往往出现在独播热剧上线时,比如优酷的峰值来自2025年5月上线的《藏海传》,腾讯视频的峰值来自2025年10月上线的《许我耀眼》,爱奇艺的峰值来自2025年1月时《漂白》的热播,芒果TV的峰值来自2025年1月开播的《国色芳华》。 但内容驱动的增长模型能制造陡峭的用户数据峰值曲线,也会让用户注意力随剧集质量的波动而波动。当两部重磅剧集的上线空窗期过长,用户就极易流失至其他平台。而长视频平台的竞争已进入常态化多平台订阅的阶段,用户的注意力被分散,很难长期锁定于单一平台。一部爆款带来的短期光环,难以直接转换为对平台的长期独占忠诚,因此任何平台的不可替代性都在系统性减弱。 即便是有更多剧集登上播放量榜单的爱奇艺,也在承压。据财报,2024年,爱奇艺营收292.2亿元,同比下滑8.3%;2025年前三季度,爱奇艺营收205亿元,同比下滑近9%;2025年第三季度,爱奇艺营收66.8亿元,同比下滑8%,亏损2.5亿元,而2024年同期净利润2.3亿元;作为核心业务的会员服务业务,2025年第三季度收入42.1亿元,同比下滑4%,原因为与2024年同期相比内容供给相对偏少。 即便成功打造出爆款系列,长视频平台也难以规避IP价值随时间递减的定律。以爱奇艺的《唐朝诡事录》系列为例,据海克财经观察,该剧的第一部以豆瓣8.6分的高口碑建立起稳固的观众基本盘,但其热度与影响力的边际递减效应已清晰可见。从第一部到第三部,其豆瓣评分人数分别为41万、32万和16万,再到2025年12月上线的衍生剧《唐诡奇谈》,豆瓣评分人数仅4万。 03 多元化求解 长视频平台正通过更多方式探索突破路径,比如将出海作为新增长曲线。 国内播放量居于头部的《藏海传》,通过优酷国际版与海外平台Disney+,登陆全球超过190个国家和地区,在中国台湾地区的Disney+连续七日霸榜榜首,在中国香港地区登顶,在韩国也登顶了最大IPTV平台Genie TV的海外剧榜单。优酷的现代都市剧《难哄》还进入到奈飞全剧日榜的TOP6。 财报显示,爱奇艺国际版2025年全球内容播放量同比增长了114.5%,海外业务总收入在第三季度实现了同比、环比均双位数增长,财报还将海外业务明确称为“第二增长曲线”。爱奇艺的古装仙侠剧《临江仙》上线后登顶了15个国家和地区的热播榜,古装探案剧《朝雪录》则在泰国、马来西亚等5个地区登上谷歌趋势热度第一。 腾讯视频则依托强大的IP储备和全球渠道网络持续扩大影响力。腾讯视频的《庆余年》第二季登陆Disney+后,成为该平台有史以来播出热度最高的中国大陆剧集,在多个海外市场进入收视榜单前列。腾讯视频2025年初的热门剧集《大奉打更人》在海外同步上线后,成功登顶流媒体平台Rakuten Viki的美区华语剧集榜、新加坡平台Viu的中国大陆剧热度榜等多个地区榜单。 探索不止于横向地理跨越,还在纵向力求体验深化,挖掘IP深层消费价值。 爱奇艺正尝试让IP版图从线上屏幕延伸至线下实体空间。2026年1月16日,爱奇艺首个线下乐园项目预售开票,并定于2月8日正式开园。这个位于江苏扬州的乐园,以国创IP加前沿科技为核心定位,设计了包含全感剧场、光影互动空间在内的体验版块,呈现了《唐朝诡事录》《狂飙》《苍兰诀》《莲花楼》等头部剧集的现实场景,试图将用户在观看内容时产生的情感连接,转化为可触摸、可参与的实体体验。 腾讯视频、优酷等平台已将自身储备的颇多IP与其他行业品牌进行跨界联名,比如剧集与喜茶、乐乐茶等茶饮品牌的联名。芒果TV则开设了电商平台“小芒”,还将《乘风破浪的姐姐》《披荆斩棘的哥哥》等系列综艺IP的周边进行集中陈列与主题策展,希冀打造线上线下潮流消费点。 国家政策也在为行业注入发展动能。2025年8月发布的“广电21条”即是如此。“广电21条”指的是国家广电总局发布的《进一步丰富电视大屏内容,促进广电视听内容供给的若干措施》(下称“措施”),后者以系统性提效与创造性松绑为导向,倾力于为剧集的高质量发展提供更多政策层面支持。 海克财经研读发现,措施取消了电视剧40集的上限,为需要宏大篇幅的作品提供了空间,同时以“全剧本审核”防止注水;废止了季播剧播出间隔一年的要求,利于系列化IP开发与用户维系;将古装剧管理从“比例限制”优化为“灵活调控”,同时鼓励对全球优秀IP进行高质量本土化改编;措施还提出,要积极探索“边审边播、边改边播”等创新机制,这实质上是对互联网内容生产节奏的适配,旨在降低制作方的制度性时间成本与资金压力。 多元开发的根基始终在内容质量。出海,乐园或其他实体体验,无疑都需建立在能够真正缔造IP、为用户提供强烈沉浸感与情感认同的优质内容之上。长剧的核心竞争力,正来源于其篇幅所能承载的更深层的叙事逻辑、更厚重社会情绪的积聚,以及更长周期情感陪伴的建立,这些是短视频、短剧等其他形式难以替代的独特价值。 会员付费意愿及其他营收起落无不以内容力为起始。在长剧方向,只有故事本身具备足够力量,一切横纵延展才能拥有持续旺盛生命力。竞争之于长视频平台而言,早已是避无可避的行业常态,且场外杂音越发多了起来,爱优腾芒唯有在开源节流之外,对内容力上更加苛求,才能真正免于商业模式崩解的命运,同时才能走得更稳更远
“空降”印奇和50亿,阶跃星辰上桌了吗?
融资+人事调整,在智谱和MiniMax抢先上市、余下“小龙”争先出来放话的1月,阶跃星辰整了个大活。 昨天,阶跃星辰对外确认完成超50亿元B+轮融资,和现金大礼包一同“空降”的,还有新任董事长印奇。 公开信息显示,这一轮融资出资方包含多地国资与产业投资人,多位老股东亦选择继续跟投;官方称资金用途为“基础模型研发”与“AI+终端”落地。 对于印奇的加入,阶跃星辰方面称并非“空降”,而是公司早有的战略部署。 从目前披露的分工情况来看,印奇更侧重顶层战略、资本运作与终端商业化等领域,CEO姜大昕继续主持技术研发与日常经营。 印奇,中国最早一批AI创业者,曾带领旷视科技在AI1.0时代探索了多个场景。不过,旷视在A股科创板注册程序于2024年年底终止。面对AI六小龙已有两家完成IPO的局面,阶跃星辰的操作透露出一丝“重回牌桌”的意味。 事实上,刚刚过去的2025年是AI六小龙“抗压”的一年,阶跃星辰C端产品“冒泡鸭”已经停运,而在行业视角,六小龙放缓甚至放弃基模的质疑贯穿了整个2025年。在业务层面,阶跃星辰转向“基座+多模态”与生态合作,业务重心逐步向端侧Agent靠拢。 三周前,六小龙中的智谱、MiniMax先后在港股完成上市,市值均来到千亿港元级别。一时间,“小龙”跃龙门的故事吸引了行业内的所有目光,其余“小龙”纷纷在同一时期发声。 本月初,杨植麟发布内部信,宣布新一轮融资到位,并现身清华和智谱主导的AI论坛。百川智能和零一万物也在本月先后召开媒体沟通会,披露公司最新路线选择与产品规划。 印奇的加入和50亿融资的到账,相比起释放声量,阶跃星辰显然想在商业化不断扩大版图,在竞争激烈的2026年掏出更多筹码,挤进大模型“高玩”牌桌。 01 先来看印奇加入带来的影响。 据多家媒体披露,印奇此次加入并非“空降”。早在2023年阶跃成立之初,印奇便深度参与公司战略规划,阶跃核心算法团队亦主要来自旷视体系。 今年38岁的印奇,2006年考入清华大学自动化专业就读,后入选著名的清华“姚班”。“姚班”后来也成为中国顶尖AI人才的摇篮,包括如今名噪一时的姚顺雨等业内大拿。 在本科阶段,印奇就在微软亚洲研究院实习并工作多年,参与研发人脸识别引擎——这也是后来旷世科技的技术路线之一。 而在同一时间,姜大昕也在微软亚洲研究院任首席研究员。只不过,印奇选择在本科毕业后,赴美国哥伦比亚大学攻读3D相机方向博士学位。而姜大昕在微软一直工作了十几年,一路做到微软全球副总裁、亚研院的首席科学家。 尽管无法证实两人当时就认识,但观察阶跃星辰这家公司不难发现,“微软系”的基因确实体现在多位管理层身上,两位联合创始人——系统负责人朱亦博、数据负责人焦斌星都曾在微软任职。 换言之,“风格匹配”是印奇加入阶跃星辰的一个重要前提。 至于印奇的职责和公司未来的战略规划,阶跃星辰方面称,“基础大模型”与“AI+终端”是公司长期坚定的战略选择。“印奇出任董事长,将为阶跃星辰进入下一阶段提供更强的牵引力与确定性。” 显然,这种“牵引力”和印奇的行业地位有着莫大的联系。 2011年,印奇与几位联合创始人一同创立旷视科技,是国内较早将深度学习与计算机视觉(AI)用于商业化的公司之一。公司最早靠Face++人脸识别云平台切入市场,并将AI视觉技术应用于安防、金融身份认证、智能物联网(IoT)与城市/供应链解决方案等领域。 根据观察者网的报道,加入阶跃星辰后,在分工上,印奇将主要负责公司顶层战略、资本运作及终端商业化落地;CEO姜大昕继续全权主持技术研发与日常经营。 这种“技术负责人+商业化/战略负责人”的组织形态,在AI六小龙中不乏类似的案例,例如智谱的唐杰和张鹏;月之暗面的杨植麟和张予彤。 这一模式往往出现在创始人技术优先路线的公司中。随着模型训练、算力投入与融资复杂度上升,企业需要引入熟悉产业、资本与组织协同的角色,分担对外沟通、商业化推进与资本运作压力。 事实上,印奇的本次加入阶跃星辰,还有另外一个值得关注的身份——千里科技董事长。 2024年7月,印奇斥资超24亿元,通过江河汇受让吉利集团旗下公司所持有的千里科技19.91%的股份,成为该公司第二大股东,并在同年11月当选为千里科技董事长。 千里科技前身为力帆体系,2010年在上交所上市,并于2025年2月正式更名为“千里科技”,聚焦“AI+车”智能出行与自动驾驶解决方案。 换言之,在印奇加入之前,阶跃、千里、吉利,三家企业就已经在业务链条上建立了某种紧密的联系。 印奇入主后,千里科技与前股东吉利汽车集团持续建立深度技术/生态合作,共同推动智能驾驶与智舱产品落地。2025年WAIC上,千里科技、阶跃星辰与吉利联合发布面向AI Agent原生的智能座舱AgentOS(预览版),基于多模态与端到端语音大模型。 显然,作为大模型技术方,阶跃星辰在AI技术层面与吉利、千里形成协同,随着印奇同时担任千里科技与阶跃星辰董事长,进一步强化了三方在“AI+车”战略上的联动与资源整合。 在印奇的小红书主页上,他的签名已经换成“千里科技&阶跃星辰”。不难看出,相比“空降”,印奇的加入更像是两家公司业务上的“联姻”。 在最新一篇笔记中,印奇这样写道:“至此,千里和阶跃所构成的“AI+终端”的商业拼图完成初步搭建。” 02 2023年成立后,阶跃星辰与智谱、MiniMax、月之暗面等一同被归入“六小龙”,一度被视为通用大模型创业阵营中的主力选手之一。 2024年3月,阶跃星辰发布Step-2万亿参数MoE语言大模型。同一时期,阶跃星辰的Step-1V千亿参数多模态大模型,还在国内评测平台OpenCompass(司南)多模态榜单上的表现出色,“通用+多模态”双线并行,阶跃星辰一度被认为是通用AGI的有力竞争者。 但进入2025年,AI圈的风向突然发生了变化。 DeepSeek的异军突起,让AI行业走到了一条分水岭:一方面,它抬升了市场对大模型应用的认知;另一方面,DeepSeek的快速铺开和低成本优势,也让其他AI创业公司在做大模型规模和商业化承压之间的矛盾被集中放大。 在这种外部压力下,以“六小龙”为首的AI创业公司是否坚持“大参数路线”被业内外反复追问:究竟是继续冲击更大规模,还是把业务重心转向“可部署、可交付”的应用层面。 在这一背景下,智谱AI与MiniMax在延续此前基模研发路线的同时,选择加速在香港推进IPO进程,借助公开市场扩大资金与生态影响力;而月之暗面也在不断迭代其K2系列大模型并优化技术路径。 阶跃星辰方面,去年下半年Step3的发布,标志着公司整体技术路线出现调整的迹象,不再仅以参数规模作为核心叙事。 Step3将重心放在原生多模态能力与通用推理覆盖面上,强调模型在多任务、多模态场景下的统一能力,同时更加重视训练成本、推理效率与部署可行性之间的平衡。 从技术形态看,Step3采用MoE架构,总参数量约321B、激活参数38B,并于去年7月底正式开源。 值得注意的是,在一些测评场景中,Step3的推理解码成本约为DeepSeek-V3的三分之一,并强调其在国产芯片上的推理效率表现。 而在模型路线之外,产品线也在2024年末出现收敛。阶跃星辰曾在ToC端并行探索“跃问/冒泡鸭”两条路径:前者偏对话助手,后者是角色扮演类Agent产品。 自2024年12月起,阶跃星辰已停止对角色陪伴应用“冒泡鸭”的大规模投放与资源投入,相关开发/运营团队被并入主打对话与智能体产品的“跃问”(后更名为阶跃AI)团队。 伴随团队合并,“阶跃AI”在产品战略上出现了从“ChatBot”走向“Agent”的转向:不再把对话作为终点,而是将重点放在任务型智能体与可交付能力上。 毫无疑问,这与 2025 年大模型公司集体下场“卷应用”、资源向核心产品集中的趋势相契合。 进入2025年下半年,阶跃星辰将终端落地与多端部署作为对外核心方向。2025年12月,阶跃发布了业内首款可部署的GUI开源模型,并以端云结合方案支持手机、汽车、电脑等多端部署。 公开数据显示,在手机侧,国内约60%头部手机品牌与其达成深度合作,模型装机量超过4200万台。而在汽车场景中,印奇的加入将进一步强化阶跃星辰与“AI+汽车”产业链的紧密联系。 加上手握最新一笔50亿融资,2026年,阶跃星辰似乎在资本市场上可以定下一个更长远的目标。 03 本月初,智谱与MiniMax相继完成港股上市后,余下“四小龙”是否、何时走向公开市场,一时间成为业内关注的热点。 这种热度很快转化为一场声量之战,尤其是在智谱和Minimax市值一度突破千亿港元后——相比两家公司上市前的估值翻了一倍还不止。 在“AI上市潮”的情绪带动下,余下四小龙们近期不得不出来频频露面,对外释放“不急于上市”的信号,以缓解市场对现金流与融资窗口的担忧。 月之暗面创始人杨植麟先是在在2025年最后一天发了一封内部信,提到公司现金储备超过100亿元,并明确表态短期不着急上市。 百川科技创始人王小川,在本月初召开了一场媒体沟通会,采访中提到百川智能“有机会在2027年上市”,并强调希望先把商业模式做得更扎实。 相比起同行,阶跃星辰选择用一大笔融资和印奇的“空降”,加入这场声量大战中。这轮超50亿元人民币B+轮融资,参与方包括多地国资平台与产业投资人,并有腾讯、启明、五源等老股东跟投。 值得关注的是,在融资结构上,阶跃星辰与智谱有着一定的相似度,长期以来都获得了国资背景的支持和青睐。 但在业务模式上,二者的侧重却略有不同。智谱对外叙事更强调基座模型能力与模型对外输出,并持续推进“多场景的B端/G端落地”;阶跃星辰则更强调模型与终端场景的绑定,把“端云结合、终端可部署”作为近一年的主轴之一。 在IPO问题上,阶跃星辰官方迄今并未公开披露明确计划,但智谱等“小龙”的资本化进展无疑会让外界拿来做参照。 近期,证监会公开信息显示,智谱在港股上市后仍在推进A股上市辅导进展。事实上,智谱早在去年上半年就在推进科创板上市辅导,但显然,相比摩尔线程等光速上市的算力龙头,大模型企业登陆A股并非易事。 对于“尚未盈利、研发投入高”的大模型公司而言,IPO并非单单是一个“能不能上”的问题,也是“如何说服市场长期看好”的问题。 即使能够摸到上市的门槛,长期的商业化兑现仍是绕不开的核心审视点。 事实上,印奇早在旷世时期就曾筹备过IPO。旷视科技曾两度冲刺上市,先后经历港股与科创板申报过程,并在注册推进、财务更新等环节反复受阻,最终于2024年主动撤回科创板IPO申请。对于AI创业公司上市前的博弈,这位38岁的少帅有着直接的体感。 放眼A股,目前仍未出现一家真正意义上的“大模型公司”。在科创板框架下,尽管制度不断为未盈利科技企业预留通道,但对商业化路径、收入结构与可持续性的要求并未放松。 无论是阶跃星辰,还是其他几家“小龙”,如果想成为“A股大模型第一股”,最终都绕不开一个更现实的问题:如何突破性地证明自身商业化能力。 显然,这是年初这轮大调整后,留给印奇最重要的命题。 “我希望它(阶跃星辰)会是一个商业化闭环的公司。”在同期披露的采访中,这位38岁的董事长如是说道。
DeepSeek-OCR 2发布:让AI像人一样“读懂”复杂文档
凤凰网科技讯 1月27日,DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型。 该模型采用创新的DeepEncoder V2新型编码器结构,它能够根据图像语义动态调整视觉信息的处理顺序,使模型在进行文字识别前先对视觉内容进行智能排序。这项技术突破源于对传统视觉语言模型处理方式的重新思考,旨在让机器更贴近人类的视觉阅读逻辑。 在传统的视觉语言模型中,图像通常会被切分为若干视觉token,并按照从左上到右下的固定栅格顺序送入模型处理。这种方式虽然实现简单,但与人类在阅读文档、表格或公式时基于语义和逻辑关系进行跳跃式浏览的方式并不一致。 DeepSeek论文指出,尤其在版式复杂的文档场景中,视觉元素之间往往存在明确的逻辑先后关系,仅依赖空间顺序可能限制模型对内容结构的理解能力。 为验证模型性能,研究团队在OmniDocBench v1.5基准上进行了全面评估。该基准涵盖多种类型的中英文文档,包括学术论文、杂志、报告等,重点考察文本识别、公式解析、表格结构还原以及阅读顺序等指标。 测试结果显示,在视觉token上限更低的情况下,DeepSeek-OCR 2的整体得分达到91.09%,相较DeepSeek-OCR提升了3.73%。特别是在阅读顺序准确度方面,编辑距离从0.085降至0.057,表明新模型能够更合理地理解文档内容结构。
营销视频DeepSeek时刻已至?中国自研AI视频杀器,要抢走电商视频后期饭碗
智东西 作者 云鹏 编辑 漠影 今天,当大部分AI视频生成工具还在做“快餐”的时候,国内团队祭出的新AI大招已经可以一键生成商用级的精美营销视频了。 AI技术给短视频创作带来的巨大变革,正在跨境电商领域掀起新的风暴。 当前,电商营销内容越来越多以视频形式呈现,尤其是短视频,移动生态流量正在大量转向视频内容。在AI大模型技术与内容创作深度融合的今天,如何用AI降本增效成为所有玩家聚焦重点。 但与此同时,痛点与机遇并存,海外模型更多比拼顶尖创作能力而非商业化能力,商用级营销视频的大量需求无法被满足,尤其是国内市场更是充满空白。 市面上绝大部分模型处理多模态内容一致性差、产品细节与品牌调性难以精准还原、视频逻辑和连贯性不足,并且成本高周期长,不易应对电商高频使用、灵活调整的需求,同时,跨境电商领域极高的本地化需求也难以被满足。 在炫酷画面视觉效果之外,商用AI落地真正追求的是高可用性、稳定性以及出色的性价比。 这样的行业趋势之下,近期由营赛AI发布的AI视频杀手级应用inSai Hilight成为行业中的一匹黑马,让AI从“玩具”变成了“工具”。 智东西也提前进行了上手体验,效果令人印象深刻。我们只需要一条简单的商品链接或一张商品图,就能一键生成长达1分钟的精品电商营销视频;不仅音画同步、产品信息准确,甚至连数字人都直接生成好了,口型都对的上。据了解,这背后包含Multi-Agent协同等多项技术创新以及顶级国内外垂类模型的加持。 Hilight俨然成为了跨境电商领域的“Sora”,它不是一个“剪视频工具”,而是能够像真人一样“思考、策划、剪辑”,交付可商用视频的超级创作平台。 营销视频领域的DeepSeek时刻悄然到来。 一、一条链接生成商用精美大片,稳定性一致性是杀手锏,彻底告别“AI味儿” 正如前文所说,在真正营销“战场”,需求是极为复杂且具有挑战的,需要AI工具的创作能够保证品牌和产品的高度一致性、能很好地传达品牌调性,性价比要高、转化能力要强,同时模式要能够批量化复制且内容合规。 当前行业中大部分产品仍不成熟,不仅效率、成本、效果存在短板,而且绝大部分都是“套壳”,并没有真正针对行业痛点进行技术创新,突破既有方案的瓶颈。 能够实现真正高可用、高性价比的商用全流程解决方案,是突围行业的机会所在。 面对这些挑战,Hilight给出了成为成熟的,甚至可以说是“投喂式”的AI全包服务。在实际体验过程中,其一键成片的高效、准确、稳定给我留下了深刻印象;创意工坊和数字人功能也成为营销领域不可多得的提效降本“工具箱”。 具体来看,我们只需要一条链接或上传商品图就能一键生成营销视频,从脚本生成、镜头匹配、剪辑渲染到多平台适配,整个流程清晰可见,并且还可控。甚至每个Agent负责哪些内容都有直观呈现,就如同今天大模型领域的“深度思考”过程。 在Ebay上,找到一条目标产品的商品链接,复制粘贴到对话框中,系统就会开始智能分析链接中的网址,提取关键信息,当然,我们不止可以用链接,还可以用脚本、图文等多源输入。 分析提取信息后系统会与你确认创作需求,包括产品信息、素材、主图选择、产品卖点、目标受众、促销优惠、营销节点、视频比例、视频时长、视频语言、数字人形象和配音,目前平台已经支持全球主流语种,可以很好的应对各种市场需求。 此外,你可以提出其他要求,比如你的风格偏好、有哪些需要规避的内容,你还可以进一步选择“精调成片”,对更多细节进行完美把控。 精调模式下确认分镜信息 这种灵活可控、把选择权充分交给用户的模式是值得肯定的,也是电商人所“刚需”的。 当然,你还可以直接放手让AI帮你完成一切,你只需要点击最后的“一键成片”,就可以享受AI给你带来的服务。 从一些体验的生成结果来看,商品/人物跨帧一致性是其突出特点之一。比如皮鞋产品的细节纹理可以得到很好的还原,在多个场景中出现都具有不错的稳定性一致性。 比如眼镜产品视频中,眼镜是否带摄像头、按键位置、造型都有比较好的还原。纵观其他AI视频生成工具,Hilight的生成效果可以说是断档式领先的,这也是其核心技术护城河。 在耳机展示视频中,不论是在有人物佩戴的画面,还是产品空镜,亦或是产品充电、连接手机等功能展示环节,耳机的外观、色彩、LOGO都能有准确还原。 除了一致性,Hilight还可以保证对需求的准确呈现,对于商品特性有比较形象直观的展示,比如展示鞋底的舒适、展示眼镜的轻便时尚与翻译功能,对于目标人群所在的标志性场景都有展现,比如室内、户外、旅行、工作。整体上可以较好的覆盖前期的目标人群、产品卖点。 此外,真实感强、AI味淡也是我的突出感受,视频画面、场景真实感很强,实拍感很强,AI生成味比较淡,一些服装的细节、皮肤的纹理、人物自然的表情都会带来比较强的实拍感。 数字人面部细节、穿着都比较逼真,并且说话时口型也对的上,几乎没有AI常见的违和感。 与此同时,这种真实感也来源于光影的呈现,比如展示眼镜商品的视频中,连镜片中的反光和景物映射都十分还原,真实感扑面而来。 可以说,即使是视频剪辑领域的“纯小白”,也能快速产出优质视频,真的是一键生成自主成片,所有环节AI都可以搞定。 从实际体验来看,视频短则几分钟就可以完成,相比传统短则几天,长则数周的创作流程来说,效率的提升是立竿见影的,更适合电商营销视频这类高频创作、竞争激烈、要求快速落地的领域。 同时,生成视频的成本最低仅有3元左右,价格区间在几元到十几元之间,相比传统流程中的人力、财力成本,几乎可以忽略不计。 除了智能一键成片,我也对创意工坊和数字分身两大功能进行了体验。 在创意工坊中,我们可以进行视频或图片素材的生成,输入素材可以是文字,也可以是图片。 比如我们可以根据一张简单的商品静态图,生成各类空镜图片、视频素材,为后续进一步的视频制作积累内容素材。 创意工坊可以生成创意片段,比如让照片中的静态人物说话、给视频中的人物换脸。 在商品展示方面,AI可以给模特捏脸、换装、换脸、换背景,十分灵活;素材加工方面,AI可以对图片、视频进行增加画幅、去水印、高清化等操作。 总体来看,创意工坊有着丰富的素材工具集,可以灵活高效地生成大量素材。 可以看到,基于Hilight平台,商用级电商营销视频的创作效率有了数十倍提升,从数天数周到几分钟几小时,这无疑是一种AI加持下的“降维打击”。 Hilight真正将AI视频生成从噱头性的“玩具”升级为好用、易用的专业“工具”,视频生成从快餐Demo来到了商用大片时代。 二、Multi-Agent协作兼顾性能、效率、成本,电商营销从“经验驱动”到“AI驱动” 在惊艳的产品体验背后,Hilight掏出了不少硬核技术创新,其团队历时9个多月自研,让产品跟市面上的“套壳AI”工具有了本质区别,真正实现了技术和模式架构层面的创新。 首先,也是最核心的一点,就是当我们用“商用”标准来看待AI生成视频,最关心的问题是什么?没错,是真实,要真实、准确,“不穿帮”。 其中对真实感影响最明显的就是商品的一致性,简单来说,这个产品的形状、外观、颜色、材质、版型、大小、结构等特点是不是在整个视频中都保持准确。 为了实现这一点,Hilight会基于商品知识图谱,对商品的关键属性进行精细化的拆解和结构化梳理,比如西裤的材质、眼镜摄像头的位置、皮鞋缝线的形状,从Agent处理流程中我们也能看到这个过程。 这就像为视频创作安排了一个“质检员”,保证镜头、场景切换的过程中,产品特点准确,即时修正误差,这是实现跨帧一致性的基础保障。 针对视频中出现的数字人,Hilight都有对应的专属形象“模板”,对基础身份、动作姿态、场景都做了约束,能让数字人在展现商品时更精准、更真实、更能符合需求。 比如商品是正式西装时,为数字人添加衬衫、领带等商务穿搭,调整站姿为通勤款;若是商务办公场景,则将背景切换为办公室,数字人与新背景自然融入,确保数字人与场景、商品高度契合。 在保证一致性提升真实感方面,Hilight还构建了负责智能自检的Agent,在视频片段生成后再进行校验,确保最后输出结果的准确。 根据视频生成领域权威µµ基准测试VBench得分,Hilight在背景一致性、主体一致性两方面都在行业同类产品中位列第一,超越Sora 、Seed Dream等模型。 在具体的执行层面,Multi-Agent协同是Hilight另一个关键技术创新。 在理解洞察层,Brief理解、素材理解、信息总结、趋势洞察四个Agent相互配合,把商品链接或者素材包中的各类图文素材分析拆解为真正可执行的营销指令。从理解我们的目标、把素材整理成素材库、汇总梳理关键信息到构思内容打包。 在创意与结构层,创意生成、剧本策划、素材匹配、素材增强四个Agent高效协同,把构思创意变成真正可以执行的视频结构,从如何讲故事、如何拆分每一个镜头、脚本制作、到素材的后期处理。 最后在执行与成片层,剪辑执行、成片生成、质检复盘三个Agent会最终制作出视频成品并复检,甚至还能将结果反哺系统,形成良性迭代循环。 形象地来看,相比于其他AI工具,使用Hilight更像拥有一个各方面精通的专家团队,Hilight AI自研了十多个专家Agent,并集于一个系统之中,可以说是十余个“诸葛亮”齐帮忙。 这一Multi-Agent模式带来优势是显而易见的:每一个Agent都有独立判断的能力,可以进行决策,并且Agent之间有协商协作机制,支持多轮回退,降低不确定性。此外,整个Multi-Agent系统有着自我进化能力,针对爆款产出,可以进行迭代。 简单来说,我们不再需要纠结于各个模型产出的复杂组合,不再受限于单独模型的制约和瓶颈,直接让所有顶级模型在同一平台上为我所用,效率大幅提升、效果集各家之所长。 这种“DeepSeek式”的颠覆和良心,给电商营销领域带来了巨大经济价值。 首先,在性能和性价比层面,Hilight是目前市场上唯一可以做到生成视频比肩实拍效果的产品,商家可以按产出支付,更高效且可控,可以说是跨境电商领域的Sora。 实际上,其在营销垂类领域的效果已经超过了Sora,成为这一领域新的“更优解”。 效率方面,一键直出所有营销素材带来的提效是显而易见的,甚至不需要本地部署,不需要高性能PC或工作站,AI全自动、全流程完成视频生成工作,从剧本、选图、数字人、配音到渲染。100%纯AI原创也让合规性和版权均有保障。 用一个产品代替“一箩筐”的传统创作工具,这是对传统视频制作流程的颠覆,也是真正的“花小钱办大事”。 从技术层面来看,Hilight这种突破性的“慢思考”逻辑、采用Multi-Agent的协作方式无疑是最核心的创新之处,这也是全球首个AI原生电商视频Multi-Agent,相比市面上的“快餐型”AI视频生成工具效果更可控,断档领先的一致性也成为解决商用“最后一道坎”的关键。 在Hilight加持下,基于AI形成“内容生成-数据反馈-优化迭代”的闭环,电商营销真正拥有了从“经验驱动”向“数据驱动”的转型基础; 相比套壳AI产品没有思考的快餐式产出,Hlight选择通过“有限的等待”让用户获得真正商用级的高质量视频,成为真正给电商营销行业带来价值的工业级AI应用。 结语:AI视频工具大战迈入深水区,Hilight AI率先交出标杆式答卷领跑行业 在AI与各领域深度融合的过程中,营销一直是AI率先大规模商业化的一个重要阵地,这一领域商家规模巨大、商品差异化显著、定制化需求突出、竞争十分激烈,同时对时效、成本极为敏感。 Hilight给出的解决方案对于电商视频营销所面临的几大核心痛点都有着针对性优化,这种一键搞定的极简操作背后,是团队将技术细节和难题留给了自己,将简单留给了用户,可以极大扩展平台初期所能适用的用户范围。 与此同时,我们也看到AI营销领域的技术发展迈入了Multi-Agent时代,通过多专家Agent配合、多模态模型协作的模式搞定复杂任务,无疑成为一种标杆式的解决思路。 在AI视频大战迈入深水区之下,Hilight AI无疑已经跑在了AI营销视频行业前列。
DeepSeek最新王炸模型:VLM架构重磅突破,AI像人一样读图
头图由AI生成 这一框架可用于集成额外文本、语音和视觉等多种模态。 作者 | 陈骏达 编辑 | 云鹏 智东西1月27日报道,刚刚,DeepSeek开源了其面向OCR场景的专用模型DeepSeek-OCR 2,技术报告同步发布。这一模型是对去年DeepSeek-OCR模型的升级,其采用的新型解码器让模型看图、读文件的顺序更像人,而不是像机械的扫描仪。 简单来说,以前的模型阅读模式是从左上到右下,地毯式扫一遍图片,DeepSeek-OCR 2则能够理解结构,按结构一步步读。这种新的视觉理解模式,让DeepSeek-OCR 2可以更好地理解复杂的布局顺序、公式和表格。 在文档理解基准测试OmniDocBench v1.5上,DeepSeek-OCR 2拿到了91.09%的得分,在训练数据和编码器都不变的前提下,较DeepSeek-OCR提升了3.73%。与其他端到端的OCR模型相比,这已经是SOTA成绩,但其表现要略逊于百度的PaddleOCR-VL(92.86%)OCR管线。 同时,在相似的视觉token预算下,DeepSeek-OCR 2在文档解析方面的编辑距离(编辑为正确文本所需的工作量)低于Gemini-3 Pro,这证明DeepSeek-OCR 2在确保优越性能的同时保持了视觉token的高压缩率。 DeepSeek-OCR 2兼具双重价值:既可作为新型VLM(视觉语言模型)架构进行探索性研究,也能作为生成高质量预训练数据的实用工具,服务于大语言模型的训练过程。 论文链接: https://github.com/deepseek-ai/DeepSeek-OCR-2/blob/main/DeepSeek_OCR2_paper.pdf 开源地址: https://github.com/deepseek-ai/DeepSeek-OCR-2?tab=readme-ov-file 01. 大模型不懂复杂文件结构? 先观察全局再阅读便可解决 从架构上来看,DeepSeek-OCR 2继承了DeepSeek-OCR的整体架构,该架构由编码器和解码器组成。编码器将图像离散化为视觉token,而解码器根据这些视觉token和文本提示生成输出。 关键区别在于编码器:DeepSeek将此前的DeepEncoder升级为DeepEncoder V2,它保留了原有的所有能力,但把原本基于CLIP的编码器换成基于LLM的,同时通过新的架构设计引入了因果推理。 DeepEncoder V2关注的核心问题在于:当二维结构被映射为一维序列并绑定线性顺序后,模型在建模空间关系时不可避免地受到该顺序的影响。 这在自然图像中可能尚可接受,但在OCR、表格、表单等具有复杂布局的场景中,线性顺序往往与真实的语义组织方式严重不匹配,从而限制模型对视觉结构的表达能力。 DeepEncoder V2是如何缓解这一问题的?它首先采用视觉tokenizer对图像进行高效表示,通过窗口注意力实现约16倍的token压缩,在显著降低后续全局注意力计算与显存开销的同时,保持了充分的局部与中尺度视觉信息。 它并未依赖位置编码来规定视觉token的语义顺序,而是引入因果流查询(causal queries),通过内容感知的方式对视觉标记进行重排序与蒸馏。这种顺序不是由空间展开规则决定,而是由模型在观察全局视觉上下文后逐步生成,从而避免了对固定一维顺序的强依赖。 每个因果查询可以关注所有视觉token及先前查询,从而在保持token数量不变的前提下,对视觉特征进行语义重排序与信息蒸馏。最终,仅因果查询的输出被送入下游LLM解码器。 该设计本质上形成了两级级联的因果推理过程:首先,编码器内部通过因果查询对无序的视觉标记进行语义排序。随后,LLM解码器在此有序序列上执行自回归推理。 相较于通过位置编码强制施加空间顺序的做法,因果查询所诱导的顺序更贴合视觉语义本身,也就是符合人类阅读内容的正常习惯。 由于DeepSeek-OCR 2主要关注编码器改进,没有对解码器组件进行升级。遵循这一设计原则,DeepSeek保留了DeepSeek-OCR的解码器:一个具有约5亿活跃参数的3B参数MoE结构。 02. OmniDocBench得分达91.09% 编辑距离低于Gemini-3 Pro 为了验证上述设计的有效性,DeepSeek进行了实验。研究团队分三个阶段训练DeepSeek-OCR 2:编码器预训练、查询增强和解码器专业化。 第一阶段使视觉tokenizer和LLM风格的编码器获得特征提取、token压缩和token重排序的基本能力。第二阶段进一步增强了编码器的token重排序能力,同时增强了视觉知识压缩。第三阶段冻结编码器参数,仅优化解码器,从而在相同的FLOPs下实现更高的数据吞吐量。 为评估模型效果,DeepSeek选择OmniDocBench v1.5作为主要的评估基准。该基准包含1355个文档页面,涵盖中英文的9个主要类别(包括杂志、学术论文、研究报告等)。 DeepSeek-OCR 2在仅使用最小的视觉标记上限(V-token maxmax)的情况下,达到了91.09%的性能。与DeepSeek-OCR基线相比,在相似的训练数据源下,它表现出3.73%的改进,验证了新架构的有效性。 除了整体改进外,阅读顺序(R-order)的编辑距离(ED)也显著下降(从0.085降至0.057),这表明新的DeepEncoder V2可以根据图像信息有效地选择和排列初始视觉标记。 在相似的视觉标记预算(1120)下,DeepSeek-OCR 2(0.100)在文档解析方面的编辑距离低于Gemini-3 Pro(0.115),进一步证明新模型在确保性能的同时保持了视觉标记的高压缩率。 不过,DeepSeek-OCR 2也不是全能的。在文本密度超高的报纸上,DeepSeek-OCR 2识别效果没有其他类型的文本好。这一问题后续可以通过增加局部裁剪数量来解决,或者在训练过程中提供更多的样本。 03. 结语:或成新型VLM架构开端 DeepEncoder V2为LLM风格编码器在视觉任务上的可行性提供了初步验证。更重要的是,DeepSeek的研究团队认为,该架构具有演变为统一全模态编码器的潜力。这样的编码器可以在同一参数空间内压缩文本、提取语音特征和重组视觉内容。 DeepSeek称,DeepSeek-OCR的光学压缩代表了向原生多模态的初步探索,未来,他们还将继续探索通过这种共享编码器框架集成额外模态,成为研究探索的新型VLM架构的开端。
上海交大给具身智能发了一张“统考卷”,这会是机器人的LMArena吗?
用多样化的任务与公开透明的机制,堵上具身大模型刷榜的捷径。 作者 | 陈骏达 编辑 | 漠影 在具身智能领域,一个越来越突出的现实是:Demo,似乎成为了技术能力的通用叙事方式。 在发布会、短视频和展台上,我们反复看到类似的场景,机器人在精心布置的环境里完成一次抓取、一段行走,流程流畅、效果惊艳。 然而,一旦离开展示场景,问题便变得复杂得多。换一个光照条件、换一个物体材质、稍微打乱顺序,系统是否还能稳定工作,外界往往无从得知。 不同厂商基于不同任务与展示方式来定义“领先”,使得这些Demo之间既难以横向比较,也难以被复现验证。在缺乏统一评测标准的情况下,Demo与实际落地之间的差异逐渐放大。 日前,图灵奖得主姚期智便在一场演讲中点破了这一现状:(具身智能行业)要从各说各话到统一评测,建立开放机制、安全规范等等,鼓励开源复现与挑战赛,让优秀的算法可以重复使用,可验证、可产业化。 这一呼吁背后的核心,正是建立一套统一、科学且可被反复验证的评测体系。2026年开年,上海交通大学等机构联合发布的GM-100,正是目前国内少数试图在这一方向上给出系统性解决方案的尝试之一。 01. 具身智能 缺一张“统考卷” 在一个仍处于早期探索阶段的技术领域,评测体系的意义并不止于给模型排个名次,更像是一张“统考卷”:它通过题目设置,明确哪些能力被认为是重要的,哪些问题值得被长期投入,从而在无形中塑造和引领整个行业的研究方向与技术路线。 但从现实情况来看,具身智能领域的评测体系仍然较为分散。不同企业和研究团队往往使用各自的任务集、评测流程和指标体系:有的侧重抓取成功率,有的关注路径规划,有的强调单一长任务完成情况。 现有的评测在一定程度上推动了行业早期的发展,但其任务设置多集中于高频、相对简单的场景。随着模型能力的提升,这类基准对真实应用的区分度正在下降,也越来越难以反映具身智能在复杂环境中的核心挑战。 当模型已经可以稳定完成这些“标准动作”时,继续在同一类任务上刷分,往往只能体现工程调优或场景适配能力,而难以揭示模型在复杂条件下的真实表现。行业在判断技术成熟度时,仍然缺乏一个被广泛认可的客观参照。 面向具身智能的未来,一个好的评测体系不只考“常见题”,还应覆盖偏题、难题和综合题,结构上既有基础能力测试,也有对长尾行为和复杂交互的检验。 它的目标不是让模型看起来“很强”,而是清晰呈现模型在真实执行中的能力边界——在哪些条件下可以稳定工作,在哪些情况下会失败,失败模式又是什么。 同时,随着具身任务从单一动作走向长序列、多步骤协作,评测也不能唯结果论。是否完成任务固然重要,但完成过程中的决策质量、异常处理方式、对环境和人类行为的响应,同样是衡量系统成熟度的关键维度。 过去一段时间里,学术界和工业界已关注到这一问题,并着手解决。从李飞飞教授的BEHAVIOR,到HuggingFace联合业内打造的RoboChallenge,各种新的评测体系,恰恰折射出了行业对更全面评测的迫切需求。他们希望通过更具挑战性和解释力的测试体系,为技术演进提供清晰坐标。 02. 让机器人穿糖葫芦、开抽屉 如何揭示具身智能的能力边界? GM-100由100个任务组成,每个任务大约有100条训练轨迹和30条测试轨迹,总计13000条操作轨迹,规模已经不小。不过,相比单纯追求规模的数据集,真正让GM-100与其他测评集打出差异化的,是其任务多样性和评估系统性。 GM-100的主要作者与项目牵头人、上海交通大学副教授李永露告诉智东西,其实验室践行的理念是“以数据为中心的具身智能”。 他认为在这个时代,数据集和评测对科研的贡献超过了60%,加些数据,或是让数据的分布更为健康,便有可能大幅推动模型能力的提升。 研究中,团队对现有的海量数据集和任务进行了统计,发现大部分任务仍以“pick, hold, place”这三大类为核心。因此,GM-100选择了以长尾任务和精细操作为重点,力图展现当前具身智能在真实世界操作中的能力边界。 任务设计过程中,研究团队先对人类与物体的交互原语进行了系统分析,然后借助大语言模型生成候选任务,再经过专家筛选与优化,最终形成100个任务。这些任务从日常常见到罕见,从简单到复杂。 这些任务中有不少“反直觉”的存在——人类觉得非常精细困难的任务,机器人反而能够较好完成;而人类认为非常简单的操作,机器人却经常失败。 该实验室成员、上海交通大学博士生王梓宇告诉我们,像穿糖葫芦这样人类认为对机器人比较复杂的任务,机器人已经能够做到一定水平,而开抽屉、按台灯开关或整理小物体等直觉上简单的任务,却因为机械臂构型、物体材质、位置摆放以及指令理解等因素而变得困难。 ▲GM-100中的部分任务 在现有评测体系普遍面临任务同质化、容易被针对性优化“刷榜”的背景下,GM-100通过高度多样化且长尾的任务来贴近真实物理世界。这拉高了针对性优化的成本,进而有效引导模型发展通用能力,避免模型仅在简单任务上过拟合的倾向。 在研究论文中,GM-100背后的团队已经验证了这一测评集的有效性。他们对Diffusion Policy(DP)、π₀、π₀.₅及GR00T等主流具身学习模型进行了测试。值得注意的是,GM-100评估指标不止于传统的任务成功率(SR),还引入了部分成功率(PSR)和动作预测误差。 PSR让多步骤任务的细节完成情况可量化,动作预测误差则衡量模型在新轨迹上的模仿精度。这种多维度指标使研究者能从不同角度衡量模型表现的强弱,遏制了模型通过“作弊”、“走捷径”完成部分动作,鼓励研究者关注模型真正的泛化和模仿能力。 结果显示,GM-100的任务在许多机器人平台上都可执行,但也没有过于简单,不同模型在GM-100上的表现拉开了区分度,这证明任务设计本身是合理的。跨平台测试也表明,这些任务在不同机器上具有一定的泛化价值,为评估模型能力提供了可靠参考。 03. 不做“爹味很浓”的测评集 Benchmark不只靠权威说话 不过,对一个测评集来说,打造出来仅仅是第一步。如何让更多的人用起来,对它产生信赖,可能是更为关键的一步。 在与李永露的沟通中,我们了解到,GM-100团队在打造这一测评集的时候就意识到,一个真正有生命力的评测体系不能只靠“权威”,而应走向“社区共建”。 ▲李永露 换言之,他们似乎并未将自己定位为“裁判”,而是“搭台者”。 当前的机器人学习模型仍显著受到测试者能力和环境条件的影响,GM-100不是要成为一个绝对公平的物理测试环境,这在当前的产业发展阶段也不现实。GM-100打造了一个开放平台,研究人员可以自主上传测试结果与证据视频。 为了让更多人参与这一评测,GM-100开源了全部100个任务的详细说明,需要购买的物料清单精确到了淘宝链接,还上传了每个任务约130条真实机器人操作数据,极大降低了复现门槛。 对于开源模型,GM-100团队进行验证与作者身份确认,要求提交模型权重以供审核,并为符合标准的提交打上“已验证”标签。未来,GM-100还会丰富社区的功能,让用户可以点评、收藏,表达自己的见解。 李永露说,他们不想成为一个“爹味很浓”的组织,来告诉大家应该怎么做,因为这样很有可能丧失公信力。相反,他们希望让研究社区以“悠悠众口”的模式,长期讨论并建立共识,最终形成对模型能力的客观评价。这种模式也有望让“刷榜”、“作弊”的模型在群众监督下现出原形,最终建立起透明、可信的基准测试体系。 ▲GM-100的数据采集工作(图源:RHOS) 对熟悉大模型评测的读者来说,GM‑100在理念上让人联想到LMArena。 LMArena的公信力来自一种去权威化的评测机制:平台通过匿名双盲对比和真实用户投票,让性能评估不依赖单一指标、不受品牌影响,再用Elo排名体系动态反映真实偏好,而非靠构建者主观设定的权威分数。 在这一点上,GM-100同样强调机制而非权威背书。它通过跨平台数据、详尽的交互说明和多维度指标体系,使评估结果具有可复现性和解释性,而非依赖实验者主观裁定。 两者都探索了一种面向社区与实际表现的评估范式,试图让评测结果既透明可检验、又不受单一权威框架制约。 04. 结语:GM-100将进一步扩展 不怕干“脏活累活” 李永露告诉我们,团队不会止步于GM-100数据集的发布。GM取自“Great March”,寓意“长征”,团队将逐步把任务库扩展至300乃至1000项,并推进跨机器人平台评测,以增强评测的覆盖面。 长远来看,他们希望通过任务设计的系统化、评测维度的多元化(如引入进度评分、安全性、社会价值等指标),打造更科学、更工程化的具身智能评测“奥林匹克”。 数据集和评测的构建是公认的“脏活累活”。正如李永露所说:“评测其实是一个挺苦的事情,这类工作并非在空调房里写写代码就能完成,而需要实实在在动手操作,甚至拧螺丝。但完成后,对整个世界的贡献却非常巨大。”他希望更多年轻人、研究团队和企业能够参与,共同推进这一事业。
国产GPU重磅发布 明年超英伟达Rubin架构:中国院士力挺天数智芯
快科技1月27日消息,国产GPU迎来了重磅更新,这家名叫天数智芯的公司发布的四代架构路线图显示,明年超英伟达Rubin架构。 天数智芯AI与加速计算技术负责人单天逸公布四代架构路线图显示,2025年,天数天枢架构超越Hopper(H200系列);2026年,天数天璇架构对标Blackwell(B200);2026年,天数天玑架构超越Blackwell;2027年,天数天权架构超越Rubin;2027年之后将转向突破性计算芯片架构设计。 针对行业面临的能效比偏低、创造力不足、实际使用困难等问题,单天逸表示,天数智芯通过优化设计为客户创造最优TCO(总体拥有成本),从容应对复杂应用场景;可预期,借助精准仿真模拟,让客户在部署前即可预判性能表现,实现“所见即所得”;可持续,无缝适配从传统算法到未来未知算法的演进,确保长期使用价值。 此外,单天逸介绍了四代架构的关键细节:天数天枢架构,支持从高精度科学计算到AI精度计算,AI 芯片在执行注意力机制相关计算时,算力的实际有效利用效率达到 90% 以上;天数天璇架构,新增 ixFP4 精度支持;天数天玑架构,实现全场景AI与加速计算覆盖;天数天权架构,融入更多精度支持与创新设计。 具体来说,对于天数天枢架构,单天逸详述了如何实现多项核心技术创新:TPC BroadCast(计算组广播机制)设计通过上游数据广播减少重复访存,等效提升带宽并降低功耗。 Instruction Co-Exec(多指令并行处理系统)设计实现多类型指令并行处理,增强复杂任务处理能力;Dynamic Warp Scheduling(动态线程组调度系统)机制则通过动态调度避免资源争抢,提升计算资源利用率。 官方强调,这些创新让天数天枢的效率较当前行业平均水平提升60%,基于这些效率优势,实现在DeepSeek V3场景平均比Hopper架构高约20%性能。 发布会上,天数智芯董事长兼CEO盖鲁江表示,AI 算力需以全栈自研筑牢生态根基,以开放合作定义发展新范式,以长期主义共筑产业未来;天数智芯愿与伙伴携手,让自主通用 GPU 成果惠及千行百业,共促国产算力生态繁荣。 对于这样的重磅新品,中国工程院院士刘韵洁也来站台。 按照这位院士的说法,AI算力需兼顾量的充足与质的卓越,要突破单点性能,更要实现软硬件高效协同,既要覆盖核心数据中心,更要延伸至边端末梢,实现全场景赋能;并肯定天数智芯多年来走出了自主创新、生态共建的扎实发展之路。
腾讯搜狗输入法20.0来了:口语AI润色 一通乱说也能直发
快科技1月27日消息,腾讯宣布,搜狗输入法正式推出20.0版本,全面开启AI化新体验。 其中“AI一键口语转书面语”功能堪称亮点,即便说话颠三倒四、驴唇不对马嘴,也能一键转化为规范书面语,直接发送毫无压力,彻底解决语音输入的尴尬痛点。 新版本还大幅优化轻声的识别准确率,轻声识别延时下降40%,在图书馆或深夜发语音聊天,即使是20分贝的悄悄话音量,识别准确率也能高达97%。 翻译能力迎来质的飞跃,接入全球领先的腾讯混元翻译模型,支持30多种语言边输边译。而且做到了信达雅的文学级翻译。 AI打字方面,搜狗输入法20.0能根据不同场景,识别用户的打字意图,把更准确的词排在前面。比如玩游戏时,用户输入“无语,把李白禁了 wwsm”,模型识别游戏场景和意图后,候选词优先推荐“我玩什么”而不是“我为什么”。 它还拥有10亿级动态词库,日更网络热梗、新词、新剧名。今天出的新剧,明天就能打出主角名。 搜狗输入法20.0联合权威数据库,面向医生、律师等专业行业提供定制词库,无论是复杂的化学药名还是繁琐的法律条文,打几个缩写一键上屏。 对了,搜狗输入法20.0版本的手机端可一键关闭键盘广告,回归清爽、专注的输入体验。
都Agent时代了,AI大战还要靠春节发红包?
红包能撑开多大的AI入口? 2026年AI圈的年味,在腊八节前后被腾讯和百度拉高。1月25日,腾讯元宝和百度文心先后宣布,要在这个春节分别发出10亿、5亿现金红包,单个红包最高可得10000元。 双方的玩法有着明显差异:腾讯以优势的“社交裂变”为特色,用户除了可以自己领取红包,还可以分享红包到微信、QQ好友和社群。同时,元宝还在灰度测试社交类产品元宝派,腾讯董事会主席马化腾称,这本来是绝密的项目。 图注:元宝红包活动 唐辰截图 百度则联动北京广播电视台春晚,并推出三种核心玩法:看视频领钱、前1000名集齐稀有卡得万元、通过文心助手猜口令。其特征就是和“AI深度绑定”,提升投入产出比。 这种“撒钱抢人”的戏码,在移动互联网时代并不陌生,它们的意图也很明显,希望在春节黄金窗口期实现用户规模与心智的跨越式增长。 但让人唏嘘的是,AI已经进入Agent时代,新一轮超级AI入口的争夺,红包还是那个熟悉的“老演员”,成为各家圈定用户的最佳杠杆。尽管打法各异,所有参与者的核心目标却高度一致。 腾讯的紧迫感 腾讯是春节红包玩法的“鼻祖”。微信支付在2015年凭借春晚“摇一摇”和5亿红包,在移动支付上撕开一道口子,并改写了市场格局。 此后10年间,阿里、百度、快手、字节先后复用这个玩法,和春晚绑定,推广自家的产品。比如,2019年,百度投入19亿元首次加入春晚红包战,以“产品全家桶”模式加入用户争夺战,参与就需要下载百度App。 如今,腾讯又把这套玩法复刻到自家AI应用元宝上,它深知在关键节点,通过高激励、强社交的“行为植入”,可快速完成用户习惯的重塑。 腾讯的最大依仗还是微信这座社交金矿,其试图用最短的路径,把流量从社交场景导流到AI应用上。 这背后是,腾讯对字节豆包、阿里千问先后在AI2C上跑马圈地,并拿下亿级活跃用户的紧迫感:10亿红包,本质上是腾讯为争夺用户心智支付的战略性学费。 元宝也如爱范儿所言,成了腾讯 AI2C的第一战场,更是社交的第三战场。 过去一年,腾讯在原生AI上的步调被外界评价为“慢”,制造出一种相对佛系的感觉。比如基座模型能力一般,ToB 业务也没有太多大动静。腾讯总裁刘炽平将行业对腾讯 AI 的期待,拉到还在“酝酿”中的微信 Agent 上。 尽管2025年初元宝的买量砸的也很猛,但大多也是在腾讯生态内的渠道,外部渠道的投流占少数。腾讯的“温吞”,与字节(火山云、豆包)、阿里(千问、夸克)、DeepSeek、智谱AI等的狂奔形成鲜明对比。 这次春节以10亿元的红包规模砸向C端市场,更像是腾讯一次被逼到墙角后的“急行军”。它需加速打通元宝与微信、QQ、小程序等生态的“毛细血管”。 一个行业共识是,2026 年将是 AI Agent 爆发的一年。这个趋势除了被谷歌预测,阿里千问6.0、百度文心 5.0 都依托 Agent、MCP 等,将办事能力推向用户,作为 AI2C 争夺的核心体验。 腾讯的焦虑在于,它不能输掉AI时代的“默认入口”。虽然作用微信、QQ 两大超级社交 App,但AI Agent或者MCP都有可能凌驾其上,成为新的入口。 如果用户遇到问题习惯先问“豆包”或“千问”,而不是腾讯自家的AI,那么微信的流量护城河就可能被绕过。这也是豆包手机炒热了AI手机后,很快被微信等超级App“拦截”的根本原因。 一定程度上,腾讯发起的红包大战,是对其AI生态整合能力的一次压力测试,并吹响了腾讯AI2C入口争夺的集结号。 因为过去一两年,腾讯在“佛系”的表象之下,对原生AI的布局并不缓慢。 其策略用小龙Allen Zhang的“原子”理论概括很贴切,即以“无感嵌入”的体验,推进业务AI化。同时,其在人才引进、组织架构上也做好了准备。比如去年下半年,姚顺雨等更年轻的 AI 原生技术人才被引入。 1月26日下午,在腾讯年会上,马化腾提及AI应用元宝即将展开的春节分10亿元现金活动,表示希望重现当年微信红包的盛况。他也强调,腾讯要保持定力、专注自身业务节奏。因为“每个企业的基因与体质不同,腾讯的风格就是稳扎稳打。” 这也是对“佛系”传闻的回答。只是,这份盛况能否重现,腾讯能否借此开启AI社交新时代,最终还要看元宝后续的执行能力。 百度的信心回来了 百度的及时跟牌,与腾讯针锋相对的站位还是挺出人意料。 一是百度2019年首次发放春晚红包,尽管投入19亿巨资,但还是因为用户体验不佳等问题被吐槽;二是AI大战开启后,百度也多被揶揄为“起大早,赶晚集”,还有观点称,它在AI时代掉队了。 如果按照百度之前的惯性,它的反应速度不会来得如此敏捷,更大可能是受限于外界风评,畏首畏尾,或者是回应动作变了样。 图注:百度红包活动 官方图 但这次,百度还是在腾讯之后,第一时间启动2026马年春节红包活动。除了行业性的焦虑,更重要的是看到百度的信心回来了。 近一年多来,包括上周举办的文心Moment大会2026,我明显感觉到百度的一个变化:既深耕技术,也开始积极、自信对外沟通。 其中,这次活动让人记忆深刻的一幕是,现场媒体人与“罗永浩”数字人进行了一场公开辩论,把外界比较关心的几个问题抛给了“罗永浩”。 百度借“罗永浩”的嘴,回应了这些扎心、尖锐的关切,除了需要勇气,也是一种自信:一个能打的百度,又回到AI主桌。它在争议之外,打造出“芯-云-模-体”全栈协同体系,实现从底层芯片到上层应用的全链路自研可控。 2025年百度世界大会上,百度创始人李彦宏宣布全力加码AI,并提出一个概念:内化AI能力。这是一个精神切口,是基于百度AI应用生态能力的精准提炼,说明其已经走完从目标到实现的闭环。 其带来的直观效果就是,百度在AI无人区摸索十多年,构建起与谷歌、微软等巨头媲美的全栈AI闭环能力,也让它在气质上完成蜕变。 如果把百度的信心恢复看着一个阶段性项目,这次春节红包大战就是一个分界点。在此之前,百度还有些怯战,在此之后,百度已经完成脱胎换骨,在 AI 时代调整好了自己的节奏,完成技术闭环,快速抢占AI价值的最高点: 当各家还在烧 token,烧钱,无法确定什么时候能跑通模式时,百度已经开始赚钱了。这也是其打 AI 持久战的底气。 最新的动作是,百度在近期成立个人超级智能事业群组(PSIG),整合网盘、文库等核心AI应用资产,由副总裁王颖挂帅,直接向CEO李彦宏汇报。这部分涉及AI应用资产业务的整合,也是百度对外界关于自身AI能力能不能转化为规模化营收质疑的回应。 当然,百度的焦虑并未完全消散。此次积极应战,也是百度在自证:它依然是中国最懂AI的公司,其技术护城河依旧足够深厚。 “豆包、千问”们会不会跟进 目前,字节豆包、阿里千问、kimi等AI新势力还没有作出针对性的部署,但不代表它们会放弃“春晚黄金时刻”的较量——DeepSeek在去年春节横空出世,将中国AI引领到一条新路上,这也让春节对于AI行业变得意义非凡——相关春节活动势必会陆续上线,集中引爆这轮“春节红包大战”。 图注:豆包春节活动 资料图 比如,火山引擎已成春晚独家AI云合作伙伴,豆包也会参与,将配合上线多种互动玩法。字节虽还没有透露具体的赞助金额,但参照过去赞助春晚的标准,以及其大力出奇迹的风格,这必定不会是一笔小数目,甚至可能是字节或者行业今年最大的一笔AI品牌营销投入。 从去年年底开始,千问围绕阿里生态不断在挖掘AI2C战略纵深,主要以千问6.0、夸克AI眼镜为两翼,软硬通吃。其中,千问6.0全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,实现点外卖、买东西、订机票等AI购物功能,并向所有用户开放测试。 这也让其成为全球首个能完成真实生活复杂任务的AI助手,引领AI行业从“聊天对话”迈入“办事时代”。 图注:千问6.0 唐辰拍摄 尽管千问还没有确认是否参与红包大战,但可以肯定的是,千问的春节玩法会是一个体系化的“集团军作战”模式,将会和阿里商业生态一起,融入进各个业务,红包等不过是纽带,丝滑的将AI“办事能力”的体验,普及到更多商家和普通消费者。 这才是千问要不要参加、怎么参加春节红包大战的逻辑原点。脱离这个原点,千问即便发再多红包,也只是仓促应战,效果难料。 但对于参战的AI大厂来说,都需要面对一个现实问题:红包能砸出AI的未来吗? 短期来看,春节红包带来的“脉冲式流量”,必然带来下载量与日活的短期暴涨。但历史经验也给出过教训:产品力和生态体验才是硬通货。 DeepSeek的崛起证明,技术壁垒和极致体验(低成本、高性能)比单纯撒钱更具穿透力。如果各家无法在体验、场景闭环上占据优势,红包可能沦为“数字烟花”,用户“领完即走”,无法真正完成在自家AI应用上的留存。 无论如何,这场春节红包大战,承接的是字节、腾讯、阿里、百度等巨头对AI时代“超级入口”的集体押注,短时间内很难决出胜负。 但从客观层面来说,它加速了AI的普及,推动AI真正走进寻常百姓家。对普通用户来说,这是一场狂欢,原本对AI无感以及还没有习惯使用AI的群体,都会在这个节点完成一次市场教育。 我也乐见这场红包大战,能更热闹一点。
Clawdbot爆火,我看到了腾讯元宝的通天路
GitHub上有这么一个项目,一天内就暴涨了9000颗星,从早上的7.9K飙升到晚上的17K+。截至发稿,这个项目已经突破4万颗星了。 这种增长速度在开源项目中极为罕见,甚至由于这个项目能运行在苹果M4芯片上,直接引起了Mac mini的抢购潮。 而这个项目就是Clawdbot。 周末这两天,整个硅谷A 圈都沉迷在了Clawdbot 里。 前特斯拉 AI 负责人安德烈·卡帕西(Andrej Karpathy)公开点赞,谷歌AI产品负责人洛根·基尔帕特里克(Logan Kilpatrick)跟风购买 Mac mini, MacStories 的费德里科·维蒂奇(Federico Viticci)在一周内烧掉1.8亿个Anthropic API Token,就为了体验Clawdbot。 看到Clawdbot的火爆,我突然意识到:这不正是元宝在微信生态里可以复制的机会吗? 但在探讨元宝的可能性之前,我们还是先来了解一下,Clawdbot到底是什么,它为什么能在短短几天内征服这么多AI大牛。 01 什么是Clawdbot 一句话概括,Clawdbot是一个开源的、可自托管的AI助手。 它的核心创新点在于,无需打开专门的网站或App,只需通过日常使用的通讯软件(WhatsApp、Telegram、iMessage、Discord、Slack等)发送消息,就能指挥它完成各种任务。 相当于是有个24小时不休息的员工坐在你电脑前,你下班的时候想看电视剧了,就可以跟Clawdbot说你的需求,他会打开相应的页面。等你到家后,坐在电脑前就可以直接看你想看的电视剧了。 Clawdbot 的设计逻辑是通过消息应用发出指令,它会调用后台运行的大语言模型,将需求转化为本地Shell脚本并在你的电脑上执行。 换句话说,它不是告诉你怎么做,而是直接帮你做完。 它的工作流程是“消息应用⇄网关⇄AI 模型+工具”的架构。网关作为协调中枢运行在你自己的设备上,负责消息路由、状态管理、定时任务和服务集成。 但纠结的地方来了,为了让AI更强大、更好用,它就需要极高的权限(读写文件、执行终端命令)。但为了安全,又必须限制它。 Clawdbot的解决方案是引入“会话隔离”机制。 它把使用场景分成两类:一类是“主会话”(main session),就是你一对一跟它聊天的时候;另一类是“非主会话”(non-main session),比如在群聊或者公共频道里。 在主会话中,Clawdbot拥有完整的系统权限,可以读写文件、执行bash命令、控制浏览器、操作日历。因为这时候只有你在和它对话,风险可控。 但在非主会话中,Clawdbot会自动切换到“沙箱模式”,它会把所有操作都放进Docker容器里执行。 这就好比给它准备了一个“训练场”。在这个隔离的环境里,它依然可以执行命令,但无法触及你电脑上的真实数据。即使有人在群聊里试图通过恶意指令攻击你的系统,Clawdbot也只会在沙箱里执行,不会影响到真实环境。 另一个技术难点是网关(Gateway)和工具(Tools)的协调。 网关是运行在你设备上的控制中枢,它负责接收来自各个聊天软件的消息,维护会话状态,调度 AI 模型,管理定时任务。而工具则是Clawdbot能够调用的各种能力。 这两者的配合并不简单。当你在聊天软件里给Clawdbot发一条消息,网关需要做这样几件事: 1.识别这条消息来自哪个会话(是主会话还是群聊) 2.决定用什么权限级别来处理(完整权限还是沙箱模式) 3.把消息发给 AI 模型理解意图 4.AI 模型返回需要调用的工具和参数 5.网关再去执行这些工具 6.最后把结果返回给你。 整个过程中,网关要同时处理多个会话,每个会话可能有不同的权限配置,还要保证消息的顺序不乱,状态不丢失。 这就像一个交警,他需要协调来自不同方向的车,在保证效率的同时避免碰撞。 为了解决这个问题,Clawdbot 设计了一套“会话模型”。每个会话都有自己的状态、历史记录、权限配置。 虽然AI推理仍需调用Anthropic或OpenAI的API,但路由逻辑和自动化控制完全在本地,保证了隐私和可控性。这种架构设计让Clawdbot既能利用云端大模型的强大能力,又能保持本地优先的隐私原则。 模型的记忆是有限的,但是Clawdbot属于长期持续工作的产品,因此它将所有交互记录以Markdown格式存储在本地文件夹中,形成持久记忆,类似Obsidian的知识库。 它会记住你的偏好、习惯、正在进行的项目,每次对话都能延续上下文,而不是像传统AI那样每次都从零开始。 同时,Clawdbot还具备一定的“自我升级”能力。比如当你告诉它“我想让你能够生成图片”,它会自己去研究如何接入图片生成API,自己改进自己的代码,然后告诉你“我现在可以生成图片了”。 Clawdbot官方把这个过程叫做“自我技能扩展(Self-Expanding Skills)”。 它会优先检索官方技能库与用户本地已安装技能,仅在无可用资源时才进行完整API研究与代码编写。 当技能升级扩展完成后,Clawdbot会开始语法检查、权限验证、功能试运行三步,测试失败会自动回滚并向用户报告问题,不会影响现有功能。 此外,Clawdbot还是一个主动的AI助手。它通过cron定时任务,能够主动向你发送消息。每天早上自动发送日程摘要、每周五下午总结本周工作进展、监控特定条件并及时提醒。 这种主动性打破了传统AI的被动响应模式。你不再需要记得去问它,而是它会在合适的时间主动找你。 运行Clawdbot并不需要昂贵的硬件。虽然网上流传着很多人购买Mac mini来运行Clawdbot的故事,但实际上,对于基本的聊天、总结、API调用场景,只需要一台每月5美元的VPS就足够了。 只有当你需要运行本地大模型、执行重度自动化任务时,才需要考虑Mac mini这类本地硬件。Mac mini的抢购潮更多是一种社交证明和极客文化的体现,而非必需品。 不仅仅是操作电脑,从技术实现上看,Clawdbot支持超过50种集成,包括Gmail、GitHub、Obsidian、Notion、Todoist、Spotify、Philips Hue智能灯等。 那也就意味着,你可以用一条短信,控制整个屋子的智能家具。 Clawdbot可以连接你生活和工作中的几乎所有数字工具,成为一个真正的数字生活中枢。而且由于它是开源的,社区正在不断贡献新的技能和插件。 02 为何 Clawdbot 会爆火? Clawdbot 的火爆源于它解决了现有AI工具的核心痛点:摩擦力太大。 这个问题听起来简单,但它是阻碍AI真正融入日常生活的最大障碍。 传统AI需要你打开网页、切换标签页、复制粘贴结果,每一步都在打断你的工作流。 你正在写邮件,突然需要AI帮忙润色一段话,你得切换到ChatGPT的标签页,粘贴内容,等待回复,再复制回来。 这个过程看似只需要几秒钟,但它打断了你的思维,使整个流程不再连贯。而Clawdbot不同,它就在你的聊天软件里,你发一条消息就能得到回复,不需要任何上下文切换。 另一大原因在于隐私。 在AI服务普遍依赖云端的今天,Clawdbot的本地优先、开源透明、用户可控理念击中了技术社区的核心诉求。你的对话记录、个人偏好、自动化脚本只会存储在自己的设备上,可以随时查看和修改。 “数据主权”掌握在自己手中,这对于重视隐私的用户来说是巨大的吸引力。 更深层的原因是,Clawdbot代表了一种新的软件范式。传统软件是静态的,开发者写好功能,用户被动使用。而 Clawdbot是动态的、可塑的。 你可以随时让它学习新技能,可以让它根据你的需求自我改造。 这其实是一种“软件即对话(SaaC,Software as a Chat)”的新模式,每个用户都能以自己独特的语言风格和需求,拥有一个量身定制的助手。 从社区反应来看,Clawdbot的火爆也体现了一种集体的渴望。人们等Siri变聪明等了十几年,等Alexa真正有用等了快十年,但这些大公司的产品始终停留在“设个闹钟、查个天气”的水平。 而Clawdbot用开源的方式,用社区的力量,在几周内就实现了这些大公司承诺了多年却没做到的事情。 这种“人人都是产品经理,人人都是开发者”的氛围,在技术社区引发了强烈共鸣。 诚然,Clawdbot在技术上并不没有什么很高深的地方,它本质上是一个“harness”(线束),它把强大的模型能力转化为实际可用的助手功能。没有这些模型的进步,Clawdbot 不可能实现。 但它的产品理念击中了人们的痛点。 AI助手的重点不是AI,而是助手。所以它不应该是一个单独的网站,而应该是一个生活在你日常工具里的存在。 更重要的是Clawdbot的可扩展能力,有人让Clawdbot每天早上总结Whoop手环的健康数据,有人让它自动处理保险理赔邮件,还有人让它监控服务器状态并在出问题时自动修复。 这些都不是官方预设的功能,而是用户根据自己的需求创造出来的。 03 元宝的机会来了 Clawdbot的成功证明,AI助手应该生活在用户已有的通讯工具中,而不是要求用户安装新 App。 在中国,这个工具就是微信。 微信不仅是中国最大的通讯工具,它本身就是现代生活的工作流之一。 人们在微信里聊天、工作、支付、购物,几乎所有的数字生活都能在微信里发生。 如果元宝能够以通讯录的形式存在,它将拥有天然的用户触达优势。用户不需要下载新应用,不需要学习新界面,只需要像给朋友发消息一样给元宝发消息,这种零门槛的使用方式,是任何独立App都无法比拟的。 而且,微信的优势还不止于此。 微信拥有支付和小程序生态,这意味着元宝可以做的事情比Clawdbot更多。 Clawdbot可以帮你查信息、写代码、管理日程,但它很难帮你完成支付、预订、购物这些闭环操作。 而元宝如果能打通微信支付和小程序,它就能真正成为一个万能助手。你可以让元宝帮你订外卖、买电影票、缴水电费、预约挂号,所有这些操作都在对话中完成,不需要跳转到其他应用。 Clawdbot将记忆存储为Markdown 文件,这已经很先进了。但元宝可以在微信生态内,以聊天记录、图片、表情包、订阅的公众号、微信订阅的服务,来构建更高维度、更精准的个人知识库。 微信记录了你的社交关系、消费习惯、兴趣偏好,这些数据如果能被元宝合理利用(当然前提是用户授权和隐私保护),它对你的了解将远超任何其他AI助手。 这种持久记忆能力将让元宝从临时工具变成长期伙伴,用户使用越久,它越了解你,它能带给你的价值也就越大。 Clawdbot的主动关心用户,对元宝也是一个启发。通过微信绑定的信息,元宝可以做到更多。 每天早上推送个性化日程和天气,这是基础功能。但元宝还可以监控快递物流并主动提醒签收,可以定期总结消费账单和理财建议,可以根据用户习惯推荐内容或服务。 比如,元宝发现你最近经常搜索某个话题,它可以主动推送相关的公众号文章或视频号内容。 这可不是畅想,从技术实现上看,元宝复制Clawdbot的核心能力是完全可行的。 Clawdbot的架构并不复杂,前文提到,一个消息网关,一个大语言模型接口,一套工具调用系统就够了。 这些技术腾讯都有,而且可能做得更好,更何况腾讯还有自己的混元大模型。如果腾讯愿意投入资源,元宝完全可以成为中国版的Clawdbot,甚至做得更好。 但元宝要成功,需要解决几个关键问题。 第一个是隐私和信任。Clawdbot之所以受欢迎,很大程度上是因为它开源、本地优先,用户完全掌控自己的数据。 而元宝作为腾讯的产品,必然是云端服务,如何让用户相信自己的数据是安全的、不会被滥用,这是一个巨大的挑战。 第二个肯定就是开放性,Clawdbot的强大来自于社区贡献的技能和插件,而元宝如果想要同样的生态,就需要开放API,让第三方开发者可以为元宝开发技能。 但腾讯对于开放API 的态度一直很审慎。多年来,微信一直对第三方API保持严格限制,甚至封禁使用itcha 等非官方API的账号。 微信的用户协议明确禁止“通过非腾讯开发、授权的第三方软件、插件、外挂、系统,登录或使用本软件及服务”。 所以如果腾讯真打算把元宝做成Clawdbot,那么需要好好想想究竟如何运营开发者社区。 最后是商业模式。 Clawdbot是开源项目,用户只需要支付API调用费用。而元宝作为商业产品,如何定价、如何盈利,这需要仔细设计。 如果定价太高,会吓跑用户,如果免费,又难以持续投入。 最近很火的freemium模式适合元宝版Clawbot。基础功能免费,高级功能(比如更强的模型、更多的API调用次数、企业级功能)收费。 从更大的视角看,元宝如果能成功复制 Clawdbot,它的影响力只会更大。中国有超过10亿微信用户,如果其中哪怕只有1%的人开始使用元宝作为个人AI助手,那就是 1000 万用户。 这个规模是Clawdbot在全球范围内短期内都难以达到的。 说到聊天软件和接壤AI助手,在美国,这个工具可能是WhatsApp、Telegram或iMessage。在中国,这个工具只能是微信。 元宝有机会成为中国版的Clawdbot,关键在于腾讯是否愿意投入资源,是否愿意开放生态,是否愿意真正把用户需求放在第一位。 如果答案是肯定的,那么元宝的未来将不可限量。
奥特曼承认OpenAI路线走偏了,以及“写代码将变得不再重要”
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 大家是真敢问,奥特曼也是真敢说! 刚刚,奥特曼拉着一屋子AI相关从业者搞了一场直播,围绕软件工程、商业、模型开发、科学研究、教育、安全等问题,奥特曼进行了一场超「有问必答」的对谈。 问题一个比一个劲爆,奥特曼这边也是诚意满满,主打一个:奥特曼大舞台,有问题您就来~ 整场直播听下来呢,奥特曼也确实给出了一些非常实诚的结论,我也帮大家小小总结了一下: 未来从事工程师工作的人数可能会大幅增加。 我们花在写代码、调试代码上的时间将会明显减少,更多精力会用在让系统替我们把事办成上。 在今后的几年,我们会大量使用只为一个人、或极小群体量身定制的软件。 OpenAI确实搞砸了ChatGPT5系列模型,今后ChatGPT也一定会回到真正的通用模型上。 在接下来的几年里,模型学习新技能的速度会比人类还要快。 以下为本场直播的重点内容实录,围绕核心观点做了摘选整理,部分文字在不改变原意的基础上做了适度删改~ AI 正在重新定义工作、技术和教育这三件事 Q:如果AI让写代码这事儿变得又快又便宜,那是不是意味着未来市场会减少对软件工程师的需求? Sam Altman:我认为,未来从事工程师工作的人数可能会「大幅增加」。 不仅如此,未来AI能让工程师捕捉到更多工作价值,让计算机实现预期功能,这也意味着你花在敲代码、调试代码上的时间,会明显减少,更多精力会用在「让系统替你把事办成」这件事上。 甚至,我们会大量使用那种只为一个人、或者极小群体量身定制的软件, 每个人都会不断给自己定制工具。 所以在我看来,软件工程岗位需求不会变少,只会变得更多,而且规模会比今天大得多,而且全球GDP中会有更大一部分,是通过这种方式被创造出来的。 Q:随着模型和工具越来越强,我们会不会被现在这套技术方案“定死”,以后哪怕有更好的新技术出来,也很难让模型和系统真正用上? Sam Altman:我对这件事非常乐观,我认为我们会非常擅长让模型学会使用新技术、新工具。 从本质上讲,只要我们用对了方式,这些模型就是一种通用推理引擎。 而且,以我们现在的架构来看,模型本身就内置了大量世界知识,所以我觉得我们正在走在正确的方向上。 我非常希望、也非常相信在接下来的几年里,模型更新能力、学习新技能的速度,会比人类还要快。 一个我会非常自豪的里程碑是:当模型第一次面对一个完全陌生的东西——新的环境、新的工具、新的技术,你只需要给它解释一次,或者甚至不用解释,它就能自己探索一遍,然后稳定、可靠地用对它、用好它。 而且说实话,这个时刻感觉并不遥远。 Q:你认为在人生关键的成长阶段,教育会如何被人工智能改变和塑造? Sam Altman:我一直觉得,幼儿园里根本不该有电脑。 在我看来,小孩子这个阶段,最重要的就是跑一跑、玩一玩,通过真实的东西、真实的人去学怎么交流,而不是对着屏幕。 所以不只是AI,我连电脑本身都不太想让它们出现在幼儿园里,从成长角度看,我们其实到现在都没搞明白,技术到底会对青少年造成什么长期影响。 虽然已经有一大堆研究在讨论社交媒体的问题,但结论也很分裂,整体看下来情况并不乐观,更糟的是,专门给幼儿用的那些科技产品,潜在问题可能更大,却反而没什么人在认真讨论。 所以在我们真正搞清楚这些影响之前,我觉得至少在幼儿园这个阶段,根本没必要把AI引进来。 OpenAI正在重新校准产品路线:从偏科走回通用模型 Q:我注意到ChatGPT最近几代模型开始出现明显「偏科」的问题,我想问OpenAI会继续沿着这种「能力失衡」的路线走吗,还是会回到真正通用、各项能力更均衡的模型方向? Sam Altman:说实话,这件事儿上我们确实「搞砸」了。 在ChatGPT-5系列模型的开发中,我们有意把大部分精力集中在让它在智力、推理能力和编程能力上做到非常强,但现实是,有时候专注了一件事,就会不可避免地忽视其他方面。 这也是为什么,你会看到ChatGPT-5系列模型表现在写作能力上没有像4.5模型那样表现稳定,这一点我们是承认的。 但从更长远的方向上看,我认为未来主流一定会是真正高质量的「通用型」模型。 比如,当你希望模型帮你生成一个完整应用程序时,你不仅需要它把代码写对,也希望它在和你互动时,具备一种清晰、有条理、善于表达的人格,这里说的写作能力,不是指辞藻华丽的文风,而是指思路清楚、表达清楚、沟通高效。 所以我的希望是:我们能继续推进下一代模型,让它们在「所有这些维度」上都变得非常优秀,而且我相信,这件事是可以做到的。 而且我认为我们完全有可能在一个单一模型里,同时把这些能力都做到很强,眼下这个时间点尤其关键。 我们必须继续把「编程智能」这条线往前推,但与此同时,我们也会努力在其他能力上迅速补齐短板、追上进度。 Q:如果要让数百万、甚至上亿个Agent同时运行,真正的瓶颈其实在于成本,OpenAI怎么看小模型和推理成本的下降空间?在接下来的时间里,模型调用成本有没有可能出现大幅下降? Sam Altman:其实现在模型的发展已经进入了一个新阶段了,大家注重问题不再只是怎么把成本打下来,而是越来越多人开始要求更快的输出速度,甚至愿意为速度付更高的价格。 而且从历史数据来看,我们在「压低模型成本」这件事上其实一直做得非常好,如果你回头看从最早的预览版本到现在,就会发现我们的模型成本曲线已经出现了非常明显的下行趋势。 但现在的关键变化在于,除了成本之外,一个过去没那么被重视的维度,开始变得同样重要——「速度」。 有些场景里,大家其实愿意为更快的输出付更高的价格,哪怕价格贵很多,只要能在原来百分之一的时间里拿到结果。 所以我们现在面临的不只是单纯压低成本的问题,而是要在成本和速度这两个目标之间,找到一个合理的平衡点。 如果我们继续沿着降成本这条路往下推,而市场也确实想要这个方向,那我很有信心,我们能把模型成本打到非常低, 让“大规模运行Agent”这事儿在经济成本上真正站得住脚。 Q:在一个人类注意力极度稀缺的时代,OpenAI是否能构建一些工具,去系统性地提升人们提出想法的质量,让更多产品在源头阶段就变得「值得被做出来、值得被关注」呢? Sam Altman:我知道现在很多人喜欢把AI生成的内容叫作垃圾,但说实话,这个世界上本来就有大量由人类生成的垃圾内容。 真正困难的,从来都不是把东西生成出来,而是想出真正好的新点子。 我认为,我们应该去构建一类工具,专门帮助人们产生好想法,而且我相信,这样的工具应用前景非常大。 随着创作成本持续暴跌,我们可以用极低的代价去快速试错、验证想法,并建立起非常紧密的反馈回路,更快地筛选出哪些点子是好的,哪些是行不通的。 而且从模型能力上看,我完全不觉得这是做不到的,现在我们内部在用一个「特殊版本」的GPT-5.2模型,来自科学家反馈的:这些模型带来的科学进展,已经不再是可有可无的水平了。 AI会带来巨大经济变化,但风险也会一并放大 Q:现在女性因为工资差距,每年白白损失了约100万美元,你认为人工智能怎么解决这些存在了几十年的经济差距问题? Sam Altman:我确实觉得,AI会带来非常强的「通缩」效应。 我之所以这么说,是因为AI很可能会成为一种赋权工具,它会让个人用极低的成本,做出以前只有大公司或大团队才能做的事情。 如果这套能力被广泛普及,它确实有潜力去拉平一部分长期存在的经济差距,包括你提到的那种因为结构性不公平而被压低的收入问题。 但我同时也非常警惕另一种可能性,那就是AI也可能反过来,把权力和财富进一步集中到少数人手里,如果这些工具只掌握在一小撮人或少数公司手中,那它带来的不一定是拉平差距,而可能是「放大差距」。 所以在我看来,AI能不能真的缩小这些几十年的经济差距,最终取决于我们怎么去部署它、监管它,以及配套的政策设计。 Q:你认为我们如何利用人工智能来提升安全基础设施的水平? Sam Altman:我对2026年AI可能出问题这件事其实非常紧张,其中最让我担心的一块就是——生物安全。 现在这些模型在生物领域已经相当强了,而我们当下的主要策略,基本还是靠限制访问权限、加各种分类器,尽量不让人用模型危害人类的事,但说实话,我不觉得这种「封堵式」的办法还能撑多久。 我认为,AI安全,尤其是生物安全,必须从阻止一切发生,转向提高整体抗风险能力,也就是一种「韧性式」安全。 就像人类当年面对火一样:火带来了巨大的社会价值,但也开始烧毁城市,一开始我们试图禁止用火,后来发现根本行不通,于是我们转而建设防火规范、耐火材料、城市基础设施,最后才真的把火变成了一个可控、可用的东西。 我觉得AI也必须走同一条路,AI一定会有非常多的现实风险,但它同时也会成为解决这些问题的一部分,它既是问题本身,也是解决方案的一部分。 此外如果今年AI真要出一次明显、严重的事故,我觉得最有可能出事的领域就是「生物安全」,等到明年、后年,你可以想象,还会有更多其他方向开始出问题。 AI解决不了差异化价值这道坎 Q:现在大家都能用Codex、Cursor把产品做出来,但新的难题变成了GTM,我该怎么找到那些真的会用、也真的能从中我的产品中获益的人?你怎么看这件事? Sam Altman:我一直觉得,创业最难的部分,从来都不在「把产品做出来」,而在于怎么让大众真正关注它、使用它、并和它建立连接,以前是这样,现在依然是这样。 AI确实让软件开发本身变得轻松了很多,但这并不意味着创业的其他环节也跟着变简单了,你还是必须找到真正有差异化的价值突破口,产品才有可能被市场接住。 就算现在可以用AI自动化一部分销售和营销流程,也只会带来一些局部成功,解决不了根本问题。 在我看来,这件事之所以始终很难,是因为一个更底层的约束并没有改变——人类注意力极其稀缺,哪怕进入一个软件极度丰裕、能力爆炸的世界,注意力反而会变成最稀缺的资源。 在一个高度丰裕的世界里,真正稀缺的将是人的注意力与好创意,而创业,依然是一件必须靠持续创造非凡价值才能跑出来的事。 参考链接:https://www.youtube.com/watch?v=Wpxv-8nG8ec

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。