行业分类:
加载中...
头条分类:
加载中...
对话联想刘军:从"九死一生"全球化到押注AI智能体的战略思考
作者|刘毓坤 编辑|于雷 在2025年上海MWC期间,联想集团执行副总裁兼中国区总裁刘军接受了凤凰网科技在内的媒体采访。刘军系统阐述了公司以AI为核心的未来十年战略。他明确指出,联想正经历一次深刻的身份重塑,从一家算力公司转变为一家AI公司 ,其核心产品甚至可能演变为“智能体”本身 。这场变革的底气,不仅源于对AI技术浪潮的精准预判,更根植于公司过去数十年在PC崛起、全球化和智能化转型中积累的“九死一生”的宝贵经验 。 “超级智能体”引领的全栈AI战略 联想将今年定义为“超级智能体元年” 。刘军在专访中描绘了一幅完整的AI战略蓝图,该蓝图覆盖个人与企业两大领域,并具备全栈能力 。 在个人智能领域,联想的核心构想是“一体多端”。其推出的“天禧超级智能体”已不再局限于PC,而是基于个人云的端云混合架构。刘军强调,这一架构在保障用户数据隐私安全的前提下,能够打通PC、手机、平板等不同设备间的个人知识库,实现无缝连接与体验 。他甚至预言:“未来,消费产品的操作系统已经不重要了,因为客户使用界面是个人超级智能体” 。 在企业智能领域,联想同样展现了全栈实力。从底层的AI PC、智能化AIoT设备,到跻身中国市场前三且增长最快的服务器业务,联想构筑了坚实的算力基础设施 。在此之上,其“一横五纵”架构中的核心——“万全异构智算平台”,扮演着智算中心“操作系统”的角色,能够统一纳管并高效优化异构算力资源 。在解决方案与服务层面,联想正将超级智能体的理念应用于千行百业。在智慧城市领域,已签约武夷山、宜昌、上海虹口区等代表性客户,开启“智慧城市4.0”的实践 。同时,针对中小企业,联想推出了“百应”智能体,提供IT运维、AI办公和AI营销等一站式服务。 AI驱动的“硅基战队”与内部变革 “企业智能的未来,是每家企业都拥有一支硅基战队” 。刘军用这个生动的比喻,来形容AI对企业流程的重塑。联想自身正是这一变革的先行者与亲历者 。 从2017年提出“智慧中国”愿景开始,联想便从内部着手智能化转型,第一个AI模块就是智能客服 。如今,这一进程正在加速。刘军透露,今年联想中国的目标是将四分之一的四级流程(企业流程被分为六级)交由AI替代 。他认为,在AI时代,AI将不再是传统企业架构中的人力、财务、IT等职能部门,而是会像研发、生产、销售一样,成为直接创造价值的生产力环节 。 这种“从内生到外化”的路径,构成了联想独特的优势。内部实践中获得的经验与数据,经过验证和修正后,被迅速应用于外部客户的解决方案中,形成了强大的正反馈循环 。刘军坦言,虽然未曾刻意去构建所谓的“护城河”,但“谁先拿到数据谁就是王,谁能先形成新的循环,他就会越来越多的积累数据” 。联想无疑已在这条道路上占据了先机。 亲历者说:从PC崛起到全球化的“九死一生” 在回答凤凰网科技主编刘毓坤关于其职业生涯中印象最深刻变革的提问时,刘军进行了一次深入的复盘。作为自1993年便加入联想的“老兵”,他完整经历了公司发展40多年历史中的三个十年:品牌PC的崛起、充满挑战的国际化,以及业务走向多元化的转型 。 刘军坦言,每个阶段都充满挑战,但如果要排序,有两次变革最为刻骨铭心。第一个是品牌PC崛起的十年,他见证了联想在中国PC市场份额从微不足道的1%一路攀升至第一,那是一个“激情燃烧的岁月” 。 然而,刘军认为最艰难、对其领导力塑造最重要、印象也最为深刻的,是收购IBM PC业务后的全球化十年 。他直言那段经历是“含辛茹苦,九死一生”。面对一个体量是自身三倍大的公司,面对语言不通、文化迥异的海外团队,以及持续的亏损压力,整个过程充满艰险 。他感慨道:“说实话再走一次都不一定能走过来” 。正是这段在“无人区”中摸索前行、最终带领联想登上全球PC市场之巅的经历,塑造了公司坚韧不拔的品格与执行力。 身份重塑:联想究竟是什么公司? “联想是一家什么公司?”面对这个媒体和公众持续关注的问题,刘军给出了一个动态而清晰的答案:“我觉得联想正在从算力公司转变成AI公司” 。 他进一步解释,未来联想的主要产品可能就是“智能体” 。无论是面向个人的“天禧”,还是面向企业的“乐享”和“百应”,联想的目标是成为一个“智能体制造公司” 。这种身份的转变,标志着联想的业务核心正从提供硬件和基础设施,全面转向以AI驱动的、更智能的解决方案与服务。这一战略的成功,也体现在市场数据上:联想的IT服务业务在过去8年里以远超同行的速度增长,并于上个财年下半年成功登顶中国IT服务市场第一 。 结语 从专访中可以看出,联想的AI战略并非空中楼阁,而是建立在长达八年的智能化转型实践、坚实的全栈技术布局以及历经市场残酷考验的战略定力之上。刘军对其职业生涯和联想发展史的深刻反思,尤其是那段“九死一生”的全球化征程,为联想今天的AI雄心提供了最佳注脚。那段经历所锤炼出的勇气、韧性和全球化视野,正是联想在AI这一新的“无人区”中坚定前行,并致力于将AI打造为新质生产力的核心底气。
鸿蒙时代合伙人:95后独立开发者月入7万
凤凰网科技讯 6月23日,在近日举行的HDC 2025(华为开发者大会)上,华为公布了鸿蒙操作系统的最新生态进展。数据显示,搭载鸿蒙操作系统的设备数量已突破10亿台,注册开发者数量超过800万。华为方面预计,未来半年内,鸿蒙原生应用数量有望达到10万个,标志着该生态已跨越关键拐点,进入了“微笑曲线”的快速攀升期。 走进鸿蒙时代合伙人街区可以看到,前飞机工程师钟显燊。他开发的《快手笔》应用,初衷是为了给自己那些转瞬即逝的灵感造一座“离线堡垒”。借助鸿蒙的分布式能力,他的笔记可以在手机、平板、电脑间无感同步,即使没有网络,思想的火花也能被精准守护,这背后是对技术精度的执着。 华为常务董事、终端 BG 董事长余承东也走进街区,与鸿蒙时代合伙人们面对面交流。在《溏心音乐》展台,一位在校学生开发者,生动诠释了鸿蒙生态如何助力开发者梦想落地。他坦言自己是“10年老花粉”,第一台华为手机是P9。如今,他成为鸿蒙开发者,让应用覆盖到更多鸿蒙生态设备,并实现多端协同的创新体验。鸿蒙生态为他这样的开发者提供了将创意变为现实的工具与舞台。 在《轻倒数》展台前,则上演了一场“老友”间的对话。开发者周永麒向余承东介绍自己的新应用时,余承东一眼就认出了他,并笑着模仿起他上一款鸿蒙元服务“轻木鱼”标志性的“邦邦”声。周永麒表示,自己成为鸿蒙开发者已有993天。这份近千日的坚持,让他将鸿蒙独特的卡片能力,变成了桌面上提醒重要日子的《轻倒数》。这不仅是一个开发者的成长故事,更是鸿蒙与开发者之间长期陪伴、共同成长的见证。 在《每日咖啡》展台,95后独立开发者李尚儒分享说,自已一人已独立开发十几款鸿蒙生态应用,并已完成商业闭环。他表示,鸿蒙“一次开发,多端部署”的特性,让他半个月到一个月就能上架一款新产品。余承东随即向他征求建议:“你对我们的开发环境、开发语言、编程工具这方面有什么建议,意见也可以提供给我们。” 华为终端BG CEO何刚则在《西窗烛》的展台前,与“AI李白”进行了一场跨时空对话。这款应用将中国古典诗词与AI大模型深度结合,不仅能与数字诗人对话互动,还能在平板上练习书法,在手表上玩飞花令。 从这些丰富多元的创意中,我们看到,鸿蒙生态不仅为开发者提供了实现创意的技术能力,更重要的是,它打破了设备与设备、应用与应用之间的“隐形墙”,构建了一个全新的场景化服务生态。在这个生态里,《示路》的开发者夫妻,能将手绘的地图,变成服务万千自驾爱好者的智能路线规划;《药管家》的创始人,能将自己为父亲开发的用药提醒,通过鸿蒙卡片守护更多家庭的健康。 鸿蒙生态飞轮加速,携手每一位鸿蒙时代合伙人,一起穿越微笑曲线,昂然向前。对于鸿蒙开发者而言,这不仅意味着创新激情的释放,更带来了实实在在的商业回报。《轻倒数》开发者周永麒,那位坚持了近千日的鸿蒙“老朋友”,如今已实现几十万的日活和过百万的年收益,他将此称为一段“非常美妙的人生体验”。而95后独立开发者李尚儒不仅实现了月入7万、总收益达百万级的商业闭环,更让他坚信,及早加入鸿蒙,就“相当于成为了鸿蒙的‘原始股东’”。
微信朋友圈,又有新功能!网友:终于可以了,哦耶
近日 有多名网友发文称 微信朋友圈的评论 可以发表情包和图片了 对此,腾讯客服回应称:“微信更新至8.0.60版本后,朋友圈支持在评论中添加表情包或从相册上传图片,该功能目前处于小范围内测阶段,未被灰度到的用户请耐心等待,我们会持续优化产品体验。内测期间,满足版本要求的用户,可查看朋友评论的表情包和图片。” 对此,有网友表示自己也“尝鲜”了~ 也有网友表示,自己还没有获得测试邀请。 也有网友许愿新的朋友圈功能。 此前,微信发布多次功能更新,如地震预警、自动翻译、附近的工作、聊天记录备份、一次性删除“已经删除或屏蔽你的好友”等。 <上下滑动阅览此前更新的功能> 支持将聊天记录备份到U盘等外部存储设备 微信表示,支持用户通过手机微信,将聊天记录备份到外部存储设备(如U盘、移动硬盘),且可创建及管理多份备份文件,并支持自动备份。目前,该功能更新在持续扩大测试范围。 聊天记录备份的具体路径是“微信设置-通用-聊天记录与迁移-备份与恢复”,如果你的微信在该功能的灰度测试范围,那么就会看到现在备份与恢复可以选择“备份到电脑、U盘等多种存储设备”或“支持自动备份”。备份范围可以选择全部聊天或者指定聊天,也可以选择指定时间段。此外,用户还可开启自动备份,支持电量不足20%时暂停备份,以节省手机电量。 视频号可修改封面和文案 可对三个月内发布的视频发起修改;用户可点击视频的转发按钮选择修改进入文案修改页面,支持修改20个字;点击封面设置可以更换封面,还支持预览查看封面效果。目前,仅支持修改一次,如需修改封面、文案,需同时确认。 微信、QQ地震预警功能更新,紧急时能救命 腾讯宣布微信、QQ地震预警功能更新,四川以外的地区也能开启这个功能,地震预警功能正式覆盖至全国。此外,该功能新增强预警通知,当发生可能造成破坏性影响的地震时,则会进入强预警通知,用户会收到更加强烈的全屏弹窗提醒,并进入声音播报倒计时。强预警通知当前仅支持安卓系统手机,iOS系统待解锁。 手机端微信支持个人公众号一键注册和发布内容 已拥有个人公众号的,进入微信-公众号-右上角(个人中心),管理员能直接用手机撰写发布公众号图文/文章,回复留言私信;还未有个人公众号的,点击发表按钮,填写信息就能快速注册。此外,公众号分享到朋友圈能直接查看来源。 微信PC端可以收款和发朋友圈 Windows端和Mac端也可以收钱和发朋友圈了。在电脑上也能接收来自单聊中的转账。在电脑微信,进入朋友圈页面,就能看到新增的照相机按钮。除了发朋友圈,还能在电脑上查看好友的朋友圈以及置顶你的某条朋友圈。点击头像就能查看好友朋友圈。至于置顶,在单条朋友圈窗口的右上角“...” 里。 自动翻译 最新版本微信中,点击我-设置-通用-翻译,勾选自动翻译聊天中收到的消息,不再需要一条条长按翻译,丝滑唠唠嗑。目前,微信翻译已支持简体中文、繁体中文(中国台湾)、繁体中文(中国香港)、英语、印度尼西亚语、马来语、西班牙语、韩语、意大利语、日语、葡萄牙语、俄语、泰语、越南语、阿拉伯语、土耳其语、德语、法语共18种语言。 批量转发记录 聊天页面中长按消息,选多选后,划拉到想结束的任何位置,点击选择到这里,就能一网打尽所有划到的消息,合并转发或收藏,省事不费手。 附近的工作 在微信内搜索“附近的工作”“兼职”“日结”“零工”等关键词,就能自动匹配所在城市的零工,还能根据“距离”“薪资待遇”“性别”等快速筛选。腾讯表示,“附近的工作”小程序上线,所有岗位信息均由政府人社部门审核发布。当前搜索服务涉及岗位已覆盖超200个地市。 微信卡包可同步铁路电子客票 在微信发票助手绑定QQ邮箱,在12306开具电子客票后,选择发送到QQ邮箱后,微信卡包会自动收到这个发票。 一次性删除“已经删除或屏蔽你的好友” 微信通讯录满10000人以后将提示无法继续添加好友,随后将跳转到“已把你删除的联系人”列表。此前,这项功能允许用户一次删除5个,随后会进入到可加好友状态。最新版微信支持用户继续删减“单方面删除的好友”,每次5个,直至提示“单向好友”都已经删除。 你还期待微信上线 哪些新功能? 来源:河南日报、腾讯客服、微信派、中国新闻网、大众日报 编辑:黄琳 肖苔 审核:邹丹
多家充电宝品牌召回背后:消费电子行业电芯之殇
一款行业通用电芯的原材料擅自变更,引发了一场波及整个行业的品质风暴,中国消费电子供应链的隐秘创口被撕开。 6月13日,北京多所高校下发通知,要求禁用20000毫安的罗马仕牌充电宝。随即在6月16日,罗马仕宣布紧急召回逾49万台充电宝,其官方通知中提到原因为“部分电芯原材料来料”。6月20日,安克创新发布官方公告。公告指出,“某供应商部分批次的行业通用电芯,存在未经批准的原材料变更。这一变更可能导致极少数产品在长期循环使用后隔膜绝缘失效,引发过热甚至燃烧的安全隐患。” 充电宝安全问题一度成为行业热点,一连串的事件话题,撕开了移动电源行业长期潜藏的安全隐患“创口”,尤其是行业通用电芯背后隐藏的问题,亟待深入剖析。 风暴眼:主动召回与供应链的失序 据多方信源交叉印证,此次涉及行业通用电芯的背后厂商是知名电池供应商安普瑞斯(无锡)有限公司。除安克创新、罗马仕外,该企业电芯还供货给小米、绿联、倍思等多家主流充电宝品牌。目前,安普瑞斯多个相关电池及电芯产品的3C认证证书处于“暂停”状态。 据官网显示,安普瑞斯(无锡)有限公司由美国安普瑞斯全资子公司和无锡产业发展集团有限公司共同出资组建,主要从事消费类锂离子电池及其部件的生产销售等业务。其产品覆盖移动电源及电动工具领域、无人机、智能机器人、智能手机、笔记本电脑、智能穿戴设备等,是国内消费类锂离子电池领域的领军企业,也是充电宝领域软包电池第一大供应商。如今,这家供应链巨头却成了行业地震的震源。 据行业资深人士透露,此次安普瑞斯未经审批的原材料变更,使移动电源产业头部品牌均受到严重冲击。该原材料变更直接降低了电芯热失控阈值,而擅自进行的违规操作更让下游厂商无法通过常规监测手段发现异常,最终导致问题充电宝流入消费市场。此次事件折射出行业的多重问题:电芯作为重要安规部件,任何材料、工艺变更都需要重新认证,而不仅只需整机通过测试即可,安普瑞斯借此将问题电芯混入整机认证批次,规避独立检测。 低价内卷与安全刚需的矛盾 “移动电源行业的核心矛盾在市场对极致低价的追求与锂电池安全的高成本要求之间的冲突。” 市场数据显示,2024年全球移动电源市场规模已突破1200亿元人民币。其中,中国市场占比达38.7%,在全球市场中占据重要地位。但是,移动电源整体技术壁垒不高,市场集中度一般,伴随着近年来大厂商的入局,内卷已经成为了行业的主基调。从电商平台上能直观感受到移动电源价格战的白热化,本次召回涉及的充电宝主要集中在200元以下价位段,99元甚至49元的低价移动电源屡见不鲜。从成本结构分析,定价在100元以下的移动电源确实很难兼顾品质及安全。 有业内人士称:“移动电源行业目前的核心矛盾在于市场对极致低价的追求,与锂电池安全的高成本要求形成冲突。同样容量的电芯,优品、次品价差非常大,当移动电源售价不断下压时,供应链只能在电芯和电路保护上做减法。”而移动电源整机成本电芯成本占比很大,尤其很多基础款、入门款移动电源电芯成本占比往往在50%以上,是压缩成本的首要目标。为降低生产成本,电芯制造商不断挑战设计和工艺极限,擅自变更关键材料、简化工艺流程及缩减制造设备投入,此类做法已成为某些电芯制造商常见现象,为安全生产埋下隐患。 目前的局势让人联想到动力电池的发展路径。2024年动力电池价格断崖式下跌,磷酸铁锂电芯价格降至0.3元/Wh(含税约0.35元/Wh),部分企业甚至低于材料成本价销售,陷入“越卖越亏”的恶性循环。内卷困局破除有两大关键点,一为技术升级,二为政策与标准驱动的良性循环。 破局之道:技术升级与政策驱动 还是以动力电池为例,快充和固态电池的出现,以技术升级实现突围。此外,2025年工信部出台《电动汽车用动力蓄电池安全要求》,将“不起火、不爆炸”从企业技术目标上升为法规强制要求,进一步推动了动力电芯产业的高质量发展。据研精毕智市场调研网发布的《2024-2029年中国动力电池电芯行业市场深度研究及发展前景投资可行性分析报告》预计到2029年,全球动力电池电芯市场规模将达到50亿美元,未来几年的年复合增长率为19.7%。 移动电源行业当前的低价竞争与安全矛盾,与动力电芯早期阶段高度相似,但面临更复杂的约束条件,比如消费电芯的安全认证较晚出现,以及消费电子对类似轻薄的要求更为苛刻等。 政策方面,针对近期出现的移动电源行业乱象,6月18日,工业和信息化部网站公开征集《移动电源安全技术规范》这一强制性国家标准制修订计划项目的意见。行业普遍认为这是回应民生安全痛点的关键举措,有望解决容量虚标、老旧电芯回流、智能防护缺失等顽疾。 从目前互联网上透露的部分信息来看,相关政策对生产技术、质量监测、产品检测等关键环节都将实现监管覆盖,推动行业从“价格战”转向“质量战”。不过,政策落地需平衡安全性与企业成本,通过CCC认证+技术指标升级,有望复制锂电池行业“标准化→集中化→国际化”的发展路径。 充电宝安全风暴,彻底撕开了低价内卷下移动电源电芯的安全问题。为长效保障移动电源电芯安全,工信部紧急出台国标,提升行业标准。另外据知情人士透露,安克日前已同全球消费锂离子电池巨头新能源集团(ATL),即苹果手机电池的主力供应商,正式达成了过亿金额的合作,大力加码提升电芯质量标准,这标志着行业自救的启动。 然而,当强制认证的合规成本碰撞白热化的价格战,在安全成为生死线的时代,消费电子电芯产业,需要一场怎样的价值革命,才能支撑起中国质造的下一程?
阿里握紧拳头,不只是为打美团
阿里西溪园区 图源:唐辰拍摄 阿里巴巴走向大消费平台。 6月23日,阿里CEO吴泳铭发布全员邮件,宣布即日起,饿了么、飞猪合并入阿里中国电商事业群,在业务决策执行上与中国电商事业群集中目标、统一作战。 这被不少媒体误读为“并入阿里电商”。根据官方信息,此轮调整后,范禹继续担任饿了么董事长兼CEO,南天继续担任飞猪CEO,二者向阿里电商事业群CEO蒋凡汇报。同时,两家公司继续保持公司化管理模式。 “加入”或者“会师”的理解或更加准确。 公开资料显示,阿里在去年11月,将淘宝天猫集团、国际数字商业集团以及1688、闲鱼等电商业务整合为阿里中国电商事业群,涵盖了阿里在国内外的全产业链电商业务,蒋凡担任CEO。 进入2025年,阿里电商事业群将 “增长” 作为优先级最高的战略。 “淘宝闪购x饿了么”,凭实力上牌桌 此前,我指出,淘宝做闪购,不是把饿了么再做一遍,也不是把饿了么边缘化或者卖掉,而是要打破过去的资源和业务的条块分割的局面,真正把即时零售提升到战略高度。 今年5月,吴泳铭在阿里内网称:“今年集团将以饱和式投入的打法,聚焦几大核心战役。这几个关键战役将由多个业务方参与,发挥各自优势和长项,以全局价值最优来制定各项业务的协同策略”。 从阿里调整的内容和方向不难看出,吴泳铭治下的阿里,正在进一步整合国内电商平台业务,打响“关键战役”,即时零售是其中重要一战。 也可以说,淘天、飞猪、饿了么、1688、闲鱼等业务“会师”,不只是在给蒋凡“加担子”,也是握紧拳头,发挥各业务的优势和长项,构建更加完整的大消费商业生态体系。 特别是在正火的即时零售领域,淘宝闪购将与饿了么、飞猪等加强协同,为全面打通各项资源,破除组织架构障碍。 从短期内看,“淘宝闪购x饿了么”在牌桌上的出色表现,在阿里即时零售业务上起到了化学作用。 事实上,即时零售的内核还是过去阿里提倡的新零售概念,本质还是零售业务在线上线下的深度融合。比如,刘强东归来后,京东着力打造的全渠道一体化模式——主要以布局线下自营京东Mall和七鲜美食MALL为载体——试图重塑消费体验。 我有个叫“老铁”(思辨财经)的朋友判断,新零售倡导的线上线下一体化并不过时,而是时机未到。 现在看,风口来了。根据36氪报道,自从5月2日正式上线,淘宝闪购的订单量一路飙涨。淘宝内部原本预计达到1000万单需要十几天时间,但实际只花了6天,而从1000万单到2000万单的突破,间隔时间也很短。 “淘宝”公众号宣布,6月23日,在「淘宝闪购」上线不到两个月的时间内,淘宝闪购联合饿了么日订单数已超6000万。并且,淘宝还补充,“截至目前,零售订单同比增长179%,订单准时率维持在96%,保持高质量履约水平。” 5月26日,淘宝方面曾官宣,淘宝闪购联合饿了么日订单数已超4000万。其中,非茶饮订单占比达75%。 作为对比,有媒体报道,从6月中旬开始,美团外卖日单量始终维持在9000万以上,市占率稳居70%左右。这意味着,单从外卖日订单量看,“淘宝闪购X饿了么”用不到2个月时间,快赶上美团外卖了。 核心还是做“大消费平台” 阿里巴巴2025财年第四季度及全年财报业绩会曾透露,淘宝闪购无论是在规模增长还是在效率提升上均超出预期。 因为“淘宝闪购x饿了么”带来的效益,不只是在外卖业务上订单量的激增,还在于用户活跃度、用户规模等多方面,以高频即时零售需求带动淘宝交易转化。有分析人士认为,“重构业务线结构,是阿里系为产业资源配置更为合理且能共享,以此形成覆盖国内外全产业链的业务集群。” 更重要的是,“淘宝闪购x饿了么”相当于是一次“灰度测试”,让淘天看到远场近场电商结合、基于闪购业务升级商业模式的可能性。这也需要阿里重新评估饿了么在阿里生态内的价值,并给与新的定位。 Q1的财报会上,蒋凡曾预估:中国即时零售的市场规模目前在5-6亿人,未来可以增长到10亿人,还有一倍的增长空间。 图源:AI生成 长期来看,阿里还是需要聚焦在本身的商业生态建设。不管是“重燃创业精神”,还是不再着眼于业务分拆。饿了么、飞猪等业务合力,蓄力备战,更符合阿里当下“电商、云+AI”的战略指向——电商是阿里集团的核心业务之一,另外一个是云计算。 过去十余年,阿里基于淘天,从即时履约服务、品牌货盘、中小商家特色供给、新零售以及电商服务体系方面,都培育出最适合即时零售生长的土壤。一旦锚定方向,就爆发出强悍的战斗力。 比如,除了淘宝闪购的用户规模和日订单量,今年天猫618购物节,品牌纷纷加码即时零售,3C数码、服饰、运动户外等行业多个品牌成交创历史新高。 吴泳铭在全员邮件中提到,“这是我们从电商平台走向大消费平台的战略升级”。饿了么、飞猪加入阿里电商事业群的逻辑,谜底就在谜面上:做大消费平台。对外防御,应对京东、美团等在即时零售领域的竞争压力,只是其中的战略意图之一。 很多人可能忽略一个细节,从2021年底的淘天大调整开始,阿里一直在做执行一个战略:面对各种不确定性,淘宝天猫持续完善从交易到消费的链路。即,淘天不仅是高效率的商品交易平台,还要成为消费者的内容消费平台、商家的新品培育平台。 围绕这个战略,过去几年,淘宝持续发力内容化、AI以及平台化。阿里中国电商事业群的成立,一定程度上也是脱胎于此——不断拓宽消费这个场景,瞄准消费者,从交易到消费,把“流”量生意做成“留”量生意。 这也是一种回归,回归阿里价值观的第一条,就是“客户第一”。刚过去的一个热搜,阿里离职员工在内容发布万字“谏言”,也击中了这一点。 马云曾说,“我坚信阿里会变,阿里会改。”这次合力,也不是阿里拥抱变化,积极变阵的“终点”。吴泳铭表示,“未来,我们将更多从用户角度出发优化整合业务模式和组织形态,为用户创造更丰富优质的生活消费体验。 变则通,通则久远,阿里又将引爆一场新的局部战争。而这恰是阿里所需要的,面对更加复杂的竞争态势,主动出击,在发展中解决问题。对于阿里这样的庞然大物,腾挪起来,十分不易。但它又不得不变,盯紧自身,聚精会神搞建设。 参考资料: 唐辰同学,《淘宝做闪购,不是把饿了么再做一遍》 36氪,《淘宝闪购联合饿了么订单峰值突破6000万单》
北斗智影发布“七星Agent”AI智能体,短剧出海创作效率提升20倍
凤凰网科技讯 6月23日,南京智影文化传媒旗下北斗智影AI创作者平台日前在江北新区召开“AI超级个体时代”内容创作者大会,正式发布视频剪辑AI智能体“七星Agent”,并与多家行业企业达成战略合作。 会议透露的数据显示,海外短剧市场正迎来爆发式增长。2024年全球短剧应用内购收入达5.7亿美元,同比增长12倍。据Sensor Tower统计,2025年第一季度全球短剧应用累计内购收入逼近23亿美元,下载量突破3.7亿次,其中美国市场单季度贡献3.5亿美元收入。 北斗智影在技术层面实现重要突破。其发布的“七星Agent”集成多模态理解能力,通过内容理解大模型实现对视频、音频等媒体形式的精准分析,具备人脸识别、情感分析、特征提取等功能。该系统最显著的改进是创作效率的大幅提升——原本需要30分钟完成的视频素材剪辑工作现在仅需3分钟,全链路创作效率提升超过20倍。 在商业化表现方面,北斗智影平台上线4个月来累计为创作者带来超过1000万元收入。平台数据显示,已有超过5000部内容通过AI技术重新激活价值,累计生成超过1000万条二创视频,通过平台分发的视频数量超过50万条。从全球语言地区收入排名看,英文、西班牙语、印尼语等语种市场表现突出。 江北新区科技投资集团董事长高亮在会上介绍,扬子江数字视听产业园已构建起完整的产业生态链。自2024年9月开园以来,园区吸引43家企业落户,其中亿元级签约项目6个,累计产业投资规模达3亿元。园区内多部短剧作品取得市场成功,其中《何苦相思煮余年》创下24小时播放量5亿的纪录。 AI技术在内容本地化方面发挥关键作用。北斗智影自主研发的AI工具支持28种语言和方言的智能翻译与文化适配,翻译智能体不仅能准确翻译文本,还能原声复刻演员音色,保持情感细节与情绪张力的完整传递。 中科金财董事长朱烨东表示,双方联合研发的多模态智能体产品集成自然语言处理、计算机视觉等技术,旨在实现AI技能平权,让更多人成为内容创作者。 当前内容分发市场面临的挑战包括长尾内容过剩、公域流量成本高企等问题。北斗智影推出的AI+超级个体分发体系将供给模式从“以产定销”转变为“以销定产”,通过私域流量分发将公域付费占比降至20%,私域转化提升至80%。 会上还进行了战略合作签约仪式,昕箐年科技、重庆触摸文化、广西山海星辰传媒、北京小川科技、河南荷马广告传媒等公司与北斗智影达成合作。同时,大会表彰了平台优秀创作者和合作机构,展示了AI赋能内容创作的实际成效。
实测Kimi首个Agent:智能体与模型之间的区隔消失了?
这两天,月之暗面上线了名为Kimi-Researcher的产品,以“模型即Agent”的思路切入,标志着其在Agent路线上的一次明显发力。 如果大家还记得的话,就在 Kimi 发布的前一天,MiniMax 在 MiniMax Week 的第三天也启动了通用 Agent 的灰度测试。这两家此前一度低调的公司几乎在同一时段重新进入公众视野,也让原本趋于平静的 AI 四小强格局再次活跃起来。 Kimi、MiniMax、智谱、阶跃星辰,这几位曾经在大模型初期阶段高频出现的名字,如今正借助 Agent 的新赛道寻找新的突破口。不管是技术报告的更新、产品形态的演进,还是实际功能的迭代,几家厂商都在以各自的节奏向外界释放信号。 这一轮产品集中露面的时间节点并非巧合。从时机上看,这一波集中亮相并非偶然。当前,大模型正从纯粹的问答工具演进为具备自主规划、任务执行与上下文记忆能力的智能体系统。Agent 正在从“增强生产力”转向“替代部分人类任务角色”。对于具备模型研发和产品整合能力的厂商来说,这是一次相对公平的新起点。 01 报告,不只是写完,还得像 在这样的背景下,Kimi 推出的 Kimi-Researcher 选择了一个很明确的切入口:深度研究。 这个定位本身就带着浓厚的判断意味。它不打资讯助手、也不打日常问答,而是瞄准了原本需要专业助理团队完成的任务,例如梳理产业政策、比对跨国法规、生成调研报告等。 这类任务对模型的检索、思考、组织、判断能力要求极高,几乎是对 Agent 体系的全方位考验。 话不多说,我们直接开测。 比如说我想让它分析下2025年上半年黄金价格波动与美联储政策走向的关联性。 它没有立刻开始写,而是反问了我一些问题,从研究逻辑本身出发,主动确认这个任务到底该怎么做才不空转。 这种主动澄清机制,是过去在 Deep Research(左图展示为:ChatGPT的 research 模式)里很熟悉的,也不像 MiniMax (右图展示为MiniMax Agent)那种一口气跑完所有流程后才看结果的虚拟机结构,更接近一个“你提一个话题,它开始一步步推”的助研模型。 Kimi比GPT更贴心增添了“Include everything”按钮,不是单纯放开信息源,而是直接把它切换到一种更倾向生成完整结构报告的工作状态。 经过大概十几分钟的等待,它一共生成了两种版本。 一种是我们熟悉的文字版研究报告,段落结构清晰,语气沉稳,整体逻辑偏向内容层次 + 政策推导;另一种则是自动渲染的 HTML 格式报告,已经配好封面、标题、摘要、分节说明,标注出“核心发现”“关键风险”“历史规律”这些结构化小标签。 网页稿链接在这,有兴趣的朋友们可以打开看一看: https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108 内容还是很丰富的。 对经常要做对内材料和对外汇报的人来说,这种“写+排+渲”一体的体验,确实提高了交付效率。 你可以把它当成是Word+Notion+研究助理的混合体,不仅能输出内容,还知道怎么让内容看起来像一份真的报告。 然后我们也测了测生成PPT的能力。给它的任务是这样的: 梳理一下Stable Diffusion从最初发布到最新版本的演进路线,列出各阶段关键改进与社区贡献节点,并作出PPT 看起来是一个非常结构化的问题,理论上应该正对 Researcher 的下怀。但实际操作过程中,我们也发现了一些限制。 1. 当前版本仍未支持多任务并行(当然,这可能只是内测阶段的限制,正式版是否优化还有待观察。) 2. 并不能生成传统PPT,只能是 HTML 格式报告。 我们还是把report链接放在这里: https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108 不过也不能说它表现不好。作为一个学术型Agent,它在报告里自动加上了参考文献链接,并用下划线标注出处。可以完成一整套可交付内容。 而这,恰恰就是很多 AI 工具还停留在段落生成时无法做到的部分。 但当我们把这个任务交给 MiniMax Agent 时,体验就完全不同了: 它不仅生成了 PPT,还一并打包了 PDF 报告、Markdown 研究文档、图表文件、项目任务表(todo.md)和用于可视化的 Python 脚本。 你可以下载 .pptx 源文件,二次修改内容和格式。也能查看 .md 的版本记录、调图的 .py 脚本,每一阶段的中间产物全都可查。 从产出形式来看,它给你的是一整个PPT 制作系统,而不是一份静态报告。 02 Kimi-Researcher和 MiniMax Agent,哪个更适合你 从执行力上来说,两者都已经远超传统意义上的聊天机器人——你不用再一句一句提示,它们可以自己补全问题、拆解任务,甚至按你没说出口的逻辑推下去。但使用下来,两者的Agent 感其实来自不同的方向。 Kimi-Researcher 是任务导向的,它的逻辑很清楚:你给我一个研究型问题,我就像一个训练过的助理那样,问你三件事、查五份资料、最后给你一份成稿。 但 MiniMax 不太一样。 它更像一个运行在虚拟机里的多工系统——你可以把它理解成你装了一个干活的人,但这个人是你组装出来的。他自己并不主张“要做研究”还是“要做运营”,而是你怎么设计,他就按你的指令一步步走。有时候你会觉得,它像是个开着调试模式的智能体,你能看到它每一步调用了什么插件、在哪个页面抓了数据、用了哪个文档里的知识。这种透明度很高的体验,本质上更像是你操控一个流程机器人,而不是和一个人打交道。 如果说 Kimi 是把一个智能体藏在了模型背后,让你感受到结果;那 MiniMax 更像是把智能体摊开在你眼前,让你参与构建过程。两者谁更强,不一定,但它们带来的使用心智是完全不一样的。 还有一个重要差别,是默认角色设定。 Kimi 很明显是自带性格的——不夸张地说,它的Researcher标签决定了它的行为方式,比如它更关注严谨表达、更倾向于做出规范排版、更容易使用资料比对视角进行总结。 而 MiniMax 给你的更多是空角色模板——你自己来写 prompt,自己搭建链路,它才启动真正的 Agent 能力。 我不是说哪个更好,我只是说它们在实现Agent这件事上,走的是完全不同的路径。 在我们深度体验两者后,给出用户一句话结论:如果你更在意“我提个需求就能直接拿到结果”,Kimi 会是更顺手的选择;但如果你希望掌控整个任务的执行流程、甚至自己定义智能体的逻辑结构,那 MiniMax 可能更适合你。 03 Kimi 做结果,MiniMax 做过程 说到底,Kimi 和 MiniMax 的这次同步出招,看起来像是在做 Agent,其实是在做一次底层策略切换。 Kimi 把“模型即 Agent”这件事做得非常彻底。你看不到 Agent 配置、插件安装、工作流设计这些 Developer 套路,它不是在鼓励你搭建 Agent,而是干脆告诉你:“Agent 本身就是模型的一部分了”。你想研究政策,它就用研究员的方式回应你。它把智能体的控制权从用户界面撤回到了模型内部,交给了系统自动调度。 这一点是很多人没意识到的。 过去我们理解的智能体,是我来设计、我来组合,但 Kimi 的思路是,你不需要设计,你只要告诉我你要什么结果,我来决定应该找谁干活、用什么方法、怎么安排流程。 它把整个 Agent 系统做成了一个黑箱,你丢任务进去,它自己完成任务拆解、插件调用、资料组织和内容生成。就像你发了封工作邮件,过一阵就能收到一份干净利落的文档回复。 很多人还在找插件入口,Kimi 已经在去插件化。 这两种产品方向的不同,其实也能看出背后公司在策略上的侧重点。Kimi 一直强调“长文本”能力和“系统性表达”,在 Researcher 这个产品上被推到极致,它更注重交付内容的完整性和逻辑性。 Kimi不是做开发者平台,它要做的是“懂结构、能调度”的模型本体。这也解释了为什么它一上来就定位在最复杂的研究类任务,因为这种任务能最大程度激活它预设的 Agent 内部机制:澄清问题、检索并行、结构统筹、表达生成。这不是让你看到它能干什么,而是逼你意识到,你其实可以不再亲自干。 这点对用户心智的冲击,其实比 MiniMax 更强。 MiniMax 反而是最像 Agent的那一个。你真的可以看到它调用了哪些函数,爬了哪些网页,引用了哪段语料,它给你一个完整的操作轨道,你像是在 Debug 一个机器人的思路流程。这让它特别适合那些自己有一套流程、知道怎么干活的人。你可以把它当成 Agent 的 IDE ——你是工程师,它是执行层。 但这个过程中,大多数用户其实是有门槛的。 你需要理解:插件怎么绑定、变量怎么配置、路径怎么切换、长文本怎么缓存……你得像在搭一个流程工厂。而 Kimi 则直接告诉你:“你什么都不用管,只要告诉我要结果。” 这个差别说到底,是两家公司对智能体未来形态的不同下注。 MiniMax 赌的是:AI 应该成为一个流程平台,你来决定它长成什么样。 Kimi 赌的是:AI 应该直接成为一个能干事的角色,让你不再需要流程本身。 这两条路背后的预设完全不同。一个相信每个用户都该拥有自己的Agent,一个相信模型应该成为能自动执行复杂任务的交付体。 Kimi 是在重新定义什么是工具,MiniMax 是在放大工具能到多深。 这场Agent战役其实不是从用户开始的,而是从怎么分配任务这件事开始的。而这,恰恰是大模型能力真正能走入现实的起点。 你以为你在选一个Agent工具,其实你在决定的是:你愿不愿意把解决问题的方式,也一并交给它。
2025戛纳创意节:在AI的喧嚣中找回“人”的价值
©️深响原创 · 作者|吉祺 在“创意即资产”的新时代里,戛纳国际创意节仍是广告营销行业关键的晴雨表。 “AI不会毁掉广告,但它也不会拯救它。”苹果全球营销副总裁 Tor Myhren 的这句话,为今年戛纳定下了基调——今年的 Cannes Lions 并未被 AI 技术的炫目光芒所掩盖,反而在算法时代的背景下,重新讨论了“创意的意义”。 围绕创意和品牌的核心话题,我们从众多的演讲和获奖案例中提炼出以下四个关键——它们不仅定义了2025年的戛纳,或许也代表着广告营销行业的演进方向。 技术之外,人性创意回归 相比于去年,今年的戛纳关于AI的讨论只增不减,但视角与话术都更加理智了。从业者希望人们回归到创意,重新思考,在技术之外,我们还拥有什么? 苹果全球营销副总裁 Tor Myhren的演讲核心观点便是在回答这个问题。他认为,AI并不会毁掉广告,但也不会拯救它。真正的出路仍来自于“人类的感知力”。 事实上,苹果去年的广告《Crush》才翻过车。那则广告描绘了一台液压机压平乐器、油漆罐和相机等艺术品的过程,非常有视觉冲击力地呈现出创造性工具的毁灭,从而引起了创意人士对AI等技术的恐惧。Myhren当时也为该广告道歉——“我们没有抓住重点。” 苹果广告《Crush》 今年,苹果显然学乖了。Myhren 诚恳地说:“算法正在为我们做更多的决定,因为它们真的很聪明,也很有逻辑,但逻辑并不总是能让人与人悲欢想通。”广告的核心是创造情感共鸣,这种情感共鸣是算法无法复制的。 Myhren 在演讲中分享了AirPods的一则假日广告,该广告在前40秒的声音都是听不太清楚的(muffled sound)——这是一个没有“算法”会批准的创意。这则广告的灵感来自于他88岁的父亲,父亲在加州旅游时忘记了他价值5000美元的助听器,Myhren使用了他的AirPods耳机和苹果的助听器功能解决了问题。听力损失是一种无声的流行病,它的羞耻感,笨拙过时的助听器,使得很多人不愿寻求帮助。而这则广告,重点不是产品规格或功能展示,而是连接,直观而真诚的“连接”、“情感相通”。广告一出立即引起了观众共鸣,这成为了苹果有史以来收视率最高的假日广告。 自动播放 苹果AirPods广告 “我不相信这个行业95%的工作很快就能通过输入你的银行账户和按下一个按钮来完成的预测。”Myhren 认为最好的想法仍然需要人类的头脑来唤起他人的真实情感。他敦促创意人员重新发挥他们的想象力,而不是将其外包出去,因为广告的未来不是写在代码上的,而是写在我们做出的选择上。 当前的营销行业可能“有点受挫,有点害怕”,但他充满信心地说,“没有一种人工智能能比人类的思维更能让我们感受。”这不仅仅是对创意人信心的激励,更是一种结构性的判断:如果所有人都能用同一套 AI工具做出差不多的内容,唯一能区分好坏的,终究还是人的“视角”和“感受力”。 Tor Myhren,图源:Campaign 在今年的大奖作品中,现代汽车的《Night Fishing》也表达了类似的思考: 在不远的未来,一名孤独的渔夫夜晚驾驶高科技渔船出海。他使用先进设备“钓出”一种神秘的能量生命体,却在一次出钓中,意外发现了一位坠入水中的神秘少女。她不像普通人类,也不像机器,仿佛介于现实与幻象之间。两人无法交流,却在沉默中产生了情感链接。当渔夫试图将她带回岸边时,系统判定她为“异常样本”,即将强制清除。面对技术逻辑与人性抉择,渔夫做出了违背系统命令的决定——放她自由。最终,少女在晨光中消失于海面,而渔夫独自面对一个更加未知却真实的世界。 这是一则关于人类、科技与情感边界的寓言,隐喻着我们在AI主导的时代中,仍试图寻找“真实的连接”。品牌在其中几乎隐形,却用整部片子传递出现代汽车对于“未来感”“人本精神”的理解。 这类作品提醒我们:真正打动人的,并非炫技,而是情感共振。 自动播放 现代汽车广告《Night Fishing》 值得一提的是,今年小红书CMO之恒也在戛纳国际创意节上发表了演讲,核心话题也是“人”——《真实的人,真实的影响力》。 她谈到了小红书三个看似“反效率”的关键选择: 坚持UGC内容主体,如今平台90%的笔记来自于普通用户; 坚持采用给予用户内容选择权的“双列信息流”设计,而非流量效率更高的单列信息流; 将“真诚分享、友好互动”的社区氛围,优于短期增长。 正是这种回归“人”的价值观以及基于真实生活经验的分享生态,催生了小红书的内容生态蓬勃发展,为“种草”提供了生长的土壤。 AI的真正价值并不是生成内容 除了创意,今年关于AI的另一个主要话题,是如何让AI进入各个环节中,成为高度实用的生产力工具。 Adobe CEO Shantanu Narayen 的理念是“创意、营销和客户体验,必须作为一个系统被重构”。他重点讲了 Adobe 刚刚推出的GenStudio平台 ,一个集生成、管理、分发与评估于一体的内容生命周期系统。Shantanu Narayen 描述它为“创意内容的操作系统”。 在他看来,当下的内容营销生态面临两个核心痛点:内容碎片化,多平台、多版本需求日益增加;创意孤岛化,品牌内容很难统一输出、持续优化。GenStudio 的目标,是以 AI 驱动实现规模化个性内容生产,同时打通与营销、销售等下游平台的协同,使创意不再是“孤立事件”,而是嵌入到客户旅程中的“实时变量”。 平台核心能力包括: 可根据客户行为实时调整视觉内容; 与 Adobe Experience Cloud 深度集成,形成闭环投放-追踪-优化系统; 多人协作、版本管理、品牌一致性自动审核。 比如在汽车行业中,不同客户群需要不同类型的视觉内容(年轻人vs家庭用户),GenStudio 可以根据用户画像,自动生成与之匹配的品牌素材,而不是人为调整几十种版本。 Shantanu Narayen最后提出一个核心观点:“未来品牌的竞争,不是产品功能,而是用户体验。”他指出,过去十年,品牌通过广告讲述自己是谁;而接下来十年,品牌将通过交互和体验,证明自己是谁。在这个背景下,AI的真正价值并不止于“生成内容”,而是通过实时洞察与行为反馈,实现个性化体验的闭环运营。 GenStudio 而品牌方和代理公司对 AI 的态度也更加务实。 “当前最有效的AI应用,是那些能够将「实时行为数据」与生成能力结合的系统。”Avenue Z 的策略官 Whitney Hart 指出:“AI 现在的价值不在于天花乱坠的可能性,而在于如何用它更快、更精准地回应人类的洞察。” 例如在《Renault - Cars to Work》案例中,团队用 AI 分析用户每日上下班路径,自动生成最适合其生活轨迹的汽车广告内容。这种基于“生活语境”的个性化创意,大大提升了转化率,也证明 AI 真正的潜力是在幕后,而非舞台中央。 Visa 全球品牌体验副总裁也表达了类似的观点——“AI 的强项在于理解用户,回应用户,而不是替我们讲品牌故事。”Visa 强调 AI 最适合的场景不是主视觉制作,而是用在“互动机制”上。创意叙事依旧是品牌最珍贵的资产,而 AI 不应试图代替它。AI 的最佳用武之地,是在用户行为发生之后捕捉意图、响应情绪、生成反馈式体验。 在 2024 巴黎奥运会赞助项目中,Visa就利用 AI 开发了一个互动平台:观众只需上传照片和观看项目偏好,系统就会根据他们观赛时长、运动偏好、地理位置等数据,生成一个个性化的奥运纪念视频。这个视频不仅包含用户在比赛期间的互动数据,还结合了当地语言、视觉元素和音乐风格,是典型的AI+品牌的“共创产物”。 “AI 不该拿起麦克风,它应该负责监听和回答。” 效果驱动型创意, 既要又要还要 广告行业长期面临一个悖论:有趣的内容未必能带来商业结果,而有效果的广告又常常缺乏创意。今年的戛纳却出现了越来越多“效果驱动型创意”(Creative Effectiveness)的案例,说明这个鸿沟正在被填平。 在戛纳多个场次演讲中,评委们强调:“没有效果的创意是自我表达,有效果的创意才是品牌表达。”这种转变背后有几个关键背景因素: 宏观经济压力:预算减少,品牌不能容忍“美而无用”的内容; 可衡量技术成熟:数据链条越来越清晰,效果归因成为可能; 平台生态变化:算法推动以“表现”分发创意,效率要求更高。 不过,戛纳舞台上的从业者们并不是在搬起石头砸自己的脚,大家明确了效果的重要性,同时也明确了这里的效果不是单指“短期 ROI”,而是品牌的长期复利。戛纳强调评估“长尾价值”,例如品牌心智占有率提升、消费者态度改变、用户留存增强等。 比如亨氏《It Has to Be Heinz》案例,在今年的戛纳创意节(Cannes Lions 2025)斩获 Creative Effectiveness Grand Prix(金狮奖最高奖),被视为“品牌资产构建+文化嵌入+可持续增长”的典范。它通过坚持“品牌记忆资产”(瓶子形状、颜色、用语),用一种“看似平凡”的长期创意平台撬动了 12% 的年增长率。这不是一支爆款广告,而是一个有体系、有节奏、有沉淀的品牌行为。 而亨氏的另一支广告“调味卷帘门”同样也用创意拉动了效果。每年春节,城市中的小饭馆歇业返乡,卷帘门紧闭。不过,卷帘门上写着——“本店招牌糖醋排骨的秘密?用了亨氏番茄酱。”“老板回家过年了,菜谱留下了,你试试看。” 番茄酱也能做中国菜,他们还在卷帘门上贴上了真实菜谱和番茄酱试吃小包装,让人们可以顺手带回家,立刻尝试起来。万万没想到,就是这样朴实无华的广告和创意,引发了用户各种自发内容的传播,抖音平台上,相关搜索指数增长超1500%;电商平台销量同比增长30%,渗透率大幅上升;品牌与经典菜肴的联想度提升近18倍。 创作者即品牌,品牌请放权 在今年戛纳创意节上,关于“创作者即品牌”的讨论也格外热烈。从最初的内容分发角色,到如今逐步掌握创意主导权,创作者正从“媒介”跃升为“品牌自身”。主办方提出:“Creators aren’t just amplifiers, they’re the originators.”——创作者不再只是扩音器,而是创意的原点。这种转变背后,是社交平台生态的成熟、粉丝信任资本的积累,以及品牌传播逻辑的重构。 多个品牌高管在圆桌论坛中强调,与创作者的合作,关键在于“放权”。品牌不应强制提供模板式 briefing,而应信任创作者对圈层语言的把握,让内容以最真实的形式自然生长。 例如 Magnum 与 Miley Cyrus 的合作中,品牌选择退居幕后,由艺人主导创意开发,结果不但赢得年轻人共鸣,还带动了一款节日限定冰淇淋迅速售罄。未来品牌与创作者的关系将更像“品牌共建者”,而非“内容承包商”。 CaptainPuffy更是语出惊人:“很多品牌的营销创意总监都是一个70岁的老人,什么都不懂。” CaptainPuffy13岁就开始玩流媒体了,现在在Twitch上有150万粉丝。她对品牌的建议是:学会交出控制权。 “当我接受品牌交易时,我想要创意自由,”她解释道。“如果他们给你一个无聊的简报或不自然的措辞,那就不会有很好的表现。但你要为此付出代价,现在没人会高兴了。” 更关键的是,创作者经济已经从“流量资产”进化为“商业引擎”。 例如 Modibodi《I’m Dying Inside》系列,通过创作者讲述真实生理痛苦的故事,在 4 周内斩获 1,200 万观看、91% 参与提升和 75% 销售增长;Chipotle 联合网红推出“吃播生存包”,55 分钟内售罄,社媒自传播效应远超传统广告;Adidas 的“Superstar Concha”则通过挑战赛和 UGC 热潮,做到库存在一周内清空。 这些案例共同说明:创作者的内容不仅讲故事,更能动销、积淀品牌资产、撬动文化影响力。而能不能做出成绩的关键,就在于品牌是否敢于放权——这个过去被“藏着掖着”的话题,今年被摆上了台面。 结语 戛纳创意节从来不仅是一个奖项集合地,它更像一面映照行业趋势与信仰的镜子。2025 年的戛纳没有陷入技术狂欢,也没有回到传统叙事,而是坚定地指向一个答案:创意的价值,仍然源自真实的人、真实的洞察和真实的连接。 在生成式 AI、效果压力、预算紧缩、品牌信任重建等多重挑战下,好的创意不再是某一支“奇思妙想”,而是品牌长期经营的复利杠杆,是能沉淀为资产、参与文化、创造复购的战略资源。在这个时代,创意人也许不再是单打独斗的艺术家,而是掌握技术、拥抱数据、回归人心的系统构建者。 这不是创意的终结,而是创意的重构。
特斯拉 Robotaxi 高调开跑:只能坐两人,不能跟安全员聊天
特斯拉的 新阶段 今天凌晨,在经历了 12 年的漫长期待与无数次的跳票之后,特斯拉的 Robotaxi(自动驾驶出租车)终于在德克萨斯州奥斯汀市的街头,悄然开跑。 这场备受瞩目的首秀,呈现出一种奇特的矛盾感。 一方面,其运营规模极其谨慎:仅有约 10-20 辆 Model Y 展开服务,服务范围被严格限制在奥斯汀中南部的电子围栏内,避开了市中心的复杂路况;乘客采取邀请制,包括特斯拉员工、部分车主及 KOL。更关键的是,每辆车的副驾驶位上,都配备了一名「安全监控员」。 而另一方面,其传播声量颇为高调。马斯克亲自在社交媒体上大量转发首批体验者的视频,将这次小范围的内部测试,放大成了一个全球科技圈都在关注的焦点事件。 热烈祝贺特斯拉 AI 软件和芯片设计团队成功发布 Robotaxi!!这是十年艰苦奋斗的结晶。AI 芯片和软件团队都是特斯拉从零开始建立的。 马斯克的字里行间充满了对团队和自研路线的自豪。 掌镜的是特斯拉首席软件工程师段鹏飞,毕业于武汉理工大学,后于俄亥俄大学获电子工程硕博学位 一次「脚尖探水」式的落地 对于那些有幸收到邀请的「早鸟」用户而言,体验一次特斯拉 Robotaxi 的流程,既充满了未来感,也透露着无处不在的谨慎。 那么,体验一次真正的特斯拉 Robotaxi,流程究竟是怎样的? ⬇️ 点击下方观看视频 ⬇️ 首先,你需要通过一个界面颇具赛博朋克风格的手机 App,确认自己处于奥斯汀南部的服务区内,下单成功后,一辆没有驾驶员的 Model Y 便会向你驶来。至于价格,马斯克统一定在了 4.2 美元——一个充满争议的亚文化的数字。 如果你点击了打赏,它会告诉你「这只是在开玩笑」。 当车辆抵达后,其外部灯光会闪烁以帮助你进行识别,但车身并没有像 Waymo 那样独特的标识,仅在车门处印有「Robotaxi」的字样。 上车之后你会发现,车辆会自动同步你的座椅位置,音响系统也会播放你平时最爱的音乐,为你营造出一种「像是进入了自己车」的熟悉感。 有趣的是,也许是为了从形式上强调「无人驾驶」属性,乘客的乘坐位置也受到了严格限定:驾驶位永远空着,副驾属于那位时刻观察路况的「安全监控员」,而你和你的朋友,只能一同坐进后排。 后排的屏幕会进入专属的 Robotaxi 模式,你需要长按屏幕上的一个圆形按钮来开始行程。行程中,你也可以操控空调和影音系统,但前排的中控大屏则无法操作。 根据多位 KOL 分享的体验,Robotaxi 的整个乘坐过程平稳、顺畅,体验甚至比之前的 FSD 更好。一位名叫 Zack 的用户表示:「在减速带上减速效果非常好,停车也非常平稳。」 在乘坐了 3 次之后,Farzad 也给出了它的评价:它对 Robotaxi「平稳舒适」的运行状态毫不意外,但当他意识到这辆实现无人驾驶的汽车,和他买的那辆 Model Y 一模一样时,他的内心受到了巨大的冲击。 一些人性化的细节也值得称赞。例如,下车时,屏幕会提示乘客使用按钮开启后备箱(如果乘客在上车前有打开的话),并附有如何打开车门的图文说明,确保隐藏式门把手不会给新乘客带来困扰。 当然,在这看似流畅的体验之下,是特斯拉近乎「步步为营」的战略考量。 副驾驶位被禁止与乘客交流的安全员、车外待命的远程操作员、严格的地理围栏、避开市中心复杂路口的路线规划、以及仅在良好天气下运营的限制,每一个环节都在尽力规避风险。 坐在副驾的安全员可以让车辆在车道内停下或是靠边 这背后,无疑有 Cruise 在旧金山因事故而全面停摆的前车之鉴,以及 Uber 因致命事故而彻底退出自驾业务的惨痛教训。在自动驾驶的商业化道路上,「安全」是那条一旦越过便万劫不复的唯一红线,特斯拉显然不愿在同一个地方摔倒。 乘客也可以让车辆靠边,或是直接与客服沟通 马斯克上周的表态也说明了这一点:「由于我们对安全问题极度在意,所以(试运营)启动日期可能会有所调整。」 当然,支撑这场首秀的,是特斯拉的技术内核。 这批投入运营的 Robotaxi,搭载的很有可能是全新的 HW5 硬件平台,配备 4 颗 4D 毫米波雷达和 12 颗高清摄像头,其算力范围覆盖 2000 至 2500TOPS,远超现款 HW4 芯片的 400 至 500TOPS。 软件层面,车辆运行的是 FSD V13.3,该版本后续也会向其他 FSD 用户进行推送。 除了展示已经落地的技术,马斯克也总不忘在社交媒体上预告下一个更强大的未来,这已成为特斯拉维持市场高期待值的惯常手法。他透露,一个参数量是现行模型 4.5 倍的更先进 AI 模型,已在内部进行 Alpha 阶段的测试。这种「硬件超前预埋、软件持续迭代」的模式,正是特斯拉试图构建其技术护城河的核心逻辑。 但即便如此,环绕在特斯拉技术路线上的争议与挑战,也从未停歇。 最核心的,依然是其近乎执拗的纯视觉路线。多个分析机构和众多技术专家都曾指出,仅依靠摄像头,在面对太阳强光、恶劣雨雪天气、或光线极差的夜晚等场景时,其感知的可靠性仍面临巨大挑战,这与 Waymo 等竞争对手采用的「激光雷达+毫米波雷达+摄像头」的多传感器融合方案形成了鲜明对比。 与此同时,来自监管层的压力也如影随形。美国国家公路交通安全管理局(NHTSA)目前仍在对特斯拉的自动驾驶系统进行多项调查,而德州的立法者甚至在 Robotaxi 上线前,就公开呼吁其推迟运营,等待更严格的安全法规生效。 *我们可以在得州交通部官网看到所有正在运营的自动驾驶车: https://txdot.maps.arcgis.com/apps/dashboards/f4dd9ee9f87447d3ac3cdef192b3910f 或许,最冷静的一盆冷水,来自特斯拉的前 AI 主管、纯视觉路线的奠基人之一——安德烈·卡帕西。他分享了自己早在 2013 年就体验过 Waymo 前身(谷歌无人车)的一次完美的无干预演示,那次经历曾让他以为自动驾驶「近在咫尺」。 「但如今 12 年过去了,」他感慨道,「我们仍未真正解决这个问题。」 这位大神级人物的审慎,无疑为特斯拉这场看似成功的首秀,增添了一层复杂而深刻的意味。 Robotaxi 撑起特斯拉的下一个十年 在完全了特斯拉 Robotaxi 的初步体验、运营策略以及其背后喜忧参半的技术内核之后,我们才能更清晰地审视马斯克为这场「终局之战」所描绘的、那幅庞大而诱人的商业蓝图。 这套商业模式的核心,被马斯克生动地比作「Airbnb 和 Uber 的结合体」。 一方面,特斯拉将运营一部分自有的 Robotaxi 车队,保证核心区域的服务稳定。 而另一方面,也是其最具颠覆性的一点,是向全球数百万的特斯拉私人车主开放「加盟」入口。 车主可以通过手机 App,一键将自己的车辆在闲置时投入 Robotaxi 网络,随时加入或退出,让汽车从消费品变成可以创造持续收益的资产。 马斯克曾算过一笔账:车主通过共享车辆获得的收入将远超车贷月供,而特斯拉则可以从每笔订单中抽取佣金。这种「轻资产」的扩张模式,巧妙地将车辆、充电、清洁、维护等大量运营成本,转移给了庞大的车主网络,从而有望实现高达 70% 的惊人运营利润率—— 这正是支撑马斯克喊出「Robotaxi 将为公司市值带来 5 到 10 万亿美元增长」这一豪言的底层逻辑。 然而,宏大的愿景与骨感的现实之间,依然横亘着巨大的鸿沟。 马斯克为 Robotaxi 的规模化定下了极其激进的时间表:在奥斯汀试运营的几个月内扩展到 1000 辆,到 2026 年底,在美国将有超过 100 万辆自动驾驶的特斯拉投入运营。 但华尔街的分析师们显然要冷静得多。高盛预计,特斯拉在 2027 年前能部署约 2500 辆 Robotaxi;而摩根士丹利等机构则普遍认为,真正意义上的大规模商业化落地,可能要等到 2028 年左右。 这种预期上的巨大差异,源于市场对马斯克「过度承诺」的深刻记忆。从 2019 年宣称「2020 年实现百万 Robotaxi 上路」,到如今 2025 年才刚刚以 10 余辆车的规模开启内测,时间这位最公正的裁判,已多次修正了马斯克的「PPT 时间表」。 但有趣的是,即便跳票已成常态,资本市场似乎依然愿意为 Robotaxi 这个故事持续买单。 究其根本,是因为 Robotaxi 直接关系到对特斯拉这家公司的最终定义——它究竟是一家增长有限的汽车制造商,还是一家拥有无限想象空间的 AI 和科技公司? 万亿美金的市值,早已无法单靠卖车来支撑。FSD 软件的持续收费、Dojo 超算的算力服务,以及 Robotaxi 所代表的未来出行网络,这些才是支撑其高估值的核心叙事。 因此,Robotaxi 的每一次进展,无论多小,都像一针「兴奋剂」,能直接刺激市场的神经。它的顺利与否,将直接触发对特斯拉股价和未来价值的大幅修正。 可以说,此次奥斯汀的首秀,无论其运营规模多么有限,都标志着特斯拉的 Robotaxi 故事,终于从虚无缥缈的 PPT,第一次走入了触手可及的物理世界。这是一个至关重要的「从 0 到 1」。 正如卡内基梅隆大学的自动驾驶领域教授菲利普·库普曼(Philip Koopman)在评价此次首秀时所言,这更像是「开始的结束,而非结束的开始。」 对于马斯克和他庞大的 AI 团队而言,这场持续了 12 年的艰苦奋斗,或许才刚刚完成了它的序章。 文 | 李华
字节上线“卷王”级产品“探饭”,全功能AI饭搭子
《读佳》获悉,字节的UserGrowth(用户增长团队)做了一个名为“探饭”的AI产品,搭载的是豆包大模型。 开发公司为北京有竹居网络技术有限公司,经查询,为字节全资子公司。探饭主要为用户提供美食相关的智能向导服务,在实际体验过程过程中,还发现通过探饭也能够购买团购套餐或点外卖,以及AI点菜。 堪称全方位的AI饭搭子。 第一部分:从“吃什么”到“怎么吃”,探饭把AI干饭流程卷到极致。 实测来看,探饭的功能较为丰富,不仅可以实现探店推荐、菜品推荐、美食攻略、点菜,还可以实现买团购、点外卖等功能。 在实际体验中,可以直接问探饭美食问题,比如“北京有什么好吃的鲁菜馆”,随后,探饭便会基于地理位置,且按照连锁品牌和小众美食,划分为品牌店和宝藏店,分别罗列出附近的相关鲁菜餐厅。探饭还会给出具体的推荐理由,比如同和居(银泰店)入围了北京市地方菜回头店,有溜肝尖特色菜,还赠送长寿面等。 如果用户对于罗列出来的美食店仍然不好做出选择,也可以通过PK比店功能,进一步筛选出合适的美食店。探饭会从适用场景、特色、推荐菜、优劣势等多个维度进行比拼,并进行总结,让用户进行判断。 确定好美食店后,可以直接在探饭上点击该门店的图片,紧接着会进入该店铺的详情页,可以看到推荐菜、评论、优惠团购、推荐搭配、环境等更多信息。 探饭还支持地图找店,可以在地图上寻找美食店(注:笔者附近暂没看到美食店),确定好店铺后可以进行导航,导航需跳转至高德地图。 第二部分:从推荐到下单,抖音生态让AI干饭形成闭环 除了上述提到的服务外,用户甚至可以直接在探饭中购买团购,如果购买带有随心团的团购,则可以直接外卖到家。 探饭还有AI点菜功能,选择好人数和口味偏好或者忌口,AI就会推荐出合适的团购菜单供用户参考。 这种“AI推荐+生态闭环”的模式,让用户从“被种草”到“下单”的决策时间压缩到几分钟以内,一位业内人士表示:“字节这是要让AI成为本地生活的新流量入口。 不过,探饭目前也并非十全十美。在探店推荐方面,虽然能够广泛搜罗各类餐厅信息,但对于一些较为小众、新开不久,尚未被大众熟知的宝藏店铺,存在信息覆盖不全面的情况,可能导致部分极具特色的小店难以出现在推荐列表中。 不得不说,“探饭”的出现重新定义了“干饭智能化”,当AI能从推荐餐厅、PK比店到完成团购外卖全链路服务,字节实际上在用技术重构用户的饮食决策逻辑。对行业来说,或许正在预告下一个本地生活的流量入口形态。
地表最强法务部,把明星AI独角兽告了
作者 | 陈骏达 编辑 | 心缘 “地表最强”法务部,跟一家AI创企杠上了。 智东西6月17日报道,6月12日,好莱坞影视巨头迪士尼、环球影业及其旗下多家公司联手提起诉讼,指控美国生成式AI独角兽Midjourney的生图服务在未经许可的情况下,将大量IP内容用于训练AI模型,并允许用户生成与原IP形象高度相似的图像。 通过此次诉讼,迪士尼和环球影业不仅希望法院禁止Midjourney的侵权行为,还要求后者为每部故意侵权的作品支付最高15万美元(约合人民币108万元)的赔偿。根据起诉书中提供的不完全统计,Midjourney最终可能需要对涉及总计200部作品的侵权行为支付最高3000万美元(约合人民币2.15亿元)的赔偿。 ▲Midjourney生成的侵权形象与原IP形象对比(图源:起诉书) Midjourney平台上的侵权内容不止包括迪士尼、环球影业的IP,连最近全球爆火的泡泡玛特Labubu也出现在其主页推荐中,被AI“抄袭”了。 ▲Midjourney首页上出现的AI复刻版Labubu(图源:Midjourney官网) 其实,在正式提起诉讼前,迪士尼和环球影业已经向Midjourney发送了停止侵权的警告,但并未收获任何回复。Midjourney不仅持续更新其图像生成模型,还计划在本月推出视频生成模型,这些新服务可能会进一步侵害版权方的权利。 迪士尼和环球影业将Midjourney的行为定性为“典型的版权搭便车”,更是“抄袭的无底洞”。这些行为从根本上威胁了版权法的激励机制,可能对未来的影视作品创新带来负面影响。目前,Midjourney尚未对此案进行正面回应。 Midjourney是全球使用范围最广、最受欢迎的图像生成工具之一,以订阅的形式对外提供服务,月费从10美元-120美元(约合人民币72元-862元)不等。去年,Midjourney公司的营收已经达到3亿美元,估值已超过10亿美元,成为一家独角兽企业。 不过,MidJourney并不是唯一一家遇到类似问题的硅谷创企。今年,OpenAI的GPT-4o的图片生成功能,就因允许用户生成高度模仿吉卜力、史努比等风格的图像,而引发版权争议。 过去几年,好莱坞一直对类似侵权行为持观望与试探态度,迪士尼和环球影业是首批起诉AI创企侵权的好莱坞制作公司。 选择在此时提起诉讼,或许意味着这两家公司认为法律和舆论环境已经成熟。迪士尼的法务部门以超强版权保护、诉讼胜率高、维权手段强硬著称,被业内人士“地表最强法务”,而环球影业也同样拥有好莱坞顶级法务团队。 值得注意的是,这一诉讼特别强调了Midjourney对包括钢铁侠、功夫熊猫、巴斯光年、艾尔莎、史莱克和小黄人等独创IP角色的侵权,而非仅仅关注图像的复制,这意味着对这些形象进行衍生创作可能也构成侵权。好莱坞巨头们打响的第一枪,很有可能引发一波后续诉讼。 一、平台、用户均涉嫌侵权,创始人言论或坐实“明知故犯” 迪士尼和环球影业的起诉,主要围绕着两大指控,涉及Midjourney AI生图技术的训练和分发。 首先是直接版权侵权。起诉书中列举了数十项AI生成形象与原AI形象的对比照,结合这些证据和生成式AI行业常识,迪士尼和环球影业确信,Midjourney在数据抓取、数据清洗、模型训练等阶段都存储、复制了相关IP形象,这一行为构成了直接侵权。 ▲Midjourney生成的侵权形象与原IP形象对比(图源:起诉书) Midjourney不断更新和扩展的模型家族,还意味着每次升级图像服务时,该公司都会重复上述涉嫌侵权的训练流程。原告方推测,Midjourney即将推出的视频生成服务,或将大幅提升其传播侵权副本及衍生作品的能力。 上述推测得到了Midjourney创始人兼CEO大卫·霍尔兹(David Holz)个人表述的佐证。2022年8月,霍尔兹在接受The Verge采访时称,为了收集训练数据,Midjourney“竭尽所能获取所有数据、所有文本、所有图像”。 ▲大卫·霍尔兹 在同年9月接受福布斯的采访时,霍尔兹更是明确承认Midjourney从未寻求获得任何版权内容持有者的授权,来复制和利用其作品。 训练完成后,Midjourney图像生成服务能直接为用户生成侵权内容,这构成了迪士尼和环球影业所指控的第二项罪名——间接版权侵权。 迪士尼和环球影业认为,用户对版权内容进行未经授权的复制,本身就构成侵权,而平台方Midjourney对此应当负有监督控制的责任。 实际上,Midjourney有充分的手段与能力对类似行为进行限制。 在训练阶段,Midjourney能控制并选择哪些内容被用于训练,这也意味着其有权且有能力排除迪士尼、环球影业受版权保护的作品。 在生成阶段,Midjourney可通过对特定提示词、图像的限制,避免生成某些受版权保护的内容,该公司已经对部分公众人物、暴力和不雅图像进行了限制,但并未对IP内容和形象采取相同的措施。 迪士尼和环球影业还试图论证Midjourney的行为构成故意侵权,并分享了向Midjourney发送的两封警告停止侵权行为的信函。这两封信函告知了侵权行为的存在,并明确了涉及的具体IP形象。根据美国相关法律,故意侵权行为的赔偿金额远超普通侵权,最高可判处15万美元的赔偿。 原告方总结道,Midjourney明知且实质性地促成了用户的侵权行为,并鼓励和诱导了这种侵权行为。如果没有Midjourney的故意设计,其图像服务将无法创建侵权内容。Midjourney在其网站展示了大量侵权图像,涉嫌故意利用原告的IP形象来吸引订阅用户,从而获取利润。 迪士尼和环球影业希望法院能发布初步和永久禁令,禁止Midjourney继续侵权,包括停止其图像服务和即将推出的视频服务,并要求赔偿原告的损失。 二、侵权诉讼只是起点,或倒逼AI企业坐上谈判桌 不过,法院禁令和一次性的经济赔偿对迪士尼与环球或许仅仅是一个开始,如何持续稳定地参与到生成式AI产业链条,并从中获利,可能是诉讼背后这些影视公司的另一大重要考量。 好莱坞影视公司并不反对生成式AI技术,相反,这些公司正在积极利用AI技术提升其制作效率与创意表现。今年奥斯卡颁奖典礼上,AI技术的广泛应用已成为业界和观众关注的焦点,多部提名和获奖影片都在制作过程中应用了AI技术。 获得最佳男主角等3项奖项的《粗野派》利用AI优化了主演的匈牙利语发音;获得最佳原创歌曲奖的歌舞片《艾米莉亚·佩雷斯》则通过AI进行声音克隆和调整,提升了角色表现力。此外,AI还被用于部分影片的虚拟换脸、视觉特效增强和场景渲染,提高了制作效率和视觉效果。 尤其值得注意的是,在好莱坞,迪士尼正是推动AI在影视制作中应用的重要力量之一。迪士尼研究院在视觉计算、机器学习和AI已有长达十几年的投入,在今年的计算机视觉顶级会议CVPR上,该研究院共有3篇论文被收录,分别涉及图像压缩扩散模型、视频外绘扩散模型、生成式变形图像等能给影视制作降本增效的技术。 ▲迪士尼研究院部分成果(图源:迪士尼研究院官网) 迪士尼总法律顾问奥拉西奥·古特雷斯(Horacio Gutierrez)也向外媒表达了类似观点:“我们看好AI技术的前景,也对如何负责任地利用它作为促进人类创造力的工具感到乐观。” 《华盛顿邮报》的评论文章认为,好莱坞的真正意图或许并非封杀生成式AI,而是要在产业红利中分得应有份额。 代表Midjourney等科技企业的中间派行业组织“进步联盟”政策专家亚当·艾斯格劳称,制片厂深谙AI的价值,用AI替代部分人工所能节省的巨额成本,好莱坞心知肚明,“这正是主流片厂此前始终按兵不动的重要原因”。 迪士尼和环球选择此时发难,一方面可能是因为业界对AI侵权问题的关注日益增强,另一方面则或与Midjourney即将推出的视频生成服务密切相关,该服务有可能更直接地侵犯其版权和相关权益。 好莱坞影视公司经常战略性地利用诉讼作为其版权和商标权保护和谈判的一种方式,有效地阻止侵权并加强对其知识产权的控制。 具体到这一案件,康奈尔大学数字信息法教授詹姆斯·格里梅尔曼(James Grimmelmann)向《华盛顿邮报》分析道,相比其他AI版权诉讼原告,迪士尼和环球的证据链更为扎实,掌握了用户利用Midjourney生成“小黄人”等IP角色的确凿证据。格里梅尔曼还认为,这场诉讼是“谈判桌上的首轮叫价”,其核心诉求为版权授权机制与内容过滤系统。 迪士尼和环球如果最终胜诉,将有可能倒逼其他AI企业主动坐上内容授权的谈判桌。 三、版权“达摩克利斯之剑”即将落下,AI创企还有翻盘机会吗? 版权问题一直是悬在诸多AI企业头上的“达摩克利斯之剑”,OpenAI、Runway等企业已经因版权问题陷入争议和法律纠纷。不过,法律风险并未让这些企业减缓新模型、新功能的发布,其中有不少生成的内容游走在侵权的灰色地带。 例如,GPT-4o生图功能官方演示并带火的吉卜力风格漫画转绘,已引发侵权争议。 ▲GPT-4o转绘的吉卜力风表情包(图源:X平台) 谷歌日前发布的Veo 3能毫无限制地生成诸多版权内容,也可能造成侵权。 ▲谷歌Veo 3生成的星球大战角色(图源:X平台) 在国内,类似涉嫌侵权的行为屡见不鲜。Labubu、哪吒等近期热度较高的IP形象,在国内部分图像、视频生成平台上可以自由生成和传播。 大部分国产AI图像生成工具也不会拒绝生成小黄人等海外IP形象。 在版权方和普通民众看来,这种对IP形象的复刻与侵权无异,但AI公司们有可能会引用版权法中的“合理使用(Fair Use)”概念来规避法律风险。 无论是中国还是美国的版权法,都为企业使用版权内容留下了一定空间。一般而言,部分地引用、借鉴版权内容并不会被判定为侵权,只有完整地复制、抄袭才面临侵权风险。 2004年,谷歌在中美两国法院均成功援引“合理使用”原则进行抗辩。在图书版权方指控其通过图书搜索和预览服务侵权受版权保护内容的系列案件中,谷歌赢得了部分胜诉。 OpenAI在其最近与《纽约时报》的诉讼中也引用了合理使用的概念,不过由于其生成的内容中包含与《纽约时报》报道原文高度雷同的段落,这一主张未获得法官的支持。目前此案仍在进行中。 其实,我国在AIGC侵权法律责任的判定方面走在全球前沿。2024年2月,广州互联网法院对全球范围内首例生成式AI侵犯他人著作权案件宣判。原告为“奥特曼”IP的被许可方,被告为一家提供文生图功能的AI企业。 ▲判决书截图(图源:垦丁律师事务所) 在用户要求被告公司的生图工具生成奥特曼的相关图片时,该工具生成的内容与原形象高度相似。法院认为,此类行为侵犯了原告对其作品的复制权与改编权,平台对此负有责任。 结语:AI碰上版权红线,合规框架或成刚需 近期,无论个人创作者还是头部版权方,都开始提高对AI侵权的法律维权力度。据媒体The Variety统计,仅在美国就有17起类似诉讼正在进行中。不过,由于AI复制品们在一定程度上也起到了扩大IP影响力的作用,有部分版权方会选择暂时不起诉。 对AI企业而言,版权风险终将影响企业的正常运营。去年,Runway AI在Hugging Face平台上上演的一处开源模型“删库跑路”大戏,正是由于他们使用了一个涉嫌侵权的图像数据库并陷入法律争议。对所有AI企业而言,建立合规的版权框架需要尽快提上日程。
正面刚 iPhone 17 的特朗普手机,还是离不开「中国制造」
美国梦? 中国制造 美国总统唐纳德·特朗普,宣布进军手机行业。 准确的来说,是特朗普家族集团要推出一台新的手机,名为 T1 Phone 8022(黄金版)现在已经开启预售,价格 499 美元(折合人民币约 3584.57 元)。 有意思的是,这台手机将于今年 9 月正式发售,也就是说,要和苹果 iPhone 17 正面交锋了。 作为一台「MAGA」手机,T1 当然宣称自己「自豪地在美国设计和制造」,一封官方邮件表示将在阿拉巴马州、佛罗里达州以及加利福尼亚州生产。 既然不能将 iPhone 拽回国内生产,那就自己出一台「美国制造」手机,特朗普的想法很美好,但现实真的能如这位美国总统所愿吗? 为美国人打造的「美国手机」 再来看看这款手机唯一一张产品图。手机的背面酷似 iPhone 16 Pro,摄像头模组内只有三颗间距略显任意的摄像头,却没见到闪光灯。硕大的「T1」logo 下方,则是充满信仰的星条旗剪影。通体金光闪闪,十足彰显了特朗普商界出身的富豪品位。 机身正面更是 Buff 叠满:大大的 Trump Mobile 字样,经典的「Make America Great Again」标语,只是星条旗下方疑似的指纹识别模块,没能对准中线,背面的摄像头好像也忘了要 P 上一颗闪光灯。 这种个人风格强烈的手机,自然给看惯苹果三星简约审美的老美带来了极大的震撼,却让中国网友们想起一位 10 年前的老朋友: 带有董明珠「一封信」的格力手机 除了这个图,官网还透露了 T1 手机的「详细」配置: 6.8 英寸 AMOLED 挖孔屏 120Hz 刷新率 5000 万像素主摄,200 万像素深度传感器,200 万像素微距镜头 1600 万像素前置摄像头 5000mAh 电池,20W PD 快速充电 USB-C 接口,支持 USB 2.0 协议 3.5 毫米耳机接口 屏下指纹传感器 + AI 人脸解锁 Android 15 系统 12GB RAM 256GB ROM,支持扩展存储卡 这个配置单可以说亮点满满:iPhone 16 标准版都没有的 120Hz 刷新率,比 iPhone 16 Pro Max 还大的电池,以及「外星科技」3.5 毫米耳机接口。而手机最重要的处理器只字不提,不禁让人更好奇和期待。 而以上就是这台手机现存的全部基本信息,官网目前真的就只有这一张连屏下指纹位置和闪光灯都没 P 好的「概念图」,以及这些和山寨机一样没有任何细节的参数列表,以及 499 美元的售价。 如果不是因为「特朗普」的这个招牌,那么这一切看起来都和一个骗局没啥两样,而现在,一切都像是这位不按常理出牌的现任美国总统,再一次和世界开了个玩笑。 「特朗普移动」不只造手机,还为「辛勤工作的美国人」,提供「价格合理、体现其价值观、质量可靠值得信赖」的无线运营商服务。 说好的「处理器 & 内存」,却只有内存 特朗普移动将联合美国三大运营商提供 5G 服务,主推「47」套餐,月费 47.45 美元。值得一提的是,唐纳德·特朗普本人分别是美国第 47 和 45 任总统。 这个套餐的内容也非常奢华,包含了无限的通话、短信和流量(前 20GB 高速流量),附赠 24 小时道路救援,还能免费拨打 100 多个国家的国际电话,没有合同可以随时取消。 类似国内的「米粉卡」和「大王卡」,特朗普移动其实只是一种「虚拟网络运营商」,用的其实还是美国通信「御三家」AT&T、Verizon 和 T-Mobile 的服务。 Apple Insider 则认为,这个套餐的细节也含糊其辞,收费也较高,「无限流量」和其他服务看起来更像是在画饼。 如果说「特朗普移动」还有商业上的可行性,那么「特朗普手机 T1」就可能完全是一场骗局了,事实上,这台写满「MAGA」的爱国手机,背地里很可能还是中国制造。 美利坚爱国手机,中国造? 粗制滥造的 P 图,语焉不详的配置列表,一切都在强烈暗示着,这台手机还只是一个幻想,甚至可能没有一台样机。 我们已经在四月进行了详尽分析,要想实现特朗普「美国制造 iPhone」的想法,需要花费数十亿美元和几年的时间,并且生产出来的 iPhone 成本将是现在的数倍。 原因很简单,一台智能手机的原材料和部件供应链遍布全球,而美国连电池中的钴和锂都炼不出来,各种技术和人力成本会直接毁灭 iPhone 傲人的高利润率。 提到「全美产」手机那自然绕不开 Liberty Phone,这台爱国者手机标榜「全部来自美国电子厂的安全供应链」,配置性能极其落后,并且还是有不少零部件来自中国和越南采购,售价 2000 美元,可以买两台 iPhone 16 Pro。 而在部分参数上甚至超越了 iPhone 的特朗普手机 T1,价格仅售 499 美元。 就目前 T1 给出的配置列表来说,其中最高端的零部件就是这块尺寸堪比 iPhone 16 Pro Max 的 6.8 英寸 AMOLED 屏幕,而美国本土基本没有生产 OLED 的先进技术和产业链。 类似的,虽然可以预料到 T1 不会配备一颗先进的摄像头,但里面的 CMOS 传感器,也大概率需要进口。 如果 T1 真的要完全美国制造,并且按时在 3 个月后交付,还只卖这个良心价格,恐怕需要总统特朗普举国之力才能实现了。 实际上,特朗普集团自己也没把话说太死,还是保留了一些余地,发言人特朗普次子埃里克·特朗普称「(T1 手机)最终都可以在美国制造」,言下之意就是,初期 T1 还是一台「全球化手机」。 T1 手机这些即视感满满的配置和设计,让美国网友和行业专家都一致认为,这很可能只是一台「贴牌手机」,并且很可能贴的还是中国制造的 ODM 手机,也就是专门做来贴牌的公版手机,再通俗点说,很多都成了国内的「山寨机」。 这样的推测一出街,媒体和网友纷纷开始在 Amazon 搜寻 T1 手机的真身,最终锁定在了国内立讯精密闻泰科技出品的 Revvl 7 Pro 和道格 DOOGEE Note 58,以及其他几台国产低端手机上。 值得一提的是,这些低端手机电商价格都在 150 美元左右,最高不会超过 200 美元,也就是说如果 T1 手机真的是这些手机贴牌而成,那特朗普集团能从中赚取巨额的利润。 对于大洋彼岸隔岸观火的我们来说,其实不用过于担心 T1 手机真的会导致相关产业链回流美国本土,从而冲击我们本土的制造业,因为这本质上是对规律的违背,破坏美国在全球化阶段形成的成熟商业模式,即将低附加值的制造工序转移海外,利用劳动力价差来赚取足够高的利润率。 就目前的情况来看,特朗普 T1 手机其实离科技数码很远,甚至也和地缘政治也没太大关系,更像是一门算盘珠子打到人脸上的生意,主要面向的人群,就是那一部分对 MAGA 深信不疑,同时出身比较底层的美国群众,他们学历不高,见识也不多,更不可能了解一台手机背后错综复杂的供应链问题。 那个抽象的产品图就像一个筛选受众的「门槛」,也是这台手机的缩影:只卖给那些愚昧到会相信它的人。 别看一个人怎么说,更应该看他怎么做。我相信,即使这台手机能真正问世,特朗普本人可能也只会用它摆拍几张,最终他手里在用的,还会是一台 iPhone。 *封面图源:Fast Company
苹果折叠屏,这次真要来了
从2019年开始,苹果计划生产折叠屏手机的消息就开始在市场上流传。 ​​2019年5月30日​​,美国专利商标局授予苹果一项可折叠屏幕专利,该专利描述了一种柔性显示屏和保护层的设计,适用于iPhone或其他设备。同时,​​有观点认为,苹果最早可能在​​2020年底或2021年初​​推出可折叠屏手机。 之后的6年时间里,苹果折叠屏的有关消息时有出现,但量产时间表依然不明。 比如,2020年底​​,有报道称苹果将折叠屏部件样品送往富士康进行测试,包括超过10万次的折叠测试,并通过了组装质量控制检查。同期,供应链消息称苹果已启动折叠屏iPhone的研发,但进展缓慢,主要因技术难题(如铰链耐用性、屏幕折痕等)。 2021年​​,苹果曾探索两种折叠形态:类似微软Surface Duo的双屏连接设计,以及三星Galaxy Z Flip的翻盖式小折叠方案,但均未进入量产阶段。此后数年,苹果持续申请多项折叠屏专利,包括​​双螺旋铰链​​、​​碳纤维支架​​、​​UTG超薄玻璃​​等,并与三星合作优化屏幕技术。 而在此期间,包括华为、小米、三星等几乎所有的主流安卓手机厂商,都发布了一代又一代折叠屏手机,并已成为直板机之外的主流手机产品。 直到2025年6月,苹果折叠屏手机终于迎来了明确的量产进展。 据苹果知名分析师郭明錤爆料,苹果供应商鸿海精密(富士康)预计将于2025年第三季度末或第四季度初正式开始生产“折叠屏iPhone”。 不过,许多组件规格(包括备受市场关注的铰链轴承)尚未最终确定。目前已经确定的一个部件是,该设备的可折叠显示屏,这将由三星负责提供。目前,三星计划明年为这款设备生产700万至800万块可折叠面板。 郭明錤还指出,最近市场传闻称苹果已订购1500-2000万部“折叠屏iPhone”,但根据其基于对多个组件的了解,“这一数量可能反映了产品2-3年生命周期内的累积需求,而不仅仅是2026年”。 “这表明,预计将于2026年下半年投入批量生产的苹果折叠屏iPhone,可能会在2027年和2028年每年出货数百万部。”郭明錤补充称。 而在手机折叠形态上,苹果的首款折叠设备将采用类似书本的“左右对开”设计,而非上下翻折的“小折叠”形态。 折叠时外屏约5.5英寸,展开后内屏7.8英寸,采用类似三星Galaxy Fold的对折设计,展开后厚度仅4.5毫米,折叠后9-9.5毫米。屏幕由三星显示独家供应,采用UTG超薄玻璃(透光率超90%),并应用苹果专利的“动态张力系统”和填充聚合物技术,实现“几乎无折痕”效果。 折叠屏的核心零部件铰链创新上,苹果的专利显示采用“双螺旋铰链”和反向转轴设计,减少应力集中,提升耐用性。混合钛合金与碳纤维材料,支持20万次弯折测试,结合液态金属和自研零感折痕技术,折痕深度控制在0.1毫米级。 因结构限制,苹果大概率会取消Face ID,改用侧边集成Touch ID指纹识别。售价方面,苹果的折叠屏手机预计售价​​2000-2500美元​​(约1.44万-1.79万元人民币),是苹果史上最贵机型之一。 从各类零部件的性能参数来看,苹果的折叠屏手机与目前在售机型相比,基本没有太明显的优势。而从量产时间来看,苹果则已经落后市场太多。 市场调研机构最新报告显示,2024年中国折叠屏手机出货量达917万台,同比激增30.8%。其中,华为以51.29%的市场份额稳居榜首,荣耀、vivo、三星、小米紧随其后。 值得注意的是,华为已连续第五年领跑中国折叠屏手机市场。 过去五年间,尽管赛道玩家不断涌入、技术参数竞争白热化,华为仍保持年均50.3%的市占率。据行业消息,2025年以来华为折叠屏市场份额进一步攀升至73%,技术壁垒与生态建设持续扩大领先优势。 全球范围内来看,中国也是全球最大的折叠屏手机市场,贡献了全球出货量的一半以上。 2024年全球折叠屏手机销量约为1600万台,相比2023年增长了2.9%。2024年第四季度,全球折叠屏手机出货量为380万部,同比下降18%。华为在2024年第四季度超越三星,以31.2%的市场份额成为折叠屏手机市场的领导者。 所以,苹果的折叠屏手机面临的市场状况与AI几乎一致——落后于行业之后的战略防守。 自从 OpenAI的ChatGPT于2022年引起公众关注以来,科技公司一直在竞相使用生成人工智能来添加更多功能。 去年,苹果发布了Apple Intelligence,展示了它所谓的“为我们其他人打造的人工智能”。这项技术可以帮助总结文本、创建原始图像,并承诺检索最相关的数据。 但迄今为止,Apple Intelligence出现了一系列漏洞和延迟,而竞争对手仍在不断追赶。苹果通过与 OpenAI 合作,成功填补了产品线的空白,但其承诺的一些重大升级,例如全面改进的 Siri 语音助手,仍悬而未决。在6月份的全球开发者大会上,苹果几乎没有在Siri和AI上投入太多精力,而是专注于操作系统的设计改进。 同样,苹果的折叠屏手机也面临着类似尴尬处境。 在基本形态和硬件供应链都已经固定的情况下,苹果折叠屏想要在这种防守中突围,很大程度将取决于苹果能将折叠屏的软件体验做到何种程度。而后者,又与Apple Intelligence的成熟度息息相关。 如果Apple Intelligence迟迟难以完成优化,苹果折叠屏又做不到更惊艳的硬件突破,那消费者将很难为其折叠屏高昂的售价买单。(本文首发于钛媒体APP,作者| 饶翔宇 编辑 | 钟毅
Marshall Kilburn III 体验:50 小时超长续航,在便携音箱属性下的一次踏实升级
这两年来,Marshall 似乎都将更新的重点放在耳机上。 ▲ Marshall Major V ▲ Marshall Monitor II 像是提升了舒适度和续航的贴耳头戴 Major V,还有续航变强的同时也增加了 SOUNDSTAGE 环绕音效的 Monitor III,还有在保持原有紧凑设计的基础上再增加了一点点播放时长的 Emberton III,这三款都是 2024-2025 年度的 Marshall 重点新品。 对,相信你也看出来了。现在的 Marshall,已经把「续航」作为一个重要的更新点。 最近,他们推出了 Kilburn 系列的第三代 产品,就是一款结合和 Marshall 经典的手提设计,主打长续航和注重 Marshall 招牌声音表现的产品。 包装是标准的 Marshall 模式,带手提的硬纸皮包装盒里面装有分开上下两层的纸皮固定结构,结构上层装有说明书和附属的 USB-C to C 充电线。 双层固定结构下,音箱外层还有海绵纸包裹,确保在运输的过程中不会划伤音箱本体。 Kilburn III 造型设计是 Marshall 的经典模式,机身的上侧和左右两侧都有带荔枝皮纹理的物料包裹,正面是黑色滤声网配金色 Marshall 手写体 Logo 的标志性组合。 为了满足 360° 环绕音效的设计,机身后侧也有 3/4 的位置是被滤声网占据。滤声网的左下方有专门为音箱做得导声孔,右侧则是充放电用的 USB-C 口和 3.5mm AUX 口。 来到音箱的控制面板部分,Kilburn III 的面板设置很丰富,有调整音量、高低频输出的三个旋钮,旋钮旁边有常亮的指示灯显示当前状态。 旋钮左侧有模式切换用的 M 键和蓝牙按键,控制播放和电源开关拨杆则放在了操控区域的两端。 开关虽然用了 Marshall 传统音箱的拨杆造型,但本质上都还是带弹性的摇杆结构。如果可以做成更传统的开关摇杆结构,手感更好也会更耐用。 Kilburn III 这里的设计模式和其他 Marshall 便携式音箱相同,都是把音频接口放在后侧,而不是放到上侧的面板里,不然配上黑色的弹簧 AUX 线,看起来会更有 Marshall 的味道。 提到 Kilburn 系列,自然也少不了它的提手。 提手外侧是荔枝纹理的皮质,内侧就加上了绒布处理,边缘有一定的硬度,整体相对柔软,用来提起这个 2.8kg 的「小音箱」也很合适,拿着走并不会觉得很累。 作为有提手的 Marshall 音箱,Kilburn 在 Tufton 系列这些大哥面前还真的只能算的是小音箱。 273mm x 150mm x 169mm 的机身尺寸也就比常规的邮差包稍大一点,2.8kg 的重量感觉是达到了手提移动舒适度的极限。机身支持 IP54 防水防尘,假日如果想要拿它到户外感受大自然,或者做一些简单的室外小活动,只要是公共交通可以到的地方,并且不需要太长时间的步行,都是 Kilburn III 的适用范围。 当然,你如果本来就是驾车一族,那长时间把 Kilburn III 放在后备箱也很合适。 但如果是在长距离的登高活动,又或者是只能步行才能到的地方,那选 Middleton 和可以多台连接的 Emberton 系列会更合适。 连接性能方面, Kilburn III 支持蓝牙版本从 II 代的 5.0 升级到 5.3,并支持 Auracast 技术。但上一代支持的 aptX 传输编码,这次就没有加入进来了。 考虑到 Marshall 的声音风格,以及大部分时间都主打在共享声音内容和提供氛围音乐的活动场景,声音传输规格升级带来的细节提升对于 Kilburn III 似乎不那么重要。基本上,听流媒体和看视频时用到 AAC 其实已经足够了,这里没有 aptX 的影响并不大。 机身的三款旋钮都采用了无级设计,周边的灯带可以更细致地看到目前调整的音量和高低频输出。搭配 Marshall app,用户可以将目前的输出模式记录预设模式,然后透过短按 M 键快速切换。 续航方面,Kilburn III 能够实现约 50 小时的播放,比只能播放 20 小时的 Kilburn II 要长一倍有多。更长的续航,拿到户外进行大音量播放页不需要担心了。 机身背后的 USB-C 口同样支持 30W 的 PD 通用快充,充电 20 分钟则可以播放 8 小时,整机充满大约是 3 小时。在户外不够电的话,则能够用支持 PD 的移动电源就可以供电。 此外,Kilburn III 同样支持反向供电,可以简单给手机、手表和耳机充个电。 充电口旁边是 3.5mm AUX 音频接口,面对没有蓝牙的老设备,用户可以通过另购一根 3.5-3.5 的音频线连接播放。 只不过,Kilburn III 开机时会优先连接蓝牙,如果你想切换到有线模式,那用之前最好就先把周边无线连接过的设备都先断开。这个设计在 Marshall 的便携式音箱,像是 Middleton 这一类产品里面一直都存在,要是之后能提供一个模式切换的开关按钮,用起来会更加舒服。 声音的部分,Kilburn III 搭载了 2 个 2 英寸全频单元搭配 1 个 4 英寸低音单元的 2+1 三单元组合,全频单元由 2 个 10 瓦的 Class D 放大器驱动,低音单元则由 1 个 30W 的 Class D 放大器驱动。 箱体加入了低音反射式设计,所以我们在机身后侧的左下角看到低音反射孔。 外观的部分也提到,Kilburn III 采用了无盲区的立体声布局,前后都设有滤声网,都是能够发声的设计。所以在家中摆放的时候还是要注意,最好不要离墙太近,以免影响声音。 听感方面,Kilburn III 还是 Marshall 音箱很熟悉的感觉,低频能量感很足,极具冲击力。底部四个带防滑垫的脚给音箱足够的稳定性,听摇滚时足够震撼,歌手和背景之间预留出距离,不会粘合在一起。有些时候,人声的位置还可以再靠前一点,有种主唱靠近你贴脸输出的感觉。 听相对温和,但鼓点带出强节奏感的流行曲时,低频饱满的 Kilburn III 很容易就能够让听者感觉得声音变厚。每一下都铿锵有力的低频加持下,听感也变得再饱满厚实一点。 不过,有些时候低频的输出会太过于主导,给人一种抢戏的感觉,听起来不那么平衡。 另外,Kilburn III 的声音表现也不太适合在小空间里面做低音量播放,空旷的户外和能吃得住这能量的室内空间才是它能发挥的场地。 如果你把它当做书房小音箱,夜间小小声欣赏一下音乐,那未必能够听出它的实力。多带它走到户外,或者投入到在亲朋好友的聚会中,才是它发光发热的地方。 整体来说,Kilburn III 还是一款非常 Marshall 的常规升级产品。 造型上,经典的黑色滤声网搭配金色手写体 Marshall 字体,还有金色面板上附带三大旋钮和拨杆造型的开关,这看起来就很经典很 Marshall。 如果配件里面能够附带一条 3.5mm 弹簧线,又或者把开关设计成真拨杆的同时讲 3.5mm 接口转移到面板上,这会让 Kilburn III 的传统 Marshall 味更浓。 机身精致,放在家中也是一件兼顾好看和兼顾个人声音偏好的摆设。 方便移动的机身搭配相对轻巧的重量,还有 IP54 防水防尘机身和能量满满的声音输出加上不需要担心的续航,让 Kilburn III 拥有了走出去的灵活。 加上前些年精致的户外活动和露营文化的影响,我会觉得这才是 Kilburn III 的主力场景。 定价方面,Marshall Kilburn III 国行售价为 2899 元,目前已经上线。
3B挑战70B!月之暗面Kimi-VL新版开源:数学、视频等多项指标超越GPT-4o
作者 | 李水青 编辑 | 心缘 智东西6月23日报道,月之暗面今日开源多模态模型Kimi-VL-A3B-Thinking-2506,这是其首个开源多模态推理模型Kimi-VL-A3B-Thinking发布两个月后的更新版本,可凭借2.8B激活参数(16B总参数)在多项测评中超越GPT-4o、Qwen2.5-VL-7B等模型。 ▲Hugging Face截图 与之前的版本相比,2506版本提供了多项全新或改进的功能: 1、它在消耗更少tokens的同时思考得更聪明:2506版本在多模态推理基准上达到了更好的准确率:MathVision上得分为56.9(+20.1),MathVista上为80.1(+8.4),MMMU-Pro上为46.3(+3.2),MMMU上为64.0(+2.1),而平均需要减少20%的思考长度。 2、思考过程更清楚可见:与之前的思考版本不同,2506版本在一般的视觉感知和理解上也能达到相同甚至更好的能力,例如MMBench-EN-v1.1(84.4)、MMStar(70.4)、RealWorldQA(70.0)、MMVet(78.4),超越或匹配其非思考模型(Kimi-VL-A3B-Instruct)的能力。 3、扩展至视频场景:2506版本在视频推理和理解基准方面也有显著提升。它在VideoMMMU上为开源模型刷新记录(65.2),同时在通用视频理解方面也保持了良好的性能,在Video-MME上达到71.9,与Kimi-VL-A3B-Instruct相当。 4、分辨率进一步提升:2506版本支持单张图像320万像素(1792×1792),比上一版本提升了4倍。这在高分辨率感知和OS-agent基准测试中带来了显著提升:在V* Benchmark(未使用额外工具)上得分为83.2,在ScreenSpot-Pro上得分为52.8,在OSWorld-G上得分为52.5。 具体来看,与业界顶尖模型和Kimi-VL的两个先前版本的比较,2506版本测试性能明显提升: 在通用多模态方面,2506版本在MMBench-EN-v1.1(Acc)、OCRBench(Acc)、MMStar(Acc)、MMVet(Acc)多项测评的得分超过OpenAI的GPT-4o。 在推理能力方面,2506版本在MMMU(val,Pass@1)、MMMU-Pro(Pass@1)上的测试成绩超过Qwen2.5-VL-7B、Gemma3-12B-IT,不如GPT-4o,但差距有所缩小。 在数学能力方面,2506版本在MATH-Vision(Pass@1)、MathVista_MINI(Pass@1)中得分大超GPT-4o。 在视频能力方面,2506版本在VideoMMMU(Pass@1)、MMVU(Pass@1)、Video-MME(w/sub.)多项测评中超过Qwen2.5-VL-7B、Gemma3-12B-IT,与GPT-4o的差距缩小。 在Agent落地方面,2506版本在ScreenSpot-Pro(Acc)、ScreenSpot-V2(Acc)、OSWorld-G(Acc)测试中得分都超越Qwen2.5-VL-7B。 在长文本方面,2506版本在MMLongBench-DOC(Acc)测试中超越Qwen2.5-VL-7B,与GPT-4o接近。 如下图所示,与30-70B的开源模型对比,2506版本的大部分测试已经超越Qwen2.5-VL-32B、Gemma3-27B-IT,看齐Qwen2.5-VL-72B。 来源:Hugging Face
一场没有“罗永浩”的直播,为百度AI正名
作者 | Yoky 邮箱 | yokyliu@pingwest.com 5500万GMV,这可能是迄今为止,一个AI数字人单次直播带来的最高销量。 过去几年内,数字人直播代替真人主播的传言总是一波又一波,空无一人的直播基地无数手机屏幕“自动地”产生着GMV,这个画面曾经击中了无数网友的心。但现实是,这些数字人们机械重复的动作、无法随机应变的话术反而让真人主播们都松了一口气。 但这次,真正的转折点来了。6月15日,罗永浩数字人在百度直播的第一次亮相,连播近7小时,达成了1300万人次观看、GMV突破5500万的成绩,不仅破了AI数字人圈里的记录,甚至超过了真人的记录——互动量超真人直播间3倍。 一直以来,数字人技术成熟度的一个核心评判标准,都是与真人主是否存在差距,以及有多大的差距。而在此次的直播间,弹幕里“这是真的还是假的”的评论不断刷屏,已经证实了这次AI数字人的惊人效果。 更重要的是,这不是一次炫技式的表演,而是百度AI在真实商业环境的实战演练。当整个行业还在为文生视频的“确定性” ,百度已经用AI为商家和创作者们端起了第一个能真正“养活”自己的“饭碗”。 如何用AI炼成“真”罗永浩? 这背后并非单一模型的技术突破,而是一套多模协同的数字人技术。简单来说,这套技术将语言大模型置于“总导演”的位置,统筹指挥着语音、视觉等各个“演员”,完成了一场几乎以假乱真的演出。 与传统数字人技术形成鲜明对比的是,过去的方案往往采用语言、语音、视觉三条独立流水线,各自生成内容后再强行拼接,这必然导致音画不同步、表情僵硬、言语乏味等问题。 百度的技术方案重点包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成五项创新技术,实现了数字人“神、形、音、容、话”的高度统一。最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。 具体而言,“剧本”模型扮演了总指挥的角色。它在生成时输入的并非只有文本,而是包含商品信息、历史视频、主播人设要求等多模态信息。剧本会生成对视觉和语音的具体要求,即所谓的“标签”,为后续的视觉和语音模型提供方向性指引,从而确保内容、语气和表情在语义上的高度一致性。 百度集团副总裁吴甜告诉硅星人,多模态协同的难点在于多个模型对于要求的理解是一致的。这意味着从剧本(导演)到语音、视觉(演员),整个团队对表演基调有统一认知。同时,各个演员(各模态模型)又保有自己的“发挥空间”,比如语音模型会根据自身对文本的细粒度理解调整语调顿挫,而不是完全被剧本的词语锁死。 以罗永浩数字人剧本为例,基于文心大模型4.5 Turbo生成的剧本,充分展现了主播的个人特色,具备典型的罗氏幽默风格,并能够实现双人主播的内容协同,动态实现丰富的实时互动。 在单体完成“真老罗”的打造后,体现直播生命力的实时互动成为另一个更关键的挑战。面对评论区海量、无序的用户提问,以及与助播的配合上,数字人如何做到实时、自然的回应?这背后是一套动态决策系统。 在直播过程中,模型并非对每个问题都立即回复。系统会对评论区进行智能分析,结合主播当前的讲解节奏,选择合适的时机、合适的问题,以及合适的回答策略进行触发。这种“谋定而后动”的机制,远比简单的“一问一答”更接近真人主播的互动逻辑。 为了彻底解决实时生成的延迟问题,百度采用了“流式生成”的工程化设计。语言、语音、视觉三个模态并非串行等待,而是像流水线一样并行工作,极大缩短了用户感知的时延。同时,系统采用“离在线统一”的方法,部分可预见的交互内容可以提前处理,而需要即时反应的部分则在线动态生成。通过系统性优化,成功解决了生成视频这类高耗时任务的卡点问题,最终实现了丝滑的交互体验。 更进一步地,在双人直播中,大量的打断、复说、抢话等场景对语音合成提出了极高要求。吴甜提到,通过引入“对话上下文解码器”,模型能够结合历史对话信息进行推理,从而实现老搭档之间那种默契、自然的对话流。 在数字人形象生成以及驱动方面,百度通过结合多模态视频理解、跨模态信号生成、视频生成等技术,克服了高可控交互,高精度、长时间一致性保持等难点,实现了高一致性超拟真罗永浩数字人长视频生成。 而且在此过程中,能保证语音、口型、表情与动作始终保持高度同步,从而实现真正的「音、容、话」一致。 从炼成“罗氏幽默”到跑通商业闭环,百度数字人不仅为行业树立了新的技术标杆,更重要的是,它为AI技术如何从“热搜”走向真实的生产线,提供了一份极具说服力的答卷。 不要“超级应用”,要“超级有用” 对于在直播电商红海中拼杀的千万商家而言,现实的挑战正变得愈发尖锐:头部主播签约费动辄千万,自建团队每月固定开销数万甚至数十万,而流量获取成本却在持续攀升。在这种环境下,如何在保证效果的前提下控制成本,成为每个商家必须面对的生存课题。 数字人技术,一度被视为破局的希望。然而,早期的数字人更像是一个“不知疲倦的播报员”,形象呆板、互动生硬,无法传递信任,更遑论激发购买欲。它们解决了“有没有”的问题,却没能解决“好不好用”的核心痛点。市场真正需要的,不是一个仅仅能节省成本的“工具”,而是一个能真正替代真人、创造价值的“战力”。 那么,一个“真正可用”的数字人到底意味着什么?它不仅要形象逼真,更要具备三项核心能力:能理解商品、能与人互动、能建立信任。罗永浩数字人直播的案例,恰恰为这三点提供了行业标尺。它不再是简单的产品复读机,而是能用“罗氏幽默”与观众调侃,能根据实时提问调整讲解策略,最终实现了与真人主播几乎无异的带货效果。 从商业角度审视,这背后反映的是两笔关键账目的变化: 第一笔是成本账。数据显示,数字人直播能平均降低约80%的成本。这意味着商家可以将过去投入在昂贵主播身上的预算,转移到供应链优化和市场推广上,彻底重构成本结构。千元级别的投入,就能获得一个7x24小时在线的主播,这在过去是不可想象的。 第二笔是效率账。在保健品、教育、旅游等需要深度讲解的品类上,知识储备无限、表达精准无误的数字人,其转化效率已开始超越真人。对于拥有好产品但缺乏优秀主播的商家,或是不希望核心名师被直播消耗的教育机构而言,数字人代表着一条全新的增长路径。 “好用”的数字人并非凭空而来,它的出现反映了不同公司在技术路径上的战略分化。当我们从市场应用效果反推其背后的技术逻辑时,百度的选择便清晰地浮现出来。 当前行业的主流叙事集中在卷模型,各家比拼参数规模和基准测试成绩。而百度的路径更偏向卷应用,这一选择的底气源于其在多模态技术上的长期积累。 这种“应用为王”的战略,最终指向的是生产力的规模化落地。复刻罗永浩更多是技术天花板的展示,其真正的商业价值在于将这种能力以低门槛、可复制的方式赋能给广大中小商家。百度电商总经理平晓黎在接受采访时表示,相比追逐头部IP,更倾向于“让更多的中小商家、腰部商家,还有创作达人能够做起来”。 更关键的是,这条路径验证了AI产业期待已久的商业闭环。从行业发展的角度看,罗永浩数字人直播的意义远超一场带货本身。它为AI产业提供了一个清晰的价值验证:技术的最终价值必须通过为实体经济创造可度量的商业成功来检验。这种“超级有用”的路径,或许比追逐“超级应用”的概念更具现实意义。当然,这种模式能否被广泛复制,以及在更多垂直领域的适用性,仍需要市场的进一步检验。
千亿巨头AI子公司赴港IPO:卖智能装备,年入174亿
作者 | 陈骏达 编辑 | 心缘 智东西6月23日报道,6月20日,中国智慧农业龙头潍柴雷沃向港交所提交上市申请,独家保荐人为中金公司。 潍柴雷沃的前身山东福田重工成立于2004年,注册地为山东省潍坊市,注册资本约为1.15亿元。2022年8月,潍柴雷沃更名为现有名称,同年9月,潍柴雷沃在中金公司的保荐下向深交所提交上市申请,但在2024年4月主动撤回了上市申请。 港股招股书显示,潍柴雷沃在中国的农机装备市场、智能农机市场、智能拖拉机市场、智能收获机械市场均位列全国第一,并打造了一套涵盖农业生产全周期的智慧农业整体解决方案,融合了成套智能农机装备与智慧农业服务。2024年,潍柴雷沃的营收达到173.9亿元,同比增长18.5%;同期其经调整净利润为9.8亿元,同比增长12.1%。 其高端化、智能化的农机装备主要解决了“谁来种地”的问题;而结合IoT、AI、大数据技术的智慧农业服务,则助力企业实现“科学种地”。 目前,潍柴雷沃尚未披露其计划募资额,该公司计划将所募集资金用于建设高端农机装备生产基地、生产线智能化升级、智能农机和智慧农业解决方案研发及海外业务拓展等用途。 一、年入百亿、毛利率约13%,中国市场营收占比超9成 智能农机是指融合AI、远程通讯、大数据、云计算、传感器、自动控制等现代信息技术与农业机械装备技术,实现农业生产过程自动化、精准化、智能化的新型农业机械系统。 智能农机显著提升农业生产效率、降低资源消耗、减少人力成本,有望帮助解决中国农业劳动力不足、人工老龄化问题突出、农业经营模式落后等问题。 2022年-2024年,潍柴雷沃的营收分别为159.5亿元、146.8亿元和173.9亿元,同期,其年度利润为7.7亿元、8.7亿元和9.6亿元。2023年,潍柴雷沃的营收同比下降,这与2023年排放标准变化引发的短期需求下滑有关。 ▲潍柴雷沃2022年-2024年营收、年度利润和研发费用变化(智东西制图) 2022年-2024年,潍柴雷沃的研发开支分别为5.7亿元、6.8亿元和8.4亿元,分别占同年度营收的3.6%、4.6%和4.8%,占比逐年扩大。 潍柴雷沃目前已经向全球超过120个国家和地区的客户提供了产品与解决方案,按地理区域划分,海外市场在其营收中的占比正逐年提升,2024年占比已超10%,海外业务收入CAGR(复合年均增长率)超过30.0%。但中国市场仍是其主要市场,占同期营收的比重超9成。 材料成本是潍柴雷沃最大的成本项之一,2022年-2024年,其材料成本分别为125.3亿元、115.8亿元和127.6亿元,占当年度总销售成本89.2%、91%和91.2%。 2022年-2024年,潍柴雷沃的毛利分别为19.1亿元、1.94亿元和23.0亿元,同期毛利率分别为12.0%、13.2%及13.2%。按产品类别来看,潍柴雷沃各个产品线的毛利整体呈增长趋势,农机销售的整体毛利率从2022年的13%增长至13.2%,与业内其他可比企业的毛利率处于同一水平。 二、研发团队规模业内最大,拥有近2500项专利 目前,潍柴雷沃的智能农机设备已经覆盖耕整、种植、田间管理、收获、秸秆处理与粮食烘干等现代农业生产的各个环节,能够满足客户针对不同作物、不同农艺、不同工况和不同规模的应用场景需求。 与此同时,其智慧农业整体解决方案实现将经验与数据转换为自动化、精准化的田间作业指令,赋能各类智能农机装备协同作业,提供高效、科学的农业生产解决方案。 报告期内,潍柴雷沃持续投入上述两大领域的研发,具体研发领域包括农机装备智能化升级、拓展新能源领域、分阶段研发农业机器人、系统升级驱动智慧农业效能升级等。 招股书显示,截至2024年末,潍柴雷沃拥有行业内规模最大的研发团队,总人数超过2500人,硕士及以上学历占比33.5%。该公司构建了“中国+日本+欧洲”全球协同研发体系,以潍坊研发总部为基础,充分利用欧洲、日本等重点区域全球技术资源。 产学研合作方面,潍柴雷沃与中国科学院、中国农业大学等50余家科研机构,以及罗锡文、赵春江院士等顶尖行业专家建立合作,共同承担了110余项国家、省部级重点项目,突破多项行业技术关键技术。 截至2024年末,潍柴雷沃已在中国大陆已取得2443项专利,其中包括1905项实用新型专利、168项发明专利及370项外观设计专利;其在中国大陆以外亦持有49项专利,还主导和参与了26项国家标准、18项行业标准和56项协会标准的制定。 三、客户集中度较低,山东重工为主要供应商 潍柴雷沃能提供高端化、智能化的成套农机产品,拥有涵盖不同马力区间、不同技术路线的拖拉机、收获机械和农机具。 截至2025年4月30日,潍柴雷沃已在20多个省市落地60多个智慧农场项目,服务超2万家种植户。其智慧农业管理平台用户累计超3.74万人次,服务土地面积超800万亩,覆盖全国31个省份,其中500亩以上的大客户超过600家。 潍柴雷沃主要将产品销售给经销商合作伙伴和直接销售客户,后者主要包括农业企业。2022年-2024年,来自其前五大客户的销售收入分别占其当年度总营收的5.5%、6.0%和5.2%,而同期来自其最大客户的销售收入分别占总营收的1.1%、1.4%和1.3%,客户集中度较低。 潍柴雷沃的供应商主要包括原材料、零部件和组件以及车辆发动机的供应商。2022年-2024年,该公司从前五大供应商的采购金额分别占同期总采购金额的22.6%、27.0%和28.7%。同期最大供应商的采购金额分别占总采购金额的10.0%、16.6%和19.3%。报告期内,其最大供应商均为山东重工集团。 四、山东重工为实控人与控股股东,高管均为行业老兵 以下为潍柴雷沃的股权架构图: 山东重工通过潍柴动力和潍柴控股分别持有潍柴雷沃61.10%和27.26%的股权。山东重工合计有权控制潍柴雷沃约88.36%的投票权,为潍柴雷沃的实际控制人和控股股东。潍柴雷沃其他主要股东包括中央企业基金、欠发达地区基金等。 潍柴雷沃的法定代表人为该公司董事长、总经理、执行董事王桂民,于2008年9月加入潍柴雷沃,先后担任多个关键职位,包括执行总裁和总经理。自2024年12月起,王桂民担任潍柴雷沃董事长。 加入潍柴雷沃前,王桂民曾于1991年-2008年在北汽福田长期任职,最高职务为北汽福田总经理助理。王桂民拥有山东理工大学汽车及拖拉机工程学士学位、大连理工大学动力工程硕士学位和江苏大学管理科学与工程博士学位。 潍柴雷沃执行董事兼总经理王健于2024年12月加入该公司,此前他在潍柴动力长期任职,曾担任总质量师和副总工程师等职务。王健拥有武汉理工大学机械工程与自动化学士学位和天津大学机械工程硕士学位。 潍柴雷沃执行董事、财务总监兼董事会秘书王俊伟于2021年9月加入该公司,他此前也长期在潍柴动力任职,并曾担任上市企业山推工程机械股份有限公司的副总经理与财务总监。 2022年-2024年,潍柴雷沃的高管、董事和监事以薪金、花红、股份等形式,分别领取了241万、250万和279万的薪酬。 结语:智慧农业市场迎来发展机遇期 AI技术正快速渗透至农业、传统制造业等行业,助力产业升级。随着AI技术的不断成熟、高标准农田建设推进、土地规模化经营加速及“优机优补”政策实施,智慧农业市场或将迎来发展机遇期。 智慧农业正从 “经验驱动” 转向 “数据驱动”,以智能农机为基础,融合生物技术、信息技术、AI、大数据技术等,实现农业生产全过程的数字化感知、智能化决策、精准作业和智慧化管理。 作为业内龙头企业,潍柴雷沃有望通过在智能农机和智慧农业领域的技术研发、产品创新和市场拓展,成为行业发展的重要推动者。
制糖工厂发布硬糖® C³ 多口智能充电头,以超小体积实现高功率与智能调度的全面突破
广州,2025 年 6 月 18 日 制糖工厂今日正式发布全新 硬糖®充电头 C³(68W,3 个USB-C 端口 ),一款兼顾体积、功率与智能调度的全 C 口充电器,它首次搭载 TimiC(Timing intelligent Charge)时序调度充电方案,实现比传统「拔插时智能分配」更智能、更高效的功率调度体验。 兼顾体积、功率与智能调度的充电头最优选 硬糖 C³ 延续制糖工厂一贯的设计美学,外观精致、质感考究,承袭品牌标志性的复古优雅风格,主打「超便携 × 全 C 接口」的组合,专为差旅场景与极简用户打造。 C³ 代表「Chic、Convenient、Compact」的组合,面对当下用户对高效出行的迫切需求,硬糖 C³ 聚焦那些追求品质、讨厌「带一堆充电头」的旅行者与创作者,希望为他们提供一个兼顾体积、功率与智能调度的充电头最优选: 配备三路独立电路,三枚 USB-C 接口,全面支持主流设备快充,是出行多设备用户的理想选择; 极致小巧、轻盈便携,机身体积仅与 AirPods 相当,轻松收纳于口袋或旅行包中; 68W 总功率支持持续满功率输出,无需依赖温控机制,性能稳定可靠; 三口持续不断连,无掉线、无重启,支持多设备同时流畅充电; 优异的电气性能,输出纹波仅 34mV,远低于国家标准 200mV,更加安全稳定; 复古精致的外观设计,在功能与审美之间实现完美平衡,为日常使用增添质感体验。 无论是出差、旅行还是日常办公,硬糖 C³ 都以轻巧体积和强劲性能,为用户带来更少负担、更高效率的移动充电体验。 智能分配方案再升级,「TimiC 时序调度」更快、更稳、更省心、更安全 在设计之外,制糖工厂在技术层面同样追求极致,不断打磨充电体验,力求做到更快、更稳、更省心、更安全。 硬糖 C³ 首次搭载 TimiC(Timing intelligent Charge)时序调度充电方案,在传统「智能分配」(仅在拔插时按功率分配表分配)的基础上实现显著升级,为多设备充电带来更高效、更精准的调度体验。 ·识别连接顺序,动态优先分配 TimiC 能自动识别设备的接入顺序。当同时插入两个设备时,系统会优先为首个连接的设备分配更高功率,后插设备获得剩余输出,从而保障主设备实现快速、高效的充电。 ·智能调控 + 全程定时调度,高效且不浪费 TimiC 采用「初始智能调控 + 持续定时调度」的双阶段策略,动态优化多设备间的功率分配: 初始阶段:每次设备插拔后的 2-4 分钟内,系统通过内置定时器检测功率变化,按需智能调整分配策略,更贴合设备的即时需求; 持续阶段:随后系统每隔 3-5 分钟自动检测当前用电状态,实时调整功率输出。例如,当主设备充满电后,其释放出的功率可立即转供其他设备,提升整体充电效率。第二个设备由此可获得更大功率,实现更快速的补能。 ·多口同步反馈,输出稳定可靠 每一次功率调整均同步反馈至所有端口,确保多设备同时充电时依然保持稳定、均衡的输出状态。 ·自动复位机制,精准响应插拔操作 无论哪个端口的设备发生插拔或状态变化,系统都会立即重置至初始状态,并重新进行功率分配,确保每一次连接都高效、可靠、无延迟。 注:硬糖充电头 C³ 首次搭载 TimiC 时序调度为基于规则的算法,虽不如小电拼 SDC 的 FluxAI 自由流(市面唯一真正 AI 智能充电方案)技术先进,但在非 AI 技术架构中,TimiC 已展现出远超行业平均水平的智能表现。 关于制糖工厂 制糖工厂CANDYSIGN 是一个专注极致美感和灵活多用电能产品的先锋品牌。秉承「好产品就是一颗糖」的理念,我们融合科技、艺术与时尚,服务全球最具创造力和生产力的个体,打造兼具审美与人文关怀的「明日产品」。以灵活技术与前瞻设计为驱动,我们专注于可持续发展,持续探索数字电能的无限可能。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。