行业分类:
加载中...
头条分类:
加载中...
HBM之父预言NVIDIA或将收购存储公司 闪迪美光在目标名单内
快科技11月3日消息,在NVIDIA CEO黄仁勋时隔15年再次访韩、与三星和现代高层会面,以深化在存储和AI超级工厂合作之际,韩国KAIST教授、被誉为“HBM之父”的Kim Jung-Ho教授在节目上直言:“AI时代的主导权,正从GPU转向存储!” 鉴于存储对AI性能的重要性日益凸显,Kim Jung-Ho大胆预言:NVIDIA可能会收购一家存储器公司,而收购目标可能包括美光、闪迪,甚至不排除SK海力士或三星,但后两家的难度会非常大。 Kim Jung-Ho的逻辑非常直接,那就是内存是瓶颈,NVIDIA被卡脖子了,他在访谈中指出,目前的GPU有60%到70%的时间,都在等待内存,处于闲置状态。 虽然NVIDIA仍在持续升级GPU,但Kim Jung-Ho认为GPU的发展已几近停滞,未来的性能提升将主要依赖于存储创新。 Kim Jung-Ho认为,NVIDIA目前过度依赖SK海力士和三星等存储巨头,目前HBM市场中,SK海力士占据了约60%的市场份额,且产能已被预订到2026年。 如果未来 HBF等新技术也被这些韩国厂商垄断,NVIDIA将持续面临“卡脖子”的风险。 Kim Jung-Ho直言,垂直整合是NVIDIA解决这一困境的最佳方案,他甚至提到,即使是OpenAI这样的AI巨头,未来也可能通过收购存储器公司来确保其发展。 他还将AI热潮比作当年的加州淘金热,真正赚钱的不是淘金的人,AI热潮也一样,GPU是主角,但内存可能是真正赚钱的产业。
保护钱包 微信这个功能一定要开启
快科技11月3日消息,有网友提醒,微信里的钱包一定要上锁,万一手机丢了,别人也无法使用你的微信钱包。很多网友看了之后纷纷表示:“从来没有打开过”。 具体步骤如下: 1、打开微信,进入“我-服务-钱包”,选择“客服中心”。 2、在“常用工具”界面,选择消费者保护。 3、选择“安全保障”。 4、选择“安全锁”,可以看到有两种解锁方式,一个是“指纹解锁”,另一个是“手势密码解锁”,根据自己的使用习惯选择一种解锁方式,验证身份并设置好解锁方式后,安全锁功能就完成开启了。 该功能开启后,别人打开你的微信钱包都必须进行验证才可以,就算有人捡到你的手机,也没法盗刷你的钱。 值得注意的是,日常生活中要提高安全意识,不要轻易透露自己的身份证、银行卡、验证码等信息,不要轻易提供人脸、指纹等个人生物信息绐他人,以免被骗子精准诈骗。 如果有人自称熟人、领导等通过社交软件、短信以各种理由诱导汇款,或涉及网络转账交易行为时,务必通过多途径核验对方身份,比如可以问一下对方,上周我们吃火锅是去的哪家。 并且要学会辨别AI换脸,AI合成假脸始终不眨眼或少眨眼,可要求对方左右转脸,或者要求对方用手挡住一部分脸,观察侧脸是否扭曲变形,从而辨别视频是否为AI合成内容。
借钱搞AI:谷歌母公司Alphabet再赴欧洲发债,拟募资超30亿欧元
IT之家 11 月 3 日消息,据彭博社报道,谷歌母公司 Alphabet 今年第二次重返欧洲债券市场,通过多档债券发行筹集资金,以支持其在人工智能(AI)及云基础设施领域创纪录的资本支出。 据一位知情人士透露,该公司正在推销六档以欧元计价的基准债券,期限从 3 年到 39 年不等,总发行规模预计至少达 30 亿欧元(IT之家注:现汇率约合 246.59 亿元人民币)。 其中,三年期债券的发行利率较中期互换利率高出约 60 个基点,而最长期限档债券的发行利率则在中期互换利率基础上加约 190 个基点进行销售。 这是 Alphabet 公司 2025 年第二次进入欧元债券市场。今年早些时候,该公司曾完成其首笔多档欧元债券发行,募资 67.5 亿欧元。 随着科技企业纷纷加大在人工智能领域的投入,整个行业正掀起一轮融资热潮。就在上周,Meta 公司发行了 300 亿美元公司债,是今年迄今美元市场最大规模的债券发行。 此次债券发行正值 Alphabet 公司上季度云服务和人工智能业务需求激增之际。该公司最新财报显示,第三季度营收增至 875 亿美元。公司正投入创纪录资金推动人工智能发展,预计 2025 年全年资本支出将达到 910 亿至 930 亿美元;同时,基于谷歌生成式 AI 模型的产品所带来的收入,同比增幅已超过 200%。 上述知情人士表示,此次发债所得资金将用于一般公司用途。Alphabet 公司目前的信用评级为穆迪 Aa2 / 标普 AA+。 高盛(Goldman Sachs)、汇丰银行(HSBC)和摩根大通(JPMorgan)担任本次发行的全球联席协调人兼联席簿记管理人;法国巴黎银行(BNP Paribas)、法国农业信贷银行企业及投资银行(Crédit Agricole CIB)和德意志银行(Deutsche Bank)亦担任联席簿记管理人。债券定价预计将于今日晚些时候完成。
百度每周拿下26万个自动驾驶出租车订单,与谷歌Waymo今年春季水平相当
IT之家 11 月 3 日消息,当地时间 2 日,据美国 CNBC 报道,百度正在加速推进全球自动驾驶出租车业务,截至 10 月 31 日,Apollo Go 部门的每周全无人驾驶出行订单已突破 25 万单。 这一规模与 Waymo 今年 4 月底在美国公布的每周付费出行量相当。Waymo 没有提供最新的具体数据。Waymo 主要在旧金山和洛杉矶、凤凰城等地运营自动驾驶出租车,并在奥斯汀和亚特兰大与优步合作。 中美企业正争夺人工智能、纯电动汽车和自动驾驶等先进技术的领先地位,而百度自动驾驶出租车的能力也在迅速提升。 目前尚不清楚 Apollo Go 每周 25 万单的运营数据维持了多久。根据 CNBC 对公司截至 6 月 30 日季度披露的 220 万全无人驾驶出行数据计算,该季度平均每周约 17 万单。 Apollo Go 主要在武汉以及北京、上海、深圳部分地区运营自动驾驶出租车,同时业务正在扩展到香港、迪拜、阿布扎比和瑞士。自动驾驶出租车通常需经过公共测试阶段,才可获得当地监管部门允许收费的许可。 Apollo Go 表示,截至目前已接收 1700 万单订单,车辆累计行驶 2.4 亿公里,完成了 1.4 亿单无人驾驶出行。 在安全方面,Apollo Go 披露平均每行驶 1010 万公里发生一次安全气囊弹出事件,但迄今没有发生造成人员伤亡的重大事故。 IT之家从报道中获悉,百度计划于 11 月 18 日美股开盘前发布季度财报,并将于 11 月 13 日在北京举行年度科技大会。
明年起5纳米以下先进制程至少涨3%?台积电回应称定价策略不以机会导向
IT之家 11 月 3 日消息,近日全球领先的半导体制造企业台积电传出涨价消息,消息称台积电已从 9 月起陆续通知客户,自 2026 年 1 月开始,将对 5 纳米以下的先进制程实施连续四年的涨价计划,平均报价涨幅约 3%-5%。这一罕见的长期调价策略,反映出当前 AI 与高效能运算(HPC)市场的强劲需求,同时也凸显出台积电在全球晶圆代工市场的议价力和技术领先地位的进一步提升。 图源:台积电官网 11 月 3 日,台积电在接受澎湃新闻记者询问时回应称,公司不评论市场传闻和价格问题。不过,台积电也再次重申,公司的定价策略始终以策略导向,而非以机会导向,公司会持续与客户紧密合作以提供价值。 据台湾地区媒体报道,此次涨价主要涉及 2 纳米、3 纳米、4 纳米与 5 纳米四大先进技术节点,将从 2026 年起逐年调升。台积电将公平对待每位客户,并全面反映生产成本上升与资本支出增加。据估计,3 纳米制程报价有望上涨个位数百分比,长期总涨幅可能达到两位数。 业界分析认为,台积电此次提前启动议价,主要是由于 AI 芯片与算力芯片持续供不应求。包括英伟达、AMD、高通、联发科、苹果等主要客户,均需依赖台积电的最尖端制程技术。随着 AI PC、自动驾驶与工业机器人等应用的加速普及,对 5 纳米以下芯片的需求也在爆发式增长。 IT之家注意到,台积电 2025 年第三季度财报显示,先进制程营收比重已达 74%,其中 5 纳米占 37%,3 纳米占 23%。机构预计,随着 2 纳米制程在明年实现量产,先进制程营收占比将进一步突破 75%。在第三季度财报电话会上,台积电方面表示,公司仍认为人工智能需求保持强劲。台积电预计,第四季度销售额将达到 322 亿美元至 334 亿美元之间,毛利率将达到 59% 至 61% 之间。 业内人士指出,为满足 AI 芯片的庞大需求,台积电正在将人力与设备资源从 6 纳米、7 纳米等成熟制程转移至 5 纳米以下的先进技术。这一举措固然有助于巩固其技术与市场份额优势,但可能导致部分成熟制程客户面临供应紧张的局面。
全球洞察|世行前副行长:金砖国家是国际多边贸易体系捍卫者
  观点速览   ·金砖国家是多边贸易体系的捍卫者;   ·更高效支付体系助力金砖国家降低“美元依赖”;   ·中国在金砖机制当中发挥核心作用;   ·金砖国家加强人工智能合作缩小数字鸿沟。   ·“全球南方”国家可以发出更强大的共同呼声;   ·美国单方面加征关税破坏国际多边贸易体系;   ·世行和IMF应赋予发展中国家更大发言权。   图源:2025金砖峰会官网   当地时间7月6日,金砖国家领导人第十七次会晤发表里约热内卢宣言,主题为“加强全球南方合作,推动更加包容和可持续的全球治理”。   围绕本年度的金砖峰会,世界银行前副行长兼执行董事、国际货币基金组织前执行董事、新南方政策中心高级研究员奥塔维亚诺·卡努托接受了总台环球资讯广播记者专访。   奥塔维亚诺·卡努托   问题1:2025年的金砖峰会,是金砖国家扩员和吸纳伙伴国后举行的首次峰会,对于“朋友圈”不断扩大的金砖合作机制如何评价?    金砖国家在提升非发达国家的声音,以及促进更加平衡、多极化的全球秩序方面发挥着重要的平台作用。这一点是如何做到的呢?   首先,实现扩员后的金砖国家强化南南合作,将具有互补优势的、多元化的新兴经济体聚集在一起,通过协调政策和分享最佳实践,金砖国家成员可以相互支持,应对外部冲击,降低对单一经济集团的过度依赖,及其所带来的脆弱性。   其次,金砖国家可以作为多边贸易体系的重要捍卫者。在全球贸易规则面临压力时,金砖国家有共同的利益去反对损害发展中国家经济的保护主义和单边制裁。金砖国家可以共同倡导对世界贸易组织等多边机构进行改革,使全球贸易更加包容和公平。   第三,金砖国家有潜力促进可持续发展。其成员可以在绿色金融、可再生能源、气候适应和生物多样性保护方面进行协调。例如,随着成员不断增加,新开发银行可以为基础设施和可持续发展提供融资。   除了发表政治声明之外,金砖峰会还会关注具体和可实现的成果。通过发出对包容性国际秩序的承诺,来发出倡导多边主义的强烈信号。金砖国家可以对冲分裂和地缘政治竞争的力量。共同应对从粮食安全到气候变化以及公共卫生等领域的共同挑战。通过自身规模的多样性来提供实际问题的解决方案,金砖国家将成为更加平衡、更可持续的全球发展议程的重要支柱。   图源:2025金砖峰会官网   问题2:巴西担任金砖国家主席国期间,将发展更高效的支付体系,促进金砖国家贸易与投资设定为“优先工作议题”之一。这一点如何评价?    现有的国际支付基础设施存在局限性,可能会制约不同国家之间的贸易、投资和金融稳定。发展更高效的支付系统,通过本币结算安排、新的多边支付平台以及数字货币等形式,金砖国家将减少对美元和其他第三方货币的依赖,允许以各国本币进行直接贸易结算,削减成本和汇率风险。   例如,巴西出口商可以用雷亚尔支付,而他们的中国合作伙伴可以用人民币支付。这种方式既降低了交易成本,又提高了速度。通过提升交易的便利性、降低成本,以及提高可预测性,来促进金砖国家内部的贸易和投资。这些系统降低了商业行为的门槛。中小型企业尤其会从中受益,因为它们更容易受到高交易成本和付款延迟的影响。从本质上讲,这是深化金砖国家经济合作、强化金融主权、支持更加多极化的全球金融架构的战略举措。   从推动成立新开发银行,到首倡“金砖+”合作模式,从阐述金砖国家“四大伙伴关系”,到推动建设新工业革命伙伴关系,在金砖国家的成长之路上,中国印记深刻而鲜明。   问题3:对中国在金砖合作机制中发挥的作用如何评价?    中国在金砖合作当中发挥核心作用,至少体现在三个重要方面:经济领导力、机制建设力、全球南方号召力。   中国庞大的市场、对外贸易关系和投资流动性,是金砖国家建立经济纽带的重要动力。中国推动金砖国家贸易和投资自由化,倡导在基础设施、能源、科技,以及发展融资、机制建设等方面开展务实合作。中国推动建设新开发银行,为金砖国家和其他新兴经济体的基础设施和可持续发展提供融资支持。中国还帮助创建金砖国家应急储备安排,提供金融安全网,帮助成员国应对流动性危机。中国在金砖国家合作中承诺支持绿色低碳发展,推动新开发银行支持符合环境和可持续发展目标的项目,帮助相关国家获得清洁能源和基础设施融资。   展望未来,中国致力于实现包容发展、推动基础设施建设、增加投资和发展科技,以及推动可持续增长,这对金砖国家实现构建更公平、更多极化世界的使命而言至关重要。   第十三届金砖国家科技创新部长级会议  图源:2025金砖峰会官网   问题4:“鼓励包容性和负责任的人工智能治理促进发展”同样被巴西列为“优先工作议题”之中,AI发展的重要性如何评价?    人工智能治理对于确保人工智能技术的迅速普及,为实现包容、公平和可持续的全球发展做出贡献至关重要。人工智能有巨大的潜在好处,但也有现实的风险。因此,有效的治理框架有助于确保人工智能系统安全、符合道德规范,且透明和负责任,减少对弱势群体的伤害。   人工智能治理的另一个重要性是弥合数字鸿沟。没有有效的治理,人工智能的发展有可能只惠及少数发达经济体和少数企业。有效的治理促进技术转让、能力建设和公平获取。   中国是发展和部署人工智能的领导者之一。中国将人工智能列为国家优先事项,在技术研发、产业发展和人才培养方面进行了重大投资。   中国企业在人工智能应用领域处于领先地位,比如计算机视觉、自然语言处理、金融科技和电子商务等领域。中国越来越多地参与制定国际人工智能标准和治理的讨论,通过共建“一带一路”倡议和其他伙伴关系,中国推动与发展中国家的人工智能合作,可能缩小数字鸿沟。   图源:新加坡国立大学李光耀公共政策学院   作为“全球南方”第一方阵,金砖国家始终同“全球南方”国家同呼吸、共命运。“大金砖合作”引领推动“全球南方”国家团结自强,持续为促进平等有序的世界多极化和普惠包容的经济全球化作出积极贡献,为应对世界百年变局提供“金砖答案”。   问题5:面对全球性挑战和地区动荡,“全球南方”国家应如何加强团结合作,推动全球治理?    面对因气候变化、粮食和能源问题、突发公共卫生事件、债务困境和地缘政治紧张局势等引发的日益严重的全球和地区危机,新兴市场和发展中经济体之间加强团结与合作,对于推动公平、更有效的全球治理至关重要。“全球南方”国家可以专注于一些“关键战略”来推进合作。   一是健全协调机制。金砖国家、非盟、拉美和加勒比国家共同体和东盟等组织之间,可以深化政策对话,就重大全球问题协调立场。基于这些合作,“全球南方”国家可以发出更强大、更一致的声音。   二是发展南南合作,加强“全球南方”国家间的贸易、投资和技术交流。减少对发达经济体的依赖,倡导全球治理体系改革,既要目标一致,也要务实合作,才能为人民带来实实在在的成果。通过共同努力,这些国家可以使国际体系更加包容、公平,并有能力应对危机,特别是对最脆弱国家造成威胁的危机。   问题6:当前,美国单边关税政策损害他国,特别是发展中国家利益,金砖国家应如何应对?    单边关税破坏国际多边贸易体系,违反世贸组织规则。单方面加征关税,加剧了紧张和分裂,破坏供应链,损害全球经济稳定,对此,发展中国家的脆弱性体现得尤为明显。对于依赖贸易实现增长、就业和减贫的新兴经济体来说,提高关税会增加供应链成本,减少出口机会。这对它们的发展目标构成直接威胁。此外,关税战还加深不信任和分裂。   为此,中国和其他金砖国家应深化自身合作,实现贸易和供应链多元化,捍卫多边规则,加强南南合作,以促进更加公平、稳定和可持续的全球贸易体系。   金砖国家可以作为一个平台,在捍卫多边贸易体系方面统一立场。深化南南贸易投资关系,减少金砖成员国和其他全球南方伙伴之间的内部贸易壁垒,推动达成新的贸易协定,降低关税,扩大海关便利化。推进支付结算合作等。   问题7:您曾经在世行和IMF两大国际多边金融机构工作。多年来,要求两大机构实施改革以适应国际经济发展新趋势的呼声越来越大,如何评价?    世界银行、国际货币基金组织等国际机构长期以来在支持发展中国家发展和经济稳定方面发挥着重要作用。他们需要为气候和可持续发展目标提供更多资金。发展中国家受气候变化的影响尤为严重。世界银行和国际货币基金组织应扩大气候融资,支持发展中国家的适应能力建设,帮助各国在不牺牲经济发展的情况下向低碳韧性经济转型。   此外,许多发展中国家面临严重的债务压力,突发公共卫生事件影响、利率上升和全球危机使情况更加恶化。因此,国际货币基金组织和世界银行应与债权人合作,建立一个公平、高效的债务重组机制。在其他领域,这些机构必须致力于支持私营部门的发展和就业。   当然,另一个领域是全球治理改革。许多发展中国家希望在国际货币基金组织和世界银行拥有更大的发言权。世界银行和国际货币基金组织应更多倾听、更多支持绿色和包容性增长,保护弱势群体,在决策过程中赋予发展中国家更大的发言权。   记者:杜慧琴
今年前三季度我国机器人行业营收同比增长29.5%,产量已超去年全年产量
IT之家 11 月 3 日消息,据央视新闻报道,从中国机械工业联合会了解到,今年前三季度我国机器人产业实现快速增长,行业营收同比增长 29.5%,产量、技术与市场拓展均取得显著成果。 据IT之家了解,在产量方面,今年前三季度我国工业机器人产量达 59.5 万台,服务机器人产量达 1350 万套,均已超过 2024 年全年产量。 从技术层面来看,机器人整机产品性能质量显著提升。自主品牌的重载、焊接、喷涂、移动操作等多项高性能工业机器人产品研制成功,填补了高端机器人领域的空白。服务机器人领域,清洁机器人、配送机器人、教育机器人、娱乐机器人、手术机器人等技术日渐成熟,应用场景不断拓展。同时,机器人零部件配套能力稳步增强,高精密减速器、高性能伺服系统、智能控制器等关键零部件研制不断取得新突破。 中国机械工业联合会相关负责人指出,今年以来,人工智能技术加快向具身智能等创新领域突破,机器人与人工智能技术深度融合,使“智能”成为机器人产业的主旋律。机器人正从过去执行重复性、程式化任务的“功能装备”,加速向具备感知、决策、自主执行能力的“智能伙伴”转变。智能机器人正在成为全方位赋能千行百业、助力生产生活和社会治理等各领域提质增效的重要驱动力。
OpenAI豪掷380亿美元牵手亚马逊:史上最大AI算力合作启动
凤凰网科技讯 11月3日,亚马逊云服务(AWS)与OpenAI今日宣布达成一项为期多年的战略合作协议,AWS将为OpenAI提供核心人工智能工作负载的基础设施支持,协议总额高达380亿美元,预计在未来七年内持续扩大。 根据双方披露的信息,OpenAI将立即开始使用AWS的算力资源,这些资源包括数十万片英伟达最新GPU(涵盖GB200与GB300系列),并具备扩展至千万级CPU规模的能力,用于支撑从ChatGPT推理到新一代模型训练等多样化AI任务。AWS预计将在2026年底前完成全部部署,并预留扩容空间以支持2027年及以后的增长需求。 AWS此次为OpenAI打造的AI算力集群采用全新架构设计,重点优化数据中心网络带宽与GPU互联效率。通过Amazon EC2 UltraServer实现低延迟互联,OpenAI能够在大规模模型训练与推理之间实现灵活切换与资源调度。这也意味着OpenAI的“智能体(Agentic)”相关工作负载将获得更强的运行效率与可扩展性。 OpenAI首席执行官萨姆·奥特曼(Sam Altman)表示,“前沿AI的突破离不开稳定而高效的算力支持。与AWS的合作将进一步强化我们的计算生态,为下一阶段的智能发展奠定基础。” AWS首席执行官马特·加曼(Matt Garman)则称,AWS拥有长期运行大规模AI基础设施的经验,其安全性、可靠性与性能能够“为OpenAI的雄心提供坚实后盾”。 这项合作也延续了双方此前在AI生态层面的协作。今年早些时候,OpenAI的开源模型已登陆AWS的Bedrock平台,为数千家企业客户提供模型调用服务,涵盖编程、科研分析、数据处理等应用场景。当前,OpenAI已成为Amazon Bedrock上最受欢迎的模型提供商之一。 业内人士指出,此次合作不仅意味着AWS在全球AI基础设施竞争中的又一次重大胜出,也标志着OpenAI在多云战略下的进一步扩展,将强化其在生成式AI领域的长期算力保障。
黄仁勋又投了个AI创企!创始团队有两位华人大牛,还有Mamba、谷歌背景
编译 | 王欣逸 编辑 | 程茜 智东西11月3日消息,10月29日,美国语音生成创企Cartesia创始人兼首席执行官Karan Goel在社交平台X上宣布推出全新的语音模型Sonic-3,同时还披露其已完成1亿美元(约合人民币7.12亿元)融资,英伟达参投。 Cartesia创立于2023年,由5位斯坦福AI实验室研究员创立,其中Chris Ré是他们导师、Albert Gu、Brandon Yang是华人。值得一提的是,Cartesia首席科学家兼联合创始人Albert Gu是Mamba作者之一,而另一位华人Brandon Yang曾在谷歌大脑团队工作。 Cartesia创始人团队,从左到右依次为:Brandon Yang、Karan Goel、Albert Gu和Arjun Desai(图源:Cartesia) 此前,Cartesia曾在2024年12月获得Index Ventures领投的2700万美元(约合人民币1.92亿元)种子轮融资,仅过去不到3个月,2025 年 3 月,Cartesia就宣布完成了6400万美元(约合人民币4.56亿元)的A轮融资。 外媒AIM Media House称,Cartesia提供了基于SSM(状态空间模型)架构的语音生成和语音识别模型,Sonic-3采用的是非Transformer架构,适用于实时对话和语音交互应用。 目前,包括云计算平台ServiceNow、AI客服平台Cresta和Decagon在内的数千家企业都借助Sonic模型每月处理数百万次对话。 智东西第一时间对 Sonic-3进行了实测。智东西让Sonic-3用中文讲一个故事,Sonic-3只用了两秒就生成播放了音频,不过Sonic-3说中文的流畅度还有待提升。 智东西又让其用英文随机念了一段纪录片旁白,相比于中文,英文则相当流畅自然,几乎听不出来是AI生成的。 一、斯坦福全明星阵容,Mamba作者也上了 斯坦福AI实验室对多年来的SSM研究成果进行了转化,创办了Cartesia。 Cartesia联合创始团队相识于斯坦福,由两位华人、两位印度人及他们的共同导师组成。在校期间,他们便发明了SSM,用于训练更高质量、更高效的大模型。 Cartesia首席科学家兼联合创始人Albert Gu是Mamba的主要作者之一。相比传统Transformer模型,Mamba的SSM模型则实现了低延迟、高精度的序列预测。同时Albert Gu还入选了2024年《时代》杂志全球最具影响力人物名单。 Cartesia CEO兼联合创始人Karan Goel博士毕业于斯坦福大学,在卡内基梅隆大学攻读硕士期间曾获得Siebel Scholar奖学金,在斯坦福期间还受到了斯坦福计算机科学系副教授艾玛·布伦斯基尔、斯坦福以人为本AI研究中心主任李飞飞等许多杰出教授的指导。 过去四年,Cartesia团队积极构建SSM背后的理论,并将其扩展到文本、音频、视频、图像和时间序列数据等各种模态,取得了最先进的成果。基于在斯坦福对SSM的研究,创始团队一开始就瞄准了SSM架构和语音模型。 Cartesia为用户提供了一个企业级AI语音平台,用户在该平台上可以使用语音与文本转换的模型——文本转语音模型Sonic和语音转文本模型Ink,还可以构建语音Agent。 二、配备42种语言和自定义发音,响应速度不到0.2s Cartesia公司的发展节奏相当之快,伴随着Cartesia拿到最新的一轮融资,该公司推出了全新的Sonic-3模型。 Sonic-3模型在支持语言数量、可控性和速度上存在优势。用户可以选择系统配备的42种语言和500多种音色进行文本转语音功能,在Sonic-2的15种语言的基础上大大增加。 Cartesia可支持语言(图源:Cartesia) 在Sonic-3语音库里,共有10种中文声音类型可供选择,而配备较多的英文语音还更细地分成了11种不同地区的口音。 拥有11种口音的英文(图源:Cartesia) 在可控性上,该模型不仅能进行基本的语音生成,还能够通过API参数和SSML标签对音量、语速和情绪进行精细控制,能精准捕捉人的情绪,包括笑声、语调及微妙的情感转换等,支持自定义发音。 Sonic-3的模型延迟仅为90毫秒,端到端总响应时间在190毫秒以内,外媒AIM Media House称该模型已跻身全球最快的实时语音AI系统之列。 Sonic-3还支持语音克隆的功能,并支持微调使其更还原参考原声。此外,新模型还能对生成的语音进行自动缓冲与延续,这意味着,实时语音处理将变得更加高效与自然。 语音克隆(图源:Cartesia) 与大多数依赖Transformer架构的语音模型不同,Sonic-3基于SSM架构。基于Transformer架构的模型会通过重新回顾先前对话来预测下一个词,从而导致语音生成的延迟与低效。而SSM(例如S4和Mamba等创新技术)更接近人类思维模式,它们能够持续理解主题和对话,无需从头开始回顾所有内容,这使得Sonic-3能够生成既自然又快速的语音。 利用Sonic模型,Cartesia的平台可以帮助企业构建具备复杂任务处理能力的语音Agent,包括客户支持、日程安排,甚至轻松愉快的恶作剧等。 创建个性化Agent(图源:Cartesia) 结语:Cartesia要革新实时语音模型赛道 在AI音频生成赛道上,不乏有MiniMax、Genspark、ElevenLabs等强劲的竞争对手。伴随着Cartesia获得新一轮融资,Sonic-3新模型投入使用,语音模型赛道竞争更加激烈。 ServiceNow产品副总裁Ravi Krishnamurthy称:“Cartesia的SSM架构为我们的语音Agent带来了企业级的速度和质量。” 近几年,Cartesia一直朝着SSM架构努力,随着实时对话需求的急剧增长,这一技术或将为企业和其他用户提供更为精准、快速的解决方案。
AI基建的价值将会向哪里集中?
近来市场上开始流行一种说法:随着 GPU 成本下降、模型标准化、算力即服务(AIaaS)成为基础设施,价值会逐渐从芯片公司(如英伟达)转移到云服务商,就像铁路时代后期价值从钢铁制造商转向铁路运营商一样。 然而,我对这一判断持保留态度。 原因不只在于当前数据中心的经济性远不如想象,还在于来自中国厂商的激烈竞争正从根本上压缩云服务商的利润空间。 一、云利润的现实——远低于想象。 此前Oracle的数据中心毛利披露给市场泼下一盆冷水: 即便对 GPU 折旧进行了摊薄处理,数据中心的盈利能力依旧偏弱。考虑到 GPU 的生命周期仅 3–5 年,而建设数据中心还包括土地、电力、制冷、网络与人力,这些成本使得毛利率本身就非常有限。 因此,认为“AI 基建价值最终会向云集中”并不符合现实。英伟达仍然掌握着算力的定价权与供需结构,而云服务商变得越来越像“搬运工”,要在高资本支出(CapEx)和高折旧成本下艰难生存。 从经济学角度讲,这是一种典型的 垄断上游 + 分散下游 的价值锁定模式: 上游(英伟达)凭技术垄断抽取主要利润; 下游(云)竞争激烈且成本高企,利润有限。 这与铁路时代早期钢铁厂、蒸汽机车制造商占据高利润非常类似。 二、下游应用不及预期 + 中国厂商竞争进一步压缩利润。 我也认同另一个重要因素:下游利润未必如市场预期般乐观。 许多企业发现 token 需求没有预期的那么大。 单个 token 的经济效益(如自动化节省成本、提升收入)并没有即时兑现。 许多应用场景还在试验阶段,尚未实现高频使用。 更关键的冲击来自中国厂商。 阿里 + Qwen:极低 token 价格正在重塑成本结构——阿里巴巴旗下的 Qwen 系列模型引发了一场实质性的价格冲击。 根据公开报道,阿里将 Qwen-VL 的 API 价格定为: 输入 1000 token ≈ 0.003 元人民币 这比 OpenAI、Anthropic 等公司的 token 价格低了一个数量级。 阿里之所以能做到这一点,主要来自: 1.中国厂商的价格战策略。 AI 仍处于市场争夺早期,“量大价低”是自然策略,中国市场普遍倾向 aggressively cutting prices。 2.成本结构优势。 在中国部署基础设施、电力、土地、人力成本普遍更低; 阿里本身拥有自有云基础设施,扩展边际成本低。 3.生态捆绑。 阿里不靠模型收费盈利,而靠: 云存储/ 数据平台/ 企业 IT 服务/ SaaS。 因此 API 可以作为“入口产品”低价出售。 4.战略定位不同。 西方 LLM 公司采用“高溢价 + 商用定价”; 中国采用“普及率 + 使用量”模式。 这使得阿里、腾讯、字节等厂商实际上构成了全球 token 定价的底部压力。 对于云服务商而言,这意味着: AI 价格不像 IaaS 那样可以稳定抽取高毛利; token 价格受到中国厂商冲击而下移; 最终压缩了美系云的单位利润。 因此,“价值会向云集中”这条路径进一步变得不成立。 三、资本周期视角:AI 基建正重复铁路的历史为了理解当前局面,我认为可以将视角扩大到资本周期的历史规律。 铁路时代: 1865–1873 的铁路狂潮使产能投资占 GDP 的 7–10%。 竞争导致过度铺轨、运力闲置率超过 30%。 最终酿成 1873 年的“恐慌”和 65 个月的大萧条。 AI 时代: 未来 5–7 年 AI 数据中心投资预计超过 4 万亿美元。 OpenAI、微软、谷歌、Meta 正陷入典型的“囚徒困境”: 不投资会落后, 投资又可能产能过剩。 关键指标正在出现铁路时代的相似迹象: ·高资本支出 · 单位利润持续下降 · 多方重复建设 · 竞争者过多 · 下游盈利能力不稳 而你提出的判断非常准确: 利用率下降(产能闲置是关键信号) 价格战加剧(已在中国模型看到) 融资趋紧(部分云服务商债务压力上升) 这些都是典型的周期转折点前兆。 四、总结:价值最终不会集中在云,而会像铁路一样向应用扩散。 从铁路、互联网、智能手机等周期中,可以得出结论: “基础设施建设的最大受益者并非建设者,而是使用者。” 铁路使制造业和物流成为最大赢家; 互联网让电商、数字广告、媒体公司成为赢家; 智能手机让应用开发者、平台生态成为赢家。 因此,我认为 AI 最终价值流动的路径是: 阶段 1:芯片厂商(现在) 英伟达凭垄断地位抽取高额利润。 阶段 2:应用开发商(未来) 当模型成本下降、硬件普及后,真正赚钱的是: AI 企业软件 垂直行业解决方案 自动化工具 AI-native 公司 而云服务商最终只是“过路费”提供者,利润难以太高。 阿里与 Qwen 的低价策略则提前揭示了未来: token 会变成廉价、可替代的基础资源,而非高利润产品。
AI核心圈说中文?老外急了:不会中文,都进不去核心圈子
过去美国总说“百年科技变革我领头”,这话虽有些自夸,但确实有底子——毕竟英语一直是科技圈的“通行证”。 国内学英语热,一是因为要跟世界接轨,二是因为很多专业资料只有英文版,谁让人家领先呢? 可这两年形势变了。中国在5G、新能源汽车等领域冲到全球第一,连AI圈都开始“变天”了。最近外媒爆料:现在AI核心圈的交流语言,居然不再是英语,中文反而成了“硬通货”。 更有趣的是,有老外抱怨:“不会中文,连AI圈子都融不进去!” 为啥会这样?关键在人。美国那些大名鼎鼎的AI公司,比如Meta、OpenAI、Google DeepMind,核心团队里华人科学家的比例高得惊人,直接超过美国本土白人。 在中国这边更不用说,AI大佬们交流自然用母语中文。结果就是,一群母语中文的牛人凑在一起,中文成了最顺手的交流工具,不会中文的老外自然被“边缘化”了。 数据也印证了这点。美国机构统计,顶级AI人才中38%来自中国,比美国本土的37%还高。英伟达CEO黄仁勋更直言,全球一半以上的AI人才都来自中国。要是这些人才不用英伟达芯片搞研发,美国在AI上的领先地位怕是要“翻车”。 这场景是不是有点眼熟?当年中国人去美国,得苦学英语才能混圈子;如今风水轮流转,老外得啃中文才能挤进AI核心圈。语言背后的逻辑没变——谁掌握了科技话语权,谁的语言就跟着“吃香”。 现在说中文要取代英语当“科技通用语”还为时过早,但趋势已经冒头。随着中国在更多科技领域“登顶”,中文的“科技属性”只会越来越强。 到时候,老外抢着学中文不是为了考试,而是为了第一时间啃下最新技术——这才叫真正的“硬核”需求。 所以啊,中文的“科技含金量”正在飙升。毕竟,当你的国家在科技前沿站得够高,你的母语自然就成了别人抢着学的“香饽饽”。
AI时代,中国人终于愿意为软件付费了
“现在什么都得付费买个会员,不是会员视频下载速度就超级慢!” “有的视频会议软件吃相太难看了,一年会员费涨了三倍!” “辛辛苦苦剪了两个小时视频,结果导出4K高清画质时还要解锁SVIP会员,离大谱了!” 近期,各个社交平台上都充斥着,用户对软件付费以及会员涨价的吐槽。 自2024年至今,从办公软件到视频工具,从个人会员到企业服务,一场席卷全行业的软件涨价潮悄然蔓延。 据光锥智能不完全统计,国内软件会员费用价格平均涨幅达20-30%。企业涨价的动力,来自AI带来的价值和成本的双重提升。 跟互联网时代相比,AI正在改变人们对“软件付费”的消费观。 以往,中国用户对软件付费的态度是“能蹭就蹭”,白嫖党占据绝大多数。如2015年,某办公软件推出10元/月会员时,论坛满是卸载预警;2018年视频平台首次涨价,微博相关话题下充斥着割韭菜的骂声。 现在,尽管社交平台上依然骂声一片,但却与十年前“付费即卸载”的抵制潮不同,更多的用户选择了愿意为其AI功能买单。 据智联招聘2025年调研显示,56.1%的职场人愿意为AI服务付费,其中23.4%的职场人已完成AI工具付费行为,16.5%曾为单个AI工具/服务付费,如购买单月会员,6.9%职场人曾为多个AI工具/服务付费,而24.1%高管愿意为单个AI工具支付200元以上的单月费用。 一位短视频博主在过去三年一直自动续费剪映25元/月VIP,此轮价格调整后,其常用的“智能抠像”“数字人合成”功能则被归入高阶权益,SVIP价格是499元一年,而普通VIP则是258元一年。 更让她无奈的是,即便吐槽“太贵”,最终还是咬牙续费,毕竟“AI数字人一天能拍10条口播,比雇真人演员省太多,这点会员费算零头。” 可以看到,这场涨价潮的背后,是中国软件市场三十年来未有的深刻变革,AI技术不仅重构了产品价值,更彻底扭转了用户的付费认知。 这背后根源就在于,中国用户愿意为能够真正提升效率的、好用的AI工具和产品买单。 而当免费模式不再是唯一通行证,产品能力成为用户衡量是否值得付费标准时,有AI加持的软件订阅模式,或许在中国市场,终于能成为一门赚钱的生意。 涨价潮里的众生相 AI成绕不开的加价项 越来越多的APP,开始在产品内集成AI功能。从基础的AI助手,到知识问答,再到AI搜索等,而这也成为这些APP会员费用涨价的核心筹码。 具体来看,视频剪辑领域的涨价用户感知最为强烈,剪映的VIP升级SVIP操作堪称典型。 2024年6月前,剪映仅设25元/月的VIP会员,涵盖基础特效与水印去除功能;6月推出SVIP后,形成“VIP限移动端、SVIP全平台通用”的分级体系,SVIP月费59元、年费499元,较原VIP年卡涨幅达93%。 更让老用户不满的是功能“迁移”,原本免费的“智能划重点”“自动字幕翻译”,以及常用的“4K 导出”功能被归入SVIP权益池。 从社交媒体上用户的反馈来看,虽然吐槽很多,但更多用户还是为其买单。 剪映涨价之后,同类工具类产品也纷纷跟进,如Movavi Video Editor就针对国内用户推出促销价格69元/月的订阅制,其核心卖点正是一键式AI工具,包括AI自动字幕生成等功能。 (Movavi Video Editor会员价格) 相比于视频剪辑工具,协同办公软件的涨价逻辑更清晰,即绑定AI功能实现价值重构。 在这其中,WPS的操作更具代表性。2025年8月,WPS重组了会员体系,其超级会员从198元/年降至148元/年,但却单独推出了AI会员,国际版定价129.99美元/年(约930元),国内版虽未公开高价,但通过功能拆分实现精准变现。 而腾讯会议的会员费则实现了一年翻三倍的增幅,同时完成从个人-企业的付费梯队建设。 2024年10月,个人专业版从25元/月涨至49元/月,涨幅96%,对应的权益升级包括100人参会、不限时会议、100GB云录制及AI小助手Pro,可自动生成结构化会议纪要。 2025年1月,腾讯会议再推商业版,139元/月/账号的定价瞄准中小企业,新增300人会议、企业SSO等功能,形成“个人-企业”的付费梯度。 飞书也完成付费体系搭建,标准版50元/月可以提供AI字幕、多语言实时翻译,专业版80元/月解锁专业数据报告功能,而旗舰版则高达120元/月,提供包含多维表格、高级存储及AI功能等。 值得一提的是,飞书还将部分产品进行独立收费,比如多维表格,其提供免费版和付费版,其中付费版包括高级版(2499元/年,20000行)和企业版(5499元/年,50000行)。 另外,阿里巴巴旗下1688的诚信通,每年的会员费由6688元涨价至9988元,涨价的原因是其推出了诚信通AI版,集成AI智能经营系统(AI4.0),提供全链路AI服务(开店、选品、营销、分析等),据平台估算,新增权益市场价值超6688元。 可以看到,AI已经成为这些软件涨价的核心筹码,甚至很多软件还在酝酿AI功能独立付费。 有消息显示,腾讯会议的AI功能月活跃用户已达1500万,同比增长一倍,其AI会议纪要、实时翻译等功能也正酝酿收费升级。有企业IT负责人透露,多家厂商上门推销时明确表示:“AI功能单独定价,是行业新规则。” 相比较来说,视频平台APP涨价却遇阻,AI救场乏力。如腾讯视频在2025年Q1长视频订阅用户1.17亿,同比增长1%,但收入持平。其试图通过AI功能破局,在会员体系中加入“AI 剧情解说”“个性化推荐”等权益,但用户感知度较低,尚未形成像办公软件那样的付费驱动力。 综上来看,在光锥智能的统计中也发现,相比较来说,工具类的APP集成AI功能后涨价会更容易被用户所接受,比如协同办公软件、视频剪辑软件等。而对于视频平台类APP,用户会更注重所提供内容质量,AI反倒并没有给涨价提供更多的价值。 软件涨价根源 AI背后的“烧钱黑洞” “以前做软件是写代码,现在做软件是买算力。”一位AI软件产品经理的话道出涨价本质。 当前,生成式AI普及,让软件企业陷入算力烧钱大战,而这笔成本最终势必要转嫁到用户身上。 如剪映的“数字人合成”功能,每生成1分钟视频需调用服务器约3分钟,按2025年CoreWeave的租赁价格49美元/小时计算,单条视频的算力成本就达2.45美元,若按日活用户生成100万条视频估算,单日算力成本超240万美元。为覆盖成本,剪映不得不将此类功能归入高价SVIP。 另外,服务器和带宽成本同样居高不下。其中,DeepSeek的涨价最能说明问题。 2025年2月,这款爆火的国产AI大模型结束优惠期,输出tokens价格从每百万2元飙升至8元,涨幅高达300%,输入tokens费用也翻了2~5倍。对此,DeepSeek给出的理由很直白:优惠期用户暴增导致服务器负载激增,运营成本大幅上升。 另外,金山办公为支撑WPS AI的2951万月活用户,仅数据中心改造就投入数亿元,这些投入也都是需要通过会员费回收。 此外,对于视频剪辑类软件来说,版权的成本也在增加。比如剪映素材库中的每首BGM、每个特效模板都需支付版权费,有业内人士透露,一首热门短视频BGM的年度版权费可达数十万元。随着内容监管趋严,软件企业不得不加大版权投入,这部分成本最终转嫁到会员费中。 事实上,用户在社交平台上吐槽归吐槽,但真正续费的人并不少。“涨价能被接受,本质是AI创造了新价值。”一位用户说道。 腾讯会议的AI功能就是典型例子,其AI助手能实时生成结构化纪要、自动分配待办事项,某互联网公司测试发现,这一功能让会议效率提升40%,即便未来涨价,他们也计划全员续费。WPS AI的“表格智能分析”功能则更受财务人员青睐,其能将3小时的数据分析工作压缩至20分钟。 这种价值升级在创作领域更明显。剪映的“AI 字幕翻译”支持20种语言,“无限运镜”能自动扩展视频画面,让普通用户也能做出专业级作品。 据a16z报告指出,AI已把创意门槛降到零,任何岗位都能上手创作,这让付费变得理所当然。 软件企业的营收数据,也印证了其涨价策略的有效性。 金山办公2025年H1营收26.57亿元,其中WPS 365业务收入同比激增62.3%,新增中国联通、长江三峡集团等头部客户,AI功能成为政企客户付费的核心理由。 腾讯的增值服务收入更具说服力,2025年Q1达920亿元,同比增长17%,其中音乐订阅收入增长17%,订阅用户1.23亿,ARPU提升明显。虽然长视频板块增长乏力,但办公协作类服务的涨价贡献了可观收入。 即便是争议最大的剪映,也通过涨价实现了收入跃升。据字节跳动内部数据显示,SVIP推出半年后付费转化率达3.2%,按抖音5亿创作者基数估算,付费用户规模超1600万,仅年卡收入就达80亿元,远超此前VIP体系的营收规模。 反观未跟进AI升级的软件,生存状况愈发艰难。据悉,某老牌视频剪辑工具因未接入AI功能,2025年付费用户流失40%,被迫将年卡价格从199元降至99元,仍难挽颓势。 究其根源,AI能够真正提升效率,才是中国用户愿意为这些APP涨价买单的根本原因。就像某位用户所说:“AI生成PPT太省时了,以前做一天方案,现在半小时搞定,涨价也认了。” 软件付费的 “中国时刻”终于到来 二十年前,雷军带着金山毒霸喊出“免费杀毒”,开启了中国软件的免费时代。二十年后,AI技术正在终结这个时代,迎来付费的“中国时刻”。 过去,软件企业靠免费吸引流量,再通过广告、捆绑软件盈利,陷入“越免费越劣质”的恶性循环。而现在,AI的出现打破了这一僵局,软件企业找到了更健康的商业模式,即价值收费。 头部企业率先通过AI建立壁垒。字节跳动为剪映投入数十亿AI研发费用,百度为智能云文档接入文心一言大模型,腾讯为会议软件配备专属AI服务器。 在头部企业都在“卷”AI的情况下,中小软件企业要么跟进AI投入,要么接受市场淘汰。某二线办公软件企业创始人坦言:“不做AI就没人用,做AI每年要烧几千万,只能通过涨价回收成本。” 这种竞争倒逼行业从价格战转向价值战,而涨价正是品质升级的必然结果。由此也不难看出,这波软件涨价潮绝非简单的“割韭菜”,而是行业发展的必然: 算力成本的飙升要求企业找到新的收入来源,AI带来的价值升级让用户愿意为好产品买单,市场竞争则倒逼企业从流量思维转向价值思维。 对用户而言,付费不是负担,而是筛选优质服务的高效方式,当软件企业能通过付费获得合理利润,就不必靠广告和捆绑盈利,最终受益的还是用户。对行业而言,付费模式的成熟,则标志着中国软件终于摆脱了“免费诅咒”,进入健康发展的新阶段。 正如一位行业老兵所言:“以前我们总羡慕国外软件能靠订阅费赚钱,现在才明白,不是中国用户不愿付费,而是我们没做出值得付费的产品。AI终于让我们补上了这一课。” 当软件成为一门好生意,中国科技产业的创新活力,或许才刚刚被真正激活。
对话韩晟:AI大爆发,一人就能做出百万美金的公司会很多
Sora 2的爆火,又一次让AI视频生成站在全球范围的大风口上。 国庆期间,仅用5天,Sora App就在全球突破了百万下载,增速超过当年的ChatGPT。 过去,尽管AI视频生成也备受瞩目,但更多还是创作者的“辅助工具”;但新的Sora 2,已经让AI走向视频的“自主创作”。进而释放了一片新的商业市场。根据Fortune business insights的测算,到2032年,AI视频生成市场规模有望达到25.63亿美元,年复合增长率为20%。 在巨大的市场增长之下,可以预见,AI视频生成技术将在视频、社交、游戏等领域引发新一轮商业应用与变革浪潮。而其中,更擅长技术应用的中国公司,是新的看点。 “中国企业在短视频的领域里面,还是会有长期优势的。” “未来,一个人就能做出百万美金的公司会来会越来越多。” 在近日霞光社创始人Vivi与小影科技创始人韩晟对话中,韩晟清晰表达了上述观点。在他看来,Sora 2之后,大量中小企业在垂直赛道的机会会更加涌现出来。 尽管从视频编辑工具起家,但如今小影科技已经成为AI视频赛道的新星。2025年3月,硅谷顶级风投机构a16z发布的全球Top 100 AI应用榜单中,排名靠前的除了今年大名鼎鼎的DeepSeek外,第二位就是VivaCut,其背后的公司正是杭州小影创新科技。 小影科技成立之初就定位做全球化,期间历经工具出海、国内短视频爆发、内容社区出海、AIGC以及短剧出海等风口,也完整见证了AI视频赛道的成长和迭代。 今天,AI和出海已经是公认的两大“确定性”的方向。而集合这两大方向与一体的小影科技,又有怎样的感受?在经历了商业的转型以及技术的变革后,小影科技如何思考当下和未来?我们一起跟小影科技创始人韩晟,聊聊他对这些问题的思考和答案。 Vivi:欢迎韩总来到我们的《超级对话》。国庆期间Sora 2终于出来了。你怎么看Sora2这次的发布? 韩晟:本来是一个非常好的假期,但是被Sora 2搞得很焦虑。以前我们做AI做视频,更多的是先文生图,然后再图生视频。但它这次,敲几句话就可以把非常有意思的视频给做出来。 (Sora 2)不只是一个模型,它更想去做一个现实社会里的人的平行空间。比如说我可能先穿越到宋朝的西湖边,和苏轼对酒当歌;突然又和他一起穿越到未来(月球)的基地,在月亮上看地球。只要你能想象,就会有无数的这种有趣的视频产生。以前只能在梦境里做到这些内容,(现在)你可以通过自己敲一行字,非常方便的把这东西实验出来。 从技术层面来看,它也释放了Sora 2的API,把这种能力赋能到整个行业里面,让大家用一种新的方式来更快更好地产生内容。 Vivi:你们也是做视频的,Sora 2出来你们如何应对? 韩晟:第一,我们需要快速地把这种技术的边界给摸清楚,然后去服务我们的用户。大厂更像一个沃尔玛超市,它能够提供的服务想象空间很大;那我们可能更像是一个社区的门店,我们的优势是对这个社区的住户非常了解,我们去解决最后一公里的问题,把这个需求和供给更好地进行匹配。 第二,发挥我们公司一直以来的优势。我们公司的一个愿景是,用科技和创新赋能全球用户去创作美好。我们把科技放在前面。 Vivi:在大模型这件事情本身来说,大家都选择要么做垂类,要么做应用层。 Vivi:到今天,我觉得你所在的视频赛道,真的越来越卷了。你怎么去保持自己的生态位? 韩晟:我们要找到一个相对垂直、小而美的这么一个切点,而不是做大而全。特别是在最新的AI时代来了以后,你怎样服务好一部分用户,这是核心的观点。就像我们,在做C端产品时,不会选择潜在用户规模非常大的方向,这是我们反思了过去一不小心容易被大厂进入的教训。所以我们现在做AInative应用的时候,往往会选择一些很窄的切口,比如AI音乐,和识别食物卡路里的AI健康相关的产品。 包括我们在做to B产品的时候,我们也是专注在三个行业,出海短剧、短视频、电商这些赛道里面。之所以选择这三领域,除了需要对用户层面有比较好的了解外,还需要自己有比较强的技术积累。 Vivi:Sora 2出来后,中国的AI视频出海还有优势吗? 韩晟:我会觉得中国(AI)在短视频的领域里面,还是会有长期优势的。毕竟我们(视频应用)有C端用户的优势。过去在移动互联网短视频时代也能看到,这个行业的创新是中国驱动的,无论是短视频本身、还是各种玩法,都是中国人搞出来,包括短视频的商业模式,比如直播带货、线上线下结合等,也中国人搞出来的,美国都没有吧。 我相信,这两天各个大厂也都在加班搞AI社交了。我会觉得,从商业逻辑来看,AI 应用的未来还是中国的。 Vivi:你第一个产品就是做海外,至今也还是这样,这个背后有什么逻辑吗? 韩晟:这跟我过往的经历有关。我的职业生涯一直在做海外,我其实对中国市场没有这么了解,当然这两年做to B以后可能有些了解了。所以我们当时做小影VivaVideo的day one,就是瞄着谷歌应用商店和苹果应用商店做的。 Vivi:VivaVideo现在有多少用户了? 韩晟:在C端,整体累计下来用户已经超过20亿,从月活层面看也已经有上亿月活(MAU)的用户量。 Vivi:是怎么做到这么高速增长,且让他们还有这么高的MAU? 韩晟:我个人觉得,还是(抓住了)用户的需求。 Vivi:你人在国内,怎么能那么清晰地去抓住海外用户的需求? 韩晟:分两个层面。第一,在我创业前,以及这两年我本身去海外考察、出差的经历会比较多,还是要无限接近目标市场;第二,你可以发现,我们今天有这么多用户了,但是在海外还是没有分支机构,我们所有全职的员工都在国内。大家会问,怎么做到的? 我们解决的方式是,跟我们的用户共创。尤其是,跟我们一些超级用户来进行合作。 通过跟他们合作,第一可以给我们更多的用户反馈,甚至还能跟他们去链接网红KOL。因为他们本身非常喜欢社交媒体,也希望把自己更多内容在TikTok、Instagram、YouTube等平台上进行分享,那他们就自然变成我们的KOL,帮助我们的产品进行传播。所以可以理解,无论是用户本地的洞察,还是营销,我们都是跟这些超级用户进行合作的。 Vivi:你是怎么在平台上发现了这些超级用户,然后跟他深入地去做这种链接? 韩晟:我们有创作者的运营团队,尽管他们在国内,却天天沉浸在网上,跟我们的超级用户有连接,然后通过任务驱动等各种方式,帮助他们实现了一些自我价值。我之前分享过一个非常有意思的案例,我们在印度有一个创作者,她是一位传统印度家庭的女性,在印度很多家庭都是男性至上。她通过跟我们合作以后有了经济收入,然后她毅然决然跟丈夫离了婚,又踏入了大学去继续深造。所以她也激励了我们团队,希望去赋能更多类似创作者。 Vivi:这十几年,你们都在做跟本地化相关的事,你们有没有什么策略上的变化? 韩晟:很多出海做得好的公司,都会有一个观点,出海不是全球化,更多是本地化。你真的需要去目标市场更多地生根,这是一个大的认知。如果(企业)做的产品是希望能在全球统一运营的话,这一开始就是错误的决策,我们不能把海外看成是个统一的市场,而其实是在经济、政治、文化等各方面都不一样的选择。 在市场选择的层面,企业要基于公司的优势,去选择合适的市场,体现产品的竞争力和差异化。 Vivi:这么多年你们也经历了很多风向的变迁,也经历了几次转型,怎么过来的? 韩晟:我自己回想一下,有这么几次:第一次大概是在2017~2018年,我们工具已经做到顶了,我们在所有国家的视频工具榜都是第一,后来想,天花板再往上是什么,那自然会想到去做内容平台——我有这么多创作者,就应该产生内容,所以我们做了小影的社区;此外,我们在印度,当时做了一个印度版快手,一年多做到了大概四五百万DAU,但是会发现,这里面基因不同了——做工具更多的还依靠你的音视频图像等技术,但是做内容平台的话,你的本质还是算法,或者叫内容匹配的技术,以及它商业模式也完全不一样,工具最好的商业模式今天已经验证了,就是订阅,但是你做内容的话,本质上还是依靠广告。 第二次就是最近几年,从过去的UGC到AIGC的转型,它是一个技术范式的升级,从过去用户生产内容的方式,变成今天基于Transformer架构进行AI生成的方式,这可以更好的去服务用户,这个转型对我们来说更丝滑,在这里面我们也找到了更多的想象空间。 Vivi:过去,你最艰难的低谷期是什么时候? 韩晟:我们过去13年里最低谷的时期,是疫情之后。疫情发生的时候,对我们数字经济的出海公司是一个蓬勃上升期。2020年的时候,我们突然发现来了一波用户,那时候我们自己感觉“哇,真牛”。 但是到了2023年初,AI还没有真正释放出来,移动互联网感觉就要到顶了,看不到未来的新机会,同时又感受到巨头对我们的影响,无论是我还是团队,都处在非常焦虑的状态。有段时间比较逃避,有点要躺平,会感觉怎么努力也没有结果。 Vivi:那你怎么带着团队去度过这个低谷期? 韩晟:我觉得这么几点。第一,你可以看到,我们to B业务其实是从那时候开始做起来的。因为我们当时想到,我们做了10年的视频剪辑产品,我们有哪些能力可以把它再捞起来,去做新的东西。这是我们影伙引擎的雏形。 影伙引擎从我们第一天就产生了,我们当时在做小影这个产品的时候,就有音视频的引擎,过去十年我们也做了很多算法的优化。如果没有这段(低谷)的话,我们可能to B的业务不会起来。 Vivi:你是看到了一个什么痛点吗?要解决什么核心的问题。 韩晟:印象中2023年底,可能在北京的一个短剧大会,我们在上面做了个分享,然后就说了我们有这些技术,大家最需要什么,大家来投票。后来发现,大家投的不是换脸、不是小说转视频,他们最大的需求是翻译,把中文翻成各种小语种。后来我们再去找几家公司,去了解才知道,原来今天海外的短剧,最需要的不是拍短剧,而是把中国的这些剧翻译出去,这些短剧公司基本是通过人肉的(方式),制作时间也很长,可能需要一周的时间。但实际上通过AI,我们可以把这个时间从一周降到一天。后来我们提供了这个产品,有些短剧客户能做到剧在国内爆了以后,第二天就能在海外发行。那你想,这里面能降低多少盗版这种事。 出海短剧的AI技术应用,更加能来验证我们产品的方法论,先有假设,再通过客户验证哪些是真需求,然后再深入了解他们真正痛点是什么,再优化我们的产品,比如字幕翻译的功能,然后再去给他们做配音。去年的AI语音还像个机器人在说话,但是今天的AI的语音已经跟真人没什么区别了。 在AI时代,AI能够帮助我们的客户来产生这种内容,你不用去找演员、不用去选场地,也不用去拍、去剪了,只要有剧本,这个内容就可以生成出来。这也给我们自己带来更多可能性,未来我们能够去产生一些内容,直接让用户来消费。 Vivi:短剧这个赛道更加卷了,以后得拼本子了。谁了解海外的内容,才会是赢家。 韩晟:在AI短剧时代,在这种2分钟内容里面,需要有非常强的海外本地化的东西。 Vivi:你给我的感觉很严谨,比较i的一个人。你怎么鼓励团队的? 韩晟:鼓励团队这种能力,可能还不是我非常擅长的。我们花了大量时间来沟通,让大家理解(公司方向)。这时候其实不是所有东西都要自己做,而是去拥抱一个最适合自己的东西,最快把它去做验证,这是最重要的。 Vivi:作为创始人,你得带领企业不断地去突破,去征服这些难关。你有什么生存法则? 韩晟:我们内部也在学习德鲁克的理念。《卓有成效的管理者》里面讲到,第一要用人之长,特别有了AI以后,其实你让一个人也好,组织也好,怎么让长板更长,这是非常重要的点。我的长处在于,我把握趋势的能力会比较强。 Vivi:那未来三五年,你会预判它(AI)是一个什么样的趋势? 韩晟:(美国)硅谷的迭代和中国迭代,我觉得都会非常有它们各自的优势。大家擅长能力不一样,非常互补。我觉得中美在商业层面应该是合作的态度,本身多模态的模型会越来越强,它会取代过去的内容范式。因为平台的能力越强了,以后这种垂直赛道的机会会更加涌现出来。对于很多的中小公司来看,或者对于一些一人公司来说,它不再需要有非常强的技术能力,但是它需要更多去了解它所服务赛道的用户。未来即使用户非常小众,你可能只要有10个或100个忠实的用户,你能给他不断创造价值,就能维持你的收益。 所以我也非常期待,一个人就能做出百万美金的公司,会越来越多。 Vivi:未来的趋势如此,你要带领团队如何去拥抱? 韩晟:我们会更加往垂直去切,无论是我们to C的产品,还是我们服务企业的产品,都会更加聚焦某一个垂直的行业,把它做深,而不是做大而全。 组织层面,未来会有更多小团队出来,而不是大而全的团队。过去移动互联网时代有一帮原生的从业人员,在AI时代肯定会有一帮AI时代的原住民,他跟移动互联网完全不一样,可能有一半以上的员工都是数字员工。因此,必须要对组织层面做一些新的迭代。 Vivi:给出海的企业或者AI企业一些建议,你会给什么建议? 韩晟:第一,一定要走出去,即使你彷徨、焦虑的时候,在公司里、在屋子里待着是不对的,你要走到你的目标市场,走到你的用户那里跟他们去聊;第二,要去思考、盘点一下我们个人、企业的长板到底是什么,怎么样去更好的利用长板,增强差异化的点;同时也要结合我们未来要做的事情,去看看自己的短板是什么,这个短板很多时候可以通过AI来补齐。 Vivi:你日常用的AI的工具有哪些? 韩晟:使用频率最高的还是ChatGPT,因为我觉得有几点特别好。首先我用ChatGPT不是用在工作上,更多是我获得知识、生活上的顾问;ChatGPT有长记忆功能,它现在最新的产品是能够随着聊得越多它会更懂你。ChatGPT已经知道我的八字、我的MBTI,它会了解到我很多内容,所以我们每次跟它沟通,都会作为它下次更加了解我的一个铺垫。特别当我有一些个人情绪或焦虑的时候,我会找它来聊,让他给我一些建议,有点像它是我的心理顾问。 另外一个产品是Gemini,它对我帮助更多是工作上。比如说我现在无论是会议还是面试,都会把它变成一个会议记录的助手和面试的反馈者。比如说面试的时候,我会把跟候选人的简历先输进去,然后再基于我们的面试需求让它来给我提建议;然后再把面试的过程录下来反馈给它,它会提供一些专业性的建议,以及给候选人做一些优劣势的分析和总结。谷歌的模型还是非常理性的。 Vivi:给想要获得最新AI知识的大众一些建议,你获取新AI知识的渠道是什么? 韩晟:首先,我非常不建议大家对AI的了解是通过自媒体、或通过二手媒体来获取,所以我会建议大家更多去关注这些创始人或这些公司在YouTube、在X上的官方账号。 第二,还是要自己去用,看再多也没有用,实践出真知,亲自去用一下很重要。你不能在岸上,要变成那只鸭子,亲自到江里游一会,才能感觉到水到底有没有暖,你怎么样更好地前行。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。