行业分类:
加载中...
头条分类:
加载中...
假期被玩坏了的奥特曼,正在玩弄全世界的算力
如今,春天英伟达的GTC,秋天OpenAI的DevDay,是硅谷最重要的盛会。它们预告了未来。 在刚过去的OpenAI开发者日上,除了发布了ChatGPT Apps SDK、AgentKit、GPT-5 Codex,奥特曼提到的几组截至2025年的数据,揭示AI行业正在驶向何方: 平台400万开发者; 8亿ChatGPT周活用户; API调用每分钟60亿token。 让我们就此做一点大胆地假设与简单的计算。 第一,OpenAI整体每月tokens消耗。 基于API的调用,显然不是OpenAI对外提供AI服务的全部。去年,OpenAI曾披露它的基于ChatGPT的消费者订阅业务,收入占比约为75%。而按照OpenAI对未来的收入路线规划,ChatGPT订阅收入占比将逐步下滑,取而代之的是API、Agents与其他新业务占比。当然,目前OpenAI正在布局Agents相关产品线,并开始探索广告与电商业务,但相比其他两大业务,可以说仍然处于商业化早期阶段。 不妨让我们假定,目前,OpenAI来自API的收入,仍然占据25%,而且,收入占比对应着token的消耗数量。 那么,OpenAI基于API的token消耗量,每周将达到60*60*24*7=60万亿tokens,每月则约为260万亿。相应的,基于ChatGPT订阅的token消耗量,每周将达到180万亿tokens,每月约780万亿。整个OpenAI每月的token消耗合计约为1040万亿。 这意味着OpenAI与谷歌处于相同烈度的竞争之中。谷歌的AI工厂同样在疯狂地生产token,从5月的480万亿tokens,骤增至6月的980万亿。当时,Veo 3发布不久,Nano Banana尚未发布。谷歌目前月均token消耗量肯定已经突破千万亿量级。而OpenAI这次公布的数据应该也没有统计Sora 2放量所带来的。 第二,ChatGPT用户画像。 OpenAI的ChatGPT目前拥有约8亿周活用户,每周消耗约180万亿tokens,折算下来人均每周使用约22.5万tokens。一项研究将典型推理任务设定为输入10k、输出1.5k tokens,据此估算,平均每位用户每周大约执行20次此类推理任务,也就是在每个工作日向ChatGPT提出约四个重要问题。 当然,这一抽象的平均值,掩盖了几个实际应用场景中的结构性差异:少数中重度用户贡献了绝大部分token消耗;不同重要程度的问题,交互深度与轮次并不相同。 第三,开发者用户画像。 若将API调用主要视作由开发者生态贡献,那么,相对2023年,OpenAI平台上的开发者人数增长了2倍,而API消耗的token数量却增加了20倍。简言之,短短两年间,平均每位开发者消耗的token数量增长了10倍。 促成人均消耗量大幅增长的,也许正是深度推理与智能体在各行各业,尤其首先是编码行业的渗透。 在演讲中,奥特曼宣布GPT-5 Pro将开放API。它就非常适合协助完成非常困难的任务,在金融、法律、医疗保健等领域,以及更多需要高准确性和深度推理的领域。此外,OpenAI的GPT-5 Codex正式发布,从8月以来,Codex的日使用量增长了10倍以上。 这个趋势仍在增强。智能体的摩尔定律就预言了它能处理的任务的复杂度每7个月翻倍;多智能体间的协作,至少将推理消耗进一步放大到简单对话的15倍以上。 难怪在绑定英伟达10GW的数据中心后,OpenAI又与AMD打得火热,约定了总计高达6GW的数据中心。奥特曼已经开始营销它强大10倍的GPT-6,并将数据中心规模提升至2033年得到惊人的250GW。 第四,Sora 2的峰值GPU需求。 从文本推理到多模态生成,算力消耗的曲线将更急剧陡峭。奥特曼还宣布Sora 2也将开放API。多模态将不断向现有应用场景渗透,也有望创造出新的应用市场。 但由于OpenAI越来越不透明,不再公开技术细节,对Sora 2算力消耗的估算也不得不建立在一系列大胆而高度敏感的假设之上。总体而言,它与模型与视频的性能参数,以及工作负荷模式密切相关。 在初代Sora发布的时候,风险投资机构Factorial Funds的Matthias Plappert,就曾基于多重假设估算出,72万张H100才能满足它的峰值需求。他假设,初代Sora的参数规模为200亿,且以24帧/秒编码,采样步数为250步,它与典型的DiT模型类似,即6.75亿参数的模型,8倍的压缩率,以及单帧画面524×10^9次浮点运算。他还假设Sora在TikTok与Youtube上的渗透率分别为50%与15%。他还考虑了算力实际利用率,峰值需求与候选视频需求。 可见,模型规模、采样步数、硬件效率,以及OpenAI在AI社交短视频上的野心,将是决定Sora 2整体算力需求最关键的变量与杠杆。 整体而言,扩散模型仍然满足扩展定律。年初,对标初代Sora的Step-Video-T2V参数规模达到了300亿,也许Sora 2的参数规模也有小幅增长。业界也在探索通过算法改进推动采样步数的下降。此外,从Hopper架构到Blackwell架构算力性能的提升,以及针对性地推出定制芯片,都在提升算力效率。 不妨先让我们假定,Sora 2的参数规模增长2.5倍至500亿参数;它主要在GB200的FB8精度下推理,约较H100的FP16精度提升了5倍;其他变量此消彼长,整体不变。再让我们假定,Sora 2继续向TikTok与Youtube输出相同体量的内容,且OpenAI最新的独立应用Sora,将成为短视频平台的有力竞争者,即每天生成的AI视频总时长,等同于对外输出的体量。 换言之,Sora 2的峰值算力需求仍高达约72万张GPU,只是硬件代际从H100更换为GB200。 这当然只是一个静态的、片面的估算。随着AI视频生成性能的提升,其应用将从社交分享扩展到影视制作等专业领域;社交和短视频平台也将卷入这场新的军备竞赛,把算力竞争推向新的量级。 难怪奥特曼的目标,是今年底百万张卡。
GPU警钟敲响,AI过热了?
在OpenAI和英伟达等联手搞动GPU和整个芯片市场之后,一个警钟悄然敲响。 10月7日,知名媒体The Information在一篇报道对该公司购买数十亿Nvidia芯片并作为云提供商出租给OpenAI等客户的计划提出了质疑,随后该公司股价下跌3%。报道称,甲骨文最近转型为最重要的云计算和人工智能公司之一,但可能会面临盈利挑战,因为英伟达芯片价格昂贵,而且其人工智能芯片租赁定价激进。 根据报告援引内部文件称,截至8月的三个月里,甲骨文旗下英伟达云业务的销售额为9亿美元,毛利率为14%。这远低于甲骨文约70%的整体毛利率。 甲骨文今年9月表示,其积压的云合同(称为剩余履约义务)在一年内增长了359%。该公司预测,2030年云基础设施收入将达到1440亿美元,高于2025年的100多亿美元。然而,这些预测收入的大部分来自Oracle在星际之门项目中所扮演的角色,该项目中,这家企业供应商正与OpenAI合作,开设五个装有Nvidia人工智能芯片的大型数据中心。 纵观整个AI市场,这其实是OpenAI一系列动作下的结果。 OpenAI挑起的AI基础设施争夺战 据金融时报最新报道,OpenAI今年已签署了约1万亿美元的合同,用于运行其人工智能模型的计算能力。这些承诺使其收入相形见绌,并引发了对其资金来源的质疑。 今年1月,OpenAI与软银、甲骨文等公司启动了一项名为“星际之门”的计划,承诺为OpenAI在美国基础设施建设上投资高达5000亿美元。目前尚不清楚英伟达和AMD的交易将如何融入“星际之门”计划。 这家ChatGPT制造商尚未透露是直接购买芯片还是通过其云计算合作伙伴购买,预计将租赁部分英伟达芯片。 OpenAI已从其供应商处获得了巨额财务激励,以换取其芯片采购的回报。 Nvidia计划在未来十年向OpenAI投资1000亿美元,OpenAI可以用这笔资金购买Nvidia的芯片,用于其AI数据中心。AMD将向OpenAI提供认股权证,使其能够以每股1美分的价格收购OpenAI最多10%的股份,具体取决于他们的项目是否达到特定目标,其中包括一些与AMD股价挂钩的目标。 据OpenAI高管估计,按目前的价格计算,每部署1千兆瓦的人工智能计算能力的成本约为500亿美元,总成本约为1万亿美元。这些交易将一些全球最大的科技集团与OpenAI的能力紧密联系在一起,OpenAI有能力发展成为一家盈利企业,并能够偿还其日益沉重的财务负担。 但DA Davidson分析师Gil Luria表示:“OpenAI没有能力做出任何这些承诺”,他同时补充称,该公司今年可能亏损约100亿美元。“硅谷‘假装成功,直到成功’的理念部分在于让人们参与其中。现在,许多大公司在OpenAI上投入了大量资金。” OpenAI在基础设施、芯片和人才方面投入了大量资金,但还远没有达到实现这些宏伟计划所需的资金。这些交易还涉及这家全球最有价值的初创公司与其合作伙伴之间的循环安排,以及在大多数情况下尚未达成一致的复杂融资条款。 彭博社在一篇相似的报道中也指出,两周前,英伟达公司同意向OpenAI投资高达1000亿美元,以帮助这家领先的人工智能初创公司建设一个规模庞大、足以为一座大城市供电的数据中心。OpenAI则承诺在这些数据中心部署数百万块英伟达芯片。这一安排因其“循环”性质而迅速受到批评。 本周,OpenAI再接再厉,达成了一项类似的协议。这家ChatGPT的开发商10月6日与英伟达的竞争对手AMD公司签署了合作协议,将部署价值数百亿美元的AMD芯片。作为合作的一部分,OpenAI有望成为AMD的最大股东之一。 据报道,AMD已与OpenAI达成合作伙伴关系,ChatGPT制造商将在多代芯片中部署6 GW的AMD图形处理单元(GPU)。这笔交易对OpenAI来说是一个重大决定,OpenAI几乎完全依赖Nvidia芯片来训练ChatGPT及其其他AI产品背后的模型。 Nvidia占据了人工智能加速器市场的主导地位,市场份额估计为80%至95%,当供应紧张或价格上涨时,客户几乎没有其他选择。 现在,Instinct系列在数据中心直接与Nvidia的H100和H200芯片竞争,这些处理器在数据中心训练大型语言模型(LLM)并运行推理工作负载。 此次合作的财务利益相当可观——正如AMD执行副总裁、首席财务官兼财务主管Jean Hu所说,此次合作“预计将为AMD带来数百亿美元的收入,同时加速OpenAI的AI基础设施建设”。她补充说,该协议“为AMD和OpenAI创造了重要的战略一致性和股东价值,预计将大大增加AMD的非GAAP每股收益”。 对于AMD来说,获得OpenAI作为客户是其多年来试图打破Nvidia对AI芯片市场的控制的证明。 从Meta到xAI,都在抢GPU 除了OpenAI以外,其他云供应商也陆续加入这个疯狂的AI基础设施浪潮。 从相关报道可以看到,META和CoreWeave已签署了一份价值140亿美元的协议,利用后者的GPU算力为Facebook母公司提供计算能力。ORACLE也正在和Meta就一项价值约200亿美元的多年期云计算协议进行谈判,这凸显了这家社交媒体巨头致力于更快获得计算能力的决心。八月底,有消息指出,Meta与谷歌签署了价值100亿美元的云计算协议。根据协议,Meta将使用谷歌云的服务器、存储、网络和其他服务。 此前,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)曾在7月份表示,公司将斥资数千亿美元建设几个大型人工智能数据中心。在最新的财报电话会议上,该公司预测2025年的资本支出将提升到660亿至720亿美元。 当中,Meta将部分资金投向出版商、芯片初创公司和云服务提供商,并与之达成协议——这是一项庞大行动的一部分。与此同时,数十亿美元的资金正涌入英伟达的GPU、定制芯片以及类似能源公用事业的数据中心,旨在确保人工智能经济的各个领域都不受限制。 值得一提的是,Meta的高管表示,他们预计,到2028年将在人工智能基础设施上花费6000亿美元,包括大型数据中心。 另一家巨头微软也是GPU的大买家。科技咨询公司Omdia的分析师估计,微软在去年购买了48.5万块英伟达的“Hopper”芯片。这使得微软远远领先于英伟达的第二大美国客户Meta(购买了22.4万块Hopper芯片),以及其云计算竞争对手亚马逊和谷歌。 但这远远满足不了微软的需求。据知情人士在本月初透露,微软与NeoCloud公司Nebius Group NV达成的协议将为微软内部团队提供计算能力,用于开发大型语言模型和消费者AI助手。 这项价值高达194亿美元的协议公布后,Nebius股价应声上涨,但公告并未透露具体细节。知情人士表示,作为协议的一部分,微软将获得英伟达公司超过10万块最新的GB300芯片的使用权。 云供应商通常运营着自己的数据中心,但微软却难以提供足够的计算能力。租用NeoClouds的服务器可以加快速度,因为他们已经解决了包括获取足够的电力和芯片在内的后勤挑战。 “我们在人工智能领域处于非常激烈的争夺战模式。”微软云业务负责人Scott Guthrie表示。“我们已经决定,我们不想在容量方面受到限制。” Elon Musk旗下的xAI也已然成为了AI基础设施市场的另一个争夺者。其中,孟菲斯是马斯克斥巨资进军人工智能战争的前线。他的人工智能公司xAI已经在这座布拉夫城建造了一座大型数据中心,并称之为世界上最大的超级计算机。这座名为“Colossus”的设施拥有超过20万块英伟达芯片,并为人工智能聊天机器人Grok提供技术支持。现在,马斯克即将完成第二座设施,这座设施规模将更大,他称之为“Colossus 2”。 一些人工智能和数据中心专家表示,完成Colossus 2将耗资数百亿美元。仅英伟达芯片一项就耗资巨大:一位熟悉孟菲斯项目财务状况的人士表示,马斯克需要至少花费180亿美元来购买大约30万块芯片才能完成孟菲斯项目。马斯克在7月份表示,Colossus 2将总共拥有55万块芯片,并曾暗示最终可能拥有100万个处理单元。 此前报道指出,马斯克还在探索一种无需直接购买、而是通过与外部合作伙伴达成的复杂融资协议租赁的方式,以此囤积价值120亿美元的芯片。 再加上其他云厂商,尤其是中国厂商的抢夺,对于AI算力和GPU的需求,正在疯狂增长。 根据《商业内幕》对财务报表的分析,今年统计的五大能源用户中的四家,亚马逊、Meta、Microsoft和谷歌,估计可以在资本支出上花费3200亿美元,主要用于人工智能基础设施。这超过了芬兰的GDP,略低于埃克森美孚2024年的总收入。 另一场互联网泡沫正在上演? 此前从未有过如此巨额的资金被如此迅速地投入到一项尽管潜力巨大,但其盈利能力在很大程度上仍未经证实的技术上。而这些投资通常可以追溯到两家领先的公司:英伟达和OpenAI。近期,两大巨头之间发生的一系列交易和合作加剧了人们的担忧:日益复杂且相互关联的商业交易网络正在人为地支撑着价值数万亿美元的人工智能热潮。几乎每个经济领域都面临风险,人工智能基础设施的炒作和建设波及了各个市场,从债务、股票到房地产和能源。 晨星公司分析师布莱恩·科莱洛在谈到英伟达对OpenAI的投资时表示:“如果一年后我们经历了人工智能泡沫并最终破裂,这笔交易可能是早期的蛛丝马迹之一。如果情况恶化,循环关系可能会发挥作用。” 这种迅速吹起的泡泡,让人想起了四分之一个世纪前的“互联网泡沫”。当时,公司们争先恐后地为新兴互联网奠定支柱时,出现了类似的模式。在截至2001年的五年里,WorldCom和Global Crossing等公司花费了数百亿美元铺设光缆和安装其他网络功能,但第二年,互联网泡沫破灭导致为建设提供资金的贷方索要资金,结果倒闭了。 根据Businessinsider引述布鲁金斯学会(Brookings Institution)的分析报告,领导光纤建设的公司的股东损失了2万亿美元的价值,而50万名工人失去了工作。虽然光缆最终被投入使用,主要是由于Netflix开创的流媒体视频革命,但许多铺设它的公司并没有看到。 就像早期的光缆和铁路一样,数据中心的建设和GPU的购买都是由华尔街资助的。当然如上所述,硅谷巨头本身也越来越多地为繁荣提供资金。这进一步引发了担忧。 “我们都见证了这种行为的某些方面。”JonesTrading首席市场策略师迈克·奥罗克(Mike O'Rourke)上个月在一份报告中写道。“互联网泡沫的教训几乎已被遗忘,但它的影响将永存。”他写道,并指出供应商融资是朗讯倒闭的“关键”——朗讯曾是全球最大的电信设备公司,如今却像英伟达一样,被誉为新兴科技经济中的“铁锹”公司。(朗讯在2002年经济衰退期间险些破产,并于2006年被出售给法国竞争对手阿尔卡特。) 摩根士丹利分析师在一份报告中表示:“我们看到了一些重要的区别。”其中最主要的是:大型科技公司的财务状况比互联网时代许多过度膨胀的股票要强得多。 “我认为这是全球有史以来最大、最危险的泡沫。”宏观战略合伙公司(MacroStrategy Partnership)的朱利安·加兰(Julien Garran)在一份颇为悲观的报告中写道。他估计,由人工智能引发的“美国资本错配”比互联网泡沫严重17倍,比2008年的房地产泡沫严重4倍。 但抛开循环融资及其盈利能力的讨论,我们更应该关注的是这些投资的核心产品:由大型语言模型驱动的生成式人工智能(LLM)。而这正是许多其他投资者、分析师和学者们高呼“皇帝没穿衣服”的原因。 “我想说,这种想法可能太狭隘了。”当被问及对大规模人工智能投资可能超前发展的担忧时,AMD CEO苏姿丰在雅虎财经上表示。“你必须认真考虑这项技术的力量能为世界带来什么。” 苏姿丰表示,公司“正在以正确的速度进行投资,因为我们希望加速发展……这是一个当公司和合作伙伴采取大胆行动时就会获得回报的地方。” 展望未来,苏姿丰表示,人工智能热潮仍处于初期阶段。“我坚信,这是一个十年超级周期的开端。”她补充道,人工智能改变金融、医疗保健和研究等各行各业的潜力才刚刚开始显现。 她说:“我们相信,只要正确使用人工智能计算,就能更快地解决疾病问题,更快地研发新药,更好地诊断早期患者的问题,从而为人们的生活带来改变。” 写在最后 由于文章里的“泡沫说”是一个假设,那就意味着其在未来并不会出现,这也引发了另一个猜想,OpenAI和AMD的交易,Microsoft对AMD和英伟达的观点,会否撼动当前的英伟达格局?如上所述,英伟达占领了接近九成的训练芯片市场。 据FactSet估计,人工智能处理器目前每年为数据中心创造超过1460亿美元的收入,预计未来12个月的年销售额将达到2260亿美元。 相比之下,AMD的数据中心业务目前的年销售额略高于140亿美元。首席执行官苏姿丰在10月6日上午的电话会议上表示,一旦首批芯片在明年下半年开始部署,OpenAI的交易将为该部门带来“数十亿美元的年收入”。她还指出,未来几年该业务的收入可能“远超1000亿美元”。这将是一笔可观的收入,但也表明AMD要想缩小与英伟达在人工智能系统市场的领先优势,还有很长的路要走。 就AMD而言,在追赶竞争对手的竞争中,AMD现在面临着更大的风险。这笔交易从AMD预计将于明年下半年开始出货的MI450芯片开始。AMD宣称,这些芯片的性能完全可以与英伟达计划同期推出的Vera Rubin芯片相媲美。这将是一个巨大的飞跃。根据英伟达在3月份的GTC大会上公布的规格,首批Rubin系列芯片的计算性能将是英伟达目前销售的最强大的Blackwell芯片的3.3倍。 MI450也代表着AMD首次尝试所谓的机架式系统,该系统将多个GPU芯片和其他组件组合在一起,有效地形成一台可装入现有数据中心机架的AI超级计算机。这类系统的复杂性非常高;就连英伟达去年在量产首批基于Blackwell的机架时也遇到了一些困难。 但AMD在追赶英伟达的竞争中,仍需实现一个雄心勃勃且快速推进的目标,同时还要兼顾其他业务,例如个人电脑和视频游戏等增长前景黯淡的市场。 对于OpenAI和AMD的交易来说,还有一个关注点,那就是博通是否会最大利空。因为据之前报道,OpenAI正在与博通打造ASIC。专家此前曾猜测,AVGO将成为仅次于Nvidia的第二大AI芯片供应商——尤其是在有报道称OpenAI已下达100亿美元定制ASIC订单之后。
黄仁勋投资马斯克20亿美元!英伟达构建AI资本帝国,只用了一个月
黄仁勋 频出手 据彭博社报道,英伟达将参与到埃隆·马斯克旗下的人工智能公司 xAI 的新一轮融资当中,参投金额约 20 亿美元。 xAI 该轮募资远超最初计划,总额将达到 200 亿美元。 美国时间 10 月 8 日周三早上,黄仁勋接受 CNBC 电视台采访,表示这笔交易的唯一遗憾是「没有给他更多钱」。黄仁勋说能够得到投资 xAI 的机会,自己感到非常高兴,「几乎所有埃隆在做的事情,你都会想要随一份子。」 最近一个月以来,英伟达公司发起和参与了多笔直接、间接的巨额投资,均与 AI 领域相关。 9 月 22 日,英伟达突然将向 OpenAI 投资至多 1000 亿美元,获得无投票权股份并与之达成战略合作伙伴关系;OpenAI 将用获得的投资租用或购买英伟达 GPU,用于其 Stargate 数据中心建设。根据安排,随着 Stargate 项目的芯片部署量上升,英伟达将逐步向 OpenAI 支付投资额。 OpenAI 投资的几天前,英伟达收购了当时约合 50 亿美元市值的英特尔股票。新闻公布后,英伟达股价小涨 3.5%——涨出了一整个英特尔的市值;英特尔股价则暴涨 22%。 值得一提的是,英伟达与 xAI 的投资安排,和与 OpenAI 的几乎如出一辙: 在英伟达和 xAI 的投资安排中,本轮募资将用于设立一个新的 SPV(特殊目的公司)实体。该 SPV 购买英伟达 GPU,再转租给 xAI。 而在英伟达和 OpenAI、甲骨文公司等公司的投资安排中: 英伟达投资 OpenAI; OpenAI 和甲骨文签订云计算订单; 甲骨文从英伟达购买 GPU,构建云计算服务; 英伟达、OpenAI 向甲骨文租用算力资源 ——结果就是英伟达无需自己修建和拥有数据中心,就可以从硬件销售和云服务中产生持续性收入;而甲骨文向英伟达、OpenAI 等公司出租算力资源,将资本支出转化为运营支出/收入;参与到交易中的所有公司,都因为 AI 的热火朝天而市值/估值暴增。 AI 泡沫远未到来,但将泡沫吹大的机制,已然全速运转。 英伟达和 OpenAI 等公司如何推动 AI 赚钱机器持续运转 图|彭博社 截至目前,英伟达通过直接持股、风投投资等方式,投资了包括 OpenAI、xAI、Mistral 等一批头部 AI 公司,以及英特尔、CoreWeave 等硬件/云计算公司。 英伟达的思路,是向 AI 公司提供算力服务——有时候直接提供,有时候通过类似于 NVDA-ORCL-OpenAI 循环架构——并收回前述投资。 这个过程中,每一方都大体上得到了自己需要的东西(投资额、销售收入、成本摊薄等)。并且,AI 的热潮得以被越推越高,对多方都有利。 而特别对于英伟达来说,由于其市值太高,可支配资金过于巨大,不得不通过千亿美元级别的高额直接投资或间接资本安排,来实现资本的合理配置——也是一件可以理解的事情。
OpenAI视频应用Sora大受欢迎,首周下载量超越ChatGPT
Sora 凤凰网科技讯 北京时间10月9日,据科技网站TechCrunch报道,根据应用分析公司Appfigures的最新数据,在登顶美区App Store之后,OpenAI的视频生成应用Sora的首周表现从技术上讲已超过了当初的ChatGPT。 Appfigures预计,Sora上线前7天在iOS平台的下载量为62.7万次,超过了ChatGPT上线首周的60.6万次。 不过,这并不是一个完全公平的对比,因为ChatGPT首周仅在美国上线,而Sora上线时同时覆盖美国和加拿大。Appfigures表示,Sora在加拿大的下载量约为4.5万次。如果只计算美国的数据,Sora的首周下载量约为ChatGPT的96%。 Sora每日下载量 但是,Sora在消费者群体中的普及速度仍然值得关注,因为Sora目前仍然是仅限邀请的应用,而ChatGPT在上线时的范围更大,这使得Sora的表现更令人印象深刻。Sora上线首日即迅速斩获5.6万次下载量,冲至美区App Store总榜第三,截至10月3日周五已登顶榜首。这一表现不仅超越了Anthropic的Claude、微软Copilot等主流AI应用的首发成绩,更与xAI的Grok亮相时的表现旗鼓相当。 根据Appfigures的数据,自2025年9月30日上线以来,Sora的普及速度保持稳定。数据显示,Sora在iOS平台的日下载量在2025年10月1日达到10.78万次的高峰,此后每日下载量在8.44万次(10月6日)至9.85万次(10月4日)之间波动。 虽然Sora目前的日下载量低于峰值水平,但对于一款仍非所有人可用的应用而言,这依然是相当不错的表现了。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
苹果Meta与欧盟“过招”,《数字市场法》和解在望?
IT之家 10 月 8 日消息,据英媒《金融时报》今天报道,苹果、Meta 等软硬件巨头正与欧盟进行私下谈判,双方已接近达成协议,此前苹果曾因违反《数字市场法》,被欧盟总计罚款 7 亿欧元。 知情人士透露,两家巨头公司正在欧盟监管机构就一系列商业行为进行最终协议谈判,相关谈判目前没有最终结果,双方仍在继续推进,但相关案件有望在近期得到解决。 IT之家注:《数字市场法》是欧盟在 2022 年推出的一项法规,旨在将大型科技公司列为“守门人”,约束其垄断地位,促进数字市场的公平竞争、开放性和创新性,为某些大型公司设定一系列明确的义务和禁止行为,例如不得滥用主导地位打压竞争对手、不得在自家产品搞垄断等。 欧盟与苹果的其中一个争议点在于手机上的应用商店,此前欧盟要求苹果必须开放 iPhone 手机 iOS 系统的“侧载”(第三方应用商店)权限,而苹果已经遵守相关规定,向欧盟用户开放了权限,使 AltStore Pal 等第三方商店出现在自家软硬件平台。 后续《数字市场法》还规定,苹果必须将只适配自有硬件的软件新功能开放给第三方厂商,苹果就此认为这会带来重大隐私问题,因此不得不推迟在欧盟市场推出 iPhone 镜像、AirPods 实时翻译等功能。 此外,苹果还在上月末发布公开长文,指责《数字市场法》违背初衷,使自家用户体验变差,放任竞争对手自由发展,其中写道: 尽管三星是欧洲智能手机的领军人,同时中国公司正在欧洲市场快速增长,但《数字市场法》仅适用于苹果。苹果在构建独特、创新的生态方面“一直领先,并被他人模仿”,但法律并未鼓励这种创新,反而还单独针对苹果一家,让竞争对手可以一如既往地自由发展。 而欧盟委员会发言人托马斯・雷格尼耶在同一天强硬“回怼”苹果,他表示: 自《数字市场法》实施以来,苹果几乎对每一条规定都提出异议,与苹果声称的“希望与委员会完全合作”相左。 苹果还让欧盟委员会就如何遵守《数字市场法》进行积极对话的努力付诸东流,此前两个月的积极互动却招来苹果回过头要求废除所有规定,让我们放弃一切。
AMD CEO苏姿丰谈AI泡沫:看衰者眼光狭隘,热潮仍处早期
IT之家 10 月 8 日消息,AMD CEO 苏姿丰昨天接受雅虎财经栏目采访,聊及她对 AI 领域的独到思考。 节目中主持人首先复述了某些媒体关于“大规模 AI 投资过于超前,AI 泡沫即将戳破”的担忧,苏姿丰对此认为:“我认为这些想法过于狭隘,我们必须真正考虑 AI 技术能够为世人带来何种力量”。 AMD 前天(10 月 6 日)与人工智能巨头 OpenAI 达成了数百亿美元的合作协议,后者以每股 1 美分(现汇率约合 0.071 元人民币)的价格收购 AMD 最多 10% 股份,并共同开发基于 AMD 处理器的 AI 数据中心,OpenAI 承诺购买价值 6 千兆瓦的 AI 芯片(基于多代 AMD Instinct GPU)。 ▲ 图源 AMD 官网,下同 此消息一出引得 AMD 股价大涨,前天涨幅一度达 35%,昨天盘前涨幅则来到 4%,苏姿丰对此表示:“我们希望加速发展,正在以正确的节奏投资,这种合作将在未来得到持续回报”。 展望未来,苏姿丰表示 AI 热潮仍处于早期阶段,这种技术改变各行各业的潜力才刚刚显现出来,她说道:“我相信通过适当使用 AI,能让人们更快地进行药物研发、消灭疾病,在早期诊疗方面也会有更好表现,给所有人带来实实在在的改变”。 IT之家注:苏姿丰(Lisa Su)出生于中国台湾省台南市,拥有麻省理工学院电机工程学博士学位,曾任职于德州仪器、IBM、飞思卡尔等企业,2012 年正式加入 AMD,推动 Xbox One、PS4 等游戏机使用自家芯片,推出“Zen”架构处理器,拯救了当时濒临“生死局”的 AMD。
realme真我15 Pro《权力的游戏》限定版发布,后盖遇热变红
IT之家 10 月 8 日消息,据科技媒体 Android Central 今天报道,realme 真我 15 Pro 手机《权力的游戏》限定版现已在海外市场发布,主打权游联名造型,拥有多种别致设计。 据介绍,这款手机的包装盒设计灵感源自《权力的游戏》剧集中的龙蛋盒,上面印有胡桃木纹理,嵌入维斯特洛大陆中的多个家族元素及定制金属铭牌,打开盒子就能看到铁王座造型,首先映入眼帘的是维斯特洛地图、史塔克家族和坦格利安家族介绍。 开箱后我们还可以看到一封采用紫外线处理的信件,用户需要将信拿到太阳底下才能看到内容,拿下第一层后可以看到国王之手造型的 SIM 取卡针、印有剧集人物的明信片 / 贴纸、保护壳、80W 快充充电器和充电线。 拿出手机后可以看到,这款手机的后摄模组被“龙爪”、家族座右铭及定制花纹包围,布置有维斯特洛家族印章,后盖为皮革质感,下方带有金色的坦格利安家族徽章,后盖整体还可在 44°C 以上自动变为红色,手机本体具备 IP68 / IP69 防水防尘。 打开手机并完成初始设置后,《权力的游戏》主题壁纸跃然在屏幕上,按下屏幕指纹解锁即可看到坦格利安家族徽章,解锁后可以看到这台手机的软件定制颇有新意,提供定制图标及 Launcher,硬件配置与普通版的 realme 15 Pro 相同,配有 6.8 英寸 OLED 屏,辅以 144Hz 高刷。 硬件方面,这款手机搭载高通骁龙 7 Gen 4 处理器,内存 + 存储空间组合为 12GB RAM + 512GB ROM,屏幕采用双曲面设计,内置金属中框,配有 7000mAh 电池,号称轻度使用下可“两天一充”。 目前这款手机售价 44999 印度卢比(IT之家注:现汇率约合 3622 元人民币),相比普通版的 realme 15 Pro 贵 6000 印度卢比(现汇率约合 482.9 元人民币)。
地外来客:三颗彗星正接近地球,还有哈雷彗星留下的猎户座流星雨
IT之家 10 月 8 日消息,如果你的梦想是亲眼看见一颗彗星,那么可能就在这个月!2025 年 10 月,两颗彗星可以通过双筒望远镜轻松观测,而且其中 C/2025 R2 SWAN 很可能肉眼可见。 ▲ 图源:Vito Technology(Starwalk),下同 其中,彗星 C/2025 K1(ATLAS)今日刚好抵达近日点(9.4 等),预计 11 月 24 日抵达近地点(视星等 >10),建议使用口径至少为 100 毫米的望远镜来观测。 另外,天龙座流星雨今晚也将达到顶峰,当群星划过月光下的天空时,一场壮观的天文奇观即将上演。 除此之外,我们还能在 10~11 月看到 C/2025 A6(莱蒙)彗星,最佳时间是 10 月 12 日至 11 月 2 日,在远离城市灯光的黑暗天空下可被肉眼看到;预计它将在 10 月 31 日或 11 月 1 日左右达到最亮。 后续,3I/ATLAS 或 C/2025 N1(ATLAS)彗星预计 2025 年 10 月 29 日抵达近日点(12 等),12 月 19 日抵达近地点(视星等未知),预计将于 11 月下旬起可见,南北半球均可见。 ▲ 按真正从地球上可见的时间排列 C/2025 R2(SWAN)彗星的亮度目前估计为 6 等,可通过双筒望远镜和小型望远镜观测。如果这种亮度不是由暂时性的爆发造成的,那么这颗彗星可能会在下一个月里保持甚至进一步提升亮度,并有望在 10 月 20 日左右在黑暗的天空下达到肉眼可见的程度! C/2025 K1(ATLAS)在接近近日点时并没有明显增亮,其亮度保持在 9–10 等左右,只能在暗夜天空下用强力双筒望远镜或望远镜观测。对于北半球的人,清晨是最佳观测时间。 C/2025 R2(SWAN)将在 2025 年 10 月 20 日最接近地球,距离为 0.26 AU。它的尾巴已经超过了 5° 长度(相当于 10 个满月并排),如果彗星的亮度保持稳定,它的尾巴还可能继续增长。 10 月初,这颗彗星已在北半球出现,低悬在天秤座西南方的傍晚地平线上。随着秋季推进,北半球的可见性将稳步改善,到 10 月下旬日距将达到约 60°。 除此之外还有额外惊喜:在 10 月 20 日的晚上,观星者将迎来三重盛宴。向西南方望去,可以在射手座看到发光的彗星 C/2025 R2(SWAN);向西北方则可在牧夫座找到彗星 C/2025 A6(莱蒙)。在头顶上方,猎户座流星雨将点亮天空,每小时最多可见 20 颗明亮而快速的流星,从猎户座划过。 在 11 月 3 日,这颗彗星将越过天球赤道向北,开始返回外太阳系的漫长旅程。它会逐渐变暗,最终从我们的天空中消失,直到它的下一次回归 —— 大约 20000 多年之后。 SWAN R2 彗星最与众不同的地方在于其轨道,相对于黄道平面仅倾斜 4.5°。这对于来自遥远奥尔特云的长周期彗星来说相当罕见,因为它们通常从陡峭的角度和随机的方向接近。 C/2025 A6(莱蒙)将于 10 月底以 0.6 天文单位的距离掠过地球,在北半球的傍晚天空中处于理想观测位置。 在 10 月至 11 月期间,这颗彗星的亮度可能达到 5 等,可以通过双筒望远镜观测。此外,C/2025 A6(莱蒙)还有可能进一步增亮,因为这类彗星在近日点附近往往会显著变亮。这可能是 2025 年最亮的彗星(IT之家注:彗星难以预测,亮度无法保证)。 C/2025 A6(莱蒙)轨道倾角为 144°,因此彗星以逆行方式运行 —— 与行星的通常方向相反,并在黄道面以北通过近日点,更有利于北半球观测者。 到 10 月 10 日,它甚至在北纬 48° 及更高纬度变为拱极星(永不落下); 此后,拱极边界将逐渐向北移动,因此彗星进入拱极区的地区将越来越少。此外,对于许多地区来说,它的最佳傍晚观测期出现在 10 月下旬至 11 月上旬,正好与北半球漫长而晴朗的秋夜重合。 值得一提的是,这颗彗星此前曾靠近过太阳,其轨道周期约为 1350 年 —— 换句话说,人类上一次看到它是在一千多年前。然而,这一次穿越太阳系改变了其轨道周期(这种情况并不罕见)。4 月 16 日,该彗星以 3.485 亿公里的距离掠过木星。木星的引力消耗了部分轨道能量,将其周期缩短约 200 年,现在约为 1154 年。 实际上,天文学家最初预测这是一颗相对暗淡的彗星(9 等),然而它在 2025 年 7 月 2 日与太阳合之后,8 月中旬的观测显示彗星活动增强,亮度在一个月内迅速从 16.5 等提升至 9 等。到 9 月时已经超过了预期的峰值亮度,并继续变亮。 当前预测显示,莱蒙彗星将在 10 月底达到 3.7 等的峰值亮度,这意味着它将在黑暗地点成为肉眼可见的目标,并且是双筒望远镜的绝佳观测对象。 保守估计来看,其亮度约为 4 等,在这种情况下,我们仍能用双筒望远镜看到,并可能在完美的观测条件下被肉眼微弱看到。 C/2025 A6(莱蒙)目前在北半球的晨空中可见,但到 10 月中旬会转入傍晚天空。高纬度北方地区尤其有利 —— 到那时,它甚至会在北纬 48° 以上成为拱极星。到 10 月底至 11 月初,彗星亮度可能达到 3–4 等,然后很快变暗。大约在 11 月 20 日,它将消失在傍晚的暮光中。 除彗星外,我们还将在 10 月看到天龙座流星雨及猎户座流星雨,其中天龙座流星雨的高峰期刚好是今晚(活动时间 10 月 6 日至 10 日),其北半球完美可见。 天龙座流星雨是一场小型流星雨,在高峰期通常每小时产生约 5 颗流星,但它也存在罕见的周期性活动爆发。 恰巧,天文学家预计今年将出现短暂的天龙座流星雨爆发(这可能是未来几十年里的最后一次),有机会达到 150 颗 / 小时,而且甚至可能高达 400 颗 / 小时,但预计这次爆发仅会持续几个小时。 天龙座流星雨的辐射点位置位于所谓的“龙眼”附近,就是天龙座中的天棓四和天棓三。但您不必直视辐射点,因为流星离辐射点越近,它们的尾巴就越短。要观察天龙座流星雨,只需观察头顶并保持耐心即可。 天龙座流星雨的母体彗星是 21P / 贾科比尼–秦纳(Giacobini–Zinner),它每 6.6 年绕太阳运行一周(上一次经过近日点是在 2025 年 3 月 29 日)。每次这颗彗星穿过太阳系内侧时,都会留下尘埃带,而当地球穿过这些尘埃带时,就会产生天龙座流星雨。虽然该流星雨通常比较平淡,但彗星致密的尘埃流在过去已经多次引发了壮观的爆发。 相对来说,更出名的猎户座流星雨将在 10 月 21 日迎来极大,每小时最多可见 20 颗流星,而且观测条件十分完美 —— 极大时正好与新月重合(不会有太亮的月光)。 猎户座流星雨是一个多产的流星雨。它在 10 月 2 日至 11 月 7 日活跃,10 月 21 日到达高峰。在这一天,流星的平均数量约为每小时 20,这比 10 月甚至 11 月产生的流星雨还要多。 值得一提的是,猎户座流星雨正是大名鼎鼎的哈雷彗星的流星雨(由 1P / 哈雷彗星留下的冰和尘埃碎片造成)。除了猎户座流星雨之外,哈雷彗星还会产生宝瓶座 η 流星雨,它于 5 月 5 日至 6 日到达高峰。 哈雷彗星是人类一生中唯一可以肉眼看到两次的彗星。1P / 哈雷彗星是一颗短周期彗星,需要 75-76 年完成一周轨道。这颗彗星下一次将于 2061 年回归太阳系。 正如其名,猎户座流星雨辐射点位于猎户座中,在亮星参宿四的北方,但是,猎户座流星可以在整个天空出现。它们以每秒 66 公里的速度飞行;相比之下,英仙座流星的速度为每秒 59 公里。 感兴趣的朋友请在距猎户座中的辐射点 45 至 90 度处寻找星雨。从这个角度来看,它们比直接观察辐射点显得更闪亮、更长。如果有机会的话,请寻找一个天空黑暗、远离城市灯光的地方:在城市里,可见的流星数量会少十倍。另外,不要直视辐射点,因为在那里你看到的大多是短流星。猎户座流星雨在天空中随处可见。
对话李开复:大模型应用爆发会带来推理芯片更大增长
《科创板日报》10月8日讯 (记者 毛明江 李佳怡) 李开复,不折不扣的计算机与人工智能领域的老兵。 早在1988年,李开复便在卡内基梅隆大学获计算机科学博士学位,博士论文开发出全球首个“非特定人连续语音识别系统”,该成果获《商业周刊》“年度最重要科学创新”奖。随后,他在苹果、微软和谷歌都曾任职,担任核心技术骨干与重要研究负责人。 他最知名的职业经历,是微软中国研究院(后更名为微软亚洲研究院)首任院长与谷歌(Google)全球副总裁兼大中华区总裁。在ChatGPT出圈带动全球人工智能产业大爆发后,2023年5月,李开复正式投身入局AI大模型领域,带队创立AI创新公司“零一万物”并担任CEO。 在日前上海举行的零一万物华东数智大会会后,《科创板日报》记者采访了李开复,就当前人工智能投资是否过热、AI智能体发展、中国具身智能产业机遇等话题进行了对话。 李开复向《科创板日报》表示,大模型应用的爆发会带来推理芯片需求的更大增长。推理芯片方面和训练芯片不同,没有英伟达那么高的门槛,所以这对中国芯片公司是利好。中国的芯片推理一定是越来越强的。 他还认为,具身智能是特别适合中国的一个业务,因为它把中国的供应链和硬件的优势能够结合进来。机器人和具身智能,这绝对是中国的优势。 “AI Agents不仅是超级员工,也是战略变革利器。”谈及AI智能体的发展,他认同OpenAI CEO 奥尔特曼的观点,未来会有一个人的独角兽出现。就是一个 CEO 来定制很多智能体来帮他做市场、产品、技术、公关、财务、法务等等。未来AI 超级员工占所有员工的比例会越来越大,形成“一个非常高效、超级聪明的人,管理着一大堆智能体”的局面。 《科创板日报》记者采访李开复 以下是《科创板日报》与李开复对话的节选: 记者:当前有关的AI大模型以及产业链等投资热度非常高,美国“星际之门”投资动辄以千亿美元计算。国内寒武纪等公司也获得了资本市场高度追捧。你认为当前AI领域是否存在投资过热现象? 李开复:大家都喜欢讨论什么星际之门、千亿美元投资,但是我们真的要看到的是:会不会GPU越卖越多?肯定会;国产跟美国的GPU会不会都变成很好的投资?也会。但是我们有一件事情要想清楚,AI真正爆发的是应用,对真正的ToB、ToC的用户,对他们产生价值的是应用。 我认为,越来越多的市场份额会进入推理芯片,所以就是我们讨论OpenAI、英伟达、甲骨文等动辄在AI上千亿美元投资的时候,有时候一些对外的公关稿会把(AI大模型的)推理跟训练并为一谈。 但是我们会认为,大模型应用的爆发,其实会带来推理芯片需求的更大增长。那基模(基础大模型)的竞争会继续发生,但是整个行业来看,从GPU花费或者数据中心花费的比例来说,训练芯片的比例肯定是会越变越小。 中国在推理芯片上,一定是越来越强的。推理芯片方面和训练芯片不同,没有英伟达那么高的门槛,所以这其实对中国的芯片公司也是利好。 记者:如何看待具身智能在中国的发展前景? 李开复: 具身智能是特别适合中国的一个业务。因为它把中国的供应链和硬件的优势能够结合进来。所以无论你对中美的AI的底层技术竞争是怎么看,那对于机器人和具身智能,这绝对是中国的优势。 而具身智能之所以“具身”,就是因为它能够把大模型的大脑融合进去。如果说大模型的大脑融进了企业级AI应用,就变成了智能体,那如果它融入了机器人场景,那就是具身智能。 所以大模型对具身智能是非常重要的。今天零一万物本身并没有在做具身智能的项目,但是如果有机器人行业愿意跟我们合作,我们来做智能体方面的探索,我们也非常乐见。 记者:你对国内大模型公司发展怎么看,尤其DeepSeek这样已经获得国际影响力的国内大模型企业? 李开复: 国内可能我们最认可的两个开源模型,是阿里通义千问和DeepSeek,所以我们经常关注,之前也看到其实DeepSeek做了不少升级的动作。我们也感觉到梁文锋比较务实,他没有大招的时候,可能不会把V4或R2推出来。非常期待在不久的将来可以看到,一旦发出来,我们一定会第一时间做适配。 记者:你认为AI将如何改变未来的企业组织形式? 李开复:OpenAI CEO 奥尔特曼曾经说过未来会有一个人的独角兽出现。这其实就是一个CEO来定制很多智能体来帮他做市场、产品、技术、公关、财务、法务等等。 所以,我认为未来真正有价值的,无论是改造一个已有的公司,或者创立一个新的公司,AI超级员工占所有员工的比例会越来越大,形成“一个非常高效、超级聪明的人,管理着一大堆智能体”的局面。AI Agent能够创造巨大的价值,这个价值是怎么去衡量?就是公司的营业额、利润等核心指标。 记者:零一万物的企业战略和定位是什么?在当前竞争环境中如何实现差异化? 李开复:我们不可能去参与打造万亿参数以上超大底座基础模型,这是千亿级别公司的“军备竞赛”。但是对行业来说,头部大模型公司愿意烧这个钱,会把整个行业带到更高的高度。这是第一点。 零一万物所推动的“一把手工程”,就是与目标客户和所服务的企业CEO共绘AI顶层蓝图,输出路线图、技术栈、产品矩阵和交付里程,以战略服务于场景,将战略落地于场景,并且基于场景中积累的实践经验反哺于战略迭代优化,从全局中找到最优解。 我们是能唯一能够放下心态说,什么模型都行,私有化也行,上云也行,然后你开发也行,我们一起开发也行,我们帮你开发也行,为企业提供定制化的AI服务,或者与传统公司在AI应用上进行共创。 记者:在当前ToB市场竞争激烈的情况下,零一万物如何保持竞争力? 李开复:确实ToB的这个领域从外部看来是很卷,但是你今天可能也注意到了零一万物是不再去卷的团队之一。在一个大家都卷的领域,我们有独特的打法。我们的独特打法就是在于深度了解一个公司,尤其是一把手他在乎什么,然后我们怎么能够拿下这样的案子,然后去创造巨大的价值,这个是我们去选择走的一条路。 这条路需要我们能提供一些独特的能力,一个就是和麦肯锡一样可以帮着去制定公司的战略。第二和Palantir和SAP早期一样,能够派人进去做前置工程师。当你自己公司内部的IT部门还没有这个能力的时候,我们不但帮你做出来,还帮你招团队,还帮你去执行,所以我们这个也是比较独特的。 智能体经济时代,AI Agent 是推动企业转型的关键执行者,而Agents 也将带来“基于结果”的商业模式再造。AI的价值正在从“工具”走向“服务”,再从“服务”走向“结果”。
苹果玩转材料魔法:iPhone 18 Fold中框曝光,钛铝CP组合出道
IT之家 10 月 9 日消息,科技媒体 Wccftech 昨日(10 月 8 日)发布博文,报道称在最新投资简报中,分析师蒲得宇(Jeff Pu)透露,苹果正研发首款折叠屏手机 iPhone 18 Fold,预计于 2026 年底发布。 材质方面,蒲得宇分析认为称 iPhone 18 Fold 为平衡强度、重量和散热管理,最大创新在于采用混合金属框架,利用钛金属的结构强度来保证设备的耐用性,同时借助铝金属的轻量化特性来控制整机重量。 钛合金中通常会使用少量铝,而且这两种金属也可以以更高的比例混合。由于钛比铝重,苹果可能计划在框架的承重部分使用钛,在其他部分使用铝,以减轻重量。 作为折叠屏设备的核心部件,铰链承受着巨大的机械应力。行业分析师郭明錤此前也曾透露,苹果将为铰链部件选用钛金属和不锈钢,以确保其在反复开合下的稳定性和对齐精度。 屏幕方面,综合多方消息,iPhone 18 Fold 在展开后将拥有一块 7.8 英寸的内屏,此外还有一块 5.5 英寸的外屏。彭博社的马克・古尔曼称其整体形态可能类似于将两台超薄的 iPhone Air 并排堆叠。 生产进度方面,蒲得宇透露 iPhone 18 Fold 交由富士康组装生产,目前已进入新产品导入(NPI)阶段,这意味着产品已从设计转向生产验证,预计大规模量产将于 2026 年下半年启动。 这一时间线与先前关于苹果首款折叠屏设备将于 2026 年底推出的传闻相符,具体发布时间点很可能在同年 9 月 iPhone 18 系列发布之后。 IT之家注:NPI 是制造业中的一个专业术语,指一个新产品在完成设计后、进入大规模量产前的关键验证阶段。在这个阶段,工厂会进行小规模试产,以测试和优化生产线、解决潜在的制造问题,确保产品能够被稳定、高效且符合质量标准地生产出来。
亚马逊贝索斯“蓝色起源”公司发射火箭送6名乘客亚轨道飞行
IT之家 10 月 8 日消息,据 Space.com 今天报道,亚马逊创始人杰夫・贝索斯创办的“蓝色起源”公司今天举行了其第 15 次太空飞行活动,将 6 名乘客短暂送上太空,其中有一名神秘乘客直到飞行结束才公开身份。 ▲ 图源蓝色起源官网,下同 蓝色起源公司的新谢泼德火箭在美东时间上午 9 点 40 分(北京时间晚上 9 点 40 分)点火发射,开启代号为 NS-36 的亚轨道飞行任务,进程一切顺利,发射约 8 分钟后一级火箭实现垂直动力着陆,飞船客舱随后顺利打开降落伞,顺利降落在美国德州的一处沙漠中。 本次座舱中乘坐着特许经营行业高管 Jeff Elgin、媒体从业者 Danna Karagussova、电器工程师 Clint Kelly III、软件创业者 Aaron Newman 及乌克兰商人兼投资者 Vitalii Ostrovsky,同时还载有一名希望在飞行结束前保持匿名的神秘乘客。 飞行结束后这名神秘旅客表示,他就是生物医疗公司 Insmed 的董事长 William H. Lewis。 目前新谢泼德火箭已经运行近十年,正如其代号所示,今天的飞行任务是这款可回收火箭执行的第 36 次飞行任务,但其中只有 15 次任务载有乘客,其余大多数任务都是无人科研飞行。 官方表示,本次飞行将 6 名乘客带到离地 66 英里(IT之家注:约 106.2 公里)外,略高于卡门线,整个任务耗时 10 分 21 秒,不过官方并未公布这种飞行的单人票价,作为参考,竞争对手 Virgin Galactic 公司的类似服务每人收费 60 万美元(现汇率约合 428.1 万元人民币)。
15年悬案告破:修复iPhone 4“天线门”,苹果只改了20字节代码
IT之家 10 月 9 日消息,科技媒体 9to5Mac 昨日(10 月 8 日)发布博文,报道称困扰业界 15 年之久的苹果 iPhone 4“天线门”事件谜底近日揭晓。软件工程师萨姆・亨利・戈尔德发现,当年导致信号格急剧下降的根本原因并非硬件缺陷,而是一个软件算法错误。 IT之家援引博文介绍,苹果在 2010 年推出的 iPhone 4,因其经典设计备受瞩目,但很快就被一场名为“天线门”(Antennagate)的争议事件抢走了风头。 大量用户发现,当以特定方式手持手机时,屏幕上显示的信号格会发生断崖式下跌。这一发现迅速引发了全球范围的关注和争议,成为苹果历史上一次重大的公关危机。 面对汹涌的舆论,苹果当时采取了多种应对措施,包括时任 CEO 史蒂夫・乔布斯曾公开表示“用户握持手机的方式不正确”。 不过,公司最终还是承认了问题的存在,并被迫向所有 iPhone 4 用户提供免费的保护套(Bumper Case),同时就一起集体诉讼达成和解,向受影响的用户支付了赔偿金。 苹果公司在当年的官方声明中指出,用于计算并显示信号格数的软件算法存在“完全错误”。该算法在许多情况下会错误地多显示 2 格信号,导致用户误以为自己所处区域的信号强度很好。 因此,当用户手持手机影响到天线接收后,他们看到的并非信号真实减弱,而是从一个虚高的、从未真实存在过的满格信号,瞬间回落到真实的微弱信号水平,从而造成了巨大的心理落差。 时隔 15 年,软件工程师萨姆・亨利・戈尔德通过对比固件代码,终于揭开了当年苹果修复该问题的具体技术细节。 他通过分析新旧两个版本的固件发现,苹果在 CoreTelephony 框架下的 CommCenter 安装文件中,修改了一个用于转换信号强度与显示格数之间对应关系的“查找表”(lookup table)。 这个修改仅涉及 20 个字节的数据。原有的查找表数值设定得“过于乐观”,导致大部分时间里手机都会显示 4 到 5 格信号。而新的数值则让信号格的显示曲线变得更加平滑和真实。 这一调整的结果是,用户虽然更难看到满格信号,但信号格也不会再出现断崖式下跌。戈尔德还发现一个有趣的细节:苹果在更新中还略微增加了前两格信号条的高度,这或许是一种心理学上的优化,从而让微弱信号看起来不那么糟糕。
“谷歌克星”杀入浏览器赛道!创始人万字揭秘
编译 | 陈骏达 编辑 | 李水青 当下最火的AI搜索引擎公司,为什么要做AI浏览器? 智东西7月15日消息,近日,在YC创业学校的分享会上,美国AI搜索引擎独角兽Perplexity创始人兼CEO Aravind Srinivas向外界深度分析了Perplexity入局AI搜索,又押注浏览器与智能体背后的转型逻辑。这家被外界誉为“谷歌克星”的创企,野心不止于AI搜索,还希望将其AI浏览器Comet打造为下一代“认知操作系统”,全面接管用户的上网体验。 Perplexity公司成立于2022年,创始人曾在OpenAI任职。其同名产品Perplexity以准确、快速、引用全面、无广告的搜索体验而获得用户喜爱,曾经多次被英伟达创始人黄仁勋点名推荐。 今年五月,Perplexity公司被曝即将完成新一轮5亿美元融资,投后估值达140亿美元(约合人民币1004亿元),这也是Perplexity在过去一年内的第五轮融资。另据彭博社爆料,苹果管理层对Perplexity已经产生了收购意向,以获取Perplexity的AI人才和技术。 尽管屡获融资,但作为一家创业公司,Perplexity没有海量计算资源,也没有庞大的用户基础。当谷歌等巨头入局AI搜索时,Aravind经常听到“Perplexity死定了”这样的言论。不过,Aravind认为,巨头和头部创企的入局属于正常现象:“某个领域有钱赚,自然会引来模仿”。 Aravind认为,浏览器与搜索并非两个孤立产品,而是自然演进的一体两面,正如谷歌凭借Chrome浏览器推动每日搜索查询从亿级增长到数十亿次,浏览器在Perplexity未来战略中也是至关重要的,是构建移动智能体(mobile agent)的关键途径。如果仅仅依赖MCP等第三方协议打造智能体,限制太多、无法灵活调用第三方应用,相比之下,浏览器提供了理想的方式,使这一愿景得以落地。 面对搜索引擎和浏览器领域的竞争对手谷歌,Aravind提出了尖锐的批评。他认为,AI搜索与谷歌搜索在获利机制上存在本质冲突,因此,谷歌一开始并未下定决心将AI能力集成至谷歌搜索上,这也导致谷歌无法充分利用其分发渠道。 在Aravind看来,谷歌的AI搜索产品只是“换个名字,换个副总裁和团队,功能本质上没什么不同”。在2023年-2024年期间,谷歌使用的内部模型在业内并不算领先,而Perplexity却可以自由使用OpenAI、Anthropic和其他企业的顶尖模型,这给Perplexity带来了以往难以想象的竞争优势。 Perplexity目前正在“用极限速度跑马拉松”,Aravind称他们“必须创新,必须比别人快”。入局AI浏览器赛道后,Perplexity希望将Comet打造成一款完美融合AI、网页导航和智能体体验的产品。 Aravind还回顾了Perplexity创业过程中的经验与收获,AI编程工具对公司日常运营的影响,以及AI搜索产品对互联网生态的影响。 以下是Aravind Srinivas今年6月在YC创业学校上分享会的完整编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改): 一、Perplexity面临冲击,押注浏览器和智能体 主持人:请你简单介绍一下Perplexity的近况。 Aravind Srinivas:不管你信不信,我每天都要处理基础设施的问题,确实有很多人在使用,甚至增长到了我们不知道该如何应对的程度。我们必须重建基础架构,以支持下一个10倍的增长。也要感谢在场的大家的支持。 接下来我们最关注的,是浏览器。我们把它视为公司未来发展的重要方向。 很多人会问,既然已经有搜索引擎和其他AI应用,为什么我还要用Perplexity?当然,ChatGPT的用户分布比我们广,其他AI应用也都在试图将搜索嵌入进去。它们都支持引用功能,也涵盖了我们在一些垂直领域投入的努力。当然,我们仍然会在这些方面做得比别人更好。 但我们认为,浏览器和智能体才是真正值得押注的方向。我们将浏览器视为一个助手,而不是一个完全自主的智能体。它是一个万能框(Omnibox),可以进行信息查询、分配智能体任务。 你的AI助手将驻留在新标签页和网页侧边栏,随时为你服务。这将使浏览器不再只是浏览器,而更像一个认知操作系统。 我们希望它像一个云端平台,可以并行运行多个异步任务,调用你的联系人、邮件、日历、亚马逊账号、社交媒体账号等所有个人数据资源。比如,你可以用它研究房地产或金融市场,它们在浏览器中运行,就像在你的计算环境中运行的多个进程。这在以前是做不到的。 Chrome令人兴奋的地方在于每个标签页都是一个独立的进程。我们设想未来,每一个查询、每一个指令,都可以成为一个进程。而这,就是我们正在打造的浏览器——Comet。我们正全力以赴投入其中。 二、大公司模仿难以避免,创业者靠速度取胜 主持人:其实我本来想把这个问题放在最后问你,但既然你已经提到了,我们就现在谈吧。 如果Sam Altman今天还在台上,他大概会说:“哦,对,这也是我们正在做的事。”谷歌的CEO Sundar Pichai大概也会说:“我们也在朝这个方向努力。”很多人手里都有充足的资金,都在朝着类似的方向前进。 你怎么看待这个趋势?你认为未来会出现多种细分用例,而你们可以主导其中一个?还是说这会是一场正面对决的大混战? Aravind Srinivas:如果某件事真的值得去做,那么自然会有资金充足的人来做。别人说Perplexity是个很棒的产品,现在每个公司都想做一个可以回答问题并附上来源的产品。 Cursor是一个很棒的产品,现在OpenAI想收购它的竞争对手,Anthropic推出了Claude Code,谷歌也有类似的工具。这很正常,某个领域有钱赚,自然会引来模仿。 但你不可能在所有领域都做到世界一流。不论是构建顶级模型,还是打造一两个真正优秀的产品,总得有所取舍。对我们来说,唯一重要的事情是答案的准确性、任务执行的准确性,以及工具的编排整合。而浏览器,比打造另一个聊天工具要难复制得多。 话虽如此,我也假设OpenAI、Anthropic会打造AI浏览器,而谷歌已经有Chrome了,他们做AI浏览器也是完全合理的。但我们唯一的模式依然是速度。你必须创新,必须比别人快。这就像是在用极限速度跑马拉松。 主持人:一个人最多只能专注做好一件事。我们刚才在后台的时候,你还在给我展示你们最近在开发的新功能,发现了一个Bug,你立刻停下手头的一切去调试。大公司的CEO可能早就交给别人处理了。但你亲自查找原因,说明你是真正在乎这件事。我觉得这是一个很有力的例证。 Aravind Srinivas:是的,我喜欢处理和修复Bug。听起来好像不重要,但我真的很喜欢。是不是CEO最该做的事?很多人会觉得不是。但最近我听说,有些人希望这种行为能“传染”给更多人,甚至连Sundar最近也在X平台做Bug支持。我觉得这也算是个正面榜样。 三、创业不必死守单一想法,也不能朝三暮四 主持人:现场很多人都是学生、应届毕业生或者研究生。你创业的故事,应该会让他们很有共鸣,因为他们现在正处在人生类似的阶段。你是怎么开始创业的? Aravind Srinivas:我们其实是在没有明确产品方向的情况下就创办了这家公司,这跟YC建议的路径相反。YC通常建议你从一个项目开始,把它打磨成一家公司。 但我觉得,在今天AI技术进步如此迅速的环境下,你不必一开始就死守一个想法。但同样重要的是,你也不能每周换一次想法,这样也不行。得从一个方向出发,认真思考,迅速动手做出来,然后尽快让用户用上。 我们曾经开发过一个工具,就是自然语言SQL,我们当时将其视为一个搜索工具,用于搜索关系型数据库。 我们最初做的是自然语言SQL,把它当作一种搜索工具,在关系型数据库中搜索。我喜欢Twitter搜索,也喜欢早期Facebook Graph Search。于是我想用语言模型把它重新做一遍。 我非常喜欢Twitter这个平台,但它的搜索体验很差,现在还是一样。我们把整个Twitter的数据组织成关系型表格,再把用户的自然语言查询转成SQL语句,查询数据库,效果特别好,这也是我们最初的起点。 后来我们意识到,想要将这种搜索扩展到整个互联网,这种方式行不通。你不可能把每个网站都转成表格,也无法用这种方法回答所有问题。 因此,我们转而押注语言模型,认为它们未来可以完成推理、解析和结构化。更重要的是,一开始就从非结构化内容入手。最终,这个方向就变成了Perplexity。 主持人:在真正创业之前,你是如何找到联合创始人的?又是怎么决定要专注于机器学习和AI的? Aravind Srinivas:因为那是我唯一擅长的领域。我对别的事情都不在行。既然如此,为什么要去创办一家外卖公司或者社交媒体公司?我根本就不合适。AI和机器学习是我唯一熟悉的东西。 其实挺有意思的,我们创立的是一家AI公司,但当时大家都笑话我们:连自己的模型都不训练,全都是用现成的大模型。其实我们也训练了很多不同的模型。 但这也说明,做事时需要有一种知己知彼的谦卑,你得清楚自己擅长什么,有哪些资源,哪些事情是你能力范围内可以做到的。 我的联合创始人是我研究生时期就认识的同学。我们一直在讨论各种想法,积累了很久的默契。我认为读研究生其实是认识创业伙伴的一个非常好的方式。 你并不是带着“将来要一起创业”的算计去和他们交流,而是因为他们是有趣的人,这就是YC网络的意义所在。即便你的第一个创业项目失败了,你也能接触到很多很棒的人,也许将来他们就会成为你的合作伙伴。对我来说,研究生阶段正是这样的经历。 四、项目始于推特搜索引擎,大模型+搜索展现独特魅力 主持人:初代Perplexity主要是为了有效地进行Twitter搜索。那么你们是什么时候决定继续探索这一方向的呢? Aravind Srinivas:我们为早期用户提供了访问权限,他们非常兴奋且反复使用。我们观察到:产品往往先给人一种新鲜感,然后要么用户完全不再使用,要么他们会持续用下去。如果只是短暂的兴趣,说明根本没有真正的留存。 当看到我们为Twitter、LinkedIn、GitHub做的关系数据库搜索,能够持续吸引用户使用,我们便意识到将大语言模型与搜索相结合有某种独特的魅力。 于是,我们开始思考:如果我们直接给用户答案,并附上引用来源呢?于是我们将这个功能以Discord机器人形式推出,同样获得了稳定的使用,不是那种“一天新鲜感后就被遗忘”的情况。 因此,我们下定决心正式推出产品。事实上,我们是在ChatGPT发布后七天上线的,那个时候ChatGPT还没有网络搜索功能,是个不错的切入时机。 很多现在成功的AI产品——包括Cursor在内——都是在2022年底或2023年初发布的,从AI时间尺度来看,它们都算是“老玩家”。对我而言,真正的“顿悟时刻”是在跨年夜,当时有接近70万次查询请求。 我心里想:“这个产品的名字对普通消费者来说非常糟糕,叫Perplexity,根本不好传播。而且速度极慢,每个查询要花7秒,准确率也不高,经常产生幻觉,背后还是一家无名公司,没有知名创始人,只有一两百万美元的种子轮融资。” 尽管如此,人们依然愿意去分享截图。在跨年夜那天,本可以看Netflix,而他们却选择在使用这个产品。那一刻我意识到,这确实是真实的需求,于是我开始坚定地投入到这个愿景中。 五、谷歌做AI搜索没有优势,产品换汤不换药 主持人:在那时,你是否已经在确信自己正在打造一个能与谷歌竞争、甚至有潜力取代谷歌所覆盖的巨大市场的产品? Aravind Srinivas:其实,我第一次萌生这种想法,是在Google发布Bard的博客文章时,Sundar亲自写了那篇博客。当时我们正在进行A轮融资,所有人都在说:“Bard要做你们正在做的事情。” 我当时在想:“为什么一定要专门去做一个Bard?干脆直接把它集成在谷歌搜索上不就好了?你们明明拥有全世界最强大的分发渠道,完全可以直接更新核心产品。” 可越想就越清楚:如果用户能够直接得到关于“旧金山有哪些能看到金门大桥景观的最佳酒店”或“纽约中央公园附近配套设施最好的住宿”这类问题的答案,还能立刻点链接预订,那么谷歌要如何从Booking、Expedia或Kayak这些广告主身上赚取广告费? 在购物领域也一样,如果给出直接的答案并提供购买链接,谷歌要怎么继续让亚马逊和沃尔玛等广告主竞价投放?从收入激励上来说,谷歌没有动力去给出最准确直接的答案。 正是这时我意识到,谷歌必须新建一个产品来做这件事,但他们永远无法在核心搜索里充分利用分发能力。2023年到2024年期间,谷歌在任何时间点拥有的模型,大概都只是排在第四或第五名。 作为一家创业公司,我们能使用比谷歌内部更强的AI模型,这在以前是完全无法想象的。如果早些年你想要做AI产品去和谷歌竞争,那几乎是没戏的。你根本得不到比谷歌更好的AI技术支持。可现在情况完全反转,这要感谢OpenAI、Anthropic以及开源模型的出现。 再加上创新者困境,以及我们可以容许自己犯很多错误都无妨,而谷歌犯一次错就会影响股价。当时Bard的演示失败,导致谷歌股价立刻下跌6%——我们清楚这是对我们有利的局面。 主持人:你最近也提到过,谷歌一直试图打造类似Perplexity的体验。你开玩笑说,他们每年都给同样的功能换个名字。 Aravind Srinivas:确实如此。他们每次I/O大会都会宣布相似的东西,换个名字,换个副总裁和团队,功能本质上没什么不同。也许产品能力在逐步改进,但始终没有面向所有用户全面发布。 主持人:我很佩服你对用户体验的专注。你曾告诉我,这也是你从拉里·佩奇写的那本关于谷歌的书中学到的。你觉得谷歌为什么失去了这种能力? Aravind Srinivas:最主要的原因是它已经是一家规模巨大的公司,不再由创始人亲自领导了。这样一来,承担风险变得非常困难。我并不认为他们没有优秀的人才,相反,我觉得他们有非常出色的工程师。问题更多在于激励结构:要为了长期正确的方向而愿意承担短期股价下跌,这本身就极其困难。 说实话,我很庆幸这种困境的存在,否则,初创公司又从哪里找到切入机会呢?如果创业公司没有机会胜出,最后就只会是垄断巨头愈发庞大,这对世界而言不是好事。现在我们能赢,同时谷歌也能不断推出新产品,用户可以真正地比较这些产品。 以前在信息获取领域,没人会认真考虑谷歌之外的替代品,那会被视作浪费时间。如今,至少大家会先去问问这些AI应用,比如ChatGPT、Perplexity、Gemini,再考虑是否还要去谷歌搜索。甚至很多人已经不再用谷歌,而是只在AI工具中搜索。 各大手机厂商未来也会在设备里集成多种AI助手,而不再只有一个默认搜索选项。我很高兴看到这样的竞争,让整个生态更加公平。 六、融合AI、网页导航和智能体,Comet要“接管”用户体验 主持人:你刚才在后台也和我聊到,现在你们面临来自各方的竞争压力,但如果看你们的数据,似乎并没有受到明显影响。 Aravind Srinivas:没错。我每次看Google I/O大会相关的Twitter评论,都是一模一样的场景重演。去年I/O大会推出了AI Overview,大家说“Perplexity死定了”。今年又推出AI Mode,还是说“Perplexity死定了”。 我也看到了这些评论,实际上我挺喜欢的,因为这些评论背后的潜台词是“Google会不会真的做这个?”或者是“他们的人会不会真的把这个功能完善?”而事实是,大多数用户根本接触不到这些功能。 当然,竞争确实是真实存在的。我们必须承认,OpenAI的资金实力极其雄厚,也没有什么创新者困境的包袱。他们确实在努力把搜索功能融入ChatGPT,而ChatGPT已经是目前最成功的面向消费者的AI产品了。 与这样一个对手竞争,难度很大。因此,我现在特别希望推动公司进一步发力浏览器方向。我认为Comet浏览器可以成为所有聊天机器人的“抽象层”。 如果你允许Comet浏览器接管你的体验,所有ChatGPT的对话内容都能输入到这个AI里,这样你就不用再为记忆或个性化等问题操心了。 Comet会做很多传统聊天机器人做不到的事情,比如访问你的其他浏览器标签页、调取浏览历史、帮你自动填写表单、支付信用卡账单、下单购物,甚至充当你的情报员,先帮你完成各种研究。对于那些周期性、重复性的任务,这才是浏览器能够赋予用户的真正魔力。 要把这种能力迁移到移动端,工程难度极大,至少需要几个月的开发,我并不担心有人很快抄袭这个方向。要让用户迁移到新的浏览器,本身就是个重大的决策。 主持人:在短期内,你觉得这个浏览器会在哪些方面做得比Chrome好得多,能立刻让用户愿意迁移? Aravind Srinivas:我们会提供一个完美结合AI、网页导航和智能体的体验。虽然这个回答听上去平淡无奇,但实际上至今没有人真正把这三者做到极致。如今全球已经有数亿人习惯使用AI,市场基础已经非常大了。 主持人:举个具体例子,如果我明天就能用上它,我可以怎么用? Aravind Srinivas:你可以用它来安排会议、回复一些你根本不想看的邮件。比如说,你在主办一个Y Combinator的活动,只想接受斯坦福退学的申请人,AI可以把所有报名的人资料过一遍,自动抓取LinkedIn链接,筛选出既是斯坦福校友又退学的人,然后自动审批入选。 当然,我并不是说这样的筛选条件是好主意,否则我自己都不会被选上了。希望你对招募标准更开放一些,我们也会考虑深度学习领域的研究人员。 七、强制使用AI编程工具,但也会带来新型Bug 主持人:接下来聊聊你如何管理公司。你现在大概有多少名员工? Aravind Srinivas:我们大约有200人。 主持人:公司规模已经不小了。现在有了代码生成类AI工具,你们是否全面采用它们?是不是所有人都在“Vibe Coding”? Aravind Srinivas:其实也不能所有事情都靠“Vibe Coding”来解决。我们经常遇到基础设施层面的复杂问题,在生产环境修Bug时肯定不能用“Vibe Coding”的方式。 那种情况下,我还是希望团队拥有扎实的软件工程、基础设施和分布式系统能力,这些技能是不能被完全取代的。不过在前端设计方面,我们看到了非常大的效率提升。Cursor基本上成了所有人都在用的工具。 我们已经规定,所有工程师必须至少使用一种AI编程工具。在Perplexity内部,最常用的是Cursor,以及Cursor和GitHub Copilot的结合。可以说,这已经成为强制性的标准。 机器学习工程师们用它的方式也非常高效:有时候他们读到一篇新论文,只需把代码截图上传给Cursor,就能自动编辑代码文件实现新算法,还能自己生成单元测试,再运行实验。以前要花三四天的工作,现在一小时就能完成。 有些同事不懂设计,假如我在iOS App里看一个界面,截图以后在上面画个箭头,说“这个按钮要移到这里”,他们就把这张截图上传给Cursor,要求它修改SwiftUI文件。这样的开发体验非常不可思议。修Bug、上线产品的速度远超以往。 当然,Bug总是比代码写作速度跑得更快。不过需要澄清一点,我非常喜欢这些AI工具,但它们确实也带来了新的Bug,而且很多人并不知道这些Bug是怎么产生的,更不清楚怎么去修复。 这个过程并不完美。我个人也很看好一些新工具,比如Claude Code在代码生成上的表现,已经比Cursor还要智能。我相信这是正确的未来方向,但当下也仍然存在不少问题。 八、现有AI产品没有强网络效应,品牌是生存通行证 主持人:大家经常提到一个问题:随着这些代码生成工具变得越来越强大,像你们这样的公司所做的事情将来会越来越容易被复制,那么在这种情况下,你们公司的持久价值到底在哪里? Aravind Srinivas:我认为,品牌本身确实具有巨大价值。市场上有Cursor的竞争对手,也有Perplexity的竞争对手。OpenAI未来也会推出他们自己的Cursor,实际上OpenAI在ChatGPT里也已经集成了类似Perplexity的功能,但这些并没有消灭掉任何一家相关公司。 当你的用户规模达到几百万、甚至是数百万付费用户时,品牌就会变成一张“生存通行证”,让你不至于很快被取代。你赢得了继续发展的权利。所以,品牌很重要。 “品牌叙事”对品牌而言也同样重要。你必须清楚地向用户说明:为什么你需要存在? 对我们来说,我们最在意的就是“准确性”。这个领域里已经存在100个聊天机器人,但我们是最注重让尽可能多的答案正确的那一个。 我们也非常重视速度——无论在App还是网页上,我们依然是“从提出问题到生成第一部分答案”最快的,即使我们在后台进行了搜索。我们也格外看重如何呈现答案。当你对某些事情有执念,那就会塑造你的叙事和品牌认同。 只要你能获得一定程度的分发渠道,我不是说非得拥有一亿用户,但如果你有几千万用户,那么无论别人发布什么产品,你都拥有继续“留在赛场”的资本。 在此之前,这确实是一个巨大的挑战,你必须时刻担心竞争。即便是现在,我们也保持高度警惕,唯一的解决办法就是:不断加快节奏,持续推出新功能。 主持人:除了品牌之外,你是否考虑过Perplexity会不会出现任何“网络效应”? 其实品牌本身就带有网络效应,人们会互相推荐、相互影响。但目前所有AI产品都没有那种应用内的强网络效应。 不像WhatsApp,虽然Meta这个公司品牌未必被所有人信任,但你也很难让用户迁移到新的聊天软件,因为他们所有的联系人、群组都已经沉淀在WhatsApp里了。 AI产品还没有形成这样的锁定。主要原因在于,你可以很轻松地导出你的ChatGPT历史记录,把数据迁移到别的应用里,所以不会像社交网络那样形成牢固的关系网络壁垒。 我认为,浏览器绝对会是一个可以着手解决这些问题的重要工具,因为它掌握了你的浏览历史。虽然你依然可以导出这些数据,但这跟直接获取一份CSV导出文件,包含你的密码、钱包、以及你的智能体记住的所有东西,是不一样的。 有许多你日常生活和工作中依赖的任务,都是在浏览器里运行的。这是一个让产品变得更加“黏性”、形成网络效应的好方法,尤其是当多人共享同一套任务时,你可以把它分享给他们。这也是把所有功能提升到新水平的路径之一。 九、MCP模式容错率低,浏览器拟人操作可破解困局 主持人:听起来,你想帮助用户解决的很多事情,其实都需要和其他公司整合或合作。如果你能把这些合作做好,就会形成某种网络效应:你的产品体验更好,而竞争对手要赶上,就得去重建同样的集成或谈成同样的合作。 你觉得未来会是什么样呢?Perplexity要和全球所有航空公司、酒店、电商平台去谈合作吗? Aravind Srinivas:其实我们已经和Southbook合作了,所有在Perplexity上完成的酒店预订都是由他们提供技术支持的。我们也和TripAdvisor合作,提供各类酒店和目的地的评论信息,还有地图的合作。我们和Yelp也有合作。 在购物领域,我们有许多商家直接通过平台销售商品。我们与Firmly合作,将预订转化为原生购买。Shopify也是我们的合作伙伴之一。 在金融领域,我们与FMP合作;在体育领域,我们与Stats Perform合作。各个垂直领域都有很多数据提供方在和我们合作,而且我们认为未来会进一步扩展。 当智能体开始真正“做事”时,一些公司会愿意成为MCP服务器,也有一些公司并不愿意。有些只希望保留自己的网站。我们构建的浏览器智能体将足够通用,去尊重第三方的各种选择。 归根结底,智能体是用户授权代表自己行动的。如果没有MCP服务器也没关系,依旧可以用这些标签页,就像用户亲自操作一样。这是浏览器的关键优势——如果你只专注于MCP模式,就会丧失这一点。 如果完全依赖MCP模式,你就得确保第三方服务器一直稳定可靠,数据协议必须完美无误,你的聊天机器人要能应对各种问题。而如果把它设计成模拟一个人如何使用网站的方式,你就拥有了完全的掌控,不必依赖他人把工程做好。 十、正探索多元变现渠道,未来或将按次计费 主持人:接下来我们聊聊商业模式。你的主要竞争对手谷歌,是通过广告盈利的,你提到这让他们无法做好你们在做的事情。那么Perplexity未来的商业模式会是什么?要如何实现与谷歌同量级的收入? Aravind Srinivas:坦白说,我不确定我们能否获得和谷歌同等量级的利润,而且我也不觉得必须如此。历史上,哪怕是谷歌自己,也从未再创造出跟它搜索广告同样利润率的第二个业务。就算我们做到比现有上市公司都好,依然可能远不如谷歌,这是完全合理的。 其次,订阅收入给了我们很大信心。我们从没想到会走到这一步。我们相信,光是订阅每年就可以增长到数十亿美元的规模,这本身就是一门很棒的生意。 还有按使用付费:人们为智能体完成某个任务付费,或者为持续的、周期性任务按次付费,费用对比请一个人来做同样的事情,可能会非常划算。 我不确定这会如何发展,也不确定利润率会怎么样。有可能比订阅更受欢迎,但毛利率低一些,因为每次使用都要支付成本。有的人订阅了一个AI产品,一个月里一次都没用,这对我们来说就是很高的毛利。 我现在也无法给出特别清晰的未来蓝图,但可以确定的是,订阅和按使用付费一定都会存在。如果人们开始通过AI完成更多购买,我们也会抽取交易佣金。不过历史上,按效果付费(CPA)的利润率一直低于按点击付费(CPC),所以谷歌一直没做成交易平台。 也正因为如此,我说这个市场会很大,但不一定能赚到谷歌那么多钱。谷歌的商业模式可能是人类历史上最成功的商业模式,或许正因为如此,也只有AI才能真正挑战它。 主持人:我想请你给在座的创业者一些建议。如果你回到四年前,处在他们的位置,你会建议他们怎么做? Aravind Srinivas:我会说,一定要非常努力工作,别无他法。不要自以为聪明,靠各种策略就能绕过竞争。 如果你的产品足够成功,可以做到上亿甚至几十亿的收入,那你就必须假设大型AI公司一定会模仿你。因为他们急需变现,筹了数百亿美元,必须给这些投入找回报,所以他们会去复制任何好的产品。 你要学会和这种压力共处,甚至拥抱它。你的护城河就是比别人更快、形成自己的独特定位。 最终,用户在乎的,是你能否满足他们的具体需求,就像找家政服务时,他们会想找一个具体的人,而不是随便去个大公司。每天醒来,都要怀着对产品的激情,这会成为你持续前行的动力。 主持人:你们是一个很好的例子,证明了挑战Google这样的大公司也是有可能的。 十一、浏览器与搜索一脉相承,打造移动智能体必须依赖浏览器 观众:你们最近和英伟达合作,把AI模型推向整个欧洲,还有传言说Perplexity会预装在所有三星手机上。据彭博社等消息,这可能会让你们的估值达到140亿美元。成为大众的默认搜索引擎,是一个沉重的责任。你觉得Perplexity最重要的事情是什么?怎样防止把虚假的信息或错误数据传播给大众? Aravind Srinivas:我们非常重视“幻觉”问题。我们内部在建立各种基准体系,实时监测和改进。最有效的办法,就是持续建设更好的搜索索引,不断捕捉网站上更精准的片段。 模型的推理速度也越来越快,现在已经能在不增加太多成本的情况下,对每个问题进行多步推理。这也是降低幻觉率的重要途径之一。 观众:我想问一下“创新者困境”。如果你是谷歌CEO,或者是谷歌联合创始人,你会怎么做?会不会考虑牺牲现在的商业模式去争取下一个产品?或者说,你会不会干脆把新产品分拆出来,单独运营,哪怕因此短期内丧失分发优势? Aravind Srinivas:我真的不羡慕那份工作。世界上没有人想接手那个位置,那是个非常艰难的角色。 要牺牲现有商业模式,去换下一代产品,还是把新产品拆分出来单独运营?说实话,我也不知道。我可以站在这里讲很多“如果我是他们”的假设,但他们才真正掌握着庞大的用户数据。 要知道,世界上其实有很多人讨厌AI。如果你硬把AI“强行塞到”这么大的用户群里,绝对不是件容易的事。至于我会怎么做,我真的无法回答,也不想身处那样的位置。 顺便说一句,如果未来AI回答里每条都插广告,你们也会讨厌它的。有像我们这样的替代方案,是件好事。 观众:有很多创业公司,会先找到一个基础模型的“酷炫应用”,做出产品。一旦有了规模,基础模型公司就会把这个能力内建到自己的平台里。 Perplexity其实也面临类似的问题,很多大模型都在整合搜索功能,比如ChatGPT、Gemini等。你怎么看待这种情况?是要转型?还是把现有事情做到极致? Aravind Srinivas:我的看法是:先选定一件事,努力成为这件事上被人记住的品牌。是的,很多人都在集成搜索,但我们依然想做到“最快、最准”。这不是嘴上说说就行。 我们也必须想出新的策略,创造出尚不存在的新产品。对我们来说,浏览器就是新的大项目。浏览器和搜索,其实不是两个完全独立的产品,而是一个自然的演进。就像谷歌当年从谷歌搜索到Chrome浏览器一样。Chrome正是他们能从几亿查询增长到每天上百亿查询的关键。当年谷歌上市时,还没有浏览器,查询量可能一亿级,现在已经是几十亿了。 浏览器对我们的未来非常重要,这也是我们坚定下注的原因。我非常确信,要想真正构建一个移动智能体(mobile agent),必须依赖浏览器。如果你完全依赖操作系统(苹果、谷歌)制定的规则,比如无法随意调用第三方应用、或要求每个应用都提供MCP服务器把数据接入,根本不现实。没人愿意被AI这么快地中介化。浏览器是把这一切构建起来的理想方式。 十二、创业受挫时,靠马斯克视频“打鸡血” 观众:我们在座的很多人都创业过,失败过,有些人更成功,有些人像我一样屡败屡战。当你处在一次次失败的深渊里,觉得一切都要塌了、功能没法上线、又冒出重大Bug时,作为CEO或者创业者,你会对自己说什么?是什么支撑你继续走下去? 又或者,在一开始还没起飞的时候,是靠什么让你不放弃,继续努力,而不是干脆回去OpenAI上班? Aravind Srinivas:我就是去看Elon Musk的YouTube视频。(全场笑)我是认真的。我可以告诉你哪一条视频:有一个采访,是他们火箭第三次连续失败,记者问他怎么想,他说:“我绝不会放弃,除非我死了或丧失行动能力。” 我希望能一直保持这样的心态。但说实话,这并不容易。他已经坚持了比我们更久,大家都敬佩他。这个世界上有很多伟大的创业者,都是在所有人都不看好的情况下,依然坚持了下去。你又有什么好失去的呢?只要继续干就行。 观众:我想问一个关于Perplexity“可持续性”的问题,不是商业模式,而是整个互联网生态。最近很多研究发现,像Perplexity这样的AI搜索引擎,给网站带来的流量比传统搜索少得多。 未来五到十年,当这些网站因为流量锐减被迫关闭,整个网络会变得更“安静”,内容创作也会减少。你怎么看待这种未来?Perplexity在其中扮演什么角色? Aravind Srinivas:我觉得,网络本来就有极度的“长尾效应”,是一个巨大的幂律分布。未来这个幂律只会更加陡峭,这是显而易见的。一些知名品牌仍会保留直接的自然访问流量,而那些通过SEO“蹭”流量的人,肯定会日子更难过。 观众:我想请教两个问题:第一,你们如何界定“摘要”和“抄袭”的边界?如何在报告生成时避免侵犯知识产权?第二,新闻和其他人类写作的内容里经常带有政治倾向和个人立场,你们如何处理这些偏见? Aravind Srinivas:确实,有些问题是有客观真相的,比如“NBA比赛的比分是多少”,“现在旧金山的实时天气”。在这类查询上,你必须始终保证正确。即便如此,你也依赖某些数据提供方——直播比赛的频道、气象服务商、苹果或谷歌提供的天气数据。 归根结底,一切都基于信任。信任是靠长期准确积累的。我们尽力去展示“值得被信任的数据来源”,这是我们对准确性的理解。但很多事情并没有单一真相。面对这种情况,我们最好的做法就是提供多元观点,而不是去判定孰对孰错。 观众:那你们会通过用户反馈来衡量这些答案的准确性吗? Aravind Srinivas:目前我们并没有建立这样的衡量体系,但确实应该去做。我们应该建立一套专门的评估集,专门针对那些没有标准答案的问题。 不过,要为这种问题建立自动化评估很难,因为“正确答案”是主观的。比如“新冠起源”这种议题,观点各不相同。如果只看维基百科,那人类评审可能会说:“它列举了维基百科说的所有内容,这是好答案。” 但或许用户希望看到维基没有的内容,这就需要更聪明的评审者。而这种评审者,不是“Scale AI”式廉价劳动力能胜任的。 观众:我想问你们市场策略的问题:你们做过面向学生的营销活动,我和很多大学生就是因此知道你们的。同时,你们还和Costco做了合作,那是完全不同的受众。你们是怎么决定要针对哪些群体的? Aravind Srinivas:在我看来,关键是要进入那些你通过传统渠道接触不到的用户分布。很多人根本不用Twitter或LinkedIn,但他们真实存在。只是我们生活在自己的信息茧房里罢了。 而有些企业在这些人群中有很强的渗透,比如Costco等传统企业。如果你想要触及这部分人群,就要调整策略去适配他们。 当然,增长也要有“邻接性”。你希望用户群体之间有部分交集,这样他们会成为你的口碑传播者,帮助你进入新的圈层。我认为,要有一些交集,但分发渠道要不断进化。
果粉期待五年新品终于有消息!苹果HomePod mini 2有望今年底发布
快科技7月15日消息,苹果于2020年10月推出了第一代HomePod mini,凭借其小巧的体积、出色的音质以及对Siri语音助手和HomeKit智能家居控制的支持,赢得了众多果粉的喜爱。 不过自发布以来,HomePod mini的核心硬件一直维持在五年前的水平,这让许多用户对其升级换代充满期待。 据Mark Gurman最新透露,苹果计划在今年底推出第二代HomePod mini,预计发布时间将在9月iPhone发布会之后至11月之间。 新一代产品将带来多项重大升级,满足用户对更快网络、更高音质和更强AI功能的需求。 HomePod mini 2将支持Wi-Fi 6E,相比第一代的Wi-Fi 4,这将大幅提升传输速度并减少延迟,在播放高音质音乐或同步多台设备时表现更为出色。 新一代产品预计将搭载苹果自研的无线通信芯片,整合Wi-Fi与蓝牙功能,取代目前的第三方方案,从而在低功耗与性能之间实现优化。 这颗芯片还可能支持未来苹果生态内的无缝串流功能,进一步提升与Vision Pro、Apple Watch或iPhone的互动效率。 此外,HomePod mini 2有望引入第二代超宽带芯片(UWB),这是一种短距离高精度定位技术,能够实现与其他苹果设备的精准距离感知与连接。 在音质方面,目前没有明确证据显示HomePod mini 2会更换全新音响模块,但苹果一直对音质要求严格,预计此次会针对声场效果和低频饱满度等进行优化。 最后,HomePod mini 2还将推出新的配色选项,除了现有的午夜色、蓝色、橘色、黄色和白色外,可能会新增粉色、绿色或其他更具潮流感的颜色。
黑客利用AI生成恶意软件,可绕过微软Defender安全防护
IT之家 7 月 15 日消息,随着生成式人工智能技术的广泛应用,安全问题也日益成为公众关注的焦点。2023 年,微软的一项研究揭示了一个令人担忧的趋势:黑客开始利用像微软 Copilot 和 OpenAI 的 ChatGPT 这样的人工智能工具,对毫无防备的用户实施网络钓鱼计划。 如今,网络攻击者变得更加狡猾,他们不断想出巧妙的方法来绕过复杂的安全系统,以获取未经授权的敏感数据。最近几周,就有用户精心策划骗局,试图降低 ChatGPT 的安全限制,诱使其生成有效的 Windows 10 激活密钥。 Windows 用户对微软 Defender 并不陌生,这是一个复杂的安全平台,旨在保护用户免受黑客的恶意攻击。然而据 Dark Reading 报道,安全研究公司 Outflank 的研究人员计划在 8 月的“黑帽 2025”网络安全大会上发布一种新型人工智能恶意软件,这种恶意软件能够绕过微软 Defender for Endpoint 的安全防护。 Outflank 的首席进攻专家负责人凯尔・艾弗里(Kyle Avery)在接受采访时表示,他花了大约 3 个月的时间开发这种人工智能恶意软件,并花费了 1500 至 1600 美元(IT之家注:现汇率约合 10759 至 11476 元人民币)用于训练 Qwen 2.5 大型语言模型(LLM),使其能够绕过微软 Defender 的安全防护。 有趣的是,这位专注于人工智能的研究人员还分享了他对 OpenAI 的 GPT 模型及其最新旗舰推理模型 o1 的见解。尽管他承认 GPT-4 相比 GPT-3.5 有了重大升级,但他指出,OpenAI 的 o1 推理模型具备了更复杂的功能,尤其擅长编程和数学。 艾弗里表示,DeepSeek 利用强化学习技术来提升其模型在广泛主题上的能力,包括编程。因此,他在开发能够绕过微软 Defender 安全解决方案的人工智能恶意软件时,也应用了这一理论。 研究人员承认,开发过程并非易事,因为大型语言模型主要通过互联网数据进行训练,这使得他难以获取传统恶意软件来训练人工智能驱动的等效产品。此时,强化学习发挥了关键作用。研究人员将 Qwen 2.5 LLM 置于一个安装了微软 Defender for Endpoint 的沙盒环境中,然后编写了一个程序来评估该人工智能模型输出规避工具的接近程度。 据艾弗里介绍:“它绝对不可能直接做到这一点。也许一千次中只有一次,它会偶然写出一些能够运行但无法规避任何检测的恶意软件。当它做到这一点时,你可以奖励它生成了能够运行的恶意软件。” “通过这种迭代过程,它会越来越稳定地生成能够运行的恶意软件,不是因为你向它展示了例子,而是因为它被更新得更有可能进行那种导致生成有效恶意软件的思维过程。” 最终,艾弗里接入了一个 API,使模型能够更方便地查询和检索由微软 Defender 生成的类似警报。这样一来,模型更容易开发出在绕过软件安全屏障时不太可能触发警报的恶意软件。 研究人员最终实现了他期望的结果,成功利用人工智能生成了能够绕过微软 Defender 复杂安全解决方案的恶意软件,其成功率约为 8%。相比之下,Anthropic 的 Claude 人工智能在类似测试中的成功率不到 1%,而 DeepSeek 的 R1 模型的成功率仅为 1.1%。 随着人工智能骗局和恶意软件变得越来越复杂,像微软这样的公司是否会加大其安全解决方案的力度,将是一个值得关注的问题。在当前形势下,他们似乎别无选择。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。