行业分类:
加载中...
头条分类:
加载中...
本科学历但创造出GPT,奥特曼盛赞为“爱因斯坦级”天才,OpenAI总裁:他想要的,我们都给
白小交 发自 凹非寺 量子位 | 公众号 QbitAI 奥特曼称他是爱因斯坦级别的天才;OpenAI总裁更是直言: 只要他想要的,我们都给。 Alec Radford大神离职OpenAI,现在牵出更多细节: 改变世界的GPT,竟然是在Jupyter notebook上诞生的。 而他只负责提供背后的灵感,剩下的由工程师来解决。 (网友:那在Excel也可以做到这一点) 奥特曼高度评价:没有他应有的知名度。 他在Jupyter notebooks上发明了GPT 在奥特曼帖子下面,更多细节轶事被扒了出来。 比如事实是,他差点就放弃了将语言作为通往 AGI 的道路。 据这位OpenAI员工描述,在Alec在职最后一天他们有机会第一次谋面,他向Alec询问了坚持语言模型背后的原因。 大概在2017年,Alec花了几年时间来研究RNN,但是进展不大。 于是Alec就感觉很沮丧,就想着要不要退出OpenAI。最终他决定休息一个月来调整,重新思考自己的方案。 回来后不久,Ilya就跟他推荐了谷歌前同事的新论文,也就是那篇著名的Attention is all you Need。 于是乎,他就开始了新的架构尝试,并将其与无监督预训练相结合。 结果效果非常好,GPT时代就此开始。 同样还有CLIP,他曾为此闭关一年来解决计算机视觉问题,最终才得以推出。CLIP也成为后续解决2D计算机视觉问题的基础。 不过能造就GPT、CLIP,也是少不了OpenAI诸位同事对他的全力支持—— 当时他在Jupyter notebooks上编写代码,然后就让研究工程师在那里翻译。好奇心胜过一切。 OpenAI总裁Greg Brockman曾提到过这位天才:只要他想要的,我们都给。 当时是在2023年SXSW大会上,Greg Brockman表示,Alec Radford对语言非常感兴趣,一直在研究如何构建小型聊天机器人。 我们非常喜欢他,所以我们非常支持他做任何他想做的事情。与此同时,我们也在投资一些严肃的项目,我们就想,你知道,无论亚历克需要什么,我们都会确保他得到。 也正因如此,2017诞生了第一个有趣的结果——一个根据亚马逊评论训练出来的模型,它可以预测下一个角色、下一个角色、下一个字母是什么。实际上,它学会了最先进的情感分析分类器。你可以给它一个句子,它会说这是正面的还是负面的。这听起来并不令人印象深刻,但就是在这一刻,我们知道它一定能成功。” 还有同行们表示,他的一些想法是整个AI领域研究者们重要灵感来源。并且他从来也不吝惜地去分享他的时间和想法。 据这位朋友分享,当时他在学习ML,在MNIST训练一个普通的MLP,结果遇到了一个愚蠢的小问题。 然后Alec没有敷衍,又或者是帮忙修复这个小问题,而是立即开始教关于CNN方面的知识。 奥特曼:爱因斯坦级别的天才 他毕业于富兰克林·欧林工程学院(Franklin W. Olin College of Engineering)。 据网友透露,这是个规模很小、以项目为导向的工程学院。其声誉与Rose-Hulman理工学院和Harvey Mudd College等学校类似。 他们的学生在项目方向上往往有很大的个人自由度,并能直接接触到大量的教师和研究工作,这与其他院校的研究生经历不相上下。 随后就加入OpenAI,一干就是八年。 截至今日,他的论文被引数已超过19万。被引量排名前三的论文,分别与GPT-3、CLIP和GPT-2相关。 这三篇论文都为今天的ChatGPT打下了重要基础,实际上,Alec几乎参与了OpenAI所有的重大突破。 除了被引量最高的这三篇,从第一代GPT到GPT-4o的作者名单中,Alec的名字都赫然在列,并且前两代中都是第一作者。 Alec同样作为一作的CLIP,则是OpenAI在多模态路线上的重要成果,甚至在整个行业都极具影响力;同时,Alec也是OpenAI初代绘图模型DALL·E的参与者。 其他模态方面,OpenAI开源的语音识别系统Whisper,一作仍然是他。不过,最新的o1模型贡献者列表中已经没有了Alec的名字。 接下来,奥特曼表示,期待他以独立开发者的身份与OpenAI合作。 网友:不用博士学位也能干大事? Alec Radford的经历,牵出来更多研究层面上的讨论。 是不是不用博士学位也能干大事了? Stability AI创始人回忆,他们自己的博士占比也不高,大概80个研究者/工程师中只有16个博士。 这样看,博士学位是不是就不是招聘中的必选项了。 但也有持反对意见,这样以偏概全未免有点夸张和过于简单化了。博士学位不仅仅是一个证书,更是一个教会你如何批判性思考和系统地解决复杂问题的旅程。 而围绕这些细节,另一个讨论的主角是Jupyter notebook,网友们直呼:是个诞生天才想法的地方。 所以新的一年,从开始学习如何使用notebook开始吧。
年轻人不需要跨年演讲了,吴晓波更不需要
在吴晓波频道的公司介绍中, 一个从未改变过的价值观是:认可商业之美,崇尚自我奋斗,乐于分享贡献,反对屌丝文化。 01 撸起袖子加油干 2015年夏天的时候,吴晓波跟罗振宇约了一顿饭,饭局上吴晓波提议:是不是可以一起以类似跨年演唱会的方式搞一场跨年演讲? 彼时,吴晓波刚刚在深圳组织了一场名为“转型之战”的千人大课。这一年,是吴晓波由传统媒体转型自媒体的一周年,也是中国企业的转型元年——“互联网+”模式几乎把整个儿实体经济重新洗礼了一遍。 “转型之战”的课程内容包括宏观经济解读、转型企业案例、BAT资源以及工业4.0这四个内容板块,几乎是点对点的给急于转型的企业主们一场知识解渴。活动大获成功,1000张售价9000元的门票在不到半个月的时间里就销售完成,后来还不断有用户问询,工作人员说再来就只能是站票了,但仍止不住用户们下单的手。 钞票以一种吴晓波无法拒绝的方式扑面而来,跨年演讲的想法便应运而生。 他的提议得到了罗振宇的深度认可,俩人背后都有着巨大的商业蓝图,这种既可以收门票和赞助(据了解,吴晓波一场跨年演讲的收益在1000万~2000万之间,罗振宇这部分收入每年在3000万元以上),还能最大程度提升个人影响力的商业模式,没有说不的理由,于是俩人一拍即合。 不得不说,对于财富的认知,吴晓波与罗振宇有着惊人的相似:罗振宇认为,在财务自由之前什么都不要想,财务自由是确立你人生价值的基础。吴晓波也有类似的观点,他认为一个人思想自由的前提是财务要自由。 不过,他们在讨论之后很快发现,双方的用户社群属性差异过大: 罗振宇的主要用户是渴望利用碎片化时间来学习的年轻职场人,他曾说:如果贵州某自治县汽车修理铺对面的一个地址上,买的是《经济学通识》,那这就是我们干下去的根本动力。 这样的话吴晓波就从来不说,他的靶向受众是拥有一定经济实力的企业主和中产们。 用户群不一样会造成演讲主题割裂,基于此,俩人决定还是各说各的吧。 分野在开始时便已经产生,只不过当时烈火烹油,他们不知道人们有一天竟然会“不爱学习”,并将“知识天王”赶下神坛。 罗振宇甚至还有点上头,一口气承诺了20年,还提前发售了船票:预售99张20年联票,单价为40000元,300张18年联票,单价为36000元。总价近1500万元的联票很快被售空。 为了避开竞争,吴晓波选在12月30日,罗振宇选在12月31日。但读书人的事,怎么能说得这般市侩。所以,在吴晓波的语境里,是“把一年里的倒数第二天留给自己,最后一天留给爱的人。” 自此,年轻人的跨年方式就多了一种选择。 02 及时刹车 “没有哪种职业,具有像企业家这样的功利性。企业家的成功能被人记取和传颂,只有一种可能,那就是:他所一手缔造的企业仍然在创造奇迹。企业家总是需要有一些看得见、可以被量化的物质和数据来证明自己的价值。这些物质和数据还必须每年保持一定的增长,甚至,增长的速度应该比自己的同行还要快,否则,他就很难被视为成功。” “正是这种特征,构成了企业家不幸的宿命:除非退出舞台,否则永远不能以成功来定义。” 写《大败局》的时候,吴晓波对企业家的属性进行了这般解读,尽管吴晓波对自己的身份定位是记者,但拥有一家年收入能到3亿的自媒体公司,怎么不算是一个企业家呢? 于是,当跨年演讲来到10周年时,吴晓波宣布退出舞台了。 某种程度上,这不可谓是一种保全。 事实上,跨年演讲的热度比他们想象中要凉得快。早在2018年时,知识跨年的意义就开始遭受质疑。一个流传很广的段子是:中年人听罗胖的跨年演讲,与老年人买权健的营养保健品,其本质上没有任何差别。 而关于“跨年演讲”遇冷的相关报道,从2020年起就如赠品一般,随着吴晓波罗振宇们的每一场演讲前后出现。 并非媒体蓄意看衰,以罗振宇为例: 2016年罗振宇“时间的朋友”跨年演讲直播时,深圳卫视曾以1.69%的收视率位居全国同时段第一。2022年时,深圳卫视《2022时间的朋友——罗振宇跨年演讲》收视率仅为0.131%,位列同时期地方卫视节目收视率第九。 这股寒气在2023年达到高潮。跨年演讲当天,一则关于罗振宇“晚会现场上座率不到三分之一,内场4900的票在开场前暴跌到1500,黄牛全部亏麻了”的消息在社交媒体上暴走,尽管后续罗振宇进行了辟谣,但闲鱼上打折售卖演讲门票的事确有发生。比如,4680元只要2000元就可买到,2980元的卖1500元……想想当年卖20年联票时的一售而空,恍如隔世。 吴晓波的情况也并不乐观。 2年前,关于吴晓波演讲全是广告的论调就甚嚣尘上。跨年夜最后的演讲结束后不久,社交媒体上关于“听吴晓波念了3小时广告”“三小时的鸡汤居然要卖6000元”等等的吐槽帖也随处可见,跨年演讲对于公众的意义正在消弭,在互联网更大规模的嘲弄来临之前,吴晓波及时刹车了。 他收获了一个体面的退场——这场告别秀的观众数量创下了历史新高,近乎9000人。而贯穿首尾的广告数量和广告主含金量,也宣告了这将是一个盆满钵满的收尾。 03 安全垫很厚 另一方面,跨年演讲对于吴晓波生意的意义也在减弱。 跨年夜的最后一场演讲中,吴晓波邀请了一个名为“Harry刚刚”的创业者来到现场,这名创业者曾给吴晓波留言:“我已经没钱支付超级会员的费用了,深感惭愧。扛到最后一滴血,或许就是创业者的宿命……” 这就是吴晓波的魅力。隔壁雷军在网民们一声声“军儿”的称呼中,又改头像又汇报行程,还兼职客服和主播,才赚得如今的局面。但吴晓波却能做到,让顾客以不能为他继续贡献GMV而深感惭愧。 吴晓波的超级会员费是多少呢?2980元。跨年夜做活动还直降了500元,但看起来,对于Harry刚刚这样的创业者已经成为负担。 吴晓波的客户群正在面临挑战。 据IT桔子数据统计,近十年,中国新经济创业公司关停/倒闭总量达3.24万家,其中2023年关停/倒闭公司数量为3820家。当中产默契地选择捂紧钱包,留给吴晓波可吸收的信徒也肉眼可见的减少,聚众演讲的商业意义随之面临挑战。 不过,2021年接受《财新时间》采访时,吴晓波曾说:“我都懒得破圈,把这几十万人服务好就行。”一定程度上,他说的没错。最近几年的破圈对吴晓波造成的影响几乎都是负面的。比如直播时仅卖出15罐奶粉,以及崇尚精英主义者,反对屌丝文化的言论。 “人跟蚕很像,就是你要不断地吐丝,吐得越勤快,吐的越开心,他把你包裹的就越严重,最后哪也去不了。”2024年年初,他跟刘润这样说,也坦诚自己不再有面对新世界的勇气了。 所以,无论主动还是被动,跨年晚会能带给吴晓波的兴奋感都在消失。 不过你若因此怀疑吴晓波的赚钱能力,那确实大可不必。 吴晓波曾在一档节目中自曝,吴晓波频道的年收入在3亿元左右,其中三分之一的收入来自企业培训,三分之一来源于知识付费,三分之一是广告收入。 尽管近两年吴晓波没有对外界公布过公司的收入,但经略大了解: 北京一家知识付费TOP5的公司,24年的盈利规模有7000万。这家企业致力于为企业赋能,客户群主要为中小企业主与企业高管,与吴晓波的用户群高度重合。该公司每年都会举办一场峰会,近两年峰会的参与人员数量较高峰时跌去了三分之一,也因为客户数量的减少,大课由每个月一次改为了两个月一次。以及,该公司24年参与了一场对赌,对赌失败,赔偿了股东5000万。 如此境遇下,依然能产生如此规模的盈利,可见知识付费这条赛道的韧性或许比外界猜测的要更强一些。具体到吴晓波身上,他或许更加怡然自得,毕竟,他本人的知名度更大,公司的业务范畴更广,收入受影响程度或许会更小。 换而言之:中产客户们留给吴晓波的安全垫,足够他穿越更长的寒冬。也难怪他提出“只有新中产才能救内需”的经济观点。没有人比他更了解这个群体的韧性。 罗振宇或许就没有这样的好运气了。 论含金量,年轻的白领们显然没有企业主们那般慷慨,更糟糕的是,这个群体的付费人数还在萎缩。 6次折戟IPO后,得到的财务数据便不再对外披露,我们暂以招股书的数据作比。 2018年至2021年上半年,思维造物旗下“得到”App新增注册用户数量分别为681.37万人、397.50万人、456.46万人及172.03万人,最近一年新增用户不到3年前的1/6;连带着营收也在不断收缩。 2019年度、2020年度、2021年上半年,思维造物分别实现营业收入6.27亿元、6.74亿元、4.38亿元,实现归属于母公司所有者的净利润1.17亿元、4006.35万元、2863.67万元,营收和净利润均呈下降趋势,而盈利的部分中,大头还要分给签约的讲师们。 20年的跨年演讲,是罗振宇纪念时间的仪式,也是他无法挣脱的枷锁。 04 忠于自己 “还得是吴晓波,全程没有一张废牌。”盯完整场跨年演讲后,编辑部小张如此感慨。 直播过程中,视频下方的购物车提示就没有停止过。在赚钱这方面,吴晓波是有信仰的:不管是屌丝还是中产,他照单全收。所以购物车里有6.6元的年终秀资料,也有2480元的超级会员。就连跟直播内容毫不相关的酒,也出现在小黄车里。 至于贯穿演讲首尾的广告品牌就不用说了,小张有一瞬间的恍惚:他到底是根据广告主们的品牌属性来准备的演讲内容?还是根据演讲内容找到的靶向广告主呢? 演讲期间,每一个阶段的内容都有相应的资料可出售,比如讲到企业出海的部分时,视频右下角就出现了199元的出海大课,讲到他走访企业时,又出现售价1000元的《走进标杆工厂2025企业管理线下课》,售价288元的“每天听见吴晓波”的项目时不时就在评论区里刷屏。直播全程,画面中不断出现各种二维码,引导观众去关注,转向吴晓波的私域流量。 “如果可以,吴晓波恨不得把他说或者写出来的每一个字,都拆成笔画来卖钱。”这是一条早年间的网友评论,此刻,小张对这句话的理解更深了。 在吴晓波频道的公司介绍中,一个从未改变过的价值观是:认可商业之美,崇尚自我奋斗,乐于分享贡献,反对屌丝文化。 外界对于吴晓波的评价,纷纷攘攘从未停止过,但吴晓波说:“我不在乎人家怎么评价我,年轻的时候还在乎,现在也跑出这个射程了。”即使在被抨击最严重的时候,反对屌丝这四个字也从来没有更改过。他也开玩笑说过:你可以侮辱我的人,但你不能侮辱我的钱。 对于金钱和商业的崇拜,30多年了,吴晓波从来没变过。一个人若能从一而终的坚持自己的信仰,倒也足够令人佩服。 会程过半时,吴晓波问候了后排的观众:“你们能听到我的声音吗?”后排,意味着价格便宜的区域,他还对这个区域的观众保持了关心。 他曾对苦难有过深度的怜悯。《永不抵达的列车》一书曾记录过一个关于他的故事: 吴晓波得知一个下岗家庭因为买不起孩子运动会所需的鞋子,父亲跳了楼。这个故事在吴晓波午夜梦回时常常出现,他对这个家庭的苦难感到浑身战栗。 跨年夜,或许没有听到来自后排声音的反馈,他停顿了一下微微一笑:“你们离我太远了。” 也或许是,他在高位太久了。 文/略大参考
传禾赛科技裁员,没有年终奖
据爆料称:激光雷达科技企业禾赛科技正在开启裁员计划,据相关消息显示,此次裁员比例可能达到数百人。赔偿N+1.无年终奖! 根据禾赛科技最新公告:禾赛12月激光雷达交付量突破10万台,成为全球首个达成单月交付量超过10万台的激光雷达企业。值得一提的是,禾赛面向机器人市场单月交付激光雷达超过2万台,广泛覆盖移动机器人、配送机器人、清扫机器人、割草机器人等多个领域。 上海禾赛科技有限公司2014年在嘉定创立,最初致力于激光气体传感器的研发工作,但因该领域的市场规模较为有限,开启了转型之路。 2016年,禾赛科技针对无人驾驶领域陆续推出了三款激光雷达,正式进入激光雷达领域。此后,禾赛科技一直聚焦于激光雷达产品的研发、制造和销售。 目前,禾赛科技拥有7个激光雷达系列产品,包括AT系列、FT系列等,覆盖ADAS市场、自动驾驶市场和机器人领域。第三季度财报显示,禾赛科技实现营收5.4亿元人民币,同比增长 21.1%。激光雷达季度总交付量达13.42万台,同比大幅增长182.9% ;业务综合毛利率为47.7%,实现了自2022年第二季度以来的最高水平。从目前的毛利压下来的角度来看,要盈利必须要控制成本,所以裁员是禾赛的工具箱一种武器。目标ADAS的激光雷达规模扩大到100万(2025年)。 2024年Q4实现盈利,然后继续在2025年盈利。 天风证券海外团队指出,禾赛科技目前已覆盖理想、小米、零跑、比亚迪、华为、长城、长安等国内客户。截至2024年底,公司已累计获得来自21家车企的超过100款前装量产定点车型手段就是严控成本,把冗余的人员减下来,这是很残酷的事情,但也是禾赛从一家创新的创业零部件企业到一家成熟的汽车零部件企业的必经之路!
奇点临近!美国47%工作岗位将被ASI卷走,大佬急发“逃生攻略”
新智元报道 编辑:编辑部 HYZ 【新智元导读】进入25年,ASI正在逐月逼近!美国一份报告显示,未来20年内,约47%的工作岗位将会被自动化取代!我们做好准备了吗? 2025年,我们会迎来奇点吗? 在2023年末和2024年中,DeepMind和OpenAI分别放出了对于AGI等级的定义。我们亲眼见证了,今年的AI如何在逐步攀升AGI高峰。 显然,2024是旋风般的一年。而在2025年,我们有理由相信会看到更多的进步。 我们迟早会看到,科学和数学的进步将以非常真实的方式触及和改变我们的生活,起初会很迟缓,然后在某一刻变得突然。 就在昨天,谷歌大佬Logan Klipatrick预测:我们直接进入ASI的可能性,正在逐月逼近。Ilya已经看到了。 OpenAI CEO奥特曼则暗示,18个月后,2026年夏天,我们将见证奇迹。 而ASI诞生之后的人类,只有两种可能:要么「走向永生」;要么「走向灭绝」。 对此,AI教父Hinton已经发出预警了,10年内,AI可能会导致人类的灭亡! 未来20年,美国47%工作岗位将被自动化! 这种担忧,似乎并不是空穴来风。 一份美国报告研究显示,在未来20年内,约47%的美国工作岗位可能被自动化。 而且,每增加一个机器人,就会导致当地经济损失约5.6个工作岗位。 这些触目惊心的数字背后,折射出的是一场正在悄然发生的职场革命—— AI带来的冲击,从蓝领到白领都不能幸免。 2023年,美国编剧工会,美国演员工会罢工,让所有人清晰看到了AI对「知识工作者」构成的真实威胁。 但实际上,生成式AI和先进技术带来的挑战,早已波及到了多个行业。 那么,哪些工作岗位将面临被AI自动化,甚至取代的风险? 如果工作内容与AI潜在能力高度相似,那么工作者就可能受到包括AI在内数字技术的影响。 不可否认的是,AI加速迭代能够提升人们生产效率,但同时也有取代人类工作的风险。 以伊利诺伊州为例,研究估计有14%-25%的劳动力岗位面临着工作被自动化的高风险,这意味着,高达150万工作者可能受到影响。 此外,约有23.7万到41.7万名工人面临着极高风险。而在建筑行业中,约49%的工作任务可能被自动化取代。 对此,有网友表示,「这个问题本质上可以归结为我们是否能拥有通用型机器人。 如果有了通用机器人,就意味着所有工作都会受到影响;如果没有通用型机器人,那么只有一半的工作岗位会受到影响,因为AI只能取代基于计算机的工作」。 有人则反驳道,你低估了现如今机器人的现状,并甩出了一长串,关于机器人走进岗位的各种报道。 不过,至少在20年后,我们将拥有一批今天不存在的职业。 奇点预测:是2029年吗? Reddit上的singularity社区,举办了年度奇点预测活动。 首先发言的,是OpenAI o1。它认为,2024年关于AI的讨论已经达到了历史最高水平。 生成式AI引发了关于效率、创造力、道德和人类智慧本质的讨论。通向AGI乃至ASI的旅程仍然很复杂,但每一年,我们都有了实实在在的进步。 而社区的网友们普遍认为,库兹韦尔对于2029年的预测的准确的。 AGI和ASI的发生,就在2029-2030年。不过,那时的AI模型应该会有革命性的架构变化,而非如今的LLM路线。 左右滑动查看 相比之下,AI大佬们的预计普遍更为乐观。 奥特曼:2025年可能是AGI的节点,18个月后可能会见证ASI Anthropic CEO Dario Amodei:AGI将在2026-2027年实现 xAI CEO马斯克:最迟在2026年就能实现AGI Meta AI首席科学家Yann LeCun:如果研发顺利,人类水平的AI可能会在5-6年内问世 DeepMind CEO Demis Hassabis:AGI还有约10年时间,且仍需2-3项重大技术突破 但毫无疑问,所有人心里都承认:我们的确离AGI越来越近了。 2023年,在对2,778名AI研究人员的一项调查显示,AGI实现有50%的可能性在23-92年之间。然而,时间跨度仅过去了一年,最新调查却显示,16.6%受访者认为AGI会在5年或更短的时间内实现 AGI来势汹汹,博士生如何应对? 对于那些还未毕业,走进正式工作岗位之前的博士生们,如何应用AI带来的挑战? 毕竟,o3的出世,尤其是在数学编程方面,真正达到了博士级水平。许多网友表示,未来每个人的口袋里都会有一个「超级智囊」。 对此,来自沃顿商学院的Ethan Mollick教授在「四大研究奇点」这篇长文中,详细阐述了AI崛起带来的危与机,并为博士提供了一个「生存指南」。 注:完整版「指南」,请划至文末阅读。 他表示,「作为一名商学院教授,我深知研究表明,在1,016个职业中,商学院教授是与AI任务重叠度最高的25个职业之一」。 但重叠并不一定意味着替代,而是意味着颠覆性变革和改变。 早在ChatGPT崭露头角之前,学术界就已经面临着一个令人担忧的困境——表面上看,学术论文数量在持续增长,但实质性的创新步伐却在悄然减速。 事实上,一项研究发现,从农业到癌症研究,各个领域的突破性进展都在放缓,而且创新速度每13年就会下降一半。 其中的原因错综复杂,但有一点可以明确的事,这场危机将发生,但AI并非是危机的源头。 实际上,AI可能会成为解决方案的一部分,但在此之前它会先创造出新的问题。 Mollick表示,自己更愿意把AI在科学研究中带来的变革称为「奇点」,而非「危机」。 这里的奇点是「狭义的奇点」,指的是未来某个时点——AI已经深刻改变了某个领域或行业,以至于我们无法完全想象奇点之后的世界是什么样子。 而在学术领域,我们正在面临至少四个这样的奇点时刻。 每一个奇点都可能从根本上重塑学术研究的本质,要么成为重启创新引擎的奇迹,要么加剧现有的危机。 征兆已经出现,而现在,我们只需要决定在奇点之后要做什么。 2024,见证历史的一年 回顾2024,这是惊心动魄的一年,见证历史的一年。 各位大佬们都对2024年发生的AI大事做了盘点。 吴恩达总结了2024年AI圈的热门故事:AI智能体崛起,LLM token价格暴跌,生成式视频迎来爆发期,小模型异军突起。 吴恩达也强调,如今,那些处于AI前沿的人,和那些甚至一次都没用过ChatGPT的人,他们之间的差距已经越来越大。 智能体 智能体的含金量,还在上升。 这一年,集成开发环境中有越来越多的智能体开始生成代码,比如Devin、OpenHands、Replit Agent、Vercel的V0和Bolt等。 AI的推理能力也取得了飞速进步。 2024年年底,OpenAI推出了o1模型和o1 pro模式,该模式使用代理循环逐步完成提示。DeepSeek-R1和Google Gemini 2.0 Flash Thinking Mode也遵循类似的代理推理。 在2024年的最后几天,OpenAI发布了o3和o3-preview,进一步扩展了o1的代理推理能力,效果惊艳。 CoT、Reflexion、测试时计算等技术的兴起,让智能体更加繁盛。Agent的时代即将到来! 价格暴跌 同时,我们也见证了LLM token价格的暴跌。今年,AI提供商之间的价格战,打得是轰轰烈烈。 从2023年3月到2024年11月,OpenAI模型云访问的单个token价格降低了90%。 2023年底,GPT-4 Turbo亮相时,每百万token的输入/输出为10.00美元/30.00美元。 但随即的价格战中,模型价格纷纷暴跌。 比如谷歌Gemini 1.5 Pro,价格已削至每百万token的输入/输出为1.25美元/5.00美元。亚马逊的Nova Pro,则已低至0.80美元/3.20美元。 AI视频起飞 这一年,AI视频的发展惊人。 Sora引发了全球轰动,随后的Runway Gen 3、Adobe Firefly Video、Meta Movie Gen、King AI、PixVerse、PixelDance等也加入战场。 未来,AI视频仍有较大的改进空间。大多数模型一次仅生成少量帧,因此可能很难跟踪物理和几何形状,并随着时间推移生成一致的角色和场景。 小即是美 2024年,许多LLM已经足够小,小到可以在智能手机上运行。 顶级AI公司也把一部分资源投给小模型,比如Microsoft Phi-3(参数最低38亿)、Google Gemma 2(最低20亿)和 Hugging Face SmolLM(最低1.35亿)。 而这些小模型,极大地扩展了我们对成本、速度和部署的选择空间。 Jim Fan:24年,6点震撼 英伟达高级研究科学家Jim Fan,从6个方面总结了2024年。 首先,是高端类人机器人的崛起,包括特斯拉Optimus、1X Neo、波士顿动力、GR-1、西部世界克隆等等。 接下来是具身智能的进展:特斯拉FSD v12、英伟达GR00T、HOVER、DrEureka、斯坦福OpenVLA等,让机器人大脑有了更多进步。 而英伟达Blackwell架构、Jetson Nano Super、谷歌Willow芯片,将计算硬件带入全新的领域。 视频生成和世界建模,也迈进了一大步。包括Sora,Veo,GameNGen、Oasis、GENIE-2等行动驱动的世界模型,以及李飞飞的World Labs。 在LLM方面,Claude 3.5 Sonnet、Gemini 1.5 pro、o1和o3不断给我们新的冲击。真正的AGI测试,是完成这个序列:4o -> o1 -> o3 -> (?)。 GPT-4o实时语音模型、NotebookLM等,带给了我们LLM体验的最佳重新构想。 最后,在AI4Science上,今年的诺贝尔物理学奖和化学奖,都给了所有人亿点点震撼。 人类的命运绝不能交给算法的「黑匣子」 在2024年12月的演讲中,联合国秘书长古特雷斯提到——人类命运不能交由算法决定。 技术的发展速度永远不会比今天更慢。 如今的AI模型变得越来越强大、越来越通用、越来越容易获取——不仅能结合语言、图像、声音和视频,还能实现决策自动化。 AI不仅在重塑我们的世界——它正在彻底改变世界。过去需要多年人类专业知识才能完成的任务,现在转瞬之间就能完成。 但同时,它带来的风险同样巨大。 这种快速增长超出了人类治理的能力,引发了关于问责、平等、安全和保障的根本性问题。也引发了关于人类在决策过程中,应该扮演怎样角色的问题。 AI工具可以识别粮食不安全状况,预测极端事件和气候变化导致的人口流离失所。 但是,AI也以更令人担忧的方式进入战场。最关键的是,AI正在削弱人类控制武力使用这一基本原则。 据报道,从基于情报的评估到目标选择,算法已经被用于人类的生死决策。 AI与其他技术的融合,更是呈指数级放大了这些风险——未来,量子AI系统可能在一夜之间突破最强大的防御,重写数字安全规则。 我们必须明确的是:人类的命运绝不能交给算法的「黑匣子」。 既然人类创造了AI,那么它的前进也必须由人类指引。 除武器系统外,我们还必须应对AI带来的其他风险。 AI可以创造高度逼真的内容,这些内容能够在网络平台上即时传播——操纵公众舆论,威胁信息完整性,使真相与彻底的谎言难以区分。Deepfake可能引发外交危机,煽动动乱,并破坏社会的根基。 AI的环境影响也带来明显的安全风险。AI数据中心大量消耗能源和水资源,再加上对关键矿产的争夺,正在造成对资源的激烈竞争和地缘政治紧张。 人类下一步行动至关重要,我们现在做出的选择将决定我们的未来。建立有效的国际治理机制刻不容缓,因为每一次延迟都可能增加全人类面临的风险。 「四大研究奇点」全文 奇点一:我们如何写作和发表 在许多学术领域,学术研究进展缓慢得令人煎熬。 Mollick教授称,自己有些论文从开始研究到最终在期刊上发表花了将近十年时间。顶级期刊是为这种节奏而设计的,因此对AI引发的学术文章洪流准备不足。 这是因为许多研究人员正在使用AI写作文章,加快了研究过程的关键环节,干扰了审稿人的评估标准。 其中一些AI辅助方式极其拙劣且不道德,比如明显由LLM撰写的章节或令人震惊的AI生成图像的论文泛滥。 但当正确使用时,AI写作实际上可以非常有帮助。毕竟,许多科学家在他们的专业领域很优秀,但他们可能不是优秀的写作者或表达者。 而GPT-4级的模型在科学写作方面确实相当出色,至少在一项小型研究中,它们输出的引言部分与人类写作水平相当。 如果AI能够帮助写作过程,它可以让科学家专注于他们最擅长的事情,通过让AI协助处理耗时的任务来加快研究进程。 当然,我们无法得知研究人员是否正确检查了AI的写作内容,因此,在新文章大量涌现的情况下,同行评审变得越来越重要,同时也趋于AI自动化。 在一次重要的AI会议上,约17%的同行评审内容来自AI。 更令人惊讶的是,研究显示约82.4%的科学家认为AI同行评审比部分人工评审更有参考价值。尽管在某些方面,AI表现不及人类,但其在发现错误方面已经展现出独特的优势。 然而,现有的科学出版体系并非为「AI写作-AI评审-AI总结」这样的流程而设计。如果任由这种趋势发展,整个系统可能难以为继。 当然,AI的能力远不止于辅助写作。 为了展示其潜力,Mollick构建了一个「定制GPT」,它可以探索任何数据集,生成假设并以越来越复杂的方式进行测试。 通过实验发现,AI已经能够自主探索数据集、生成假设并进行复杂测试。 这种能力固然令人印象,但也带来新的隐忧:AI可能被用来进行数据操纵(p-hacking),不断尝试直到得到预期结果。 这种行为严重威胁着学术诚信。 上下滑动查看 那么,我们如何度过这个奇点?我们需要重新思考科学出版的本质,并得出一些结论: 未来的科学出版和同行评审会是什么样子? 我们如何应对AI内容的洪流? 我们如何树立积极的AI使用模式,在加快研究进度的同时阻止不当使用? 奇点二:我们如何研究 与此同时,LLM也正在改变研究的实际开展方式。 首先,和AI的合作更像是与人类研究助理合作,而不是使用编程语言。这意味着,更多的研究人员无需学习专门的技能,就可以使用AI来扩展研究的范围。 更进一步的,LLM还能处理人类研究助理难以完成的事情。 例如,Mollick在向Gemini Pro输入了自己2022年之前所写的20篇论文和著作,总计超过1000多页的PDF文件后,模型借助强大的「长上下文窗口」能力,很快便提取出了直接引用并找到了所有文献中的主题,同时只有几处微小的错误。 此外,由于AI可以高度准确地模拟人类,因此研究人员能够更加轻易地复刻著名实验,如「米尔格拉姆的权力服从研究」或跨50个国家的性格测试,从而为社会科学研究带来了更多的可能性。 更为有趣的是,在这些实验中,被赋予个性和目标的AI智能体,可以在模拟环境中相互交互和学习。 比如,在模拟医院中的模拟医生与模拟病人互动,学会了更好地诊断疾病。 是的,在科学中使用LLM最有趣(也最具颠覆性)的方式,就是让AI系统自动探索新事物。 一些早期工作表明,LLM可以在社会科学领域生成新假设,制定测试这些假设的计划,然后通过模拟实际进行测试。 甚至是从事更具挑战性的实验:让GPT-4访问化学数据库,编写软件控制实验室设备,并独立规划和进行实际的化学实验。 自主化学研究系统原型 在不久的将来,AI可能真的会进行科学研究,并以我们无法预测的方式改变研究的本质。 为了引导这种变化,我们需要回答几个问题: 哪些AI方法是可以接受的?哪些方法可能导致糟糕的科学、偏见或危险的结果? 应该允许自主智能体研究什么?如何在需要时对它们进行监控和停止? 奇点三:我们的研究意味着什么 研究界与公众之间往往存在深深的隔阂。 然而,在学术界深耕了20年的Mollick相信,大量学术研究对外部世界都具有价值,这种价值甚至许多学者都没有意识到。 AI可以帮助架起连接学术界和现实世界的桥梁。 比如,当你给之前提到的「定制GPT」投喂一篇论文之后,它不仅可以解释其中的含义并总结关键结果,而且还可以告诉你,为什么这篇学术论文可能也与你有关。 同样有趣的是,AI有望帮助研究人员相互解释工作,发现跨学科合作的机会,并帮助处理奇点一和奇点二所释放的研究浪潮。 我们知道,AI可以进行大规模文献综述并找出意想不到的工作之间的联系,同时也能发现可以填补的错误和空白。 其中,能够将研究人员与正在进行的研究和讨论联系起来的AI,甚至可以更进一步地成为重启创新引擎的有力工具。 但我们需要重新考虑学科之间以及学术界与公众之间的界限,以便在这个奇点的另一边找到更好的世界。 奇点四:我们研究什么 时至今日,我们仍然不知道LLM为什么能如此出色地模拟人类思维。就连创造它们的研究人员,也不了解它们的全部能力。 虽然关于LLM是在进行「原创思维」,还是仅仅在重复训练中学到的内容,仍存在着广泛的争议。 但从目前的研究中可以看出,LLM必将在现实世界中产生重大影响,在越来越多的实际工作中超越人类表现。 如果说,AI确实是一项「通用型技术」,是能够影响文化、经济和社会大部分领域的创新之一,那么我们就需要发动更多领域的研究人员,全力以赴来理解其影响、塑造其发展、减轻其风险,并帮助每个人获益。 这是一个令人振奋的时代,但如果学者们不紧紧抓住这个历史性的时机,其他人就会去做。 我们有一个独特的机会来应对我们的奇点带来的挑战,如果我们做到了,世界将因此变得更好。
o3拿下25%高分震惊数学教授,2025 IMO金牌或被AI收入囊中
编辑:编辑部 JHY 【新智元导读】AI真的可以做数学了吗?来自帝国理工学院教授Kevin Buzzard在最新博文中深刻探讨了这个问题。甚至,他预测道,2025年AI能够拿下IMO金牌级水平。 OpenAI o3发布后,多个高难度基准测试的SOTA被大幅刷新。 就数学、代码、软件工程等领域而言,更是完全粉碎了满血版o1。 在这之中最引人瞩目的,便是在今年11月Epoch AI发布的数学基准Frontier Math上,准确率破纪录地达到了25.2%。 那么,这个结果到底意味着什么呢? 联手60多位数学家出题的陶哲轩,曾认为这项测试能够难住AI好多年 最近,帝国理工学院教授、数学家、IMO金牌得主Kevin Buzzard发表了一篇深度长文——AI现在能做数学了吗? 文中,他探讨了AI在数学研究中的潜力,特别是在处理复杂计算和验证方面。不过,Buzzard认为在原创性证明、深刻理解数学概念方面,依旧存在一些局限。 o3未来在数学方面的研究潜力究竟如何,或许我们能够从这篇文章中获得关键的一瞥。 o3是什么?FrontierMath又是什么? 可能大多数人都认为,语言模型就是ChatGPT之类的东西:你可以向它提出问题,它会写一些句子给你答案。 语言模型在ChatGPT之前就有了,但总的来说,它们甚至无法写出连贯的句子或段落。 之后还有很多其他模型。现在,它们仍在快速进步。 没有人知道这种情况还会持续多久,但有很多人在这个游戏中投入了大量资金,因此,如果打赌进展会很快放缓,那就太傻了。 Epoch AI在11月宣布, 其精心挑选了「数百」个数学难题, 组成了保密的FrontierMath数据集。 论文链接:https://arxiv.org/abs/2411.04872 之所以要进行「保密」,是有原因的。 大语言模型的训练要依赖于大型的知识数据库,因此一旦你将数据集公开,这些语言模型就会在上面进行训练。 如果你向这样的模型提出来自数据集中的问题,它们可能会直接复述出已经看到的答案。 这个数据集有多难? 那么,FrontierMath数据集中的问题是什么样的呢? 我们知道的是,这些问题不是「证明这个定理」问题,而是「找到这个数字」问题。更准确地说,「问题必须具有清晰且可计算的答案,并且能够被自动验证。」 对于数据集中公开的5个示例问题,通过随机猜测的方式几乎上不可能成功。而且对于专业数学家来说也不简单。 Buzzard称,自己可以理解这5个问题的题意,并能较为轻松地完成第三道题——他以前见过这个技巧。 简单来说就是,函数将自然数n映射到α^n,当且仅当α-1的p进值为正时,该函数在n上是p进连续的。 而且,他也完全知道如何解决第五个问题——这是一个涉及曲线Weil猜想的标准技巧,但没有去算出确切的13位数答案。 对于第一个和第二个问题,Buzzard承认自己并不会做;至于第四个问题,如果花很多力气去研究的话可能会有进展,不过他最终没有尝试,只是看了看答案。 Buzzard怀疑道,即便是非常聪明的数学本科生,可能连其中的一个问题都无法完成。 比如第一个问题,就需要是解析数论领域的博士生才有可能。 FrontierMath论文中引用了一些数学家对这些问题难度的评价。就连菲尔兹奖得主陶哲轩表示:「这些问题极具挑战性,只有领域专家才能解决」。 确实,Buzzard称自己能解决的两个示例问题都在专业领域,比如算术;而对那些不在专业范围内的问题,一个都没解决。 不过,同是菲尔兹奖得主的Borcherds也在论文中提到,机器所生成数值答案「并不完全等同于提出了原创性的证明」。 那么,为什么要制作这样一个数据集呢? 问题在于,对「数百」个「证明这个定理」问题的答案进行评分成本非常高。至少在2024年,人们还不会信任机器在这种复杂程度下进行评分,因此必须花钱聘请人类专家来完成。 相比之下,检查一个列表中的数百个数字是否与另一个列表中的相对应,计算机可以在一秒钟内完成。 正如Borcherds所指出的,数学研究人员的大部分时间都是在尝试提出证明或构思想法,而不是处理数字。 不过,由于在数学领域,AI迫切需要高难度的数据集,而创建这样一个数据集是非常困难的,或者说是非常昂贵的。因此,FrontierMath数据集仍然非常有价值。 在最近的一篇论文中,Frieder等人深入讨论了数学领域AI数据集的不足之处。 论文链接:https://arxiv.org/pdf/2412.15184 此外,Science上也有一篇关于FrontierMath数据集的文章,其中引用了Buzzard的话:「如果有一个系统能够在这个数据集上取得满分,那数学家的时代就结束了。」 没想到,就在论文发出的一个多月之后,OpenAI突然宣布o3在这个数据集上取得了破纪录的25.2%准确率。 整个AI数学圈,都为之震惊,包括Buzzard本人也是。 发生了什么? 在数学领域,Buzzard对「AI」能力的认知是「本科生或预科生」的水平。 o3在解决为优秀高中生设计的「奥林匹克式」问题方面,表现得非常出色。 毫无悬念的是,AI系统在一年之内就能通过本科数学考试。 因为,在设计本科数学考试时,通常需要确保不至于有50%的学生都不及格,因此会加入一些标准化问题(和学生们已经见过的非常相似),从而帮助那些对课程有基本理解的学生能通过考试。在这些问题上,机器很容易取得高分。 但要从这一水平跨越到高级本科或早期博士阶段,并提出创新性想法,而不仅仅是重复利用标准化的思路,将需要一个相当大的飞跃。 毕竟在普特南竞赛(美加知名大学生数学竞赛)中, o1 pro仅对「B4」这道题给出了还算不错的解答,其他大多数答案最多只能得一两分(满分10分)。 上下滑动查看 因此,Buzzard原本预计这个数据集在接下来的几年内仍然是难以攻破的。 但还是激动早了。 Epoch AI的Elliot Glazer在Reddit发帖声称数据集中实际上有25%的问题是「IMO/本科生风格的问题」。 这个说法有点令人困惑,因为很难将这样的形容词,对应到公开发布的5个问题中的任何一个。 即使是最简单的一个,也涉及到了Weil曲线猜想(或是通过暴力计算论证——勉强可行但会非常痛苦,因为它需要在有限域上分解10^12个三多次项式)。 那么问题来了,这个数据集中问题的实际水平到底是什么?或者换句话说,这五个公开问题是否真的具有代表性?我们无从得知。 考虑到这一新的信息,即25%的问题是本科水平,Buzzard称自己对o3取得的成绩也就不那么惊讶了。 不过,他表示,还是很期待AI能够在数据集上达到50%的准确率。因为在「博士资格考试」上的表现(也就是Elliot Glazer所描述的接下来50%的问题),正是Buzzard希望从这些系统中看到的。 证明这个定理! 然而,正如Borcherds指出的那样,即使我们最终得到了一台在「找到这个数字」方面超越人类的机器, 它在许多数学研究领域的适用性也将十分有限,因为这些领域的核心问题通常是如何「证明这个定理」。 在Buzzard看来,2024年最成功的案例是DeepMind的AlphaProof——它解决了2024年国际数学奥林匹克(IMO)六道题中的四道。 在这些问题中,既有「证明这个定理」, 也有「找到一个数字并证明它的正确性」。对于其中的三道题,机器的输出是完全形式化的Lean证明。 交互式定理证明器Lean拥有一个完善的数学库mathlib,其中就包含有能够解决IMO以及其他问题所需的众多技术。 最终,DeepMind系统的解答经过人工检查后被验证为「满分」答案。 不过,这相当于让我们又回到了高中——尽管题目极难,但解题只需使用高中水平的技术。 Buzzard认为,我们将会在2025年看到IMO金牌水平的机器。 但同时,这也迫使我们不得不重新面对之前提到的「评分难题」。 谁给机器打分? 可以设想,在2025年7月的国际数学奥林匹克大赛(IMO)上,除了数百名世界上最聪明的中学生之外,还会有机器参赛。但希望数量不会太多。 这些系统将分为两种类型: 以计算机证明检查器(如Lean、Rocq、Isabelle等)的语言提交答案的系统 以人类的语言提交答案的大语言模型 这两种提交方式之间最大的区别在于: 对于已被正确翻译为计算机证明检查器语言的题目陈述,评审只需检查证明能否通过编译,基本上就可以确定这是不是一个「满分」答案了。 对于大语言模型,评审将面临类似普特南竞赛解答的情况——计算机会写出一些看起来很有说服力的内容,但人类需要仔细阅读并评分,而且并不能保证这会是一个「满分」答案。 Borcherds提醒AI社区「证明这个定理!」是数学家真正希望看到的,这是非常正确的。 目前在逻辑推理方面,大语言模型的准确度至少比人类专家低一个数量级。 我担心,在一两年之内会不可避免地出现语言模型「证明」黎曼猜想的浪潮。这些模糊或不准确的「证明」可能会夹杂10页正确的数学内容中,而人类不得不耗费大量的精力才能把它们找出来。 另一方面,定理证明器的准确性至少高一个数量级:每当看到Lean拒绝接受数学文献中的某个人类论证时,错误的总是人类。 事实上,数学家希望看到的不仅仅是「证明这个定理!」,而是希望看到「正确地证明这个定理,并以人类能够理解的方式解释其成立原因」。 对于语言模型方法,我非常担心「正确性」;而对于定理证明器的方法,我则担心「是否能够以人类能够理解的方式呈现」。 目前进展非常迅速,但我们在这一领域仍然有大量工作要做。 至于何时才能「跨越本科生水平这道坎」?没有人知道。
5nm芯片自研计划失败,韩系车企,可能得依赖中国企业了
大家都清楚,随着电动化趋势越来越明显,传统的燃油车品牌们,也不得不拥抱电动汽车了,比如丰田、大众、B B A等等,都开始积极转型。 而电动汽车的基础,主要就是电动化、智能化这两块。 而在电动化方面,最核心的动力电池,目前已经被中国厂商垄断了,数据显示,2024年前面10个月,中国的6大厂商已经拿下了全球66%的份额,而韩国3大企业拿下了20%左右的份额,留给其它国家和地区的时间和市场,真的不多了。 而在智能化方面,目前也几乎是中国、美国企业的天下,其它国家的企业难望其项背。 美国的英伟达、高通等提供智能座舱、自动驾驶的芯片,特斯拉的FSD也是大名鼎鼎。 而中国厂商中,也有地平线、黑芝麻等企业提供各种智驾芯片,还有车企自研这些芯片,另外中国车企的自动驾驶算法,独步天下,完全不输给特斯拉。 所以,其它国家和地区的车企,要想在电动汽车领域有所成就,必须在电动化、智能化方面多下苦功夫,真正掌握核心科技才行,否则没法竞争。 也正因为如此,之前韩国现代汽车有一个决定,那就是要自研自动驾驶芯片,要在2025年推出5nm的智驾芯片,再配合自研算法,在智能化上达到全球顶尖水平,2029年实现全自动驾驶,为了实现这个目标,还成立了一个“半导体战略室”。 不过,近日传出消息,现代的负责车载芯片研发的“半导体战略室”解散,不再研发了,原因就是芯片也好,算法也好,都没这么容易。 一旦解散这个部门,接下来可以预计的是,现代的汽车芯片没法自研,只能对外采购了,甚至算法可能也得借助外力了。 而给现代的选择不多,芯片方面要么就是高通、英伟达,或者中国企业地平线、黑芝麻等,而在算法方面,可能也是采用一些现成的方案,比如Mobileye、华为ADS、大疆的方案等等。 而有消息称,现代之前使用的是Mobileye的方案,但未来可能会倾向于使用中国企业的方案,因为Mobileye方案不够给力,明显落后于中国企业了。
英伟达千万投资后,27岁CEO豪言:前端工程师三年内消失
我给数学家们的时间是 700 天。这就是人类作为宇宙已知领域中数学王者的剩余时间。 “像前端工程师这样的岗位可能在三年内就会消失。这听起来很极端?其实不然——三十年前本来也没有前端工程师这个职位。” 这个惊人预测出自 Exa CEO 威廉·布里克(William Bryk)之口。前段时间,这家由他与华人天才极客 Jeff Wang 在哈佛创立的 AI 搜索引擎公司 Exa,刚刚拿下了英伟达领投的 1700 万美元 A 轮融资。 在硅谷的 AI 新贵中,这对创始人组合格外引人注目:27 岁的布里克提出了“史上最慢搜索引擎”的大胆理念——宁愿花上几分钟返回精确结果,也不要毫秒级的肤浅匹配;26 岁的 Wang 则将向量数据库技术推向了极限,让 AI 真正读懂互联网内容。比方说,圣诞节的这几天推特(X)上开始流传 Exa 制作的一个“年度总结工具”,可以总结你在推特一年来的所有内容,各大博主玩的是爱不释手: 图源:归藏老师 小编的个人推特被 Exa 评价最像马斯克 Exa 的“推特年度总结”:https://twitterwrapped.exa.ai/ 但比起搜索技术本身,布里克对 AI 未来的预测更令业界震惊:前端工程师职位将在 3 年内消失,2025 年底 AI 将能自动处理任何计算机工作。他还放话,“我给数学家们的时间是 700 天。这就是人类作为宇宙已知领域中数学王者的剩余时间。”这句颇有《三体》里三体人向地球人宣战的味道。 以下是布里克于圣诞前夜发布的最新预言全文《AI 前夜的思考》,经 CSDN 精编处理,让我们一同看看他这么说的依据: 变革前夜 最近和几位朋友聊起 OpenAI o3 模型,他们的第一反应都是难以置信:“大的要来了?” 没错,这一切确实要来了。未来几年,我们将见证一场翻天覆地的变革。这不仅仅是一个历史性的时刻,放眼整个银河系,这都是一个重大转折点。 让人哭笑不得的是,对于这场即将到来的巨变,我们却缺乏深入的讨论。AI 实验室讳莫如深,新闻媒体对此浅尝辄止,政府更是一头雾水。 更讽刺的是,人类文明发展的重大议题,居然要靠社交媒体上的表情包和梗图来讨论。这简直像是一出荒诞剧,但现实就是如此。 接下来,我想分享一些个人对当前局势的思考和见解 —— 权当是为 X 平台上的思想漩涡添砖加瓦吧。 在开始之前,我要强调:这些想法都是未经深入推敲的头脑风暴。由于时间有限,很多观点都没能充分研究和论证,其中难免有不少谬误。但我希望这些想法能给那些正在试图理解这场变革的人带来一些启发。 让我们开始吧。 模型突破与行业变革 说实话,o3 的出现本不该让人感到意外。两个月前,OpenAI 就公布了测试时间扩展图表。计算机发展史告诉我们,这些发展曲线往往都能变为现实,即便看起来再怎么不可思议。真正令人震惊的是,这一切只用了短短两个月。从大学水平到博士水平,AI 的进化速度快得让人措手不及。对人类来说,渐进式的变革令人雀跃,但这种突飞猛进的跃迁却让人心惊胆战。 未来的发展路径其实已经呼之欲出。o3 这类模型最擅长优化那些能够明确定义奖励函数的任务。数学和编程这样的领域,奖励函数相对容易设计;而小说创作这样的领域则难度更大。这意味着在短期内(一年之内),我们将看到能力分布不均衡的模型。它们在数学、编程和一般逻辑推理上可能已达到接近通用人工智能的水平,但在创作文学作品时可能仍显得平庸乏味。虽然更强的推理能力会让模型在各个领域都表现得更加智能,但在那些未经强化学习训练的领域——也就是训练数据未覆盖的盲区——它们仍会犯一些低级错误。从长远来看(1-3 年),随着我们不断将新的领域(情感数据、感知数据等)纳入强化学习训练范围,这些盲点终将被填补。到那时,除了像 Gary Marcus 这样的顽固派,所有人都会承认这些模型已经具备了真正的通用智能。 AI 助手在 2025 年必将成为现实。以 o3 为代表的模型必然能够自如地操作浏览器和应用程序,这类任务的奖励模型设计相对简单。更重要的是,自动化办公这个市场潜力巨大,对于那些需要证明高额投入合理性的实验室来说,这是一个绝佳的切入点。我敢打赌,到 2025 年底,你只需要一句话,就能让电脑自动完成各种涉及网页浏览、应用操作和数据处理的工作流程。 在所有即将被颠覆的学科领域中,数学可能是最容易被 AI 征服的。数学家们在符号世界里工作,几乎不受物理世界的掣肘,这恰恰是大语言模型最擅长的领域。说到底,数学本身并不难,只是人类的大脑不够用罢了。这一点在正则表达式的使用上也同样明显。 研究领域的巨变 一个关键问题是:制作研究级别的合成数据到底有多难?我的判断是,没有想象中那么困难。对人类来说,博士级数学和研究员级数学的差别可能很大,但在 AI 眼中,这可能只是量级上的差异,只需要增加几个数量级的强化学习训练就能跨越。我给数学家们的时间是 700 天——这话听起来疯狂,但如果说 o6 模型无法超越数学家,听起来同样不可思议。所以和本文其他预测一样,我对这个判断的把握超过五成。700 天,这就是人类作为宇宙已知领域数学王者的剩余时间。 目前的形势下,软件工程师又该何去何从?短期来看,这对我们来说简直是天赐良机。每个程序员都相当于被空降了一个技术主管的位置,干得漂亮。对于那些充分拥抱大语言模型的开发者来说,到 2025 年底,编程的感觉更像是在指挥一群小帮手完成各种任务。只要需求描述足够清晰,o4 系统就能完成任何代码提交,错误率低到完全可以接受。当然,这里可能会遇到一个问题:模型的上下文窗口可能容纳不下整个代码库,不过像 Sam Altman 这样的行业领袖显然已经意识到了这个问题。 那么,AI 是否会在短期内取代所有软件工程师呢?答案是否定的。软件工程不仅仅是根据明确的需求提交代码那么简单。与数学家不同,软件工程师需要频繁地与现实世界打交道,特别是要和其他人互动。工程师需要与客户沟通以理解他们的需求,需要与团队成员配合以满足他们的要求。在设计架构或编写代码时,工程师需要考虑大量的组织背景因素。o4 模型还无法做到这一点。但它确实能帮助那些已经理解这些背景的工程师提高十倍的工作效率。 软件行业的变革与重塑 如果软件工程师的效率提升了十倍,是不是意味着我们需要的工程师会更少?从单个公司的角度来看,确实如此,因为精简的团队就能达到同样的产出。但从全球范围来看,对软件工程师的需求可能反而会增加,因为世界显然需要十倍于现在的优质软件。因此,我们很可能会迎来一个由精简团队打造的应用程序黄金时代。每个人、每个企业都能拥有专属的定制化应用。 从更长远的角度来看(在这疯狂的变革中,两年后就算是长远了),软件工程这个行业将会焕然一新,具体会变成什么样很难说。当 o6 系统存在并完全融入我们的应用程序时,这个行业怎么可能还保持原样?像前端工程师这样的岗位可能在三年内就会消失。这听起来很极端?其实不然——三十年前本来也没有前端工程师这个职位。 我们需要后退一步,认识到软件行业每一代都会彻底重塑自己。软件的本质始终是将需求转化为纯逻辑,只是这个转化过程的抽象层次在不断提升,从二进制提升到了 Python。现在的区别在于,它正在向自然语言迈进。 这种向自然语言的转变,将让非技术人员也能参与编程。但最优秀的开发者永远是那些能够在不同抽象层次间自如切换的人。 简而言之,因为软件工程的核心是通过代码来理解和解决组织的需求,所以只有当所有组织都实现完全自动化的那一天,软件工程才会被完全自动化。 实体行业与算力变革 说完了知识工作者,我们再来谈谈体力劳动者。AI 同样会影响这个群体,只是进程会相对缓慢,毕竟机器人还得应对重力和摩擦力这些现实问题。o 系列模型对机器人技术的助力可能并不明显,因为一个需要一小时才能给出结果的模型,对流水线上的机器人帮助不大。虽然基础模型变得更智能,o 系列模型也能帮助训练这些基础模型,但这并不能解决机器人发展的最大瓶颈。我认为真正的瓶颈在于硬件的改进,以及快速可靠的感知和动作模型。这些都需要更长的时间来突破。机器人技术要实现真正疯狂的进步,得等到机器人能自己制造机器人,AI 能自主进行 AI 研究的时候。这可能来自于o 系列模型,但估计还要再等几年。 谈到发展速度,也许我们不该以年为单位来计算,而是该以算力为衡量标准。人类的产出取决于时间,但AI的产出取决于算力,而在研究机构中,AI 的产出正变得越来越重要。这就是为什么各大实验室都在争相建设超级计算集群—— Meta 的 2GW 集群、xAI 追加的 10 万块 H100 芯片等等。 所有的实验室很快就会跟随 OpenAI 的脚步,采用测试时算力模型。有些实验室可能算法不如人,但可以用更多的算力来弥补。就像他们在 GPT-4 之后做的那样,总能追赶上来。在 o 系列模型中,OpenAI 到底掌握了多少独家技术还不好说,但从他们的进步速度来看,这更像是算法上的突破(容易复制),而不是某种独特的数据组合(难以复制)。 在这个讲究测试时算力的时代,究竟是拥有更多算力重要,还是拥有更好的模型重要?这个问题很有意思。一方面,你可以用更多的测试时算力来弥补模型的不足。但另一方面,稍微好一点的模型可能就能节省指数级的算力。 如果 xAI 真能靠着建设超级集群的能力追上 OpenAI,那场面还真有点意思。 无论如何,模型领域的护城河不可能持续超过一年,因为各家实验室的核心研究人员就像棒球卡片一样持续互相交换。更有趣的是,这些实验室的研究员们私下里还会一起聚会玩乐。再加上我觉得,一旦情况失控,研究人员们恐怕会出于理想主义选择分享信息。 AI 竞赛的现状与未来 眼下这个局面还真是挺有意思。AI 竞赛就像当年的核武器竞赛,但区别在于,这场“新冷战”的“美国人”和“苏联人”会在洛斯阿拉莫斯一起狂欢,还在推特上互相调侃:“我赌你们在 2025 年造不出最大的核弹,笑死 :)” 这种嬉皮士般的欢乐氛围,只能维持到政府介入或者出现重大事故为止。 o 系列模型从几个有趣的方面改变了算力扩张的动态。这类模型激发了大规模扩建的热情,因为每增加一个数量级的算力,就能带来明显的性能提升。对算力供应商来说,这种扩展规律简直是天降福音。我猜这个规律正是 Sam Altman 看到后,想要建设万亿规模计算集群的原因。 不过这对英伟达来说可能不是好消息。o 系列模型让推理变得比训练更重要。而我认为,优化推理的芯片比训练芯片更容易设计,所以英伟达在这方面的护城河并不深。 说到这里,我有个大胆的猜想:如果 o 系列模型能够利用全世界的算力来训练最强大的模型呢?想想看,如果我们能把所有 MacBook Pro 的算力集合起来,形成一个推理超级集群,开源阵营是不是就能打败闭源阵营了?这画面想想就让人兴奋。 效率革命与科研突破 除了算力,代码生产效率也成了一个新的指数级增长点。假设某个实验室独享最强大的模型,他们的软件工程师效率就能比其他实验室高出一倍,这样他们就能更快地实现下一个效率翻倍。当然,除非代码速度已经达到极限,实验队列排得老长,实验室又一次被算力所困。(说实话,这里面的博弈关系挺复杂的。要是能看看这些实验室是如何在算力和人力之间做预算平衡,那就太有意思了。) 说到这些计算资源的扩张和知识工作的自动化,听起来已经够疯狂了,但等到科学家们也感受到 AGI 的威力时,事情才会变得真正疯狂。这话是说给你们听的,物理学家、化学家、生物学家们。 首当其冲的是理论研究领域。理论物理学将率先迎来变革。如果数学真的被攻克了(写出这话我自己都觉得不可思思,但这并不影响它的可能性),那理论物理学应该也差不了多远。它同样在符号世界里运作,这正是大语言模型所擅长的。 设想一下,当成百上万个 AI 版的冯·诺依曼日以继夜地工作在路易斯安那的田野间(Meta 即将建设的数据中心所在地),会发生什么?它们会瞬间阅读过去一个世纪里数千名物理学家撰写的所有论文,然后立即吐出更准确的结论。 显然,这就到了故事最难预测的部分。理论物理学、化学、生物学——如果这些对于经过强化学习训练的大语言模型来说不过是小菜一碟呢?现在看来,我们还有什么合理的理由认为它做不到?没错,我们还没有见过这些模型展现真正的创新,但那是因为它们大多还停留在高中或大学水平,而这个年龄段的人本来就不会发明新物理学。现在我们已经达到了博士水平,或许很快就能看到一些创新性的成果了。 科技创新的链式反应 一旦 AI 开始产出新的科学理论,进步的瓶颈就会转移到现实世界中的测试和实验环节。这里的瓶颈主要是劳动力和材料。到那时,如果已经有能自我复制的机器人,那劳动力的问题就解决了。材料问题也能通过机器人挖矿来解决。这个过程会比较慢,毕竟制造和运输实物需要时间,但我们说的是年的尺度,而不是几十年。 以上说的这些都是建立在一个前提之上:AI 和机器人的研发不会遇到新的瓶颈,模型可以自由地学习发展。但这种情况几乎不可能发生。最大的瓶颈将来自人类自身,具体表现在监管、恐怖主义和社会崩溃这三个方面。 监管:政府不会坐视几家旧金山的科技公司用自动化机器人开采地球资源; 恐怖主义:如果政府管不住大公司,那些失业的愤怒民众可能会诉诸暴力; 社会崩溃:除非人们已经被 AI 增强的媒体内容洗脑到无法维持正常社会运转。 如果战争爆发,它反而不会成为瓶颈,而是会加速这一进程。 形势越来越严峻了。2025 年可能是 AI 作为旧金山科技圈在推特上的玩笑话题的最后一年。之后,那些西装革履的外行人就要介入了。所以,趁现在还能欣赏 Sam Altman 的推文,就且看且珍惜吧。 AI 发展的隐忧 这一切会要了我们的命吗?说实话,我更担心人类滥用 AI,而不是 AI 自己失控。 无数历史证明,人类最擅长使用最新技术相互争斗。当武器变得更致命、更自主,赌注也就越来越大。另一个重大风险是 AI 导致的社会动荡。AI 生成的内容可能会引发大规模的混乱、歇斯底里和集体认知障碍。这项新技术,很可能会被利用来剥夺我们几千年的自由。 还有一种风险是 AI 真的失控了。也就是说,它可能会造成我们始料未及的灭绝级灾难。特别是现在强化学习又重新成为主流,AI 开始自主寻找优化方案,而不是单纯模仿人类数据(模仿人类相对更安全)。不过到目前为止,这些模型的核心还是大语言模型,而大语言模型已经表现出了对人类的理解能力。比如说,如果你在提示词里写上“千万别做任何可能害死我们的事”,那现在的举证责任就在质疑者那边了——你得证明它还是很可能会杀死我们。当然,这里面还有很多论点我都没考虑到。 憧憬与期待 说到底,我还是更多感到兴奋,而不是恐惧。 我一直期待的科幻世界终于要来了。它来得比预期快了一点——这也是人们感到恐惧的原因——但在所有可能的发展路径中,我觉得现在这条路也没那么糟。这是个相当不错的时间线。 我特别期待在未来十年内看到这些突破: 一些突破性的物理学发现 由机器人率先建造的火星和月球基地 完美的导师/顾问系统(这个已经很接近了,只需要更好的检索、记忆和个性化) 零副作用的生物增强药物 超级优化的无人机载人飞行 融合能源、地热能和大量太阳能带来的清洁能源革命 还有那些意想不到的突破:AI 天文学家在望远镜数据中发现外星信号?AI 化学家轻松设计出室温超导体?AI 物理学家统一某些理论?AI 数学家解决黎曼猜想? 这些不再是科幻小说,而是触手可及的科技现实。 AGI 前夜 这一切的终点是什么?终有一天我们会达到超级智能的水平,那时候,只要物理规律允许的事情,我们都能做到。我很期待长生不老,也想去看看其他星系。我猜我们还会把这副血肉之躯升级成更好的载体。不过最让我激动的,还是终于能搞清楚宇宙从何而来。十年前,我就开始在日记里写道,我多么渴望知道这个答案,而 AI 将帮助我们找到答案。现在这一切真的可能发生了,简直不可思议。 我们现在生活在一个让这一切听起来都变得理所当然的世界里。每一次 AI 的新突破都让更多的人意识到这一点,o3 就是最新的例子。 如果未来没能变得精彩纷呈,那只可能是因为我们人类自己搞砸了。比如我们的公众认知、相应的政策制定、社会稳定性、国际合作——这些才是可能阻碍这个精彩未来的绊脚石。 人们常说 AI 实验室的人在主导我们的未来。我不这么认为。他们的工作其实早就注定了。他们只是在执行必然会在某个实验室发生的模型架构演进。但是公众认知、政策制定、社会稳定、国际合作——这些都充满了不确定性。这意味着我们每个人都是未来的守护者。让这个世界安然度过未来的疯狂时期,让我们迎来美好而不是可怕的未来,这个责任落在了我们每个人身上。 帮忙的方式有很多。你可以开发一些能让社会更稳定或让人们更聪明的产品。你可以帮助人们了解正在发生的事情。你也可以清理我们的街道,这样这个许诺带来乌托邦的城市就不会看起来像个反乌托邦。 几乎每个和我聊天的人都担心在 AI 时代失去人生意义,你可能也有这种担忧。对此我想说,情况恰恰相反。你正生活在人类历史上最重要的时期,而且你有能力影响这个时期的走向。拯救世界还不够有意义吗?你真的想回到那个只有个人职业在进步而世界没有进步的时代吗? 也许人们需要从个人成功获得意义转变为从集体成功获得意义。我们现在的很多工作很快就会被自动化。我们必须适应。如果你的意义来自某项特定技能,那么是的,这项技能在五年后可能就不再必要了,你就倒霉了。但如果你能从帮助世界变得更好中获得意义,这种意义永远不会消失。 对于因为 o3 而收到各种建议的应届生们,这是我的建议:学会成为一个主动解决问题的人和一个优秀的团队合作者。你在这个过程中学到的具体技能并不重要,因为世界变化得太快了。但主动跳出来解决问题和与团队良好合作的能力会在很长一段时间内都很重要。 你可能还得接受一个不稳定的人生,因为我们生活在一个不稳定的世界里。情况会变得很奇怪。你可能不会过上养两个孩子加一条狗的郊区生活。你可能会有两个半机械人孩子和一个 AI 宠物狗,生活在星际方舟上。 我们正生活在 AGI 的前夜。在这个圣诞前夜,我想说:希望你能帮助 AGI 的转型顺利进行,这样在 3024 年的圣诞前夜,我就能在环绕 Altman 星的行星上和你打招呼了。
阿里前端第一人AI创业首秀,要做全球内容创作者的GitHub!公司俩月估值过亿,5k人排队内测
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 百花齐放,但尸横遍野。 这就是躬身入局AI大模型创业的玉伯,对2024年创业现状的真实体感。 但这位昔日的阿里前端第一人,还是选择加入了这个没有硝烟的战场,用AI聚焦内容创作者群体。 入场2个月,公司估值过亿;入场6个月,推出首款产品YouMind,开放内测20多天来,反响不错,有近5000人排队申请(最后通过了千余人)。 他还有些喜出望外地告诉量子位,迄今为止,已付费的种子用户比他预料中更多。 △自己公司刚成立时的玉伯 玉伯是谁? 这个名字在前端开发领域圈子里家喻户晓,且和现在大多数打工人每日用的办公工具/平台息息相关: 硕士就读于中科院物理所; 2008年加入淘宝UED(User Experience Design)部门担任前端工程师,和团队陆续推出了SeaJS、KISSY等框架; 2012年转入支付宝前端开发部,负责基础组,后来创立了体验技术部,致力于设计语言Ant Design、数据可视化AntV等; 2016年,主导了笔记与文档知识库语雀(初期叫云雀)的开发,并在2019年开始了语雀的商业化尝试; 2021年,生产力协同事业部成立,玉伯负责主要产品语雀+白雁; 2023年4月,入职阿里15年、职级P10的玉伯离开蚂蚁;紧接着入职字节旗下飞书,担任飞书产品副总裁; 2024年4月,玉伯离职飞书,次月在杭州创办AI公司思维天空。 11月底,思维天空的第一款产品问世,并于12月6日开启内测: YouMind,一个面向全球创作者的AI工具,覆盖全流程,能整合多模态那种。 不过,玉伯很直接地告诉量子位,目前大家看到和用上的版本,仅仅是YouMind最终构想的v0.1。 但出于一个技术出身者深入骨髓的开源精神和共创理念,团队选择在此时把YouMind摆到用户眼前。 最终形态:内容创作者的GitHub社区 那么,0.1版本的YouMind——也就是现在用户可以内测上的这个版本,是什么样的? 作为通过内测的千分之一,量子位多位编辑都尝试体验了一番。 注册后,它会推荐你安装YouMind浏览器插件。 通过这个插件,你主要可以干三件事: 第一,总结网页,翻译网页; 第二,和ChatBot对话,询问问题,不管是关于正在浏览的界面的,还是需要互联网搜索的; 第三,把任何模态的内容,包括文字、图片、播客/音频、视频等,吃进个人收藏夹里,带分类那种。 以上,是调用插件能做的事。 △右侧为调用插件时的界面 而当进入YouMind主页后,有三大功能。 首先,Snips。 用来摘取并收藏互联网上任何你觉得有用,想要沉淀到自己知识库的内容。 可以是来自arXiv的论文,来自油管的视频,总之anywhere的anything。 其次,Thoughts。 这个很好理解,用来记录你自己个人的想法和随笔,就是网络在线笔记本。 再者,Boards。 可以在这里把外来沉淀的Snips,和个人记录的Thoughts,在这里分类归类,进行整理。 目前来看,Boards功能有限。 (不过毕竟玉伯还把此版本定义为v0.1,大家看个意思吧先) 非要做个类比来方便大家理解的话,我愿称之v0.1的YouMind为: Readwise和obsidian的AI集合版。 (打个比方啦,有更准确的描述欢迎大家评论区集智众筹) 而这,仅仅是玉伯构想中,YouMind走向完全成熟的三个阶段中,第一阶段的第一步。 量子位画了张思维导图,来呈现他对YouMind的整体构想: 玉伯介绍,团队目前正在打磨第一阶段的第二步,让内容创作者们能够在YouMind上IPO起来(手动狗头)。 让收藏的内容不再吃灰,想找看过的内容时不用各平台狂翻浏览记录。 完成资料的串联和调用,帮助自己更好地生产文章/播客/视频等内容。 至此,就算完成了YouMind第一阶段——此时将达到v0.5。 到了第二阶段,YouMind会从个人工具走向协同使用,正式走向v1.0。 但和Notion、飞书、WPS等还不太一样,YouMind偏重内容协同、强调项目管理,而非组织管理。 AI 2.0时代,“一人公司”为代表的超级个体或小微团队大量出现,我想他们都不需要很庞大的协同工作平台。 我们的第二阶段,就是想做服务这类人群的协同工具。 “哈哈,第三阶段其实很长期,和我的初心有关。”玉伯笑道,那就是做社区。 内容创作者们有油管、抖音、推特、小红书等各种平台,但会给人一种四处打工的感觉,“我感觉创作者没有归属感。” 他拿程序员最大的社区GitHub类比—— 无论是写代码还是抄代码,程序员会把GitHub看成是一个家一样的社区;自己有好的想法,也能上传后,进一步被build,甚至变成软件,再分发出去,可能还会在Apple Store里面挣钱。 所以,YouMind的终极目标,是成为一个内容创作者的GitHub。 (p.s.:以天天写稿人的角度,我们聊到创作者的心态或许和程序员的心态有所不同,内容创作者或许不太接受“被copy”。但玉伯举例了一个他认为的神奇存在:维基百科) “也许创作是更好的消费” 而之所以创业第一剑,玉波选择对内容创作者群体“下手”,原因无外乎有二。 一看擅长什么。 一次与杭州的创业前辈交流时,玉伯头一回听说了与共识不同的PMF解释: P不应该代表product,应该代表person。指代的还不是团队里的所有人,就是创始人本身。 那看玉伯自己的经历,他表示自己从2014年起开始用Notion,后来主导语雀、加入飞书。 他介绍团队成员虽然年轻,但多年工作经验与此息息相关,有经验,有积累,有市场长期观察。 团队成立后,内部协同又从Slack+Notion+Google Workspace,横跳到觉得更适合小团队协同和项目管理的Linear+Google Workspace。 等于是从自己的日常使用中寻找新的痛点。 △杭州,思维天空公司内部 二看趋势是什么。 他洞察到与自己要做的事有关的趋势,也分为两点。 首先是内容创作越来越多模态化,并且这个现象不仅仅在国内,是在全球范围内发生。 其次是95后,准确来说10后、20后的消费习惯正在改变。 玉伯自己本人觉得目前的娱乐消费,需要普通人有很高的自律要求。在玉伯口中,这种纯·消费其实很累,他说:“你以为消费了,其实啥也没得到。” 同时,他又不止一次从初中学生口中听到“抖音是老年人才玩的东西”之类的话,也看到自己的儿子和小伙伴们面对轰动一时的《黑神话:悟空》时,不仅仅是去玩那个游戏,更是自己去我的世界(Minecraft)里自己搭建还原游戏中的建筑、boss等等。 再三思索后,玉伯得出自己的结论: 本质上,我会觉得可能「创作」是一种更好的消费,或者创作有可能是一种新时代的消费。 他表示,也许每个人都应该去尝试创作一点内容,尝试过后收获的甜头,跟纯粹是刷短视频的快乐是完全不一样的。 所以就有了YouMind。 然后本着一种很朴素的开源心态——朴素指的是“有了想法就开源”,让大家以此为基点,有代码的写代码,会文档的写文档,有钱的捧个钱场,一起攒个局把想法实现——团队觉得没必要憋大招,可以用共建的方式合力朝内容创作者的GitHub前进。 所以现在时刻的YouMind还是v0.1。 创业后,“功成必须在我” 作为YouMind背后最主要的那个男人,成为创业者后,玉伯更踏实了,但也更害怕了。 踏实,是相比于此前的大厂经历而言。 2018年前,玉伯都在和代码打交道;后来身居大厂中层,带着六、七百人的团队。 不过问题随之而来: 和一线同学隔了三、四个层级,既不能很好地感知到一线的信息,也很少需要自己去做决策(因为更贴近业务本身的-1 or -2提上来的决策已经很不错了),只需自己点头;又因为自己就是所在业务的领头羊,需要他本人自上而下传递的高层信息也几乎为零。 但真的有那么安逸吗?并没有。 出于各种原因,他不能让自己的日程表有空白,甚至有时需要被动地去卷别人。 用他自己的话说,总之人是忙了,心却闲着。 自认为是个实操性人格的玉伯不太享受这种状态,甚至一度想转型去做HR,想让自己踏实一些。 现在离开大厂,自己拉起十几个人的小团队开始从零开始,确实也踏实了。 不过回头看,有时需涉及团队管理方面的事务,还会回头有点“羡慕”大厂。(但玉伯表示,欢迎大家加入~)。 至于害怕嘛—— 是肯定害怕嘛!一个创业者说不害怕,我觉得见了鬼了。 说不害怕创业失败的创业者,基本上都在骗人。 但他陈述,所谓的“害怕”不是说自己怕丢面子。 玉伯很清楚,创业当然得尝试,但当然也担心瞄准的方向是伪命题,某些害怕的情绪是必然会有的。 害怕金钱流失。 作为一个长期主义者,背负投资人的钱,AI创业花钱如流水,但又担忧找不到“有耐心”的长期投资者。 害怕时机不对。 他认为找准时间和看准趋势同样重要。当初2019年前后,在大厂有架空感的时候,是不是就应该毅然创业? “就算挂了,可能现在已经在连续创业第二次、第三次了。” △10年前的玉伯 & 3天前的玉伯 最后一个害怕,来自于他成为创业者后心态上的转变。 以前,他觉得「内容创作者的GitHub」是他的想法和愿景。 这件事“功成不必在我”,可以由别人做出来,自己直接用,还不用承担成本和损失;可以半路被大厂收购,只要目标一致,能被收购也是好事情。 但最近看了尤瓦尔·赫拉利的《智人之上》,他觉得自己突然悟了—— 最后一个害怕,是不愿看到自己的想法和目标,被别人抢先实现。 社区的灵魂,来自社区的共识现实。其中创始人的所思所想是决定性的,无法依赖他人。 所以现在的我认为,创业做「内容创作者的GitHub」这件事儿,功成必须在我。 内测waiting list:youmind.ai
2024年另类AI评测标准走红:“威尔・史密斯吃意大利面”领衔
IT之家 1 月 1 日消息,据 TechCrunch 报道,随着人工智能视频生成技术的不断发展,一个有趣的现象开始在业内流行:当一家公司发布全新的人工智能视频生成器时,似乎总有人会第一时间用它来制作威尔・史密斯吃意大利面的视频。这不仅演变成了一种网络热梗,更成为衡量新型 AI 视频生成器性能的非官方基准 —— 检验其能否逼真地呈现史密斯狼吞虎咽吃面的场景。史密斯本人也在今年二月通过 Instagram 发布了一段模仿视频,亲自参与了这场网络狂欢。 IT之家注意到,“威尔・史密斯吃意大利面”只是 2024 年人工智能领域众多奇特“非官方”评测标准中的一个,此前还有一位 16 岁的开发者开发了一款应用程序,让人工智能控制《我的世界》(Minecraft)游戏,并以此测试其建筑设计能力。与此同时,还有一位英国程序员创建了一个平台,让人工智能在“你画我猜”(Pictionary)和“四子棋”(Connect 4)等游戏中相互对战。 人工智能领域不乏更学术化的性能测试,那么为何这些略显怪异的测试反而能够迅速走红呢?原因之一在于,许多行业标准的人工智能基准测试对普通人来说过于晦涩难懂。企业经常标榜其人工智能在奥林匹克数学竞赛或博士级别难题中的解题能力,但大多数人使用聊天机器人只是为了聊天或回复电子邮件。 即使是行业内普遍采用的评测方法,也未必更有效或更具信息量。以受到众多人工智能爱好者和开发者密切关注的公共基准测试平台“聊天机器人竞技场”(Chatbot Arena)为例,其允许任何网络用户对 AI 在特定任务上的表现进行评分,例如创建网页应用程序或生成图像。但参与评分的用户往往不具有代表性,他们大多来自人工智能和科技行业,并且他们的投票也常常基于个人且难以捉摸的偏好。 像“四子棋”“我的世界”和“威尔・史密斯吃面条”这类奇特的人工智能基准测试显然不是严谨的实证研究,甚至不具备普遍适用性。因为即便 AI 能够完美生成“威尔・史密斯吃面条”的视频,也并不意味着其能很好地生成汉堡的图像。 这些另类的 AI 基准测试可能在短期内不会消失,毕竟它们不仅具有娱乐性,而且还易于理解。2025 年,又会有哪些新奇的基准测试会走红呢?
对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见
2024 年的最后一周,爱范儿等媒体来到了 vivo 位于东莞的总部,与 vivo 执行副总裁,首席运营官胡柏山进行了一场畅所欲言的对话,聊了市场格局,AI 进程和应用,以及关于 vivo 产品的未来方向和规划,其中包括对于折叠屏市场的思考,对于 MR 眼镜、人形机器人以及 AI 眼镜的规划和看法,还有 vivo 的强项:影像。 以下是关于产品层面的对话纪要(为便于阅读,对话经爱范儿重新编辑): 长焦和视频还有提升空间,手机 AI 任重道远 Q:怎么看 AI 目前的状况,AI 未来取代影像成为手机第一卖点吗?现在旗舰机的影像水平到头了吗? 胡柏山:我们先聊影像,我们自己所定位的最终目标是取代绝大部分的单反相机的场景,我说的是场景。所以它的天花板还是非常高的。 我之前也说过,X200 Pro 的主摄从上代旗舰的 1 英寸往回退到 1/1.28 英寸,但是用户体验没有下降,没有下降原因就是芯片处理能力加上影像算法又提升了一大步。这个说明一个问题,主摄的用户体验已经到了一个不错的水平,如果打个分的话,假设常规焦距的单反是 100 分,现在我们的主摄接近 80 到 85 分。 但是在长焦和视频上,跟单反差距还是比较大的。如果继续打分的话,主摄是 80 到 85,长焦大概在 60 分,勉强及格。 演唱会场景下,10 倍焦距的时候,我们的 X200 Pro 还是 OK 的,20 倍的时候也就是说你坐在外场的时候,在晚上的拍摄效果,能够看得清楚这个人是谁,但是用户还是不敢把照片拿朋友圈分享,因为有点拿不出手,但是 10 倍可以拿的出手。 在长焦这一块上,我们的手机影像离单反有比较大的距离。争取 3 到 5 年,vivo 能够把长焦提升到 80 分这个水平,这个机会还是存在的。虽然手机的内部空间利用已经到了极限,其他的提升空间在哪里?影像传感器的感光能力还可以通过技术继续提升,另外大模型和影像算法还可以有很大的提升。这就是我对 vivo 未来把长焦做到 80 分有信心。 拍照是相对静态的,所以算法的作用空间会大很多,但是视频是动态的,视频要加一堆算法的话,功耗会有巨大的压力。当然这里也有提升空间,芯片现在是 3nm,下一代是 2nm,SoC 芯片,甚至未来专门的影像处理芯片都会进步。我们下一步也会把大模型的算法能力用在视频上,但是视频的总体逻辑是动态的,所以算法的加持能力还是会弱一些。 无论是长焦还是视频,离用户高要求的满意还有不少距离,技术本身也还有很大的发展空间,所以影像依旧是未来旗舰手机的重点。 再说 AI,确实是过去两年时间里大模型的产生,AI 的发挥在那还是很快。回归到手机本身讲,AI 还是有它的限制空间,手机的最大的问题是算力不够,我把手机 AI 分成了三个阶段: 第一阶段就是 AI 能力加强过去一些功能,比如过去一段时间,整个手机行业比较热门的就是 AI 消除,这个功能十几年前就有,功能技术时代就有,但是那个时候算法比较低级,一直做不好。 过去的语音识别能力,用深度学习的方式,做得好的可能成功率只有 90%,这种成功率你就会发现,对话搞不了几轮,每个环节失真太厉害了。生成式大模型出来依旧,语音识别能力和语义理解能力,一下子提升很多。过去我们有个功能叫电话秘书,最早是在 NEX 3 上推出,别人一听就知道是传统 AI 做出来的,说不了两句就把电话挂了。现在因为有 AI 加持,短时间内大家听不出来是 AI 在讲话。 这些都还是基于某一个功能或者某一个模块的提升,跟通用人工智能(AGI)不是差一点,而是差了十万八千里。 第二个阶段,我认为,是大模型能力结合到系统里去。比如说,我们过去找一个功能设置,根本找不到,因为菜单选项太多,乱七八糟。未来 AI 和系统深度耦合,能够让手机清楚地知道你的意图,知道下一步要操作什么,手机交互变得更加智能。比如我们刚开始尝试的「原子岛」,就是知道你的意图,来提出解决方案。这个阶段会跑比较长的时间,因为这个阶段用户体验,现在算力勉强可以满足。 第三个阶段,就是我们在 VDC 2024 大会上说的 PhoneGPT,我们当时展示的功能就是点个外卖,说能点成功。其实每一步成功率只有 85%,跑三步就跑不动了,时间也很长,这个体验只是个模型,用户体验根本不好。 真正要实现 PhoneGPT 的要求,对算力要求不是增加一点,而是增加好多倍。现在的一体架构,封装架构,以及带宽,都不够。真正 PhoneGPT,整个能力要求就是对现在高速存储,服务器端能力,带宽能力,SoC 架构要跟服务器端要接近才有机会实现。 这个就跟影像一样,我们能看到用户的需求已经产生,很多模型跑在云端的服务器上,我们内部的算力中心差不多接近 1 万张算力卡,很多模型在云端可以跑得动,比如 130B 参数的模型,但这个规模在手机上根本跑不动,手机只能跑 2B、3B 的参数。所以手机真正实现 PhoneGPT,我估计没有五年,达不到用户体验上的要求。 AI 这个赛道,目前还在第二阶段,它是一个渐进式的提升,不是 0 到 1 的提升。所以 AI 对整个换机潮,目前来说,驱动力是不大的,因为用户没有感到了从 0 到 1 的突变,只有从 0 到 1 的突变发生,用户发现 PhoneGPT 能干那么多事情,他们才会有强大的换机欲望。 因为我自己既管产品也管技术,所以我透露的应该都是目前我们的技术或者整个行业的技术目前所处的水平。 Q:在智能手机行业,新质生产力体现在哪些方面,最重要的是在哪些部分? 胡柏山:手机行业就是最典型的新质生产力的代表,按照我的理解,新质生产力所体现出来的有三高的特点,高科技、高质量、高动能,也有四新的特点。如果以这个标准来衡量,新质生产力里面,手机就属于典型的新质生产力范畴,大家看到过去那么多年,新技术在手机上不断地迭代。 我们自己非常重视的两个赛道,一个是影像赛道,一个是 AI 赛道。影像赛道里面,过去大概五年,大家能够感受到手机在各种条件下的拍照效果,这是一个突飞猛进的过程。 手机替代了过去很多我们用的数码相机,甚至都把微单取代掉了,然后在部分场景也替代掉了单反,更多的消费者愿意为拍照效果好去买单,愿意多掏更多的钱来买手机使拍照效果好。 2024 年我们发布的 X100 Ultra 以及 X200 Pro,我们命名为「演唱会神器」,也是一样。这几年演唱会场景非常多,大家开各种演唱会,消费者希望把这个美好的时刻记忆下来。演唱会场景为什么需要手机?单反相机不能带入演唱会场景,所以消费者记录美好瞬间只能用手机。 AI 赛道也是如此,AI 刚起步,其实也赋能了手机很多赛道。我觉得手机行业作为新质生产力的代表,完全是毋庸置疑的,我也相信未来很长一段时间,手机还是作为最最核心的消费电子产品,能为新质生产力添砖加瓦。 vivo MR 原型机明年见,人形机器人成熟要十年后 Q:vivo 在 MR(混合现实)和人形机器人上的进展如何? 胡柏山:我们 MR 跑得比较快,vivo MR 团队已经达到将近五百人,我们的目标进度是 2025 年大概 9、10 月份,高保真的 MR 体验原型机会在全国大概十几个城市的 vivo 店上架体验。从开始预约到现场体验,形成一个标准化的流程,让大家体验一下。 商业化的话,我们要看整个 MR 的生态,MR 生态还是需要娱乐的内容,游戏的内容。因为 vivo 是一家比较纯粹的,不做内容生产的公司,所以内容上要看整个生态能不能及时匹配上。当然,很多信息表明业界朝有利的方向走,腾讯在内容上会加大投入,过去他们的想法是要做硬件,最近的想法是不做硬件,还是做软件,这对我们来说是一件好事。 我对 MR 团队的要求是我们一定要找到我们自己认为比较刚需的场景,人群细分点没有关系,但是对细分人群来说,MR 是非要不可。 就比方说,手机上玩的游戏或者主机上玩的游戏,体验是这个水平,MR 一来以后,用户发现原来那些都是渣渣,体验有巨大的提升。除了 MR 设备没带在身上以外,大部分时间,他们一有时间玩游戏就找那个 MR 上去,这就是刚需场景。 关于人形机器人,去年我们也提到这个概念,为什么有这个需求大家很清楚:社会老龄化越来越严重。 从趋势角度来说,机器人确实是一个方向,我们自己分析过机器人的一些关键的路径,其中有个就是空间感知。MR 的空间感知能力非常强,MR 做好以后,机器人空间感知能力不会出问题。 机器人还有一个要求就是手和脚要足够灵活,它的大脑决策能力要很强。所以要实现大家理想中的机器人,我们自己的判断需要十年以上。 空间感知能力以及决策能力短时间内没有那么完美,但是手和脚的能力其实是会进步比较快,像特殊场景干特殊工作的工业机器人。 真正理想的机器人可能需要十年甚至十五年以上才能实现,但是我们可以分阶段实施,先比如说先限定一个范围,生产线机器人,可能干「两份活」,但是我们未来希望做「十份活」,这个能力我们也在构建,出产品没有那么快。 我们现在整个逻辑是这样的,这种机器人我们内部叫做场景需求和用户需求比较明确,但是技术解决路径不完全明确。就跟之前聊影像一样,用户要的就是对标单反机拍摄,机器人属于用户场景需求足够明确,只是技术不匹配的情况。未来三到五年,我们搞清楚技术成熟的状态,我们可以根据这个技术的成熟状态,在中间这个时间点设置一个具有解决某一些局部场景能力的产品出来。 说白了就是我们要搞清楚未来三到五年技术达到什么状态,包括 AI 能力。根据这个技术能力,我们在理想场景情况下,中间做一些裁剪,满足具体场景的需求,这是我们自己内部制订的一些产品周期。 Q:AR 产业链成熟进度会快一些,这块怎么看? 胡柏山:对于 AR 这个产品我们这么理解,首先用户需求角度,眼镜不能太重,带显示的 AR 眼镜很重的,四五十克,这个体验不好,有些 AR 眼镜做的显示部分,显示东西比较少,这个品类暂时我们没有做,不带显示的眼镜我们会考虑。 无论做哪个品类,我们都要找到我之前讲的刚需的场景,必须要找到细分人群,对这个品类来说,他非要不可,前一段时间产品同事跟我聊,我问找到非要不可的用户和场景有没有?他说找到一部分,听起来也挺有道理。 因为很多用户在干活的时候,手已经被占用了。要不要不另外一个人站后面,为他服务?如果说他只有一个人,手被占的情况下,需要一个辅助设备来弥补那个场景,手机也好或者其他设备不能很好解决。所以,我们的 MR 设备的定位逻辑就是这个东西对那部分人是刚需,而且非要不可,我们找到了一些人群,应该产品快的话 2025 年底,慢的话 2026 年会出现。 折叠屏需求出现了去伪存真,产品节奏会改 Q:增长了 4 年的折叠屏手机市场出现了停滞乃至下滑的情况,vivo 对折叠屏手机的规划是怎么样的? 胡柏山:折叠屏可能一开始各个厂商对它的希望比较大,因为毕竟是一个产品形态的巨大的变革。回到用户需求角度来说,谁在用折叠屏? 一类像我这样超过 45 岁以上,眼睛开始老花的人群,现在折叠机就解决很多眼睛开始老花,要看很多新闻或者视频,他需要手机屏幕大很多,这是解决年纪大的问题的需求。 第二类人就是像在座的各位媒体人,都用折叠机,要处理很多信息,也包括我自己,要处理公司的邮件很多信息。 直板机处理信息就是先是纵向的,点进去就必须要横过来,这个体验不好,而且字比较小。 不管哪一类都是解决细分人群的需求,我为什么说做产品,我们还要搞清楚对哪些用户是刚需。折叠刚出来的时候中间很大一部分用户是抱着尝新的态度,过去没有用过,试着用用,结果用了之后发现对他来说并不合适。 我有一个朋友,他说手机除了看微信,打电话,发短信,剩下就是刷抖音,抖音还是竖屏,折叠屏对他根本没有作用,下一部肯定不会再买折叠屏。 经过前面的发展以后,折叠屏留下来的就是刚需的用户,刚才说的两类用户,去掉的就是那些尝新的用户。第一和第二类用户市场容量,其实相对没有那么大。而且很多场景,像游戏场景,折叠屏使用肯定不好,它的散热环境比直板机要差,操控体验也没有直板机好,所以折叠屏就变成了一部分细分人群的产品。这个市场规模总量多大,取决于那部分细分人群的规模,未来可能大概稳定五百万台的规模, 对我们来说,我们要不要做?要做。因为用户需求角度有那些人群,但是我们要控制一下,我们上一代大折一次做了两款,一款主打影像和性能,一款偏性价比,我们计划上百万台销量,最后发现还是干了大几十万台,这个规模还是有限的。后面正常就是一年一迭代,按照这个节奏推进,把用户体验做好,毕竟始终有一部分用户是折叠刚需,比如有的用户一部手机处理日常微信,日常社交,另外一部手机看股票行情,审批文件。 另外,小折叠产品这块,2023 年小折叠产品全球范围内是增长的,2024 年,行业领先品牌的小折叠掉了 30% 到40%,后续 vivo 应该不会再出小折叠产品。 旗舰机价格还会涨,次旗舰体验已经相当不错 Q:今年旗舰机微微涨价,明年涨价还会继续吗?vivo 如何平衡成本价格? 胡柏山:我们判断涨价可能还是持续,涨价两个因素,第一个很清楚,旗舰的 SoC 平台,半导体制程会往上再提,所以持续涨价是确定性的,都要涨,我们也在尽量跟 SoC 厂商协商,也不能涨的太猛,比如说他要牺牲他的毛利空间,我们也牺牲一点毛利空间,来维持或者说到涨价幅度慢一点,五百,我们涨三百,另外两百下一年再涨。 第二个包括刚才说的影像,像长焦,离 80 分比较远,我们每年要持续投入,虽然空间不变,但是里面的实现方式,像镜头的排布,模组的实现方式,会有大的变化。大的变化以后,良率会降低,各个产品成本都在增加。 旗舰机价格往上走是必然趋势,对于大部分普通用户来说,(次旗舰现在)已经做的比较好了。比方说 N-1 平台(使用上代旗舰芯片的次旗舰手机),用户体验已经比原来提升不少。我们在未来的旗舰影像也可能会布局在 N-1 平台产品上,满足用户购买力的问题。 说白了,如果用户要追求极致用户体验,影像、AI、游戏的极致体验,现在对不起,还是得多掏五百块钱。不追求极致体验,一般体验,OK,N-1 平台也有很好的外观,当然也没有那么极致体验,但是对用户来说,游戏也不玩那种最猛的,就玩原神,N-1 平台完全没有问题。拍照,你不追求演唱会 20 倍长焦,你追求 10 倍,我们 X 系列的普通款也能满足的比较好。 所以,用户购买力强的对体验有极致追求的,会更加往上走,但是我们中间肯定还是会布局一些合适的价位段的产品和比较好的体验的产品来满足用户的需求。
雷军跨年直播:小米汽车明年目标交付 30 万辆,SU7 Ultra 还有新外观?
从 2024 到 2025 这是 2025 年的第一篇推送,爱范儿的朋友们,新年好! 昨晚,雷军通过一场跨年直播,带领我们回顾了小米汽车过去一年的辉煌成就,也展望了一下 2025 年,聊了一下即将推出的新车。 在这场持续了 4 个多小时的直播里,雷军还顺便带直播间的朋友们参观了一下小米汽车工厂。有趣的是,雷军在现场看到一辆叉车时,竟然萌生了试驾的念头,结果却被工作人员拦下,只因操作叉车需要特种车辆驾驶证。 雷军当即表示,2025 年,小米驾驶培训要开一个叉车学习班。 错过了本场直播的朋友们,别担心,我们给你划了重点。以下是董车会梳理的本场直播中雷军提到的核心要点: 1. 小米 SU7 一年卖了多少辆? 今年年初,我向内部下达了 7 万辆的任务,供应链的备料是 7.6 万辆。后来我们将全年目标提高到 10 万、12 万,甚至是 13 万。没想到,几天前我们提前完成了 13 万辆的交付任务。有媒体评价小米 SU7 是年度之车,感谢车主朋友们的支持和认可。 我专门准备了一份 24 年的成绩单,大家看一下,我们已经交付了超过 13.5 万辆车。 2. 明年准备卖多少辆车? 今天的跨年直播中,我的第一个 flag 是明年加速交付 30 万辆车,这也是我在工厂办直播的一个原因。许多朋友可能不太了解车企,许多车企已经工作十几年,销量都没有超过 30 万辆。即使今天表现最出色的车厂比亚迪,也用了 10 年时间才达到 30 万辆。 3. 只花 100 多亿就把车造出来了? 最近我发现很多营销号夸奖我,把我夸成了一朵花,他们说雷军只花 100 多亿就把车造出来了,这真的是个骗局。我们在汽车研发方面投入了 130 多亿元,包括工厂建设、全国销交付网络以及 1 万多人的工资费用,到目前为止大约花费 300 亿元左右。 4. 还要投入多少钱? 我们在小米 10 周年时提出,未来 5 年至少投入 1000 亿用于研发。今年(2024 年)大约投入 240 亿,明年(2025 年)预算为 300 亿,5 年大约投入 1050 亿。 我有时候认为不可思议,像小米这样规模的公司 5 年时间能投入 1000 多亿用于研发,这是真金白银的投入。网上总有人质疑我们是「组装厂」,这让我很生气。 5. 漂移学了多少次? 我大概学习了 10 次。 6. 小米 SU7 Ultra 会有机盖风道的选装吗? 其实这件事我一开始是反对的,但由于需要的人实在太多,前不久我们决定开发开孔机盖,给它加上更多空气动力学套件,大概四五月份出来。我只想借此机会向大家表明,大家的意见我们都听到了,每个意见我们都会认真分析。 前盖没有风道的 SU7 Ultra 量产版 前盖有风道的小米 SU7 Ultra 原型车 7. 小米 SU7 Ultra 量产版极速能跑多少? 在盐城试车场跑了 359km/h,这是试车场的极限,不是车的极限。实际上没有赛道可以测试它的实际时速,未来可以在国外寻找赛道进行尝试。如果没有任何改装和减阻,我们应该能跑到 370km/h 左右;如果进行一些减阻,应该能超过 400km/h。 8. 什么时候带 SU7 Ultra 量产版去纽北测试? 我们开春就过去,3 月中旬开始在纽北练习。 9. 小米汽车工厂有多大? 我们整个工厂的面积相当于故宫的三倍, 10. 为什么要给 SU7 增加璀璨洋红色? 其实这个颜色早就做好了,但是之前调研的时候发现大家更喜欢其他颜色,我自己倒是很喜欢(洋红),所以当时我就提议,这个颜色我们 2025 年再发布吧。 11. 现在小米汽车的智驾发展到什么程度了? 小米的智驾团队分布在北京、上海、武汉等地,全年都在全国不同地方进行测试,不仅在工厂和实验场,还在各个城市的大街小巷,包括地下停车场,我们都一个一个进行测试。今年我们已经进行了几次直播,接管率以及体验都很出色。 我再向大家分享几个数据。12 月 9 日,小米的智能驾驶行驶里程突破 1 亿公里,这是全行业最快突破 1 亿公里的智驾里程,用户的自驾活跃率高达 88.82%。这个比例非常高。 12. 什么时候全系推送? 我认为我们可能还需要再等待一两个月。 13. 为什么这么早曝光小米 YU7? YU7 提前两个月发布公告,原因是我们需要进行更长期的全面测试。由于带着重伪装,YU7 的漆面、风阻和能耗等方面都测不准,因此我们决定改成无伪装,认真测试,我认为质量是第一位的。 小米 YU7 雷军还称,小米汽车在 2025 年有三大任务: 小米 SU7 Ultra 3 月份上市; 小米 YU7 6、7 月份上市; 交付新车 30 万辆以上。 这三件事我们都要做好,而且 15 周年对小米来说,也是非常关键的一年,我们也准备了一系列的庆典活动,到时候再找时间跟大家一条一条说。 最后,我们来看看雷军 2025 年的 3 个愿望: 第一,我希望在 2025 年交 30 万辆车,现在每天都有很多人在催我,压力很大。 第二,我希望有时间去更多的地方看看美景,尝尝各地的美食,顺便测试一下我们的汽车。 第三个愿望,明年我想好好地健身,我觉得身体健康真的很重要,我立了一个小 flag,我打算在健身房打卡 100 次。 我从事汽车工作后的工作量翻倍,每天都很忙,希望自己尽早从这种状态出来。创业是一个痛苦的过程,你会非常忙碌,压力非常大。我认为这个状态还会持续两三年,等到小米汽车基本稳定,我会轻松很多。 我认为健康对每个人都非常重要,我希望大家在新的一年里能够规划适合自己的运动,无论是跑步、自行车还是健身房。 编辑 | 李华
苹果Vision Pro或已停产,新一代产品在路上
【环球网科技综合报道】1月1日,有消息称苹果第一代 Vision Pro 头显或已停产。这一决定可能源于该设备需求疲软以及生产削减的早前报道。 苹果商店 据外媒The Information报道,苹果在今年初夏开始缩减Vision Pro的生产,并可能在2024 年底前完全停止生产当前版本的设备。这一举措表明,苹果现有库存已足够满足该设备至 2025年的市场需求。历史上,苹果曾对低需求产品采取过类似策略,如iPhone 12 mini。 外媒指出,Vision Pro的需求疲软主要归因于其高昂的价格和内容生态系统的不足。苹果 CEO 蒂姆·库克曾表示,该设备主要面向对尖端技术感兴趣的早期采用者,而非大众市场。 随着 Vision Pro 的停产,苹果将把重心转向开发一款成本更低的头显。据报道,苹果已告知供应商准备在未来产品的整个生命周期内生产400万台低成本头显,这一数量仅为原计划Vision Pro生产数量的一半。 尽管第二代Vision Pro的开发工作目前处于暂停状态,但有迹象表明,苹果可能会发布一款对该产品的小幅更新,如芯片升级。此前,天风国际分析师郭明錤和彭博社记马克·古尔曼均在社交平台中透露,一款更具迭代性的第二代Vision Pro正在积极开发中,并有望引入M5芯片和Apple Intelligence。预计该设备将在2025年秋季至2026年春季期间发布。(旺旺)
早报|小米 SU7 15 周年限定色今日开售/苹果鼠标或将加入 AI 语音控制/OpenAI 2025 年新目标公布
OpenAI CEO 公布公司 2025 年新目标 传字节跳动斥资 70 亿美元购买英伟达芯片,官方辟谣 三星斥资千亿计划成立未来机器人办公室 小鹏大众联合采购,帮助前者优化成本 英伟达 7 亿美元收购 AI 初创公司 特斯拉宣布上海储能超级工厂项目竣工验收 小鹏开年内部信:2024 年经历至暗时刻 阿里云宣布本年度第三轮大模型降价 Meta 首席 AI 科学家:智能是社会最缺乏也最宝贵的资源 智谱深度推理模型 GLM-Zero 预览版上线 小米 SU7 15 周年限定色亮相 妙控鼠标或将加入 AI 语音控制 OpenAI CEO 公布公司 2025 年新目标 近日,OpenAI CEO Sam Altman 公布了公司 2025 年新目标。 此前,Altman 在个人媒体账号征集网友们对 OpenAI 的愿望。此后 Altman 公布了 OpenAI 2025 年的新目标,目标中 AGI 排名第一,其余的排名为 agents、让 4o 升级变得更好、更强的记忆能力、更长的上下文、「成长模式」、能够深入研究的功能、更好的 Sora 以及更个性化的设置。 此前,据 The Information 报道,微软和 OpenAI 已签署了一份秘密协议,协议内容包含关于 AGI 的定义,并且主要评判维度不看技术而是收益。并且 OpenAI 认为需要研发出能够带来 1000 亿美元收益的 AI 系统,才能被视为实现 AGI。 Altman 还表示,OpenAI 即将推出的众多新功能几乎没有被提及,而排名中出现的「grown up mode」或将成为新功能之一。 此外,Altman还在近期接受了 Forbes 采访并表示对 AI 未来保持乐观态度。采访中 Altman 表示,在接下来的 18 个月内,快速进步的技术或将会导致变革性的 AI 出现,并且他预测这不会改变人类的基本驱动力,但会让整个世界发生巨大改变。 传字节跳动斥资 70 亿美元购买英伟达芯片,官方辟谣 据 The Information 报道指出,字节跳动计划 2025 年斥资 70 亿美元投入英伟达最新的 Blackwell 芯片,并且该计划将由张一鸣主导。 报道称呼,张一鸣近期与东南亚及其他地区数据中心运营商讨论,获取英伟达即将于明年出货的 Blackwell 架构芯片。此外,张一鸣告诉供应商,字节跳动计划在未来两年内在 AI 硬件、土地和建筑等资本支出方面超越其他中国科技巨头。同时他还表示,将亲自监督这些开发项目,以确保公司拥有足够的计算能力来训练和运行其 AI 能模型。 据参与字节跳动项目的人士透露,字节跳动向部分数据中心供应商和银行表示,预计明年将在 AI 芯片、数据中心以及包括海底电缆在内的其他硬件上投入超过 200 亿美元,其中,近 70 亿美元将用于海外云服务,从而获取到英伟达的 AI 芯片。 12 月 31 日,中证金牛座报道,字节跳动发言人就上述新闻回应:信息不实。 三星斥资千亿计划成立未来机器人办公室 近日,据韩国机器人公司 Rainbow Robotics 在 12 月 30 日的一份公开文件中表示,三星电子已成为其最大股东。 根据文件显示,三星此次斥资 2670 亿韩元购入了 Rainbow Robotics 的大量股份,共计约 393 万股,在完成股份转让后,三星电子预计将持股 35%,计划日期为 2025 年 2 月 17 日。据悉,三星电子已经是 Rainbow Robotics 的第二大股东,持有该公司 14.71% 的股份,约合 285 万股。而在此次交易之前,Rainbow Robotics 的最大股东是其创始人 Oh Jun-ho 及其关联实体。 此外,三星电子在另一份声明中同时宣布,通过此次收购,未来将正式成立一个直接向首席执行官汇报的「未来机器人办公室」。 据了解,Rainbow Robotics 为一家韩国智能机器人研发商,主要从事协作机器人的研发、制造和销售。其产品能够在执行简单和重复性任务方面协助或取代人类劳动力。目前 Rainbow Robotics 的旗舰产品是 RB-Y1 移动双臂机器人,为世界上第一款面向 AI 专家的研究平台。 小鹏大众联合采购,帮助前者优化成本 12 月 31 日,据芯流汽车报道,小鹏大众将联合采购,从而帮助小鹏优化成本、提升毛利率。 据知情人士透露,持有小鹏 4.99% 股权的大众,目前正拿出车型,并深度联合参与小鹏的日常采购,二者的联合采购结合了小鹏的技术和大众的体量与议价能力,从而优化小鹏的成本,更好地贯彻其车型价格下攻的战略,也能帮助大众优化智能化硬件的采购选择。 据悉,解决内部采购贪腐、借助大众之势优化供应链成本管控后,小鹏凭借 MONA m03 和 P7+ 两款车的大爆实现了困境反转,而这场双赢的合作,还在联合开发 CEA 架构、MEB 平台等层面不断深入。 此前,据媒体报道,2024 年 2 月,小鹏与大众围绕平台与软件战略技术签订联合开发协议,双方就车型及平台的共用零部件订立联合采购计划,合力降低平台成本。同年 7 月,小鹏与大众签订电子电气架构技术联合开发协议,通过联合开发项目组的密切技术合作,第一个搭载双方联合开发的电子电气架构的车型预计将在约 24 个月内量产。 英伟达 7 亿美元收购 AI 初创公司 据Run:ai 官网公告,英伟达完成了对 AI 初创公司 Run:ai 的收购。 官方表示,Run:ai 表示坚持开放平台理念,为合作伙伴提供广泛的 AI 解决方案和平台选择。并且 Run:ai 透露,将计划开源其软件,虽然 Run:ai 仅支持英伟达,但开源后将有助于应用范围扩展到整个 AI 生态系统。 据多家媒体获悉,欧盟委员会在 12 月初无条件批准了英伟达斥资 7 亿美元对 Run:ai 进行收购。2024 年 10 月,欧盟曾表示该交易需接受反垄断审查,并且反垄断监管机构警告称,该交易威胁到了市场中的竞争。早在 8 月,美国司法部也曾调查英伟达收购 Run:ai 的反垄断风险。不过,欧盟委员会 12 月初表示,此收购交易不会引发竞争担忧。 据了解,Run:ai 成立于 2018 年,专注于在 GPU 和类似芯片组上 AI 工作负载的编排和虚拟化软件层。自 2020 年以来,其一直和英伟达保持紧密合作。2024 年 4 月,英伟达发布新闻稿,宣布收购 Run:ai 公司。 特斯拉宣布上海储能超级工厂项目竣工验收 12 月 27 日,特斯拉上海储能超级工厂项目顺利通过竣工验收,从 5 月开工到竣工仅耗时 7 个月,刷新了「特斯拉速度」。2024 年 5 月 23 日,特斯拉中国第二座超级工厂——储能超级工厂在上海临港破土开工,工厂预计 2025 年初正式量产。 官方表示,特斯拉上海储能超级工厂预计 2025 年第一季度投产,规划年产 1 万台商用储能电池 Megapack,储能规模近 40GWh,供给全球市场,将成为「中国智造」在国际舞台的又一张新名片。 此外,据媒体报道,2024 年特斯拉 Q3 发电及储能业务的营收为 23.76 亿美元,同比增长 52.4%,尤其是,特斯拉 Q3 的能源业务毛利率达到创纪录的 30.5%。说明储能已成为特斯拉重要增长点。 小鹏开年内部信:2024 年经历至暗时刻 12 月 31 日,据晚点 Auto 获悉,小鹏汽车董事长兼 CEO 何小鹏今日发布 2025 开年内部信,他全面总结了小鹏 2024 年在各方面取得的进展,并表示要穿过暴风雨,迎接 2025 年。 何小鹏称,2024 年是 「逆风前行」 的一年,小鹏曾在上半年经历至暗时刻,也曾在下半年连续 4 次打破历史纪录,他希望小鹏可以在 2025 年做到 「行稳致远」。 何小鹏还表示,未来 10 年是 AI 的时代,AI 的发展浪潮趋势会比移动互联网更大、持续时间更长。没有人能打败趋势,AI 也会具有很强的先发优势。他重申 「小鹏要成为全球领先 AI 汽车公司」 的目标。 获悉,小鹏计划在 2025 年每个季度都有全新或改款车型上市。未来 3 年,小鹏在产品上的核心策略是:做精、做少,做差异,做全球。 2024 年,小鹏下半年凭借 MONA M03、P7+ 两款新车实现销量翻盘,毛利率一年内累计提升约 20 个百分点,与大众的合作也推向深入。2023 年,小鹏内部寄予厚望的 G6 上市后销量未达预期,管理层经历几番调整。 此外,12 月 20 日,小鹏在德国埃伯斯贝格完成欧洲第 1 万辆的交付,成为首个达成欧洲万辆交付的中国纯电新势力品牌。小鹏目标将在 2025 年底,累计进入超 60 个国家和地区;未来 10 年,小鹏要做到一半销量来自海外市场,力争成为中国中高端新能源品牌出海份额第一。 阿里云宣布本年度第三轮大模型降价 12 月 31 日,阿里云宣布本年度第三轮大模型降价,通义千问视觉理解模型全线降价超 80%。 据悉,其中 Qwen-VL-Plus 直降 81%,输入价格仅为 0.0015 元/千 tokens,创下全网最低价格;更高性能的 Qwen-VL-Max 降至 0.003 元/千 tokens,降幅高达 85%。 目前,按照最新价格,1 块钱可最多处理约 600 张 720P 图片,或 1700 张 480P 图片。 据介绍,Qwen-VL 是阿里云研发的大规模视觉语言模型。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。Qwen-VL 系列模型性能强大,具备多语言对话、多图交错对话等能力,并支持中文开放域定位和细粒度图像识别与理解。 Meta 首席 AI 科学家:智能是社会最缺乏也最宝贵的资源 近日,Meta 首席 AI 科学家、图灵奖得主杨立昆(Yann LeCun)接受了加州大学圣地亚哥分校杰出物理学教授 Brian Keating 的专访。 当被问及「对于 AGI 有什么其他想法」时,杨立昆持乐观态度。但他同时也表示,人们总是低估了 AI 发展的难度,并且要达到让大众认可的人类级智能,杨立昆对此表示依然不是短期内能实现的。 他认为,智能是社会最缺乏也最宝贵的资源。AI 增强人类智能的影响力可能堪比 15 世纪的印刷术——虽然也曾带来短期的负面影响,但它推动了知识传播、启蒙运动、科学发展和民主。他认为,「如果我们能做好,AI 将同样具有变革性影响。」 在采访中,他还表示,「如何超越自回归式大语言模型架构,发展能够理解真实世界、获得某种常识的架构。」将成为未来几年 AI 领域的重大挑战。 智谱深度推理模型 GLM-Zero 预览版上线 12 月 31 日,智谱宣布深度推理模型 GLM-Zero 的初代版本 GLM-Zero-Preview 上线。 据官方介绍,这是智谱首个基于扩展强化学习技术训练的推理模型。其专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。 在同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面的表现大幅提升,其在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI o1-preview 相当。官方也表示,目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型仍有不少的差距,在未来智谱也将持续优化迭代。 目前 GLM-Zero-Preview 已经上线使用: 用户可以在「智谱清言」中的「Zero 推理模型」智能体免费使用,支持上传文字或图片,模型会输出完整推理过程; 开发者可以在「智谱开放平台」中,通过 API 进行调用。 小米 SU7 15 周年限定色亮相 12 月 31 日,小米汽车公布小米 SU7 小米 15 周年限定色,并为其命名为「璀璨洋红」。 「璀璨洋红」配色将于 2025 年 1 月 1 日 0 点开售。一同公布的还有共计 4 款新轮毂以及 1 款内饰新配色。新款轮毂分别为:20 英寸米型轮毂(提供珍珠白、璀璨洋红两款配色,珍珠白全系可选,璀璨洋红独占同色版本)、20 英寸花瓣低风阻轮毂(全系可选)、21 英寸运动轮毂(Max 版可选);新款内饰配色为米灰色,全系可选。 同时,锁单未交付用户可参与限时改配,其时间为 2025 年 1 月 1 日 0 点至 2025 年 1 月 5 日 24 时。 妙控鼠标或将加入 AI 语音控制 北京时间 12 月 31 日凌晨,据彭博社记者 Mark Gurman 透露,新一代的妙控鼠标有望加入 AI 语音控制。 Gurman 在推文中指出,考虑到苹果正处于发展 AI 的时期,因此推测妙控鼠标有望加入 AI 语音控制功能。 但他也强调,现阶段仅为推测,目前已有的线索仅能代表苹果将重心放在人体工程学(即重新调整充电接口)和手势操作方面。 此前,Gurman 曾透露,新款妙控鼠标将会更换造型以及充电方式,从而解决被诟病已久的人体工学问题。 lululemon 发布 2025 新春短片 12 月 31 日,运动生活方式品牌 lululemon 发布 2025 年新春主题短片《回到春天》。 据官方介绍,为庆祝中国农历新年,lululemon 携手歌手、创作人、演员李宇春,乒乓球运动员倪夏莲,青年演员吴汉坤等不同代际人物代表,共同演绎《回到春天》新春主题短片,鼓励人们无论处于人生的哪个阶段,都可以找回出发时的状态,像春天一样,再次出发。 lululemon 中国区品牌营销高级副总裁谢淑玲表示,lululemon 延续去年对于春天般好状态的歌咏,在这个一年重启之际,并鼓励大家找到自己的方式,感受身心合一,探索内在自我,迎来下一个和人生中的每一个春天。 据悉,2025 年 lululemon 新春主题短片《回到春天》由青年导演范庆执导,旅居巴黎的独立音乐人丁可作曲,在重庆、云南等地取景摄制。该片用充满电影感的镜头语言,呈现了处于不同人生长跑的人们如何面对惊喜、挑战、困惑与成长,如何重拾好状态,满怀希望,再次出发。 腾讯音乐旗下「酷狗音乐」被判侵权 12 月 31 日,中国音乐著作权协会发布公告,腾讯音乐娱乐集团因未经许可使用中国音乐著作权协会管理的音乐作品,前者被法院判决认定侵权。 据公告显示,截至 2024 年 12 月 19 日,就音著协诉腾讯音乐旗下「酷狗音乐」侵害音乐作品信息网络传播权纠纷一案,音著协方面收到了广州知识产权法院的二审判决书,全部判决驳回酷狗音乐上诉,维持原判。 一审法院认定,酷狗音乐侵犯了音著协对涉案歌曲享有的信息网络传播权,依法应当承担相应的侵权责任。案件具体判决原因,一审法院认为,酷狗音乐在与音著协的合作合同到期后,未经许可使用由音著协进行集体管理的多首歌曲,主观过错较明显。 赔偿方面,一审法院就上述案件,判决酷狗音乐向音著协赔偿经济损失共计近 22 万元人民币。 音著协还称,已经对腾讯音乐集团多次提起侵权之诉,已经生效的判决中,法院全部判决腾讯音乐集团旗下平台构成侵权,其他亦有多起对 QQ 音乐、酷狗音乐、酷我音乐、全民 K 歌平台的维权诉讼案件正在法院审理过程中。 此外,12 月 16 日,音著协曾发文称,就诉酷我音乐侵权案中胜诉,获赔近 12 万元。 《守望先锋》国服官宣 2 月 19 日回归 昨晚,守望先锋官方微博宣布,国服将于 2 月 19 日正式回归。 在正式回归前,官方将邀请大家在 2025 年 1 月 8 日至 15 日参加公开技术测试,所有参与玩家,将在之后获得外观奖励。 目前,国服预约已经开启,官方表示所有的账号数据均被完整保留。 此前,因代理商网之易与《守望先锋》制作公司暴雪娱乐公司协议期限到期,《守望先锋》系列于 2023 年 1 月 24 日在中国大陆地区停止运营。此后,2024 年 4 月 10 日,网易游戏官宣,将暴雪游戏重新带回国服。 《7 天》发布定档预告 12 月 31 日,电影《7 天》发布定档预告。 据介绍,该片讲述陈丑时一个能看见恋爱时长的男孩,因为巧合在牙科诊所邂逅女孩温倩,两人一起对抗规则,开启了一段奇妙的爱情,而当感情进一步发展时,陈丑时向温倩坦诚了一个关于自己的秘密,他从小就能在女孩头顶看到一串数字,那是他们之间的恋爱时长,而他和温倩只有七天的故事 该片由尹露监制,邱玉洁编剧、导演,蒋奇明、张艺凡领衔主演,将于 2025 年 3 月 14 日上映。 杰森莫玛海王后再演 DC 超级英雄 近日,演员杰森莫玛正式宣布,他将由海王变 Lobo,加入新的 DC 电影宇宙 DCU。 据介绍,Lobo是 一名强大、狂野的外星赏金猎人。此前,莫玛传闻出演这个角色许久,特别是他已确定不再出演海王。近期,莫玛在个人帐号分享了「是不是会演 Lobo」的采访,并回应如果片方找莫玛演 Lobo,必然是大写的「好」。后续,莫玛表示接到片方的邀请。 据 Deadline 等媒体随后透露,莫玛的 Lobo 将亮相于 DC 新片《超女:明日之女》,该片也宣布将于明年 1 月 13 日开拍。届时,米莉·阿尔柯克饰演超女,马提亚斯·修奈尔饰演反派Krem,影片由克雷格·吉勒斯佩执导,已定档 2026 年 6 月 26 日北美上映。 新浪 2024 年度十佳华语影片公布 12 月 31 日,新浪电影公布了其 2024 年度十佳华语院线电影、年度推荐外语片以及年度推荐演员。 据介绍,《好东西》获得 2024 年度十佳华语院线电影 Top1;《机器人之梦》获得 2024 年度推荐外语片;宋佳获得 2024 年度推荐演员,同时宋佳也担任这次年度十佳视频的配音。 官方表示,评选范围限定在 2023 年 12 月至 2024 年 11 月在国内院线公映的影片及有作品公映的演员,不包括重映作品。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。