行业分类:
加载中...
头条分类:
加载中...
英伟达含量为零!华为密集模型性能比肩DeepSeek-R1,纯昇腾集群训练
密集模型的推理能力也能和DeepSeek-R1掰手腕了? 华为利用纯昇腾集群训练出的盘古Ultra,在数学竞赛、编程等推理任务当中,和R1打得有来有回。 关键是模型参数量只有135B,整个训练过程零英伟达含量,而且没有出现损失尖峰。 通过改进的模型架构和系统优化策略,盘古Ultra拥有优异的性能表现和52%以上的算力利用率。 并且有网友表示,训练过程中没有出现损失尖峰这一特征,似乎此前从未实现。 135B密集模型比肩DeepSeek-R1 作为一个参数量135B密集模型,盘古Ultra达到了同尺度密集模型的最优表现,甚至可以与DeepSeek-R1等参数量更大的MoE模型竞争。 在预训练阶段模型的评测中,盘古Ultra在绝大部分英文基准任务和全部中文任务上取得了最佳性能,优于Llama 405B、DeepSeek-V3等baseline模型。 尤其在MMLU、TriviaQA、GSM8K等具有挑战性的数据集上,盘古Ultra展现出了卓越的语言理解和推理能力。 经过指令调优后,盘古Ultra的性能进一步提升,尤其在AIME 2024、MATH-500等数学推理任务和LiveCodeBench等编程竞赛题上达到了SOTA水平。 综合来看,盘古Ultra超越了包括GPT-4o、Mistral-Large 2等强大模型,与DeepSeek-R1等MoE模型竞争激烈。 同时,盘古Ultra在Arena Hard、MMLU-pro等涵盖通用语言理解和推理的评测中也表现优异。 那么,为了实现这样的效果,盘古Ultra采用了哪些关键技术呢? “三明治”层归一化架构 如前文所述,盘古Ultra是一款135B参数量的密集模型,使用了94层的网络结构。 盘古Ultra采用了分组查询注意力(GQA)机制,包含96个查询头(query head)和8个键值头(key-value head)。 为了解决训练超深网络面临的不稳定性和收敛困难等问题,盘古Ultra在模型架构上做出了两个关键改进——深度缩放的Sandwich-Norm层归一化和TinyInit参数初始化策略。 传统的Transformer通常使用Pre-LN层归一化,但在深度模型中,Pre-LN容易导致每个子层输出尺度的波动,引发训练不稳定。 盘古Ultra使用的Sandwich-Norm层归一化,则是在残差连接前对每个子层的输出做归一化,并根据网络深度对初始化值进行缩放,从而有效消除了训练过程中的loss尖峰,使训练过程更加平稳。 用更容易理解的话说,传统方法仅在每个子层的输入进行归一化,但这种方法针对输出也进行了归一化,形成了Pre-Norm + 子层 + Post-Norm的“三明治”结构。 但是,仅仅使用Sandwich-Norm还不足以完全消除深度模型训练中的不稳定性——随着网络层数的增加,每一层的输出尺度仍然可能出现累积性的漂移。 为此,盘古Ultra在Sandwich-Norm的基础上,进一步引入了深度缩放机制,对Post-Norm中的放缩参数γ进行了深度相关的初始化。 至于整个模型的初始化,传统的初始化通常采用的Xavier初始化方法仅考虑模型宽度,而盘古Ultra采用的TinyInit同时依据模型深度和宽度来缩放初始化权重的标准差。 这种初始化方式有助于在前向传播和反向传播过程中,维持各层梯度的方差在一个合理的范围内,避免了梯度消失或爆炸问题,使得训练过程更加稳定,同时也加速了收敛。 实验表明,TinyInit在深度模型训练中取得了更好的收敛速度和下游任务性能;同时针对embedding层,保持权重的标准差接近1也能提升训练稳定性。 另外,盘古团队也针对Tokenizer进行了优化,通过在通用中英文、代码、数学等不同领域分别进行词频统计,再合并去重,最终得到了一个兼顾领域覆盖和编码效率的153376个token的平衡词表。 8192张昇腾NPU训练集群 盘古Ultra的整个训练流程主要分为三个阶段——预训练、长上下文扩展和指令调优。 其中预训练又可以分为三个子阶段: 通用阶段:侧重建立语言理解和知识储备,使用了大量中英文通用语料,覆盖网页、书籍、百科等多个来源; 推理阶段:引入更多高质量的数学和代码数据,以增强模型的推理能力。同时还使用instruction数据来帮助模型学习执行任务; 退火阶段:帮助模型巩固知识和推理能力,并强化指令遵循能力。大量使用问答对和人类反馈数据。 研究者们采用了基于规则和模型的数据清洗方法,并设计了curriculum learning策略,让模型循序渐进地学习不同难度的样本。 预训练中使用了AdamW优化器,并动态调整超参数。 预训练后,模型在最长128K的长上下文数据上进一步训练,通过扩大RoPE的基频来实现长序列建模,以增强处理长文档的能力。 最后的指令调优阶则段使用监督微调(SFT)和强化学习(RL)来使模型更好地适应下游任务,学会执行指令并与人类偏好对齐。 训练设施方面,盘古Ultra使用了一个由8192个昇腾AI处理器组成的大规模计算集群。 集群中每个节点包含8个NPU,通过华为高速缓存一致性互联HCCS以全互联的拓扑结构连接,每个NPU配备64GB内存,节点间则通过200Gbps的RoCE(RDMA over Converged Ethernet)网络互联。 为了实现盘古Ultra的高效训练,研究团队还采用了一套系统的并行策略和优化技术。 在并行策略的选择上,盘古Ultra综合考虑了模型的规模、数据的特性以及硬件的拓扑,最终采用了数据并行、张量并行、序列并行和流水线并行等多种并行方式的组合: 128路数据并行,将训练数据分片到不同设备,保证了数据吞吐; 8路张量并行,利用设备内部高带宽切分层内张量,实现高效通信; 序列并行用于处理超长序列以降低显存压力; 8段流水线并行,将不同层分布到不同设备,形成高效的计算流水线。 在并行策略的基础上,盘古Ultra还从多个角度对训练系统进行了深度优化。 一方面,通过使用ZeRO(Zero Redundancy Optimizer)分布式优化器,将模型状态分片到不同设备,大幅降低了单个设备的内存占用,在提高数据并行度的同时,确保了每个设备的内存负担在可接受范围内。 另一方面,研究者们通过各种通信和计算优化技术,最小化了通信开销,提升了计算效率: 通过算子融合(Kernel Fusion)将多个小算子合并,减少了内存访问和kernel启动; 通过通信计算重叠(Communication-Computation Overlapping)实现通信和计算的深度交织,隐藏通信延迟; MC^2(Merged Computation & Communication)和BOA(Batch Optimization Accelerator)分别对张量并行和规范化层的通信进行了专门优化…… 在算法、工程、数据各个层面的精细优化下,盘古Ultra实现了52%以上的算力利用率。
比ChatGPT贵1000倍,每月14.5万元,OpenAI两大新推理模型曝光
编译 | 梁颖琳 编辑 | 云鹏 智东西4月15日消息,据The Information报道,OpenAI计划于本周推出新一代AI推理模型(o3和o4-mini),其核心突破在于能够跨学科整合知识并提出创新实验方案。 新模型通过同步调用物理学、生物学、工程学等领域的知识库,可自主生成创新实验方案,例如设计核聚变反应参数或优化病原体检测方法。 其高价瞄准企业市场,OpenAI拟以每月2万美元(约合人民币14.5万元)的价格向《财富》500强企业提供该服务,费用是基础版ChatGPT的1000倍。首批目标客户包括石油公司、制药巨头及国家级实验室。 若商业化成功,该模型或成能源、材料研发领域的“标配工具”。 一、AI跨学科生成实验方案,能源制药企业或成首批用户 OpenAI新模型通过整合生物学、物理学、工程学等多领域知识,可自主提出新实验思路。例如,为核聚变反应设计激光强度参数,或结合生态学方法优化病原体检测方案。 早期测试者透露,该技术或彻底改变科研协作模式——传统需多领域专家耗时数周的合作,AI大幅可缩短实验设计时间。 二、实测案例:AI成科研“加速器” 美国阿贡国家实验室分子生物学家Sarah Owens利用OpenAI现有模型(o3-mini-high),仅用数分钟便完成“用生态学统计法预测废水病原体”的实验设计,效率较传统方式显著提升。 另一化学家则通过AI设计出塑料降解实验的温度与压力参数范围,耗时仅为自主研究的1/10。 OpenAI总裁布罗克曼在2月能源部联合研讨会上称:“未来模型将用‘深度思考’解决重大科学问题,让科研效率提升10至100倍。” 目前,美国洛斯阿拉莫斯国家实验室已部署专用超算,为九个联邦实验室提供推理模型支持。 三、从“想法”到“验证”仍有差距,以高价策略应对企业市场 尽管AI可生成实验方案,但验证仍需人工介入。 例如,模型建议的激光参数需通过模拟软件测试,化学实验需依赖实验室设备。OpenAI正开发自动化AI代理(如Operator),未来或结合机器人加速实验验证。 OpenAI计划对推理模型收取高额费用,目标客户包括石油公司、药企等《财富》500强企业。但其现有AI代理(如Operator)仍存在操作复杂网站时出错的问题。 公司拟通过“人类反馈强化学习”优化模型,即筛选用户成功案例迭代训练。 结语:AI离“科研大脑”还有多远? 科学家指出,AI无法理解蛋白质与DNA的相互作用等微观机制,实验室验证仍是必经之路。 正如阿贡国家实验室化学家Massimiliano Delferro所言:“从怀疑到兴奋,关键在于AI能否与模拟器、机器人协同工作。” 尽管AI展现了跨学科创新潜力,AI的训练样本可能存在偏差,例如忽视贫困地区无法联网的弱势群体,或者艺术生成AI的训练样本主要以西方白人肖像为主。 开发者在设计系统时,仍需将更多要素纳入考量。
DeepSeek红利耗尽后,元宝拿什么和豆包斗?
短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。 最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧随其后的DeepSeek被挤到了第三的位置,腾讯元宝则滑落到了第七名。 2月13日,作为首家在C端主力产品中接入DeepSeek-R1满血版的元宝,一度趁着DeepSeek东风崛起:3月3日力压DeepSeek和豆包,首度登顶。 但好景不长,尽管一手靠着DeepSeek加持,一手靠着投流开道,但元宝再次被豆包赶超的现实,足以说明了一个道理:AI应用之战,DeepSeek只能救一时之急,却无法成为敲定胜局的那颗银子弹。 随着各家AI应用相继补上了深度思考的短板,好奇流量逐步消退之下,用户惰性再次占据上风。中国知名产品经理之一的傅盛对此曾给出过一个观点,认为“产品体验只好20%、30%,没人会动。产品力得强10倍以上才能击穿市场。” 除了产品力的弱化之外,在产品设计和功能丰富度上落后一截的元宝,也成了被豆包再次迎头赶上的原因之一。 国内头部大厂产品经理刘凯(化名)向字母榜(ID:wujicaijing)分析道,“DeepSeek,包括接入DeepSeek的元宝,目前更多处在商品化模型的阶段,而眼下的ChatGPT和豆包们,则更像一个完善的产品,靠着更丰富的功能体系,在用户侧具有了更持久的竞争力。” 最近元宝和豆包的产品更新,无疑便是对上述论断的一种有力佐证。在最新的元宝V2.15.0版本中,字母榜观察到,同为iPhone用户,但有人在下载后的元宝APP中却找不到智能体的身影。 元宝智能助手给出的回应中表示,“目前元宝部分功能在调整迭代中,AI应用可能暂时未显示,请您持续关注后面的产品升级和更新。” 就在元宝还处在一些基础标配功能的调整之际,追求规模效应的豆包又从抖音那里借了把力。继3月份被曝出抖音测试接入豆包AI能力之后,根据字母榜获悉,目前抖音进一步扩大了其消息列表中出现豆包联系人的内测范围,被测试到的用户,点击进入豆包联系人界面后,还会被引导直接下载或打开豆包APP。 借助上述动作,字节试图进一步借助超级APP的流量,为旗下AI应用产品导流,从而增强用户打开豆包的频次和粘性。对比元宝,尽管此前微信也接入了腾讯元宝,但在微信内找到元宝的流程,要比从抖音消息列表中打开元宝复杂些。 但在大模型技术尚未走向成熟之际,当下的AI应用排名,还存在一系列变数。尤其是DeepSeek的出现,让整个行业都或主动或被动直面不确定性的压力考验。未知的挑战多种多样,反过来,这些挑战也在不断创造豆包和元宝继续较量的新空间。 为了尽可能将用户吸引到自家APP上,过去两个月内,围绕模型上新和产品更新,元宝和豆包各自展开了一系列新动作。 接入DeepSeek仅4天后,2月17日,腾讯自研的深度思考模型“混元T1”便灰度上线元宝,紧接着,3月1日,混元自研快思考模型Turbo S也灰度上线元宝。 坚持不在豆包中接入DeepSeek的字节,也加紧了在自研深度思考功能上的动作。3月18日,豆包APP全量上线深度思考功能,时隔十天之后,同月28号,豆包又对深度思考功能做了番更新,主要亮点在于将联网搜索能力直接融进了思考过程中,可以实现“边想边搜”。直白点理解,就相当于豆包把联网搜索键与深度思考键合二为一了。 在国内大模型创业者李振看来,这可以视为两家公司在模型差异化方面,选择了两条不同的路径:元宝将模型重心放在了缩短推理模型的答案生成时间上,豆包则更重视答案的生成精准度,以此来形成各自模型的区隔度。 此前,业内便有部分人秉承着一种观点,即模型随着时间的推移会变得越来越不同,而不是越来越相似。元宝和豆包最近的模型上新,成了这一观点的最新例证。 在产品设计和功能丰富度上,原本便呈现落后态势的元宝,表现得比豆包更加热情。官方统计的一份数据显示,接入DeepSeek的35天内(从2月13日到3月18日),元宝版本更新了30次。 拍照问答、识图,语音输入,支持检索历史对话,支持折起/展开思考过程,支持停止生成回答、可重新编辑等豆包已有的系列功能,在最近两个月内被元宝密集上新。 某种程度上,DeepSeek成了腾讯元宝产品上新的加速器。2月中旬以后,元宝的版本更新从过去的月更压缩到周更,并进一步提速至当前的日更模式。 在产品更新上趋缓的豆包,则选择了另一条吸引用户的策略,即持续强化和超级APP抖音的联动。 最新的动作便是扩大抖音消息列表中植入豆包作为联系人的内测范围,引导更多抖音用户下载或使用豆包APP。 在此之前,豆包已经支持在生成答案中向用户提供抖音短视频特色内容,并在3月中旬内测了一项新功能,即在原有的对话内容下面,用户继续上滑屏幕,会出现基于用户兴趣和对话推荐的内容流,堪比在豆包内再造了一个微缩版“抖音”。 来自抖音内容生态的加持,正成为当下豆包增强用户粘性、对抗腾讯元宝+DeepSeek竞争的重要手段之一。 两家产品的上述动作,各自取得了一定成绩。QuestMobile最新发布的《2025第一季度AI应用市场竞争分析》报告显示,元宝月活用户从去年12月的211万,飙升至今年3月份的约4000万,豆包则从去年12月的7523万,继续增至3月份的1.1亿。 但它们又都被DeepSeek这匹黑马压了一头。截至3月份,DeepSeek月活用户达到1.9亿,成为国内AI应用市场无可争议的第一。 从一度领先豆包再到被豆包重新赶超,元宝在下载量排行榜上的变化,也让外界思考一个现实问题,即虽然接入DeepSeek可以带来一时的用户增长,但或许难靠着DeepSeek持续增长下去。 归根到底,应用在产品设计和功能丰富度上的完备性,才是培养用户当下产品忠实度的更强竞争力因素。 如同刘凯并不将DeepSeek视为对OpenAI的威胁一样,靠接入DeepSeek打出产品差异化特点的元宝,当下也很难具备和豆包在用户规模上掰手腕的资本。“因为它更像是一个商品化的模型,而豆包更接近一个完善的产品,从而使其具有更持久的竞争力。” OpenAI推出的ChatGPT便是这方面的成功代表。除了OpenAI提供更强大的基础模型之外,还因为ChatGPT背后有一系列附加功能,使其构建起了当下最丰富的产品体验。 在这方面,从2月中旬之后才开始发力的元宝,已经明显慢了好几拍。 产品更新落后一步的另一重影响,则体现在跨设备的多端平台开发上。直到2月28日,元宝才正式发布了电脑版客户端。在刘凯看来,多设备的转化对用户留存率提升也是助益之一,因为这样“用户就可以在周末和工作日,都能找到使用AI助手的便捷方式,厂商也能借此更深度融入用户的生活。” 此外,因模型选择所带来的用户体验差异,某些时候也可能导致用户选择上的不同。 相比元宝植入的混元自研大模型和DeepSeek,豆包没有提供多模型选项,且在豆包APP中也没有勾选联网搜索的额外选项。这些更拟人的设计,都使得豆包在用户体验上更有好一些,尤其是面向下沉市场用户和老年人群时。 另一不容忽视的因素则在于,随着各家AI应用中都相继加入深度思考功能所带来的思维链展示,用户对接入DeepSeek类产品的好奇心开始有所消退,这些因好奇而来的试用型用户,留存率往往较低。 当好奇心弱化之后,用户惰性便会重新占据上风。正如傅盛所说的那样,如果你的产品体验只好20%、30%,就很难培养用户的忠实度。 现实的残酷在于,不只元宝和豆包,一众大模型公司,都在力争追求产品力强10倍以上应用的出现,并以此击穿市场,就像DeepSeek已经实现的那样。 面对一个新模型层出不穷的未来,AI应用的比拼,正演化为一场新的马拉松竞赛,“你不能因为一次发布而过于沮丧,也不能寄希望于靠一次发布就奠定大局。”李振说道。 年初DeepSeek惊艳亮相后,很快更强大的GPT 4.5、Grok 3,以及Anthropic的Claude 3.7都来了。 对于元宝来说,即将发布的DeepSeek R2新模型,无疑将是其再次捕获好奇流量的重要时刻。 3月份各家纷纷推出自研推理模型之际,就有外媒爆料称,DeepSeek正在加速推出R2模型,该模型原计划在5月初发布,但现在官方希望能尽早发布。 当然,豆包也同样留有后手。近期,字节最新深度思考模型Seed-Thinking-v1.5对外亮相,官方称其在数学、代码等多项推理任务中超过了DeepSeek R1,而且参数规模更小。对比DeepSeek R1的671B总参数,同样采用MoE架构的Seed-Thinking-v1.5,总参数只有200B。 除了通过新模型来吸引用户之外,留给元宝和豆包的另一场较量,或许将发生在AI Agent领域。 3月份,AI创业公司蝴蝶效应发布的应用产品Manus,以世界首款通用AI Agent的名头,震惊业内。 黄仁勋在英伟达GTC 2025开幕主题演讲中,更是预告当下AI行业,正在从生成式AI进入Agentic AI新时代。 被视为AI Agent元年的2025年还没过半,OpenAI便推出了Deep Research,马斯克的Grok 3也推出了DeepSearch功能,国内智谱AI同样上线了AutoGLM,号称可以实现边想边干。 这些AI Agent的一大特点,便是能够自主打开并浏览网页,完成从数据检索、分析到生成报告的全过程。 Manus的爆火印证了市场对通用智能体的高度期待与迫切需求,同时也揭示了AI发展向下一阶段的跃迁。 AI Agent爆发的“第一块多米诺骨牌”被推倒后,外界开始将目光放在了谁能造就一款真正好用的AI Agent上。 一旦成功,这或许将是国内外AI厂商追求的下一个“好奇流量”时刻。现在,就看元宝和豆包,谁能抢占这一产品高地了。
我用可灵AI 2.0 复活《清明上河图》,这就是下一代创作工具
可灵 AI 2.0 发布 在 Sora 之前,就已经受到全世界用户的认可的生成式视频工具是什么?——可灵 AI。 无需折腾剪辑软件,几分钟,就能拿到自然如实拍,画面质感如电影的动态视频。 可灵稳坐国产 AI 视频的头把交椅许久,从去年 6 月 6 日首次上线开放测试以来,产品快速经历了二十多个版本的迭代。可灵 1.6 模型的图生视频内部评测,比 1.5 模型整体效果提升近 200%,还让毛绒玩具的特效迅速出圈。 自动播放 现在,可灵终于又迎来了一次重大更新:可灵 2.0 视频生成,以及可图 2.0 文生图模型。 自动播放 从人物跑动、火焰燃烧的真实物理轨迹,到机械蝴蝶穿梭未来都市的奇幻场景,AI 不仅能精准模拟现实世界的运动规律,更能将抽象文字转化为惊艳的动态画面。 APPSO 第一时间来到发布会现场,本次的更新亮点包括: 1. 可灵、可图模型层面更新, 快手结合多项自研技术创新,画面美学、语义响应和动态质量大幅度提升。2.0 全面升级了训练和推理策略,尤其是强化了对于复杂运动主体交互滤镜、构图术语等专业的表达和理解响应。 2. 精准微调功能。可灵新增新增「多模态编辑」功能,支持在一段 5s 的视频的基础上,输入图片/文字,对视频进行灵活、精准的修改和再创作。可图新增「图片编辑」及「风格转绘」功能。 3. AI 音效生成,根据影像内容结合文字prompt,生成适配的音效片段 另外,我们还提前体验了内测,除了震撼于新模型的强大之外,也发现了一些使用小技巧,帮助你体验这款强大的生成+编辑工具。 不止是多模态功能,更是一种语言 仅仅使用文字作为和 AI 沟通的语言,显然不足够,只能有限描述脑海中的想法。配合图片,准确程度提高一层。再结合动态影像,又更上一层楼。 这些,共同形成了 MVL:Multi-modal Visual Language,一种全新的交互「语言」。MVL = TXT 语义骨架+MMW 多模态描述子,即通过文本+动作描述文件,生成精细的视频成片。 这套语言形成了 可灵 2.0 中新增的「多模态编辑」功能。包括三种模式:替换、增加和删除。 在可灵的创意社区,我们发现了一个来自可灵用户制作的视频,堪称现实主义创作。 不过嘛,既然是现实主义题材,还可以再写实一点:应该让川普和马斯克,去工厂里装手机。 这就是「多模态编辑」大展身手的时刻了,我们先来把缝纫机删掉。通过下方的文字输入框,@ 具体的图片和部分,进一步明确需要改动的内容。 at 的设计很符合用户直觉,尤其是多个素材的情况下,能更方便地用文字指出要改动的对象。 注意!点击编辑,会弹出笔刷编辑界面。在这里,可以通过用涂抹的方式,选择要替换的具体区域——一定要时间线上选几个点,才能保证覆盖到整个视频。 可以看到,在涂抹和文字 prompt 的双重保险下,单个元素能被删的干干净净。 替换模式就有更多可玩的了,除了修改原视频,还可以结合图片。 不是要让这俩人去装手机吗?把手机流水线的图片导入,进入选择主题界面,框出具体的部分。 大功告成! 在可灵 2.0 版本中,「多模态」不仅是一个新功能,更加是一种全新的互动语言,更充分地开发和调用模型的能力,作用于实际的创作工作流。 从生成到编辑,全链路的创作工作流 如果说「多模态编辑」满足的是影像从业者,在精细调优方面的要求,那可图 2.0 以及可灵的图生视频模式,就是造福所有人民群众的。 图生视频占到使用比例的 85%,是更为可用的手段。再搭配视频模态微调,就能实现一次跑完所有流程。 比如,先拿胶布人形象图,生成当下最流行的 3D 玩偶版本。 然后直接生成视频——没错,手指和动作,只是一句话即可生成。 自动播放 文字 prompt 随意更改,镜头视角调整后,又是一支新片。 自动播放 截取《清明上河图》的一段画面,交给可灵 2.0 即可,汴河水波荡漾,船只随流水轻摇,岸边行人熙熙攘攘。近千年前的社会风貌「焕发生机」。 灯火通明,丝竹乱耳,宾客们酒杯叮当,《韩熙载夜宴图》的主人公半醉半醒的场景也在可灵 AI 2.0 的帮助下得到了很好的还原。动态质量和运动幅度,都和素材的题材相当符合。 OpenAI 创始团队已然分崩离析,但聚是一团火,散是满天星,下面这张经典的合照倒也很符合 OpenAI 当下的处境。 Sam Altman 与马斯克的恩怨纠葛早已是科技圈的谈资,两人没少针锋相对,我们也用 AI「重现」了他俩干架的名场面。 动作的流畅性,可以看出可灵 2.0 在时序响应上的能力,动作符合逻辑、连贯自然。 下一代创作工具,已经到来 显然,可灵对 2.0 版本,不仅是为了展示技术上的进步,也是理念的再阐述:全新的功能,全新的语言,全新的能力。 在全新设计了 DiT 架构之后,视觉模态和文本模态的融合更加对齐。同时,这次的更新背后是对后训练的大量探索。 除了在预训练阶段,通过精准的建模与训练和视视觉标注的映射,使得文本和图像的对齐做的更好。还有在后训练阶段,通过强化学习提高多模态推理能力 不过,更重要的是,可灵所秉承的「让灵感成真」,使得使用体验成为整个产品的中心。 从发布到现在,有超过 2200 万的用户使用、肯定可灵 AI,在平台上总共创作了 1.68 亿个视频和 3.4 亿张图片。上万名开发者在使用可灵 AI 的 API,应用在自己的行业场景中。而这些开发者已经累计生成了 1200 万张图像,4000 万个视频。 模型能力并不是炫技的武器,也不是秀肌肉的手段,而是需要实在地进入用户的工作流当中,让每个创作者,无论经验如何,都能以简单地方式、便捷的工具,讲好自己心中的故事。
苹果 “抢卖” iPhone奏效:前三月出货5790万台,飙涨10%
编译 | 王涵 编辑 | 漠影 智东西4月15日消息,据外媒彭博社(Bloomberg News)最新报道,行业数据追踪机构IDC称苹果公司或因关税刺激,iPhone出货量提高10%。 苹果2025年第一季度的iPhone出货量增长了10%,达到5790万部,分析称这是由于苹果公司为抵消中国对美国出口商品征收关税的预期而进行了囤货。 一、逆风抢跑,一季度iPhone出货量逆势增长 据IDC最新发布的《全球移动电话季度跟踪》(Worldwide Quarterly Mobile Phone Tracker)的初步数据,2025年1月到3月,iPhone出货量达到5790万台,比去年同期的5260万台增长530万台,同比增长约10%。 2023年同期iPhone的出货量为5520万部,在2024年出货量较上年下滑4.7%之后,2025年又实现了10%的增长,这一增速变化着实引人关注。 IDC分析指出,这一增长并非源于市场需求突然提升,而是iPhone制造商为应对中国对美国出口商品加征关税而进行的提前备货。 据彭博社报道,苹果和其他消费电子企业为应对特朗普政府的最新关税措施,已提前数月进行准备,在美国销售渠道中囤积了大量产品。 IDC 表示:“这种供应端的激增主要是为了缓解潜在的成本增加,实际上抬高了第一季度的出货量数据,使其超出了基于实际消费需求的预期水平。” 根据特朗普政府现行规定,在关税生效之前,企业无需为已在美国本土市场销售的产品支付额外关税。 同时,美国以外的其他地区的苹果手机出货量也有所增长,主要源于其对潜在供应终端和价格上涨的担忧。 ▲IDC《2025年Q1全球移动电话季度跟踪》数据 美国总统唐纳德·特朗普(Donald Trump)已宣布对从中国进口商品加征的关税最高可达145%,不过在周五获得电子产品相关豁免后,实际税率有所下降。 这也可能是暂时的,因为特朗普政府已表示,专门针对半导体产品的新关税将卷土重来。 不过,外媒预计这些征税将远远低于最初的145%,从而避免消费者面临巨大的价格涨幅。 值得关注的是,在全球出货量整体增加的背景下,中国的出货量却有所下降。 IDC认为这与中国政府的设备补贴政策有关,该政策将售价超过6000元人民币的iPhone Pro系列机型排除在补贴范围之外。 二、72小时5架专机:印度产iPhone闪电调运美国 除了提前囤货外,苹果抵消关税影响的策略还包括将印度制造的产品紧急调用于美国分销,印度制造的产品相较中国产可能享受更低关税税率。 印度被列入特朗普政府批准的90天关税豁免国家名单,在此期间其输美商品只需10%的最低关税。 ▲苹果公司2024年度供应链进展报告封面 4月8日《印度时报》援引苹果美国高管消息称,为最大限度降低关税政策带来的成本压力,苹果在新关税生效前实施了印度产iPhone紧急调运计划。 报道显示,3月末苹果曾安排5架货运专机,在72小时内完成印度至美国的iPhone快速转运。 目前印度已具备全球20%的iPhone产能,可以满足美国市场主要需求。 结语:苹果与关税的竞速,既是冲刺,更是长跑 由于白宫关税政策的不确定性,近期美国各地苹果专卖店出现了“抢购潮”,不少消费者选择提前入手iPhone以避免可能到来的涨价风险。 IDC全球终端研究副总裁瑞安·雷斯(Ryan Reith)表示:“美国政府最近暂停对中国智能手机进口关税的豁免为美国公司提供了暂时缓解,但在关税持续波动的情况下,对中国供应链的严重依赖依然存在,这让其未来规划面临挑战,并使许多公司在做出重要决策时面临高度不确定性。 ” 外媒分析指出,美国智能手机品牌当前正面临“与时间赛跑”的关键时刻。 企业必须赶在政策窗口关闭前开足马力生产出货,以充分享受关税豁免红利。然而,阴云笼罩的经济前景很可能给后续消费需求“泼上一盆冷水”。 苹果公司将于2025年5月1日公布第二财季(1月至3月)数据,届时将能更好地反映这一时期的实际销售情况。
安谋科技亮相2025世界互联网大会亚太峰会,共筑AI算力新未来
图:安谋科技CEO陈锋发表演讲 4月14日,以“数智融合引领未来——携手构建网络空间命运共同体”为主题的2025世界互联网大会亚太峰会在香港会议展览中心拉开帷幕。作为世界互联网大会主办的重要区域性会议,本届峰会汇聚了来自国际组织、政府机构、科技企业及学术界的高层代表,共同探讨数智时代发展命题。安谋科技CEO陈锋受邀出席,并在主论坛暨数智未来论坛上发表演讲,系统阐述了公司在推动AI技术与本土半导体产业融合方面的思考与创新实践。 本届峰会由世界互联网大会主办,香港特别行政区政府承办,香港创新科技及工业局协办。为期两日的大会聚焦AI大模型发展路径、技术创新降低成本、开源生态构建、多模态应用以及高算力芯片等多个热点话题,为全球数字经济发展和AI治理提供了重要参考。 在大会首日举行的主论坛暨数智未来论坛上,安谋科技、IBM、群核科技三家先锋科技企业的高管代表,与来自国内外的政府高级官员及高校专家一道,围绕数智未来、人工智能、数字安全与治理等议题展开分享。 AI作为引领新一轮科技革命的核心驱动力,已成为新质生产力发展的关键引擎,正在深刻重塑全球产业格局,并加速从云端向终端渗透。同时,随着AIGC、大模型等新兴AI技术的规模化落地,全球AI算力需求呈指数级增长。对此,安谋科技CEO陈锋以“夯实AI算力底座,赋能产业智能化跃迁”为题发表演讲,分享了其对AI技术发展趋势的洞察,并强调算力始终是推动AI发展的核心要素,是数智时代的关键生产力,未来AI的持续演进仍将依赖于底层算力支撑。 历经30余年的技术深耕与生态积累,Arm®技术已发展为全球唯一支撑万亿级生态的计算架构,并且成为最普及的AI计算基石,凭借其高性能、低功耗和灵活扩展性等优势,广泛应用于从云到端的各个领域。从最新数据来看,目前全球超过2000万名开发者基于Arm架构进行创新研发;预计到2025年底,将有超过1000亿台搭载Arm处理器的AI设备面世。 作为国内领先的芯片IP设计与服务提供商,安谋科技始终致力于将自研业务技术创新与Arm技术授权相配合,紧贴本土市场需求与新兴技术趋势,为国内芯片厂商提供“全球标准、本土创新”的异构计算解决方案。一方面,公司持续将最新的Arm技术引入国内市场,充分撬动Arm技术的全球生态资源,助力国内芯片厂商打造具有国际竞争力的产品,有效加速其商业化进程;另一方面,通过积极布局和大力投入本土研发,公司已构建起覆盖AI、CPU、信息安全及多媒体处理等核心领域的自研矩阵,打造本土领先的“高精尖”研发团队。目前,累计已有9亿颗芯片搭载了安谋科技自研产品,广泛应用于AIoT、智能汽车、移动终端及云计算等前沿领域。 当前,随着AI技术发展迈入崭新阶段,推动AI在PC、手机、机器人、汽车等端侧设备落地并实现场景化创新,已成为AI产业链竞逐焦点。未来,物理AI(Physical AI)将是AI技术的重要演进方向之一,通过智能算法与传感器数据的深度耦合,赋予AI感知和改造物理世界的能力,为机器人、具身智能等AI创新场景注入新动能。面对不断迭代的AI技术趋势,安谋科技积极携手国内领先的AI研发机构及产业链伙伴,以多维举措加速端侧AI落地与创新,全力构建Arm技术体系下的本土AI生态。 在总结发言中,陈锋表示:“作为国内AI技术创新的重要推动者,安谋科技愿与产业界同仁、政企学研各界专家通力合作,持续深化技术研发,促进产业协同,共建创新生态,通过底层技术突破为本土AI发展提供核心动能,助力‘AI+’在各行各业落地生根,让智能技术真正赋能产业转型升级。”
亚裔小哥F翻大厂!自制作弊器通过面试,却霸气拒绝Offer,录视频发油管,还……
“如果我最终无家可归或入狱,那就这样吧。” 说出这句话的,是就读于哥伦比亚大学的大二学生Roy Lee,今年还不到20岁。 实际上,他刚从社区大学转学到哥大一年半的时间,却做出了一个让哥大和亚马逊等科技巨头都尴尬的面试作弊器——他不仅通过了亚马逊、Meta、TikTok等多家公司的程序员实习面试,还将在远程面试中使用作弊器答题的视频录制下来,并且发布到油管(YouTube)上。 将一切推向高潮的,是当亚马逊发现Roy的行为并举报给学校后,Roy非但没有因为丑闻而被钉上耻辱柱,反而获得了行业大佬的夸赞和普通从业者的追捧。 因为他拒绝了亚马逊的Offer,并且对哥大对他做出的“停学一年”的决定不屑一顾,表示不会再回去。 一个不到二十岁的亚裔小伙,就这样戏耍了常春藤大学和科技巨头。 谁说“朋克已死”? 01 当亚马逊高管看到那个油管视频 一月的最后一天,冬风依旧,招聘季已经开始。亚马逊公司刚给哥伦比亚大学的一位学生Roy Lee发了软件开发工程师的实习Offer,他成功通过了技术面试,而且得分不低。 对于这个仅在美国本土就有超过百万员工的科技巨头来说,这是一个小得不能再小的招聘动作。 然而,事情突然变得非同一般。 一名高管发现了一个油管视频,一位年轻人录制了参与亚马逊“技术面试”的全过程。镜头时远时近。镜头对准年轻人电脑屏幕的时候,可以看到他在做测试题时使用了某种作弊软件。镜头拉远时,能清晰地看到男孩的样貌。 实际上,这个视频正是这名年轻男子自己录制并发布的,已经有2万次播放。他正是已经拿到亚马逊实习生Offer的Roy Lee。 错愕和愤怒之中,高管直接向Roy就读的哥伦比亚大学发送了一封举报邮件,在信中先肯定了该大学多年来为亚马逊输送了大量人才,控诉了Roy的恶劣行径,并说道: “亚马逊和哥伦比亚工程学院的长期合作关系是基于双方对正直和公平的共同承诺,因此我们对此类事件深感担忧。 我们信任哥伦比亚大学能够对这位学生采取适当的措施,并希望继续保持我们长期的合作关系。” 于是,哥伦比亚大学将Roy停学一年,并且要举办针对他的纪律听证会。 到此为止,一切都看起来像是一个“作弊通过大厂面试的学生被揪出来”的丑闻。 但Roy的反击让所有人惊讶。 他反手就把哥伦比亚大学发给他的“处分邮件”,以及亚马逊那封举报信全都公开在了X(前推特)上,并且详述了整个经过。 原来,他不仅用作弊器通过了亚马逊程序员的实习Offer,这个作弊器还是他自己做的。 他不仅拿到了亚马逊的程序员实习Offer,而且还拒绝了Offer。此外,他还用同样的作弊器通过了Meta、TikTok、One Capital等多家大厂的实习生技术面试,顺利拿到Offer。 他不仅不怕被学校“留校察看”,还声称这对他来说就是“开除”,因为他不会再回哥大。 就此,这个故事不再是一个简单的“常春藤学生面试作弊被抓”的丑闻,而陡然变成极富叛逆精神的“励志故事”。短短两个多月,Roy已经正式注册公司,多次接受知名媒体的采访,眼瞅着开辟了自己的一番事业。 02 “去他的Leetcode” Roy从一开始就没想要加入“大厂”。 他创造的作弊器名叫Interview Coder,对外公开。打开官网,最醒目的是中心的一行大字:“去他的Leetcode。” 他今年不到20岁,成长于一个韩裔中产家庭。做编程并不是他从小的梦想,实际上,从前他幻想过自己成为华尔街的交易员。直到18岁之后,他才开始学习编程。这放在硅谷,类似于65岁才上小学。 他到底是有一些天赋的,一年半之前,他顺利地从社区大学转学到了哥伦比亚大学,学习计算机。 然而,别人眼中的常春藤学府,在Roy眼中很没劲。而且AI的浪潮正在席卷全球,他立刻觉得,自己不可能在这里待到毕业——传统编程将在两年内过时,自己必须在那之前做点什么。 于是,他到处找“看起来聪明”的人,问他们想不想创业,只有一个人给出了肯定的答复,于是两个人搭伙开始做事。 说干就干,他们很快捣鼓出了两个产品,一款笔记应用程序,和一款面向酒类经销商的AI销售代理。但是收获甚微,这两次尝试,都失败了。 时间来到2025年,新的一年,新的招聘季。哥大的学子们都开始行动,计算机系的同学更是纷纷攻坚大厂的实习生岗位。 Roy也试了试。要拿到大厂程序员实习生的工作,就要通过技术面试。而大部分大厂使用的是Leetcode式的测试题。Leetcode虽然2015年才成立,但迅速成为全球技术面试准备的核心平台之一。其题库庞大,且具备系统性,和技术面试高度契合,有广泛的影响力。 也就是说,要想通过大厂技术面,得提前花大量的时间泡在Leetcode上“刷题”(网站有各种系统性的试题分类,也有针对谷歌、Meta等大厂面试的试题)。Leetcode的题库并非完全免费,要想获得更多试题、更好的“备考”,需要花钱开通服务。 Roy觉得,这一点和自己理解的富有创造力的编程相去甚远。刚开始刷题的几个小时,他还学到了一些东西,随后就是漫长而枯燥的“死记硬背”。一些试题的刁钻程度,让他怀疑在工作中永远都不会用到:“(就好像)我是亚马逊的一个大坏蛋高管,然后对你说——嘿!你能不能在倒立并做十个开合跳的同时,找出所有偶数长度的逆序回文子序列?” 所以,这种“刷题”的结果是考验你是否记忆了足够多的试题,而不是你是否真的掌握了编程。“所以真正的考验不是你有没有能力解题,而是:你以前见没见过这道题?有没有做过?有没有把答案背下来?你现在能不能把这个答案原样吐出来。” 这也太没劲了。Roy一边在Leetcode上怒刷600道题,并且拿到了前1%的好成绩,一边着手制造作弊器。 而作弊器的达成路径其实并不难,就是一个非常简单的Electron应用,前端用的是React,后端是在Vercel上托管的一些serverless函数。 说人话就是:截图给ChatGPT来解题。用户在使用Interview Coder时,首先会截取当前面试题目的截图,发给ChatGPT,由这个AI好帮手解题。然后屏幕上会有一个透明的浮动显示层,显示答案。用户最终要做的,就是照抄。 是的,AI直接给你递小抄。这个浮动层既不会被监测到,看答案的时候还会给面试官一种你在“思考”的错觉。 以亚马逊的远程面试为例,一场面试总时长1小时左右,其中有半个小时左右是用来做题的。面试官就在镜头里看着(不是所有面试官都会要求共享屏幕),相当于远程监考官。 至于为什么这么简单的工具却能瞒天过海,Roy表示,大多数大厂的面试网页都看起来很老旧,感觉停留在10年前。自己打字答题,“表演”出努力解题的样子,问题不大。 就是在这样的背景下,那条有关视频诞生了——Roy录下了参与视频的过程,并且放出了Interview Coder作弊器。 03 危机还是机遇? 作弊者还是英雄? 当学校的邮件一封接着一封出现在Roy眼前时,他曾有过自我怀疑:难道要因为这个断送整个事业吗? 虽然他的油管视频被删除,但随着他在X上发布整个事件的前因后果,并持续更新近况,巨大的关注让他明白,事情还有转机。 这也许不是一个危机,而是一个机遇。 哥大让他参加纪律听证会,他将这封邮件公开,随后哥大又以泄露机密文件通知他参加另一个听证会。而亚马逊高管的那封邮件被公开时,Roy还圈出“我们信任哥大能对这位学生采取适当的措施”,标写“LOL(放声大笑)”。 这注定已经是一条不归路,Roy的姿态很明显,他已经放弃学业,也放弃任何在亚马逊等科技巨头工作的可能性,专心自己干。而且要趁着这股“戏耍大厂”的舆论风暴,尽量做大。 这一切都让哥大和大厂愈发尴尬:亚马逊痛斥我面试作弊?可是我压根没想接你们的Offer啊。哥大要给我停学一年?可是我压根就不准备再读下去了。 当你以为你对这个年轻人有压制力量的时候,却发现对方早就不在压制范围内了。 在另一条路上,Roy迅速积蓄力量。 公司注册好了,Interviewcoder.com的域名买下来了。即便已经爆火,这个作弊器依然可以正常使用。本月初,Roy在X公布了过去两个月的“战绩”:收入22.8万美元,利润22.4万美元。其中94%的收入来自每月60美元的用户订阅。利润率99%,每月唯一的账单是vercel的3000美元。 他也毫不避讳自己的“叛逆行动”是一次成功的营销:“作为一名年轻人,我的‘病毒’直觉比任何人都好,在这个构建工具如此简单的时代,这是目前世界上最有价值的技能。” 有一次有人请教他,是如何获得“病毒式传播”的,Roy直言:“毁掉你的整个教育生涯和职业生涯,然后把它发到网上让全世界看到。” 最近,他仍然在X上更新近况:拿到了Zellow的小额投资(类似一个创业训练营),准备种子轮融资。计划在4月20日落地名为“Cluely”的产品,Roy称这将是Interview Coder的最终形态,并透露光是在发布的宣传视频上就花了六位数的资金。 名誉向Roy涌来。 很多人支持Roy,其中不乏大佬。比如曾在苹果供职12年的Ray Fernando说:“谢谢你保持勇敢、听从直觉并分享经历。你会走得很远。那些机构因为没有为你的好奇心、独创性和挑战现状的意愿投资你而遭受最大的损失。” 前思科软件工程师、PDF.ai创始人Damon Chen在看了Roy的故事之后大呼:“哥伦比亚大学!我绝不会送我的孩子去那里!” 普通从业者领略到了Roy所挑战的技术面试僵化的问题,赞同Leetcode“很愚蠢”,在AI的影响下,技术面试应当改变,如何找到/判断很优秀的开发人员是科技大厂需要思考的问题。而Roy实际上是帮他们意识到了这个问题,比起举报Roy、敦促哥大开除他,以亚马逊为代表的大厂更应该做的是及时纠正自己不完善的招聘制度。 在支持者的眼中,亚马逊气急败坏,不反思自己,只想铲除提出问题的人。而哥大不保护有才能的学生,而是心疼自己和亚马逊建立的“合作关系”,对学生动刀。 还有的年轻人受到了Roy的鼓舞,激动地告诉他:因为你,我也终于决定做点什么了! 但质疑声也并不少。 人们质疑Roy不过就是一个“作弊者(Cheater)”,而亚马逊和哥大的反应在情理之中。有从业者劝年轻人还是乖乖刷题,并为“刷题”正言,认为这是作为开发者精进技艺的好方法,而就职在一家大型公司也是一条很好的路径。 Roy到底是一个美化、包装自己的“作弊者”,还是一个具有反叛精神的英雄?这个问题人们争论不休。 也许正如某次接受采访时,主持人的嘱咐:在边缘试探和真的违法之间有一条微妙的界限,Roy需要做的是千万不能越过去。在边缘试探、挑战权威和规则,他有大好未来。但跨过界线,触犯法律,贪欲蒙心,他有可能变成下一个Sam Bankman-Fried——那个创办了加密货币平台FTX并最终入狱的年轻人。 Roy似乎已经决定不论如何,拼尽全力继续下去,在一个X帖子中,他这样说:“我坚信自己有能力塑造世界,并且我不会满足于长期实现除我之外的任何人的愿景/梦想。如果我最终无家可归或入狱,那就这样吧。” “朋克精神”能不能当饭吃?都看Roy的了。
实测:Android 微信能发实况照片了,vivo、荣耀手机率先适配
近日,微信开始小范围测试 Android 手机的朋友圈 Live 图「实况照片」的分享功能,爱范儿也在第一时间获得了测试资格,为大家带来上手体验: - 如何获得测试资格? 据爱范儿实测发现,登录 Android 微信版本号为 8.0.58 的测试版,将有一定几率获得朋友圈实况照片的实测资格,目前爱范儿手中有几台 Android 设备已经支持该功能: · vivo X200 Pro 系统版本:PD2405D_A_15.0.20.15.W10.V000L1 · iQOO 13 系统版本:PD2408D_A_15.0.22.5.W10.V000L1 据爱范儿观察,目前适配的机型主要来自 vivo 和荣耀两个品牌。 值得一提的是,「实况照片」分享功能还与微信号相关联:使用同一台机器登录不同微信账号,仅有获得测试资格的账号能够使用该功能。 - 可以查看 iOS 设备发布的实况照片吗? 经实测,已经获得测试资格的微信号,无论是 iOS 还是 Android 设备都能查看已经发布的实况图片。 - 哪些实况照片可以发朋友圈? 经爱范儿实测,包括带水印的实况照片在内,只要手机相册内能查看到「动态照片」的标识的图片,都可以在朋友圈进行分享,并且正常显示。 需要注意的是,不同设备之间的实况照片格式并不一定能互通。我们测试将其他品牌手机的实况照片传送到 vivo 手机中,尽管在相册中能正常显示为「实况照片」,但发布实况朋友圈时会提示「部分实况照片无法正常加载,将作为静态照片发表」。 - 朋友圈的实况照片能保存吗? 经实测,只要朋友圈能够正常显示的实况照片,在保存后也会以实况照片的格式保存到手机相册中,并且能够正常显示。 目前,Android 版微信的实况照片仍处在测试阶段,预计后续会陆续给更多用户开通。你有哪些想了解的功能?爱范儿上手帮你测一测。
4年大搞3.6万亿AI基建,英伟达或首次“全美国化”生产AI超算,Blackwell已在美投产
编译 | 梁颖琳 编辑 | 云鹏 智东西4月15日消息,英伟达于当地时间4月14日宣布,将首次在美国本土设计和制造AI超级计算机及芯片,计划未来四年内通过合作伙伴生产价值高达5000亿美元(约合人民币3.6万亿元)的AI基础设施。 此次布局覆盖亚利桑那州和德克萨斯州,Blackwell芯片量产与超级计算机制造双线并行。 与此同时,特朗普政府近期对电子产品关税的摇摆态度成为行业焦点——尽管手机等消费品获临时豁免,但芯片进口税率仍未落定。 值得关注的是,英伟达在声明中特别提到,其工厂将深度整合AI、机器人及数字孪生技术,通过Omniverse平台模拟生产流程,并利用Isaac GR00T机器人实现自动化制造。 英伟达认为,增加美国制造有助于更好地满足AI芯片和超级计算机的激增需求,强化供应链并提升韧性。 一、Blackwell芯片量产启动,德州、亚利桑那州建厂 英伟达CEO黄仁勋在声明中表示,公司与台积电(TSMC)、富士康、纬创(Wistron)、安靠(Amkor)和矽品(SPIL)等合作伙伴共同启动生产计划。 其中,Blackwell芯片已在台积电位于亚利桑那州凤凰城的新工厂投产,而AI超级计算机组装线则落地德克萨斯州——富士康负责休斯顿工厂,纬创负责达拉斯工厂,两厂预计未来12至15个月内实现大规模量产。 英伟达强调,AI芯片和超级计算机的供应链高度复杂,涉及先进制造、封装、测试等环节。为此,安靠和矽品将负责亚利桑那州的封装测试业务。 公司还将利用数字孪生技术(通过Omniverse平台)和自动化机器人(Isaac GR00T)优化工厂运营。 二、关税压力成催化剂,万亿产业链回流美国 路透社报道指出,英伟达此次布局与特朗普政府近期加码的关税政策密切相关。尽管美国政府宣布豁免部分电子产品关税,但芯片进口税率仍未确定。 分析师认为,英伟达若未面临关税压力,“不太可能将生产转移至美国”。 此前,苹果承诺未来四年在美投资5000亿美元,包括建设德州AI服务器工厂。英伟达的声明进一步凸显科技巨头“美国制造”趋势。特朗普在简报会上直言:“英伟达的行动与11月5日的选举和关税直接相关。” 三、催生数十万岗位,调整AI基础设施分布 根据英伟达预测,美国本土AI芯片和超级计算机制造将在未来几十年内创造数十万个就业岗位,并推动数万亿美元的经济增长。 黄仁勋称,这些“千兆瓦级AI工厂”将成为新型数据中心的核心,专门处理人工智能负载,为全球AI产业提供底层算力支持。 目前,台积电亚利桑那州工厂已开始生产Blackwell芯片,富士康和纬创的超级计算机工厂建设进度成为下一步关注焦点。 结语:供应链本土化背后的博弈 尽管英伟达称扩大美国制造是为“满足需求、增强供应链韧性”,但业界普遍认为,这是企业应对政治风险的无奈之举。 DA Davidson分析师Gil Luria指出,5000亿美元的投资承诺“可能存在夸张成分”,类似苹果的“口号式目标”。值得关注的是,若特朗普政府进一步上调芯片关税,或将加速全球半导体产业链重构。 然而,美国制造业成本高企、技术工人短缺等挑战,仍是英伟达及其合作伙伴必须面对的长期难题。
对话润和软件马超:全栈国产化+软硬一体,加速企业AI场景落地
作者 | ZeR0 编辑 | 漠影 “人工智能的发展,不应该是让人类被取代,而是让人类拥有更好的工具去解决问题。”这句看似简单的话语,却道出了人工智能发展的真正意义。 近年来ChatGPT的横空出世将AI浪潮推向了新的高度,今年伊始,DeepSeek模型的出现更让众多企业看到了将AI技术从“尝鲜”转变为快速落地赋能业务的新机遇。然而高昂的成本、复杂的部署流程、技术人才的匮乏等问题,犹如道道鸿沟,横亘在企业智能化转型的道路上。 面对这些挑战,江苏润和软件股份有限公司(以下简称“润和软件”)以其“全栈国产化+软硬件深度协同”的AI解决方案,为企业提供了一条通往智能化未来的捷径。其推出的DeepSeek一体机让企业无需深谙技术细节,也能轻松用好AI。 一、AI落地难,企业如何跨越鸿沟? “2022年ChatGPT刚兴起时,大家更多是抱着好奇的心态去体验,用它写写文章、聊聊天。但到了2023年,企业已经开始探索如何利用AI辅助生产,比如进行知识检索增强。到了2025年,Manus利用各种API工具让大模型深入到了更多的工作场景中。未来,智能体将成为企业流程自动化和决策辅助的关键技术,大模型的能力将落地到企业的各个具体业务场景中。”润和软件AI产品与解决方案部总经理马超对AI的未来发展充满了期待。 ▲润和软件AI产品与解决方案部总经理马超 的确,企业对AI的期待已经不再局限于简单的“尝鲜”,而是希望将其真正应用于企业的关键业务场景,提升效率、降低成本、创造价值。然而,理想与现实之间,却存在着难以忽视的鸿沟。 马超认为,企业在智能化转型过程中首先遇到的问题就是技术整合难度大。AI技术并非单点突破,而是涉及芯片、操作系统、算法、模型等多个层面,企业需要投入大量人力物力进行整合,才能构建起一套完整的AI系统。 其次,企业内部业务与技术脱节。许多AI解决方案过于注重技术本身,却缺乏对企业实际业务场景的深入理解,导致最终落地的效果不尽如人意。新技术对企业的人才与能力提出了新的挑战,AI技术的开发与应用需要专业的技术人才,而这正是许多企业所缺乏的。 最后,成本与资源压力成为困扰企业走向智能化的重要难题。构建和维护AI系统需要投入大量资金和资源,这对许多企业来说都是不小的负担。 面对这些挑战,润和软件明确了“企业级AI解决方案产品及服务供应商”的定位,为企业提供从AI芯片底座到行业应用集成的全链路技术栈,帮助企业跨越AI落地鸿沟,释放大模型的产业价值与业务生产力。 二、从“堆参数”到“解方程”,用AI工具精准求解行业问题 AI领域一直存在着“大力出奇迹”的现象,许多企业和研究机构热衷于“堆参数”,追求构建更大规模的模型,试图以此来提升AI的性能。然而,这种做法不仅带来了巨大的算力消耗,也使得AI模型的解释性和可控性变得更加困难。 润和软件则选择了另一条道路——“解方程”。他们坚持将行业关键问题转化为可量化、可迭代的算法命题,再用AI工具精准求解。 马超谈道,润和软件的目标是打造AI全场景智能生态体系,赋能千行百业智能化升级。 ▲润和软件AI全栈技术架构图 据他分享,润和软件拥有20多年软件交付经验和行业积累,能够深入理解企业业务痛点和流程特性,确保AI技术与企业实际业务场景深度融合。 三、打造DeepSeek一体机:四大特性,降低企业AI应用门槛 以“解方程”的思路并针对企业AI落地难的困境,润和软件推出了DeepSeek一体机,希望通过软硬件深度融合、行业解决方案、安全可靠、生态集成和扩展性等优势,打造了一款真正意义上的企业级AI落地加速器,帮助企业“无需懂AI,也能用好AI”。 DeepSeek一体机将“即插即用”、“自带模型”、“图形化配置”和“一站式平台”四大特性集于一身,降低了企业应用AI的门槛。企业无需投入巨资搭建复杂的AI基础设施,也无需招聘大量的AI人才,只需根据自身需求选择相应的模型和服务,即可快速构建专属的智能化解决方案。 马超解释说:“DeepSeek一体机不是一个封闭的盒子,而是一个‘可组装、可演进、可融通’的AI中台平台。它支持弹性算力扩展、模型与算法定制化训练扩展、软硬异构适配以及国内生态兼容,能够根据企业不断变化的业务需求进行灵活调整和升级。” 值得一提的是,DeepSeek一体机通过“国产芯片安全自主可控+HopeOS内核安全+模型数据全生命周期保护”三位一体,构建了AI应用的可信执行环境,以保障企业数据安全。 它采用模块化的设计,功能可自由扩展,支持模型与算法定制化训练扩展,支持软硬异构适配与国内生态兼容,满足企业AI可持续发展的需求。 除了DeepSeek一体机,润和软件还提供全链路定制化服务,从“算力适配、数据构建、算法增强、模型定制、应用快速封装”五个维度帮助企业将AI能力精准嵌入到自身业务流程中。 四、构建DeepSeek全场景智能生态体系,AI解决方案已落地多个行业 企业的智能化建设并非一蹴而就,需要一个强大的生态支持。为此,润和软件整合AI全栈技术能力,打造DeepSeek全场景智能生态体系,为企业提供从数据采集、处理、分析到智能决策的完整闭环。 ▲润和软件全场景云-边-端智能生态体系 这个生态体系以昇腾AI算力为引擎、openEuler开源系统为基石、OpenHarmony全场景连接为脉络,结合DeepSeek行业大模型,覆盖云-边-端,并通过“技术+业务”的双轮驱动模式,帮助企业快速落地,使其开发出符合自身特点的智能化应用。并且,润和软件的AI解决方案已经在多个行业落地生根,取得了显著成效。 在金融领域,润和软件推出的智能财务助手、智能研报等产品帮助金融机构提升了工作效率和决策水平。以智能研报为例,其撰写时间相比传统方式压缩了20%,有效提升了研报的专业性和客观性。 在电力行业,润和软件打造的变电站远程智能巡视系统,利用图像识别、图像判别等人工智能技术,实现了智慧变电应用场景的一键顺控、静默监视等功能,为变电设备安全和人员生产安全提供了保障。 在能源领域,润和软件推出的智能企业办公助手,依托深度语义理解和DeepSeek等大模型的复杂逻辑解析能力,实现了知识服务的智能化升级,帮助企业员工快速获取所需信息,提高工作效率。 此外,润和软件还在政务、汽车、企业通用智能等领域取得了丰硕成果。如DeepSeek政务一体机支持快速适配法律助手、政务办公、社区安防、街道违章等垂直领域,满足政企用户“一机多能”的需求,有效提升了政务效率。 结语:企业AI落地要找准痛点、选对路径、深耕行业 润和软件“从‘堆参数’转向‘解方程’”的理念,以及DeepSeek一体机等产品的推出,为企业AI落地提供了新的思路。其经验表明,企业AI落地并非遥不可及,只要找准痛点、选对路径、深耕行业,就能将AI技术转化为实实在在的生产力。 润和软件计划未来持续深化夯实技术纵深、攻坚场景落地、共建开放生态的发展理念,依托工程化技术解耦能力,将大模型技术重构为企业级“即懂即用”的智能业务赋能系统,助力千行百业智能化升级。 可以预见的是,随着AI技术的不断成熟和应用场景的不断拓展,会有越来越多的企业加入到智能化升级的浪潮中。
荣耀Power发布:8000mAh大电池+7.98mm厚度,1999元起
凤凰网科技讯(作者/于雷)4月15日,荣耀在今日举办的“轻户外新物种”发布会上正式推出了全新系列产品荣耀Power,主打超长续航和户外使用场景。该机型配备8000mAh大容量电池,机身厚度仅为7.98mm,售价1999元起,国补后1699.15元起。 作为荣耀新推出的“轻户外”系列产品,Power搭载了品牌称为“青海湖电池”的8000mAh容量电池,能量密度达到821Wh/L,通过中国质量认证中心认证可实现16.6小时持续亮屏使用。该机型在极端环境下的续航表现同样出色,官方数据显示可在-30℃环境下连续通话31小时,55℃高温环境下通话超过27.5小时。为应对紧急用电需求,荣耀Power配备了66W快充技术,充电10分钟即可提供相当比例的电量。 在通信能力方面,荣耀Power搭载了自研的射频增强芯片HONOR C1+,旨在改善在地下车库、电梯等弱信号环境下的网络连接稳定性。值得注意的是,该系列12GB+512GB版本还支持双向北斗卫星短信功能,为用户在山区等无常规信号覆盖区域提供通信保障。定位方面,该机型集成了三频北斗和双频GPS技术,配合新开发的磁融合指向算法,提升了导航精准度。 针对户外使用场景,荣耀Power采用了“太极缓震架构2.0”设计,官方宣称实现了“十面抗摔”的防护能力,并具备全场景生活防水特性。显示方面,该机型配备6.78英寸1.5K分辨率屏幕,峰值亮度可达4000尼特,支持3840Hz高频PWM调光,通过了中国标准化研究院Vico A+护眼认证。音频系统方面,荣耀Power搭载双扬声器设计,并融入自研声场扩展算法,提升多场景下的音量表现。 荣耀Power提供“雪原白”、“沙漠金”和“幻夜黑”三种配色选择,存储组合包括8GB+256GB、12GB+256GB和12GB+512GB三个版本,国补后售价分别为1699.15元、1869.15元和2124.15元。 该产品已开启预售,将于4月18日10:08在荣耀官方商城及各大授权渠道正式开售。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。