行业分类:
加载中...
头条分类:
加载中...
百度新商业产品“品牌百看”能捅破搜索营销天花板吗?
AI时代就这么来了。不同于前几年大众及产业对AI路线的迟疑,在当下,“拥抱AI”已经是生活、生意的必选项。 但在营销行业,一些困惑始终弥漫——眼见着用户因为AI而在搜索习惯上发生了巨大变化,那么品牌该如何在布局搜索营销时予以应对?大模型改变着内容供应的逻辑,品牌内容又要怎么做才能获得“AI的好感”得以呈现在用户面前?都知道AI是大势所趋,但到底怎么跟日常的经营生意挂钩借力? 3月20日,百度全新AI搜索模式“百看计划”在华为鸿蒙系统首发亮相,在用户侧向前迈出一大步。通过深度学习,“百看计划”可以更好地理解用户搜索意图、提供基于用户行为洞察的精准内容,提供了优化用户搜索体验的新思路。 首款搭载harmonyOS 5的手机华为Pura X发布,代表着国产操作系统自主研发能力和国际竞争力的再一次跃升;同一时间在鸿蒙生态首发的百度“百看计划”,则意味着百度、华为双方在AI搜索领域的深度合作共创,将推动AI技术在搜索领域的进一步普及和优化。立足于国际技术竞争的大环境下,这次国产操作系统先驱和AI搜索技术先锋的“强强联手”,无疑将为本土技术创新注入崭新的活力。 而在品牌侧,百度「品牌百看」产品上线。凭借精准化的投放、个性化的内容、以及高转化等优势,「品牌百看」很好地平衡了用户体验和品牌营销的诉求。数据显示,借助「品牌百看」产品,品牌广告互动率提升1.5倍,跳转点击提升12.6%。 这一系列产品、技术变革,也给了我们一个契机,探寻在AI时代做好新搜索的思路和方法。 品牌搜索大趋势: 用户变了,平台也在变 品牌营销永远要跟着用户走,读懂AI时代用户行为的变化,是跟上AI营销潮流的第一步。 总体而言,AI时代的用户搜索行为,呈现明显内容化倾向:搜索方式更加自然和灵活,喜欢和搜索系统“对话”,以自然的语言表达需求,而不是机械式传递搜索指令;不是只想要最后的搜索结果,更想看到思考的过程、发散性的思维和可延展的内容。 百度大数据的报告显示,过去几年“内容需求词”流量暴涨,带动内容化搜索成为搜索营销的一片流量蓝海。比如在日化行业,功能性护肤市场内容需求词搜索流量年均增长25%,汽车领域2025年内容需求词搜索流量也同比增长了22%。如今更多用户喜欢搜索护肤品功效、成份、搭配组合,不同价位有哪些推荐车型、油电混合车型有什么优缺点,从而获取更丰富的内容,而不是直接搜索某款产品。 顺应用户行为的变迁,平台也要做出相应调整——即呈现更全面,更直观,更精准的搜索结果。 更全面是指在充分理解用户意图的前提下,提供一站式、整合式内容,而不是像以往那样需要用户反复输入指令、搜索不同内容。更直观则是指内容前置直接回答,让用户第一时间找到重点。而要做到更精准,则要求系统具备发散性思维和深度理解能力,不只是理解用户输入的指令,还要给出进一步搜索的启发——能洞察用户没说出口的需求,才是真正的智能。 百度「品牌百看」,正是顺应上述变化应运而生的商业产品。我们看到,今年春节期间王老吉和百度「品牌百看」合作,就收获了明显的效果。 在合作中,王老吉联合百度围绕拜年、团聚等场景,通过智能问答、笔记等形式进行全方位曝光。用户在百度搜索“王老吉蛇年长吉”、“怎么定制王老吉姓氏罐”、“王老吉原味凉茶含糖吗”,或者品牌相关的“王老吉荔小吉”、“刺柠吉瓶装”等话题,都可以获得AI助手的智能回答。从这些回答来看,「品牌百看」抓住了用户内容化搜索的全面、直观、精确等核心诉求。 首先是做到了“答即所问”,提供清晰明了的答案,让用户一下子就能找到问题的关键。比如输入“怎么定制王老吉姓氏罐”时,AI会集成整个定制步骤向用户展现,教用户怎么搜索定制入口-输入定制内容-选择字体和预览,还会补充价格、起订规格、起订量等用户关心的信息。 核心信息的高效展示,可以第一时间抓住用户注意力,是解决搜索过程中用户关注点被分散、品牌信息难以准确触达用户等问题的关键。 而在满足用户对搜索信息量密度的要求前提下,AI还懂得如何巧妙融入品牌关联内容。 由于恰逢春节假期,双方合作推出的抽签测新春运势,并根据签文生成年夜饭推荐菜单的活动深受用户欢迎。在该活动中,AI会为用户抽取预测事业运、财运、爱情运等主题的签文,按照抽签结果为用户生成年夜饭菜单的时候,除了列出了一系列充满美好寓意的经典菜式,最后会建议用户来一罐清热解毒的王老吉凉茶,为年夜饭“增添一份健康和吉祥”,既植入了品牌信息,又能和当时的节日氛围、用户提问巧妙融合。 AI加持下,品牌信息得以以更巧妙的形式植入用户的搜索答案中 此外,通过品牌百看构建的新场域,AI还会基于用户提出的问题推测其潜在意图,展示额外的内容,为用户提供更多启发,也给品牌创造继续和用户交流的机会。比如用户搜索“王老吉原味凉茶含糖吗”的时候,AI不仅会解答相应的问题,还会进一步展现王老吉在减糖控糖方面的成果,让用户对王老吉的产品有更深了解,并推荐王老吉旗下其他无糖产品。 最后,借助丰富的转化组件,实现从内容到消费的丝滑连接,打通曝光-交易转化链路。当用户在百度搜索“王老吉荔小吉”、“刺柠吉瓶装”等关键词的时候,智能体都会在展示区前列嵌入王老吉官网和各大电商平台的购买链接,让产生购买意向的用户能第一时间找到购买入口,触发交易。 丰富的转化组件,提高交易几率 见微知著,透过这一实践,我们至少可以看到「品牌百看」在营销深度和广度上的双重价值。 在广度上,通过更多场域的延展,平台不断激发用户的互动热情,从而扩展了品牌呈现的空间。从前的搜索逻辑中,当用户搜索王老吉等品牌的时候,得到的就只有品牌的基本状况、产品等碎片化信息,信息索取缺乏连贯性。而在AI的助力下,用户可以接收到更多延展内容,增加对品牌的了解。 而在深度方面,更具沉浸感的展现模式,尤其是智能体和用户的一对一交流,无疑为品牌创造了一个贴近用户的机会,有助于实现更深度的心智种草。 原生化+互动化+个性化: 让品牌广告更高效 当然,AI带给品牌的绝不只是内容展示上的升级。 「品牌百看」的高效满足区、延展满足区的组件、文本等均由品牌智能体生成,这就意味着一种全新的内容供给和交互模式——千人千面的内容呈现,AI驱动的用户需求与品牌广告的精准匹配,这背后是整个百度AI生态的资源支持,也是让品牌广告更高效的秘诀。 整体而言,「品牌百看」对品牌营销的支持全方位体现在以下四个方面。 一是原生化,平衡“用商”利益,让品牌营销更丝滑融入用户搜索过程中。 品牌营销要做到原生化,最重要的是让用户体验和品牌内容高度贴合,让品牌推广成为用户搜索行为的一部分,而不是单纯的产品推销。而要做到这一点,就需要平台在内容深度和丰富度、展示形式、信息密度等层面做好把控,这当中的门道绝不简单。 百度「品牌百看」和东风本田的合作是一个很好的例子,充分说明了AI技术如何让品牌推广更具原生感。 借助AI语义分析技术,高效满足板块能实时捕捉用户搜索意图,比如搜索“混动技术”、“智能驾驶”的用户,很可能就是对相关产品有潜在需求。在捕捉到这些信息后,平台会精准匹配东风本田官方产品信息,如车型参数、配置、年款等向用户进行展示,满足用户的即时需求。 在此基础上,延展满足板块会根据用户搜索行为推送更多原生内容,为用户提供延伸阅读空间。比如KOL评测、车主真实体验等原生内容,并通过智能体对话引导用户参与互动、了解车型信息、预约试驾。 「品牌百看」能够实现原生感内容展示,离不开百度多年积累的内容生态,只有内容足够丰富、优质,才能做好内容延展,通过内容吸引用户、留住用户最后提高转化。自然融入、视觉一致的呈现形式,也更容易引发用户的情感共鸣,建立用户对品牌的信任感。更重要的是,以原生内容的形式向用户推送品牌信息,在用户体验和品牌推广之间取得了更好的平衡。 整个问答的内容质量和智能体对话的质量是品牌原生化内容的重点,只有先满足用户需求,才能更好地满足商业需求。品牌推广的效果,不应该以牺牲用户利益、强行增加广告加载率来实现,而是应该想办法提供更能凸显品牌优势的高密度信息、优质内容,这也正是AI对行业的深度改造。 关键词搜索能得到更丰富的内容 二是互动化,通过激发用户互动热情、提高互动频率,达到缩短转化链路、增加转化机会的目的。 在「品牌百看」和东风本田的合作案例中,「智能体对话」这一形式就很好地充当了激发互动、拉近用户关系的角色。通过不断引导用户抛出问题、互相交流,东风本田智能体会逐步加深用户对产品的了解,乃至向用户发出试驾邀请,促成最终转化。 在和智能体的对话中,用户只需要向东风本田智能体发送关键词“英仕派”,智能体不仅会回答你这款车型的基本信息、亮点,还会分享相关介绍视频,以及一系列关联话题,如“英仕派内饰/外观图片”、“英仕派价格”等等,让用户循着这个思路继续交流。 对于汽车这种高客单价、长决策周期的“线索型”行业来说,抓住用户注意力是一件很困难的事情。互联网上的信息庞杂且凌乱,很容易分散人的思绪。很多时候,即便用户一开始是带着明确目的搜索相应品牌、车型,也会在不断翻阅各种信息的时候跑偏思路。「智能体对话」则通过连续对话成功缩短转化路径,让品牌和用户之间建立深度交流。 很多人在搜索的时候,想快速得到答案,但还有一部分用户他们一开始并不知道自己需要什么。多轮对话可以给人们提供更多背景信息,他们会更深层次地参与到问题的探讨中来,长期来看这无疑能够促进信息增长,带来更多内容和流量,更多生意的机会。 通过发散思维、关联提问,智能体加强了和用户的互动 第三是个性化,借助“千人千面”的内容呈现,实现更精准的品牌和人群匹配。 在过去,用户更多把搜索引擎当做一个“资料库”,希望从中找到对应的资源、答案。搜索引擎的运行逻辑也是和用户需求对应的,给出的搜索结果都是以关键词进行简单匹配,输入相同问题、指令、关键词的用户,往往也会得到相似的结果。然而现实是,每个用户的诉求、行为习惯是千差万别的,哪怕输入相似的搜索词,他们也很有可能期待得到不同的答案。 AI技术的进步和普及,让千人千面的内容呈现成为可能。同样在东风本田的案例中就能看到,就算都是输入“英仕派”这个关键词,不同的用户会得到迥异的答案——比如一直关注相关内容的资深爱车人士,会得到更多硬核、专业测评;如果是一个平时不怎么关注汽车的“小白”,那么会收到浅显易懂的车型亮点介绍、同级别车型对比信息;如果是近期有大量查阅相关内容的潜在购车用户,则会看到更多价格信息、真实车主点评等相关内容。 千人千面说起来好像轻巧,要真正实现可一点都不简单。这背后,依赖于平台两个层面的能力提升:一方面是对不同用户提问意图的理解能力,即理解“千人”;另一方面则是精确匹配用户意图的内容呈现能力,即呈现“千面”。 百度搜索依托海量用户画像和行为数据,通过AI智能总结、意图解析等技术,实现搜索结果的高度个性化。 不同的用户搜索同样的关键词,能得到侧重点不同的信息 第四,高效率。从原生内容、智能服务再到AI创意和投放,百度形成了一套完整且高效的AI营销链路,让品牌主可以真正做到降本提效。 事实上,「品牌百看」只是百度商业系统「百度伴飞」的一部分,百度伴飞整合了百度在智能体、数字人等多方面的能力,以更加体系化的方式为企业打开更大的商业空间。 百度伴飞和东风本田这一次整体合作,就充分体现了原生内容+智能服务+AI创意和投放这条完整的AI营销链路的价值。高效满足和延展满足两个板块,通过产出优质原生内容,满足用户个性化搜索需求;「智能体对话」承接用户进一步交流的需求,通过深度对话和用户建立联系、培养信任感;再借助投放平台的用户洞察数据、创意平台的内容积累,为品牌和用户建立稳定的供需连接。 AI带来的变革是全方位的,所以「品牌百看」也不是孤立的。放到更大范围来理解,它其实也是百度AI能力和内容生态资源整合的一个交叉点。AI搜索是入口,智能体、数字人做承接,完成整个转化增长。 不可否认,AI正在全方位重塑品牌营销逻辑,用户行为的变迁难以避免。但面对变化,品牌主也不必过于焦虑,因为平台早已做出应对,准备好相关的基础设施。 更何况,无论用户行为、喜好怎么变,营销的核心逻辑从未改变——那就是通过兼顾平衡用商两端的体验,为品牌争取更深、更广的影响力以及更高效的产出与生意增长。
博鳌亚洲论坛2025:vivo执行副总裁胡柏山透露已成立机器人Lab
凤凰网科技讯 3月25日,博鳌亚洲论坛2025年年会在海南博鳌盛大开幕。vivo执行副总裁、首席运营官兼中央研究院院长胡柏山出席年会并发表演讲,透露vivo已正式成立机器人Lab。 vivo执行副总裁、首席运营官胡柏山发表主题演讲 胡柏山称,依托vivo在AI大模型与影像领域的十年积累,以及自研混合现实头显的实时空间计算能力,vivo将专注于研发机器人的“大脑”和“眼睛”,重点面向消费级市场,开发适用于个人和家庭场景的机器人产品。vivo计划通过“渐进突围、沿途下蛋”的方式,让技术走出实验室,应用到用户实际生活中。 他还提到,手机行业过去几十年是新产业的“孵化器”,改变了人们的生产生活方式。当下,AI和机器人分别是数字世界和物理世界的顶尖技术成果,但二者尚未实现完美连接。手机行业拥有庞大消费人群、前沿技术生态和多元应用场景,而机器人将成为连接物理世界和数字世界的桥梁。 此外,vivo在此次年会上还展示了蓝科技矩阵、混合现实头显、6G领域等最新技术成果,在博鳌论坛现场展示的vivo混合现实头显是阶段性成果之一,即将发布的vivo X200 Ultra也集成了vivo在影像领域的最新突破。未来,vivo希望与产业伙伴共同推动机器人走进更多家庭。 vivo混合现实头显 vivo X200 Ultra亮相博鳌论坛 在下个月即将发布的vivo X200 Ultra上,也会集成vivo在影像领域最新的技术突破。 资料显示,vivo是一家以设计驱动产品创新,以智能终端和智慧服务为核心的科技公司,总部位于中国东莞。该公司在多地布局研发网络,涵盖5G通信、人工智能等多个前沿领域,年生产能力近2亿台,销售网络覆盖60多个国家和地区。
李开复:DeepSeek让中美AI差距缩小至只剩三个月
李开复 凤凰网科技讯 北京时间3月25日,据路透社报道,AI大模型公司零一万物CEO李开复表示,中国在某些领域已将其与美国在AI发展方面的差距缩小至只剩三个月,因为DeepSeek等公司已经摸索出如何更有效地利用芯片和应用算法。 他在接受路透社采访时表示,DeepSeek的崛起表明,中国在基础设施软件工程等领域已处于领先地位。 “此前,我认为中国与美国的差距为六到九个月,各方面都落后。而现在,我认为中国在某些核心技术上可能只落后美国三个月,但在某些特定领域实际上已经领先。”李开复称。 李开复认为,美国的半导体制裁是一把“双刃剑”,虽然短期内给中国公司带来了挑战,但也迫使中国企业在受限条件下进行创新,中国企业已经开发出了自己的算法。 “DeepSeek能够通过一种新的强化学习方式理清思维链,这表明他们要么正在赶上美国,学习得很快,要么现在可能更具创新能力。”李开复称。他指的是DeepSeek模型在给出答案之前能够向用户展示其推理过程。这一能力最早由OpenAI开发,但尚未向用户发布。 李开复表示,在当前这个由财力雄厚的科技巨头主导、开源替代方案快速发展的市场环境中,投资专有模型“需要勇气”。 他指出,零一万物将专注于实用型AI应用,即帮助客户更好部署基础模型的软件解决方案。本月初,零一万物推出了一站式AI工作平台万知,这是一款帮助企业部署AI技术的软件平台。李开复称,公司已经开始创收,并预计2025年收入将实现显著增长,达到去年1500万美元的几倍。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
DeepSeek低调宣称小更新,结果用2折价格达到R1水平
昨晚,DeepSeek无预警发布DeepSeek-V3-0324模型,此次更新虽被官方低调地称为“小版本迭代”,但实测表现远超预期。 该模型尤其在代码生成、前端开发等方面显著提升,甚至部分能力比肩Claude 3.7 Sonnet,引发全球AI社区热议。 在大模型竞技场测试KCORES中,DeepSeek-V3-0324代码能力得分328.3分,超越普通版 Claude 3.7 Sonnet( 322.3 分 ),接近Claude 3.7 Sonnet的思维链版本(334.8分 )。 在Aider LLM Leaderboard排行榜中,DeepSeek-V3-0324在多语言基准测试中得分为 55%,比V3有显著提升,比R1略低一些。在非思考/推理模型中,它排名第二,仅次于 Claude Sonnet 3.7 。 测试数据还表明,在表现良好的模型中,DeepSeek-V3-0324花费是最低的,比R1还低很多,只需大约1/5,拥有高到令人发指的性价比。 另外,Claude Sonnet 3.7 Thinking的花费是DeepSeek-V3-0324的33 倍,o1是 DeepSeek-V3-0324的167倍。 目前在DeepSeek官网,只需要关闭“深度思考”选项即可使用新模型。 Hugging Face上也提供了开源下载,下载地址: https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main DeepSeek-V3-0324包含685B参数,较前代V3小幅增加,采用MoE( 专家混合 )架构,激活参数370亿。网友实测DeepSeek-V3-0324支持4-bit量化,可在512GB M3 Ultra Mac上以20+token/s速度运行,磁盘占用仅352GB。 新模型采用与DeepSeek-R1相同的MIT许可,允许自由修改、商用及模型蒸馏,比上一版V3更开放。 从测评结果来看,DeepSeek-V3-0324前端开发表现突出,媲美顶级商业模型。 X博主Deepanshu Sharma仅用简单提示词(“用 HTML/CSS/JS制作现代化登录页面” ),就能让新版V3一键生成800+行代码,且无错误运行,效果媲美Claude 3.7 Sonnet 。 在经典弹跳小球测试中,DeepSeek V3-0324不仅比R1表现更好,博主Deepanshu Sharma还认为它生成了最流畅的动作。 在测试中o3-mini最初表现看起来不错,但并没有正确遵循物理原理,尤其是在视频中间,球对重力没有做出正确的反应。 Deepanshu Sharma评价DeepSeek V3-0324“表现得像唯一排名第一的非推理模型”。 据X网友karminski-牙医介绍,在升级版的20小球物理模拟测试中,DeepSeek V3-0324 相比V3也表现更优。 而新版V3与头部推理模型的比较情况如下: 在火星任务测试中,DeepSeek-V3-0324提升巨大,星球、图例渲染正确,发射和返回的窗口计算也有很大进步。 结合UI设计和物理模拟,X网友Parul Pandey还用DeepSeek-V3-0324生成了一个可交互物理模拟界面,通过AnyChat使用DeepSeek-V3-0324模拟水分子。 实际运行中,可以通过温度滑块提升温度,让分子呈现越来越快的前进和碰撞反弹运动。 提示词:创建一个交互式模拟,显示水分子形成和断裂氢键的过程,同时显示温度滑块。 对于本次升级的技术难度,有Reddit网友pigeon57434给出了比较中立的解读:不用太惊叹本次V3升级的幅度,因为RL ( 强化学习,Reinforcement Learning )潜力极大。以QwQ-32B为例,尽管它实际上小了20倍,但它在某些方面的表现几乎与R1一样好,甚至比R1更好。它能那么强,只是因为扩展推理模型还有很大空间,甚至不需要新的基础模型。我敢打赌,使用更复杂的技术,可以轻松获得基于DeepSeek-V2.5的推理模型来击败R1,更不用说这个新版本的V3了。 总的来说,这样的免费+高性能的组合将对OpenAI、Anthropic等闭源商业模型形成越来越大的压力。 DeepSeek此次更新再次证明开源模型的爆发力,不仅技术指标逼近顶级商业AI,更以低成本、高自由度推动行业变革。 可以合理推测,此次更新有可能是R2的前置版本,类似去年V3( 24.12.16 )→R1 ( 25.01.20 ) 的发布节奏,或许几周内我们可能迎来更强的推理模型R2。 随着R2的临近,全球AI竞争格局或将迎来新一轮洗牌。
AI 按钮占领手机和电脑,体验真的更好了吗?
前段时间上手了全新的三星 Galaxy S25,主编们让我着重体验一下这台手机著名的 AI 功能,于是我把它当作主力机来使用,换掉了手上这台和 AI 毫无关系的 iPhone 15。 先不谈 Galaxy AI 好用与否,在体验的过程中,另一个想法也渐渐在我内心成型:目前用户和手机的交互,似乎还没有一个能很好容纳 AI 的范式。 这也衍生出了一个疑问:有必要为 AI,增加一颗专门的按钮吗? 我想要一颗 AI 按钮 这样的想法,源于我刚刚拿到三星 Galaxy S25 时的体验。 既然要体验「AI」,那 AI 在哪呢?第一反应肯定是直接长按那个曾经被称为「电源键」的长条按钮,果不其然,呼出了三星的 AI 语音助手 Bixby。内置了大模型的 Bixby 体验和大部分国产手机类似,能说会道,还能一句话帮忙发朋友圈。 但当我想使用圈点即搜、AI 识物等多模态功能时,我却有点困惑了,这些功能都藏在哪? 没有教程,没有引导,也就是说,如果是不太了解手机 AI 的小白用户,他们很可能完全不知道自己花大几千买的新手机,还包含了这些发布会上大谈特谈的新功能。 这个现象不只是三星一家,同样非常重视手机 AI 的国产厂商,AI 的正确打开方式,也总是让人摸不着头脑:长按导航条、长按电源键、「AI 岛」……各家还不完全一样,各种 AI 功能被塞在各种各样有点抽象的交互之中。 但 AI 现在已经被提升到一种优先度极高的战略级地位,不管什么设备什么平台都要讲「AI」,什么操作都可以让 AI 赋能。 所以我不由得去思考,如果有一颗交互专门围绕 AI 功能的实体按钮,不管什么场景,只要一按,就能得到 AI 助力。 而且,专门做一颗按钮,也能给消费者和用户一种更深刻的「AI 手机」印象。 AI 按钮这个概念,其实并不算特别新鲜。如果现在入手一台全新的 Windows 笔记本,很大概率会发现,方向键的左边是一个全新的按键。 从去年开始,微软出台一个新规范:所有的 「AI PC」笔记本,出厂都要配备一个「Copilot」按键,将旗下的 AI 功能提升到一个更高的地位。 虽然一年过去,这个 Copilot 按键基本上只能用来呼出 Windows 的 Copilot 聊天机器人网页应用,而如果你在 Copilot 不支持的地区,那它就只是一个普通的搜索键而已。 另一个桌面阵营的「AI 按键」就有用多了。Google 也在去年开始推广 ChromeBook 键盘上的「Quick Insert(快速插入)」按键,按下就能快速访问 ChromeOS 的 AI 生成工具菜单,快速生成需要的文字和图片内容,或者进行搜索。 而苹果这边,iPhone 比 Mac 要抢先迎来「AI 按键」:iPhone 16 上的全新「拍照按钮」不仅能用来抓拍,还能用来启动「视觉智能」功能;没有拍照按钮的 iPhone 15 Pro 和 iPhone 16e 系列,则把这个交互放在了操作按钮上,方便用户抬手就能用 Apple 智能看世界。 现在的 AI 形态,已经不满足于一问一答的聊天机器人,各种多模态和智能体,已经深入我们的工作流和设备当中,这也是现在厂商们提倡的「系统级 AI」。 未来设备上的 AI 功能,一定会比现在花样更多,这时候就需要一颗专门用来承载这些功能的 AI 按钮了。 ▲ 现在侧边按钮都能呼出语音助手,但或许还不够 比如,当用户在小红书刷到一家餐厅的种草帖,按下 AI 按键就能自动提取出相关的地址信息,推送大众点评的详细评价,还能自动安排合适的日程。 没想到,一些不同的「AI」按键的设备,真的出现在我的面前。 不同的 AI 按键,体验如何? 作为一家新品牌,Nothing 没有太多的技术积累,很难像其他大牌一样拿出「系统级 AI」的解决方案,因此语音助手的集成上只能依靠 Google Gemini 和 ChatGPT。 不过,全新的 Nothing Phone 3a 上面的 AI 功能要更别出心裁:名为「Essential Space」,有点类似老罗的「闪念胶囊」。 用户可以随时按下锁屏按键下方的 Essential Key 截取一张屏幕截图,并可以加入一点文字描述,或者长按录音转文字 AI 也会在后台识别截图和录音的内容,生成一个摘要。 ▲ 电源键下方就是 AI 键,图源:The Wired 理念很美好,但用起来却有点在我的预期之下,一个问题是,很多时候我几乎想不起来有这么一个功能,误触的次数比主动唤醒要多得多。 毕竟,要让用户形成全新的使用习惯并不容易,除非是一个让用户一碰就回不去的顶级功能。而这个简陋并且不太靠谱的 Essential Key,有用但不算特别好用,归纳总结和语音识别都不算特别准确,更多只是一个将重要信息保存在另一个地方的截图键和录音键而已。 但与此同时,另一种「AI 按键」,却赢得了编辑部不少小伙伴的好评。 这个乍一看非常雷人的「AI 键盘」,其实就是一个做工 50 元的普通键盘,加上了一大堆能一键直达相应 AI 功能的按键:文稿校对、阅读理解、AI 问答、AI 写作…… 集成的是 DeepSeek R1 模型,然后售价高达 399 元。 一开始,这个键盘以一种「智商税」的形象出现在我们的讨论之中,但一上手,我就被这种简单粗暴的交互方式折服,逢人便说好。 原因很简单,这些一键直达的 AI 功能,很多都是我需要先点开浏览器页面,再点击 DeepSeek 的书签,还要往里面输入合适的 prompt,最后才能真正用上这些功能。 所以,即使知道 DeepSeek 和 ChatGPT 的翻译、校对能力都要更胜一筹,很多时候我还是因为懒得打开相关页面和输入 promt,选择使用更古早的工具。 而这一切都被这个方便的 AI 键盘颠覆,真正让 AI 直接渗透了了我的工作流。 ▲键盘联动的 AI 软件真的啥都有 AI 交互的答案 要不要增加 AI 按键,说到底还是一个「入口」的问题。想要一个 AI 按键,其实就是渴望一个统一的 AI 入口,让 AI 为所有操作和交互赋能。 AI 键盘就是直接用一种简单粗暴的方式,将各种各样的 AI 功能入口,直接推到我的手下,功能的实现路径被缩到最短。 当然,这也因为,AI 键盘的功能都是强生产力相关的,能完美融入我用电脑的工作流之中,极大增加工作效率。 手机和电脑,不管是交互还是场景都有着不小差异。电脑上我们可以让 DeepSeek 生成十篇不同的文稿择优录取;手机上,我们希望 AI 能一声令下完成任务,但现在的技术水平还达不到百分百的可靠,难以说服用户积极使用。 为 AI 单独设立一个按键,不管从智能设备的演变,还是 AI 发展的路径来看,或许都不算最终答案,最多只是一种过渡。 不仅智能手机本身就在「去按键化」的道路上一往无前,如果过度依赖一个物理的入口,也会固化「AI = 独立工具」这样的认知,而目前公认的 AI 方案,其实都是让 AI 深入系统底层,实现「真智能」。 毕竟,AI 不是目的,而应该是更好用户体验的手段。 就像是 Nothing 的 Essential Space,如果能够实现全自动化,在我需要的时候,就能搜索快速检索出之前我看过的信息,比如淹没在海量聊天记录中的一家餐厅,或是飞机信息,那就是更加高级的智能。 ▲ 苹果画饼的「AI Siri」其实就是想实现这种愿景 vivo 的「原子岛」也很有这种感觉:复制一个地址信息,原子岛就会建议地图导航;复制一个淘口令,原子岛里淘宝已经等着你去打开。 真正高明、简约的交互,不应该需要用户频频转移注意力去完成,而是当用户需要的时候,就能用最简单的方式获得需要的帮助,更多时候甚至是主动提供帮助。 我相信,未来这几年内,会有更多设备做出 AI 按键的尝试,但最终又都会消失,甚至更多其他现存的交互也会不复存在,因为 AI 已经将一切完成了。
高规格盛会解码AI产业拼图:“顶流”齐聚、多元成果发布,3月27日开启
作者 | 智东西编辑部 倒计时两天!AI产业顶级盛会即将启幕。 3月27日-31日,以“新质生产力与全球科技合作”为主题的2025中关村论坛年会将在北京举办,期间,论坛年会的人工智能主题日——将于3月27日正式开启。 紧跟AI产业爆发的时代浪潮,由北京市科学技术委员会、中关村科技园区管理委员会与北京市海淀区人民政府举办的人工智能主题日,集嘉宾规格之高、议程设置之前沿、发布成果之重磅、嘉宾范围之广为一体,成为全球AI产业交流探讨高地。 人工智能主题日上,将有20+中外院士、国内顶级人工智能研究院负责人等,以及百度、阿里云、蚂蚁集团等AI大厂、大模型独角兽核心人物,具身智能创业代表,顶尖投资人同台,以及涵盖投资支持、技术研发、人才培养等与AI产业紧密相关的数十项核心成果发布。 中关村论坛是面向全球科技创新交流合作的国家级平台,其中的人工智能主题日已经成为聚焦全球AI产业发展的关键窗口,全方位展示全球AI领域前沿技术突破、创新应用实践,并吸引全球目光,促进产业资源高效对接与深度合作。 目前,AI领域海淀区已形成全栈产业链布局,备案大模型76款、占全市七成,正在建设具有全球影响力的人工智能产业高地;在具身智能领域集聚企业数量占全市40%……如今,以人工智能主题日作为关键核心节点,海淀区正依托其得天独厚的资源优势,全方位发力,向全球范围强势辐射影响力。 这场广纳全球学界、产业界、投资界诸多大咖的盛会充满看点: 一、前沿AI学术成果:图灵奖得主、中外院士,顶尖研究院、高校领衔 多位中外院士、图灵奖得主、顶级人工智能研究院负责人、顶尖高校教授等学界大牛将在人工智能主题日同台,以大模型为圆心,深度剖析其创新应用、发展挑战与未来趋势。 1、中外院士 鄂维南 中国科学院院士,美国数学会会士、美国工业与应用数学学会会士,英国物理学会会士,北京大学讲席教授、大数据分析与应用技术国家工程实验室主任,北京大学国际机器学习研究中心主任,北京科学智能研究院院长,北京大数据研究院院长,主要从事计算数学、应用数学及其在力学、物理、化学和工程等领域中的应用等方面的研究。 戴琼海 中国工程院院士,清华大学信息学院院长,北京信息科学与技术国家研究中心主任,中国人工智能学会理事长,主要学术方向为人工智能(立体视觉)和计算摄像学,长期致力于该研究领域的理论和关键技术创新。中国人工智能学会成立于1981年,是我国在人工智能领域具有重要影响力的全国性学术组织。 郑志明 中国科学院院士,北京航空航天大学数学与系统科学学院教授、博士生导师,数学与信息科学交叉领域专家,长期从事空天信息安全与复杂信息系统等数学与信息交叉领域的研究。 王耀南 中国工程院院士,机器人技术与智能控制专家,湖南大学教授,机器人视觉感知与控制技术国家工程研究中心主任。主要从事智能机器人感知与控制技术及工程应用研究。 郭雷 中国科学院院士,中科院国家数学与交叉科学中心主任,北京航空航天大学自动化科学与电气工程学院教授,IEEE、IET Fellow,中国自动化学会、中国发明协会会士,中国自动化学会导航制导与控制专业委员会主任,长期从事抗干扰控制理论与应用领域的研究。 约瑟夫·斯发基斯 图灵奖得主,中国科学院外籍院士,美国人文与科学院外籍院士,美国国家工程院外籍院士,美国国家科学院外籍院士,法国科学院院士,法国Verimag实验室荣誉科研主任。研究方向为模型检测及嵌入式系统设计与验证等领域。 孙富春 清华大学计算机系教授,智能技术与系统国家重点实验室副主任;IEEE高级会员;中国人工智能学会理事;中国人工智能学会智能控制与智能管理专业委员会副主任兼秘书长;IEEE控制系统协会智能控制技术委员会委员。研究领域为智能控制、机器人与飞行器的导航与控制、网络控制系统、人工认知系统的信息感知和处理。 斯图尔特·罗素 英国计算机科学家、加州大学伯克利分校计算机科学专业教授、加州大学伯克利分校人类兼容人工智能中心(Center for Human-Compatible AI)创始人。 此外还有俄罗斯自然科学院院士、澳大利亚科学院院士等国内外院士…… 2、顶尖人工智能研究院负责人 黄铁军 北京智源人工智能研究院理事长,北京大学人工智能研究院副院长,北京大学计算机学院教授,北京人形机器人创新中心专家委员会副主任,全程参与我国新一代人工智能发展规划建议、起草和实施,“科技创新2030”新一代人工智能重大科技项目专家组副组长,国家人工智能标准化总体组副组长,新一代人工智能产业技术创新战略联盟秘书长。 王仲远 智源研究院院长,长期从事人工智能前沿技术研究与实践。 周伯文 上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授、清华大学电子工程系长聘教授、清华大学电子系协同交互智能研究中心主任、衔远科技创始人,IEEE/CAAI Fellow。 朱松纯 北京通用人工智能研究院院长,北京大学智能学院院长、人工智能研究院院长,北京人形机器人创新中心专家委员会副主任,主要研究包括通用人工智能基础、计算机视觉、统计建模与计算、认知科学、机器学习、自主机器人等。 可以看出,这些学界大牛具备全球化特征,来自世界各地不同学术背景与文化环境,为学术交流与合作注入了多元活力 。从技术角度来看,这些学界大咖过往成果影响力极为深远,人才培养成果丰硕,且研究与行业实践紧密相连,研究方向呈现出丰富多元的态势,广泛覆盖多个学科与应用场景。 二、前沿AI实践:科技大厂、大模型独角兽分享最新AI成果 DeepSeek爆火正撬动全球AI产业剧变,催化国内大模型产业突围。今年开年国内大模型产业研发进展、研究成果连番炸场。 不仅有月之暗面Kimi被曝最新模型k1.6编程能力超GPT o3-min、豆包大模型1.5多模态能力霸榜多个基准,还有“清华系”AI初创公司面壁智能凭借全球首个端侧全模态模型MiniCPM-O 2.6,仅用8B参数便在OpenCompass榜单中以70.2的平均分超越GPT-4o和Gemini 1.5 Pro,成为开源社区最强语音通用模型…… 在人工智能主题日上,这些搅动全球大模型产业风云的大厂、大模型独角兽、大模型六小虎将同台热议。 李开复 零一万物创始人、CEO,创新工场董事长,微软前全球副总裁 零一万物是国内最早探索MoE等轻量化模型架构的大模型企业之一, 在打造Yi系列顶尖基座模型的过程中已经积累了从模型训练到模型微调,再到应用实践的大模型端到端(end-to-end)四大管线技术栈。 王海峰 百度首席技术官 百度是国内为数不多进行芯片层、框架层、模型层以及应用层全栈布局的人工智能公司,自2023年发布知识增强大语言模型文心一言以来,到2024年,文心大模型的日均调用量达到16.5亿,同比增长33倍。其最新发布的自研原生多模态基础大模型文心大模型4.5,在多个测试集上的测评表现已经超过GPT-4o。 杨植麟 月之暗面创始人、清华大学助理教授 2023年10月,月之暗面发布首款对话类产品Kimi Chat,宣布支持约200万字超长对话上下文使得用户量激增,使得这家成立不到一年迅速跃升独角兽,红杉中国、小红书、美团、阿里、腾讯等明星玩家均在其投资方之列。 李大海 面壁智能联合创始人兼CEO 作为清华系AI创企,面壁智能首批实现千亿多模态模型的落地,其核心科研成员来自清华大学NLP实验室,是国内最早一批做预训练大模型的团队之一,至今已经推出多款人工智能大模型产品。 在商业化领域,这些企业正以磅礴之势搅动全球风云,从基座模型的底层搭建,到多模态技术的融合创新,再到深度推理模型的突破,不断拓展大模型的边界。以生数科技为例,去年其推出的AI视频生成工具Vidu,全方位对标Sora,在行业内引发广泛关注。照此发展态势,今年极有可能再度诞生类似的炸场产品,为大模型产业带来新一轮的变革与惊喜 。 三、前沿AI方向:热议具身智能,四位核心玩家创始人同台 2025年《政府工作报告》首次将“具身智能”纳入未来产业培育范畴。具身智能赛道迎来新的产业发展高潮,近年来,国内相关研发与创业浪潮涌起,诸多量产落地、研发进展公布。 人工智能主题日上,4位国内具身智能核心创企的创始人将同台探讨这一产业的产业机遇与挑战。 王鹤 银河通用机器人创始人、智源具身智能研究中心负责人。银河通用机器人成立于2023年,研发了全球迄今为止最大规模的灵巧手抓取数据集,并首次公开十亿级数据规模下的灵巧抓取“Scaling Law”。 卢策吾 上海交通大学教授、穹彻智能创始人。穹彻智能成立于2023年11月,致力于研发具身智能系统及其相关工具与平台,已发布其自主研发的穹彻具身大脑Noematrix Brain。 冷晓琨 乐聚机器人创始人。乐聚机器人成立于2016年,专注于人工智能领域高端智能人形机器人核心技术研究产品开发和生产,是全球公布交付数量最多、场景最多的人形机器人企业。 陈建宇 星动纪元创始人兼CEO。星动纪元成立于2023年,专注于通用人形机器人研发。去年世界机器人大会上,该公司发布了第六代人形机器人STAR 1和灵巧手XHAND 1,并于去年10月完成3亿元Pre-A融资。 从这些核心玩家的动向来看,在全球具身智能蓬勃发展的大背景下,国内企业已经展现出强劲的发展势头,在产业落地与进厂实践方面成果显著,部分企业研发的机器人已成功进入工厂等实际场景开展作业,为具身智能的商业化应用开拓了广阔前景。 四、AI产业投资:共探AI产业资金密码与发展脉络 AI产业的研发和发展需要大量的资金投入,投资人在整个AI产业中扮演着至关重要的角色。 因此,人工智能主题日的核心论坛之一,将目光瞄准了投资界大佬,他们将从投资视角洞察整个AI产业的发展脉络与产业发展机遇。 邝子平 启明创投创始主管合伙人。截至2024年7月,启明创投在AI领域投资超过50个项目,其中近20个已经上市或成长为独角兽企业,其中有10家中国大语言模型、多模态模型或具身智能模型研发领域的领军企业,数量居全国之首。 朱啸虎 金沙江创投、主管合伙人。朱啸虎曾投资孵化出滴滴、饿了么、小红书等知名企业,去年在AI领域,金沙江创投出手4笔投资,分别是Gyges Labs、Aha Lab、筷子科技、星海图。 张晓燕 清华大学五道口金融学院副院长、鑫苑金融学讲席教授,兼任清华大学金融科技研究院副院长及财富管理研究中心主任。 从全球产业投资视角审视,人工智能领域存在着在硬件设施搭建、专业人才储备以及能源消耗等多方面的高昂开发成本。 尽管如此,中国在人工智能领域的融资数量一马当先。这一现象充分体现出投资者普遍看好人工智能的发展前景,愿意积极投入资金助力国内AI产业发展 。 五、前沿AI成果:政策、平台、研究院、人才,开启大模型产业布局征程 AI正以其强大的变革能力和广泛的应用场景,引领着全球经济与社会的发展,因此推动其加速发展的举措也将是全方位的。围绕着空间生态、算力平台、核心技术、垂直方向、投资支持、人才培养等成果将在人工智能主题日上集中发布。 空间生态:人工智能创新街区发布; 大模型技术发展:北京人工智能公共算力调度平台发布、北京唯实具身智能研究院揭牌、法信法律基座大模型合作发布; 投资支持:中关村科学城科技成长基金合作子基金签约、“投中榜2024年度中国最具创投价值城区榜单”发布、中国银行北京市分行支持人工智能产业实施方案 人才培养:北京市少年人工智能学院揭牌,北京市科委、中关村管委会发布“智星青年人才计划”、AI100青年先锋、吴文俊人工智能科学技术奖颁发 可以看出,北京市正全方位、成体系地为大模型产业发展布局。 六、人工智能主题日完整议程 人工智能主题日设置“2+5+N”架构,将围绕前沿技术与投资、人才发展、数据赋能、行业应用四大主题,涵盖大模型、AGI、AI for Science、具身智能、人才培养、数据要素以及AI安全等人工智能全要素、全领域各类主题论坛活动。 两场核心论坛为“2025未来人工智能先锋论坛”、“AI未来论坛:创新·投资·全球化”。 未来人工智能先锋论坛将于3月29日下午举行,以“积淀·涌现”为主题,汇聚国内外学术与产业界领袖,共同描绘人工智能发展蓝图。 AI未来论坛:创新·投资·全球化将于3月31日下午举行,以“AI引领产业投资新风向”为主题,围绕人工智能的技术创新、商业化路径、创业投资、伦理治理、安全与可持续发展、全球化战略等话题展开讨论,以行业声量探索人工智能的技术前沿,前瞻未来投资趋势。 五场专场论坛为中国具身智能大会、AI for Science青年论坛、通用人工智能论坛、人工智能领军人才发展论坛、区块链与隐私计算论坛。 中国具身智能大会以“具身前沿,智领未来”为主题,推动模型与机器人技术融合发展,拟发布具身智能十大重点研究方向、具身智能标准化白皮书。 AI for Science青年论坛聚焦前沿技术与青年人才,国内外资深科研人员以及技术专家、企业家和青年学者共同探讨AI for Science以及开源理念的融合与创新。 通用人工智能论坛锚定AGI行业生态,内外顶尖专家学者共同分享最新技术趋势、展示前沿科技成果。 人工智能领军人才发展论坛探索人才贯通培养,论坛深度聚焦人工智能领域的人才创新培养模式,围绕建设“产学研创投”一体的创新生态体系进行讨论。 区块链与隐私计算论坛汇聚数据要素,围绕释放数据要素价值,深入探讨如何将区块链与隐私计算技术深度融合。
迎头挑战还是换赛道?英媒:DeepSeek让所有同行陷入抉择
DeepSeek与同行 凤凰网科技讯 3月25日,金融时报发文,随着竞争对手DeepSeek的技术在国内广泛应用,中国的AI初创企业正在全面调整其商业模式,以保持竞争力。 据两位知情人士透露,曾被视为中国最杰出的大语言模型初创企业智谱,在专注于拓展企业销售业务的同时,将希望寄托于首次公开募股(IPO),以维持其高资金投入的增长模式。 在中国其他领先的生成式人工智能初创企业中,由李开复创办的零一万物已停止大语言模型的“预训练”,转而专注于利用DeepSeek的模型销售定制化人工智能商业解决方案;百川智能选择专注于医疗保健市场;月之暗面则大幅削减其Kimi聊天机器人的营销预算,将重点放在模型训练上。 接近这些公司的人士表示,这些转变显示出DeepSeek是如何极大地改变了中国新兴人工智能产业的格局。这些公司均拒绝置评或未回应置评请求。 自1月底推出具有突破性的R1模型以来,这家总部位于杭州的初创企业迅速被视为中国的人工智能领军者,其技术从医院到地方政府迅速得到广泛应用。 这使得中国一些顶尖的人工智能初创企业不得不重新评估其现有战略,试图复制DeepSeek的成功。在过去两年的人工智能热潮中,这些初创企业曾获得国内投资者的大力支持。 人工智能研究中心Hugging Face的工程师王铁震表示:“中国的大语言模型市场正在迅速向少数几家领先企业集中。DeepSeek促使许多公司将资源重新导向应用领域,而非基础模型开发。” 总部位于北京的零一万物已在李开复所称的“DeepSeek 时代”调整了业务方向。该公司曾推出了一系列名为“Yi”的开源模型,由于竞争对手训练的模型越来越大、功能越来越强,成本不断上升,零一万物在2024年底停止了预训练。据知情人士透露,在与阿里巴巴达成的一项交易中,其基础模型团队被转移至这家互联网巨头。 上周,零一万物宣布将向希望部署DeepSeek模型的企业销售定制化人工智能解决方案。零一万物将其在所谓“混合专家模型”方面的专业知识作为竞争优势进行推广,DeepSeek也采用了这种方法来训练模型。 DeepSeek决定专注于研究,而不是通过向企业销售应用程序来实现收入最大化,这为零一万物这样的中介机构留下了市场空间。互联网巨头百度最近几周也转向提供同样的服务。 月之暗面去年因其广受欢迎的人工智能聊天机器人Kimi而备受关注,但随着频繁的服务中断以及竞争对手推出有竞争力的产品,Kimi的人气受到了影响。 据两位知情人士透露,最近几周,这家初创企业削减了Kimi的营销支出,转而更加专注于模型训练,以复制DeepSeek的突破性成功并提升聊天机器人的性能。 但随着Kimi被其他应用超越,月之暗面在没有稳定收入的情况下投入资金进行模型训练,前景充满不确定性。该初创企业试图通过邀请用户向聊天机器人背后的人工智能角色“Kimi”赠送虚拟礼物来盈利。 据知情人士透露,去年,月之暗面通过两轮融资筹集了超过13亿美元,其中包括来自中国科技巨头阿里巴巴的计算资源以及风险投资公司的现金。 这些人士称,2024年初,阿里巴巴曾将月之暗面视为潜在的收购目标,并在8亿美元的投资中获得了未来任何出售时的优先购买权。近几个月来,在创始人马云指示首席执行官吴泳铭专注于内部人工智能业务后,阿里巴巴收紧了对初创企业的投资。这些人士补充称,这一转变使得阿里巴巴未来收购Kimi的可能性降低。 总部位于北京的初创企业百川智能此前曾致力于面向消费者的人工智能聊天机器人,并向教育、金融和医疗保健企业推销企业业务,如今已将医疗保健业务作为重点。 据两位知情人士透露,今年2月,百川智能解散了专注于向银行和投资基金销售定制化金融人工智能应用的销售团队,并终止了该业务线。 当时,公司管理层向员工宣布,将专注于为医院开发技术,包括协助诊断的人工智能医生。 相比之下,由清华大学知名计算机科学家唐杰创办的智谱仍在推进多条业务线。它推出了几款面向消费者的应用程序,以及一项向地方政府和企业销售个性化人工智能应用的企业业务。 随着企业销售业务的拓展,这家初创企业一直在大量消耗资金。据三位了解相关数据的投资者透露,2024年,智谱实现销售额3亿元人民币,亏损20亿元人民币。 在DeepSeek展示了以较低预算打造尖端模型的途径后,不断膨胀的成本引发了一些投资者的担忧。与DeepSeek约160人的小团队相比,智谱雇佣了约800人,按员工数量计算是最大的大语言模型初创企业。 据两位了解情况的人士称,智谱此前曾告诉投资者,目标是在今年年底前上市。但他们补充称,如果推进IPO,DeepSeek的发展可能会对其产生影响。 金融时报表示,DeepSeek已然撼动了中国的人工智能竞争格局,导致一些竞争对手不得不决定是直接挑战该公司,还是采用其开源模型,专注于较小的潜在市场。(作者/陈俊熹) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
体验完手机上的AI 按钮,我感觉以后它们都会消失
AI 也想 有个家 前段时间上手了全新的三星 Galaxy S25,主编们让我着重体验一下这台手机著名的 AI 功能,于是我把它当作主力机来使用,换掉了手上这台和 AI 毫无关系的 iPhone 15。 先不谈 Galaxy AI 好用与否,在体验的过程中,另一个想法也渐渐在我内心成型:目前用户和手机的交互,似乎还没有一个能很好容纳 AI 的范式。 这也衍生出了一个疑问:有必要为 AI,增加一颗专门的按钮吗? 我想要一颗 AI 按钮 这样的想法,源于我刚刚拿到三星 Galaxy S25 时的体验。 既然要体验「AI」,那 AI 在哪呢?第一反应肯定是直接长按那个曾经被称为「电源键」的长条按钮,果不其然,呼出了三星的 AI 语音助手 Bixby。内置了大模型的 Bixby 体验和大部分国产手机类似,能说会道,还能一句话帮忙发朋友圈。 但当我想使用圈点即搜、AI 识物等多模态功能时,我却有点困惑了,这些功能都藏在哪? 没有教程,没有引导,也就是说,如果是不太了解手机 AI 的小白用户,他们很可能完全不知道自己花大几千买的新手机,还包含了这些发布会上大谈特谈的新功能。 这个现象不只是三星一家,同样非常重视手机 AI 的国产厂商,AI 的正确打开方式,也总是让人摸不着头脑:长按导航条、长按电源键、「AI 岛」......各家还不完全一样,各种 AI 功能被塞在各种各样有点抽象的交互之中。 但 AI 现在已经被提升到一种优先度极高的战略级地位,不管什么设备什么平台都要讲「AI」,什么操作都可以让 AI 赋能。 所以我不由得去思考,如果有一颗交互专门围绕 AI 功能的实体按钮,不管什么场景,只要一按就能得到 AI 助力。 而且,专门做一颗按钮,也能给消费者和用户一种更深刻的「AI 手机」印象。 AI 按钮这个概念,其实并不算特别新鲜。如果现在入手一台全新的 Windows 笔记本,很大概率会发现,方向键的左边是一个全新的按键。 从去年开始,微软出台一个新规范:所有的 「AI PC」笔记本,出厂都要配备一个「Copilot」按键,将旗下的 AI 功能提升到一个更高的地位。 虽然一年过去,这个 Copilot 按键基本上只能用来呼出 Windows 的 Copilot 聊天机器人网页应用,而如果你在 Copilot 不支持的地区,那它就只是一个普通的搜索键而已。 另一个桌面阵营的「AI 按键」就有用多了。Google 也在去年开始推广 ChromeBook 键盘上的「Quick Insert(快速插入)」按键,按下就能快速访问 ChromeOS 的 AI 生成工具菜单,快速生成需要的文字和图片内容,或者进行搜索。 而苹果这边,iPhone 比 Mac 要抢先迎来「AI 按键」:iPhone 16 上的全新「拍照按钮」不仅能用来抓拍,还能用来启动「视觉智能」功能;没有拍照按钮的 iPhone 15 Pro 和 iPhone 16e 系列,则把这个交互放在了操作按钮上,方便用户抬手就能用 Apple 智能看世界。 现在的 AI 形态,已经不满足于一问一答的聊天机器人,各种多模态和智能体,已经深入我们的工作流和设备当中,这也是现在厂商们提倡的「系统级 AI」。 未来设备上的 AI 功能,一定会比现在花样更多,这时候就需要一颗专门用来承载这些功能的 AI 按钮了。 现在侧边按钮都能呼出语音助手,但或许还不够 比如,当用户在小红书刷到一家餐厅的种草帖,按下 AI 按键就能自动提取出相关的地址信息,推送大众点评的详细评价,还能自动安排合适的日程。 没想到,一些不同的「AI」按键的设备,真的出现在我的面前。 不同的 AI 按键,体验如何? 作为一家新品牌,Nothing 没有太多的技术积累,很难像其他大牌一样拿出「系统级 AI」的解决方案,因此语音助手的集成上只能依靠 Google Gemini 和 ChatGPT。 不过,全新的 Nothing Phone 3a 上面的 AI 功能要更别出心裁:名为「Essential Space」,有点类似老罗的「闪念胶囊」。 用户可以随时按下锁屏按键下方的 Essential Key 截取一张屏幕截图,并可以加入一点文字描述,或者长按录音转文字 AI 也会在后台识别截图和录音的内容,生成一个摘要。 电源键下方就是 AI 键,图源:The Wired 理念很美好,但用起来却有点在我的预期之下,一个问题是,很多时候我几乎想不起来有这么一个功能,误触的次数比主动唤醒要多得多。 毕竟,要让用户形成全新的使用习惯并不容易,除非是一个让用户一碰就回不去的顶级功能。而这个简陋并且不太靠谱的 Essential Key,有用但不算特别好用,归纳总结和语音识别都不算特别准确,更多只是一个将重要信息保存在另一个地方的截图键和录音键而已。 但与此同时,另一种「AI 按键」,却赢得了编辑部不少小伙伴的好评。 这个乍一看非常雷人的「AI 键盘」,其实就是一个做工 50 元的普通键盘,加上了一大堆能一键直达相应 AI 功能的按键:文稿校对、阅读理解、AI 问答、AI 写作...... 集成的是 DeepSeek R1 模型,然后售价高达 399 元。 一开始,这个键盘以一种「智商税」的形象出现在我们的讨论之中,但一上手,我就被这种简单粗暴的交互方式折服,逢人便说好。 原因很简单,这些一键直达的 AI 功能,很多都是我需要先点开浏览器页面,再点击 DeepSeek 的书签,还要往里面输入合适的 prompt,最后才能真正用上这些功能。 所以,即使知道 DeepSeek 和 ChatGPT 的翻译、校对能力都要更胜一筹,很多时候我还是因为懒得打开相关页面和输入 promt,选择使用更古早的工具。 而这一切都被这个方便的 AI 键盘颠覆,真正让 AI 直接渗透了了我的工作流。 键盘联动的 AI 软件真的啥都有 AI 交互的答案 要不要增加 AI 按键,说到底还是一个「入口」的问题。想要一个 AI 按键,其实就是渴望一个统一的 AI 入口,让 AI 为所有操作和交互赋能。 AI 键盘就是直接用一种简单粗暴的方式,将各种各样的 AI 功能入口,直接推到我的手下,功能的实现路径被缩到最短。 当然,这也因为,AI 键盘的功能都是强生产力相关的,能完美融入我用电脑的工作流之中,极大增加工作效率。 手机和电脑,不管是交互还是场景都有着不小差异。电脑上我们可以让 DeepSeek 生成十篇不同的文稿择优录取;手机上,我们希望 AI 能一声令下完成任务,但现在的技术水平还达不到百分百的可靠,难以说服用户积极使用。 为 AI 单独设立一个按键,不管从智能设备的演变,还是 AI 发展的路径来看,或许都不算最终答案,最多只是一种过渡。 不仅智能手机本身就在「去按键化」的道路上一往无前,如果过度依赖一个物理的入口,也会固化「AI = 独立工具」这样的认知,而目前公认的 AI 方案,其实都是让 AI 深入系统底层,实现「真智能」。 毕竟,AI 不是目的,而应该是更好用户体验的手段。 就像是 Nothing 的 Essential Space,如果能够实现全自动化,在我需要的时候,就能搜索快速检索出之前我看过的信息,比如淹没在海量聊天记录中的一家餐厅,或是飞机信息,那就是更加高级的智能。 苹果画饼的「AI Siri」其实就是想实现这种愿景 vivo 的「原子岛」也很有这种感觉:复制一个地址信息,原子岛就会建议地图导航;复制一个淘口令,原子岛里淘宝已经等着你去打开。 真正高明、简约的交互,不应该需要用户频频转移注意力去完成,而是当用户需要的时候,就能用最简单的方式获得需要的帮助,更多时候甚至是主动提供帮助。 我相信,未来这几年内,会有更多设备做出 AI 按键的尝试,但最终又都会消失,甚至更多其他现存的交互也会不复存在,因为 AI 已经将一切完成了。
通义开源32B视觉模型,阿里与DeepSeek前后脚上新!能看图说话
作者 | 程茜 编辑 | 心缘 智东西3月25日报道,昨天,阿里云通义千问开源更小尺寸的视觉理解模型Qwen2.5-VL-32B-Instruct。与昨夜DeepSeek V3新版本DeepSeek-V3-0324的发布时间几乎前后脚。 Qwen2.5-VL-32B-Instruct的优势主要集中于三个方面:研究人员调整了输出风格,使其回答详细、格式规范且更符合人类偏好;在数学推理能力方面,可应对复杂数学问题;在图像解析、内容识别、视觉逻辑推导等任务中更准确并具备细粒度分析能力。 该模型是在1月底开源的视觉模型Qwen2.5-VL系列的基础上,研究人员基于强化学习持续优化的模型,新模型使用Apache 2.0协议开源。 科技博主Simon Willison在博客中提到,32B参数正迅速成为其最喜欢的模型大小,既能达到可媲美GPT-4级别的能力,又小到可以在其64GB内存的Mac上使用,并且仍有足够的RAM来运行其他如火狐浏览器(Firefox)和软件开发工具Visual Studio Code等内存占用较大的应用程序。 一、一张图就能输出地理特征、地形地貌,几何难题也能胜任 Simon Willison尝试了Qwen2.5-VL-32B-Instruct的图片理解能力,他上传了一张图片让模型识别。Qwen2.5-VL-32B-Instruct给出了图片中包含的地理特征、分颜色区域、深度等值线、保护区等诸多要素。 官方博客中展示了Qwen2.5-VL-32B-Instruct在细粒度图像理解和数学推理方面的实际表现。 第一个提示词是:“我开着大货车在这条路上行驶,现在已经12点了,我能在13点之前到达110公里以外的地方吗?”模型需要在理解用户需求的基础上,补充图片上对车辆限速的背景信息再得出结论。 可以看到,Qwen2.5-VL-32B-Instruct先将题目和图片中的信息进行了汇总,然后进行逐步分析解答。 第二个问题是数学推理,提示词为:“如图所示,直线AB和CD在O点相交,OD平分∠AOE,∠BOC=50.0,然后∠EOB=()”这道题重点考察的是模型够准确理解几何图形的基本概念,以及相关角之间的位置关系,如对顶角、角平分线等概念在图形中的体现。 第三个提示词是:“侏罗纪蜘蛛网是一种非常有规律的蜘蛛网,如图,它是由无数个正方形环绕而成的,且最外边第一个正方形A_{1}B_{1}C_{1}D_{1}的面积为a_{1}=1,分别取正方形A_{1}B_{1}C_{1}D_{1}各边的三等分点A_{2},B_{2},C_{2},D_{2},作第二个正方形A_{2}B_{2}C_{2}D_{2},且正方形A_{2}B_{2}C_{2}D_{2}的面积为a_{2},\ldots \ldots ,依次类推,第n个正方形A_{n}B_{n}C_{n}D_{n}的面积为a_{n}. $求{a_{n}}的通项公式”。 这道题综合考查了几何图形分析、归纳推理、数学运算以及数列知识运用等多方面的能力。在Qwen2.5-VL-32B-Instruct的解题过程中,其首先罗列了解题文章的基本思路,然后进行分步骤解答。 最后一个是对精细图片的理解,Qwen2.5-VL-32B-Instruct通过图片中的锅底、分格设计、配菜、氛围等识别出这是四川麻辣火锅,并附上了简介。在用户询问这为什么是四川火锅时,其对上述关键要素进行了详细引用给出答案。 二、多项测试超过72B前代模型,纯文本能力整体优于GPT-4o mini 多项基准测试中,Qwen2.5-VL-32B-Instruct的表现超过了Mistral-Small-3.1-24B和Gemma-3-27B-IT,以及参数规模更大的Qwen2-VL-72B-Instruct模型。 在强调复杂任务多步骤推理的MMMU、MMMU-Pro和MathVista中,Qwen2.5-VL-32B-Instruct表现优于Mistral-Small-3.1-24B、Gemma-3-27B-IT、Qwen2-VL-72B-Instruct。 同时,注重主观用户体验评估的MM-MT-Bench基准测试中,该模型相较于其前代Qwen2-VL-72B-Instruct表现更好。 纯文本能力方面,Qwen2.5-VL-32B-Instruct是同规模模型中整体表现最好的。 结语:下一步将聚焦长且有效的视觉推理 相比于Qwen2.5-VL系列模型,基于快思考模式,Qwen2.5-VL-32B在强化学习框架下优化了主观体验和数学推理能力。 阿里云通义千问的研究团队下一步研究将聚焦于长且有效的推理过程,以突破视觉模型在处理高度复杂、多步骤视觉推理任务中的边界。
欧盟版iOS 18.4缺失关键功能:苹果砍掉了iPhone镜像
快科技3月25日消息,据媒体报道,本周苹果面向开发者推送了iOS 18.4 RC(Release Candidate)版,有开发者发现,iOS 18.4欧盟版本缺失了一项关键功能—iPhone镜像。 据悉,iPhone镜像是iPhone和Mac设备互联互通的重要功能之一,借助“iPhone镜像”,你可以通过Mac以无线方式与你的iPhone以及iPhone上的App和通知进行交互。 连接后,你的Mac会自动收到来自iPhone的通知;iPhone音频会通过你的Mac播放,而且音量由你的Mac控制;iPhone视频会在“iPhone镜像”窗口中播放,你还可以将视频从iPhone上的照片App中拖放至Mac上,非常方便。 但是,这项功能在欧盟不可用,原因跟欧盟的《数字市场法案》有关,苹果早在去年就提醒用户,鉴于欧盟的《数字市场法案》(DMA)会迫使苹果降低产品和服务的安全级别,公司决定暂时不对欧盟市场几亿用户推出包括iPhone镜像在内的新AI技术。 该消息公布后,欧盟当时还作出了回应,称“欢迎苹果等大平台来欧洲提供服务,只要遵守我们旨在确保公平竞争的规定。” 公开信息显示,欧盟的《数字市场法案》(DMA)对大型科技平台施加了一系列详细的行为规范,旨在促进市场的公平竞争和保护消费者的利益。 例如,大型科技公司不能利用自己的市场地位或平台来不公平地排挤其他竞争者、禁止跨服务合并个人数据、禁止利用第三方数据进行竞争,以及必须允许用户下载竞争对手的应用。
最新报告发布!美无差别攻击全球手机用户:窃取苹果iPhone用户手机数据
快科技3月25日消息,今日,中国网络安全产业联盟(CCIA)发布《美情报机构针对全球移动智能终端实施的监听窃密活动》(以下简称《报告》)。 《报告》从11个章节,详细披露美情报机构不遗余力针对全球移动智能终端和通讯体系,构建全方位的攻击渗透能力。 从SIM卡、固件、操作系统等网络产品,到数据线、Wi-Fi、蓝牙、蜂窝网络、GPS等数据接口,再到大型互联网和IT厂商的数据中心,乃至整个移动产业生态体系无孔不入,大肆窃取人员、账号、设备、链路、位置等数据,对全球移动智能终端实施的大规模、长时间的监听窃密行动,严重危害全球各国网络安全和国家安全。 《报告》总结出美情报机构通过对SIM卡漏洞、手机操作系统漏洞、APP应用漏洞,投放定制木马或商业间谍软件等多种手段来对手机用户实施网络攻击,攻击场景包括手机终端、移动网络通讯设备和运营商等。 据了解,《报告》还揭露了美情报机构对苹果手机用户窃取手机数据的黑暗行为。 《报告》称,iOS系统平台是由苹果公司开发的移动操作系统,用于iPhone、iPad和iPod touch等苹果移动设备。 iOS系统平台内置了一些苹果独有的功能,如iMessage就是苹果公司开发的即时通信服务,具有发送和接收短信、图像、视频和文档等多种功能。 这类即时通信服务却成为了美情报机构利用的目标,美情报机构通过该类服务向苹果手机用户发送漏洞利用代码,植入攻击木马,以达到长期窃取手机数据的目的。 该《报告》引网络安全公司卡巴斯基的报告显示,美情报机构实施的“零点击”攻击是指在整个攻击过程中无需手机用户进行任何交互操作,就可完成对目标移动设备的植入。 “‘零点击’”攻击不需要用户对手机进行任何操作,不需要用户点击某个链接或打开某个文件,只要手机用户收到相关内容,恶意程序就能自动植入手机。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。