行业分类:
加载中...
头条分类:
加载中...
智慧运河数字孪生平台—— 打造世纪工程的“智慧大脑”
在平陆运河建设调度指挥中心,工作人员通过数字孪生智慧运河系统查看现场施工情况。 广西云-广西日报记者黄远来/摄 平陆运河集团科技信息部相关负责人接受记者采访。韦璐明/摄 平陆运河施工现场安装了4400余套感应设备,连接数字孪生智慧运河系统,施工情况在系统上一目了然。图为马道枢纽建设现场。广西云-广西日报记者徐天保/摄   项目介绍   正在建设的平陆运河,是新中国成立以来第一条连通江海的大运河。作为西部陆海新通道的骨干工程,这条运河承载着推动区域经济高质量发展的历史使命。   除了有形的运河,平陆运河建设管理团队还利用北斗、云计算、人工智能等新一代信息技术,建设了一条无形的智慧运河,实现数字孪生运河与实体工程同生共长。   目前,智慧运河数字孪生平台已构建包括基础环境、建设管理、智慧工地、综合监控、安全应急等应用模块,通过三维动画模拟仿真、模拟数据集成关联、数据集成可视化等信息化手段,提高项目的管理质效。   实干者说   广西平陆运河建设有限公司党委书记、董事长程耀飞:   数字孪生技术高标准高质量高效率推进平陆运河工程建设,助力打造优质工程、绿色工程、廉洁工程,确保2026年如期建成通航。   平陆运河集团科技信息部副部长闫强:   作为国内首条全生命周期智慧运河,数字赋能于运河建设的各个关键环节,助力提升施工效率,降低管理成本,保障施工质量和安全。   一线采访   3月22日,记者走进平陆运河建设调度指挥中心,数字孪生平台巨幅屏幕上,一个个实时更新的数据,如同跳动的脉搏,映射出运河建设进展和工程施工动态,科幻感十足,令人震撼。   这里,既连接绵延134.2公里的运河施工现场,也连接着工地上4400多台(套)大型机械设备和重要结构物。   眼下,平陆运河三大枢纽都已经进入混凝土浇筑高峰期。通过数字孪生平台,可以看到世纪工程平陆运河项目工地上塔吊林立,铁臂飞舞,近2万名建设者奋斗正酣,宏大建设场景振奋人心。   “每个标段的施工情况都能在屏幕上显示。随着施工建设的进展,数据也会实时变化,技术人员在指挥中心就能实时进行现场管控、边坡监测、水文预警……”平陆运河集团科技信息部副部长闫强说,数字孪生平台可实现对人员、设备进行实时调度,对混凝土浇筑质量和边坡状态实时监测预警。   工作人员轻点鼠标,马道枢纽建设管理板块中,投资管理、进度管理、质量管理等情况跃然屏上,一目了然。   “在进度管理上,将BIM模型(建筑信息模型)与实际三维图进行结合,通过不同颜色来判断不同混凝土构件的进展情况。任意点击一个混凝土构件,可以查看质量验评、计量支付、浇筑记录、温控信息等。温控就是在混凝土浇筑及之后,实时监测混凝土内外温度差,防止差值过大,造成混凝土形变以及开裂。”闫强介绍。   如果数据超出阈值,系统会立即预警,确保工作人员及时、准确掌握工程建设情况和施工状态。去年5月9日至10日,平陆运河某边坡一处GNSS地表位移监测设备监测到该处两日平面位移和垂直位移速率较往常增大,系统自动启动预警,提醒工作人员迅速妥善处理,保障运河建设安全高效。   智慧运河建设实现了运河动态“一图总览”、工程建设“一站服务”、决策指挥“一脑智控”。在数据采集和业务管理方面,平台依托项目感知网、传输网、无人机、遥感卫星等技术,实现对施工现场和工序的全面感知。“平台采用大数据分析和机器学习算法,对采集的数据进行清洗、整合和动态更新,确保数字孪生模型与物理世界始终保持同步。”   “在运营期,我们计划在主要骨干航道,通过激光扫描与倾斜摄影技术,建立毫米级高精度模型,整合水位、流速、船舶轨迹等实时数据,破除传统水运‘数据孤岛’困局。”闫强介绍,他们还同步部署“一网感知”智能监测体系,在各枢纽节点布设水位传感器、闸门状态检测仪、雷达等设备为动态调度提供技术支撑。   与此同时,依托AI算法与流体动力学仿真技术,开发内河航运“智慧大脑”,实现航道通航效率模拟、船舶智能编队、多式联运路径优化等功能。“平陆运河设计的船舶过闸调度算法,可对船闸设计‘优先级插队’机制,对电煤、粮食等民生物资运输船舶实施智能通行权分配,提升单闸次通行效率;同时协同构建‘一屏统览’的省级水运资源调度平台,整合航道、港口、铁路、公路数据,实现‘水—铁—公’联合调度。”闫强说。   作为我国首条“智慧运河”的实践标杆,平陆运河数字孪生平台的技术与模式正不断创新与突破。当前,平陆运河集团已完成DeepSeek大模型本地化部署,并与数字孪生平台深度融合,同时正在进一步开展智能调度、智能导航、智能感知、智慧运营等应用场景的研究,全生命周期智慧运河建设迈出新步伐。   数字技术赋能下,平陆运河建设扬鞭发力,跑出加速度。截至2025年3月20日,平陆运河累计完成投资突破510亿元、土石方开挖约2.78亿立方米,“一河贯通,八桂向海”的美好愿景正逐步成为现实。( 广西云-广西日报记者 黄远来)
河南“象”如何长成群
锅圈食汇。 胖东来天使城。 UU跑腿全国运营中心。 郑州东站东广场打造中原商业新地标,目前已集聚蜜雪冰城总部旗舰店、胖东来郑州首店、牧原集团郑州研发中心等商业体,共同引领中原消费升级。河南日报记者 聂冬晗 摄     春分至,中原千花百卉争明媚。   3月21日,全省促进民营经济高质量发展大会暨重大项目集中开竣工活动在郑州举行,胖东来、牧原、多氟多等河南民营企业代表,在这场重磅活动中同框站“C”位。   建好5万平方米的郑州高铁东站胖东来超市;在南阳打造千亿级合成生物产业集群;依托“中原氟谷”打造千亿级氟材料产业集群……当胖东来等几位河南民企“流量”担当者,现场发言中亮出各自的“小目标”,一个高吸睛度的话题如影随形:河南人还能造出几头“象”?   前有蜜雪冰城登陆港股市值冲破千亿港元,后有全国网友争相为胖东来郑州首店取名。当“雪王”和胖东来成为话题王,河南消费类民营企业憧憬的春天来了。   过往两年,网上流行着一个既严肃且具喜感的话题——“胖东来、锅圈食汇、蜜雪冰城,能否在河南实现量产?”看似诙谐的调侃,折射出河南人对中原经济沃野孕育出更多优秀民企的殷切期许。   几天前,知名博主秦朔撰写的《河南跑出来“三头象”》,引发热议。“河南这块饱经沧桑的中原大地,涌现出这样的创业之子,是一种骄傲。”秦朔以胖东来、蜜雪冰城、泡泡玛特为例,从成功模式、创业精神、行业区域经济贡献等多维度剖析,为公众呈现了一幅河南民企破茧成蝶的生动图景。   有茂密的森林,才有起舞的大象。中国大市场是无边的茂密森林,中国经济发展动能转换不断加速,“消费领跑”新周期因此开启,一个前所未有的出彩机会,摆在消费类商企面前。胖东来、蜜雪冰城、锅圈食汇、姐弟俩、巴奴、致欧家居等,被市场和消费者齐力推到聚光灯下,成为河南典范,源自在大市场中找准自身定位,在细分赛道始终坚持以消费者为中心,不内卷、不打价格战,用服务于人来创造独特价值。   河南简称“豫”,字形是“我牵着一头象”。三位河南籍企业家所创办的公司在国内市场均是现象级企业,确实可以比喻为河南跑出来的“三头象”。由此,一个更宏大的话题被点燃:“河南三头象”可比“杭州六小龙”?   今年春节,“杭州六小龙”的话题火遍全网。深圳则集结机器人产业“八大金刚”列队,高调秀出了“中国第一开放窗口”的城市实力和营商环境。一场区域经济强势产业的友谊赛就此打响,各省(市)都在忙着吹集结号、找形象参照物。   相比浙系六小龙、粤系八大金刚,河南“三头象”在很多人眼里,产业档次或科技范儿不仅“土”,还是妥妥的代差。但开超市真的比造机器人“土”?答案是否定的。   超强学习力,是河南“三头象”的首个品质。   2024年《财富》杂志发布的世界500强榜单上,沃尔玛连续11年蝉联第一,苹果排名第七。沃尔玛是胖东来“偷师”的对象,20年前于东来没少带队去沃尔玛门店蹲点做笔记,今天该公司商管团队也没少去山姆会员店“定向溜达”。但“教会徒弟,饿死师傅”这事儿,真让河南人干成了。沃尔玛入豫20年始终不入许昌,新乡店在2014年撤店后,被胖东来租下其所在物业补了位。   蜜雪冰城、锅圈食汇也是“好学生”,特许经营连锁模式是典型的舶来品,以一套超强标准化门店模式输出,用优秀的产品创造体系与供应链牢控数万家店,在今天已可比肩全球麦当劳、肯德基。   从“学习象”晋级“产业象”,靠的是破解差异、就地取材、扬长避短,这是河南“三头象”的第二个品质。   全国餐饮业竞争最惨烈的赛道是火锅和烧烤。锅圈食汇敢“脚踩两船”,且屹立市场之巅,支撑力来自哪里?镜前看,是产品及服务模式高度契合家庭及户外露营的使用场景;镜后看,是在河南、广西、贵州等省区布局的供应链,10多家工厂持续输送优质的原创产品。同时,它投资的华鼎冷链提供低成本物流体系,支撑起锅圈系在消费市场实现客群细分,让全国的火锅店、烧烤店、大型商超成为它的采购客户。   做到了“产业象”或能具备网红体质,但基业长青则需真正做到“长期主义”,修炼肌体做一头“创新象”,这是“三头象”的第三个品质。   10年前,很多公司喜欢炒作“天价产品”,茶、酒、方便面、家具、蛋糕是典型案例。河南“三头象”却无一这么做,它们更喜欢做别人不屑于做的生意或赚慢收益的买卖,打的是“产品创新力+极致质价比”。如蜜雪冰城,一杯柠檬水售价4元,一年卖出1亿杯,“隔夜”柠檬被网上一众消费者“护短”。但蜜雪冰城只卖柠檬水吗?2024年前9个月,该公司共推出了百余款新品,月均上新超10款产品,持续为消费者带来新鲜感,获利是水到渠成。   市场是稀缺资源,也是商家的流量密码。在行业强势资本所裹挟的激烈对抗中,河南“三头象”不但磨砺了扎实基本功与求生韧性,最终逐个破圈,市场与政策红利是最坚实依靠。大中原是亿级人口大市场,支持民营企业政策组合拳,既有“拳路拳式”,又精准“拳拳发力”。河南“三头象”不但获得存活的土壤养分,更获得了足够的时间积淀与试错机会,支撑它们破解属于自我的活法。   民营经济,推进中国式现代化的生力军,实现高质量发展的重要基础。“三头象”走过的路能否在河南更多产业中复刻,繁衍更多的象群?来自朋友圈的追问,深刻折射出河南人对中原沃野孕育出更多优秀民企的殷切期许。   河南本土消费产业不缺好苗子,此前有巴奴火锅、悦来悦喜、致欧家居,如今还有麦陌烘焙、代字行、匠多多,它们在国内细分赛道表现出色。关键是如何发现、理解、鼓励和扶持,就像合肥发现了蔚来、科大讯飞,耐心给予成长时间,在国内科技领域造就了“合肥现象”。这不仅考验着管理者们的远见和智慧,更需要一省民众对现代服务业的价值拉齐认知,对产业高质量发展方向看得清、敢于干。   “水广者鱼大,山高者木修。”今天的大中原,抓住畅通经济循环这个根本和市场经营便利这个“棋眼”,建设全国统一大市场循环枢纽,打造国内国际市场双循环支点,民营经济高质量发展其时已至、其势已成,“豫地之象”必将让世人刮目。(记者 丁新伟 河南日报财经全媒体中心记者 杨霄)   专家观点   强有力政策体系护航民营经济高质量发展   □省发展战略和产业创新研究院研究员 高亚宾   民营经济在河南省经济发展大局中占据重要地位,贡献了全省55%以上的生产总值,经营主体占全省经营主体总数的96%,成为推动经济增长的重要引擎。加快推动民营经济高质量发展,对奋力谱写中国式现代化河南篇章具有重要支撑作用。近日,河南省召开全省促进民营经济高质量发展大会,深入贯彻落实习近平总书记在民营企业座谈会上的重要讲话精神,硬核发力出招,打出一揽子政策措施“组合拳”,进一步优化民营经济发展环境、提振民营企业发展信心,护航推动全省民营经济健康发展、高质量发展。   一是政策体系更加系统集成。促进民营经济发展是系统工程,涉及范围广、政策链条长、工作环节多,需要各部门及社会各界密切协作配合。根据会议部署,近期河南省将印发实施促进民营经济高质量发展的政策体系框架,既有促进民营经济高质量发展行动计划作为总的统领,又有经营主体培育、骨干企业培育、市场平等准入、维护公平竞争、科技创新赋能、合法权益保护等专项行动,还有整治涉企四乱、法治保障、招投标专项整治和强化要素保障、信用诚信建设、民营企业培训等重点领域攻坚,以及完善政企常态化沟通机制、“万人助万企”帮扶机制、小微企业和民营企业融资等工作机制。总体看,此次政策体系坚持系统观念,牢固树立一盘棋思想,将落实机制与支持政策措施紧密配合,有利于各部门各领域相互促进、良性互动、凝聚合力。   二是政策措施更加精准有力。此次会议目标导向十分明确,及时回应民营企业的核心关切,释放出支持民营经济加快高质量发展的强烈政策信号。比如,针对一些领域民营企业进入难问题,聚焦融入全国统一大市场建设,实施市场平等准入专项行动,加强公平竞争审查刚性约束,尽快破除制度性障碍约束,完善民营企业参与重大项目建设长效机制。比如,针对我省民营企业科技创新能力与广东、江苏、浙江、山东等主要GDP大省仍存在较大差距问题,支持民营企业创新发展,实施科技创新赋能行动,支持民营企业加快推动智能化、绿色化改造,大力开发更多新产品、新技术、新业态,提升市场竞争力。比如,针对民营企业发展中存在的乱收费、乱罚款、乱检查、乱查封“四乱”问题,加快推进整治攻坚,强化执法监督和集中治理,依法保护民营企业和民营企业家合法权益。同时,河南省还将推广落实“入企扫码”制度,让“无事不扰、有事必应”成为常态。   三是政策落实更加积极有为。优良的营商环境对民营经济发展至关重要,哪里营商环境好,企业就往哪里走。此次会议还有一大鲜明亮点体现在落实机制上、体现在为民营企业营造一流营商环境上。比如,省级层面成立高规格促进民营经济高质量发展工作领导小组,建立清单化推进政策落实工作机制,将切实增强政策落实的精准度、可及性。专门建立常态化沟通、“万人助万企”帮扶、民营企业融资等工作推进机制,有利于快速打通政策落地落细“最后一公里”,切实解决企业发展中面临的突出问题。同时,上线运行河南省政策直达和诉求响应平台,提供24小时“客服”,对企业诉求建立快速受理、有诉即办、限时办结的执行闭环,有利于推动政策直达快享、应享尽享。   河南日报财经全媒体中心 出品
黑龙江省“森林粮库”日益丰盈
  原标题:我省森林食品产业发展加速,一年多307款产品入选 “九珍十八品” 品牌阵营 “森林粮库”日益丰盈 蓝靛果。 沙棘果。   2025年中央1号文件提出,构建多元化食物供给体系。践行大农业观、大食物观,全方位多途径开发食物资源。发展森林食品,丰富“森林粮库”。   近年来,我省深入践行大食物观理念,充分利用丰富的森林资源,大力发展森林食品产业,致力于将“绿水青山”转化为“金山银山”,让森林食品成为保障粮食安全的“新粮库”。   产业发展势头旺   虽已进入春季,但积雪尚未消融,洁白的白桦林一片静谧。走入庆安国有林场管理局(以下简称庆安管局)新青山林场,工作人员正在进行白桦树本底资源调查,为林间的白桦树进行标号。   庆安管局负责人陈志强介绍,为精准布局桦树汁产业,摸清资源“家底”,庆安管局制定并实施《桦树资源调查会战方案》,全面掌握桦树资源分布情况、数量统计、生长状态及道路信息。300余名职工历经60余天艰苦奋战,调查总面积达8131公顷,精确统计桦树总株数152.4万株。依据调查数据,绘制出全局桦树资源“一张图”,实现了资源可视化管理与高效利用。   我省白桦树面积1000余万公顷,白桦树汁蕴藏总量达5800万吨,白桦树汁产业发展潜力巨大。   目前,全省初步形成了以大小兴安岭为核心的白桦树汁产业格局。省林草局立足我省资源及产业现状,组织编制并印发了《黑龙江省白桦树汁产业发展规划》,努力将白桦树汁生产加工打造为百亿级产业链。   在“林都”伊春,白桦树汁产业已形成了较为完整的产业链条,共有食品、日化、保健等近180个品种,产业发展势头强劲,特别是2024年,桦树汁采收量达4.75万吨,同比增长280%,产业产值达到3.17亿元,企业数量由2023年的13家提升至21家,在《伊春市桦树汁产业发展五年规划(2024-2028年)》中可以看到,伊春市5年内可累计采集桦树汁达到40万吨,将实现总产值48亿元以上。   日前,《黑龙江省桦树液采集管理办法(试行)》正式发布,标志着我省在桦树汁产业可持续发展上又迈出坚实的步伐。今后全省将在保护第一的前提下,对桦树汁施行科学规范利用、适度适量采集,并陆续建立采集、储运、加工全过程标准体系,推动桦树汁产业蓬勃发展。   “森林粮库”底气足   我省广袤的森林资源不仅构成了祖国北方坚实的生态安全屏障,更蕴藏了无数森林珍宝。   走入“蓝靛果之乡”七台河市勃利县,近1300公顷的蓝靛果正汲取着融化的雪水,积蓄生长的力量。再过一个多月,这些蓝靛果便将迎来开花时节。进入大健康时代,比蓝莓中的花青素还要高10倍的蓝靛果,其“花青素之王”的名头早已“走出深闺”被大众所了解。   每年12月到来年1月是牡丹江穆棱市和林口县的沙棘采摘季,橘中带红的沙棘果被收入冷库,等待着被加工成沙棘果汁、沙棘油等高附加值产品,端上全国消费者的餐桌。   在鸡西市虎林市,精心培育的刺五加苗也即将上山,这里除了76万亩丰富的野生刺五加资源外,还开辟了刺五加仿野生栽植,源源不断的优质刺五加自这片土地孕育而出,以各种形态为人们的健康保驾护航,也让虎林赢得了“中国刺五加名城”的称号。   猴头菇、红松子、黑木耳……无数珍贵、稀有、绿色、健康的森林特产不但是黑龙江发展森林食品、丰盈“森林粮库”的底气,也是兴林富民的致富密码。发展森林食品产业,不仅是对大食物观的生动实践,更让黑龙江从传统农业向多元化的森林食品产业拓展,走出了一条生态优先、绿色发展的新路子。   品牌引领效益高   基于丰富优渥的森林食品资源,在省委省政府“打造践行大食物观先行地”发展战略部署下,2023年,省域林业公用品牌“九珍十八品”问世。经过一年多发展,目前全省已有129家企业的307款产品入选“九珍十八品”品牌阵营。在“九珍十八品”品牌引领带动下,入选企业2024年实现总营收52.2亿元。2024年全省森林食品产业产值实现853亿元,增长6%。   在品牌建设上,“九珍十八品”注重顶层设计,制定了《“九珍十八品”品牌战略规划(2024年-2026年)》,并根据市场需求调研和科学分析,制定了《“九珍十八品”品牌建设实施方案》。制定《龙江森林食物“九珍十八品”标准体系建设规划(2024年-2026年)》,从生产源头、原料质量标准及产品标准三个方面入手建立全过程标准体系。与中国标准化研究院合作建立品牌质量标准体系,已经完成了涉及保护性采集标准和产地环境系列约束性指标等34项技术规程。   在品牌发展上,“九珍十八品”积极创新,推出“森林茶哺”新业态。聘请北京专业团队同北京农业大学、东北农业大学联合研发森林饮品,创建“森林茉茉”健康茶饮品牌,初步开发近20款产品,成为当下风靡一时的健康森林茶饮。不仅如此,“九珍十八品”还注重国际市场影响力,品牌先后获得伦敦国际设计铂金奖等8项国际大奖,打响了品牌国际知名度,为“高寒植物 高倍营养”的森林食品走上国际奠定坚实基础。   在前不久召开的“九珍十八品”品牌建设专题会议上,明确了2025年的重点工作任务,品牌宣传推广、国内展会建设、营销渠道建设、新业态“森林茉茉”发展、“桦树汁”采集管理、“九珍十八品”一线城市行……一系列工作部署及举措让黑龙江森林食品产业发展之路更加清晰,也让“打造中国森林食品第一公益品牌”的目标愈来愈近。(文/摄 记者 唐海兵)
古老剧种打破沉寂—— ​东路梆子“吼”出新天地
  “青史人物百家评,悲歌一曲留人间……”近日,东路梆子新编历史剧《荐官记》在山东省滨州市阳信县首演,剧中寒儒王密求官、为官、失官、悔官的人生历程令许多观众唏嘘感叹。   这场演出是东路梆子近半个世纪以来首次推出的原创大戏。从历史上的繁荣、沉寂,到近几年的挖掘、保护,东路梆子继承传统、守正创新,重新走入大众视野,受到广泛关注。   传唱300年   “吼”出鲜明特色   《荐官记》开场前,山东省戏曲理论家、作曲家高鼎铸对两件事尤为关注:一是演员有没有外借,二是唱腔的完成度如何。对此,他解释说:“东路梆子虽然是个稀有剧种,但它也是地方大剧种,传统戏以袍带戏居多,‘四梁八柱’是否齐整将直接关系到未来的剧目体系。唱腔音乐更为关键,它是一个剧种最显著的艺术特色,也是戏曲有别于其他艺术形式的主要标志。”   东路梆子,也叫“山东吼”“东路讴”,属于梆子声腔系统,至今已流传300多年。据《山东地方戏曲剧种史料汇编》记载,明末清初,山西、陕西梆子艺人沿黄河来山东谋生,演唱梆子腔,这种声腔先是在商贾往来重镇章丘盛行,后又以惠民为主蓬勃发展,并受到地域艺术元素影响,形成了特色鲜明的剧种形态。   “清代中叶以后,东路梆子在鲁东北多地取得长足发展,常与横笛梆子(今河北梆子)班社同台演出。”高鼎铸告诉记者,为了加以区分,当时,人们把活跃在济南以西及西北的横笛梆子叫作西路梆子;把流布于济南以东的这一支称为东路梆子,该剧种便由此得名。   谈及剧种特色,《荐官记》导演陈胜介绍,东路梆子虽与山东省内流传的山东梆子、莱芜梆子等同属于梆子声腔剧种,但在伴奏乐器、唱腔风格上有明显不同。“它的唱腔高亢明亮,句尾会根据不同的唱词内容、唱腔板式、演唱情绪呈现出不同程度的拖腔,就是这个‘吼’,彰显了剧种的独特性,往往也是烘托戏剧情境的点睛之笔。”陈胜说。   “周康演关公,我三天不上工”“豁上今天不赶市,也要先看梆子戏”……这些民间流传的说法,形象描述了东路梆子在不同历史时期的繁盛局面。据阳信县洋湖乡西肖家村老艺人讲,及至20世纪50年代末,该村尚有东路梆子演出人员30多人,服装、把子箱五六顶,常演《双锁山》《破洪州》等20多出剧目,这也印证了东路梆子为地方大剧种的观点。   十余载挖掘保护   从沉寂走向新生   20世纪中叶,以惠民、阳信一带为中心,东路梆子演出辐射至周边20多个县市区的上百个村庄。1956年,东路梆子第一个专业演出团体——惠民县东路梆子剧团成立。但由于历史原因,这支剧团在1967年被解散。   “此后,东路梆子再无专业演出团体,民间零散组织一些演出活动,随机性较强。20世纪末,受到娱乐方式多元化等现实因素影响,剧种发展进入低迷期。”滨州市艺术创作研究所所长臧宝荣介绍。至今,她仍清晰记得该所牵头开展东路梆子调研时的情况:“2015年前后,调研组走访了70多个村庄,发现仅有少数村还保留服装、道具,艺人最年轻的也已60多岁。东路梆子整体走向沉寂,一无财力支持,二无研究人员,三无专业学校。”   作为历史上东路梆子演出较活跃的区域之一,阳信县较早开始了对这一剧种的挖掘与保护工作。“从2007年起,阳信县就着手整理东路梆子老艺人口述资料。2016年,阳信县非物质文化遗产保护和文化研究中心(简称‘阳信县非遗中心’)成立,在开展专项研究的同时,以原阳信县艺术团为班底从事东路梆子演出活动。”阳信县非遗中心负责人封波说。   体制机制创新给东路梆子发展带来转机,但如何让剧种回到群众中去?亮出家底和特色,是阳信县走出的第一步。   《荐官记》剧照     阳信县文化和旅游局供图   说到近些年演出的剧目,东路梆子省级代表性传承人李双印开口就唱,传统戏《白虎帐》选段被他演绎得酣畅淋漓。“过去几年,我们把滨州区域内上演的几百种东路梆子戏分类存目,整理出传统戏10余部,并复排了《白虎帐》《双锁山》。”李双印介绍,东路梆子每个行当都有不同的唱腔特点、发声方法,文本、表演、伴奏均有较高的研究价值,需要在传承中被发现。   封波介绍,东路梆子还贴合时代审美,从现实中取材,排演了反映乡村生活的《二蛋闹牛》、讲述军民鱼水情的《军号嘹亮》等多部小戏作品,给人质朴、灵动和耳目一新之感,受到许多年轻人喜爱。   与时代同行   返本不忘开新   “与排小戏有所不同,排演大戏更锻炼年轻人。就拿《荐官记》来说,我们从2024年就投入创排之中,以演带训,演职人员获得了快速成长。”陈胜表示,演出原创作品时,演员需要突破固定范式,把自身感受与体验融入人物塑造,这正是获取舞台经验的良好契机。   “从长远来看,一部新戏的问世、打磨,对于稀有剧种传承发展、人才培养的意义或将超越作品本身。”高鼎铸谈到,阳信县非遗中心若能在现有队伍基础上,扩充一部分演职人员,舞台演出将会更加游刃有余,也能更好地契合东路梆子作为地方大剧种对行当、角色的要求。   这同样是阳信县非遗中心迫切想要解决的问题。“近几年,尽管有新生力量注入,但2026年前,中心将有8名演职员退休,45岁以下的演员尤为匮乏,人才梯队建设亟须完善。”封波说。   阳信县已经开始“破题”。据阳信县文化和旅游局党组副书记孙洪芳介绍,除“以戏促培”外,该县推动“以师带徒”,聘请戏曲名家、当地老艺人定期对青年演员进行教学、培训,拓宽了东路梆子专业人才培养途径。与此同时,阳信县探索人才引进“特事特办”机制、与相关艺术院校开展联合培养,为剧种体系化传承和地方文化生态整体性保护注入内生动力。   也有专家建议,东路梆子的发展,在尊重规律、注重差异、保护特色的同时,还应抓住在“中国戏曲稀有剧种优秀剧目展演”等大型演出活动中的“出圈”机会,加强新人、新作与新青年、新平台的连接,打破传承的时空界限与代际隔阂,这将有助于更好地彰显剧种的艺术魅力和时代价值。(记者  孙丛丛)
集装箱行业加速绿色低碳升级
  2025集装箱多式联运亚洲展上发布的最新数据显示,2024年我国集装箱总产量超810万标准箱,较2023年增长268.2%,再创历史新高。   2024年,我国集装箱供应链水平持续提升,产业链协同更加稳定,集装箱生产及上游企业积极配合,通过优化生产流程、稳定资源供应等方式保障订单交付。中国集装箱行业协会副会长李军表示,我国拥有集装箱全产业链集群,具备全供应链体系、全产品系列、全技术能力和全面的配套服务体系。   国际市场显著增长   近日,中国集装箱行业协会发布《中国集装箱供应链发展报告(2024)》显示,2024年我国集装箱产量占全球96%,产能主要分布在长三角和珠三角地区。   其中,国际标准干货集装箱是集装箱生产的主力箱型,2024年,约占我国集装箱总产量的91.3%。此外,冷藏集装箱产量约占我国集装箱总产量的3.8%;铁路35吨敞顶箱产量占比约为0.7%;罐式集装箱产量占比约为0.6%;其他类型集装箱产量占比约为3.6%。   “2024年,我国集装箱生产量继2021年后再创历史新高,是过去5年集装箱平均产量的2.2倍。这主要是多重因素叠加推升了集装箱市场需求。”中国集装箱行业协会弘景智库副主任罗先立分析,一是红海危机等冲击了集装箱供应链,推动了需求增长;二是航运公司和租箱公司为应对地缘政治影响及国际贸易形势变化,备箱意愿增强。   数据显示,2024年,集装箱国际市场显著增长。从出口数量来看,我国集装箱出口数量较上年增长135.7%,扭转2022年、2023年连续两年下降的态势;从出口金额来看,2024年,我国集装箱出口额为170.4亿美元,较上年增长105.8%;出口箱型结构上,40尺国际标准干货集装箱占比超过50%。   虽然出口数量增长,但集装箱价格仍处于较低水平。罗先立介绍,2024年集装箱出口额增幅低于出口量增幅,集装箱箱价较上年下滑,国际标准干货集装箱箱价同比下降约15%,冷藏集装箱箱价同比下降6.2%。   推进绿色低碳发展   在出口数量和金额均大幅增长的同时,国内集装箱市场发展势头也不错。2024年,集装箱国内市场销量达到47.7万标准箱,较上年增长35.8%。   不过,由于国际市场销量激增、国内市场基数较低,使得国内市场销售占比下降。   李军认为,从国内市场来看,关于促进集装箱发展的政策频出,利好国内集装箱市场,集装箱产业仍具有较大潜力。   2024年,交通运输部等多个部门相继推出《有效降低全社会物流成本行动方案》《交通物流降本提质增效行动计划》等,持续推动集装箱多式联运发展。   按照部署,到2027年,港口集装箱铁水联运量年均增长15%左右。近年来,集装箱国内市场需求保持在50万标准箱左右的规模。随着我国交通物流降本提质增效进程加快,以及多式联运“一箱制”推进实施,将持续带动国内集装箱市场需求。   今年3月10日,《冷藏集装箱智能终端技术规范》等4项交通运输行业标准发布,国内特种集装箱推广应用步伐加快。   罗先立介绍,与国际市场不同,国内集装箱市场呈现3个特点:一是以高频次、小批量的用箱需求为主;二是注重不同货物运输场景的定制化需求;三是需求主体主要为国际陆港及物流园区的运营商、内河航运企业、多式联运经营人、港口物流企业等。   根据国内用箱的需求特点,集装箱行业积极拓展冷藏集装箱、罐式集装箱国内市场。铁路50英尺等大容积集装箱投入量和覆盖区域将持续扩大,卷钢、水泥、沥青、豆粕等货类集装箱加快推广应用,铁路35吨敞顶箱海铁联运“一箱制”班列有序推进……这些都将促进国内集装箱需求增长。   “绿色低碳正成为集装箱行业发展的主基调。”罗先立介绍,绿色材料创新驱动产业升级,绿色能源应用加快拓展,集装箱生产和配套企业推进“零碳工厂”建设……一系列节能减排技术和节能设备加快改造步伐,助推集装箱全产业链节能减排。   集装箱供应链碳核算与绿色认证体系将加快完善。2024年下半年,中国集装箱行业协会先后发布《推进集装箱绿色发展倡议及标准体系建设工作建议》和《中国集装箱行业绿色低碳发展工作方案及第一阶段工作计划》。在此基础上,集装箱行业将继续推进绿色低碳进程,组织上下游企业共同参与,为集装箱相关企业绿色低碳发展提供有力支撑。   积极应对市场变化   总体上看,集装箱行业受经济形势、外贸水平、船队规模、流转效率、安全局势等多方面影响,市场波动大。比如,2021年我国集装箱产量创下历史新高后,2022年、2023年产量均出现下降。2024年,集装箱行业在再创历史新高的同时也积极应对可能出现的波动。   “结合行业调查及对集装箱市场面临的形势研判,我们认为集装箱供应链进入了调整期。近期看,集装箱市场将回归常态。”罗先立说,集装箱新箱处于高库存,全球集装箱保有量规模已达5800万标准箱,航运公司和租箱公司订购新箱的紧迫性减弱,对集装箱市场造成较大下行压力。   与此同时,全球贸易和安全形势还面临许多不确定因素。   业内专家分析,综合研判当前形势和未来趋势,建议集装箱行业、企业要持续稳固自身优势,练好内功,同时紧跟国际需求变化,不断调整适应,积极应对变化。(记者 齐慧)
2025“五月演出季”官宣: 28部剧目96场演出“京”彩纷呈
  北京演艺集团2025“五月演出季”重磅官宣,精彩来袭!作为北京演艺集团十年倾力打造的演出季品牌,今年第十一届从5月1日至6月1日,共带来4大单元板块、28部作品、96场演出,为首都市民打造一场跨越春末夏初的文化盛宴。   “伯爵号”五一假期剧场扬帆起航 “主角”用舞蹈肢体吟唱命运悲歌   五月好戏云集,多部精品佳作将在北京天桥艺术中心集中上演。音乐剧《基督山伯爵》中文版北京站8场连演开启“五一”小长假,北京演艺集团旗下北京歌剧舞剧院音乐剧团团长、剧目制作人和主演阿云嘎,联袂赵超凡、娄艺潇、徐瑶、徐丽东等众多实力派原班人马回归,让观众感受文学经典的深度舞台呈现,更有限定活动“假面舞会”邀请大家与“伯爵“共舞”;改编自茅奖小说,集结文学、舞蹈、戏剧界豪华主创阵容倾力打造的舞剧《主角》5月9日至11日重磅首演,剧目将横跨40年78万字的长篇巨著浓缩于舞台之上,巧妙融合舞蹈肢体与秦腔元素,以全新视角和艺术表现手法,让观众感受文学与舞台艺术融合的独特魅力。   让艺术跨越时空与地域 新疆的大漠、青海的高原、拉萨的河水即将走上舞台   以国宝文物为灵感创作,荣获“五个一、文华”双项大奖、惊艳央视春晚舞台的舞剧《五星出东方》5月23日至24日将携西域传奇故事登上舞台,全国巡演超百场好评,被观众评价为“含舞量”超高的口碑佳作;全国儿童剧高分榜第1名、大麦评分9.9的原创藏风儿童剧《高原上的黑眼睛》5月10日至11日即将温情上演,不出北京也能欣赏到三江源的美,这部“遛娃神剧”千万别错过;5月16日至18日,话剧《远方的拉萨河》将动人援藏故事搬上舞台,剧目用艺术形式巧妙融合京藏两地极具鲜明地域特色的元素与符号,以平凡故事展现不平凡的感动与美好。   传统戏曲、京味经典、热门IP改编创作 十三大艺术门类带来丰富视听文艺盛宴   北京演艺集团旗下文艺院团“国家队”多部好戏登台,带来高品质精彩演出。中国杂技团建团75周年特别演出“登峰造‘技’——中国杂技团建团75周年精品展演”,5月9日至11日将在二七剧场上演;中国评剧院新创作品《咫尺千里》5月10日至11日唱响梅兰芳大剧院,传统经典剧目《花为媒》《秦香莲》《杨三姐告状》5月19日至21日登台人民剧场;中国木偶艺术剧院改编创作自经典神话IP与热门动画IP的木偶剧《孙悟空三打白骨精》《哪吒闹海之龙灵石传说》《海底小纵队在中国》之东海救援5月1日至5月10日在中国木偶艺术剧院为小朋友们带来快乐与惊喜。   梆韵声腔交织时尚国乐,中华优秀传统文化魅力绽放舞台。北京演艺集团旗下北京市河北梆子剧团带来的经典剧目《王宝钏》和集团重点剧目、讲述密云水库建设保护动人故事的《密云十姐妹》,将于5月7日至8日、11日在长安大戏院登台亮相,更有深受戏迷喜爱的河北梆子《金玉奴》5月17日在民族文化宫大剧院上演。北京民族乐团推出的“青春乐拍《胡同》”、成立十周年系列音乐会《五行》、《彩云追月》将分别于 5月3日、10日、30日在国家大剧院、中山公园音乐堂、北京艺术中心奏响国乐之声。   地道京味曲韵悠扬,南锣剧场即将好戏开场。北京演艺集团旗下北京儿童艺术剧院四部好评儿童剧《甲骨文学校1》《米小圈之银河侦探社》《你看起来好像很好吃》《封神之哪吒大战海龙王》将串联整个五月在南锣剧场和中国木偶艺术剧院,为小朋友们打造欢乐戏剧海洋,是亲子同行的绝佳去处。北京曲艺团四大名著主题专场演出《红楼缘梦》《国学中的曲艺》将于5月16日至17日,5月29日至30日在东图剧场、北京天桥艺术中心带来最地道的京味演出。北京市曲剧团将于5月3日至6日在北京天桥艺术中心带来北京唯一地方戏北京曲剧《少年天子》《离婚》,以及5月31日在中国儿童艺术剧院还将上演北京曲剧《运河遥啊谣》(暂定名),看北京曲剧,品京腔京韵之美。   北京演艺集团2025五月演出季,共将为观众呈现5部集团重点精品大戏,9部彰显传统文化技艺佳作,7部适合全家共赏儿童剧,7场京腔京韵的曲艺、民乐及戏曲演出。让我们欢聚剧场,五月不见不散。(记者 杜娟)   2025“五月演出季”演出排期:   
OpenAI发布生图神器狙击谷歌!一句话P图奥特曼现场玩梗
就在刚刚,OpenAI 宣布在 GPT-4o 模型中集成了迄今为止最先进的图像生成器。 OpenAI CEO Sam Altman 在 X 平台继续夸夸群主上线,表示初次见到模型生成的图片时,难以相信是 AI 所为,并期待用户能发挥创意。 新功能亮点如下: 能够精确渲染文本内容 支持多模态输入输出(文本、图像、音频) 能理解复杂指令并结合上下文 能创建具有真实感的第一人称视角图像 遵循指令,可以处理上传的图片并进行编辑或风格转换 先来感受一下新模型生成的图片: 向左滑动查看更多内容 最新版本的系统卡写到,与作为扩散模型的 DALL·E 不同,4o 图像生成是一个自回归模型,原生嵌入在 ChatGPT 中。 具体来说,比起其他图像生成模型,GPT-4o 能处理多达 10-20 个不同物体的复杂指令,远超竞争对手 5-8 个的限制,差距不是一般大。 一句话 P 图也行,该模型同样支持多轮图像生成,聊着天就能优化图像,确保角色等元素在多次迭代中保持一致性。 比如设计个游戏角色,改来改去外观都能稳住,还能分析用户上传的图像、细节抓得准,并指导后续图像生成。 目前,新功能已向 Plus、Pro、Team 和免费用户开放,Enterprise 和 Edu 用户即将获得访问权限。别急,开发者们几周后也能通过 API 用上这功能。 附体验链接:https://chatgpt.com/ 使用 GPT-4o 创建和自定义图像非常简单,只需描述需求,包括纵横比、精确颜色或透明背景等规格。不过要是细节多,渲染可能得等上一分钟,毕竟慢工出细活嘛。 今天凌晨召开的发布会也向我们展示了几个具体的案例。比如说,演示者拍了张仨人的合影,让 ChatGPT 改成动漫风。 结果模型不仅保留了三人的特征(如胡须、表情等),还能理解并融合「动漫」这一视觉风格。 接着他又让它改成互联网梗图,加上了「I FEEL THE AGI」的文字,果然,OpenAI 的发布会少了 AGI 总感觉差点意思,属实是传统艺能了。 又或者,演示者要求模型创建一个「描述相对论的彩色漫画页面,并添加幽默元素」。 模型生成一个结构完整的漫画页面,包含了相对论相关概念的解释,融合了不同语言的文字,并通过视觉表现形式呈现出幽默效果。 换句话说,能够将抽象科学概念可视化,有望利好教育领域。 还有演示者先上传了一张 Sora 发布会的交易卡片照片作为参考,然后上传了自己宠物狗的照片,并提供了卡片上应包含的具体信息(名称、年份、能力、体重身高等)。 模型很快整出一张风格统一的卡片。卡片里,狗狗站在滑雪板上帅气出场,文字排版清晰准确。 继续上强度,演示人员拿前两个演示的图加上背景两张图,让模型设计一枚纪念币,并指定了特定的颜色代码(春季色彩)和文字要求。 模型成功将四张不同图像以和谐方式融合到一个币面设计中。他随后还要求将背景改为透明,以便实际打印,模型稳稳改好,设计也没走样。 AI 生成图像造成的危害已经不是什么新鲜的话题了。为了安全,所有生成图像都带有 C2PA 元数据标识,OpenAI 还构建了内部搜索工具,验证内容来源,以及阻止违反内容政策的图像请求。 当要求生成真人图像时,OpenAI 则管得更严。包括 Altman 也表示,OpenAI 希望工具默认不生成冒犯性内容,除非用户明确要求,并在合理范围内实现。 那新功能也存在比较明显的短板。比如偶尔裁剪不恰当、低上下文提示下可能产生幻觉、渲染非拉丁语言文本困难、局部调整不够细等。OpenAI 说了,这些小问题会在发布后慢慢优化。 此外,Google 于今天凌晨也发布了旗下迄今为止最强大的 AI 模型。 Google CEO Sundar Pichai 在线打 Call,称 Gemini 2.5 Pro Experimental 是一款最先进的「思维」模型,在多个基准测试中领先,特别是在推理和编程能力上有了显著的提升。 在大模型竞技场 Chatbot Arena 中,新模型力的排名压 Gork 3,再次遥遥领先。 按照 OpenAI 过往的「狙击」作风,新模型的发布一方面是对上周 Google 发布的图像模型进行回击,另一方面同样是狙击 Gemini 2.5 Pro Experimental。 你方唱罢我登场,AI 巨头们针锋相对的戏码只会越演越烈,消停?看来是想都别想了。
电视剧《北上》—— “情”是年代剧的生命线
  电视剧《北上》海报。   资料图片   在网络内容层出不穷、不断争夺注意力的今天,年代剧何以在视听市场顽强占据一席之地?正在热播的电视剧《北上》或许提供了一种答案。它以独特的审美和叙事,满足观众日益升维的视听需求,又以对个体情感的用心观照,给人以情感抚慰和价值共鸣。   《北上》的叙事是生活化的,开篇以一个4分多钟的“认门”长镜头,勾勒出3代人、6个家庭之间包容互助的真情,构筑起独属于运河人家的烟火气和人情味。观众感慨:“《北上》让中国传统式的邻里关系回来了。”作品以温存但不美化的目光回望过去,不仅复现了当时的社会环境,而且让人物命运连通时代情绪,让故事有了情感锚点。为了还清邻居们买船入股的钱,梁海泓没有躺平,她要让因跑船生意一落千丈而日渐颓废的丈夫谢天成明白,一个卖早点的家庭妇女也能学开大货车赚钱,带领这个家走出困境。面对婆婆提出过继的无理要求,多年带着女儿忍气吞声的李燕终于爆发,如同从背后猛击一掌,促使家人振作起来。这些情节抵抗住了“话题叙事”的诱惑,让人物“是其所是”,于细微处勾连起荧屏内外。   年代剧往往给人画面泛黄的印象,但《北上》始终洋溢着青春与活力,它以青春化表达塑造成长型角色,传递出一种温暖且振奋的力量,让观众在年代叙事中看到指向未来的“箭头”。作品将90后成长史融进运河百年变迁,在如何让乡愁与梦想共生、让传统与现代共舞的解题中,实现人与运河的双向奔赴。   谢天成身为“船老大”的时代,因陆运取代水运的大势而落幕,谢望和、夏凤华等一众童年玩伴,也懵懂又勇敢地感受着时代变革。经济变迁与个人成长的交织,让“北上”成为他们的共同选择,“花街六子”们从乡土嬉闹到都市闯荡的生命轨迹,镌刻着许多80后、90后的集体记忆,也暗含着现代化进程中挣脱舒适区、对未知与可能性的热烈拥抱。   《北上》将运河的兴衰放置于代际关系中书写,凸显了传承与创新的主题。剧中,新生代的拔节成长、创业突围与父辈“搁浅”于运河经济的生存处境,形成极具张力的代际叙事。一条沉船勾连出百年秘辛,三代人接力破解运河密码,新旧碰撞的火花里,年轻一代懂得了什么叫“根”。剧作巧妙地将2000年的少年身影与1950年父辈拉纤的剪影交织重叠,又让2014年北京写字楼里跳动的数据流与运河古道上亲人们的足迹遥相呼应。运河这个地理坐标,已经被升华为承载文化记忆、凝聚情感认同的精神原乡,增添了作品的历史厚重感。   作为一部年代剧,《北上》通过情绪的表达、情感的体认,最终完成了情怀的彰显。歌谣文理,与世推移。虽然人生甘苦的内容和表现形式已然不同,但丝毫不影响我们穿越时空,在年代叙事中看见自己的真实悲欢,更看见面对人生起伏时的那种坚定信念何以生生不息。(张  硕)
特朗普要在美推广马斯克的星链 官员质疑:长期使用成本太高
星链终端 凤凰网科技讯 北京时间3月26日,据彭博社报道,特朗普政府正在对一项价值420亿美元的宽带补贴计划做出调整,此举将让埃隆·马斯克(Elon Musk)旗下星链等卫星互联网提供商受益。然而,一些州和联邦官员担忧,卫星互联网技术无法大规模、低成本地为美国民众提供可靠的网络连接。 此前,拜登政府制定了宽带公平与接入部署计划(BEAD),希望为每个美国家庭提供快速、可靠的家庭互联网服务。该计划主要依赖光纤线路,虽然安装成本高,但使用时间可达数十年。不过,在特朗普上任后,马斯克大力游说美国政府转用卫星网络,并获得了共和党的支持,其中包括参议院商务委员会主席特德·克鲁兹(Ted Cruz)。 然而,一些州政府官员和前联邦官员在接受彭博社采访时以匿名方式透露,美国商务部长卢特尼克推广卫星网络的新政策存在问题。虽然卫星网络最初价格低廉,但长期费用较高。一位州政府官员分享的内部数据显示,卫星服务在30年内将使消费者的成本增加53%,维护成本也将增加一倍以上。 “这些技术之间的区别目前似乎还没有一个清晰的认识,选择一种技术弃用另一种技术所产生的长期影响也不清楚。”拜登政府时期负责宽带项目的前负责人埃文·费因曼(Evan Feinman)。他在本月离开了商务部。 根据一位匿名州宽带官员分享的分析,光纤铺设到家的安装成本至少为每户1500美元。然而,这项成本可能会因住户所在位置、周围现有基础设施完善情况等因素存在很大差异。得州估计,安装光纤到每个家庭的成本大约为1万美元。 相比之下,星链提供的标准家庭套件大约为600美元,该费用也可能存在波动。然而,根据该州的分析,星链的卫星每五年就需要更换,这使得卫星服务的长期成本大幅增加。分析还显示,光纤在30年内为25万户家庭提供服务的总体成本,比卫星服务节省了大约40亿美元,每个家庭将节省1.56万美元。 美政府的宽带计划转用卫星服务将为星链带来更多利润。《华尔街日报》报道称,根据当前的BEAD计划,星链有望获得41亿美元宽带补贴资金。如果特朗普政府转用卫星服务,星链可能会获得100亿美元至200亿美元补贴资金。 除星链外,亚马逊、OneWeb也在提供或计划提供卫星互联网服务。截至发稿,SpaceX、亚马逊以及OneWeb尚未就此置评。 (作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
OpenAI发布新文生图模型,免费、逼真到难以分辨
今天凌晨2点,OpenAI进行了技术直播,对GPT-4o和Sora进行了重大更新,提供了全新文生图模型。 除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。 尤其是生成图像的逼真度,肉眼几乎看不出任何破绽,在精细度、细节和文本遵循方面非常出色,可以媲美甚至在某些功能超过该领域的头部平台Midjourney。 新图像模型功能展示 话不多说,「AIGC开放社区」就用免费版为大家展示一下实际的生成案例。 我们先测试一下模型的文本还原和细节表现,来个复杂点的提示词 提示词:一个由甜品组成的奇幻世界,地面是柔软的奶油草坪,树木是用巧克力棒和糖果制作的,树叶是五彩缤纷的果冻。天空中漂浮着巨大的棉花糖云,远处有一个冰淇淋火山正在喷涌彩色的糖浆。 场景中还有一座用蛋糕堆砌的小屋,屋顶是草莓酱,窗户是糖玻璃,细节包括散落的糖粒、路上的巧克力碎片,以及跳跃的小糖果精灵。 构图、文本还原能力非常棒!一次就完成,生成时间大约在15秒左右。 再试一下它的新功能,其实OpenAI官方说这是一个“世界知识”功能,但是使用之后感觉更像是一个图像PPT功能,对于教育、金融、医疗等领域帮助非常大。 例如,帮我用图像介绍牛顿第一定律。就能直接生成详细介绍牛顿定律的图像,感觉和PPT差不多吧。 提示词:用一张图片介绍人体各个结构。 这个人体介绍图片就丰满很多,放在医疗介绍或PPT里应该不错吧。以后做各种宣传资料不愁找不到量身定制的图片了。 如果不满意,可以基于该图片继续发问,例如,我们想看上面人体介绍的骨骼。提示词:可以详细展示骨骼介绍吗? 我们放大手部骨骼,继续提问:来一张手部骨骼的特写。 需要注意的是,图像的文字介绍可能比较模糊或混乱,这是因为中文提示的原因,如果使用英文会好很多。 那我们就用英文提示词来试一下,In a study filled with a retro atmosphere, on the corkboard beside the wooden desk, magnetic word - spelling cards fixed with colorful pushpins form a unique poem: Line 1: "A melody" Line 2: "Can wake up" Line 3: "The slumbering memories," Line 4: "However, occasionally" (There is a large gap here) Line 5: "On a silent night" Line 6: "Will deepen" Line 7: "That longing." 文字的嵌入和排列顺序还是相当不错的。 这个提示词的大意是,在一间充满复古氛围的书房里,木质书桌旁的软木板上,挂着用彩色图钉固定的磁性拼词卡片,组成一首独特的诗:第一行:“一段旋律” 第二行:“能唤醒” 第三行:“沉睡的记忆,” 第四行:“然而偶尔” (此处有较大间隔)第五行:“在寂静的夜晚” 第六行:“会加深” 第七行:“那份思念。” 上面只是一些非常简单、基础的玩法,有兴趣小伙伴可以体验一下非常棒。 对于新的文生图模型,OpenAI联合创始人兼首席执行官Sam Altman也给出了非常高的评价。 这是一项令人难以置信的产品。我还记得看到这个模型最初生成的一些图像时,很难相信它们真的是由人工智能创作的。我们认为大家会喜欢它,并且很期待看到由此激发的创造力。 这代表着我们在给予创作自由方面达到了一个新的高度。人们将会创作出一些非常了不起的作品,也会有一些可能冒犯他人的内容;我们的目标是,除非用户有此需求,否则该工具不会生成冒犯性内容,即便有此需求,生成的内容也需在合理范围内。 正如我们在模型规格说明中提到的,我们认为将这种知识创作自由和控制权交到用户手中是正确的做法,但我们也会观察其发展情况并倾听社会的声音。 我们认为,尊重社会最终为人工智能设定的广泛界限是正确的做法,而且随着我们离通用人工智能越来越近,这一点也变得越来越重要。在此过程中,感谢大家的理解。 新图像模型简单介绍 根据直播介绍,非自回归生成是OpenAI新图像模型的核心之一,是提升图片质量、生成效率的关键技术。 传统的图像生成方法,尤其是基于自回归模型的技术,通常是通过逐步生成图像的每个像素或部分来构建最终的图像。这种方法虽然在某些情况下能够生成高质量的图像,但其生成过程往往较为缓慢,并且容易在生成过程中出现累积错误,导致最终图像的质量下降。 此外,自回归生成方法在处理复杂的图像结构时也存在一定局限性,因为它们需要在每一步生成过程中都依赖于之前生成的内容,这使得模型难以全局性地理解和优化图像的整体结构。 相比之下,非自回归生成模块采用了一种全新的思路。不再依赖于逐像素的生成过程,而是直接生成整个图像。这一过程的关键在于模型能够一次性地理解和处理图像的整体结构和细节。非自回归生成模块通过一种特殊的编码器-解码器架构来实现这一目标。 编码器负责将输入的文本描述或其他模态信息转化为一种中间表示,包含了生成图像所需的所有关键信息。然后,解码器利用这种中间表示直接生成完整的图像,而无需逐像素地构建图像。 这种直接生成完整图像的方式带来了很多优势。首先,非自回归生成模块的生成速度远远超过了传统的自回归方法。由于无需逐像素生成,模型能够在短时间内生成高质量的图像,这对于实时应用和大规模图像生成任务具有重要意义。例如,在需要快速生成大量图像的设计场景或教育场景中,非自回归生成模块能够显著提高工作效率。 此外,非自回归生成模块在生成图像的质量上也表现出色。由于模型能够一次性地理解和处理图像的整体结构,生成的图像在细节和一致性方面都得到了显著提升。 例如,在生成复杂场景的图像时,非自回归生成模块能够更好地处理图像中的多个对象及其相互关系,生成的图像更加自然和逼真。此外,非自回归生成模块还能够更好地处理文本指令中的复杂语义信息,生成与文本描述高度一致的图像。 非自回归生成模块的另一个重要特点是其在多模态融合中的应用。在ChatGPT 4.0模型中,非自回归生成模块不仅能够根据文本描述生成图像,还能够结合其他模态的信息,如音频或已有的图像,生成更加丰富和多样化的图像内容。 这种多模态融合的能力使得模型能够更好地理解和满足用户的需求。例如,用户可以提供一段音频描述和一张参考图像,非自回归生成模块能够结合这些信息生成一张符合音频描述且风格与参考图像一致的新图像。 从今天开始,新的文生图模型在ChatGPT和Sora中开始向所有Plus、Pro、Team和免费用户推出。面向企业版、教育版和API即将到来。 本文素材来源OpenAI,如有侵权请联系删除 END
谷歌地表最强模型深夜来袭!Gemini 2.5 Pro发布即屠榜,代码推理杀疯了
新智元报道 编辑:Aeneas 好困 【新智元导读】Gemini 2.5 Pro,刚刚深夜上线了!这个「思考」模型专为复杂任务打造,推理能力强大,一经诞生就横扫各大榜单、拿下各类TOP 1,还创下了历史上最大分数飞跃纪录。 就在刚刚,谷歌的全新模型Gemini 2.5 Pro,果然深夜上线了! Gemini 2.5 Pro是一个「思考」模型,能够在回应前先进行思考推理,从而提升性能,并改善准确性。 谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的Gemini的所有功能(长上下文、工具等)。 它在多个基准测试中达到了SOTA水平,并且以显著的优势在LMArena上排名第一。 现在,Gemini 2.5 Pro已经登顶了Arena排行榜的第一位,而且创下了历史最大分数飞跃,比Grok-3/GPT-4.5整整高出了40分! 在代号「nebula」的测试中,它也横扫所有类别夺得第一,并且独揽数学、创意写作、指令遵循、长查询和多轮对话五大领域的冠军! 在困难提示词和编程两大领域,它与Grok-3/GPT-4.5拿到了并列冠军,而且在所有其他比拼中都以微弱优势胜出,成功问鼎榜首! 此外,Gemini 2.5 Pro还成功登顶了视觉竞技场(Vision Arena)排行榜榜首! 在网页开发领域,它也同样大放异彩,成功斩获网页开发竞技场(WebDev Arena)亚军宝座! 它是首个实力媲美 Claude 3.5 Sonnet 的模型,相比之前版本的Gemini更是实现了质的飞跃。 这一次,谷歌的模型又展现出巨大的飞跃,OpenAI、Anthropic、DeepSeek等竞争对手,在多久时间内会赶上? 目前,Gemini 2.5 Pro已在Google AI Studio和Gemini应用中,向Gemini Advanced用户开放,并将很快在Vertex AI上推出。 而它的定价方案,会在未来几周内公布,用户可以在更高使用配额下,将模型应用于大规模生产环境。 网友实测后发现,它果然实力惊人,在所有模型中效果拔群,第一次尝试就只用几秒解决了一道难题。 Gemini 2.5 Pro上线! 谷歌表示,在AI领域,系统的「推理」能力不仅仅指分类和预测,而是指系统分析信息、得出逻辑结论、融入上下文和细微差别,以及做出明智决策的能力。 长期以来,谷歌一直在探索通过强化学习和思维链提示词等技术,让AI更智能、更具推理能力的方法。 正是在此基础上,他们在2月推出了第一个思考模型,Gemini 2.0 Flash Thinking。 而今天,通过Gemini 2.5,他们结合了显著增强的基础模型和改进的后期训练,让模型达到了新的性能水平。 推理和代码能力大幅提升 Gemini 2.5 Pro展现出了强大的推理和代码能力,在常见的编程、数学和科学基准测试中均处于领先地位。 另外,在各类需要高级推理能力的基准测试中,它都达到了SOTA水平。 无需使用测试阶段会增加计算成本的技术(如多数投票法),2.5 Pro就能在GPQA和 AIME 2025等数学和科学基准评测中表现卓越。 而且,在不使用任何外部工具的条件下,它就在挑战人类知识和推理能力的极限前沿「人类最后的考试」中取得了18.8%的准确率,达到业界领先。 在编程能力上,Gemini 2.5相比2.0版本也实现了质的飞跃,而这,仅仅是个开始。 2.5 Pro在创建视觉精美的网页应用和AI智能体代码应用方面都表现卓越,在代码转换和编辑领域中,也同样实力出色。 在智能体代码评估的行业标准测试SWE-Bench Verified上,Gemini 2.5 Pro靠使用自定义智能体配置,就获得了63.8%的优异成绩。 以下这波demo,就展示了Gemini 2.5 Pro如何运用强大推理,仅通过一行提示词,就能生成可执行代码,来创建完整的动画和游戏。 在下面这个demo中,仅仅根据下面这行prompt,它就生成了一段p5js的交互式动画,展示了「宇宙鱼」的场景,并且还显示了鱼们都在想什么。 它还根据以下prompt,生成了一个无限的恐龙跑酷游戏。 按照要求,它生成了像素化的恐龙图像和有趣的游戏背景。 随后,Gemini 2.5 Pro还通过编程实现了分形可视化。 它创建出了精细分形图案的模拟程序,展现出了神奇的曼德布洛特集合。 此外,它还能构建一个交互式气泡图,直观展示出了每个大陆的经济与健康指标随时间的变化。 或者用一段交互式的Javascript动画,展示了旋转六边形内多彩的人工生命群体,并且按要求做成了「超新星星云」的感觉。 另外,它还能开发粒子系统模拟,给出了一个HTML文件,创造出了反射星云的沉浸式交互模拟场景。 原生多模态和超长上下文 Gemini 2.5继承并发扬了Gemini 模型的优势——原生多模态能力和超长上下文长度。 自己发布之初,2.5 Pro就支持100万token的上下文窗口(而200万token也即将推出!),性能显著超越了前代模型。 这能让它理解海量数据集,并处理来自多种信息源的复杂问题,包括文本、音频、图像、视频,甚至完整的代码仓库。 最后,既然谷歌已经掏出了地表最强模型,接下来,就让我们坐等OpenAI的反应了。 参考资料: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking https://deepmind.google/technologies/gemini/pro/ https://x.com/lmarena_ai/status/1904581128746656099
3000亿逆袭3万亿!印度码农用云计算暴打苹果谷歌
2014年的微软总部弥漫着焦虑的气息,落地窗外西雅图的阴雨仿佛浸透了每个员工的衬衫。史蒂夫·鲍尔默最后一次以CEO身份走进董事会的脚步格外沉重,会议桌上的数据报表像一本黑色幽默小说:Windows系统市场份额持续流失,智能手机战场被苹果碾压,云计算领域落后亚马逊五年,股价在33美元徘徊了整整十年。曾有分析师刻薄地说:"微软就像博物馆里的恐龙骨架——壮观但毫无生气。" 在茶水间端着咖啡的萨蒂亚·纳德拉凝视着纸杯上的水渍,这个来自印度海得拉巴的工程师突然想起家乡的季风。儿时在板球场上的记忆涌上心头——当暴雨突袭时,真正的队长不会让队员躲雨,而是带领大家调整击球策略。47岁的他摸了摸西装口袋里的《薄伽梵歌》,推开董事会大门的瞬间,命运的齿轮开始转动。 上任第一周,纳德拉做了件震惊华尔街的事:在全员大会上公开放映iPhone广告。当库克的声音回荡在微软礼堂,前排高管们的脸色比窗外的乌云更阴沉。"我们要停止把世界看作Windows与苹果的对立战场,"他指着屏幕上流畅的iOS系统,"真正的战争在云端。"这句话如同板球棍击碎玻璃窗,飞溅的碎片划破了微软延续二十年的操作系统崇拜。 在比尔·盖茨私人办公室的深夜长谈中,两位技术先知用白板推演着云计算的未来。纳德拉用工程师的缜密计算出每个数据中心的边际成本,盖茨则用创业者的直觉勾勒出企业服务的生态闭环。"Azure不能只是追赶亚马逊的云存储,"盖茨用马克笔圈住白板上的流程图,"要成为数字时代的电力公司。"这个比喻让纳德拉想起海得拉巴老家的变压器——看不见却支撑着整个街区的生机。 转型的阵痛比预期更剧烈。当纳德拉宣布开放Office套件登陆iPad时,视窗部门主管当场摔门而去;提议收购领英时,财务总监拿着报表的手在发抖:"260亿买求职网站?这足够开发三代Windows系统!"但纳德拉在董事会上展示了令人震撼的数据可视化:领英每个用户的职业图谱都是潜在云服务客户,每份简历更新都在标记企业软件需求。这就像他年轻时痴迷的板球运动——真正的战略家能从击球手的挥棒轨迹预判球的落点。 2018年某个雨夜,微软研究院的地下实验室里,纳德拉抚摸着初代Surface电脑的金属外壳。突然响起的视频通话打断了他的沉思——OpenAI的阿尔特曼在屏幕那端兴奋地展示着GPT-3的雏形。两个技术狂人隔着12小时时区讨论到黎明,纳德拉的衬衫袖口沾满了白板笔的墨迹。当晨光穿透云层时,他签下了改变科技史的百亿美元投资协议,就像二十年前盖茨押注图形界面般决绝。 2020年的疫情黑天鹅成了微软的涅槃之火。当全球企业挣扎着搭建远程办公系统时,Teams视频会议的用户量以每分钟3000人的速度暴涨。纳德拉命令工程师们拆解了Xbox云游戏的代码架构,将其底层技术注入Azure服务器。"这就像用板球投球手法打棒球,"他在内部邮件中写道,"重要的是解决问题的核心逻辑,而不是形式。"十二个月内,微软云服务的市占率从17%飙升至31%,亚马逊AWS的城墙第一次出现裂痕。 收购动视暴雪的决定再次让华尔街哗然。680亿美元的天价背后,纳德拉在备忘录里写下一段诗意的话:"游戏世界里的每个虚拟化身,都是元宇宙的原始细胞。"当分析师质疑时,他展示了Xbox云平台与Azure的神经连接图谱——暴雪1.2亿月活用户的数据流,正在训练着下一代AI模型的认知能力。这让人想起他童年拆解收音机的执着:所有看似无关的零件,终将在某个电路板上共振。 2023年春天,纳德拉站在新落成的智能云园区顶楼,俯瞰着数据中心的蓝色光点如星河闪烁。他的西装口袋里依旧装着那本翻旧的《薄伽梵歌》,扉页上有句用梵文写的批注:"变革不是破坏,而是让旧元素在新维度重生。"此时的微软市值突破3万亿美元,Azure年收入超过500亿,但最让这位CEO自豪的,是开发者论坛里00后工程师的留言:"在微软生态里,我的代码能变成治愈罕见病的AI诊断模型。" 回望这场惊心动魄的转型,纳德拉在自传中揭示的不仅是商业智慧,更暗合熊彼特"创造性破坏"的经济学真谛。当传统路径依赖形成沉没成本陷阱时,真正的企业家会像量子跃迁般突破势垒。微软的故事证明:组织的生命力不在于现有资产的规模,而在于将技术资本、人力资本和愿景资本重新组合的勇气。就像纳德拉家乡的板球场——胜负从不取决于场地大小,而在于击球手能否在风向突变时,将劣势转化为独特的旋转弧线。
DeepSeek的一次小更新,堪比发布新模型
一个好消息,时隔俩月, DeepSeek 终于更新了。 就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。 模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。 根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。 现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。 不过有一说一,虽然 V3-0324 仅仅只是 V3 的小版本升级,并不是大伙儿期待已久的 V4 或者 R2 ,且官方账号也没有发布任何跟模型有关的信息。 但也丝毫不妨碍, V3-0324 一上线,就有人说他的代码能力,直追克劳德。 新版本的模型刚一上传,就登上了 Hugging Face 的趋势榜单。 在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。 图源 @karminski 牙医 重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。 所以在 V3-0324 上线不到一天的时间里,就已经有很多老哥迫不及待上手测评了一波。 这么说吧, V3-0324 在这些人手里,已经成了拳打 o3-mini ,脚踢 Claude 3.7 Sonnet 的存在。 经典的小球弹跳测试中,这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。 o3-mini 刚开始看着还不赖,但估计物理没学好,外面的六边形都转到垂直的位置了,球还不知道往下掉。 R1 的表现,也是有些让人摸不着头脑。。 相对来说, V3-0324 生成的结果是表现最好的,这位老哥丝毫不吝啬对它的夸奖,说它 “ 表现得像唯一排名第一的非推理模型 ” 。 让 V3-0324 生成一个网页,模型一口气写了 800 多行代码,运行的时候还没有出错,这什么实力不用多说了吧。 在评论区底下,有人仅仅下达了编写登录页面的简单指令,并没有任何其他的附加提示,同样也生成了一个完整的登录页面。 还说 V3-0324 在编码上,能跟 Claude 3.7 Sonnet 掰一掰手腕。 更别提其他的模型,性价比各方面相比下来,现在 OpenAI 的 o1-pro 和 GPT-4.5 ,都已经不香了。 反正看了几个网友的测试案例之后,世超对 V3-0324 的前端代码生成能力,已经有了初步的判断。 但不管咋说,没亲自上过手的东西,咱硬夸也有点心虚。所以这次世超也打算简单试一试,看看 V3-0324 到底有多能打。 一上来,世超就让模型做了一个画板,提示词是 “ 帮我用 HTML 代码构建一个画板,支持鼠标绘制、橡皮擦功能和颜色选择 ” ,这次出战的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。 只能说,这把 Claude 3.7 Sonnet 赢得很彻底。光是有取色器这一点,就甩了 V3-0324 不知道几个车尾灯。 更别提 UI 设计了, V3-0324 做出来的画板让世超不是很有创作的欲望。。。 世超着实是没想到,这盆凉水来得这么快,都让我有点怀疑到底是我的提示词没写好,还是模型有问题了。。。 不过,我后面又继续把小球弹跳的提示词,分别喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。 这下味儿终于对了。V3-0324 生成的结果确实牛叉,能很清楚地看到小球在下落触底的时候,产生了小幅度的弹跳。 就是吧,老版本的 V3 压根没运行起来。。。只能说两个版本之间的差距高下立判了。 再来看普通版 Claude 3.7 Sonnet 的结果,优点是底下的转速、重力和摩擦力都是可调节的,弹跳看起来也没什么大问题,但小球有点出画面了。。。 最后,世超又分别让 V3 和 V3-0324 生成一个 Saas 登录页面,提示词就一句话,没有任何的附加信息。 可以看到, V3 的页面倒是做出来了,但没什么设计可言。 反观 V3-0324 ,果然就跟官方的版本更新说明一样,生成的网页更美观了。 综合看下来, V3-0324 的代码能力相比 V3 确实有了比较大的提升,而且在一部分测试案例中,也能够比肩普通版 Claude 3.7 Sonnet 。 但如果要说完全超越 Claude 3.7 Sonnet ,那世超觉着暂时还不太行。 不过大伙儿也别忘了, V3-0324 在开源这个赛道里, V3-0324 已经算得上能打的了。 而且 DeepSeek 的 API 价格业主打的一个便宜。世超对比了 Claude 3.7 Sonnet 和 V3-0324 的 API 价格, V3-0324 百万 tokens 输入的价格是 2 元,百万 tokens 输出的价格是 8 元,而同样的 tokens 数, Claude 3.7 Sonnet 的输入和输出价格分别是 36.6 元和 108.9 元,价差最多有 18 倍。 所以在某种程度上, V3-0324 这个小更新,的确可以跟 Claude 3.7 Sonnet 媲美。 特别是今天晚上,DeepSeek官方还发文,正式介绍了这波小更新,在数学、代码类的相关评测上,V3-0324比OpenAI目前最厉害的非推理模型GPT-4.5都要更胜一筹。 去年 12 月底 V3 上线,紧接着 R1 就在过年的时候上桌吃饭了。如果按照 DeepSeek 之前发布模型的节奏,盲猜一波 R2 也快了。 总之,小版本更新的 V3-0324 就已经如此强悍了,就是不知道,在 DeepSeek 猛烈的开源炮弹下, “OpenAI 们 ” 还遭不遭得住了。 撰文:西西 编辑:江江&面线 美编:萱萱
增强版Sora生图模型发布:不仅能直接在ChatGPT用,还抢了梗图作者的饭碗
在 DeepSeek 24 小时前刚刚发布了 V3 模型 0324 版本更新之后,OpenAI 似乎真的有点「不甘示弱」的较劲感,在北京时间 3 月 26 日凌晨宣布了新产品的发布预告。 虽然在正式开始之前,有一些传言猜测本次有可能发布 GPT-5,但根据以往 OpenAI 的各种产品发布节奏来看,这次并不会是一次重磅更新,但本次直播中,发布的整合进 ChatGPT 中的新版 Sora,还是给大家带来的意料之外的「节目效果」。 目前,整合进 ChatGPT 中的 Sora,相比于独立应用版本,能力暂时被局限在了图像生成,但据 OpenAI 在直播中介绍,该模型比之前的模型有了质的飞跃。 据介绍,开发团队使用了GPT-4o「全模态」(或可以生成文本、图像、音频和视频等任何类型数据的模型)能力为基础,来开发这个版本的 Sora。因此用户可以直接说出自己的需求,甚至上传或者拍一张照片,作为提示词来使用。 比如直播现场的演示环节,就直接用手机给 Sam Altman 在内的三人来了张自拍,并要求 Sora 生成一张「动漫风格的版本」。 这还没完,他们三人甚至还现场演示了让 Sora 在图片上添加一段文本「Feel The AGI」(感受通用人工智能)。现场画了第一张新版 Sora 的表情包。 这个现场生成的表情包不仅文本准确清晰,并且准确理解了当代流行梗图中的包括粗体字等必备元素,已经能直接拿来当梗图发到各种群里了。 由于是 OpenAI 官方带头整活,评论区也有不少用户也被激发热情,尝试着把相同的提示词喂给 Grok,用相同的提示词和照片,生成同样风格的内容 ———— 但显然效果还是比新版 Sora 差了不少,反而带来了更喜感的效果。 除了带头画梗图,OpenAI 还演示了新版本 Sora 在文本渲染方面的改进,可以让在图像上生成没有拼写错误的连贯文本的成功率明显提升。 在另一个演示场景中,OpenAI 团队让 Sora 去生成一幅用于理解相对论的漫画卡片。 不同于以往生图模型中,在文本生成部分经常容易变得混乱不堪,甚至是「AI 造字」的情况发生,新版 Sora 其原生图像生成,生成的文本,已经没有任何明显错乱,甚至还在漫画生成了非常自然流畅的日文,意外的让日文社区的不少日本用户「炸锅」。 对于图片生成模型来讲,过去正确渲染文本是一个巨大的挑战。如果小标题或文本元素有拼写错误或错误,整个图像都可能变得无法使用。 此外在这个案例中,OpenAI 还演示了类似对相对论这样「世界上现有知识」的正确引用。 「如果我画一张图像,我会受到自身技能的限制……以及我积累的所有世界知识的限制,」 ChatGPT多模态产品负责人 Jackie Shannon 在接受媒体采访时解释这个功能的必要性。 「该模型将世界知识代入其中,因此当你要求生成牛顿棱镜实验的图像时,你无需解释「牛顿棱镜实验」这件事它本身是什么,就能得到准确的图像。」 除了上述这些直播中提到的模型能力改进,OpenAI 还表示新版 Sora 大幅提升了在属性和对象之间保持正确关系的能力。例如,绑定能力较差的模型可能会将要求生成蓝色星星和红色三角形的提示词,生成为红色星星而没有三角形。 据 OpenAI 介绍,现有的大多数图像模型在这方面都很容易「犯错」,尤其是当被要求渲染多个项目(通常在5到8个左右)时,经常会混淆颜色和形状。而新版 Sora 的图像生成功能,可以正确绑定15到20个对象的属性,在理解各自的复杂需求的同时,保证不会被误导,从而大幅提高成功率。 除了这些使用体验上的改进,还有一个细节是,OpenAI 已经确认,新版 Sora 生成图像的时间比以前更长,但 OpenAI 认为这是一个值得的权衡。 「虽然我们在延迟方面肯定还有改进的空间……但(我们觉得)这些生成图片的质量、功能和世界知识,确实弥补了用户需要等待的额外几秒钟,」Shannon说。 至于生图领域的安全问题 —— 从去年到今年已经出现多次伪造名人不雅图像、热点事件虚假图像,以及 Google Gemini 去除照片原水印这样的问题,OpenAI 团队强调新版 Sora 已经可以去除照片水印,同时阻止生成性深度伪造图像,并拒绝生成相关的内容请求。同时所有生成的图像都将包含标准的C2PA元数据,以标记该图像是由OpenAI创建的。 目前,新版集成在 ChatGPT 内的 Sora 图像生成模型功能,已经开放给 Pro 和 Plus 订阅套餐的用户,并且 OpenAI 承诺,新版 Sora 也会在不久的将来,提供给免费版本和 API。 现在我最想做的,就是立即让它帮我画自己的梗图了。
别让大模型想太多了,过度思考会影响性能
加州大学伯克利分校、苏黎世联邦理工学院等多所高校的研究人员,深入剖析了大模型在执行Agent任务时面临的困境 ——过度思考。 为了量化这种行为,研究人员开发了一套系统评估框架,并通过4018条轨迹分析发现,高推理努力配置的模型虽然解决了29.1%的问题,但成本高达1400美元;而低推理努力配置则以3.5倍更低的成本达到了21.0%的成功率。 此外,生成两个低推理解决方案并选择其中一个具有较低过度思考得分的方法,实现了27.3%的解决率,同时减少了43%的计算成本。这表明减轻过度思考不仅提高了推理效率,还显著降低了成本。 开源地址:https://github.com/AlexCuadron/ThinkingAgent 过度思考是指,大模型过度依赖内部推理,而忽视了从环境中获取或整合关键反馈的倾向。即使在资源不受限制的情况下,这种过度依赖内部推理的模型仍然会受到其不完整或不准确的世界模型的限制,从而导致错误的累积和决策能力的下降。 为了深入研究这种现象,研究人员通过分析智能体与环境之间的交互过程,识别出三种过度思考的典型表现模式。 首先是“分析瘫痪”(Analysis Paralysis),在这种情况下,模型过度专注于未来的规划,而忽视了当前环境中的实际进展。它们会生成越来越复杂的行动序列,但却难以系统地执行这些计划,从而陷入无休止的规划循环中。 其次是“鲁莽行动”(Rogue Actions),在这种模式下,模型在面对错误时会尝试同时执行多个相互依赖的行动,而没有等待环境对前一个行动的反馈,模型试图用内部模拟来替代真实的环境反馈。 最后是“过早脱离”(PrematureDisengagement),在这种情况下,模型基于内部对问题空间的模拟而终止任务,而不是根据环境反馈来验证解决方案的有效性。这种过度依赖内部推理的行为可能导致模型在没有验证的情况下就放弃任务,或者错误地认为问题无法解决。 为了量化过度思考行为,研究团队开发了一种系统化的评分方法,使用大模型作为评判标准。该方法通过分析模型轨迹,识别出上述三种过度思考模式,并给出0到10分的评分,分数越高表示过度思考越严重。每个评分都附有详细的理由,解释所识别的模式及其严重程度。完整的评估提示和评分标准可以在附录A中找到。 为了验证自动化评估方法的可靠性,研究人员邀请了四位专家手动评定了20个随机选择的模型轨迹。通过标准化评分,研究团队进行了全面的统计分析,探究过度思考行为与模型性能的关系,以及过度思考对推理模型和非推理模型的不同影响。 结果显示,推理模型的过度思考得分显著高于非推理模型,且两者之间的相关性非常强,证实了自动评估方法的可靠性。 此外,研究团队设计了一个系统化评估轨迹的提示,避免使用“过度思考”一词以防止模型偏向自身定义。该提示围绕过度思考的三种表现形式展开,即分析瘫痪、鲁莽行为和过早脱离,并强调偏好内部推理链而非环境互动。 评分系统分为三档:0-3分表示适当的环境互动,4-7分表示偶尔过度依赖内部推理,8-10分则表示完全脱离环境反馈。 通过提供具体的例子,如模型得0分时会持续重试类似配置并在每次尝试间等待反馈,而得10分时会生成多个互依动作而不等待环境响应,或基于内部推理提前结束任务,确保评分标准的透明和一致。 实验结果表明,过度思考评分与任务解决率呈现出显著的负相关性。推理模型的过度思考评分越高,其在软件工程任务中的表现越差。这一趋势在非推理模型中也得到了体现,但其下降速度更快。例如,推理模型的趋势线斜率为-7.894,而非推理模型的趋势线斜率达到了-15.938。 在模型类型与过度思考的关系方面,作者们发现推理模型的过度思考倾向明显高于非推理模型。实验数据显示,推理模型的平均过度思考评分为3.505,而非推理模型的平均评分为2.228。这种倾向可能是由于推理模型在训练过程中被优化为生成更长的推理链,从而在面对需要频繁与环境互动的任务时,表现出更高的过度思考倾向。 此外,还研究了模型规模对过度思考的影响。实验结果表明,模型规模与过度思考评分之间存在负相关性。较小的模型,如7B和14B参数的模型在交互式任务中表现出更高的过度思考倾向,而较大的模型如671B参数的模型则相对较低。这一现象可能与模型的复杂性和对环境反馈的处理能力有关。
59元起!小米偷偷上架这新品,一个比一个离谱
下一波新机,基本都定在下个月了... 闲暇之余,我们就去 “ 小米百货 ” 逛逛吧,看看有什么好玩的新品~ 首先,就是小米最近偷偷众筹的 MIJIA 智能音频眼镜 2 ! 想不到吧?小米还卖这种东西,而且还出到了第二代。 其实之前果子路过小米之家就挺想去试试一代的,但每次店里的摆放的样机都没电,以至于果子还没真正体验过 MIJIA 的智能音频眼镜... 不过据买过的小伙伴说,体验还不错,这次二代可以的话果子也整一个。 外观上最明显的,就是二代的镜腿相比上代大幅优化... 在最细处的前端跟最宽处的后端尺寸分别减少了 26% 跟 30% ! 更轻巧的重量跟更合理的重心分配,使得二代在佩戴舒适感上进一步增强。 然后弹性更好更持久的「琴钢超弹铰链」、疏水性更好的 105° 高水滴角设计跟质感更好的 NCVM 纳米真空镀膜工艺... 细节上,MIJIA 智能音频眼镜 2 跟普通眼镜越来越接近了~ 再提供 5 款不同风格的镜框,辅以 “ 单手就能秒换镜框 ” 的「第二代快拆技术」! 基本能满足绝大部分小伙伴的场合跟款式需求了吧? 功能上... MIJIA 智能音频眼镜 2 不仅新增了上代没有的现场、线上会议、通话、音视频录音(无需手机)! 音质跟降噪这块也进一步得到了增强,上代漏音的情况也有所了改善。 而且录音的时候眼镜是会有亮灯提醒,隐私保护好评~ 最后比上代续航更长的 12 小时音乐播放时间(1小时充满)、IP54 防尘防水、语音就能唤醒设备端小爱同学的 MIJIA 智能音频眼镜 2 价格是: 1199 元(众筹 999 元) 这个价格你们觉得怎么样? 果子是觉得这代升级挺大的,更好的音质、更强的续航、更多的功能... 关键是更接近普通眼镜的设计跟佩戴体验,在可用度上要好上不少~ 然后就是可能每家都有的小米插座... 他们新出了一个轨道插座,看着蛮有意思的~ 它采用长条的轨道式设计,可以按自己的需求自由增减插座: 用的时候呢,插上去即可;不用的时候呢,可以取下来! 如果像电饭煲、微波炉等位置常驻电器,插头不取下来也行,因为插头有内外圈分离的断电设计... 只要旋转外圈就能控制通电/断电,进而减少线缆插拔,方便不少~ 关键是它还能自由换位这你们受得了吗? 针对安全性,轨道基座还有 “ 自回弹关闭式保护门 ” 设计! 取下插座后保护门会自动回弹关闭,避免猫猫狗狗小孩伸手进去误触。 T 型结构设计,就算是金属物品误入轨道开口也没有触电风险。 最后 8000W 总功率,单个插头 2500W ... 有 50cm 3 插座、75cm 4 插座、100cm 5 插座,黑白两色可选: 大家可以根据场景布局、用电需求选择自己合适的尺寸。 299 元起(众筹 289 元起) 这个价格你们觉得怎么样? 然后插座的话也有单个卖... 59 元 但单独不能使用,必须得配合那个轨道基座。 不得不说这设计是真的好看~ 说到好看,小米还推出了个米家隐藏式智能窗帘! 之所以叫 “ 隐藏式 ” ,是因为整个设计的特别小。 5.5cm 的高度,半掌大小... 因此它能被藏进大部分顶装设计的窗帘盒。 功能这块的话,支持窗帘三档开合调速!你也可以选择手拉或让窗帘自适应控速。 就连开合行程、开合比例都能精准自定义! 在接入米家 App 控制后,手机控制、定时开合,配合 WiFi 模块,实现进/离家门自动开合等等...... 什么小爱同学语音控制、电视无线遥控器也算是米家生态基操了~ 最后 1.5N・m 扭矩,低于 30dB(A)的运行噪音,最大 50Kg 的帘布驱动重量,满足多种直轨安装... 599 元(国补 509 元) 这个价格你们觉得怎么样? 果子初略看了下,包含一次上门安装服务,拼接式的轨道设计,是不用上门测量、定制的,只要一次上门就能完成安装跟拆旧... 这点还是不错的~ 总体看下来果子好像也就那个 MIJIA 智能音频眼镜 2 能买的,另外两个的话问就是果子现在所处的出租房基本用不到也不好搞。 等哪天有属于自己的房子再捣鼓吧,不说了都是泪,果子接着搬砖了。 参考资料: 小米众筹 小米商城 编辑:Unicorn
中国AI没有泡沫,比起资本开支,更需要风险投资
美国对算力的投资过于激进,中国企业对算力的投资仍在务实增长,并为AI应用留足了空间。现在,只缺风险资金推中国AI应用一把了。 美国巨头砸在算力上的资本开支,一年或超4000亿美元;中国互联网巨头加上三大运营商,一年或在650亿美元左右,相差6倍。美国初创企业获得的风险投资约为760亿美元,是中国的140亿美元的4倍。似乎相比资本开支,中国与美国在风险资本上的差距还小点;但是,中国正在提供更高性价比的算力,亟待AI应用爆发,更需要初创企业的大爆发。 今天,在香港举行的汇丰全球投资峰会上,阿里巴巴董事长蔡崇信对全球数据中心建设中可能形成的泡沫发出了警告。结果,被标题党渲染为“数据中心泡沫”,吓了市场一跳。明明阿里巴巴刚刚承诺未来三年内投入过去十年的资本开支,超过520亿美元。 很快媒体逐步还原现场。原来,他讲的是全球范围内很多企业或基金,在没有取得全球云巨头等潜在用户的使用协议前,就筹集数十亿美元投机建设数据中心;美国许多数据中心投资公告存在“重复”或“相互重叠”的现象。 “我仍然对美国在人工智能投资方面所提到的那些数字感到震惊。”蔡崇信说,人们居然真的在谈论数千亿美元这样的数字。他指的是美国巨头将在今年投入至少3200亿美元的资本开支。其中,亚马逊1000亿美元,微软800亿美元,谷歌750亿美元,Meta约650亿美元。这还没算上OpenAI联合软银、甲骨文,准备未来几年向星际之门投入5000亿美元,初期1000亿美元。 事实上,微软早已转向谨慎。美国投行TD Cowen就发现微软正在退租数据中心;纳德拉有点反感市场上那些动辄AGI的过度炒作,倒是非常关注微软的推理收入。 中国正在开启第二波算力资本开支的增长,务实稳健。互联网巨头仍在追逐前沿模型训练,并为旗下应用推理需求爆发做准备;三大电信运营商承担了“东数西算”战略基建重任,算力开支继续两位数增长,并承诺对推理需求的投资不设上限。 阿里巴巴未来3年至少3800亿元人民币,约合520亿美元,平均每年170亿美元;字节跳动的资本开支,缺乏官方披露信息,市场推测约为200亿美元;腾讯去年四季度资本支持大幅跃升,超过2023年全年,明年将进一步增长,预计占收入低十几百分点,或在150亿美元左右。即,三家科技巨头明年资本开支合计约520亿美元。 由于5G基建大潮基本过去,八大算力枢纽基建前几年保持“适度超前”,三大运营商明年资本开支整体微降。但是,在支出结构上,算力占比相反明显提升。 中国移动预计2025年资本开支下降2.5%,但算力支出为373亿元人民币,增长0.5%;中国联通预计2025年资本开支约下降10%,但算力投资同比增长28%;中国电信预计2025年资本开支下滑10%,但算力相关开支增长22%。目前,算力相关业务在中国联通归入算网数智类,规模约为141亿人民币;在中国电信归入产业数字化业务,规模约317亿元。粗略估算,三家运营商明年算力相关资本开支合计约130亿美元。 但是,无论是腾讯,还是三大运营商,无一例外都强调了对推理需求预留了充分的调节空间。腾讯高管在财报电话会议上补充说,现在他们提供的只是当前的预期,而市场是非常动态的,腾讯也将“保持高度灵活性和动态响应能力”,如果需求激增,肯定会追加订单。三大运营商的表述相当统一,对推理资源需求的投资“不设上限”。 中国与美国的大模型及其应用,仍然处于不同的商业化路径上。中国企业基于开源策略,大模型商品化趋势明显,关键在于用低成本的算力培育出高体验的AI应用。阿里巴巴Qwen和DeepSeek正在持续开源,为全球提供训练与推理算力性价比更高的选择。腾讯认为“”中国公司普遍优先考虑效率和GPU服务器的高效利用”,并认为这并不一定会影响技术的最终效果。而以OpenAI为代表的美国企业,为避免被卷入价格战,将继续加大投入,维持闭源模型在一段时间内的溢价能力。 美国的风险在于,闭源模型能够维持的优势期越来越短;中国的风险在于,AI应用层面的初创企业不够活跃。根据CBInsights的统计,最近两年,美国初创企业获得的风险投资资金分别为400亿美元与760亿美元;而据清科研究中心的统计,中国企业获得的融资规模分别是105亿美元与140亿美元。无论是在金额上,还是增速上,中国创业激情仍然没有美国强烈。 未来,越来越多的初创企业会围绕AI开展业务。在这个意义上,中国的风险投资更需要大步赶上。据PitchBook统计,在2024年第四季度,全球风险投资资金超过1半的金额投向了AI相关初创企业,几乎是2023年同期的两倍。 启明创投创始主管合伙人邝子平相信,全球投资人希望到中国投资AI的呼声,在未来几年会越来越高。近日,他在中国发展高层论坛表示,中国的AI市场潜力巨大,中国的AI人才库具有全球竞争力,中国的AI产业存在巨大投资缺口;而中国在投资准入方面,包括AI,近年来越来越开放。 几乎所有人都已经相信,2025年是AI应用爆发的一年。中国与美国在AI领域的竞争,将从大模型领域蔓延至AI应用领域。相比资本开支,风险投资也需要扮演越来越重要的角色。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。