行业分类:
加载中...
头条分类:
加载中...
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
【新智元导读】科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。 AI接管人类电脑,就是下一个未来! 几天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光标完成复杂任务,足以惊掉下巴。 刚刚,Information独家爆料称,谷歌正开发同类新项目「Project Jarvis」,能将Chrome网页任务自动化。 谷歌「贾维斯」将由未来版Gemini 2.0驱动,预计在12月亮相。 起这个名字,是为了向钢铁侠中的J.A.R.V.I.S致敬。 无独有偶,微软团队悄悄放出的OmniParser,也在笃定AI智能体操控屏幕的未来。 论文地址:https://arxiv.org/pdf/2408.00203 OmniParser主要是一个屏幕解析的工具,可以将截图转化为结构化数据,帮助AI精准理解用户意图。 不仅如此,OpenAI内部已有了AI智能体雏形,可以操控计算机完成在线订餐、自动查询解决编程难题等任务。 包括苹果在内,预计在明年发布跨多个APP屏幕识别能力。最新迭代的Ferret-UI 2,就是通用UI模型。 可见,「Computer use」已经成为科技大厂们,重点发力的下一个战场。 谷歌「贾维斯」年底出世,最强Gemini 2加持 代号为Jarvis Project项目,本质上是一个大动作模型(LAM),也是谷歌一直以来在做的大模型方向。 它专门针对谷歌Chrome浏览器,进行了优化。 具体操作原理,与Claude 3.5类似,通过截屏、解析屏幕内容,然后自动点击按钮,或输入文本,最终帮助人们完成基于网页的日常任务。 不论是收集研究信息、购物,或是预定航班等任务,谷歌「贾维斯」均可实现。 不过,它在执行不同操作时,中间会有几秒钟的思考时间。 因此,在终端设备中运行还不太现实,仍然需要云上操作。 5月的谷歌I/O大会上,谷歌CEO劈柴曾展示了,Gemini和Chrome如何协同工作的样貌。 如前所述,谷歌「贾维斯」将由Gemini 2.0加持,也就意味着年底我们可以看到进步版Gemini模型。 尽管Sam Altman否认了Orion模型的发布,但外媒猜测,预计年底OpenAI也将放出新核弹 微软OmniParser也下场了 紧接着Claude「计算机使用」发布之后,微软就开源了AI框架OmniParser。 假设你想要去布赖斯峡谷国家公园,不知是否需要订票入园,这时OmniParser可以带你查询。 它会解析屏幕后,自动点击「permits」按钮,然后再截屏找到「布赖斯峡谷国家公园」,最后就可以完成用户任务。 可见,想要把类似GPT-4V的多模态大模型应用于操作系统上,模型还需要具备强大的屏幕解析能力,主要包括两方面: 1、准确地识别用户界面中的可交互图标; 2、理解屏幕截图中各种元素的语义,并准确将预期动作与屏幕上的相应区域关联起来。 基于上述思路,微软最新提出的OmniParser模型,可以将用户界面截图解析为结构化元素,显著增强了GPT-4V在对应界面区域预测行动的能力。 方法 一个复杂的操作任务通常可以分解成多个子行动步骤,在执行过程中,模型需要具备以下能力: 1、理解当前步骤的用户界面,即分析屏幕内容中大体上在展示什么、检测到的图标功能是什么等; 2、预测当前屏幕上的下一个动作,来帮助完成整个任务。 研究人员发现,将这两个目标分解开,比如在屏幕解析阶段只提取语义信息等,可以减轻GPT-4V的负担;模型也能够从解析后的屏幕中利用更多信息,动作预测准确率更高。 因此,OmniParser结合了微调后的可交互图标检测模型、微调后的图标描述模型以及光学字符识别(OCR)模块的输出,可以生成用户界面的结构化表示,类似于文档对象模型(DOM),以及一个叠加潜在可交互元素边界框的屏幕截图。 可交互区域检测(Interactable Region Detection) 从用户界面屏幕中识别出「可交互区域」非常关键,也是预测下一步行动来完成用户任务的基础。 研究人员并没有直接提示GPT-4V来预测屏幕中操作范围的xy坐标值,而是遵循先前的工作,使用标记集合方法在用户界面截图上叠加可交互图标的边界框,并要求GPT-4V生成要执行动作的边界框ID。 为了提高准确性,研究人员构造了一个用于可交互图标检测的微调数据集,包含6.7万个不重复的屏幕截图,其中所有图像都使用从DOM树派生的可交互图标的边界框进行标记。 为了构造数据集,研究人员首先从网络上公开可用的网址中提取了10万个均匀样本,并从每个URL的DOM树中收集网页的可交互区域的边界框。 除了可交互区域检测,还引有一个OCR模块来提取文本的边界框。 然后合并OCR检测模块和图标检测模块的边界框,同时移除重叠度很高的框(阈值为重叠超过90%)。 对于每个边界框,使用一个简单的算法在边框旁边标记一个ID,以最小化数字标签和其他边界框之间的重叠。 整合功能的局部语义(Incorporating Local Semantics of Functionality) 研究人员发现,在很多情况下,如果仅输入叠加了边界框和相关ID的用户界面截图可能会对GPT-4V造成误导,这种局限性可能源于GPT-4V无法「同时」执行「识别图标的语义信息」和「预测特定图标框上的下一个动作」的复合任务。 为了解决这个问题,研究人员将功能局部语义整合到提示中,即对于可交互区域检测模型检测到的图标,使用一个微调过的模型为图标生成功能描述;对于文本框,使用检测到的文本及其标签。 然而,目前还没有专门为用户界面图标描述而训练的公共模型,但这类模型非常适合目标场景,即能够为用户界面截图提供快速准确的局部语义。 研究人员使用GPT-4o构造了一个包含7000对「图标-描述」的数据集,并在数据集上微调了一个BLIP-v2模型,结果也证明了该模型在描述常见应用图标时更加可靠。 实验评估 SeeAssign任务 为了测试GPT-4V模型正确预测边界框描述所对应的标签ID的能力,研究人员手工制作了一个名为SeeAssign的数据集,其中包含了来自3个不同平台(移动设备、桌面电脑和网络浏览器)的112个任务样本,每个样本都包括一段简洁的任务描述和一个屏幕截图。 根据难度,任务被分为三类:简单(少于10个边界框)、中等(10-40个边界框)和困难(超过40个边界框)。 GPT-4V不带局部语义的提示: Here is a UI screenshot image with bounding boxes and corresponding labeled ID overlayed on top of it, your task is {task}. Which icon box label you should operate on? Give a brief analysis, then put your answer in the format of ‘‘‘ Box with label ID: [xx]‘‘‘ 带局部语义的提示: Here is a UI screenshot image with bounding boxes and corresponding labeled ID overlayed on top of it, and here is a list of icon/text box description: {parsed_local_semantics}. Your task is {task}. Which bounding box label you should operate on? Give a brief analysis, then put your answer in the format of ‘‘‘Box with label ID: [xx]‘‘‘ 从结果来看,GPT-4V经常错误地将数字ID分配给表格,特别是当屏幕上有很多边界框时;通过添加包括框内文本和检测到的图标的简短描述在内的局部语义,GPT-4V正确分配图标的能力从0.705提高到0.938 ScreenSpot评估 ScreenSpot数据集是一个基准测试数据集,包含了来自移动设备(iOS、Android)、桌面电脑(macOS、Windows)和网络平台的600多个界面截图,其中任务指令是人工创建的,以确保每个指令都对应用户界面屏幕上的一个可操作元素。 结果显示,在三个不同的平台上,OmniParser显著提高了GPT-4V的基线性能,甚至超过了专门在图形用户界面(GUI)数据集上微调过的模型,包括SeeClick、CogAgent和Fuyu,并且超出的幅度很大。 还可以注意到,加入局部语义(表中的OmniParser w. LS)可以进一步提高整体性能,即在文本格式中加入用户界面截图的局部语义(OCR文本和图标边界框的描述),可以帮助GPT-4V准确识别要操作的正确元素。 Mind2Web评估 测试集中有3种不同类型的任务:跨领域、跨网站和跨任务,可以测试OmniParser在网页导航场景中的辅助能力。 结果显示,即使没有使用网页的HTML信息,OmniParser也能大幅提高智能体的性能,甚至超过了一些使用HTML信息的模型,表明通过解析屏幕截图提供的语义信息非常有用,特别是在处理跨网站和跨领域任务时,模型的表现尤为出色。 AITW评估 研究人员还在移动设备导航基准测试AITW上对OmniParser进行了评估,测试包含3万条指令和71.5万条轨迹。 结果显示,用自己微调的模型替换了原有的IconNet模型,并加入了图标功能的局部语义信息后,OmniParser在大多数子类别中的表现都有了显著提升,整体得分也比之前最好的GPT-4V智能体提高了4.7%。 这表明了,模型能够很好地理解和处理移动设备上的用户界面,即使在没有额外训练数据的情况下也能表现出色。 参考资料: https://microsoft.github.io/OmniParser/ https://x.com/Prashant_1722/status/1850265364158124192
OpenAI语音转录工具被曝严重幻觉:转录100小时,一半儿在瞎扯
OpenAI的AI语音转写工具,那个号称近乎“人类水平”的Whisper,被曝幻觉严重—— 100多小时转录,被工程师发现约一半都在瞎扯。 更严重的是,美联社还爆料有医疗机构利用Whisper来转录医生与患者的会诊,瞬间引发大量网友关注。 据悉,明尼苏达州的曼卡托诊所和洛杉矶儿童医院在内的超过30000名临床医生和40个卫生系统已开始使用法国AI诊疗公司Nabla基于Whisper打造的工具。 而且他们已经转录了大概700万次医疗就诊。 网友纷纷表示这就有点吓人了。 值得一提的是,OpenAI之前早就警告过,该工具不应在“高风险领域”中使用。 针对最新爆料,有OpenAI发言人回应,OpenAI会在模型更新中加入相应的反馈机制。 OpenAI被督促赶紧解决此问题 Whisper是OpenAI老早前推出的开源自动语音识别(ASR)系统,于2022年9月发布。 它采用简单的端到端方式,基于编码器-解码器Transformer架构。输入音频将被分成30秒的块,转化为梅尔倒谱(音频特征提取方式之一,log-Mel spectrogram),然后传入编码器。 经过68万小时的多语言和多任务监督网络数据的训练,Whisper可以进行多语言转录。 Whisper推出后得到广泛应用,如今GitHub已揽获70.2k标星: 据悉,它还被集成在ChatGPT的一些版本中,同时也是Oracle和微软云计算平台的一项内置服务,而这些平台为全球数千家公司提供服务。 此外,仅在上个月,HuggingFace上的一个最新版本Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi表示,Whisper是最受欢迎的开源语音识别模型。 而现在,据美联社报道,很多研究人员和工程师反映,在工作中他们经常遇到Whisper产生的幻觉。 例如,密歇根大学的一位研究员在尝试改进模型之前,发现其检查的每10份音频转录中有8份出现了幻觉。 一位机器学习工程师指出,在他分析的超过100小时Whisper转录中,大约一半出现了幻觉。 还有一位开发者表示,在他使用Whisper创建的26,000份转录中,几乎每一份都发现了幻觉。 …… 这种问题甚至存在于录制良好的短音频样本中。 在最近的一项研究中,计算机科学家们在审查的超过13000个清晰音频片段中发现了187个幻觉。 工程师和研究人员表示,他们从未见过其它任何AI驱动的转录工具像Whisper这样频繁地产生幻觉。 Whisper幻觉严重的原因目前尚未可知,但有软件开发者表示,这些虚构内容往往发生在停顿、有背景声音或音乐播放时。 之前,OpenAI就有提醒: 不要在决策情境中使用Whisper,准确性上的缺陷可能导致结果出现明显偏差。 然鹅,美联社表示,这一警告并未阻止一些医院或医疗中心使用Whisper等语音转文字模型—— 包括明尼苏达州的曼卡托诊所和洛杉矶儿童医院在内,已经有超30000名临床医生和40个医疗系统已经开始使用由Nabla公司基于Whisper开发的工具。 Nabla CTO Martin Raison称,该工具针对医疗语言对模型进行了微调,用于转录和总结患者的交流。 目前,该工具已被用于转录约700万次医疗就诊。 在得知Whisper可能会产生幻觉后,Nabla表示正在解决此问题,不过: 由于“数据安全原因”,Nabla的工具会删除原始音频,无法将Nabla生成的AI文本与原始录音进行比较。 此外,据了解,Whisper还被用来为聋人和听力障碍者创建字幕。 Whisper幻觉严重问题被发现后,有人敦促OpenAI赶紧解决此问题。 今年2月离开OpenAI的研究员William Saunders也开麦了: 如果公司愿意优先考虑,这似乎是可以解决的。如果你把它放出去,人们过于自信于它的功能,并将其集成到所有这些其他系统中,那就成了问题。 有OpenAI发言人回应称,公司持续研究如何减少幻觉现象,并感谢研究人员的发现,同时补充道OpenAI会在模型更新中融入相应反馈机制。 参考链接: [1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14 [2]https://x.com/AP/status/1850150400424345858 — 完 —
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
【新智元导读】AI评估AI可靠吗?来自Meta、KAUST团队的最新研究中,提出了Agent-as-a-Judge框架,证实了智能体系统能够以类人的方式评估。它不仅减少97%成本和时间,还提供丰富的中间反馈。 AI智能体,能否像人类一样有效地评估其他AI智能体? 对于AI智能体来说,评估决策路径一直是棘手的问题。 已有的评估方法,要么只关注结果,要么要要过多的人工完成。 为了解决这一问题,田渊栋、Jürgen Schmidhuber带领的团队提出了「Agent-as-a-Judge」框架。 简言之,让智能体来评估智能体系统,让AI审AI。 它不仅可以减少97%的成本和时间,还能提供丰富的中间反馈。 这是「LLM-as-a-Judge」框架的有机延伸,通过融入智能体特性,能够为整个任务解决过程提供中间反馈。 论文地址:https://arxiv.org/abs/2410.10934v1 研究人员提出了DevAI基准,为全新框架提供概念验证测试平台。包含55个真实的AI开发任务,带有详细的手动注释。 通过对三个领先的智能体系统进行基准测试,发现它大大优于「LLM-as-a-Judge」框架。 总之,这项研究真正的变革之处在于:它提供了可靠的奖励信号,为可扩展的、自我改进的智能体系统铺平了道路。 「法官」智能体,击败大模型 现有评估方法,无法为智能体系统的中间任务解决阶段,提供足够的反馈。 另一方面,通过人工进行更好的评估,代价太大。 而智能体系统的思考方式,更像人类,通常是逐步完成,并且在内部经常使用类人的符号通信来解决问题。 因此,智能体也能够提供丰富的反馈,并关注完整的思考和行动轨迹。 「Agent-as-a-Judge」不仅保留了「LLM-as-a-Judge」成本效益,还具备智能体特性,使其在整个过程中提供中间反馈。 下图展示了,大模型、智能体、人类作为评判者的示意图。 DevAI:自动化AI开发数据集 另外,在代码生成领域,基准测试的发展也落后于智能体系统的快速进步。 比如,HumanEval仅关注算法问题,而MBPP则处理简单的编程任务,但这两者都没有反映出开发者面临的最实际的挑战。 作为一个改进,SWE-Bench基准确实引入了GitHub现实问题,提供一种全新评估的方法。 不过,它仍需要关注自动修复任务的开发过程。 为了解决当前代码生成基准测试中的上述问题,研究人员引入了DevAI:AI开发者数据集,其中包含55个由专家注释者创建的真实世界综合AI应用开发任务。 DevAI结构是这样的:智能体系统首先接收用户查询以开始开发,然后根据AI系统满足需求的程度来评估它,其中偏好作为可选的、较为柔性的标准。 图3展示了DevAI任务的一个例子。 DevAI中的任务规模相对较小,但涵盖了常用的关键开发技术。 如图2所示,任务被标记并覆盖了AI的多个关键领域:监督学习、强化学习、计算机视觉、自然语言处理、生成模型等。 每个任务都是,可能交给研究工程师的真实世界问题,并降低了在这个基准上评估方法的计算成本。 接下来,研究人员将领先的开源代码生成智能体框架,应用于DevAI中的任务:MetaGPT、GPT-Pilot、OpenHands。 他们让人类评判者、大模型评判者、以及智能体评判者框架,来评估其性能。 结果如表1所示,MetaGPT最具成本效益(1.19美元),而OpenHands是最昂贵的(6.38美元)。 从开发时间来看,OpenHands完成任务平均耗时362.41秒,而GPT-Pilot耗时最长,为1622.38秒。 平均而言,使用这三者之一对DevAI进行完整评估,大约需要210.65美元和14小时才能完成。 Human-as-a-Juge:DevAI手动评估 为了确定DevAI的实用有效性,并准确估计当前最先进的智能体系统实际代码生成能力,研究人员手动评估三个AI开发者基线在DevAI中的应用。 如表2所示,(I)和(D)代表独立性能与考虑任务依赖性的性能。 表示多个专家的进化,并且意味着评估使用白盒测试(允许访问生成的workspace、人类收集的轨迹和开源代码库)。 两种性能最好的方法(GPT-Pilot和OpenHands)可以满足大约29%的要求,但只有一项任务可以满足所有要求。 另外,在三位人类评估者之间,他们的个人评估存在大量分歧,说明了单一人类评估的不可靠性。 下图5总结了人类评估和共识评估的不匹配度。 𝗔𝗴𝗲𝗻𝘁-𝗮𝘀-𝗮-𝗝𝘂𝗱𝗴𝗲:智能体评估智能体 根据以往智能体设计的经验,并通过模仿人类评估过程,研究人员涉及了8个模块化交互组件,具体包括: 1 图像模块:构建一个图像,获取项目整个结构,包括文件、模块、依赖项,还可以将代码块分解为代码片段 2 定位模块:识别需求所引用的特定文件夹/文件 3 读取模块:超越了简单的文件解析,支持跨33种不同格式的多模态数据的读取和理解 4 搜索模块:提供了对代码的上下文理解,并且可以快速检索高度相关的代码片段,以及其背后细微差别 5 检索模块:从上下文中提取信息,识别轨迹中相关片段 6 查询模块:确定是否满足给定要求 7 记忆模块:存储历史判断信息,允许智能体基于过去记忆评估 8 规划模块:允许智能体根据当前状态和项目目标制定策略,并排序任务。 具体操作流程,如下图9所示。 下表3展示了,Agent-as-a-Judge在各项任务中始终优于 LLM-as-a-Judge,特别是在那些训在任务依赖关系的情况下。 评判开发者智能体,是一项类别不平衡的任务,满足要求的情况要比失败的情况少的多。 而判断转移和对齐率等指标可能会产生误导。比如,由于MetaGPT很少满足要求, LLM-as-a-Judge很容易将大多数情况识别为负面(在黑盒设置中达到84.15%)。 PR曲线通过平衡精确度和召回率,提供更清晰的性能衡量标准。 这表明,在某些情况 下,Agent-as-a-Judge几乎可以取代人类评估员。 最后,在消融研究中,研究人员分析了各种组件的添加,对Agent-as-a-Judge判断OpenHands性能的影响。 参考资料: https://x.com/tydsh/status/1846538154129375412
让千万网友着迷的 AI 巫师猫,凭什么成为小红书和 Instagram 的新顶流
秋天到了,《哈利波特》重映了,万圣节快来了,魔法的气息蠢蠢欲动了。 最近,一只 AI 生成的猫从海外火到国内,在 X、Instagram、小红书都拥有极高的人气。 爱意始于颜值,这是一只圆滚滚的橘猫,头戴尖顶的巫师帽,爪子握着魔杖,迷离的眼神大智若愚。可以形象地称它为,巫师猫。 巫师猫的一条短视频,在 Instagram 超过 1200 万次播放,还不断有人为它二创。 ▲图片来自:Instagram@tothemoonq888 不少网友感叹,这才是使用 AI 的正确方式。上网只为三件事,吸猫,吸猫,还是特么的吸猫。当然也有人满头问号,这也能火? 当一只 AI 猫成为网红 经过考古,巫师猫最早出现在 8 月 25 日,由分享猫咪图片投稿的 X 账号@gatinarios 发布,现在这条帖子超过 1250 万次浏览、22.3 万次点赞。 真正让巫师猫火起来的,是一系列脑洞大开的 AI 二创。 大口品尝拉丝芝士披萨,仍比人类老铁的吃播优雅几分。 ▲ 图片来自:Instagram@miyavlikedicikler 魔杖秒变左轮手枪,要是阁下不想看魔法,它也略懂一些拳脚。 ▲ 图片来自:X@Cheeseball_sol 熬了一锅魔法药水,它说紫色很有韵味。 ▲ 图片来自:X@venturetwins 骑上扫帚潇洒飞走,挥一挥斗篷,不带走一片云彩。 ▲ 图片来自:X@venturetwins 以古早 3D 游戏画风展现魔性舞蹈,轻轻松松在 Instagram 迷倒 34.2 万个人类。 ▲ 图片来自:Instagram@doro_daro 甚至连 3D 建模都有了,只差分享一个链接,已经准备好掏钱买来当书桌摆件。 ▲ 图片来自:X@masom_mamen 猫红了,诡计多端的人类便要蹭。 快手可灵官方生成了一个万圣节氛围感短视频,秀一秀自己的 AI 视频能力,然而东亚味图穷匕见,没想到连猫都要拿起电脑打工。 ▲ 图片来自:X@Kling_ai 硅谷知名投资机构 a16z 合伙人、专做 AI 公司投资的 Justine Moore 也给予了高度评价,说巫师猫是 Instagram 短视频的新顶流。 热衷方法论的小红书用户们,则教你怎么用 AI 制作巫师猫,授人以鱼不如授人以渔。 总之,时代变了大人,AI 让创作和二创表情包都更容易了。 迪士尼的粉色狐狸玲娜贝儿,本是没有故事的女同学,但迪士尼乐园工作人员的扮演和粉丝的二次创作赋予了它灵魂。 巫师猫的出道方式与之类似,现在已经有自己的社交帐号、网站甚至迷因币,堪比马斯克喜欢的狗头 Doge,这些动态就是它的故事,丰富着它的猫设。 甚至有网友觉得,它神似《哈利波特》的麦格教授。 只要形象够可爱,出厂设置再单薄,也会有人填补空白。这就叫,颜值即是正义,总会有妈妈爱你。 无聊的人类会吸电子猫吗 世界破破烂烂,萌物缝缝补补。从纸箱狗、猫 meme 的一度流行来看,猫,哪怕是 AI 生成的猫,受网友欢迎,是再正常不过的了。 其中或许有个原因,围绕宠物而不是人创作,更能让 AI 扬长避短,更不容易陷入恐怖谷。 它们不需要完全地拟人,也不需要和真实动物完全一致,哪怕稍显奇怪和夸张,善良的观众也会包容。 ▲ 图片来自:X@Cheeseball_sol AI 宠物并不是一条小众的赛道,巫师猫之前,这片沃土已被发掘。 当长辈向你催婚,追问等你老了谁照顾你,可以请他们看一段猫洗手作羹汤的 VCR。 ▲ 图片来自:Instagram@kimbingmei__ 连猫都有心事,草帽一戴成了酷盖,弹起吉他比《猫和老鼠》的汤姆多一分忧郁和深沉。 ▲ 图片来自:Instagram@nico.m.ai AI 提高了人们的生产力,让大家过得更快乐了吗?不好说,各有各的看法,但它确实改变了人们造梗和娱乐的方式。 这段时间,我的朋友圈流行一个 AI 特效:醒图 app 的「金箔岩彩」。它和猫猫狗狗的适配度很高,一键 get 新中式插画。甚至有铲屎官表示,不用花钱向画师约稿了。 AI 视频更是让人类的脑洞有了一万种落地的可能性,专业人士搞 AI 大片,挑战传统电影,但玩家们考虑怎么抽象和搞怪就可以了。 之前,海螺 AI 有个很出圈的视频,把经典电影桥段里的武器都变成冰淇淋,上一秒剑拔弩张,下一秒一笑泯恩仇,没有一个冰淇淋解决不了的问题,如果有,那就来两个。 ▲ 图片来自:X@Martin_Haerlin 我们自己复刻个七八成也很简单,上传图片,再输入文字提示词即可,特效从未如此简单。 这是一个人人都是创作者的时代,二创也能有很好的体验,AI 放飞想象力又能满足成就感,真「我上我也行」。 为爱发电可以,变现需要自知之明 为爱发电固然快乐,但成年人需要考虑现实,换句话说,AI 宠物有没有变现的可能? 这和任何内容垂类一样,高质量的金字塔尖,才能接点广告植入。但因为 AI 创作的高度自由,AI 宠物是个百搭体质,业务范围还挺广,包括但不限于服饰、电脑、汽车、奶茶…… ▲ 图片来自:小红书@橙子的橙啦 文案、图片为甲方讲故事固然好,也有更简单粗暴赚快钱的,先用讲 AI 猫咪小故事的短视频起号,时不时单发一条无关的广告。 当然,哪里也少不了卖课的。一些账号就像 AI 博主的周边,以月入几千甚至上万为噱头,分析变现思路和操作方法,然后拉群卖课,但它们自己的账号流量都低得可怜。 为了打破信息茧房,我加了一个吃这碗饭的小红书博主的群聊,由此知道,需要加微信,然后花近 700 元加入 AI 训练营,才能教你怎么 AI 视频号带货、AI 小红书壁纸变现…… 无意贬低,把 AI 当副业可能竹篮打水一场空,但李一舟们证明了信息差确实赚钱。看这些博主整理的教程,先从注册账号开始,就差把饭喂到嘴里了。 但这里存在一个问题,免费的教程一搜一大堆,希望别人手把手教、抱着焦虑心态、相信速成品也会被市场买单的用户,很难创作出好的东西,反而可能是白交了学费。 AI 宠物的本质,其实就是用 AI 设计可以打动用户的 IP,然后再持续运营,讲出故事。 在盲盒爆火的时候,IP 需不需要故事就已经被讨论过一波。 泡泡玛特 CEO 王宁曾说:「现在年轻人的时间碎片化。Molly 这类 IP 降低了时间的门槛,一分钟,你知道你喜不喜欢它……」 ▲将巫师猫变成可爱卡通风,图片来自:@BBIM_official 泡泡玛特的盲盒形象好歹也是艺术家精心设计的,AI 让创作 IP 形象更容易,但不代表可以轻易地打动用户。 之前我们采访过一位前游戏大厂员工、AI 游戏美术创作者。因为有专业背景,又热衷实践,所以上手 AI 对她来说不难。 ▲ 图片来自:knowyourmeme 她更关心的是:你喜欢的风格,是不是大部分人也会喜欢?你设计的游戏人物 IP,有没有强烈的风格,能不能让大家记住? AI 不是出不了好作品,但少不了时间和汗水。热点来了又走,焦虑长盛不衰,真正想要创造什么内容的人返璞归真——我们想要和需要用 AI 生成什么,我们怎么判断 AI 生成结果的好坏,以及,我们又愿意为之付出多少努力。
富士相机对决 OPPO Find X8 的胶片风格,手机不只是是富士平替
在手机影像配置卷到白热化的今天,你是否好奇过:手机摄影的下一个破局点,到底在哪里? 先请大家看一组照片: 如果我不说,也许有朋友会问,这不是近年来大火的富士胶片模拟吗?实际上,所有照片都是使用这台 OPPO Find X8 Pro 拍摄的,并且没有用任何专业软件做后期调色。 这种「类富士」的滤镜,其实是 Find X8 系列上三个全新的胶片风格,只需要动动手指,我们就能一键拍出富士风格的照片。 这是三组照片对比,你可以猜猜哪边是富士 XT5 拍的,哪边是 OPPO X8 系列拍的: 揭晓答案:这三组照片中,左边三张全都是富士,而右边三张全是 OPPO。 看完了扫街实景,我们再来看看两者人像的对比: 揭晓答案:这三组对比中,左边三张是 OPPO,右边三张是富士。 这三个胶片风格地位相当特殊特殊——以绝对强势的存在感,代替了曾经的哈苏自然色彩方案,成为这一代旗舰的影像「排头兵」。 想要探寻厂家对于手机影像的理解和构思,也许可以从这三个风格中找到蛛丝马迹——OPPO Find X8 系列除了复古,还有清新与通透两个风格,这些风格分别有什么区别?该怎么用?它们背后的设计逻辑,是怎么暗示影像下一步方向的? 三种风格,各有千秋 要说这三款胶片风格中最抓人眼球的,要数这个风靡一时、足以「以假乱真」的复古风格。 由复古风格拍摄的照片,相当有辨识度:画面整体呈现出较高的对比度,偏亮的高光渲染了一层橙黄,阴影则偏向碧绿 ,这与富士 NC 胶片模拟的色彩倾向非常相似,能够一秒将人带回浓烈又厚重的胶片时代,堪称富士「平替」。 在社交平台上,经常看到有帖子提问:为什么我拍的照片总是那么灰。 发灰的画面其实是因为由于手机影像传感器面积逐年变大、摄影算法逐渐变强,导致画面可以容纳的明暗范围更多,但受制于 sRGB 色彩空间标准,画面变得越来越灰。 这听起来有点复杂,你可以将其理解为照片是一个盘子,向照片塞入更多的明暗细节就像在这个盘子上堆积更多食物,但 sRGB 这个小盖子盖下来时,本来铺满盘子的明暗细节就被挤成这个盖子的大小了,最终呈现的画面自然而然地显得灰暗,失去对比度和层次感。 想要恢复舒适的影调,往往需要用专业的后期软件去调试,但现在,使用 OPPO Find X8 系列中的清新胶片风格拍摄照片,可以直接解决这个麻烦。 清新风格在影调上与复古胶片风格类似,画面以高对比度的影调呈现,同时通过降低周围环境中的颜色饱和度,为画面去灰解腻。 有浓烈炽热就有清淡温和,最后一个通透风格就是如此。 使用通透风格拍照时,照片像素集中在温和的中间调,呈现低对比度,保持画面饱和度的同时,还把白平衡拉低,使其发色整体偏冷。 通透风格藏在前两个锋芒毕露的效果之后,展现自己收放自如的功底。 胶片风格操作指南 风格化固然好用,但世上没有万能的配方,就像用扫把拖地一样,一旦用错了环境,翻车也并不少见,不同的胶片风格,必须要挑到合适的场景,才能让这些独特的颜色更出彩。 我们对三个胶片风格进行测试并总结了一份操作文档,帮助你更好地使用它们。 首先是最受欢迎的复古风格,由于明暗对比度高、颜色浓郁,复古风格不适合在颜色杂乱的地方使用——配合颗粒,很容易出现画面变脏的情况。 同时,如果有人物出镜,要注意将人脸和皮肤尽量放在受光面,否则人脸和皮肤也会呈现酱油色。 而它擅长的,是有大面积纯色的环境——尤其是绿色。 在后期调色时,我觉得画面中最棘手的、最难处理好看的就是绿色,与富士 NC 胶片模拟类似,复古风格会将绿色偏移向浓郁的墨绿,将原本麻烦的绿色处理得好看、耐看。 综合这些特点,复古风格非常适合在有质感、有阳光照射、尤其是画面中存在绿色的场景使用。 虽然复古风格很亮眼,但在生活中 存在大色块的环境终究是少数,更多情况下,我们镜头中的场景与颜色都比较杂乱。 此时,清新风格可以大展拳脚,利用其高对比、低饱和的特点,清新风格可以有效将画面中的杂乱色减弱,降低存在感,大大突出画面主体。 但同样的,由于清新风格也会加强画面的对比度,所以想要人像的清新通透,需要尽量将人物放在受光面,或是正确曝光,才能获得一个不错的效果。 最后,对于那些布置干净、颜色简单的环境,直接拍摄的照片会显得有些白开水,此时就可以用上三个风格中最平和的通透滤镜。 较低的明暗对比度和适中的饱和度,将宁静与平和的氛围融入画面,进一步营造画面的氛围感。 特别是在白色环境中,有暖色作点缀时,通透风格会将画面向冷偏移,白色更亮眼、暖色更突出,效果会更好。 三个胶片风格,三种明显不同的倾向,选择之多,总会有你喜欢的一个。 建立在审美上的照片,也许是未来方向 走进手机影像的下半场,照片正在从「拍得好」走向「我觉得好」,在客观标准逐渐过渡到主观感受的过程中,审美,成为了关键。 拍摄了《大提顿和蛇河》的摄影家安赛尔·亚当斯对此早有预言: You don’t take a photograph, you make it. 意思是,照片美不仅仅在于捕捉瞬间,更是你的创意和审美共同打造出来的。 ▲《大提顿与蛇河》安赛尔·亚当斯 为了「美」,专业摄影师可以将大把时间放在审美提升上,但普通用户可不行,工作和生活已经占据了我们绝大部分精力,根本没空再去深入学习美学知识与后期软件。 为了让大家更轻松地拍照,OPPO 将目光转移到了风格化方案上,而在摄影厂商中,早有两家厂商打造了极具审美代表性的风格:哈苏与富士。 这两家扮演对手戏的厂商,在风格上各有所长:哈苏以自然色彩科学出名,参考自然之美,巧妙地将肉眼所见的画面保留下来;而富士,则是钻研银盐颗粒,将胶片时代数十年的色彩积累带到数码照片上。 OPPO 先与哈苏合作,将自然色彩带到了手机上,再推出了三个胶片风格,集众家之长,打造出哈苏与富士的双重平替,为你提供更多选择。 这些举措听起来复杂,但它们的目标都十分明确——不需要你再花时间成本,去学习美学知识与复杂的后期软件,直接在每个人都会用到的手机上,提供一系列现成的美学基础。 你可以在这个基础上,任意选择符合你的「美」。
富士相机对决 OPPO Find X8 的胶片风格,手机不只是富士平替
在手机影像配置卷到白热化的今天,你是否好奇过:手机摄影的下一个破局点,到底在哪里? 先请大家看一组照片: 如果我不说,也许有朋友会问,这不是近年来大火的富士胶片模拟吗?实际上,所有照片都是使用这台 OPPO Find X8 Pro 拍摄的,并且没有用任何专业软件做后期调色。 这种「类富士」的滤镜,其实是 Find X8 系列上三个全新的胶片风格,只需要动动手指,我们就能一键拍出富士风格的照片。 这是三组照片对比,你可以猜猜哪边是富士 XT5 拍的,哪边是 OPPO X8 系列拍的: 揭晓答案:这三组照片中,左边三张全都是富士,而右边三张全是 OPPO。 看完了扫街实景,我们再来看看两者人像的对比: 揭晓答案:这三组对比中,左边三张是 OPPO,右边三张是富士。 这三个胶片风格地位相当特殊特殊——以绝对强势的存在感,代替了曾经的哈苏自然色彩方案,成为这一代旗舰的影像「排头兵」。 想要探寻厂家对于手机影像的理解和构思,也许可以从这三个风格中找到蛛丝马迹——OPPO Find X8 系列除了复古,还有清新与通透两个风格,这些风格分别有什么区别?该怎么用?它们背后的设计逻辑,是怎么暗示影像下一步方向的? 三种风格,各有千秋 要说这三款胶片风格中最抓人眼球的,要数这个风靡一时、足以「以假乱真」的复古风格。 由复古风格拍摄的照片,相当有辨识度:画面整体呈现出较高的对比度,偏亮的高光渲染了一层橙黄,阴影则偏向碧绿 ,这与富士 NC 胶片模拟的色彩倾向非常相似,能够一秒将人带回浓烈又厚重的胶片时代,堪称富士「平替」。 在社交平台上,经常看到有帖子提问:为什么我拍的照片总是那么灰。 发灰的画面其实是因为由于手机影像传感器面积逐年变大、摄影算法逐渐变强,导致画面可以容纳的明暗范围更多,但受制于 sRGB 色彩空间标准,画面变得越来越灰。 这听起来有点复杂,你可以将其理解为照片是一个盘子,向照片塞入更多的明暗细节就像在这个盘子上堆积更多食物,但 sRGB 这个小盖子盖下来时,本来铺满盘子的明暗细节就被挤成这个盖子的大小了,最终呈现的画面自然而然地显得灰暗,失去对比度和层次感。 想要恢复舒适的影调,往往需要用专业的后期软件去调试,但现在,使用 OPPO Find X8 系列中的清新胶片风格拍摄照片,可以直接解决这个麻烦。 清新风格在影调上与复古胶片风格类似,画面以高对比度的影调呈现,同时通过降低周围环境中的颜色饱和度,为画面去灰解腻。 有浓烈炽热就有清淡温和,最后一个通透风格就是如此。 使用通透风格拍照时,照片像素集中在温和的中间调,呈现低对比度,保持画面饱和度的同时,还把白平衡拉低,使其发色整体偏冷。 通透风格藏在前两个锋芒毕露的效果之后,展现自己收放自如的功底。 胶片风格操作指南 风格化固然好用,但世上没有万能的配方,就像用扫把拖地一样,一旦用错了环境,翻车也并不少见,不同的胶片风格,必须要挑到合适的场景,才能让这些独特的颜色更出彩。 我们对三个胶片风格进行测试并总结了一份操作文档,帮助你更好地使用它们。 首先是最受欢迎的复古风格,由于明暗对比度高、颜色浓郁,复古风格不适合在颜色杂乱的地方使用——配合颗粒,很容易出现画面变脏的情况。 同时,如果有人物出镜,要注意将人脸和皮肤尽量放在受光面,否则人脸和皮肤也会呈现酱油色。 而它擅长的,是有大面积纯色的环境——尤其是绿色。 在后期调色时,我觉得画面中最棘手的、最难处理好看的就是绿色,与富士 NC 胶片模拟类似,复古风格会将绿色偏移向浓郁的墨绿,将原本麻烦的绿色处理得好看、耐看。 综合这些特点,复古风格非常适合在有质感、有阳光照射、尤其是画面中存在绿色的场景使用。 虽然复古风格很亮眼,但在生活中 存在大色块的环境终究是少数,更多情况下,我们镜头中的场景与颜色都比较杂乱。 此时,清新风格可以大展拳脚,利用其高对比、低饱和的特点,清新风格可以有效将画面中的杂乱色减弱,降低存在感,大大突出画面主体。 但同样的,由于清新风格也会加强画面的对比度,所以想要人像的清新通透,需要尽量将人物放在受光面,或是正确曝光,才能获得一个不错的效果。 最后,对于那些布置干净、颜色简单的环境,直接拍摄的照片会显得有些白开水,此时就可以用上三个风格中最平和的通透滤镜。 较低的明暗对比度和适中的饱和度,将宁静与平和的氛围融入画面,进一步营造画面的氛围感。 特别是在白色环境中,有暖色作点缀时,通透风格会将画面向冷偏移,白色更亮眼、暖色更突出,效果会更好。 三个胶片风格,三种明显不同的倾向,选择之多,总会有你喜欢的一个。 建立在审美上的照片,也许是未来方向 走进手机影像的下半场,照片正在从「拍得好」走向「我觉得好」,在客观标准逐渐过渡到主观感受的过程中,审美,成为了关键。 拍摄了《大提顿和蛇河》的摄影家安赛尔·亚当斯对此早有预言: You don’t take a photograph, you make it. 意思是,照片美不仅仅在于捕捉瞬间,更是你的创意和审美共同打造出来的。 ▲《大提顿与蛇河》安赛尔·亚当斯 为了「美」,专业摄影师可以将大把时间放在审美提升上,但普通用户可不行,工作和生活已经占据了我们绝大部分精力,根本没空再去深入学习美学知识与后期软件。 为了让大家更轻松地拍照,OPPO 将目光转移到了风格化方案上,而在摄影厂商中,早有两家厂商打造了极具审美代表性的风格:哈苏与富士。 这两家扮演对手戏的厂商,在风格上各有所长:哈苏以自然色彩科学出名,参考自然之美,巧妙地将肉眼所见的画面保留下来;而富士,则是钻研银盐颗粒,将胶片时代数十年的色彩积累带到数码照片上。 OPPO 先与哈苏合作,将自然色彩带到了手机上,再推出了三个胶片风格,集众家之长,打造出哈苏与富士的双重平替,为你提供更多选择。 这些举措听起来复杂,但它们的目标都十分明确——不需要你再花时间成本,去学习美学知识与复杂的后期软件,直接在每个人都会用到的手机上,提供一系列现成的美学基础。 你可以在这个基础上,任意选择符合你的「美」。
确认涨价!小米15系列售价曝光:或4599元起售
快科技10月27日消息,小米15系列新品发布会已经定于10月29日晚7点举办。目前,大家最关心的莫过于新机的售价了。 此前,雷军公开发微博确认,小米15系列确实会涨价。“去年我跟大家说过,小米14肯定是最后一次定价3999。今年元器件成本上涨非常多,另外我们在研发上投入也非常大,小米15 确实需要涨价。谢谢大家理解,我们一定把产品做好!” 但到底会涨多少呢?据了解,受到内存存储、核心元器件采购成本上涨和汇率等因素叠加,小米15系列起售价或将来到4500-5000区间。业内分析人士称,这次小米15软硬件升级幅度巨大,售价或将4599元起步。 有博主认为,小米15系列涨价多少讨论激烈,最靠谱的还是4599元起。拿最近发布的友商几款新机来说,两家起售价都破了4K,其中同样小屏的X200 Pro mini更是4699起。 “这两家都是搭载天玑9400平台,而小米15则是骁龙8至尊版,单就芯片来说,贵个三五百的没毛病吧?” 该博主表示,如果按照友商小屏4699元起进行参考,小米15就算4899元起贵200块都很香,何况是4599起呢? 早先,小米中国区市场部副总经理、Redmi品牌总经理王腾表示,今年旗舰涨价主要是两方面因素,一是旗舰处理器升级最新3nm制程,工艺成本大幅增加。 另一方面是内存经过持续一年的涨价,已经到了高点,所以大家看到大内存的版本涨幅更大。去年底内存是个历史低点,跟大家说大内存且买且珍惜。
新一代钉子户机型!小米15系列性能、能效双升级
快科技10月27日消息,小米15系列的发布会将于10月29日晚7点举行,并首发搭载骁龙8至尊版处理器。 雷军表示,骁龙8至尊版基于台积电第二代3nm制程打造,采用双超大核方案,拥有PC级强大架构,配合小米自研的HyperCore以及内置的微架构调度器,强强联手,能效强得不可思议。 据悉,骁龙8至尊版的Oryon CPU拥有移动平台最高的频率,其2颗超级内核频率从上代3.3GHz直接增加到4.32GHz,提升约31%;性能核频率也从3.2GHz提升到3.53GHz,提升约10%。 小米HyperCore澎湃内核进一步提升了芯片的效率,通过自研微架构调度器,HyperCore能够解析指令流水线,将传统的帧负载追踪“黑盒”模式转变为“白盒”模式,真正实现对任务执行周期的透明化管理。 结合一体化调频机制和智能资源分配,CPU空转率下降了19%,使得能效也获得不错的提升。 小米HyperCore内核还对图形渲染管线进行了重构,通过全局联合渲染和图形异构计算,将图像渲染的完成时间从576ms缩短至48ms,提升了12倍的效率。 而在骁龙8至尊版和小米HyperCore内核的双重加持下,小米15系列的整体性能提升超过45%,峰值功耗则降低了52%以上。 鉴于小米15在软硬件方面的显著升级,业内分析人士预计,其起售价可能为4599元。
小米智能家电实验中心揭牌启用:耗资1.2亿元,面积超1万平方米
IT之家 10 月 27 日消息,10 月 24 日小米在武汉召开了主题为「科技家电新起点」媒体沟通会,本次活动不仅举行了小米智能家电实验中心的揭牌仪式,以及与中国家用电器研究院、威凯检测技术有限公司、华中科技大学三家合作机构共建联合实验室的授牌仪式,还提前介绍了小米即将在 10 月 29 日正式发布的 5 款旗舰家电新品。 据IT之家了解,小米智能家电实验中心耗资 1.2 亿人民币,总面积超过 1 万平方米,是一所集研发、测试、办公为一体的综合性产品开发基地。实验中心配有 47 间实验室,涵盖了产品预研和试产阶段所需的各个维度测试,包括性能和耐久性等关键指标。 此外,小米智能家电实验中心还与中国家用电器研究院、威凯检测技术有限公司、华中科技大学展开合作,通过共建联合实验室和联合技术中心,实现产学研侧深度融合,打造了一个以武汉为中心的小米大家电研发枢纽,为小米大家电业务注入创新动力。 小米还在此次活动上提前介绍了即将在 10 月 29 日正式发布的 5 款家电旗舰新品,包括画质体验全面跃升的小米电视 S Pro Mini LED 2025,拥有全新舒适风感体验的米家空调上出风 Pro,首创标准尺寸独立双筒设计的米家洗衣机双区洗双洗烘,双系统设计后控温更精准并能实现 0 串味的米家冰箱分储鲜 Pro 十字 508L,首次拥有蓝氧护衣洗技术加持的米家洗衣机精护洗 Pro。 IT之家注意到,刚刚小米集团合伙人、总裁,手机部总裁,小米品牌总经理卢伟冰在微博发文称, 10 月 29 日的发布会也是小米大家电的新起点,“几年前,我们把小米大家电业务定位为公司战略业务,在核心技术上实现压强性投入,充分发挥小米的智能化优势,为用户提供技术领先,品质可靠,简单易用的小米科技家电。这次,是阶段性成果的集中性展示。”
一加13支持新一代手机搬家,速度提升220%
IT之家 10 月 27 日消息,一加 13 手机将于 10 月 31 日 16:00 发布,官方今日宣布,一加 13 支持新一代手机搬家,速度提升 220%。 其中: Wi-Fi 7 首次用于手机搬家通道,传输速率提升 20% 超级 Wi-Fi 低功耗技术助力,相同功耗温升性能提升 30% 自研近场高速互联天线技术,极限吞吐量提升 40% 此外,一加 13 配备红外遥控、全区域多功能 NFC 等功能,支持 USB 3.2 Gen1。 IT之家整理一加 13 手机预热 / 爆料配置参数信息如下(以实际发布为准): 性能:高通骁龙 8 至尊版 | 支持 120 帧游戏 运行:提供 24GB+1TB 版本 信号:超级信号工程 2.0 | 400 米超远距灵动蓝牙 | 全新 360° 环绕式天线 屏幕:2K BOE X2 最高定制等深四微弧直屏 | 120Hz 8T LTPO 显示 | 安卓唯一「太阳显示」技术 电池:6000mAh 电池 | 支持 100W 有线快充 + 50W 无线快充 后摄:50MP LYT808 主摄 + 50MP JN5 + LYT600 3X 潜望长焦 防护:IP68 / 69 | 微晶玻璃 系统:ColorOS 15 连接:多功能红外遥控 | 全区域多功能 NFC | USB 3.2 Gen1 设计:丝绸玻璃(白露晨曦) | BabySkin 亲肤绒感皮(蓝调时刻) | 黑檀木纹玻璃(黑曜秘境) 其他:0916 Turbo 马达 | IP68 / IP69 级防尘防水 | 单点超声波指纹 | 4 麦克风通话 AI 降噪 | 超线性立体声双扬声器 厚度重量:玻璃版本 8.5mm / 213g | 素皮版本 8.8mm / 210g
苹果正研发糖尿病预防应用:Apple Watch或将支持无创血糖监测
快科技10月27日消息,近日,爆料人马克·古尔曼透露,苹果公司内部正开发测试一款新的健康应用程序,重点在于预防糖尿病。 在这次测试中,苹果邀请了部分患有前期糖尿病的员工参与使用该应用,参与者通过血液检测确认自己处于前期糖尿病阶段,之后使用血糖监测设备来密切监控饮食和血糖水平。 该应用程序可用于向员工展示健康和不健康的食物选择如何影响他们的血糖,以及这些食物对病情的影响。 例如,碳水化合物含量高的食物可能导致血糖显著升高,从而提醒测试人员多摄入蛋白质,并选择更有利健康的食物,在前期糖尿病阶段进行干预,可以帮助数百万人避免发展成2型糖尿病。 古尔曼指出,苹果正通过该应用研究血糖数据的潜在用途,并探索未来可能对用户有帮助的工具。 值得一提的是,近年来,苹果一直致力于在Apple Watch中添加无创血糖监测功能。 目前,大多数血糖测试需要刺破皮肤进行采血检测,而苹果正在开发一种通过光吸收光谱和激光技术来测量体内葡萄糖浓度的方法,无需刺破皮肤。 截至去年,苹果的无创血糖监测技术已达到“概念验证”阶段,虽然有一个功能原型设备,但体积仍然太大,无法整合到Apple Watch的体积中,预计苹果还需要几年时间才能发布具有无创血糖监测功能的Apple Watch。 在此期间,苹果将会开发更多高级的食物记录和血糖监测工具,并进一步扩展Health应用与第三方血糖监测设备的整合。
印尼:旅客可携带苹果iPhone 16入境,但禁止销售
IT之家 10 月 27 日消息,印度尼西亚工业部表示,旅客可以携带 iPhone 16 进入该国,但禁止销售。 由于苹果公司未达到印度尼西亚的本地投资目标,因此该公司于 9 月份发布的 iPhone 16 系列新机无法在印尼销售。 据《雅加达环球报》报道称,如果手机是个人使用或通过快递服务运输,则可以带入印尼。 印尼工业部发言人 Febri Hendri Antoni Arif 于 10 月 26 日在一份声明中表示:“旅客携带并需缴税的 iPhone 16 是个人物品,不得出售,仅限旅客个人使用。” 报道称,每位旅客最多可携带两台 iPhone 16 入境印尼。 8 月至 10 月期间,约有 9000 台 iPhone 16 作为个人行李入境印尼,并缴纳了税款。但如果这些手机在印度尼西亚销售,将被视为非法。 通过邮政服务进入印度尼西亚的非商业用途的 iPhone 16 设备也是被允许的,因为它们不需要满足当地的投资目标。 据《雅加达邮报》报道,印尼工业部长 Agus Gumiwang Kartasasmita 于 10 月 22 日表示,苹果尚未履行其在印尼投资 1.71 万亿印尼盾(IT之家注:当前约合人民币 7.8 亿元)的承诺,这是获得在当地销售手机许可证的先决条件。Agus 表示,到目前为止,苹果已投资 1.48 万亿印尼盾。 苹果于 10 月 11 日表示,“我们深耕印度尼西亚市场,并期待尽快将所有最新产品,包括 iPhone 16 系列,带给我们的客户。”
一加13手机预热:配备红外遥控、全区域多功能NFC,支持USB 3.2 Gen1
IT之家 10 月 27 日消息,一加 13 手机将于 10 月 31 日 16:00 发布,官方今日再次对新机进行预热:新机确认配备红外遥控、全区域多功能 NFC,支持 USB 3.2 Gen1。 据介绍,一加 13 手机支持多功能红外遥控,可添加机顶盒、电视、智能盒子、DVD 播放器等设备红外遥控,支持拍照添加(即拍照实物遥控器自动识别添加红外遥控)。 一加 13 还拥有多功能 NFC,使用时无需刻意“瞄准”,支持手机上 1/3 部分五面自由刷卡,包括:正面、反面、顶部、双侧面。该机还支持 USB 3.2 Gen1。 另外,一加 13 还升级“超线性立体声双扬声器”,采用金属密闭独立式音腔、辅以双环式对磁设计,搭载自研音效 2.0,适配听歌、追剧、游戏场景。 IT之家整理一加 13 手机预热 / 爆料配置参数信息如下: 性能:高通骁龙 8 至尊版 | 支持 120 帧游戏 运行:提供 24GB+1TB 版本 信号:超级信号工程 2.0 | 400 米超远距灵动蓝牙 | 全新 360° 环绕式天线 屏幕:2K BOE X2 最高定制等深四微弧直屏 | 120Hz 8T LTPO 显示 | 安卓唯一「太阳显示」技术 电池:6000mAh 电池 | 支持 100W 有线快充 + 50W 无线快充 后摄:50MP LYT808 主摄 + 50MP JN5 + LYT600 3X 潜望长焦 防护:IP68 / 69 | 微晶玻璃 系统:ColorOS 15 连接:多功能红外遥控 | 全区域多功能 NFC | USB 3.2 Gen1 设计:丝绸玻璃(白露晨曦) | BabySkin 亲肤绒感皮(蓝调时刻) | 黑檀木纹玻璃(黑曜秘境) 其他:0916 Turbo 马达 | IP68 / IP69 级防尘防水 | 单点超声波指纹 | 4 麦克风通话 AI 降噪 | 超线性立体声双扬声器 厚度重量:玻璃版本 8.5mm / 213g | 素皮版本 8.8mm / 210g
400米超远距离连接!一加13蓝牙功能大升级:远离手机也能畅听音乐
快科技10月27日消息,一加手机近日宣布即将推出的一加13将搭载超级信号工程2.0,对蓝牙、信号、网络等进行了优化升级。 据悉,一加13将配备5.4低功耗蓝牙,可实现了400米超远距离蓝牙覆盖,能够在100㎡的居家空间内自由移动而不失连接,确保用户即便远离手机,也能流畅听歌。 此外,一加13还配备了13根全新设计的360°环绕式天线,确保在各种场景下都能拥有优质的信号体验。 该机还创新采用了三段式开关融合天线和专属电竞天线,并在相机模块中引入了天线融合技术,以进一步优化信号性能。 为提升不同场景下的网络体验,一加13带来了全新高铁/地铁模式,使得在地铁和高铁上观看短视频和进行视频会议时的卡顿率大幅下降,地铁短视频卡顿率降低了43.48%,高铁腾讯会议卡顿率降低了31.39%,微信视频通话卡顿率降低了53.30%。 一加13还引入了演唱会模式和校园网络无缝切换功能,并显著优化了在特定场景下的网络表现。 在地库、电梯等网络信号薄弱的场所,一加13的卡顿率显著降低,地库短视频卡顿率减少98.92%,电梯短视频卡顿率降低15.91%,地库直播卡顿率消除100%,电梯直播卡顿率降低75.90%,地库游戏卡顿率降低35.06%,高速直播卡顿率降低67.11%。 其他配置方面,一加13将首批搭载骁龙8至尊版处理器,全球首发第二代2K东方屏,提供高达24GB+1TB的存储组合,并配备哈苏超光影旗舰三主摄。 目前,该手机已正式官宣,将于10月31日16点发布。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。