发布日期:2025-04-14 浏览次数:
4月13日,据The Information援引知情人士消息,字节跳动正计划推出自研的AI智能眼镜,并已开始与供应链进行沟通,商讨功能、技术方案、成本控制与上市节奏。这款尚未公布核心功能、发布时间未定的产品,很可能内置其自研大模型“豆包”提供的AI能力。
知情人士称,字节跳动自去年起就开始研发AI眼镜项目,公司已招聘具备硬件设计经验的工程师参与开发,正在攻克的技术难题包括:在不牺牲过多电池续航的前提下,确保眼镜能够拍摄出高质量的图像和视频。
这并不是字节第一次向硬件领域发起冲击。早在2021年9月,抖音集团以90亿元重金收购VR硬件公司PICO,试图借助抖音内容生态推动VR设备普及,但PICO头显因销量不及预期宣布缩减业务规模,并取消了新产品的发布计划。这场高举高打的尝试最终以“战略收缩”告终。
反思这段经历可以发现,VR设备的失败,并不在于技术不成熟,而在于“使用场景”的缺位。相比之下,作为一种更轻量、贴近日常使用的设备,具有天然的场景适配性:拍摄、导航、翻译、语音助手、日程提醒……再加上AI大模型的落地能力与开放式音频技术的支持,它或许是目前最有可能走进大众生活的AI硬件形态。
字节跳动在AI领域布局已久。早在2016年,公司便成立AI实验室,专注自然语言处理、机器学习等技术探索;2023年8月,大模型“云雀”上榜首批通过国家《生成式人工智能服务管理暂行办法》的模型名单,同年8月推出面向C端的豆包聊天机器人,开启公测。2024年5月,豆包大模型在火山引擎原动力大会上正式发布,日均处理1200亿Tokens文本,生成3000万张图片,成为其AI战略核心。豆包不仅能力可对标ChatGPT,还逐步形成了独立生态,涵盖口语练习、问答、旅行助手等轻量应用,成为可迁移至硬件平台的理想AI内核。
字节跳动官方也曾表示:“豆包业务正致力于探索与智能可穿戴设备的结合,旨在为用户提供更加自然、便捷的交互体验。”
2024年10月,字节推出首款AI硬件产品——无线耳机Ola Friend。该耳机无需连接手机即可调用豆包进行对线元的产品市场反响平平,但在技术路径上却清晰地预演了未来AI眼镜的雏形:语音交互+离线运行+硬件端AI部署。
更关键的一步,是字节跳动对开放式耳机品牌Oladance的收购。Oladance为深圳本土厂商,是业内领先的开放式音频技术提供者。AI眼镜在设计上无法采用入耳式耳机,因此开放式音频方案几乎是必选项,而通过收购Oladance,字节跳动不仅掌握了技术,也节省了音频模组的研发成本和时间,快速补齐了眼镜产品的音频短板。2024年9月,字节跳动完成对Oladance的100%控股,将其OWS(Open Wearable Stereo)技术整合至硬件生态。
此外,早在今年2月就有消息称字节跳动在考虑恒玄2800+研极微ISP芯片方案以满足AI眼镜对成像和图像处理的要求。据了解,恒玄2800芯片作为主控芯片,在性能上表现出色。然而,为了满足AI智能眼镜的拍摄功能需求,还需要外挂一块ISP芯片。ISP芯片是专门设计用于图像信号处理的芯片,它在决定主打拍摄类的AI智能眼镜成像质量方面起着至关重要的作用。
业内人士指出与高通AR1 芯片相比,恒玄2800芯片外挂ISP芯片的方案具有高性价比和低功耗长续航的特点。通过调校ISP芯片,可以达到接近于AR1芯片实现的拍摄效果。更重要的是,该方案的成本远低于AR1 芯片方案,仅为后者的几分之一。这一方案将把图像处理与AI推理能力结合,兼顾低功耗与拍摄质量,且有望将BOM成本控制在千元以内,最终零售价压至1500元区间。这一价格带正是2025年AI眼镜争夺的主战场。尽管这一方案目前尚未确定为最终方案,但它已经引起了业界的广泛关注。
从大模型“豆包”的嵌入,到开放式音频技术整合,再到AI芯片与成像方案的协同,字节跳动正在尝试构建一个“软硬一体”的完整闭环,而这一切的落脚点,就是AI眼镜。
从行业趋势来看,2025年被视为AI眼镜的爆发元年。据IDC预测,2025年全球智能眼镜出货量预计将达到1280万台,同比增长26%;其中,中国市场将突破275万台,同比增长高达107%,跃居全球第一。另据Counterpoint数据,若AI眼镜价格成功下探至1500元以内,中国市场规模或将激增300%,达到120亿元级别。
当前,AI眼镜市场热潮汹涌。小米、OPPO、vivo纷纷重启或加速穿戴设备产品线;小度、雷鸟、Rokid等创业型公司相继推出新品,AI眼镜从试验室走向消费市场,成为与手机并行的“新入口”争夺战场。而Meta加速推进Quest头显入华,Amazon也在海外市场加速推进AR/AI设备的本地化适配,尝试以内容+服务捆绑形态构建生态闭环。欧博体育
在这一背景下,字节跳动的入场不再是“探索性试水”,而是一场有战略目标、有技术路径、有生态协同的“精准进击”。
作为国内内容分发的绝对头部平台,字节跳动旗下的抖音、西瓜视频、番茄小说、今日头条等矩阵,构建起了一个“高频使用+深度互动”的内容生态。而豆包AI的核心场景正好与这些平台天然融合:AI视频剪辑助手、内容总结工具、视频脚本生成器、虚拟客服、旅游导览、语言练习等服务,几乎可以直接迁移至AI眼镜。
换句话说,字节跳动不是在卖“智能眼镜”,而是在推销一种“随时在线的生活方式”。通过软硬件联动,字节可以在硬件中输出服务,在服务中引导消费,构建出闭环商业模式——这正是苹果、Meta等公司所梦寐以求的生态控制力。
而凭借其庞大的用户基数与品牌号召力,字节跳动有可能快速完成早期用户渗透,从而在初期市场中获得份额优势。
尽管潜力巨大,但AI眼镜要真正从“热潮”迈向“普及”,仍面临诸多结构性挑战。
企事界执行董事长李睿对高见科技论表示:首先是技术层面的掣肘。目前微型显示、功耗控制、图像处理等技术尚未完全成熟,尤其在轻量化设备中实现高质量AI能力,仍需在芯片设计、能效调度等方面突破。
其次是隐私合规压力。眼镜自带摄像头可能会引发公共场景下的隐私争议,尤其在国内法律监管趋严背景下,如何确保拍摄合规、安全存储和数据不滥用,将是监管重点。再者是用户认知问题。当前市场上AI眼镜多为“功能尝鲜”型设备,缺乏长期使用驱动。若缺乏稳定的内容与交互生态支撑,极有可能走上“买了吃灰”的老路。
最后,内容生态闭环尚未打通。豆包虽已具备一定能力,但仍需通过大规模用户反馈迭代,形成真正“有用、好用、常用”的产品体验,这不仅是产品设计问题,更是“场景创新”能力的考验。
过去十年,字节依靠内容和流量打造出移动互联网的内容帝国,但随着广告、电商红利逐渐见顶,必须寻找下一个“平台级机会”。AI硬件,尤其是AI眼镜,可能正是这个“新入口”——一个把内容生态、技术能力与商业场景统一融合的超级终端。