“工具在使用者手中时才成为工具。”海德格尔的这段话,今天用来理解AI硬件同样贴切。 问题在于,大模型这只“手”伸出来的时候,用户究竟愿意把它握在掌心里(手机),还是架在鼻梁上(眼镜),亦或是让它一直贴耳倾听(耳机)? 据《Z Finance》独家报道,字节跳动内部决定暂停豆包AI眼镜项目。想要理解这场选择,需要先回答一个更基础的问题:大模型公司为什么要做硬件? 据《晚点LatePost》的报道,火山引擎豆包大模型日均调用量已超过120万亿Token,半年增长4倍。国家数据局的数据显示,中国日均Token消耗量在一年半内增长约300倍。黄仁勋在GTC 2026的舞台上说,Token将是未来数字世界最核心的大宗商品。 但Token消耗的暴涨,反而掩盖了一个更根本的问题,即这些Token从哪里被触发,通过什么界面进入用户的生活? 过去两年,这个问题的答案是手机屏幕和对话框。OpenClaw的爆火将Agent从开发者工具推向大众用户,直接推高了对“随时随地触发AI执行”这一能力的需求密度。当大模型的竞争从生成式问答转向执行任务,执行链路就需要一个更靠近用户身体的物理锚点。 豆包选择的落点是操作系统,以“操作系统级合作”模式切入AI手机赛道,通过与手机厂商在系统层面合作,获得识别屏幕UI元素、模拟人工操作的核心权限;千问选择的是眼镜,千问AI眼镜上线首批“AI办事”能力后,支持话费充值、扫码骑车、停车缴费、语音点外卖。这些功能的共同特征是,AI开始在真实世界里把事情做完。 两条路径的本质,是两家公司对同一个问题给出的不同工程答案:究竟改由谁来做Agent执行链路的物理接口。 两种优势的两种延伸 大模型公司做硬件,实际上是在回答一个从Token经济学中衍生出来的问题。 过去两年的AI竞争,核心战场在模型能力和价格。价格战把Token单价从三年前的高点压低了约300倍。但单价的崩塌没有让