1、SPY/QQQ高开低走,出现高位震荡的行情。SQCG-0.30%,和大盘基本保持一致。
2、“鳄指”三线开始走平,但是向上趋势不变。20线维持80%区间,50线维持50%区间,200线维持60%群间。市场比较疲弱,主题炒作风格不明显,但是也没有出现明显的Following through(持续卖盘),市场总体健康。
3、最近,一家来自中国的AI初创公司DeepSeek以前所未有的低成本实现了高性能,引起整个市场的强烈关注。
①去年12.26,DeepSeek发布的V3模型在多项基准测试中表现超过Meta的Llama4。而拥有6710亿参数的DeepSeek-V3训练成本仅为558万美元,仅仅耗费260万个GPU小时,用低配版还是英伟达H800芯片。相比之下,Meta的Iama3模型已经花费3930万个GPU小时,用的还是高性能的H100。
②今年1.20,DeepSeek发布性能更强的R1模型,其在数学、语言、自然推理等方面已经和OpenAI的最新模型不相上下。此外,其在发布模型的同事还开源了权重,倒是给了市场窥见真容的机会。DeepSeek这样的表现也让Meta的整个生成式AI团队压力巨大,高额的成本开始面对质疑。
③我不懂技术,但是我在ChatGPT帮助下,从逻辑的角度说一下我对这件事看法:
A、总结X上面各种技术帖子,和最近AMD等公司的表态,我基本还是认为这张表的结果应该是真的。
B、而且,从结果来看,不同模型在各种任务中的表现差异较大,例如在数学和代码领域,某些模型的表现明显优于其他模型。这种差异符合现实中不同模型在特定任务上有不同优化的情况。
C、所以,某些高分可能存在过度拟合某一任务或在特定数据集上表现优异的情况,不具备泛化能力。模型可能经过了专门的微调或优化,尤其是针对某些特定基准(如数学或编程代码),这些模型可能在特定任务上表现得特别好,但在其他任务上可能没有那么突出。
D、简而言之,DeepSeek应该是根据测试进行了针对性的优化,并且很可能限制了测试的范围。就像是考试能够拿到考题并做了一遍的学生,这样的高分和其实际能力都有待商榷。相信我们都很能体会中国人这种做事的方式。
E、当然,市场上也有阴谋论者认为这是华尔街的炒作,目的是打压AI公司股价,获得再一次建仓空间。我只能说这算是一种可能性吧,甚至还有点期待。这样我们也能跟着一起继续完成我们的建仓。
4、虽然春节将至,大家都迎来了难得假期,但是对于美股交易员来说,假期生活其实变化不大,特别是初一晚上注定是一个不眠之夜:
①2:00美联储利率决定会议之后,2:30会有鲍爷的演讲。由于这次会议没有点阵图和报告,从鲍爷演讲当中找寻美联储下一步动作的线索就显得尤为重要。
②盘前阿斯麦、盘后特斯拉、Meta、微软都会公布财报,这四家公司的财报状况极有可能影响整个2月份市场的走向,我们也要为此做好充分的应对和准备。
最后,祝我的家人和朋友们春节快乐,身体健康。
精彩评论