灰熊报告里公布的爬取数据技术解读

杰森张
2020-06-03
$跟谁学(GSX)$

灰熊公布的做空报告爬取的数据在Github上了,有兴趣可以去看看

https://github.com/67647f8/gsx-fraud

纯从技术上解读一下数据结构,和股价怎么关联请自行判断

几点看法

1、 $跟谁学(GSX)$ 的技术挺烂的。

2、安全防护做的非常弱,明码裸奔,做空机构能轻易爬取这些数据,相信竞争对手也可以,甚至是不是黑客可以轻松盗取到用户数据,算是个定时炸弹。

3、码农比较懒,如果已经996了,那就是能力问题,可以末位淘汰一下了。


免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

  • 面对疾风呀
    2020-06-04
    面对疾风呀

    这老哥应该不懂技术,这里有几个问题


    1. 抓接口不很正常么?或者请您给出一个可以抓不到http的方式?


    2. clazz为什么不用class您可以百度下代码里的class什么意思


    3. v6v7升级是技术内部升级。要真像你说的,为什么不在原有的版本上改呢,还要加版本号


    4. 至于enrollment_count字段,我都不太想解释...接口里面字段就一定是真实数据吗。比方说刚上架一门课就显示已报名0人,你还会去买吗,肯定显示的假数据啊对不对,吸引消费者嘛,所以这个值肯定不能代表真实报名人数啊,稍微在互联网公司呆过的都知道吧。如果就以这个来判定造假的话。。。洗洗睡吧


    这个报告也就忽悠不懂技术的了,哎,白兴奋一场。今天来开始没戏了,大家回去好好准备准备,下次拿出强有力的证据,空他!!!

  • 杰森张
    2020-06-03
    杰森张

    跟谁学目前在线的API版本有V6,V7,V5已经强制下线,提示升级了,灰熊爬取的数据应该是V5及以前的,enrolled_count有详细数字,报告里的重点也是这个数字的问题。

    V7和V6的主要区别,就是删除了enrolled_count,left_count和subclazz_left_count这3个数据项,干脆连0都不返回了

    这就比较有意思了,赶紧打电话叫码农起床发新版本啊,直接到V10

  • Julio堂
    2020-06-04
    Julio堂
    多个字段就是码农偷懒啊,只是个前后端联习惯问题
    • Julio堂回复杰森张
      好吧,有道理
    • 杰森张
      极端点的说法,会增加网络传输数据量,在极端情况下,会透支网络资源
  • cicicicci
    2020-06-04
    cicicicci
    大哥这都是公开数据,有什么可说的
    • 杰森张

      以应用和页面的形式公开和直接后台接口被抓到是两个层级的

  • 约旦河北岸
    2020-06-03
    约旦河北岸
    已经实锤了,跟谁学修改了参数就是此地无银三百两
  • 小虎AV
    2020-06-04
    小虎AV
    原来代码是这么看的 [666] [666] [强]
发表看法
26
7