是否可以使用 Scrapy 从使用 AJAX 的网站抓取动态内容?
我最近一直在学习Python,并且正在投入到构建Web抓取器中。这根本不是什么花哨的东西;它的唯一目的是从博彩网站获取数据,并将这些数据放入Excel中。
大多数问题都是可以解决的,我周围有一个很好的小混乱。然而,我在一个问题上遇到了一个巨大的障碍。如果网站加载马匹表并列出当前投注价格,则此信息不在任何源文件中。线索是,这些数据有时是实时的,数字显然是从某个远程服务器更新的。我PC上的HTML只是有一个洞,他们的服务器正在推送我需要的所有有趣数据。
现在我对动态Web内容的经验很低,所以这件事是我很难弄清楚的事情。
我认为Java或Javascript是一个关键,这经常弹出。
刮刀只是一个赔率比较引擎。有些网站有API,但我需要那些没有API的网站。我正在使用Python 2.7的废料库
如果这个问题过于开放,我很抱歉。简而言之,我的问题是:如何使用purpery来抓取这些动态数据,以便我可以使用它?这样我就可以实时抓取这个投注赔率数据了吗?