转载

Google技巧拿到淘宝历史成交记录接口

本文作者:leopard7777777

前言:从1月27号开始,淘宝、天猫决定,不再把每样商品的具体成交记录告诉你,只保留总销量数据、以及它在全网的销售排名。

结果:在”累计评价“最后的历史交易div被删除。从http流量中也未获取到相应的痕迹

思路一

首先要找到原先的div是如何展示、获取数据的。那么通过搜索引擎的快照,获取详情页的旧版信息。百度爬虫默认是被taobao屏蔽的,所以通过google进行尝试

Google技巧拿到淘宝历史成交记录接口

找到有快照的地址,可以根据日期范围过滤并排序

Google技巧拿到淘宝历史成交记录接口

找到过去的一个历史成交记录的接口(PS:此处少了一个环节,因为文章是最近写的,快照更新过了)

https://detailskip.taobao.com/service/getData/1/p1/item/detail/showBuyerList.htm?step=false&page_size=15&ends=1453428291000&starts=1452823491000&item_id=38452658757&sold_total_num=16&seller_num_id=152925940&dk=0&title=%25E5%2585%258D%25E8%25B4%25B9%25E7%259B%25B4%25E9%2582%25AE%25E8%258B%25B1%25E5%259B%25BDUK%25E5%2593%2581%25E7%2589%258CNature%2527s%2BBest%2B%25E5%258F%25B6%25E9%25BB%2584%25E7%25B4%25A0%2B120%25E7%25B2%2592%25E8%25A3%2585&sbn=8a6325756cb404196e50938cfe6ca91c&isTKA=false&msc=1&modules=showBuyerList

Google技巧拿到淘宝历史成交记录接口

但现在已经不能使用了

思路二

站在开发者的角度,大项目的接口地址均不同部门或不同小组分工完成,因此其中接口的名称定义必须是一目了然。根据旧接口的route,尝试用inurl: showBuyerList site:taobao.com去搜索试试

Google技巧拿到淘宝历史成交记录接口

只得到两条结果

Google技巧拿到淘宝历史成交记录接口

Json的url中 Taobao Query ,但并没有什么卵用,sec二级域是用于安全认证的

仔细往下阅读英文

Google技巧拿到淘宝历史成交记录接口

得到了更多的链接

Google技巧拿到淘宝历史成交记录接口

大概10页的链接,均没有什么卵用

思路三

仍然是站在开发者的角度,一个念头浮现,showBuyerList是用驼峰法去定义名称,那么我用下划线_ 分割的名称定义去搜索试试

Google技巧拿到淘宝历史成交记录接口

同理展示更多结果

Google技巧拿到淘宝历史成交记录接口

Google技巧拿到淘宝历史成交记录接口

有布局格式,这个很关键,虽然没有数据,也没有关系

思路四

同上,bid_page=9&item_id=22315247651&seller_id=1028185725&page_size=10,每一个key都是一目了然

seller_id:卖家ID

item_id:商品ID(非SKU)

bid_page:第几页

page_size:一页几个

组合一个可用的地址:

https://licai.taobao.com/json/show_buyer_list.html?bid_page=1&item_id=525850484428&seller_id=2455547464&page_size=10

Google技巧拿到淘宝历史成交记录接口

根据成交记录结合流量来源和行业转化,可以分析出竞争对手的爆款操作模式,做过啥活动,刷过多少单,都可以推导。虽说这些数据也推算不出什么权重组合或拟合预测,但我相信控制变量法,是个商家都会用。不过我敢说公开后第二天这个接口就不能用了,留个图做个纪念,反正我也不做淘宝。

扫描插件

最后附上一个scrapy,拿去耍,请求频率无限制

https://github.com/leopard7777777/taobao_deal_history

小结

这个接口大概是我几个月前弄到,文章是最近写的,google快照大概30-90天更新一次taobao.com下的站点,所以你们现在去看快照,更新日期都是在四五月份,所有的页面历史成交接口都不显示,所以永远也无法重现过程,但旧接口和lical的接口依旧被收录,中间断了一个环节。

当时,研究淘宝搜索入口很久了,做了许多淘宝旗下数据平台的爬虫,所以拿下这个接口大概就花了30分钟。后来,我去做了跨境电商ERP和amazon爬虫,发现淘宝的反爬虫做的是国际一流的。然后投了个简历到阿里,被丑拒,工作年限不足直接刷,怒而爆接口,然后我听说最近生意参谋查的很严,但跟我也没有什么关系。

*本文作者:leopard7777777,本文属FreeBuf原创奖励计划,未经许可禁止转载

原文  http://www.freebuf.com/articles/web/109314.html
正文到此结束
Loading...