怎么采集京东商品详情页信息?八爪鱼采集器使用教程

京东工具2年前 (2021)发布 清蒸鲈电商
17.5K 0 0

本文主题京东开店,京东新品上架,商品采集,京东开店,八爪鱼,京东工具。

怎么采集京东商品详情页信息?八爪鱼采集器使用教程

不懂网络爬虫技术,怎么去采集其他网店商品信息呢?电商运营官这里给大家介绍一个可以

采集多平台信息

的工具—

八爪鱼

。让不懂网络爬虫技术的我们,也可以轻松采集数据信息。下面就以京东商品详情页采集为例,一起来看看八爪鱼采集器的使用教程吧~

一、八爪鱼介绍

八爪鱼全球百万用户信赖的数据采集器。满足多种业务场,适合产品、运营、销售、数据分析、政府机关、电商从业者、学术研究等多种身份职业。

使用场景:

1、电商:

京东、淘宝、Amazon、速卖通、百度爱采购平台信息采集

2、设计媒体:

微博、搜狗微信、知乎、b站、豆瓣等平台评论、、视频、热点采集

3、新闻资讯

今日头条文章采集、首页新闻采集

4、生活服务

168孔夫子、百度、58同城、天眼查、携程等平台信息采集

5、金融

东方财富、同花顺、银保监、雪球、股吧等平台数据、公告采集

6、房产

小猪短租、赶集网、百姓网、游天下、58同城、房天下等平台房源数据采集

二、【京东】商品详情页采集教程

下面电商运营官就以京东商品详情页为例,给大家带来八爪鱼的使用教程。

步骤一、打开网页

在首页输入框中,输入网址https://item.jd.com/100006607659.html#crumb-wrap(举例),然后点击【开始采集】,八爪鱼自动打开网页。

怎么采集京东商品详情页信息?八爪鱼采集器使用教程

电商运营官特别说明:

打开网页后,如果开始开始【自动识别】,请等待自动识别完成。八爪鱼支持自动识别网页上的列表、滚动和翻页,识别成功后直接启动采集即可获取数据。如果【自动识别】的结果不是我们需要的,可点击【取消】关闭智能识别,自行配置采集流程。

步骤二、循环点击颜色属性,并提取对应文本

通过以下几步,实现点击每个颜色属性并提取对应文本

1、循环点击颜色属性

2、提取颜色属性的文本

3、将循环点击颜色属性与提取颜色文本联动起来

1、循环点击颜色属性

①选中页面上第1个颜色属性

②在黄色操作提示框中,选择【选中全部】

③选择【循环点击每个链接】

3、将循环点击颜色属性与提取颜色文本联动起来

进入【提取数据】设置页面,勾选【采集当前循环中设置的元素】后保存。

点击【颜色】字段后的按钮,勾选【相对于循环里的XPath】后保存。

怎么采集京东商品详情页信息?八爪鱼采集器使用教程

步骤三、循环点击版本属性,并提取对应版本文本

通过以下几步,实现点击每个版本属性并提取对应文本

1、循环点击版本属性

①选中页面上第1个版本属性

②在黄色操作提示框中,选择【选中全部】

③选择【循环点击每个链接】

a.经过以上连续3步,【循环-点击元素】创建完成。【循环】中的项,对应着页面上所有版本属性。启动采集以后,八爪鱼就会按照循环中的顺序依次点击每个版本属性。

怎么采集京东商品详情页信息?八爪鱼采集器使用教程

2、提取版本属性的文本

选中页面中的版本属性框,在操作提示框中选择【采集该链接文本】,版本属性的文本提取下来。

3、将循环点击版本属性与提取版本文本联动起来

进入【提取数据】设置页面,勾选【采集当前循环中设置的元素】后保存。

点击【版本】字段后的按钮,勾选【相对于循环里的XPath】后保存。

步骤四、提取其他字段

选中页面中的文本,然后在操作提示框中,点击【采集该元素文本】。

文本类字段都可以按照这样的方式提取。示例中我们提取了商品标题、商品价格、主图链接、商品编号等多个字段。

特别说明:

a.文本、图片、视频、源码是不同的数据形式,在操作提示框选择提取方式时稍有不同。文本一般为【采集该元素文本】,图片一般为【采集该图片地址。

怎么采集京东商品详情页信息?八爪鱼采集器使用教程

步骤五、编辑字段

1、编辑字段

进入【提取数据1】设置页面,可删除多余字段,修改字段名,移动字段顺序等。

2、格式化字段

【商品名称】和【商品编号】这2个字段,默认提取的内容有与表头重复的部分。如果没关系,可跳过此步骤。

如果想要去掉内容中多余的部分,可使用数据格式化功能。

以【商品名称】格式化为例:点击字段后的按钮,选择【格式化数据】→点击【添加步骤】,选择【替换】,将【商品名称:】替换为【空】,输出【华为P40Pro】并保存。

怎么采集京东商品详情页信息?八爪鱼采集器使用教程

步骤六、启动采集

1、单击【采集】并【启动本地采集】。启动后八爪鱼开始自动采集数据。

特别说明:

a.【本地采集】是使用自己的电脑进行采集,【云采集】是使用八爪鱼提供的云服务器采集,点击查看本地采集与云采集详解。

2、采集完成后,选择合适的导出方式来导出数据。支持导出为Excel,CSV,HTML,数据库等。这里导出为Excel。

怎么采集京东商品详情页信息?八爪鱼采集器使用教程

那么以上就是全部的内容啦~在开店的过程中遇到问题,都可以来电商运营官官网搜索查找干货内容,或者点击页面最上方的卖家问答,解开疑惑哦~想要了解更多电商干货、电商运营工具,记得关注搜索电商运营官。

电商运营官为您更新最近最有用的电商资讯、电商规则京东开店,京东新品上架京东工具。了解更多电商资讯、行业动向,记得关注电商运营官!

© 版权声明

相关文章

没有相关内容!

暂无评论

暂无评论...