构建小红书(RedNote)电商爬虫以获取红店商品数据

发布日期:2026-05-06 10:00:26   浏览量 :2
发布日期:2026-05-06 10:00:26  
2

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

当小红书(RedNote / Little Red Book / 小红书)在 2026 年 4 月推出其面向美国的电子商务平台“红店”(RedShop)时,我注意到阿皮菲(Apify)上现有的所有网络爬虫仅覆盖社交方面:帖子、个人资料、评论和视频。它们均未涉及商品列表、供应商目录或定价数据。

因此,我构建了一个专用的爬虫。

为什么需要专用的商店爬虫?

小红书在中国平台中与众不同,因为商品列表位于与社交帖子不同的统一资源定位符(URL)空间中。全能型社交爬虫处理的是 /explore/ 下的帖子页面。而“红店”的商品则位于 /goods-detail/ 背后,具有完全不同的结构。

试图从“社交”爬虫中提取商品数据意味着需要使用笨拙的变通方法。专用的商业聚焦工具为您提供:

  • 结构化的商品字段(价格、销量、库存量单位(SKU)变体、供应商元数据)
  • 对供应商/店铺浏览的原生支持
  • 跨境与国内商品的标记
  • 更清晰的定价模式:按商品收费,而非按“结果”收费

它提取什么内容

对于每个商品:

  • 商品标识(itemId)、标题、商品链接(productUrl)
  • 销售价格、原价、折扣百分比、货币(国内商品为人民币(CNY),跨境商品为美元(USD))
  • 销量、想要人数(受欢迎程度信号)
  • 封面图、图片列表
  • 供应商(卖家标识(sellerId)、名称、评分)
  • 分类路径
  • 库存量单位(SKU)(包含价格和库存的变体)
  • 跨境标记和发货来源地

三种模式

模式 功能描述
product_search 通过关键词搜索商品,按价格/销量排序,按价格范围筛选
vendor_products 获取特定卖家的完整目录
product_detail 深入抓取特定商品链接(完整的库存量单位(SKU)细分)

实际应用场景

  • 直接面向消费者(DTC)品牌:在中国排名第一的社交电商平台上监控您自己的商品列表和竞争对手定价
  • 代发货商和转售商:在中国潮流产品登陆亚马逊(Amazon)或爱特西(Etsy)之前发现它们
  • 跨境套利:识别在中国流行但尚未进入西方市场的库存量单位(SKU)
  • 投资分析师:追踪中国消费品牌的电子商务活动
  • 采购代理:为化妆品、时尚或家居用品领域的客户大规模搜寻中国商品

结合 RedNote 全能爬虫(社交端),您可以将商品与标记它们的网红联系起来——这对于网红与商品关联性研究极具价值。

如何使用

from apify_client import ApifyClient

client = ApifyClient("YOUR_APIFY_TOKEN")

run = client.actor("zhorex/rednote-shop-scraper").call(run_input=

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部