在电商的浩瀚宇宙中,Shopee 宛如一颗璀璨星辰,吸引着无数卖家与买家在此汇聚。对于电商从业者、市场调研人员或是数据分析师而言,获取 Shopee 店铺的商品信息就如同掌握了开启财富之门的钥匙。而爬虫技术,正是帮助我们高效获取这些宝贵数据的强大工具。
想象一下,当你想要深入了解竞争对手的商品策略,或是挖掘市场潜在的热门品类时,若能一键获取 Shopee 店铺的所有商品信息,那将是多么令人兴奋的事情。爬虫就可以实现这一点,它能快速、准确地抓取商品的名称、价格、销量、评价等关键信息,为你的决策提供坚实的数据支撑。
以下是一个使用 Python 编写的爬虫示例,带你轻松获取 Shopee 店铺的所有商品:
python
import requests
import time
import json# 替换为目标店铺的 ID
shop_id = "123456"
# 初始化商品列表
all_products = []
# 起始页码
offset = 0
# 每页商品数量
limit = 50while True:url = f"https://shopee.com.my/api/v4/search/search_items?by=relevancy&keyword=&limit={limit}&newest={offset}&order=desc&page_type=shop&scenario=PAGE_OTHERS&shop_id={shop_id}&version=2"headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36","Accept": "application/json","Referer": f"https://shopee.com.my/shop/{shop_id}",}try:response = requests.get(url, headers=headers)response.raise_for_status()data = response.json()items = data.get("items", [])if not items:breakfor item in items:product = {"name": item["item_basic"]["name"],"price": item["item_basic"]["price"] / 100000,"sold": item["item_basic"]["sold"],"rating": item["item_basic"]["item_rating"]["rating_star"]}all_products.append(product)offset += limit# 避免频繁请求被封禁time.sleep(1)except requests.RequestException as e:print(f"请求出错: {e}")breakexcept (KeyError, json.JSONDecodeError):print("解析数据出错")break# 打印所有商品信息
for product in all_products:print(product)
在上述代码中,我们首先设置了目标店铺的 ID,然后通过循环不断请求不同页码的商品数据。每次请求后,我们解析返回的 JSON 数据,提取商品的关键信息并添加到商品列表中。为了避免因频繁请求而被封禁 IP,我们在每次请求后添加了 1 秒的延时。当没有更多商品数据时,循环终止。
有了这样的爬虫,你可以轻松地对 Shopee 店铺的商品数据进行分析,洞察市场趋势,制定更具竞争力的商业策略。无论是优化自家商品定价,还是开发新的产品品类,这些数据都将成为你最可靠的伙伴。别再犹豫,赶紧拿起代码,开启你的 Shopee 数据探索之旅吧!