博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
day03 爬取京东商品信息
阅读量:4551 次
发布时间:2019-06-08

本文共 2542 字,大约阅读时间需要 8 分钟。

'''初级版:    form tank!'''import timefrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysdriver = webdriver.Chrome()try:    driver.implicitly_wait(10)    #往京东发送请求    driver.get('http://www.jd.com/')    #往京东主页输入框输入墨菲定律,按回车键    input_tag = driver.find_element_by_id('key')    input_tag.send_keys('墨菲定律')    input_tag.send_keys(Keys.ENTER)    time.sleep(5)    #js_code = '''    #window.    #'''    good_list = driver.find_elements_by_class_name('gl-item')    for good in good_list:        #print(good)        #商品名称        good_name = good.find_element_by_css_selector('.p-name em').text        print(good_name)        #商品链接        good_url = good.find_element_by_css_selector('p-name a').get_attribute('href')        print(good_url)        #商品价格        good_price = good.find_element_by_css_selector('p-price').text        #print(good_price)        #商品评价        good_commit = good.find_element_by_css_selector('p_commit').text        good_content = f'''        商品名称:{good_name}        商品链接:{good_url}        商品价格:{good_price}        商品评价:{good_commit}        \n        '''        print(good_content)        with open('jd.txt','a',encoding='utf-8')as f:            f.write(good_content)    print('商品信息写入成功')finally:    driver.close()

 

'''狂暴版'''import timefrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysdriver = webdriver.Chrome()try:    driver.implicitly_wait(10)    #往京东发送请求    driver.get('http://www.jd.com/')    #往京东主页输入框输入墨菲定律,按回车键    input_tag = driver.find_element_by_id('key')    input_tag.send_keys('墨菲定律')    input_tag.send_keys(Keys.ENTER)    time.sleep(5)    #js_code = '''    #window.    #'''    good_list = driver.find_elements_by_class_name('gl-item')    for good in good_list:        #print(good)        #商品名称        good_name = good.find_element_by_css_selector('.p-name em').text        print(good_name)        #商品链接        good_url = good.find_element_by_css_selector('p-name a').get_attribute('href')        print(good_url)        #商品价格        good_price = good.find_element_by_css_selector('p-price').text        #print(good_price)        #商品评价        good_commit = good.find_element_by_css_selector('p_commit').text        good_content = f'''        商品名称:{good_name}        商品链接:{good_url}        商品价格:{good_price}        商品评价:{good_commit}        \n        '''        print(good_content)        with open('jd.txt','a',encoding='utf-8')as f:            f.write(good_content)    print('商品信息写入成功')finally:    driver.close()

 

转载于:https://www.cnblogs.com/zaccheo/p/11125037.html

你可能感兴趣的文章
Bootstrap中点击后禁用按钮的最佳方法
查看>>
【重点】Shell入门教程:流程控制(2)条件判断的写法
查看>>
$.get
查看>>
1019.安全技能树
查看>>
TP框架的SESSION <尾部封装了一个返回字符串长度的方法>
查看>>
移动设备外观设计的基础知识
查看>>
quick-cocos2d-x添加到Pomelo的支持
查看>>
JS基本内容 套路 脚本语言
查看>>
20175316盛茂淞 2018-2019-2 《Java程序设计》第3周学习总结
查看>>
zookeeper安装
查看>>
js清空页面控件值
查看>>
Appium使用Python运行appium测试的实例
查看>>
django request bug
查看>>
浏览器的post,get。
查看>>
什么是fortran语言之fortran语言入门
查看>>
开启GDB
查看>>
●POJ 2187 Beauty Contest
查看>>
二叉树_非递归先中后序_递归非递归求深度
查看>>
print(__file__)返回<encoding error>的问题
查看>>
122. 买卖股票的最佳时机 II
查看>>