如何使用Python构建打字机器人,以及进行Web抓取

众所周知,Python作为编程语言的一种,不仅语法简单、易学并且很有前途,很多人都对Python感兴趣。Python的应用十分广泛。经常关注我的朋友可能知道,关于Python的使用,之前已经为大家介绍了很多用法,今天主要介绍两个方面的内容,一个是如何使用Python构建打字机器人,另一是如何使用Python进行Web抓取的内容。

如何使用Python构建打字机器人,以及进行Web抓取_人工智能_机器人

 一、如何使用Python构建打字机器人

先决条件

pip install selenium

代码段

# Importing required modules and initializing variablesfrom selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsimport re

string = ''

# ______________________________________

# Opening thetypingcat.com on firefox

firefox = webdriver.Firefox()

firefox.get

# ______________________________________

# Using javascript to get the typing content from the website and storing value in "string" variablefor i in range(firefox.execute_script('return document.querySelectorAll(".line").length')):

string += firefox.execute_script('return document.querySelectorAll(".line")['+str(i)+'].innerHTML')

string = re.sub(r'<[^>]*>','',string) #This line is just delete tags present inside string

# ______________________________________

# Selenium commands to type what is stored inside string variable on the focused screen

action = ActionChains(firefox)

action.send_keys(string)

action.perform()

# ______________________________________ END ______________________________________

 二、如何使用Python进行Web抓取

仅需9行代码即可使用Python进行Web抓取。

先决条件

如果还没有安装,请安装beautifulsoup4和请求。

pip install beautifulsoup4

pip install requests

代码段

import requestsfrom bs4 import BeautifulSoup

result = requests.get

soup = BeautifulSoup(result.content)

links = soup.find_all("a", "title")

data = {}for link in links:

title = link.string

data[title] = link.attrs['href']

这里是完整的代码段,您可以将其直接复制并粘贴到终端,收藏的文本编辑器或jupyter笔记本中。

要检查您是否正确执行了该操作,数据输出应类似于以下内容:

{'MSI GL62VR 7RFX': '/test-sites/e-commerce/allinone/product/326',

'Dell Vostro 15…': '/test-sites/e-commerce/allinone/product/283',

'Dell Inspiron 17…': '/test-sites/e-commerce/allinone/product/296'}

Web抓取功能很棒,当您想从网站中快速提取数据时,可以节省大量时间。上面的示例可帮助您快速入门。

好了以上就是关于如何使用Python构建打字机器人,以及进行Web抓取的全部内容介绍,想了解更多关于Python的信息,请继续关注。

13
124
0
62

相关资讯

  1. 1、南加州大学研究人员增强AR眼镜改善低视力患者日常生活3547
  2. 2、软银和谷歌正建立空中无线基站,有望扩大偏远地区网络连接4436
  3. 3、LoRa联盟在2018年实现爆发式增长,覆盖全球100多个国家4613
  4. 4、全球超算榜单公布500强中国占比31%,“TOP500”榜单前十名单2214
  5. 5、豪威科技图像传感器增加光波导特性提升运动物体拍摄效果3836
  6. 6、传感器材料突破!青岛大学等研制出仿生结构高弹性导电纤维1178
  7. 7、Marvell以6.5亿美元收购格芯的Avera部门,开发ASIC芯片4892
  8. 8、点胶机的分类,具体的有哪些?5048
  9. 9、软件电话会议系统的优缺点839
  10. 10、上海发布智能制造三年行动计划,建设100家国家级示范性智能工厂2262
全部评论(0)
我也有话说
0
收藏
点赞
顶部