七 Python爬虫之appium的使用

阅读: 评论:0

七 Python爬虫之appium的使用

七 Python爬虫之appium的使用

一 环境安装

1.1 安装node.js

  1. 点击进入 /
  2. 点击下载安装包
  3. 双击安装包,然后同样一路狂点下一步
  4. 安装完成后在cmd终端中输入 node -v,显示版本号则表示安装成功

1.2 安装java JDK

  1. 点击进入官网下载页面 .html

    下载后双击安装即可
  2. 配置java环境变量
    略。。。(找度娘,一找一堆)

1.3 安装android SDK

  1. 进入网站 /
  2. 依次点击AndroidSDK工具>>SDK Tools>>会跳转到以下界面,Windows建议选择.exe后缀

  3. 下载后安装

    注意此处,点击第一项,为所有用户安装


    如果不小心关闭了,或者没有自动打开上边的界面,点击安装目录下的文件,同样可以打开,已经自动打开的忽略此步。


下载完成后,你的sdk文件夹下,应该是这样的

4.安装环境变量

  • ANDROID_HOME
    C:...Androidandroid-sdk

  • Path
    %ANDROID_HOME%tools
    %ANDROID_HOME%platform-tools


1.4 安装Appium

  1. 需要科学上网 /
  2. 点击下载并安装


1.5 安装夜神模拟器

  1. 下载并安装夜神模拟器 /
  2. 首先,下载完成后不要忙着打开夜神模拟器,先确保你的电脑Hyper-V是关闭的,否则启动模拟器时部分电脑会蓝屏重启。
  3. 把安卓sdk中的复制两份,其中一个改名为后,放到夜神模拟器安装目录的bin目录下覆盖原文件


二 联调测试环境

2.1 开启并设置夜神安卓模拟器


2.2 adb命令建立连接

  1. 在夜神模拟器安装路径下的bin目录下执行cmd进入终端

  2. 输入 adb devices后,出现提示

    List of devices attached
    * daemon not running; starting now at tcp:5037
    * daemon started successfully
    
  3. 再输入 connect 127.0.0.1:62001后,出现提示

    connected to 127.0.0.1:62001
    
  4. 最后再次输入adb devices后,出现提示

    List of devices attached
    127.0.0.1:62001 device
    

2.3 开启Appium并配置运行

  1. 获取app包名和进程名

    • 打开夜神模拟器中的浏览器

    • 在adb连接正确的情况下,在夜神模拟器安装目录的bin目录下的cmd中输入adb shell

    • 进入adb shell后输入 dumpsys activity | grep mFocusedActivity

    • com.android.browser就是app包名

    • .BrowserActivity就是进程名



2. 启动Appium,点击start server

3. 点击放大镜进入并输入测试配置


4. 配置参数的来源

  • platformName 系统名 Android

  • platformVersion 系统版本 4.4.2

  • deviceName 手机型号 SM-G955F

  • appPackage app的包名 com.android.browser

  • appActivity app的进程名 .BrowserActivity

  1. 关闭夜神模拟器中的浏览器,点击右下角的start session查看运行结果


    至此,环境搭建成功

三 安装appium-python-client模块并启动已安装好的环境

3.1 安装appium-python-client模块

在window的虚拟环境下执行pip install appium-python-client

3.2 启动夜神模拟器,进入夜神模拟器所在的安装路径的bin目录下,进入cmd终端,使用adb命令建立adb server和模拟器的连接

  1. adb devices
C:Program Files (x86)Noxbin>adb devices
List of devices attached
* daemon not running; starting now at tcp:5037
* daemon started successfully
  1. connect 127.0.0.1:62001
C:Program Files (x86)Noxbin> connect 127.0.0.1:62001
already connected to 127.0.0.1:62001
  1. adb devices
C:Program Files (x86)Noxbin>adb devices
List of devices attached
127.0.0.1:62001 device

3.3 启动appium-desktop,点击start server启动appium服务

[Appium] Welcome to Appium v1.10.0
[Appium] Appium REST http interface listener started on 0.0.0.0:4723

3.4 利用上一小节所学习的内容获取Desired Capabilities参数

  1. 获取模拟设备的型号
    • 打开设置——关于平板电脑
    • 查看型号,获取模拟设备的型号
  2. 获取app包名称 以及 app进程名
    • 打开模拟器中的抖音短视频app
    • 在adb连接正确的情况下,在夜神模拟器安装目录的bin目录下的cmd中输入adb shell
    • 进入adb shell后输入 dumpsys activity | grep mFocusedActivity
    • ``com.ss.android.ugc.aweme`就是app包名
    • .main.MainActivity就是进程名 注意前边有个点.

四 初始化以及获取移动设备分辨率

完成代码如下,并运行代码查看效果:如果模拟器中抖音app被启动,并打印出模拟设备的分辨率则成功

from appium import webdriver# 初始化配置,设置Desired Capabilities参数
desired_caps = {'platformName': 'Android','deviceName': 'SM-G955F','appPackage': 'com.ss.android.ugc.aweme','appActivity': '.main.MainActivity'
}
# 指定Appium Server
server = 'localhost:4723/wd/hub'
# 新建一个driver
driver = webdriver.Remote(server, desired_caps)
# 获取模拟器/手机的分辨率(px)
width = _window_size()['width']
height = _window_size()['height']
print(width, height)

移动设备分辨率

  • <_window_size()[‘width’]

  • <_window_size()[‘height’]

五 定位元素以及提取文本的方法

5.1 点击appium desktop右上角的放大镜图标

如图填写配置,并点击start session

5.2 定位界面的使用方法如下图所示

5.3 点击短视频的作者名字,查看并获取该元素的id

5.4 在python使用代码通过元素id获取该元素的文本内容

实例化appium driver对象后添加如下代码,运行并查看效果

# 获取视频的各种信息:使用appium desktop定位元素
print(driver.find_element_by_id('bc').text)  # 发布者名字
print(driver.find_element_by_id('al9').text)  # 点赞数
print(driver.find_element_by_id('al_').text)  # 留言数
print(driver.find_element_by_id('a23').text)  # 视频名字,可能不存在,报错
  • 定位元素及获取其文本内容的方法

    • driver.find_element_by_id(元素的id).text
    • driver.find_element_by_xpath(定位元素的xpath规则).text

六 控制抖音app滑动

6.1 appium滑动的函数

从(start_x, start_y)滑动到(end_x, end_y)

  • driver.swipe(start_x, start_y, end_x, end_y)

6.2 控制抖音app滑动的代码实现

start_x = width // 2  # 滑动的起始点的x坐标,屏幕宽度中心点
start_y = height // 3 * 2  # 滑动的起始点的y坐标,屏幕高度从上开始到下三分之二处
distance = height // 2  # y轴滑动距离:屏幕高度一半的距离
end_x = start_x # 滑动的终点的x坐标
end_y = start_y-distance # 滑动的终点的y坐标
# 滑动
driver.swipe(start_x, start_y, end_x, end_y)

七 整理并完成自动滑动的代码

import time
from appium import webdriverclass DouyinAction():"""自动滑动,并获取抖音短视频发布者的id"""def __init__(self, nums:int=None):# 初始化配置,设置Desired Capabilities参数self.desired_caps = {'platformName': 'Android','deviceName': 'SM-G955F','appPackage': 'com.ss.android.ugc.aweme','appActivity': '.main.MainActivity'}# 指定Appium Serverself.server = 'localhost:4723/wd/hub'# 新建一个driverself.driver = webdriver.Remote(self.server, self.desired_caps)# 获取模拟器/手机的分辨率(px)width = _window_size()['width']height = _window_size()['height']print(width, height)# 设置滑动初始坐标和滑动距离self.start_x = width//2 # 屏幕宽度中心点self.start_y = height//3*2 # 屏幕高度从上开始到下三分之二处self.distance = height//2 # 滑动距离:屏幕高度一半的距离# 设置滑动次数self.nums = numsdef comments(self):# app开启之后点击一次屏幕,确保页面的展示time.sleep(2)self.driver.tap([(500, 1200)], 500)def scroll(self):# 无限滑动i = 0while True:# 模拟滑动print('滑动')self.driver.swipe(self.start_x, self.start_y,self.start_x, self.start_y-self.distance)time.sleep(_infos() # 获取视频发布者的名字# 设置延时等待time.sleep(4)# 判断是否退出if self.nums is not None and self.nums == i:breaki += 1def get_infos(self):# 获取视频的各种信息:使用appium desktop定位元素print(self.driver.find_element_by_id('bc').text) # 发布者名字print(self.driver.find_element_by_id('al9').text) # 点赞数print(self.driver.find_element_by_id('al_').text) # 留言数print(self.driver.find_element_by_id('a23').text) # 视频名字,可能不存在,报错# # 点击【分享】坐标位置 671,1058# self.driver.tap([(671, 1058)])# time.sleep(2)# # 向左滑动露出 【复制链接】 580,1100 --> 200, 1100# self.driver.swipe(580,1100, 20, 200, 1100)# # _screenshot_as_file('./a.png') # 截图# # 点击【复制链接】 距离右边60 距离底边170 720-60,1280-170# self.driver.tap([(660, 1110)])# # _screenshot_as_file('./b.png')  # 截图def main(self):selfments() # 点击一次屏幕,确保页面的展示time.sleep(2)self.scroll() # 滑动if __name__ == '__main__':action = DouyinAction(nums=5)action.main()

至此,可以参考爬虫5.0课程项目库,使用fiddler等抓包工具,利用appium+mitmproxy+wget等python模块自动获取抖音视频文件

八 关于模拟式移动端爬虫的参考阅读

  1. /

本文发布于:2024-01-31 05:49:23,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170665136526002.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:爬虫   Python   appium
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23