热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

用Python自动给抖音漂亮小姐姐视频点赞

用Python自动给抖音漂亮小姐姐视频点赞,Go语言社区,Golang程序员人脉社


先来看看这只爬虫做了些什么事儿呢?


  • 通过 ADB 控制你的手机,帮你自动刷抖音

  • 调用百度人脸识别的接口,给视频画面中出现的小姐姐打分

  • 自动给颜值 70 以上的小姐姐的视频点赞

有趣的是,根据抖音的推荐算法,连着刷几天之后,抖音里给你推荐的全是漂亮小姐姐了。


成果展示

先演示一下效果。

连接手机(手机要允许ADB调试),运行爬虫程序,程序会自动打开抖音APP,自动寻找漂亮的小姐姐啦。

有趣的是,根据抖音的推荐算法,连着刷几天之后,抖音里给你推荐的全是漂亮小姐姐了。刚开始刷的时候,可能几十条里都没有一个漂亮小姐姐,而刷几天之后,基本上刷到的每条视频里都是漂亮小姐姐。看,这是我刷了三天的 “成果”, 断断续续刷了三天时间,已经 “点赞” 了两百多条漂亮小姐姐的视频。

咱有一说一啊,先不管是不是因为抖音的美颜滤镜功能强大,单纯从爬虫爬到的视频来看,这些小姐姐是真的好看,结果还是令人满意的。

下面这个是抖音里检测到漂亮小姐姐的截图画面,本来这是作为临时文件,人脸检测完即删除的,我看着好看,就给留了下来。

这个爬虫程序大概就是这样,下面详细讲解一下,这个爬虫是怎么做出来的。

1. 基础准备 这个爬虫需要用到三个东西。Python 环境,爬虫程序是用 Python 写的,肯定要先配置好 Python 的环境啊。没有配好的自行去安装一下 Anaconda。

此外,还需要安装一些必要的库,如 requests,urllib,PIL等。ADB 环境,我们的爬虫需要通过 ADB 命令对手机进行操作,实现自动刷抖音,自动点赞的功能。安装方法自行百度。

人脸识别API,我这里用的是百度AI的人脸识别接口,大家需要自行注册一个百度AI 开放平台的账号,然后创建一个人脸识别的应用,然后将 appid,api_key,secret_key 三个参数填到爬虫代码这儿即可。

这里简单对 ADB 介绍一下。

ADB 的全称为 Android Debug Bridge,就是起到了调试桥的作用,用这个可以很方便地对安卓应用进行调试。

简单点说,就是你可以用这个工具来操作你的手机,它可以完成你在手机上能做的任何操作。

比如说安装/卸载/打开/关闭手机APP,滑动屏幕,点击,长按等等。更复杂的操作也能做,我们这里就不讲了,因为我们的这个抖音爬虫用到的 ADB 指令基本也就这些了。a. ADB 启动应用 只需要知道应用的 package_name 和 activity_name,然后调用下面的 adb 指令,即可打开相应的应用。

  1. adb shell am start -n [package_name] [activity_name] 

以抖音 APP 为例,它的 package_name 和 activity_name 如下。

  1. # 抖音App的应用包名和初始Activity  
  2. package_name = 'com.ss.android.ugc.aweme'  
  3. activity_name = 'com.ss.android.ugc.aweme.splash.SplashActivity' 

所以在命令行中运行下面的指令,即可打开手机中的抖音APP。

  1. adb shell am start -n com.ss.android.ugc.aweme com.ss.android.ugc.aweme.splash.SplashActivity 

b. ADB 点击屏幕

在命令行中运行下面指令,即可实现手机屏幕的点击。其中 1330 1750 是点击的 x y坐标。

  1. adb shell input tap 1330 1750 

以此爬虫里的抖音点赞为例,我只需要记录下抖音app中,点赞按钮对应的屏幕坐标,然后调用这句指令,即可完成自动点赞。

c. ADB 滑动屏幕

在命令行中运行下面指令,实现的是手机屏幕的滑动操作。其中有 5 个参数。这五个数字分别表示的是,滑动起始点的 x y 坐标,滑动终止点的 x y 坐标,滑动时长。

  1. adb shell input swipe 900 1400 400 1400 100 

比如上面这句指令表示的就是,从坐标(900,1400)的点,滑动到坐标 (400,1400)的点,滑动过程 100 毫秒。

其实,这句指令稍微改一改,把起始坐标和终止坐标设为一致,滑动时长设长一些,滑动操作就变成了 “长按屏幕” 操作了。

基本准备工作也差不多就这些了,下面讲一下爬虫程序的整体思路吧。


爬虫整体思路

如图所示,爬虫的整个爬取思路如下。

首先启动抖音 APP,等第一个视频加载出来播放之后,截取屏幕画面,调用百度 AI 的人脸识别接口进行人脸检测和评分。

如果画面中检测到颜值评分70分以上,且性别为女的人脸,则点击屏幕中的”点赞“按钮,然后上滑播放下一条视频。

如果画面中中没有出现人脸,或者性别为男,或者颜值不足70,则继续截图检测,直到视频播放结束,或者找到满足条件的人脸为止,然后上滑播放下一条视频。为了尽可能地不错过有漂亮小姐姐的抖音,每条视频中会截取 4 - 5 张图片进行检测,只要有一张截图中有高颜值的小姐姐,那么我们就对这个视频进行点赞。如果这样都检测不出来,只能说小姐姐藏得太深,或者漂亮的不够明显了。

大概思路就是这样,下面我们就来动手完成爬虫吧!


动手撸码写爬虫

由于爬虫还是稍微有点大,所以我拆成三个部分来写。人脸识别部分,ADB 控制部分,和爬虫主逻辑部分。


(1)人脸识别部分

这部分用了调用了 百度AI 的人脸识别接口,需要将你自己申请的 appid,api_key,secret_key 三个参数填到代码里。

  1. import base64 
  2. import urllib 
  3. import json 
  4. import requests 
  5. import sys 
  6.  
  7. appid = '填写你申请的 appid' 
  8. api_key = '填写你申请的 api_key' 
  9. secret_key = '填写你申请的 secret_key' 
  10. 这部分的代码主要包括四个函数,包括 

这部分的代码主要包括四个函数,包括:


(2)ADB 控制部分

ADB 控制部分,大概思路就是通过python中的 os 库执行 adb 指令,来对手机进行操作。

主要包括四个函数:


  • start_my_app 函数,用来启动 抖音 APP。

  • save_video_met 函数,点击 ”点赞“ 按钮。在检测到漂亮小姐姐之后调用。

  • play_next_video 函数,向上滑动屏幕,播放下一个视频。

  • get_screen_shot_part_img 函数,用来截取屏幕图像,保存到电脑中,以便后续人脸识别。 

  1. import os 
  2. from PIL import Image 
  3.   
  4. # 抖音App的应用包名和初始Activity 
  5. package_name = 'com.ss.android.ugc.aweme' 
  6. activity_name = 'com.ss.android.ugc.aweme.splash.SplashActivity' 
  7.   
  8. def start_my_app(package_name, activity_name): 
  9.     # 打开 Android 应用 
  10.     os.popen('adb shell am start -n %s/%s' % (package_name, activity_name)) 
  11.      
  12. def save_video_met(screen_name, find_girl_num): 
  13.     # 保存截图 
  14.     img = Image.open(screen_name).convert('RGB'
  15.     img.save("漂亮的小姐姐/DYGirl_%d.jpg" % find_girl_num) 
  16.     # 给视频点赞 
  17.     os.system("adb shell input tap 1330 1750"
  18.      
  19. def play_next_video(): 
  20.     # 向上划屏幕,播放下一段视频 
  21.     os.system("adb shell input swipe 540 1300 540 500 100"
  22.   
  23. def get_screen_shot_part_img(image_name): 
  24.     # 截图 
  25.     os.system("adb shell /system/bin/screencap -p /sdcard/screenshot.jpg"
  26.     os.system("adb pull /sdcard/screenshot.jpg %s" % image_name) 
  27.     # 打开图片 
  28.     img = Image.open(image_name).convert('RGB'
  29.     # 图片的原宽、高 
  30.     w, h = img.size 
  31.     # 截取部分,去掉其头像、其他内容杂乱元素 
  32.     img = img.crop((0, 400, 1200, 2750)) 
  33.     img.thumbnail((int(w / 1.5), int(h / 1.5))) 
  34.     # 保存到本地 
  35.     img.save(image_name) 
  36.     return image_name 

这些函数中的坐标是根据我手机的屏幕坐标写的(华为 Mate 20 Pro),其他型号手机的同学,可以根据自己手机屏幕的分辨率,对这些参数进行调整。

修改坐标的方法我也大概说一下,在你手机的设置中,找到开发人员选项,然后将指针位置这个打开

然后你就可以看到你点击到屏幕的位置了,顶部也会显示你点击的位置坐标。

打开抖音,手指放到点赞按钮上,记录下此时屏幕顶部显示的坐标,然后把这个坐标替换到代码中就好了。


(3)程序主逻辑部分

根据前面分析的流程图,编写爬虫程序的主逻辑。

  1. import datetime 
  2. import time 
  3. import shutil 
  4.  
  5. if __name__ == '__main__'
  6.  
  7.     access_token = get_access_token() 
  8.     # 设置一条视频最长的识别时间,要是墨迹 10 秒还不露脸,也不管她了,下一个 
  9.     RECOGNITE_TOTAL_TIME = 10  
  10.     # 识别次数 
  11.     recognite_count = 0 
  12.  
  13.     # 图片类型【网络和本地】 
  14.     TYPE_IMAGE_NETWORK = 0 
  15.     TYPE_IMAGE_LOCAL = 1 
  16.  
  17.     print("打开抖音~"
  18.  
  19.     start_my_app(package_name, activity_name) 
  20.     time.sleep(5) 
  21.     print("开始播放视频~"
  22.     find_girl_num = 0 
  23.     # 对当前视频截图去人脸识别 
  24.     while True
  25.         # 开始识别的时间 
  26.         recognite_time_start = datetime.datetime.now() 
  27.         # 识别次数 
  28.         recognite_count = 1 
  29.         # 循环地去刷抖音 
  30.         while True
  31.             # 获取截图 
  32.             screen_name = get_screen_shot_part_img('images/temp%d.jpg' % recognite_count) 
  33.             # 人脸识别 
  34.             recognite_result = analysis_face(parse_face_pic(screen_name, TYPE_IMAGE_LOCAL, access_token)) 
  35.             recognite_count += 1 
  36.             # 第n次识别结束后的时间 
  37.             recognite_time_end = datetime.datetime.now() 
  38.             # 这是一个美女 
  39.             if recognite_result: 
  40.                 find_girl_num += 1 
  41.                 save_video_met(screen_name, find_girl_num) 
  42.                 print("已经发现 %d 个漂亮小姐姐" % find_girl_num) 
  43.                 break 
  44.             else
  45.                 if (recognite_time_end - recognite_time_start).seconds < RECOGNITE_TOTAL_TIME: 
  46.                     continue 
  47.                 else
  48.                     print('超时!!!这是一条没有吸引力的视频!'
  49.                     # 跳出里层循环 
  50.                     break 
  51.         # 删除临时文件 
  52.         shutil.rmtree('./images'
  53.         time.sleep(0.05) 
  54.         os.mkdir('./images'
  55.  
  56.         # 播放下一条视频 
  57.         print('==' * 30) 
  58.         time.sleep(2) 
  59.         print('准备播放下一个视频~'
  60.         play_next_video() 
  61.         time.sleep(2) 

有时候网络可能卡一些,视频加载需要一些时间,所以每次看到下一条视频时,先停两秒,等视频差不多加载好了再开始检测。


后记

这爬虫我断断续续玩了一段时间了,反正没事儿的时候手机放一边,把爬虫开了后台跑着,让它自己刷着玩。然后晚上拿起手机一看,哇手机里全是漂亮的小姐姐!


【责任编辑:未丽燕 TEL:(010)68476606】


点赞 0


推荐阅读
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • Python实现变声器功能(萝莉音御姐音)的方法及步骤
    本文介绍了使用Python实现变声器功能(萝莉音御姐音)的方法及步骤。首先登录百度AL开发平台,选择语音合成,创建应用并填写应用信息,获取Appid、API Key和Secret Key。然后安装pythonsdk,可以通过pip install baidu-aip或python setup.py install进行安装。最后,书写代码实现变声器功能,使用AipSpeech库进行语音合成,可以设置音量等参数。 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了如何在给定的有序字符序列中插入新字符,并保持序列的有序性。通过示例代码演示了插入过程,以及插入后的字符序列。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • Go GUIlxn/walk 学习3.菜单栏和工具栏的具体实现
    本文介绍了使用Go语言的GUI库lxn/walk实现菜单栏和工具栏的具体方法,包括消息窗口的产生、文件放置动作响应和提示框的应用。部分代码来自上一篇博客和lxn/walk官方示例。文章提供了学习GUI开发的实际案例和代码示例。 ... [详细]
  • Go Cobra命令行工具入门教程
    本文介绍了Go语言实现的命令行工具Cobra的基本概念、安装方法和入门实践。Cobra被广泛应用于各种项目中,如Kubernetes、Hugo和Github CLI等。通过使用Cobra,我们可以快速创建命令行工具,适用于写测试脚本和各种服务的Admin CLI。文章还通过一个简单的demo演示了Cobra的使用方法。 ... [详细]
  • 使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例
    本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤,可以获取到网站首页的新闻数据。代码示例使用Python编写,并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]
  • 数组的排序:数组本身有Arrays类中的sort()方法,这里写几种常见的排序方法。(1)冒泡排序法publicstaticvoidmain(String[]args ... [详细]
  • (三)多表代码生成的实现方法
    本文介绍了一种实现多表代码生成的方法,使用了java代码和org.jeecg框架中的相关类和接口。通过设置主表配置,可以生成父子表的数据模型。 ... [详细]
  • 图像因存在错误而无法显示 ... [详细]
author-avatar
mobiledu2502869423
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有