如何利用Tumblr汤不热爬虫脚本保存小哥哥小姐姐图片视频?

    大家都知道汤不热了凉了,可以关注的各位小哥哥小姐姐姐的图片大家肯定都舍不得。在凉之前想把所有大姐姐小姐姐全都抢救出来,今天试了一下成功了。
    之前有大神发过用 python 爬虫爬汤不热图片视频的贴子。操作操都一要的。须要一点点文本编辑 和命令行的知识
    首先自己下载好 python 并安装好
    然后到谷歌的 GitHub xuanhun/tumblr-crawler 下载大神编好的 python 汤不热爬虫脚本 把脚本解压后放在一个空间大一点的硬盘里(一会下载下来的小姐姐门要住的,太小不够住)然后运行 cmd 在dos命令行下进入到角本所在目录(前掉是先安装好了python)
    命令 : pip install -r requirements.txt (安装依赖)文章源自奇点资讯-https://www.xerer.com/archives/27842.html

    如何利用Tumblr汤不热爬虫脚本保存小哥哥小姐姐图片视频?
    然后在电脑上打开汤不热,把所有你关注的人一页页复制下来。贴到 word文件里 然后用查找替换的方式把多的字符删掉 如:
    aa414258
    已于 1 个月前 更新文章源自奇点资讯-https://www.xerer.com/archives/27842.html

    godmmm
    已于 1 周前 更新文章源自奇点资讯-https://www.xerer.com/archives/27842.html

    ad-microkini
    已于 11 个月前 更新文章源自奇点资讯-https://www.xerer.com/archives/27842.html

    hw7232
    已于 10 个月前 更新文章源自奇点资讯-https://www.xerer.com/archives/27842.html

    把中间的 已于 XXXXX 更新 替换删除 我不是很懂 wrod 替换删除 了 “已于” 再替换删除 “更新” 再替换删除 什么年 月日 时 最后是数字 1 2 3 4 5 后边还有几个不多的就手动删除了。
    最后把两个段落符号 替换成了 英文的逗号 ,最后格式如:hoverwatch,shmily9921,luolili,hentaidongman,foundpoision,kmmmmmmo,mu-rn(汤不热用户名 用逗号隔开)
    然后把搞好格试的 汤不热用户名复制到 sites.txt 文件里 并保存好
    挂好全局代里
    然后在命令行 进入到 目录 tumblr-crawler-master 然后运行命令
    python tumblr-photo-video-ripper.py
    然后你所关注用的所有视频和图片都会保存在 以汤不热用户名命名的文件夹里
    至于代理我是撸谷歌300刀的羊毛的。感谢一次谷歌
    脚本文件夹里 README_CN.md 文件是中文的使用说明,不懂可以用记事本或Notepad++打开 自己研究下。
    不说了,我哪块盘只剩100来G了,要去腾点地方给小姐姐们住。文章源自奇点资讯-https://www.xerer.com/archives/27842.html

    文章源自奇点资讯-https://www.xerer.com/archives/27842.html

    • 本文由 发表于 2018/12/0522:39:40

    发表评论

    匿名网友 填写信息