豆瓣租房小组爬虫

文章频道 软件下载 安卓下载 苹果下载

当前位置:首页软件下载网络工具浏览辅助 → 豆瓣租房小组爬虫 v1.1.1免费版
豆瓣租房小组爬虫

豆瓣租房小组爬虫v1.1.1免费版

豆瓣租房小组爬虫最新版下载评分:3.2
下载地址
  • 软件大小:4M
  • 软件语言:简体中文
  • 更新时间:2020-07-06
  • 软件类别:免费软件
  • 软件性质:PC软件
  • 软件厂商:未知
  • 运行环境:WinXP/Win7/Win10
  • 软件等级:
  • 官方网址:暂无
  • 软件介绍
  • 软件截图
  • 猜你喜欢
  • 同类推荐
  • 相关文章

豆瓣租房小组爬虫是一款能够帮助中介或者找房源的用户快速找到适合自己的房源的软件,很多在豆瓣租房小组找房的用户面对琳琅满目的房子不知该如何甄别,利用软件能够快速筛选出适合自己价位的房源,有需要的小伙伴欢迎来体验。

【软件介绍】

1.首先对网页F12进行节点分析

2.分析得到id为group-new-topic-bar下的tbody下的tr就是我们要的每一行租房信息

3.遍历每一个tr节点,得到详细信息的url,进入到该url里获取到帖子的详细信息

4.防止爬取过于频繁,可以在每次爬取详情信息时sleep一会

版权声明:本文为CSDN博主「好记古啊古」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

【使用方法】

一、下载打开软件,首先设置要找的房源的地址。

二、接下来设置理想价位和排除关键词。

三、点击爬取即可获取房源信息,等待软件获取相关关键词房源。

四、利用typora软件打开爬取下来的MD文件即可看到房源信息。

【使用说明】

此爬虫用python开发,基于gevent、pymongo、requests、lxml、Flask。

流程也相对较简单:

配置需要爬取的URL;

配置需要解析的信息元素,用XPATH完成;

配置代理;

配置监控周期、最大页数、并发数等;

运行爬虫,等待抓取,会自动根据配置定时爬取;

启动web服务,在前台搜索、排序等;

【常见问题】

如何设置豆瓣群组链接?

首先搜索某个地区租房,例如:北京租房

点进去要爬取的某个小组,例如第一个:北京租房

将页面拉到最下面有个> 更多小组讨论超链接,点进去

复制地址栏中地址(从/group开始复制到结尾),粘贴到软件设置豆瓣群组链接

有时候粘贴进软件会崩溃,不知道什么原因,建议把软件中原来的链接删除再粘贴进去。

将start=后边的数字50改成%d

如何设置排除关键字?

排除关键字是标题和内容只要出现关键字就会排除掉该条租房信息。

例如默认是限女这个关键字,只要租房信息中包含限女生入住,只限女生等出现限女关键字的一律不爬。

多个关键字用|分隔,注意是英文的。

例如:限女|短租|整租,这三个关键字设置后,只要标题和内容出现这三个关键字软件就不会爬取。

关于识别标题中的价格

使用正则\b\d{4}\b识别标题中的价格信息,无法爬取少于1000元的信息。

关于爬取结果排序

先根据价格从小到大排序,价格相同根据发帖时间排序。

展开内容

软件截图

  • 豆瓣租房小组爬虫v1.1.1免费版
  • 豆瓣租房小组爬虫v1.1.1免费版
  • 豆瓣租房小组爬虫v1.1.1免费版
  • 豆瓣租房小组爬虫v1.1.1免费版

下载地址

  • PC版

同类推荐

相关文章

本类排行

  • 周排行
  • 月排行

感谢速联科技、八度网络、九九数据、亿恩科技、群英网络赞助部分带宽!

关于本站 | 联系方式 | 版权声明 | 下载帮助(?) | 网站地图

Copyright 2002-2020 95262.com 【数码资源网】 版权所有 粤ICP备2020128507号-1

本站所有软件来自互联网,版权归原著所有。如有侵权,敬请来信告知 ,我们将及时撤销。