导图社区 网络爬虫系统功能设计
关于网络爬虫系统功能设计,具体有 目标、客户端、功能、业务逻辑,有兴趣的可以看看哟。
关于物流运输APP的思维导图,功能分推送通知、司机端、供应商、代理商、办公OA,有兴趣的可以看看哟。
健身设备监控那个大屏,设定为 选择地区、统计、地图、统计图表,有兴趣的可以看看哟。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
爬虫系统
目标
招标信息
其他关键词
客户端
PC软件
功能
登陆注册
邮箱登录/注册
密码
验证码
网站目录
初始化
内置搜索引擎(百度、google、360等)关键词搜索结果采集模板
选择搜索引擎->输入关键词
从搜索引擎中获取相关网站(自动去重)然后保存到网站目录
将搜索的关键词一并保存下来
根据关键词搜索到的有效网站集合
手动添加
可以批量导入
增删改都需要手动操作
优先抓取
网站模板
解析数据模板
主题/分类
网站的内容分类
网址
更新日期
本地保存
云端备份
更新
优先更新网站目录
全网搜索增量更新
同步
从云端下载更新本地数据
本地数据上传更新云端数据
分享
分享到公共网站目录库
可设置使用价格,积分
定时采集
时间
循环
每天
每周
周几
可多选
每月
几号
本地采集
立即
定时
后台运行
采集
第一步
确定采集的网址
批量任务需使用有模板的网站
第二步
目标网页预览
读取网页内容,根据模板显示解析后的数据或自动解析
批量任务跳过此步骤
第三步
解析预览
模板数据
自定义
配置采集条件
页面类型
单页
列表
分页识别
瀑布
分页按钮
无分页
采集范围(可选)
默认全部
开始页数到结束页数
跳过页数
数据筛选
筛选解析后的数据
选择筛选的字段
大于、等于、不大于、不小于、包括、不包括、时间等于、时间早于、时间晚于 限定值
深入采集
单链接自动加载
多链接需选择某一链接加载
添加字段
添加页面中为解析的数据
自动识别新加数据的链接
第四步
执行
本地
云端
定时执行
循环执行
结果通知
邮件
保存已采集(筛选)的内容
第五步
导出结果
导出文件
发送到邮箱
结果满意?保存到常用网站目录中
为当前模板引擎命名
采集完成
弹框通知
提示音
邮件通知结果
批量任务
多线程
多任务
并行
默认功能
数据去重
跳过已筛选网站
跳过重复数据
数据导出
导出已查询到的数据
导出到数据库
深层内容抓取
多链接需手动配置或使用网站模板
待定/付费功能
会员互助
多IP代理
付费用户可加入
防爬网站穿透(付费)
代理IP
最小采集间隔
云端采集
黑名单
无效、无法抓取内容或其他原因不希望抓取的网站
跳过这些网站
业务逻辑
登录
账号
注册
邮箱
再次输入密码
用户信息
头像
名称
账号等级
首页
自定义采集
输入网址
智能采集
采集准备页面
网站预览
解析数据预览
解析配置
开始
子主题
我的目录库
网站URL
网站名
更新时间
模板数量
更多
公共目录库
新增
手动添加网站
初始化自动添加
开始采集
分享到功能目录库
网站配置信息
使用价格
分页
云端同步
立即使用
购买
进入采集页面
采集任务
进行中
已完成
已停止
采集方式
开始时间
采集时长
已采集数据条数
数据预览
导出数据
操作
停止
进行中的可用
重启
已停止的可用
采集历史
只显示已完成或已停止的采集任务
删除
清空历史记录
设置
关闭窗口时
隐藏到任务栏
退出程序
默认文件导出目录
清理缓存
检查更新
任务完成提示
声音
弹框
个人中心
基本信息
昵称
积分
充值
优惠券
订单数
账户类型
免费版
专业版
旗舰版
编辑
账号安全
修改密码
手机号
绑定
更换
第三方账号
微信
QQ
微博
费用中心
订单
订单号
查看订单详细
下单时间
订单状态
商品名
商品介绍
商品价格
优惠金额
支付金额
支付方式
支付时间
订单完成时间
商品名称
金额
状态
待支付
已取消
立即支付
查看发票
取消订单
删除订单
使用门槛
失效日期
发票
可开发票订单列表
订单金额
选择订单
填写开票信息
开票
积分总量
积分变动记录
变动类型
购买xxx
充值xxx
卖出xxx
数量
增加为 正
减少为 负
剩余
变化后的数量