登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
登录
注册
全部推荐项目
前沿技术
智能硬件
IOT/物联网/边缘计算
车载系统/应用
智能家居
自动驾驶/无人机
机器人
5G/通讯
低代码
科研论文
量子计算
芯片开发
Web 3.0
隐私计算
云原生
OpenHarmony
按钮(Button)
文本框(EditText)
布局(Layout)
图形图像(Image)
进度条(Progress)
菜单(Menu)
弹窗(Popup)
选择器(Selector)
文本组件(TextView)
列表组件(ListView)
加载器(Loading)
提醒(Notification)
视图切换(View Transition)
滑杆(Slider)
图表(Chart)
绘图组件(Draw)
计数器(Counter)
动画(Animate)
验证码(Captcha)
多媒体(Multimedia)
条形码(Barcode)
高级UI组件
地图(Map)
OpenHarmony 游戏(Gaming)
网络(Networking)
通讯(Communication)
支付(Payment)
数据库(Database)
硬件驱动(Drivers)
OpenHarmony 教程指南
OpenHarmony工具集
OpenHarmony 应用
华为移动服务(HMS)
权限(Permissions)
工具包(Toolkit)
底层组件
手势控制(Gesture)
程序开发
中英文分词
支付开发包
安全开发相关
常用工具包
Excel工具包
条形码/二维码
模板引擎
图形UI组件/框架
网络开发包
语音处理
网络工具
网络服务
数据挖掘
作业/任务调度
编程语言/脚本语言
缓存组件
Markdown工具包
搜索引擎
微服务
工作流
图表组件
权限管理
报表工具
代码生成器
IoC/AOP框架
图像处理
规则引擎
JSON工具
日志工具包
Spring Boot 扩展
验证码
算法/数学计算
Node 扩展
流程引擎/工具
动画开发
移动通信
工业软件
智能硬件
操作系统
IOT/物联网/边缘计算
算法/数学计算
车载系统/应用
智能家居
自动驾驶/无人机
机器人
5G/通讯
科研论文
芯片开发
隐私计算
工程软件
车载应用
人工智能
AI-人工智能
VR/AR
机器学习/深度学习
计算机视觉/人脸识别
自然语言处理
大模型
推理框架
MCP
RAG知识库
区块链
数字货币
NFT
微信开发
微信开发包
微信小程序/小游戏
微信应用
微信小游戏
企业应用
任务/项目管理
企业应用系统
BI-商业智能
财务/金融/股票证券
GIS/地图/导航/定位
工程软件
建站系统
CMS建站系统
新零售/网店/商城
BBS论坛/问答
博客系统
问卷调查/表单系统
SNS社交系统
学校/教学管理
相册/画廊/照片
RSS/Atom工具
应用工具
文件管理工具
多媒体
文本编辑
IM即时通讯/聊天
应用软件
RPA-机器人过程自动化
WEB应用开发
Web开发框架
jQuery插件
WebUI组件/框架
JavaScript工具包
RESTful项目
后台管理框架
网站主题
Vue扩展组件
Web爬虫
OAuth/单点登录/统一认证
Angular扩展
Bootstrap扩展插件
React 组件
RPC开发框架
API 网关/接口管理
短网址
layui 组件
DevOps/运维/网管
网管工具
监控系统
DevOps工具
手机/移动开发
Android组件/项目
iOS组件
移动App
支付宝小程序
百度小程序
PhoneGap/Cordova 插件
跨平台移动开发
快应用
TV/电视开发
uniapp 开源组件
开发工具
版本管理系统
开发/调试
Wiki/文档工具
编译/构建/部署
Maven 插件
Gulp 扩展
测试工具
代码扫描分析
服务器应用
分布式服务/框架
消息服务器/消息队列
Docker相关
容器/虚拟机
Nginx扩展模块
大数据
云计算
一键安装包
OpenResty 扩展
系统性能优化
Serverless
分布式存储系统
数据库相关
数据库开发包
数据库服务
数据库管理/监控
游戏/娱乐
游戏
游戏开发
3D引擎
插件和扩展
Chrome扩展
WordPress 扩展
Eclipse插件
IDEA 插件
Firefox扩展
Safari 插件
Visual Studio Code 扩展
Jenkins 插件
其他开源
高仿项目
图书/手册/教程
ACM/OJ 项目
操作系统
教学管理
车载应用
教程配套代码
RISC-V 开发
生物/医疗/健康
2020公益黑客马拉松
新冠病毒相关开源
可信开源镜像
可信代码库平台
WEB应用开发
/
Web爬虫
Apache-2.0
全部项目
MulanPSL-2.0
0BSD
AFL-3.0
AGPL-3.0
Artistic-2.0
BSD-2-Clause
BSD-3-Clause
BSD-3-Clause-Clear
BSD-4-Clause
BSL-1.0
CC-BY-4.0
CC-BY-SA-4.0
CC0-1.0
CECILL-2.1
CERN-OHL-P-2.0
CERN-OHL-S-2.0
CERN-OHL-W-2.0
ECL-2.0
EPL-1.0
EPL-2.0
EUPL-1.1
EUPL-1.2
GFDL-1.3
GPL-2.0
GPL-3.0
ISC
LGPL-2.1
LGPL-3.0
LPPL-1.3c
MIT
MIT-0
MPL-2.0
MS-PL
MS-RL
MulanPSL-1.0
MulanPubL-1.0
MulanPubL-2.0
NCSA
ODbL-1.0
OFL-1.1
OSL-3.0
PostgreSQL
UPL-1.0
Unlicense
Vim
WTFPL
Zlib
Java
全部语言
JavaScript
HTML
CSS
Python
C
Shell
C++
TypeScript
PHP
C#
Go
Objective-C
Kotlin
Android
Ruby
Assembly
Swift
NodeJS
Dart
Perl
Lua
Rust
Matlab
其他
PowerShell
HTML/CSS
Scala
微信
Groovy
C/C++
Verilog
XSLT
R
QML
Pascal
Docker
CoffeeScript
FORTRAN
Erlang
Emacs Lisp
ActionScript
SQL
Smalltalk
M
VHDL
Delphi
TeX/LaTeX
ASP
Visual Basic
Common Lisp
Clojure
Scheme
LiveScript
Awk
Haskell
Julia
Elixir
易语言
Pawn
AutoHotkey
YAML
OCaml
Ada
D
Puppet
Standard ML
Logos
XML
Arduino
Prolog
Coq
VimL
汇编
Haxe
Vala
ColdFusion
Scilab
Crystal
Racket
Lisp
Slash
Eiffel
eC
DOT
Zephir
Nemerle
Stars
Stars
最新推荐
最近更新
Gwenson/Gwenson-robot
101
这是一个使用JAVA语言开发的应用级的分布式爬虫搜索引擎机器人
Java
Web爬虫
|
6年多前
西门吹雪/pikachu
89
去吧皮卡丘,为什么取个名字叫皮卡丘,大概是这样萌一些。小哥哥是很可爱的。然后本项目是个爬虫项目,使用时候就像派出小精灵一样,派出皮卡丘,就会为你抓回对应的数据。
Java
Web爬虫
|
5年前
Microgoople/cockroach
84
又一个 java 爬虫
Java
Web爬虫
|
6年前
无极小子/SeimiCrawler
74
分布式敏捷的爬虫框架
Java
Web爬虫
|
7年多前
ggymm/Spider2.0
74
使用JCEF(chromium内核)开发的抓取数据浏览器,可以用来制作浏览器,也可以用来制作爬虫。
Java
Web爬虫
|
5年多前
夕阳雨晴/zhihu-spider
73
Spring Boot项目框架,结合多种开源技术,知乎信息中转持久化的数据流平台,并提供HTML+JSON和RabbitMQ等消息接口,从而使有兴趣的伙伴开发并使用其熟悉的语言环境,实现信息爬取,从而持久化到此项目中来,完成最开始的开发目标。
Java
Web爬虫
|
8年前
Jtyoui/sogou
73
最新代码链接:码云上不在更新
Java
Web爬虫
|
6年多前
xinshengsiyu/WechatSpider
54
java抓取微信最新推送内容
Java
Web爬虫
|
8年多前
gitclebeg/nlp-spider-dynamic
50
nlp项目基础框架:爬虫,针对动态网页(JS)的专有爬虫
Java
Web爬虫
|
6年多前
大强哥/SpiderV
49
java编写的带有web管理后台的抓取程序,自动生成搜索URL,简单实现数据抽取即可,支持多机,任务定时自动运行等功能,提供各种扩展点,适应各种情况
Java
Web爬虫
|
11年多前
logic/QuickCompanyCollect
39
运行于java环境的一个免费开源的企业信息采集器(简单的java网络爬虫)。 信息采集完成后自动导出Excel表格。 基于Jsoup+Poi+Sqlite开发完成。
Java
Web爬虫
|
7年多前
Andrew/Egg
35
一个通用的爬虫
Java
Web爬虫
|
9年多前
feng/webmagic-learn
33
使用springboot、spring-data-jpa、webmagic等技术,定时爬取爱奇艺视频、360视频
Java
Web爬虫
|
5年多前
tianxia007/java_spiderPro
27
音乐歌单目录导出软件,网易云等各大音乐平台由于版权问题,间歇性的会让一些收藏的音乐无法播放,所以做了这个小软件,把常见的音乐网站的个人收藏的歌单导出备份,目前实现导出网易云音乐个人收藏的歌单,后面再不断兼容其他音乐网站的歌单导出功能吧。 后续计划: 1.模拟登陆直接导出,无需下载静态页面导出; 2.跨音乐网站,把本地歌单文件导入其他音乐网站;
Java
多媒体
Web爬虫
|
7年多前
jasperyou/JavaSpiderDemo
21
(此项目将迁移至 GitHub,并计划迎来一次基于 AI 技术的重大升级。届时,它将从一个 Demo 演进为一个功能完备的网站应用,底层技术架构也可能不再依赖传统的爬虫方案。) Java爬虫实现,SpringBoot + HttpClient+Jsoup 爬虫Demo,满屏注释,适合入门
Java
Web爬虫
|
1个月前
1
2
3
热门项目
今日
本周
鬼画符/templatespider
3.5K
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
ssssssss-team/spider-flow
8.2K
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
易水风萧/wind-bell
630
风铃虫是一款轻量级的高效爬虫工具,配置简单,方便二次开发,能抓取js渲染的网页,可以抓取任何数据,支持保存网页快照,智能防封杀,天然适合分布式。
鬼画符/templatespider
3.5K
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
ssssssss-team/spider-flow
8.2K
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
易水风萧/wind-bell
630
风铃虫是一款轻量级的高效爬虫工具,配置简单,方便二次开发,能抓取js渲染的网页,可以抓取任何数据,支持保存网页快照,智能防封杀,天然适合分布式。
ggymm/Spider2.0
74
使用JCEF(chromium内核)开发的抓取数据浏览器,可以用来制作浏览器,也可以用来制作爬虫。
许雪里/xxl-crawler
536
一个分布式爬虫框架。一行代码开发一个分布式爬虫,拥有"多线程、异步、IP动态代理、分布式、JS渲染"等特性;
linzhaoquan/xx小说阅读网站
582
springboot【小说阅读网站】,多线程抓取小说数据(单本或者批量),持久化到MySQL数据库,能定时跟源站数据同步=小说定时更新。通过jsoup采集数据到mysql数据,redis作为缓存框架,减轻服务器压力。部署在linux,网站UI套纵横中文网!
黄亿华/webmagic
5K
webmagic 是一个无须配置、便于二次开发的爬虫框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
回到顶部