监视并转换磁盘目录中的pdf文档为文本文件,并进行全文检索 python,watchdog,whoosh, jieba, mongodb,pymongo, pdf2text
股票信息采集系统,想通过两个阶段,来完成股票信息的采集以及股票价格的预测。第一个阶段,完成对指定股票的相关信息采集、价格采集以及展示工作;第二个阶段,通过数据挖掘相关技术,利用新闻数量、股票价格走势,对股票价格进行预测。 前期会先通过几个小项目,一步一步将项目的主要功能完善。
丑牛迷你采集器是一款基于Java Swing开发的专业的网络数据采集/信息挖掘处理软件,通过灵活的配置,可以很轻松迅速地从 网页上抓取结构化的文本、图片、文件等资源信息,可编辑筛选处理后选择发布到网站