标签:jsoup

Java

Java程序员,应该知道的20个有用的开源库

19

yanxinchi 发布于 2019-07-19

总的来说,我在日常项目包含了有用的库,包括Log4j日志库,Jackson JSON解析库,以及JUnit和Mockito等单元测试API。如果需要在项目中使用,则在项目的classpath包含这些JAR,也可以使用Maven进行依赖管理。 当你使用Maven进行依赖管理时,它会...

阅读(83)评论(0)赞 (0)

Java

分析微信发送消息接口(基于网页版分析)

6

尖兵 发布于 2019-07-04

平常我们用微信都是使用安卓客户端或者,IOS客户端,或者网页版,但是作为一个Programmer,必须得有点Programmer的亚子。 下载链接 本文只作为学习交流,不可用于其他用途,若有冒犯之处,请立即联系我删除。 在阅读之前请确保你有Javascript的基础,和Http相...

阅读(64)评论(0)赞 (0)

Java

刷票小程序原理剖析(python和java)

7

zhuangli 发布于 2019-06-12

前言 现在生活中离不开各类的比赛,然而,各个比赛离不开投票,我们会清一色有时候找到我们的朋友在朋友圈发—帮宝贝投一票,帮某某老师,学生投一票。又或许你自己参加比赛,你在为你自己拉票。 剖析投票原理 作为一名程序员,你是否想为自己的生活开一点G呢?熟悉网络请求的我们,应该从问题根源...

阅读(75)评论(0)赞 (0)

Java

浅谈网络爬虫

14

Harries 发布于 2019-06-12

爬虫,又称为 网页蜘蛛(spider) ,就是能够在互联网中检索自己需要的信息的程序或脚本。 爬虫,简单的说就是 一个http(https)请求 ,获取到对面网页的源码,然后从网页的源码中抓取自己需要的信息。而html代码的规则是基于xml的,所以可以通过一定解析规则和逻辑完成我...

阅读(77)评论(0)赞 (0)

Java

(Java篇)爬取微信公众号文章并保存为 PDF 格式

10

wenming.gapo 发布于 2019-05-28

背景:某一天,拿着自己的手机看着技术文章,然而手机看技术文章,有时候确实蛋疼,因为一旦代码多起来,小屏幕看的还是眼花;又或者某一天觉得这一篇文章,觉得写的很棒棒哦,于是先收藏,打算过几天看,然后等我几天再次打开收藏的文章,卧X,居然被作者删了··&mi...

阅读(90)评论(0)赞 (0)

Spring

MRoot 2.4 发布,细节优化、Bug 修复和依赖升级版本

dulong 发布于 2019-05-22

MRoot小小木是基于Spring Boot2编写的快速开发平台。提供强大的代码生成器,一键生成90%的代码!MRoot的宗旨是降低开发成本,提高开发效率。 升级 升级 1 Spring Boot 到 2.1.5 版本 升级 2 commons-lang3 到 3.9 版本 升级...

阅读(76)评论(0)赞 (0)

Java

Hibernate Validator—更简洁的参数校验及一个util

1

xirruiqiang 发布于 2019-05-13

代码地址 https://github.com/wheel-orga… 简介 hibernate-validator是Hibernate项目中的一个数据校验框架,是Bean Validation 的参考实现,hibernate-validator除了提供了JSR 30...

阅读(74)评论(0)赞 (0)

Java

程序员必须搞懂的20Java类库和API

21

hellas 发布于 2019-05-13

一个有经验的Java开发人员特征之一就是善于使用已有的轮子来造车。《Effective Java》的作者Joshua Bloch曾经说过:“建议使用现有的API来开发,而不是重复造轮子”。在本文中,我将分享一些Java开发人员应该熟悉的最有用的和必要的库和API。顺便说一句,这里...

阅读(161)评论(0)赞 (0)

Java

jsoup 1.12.1 发布,最好的 Java HTML 解析器,没有之一

zhuangli 发布于 2019-05-13

jsoup 1.12.1发布了,该版本包含众多可用性的提升,提升了解析速度和内存效率,修复了不少 bug 。 jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操...

阅读(126)评论(0)赞 (0)

Java

Generate all unserialize pyload via serialVersionUID

1

hanze 发布于 2019-04-01

最近遇到了个shiro老版本的反序列漏洞, 但是只能在用URLDNS的时候能成功, 除了CommonsCollections在shiro上是不行的, 使用其他gadget的时候也失败了, 怀疑有SUID的原因。 java在打反序列时, 如果字节流中的serialVersionUI...

阅读(82)评论(0)赞 (0)

Spring

从博客时间轴总结这一年

9

Harries 发布于 2019-04-01

去年刚来的时候也是三月份,当时和一个舍友一起下定决心得学点什么——学算法吧,两人一拍即合,恰巧两人都是java语言,变开始百度杭电oj刷题顺序,因为那时候刚刷题,往往一天只能AC一道题。两人虽然不坐在一块,但是一宿舍来回路上都在谈论题目,我们做的题目也都基本类似,也分享题目思路,...

阅读(105)评论(0)赞 (0)

Spring

Elasticsearch实战篇——Spring Boot整合ElasticSearch

21

邓龙华 发布于 2019-03-23

当前Spring Boot很是流行,包括我自己,也是在用Spring Boot集成其他框架进行项目开发,所以这一节,我们一起来探讨Spring Boot整合ElasticSearch的问题。 本文主要讲以下内容: 第一部分,通读文档 第二部分,Spring Boot整合Elast...

阅读(106)评论(0)赞 (0)

Java

最受欢迎的100个Java库

3

puefu.he 发布于 2019-02-19

谁拔得头筹?谁又落于人后?我们分析了 GitHub 中 47,251 条依赖关系,得出最受欢迎的100个 Java 库。 漫长的周末里,我们最喜欢的消遣方式是遍历 GitHub,找出最受欢迎的 Java 库。我们决定,将其中的乐趣与所得分享给大家。 我们分析了 GitHub 中前...

阅读(125)评论(0)赞 (0)

Java

WebMagic 爬虫框架浅析

6

小丁 发布于 2019-02-13

很久之前因为爬虫需求就接触过 WebMagic,但是一直停留在简单使用阶段。近来公司项目也有爬虫需求,而且需要对爬虫框架做一些定制开发,便以此为契机深入学习 WebMagic 的设计思想及实现原理。 概述 WebMagic 是国内知名开发者黄亿华开源的一个 Java 爬虫框架。W...

阅读(145)评论(0)赞 (0)

Java

是时候 Get 新技能了:使用 Java 爬取网页信息

5

hellas 发布于 2019-01-27

如果你想利用自己的技术做出一点有意思的产品来,那么爬虫、算法和 AI 等技术可能是一个不错的突破口。今天,我们就来介绍下使用 Java 爬取页面信息的几种思路。 说起爬虫,自从 Python 兴起之后,人们可能更多地使用 Python 进行爬虫. 毕竟,Python 有许多封装好...

阅读(152)评论(0)赞 (0)

Java

java爬取并下载酷狗TOP500歌曲 原 荐

4

xiaoli.he 发布于 2018-12-31

是这样的,之前买车送的垃圾记录仪不能用了,这两天狠心买了好点的记录仪,带导航、音乐、蓝牙、4G等功能,寻思,既然有这些功能就利用起来,用4G听歌有点奢侈,就准备去酷狗下点歌听,居然都是需要办会员才能下载,而且vip一月只能下载300首,我这么穷又这么抠怎么可能冲会员,于是百度搜了...

阅读(185)评论(0)赞 (0)

Java

Gradle构建工具从入门到精通(IDEA)

18

yanxinchi 发布于 2018-11-27

1.Gradle安装 官网 下载 压缩包,然后解压,配置本地环境变量。主要有下面两个: GRADLE_HOME 是解压后的目录, GRADLE_USER_HOME 的作用是让其他程序检测到本地.gradle文件夹的位置, 再把 %GRADLE_HOME%/bin 追加到 Path...

阅读(268)评论(0)赞 (0)