java如何爬取网页

发布时间:2017-06-18 20:56

百度搜索引擎的原理其中之一就是定期的派出网络爬虫到互联网上去爬取网页,下面就让小编教大家java如何爬取网页吧。

java爬取网页的方法

我希望输入一个有效的网址后返回这一网址下的网页源码,则有代码如图:

java如何爬取网页

通过网址连接到指定的网址

java如何爬取网页

在运行之前把开发空间的的编码改为UTF-8,否则编译执行返回的网页中的中文会变成乱码

java如何爬取网页

连接成功后通过连接对象得到输入流,读出输入流就可以得到网页代码

java如何爬取网页

运行后得到的网页代码如下

java如何爬取网页

把返回的代码复制到EditPlus中运行一下看看

java如何爬取网页

猜你感兴趣的:

1.java如何比较字符串

2.java半年工作经验怎么跳槽

3.Java中对象和引用的具体区别

4.java中怎么创建对象

5.java简历中项目经验怎么写

java如何爬取网页的评论条评论