全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

手把手教学Android用jsoup解析html实例

1.jsoup介绍

很多时候,我们需要从各种网页上面抓取数据,而jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

jsoup官方文档:https://jsoup.org/cookbook/

2.使用场景

下面是一张关于美食的截图,可以留意到这是一个html网页,当我们想要抓取里面的数据的时候,jsoup就能帮到我们很多。


接下来开始手把手教学

首先,也是很重要的一步,就是下载jar包,丢到libs里面

jar包下载地址:http://jsoup.org/download

Android studio玩家可以不下载jar包,在Gradle里面加入

dependencies {
  compile 'org.jsoup:jsoup:1.9.2'
}

然后,找到你心仪的网页去抓取数据

这里我们我继续使用美食的网页,然后右键查看网页源码,或者按F12,接下来可以看到一大堆标签:

找到需要的,例如上图这个 “美食天下” ,可以看到 “美食天下” 是放在以 <div class="top-bar" id="J_top_bar"> 为节点的 <a title="美食天下" 中,要获取这个“美食天下”,代码可以这样写:

try {  
  //从一个URL加载一个Document对象。
  Document doc = Jsoup.connect("http://home.meishichina.com/show-top-type-recipe.html").get();
  //选择“美食天下”所在节点
  Elements elements = doc.select("div.top-bar");  
  //打印 <a>标签里面的title
  Log.i("mytag",elements.select("a").attr("title"));
}catch(Exception e) {  
  Log.i("mytag", e.toString());
}

接下来看一下打印出来的结果:


Jsoup.connect(String url)方法从一个URL加载一个Document对象。如果从该URL获取HTML时发生错误,便会抛出 IOException,应适当处理。

一旦拥有了一个Document,你就可以使用Document中适当的方法或它父类 Element和Node中的方法来取得相关数据。

public class Element extends Node
public class Document extends Element

很多文章都是说一大堆原理然后放出一个简单的例子,就跟我上面简单的打了一个log一样,然后发现用起来的时候是没那么简单的。为了大家能不看文档也可以直接使用(并且看不懂那一大堆标签也可以用),我决定再举一个例子(其实也就是比上面多打几个log):

下图红色框框是我们要获取的数据,可以看到他们对应的节点就是蓝色圆圈里面的<div class="xxx">

废话不多说上代码

try {  
  //还是一样先从一个URL加载一个Document对象。
  Document doc = Jsoup.connect("http://home.meishichina.com/show-top-type-recipe.html").get();

  //“椒麻鸡”和它对应的图片都在<div class="pic">中
  Elements titleAndPic = doc.select("div.pic");
  //使用Element.select(String selector)查找元素,使用Node.attr(String key)方法取得一个属性的值
  Log.i("mytag", "title:" + titleAndPic.get(1).select("a").attr("title") + "pic:" + titleAndPic.get(1).select("a").select("img").attr("data-src"));

  //所需链接在<div class="detail">中的<a>标签里面
  Elements url = doc.select("div.detail").select("a");
  Log.i("mytag", "url:" + url.get(i).attr("href"));

  //原料在<p class="subcontent">中
  Elements burden = doc.select("p.subcontent");
  //对于一个元素中的文本,可以使用Element.text()方法
  Log.i("mytag", "burden:" + burden.get(1).text());

}catch(Exception e) {  
  Log.i("mytag", e.toString());
}

大功告成,接下来看看log


没有问题!那么教学可以结束了!

注意:

Jsoup.connect(String url)方法不能运行在主线程,否则会报NetworkOnMainThreadException

最后上一张应用在项目的效果图:


有没有发现熟悉的椒麻鸡?很酷炫有木有!

小结

整堂课分几步:

1.下载jar包并丢到libs(或者在gradle)

2.找到心仪的网页

3.用Jsoup.connect()获取网页的document

4.查看网页源码,对准你想要的地方,给他来一个Element.select(String selector)

5.用Node.attr(String key)或者Element.text()方法把数据抽出来

6.没有6了就是这么简单!

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。


# jsoup解析html  # Android使用jsoup解析html  # 安卓jsoup解析html  # Jsoup解析html实现招聘信息查询功能  # Android开发之利用jsoup解析HTML页面的方法  # Android使用Jsoup解析Html表格的方法  # Java中使用开源库JSoup解析HTML文件实例  # crawler4j抓取页面使用jsoup解析html时的解决方法  # Jsoup解析HTML实例及文档方法详解  # 可以看到  # 加载  # 可以使用  # 会报  # 方法来  # 几个  # 文档  # 放在  # 都在  # 你就  # 就能  # 下载地址  # 可以用  # 不多  # 打了  # 右键  # 所需  # 这是一个  # 很重要  # 来看看 


相关文章: 微信推文制作网站有哪些,怎么做微信推文,急?  北京专业网站制作设计师招聘,北京白云观官方网站?  建站之星备案流程有哪些注意事项?  网站制作大概要多少钱一个,做一个平台网站大概多少钱?  如何在服务器上配置二级域名建站?  建站VPS配置与SEO优化指南:关键词排名提升策略  如何安全更换建站之星模板并保留数据?  c++23 std::expected怎么用 c++优雅处理函数错误返回【详解】  孙琪峥织梦建站教程如何优化数据库安全?  太原网站制作公司有哪些,网约车营运证查询官网?  如何在建站之星绑定自定义域名?  建站之星后台管理系统如何操作?  建站之星展会模板:智能建站与自助搭建高效解决方案  阿里云高弹*务器配置方案|支持分布式架构与多节点部署  高防服务器如何保障网站安全无虞?  如何破解联通资金短缺导致的基站建设难题?  如何通过商城自助建站源码实现零基础高效建站?  如何实现建站之星域名转发设置?  在线制作视频的网站有哪些,电脑如何制作视频短片?  建站之星CMS五站合一模板配置与SEO优化指南  如何在腾讯云免费申请建站?  制作网站公司那家好,网络公司是做什么的?  ,制作一个手机app网站要多少钱?  如何在腾讯云服务器快速搭建个人网站?  大同网页,大同瑞慈医院官网?  如何在云服务器上快速搭建个人网站?  在线ppt制作网站有哪些软件,如何把网页的内容做成ppt?  高防服务器租用首荐平台,企业级优惠套餐快速部署  建站之星如何快速解决建站难题?  建站之星伪静态规则如何正确配置?  如何用免费手机建站系统零基础打造专业网站?  开心动漫网站制作软件下载,十分开心动画为何停播?  建站之星代理商如何保障技术支持与售后服务?  小说建站VPS选用指南:性能对比、配置优化与建站方案解析  创业网站制作流程,创业网站可靠吗?  深圳防火门网站制作公司,深圳中天明防火门怎么编码?  制作企业网站建设方案,怎样建设一个公司网站?  建站之家VIP精选网站模板与SEO优化教程整合指南  导航网站建站方案与优化指南:一站式高效搭建技巧解析  济南企业网站制作公司,济南社保单位网上缴费步骤?  官网建站费用明细查询_企业建站套餐价格及收费标准指南  智能起名网站制作软件有哪些,制作logo的软件?  高端网站建设与定制开发一站式解决方案 中企动力  国美网站制作流程,国美电器蒸汽鍋怎么用官方网站?  如何在IIS7中新建站点?详细步骤解析  外贸公司网站制作,外贸网站建设一般有哪些步骤?  网站规划与制作是什么,电子商务网站系统规划的内容及步骤是什么?  如何自己制作一个网站链接,如何制作一个企业网站,建设网站的基本步骤有哪些?  北京建设网站制作公司,北京古代建筑博物馆预约官网?  再谈Python中的字符串与字符编码(推荐) 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。