Freewind @ Thoughtworks scala java javascript dart 工具 编程实践 月结 math python english [comments admin] [feed]

(2011-09-12) 好用的HTML解析器 jsoup

广告: 云梯:翻墙vpn (省10元) 土行孙:科研用户翻墙http proxy (有优惠)

曾经用过HTML Parser这个东西来解析html文档,感觉就是看起来强大,用起来超繁琐,还用了一堆如visitor模式,真是继承了java的“优良”传统,让人心里堵。所以遇到需要解析修改html的任务,都觉得是一件挺艰巨的任务。

其网址如下: http://htmlparser.sourceforge.net/

如果不分语言,对html处理最好的库应该是jquery这个javascript库。其强憾的选择器和超级好用的api,让操作html成了一件享受的事情。我一直在想,如果在java中能像它一样去处理html,那多好。

昨天不经意发现了一个叫jsoup的库,让人惊喜。它模仿了jquery,使用了极其相似的api与使用方法。我使用它来解析和处理html文档,感觉真是太棒了。以前使用HTML Parser觉得无从下手,得写几十行上百行代码才能做的事情,现在三五行就搞定了。这样的东西,才是我们应该学习和使用的。

地址如下:http://jsoup.org/

很高兴看到现在的javaer们终于开始转变思想,积极学习和吸引其它语言中好的思想与用法,让javaer们的生活变得简单一些。

comments powered by Disqus