首页 > 其他分享 >iphone 解析HTML

iphone 解析HTML

时间:2023-05-10 12:32:51浏览次数:52  
标签:git HTML TFHpple xpathParser html iphone 解析 com htmlData


几周前,由于需要从网页中提取一部分内容我们就一直在寻找一个可以在iPhone可用的简单的html解析器。我们在该贴中找到了一个名为hpple的漂亮封装。使用该库的简单步骤如下:

包含并链接libxml2:

  1. 展开Targets
  2. 双击项目名
  3. 选择所有配置
  4. 搜索Header Search Path
  5. 加入一行并选中recursive选项: ${SDKROOT}/usr/include/libxml2
  6. 搜索Other Linker Flag
  7. 加入一行:-lxml2

截屏如下:

从如下地址下载源码:

git clone git://github.com/topfunky/hpple.git

将如下代码拖拽到项目中:

TFHpple.h

TFHpple.m

TFHppleElement.h

TFHppleElement.m

XPathQuery.h

XPathQuery.m

就这些。接下来就可以试着写些代码了。


// Don't forget  
 // #import "TFHpple.h"  
NSData *htmlData = [[NSString stringWithContentsOfURL:[NSURL URLWithString: @"http://www.objectgraph.com/contact.html"]] dataUsingEncoding:NSUTF8StringEncoding];  
TFHpple *xpathParser = [[TFHpple alloc] initWithHTMLData:htmlData];  
//get the page title - this is xpath notation  
NSArray *elements  = [xpathParser search:@"//h3"];   
TFHppleElement *element = [elements objectAtIndex:0];  
NSString *myTitle = [element content];  
NSLog(myTitle);  
[xpathParser release];  
[htmlData release];

完整的项目代码从此下载

 

原文链接:http://blog.objectgraph.com/index.php/2010/02/24/parsing-html-iphone-development/


标签:git,HTML,TFHpple,xpathParser,html,iphone,解析,com,htmlData
From: https://blog.51cto.com/u_16034393/6260991

相关文章

  • 碎片化学习前端之HTML(webComponent)
    前言webComponent是HTML5推出的新特性,为组件化推广奠定基础。webComponent基本使用原生组件,性能较好,但存在兼容性问题。其核心技术有:Customelements,ShadowDOM,HTMLTemplates。CustomelementsJavaScriptAPI,用于定义customelements及其行为。<m-buttontype="p......
  • Spring18_SpringMVC的组件解析3
    一、SpringMVC的执行流程1. 用户发送请求至前端控制器DispatcherServlet。2.DispatcherServlet收到请求调用HandlerMapping处理器映射器。3.处理器映射器找到具体的处理器(可以根据xml配置、注解进行查找),生成处理器对象及处理器拦截器(如果有则生成)一并返回给Dis......
  • Java使用wkhtmltopdf实现HTML转pdf
    wkhtmltopdf设置全屏:wkhtmltopdf--disable-smart-shrinking--page-sizeA4-B0-L0-R0-T0test.htmloutput.pdf-B-T-R-L是有效果的,$snappy->setOption('margin-top','0mm');$snappy->setOption('margin-left','0mm'......
  • HTML中meta标签的那些属性
    <meta>标签是HTML中用于描述网页元信息的元素。它位于<head>部分,不会显示在页面内容中,但对于浏览器、搜索引擎等具有重要作用。主要作用有:定义文档的字符编码、提供网页的描述信息、关键词、作者、视口设置等,这些信息有助于搜索引擎理解和索引网页内容。 <meta>标签的......
  • 4.Spring之依赖注入源码解析
    Spring中到底有几种依赖注入的方式?首先分两种:手动注入自动注入手动注入在XML中定义Bean时,就是手动注入,因为是程序员手动给某个属性指定了值。<beanname="userService"class="com.luban.service.UserService"> <propertyname="orderService"ref="orderService"/>&l......
  • ChatPDF/ChatDOC实现原理解析
    1)把PDF切分成小的文本片段,通过OpenAI的Ada模型创建Embedding放到本地或远程向量数据库。2)把用户的提问也创建成Embedding,用它和之前创建的PDF向量比对,通过语义相似性搜索(余弦算法),找到最相关的文本片段。比关键词搜索好的一点是不要求关键词包含,也能发现文本相关性,比如汽车和公路......
  • HTML 表单
    9.1表单标签-主要标签-<form>:表单容器-<input>:输入框-相关标签-<textarea>:多行文本框-<select>、<option>:下拉菜单(组合使用)-<label>:标题(辅助表单标签),用for和id属性形成映射,点击标题也可选择9.2<input>标签属性-type:控制输入框类型-值:-text-普通文本输入......
  • CRC 校验解析
    CRC校验解析一个CRC校验模型需要包含以下信息:WIDTH,指CRC校验码的最终位数(二进制)POLY,指用来做二进制除法的多项式。INIT,指CRC的初始值。存在初始值是为了避免全0数据的校验码恒为0。若初始值不为0,则对于不同长度的全0数据,校验码一般也会不一样。XOROUT,指最后对......
  • 学习日记——HTML入门第一课
    1.了解HTML的定义,基本结构①对于超文本标记语言的理解,是超越文本(不限制于字符,包含视频音频)用“<>”这个特殊字符来书写的语言②基本结构为<!DOCTYPEhtml><html><head><metacharset="UTF-8"><title>网页标题</title></head>......
  • HTML a标签
    7.1属性-href:链接地址-target:控制链接的打开方式。-_self(默认)-在当前页面打开;-_blank-新标签页打开。7.2<base/>标签-作用:改变链接的默认行为-位置:在head标签中-属性:href——改变默认链接;target——改变默认目标。7.3可作为锚点-作用:跳转到本页指定id......