用php代替js玩转dom的思路及示例代码

当前位置：首页 > 范文|应用文 > IT技术专栏 > 脚本栏目

来源：易贤网阅读：766 次日期：2014-10-08 13:19:31

温馨提示：易贤网小编为您整理了“用php代替js玩转dom的思路及示例代码”,方便广大网友查阅！

事情的起源比较简单，我需要把一个导航页的数据整理好写入数据库。一个比较直观的方法是对html文件进行分析，通用的方法是用php的正则表达式来匹配。但是这样做开发和维护都很困难，代码可读性非常差。

导航页的数据都是规则的排列在dom树当中的，用js可以用几个循环轻松的对其进行操作，而且js需要依赖浏览器，操作数据库很困难。其实php就有现成的类库对dom树种的节点进行增删改查操作，在此做一些笔记。

这里涉及到2个类 domdocument 和 domxpath。

其实思路比较明确，就是通过domdocument将一个html file转换成dom树的数据结构，再用domxpath的实例去搜索这个dom树，拿到想要特定节点，接下来就可以对当前节点的子树进行遍历，得到想要的结果。

在当前目录下有一个这样一个导航的html文件 ./hao.html

现在需要得到所有<a>标签的中文内容，php代码如下：

代码如下:

<?php

//将html/xml文件转换成dom树

$dom = new domdocument();

$dom->loadhtmlfile(hao.html);

//得到所有class为fix的dl标签

// example 1: for everything with an id

//$elements = $xpath->query(//*[@id]);

// example 2: for node data in a selected id

//$elements = $xpath->query(/html/body/div[@id='yourtagidhere']);

// example 3: same as above with wildcard

//$elements = $xpath->query(*/div[@id='yourtagidhere']);

$xpath = new domxpath($dom);

$dls = $xpath->query('//dl[@class=fix]');

foreach ($dls as $dl) {

$spans = $dl->childnodes;

foreach ($spans as $span) {

echo trim($span->textcontent).\t;

}

echo \n;

}

输出结果如下：

注意：值得注意的一点是domdocument的默认编码方式是latin，所以在处理utf编码的中文的时候，需要在<head>后面紧跟着填入

代码如下:

在其他位置，或者是只写上<meta content=charset=utf-8>都是不识别的哦

更多信息请查看IT技术专栏

上一篇：.net 数据表格显示控件介绍

下一篇：正则替换换行符和把 br 替换成换行符

易贤网手机网站地址：用php代替js玩转dom的思路及示例代码

由于各方面情况的不断调整与变化，易贤网提供的所有考试信息和咨询回复仅供参考，敬请考生以权威部门公布的正式信息和咨询为准！

最新信息

2025年玉溪第六中学青年就业见习基地就业见习岗位招募公告

2025年云南玉溪中汇电力设备有限责任公司就业见习岗位招幕公告

2025年玉溪市儿童医院就业见习岗位招募公告

2025年临沧市沧源县医共体总医院招聘急需紧缺专业人才公告

2025年西双版纳州景洪市综合行政执法局招聘工作人员公告

2025年临沧市双江县住房和城乡建设局招聘政府性购买服务岗位公告

2025年全国一、二级注册建筑师资格考试云南考区公告

2025年云南省建筑材料科学研究设计院有限公司招聘公告

2025年云南省二级造价工程师职业资格考试考务工作通知

2025年中国银行股份有限公司春季招聘公告

公考类

云南公务员贵州公务员四川公务员广西公务员各省公务员国家公务员选调遴选

招聘类

事业单位教师招聘特岗教师三支一扶志愿者银行招聘国企招聘

各类考试

学历升学会计考试职业资格外语考试医学考试工程考试教师资格