php simple_html_dom 操作HTML 删除指定标签及HTML内容 代码实例

前面我们写了一个WordPress的采集插件:WordPress WP-JPost 自动采集发布插件 。最近我们在增加一个去除正文内容里指定元素HTML内容的功能,插件中是用的是simple_html_dom类库来操作HTML,这里记录一下simple_html_dom 删除指定元素HTML内容的PHP代码:

$html = @str_get_html($result); 
$j_replace_tags = explode(',', $j_replace_tags);
foreach( $j_replace_tags as $tags_ele):
    foreach( $html->find($tags_ele) as $date )
        $date->outertext = '';
endforeach;
echo $html->find('.content',0)->innertext;

$result 值是读取的html流。

$j_replace_tags 是填写的值,并使用英文状态的逗号( , )作为分隔符。如:script,.jads 等。

如一段代码里含有多个script段,这里将会全部删除。

最后过滤出来的$html已经是删除了某个元素的html了。

评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注