前面我们写了一个WordPress的采集插件:WordPress WP-JPost 自动采集发布插件 。最近我们在增加一个去除正文内容里指定元素HTML内容的功能,插件中是用的是simple_html_dom类库来操作HTML,这里记录一下simple_html_dom 删除指定元素HTML内容的PHP代码:
$html = @str_get_html($result);
$j_replace_tags = explode(',', $j_replace_tags);
foreach( $j_replace_tags as $tags_ele):
foreach( $html->find($tags_ele) as $date )
$date->outertext = '';
endforeach;
echo $html->find('.content',0)->innertext;
$result 值是读取的html流。
$j_replace_tags 是填写的值,并使用英文状态的逗号( , )作为分隔符。如:script,.jads 等。
如一段代码里含有多个script段,这里将会全部删除。
最后过滤出来的$html已经是删除了某个元素的html了。