通过php代码来实现一些功能时或通过php代码来实现采集数据时,采集到的数据或多或少都会带有html代码以及一些冗余杂乱数据,要经过处理下替换或者过滤掉这些不需要的数据,为了效率可以使用php正则表达式来进行替换或者过滤,下面是一些实用的替换或者过滤数据的正则表达式php代码,使用这些正则表达式就可以很好的替换或者过滤一些不想要的冗余杂乱数据。$str=preg_replace("/<[\/\!]*?[^<>]*?>/","",$str); //替换或过滤所有html代码
$str=preg_replace("/\s+/", " ", $str); //替换或过滤多余回车
$str=preg_replace("/<[ ]+/si","<",$str); //替换或过滤<__("<"号后面带空格)
$str=preg_replace("/<\!--.*?-->/si","",$str); //注释
$str=preg_replace("/<(\!.*?)>/si","",$str); //替换或过滤DOCTYPE
$str=preg_replace("/<(\/?html.*?)>/si","",$str); //替换或过滤html标签
$str=preg_replace("/<(\/?head.*?)>/si","",$str); //替换或过滤head标签
$str=preg_replace("/<(\/?meta.*?)>/si","",$str); //替换或过滤meta标签
$str=preg_replace("/<(\/?body.*?)>/si","",$str); //替换或过滤body标签
$str=preg_replace("/<(\/?link.*?)>/si","",$str); //替换或过滤link标签
$str=preg_replace("/<(\/?form.*?)>/si","",$str); //替换或过滤form标签
$str=preg_replace("/cookie/si","COOKIE",$str); //替换或过滤COOKIE标签
$str=preg_replace("/<(applet.*?)>(.*?)<(\/applet.*?)>/si","",$str); //替换或过滤applet标签
$str=preg_replace("/<(\/?applet.*?)>/si","",$str); //替换或过滤applet标签
$str=preg_replace("/<(style.*?)>(.*?)<(\/style.*?)>/si","",$str); //替换或过滤style标签
$str=preg_replace("/<(\/?style.*?)>/si","",$str); //替换或过滤style标签
$str=preg_replace("/<(title.*?)>(.*?)<(\/title.*?)>/si","",$str); //替换或过滤title标签
$str=preg_replace("/<(\/?title.*?)>/si","",$str); //替换或过滤title标签
$str=preg_replace("/<(object.*?)>(.*?)<(\/object.*?)>/si","",$str); //替换或过滤object标签
$str=preg_replace("/<(\/?objec.*?)>/si","",$str); //替换或过滤object标签
$str=preg_replace("/<(noframes.*?)>(.*?)<(\/noframes.*?)>/si","",$str); //替换或过滤noframes标签
$str=preg_replace("/<(\/?noframes.*?)>/si","",$str); //替换或过滤noframes标签
$str=preg_replace("/<(i?frame.*?)>(.*?)<(\/i?frame.*?)>/si","",$str); //替换或过滤frame标签
$str=preg_replace("/<(\/?i?frame.*?)>/si","",$str); //替换或过滤frame标签
$str=preg_replace("/<(script.*?)>(.*?)<(\/script.*?)>/si","",$str); //替换或过滤script标签
$str=preg_replace("/<(\/?script.*?)>/si","",$str); //替换或过滤script标签
$str=preg_replace("/javascript/si","Javascript",$str); //替换或过滤script标签
$str=preg_replace("/vbscript/si","Vbscript",$str); //替换或过滤script标签
$str=preg_replace("/on([a-z]+)\s*=/si","On\\1=",$str); //替换或过滤script标签
$str=preg_replace("/&#/si","&#",$str); //替换或过滤script标签,如javAsCript:alert(
评论
172条评论ゞ做人要低調兒 Lv.1
Chrome 107.0.0.0
Windows 回复
ddddddD的
江西省上饶市 移动
打工的仔仔 Lv.1
Chrome 92.0.4515.
Android 12 回复
可以
河北省 移动
№闲情@逸致‰ Lv.1
Android Webkit 4.0
Android 12 回复
支持
广东省广州市 电信
3134908354 Lv.1
Chrome 94.
Android 11 回复
6666
中国 移动
lovek6 Lv.1
Chrome 86.0.4240.198
Windows 7 x64 Edition 回复
感谢楼主
,好人一生平安
广东省深圳市 电信
慕城 Lv.1
Android Webkit 4.0
Android 12 回复
来看看吧
广东省广州市 联通
纯小白 Lv.1
Firefox 106.0
Windows 回复
江西省萍乡市 电信
漫步云端你爸爸 Lv.1
Android Webkit 4.0
Android 12 回复
非常不错,带着全家来支持一下。
湖南省邵阳市 电信
何鸿燊 Lv.1
Chrome 96.0.4664
Android 12 回复
看看
广东省茂名市 移动
2065498621 Lv.1
Chrome 86.0.4240.198
Windows 回复
rrrrrrrrrrrrrrr
河南省平顶山市舞钢市 电信