通过php代码来实现一些功能时或通过php代码来实现采集数据时,采集到的数据或多或少都会带有html代码以及一些冗余杂乱数据,要经过处理下替换或者过滤掉这些不需要的数据,为了效率可以使用php正则表达式来进行替换或者过滤,下面是一些实用的替换或者过滤数据的正则表达式php代码,使用这些正则表达式就可以很好的替换或者过滤一些不想要的冗余杂乱数据。$str=preg_replace("/<[\/\!]*?[^<>]*?>/","",$str); //替换或过滤所有html代码
$str=preg_replace("/\s+/", " ", $str); //替换或过滤多余回车
$str=preg_replace("/<[ ]+/si","<",$str); //替换或过滤<__("<"号后面带空格)
$str=preg_replace("/<\!--.*?-->/si","",$str); //注释
$str=preg_replace("/<(\!.*?)>/si","",$str); //替换或过滤DOCTYPE
$str=preg_replace("/<(\/?html.*?)>/si","",$str); //替换或过滤html标签
$str=preg_replace("/<(\/?head.*?)>/si","",$str); //替换或过滤head标签
$str=preg_replace("/<(\/?meta.*?)>/si","",$str); //替换或过滤meta标签
$str=preg_replace("/<(\/?body.*?)>/si","",$str); //替换或过滤body标签
$str=preg_replace("/<(\/?link.*?)>/si","",$str); //替换或过滤link标签
$str=preg_replace("/<(\/?form.*?)>/si","",$str); //替换或过滤form标签
$str=preg_replace("/cookie/si","COOKIE",$str); //替换或过滤COOKIE标签
$str=preg_replace("/<(applet.*?)>(.*?)<(\/applet.*?)>/si","",$str); //替换或过滤applet标签
$str=preg_replace("/<(\/?applet.*?)>/si","",$str); //替换或过滤applet标签
$str=preg_replace("/<(style.*?)>(.*?)<(\/style.*?)>/si","",$str); //替换或过滤style标签
$str=preg_replace("/<(\/?style.*?)>/si","",$str); //替换或过滤style标签
$str=preg_replace("/<(title.*?)>(.*?)<(\/title.*?)>/si","",$str); //替换或过滤title标签
$str=preg_replace("/<(\/?title.*?)>/si","",$str); //替换或过滤title标签
$str=preg_replace("/<(object.*?)>(.*?)<(\/object.*?)>/si","",$str); //替换或过滤object标签
$str=preg_replace("/<(\/?objec.*?)>/si","",$str); //替换或过滤object标签
$str=preg_replace("/<(noframes.*?)>(.*?)<(\/noframes.*?)>/si","",$str); //替换或过滤noframes标签
$str=preg_replace("/<(\/?noframes.*?)>/si","",$str); //替换或过滤noframes标签
$str=preg_replace("/<(i?frame.*?)>(.*?)<(\/i?frame.*?)>/si","",$str); //替换或过滤frame标签
$str=preg_replace("/<(\/?i?frame.*?)>/si","",$str); //替换或过滤frame标签
$str=preg_replace("/<(script.*?)>(.*?)<(\/script.*?)>/si","",$str); //替换或过滤script标签
$str=preg_replace("/<(\/?script.*?)>/si","",$str); //替换或过滤script标签
$str=preg_replace("/javascript/si","Javascript",$str); //替换或过滤script标签
$str=preg_replace("/vbscript/si","Vbscript",$str); //替换或过滤script标签
$str=preg_replace("/on([a-z]+)\s*=/si","On\\1=",$str); //替换或过滤script标签
$str=preg_replace("/&#/si","&#",$str); //替换或过滤script标签,如javAsCript:alert(
评论
13条评论2023 Lv.1
Chrome 109.0.0.0
Windows 回复
感谢楼主
,好人一生平安
广西百色市 电信
5555555 Lv.1
Chrome 94.0.4606.71
Windows 回复
666666热乎
湖南省长沙市 电信
JAVA Lv.1
Chrome 94.0.4606.71
Windows 回复
看一看
山东省 联通
mua123 Lv.1
Chrome 94.0.4606.71
Windows 回复
666
陕西省西安市 电信
浅夏云-浅夏 Lv.1
Chrome 95.0.4638.69
Windows 回复
安徽省淮南市 联通
孜然 Lv.1
Chrome 106.0.0.0
Mac OS X 10.15.7 回复
try啊哈哈哈啊哈
中国 移动
踢足球的肖邦 Lv.1
Chrome 87.0.4280.141
Android 11 回复
刚才丑八怪
广东省珠海市斗门区 电信
周松松博客 Lv.1
Chrome 97.0.4692.71
Windows 7 x64 Edition 回复
看一看
福建省 移动
aigozi Lv.1
Chrome 78.0.3904.108
Windows 回复
效地址,于是就想到了先检查下地址是否有效,
中国 移动
lssun Lv.5 回复
导航栏有用
广东省东莞市 联通