手机站
网通分站
电信主站
密 码:
用户名:
当前位置 : 主页>网络编程>Asp编程>列表

用Regular Expression来改变HTML代码

来源:互联网 作者:west263.com 时间:2008-02-23
西部数码-全国虚拟主机10强!40余项虚拟主机管理功能,全国领先!双线多线虚拟主机南北访问畅通无阻!免费赠送企业邮局,.CN域名,自助建站480元起,免费试用7天,满意再付款! P4主机租用799元/月.月付免压金!
我最近在为一个客户开发在线论坛程序,我想把用户发言中的url或e-mail地址用超链接显示出来. 用JavaScript的regular expressions是最容易实现的.

用户在表单里的多行文本框中输入他们的发言内容,然后把消息送到论坛的用户发言区中,然而,在把消息在论坛里显示出来之前,我要调用一个函数来处理消息,对url动些手脚.

我不想在这里讨论如何从数据库里取得一条记录了,这个站点已经说得很透彻了. 我们假设用户的消息文本存放在数据库中,并被赋予了一个叫s_message的变量.

<%

'...start the page and spit out html to the browser

'call the function to convert the message
Response.Write to_html(s_message)

%>

函数如下:


<%
Function to_html(s_string)

to_html = Replace(s_string, """", """)
to_html = Replace(to_html, "<", "<")
to_html = Replace(to_html, ">", ">")
to_html = Replace(to_html, vbcrlf, "
")
to_html = Replace(to_html, "/<", "<")
to_html = Replace(to_html, "/>", ">")
to_html = edit_hrefs(to_html)

End Function
%>

<script language="javascript1.2" runat=server>
function edit_hrefs(s_html){

// use regular expressions to look for
// e_mail addresses and urls
s_str = new String(s_html);

s_str = s_str.replace(/\bhttp\:\/\/www(\.[\w \.\:\/\_] )/gi,
"http\:\/\/?¤?$1");

s_str = s_str.replace(/\b(http\:\/\/\w \.[\w \.\:\/\_] )/gi,
"<a href=\"$1\">$1<\/a>" target=_blank);

s_str = s_str.replace(/\b(www\.[\w \.\:\/\_] )/gi,
"<a href=\"http://$1\">$1</a>" target=_blank);

s_str = s_str.replace(/\bhttp\:\/\/?¤?(\.[\w \.\:\/\_] )/gi,
"<a href=\"http\:\/\/www$1\">http\:\/\/www$1</a>" target=_blank);

s_str = s_str.replace(/\b(\w @[\w \.?]*)/gi,
"<a href=\"mailto\:$1\">$1</a>" target=_blank);


return s_str;

}
</script>

上面的代码做了这些事儿:

1. 把引号转换成"这样的html元素. 这不是必需的,但最好这么做.

2. 把小于号转换成html元素<. 这样的话,如果有人在发的消息里用到了小于
号,html会正确输出. 另外,也防止某些人耍小花招,比如用<b>bold</b>来特定的字以粗体显示.

3. 把大于号转换成>. 原因同上.

4. 把回车换行转换成html换行标签"
"

5. 这就是我们要动的手脚. 它允许人们在代码里放入简单的html并逃脱代码的转换. 然而,他们得用"/"来避开对"<>"的代码检查. 我想总会有人找出绕过代码转换的办法的,如果他们办到了,用"牛"来形容他们的水平是再恰当不过的了.

6. 最后,调用JavaScript的edit_hrefs的函数.

现在,让我们来看看每行的JavaScript的函数做了些甚麽:

1. 为传递函数的参数创建一个字符串对象.

2. 把所有的http://www.[something]找出来,转换成http:////?¤?.
[something]. 这是一个临时性的措施,处理所有的www.[something]. 因此
http://www.pinarello.com/被替换成http://?¤?.pinarello.com/.

3. 转换其余的http://[something],有些网址是不以www开头的. 比如
http://uk.imdb.com/将被转换为<a
href="http://uk.imdb.com/">http://uk.imdb.com/</a>

4. 寻找所有的www.[something],把它们转换成html. 比如www.principia.dk将被转换成<a href="http://www.principia.dk">www.principia.dk</a>

5. 把第二部中所有的http://?¤?.[something]/给改回来. 第二步中的http://?
¤?.pinarello.com/将被转换为http://www.pinarello.com/.

6. 最后,找出e-mail地址将其转换为<a href="mailto:[e-mail address]">[e-
mail address]</a>. 我这里用来查找e-mail地址的Regular expression不同于
Ian Stalling的, 但我还没有发现有甚麽e-mail地址用这种办法不能处理的. 然而,它还没有被彻底的测试过. 无论何时,只要你发现存在任何问题,最好马上就Ian's的代码把我写的这些代码给换掉.

你可以把这个函数用于任何用途. 或许你能增强它的功能,或是删去多余的东西,抑或是增加新的函数. 如果你这么做了,你将乐在其中!

文章整理:西部数码--专业提供域名注册虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!