搜索
查看: 2555|回复: 3

查找网页源代码中的超链接问题,请各位帮忙一下

[复制链接]

2

主题

3

帖子

28

积分

新手入门

Rank: 1

积分
28
发表于 2014-2-28 09:23:17 | 显示全部楼层 |阅读模式

  1. io.open();

  2. var str=".....adt201-40228-2223-aaabc798.html  target=_blank";
  3. pattern = //\s*href\s*=\s*"?\'?([:\w\./@]+)"?\'?\s*
  4. var newstr=string.match(str,pattern);
  5. io.print(newstr);
  6. //最后输入结果为:....yn/zhxw/201402/sadt201
  7. //url地址没有截取完整,由于是 -  这个符号导致的,请解决下。

  8. execute("pause")

复制代码
回复

使用道具 举报

2

主题

871

帖子

4689

积分

荣誉会员

Rank: 8Rank: 8

积分
4689
发表于 2014-2-28 09:48:33 | 显示全部楼层

匹配里有href,提供的文本里却没有, 建议你把超链接发全,不要用省略号省掉一半

匹配里有href,提供的文本里却没有,
建议你把超链接发全,不要用省略号省掉一半

回复

使用道具 举报

2

主题

3

帖子

28

积分

新手入门

Rank: 1

积分
28
 楼主| 发表于 2014-2-28 10:14:25 | 显示全部楼层

[i=s] 本帖最后由 bird 于 2014-2-28 10:15 编辑 [/i] 你好,链接地址我是随边写的,主要是url地址中有一个符串 “-” 横线。

本帖最后由 bird 于 2014-2-28 10:15 编辑

你好,链接地址我是随边写的,主要是url地址中有一个符串 “-” 横线。
比如有个字符串为:
var str=
/*
<h3><a HrEf=http://health.jschina.com.cn/system/sdfsdf20-14ssdfdf/0sdfsd-2adf2323/27/0203-95027.shtml  target=_blank onclick="onResultClick('%E5%81%A5%E5%BA%B7+site%>哈基材森罗万象</a>顶替顶替</h3>
就以为这地址为例吧,

*/
回复

使用道具 举报

2

主题

871

帖子

4689

积分

荣誉会员

Rank: 8Rank: 8

积分
4689
发表于 2014-2-28 10:51:25 | 显示全部楼层

[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=64808&ptid=11655][c

bird 发表于 2014-2-28 10:14
你好,链接地址我是随边写的,主要是url地址中有一个符串 “-” 横线。
比如有个字符串为:
var str=

不知道你看到哪个HTML里是这样写的HrEf ?
好吧,如果真有人会这样写:
var str=
/*
<h3><a HrEf=http://health.jschina.com.cn/system/sdfsdf20-14ssdfdf/0sdfsd-2adf2323/27/0203-95027.shtml  target=_blank#000000">

m = string.match(str,
"<@@href@>\s*=\s*(\S+)")  

io.open()
io.print( m )
串匹配以@@开始指定忽略大小写,例如
<@@href@>

不要去假设任何可能下都能匹配出结果,模式匹配首先要找出该文本的特征、书写风格。
如果要完美的解析HTML语法、可使用标准库里的 web.mshtml 。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

手机版|未经许可严禁引用或转载本站文章|站长邮箱|aardio.com|aardio官方社区 ( 皖ICP备09012014号 )

GMT+8, 2020-7-6 02:51 , Processed in 0.078125 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表