统计211

标题: 动态抓取外部URL的网友内容 [打印本页]

作者: 275932488    时间: 2011-7-1 13:30
标题: 动态抓取外部URL的网友内容
  使用之前先要注意一下SAS的版本,SAS8的话需要打补丁,并且好像SAS网站上没有直接的补丁,需注意了,9版当然就没有这问题了
  其实实现这已内容很简单,就是通过SAS的DATA STEP来实现
  首先:需做一个逻辑文件名引用到该URL地址
  然后通过DATA STEP都该文件名即可把内容读取出来
  代码如下:
  filename 引用名 url 'URL地址'
  RECFM=v(读取格式,V表以文本格式读取) lrecl=N(每行最长的记录) ;
  data 表名;
  file _webout;
  infile 引用名 LINESIZE =N pad ;
  length content $32766.;
  input content $char32766.;
  run;
  即可实现抓取URL所指向的网页内容,但是很奇怪的是,联系运行上面代码会造成SAS崩溃,真是奇怪,后来把代码改成如下:
  filename 引用名 url 'URL地址'
  RECFM=v(读取格式,V表以文本格式读取) lrecl=N(每行最长的记录) ;
  data 表名;
  file _webout;
  infile 引用名
  length=len;
  length content $32766.;
  input content $varying32766. len;
  run;
  竟然就不会造成SAS当掉,奇怪啊奇怪





欢迎光临 统计211 (http://www.tj211.com/) Powered by Discuz! X3.2