当前位置: 首页 > 图文教程 > 脚本技术 > Ruby > ruby写扫描当前网页所有url的脚本

Ruby
Rails link_to 详解
ruby 小脚本搞定CVS服务器更换后checkout下来的工程迁移
Ruby 魔法 学习笔记之一
Ruby self在不同环境的含义
ruby 程序的执行顺序
ruby on rails 代码技巧
ruby 标准类型总结
ruby 去掉文件里重复的行
Ruby 取得指定月日期数的方法
Ruby 中关于日文转UTF-8及半角全角转换的技巧
比较不错的关于ruby的电子书下载地址集合
二十分钟 教你Ruby快速入门 图文教程
Terry七月Ruby读书笔记(比较详细)
Ruby rails 页面跳转(render和redirect_to)
Ruby 之 class 中的 private、 protected、public

Ruby 中的 ruby写扫描当前网页所有url的脚本


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-11   浏览: 264 ::
收藏到网摘: n/a

用ruby写的扫描当前网页所有url的脚本,对于学习ruby的朋友是个不错的实例 #scanweb.rb
#用法ruby scanweb.rb www.ruanchen.com 将当前结果保存在c:\1.txt
require 'net/http'
filename= File.new('c:\1.txt',"w+")
if $*[0]==nil
puts "hehe,没有输入网址"
else
h = Net::HTTP.new($*[0], 80)
resp, data = h.get('/index.html', nil)
if resp.message == "OK"
data.scan(/<a href="(.*?)"/).each do |x|
puts x
filename.puts x
end
end
end
#无聊,有vbs、php、ruby版了,好像ruby比vbs快,与php不相上下。
=begin
修改一下
require 'net/http'
filename= File.new('1.txt',"w+")
if $*[0]==nil
abort "用法示例:ruby #$0 www.sohu.com ,结果放在当前目录1.txt"
end
h = Net::HTTP.new($*[0], 80)
resp, data = h.get('/index.html', nil)
if resp.message == "OK"
data.scan(/<a href="(.*?)"/).each do |x|
puts x
filename.puts x
end
end
=end