当前位置: 首页 > 图文教程 > 脚本技术 > Ruby > ruby写扫描当前网页所有url的脚本

Ruby
ruby 模块
ruby 过程对象 解析
ruby 变量
解析 ruby 全局变量
ruby 实变量
ruby 局部变量
ruby 类常量 解析
ruby 异常处理:rescue
ruby 异常处理:ensure
ruby 存取器 概念
ruby 对象的初始化 方法
ruby 杂项
初步了解一下什么是ruby
ruby写扫描当前网页所有url的脚本
比较详细的ruby symbol 学习资料
ruby will_paginate的用法
Ruby进行文件信息输出实例代码
采用UTF-8解决Ruby on Rails程序的中问题
rails "No route matches" 错误的解决方法
rails 连接mysql的问题解决

Ruby 中的 ruby写扫描当前网页所有url的脚本


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-11   浏览: 263 ::
收藏到网摘: n/a

用ruby写的扫描当前网页所有url的脚本,对于学习ruby的朋友是个不错的实例 #scanweb.rb
#用法ruby scanweb.rb www.ruanchen.com 将当前结果保存在c:\1.txt
require 'net/http'
filename= File.new('c:\1.txt',"w+")
if $*[0]==nil
puts "hehe,没有输入网址"
else
h = Net::HTTP.new($*[0], 80)
resp, data = h.get('/index.html', nil)
if resp.message == "OK"
data.scan(/<a href="(.*?)"/).each do |x|
puts x
filename.puts x
end
end
end
#无聊,有vbs、php、ruby版了,好像ruby比vbs快,与php不相上下。
=begin
修改一下
require 'net/http'
filename= File.new('1.txt',"w+")
if $*[0]==nil
abort "用法示例:ruby #$0 www.sohu.com ,结果放在当前目录1.txt"
end
h = Net::HTTP.new($*[0], 80)
resp, data = h.get('/index.html', nil)
if resp.message == "OK"
data.scan(/<a href="(.*?)"/).each do |x|
puts x
filename.puts x
end
end
=end