昨天CNBETA突然改版了,实在不清爽了,引大堆人吐槽,正好,前阵看了下node,发现抓取网页超级简单,就自己抓取下吧,几十行代码,比ruby方便好多,主要cheerio用起来太顺手,而且性能很好

index.js
var util = require('../lib/util.js');
var cheerio = require('cheerio');
exports.index = function(req, res) {
var url = "http://www.cnbeta.com";
util.get(url,
function(content, status) {
var $ = cheerio.load(content);
var realtime_li...