《新语丝·月刊》打包下载


所有跟贴·加跟贴·新语丝读书论坛

送交者: qtl 于 2021-04-25, 08:33:24:

我试着用 julia 写了一个码。另外,转国标码需要 Linux 命令 `iconv`。

代码:

using Gumbo, Cascadia

url = "http://www.xys.org/xys/magazine/GB"

for year in 1994:2021
    page = parsehtml(read(download("$url/$year/"), String))
    for k in eachmatch(sel"li", page.root)
        file = Gumbo.text(k)
        if file[1:3] == "xys"
            download("$url/$year/$file", "tmp.txt") # man change save path
            run(`iconv -c -f gbk -t utf8 tmp.txt -o $file`)
        end
    end
end

run(`tar jcvf xys.tar.bz2 xys*.txt`)




所有跟贴:


加跟贴

笔名: 密码: 注册笔名请按这里

标题:

内容: (BBCode使用说明