新语丝网页的HTML化建议



所有跟贴·加跟贴·新语丝科技论坛

送交者: SVT 于 2005-6-22, 06:50:12:


HTML化的最大好处可使搜索服务器把你排在前面,可以使更多的人访问你的网页。
据不久前的调查,90%以上的用户通过Google等各种搜索服务器寻找各种网页。
下面举个例子,
经常访问新语丝的人知道有鲁迅家页,想看的时候直奔该网页就是了。但是通过搜索服务器怎么样呢?
在Google窗口输入"孔乙己",首先跳出的第一项是一个有"孔乙己"HTML文本的网站,因为是国内服务器的关系,非常慢,该HTML里有< title>孔乙己(鲁迅)</title>。新语丝的"孔乙己"(http://www.xys.org/xys/classics/Lu-Xun/Nahan/kongyiji.txt)虽然PageRank较高(3),但被排在了第28位,推测原因是缺少< title> </title>,文本中的文字权重比较小,非常可惜。
从TXT文本转换到HTML并不复杂,可通过Perl小程序来批量处理。比如说编一个小程序,把文本文章的内容插到下面的文章内容处,把文章题目插到有关的位置,文章总体文字数基本不变,但是从纯文本文件变成了HTML文件,放在网上后,由于有< title> 文章题目 </title>,可使该网页在搜索服务器的结果靠前许多。这个想法同样适用于新到资料等其他网页。如果网页管理人有兴趣的话,请给一个电子邮址,本人愿意编一个Perl程序寄上,可以先试一试,然后进一步修改和完善。

< html>
< head>
< META http-equiv="Content-Type" content="text/html;charset=UTF-8">
< title>文章题目</title>
< /head>
< body>
< H3>文章题目</H3>
< p>文章内容
< hr>
< a href="xxxx">返回</a>
</body>
</html>




所有跟贴:
  • Are you volunteering for the work to improve XYS? - AA (72 bytes) 2005-6-27, 21:21:39
  • 同意“HTML化”,但是对你其他建议都有不同意见 - 松鼠 (1032 bytes) 2005-6-23, 00:33:28
  • 把perl程序放在了网上,欢迎讨论 - SVT (52 bytes) 2005-6-22, 23:31:58

    加跟贴

    笔名: 密码(可选项): 注册笔名请按这里

    标题:

    内容(可选项):

    URL(可选项):
    URL标题(可选项):
    图像(可选项):


    所有跟贴·加跟贴·新语丝科技论坛