«
动易采集一个新问题

时间:2007-1-11    作者:Deri    分类: 分享


网站正常运行约一个月后文章采集功能突然出了问题,具体表现为所有网站采集无法获取文章列表云云(其实所有问题都是这个提示),进入项目--编辑,下一步后提示为XMLHTTP组件等问题,网络中心前几天刚刚解除了服务器空间上传文件大小200K的限制,但他们表示并未做其它改动。

    自己动手,根据系统的提示,检查了XMLHTTP组件没有问题,那么是防火墙阻止了必须的端口?如果是,又是哪个端口呢?动易论坛有这样一个问题,但只有一条回复:80。本人对端口知识知之甚少,马上百度里现学,了解到80和8080是不可能关闭的,否则会导致无法访问网页,为了确信还在自己的机器上设置IIS端口,并仔细检查网络中心IIS服务器的端口情况,确定80和8080未关闭,那么到底需要哪些端口才能正学采集?为了设置端口,下载了最新版的天网和瑞星防火墙(可以编辑端口规则),再次一个个测试(痛苦!),当然是在网上学习了基本的端口知识,凭直觉和运气来测的,未果!!!

    这时防火墙又弹出对话框(是否阻止“dllhost.exe”进程?),随手点了阻止,随后,本机测试时如愿地不能采集了。。。于是认定了防火墙阻止dllhost.exe捣的鬼,大喜!

    跟网络中心联系后,管理员表示:dllhost.exe是关键进程,防火墙不可能阻止,而且网站服务器并未安装防火墙软件。。。那么,问题究竟在哪里?与管理员在服务器机房研究半天,他的服务器IIS端口明确表示开放了80和8080等必须端口。

    这时我突然想起有时候网站域名不能正常解析的问题,便向他请教,他在DOS里运行了几个命令,网站服务器也存在这个问题,不能正常解析有时,他解释为域名服务器的缓存问题。当然也有可能对网站采集有一定影响――不能正常解析域名!!!思路豁然开朗!

    既然不能正常解析域名,那么直接写采集对象网站的IP如何?测试正常!!大喜!(顺便了解了到大型网站有好多个IP哦,负载均衡)

不过高兴得有点早了,回去后直接采集问题依旧。。。在编辑项目的第一步下一步时正常,但第二步就行不通了,因为采集所得到的文章列表地址不是IP,试着用了一下列表地址的高级功能,也不怎么好操作,罢了,只得再次劳烦网络中心了。。。。不过这次了解了问题所在,解决起来应该简单得多

关键字:动易,动易CMS,动易采集,动易文章采集,文章采集