有许多种原因可能导致Web网站站点无法正常工作,这使得系统地检查所有问题变得很困难。下面将集中分析总结导致Web网站站点崩溃的最常见的问题。如果可以解决这些常规问题,那么也将有能力对付出现的一些意外情况。
磁盘已满
导致系统无法正常运行的最可能的原因是磁盘已满。一个好的互联网网络管理员会密切关注磁盘的使用情况,隔一定的时间,就需要将磁盘上的一些负载转存到备份存储介质中(例如磁带)。
日志文件会很快用光所有的磁盘虚拟空间。Webwe服务器的日志文件、SQL*Net的日志文件、JDBC日志文件,以及应用程序we服务器日志文件均与内存泄漏有同等的危害。可以采取措施将日志文件保存在与操作系统不同的文件系统中。日志文件系统虚拟空间已满时Webwe服务器也会被挂起,但机器自身被挂起的几率已大大减低。
C指针错误
用C或C++编写的程序,如Webwe服务器API模块,有可能导致系统的崩溃,因为只要间接引用指针(即,浏览访问指向的内存)中出现一个错误,就会导致操作系统终止所有程序。另外,使用了糟糕的C指针的Java模拟量(analog)将浏览访问一个空的对象引用。Java中的空引用通常不会导致立刻退出JVM,但是前提是程序员能够使用异常处理方式方法恰当地处理错误。在这方面,Java无需过多的关注,但使用Java对可靠性进行额外的度量则会对性能产生一些负面影响。
内存泄漏
C/C++程序还可能产生另一个指针问题:丢失对已分配内存的引用。当内存是在子程序中被分配时,通常会出现这种问题,其结果是程序从子程序中返回时不会释放内存。如此一来,对已分配的内存的引用就会丢失,只要操作系统还在运行中,则进程就会一直使用该内存。这样的结果是,曾占用更多的内存的程序会降低系统性能,直到机器完全停止工作,才会完全清空内存。
解决方案是使用代码分析工具(如Purify)对代码进行仔细分析,以找出可能出现的泄漏问题。但这种方式方法无法找到由其他原因引起的库中的泄漏,因为库的源代码是不可用的。另一种方式方法是每隔一段时间,就清除并重启进程。Apache的Webwe服务器就会因这个原因创建和清除子进程。
we服务器超载
NetscapeWebwe服务器的每个连接都使用一个线程。NetscapeEnterpriseWebwe服务器会在线程用完后挂起,而不为已存在的连接供应提供任何服务。如果有一种负载分布机制可以检测到we服务器没有响应,则该we服务器上的负载就可以分布到其它的Webwe服务器上,这可能会致使这些we服务器一个接一个地用光所有的线程。这样一来,整个we服务器组都会被挂起。操作系统级别可能还在不断地接收新的连接,而应用程序(Webwe服务器)却无法为这些连接供应提供服务。用户使用者可以在查看浏览器状态行上看到connected(已连接)的提示消息,但这以后什么也不会发生。
解决问题的一种方式方法是将obj.conf参数RqThrottle的值配置设置为线程数目之下的某个数值,这样如果越过RqThrottle的值,就不会接收新的连接。那些不能连接的we服务器将会停止工作,而连接上的we服务器的响应相应速度则会变慢,但至少已连接的we服务器不会被挂起。这时,文件描述符至少应当被配置设置为与线程的数目相同的数值,否则,文件描述符将成为一个瓶颈。
另外,还有许多因素也极有可能导致Web网站站点无法工作。如:同类相关性、子网用户访问量流量超载、糟糕的设备驱动程序、硬件故障、包括包含错误文件的通配符、无意间锁住了关键的表.
Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有