"404"的真实身份

如果你使用过互联网,一定遇到过访问网站时出现的"404 Not Found"。你知道页面没找到,但为什么是"404"这样一个奇怪的数字呢?

实际上,404 是 HTTP 状态码之一。这些是 Web 服务器用来向浏览器传达"请求结果"的三位数字,第一位数字遵循特定的规律。

  • 1xx:处理中("收到了,请稍等")
  • 2xx:成功(200 OK 是经典。"一切顺利")
  • 3xx:重定向("已经搬到别的地方了")
  • 4xx:客户端错误("你的请求有问题")
  • 5xx:服务器错误("抱歉,是我们的问题")

404 属于"4xx = 你这边的问题",其中"04 = 未找到"。也就是说,它的意思是"你指定的 URL 对应的页面在这台服务器上不存在"。

"CERN 404 号房间"的传说是真的吗?

有一个著名的互联网都市传说:"404 源自 CERN(欧洲核子研究组织)的 404 号房间,那里放着服务器。"故事说 Web 的发明者 Tim Berners-Lee 在 CERN 的 404 号房间工作,当找不到文件时,回复就是"我查了 404 号房间,但没找到"。

然而,这并不是真的。CERN 的建筑中是否存在 404 号房间从未得到证实,Tim Berners-Lee 本人也否认了这个说法。404 这个数字是在 HTTP 规范开发过程中作为状态码系统编号的一部分确定的。

404 页面的创意运用

许多公司将 404 页面作为娱乐用户的机会。

  • GitHub:显示"星球大战"风格的视差动画,配文"This is not the web page you are looking for"
  • Pixar:展示电影《头脑特工队》中"忧忧"哭泣的插画
  • LEGO:展示乐高小人修复损坏页面的动画
  • Bloomberg:显示"Are you lost?"并提供市场数据链接

404 页面承担着重要的角色,当用户走进死胡同时,引导他们前往首页或搜索功能,而不是让他们直接离开网站。

其他"有趣的"状态码

  • 418 I'm a teapot:1998 年在 RFC 2324 中作为愚人节玩笑定义,用于"茶壶被要求煮咖啡"的情况。虽然是玩笑,但作为正式 RFC 确实存在
  • 451 Unavailable For Legal Reasons:因法律原因无法访问的页面。编号取自 Ray Bradbury 的小说《华氏 451 度》(一部关于焚书的反乌托邦小说)
  • 503 Service Unavailable:服务器暂时过载。在热门票务开售时经常看到
  • 301 Moved Permanently:页面已永久移动。访问旧 URL 会自动重定向到新地址

如何减少 404 错误

对网站运营者来说,404 错误也会对 SEO 产生负面影响。搜索引擎可能会将 404 较多的网站判定为"维护不善"。

  • 删除或移动页面时设置 301 重定向
  • 定期检查内部链接并修复断链
  • 准备一个自定义 404 页面,引导用户前往首页或搜索

IP 确认酱上,访问不存在的页面也会显示带有返回首页导航的自定义 404 页面。

总结

404 诞生于 HTTP 状态码的系统编号,与 CERN 的 404 号房间无关。下次遇到 404 页面时,不妨欣赏一下那个网站准备的创意设计。

本文相关术语

HTTPS HTTP 状态码是 HTTP 和 HTTPS 共有的机制。 DNS DNS 找到了服务器,但指定的页面不存在,这就是 404。 IP 地址 404 意味着与服务器的连接本身是成功的。IP 地址解析已经完成。