一旦上网,就无法抹去

"互联网永远不会忘记"是一句常见的说法。发布在社交媒体上的照片、博客文章、论坛评论,即使按下了删除按钮,它们可能并没有真正消失。为什么互联网"永远不会忘记"?

Wayback Machine - 互联网的图书馆

由非营利组织 Internet Archive 运营的"Wayback Machine"自 1996 年以来一直在自动保存全球的网页。截至 2024 年,已保存超过 8660 亿个页面。

这意味着你 10 年前创建的主页或 5 年前删除的博客文章可能仍然保存在 Wayback Machine 中。只需输入 URL,就可以查看过去某个时间点的页面。

Wayback Machine 被广泛用于学术研究、新闻报道和法律证据保全等正当目的。另一方面,它也造成了"本应被删除的信息仍然可以访问"的问题。

网页存档 - 独特的日本文化

日本有一种独特的服务叫"Web 鱼拓"(网页拓印)。这是一种用户可以保存任何网页快照的服务,主要用于"证据保全"。

  • 在争议性言论被删除前保存快照
  • 在企业丑闻相关页面被删除前保存
  • 记录网上商店的价格显示

"被拓印了"这个说法在日本互联网文化中根深蒂固。

社交媒体上的"删除"真的是删除吗?

即使删除了社交媒体帖子,信息可能因以下原因而持续存在。

  • 其他用户的截图:如果有人截了图,即使你删除了原帖也可以传播
  • 搜索引擎缓存:Google 会在一定时期内保留网页的副本(缓存)。删除后可能仍然可以从缓存中查看一段时间
  • 服务提供商的备份:服务提供商可能出于法律义务或系统原因保留数据备份
  • 分享和转发:一旦其他用户分享了你的帖子,即使你删除原帖,副本仍然存在

"被遗忘权" - 法律对策

欧盟的 GDPR 包含"被遗忘权"。个人可以要求搜索引擎删除关于自己的搜索结果。

2014 年,欧盟法院命令 Google 根据个人请求从搜索结果中删除链接。此后,Google 一直在接受欧盟公民的删除请求,截至 2024 年,已有数百万个 URL 从搜索结果中被删除。

但这只是从搜索结果中删除链接,原始页面本身并未被删除。通过直接输入 URL 仍然可能访问。

保护自己

  • 发布前三思:以"10 年后被看到也没关系吗?"为标准
  • 最小化个人信息:谨慎分享真实姓名、地址、电话号码和工作单位
  • 检查隐私设置:定期检查社交媒体账号的可见性设置
  • 设置 Google 快讯:为你的名字设置 Google 快讯,当有新信息发布时会收到通知

你在 IP 确认酱上可以查看的 IP 地址也会被记录在网站的访问日志中。你的在线活动被记录的程度可能超出你的想象。

总结

Wayback Machine 保存了超过 8660 亿个页面,网页存档创造了证据保全的文化,截图瞬间传播。"删除按钮"并非万能。请以"发布在互联网上的信息可能永远存在"为前提行事。

本文相关术语

IP 地址 IP 地址被记录在网站访问日志中,留下你的浏览记录痕迹。 Cookie 即使删除了 Cookie,服务器端的日志仍然存在。仅客户端删除是不够的。 DNS DNS 查询日志也会被 ISP 记录。你访问了哪些网站的记录会留下。