防火长城: 中国大陆的互联网审查系统

防火长城(英語:Great Firewall,GFW),也称中国国家防火墙,或简称为墙、防火墙等,中国网信办称其为数据跨境安全网关,是该国政府过滤国际互联网出口内容的软硬件系统集合。防火长城不是中國特有的一個專門單位,而是由分散部門的各服务器和路由器等设备,加上相关公司的应用程序构成,其监控所有经过国际网关的通讯,对认为不符合中国官方要求的传输内容,进行干扰、阻断、屏蔽。由於中國網絡審查廣泛,中國大陆內含有「不合適」内容的網站,會受到政府直接的行政干預,故防火長城主要作用在於分析和過濾中國境外網絡的資訊。自本世纪初以来,防火长城由国家计算机网络与信息安全管理中心(CNCERT)运营和维护。

随着防火长城逐渐为人熟知,「墙」一词有时也被用作动词,「被墙」即指网站内容被防火长城所屏蔽。「翻墙」、「挂梯子」、「破网」也被引申为突破网络审查浏览中国大陆境外被屏蔽的网站或使用服务的行为。

历史

中国1994年接入国际互联网,1995年被称为中国的“国际互联网年”。

中国政府对互联网的管控始于1996年,总理李鹏签署了国务院令第195号,发布施行《计算机信息网络国际联网管理暂行规定》。其中第六条规定:“计算机信息网络直接进行国际联网,必须使用邮电部国家公用电信网提供的国际出入口信道。任何单位和个人不得自行建立或者使用其他信道进行国际联网”。该规定在后来被广泛用于处罚“翻墙”行为。

最早使用Great Firewall一词的是白杰明桑晔,他们1997年发表的文章《The Great Firewall of China》称这一系统开发开始在1996年,并且当年在金橋信息網ChinaNet已经有国外新闻网站被屏蔽。

技术手段方面,一开始防火长城仅使用IP封锁,这并不能应对网站时常更换IP的情况。自2002年开始,其能够自动执行针对特定域名DNS劫持,并能够检测HTTP连接中的特定关键字,使用TCP重置攻击的方法阻止连接。

自2010年以来,HTTPS(加密的HTTP)开始被广泛使用,维基媒体计划也于2015年切换到仅加密连接,而防火长城在很长一段时间内都没有处理加密连接。直到2018年8月,对加密连接中“服务器名称指示”(SNI)信息的检测才出现,而此时正是关于加密服务器名称指示(ESNI)的IETF草案发布刚刚1个月后。另外,自2020年7月下旬起,ESNI协议也被封锁。

架构

防火长城: 历史, 架构, 主要技术 
防火长城工作在旁路,而非网关

防火长城主要部署于北京、上海和广州的三个大型互联网交换中心,而非在国际出口,在省级部署的设备较少。根据“GFW技术评论”网站2010年的估计,其硬件配置如下:

  • 防火长城(北京)使用曙光4000L机群,Red Hat操作系统。
  • 防火长城实验室(哈工大)使用曙光服务器,Red Hat操作系统。
  • 防火长城(上海)使用Beowulf集群

另外,防火长城使用的处理器指令集架构x86-64

主要技术

深度包檢測

深度報文檢測(Deep packet inspection, DPI)是一種於應用層對網路上傳遞的資料進行偵測與處理的技術,被廣泛用於入侵檢測流量分析英语Traffic analysis數據挖掘。就字面意思考慮,所謂「深度」是相對於普通的報文檢測而言的——相較普通的報文检测,DPI可對報文内容和协议特征进行检测。

DPI是防火长城檢測關鍵詞及嗅探加密流量的基础,借助硬件設施、適宜的檢測模型和模式匹配算法,它能夠精確且快速地從實時網絡環境中判別出目标流量,並作出審查者所期望的應對措施。

被认为在防火长城部署了的深度包检测包括:

  • DNS协议。防火长城检测所有经过骨干网国际出口路由的位于TCPUDP的53端口上的域名查询请求,等待和处于域名黑名單中的相匹配的。
  • HTTP协议。防火长城检测包含用户访问的网站的域名的HTTP头中的Host字段和发送和回复全文,但对回复的检测在2008年末终止。
  • Tor协议。防火长城无法提取出任何加密前的原始内容,但可以分辨出疑似流量。一般之后以主动探测确认之。
  • SMTP协议。防火长城不仅可以检测邮件的发送人(MAIL FROM)和收件人(RCPT TO),还可以检测邮件全文内容中的关键字,fqrouter作者将这称为“深包中的深包检测”。
  • TLS协议。早期TLS版本中,服务器握手响应,包括证书,是未被加密的,防火长城可以嗅探它而得知访问站点,自TLS版本1.3开始,ServerHello之后的握手信息,包括站点证书,也会被加密后传输,一般可以认为能防止对证书信息的检测;另外,SNI是TLS的一个扩展协议,该协议下,客户端握手过程开始时告诉服务器其连接的域名,以便运作多个HTTPS网站的服务器选择并提供对应证书。而该扩展也未被加密。

DNS污染

等待到深度包检测章节中的“和处于域名黑名单中的相匹配”的域名后,防火长城會向查询者注入虚假DNS回复,比真的更早到达。由于通常的域名查询没有任何认证机制,而且域名查詢通常基于的UDP協議是无连接不可靠的协议,查询者无法验证返回结果的正确性,客户端接受其伪造回复,并尝试连接其中的IP,结果往往是超时,或者出现无效TLS证书之警告。而其对TCP协议的查询则使用TCP重置攻击来阻止获得任何正确结果。

防火长城: 历史, 架构, 主要技术 
防火长城向查询zh.wikipedia.org的DNS请求注入伪造回复

此种行为自2002年开始以来有相当明确的特征。

  • 伪造回复所包含的IP地址或者是保留地址、或者是固定中国境外IP集合中的一个,这些地址通常已经被屏蔽
  • 伪造回复包有固定类型。一型的TTL值和IPID固定,每次注入出现1个;二型的TTL值周期性增加、IPID递减,每次注入出现3个。两种类型都没有设置“不分片”(Don't fragment)选项。另外,2020年的研究指出有另一种新的IPID和TTL值都随机,带有“不分片”选项的回复存在。

这种注入是双向的,不仅是在中国境内查询境外DNS时、境外的DNS查询途经中国时也会出现,这导致许多国外递归DNS服务器的缓存被污染。

根据2014年的研究,防火长城的一个计算集群有360个节点,每个节点的平均处理速度是每秒2800个DNS包。

污染事件

  • 2010年3月,一名智利域名注册商的技术人员发现向位于中国的根服务器查询facebook.com、youtube.com和twitter.com等域名时的回复不正常。中国根服务器运营商Netnod英语Netnod于是暂时切断了其与国际互联网的连接。安全专家认为这与Netnod无关,而是中国政府修改某处网络时造成的。
  • 2014年1月21日下午三点半,中国互联网域名解析异常,大量网站被错误解析到IP地址65.49.2.178,這個IP位於美国加利福尼亚州费利蒙市Hurricane Electric公司,被动态网公司租用于翻墙软件连接节点。动态网公司和研究人员认为这是因为防火长城的工作人员操作失误,另一些人认为,不能排除真正的黑客借这一IP地址作为跳板发动攻击的可能。
  • 2015年1月2日,污染方式有所改变,防火长城不再注入固定、被封锁IP地址,而是境外真实网站的、可访问的地址,这导致了境外服务器遭受来自中国的DDoS攻击,部分网站因此屏蔽中国IP。该年4月,CNCERT发表声明称,劫持是境外攻击所致。

TCP重置攻击

重置(reset)是传输控制协议(TCP)的一种消息,例如服务器端在没有客户端请求的端口或者其它连接信息不符时,系统的TCP协议栈就会给客户端回复一个重置通知消息,该功能本来用于应对例如服务器意外重启等情况,而防火长城阻止TCP连接的技术实际上就是比连接双方更快地发送连接重置消息,使连接双方以为对方终止了连接。

HTTP、SMTP、HTTPS等许多应用协议都基于TCP,防火长城对它们也都使用此种攻击方法。

防火长城每次会注入带有一个RST选项的“一型”和多个带有RST/ACK选项的“二型”数据包,这被认为是来自两种同时部署的审查设备。一型IPID为0,具有随机的窗口尺寸英语TCP tuning#Window_size,没有设置“不分片”选项;二型则有周期性增加的TTL值和窗口尺寸,并且设置了“不分片”。

外部视频链接
防火长城: 历史, 架构, 主要技术  Observations in mainland China (Chinese)YouTube
防火长城: 历史, 架构, 主要技术  Observations in mainland China (English),YouTube

有时防火长城在检测到违禁关键字并注入一次重置后,会在固定时长内、并不区分关键字违禁与否地持续注入,这被称为残余审查。前谷歌高级副总裁艾伦·尤斯塔斯英语Alan Eustace曾发布视频演示此种封锁策略。

IP封锁

防火长城主要采用路由扩散技术封锁特定IP地址,也就是通过将需要拦截的IP地址配置为空路由、黑洞设备或特别配置的自治系统上,在这些黑洞服务器上可以什么也不做,或者对这些报文进行分析和统计,获取更多的信息,甚至可以做出虚假回应。正常的情况下,静态路由是由管理员根据网络拓扑或是基于其它目的而给出的一条路由,所以这条路由是正确的情况下,可以引导路由器把报文转发到正确的目的地。而防火长城的路由扩散技术中使用的静态路由是一条有意配置错误的路由,其目的是为了把本来是发往某个IP地址的报文引导到一个“黑洞服务器”上,而不是把它们转发到正确目的地。通过动态路由协议的路由重分发功能,这些错误的路由信息可以发布到整个网络。

对于由使用虚拟主机服务提供商提供的多域名、单(同)IP的主机托管服务的网站,如果封禁它的IP地址,就会造成“过度封锁”:所有使用该提供商服务的、其他使用相同IP地址的网站也被封锁,就算是「内容健康、政治无关」的网站,也不能幸免。其中的内容可能并无不當之處,但也不能在中国大陆正常访问。所以基于路由封锁的方法现在主要用于针对自主拥有大量连续地址段的特定自治系统,例如FacebookGoogleTelegramTwitter等;对于内容分发网络(CDN)的地址段可能不会采用这种地址封锁的方法,以避免过度封锁。

破网软件的反制

因为有防火长城的存在,大量境外网站无法在中国大陆境内正常访问,于是大陆网民开始逐步使用各类翻墙软件突破防火长城的封锁。针对网上各类突破防火长城的翻墙软件,防火长城也在技术上做了应对措施以减弱翻墙软件的穿透能力。通常的做法是利用上文介绍的各种封锁技术以各种途径打击翻墙软件,最大限度限制翻墙软件的穿透和传播。

2015年1月,部分国外VPN服务在中国大陆无法正常使用,包括L2TP/IPSecPPTP协议。

防火长城在2016年就能利用TLS的旁路泄露观察数据包特征识别TLS代理,研究人员利用随机填充修改请求和握手中间发送的数据包大小,则可以正常浏览被审查的HTTP和HTTPS网站,关闭随机填充丢包问题则会立即再现。

自2021年11月初以来,防火长城部署了一种类似白名单的检测方法:应用规则来豁免那些不太可能是完全加密的流量;然后它阻止其余未被豁免的流量。由于翻墙软件的流量多是完全加密的,这种方法十分有效,仅会误伤大约0.6%的非翻墙互联网流量。

主动探测

自2011年10月以来,防火长城通过主动探测(Active probing)识别翻墙服务器,并随后将其封锁。其主要针对以下目标。

  • 任何加密连接,包括SSH和Tor,并不针对特定协议。这是最早出现的探测。每当中国用户尝试加密连接,防火长城发送“垃圾二进制(garbage binary)探针”,一系列伪随机数据,在建立加密连接前先访问目标计算机,其目的在于在用户建立加密连接前嗅探出他们所使用的反审查工具,任何从中国访问境外HTTPS 443端口的连接都会在几乎实时的情况下被刺探。
  • Tor。2011年10月起,防火长城的深度包检测设备已能识别Tor指纹。当中国的Tor客户端试图与境外Tor网桥建立连接,防火长城会在每15分钟周期(如15分钟后,30分钟后)内发送探针会尝试与Tor进行SSL协商和重协商,但目的不是建立Tor连接,每次探测持续3分钟。这种探测还会在春节等假期期间停止。而2015年的研究指出,防火长城已经可以实时主动探测Tor网桥,而不是每15分钟执行一次。被探测的网桥类型包括obfs2和obfs3等。
  • SoftEther VPN。2015年9月发现。起初使用固定的IP,如210.72.128.200,被屏蔽之后使用亚马逊EC2等云服务发起探测,模仿SoftEther的客户端握手去识别有效的SoftEther的IP。
  • AppSpot。2015年9月发现,目的是为了识别并封锁可用的Google的IP,干扰使用该服务翻墙的GoAgent。探测请求有相似的Host头和固定的用户代理

其他

针对TCP和UDP连接的封锁

2011年3月,防火长城曾经对Google部分服务器的IP地址实施自动封锁(按时间段)某些端口,按时段对www.google.com(用户登录所有Google服务时需此域名加密验证)和mail.google.com的几十个IP地址的443端口实施自动封锁,具体是每10或15分钟可以连通,接着断开,10或15分钟后再连通,再断开,如此循环,使中国大陆用户和Google主机之间的连接出现间歇性中断,使其各项加密服务出现问题。Google指责中国这样的封锁手法,因为Gmail并非被完全阻断,营造出Google服务“不稳定”的假象,表面看上去好像问题出自Google本身。

2014年5月27日起,Gmail网页版的80和443端口被封鎖。2014年12月26日起,Gmail客戶端所用的IMAP/SMTP/POP3端口也被封鎖。

防火长城也会通过限制QoS优先级的方式干扰向境外的UDP连接,如网站使用HTTP/3(QUIC)协议时。

间歇性封锁国际出口

2011年5月,中国大陆境内很多互联网公司以及高校、学院、科研单位的对外网络连接都出现问题,包括中国科学院。当时有分析指断网可能是因为防火长城已经具有了探测和分析大量加密流量并对用户IP地址执行封锁的能力,而各大机构的出口被封也在其中。具体表现为:当用户使用了破网(翻墙)软件后,其所在的公共网络IP地址会被临时封锁,所有的国际网站都无法访问,包括MSNiTunes Store等,而访问国内网站却正常,但如果使用境外的DNS解析域名则将会由于DNS服务器被封锁导致无法解析任何域名,国内网站也会无法打开。也有分析指,此举是中国当局在测试逐步切断大部分人访问国际网站的措施,以试探用户反应并最终达到推行网络「白名单」制,也就是凡没有在名单上的企业或团体其网络域名将不能解析,一般用户也无法访问。而中共党机关报《人民日报》旗下的《环球时报》英文版则引述方滨兴指,一些ISP必须为自己的用户支付国际流量费用,因此这些公司「有动机」去阻碍用户访问国外网站。一位不愿留名的工信部官员说,用户碰到这些情况应先检查自己和网站的技术问题。

中间人攻击

2013年1月26日,有中国大陆的用户在访问GitHub时发现证书无效,经检查发现,其的证书变为了一自签署的X.509证书,生成时间为2013年1月25日,有效期一年,故有人推测GitHub疑似遭到了中间人攻击GreatFire和研究人员认为攻击是由中国政府策划的。

自2014年8月28日起,原先可以通过IPv6直连Google的中国教育网(CERNET)内试图通过HTTPS连接*.google.com.*等网页时,可能收到TLS证书错误的提示,其中以连接www.google.com.hk几乎是每次连接均收到攻击,而其它连接例如ipv6.google.com和accounts.google.com也有受到攻击的报告,但攻击发生的機率相对较低。伪造的TLS证书显示其为google.com,颁发机构即为其本身,与真正的证书不同,顯示谷歌在中国教育网上受到中间人攻击。

2015年1月17日,Outlook遭到了中間人攻擊。19日,GreatFire撰文稱懷疑此攻擊是由網信辦發起的;22日,網信辦對此文作出了回應,稱「Greatfire.org是境外反华组织创办的反华网站」,「这一无端臆测,纯属境外反华势力的造谣和污蔑」。

电子邮件通讯的拦截

正常情况下,邮件服务器之间传输邮件或者数据不会进行加密,故防火长城能轻易过滤进出境内外的大部分邮件,当发现关键字后会通过伪造RST封包阻断连接。而因为这通常都发生在数据传输中间,所以会干扰到内容。也有網友根據防火长城會過濾進出境郵件的特性,尋找到防火长城部署的位置。

2007年7月,大量使用中国国内邮件服务商的用户与国外通信出现了退信、丢信等普遍现象。表现为:

  • 中国国内邮箱给国外域发信收到退信,退信提示Remote host said: 551 User not local; please try 或者Connected to *.*.*.* but connection died.(#4.4.2)
  • 中国国内邮箱用户给国外域发信,对方收到邮件时内容均为aaazzzaaazzzaaazzzaaazzzaaazzz
  • 国外域给中国国内邮箱发信时收到退信,退信提示Remote host said: 551 User not local; please try
  • 国外域给中国国内邮箱发信后,中国国内邮箱用户收到的邮件内容均为aaazzzaaazzzaaazzzaaazzzaaazzz

对此,新浪的解释是「近期互联网国际线路出口不稳定」;而万网客户服务中心的解释是「近期国内互联网国际出口存在未知的技术问题」。而网民普遍认为这与防火长城有关。

2014年12月26日,有很多中国大陆网民反映说一度无法通过客户端登录到Gmail。在此之前,国内一些用户可以通过IMAP、SMTP和POP3接收、下载邮件;据路透社报道谷歌旗下的Gmail业务已经被当局封锁。12月30日,Gmail的邮件服务器已在中国大陆境内恢复部分功能。但Gmail网页版至今仍被屏蔽。

参与建设

防火长城: 历史, 架构, 主要技术 
中国国家防火墙之父方滨兴
  • 思科系统和一些其他西方通信设备供应商向中华人民共和国政府提供了具有流量监控和过滤功能的互联网设备,用来封堵网站和追踪网上一些活跃的持不同政见者。2006年2月,美国国会为此召开听证会,向思科、微软、雅虎、Google四家公司提出质询。美国中国信息中心(China Information Center)的吳弘達指责,思科不断主动地与中国中央及各省国家安全部门联系,向其提供最新技术,包括警车间的即时通讯和指挥系统、以及声音识别技术和指纹鉴别技术。记者Sarah Lai Stirland在Wired News发表了一篇文章,并公布了一份泄漏的思科机密PPT文档。该文档详细描述了思科和中国政府在金盾工程上具有商业性质的合作。她还在文章中指责,思科在市场营销中将这些技术明确划分为“镇压工具(A Tool of Repression)”。思科的辩护者声称,实际上,在中国大陆现行的内容过滤系统中,路由器只是作为底层执行设备对人为指定的目的地址进行屏蔽,这是任何一台商用路由器都必须提供的基本功能,思科并没有向中国政府提供特别开发和定制的互联网设备。
  • 奇虎360公司已经加入中国GFW防火长城计划,并早在在2005年的时候,奇虎360就已经特派两位高管齐向东、石晓虹加入研究搜索引擎安全管理系统,助力该项目的实行。奇虎360方面拒绝透露其在GFW防火长城计划中承担的任务与角色,但从目前获得的一份资料来看,该项目落实在北京三际无限网络科技有限公司,主要完成人里除了方滨兴在列,奇虎360的高管齐向东与石晓虹也名列其中。
  • 2012年,中国互联网专家毛向辉透露,方滨兴本人已经不再直接负责中国政府防火长城项目,其已经交给一家叫启明星辰的技术公司和一些管理成熟的团队。该公司也创立于1996年。

相关报道

2007年,人民网转载了题为「百度日本站被GFW屏蔽 疑与色情内容有关」的文章,是官方最早先提到此系统的报道之一。2011年2月17日有记者在中国外交部新闻发布会上问及互联网封锁等问题,发言人马朝旭的回答是:

中国政府...依法保障公民言论自由,包括网上言论自由。同时,中国对互联网依法进行管理,这符合国际惯例。我们...反对任何国家借口互联网自由等问题干涉中国内政。

次日,方滨兴在接受《环球时报》英文版采访时被问及防火长城是如何运作的,他拒绝回答,说这是机密(It's confidential)。

评价

防火长城对网络内容的审查是否限制和违反了言论自由,一直是受争议的话题,官方說辭也相當籠統。

2007年有报告认为,防火长城并非防火墙,而是一种圆形监狱,其审查即使能轻易绕过,也会促使人民自我审查

美国贸易代表办公室在2016年4月发布的有关贸易环境的年度报告中称,中国对互联网的审查过滤对外国企业是严重的贸易障碍。报告指出,中国对很多境外网站的屏蔽都很武断,有些和社会稳定或国家安全没有关系的网站也被屏蔽,比如美国一家家居装饰网站,其内容都毫不敏感,却是典型的、有可能被防火长城屏蔽的网站。对此,中国外交部发言人洪磊回应:“我们希望各国尊重其他国家自主选择的互联网发展道路、管理模式、公共政策以及参与国际互联网治理的权利”;《环球时报》为此发表社评,认为美国同样有大量贸易壁垒,并表示“网络防火墙”能够遏制西方意识形态渗透,帮助中国更加强大,其必将得到历史的正面评价。

北京大學斯坦福大學兩名經濟學家在2018年的研究发现,中國大學生對於獲取未經審查的政治敏感信息漠不關心。他们认为,审查制度十分有效,不仅敏感信息难以获取,民众逐渐也不要求获取它们。

2021年11月,网信办发布的《网络数据安全管理条例(征求意见稿)》写道:数据跨境安全网关是指“阻断访问境外反动网站和有害信息、防止来自境外的网络攻击、管控跨境网络数据传输、防范侦查打击跨境网络犯罪的重要安全基础设施”。

影响

相关事件

参见

注释

参考来源

外部链接

Tags:

防火长城 历史防火长城 架构防火长城 主要技术防火长城 参与建设防火长城 相关报道防火长城 评价防火长城 影响防火长城 相关事件防火长城 参见防火长城 注释防火长城 参考来源防火长城 外部链接防火长城中华人民共和国政府中国国家互联网信息办公室中国网络审查国家计算机网络与信息安全管理中心国际互联网

🔥 Trending searches on Wiki 中文:

許美靜北大西洋公约组织青春18×2 通往有你的旅程MAMAMOO填詞L泰勒·斯威夫特馬英九帝國浩劫:美國內戰神舟十七号赵长鹏大白鲨3林志玲邊佑錫安德海織田信長鄂靖文ChatGPT世越号沉没事故二條城2024年世界司諾克錦標賽徐熙娣篡位 (電視劇)楚乔传里氏地震規模周杰倫提摩西·夏勒梅我的女兒㥠榮陳卓賢郭富城賴清德祝紫嫣哈尔滨一九四四太平天国052D型导弹驱逐舰GIVEN 被贈與的未來傅晓田司法院大法官鈴芽之旅幕府將軍 (2024年電視劇)月光下的異世界之旅角色列表Z-Library王洪文印度尼西亚无用的谎言香港中国大陆电视剧列表 (2024年)江西省對習近平的負面稱呼Sex141謝坤達Angelababy李敏鎬打天下2科怀·伦纳德蒙古国不夠善良的我們幕府將軍 (電視劇)周杰倫演唱會列表狐妖小红娘九龍寨城色,戒 (電影)車銀優1951年縱谷地震系列四海 (电影)唐山大地震徐譽庭尼高拉斯·積遜ONE PIECE角色列表知否?知否?应是绿肥红瘦杨幂林俊杰笑看風雲Re:MonsterANTI HERO郭東延鄭乃馨光荣之路 (2006年电影)🡆 More