热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ApacheHTTPServer映射URL到文件系统

本文解释了ApacheHTTPServer如何应用请求的URL来决定获取文档的文件系统位置。DocumentRoot对于决定向一个请求响应什么内容,httpd的默认行为是取得请求的

本文解释了Apache HTTP Server如何应用请求的URL来决定获取文档的文件系统位置。

DocumentRoot

对于决定向一个请求响应什么内容,httpd的默认行为是取得请求的URL-Path(主机名和端口号后面的URL路径),然后把它加在配置文件中指定的DocumentRoot后面。因此,在DocumentRoot下面的文件和目录构成了web基本的文档树。

例如,如果DocumentRoot被设置为/var/www/html,那么请求 http://www.example.com/fish/guppies.html 将会获得/var/www/html/fish/guppies.html作为客户端响应。

如果请求的是一个目录(也就是 path以/结尾), 那么响应的文件是由 DirectoryIndex 指令指定的。例如如果DocumentRoot按照上面的设置,然后设置

 DirectoryIndex index.html index.php

如果这些文件不存在,那么如果mod_autoindex模块被加载并且配置允许的话,就会尝试提供一个目录索引。

httpd还具有Virtual Hosting的能力,Virtual Hosting可以让httpd能够接受多个主机的请求。在这种情况下,可以为每一个虚拟主机指定一个DocumentRoot,mod_vhost_alias 模块提供的目录可以被用来根据请求的IP地址或者主机名动态决定提供文件的合适位置。

DocumentRoot指令可以被设置在主配置文件中(httpd.conf),但是更有可能的是,为每一个虚拟主机指定一个 DocumentRoot。

DocumentRoot之外的文件

经常会有这样的情况:我们需要web来访问DocumentRoot之外的文件。httpd提供了几种方式来实现这个需求。在Unix系统中,软连接(symbolic links)可以用来将其他位置的文件放到DocumentRoot之内。 为了安全考虑,httpd只有在相关目录的Options设置中包含有FollowSymLinks 或者SymLinksIfOwnerMatch时才会允许访问软连接。

或者我们可以使用Alias指令来将文件系统中的任意位置映射到web空间中。 例如,设置

Alias "/docs" "/var/web"

那么请求http://www.example.com/docs/dir/file.html将会被响应 /var/web/dir/file.html。 ScriptAlias 指令能够起到同样的效果,只不过请求访问的到目标文件会被作为CGI脚本看待。

对于需要更大灵活性的情况,我们可以使用AliasMatch 和ScriptAliasMatch 指令来指定基于匹配和替换的强大的正则表达式。例如:

ScriptAliasMatch "^/~([a-zA-Z0-9]+)/cgi-bin/(.+)" "/home/$1/cgi-bin/$2"

将会将请求 http://example.com/~user/cgi-bin/script.cgi 映射到文件系统中的 /home/user/cgi-bin/script.cgi, 并把这个映射到的目标文件作为CGI脚本看待。

用户目录(user-dir)

在传统的Unix系统中,一个特定的用户的家目录可以使用~user/来访问。mod_userdir 模块将这个用法扩展到了web中来: 我们可以使用下面的这样的URL来访问位于每个用户家目录中的文件。

http://www.example.com/~user/file.html

基于安全考虑,从web中直接访问用户的家目录是不合适的。因此, UserDir指令可以指定一个位于用户家目录下面的目录,用来存放web文件。UserDir的默认值为public_html, 所以上面的URL将被映射到/home/user/public_html/file.html。其中/home/user是在/etc/passwd中指定的用户家目录。

对于/etc/passwd中不存在用户家目录路径的系统,我们可以使用其他几种形式的UserDir。

有些人认为在URL中使用~符号(经常会被url转码为%7e)是不合适,他们更喜欢使用另外一个字符串来代表用户家目录。mod_userdir模块并不支持这个功能。但是,如果用户的家目录是按照一个有规律的方式组织的话,那么使用AliasMatch 指令是可能达到期待的效果的。例如,为了将 http://www.example.com/upages/user/file.html映射到/home/user/public_html/file.html,可以使用下面的AliasMatch指令:

AliasMatch "^/upages/([a-zA-Z0-9]+)(/(.*))?$" "/home/$1/public_html/$3"

URL重定向

上面讨论的配置指令用来让httpd从文件系统中的特定位置获得文件来响应客户端。 但是有时,我们期待能够告诉客户端请求的内容位于另一个URL中,从而使得客户端可以发送一个新的对于这个URL的请求。这种机制被称为 重定向(redirection), 可以使用Redirect 指令来实现。例如,如果DocumentRoot下的/foo/目录中的内容全部移到了另一个目录/bar/下面,你可以指示客户端重新发送一个请求来获取新目录下面的文件。

Redirect permanent "/foo/" "http://www.example.com/bar/"

上面的配置将会将以/foo/开头的URL-Path重定向到www.example.com下面的将/foo/替换为/bar/的相同路径上,例如 http://www.yousite.com/foo/fish/guppies.html 将会被重定向到 http://www.example.com/bar/fish/guppies.html。 就像上面的例子那样,我们可以将客户端重定向到任意的server,并不局限于原始的server。

httpd同样提供了RedirectMatch指令来应对更加复杂的重定向问题。例如,为了将站点的首页重定向到另一个站点,但是其他的访问并不重定向,可以使用下面的配置:

RedirectMatch permanent "^/$" "http://www.example.com/startpage.html"

或者,可以像下面这样将一个站点的所有页面全部重定向到另一个站点中:

RedirectMatch temp ".*" "http://othersite.example.com/startpage.html"

注释1: 上面两个配置中的 permanent 和 temp将会作用到客户端收到的重定向响应(301)的头信息中。

注释2: 下面将会讲到httpd的反向代理,在此我们首先需要明确重定向最重要的特性是: 服务端会主动让客户端接受到301 重定向响应,然后让客户端重新发起一个新的请求,也就是说客户端对于这个过程是了解的。而反向代理则正好相反,服务端会尽量将真实的资源来源(被代理服务器)隐藏起来,而让客户端感觉就像这些资源真的就来自于代理服务器一样。

反向代理(Reverse Proxy)

httpd同样允许我们将远程站点的文档放到本地站点的URL空间中。这种技术叫做反向代理(reverse proxying)。这是因为web服务器会像代理服务器那样从远程服务器中抓取文档并将它们响应到客户端。 但是它与普通代理(normal(forward) proxy)不同的是,反向代理会让这些远程文档看起来就像是来源自反向代理服务器自身中一样,换句话说也就是隐藏了这些文档的真实来源。

在下面的例子中,当客户端请求位于/foo/目录下面的文档时, 反向代理服务器会从internal.example.com的/bar/目录下面抓取文档并返回给客户端,对客户端来讲,这些文档就像是来自反向代理服务器一样。

ProxyPass "/foo/" "http://internal.example.com/bar/"
ProxyPassReverse "/foo/" "http://internal.example.com/bar/"
ProxyPassReverseCOOKIEDomain internal.example.com public.example.com
ProxyPassReverseCOOKIEPath "/foo/" "/bar/"

ProxyPass指令会让反向代理服务器去远程站点抓取文档(注释:实际上仅仅配置这个指令就可以达到最基本的代理)。
ProxyPassReverse 指令会让httpd调整在Location, Content-Location和URI 头信息中的URL,也就是将被代理站点发出的响应中的这三个头信息中的URL内容替换为反向代理站点。
ProxyPassReverseCOOKIEDomain 调整set-COOKIE头信息中的domain内容。
ProxyPassReverseCOOKIEPath 调整set-COOKIE头信息中的path内容。

非常值得注意的是: 在被代理的文档中的链接并不会被重写。所以任何绝对路径的链接最终还是会请求到被代理服务中去。更多相关的内容可以参考mod_substitute.和mod_proxy_html

注释: 说说我对正向代理的理解,比如我们无法直接访问外网,需要通过代理服务器来访问,那么客户端实际上会先将请求发送给代理,然后代理可能会再去访问请求中的目标,并将真实目标的响应回传到客户端,也可能利用自身的缓存(cache)直接响应给客户端。 无论哪种方式,客户端并不会意识到代理的存在,它会认为我请求的是站点a,那么我得到的响应同样来自单点a。我们在浏览器中配置的网络代理其实就是正向代理。

 技术分享

Apache HTTP Server 映射URL到文件系统


推荐阅读
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 怎么在PHP项目中实现一个HTTP断点续传功能发布时间:2021-01-1916:26:06来源:亿速云阅读:96作者:Le ... [详细]
  • 本文介绍了如何使用PHP向系统日历中添加事件的方法,通过使用PHP技术可以实现自动添加事件的功能,从而实现全局通知系统和迅速记录工具的自动化。同时还提到了系统exchange自带的日历具有同步感的特点,以及使用web技术实现自动添加事件的优势。 ... [详细]
  • Monkey《大话移动——Android与iOS应用测试指南》的预购信息发布啦!
    Monkey《大话移动——Android与iOS应用测试指南》的预购信息已经发布,可以在京东和当当网进行预购。感谢几位大牛给出的书评,并呼吁大家的支持。明天京东的链接也将发布。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 本文介绍了通过ABAP开发往外网发邮件的需求,并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定,可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度:184字。 ... [详细]
  • 本文介绍了在mac环境下使用nginx配置nodejs代理服务器的步骤,包括安装nginx、创建目录和文件、配置代理的域名和日志记录等。 ... [详细]
  • Android开发实现的计时器功能示例
    本文分享了Android开发实现的计时器功能示例,包括效果图、布局和按钮的使用。通过使用Chronometer控件,可以实现计时器功能。该示例适用于Android平台,供开发者参考。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
author-avatar
猪猪情系qq
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有