扶凯

取势 明道 优术

HTTP学习笔记 3,874 views

作者为 扶 凯 发表

HTTP简介
  web浏览器和服务器之类的交互过程必须遵守的协议.他是tcp/ip中的一个应用协议.用来协议数据交换过程和数据本身的格式.主要的有HTTP/1.0和HTTP1.1.

HTTP1.0的会话方式

在1.0时的会话方式

  1. 建立连接
  2. 发出请求信息
  3. 回送响应信息
  4. 关掉连接


小结: 浏览器和 web 服务器连接很短,每次连接只处理一个请求和响应.对每一个页的请求,浏览器与 web 服务器都要建立一次单独的连接.浏览器没有关掉前,连接就断开了.浏览器和服务器之间的通信是完全独立分开的请求和响应对.因为这样没法断点浏览器是否断开,没法做连接状态控制.建立和关掉连接会很占用连接时间.

问题:如果一个网页中有多个元素会怎么样(比如有多个图.)
请求,然后得到网页的内容,然后在解析,解析后发现网页中有多个元素.就在次向服务器发送多次请求.
在一个网页中, 在 http 头中的 Connection 中有多少个 close 的头,就相当有多少个 http 的连接.

HTTP1.1 和 HTTP1.0 的主要分别
在同一个tcp的连接中可以传送多个HTTP请求和响应.
多个请求和响应可以重叠,多个请求和响应可以同时进行.
更加多的请求头和响应头(比如HTTP1.0没有host的字段).

总结:  在 HTTP/1.0 中,大多实现为每个请求/响应交换使用新的连接.在 HTTP/1.1 中,一个连接可用于一次或多次请求/响应交换,尽管连接可能由于各种原因被关闭.这是他们之间最大的分别.

HTTP1.0的格式
request(HTTP请求消息)
结构:一个请求行.部分消息头,以及实体内容,其中的一些消息内容都是可选择的.消息头和实体内容之间要用空行分开.
 

GET /index.html HTTP/1.1  # 请求头,下面都是消息头.
Accept: */*
Accept-Languang:en-us
Connection:keep-alive
Host:localhost
Referer:HTTP://localhost/index.html
User-Agent:Mozilla/4.0
Accept-Encoding:gzip,deflate # 到上面都是消息头,下面一个空行表示完了,接下来是实体内容.


Response响应消息头

在接收并解析请求消息后,服务器以 HTTP 响应消息响应.相当服务器对客户的http的回应
结构:一个状态行.部分消息

头,以及实体内容,其中的一些消息内容都是可选择的.消息头和实体内容之间要用空行分开.
 

HTTP/1.1 200 ok           # 状态行.下面为消息头
Server:Apache2.2
Date:Thu, 13 Jul 2008 16:29:46 GMT
Content-Length:2222
Content-Type:text/html
Cache_control:private # 和请求消息头一样下面有一个空行

注意:使用get的方法的请求消息中是不能包含实体内容的,只有使用post,put和delete的方法请求消息中才能有实体内容.对HTTP1.1来讲,如果HTTP中有实体内容,但没有使用权chunked传输编码.那么消息头部分必须包含内容长度字段.不然不知什么时候内容才结束.HTTP1.1中一定要有host字段

以上消息头的结构:每个消息头都包含一个头字段名称,然后依次是冒号,空格值,回车和换行符,字段不区分大小写.对消息头中的消息头可以任何顺序排列.
消息头可以分为信息头,请求头,响应头,实体头四类
如果有多个选项,可以用逗号分隔Accept-Encoding:gzip ,deflate

请求行和状态行.
请求行格式: 请求方式 资源路径 HTTP版本号<CRLF>
例:

GET /test.html HTTP/1.1

请求方式有:POST,HEAD,OPTIONS,DELETE,TRACE,PUT

状态行格式:
      HTTP版本号 状态码 原因<CRLF>
例: HTTP/1.1     200     OK

使用telnet来测试.

$ telnet www.php-oa.com 80
Trying 211.103.156.124...
Connected to www.php-oa.com.
Escape character is '^]'.
GET /index.php HTTP/1.1
HOST: www.php-oa.com

HTTP/1.1 301 Moved Permanently
Server: nginx
Date: Wed, 08 May 2009 03:25:26 GMT
Content-Type: text/html; charset=UTF-8
Transfer-Encoding: chunked
Connection: keep-alive
X-Powered-By: PHP/5.1.17
X-Pingback: http://www.php-oa.com/xmlrpc.php
Location: http://www.php-oa.com/

正常响应 200 ,我这个指定的路径是 / 所以源服务器做了重定向,所以改变了连接。

GET和POST方式传递参数时各自的清况
HTTP://www.php-oa.com/wp?a=b&c=b
GET时

GET /wp?a=b&c=b HTTP/1.1

注:因为url长度控制,所以不能长过1024
POST时

POST / HTTP/1.1
host: www.php-oa.com
Content-Type:application/x-www-form-urlencoded
Content-Length:28

wp?a=b&c=b  # 实体正文中

注:post因为在实体内容中间,可以任意大小.

通用信息头
通用信息头可以用于请求消息,也可以用于响应消息,包括一些写被传输的实体内容没有关系的一些消息头字段.
Cache-Control: no-cache (*) //是否缓存当前的消息
Connection: close     //用于指定处理完本次请求后是否保持连接. 如果为close时就处理完响应就断开连接(HTTP1.1默认是打开持久连接.如果没有close就默认是连接的.)
Date:Tue, 11 Jul 2000 18:23:51 GMT
Pragma:no-cache     //HTTP1.0中指定不要缓存的HTTP头.
Trailer:Date           //指于在实体信息后面可以出现那些头字段
Transfer_Encoding:chunked    //传输的编码方式.给HTTP内容分段传送.chunked是指每个分段开始都有一个16进制的长度.后后一个分段必须为零的分段.
Upgrade:HTTP/2.0 ,sHTTP/1.3  //希望使用什么协议来通知.
Via:HTTP/1.1 Proxy1,Http/1.1 Proxy2 //代理服务器的信息,如果经过多个,就会在vai中加后面依次加入多个.

注:Content-Length和Transfer_Encoding分别什么时候用,如果程序在缓冲中知道内容长度就使用Content-Length,如果缓冲区一次不能缓冲,那就只能使用Transfer_Encoding,然后分段传输.

常用请求头:
主要是用在客户端向服务器传递附加和信息,比如支持的数据类型,压缩方法,语言
Accept:text/html,image/*           //支持的文件格式
Accept-Charset:ISO-8859-1,unicode-1-1  //支持的字符集
Accept-Encoding:gzip,compress  //支持的编码方式
Accept-language:en-gb,zh-cn   //支持的语言
Authorization:Basic asdfsadfsafdaenh4  //加密认证方法
Host: www.php-oa.com:80    //指定客户端打开的主机名和端口号
if-Match:"aaa","bbb"          //实体标签.用来查看是否是和当前的信息一样.
if-Modified-Since: Tue, 11 Jul 2008 18:03:00 GMT  //上次缓存的网页缓存时间
if-None-Match:"aaa","bbb"    //和if-match相反
if-Range: Tue, 11 Jul 2008 18:03:00 GMT   //只能和Range一起使用.
if_Unmodified-Since:Tue,11 Jul 2008 18:03:00 GMT 和if-Modified-Sinc相反.
Max-Forwards: 1   //通过代理服务器的数量,象ttl值.
Proxy-authorization:  //代理时的方法
Range:bytes=100-599  //断点续传时使用的HTTP头
Referer:HTTP://www.php-oa.com/index.php  //上一跳来源的网站
TE:trailers.deflate  //说明客户除了chunked还能使用什么方法
User-Agent:Mozilla/40(compatible;MSIE5.5;Windows NT 5.0) //浏览器信息

实体头
主要用做实体内容的元信息,表示实体内容的属性,包括实体信息类型,长度,压缩方法.最后一次修改时间,数据有效期等.

Allow :GET.POST
Content-Encoding:gzip
Content-Language:zh-cn
Content-Length:800                   //大小
Content-Location:HTTP://www.php-oa.com/index.html   //重定向到
Content-MD5: ABDEDFDEFERDFEFE==           //指出md5,可以算出内容是否被改变过
Content-Range:bytes 2543-4532/7878        //断点续传时用.
Content-Type:text/html;charset=GB2312     //指定文件类型,和字符集
Expires: Tue, 28 Jul 2008 16:49:49          //过期时间
Last-Modified:Tue 11 Jul 2008 16:49:4      //最后更新时间

扩展头
在HTTP1.1中没有定义的字段.比如下面的这些.
Cookie
Set-Cookie
Refersh: 1; url=HTTP://www.php-oa.com
Content-Disposition
Content-Type:application/octet-stream
Content-Disposition:attachment;filename=aaa.zip //filename为文件保存的名字

 

来了就留个评论吧! 6个评论



    xi2008wang 2008年10月30日 的 01:03

    好文!

    岩前热线 2008年12月26日 的 20:42

    很多经典的文章哦

    1314it 2009年06月17日 的 15:26

    好文章 !