TOC

I/O模型

    当一个正在运行的进程或线程,如果它碰到了I/O,就会阻塞,因为大多数情况下I/O都是比较慢的,它与CPU来讲速度差得太多了,在一个CPU时间片内,一定是访问不完I/O的,因为CPU的时间片是非常非常短的,在这种情况下CPU也不可能等待,所以这个时候进程或者线程就会进入阻塞状态,进入阻塞态之后CPU就解放了,可以去执行其他的任务了,那么进入阻塞态之后,在数据未准备完之前,CPU是不会调度的;
    前面也说过,要向访问磁盘文件,或者访问网络,这个时候就必须借助内核提供的系统调用才能完成,那么这样I/O就可以分为两个阶段,以读取recv为例,第一阶段就是将磁盘中的文件读取到内核缓冲区,第二个阶段,将数据从内核空间缓冲区,拷贝到用户空间,如果是send也是一样的,也分为两个阶段,从用户空间到内核空间,从内核空间再到磁盘文件,或者从网络接口发送出去,那么由此,产生I/O的地方就主要有两次,第一次,内核从I/O设备上读取数据,这就是一个I/O的过程,第二次,进程从内核中复制数据;
    网络IO的本质是socket的读取,socket在linux系统被抽象为流,IO可以理解为对流的操作。刚才说了,对于一次IO访问(以read举例),数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。所以说,当一个read操作发生时,它会经历两个阶段;
# I/O两阶段
第一阶段:等待数据准备 (从磁盘文件读取到内核内存空间)。
第二阶段:将数据从内核拷贝到进程中 (从内核内存空间拷贝到用户空间对应进程的堆栈)

# 对于socket流而言
第一步:通常涉及等待网络上的数据分组到达,然后被复制到内核的某个缓冲区;
第二步:把数据从内核缓冲区复制到应用进程缓冲区;
    网络应用需要处理的无非就是两大类问题,网络IO,数据计算。相对于后者,网络IO的延迟,给应用带来的性能瓶颈大于后者。网络IO的模型大致分为两大类,如下;
# 同步I/O
同步I/O(synchronous IO)
阻塞IO(bloking IO)
非阻塞IO(non-blocking IO)
多路复用IO(multiplexing IO)
信号驱动式IO(signal-driven IO)
# 异步I/O
异步IO(asynchronous IO)

同步阻塞I/O(blocking I/O)

    同步阻塞IO模型是最常用的一个模型,也是最简单的模型。在linux中,默认情况下所有的socket都是blocking。它符合人们最常见的思考逻辑。阻塞就是进程"被"休息, CPU处理其它进程去了;
    在这个IO模型中,用户空间的应用程序执行一个系统调用(recvform),这会导致应用程序阻塞,什么也做不了,直到数据准备好,并且将数据从内核复制到用户进程,最后进程再处理数据,在等待数据到处理数据的两个阶段,整个进程都被阻塞。不能处理别的网络IO;
    一次I/O请求分两次I/O事务,第一次是等内核将数据准备好,第二次是在用户空间等数据准备好,从kernel space到user space的过程,这个所谓数据准备好,指的是kernel准备好,它从磁盘的驱动到磁盘上读取数据,将数据读取到内核当中,这是第一阶段,然后用户空间的这个进程从发起recvfrom函数开始一直到数据到自己用户空间的内存,整个过程进程全程阻塞,一直都在等数据准备好,进程做不了其他的任何事情,所以此类I/O为同步阻塞I/O;

    当用户进程调用了recv()/recvfrom()这个系统调用,kernel就开始了IO的第一个阶段,即准备数据(对于网络IO来说,很多时候数据在一开始还没有到达。比如,还没有收到一个完整的UDP包。这个时候kernel就要等待足够的数据到来)。这个过程需要等待,也就是说数据被拷贝到操作系统内核的缓冲区中是需要一个过程的。而在用户进程这边,整个进程会被阻塞(当然,是进程自己选择的阻塞,也可以不阻塞)。第二个阶段:当kernel一直等到数据准备好了,它就会将数据从kernel中拷贝到用户内存,然后kernel返回结果,用户进程才解除block的状态,重新运行起来;
  • 重点 : 所以,根据上述的描述来看,blocking IO的特点就是在IO执行的两个阶段都被block了;

同步非阻塞I/O(non-blocking I/O)

    同步非阻塞就是"每隔一会儿瞄一眼进度条"的轮询(polling)方式。在这种模型中,设备是以非阻塞的形式打开的。这意味着 IO 操作不会立即完成,read 操作可能会返回一个错误代码,说明这个命令不能立即满足(EAGAIN 或 EWOULDBLOCK)。在网络IO时候,非阻塞IO也会进行recvform系统调用,检查数据是否准备好,与阻塞IO不一样,"非阻塞将大的整片时间的阻塞分成N多的小的阻塞, 所以进程不断地有机会 '被' CPU光顾",即获得CPU时间片;
    也就是说非阻塞的recvform系统调用调用之后,进程并没有被阻塞,内核马上返回给进程,如果数据还没准备好,此时会返回一个error。进程在返回之后,可以干点别的事情,然后再发起recvform系统调用。重复上面的过程,循环往复的进行recvform系统调用。这个过程通常被称之为轮询。轮询检查内核数据,直到数据准备好,再拷贝数据到进程,进行数据处理。需要注意,拷贝数据整个过程,进程仍然是属于阻塞的状态;
    进程在等待I/O的过程中,会不断的去调用recvfrom,整个等待过程只做这recvfrom一件事,其他什么事都做不了,直到返回一个OK,才能进行下一步操作,所以这是一个同步I/O,同时它也阻塞,当数据到达内核空间之后,从内核空间将数据拷贝到用户空间这一阶段,这个时候recvfrom这个函数会阻塞,从内核空间拷贝到用户空间需要耗时多久,就需要等待多久;
    但是第一阶段是不会阻塞的,因为每次向内核发起一个recvfrom都会立即得到一个结果,那么为了和blocking I/O区分,就将其称之为non-blocking I/O;

    当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。从用户进程角度讲,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作。一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call,那么它马上就将数据拷贝到了用户内存,然后返回
  • 重点 : 所以,non-blocking IO的特点是用户进程需要不断的主动询问kernel数据好了没有;

I/O多路复用(IO multiplexing)

    由于同步非阻塞方式需要不断主动轮询,轮询占据了很大一部分过程,轮询会消耗大量的CPU时间,而 “后台” 可能有多个任务在同时进行,人们就想到了循环查询多个任务的完成状态,只要有任何一个任务完成,就去处理它。如果轮询不是进程的用户态,而是有人帮忙就好了。那么这就是所谓的"IO 多路复用";
    IO多路复用有两个特别的系统调用select、poll、epoll函数。select调用是内核级别的,select轮询相对非阻塞的轮询的区别在于,前者可以等待多个socket,能实现同时对多个IO端口进行监听,当其中任何一个socket的数据准好了,就能返回进行可读,然后进程再进行recvform系统调用,将数据由内核拷贝到用户进程,当然这个过程是阻塞的。select或poll调用之后,会阻塞进程,与blocking IO阻塞不同在于,此时的select不是等到socket数据全部到达再处理, 而是有了一部分数据就会调用用户进程来处理。如何知道有一部分数据到达了呢?监视的事情交给了内核,内核负责数据到达的处理。也可以理解为"非阻塞"吧。
    I/O复用模型会用到select、poll、epoll函数,这几个函数也会使进程阻塞,但是和阻塞I/O所不同的的,这两个函数可以同时阻塞多个I/O操作。而且可以同时对多个读操作,多个写操作的I/O函数进行监控,直到有数据可读或可写时(注意不是全部数据可读或可写),才真正调用I/O操作函数;
    I/O多路复用也称之为Event-driven I/O,它关注的是I/O的事件,即读和写的事件,也叫做基于事件的I/O,所谓I/O多路复用其实就是有一个中间层(这个中间层就是操作系统),这个中间层能同时监控多个I/O的读写事件,我们只需要告诉中间层我们需要监控那些I/O的读或写事件,然后操作系统就会对这些I/O进行监控,如果这些I/O事件产生,就会通知进程;
    I/O多路复用提高了处理I/O的能力,以前只能监控一路I/O,现在可以使用I/O多路复用来实现多路I/O的监控,那么通知进程的方式又有很多种,最早的技术SELECT技术,这个技术应用比较早,所以我们常见的操作系统都支持;
    SELECT是一种轮训的方式,轮训的去查看哪个I/O已经完成,一个一个I/O交由操作系统来轮训来检测是否已经完成,效率较为低下,后来又在SELECT这个技术之上演化出来了poll的通知方式,poll是I/O多路复用中比较常见的第二项技术,poll对SELECT进行了一定的升级,但是升级也是有限的,它依然没有解决SELECT中效率低下的问题,所以说,从本质上,他两实际上是差不多的,那么从Linux内核2.5开始,就引入了epoll的这种方案,它是poll的一种升级,这个增强它摆脱了很多的限制,比如文件描述符的限制,对性能也有很好的提高;

    epoll主要是通过回调的机制,来提高它的性能,其他平台,也陆陆续续有了自己技术,比如伯克利Unix上的BSD,比如Mac平台的kqueue,他们和epoll很相似Windows的iocp;

    IO multiplexing就是人们常说的select、poll、epoll,有些地方也称这种IO方式为event driven IO。select/poll/epoll的好处就在于单个process就可以同时处理多个网络连接的IO。它的基本原理就是select,poll,epoll这个function会不断的轮询所负责的所有socket,当某个socket有数据到达了,就通知用户进程;
    当用户进程调用了select系统调用函数,那么整个进程会被block,而同时,kernel会"监视"所有select负责的socket,当任何一个socket中的数据准备好了,select就会返回。这个时候用户进程再调用read操作,将数据从kernel拷贝到用户进程;
    多路复用的特点是通过一种机制一个进程能同时等待IO文件描述符,内核监视这些文件描述符(套接字描述符),其中的任意一个进入读就绪状态,select, poll,epoll函数就可以返回。对于监视的方式,又可以分为 select, poll, epoll三种方式,其中select和poll实际上是一个东西,只不过做了最简单的升级;
    上面的图和blocking IO的图其实并没有太大的不同,事实上,还更差一些。因为这里需要使用两个system call (select 和 recvfrom),而blocking IO只调用了一个system call (recvfrom)。但是,用select的优势在于它可以同时处理多个connection,所以,如果处理的连接数不是很高的话,使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server性能更好,可能延迟还更大,select/epoll的优势并不是对于单个连接能处理得更快,而是在于能处理更多的连接;
    在IO multiplexing Model中,实际中,对于每一个socket,一般都设置成为non-blocking,但是,如上图所示,整个用户的process其实是一直被block的。只不过process是被select这个函数block,而不是被socket IO给block。所以IO多路复用是阻塞在select,epoll这样的系统调用之上,而没有阻塞在真正的I/O系统调用如recvfrom之上;
select/poll
    那么对于I/O多路复用的select来讲,操作系统将磁盘数据复制到内核的内存空间之后,告知进程某一路I/O处理完成了,但是具体是哪一路I/O完成操作系统并没有告知,需要进程自己去遍历所有的I/O,效率低下,并且它还有一个文件描述符的限制,最大1024,所以SELECT现在使用得比较少,那么poll就是最其文件描述符数量改进了下,内部原理和select是一样的,一样存在性能问题;
epoll
    也正是因为select和poll模型存在的性能问题,所以就有了epoll模型,poll的升级版,对于epoll来讲,我们可以认为它增加了一种通知机制,或者说,回调机制,当数据准备好了之后,内核会直接告知用户空间的进程,哪一路I/O好了,这就是典型的回调机制,效率更高,并且它还突破了文件描述符的限制,内部的I/O句柄使用哈希表存储,性能更加强悍;

信号驱动I/O(signal driven IO)

    epoll明显优化了IO的执行效率,但在进程调用epoll_wait()时,仍然可能被阻塞。能不能酱紫:不用我老是去问你数据是否准备就绪,等我发出请求后,你数据准备好了通知我就行了,这就诞生了信号驱动IO模型;
    信号驱动IO不再用主动询问的方式去确认数据是否就绪,而是向内核发送一个信号(调用sigaction的时候建立一个SIGIO的信号),然后应用用户进程可以去做别的事,不用阻塞。当内核数据准备好后,再通过SIGIO信号通知应用进程,数据准备好后的可读状态。应用用户进程收到信号之后,立即调用recvfrom,去读取数据;

    信号驱动IO模型,在应用进程发出信号后,是立即返回的,不会阻塞进程。它已经有异步操作的感觉了。但是你细看上面的流程图,发现数据复制到应用缓冲的时候,应用进程还是阻塞的。回过头来看下,不管是BIO,还是NIO,还是信号驱动,在数据从内核复制到应用缓冲的时候,都是阻塞的;

异步I/O(Async IO)

    上述全部都是BIO,即同步I/O,在数据从内核复制到应用缓冲的时候,都是阻塞的,因此都不算是真正的异步。由此诞生了AIO,它实现了IO全流程的非阻塞,就是应用进程发出系统调用后,是立即返回的,但是立即返回的不是处理结果,而是表示提交成功类似的意思。等内核数据准备好,将数据拷贝到用户进程缓冲区,发送信号通知用户进程IO操作执行完毕;

    进程发起一个异步I/O的系统调用,就会立即返回一个中间结果,然后,第一阶段,从磁盘读取到内核缓冲区,这个过程包括第二阶段,从内核缓冲区到用户空间缓冲区,都是非阻塞的,也就是说,进程在这两个阶段,不会被阻塞,可以继续做其他的事情,这就是异步I/O,等数据好了,内核会直接调用回调函数,所以说,它的效率是极高的;

五大I/O对比

    可以看到下图,前四个都是同步I/O,因为核心操作recv/recvfrom调用时,进程会阻塞直到最终拿到结果为止,而异步I/O进程全程不阻塞,性能极高;

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注