作为中央核心处理单元的CPU,除了生产工艺的不断革新进步外,在处理数据和响应速度方面也需要有权衡。稍有微机原理基础的人都知道Intel X86体系的CPU提供了四种特权模式ring0~ring3,其中ring0特权最高,ring3的特权最低,之所以要做这样的区分一个主要目的是保护资源,通俗来讲要保护的资源无非就是“内存、I/O端口以及执行特殊机器指令的能力”。任何一个时刻,x86 CPU都是在一定的特权模式下运行。同样,对于ARM体系的CPU 一共有七种运行模式,分别是:用户模式(usr)、快速中断模式(fiq)、中断模式(irq)、管理模式(svc)、系统模式(sys)、数据访问终止模式(abt)和未定义指令终止模式(und)。除了用户模式外,其他6中工作模式都属于特权模式,而特权模式中除了系统模式外,其他5种模式又称为异常模式。
那么底层硬件CPU的这种特性,跟我们将要讨论的用户模式和内核模式又有什么关系呢?让我们正本溯源来端正一下对操作系统的认识。每位教操作系统课程的老师都会告诉大家:所谓的操作系统呢,就是对硬件资源进行统一管理的系统,并向用户提供业务接口的软件系统。通俗来讲,【操作系统就是要能管理你的CPU和内存,驱动你的硬盘,管理你的网卡和显示器,然后当你点击鼠标和敲击键盘时能做出正确的响应。】够通俗了吧。
那么问题就来了,以CPU为例,如果你是一个操作系统的设计者,你会如何处理不同CPU体系架构的差异性(如Intel、ARM,抑或AMD、MIPS等)?当然这个问题不是一般人能hold得了的,CU论坛里开发都江堰操作系统那位大牛前辈确实值得让吾辈佩服和敬仰。继续我们的话题,也就是说不同的操作系统在处理CPU体系架构的差异化方面是不相同的,有些操作系统,就提供了用户模式和内核模式这种机制 (例如linux),而有些操作系统呢,又没有用户态和内核态之分(例如vxWorks)。后者不在我们的讨论范围,感兴趣的童鞋可以自己去google一下。
以Linux系统和Intel x86的CPU为例,Linux使用了ring0模式来运行内核态的代码,ring3来运行用户态的代码,ring1和ring2没有使用。32为操作系统可寻址范围是0~4GB,为此Linux系统将其分为了用户空间和内核空间两部分:
其中用户空间占低位的3GB空间,范围从虚拟地址的0x00000000到0xBFFFFFFFF,内核空间占用了高位的1GB空间,虚拟地址范围从0xC0000000到0xFFFFFFFF。
内核空间里存放的是整个内核代码和所有内核模块,以及内核所维护的数据。当用户运行一个程序时,该程序所创建的进程一开始是运行在用户空间的,当它要执行网络发送数据等动作时,必须通过调用write、send等系统函数来完成,这些系统调用会去调用内核中的代码来完成用户的请求操作,这时CPU必须从ring3切换到ring0,然后进入内核地址空间去执行这些代码完成操作,完成后又切换回ring3,回到用户态。
所以,我们可以看到,提供了用户模式和内核模式的操作系统,用户态的程序就不能随意操作内核地址空间里的数据,具有一定的安全保护作用;于此同时,在实时性方面稍微有所牺牲。也要就是说,只要内核代码没有问题,用户空间程序的错误和BUG一般来说不会导致系统崩溃,提高了系统的健壮性。
这么看来,内核确实比较“拽”,而Linux也提供了一些用户空间和内核空间通讯的机制,使我们可以开发出更高效的程序。但一定要记住,内核中一点小小的错误都是会导致整个系统崩溃,所以开发内核程序时一定要非常小心谨慎。