热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Linux驱动开发并发控制

1.并发与竞态并发(Concurrency)是指多个单元同时、并行被执行,而并发执行单元对共享资源(硬件资源和软件上的全局变量,静态变量等)的访问很容易导致竞态(Ra
1.并发与竞态

 并发(Concurrency)是指多个单元同时、并行被执行,而并发执行单元对共享资源(硬件资源和软件上的全局变量,静态变量等)的访问很容易导致竞态(Race Conditions)

概念:Linux驱动之并发与竞态

竞争状态的分类:

对称多处理器(SMP)的多个CPUSMP是一种紧耦合、共享存储的系统类型,因为多个CPU同时共享系统总线,因此可以访问共同的外设和存储器
单CPU内进程与抢占它的进程linux2.6以后支持内核抢占调度,一个进程在内核执行的时候可能耗完了自己的时间片,也可能被另一个高优先级进程打断,进程和抢占它的进程访问共享资源,竞态发生
中断(硬中断、软中断、Tasklet、底半部)与进程之间中断打断进程,中断打断中断(中断程序访问进程或另一个中断正在访问的资源,则竞态发生)

PS:中断下半部机制 - 软中断及tasklet

竞态的解决方法是:

保证对共享资源的互斥访问(即一个执行单元在访问共享资源时,其他的执行单元被禁止访问)访问共享资源的代码区域被称为临界区(critical sections),临界区需要被以某种互斥机制加以保护。
Linux常见互斥机制:中断屏蔽、原子操作、自旋锁和信号量、互斥体

2.编译乱序和执行乱序

程序在运行时内存实际的访问顺序和程序代码编写的访问顺序不一定一致,这就是内存乱序访问。内存乱序访问行为出现的理由是为了提升程序运行时的性能。内存乱序访问主要发生在两个阶段:

  1. 编译时,编译器优化导致内存乱序访问(指令重排)
  2. 运行时,多 CPU 间交互引起内存乱序访问

防止编译乱序:

未加屏障加编译屏障

// test.cpp

int x, y, r;

void f()

{

x = r;

y = 1;

}

 

int x, y, r;

void f()

{

x = r;

__asm__ __volatile__("" ::: "memory");

y = 1;

}

  1. g++ -S test.cpp    没有乱序
  2. g++ -O2 -S test.cpp  使用优化选项变异,乱序(y内存访问在x之前了)
编译后,对于x的内存访问必定在y赋值之前

执行乱序:(主要表现在多CPU上)

如果是单核CPU,执行程序时碰到依赖点(如f=1;while(f==0);//会等待f=1执行完,再执行while),会等待,因此程序员感受不到乱序;

但是,这个依赖点等待对于其他核是不可见的,例如:

CPU0:

while(f==0);//wait
printf(x);

CPU1:

x=42;
f=1;

  1. 在CPU0中,x的打印依赖于while循环的结束,但是CPU1并不知道这一依赖;
  2. 因此在CPU1中对于x,f的赋值是乱序的(先赋值x或者先赋值f都是有可能的);
  3. 所以CPU0打印的x信息并不一定是42!

执行乱序的解决方法:

DMB DSB ISB 简介

概括的讲:ISB>DSB>DMB

屏障指令功能应用解释
DMB(Data memory barrier)数据内存屏障:DMB可以继续执行之后的指令,只要这条指令不是内存访问指令;

core0:write A;DMB;write B

core1:Load B;Load A

写入A完成后才能写入B,因此加载B的值正确是,A的值也必然正确
DSB(Data Synchronization Barrier)数据同步指令:等待DSB之前的所有指令完成(包括指令前的所有缓存,跳转预测,TLB维护操作)  
ISB(Instruction Synchronization Barrier)指令同步屏障:Flush流水线,使指令之后执行的指令都是从缓存或内存中获得的  

3.原子操作

3.1原子操作原理

更详细的可以参考:Linux内核同步机制之(一):原子操作

要了解原子操作,首先需要了解LDREX,STREX指令,

首先我们看一下LDR和STR的含义:

  • LDR   ---   Load from memory into a register(从内存中加载数据,存到寄存器)
  • STR   ---   Store from a register into memory(寄存器中数据保存到内存里)

后缀EX其实是Exclusive(独占的);

LDREX和STREX总结:

  • LDREX将内存中的某个数据拷贝到寄存器中,并设置该内存地址为独占 ;
  • STREX试图将寄存器数据写回内存,即更新该值,若更新时检测到 该内存为独占,则更新成功,并去掉独占标志,否则更新失败,对一个寄存器写入1(下面例子中的result);
  • 通过这两个指令的配合,能检测代码段中该内存是否被并发访问过,如果被访问过 ,STREX就会失败!!!

之后我们可以来看原子操作的源代码:(以atomic_add()atomic_add_return()为例)

//保证原子操作的输入参数都是atomic结构体,因此可以对原子操作进行计数
typedef struct {int counter;
} atomic_t;

#if __LINUX_ARM_ARCH__ >= 6 ----------------------(1)
static inline void atomic_add(int i, atomic_t *v)
{unsigned long tmp;int result;
//prefetchw : 将counter的值读入内存中prefetchw(&v->counter); -------------------------(2)__asm__ __volatile__("@ atomic_add\n" ------------------(3)
"1: ldrex %0, [%3]\n" --------------------------(4)
" add %0, %0, %4\n" --------------------------(5)
" strex %1, %0, [%3]\n" -------------------------(6)
" teq %1, #0\n" -----------------------------(7)
" bne 1b": "=&r" (result), "=&r" (tmp), "+Qo" (v->counter) ---对应%0,%1,%2: "r" (&v->counter), "Ir" (i) -------------对应%3,%4: "cc");
}#else#ifdef CONFIG_SMP
#error SMP not supported on pre-ARMv6 CPUs
#endifstatic inline int atomic_add_return(int i, atomic_t *v)
{unsigned long flags;int val;raw_local_irq_save(flags);val = v->counter;v->counter = val += i;raw_local_irq_restore(flags);return val;
}
#define atomic_add(i, v) (void) atomic_add_return(i, v)#endif

最终要的是下面的代码的含义

 __asm__ __volatile__("@ atomic_add\n"                    //__asm_ _volatile()表示下面的汇编代码编译不要优化;@表示该行是注释           
"1:    ldrex    %0, [%3]\n"                                                //%3就是"r",%0就是"=&r",从内存中读(&v-counter),并存到另一个寄存器中
"    add    %0, %0, %4\n"                                                //%0寄存器记录的是v-counter的值,这里 的操作是寄存器值+1
"    strex    %1, %0, [%3]\n"                                   //将寄存器值写回内存中,即更新内存中v->counter值,如果成功%1寄存器值为0,否则为1
"    teq    %1, #0\n"                                                 //比较%1的值是不是0,若不是,跳回第一步重新执行
"    bne    1b"                                                      

备注:

%3就是input operand list中的"r" (&v->counter),r是限制符(constraint),用来告诉编译器gcc,去选择一个通用寄存器保存该操作数吧。%0对应output openrand list中的"=&r" (result),=表示该操作数是write only的,&表示该操作数是一个earlyclobber operand,具体是什么意思呢?编译器在处理嵌入式汇编的时候,倾向使用尽可能少的寄存器,如果output operand没有&修饰的话,汇编指令中的input和output操作数会使用同样一个寄存器。因此,&确保了%3和%0使用不同的寄存器。

(5)完成步骤(4)后,%0这个output操作数已经被赋值为atomic_t变量的old value,毫无疑问,这里的操作是要给old value加上i。这里%4对应"Ir" (i),这里“I”这个限制符对应ARM平台,表示这是一个有特定限制的立即数,该数必须是0~255之间的一个整数通过rotation的操作得到的一个32bit的立即数。这是和ARM的data-processing instructions如何解析立即数有关的。每个指令32个bit,其中12个bit被用来表示立即数,其中8个bit是真正的数据,4个bit用来表示如何rotation。更详细的内容请参考ARM ARM文档。

(6)这一步将修改后的new value保存在atomic_t变量中。是否能够正确的操作的状态标记保存在%1操作数中,也就是"=&r" (tmp)。

(7)检查memory update的操作是否正确完成,如果OK,皆大欢喜,如果发生了问题(有其他的内核路径插入),那么需要跳转到lable 1那里,从新进行一次read-modify-write的操作

原子操作源码总结:

ldrex(内存读数据到寄存器)---->atomic.counter操作(+,-,等)------>strex(尝试写数据到内存中)

但是:如果原子操作过程中,如果发生过并发的访问,那么strex会执行失败 ,跳回ldrex重新执行 !!!!

3.2 整型原子操作和位原子操作

整型原子操作:

Function NameExplain
void atomic_set(atomic *v,int i)设置原子变量v->counter为1
atomic v=ATOMIC_INIT(0)定义原子变量v,并初始化v->counter为0
atomic_read(atomic *v)返回原子变量的值
void atomic_add(int i,atomic *v)原子变量值加i
void atomic_sub(int i,atomic *v) 原子变量值减i
void atomic_inc(atomic *v)原子变量值自增
void atomic_dec(atomic *v)原子变量值自减

int atomic_inc_and_test(atomic *v)

int atomic_dec_and_test(atomic *v)

int atomic_sub_and_test(int i,atomic *v)

操作(自增,自减,减)并返回,测试操作是否为0;

为0返回true

否则返回false

void atomic_add_return(int i,atomic *v)

void atomic_sub_return(int i,atomic *v)

void atomic_inc_return(int i,atomic *v)

void atomic_dec_return(int i,atomic *v)

操作并返回新的值;

先返回测试值,再操作!!!!!

位原子操作:

void set_bit(nr,void *addr)设置addr地址的第nr位(该位写1)
void clear_bit(nr,void *addr)清除addr地址的第nr位(该位写0)
void change_bit(nr,void *addr)

addr地址的第nr位取反

test_bit(nr,void *addr)测试addr地址的第nr位,返回值

int test_and_set_bit(nr,void *addr)

int test_and_clear_bit(nr,void *addr)

int test_and_change_bit(nr,void *addr)

测试并操作位,返回测试值

3.3.例子:使用原子变量使设备只能被一个进程打开

static atomic_t xxx_available=ATOMIC_INIT(1); //定义原子变量xxx_available,初值为1
static int xxx_open(struct inode *inode,struct file *filep)
{
....if(!atomic_dec_and_test(&xxx_available)){atomic_inc(&xxx_available);return -EBUSY; //已经打开}
....return 0;
}
static int xxx_release(struct inode *inode,struct file *filep)
{atomic_inc(&xxx_available); //释放设备return 0;
}

假设设备未打开,则xxx_available=1;

打开设备,执行xxx_open,执行atomic_dec_and_test(),先返回值1,再执行xxx_avaiable--;此时xxx_available=0,设备打开;

另一个进程也想打开设备(二次打开),执行xxx_open,执行atomic_dec_and_test(),因为设备已经打开,返回xxx_available值0,在让xxx_available=-1,if条件满足,执行xxx_available++,返回EBUSY;

释放设备,xxx_available=0+1;

4.自旋锁

 

 

 

 

 

 

 

 

 

 

 


推荐阅读
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境,其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时,子进程只是完全复制父进程的资源,这样得到的子进程独立于父进程,具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制,另外通过fork创建子进程系统开销很大。因此,在某些情况下,使用clone或pthread_create创建线程可能更加高效。 ... [详细]
  • 本文讨论了在openwrt-17.01版本中,mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下,而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等,生成后的mac地址会保存在/etc/config/network下。 ... [详细]
  • 本文介绍了深入浅出Linux设备驱动编程的重要性,以及两种加载和删除Linux内核模块的方法。通过一个内核模块的例子,展示了模块的编译和加载过程,并讨论了模块对内核大小的控制。深入理解Linux设备驱动编程对于开发者来说非常重要。 ... [详细]
  • 本文介绍了在CentOS上安装Python2.7.2的详细步骤,包括下载、解压、编译和安装等操作。同时提供了一些注意事项,以及测试安装是否成功的方法。 ... [详细]
  • Java太阳系小游戏分析和源码详解
    本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践,作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构,包括工具类、常量、图片加载、面板等。通过这个小游戏的制作,读者可以巩固和应用所学的知识,如类的继承、方法的重载与重写、多态和封装等。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • eclipse学习(第三章:ssh中的Hibernate)——11.Hibernate的缓存(2级缓存,get和load)
    本文介绍了eclipse学习中的第三章内容,主要讲解了ssh中的Hibernate的缓存,包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]
  • 本文探讨了C语言中指针的应用与价值,指针在C语言中具有灵活性和可变性,通过指针可以操作系统内存和控制外部I/O端口。文章介绍了指针变量和指针的指向变量的含义和用法,以及判断变量数据类型和指向变量或成员变量的类型的方法。还讨论了指针访问数组元素和下标法数组元素的等价关系,以及指针作为函数参数可以改变主调函数变量的值的特点。此外,文章还提到了指针在动态存储分配、链表创建和相关操作中的应用,以及类成员指针与外部变量的区分方法。通过本文的阐述,读者可以更好地理解和应用C语言中的指针。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 本文介绍了将mysql从5.6.15升级到5.7.15的详细步骤,包括关闭访问、备份旧库、备份权限、配置文件备份、关闭旧数据库、安装二进制、替换配置文件以及启动新数据库等操作。 ... [详细]
author-avatar
杰ZGJ8513
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有