局部变量的作用域

导航

<2009年2月>
25262728293031
1234567
891011121314
15161718192021
22232425262728
1234567

统计

公告

我的邮件:

留言簿(7)

随笔分类

随笔档案

文章档案

我的链接

搜索

最新评论

阅读排行榜

评论排行榜

锁?不锁?如何锁?

    加锁、解锁(同步/互斥)是多线程中非常基本的操作,但我却看到不少的代码对它们处理的很不好。简单说来有三类问题,一是加锁范围太大,虽然避免了逻辑错误,但锁了不该锁的东西,难免降低程序的效率;二是该锁的不锁,导致各种莫名其妙的错误;三是加锁方式不合适,该用临界区的用内核对象等,也会降低程序的效率。
    要正确的运用锁操作,首先要弄清楚什么时候需要加锁。很多书上都说在可能“同时发生多个写操作”或“同时发生读写操作”时,应该加锁。这固然没什么错,但我认为它没有说到问题的根上,更准确的表述应该是:如果不加锁会导致不可容忍的数据不一致,那么就应该加锁。据此,我在下表中列出了多线程中应该加锁和无需加锁的条件,其中的“简单数据类型”是指cpu可以在一条指令中完成操作的数据类型,一般整形和所有比整形小的数据类型都是,除此之外的类型都属于“复杂数据类型”,例如你自己定义的结构体等。
   操作的结果与初值无关  操作的结果与初值相关
 写简单数据类型  不需要加锁①  需要加锁②
 写复杂数据类型  需要加锁③  需要加锁④
 读简单数据类型  不需要加锁⑤  不需要加锁⑥
 读复杂数据类型  需要加锁⑦  需要加锁⑧
    大家可能注意到,在第1、5、6种情况下,我认为可以不加锁,粗看起来,这与书上的说法有些矛盾。其实却不然,因为这些操作可以在一条指令内完成,所以它们具有天然的“原子性”,我们可以认为cpu已经给它们加锁了,我们没必要再画蛇添足。如果这个理由还不够的话,你不妨想一下我们再加一次锁是否有用,看下面的代码(以第1种情况为例):

Lock(); // ①
n = 10; // ②
Unlock(); // ③
int x = n; // ④

看出来了吗?不管语句①③是否存在,这段代码执行完毕后,我们都无法保证x的值是10。也许你会想如果把③④两条语句的位置换一下,x就肯定是10了。可是在这个例子中,想让x是10,为什么不把语句④直接换成“int x = 10;”呢?既省了加锁,有减少了键盘的磨损,何乐而不为?!而且,我的这个例子并不是刻意构造的,在多线程,这种情况比比皆是。
    第2种情况的典型代表是“i++;”,需要对它加锁是因为它表面上虽然只有一条语句,却要执行至少两个操作,一是读出i的初始, 二是把加一后的结果写回去,两个操作就没有“原子性”了,所以需要加锁。
    另外,上表中判断是否需要加锁的依据是“是否可能造成数据不一致”。实际上,有些情况下数据不一致是可以容忍的,如果它发生概率极低、造成的不良后果可以忽略、并能很快自动恢复,那它可能就是可以容忍的。对这种数据不一致,我们可以不加锁。不过对它的判定与程序的实际情况关联太大,我们在这里就不讨论了。
    加锁的方法也可分为三类,临界区、内核对象和互锁函数。相比前两类,互锁函数的知名度要低不少,但它却是我用的最多的方法,因为它有一个最大的优点:快!有不少书上比较临界区和内核对象时都说临界区的优点是不会进入内核模式,速度快。不过这是不全面的,如果没有冲突(实际发生冲突的概率一般很低),临界区确实不会进内核模式,但如果发生了冲突要进行等待,它就要依靠内核对象了。而互锁函数则绝不会进内核模式,所以互锁函数是最快的(临界区在没有冲突时的行为是依靠互锁函数实现的)。互锁函数的缺点是只能处理相对简单的数据类型(不要和我前面说的“简单数据类型”等价起来),但另一方面,对加锁需求最高的也往往是这些类型的数据。
    实际开发中,还有一种锁比较常用,这就是单写多读锁,《windows核心编程》上有一个单写多读锁的实现,我的blog上有另一个实现。前者适用于需加锁的对象数量较少(例如如只有一个),访问冲突概率相对较高的情况。后者适用于需加锁的对象很多,访问冲突概率很低的情况(对象多了, 单个对象的访问冲突自然就少了)。两个实现的共同缺点是不支持重入,即同一个线程中,解锁前不能再次加锁。临界区在这方面有优势,它支持重入。使用TLS(线程局部存储)技术进行改进应该能让它们支持重入,不过这样做了以后我那个实现应该就算不上轻量级了:)。
    最后,还有其它的一些不用锁的方法也可以保证多线程中的数据一致性,其中最常用的就是循环。例如下面的例子:

struct bar
{
    volatile unsigned version;    // 一个额外的版本号字段
    int field1;
    char field2;
    char field3;
    ......
};
bar g_bar = { 0 };

// 写线程
++g_bar.version;    // 加1, version是奇数, 表示正在更新
g_bar.field1 = 10;
......
++g_bar.version;    // 再加1, version是偶数, 表示更新完毕

// 读线程
void ReadGlobalBar( bar* p )
{
    unsigned ver;
    do {
        ver = g_bar.version;
        if( ver % 2 != 0 )    // 正在更新
        {
            Sleep( 0 );    // 等待
            continue;
        }
        p->field1 = g_bar.field1;
        ......
    } while( ver != g_bar.version );

}

然而这种方法真的没用锁吗?看你怎么理解了,那个version字段其实就可以看做是锁的。不过它只是半个锁,因为它只锁了读操作,而没锁写操作,也就是说写操作可以随时进行而无需等待。如果读操作非常多,但写操作较少,并且你不希望写操作经常被打断,那它正好满足你的要求。它的缺点是你要保证系统中某个时刻最多有一个“writer”,“writer”一多,它就的无能为力了(这时一般应该用单写多读锁)。

2007.10.18:补充一点,关于acquire release semantics
   在多处理器平台上,一个处理器的实际的操作顺序,和其它处理器所看到的它的操作顺序可能并不相同,例如:
a++;
b++;
在其他处理器看来,很有可能“b++”发生在前面,而“a++”发生在后面。某些情况下,其他处理器看到的顺序必须和实际的顺序保持一致,所以就需要引入acquire semantics和release semantics了。
   说一个操作具有acquire semantics,就表示可以保证其它处理器在看到这一操作的结果前,不会看到(该处理器上)后续操作的结果,对该处理器而言,可以理解为它进行此操作前,不会进行后续操作;而一个操作具有release semantics,就表示可以保证其它处理器在看到这一操作的结果前,能看到(该处理器)上先前所有操作的结果,对该处理器而言,可以理解为在完成所有先前的操作之前,不会进行此操作。
   vc编译器(其它编译器不一定保证)保证对volatile对象的写操作具有release semantics;对volatile对象的读操作具有acquire semantics。基于此点保证,多线程环境中就可以用volatile型对象实现锁操作了。

对windows互锁函数的补充
一个轻量级的单写多读锁

posted on 2007-10-15 09:46 局部变量 阅读(5683) 评论(13)  编辑 收藏

评论

# re: 锁?不锁?如何锁? 2007-10-16 09:33 ziding

我认为是否加锁是需求决定的,比如你上面说的
 读简单数据类型不需要加锁,我认为就不一定对:
比如有个 退出标志,若不加锁,很可能造成我已经设置了这个标志的时候,读到的仍然是老的值。

# to ziding 2007-10-16 09:48 局部变量

加了锁你也不能保证一定读到新值,具体可参考那个写的例子,所以加锁和不加锁实际上没有什么区别,既然没有区别,就不应该加。你的需求应该用volatile和循环等待来实现,但我更喜欢等待一个某个内核对象的方式。

# re: 锁?不锁?如何锁? 2007-10-16 13:26 ziding

这样不可以?没区别?这样就可以保证了啊,我的理解有问题?

thread 1:

Lock(mutex);
int x = n; 
Unlock(mutex);

thread 2:
Lock(mutex);
n = 123; 
Unlock(mutex);

# to ziding: 没有区别 2007-10-16 15:09 局部变量

加锁后的
Thread1;
Thread2;
等价于不加锁的
int x = n;
n = 123;

加锁后的
Thread2;
Thread1;
等价于不加锁的
n = 123;
int x = n;

总之x的值取决于到底谁先执行, 你这种方法并不能保证它是123, 也不能保证它肯定不是123,所以和不加锁没有区别.
实际上你在用单线程的思维方式看待这个问题.

# re: 锁?不锁?如何锁? 2007-10-16 16:56 ziding

加锁后的 
Thread1; 
Thread2; 
等价于不加锁的 
int x = n; 
n = 123; 
----------------------
不对,不等价
我加锁之后,任一时间只有一个线程可能访问到x或者n,你这个不一样

总之x的值取决于到底谁先执行, 你这种方法并不能保证它是123, 也不能保证它肯定不是123,所以和不加锁没有区别.
----------------------
这样可以保证一旦n的值发生了改变,x的值一定也会发生改变。

# to ziding: 呵呵,你总会慢慢理解的 2007-10-16 20:15 局部变量

我个人的体会,多线程很依赖经验。从单线程的思维方式转到多线程,我觉得至少要用半年时间。

# re: 锁?不锁?如何锁? 2007-10-17 17:59 func

不加锁,任一时间也只能有一个线程访问x或h,这叫做原子性。ziding你想想如果多个线程同时写一个int,这个int变量会变成什么样子?所以不会有这种情况发生。

不过我好奇的是,虽然不应该发生,但多核CPU理论上似乎能够出现多线程同时去访问一个原子数据,CPU硬件如何避免……

# to func: cpu有高速缓存 2007-10-17 20:22 局部变量

读操作从缓存中读
如果结果与初值相关,写操作可以使用带lock前缀的指令(这也是那些互锁函数的实现方式),会保证只有一个cpu访问,同时此指令还换强制刷新其他cpu的缓存。具体可搜一下read/write barrier。
但对于操作结果与初值无关的情况,我个人认为lock前缀也没有必要用的,也就是说没必要加锁。

# re: 锁?不锁?如何锁? 2007-10-19 09:55 huangrg

一般一读一写的两个线程同时访问共享数据, 用环形队列可以不加锁.

# re: 锁?不锁?如何锁? 2007-10-20 22:51 weily

师兄,请教个问题:
做双机冗余备份,如何做到双机内容同步?
CPU为x86的, 200MHz。
每个机为单线程。 线程中是一个大循环,周期为25ms。

如何做双机的指定数据块的同步?误差小于5个周期/年。 数据块大小 less than 4M.

多谢啦。

# re: 锁?不锁?如何锁? 2007-10-24 13:12 Linkman的学习记录

好!很好!非常好!

# re: 锁?不锁?如何锁? 2009-02-03 16:38 ooo

锁有锁的好处
是否是简单数据类型跟目标机有关,假定某类型是简单数据类型会影响可移植性

# to ooo: 2009-02-05 09:48 局部变量

有道理,不过可移植性和性能等有些时候是矛盾的,文中的内容以windows/x86为主,没怎么考虑可移植性。如果考虑可移植性的话,我想更好的方法应该是写一大堆条件编译。

标题  
姓名  
主页
验证码 *
内容   
  登录  使用高级评论  Top
[使用Ctrl+Enter键可以直接提交]