0%

C 迷你系列(四) 位域

位域

位段(或称“位域”,Bit field)为一种 数据结构,可以把数据以 位元 的形式紧凑的储存,并允许程序员对此结构的位元进行操作。

好处

  • 可以使数据单元节省储存空间,当程序需要成千上万个数据单元时,这种方法就显得尤为重要。
  • 段可以很方便的访问一个 整数 值的部分内容从而可以简化程序源代码。

缺点

而位域这种数据结构的缺点在于,其内存分配与内存对齐的实现方式依赖于具体的机器和系统,在不同的平台可能有不同的结果,这导致了位段在本质上是不可移植的。

C 中的位域

有些信息在存储时,并不需要占用一个完整的字节, 而只需占几个或一个二进制位。例如在存放一个开关量时,只有 0 和 1 两种状态, 用一位二进位即可。为了节省存储空间,并使处理简便,C 又提供了一种数据结构,称为“位域”或“位段”。所谓“位域”是把一个字节中的二进位划分为几个不同的区域, 并说明每个区域的位数。每个域有一个域名,允许在程序中按域名进行操作。 这样就可以把几个不同的对象用一个字节的二进制位域来表示。在声明时,位段成员必须是整形或枚举类型(通常是无符号类型),且在成员名的后面是一个冒号和一个整数,整数规定了成员所占用的位元数。位域不能是静态类型。不能使用 & 对位域做取地址运算,因此不存在位域的指针,编译器通常不支持位域的引用(reference)。以下程序则展示了一个位域的声明:

例 1

1
2
3
4
5
6
struct p_t
{
int a:5;
int b:2;
int c:9;
} p;

对于变量 p 来说,p 有三个成员:a、b、c,其中:a 占 5 位,b 占用 2 位,c 占用 9 位。那么 p 占用 16 位,即 2 字节!错~,总共占用 4 字节。不信?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
struct p_t
{
int a:5;
int b:2;
int c:4;
} p;

int main()
{
printf("size of p is %lu\n", sizeof p);
return 0;
}
--- output
size of p is 4

不是说是按位存储吗?怎么会是 4 字节呢?



从图中我们可以看出,a、b、c 共用了一个 int 的内存空间,一个 int 是 4 个字节,所以不管你用没用完,都至少是一个 int 内存。

例 2

1
2
3
4
5
6
7
8
9
10
11
12
13
struct p_t
{
unsigned char a:4;
unsigned char b:4;
} p;

int main()
{
printf("size of p is %lu\n", sizeof p);
return 0;
}
-- output
size of p is 1

两个 char 占用 2 字节,a 占用 4 位,b 占用 4 位,所以总共占用 1 字节。



例 3

1
2
3
4
5
struct p_t
{
unsigned char a:9;
unsigned char b:4;
} p;

有人可能会想到这样声明,但是该声明不会通过编译,报错 Width of bit-field 'a' (9 bits) exceeds width of its type (8 bits),因为 char 本身占用 1 字节 8 位,而声明位域 9 位,明显超过了 char 的空间,所以会报错。
Tips

位域所占位数不能超过对应的类型字节空间,比如:char 类型,位域不能超过 8 位;int 类型,位域不能超过 32 位。

例 4

1
2
3
4
5
6
7
struct p_t
{
unsigned char a:4;
unsigned char b:5;
} p;
--- output
size of p is 2

a 和 b 是相同类型的变量,但是 a、b 总的位数已经超过 1 字节,那么 b 就会存放到新的字节空间中,如图:



例 5

1
2
3
4
5
6
7
struct p_t
{
unsigned char a:4;
unsigned short b:4;
} p;
--- output
size of p is 2

由于 a、b 类型不同,在我的编辑器上,将 a 存储到空间比较大的 b 上,共用 short 空间,也就是 2 字节。如果我们让 b 是 13 位,看看会发生什么?

1
2
3
4
5
6
7
struct p_t
{
unsigned char a:4;
unsigned short b:13;
} p;
--- output
size of p is 4

我们发现总共占用 4 字节,为什么是 4 字节呢?a、b 总共 17 位,占用三个字节,由于存在内存对齐,需要额外的补 1 字节作为对齐(关于内存对齐的知识参考前一篇文章)。

例 6

1
2
3
4
5
6
7
8
struct p_t
{
unsigned char a: 2;
unsigned char : 2;
unsigned char b: 4;
} p;
--- output
size of p is 1

在 a 与 b 之间有个无名的位域,位数为 2,那么意思就是说这两位留空,b 存储在这两位之后,如图:



例 7

1
2
3
4
5
6
7
8
struct p_t
{
unsigned char a: 2;
unsigned char : 0;
unsigned char b: 4;
} p;
--- output
size of p is 2

这次无名位域的值位 0,我们发现总的内存占用变成了 2 字节,也就是说如过无名位域是 0 的话,那么会强制后续的位域在新的空间中分配。注意:只有无名位域才可能为 0。

例 8

1
2
3
4
5
6
7
8
struct p_t
{
unsigned char a: 2;
unsigned char b;
unsigned char c: 4;
} p;
--- output
size of p is 3

如果中间穿插非位域成员,会强制后续字段在新的空间分配(前提是位域类型相同,如果说不同的类型,不同的编译器会有不同的优化方式)。


参考