研讨linux下C/C++,GTK,Shell,Oracle
(转载)C 语言最大难点揭秘
上一篇 / 下一篇 2008-03-23 13:45:02 / 个人分类:C/C++
查看( 606 ) /
评论( 17 )
本文将带您了解一些良好的和内存相关的编码实践,以将内存错误保持在控制范围内。内存错误是 C 和 C++ 编程的祸根:它们很普遍,认识其严重性已有二十多年,但始终没有彻底解决,它们可能严重影响应用程序,并且很少有开发团队对其制定明确的管理计划。但好消息是,它们并不怎么神秘。Linux宝库&D^p*iP'T-_2Tu
ew2}/v cd;?0 C 和 C++ 程序中的内存错误非常有害:它们很常见,并且可能导致严重的后果。来自计算机应急响应小组(请参见参考资料)和供应商的许多最严重的安全公告都是由简单的内存错误造成的。自从 70 年代末期以来,C 程序员就一直讨论此类错误,但其影响在 2007 年仍然很大。更糟的是,如果按我的思路考虑,当今的许多 C 和 C++ 程序员可能都会认为内存错误是不可控制而又神秘的顽症,它们只能纠正,无法预防。Linux宝库 ^-e4}(wS&L
AF1kN3x t"U0但事实并非如此。本文将让您在短时间内理解与良好内存相关的编码的所有本质:
5ZQ A,E w!`#M0Linux宝库,dzz^'N6Fwf+A K+u
正确的内存管理的重要性Linux宝库Wz&d7VX M'z [_|
内存错误的类别
u}O;~M:}?0内存编程的策略Linux宝库 Itx:~)N,e
Linux宝库 R!H6nS(k
正确的内存管理的重要性
$qcQ'F kuw;Y0
%dkY%o(k0存在内存错误的 C 和 C++ 程序会导致各种问题。如果它们泄漏内存,则运行速度会逐渐变慢,并最终停止运行;如果覆盖内存,则会变得非常脆弱,很容易受到恶意用户的攻击。从 1988 年著名的莫里斯蠕虫 攻击到有关 Flash Player 和其他关键的零售级程序的最新安全警报都与缓冲区溢出有关:“大多数计算机安全漏洞都是缓冲区溢出”,Rodney Bates 在 2004 年写道。
m iL;jTNE`0
_`0AH\4U{0在可以使用 C 或 C++ 的地方,也广泛支持使用其他许多通用语言(如 Java?、Ruby、Haskell、C#、Perl、Smalltalk 等),每种语言都有众多的爱好者和各自的优点。但是,从计算角度来看,每种编程语言优于 C 或 C++ 的主要优点都与便于内存管理密切相关。与内存相关的编程是如此重要,而在实践中正确应用又是如此困难,以致于它支配着面向对象编程语言、功能性编程语言、高级编程语言、声明性编程语言和另外一些编程语言的所有其他变量或理论。Linux宝库KMB^,r
lf;j6MN`,\0与少数其他类型的常见错误一样,内存错误还是一种隐性危害:它们很难再现,症状通常不能在相应的源代码中找到。例如,无论何时何地发生内存泄漏,都可能表现为应用程序完全无法接受,同时内存泄漏不是显而易见。Linux宝库S%]{$G*b
mG;x'qVHc@"C&hf0因此,出于所有这些原因,需要特别关注 C 和 C++ 编程的内存问题。让我们看一看如何解决这些问题,先不谈是哪种语言。
A~sGA4N&t+s%Z\ r0Linux宝库 ^k6j]3b9ik
内存错误的类别
-x"r*t xQP7r0Linux宝库 oGK_;xbZ\!qT
首先,不要失去信心。有很多办法可以对付内存问题。我们先列出所有可能存在的实际问题:
dS(BM9q$s*z0
a_)YL7O|5`a$U0内存泄漏
:B4ws:]c!ra%CH0错误分配,包括大量增加 free() 释放的内存和未初始化的引用Linux宝库^0B5yav$?rh
悬空指针
3t+l.@,j1b"u6^ C_0数组边界违规Linux宝库1AT[O h,Q&x4E%n
这是所有类型。即使迁移到 C++ 面向对象的语言,这些类型也不会有明显变化;无论数据是简单类型还是 C 语言的 struct 或 C++ 的类,C 和 C++ 中内存管理和引用的模型在原理上都是相同的。以下内容绝大部分是“纯 C”语言,对于扩展到 C++ 主要留作练习使用。Linux宝库%}({ WAd[8~-m d
Linux宝库@ v rf\
内存泄漏
0dY4XU:J`8NAt9p0
*A/_ m7?vr!Yh(R0在分配资源时会发生内存泄漏,但是它从不回收。下面是一个可能出错的模型(请参见清单 1):
x0s!DHuwD0
`B.kN(Ni8].c5Y jE0
9F+}1X"`/D:xd?~0清单 1. 简单的潜在堆内存丢失和缓冲区覆盖
Linux宝库o3nzQ,NN*|
在实际的 C 和 C++ 编程中,这不足以影响您对 malloc() 或 new 的使用,本部分开头的句子提到了“资源”不是仅指“内存”,因为还有类似以下内容的示例(请参见清单 2)。FILE 句柄可能与内存块不同,但是必须对它们给予同等关注:Linux宝库9J,ir[ [}7Wg
Linux宝库7W(q @ m3en)d9E
Linux宝库!|c/jC R J&kh
清单 2. 来自资源错误管理的潜在堆内存丢失
0aP o#Sg{6c#R0Linux宝库Jf;qe$|
内存错误分配Linux宝库wZ-mTS-a/e
)`+Ox'e9vq0错误分配的管理不是很困难。下面是一个示例(请参见清单 3):
Linux宝库\Va\+pQ7W+E
在此错误类型中存在多个变种。free() 释放的内存比 malloc() 更频繁(请参见清单 4):
qlI5sX0
fp-p#dn:G T%F0
l] [izM*y'H5Q0清单 4. 两个错误的内存释放
!M%E:z#Vs0Linux宝库t?JP1R!c4{*H
悬空指针Linux宝库1T s$U!Te:t
Gc9a%N6zmhsS0悬空指针比较棘手。当程序员在内存资源释放后使用资源时会发生悬空指针(请参见清单 5):
+s!h3Sw1]|rnr T0
a5g$n}Fo0
F7?-w2KkI0清单 5. 悬空指针
ew2}/v cd;?0 C 和 C++ 程序中的内存错误非常有害:它们很常见,并且可能导致严重的后果。来自计算机应急响应小组(请参见参考资料)和供应商的许多最严重的安全公告都是由简单的内存错误造成的。自从 70 年代末期以来,C 程序员就一直讨论此类错误,但其影响在 2007 年仍然很大。更糟的是,如果按我的思路考虑,当今的许多 C 和 C++ 程序员可能都会认为内存错误是不可控制而又神秘的顽症,它们只能纠正,无法预防。Linux宝库 ^-e4}(wS&L
AF1kN3x t"U0但事实并非如此。本文将让您在短时间内理解与良好内存相关的编码的所有本质:
5ZQ A,E w!`#M0Linux宝库,dzz^'N6Fwf+A K+u
正确的内存管理的重要性Linux宝库Wz&d7VX M'z [_|
内存错误的类别
u}O;~M:}?0内存编程的策略Linux宝库 Itx:~)N,e
Linux宝库 R!H6nS(k
正确的内存管理的重要性
$qcQ'F kuw;Y0
%dkY%o(k0存在内存错误的 C 和 C++ 程序会导致各种问题。如果它们泄漏内存,则运行速度会逐渐变慢,并最终停止运行;如果覆盖内存,则会变得非常脆弱,很容易受到恶意用户的攻击。从 1988 年著名的莫里斯蠕虫 攻击到有关 Flash Player 和其他关键的零售级程序的最新安全警报都与缓冲区溢出有关:“大多数计算机安全漏洞都是缓冲区溢出”,Rodney Bates 在 2004 年写道。
m iL;jTNE`0
_`0AH\4U{0在可以使用 C 或 C++ 的地方,也广泛支持使用其他许多通用语言(如 Java?、Ruby、Haskell、C#、Perl、Smalltalk 等),每种语言都有众多的爱好者和各自的优点。但是,从计算角度来看,每种编程语言优于 C 或 C++ 的主要优点都与便于内存管理密切相关。与内存相关的编程是如此重要,而在实践中正确应用又是如此困难,以致于它支配着面向对象编程语言、功能性编程语言、高级编程语言、声明性编程语言和另外一些编程语言的所有其他变量或理论。Linux宝库KMB^,r
lf;j6MN`,\0与少数其他类型的常见错误一样,内存错误还是一种隐性危害:它们很难再现,症状通常不能在相应的源代码中找到。例如,无论何时何地发生内存泄漏,都可能表现为应用程序完全无法接受,同时内存泄漏不是显而易见。Linux宝库S%]{$G*b
mG;x'qVHc@"C&hf0因此,出于所有这些原因,需要特别关注 C 和 C++ 编程的内存问题。让我们看一看如何解决这些问题,先不谈是哪种语言。
A~sGA4N&t+s%Z\ r0Linux宝库 ^k6j]3b9ik
内存错误的类别
-x"r*t xQP7r0Linux宝库 oGK_;xbZ\!qT
首先,不要失去信心。有很多办法可以对付内存问题。我们先列出所有可能存在的实际问题:
dS(BM9q$s*z0
a_)YL7O|5`a$U0内存泄漏
:B4ws:]c!ra%CH0错误分配,包括大量增加 free() 释放的内存和未初始化的引用Linux宝库^0B5yav$?rh
悬空指针
3t+l.@,j1b"u6^ C_0数组边界违规Linux宝库1AT[O h,Q&x4E%n
这是所有类型。即使迁移到 C++ 面向对象的语言,这些类型也不会有明显变化;无论数据是简单类型还是 C 语言的 struct 或 C++ 的类,C 和 C++ 中内存管理和引用的模型在原理上都是相同的。以下内容绝大部分是“纯 C”语言,对于扩展到 C++ 主要留作练习使用。Linux宝库%}({ WAd[8~-m d
Linux宝库@ v rf\
内存泄漏
0dY4XU:J`8NAt9p0
*A/_ m7?vr!Yh(R0在分配资源时会发生内存泄漏,但是它从不回收。下面是一个可能出错的模型(请参见清单 1):
x0s!DHuwD0
`B.kN(Ni8].c5Y jE0
9F+}1X"`/D:xd?~0清单 1. 简单的潜在堆内存丢失和缓冲区覆盖
CODE:Linux宝库4tvJAN*X9g
Linux宝库+y$E5X|`U/l
Eo
void f1(char *explanation)
bo;M]g9Y.z/@mW(m0 {Linux宝库,U2f-r.w&nv3@R
char p1;Linux宝库o{Q{ Z5X+P
Linux宝库`N0e
z*u
Er
p1 = malloc(100);Linux宝库5t1F*}
f4e,nsz
(void) sprintf(p1,
ptN*@F X0 "The f1 error occurred because of '%s'.",Linux宝库h%[
|#CA2g
explanation);
G"fC*v%rI0 local_log(p1);Linux宝库P6cE3SFc(kk!lBk
}Linux宝库+r0ixip"F
您看到问题了吗?除非 local_log() 对 free() 释放的内存具有不寻常的响应能力,否则每次对 f1 的调用都会泄漏 100 字节。在记忆棒增量分发数兆字节内存时,一次泄漏是微不足道的,但是连续操作数小时后,即使如此小的泄漏也会削弱应用程序。Linux宝库5X6\!L/]jpP)ULinux宝库o3nzQ,NN*|
在实际的 C 和 C++ 编程中,这不足以影响您对 malloc() 或 new 的使用,本部分开头的句子提到了“资源”不是仅指“内存”,因为还有类似以下内容的示例(请参见清单 2)。FILE 句柄可能与内存块不同,但是必须对它们给予同等关注:Linux宝库9J,ir[ [}7Wg
Linux宝库7W(q @ m3en)d9E
Linux宝库!|c/jC R J&kh
清单 2. 来自资源错误管理的潜在堆内存丢失
CODE:
u6Qq4Jf0
^:g)A j1Y6k!i0 int getkey(char *filename)Linux宝库*UiW`Iej U
{Linux宝库qZ/DF*c} W.j
FILE *fp;Linux宝库+l-Amb`l.Dl_
int key;Linux宝库Za?9ER Jb
eO.Iwx*KdX0 fp = fopen(filename, "r");
U)YM F:jP0 fscanf(fp, "%d", &key);Linux宝库B|T1V&l
return key;Linux宝库wt}?+T*L(sYn2^f
}Linux宝库O(l*h[;Ja
fopen 的语义需要补充性的 fclose。在没有 fclose() 的情况下,C 标准不能指定发生的情况时,很可能是内存泄漏。其他资源(如信号量、网络句柄、数据库连接等)同样值得考虑。0aP o#Sg{6c#R0Linux宝库Jf;qe$|
内存错误分配Linux宝库wZ-mTS-a/e
)`+Ox'e9vq0错误分配的管理不是很困难。下面是一个示例(请参见清单 3):
CODE:Linux宝库&erIbk`'T!\S@S
清单 3. 未初始化的指针
%`CPT e0
x!tuw[:c)S#my0 void f2(int datum)
a
bu/XW X*C*^x0 {Linux宝库B q9ds1F c*a#~
int *p2;
{ggi1?0Linux宝库6\"^\#N,fPg\
/* Uh-oh! No one has initialized p2. */Linux宝库W"le4`#nU%P-^D
*p2 = datum;
;JO%U3eCg0 ...Linux宝库FK[Z1^
|:D{x^
}关于此类错误的好消息是,它们一般具有显著结果。在 AIX? 下,对未初始化指针的分配通常会立即导致 segmentation fault 错误。它的好处是任何此类错误都会被快速地检测到;与花费数月时间才能确定且难以再现的错误相比,检测此类错误的代价要小得多。Linux宝库"{-z&D"M
p Bx,}Linux宝库\Va\+pQ7W+E
在此错误类型中存在多个变种。free() 释放的内存比 malloc() 更频繁(请参见清单 4):
qlI5sX0
fp-p#dn:G T%F0
l] [izM*y'H5Q0清单 4. 两个错误的内存释放
CODE:
K7W%c0E-l3w0 Linux宝库$]'[%?r:pI }
/* Allocate once, free twice. */Linux宝库%[;D'e
jRG3{9pU
void f3()Linux宝库/lqb_jOE~)R/{8c
{Linux宝库NoG-C%I.L6j DJ [
char *p;Linux宝库$| Snk7uz
"u1z gHgl*j0 p = malloc(10);
5Ao-S~U)k"|apO0 ...Linux宝库X!QQw4d*T
free(p);
3u6Nx{*r/F~W0 ...Linux宝库Hb@E-E_9\I
free(p);Linux宝库p:f&r'N8V&H[
}
9N3o@]2p'[x%n wT0Linux宝库?Sy5V9nY _
/* Allocate zero times, free once. */Linux宝库0G {%WE^_~
void f4()Linux宝库kQ-H(jr$v;\+@*k5QM
{
h6D#t-|{%?U SD0 char *p;
p7?%po5{0
)]h#^0a/Nf
O0 /* Note that p remains uninitialized here. */Linux宝库6H BNGA
free(p);
#k'_0qH)W0 }Linux宝库
]f%M9UJe~
这些错误通常也不太严重。尽管 C 标准在这些情形中没有定义具体行为,但典型的实现将忽略错误,或者快速而明确地对它们进行标记;总之,这些都是安全情形。!M%E:z#Vs0Linux宝库t?JP1R!c4{*H
悬空指针Linux宝库1T s$U!Te:t
Gc9a%N6zmhsS0悬空指针比较棘手。当程序员在内存资源释放后使用资源时会发生悬空指针(请参见清单 5):
+s!h3Sw1]|rnr T0
a5g$n}Fo0
F7?-w2KkI0清单 5. 悬空指针
CODE:Linux宝库6C}w4aOE6s"\
Linux宝库R8u&[$_:b:sU
void f8()
S,u4an4p"bm8K.o*F*_
F0 {Linux宝库}*j7yEC"y1I&w