本文认真梳理了微分概念产生、发展与演变的历史,搜集整理了各国数学分析相关教材中微分的定义并将其归纳为三类;详细分析了三类微分定义中内蕴的逻辑错误,在此基础上呼吁学界重新审视现行微积分体系,揭示真正的微积分原理并发展微积分方法。 This article carefully combs the history of the generation, development and evolution of differential concepts, collects and collates the definitions of differential in the relevant textbooks of mathematical analysis in various countries and classifies them into three categories; analyzes in detail the logic errors inherent in the definitions of three types of differential, and appeals to the academic circles to re-examine the current calculus system and reveal the true. The principle of calculus is developed and the calculus method is developed.
刘淑玉,郭猫驼
北京航空航天大学,数学与系统科学学院,北京
收稿日期:2018年10月25日;录用日期:2018年11月6日;发布日期:2018年11月16日
本文认真梳理了微分概念产生、发展与演变的历史,搜集整理了各国数学分析相关教材中微分的定义并将其归纳为三类;详细分析了三类微分定义中内蕴的逻辑错误,在此基础上呼吁学界重新审视现行微积分体系,揭示真正的微积分原理并发展微积分方法。
关键词 :极限理论,微分概念
Copyright © 2018 by authors and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
微积分体系原理和方法经历了一个漫长的孕育演变进程。就微积分诞生之后的发展而言,有两条演变线路,一条主线是自柏拉图(Plato,约前427~前347),阿基米德(Archimedes,前287~前212),伽利略(G. Galilei, 1564~1642),卡瓦列里(B. Cavalieri, 1598~1647)和巴罗(I. Barrow, 1630~1677)的量变积累,到牛顿(I. Newton, 1642~1727)发生根本质变,形成了带有运动学特征的微积分;另一条主线是自德谟克利特(Democritus,约前460~前370),开普勒(J. Kepler, 1571~1630),费马(P. Fermat, 1601~1665),帕斯卡(B. Pascal, 1623~1662)和惠更斯(C. Huygens, 1629~1695)的量变积累,到莱布尼茨(G. Leibniz, 1646~1716)发生根本性质变,形成了原子论性质的微积分。牛顿在1665~1667年间所做的工作和莱布尼茨在1672~1676年间所做的工作就分别是这两条线上的各自的巅峰工作,它们在微积分的演变史上开启了新的时代 [
微积分的发明,为解决几何学、力学和物理学等相关问题提供了一套极有力的工具,恩格斯誉之为“人类精神的最高胜利”。但是关于其基本概念——微分(牛顿的 ο 和莱布尼茨的 d x )——的本质,长时间处于争论中。牛顿认为,弧、弦和切线任何两个互相的最终比都是等量的比,导数(或者流数)表示变化率,积分(或流量)是导数(或流数)的逆运算;莱布尼茨认为,微分就是无穷小的差数,是定性的0,微商是微分之比,而面积是微分的和;欧拉(L. Euler, 1707~1783)认为,微分是不同阶的0;泊松(S. Poisson, 1781~1840)认为无穷小是“小于任何同类性质的给定量”,这些量是真实存在的,而不仅仅是“几何学家想象得一种研究方法”,微分学关键在于去求无穷小之比。
然而,牛顿的流术数在1734年受到英国大主教兼哲学家贝克莱(G. Berkeley, 1685~1753)的有力攻击。他说,按照数学家们那种推论方法,他们是没有资格攻击宗教的无理性的。牛顿把“流数”解释为“消失的增量的速度”,贝克莱嘲笑消失的增量为“死去的量的灵魂”。他甚至更切中要害,正确地批评了当时数学家们的著作中的一些具体论证。例如,他对于求导的具体过程发出了诘难,考虑 y = x 2 ,作出
比式 [ ( x + h ) 2 − x 2 ] / h ,然后把他简化为 2 x + h 随后令h为零,得到结果2x。但h是不是零呢?如果h
是零,用它来除那是没有意义的,如果它不是零,那就无权将它扔掉。贝克莱指出,这个称为h的数量“既可以用来代表增量,又可以代表子虚乌有,但在不管以哪种意义确定之后,都需证明并保持前后一致”。
大多数数学家对于微积分原理的逻辑缺陷是不以为然的,微积分在十八世纪已经得到直观的解释,在运算上又行之有效,而且所适用的问题非常广泛。例如,对于弦振动的偏微分方程已经解决;关于太阳系运动的方程已经解决;Laplace变换和变分法以及 Γ 函数也已经发明并得到应用;所有的力学理论都用微积分表述。这些都是十八世纪数学家的伟大成就 [
但另一方面,就数学的科学性而言,贝克莱的攻击是有道理的。人们会问莱布尼茨:无穷小究竟是什么?是不是0?或问牛顿:变化率到底是什么?是不是0/0?牛顿和莱布尼茨显然没有对这些问题给出肯定的回答,但他们所创立的原始的微积分方法,能够放之四海而皆准,绝不会是无缘无故的,这背后一定隐藏着规律。人类总要去揭示这个规律,从而建立新的微积分原理,发展更多的微积分方法。
达朗贝尔(J. R. d'Alembert, 1717~1783)学识渊博,曾与狄德罗(D. Diderot, 1713~1784)一起编纂法国第一部《百科全书》。对于微积分基础,他认为无穷小量或者逐渐消失的量是没有意义的,他毫不含糊地宣称:“一个量或者是有,或者是没有。如果是有,它就还没有消失;如果是没有,它就确实消失了。假设存在介于这两者之间的中间状态,就只能是一头由狮头羊身和蛇尾构成的喷火怪物。”他继承了罗宾斯(B. Robins, 1707~1751)用极限解释“首末比”的思想,并将用极限解释微积分的方法引向深入 [
柯西(A. L. Cauchy, 1789~1857)从牛顿后期关于微分的反思——消失量的最终比不是最终量之比,而是这些无限减少的量的比的极限——中受到启发,从而把微积分体系建立在极限和实数的基础上,并由此开启了现行微积分的原理体系。(可以看出,牛顿后期的反思与其发明微积分时的直觉论断——弧、弦和切线任何两个互相的最终比都是等量的比——是相互矛盾的。)柯西对于极限的数学定义是数学史上一个经典的定义:当属于一个变量的相继的值无限地趋近某个固定值时,如果最终同固定值之差可以任意地小,那么这个固定值就称为这个变量的极限。
柯西基于“接近”的思想避免了贝克莱所批判的一些缺陷。特别是,他既没有对达到这个极限做出什么规定,也没有对超过这个极限的情况进行说明。正如贝克莱主教因过于兴奋而没有来得及指出的那样,这个问题曾使柯西的许多前辈们陷入圈套。相形之下,柯西的所谓“回避极限”的定义不提及无论怎样达到极限,仅仅是接近并保持接近它。对他来说,这里没有消逝的量,于是贝克莱主教所谓消逝的量的鬼魂也就不复存在了。
对于柯西微分体系中定义和表述的含混,魏尔斯特拉斯(K. Weierstrass, 1815~1897)作了大量的工作,澄清了许多难以捉摸和似是而非的错误概念,证明了大量的重要的定理,给分析学赋予逻辑上的一种无
与伦比的精确性。例如魏尔斯特拉斯重新给出了极限的定义: lim x → a f ( x ) = L ,当且仅当对于任意的 ε ,存在一个 δ > 0 ,使得只要 0 < | x − a | < δ ,就有 | f ( x ) − L | < ε 。
依据其学生施瓦茨(H. A. Schwarz, 1843~1921)的记录,魏尔施特拉斯的表述为:当x变至 x + h 时函数 f ( x ) 所产生的全改变量 f ( x + h ) − f ( x ) 一般可分解为两部分,第一部分正比于自变量的改变量h,因此它由h和不依赖与h的一个因子(即关于h为常量)组成,从而它当h变为无穷小时也变为无穷小。函数全改变量的正比于自变量的改变量的第一部分,称为微分改变量或微分,并以刻画其特征的d置于函数前表示,而前缀 Δ 则表示全改变量,即 Δ f = d f + o ( h ) 。此时,微分被理解为增量函数的线性主部 [
后来,经过博雷尔(M.R. Frechet, 1871~1956),加托(R. Gâteaux, 1889~1914)和嘉当(E. Cartan, 1869~1951)等多位数学家的努力,微分被理解为一个线性映射,增量 f ( x + h ) − f ( x ) 与微分这个线性映射在自变量h上的值之差,在 h → 0 时是个比h更高阶的无穷小,它和莱布尼茨及传统的微积分教科书上的解释都不一样!它比微分是依赖于无穷小量h的无穷小量的传统说法更加明确,重要的是这种定义方式可以轻易地推广到n维乃至无穷维空间上去 [
经过一百多年的几代数学家的努力,到勒贝格(H. Lebesgue, 1875~1941)测度论的提出,数学界宣布微积分已经成为一个严密而完整的体系 [
1) 用 y = x 这一特殊函数定义自变量的微分,见,莫斯科大学力学与数学系教授,俄罗斯B.A.卓里奇的《数学分析》 [
定义在集 E ⊂ R 上的函数 f : E → R 叫做在集E的极限点 x ∈ E 处是可微的,如果 f ( x + h ) − f ( x ) = A ( x ) ( h ) + α ( x ; h ) ,其中 h → A ( x ) h 是关于h的线性函数,而 α ( x ; h ) 当 h → 0 , x + h ∈ E 时,等于 o ( h ) 。量 Δ x ( h ) : = ( x + h ) − x = x 和 Δ f ( h ) : = f ( x + h ) − f ( x ) 分别叫做自变量的增量和函数(相应于自变量的这个增量)的增量。
他们常常用(其实并不完全合理)自己作为h的函数的记号 Δ x 和 Δ f ( x ) 表示。这样一来,说函数在一点处可微,指的是在这点处的增量作为自变量的函数近似于一个线性函数,其误差与自变量增量的比当 h → 0 时是无穷小量。
在上述定义中,关于h的线性函数 h → A ( x ) h 叫做函数 f : E → R 在点 x ∈ E 处的微分,并用符号 d f ( x ) 或 D f ( x ) 来表示。于是, d f ( x ) ( h ) = A ( x ) h 。我们有 Δ f ( x ; h ) − d f ( x ) ( h ) = α ( x ; h ) ,并且当 h → 0 , x + h ∈ E 时, α ( x ; h ) = o ( h ) ,就是说,由自变量的增量h引起的函数增量与线性函数 d f ( x ) 在同一个h处的值之间的差是关于h的高于一阶的无穷小量。
由于这个缘故,微分是函数增量的线性主部。可以推出:
A ( x ) = f ′ ( x ) = lim h → 0 x + h , x ∈ E f ( x + h ) − f ( x ) h ,
因此微分可以写成 d f ( x ) ( h ) = f ′ ( x ) h 。
特别地,如果 f ( x ) ≡ x ,则显然 f ′ ( x ) ≡ 1 且,因此,人们有时会说,自变量的微分是它的增量。从而得到 d f ( x ) ( h ) = f ′ ( x ) d x ( h ) ,即 d f ( x ) = f ′ ( x ) d x ,此等式必须理解作h的函数的等式。
还可得到, d f ( x ) ( h ) d x ( h ) = f ′ ( x ) ,即函数 d f ( x ) d x (函数 d f ( x ) 和 d x 的比)是常数并且等于 f ′ ( x ) 。由于这个缘故,人们常常根据莱布尼茨的办法,用记号 d f ( x ) d x 来标记导数。这种记法与后来拉格朗日提出的记号 f ′ ( x ) 均为人们所使用 [
2) 直接定义自变量的增量就是自变量的微分。参见俄罗斯数学教授Г.И阿黑波夫的《数学分析讲义》 [
线性函数 g ( Δ x ) = c Δ x 叫作是增量 Δ f ( x ) (或函数 f ( x ) 本身在点 x = a 处)的微分,如果 Δ f ( x ) ∼ c Δ x 。当 Δ x → 0 ,即 Δ f ( x ) = c Δ x + γ ( Δ x ) Δ x ,其中 c ∈ R 且当 Δ x → 0 时 γ ( Δ x ) → 0 ,函数 f ( x ) 的微分记作 d f (x)
或简记作 d f 。从定义推出 lim Δ x → 0 Δ f ( x ) Δ x = c ,若此时 c ≠ 0 ,则 Δ f d f → 1 ;当 Δ x → 0 ,我们发现,函数 γ (Δx)
定义在点 x = a 的某个去心领域中,函数 Δ f ( x ) 定义在点的某个去心 δ 领域中,而函数 d f ( x ) = c Δ x 对于一切 x ∈ R 有定义,定义函数 γ ( Δ x ) 使 γ ( 0 ) = 0 ,对于我们是方便的,结果在我们定义微分 d f ( x ) 的等式 Δ f ( x ) = d f ( x ) + γ ( Δ x ) Δ x 中,所有的函数都定义好了,且都在点 Δ x = 0 的某个领域中连续,进而易见 Δ x = d x [
3) 利用线性映射定义微分。参见陈天权的《数学分析讲义》 [
定义(167): R → R 的线性映射 h ↦ f ′ ( x ) h ,(5.1.11)称为函数f在x处的微分,记做 d f x ,即 d f x : h ↦ f ′ ( x ) h ,(5.1.12)或 d f x ( h ) = f ′ ( x ) h ,(5.1.13)。从等式(5.1.13)看, f ′ ( x ) 与 d f x 几乎相同。事实上, d f x 是 R → R 的线性映射,而 f ′ ( x ) 正是代表线性映射 d f x 的(关于一维线性空间R的通常的基的一行一列的)矩阵,后者与数成一一对应。我们常常把一行一列的矩阵与它所对应的数看成是同一个东西。
微分这个词是莱布尼茨于17世纪,在极限概念尚未弄清楚的情况下,为了解释微分学的形式运算规律而引进的。他运用了在当时还没有明确定义的无穷小这一概念,经典的数学分析教材中,一元函数f在点x处的导数 f ′ ( x ) 看成是一个(依赖于x的)数。我们现在把导数看作是一个一行一列的矩阵,因为一行一列的矩阵与数成一一对应,一元函数f在点x处的导数 f ′ ( x ) 看成是一个(依赖于x的)数。
特别,当 f = i d R (R上的恒等映射)时,即 f : x ↦ x 或 ∀ x ∈ R ( f ( x ) = x )时,为了方便,映射 f = i d R 常记作x。应注意的是:x表示映射 x : x ↦ x 上式中,第一个x表示映射,第二个x表示自变量的值x,第三个x表示自变量的值x在映射x下得值。同一个x表示很多不同的东西。根据上下文,一般不会搞混。当然,同学应小心区别它们的涵义。
这时,我们有 d x : h ↦ h ,换言之, d x = i d 。故公式(5.1.13)可改写成 d f x = f ′ ( x ) d x (5.1.14)。应注意的是:最后的 d x 表示的是恒等映射。这个(5.1.14)也可改写成 f ′ ( x ) = d f x ∘ ( d x ) − 1 (5.1.15)。公式(5.1.15)与莱布尼茨引进的导数记法 f ′ ( x ) = d f d x 是一致的 [
1) 林群院士的《微积分快餐》 [
微分被理解为一个小局域内的线性主部,而不是任意的线性主部:设函数 f ( x ) 定义在闭区间 [ a , b ] 上(即 x ∈ [ a , b ] ),则在子区间 [ x , x + h ] 上,对起点x(固定)及一切附近点 x + h (其中h是变量):小段高 = f ( x + h ) − f ( x ) ,微分 = A ( x ) h ,测量误差 = f ( x + h ) − f ( x ) − A ( x ) h 。(在x的附近点 x + h 处用微分来测量小段高的差量) [
2) 美国数理逻辑学家A.鲁宾逊的《非标准分析》 [
另 y = f ( x ) 是一个内函数,它在开区间 ( a , b ) 上有定义,这里 a < b ,a和b都是标准的。我们选取一个无限小的正实数,叫做 d x 。对于 ( a , b ) 中的x,则取 d y = d f = f ( x + d x ) − f ( x ) 。因此,d可以看作一个算子,它把 R * 中的任何函数映射到另一个函数,后一函数定义在一个少尉小些的区间 ( a , b − d x ) 上。对 d y 应用d。得 d 2 y = d ( d y ) = f ( x + d x ) − 2 f ( x + d x ) + f ( x ) ,它定义于 a < x < b − 2 d x 。更一般地,有 d n y = d ( d n − 1 y ) , n = 1 , 2 , ⋯ ,记 d 0 y = y ,我们得到分别定义于 a < x < b − n d x 的函数。对于标准的 f ( x ) 和
标准的x, a < x < b ,立即得到:若函数 f ( x ) 在x处可微,则 d y d x = f ′ ( x ) [
3) 在著名数学家项武义的《微积分大意》 [
变率的定义:设C是函数 y = f ( x ) 的图示曲线, P ( x 0 , f ( x 0 ) ) 是C上的一个定点, Q ( u , f ( u ) ) (或写成 ( x 0 + h , f ( x 0 + h ) ) ),即把u写成 x 0 + h 是P的邻近动点,割线PQ的斜率: k = f ( u ) − f ( x 0 ) u − x 0 = f ( x 0 + h ) − f ( x 0 ) h ,所以割线的极限位置存在的充要条件是下述极限存在:即 lim h → 0 f ( x 0 + h ) − f ( x 0 ) h ,当上述极限存在时,该极限值就定义为函数 y = f ( x ) 在 x 0 点的变率,即 f ′ ( x ) : = lim h → 0 f ( x 0 + h ) − f ( x 0 ) h ;再者,当我们让 x 0 点再函数 y = f ( x ) 的所有平滑点变动,即得一个新函数 y ′ = f ′ ( x ) ,它在x点的函数值就是原始函数在该点的变率,所以把它叫做 y = f ( x ) 的变率函数,通常也叫导函数。微分运算即求变率函数这个运算 [
4) 在另外一部分学者看来,如美国F.吉尔当诺的《托马斯微积分》,法国J.迪尔多内的《现代分析基础》等,微分概念并非必须,便不再定义微分了 [
微分的定义,上承导数,下启积分,因此,如果微分定义不恰当,则导数和积分必然遭到影响,势必导致微积分原理的结构变得支离破碎,在逻辑上自相矛盾。如《托马斯微积分》书中所著,直接不采用微分的概念,即不予定义,势必导致微积分学分裂为微分学和积分学,迪尔多内的《现代分析基础》此书反映了这种分裂的趋势 [
在主流分析学的结构,或者可以说柯西–勒贝格微积分原理体系中,微分的三种定义方式都存在着较明显的逻辑错误,下面进行详细的分析。
1) 利用增量的线性主部定义微分存在的问题
如果函数 在 x 0 的改变量 Δ y 与自变量的改变量 Δ x 有下列关系: Δ y = A ⋅ Δ x + o ( Δ x ) ,其中A是与 Δ x 无关的常数。则称函数 y = f ( x ) 在点 x 0 可微。称为 A ⋅ Δ x 函数在 x 0 的微分,记为: d y = A ⋅ Δ x 或 d f ( x 0 ) = A ⋅ Δ x 。
为了凑出承上启下的 d y = f ( x 0 ) d x 形式,又制造了两种方法:其一,强行认为x 的微分就是 y = x 的微分,参见微分的主流定义2.1 (1);其二,强行定义 d x = Δ x ,参见2.1 (2) 。基于这两种方法之一, d y = f ( x 0 ) Δ x 就变成了 d y = f ( x 0 ) d x [
强行认为或定义是违反科学原则的。事实上,只要认为自变量x 的微分就是 y = x 的微分,就有 d x = d y = x ′ ⋅ Δ x = Δ x ,于是,得到了想要的 d y = f ( x 0 ) Δ x = f ( x 0 ) d x ,但同时,也产生了令人啼笑皆非的 d y = f ( x 0 ) Δ x = f ( x 0 ) d y 。
数学可以一个符号体系,但每种符号都有其特定的含义,所谓同一律,这是形式逻辑的内在要求, Δ x , Δ y , d x , d y 分别表示不同的含义,函数 y = f ( x ) 和函数 y = x 与自变量x也有各自的规定性, Δ x 和 Δ y 是一个演绎系综,可以相互推导, d x 与 d y 是一个演绎系综,可以相互推导,函数 y = f ( x ) 和函数 y = x 与自变量x是互不干涉的独立存在,强行将它们联络起来,混合在一起以凑出 d y = f ( x ) d x 的形式,是严重违反科学原则,不仅远远背离了微积分的发明者牛顿–莱布尼茨的本意,而且误导后世的学习者。这是不可原谅的错误。
2) 利用线性映射定义微分存在的问题
这源自弗雷歇格(M.R. Frechet),加托(Gateaux)和嘉当(E. Cartan)等多位数学家的工作。
微分被理解为一个线性映射,增量 f ( x + h ) − f ( x ) 与微分这个线性映射在自变量h上的值之差在 h → 0 时是个比h更高阶的无穷小。引入恒等映射的概念,即 d x : h ↦ h ,换言之, d x = i d 。从而 d f x ( h ) = f ′ ( x ) h = d f x ( h ) = f ′ ( x ) d x ,但是这是在单位映射(或者恒等映射)下成立,在非单位映射的情况下是否仍然成立呢?这种情况下的定义与采用特殊函数 y = x 定义 d x = Δ x 是等价的 [
用线性映射来定义微分,提高了抽象的层次,使得一般的学者更加难以理解,也使得其与积分的关系越来越远,越来越背离微积分的发明者的本意,使得微积分的整体结构彻底的支离破碎,也使得原有微积分方法放之四海而皆准的根源越来越扑朔迷离。现行的微积分原理,不仅没能揭示也严重阻碍了对于新的微积分方法的开拓。
事实上,微分概念自身存在严重的逻辑错误,不仅于此,现行微积分体系在许多方面(包括集合论、极限论、实数理论、测度论等)都存在严重的逻辑错误,丁小平在文献 [
数学发展史一再证明, d x 这一以“直”代“曲”的理论推导和计算是精确的(而非近似的);积分本质就是微分的直接累加(求极限是多此一举)。面对这一事实,柯西等人没有能力回答这一问题,而是选择另起炉灶,通过建立极限理论来予以否认。在柯西看来,莱布尼茨的“定性的0”的思想,欧拉的“不同阶0”的想法,泊松的“小于任何同类的给定量”的观点,都不是充满智慧的真知灼见,只是他们个人的猜测。
微分是微积分体系中的重要概念,它上承接导数,下连接着积分,而现在的微分教学中竟无法解释清楚微分的本质。故对现行微积分理论而言,理顺原理是当务之急。近年来,张景中和林群两位院士在微积分原理的研究方面进行了大量的工作,以与前人不同的方式处理微分定义,试图建立第三代微积分,是对微积分研究的重要贡献。当然微分的本质还需要研究,好能够正本清源。
在文章的末尾,我要感谢北京高校青年微积分小组成员在写作构思和过程中给予的指导和批评。
刘淑玉,郭猫驼. 微分定义的演变及其内蕴的逻辑错误The Evolution of Differential Definition and Its Intrinsic Logic Error[J]. 理论数学, 2018, 08(06): 681-687. https://doi.org/10.12677/PM.2018.86092