高中时期真的很爱数学,虽然老师老是骂我不做作业,可是我真的有在努力的,只是不喜欢做题而已。高中三年我的数学课本上一直存在两段公式,一是一元三次方程的判别式和一元四次方程降阶的公式。记得当时一元三次方程用了一两个月的时间才推导出来的,其解法主要也是变量代换。其实即便拥有现代知识的我们去推导三次方程也需要花些时间的,可以先考虑非一般式的三次方程,比如没有二次项或者没有一次项,形如x3+bx+c=0这样的,其实我高中时就是这么干的,若干年后发现其实当年的诸多数学家也是这样做的,然后再通过将一般形式的三次方程转换为缺少二次项的形式进行求解。

而四次方程的研究我连续研究了2个多月的晚自习也毫无头绪,完全没辙,无奈最终只能放弃,当时还很受挫,原本还做着春秋大梦想着找到所有高次方程的通解公式。可是直到一天我在新华书店看到一本书叫《人类在数学上的发现》里面提到四次方程曾经让无数数学家都束手无策(心里突然释怀了,当时还不会上网,不懂得去网上查找资料)最后是费拉里给出了解决方案,而我将这段公式从高一的数学课本抄写到高三的数学课本中(因为实在不好解,很繁杂记不住只得抄录)。于是今天打算整理下高次方程背后的故事。

先聊一聊数

现代欧洲早期在代数学方面有两个伟大的进步:一是得到了一般三次方程和四次方程的解法,二是发明了现代字母符号体系,系统地使用字母代表数。

数的现代概念在 19 世纪后期开始形成,并在 20 世纪二三十年代在数学界广泛传播。数的现代概念好似层层嵌套的“俄罗斯套娃”模型,其中共有五个“俄罗斯套娃”,分别用镂空字母 N、Z 、Q 、R 和 C表示。

  • N(自然数):1,2,3,4,5,6,7,8,9,10,...

    自然数的问题是自然数不是封闭的,在减法和除法面前会跳出自然数的范围,比如1-2,3/2等。减法的问题因为零和负数的发现而得到解决。大约在 600 年,古印度数学家发现了零。负数是欧洲文艺复兴时期的成果。

  • Z(整数):... -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, ...

    整数的发现解决了自然数减法的问题,但是除法还是无法解决,Z在除法运算下不是封闭的。

  • Q(有理数):Z+分数

    有理数是“稠密的”。这意味着在任意两个有理数之间,你总可以找到另外一个有理数,这是N和Z都不具备的。正是因为Q是稠密的,才会误导人们认为Q是完全的。

  • R(实数):Q+无理数

    还有另外一些数,它们既不是整数也不是有理数。公元前 500 年左右,古希腊人发现了这类数。这个发现给古希腊人的思维带来了深刻的影响,而且还提出了一些问题,这些问题至今也没有令所有数学家和哲学家都满意的答案。这类数的最简单的例子是 2 的平方根,如果你把它与自身相乘,就得到2。(在几何中,边长是单位 1 的正方形的对角线的长度就是 2 的平方根。)我们今天当然知道是个无理数,可是你会证明吗? 欧几里得首次给出了一般的证明,他使用了反证法 。假设这件事不 成立,即假设存在某个有理数pq(其中 和 都是整数)满足pqpq=2假设pq是最简分数(将分子和分母中的公因子约去,这总能做到),那么p 和 q中必定有一个是奇数用 q2乘上式两边得到p2=2q2而且只有偶数的平方是偶数,所以 p一定是偶数, q一定是奇数。因此p=2k k是某个整数,于是p2=4k2,所以4k2=2q2,q2=2k2因此 q也一定是偶数。那么p 和 q就都是偶数,出现矛盾。因此假设不成立,所以不存在平方等于 2 的有理数。在《素数之恋》一书中另有证明。 实数同有理数一样,也是稠密的。那么问题来了,有理数是稠密的,可是无理数又可以插入到无理数中间,那有理数还是稠密的吗?

  • C(复数):R+虚数

    在R 中,负数没有平方根。1=i2 这里有个疑问就是i等于什么? 12+12i×(12+12i)=12+12i+12i+12i2 因此i=12+12i.

那么复数C已经完备了吗?

其实人类在数学上的研究一个分支就是从代数到未知数x再到抽象出方程的研究历程,方程出现以后自然都在寻求各种方程的解,这其中最直接的就是高次方程的解了。

一元二次方程

对于 ax2+bx+c=0(a0), 若 =>0 ,则他的两个实数根可以表示为: x1=b+b24ac2ax2=bb24ac2a

这个是怎么来的?简单回顾一下中学数学知识,假设方程的两个解分别是x1x2,则方程一定可以写为:

(xx1)(xx2)=0x2(x1+x2)x+x1x2=0

于是有: x1+x2=bax1x2=ca

如果我们再知道x1x2的结果那么就可以非常容易得到根与系数的关系即求根公式了。那么继续构造: (x1x2)2=(x1+x2)24x1x2(x1x2)2=b24aca2

=b24ac=0则它的两个相等实数根可以表示为:

x1=x2=b2a

=b24ac<0则它的两个共轭复数根可以表示为:

x1=b+(b24ac)2ax2=b(b24ac)2a

三次方程

降阶解法

含有一个未知量的三次方程的一般形式x3+Px2+Qx+R=0 首先,我们可以通过一个简单的代换去掉包含 x2的项: x3+Px2+Qx+R=(x+P3)3+(QP23)(x+P3)+(RQP3+2P327)

换一种形式就是:

x3+Px2+Qx+R=X3+(QP23)X+(RQP3+2P327)

其中X=x+P3所以,只需要借助一个简单的代换就可以将任意的三次方程转化成不包含 x2项的方程,如果能求出这个较简单的方程中的X,那么用 X减去 P3就得到x.

现在的目标变成求解:x3+px+q=0的解。

x写为x=u+v此时方程变为:

(u+v)3+p(u+v)+q=0

整理后得到: (u3+v3)+3uv(u+v)=qp(u+v)

因为u 和 v的选择有无穷多种,所以,如果我可以选出特殊的u 和 v,满足: u3+v3=q3uv=p

那么我就得到一个解。因为3uv=p所以我可以用u 和p 表示v ,然后再把它代回第一个方程u3+v3=q中,就得到下面的方程: u6+qu3p327=0 这是一个关于未知量 u3的二次方程,如此就将一个三次方程降阶为二次方程,进而进行求解再反代换回去即可解出三次方程。

一元三次方程根与系数关系

三次方程是未知项总次数最高为3的整式方程,一元三次方程一般形式为ax3+bx2+cx+d=0 对于一元三次方程的判别式$$ 为:

=(bc6a2b327a3d2a)2+(c3ab29a2)3

>0 方程有一个实根和两个共轭复根;当=0 方程有三个实根:当<0 时,方程有三个不等的实根。

公式法求解:

x1=b3a+bc6a2b327a3d2a+3+bc6a2b327a3d2a3

x2=b3a+1+3i2bc6a2b327a3d2a+3+13i2bc6a2b327a3d2a3

x3=b3a+13i2bc6a2b327a3d2a+3+1+3i2bc6a2b327a3d2a3

一元三次方程的解法跟一元二次方程的解法可以采用相同的研究方法,也并没有太多的研究难度。

其实在二次方程里会通过几何法求近似解也是一种不严谨的解法,而这是很不数学的,但是逼近法却是微积分思想的原型,也许正式因为逼近法是如此的让人难受才导致微积分直到很晚才发现吧。此外三次方程还有很多种其他解法,但思想都是类似的。你可以自行尝试。

一元四次方程

其实以下方法不用细看,我估计也没人能有耐心看下去,这里列出来仅是纪念那个年代而已,其思想跟三次方程的解法思想相同,降阶。先想办法将三次项消除,然后再想办法求解不含三次项的四次方程。其中笛卡尔就将x4+bx2+cx+d=0转变成两个二次方程的乘积形式来求解四次方程。

费拉里的方法

转变成减少次数的四次方程要让以下四次方程式变成标准的四次方程式,先在等式两边分别除以a: ax4+bx3+cx2+dx+e=0

x4+bax3+cax2+dax+ea=0

第一步:消除 x3列。为了做到这一步,先把变量x变成u,其中: x=ub4a

将变量替换:

(ub4a)4+ba(ub4a)3+ca(ub4a)2+da(ub4a)+ea=0

展开后变成:

(u4bau3+6u2b216a24ub364a3+b4256a4)+ba(u33u2b4a+3ub216a2b364a3)+ca(u2ub2a+b216a2)+da(ub4a)+ea=0.

整理后变成以u为变量的表达式:

u4+(3b28a2+ca)u2+(b38a3bc2a2+da)u+(3b4256a4+b2c16a3bd4a2+ea)=0

现在改变表达式的系数,为:

α=3b28a2+caβ=b38a3bc2a2+daγ=3b4256a4+b2c16a3bd4a2+ea.

结果就是我们期望的低级四次方程式,为:

(1)u4+αu2+βu+γ=0

这种降低的四次方程的方法是被费拉里发现的,然而,这种方式曾经被发现过。接下来,利用一个恒等式:

(u2+α)2u42αu2=α2

从方程 (1)和上式,得出: (u2+α)2+βu+γ=αu2+α2.(2)

结果把 u4配成了完全平方式:$ (u{2}+){2}$ 下一步是在方程(2) 左边的完全平方中插入变量 y相应地在右边插入一项2y。根据恒等式:

(u2+α+y)2(u2+α)2=2y(u2+α)+y2  =2yu2+2yα+y2,

0=(α+2y)u22yu2αu2 两式相加,可得: (u2+α+y)2(u2+α)2=(α+2y)u2αu2+2yα+y2 与等式(2)相加,得: (u2+α+y)2+βu+γ=(α+2y)u2+(2yα+y2+α2)

也就是 (u2+α+y)2=(α+2y)u2βu+(y2+2yα+α2γ).(3)

现在我们需要寻找一个y值,使得方程(3)的右边为完全平方。而这只要令二次方程的判别式为零。为此,首先展开完全平方式为二次式: (su+t)2=(s2)u2+(2st)u+(t2)

右边的二次式有三个系数。可以验证,把第二项系数平方,再减去第一与第三项系数之积的四倍,可得到零: (2st)24(s2)(t2)=0

因此,为了使方程(3)的右边为完全平方,我们必须解出下列方程:

(β)24(2y+α)(y2+2yα+α2γ)=0

把二项式与多项式相乘,

β24[2y3+5αy2+(4α22γ)y+(α3αγ)]=0

两边除以4再把β24移动到右边,

2y3+5αy2+(4α22γ)y+(α3αγβ24)=0

这是关于y的三次方程。两边除以2,

y3+52αy2+(2α2γ)y+(α32αγ2β28)=0.(4)

转化嵌套的三次方程为降低次数的三次方程 方程(4)是嵌套的三次方程。为了解方程(4),我们首先用换元法把它转化为减少次数的三次方程:

y=v56α.

方程(4)变为:

(v56α)3+52α(v56α)2+(2α2γ)(v56α)+(α32αγ2β28)=0.

展开,得

(v352αv2+2512α2v125216α3)+52α(v253αv+2536α2)+(2α2γ)v56α(2α2γ)+(α32αγ2β28)=0.

合并同类项,得

v3+(α212γ)v+(α3108+αγ3β28)=0.

这是嵌套的三次方程。记

P=α212γQ=α3108+αγ3β28.

则此三次方程变为:

v3+Pv+Q=0(5)

解嵌套的降低次数的三次方程
方程(5)的解(三个解中任何一个都可以)为令 U=Q2±Q24+P3273

则:

v=UP3U

则原来的嵌套三次方程的解为:

y=56αP3U+U(6)

注意 (1):

P=0Q2+Q24+P327=0

注意 (2):

limP0PQ2+Q24+P3273=0

配成完全平方项 y的值已由(6)式给定,现在知道等式(3)的右边是完全平方的形式

s2u2+2stu+t2=(s2u+2st2s2)2

这对于平方根的正负号均成立,只要等式两边取相同的符号。A的正负是多余的,因为它将被本页后面马上将提到的另一个±a消去。

从而它可分解因式为:

(α+2y)u2+(β)u+(y2+2yα+α2γ)=[α+2yu+(β)2α+2y]2

注:若 β≠0 则 α+2y≠0如果 β=0则方程为双二次方程,前面已讨论过。因此方程(3)化为:

(u2+α+y)2=(α+2yuβ2α+2y)2(7)

等式(7)两边各有一个乘起来的完全平方式。两完全平方式相等。如果两平方式相等,则两平方式的因子也相等,即有下式:

(u2+α+y)=±(α+2yuβ2α+2y)(7)

对 u合并同类项,得

u2+(sα+2y)u+(α+y±sβ2α+2y)=0(8)

注:±s 及 ∓s 中的下标s 用来标记它们是相关的。方程(8)是关于u的二次方程。其解为

u=±sα+2y±t(α+2y)4(α+y±sβ2α+2y)2.

化简,得

u=±sα+2y±t(3α+2y±s2βα+2y)2

这就是降低次数的四次方程的解,因此原来的四次方程的解为

x=b4a+±sα+2y±t(3α+2y±s2βα+2y)2.(8)

注意:两个 ±s来自等式(7′)的同一处,并且它们应有相同的符号,而 ±t 的符号是无关的。

五次方程

以上对于前四次方程的求解都不具备一般性,可以理解为无法通过数学归纳法应用到更高次方程的求解上,只是思想上具备一般性,也就是降阶。可是降解是偶现的灵感或暴力尝试出来的,变量代换、因式分解都具有特殊性用在五次方程上完全行不通。

对于任意一个特定的五次方程,使用 10 世纪和 11 世纪阿拉伯数学家熟悉的技术就能得到一个可以达到所要求精度的数值解。我们不知道的是它的代数 解,即一个如下形式的解:

x=[p,q,r,s,t]

其中括号里的“代数”的意思是“只包含加、减、乘、除运算和开方运算(开平方、开立方、开四次方、开五次方,等等)”。为了完整起见,我还是指定括号里的表达式只包含有限 次运算。

我们现在知道,这样的解并不存在。公认的真正证明了“一般五次方程没有代数解”这个结论的人是挪威数学家尼尔斯·亨里克·阿贝尔(1802—1829),他在 1824 年发表了他的证明。因此,在整个 18 世纪里,人们一直相信一般五次方程有代数解。寻找这个解成为那个时代最困难的问题。到了 1700 年,关于五次方程的研究没有取得丝毫进展,这距离费拉里攻克四次方程已经过去 160 年。在解决三次方程和四次方程时使用的技术都不能解决五次方程。解决这个问题显然需要一种全新的想法。

拉格朗日的工作
论文《对方程的代数解的思考》由已经声名显赫的数学家拉格朗日发表的文章,把通过方程解的置换来求解方程的想法呈现给广大数学家(该思想最早由范德蒙德想到,而且这个想法已经得到了现代教材的认可。然而,他的论文在当时没有得到关注)。其对于二次方程的解法有如下思想:

x1+x2=ba

x1x2=ca

对于三次方程:

x1+x2+x3=ba

x1x2+x2x3+x3x1=ca

x1x2x3=da

这里面存在一个变量代换的游戏,也就是高次方程的不同解之间的运算可以用方程系数来表示,对于二次方程的解种置 换这些未知量的方法有2!个,对于三次方程解种置换这些未知量的方法有3!个,对于四次方程解种置换这些未知量的方法有4!个,对于五次方程解种置换这些未知量的方法有5!=120个。

这里面其实还存在某种规律:

  • x1x2x3具有对称性。也就是x1x2x3在代数关系式中的位置可以互换, x1x2就不具备对称性,两则互换结果不一致。
  • x1x2x3满足某种循环关系[1,2]、[2,3]、[3,1]。

这其实就是群论的思想,对于二次方程满足S2群论,对于三次方程满足S3群论,依次类推四次方程满足S4群论,五次方程满足S5群论。而此后的研究方法就改为如何用系数表示出每一个解,而这些规律的研究形成了后面数学领域非常重要的群论。

阿贝尔和伽罗瓦的工作
其实到这里就已经很复杂了,我也没有能力解释清楚,想要完整的了解阿贝尔和伽罗瓦的思想需要先系统的了解群论的基本概念,运算法则以及各种子群相关知识。我们只需要知道高次方程的解x1x2x3...的运算可以通过高次方程的系数来表示。而我们只能得到该表示的一部份关系,来根据这有限的表示来求解x1x2x3的独立表示法。想要证明五次方程不可解就转化为已知的表示方法求解单个解的表示是否有解的问题。而x1x2x3用群论来解释就是其可以组成一个群,然后已知的方程组为该群的子群。