编程语言深入理解递归算法

    作者:底层软件架构更新于: 2020-07-25 21:19:03

    大神带你学编程,欢迎选课

    深入理解递归算法,被误解的递归。虽然大多数的语言可以既可被编译又可被解译,但大多数仅在一种情况下能够良好运行。在一些编程系统中,程序要经过几个阶段的编译,一般而言,后阶段的编译往往更接近机器语言。这种常用的使用技巧最早在1960年代末用于BCPL,编译程序先编译一个叫做“0代码”的转换程序(representation),然后再使用虚拟器转换到可以运行于机器上的真实代码。这种成功的技巧之后又用于Pascal和P-code,以及Smalltalk和二进制码,在很多时候,中间过渡的代码往往是解译,而不是编译的。

    递归是一个神奇的算法,它是编程书籍中讲解的最尴尬部分。这些书籍通常会展示一个递归的阶乘实现,然后警告你,虽然它能运行但是它非常的慢并且可能会堆栈溢出而崩溃。虽然大家对它持怀疑态度,但是这不影响递归是算法中最强大的想法。

    编程语言深入理解递归算法_编程语言_Python_计算机_课课家

    递归是一个神奇的算法,它是编程书籍中讲解的最尴尬部分。这些书籍通常会展示一个递归的阶乘实现,然后警告你,虽然它能运行但是它非常的慢并且可能会堆栈溢出而崩溃。虽然大家对它持怀疑态度,但是这不影响递归是算法中最强大的想法。

    让我们来看看经典的递归阶乘:

    factorial.c

    1. #include  
    2. int factorial(int n) 
    3.  int previous = 0xdeadbeef; 
    4.  if (n == 0 || n == 1) { 
    5.  return 1; 
    6.  } 
    7.  previous = factorial(n-1); 
    8.  return n * previous; 
    9. int main(int argc) 
    10.  int answer = factorial(5); 
    11.  printf("%d\\n", answer); 
    12.   

    一个函数调用自身的想法起初非常神秘。为了解释整个过程,下图展示了factorial(5)被调用到n == 1 栈上结构。

    每次调用factorial都会生成一个新的栈帧。这些栈帧的创建和销毁使得递归因子比其迭代部分慢。在调用开始和返回之前的这些栈帧累积是可能耗尽栈空间并使程序崩溃。

    但是这些担忧通常是理论上的。例如,栈帧 factorial每个占用16个字节(这可以根据栈对齐和其他因素而变化)。如果您在计算机上运行现代x86 Linux内核,通常默认有8兆字节的堆栈空间,因此factorial n最多可以处理512,000。这是一个巨大数,需要8,971,833位来表示这个数,所以栈空间是我们问题中最少的:一个微弱的整数 - 甚至是64位 - 在我们用完栈空间之前会溢出数万次。

    我们稍后会看一下CPU的使用情况,但是现在让我们从位和字节中退一步,看看递归作为一种通用技术。我们的阶乘算法归结为将整数N,N-1,... 1推入堆栈,然后以相反的顺序将它们相乘。我们使用程序的调用堆栈执行此操作的前提是:我们可以在堆上分配堆栈并使用它。虽然调用堆栈确实具有特殊属性,但它只是您可以使用的另一种数据结构

    一旦你看到调用堆栈作为一个数据结构,其他东西就变得豁然开朗了:将本身之前所有这些整数累加起来再乘以自身这显然不是明智的选择。 使用迭代过程计算阶乘更为明智。

    有一个传统的面试问题,在迷宫中放一只老鼠,你帮助老鼠找奶酪,假设老鼠可以在迷宫中向左或向右转。你会如何建模并解决这个问题?

    像生活中的大多数问题一样,你可以将这种啮齿动物的任务抽象到一个图形,特别是一个二叉树,其中节点代表迷宫中的位置。然后你可以尽可能地让鼠标左转,当它到达死胡同时回溯然后右转。下图就是老鼠路径 :

    每条边(线)都可以左转或右转,老鼠可以选择。如果任一转弯被阻止,则相应的边缘不存在。无论您使用调用堆栈还是其他数据结构,此过程本质上都是递归的。但使用调用栈非常简单:

    Maze.c

    1. #include  
    2. #include "maze.h" 
    3. int explore(maze_t *node) 
    4.  int found = 0; 
    5.  if (node == NULL) { 
    6.  return 0; 
    7.  } 
    8.  if (node->hasCheese) { 
    9.  return 1; // found cheese 
    10.  } 
    11.  found = explore(node->left) || explore(node->right); 
    12.  return found; 
    13. int main(int argc) 
    14.  int found = explore(&maze); 

    在maze.c:13中找到奶酪,下图是堆栈。

    虽然这里很难摆脱递归,但这并不意味着它必须通过调用栈来完成。例如,你可以使用一个字符串 RRLL来跟踪转弯,并依靠字符串来决定鼠标的下一步行动。或者你可以分配其他变量来记录奶酪寻找的状态。你仍然在实现递归过程,但滚动你自己的数据结构。

    这可能会更复杂,因为调用堆栈就像手套一样。每个堆栈帧不仅记录当前节点,还记录该节点中的计算状态(在这种情况下,我们是仅采用左侧还是已经尝试右侧)。然而,我们有时会因为害怕溢出而放弃了美好的东西。在我看来是非常愚蠢的。

    正如我们所看到的,栈很大,并且在栈空间之前经常会遇到其他约束。还可以检查问题的大小并确保可以安全地处理。CPU担心主要是由两个广泛的病理学例子灌输:愚蠢的因子和可靠的O(2 n) 递归Fibonacci没有记忆。这些并不表示理智的堆栈递归算法。

    现实情况是栈操作很快。数据的偏移是准确的,栈在缓存中,不需要冷启动,并且有专门的指令来完成工作。同时,使用您自己的堆分配数据结构会产生大量开销。会看到其他人编写的东西比调用堆栈递归更复杂,性能更差。

    现代CPU 非常优秀了,通常不是瓶颈。简单往往和性能等同。

    高级语言的出现使得计算机程序设计语言不再过度地依赖某种特定的机器或环境。这是因为高级语言在不同的平台上会被编译成不同的机器语言,而不是直接被机器执行。最早出现的编程语言之一FORTRAN的一个主要目标,就是实现平台独立。

课课家教育

未登录