一步一步写算法（之字符串查找中篇）

时间：2022-11-23 11:04:45浏览次数：37

标签：index 中篇 return 一步 len char 查找 str NULL

昨天我们编写了简单的字符查找函数。虽然比较简单，但是也算能用。然而，经过我们仔细分析研究一下，这么一个简单的函数还是有改进的空间的。在什么地方改进呢？大家可以慢慢往下看。

下面的代码是优化前的代码，现在再贴一次，这样分析起来也方便些：

char* strstr(const char* str, char* data)
{
  int index;
  int len;

  if(NULL == str || NULL == str)
    return NULL;

  len = strlen(data);
  while(*str && (int)strlen(str) >= len){
    for(index = 0; index < len; index ++){
      if(str[index] != data[index])
        break;
    }

    if(index == len)
      return (char*) str;

    str++;
  }

  return NULL;
}

不知道朋友们发现没有，原来的while条件中有一个很费时的操作。那就是每次str移动的时候，都需要判断str的长度大小。如果str的长度远大于data的长度，那么计算str长度的时间是相当可观的。

int check_length_of_str(const char* str, int len)
{
  int index;

  for(index = 0; index < len; index ++){
    if('\0' == str[index])
      return 0;
  }

  return 1;
}

char* strstr(const char* str, char* data)
{
  int index;
  int len;

  if(NULL == str || NULL == str)
    return NULL;

  len = strlen(data);
  while(*str && check_length_of_str(str, len)){
    for(index = 0; index < len; index ++){
      if(str[index] != data[index])
        break;
    }

    if(index == len)
      return (char*) str;

    str++;
  }

  return NULL;
}

上面的代码很好地解决了长度判断的问题，这样一来每次比较的长度很短，只要判断len的大小字符长度即可。但是，我们还不是很满足，如果两者不比较岂不更好。那么，有没有这个可能？我们发现，如果str在每次比较不成功的时候，就会自己递增一位。那么我们只要判断这一位是不是‘\0’不就可以了吗？所以说，我们的代码还可以写成下面的形式。

char* strstr(const char* str, char* data)
{
  int index;
  int len;

  if(NULL == str || NULL == str)
    return NULL;

  len = strlen(data);
  if((int)strlen(str) < len)
    return NULL;

  while(*str){
    for(index = 0; index < len; index ++){
      if(str[index] != data[index])
        break;
    }

    if(index == len)
      return (char*) str;

    if('\0' == str[len])
      break;

    str++;
  }

  return NULL;
}

和上面第一次的优化不同，我们在进入while之前会判断两者的长度区别，但是经过第一次判断之后，我们就再也不用判断了，因为接下来我们只要判第n个元素是否为‘\0’即可，原来的n-1个元素我们已经判断过了，肯定是合法的元素。为什么呢？大家可以好好想想。

（二）、KMP算法

KMP算法本质上说是为了消除查找中的多余查找步骤。怎么就产生了多余的查找步骤了呢。我们可以用示例说话。假设有下面两个字符串：

A： baaaaabcd

B： aaaab

那么这两个查找的时候会发生什么现象呢？我们可以看一下：

/*      1 2 3 4 5 6 7 8 9
*    A: b a a a a a b c d
*    B:   a a a a b
*       1 2 3 4 5 6 7 8 9
*/

我们发现B和A在从第2个元素开始比较的时候，发现最后一个元素是不同的，A的第6个元素是a，而B的第5个元素是b。按照普通字符串查找的算法，那么下面A会继续向右移动一位，但是事实上2-5的字符我们都已经比较过了，而且2-5这4个元素正好和B的前4个元素对应。这个时候B应该用最后一位元素和A的第7位元素比较即可。如果这个计算步骤能省下，查找的速度不就能提高了吗？

标签：index,中篇,return,一步,len,char,查找,str,NULL
From： https://blog.51cto.com/u_15888909/5880563

一步一步写算法（之字符串查找上篇）
字符串运算是我们开发软件的基本功，其中比较常用的功能有字符串长度的求解、字符串的比较、字符串的拷贝、字符串的upper等等。另外一个经常使用但是却被我们忽视的功......
一步一步写算法（之 A*算法）
在前面的博客当中，其实我们已经讨论过寻路的算法。不过，当时的示例图中，可选的路径是唯一的。我们挑选一个算法，就是说要把这个唯一的路径选出来，怎么选呢？当时我......
一步一步写算法（之可变参数）
可变参数是C语言编程的一个特色。在我们一般编程中，函数的参数个数都是确定的，事先定下来的。然而就有那么一部分函数，它的个数是不确定的，长度也不一定，这中间有什么秘密......
力扣34(java)-在排序数组中查找元素的第一个和最后一个位置（中等）
题目：给你一个按照非递减顺序排列的整数数组nums，和一个目标值target。请你找出给定目标值在数组中的开始位置和结束位置。如果数组中不存在目标值target，返回 [-1,-1]......
深度优先遍历查找
一.题目二.思路深度优先遍历+回溯法三.代码#include<stdio.h>#include<malloc.h>intn,m;int*path;intcount[2];//0代表-，1代表ointkey;//第k个intcount_=......
HTAP 的下一步？SoTP 初探（上）：从 “大” 数据到 “小” 而 “宽” 数据 —— 第七届中国开
在今年的第七届中国开源年会上，StoneDB团队在大数据分论坛发表了《HTAP的下一步？SoTP初探》主题演讲，在本次演讲中，我们首次正式对外阐释了“SoTP数据库”的技术理念，本系列......
HTAP的下一步？SoTP初探（上）：从“大”数据到“小”而“宽”数据
在今年的第七届中国开源年会上，StoneDB团队在大数据分论坛发表了《HTAP的下一步？SoTP初探》主题演讲，在本次演讲中，我们首次正式对外阐释了“SoTP数据库”的技术理念，本系......
查找算法总结
顺序查找基本思想intsearch(inta[],intn,intkey){for(inti=0;i<n;i++)if(a[i]==key)returni+1;return0;}经典查找——设......
【Core Java Volume 5】集合算法---查找数组、集合最大值的通用方法
一、查找数组的最大值1 笔试的时候通常查找数组的最大值，数组类型通常是int类型，可以这样直接写出getMax()代码://数组(int类型)publicstaticintgetMax(int[]nums){......
【Core Java Volume 6】集合算法--二分查找法
在数组中查找一个对象，当数组是有序的时候可以采用二分查找法。即可以直接查看位于数组中间的元素，看一看是否大于查找的元素。如果大于，用同样的方法在数组的前半部分继续查找......

一步一步写算法（之字符串查找中篇）

相关文章

赞助商

阅读排行

一步一步写算法（之字符串查找 中篇）

相关文章

赞助商

阅读排行

一步一步写算法（之字符串查找中篇）