winston 发表于 2012-5-23 21:33:38

字符匹配:查找包含字符集的子串-和谐系统

实现一个挺高级的字符匹配算法:
给一串很长字符串,要求找到符合要求的字符串,例如目的串:123,1******3*****2,12******3这些都要找出来
其实就是一些和谐系统。。
与此题类似:给一个很长的字符串str, 还有一个字符集比如{a,b,c},找出str包含{a,b,c}的最短子串,要求O(n)。
/*用两个变量 front,rear 指向一个的子串区间的头和尾(当然,开始时front和rear都指向字符串开始处)。用一个int cnt={0}记录当前这个子串里字符集a,b,c各自的个数,一个变量count记录字符集里有多少个了rear 一直加,更新cnt[]和count的值,直到count等于字符集个数然后front++,直到cnt[]里某个字符个数为0(front 开始的部分有可能和后面的重复,所以front要加到某个字符个数为0),这样就找到一个符合条件的字串了,继续下去,可以求出所有符合条件的串,同时可以求出满足条件最短子串*/
#include <iostream>
using namespace std;

void MinSubString( char *src, char *des )
{
      int min=1000;//找最短子串
      int minfront=0;//最短子串开始位置
      int minrear=0;//最短子串结束位置
      int front,rear;
      front=rear=0;
      int len=strlen(des);
      int hashtable={0};
      int cnt={0};
      int cnt2={0};
      for(int i=0; i<len; i++)//将字符集里的字符映射到hashtable数组中,方便判断src中的某个字符是否在字符集中
                hashtable[*(des+i)]=1;
      int count=0;
      char *p=src;
      while( *(p+rear) !='\0')
      {
                if(hashtable[*(p+rear)]==1)//rear当前字符在字符集中
                {
                        if(cnt2[*(p+rear)]==0)//判断是否是本子串中第一次检索到此字符,由count统计字符集中已出现的字符数
                        {
                              count++;
                              cnt[*(p+rear)]++;
                              cnt2[*(p+rear)]++;
                              if(count == len)//字符集中的字符在本子串中都已检索到
                              {
                                        while(1)
                                        {
                                                if(hashtable[*(p+front)]==1)//front当前字符在字符集中
                                                {
                                                      cnt[*(p+front)]--;
                                                      if(cnt[*(p+front)]==0)//字符集中某个字符为0,此时front到rear所指字符串即为符合条件的子串
                                                      {
                                                                for(i=front; i<=rear; i++)//打印此子串
                                                                        cout<<*(p+i);
                                                                cout<<endl;
                                                            if(rear-front+1<min)
                                                                {
                                                                        min=rear-front+1;
                                                                        minrear=rear;
                                                                        minfront=front;
                                                                }
                                                                //开始另一个串的检索时,要将count和cnt2[]清零。cnt[]不用变
                                                                count=0;
                                                                for(i=0; i<255; i++)
                                                                        cnt2=0;
                                                                front++;
                                                                break;                                                               
                                                      }                              
                                                }
                                                front++;
                                        }
                              }
                        }
                        else
                        {
                              cnt[*(p+rear)]++;      
                              cnt2[*(p+rear)]++;      
                        }
                }//当前字符不在字符集中
                rear++;
      }


      cout<<"最短子串:";
      for(i=minfront ; i<=minrear; i++)
                cout<<*(p+i);
      cout<<endl;





}

void main()
{
      char *src="ab1dkj2ksjf3ae32ks1iji2sk1ksl3ab;iksaj1223";
//      char *src="2sk1ksl3ab;iksaj1223";
      char *des="123";
      MinSubString( src, des );


}


页: [1]
查看完整版本: 字符匹配:查找包含字符集的子串-和谐系统