本次讲课讲全面介绍字符串以及如何使用字符串解决具体问题。
一、什么是字符串
1.如何存储字符串
平时我们使用的变量有很多,int代表整型变量,double代表浮点型变量,char代表字符型变量,那么对于一个字符串例如“Hello World!”应该如何存储并操作呢。
在C语言里,我们可以char数组进行存储,例如:
1 char str1[] = "Hello World!";
2 char* str2 = "Hello World!";
3 char str3[20] = "Hello World!";
对str1、2、3进行输出都为“Hello World!”,这三种方式构造一个字符串的区别有哪些?我们输出他们的空间长度(注意是占用的空间长度而不是字符串长度)。
1 int len1 = sizeof(str1)/sizeof(char);
2 int len2 = sizeof(str2)/sizeof(char);
3 int len3 = sizeof(str3)/sizeof(char);
4 printf("%d\n%d\n%d\n",len1,len2,len3);结果为:13 4 20
(此处应对上诉结果进行解释说明 ==)
既然字符串可以存储在一个字符数组里面,那么如何对字符串进行操作想必也就非常清楚了。需要注意的是,对于计算机可以字符和一个整型变量没有任何区别,它们都是数据,所以对整型变量可以做的操作都可以对一个字符进行同样的操作。
2.ASCII编码
众所周知字符在C/C++里面是以ASCII码的形式存储在计算机中,既然字符串是存储在字符数组里面的,其实也就是多个字符的一个有序集合。它也遵守和字符同样的的规则,例如'A'的ASCII码为65,如果我们进行下列语句
1 char ch = 'A';
2 if(ch == 'A'){
3 ch = ch + 5;
4 }
5 else {
6 ch = ch - 1;
7 }
那么这里ch的值应该变成多少了呢?此时的ch又代表哪个字符呢?
3.std::string
是不是没见过这是什么东西,它其实就是character string(字符串),这是一个C++的语句,意思就是调用std(标准命名空间)里面的string类,可能你也已经猜到了string是用来干什么的,是的它可以直接定义一个字符串变量,并且能够直接对串进行操作。
什么意思呢?我们既然已经能够用字符数组存储字符串了,为什么还需要多个string呢,因为我们前面说了字符串数组相当于一个字符的有序集合,归根到底还都是单个字符,而字符串变量string才是真正的字符串,它可以直接对串操作,例如下列语句:
std::string str = "Hello";
str += " World";
str += "!";
如果仅仅只是这样,那么string并不显得强大,事实上string支持下面的功能
但是值得注意的是,string是c++语言的东西,在c语言中并不能使用,而且string只能通过cin流进行读入操作,同样可以使用下标对string字符串进行每一位的访问以及操作。
C++也还有很多C语言没有的容器,通过这些容器对做题有很大帮助,而且这些容器对于一个ACMer来说是必须要掌握的,详情请戳:
STL容器(Stack, Queue, List, Vector, Deque, Priority_Queue, Map, Pair, Set, Multiset, Multimap)
二、字符串操作
1.空格、换行符
我们知道使用scanf("%s",s);读入一个字符串遇到空格和换行符自动跳出,但是对于一个字符串不可能都没有空格以及换行呀,如果是需要读入一个句子那该怎么办呢,对于C语言,我提供了下列几种方法供参考
1 //方法一——判断是否为空格选择继续读入还是跳出
2 char s[100],ch;
3 scanf("%s",s);
4 ch = getchar();
5 while(ch == ' '){
6 int len = strlen(s);
7 s[len] = ' ';
8 scanf("%s",s+len+1);
9 ch = getchar();
10 }
11
12 //方法二——利用格式符%[]设置结束符
13 char s[100];
14 scanf("%[^\n]",s);
15
16
17 //方法三——利用不安全的gets进行读入
18 char s[100];
19 gets(s);
三种方法都可以进行读入以换行符为结束符带有空格的字符串,但是我推荐最好使用第一种,为什么?
(此处应对上述进行解释说明)
在C++语言中,想要读入这样的串,我也同样提供几种方法供参考
1 //方法一——使用cin流对字符串进行读入
2 char s[100];
3 cin.getline(s,100);
4
5 //方法二——使用getline进行string类读入
6 string s;
7 getline(cin,s);
下面以一个例题为例,对字符串的具体操作进行讲解
题目链接:http://120.78.128.11/Problem.jsp?pid=1716
下面我贴出C语言和C++语言的代码
C语言:
1 #include <stdio.h>
2 #include <string.h>
3 char s1[10005],s2[105];
4
5 void read(char *s){
6 int ch;
7 scanf("%s",s);
8 ch = getchar();
9 while(ch == ' '){
10 int len = strlen(s);
11 s[len] = ' ';
12 scanf("%s",s+len+1);
13 ch = getchar();
14 }
15 }
16
17 int main(){
18 int t;
19 scanf("%d",&t);
20 while(t--){
21 read(s1),read(s2);//读入字符串
22 int len1 = strlen(s1),len2 = strlen(s2);
23 int flag = -1,i,j;
24 for(i = 0; i < len1; i++){
25 if(s1[i] == s2[0]){
26 for(j = 0; j < len2; j++){
27 if(j == len2-1 && s1[i+j] == s2[j])
28 flag = i+1;
29 if(s1[i+j] != s2[j])
30 break;
31 }
32 }
33 }
34 printf("%d\n",flag);
35 }
36 return 0;
37 }
C++语言:
1 #include <bits/stdc++.h>
2 using namespace std;
3
4 string s1,s2;
5
6 int main(){
7 int t;
8 cin>>t;
9 cin.get();
10 while(t--){
11 getline(cin,s1),getline(cin,s2);
12 int pos = s1.find(s2);
13 cout << (pos==-1?-1:pos+1) << endl;
14 }
15 return 0;
16 }
这也是为什么要用C++的原因,C++内置函数以及操作实在是太强大了,两个C中较为冗长的函数在C++中都只要用一句便实现了。
另一个例题:http://120.78.128.11/Problem.jsp?pid=1924
C语言代码:
1 #include <stdio.h>
2 #include <string.h>
3 char s[1000005];
4
5 void read(char *s){
6 int ch;
7 scanf("%s",s);
8 ch = getchar();
9 while(ch == ' '){
10 int len = strlen(s);
11 s[len] = ' ';
12 scanf("%s",s+len+1);
13 ch = getchar();
14 }
15 }
16
17 int main(){
18 int t,i;
19 scanf("%d",&t);
20 while(t--){
21 read(s);
22 int len = strlen(s);
23 for(i = 0; i < len; i++){
24 if(i == 0){
25 putchar(s[i]-32);
26 }
27 if(s[i] == ' '){
28 putchar(s[i+1]-32);
29 }
30 }
31 puts("");
32 }
33 return 0;
34 }
C++代码:
1 #include <bits/stdc++.h>
2 using namespace std;
3
4 string s;
5
6 int main(){
7 int t;
8 cin>>t;
9 cin.get();
10 while(t--){
11 getline(cin,s);
12 int len = s.size();
13 cout << char(s[0]-32);
14 for(int i = 1; i < len; i++){
15 if(s[i] == ' ')
16 cout << char(s[i+1]-32);
17 }
18 cout << endl;
19 }
20 return 0;
21 }
2.字符串比较
我们知道可以通过一位一位的模拟进行字符串比较,但要是两个字符串都很长怎么办,我们容易得出暴力方法进行匹配的时间复杂度为O(n*m),n和m就是两个字符串的长度,通过一些算法我们可以进行匹配优化,例如我们可以利用KMP算法在O(n+m)的时间复杂度内进行匹配。
下面是KMP的算法讲解