题目:
[NOIP2011 普及组] 统计单词数
题目描述
一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。
现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同(参见样例 1),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例 2)。
输入格式
共 2 行。
第 1 行为一个字符串,其中只含字母,表示给定单词;
第 2 行为一个字符串,其中只可能包含字母和空格,表示给定的文章。
输出格式
一行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从 \(0\) 开始);如果单词在文章中没有出现,则直接输出一个整数 -1。
样例 #1
样例输入
To
to be or not to be is a question
样例输出
2 0
样例 #2
样例输入
to
Did the Ottoman Empire lose its power at that time
样例输出
-1
提示
数据范围
$1\leq $ 第一行单词长度 \(\leq10\)。
$1\leq $ 文章长度 \(\leq10^6\)。
解析
先来看一下之前我写的代码
#include<bits/stdc++.h>
using namespace std;
int main(){
string sa;
getline(cin,sa);
string sb;
getline(cin,sb);
for(int i=0;i<sa.size();i++){
if(sa[i]>='A'&&sa[i]<='Z'){
sa[i]+=32;
}
}
for(int i=0;i<sb.size();i++){
if(sb[i]>='A'&&sb[i]<='Z'){
sb[i]+=32;
}
}
int a=sa.size();
int sum=0;
int f;
string gga=' '+sa+' ';
string ggb=' '+sb+' ';
if(ggb.find(gga)==-1){
cout<<-1;
}else{
f=ggb.find(gga);
while(1){
if(ggb.find(gga)==-1){
break;
}
int t=ggb.find(gga)+1;
for(int i=t;i<=sa.size();i++){
ggb[i]='@';
}
sum++;
}
cout<<sum<<" "<<f;
}
return 0;
}
整体十分凌乱,变量名命名也不规范,但还认得出来。
当时我的大体思路就是,先判断这个单词有没有在这个句子中出现过,然后再具体查找。找的时候如果在句子中还有这个单词,那么就把单词数量累加一次,再将这个单词“遮起来”,然后一直找,直到这个单词在句子中找不到为止。
但不知道什么原因,这个while循环在一直执行,我也懒得找,干脆重写了一个
新的代码思路是这样的:
特判是一样的,只是后面发生了改变。我们知道,一个位置的单词在找到后,就没有利用价值了,我们就可以将他残忍的抛弃,可以从他后面一个位置来找,同样不会重复或漏掉。
AC代码
#include<bits/stdc++.h>
using namespace std;
int main(){
string sa;
// getline(cin,sa);
cin>>sa;
getchar();//吞掉多的换行符
string s;
getline(cin,s);
for(int i=0;i<sa.size();i++){
if(sa[i]>='A'&&sa[i]<='Z'){
sa[i]+=32;
}
}
for(int i=0;i<s.size();i++){
if(s[i]>='A'&&s[i]<='Z'){
s[i]+=32;
}
}
int sum=0;
int f;
string gga=' '+sa+' ';//确保找的是单词
string ggb=' '+s+' ';
if(ggb.find(gga)==-1){
cout<<-1;
}else{
f=ggb.find(gga);
int t=ggb.find(gga);
while(t!=-1){
t=ggb.find(gga,t+1);
sum++;
}
cout<<sum<<" "<<f;
}
return 0;
}