P1540 [NOIP2010 提高组] 机器翻译
[NOIP2010 提高组] 机器翻译
题目背景
小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。
题目描述
这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和译义放入内存,以备后续的查找和翻译。
假设内存中有 M 个单元,每单元能存放一个单词和译义。每当软件将一个新单词存入内存前,如果当前内存中已存入的单词数不超过 M-1,软件会将新单词存入一个未使用的内存单元;若内存中已存入 M 个单词,软件会清空最早进入内存的那个单词,腾出单元来,存放新单词。
假设一篇英语文章的长度为 N 个单词。给定这篇待译文章,翻译软件需要去外存查找多少次词典?假设在翻译开始前,内存中没有任何单词。
输入格式
共 2 行。每行中两个数之间用一个空格隔开。
第一行为两个正整数 M,N,代表内存容量和文章的长度。
第二行为 N 个非负整数,按照文章的顺序,每个数(大小不超过 1000)代表一个英文单词。文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。
输出格式
一个整数,为软件需要查词典的次数。
样例 #1
样例输入 #1
3 7
1 2 1 5 4 4 1
样例输出 #1
5
提示
样例解释
整个查字典过程如下:每行表示一个单词的翻译,冒号前为本次翻译后的内存状况:
1
:查找单词 1 并调入内存。1 2
:查找单词 2 并调入内存。1 2
:在内存中找到单词 1。1 2 5
:查找单词 5 并调入内存。2 5 4
:查找单词 4 并调入内存替代单词 1。2 5 4
:在内存中找到单词 4。5 4 1
:查找单词 1 并调入内存替代单词 2。
共计查了 5 次词典。
数据范围
- 对于 10% 的数据有 M=1,N ≤ 5;
- 对于 100% 的数据有 1 ≤ M ≤ 100,1 ≤ N ≤ 1000。
分析
由于本题数据范围较小,我们可以用指针的方法做。
注:本文中的“指针”指的是“指针的思想”,并不是“指针类型”的“指针”。
先开两个数组,一个数组a存标记,在读入单词x时,若当前数组a中的第x位的标记为“1”,则表示该单词在内存中,若标记为“0”,则表示该单词不在内存中,这样做就可以一步判断读入的单词在当前是否在内存中,而不必从头到尾找。这样做还有一个好处,在存入单词时只需要把数组a中的第x位的标记“0”改为“1”,而在删去内存中的单词x时,只需要把数组a的第x位的标记“1”改为“0”,这样就可以做到一步到位,大大降低时间复杂度,提高程序效率。这是本题的关键之一,需要各位好好体会体会,理解理解。
再说另一个数组b。数组b存储的是内存中的单词,而且要按读入顺序存入,如b[1]中存储的单词x是在时间1存入的。要注意的是,若当前读入的单词x已经在内存中(即a[x]==1)那就不用存入数组b中,遇到内存中没有的新单词才存入。
接下来要讲指针。指针有两个,一个是l,指向当前内存中的单词中最先一个存入的,如b[l]是当前内存中第一个存入的。另一个是r,指向当前内存中的单词中最后一个存入的,如b[r]是当前内存中最后一个存入的。所以,数组b的第l位到第r位存储的就是当前内存中的单词。
遇到新单词时(即a[x]==0),情况有两种:
1.内存没被用完(即r<=m)。此时指针r向右移一位,在b[r]中存入新单词,并在数组a中把单词x的标记改为1;
2.内存已满(即r>m)。此时先删去当前内存中最先存入的单词(b[l])。删除操作不用太复杂,只需要先把指针l向右移一位,然后再修改a数组的第b[l]位的标记就可以了,可联系上文加深理解。不要忘了最后在b[r]中存入新单词x。
这题大概就是这样做了,如果你感觉可以自己AC掉,就先不要看以下程序,自己试着打打程序。如果WA了就再认真看看上文,如果AC了就把你的程序和以下程序对比对比,看看有什么可以改进的地方。
提交答案
#include <iostream>
#include <stdio.h>
#include <algorithm>
using namespace std;
int n,m,x,ans,l,r,a[1005],b[1005];
int main()
{
cin>>m>>n;
l=0;r=0;//初始化两个指针
for (int i=1;i<=n;i++)
{
scanf("%d",&x);//边读入边做
if (a[x]==0)
{
ans++;
r++;b[r]=x;a[x]=1;//因为每次遇到新单词都要做这些操作,不如搬到判断语句外做,这样程序更简洁
if (r>m) {l++;a[b[l]]=0;}
}
}
cout<<ans;
return 0;//千万不能忘记打这句,不然在比赛中会出错
}
标签:NOIP2010,机器翻译,存入,单词,查找,内存,数组,P1540,指针
From: https://www.cnblogs.com/bujidao1128/p/17202997.html