首页 > 其他分享 >P1540 [NOIP2010 提高组] 机器翻译

P1540 [NOIP2010 提高组] 机器翻译

时间:2023-03-10 12:57:00浏览次数:36  
标签:NOIP2010 机器翻译 存入 单词 查找 内存 数组 P1540 指针

P1540 [NOIP2010 提高组] 机器翻译

[NOIP2010 提高组] 机器翻译

题目背景

小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。

题目描述

这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和译义放入内存,以备后续的查找和翻译。

假设内存中有 M 个单元,每单元能存放一个单词和译义。每当软件将一个新单词存入内存前,如果当前内存中已存入的单词数不超过 M-1,软件会将新单词存入一个未使用的内存单元;若内存中已存入 M 个单词,软件会清空最早进入内存的那个单词,腾出单元来,存放新单词。

假设一篇英语文章的长度为 N 个单词。给定这篇待译文章,翻译软件需要去外存查找多少次词典?假设在翻译开始前,内存中没有任何单词。

输入格式

共 2 行。每行中两个数之间用一个空格隔开。

第一行为两个正整数 M,N,代表内存容量和文章的长度。

第二行为 N 个非负整数,按照文章的顺序,每个数(大小不超过 1000)代表一个英文单词。文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。

输出格式

一个整数,为软件需要查词典的次数。

样例 #1

样例输入 #1

3 7
1 2 1 5 4 4 1

样例输出 #1

5

提示

样例解释

整个查字典过程如下:每行表示一个单词的翻译,冒号前为本次翻译后的内存状况:

  1. 1:查找单词 1 并调入内存。
  2. 1 2:查找单词 2 并调入内存。
  3. 1 2:在内存中找到单词 1。
  4. 1 2 5:查找单词 5 并调入内存。
  5. 2 5 4:查找单词 4 并调入内存替代单词 1。
  6. 2 5 4:在内存中找到单词 4。
  7. 5 4 1:查找单词 1 并调入内存替代单词 2。

共计查了 5 次词典。

数据范围

  • 对于 10% 的数据有 M=1,N ≤ 5;
  • 对于 100% 的数据有 1 ≤ M ≤ 100,1 ≤ N ≤ 1000。

分析

由于本题数据范围较小,我们可以用指针的方法做。

注:本文中的“指针”指的是“指针的思想”,并不是“指针类型”的“指针”。

先开两个数组,一个数组a存标记,在读入单词x时,若当前数组a中的第x位的标记为“1”,则表示该单词在内存中,若标记为“0”,则表示该单词不在内存中,这样做就可以一步判断读入的单词在当前是否在内存中,而不必从头到尾找。这样做还有一个好处,在存入单词时只需要把数组a中的第x位的标记“0”改为“1”,而在删去内存中的单词x时,只需要把数组a的第x位的标记“1”改为“0”,这样就可以做到一步到位,大大降低时间复杂度,提高程序效率。这是本题的关键之一,需要各位好好体会体会,理解理解。

再说另一个数组b。数组b存储的是内存中的单词,而且要按读入顺序存入,如b[1]中存储的单词x是在时间1存入的。要注意的是,若当前读入的单词x已经在内存中(即a[x]==1)那就不用存入数组b中,遇到内存中没有的新单词才存入。

接下来要讲指针。指针有两个,一个是l,指向当前内存中的单词中最先一个存入的,如b[l]是当前内存中第一个存入的。另一个是r,指向当前内存中的单词中最后一个存入的,如b[r]是当前内存中最后一个存入的。所以,数组b的第l位到第r位存储的就是当前内存中的单词。

遇到新单词时(即a[x]==0),情况有两种:

1.内存没被用完(即r<=m)。此时指针r向右移一位,在b[r]中存入新单词,并在数组a中把单词x的标记改为1;

2.内存已满(即r>m)。此时先删去当前内存中最先存入的单词(b[l])。删除操作不用太复杂,只需要先把指针l向右移一位,然后再修改a数组的第b[l]位的标记就可以了,可联系上文加深理解。不要忘了最后在b[r]中存入新单词x。

这题大概就是这样做了,如果你感觉可以自己AC掉,就先不要看以下程序,自己试着打打程序。如果WA了就再认真看看上文,如果AC了就把你的程序和以下程序对比对比,看看有什么可以改进的地方。

提交答案

#include <iostream>
#include <stdio.h>
#include <algorithm>
using namespace std;
int n,m,x,ans,l,r,a[1005],b[1005];
int main()
{
    cin>>m>>n;
    l=0;r=0;//初始化两个指针
    for (int i=1;i<=n;i++)
    {
        scanf("%d",&x);//边读入边做
        if (a[x]==0) 
        {
           ans++;
           r++;b[r]=x;a[x]=1;//因为每次遇到新单词都要做这些操作,不如搬到判断语句外做,这样程序更简洁
           if (r>m) {l++;a[b[l]]=0;}
        }
    }
    cout<<ans;
    return 0;//千万不能忘记打这句,不然在比赛中会出错
}

标签:NOIP2010,机器翻译,存入,单词,查找,内存,数组,P1540,指针
From: https://www.cnblogs.com/bujidao1128/p/17202997.html

相关文章