P1540 [NOIP2010 提高组] 机器翻译

时间：2023-10-11 12:44:22浏览次数：41

标签：翻译 NOIP2010 int 机器翻译单词查找内存 P1540 软件

题目背景

小晨的电脑上安装了一个机器翻译软件，他经常用这个软件来翻译英语文章。

题目描述

这个翻译软件的原理很简单，它只是从头到尾，依次将每个英文单词用对应的中文含义来替换。对于每个英文单词，软件会先在内存中查找这个单词的中文含义，如果内存中有，软件就会用它进行翻译；如果内存中没有，软件就会在外存中的词典内查找，查出单词的中文含义然后翻译，并将这个单词和译义放入内存，以备后续的查找和翻译。

假设内存中有 \(M\) 个单元，每单元能存放一个单词和译义。每当软件将一个新单词存入内存前，如果当前内存中已存入的单词数不超过 \(M-1\)，软件会将新单词存入一个未使用的内存单元；若内存中已存入 \(M\) 个单词，软件会清空最早进入内存的那个单词，腾出单元来，存放新单词。

假设一篇英语文章的长度为 \(N\) 个单词。给定这篇待译文章，翻译软件需要去外存查找多少次词典？假设在翻译开始前，内存中没有任何单词。

输入格式

共 \(2\) 行。每行中两个数之间用一个空格隔开。

第一行为两个正整数 \(M,N\)，代表内存容量和文章的长度。

第二行为 \(N\) 个非负整数，按照文章的顺序，每个数（大小不超过 \(1000\)）代表一个英文单词。文章中两个单词是同一个单词，当且仅当它们对应的非负整数相同。

输出格式

一个整数，为软件需要查词典的次数。

样例 #1

样例输入 #1

3 7
1 2 1 5 4 4 1

样例输出 #1

提示

样例解释

整个查字典过程如下：每行表示一个单词的翻译，冒号前为本次翻译后的内存状况：

1：查找单词 1 并调入内存。
1 2：查找单词 2 并调入内存。
1 2：在内存中找到单词 1。
1 2 5：查找单词 5 并调入内存。
2 5 4：查找单词 4 并调入内存替代单词 1。
2 5 4：在内存中找到单词 4。
5 4 1：查找单词 1 并调入内存替代单词 2。

共计查了 \(5\) 次词典。

数据范围

对于 \(10\%\) 的数据有 \(M=1\)，\(N \leq 5\)；
对于 \(100\%\) 的数据有 \(1 \leq M \leq 100\)，\(1 \leq N \leq 1000\)。

思路

由数据范围可知，我们可以直接模拟队列。

同时定义一个bool类型的数组，当数字加进队列时将该数字下标改为真，出则改成否。

代码实现

#include<bits/stdc++.h>
using namespace std;
int a[1002];
bool b[1002];
int ans=0,l=0;
queue<int> q;
int main(){
	ios::sync_with_stdio(false);
	int m,n;
	cin>>m>>n;
	for(int i=0;i<n;i++){
		cin>>a[i];
	}
	memset(b,0,sizeof(b));
	for(int i=0;i<n;i++){
		if(b[a[i]]){
			continue;
		}
		if(!b[a[i]]){
			q.push(a[i]);
			l++;
			b[a[i]]=1;
			ans++;
		}
		if(l>m){
			b[q.front()]=0;
			q.pop();
		}
	}
	cout<<ans<<endl;
	return 0;
}

标签：翻译,NOIP2010,int,机器翻译,单词,查找,内存,P1540,软件
From： https://www.cnblogs.com/j1hx-oi/p/17756815.html

P1514 [NOIP2010 提高组] 引水入城
link搜索。首先先用\(dfs\)判断一下对于每一个点来说对应的可以覆盖的\(L,R\).假设题目一定存在一个解，所以一定会有该点覆盖的区间连续。设该区间为\(L,R\)，若不是每一个点均会被覆盖，那么题目不会存在任何一个解。判断是否有解：跑一遍\(dfs\)，记录每一个点被\(dfs......
机器翻译与数据集
importosimporttorchfromd2limporttorchasd2l#@saved2l.DATA_HUB['fra-eng']=(d2l.DATA_URL+'fra-eng.zip','94646ad1522d915e7b0f9296181140edcf86a4f5')#下载数据集#@savedefread_data_nmt(......
「NOIP2010」机器翻译题解
前言附加任务这道题也是一个简单模拟题。传送门解析这道题就是一个简单的模拟题，简单来说就是如果内存里面没有这个单词（其实是一个数）的话就从外存入队，如果内存容量不够，出队即可。对了，每次查询时还要计数噢！代码话不多说上代码#include<bits/stdc++.h>usingnamespacestd......
机器翻译 | Improving Neural Machine Translation Robustness via Data Augmentation
论文地址：https://arxiv.org/abs/1910.03009动机神经机器翻译(NMT)模型在翻译干净文本时已被证明是强大的，但它们对输入中的噪声非常敏感。改进NMT模型的鲁棒性可以看作是对噪声的“域”适应的一种形式。最先进的方法严重依赖于大量的反向翻译数据。最近创建的基于噪声文本的机......
机器翻译 | Improving Neural Machine Translation Robustness via Data Augmentation
摘要神经机器翻译(NMT)模型在翻译干净文本时已被证明是强大的，但它们对输入中的噪声非常敏感。改进NMT模型的鲁棒性可以看作是对噪声的“域”适应的一种形式。最近创建的基于噪声文本的机器翻译任务语料库为一些语言对提供了噪声清洁的并行数据，但这些数据在大小和多样性方面非常有......
机器翻译｜EMNLP 2019大规模利用单语数据提升神经机器翻译
目前，目标语言端的无标注单语数据已被广泛应用于在机器翻译任务中。然而，目标语言端的无标注数据一旦使用不当，反而会给模型结果带来负面影响。为了有效利用大规模源语言端和目标语言端的单语数据，微软亚洲研究院在EMNLP2019上发表的论文中，提出一种简单的语料数据使用流程，只需要四......
机器翻译 | Prompting Large Language Model for Machine Translation: A Case Study
题目：机器翻译的提示大语言模型:一个案例研究摘要对提示的研究表明，在很少甚至没有监督训练的情况下，提示在许多任务中表现出色。然而，文献中对机器翻译的提示还没有充分的研究。本文对翻译提示策略进行了系统的研究，考察了提示模板和示例选择的各种因素，填补了这一空白。我们进一步......
机器翻译 | 机器翻译评测指标
机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法进行评价，我们称其为机器翻译评测。事实上，在科学研究和工业界的任何一个领域，如果提出一个新的算法并声称其具有良好的性能，都需要使用某种通用的、被广泛承认的评价标准为这个算法“打分”。这个分数不仅要体现出......
肖桐、朱靖波-机器翻译统计建模与深度学习方法
分享一本由肖桐、朱靖波老师编著，东北大学自然语言处理实验室·小牛翻译联合出品的新书《机器翻译统计建模与深度学习方法》。本书中文编著，对机器学习相关历史和涉及知识进行详细、全面、深入讲解，非常值得深入阅读、学习。本书全面回顾了近三十年内......
口语机器翻译(ST)相关算法、论文、数据集、代码库等资源分享
本资源整理了口语自动翻译（SpeechTranslation,SpokenLanguageProcessing,NaturalLanguageProcessing）相关的经典端到端算法，经典论文，公开数据集，学术会议及代码库等资源。目录内容截图......