一、了解机器翻译
在运行task1时,我仅仅只是按照教程一步步走下去,不理解每一步的意义,也不懂什么叫做机器翻译。于是在task2中碰了壁。
1.机器翻译的含义
机器翻译(MT)是自然语言处理领域的一个重要分支,其目标是将一种语言的文本自动转换为另一种语言的文本。机器翻译的发展经历了从基于规则的方法、统计方法到深度学习方法的演变过程。
2.机器翻译的发展
当前,机器翻译正朝着更加智能化和个性化方向发展。一方面,结合上下文理解、情感分析等技术,提高翻译的准确性和自然度;另一方面,通过用户反馈和个性化学习,提供更加符合用户需求的翻译服务。同时,跨语言信息检索、多模态翻译等新兴领域也正在成为研究热点。
总的来说,机器翻译的发展历程是从规则驱动到数据驱动,再到智能驱动的过程,反映了自然语言处理技术的进步和应用需求的变化。
二、我在执行任务中遇到的困难
1.语言包下载失败
首次失败是因未正确配置环境,重复阅读步骤后,经过大佬的指导学会了配置环境的方法。
第二次失败,经过查找发现是计算机性能不够,调模式后经过一段时间正常下载了语言包。
2.脚本无法正常运行
配置好环境后,未经历预处理的数据一直运算不出结果。
第一步 减少了采样训练集的数量数据运算难度减小,控制在计算机算力范围内
第二步 调小batch-size
提供更频繁的权重更新,使模型更快地收敛;较小的batch-size提供了一种隐式的正则化效果,使模型有更好的泛化能力,还有了更大的梯度噪声,帮助模型跳出局部最优解,最终运算出正确的结果。
标签:task2,运算,AI,batch,机器翻译,语言包,Datawhale,size From: https://blog.csdn.net/2302_79354115/article/details/140553462