简介
我开始尝试各种受 Pokémon 启发的猫名变体,试图赋予它独特、略带神秘感的氛围。在尝试了“ Flarefluff ”和“ Nimblepawchu ”等名字后,我突然想到:为什么不完全使用人工智能,让字符级语言模型来处理这个问题呢?这似乎是一个完美的小项目,还有什么比创建自定义 Pokémon 名称生成器更好的方法来深入研究字符级模型呢?
在大型语言模型 (LLM) 和生成式 AI 的复杂背后,隐藏着一个出奇简单的核心思想:预测下一个字符。就是这样!每一个令人难以置信的模型——从对话机器人到创意作家——归根结底都在于它们对下一步的预测有多好。LLM 的“魔力”是什么?它在于它们如何改进和扩展这种预测能力。所以,让我们剥去炒作的外衣,直奔本质。
在本指南中,我们不会构建具有数百万个参数的大型模型。相反,我们正在创建一个可以生成 Pokémon 风格名称的字符级语言模型。这里有一个转折点:我们的数据集很小,只有801 个 Pokémon 名称!到最后,您将了解语言建模的基础知识,并拥有自己的迷你 Pokémon 名称生成器。
以下是每个步骤的结构,以帮助您跟进:
目标:快速概述我们要实现的目标。
直觉:基本思想——这里不需要编码。
代码:逐步的 PyTorch 实现。
代