GPT-4 所采用的「预测下一个词」模式,存在着明显的局限性:模型缺乏规划、工作记忆、回溯能力和推理能力。
由于模型依赖于生成下一个词的局部贪婪过程,而没有对任务或输出的全局产生深入的理解。因此,GPT-4 擅长生成流畅且连贯的文本,但不擅长解决无法以顺序方式处理的复杂或创造性问题。
比如,用范围在 0 到 9 之间的四个随机数进行乘法和加法运算。在这个连小学生都能解决的问题上,GPT-4 的准确率仅为 58%。
当数字在 10 到 19 之间,以及在 20 到 39 之间时,准确率分别降至 16% 和 12%。当数字在 99 到 199 的区间时,准确率直接降至 0。
然而,如果让 GPT-4「花时间」回答问题,准确率很容易提高。比如要求模型使用以下提示写出中间步骤:
116 * 114 + 178 * 157 = ?
让我们一步一步思考,写下所有中间步骤,然后再产生最终解。
此时,当数字在 1-40 的区间时,准确率高达 100%,在 1-200 的区间时也达到了 90%。
标签:GPT4,模型,准确率,GPT,局限性,区间 From: https://www.cnblogs.com/end/p/17406841.html