首页 > 其他分享 >学习随想:高维AI数据的训练和推理与一维数据的排序和查找

学习随想:高维AI数据的训练和推理与一维数据的排序和查找

时间:2025-01-05 20:00:46浏览次数:8  
标签:AI 随想 图灵机 一维 速度 排序 数据 高维

以下是看Attention Is All You Need这篇文章的一点随想。
说实话,我没看懂transformer是咋回事,但突然一个类比念头,让我感觉有点概念了,虽然所有的类比都是不完备的。
学习随想记录如下,仅供查考:

物理世界高维AI数据一维数据
物理对象n维矩阵向量,Word2vec一维数组
观察与实验数据采集与标注数据输入
学习模型训练排序
推理模型推理查找
大脑神经元运行原理transformer(用于训练与推理)比较函数(用于排序和查找)
知识简化、降维数据蒸馏剔除重复数据
输入知识训练用数据排序用数据
人脑训练后的数据(数字大脑)排序后的有序数据
已知世界的子集有限的训练用数据有限的排序用数据
无法言传身教的知识,语言的边界非完整高维数据非完整数据映射
学习知识的速度不同大模型的训练速度不同算法的排序速度
运用知识解决问题的速度不同大模型的推理速度不同算法的检索速度
概念抽象化的速度梯度下降的速度排序中某步的速度
概念理解偏差模型局部失真一维数据局部非单调有序

以下是一点随想:

  1. 未来大模型的创新和竞争,本质上等价于当年的排序算法的创新。
  2. 如何用严谨的数理逻辑去定量定性描述大模型算法需要数学专业人士去突破定义。
  3. 目前大模型竞争更侧重于工程实现,这种实现目前还带有一些迷雾中摸索的感觉。
  4. 维特根斯坦认为语言的边界就是思维的边界‌。同理,真实物理世界的数字化能力决定了AGI的能力上限
  5. 所以,不完备的数据映射决定了AGI永远无法完全替代人类,但是,AGI可以极大的帮助人类进化,能力上限难以估量。
  6. GPU等硬件扩展了图灵机的能力,相应的,可被处理的数据模型也变大了,这使得AGI有了实现基础。

以下是附加的一点概念(以前的一点理解或者随想):

真实物理世界与图灵机(一维数据处理等价于高维数据处理):
在这里插入图片描述
关于图灵机
可以理解为一个c函数 out function(int in, int * all_data){…}
all_data是当前图灵机的所有数据,对应无限长磁带及存储在磁带上的数据,当前数据状态q是Q状态集合中的一个元素(一个确定状态)
当输入数据int in进来时(图灵机中的in也存储在all_data中,且是下一个被读入的数据),图灵机就像一个函数function δ,δ(q,x)= (q’,x’,L)此处x等价in,L等价返回值out
在这里插入图片描述

标签:AI,随想,图灵机,一维,速度,排序,数据,高维
From: https://blog.csdn.net/weixin_43172531/article/details/144918568

相关文章

  • WSL Ubuntu clone仓库报错RPC failed; curl 56 GnuTLS recv error (-24): Decryption
    问题user@user:~/Work/1-2025/phxpaxos$gitclonehttps://gitee.com/tjopenlab/phxpaxos.gitCloninginto'phxpaxos'...remote:Enumeratingobjects:6410,done.remote:Countingobjects:100%(6410/6410),done.remote:Compressingobjects:100%(4006......
  • 时隔一个月,再次在 Arch Linux 上安装 HP LaserJet Professional P1106 驱动(关键错误 c
    省略了安装CUPS的过程。sudopacman-Shplippakku-Sgutenprint#也可以是yayhp-setup-i#此时出现cupsextnotfound错误,解决方案见“cupsext解决”hp-setup#失败sudopacman-Scupssudosystemctlstartcupssudosystemctlenablecupssudosystemctlst......
  • 【零基础到精通】AI大模型技术基础学习路线:掌握必备能力,轻松成为大模型专家!
    “**大模型技术的基础学习,是未来在大模型领域能否站稳脚跟的关键**”随着大模型技术的发展,越来越多的人开始进入大模型领域,但大模型作为一门技术,因此它的本质上是一个工具,因此这也让学习大模型有了不同的学习方向。从工具的角度来看,学习一个工具主要有两个方向,一个是使......
  • 2025年程序员的副业机会:探索AI独立开发之路
    机会随着2025年的到来,我们迎来了一个前所未有的机遇——通过AI编程实现个人发展的飞跃。在硅谷著名投资人纳瓦尔的《纳瓦尔宝典》中,他强调了代码杠杆与媒体杠杆的重要性,指出这两者是普通人无需原始积累即可掌握的重要工具。如今,AI技术的普及让这一梦想触手可及,为追求时间自......
  • Agent智能体之:2025 一文掌握 AI Agent全部技术栈。
    AIAgent技术栈解析1、引言2、AIAgent2.1定义2.2核心特性3、从LLM到Agent:智能体的演进3.1大型语言模型(LLM)的突破3.2LLM的局限性3.3Agent的兴起4、Agent的核心技术栈4.1感知模块4.2认知模块4.3执行模块4.4学习模块5、Agent的四大关键因素5.1规划(Planning......
  • 博通带来业界首个3.5D F2F封装技术, 支持消费类AI客户开发下一代XPU
    博通(Broadcom)宣布,推出其3.5DeXtremeDimension系统级(XDSiP)封装平台技术。这是业界首个3.5DF2F封装技术,在单一封装中集成超过6000mm²的硅芯片和多达12个HBM内存堆栈,以满足AI芯片的高效率、低功耗的计算需求。 3.5DXDSiP是一种新颖的多维堆叠芯片平台,结合了2.5D技术和使......
  • AI应用平台搭建之旅(上) - 框架篇(附:AICon大会阿里国际Agent应用平台分享)
    前言LangEngine内源项目发起于阿里巴巴集团内部组织,LangEngine是类似LLM应用开发框架LangChain的纯Java版本。该框架现已正式对外开源:https://github.com/AIDC-AI/ali-langengine作为AI应用搭建平台核心架构师,这段时间一直专注于阿里国际APaaS平台以及AI基础设施建设,LangEngine......
  • Stable Diffusion&AI工具备份(25/1/5-01)
    StableDiffusion是一个基于AI的文本到图像生成工具,由StabilityAI开发。它利用扩散模型从文本提示生成高度详细的图像,其高效性和易用性使其在创意产业中迅速流行。该工具不仅推动了艺术和设计领域的创新,还在游戏开发、广告和教育等多领域展现出广泛应用潜力。随着技术的不断进......
  • 信息系统架构演化-AI业务逻辑智能体
    背景软件即服务应用(SaaS)的角色,不是作为企业运营的中心,而是作为由AI代理驱动的生态系统中的次要参与者这些业务逻辑将全部转移到这些AIAgent上,而这些Agent将是多仓库的CRUD,它们不会区分后端是什么。它们将会更新多个数据库,而所有的逻辑将集中在AI层。一旦AI层成为所有逻......
  • HackMyVM-Airbind靶机的测试报告
    目录一、测试环境1、系统环境2、使用工具/软件二、测试目的三、操作过程1、信息搜集2、Getshell3、提权使用ipv6绕过iptables四、结论一、测试环境1、系统环境渗透机:kali2021.1(192.168.101.127)靶 机:debian(192.168.101.112)物理机:win11(192.168.101.241)......