网站首页
编程语言
数据库
系统相关
其他分享
编程问答
芯穹
2024-11-13
一同掀起人工智能艺术新浪潮!无问芯穹即将出席2024东京ComfyUI全球社区峰会
2024-11-13
CVPR截稿倒计时|无问芯穹Infini-AI超级算力周延长
随着CVPR2025的投稿截止日期(11月14日)的临近,科研人员正全力以赴进行最后的冲刺。为了帮助大家轻松应对这一关键时刻,无问芯穹Infini-AI异构云平台特别延长了“超级算力周”活动,活动日期直至11月15日。现在,您只需支付每小时0.99元的优惠价格,即可享受到搭载4090显卡的高性能
2024-11-13
无问芯穹与清华、上交联合研究团队提出合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升
随着大语言模型在长文本场景下的需求不断涌现,其核心的注意力机制(AttentionMechanism)也获得了非常多的关注。注意力机制会计算一定跨度内输入文本(令牌,Token)之间的交互,从而实现对上下文的理解。随着应用的发展,高效处理更长输入的需求也随之增长[1][2],这带来了计算代价的挑战:注