feidan的头像-
管理员
这家伙很懒,什么都没有写...
DeepSpeed:所有人都能用的超大规模模型训练工具-

DeepSpeed:所有人都能用的超大规模模型训练工具

DeepSpeed是一款由微软开发的开源工具,旨在让所有人都能轻松训练超大规模的深度学习模型。本文将详细介绍DeepSpeed的特点、优势及其在模型训练中的应用前景。
3个月前
05610
哈工大发布“珠算”代码大模型-

哈工大发布“珠算”代码大模型

哈尔滨工业大学发布了名为“珠算”的代码大模型,旨在提升代码生成和优化的能力。本文将详细介绍“珠算”的特点、应用场景及其在编程领域的潜在影响。
3个月前
0409
因克斯ENCOS完成数千万元天使轮融资,绿洲资本领投-

因克斯ENCOS完成数千万元天使轮融资,绿洲资本领投

因克斯ENCOS近日完成数千万元的天使轮融资,由绿洲资本领投。本文将详细介绍此次融资的背景、公司的技术优势及其未来发展规划。
3个月前
0499
复旦&百度又一力作!可生成一小时高清4K视频,音频驱动视频生成开源项目Hallo2-

复旦&百度又一力作!可生成一小时高清4K视频,音频驱动视频生成开源项目Hallo2

复旦大学和百度联手推出开源项目Hallo2,能够生成长达一小时的高清4K视频,通过音频驱动视频生成。本文将详细介绍这一创新技术及其在视频生成领域的应用前景。
3个月前
0295
微软开源,CPU推理100B模型,速度飞起~-

微软开源,CPU推理100B模型,速度飞起~

微软开源了一项新技术,能够在CPU上高效推理100B规模的模型,显著提升了推理速度。本文将详细介绍这一技术突破及其对人工智能领域的重大影响。
3个月前
0497
颜水成袁粒提出新一代MoE架构:专家吞吐速度最高提升2.1倍!-

颜水成袁粒提出新一代MoE架构:专家吞吐速度最高提升2.1倍!

颜水成和袁粒提出的新一代MoE(Mixture of Experts)架构,显著提升了专家的吞吐速度,最高可达2.1倍。本文将详细介绍这一创新技术及其在人工智能领域的应用前景。
3个月前
03415