今日 AI 热点资讯如下:
1. 10行代码让大模型数学提升20%,”野路子”研究谷歌也测上了
2024年8月24日,量子位报道了一项研究,通过不到10行代码的改进,大模型数学能力(GSM8k)提升了20%。这项名为最小p采样(min-p sampling)的方法,旨在平衡生成文本的连贯性和多样性。该方法已在Mistral-7B模型上取得成效,并在Llama3-70B上测试。min-p采样通过动态调整抽样阈值,平衡生成文本的连贯性和多样性。它引入了一个基础概率阈值p_base,与当前概率分布中最大的token概率p_max相乘,得到缩放后的绝对阈值p_scaled,从而控制采样池。这种方法在推理任务和数学类任务中表现出更好的稳定性,同时在创意写作中也能发挥创意。
信息来源:量子位
2. Transformer作者预警:只卖模型玩不过OpenAI
2024年8月24日,量子位报道了Transformer作者之一Aidan Gomez的采访。Aidan Gomez是Cohere公司的联合创始人兼CEO,他在采访中讨论了AI的发展趋势,包括模型性能提升的多种途径、只卖模型的局限性、AI创业公司的策略,以及对机器人领域的乐观预期。他强调,数据和模型创新比单纯依赖规模扩张更有效,而且数据质量对模型性能至关重要。Aidan Gomez还提到,合成数据市场将如何发展,以及AI如何增强人类能力而不是取代工作岗位。
信息来源:量子位
3. Meta 发布 Sapiens 视觉模型,让 AI 分析和理解图片 / 视频中人类动作
IT之家8月24日消息,Meta Reality实验室推出了Sapiens AI视觉模型,适用于二维姿势预估、身体部位分割、深度估计和表面法线预测等视觉任务。这些模型参数数量从3亿到20亿不等,采用视觉转换器架构,共享编码器但有不同解码器头。Sapiens模型可原生支持1K高分辨率推理,易于针对个别任务调整,展现出对野生数据的泛化能力。
信息来源:IT之家
4. Ideogram 倒逼 Midjourney“拔剑”,开放网页版后再向免费用户开放 AI 文生图提示词描述工具
IT之家8月24日消息,Midjourney感受到来自Ideogram的压力,开放了网页版,并推出了“Tools with the Lab”工具,向免费用户提供文生图试用额度。用户可以上传照片,工具会提供4种描述作为提示词,帮助创建类似图片。Midjourney是一款AI生成工具,适用于快速原型设计和创意探索。
信息来源:IT之家
5. Meta 研发新方法:整合语言和扩散 AI 模型,降低计算量、提高运算效率、优化生成图像 – IT之家
IT之家8月24日消息,Meta AI推出了Transfusion新方法,整合了语言模型和图像生成模型。Transfusion采用统一的Transformer架构,适用于所有模式,对文本和图像数据进行端到端训练。该方法在图像生成方面取得了与DALL-E 2相似的结果,同时还能处理文本,计算量减少,运算效率提高。
信息来源:IT之家
6. “国内首个能力追齐 GPT-4o 语音能力的模型”,心辰 Lingo 语音 AI 模型开放内测预约
IT之家8月24日消息,西湖心辰推出的心辰Lingo语音大模型是国内首个端到端语音大模型,已开启内测预约。该模型具备原生的语音理解、多种语音风格表达和语音模态超级压缩等特点,技术能力上追齐GPT-4o语音能力。
信息来源:IT之家
7. 亚马逊 CEO 安迪・贾西:AI 助手 Amazon Q 可节省约 4500 个开发人员一年工作量
IT之家8月24日消息,亚马逊CEO安迪・贾西表示,集成到内部系统的Amazon Q AI助手,通过新的代码转换功能,将应用程序升级到Java 17的时间从开发人员的50天左右缩短到了几个小时,节省了约4500个开发人员一年的工作量。Amazon Q是亚马逊推出的新型聊天机器人,旨在帮助企业和员工更好地利用AWS。
信息来源:IT之家
暂无评论内容