8月25日AI资讯：10行代码让大模型数学能力提升20%，Meta发布Sapiens视觉模型

今日 AI 热点资讯如下：

1. 10行代码让大模型数学提升20%，”野路子”研究谷歌也测上了

2024年8月24日，量子位报道了一项研究，通过不到10行代码的改进，大模型数学能力（GSM8k）提升了20%。这项名为最小p采样（min-p sampling）的方法，旨在平衡生成文本的连贯性和多样性。该方法已在Mistral-7B模型上取得成效，并在Llama3-70B上测试。min-p采样通过动态调整抽样阈值，平衡生成文本的连贯性和多样性。它引入了一个基础概率阈值p_base，与当前概率分布中最大的token概率p_max相乘，得到缩放后的绝对阈值p_scaled，从而控制采样池。这种方法在推理任务和数学类任务中表现出更好的稳定性，同时在创意写作中也能发挥创意。

信息来源：量子位

2. Transformer作者预警：只卖模型玩不过OpenAI

2024年8月24日，量子位报道了Transformer作者之一Aidan Gomez的采访。Aidan Gomez是Cohere公司的联合创始人兼CEO，他在采访中讨论了AI的发展趋势，包括模型性能提升的多种途径、只卖模型的局限性、AI创业公司的策略，以及对机器人领域的乐观预期。他强调，数据和模型创新比单纯依赖规模扩张更有效，而且数据质量对模型性能至关重要。Aidan Gomez还提到，合成数据市场将如何发展，以及AI如何增强人类能力而不是取代工作岗位。

信息来源：量子位

3. Meta 发布 Sapiens 视觉模型，让 AI 分析和理解图片 / 视频中人类动作

IT之家8月24日消息，Meta Reality实验室推出了Sapiens AI视觉模型，适用于二维姿势预估、身体部位分割、深度估计和表面法线预测等视觉任务。这些模型参数数量从3亿到20亿不等，采用视觉转换器架构，共享编码器但有不同解码器头。Sapiens模型可原生支持1K高分辨率推理，易于针对个别任务调整，展现出对野生数据的泛化能力。

信息来源：IT之家

4. Ideogram 倒逼 Midjourney“拔剑”，开放网页版后再向免费用户开放 AI 文生图提示词描述工具

IT之家8月24日消息，Midjourney感受到来自Ideogram的压力，开放了网页版，并推出了“Tools with the Lab”工具，向免费用户提供文生图试用额度。用户可以上传照片，工具会提供4种描述作为提示词，帮助创建类似图片。Midjourney是一款AI生成工具，适用于快速原型设计和创意探索。

信息来源：IT之家

5. Meta 研发新方法：整合语言和扩散 AI 模型，降低计算量、提高运算效率、优化生成图像 – IT之家

IT之家8月24日消息，Meta AI推出了Transfusion新方法，整合了语言模型和图像生成模型。Transfusion采用统一的Transformer架构，适用于所有模式，对文本和图像数据进行端到端训练。该方法在图像生成方面取得了与DALL-E 2相似的结果，同时还能处理文本，计算量减少，运算效率提高。

信息来源：IT之家

6. “国内首个能力追齐 GPT-4o 语音能力的模型”，心辰 Lingo 语音 AI 模型开放内测预约

IT之家8月24日消息，西湖心辰推出的心辰Lingo语音大模型是国内首个端到端语音大模型，已开启内测预约。该模型具备原生的语音理解、多种语音风格表达和语音模态超级压缩等特点，技术能力上追齐GPT-4o语音能力。

信息来源：IT之家

7. 亚马逊 CEO 安迪・贾西：AI 助手 Amazon Q 可节省约 4500 个开发人员一年工作量

IT之家8月24日消息，亚马逊CEO安迪・贾西表示，集成到内部系统的Amazon Q AI助手，通过新的代码转换功能，将应用程序升级到Java 17的时间从开发人员的50天左右缩短到了几个小时，节省了约4500个开发人员一年的工作量。Amazon Q是亚马逊推出的新型聊天机器人，旨在帮助企业和员工更好地利用AWS。

信息来源：IT之家

THE END

AI资讯