AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本图由Pixeling(千象)生成
本周,我们观察到以下AI领域的新动向和新趋势:
1.AlphaFold的精度进化到原子级别,除了蛋白质,核酸(DNA、RNA)也能分析。
2.DALL·E 3推出二次编辑功能,嵌入ChatGPT的DALL·E 3推出了一项名为「种子」的功能,允许用户对生成的图片进行后期精修,如添加元素、改变视角和调整光线等。
3.Anthropic一年内融资近70亿美元,它先后获得亚马逊和谷歌的40亿美元和20亿美元巨额融资,成为融资量和产品技术实力与OpenAI最接近的竞争对手。
人工智能产品和技术的新突破
1.DeepMind新一代AlphaFold登场,可预测几乎所有分子结构
DeepMind的AlphaFold再次进行重大更新,此前,它已经解析了几乎所有蛋白质,被视为蛋白质研究的里程碑。
新的AlphaFold可以预测几乎所有的分子结构,覆盖范围从蛋白质扩展到了其他生物分子,如配体、核酸(DNA和RNA)等,而且准确性大幅提升,达到原子级的预测精度。
DeepMind表示,这一技术进步将加速生物医学突破,为疾病研究、药物设计等提供新的可能性。AlphaFold的新模型标志着「数字生物学」时代的来临。
2.逼真到可怕!Runway的Gen-2史诗级更新,手搓4K好莱坞大片
Runway发布了Gen-2更新,提高了视频的清晰度和一致性,使得AI生成的视频与真实视频难以区分。
这一技术的进步不仅仅是技术上的突破,更预示着电影制作行业可能迎来重大变革。Runway的CEO Cristóbal Valenzuela宣称,传统的创意软件时代已经结束,新的时代已经到来。
这种进步为视频博主和内容创造者带来了福音,使得他们能够以更少的资源创造出更加逼真和高质量的视频内容。
3.支持二次编辑、导入虚拟引擎5,Stable Diffusion进化出3D生成功能
日前,Stability AI的Stable Diffusion平台从2D进化到了3D图像生成。
它的3D内容创建的新工具新工具和功能包括:Sky Replacer,允许用户更改原始照片中天空的颜色和美学效果;Stable 3D,用户可以选择图像、插图或编写文本来生成3D对象;Stable FineTuning,帮助用户微调图片、对象和风格,适应特定的用例。
Stable 3D模型基于Stable Diffusion和Objaverse-XL数据集,后者是全球最大的开源3D数据集之一。Stable 3D生成的3D对象可以进一步在3D工具如Blender和Maya中编辑,或导入到虚拟引擎5和Unity游戏引擎中使用。
4.Midjourney推出网页版和新功能Style Tuner,生成图像真实清晰
Midjourney近日进行了一次重大更新,将其服务完全迁移到浏览器上,用户不再需要通过Discord的复杂界面来使用Midjourney。
同时,Midjourney也推出了新功能Style Tuner,这一风格调谐器允许用户像调色一样混合和创造出各种图像风格,进一步扩展了创意的可能性。
除此之外,Midjourney还发布了新版本的4倍分辨率图像生成器,使得生成的图像更为清晰和真实。
5.DALL·E 3=Midjourney+PS?OpenAI悄悄推出「种子」功能,生图之后还能精修
OpenAI近期为DALL·E 3推出了一项名为「种子」的功能,允许用户对生成的图片进行后期精修,如添加元素、改变视角和调整光线等。
例如,用户可以在生成的图片中添加鹦鹉等元素。操作流程如下:首先生成图片,如“一个穿蓝色连帽衫的孩子盯着镜头”。接着,询问ChatGPT关于图片的「种子」信息。
有了种子后,就可以对图片进行修改,如“使用种子[1470033597]修改图像[1]:在她的肩膀上添加一只鹦鹉”。此外,用户还可以通过右键复制图片链接获取种子。
6.马斯克的𝕏AI首批产品曝光!「提示词工作站」来了
马斯克旗下的𝕏AI团队首批产品信息被曝光,其中包括Grok和PromptIDE两个项目。Grok涉及AI信息检索,而PromptIDE则被解释为“提示词工作站/集成开发环境”,或是利用AI开发软件的代码编辑器。
这些信息源自推特用户@Asuna Gilfoyle – e/acc的爆料,而马斯克本人在评论区的出现,没有对此进行否认,反而增加了消息的可信度。
马斯克曾透露,𝕏AI将使用推特数据进行训练,并与特斯拉合作开发软硬件,目标是在2029年实现全面的通用人工智能(AGI)。
7.ChatGPT上新文件分析、自动搜索等功能,初创公司的产品被取代?
OpenAI近期为ChatGPT Plus会员推出了新的测试版功能。这些功能主要包括上传和分析多模态文件,并且系统会根据上下文自动选择工具,如必应浏览、数据分析工具和DALL·E,而无需用户手动切换。
当文件输入到ChatGPT后,系统会消化文件内容,然后执行数据汇总、问题回答或根据提示生成数据可视化等操作。例如,有用户上传图像文件,使用ChatGPT视觉识别“参考图像”,并要求DALL・E 3基于其生成新图像。此外,还有用户测试了总结pdf文件、基于图像生成新图像、浏览器搜索数据并进行可视化等功能。
对于OpenAI的这次更新,有网友指出,这些新功能正是一些小型初创公司正在努力开发的产品功能。这使得初创企业面临巨大的竞争压力。
8.专攻芯片设计,英伟达推出定制版大模型ChipNeMo
英伟达展示了其专为芯片设计而定制的ChipNeMo大语言模型。与其他通用模型相比,ChipNeMo采用了多种领域适应技术,使其在芯片设计领域的性能得到显著提升。
研究结果显示,ChipNeMo不仅在设计任务中实现了出色的性能,而且其模型规模比其他模型小了5倍。
该模型在芯片设计的多个应用中都表现出色,如工程助理聊天机器人、EDA脚本生成和错误总结分析。
9.DeepMind新研究显示,决定模型性能的关键因素可能是算力、数据而非模型结构,LeCun怒赞
DeepMind的最新研究揭示,模型性能可能主要由训练计算量和数据决定,而非模型结构。在相同的计算量下,卷积神经网络(CNN)和视觉Transformers(ViT)的性能相当。
研究人员通过比较CNN和ViT在大规模图像识别任务上的表现得出此结论。
研究中,NFNet模型在ImageNet上的表现与ViT相当,证明了大规模预训练的CNN与ViT在性能上并无明显差异。
LeCun对此研究表示赞同,并评论说“Compute is all you need”。这意味着,决定模型性能的关键因素可能是算力和数据量,而不仅仅是模型结构。
10.vivo自研大模型/操作系统齐面世!蓝心大模型加持最新Origin OS 4
vivo近日发布了自研的通用大模型矩阵,共有5款模型,涵盖从10亿到1750亿参数。其中,7B版本将对外开源,成为首家开源大模型的手机厂商。
vivo还推出了两款基于大模型的产品:蓝心千询自然语言对话机器人和蓝心小V助手。蓝心小V助手内置于vivo新发布的OriginOS4,具有自然对话、意图理解、智慧搜索等功能。
此外,vivo还发布了蓝心千询APP,具有代码编写能力,将上线各大应用商城。vivo还宣布了自研操作系统蓝河(BlueOS),支持多模态交互、机器学习和自然语言处理技术。
11.阿里云通义“全家桶”来了,5分钟搞出大模型应用
在云栖大会上,阿里云更新了其通义大模型“全家桶”。其中,通义千问升级至千亿级参数2.0版本,基础性能超越GPT3.5,并逐渐追赶GPT-4。
此外,阿里云推出了智能编码助手“通义灵码”,能自动编写代码。例如,简单地告诉它“用Python写一个飞机游戏”,它可以迅速生成100+行代码。阿里云还公开了大模型应用的“秘籍”,使开发大模型应用变得更加简单。
阿里云CTO周靖人表示,阿里云已经从底层算力到AI平台再到模型服务进行了全栈升级,初步建成了AI时代的全栈云计算体系。阿里云还推出了一站式大模型应用开发平台—阿里云百炼,帮助开发者快速开发大模型应用。
12.正面硬刚OpenAI,智谱AI推出第三代基座模型,功能对标GPT-4V
智谱AI近期发布了自研大模型ChatGLM3,这不仅是底层架构的升级,在性能、推理能力和智能体能力上都有显著的提升。在50个大模型公开性能测评数据集中,ChatGLM3夺得了44个全国第一。
此外,它还在功能上直接对标了OpenAI的GPT-4V,包括代码解释器、搜索增强和图像解读等功能。智谱AI还宣布了对多个模型的开源,其中60亿参数的ChatGLM3-6B在多个数据集上均表现出色。
智谱AI CEO张鹏表示,开源模型已经获得了千万次的下载,这对于智谱AI在短短四个月内推出新一代基座模型起到了关键作用。
13.多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「啄木鸟」
近日,中科大等机构的研究者提出了首个多模态修正架构「啄木鸟」,旨在有效解决多模态大语言模型(MLLMs)输出的幻觉问题。
幻觉是指模型输出的描述与图片内容不相符,如描述了不存在的对象或错误的属性。这种问题对模型的可靠性产生了负面影响。传统的解决方法主要集中在对MLLM进行重新微调,但这种方法存在数据构建和训练的高开销。为此,研究者提出了「啄木鸟」架构,它是一个免训练、即插即用的通用架构,可以修正MLLM输出的幻觉。
该架构包括五个主要步骤:关键概念提取、问题构造、视觉知识检验、视觉断言生成和幻觉修正。实验结果显示,「啄木鸟」架构在多个MLLM上都实现了显著的性能提升,不仅提高了描述的准确性,还丰富了描述的细节。
人工智能初创公司的新融资
1.谷歌20亿美元砸向Anthropic:大模型军备竞赛升级
近日,谷歌宣布对Anthropic投资20亿美元,这是继亚马逊的40亿美元后,Anthropic获得的另一笔巨额融资,这使得它在一年内获得近70亿美元融资,仅次于OpenAI。
Anthropic是由OpenAI前研究副总裁Dario Amodei、GPT-3论文一作Tom Brown等人于2021年创立的生成式AI公司,总部位于加州旧金山。它的Claude直接对标OpenAI的GPT系列模型,而且其Claude 2在长文本处理能力上领先OpenAI。微软,谷歌,亚马逊等科技巨头对OpenAI和Anthropic等基础模型公司的巨额投资,显示出科技巨头在AI领域的军备竞赛日趋激烈。
2.斯坦福教授马腾宇创业,大模型方向,Manning、李飞飞等是顾问
官方网站:www.voyageai.com
清华大学2012届姚班校友、斯坦福大学助理教授马腾宇宣布创办Voyage AI,专注于构建嵌入/矢量化模型,旨在提升大语言模型(LLM)的检索质量。Voyage AI的团队由多名AI研究者组成,包括斯坦福大学教授(马腾宇)和MIT博士。
公司目标是提高RAG应用程序的效率,并提供定制服务,提升LLM产品的准确率10-20%。RAG,即检索增强生成,是一种聊天机器人设计模式,实时获取与查询相关的文档,并输入生成模型如GPT-4生成响应。Voyage AI发布了一种先进的嵌入模型和API,性能超过OpenAI。
Voyage AI的学术顾问包括斯坦福大学教授Christopher Manning、副教授Christopher Ré和首位红杉讲席教授李飞飞。Voyage AI还为编程和金融领域提供定制嵌入模型,并计划扩展到更多行业。马腾宇表示,已将价格降至与OpenAI ada相同,并将免费试用增至至少5000万tokens。
3.打造可定制DPU芯片的MangoBoost获得韩国风投IMM Investment等领投5500万美元A轮融资
官方网站:mangoboost.io
近日,MangoBoost获得由韩国风险投资公司IMM Investment和Shinhan Venture Investment共同领投的5500万美元A轮融资,韩国开发银行、KB Investment、香港IM Capital和Premier Partners参投。当前MangoBoost的估值约为3亿美元;累计融资6500万美元。
DPU让CPU或GPU从通信网络中释放出来,以帮助优化云和数据中心的工作负载,并通过减少更昂贵的GPU和CPU的工作负载来帮助降低成本。
MangoBoost进一步优化了此前的DPU解决方案,它表示当DPU与三星的Petabyte SSD存储系统结合使用时,其DPU可以实现比现有解决方案高出三倍的性能,并将CPU使用率降低高达95%。
英特尔、NVIDIA和AMD通常将其DPU作为配有自己统一开发的DPU芯片的PCIe卡提供。而MangoBoost产品的主要区别在于它提供了一组通用且可定制的DPU功能,可以无缝部署在现有基础设施上,并轻松地针对客户应用进行定制/优化。
MangoBoost首席执行官Jangwoo Kim在康奈尔大学获得了电气工程学士学位和计算机科学硕士学位,在卡内基梅隆大学计算机工程获得博士学位;现任首尔国立大学电气与计算机工程系的正教授,此前曾担任美国硅谷Sun Microsystems和Oracle Corporation的CPU/系统架构师。
4.多伦多大学教授创立的机器学习部署工具CentML获得NVIDIA等参投的2700万美元融资
官方网站:centml.ai
机器学习部署工具CentML获得2700万美元的新融资,Gradient Ventures、TR Ventures、NVIDIA和Microsoft Azure AI的VP参与其中。CentML于2022年完成了种子轮融资,这一轮融资属于种子加轮,这也使融资总额达到3050万美元。
随着生成式AI的繁荣和AI模型规模的不断扩大,GPU等AI算力硬件严重供应不足。据报道,NVIDIA性能最佳的AI算力卡将在2024年之前销售一空。而在现阶段,那些缺少算力的创业公司显然会遇到瓶颈,他们只能缩小模型规模(这牺牲了AI性能)或者模型的推理延迟更高(这影响用户体验)。
CentML旨在打造可以让AI模型在现有硬件上更高效运行的软件平台。据称,借助CentML的优化技术平台能够在不影响速度或准确性的情况下减少高达80%的费用。该平台尝试识别AI模型训练期间的瓶颈,并预测部署模型的总时间和成本。例如,CentML的一家客户公司通过其平台优化了他们部署在NVIDIA A10 GPU上的Llama 2模型,使其训练速度提高了3倍。
在优化了模型训练成本后,CentML计划将优化目标转移到AI模型的推理上,这显然在未来有更巨大和更持续的需求。
CentML由多伦多大学副教授Gennady Pekhimenko(CEO)在2022年与Akbar Nurlybayev以及博士生Shang Wang和Anand Jayarajan共同创立。他在卡内基梅隆大学计算机科学系博士毕业,曾任微软研究院系统研究组的研究员。
5.法律界的AI助理Eve获得Lightspeed参投的1400万美元种子轮融资
官方网站:www.eve.legal
Eve近期获得由Lightspeed Venture Partners和Menlo Ventures共同领投的1400万美元种子轮融资。它的主要产品使业内首个专注于法律行业的AI助理。
此前的AI法律公司主要专注替代或辅助法律工作的某个细分板块,例如合同审查,个人伤害等,而Eve则是一个综合性的AI助理,它可以自动执行文档审查、案例分析和法律研究等多种任务。它利用最新的大语言模型和法律领域的“技能数据库”,获得了在法律领域的通用处理能力,它可以当成一个完整的团队成员来用。
Eve的创始团队由Jay Madheswaran(CEO)、Matt Noe和David Zeng组成。Madheswaran曾是Lightspeed Venture Partners的早期投资人,也在人工智能和机器学习方面拥有超过 15 年的经验,Zeng拥有斯坦福大学的计算机科学硕士学位,这三位联合创始人也曾在Rubrik这家数据管理和数据安全公司共事。
6.法律AI创业公司LegalMation获得由Aquiline领投的1500万美元A轮融资
官方网站:www.legalmation.com
近日,法律AI创业公司LegalMation获得Aquiline Technology Growth领投的1500万美元A轮融资,REV、Motley Fool Ventures、Key Venture Partners、Quick Set LLC参投。
LegalMation专注于法律文件,它能够生成与律师/法律专业人士技能水平相当的法律文件草稿,让法律从业者只需在提交/送达文件之前进行少量编辑和基本审查即可。这能将处理此类工作的时间花费从一整天缩短到几分钟。
而且,LegalMation的分析解决方案可获取公司或律师事务所现存的所有数据(账单、案件结果等),并提供比以往的AI工具更深入的见解。
LegalMation由三位资深律师合伙人James Lee(CEO)、Thomas Suh(COO)和Enoch Liang(前任CSO)于2017年共同创立。James Lee是斯坦福大学的法律博士,也是LTL ATTORNEYS LLP律师事务所的联合创始人,Thomas Suh是LTL ATTORNEYS LLP律师事务所的资深合伙人,曾创立会计领域解决方案提供商SBSuite并担任CEO。
7.帮助医生写医疗文档的Abridge获得Spark Capital领投的3000万美元B轮融资
官方网站:www.abridge.com
近日,专注在医疗健康领域的AI公司Abridge获得由Spark Capital领投的3000万美元B轮融资,Bessemer Venture Partners、American College of Cardiology、SCAN Group、Kaiser Permanente Ventures、CVS Health Ventures等机构参投。目前Abridge的累计融资总额达到5750万美元。
Abridge开发的软件利用其专有的AI技术,自动将患者与临床医生的对话实时转换为结构化的临床笔记草稿。它能帮临床医生每天节省2小时以上的文档写作时间,让医生有更充沛的精力接诊更多病人。
在实际应用场景中,覆盖40余个专业领域的超过91%的临床笔记都是由Abridge软件独立起草的,临床医生基本不需要做任何输入。此外,Abridge的软件保证了客户的数据在静态和传输过程中都是安全的,从而提供完全的可审计性。
Abridge位于匹兹堡,由UPMC心脏病专家Shiv Rao(CEO)和两名卡内基梅隆大学研究人员Sandeep Konam(前任CTO)和Florian Metze于2018年创立。
8.人工智能合约系统提供商Arteria AI获得由GGV Capital U.S.领投的3000万美元B轮融资
官方网站:www.arteria.ai
近日,Arteria AI获得由GGV Capital U.S.领投的3000万美元B轮融资,Illuminate Financial、Information Venture Partners、BDC Capital和花旗银行参与投资。目前它的累计融资额达4090万美元。
资本市场的交易会产生大量文件,但是此前的自动化工具并没有很好的处理这些文件,大量有价值的数据被闲置。Arteria AI平台通过在文档生命周期开始时构建数据,消除了对传统手工流程的需求,在交易、贷款和资产管理等领域提升了速度和效率。
Arteria AI平台通过智能工作流工具显示数据和见解,形成了银行流程的文档层,并实现了数据和分析的实时流动,以高度直观的方式,加速所有利益相关者的决策过程。
Arteria AI由Shelby Austin(CEO)、Jonathan Wong(CTO)和Abrar Huq(CRO)联合创立,他们曾是在德勤的同事,并都从事AI方向。其中Shelby Austin是连续创业者,公司被收购后成为德勤高管,负责收购、风险投资和孵化,Jonathan Wong和Abrar Huq则分别是AI和法律方向的专家。
9.企业人工智能安全和信任软件Cranium获2500万美元A轮融资
官方网站:www.cranium.ai
人工智能安全和信任软件公司Cranium获得由Telstra Ventures领投,KPMG LLP和SYN Ventures参投的2500万美元A轮融资,它的累计融资达到3200万美元。
随着生成式AI的采用率逐渐提高,如何确保企业引入的AI解决方案可靠、安全地工作,并符合其运营所在地法律和规则是急需解决的问题。
Cranium是毕马威初创孵化器中第一个技术衍生产品,它的目标是让公司和组织能够安全的使用AI。Cranium提供围绕四个目标组织的多种产品和服务,包括:发现、监控、创建透明度、报告和合规性。它的Connectors能够实时监控AI在客户组织中的使用情况,另一项产品则是可以嵌入AI应用程序的安全软件评估工具。
Cranium的联合创始人包括Jonathan Dambrot(CEO)、Paul Spicer等。Jonathan Dambrot是前毕马威合伙人、第三方安全管理全球领导人,曾在第三方风险管理初创公司Prevalent担任CEO;Paul Spicer担任软件架构师和技术主管,拥有10多年的技术经验。
暂无评论内容