国产AI迎来新突破:智能助手支持200万字无损长文,引领文本处理新时代

IMG_256

” 一个有着超大‘内存’的智能助手,可以一口气读完二十万字的小说,还会上网冲浪。” 这是 Kimi Chat 官方对自家推出的智能助手的介绍。

3 月 18 日,月之暗面(Moonshot AI)宣布其旗下推出的智能助手 Kimi Chat 在大模型长上下文窗口技术上取得新的突破,目前已经可以支持 200 万字超长无损上下文,并宣布开启产品内测。

此消息一出立刻引起资本市场和 AI 界的关注,相关话题很快登上热搜,诸多网友前往 Kimi Chat 官网亲自体验,一度让 Kimi Chat 因为过于火爆而 ” 罢工 “。而此时,距离月之暗面第一次向世人介绍 Kimi Chat 这款 AI 长文本领域的突破性成果仅过去不到半年。

IMG_257半年内提升 10 倍,Kimi 开启千亿大模型长文本时代

2023 年 10 月 9 日,月之暗面向公众推出世界首个支持输入 20 万汉字的智能助手产品,这是月之暗面第一次在公众面前亮相,也是 Kimi Chat 的名字首次被公众听到。在此之后,月之暗面就渐渐淡出人们视野,只是在今年 2 月完成新一轮超 10 亿美元融资时才再度浅浅露个面。此时估计谁也未曾想到,一个月后这家 AI 新秀将再度爆出大惊喜,把 AI 长文领域赛道竞争的激烈程度 ” 自我内卷 ” 到难以企及的新高度。

相比于此前的 20 万字长文本上限,全新的 Kimi 智能助手支持文本上限的长度直接提升到原先 10 倍,而更大容量的长上下文处理能力无疑将帮助 Kimi 用户解锁更多新的使用场景,包括长篇文本的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解 API 开发文档等。

而除了长文本处理能力大幅提升之外,新的 Kimi 同样还强化了自身的上下文窗口和无损记忆功能以及多语言支持优势,这使得 Kimi 在联网搜索与信息搜集、数据处理、编写代码和模拟对话等多种使用场景中同样可以表现出色,也意味着国产 AI 在文本领域上或已超过海外顶尖水平。

” 过去要 10000 小时才能成为专家的领域,现在只需要 10 分钟,Kimi 就能接近任何一个新领域的初级专家水平。用户可以跟 Kimi 探讨专业领域的问题,让 Kimi 帮助自己练习专业技能,或者启发新的想法。” 月之暗面方面为此举例道:用户可以上传一份完整的近百万字中医诊疗手册让 Kimi 阅读学习,之后 Kimi 就可以针对用户提出的问题给出专业诊疗建议。

IMG_258

资本市场望风而动,新概念股流行

有趣的是,Kimi 升级的消息最先震动的并非 AI 圈,Sora 出世以来对 AI 市场风向敏感的资本市场反应迅速,抢先一步开始了狂欢,推动 Kimi 很快成为资本市场的新宠。

首先开始大涨的,是素有 A 股 ” 妖王 ” 之称的九安医疗。自 3 月 19 日起,九安医疗股价突然垂直起飞,从当日开盘的 41.96 元 / 股,在 4 个交易日内一度涨至最高 54.98 元 / 股,而原因仅仅是因为在去年 8 月时,九安医疗曾经投资过月之暗面。

3 月 20 日开始,与 Kimi 相关的概念股终于集体爆发,”kimi 概念股 ” 成为 A 股市场上冉冉升起的一个全新的概念,多家上市公司因此集体收益,其中包括华策影视、掌阅科技、中广天择等。根据一周牛熊股发布的 ” 本周涨幅最大个股 TOP10″,3 月 18 日到 3 月 22 日,华策影视股价一周大涨 95.41%,堪称 ” 最强 Kimi 概念股 “。

IMG_259

但 Kimi 概念股高歌猛进的势头并没能持续太久,多家股市在短期骤涨后就很快开始降温。25 日开始,中广天择收盘跌停,福昕软件、华策影视双双大跌,跌幅分别为 15.01%、12.93%;广宇软件、深信服、易点天下跌幅均超 10%,掌阅科技更是险些在短期内上演了一出 ” 天地板 “。开盘以来,掌阅科技一度实现 10 天 6 板,但很快股价就大幅剧震,收盘跌近 6%。

“Kimi 延续了人工智能领域的火热,因能与智能车等诸多产业结合,所以市场天花板很高。加上政策扶持,受资金青睐在意料之中。” 科技分析师赵松解释道:” 该板块的注意力一般聚焦在资金面和企业估值抬升上。券商炒热概念然后退出赚钱,导致该板块短期内出现较大的波动性。”

IMG_260旧赛道新高度,AI 长文本内卷升级

事实上,Kimi 主打的长文本赛道本身并不算是目前 AI 领域的 ” 潮流 ” 赛道,甚至在 Sora 推出之前,业内就有声音认为单一的大语言模型必将被淘汰,多模态转型才是未来趋势。但就是在这样的背景下,月之暗面依然将长文本大语言模型内卷到一个所有人都始料未及的新高度,让 AI 长文本再度成为一时热点。

无论走哪个赛道,只要做到业内顶尖就不怕没有市场。随着 Chat GPT 发布,AI 文本分析和生成就已经不再是什么稀奇事,日常的工作学习和生活中,不少人也已经逐渐习惯于利用 AI 助手处理文本,但自始至终,由于目前市面上主流的 AI 大模型产品在 promot 的输入上都存在字数限制,应用场景还是相当局限。

比如 GPT-3.5 上下文输入长度约在 1.6 万 token(token 即模型输入和输出的基本单位),GPT-4 在 3.2 万 token。把 token 量化成人类语言的话,3.2 万 token 的 GPT-4 达到了阅读一篇短篇小说的程度,但并不支持阅读长篇小说。

IMG_261

相比于同赛道的其他文生文大语言模型应用,Kimi 自诞生起的核心竞争力就聚焦于长文本分析联网搜索、文档处理等功能,在处理分析长文本材料,如厚重的学术文献、古籍之类,Kimi 的性能远超其他模型。因此 Kimi 的出现和突破可以说填补了目前 AI 文本处理方面的市场空白。

有用户实测了 Kimi 在长文本阅读上的表现,发现其在理解超长文本,比如小说和长篇文件上确实具有独到优势。输入一本长达 70 多万字的《红楼梦》,Kimi 只用耗时数秒就能给出一篇漂亮的总结报告。

但是旧赛道的内卷并没有被 Kimi 终结,反而很快卷出新高度。在 Kimi 宣布升级后,阿里和 360 在几日后就相继宣布自家 AI 助手将免费开放长文本功能。阿里旗下国产大语言模型通义千问预告即将免费开放 1000 万字的长文档处理功能,如果顺利问世就会成为全球文档处理容量第一的 AI 应用。360 更是在 23 号直接宣布其 AI 大模型智脑正式开启内测 500 万字长文本处理功能,并入驻 360AI 浏览器。

IMG_262
Kimi 让 AI 界再度聚焦大语言模型领域的蓝海商机,一批资本开始回流。” 随着竞争对手们相继发力长文本处理,Kimi 的差异化优势或将不会太突出。如果大家都宣布免费开放,企业们的盈利问题将日益严峻。” 赵松表示。

无损长文——通往通用人工智能的钥匙

通用人工智能(General Artificial Intelligence),是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。换言之,通用人工智能就是具有真正 ” 智能 ” 的人工智能,是几个世纪以来人工智能努力发展的最终方向。

即便当下现有的人工智能已经足以突破人类的固有想象,但实际上依然都停留在弱人工智能阶段,离真正的人工智能相差甚远。而无损的长上下文,就将会是走向通用人工智能的一个关键的基础技术。月之暗面创始人杨植麟表示:” 历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。”

IMG_263
时间回溯到 2022 年底,AI 界的 ” 破壁人 “ChatGPT 问世,相比以往 AI 产品,这款不仅可以流畅地与人类进行对话,还能够在这个过程中完成多项自然语言处理任务的大语言模型彻底打破人工智能局限于某一特定领域的桎梏,让人工智能摘下了 ” 人工智障 ” 的标签,为通用人工智能带来了曙光。而今天,Kimi 揭开 AI 大模型在长文本领域的高速发展序幕,强大的长文本处理能力必将使 AI 在知识获取、专业文档分析以及语义理解等更加复杂的任务上产生巨大的实用价值,拓展 AI 应用前景。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容