节目背景信息
随着大语言模型变得指数级地更好,我们可以看到,垂直领域的AI Agent 将会是下一代价值十亿美元 SaaS 公司的关键。
在这期节目中,主持人与YC校友、Casetext 联合创始人兼 CEO Jake Heller 探讨了如何打造一家成功的垂直领域 AI公司,以及如何在这个过程中打破资深行业专家和围观者的质疑的故事。
在最初的 10 年里,作为一家法律科技公司,Casetext 从 0 发展到 1 亿美元的估值,而在 GPT-4 发布后的短短两个月内,公司估值达到了 6.5 亿美元,被 Thomson Reuters 收购。
Jake 是这一场生成式 AI 浪潮的先行者,同时在实战过程中积累了丰富的如何让 LLM 在垂直领域产生价值的经验,这次访谈他分享了很多自己在这个过程中的故事。
你可以收获的 3 个 take-away
1.垂直 AI 产品不仅仅是“GPT 套壳”,产品背后的工程问题、创始人对业务逻辑的理解、团队的独家数据等都可以成为产品的竞争壁垒。
2.作为创始人,如果要让团队相信你要转型的新方向,最好自己亲自下场做出一个惊艳的 Demo,用实际效果来打动大家。
3.经过测试,OpenAI 的 o1 模型能有效提高模型输出的准确率,这给不少垂直产品带来了很多新的机会。
因为感受到了 GPT 4 的强大而快速转换了业务方向
Casetext 的团队在很早的时候就与不同的研究实验室建立了密切的合作关系,这些研究实验室包括 OpenAI,所以他们很早就能够体验 GPT 4。
当时,OpenAI 和 Casetext 的团队签署了保密协议后,就把 GPT 4 开放给了他们,在 Casetext 团队体验了 48 小时以后,团队因 GPT 4 强大的性能而感到震撼,立即转变了业务方向,将 100% 的精力投入到了一款名为“CoCounsel” 的、基于 GPT 4 的新产品上。
为什么会开始做 Casetext这款产品?
Casetext 的创始人 Jake 自己曾经是一名律师,在他刚刚成为律师的那几年,法律行业的数字化程度非常低,为案件找参考资料的过程异常痛苦。
比如,你得阅读一些大公司公司中的所有电子邮件,看是否有潜在的欺诈行为;而如果你想找到对应的法律条文,你真的得去图书馆,翻开一本一本书,在阅读中查找你需要的信息……
后来,虽然有了网页和一些研究工具被开发出来,但它们非常笨拙,搜索效率仍然很低。
Jake 是一个有计算机背景的人,他很受不了这样的工作方式,所以他自己在律所工作时,会经常根据自己的业务痛点,开发一些像浏览器插件这样的小工具。
不过律所的人不太认可这种做法,律所的总顾问常常来质问 Jake 为什么要花费那么多时间在技术上,经常和 Jake 发生冲突。
当 Jake 为自己开发出了业务工具时,总顾问也会警告他说这些技术的归属权是律所,这让 Jake 很不满。
于是 Jake 出来创立了一家法律科技公司,公司从早期阶段开始,一直以来的使命就是将最好的技术带入法律领域。
Casetext 团队的 PMF 之路
在一开始,Jake 和他的团队试图做一个律师 UGC 平台,一个像维基百科、GitHub、Stack Overflow 那样的问答社区,来帮助律师之间互相帮助。
但是这个想法失败了,因为律师通常是按小时计费的,他们的时间非常宝贵,于是没有人愿意花大量的时间在这个平台上创作内容。
后来,Jake 将大量的时间和精力投入到了 AI 上,AI 能帮助律师们发现几个案例之间的相关性,从而更高效地获取信息。
律师只用上传和自己正在处理的工作相关的文件,AI 会读取这些内容,并且推荐相似的法律案例,从而给律师参考,让律师更加清楚自己手上的案子该如何处理。
这次转型是有价值的,但是只是简单改善了律师的工作流,只能算是个不错的渐进式创新,但依然没有在行业里掀起大的波澜。
Jake 的团队在推销产品时,常常会得到律师们这样的反馈:“我一年赚 500 万美元,我的工作是按照小时计费的,不想引入任何可能让我的生活变得更高效的东西,这些东西会增加我的学习成本,同时降低我的报价,所以我并不想改变我的工作方式。”
但后来,ChatGPT 出现了,突然之间,美国甚至全球的每个律师都意识到,AI 会对他们的工作产生巨大的影响,于是 Jake 的团队接到了大量的业务咨询,很多人和他们说,“我知道你们在做法律相关的 AI 产品,我感觉我们会需要这样的产品,你可以给我讲讲你们的产品吗?”
团队也很快拥有了很高的知名度,许多投资人邀请他们去高档餐厅吃饭,许多知名的杂志刊登了他们团队的案例,他们一下子因为做 AI 做得比较早而成为了明星团队。
由于在 GPT 4 发布前就开始准备 CoCounsel 这款法律 AI 产品,他们在那时候就已经建立起了产品和技术上的优势。
CoCounsel 在那时的产品形态是一个对话式的法律 AI 产品,你可以像与 ChatGPT 交流一样和他对话,并给它布置任务,比如可以让它帮你阅读 100 万份文件,看看里面是否有某家公司欺诈的证据,然后整理出一份摘要。当时,这样的产品交互方式很像给团队招了一个新的员工,而不是购买了新的产品,这极大地提高了他们的客户所在的律师事务所的人效,所以产品很快完成了 PMF。
如何践行“Founder Mode”,带领团队进行业务转型?
对于 Casetext 来说,一开始向 AI 转型是一个不小的挑战,作为一家经营了十年的企业,他们靠着之前的产品已经能够有 1000 万 到 2000 万美元的 ARR 了,并且还能保持 70% ~ 80% 的年增长率,所以并不是每个人都会那么热情地拥抱新方向。
作为“Fonder Mode”的践行者,为了让大家感受到新方向的价值,Jake 亲手写代码,做出了 CoCounsel 的第一个版本。
Jake 在一次高管会议上向高管、员工和部分客户演示了 CoCounsel 的产品功能,这次演示非常成功,在场的所有人都被这个新产品惊艳到了,从而认可了 Jake 对转型的看法。
开发 AI 产品的独特流程:测试驱动开发
在模型能力不够强时(比如大家只能用 GPT 3.5 时),Jake 的团队花了大量的时间在研究如何让模型的输出达到可用的程度。
虽然对于一个没有用过 ChatGPT 的人来说,对话式机器人的输出很惊艳,但是在面对专业人士时,ChatGPT 的输出虽然很有律师的风格,但是细看内容的话,会发现它还是在一本正经地胡说八道,会存在不少错误,这在法律领域是绝对不被允许的。
为了让它的输出能达到可以给用户交付的标准,这里面需要进行大量的“工作流拆解”、“分节点调优”的工作。
在这个过程中,团队发现了最高效的开发方式是“测试驱动开发”,即先测试出什么样的提示词和对话流程能够让 GPT 输出有用的内容,再围绕着这个流程开发产品功能。
在这样的流程里,如何为提示词添加示例、如何构建测试集数据很关键。
垂直 AI 产品如何构建竞争壁垒?
有的人会认为,这些所谓的“垂直 AI 产品”都是“GPT 套壳”,这类产品毫无壁垒。
而 Jake 根据自己的亲身经历,给出了不一样的看法:
当你真正尝试为客户解决问题,并实际完成工作时,你需要让自己的产品像一个优秀的年轻律师助理一样出色,才能让客户买单。
而为了实现这个目标,你需要拥有独家的数据集,比如法律行业的专业案例。
并且你需要解决很多软件工程的问题来让系统更稳定,更加用户友好,比如优化 OCR 功能,让它能够识别出法律文件里的手写内容和正确读取一些排版奇怪的内容。
你还需要足够了解法律行业的各种业务系统,以便于你的产品能更好地和客户原有的系统进行集成,从而降低客户的迁移成本……
这所有的一切,构成了你的垂直产品的竞争壁垒。
这个道理是通用的,因为所有的 SaaS 产品都可以看做是“SQL 套壳”,比如 Salesforce 本质上也只是将几个数据库连接了起来,并且根据用户不同的交互方式展示不同的数据,它的竞争壁垒在于产品背后的业务逻辑。
同样的,对于垂直 AI 产品来说,竞争力不必在 AI 上,也可以和 SaaS 产品一样,在于对行业和业务逻辑的深刻理解。
OpenAI 的 o1 模型如何给法律 AI 产品带来了新机会?
由于法律行业是一个对 AI 输出的准确性要求很高的行业,所以 Jake 的团队花了大量的时间在降低模型的输出幻觉上。他们试了很多方法,比如在提示词工程里添加足够专业的用例、优化搜索算法(把一次查询拆解成多轮查询)等。
OpenAI 发布了 o1 模型之后,他们对这个新模型做了很多详细的研究。
o1 是一个具有“慢思考”能力的模型,它不会像之前的 LLM 一样根据你的问题直接输出,而是会一步步拆解步骤,好好想想之后才回答你,所以 Jake 意识到,o1 模型在输出答案之前,可能自己会多做几轮检查。
团队给 o1 提供了真实的法律简报,并且悄悄修改了里面的一些细节,使这份简报变成一个有问题、不规范的法律简报,并让 o1 模型来判断这份简报里存在什么样的错误。
他们拿了好几个模型来做测试,其它的模型都回答说这份材料没问题,唯有 o1 在进行了复杂的思考之后,找到了这份简报里出现的问题。
这让他们感受到了思维链的强大之处,他们也开始了对思维链的探索,比如邀请全国最优秀的律师来分享自己解决复杂法律问题时的思考过程和工作流程,来获得更多这方面的训练数据。
Jake 对法律行业的 AI 落地非常乐观,他认为,从此以后,你不必再像他刚入行那样,花费大量的时间和金钱在一个地下室逐页阅读文档,而是真的有个 Agent 能和你一起进行战略性的智能思考,这不仅会让工作变得高效,也会让工作更有意思。
暂无评论内容