ChatGPT迎来自发布以来最重大的UI更新!OpenAI 刚刚发布了一个名为 Canvas 的全新交互界面,让你像使用 Word 和 VS Code 一样,与 ChatGPT 协同创作!
Canvas 是什么?
Canvas 是一个独立的窗口(感觉有点抄Claude的artifacts组件功能😄),你可以在里面和 ChatGPT 一起进行写作和编程项目,再也不用局限于聊天框了!它提供了一种全新的协作方式,让你和 ChatGPT 可以并排创建和完善想法,就像你和同事一起对着白板讨论一样!
Canvas 的亮点:
更好的协作: 你可以高亮特定部分,让 ChatGPT 知道你想要它关注哪些内容。ChatGPT 会像一个编辑或代码审查员一样,提供内联反馈和建议
更灵活的控制: 你可以直接在 Canvas 中编辑文本或代码,还可以使用快捷菜单让 ChatGPT 调整文本长度、调试代码等等。你还可以通过“后退” 按钮恢复到之前的版本
更智能的触发: Canvas 会在 ChatGPT 检测到它可以提供帮助的场景时自动打开。你也可以在提示中加入 “use canvas” 来打开 Canvas,并在其中处理现有项目
更丰富的快捷方式:
写作快捷方式:建议编辑、调整长度、更改阅读级别 (从幼儿园到研究生水平)、润色文字、添加表情符号
编程快捷方式:审查代码、添加日志、添加注释、修复错误、移植到其他语言 (JavaScript、TypeScript、Python、Java、C++ 或 PHP)
Canvas 是如何训练的?
OpenAI 使用 GPT-4o 和一些新颖的合成数据生成技术(例如从 OpenAI o1-preview 中提取输出)来训练 Canvas 模型,使其成为一个富有创造力的合作伙伴。Canvas 模型知道何时打开 Canvas,进行 targeted 编辑和完全重写,它还能理解更广泛的上下文,提供更精准的反馈和建议
为了支持 Canvas 的这些功能,OpenAI 的研究团队开发了以下核心行为:
• 触发 Canvas (用于写作和编程)
• 生成不同的内容类型
• 进行 targeted 编辑
• 重写文档
• 提供内联评论
OpenAI 还使用超过 20 项自动内部评估来衡量训练进度,并通过改进“正确触发器”,将写作和编程任务中正确触发 Canvas 的准确率分别提高到了 83% 和 94%
Canvas 的未来:
OpenAI 认为,让 AI 变得更有用、更容易访问,需要重新思考我们与 AI 的交互方式。Canvas 是一种全新的方法,也是 ChatGPT 自两年前发布以来的第一次重大视觉界面更新
Canvas 目前还处于早期测试阶段,OpenAI 计划快速改进它的功能
以下是OpenAI官宣全文:
一种使用 ChatGPT 进行写作和编程的新方式
我们推出了 Canvas,这是一个新的界面,旨在通过写作和编程项目与 ChatGPT 合作,超越简单的聊天功能。Canvas 会在单独的窗口中打开,让你与 ChatGPT 共同协作项目。这款早期测试版引入了一种全新的合作方式——不仅仅通过对话,还可以在旁边共同创建和优化想法。
Canvas 是基于 GPT-4o 构建的,用户可以在模型选择器中手动选择它进行测试。从今天开始,我们将逐步向 ChatGPT Plus 和团队用户推出 Canvas。企业和教育用户将在下周获得访问权限。当 Canvas 退出测试阶段时,我们还计划向所有 ChatGPT 免费用户开放
与 ChatGPT 更好的协作
人们每天都在使用 ChatGPT 进行写作和编程帮助。虽然聊天界面易于使用且适用于许多任务,但当你想进行需要编辑和修订的项目时,它显得有些局限。Canvas 为这类工作提供了一种全新的界面。
通过 Canvas,ChatGPT 可以更好地理解你想要完成的内容的上下文。你可以突出显示特定部分,明确指出你希望 ChatGPT 集中注意的内容。就像一名文稿编辑或代码审查员,它可以根据整个项目提供行内反馈和建议。
在 Canvas 中,你完全控制项目。你可以直接编辑文本或代码,还有一个快捷菜单,帮助你请求 ChatGPT 调整写作长度、调试代码以及快速执行其他有用操作。你还可以通过 Canvas 中的返回按钮恢复之前的工作版本。
当 ChatGPT 检测到某些情景可能需要 Canvas 时,Canvas 会自动打开。你也可以在提示中包含“使用 Canvas”,以打开 Canvas 并在现有项目上工作。
写作快捷方式包括:
建议编辑:ChatGPT 提供行内建议和反馈。
调整长度:编辑文档长度,使其变短或变长。
改变阅读水平:调整阅读水平,从幼儿园到研究生。
最后润色:检查语法、清晰度和一致性。
添加表情符号:添加相关表情符号以强调和增色。
在 Canvas 中编程
编程是一个迭代过程,在聊天中很难跟踪所有代码的修订。Canvas 使跟踪和理解 ChatGPT 的更改变得更容易,我们计划继续改善此类编辑的透明度
编程快捷方式包括:
审查代码:ChatGPT 提供行内建议以改进代码。
添加日志:插入打印语句,帮助你调试和理解代码。
添加注释:为代码添加注释,使其更易于理解。
修复错误:检测并重写问题代码以解决错误。
转换为其他语言:将代码翻译成 JavaScript、TypeScript、Python、Java、C++ 或 PHP。
训练模型成为协作者
我们训练了 GPT-4o,使其能够作为创意合作伙伴协作。该模型知道何时打开 Canvas、进行针对性编辑以及完整重写。它还理解更广泛的上下文,以提供精准的反馈和建议。
为了支持这一点,我们的研究团队开发了以下核心行为:
为写作和编程触发 Canvas
生成多样化内容类型
进行针对性编辑
重写文档
提供行内批评
我们通过 20 多项自动化的内部评估衡量了进展。我们使用了新颖的合成数据生成技术,如从 OpenAI o1-preview 中提取输出进行后训练,以针对这些核心行为进行模型优化。这种方法使我们能够快速解决写作质量和用户新互动方面的问题,而无需依赖人工生成的数据
一个关键挑战是定义何时触发 Canvas。我们教会模型为类似“撰写一篇关于咖啡豆历史的博客文章”这样的提示打开 Canvas,同时避免对类似“帮我做晚餐新菜谱”这种一般问答任务的过度触发。对于写作任务,我们优先改善“正确触发”,在此方面的正确率达到了 83%,相较于基础零样本 GPT-4o 的提示指令更高
值得注意的是,这类基线模型的质量对特定提示的敏感性非常高。使用不同提示时,基线可能仍表现较差,但表现形式有所不同——例如,在编程和写作任务上均不准确,从而导致不同的错误分布和其他形式的次优表现。对于编程,我们故意让模型偏向于避免触发,以免打扰高级用户。我们将继续根据用户反馈进行优化
第二个挑战是调节模型在触发 Canvas 后的编辑行为,尤其是决定何时进行针对性编辑,何时重写整个内容。当用户通过界面明确选择文本时,我们训练模型进行针对性编辑,否则偏向重写。随着我们对模型的优化,这一行为也在不断演变
最后,训练模型生成高质量的注释需要谨慎的迭代。与前两个案例不同,高质量注释的评估很难自动化,因此我们采用人工评估来评估注释的质量和准确性。与带有提示指令的零样本 GPT-4o 相比,我们集成的 Canvas 模型在准确性上提高了 30%,在质量上提高了 16%,表明合成训练相对于详细指令的零样本提示显著提高了响应质量和行为
未来展望
要让 AI 更加实用和易用,需要重新思考我们与其交互的方式。Canvas 是一种新的方法,也是自两年前我们推出 ChatGPT 以来的第一个主要视觉界面更新。
Canvas 仍处于早期测试阶段,我们计划快速提升其功能。
暂无评论内容