矢量图形是设计中不可或缺的工具,它让艺术家能够创作出分辨率无关且易于编辑的视觉内容。最近,视觉语言模型和扩散模型的进步让“文字生成矢量图”成为热门话题。然而,现有的方法往往面临两个问题:要么生成的结果过于复杂和臃肿,要么忽略了矢量图核心的分层结构,导致实用性大打折扣。针对这个问题,特拉维夫大学提出了一种叫 NeuralSVG 的方法,这是一种用隐式神经网络生成矢量图形的技术。受 NeRF(神经辐射场)启发,NeuralSVG 将整个场景信息编码进一个小型 MLP(多层感知机)网络的权重中,并通过 SDS(得分蒸馏采样)优化。为了让生成的矢量图具有更好的分层结构,引入了一种基于 dropout(随机失活)的正则化技术,使每个形状都更有独立的意义。用户可以在生成结果的基础上,根据自己的需求实时修改矢量图,而无需重新训练模型。NeuralSVG 在生成结构化、灵活的矢量图方面,比现有方法表现更出色。
01 技术原理
—
通过学习一种隐式神经表示,实现了从文本提示生成矢量图形的功能。具体来说,将 SVG 的信息编码到一个小型 MLP(多层感知机)网络的权重中,并使用 得分蒸馏采样(SDS) 进行优化。为了促进生成结果的有序性,引入了一种基于 dropout(随机失活) 的技术,鼓励每个生成的形状在整体场景中具有清晰且有意义的角色。
此外,这种神经表示方法还支持 推理时的动态控制,例如,可以实时调整生成 SVG 的配色方案或长宽比例,而这一切都基于单一的学习表示完成。
用户可以通过指定所需的背景颜色来调整生成 SVG 的配色方案。在每次训练步骤中,会采样一个以 RGB 值表示的背景颜色。这个采样的背景颜色会经过位置编码函数处理,并作为附加输入,与形状索引的编码一起提供给 MLP 网络。在渲染时,这个采样的背景颜色也会传递给渲染器,以生成带有该背景的 SVG。采样的颜色可以来自一组预定义颜色,或者是随机生成的 RGB 值。
暂无评论内容