设计行业革命性创新！文字转矢量图开源工具NeuralSVG

矢量图形是设计中不可或缺的工具，它让艺术家能够创作出分辨率无关且易于编辑的视觉内容。最近，视觉语言模型和扩散模型的进步让“文字生成矢量图”成为热门话题。然而，现有的方法往往面临两个问题：要么生成的结果过于复杂和臃肿，要么忽略了矢量图核心的分层结构，导致实用性大打折扣。针对这个问题，特拉维夫大学提出了一种叫 NeuralSVG 的方法，这是一种用隐式神经网络生成矢量图形的技术。受 NeRF（神经辐射场）启发，NeuralSVG 将整个场景信息编码进一个小型 MLP（多层感知机）网络的权重中，并通过 SDS（得分蒸馏采样）优化。为了让生成的矢量图具有更好的分层结构，引入了一种基于 dropout（随机失活）的正则化技术，使每个形状都更有独立的意义。用户可以在生成结果的基础上，根据自己的需求实时修改矢量图，而无需重新训练模型。NeuralSVG 在生成结构化、灵活的矢量图方面，比现有方法表现更出色。

01 技术原理

—

通过学习一种隐式神经表示，实现了从文本提示生成矢量图形的功能。具体来说，将 SVG 的信息编码到一个小型 MLP（多层感知机）网络的权重中，并使用 得分蒸馏采样（SDS） 进行优化。为了促进生成结果的有序性，引入了一种基于 dropout（随机失活） 的技术，鼓励每个生成的形状在整体场景中具有清晰且有意义的角色。

此外，这种神经表示方法还支持 推理时的动态控制，例如，可以实时调整生成 SVG 的配色方案或长宽比例，而这一切都基于单一的学习表示完成。

用户可以通过指定所需的背景颜色来调整生成 SVG 的配色方案。在每次训练步骤中，会采样一个以 RGB 值表示的背景颜色。这个采样的背景颜色会经过位置编码函数处理，并作为附加输入，与形状索引的编码一起提供给 MLP 网络。在渲染时，这个采样的背景颜色也会传递给渲染器，以生成带有该背景的 SVG。采样的颜色可以来自一组预定义颜色，或者是随机生成的 RGB 值。

THE END

AI资讯