OmniSVG
OmniSVG

原始链接: https://github.com/OmniSVG/OmniSVG

OmniSVG是一个新颖的端到端多模态SVG生成器家族,它利用预训练的视觉语言模型(VLMs)。这篇最近发表在arXiv预印本上的论文详细介绍了该系统,它能够生成复杂且详细的SVG,从简单的图标到复杂的动漫人物。该项目于2025年4月9日与论文一起发布了MMSVG-Icon和MMSVG-Illustration数据集。OmniSVG建立在之前的作品IconShop的基础上,IconShop利用LLMs生成单色图标SVG,特别是采用了其参数化实现方法。同时进行的研究包括LLM4SVG,它专注于通过将SVG数据视为数字字符串来进行精确的坐标预测,以及StarVector,它集成了图像编码器和LLMs来进行图像到SVG的生成。OmniSVG提出了一种统一的SVG创建方法,通过先进的AI技术扩展了矢量图形生成可能性。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 OmniSVG (github.com/omnisvg) handfuloflight 40分钟前 9分 | 隐藏 | 过去 | 收藏 | 1条评论 mubou 31分钟前 [–] 我本来以为这是另一个垃圾的OpenAI前端,但它实际上是一个合法的机器学习项目!他们甚至为此训练了一个自定义模型。做得很好。我希望我们在HN上看到更多像这样的有趣的ML工作,而不是,你知道的,那些普通的AI垃圾。更多细节请访问https://omnisvg.github.io/不过,我想知道他们为什么推迟发布实际运行程序的代码。 回复 加入我们6月16日至17日在旧金山举办的AI创业学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系我们 搜索:

原文

OmniSVG: A Unified Scalable Vector Graphics Generation Model

OmniSVG is the first family of end-to-end multimodal SVG generators that leverage pre-trained Vision-Language Models (VLMs), capable of generating complex and detailed SVGs, from simple icons to intricate anime characters.

Demo GIF

Demo GIF

  • [2025/04/09] Release MMSVG-Icon and MMSVG-Illustration 🤗Dataset.
  • [2025/04/09] Upload paper and init project.
@article{yang2025omnisvg,
  title={OmniSVG: A Unified Scalable Vector Graphics Generation Model}, 
  author={Yiying Yang and Wei Cheng and Sijin Chen and Xianfang Zeng and Jiaxu Zhang and Liao Wang and Gang Yu and Xinjun Ma and Yu-Gang Jiang},
  journal={arXiv preprint arxiv:2504.06263},
  year={2025}
}

We thank the following excellent open-source works:

IconShop: is the first advanced work that leverages LLMs to generate monochrome, icon-level SVGs. We referred to its parametric implementation.

Here is the list of highly related concurrent works:

LLM4SVG: treats SVG coordinates as number strings and predicts decimal part for higher spatial accuracy.

StarVector: equips LLM with an image encoder for Image-to-SVG generation.

Star History Chart

联系我们 contact @ memedata.com