WordArtDesigner是一款基于gpt-3.5turbo的艺术字生成框架,旨在通过四个关键模块:LLM引擎、SemTypo、Styltypo和TextTypo,将用户的抽象概念转化为具体的设计。LLM引擎由gpt-3.5turbo驱动,解释用户输入,推动整个框架的智能生成过程。
SemTypo模块是WordArt Designer的核心之一,它运用语义概念来优化字体设计,实现在艺术转换和可读性之间的平衡。在SemTypo的基础上,StyTypo模块辅助生成更精细的图像,提升艺术字的表现力。而TextTypo模块通过纹理渲染,进一步创造性地生成纹理字体。这些模块的应用demo已上线至ModelScope创空间,涵盖文字变形和纹理渲染等相关模块。
技术架构图展示了WordArt Designer系统的四个关键模块,由大型语言模型(LLM)推动,例如通义千问。这推动了一个交互式、以用户为中心的设计过程。用户通过LLM引擎定义他们的设计需求,包括概念和领域,例如,“珠宝设计中的猫”。LLM引擎负责解析用户设计需求,生成提示词,指导SemTypo、StylTypo和TextTypo模块,执行用户设计愿景。 SemTypo模块根据LLM的提示创意词进行文字变形,涉及文字参数化、区域笔画选择、可微渲染等。 StylTypo模块基于语义变形后的图像生成更平滑、更丰富细节的图片。 TextTypo模块基于LLM的提示创意词进行文字纹理渲染,生成带纹理的创意艺术字。
为了实现自动化设计和提高最终图片质量,WordArt引入了一个质量评估反馈机制,确保进入纹理渲染模块的变形图片具有创意性、艺术表达能力和可扩展性。
文字纹理功能允许用户基于输入的纹理效果,对文字添加纹理,产生上了纹理的文字图片。用户可以通过两种方式产生输入文字图片:使用文字变形版块生成的变形文字图片,通过“为变形字增加纹理”将对应的图片发送至文字纹理版块,或直接输入文字内容并选择不同的字体。
WordArt Designer的应用已上线至ModelScope创空间,包括文字变形、文字纹理和创意文字生成三大功能。用户通过输入创意字即可得到推荐的文字变形和纹理创意,实现了艺术字的智能自动生成。这一框架有望推动艺术字设计领域的发展,为非专业设计师提供更加便捷、创造性的设计工具。