再见平面设计师COLE结合多个人工智能按需生成可编辑设计

“
COLE是一款潜力巨大的平面设计工具,能够通过输入文本提示生成高质量设计,具有可编辑文本和图像对象。虽然目前还不是成熟产品,但已在平面设计领域取得惊人成果,有望为非专业人士提供设计能力。然而,它也可能对现有平面设计软件公司构成威胁。COLE的未来发展备受期待。
据The Verge消息,一个名为COLE的新工具已经出现,似乎能够彻底改变平面设计领域。这个工具以亨利·科尔的名字命名,他被认为是1843年创造了第一张图形圣诞卡的创作者。COLE的研发团队由微软亚洲研究院和北京大学的12名研究人员组成,他们将多个人工智能模型组合而成,包括Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B(Llama的一个变种)、GPT-4V以及开源图形渲染器Skia。
COLE的独特之处在于它允许用户输入平面设计项目的想法,然后由人工智能生成图像,并嵌入相关的文本。尽管目前COLE更像是一个框架而不是成熟的产品,但它已经在平面设计领域取得了惊人的成果。用户只需输入文本提示,就像其他文本到图像生成器一样,COLE能够生成清晰、有组织的平面设计,将视觉与风格化文本相结合。
不仅如此,COLE生成的图像具有可编辑的文本块和图像内的可编辑对象,使用户可以在框架内轻松地更改文本、字体或添加不同的视觉元素,而无需导出到其他设计软件中。
研究人员在200个不同的平面设计项目上测试了COLE的表现,结果显示在某些方面,COLE甚至比DALL·E 3更具竞争力。尽管如此,COLE并不是平面设计的终结,因为它目前还不能允许用户更改文本排版的位置或同时使用多种文本颜色。不过,研究人员表示他们将在未来的工作中解决这些问题。
至于是否会威胁到平面设计师的工作,研究人员明确表示COLE是为了允许用户在需要时进一步完善输出,融入人类专业知识而设计的。平面设计培训仍然对于从COLE中获得最佳结果非常有用,因为通常需要高度专业知识来开发有效提示的平面设计生成任务。与其他文本到图像生成器相比,COLE能够在仅需要简单用户意图的情况下生成卓越质量的平面设计图像。
综合而言,COLE似乎是一种面向大众的平面设计工具,有望使没有平面设计培训或专业知识的人能够生成与经过培训的专业人士相媲美的高质量设计。不过,它也可能对一些现有平面设计软件公司构成威胁,或者在某些情况下成为它们的补充。目前,COLE尚未公开发布,但研究人员表示演示将很快在他们的Github项目页面上发布。这一工具的潜力和未来发展令人期待。

共有 0 条评论