【51CTO晃荡】8.26 带你深度懂得清华大年夜学、搜狗基于算法的IT运维实践与摸索
你是否曾经为若何创作和编辑一篇图文并茂、排版精细的文┞仿而懊末路?或是为缺乏艺术灵感和设计思路而苦楚?AI技巧可否在艺术设计中赞助到我们?今天我们为大年夜家介绍的┞封篇论文,“Automatic Generation of Visual-Textual Presentation Layout”(图文排版的主动生成算法研究),方才被美国计算机学会会刊ACM Transactions>
图1 应用算法主动产生的图文排版效不雅。注:原始输入是一张纯图片(即没有任何文字)和一段纯文本(如编缉题和副标题等),输出是图文混排的结不雅(文字嵌入图片之中)。
这项研究精晓用的美学感知进行了体系的数学表达,构建了一套和主题相干的图文排版设计模版库,并提出一套可计算的图文合成框架原型,既融合了宏不雅层面自上而下的美学感知,又包含了微不雅层面自下而上的图文特点。经由过程融合人脸、文字检测以及视觉米锒裨检测算法,率先提出了视觉留意力检测算法,构成了整幅图像的重要性图和留意力争;在针对文字构造的算法中,这篇论文将文字块的外形和图像中的重要性图交互过程量化为一个能量最优化问题:
是图1中文本侵入明显视觉对象的成本,即尽量削减文本和重要视觉对象的交叉;
表示余暇视觉空间的浪费,即充分应用图像中的可用视觉空间,以最大年夜化文字的凸起效应;
而则代表文本块的语义重要性
i 和视觉感知重要性
i 之间的不匹配,即将最重要的文字内容匹配到图像中最重要的视觉区域,以便于浏览时快速获得关键信息。能量最优化的求解过程,在设计模版的美学感知原则的监督下,使得最后的求解结不雅能相符视觉审美需求,而不仅仅是计算机的最优求解结不雅。
在文本空间构造后,经由过程对图像前后景明显色彩的分析,在色彩调和最优化框架中,坚出色彩整体调和,并最大年夜化文字和配风景彩的差别以使得最后的图文混排能在全局尊敬原图的色彩调和性,又能在局部包管文字的可浏览性。全局色彩的调和计算采取了有名的“Color Harmonization”中提出的心理学色彩模型,并结合了这篇论文中提出的图像前后景主题色在不合主题下的模型偏好,大年夜而找到最合适的全局主题色。针对局部的视觉比较度最大年夜化,论文提出了最远色调角黄攫取样法,即找到文本覆盖背景下图像的明显色彩映射到tone和hue空间,在二维色调空间(tone, hue)求最远点,并取明显色彩获得最远点的黄金瓜分点。经由过程全部框架,能完成全部图文设计在美学感知监督下的主动化。
徐迎庆,前微软亚洲研究院主管研究察,清华大年夜学美术学院信息艺术设计系主任
这篇论文提出的体系许可用户上传具体主题的视觉背景图像以及一些文本语句。并在第二阶段对原始图像进行了处理,经由过程结号绫趋显值、脸部、文本以及眼光留意力争以获取视觉感知图,进而从新调剂图像的大年夜小,使之相符目标构造尺寸,并根据视觉感知图保存重要的区域。从新调剂过的图像就能用来分列空间分布的构造模板。当图像调剂后,已有的语句、空间构造以及文本就经由过程第三阶段中的能源竽暌古化工艺重叠在背景图像上了。在第四阶段的文本着色上,起首分析经由剪裁的图像的调色板,同时根据主题属性遴选主题色彩。应用特定色相/色调模型、调色板、语义色彩以及内容特点,就可以经由过程保持局部色彩调和以及局部可读性对文本进行从新着色。
图3 构造算法(a)带有眼光留意力(黄色)的视觉重要性图(灰色);(b)早年5个模板中遴选出的模板;(c)输入文本;(d)付梓法度榜样的细节,这里能源定义为E(L),经由过程迭代控制字体高度,在局部优化解决筹划中会被最小化,;(e)受到下向上的图像特点和自上向下的空间构造限制的付梓结不雅。
图2 体系框图

推荐阅读
【51CTO晃荡】8.26 带你深度懂得清华大年夜学、搜狗基于算法的IT运维实践与摸索据readwrite北京时光8月19日报道,2014年被谷歌收购的英国人工智能公司DeepMind,将新开辟一款人工智能体系,具有想象和懂>>>详细阅读
本文标题:MSRA获ACM TOMM 2017最佳论文:让AI接手繁杂专业的图文排版设计工作
地址:http://www.17bianji.com/lsqh/36822.html
1/2 1