Print

基于美学评判的文本生成图像优化

论文摘要

在对抗生成网络(GAN)这一概念的诞生及发展推动下,文本生成图像的研究取得进展和突破,但大部分的研究内容集中于提高生成图片稳定性和解析度的问题,提高生成结果美观度的研究则很少。而计算机视觉中另一项经典的课题——图像美观度评判的研究也在深度神经网络的推动下提出了一些成果可信度较高的美观度评判模型。本文借助美观度评判模型,对实现文本生成图像目标的GAN模型进行了改造,以期提高其生成图片的美观度指标。首先针对StackGAN++模型,通过选定的美观度评判模型从美学角度评估其生成结果;然后通过借助评判模型构造美学损失的方式对其进行优化。结果使得其生成图像的总体美学分数比原模型提高了3. 17%,同时Inception Score提高了2. 68%,证明所提方法具有一定效果,但仍存在一定缺陷和提升空间。

论文目录

  • 1 相关工作
  •   1.1 美观度评判模型
  •   1.2 文本生成图像GAN
  • 2 StackGAN++的美学质量分析
  •   2.1 测试数据集生成结果的美观度分布
  •   2.2 固定文本批量生成图像结果的美观度分布
  • 3 基于美学评判的图像生成优化
  • 4 实验与性能评估
  • 5 结论
  • 文章来源

    类型: 期刊论文

    作者: 徐天宇,王智

    关键词: 文本生成图像,对抗生成网络,美观度评判,美学损失

    来源: 北京航空航天大学学报 2019年12期

    年度: 2019

    分类: 工程科技Ⅱ辑,哲学与人文科学,信息科技

    专业: 美学,计算机软件及计算机应用

    单位: 清华大学计算机科学与技术系

    基金: 国家自然科学基金(61872215,61531006)~~

    分类号: B83-0;TP391.41

    DOI: 10.13700/j.bh.1001-5965.2019.0366

    页码: 2438-2448

    总页数: 11

    文件大小: 5271K

    下载量: 135

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/7877a361fa71b783c280c261.html