报告题目 |
跨模态图像生成 |
报 告 人 |
鲍秉坤,南京邮电大学,教授、博士生导师 |
报告时间 |
2024年12月1日(星期天)上午10:10-10:40 |
报告地点 |
方远雪缘园比分直播大饭店天韵A |
报 告 内 容 简 介 |
报告内容简介: 近年来跨模态图像生成在图像生成、图像编辑等任务中取得了广泛应用。尽管现有研究在生成图像的质量方面取得了一定的进步,但生成图片的速度较慢,且对硬件需求较高。这主要归因于当前预训练生成模型具有庞大的参数规模,生成过程高度复杂,每个生成步骤都需要进行大量计算,从而导致整个生成过程耗时相当长。这一缺陷使得模型训练成本极高,同时也提高了用户的硬件和时间成本。本报告将首先介绍近期跨模态图像生成任务的研究进展,从提高预训练GAN模型生成质量且保证生成速度的角度出发,介绍团队在文本生成图像任务的研究思路和研究成果,最后探讨如何使用大规模预训练多模态模型优化文本到图像生成任务。
报告人简介: 鲍秉坤,南京邮电大学计算机学院、软件学院、网络空间安全学院副院长(主持工作),教授、博士生导师。国家杰出青年基金获得者、江苏省杰青、江苏省双创人才。研究方向为多媒体计算、社交多媒体、计算机视觉、人工智能等。先后主持多项国家和省部级项目,包括国家重点研发计划:科技创新2030-人工智能重大专项、国家自然科学基金重点项目、国防科技173计划技术领域基金项目、江苏省重点研发计划等。荣获2018年度电子学会科学技术(自然科学类)一等奖。荣获多媒体领域的ACM汇刊TOMM 2016年度最佳论文奖、IEEE MM 2017年度最佳论文奖、Multimedia Modeling 2019年度最佳论文Runner Up奖。荣获ICME 2020 Outstanding Areas Chair。 |
承办学院 |
电子与信息工程学院 |
发布日期 |
2024-11-26 |
欢迎广大教师、学生参加! |