金融界2023年12月6日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“一种文生图模型的训练方法、装置、设备及存储介质“,公开号CN117173504A,申请日期为2023年8月。
专利摘要显示,一种文生图模型的训练方法、装置、设备及存储介质,涉及人工智能;基于图文样本对训练集,对待训练文生图模型执行迭代训练,获得目标文本生模型;一次训练过程中:从图文样本对训练集中选取图文样本对,图文样本对包括样本图像和描述文本,样本图像中包括至少两个物体;获得至少两个物体各自对应的掩码图像及关联的物体类名,掩码图像用于区别物体在样本图像中的位置区域;将样本图像以及描述文本,输入待训练文生图模型,获得样本图像的图像预测噪声,将至少两个掩码图像以及关联的物体类名,输入待训练文生图模型,获得至少两个掩码图像各自关联的物体预测噪声;基于图像预测噪声和物体预测噪声构建的损失函数,对待训练文生图模型进行调参。
本文源自:金融界
作者:情报员
文章版权声明:除非注明,否则均为杭州车汇原创文章,转载或复制请以超链接形式并注明出处。