发布时间:2025-03-03 11:49:57 点击量:
HASH GAME - Online Skill Game GET 300
31.对于以图搜图场景来说,匹配效果和计算效率同等重要。对于一些简单场景,传统的非深度学习模型已经可以达到较好的效果,且计算效率远远优于深度学习模型,硬件资源的要求也大大降低。本技术实施例通过评测的自动化实现了对最优模型的搜索,合理选择手工特征模型和深度学习神经网络模型。同时,将图片匹配过程和指标评测过程进行集成,将图片标定以可视化的方式暴露给用户,用户仅需要提供数据和点击鼠标即可快速完成模型的选择和测试。
32.在以图搜图的业务场景中,需要匹配的图片类型往往会随着时间的推移发生变化。在实际使用的过程中,也会产生新的需求。例如,在文化娱乐社交场景下,需要避免字幕、贴图等内容的影响,在交通安全领域,需要避免季节、天色带来的图片画面变化噪声的影响,在安防领域,需要避免图片质量和图片模糊的影响等。这种需求的变化是不确定的,且经常发生。在涉及到公共安全或者商业机密的领域,模型需要在当地的生产环境下重新训练和部署。本技术实施例通过参数面板的方式,将各种图片变化噪声和扰动进行抽象和
33.另外,在通常情况下,训练模型时需要提前准备好全量的训练数据。数据准备和训练过程是割裂的。对于以图搜图级别的模型训练,往往需要大量的数据来支撑,给硬盘存储资源带来很大的压力。本技术实施例通过在线训练的模式,只需要提供有限的初始种子数据,新数据的生成只存在于产生训练图片batch的过程中,加载在内存或者显存中,更新完训练权重之后,即被销毁。在线训练的方式,既保证了训练数据的规模和多样性,也保证了对硬盘资源的消耗保持在初始种子数据的量级,实现基于少量物理存储的模型在线.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的图片搜索模型的选择方法进行详细地说明。
57.本实施例中,指标评测用于判断模型是否符合用户需求。用户给出一个参考图片库,以及待检索图片集,系统将自动计算出每张图片特征编码,并给出每张待检索图片的前k个最匹配图片以及分数,如图2所示。当用户给出匹配关系的文本文件时,系统将自动算出各项指标;当用户未给定时,系统将可视化的给出每张待检索图片以及由系统计算得到的前k个匹配图片。对于每张待检索图片,用户对系统给出的k张候选图片进行标定,当第k张命中时,标定该图片。当k张图片无命中时,标定
本技术实施例将常见的图片变换方式均纳入到参数面板中,主要包括四种变换方式:图层覆盖、空间变换、像素抖动和颜色变换。图层覆盖下包含两种操作形式,分别为文本覆盖和图片覆盖;空间变换下包含七种操作方式,分别为裁剪、旋转、水平翻转、竖向翻转、填充、长宽比和透视变化;像素抖动下包含五种操作形式,分别为模糊、编码压缩、锐化、马赛克化、像素洗刷;颜色变换下包含四种操作方式,分别为亮度、饱和度、对比度和灰度。对于每种操作方式,均可以设置一个出现概率值,介于0-1之间;对于有参数区间的操作方式,还可在参数面板上设置参数的变化范围,通常以最大值和最小值的形式设定,在真正生成数据时,选用的参数为介于最大值和最小值的变化随机值。
数据。在通过参数面板确定参数后,对模型进行训练更新。在一般情况下,训练数据需要全量地存储在硬盘上。对于以图搜图这种业务,数据量通常在几百g左右以上。当需要在项目地进行训练时,对硬盘资源等要求很高。本技术实施例采用图片数据在线生成的方式进行训练,如图5所示,新生成的训练数据不保存在硬盘,而只存在于内存或显存中用于训练。系统中预置了初始的种子图片1万张,这1万张图片存储在硬盘上。在训练过程中,一个批次的训练图片被分成两部分,
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。