- 2025年区块链技术在供应链管理中的创新实践:重塑信任与效率的未来趋势预测分析
- 新政倒计时引爆分布式光伏抢装潮 组件价格已连涨近一个月
- 华润电力(广东)能源服务有限公司广东省惠州市龙门县一期分布式光伏项目专业工程分包公告
- 偶数科技获分布式数据库专利技术突破引关注!
- 北京企业核心竞争力成果巡展 东方国信:CirroData 分布式数据库 为企业数字化转型构筑数字底座
联系人:王经理
手机:13928851055
电话:13928851055
邮箱:sgbwre@163.com
地址:广州市天河南一街14-16号华信大夏四楼
AI应用实例分析——图像检索
前一节主要跟大家讨论了文本纠错技术的应用,本节将跟大家讨论分享关于图像视觉方面的应用——图像检索。
在人工智能技术应用方面,图像视觉应该是被应用最广泛的技术之一,从最早的安防监控,到后面落地最多的人脸识别,都是图像技术的应用,本文想围绕图像检索技术的应用进行产品介绍。
图像检索技术在实际应用中包括了检索+识别(相似度度量)两个部分,目前重点应用于泛搜索引擎中,百度搜Kaiyun平台官方索、谷歌搜索、淘宝拍立淘等都可以支持通过图片检索实现信息查找。
相对于文字搜索而言,图像检索更直观,更易操作,尤其是对于陌生信息的检索,可以直接通过拍照实现信息的检索。
图像检索包括了基于文本的图像检索和基于内容的图像检索。基于文本的图像检索主要通过对图像进行文本描述,提炼关键词等标签信息,后续在进行检索时,可以通过检索关键词的方式查找对应的图片,这种方式跟用百度查找“胡歌”返回胡歌的照片是一致的;
基于内容的图像检索是通过提取图像的纹理、颜色、梯度或者其他高层语义特征等作为图像特征来计算图像间的相似度,实现图像检索。
如果需要高查准率,就需要精确的标签数据,而精确的标签数据对于人工标注来说是耗时耗力的,甚至有些图像很难用有限的关键词能描述清楚。目前通常情况下会先基于图像内容分析进行自动标注,然后只要存储图像和文本标签即可,虽然会降低查准率,但是仍然可以保证文本检索。
虽然搜索精度不一定如文本搜索,并且容易受到图像质量(光照、遮挡、背景复杂度等)的影响,但是对用户而言,搜索难度将降低,可以实现所见即所得,只要拍照出发搜索即可。因此,可应用范围将更加广阔。
除了关键的算法技术,还需要跟工程相关的分布式存储技术,因为在实际工程应用中,涉及到的索引结构需要支持到10亿量级的,所以如何构建并存储图片的特征索引信息,需要工程上进行优化(ps:由于过于技术化,笔者也不敢班门弄斧了)。
在实际应用中,基于文本和基于内容的图像检索一般是解耦的,产品设计可以选择两者并存,或者独立使用。
比如在电商中,淘宝通过知识图谱技术构建了大量的商品画像,所以用户可以通过文本搜索,同时拍立淘也支持图像搜商品;而某些识花等小软件则是单纯通过以图搜图实现。具体的还是需要产品根据实际应用场景来决定。
本文下面将重点介绍的是基于内容的图像检索,其中基于内容的图像检索,从产品的输入角度又可以分为以图搜、以视频搜和以音频搜,列举出来的话是图搜图、图搜视频、视频搜视频。
(2)本文选择图片库类的图片检索为应用场景,讲述产品设计中的业务流程和需要支持的产品能力,其中图片库类的图片检索应用场景有以下两个:
先确定应用场景不仅是为了便于产品设计,也是为了检索技术的选择,从图像检索的特征来看一般包括两种类型:
相同图搜索:是指返回与查询图片包含相同主体的图片,一般是完全相同或具备相同主体的图片,主要适用于重复图片检测、图片精确查找等场景。
相似图搜索:是指返回与查询图片内容语义相似的图片,内容语义相似包括在图片类型、颜色、布局、内容、风格和纹理等特征方面的相似,主要应用于相似图片素材搜索、相似图片推荐等场景;
在图片库的图片检索应用场景中,这两个场景都是要支持的,因此相同图检索,和相似图检索都需要包含的。
但是实际上相似图的结果通常情况下是包含相同图的,相同图是相似图的一个子集。之所以区分开来,是为了便于产品设计,因为在实际过程中,需要设定一个阈值来决定返回结果,但是如果想让相似图都能包含相同图,则很难指定一个通用的阈值,因此,可以根据实际场景分别调用两个模型。
相同图和相似图的特征提取是不一样的,这里为了简化流程,因此画在了一起。
用于查询与上传图片相似或者相同的图片,这里可以根据实际场景进行设计,增加参数是否做主体识别,如果做主体识别,则调用相同图检索;如果不做主体识别,则调用相似图检索。
图片新增或者删除后,如何更新图片的特征索引库,以新增为例,是在新增后实时更新索引库还是定时更新,这个需要产品根据场景判断。一般当底库较小,且日常并发检索较小时,可以考虑实时更新;当底库容量较大,且频繁发生检索时,建议可以选择定时更新,如选取闲时更新。
随着AI技术和互联网应用的发展,图搜这样的智能化检索方式将会有更多的落地场景,但是对于产品设计而言,需要根据实际场景结合技术现状考虑。
比如在推荐场景中,为了更多能留住客户,在尽可能保证高精确率的情况下,k的上限就会取得较大,这样就能给用Kaiyun平台官方户更多的返回结果。因此为了能满足检索业务的需要,同时提高用户体验,就需要产品能多思考实际业务场景。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
詹姆斯28+13连创多项历史第一:核心PK完胜小卡 率湖人21战17胜
21 天销量 100 万,三星 Galaxy S25 系列在韩国创造销售新纪录
三星发布 Galaxy M16 5G:天玑 6300 芯片,享 6 年安卓/安全更新
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
- 上一篇:分布式系统最全详解(图文全面总结)
- 下一篇:七大标准判别分布式系统的优劣(上)
-
2025-03-162025年区块链技术在供应链管理中的创新实践:重塑信任与效率的未来趋势预测分析
-
2025-03-16新政倒计时引爆分布式光伏抢装潮 组件价格已连涨近一个月
-
2025-03-16华润电力(广东)能源服务有限公司广东省惠州市龙门县一期分布式光伏项目专业工程分包公告
-
2025-03-16偶数科技获分布式数据库专利技术突破引关注!
-
2025-03-16中国工商银行斩获分布式数据库专利金融科技再添新力!
-
2025-03-16浙江大华技术获分布式对象存储专利掀起行业技术革命!
-
2025-03-15微软获得无锁分布式数据库专利未来存储器将如何变革?