`
阅: 718 | 回: 4
发表于2023/2/28 17:55:51 楼主 
头像 等级:初学者
积分:3
财富值:2.0
身份:普通用户

这是整理上万个素材,一个压缩文件匹配一张图片。命名相似(不完全相同),以TextMatchRate筛选,结果发现这个相似度是按含有的字符数量来计算,要命的是不按顺序!结果就成了看来完全不同的两文件名相似度很高!

图1:39字符,一个多个“1”,为什么只有95%相似度?按字符比例来算也不止这么多?

图2:明显不同字符很多为什么却达到96%相似度?这两文件一眼就看出不匹配

图3:前面同图1,前面安全相同,后面多个模型字符,前面相同35字符,后面多7个字符,相似度却只有80%?

我的个性签名
发表于 2023/2/28 18:00:11   
头像 等级:传说级人物
积分:1997
财富值:6
身份:系统管理员

这个算法肯定是全文匹配不是按顺序匹配的

方方格子安装教程http://www.ffcell.com/WenKu/article.aspx?id=376
发表于 2023/2/28 18:04:11   
头像 等级:初学者
积分:3
财富值:2
身份:普通用户

回复:2楼

请问下那我这种应用用什么函数来筛选合适?
我的个性签名
发表于 2023/2/28 18:27:32   
头像 等级:初学者
积分:3
财富值:2
身份:普通用户

我是真得不理解这个匹配规则设定了,它的应用范围在哪儿我都想不出了。下面实验了123456789与987654321,匹配度100%还可以理解成不按顺序,有的字符都有。但改成下图这样还是100%匹配?就真不理解了。是都是数字原因?


我的个性签名
发表于 2023/3/1 9:28:40   
头像 等级:传说级人物
积分:1997
财富值:6
身份:系统管理员
这个应该得用来匹配汉字,字母和数字个数太少了,加起来也就36个,很容易重复
方方格子安装教程http://www.ffcell.com/WenKu/article.aspx?id=376

快速回复

目前不允许游客发表,请 登录 注册 后再发贴。