Excel TextMatchRate相似度筛选文件让我无从

阅： 2473 | 回： 4

TextMatchRate相似度筛选文件让我无从下手？全部 , 编号:03524

ChenXuanfx

发表于2023/2/28 17:55:51 楼主

回复楼主

等级:初学者

积分:3

财富值:2.00

身份:普通用户

这是整理上万个素材，一个压缩文件匹配一张图片。命名相似（不完全相同），以TextMatchRate筛选，结果发现这个相似度是按含有的字符数量来计算，要命的是不按顺序！结果就成了看来完全不同的两文件名相似度很高！

图1：39字符，一个多个“1”，为什么只有95%相似度？按字符比例来算也不止这么多？

图2：明显不同字符很多为什么却达到96%相似度？这两文件一眼就看出不匹配

图3：前面同图1，前面安全相同，后面多个模型字符，前面相同35字符，后面多7个字符，相似度却只有80%？

我的个性签名

信步

发表于 2023/2/28 18:00:11

回复2楼

等级:传说级人物

积分:2734

财富值:4

身份:普通用户

这个算法肯定是全文匹配不是按顺序匹配的

ChenXuanfx

发表于 2023/2/28 18:04:11

回复3楼

等级:初学者

积分:3

财富值:2

身份:普通用户

回复：2楼

请问下那我这种应用用什么函数来筛选合适？

我的个性签名

ChenXuanfx

发表于 2023/2/28 18:27:32

回复4楼

等级:初学者

积分:3

财富值:2

身份:普通用户

我是真得不理解这个匹配规则设定了，它的应用范围在哪儿我都想不出了。下面实验了123456789与987654321，匹配度100%还可以理解成不按顺序，有的字符都有。但改成下图这样还是100%匹配？就真不理解了。是都是数字原因？

我的个性签名

信步

发表于 2023/3/1 9:28:40

回复5楼

等级:传说级人物

积分:2734

财富值:4

身份:普通用户

这个应该得用来匹配汉字，字母和数字个数太少了，加起来也就36个，很容易重复

快速回复