pid match算法思想

阅读: 评论:0

pid match算法思想

pid match算法思想

在电子商务搜索领域,商品搜索中,pid match 算法是扩展产品库的有效方法。主要作用是根据商品title,将该商品归到一条spuid记录下。

原理:

1.将产品库中关键属性(如:nokia N97(代表品牌 和 型号))提取出来,分词,并丢关键属性中的一些弃垃圾词(丢弃算法:根据该条spuid下挂商品title分词之后,统计词频最低的词丢弃);

2.得到所有分词之后的关键属性词之后,建立倒排索引:关键属性词-->对应spuid集合以及权重。权重计算方法:计算idf权重;

3.得到倒排索引表之后,对每一个宝贝title,同样分词,查询倒排索引表,计算权重之和,将该宝贝归到权重最高的一条spuid下面。

本文发布于:2024-01-30 06:19:29,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170656677119839.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:算法   思想   pid   match
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23