企業(yè)做網(wǎng)站識別商品屬性信息設(shè)計
日期 : 2020-12-06 15:52:40
識別商品屬性信息設(shè)計。在電子商務(wù)網(wǎng)頁中對商品信息的描述中,包含商品的特征詞,因此結(jié)合超文本標記語言以及統(tǒng)計學規(guī)則,可以自動識別商品屬性信息的所在位置,設(shè)計流程為:
檢索電子商務(wù)網(wǎng)頁中商品屬性特征詞典中的每一個詞匯,若找到相配詞匯,則將該詞匯所在節(jié)點添加到候選集合中。再對后先集合中的每一個節(jié)點中,查詢與其距離最近的上一級別的節(jié)點,若未能成功找到則將該節(jié)點排除,若能夠找到則從上一級別的節(jié)點集合中將屬于該節(jié)點的子節(jié)點刪除。
利用統(tǒng)計學的規(guī)則,并結(jié)合提取規(guī)則,計算出節(jié)點中的表格子節(jié)點以及文本內(nèi)容的子節(jié)點,并通過計算獲得其數(shù)量的所占比例,若比值大于75%,則將該節(jié)點加入到提取集合當中,若小于75%,則將該節(jié)點排除。
檢索電子商務(wù)網(wǎng)頁中商品屬性特征詞典中的每一個詞匯,若找到相配詞匯,則將該詞匯所在節(jié)點添加到候選集合中。再對后先集合中的每一個節(jié)點中,查詢與其距離最近的上一級別的節(jié)點,若未能成功找到則將該節(jié)點排除,若能夠找到則從上一級別的節(jié)點集合中將屬于該節(jié)點的子節(jié)點刪除。
利用統(tǒng)計學的規(guī)則,并結(jié)合提取規(guī)則,計算出節(jié)點中的表格子節(jié)點以及文本內(nèi)容的子節(jié)點,并通過計算獲得其數(shù)量的所占比例,若比值大于75%,則將該節(jié)點加入到提取集合當中,若小于75%,則將該節(jié)點排除。