Clement, Expert Lizeo Price 于 30/08/2020
当您试图比较来自不同地区、网站和渠道的价格数据时,这些数据往往会显示出不完整的产品信息,从而表现其局限性。解决方案: 需要与一个全面综合且高质量的产品数据库来参考匹配。使用什么方法来匹配?如何匹配?如何建立一个全面综合的产品数据库?这里来一一做介绍。

价格分析:一种方法,三个步骤

  • 为了有效跟踪市场上的价格,您必须先定义 产品和数据来源的范围 (如果是网络抓取,先圈定感兴趣的电商平台)。
  • 然后,您需要 详细定义您想优先追踪哪些竞争对手的产品 。在这一步,重要的是要确保能收集的数据具有足够的一致性和颗粒度,以保证其能与匹配数据库做精确对比。
  • 最后,确保 不同数据源 之间的产品名称描述和技术描述之间是统一的(这样可以做产品匹配)。在这最后一步,您的综合产品数据库就可以发挥匹配作用了,当然数据库需先经过技术专家的加强和验证。
  • 数据匹配: 这是提升数据价值的关键步骤

    为了能够解析收集到的竞品数据,您需要一个清洁的产品匹配系统。为了获得最具代表性的市场前景,您需要 广泛收集和统一不同来源的数据 ,可能是线上数据也可能是线下数据。问题是,同一产品的名称、描述和技术特性通常因为来源不同而具有不同的表达,以至于分析不准确,甚至于难以分析(重复数据,数据中有漏洞等)。
    为了解决由于采集点的多样性而造成的难题,在着手做数据分析的前期必须引入 数据匹配 步骤。在实践中,此步骤的作用是将从一个源(站点A或者价目表A)上找到的产品价格数据与另一个源(站点B或者价目表B)上相同产品的价格数据链接起来。产品数据还必须在经认证的产品数据库中做标识,以确保附加到它的 价格数据相关性
    实际的操作很简单, 在价格采集过程中收集到的每一条产品信息都会自动分成三类;
    未知 :信息指向不存在的产品,也有可能是一种新的产品,则需要找到可靠来源去创建它。然后我们将寻找证明此产品存在的官方文件,以完成产品创建并追溯匹配产品的步骤。 已知 :价格数据必须与相应产品做关联。 错误 :此信息会被列入黑名单。例如,产品的技术字段就很容易标错。
    自动分类操作通过排除错误信息和重复信息来获得 清洁数据 ,从而赢得时效性。结果是,通过将每个产品的信息关联起来,使得“匹配“成功的数据存储在干净的数据库中。

    产品参考数据库: 是做匹配的基本要素

    您的产品复杂么?是否有很多技术特性?构建和引用 产品数据库 将简化匹配操作。
    为了确保产品数据库的高质量和完整性,需要在技术专家的监督下对数据库做持续的完善改进。
    数据库内的每个产品都必须 仅从官方来源 (官方产品目录,制造商官网等)进行跟踪和创建。若需使用机器人学习辅助来进行产品的鉴定,这个鉴定的过程需要先由该领域的专家进行验证。
    但是,请注意,要进行匹配、对接或链接,您需要先对 市面上的产品 有一个全面的了解。 产品数据库的精确程度决定了之后进行价格分析的精度和深度 。现在,我们只需要定义和选择产品的判别标准,以使您的竞品分析尽可能相关。

    判定产品文件是否可靠的关键

    可追溯性 :每个产品或字段的创建必须来自于官方来源文件,并需存档。 代表性 :竞争对手产品的资格等级和归档种类必须由技术专家定义,并且必须反映市场的公正观点。 完整性 :产品文件越完整,能做的分析越丰富。这也会影响到自动鉴定和手动增强之间的平衡点。
    在大数据时代,将数据准备工作嵌入到数据操作流程的前端是非常必要的。不能偷工减料。在进行 竞品价格分析 之前,对数据的清洁和匹配操作必不可少,您想了解更多有关如何构建产品数据库并使其符合匹配操作的流程么?