在工作中,产品经理为了表达自己的想法,使用文字云工具构筑了各种各样的文字云图。
文字云图的视觉美观取决于工具的自定义功能和制作者的审美,但文字云图的内涵来自哪里呢?答案以数据为基础。下面以关键词“产品经理”为例,快速制作内涵文字云图。
从哪里可以得到说明产品经理特征的文本? 从百科全书? 从书里? 我个人觉得不一样。 产品经理的特点应来源于市场、人才市场。 最准确地表现产品经理特点的应该是各公司的招聘信息,这次选择了广西某人才市场网站作为数据源。 在python中轻松创建小爬虫脚本,以提取产品经理相关位置的文本。
数据提取脚本
2 .在广西人才网南宁地区招聘产品经理的公司很少,在200多个岗位处理冗长的HTML标志,只剩下300KB左右的文本数据。
文本内容
3 .本次目标是分析产品经理的特点。 因此,简单地或者使用PYTHON的结合部分词典将文本分为全文,然后按词数顺序排序,词数越高,在产品经理的工作内容和工作资格中出现的次数越多,代表市场越关注这个词,这些文字构成的云图应该有足够的“内涵”吧。
分词脚本
4 .最后将词汇表导入在线文字云图工具生成图像,可以得到内涵丰富的产品经理关键词云图。
产品经理关键字云图