而很快,01就给出了步骤,一共五点。

        周岩给出的要求是:对网络文本进行文本统计分析。

        01的回复是:1、导入文本。2、文本预处理。3、文本统计。4、得出结论。

        比较简单,周岩给出具体一点的要求。

        于是01的回复变成了:1、导入文本。2、对文本进行预处理,导入停用词表,使用分词工具对文本进行预处理。3、对处理后的分词文本,进行词频统计。4、对词频统计后的结果进行词频统计分析,得出结论。

        具体了一些,只不过依旧有点儿宽泛。

        不过周岩等不及了,

        他直接提出让01根据自己的步骤,生成相关的代码。

        而很快,01就生成了一系列的代码。

        周岩下载了《斗破苍穹》的文本,对这段代码进行验证,很快就得到了不错的数据,虽然不全面,但显然这个项目是能进行下去的。

        周岩又对这段代码提出改进要求,包括词频可视化,把词频用云图展现出来,包括对词频进行文本训练,从而找出词与词之间的关联。

        内容未完,下一页继续阅读