评论数据迁移,记uyan向mongo的导入

时间:2014-10-23 作者:剧中人

经过一段时间的努力,博客的评论模块终于上线了,可que能shi交互上还比较弱,但造轮子的快感爆表,也终于可以避免友言在单页面设计里的不足。

可能你还不知道友言是个什么东西,这里我简单介绍一下。友言是一个免费的web评论系统,无需自建后台程序。很多博客都采用友言来节省开发成本,这里是友言的官网

上面纯粹是感谢友言为小剧提供了两年服务而写的广告,下面开始正题。

评论模块在开发到尾声的时候,很自然地开始考虑到友言数据向自己mongo数据库的迁移。初期的思路是这个样纸:友言导出评论数据(json格式),nodeJS撸一遍数据格式转换,大刀阔斧地导入mongo。

兴冲冲地到友言后台导出评论,出来的数据却让我很是失望,因为每条评论牛逼闪闪的用户信息却不完整,我可不希望所有人都长一个脸,肿么办么?

猥琐的我这时候瞄到网页中的列表,碎碎念道,貌似可以从HTML里偷数据。三行五行JS就开始写了,不一会儿一个脚本完成了,顺利地把28页评论的HTML搞到手。对比了之前导出的JSON数据,信息只多不少,又省得我做数据合并。

数据源的获取已经偏离了初期计划,第二步的撸数据也得换种方式。

用浏览器打开之前搞到手的HTML数据,一遍遍JS过滤多余内容,筛选有用数据,转换时间格式,拼接新ID。终于得到一手干净的数据。

第三步倒和预期一样,使用mongo自带的mongoimport方法开始大刀阔斧的导入了。

bingo,一切顺利完成!

作为我第一次数据迁移,虽然没有什么难点,但却学到了很多,一种程序猿特有的快感充斥全身,给自己点一百个个赞!