同学的问题:一个文本文件,2000多万行,每行用空格格开了8列。
什么算法可以最快从这些行中选出每列都不相同的?就是说,对于两行,8列中的每个对应的列都要比较,如果有一列相同就算相同。这个问题目前有很多解法(都不是我想出来的):1.八个hash table比较2.(外)排序,然后删除重复的3.插入数据库,排序,删除不过还没有看到有人实现了的,其中第三个实现更加麻烦,还需要数据库...
posted on 2006-05-17 13:17 jzhang 阅读(1484) 评论(8) 编辑 收藏
Powered by: Copyright © jzhang