linux下处理密码字典、文本文件

  • 内容
  • 评论
  • 相关

一般的密码字典都是文本文档,一行一个;
目标文件 dic.txt

使用linux下的命令来处理很方便:

仅去重

uniq -u dic.txt > dic-uniq.txt

注:这里的去重只能去除连续相同的重复

排序去重

sort dic.txt | uniq -u > dic-sort-uniq.txt

或者

sort -u dic.txt > dic-sort-u.txt

筛选大于8位字符串

awk '{if(length>7) print $0}' dic.txt > dic-length8+.txt

筛选符合正则的字符串

awk '/pattern/' dic.txt > dic-regexp.txt

多文件合并

# 将文件依次合并
cat file01 file02 file03 > all_file.txt

#将文件按列左右以英文逗号进行合并
paste -d ',' file01 file02 file03 > all_file.txt

# 合并同一类型文件
cat *.txt > dic

大文件分割

# 指定M切分
split -b 10m dic.txt -d -a 3 dic_

# 指定行切分
split -l 1000 dic.txt

评论

0条评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注