grep 一个100GB的文件总是很有压力,怎么才能提速呢?
瞎优化
1
|
|
-
LC_ALL=C
比LC_ALL=UTF-8
要块 -
不需要正则的话,用fgrep可以提速
不过这样优化总是治标不治本,下面隆重推出linux 里面parallel all cmds的perl工具
1
|
|
使用parallel ,和不使用parallel直接grep。结果显而易见,相差 20 倍。这比用啥 ack,ag优化效果明显多了
xargs也有一个-n的多核选项,可以作为备用
1 2 3 4 5 |
|
这一条xargs把每个echo的数作为参数传给sleep ,所以一共sleep了 1+2+3+4+5=15秒。
如果使用 -P 参数分给5个核,每个核各sleep 1,2,3,4,5秒,所以执行完之后总共sleep的5秒。
1 2 3 4 5 |
|
- 引自:
https://www.jianshu.com/p/c5a2369fa613