CommandlineFu 是一个记录脚本片段的网站,,每个片段都有对应的功能说明和对应的标签。我想要做的就是尝试用 shell 写一个多进程的爬虫把这些代码片段记录在一个 org 文件中。
参数定义
这个脚本需要能够通过 -n
参数指定并发的爬虫数(默认为 CPU 核的数量),还要能通过 -f
指定保存的 org 文件路径(默认输出到 stdout)。
#!/usr/bin/env bash
proc_num=$(nproc)
store_file=/dev/stdout
while getopts :n:f: OPT; do
case $OPT in
n|+n)
proc_num="$OPTARG"
;;
f|+f)
store_file="$OPTARG"
;;
*)
echo "usage: ${0##*