目标

经常会有一些英文的 PDF 需要阅读,但是里面存在大量不熟悉的单词,如果能提取出来加到背单词软件中有多好?!

本文本就是介绍如何手动添加这些单词。

环境

获取单词

可以使用 PDF 软件打开 PDF,然后全选复制到 Vim 中。

这里建议使用对应平台的 GUI 版本,如 Windows 下的 gVim 与 macOS 下的 MacVim。

然后按照顺序按键盘即可,请跳过 # 开头的注释行

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
# 跳到行首
gg
# 替换非英文字母为空格
:%s/\A\+/ /g
# 替换空白为换行符
:%s/\s\+/\r/g
# 字母小写
vGu
# 排序去重
:sort u

经过上面步骤处理之后就会生成一个单词一行的文本。

安装扩展

根据自己当前的浏览器下载对应的 Tampermonkey 扩展,然后前往 扇贝单词助手 安装即可

添加单词

  • 登录扇后打开 批量添加 - 扇贝,然后将之前处理的单词列表复制粘贴到输入框中
  • 点击输入框提交按钮左侧的 超量提交 按钮,就可以看到单词被批量添加到 我的词库 中了。

已知问题

处理单词时未进行词形转换,即未将复数、第三人称单数、过去式、现在进行式等等转换为原始形态。这部分单词在添加时会报无法添加的错误。