混合文档中提取纯英文
来源: 系统之家 2015/03/18 15:17
我孩子使用的一款英语单词背诵软件,它的自定义词库要求只能导入英文单词TXT文件(每个单词一行)。但是我从网上下载到的单词文章却基本都是单词、词性、中文注释混杂在一起的,但是我现在只需要复制其中的单词列表(图1),纯手工操作太麻烦了,有没有好办法。

【解题思路】
大家知道在Word中复制时按下Alt键可以实现文本内容的列复制,因为现在要求是复制文章前部的单词列表,因此我们可以使用列复制的方法。不过文中单词长短不一,无法直接选择多少列复制。通过观察可以发现英文单词和中文注释之间都有一个全角空格错开,因此使用多个空格替换实现单词和注释分开即可解决问题。
【解题方法】
在Word中打开下载到的文件,然后复制任意一个单词和后面注释之间的空格,接着点击“编辑→替换”,在“查找内容”处粘贴复制的空格,在“替换为”处使用多个空格位置替换单个空格,最后点击“全部替换”(图2)。

小提示:
实际上很多列复制的文章都可以使用类似方法实现替换隔离,大家只要认真观察即可。比如上述文章每一行单词后面都是词性(n、v或其他),我们只要使用“ n.”来替换原来的“n.”,这样就可以将文章中所有名词和原来单词错开,其他词性可按同样方法操作。
完成上述操作后,原来文章中的单词和后面的注释就会被多个空格断开,只要对原来多行的单词稍加修改(比如将taste的名词解释删除),这样单词就和注释分隔开来了(图3)。

现在按下Alt键,然后使用鼠标即可将所有单词全部复制,按提示将其粘贴到记事本中,这样就完成了单词的提取操作。不过到此并未结束,因为列复制会产生大量空格(图4)。

空格的取消可以使用命令提示符去除,假设上述文件名为D:\a.txt,启动命令提示符后输入“type D:\a.txt”,现在继续在命令提示符窗口进行复制后再粘贴到记事本即可取消所有多余的空格了(图5)。

使用命令提示符复制可以去取消空格
本文来自于【系统之家】 www.xp85.com

【解题思路】
大家知道在Word中复制时按下Alt键可以实现文本内容的列复制,因为现在要求是复制文章前部的单词列表,因此我们可以使用列复制的方法。不过文中单词长短不一,无法直接选择多少列复制。通过观察可以发现英文单词和中文注释之间都有一个全角空格错开,因此使用多个空格替换实现单词和注释分开即可解决问题。
【解题方法】
在Word中打开下载到的文件,然后复制任意一个单词和后面注释之间的空格,接着点击“编辑→替换”,在“查找内容”处粘贴复制的空格,在“替换为”处使用多个空格位置替换单个空格,最后点击“全部替换”(图2)。

小提示:
实际上很多列复制的文章都可以使用类似方法实现替换隔离,大家只要认真观察即可。比如上述文章每一行单词后面都是词性(n、v或其他),我们只要使用“ n.”来替换原来的“n.”,这样就可以将文章中所有名词和原来单词错开,其他词性可按同样方法操作。
完成上述操作后,原来文章中的单词和后面的注释就会被多个空格断开,只要对原来多行的单词稍加修改(比如将taste的名词解释删除),这样单词就和注释分隔开来了(图3)。

现在按下Alt键,然后使用鼠标即可将所有单词全部复制,按提示将其粘贴到记事本中,这样就完成了单词的提取操作。不过到此并未结束,因为列复制会产生大量空格(图4)。

空格的取消可以使用命令提示符去除,假设上述文件名为D:\a.txt,启动命令提示符后输入“type D:\a.txt”,现在继续在命令提示符窗口进行复制后再粘贴到记事本即可取消所有多余的空格了(图5)。

使用命令提示符复制可以去取消空格
本文来自于【系统之家】 www.xp85.com