[下篇]supermemo词库探讨,什么样的词库效果最好?

2012.2.13日 第一稿
2012.2.14日 小改
------------------------------

上篇:http://www.guyiren.com/archives/625

前言:写完上篇后,得到很多朋友的支持,有很多朋友邮件或QQ询问我什么时候出下篇,其实写上篇的同时下篇的主要内容就已经形成了。为什么本文姗姗来迟?一个是由于个人学业上的时间问题,忙到有整整一个月没有去复习supermemo词库的内容;另外就是想对词库有更深入的了解,在学习过程中截一些图来使文章内容更饱满、更有可信度。

在上篇中我们讨论了最简单的词库模型用来记单词的效果问题,在本文中我们聚焦于两个知名度很高的UX第三方词库:舍得英语魔法学苑的test your vocabulary和SuperMemo官方的Extreme English

第一部分:关于test your vocabulary》

首先我们来做下面一道题目:看图从备选单词中选出正确答案。Image

相信通过英语四级的同学都能很快做对这道题,每次碰到这道题我都是爽快地打4分。但后面出现的情况却让我感到诧异:我在一篇英文文章中看到“torch”这个单词,却对它几乎没有任何印象(如果这时用sm的6级评分对torch这个单词打分的话应该是0分)。那时候我没有去翻字典查这个单词的意思,但是几天后在tyv2(test your vocabulary 2,以下同)中,当出现上图所示的问题时,我还是能做出正确答案(评4分),而且左下角的属性栏显示是这个问题要在80天之后才会再出现,也就是torch这个单词我“基本上掌握了”,但实际情况却是在阅读中看到这个单词我几乎没有任何印象,为什么会出现这种情况?

原因就在于学习torch单词时的问题模式:看图根据备选答案猜词

更深层次的原因就是:我们记住的不是“torch”这个单词,而是记住了做对这道题的方法

为什么我们都能很快地做对这道题?以通过四级的一般英语水平,备选单词中基本就只有“torch,saucer,lid”这三个单词不太了解。第一遍学习这个问题时,我不知道torch是正确答案,当然batteries是知道的,我打分“1”。下次再看到这个问题时,我基本上很快就能确定正确答案了。因为我大概记得是一个t开头的单词,而且通过下面的词条的学习,我大概对“saucer,lid”这两个单词有一定印象,知道不是这道问题的答案。于是我很快就能知道这道问题的正确答案了,打4分。

然而如果你不看下面的单词备选,你可以完整地拼写出正确的答案单词torch吗?这就是为什么我在英文阅读中看到“torch”这个单词,对它却几乎没有任何印象的原因了。

这里要稍微扯一下sm的评分等级。sm的评分等级当然是十分科学的,问题在于词库。比如对于看备选答案来选择正确答案这种形式,通过排除法可以很快并且准确地确定(也算“猜中”?)正确答案,那么这个评分到底要算3分(蒙对),还是4分(想了一下,可以确定正确答案),或者是5分(我很快就选中了正确答案)呢?不知道sm对选择题有没有专门的算法?(应该是没有吧)

其实不管你评分是多少,对于这道问题,效果都是差不多的。按照正常的选择题来做,我们都能很快地选中正确答案。

因此每次我都能很快地评分4,但是在实际中我对torch这个单词却根本没有什么印象。

类似的情况还有很多:

Image(1)

这个题目是要看备选单词选择正确的匹配图的意思。做对这道题很容易,因为看着备选单词,有很多我们都是懂的,可以排除掉一大堆不可能的答案,加上对正确答案的一点印象(比如大概记得是b开头的单词等等)就很容易做对这道题了。这个训练的效果是如果看到图,并且选择单词中有banister,你就能较快的选中banister。但是如果把banister这个单词放在没有附图的情况下单独放在你面前,你能回忆起是什么意思吗?

Image(2)

这个问题也是这样。做对题目很容易,但是效果呢?相似的情况实在太多了。

其实舍得苑长早就研究过这个问题了,引用舍得原话:http://emagic.org.cn/thread-5056-1-1.html

最后讲讲"多种记忆模式"的问题.

SuperMemo2008采取的主要模式是"听(看)英文想中文"或"听(看)中文想英文"?为什么它不搞出一些类似"听(看)英文选择中文"的模式呢(SuperMemo2008或UX中都有选择题型,但不作为主要手段)?这跟SuperMemo设计思路有关,它更关注如何与实战接轨.我们还是用apple为例,你在与别人用英语交流的时候,apple这个词你吃不准,你总不能跟对方说:"你能不能让我选择一个,apple是苹果呢,还是香蕉啊啥的."拜托,这又不是小丫的开心词典.

回过头来看设计,在"听(看)英文选择中文"的模式中,假设apple有ABCD四个选项,分别是苹果、香蕉、桔子和梨,由于限定了范围(因为选择题再怎么设计,苹果总是要出现的),你选中苹果的次数自然会越来越多,表面上看你似乎记住了这个词,但这只是一种假象,当把ABCD都拿掉的时候,你有多大机率回忆得起来

舍得并不是说"听(看)英文选择中文"这种模式完全不可取,事实上它在记忆新单词的初期,会起到降低难度的作用--有得选总比没得选好弄一点。但它的消极作用也是非常明显的,它完全是靠机械的重复在起作用,而且即便如此,它要取得同样的效果,得花上比"听 (看)英文想中文"这种模式更多的时间,依赖于"听(看)英文选择中文"来记忆单词的话,其基础是不牢固的,就算你总是能选对,并不等于你真正掌握了这个单词!因此,这种模式只能作为一种辅助手段,即便不用,也不会有什么影响。对于懒得动脑筋或有大把时间去浪费的人,可能是一个“不错”的选择。

那么我们究竟应该怎样对待TYV词库?

到目前为止,我学习了TYV2和TYV3,进度大概都是50%,我对TYV词库的使用的看法是:TYV是一个很好的词库,关键在于你怎么用。如果你以做题的形式去学习,比如本文提到的几个例子如在备选答案中选择正确单词,那么题库的难度就降低了,虽然效果可能不会特别好(体现就是实际阅读中对单词只有点模糊的印象),但是这种学习方法也不会花掉你太多时间(因为都是一直打4分5分嘛),投入产出还是很值得的。另外,我个人的一个使用方法是:对部分词条不要看备选答案,请自己拼写出正确单词来(男人就要对自己狠一点!)。值得一提的是UX从2012年开始更新的版本里多了一个功能,每个页面都可以添加笔记。这是一个很赞的功能。如果你认为该条目很有价值,同时不看备选栏也能写出正确答案,那么你就可以给该条目增加一个笔记,写上:不要看备选栏!这样下次碰到该问题时你就根据这个信息:不看备选栏来打分。

image

以上就是我对TYV词库使用的一些看法,大家有什么观点也可以互相分享一下。

第二部分:关于《Extreme English》

下面讨论一下官方的Extreme English词库出现的一个主要问题。个人认为,非自己做的词库,或者说,记忆的材料没有先经过自己的第一次学习选择过滤加工,那么总会出现部分词条感觉很棘手的情况,并不是问题很难,而是你想到的答案跟标准答案有出入,但是又不能说我想到的答案是错的。出现这种情况的原因我认为是词库的引导性不够,或者说在该问题中可以参考的情境信息不够,导致我们往跟标准答案不一样的方向去想,结果出现给出的答案也算对,但是又跟标准答案不一致的问题。

说得有点理论了,看看下面的例子就很清楚了。

首先看看下面两个问题,是否很相似呢?但是答案却不一样:

Image(3)

Image(4)

是的,每次我看到这两个问题时都头很大,经常是第一个问题给答案clutch,第二个问题给答案brood。但是查了很多字典,在表达“一窝鸡(蛋)”的意思时这两个单词貌似没有什么区别。

接下来再看看(我手动在答案栏加入了一些中文解释):

Image(5)

Image(6)

Image(7)

上面三个问题我一直分不清couch和crouch的区别。不能抱着我同时想到两个单词,有一个中了就打4分的想法。因为在学习过程中还可能存在其他的2个条目之间意思可能有点接近,但是用法或含义又有一定区别的情况。如果每次都带着这样的想法,用两个答案去核对一个标准答案,这样来评分,结果肯定是不太好的。

再来:

Image(8)

Image(9)

在一个QQ翻译群上提问了,500人的超级群中也没人指出abortion和termination有什么区别?

好吧,也许上面例子中两个单词之间还是有区别的,但是目前我没有那么高的英语水平,同时我也搜索不到它们之间有不同的地方,也许在表达含义的侧重点上不一样,或者在书面语的不同情景中表达含义略有不同,但这不是我要关注的重点,我只关心:这些条目花掉了我很多的时间,但是同时给我的回报确实很低的

解决上述问题的最好方法就是,在问题中写上同义词来设置一个更好的情境。比如,将第一个问题改成:

(n)young birds born at the same time.

e.g. We installed a camera in the nest in order to observe a pair of pigeons and their ...

同义词:clutch

好的,这时候你就知道本题的答案是brood了,不会再往clutch的方向上想了。其余问题也类似可以这样做。实际上EE词库本身就是这样做的,很多问题都给出了同义词来引导你思考,比如:

Image(10)

只是由于是第三方词库,每个人的基础不一样,看到相同的题目想法也不一样,因此有些时候需要自己修改一下题目的情境以便于我们更好的学习。在这里我突然想到我制作的一个词库:《NBA常用英语》,学习完我取得了不错的效果。为什么它比一般的什么“考研词汇”“托福词库”效果好?就是因为有了情境的限制。比如以squad作为问题,你不会往它的其他方向的意思上想,在篮球界squad就是表达一个意思:“五人组(篮球队的非正式说法)”。

加入同义词这种辅助的方法效果是很好的,除此之外我还试过其余两种方法,个人觉得也是有一定参考价值的。

一种是修改词库的学习类型,改成完成句子(complete the sentence)。这样会给出单词第一个字母的提示。

Image(11)

Image(12)

这个方法的不足之处:

有些词义相近的单词可能第一个字母刚好就是一样的(比如couch和crouch),那一样分不清楚;

第二这种方法也降低了学习难度,比如:我一直分不清楚单词carp和ray哪个是表示鲤鱼、哪个是鳐。

Image(13)

Image(14)

如果改类型变成完成句子,那么会有第一个字母的提示。本来看到上面任何一个问题我都会在carp和ray两个备选答案中徘徊,一旦给了第一个字母的提示,我很快就能给出正确答案,但是,实际中我还是分不清楚carp和ray的区别。

因此这种方法不是很可取。但还是有一定的参考价值,毕竟上面这样的问题是比较少见的。

第二种方法可以叫做不是方法的方法,那就是:直接Ctrl+D忽略掉该条目!

这些情境不够的条目才是浪费我们学习时间的元凶,经常我们学习到一半被这种“哭笑不得”的条目给卡住了。与其在个别的几个条目上花费大量时间,比如翻字典查找两个单词意思是否会不一样的地方(couch和crouch,termination和abortion等),不如直接Ctrl+D,让我们的学习进程更加流畅,保证了主要学习任务的完成,丢车保帅嘛。

那么什么时候该Ctrl+D? 对什么词条Ctrl+D?

这里不得不提到UX的一个重大功能缺失:难词过滤功能(leech)。这个功能的缺失真是让人感到遗憾。自从开始使用anki之后我深深感到难词过滤功能的强大作用。

anki的难词过滤功能很简单,只要对一个条目连续打“重来”(也就是sm的2分及以下)到一定次数,就自动加入到难词队列中,同时该条目不会再出现在复习过程中。如果想要在学习该条目,可以到难词的队列中将它恢复为正常的条目。在实际的使用过程中我固定一段时间(2个礼拜或1个月,跟据不同词库定)去重新学习评判加工这些难词,在面对这些难词的时候就要想:为什么这个单词我没记住?是问题设置不好吗?是单词的提示信息不够吗?还是其他什么原因。在这个加工难词的过程中加深了我对学习材料的理解,同时也剔除了很多没有价值的词条。同时由于难词会自动暂停复习,因此平时的学习过程就显得比较顺畅,能将主要时间主要精力集中在主要的词条上,获到最好的效果。

在supermemo 08和15版本中有比anki强大数倍的难词过滤功能,但UX居然阉割了此功能。试想如果UX有难词过滤功能,那么上面我们提到的这么多棘手词条(termination和abortion,ray和carp等),都会被加入到难词中,不再影响我们每次学习的流畅度,然后我们选择一个时间主动去加工这些难词词条,通过加入同义词,查字典看看相互之间意思是否有区别等方法处理这些词条。而不是在学习的过程中碰到这些条目去翻字典对比意思,网上搜索,到处询问,破坏我们正常的学习过程,导致我们学习(复习)的时间越来越长,却反而没能准时完成任务。同时随着学习条目的增多,这些棘手词条也在增加,如果没有难词过滤将这些词条分类出来,这些慢慢增加的拦路虎题目将会大大降低我们学习的积极性,越来越拖长我们的学习时间。

总结:软件是死的,算法是死的,第三方词库也是死的,但是人是活的,我们应该更多的在学习的过程中思考,思考如何让记忆软件发挥最大功效,思考如何让词库与我们的实际知识水平相结合,思考如何让我们的学习过程更加有趣流畅,而不是让软件和算法接管学习的一切,沦为软件和算法的奴隶。

阅读剩余
THE END