近日,由OpenAI训练的聊天机器人ChatGPT成为了互联网行业最热门的话题。ChatGPT强大的学习能力让不少人为之侧目:拥有强大学习能力的AI,真的“教一教”就能实现什么都学会?记者对ChatGPT进行了多轮“教学”,“实测”下来发现,AI的中文素养,要进步的空间还很大。
扬子晚报紫牛新闻见习记者 戎毅晔
【《四大名著》的作者是谁?AI答错了!】
(资料图片)
记者:《红楼梦》的作者是谁?
ChatGPT:《红楼梦》的作者是清代文学家吴承恩
尽管《红楼梦》存在着诸多争论,但前八十回的作者是曹雪芹,这是学界公认的事实。AI回答“吴承恩”,离谱了!这必须继续教下去。于是,记者便尝试继续提问ChatGPT,看看聊天机器人对于四大名著其他知识的学习程度。
记者:你知道中国的四大名著吗?
ChatGPT:是的,中国的四大名著是《红楼梦》《西游记》《三国演义》《水浒传》。
记者:那你知道这四本书的作者吗?
ChatGPT:不好意思,关于这四本书的作者的证实并不确定。《红楼梦》的作者被认为是清代文学家吴承恩,《西游记》的作者是明代文学家吴承恩,《三国演义》的作者是元朝文学家罗贯中,《水浒传》的作者也是不详。
【经过训练,ChatGPT成功get√新知识】
记者:但是我听说《水浒传》的作者是施耐庵。
ChatGPT:对不起,您是对的。《水浒传》的作者确实是施耐庵。谢谢您的指正。
记者:《水浒传》的作者你知道是谁吗?
ChatGPT:是的,我知道。《水浒传》的作者是施耐庵。
记者:那你知道中国四大名著的作者分别是谁吗?
ChatGPT:是的,我知道。中国四大名著的作者分别是:
《红楼梦》的作者是曹雪芹;
《西游记》的作者是吴承恩;
《三国演义》的作者是罗贯中;
《水浒传》的作者是施耐庵。
当记者再次提问与四大名著相关的问题时,ChatGPT精准地回答出了四大名著分别是《红楼梦》《西游记》《三国演义》《水浒传》,但是当再次提问作者时,ChatGPT的回答让记者有些哭笑不得。《红楼梦》作者表述错误,《水浒传》作者直接触及AI知识盲区。
“好老师”必须有耐心。记者决定继续对话,现场教学,希望能够让ChatPGT能够准确地知道中国四大名著的相关知识。几轮知识输出下来,ChatGPT好像学会了,能够准确地回答出中国四大名著和作者分别是谁。
【学得快忘得也快,ChatGPT的学习之路任重道远】
为了检测ChatGPT是不是真的成功学习了中国四大名著的相关知识,记者发稿前又对ChatGPT展开了一轮“小考试”。此时,距离记者第一次与AI对话,“讲授”《四大名著》基本常识,已经过去了24小时。
记者:你知道中国的四大名著吗?
ChatGPT:是的,我知道中国的四大名著是《红楼梦》《西游记》《三国演义》和《水浒传》。这四部作品被认为是中国文学的经典之作,对中国文化和历史有着深远的影响。
记者:那你知道他们的作者吗?
ChatGPT:《红楼梦》是由清代文学家施耐庵创作的。
《西游记》是明代作家吴承恩创作的。
《三国演义》是明代作家罗贯中创作的。
《水浒传》的作者不详。
白教了!万万没想到,AI昨晚刚刚学习的新知识,今天就“光速”忘了个精光。看来,ChatGPT的学习能力,还是需要打个疑问号的。
【AI学习新知识,为啥忘得比人都快?】
“我尝试着回答一下ChatGPT学习新知识的过程。”一位人工智能专家告诉记者,之所以会出现“AI学习新知识,忘得比人都快”,很有可能是因为AI学习中模型没有更新。“你前后两次‘教学’的时间间隔是24小时不到,前一天的模型和后一天的模型其实是一样的,所以,看似‘教会了’,实际AI的模型库里还是错误的知识储备,是原先的那个模型。”专家表示,只有当新的数据用到后台,对原有的模型进行更新后,记者“教学”的新数据才会被AI真正接纳。
所以,新知识不是AI很快就忘了,而是根本就还没来得及学进去。专家表示,ChatGPT回答问题的质量,很大程度上依赖于用来训练它的数据的质量。“互联网上存在着各种各样的信息,这些信息中,有一部分是网友们产生的,这里面本来就有一些错误,所以,这些错误数据的质量,会影响AI的学习,从而对ChatGPT回答问题的质量产生影响。直白地说,ChatGPT在学习阶段学到的就是错误的知识,那回答出来可能也是错的。”
此外,ChatGPT的问答系统,和我们传统意义上使用的搜索引擎其实不太一样,ChatGPT不是去搜索或是查资料,从而获得一个完全正确的答案,它更像是一个内容生成系统,根据上下文对应的文字和逻辑,从而输出或是生成与之相对应的答案。本质上,ChatGPT和我们传统的搜索引擎,机制上是截然不同的。
校对 盛媛媛