IBM的人工智能辩论机器:如果有血液,我的血液将沸腾
发表时间 2018-09-17 16:21 来源 网络

  (上图为2018年6月18日旧金山举办的Project Debater人机辩论公开赛)

  “I can't say it makes my blood boil, because I have no blood. But it seems some people naturally suspect technology because it's new. (如果我有血液,它将让我的血液沸腾。有很多人天然的怀疑新技术,因为这是新的。)”IBM的人工智能辩论系统Project Debater(以下简称: Debater)在2018年6月18日在旧金山举办的一次公开现场人机辩论赛中,就“远程医疗”这一辩论进行陈述时,如此陈词。

  Debater是人类历史上首次出现的可以与人类对手进行复杂辩论的AI人工智能系统,旧金山辩论赛的人类对手为曾在2016年获得以色列国家辩论冠军以色列大四女生Noa Ovadia和以色列国际辩论协会主席Dan Zafrir。Debater与两位人类辩手在两场辩赛中,成功在“是否应该增加使用远程医疗”辩论中扭转了更多现场观众的最初观点。

  无论是人类辩手还是Debater,都是现场拿到辩题并临时准备。现场观众的评价是:整体来看,人类辩手的表达更好,但AI辩手传递信息量的丰富度则优于人类。Debater历时逾六年研发,是IBM继1997年打败人类国际象棋大师的“Deep Blue”(深蓝)和2011年在益智游戏节目《危险边缘》国战胜人类冠军的“Watson”(中文音译:沃森)之后的又一里程碑。

  显然,人工智能在国际象棋中要学习的是高度程序化的游戏规则、在益智游戏节目中要学习的是冷冰冰的百科知识,而与人类辩论则要理解和掌握人类的政治、文化、法律、宗教、经济甚至是情感和艺术等非理性内容,同时还要在短时间内完成广泛而深度的阅读理解以及长篇陈述表达,表达除要有复杂的逻辑外,还要融入适当的幽默和情绪以感染现场观众。种种挑战,如果成功,亦如Debater的阐述:如果我有血液,我的血液将沸腾。

  就在2018上海人工智能大会前夕, 笔者采访了IBM海法研究院的三位科学家,深挖了Project Debater背后的AI技术、科研价值,及其在AI发展历程中的地位。

  36篇顶级学术论文

  【上图为Project Debater首席研究员Noam Slonim博士(右)、Project Debater全球经理Ranit Aharonov博士(左)接受视频采访】

  Debater是由IBM Research开发的AI技术集成项目,该项目由IBM研究院以色列海法实验室于2011年提出。与传统辩论相同,Debater与人类辩手各有4分钟陈述自己论点,4分钟反驳对方论点,2分钟总结陈词。

  对于给定的主题,Debater系统会在巨大的知识库内进行搜索,寻找最相关的观点和证据,然后在其中选择最吸引人、最多样化、支持度最高的论点,把这些构建成一个完整的观点加以叙述。与人类辩手一样,Debater事先并不知道辩题,在现场只有30分钟左右的准备时间。当Debater知道了辩题后的30分钟之内,就会通过自己的算法在知识库和语料库中搜索,形成有利于自己论点的论证。

  六年来,IBM研究院团队为Debater系统赋予了三种能力,每种能力都可开创新的人工智能领域:数据驱动的演讲稿撰写和表达——Debater第一次证实了计算机能够消化海量语料库,针对给定的有争议的简短主题描述,能够撰写结构良好的演讲内容,并清晰且有针对性地表达出来,甚至还会适时地展现幽默感;听力理解——能够识别长段连续口语中隐含的重要概念和观点;模拟人类困境——通过独特的知识表达方式来模拟人类争议和困境,使系统能够根据需要提出有原则的论点。

  截止到2018年9月,Debater项目一共在6大研究领域诞生了36篇国际性学术论文以及相关的数据集。

  其中,在海量语料库挖掘辩论内容领域(Argument Mining),涉及:在语料库中侦测论点、在语料库中自动侦测证据、自动否认论点、通过循环预测进行论点综合分析、整个语料库中无监督式论点侦测、弱监督式论点内容搜索引擎、用自然语言计算辩论质量、辩论质量评估、用联合推理模型进行辩论关系分类等9篇学术论文。

  在深度神经网络和弱监督领域,涉及:用弱监督学习抽象概念、用弱监督学习训练辩论内容搜索引擎、用于提高辩论内容挖掘神经网络的高质量人工标注数据与低质量自动产生数据的混合、近似句侦测、语音输出时的强调词预测和强调句预测、辩论表达时的停顿预测、自动辩论内容识别、辩论打分等9篇国际学术论文。

  在自然语言处理领域,涉及:用概念图谱表达文本语义的相关性、侦测辩论结构和框架等4篇国际学术论文。在文本到语音转换领域,涉及:改进演讲稿模型等3篇国际学术论文。此外,还产生了7篇数据集相关的国际学术论文。

  IBM以色列海法研究院Project Debater首席研究员Noam Slonim博士表示,尽管是六年之前开始Debater的研究,但时值今日依然认为一切工作才刚刚起步,就计算辩论本身而言就有太多有趣的问题等待被发掘。

  找到用于决策的有效信息

  (上图为IBM 以色列海法研究院AI Tech副总裁Aya Soffer博士接受视频采访)

  AI领域的重大挑战是什么?在AI领域应该关注什么样的人类难题,从而以关注的难题去推动AI领域的下一步发展?

  IBM 以色列海法研究院AI Tech副总裁Aya Soffer博士表示,在真实的世界中并不需要回答很多琐碎的问题,而是要回答真正重要的问题,从而做出真正重要的决策。从海量信息中找到有助于正确决策的信息,是非常困难的:首先,能帮助人们做出正确决策的信息量本来就少;其次,如何找到这些信息就更加困难。因此,从对于决策的重要性出发,IBM研究院六年前确定要把辩论作为AI的下一个重大挑战做研究,并且使得AI拥有辩论的功能和用途。

  辩论是一个开放式的挑战,这与之前AI所解决的挑战完全不同。之前的AI挑战总是有具体的衡量指标用于判断输赢,而在辩论中则没有明确的办法进行打分。辩论中就像实际的商业决策一样,没有清晰而简单标准,可以用分数高低衡量输赢。Debater项目的本身目标就是建立一个系统,帮助人们在答案不是非黑即白时,作出基于证据的决定。

  辩论在算法方面的重大挑战包括Debater要能听长达4分钟的内容,对方人类辩手在讲的过程中可能是很快的语速,充满激情的演说,同时还带有道德性、伦理性陈述,Debater要在听力理解中做到能够理解对方所表达的主旨。这与业界所熟悉的个人智能助手完全不同,因为像个人智能助手类AI只需要听懂一句话就可以,比如开灯、关灯,而Debater要在很长的语句中听懂对方的主旨。

  此外,在辩论开始时要做一个本方观点开场白,即观点陈述文章,要求Debater具有自动写成功能,可以具有说服力的清晰地阐述。Debater还总结了人类专家辩手的一些共性,进行模拟、建模后注入到系统中,就形成了一个知识图谱。一旦开始辩论,Debater就可以在已经形成的知识图谱中进行索引和导航,找到可以支撑观点的证据。

  走近人类的智慧

  “关于AI的下一步,就是智慧上越来越接近人类。我觉得Debater是一个很好的例子,它展示了我们如何教授机器,只要有充足的时间、充分的数据和算法就可以充分前进。”Aya Soffer表示。

  就Debater本身的下一步发展,Noam Slonim表示,人类的辩论能力包括三个部分,也就是几千年前亚里士多德提出的辩论三原则:逻辑(logos)、表达(ethos)、情感(pathos)。亚里士多德曾经指出辩论术是对话中辩驳的技术,而修辞学则是演讲中说服的技术,两者在表现形式上不同,但却有着内在的一致性。现在的AI还只能关注到逻辑本身,而对于自己的立场、向对方传达信息时所带有的色彩、传递方式和修辞表达方式的研究还很少。

  今天的Debater仍然是一个初级阶段,但已经能够向世界展示它的可行性和可达到性。那么,Debater之后的下一个挑战是什么?

  Aya Soffer认为,下一个挑战就是要让人工智能更像人类。就好像一个小孩子去上学,看了两三张大象的图片后,学会了从不同的角度看大象,那么再下一次再看到大象的图片,即使是其它的角度也能知道这是大象,也就是人可以理解概念,并且在概念的基础上学以致用到新的领域,这种开放域的强应用能力是目前机器不具备的。

  目前AI再发达,尚不能把概念进行学以致用的应用。IBM研究员们希望AI下一步的发展是从比较窄的例子上学习,而后扩展到比较宽泛的领域、跨不同领域的应用,以及能够从概念上学习。这不是再学习的能力,而是具备能够自行推理的能力。

  对于Debater的商业应用,将有助于各类决策。辩论本身不是源于冲突和竞争,而是源于更有建设性的讨论。辩论丰富了决策制定的过程,帮助人们权衡新想法、新理念的利弊。辩论不只是为了说服他人,也是为了理解和学习彼此的观点,做出更加无偏见的决策。

  IBM以色列海法研究院Project Debater全球经理Ranit Aharonov博士表示,Debater的可能商业应用范围包括:金融顾问,通过Debater找出金融事实,用以支持或反对金融分析师所思考的金融投资选择;律师,借助Debater来寻找相关案件和主张,或借助Debater模拟法庭辩论来分析优势和劣势;公共事务决策,通过Debater公正的优/缺点分析和对人类困境的模拟,为决策提供基于事实、没有人为偏见的观点;企业决策,通过Debater拓宽思路,在关键决策中纳入可能没有考虑到的新观点等。

  展望未来,虽然计算辩论是一个崭新的科学领域,但是所支持的是人类非常古老和传统的辩论文化。对于计算辩论的研究,无论是人工智能本身,还是研究学者,都是“热血沸腾”式里程碑式,将对人类的前途有着深远的意义和影响。