解决“贫瘠的高原”是量子机器学习的关键

  量子计算机上的许多机器学习算法都遭受着可怕的不可解决的“荒芜高原”之苦,在这些问题中,它们陷入了优化问题的死胡同。直到现在,对这一挑战的研究还相对较少。严格的理论工作建立了定理,以保证给定的机器学习算法在大型计算机上扩展时是否能正常工作。

解决“贫瘠的高原”是量子机器学习的关键

  论文的主要作者Marco Cerezo表示:“这项工作解决了量子机器学习的一个关键问题。我们严格证明了变分量子算法的某些体系结构在扩大的条件下是否会出现贫瘠高原的条件。”由洛斯阿拉莫斯国家实验室小组今天在《自然通讯》上发表。Cerezo是Los Alamos的量子信息理论研究的博士后。“利用我们的定理,您可以保证该体系结构可扩展到具有大量量子位的量子计算机。”

  该研究的合著者帕特里克·科尔斯说:“通常,该方法一直是进行优化并查看其是否有效,这导致了该领域研究人员的疲劳。” 建立数学定理并推导第一原理可以消除开发算法时的猜测。

  Los Alamos团队使用通用的混合方法进行变分量子算法,在经典计算机上训练和优化参数,并在量子计算机上评估算法的成本函数或算法成功的度量。

  共同作者卢卡斯·辛西奥(Lukasz Cincio)表示,机器学习算法将优化任务转化为成本函数,例如,找到旅行销售员通过多个城市的最短路线。那是一个将被最小化的函数的数学描述。仅在解决问题后,该功能才会达到最小值。

  大多数量子变分算法会随机启动搜索,并在每个量子位上全局评估成本函数,这通常会导致贫瘠的平稳期。

  “我们能够证明,如果您选择一个在每个单独的qubit本地查看的成本函数,那么我们保证定标不会导致时间与系统规模的陡峭曲线,因此可以进行训练。”科尔斯说。

  量子变分算法建立了一个解决问题的环境,其中峰代表系统或问题的高能量点,而谷则代表低能量值。答案在于最深的山谷。这是基本状态,以最小化成本函数表示。为了找到解决方案,该算法在地形周围进行自我训练,从而导航至低点。

  塞雷佐说:“人们一直在提出量子神经网络,并通过对10s(或更少)的几个量子位进行小规模模拟来对其进行基准测试。” “问题是,您不会看到只有少量量子比特的贫瘠高原,但是当您尝试扩展到更多量子比特时,它就会出现。然后必须为更大的量子计算机重新设计该算法。”

  贫瘠高原是在机器学习优化算法中发生的可训练性问题,当问题解决空间随着算法的运行而变平时,就会出现在机器学习优化算法中。在这种情况下,该算法无法在似乎无特征的景观中找到向下的坡度,并且没有通往最小能量的明确途径。缺乏景观功能,机器学习无法训练自己寻找解决方案。

  塞雷佐说:“如果你处于贫瘠的高原,那么量子加速或量子优势的所有希望就将荡然无存。”

  洛斯阿拉莫斯团队的突破是朝着量子优势迈出的重要一步,量子计算机执行的任务在传统计算机上将花费无限长的时间。短期内实现量子优势取决于扩大变分量子算法。这些算法具有潜力,因此可以在希望有100个量子比特或更多的量子计算机可用时解决实际问题。量子计算机目前最大速度为65量子位。量子位是量子计算机中信息的基本单位,就像经典数字计算机中的位一样。

  Coles说:“在嘈杂的中型量子计算机中,最热门的话题是变分量子算法或量子机器学习和量子神经网络。” “从化学上解决分子的结构到模拟原子和分子的动力学以及分解数的应用,已经提出了它们的应用。”

侵权请联系作者。发布者:admin,转转请注明出处:/kexue/575.html

联系我们

888-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信