- 1秒极速求解PDE:深度神经网络为何在破解数学难题上独具天赋?
- 来源:机器之心
机器之心报道编辑:力元两种基于深度神经网络的新方法,均可成功求解 PDE,并且能够以更快的速度、更简单的方式建模复杂的系统。有趣的是,和大多神经网络一样,我们猜不透它们为什么如此优秀。
研究者们致力于使用偏微分方程(Partial differential equation,PDE)来描述涉及许多独立变量的复杂现象,比如模拟客机在空中飞舞、模拟地震波、模拟疾病在人群中蔓延的过程、模拟基本力和粒子之间的相互作用。
一直以来,求解复杂问题的偏微分方程都是世界级的难题。CPU 往往需要几百万个小时才能得出相对复杂的偏微分方程,而且越复杂的问题越难用偏微分方程解决。无论是设计更好的火箭发动机,还是模拟气候变化,我们都需要更有效的方法来解决这些问题。
近来,研究者在偏微分方程的求解上取得了令人激动的新进展。他们构建了新型的人工神经网络,实现了更快求解偏微分方程。经过训练后,新型的神经网络不但可以求解单个偏微分方程,而且无需再度训练即可求解整个偏微分方程族。
瑞士苏黎世联邦理工学院的数学家 Siddhartha Mishra 表示,传统的神经网络通常将数据从一个有限维空间映射或转换到另一个有限维空间,但新型的深层网络能够在无穷维空间和无穷维空间之间映射。 毫无疑问,这样的技术将加速涉及偏微分方程的许多模型。作为开发团队的一员,Anima Anandkumar 说:「最终,我们的目标是取代非常缓慢且昂贵的传统求解器。」
当然,新的方法绝不仅仅是作用于加速。对于只有数据却不知用哪种偏微分方程进行建模的情况,训练数据然后使用新型神经网络是唯一的手段。
神经网络入场求解 PDE
偏微分方程有用且极其难以解决的原因是它的复杂性。这使它们能够对各种现象进行建模,例如,如果建模人员想知道流体在空间中任何一点(也称为流场)以及在不同时间下的速度和压力,可能会使用 Navier-Stokes 偏微分方程进行建模。求解 Navier-Stokes 方程,将获得一个描述系统内容的公式。如果对初始和边界条件有足够的了解,例如在时间 t = 0 时的流场值,则可以使用数学工具来解析偏微分方程。
但是偏微分方程常常复杂到没有通用的分析解决方案,对于 Navier-Stokes 方程的最通用形式尚且如此:数学家尚未证明是否存在唯一解,更不用说通过分析实际上找到它们了。
甚至在超级计算机上,用数值法来解决复杂的偏微分方程可能也要花费数月的时间。而且,每次更改初始或边界条件或所研究系统的几何形状都必须重新开始。同样,使用的增量越小(网格越细),模型的分辨率就越高,数值法所需的时间就越长。
2016 年,研究人员尝试将通常用于图像识别的深度神经网络应用于解决偏微分方程。首先,研究人员生成了用于训练深度网络的图像数据。其中输入的是有关对象几何形状和流体初始条件的 2D 图像编码信息,而输出的是相应速度场的 2D 快照。
有了数据,研究人员开始训练他们的神经网络,以学习这些输入和输出之间的相关性。训练主要是先比较输出与预期输出的差别,然后用算法调整神经元的权重,以最大程度地减少生成的输出和预期输出之间的差异。重复此过程,直到输出误差在可接受的范围。 让神经网络学习了如何解决偏微分方程是令人兴奋的,但还有很大的不足。一旦在一定的网格尺寸上进行训练,神经网络就变得非常特定于该分辨率。深度网络已经学会了预估将数据从一个有限维空间映射到另一个空间的函数。但以不同的分辨率求解偏微分方程时,如果想对流场有一个更细致的了解,或更改初始和边界条件,则需要重新开始训练,学习预估新的函数。
DeepONet
而现在的深度神经网络,不仅可以学习预估函数,还可以学习将函数映射到函数的「算子」,并且似乎没有遭受神经网络和其他计算机算法从数据中学习的维数问题。例如,如果想使神经网络的错误率从 10%降至 1%,则所需的训练数据量或网络规模可能会指数增长,从而导致任务无法实现。 在这之前,研究人员必须弄清楚如何让神经网络学习算子来解决偏微分方程。布朗大学的 George Karniadakis 表示,学习算子是从无穷维空间到无穷维空间。算子作用于一个函数,然后将其转换为另一函数。比如,一个算子将一个函数转换为其导数(比如 x 的正弦转换为 x 的余弦),其输入和输出端都是无穷维的。
George Karniadakis。
学习预估算子的深度网络可用于一次求解整个偏微分方程族,对一系列初始和边界条件以及物理参数建模相同的现象。这样的偏微分方程族是输入端的一组函数,而对偏微分方程公式的相应解决方案则由输出端的函数来表示。
1995 年的一项研究表明,浅层网络可以看成是算子。由于涉及神经网络,因此此类算子也叫神经算子,即实际算子的近似值。在 2019 年 10 月,Karniadakis 和他的同事把这种理论延伸到了深度神经网络,提出了「DeepONet」,一种可以学习这种算子并一次求解多个偏微分方程的深度神经网络架构。
论文链接:http://arxiv-export-lb.library.cornell.edu/pdf/1910.03193
DeepONet 的独特之处在于它的分叉式架构,该架构在两个并行网络(「分支」和「主干」)中处理数据。前者学习预估输入侧的许多函数,后者学习预估输出侧的函数。然后,DeepONet 将两个网络的输出合并,以学习偏微分方程所需的算子。训练 DeepONet 的过程包括反复地展示使用数字求解器生成的一族偏微分方程的输入、输出数据,并在每次迭代中调整分支网络和主干网络中的权重,直到整个网络出现的错误量可以被接受为止。 因此,DeepONet 一旦经过训练,就会学会预估算子。它可以在输入端获取代表偏微分方程的数据,然后将其转换为输出端偏微分方程解决方案的数据。假设有 100 个代表了训练数据中没有的初始 / 边界条件和物理参数以及所需的流场位置的样本被提供,那么 DeepONet 可以在不到一秒的时间提供流场。
DeepONet 架构图。
但是,即使 DeepONet 跟数值求解器一样快速,它仍必须在训练期间执行密集的计算。当必须用大量数据训练深度网络以使神经算子越来越精确时,这可能会成为一个问题。
那么,神经算子还能更快吗?
傅里叶神经算子
去年,加州理工学院的 Anima Anandkumar 和普渡大学的 Kamyar Azizzadenesheli 共同建立了一个称为傅立叶神经算子(FNO)的深度神经网络。
论文链接:https://arxiv.org/pdf/2010.08895v2.pdf
研究者声称新的架构使网络具有更快的速度,能将函数映射到函数,从无穷维空间到无穷维空间,并且在偏微分方程上测试了该神经网络。
Anima Anandkumar。
解决方案的核心是傅立叶层:在训练数据通过神经网络的每一层之前,先对其进行傅里叶变换。然后,该层通过线性运算处理数据,再执行傅立叶逆变换回原始格式。此过程显然比 DeepONet 的计算更直接,并且能够通过卷积偏微分方程与其他函数的数学运算来求解偏微分方程。在傅立叶领域中,卷积相当于一个简单的乘法,将经过傅立叶变换的数据通过一层已训练过权重的人工神经元传递,然后进行傅立叶逆变换。最后,FNO 学习了整个偏微分方程族的算子,将函数映射到函数。
傅里叶神经算子架构图。
FNO 深度神经网络同时拥有极快的运行速度。例如,在一个需要进行 30000 次仿真(包括 Navier-Stokes 方程)的求解过程中,对于每个仿真,FNO 花费了不到一秒的时间;而 DeepONet 耗时 2.5 秒;传统的求解器则大概需要花费 18 个小时。
总结
很显然,DeepONet 与 FNO 这两种方法都会超越传统的求解器。两个团队的方法都是成功的,但是与大多黑盒化的神经网络一样,目前我们尚不清楚它们为什么如此出色,以及是否在所有情况下都如此出色。 经过一年的努力,今年 2 月研究人员发表了对 DeepONet 架构长达 112 页的数学分析。研究证明这种方法是真正通用的,不仅仅是偏微分方程,DeepONet 可以将输入端的任何函数集映射到输出端的任何函数集。
而对 FNO 的数学分析尚未完成。不过对于没有确定的偏微分方程的现象,学习神经算子很可能是建模此类系统的唯一方法。比如交通问题,编写精确捕捉交通动态的偏微分方程几乎是不可能的,但是可以学习的数据量却非常之多。
参考内容:https://www.quantamagazine.org/new-neural-networks-solve-hardest-equations-faster-than-ever-20210419/
KDD Cup 2021赛题分享:智能调度优化交通出行
4月23日20:00-21:00,机器之心特邀参与组织2021 KDD Cup赛题的郑冠杰博士,分享「强化学习在智能交通领域的应用」,深入介绍通过数据科学的方法优化交通灯调度,优化城市出行规划。
分享分为三个部分:智能交通信号灯领域现状、开发经验分享以及近期在举行的KDD Cup城市大脑挑战赛。
点击阅读原文,直达直播间。
© THE END 转载请联系本公众号获得授权投稿或寻求报道:content@jiqizhixin.com
研究者们致力于使用偏微分方程(Partial differential equation,PDE)来描述涉及许多独立变量的复杂现象,比如模拟客机在空中飞舞、模拟地震波、模拟疾病在人群中蔓延的过程、模拟基本力和粒子之间的相互作用。
一直以来,求解复杂问题的偏微分方程都是世界级的难题。CPU 往往需要几百万个小时才能得出相对复杂的偏微分方程,而且越复杂的问题越难用偏微分方程解决。无论是设计更好的火箭发动机,还是模拟气候变化,我们都需要更有效的方法来解决这些问题。
近来,研究者在偏微分方程的求解上取得了令人激动的新进展。他们构建了新型的人工神经网络,实现了更快求解偏微分方程。经过训练后,新型的神经网络不但可以求解单个偏微分方程,而且无需再度训练即可求解整个偏微分方程族。
瑞士苏黎世联邦理工学院的数学家 Siddhartha Mishra 表示,传统的神经网络通常将数据从一个有限维空间映射或转换到另一个有限维空间,但新型的深层网络能够在无穷维空间和无穷维空间之间映射。 毫无疑问,这样的技术将加速涉及偏微分方程的许多模型。作为开发团队的一员,Anima Anandkumar 说:「最终,我们的目标是取代非常缓慢且昂贵的传统求解器。」
当然,新的方法绝不仅仅是作用于加速。对于只有数据却不知用哪种偏微分方程进行建模的情况,训练数据然后使用新型神经网络是唯一的手段。
神经网络入场求解 PDE
偏微分方程有用且极其难以解决的原因是它的复杂性。这使它们能够对各种现象进行建模,例如,如果建模人员想知道流体在空间中任何一点(也称为流场)以及在不同时间下的速度和压力,可能会使用 Navier-Stokes 偏微分方程进行建模。求解 Navier-Stokes 方程,将获得一个描述系统内容的公式。如果对初始和边界条件有足够的了解,例如在时间 t = 0 时的流场值,则可以使用数学工具来解析偏微分方程。
但是偏微分方程常常复杂到没有通用的分析解决方案,对于 Navier-Stokes 方程的最通用形式尚且如此:数学家尚未证明是否存在唯一解,更不用说通过分析实际上找到它们了。
甚至在超级计算机上,用数值法来解决复杂的偏微分方程可能也要花费数月的时间。而且,每次更改初始或边界条件或所研究系统的几何形状都必须重新开始。同样,使用的增量越小(网格越细),模型的分辨率就越高,数值法所需的时间就越长。
2016 年,研究人员尝试将通常用于图像识别的深度神经网络应用于解决偏微分方程。首先,研究人员生成了用于训练深度网络的图像数据。其中输入的是有关对象几何形状和流体初始条件的 2D 图像编码信息,而输出的是相应速度场的 2D 快照。
有了数据,研究人员开始训练他们的神经网络,以学习这些输入和输出之间的相关性。训练主要是先比较输出与预期输出的差别,然后用算法调整神经元的权重,以最大程度地减少生成的输出和预期输出之间的差异。重复此过程,直到输出误差在可接受的范围。 让神经网络学习了如何解决偏微分方程是令人兴奋的,但还有很大的不足。一旦在一定的网格尺寸上进行训练,神经网络就变得非常特定于该分辨率。深度网络已经学会了预估将数据从一个有限维空间映射到另一个空间的函数。但以不同的分辨率求解偏微分方程时,如果想对流场有一个更细致的了解,或更改初始和边界条件,则需要重新开始训练,学习预估新的函数。
DeepONet
而现在的深度神经网络,不仅可以学习预估函数,还可以学习将函数映射到函数的「算子」,并且似乎没有遭受神经网络和其他计算机算法从数据中学习的维数问题。例如,如果想使神经网络的错误率从 10%降至 1%,则所需的训练数据量或网络规模可能会指数增长,从而导致任务无法实现。 在这之前,研究人员必须弄清楚如何让神经网络学习算子来解决偏微分方程。布朗大学的 George Karniadakis 表示,学习算子是从无穷维空间到无穷维空间。算子作用于一个函数,然后将其转换为另一函数。比如,一个算子将一个函数转换为其导数(比如 x 的正弦转换为 x 的余弦),其输入和输出端都是无穷维的。
学习预估算子的深度网络可用于一次求解整个偏微分方程族,对一系列初始和边界条件以及物理参数建模相同的现象。这样的偏微分方程族是输入端的一组函数,而对偏微分方程公式的相应解决方案则由输出端的函数来表示。
1995 年的一项研究表明,浅层网络可以看成是算子。由于涉及神经网络,因此此类算子也叫神经算子,即实际算子的近似值。在 2019 年 10 月,Karniadakis 和他的同事把这种理论延伸到了深度神经网络,提出了「DeepONet」,一种可以学习这种算子并一次求解多个偏微分方程的深度神经网络架构。
论文链接:http://arxiv-export-lb.library.cornell.edu/pdf/1910.03193
DeepONet 的独特之处在于它的分叉式架构,该架构在两个并行网络(「分支」和「主干」)中处理数据。前者学习预估输入侧的许多函数,后者学习预估输出侧的函数。然后,DeepONet 将两个网络的输出合并,以学习偏微分方程所需的算子。训练 DeepONet 的过程包括反复地展示使用数字求解器生成的一族偏微分方程的输入、输出数据,并在每次迭代中调整分支网络和主干网络中的权重,直到整个网络出现的错误量可以被接受为止。 因此,DeepONet 一旦经过训练,就会学会预估算子。它可以在输入端获取代表偏微分方程的数据,然后将其转换为输出端偏微分方程解决方案的数据。假设有 100 个代表了训练数据中没有的初始 / 边界条件和物理参数以及所需的流场位置的样本被提供,那么 DeepONet 可以在不到一秒的时间提供流场。
但是,即使 DeepONet 跟数值求解器一样快速,它仍必须在训练期间执行密集的计算。当必须用大量数据训练深度网络以使神经算子越来越精确时,这可能会成为一个问题。
那么,神经算子还能更快吗?
傅里叶神经算子
去年,加州理工学院的 Anima Anandkumar 和普渡大学的 Kamyar Azizzadenesheli 共同建立了一个称为傅立叶神经算子(FNO)的深度神经网络。
论文链接:https://arxiv.org/pdf/2010.08895v2.pdf
研究者声称新的架构使网络具有更快的速度,能将函数映射到函数,从无穷维空间到无穷维空间,并且在偏微分方程上测试了该神经网络。
解决方案的核心是傅立叶层:在训练数据通过神经网络的每一层之前,先对其进行傅里叶变换。然后,该层通过线性运算处理数据,再执行傅立叶逆变换回原始格式。此过程显然比 DeepONet 的计算更直接,并且能够通过卷积偏微分方程与其他函数的数学运算来求解偏微分方程。在傅立叶领域中,卷积相当于一个简单的乘法,将经过傅立叶变换的数据通过一层已训练过权重的人工神经元传递,然后进行傅立叶逆变换。最后,FNO 学习了整个偏微分方程族的算子,将函数映射到函数。
FNO 深度神经网络同时拥有极快的运行速度。例如,在一个需要进行 30000 次仿真(包括 Navier-Stokes 方程)的求解过程中,对于每个仿真,FNO 花费了不到一秒的时间;而 DeepONet 耗时 2.5 秒;传统的求解器则大概需要花费 18 个小时。
总结
很显然,DeepONet 与 FNO 这两种方法都会超越传统的求解器。两个团队的方法都是成功的,但是与大多黑盒化的神经网络一样,目前我们尚不清楚它们为什么如此出色,以及是否在所有情况下都如此出色。 经过一年的努力,今年 2 月研究人员发表了对 DeepONet 架构长达 112 页的数学分析。研究证明这种方法是真正通用的,不仅仅是偏微分方程,DeepONet 可以将输入端的任何函数集映射到输出端的任何函数集。
而对 FNO 的数学分析尚未完成。不过对于没有确定的偏微分方程的现象,学习神经算子很可能是建模此类系统的唯一方法。比如交通问题,编写精确捕捉交通动态的偏微分方程几乎是不可能的,但是可以学习的数据量却非常之多。
参考内容:https://www.quantamagazine.org/new-neural-networks-solve-hardest-equations-faster-than-ever-20210419/
KDD Cup 2021赛题分享:智能调度优化交通出行
4月23日20:00-21:00,机器之心特邀参与组织2021 KDD Cup赛题的郑冠杰博士,分享「强化学习在智能交通领域的应用」,深入介绍通过数据科学的方法优化交通灯调度,优化城市出行规划。
分享分为三个部分:智能交通信号灯领域现状、开发经验分享以及近期在举行的KDD Cup城市大脑挑战赛。
点击阅读原文,直达直播间。
科技
-
-
- 1秒极速求解PDE:深度神经网络为何在破解数学难题上独具天赋?
- 机器之心报道编辑:力元两种基于深度神经网络的新方法,均可成功求解 PDE,并且能够以更快的速度、更简单的方式建模复杂的系统。有趣的是,和大多神经网络一样,我们猜不透它们为什么如此优秀。研究者们致力于使...
- 机器之心
-
-
-
- 摩尔定律放缓,可重构计算芯片未来可期
- 当下,数字化升级成为诸多行业领域重要发展趋势,作为核心的技术驱动力,AIoT技术的深度赋能加快了行业数字化升级的步伐。AIoT推动着万物互联时代的到来,不过从万物互联到万物智联,很大程度上也还依赖AIoT技术...
- 安全自动化
-
-
-
- 倒计时丨第四届数字中国建设峰会来了,AOC邀您相聚福州!
- 4月25日,由国家互联网信息办公室、国家发展和改革委员会、工业和信息化部、国务院国有资产监督管理委员会、福建省人民政府共同主办,以“激发数据要素新动能,开启数字中国新征程”为主题的第四届数字中国建设...
- AOC未来视界
-
-
-
- 用户被要求少打电话否则可能被销户,运营商“认定骚扰”的方式粗暴吗?
- 随着移动互联网的出现,使用社交软件沟通交流成为日常,打电话的次数自然就越发少了,不过通讯功能作为基础功能,现在却因使用太多而面临销户的风险。近日有媒体报道,中国电信用户夏先生表示,其电话号码在一个...
- 电脑报
-
-
-
- [观察]戴尔科技:勒索攻击的“新常态”,数据保护的“避风港”
- 申耀的科技观察读懂科技,赢取未来!毫无疑问,自2017年WannaCry、NotPetya席卷全球以来,勒索攻击一直以不可忽略的危害性和破坏力,被全球企业和机构视为最大网络威胁之一,在加上2020年,受疫情大流行和全球数...
- 申耀的科技观察
-
-
-
- 助力中国跳水队,这技术我要吹爆它!
- 你可能不知道,NBA的金州勇士队实际上还是一家“科技公司”。勇士老板乔·拉科布,曾是硅谷的风投人,和众多科技公司都有密切的联系。所以他坚信可以通过高科技手段来提升训练水平。于是,勇士队会让队员们使用...
- 全是黑科技
-
-
-
- 进入智能汽车领域的华为,自己为何不造车?
- 虽说之前有过各种各样的传闻,华为官方也一直否认“造车”这件事,不过依旧有不少人站在自己的角度,对华为“指点江山”。然而,看到华为在上海国际车展的这一番动作后,相信不少人都该明白:在“不造车”这件事...
- ZEALER
-
-
-
- |观点|调研显示人们质疑可穿戴设备的医疗保健获益
- 周一刚发表了一篇短文“可穿戴设备将成为人们的健康标配”(参考文章),怎么今天又改变观点,质疑可穿戴设备为人们提供的健康获益,究竟怎么回事儿?周六晚8点,Zoom在线讲座主题“可穿戴技术新进展和未来远景:...
- 全球医生组织
-
-
-
- 随形冷却,把复杂异形的问题交给增材制造
- 自工业注塑制模发展之初,如何使模具表面保持恒温就一直困扰着人们,在注塑成型中,成品的冷却时间在注塑生产周期的占比高达70%,主要原因是:在传统的模具制造中,温度控制或冷却水路只能在直线上钻孔。关键热...
- 未知大陆
-
-
-
- [芯版图]射频前端芯片迎5G风口,“缺芯”困境难成国产化良药
- 【编者按】芯版图:盘点各省/市/园区半导体产业布局情况,探究企业技术/项目布局等。集微网消息,芯片缺货的影响仍然在持续。手机等移动智能终端作为半导体芯片用量最大的市场之一,无疑受到强烈冲击。此前小米...
- MCA手机联盟
-
-
-
- 能祷告、能搬砖,多少机器人已经「混」入了我们的生活?
- 机器人并不会抢走人类的工作,但机器人已经在医学、园艺和宗教等领域证明了他们是人类合格助手。深入各行各业的服务机器人、工业机器人能够使用传感器和机器学习感知、融入,甚至是理解周围的世界,在人们的工作...
- 机器之能
-
-
-
- 高科技产品提升区域竞争力
- 前段时间,贵州宝智达网络科技有限公司在深圳与多家企业达成合作意向,又一次将出自观山湖区的高科技产品成功推向外省。 贵州宝智达网络科技有限公司是一家集成控制系统研发、生产、销售、售后服务的高科...
- 贵阳晚报
-
-
-
- 鼎桥EC520S:智能可视化指挥调度能力深度体验报告
- 近期,我们鲸准评测团队发布了多篇关于鼎桥视音频记录仪EC520S的评测文章,本期评测继续挖掘EC520S强大视音频指挥实时调度能力。下面就正式进入这次测评的正文内容:一、基于5G的视音频指挥调度EC520S是业内唯一...
- 对讲机世界
-
-
-
- 这93款问题APP,你手机里有吗?
- 尚有93款APP未完成整改主要问题:违规收集、使用个人信息近期,工信部组织第三方检测机构对手机应用软件进行检查,重点督促游戏类、工具类存在问题的企业进行整改。截至目前,尚有93款APP未完成整改。广东省通信...
- 光明日报
-
-
-
- 数字化转型时代的新基建,科天音视频技术赋能企业全场景协作
- 关键讯息,D1时间送达!2020年,蔓延全球新冠肺炎疫情向企业的数字化进程提出了极大的挑战,迫使企业更加强烈地意识到数字化转型的必要性和紧迫性。正如清华大学全球产业研究院发布的《中国企业数字化转型研究报...
- 企业网D1net
-