371：学校，空间计算377（2 / 2）-叮咚系统

“好，那你回去忙你的事情吧。”韩琛说道。

“好的，韩总。”童婧婧回道。

...

深蓝集团2期4号楼一号会议室。

盘古系统研发负责人严辉武将盘古系统所有研发小组组长以及管理层都叫到了会议室进行开会。

“相信大家都很好奇我把大家叫过来干什么，就在刚刚韩总给我下达一个新任务，这个任务对于我们来说是个新的挑战，而且还是一个十分严峻的挑战。”严辉武说完打开韩琛发给他的ppt。

ppt第一页上写着空间计算系统几个大字。

“没错，韩总要我们研发的就是空间计算系统，那么到底什么是空间计算系统呢？想必在座各位都已经看过钢铁侠，钢铁侠使用全息投影设计机甲时，用到的技术就蕴含了空间计算系统。

只不过撰写钢铁侠的编剧并不知道该如何称呼这个东西，我们的任务就是将空间计算系统给实现出来，用韩总说的话来说就是好莱坞负责想象我们负责实现，大家有没有信心将空间计算系统做出来？”严辉武对着台下的众人问道。

“有信心。”台下众人齐声回道。

对于他们这些科研人员来说越是有挑战性越是有意思，这样他们才能将自身的才华彻底发挥出来。

“韩总已经将整个空间计算的框架给做出来了，说真的一开始我都有些怀疑是不是真的，直到我看到韩总发来的ppt，我才知道原来我们的老板这么厉害，我们在座的各位都已经是自认是天才了，但是跟我们老板相比还是差太远了。”严辉武赞叹道。

众人在听到严辉武说韩琛已经将空间系统的框架做出来那是一个惊讶不已。

“我们现在要做的就是将框架里的内容填充进去就行了，对于空间计算这个东西我也是十分迷茫，如果没有韩总设计的框架我都不知道该如何开发得好。”严辉武补充道。

实际上空间计算并不是什么新鲜的东西，在场的一些人也听说过空间计算这个概念。

早在2003年麻省理工学院simon greenwold就在论文中引入这一术语。

只是那个时候的硬件水平十分落后，即使有人研究也没办法把它做出来，因此只有极少数人知道这个东西，也只有极少数人在研究这个项目。

“空间计算是一种整合虚拟现实（vr）、增强现实（ar）、混合现实（mr）等技术的计算模式，旨在将数字信息与真实世界融合在一起。

这种融合创造了一个全新的计算环境，能够感知和理解我们周围的空间，并将数字内容与现实场景相互交织。空间计算的应用范围非常广泛，例如地理信息系统（gis）、智能交通系统、城市规划等领域均可应用空间计算技术。

空间计算最初指对地图及其他地理位置数据进行计算和分析以实现定位与测量的技术，随着xr、虚拟人、数字孪生等技术领域的发展，微观空间的计算需求也在逐渐增加。

语音、视觉、手势等其他更为自然的输入方式将进一步丰富鼠标、键盘、触摸屏等传统交互模式，使人们能够以最适合自己当前场景与业务流程的方式进行接入和交互。

从核心技术维度考量，空间计算是由ai技术、三维重建、空间感知、用户感知、空间数据管理等一系列技术支撑实现的。它是构建元宇宙空间并实现与现实世界自由切换、相互融合的关键技术。

从计算载体维度考量，空间计算可以分为端计算、云计算以及由5g作为重要媒介的云、边、端协同计算。通过空间计算可以实现人、物、机器和虚拟空间的无缝衔接，构建数字孪生体，创造虚实融合的新经济形态，最终驱动新一轮的产业变革。

空间计算反映了我们如何与现实世界中的物体、人、动物和目标进行交互，人类将眼睛中的 2d图像转换为世界的 3d模型，理解世界中的物体，然后指挥我们的手去行动。

例如，当我们倒一杯茶时，我们一边倒，一边看着杯子，确定杯子什么时候满了，然后当杯子满了就停下来，空间计算也是如此，但使用传感器、计算机和执行器。

空间计算涉及多个步骤。

首先，摄影测量、激光雷达和雷达等技术可以捕捉世界的 3d模型，激光雷达或雷达通过测量扫描仪周围物体的激光或无线电信号反射来捕获 3d模型，以自动捕获表示到每个点的距离的点云。

摄影测量学被描述为从照片创建 3d模型的艺术和科学，它结合了来自多个图像或相机的图像，神经辐射场(nerf)等较新的 ai技术可以使用少量图像捕获更丰富的表示。

其次，机器视觉等技术分析这些数据以理解图像，人工智能技术有助于识别场景中的单个对象、查找缺陷、了解步态模式或分析不同工人如何执行流程。

例如，在建筑中，这些技术可以帮助监控工作进度，查明门未正确关闭等问题，并识别承包商忘记安装电源插座等问题。

空间计算的第三个方面涉及采取行动。例如：自动驾驶汽车检测到前方有行人，并决定实时停车，当有人走进房间时，建筑控制系统会根据他们存储在数据库中的偏好来决定调整热量或光线，施工管理系统安排一个团队安装缺失的插头。

由于从物理过程中捕获的数字 3d图像进行了分析，因此这些示例中的操作是可能的...”严辉武照着ppt上的内容向在场众人讲解起来。

此刻在场众人也是听得津津有味疯狂摄取这里面的知识。

实际上ai部门正在研发的sora也涉及到空间计算，很多人都以为sora只是一个视频生成ai，sora是一个继承了文本理解能力的扩散模型，所谓的扩散模型，走的是一个逆向还原噪点图片到原目标图片的逻辑。

open ai充分的发挥了它本身的大语言模型优势，让视频数据可以直接用来训练模型。

正是在这样的基础之上，sora得以理解现实世界的各种物理规律，再根据提示词语转换成视频作品，做出足以以假乱真的效果。这种理解世界的能力是其他ai视频生成模型所不具备的，也是他们视频质感差距的重要原因。

sora就是通过理解现实世界的各种物理规律来实现空间计算的。

之前就说过sora还能够应用到自动驾驶上面，一个能够理解现实世界的各种物理规律的ai，让它来解读无人驾驶还不是十分简单的事情。

只是sora和xr眼镜的用途并不在一个领域上，不过两者之间是可以是进行互惠互助的。