Appearance
未来信息综合技术
更新: 4/10/2025 字数: 0 字 时长: 0 分钟
信息物理系统CPS(⭐)
CPS通过集成先进的感知、计算、通信、控制等信息技术和自动控制技术,构成了物理空间与信息空间中人、机、物、环境、信息等要素相互映射、适时交互、高效协同的复杂系统,实现系统内资源配置和运行的按需响应、快速迭代、动态优化。
CPS本质就是构件一套信息空间与物理空间之间基于数据自动流动的状态感知、实时分析、科学决策、精准执行的闭环赋能体系,解决生产制造、应用服务过程中的复杂性和不确定性问题,提高资源配置效率,实现资源优化。
最终目的:实现资源优化配置。
实现目标的关键:数据的自动流动。
CPS体系架构
单元级
单元级CPS是具备可感知、可计算、可交互、可延展、自动决策功能的CPS最小单元。
一个智能部件、一个工业机器人或一个智能机床都可能是一个CPS最小单元。
系统级
系统级CPS基于多个单元级CPS的状态感知、信息交互、实时分析,实现了局部制造资源的自组织、自配置、自决策、自优化。
多个最小单元通过工业网络(如工业现场总线、工业以太网等),实现更大范围、更宽领域的数据自动流动,实现了多个单元级CPS的互联、互通和互操作,进一步提高制造资源优化配置的广度、深度和精度。
SoS级
多个系统级CPS的有机组合构成SoS级CPS。
SoS级CPS主要实现数据的汇聚,从而对内进行资产的优化和对外形成运行优化服务。
主要功能:数据存储、数据融合、分布式计算、大数据分析、数据服务,并在数据服务的基础上形成资产性能管理和运营优化服务。
SoS级CPS可以通过大数据平台实现跨系统、跨平台的互联、互通和互操作,促成多源异构数据的集成、交换和共享的闭环自动流动,在全局范围内实现信息全面感知、深度分析、科学决策和精准执行。
CPS的建设路径: CPS体系设计
=> 单元级CPS建设
=> 系统级CPS建设
=> SoS级CPS建设
CPS技术体系
- CPS总体技术(顶层设计技术):主要包括系统架构、异构系统集成、安全技术、试验验证技术等。
- CPS支撑技术(基于CPS应用的支撑技术):主要包括智能感知、嵌入式软件、数据库、人机交互、中间件、SDN、物联网、大数据等。
- CPS核心技术(基础技术):主要包括虚实融合控制、智能装备、MDB、数字孪生技术、现场总线、工业以太网、CAXMES/ERP/PLM/CRM/SCM等。
四大核心技术要素:
- 一硬(感知和自动控制):硬件支撑
- 一软(工业软件):CPS的核心
- 一网(工业网络):网络载体
- 一平台(工业云和智能服务平台):对外提供资源管控和能力服务
CPS应用场景
人工智能技术(⭐⭐⭐)
AI
人工智能【AI】是利用数据计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
目标:了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。(图灵测试)
分类:弱人工智能和强人工智能。(分类依据:是否能真正实现推理、思考和解决问题)
关键技术:机器学习、自然语言处理【NLP】、计算机视觉、知识图谱、人机交互、虚拟现实/增强现实
机器学习
机器学习ML是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科。其最初的研究动机是为了让计算机具有人的学习能力以便实现人工智能。具体来说,ML是以数据为基础,通过研究样本数据寻找规律,并根据所得规律对未来数据进行预测。目前,ML广泛用于数据挖掘、计算机视觉、NLP、生物特征识别等领域。
- 监督学习:需要提供标注的样本集
- 无监督学习:不需要提供标注的样本集
- 半监督学习:需要提供少量标注的样本
- 强化学习:需要反馈机制
传统机器学习的领域特征需要手动完成,且需要大量领域专业知识;而深度学习不需要人工特征提取,但需要大量的训练数据集以及强大的GPU提供算力。
自然语言处理NLP
人与计算机之间用自然语言进行有效通信的各种理论和方法。如:机器翻译、语义理解、问答系统。
计算机视觉
模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力,将图像分析人物分解为便于管理的小块任务。
自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。
知识图谱
本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系。知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度去分析问题的能力。
知识图谱可用于反欺诈、不一致性验证、组团欺诈等对公共安全保障形成威胁的领域,需要用到异常分析、静态分析、动态分析等数据挖掘方法。知识图谱在搜索引擎、可视化展示和精准营销方面有很大的优势,已称为业界的热门工具。
人机交互HCI
人机交互主要研究人和计算机之间的信息交换,包括人到计算机和计算机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科的交叉。
传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互及脑机交互等技术。
虚拟现实VR/增强现实AR
虚拟现实或增强现实是以计算机为核心的新型视听技术。结合相关科学技术,在一定范围内生成的与真实环境在视觉、听觉等方面高度近视的数字化环境。
用户借助必要的装备与数字化环境中的对象进行交互,相互影响,获得近视真实环境的感受和体验,通过显示设备、跟踪定位设备、触力觉交互设备、数据获取设备、专用芯片等实现。
人工智能芯片
从广义上讲只要能够运行人工智能算法的芯片都叫做AI芯片。但是通常意义上的AI芯片指的是针对人工智能算法做了特殊加速设计的芯片。现阶段,这些人工智能算法一般以深度学习算法为主,也可以包括其它机器学习算法。
AI芯片按技术架构分类:
- GPU
- FPGA(现场可编程门阵列)
- ASIC(专用集成电路)
- 类脑芯片
AI芯片关键特征:
- 新型的计算范式:AI计算既不脱离传统计算,也具有新的计算特质。
- 训练和推断:AI系统通常设计训练和推断过程。
- 大数据处理能力:满足高效能机器学习的数据处理要求。
- 可重构的能力:针对特定领域而不针对特定应用的设计,可以通过重新配置、适应新的AI算法、架构和任务。
- 数据精度:降低精度的设计。
- 开发工具:AI芯片需要软件工具链的支持。
机器人技术(⭐)
具有以下3个条件的机器可以称为机器人:
- 具有脑、手、脚等三要素的个体;
- 具有非接触传感器(用眼、耳接收远方信息)和接触传感器;
- 具有平衡觉和固有觉的传感器。
该定义强调了机器人应当具有仿人的特点,即它靠手进行作业,靠脚实现移动,由脑来完成统一指挥的任务。非接触传感器和接触传感器相当于人的五官,使机器人能够识别外界环境,而平衡觉和固有觉则是机器人感知本身状态所不可缺少的传感器。
机器人发展过程可以简单分为3个阶段:
- 第一代机器人:示教再现型机器人
- 第二代机器人:感觉型机器人
- 第三代机器人:智能型机器人
- 机器人4.0时代:把云端大脑分布在各个地方,充分利用边缘计算的优势,提供高性价比的服务,把要完成任务的记忆场景的知识和常识很好地组合起来,实现规模化部署。特别强调机器人除了具有感知能力实现智能协作,还应该具有一定的理解和决策能力,进行更加自主的服务。
机器人4.0时代的核心技术:
- 云-边-端的无缝协同计算
- 持续学习与协同学习
- 知识图谱
- 场景自适应
- 数据安全
数字孪生体技术(⭐)
数字孪生体是现有或将有的物理实体对象的数字模型,通过实测、仿真和数据分析来实时感知、诊断、预测物理实体对象的状态,通过优化和指令来调控物理实体对象的行为,通过相关数字模型间的相互学习来进化自身,同时改进利益相关方在物理实体对象生命周期内的决策。
数字孪生体的三项核心技术:建模、仿真和基于数据融合的数字线程。
顶层框架技术:能够做到统领建模、仿真和数字线程的系统工程和MBSE,则称为数字孪生体的顶层框架技术。
底层伴生技术:物联网。
外围使能技术:云计算、机器学习、大数据、区块链。
数字孪生体主要应用于制造、产业、城市和战场。
层次 | 说明 |
---|---|
行业应用层 | 包括智能制造、智慧城市在内的多方面应用 |
共性应用层 | 包括描述、诊断、预测、决策四个方面 |
模型构建与仿真分析层 | 包括数据建模、数据仿真和控制 |
数据互动层 | 包括数据采集、数据传输和数据处理等内容 |
基础支撑层 | 由具体的设备组成 |
大数据技术(⭐⭐)
大数据特点——5V:
- 大规模(Volume)
- 高速度(Velocity)
- 多样化(Variety)
- 价值密度低(Value)
- 真实性(Veracity)
大数据应用领域:制造业、服务业、交通行业、医疗行业等。
大数据分析的步骤大致分为5个主要阶段:
- 数据获取/记录(实时数据+离线数据)
- 信息抽取/清洗/注记
- 数据集成/聚集/表现
- 数据分析/建模
- 数据解释
大数据研究工作将面临的5个方面的挑战:
- 数据获取问题。
- 数据结构问题。
- 数据集成问题。
- 数据分析、组织、抽取和建模是大数据本质的功能性挑战。
- 如何呈现数据分析的结果,并与非技术的领域专家进行交互。
大数据架构发展

相关技术
Hadoop
分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的高速运算和存储。
- HDFS:适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模的数据集上的应用。通常用于存储离线数据。
- MapReduce:分布式计算框架,海量数据离线批处理,不擅长实时的流式处理。
- Yarn:分布式资源调度平台。
HBase
- 分布式、多版本、面向列的非关系型数据库
- 利用HDFS作为文件存储系统,提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储。
- 主要适用于海量数据的实时数据处理(随机读写)。
Hive
- 开源的数据仓库。
- 存储结构化数据(底层依赖HDFS文件系统),提供SQL语法来处理和分析数据(基于Hadoop的MapReduce)。
- 不支持实时查询,适用于海量离线数据的非实时批处理。
Spark
- 基于内存的计算引擎,而非存储引擎,本身并不负责数据存储。
- 通常用于离线数据批处理计算,也可以进行流式计算(只是把每批的数据量变小而已)。
Spark和Hadoop不是互斥关系,一般可以充分发挥他们彼此的优势,在应用中协作。
- Spark没有数据存储模块,依赖于Hadoop的HDFS
- Spark是通用计算框架,资源调度可以使用Hadoop的Yarn
- Spark是统一的计算引擎,Hadoop是一个分布式系统基础框架
- Spark基于内存与迭代运算,简化了MapReduce的计算过程
Flink
实时数据流式处理平台。
其它
- Kafka:一种高吞吐量的分布式发布订阅消息队列。
- Flume:高可用、高可靠的分布式海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接收方(可定制)的能力。
- ZooKeeper:开放源码的分布式应用程序协调服务,是Hadoop和HBase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。
大数据架构
Lambda架构

- 批处理层:存储数据集和生成Batch View。
- 加速层:存储实时视图并处理传入的数据流,以便更新这些视图。
- 服务层:用于响应用户的查询请求,合并Batch View和Real-time View中的结果数据集到最终的数据集。

优点:
- 容错性好
- 查询灵活度高
- 易伸缩
- 易扩展
缺点:
- 全场景覆盖带来的编码开销
- 针对具体场景重新离线训练一遍益处不大
- 重新部署和迁移成本很高
某网奥运中的Lambda架构示例:
Kappa架构

- 输入数据直接由实时层的实时数据处理引擎对源源不断的源数据进行处理。
- 再由服务层的服务后端进一步处理以提供上层的业务查询。
- 而中间结果的数据都是需要存储的,这些数据包括历史数据域结果数据,统一存储在存储介质中。
优点:
- 将实时和离线代码统一起来
- 方便维护而且统一了数据口径
- 避免了Lambda架构中与离线数据合并的问题
缺点:
- 消息中间件缓存的数据量和回溯数据有性能瓶颈。
- 在实时数据处理时,遇到大量不同的实时流进行关联时,非常依赖实时计算系统的能力,很可能因为数据流先后顺序问题导致数据丢失。
- Kappa在抛弃了离线数据处理模块时,也抛弃了离线计算更加稳定可靠的特点。
某证券大数据系统Kappa架构示例:
Lambda架构和Kappa架构对比
对比内容 | Lambda架构 | Kappa架构 |
---|---|---|
复杂度 | 高(需要维护两套系统/引擎) | 低(只需维护一套系统/引擎) |
开发与维护成本 | 高 | 低 |
计算开销 | 大(一直批处理和实时计算) | 相对较小(必要时进行全量计算) |
实时性 | 满足实时性 | 满足实时性 |
历史数据处理能力 | 强(批式全量处理,吞吐量大) | 相对较弱(流式全量处理,吞吐量较低) |
使用场景 | 更适合对历史数据分析查询 | 不是Lambda的替代架构 ,而是简化,更擅 长业务本身为增量数据写入场景的分析需求 |
选择依据:
- 根据两种架构对比分析,将业务需求、技术要求、系统复杂度、开发维护成本和历史数据处理能力作为选择考虑因素。
- 计算开销虽然存在一定差别,但是相差不是很大,所以不作为考虑因素。