数据清洗是什么?如何进行数据清洗?
博客
深度学习常见的三种模型
03-19
1077
不同于传统的全连接神经网络结构,居室保洁13825404095卷积神经网络引入了局部感受区域的策略,如处理图像任务时,利用图像数据的空间结构以及邻近像素间的相关性。这使得单个神经元仅对局部信息进行响应,相邻神经元的感受区域存在重叠。循环神经网络是专门用于处理时序数据的神经网络,与典型的前馈型神经网络最大的不同在于网络内存在环形结构。隐藏层内部的神经元互相连接,可以存储网络的内部状态,并且包含序列输入的历史信息,以实现对时序动态行为的描述。此外,在卷积层中,所有神经元共享同一个卷积核,从而显著减少了训练参数的数量,提高了网络的泛化能力。
博客
机器学习的概念和类型
11-20
366
机器学习(Machine Learning,ML)是人工智能的一个关键领域,其核心理念是让计算机系统通过学习和适应,而不是通过明确的编程来改善性能。总体而言,机器学习是人工智能的一个关键领域,其核心理念是让计算机系统通过学习和适应,而不是通过明确的编程来改善性能。通过这些带有标签的训练数据,机器学习模型学会了从图像的特征中学习猫和狗的区别,形成了一个能够预测新图像标签的模型。监督学习使用带有标签的训练数据进行训练,算法通过学习这些输入和输出之间的关系,从而能够对新的未标记数据进行预测。
博客
数据湖的概念、发展背景和价值
11-20
219
然而,随着互联网的爆发,数据量急剧增长,传统的数据库架构出现了问题,无法支撑大规模数据的存储和处理。数据湖的涌现:数据湖的引入是为了弥补Hadoop和数据仓库各自的不足,提供了低成本、大容量、事务支持等综合性能,为企业提供更灵活、更综合的数据存储和处理方案。综上所述,数据湖的出现为企业提供了更灵活、更综合、更经济的数据管理和分析解决方案,使其能够更好地利用数据资产,做出更明智的决策。解决数据孤岛问题: 数据湖通过统一的数据存储系统,解决了Hadoop和数据仓库搭配使用时可能出现的数据冗余和数据孤岛问题。
博客
【无标题】
10-31
150
算力网络是一个分布式计算系统或网络,它利用多台计算机或服务器的合作来执行计算任务。算力网络的核心思想是将计算资源分散在多个节点上,以提高计算效率和规模。由多个节点组成,这些节点可以是物理服务器、云计算实例,甚至是个人计算机的空闲处理能力。这些节点通过网络连接在一起,形成一个巨大的计算集群。通常需要考虑任务的性质和节点的可用性,以确保任务能够在合适的节点上执行。一旦任务完成,结果将被传回并合并,以生成最终的计算输出。然而,单台计算机的能力往往无法满足日益增长的计算需求。算力网络代表了计算领域的未来。
博客
【无标题】
10-31
153
边缘计算和容器技术存在多个共同点,如分布式应用的支持以及降低延迟等,两者的结合可以为不同的业务场景提供了丰富的机遇,因此,越来越多的企业开始考虑实现边缘计算与容器技术的结合,但成功实施需要仔细考虑多个关键因素。
博客
使用Secure CRT自动记录日志的方法
07-03
702
可是因为配置太多,SecureCRT窗口一直持续输出翻页,等你想往回看之前的内容,把窗口滚动条拖到最顶上时,发现之前的配置都已经看不见了,只有最近的一部分配置还在。例如上面的例子中,我定义了采用月-日-小时-会话名称.log的文件名称形式,具体参数可以参阅图中长方形内的参数表。PS:在选项部分,个人建议最好选择覆盖文件,例如当在短时间之内重复登录会话,由于会话的日志文件名称相同。如果遇到第一种情况,可以一个个手工快速粘贴配置,但是遇到第二种情况,你的手再快也有时间差。一般情况下,此自定义键我们采用空格键。
博客
Flink运行原理
07-03
710
jobmanager会向资源管理器请求执行任务必要的资源,也就是任务管理器上的插槽(slot).一旦它获取了足够的资源,就会将执行图分发到真正运行它们的taskmanager上。⑤jobmanager申请到资源后,启动TaskManager,同样TaskManager向flink的ResourceManager注册slot,因此jobmanager得知有足够的slots可以使用,就会将job任务提交给TaskManager去执行,同时taskmanager会从HDFS加载flink的jar包和环境配置。
博客
什么是混合云技术架构?
04-04
409
云适配技术通过统一各个云服务的资源接口,形成统一的资源池,再通过统一的适配器为用户提供服务。它将公有云和私有云中涉及到的各种资源和产品组合起来,形成一个生态系统,使用户公有云、私有云融合,帮助提高云资源利用率。它将公有云、私有云进行融合,并与企业IT系统进行匹配,形成一个以云为中心的有机生态整体,帮助企业实现IT架构经济性、安全性、扩展性的多赢。对于混合云的技术架构Gartner认为:所有IT环境都是混合的环境,混合IT既包含传统的IT系统也包含云系统(公有云、私有云),具体架构如下图所示。
博客
常见的数据脱敏方法介绍
04-04
1900
在大数据时代,各种类型的数据被广泛应用于商业、科学和社会管理等领域,但与此同时,也带来了数据泄露和隐私泄露等风险。数据脱敏的方法主要分为基于规则的脱敏方法、加密脱敏方法、伪装脱敏方法、数据扰动脱敏方法、数据屏蔽脱敏方法等多种类型。
博客
大数据中台的作用
03-25
349
大数据中台是一个用于整合、管理、存储和分析海量数据的平台。它的主要五大作用。
博客
微服务与 SOA的关系
12-23
386
微服务的特性决定了要对系统重新进行定义,系统要自治,要独立部署,要有隔离性,只能和别人用轻量级的通信方式,可以有自己专属的技术和数据。在系统内部要切成一个个微服务,每个微服务要具备的特性都要定义清楚,会比原来的 SOA 有更好的操作性。微服务将业务划分多个独立的服务并明确不同的责任,既保证了概念的清晰和自洽,又保证了系统的灵活性、伸缩性。面对杂乱不可靠的现实,又从实现上注重每个服务的自治性,也就是能独立部署,具备自动化、可观察、故障隔离、自动恢复等特性,由此提供高可用保障。
博客
Kubernetes控制器的工作原理
12-23
408
Kubernetes 的核心就是控制理论,Kubernetes控制器中实现的控制回路是一种闭环反馈控制系统,该类型的控制系统基于反馈回路将目标系统的当前状态与预定义的期望状态相比较,二者之间的差异作为误差信号产生一个控制输出作为控制器的输入,以减少或消除目标系统当前状态与期望状态的误差,如图1所示。(2)比较二者的差异,而后运行控制器中的必要代码操作现实中的资源对象,将资源对象的真实状态修正为Spec中定义的期望状态,例如创建或删除 Pod 对象,以及发起一个云服务 API 请求等。
博客
网络流量控制技术简介
12-22
484
在实际的运营中,虚拟机实际的控制权属于租户,网络流量控制就是保证各个租户的的利益,保证租户的访问流量保持一个稳定的状态。网络设备控制可以通过在交换机上对每个端口限定带宽上限等方法实现,但是因为当前交换机的命令接口没有统一标准,所以在对云计算环境下的虚拟机流量进行动态控制时会产生不兼容问题,例如难以通过将虚拟机的网络配置从一台交换机转移到另一台交换机的方法解决这一问题。基于物理主机的控制将流量限制工作分散到每台物理机上,并在物理机操作系统中对每台虚拟机的虚拟网卡进行流量限制。
博客
不同存储资源的应用场景及优缺点介绍
12-22
787
容器应用应当根据应用系统的特点,综合考虑容器应用对存储类型、存储性能及数据高可用等方面的要求,选择最适合的存储资源类型。常见的存储资源应用场景包括三类:将存储挂载在外部宿主机上、将存储放置于容器内部和使用外部共享存储。下面对每种应用场景的优缺点、Volume 类型选择、适用场景进行分析和说明。
博客
容器云的双活与灾备技术
12-21
870
容器应用跨数据中心的双活,是将一个应用的不同副本部署到不同的数据中心,如图 1 所示的 Database 应用。在容器云上的应用多活,更多是采用一个应用在多数据中心部署多份的方案,跨中心多活需要从全局负载均衡、集群配置、存储、应用数据缓存、数据库这五个层面进行相应配置工作,如图 2 所示。(1)基于分布式存储同步能力,每个中心的PaaS平台使用本中心内的存储资源,只有当集群和异地存储的时间延迟和网络抖动满足应用的要求时,才会做跨中心的存储访问。(1)如果使用Redis集群,做跨集群的异步复制。
博客
虚拟机实时迁移流程介绍
12-21
784
在云计算数据中心运行过程中,如果对一台物理机进行检修,就需要将运行在这台物理机上的所有虚拟机迁移到另一台物理机上,此时虚拟机的网络环境也需要实时迁移,否则迁移之后的网络功能会出现问题,例如出现虚拟机中运行的网站可能无法被访问等问题。逻辑架构如图 1所示。第6个步骤非常关键,如果出现其中一个环节没有衔接好,则可能会出现:交换机不知道 MAC 地址对应的物理链路已经发生了改变,所以如果虚拟机在迁移之后本身没有向外发送任何包,那么外界访问虚拟机的包都不会转发给物理机 B,而仍然转发给物理机 A。
博客
资源弹性伸缩的两种方式
12-20
323
通常用户在构建新的应用系统时,都会按照负载的最高峰值来进行资源配置,而系统的负载在大部分时间都处于较低的水平,于是导致了资源的浪费。但如果按照平均负载进行资源配置,一旦应用达到高峰负载时,就无法正常提供服务,影响应用系统的可用性以及用户的体验,所以,在平衡资源利用率和保障应用系统的可用性之间总是存在矛盾。云计算的弹性资源提供的特点正好可以解决目前所面临的资源利用率与应用系统可用性之间的矛盾。资源的弹性伸缩能力通常有两种模式。
博客
容器云PaaS平台的容灾策略
12-20
561
当某个数据中心发生故障时,容器云 PaaS 平台会采用流程驱动的方式,实现快速容灾切换,容灾切换流程如图 1 所示。(1)在集群发生故障时,容器云 PaaS 平台可以自动实现容灾切换。容器云 PaaS 平台会自动进行容器应用的健康检查,在生产数据中心的集群内的应用容器运行故障时,系统自动重启或重建容器,以保证运行容器支撑业务的总能力不变。容器云PaaS平台可以根据不同的业务重要程度、对用户影响范围、故障处理时效等因素划分的的容灾等级可以针对不同的容灾等级采用不同的容灾策略。
博客
Kubernetes分布式架构分析
12-19
270
也就是说,一个 Kubernetes 平台编配的容器应用数量是数千到数万个,要想确保这么多容器应用正常运行,且各自运行在对应的容器主机上,并对这些容器应用的生命周期进行合理管理,就需要Kubernetes自身的架构具有一定的可靠性及比较好的容错能力。分布式架构软件的运行需要多个服务器或虚拟机,一个有效的Kubernetes部署称为一个集群,集群中有多个节点,每个节点可以是物理服务器,也可以是虚拟机,每个节点上运行的操作系统是Linux,且每个节点上都运行着数十到数百个容器。
博客
公有镜像仓库的优势和局限性
12-16
534
(6)成本:公有镜像仓库通常会按照拥有的仓库数量、镜像数量、存储空间、网络带宽、网络吞吐量等来计价,若企业拥有几十万、甚至几百万个镜像,则要使用几十TB的空间来存储镜像,公有镜像仓库的价格将非常昂贵。(2)安全性:公有镜像仓库中的镜像是由各个开发者分享的,这些镜像通常以功能为目的,对镜像内的依赖包、应用版本等没有任何限制。因此,公有镜像仓库带来便捷的同时也可能存在一定的风险,大型企业在使用镜像时,应该根据不同的业务需求,采取公有镜像仓库和自建私有镜像仓库相结合的模式,保证业务的稳定性的同时降低成本。