集群是指将多台服务器集中在一起,目的是实现同一业务;而分布式是指将不同的业务分布在不同的地方,目的是实现不同的业务;前者是串联工作,而后者是并联工作。——《超大流量分布式系统架构解决方案:人人都是架构师2.0》
刚刚接触到架构,发现常用的架构方案为 dns -> lvs(主备(高可用)) -> nginx集群(主备(高可用)),后面的nginx可以集群,lvs可负载转发到多个nginx上,宕机后也可以切换备用机,主备都宕机也可以发送给其他集群中其他nginx服务器,那么如果最外层负责负载的lvs并发过高,比如同时来了1000W并发,lvs挂了切换备用机,过一会又瞬间来了1000W并发。lvs主备都宕机了,是否会出现这种情况?怎么解决?刚刚接触到。。不太懂,麻烦各位告知下...
随着乘客对轨道交通出行服务的要求不断提高,为破解传统运维被动接报、维修周期长等瓶颈和难题,近日,呼和浩特市交通集团地铁科技公司AFC智慧运维系统正式上线。
项目筹备以来,呼和浩特市交通集团地铁科技公司积极运用智能感知、大数据分析、网络云互联等技术,整合现有系统技术资源,确定了“智慧运维”加“运维辅界面”“使用量辅界面”“单站辅界面““AFC服务器集群监控”“AFC数据库集群监控”的“1+5”系统实施方案。将传统轨道交通自动售检票系统中的终端设备状态监控及使用量统计、后台服务器集群运行信息、数据库集群运行信息等全流程数据进行整合,实现终端设备故障实时动态声光预警、接报修全流程自动化记录,通过系统设计与故障接报修工作机制优化相结合,让AFC维修维护管理更加高效、安全。
智慧运维系统平台的正式上线,实现了首府地铁AFC设备由被动报修到主动预警的转变,有效缩短故障延时,提高设备可靠度,在助力首府交通强国的建设中释放更多潜能。
12306刚上线时,立刻就被繁忙的业务干趴窝了,后来听说阿里帮助重建服务器集群才恢复,至今12306都能应付自如。阿里的淘宝天猫在光棍节都能应付,阿里的服务器集群还是很牛的。张彬张嘴就说
中国人忙着回家过年,结果反而是外媒先坐不住了! 西班牙世界报表示,中国春运正重现繁忙热闹的景象,世界最大规模的年度人口
管理机房,一定遇到机房增加服务器的时候的尴尬场景。
昨天晚上小弟接了私单,上架三台服务器,刚刚加电开机5分钟,就听见砰的一声,5台服务器直接断电关机,其中的两台旧服务器可是正在跑业务的。掉电原因是PDU过载。
小弟吓傻了,从来没有见过这种阵式。赶紧联系负责人,被告知应该问题不大,第一是掉电服务器已经使用3年,另外一个是掉电的服务器是vsan集群,是3副本备份,可以满足同时故障两台主机。
小弟稍稍被安慰,但是还是不放心,谁能保证理论的东西那么正确呢?于是他临时找来两个插线板,把每台服务器的一个电源(双电源)接入到一个插板上,另外一个插板接到另外一个插座上,把新购置的服务器接到这个插板上,再次开机,所有服务器都加电启动,旧服务器所在集群数据正常,业务正常。
小弟松了一口气,挣点小钱,差点掉进坑里。
所以,给机房增加服务器的时候,一定了解原来机房的强电结构,配置,能承载的最大负荷,这是一项硬指标,同时双电源的服务器,一个电源接市电,另外一个电源接UPS,这样保证服务器电源的双备份
扩了两台超聚变服务器,VSAN整出一大堆问题。
1、网络的MTU检查(执行较大数据包ping操作)报警,就是刚刚加入的两台新成员与集群中老服务器之间错误,服务器之间MTU配置都是1500,这个报警一会儿出来,一会儿又自动消失,很不稳定,分布式物理交换机没有做任何设置;
2、没有接入网线的物理网卡,“ESXI主机检测到物理网卡上的链路状态关闭”,也是不定时出现,也没有找到解决方法;
3、部分虚拟机的I/O写入延迟较高;
目前没有找到更好的解决方法,有遇到这种情况的老铁,欢迎指导。
看来稳定的vsan一直用着就好,轻易不要增加服务器,否则会出现各种千奇百态的问题。需要花费时间解决。
【2023 Day:59】今日学习案例特训-架构设计篇下的Web系统分层内容。
用户访问层:浏览器,APP, CDN;
负载均衡层:keepalived, LVS四层交换机;
缓存加速层:缓存服务器集群;
Web应用层:Web应用服务器集群,Nginx负载均衡,资源服务器,其他服务器等;
数据库应用层:LVS, keepalived, Mysql集群,Memcached, redis等;