-
运维监控做到什么程度,就达到 BATJ 的水准了?
所属栏目:[经验] 日期:2021-06-01 热度:54
疑问:为什么需要对上报方案有要求呢? 解读:比如腾讯内部的自研日志监控系统CMS,对拥有多种采集方案Agent、SDK、Kafka、ES等,各种不同的采集方案应对不同的场景 Agent:类似filebeat,指定服务器的具体路径,对文件的inode节点进行侦听,发现新增立即[详细]
-
运维真的可以被消灭?“脆弱”的云时代,运维该怎么办?
所属栏目:[经验] 日期:2021-06-01 热度:173
这本书很多专家给了非常高的评价,比如《思考快与慢》的作者丹尼尔卡尼曼这本书改变了他对世界如何运作的看法;樊登带来了心灵和生理上的震撼;逻辑思维罗振宇这是一本未来生存手册。 这个世界充满很多不确定性,前段时间发生的波音 737 事件。为了防止飞机[详细]
-
致 IT 运维:这个时代的年轻人,还能怎么逆火重生?
所属栏目:[经验] 日期:2021-05-31 热度:76
为什么呢?去对比一下当时外企里的70后跟80后的境遇就知道了。90年代后期到2000年初的时候,外资大举进入中国、快速扩张,人才一下子变得很稀缺,相较国企和民企,外企的工资常常是四五倍,而那个好时代,被70后们赶上了。 此后几年,外企在华高速发展,那[详细]
-
Linux防火墙入门说明
所属栏目:[经验] 日期:2021-05-31 热度:73
很多 Linux 发行版本已经自带了防火墙,通常是iptables。它很强大并可以自定义,但配置起来有点复杂。幸运的是,有开发者写出了一些前端程序来帮助用户控制防火墙,而不需要写冗长的 iptables 规则。 在 Fedora、CentOS、Red Hat 和一些类似的发行版本上,[详细]
-
一个800万的代价:运维怎样避免面向监狱编程?
所属栏目:[经验] 日期:2021-05-31 热度:178
事件引发了持续的热议,其中也不乏争议,针对关注度较高的问题,包括防止运维人员的骚操作、如何兼顾运维效率与安全、事件中的甲乙两方存有哪些不足、企业等保工作如何开展和有效落地等,dbaplus社群整理并归总观点如下,希望能给大家今后相关工作的展开和[详细]
-
重点:IT运维体系与发展新趋势
所属栏目:[经验] 日期:2021-05-31 热度:187
首先说一下我的个人分享,可能也限于个人的经历和水平,能力有限,视野有限,欢迎大家指正,也只是代表我现在当前的一个观点,另外可能引用网络的图片和内容。今天分享的内容大概分成五个方面:首先说一下运维定义,做什么,为什么要这么做,我们应该怎么做[详细]
-
运维收藏:HTTPS 证书是如何为网站正名的
所属栏目:[经验] 日期:2021-05-31 热度:164
加密传输保证客户端和服务器之间的信息不是明文传输,保证信息的机密性 身份认证HTTPS协议能够证明服务端的身份,防止假冒网站冒充自己的身份。 对称加密算法 这一部分需要密码学的基础,本段仅做相关总结。对称加密因为密钥只有一个,存在密钥被枚举出来[详细]
-
分析!手把手教您用 ELK 分析 Nginx 日志
所属栏目:[经验] 日期:2021-05-31 热度:94
file:使用file 作为输入源 path: 日志的路径,支持/var/log.log,及[ /var/log/messages, /var/log/.log ] 格式 start_position: 从文件的开始读取事件。 另外还有end参数 ignore_older: 忽略早于24小时(默认值86400)的日志,设为0,即关闭该功能,以防[详细]
-
DevOps已死,NoOps坚挺
所属栏目:[经验] 日期:2021-05-31 热度:149
DevOps和 NoOps的差异 DevOps是开发和运维的融合,是开发和运维工程师共同协作,定义应用从设计到交付全生命周期过程的实践。 NoOp的意思是无须操作。它的理念是去掉所有的平台管理部分,从而降低开发人员与基础设施之间的摩擦。 为何需要DevOps? 随着技术[详细]
-
ping命令的七种用法,看完瞬间变高手
所属栏目:[经验] 日期:2021-05-31 热度:58
TTL值:Time To Live,表示DNS记录在DNS服务器上存在的时间,它是IP协议包的一个值,告诉路由器该数据包何时需要被丢弃。可以通过Ping返回的TTL值大小,粗略地判断目标系统类型是Windows系列还是UNIX/Linux系列。 默认情况下,Linux系统的TTL值为64或255,W[详细]
-
就为了一个原子操作,其他CPU核心不干了
所属栏目:[经验] 日期:2021-05-31 热度:58
接下来,老K把事情的经过告诉了我。原来,我们两个CPU车间各自负责的线程都在执行一个i++的操作,我们都把i的值放到了自己的缓存中,完了之后都没有通知对方,加了两次但结果却只有一次,出现了数据不一致问题。 原子操作 了解清楚事情的原委之后,我向虎[详细]
-
解析VTY Shell配置路由器
所属栏目:[经验] 日期:2021-05-31 热度:189
副标题#e# 由于 RIP 协议使用 UDP 作为传输协议,并被分配了 520 端口,因此我们需要在firewalld配置中允许该端口。 firewall-cmd --add-port=520/udp permanent firewalld-cmd -reload 现在,我们可以使用以下命令启动 FRR 服务: systemctl start frr 使[详细]
-
怎样运用firewall-cmd管理网络服务
所属栏目:[经验] 日期:2021-05-31 热度:180
处理服务、端口和协议 现在,重点关注services、ports和protocols所在行。默认情况下,防火墙将阻止所有端口、服务和协议,而只允许列出的。 在这里,你可以看到允许的服务是非常基本的客户端服务。例如,访问网络上的共享文件夹(samba-client)、与 DNS[详细]
-
运维遇上中台,瞬间阵亡?我是这样理解的
所属栏目:[经验] 日期:2021-05-31 热度:142
从14年底开始,互联网运维理念兴起之后,传统行业也开始日益重视运维平台的建设。甚至按照运维平台的建设情况来划分运维成熟度水平,典型阶段划分如下: 手工运维 以人工作业为主要表现形式的运维,发布、故障处理、巡检等等 脚本化运维 用一些自动化脚本来[详细]
-
老派架构云化后的运维,维护的是什么?
所属栏目:[经验] 日期:2021-05-31 热度:93
一、现状和面临的挑战 传统的IT架构使用了这么多年,所有的监控设备以及网络架构都是基于此打造,那么在传统架构虚拟化、云化后的今天,如何针对虚拟化、云计算的环境如IAAS、PAAS进行运维? 传统监控系统主要是基于传统的环境构建。主要是针对基础的硬件设[详细]
-
互联网大厂的运维都是什么工作内容?30K的总监来告诉你
所属栏目:[经验] 日期:2021-05-31 热度:145
运维人员对公司互联网业务所依赖的基础设施、基础服务、线上业务进行稳定性加强,进行日常巡检发现服务可能存在的隐患,对整体架构进行优化以屏蔽常见的运行故障,多数据中接入提高业务的容灾能力。 通过监控、日志分析等技术手段,及时发现和响应服务故障[详细]
-
DevOps与NoOps现状说明
所属栏目:[经验] 日期:2021-05-31 热度:160
DevOps和 NoOps的差异 DevOps是开发和运维的融合,是开发和运维工程师共同协作,定义应用从设计到交付全生命周期过程的实践。 NoOp的意思是无须操作。它的理念是去掉所有的平台管理部分,从而降低开发人员与基础设施之间的摩擦。 为何需要DevOps? 随着技术[详细]
-
在Fedora命令行下运用防火墙
所属栏目:[经验] 日期:2021-05-31 热度:180
网络防火墙,顾名思义:为了阻止不需要的网络连接而设置的防护性屏障。在与外界建立连接或是提供网络服务时常常会用到。例如,在学校或是咖啡厅里使用笔记本电脑时,你一定不想某个陌生人窥探你的电脑。 每个 Fedora 系统都内置了一款防火墙。这是 Linux[详细]
-
数千亿在数字化转型血本无归,原因在DevOps?
所属栏目:[经验] 日期:2021-05-31 热度:128
数字化转型:Digital Transformation (DT); 开发运维一体化:DevOps; 云计算:Cloud Computing,常见的公有云有Amazon Cloud Service(AWS)、Microsoft Azure Cloud、Google Cloud Platform(GCP)、阿里云(Alibaba Cloud)、腾讯云(Tencent Cloud), 以及华为[详细]
-
万万没想到!智能运维的正确方式:从临场救火到淡然饮茶
所属栏目:[经验] 日期:2021-05-31 热度:100
啥是智能运维?如此神奇? 谈及智能运维的概念,洋气一些可被称为AIOps,正好是人工智能技术与基础运维能力的完美集合,一句话概括,运用机器学习的方法来提升运维效率。 稍微回顾下运维发展我们就能发现,在历经千锤百炼达成的传统自动化运维体系中,重复[详细]
-
PB 级大规模 Elasticsearch 集群运维与调优落地
所属栏目:[经验] 日期:2021-05-30 热度:143
因为游戏业务本身的日志数据量非常大(写入峰值在 100w qps),在服务客户的几个月中,踩了不少坑,经过数次优化与调整,把客户的 ES 集群调整得比较稳定,避免了在业务高峰时客户集群的读写异常,并且降低了客户的资金成本和使用成本。 场景 1:与客户的初[详细]
-
成为 Kafka 高手的诀窍:生产者深度实践总结
所属栏目:[经验] 日期:2021-05-30 热度:158
Client 指的是将会写入消息的多个不同的客户端,这里的客户端是一个抽象化的概念,只要和 kafka server建立了连接,将会写入消息到 kafka 中,无论是否在同一个服务器或者一个进程中,我们都把它称为一个 client。 Broker 指的是加入到了集群里面的服务器[详细]
-
教你利用DNS over TLS
所属栏目:[经验] 日期:2021-05-30 热度:117
类似于下面所示修改/etc/systemd/resolved.conf。确保启用 DNS over TLS 并配置要使用的 DNS 服务器的 IP 地址。 $ cat/etc/systemd/resolved.conf [Resolve] DNS=1.1.1.19.9.9.9 DNSOverTLS=yes DNSSEC=yes FallbackDNS=8.8.8.81.0.0.18.8.4.4 #Domains=~[详细]
-
靠谱脚本:查阅高CPU/内存消耗进程
所属栏目:[经验] 日期:2021-05-30 热度:184
副标题#e# ps是进程状态processes status,它显示有关系统上活动/正在运行的进程的信息。 它提供了当前进程的快照以及详细信息,例如用户名、用户 ID、CPU 使用率、内存使用率、进程开始日期和时间等。 1)检查高 CPU 消耗进程在 Linux 上运行了多长时间的[详细]
-
分析DevOps,数据科学家需要掌握这些
所属栏目:[经验] 日期:2021-05-30 热度:62
为什么数据科学家需要了解DevOps 那么,在众多的工程和软件技能中,数据科学家应该学习哪一种呢?我的钱花在DevOps上了。 DevOps是development和operations的合成词,于2009年在比利时的一次会议上正式诞生。这次会议的召开是为了应对科技公司在历史上经历[详细]