桌面云用户更换AD域(有NAS存储)

最近做了一个迁移项目,用户要求桌面云的AD环境重新搭建,同时尽可能地减少对用户的影响。(用户桌面均使用Windows系统的,数据重定向到NAS存储。)

在这个case中,用户数据是否需要迁移是我首要关注的点,从此切入,有两个思路。

思路一:不动原存储

技术分析:

1、Windows AD域用户是通过SID唯一识别用户身份的,新建域后(或者重新安装操作系统后),账户SID会发生变化,无法访问原先个人的数据文件(即使账户名称不变)。为解决这个问题,最原始的办法是在新域中对原存储上的用户个人文件夹手动赋予新SID的权限,但这个方法执行难度很大,原因有以下两点:

  • 对单文件夹赋权需要遍历在旧SID下的所有文件和文件夹,在这个过程中,还没有更新权限的文件用户无法访问。(视文件数量而定,以企业办公用户来看,平均在10-20分钟)。
  • 管理员对所有用户文件夹(假设500用户,每用户有桌面、文档、Profile、收藏夹、个人数据等多个文件夹,总数量上千)逐一手动赋权,无法批量操作。效率低,易出错。

2、通过ADMT将旧域用户完全迁移到新的域,可以保持SID不变。这样上述用户个人的文件夹就不需要刷新权限了

3、管理员仍然需要对存储上的文件系统赋权,但是仅需添加新域的Domain Admins、Domain Users等通用权限,这些可以后台进行(对用户无影响),且只需操作几次。

4、为了确保存储能被两个域同时识别,域间需要有信任关系。

优点

  • 对用户和IT管理员的影响小,工作量小。

技术风险点:

  • 存储是否能同时被新、旧两个域访问。
  • 存储退旧域、加新域,是否能在割接窗口内完成。

思路二:引入临时存储做中转

技术分析:

部署临时存储,将其直接与新域环境下的桌面关联。显然,新旧环境之间是独立的。用户数据需要逐步从原存储迁移到临时存储,直到全部迁移完毕后,将原存储退出旧域,加入新域。再把用户数据全部迁移回原存储。

优点

  • 文件层的拷贝没有技术风险。
  • 原存储可以在业务全部迁走的情况下加至新域。

缺点:

  • 需要设备资源,部署成本高。
  • 用户数据迁移需要迁出、迁回各一次,工作量巨大。

如果是你,觉得哪个更好呢?

发表在 IT技术 | 留下评论

HDS HNAS 4000系列重启现象详解

HDS的NAS存储机头产品HNAS 4000系列可以说是很有历史的产品。然而我们的一些客户在长达数年的使用过程中经常发现某些机头会无预兆地重启,最近找到一些资料,总结一下。

主要内容:

  1. HNAS 4000系列的重启机制是由Intel的FPGA芯片校验技术引发和自身产品设计逻辑决定的
  2. 不变更上一条的情况下,对HNAS升级微码不能彻底解决此问题。
  3. HNAS的后续产品使用了stratix V芯片,这款芯片可以对CRC校验出的位翻转错误进行修复,从而避免重启。
  4. 核实HNAS系列均使用的是stratix IV芯片。

以下为详情资料:

https://community.hitachivantara.com/s/question/0D51J00004fdLSk/hnas-systems-transient-errors-errors-and-unexpected-reboots-

这是HDS官方社区中,和我们遇到的完全相同的案例的提问。在这条提问中,把重启发生的技术原理做了解释。简单介绍一下:FPGA芯片中有一种CRC校验机制时,如果它发现了单bit突然的翻转现象(这就是从二进制的0变成1或者1变成0,这是所有电气设备都可能产生的),它就会发出一个“assert”的状态信号。在HNAS设备中,会因为这个信号重启自身。以消除这种瞬时错误。(更详细解释附于文末)

在下方回复中,有一条Nathan King的评论引起了我的关注。

该评论提到这种翻转是无法预测的,新一代(当时的新一代,即现在N系列存储的上一代产品,  NAS Module集成在SAN存储机框内的产品)因采用了stratix V芯片可以解决。

下面我点开这个链接查看了一下。

https://www.intel.com/content/dam/www/programmable/us/en/pdfs/literature/wp/wp-01135-stxv-seu-mitigation.pdf

主题是关于FPGA芯片的改进信息,关键信息在第四页的表格。

从上表能看到:CRAM Error Correction 只有只有Stratix V代才具备的功能。这个功能可以自动修复CRC错误。

最后,我想核实一下,Hnas设备到底使用的是什么FPGA芯片。官网的datasheet没有列出。我在下面这个网站找到了答案。

https://www.spec.org/sfs2008/results/res2013q3/sfs2008-20130703-00223.html

可以看到,hnas 4100采用的Altera Stratix IV芯片。

最后,附上技术原理的详细解释:

发表在 IT技术 | 标签为 , | 留下评论

《远见,如何规划职业生涯三大阶段》读书笔记

发表在 学习笔记 | 留下评论

Netapp insight 2019 China摘记-有关自动化(Ansible)

12月12日,在上海参加了联想凌拓技术的大会。下午参加了其中一个技术分论坛,有些对我来说比较新鲜的内容。在这里选择一部分整理一下。

(官方视频回放链接在这里:http://insightchina.lenovonetapp.com/sessions.html?from=timeline&isappinstalled=0)

演讲者说的大致内容我用蓝色标识。

这是一个完整的结构框图,这个发表主要是关于存储自动化的。Shell调用是1.0时代,Automation 2.0时代出现很多新名词,有下文将提到的Ansible、Powershell(注意,不是Windows Powershell,已经演化并改名叫Powershell了)、ONTAP REST API等。

<前文略>对于资源交付效率的期望越来越高。

现在数据中心内的资源交付效率不能满足企业的要求,推动了自动化技术的演化。

核心就是减少甚至消除等待。

云现在越来越火,云就是自服务的一种形态。我们可以看到很多传统的企业IT,甚至整个行业,都在逐渐地往云和自服务的形态做转型。

另外呢,可以发现,越来越多的应用已经具备了嵌入式的资源供给能力。应用程序对于基础架构资源的获取,已经是通过工作流触发的自动化来实现。比如说Devops。一个Devops场景可以自动地去创建workspace和持久卷。总之,消除等待是核心。

要应对客户对于自动化越来越高的效率的追求,我们需要对更多的基础架构进行自动化,包括传统数据中心的一体机,私有云场景的各种X86服务器或者软件定义的存储,包括我们在云端的存储资源。

不管是什么形态的存储资源,我们都有提供图形管理界面或者API来提高自动化的效率。但是,API的功能虽然很强大,可以实现基本上主要的基础架构的操作,但是在和前端的不同需求和负载进行对接的时候,会存在高度的自定义。

特别自动化的程序包在跨多平台、多厂商的情况下,会形成非常复杂的兼容性矩阵。

所以统一的配置管理可以帮助我们规范基础架构,降低在自动化的流程创建或者维护过程中的变更风险,提升效率。

Ansible的终极目标,是通过统一的资源配置框架,来管理我们整个基础架构。从存储,到网络,到计算,到虚拟化。

通过Ansible框架,结合经过认证的厂商的自动化模块,我们可以实现统一的配置管理和基础架构的自动化。

我们可以看到现在已经有接近80个Ontap的自动化的模块可用。基本上覆盖了供给、运营、维护三个关键场景和阶段。而且这些经过认证的模块,是兼容所有形态的Ontap的,不管是数据中心的硬件版本,或者是私有云里面的软件定义,或者是云端,都可以通过Ontap的自动化模块,来实现存储底层的编排、自动化交付。右上角的Element是另外一款存储SolidFire操作系统。

我们可以看到在Ansible自动化这个产品下也已经交付了超过20个模块,可以帮助我们应对在DevOps场景下的高性能数据库或者块存储的需求。

自动化是Netapp Fabric战略的一个重要保障。Cloud Volume Service 是Netapp在云端的根据SaaS灵活使用的云存储产品。

通过这些经过认证的模块,我们可以在存储架构编排设计的时候更加灵活,有更多选择。

第二款工具,就是REST API。其实第一款支持API的技术是不管是什么形态的存储资源,我们都提供图形管理界面。

<……中间略>

Ansible可以帮助我们去实现资源的分配,实现立等可取。

接下来,演讲者介绍了Netapp的System manager,还有Powershell toolkit。在演讲的最后,是一个自动化迁移的录屏,大约3分钟就完成了。

这篇演讲涉及最吸引我的名词还是Ansible,于是我查了一下。

官网:https://www.ansible.com/products/automation-platform,打开界面如下图。

验证一下讲师说的,点击learn – > partner ,如下图。

展开Netapp相关的两项,看看认证过的模块数量。

简单统计一下数量,前者Element相关的是18项,后面ontap相关的是48项。好像和前面说的70多项差异较大?

我又回去细看了一下。

原来,PPT上列出的是Netapp自己存储的命令。分享者说的是80个Netapp的模块,也没点击Ansible的命令。可以看到详细的语法。

暂时先了解到这里,以上。

发表在 IT技术 | 留下评论

桌面云和AD域的解耦玩法?

在桌面云实践中,很多企业的第一步就是确定AD域,因为这是做用户认证的使用最广泛的基础架构。但是在大规模环境中,AD域本身的健壮性令人担忧。最近有机会了解到,有厂家的桌面云产品——深信服的在走一条离开AD域绑定的路线,很有特点。本文就记录一下相关信息。

桌面云是为了稳定性想要和AD解耦,但企业中其它一系列应用都是基于AD域的,不可能轻易改变。因此本次PoC的课题是用户仍然使用AD用户来登录桌面云,来看看深信服是怎么做的。

基本要素梳理:

  1. 用户来源:通过LDAP从现有AD域环境中同步。(也可以本地建立用户,本次不涉及)
  2. 用户组的实现:AD的安全组可以同步,但在同步之后,深信服中叫做“角色“。基于角色可以做个性化的管控和资源的分配。

第一步验证:AD域用户和安全组起效

预置条件

  1. 深信服桌面云没有本地建立用户。
  2. 测试域sanfortest.local的/test OU下有ad01、ad02、ad03 三个账户。
  3. ad01、ad03属于安全组aaa。整体结构如下:

测试步骤及现象:

1、用测试域sanfortest.local/test ou下同步ad01、ad02两个用户,注意不同步ad03用户。

注意不勾选“只有导入到本地的用户,才能进行LDAP认证”。导入后的效果如图所示:

2、依次登录ad01-03,发现:ad01可以正常登录,ad02不可登录,ad03可登录。这就是因为ad01、ad03隶属于aaa安全组,现在在深信服中是aaa角色,这个角色有虚拟桌面资源。

注:深信服可以本地新建角色,角色是实现资源分配的第一步。从AD安全组同步过来的角色会默认和用户关联。从上图可以看出,AD同步的有默认描述。

第二步验证:AD域解耦起效

1、AD域只是用户登录验证,实际登录VDI桌面的,并不是AD域用户。从下图系统界面可以很清楚地看到,用户是Administrator,这是一个虚拟桌面的本地用户。

2、AD域故障或不工作时,通过缓存,用户仍然可以登录桌面云。将AD 域控制器的网卡禁用,通过本地缓存功能(最长30天),ad01仍可以正常使用。因此,深信服桌面云可以不受AD域故障的制约。具体配置见下图。

总结

通过以上的验证,基本解耦概念确实是实现了。但是仔细推敲,还是有不少疑问。对于我来说,最不适应的就是用户凭据的变更。登录的时候我是用的AD用户,可实际用桌面的时候,却变了身份,而且所有用户都是本地的用户,甚至都叫同一个名字,那对于用户之间差异性的服务该如何实现呢?我的第一反应是:如果每个用户要配置独立的NAS数据网盘的话,该如何实现。

和现场及远程的深信服工程师交流之后,我提出了以下桌面云项目中的常见个人数据盘相关的需求,目前正等待回应中。

  1. 设备使用传统的NAS品牌(传统的部署就是加域)。
  2. 用户登录时,挂到NAS上的自己独有的盘,且实现基本安全隔离(其它人不能看)。
  3. 对不同用户的网盘有不同特性,有自己的属性(角色),可实现配额等管理需求。
  4. 创建新用户时,在AD新建用户和加入用户组即可,不需要在NAS共享上手动配置文件夹等。

2020年1月6日,收到深信服相关回应如下,补充在此:

第一,不脱域,可以直接实现,其他厂家也支持。第二,脱域,深信服可以通过windows文件共享方式加云盘技术实现,需要使用vdc本地用户名密码认证,不再走ad域认证,但是该模式下无法做到个性化调整配置功能。其他厂家,脱域模式下,连挂载nas都不支持。第三,通过深信服的存储eds可以实现,只是仅支持同一品牌。

发表在 IT技术 | 留下评论

跨存储后台迁移数据的三种方案

在一套IT生产系统中,存储更换的原因,也许是设备过老,买不到备件了,也许是业务增长快,设备性能不够用了等等。当存储要需更换时,就会产生数据迁移的需求。如果旧存储中有CIFS文件这样带状态的数据需要迁移,情况就会更复杂一些。本文记录我所知的在新旧存储之间从后台带权限迁移CIFS文件系统的几种方式。

方案一:传统(一次停机)

对生产系统来说,可能是由多个业务组合起来使用的,下图中假设了两种业务。迁移的时候需要兼顾两者同步进行。共分三个阶段:初次同步 ——》 日常增量 ——》 最后割接。

mark
平时准备,割切切换

说明

  1. 新存储的安装、Share建立、文件系统使用等操作和旧存储完全独立,不影响旧生产系统。
  2. 同步技术可以是存储厂商自己的专有拷贝技术(如HDS True Copy、Shadow Image、Netapp的Snapmirror、HP的Business Copy等),也可以是与存储品牌无关的文件层拷贝技术(如Robocopy、Fastcopy、Xcp、CMT等)
  3. 初始同步时监控设备CPU、磁盘使用率、网络吞吐等重要参数,评估风险和瓶颈因素。(包括底层存储、拷贝虚拟机、NAS网关等整个路径上的所有设备)
  4. 复制条的宽窄代表时间的长短,如果是存储厂商自己的拷贝技术(只可应用于自家品牌设备,同时隔代设备之间也可能存在兼容性制约),不管是基于FC SAN的还是基于NAS的,速度都会比较快。文件级别拷贝会慢一些。
  5. 初始复制是最慢的,后续的常规增量比对时间会缩短,频率、次数可以按需自己设定。通过持续地做增量对比,最主要目的是预测割接时最后一次同步需要的时间,和停机窗口时间进行比对。
  6. 割接时,所有业务要进行最后的同步,确保数据、权限一致。同步较慢的那个业务会成为瓶颈,是重点考量因素。

小结

因为新旧设备IP地址不同,业务端的割接是必要的,目的是告知系统:下一次登录的时候,从新存储的位置取数据。如果存储层面能够实现对于应用无感知——包括网络域名不变化,和底层实际承载对象切换的无感知——业务割接就可以免除。

方案二:虚拟化接管(两次停机)

虚拟化接管一般是同品牌设备之间使用——只有这样才能使用专用拷贝技术。下面以一个存在NAS机头/网关的场景举例,我们用新存储接管旧存储后做数据迁移。仍使用原NAS机头提供服务。如下图所示(红色为新存储、蓝色为旧存储)。

mark

说明

  1. 存储第一次接入时,需要一次停机。这时新存储会接管旧存储。注意,对NAS网关来说,配置的仍然是旧存储,虚拟化对它是透明的。
  2. 停机窗口期间只需要完成虚拟化接管,即可恢复业务。此时,实际读写仍然由旧存储提供,但是路径会先经过新存储。在此同时,新存储后台异步拷贝旧存储的数据。注意,即使拷贝完成后,真正在处理IO的仍然是旧存储。使用过程中新产生的数据也会存储在旧存储(并通过同步程序向新存储迁移)。
  3. 第二次割接窗口,使得存储访问路径改变。IO全部转到新存储。新存储和旧存储之间的虚拟化关系可以保留,也可以终止。

小结

  • 很显然,这种方案最大的弊端是割接次数较多。
  • 由于是纯粹存储底层实现,对NAS网关透明,业务端可以不需要进行配置变更,继续使用原网络路径,比传统方案变更复杂度降低。
  • 值得注意的是,虚拟化接管本身也可能有相当多的操作步骤。(以HDS G系列为例,大约有40条命令)

方案三:虚拟化接管(一次停机)

说明

仍然是存储虚拟化方案。第一步和上一个方案相同,利用一次停机窗口将新存储接入现网。不同点在于,有些存储的软件产品,可以实现虚拟化接管后的新、旧存储同时提供服务。接管完成后,旧存储开始不断地把旧数据向新存储迁移。业务恢复后,处理业务数据遵循以下两个原则:

  • 新产生的数据,直接写入新存储。
  • 只要需读取的数据在新存储有,就从新存储读取,否则从旧存储读取。

显然,当旧数据全部迁移到新存储后,旧存储上就不再有业务访问了,此时可将其退出环境下线,不需要再次停机。

小结

本方案比上一个方案的优势是少了第二次停机窗口,但是否能采取此方案取决于实际环境中的存储品牌是否支持该技术,以及该技术能否兼容具体新、旧存储型号、微码版本等。

总结

  • 生产数据若要迁移到不同存储,停机总是难免的。不是因业务变更停机,就是因设备介入停机。
  • 若迁移发生在同品牌存储之间,一定会存在文件复制速度增加和权限易于保留的优势,同时,也存在更多的技术选择——如虚拟化。相应的,商务成本高。
  • 本文讨论三种方案都是整体性的后台拷贝割接方案。其实至少还有两种可考虑的其它思路:一是化整为零,在单项业务内再做切分,然后逐个处理,以提升成功率;二是改用前台拷贝——即“硬生生”地拷贝所有文件,并保证权限正确。
mark
mark
发表在 IT技术 | 标签为 | 留下评论

后台带权限迁移NTFS文件系统——Robocopy和XCP小心得

一、背景

最近遇到一个CIFS文件数据迁移的测试。

用户用户使用AD域环境,要求在不同的存储设备之间迁移Windows桌面中使用的CIFS数据(域账号不变)。

用户要求NTFS权限必须正确,并且是后台拷贝加最后割接。(不是让每个用户自行登录手动拷贝。)

本文记录异构存储环境下怎么做数据迁移的一些心得,涉及两种工具——微软的Robocopy和Netapp的XCP。

二、工具介绍

Robocopy

Robocopy 是windows server 2003以后就集成在系统的工具,使用它的目的通常就是为了需求复杂的拷贝,比如本次用户要求的复制NTFS权限。

如上图,随便打开自己电脑,打开CMD,输入Robocopy,发现可以使用。

XCP

XCP是Netapp公司的一种命令行拷贝工具。是可以免费使用的(但需要申请license)。

如上图,网址为:xcp.netapp.com。

三、重要结论

1、Windows 2012和Windows 2008中的Robocopy差异,建议2008。

Windows 2012下只要用上Robocopy 的/copy:S参数,哪怕文件没有任何改变,仍然会把所有文件再拷贝一遍。Windows 2008 下,如果文件未发生变化,则不会拷贝。

如果一定要是Windows 2012做迁移。可以采用配合方案:割接开始后,先用XCP 加-acl -nodata参数进行拷贝/同步,再使用robocopy /copy:DAT进行配合做最后更新。(不能/copy:DATS)

2、Robocopy拷贝的带权限信息的文件,如未发生变化,XCP能识别,不会重复拷贝。

3、只用XCP一种工具也可以实现割接前的常规数据拷贝和割接时的最后验证。

注:为了数据完整和安全性,还是推荐最终用Robocopy验证。

四、Robocopy参数精讲

范本:Robocopy /e /zb /COPY:DATSOU /mt \\share_source\fs1 \\share_destination\fs2 /r:0 /w:0

1、/e /z /b

必备参数

2、/COPY:DATSOU

这里的SOU就是本案例中要增加的权限的关键。这里是可以单独指定的。

3、/mt

加/MT参数可以大大提高同步速度,建议开启。

4、/r /w

可以设置为0,加快单次扫描的速度。在割接之前,同步是要进行多次的。

五、XCP参数精讲

范本:XCP sync -acl -nodata – noatime -fallback-user domain\user1 -fallback-group “domain\Domain Users” \\share_source\fs1 \\share_destination\fs2 -parallel 32 -l

1、-acl

加这个参数才会拷贝权限。

2、-nodata、-noatime(类似的,还可以-noctime等)

不比较源文件和目的文件的内容,好处是能够加快执行速度。这个设置会忽略源文件和新文件大小相同、但实际内容不同的情况。举例,某次拷贝时,假设1个txt文件中有一个参数是10ms,拷贝完成。后期,若原文件被修改为12ms,再次同步时,会忽略这个文件。但有例外,如果原始文件的size变化了(比如在原始txt文件中再多加一行内容),则会识别和重新拷贝。

3、-fallback-user、-fallback-group

如果设置了-ACL,这两个参数是必选的,它的本意是应用于这个场景:执行XCP的用户未加入域,而目的地址是有域的,需要在此定义拷贝完之后的域用户和用户组身份信息。

对于本次测试,域用户不变,这两个参数是可以任意设置为不相关的内容,不会影响运行结果。

4、-parallel 32

设置并发线程,默认是8,迁移主机的cpu配置,适当调高这个数字,可以加快扫描和拷贝的速度。设置16个就会在任务管理器看到16个XCP.exe进程。

实际测试中,设为32和16差异不大,都比8明显快。

5、-l

输出拷贝信息

六、其它信息

1、XCP安装需要VC++库,在下载文件中会包含。

2、除本文所提到XCP、Robocop外,还有Fastcopy、HDS厂商的CMT等工具,也可实现带权限后台拷贝。

七、信息扫盲

最后,对于初级人士,我写了一点知识扫盲。

带权限迁移

NTFS权限是微软的文件系统格式,从NT以后就一直沿用至今了。和本测试的相关点在于权限。随便打开一个文件夹邮件点属性,然后点安全。这里可以看到gujin这个用户对这个文件有完全控制权限,这样gujin就可以对它做读取、修改、删除等操作,如下图所示。

与此类似,用户公司中的每个员工原始只对自己个人,或者所隶属的用户组能访问的文件有访问权限权限,彼此之间是不能交叉访问的。如果迁移项目做完,但是权限信息丢失了,比如所有文件都变成everyone可访问,那无疑是失败的结果。

普通拷贝的局限——谁拷贝,权限就是谁的。

如果用具有高级权限的账号(比如说administrator)普通拷贝某用户A的数据,从旧存储位置拷贝到新存储位置。会发现新存储上的这份文件的所有者是administrator,A是没有权限的。

如果A用户自己映射新、旧两个位置,拷贝文件,权限是可以保留的。但这种方法过于繁琐,可行性太差。

发表在 IT技术 | 留下评论

使用Vmware VCG检查服务器与ESXi兼容性

兼容性检查在IT集成项目中是非常有必要的。如果在方案设计时未确认完善兼容性匹配问题,项目实施时就可能出问题。更大的风险是:项目部署时未发生问题,后期运维时发现问题。此时向各IT产品原厂开Case时,原厂容易以不符合兼容性要求甩锅。所以,IT集成项目时,我们应该追求在一开始就把事情做对。

如果你是乙方,那你显然需要关注兼容性,因为你的方案中要包含各种IT产品的版本;如果你是甲方,那你最好也能具备这种知识,因为你可能碰到不靠谱的乙方,多把一道关可以降低项目风险。

本文介绍使用Vmware的官方兼容性工具VCG(Vmware Compatibility Guide)来检查服务器设备兼容性的方法。(Vmware是广受大家信赖的虚拟化品牌,这个Guide也是我所知的IT厂商中最完善和方便的工具)。

首先贴出网址:https://www.vmware.com/resources/compatibility/search.php

如上图所示,VCG是一个网页工具(建议大家保存,我不知道从官网主页如何通过点击进入)。

VCG中能查内容非常多,本文涉及的案例是:某品牌的硬件服务器安装Vmware的虚拟化底层软件ESXi特定版本时,对兼容性的检查工作。

如上图所示:展开What are you looking for的箭头,我们看到了有平台计算、存储、云、vRealize相关产品、瘦客户机(Thin Clients)、图形等等各种菜单。我们这次需要检查的是ESXi和服务器的兼容性,先选择Systems/Servers。

在正式开始之前,我们先看看最终的成果。兼容性检查完成后会产出一份文档,其中标出各服务器相关部件是否兼容目标部署的Vmware产品版本,以及它们是否需要升级微码、固件版本等的建议。

如上图所示:我们可以看到这是对一款华为的服务器产品 Huawei 5885H V5(Intel Gold 6130)安装vSphere ESXi 6.0 U3的兼容性检查。其中“设备类型”和“型号”这两列是输入项、是从用户实际硬件中收集得来的,而“要求驱动版本”和“要求固件版本”是输出项,是下一步需要服务器供应商去确认和实施的。

特别提示一下,对一个服务器设备,完整的兼容性检查范围不只是服务器的主型号,还需要包含存储适配器(Raid卡和FC卡)、网卡。有些缺少经验的集成商检查的内容偏少,从而可能带来风险。

下面,我介绍建议的操作流程:

一、从实际环境中来获取设备型号/设备ID

如果是已经安装了ESXi的设备,可以在控制台界面和命令行中直接查询获取必要参数。如果是新部署设备,可以先在其中一台上安装目标版本的ESXi,这一步的目的是有了操作系统之后便于获得设备信息(尤其是在命令行中可以看到硬件ID,这是最精确的)。

二、对服务器型号、Raid卡、FC卡、HBA卡的每一类,分别输入VCG工具查询。

三、整理查询结果,输出文档。

下面,我就以服务器和NIC分别来举例。

如上图,打开ESXi管理界面的配置页签,选择Processors。

这一页,把我们能获取的关键信息填入要产出的文档。

打开前面介绍过的VCG网站填写相关信息。

如上图步骤,选择、提交。

结果中,可以看到我们要查的目标型号5885H V5,右边Supported Releases里面是有ESXi 6.0 U3的。点击红框进去。

这里可以选择一个较新的BIOS版本,填入最终要输出的文档。

如上图所示,文档前面有说明,为了便于最终用户、服务器厂商、项目集成商等进行其它组合的参考,我们把刚才这个网址也做成链接插入到官网链接这一格。

经过上述步骤,服务器的检查就完成了,相对较简单。下面我们来看一下网卡。

如上图所示,我们还是在ESXi中找到配置页签,选择网卡(Network Adapters),从右边的结果中,我们可以看到总共有三种型号的网卡,分别是:

Intel(R)Ethernet Connection X722 for 1GbE

Intel(R) Ethernet Connection X722 for 10GbE SFP+

Intel(R)Ethernet Controller X540-AT2

这三种都是要检查的,我们就以第一种网卡举例。记住网卡名称vmnic1和vmnic0,下一步查设备ID需要用到(只要记一个就可以,ID是一样的)。

SSH登录ESXi主机的后台(具体操作方法这里略过),输入命令:

vmkchdev -1 I grep nic回车。

如上图,网卡的设备ID就出来了。记住,我们要查询的是vmnic1或0,中间的四个数字就是设备ID。

.

整理一下,变成输入。

下一步,再次打开VCG。

注意在类别里面改成IO Devices,点击。

如上图,红框处改成硬件ID的4个数字,点击Update and View Results

乍一看没有6.0U3,点击加号展开,就看到了,点击6.0 U3。

选择第一行较新的驱动版本,点击View展开详情,这里看到下载路径都贴出来了。

如上图,把查询所得的信息贴到要产出的文档里。这样,这款网卡也完成了。

以此类推,把另外几种网卡和HBA卡也都查一遍,整个兼容性检查就结束了。

最后说明,本文介绍的是Vmware的工具。硬件厂商侧通常也有自己的检查方法或者兼容性列表,可能是公开的,也可能是内部材料。这是甲方应该去要求厂商提供确认的信息的。

延申:工作中发现,VCG不是Vmware网站唯一可以体现兼容性信息的地方,至少还有Marketplace,相关内容以后再展示,谢谢。

发表在 IT技术 | 留下评论

现在是时候把记忆工作“外包”了

不知道大家的身边有没有记忆力特别好的朋友。他们能记住比一般人多得多、也久远得多的各种事情和细节。当久未谋面的同学好友欢聚时难免回忆往事,绝大多数人只能想起事情的大致脉络走向和朦胧的感觉,而好记性的朋友却能把细节记得清清楚楚,像早已不用的专业知识、选修课老师的姓名、风靡过的经典短信等等,都能娓娓道来,让其他人常常不自禁地一拍大腿,惊呼”对啊,没错,就是这样,了不起,这么多年你还记得!”

这真是一种特别的能力,如果没有这样超群的记忆,能用作谈资的细节只会越来越少,可能花不了多久就聊完了,最后就只好说:”当年我们感情真好啊,都在酒里,来来来,干了干了。”

然而,大多数人,还是记性不那么好的人。大脑天生无法保存那么多细枝末节的信息,想象一下,如果想把七岁过生日时无比兴奋的感受一直记在心里,每天回味,一直到现在,那得付出多少精力啊。而且随着生命历程的变化,7岁那年的感受,一方面想必早已不重要了;另一方面,哪怕用笔、影像完完全全地记下当时的细节,现在的自己恐怕也不能体会同样的情绪了。成长无疑是单行道,对于美好情绪、体验、心境,我们只能尝试做一些重温旧梦的行为,却不可能像录音机一样有重播键。

看过一篇文章,里面写道:遗忘是大脑对自己的保护,能够钜细靡遗地记住很多细节的人,并没有我们想的那么快乐和有优势。他们可能为记忆中贮存着太多不重要的微末小事伤神,为想忘都忘不掉而烦恼。普通人的容易遗忘却反而是天然的减负机制,它让我们更关注在眼下和未来最为重要的事情。

说到这里,想起来前一阵子发生在自己身上的一件事。我用一张10元的纸钞,在售票机买了一张2元的地铁票,于是,机器吐给我8个硬币。我把这些硬币装在皮夹里就匆匆走了。第二天,我几乎是迫不及待地把这8个硬币全花掉了,并且毫无铺张浪费的愧疚感——如果这8元是电子账户里的,我想自己一定不会踏进那个超市了。后来我思考了一下这个现象,我的结论是:这些零钱,给我带来了麻烦,而我摆脱麻烦的欲望超过了保有他们价值的欲望。麻烦是指:1、增加了重量,以致于带着钱包就有一种被加持了debuff的感觉,让人不爽;2、在传统的男士钱包中,一般没有零钱口袋的设计,只能随便找个夹层放置,而无论怎么放置,时间长了,它们都会挤压原来钱包的形状,造成形态改变或者使用寿命缩短。看,天生的趋利避害本能就会告诉我,赶紧把这些硬币都花掉吧,花掉它们就解放了。

同样,细枝末节的小事,不也就是像这些扰人的硬币吗?明智的做法,是常常整理,不常用的小文件不要占用我们高速但容量有限的内存(本身记忆),挪到速度虽然慢,但易于取用的移动硬盘(外部信息支持)上。

之前写过一篇文章(链接),里面为了实验目的,通过记忆技巧,成功地让自己记住了一些信息:比如厦门大学的创始人和建设日期、五岳的名字、各种经济学及社会学定律等。然而它们被使用的机会大吗?几乎为零。因此,我也该把它们清理掉了。

有没有发现,在现在的生活中,没有人会没事来考考你,看看你对某些问题的答案是不是能脱口而出了。关于知道得多就是好,我似乎只能想到两个例子,一是显得聪明一点(尤其在童年时期),二是在没有移动互联网的时代方便一点(省得问人)。

当今时代,我们需要获取信息时,主流手段当然是在手机上搜索,甚至直接问语音助手,相关知识应有尽有。于是,能认得路的”活地图”,在绝大多数情况下,都比不过电子地图了,对吗?

由此看来,能记住很多很多的信息,就没有多少价值了。那么,把有限的脑力投入到记住低价值的知识上,真可以说是暴殄天物了。(闪卡这样的技巧还是用在临时性的考试准备上,或者培养必要能力上较为合适。)

其实,以上所说的内容毫不新鲜,大家可能听过这句话:”让大脑成为思考的工具,而不是记忆的工具”。我想,其实在很久很久以前,这一点就可称之为常识了。不信?以下是来自19世纪的证据。


跟他的学识一样,他的无知也很惊人。看样子,他对当代文学、哲学和政治的了解几乎等于零。有一次我引用了托马斯·卡莱尔的话,他竟然带着天真得无以复加的神情问我,这个人是谁,又干过些什么?不过,当我偶然发现他既不知道哥白尼的日心说,也不知道太阳系的构成的时候,心里的惊异才算是达到了顶点。眼下己经是十九世纪,竟然还有某个文明人不知道地球是绕着太阳转的,这样的事情实在是太过匪夷所思,简直让我无法理解。

“你似乎吃惊不小啊。”看到我惊愕的表情,他笑着说道,”如今我已经知道了这个理论,接下来的事情就是尽量把它忘掉。”

“把它忘掉!”

“你得明白,”他解释道,”在我看来,人的大脑最初就像间空无一物的阁楼,里面的摆设得靠你自个儿去选去放。傻瓜才会不加选择,捡到什么就放什么。这样一来,兴许对他有用的那些知识就会被挤得没有地方,往好里说也只能跟一大堆杂物混在一起,让他想用也用不上。反过来,在往大脑阁楼里放东西的时候,技艺精湛的匠人就会格外小心。他只选那些能帮自己干活的工具,别的什么也不要。与此同时,他拥有的工具多不胜数,全都摆放得整整齐齐。要是你以为那间小阁楼的墙壁是有弹性的想撑多大都可以,那可就错了。只管相信我好了,总有那么一天你每增加一点新的知识,就会把以前知道的某件事情忘掉。所以说,千万不能让那些没用的知识挤掉有用的知识,这事情再要紧不过了。”

言归正传,有没有发现,我们生活中总存在着一些事情,它们不至于让我们时时惦记,却不知在什么时候就会突然出现,让我们费心。比如工作中突然需要查询很久以前某个项目中的细节信息,生活中需要找几个月前的某份合约、商品收据、说明书等等。这种情况会让你头痛吗?你会觉得是一种挑战吗?

我个人的感觉是,对于电子文件,我们即使不好好设计、规划最精心合理的文档库结构、存储位置,也还有补救的机会——这就是搜索软件。它使得在糟糕情况下,我们可以把对文件管理的要求降低到”把文件名取得有意义,基本能反映实际情况”这个底线。这样,就算不记得某些文件放在哪个目录下了,借助计算机的搜索能力,还是多半能够找到我们要的文件的。

然而,对于生活中的实体物品,却没有这么方便了。我实在是很不愿意回忆那种心理体验,就是——以为某样东西铁定在某个位置(比如收据、发票通常都保管在某个抽屉),但实际上需要用时却发现竟然不在!有时事出紧急,不得不扩大范围搜索,短时间找到还算幸运,如果一时找不到,心理上只怕是要不断品尝丢失物品的沮丧和自我埋怨了。

出现这种现象,首先是因为在当今每个人拥有的物品数量极多的情况下,不太可能凭记忆力去记住所有物品的信息。其次,对某样物品应该会在某个地方的认知本身是可能存在偏差的。我们知道,大脑本身不是靠谱的记忆工具。上一次接触它是在什么时候?如果没放在这里,放在哪里了呢?这些内容隔的时间越长,记忆只会越模糊。最后,没有什么计算机可以像检索电子文件那样,帮助我们检索实实在在的物品。

其实,细细想一下,针对这几种原因,我们有对策吗?当然有了,在我看来,第一点不是问题,不需要改善——当然不能浪费大脑容量去记忆又多又杂的小事。第二点的解决方法是做备忘,将”什么时候把什么东西放到了哪”记录下来,这样后期便可以回顾参考,这是好记性不如烂笔头的体现,记下来的东西总会可靠一些。对第三点的解决方案是建个电子文档,最少只需要维护好名称、位置、时间三列基本信息。有了这份索引,条目再多,也可以用搜索功能。第二点、第三点结合一下,就是用电子文档记录,大概像下面这样就可以。


然而有意思的是,我发现像我自己,这样一个极力鼓吹文档电子化、云同步、信息随时可查询可取用的人,也从来没有维护过这样的一份表格,用来管理资产物品。为什么?因为它不是最方便的。

据我的了解,收纳类的App是比之更好的解决方案。这种App能干什么事情?其实很简单,就是创建物品和收纳箱这两类电子档案。有一个区别就是,我们创建时除了写下名称、备注之外,可以很方便地用手机或者平板给物品拍一张照,所谓有图有真相,这样就能帮助我们利用视觉来查找。诚然,电子表格也是可以插入图片的,但这需要好几个生硬的步骤,麻烦得太多了。第二个区别,在我们要调整物体位置的时候,在App里面只需要点三四下手指,就能完成一次变更。而如果利用电子表格,编辑也显然要麻烦许多。

其实,写到这里,这种对比情况让我很熟悉,它和我之前写过的思维导图软件太像了。参见链接(XXXXXX),在写那篇文章的时候,我几乎产生了一模一样的思考。明明我用文本、表格记录下来的信息,包括层次结构同样完整,可是为什么思维导图软件就是有一种特殊魅力呢?其实,它恰恰也是利用了线条、画面的刺激视觉、引导视线的能力,并且具有容易变更节点关系的特性,真的是很有意思。

最后,感谢科技的进步,让我们在这个时代有了把记忆”外包”的选项,我们可以如此方便地使用几乎时时刻刻在线的工具箱、资料库来提供信息支持,从而更好地解放大脑,让它可以不用疲于记忆,而有更多的机会去干思考的本职工作。

对工具的使用是不断精进的过程,让我们一起加油,如果有好的建议,也请分享给我,和我交流。谢谢你宝贵的时间。

发表在 学习笔记 | 留下评论

Hello world!

因为工作岗位调整,有机会再次接触技术。于是,关于沉淀工作经验的想法和热情茁壮发芽,促成了这个网站的诞生。

以后,这里就是我的练功房。如果,能够给造访的人带来一些价值,那就更好了。

今年早些时候,我开了个公众号——顾今出品(ID:gujinworks),在这里就把当时的首篇文章附上,后面会把两者同步起来。

发表在 IT技术 | 2条评论