查看原文
其他

数据治理 | 社科研究软硬件体系搭建——虚拟化技术概述与实践

数据seminar 数据Seminar 2022-12-31

我们将在数据治理板块中推出一系列原创推文,帮助读者搭建一个完整的社科研究数据治理软硬件体系。该板块将涉及以下几个模块:

  1. 计算机基础知识
  2. 编程基础
  3. 数据采集
  4. 数据存储
  5. 数据清洗
  6. 数据实验室搭建

本文【虚拟化技术概述与实践】,属于计算机基础知识模块,是读者理解和掌握后续推文的知识基础。


一、什么是虚拟化


近年来,大家可能经常听到“云计算”一词,也在“不经意间”用过基于“云计算”技术的相关产品,例如:铁路12306把网站访问量最大的查询业务分担到“云端”,系统查询能力大幅上升,方便用户快速查询到的列车班次信息。

云计算是一种基于互联网的计算方式,通过这种方式,计算机软硬件资源和信息可以按需提供给需要的用户或服务。云计算被称为个人计算机、互联网之后的第三次IT浪潮,给生活、生产和商业模式带了巨大变革。

本文主要向大家介绍云计算中的关键技术:虚拟化。虚拟化技术将硬件资源抽象成一个资源池,可以实现按需分配资源提高硬件资源的利用率。更通俗的说,虚拟化就是让多个操作系统安装在一套计算机的硬件上。

如果把个人电脑的计算资源看做一口水井,那么提供云计算的服务商就像一个自来水厂,他维护了大量的计算资源与硬件设备,而网线就像是一条水管。消费者只需向云计算服务商购买计算资源,就可以通过网络随时使用计算资源。

其实,我们个人也可以做一个小型云计算服务的提供商。假设我们有一台性能强劲的个人电脑,可以让其他人通过网络访问我们的操作系统(目前主流的操作系统都支持多用户),我们和其他用户一起使用这台电脑的计算资源。但这样做的问题是,多人共用一个操作系统会有安全隐患也不方便。还有一种方法就是使用虚拟化技术,将一个性能强劲的个人电脑,“拆分”成多个小电脑,我们可以给小电脑自由分配内存、CPU和硬盘,然后将这些小电脑提供给其他人使用,用户之间有良好的隔离。


二、如何实现虚拟化

常见的虚拟化是通过虚拟化软件实现的,例如:VMware公司开发的“VMware WorkStation”软件和“VMware ESXI”软件、微软公司开发的“Hyper-V”软件、Quramnet开发的“KVM”等等。

这些软件的基本原理,我们简单地用下面两张图概况:

图1中,虚拟化软件(例如:VMware EXSI)可以看做一款简化的操作系统,计算机硬件由该虚拟化软件调度分配。虚拟化软件可以创建出一个一个的虚拟机,可以把它们看作一台台独立的裸机(未装操作系统),虚拟机装上操作系统后,就可以给用户使用了。

图1

图2中,虚拟机软件(例如:VMware Workstation)可以看作一款普通的应用程序,它需要向主机的操作系统申请资源,创建出虚拟机。与图1相比,这种虚拟化软件配置出来的虚拟机性能较差,但使用和配置较为简单,适合新手使用。

图2


三、安装虚拟化软件

相信大家已经迫不及待想体验一下虚拟化技术了。本小节将带领大家完成虚拟机软件(Vmware Workstation)的安装。

开始之前,需要在进入主机的BIOS,打开CPU的虚拟化支持(注意,不同主机的BIOS界面不同)。

我们推荐 Vmware Workstation 的 Player 版本,非商业使用是免费的,非常适合我们学习。

下载地址:https://www.vmware.com/cn/products/workstation-player.html ,选择 Windows 安装版本。

下载完毕后,打开安装程序。点击【下一步】。

接受许可,点击【下一步】。

选择安装位置,然后勾选两个选项,点击【下一步】。

不检查更新,不加入客户体验,点击【下一步】。

创建快捷方式和开始菜单文件夹,点击【下一步】。

点击【安装】。

稍等片刻后,安装完成,点击【完成】,不需要填写【许可证】。

然后重启电脑。

打开软件,选择免费试用,点击【继续】,然后点击【完成】。

最后打开应用程序就可以使用了,Player 版本功能较少,界面整洁。

上面是 Player 版本的安装方法,Pro版本也一样,下载地址:https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.html,安装方式相同。安装后,我们可以选择30天试用。

Pro 版本拥有更多的功能,打开后的界面与 Player 版本有所不同。


四、创建虚拟机

本节我们使用虚拟化软件 VMware Workstation Player 配置两台虚拟机,一台装 Windows Server 2016 操作系统,另一台安装 CentOS Linux 操作系统。


(一)创建 windows 虚拟机

接下来,我们使用 VMware Workstation 安装一个虚拟机,虚拟机使用的操作系统是 Windows Server 2016 。实验使用的主机是一台装有8GB内存,240GB固态硬盘,操作系统为windows10的笔记本电脑,相信大多数读者的电脑配置都比实验主机的配置更高。

首先,我们需要准备 Windows Server 2016 的操作系统,我们可以从网站"next i tell you" (https://next.itellyou.cn/)上下载,系统镜像文件。

复制 ED2K 连接后,可以使用迅雷等下载工具进行下载(注意:下载工具需要支持 ED2K )。

下载完成后,我们打开 VMware Workstation Player ,在程序界面中点击【创建新虚拟机】。

在选择【稍后安装操作系统】,点击【下一步】。

【客户机操作系统】选择 Microsoft Windows,【版本】选择 Windows Server 2016。

设置好【虚拟机名称】,以及虚拟机存储【位置】,点击【下一步】。

给虚拟机添加一个 100GB 的虚拟磁盘(一种文件类型),勾选【将虚拟磁盘存储为单个文件】便于管理,否则这100GB的磁盘将被拆分成多个虚拟机磁盘,然后点击【下一步】。

然后点击【完成】。

左侧主页窗口会出现我们创建好的虚拟机。

此时的虚拟机还没有安装操作系统,因此,在虚拟机开机前,我们还需要进行一些配置,点击【编辑虚拟机设置】。

在【虚拟机设置】弹窗中,首先将内存设置为4GB。【处理器】保存两个不变。

在【CD/DVD (SATA)】选项中,点击【使用 ISO 映像文件】,选择我们下载好的 Windows Server 2016 操作系统的镜像文件。

在【网络适配器】中,勾选【桥接模式(B):直接连接物理网络】。

上述选项配置完毕后,点击下方【确定】。

现在,我们可以打开让虚拟机开机了,右击虚拟机名称,选择【开机】。

开机后,按任意键进入操作系统安装界面。

稍等片刻后,出现 【Windows 安装程序】界面,点击【下一步】。

点击【现在安装】。

选择【Windows Server 2016 Standard (桌面体验) 】,然后点击【下一步】。

点击【我接受许可条款】后,点击【下一步】。

点击【自定义】安装。

对驱动器0进行分区,这个驱动器0就是我们设置的100GB虚拟磁盘。点击【新建】,然后在【大小】一栏中,填写 50000 (单位MB),从驱动器0中分出一个约50GB的空间。

点击【应用】,出现弹窗,表示windows除了创建一个约50GB的空间外,还会创建一些用于系统功能的其他空间,点击【确定】。

上述操作完成后,我们可以看到,驱动器0出现了 1~4,这四个分区,其中分区4大小约50GB是根据我们的需求生成的,但分区1~3则是为了系统管理需要,由安装程序自动生成。

驱动器0 未分配空间还有51GB,我们选择它,然后点击【新建】,【大小】一栏中默认填充所有剩余的空间大小,最后点击应用。

我们【选中驱动器0 分区4】,点击【下一步】。这一步很关键,表示我们需要在【分区4】

中安装操作系统。

然后,安装程序开始在【驱动器0 分区4】中安装操作系统,这要花费一段时间。

安装完毕后,自动重启,我们也可以点击【立即重启】。

重启后,稍等片刻,进入Windows 初始化设置界面,设置好密码后,点击【完成】。

Windows server 操作系统需要 按【ctrl + alt + delete】进行解锁,如果我们同时按下这些按键,我们的主机会调出【安全窗口】,因此,我们需要用 VMware Workstation 的按键,向虚拟机发送这些组合建,如图所示。

输入密码后就可以使用了。

进入虚拟机后,我们需要配置网络,点击左下角的小电脑图标,然后点击【网络设置】。

在【设置】弹窗中,点击【更改适配器选项】。

双击网卡【Ethernet 0】。

在弹窗中,点击【属性】。

双击【Internet 协议版本 4 (TCP/IPv4) 】

勾选【使用下面的 IP 地址】。

如何填写这些信息呢?我们在实验主机上打开【命令提示图符】,输入:ipconfig,可以看到我们实验主机的IPv4 地址是:192.168.50.99,子网掩码是:255.255.255.0,默认网关是:192.168.50.1(读者的电脑中的网络设置可能与书中的有所不同,请以读者的实际情况为准)。

由于我们的虚拟机网络采用了【桥接模式】,该模式下,虚拟机共享主机的网卡,需要把虚拟机的IP地址设置到与主机一致的网段。虚拟机网络设置如下,然后点击【确认】。

设置完网络后,我们进行测试,打开虚拟机中的【命令提示符】,输入:ping www.baidu.com,回车运行,如果出现图中所示结果,说明网络畅通。

Windows Server 2016 创建完毕,现在我们可以使用虚拟机了。


(二)创建 Linux 虚拟机

我们所说的Linux系统,通常是指一个使用Linux内核的操作系统的集合。Linux内核由林纳斯·本纳第克特·托瓦兹的团队维护,他是Linux内核的创始人。其他开发者团体在Linux内核基础上进行了拓展开发,形成一个又一个的发行版本,我们要安装的Linux操作系统,就是发行版本。

Linux的发行版本有很多,例如:红帽、中标麒麟、银河麒麟、CentOS Linux、Rocky Linux、Ubuntu等等。我们带大家安装一下CentOS操作系统,它是与Windows不同,是免费的操作系统。

我们先下载CentOS的镜像文件,地址:http://mirrors.163.com/centos/7.9.2009/isos/x86_64/

下载完镜像后,我们打开VMware Workstation 16 Player,点击【新建虚拟机】,

在弹出的向导窗口中,点击【稍后安装操作系统】,然后点击【下一步】。

选择【Linux】选项,版本选择【CentOS 7 64 位】。

输入【虚拟机名称】,选择虚拟机保存位置。

设置【最大磁盘大小】为100GB,选择【将虚拟磁盘存储为单个文件】。

最后点击【完成】。

在运行虚拟机之前,我们需要进一步配置。点击【编辑虚拟机设置】。

【内存】设置为4GB。

【处理器】数量设置2个,可以选择开启【虚拟化引擎】,也可以保持默认,如果开启虚拟化引擎,则虚拟机也可以安装虚拟化软件,可以实现在虚拟机中创建虚拟机这样的“套娃”操作。

在 【CD/DVD】一栏中,选择刚才下载好的镜像文件,并选择【启动时连接】。

在【网络适配器】一栏中,选择【桥接模式】。

配置完毕后,选择【确定】。

在左侧窗口中,右击创建好的虚拟机,点击【开机】。

使用键盘上的方向键,选中第一项【Install CentOS 7】。

稍等片刻后,进入CentOS7系统安装界面。将安装程序的界面语言设置为你中文,然后继续。

首先设置【日期和时间】。

设置好后点击【完成】。

然后,设置【语言支持】。

默认已经勾选【中文】,我们需要添加【English】,勾选后点击【完成】。

然后,我们设置【软件选择】。

选择【带 GUI 的服务器】,然后点击【完成】。

接着,我们点击【安装位置】。

选择【自动配置分区】,然后点击【完成】。

然后,我们设置【网络和主机名】。

设置主机名,然后点击应用。

接着,打开网络开关。我们在配置虚拟机的时候,选择了【桥接模式】,此时安装软件会帮我们配置好网络。

我们还需要对网络进行进一步配置,点击【配置】。

点击【常规】,勾选【可用时自动连接到这个网络】,然后点击【保存】,回到【网络和主机】设置界面后,点击【完成】。

然后,我们点击【开始安装】。

我们还需要设置ROOT密码,ROOT是Linux系统的超级管理员,它的密码要设置的复杂一些。

两次输入密码后,点击完成。

我们还需要创建一个用户,毕竟用超级管理员操作,存在安全隐患。

输入用户名和密码后,点击【完成】即可,如果密码过于简单,则连续点击【完成】即可生效。

稍等片刻后,进度条加载完毕,点击【重启】。

重启后,接受许可,最后点击【完成配置】,系统会进行重启。

片刻后,出现用户登录界面,点击用户,然后输入密码,再点击【登录】。

登录后进入欢迎界面。点击【前进】即可。

鼠标右击,点击【打开终端】。

输入,ping www.baidu.com 测试网络是否畅通,出现途中结果表示网络畅通。

CentOS操作系统至此安装结束,大家可以尝试使用Linux操作系统了。




星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧

往期推荐


数据可视化 | 20条超全建议!让你轻松搞定高质量数据可视化~

软件应用 | 主成分分析的Python实现

统计计量 | 内生性!内生性!解决方法大集合

数据资源 | 企研·学术大数据平台:福建农林大学开通试用!

热点资讯 | 三农学术周报(第17期)

统计计量 | 因果推断:混杂因素的敏感性分析

机器学习 | 线性回归:不能忽视的三个问题






数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 陈煌杰


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存