热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

stata中计算公式命令_Stata博文|Stata在云端的应用

随着越来越多的组织将其IT,数据管理和数据分析需求转移到云端,我经常要回答以下问题:1.Stata可以在云端运行吗?2.可以

随着越来越多的组织将其IT,数据管理和数据分析需求转移到云端,我经常要回答以下问题:

18e5c3f438cbf035918cdd8506437a56.png

1. Stata可以在云端运行吗?

2. 可以在云端运行Stata副本吗?

3. Stata在云端的最佳设置是什么?

4. Stata在云端的性能如何?

在回答这些问题之前,让我们先定义什么是云计算。以下是维基百科对云计算的定义:

“云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备,使用服务商提供的电脑基建作运算和资源。该术语通常用于描述互联网上可供许多用户使用的数据中心。”

我看到用户使用云计算的主要原因是,他们可以轻松地将更多的计算资源(内存和内核)添加到正在从事的项目中,以加快开发和分析的速度。云服务的好处在于它提供了一种轻松的方法来按需添加资源。基本上,仅在需要硬件资源时才付费,这样既节省时间和金钱,又可以相应地扩展不同的项目。

现在我们谈谈云平台。我看到用户使用的两个主要平台是Amazon Web Services和Microsoft Azure。当然还有其他平台。

那么,Stata可以在云端运行吗?Stata当然可以。大多数云计算机是运行Linux或Windows操作系统的虚拟机,Stata可以同时运行这两种系统。现在,应使用Stata的哪个版本?IC,SE或MP?如果要使用大型数据集,并且希望使用的高度并行的Stata命令,那么我绝对建议在云端使用Stata / MP。

用户经常询问是否允许他们在云端使用其Stata许可证。答案是当然可以。我们在本地工作站或服务器,本地虚拟机和云上等效虚拟机之间没有任何区别。您可以在任何所需的计算机上使用Stata许可证,无论是真实的,虚拟的还是在云端的虚拟机。

第三个问题有点难回答。最佳设置很大程度上取决于您的特定需求。您需要回答以下一些问题:

18e5c3f438cbf035918cdd8506437a56.png

1. 用户习惯使用哪种操作系统?

2. 使用的典型数据大小是多少?

3. 在云端分配多少个内核和多少内存?

4. Stata在云端的性能如何?

请注意,这些问题不是特定于云端的,它们实际上适用于任何设置、云端或本地环境,在这些环境中,资源是在用户之间共享的。最后一个问题很重要。一旦您的云端(或本地)计算机上有多个用户同时使用Stata,您必须确保拥有一台足够大的计算机,并为所有用户提供足够的内存和内核。例如,如果您拥有一个Stata / MP 4核2用户的许可证,那么您将希望有一台至少分配了8个核的云机器,每个Stata用户有4个核。或者,您将需要启动多个云实例,为用户提供自己的虚拟机。

下一个考虑因素是内存。如果用户使用的是5 GB大小的Stata数据集,则需要为云计算机分配至少16 GB的RAM,为内存中的数据分配10 GB的RAM,并为运行操作系统增加更多的内存。或者,您可以分配两台具有8 GB RAM的云计算机。

我听到的关于在云端使用Stata的最常见问题是,用户有时会争用RAM,因为一些用户试图在同一台计算机上同时将大型数据集加载到RAM中。解决此问题的最简单方法是按设计方式使用云—缓存多台虚拟机以扩展负载。培训Stata用户有效地使用内存也很容易。这样做的方法是让他们仅从Stata的内存空间中的数据集中加载需要分析的变量,而不是将整个数据集盲目地带入内存。例如,假设用户正在使用包含20,000个变量的美国人口普查数据集,但该用户实际上只希望分析其中的100个变量。Stata能够使用use命令从Stata数据集中仅加载用户所需的变量。

如果您不确定要加载哪些变量或需要搜索要加载的确切变量,则可以使用Stata 16的GUI轻松搜索变量。

一旦有了确切的use命令后,将该命令复制到一个do文件中,并保存以供将来加载数据。

最后一个问题,关于Stata在云中表现如何,同样取决于上面讨论的相同问题。这与询问有关Stata在本地计算机上的性能如何的问题相同。

您的组织将使用的数据集的典型大小是多少?正在使用哪种类型的云虚拟机,要分配多少核心和多少内存?多少用户将同时访问此云虚拟机?正在使用什么Stata命令和模型?云提供商将发布您可以使用的虚拟机实例的规范,并且Stata将在其上执行操作,就像在等效的物理机上执行一样。

数据大小,分配的资源以及同时使用资源的人数将成为构建环境时要考虑的主要问题。

免费Stata机器学习直播培训

03913e04bc6d612f755253efe1e45af4.png

免费的在线直播课程上线啦!2019年11月20日起每周三下午14:00为大家安排了Stata机器学习直播培训!本课程全程免费,准点开课,直播名额有限,大家抓紧报名!

834d0571bdfd5062b265e62f7d657067.gif

文章精选

e64dd1d14c7527b16b7e900bf03908e6.gif

Stata博文 | 使用蒙特卡罗模拟计算功率part 2:使用power运行模拟

Stata博文 | 使用蒙特卡罗模拟计算功率part 1:基础知识

免费培训 |Stata机器学习直播培训

2019 Stata洞察数据科学大会 精彩再现!

在Stata软件中如何自动执行常见任务

Stata软件处理大数据集的神器|ftools和gtools命令博文分享 | 在Stata软件中编写估计命令:编写插件案例分享 | Stata软件处理效应与案例分析Stata处理效应与案例分析网络抓取NFL数据到Stata中Stata软件教程:用 import fred命令导入数据Stata软件教程:Mata运算stata软件教程:结构方程模型stata软件教程:编程初步Stata软件教程系列:Stata在忽略干扰因素下的估计Stata软件最新版本15最全功能介绍分享Stata软件教程系列:DSGE模型的参数估计Stata教程系列:用putexcel命令创建Excel表格 Part 2:宏,图片,矩阵和公式表达式Stata教程系列: 用putexcel命令创建Excel表格 part 1:概念和框架

f47c2b8665c87284a845f76ee576df73.png

7ed13f621a596acec511aa62886a9279.gif



推荐阅读
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • Webmin远程命令执行漏洞复现及防护方法
    本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法,同时提供了防护方法。漏洞存在于Webmin的找回密码页面中,攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外,还指出了参考链接中的数据包不准确的问题,并解释了漏洞触发的条件。最后,给出了防护方法以避免受到该漏洞的攻击。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • 本文介绍了在使用Python中的aiohttp模块模拟服务器时出现的连接失败问题,并提供了相应的解决方法。文章中详细说明了出错的代码以及相关的软件版本和环境信息,同时也提到了相关的警告信息和函数的替代方案。通过阅读本文,读者可以了解到如何解决Python连接服务器失败的问题,并对aiohttp模块有更深入的了解。 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 腾讯安全平台部招聘安全工程师和数据分析工程师
    腾讯安全平台部正在招聘安全工程师和数据分析工程师。安全工程师负责安全问题和安全事件的跟踪和分析,提供安全测试技术支持;数据分析工程师负责安全产品相关系统数据统计和分析挖掘,通过用户行为数据建模为业务决策提供参考。招聘要求包括熟悉渗透测试和常见安全工具原理,精通Web漏洞,熟练使用多门编程语言等。有相关工作经验和在安全站点发表作品的候选人优先考虑。 ... [详细]
  • 本文介绍了如何在Azure应用服务实例上获取.NetCore 3.0+的支持。作者分享了自己在将代码升级为使用.NET Core 3.0时遇到的问题,并提供了解决方法。文章还介绍了在部署过程中使用Kudu构建的方法,并指出了可能出现的错误。此外,还介绍了开发者应用服务计划和免费产品应用服务计划在不同地区的运行情况。最后,文章指出了当前的.NET SDK不支持目标为.NET Core 3.0的问题,并提供了解决方案。 ... [详细]
author-avatar
Q457423356
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有