热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据基础大数据挖掘工具(刘鹏《大数据》课后习题答案)

1.简述常用机器学习系统和大数据挖掘工具有哪些。(1)Mahout,ApacheMahout是一个由Java语言实现的开源的可拓展的机器学习算法库。(2)SparkMLli

1.简述常用机器学习系统和大数据挖掘工具有哪些。

   (1)Mahout,Apache Mahout是一个由Java语言实现的开源的可拓展的机器学习算法库。

   (2)Spark MLlib,运行在Spark平台上专门为集群上并行运行而设计,内存中更快地实现多次迭代,适用于大规模数据集。

  (3)其他数据挖掘工具,有SystemML、GraphLab、Parameter Server、Scikit-Learn、Weka、基于R语言的机器学习库、H2O、腾讯大规模主题模型训练系统Peacock与深度学习平台Mariana、百度大规模机器学习框架ELT与机器学习云平台BML、阿里数据挖掘平台DT PAI等。

2.Mahout的适用场合与特点有哪些?

   Apache Mahout主要运作于MapReduce计算模型上,Mahout具有高吞吐、高并发、高可靠的特点,这就保证了其适合于大规模数据的机器学习。

3.Spark MLlib的适用场合和特点有哪些?

   Spark MLlib运行在Spark平台上专门为集群上并行运行而设计,适用于大规模数据集。运行时间和计算成本较低,适用于数据挖掘算法。

4.简述SystemML的体系结构。

                                                  

5.简述Parameter Server的工作原理。

   基于模型参数数据的抽样方法,把所有机器学习算法抽象为对学习过程中一组模型参数的管理和控制,并提供对大规模场景下大量模型参数的有效管理与访问。

                                           

 

6.简述Scikit-Learn的主要模块。

   Scikit-Learn是基于Python的机器学习库,建立在Numpy、Scipy和matplotlib基础之上,使用BSD开源许可证,主要模块有分类、回归、聚类、数据降维、模型选择与数据预处理。

7.简述Weka的工作原理。

   Weka作为一个基于Java的开源数据挖掘平台,实现了大量的机器学习算法,使用GUI界面与数据文件交互并生成可视化的结果,提供了通用API,可以将Weka嵌入应用程序完成特定任务,通过接口,开发者还可加入自行实现的数据挖掘算法。

8.基于R语言的机器学习库有哪些?

   主要有:

  • Clever Algorithms For Machine Learning
  • Machine Learning For Hackers
  • Machine Learning Task View on CRAN—R语言机器学习包列表,按算法类型分组。
  • caret—R语言150个机器学习算法的统一接口
  • SuperLearner and subsemble—该包集合了多种机器学习算法
  • Introduction to Statistical Learning

9.简述H2O机器学习系统的主要功能。

   (1)为应用提供快速的机器学习引擎。

  (2)通过H2O提供的API接口,开发者可以将H2O提供的机器学习服务整合进自己的应用。

  (3)提供易用的WebUI、R、Python、Scala、Java、JSON和Javascript接口,可连接到HDFS、S3、SQL与NoSQL数据源。


推荐阅读
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • Gitlab接入公司内部单点登录的安装和配置教程
    本文介绍了如何将公司内部的Gitlab系统接入单点登录服务,并提供了安装和配置的详细教程。通过使用oauth2协议,将原有的各子系统的独立登录统一迁移至单点登录。文章包括Gitlab的安装环境、版本号、编辑配置文件的步骤,并解决了在迁移过程中可能遇到的问题。 ... [详细]
  • iOS 集成Facebook 第三方分享报错[FBSDKInternalUtility validateAppID]: failed for URL: fbauth2:/error:...
    2019独角兽企业重金招聘Python工程师标准出现这种原因主要是因为info.plist文件里面没有添加一些配置文件转载于:https:my.oschina.net1715 ... [详细]
  • 本文介绍了在Python中使用zlib模块进行字符串的压缩与解压缩的方法,并探讨了其在内存优化方面的应用。通过压缩存储URL等长字符串,可以大大降低内存消耗,虽然处理时间会增加,但是整体效果显著。同时,给出了参考链接,供进一步学习和应用。 ... [详细]
author-avatar
life-death-swallow_204
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有