热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

沃趣科技携QData登录美国纽约

背景:BridgeMarketing是纽约一家致力于电子广告行业的科技公司,公司业务包括电子广告投放,第三方数据服务和分析等.技术团队负责人王沛毕业于清华大学和哥伦比亚大学.在使用QData之前,数据分析引擎采用GoogleBigQuery,随着业务的发展,遇到了如下问题:1.

背景: Bridge Marketing是纽约一家致力于电子广告行业的科技公司,公司业务包括电子广告投放,第三方数据服务和分析等.技术团队负责人王沛毕业于清华大学和哥伦比亚大学.在使用QData之前,数据分析引擎采用Google BigQuery,随着业务的发展,遇到了如下问题: 1.

背景:

Bridge Marketing是纽约一家致力于电子广告行业的科技公司,公司业务包括电子广告投放,第三方数据服务和分析等.技术团队负责人王沛毕业于清华大学和哥伦比亚大学.在使用QData之前,数据分析引擎采用Google BigQuery,随着业务的发展,遇到了如下问题:

1.数据分析中常常遇到多表关联,但是Google BigQuery在两表关联时,小表的数据量不能超过1MB,所以基本上只能做简单的查询;

2.Google BigQuery中的数据不支持修改和删除,所以每次都需要清空再重新加载,再加上数据上传,整个过程较长,使得业务的响应速度变慢;?

测试过程:

Bridge Marketing根据自身业务设计测试场景,测试中使用了最常使用的4张表,测试场景主要是:

1.数据装载(数据加载,统计信息分析,创建索引等);

2.单表全表查询(宽表字段超过480个);

3.多表关联查询; 测试过程主要针对沃趣科技的QData和Oracle Exadata1/4配和1/8配。

测试结论:

1.QData完成所有17项测试;

2.QData在硬件配置明显低于Oracle Exadata 1/4配和1/8配的前提下,性能指标明显优于Oracle Exadata 1/8配,跟1/4配不分伯仲;

3.Google BigQuery上的业务将会全部迁移到QData。

用户评价:

Compared with ExaData, QData has the same level of performance both in IOPS and throughput. However, the price of QData is only about one fifth of that of ExaData. It is also very easy to use, maintain and expand. After our boss heard the onsite test result, he said it seems to him that he just hit one million jackpot. He is right, we saved one million dollars by choosing QData.

?测试报告

?

1 测试机型配置 :

1.1 1/4配服务器配置

服务器类型

配置

计算节点

2

48 CPU cores / 1TB 内存

存储节点

3

36 CPU cores / 9.6TB Flash Cache / 36 x 1.2 TB 机器磁盘

1.2 1/8配服务器配置

服务器类型

配置

计算节点

2

24 CPU cores / 512GB 内存

存储节点

3

36 CPU cores / 4.8TB Flash Cache / 18 x 1.2 TB 机器磁盘

1.3 QData服务器配置

服务器类型

配置

计算节点

1

32 CPU cores / 96GB 内存

存储节点

2

32 CPU cores / 6.4 TB Flash

?

2 数据加载测试

2.1 Exadata 1/4配

uniqueFULLNEW为例,数据超过1400万行,容量约28GB,数据加载时间38.14秒搜集统计信息13.79,创建索引17.96,整个时间19.89秒。

2.2 Exadata 1/8配

2.3 QData

2.4 测试结果对比

从对比结果可以看出,QData与Exadata 1/4对比,性能不相上下(或者可以说微弱领先),与Exadata 1/8对比,性能提升40%左右。

?

3 关联测

3.1 测试说明

测试方式

SELECT 1

单表全表扫描

Addr Match

2表基于Addr字段关联

Email Match

2表基于Email字段关联

SELECT 2

4表关联

Test under loads

时间总和


3.2 测试结果
?

?

从测试结果看,QData全面超过Exadata 1/8的机器,并且在大部分测试场景要优于Exadata 1/4。

工作剪影:

QData安装完毕

测试完毕

机房对面的曼哈顿

推荐阅读
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 本文介绍了使用AJAX的POST请求实现数据修改功能的方法。通过ajax-post技术,可以实现在输入某个id后,通过ajax技术调用post.jsp修改具有该id记录的姓名的值。文章还提到了AJAX的概念和作用,以及使用async参数和open()方法的注意事项。同时强调了不推荐使用async=false的情况,并解释了JavaScript等待服务器响应的机制。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Centos7.6安装Gitlab教程及注意事项
    本文介绍了在Centos7.6系统下安装Gitlab的详细教程,并提供了一些注意事项。教程包括查看系统版本、安装必要的软件包、配置防火墙等步骤。同时,还强调了使用阿里云服务器时的特殊配置需求,以及建议至少4GB的可用RAM来运行GitLab。 ... [详细]
  • 本文介绍了在Hibernate配置lazy=false时无法加载数据的问题,通过采用OpenSessionInView模式和修改数据库服务器版本解决了该问题。详细描述了问题的出现和解决过程,包括运行环境和数据库的配置信息。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 本文介绍了如何找到并终止在8080端口上运行的进程的方法,通过使用终端命令lsof -i :8080可以获取在该端口上运行的所有进程的输出,并使用kill命令终止指定进程的运行。 ... [详细]
  • 禁止程序接收鼠标事件的工具_VNC Viewer for Mac(远程桌面工具)免费版
    VNCViewerforMac是一款运行在Mac平台上的远程桌面工具,vncviewermac版可以帮助您使用Mac的键盘和鼠标来控制远程计算机,操作简 ... [详细]
  • 本文详细介绍了云服务器API接口的概念和作用,以及如何使用API接口管理云上资源和开发应用程序。通过创建实例API、调整实例配置API、关闭实例API和退还实例API等功能,可以实现云服务器的创建、配置修改和销毁等操作。对于想要学习云服务器API接口的人来说,本文提供了详细的入门指南和使用方法。如果想进一步了解相关知识或阅读更多相关文章,请关注编程笔记行业资讯频道。 ... [详细]
  • 阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]
  • 如何基于ggplot2构建相关系数矩阵热图以及一个友情故事
    本文介绍了如何在rstudio中安装ggplot2,并使用ggplot2构建相关系数矩阵热图。同时,通过一个友情故事,讲述了真爱难觅的故事背后的数据量化和皮尔逊相关系数的概念。故事中的小伙伴们在本科时参加各种考试,其中有些沉迷网络游戏,有些热爱体育,通过他们的故事,展示了不同兴趣和特长对学习和成绩的影响。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
网络营销论坛闯天涯
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有