热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发岗面试必问:3个超难的案例分析回答汇总!

图源:unsplash来源:读芯术我头次遇见案例研究问题是同德勤的一位经理模拟面谈时。面试官问我如何判断Instagram上各种故事的成功与否。我回答A

图源:unsplash

来源:读芯术

我头次遇见案例研究问题是同德勤的一位经理模拟面谈时。面试官问我如何判断Instagram上各种故事的成功与否。我回答A/B测试会很有效,但面试官告知公司并没有这个能力,要再想想别的办法。我呆住了,因为没别的法子。

 

案例分析已经成为数据科学和产品开发岗面试中不可或缺的一部分,是决定候选人够不够格的关键点。这些面试的目的是模拟公司现有的产品,测试候选人的反应能力、解决问题的能力、有效处理障碍的能力。一般来说,有三种类型的案例研究问题:

 

· 产品相关型

· 模型相关型

· 商业相关型

 

让我们先从一些问题开始。注意,这些问题没有确切的正确答案,更多是为评估是否可以做出现实的假设,并在这些假设下提出解决方案。不会特别详细,本文的主要目的是提供一个大纲或要点来回答这些类型的问题。

问题1

 

试想你在运营一家电子商业网站,有数以百万计的产品列表,并且希望消除可能列在不同类别下重复的产品名称。举个例子,有两种不同的产品名,iPhoneX 和AppleiPhone 10(它们指的是一个东西,但为什么需要两个名字?)。

 

再如,亚马逊在用不同的名字销售同样的N-95口罩,例如:

 

· 新冠口罩

· N-95口罩

 

你的任务是将所有重复的名称改为一个公共名称。但首先,需要找出那些名称重复的产品。你将如何处理这个问题?

 

我的解决方案是:可以用两种方法解决这个问题。利用给定的所有产品的图像提取粒度特征,并对这些特征进行聚类。粒度这个词很重要,因为必须对特定项目的不同版本进行分类,而它们之间会有细微的差异。因此,提取底层特征是很重要的。

 

例如,假设只从每张图像中提取高级特征并进行聚类。算法会将所有iPhone手机聚到一个集群中,将所有三星手机聚到一个集群中,诸如此类。但是我们希望所有的iPhoneX在一个集群,其他型号一个集群。但iPhoneX和iPhone11的图像差异极小,因此必须提取颗粒特征,才能提高聚类算法的性能。

 

但假如面试官反驳:假如有些产品根本没有图像,那该怎么办呢?可以对每个产品的描述进行聚类,并对它们进行分类。首先对描述执行数据清理,然后使用TF-IDF或NLP中任何其他类似方法,再执行集群。

 

图源:unsplash

问题2

 

假设还是为一家网站工作,给了一个大型数据库,其中每一行代表一个页面视图。网站不止一页。该如何区分机器账号和真实用户?

 

我的解决方案是:基本上,机器账号是为从网站中提取数据,肯定会有很多的页面视图,并且每次页面视图的持续时间会很短,因为它可以非常快速地提取信息。

 

另一方面,真实用户访问的页面相对较少,在每个页面上花费的时间更多。除了上述两个假设之外,我们可以做的另一个假设是通过IP地址或其他设备签名来跟踪每个唯一的访问者。

 

使用SQL或任何其他查询语言找到每个访问者访问的页面总数、总页面查看时间,和平均页面查看时间。然后,可以使用基于上述指标的聚类算法将机器账号和真实用户分成两个聚类。

 

问题3

 

图源:unsplash

假设你是领英项目小组中的数据分析师。假设你有一个新闻推送排名算法(我们都知道,当每个用户登录时,他们会看到一个新闻推送,里面有各种各样的文章,这些文章是用排名算法排序的)。如何衡量新闻推送算法的成功?

 

我的解决方案是:第一步是提出评估算法有效性的指标。基准指标可以是点击率。然而,更好的指标例如分享和评论,可以评估内容的吸引力。

 

面试官可能会问以下问题测试思考深度:如果上面提到的某些指标上升而另一些下降了呢?你会怎么做呢?你认为哪个指标更重要?

 

笔者强烈认为Linkedin的视角在这里非常重要。如果他们试图从业务的角度评估算法,点击率将是一个更重要的指标,但如果评价是纯粹从用户体验的角度来看,评论将是一个重要的指标。现在,再对模拟面试中遇到的问题做出回答。

 

如何判断Instagram上的故事是否成功?我们都知道Ins故事能让用户24小时内与他人分享照片和视频。用户的朋友可以看到这些故事,回复和分享这些故事。笔者认为这个特性试图实现两个目标。

 

· 用户留存——确保用户再次回到平台。

· 参与度——确保用户更多地使用这个功能。

 

Saiteja Kura想提出这样的指标:

 

· 每个用户发布的平均故事

· 每个用户平均观看的故事

 

除了上述两个度量标准,另一个对评估故事成功性至关重要的度量标准,是发布多个故事的用户的百分比。

 

回答案例分析问题不仅需要技术知识,还需要对业务需求的深刻理解。创造高效又适合企业的产品一直是市场的主导。我坚信发展商业视角来解决现实问题是非常重要的。

近期开班情况

课程详情请扫码咨询


推荐阅读
  • 面试经验分享:华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试
    最近有朋友去华为面试,面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败,因为缺乏基础知识。面试问题涉及 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • 本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型,其中DDL语句用于定义、删除和修改数据表,关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外,还介绍了常见的数据库数据类型,包括integer、text和real。 ... [详细]
  • FineReport平台数据分析图表显示部分系列接口的应用场景和实现思路
    本文介绍了FineReport平台数据分析图表显示部分系列接口的应用场景和实现思路。当图表系列较多时,用户希望可以自己设置哪些系列显示,哪些系列不显示。通过调用FR.Chart.WebUtils.getChart("chartID").getChartWithIndex(chartIndex).setSeriesVisible()接口,可以获取需要显示的系列图表对象,并在表单中显示这些系列。本文以决策报表为例,详细介绍了实现方法,并给出了示例。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 腾讯安全平台部招聘安全工程师和数据分析工程师
    腾讯安全平台部正在招聘安全工程师和数据分析工程师。安全工程师负责安全问题和安全事件的跟踪和分析,提供安全测试技术支持;数据分析工程师负责安全产品相关系统数据统计和分析挖掘,通过用户行为数据建模为业务决策提供参考。招聘要求包括熟悉渗透测试和常见安全工具原理,精通Web漏洞,熟练使用多门编程语言等。有相关工作经验和在安全站点发表作品的候选人优先考虑。 ... [详细]
  • Unity3D引擎的体系结构和功能详解
    本文详细介绍了Unity3D引擎的体系结构和功能。Unity3D是一个屡获殊荣的工具,用于创建交互式3D应用程序。它由游戏引擎和编辑器组成,支持C#、Boo和JavaScript脚本编程。该引擎涵盖了声音、图形、物理和网络功能等主题。Unity编辑器具有多语言脚本编辑器和预制装配系统等特点。本文还介绍了Unity的许可证情况。Unity基本功能有限的免费,适用于PC、MAC和Web开发。其他平台或完整的功能集需要购买许可证。 ... [详细]
author-avatar
阿里根本_436
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有