热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SeMITechnologies的搜索引擎开辟了查询数据的新方法

SeMITechnologies正在使用矢量搜索引擎Weaviate构建的内容。SeMI的首席执行官兼联合创始人BobvanLuijt说,它是一种独特的AI优先数据库,使用机器学习
Bob van Luijt,SeMi Technologies,Weaviate

SeMi Technologies SeMi Technologies 首席执行官 Bob van Luijt


公司坐拥大量非结构化数据,并且通常没有能力从中获得太多收益。

现在想象一下有一种方法可以存储数据并且实际上能够向它提出问题,例如,“ABC 公司什么时候与我们签订了第一份合同?” 或“给我看包含蓝天的视频。”

这就是SeMI Technologies正在使用矢量搜索引擎 Weaviate 构建的内容。SeMI 的首席执行官兼联合创始人 Bob van Luijt 说,它是一种独特的 AI 优先数据库,使用机器学习模型输出向量,也称为嵌入,因此得名向量搜索引擎。


他解释说矢量搜索引擎并不新鲜——谷歌搜索是建立在矢量搜索引擎之上的解决方案的一个例子。然而,SeMI 的目标是将这项技术商品化,并拥有一个开源的商业模式,以便任何人都可以使用它。

去年,Van Luijt 创建了一个语义搜索引擎,对 2021 年 Techcrunch 文章进行问答,从而让我的同事 Alex Wilhelm了解了这项技术。


“每个人都可以使用这项技术,我们为那些需要这项技术的公司提供工具和服务,”van Luijt 补充道。“我们不创建或分发实际模型——这是像 Huggingface 或 OpenAI 这样的公司做的事情,或者公司自己制作模型。但是拥有模型是一回事,在生产中使用它们来支持您的搜索和推荐系统是另一回事,而这正是 Weaviate 解决的问题。”

自 2019 年与首席技术官 Etienne Dilocker 和首席运营官 Micha Verhagen 一起创立公司以来,van Luijt 已经看到 SeMI 的技术激发了 100 多个用例,包括 Keenious 或Zencastr等初创公司,他们根据矢量搜索引擎提供的新可能性创建了新业务,以及 Weaviate 提供的结果直接帮助人们的用途,例如医疗领域。

van Luijt 个人最喜欢的一些是他说更“深奥”的,包括人类基因组的矢量化和搜索,整个世界的矢量映射,或所谓的图嵌入,可以很容易地搜索使用 Weaviate,就像在 Meta Researches 的图嵌入上创建的演示SeMI。

SeMI 于 2020 年 8 月从 Zetta Venture Partners 和 ING Ventures 筹集了 120 万美元的种子资金,此后一直受到风险投资公司的关注。从那时起,它的软件被下载了近 750,000 次,每月增长约 30%。Van Luijt 没有具体说明公司的增长指标,但表示下载量与企业许可证和托管服务的销售量相关。此外,对 Weaviate 附加值的使用和理解的激增导致所有增长指标上升,公司耗尽了其种子资金。


尽管种子资金已经消失,但该公司并未积极寻求新的资金。然而,当 SeMI 联合创始人与前 Datarobot 创始人和 New Enterprise Associates (NEA) 的新基金 Cortical Ventures 进行对话时,van Luijt 表示,这些公司向他们展示了他们将如何支持该业务。

“这真的是‘捏我的胳膊让人瞠目结舌’,太棒了,”他补充道。“他们过去所做的一切,支持我们的团队,正是我们正在寻找的,我可以说,虽然非常新鲜,但所有令人惊叹的故事都是真实的。”

这些对话导致 NEA 和 Cortical 共同领导了新一轮 1600 万美元的 A 轮融资。

SeMI 打算将新资金用于招聘美国和欧洲人才,并在其开源社区中加倍投入用于 Weaviate 和矢量搜索。它还将更加关注开源核心的上市和产品,并在机器学习与计算机科学重叠的研究方面迈出第一步。

与此同时,van Luijt 认为,我们正在关注下一波数据库技术浪潮,该浪潮始于 SQL 浪潮,迎来了 Oracle 和 Microsoft 等大赢家,随后是第二波非 SQL 数据库浪潮,其中 MongoDB 等赢家和 Redis。

“我们现在正处于新一代数据库的边缘,那些以人工智能为先的数据库,而 Weaviate 就是一个例子,”他补充道。“我们不仅需要对市场进行有关 Weaviate 的教育,还需要对矢量搜索数据库或 AI 优先数据库进行教育。这是一件非常令人兴奋的事情,因为机器学习带来了一些非常棒的东西。例如,让您的数据库回答数百万甚至数十亿文档的自然语言问题,或者‘理解’数百万张照片或视频包含的内容。”


文章来源:https://techcrunch.com/2022/02/22/semi-technologies-search-engine-data/


推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 解决java.lang.IllegalStateException: ApplicationEventMulticaster not initialized错误的方法和原因
    本文介绍了解决java.lang.IllegalStateException: ApplicationEventMulticaster not initialized错误的方法和原因。其中包括修改包名、解决service name重复、处理jar包冲突和添加maven依赖等解决方案。同时推荐了一个人工智能学习网站,该网站内容通俗易懂,风趣幽默,值得一看。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在数据分析工作中,我们通常会遇到这样的问题,一个业务部门由若干业务组构成,需要筛选出每个业务组里业绩前N名的业务员。这其实是一个分组排序的 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • Oracle分析函数first_value()和last_value()的用法及原理
    本文介绍了Oracle分析函数first_value()和last_value()的用法和原理,以及在查询销售记录日期和部门中的应用。通过示例和解释,详细说明了first_value()和last_value()的功能和不同之处。同时,对于last_value()的结果出现不一样的情况进行了解释,并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • Python SQLAlchemy库的使用方法详解
    本文详细介绍了Python中使用SQLAlchemy库的方法。首先对SQLAlchemy进行了简介,包括其定义、适用的数据库类型等。然后讨论了SQLAlchemy提供的两种主要使用模式,即SQL表达式语言和ORM。针对不同的需求,给出了选择哪种模式的建议。最后,介绍了连接数据库的方法,包括创建SQLAlchemy引擎和执行SQL语句的接口。 ... [详细]
  • Windows7 64位系统安装PLSQL Developer的步骤和注意事项
    本文介绍了在Windows7 64位系统上安装PLSQL Developer的步骤和注意事项。首先下载并安装PLSQL Developer,注意不要安装在默认目录下。然后下载Windows 32位的oracle instant client,并解压到指定路径。最后,按照自己的喜好对解压后的文件进行命名和压缩。 ... [详细]
  • 在Oracle11g以前版本中的的DataGuard物理备用数据库,可以以只读的方式打开数据库,但此时MediaRecovery利用日志进行数据同步的过 ... [详细]
  • 本文介绍了Oracle存储过程的基本语法和写法示例,同时还介绍了已命名的系统异常的产生原因。 ... [详细]
  • OCI连接MySQL_PLSQL Developer连接远程数据库OCI客户端安装方法
    本文介绍了使用OCI客户端连接MySQL和PLSQL Developer连接远程数据库的安装方法,避免了在本地安装Oracle数据库或类似的开发套件的麻烦,同时解决了PLSQL Dev连接远程Oracle时的配置问题。 ... [详细]
author-avatar
梦蕾AngeL
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有