地址:联系地址联系地址联系地址
电话:020-123456789
传真:020-123456789
邮箱:admin@aa.com
阿尔法公社
重度帮助创业者的估值天使投资基金
━━━━━━
阿尔法公社说:Databricks起步于加州伯克利的开源项目,由多位科学家创业者创立 ,亿美元经过多年发展,数据目前是湖引何估值380亿美元的超级独角兽。它的展壮联合创始人兼CEO ,Ali Ghodsi接受了投资人Matt Turck访谈,估值详细谈了Databricks从0到380亿美元的亿美元发展壮大历程,包括如何做产品 ,数据如何进入市场,湖引何如何管好团队,展壮以及他作为领导者的估值修炼过程,欢迎创业者们参考 。亿美元
Databricks是数据一家正在崛起的企业软件巨头。2021年,湖引何它连续获得两轮10亿美元级别的展壮大额融资,估值跃升到380亿美元,它在数据和人工智能领域具有全球雄心 。
Databricks是一个非典型的创业故事,它由七位联合创始人创办,其中大部分是学者 。它从Spark开源项目起步,现在引领了数据湖范式 ,这将加速其与主要竞争对手Snowflake的竞争 。
本文是投资人Matt Turck与Databricks联合创始人兼CEO Ali Ghodsi的对话实录,Matt Turck在2015年就与Databricks的联合创始人Ion Stoica有过对话,对于Databricks的情况相当熟悉 。在本文中Ali Ghodsi将透露Databricks从一个开源项目到大型公司的成长经历 ,以及在团队,产品,进入市场,扩张等方面积累的洞见 ,Enjoy。
科学家创始人们推动Databricks起步
Matt Turck:我们谈一下Databricks的起步 ,AMPLab、Spark和Databricks,这一切是如何开始的?
Ali Ghodsi:我们当时正处于人工智能革新的风口浪尖:Uber刚刚起步 ,Airbnb、Twitter处于早期,Facebook还不是巨头。他们声称,使用20世纪70年代诞生的机器学习算法实现了很好的效果 。
以当时的常识来想这不可能是真的,我们觉得那些算法不可能Work,但他们说,“不,我们得到了非常厉害的结果。”当仔细观察后 ,我们的想法被颠覆了——他们确实获得了惊人的结果 。以现代硬件和大量数据为支撑 ,运用上世纪的算法依旧可以获得令人难以置信的产出 ,我们对此感到震惊。我们想 :"需要使之普适化" 。例如,在Facebook ,他们可以提前检测到情侣分手 ,如果地球上的每个企业都有这种技术 ,这会对现有商业产生巨大影响 。这就是AMPLab的起点 。
Matt Turck :当时AMPLab的Spark是怎么来的?
Ali Ghodsi:图灵奖得主之一戴夫·帕特森当时是伯克利的教授 ,他非常相信人们应该聚在一起 ,打破孤岛 。伯克利的教授们放弃了自己的私人办公室,和所有学生一起在巨大的开放区域办公。
他们试图解决的机器学习问题以当时的技术背景来说是很有挑战性的 。AMPLab里做机器学习的人 ,做数学的人,不得不使用Hadoop,数据的每一次迭代都必须运行MapReduce,这样光是做一次迭代就需要20到30分钟 。所以当时我们决定 :"联合起来,建立一个反应快速的基础架构。”我们在数据上做了很多迭代 。因此,不只是做一次 ,不只是一个SQL引擎 ,而是可以做递归机器学习的东西,并可以极快地找到数据中的内涵模式。
Matt Turck :Databricks创始故事的特殊之处在于 ,你们有七 、八个联合创始人。回过头看,拥有这样一个大的创始团队利与弊是什么 ?
Ali Ghodsi :肯定是有利有弊的 。如果你知道如何真正让由七个人组成的紧密小组真正信任对方,并在一起工作得很好,就会发生令人惊讶的事情 。我认为Databricks的成功很大程度上归因于我们互相的信任。
创业早期的创始人,即使只有两个人 ,他们也会争吵 ,然后可能会在一两年内分裂,这就是问题所在 。我们找到了一种方法 ,使大家真正了解对方的长处和短处 ,使这段创业旅程成为一种乐趣 。
人们总说CEO是地球上最漫长的工作 ,我从来没有这种感觉 。我有很多联合创始人和我在一起,他们一直都在,这对我们来说绝对是一种力量 。如果我们没有这些人 ,就不会有现在的成就 。
从开源项目到公司 ,
从0到100万美元ARR
Matt Turck :你们是如何从学术性的开源项目(Spark)变成一家公司,然后从0做到1000万美元ARR的?这背后是否有任何决定性的时刻,或其他特别的增长手段 ?
Ali Ghodsi:我们从0到100万美元ARR的旅程非常特别,与其他的旅程非常不同 。我们经历了三个阶段 ,第一个阶段是PMF(产品与市场契合)阶段 ,当你有了一个产品,你能找到它与用户之间的契合点么?这对任何公司都存在挑战。
你一旦你找到PMF ,接下来就得弄清楚什么是能将该产品与市场联系起来的渠道 ,你的产品或许符合市场需求 ,但怎么通过渠道销售呢?事实上,我们一开始在这方面走了弯路 ,花了几年时间才确定正确的发展方向 。在这几年里,为了弄清楚Databricks的正确模式我们进行了大量的实验。
接下来 ,让我们从产品开始,然后再谈谈渠道 。
产品方面,我们有在伯克利建立的开源技术 ,但这不一定符合大企业的需要 ,因为在大企业 ,他们没有来自伯克利的博士。因此 ,我们需要为他们大简化问题 ,我们开始在云中托管它,但事实证明 ,即使是云版本对他们来说也太复杂了,无法使用。
因此,我们开始与用户一起进行迭代。我们在这之后削减了很多特性和功能 ,甚至可以说重新构建了一个产品。我们问自己 :"如果我们知道现在的一切,回去再做一次 ,会怎么做 ?"
于是 ,我们重新做了另一个开源项目,Delta,你可以把它看作Spark为大型企业所做的非常简单和自动化的软件。当我们在伯克利时,我们的产品设想是提供尽可能多的功能和设置项,因为可能是一个博士在用它做研究 。但当我们把产品在企业中推广时 ,我们意识到不是每个人都有博士学位,大家不知道如何使用它。这就是早期我们遇到的问题。在渠道方面,错误在于,我们在早期真的是非常相信这种产品主导的增长。
关于销售 ,当时我们的设想是,有了一个简化的产品 ,我们把它做成基于云的产品,就会有人会使用它 ,会为它刷信用卡,我们会非常成功。我们可以雇用销售人员,给年轻人打电话进行推销,我们不会雇佣企业的销售人员。我们更喜欢这种模式,它更便宜,更简单 。
但那是一个错误 。你不能凭空选择你的渠道 。你有一个产品和相应的市场,必须找到正确的渠道来连接它们。
如果你的解决方案是一个基于人工智能的大数据处理系统,那么对你的大企业客户来说这是真正的战略投资,你希望在企业中做决定的人说出 :“我将购买Databricks。”这些人是组织中的高管 ,而真正懂产品的数据科学家则并没有发言权,因为他们比前者低了五个级别。所以 ,你必须能够接触到企业高层,并用他们能理解的语言和他们沟通 ,说清楚你的产品对于他们的作用 。此外,你还需要与负责采购执行人员交谈,以便交易能够顺利完成。因此 ,我们需要改变我们的渠道 ,更加关注企业方面。否则,我们就不会达成目标。