Cloudera
Cloudera, Inc. | |
---|---|
Тип | Частная компания |
Листингна бирже |
NYSE:CLDR |
Основание | 2009 |
Основатели |
Кристофе Бишилья, Амр Авадалла, Джеффри Хаммербахер, Майкл Ольсон |
Расположение | США:Пало-Альто |
Ключевые фигуры |
Рейли, Том (генеральный директор), Дуг Каттинг(главный архитектор) |
Отрасль |
разработка программного обеспечения(МСОК:6201 ) |
Продукция | Коммерческая версияHadoop,Cloudera Impala[англ.] |
Оборот | ▲$301 млн (2018) |
Операционная прибыль | ▼−$389 млн (убыток, 2018) |
Чистая прибыль | ▼−$386 млн (убыток, 2018) |
Капитализация | $2,66 млрд (7 сентября 2018)[1] |
Сайт | cloudera |
Медиафайлы на Викискладе |
Cloudera—американскаякомпания, разработчик дистрибутивовApache Hadoopи ряда программных продуктовэкосистемы Hadoop.
Деловую модель компании сравнивают с бизнесомRed Hat— Cloudera создаётдистрибутивы программных продуктовдля организаций на основесвободного программного обеспеченияи извлекает прибыль, оказываятехническую поддержкупоставляемых решений[2][3].С бумом технологий «больших данных», Cloudera неоднократно отмечена как одна из самых многообещающих компаний, способных решать задачи соответствующего класса[4][5].
В 2018 году поглотила основного конкурента на рынке Hadoop-дистрибутивов — американскую компаниюHortonworks[англ.].
История
[править|править код]Компания была основана воктябре 2008 годавБёрлингейме(штат Калифорния) со стартовым капиталом $5 млн, основной целью бизнеса выбрана коммерциализация проектаHadoop.Основатели компании —Кристофе Бишилья(англ.Chirstophe Bischiglia), ранее работавший вGoogle,Амр Авадалла (Amr Awadallah,вице-президент корпорацииYahoo,отвечавший за системы анализа и хранилища данных), Джеффри Хаммербахер (Jeff Hammerbacher,менеджер проектаHiveв компанииFacebook) иМайкл Ольсон(Michael Olson), вице-президент корпорацииOracle,ранеегенеральный директорSleepecat,разрабатывавшей и развивавшейBerkeley DBи поглощённой в 2006 году Oracle)[6].Хаммербахер организовал начальное финансирование проекта фондомAccel Partners,а Ольсон возглавил компанию. Суммарно на начальной стадии было привлечено $11 млн, а кроме Accel среди инвесторов указывается Greylock Partners ибизнес-ангелыГидеон Ю(Gideon Yu) иКатерина Фейк(Caterina Fake)[7].
Среди нанятых в первые месяцы сотрудников были создатели HadoopДуг Каттинги Майкл Кафарелла (Mike Cafarella), бывшие руководители компанийVMware(Дайен Грин,Diane Green) иMySQL AB(Мартен Микос,Marten Mikos)[8].Благодаря факту перехода Каттинга в Cloudera, компания была охарактеризована как «новый знаменосец Hadoop»[9].
В2009 годуБишилья вошёл пятым в список из 22-х лучших молодых технологических предпринимателей еженедельникаBusinessweek[10],а Хаммербахер попал в этот список на седьмую (из 15) позицию в2010 году.При номинации Бишильи Cloudera была охарактеризована как сервисная компания, оказывающая технические консультации по Hadoop, тогда как вклад Хаммербахера в 2010 году отмечен как трансформация бизнеса компании, сделавшая её поставщиком тиражируемого программного обеспечения для организаций[11].
В ноябре 2011 года компания получила дополнительное финансирование в размере $40 млн[12],в декабре 2012 года — ещё $65 млн[13],среди инвесторов очередных раундов указываютсяIgnition Partners,Greylock,Accel,Meritech Capital PartnersиIn-Q-Tel[14][13].
В октябре 2012 года компания представила продукт ImpalaSQLк данным в кластере под управлением Hadoop, появление такого продукта было встречено как неожиданность, так как преобладающей риторикой компаний, сфокусированных на технологиях «больших данных», являлся отказ от традиционных технологий, имеющих в основе SQL (англ.old SQL,по созвучию со «старой школой» —old school)[15].
,обеспечивающий доступ на языкеВ июне 2013 года на должностьгенерального директораприглашёнТом Райли(Tom Reilly), ранее приведший две технологические компании к поглощению крупными игроками (компания-производительMDM-системыTrigo была купленаIBMв 2004 году, а фирмаArcSight[англ.]была выведена наIPOи вскоре поглощенаHewlett-Packardв 2010 году), событие оценено как подготовка либо кпервичному размещению,либо продаже бизнеса[16].Ольсон перешёл на пост стратегического директора и председателя правления. В июле 2013 года фирмапоглотилабританскую компаниюMyrryx,основанную Шоном Оуэном (Sean Owen), одним из основных авторов входящего вэкосистему Hadoopмасштабируемого фреймворка длямашинного обученияApache Mahout,объявлено о назначении Оуэна на должность «директора понауке о данных» (англ.director of data science)[17].
К середине 2013 года за пять раундов инвестиций компания получила в общей сумме $141 млн[16],а в очередном раунде в марте 2014 года компания привлекла ещё $160 млн[18].В марте 2014 года, после шестого раунда инвестиций, Intel за $740 млн приобрела долю в компании в размере 18 %, таким образом, оценив бизнес Cloudera приблизительно в $4 млрд[19];при этом Intel отказалась от развития созданного годом ранее собственного дистрибутива Hadoop в пользу продвижения решений от Cloudera[18].В июне 2014 году компания приобрела фирму-разработчика технологиишифрования данныхGazzang[20].
В апреле 2017 года компания провела первичное размещение наНью-Йоркской фондовой бирже,в результате которого привлекла $215 млн[21].Осенью 2017 года поглощена нью-йоркская фирма-разработчик алгоритмов машинного обучения Fast Forward Labs, сделка была отмечена как ответ на тесную интеграцию Hortonworks с IBM, делающим упор на развитие систем искусственного интеллекта в рамках программыWatson,и отказавшимся от своего дистрибутива Hadoop в пользу Hortonworks[22].
В октябре 2018 года объявлено о слиянии с Hortonworks, притом структура сохранила наименование Cloudera, листинг на бирже и генерального директора, а акционеры Hortonworks получили 40 % акций объединённой компании[23].Сделка завершена 3 января 2019 года, несмотря на суммарную оценку двух компаний в момент объявления в $5,2 млрд, по её завершении капитализация объединённого бизнеса составила около $3 млрд[24].Поглощение фактически завершило этап консолидации на рынке коммерческих дистрибутивов Hadoop (из сколь-либо заметных других участников рынка осталась только компанияMapR[англ.]с годовым оборотом около $175 млн за 2018 год), сместив фокус конкуренции на более широкие сегменты — инструментов больших данных и аналитических платформ[25].
В конце 2020 года компания совершилаобратный выкупакций у Intel за $314 млн (что на $426 млн дешевле инвестиций 2014 года)[26].
Осенью 2021 года компания выкуплена инвестиционными фондамиClayton, Dubilier & RiceиKKRза $5,3 млрд и был проведён делистинг акций с фондовой биржи.
CDH
[править|править код]CDH(англ.Cloudera’s Distribution including Apache Hadoop) — дистрибутив Apache Hadoop, включающий ряд смежных программ и библиотек и собственных утилит разработки Cloudera, бесплатно распространяемый и коммерчески поддерживаемый для определённых дистрибутивов Linux (Red Hat Enterprise Linux,CentOS,Ubuntu,SuSE SLES,Debian). Среди смежных с Hadoop программных проектов Apache в дистрибутив включены:Flume,HBase,Hive,Mahout,Oozie,Pig,Sqoop,Whirr,Zookeeper.Кроме того, в дистрибутив входит собственная подсистема управления кластером Cloudera Manager ,включающая сценарии развёртывания Hadoop-инфраструктуры как в локальных, так и воблачных средах(Rackspace,Amazon EC2,Softlayer[англ.]), а также утилиты и конфигурации для поддержки автоматизации сборки средствамиApache Maven.
К началу 2012 года поставлялись две версии CDH — CDH2 (на основе Hadoop 0.20.1) и CDH3 (на основе Hadoop 0.20.2). Дистрибутив CDH3 включён в поставкуаппаратно-программного комплексаOracle Big Data appliance[27],притом первую линию поддержки заказчиков по Hadoop обеспечивает корпорацияOracle,а Cloudera предоставляет техническое сопровождение по более сложным проблемам. В середине 2012 года вышла версия CDH4 на основе Hadoop 2.0 (включающей модульYARN), в состав CDH4 включены также три собственных продукта фирмы —Hue[англ.](браузерный интерфейс управления Hadoop-кластером), Impala иSearch(полнотекстовый и фасетный поиск в средахHDFSиHBase). В 2014 году выпущена версия CDH5; версия CDH6, вышедшая весной 2018 года, создана на основе Hadoop 3.0 (ключевым новшеством которой стала поддержкапомехоустойчивого кодированиядля HDFS, позволяющая существенно снизить физические размеры кластеров)[28].
Impala
[править|править код]Cloudera Impala[англ.]—массово-параллельныймеханизм интерактивного выполнения запросов на языкеSQLк данным, хранимым вHDFSиHBase,распространяется по лицензииApache 2.0.В отличие отHive,обеспечивающего трансляцию запросов на SQL-подобном языке (HiveQL) в MapReduce-задания, выполняемые в пакетном режиме, Impala выполняет запросы в распределённой среде интерактивно, распределяя запрос по узлам обработки на основе собственного механизма, не прибегая к MapReduce.
Cloudera Manager
[править|править код]Cloudera Manager— специализированный компонент, позволяющий автоматизировать создание и модификацию Hadoop-сред, отслеживать и анализировать эффективность выполнения заданий на обработку, настраивать оповещения по наступлению тех или иных событий, связанных с эксплуатацией инфраструктуры распределённой обработки. Годовая стоимость технического сопровождения составляет около $4 тыс. за узел кластера[29].Для Cloudera Manager существует бесплатная редакция (англ.free edition), работающая только накластерах,состоящих из менее, чем 50-ти узлов и лишённая ряда свойств, доступных коммерческим подписчикам (таких, как мониторинг производительности, управление версиями конфигурации, поддержкаKerberos).
Тематические продукты
[править|править код]Вслед за прогнозом Garnter вцикле хайпатехнологий управления данными 2017 года, предполагающим устаревание самой концепции «дистрибутива Hadoop» в скором времени, компания сместила акцент в продуктовом предложении на тематические комплекты, составленные фактически из тех же компонентов, что собираются в CDH, но нацеленные на те или иные специфические задачи. Так, в 2018 году появились продукты под наименованиями Data Warehouse (сборка дляхранилищ данных,с фокусом на Impala), Operational DB (для операционных баз данных, вокругHBase,Kudu[англ.]иSpark), Data Engineering (дляETLи интерактивного доступа к данным), Data Science (для задач «науки о данных»), Enterprise Data Hub (для платформ данных корпоративного уровня — фактически полная сборка дистрибутива Hadoop плюскаталог данныхна основе собственного компонента SDX).
Стоимостная политика с 2018 года формируется вокруг тематических продуктов; в зависимости от комплектации, подписчики ежегодно платят от $4 тыс. за поддержку каждого узла продуктов Data Engineering и Data Science до $10 тыс. за узел продукта Enterprise Data Hub.
Примечания
[править|править код]- ↑Cloudera Inc .Morning Star(7 сентября 2018).Архивировано7 сентября 2018 года.
- ↑Малик, 2009,I see some interesting parallels between Hadoop and Red Hat, which rose to prominence on the back of Red Hat Linux, a version of Linux optimized for corporate users.
- ↑Рао, 2011,Cloudera helps distribute Hadoop, and provides practical services around the technology, similar to what Red Hat does for the Linux framework.
- ↑Нэрн, 2010,Storage giant EMC has teamed up with Cloudera, a specialist in database software, to create technologies to better support “big data”… Startup Cloudera is using the open source Hadoop software package to analyse very large sets of data.
- ↑Вэнс, 2011,“It will be guys like Jeff who understand what to do with big data”.
- ↑Прикетт-Морган, 2009,…Christophe Bisciglia, who led the partnership between Google, IBM, and the National Science Foundation to create Hadoop grids for academics to play around with; Amr Awadallah, a former Yahoo vice president of engineering that led the data warehousing and analytics effort behind that company's mail, search, finance, and news services; - Mike Olson, formerly the chief executive officer of open source database maker Sleepycat Software (now owned by Oracle); and Jeff Hammerbacher, formerly of social networking giant Facebook and the manager who created the Hive project, which is a data warehousing layer that works in conjunction with Hadoop and that Facebook uses to do data analysis on its many petabytes of information stored in its user data warehouse.
- ↑Businessweek, 2010,Funding: $11 million from Accel Partners, Greylock Partners, and angel investors that include Gideon Yu and Caterina Fake.
- ↑Прикетт-Морган, 2009,…Doug Cutting and Mike Cafarella as advisors as well as Diane Green (founder and former CEO at virtualization specialist VMware) and Marten Mikos.
- ↑Handy, Alex.Hadoop creator goes to Cloudera(англ.).SD Times(9 октября 2009). Дата обращения: 25 декабря 2011. Архивировано изоригинала11 марта 2012 года.
- ↑Businessweek, 2010,Cloudera co-founder Christophe Bisciglia was one of Bloomberg BusinessWeek's Best Young Tech Entrepreneurs of 2009.
- ↑Businessweek, 2010,Toughest decision: Changing Cloudera's business model to make it into a software vendor.
- ↑Worthen, Ben (2011-11-22)."Tide Shifts on Web Start-Ups"(англ.).N. Y.:The Wall Street Journal.Архивировано25 декабря 2011.Дата обращения:28 декабря 2011.
More big-funding deals have been struck since then, including $85 million for human-resources-software maker Workday Inc., $81 million for online file-sharing site Box.net Inc., $50 million for marketing company Marketo Inc. and $40 million for data-management company Cloudera Inc
- ↑12Darrow, BarbCloudera snares $65M more to boost international, enterprise growth(англ.).Gigaom(6 декабря 2012). — «The funding round was led by Accel Partners with help from Greylock Partners, Ignition Partners, In-Q-Tel, and Meritech Capital Partners». Дата обращения: 10 декабря 2012. Архивировано изоригинала17 декабря 2012 года.
- ↑Рао, 2011,Cloudera just announced $40 million in new funding led by Ignition Partners, Greylock, Accel, Meritech Capital Partners, and In-Q-Tel.
- ↑Brust, AndrewCloudera’s Impala brings Hadoop to SQL and BI.Big Data darling Cloudera's Impala product promotes SQL to peer-level with MapReduce(англ.).ZDNet(25 октября 2012). — «Instead of beckoning “old school” database and BI professionals (i.e. the majority of enterprise developers and DBAs) to move to Hadoop, it announced the beta of a new product, Impala, that brings Hadoop to them». Дата обращения: 1 января 2014.Архивировано2 января 2014 года.
- ↑12Prickett MorganCloudera taps new CEO for inevitable IPO push or acquisition.Former CEO becomes chairman and chief strategist(англ.).The Register(20 июня 2013). Дата обращения: 1 января 2014.Архивировано2 января 2014 года.
- ↑Clark, JackCloudera acquisition: It’s a Myrrix (cle).Elephant snorts baby elephant for machine learning skills(англ.).The Register(16 июля 2013). Дата обращения: 17 июля 2013. Архивировано изоригинала31 августа 2013 года.
- ↑12Harris, DereckIntel jettisons its Hadoop distro and puts millions behind Cloudera(англ.).Gigaom(27 марта 2014). Дата обращения: 1 апреля 2014.Архивировано30 марта 2014 года.
- ↑Clark, JackDon’t touch my trunk! Intel is $740m lighter after Cloudera cash shot.Huge funding deal keeps Oracle, IBM away from upstart’s yellow elephant(англ.).The Register(31 марта 2014). Дата обращения: 1 апреля 2014.Архивировано4 апреля 2014 года.
- ↑Liam Tung.Cloudera buys big data encryption outfit Gazzang.Cloudera buys Gazzang to offer enterprise customers encryption for data at rest in Hadoop clusters .ZDNet(15 июня 2014). Дата обращения: 23 сентября 2018.Архивировано25 сентября 2019 года.
- ↑Anita Balakrishnan.Cloudera shares close more than 20% higher on Day 1 .CNBC(28 апреля 2017). Дата обращения: 23 сентября 2018.Архивировано23 сентября 2018 года.
- ↑Rebecca Hill.Cloudera bags AI biz, eyes up IBM customers… and continues to report operating losses.Someone’s noticed Big Blue’s deal with Hortonworks .The Register(8 сентября 2017). Дата обращения: 23 сентября 2018.Архивировано23 сентября 2018 года.
- ↑Kevin Kelleher.Cloudera, Hortonworks Stocks Soar as the Big-Data Rivals Announce a $5.2B Merger .Fortune(3 октября 2018). Дата обращения: 4 октября 2018.Архивировано4 октября 2018 года.
- ↑Rebecca Hill.Cloudera, Hortonworks merge into amorphous data-managing blob after stockholder vote.New-look firm turns attention to PR offensive .The Register(7 января 2019). Дата обращения: 7 января 2019.Архивировано8 января 2019 года.
- ↑Andrew Brust.Cloudera and Hortonworks' merger closes; quo vadis Big Data?The two biggest Hadoop distribution vendors are now one. What does this mean for the Big Data world, for customers and for Apache Hadoop? ZDNet(4 января 2019). Дата обращения: 7 января 2019.Архивировано31 января 2019 года.
- ↑Max A. Cherney.Cloudera Buys Back $314 Million Intel Stake. Here’s What It Means for the Stock .Barron’s(23 декабря 2020). Дата обращения: 25 декабря 2020.Архивировано25 декабря 2020 года.
- ↑Pricket Morgan, TimothyOracle mounts Cloudera's elephant for big data ride(англ.).The Register(10 января 2012). Дата обращения: 13 января 2012. Архивировано изоригинала6 сентября 2012 года.
- ↑Tony Baer.Cloudera Enterprise 6 hits the streets.Hadoop 3.0 takes a starring role in the next release of Cloudera's platform .ZDNet(22 мая 2018). Дата обращения: 23 сентября 2018.Архивировано27 ноября 2020 года.
- ↑Pricket Morgan, Timothy.Cloudera gets proactive with Hadoop management(англ.).The Register(8 сентября 2011). Дата обращения: 15 апреля 2013. Архивировано изоригинала18 апреля 2013 года.
Ссылки
[править|править код]- Vance, Ashlee (2009-03-17)."Hadoop, a Free Software Program, Finds Uses Beyond Search"(HTML)(англ.).N. Y.:The New York Times.pp. B3.Дата обращения:13 декабря 2011.
- Prickett Morgan, TimothyCloudera floats commercial Hadoop distro(англ.).The Register(16 марта 2009). Дата обращения: 13 декабря 2011. Архивировано изоригинала11 марта 2012 года.
- Taft, DarrylNew Cloudera Desktop GUI Simplifies Hadoop for Users(англ.).eWeek(2 октября 2009). Дата обращения: 13 декабря 2011. Архивировано изоригинала17 мая 2012 года.
- Malik, OmIs Hadoop Champion Cloudera the Next Red Hat?(англ.).GigaOm(2 октября 2009). Дата обращения: 13 декабря 2011. Архивировано изоригинала17 мая 2012 года.
- Nairn, Geoff (2010-09-27)."Big Data, Big Blue and Going Green"(HTML)(англ.).L.:Financial Times.ISSN0307-1766.Дата обращения:29 мая 2011.
- Cloudera’s Olson Interview About Data Use(англ.).Cloudera's Olson Interview About Data Use.Bloomberg(22 марта 2011). Дата обращения: 13 декабря 2011. Архивировано изоригинала17 мая 2012 года.
- 7. Cloudera. Entrepreneur: Jeff Hammerbacher, 27(англ.).Best Young Tech Entrepreneurs 2010.Bloomberg Businessweek(20 апреля 2010). Дата обращения: 27 декабря 2011. Архивировано изоригинала17 мая 2012 года.
- Vance, Ashlee (2011-04-14)."This Tech Bubble Is Different"(HTML).Businessweek(англ.).N. Y.:Bloomberg.ISSN0007-7135.Дата обращения:29 мая 2011.
- Jackson, Joab (2011-10-17)."SGI launches Cloudera Hadoop BI clusters"(HTML)(англ.).Framingham:Computerworld.ISSN0010-4841.Дата обращения:29 мая 2011.
- Rao, LeenaCloudera Updates Hadoop Management App With Health Checks, Reporting Features And More(англ.).TechCrunch(8 декабря 2011). Дата обращения: 27 декабря 2011. Архивировано изоригинала17 мая 2012 года.