MForum.ru
10.06.2014,
Подборка информации по теме BigData
Для чего используют Big Data в России?
С технологической точки зрения Big Data можно считать такие наборы данных, чьи размеры, типы и скорость формирования делают непрактичной их обработку и анализ традиционными технологиями и соответствующими инструментами с точки зрения денежных и временных затрат на это. Также о Big Data можно говорить в том случае, если речь идет о подходе, позволяющем опираться на обработанные тем или иным способом данные для принятия решений и высказывания предположений, вместо того, чтобы полагаться на "интуицию" и "дар". Если используется этот подход, то можно говорить о Big Data даже в том случае, если для обработки данных используются те или иные традиционные инструменты и методы.
Группа технологий и методов производительной обработки динамически растущих объемов данных (структурированных и неструктурированных) в распределенных информационных системах, обеспечивающих организацию качественно новой полезной информации.
Это наборы данных такого объема, что традиционные инструменты не способны осуществлять их захват, управление и обработку за приемлемое для практики время.
В России по опросу CNews и Oracle в 2015 году более четверти респондентов считают, что Big Data это скорее концепция, включающая подходы, методики, технологии и пр. В то же время 14% по-прежнему увязывают Big Data и Hadoop.
Клиффорд Линч, редактор журнала Nature, в 2008 году впервые упомянул термин Big Data в специальном номере журнала, посвященного теме "Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объемами данных", в котором были собраны материалы о феномене взрывного роста объемом и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка "от количества к качеству".
В 2010 году появились первые продукты и решения, относящиеся непосредственно к проблемам обработки Big Data. С 2011 году понятие используют практически все крупные участники рынка информационных технологий, такие как IBM, Oracle, Microsoft, Hewlett-Packard, EMC.
Действительно большие объемы данных в физическом смысле, от петабайт к экзабайтам и зеттабайтам
Слабо структурированные и разнородные данные, например DB, XML, Logs, тексты, видео, аудио
Необходимость и возможность высокой скорости обработки данных - близко к реальному времени
Facebook собирает 180 ПБ информации в год (300 млн фото в день)
Twitter обеспечивает доставку 1.2 млн сообщений в секунду (103 млрд сообщений в месяц в 2014)
Google - 24 ПБ в день
$41,5 млрд в 2018 году (прогнозируемый рост 26,4% в год) / прогноз IDC в августе 2014 года
Источник: Wikibon-2014
2015.12.07 Согласно прогнозам, годовой рост рынка технологий Big Data составит 32%, что в деньгах - $21 млрд. Российская доля - менее 1%. Порядка 70% крупных компаний в различных отраслях приобретают внешние данные. К 2020 году ожидается рост до 100%. В России в октябре-ноябре проведен опрос, который показал, что только 12% респондентов активно используют технологии Big Data, 39% находятся на начальном этапе внедрения решений, чуть менее половины вообще их не используют. Из тех, кто уже применяет Big Data 29% используют их для анализа удовлетворенности клиентов и потребительских предпочтенийб 22% - для управления производственным процессом. Интересно, что 45% из тех, кто пока не использует Big Data, не планирует это делать и в будущем, а 55% готовы инвестировать при условии, что эти инвестиции обещают практическую выгоду и возврат инвестиций. В целом, согласно прогнозу F&S в России будет быстро развиваться сегмент визуализации Big Data, также в перспективе ожидается втрое больший рост затрат на облачные решения в сегменте Big Data, нежели чем на локальные решения / Frost & Sullivan.
2015.05.15 Объем данных в Российских компаниях согласно опросу CNews / Oracle
$1,368,000,000 - IBM (доходы компании от направления Big Data)
$869,000,000 - HP
$652,000,000 - DELL
$545,000,000 - SAP
$518,000,000 - Teradata
$491,000,000 - Oracle
$480,000,000 - SAS Institute
$418,000,000 - Palantir
$415,000,000 - Accenture
$312,000,000 - PWC
2014.10.17 Инфографика UMBEL. Легенда: размер кружка - общие доходы компании, тонкая граница - доходы от Big Data менее 1% в общих доходах; темный кружок (как у SAP) - 2-10%; кружок с заполнением, как у Teradata или SAS Institute - 11-30%; кружок яркого цвета, как у DON - 41-99%, желтые кружки - 100%.
Источник: Wikibon-2014
Можно выделить следующие крупные направления получения доходов на рынке Big Data: профессиональные услуги; вычисления ; хранение данных ; разработка приложений ; SQL ; облачные сервисы ; инфраструктурное ПО ; сетевое взаимодействие ; NoSQL.
Рынок Big Data формируют активности как титанов технологической индустрии, таких, как IBM, HP и Dell, так и ньюкамеры, как Neo Technology, Sumo Logic, Cloudera. Доля больших компаний на рынке Big Data в 2015 году высока, несмотря на то, что в структуре их доходов доходы от Big Data пока занимают ничтожную долю, менее 1%. Для ньюкамеров - это основной источник их доходов. Как правило, компании, занимающиеся Big Data, стараются специализироваться в области либо услуг и ПО, либо услуг и железа. Только несколько корпораций инвестируют во все три области одновременно, есть также компании которые оказывают услуги, не занимаясь разработкой софта или железа. По данным UMBEL, 46% компаний на рынке Big Data инвестируют в услуги, 41% в ПО, 13% - в железо.
источник: BigData Landscape, 2015.06
источник: BigData Landscape, 2015.06
1010DATA, услуги, приложения аналитики и визуализации
Accenture, услуги
Actian, услуги и ПО, инфраструктура для аналитики
Actix, Amdocs
Actuate, услуги и ПО
Aerospike, услуги и ПО, операционная инфраструктура
Alpine, приложения аналитики и визуализации
Alterix, услуги и ПО
Amazon, услуги, консьюмерские приложения, Amazon Webservices - инфраструктура как услуга
Apache Hibase, технологическая инфраструктура
Arieso, JDSU
Atigeo, приложения аналитики и визуалиазации
AT&T, инфраструктура как услуга
Attivio, услуги и ПО, приложения Business Intelligence
Attunity, услуги и ПО
AutoGrid, вертикальные приложения
Autonomy, приложения Business Intelligence
Ayata, приложения аналитики и визуализации
Basho, услуги и ПО
Bime, приложения Business Intelligence
Birst, приложения Business Intelligence
Booz Allen Hamilon, услуги
Business Objects, приложения Business Intelligence
Calpont, инфраструктура для аналитики
Capgemini, услуги
Cassandra, технологическая инфраструктура
Centrifuge, приложения для аналитики и визуализации
Centurylink, услуги
Chart.io, приложения Business Intelligence
Cirro, приложения для аналитики и визуализации
Cisco Systems, услуги, ПО, железо
ClearStory, приложения для аналиткии и визуализации
CleverDATA, продукт 1DMP.ru (биржа для обмена данными)
Cloudera, услуги и ПО, инфраструктура для аналитики
Couchbase, услуги и ПО, операционная инфраструктура
CSC, услуги, инфраструктура как услуга
Datameer, услуги и ПО, приложения для аналитики и визуализации
Datastax, услуги и ПО, операционная инфраструктура
Dell, услуги и железо
Deloitte, услуги
Digital Reasoning, услуги и ПО
DOMO, приложения Business Intelligence
DON, услуги и железо
eBay, потребительские приложения
Ellucian, вертикальные приложения
EMC, услуги, железо, ПО
Exasol, инфраструктура для аналитики
Facebook, потребительские приложения
Fractal Analytics, услуги
Fusion-IO, услуги и железо
General Electric, услуги и ПО
Gooddata, услуги, приложения Business Intelligence
Google, услуги, потребительские приложения, Google bigquery - инфраструктура как услуга
Guavus, услуги и ПО
Hadapt, инфраструктура для аналитики
Hadoop, технологическая инфраструктура
Hadoop mapReduce, технологическая инфраструктура
Hitachi, услуги
Hortonworks, услуги и ПО, инфраструктура для аналитики
HP, услуги, железо, ПО
IBM, услуги, железо, ПО, приложения Business Intelligence, структурированные базы данных DB2
Infobright, инфраструктура для аналитики
Informatica, услуги и ПО, операционная инфраструктура
Intel, услуги и железо
JasperSoft, услуги и ПО, приложения Business Intelligence
Juniper, услуги и железо
KarmaSphere, приложения для аналитики и визуализации
Knweton, вертикальные приложения
Kognitio, услуги и ПО, инфраструктура для аналитики
LinkedIn, потребительские приложения
Mahout, технологичская инфраструктура
MAPR Technologies, услуги и ПО, инфраструктура для аналитики
Marklogic, услуги и ПО, операционная инфраструктура
memSQL, структурированные базы данных
metaLayer, приложения для аналитики и визуализации
Microsoft, услуги и ПО, приложения Business Intelligence, структурированная DB Microsoft SQL Server
Microstrategy, услуги и ПО, приложения Business Intelligence
MongoDB, услуги и ПО, операционная инфраструктура
Mortar, инфраструктура как услуга
Mu Sigma, услуги и ПО
MySQL, структурированные базы данных
Neo Technologies, услуги и ПО
Netapp, услуги и железо
Netezza, инфраструктура для аналитики
NetFlex, потребительские приложения
NG Data, приложения Business Intelligence
Opera Solutions, услуги, приложения для аналитики и визуализации
Opower, вертикальные приложения
Oracle, услуги и ПО, приложения Business Intelligence (Hyperion), структурированные базы данных ;
2015.06.26 Программно-аппаратный комплекс Oracle Big Data Appliance X5 компания начала продвигать с января 2015 года. В июне 2015 года этот комплекс установлен в FORS Solution Center в России. Достоинство - сервера предварительно сконфигурированы и протестированы вендором, что упрощает их развертывание. В России уже есть заказчики системы. Подробнее
Palantir, услуги и ПО, приложения для аналитики и визуализации
Panopticon, приложения для аналитики и визуализации
Pentaho, услуги и ПО
Pivotal, услуги и ПО, инфраструктура для аналитики
Platfora, приложения для аналитики и визуализации
PostgreSQL, структурированные базы данных
Practise fusion, вертикальные приложения
Predictive Policing, вертикальные приложения
PWC, услуги
QLIKView, услуги и ПО, приложения для аналитики и визуализации
Qubole, инфраструктура как услуга
Rackspace, услуги
Rainstor, услуги
Recomminnd, приложения Business Intelligence
Recorded Future, приложения Business Intelligence
Red Hat, услуги и ПО
Revolution Analytics, услуги и ПО
RJMetrics, приложения Business Intelligence
RxAnte, вертикальные приложения
Saffron Technology, приложения для аналитики и визуализации
SAP, услуги и ПО, приложения Business Intelligence
SAS Institute, услуги и ПО, приложения для аналитики и визуализации
SGI, услуги и железо
SiSense, услуги, приложения для аналитики и визуализации
Space Curve, инфраструктура для аналитики
Splice Machine, инфраструктура для аналитики
Sumo Logic, услуги и ПО
SurveyMonkey, вертикальные приложения
Sybase, структурированные базы данных
Syncsort, услуги и ПО
Tableau Software, услуги и ПО, приложения для аналитики и визуализации
Talend, услуги и ПО
TCS, услуги
Teradata, услуги и ПО, приложения для аналитики и визуализации Aster
Terracotta, операционная инфраструктура
Think Big Analytics, услуги и ПО
Tibco, услуги и ПО, приложения для аналитики и визуализации
Tresata, услуги и ПО
Trifacta, приложения для аналитики и визуализации
Twitter, потребительские приложения
Ufora, приложения для аналитики и визуализации
Vertica, инфраструктура для аналитики
Visual.ly, приложения для аналитики и визуализация
VoltDB, операционная инфраструктура
@WalmartLabs, потребительские приложения
Windows Azure Marketplace, инфраструктура как услуга
WMWARE, услуги и ПО
Hadoop - набор утилит, библиотеки и программный каркас для разработки и исполнения распределенных программ, работающих на кластерах из сотен и тысяч узлов
MapReduce - фреймворк для вычисления некоторых наборов распределенных задач с использованием большого числа компьютеров, называемых "нодами", образующими кластер. Разработан компанией Google.
MPP (Vertica, Exadata, Greenplum, Teradata)
NoSQL (Key-Value, Document-oriented, Column-based, Graph-oriented). Ряд подходов, направленных на реализацию хранилищ баз данных, существенно отличающихся от традиционных реляционных СУБД со средствами доступа языка SQL. Такие подходы характерны для использования с базами данных, в которых стоит задача решить проблемы масштабирования и доступности за счет атомарности и согласованности данных
In-memory Data Grids (Calculation Grids)
Data Mining
Machine Learning (Statistics / Natural Language Processing)
Event-Stream Processing
48,2% прогнозируемый рост рынка инфраструктуры в сегменте Big Data / прогноз IDC в августе 2014 года
- участники рынка сформировали "дорожные карты" своих продуктов и услуг для предприятий
- можно говорить о зрелости продуктов, в частности после появления YARN (MRv2 - Map Reduce), которая заложила обеспечила мультиплатформенность для Hadoop
- улучшились механизмы защиты конфиденциальности данных
- опасения в достаточной защищенности данных
- быстрое развитие рынка, разнообразие решений и большое число поставщиков решений Big Data, затрудняющее выбор инструментов
- недостаточное число завершенных приложений для решения специфичных проблем бизнеса
13% в 2014 году / Gartner, 2014
8% в 2013 году / Gartner, 2014
2015.05.15 Объем данных в Российских компаниях согласно опросу CNews / Oracle
Требуется отказ от классического дедуктивного мышления в пользу эмпирического, опытного мышления и использования статистики в качестве основы для реального бизнеса. Нужно, чтобы мысля эмпирически, люди владели математическим аппаратом. Требуется сочетание взаимоисключаемых ментальных факторов: интуиции, широкого кругозора и "математичности" в мозгах и образовании. Дефицит таких специалистов пока что будет только нарастать. Мнение Сергея Мацоцкого, председателя правления IBS.
Профессия: аналитик Big Data, специалист по Data Mining, архитектор баз данных и т.п.
Как стать специалистом в области Big Data
2013.12.10 Big Data в отраслях. Apcon, McKinsey & Company, CNews Analytics, 2013
2015.05.15 Инфографика: Большие данные пришли в Россию. CNews / Oracle.
Есть возможностьанализировать местоположение и активность абонентов.
Сегментация абонентской базы, персонализация клиентских сервисов и услуг. При прибытии в аэропорт можно предложить подключение услуг роуминга или дать информацию о возможностях личного кабинета для самостоятельного управления услугой.
Мониторинг качества услуг.
Оптимизация рабты колл-центра за счет угадывания причин обращения, а также индивидуального подбора и предложения сервисов и тарифов.
Можно измерить качество сервиса на уровне каждого клиента, синхронизировавшись с геолокацией, - получить мониторинг качества сервиса по всем точкам пребывания клиента, что дает возможность повышать качество в тех или иных точках сети.
Big Data на Pinterest - обновляемые
Публикации по теме:
12.01. [Новости компаний] Геоаналитика: МТС отмечает рост турпотока в алтайскую Белокуриху вдвое к прошлому году / MForum.ru
12.01. [Новости компаний] Аналитика: Новогодняя аналитика МТС / MForum.ru
28.12. [Новости компаний] Покупка компаний: МегаФон приобрел oneFactor - разработчика аналитических сервисов на базе ИИ / MForum.ru
27.12. [Новости компаний] Развитие сетей: МегаФон рассказывает об улучшении связи в Новосибирске / MForum.ru
05.12. [Новости компаний] Нетелеком услуги операторов: МТС сообщает о росте средней стоимости проживания в российских отелях на 10% за год / MForum.ru
21.11. [Новинки] Анонсы: Oppo Find X8 и X8 Pro выходят на глобальный рынок / MForum.ru
21.11. [Новинки] Слухи: Google отменяет Pixel Tablet 3 / MForum.ru
20.11. [Новинки] Слухи: Reno 13 и Reno 13 Pro замечены в Geekbench / MForum.ru
20.11. [Новинки] Слухи: Nubia Z70 Ultra с впечатляющей камерой представят 21 ноября / MForum.ru
19.11. [Новинки] Анонсы: Представлен ZTE Blade V70 с основной камерой 108 МП и аналогом Dynamic Island / MForum.ru
19.11. [Новинки] Слухи: HMD Icon Flip 1 готовится к анонсу / MForum.ru
18.11. [Новинки] Слухи: Samsung Galaxy A36 получит улучшенную фронтальную камеру / MForum.ru
18.11. [Новинки] Слухи: Vivo Y300 5G появился на «живых» фото / MForum.ru
15.11. [Новинки] Слухи: Стали известные некоторые спецификации Realme C75 / MForum.ru
15.11. [Новинки] Слухи: Realme Narzo 70 Curve готовится к анонсу / MForum.ru
14.11. [Новинки] Анонсы: Представлены Nubia Red Magix 10 Pro и 10 Pro+ с SD 8 Elite и огромными батареями / MForum.ru
13.11. [Новинки] Слухи: Vivo X200 и X200 Pro готовятся к глобальному релизу / MForum.ru
13.11. [Новинки] Слухи: Стали известны основные характеристики и особенности серии iQOO Neo10 / MForum.ru
12.11. [Новинки] Анонсы: Red Magic 10 позирует на рендерах / MForum.ru
11.11. [Новинки] Анонсы: Huawei MatePad 11.5 (2024) представлен официально / MForum.ru
11.11. [Новинки] Слухи: Samsung выпустит Galaxy S25 Slim в 2025 апреле года / MForum.ru
08.11. [Новинки] Анонсы: Samsung W25 – эксклюзивный складной смартфон для китайского рынка / MForum.ru
08.11. [Новинки] Анонсы: Представлен Samsung W25 Flip. Galaxy Z Fold 6 становится золотым? / MForum.ru
07.11. [Новинки] Слухи: Появилась информация о чипсете Kirin 9100 / MForum.ru
07.11. [Новинки] Анонсы: Бюджетный смартфон Vivo Y19s представлен официально / MForum.ru