В рамках сотрудничества с компаниями VMware и Pivotal, корпорация ЕМС достигла новой ступени прогресса и объявила о расширении Federation Business Data Lake, что стало возможным при применении технологий от разработчиков со стороны.
Главные изменения и достоинства
- Новая версия FBDL позволит развертывать так называемые "озера данных" гораздо быстрее. Причем процесс не только ускоряется, теперь доступны автоматические средства управления.
- Массивы Hadoop станут гораздо доступнее. Организации получили возможность создавать системы обработки данных со сверхнизким откликом, процесс внедрения будет занимать всего 7 дней.
- Инструментарий от ЕМС содержит полный набор средств, которыми могут воспользоваться заказчики для работы с хранилищами типа "озера данных".
FBDL включает в себя как инфраструктуры для хранения данных, использующие самые современные технологии, так и встроенные средства анализа в режиме реального времени. Объемы информации, которыми может оперировать FBDL, соответствуют концепции Больших данных. Поэтому заказчики получают решение, основанное на возможности почти безграничного развития сервисов, способное дать действительно неоценимые преимущества перед конкурентами на рынке.
Время развертывания FBDL составляет всего 7 дней. Применение средств автоматизации вкупе с довольно коротким сроком, сделало это решение идеальным инструментом для создания "озер данных". Также, примененные методики хранения и обработки информации обеспечивают ускорение всех процессов в ИТ-структурах корпоративного класса.
FBDL обеспечивает масштабируемость и может предоставить возможность самообслуживания. Инструментарий от EMC позволяет проводить как угодно сложный анализ Больших данных в режиме реального времени. Применение такой системы для анализа сегмента информации для бизнеса позволит принимать взвешенные и четкие решения.
Совместное применение FBDL и уже распространенного решения Enterprise Hybrid Cloud позволит подразделениям инфраструктуры, занятым развертыванием систем хранения и обработки данных, значительно ускорить свою работу, обеспечить гибкую организацию любых связанных процессов. Что, в итоге, приведет к более качественному предоставлению услуг для потребителей.
Поток данных, которые востребованы и требуют обработки, непрерывно растет. Это информация, получаемая из приложений традиционной структуры, мобильных платформ, веб-сервисов, а также сигналы от различных сенсоров и так называемых "вещей в интернете". В общий объем потенциально полезных данных включается информация, полученная в социальных сетях, а также из любых других доступных источников.
Современные системы хранения строятся на новом принципе, основанном на масштабировании, используя простые и относительно недорогие единицы хранения. Также, на данный момент существует достаточно ресурсов, способных предоставить вычислительные мощности для оперативного анализа таких объемов в режиме реального времени. Объединяя две концепции - масштабируемого хранилища и всестороннего анализа, реализуется озеро-бизнес данных, представляющее собой масштабный комплекс, включающий хранилища и специальные инструменты для обработки информации.
Легко объясняется интерес корпораций к системам уровня "озера данных", поскольку они способны решать задачи, недоступные для любого другого типа хранилища. Такая модель идеальна для аналитического прогнозирования, статистического моделирования и предсказания развития того или иного направления деятельности.
Причина проста - данные в пределах озера хранятся сразу в нескольких типах - как структурированные источники, так и просто статистические выборки из различных внешних точек доступа. В результате, с помощью встроенных инструментов анализа, специалисты корпорации могут легко моделировать последствия внедрения каких-то новых инженерных решений, поведение продукта на рынке или реакцию потребителей на то или иное нововведение. Подобные возможности значительно усиливают конкурентные преимущества.
Озеро данных обеспечивает высочайшую полезность благодаря следующим ключевым принципам:
- хранение данных производится в настраиваемом виде. Аналитики могут формировать структурные представления для хранения ключевых областей информации. Также, обеспечена сборка неструктурированного контента из внешних источников. Аппаратная часть, в свою очередь, отвечает за высочайшую пропускную способность хранилища, а также обеспечивает высокий показатель производительности.
- Инструментарий анализа может исследовать и управлять наборами данных, сложность которых находятся в соответствии с основными механизмами аналитики, в том числе, использующих In-Memory No-SQL, Hadoop.
- Скорость получения результатов анализа - уровень систем реального времени. Это дает пользователям, равно как и сервисам, все возможности по мгновенной регулировке, изменениям для самого оперативного принятия ключевых решений.
Трудность в развертывании озер данных заключалась в том, что соответствующим подразделениям нужно было построить аналитический инструментарий, создать специальное хранилище данных для каждой подзадачи и области, которые, в том числе, включали обработку данных перед внутренним размещением.
Также много времени отнимала предварительная загрузка данных, создание политики прав доступа, организация аудита, настройка правил и логики группового регулирования и управления. Огромный объем работы требовал большого вложения ресурсов со стороны подразделений ИТ, а большой период времени затруднял выполнение запросов пользователей.
Federation Business Data Lake (FBDL) предлагает новый принцип организации для автоматического развертывания. С ее помощью подразделения ИТ могут предсказывать и предугадывать развитие потребностей и запросов со стороны бизнес-отрасли. Аналитические инструменты полностью виртуализированы, для реализации этой части системы послужили решения от VMware. Основные схемы инструментария предустановлены и требуют только тонкой настройки.
Средства анализа включают не только решения для обработки внутренних данных, хранимых с помощью Federation Business Data Lake (FBDL). Предусмотрены возможности корпоративного класса для синхронизации и коммуникации с другими внешними платформами анализа и хранилищами структурированных данных.