Просмотр содержимого документа
«Bigdata. Основные понятия базы данных.»
Bigdata. Основные понятия базы данных.
Термин Big Data (дословно — большие данные) используется для описания большого и постоянно растущего со временем набора данных.
Преимущества, которые предоставляет Big Data:
Сбор данных из разных источников.
Улучшение бизнес-процессов через аналитику в реальном времени.
Хранение огромного объема данных.
Инсайты. Big Data более проницательна к скрытой информации при помощи структурированных и полуструктурированных данных.
Снижение риска. Большие данные помогают уменьшать риск и принимать умные решения благодаря подходящей риск-аналитике
Проблемы Big Data:
1. Конфиденциальность данных. Big Data, которую мы сегодня генерируем, содержит много информации о нашей личной жизни, на конфиденциальность которой мы имеем полное право.
2. Защита данных. Даже если мы решаем, что нас устраивает то, что у кого-то есть наши данные для определенной цели, можем ли мы доверить им сохранность и безопасность наших данных?
Примеры Big Data: Фондовая Биржа, Социальные медиа, Реактивный двигатель.
Классификация Big Data: Структурированная, Неструктурированная, Полуструктурированная
Структурированная форма.Данные, которые могут храниться, быть доступными и обработанными в форме с фиксированным форматом называются структурированными. За продолжительное время компьютерные науки достигли больших успехов в совершенствовании техник для работы с этим типом данных (где формат известен заранее) и научились извлекать пользу. Однако уже сегодня наблюдаются проблемы, связанные с ростом объемов до размеров, измеряемых в диапазоне нескольких зеттабайтов (1 зеттабайт соответствует миллиарду терабайт).Данные, хранящиеся в реляционной базе — структурированы и имеют вид, например, таблицы.
Неструктурированная форма.Данные неизвестной структуры классифицируются как неструктурированные. Пример неструктурированных данных — гетерогенный источник, содержащий комбинацию простых текстовых файлов, картинок и видео (результат Гугл поиска).
Полуструктурированная форма.Полуструктурированные данные обладают некоторой формой, но в действительности не определяются с помощью таблиц.
Характеристики Big Data
Объем. Размер данных — важнейший показатель при определении возможной извлекаемой ценности. Ежедневно 6 миллионов людей используют цифровые медиа, что по предварительным оценкам генерирует 2.5 квинтиллиона байт данных.
Разнообразие. Раньше электронные таблицы и базы данных были единственными источниками информации, рассматриваемыми в большинстве приложений. Сегодня же данные в форме электронных писем, фото, видео, PDF файлов, аудио тоже рассматриваются в аналитических приложениях.
Скорость генерации. Скорость определяет быстроту притока информации из источников — бизнес процессов, логов приложений, сайтов социальных сетей и медиа, сенсоров, мобильных устройств. Поток данных огромен и непрерывен во времени.
Изменчивость описывает непостоянство данных в некоторые моменты времени, которое усложняет обработку и управление.
Продвижение товаров и услуг: доступ к данным из поисковиков и сайтов, таких как Facebook и Twitter, позволяет предприятиям точнее разрабатывать маркетинговые стратегии.
Улучшение сервиса для покупателей: традиционные системы обратной связи с покупателями заменяются на новые, в которых Big Data и обработка естественного языка применяется для чтения и оценки отзыва покупателя.
Расчет риска, связанного с выпуском нового продукта или услуги.
Операционная эффективность: большие данные структурируют, чтобы быстрее извлекать нужную информацию и оперативно выдавать точный результат.
Задания к теме « Большие данные Big Date»
Задание 1. Оформить конспект, отразить в нём следующие моменты:
- понятие Big Date,
- преимущества и проблемы Big Date,
- классификация Big Date,
- характеристики Big Date.
Задание 2. Заполните таблицу характеристиками больших данных и традиционных данных.
Характеристики
Традиционные базы данных
Большие данные
Область применения
Характеристика данных
Способ хранения данных
Модель хранения и обработки данных
Количество информации для обработки
Задание 3.
Используя ресурсы Интернета, приведите примеры применения Big Data из жизни и проанализируйте знания и умения, которыми нужно обладать, чтобы стать специалистом в области больших данных.
Ф ПГКМ -703-31-09 Сабақ жоспары. Бірінші басылым.
Ф ПГКМ -703-31-09 План учебного занятия. Издание Первое