|
|
Обзор
Рынок баз данных 2010Аналитики отмечают, что при нынешних темпах разработки в ближайшие пять лет нас ждет ряд радикальных изменений в существующих СУБД. Большинство хранилищ данных будут использовать хранение по столбцам, а не по строкам, в большинстве крупномасштабных серверов баз данных будет использоваться горизонтальное масштабирование через кластеризацию. Множество проблем, связанных со сбором и анализом данных будут решаться при помощи СУБД, вообще не имеющих формальной схемы. Большинство данных технологий разрабатывались в течение 10 последних лет, но только сейчас они начинают находить широкое применение в промышленных системах.
Развитие индустрии систем управления базами данных базируется на значительных фундаментальных научных исследованиях. Зачастую, между самими исследованиями и их конкретной реализацией в прикладных решениях проходят годы, а иногда и десятилетия. Работу в области управления данными проводят как университетские исследовательские группы (MIT, Berkeley), так центры разработок основных поставщиков СУБД (Oracle, IBM, Microsoft). Инвестирование в управление данными – это долгосрочное, и вместе с тем, выгодное вложение средств. В настоящее время исследователи имеют в своем распоряжении средства, позволяющие эффективно реализовать сложнейшие запросы, манипулирующие терабайтами (а скоро уже и петабайтами) различных данных.
Основными тенденциями, давшими повод для проведения различных масштабных исследований в области баз данных стали:
Экспоненциальный рост данных. Объем данных, в том числе синтетических, генерируемых автоматизированными системами, значительно возрос. Увеличилось и число прикладных областей, в которых требуется обработка больших объемов данных. К таким областям теперь относятся не только традиционные корпоративные приложения и поиск в Web, но также и научные исследования, обработка естественных языков, анализ социальных сетей и т.п.
Значительное усложнение структур используемых данных. Простые виды данных в виде чисел и символьных строк стали дополнятся многочисленной мультимедийной информацией, пространственными, процедурными данными и большим количеством прочих сложных форматов.
Широкое распространение дешевых высокопроизводительных аппаратных средств. Ежегодно мы наблюдаем рост вычислительных возможностей микропроцессоров, увеличение емкости и снижение стоимости доступных и удобных в эксплуатации устройств дисковой и оперативной памяти.
Активное развитие средств коммуникации и «всемирной паутины» World Wide Web. WWW становится единой информационной средой, пронизывающей весь мир и объединяющей огромное число пользователей и электронных устройств.
Появление новых важных областей применения СУБД. В первую очередь, это связано с интеллектуальным анализом данных, хранилищами данных, а в последнее время – с параллельными вычислениями и «облачными» технологиями.
Первым поколением СУБД принято считать иерархические и сетевые системы. Данные системы получили широкое распространение в 70-х годах прошлого века, а первой коммерческой системой данного типа была система IMS компании IBM. В 80-х годах эти системы были вытеснены системами второго поколения – повсеместно используемыми и по сей день реляционными СУБД. В этих системах использовались непроцедурные языки управления данными (SQL) и предусматривалась значительная степень независимости данных.
Реляционные системы внесли значительные усовершенствования в управление данными: графический пользовательский интерфейс (GUI), клиент-серверные приложения, распределенные базы данных, параллельный поиск данных и интеллектуальный анализ данных. Уже к концу 80-х годов существовавшая тогда реляционная модель перестала удовлетворять разработчиков в силу ряда ограничений. Ответом на возрастающую сложность приложений баз данных стали два новых направления развития СУБД: объектно-ориентированные СУБД и объектно-реляционные СУБД.
В 1991 г. был образован консорциум ODMG (Object Database Management Group ), основной целью которого стала выработка промышленного стандарта объектно-ориентированных баз данных. Последняя версия стандарта имеет индекс 3.0. К концу 90-х существовало около десяти компаний, производящих коммерческие продукты, позиционируемые на рынке как ООСУБД. Наиболее известными системами данного класса стали Objectivity, Versant производства одноименных компаний, а также СУБД Jasmine, выпущенная компанией CA. Несмотря на преимущества, позволяющие более эффективно решать определенный ряд задач, объектно-ориентированные системы так и не смогли завоевать значимую долю рынка СУБД, оставшись «нишевым» продуктом.
Поставщиками традиционных реляционных СУБД также была проведена значительная работа по объединению объектно-ориентированных и реляционных систем. Разработчики постарались расширить язык SQL, чтобы включить в него концепции объектно-ориентированного подхода, сохраняя преимущества реляционной модели (объектные расширения языка SQL были зафиксированы в стандарте SQL:1999). Основной принцип – это эволюционное развитие возможностей СУБД без коренной ломки предыдущих подходов и с сохранением преемственности с системами предыдущего поколения.
Понятие СУБД третьего поколения, которыми, собственно говоря, и являются объектно-реляционные СУБД, появилось после опубликования группой известных специалистов в области баз данных «Манифеста систем баз данных третьего поколения». Основные принципы СУБД третьего поколения, обозначенные в манифесте:
Помимо традиционных услуг по управлению данными, СУБД третьего поколения должны обеспечить поддержку более развитых структур объектов и правил. Более развитая структура объектов характеризует средства, необходимые для хранения и манипулирования нетрадиционными элементами данных (тексты, пространственные данные, мультимедиа).
СУБД третьего поколения должны включить в себя СУБД второго поколения. Системы второго поколения внесли решающий вклад в двух областях – непроцедурный доступ с помощью языка запросов SQL и независимость данных. Эти достижения обязательно должны учитываться в системах третьего поколения.
СУБД третьего поколения должны быть открыты для других подсистем. Это включает оснащение разнообразными инструментами поддержки принятия решений, доступом из многих языков программирования, интерфейсами к существующим популярным системам и бизнес-приложениям, возможностью запуска приложений из базы данных на другой машине и распределенной СУБД. Весь набор инструментов и СУБД должен эффективно функционировать на разнообразных аппаратных платформах с различными операционными системами. Кроме того, СУБД, рассчитывающая на широкую сферу применения, должна быть оснащена языком четвертого поколения (4GL).
В середине девяностых годов прошлого века имелось лишь несколько исследовательских прототипов СУБД, сочетавших лучшие черты реляционных и объектно-ориентированных СУБД. Первым коммерческим продуктом, которому были присущи объектно-реляционные черты, стал Universal Server компании Informix (впоследствии была поглощена IBM). В настоящее время большинство этих идей уже воплощено в реальных коммерческих решениях, в том числе и в продуктах основных поставщиков СУБД (Oracle Database и IBM DB2).
Аналитики IDC считают, что при нынешних темпах разработки в ближайшие пять лет нас ждет ряд радикальных изменений в существующих СУБД. Большинство хранилищ данных будут использовать хранение по столбцам, а не по строкам. Для увеличения быстродействия большинство универсальных СУБД будут расширены специальными базами данных, работающими в оперативной памяти
(In memory DB). В большинстве крупномасштабных серверов баз данных будет использоваться горизонтальное масштабирование через кластеризацию. Множество проблем, связанных со сбором и анализом данных будут решаться при помощи СУБД, вообще не имеющих формальной схемы.
Большинство данных технологий разрабатывались (а некоторые и использовались в существующих решениях), по крайней мере, в течение 10 последних лет. Но только сейчас они начинают находить широкое применение в промышленных системах. По словам Карла Олофсона, вице-президента IDC по исследованиям в области управления информацией и ПО для интеграции данных, эти технологии уже не используются только для решения задач, связанных с экзотическими хранилищами данных или других инновационных задач. «Они становятся обычным явлением и предлагаются большим числом производителей – некоторые из них появились недавно, а некоторые хорошо знакомы – для решения повседневных и насущных проблем управления данными», – говорит Олофсон.
В связи с этим IDC рекомендует компаниям, активно использующим СУБД, внимательно изучить обозначенные новшества (а также другие новые технологии) и оценить, каким образом они могли бы помочь решить существующие проблемы по управлению данными. Также рекомендуется поразмыслить над тем, какие проблемы, решаемые в настоящий момент существующими системами, могли бы более эффективно решаться с помощью СУБД третьего поколения. Необходимо поинтересоваться у своих поставщиков СУБД о планах на будущее, рассказать им о своих потребностях и проблемах, а также разработать план перехода, который учитывал бы как запланированную модернизацию, так и проблемы, которые лучше решать с использованием новых технологий.
Максим Никитин
Сообщить факт о Windows XP
Почему устарела Windows XP?
Сообщить цифры о Windows XP