Корпоративные базы данных - статьи

СУБД Teradata® для ОС UNIX®


Константин Лисянский, Дмитрий Слободяников, NCR
Постоянное совершенствование
Компания Teradata была основана в 1979 году, как дочерняя фирма компании Citicorp Advanced Technology Group. Продукт данной фирмы был разработан специально для непрерывной обработки больших объемов данных. В 1984 году фирма Teradata выпустила первые системы массивно-параллельной обработки (massively parallel processing - MPP) - специализированный компьютер для баз данных первой модели (DBC Model 1). Teradata первой вышла на рынок MPP систем, опередив своих конкурентов более чем на десять лет. Начиная с того времени компания Teradata, а теперь и компания NCR (в 1991 году компания NCR купила компанию Teradata) выпускает один из лучших в мире продуктов для систем поддержки принятия решений и хранилищ данных. 80-ые годы Первая система Teradata отвечала архитектуре программного обеспечения "ничего не разделяется" ("Shared Nothing") и функционировала на соответствующей аппаратной платформе. В системе были реализованы : интеллектуальная межпроцессорная шина YNET; связующие каналы с мэйнфреймами; механизм защиты данных от сбоев (Fallback); мощный оптимизатор, оценивающий относительную "стоимость" выполнения SQL запроса, с возможностью выдачи подробных сведений о том, как выполнялся запрос. Все основные операции с данными выполнялись параллельно. Распараллеливались следующие операции и утилиты : INSERT, SELECT; UPDATE, DELETE; Nested Loop Join; Sort Merge Join; Hash Merge Join, архивация/восстановление данных; утилиты по загрузке данных; загрузчик программного обеспечения. К 90-му в году в СУБД Teradata были реализованы следующие возможности: устоявшиеся типы данных, соединения по локальной сети, кэширование шагов синтаксического разбора SQL запросов, объявляемые приоритеты, совместимость с базами данных DB2 и 10 уровней блокировок. Дополнительные, полностью распараллеленные возможности включали в себя : соединение операций по удалению записей (Delete Join), соединение операций по обновлению записей (Update Join), журналирование и утилиту параллельного обновления данных с возможностью обновления и вставки (UPSERT).
На аппаратных платформах DBC третьего поколения было достигнуто двукратное улучшение соотношения цена/производительность. В 80-ые годы непрерывное совершенствование СУБД Teradata стало неотъемлемой частью существования нашей компании. Размеры баз данных росли не по дням, а по часам. Первую систему, рассчитанную на объем данных в 100ГБ, Teradata выпустила в 1985, первую СУБД на 500ГБ - в 1987 году и, наконец, первую СУБД на 700 ГБ - в 1989 году. Тесты подтвердили, что мощность СУБД практически линейно зависит от числа процессоров, при увеличении числа процессоров до 300. В 1986 году журнал Forbes Magazine присудил продукту Teradata DBS награду "Продукт года", а в 1990 году в журнале INC Teradata была названа самой быстро развивающейся компанией в Америке. Начало 90-х годов Постоянное совершенствование продолжалось и в 90-ые годы, были добавлены следующие возможности : Teradata Manager (Клиентское ПО, предназначенное для администрирования СУБД с удаленного ПК, работающего под ОС Windows 95/NT), Диспетчер запросов к базам данных (Database Query Manager), параллельная утилита экспорта данных, разрешен доступ к таблицам БД во время архивации, увеличена в 20 раз скорость восстановления узлов после сбоев, введены поддержка дисковых массивов RAID, параллельные внешние соединения, а также поддержка запросов, связанных с многомерным анализом (OLAP), для оптимизации которых используется соединения таблиц по типу Звезда или Снежинка и параллельный оператор Hash Star Join. В 1991, когда был представлен компьютер DBC четвертого поколения, Electronic Business назвал компанию Teradata "самой быстро растущей компанией в области электроники". В 1992 году была выпущена первая система, оперирующая с 1 терабайтом данных. В 1993 году, согласно сведениям Smaby Group, доля NCR на рынке CPP составляла 80%. В 1994 году была выпущена первая система, работающая с несколькими терабайтами данных, и группа Gartner Group назвала компанию NCR "Лидером в параллельной промышленной обработке данных".


Опрос пользователей, проведенный в 1995 фирмой IDC и опубликованный в Computerworld, показал, что наша компания является компанией № 1 в области массивно-параллельной обработки. В 1997 году по результатам исследования проведенного компанией IDC по итогам 1996 года компания NCR занимает 50.5% рынка хранилища данных по поставкам и 40.9% по доходам по сравнению с ближайшими конкурентами DEC (поставки 16.8%, доходы 15.4) и IBM (поставки 10.1%, доходы 18.9%) соответственно. Сегодня Сегодня Teradata - единственный продукт, поддерживающий настоящие хранилища данных объемом свыше 500 ГБ и позволяющий реализовать системы с объемом пользовательских данных свыше 1 ТБ (1 триллион байтов). На СУБД Teradata реализована самое большое в мире промышленное хранилище данных с общим объемом в 24ТБ. Teradata является "сердцем" хранилищ данных таких крупнейших в мире компаний, как AT&T, Sprint, British Telecom, Swedish Post, Australian Telecom, Bank of America, Chemical Bank, Fidelity Investments, Proctor and Gamble, WalMart, Kmart, Sears, Otto Versand, Delta Airlines, Qantas, USAir и American Airlines, и это далеко не полный список. У одного из наших клиентов (не самого крупного) работает машина системы 3600, которая за день обрабатывает: 800000 "OLTP"-транзакций от 7500 пользователей со временем отклика меньше секунды; 2000 "OLCP"-транзакций от 400 пользователей с объемом данных до 70МБ на транзакцию и временем отклика от долей секунды до 20 минут; 40 сложных "нерегламентированных запросов DSS" от 6 пользователей-аналитиков; а также 25МБ транзакций, связанных с партиями товара, в базе данных объемом 750ГБ, содержащей 1300 таблиц. В самой большой таблице содержится 2.4 миллиарда строк. В двух других таблицах содержится по 300 миллионов строк, а в большинстве таблиц содержится от миллиона до 10 миллионов строк. Система работает 7 дней в неделю, 24 часа в сутки.
| |

Содержание раздела