Если бы вам предоставили два разных, но связанных между собой набора данных, какие инструменты вы бы использовали для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных через SQL SELECT? Джим Лемер предлагает лучшие практики, методики и приемы, которые помогут вам импортировать, очищать, сопоставлять, оценивать и осмысливать разнообразные данные с помощью SQL. Администраторы баз данных, программисты, бизнес-аналитики и специалисты по исследованию данных узнают, как выявлять и удалять дубликаты, разбирать строки, извлекать данные из XML и JSON, генерировать SQL с помощью SQL, упорядочивать данные и готовить наборы данных, а также применять подходы к качеству данных и ETL для поиска сходств и различий между различными выражениями одних и тех же данных. Примеры, приведенные в книге, полны реальных приемов и содержат рабочий код.
Федеральное государственное бюджетное учреждение культуры «Российская государственная библиотека для молодёжи»
Главное здание
107061 Москва, ул. Б. Черкизовская, дом 4, корпус 1 Метро «Преображенская площадь» (выход №5) Телефон для справок: +7 499 670-80-01 E-mail: info@rgub.ru
Филиал библиотеки МИКК «Особняк В.Д. Носова»
107023 Москва, ул. Электрозаводская, 12, стр. 1 Метро «Электрозаводская» Телефоны для справок: +7 499 670-80-01 (доб. 600) E-mail: mansion@rgub.ru