1. ВВЕДЕНИЕ В РЕЛЯЦИОННУЮ БАЗУ ДАННЫХ ВВЕДЕНИЕ ============================== SQL ( ОБЫЧНО ПРОИЗНОСИМАЯ КАК "СЭКВЭЛ" ) символизирует собой Струк- турированный Язык Запросов. Это - язык который дает вам возможность создавать и работать в реляционных базах данных, которые являются на- борами связанной информации сохраняемой в таблицах. Мир баз данных становится все более и более единым, что привело к необходимости создания стандартного языка который мог бы использовать- ся чтобы функционировать в большом количестве различных видов компь- ютерных сред. Стандартный язык позволит пользователям знающим один на- бор команд, использовать их чтобы создавать, отыскивать, изменять, и передавать информацию независимо от того работают ли они на персональ- ном компьютере, сетевой рабочей станции, или на универсальной ЭВМ. В нашем все более и более взаимосвязанном компьютерном мире, пользо- ватель снабженый таким языком, имеет огромное преимущество в использо- вании и обобщении информации из ряда источников с помощью большого колличества способов. Элегантность и независимость от специфики компьютерных технологий, а также его поддержка лидерами промышленности в области технологии реля- ционных баз данных, сделало SQL, и вероятно в течение обозримого буду- щего оставит его, основным стандартным языком. По этой причине, любой кто хочет работать с базами данных 90-х годов должен знать SQL. Стандарт SQL определяется ANSI (Американским Национальным Институтом Стандартов) и в данное время также принимается ISO (МЕЖДУНАРОДНОЙ ОР- ГАНИЗАЦИЕЙ ПО СТАНДАРТИЗАЦИИ). Однако, большинство коммерческих прог- рамм баз данных расширяют SQL без уведомления ANSI, добавляя разные другие особенности в этот язык, которые, как они считают, будут весьма полезны. Иногда они несколько нарушают стандарт языка, хотя хорошие идеи имеют тенденцию развиваться и вскоре становиться стандартами "рынка" сами по себе в силу полезности своих качеств. В этой книге, мы будем, в основном, следовать стандарту ANSI, но одновременно иногда будет показывать и некоторые наиболее общие отклонения от его стандар- та. Вы должны проконсультироваться с документацией вашего пакета прог- рамм который вы будете использовать, чтобы знать где в нем этот стан- дарт видоизменен. ПРЕЖДЕ, ЧЕМ ВЫ СМОЖЕТЕ ИСПОЛЬЗОВАТЬ SQL, ВЫ должны понять что такое реляционные базы данных. В этой главе, мы это объяс- ним, и покажем насколько реляционные базы данных полезны. Мы не будем обсуждать SQL именно здесь, и если вы уже знаете эти понятия довольно хорошо, вы можете просто пропустить эту главу. В любом случае, вы должны рассмотреть три таблицы которые предоставляются и объясняются в конце главы; они станут основой наших примеров в этой книге. Вторая копия этих таблиц находится Приложении E, и мы рекомендуем скопировать их для удобства ссылки к ним. ЧТО ТАКОЕ - РЕЛЯЦИОННАЯ БАЗА ДАННЫХ? Реляционная база данных - это тело связанной информации, сохраняемой в двумерных таблицах. Напоминает адресную или телефонную книгу. В кни- ге имеется большое количество входов, каждый из которых соответствует определеной особенности. Для каждой такой особенности, может быть нес- колько независимых фрагментов данных, например имя, телефонный номер, и адрес. Предположим, что вы должны сформатировать эту адресную книгу в виде таблицы со строками и столбцами. Каждая строка ( называемая также записью ) будет соответствовать определенной особенности; каждый столбец будет содержать значение для каждого типа данных - имени, те- лефонного номера, и адреса представляемого в каждой строке. Адресная книга могла бы выглядеть следующим образом: Имя Телефон Адрес Gerry Farish ( 415)365-8775 127 Primrose Ave.,SF Celia Brock ( 707)874-3553 246 #3rd St.,Sonoma Yves Grillet ( 762)976-3665 778 Modernas,Barcelona То что вы получили является основой реляционной базы данных как и было определено в начале этого обсуждения - а именно, двумерной (стро- ка и столбец ) таблицей информации. Однако, реляционные базы данных редко состоят из одной таблицы. Такая таблица меньше чем файловая сис- тема. Создав несколько таблиц взаимосвязанной информации, вы сможете выполнить более сложные и мощные операции с вашими данными. Мощность базы данных зависит от связи которую вы можете создать между фрагмен- тами информации, а не от самого фрагмента информации. СВЯЗЫВАНИЕ ОДНОЙ ТАБЛИЦЫ С ДРУГОЙ Позвольте нам использовать пример нашей адресной книги чтобы начать обсуждение базы данных которая может реально использоваться в деловой ситуации. Предположим, что персонажи в нашей первой таблице ( адресной книги ) - это пациенты больницы. В другой таблице, мы могли бы запом- нить дополнительную информацию об этих пациентах. Столбцы второй таб- лицы могли бы быть помечены как Пациент, Доктор, Страховка, и Балланс. Пациент Доктор Страховка Балланс Farish Drume B.C./B.S. $272.99 Grillet Halben None $44. 76 Brock Halben Health,Inc. $9077.47 Много мощных функций можно выполнить извлекая информацию из этих таблиц согласно указанным параметрам, особенно когда эти параметры включают в себя фрагменты информации свзанные в различных таблицах друг с другом. Например, возьмем - докторов. Предположим доктор Halben захотел получить номера телефонов всех своих пациентов. Чтобы извлечь эту информацию, он мог бы связать таблицу с номерами телефонов пациен- тов ( по адресной книге ) с таблицей которая бы указывала, какой из пациентов - его. Хотя, в этом простом примере, он мог бы держать это в голове и сразу получать номера телефонов пациентов Grillet и Brock, эти таблицы могут быть слишком большими и слишком сложными. Программы реляционной базы данных разрабатывались для того чтобы обрабатывать большие и сложные совокупности данных такого типа, что очевидно явля- ется более универсальным методом в деловом мире. Даже если бы база данных больницы содержала сотни или тысячи имен - как это вероятно и бывает на практике - одна команда SQL могла бы выдать доктору Halben информацию в которой он нуждался почти немедленно. ПОРЯДОК СТРОК ПРОИЗВОЛЕН Чтобы поддерживать максимальную гибкость, строки таблицы, по опреде- лению, не должны находиться ни в каком определенном порядке. С этой точки зрения, в этом структура базы данных отличается от нашей адрес- ной книги. Вход в адресную книгу обычно упорядочивается в алфавитном порядке. В системах с реляционной базой данных, имеется одна мощная возможность для пользоватей - это способность упорядочивать информацию так чтобы они могли восстанавливать ее. Рассмотрим вторую таблицу. Иногда Вам необходимо видеть эту информа- цию упорядоченной в алфавитном порядке по именам, иногда в возрастаю- щем или убывающем порядке, а иногда сгруппированной по отношению к ка- кому-нибудь доктору. Наложение порядка набора в строках будет сталки- ваться со способностью заказчика изменять его, поэтому строки всегда рассматриваются как неупорядоченные. По этой причине, вы не можете просто сказать:" Мы хотим посмотреть пятую строку таблицы. " Пренебре- гая порядком в котором данные вводились или любым другим критерием, мы определим, не ту строку, хотя она и будет пятой. Строки таблицы кото- рые рассматриваются, не будут в какой-либо определенной последователь- ности. ИДЕНТИФИКАЦИЯ СТРОК ( ПЕРВИЧНЫЕ КЛЮЧИ ) По этим и другим причинам, вы должны иметь столбец в вашей таблице который бы уникально идентифицировал каждую строку. Обычно, этот стол- бец содержит номер - например, номер пациента назначаемый каждому па- циенту. Конечно, вы могли бы использовать имя пациентов, но возможно что имеется несколько Mary Smiths; и в этом случае, вы не будете иметь другого способа чтобы отличить этих пациентов друг от друга. Вот почему номера так необходимы. Такой уникальный столбец( или уни- кальная группа столбцов ), используемый чтобы идентифицировать каждую строку и храненить все строки отдельно, называются - первичными ключа- ми таблицы. Первичные ключи таблицы важный элемент в структуре базы данных. Они - основа вашей системы записи в файл; и когда вы хотите найти опреде- ленную строку в таблице, вы ссылаетесь к этому первичному ключу. Кроме того, первичные ключи гарантируют, что ваши данные имеют определенную целостность. Если первичный ключ правильно используется и поддержива- ется, вы будете знать что нет пустых строк таблицы и что каждая строка отличается от любой другой строки. Мы будем обсуждать ключи и далее когда поговорим относительно справочной целостности в Главе 19. СТОЛБЦЫ ИМЕНУЮТСЯ И НУМЕРУЮТСЯ В отличие от строк, столбцы таблицы ( также называемые полями ) упоря- дочиваются и именуются. Таким образом, в нашей таблице адресной книги, возможно указать на " адрес столбца " или на " столбец 3 ". Конечно, это означает что каждый столбец данной таблицы должен иметь уникальное имя чтобы избежать неоднозначности. Лучше всего если эти имена указы- вают на содержание поля. В типовых таблицах этой книги, мы будем ис- пользовать такие сокращения для имени столбца, как cname для имени за- казчика, и odate для даты порядка. Мы также дадим каждой таблице лич- ный числовой номер столбца в качестве первичного ключа. Следующий раз- дел будет объяснять эти таблицы и их ключи более подробно. ========= ТИПОВАЯ БАЗА ДАННЫХ ========== Таблицы 1.1, 1.2, и 1.3 составляют реляционную базу данных которая является минимально достаточной чтобы легко ее отслеживать, и доста- точно полной, чтобы иллюстрировать главные понятия и практику исполь- зования SQL. Эти таблицы напечатаны в этой главе а также в Приложении E. Так как они будут использоваться для иллюстрирования различных особенностей SQL по всей этой книге, мы рекомендуем чтобы вы скопировали их, для удобства ссылки к ним. Вы могли уже обратить внимание что первый столбец каждой таблицы со- держит номера чьи значения различны для каждой строки. Как вы наверное и предположили, это - первичные ключи таблиц. Некоторые из этих номе- ров также показаны в столбцах других таблиц. В этом нет ничего невер- ного. Они поазывают связь между строками которые используют значение принимаемое из первичного ключа, и строками где это значение использу- ется в самом первичном ключе. Таблица 1.1: Продавцы ─────────────────────────────────────────────────────────── SNUM SNAME CITY COMM ─────────────────────────────────────────────────────────── 1001 Peel London .12 1002 Serres San Jose .13 1004 Motika London .11 1007 Rifkin Barcelona .15 1003 Axelrod New York .10 ─────────────────────────────────────────────────────────── Таблица 1.2: Заказчики ---------------------------------------------- CNUM | CNAME | CITY | RATING | SNUM -------|------------|---------|--------|------ 2001 | Hoffman | London | 100 | 1001 2002 | Giovanni | Rome | 200 | 1003 2003 | Liu | SanJose | 200 | 1002 2004 | Grass | Berlin | 300 | 1002 2006 | Clemens | London | 100 | 1001 2008 | Cisneros | SanJose | 300 | 1007 2007 | Pereira | Rome | 100 | 1004 ---------------------------------------------- Таблица 1.3: Порядки ----------------------------------------------- ONUM | AMT | ODATE | CNUM | SNUM -------|-----------|-------------|------|------ 3001 | 18.69 | 10/03/1990 | 2008 | 1007 3003 | 767.19 | 10/03/1990 | 2001 | 1001 3002 | 1900.10 | 10/03/1990 | 2007 | 1004 3005 | 5160.45 | 10/03/1990 | 2003 | 1002 3006 | 1098.16 | 10/03/1990 | 2008 | 1007 3009 | 1713.23 | 10/04/1990 | 2002 | 1003 3007 | 75.75 | 10/04/1990 | 2004 | 1002 3008 | 4723.00 | 10/05/1990 | 2006 | 1001 3010 | 1309.95 | 10/06/1990 | 2004 | 1002 3011 | 9891.88 | 10/06/1990 | 2006 | 1001 ----------------------------------------------- Например, поле snum в таблице Заказчиков указывает, какому продавцу назначен данный заказчик. Номер поля snum связан с таблицей Продавцов, которая дает информацию об этих продавцах. Очевидно, что продавец ко- торому назначены заказчики должен уже существовать - то есть, значение snum из таблицы Заказчиков должно также быть представлено в таблице Продавцов. Если это так, то говорят, что " система находится в состоя- нии справочной целостности ". Этот вывод будет более полно и формально объяснен в Главе 19. ПРИМЕЧАНИЕ: Эти три представленых таблицы в тексте имеют русские имена - Продавцов, Заказчиков и Порядков, и далее будут упоминаться именно под этими именами. Имена любых других применяемых в книге таб- лиц будут написаны по английски что бы отличать их от наших базовых таблиц этой базы данных. Кроме того в целях однозначности, имена за- казчиков, продавцов, Системных Каталогов а также полей в тексте, также будут даны на латыни. Таблицы приведены как пример к похожей ситуации в реальной жизни, когда вы будете использовать SQL чтобы следить за продавцами, их за- казчиками, и порядками заказчиков. Давайте рассмотрим эти три таблицы и значения их полей. Здесь показаны столбцы Таблицы 1.1 ПОЛЕ СОДЕРЖАНИЕ --------- ---------------------------------------------- snum уникальный номер назначенный каждому продавцу ( " номер служащего " ). sname имя продавца. city расположение продавца( город ). comm комиссионные продавцов в десятичной форме. Таблица 1.2 содержит следующие столбцы: ПОЛЕ СОДЕРЖАНИЕ -------- --------------------------------------------------- cnum уникальный номер назначенный каждому заказчику. cname имя заказчика. city расположение заказчика( город ). rating код указывающего уровень предпочтения данного заказчика перед другими. Более высокий номер указывают на большее предпочтение( рейтинг ). snum номер продавца назначенного этому заказчику ( из таблицы Продавцов ) И имеются столбцы в Таблице 1.3: ПОЛЕ СОДЕРЖАНИЕ --------- --------------------------------------------------- onum уникальный номер данный каждому приобретению. amt значение суммы приобретений. odate дата приобретения. cnum номер заказчика делающего приобретение ( из таблицы Заказчиков ). snum номер продавца продающего приобретение ( из таблицы Продавцов). =========== РЕЗЮМЕ ============ Теперь вы знаете что такое реляционная база данных, понятие, которое звучит сложнее чем есть на самом деле. Вы также изучили некоторые фун- даментальные принципы относительно того, как сделаны таблицы - как ра- ботают строки и столбцы, как первичные ключи отличают строки друга друга, и как столбцы могут ссылаться к значениям в других столбцах. Вы поняли что запись это синоним строки, и что поле это синоним столбца. Оба термина встречаются в обсуждении SQL, и мы будем исполь- зовать их в равной степени в этой книге. Вы теперь знакомы с таблицами примеров. Краткие и простые , они спо- собны показать большинство особенностей языка, как вы это увидите В некоторых случаях, мы будем использовать другие таблицы или постулаты некоторых различных данных в одной из этих таблиц чтобы показать вам некоторые другие возможности. Теперь вы готовы к углублению в SQL самостоятельно. Следующая глава даст вам быстрый просмотр языка, и даст вам информацию, которая помо- жет Вам ссылаться к уже пройденным местам. ************** РАБОТА С SQL ************** 1. Какое поле таблицы Заказчиков является первичным ключом ? 2. Что является столбцом 4 из таблицы Заказчиков ? 3. Как по другому называется строка? Столбец? 4. Почему вы может не запрашивать для просмотра первые пять строк таблицы? ( См. Приложение A для ответов. ) . 2. SQL : ОБЗОР. ЭТА ГЛАВА ПОЗАКОМИТ ВАС СО СТРУКТУРОЙ SQL языка а также с определен- ными общими выводами, такими как тип данных которые эти поля могут со- держать и некоторые области неоднозначностей которые существуют в SQL. Она педназначена обеспечить связь с более конкретной информацией в последующих главах. Вы не должны запоминать каждую подробность упомя- нутую в этой главе. Краткий обзор представлен здесь в одной удобно размещеной области, многие подробности которой вы можете иметь чтобы в последствии ссылаться к ним по мере овладения языком. Мы поместили все это в начало книги чтобы ориентировать вас на мир SQL без упрощенного подхода к его проблемам и в тоже время дать Вам привычные в будущем места для ссылки к ним когда у Вас появятся вопросы. Этот материал мо- жет стать более понятным когда мы перейдем к описанию конкретных ко- манд SQL, начинающихся с Главы 3. ========= КАК РАБОТАЕТ SQL? ========== SQL это язык ориентированный специально на реляционные базы данных. Он устраняет много работы которую вы должны были бы сделать если бы вы использовали универсальный язык программирования, напрмер C. Чтобы сформировать реляционную базу данных на C, вам необходимо было бы на- чать с самого начала. Вы должны были бы определить объект - называемый таблицей которая могла бы расти чтобы иметь любое число строк, а затем создавать постепенно процедуры для помещения значений в нее и извлече- ния из них. Если бы вы захотели найти некоторые определенные строки, вам необходимо было бы выполнить по шагам процедуру, подобную следую- щей : 1. Рассмотрите строку таблицы. 2. Выполните проверку - является ли эта строка одной из строк кото- рая вам нужна. 3. Если это так, сохраните ее где-нибудь пока вся таблица не будет проверена. 4. Проверьте имеются ли другие строки в таблице. 5. Если имеются, возвратитесь на шаг 1. 6. Если строк больше нет, вывести все значения сохраненные в шаге 3. ( Конечно, это не фактический набор C команд, а только логика шагов которые должны были бы быть включены в реальную программу. ) SQL сэко- номит вам все это. Команды в SQL могут работать со всеми группами таб- лиц как с единым объектом и могут обрабатывать любое количество инфор- мации извлеченной или полученной из их, в виде единого модуля. ЧТО ДЕЛАЕТ ANSI ? Как мы уже рассказывали в Введении, стандарт SQL определяется с по- мощью кода ANSI (Американский Национальный Институт Стандартов ). SQL не изобретался ANSI. Это по существу изобретение IBM. Но другие компа- нии подхватили SQL сразу же, по крайней мере одна компания (Oracle) отбила у IBM право на рыночную продажу SQL продуктов. После того как появился ряд конкурирующих программ SQL на рынке, AN- SI определил стандарт к которому они должны быть приведены (определе- ние таких стандартов и является функцией ANSI ). Однако после этого, появились некоторые проблемы. Возникли они в ре- зультате стандартизации ANSI ввиде некоторых ограничений. Так как не всегда ANSI определяет то что является наиболее полезным, то программы пытаются соответствовать стандарту ANSI не позволяя ему ограничивать их слишком сильно. Это, в свою очередь, ведет к случайным несогласо- ванностям. Программы Баз Данных обычно дают ANSI SQL дополнительные особенности и часто ослабляют многие ограничения из большинства из них. Следовательно, общие разновидности ANSI будут также рассмотрены. Хо- тя мы очевидно не сможем объять каждое исключение или разновидность, удачные идеи имеют тенденцию к внедрению и использованию в различных программах даже когда они не определены стандартом ANSI. ANSI - это вид минимального стандарта и вы можете делать больше чем он позволяет, хотя и должны выполнять его указания при выполнении за- дач которые он определяет. ИНТЕРАКТИВНЫЙ И ВЛОЖЕННЫЙ SQL Имеются два SQL: Интерактивный и Вложенный. Большей частью, обе фор- мы работают одинаково, но используются различно. Интерактивный SQL ис- пользуется для функционирования непосредственно в базе данных чтобы производить вывод для использования его заказчиком. В этой форме SQL, когда вы введете команду, она сейчас же выполнится и вы сможете уви- деть вывод (если он вообще получится) - немедленно. Вложенный SQL состоит из команд SQL помещенных внутри программ, ко- торые обычно написаны на некотором другом языке (типа КОБОЛА или Пас- каля). Это делает эти программы более мощными и эффективным. Однако, допус- кая эти языки, приходится иметь дело с структурой SQL и стилем управ- ления данных который требует некоторых расширений к интерактивному SQL. Передача SQL команд во вложенный SQL является выдаваемой ("passed off") для переменных или параметров используемых программой в которую они были вложены. В этой книге, мы будем представлять SQL в интерактивной форме. Это даст нам возможность обсуждать команды и их эффекты не заботясь о том как они связаны с помощью интерфейса с другими языками. Интерактивный SQL - это форма наиболее полезная непрограммистам. Все что вы узнаете относительно интерактивного SQL в основном применимо и к вложенной форме. Изменения необходимые для использования вложенной формы будут использованы в последней главе этой книги. СУБПОДРАЗДЕЛЕНИЯ SQL И в интерактивной и во вложенной формах SQL, имеются многочисленные части, или субподразделения. Так как вы вероятно сталкнетесь с этой терминологией при чтении SQL, мы дадим некоторые пояснения. К сожалению, эти термины не используются повсеместно во всех реали- зациях. Они подчеркиваются ANSI и полезны на концептуальном уровне, но большинство SQL программ практически не обрабатывают их отдельно, так что они по существу становятся функциональными категориями команд SQL. DDL ( Язык Определения Данных ) - так называемый Язык Описания Схемы в ANSI, состоит из команд которые создают объекты ( таблицы, индексы, просмотры, и так далее ) в базе данных. DML (Язык Манипулирования Данными) - это набор команд которые опре- деляют какие значения представлены в таблицах в любой момент времени. DCD (Язык Управления Данными) состоит из средств которые определяют, разрешить ли пользователю выполнять определенные действия или нет. Они являются составными частями DDL в ANSI. Не забывайте эти имена. Это не различные языки, а разделы команд SQL сгруппированных по их функциям. ======== РАЗЛИЧНЫЕ ТИПЫ ДАННЫХ ======== Не все типы значений которые могут занимать поля таблицы - логически одинаковые. Наиболее очевидное различие - между числами и текстом. Вы не можете помещать числа в алфавитном порядке или вычитать одно имя из другого. Так как системы с реляционной базой данных базируются на свя- зях между фрагментами информации, различные типы данных должны понятно отличаться друга от друга, так чтобы соответствующие процессы и срав- нения. могли быть в них выполнены. В SQL, это делается с помощью назначения каждому полю - типа данных который укаазывает на тип значения которое это поле может содержать. Все значения в данном поле должны иметь одинаковый тип. В таблице За- казчиков, например, cname и city - содержат строки текста для оценки, snum, и cnum - это уже номера. По этой причине, вы не можете ввести значение Highest(Наивысший) или значение None(Никакой) в поле rating, которое имеет числовой тип данных. Это ограничение удачно, так как оно налагает некоторую структурность на ваши данные. Вы часто будете срав- нивать некоторые или все значения в данном поле, поэтому вы можете вы- полнять действие только на определенных строках а не на всех. Вы не могли бы сделать этого если бы значения полей имели смешанный тип дан- ных. К сожалению, определение этих типов данных является основной об- ластью в которой большинство коммерческих программ баз данных и офици- альный стандарт SQL, не всегда совпадают. ANSI SQL стандарт распознает только текст и тип номера, в то время как большинство коммерческих программ используют другие специальные типы. Такие как, DATA(ДАТА) и TIME(ВРЕМЯ) - фактически почти стандартные типы( хотя точный формат их меняется ). Некоторые пакеты также поддерживают такие типы, как напри- мер MONEY(ДЕНЬГИ) и BINARY (ДВОИЧНЫЕ). (MONEY - это специальная систе- ма исчисления используемая компьютерами. Вся информация в компьютере передается двоичными числами и затем преобразовываются в другие систе- мы, что бы мы могли легко использовать их и понимать.) ANSI определяет несколько различных типов значений чисел, различия между которыми - довольно тонки и иногда их путают. Разрешенные ANSI типы данных перечислены в Приложении B. Сложность числовых типов ANSI можно, по крайней мере частично,объяс- нить усилием сделать вложенный SQL, совместимым с рядом других языков. Два типа чисел ANSI , INTEGER(ЦЕЛОЕ ЧИСЛО) и DECIMAL (ДЕСЯТИЧНОЕ ЧИСЛО) ( которые можно сокращать как INT и DEC, соответственно ), бу- дут адекватны для наших целей, также как и для целей большинства прак- тических деловых прикладных программ. Естественно, что тип ЦЕЛОЕ можно представить как ДЕСЯТИЧНОЕ ЧИСЛО которое не содержит никаких цифр справа от десятичной точки. Тип для текста - CHAR ( или СИМВОЛ ), который относится к строке текста. Поле типа CHAR имеет определенную длину, которая определяется максимальным числом символов которые могут быть введены в это поле. Больше всего реализаций также имеют нестандартный тип называемый VARC- HAR(ПЕРЕМЕННОЕ ЧИСЛО СИМВОЛОВ), который является текстовой строкой ко- торая может иметь любую длину до определенного реализацией максимума (обычно 254 символа ). CHARACTER и VARCHAR значения включаются в оди- ночные кавычки как "текст". Различие между CHAR и VARCHAR в том, что CHAR должен резервировать достаточное количество памяти для максималь- ной длины строки, а VARCHAR распределяет память так как это необходи- мо. Символьные типы состоят из всех печатных символов, включая числа. Однако, номер 1 не то же что символ "1". Символ "1" - только другой печатный фрагмент текста, не определяемый системой как наличие число- вого значения 1. Например 1 + 1 = 2, но "1" + "1" не равняется "2". Символьные значения сохраняются в компьютере как двоичные значения, но показываются пользователю как печатный текст. Преобразование следует за форматом определяемым системой которую вы используете. Этот формат преобразования будет одним из двух стандартных типов (возможно с рас- ширениями) используемых в компьютерных системах: в ASCII коде ( ис- пользуемом во всех персональных и малых компьютерах ) и EBCDIC коде (Расширенном Двоично-Десятичном Коде Объмена Информации) (используемом в больших компьютерах). Определенные операции, такие как упорядочива- ние в алфавитном порядке значений поля, будет изменяться вместе с фор- матом. Применение этих двух форматов будет обсуждаться в Главе 4. Мы должны следить за рынком, а не ANSI, в использовании типа называ- емого DATE(ДАТОЙ). ( В системе, которая не распознает тип ДАТА, вы ко- нечно можете обьявить дату как символьное или числовое поле, но это сделает большинство операций более трудоемкими. ) Вы должны смотреть свою документацию по пакету программ которые вы будете использовать, чтобы выяснить точно, какие типы данных она поддерживает. SQL НЕСОГЛАСОВАННОСТИ Вы можете понять из предшествующего обсуждения, что имеются самосто- ятельные несогласованности внутри продуктов мира SQL. SQL появился из коммерческого мира баз данных как инструмент, и был позже превращен в стандарт ANSI. К сожалению, ANSI не всегда определяет наибольшую поль- зу, поэтому программы пытаются соответствовать стандарту ANSI не поз- воляя ему ограничивать их слишком сильно. ANSI - вид минимального стандарта - вы можете делать больше чем он это позволяет, но вы должны быть способны получить те же самые результаты что и при выполнении той же самой задачи. ЧТО ТАКОЕ - ПОЛЬЗОВАТЕЛЬ? SQL обычно находится в компьютерных системах которые имеют больше чем одного пользователя, и следовательно должны делать различие между ними ( ваше семейство PC может иметь любое число пользователей, но оно обычно не имеет способов чтобы отличвать одного от другого ). Обычно, в такой системе, каждый пользователь имеет некий вид кода проверки прав который идентифицирует его или ее (терминология изменяется ). В начале сеанса с компьютером, пользователь входит в систему (регистри- руется), сообщая компьютеру кто этот пользователь, идентифицированный с помощью определенного ID(Идентификатора). Любое колличество людей использующих тот же самый ID доступа, являются отдельными пользовате- лями; и аналогично, один человек может представлять большое количество пользователей ( в разное время ), используя различные доступные Иден- тификаторы. SQL следует этому примеру. Действия в большинстве сред SQL приведены к специальному доступному Идентификатору который точно соответствует определенному пользователю. Таблица или другой объект принадлежит пользователю, который имеет над ним полную власть. Пользователь может или не может иметь привилегии чтобы выполнять действие над объектом. Для наших целей, мы договоримся, что любой пользователь имеет привиле- гии необходимые чтобы выполнять любое действие, пока мы не возвратимся специально к обсуждению привилегий в Главе 22. Специальное значение - USER(ПОЛЬЗОВАТЕЛЬ) может использоваться как ар- гумент в команде. Оно указывает на доступный Идентификатор пользовате- ля, выдавшего команду. УСЛОВИЯ И ТЕРМИНОЛОГИЯ Ключевые слова - это слова которые имеют специальное значение в SQL. Они могут быть командами, но не текстом и не именами объектов. Мы бу- дем выделять ключевые слова печатая их ЗАГЛАВНЫМИ БУКВАМИ. Вы должны соблюдать осторожность чтобы не путать ключевые слова с терминами. SQL имеет определенные специальные термины которые используются что- бы описывать его. Среди них - такие слова как запрос, предложение, и предикат, которые являются важнейшими в описании и понимании языка но не означают что-нибудь самостоятельное для SQL. Команды, или предложения, являются инструкциями которыми Вы обращае- тесь к SQL базе данных. Команды состоят из одной или более отдельных логических частей называемых предложениями. Предложения начинаются ключевым словом для которого они являются проименованными, и состоят из ключевых слов и аргументов. Например предложения с которыми вы мо- жете сталкиваться - это " FROM Salespeope " и " WHERE city = "London". Аргументы завершают или изменяют значение предложения. В примерах вы- ше, Salespeople - аргумент, а FROM - ключевое слово предложения FROM. Аналогично, " city = "London" " - агрумент предложения WHERE. Объекты - структуры в базе данных которым даны имена и сохраняются в памяти. Они включают в себя базовые таблицы, представления (два типа таблиц), и индексы. Чтобы показать Вам как формируются команды, мы будем делать это на примерах. Имеется, однако, более формальный метод описания команд ис- пользующих стандартизированные условные обозначения. Мы будем исполь- зовать его в более поздних главах, для удобства чтобы понимать эти ус- ловные обозначения в случае если вы столкнетесь с ним в других SQL до- кументах. Квадратные скобки ( [ ] ) будут указывать части которые мо- гут неиспользоваться, а многоточия ( ... ) указывать что все предшест- вующее им может повторяться любое число раз. Слова обозначенные в уг- ловых скобках (<>) - специальные термины которые объясняют что они со- бой представляют. Мы упростили стандартную терминологию SQL значитель- но, но без ухудшения его понимания. ============== РЕЗЮМЕ ================ Мы быстро прошли основы в этой главе. Но нашим намерением и было - просто пролететь над основами SQL, так чтобы вы могли понять идею от- носительно всего объема. Когда мы возвратимся к основе в следующей главе, некоторые вещи станут более конкретными. Теперь вы знаете кое-что относительно SQL - какова его структура, как он используется, как он представляет данные, и как они определяются ( и некоторые не- согласованности появляющиеся при этом ), и некоторые условные обозна- чения и термины используемые чтобы описывать их. Все это - много ин- формации для одной главы; мы не ожидаем что бы вы запомнили все эти подробности, но вы сможете вернуться позже к ним если понадобится. По Главе 3, мы будем идти, показывая конкретно, как формируются команды и что они делают. Мы представим вам команду SQL используемую чтобы изв- лекать информацию из таблиц, и которая является наиболее широко ис- пользуемой командой в SQL. К концу этой главы, вы будете способны изв- лекать конкретную информацию из вашей базы данных с высокой степенью точности. ************** РАБОТА С SQL ************** 1. Какое наибольшее основное различие между типами данных в SQL ? 2. Распознает ANSI тип данных DATA ? 3. Какой подраздел SQL используется чтобы помещать значения в таблицы ? 4. Что такое - ключевое слово ? ( См. Приложение A для ответов. ) . 3. ИСПОЛЬЗОВАНИЕ SQL ДЛЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТАБЛИЦ. В ЭТОЙ ГЛАВЕ МЫ ПОКАЖЕМ ВАМ КАК ИЗВЛЕКАТЬ информацию из таблиц. Вы узнаете как опускать или переупорядочивать столбцы и как автоматически устранять избыточность данных из вашего вывода. В заключение, вы узна- ете как устанавливать условие( проверку ) которую вы можете использо- вать чтобы определить какие строки таблицы используются в выводе. Эта последняя особенность, будет далее описана в более поздних главах и является одной из наиболее изящных и мощных в SQL. ========= СОЗДАНИЕ ЗАПРОСА =========== Как мы подчеркивали ранее, SQL символизирует собой Структурированный Язык Запросов. Запросы - вероятно наиболее часто используемый аспект SQL. Фактически, для категории SQL пользователей, маловероятно чтобы кто-либо использовал этот язык для чего-то друго. По этой причине, мы будем начинать наше обсуждение SQL с обсуждения запроса и как он вы- полняется на этом языке. ЧТО ТАКОЕ ЗАПРОС ? Запрос - команда которую вы даете вашей программе базы данных, и ко- торая сообщает ей чтобы она вывела определенную информацию из таблиц в память. Эта информация обычно посылается непосредственно на экран компьютера или терминала которым вы пользуетесь, хотя, в большинстве случаев, ее можно также послать принтеру, сохранить в файле ( как объ- ект в памяти компьютера ), или представить как вводную информацию для другой команды или процесса. ГДЕ ПРИМЕНЯЮТСЯ ЗАПРОСЫ ? Запросы обычно рассматриваются как часть языка DML. Однако, так как запрос не меняет информацию в таблицах, а просто показывает ее пользо- вателю, мы будем рассматривать запросы как самостоятельную категорию среди команд DML которые производят действие, а не просто показывают содержание базы данных. Все запросы в SQL состоят из одиночной команды. Структура этой ко- манды обманчиво проста, потому что вы должны расширять ее так чтобы выполнить высоко сложные оценки и обработки данных. Эта команда назы- вается - SELECT(ВЫБОР). КОМАНДА SELECT В самой простой форме, команда SELECT просто инструктирует базу дан- ных чтобы извлечь информацию из таблицы. Например, вы могли бы вывести таблицу Продавцов напечатав следующее: SELECT snum, sname, sity, comm FROM Salespeople; Вывод для этого запроса показывается в Рисунке 3.1. =============== SQL Execution Log ============ | | | SELECT snum, sname, sity, comm | | FROM Salespeople; | | | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1002 Serres San Jose 0.13 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | 1003 Axelrod New York 0.10 | =============================================== Рисунок 3.1: команда SELECT Другими словами, эта команда просто выводит все данные из таблицы. Большинство программ будут также давать заголовки столбца как выше, а некоторые позволяют детальное форматирование вывода, но это уже вне стандартной спецификации. Имеется объяснение каждой части этой команды: SELECT Ключевое слово которое сообщает базе данных что эта команда - запрос. Все запросы начинаются этим словом, сопровождаемым пробелом. snum, sname Это - список столбцов из таблицы которые выбираются запросом. Любые столбцы не перечисленные здесь не будут включены в вывод команды. Это, конечно, не значит что они будут удалены или их информация будет стерта из таблиц, потому что запрос не воздействует на информацию в таблицах; он только показывает данные. FROM FROM - ключевое слово, подобно SELECT, которое должно Salespeople быть представлено в каждом запросе. Оно сопровожда- ется пробелом и затем именем таблицы используемой в качестве источника информации. В данном случае - это таблица Продавцов(Salespeople). ; Точка с запятой используется во всех интерактивных командах SQL чтобы сообщать базе данных что команда заполнена и готова выполниться. В некоторых системах наклонная черта влево (\) в строке, является индикатором конца команды. Естественно, запрос такого характера не обязательно будет упорядочи- вать вывод любым указаным способом. Та же самая команда выполненная с теми же самыми данными но в разное время не сможет вывести тот же са- мый порядок. Обычно, строки обнаруживаются в том порядке в котором они найдены в таблице, поскольку как мы установили в предыдущей главе - этот порядок произволен. Это не обязательно будет тот порядок в кото- ром данные вводились или сохранялись. Вы можете упорядочивать вывод командами SQL непосредственно: с помощью специального предложения. Позже, мы покажем как это делается. А сейчас, просто усвойте, что в отсутствии явного упорядочения, нет никакого определенного порядка в вашем выводе. Наше использование возврата ( Клавиша ENTER ) является произвольным. Мы должны точно установить как удобнее составить запрос, в несколько строк или в одну строку, следующим образом: SELECT snum, sname, city, comm FROM Salespeople; С тех пор как SQL использует точку с запятой чтобы указывать конец команды, большинство программ SQL обрабатывают возврат (через нажим Возврат или клавишу ENTER ) как пробел. Это - хорошая идея чтобы ис- пользовать возвраты и выравнивание что мы делали это ранее, чтобы сде- лать ваши команды более легкими для чтения и более правильными. ВЫБИРАЙТЕ ВСЕГДА САМЫЙ ПРОСТОЙ СПОСОБ Если вы хотите видеть каждый столбец таблицы, имеется необязательное сокращение которое вы можете использовать. Звездочка (*) может приме- няться для вывода полного списка столбцов следующим образом: SELECT * FROM Salespeople; Это привыведет к тому же результату что и наша предыдущая команда. ОПИСАНИЕ SELECT В общем случае, команда SELECT начинается с ключевого слова SELECT, сопровождаемого пробелом. После этого должен следовать список имен столбцов которые вы хотите видеть, отделяемые запятыми. Если вы хотите видеть все столбцы таблицы, вы можете заменить этот список звездочкой (*). Ключевое слово FROM следующее далее, сопровождается пробелом и именем таблицы запрос к которой делается. В заключение, точка с запя- той ( ; ) должна использоваться чтобы закончить запрос и указать что команда готова к выполнению. ПРОСМОТР ТОЛЬКО ОПРЕДЕЛЕННОГО СТОЛБЦА ТАБЛИЦЫ Команда SELECT способна извлечь строго определенную информацию из таблицы. Сначала, мы можем предоставить возможность увидеть только оп- ределенные столбцы таблицы. Это выполняется легко, простым исключением столбцов которые вы не хотите видеть, из части команды SELECT. Напри- мер, запрос SELECT sname, comm FROM Salespeople; будет производить вывод показанный на Рисунке 3.2. =============== SQL Execution Log ============ | | | SELECT snum, comm | | FROM Salespeople; | | | | ==============================================| | sname comm | | ------------- --------- | | Peel 0.12 | | Serres 0.13 | | Motika 0.11 | | Rifkin 0.15 | | Axelrod 0.10 | =============================================== Рисунок 3.2: Выбор определенных столбцов Могут иметься таблицы которые имеют большое количество столбцов со- держащих данные, не все из которых являются относящимися к поставленой задаче. Следовательно, вы можете найти способ подбора и выбора только полезных для Вас столбцов. ПЕРЕУПОРЯДОЧЕНИЕ СТОЛБЦА Даже если столбцы таблицы, по определению, упорядоченны, это не оз- начает что вы будете восстанавливать их в том же порядке. Конечно, звездочка (*) покажет все столбцы в их естественном порядке, но если вы укажете столбцы отдельно, вы можете получить их в том порядке кото- ром хотите. Давайте рассмотрим таблицу Порядков, содержащую дату при- обретения(odate), номер продавца(snum), номер порядка(onum), и суммы приобретения(amt): SELECT odate, snum, onum, amt FROM Orders; Вывод этого запроса показан на Рисунке 3.3. ============= SQL Execution Log =============== | | | SELECT odate, snum, onum, amt | | FROM Orders; | | | | ------------------------------------------------| | odate snum onum amt | | ----------- ------- ------ --------- | | 10/03/1990 1007 3001 18.69 | | 10/03/1990 1001 3003 767.19 | | 10/03/1990 1004 3002 1900.10 | | 10/03/1990 1002 3005 5160.45 | | 10/03/1990 1007 3006 1098.16 | | 10/04/1990 1003 3009 1713.23 | | 10/04/1990 1002 3007 75.75 | | 10/05/1990 1001 3008 4723.00 | | 10/06/1990 1002 3010 1309.95 | | 10/06/1990 1001 3011 9891.88 | | | =============================================== Рисунок 3.3: Реконструкция столбцов Как вы можете видеть, структура информации в таблицах - это просто основа для активной перестройки структуры в SQL. УДАЛЕНИЕ ИЗБЫТОЧНЫХ ДАННЫХ DISTINCT (ОТЛИЧИЕ) - аргумент который обеспечивает Вас способом уст- ранять двойные значения из вашего предложения SELECT. Предположим что вы хотите знать какие продавцы в настоящее время имеют свои порядки в таблице Порядков. Под порядком (здесь и далее) будет пониматься запись в таблицу Порядков, регистрирующую приобретения сделанные в определен- ный день определенным заказчиком у определенного продавца на опреде- ленную сумму). Вам не нужно знать, сколько порядков имеет каждый; вам нужен только список номеров продавцов (snum). Поэтому Вы можете ввес- ти: SELECT snum FROM Orders; для получения вывода показанного в Рисунке 3.4 =============== SQL Execution Log ============ | | | SELECT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1007 | | 1001 | | 1004 | | 1002 | | 1007 | | 1003 | | 1002 | | 1001 | | 1002 | | 1001 | ============================================= Рисунок 3. 4: SELECT с дублированием номеров продавцов. Для получения списка без дубликатов, для удобочитаемости, вы можете ввести следующее: SELECT DISTINCT snum FROM Orders; Вывод для этого запроса показан в Рисунке 3.5. Другими словами, DISTINCT следит за тем, какие значения были ранее, так что бы они не были продублированы в списке. Это - полезный способ избежать избыточности данных, но важно что бы при этом вы понимали что вы делаете. Если вы не хотите потерять некоторые данные, вы не должны безоглядно использовать DISTINCT, потому что это может скрыть какую-то проблему или какие-то важные данные. Например, вы могли бы предполо- жить что имена всех ваших заказчиков различны. Если кто-то помещает второго Clemens в таблицу Заказчиков, а вы используете SELECT DISTINCT cname, вы не будете даже знать о существовании двойника. Вы можете по- лучить не того Clemens и даже не знать об этом. Так как вы не ожидаете избыточности, в этом случае вы не должны использовать DISTINCT. ПАРАМЕТРЫ DISTINCT DISTINCT может указываться только один раз в данном предложении SE- LECT. Если предложение выбирает многочисленные поля, =============== SQL Execution Log ============ | | | SELECT DISTINCT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1001 | | 1002 | | 1003 | | 1004 | | 1007 | ============================================= Рисунок 3.5: SELECT без дублирования DISTINCT опускает строки где все выбранные поля идентичны. Строки в которых некоторые значения одинаковы а некоторые различны - будут сох- ранены. DISTINCT, фактически, приводит к показу всей строки вывода, не указывая полей ( за исключением когда он используется внутри агрегат- ных функций, как описано в Главе 6 ), так что нет никакого смысла что- бы его повторять. DISTINCT ВМЕСТО ALL Вместо DISTINCT, вы можете указать - ALL. Это будет иметь противопо- ложный эффект, дублирование строк вывода сохранится. Так как это - тот же самый случай когда вы не указываете ни DISTINCT ни ALL, то ALL - по существу скорее пояснительный, а не действующий аргумент. КВАЛИФИЦИРОВАННЫЙ ВЫБОР ПРИ ======= ИСПОЛЬЗОВАНИИ ПРЕДЛОЖЕНИЙ ======== Таблицы имеют тенденцию становиться очень большими, поскольку с те- чением времени, все большее и большее количество строк в нее добавля- ется. Поскольку обычно из них только определенные строки интересуют вас в данное время, SQL дает возможность вам устанавливать критерии чтобы определить какие строки будут выбраны для вывода. WHERE - предложение команды SELECT, которое позволяет вам устанавли- вать предикаты, условие которых может быть или верным или неверным для любой строки таблицы. Команда извлекает только те строки из таблицы для которой такое утверждение верно. Например, предположим вы хотите видеть имена и комиссионные всех продавцов в Лондоне. Вы можете ввести такую команду: SELECT sname, city FROM Salespeople; WHERE city = "LONDON"; Когда предложение WHERE представлено, программа базы данных просмат- ривает всю таблицу по одной строке и исследует каждую строку чтобы оп- ределить верно ли утверждение. Следовательно, для записи Peel, прог- рамма рассмотрит текущее значение столбца city, определит что оно рав- но "London", и включит эту строку в вывод. Запись для Serres не будет включена, и так далее. Вывод для вышеупомянутого запроса показан в Ри- сунке 3.6. =============== SQL Execution Log ============ | | | SELECT sname, city | | FROM Salespeople | | WHERE city = 'London' | | ============================================= | | sname city | | ------- ---------- | | Peel London | | Motika London | ============================================= Рисунок 3.6: SELECT c предложением WHERE Давайте попробуем пример с числовым полем в предложении WHERE. Поле rating таблицы Заказчиков предназначено чтобы разделять заказчиков на группы основанные на некоторых критериях которые могут быть получены в итоге через этот номер. Возможно это - форма оценки кредита или оценки основанной на томе предыдущих приобретений. Такие числовые коды могут быть полезны в реляционных базах данных как способ подведения итогов сложной информации. Мы можем выбрать всех заказчиков с рейтингом 100, следующим образом: SELECT * FROM Customers WHERE rating = 100; Одиночные кавычки не используются здесь потому, что оценка - это числовое поле. Результаты запроса показаны в Рисунке 3. 7. Предложение WHERE совместимо с предыдущим материалом в этой главе. Другими словами, вы можете использовать номера столбцов, устранять дубликаты, или переупорядочивать столбцы в команде SELECT которая ис- пользует WHERE. Однако, вы можете изменять порядок столбцов для имен только в предложении SELECT, но не в предложении WHERE. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating = 100; | | ============================================= | | сnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1001 | ============================================= Рисунок 3.7: SELECT с числовым полем в предикате =============== РЕЗЮМЕ =============== Теперь вы знаете несколько способов заставить таблицу давать вам ту информацию какую вы хотите, а не просто выбрасывать наружу все ее со- держание. Вы можете переупорядочивать столбцы таблицы или устранять любую из них. Вы можете решать, хотите вы видеть дублированные значе- ния или нет. Наиболее важно то, что вы можете устанавливать условие называемое предикатом которое определяет или не определяет указанную строку таб- лицы из тысяч таких же строк, будет ли она выбрана для вывода. Предикаты могут становиться очень сложными, предоставляя вам высокую точность в решении, какие строки вам выбирать с помощью запроса. Имен- но эта способность решать точно, что вы хотите видеть, делает запросы SQL такими мощными. Следующие несколько глав будут посвещены, в боль- шей мере, особенностям которые расширяют мощность предикатов. В Главе 4, вам будут представлены операторы иные чем те которые используются в условиях предиката, а также способы объединения многочисленых условий в единый предикат. ************* РАБОТА С SQL *************** 1. Напишите команду SELECT которая бы вывела номер порядка, сумму, и дату для всех строк из таблицы Порядков. 2. Напишите запрос который вывел бы все строки из таблицы Заказчиков для которых номер продавца = 1001. 3. Напишите запрос который вывел бы таблицу со столбцами в следующем порядке: city, sname, snum, comm. 4. Напишите команду SELECT которая вывела бы оценку(rating), сопро- вождаемую именем каждого заказчика в San Jose. 5. Напишите запрос который вывел бы значения snum всех продавцов в текущем порядке из таблицы Порядков без каких бы то ни было пов- торений. ( См. Приложение A для ответов. ) . 4. ИСПОЛЬЗОВАНИЕ РЕЛЯЦИОННЫХ И БУЛЕВЫХ ОПЕРАТОРОВ ДЛЯ СОЗДАНИЯ БОЛЕЕ ИЗОЩРЕННЫХ ПРЕДИКАТОВ В ГЛАВЕ 3, ВЫ УЗНАЛИ ЧТО ПРЕДИКАТЫ МОГУТ оценивать равенство опера- тора как верного или неверного. Они могут также оценивать другие виды связей кроме равенств. Эта глава будет исследовать другие реляционные операторы используемые в SQL. Вы также узнаете как использовать опера- торы Буля, чтобы изменять и объединять значения предиката. С помощью операторов Буля (или проще говоря логических операторов), одиночный предикат может содержать любое число условий. Это позволяет вам созда- вать очень сложные предикаты. Использование круглых скобок в структуре этих сложных предикатов будет также объясняться. ========= РЕЛЯЦИОННЫЕ ОПЕРАТОРЫ ======= Реляционный оператор - математический символ который указывает на определенный тип сравнения между двумя значениями. Вы уже видели как используются равенства, такие как 2 + 3 = 5 или city = "London". Но также имеются другие реляционные операторы. Предположим что вы хотите видеть всех Продавцов с их комиссионными выше определенного значения. Вы можете использовать тип сравнения "больше чем" - (>). Реляционные операторы которыми распологает SQL : = Равный к > Больше чем < Меньше чем >= Больше чем или равно <= Меньше чем или равно <> Не равно Эти операторы имеют стандартные значения для числовых значений. Для значения символа, их определение зависит от формата преобразования, ASCII или EBCDIC, который вы используете. SQL сравнивает символьные значения в терминах основных номеров как определено в формате преобра- зования. Даже значение символа, такого как "1", который представляет номер, не обязательно равняется номеру который он представляет. Вы мо- жете использовать реляционные операторы чтобы установить алфавитный порядок - например, "a" < "n" где средство a первое в алфавитном по- рядке - но все это ограничивается с помощью параметра преобразования формата. И в ASCII и в EBCDIC, символы - по значению: меньше чем все другие символы которым они предшествуют в алфавитном порядке и имеют один ва- риант( верхний или нижний ). В ASCII, все символы верхнего регистра - меньше чем все символы нижнего регистра, поэтому "Z" < "a", а все но- мера - меньше чем все символы, поэтому "1" < "Z". То же относится и к EBCDIC. Чтобы сохранить обсуждение более простым, мы допустим что вы будете использовать текстовый формат ASCII. Проконсультируйтесь с ва- шей документацией системы если вы неуверены какой формат вы используе- те или как он работает. Значения сравниваемые здесь называются - скалярными значениями. Ска- лярные значения производяться скалярными выражениями; 1 + 2 - это ска- лярное выражение которое производит скалярное значение 3. Скалярное значение может быть символом или числом, хотя очевидно что только но- мера используются с арифметическими операторами, такими как +(плюс) или *(звезда). Предикаты обычно сравнивают значения скалярных величин, используя или реляционные операторы или специальные операторы SQL чтобы увидеть верно ли это сравнение. Некоторые операторы SQL описаны в Главе 5. Предположим что вы хотите увидеть всех заказчиков с оценкой(rating) выше 200. Так как 200 - это скалярное значение, как и значение в столбце оценки, для их сравнения вы можете использовать реляционный оператор. SELECT * FROM Customers WHERE rating > 200; Вывод для этого запроса показывается в Рисунке 4.1. Конечно, если бы мы захотели увидеть еще и заказчиков с оценкой рав- ной 200, мы стали бы использовать предикат rating > = 200 ========= БУЛЕВЫ ОПЕРАТОРЫ =========== Основные Булевы операторы также распознаются в SQL. Выражения Буля - являются или верными или неверными, подобно предикатам. Булевы опера- торы связывают одно или более верных/неверных значений и производят едиственное верное/или/неверное значение. Стандартными операторами Бу- ля распознаваемыми в SQL являются: AND, OR, и NOT. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating > 200; | | ============================================= | | snum cname city rating snum | | ----- -------- -------- ----- ------ | | 2004 Crass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.1: Использование больше чем (>) Существуют другие, более сложные, операторы Буля ( типа " исключен- ный или " ), но они могут быть сформированы из этих трех простых опе- раторов - AND, OR, NOT. Как вы можете понять, Булева верня / неверная логика - основана на цифровой компьютерной операции; и фактически, весь SQL( или любой дру- гой язык ) может быть сведен до уровня Булевой логики. Операторы Буля и как они работают: * AND берет два Буля ( в форме A AND B) как аргументы и оценивает их по отношению к истине, верны ли они оба. * OR берет два Буля ( в форме A OR B) как аргументы и оценивает на правильность, верен ли один из них. * NOT берет одиночный Булев ( в форме NOT A) как аргументы и заменяет его значение с неверного на верное или верное на неверное. Связывая предикаты с операторами Буля, вы можете значительно увели- чить их возможности. Предположим вы хотите видеть всех заказчиков в San Jose которые имеют оценку(рейтинг) выше 200: SELECT * FROM Customers WHERE city = " San Jose' AND rating > 200; Вывод для этого запроса показан на Рисунке 4.2. Имеется только один заказчик который удовлетворяет этому условию. Если вы же используете OR вы получите всех заказчиков которые нахо- дились в San Jose или(OR) которые имели оценку выше 200. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | AND rating > 200; | | ============================================= | | сnum cname city rating snum | | ------ -------- -------- ---- ----- | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.2: SELECT использующий AND SELECT * FROM Customers WHERE city = " San Jose' OR rating > 200; Вывод для этого запроса показывается в Рисунке 4.3. NOT может использоваться для инвертирования значений Буля. Имеется пример запроса с NOT: SELECT * FROM Customers WHERE city = " San Jose' OR NOT rating > 200; Вывод этого запроса показывается в Рисунке 4.4. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR rating > 200; | | ============================================= | | сnum cname city rating snum | | ----- ------- -------- ----- ------ | | 2003 Liu San Jose 200 1002 | | 2004 Grass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.:3: SELECT использующий OR =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR NOT rating > 200; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ----- ----- | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2003 Liu San Jose 200 1002 | | 2006 Clemens London 100 1001 | | 2008 Cirneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 4.4: SELECT использующий NOT Все записи за исключением Grass были выбраны. Grass не был в San Jo- se, и его оценка была больше чем 200, так что он потерпел неудачу при обеих проверках. В каждой из других строк встретился один или другой или оба критериев. Обратите внимание что оператор NOT должен предшест- вовать Булеву оператору, чье значение должно измениться, и не должен помещаться перед реляционным оператором. Например неправильным вводом оценки предиката будет: rating NOT > 200 Он выдаст другую отметку. А как SQL оценит следующее? SELECT * FROM Customers WHERE NOT city = " San Jose' OR rating > 200; NOT применяется здесь только к выражению city = 'SanJose', или к вы- ражению rating > 200 тоже ? Как и написано, правильный ответ будет прежним. SQL может применять NOT с выражением Буля только сразу после него. Вы можете получить другой результат при команде: SELECT * FROM Customers WHERE NOT( city = " San Jose' OR rating > 200 ); Здесь SQL понимает круглые скобки как означающие, что все внутри них будет оцениваться первым и обрабатываться как единое выражение с по- мощью всего что снаружи них ( это является стандартной интерпретацией в математике ). Другими словами, SQL берет каждую строку и определяет, соответствует ли истине равенство city = " San Jose' или равенство ra- ting > 200. Если любое условие верно, выражение Буля внутри круглых скобок верно. Однако, если выражение Буля внутри круглых скобок верно, предикат как единое целое неверен, потому что NOT преобразует верно в неверно и наоборот. Вывод для этого запроса - показывается в Рисунке 4.5. Имеется намеренно сложный пример. Посмотрим сможете ли вы проследить его логику (вывод показан в Рисунке 4.6 ): SELECT * FROM Orders WHERE NOT ((odate = 10/03/1990 AND snum >1002) OR amt > 2000.00); =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE NOT (city = 'San Jose' | | OR rating > 200); | | ============================================= | | cnum cname city rating snum | | ----- -------- ------- ----- ------ | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 4.5: SELECT использующий NOT и вводное предложение =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE NOT ((odate = 10/03/1990 AND snum > 1002) | | OR amt > 2000.00); | | =============================================== | | onum amt odate cnum snum | | ------ -------- ---------- ----- ----- | | 3003 767.19 10/03/1990 2001 1001 | | 3009 1713.23 10/04/1990 2002 1003 | | 3007 75.75 10/04/1990 2004 1002 | | 3010 1309.95 10/06/1990 2004 1002 | ================================================= Рисунок 4.6: Полный (комплексный) запрос Несмотря на то что Булевы опреаторы индивидуально просты, они не так просты когда комбинируются в комплексное выражение. Способ оценки комплекса Булева состоит в том, чтобы оценивать Булевы выражения наиболее глубоко вложенные в круглых скобках, объединять их в единичное Булево значение, и затем объединять его с верхними значе- ниями. Имеется подробное объяснение того как пример выше был вычислен. Наи- более глубоко вложенные выражения Буля в предикате - это odate = 10/03/1990 и snum > 1002 являются объединеными с помощью AND, формируя одно выражение Буля которое будет оценено как верное для всех строк в которых встретились оба эти условия. Это составное Булево выражение (которое мы будем называть Булево номер 1, или B1 для краткости) объ- диняется с выражением (amt) > 2000.00 (B2) с помощью OR, формируя третье выражение (B3), которое является верным для данной строки, если или B1 или B2 - верны для этой строки. B3 полностью содержится в круглых скобках которым предшествует NOT, формируя последнее выражение Буля(B4), которое является условием пре- диката. Таким образом B4, предикат запроса, - будет верен всякий раз, когда B3 неправилен. B3 - неправилен всегда, когда B1 и B2 - оба неверны. B1 неправилен для строки если дата порядка строки не 10/03/1990, или если значение snum не большее чем 1002. B2 неправилен для всех строк, зна- чения суммы приобретений которых не превышает 2000.00. Любая строка со значением выше 2000.00 сделает B2 - верным; в результате B3 будет ве- рен, а B4 нет. Следовательно, все эти строки будут удалены из вывода. Из оставшихся, строки которые на 3 Октября имеют snum > 1002 ( такие как строки для onum 3001 на 3 Октября со snum = 1007 ), делают B1 вер- ным, с помощью верного B3 и неверного предиката запроса. Они будут также удалены из вывода. Вывод показан для строк которые оставлены. ================ РЕЗЮМЕ ================ В этой главе, вы значительно расширили ваше знакомство с предиката- ми. Теперь вы можете находить значения которые связаны с данным значе- нием любым способом - определяемым различными реляционными оператора- ми. Вы можете также использовать операторы Буля AND и OR чтобы много ус- ловий, каждое из которых автономно в предикатах, объединять в единый предикат. Оператор Буля NOT, как вы уже видели, может изменять значе- ние условия или группы условий на противоположное. Булевы и Реляционные операторы могут эффективно управляться с по- мощью круглых скобок, которые определяют порядок, в котором операции будут выполнены. Эти операции применимы к любому уровню сложности и вы поняли как сложные условия могут создаваться из этих простых частей. Теперь, когда мы показали как используются стандартные математичес- кие операторы, мы можем перейти к операторам которые являются исключи- тельными в SQL. Это мы сделаем в Главе 5. ************** РАБОТА С SQL ************** 1. Напишите запрос который может дать вам все порядки со значениями суммы выше чем $1,000. 2. Напишите запрос который может выдать вам поля sname и city для всех продавцов в Лондоне с комиссионными выше .10 . 3. Напишите запрос к таблице Заказчиков чей вывод может включить всех заказчиков с оценкой =< 100, если они не находятся в Риме. 4. Что может быть выведено в результате следующего запроса ? SELECT * FROM Orders WHERE (amt < 1000 OR NOT (odate = 10/03/1990 AND cnum > 2003 )); 5. Что может быть выведено в результате следующего запроса ? SELECT * FROM Orders WHERE NOT ((odate = 10/03/1990 OR snum > 1006) AND amt > = 1500 ); 6. Как можно проще переписать такой запрос ? SELECT snum, sname, city, comm FROM Salespeople WHERE ( comm > + .12 OR comm < .14 ); ( См. Приложение A для ответов. ) . 5. ИСПОЛЬЗОВАНИЕ СПЕЦИАЛЬНЫХ ОПЕРАТОРОВ В УСЛОВИЯХ. В ДОПОЛНЕНИИ К РЕЛЯЦИОННЫМ И БУЛЕВСКИМ операторам обсуждаемым в Гла- ве 4, SQL использует специальные операторы IN, BETWEEN, LIKE, и IS NULL. В этой главе, вы узнаете как их использовать и как реляционные операторы позволяют создавать более сложные и мощные предикаты. Обсуж- дение оператора IS NULL будет включать отсутствие данных и значение NULL, которое указывает на то: что данные отсутствуют. Вы также узнае- те о разновидностях использования оператора NOT применяющегося с этими операторами. ============ ОПЕРАТОР IN =============== Оператор IN определяет набор значений в которое данное значение мо- жет или не может быть включено. В соответствии с нашей учебной базой данных на которой вы обучаетесь по настоящее временя, если вы хотите найти всех продавцов, которые размещены в Barcelona или в London, вы должны использовать следующий запрос ( вывод показывается в Рисунке 5.1 ): SELECT * FROM Salespeople WHERE city = 'Barcelona' OR city = 'London'; Имеется и более простой способ получить ту же информацию: SELECT * FROM Salespeople WHERE city IN ( 'Barcelona', 'London' ); Вывод для этого запроса показывается в Рисунке 5.2. Как вы можете видеть, IN определяет набор значений с помощью имен членов набора заключеных в круглые скобки и отделенных запятыми. Он затем проверяет различные значения указанного поля пытаясь найти сов- падение со значениями из набора. Если это случается, то предикат ве- рен. Когда наборсодержит значения номеров а не символов, одиночные ка- вычки опускаются. Давайте найдем всех заказчиков относящихся к продав- цам имеющих значения snum = 1001, 1007, и 1004. Вывод для следующего запроса показан на Рисунке 5.3: SELECT * FROM Customers WHERE cnum IN ( 1001, 1007, 1004 ); =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE city = 'Barcelona' | | OR city = 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | | =============================================== Рисунок 5.1 Нахождение продавцов в Барселоне и Лондоне =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE city IN ('Barcelona', 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | | =============================================== Рисунок 5.2 SELECT использует IN =============== SQL Execution Log ============ | SELECT * | | FROM Customers | | WHERE snum IN ( 1001, 1007, 1004 ); | | ============================================= | | snum cname city rating snum | | ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 5.3: SELECT использует IN с номерами =========== ОПЕРАТОР BETWEEN ========== Оператор BETWEEN похож на оператор IN. В отличии от определения по номерам из набора, как это делает IN, BETWEEN определяет диапазон, значения которого должны уменьшаться что делает предикат верным. Вы должны ввести ключевое слово BETWEEN с начальным значением, ключевое AND и конечное значение. В отличие от IN, BETWEEN чувствителен к по- рядку, и первое значение в предложении должно быть первым по алфавит- ному или числовому порядку. ( Обратите Внимание что, в отличие от Анг- лийского языка, SQL не говорит что "значение находится (между)BETWEEN значением и значением■, а просто "значение BETWEEN значение значение■. Это применимо и к оператору LIKE). Следующий пример будет извлекать из таблицы Продавцов всех продавцов с комиссионными между .10 и .12 (вы- вод показывается в Рисунке 5.4): SELECT * FROM Salespeople WHERE comm BETWEEN .10 AND .12; Для включенного оператора BETWEEN, значение совпадающее с любым из двух значений границы ( в этом случае, .10 и .12 ) заставляет предикат быть верным. =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople | | WHERE comm BETWEEN .10 AND .12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1003 Axelrod New York 0.10 | =============================================== Рисунок 5.4: SELECT использует BETWEEN SQL не делает непосредственной поддержки невключения BETWEEN. Вы должны или определить ваши граничные значения так, чтобы включающая интерпретация была приемлема, или сделать что-нибудь типа этого: SELECT * FROM Salespeople WHERE ( comm BETWEEN .10, AND .12 ) AND NOT comm IN ( .10, .12 ); Вывод для этого запроса показывается в Рисунке 5.5. По общему признанию, это немного неуклюже, но зато показывает как эти новые операторы могут комбинироваться с операторами Буля чтобы производить более сложные предикаты. В основном, вы используете IN и BETWEEN также как вы использовали реляционные операторы чтобы сравни- вать значения, которые берутся либо из набора ( для IN ) либо из диа- пазона ( для BETWEEN ). Также, подобно реляционным операторам, BETWEEN может работать с сим- вольными полями в терминах эквивалентов ASCII. Это означает что вы мо- жете использовать BETWEEN чтобы выбирать ряд значений из упорядоченных по алфавиту значений. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE ( comm BETWEEN .10 AND .12 | | AND NOT comm IN ( .10 .12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1004 Motika London 0.11 | | | =============================================== Рисунок 5.5: Сделать BETWEEN - невключенным Этот запрос выбирает всех заказчиков чьи имена попали в определенный алфавитный диапазон: SELECT * FROM Customers WHERE cname BETWEEN 'A' AND 'G'; Вывод для этого запроса показывается в Рисунке 5.6. Обратите Внимание что Grass и Giovanni отсутствуют, даже при вклю- ченном BETWEEN. Это происходит из-за того что BETWEEN сравнивает стро- ки неравной длины. Строка 'G' более короткая чем строка Giovanni, поэ- тому BETWEEN выводит 'G' с пробелами. Пробелы предшествуют символам в алфавитном порядке ( в большинстве реализаций ), поэтому Giovanni не выбирается. То же самое происходит с Grass. Важно помнить это когда вы используете BETWEEN для извлечения значений из алфавитных диапазонов. Обычно вы указываете диапазон с помощью символа начала диапазона и символа конца( вместо которого можно просто поставить z ). =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cname BETWEEN 'A' AND 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 | | | ============================================= Рисунок 5. 6: Использование BETWEEN в алфавитных порядках ============ ОПЕРАТОР LIKE ============= LIKE применим только к полям типа CHAR или VARCHAR, с которыми он используется чтобы находить подстроки. Т.е. он ищет поле символа чтобы видеть, совпадает ли с условием часть его строки. В качестве условия он использует групповые символы(wildkards) - специальные символы кото- рые могут соответствовать чему-нибудь. Имеются два типа групповых символов используемых с LIKE: * символ подчеркивания ( _ ) замещает любой одиночный символ. Напри- мер, 'b_t' будет соответствовать словам 'bat' или 'bit', но не будет соответствовать 'brat'. * знак процента (%) замещает последовательность любого числа символов (включая символы нуля). Например '%p%t' будет соответствовать словам 'put', 'posit', или 'opt', но не 'spite'. Давайте найдем всех заказчиков чьи имена начинаются с G ( вывод показывается в Рисунке 5.7 ): SELECT FROM Customers WHERE cname LIKE 'G%'; =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cname LIKE 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2002 Giovanni Rome 200 1003 | | 2004 Grass Berlin 300 1002 | | | ============================================= Рисунок 5. 7: SELECT использует LIKE с % LIKE может быть удобен если вы ищете имя или другое значение, и если вы не помните как они точно пишутся. Предположим что вы неуверены как записано по буквам имя одного из ваших продавцов Peal или Peel. Вы мо- жете просто использовать ту часть которую вы знаете и групповые симво- лы чтобы находить все возможные пары ( вывод этого запроса показывает- ся в Рисунке 5.8 ): SELECT * FROM Salespeople WHERE sname LIKE 'P _ _ l %'; Групповые символы подчеркивания, каждый из которых представляет один символ, добавят только два символа к уже существующим 'P' и 'l' , поэ- тому имя наподобии Prettel не может быть показано. Групповой символ ' % ' - в конце строки необходим в большинстве реализаций если длина по- ля sname больше чем число символов в имени Peel ( потому что некоторые другие значения sname - длиннее чем четыре символа ). В таком случае, значение поля sname , фактически сохраняемое как имя Peel, сопровожда- ется рядом пробелов. Следовательно, символ 'l' не будет рассматривать- ся концом строки. Групповой символ ' % ' - просто соответствует этим пробелам. Это необязательно, если поля sname имеет тип - VARCHAR. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE sname LIKE ' P 1% '; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | | =============================================== Рисунок 5.8: SELECT использует LIKE с подчеркиванием (_) А что же Вы будете делать если вам нужно искать знак процента или знак подчеркивания в строке? В LIKE предикате, вы можете определить любой одиночный символ как символ ESC. Символ ESC используется сразу перед процентом или подчеркиванием в предикате, и означает что процент или подчеркивание будет интерпретироваться как символ а не как группо- вой символ. Например, мы могли бы найти наш sname столбец где присутс- твует подчеркивание, следующим образом: SELECT * FROM Salespeople WHERE sname LIKE '%/_%'ESCAPE'/'; С этими данными не будет никакого вывода, потому что мы не включили никакого подчеркивания в имя нашего продавца. Предложение ESCAPE опре- деляет '/ ' как символ ESC. Символ ESC используемый в LIKE строке, сопровождается знаком процента, знаком подчеркивания, или знаком ESCA- PE, который будет искаться в столбце, а не обрабатываться как группо- вой символ. Символ ESC должен быть одиночным символом и применяться только к одиночному символу сразу после него. В примере выше, символ процента начала и символ процента окончания обрабатываются как групповые символы; только подчеркивание предостав- лено само себе. Как упомянуто выше, символ ESC может также использоваться самостоя- тельно. Другими словами, если вы будете искать столбец с вашим симво- лом ESC, вы просто вводите его дважды. Во-первых это будет означать что символ ESC "берет следующий символ буквально как символ", и во-вторых что символ ESC самостоятелен. Имеется предыдущий пример который пересмотрен чтобы искать местонахождение строки '_/' в sname столбце: SELECT * FROM Salespeople WHERE sname LIKE ' % /_ / / %'ESCAPE'/'; Снова не будет никакого вывода с такими данными. Строка сравнивается с содержанием любой последовательности символов (%), сопровождаемых символом подчеркивания ( /_ ), символом ESC ( // ), и любой последова- тельностью символов в конце строки ( % ). РАБОТА С НУЛЕВЫМИ( NULL ) ЗНАЧЕНИЯМИ Часто, будут иметься записи в таблице которые не имеют никаких зна- чений для каждого поля, например потому что информация не завершена, или потому что это поле просто не заполнялось. SQL учитывает такой ва- риант, позволяя вам вводить значение NULL(ПУСТОЙ) в поле, вместо зна- чения. Когда значение поля равно NULL, это означает, что программа ба- зы данных специально промаркировала это поле как не имеющее никакого значения для этой строки (или записи). Это отличается от просто назна- чения полю, значения нуля или пробела, которые база данных будет обра- батывать также как и любое другое значение. Точно также, как NULL не является техническим значением, оно не имеет и типа данных. Оно может помещаться в любой тип поля. Тем ни менее, NULL в SQL часто упоминает- ся как нуль. Предположим, что вы получили нового заказчика который еще не был назначен продавцу. Чем ждать продавца к которому его нужно назначить, вы можете ввести заказчика в базу данных теперь же, так что он не по- теряется при перестановке. Вы можете ввести строку для заказчика со значением NULL в поле snum и заполнить это поле значением позже, когда продавец будет назначен. ========== NULL ОПЕРАТОР ========= Так как NULL указывает на отсутствие значения, вы не можете знать каков будет результат любого сравнения с использованием NULL. Когда NULL сравнивается с любым значением, даже с другим таким же NULL, ре- зультат будет ни верным ни неверным, он - неизвестен. Неизвестный Бу- лев, вообще ведет себя также как неверная строка, которая произведя неизвестное значение в предикате не будет выбрана запросом - имейте ввиду что в то время как NOT(неверное) - равняется верно, NOT (неиз- вестное) - равняется неизвестно. Следовательно, выражение типа 'city = NULL' или 'city IN (NULL)' бу- дет неизвестно, независимо от значения city. Часто вы должны делать различия между неверно и неизвестно - между строками содержащими значения столбцов которые не соответствуют усло- вию предиката и которые содержат NULL в столбцах. По этой причине, SQL предоставляет специальный оператор IS, который используется с ключевым словом NULL, для размещения значения NULL. Найдем все записи в нашей таблице Заказчиков с NULL значениями в ci- ty столбце: SELECT * FROM Customers WHERE city IS NULL; Здесь не будет никакого вывода, потому что мы не имеем никаких зна- чений NULL в наших типовых таблицах. Значения NULL - очень важны, и мы вернемся к ним позже. ИСПОЛЬЗОВАНИЕ NOT СО СПЕЦИАЛЬНЫМИ ОПЕРАТОРАМИ Специальные операторы которые мы изучали в этой главе могут немед- ленно предшествовать Булеву NOT. Он противоположен реляционным операторам, которые должны иметь опе- ратор NOT - вводимым выражением. Например, если мы хотим устранить NULL из нашего вывода, мы будем использовать NOT чтобы изменить на противоположное значение предиката: SELECT * FROM Customers WHERE city NOT NULL; При отсутствии значений NULL( как в нашем случае ), будет выведена вся таблица Заказчиков. Аналогично можно ввести следующее SELECT * FROM Customers WHERE NOT city IS NULL; - что также приемлемо. Мы можем также использовать NOT с IN: SELECT * FROM Salespeople WHERE city NOT IN ( 'London', 'San Jose' ); А это - другой способ подобного же выражения SELECT * FROM Salespeople WHERE NOT city IN ( 'London', ' San Jose' ); Вывод для этого запроса показывается в Рисунке 5.9. Таким же способом Вы можете использовать NOT BETWEEN и NOT LIKE. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE sity NOT IN ('London', 'San Jose'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1003 Rifkin Barcelona 0.15 | | 1007 Axelrod New York 0.10 | | | =============================================== Рисунок 5. 9: Использование NOT с IN =============== РЕЗЮМЕ ================ Теперь вы можете создавать предикаты в терминах связей специально определенных SQL. Вы можете искать значения в определенном диапазоне (BETWEEN) или в числовом наборе (IN), или вы можете искать символьные значения которые соответствуют тексту внутри параметров (LIKE). Вы также изучили некоторые вещи относительно того как SQL поступает при отсутствии данных - что реальность мировой базы данных - используя NULL вместо конкретных значений. Вы можете извлекать или исключать значения NULL из вашего вывода используя оператор IS NULL. Теперь, когда вы имеете в вашем распоряжении весь набор стандартных математи- ческих и специальных операторов, вы можете переходить к специальным функциям SQL которые работают на всех группах значений, а не просто на одиночном значении, что важно. Это уже тема Главы 6. ************** РАБОТА С SQL ************** 1. Напишите два запроса которые могли бы вывести все порядки на 3 или 4 Октября 1990 2. Напишите запрос который выберет всех заказчиков обслуживаемых про- давцами Peel или Motika. ( Подсказка: из наших типовых таблиц, поле snum связывает вторую таблицу с первой ) 3. Напишите запрос, который может вывести всех заказчиков чьи имена начинаются с буквы попадающей в диапазон от A до G. 4. Напишите запрос который выберет всех пользователей чьи имена начи- наются с буквы C. 5. Напишите запрос который выберет все порядки имеющие нулевые значе- ния или NULL в поле amt(сумма). ( См. Приложение A для ответов. ) . 6. ОБОБЩЕНИЕ ДАННЫХ С ПОМОЩЬЮ АГРЕГАТНЫХ ФУНКЦИЙ В ЭТОЙ ГЛАВЕ, ВЫ ПЕРЕЙДЕТЕ ОТ ПРОСТОГО использования запросов к изв- лечению значений из базы данных и определению, как вы можете использо- вать эти значения чтобы получить из них информацию. Это делается с по- мощью агрегатных или общих функций которые берут группы значений из поля и сводят их до одиночного значения. Вы узнаете как использовать эти функции, как определить группы значений к которым они будут приме- няться, и как определить какие группы выбираются для вывода. Вы будете также видеть при каких условиях вы сможете объединить значения поля с этой полученной информацией в одиночном запросе. ==== ЧТО ТАКОЕ АГРЕГАТНЫЕ ФУНКЦИИ ? ===== Запросы могут производить обобщенное групповое значение полей точно также как и значение одного поля. Это делает с помощью агрегатых функ- ций. Агрегатные функции производят одиночное значение для всей группы таблицы. Имеется список этих функций: * COUNT производит номера строк или не-NULL значения полей которые выбрал запрос. * SUM производит арифметическую сумму всех выбранных значений данного поля. * AVG производит усреднение всех выбранных значений данного поля. * MAX производит наибольшее из всех выбранных значений данного поля. * MIN производит наименьшее из всех выбранных значений данного поля. КАК ИСПОЛЬЗОВАТЬ АГРЕГАТНЫЕ ФУНКЦИИ ? Агрегатные функции используются подобно именам полей в предложении SELECT запроса, но с одним исключением, они берут имена поля как аргу- менты. Только числовые поля могут использоваться с SUM и AVG. С COUNT, MAX, и MIN, могут использоваться и числовые или символьные поля. Когда они используются с символьными полями, MAX и MIN будут транслировать их в эквивалент ASCII, который должен сообщать, что MIN будет означать первое, а MAX последнее значение в алфавитном порядке( выдача алфавит- ного упорядочения обсуждается более подробно в Главе 4 ). Чтобы найти SUM всех наших покупок в таблицы Порядков, мы можем ввести следующий запрос, с его выводом в Рисунке 6.1: SELECT SUM ((amt)) FROM Orders; =============== SQL Execution Log ============ | | | SELECT SUM (amt) | | FROM Orders; | | ==============================================| | | | ------- | | 26658.4 | | | | | =============================================== Рисунок 6.1: Выбор суммы Это конечно, отличается от выбора поля при котором возвращается оди- ночное значение, независимо от того сколько строк находится в таблице. Из-за этого, агрегатные функции и поля не могут выбираться одновремен- но, пока предложение GROUP BY (описанное далее) не будет использовано. Нахождение усредненой суммы - это похожая операция ( вывод следующего запроса показывается в Рисунке 6.2 ): SELECT AVG (amt) FROM Orders; =============== SQL Execution Log ============ | | | SELECT AVG (amt) | | FROM Orders; | | ==============================================| | | | ------- | | 2665.84 | | | | | =============================================== Рисунок 6.2: Выбор среднего СПЕЦИАЛЬНЫЕ АТРИБУТЫ COUNT Функция COUNT несколько отличается от всех. Она считает число значе- ний в данном столбце, или число строк в таблице. Когда она считает значения столбца, она используется с DISTINCT чтобы производить счет чисел различных значений в данном поле. Мы могли бы использовать ее, например, чтобы сосчитать номера продавцов в настоящее время описаных в таблице Порядков ( вывод показывается в Рисунке 6.3 ): SELECT COUNT ( DISTINCT snum ) FROM Orders; ИСПОЛЬЗОВАНИЕ DISTINCT Обратите внимание в вышеупомянутом примере, что DISTINCT, сопровож- даемый именем поля с которым он применяется, помещен в круглые скобки, но не сразу после SELECT, как раньше. Этого использования DISTINCT с COUNT применяемого к индивидуальным столбцам, требует стандарт ANSI, но большое количество программ не предъявляют к ним такого требования. =============== SQL Execution Log ============ | | | SELECT COUNT (DISTINCT snum) | | FROM Orders; | | ==============================================| | | | ------- | | 5 | | | | | =============================================== Рисунок 6.3: Подсчет значений поля Вы можете выбирать многочисленые счета( COUNT ) из полей с помощью DISTINCT в одиночном запросе который, как мы видели в Главе 3, не вы- полнялся когда вы выбирали строки с помощью DISTINCT. DISTINCT может использоваться таким образом, с любой функцией агрегата, но наиболее часто он используется с COUNT. С MAX и MIN, это просто не будет иметь никакого эффекта, а SUM и AVG, вы обычно применяете для включения пов- торяемых значений, так как они законно эффективнее общих и средних значений всех столбцов. ИСПОЛЬЗОВАНИЕ COUNT СО СТРОКАМИ, А НЕ ЗНАЧЕНИЯМИ Чтобы подсчитать общее число строк в таблице, используйте функцию COUNT со звездочкой вместо имени поля, как например в следующем приме- ре, вывод из которого показан на Рисунке 6.4: SELECT COUNT (*) FROM Customers COUNT со звездочкой включает и NULL и дубликаты, по этой причине DISTINCT не может быть использован. DISTINCT может производить более высокие номера чем COUNT особого поля, который удаляет все =============== SQL Execution Log ============ | | | SELECT COUNT (*) | | FROM Customers; | | ==============================================| | | | ------- | | 7 | | | | | =============================================== Рисунок 6. 4: Подсчет строк вместо значений строки, имеющие избыточные или NULL данные в этом поле. DISTINCT не применим c COUNT (*), потому, что он не имеет никакого действия в хорошо разработаной и поддерживаемой базе данных. В такой базе данных, не должно быть ни таких строк, которые бы являлись пол- ностью пустыми, ни дубликатов ( первые не содержат никаких данных, а последние полностью избыточны ). Если, с другой стороны, все таки име- ются полностью пустые или избыточные строки, вы вероятно не захотите чтобы COUNT скрыл от вас эту информацию. ВКЛЮЧЕНИЕ ДУБЛИКАТОВ В АГРЕГАТНЫЕ ФУНКЦИИ Агрегатные функции могут также ( в большинстве реализаций ) исполь- зовать аргумент ALL, который помещается перед именем поля, подобно DISTINCT, но означает противоположное: - включать дубликаты. ANSI тех- нически не позволяет этого для COUNT, но многие реализации ослабляют это ограничение. Различия между ALL и * когда они используются с COUNT - * ALL использует имя_поля как аргумент. * ALL не может подсчитать значения NULL. Пока * является единственым аргументом который включает NULL значе- ния, и он используется только с COUNT; функции отличные от COUNT игно- рируют значения NULL в любом случае. Следующая команда подсчитает(CO- UNT) число не-NULL значений в поле rating в таблице Заказчиков ( вклю- чая повторения ): SELECT COUNT ( ALL rating ) FROM Customers; АГРЕГАТЫ ПОСТРОЕННЫЕ НА СКАЛЯРНОМ ВЫРАЖЕНИИ До этого, вы использовали агрегатные функции с одиночными полями как аргументами. Вы можете также использовать агрегатные функции с аргу- ментами которые состоят из скалярных выражений включающих одно или бо- лее полей. ( Если вы это делаете, DISTINCT не разрешается. ) Предполо- жим, что таблица Порядков имеет еще один столбец который хранит преды- дущий неуплаченый баланс (поле blnc) для каждого заказчика. Вы должны найти этот текущий баланс, добавлением суммы приобретений к предыдуще- му балансу. Вы можете найти наибольший неуплаченый баланс следующим образом: SELECT MAX ( blnc + (amt) ) FROM Orders; Для каждой строки таблицы, этот запрос будет складывать blnc и amt для этого заказчика и выбирать самое большое значение которое он най- дет. Конечно, пока заказчики могут иметь многочисленые порядки, их не- уплаченый баланс оценивается отдельно для каждого порядка. Возможно, порядок с более поздней датой будет иметь самый большой неуплаченый баланс. Иначе, старый баланс должен быть выбран как в запросе выше. Фактически, имеются большое количество ситуаций в SQL где вы можете использовать скалярные выражения с полями или вместо полей, как вы увидете это в Главе 7. ПРЕДЛОЖЕНИЕ GROUP BY Предложение GROUP BY позволяет вам определять подмножество значений в особом поле в терминах другого поля, и применять функцию агрегата к подмножеству. Это дает вам возможность объединять поля и агрегатные функции в едином предложении SELECT. Например, предположим что вы хо- тите найти наибольшую сумму приобретений полученную каждым продавцом. Вы можете сделать раздельный запрос для каждого из них, выбрав MAX (amt) из таблицы Порядков для каждого значения поля snum. GROUP BY, однако, позволит Вам поместить их все в одну команду: SELECT snum, MAX (amt) FROM Orders GROUP BY snum; Вывод для этого запроса показывается в Рисунке 6.5. =============== SQL Execution Log ============== | | | SELECT snum, MAX (amt) | | FROM Orders | | GROUP BY snum; | | =============================================== | | snum | | ------ -------- | | 1001 767.19 | | 1002 1713.23 | | 1003 75.75 | | 1014 1309.95 | | 1007 1098.16 | | | ================================================ Рисунок 6.5: Нахождение максимальной суммы продажи у каждого продавца GROUP BY применяет агрегатные функции независимо от серий групп ко- торые определяются с помощью значения поля в целом. В этом случае, каждая группа состоит из всех строк с тем же самым значением поля snum, и MAX функция применяется отдельно для каждой такой группы. Это значение поля, к которому применяется GROUP BY, имеет, по определению, только одно значение на группу вывода, также как это делает агрегатная функция. Результатом является совместимость которая позволяет агрега- там и полям объединяться таким образом. Вы можете также использовать GROUP BY с многочислеными полями. Со- вершенствуя вышеупомянутый пример далее, предположим что вы хотите увидеть наибольшую сумму приобретений получаемую каждым продавцом каж- дый день. Чтобы сделать это, вы должны сгруппировать таблицу Порядков по датам продавцов, и применить функцию MAX к каждой такой группе, по- добно этому: SELECT snum, odate, MAX ((amt)) FROM Orders GROUP BY snum, odate; Вывод для этого запроса показывается в Рисунке 6.6. =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate; | | =============================================== | | snum odate | | ------ ---------- -------- | | 1001 10/03/1990 767.19 | | 1001 10/05/1990 4723.00 | | 1001 10/06/1990 9891.88 | | 1002 10/03/1990 5160.45 | | 1002 10/04/1990 75.75 | | 1002 10/06/1990 1309.95 | | 1003 10/04/1990 1713.23 | | 1014 10/03/1990 1900.10 | | 1007 10/03/1990 1098.16 | | | ================================================ Рисунок 6.6: Нахождение наибольшей суммы приобретений на каждый день Конечно же, пустые группы, в дни когда текущий продавец не имел по- рядков, не будут показаны в выводе. ПРЕДЛОЖЕНИЕ HAVING Предположим, что в предыдущем примере, вы хотели бы увидеть только максимальную сумму приобретений значение которой выше $3000.00. Вы не сможете использовать агрегатную функцию в предложении WHERE ( если вы не используете подзапрос, описанный позже ), потому что предикаты оце- ниваются в терминах одиночной строки, а агрегатные функции оцениваются в терминах групп строк. Это означает что вы не сможете сделать что-ни- будь подобно следующему: SELECT snum, odate, MAX (amt) FROM Oreders WHERE MAX ((amt)) > 3000.00 GROUP BY snum, odate; Это будет отклонением от строгой интерпретации ANSI. Чтобы увидеть максимальную стоимость приобретений свыше $3000.00, вы можете исполь- зовать предложение HAVING. Предложение HAVING определяет критерии используемые чтобы удалять определенные группы из вывода, точно также как предложение WHERE дела- ет это для индивидуальных строк. Правильной командой будет следующяя: SELECT snum, odate, MAX ((amt)) FROM Orders GROUP BY snum, odate HAVING MAX ((amt)) > 3000.00; Вывод для этого запроса показывается в Рисунке 6. 7. =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate | | HAVING MAX (amt) > 3000.00; | | =============================================== | | snum odate | | ------ ---------- -------- | | 1001 10/05/1990 4723.00 | | 1001 10/06/1990 9891.88 | | 1002 10/03/1990 5160.45 | | | ================================================ Рисунок 6. 7: Удаление групп агрегатных значений Аргументы в предложении HAVING следуют тем же самым правилам что и в предложении SELECT, состоящей из команд использующих GROUP BY. Они должны иметь одно значение на группу вывода. Следующая команда будет запрещена: SELECT snum, MAX (amt) FROM Orders GROUP BY snum HAVING odate = 10/03/1988; Поле оdate не может быть вызвано предложением HAVING, потому что оно может иметь ( и действительно имеет ) больше чем одно значение на группу вывода. Чтобы избегать такой ситуации, предложение HAVING долж- но ссылаться только на агрегаты и поля выбранные GROUP BY. Имеется правильный способ сделать вышеупомянутый запрос( вывод показывается в Рисунке 6.8 ): SELECT snum, MAX (amt) FROM Orders WHEREodate = 10/03/1990 GROUP BY snum; =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate; | | =============================================== | | snum | | ------ -------- | | 1001 767.19 | | 1002 5160.45 | | 1014 1900.10 | | 1007 1098.16 | | | ================================================ Рисунок 6.8: Максимальное значение суммы приобретений у каждого продавца на 3 Октября Поскольку поля odate нет, не может быть и выбраных полей, значение этих данных меньше чем в некоторых других примерах. Вывод должен веро- ятно включать что-нибудь такое что говорит - " это - самые большие по- рядки на 3 Октября." В Главе 7, мы покажем как вставлять текст в ваш вывод. Как и говорилось ранее, HAVING может использовать только аргументы которые имеют одно значение на группу вывода. Практически, ссылки на агрегатные функции - наиболее общие, но и поля выбранные с помощью GROUP BY также допустимы. Например, мы хотим увидеть наибольшие поряд- ки для Serres и Rifkin: SELECT snum, MAX (amt) FROM Orders GROUP BY snum HAVING snum B (1002,1007); Вывод для этого запроса показывается в Рисунке 6.9. =============== SQL Execution Log ============== | | | SELECT snum, MAX (amt) | | FROM Orders | | GROUP BY snum | | HAVING snum IN ( 1002, 1007 ); | | =============================================== | | snum | | ------ -------- | | 1002 5160.45 | | 1007 1098.16 | | | ================================================ Рисунок 6. 9: Использование HAVING с GROUP BY полями НЕ ДЕЛАЙТЕ ВЛОЖЕННЫХ АГРЕГАТОВ В строгой интерпретации ANSI SQL, вы не можете использовать агрегат агрегата. Предположим что вы хотите выяснять, в какой день имелась на- ибольшая сумма приобретений. Если вы попробуете сделать это, то ваша SELECT odate, MAX ( SUM (amt) ) FROM Orders GROUP BY odate; команда будет вероятно отклонена. ( Некоторые реализации не предписы- вают этого ограничения, которое является выгодным, потому что вложен- ные агрегаты могут быть очень полезны, даже если они и несколько проб- лематичны.) В вышеупомянутой команде, например, SUM должен применяться к каждой группе поля odate, а MAX ко всем группам, производящим оди- ночное значение для всех групп. Однако предложение GROUP BY подразуме- вает что должна иметься одна строка вывода для каждой группы поля oda- te. =============== РЕЗЮМЕ ================ Теперь вы используете запросы несколько по-другому. Способность по- лучать, а не просто размещать значения, очень мощна. Это означает что вы не обязательно должны следить за определенной информацией если вы можете сформулировать запрос так чтобы ее получить. Запрос будет да- вать вам по-минутные результаты, в то время как таблица общего или среднего значений будет хороша только некоторое время после ее модифи- кации. Это не должно наводить на мысль, что агрегатные функции могут полностью вытеснить потребность в отслеживании информации такой напри- мер как эта. Вы можете применять эти агрегаты для групп значений определенных предложением GROUP BY. Эти группы имеют значение поля в целом, и могут постоянно находиться внутри других групп которые имеют значение поля в целом. В то же время, предикаты еще используются чтобы определять ка- кие строки агрегатной функции применяются. Объединенные вместе, эти особенности делают возможным, производить агрегаты основанные на сильно определенных подмножествах значений в поле. Затем вы можете определять другое условие для исключения опреде- ленных результатов групп с предложением HAVING. Теперь , когда вы стали знатоком большого количества того как запрос производит значения, мы покажем вам, в Главе 7, некоторые вещи которые вы можете делать со значениями которые он производит. ************** РАБОТА С SQL ************** 1. Напишите запрос который сосчитал бы все суммы приобретений на 3 Ок- тября. 2. Напишите запрос который сосчитал бы число различных не-NULL значе- ний поля city в таблице Заказчиков. 3. Напишите запрос который выбрал бы нименьшую сумму для каждого за- казчика. 4. Напишите запрос который бы выбирал заказчиков в алфавитном порядке, чьи имена начинаются с буквы G. 5. Напишите запрос который выбрал бы высшую оценку в каждом городе. 6. Напишите запрос который сосчитал бы число заказчиков регистрирующих каждый день свои порядки. (Если продавец имел более одного порядка в данный день, он должен учитываться только один раз.) ( См. Приложение A для ответов. ) . 7. ФОРМИРОВАНИЕ ВЫВОДОВ ЗАПРОСОВ ЭТА ГЛАВА РАСШИРИТ ВАШИ ВОЗМОЖНОСТИ в работе с выводом который про- изводит запрос. Вы узнаете как вставлять текст и константы между выб- ранных полей, как использовать выбранные поля в математических выраже- ниях, чьи результаты затем становятся выводом, и как сделать чтобы ва- ши значения выводились в определенном порядке. Эта последняя особен- ность включена, чтобы упорядочивать ваш вывод по любым столбцам, любым полученным значениям этого столбца, или по обеим. =========== СТРОКИ И ВЫРАЖЕНИЯ ============ Большинство основанных на SQL баз данных предоставляют специальные средства позволяющие Вам совершенствовать вывод ваших запросов. Конеч- но, они претерпевают значительные изменения от программы к программе, и их обсуждение здесь не входит в наши задачи, однако, имеются пять особенностей созданых в стандарте SQL которые позволяют вам делать больше чем просто вывод значений полей и агрегатных данных. СКАЛЯРНОЕ ВЫРАЖЕНИЕ С ПОМОЩЬЮ ВЫБРАННЫХ ПОЛЕЙ Предположим что вы хотите выполнять простые числовые вычисления дан- ных чтобы затем помещать их в форму больше соответствующую вашим пот- ребностям. SQL позволяет вам помещать скалярные выражения и константы среди выбраных полей. Эти выражения могут дополнять или замещать поля в предложениях SELECT, и могут включать в себя одно или более выбран- ных полей. Например, вы можете пожелать, представить комиссионные ва- шего продавца в процентном отношении а не как десятичные числа. Просто достаточно: SELECT snum, sname, city, comm * 100 FROM Salespeople; Вывод из этого запроса показывается в Рисунке 7.1. СТОЛБЦЫ ВЫВОДА Последний столбец предшествующего примера непомечен( т.е. без наиме- нования), потому что это - столбец вывода. Столбцы вывода - это столб- цы данных созданные запросом способом, иным чем просто извлечение их из таблицы. Вы создаете их всякий раз, когда вы используете агрегатные =============== SQL Execution Log ============ | | | SELECT snum, sname, city, comm * 100 | | FROM Salespeople; | | ==============================================| | snum sname city | | ------ --------- ----------- --------- | | 1001 Peel London 12.000000 | | 1002 Serres San Jose 13.000000 | | 1004 Motika London 11.000000 | | 1007 Rifkin Barcelona 15.000000 | | 1003 Axelrod New York 10.000000 | | | =============================================== Рисунок 7.1: Помещение выражения в вашем запросе функции, константы, или выражения в предложении SELECT запроса. Так как имя столбца - один из атрибутов таблицы, столбцы которые приходят не из таблиц не имеют никаких имен. Другими словами непомеченные, столбцы вывода могут обрабатываться также как и столбцы извлеченные из таблиц, почти во всех ситуациях. ПОМЕЩЕНИЕ ТЕКСТА В ВАШЕМ ВЫВОДЕ ЗАПРОСА Символ 'A', когда ничего не значит сам по себе, - является констан- той, такой например как число 1. Вы можете вставлять константы в пред- ложение SELECT запроса, включая и текст. Однако символьные константы, в отличие от числовых констант, не могут использоваться в выражениях. Вы можете иметь выражение 1 + 2 в вашем предложении SELECT, но вы не можете использовать выражение типа 'A' + 'B'; это приемлемо только ес- ли мы имеем в виду что 'A' и 'B' это просто буквы, а не переменные и не символы. Тем ни менее, возможность вставлять текст в вывод ваших запросов очень удобная штука. Вы можете усовершенствовать предыдущий пример представив комиссион- ные как проценты со знаком процента (%). Это даст вам возможность по- мещать в вывод такие единицы как символы и комментарии, как например в следующем примере ( вывод показывается в Рисунке 7.2 ) SELECT snum, sname, city, ' % ', comm * 100 FROM Salespeople; =============== SQL Execution Log ============ | | | SELECT snum, sname, city, '%' comm * 100 | | FROM Salespeople; | | ==============================================| | snum sname city | | ------ -------- ----------- ---- --------- | | 1001 Peel London % 12.000000 | | 1002 Serres San Jose % 13.000000 | | 1004 Motika London % 11.000000 | | 1007 Rifkin Barcelona % 15.000000 | | 1003 Axelrod New York % 10.000000 | | | =============================================== Рисунок 7.2: Вставка символов в ваш вывод Обратите внимание что пробел перед процентом вставляется как часть строки. Эта же самая особенность может использоваться чтобы маркиро- вать вывод вместе с вставляемыми комментариями. Вы должны помнить, что этот же самый комментарий будет напечатан в каждой строке вывода, а не просто один раз для всей таблицы. Предположим что вы генерируете вывод для отчета который бы указывал число порядков получаемых в течение каждого дня. Вы можете промаркировать ваш вывод ( см. Рисунок 7.3 ) сформировав запрос следующим образом: SELECT ' For ', odate, ', there are ', COUNT ( DISTINCT onum ), 'orders.' FROM Orders GROUP BY odate; Грамматической некорректности вывода, на 5 Октября, невозможно избе- жать не создав запроса, еще более сложного чем этот. ( Вы будете долж- ны использовать два запроса с UNION, который =============== SQL Execution Log ============== | | | SELECT 'For', odate, ', ' there are ' , | | COUNT (DISTINCT onum), ' orders ' | | FROM Orders | | GROUP BY odate; | | =============================================== | | odate | | ------ ---------- --------- ------ ------- | | For 10/03/1990 , there are 5 orders. | | For 10/04/1990 , there are 2 orders. | | For 10/05/1990 , there are 1 orders. | | For 10/06/1990 , there are 2 orders. | | | ================================================ Рисунок 7.3: Комбинация текста, значений поля, и агрегатов мы будем описывать в Главе 14. ) Как вы можете видеть, одиночный неиз- менный комментарий для каждой строки таблицы может быть очень полезен, но имеет ограничения. Иногда изящнее и полезнее, произвести один ком- ментарий для всего вывода в целом, или производить свой собственный комментарии для каждой строки. Различные программы использующие SQL часто обеспечивают специальные средства типа генератора отчетов( например Report Writer), которые разработаны чтобы форматировать и совершенствовать вывод. Вложенный SQL может также эксплуатировать возможности того языка в который он вложен. SQL сам по себе интересен прежде всего при операциях с данны- ми. Вывод, по существу, это информация, и программа использующая SQL может часто использовать эту информацию и помещать ее в более привле- кательную форму. Это, однако, вне сферы самой SQL. ======= УПОРЯДОЧЕНИЕ ВЫВОДА ПОЛЕЙ ======== Как мы подчеркивали, таблицы - это неупорядоченные наборы данных, и данные которе выходят из их, не обязательно появляются в какой-то оп- ределенной последовательности. SQL использует команду ORDER BY чтобы позволять вам упорядочивать ваш вывод. Эта команда упорядочивает вывод запроса согласно значениям в том или ином количестве выбранных столб- цов. Многочисленые столбцы упорядочиваются один внутри другого, также как с GROUP BY, и вы можете определять возрастание ( ASC ) или убыва- ние ( DESC ) для каждого столбца. По умолчанию установлено - возроста- ние. Давайте рассмотрим нашу таблицу порядка приводимую в порядок с помощью номера заказчика ( обратите внимание на значения в cnum столб- це): SELECT * FROM Orders ORDER BY cnum DESC; Вывод показывается в Рисунке 7.4. =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | ORDER BY cnum DESC; | | =============================================== | | onum amt odate cnum snum | | ------ -------- ---------- ----- ----- | | 3001 18.69 10/03/1990 2008 1007 | | 3006 1098.16 10/03/1990 2008 1007 | | 3002 1900.10 10/03/1990 2007 1004 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | | 3007 75.75 10/04/1990 2004 1002 | | 3010 1309.95 10/06/1990 2004 1002 | | 3005 5160.45 10/03/1990 2003 1002 | | 3009 1713.23 10/04/1990 2002 1003 | | 3003 767.19 10/03/1990 2001 1001 | | | ================================================ Рисунок 7. 4: Упорядочение вывода с помощью убывания поля УПОРЯДОЧЕНИЕ С ПОМОЩЬЮ МНОГОЧИСЛЕНЫХ СТОЛБЦОВ Мы можем также упорядочивать таблицу с помощью другого столбца, нап- ример с помощью поля amt, внутри упорядочения поля cnum. ( вывод пока- зан в Рисунке 7.5 ): SELECT * FROM Orders ORDER BY cnum DESC, amt DESC; =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | ORDER BY cnum DESC, amt DESC; | | =============================================== | | onum amt odate cnum snum | | ------ -------- ---------- ----- ----- | | 3006 1098.16 10/03/1990 2008 1007 | | 3001 18.69 10/03/1990 2008 1007 | | 3002 1900.10 10/03/1990 2007 1004 | | 3011 9891.88 10/06/1990 2006 1001 | | 3008 4723.00 10/05/1990 2006 1001 | | 3010 1309.95 10/06/1990 2004 1002 | | 3007 75.75 10/04/1990 2004 1002 | | 3005 5160.45 10/03/1990 2003 1002 | | 3009 1713.23 10/04/1990 2002 1003 | | 3003 767.19 10/03/1990 2001 1001 | | | ================================================ Рисунок 7.5: Упорядочение вывода с помощью многочисленых полей Вы можете использовать ORDER BY таким же способом сразу с любым чис- лом столбцов. Обратите внимание что, во всех случаях, столбцы которые упорядочиваются должны быть указаны в выборе SELECT. Это - требование ANSI которые в большинстве, но не всегда, предписано системе. Следую- щая команда, например, будет запрещена: SELECT cname, city FROM Customers GROUP BY cnum; Так как поле cnum не было выбранным полем, GROUP BY не cможет найти его чтобы использовать для упорядочения вывода. Даже если ваша система позволяет это, смысл упорядочения не будет понятен из вывода, так что включение (в предложение SELECT) всех столбцов, используемых в предло- жении ORDER BY, в принципе желательно. УПОРЯДОЧЕНИЕ АГРЕГАТНЫХ ГРУПП ORDER BY может кроме того, использоваться с GROUP BY для упорядоче- ния групп. Если это так, то ORDER BY всегда приходит последним. Вот - пример из последней главы с добавлением предложения ORDER BY. Перед сгруппированием вывода, порядок групп был произвольным; и мы, теперь, заставим группы размещаться в последовательности: SELECT snum, odate, MAX (amt) FROM Orders GROUP BY snum, odate GROUP BY snum; Вывод показывается в Рисунке 7.6. =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate | | ORDER BY snum ; | | =============================================== | | snum odate amt | | ----- ---------- -------- | | 1001 10/06/1990 767.19 | | 1001 10/05/1990 4723.00 | | 1001 10/05/1990 9891.88 | | 1002 10/06/1990 5160.45 | | 1002 10/04/1990 75.75 | | 1002 10/03/1990 1309.95 | | 1003 10/04/1990 1713.23 | | 1004 10/03/1990 1900.10 | | 1007 10/03/1990 1098.16 | | | ================================================ Рисунок 7. 6: Упорядочение с помощью группы Так как мы не указывали на возрастание или убывание порядка, возрас- тание используется по умолчанию. УПОРЯДОЧЕНИЕ ВЫВОДА ПО НОМЕРУ СТОЛБЦА Вместо имен столбца, вы можете использовать их порядковые номера для указания поля используемого в упорядочении вывода. Эти номера могут ссылаться не на порядок столбцов в таблице, а на их порядок в выводе. Другими словами, поле упомянутое в предложении SELECT первым, для OR- DER BY - это поле 1, независимо от того каким по порядку оно стоит в таблице. Например, вы можете использовать следующую команду чтобы уви- деть определенные поля таблицы Продавцов, упорядоченными в порядке убывания к наименьшему значению комиссионных ( вывод показывается Ри- сунке 7.7 ): SELECT sname, comm FROM Salespeople GROUP BY 2 DESC; =============== SQL Execution Log ============ | | | (SELECT sname, comm | | FROM Salespeople | | ORDER BY 2 DESC; | | ============================================= | | sname comm | | -------- -------- | | Peel 0.17 | | Serres 0.13 | | Rifkin 0.15 | | | =============================================== Pисунок 7. 7: Упорядочение использующее номера Одна из основных целей этой возможности ORDER BY - дать вам возмож- ность использовать GROUP BY со столбцами вывода также как и со столб- цами таблицы. Столбцы производимые агрегатной функцией, константы, или выражения в предложении SELECT запроса, абсолютнопригодны для исполь- зования с GROUP BY, если они ссылаются к ним с помощью номера. Напри- мер, давайте сосчитаем порядки каждого из наших продавцов, и выведем результаты в убывающем порядке, как показано в Рисунке 7.8: SELECT snum, COUNT ( DISTINCT onum ) FROM Orders GROUP BY snum ORDER BY 2 DESC; =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum | | ORDER BY 2 DESC; | | =============================================== | | snum | | ----- ---------- | | 1001 3 | | 1002 3 | | 1007 2 | | 1003 1 | | 1004 1 | | | ================================================ Рисунок 7.8: Упорядочение с помощью столбца вывода В этом случае, вы должны использовать номер столбца, так как столбец вывода не имеет имени; и вы не должны использовать саму агрегатную функцию. Строго говоря по правилам ANSI SQL, следующее не будет рабо- тать, хотя некоторые системы и пренебрегают этим требованием: SELECT snum, COUNT ( DISTINCT onum ) FROM Orders GROUP BY snum GROUP BY COUNTОМ ( DISTINCT onum ) DESC; Это будет отклонено большинством систем! УПОРЯДОЧЕНИЕ С ПОМОЩЬЮ ОПРЕТОРА NULL Если имеются пустые значения (NULL) в поле которое вы используете для упорядочивания вашего вывода, они могутут или следовать или пред- шествовать каждому другому значению в поле. Это - возможность которую ANSI оставил для индивидуальных программ. Данная программа использует ту или иную форму. ================ РЕЗЮМЕ ================= В этой главе, вы изучили как заставить ваши запросы делать больше, чем просто выводить значения полей или объединять функциональные дан- ные таблиц. Вы можете использовать поля в выражениях: например, вы мо- жете умножить числовое поле на 10 или даже умножить его на другое чис- ловое поле. Кроме того, вы можете помещать константы, включая и симво- лы, в ваш вывод, что позволяет вам помещать текст непосредственно в запрос и получать его в выводе вместе с данными таблицы. Это дает вам возможность помечать или объяснять ваш вывод различными способами. Вы также изучили как упорядочивать ваш вывод. Даже если таблица сама по себе остается неупорядоченной, предложение ORDER BY дает вам воз- можность управлять порядком вывода строк данного запроса. Вывод запро- са может быть в порядке возрастания или убывания, и столбцы могут быть вложенными один внутрь другого. Понятие выводимых столбцов объяснялось в этой главе. Вы теперь знае- те что выводимые столбцы можно использовать чтобы упорядочивать вывод запроса, но эти столбцы - без имени, и следовательно должны опреде- ляться их порядковым номером в предложении ORDER BY. Теперь, когда вы увидели что можно делать с выводом запроса основан- ного на одиночной таблице, настало время чтобы перейти к возможностям улучшенного запроса и узнать как сделать запрос любого числа таблиц в одной команде, определив связи между ними как вы это обычно делали. Это будет темой Главы 8. ************** РАБОТА С SQL ************** 1. Предположим что каждый продавец имеет 12% комиссионных. Напишите запрос к таблице Порядков который мог бы вывести номер порядка, но- мер продавца, и сумму комиссионных продавца для этого порядка. 2. Напишите запрос к таблице Заказчиков который мог бы найти высшую оценку в каждом городе. Вывод должен быть в такой форме: For the city (city), the highest rating is: (rating). 3. Напишите запрос который выводил бы список заказчиков в нисходящем порядке. Вывод поля оценки( rating ) должден сопровождаться именем закзчика и его номером. 4. Напишите запрос который бы выводил общие порядки на каждый день и помещал результаты в нисходящем порядке. ( См. Приложение A для ответов. ) . 8. ЗАПРАШИВАНИЕ МНОГОЧИСЛЕНЫХ ТАБЛИЦ ТАКЖЕ КАК ОДНОЙ. ДО ЭТОГО, КАЖДЫЙ ЗАПРОС КОТОРЫЙ МЫ ИССЛЕДОВАЛИ основывался на оди- ночной таблице. В этой главе, вы узнаете как сделать запрос любого числа таблиц с помощью одной команды. Это - чрезвычайно мощное средс- тво потому что оно не только объединяет вывод из многочисленых таблиц, но и определяет связи между ними. Вы обучитесь различным формам кото- рые могут использовать эти связи, а также устанавливать и использовать их чтобы удовлетворять возможным специальным требованиям. ============= ОБЪЕДИНЕНИЕ ТАБЛИЦ ============ Одна из наиболее важных особенностей запросов SQL - это их способ- ность определять связи между многочислеными таблицами и выводить ин- формацию из них в терминах этих связей, всю внутри одной команды. Этот вид операции называется - объединением, которое является одним из ви- дов операций в реляционных базах данных. Как установлено в Главе 1, главное в реляционном подходе это связи которые можно создавать между позициями данных в таблицах. Используя обьединения, мы непосредственно связываем информацию с любым номером таблицы, и таким образом способны создавать связи между сравнимыми фрагментами данных. При обьединении, таблицы представленые списком в предложении FROM запроса, отделяются запятыми. Предикат запроса может ссылаться к любому столбцу любой свя- занной таблицы и, следовательно, может использоваться для связи между ими. Обычно, предикат сравнивает значения в столбцах различных таблиц чтобы определить, удовлетворяет ли WHERE установленному условию. ИМЕНА ТАБЛИЦ И СТОЛБЦОВ Полное имя столбца таблицы фактически состоит из имени таблицы, соп- ровождаемого точкой и затем именем столбца. Имеются несколько примеров имен : Salespeople.snum Salespeople.city Orders.odate До этого, вы могли опускать имена таблиц потому что вы запрашивали только одну таблицу одновременно, а SQL достаточно интелектуален чтобы присвоить соответствующий префикс, имени таблицы. Даже когда вы делае- те запрос многочисленых таблиц, вы еще можете опускать имена таблиц, если все ее столбцы имеют различные имена. Но это не всегда так быва- ет. Например, мы имеем две типовые таблицы со столбцами называемыми city. Если мы должны связать эти столбцы( кратковременно ), мы будем долж- ны указать их с именами Salespeople.city или Customers.city, чтобы SQL мог их различать. СОЗДАНИЕ ОБЬЕДИНЕНИЯ Предположим что вы хотите поставить в соответствии вашему продавцу ваших заказчиков в городе в котором они живут, поэтому вы увидите все комбинации продавцов и заказчиков для этого города. Вы будете должны брать каждого продавца и искать в таблице Заказчиков всех заказчиков того же самого города. Вы могли бы сделать это, введя следующую коман- ду ( вывод показывается в Рисунке 8.1 ): SELECT Customers.cname, Salespeople.sname, Salespeople.city FROM Salespeople, Customers WHERE Salespeople.city = Customers.city; =============== SQL Execution Log ============ | SELECT Customers.cname, Salespeople.sname, | | Salespeople.city | | FROM Salespeople, Customers | | WHERE Salespeople.city = Customers.city | | ============================================= | | cname cname city | | ------- -------- ---- | | Hoffman Peel London | | Hoffman Peel London | | Liu Serres San Jose | | Cisneros Serres San Jose | | Hoffman Motika London | | Clemens Motika London | ============================================= Рисунок 8.1: Объединение двух таблиц Так как это поле city имеется и в таблице Продавцов и таблице Заказ- чиков, имена таблиц должны использоваться как префиксы. Хотя это необ- ходимо только когда два или более полей имеют одно и то же имя, в лю- бом случае это хорошая идея включать имя таблицы в обьединение для лучшего понимания и непротиворечивости. Несмотря на это, мы будем, в наших примерах далее, использовать имена таблицы только когда необхо- димо, так что будет ясно, когда они необходимы а когда нет. Что SQL в основном делает в обьединении - так это исследует каждую комбинацию строк двух или более возможных таблиц, и проверяет эти ком- бинации по их предикатам. В предыдущем примере, требовалась строка продавца Peel из таблицы Продавцов и объединение ее с каждой строкой таблицы Пользователей, по одной в каждый момент времени. Если комбина- ция производит значение которое делает предикат верным, и если поле city из строк таблиц Заказчика равно London, то Peel - это то запраши- ваемое значение которое комбинация выберет для вывода. То же самое бу- дет затем выполнено для каждого продавца в таблице Продавцов ( у неко- торых из которых небыло никаких заказчиков в этих городах). ОБЪЕДИНЕНИЕ ТАБЛИЦ ЧЕРЕЗ СПРАВОЧНУЮ ЦЕЛОСТНОСТЬ Эта особенность часто используется просто для эксплуатации связей встроенных в базу данных. В предыдущем примере, мы установили связь между двумя таблицами в обьединении. Это прекрасно. Но эти таблицы, уже были соединены через snum поле. Эта связь называется состоянием справочной целостности, как мы уже говорили в Главе 1. Используя обь- единение можно извлекать данные в терминах этой связи. Например, чтобы показать имена всех заказчиков соответствующих продавцам которые их обслуживают, мы будем использовать такой запрос: SELECT Customers.cname, Salespeople.sname FROM Customers, Salespeople WHERE Salespeople.snum = Customers.snum; Вывод этого запроса показывается в Рисунке 8.2. Это - пример обьединения, в котором столбцы используются для опреде- ления предиката запроса, и в этом случае, snum столбцы из обеих таб- лиц, удалены из вывода. И это прекрасно. Вывод показывает какие заказ- чики каким продавцом обслуживаются; значения поля snum которые уста- навливают связь - отсутствуют. Однако если вы введете их в вывод, то вы должны или удостовериться что вывод понятен сам по себе или обеспе- чить коментарий к данным при выводе. =============== SQL Execution Log ============ | SELECT Customers.cname, Salespeople.sname, | | FROM Salespeople, Customers | | WHERE Salespeople.snum = Customers.snum | | ============================================= | | cname sname | | ------- -------- | | Hoffman Peel | | Giovanni Axelrod | | Liu Serres | | Grass Serres | | Clemens Peel | | Cisneros Rifkin | | Pereira Motika | ============================================= Рисунок 8.2: Объединение продавцов с их заказчикам ОБЪЕДИНЕНИЯ ТАБЛИЦ ПО РАВЕНСТВУ ЗНАЧЕНИЙ В СТОЛБЦАХ И ДРУГИЕ ВИДЫ ОБЪЕДИНЕНИЙ Обьединения которые используют предикаты основанные на равенствах называются - объединениями по равенству. Все наши примеры в этой главе до настоящего времени, относились именно к этой категории, потому что все условия в предложениях WHERE базировались на математических выра- жениях использующих знак равно ( = ). Строки 'city = 'London' и 'Sa- lespeople.snum = Orders.snum ' - примеры таких типов равенств найден- ных в предикатах. Объединения по равенству - это вероятно наиболее об- щий вид объединения, но имеются и другие. Вы можете, фактически, ис- пользовать любой из реляционных операторов в обьединении. Здесь пока- зан пример другого вида объединения (вывод показывается в Рисунке 8.3): SELECT sname, cname FROM Salespeople, Customers WHERE sname < cname AND rating < 200; =============== SQL Execution Log ============ | SELECT sname, cname | | FROM Salespeople, Customers | | WHERE sname < cname | | AND rating < 200; | | ============================================= | | sname cname | | -------- ------- | | Peel Pereira | | Motika Pereira | | Axelrod Hoffman | | Axelrod Clemens | | Axelrod Pereira | | | ============================================= Рисунок 8.3: Обьединение основанное на неравенстве Эта команда не часто бывает полезна. Она воспроизводит все комбина- ции имени продавца и имени заказчика так, что первый предшествует пос- леднему в алфавитном порядке, а последний имеет оценку меньше чем 200. Обычно, вы не создаете сложных связей подобно этой, и, по этой причи- не, вы вероятно будете строить наиболее общие объединения по равенс- тву, но вы должны хорошо знать и другие возможности. ОБЪЕДИНЕНИЕ БОЛЕЕ ДВУХ ТАБЛИЦ Вы можете также создавать запросы объединяющие более двух таблиц. Предположим что мы хотим найти все порядки заказчиков не находящихся в тех городах где находятся их продавцы.Для этого необходимо связать все три наши типовые таблицы ( вывод показывается в Рисунке 8.4 ): SELECT onum, cname, Orders.cnum, Orders.snum FROM Salespeople, Customers,Orders WHERE Customers.city < > Salespeople.city AND Orders.cnum = Customers.cnum AND Orders.snum = Salespeople.snum; =============== SQL Execution Log ============== | | | SELECT onum, cname, Orders.cnum, Orders.snum | | FROM Salespeople, Customers, Orders | | WHERE Customers.city < > Salespeople.city | | AND Orders.cnum = Customers.cnum | | AND Orders.snum = Salespeople.snum; | | =============================================== | | onum cname cnum snum | | ------ ------- ----- ----- | | 3001 Cisneros 2008 1007 | | 3002 Pereira 2007 1004 | | 3006 Cisneros 2008 1007 | | 3009 Giovanni 2002 1003 | | 3007 Grass 2004 1002 | | 3010 Grass 2004 1002 | =============================================== Рисунок 8. 4: Объединение трех таблиц Хотя эта команда выглядит скорее как комплексная, вы можете следо- вать за логикой, просто проверяя - что заказчики не размещены в тех городах где размещены их продавцы ( совпадение двух snum полей ), и что перечисленные порядки - выполнены с помощью этих заказчиков( сов- падение порядков с полями cnum и snum в таблице Порядков ). =============== РЕЗЮМЕ =============== Теперь вы больше не ограничиваетесь просмотром одной таблицы в каж- дый момент времени. Кроме того, вы можете делать сложные сравнения между любыми полями любого числа таблиц и использовать полученные ре- зультаты чтобы решать какую информацию вы бы хотели видеть. Фактичес- ки, эта методика настолько полезна для построения связей, что она час- то используется для создания их внутри одиночной таблицы. Это будет правильным: вы сможете объединить таблицу с собой, а это очень удобная вещь. Это будет темой Главы 9. ************** РАБОТА С SQL ************** 1. Напишите запрос который бы вывел список номеров порядков сопровож- дающихся именем заказчика который создавал эти порядки. 2. Напишите запрос который бы выдавал имена продавца и заказчика для каждого порядка после номера порядков. 3. Напишите запрос который бы выводил всех заказчиков обслуживаемых продавцом с комиссионными выше 12% . Выведите имя заказчика, имя продавца, и ставку комиссионных продавца. 4. Напишите запрос который вычислил бы сумму комиссионных продавца для каждого порядка заказчика с оценкой выше 100. ( См. Приложение A для ответов. ) . 9. ОБЪЕДИНЕНИЕ ТАБЛИЦЫ С СОБОЙ В ГЛАВЕ 8, МЫ ПОКАЗАЛИ ВАМ КАК ОБЪЕДИНЯТЬ ДВЕ или более таблиц - вместе. Достаточно интересно то, что та же самая методика может использо- ваться чтобы объединять вместе две копии одиночной таблицы. В этой главе, мы будем исследовать этот процесс. Как вы видете, объединение таблицы с самой собой, далеко не простая вещь, и может быть очень по- лезным способом определять определенные виды связей между пунктами данных в конкретной таблице. ========= КАК ДЕЛАТЬ ОБЪЕДИНЕНИЕ ========== ТАБЛИЦЫ С СОБОЙ ? Для объединения таблицы с собой, вы можете сделать каждую строку таблицы, одновременно, и комбинацией ее с собой и комбинацией с каждой другой строкой таблицы. Вы затем оцениваете каждую комбинацию в терми- нах предиката, также как в обьединениях мультитаблиц. Это позволит вам легко создавать определенные виды связей между различными позициями внутри одиночной таблицы - с помощью обнаружения пар строк со значени- ем поля, например. Вы можете изобразить обьединение таблицы с собой, как обьединение двух копий одной и той же таблицы. Таблица на самом деле не копирует- ся, но SQL выполняет команду так, как если бы это было сделано. Други- ми словами, это обьединение - такое же, как и любое другое обьединение между двумя таблицами, за исключением того, что в данном случае обе таблицы идентичны. ПСЕВДОНИМЫ Синтаксис команды для объединения таблицы с собой, тот же что и для объединения многочисленых таблиц, в одном экземпляре. Когда вы объеди- няете таблицу с собой, все повторяемые имена столбца, заполняются пре- фиксами имени таблицы. Чтобы ссылаться к этим столбцам внутри запроса, вы должны иметь два различных имени для этой таблицы. Вы можете сделать это с помощью определения временных имен называе- мых переменными диапазона, переменными корреляции или просто - псевдо- нимами. Вы определяете их в предложении FROM запроса. Это очень прос- то: вы набираете имя таблицы, оставляете пробел, и затем набираете псевдоним для нее. Имеется пример который находит все пары заказчиков имеющих один и тот же самый рейтинг (вывод показывается в Рисунке 9.1): SELECT first.cname, second.cname, first.rating FROM Customers first, Customers second WHERE first.rating = second.rating; =============== SQL Execution Log ============== | | | Giovanni Giovanni 200 | | Giovanni Liu 200 | | Liu Giovanni 200 | | Liu Liu 200 | | Grass Grass 300 | | Grass Cisneros 300 | | Clemens Hoffman 100 | | Clemens Clemens 100 | | Clemens Pereira 100 | | Cisneros Grass 300 | | Cisneros Cisneros 300 | | Pereira Hoffman 100 | | Pereira Clemens 100 | | Pereira Pereira 100 | | | =============================================== Рисунок 9.1: Объединение таблицы с собой ( обратите внимание что на Рисунке 9.1, как и в некоторых дальнейших примерах, полный запрос не может уместиться в окне вывода, и следова- тельно будет усекаться. ) В вышеупомянутой команде, SQL ведет себя так, как если бы он соеди- нял две таблицы называемые 'первая' и 'вторая'. Обе они - фактически, таблицы Заказчика, но псевдонимы разрешают им быть обработаными неза- висимо. Псевдонимы первый и второй были установлены в предложении FROM запроса, сразу после имени копии таблицы. Обратите внимание что псев- донимы могут использоваться в предложении SELECT, даже если они не оп- ределены в предложении FROM. Это - очень хорошо. SQL будет сначала допускать любые такие псевдо- нимы на веру, но будет отклонять команду если они не определены далее в предложении FROM запроса. Псевдоним существует - только пока команда выполняется ! Когда зап- рос заканчивается, псевдонимы используемые в нем больше не имеют ника- кого значения. Теперь, когда имеются две копии таблицы Заказчиков, чтобы работать с ними, SQL может обрабатывать эту операцию точно также как и любое дру- гое обьединение - берет каждую строку из одного псевдонима и сравнива- ет ее с каждой строкой из другого псевдонима. УСТРАНЕНИЕ ИЗБЫТОЧНОСТИ Обратите внимание что наш вывод имеет два значение для каждой комби- нации, причем второй раз в обратном порядке. Это потому, что каждое значение показано первый раз в каждом псевдониме, и второй раз( сим- метрично) в предикате. Следовательно, значение A в псевдониме сначала выбирается в комбинации со значением B во втором псевдониме, а затем значение A во втором псевдониме выбирается в комбинации со значением B в первом псевдониме. В нашем примере, Hoffman выбрался вместе с Cle- mens, а затем Clemens выбрался вместе с Hoffman. Тот же самый случай с Cisneros и Grass, Liu и Giovanni, и так далее. Кроме того каждая стро- ка была сравнена сама с собой, чтобы вывести строки такие как - Liu и Liu. Простой способ избежать этого состoит в том, чтобы налагать поря- док на два значения, так чтобы один мог быть меньше чем другой или предшествовал ему в алфавитном порядке. Это делает предикат ассимет- ричным, поэтому те же самые значения в обратном порядке не будут выб- раны снова, например: SELECT tirst.cname, second.cname, first.rating FROM Customers first, Customers second WHERE first.rating = second.rating AND first.cname < second.cname; Вывод этого запроса показывается в Рисунке 9.2. Hoffman предшествует Periera в алфавитном порядке, поэтому комбина- ция удовлетворяет обеим условиям предиката и появляется в выводе. Ког- да та же самая комбинация появляется в обратном порядке - когда Perie- ra в псевдониме первой таблицы сравнтвается с Hoffman во второй табли- це псевдонима - второе условие не встречается. Аналогично Hoffman не выбирается при наличии того же рейтинга что и он сам потому что его имя не предшествует ему самому в алфавитном порядке. Если бы вы захо- =============== SQL Execution Log ============== | | | SELECT first.cname, second.cname, first.rating | | FROM Customers first, Customers second | | WHERE first.rating = second.rating | | AND first.cname < second.cname | | =============================================== | | cname cname rating | | ------- --------- ------- | | Hoffman Pereira 100 | | Giovanni Liu 200 | | Clemens Hoffman 100 | | Pereira Pereira 100 | | Gisneros Grass 300 | ================================================= Рисунок 9.2: Устранение избыточности вывода в обьединении с собой. тели включить сравнение строк с ними же в запросах подобно этому, вы могли бы просто использовать < = вместо <. ПРОВЕРКА ОШИБОК Таким образом мы можем использовать эту особенность SQL для проверки определенных видов ошибок. При просмотре таблицы Порядков, вы можете видеть что поля cnum и snum должны иметь постоянную связь. Так как каждый заказчик должен быть назначен к одному и только одному продав- цу, каждый раз когда определенный номер заказчика появляется в таблице Порядков, он должен совпадать с таким же номером продавца. Следующая команда будет определять любые несогласованности в этой области: SELECT first.onum, tirst.cnum, first.snum, second.onum, second.cnum,second.snum FROM Orders first, Orders second WHERE first.cnum = second.cnum AND first.snum < > second.snum; Хотя это выглядит сложно, логика этой команды достаточно проста. Она будет брать первую строку таблицы Порядков, запоминать ее под первым псевдонимом, и проверять ее в комбинации с каждой строкой таблицы По- рядков под вторым псевдонимом, одну за другой. Если комбинация строк удовлетворяет предикату, она выбирается для вывода. В этом случае пре- дикат будет рассматривать эту строку, найдет строку где поле cnum=2008 а поле snum=1007, и затем рассмотрит каждую следующую строку с тем же самым значением поля cnum. Если он находит что какая -то из их имеет значение отличное от значения поля snum, предикат будет верен, и выве- дет выбранные поля из текущей комбинации строк. Если же значение snum с данным значением cnum в наш таблице совпадает, эта команда не произ- ведет никакого вывода. БОЛЬШЕ ПСЕВДОНИМОВ Хотя обьединение таблицы с собой - это первая ситуация когда понятно что псевдонимы необходимы, вы не ограничены в их использовании что бы только отличать копию одлной таблицы от ее оригинала. Вы можете ис- пользовать псевдонимы в любое время когда вы хотите создать альтерна- тивные имена для ваших таблиц в команде. Например, если ваши таблицы имеют очень длинные и сложные имена, вы могли бы определить простые односимвольные псевдонимы, типа a и b, и использовать их вместо имен таблицы в предложении SELECT и предикате. Они будут также использо- ваться с соотнесенными подзапросами(обсуждаемыми в Главе 11). ЕЩЕ БОЛЬШЕ КОМПЛЕКСНЫХ ОБЪЕДИНЕНИЙ Вы можете использовать любое число псевдонимов для одной таблицы в запросе, хотя использование более двух в данном предложении SELECT * будет излишеством. Предположим что вы еще не назначили ваших заказчи- ков к вашему продавцу. Компании должна назначить каждому продавцу пер- воначально трех заказчиков, по одному для каждого рейтингового значе- ния. Вы лично можете решить какого заказчика какому продавцу назна- чить, но следующий запрос вы используете чтобы увидеть все возможные комбинации заказчиков которых вы можете назначать. ( Вывод показывает- ся в Рисунке 9.3 ): SELECT a.cnum, b.cnum, c.cnum FROM Customers a, Customers b, Customers c WHERE a.rating = 100 AND b.rating = 200 AND c.rating = 300; =============== SQL Execution Log ============== | | | AND c.rating = 300; | | =============================================== | | cnum cnum cnum | | ----- ------ ------ | | 2001 2002 2004 | | 2001 2002 2008 | | 2001 2003 2004 | | 2001 2003 2008 | | 2006 2002 2004 | | 2006 2002 2008 | | 2006 2003 2004 | | 2006 2003 2008 | | 2007 2002 2004 | | 2007 2002 2008 | | 2007 2003 2004 | | 2007 2003 2008 | ================================================= Рисунок 9.3 Комбинация пользователей с различными значениями рейтинга Как вы можете видеть, этот запрос находит все комбинации заказчиков с тремя значениями оценки, поэтому первый столбец состоит из заказчи- ков с оценкой 100, второй с 200, и последний с оценкой 300. Они повто- ряются во всех возможных комбинациях. Это - сортировка группировки ко- торая не может быть выполнена с GROUP BY или ORDER BY, поскольку они сравнивают значения только в одном столбце вывода. Вы должны также понимать, что не всегда обязательно использовать каждый псевдоним или таблицу которые упомянуты в предложении FROM зап- роса, в предложении SELECT. Иногда, предложение или таблица становятся запрашиваемыми исключительно потому что они могут вызываться в преди- кате запроса. Например, следующий запрос находит всех заказчиков раз- мещенных в городах где продавец Serres ( snum 1002 ) имеет заказиков ( вывод показывается в Рисунке 9.4 ): SELECT b.cnum, b.cname FROM Customers a, Customers b WHERE a.snum = 1002 AND b.city = a.city; =============== SQL Execution Log ============ | | | SELECT b.cnum, b.cname | | FROM Customers a, Customers b | | WHERE a.snum = 1002 | | AND b.city = a.city; | | ==============================================| | cnum cname | | ------ --------- | | 2003 Liu | | 2008 Cisneros | | 2004 Grass | ============================================= Рисунок 9.4 Нахождение заказчиков в городах относящихся к Serres. Псевдоним a будет делать предикат неверным за исключением случая когда его значение столбца snum = 1002. Таким образом псевдоним опус- кает все, кроме заказчиков продавца Serres. Псевдоним b будет верным для всех строк с тем же самым значением города что и текущее значение города для a; в ходе запроса, строка псевдонима b будет верна один раз когда значение города представлено в a. Нахождение этих строк псевдо- нима b - единственая цель псевдонима a, поэтоиму мы не выбираем все столбцы подряд. Как вы можете видеть, собственные заказчики Serres вы- бираются при нахождении их в том же самом городе что и он сам, поэтому выбор их из псевдонима a необязателен. Короче говоря, псевдоним назхо- дит строки заказчиков Serres, Liu и Grass. Псевдоним b находит всех заказчиков размещенных в любом из их городов ( San Jose и Berlin соот- ветственно ) включая, конечно, самих - Liu и Grass. Вы можете также создать обьединение которое включает и различные таблицы и псевдонимы одиночной таблицы. Следующий запрос объединяет таблицу Пользователей с собой: чтобы найти все пары заказчиков обслу- живаемых одним продавцом. В то же самое время, этот запрос объединяет заказчика с таблицей Продавцов с именем этого продавца ( вывод показан на Рисунке 9.5 ): SELECT sname, Salespeople.snum, first.cname second.cname FROM Customers first, Customers second, Salespeople WHERE first.snum = second.snum AND Salespeople.snum = first.snum AND first.cnum < second.cnum; =============== SQL Execution Log ================== | | | SELECT cname, Salespeople.snum, first.cname | | second.cname | | FROM Customers first, Customers second, Salespeople | | WHERE first.snum = second.snum | | AND Salespeople.snum = first.snum | | AND first.cnum < second.cnum; | | ====================================================| | cname snum cname cname | | ------ ------ -------- -------- | | Serres 1002 Liu Grass | | Peel 1001 Hoffman Clemens | ===================================================== Рисунок 9.5: Объединение таблицы с собой и с другой таблицей ================ РЕЗЮМЕ ================= Теперь Вы понимаете возможности объединения и можете использовать их для ограничения связей с таблицей, между различными таблицами, или в обоих случаях. Вы могли видеть некоторые возможности объединения при использовании его способностей. Вы теперь познакомились с терминами порядковые переменные, корреляционные переменные и предложения (эта терминология будет меняться от изделия к изделию, так что мы предлага- ем Вам познакомится со всеми тремя терминами ). Кроме того Вы поняли, немного, как в действительности работают запросы. Следующим шагом после комбинации многочисленых таблиц или многочис- леных копий одной таблицы в запросе, будет комбинация многочисленных запросов, где один запрос будет производить вывод который будет затем управлять работой другого запроса. Это другое мощное средство SQL, о котором мы расскажем в Главе 10 и более тщательно в последующих гла- вах. ************** РАБОТА С SQL ************** 1. Напишите запрос который бы вывел все пары продавцов живущих в одном и том же городе. Исключите комбинации продавцов с ними же, а также дубликаты строк выводимых в обратным порядке. 2. Напишите запрос который вывел бы все пары порядков по данным заказ- чикам, именам этих заказчиков, и исключал дубликаты из вывода, как в предыдущем вопросе. 3. Напишите запрос который вывел бы имена(cname) и города(city) всех заказчиков с такой же оценкой(rating) как у Hoffmanа. Напишите зап- рос использующий поле cnum Hoffmanа а не его оценку, так чтобы оно могло быть использовано если его оценка вдруг изменится. ( См. Приложение A для ответов. ) . 10. ВСТАВКА ОДНОГО ЗАПРОСА ВНУТРЬ ДРУГОГО В КОНЕЦ ГЛАВЫ 9, МЫ ГОВОРИЛИ ЧТО ЗАПРОСЫ могут управлять другими запросами. В этой главе, вы узнаете как это делается ( большей частью ), помещая запрос внутрь предиката другого запроса, и используя вывод внутреннего запроса в верном или неверном условии предиката. Вы сможе- те выяснить какие виды операторов могут использовать подзапросы и пос- мотреть как подзапросы работают со средствами SQL , такими как DIS- TINCT, с составными функциями и выводимыми выражения. Вы узнаете как использовать подзапросы с предложением HAVING и получите некоторые наставления как правильно использовать подзапросы. ======== КАК РАБОТАЕТ ПОДЗАПРОС? ========= С помощью SQL вы можете вкладывать запросы внутрь друга друга. Обыч- но, внутренний запрос генерирует значение которое проверяется в преди- кате внешнего запроса, определяющего верно оно или нет. Например, предположим что мы знаем имя продавца: Motika, но не знаем значение его поля snum, и хотим извлечь все порядки из таблицы Порядков. Имеет- ся один способ чтобы сделать это( вывод показывается в Рисунке 10.1 ): SELECT * FROM Orders WHERE snum = ( SELECT snum FROM Salespeople WHERE sname = 'Motika'); Чтобы оценить внешний( основной ) запрос, SQL сначала должен оценить внутренний запрос ( или подзапрос ) внутри предложения WHERE. Он дела- ет это так как и должен делать запрос имеющий единственную цель - отыскать через таблицу Продавцов все строки, где поле sname равно зна- чению Motika, и затем извлечь значения поля snum этих строк. Единственной найденной строкой естественно будет snum = 1004. Однако SQL, не просто выдает это значение, а помещает его в предикат основно- го запроса вместо самого подзапроса, так чтобы предиката прочитал что WHERE snum = 1004 =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE snum = | | (SELECT snum | | FROM Salespeople | | WHERE sname = 'Motika'); | |=================================================| | onum amt odate cnum snum | | ----- ------- ---------- ----- ----- | | 3002 1900.10 10/03/1990 2007 1004 | | | ================================================= Рисунок 10.1: Использование подзапроса Основной запрос затем выполняется как обычно с вышеупомянутыми ре- зультатами. Конечно же, подзапрос должен выбрать один и только один столбец, а тип данных этого столбца должен совпадать с тем значением с которым он будет сравниваться в предикате. Часто, как показано выше, выбранное поле и его значение будут иметь одинаковые имена( в этом случае, snum ), но это необязательно. Конечно, если бы мы уже знали номер продавца Motika, мы могли бы просто напечатать WHERE snum = 1004 и выполнять далее с подзапросом в целом, но это было бы не так универ- сально. Это будет продолжать работать даже если номер Motika изменил- ся, а, с помощью простого изменения имени в подзапросе, вы можете ис- пользовать его для чего угодно. ЗНАЧЕНИЯ, КОТОРЫЕ МОГУТ ВЫДАВАТЬ ПОДЗАПРОСЫ Скорее всего было бы удобнее, чтобы наш подзапрос в предыдущем при- мере возвращал одно и только одно значение. Имея выбранным поле snum " WHERE city = "London" вместо "WHERE sname = 'Motika", можно получить несколько различных значений. Это может сделать уравнение в предикате основного запроса невозможным для оценки верности или неверности, и команда выдаст ошибку. При использовании подзапросов в предикатах основанных на реляционных операторах ( уравнениях или неравенствах, как объяснено в Главе 4 ), вы должны убедиться что использовали подзапрос который будет выдавать одну и только одну строку вывода. Если вы используете подзапрос кото- рый не выводит никаких значений вообще, команда не потерпит неудачи; но основной запрос не выведет никаких значений. Подзапросы которые не производят никакого вывода (или нулевой вывод) вынуждают рассматривать предикат ни как верный ни как неверный, а как неизвестный. Однако, не- известный предикат имеет тот же самый эффект что и неверный: никакие строки не выбираются основным запросом ( смотри Главу 5 для подробной информации о неизвестном предикате ). Это плохая стратегия, чтобы делать что-нибудь подобное следующему: SELECT * FROM Orders WHERE snum = ( SELECT snum FROM Salespeople WHERE city = Barcelona ); Поскольку мы имеем только одного продавца в Barcelona - Rifkin, то подзапрос будет выбирать одиночное значение snum и следовательно будет принят. Но это - только в данном случае. Большинство SQL баз данных имеют многочисленых пользователей, и если другой пользователь добавит нового продавца из Barcelona в таблицу, подзапрос выберет два значе- ния, и ваша команда потерпит неудачу. DISTINCT С ПОДЗАПРОСАМИ Вы можете, в некоторых случаях, использовать DISTINCT чтобы вынудить подзапрос генерировать одиночное значение. Предположим что мы хотим найти все порядки кредитований для тех продавцов которые обслуживают Hoffmanа ( cnum = 2001 ). Имеется один способ чтобы сделать это ( вывод показывается в Рисунке 10.2 ): SELECT * FROM Orders WHERE snum = ( SELECT DISTINCT snum FROM Orders WHERE cnum = 2001 ); =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE snum = | | (SELECT DISTINCT snum | | FROM Orders | | Where cnum = 2001); | | =============================================== | | onum amt odate cnum snum | | ----- --------- --------- ------ ------- | | 3003 767.19 10/03/1990 2001 1001 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 10.2: Использование DISTINCT чтобы вынудить получение одного значения из подзапроса Подзапрос установил что значение поля snum совпало с Hoffman - 1001, и затем основной запрос выделил все порядки с этим значением snum из таблицы Порядков( не разбирая, относятся они к Hoffman или нет). Так как каждый заказчик назначен к одному и только этому продавцу, мы зна- ем что каждая строка в таблице Порядков с данным значением cnum должна иметь такое же значение snum. Однако так как там может быть любое чис- ло таких строк, подзапрос мог бы вывести много ( хотя и идентичных ) значений snum для данного поля cnum. Аргумент DISTINCT предотвращает это. Если наш подзапрос возвратит более одного значения, это будет указывать на ошибку в наших данных - хорошая вещь для знающих об этом. Альтернативный подход должен быть чтобы ссылаться к таблице Заказчиков а не к таблице Порядков в подзапросе. Так как поле cnum - это первич- ный ключ таблицы Заказчика, запрос выбирающий его должен произвести только одно значение. Это рационально только если вы как пользователь имеете доступ к таблице Порядков но не к таблице Заказчиков. В этом случае, вы можете использовать решение которое мы показали выше. ( SQL имеет механизмы которые определяют - кто имеет привилегии чтобы делать что-то в определенной таблице. Это будет объясняться в Главе 22.) По- жалуйста учтите, что методика используемая в предшествующем примере применима только когда вы знаете, что два различных поля в таблице должны всегда совпадать, как в нашем случае. Эта ситуация не является типичной в реляционных базах данных, она являеться исключением из пра- вил. ПРЕДИКАТЫ С ПОДЗАПРОСАМИ ЯВЛЯЮТСЯ НЕОБРАТИМЫМИ Вы должны обратить внимание что предикаты включающие подзапросы, ис- пользуют выражение < скалярная форма > < оператор > < подзапрос >, а не < подзапрос > < оператор > < скалярное выражение > или, < подзапрос > < оператор > < подзапрос >. Другими словами, вы не должны записывать предыдущий пример так: SELECT * FROM Orders WHERE ( SELECT DISTINCT snum FROM Orders WHERE cnum = 2001 ) = snum; В строгой ANSI реализации, это приведет к неудаче, хотя некоторые программы и позволяют делать такие вещи. ANSI также предохраняет вас от появления обеих значений при сравнении, которые нужно вывести с по- мощью подзапроса. ИСПОЛЬЗОВАНИЕ АГРЕГАТНЫХ ФУНКЦИЙ В ПОДЗАПРОСАХ Один тип функций, который автоматически может производить одиночное значение для любого числа строк, конечно же, - агрегатная функция. Любой запрос использующий одиночную функцию агрегата без предложения GROUP BY будет выбирать одиночное значение для использования в основ- ном предикате. Например, вы хотите увидеть все порядки имеющие сумму приобретений выше средней на 4-е Октября ( вывод показан на Рисуноке 10.3 ): SELECT * FROM Orders WHERE amt > ( SELECT AVG (amt) FROM Orders WHERE odate = 10/04/1990 ); =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE amt > | | (SELECT AVG (amt) | | FROM Orders | | WHERE odate = 01/04/1990 ); | | =============================================== | | onum amt odate cnum snum | | ----- -------- ---------- ----- ----- | | 3002 1900.10 10/03/1990 2007 1004 | | 3005 2345.45 10/03/1990 2003 1002 | | 3006 1098.19 10/03/1990 2008 1007 | | 3009 1713.23 10/04/1990 2002 1003 | | 3008 4723.00 10/05/1990 2006 1001 | | 3010 1309.95 10/06/1990 2004 1002 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 10.3: Выбор всех сумм со значением выше средней на 10/04/1990 Средняя сумма приобретений на 4 Октября - 1788.98 ( 1713.23 + 75.75) делится пополам, что в целом равняется = 894.49. Все строки со значе- нием в поле amt выше этого - являются выбраными. Имейте ввиду что сгруппированные агрегатные функции, которые являют- ся агрегатными функциями определенными в терминах предложения GROUP BY, могут производить многочисленые значения. Они, следовательно, не позволительны в подзапросах такого характера. Даже если GROUP BY и HA- VING используются таким способом, что только одна группа выводится с помощью подзапроса, команда будет отклонена в принципе. Вы должны ис- пользовать одиночную агрегатную функцию с предложением WHERE что уст- ранит нежелательные группы. Например, следующий запрос который должен найти среднее значение комиссионных продавца в Лондоне - SELECT AVG (comm) FROM Salespeople GROUP BY city HAVlNG city = "London"; не может использоваться в подзапросе! Во всяком случае это не лучший спо- соб формировать запрос. Другим способом может быть - SELECT AVG (comm) FROM Salespeople WHERE city = "London"; ИСПОЛЬЗОВАНИЕ ПОДЗАПРОСОВ КОТОРЫЕ ВЫДАЮТ МНОГО СТРОК С ПОМОЩЬЮ ОПЕРАТОРА IN Вы можете использовать подзапросы которые производят любое число строк если вы используете специальный оператор IN ( операторы BETWEEN, LIKE, и IS NULL не могут использоваться с подзапросами ). Как вы пом- ните, IN определяет набор значений, одно из которых должно совпадать с другим термином уравнения предиката в порядке, чтобы предикат был вер- ным. Когда вы используете IN с подзапросом, SQL просто формирует этот набор из вывода подзапроса. Мы можем, следовательно, использовать IN чтобы выполнить такой же подзапрос который не будет работать с реляци- онным оператором, и найти все атрибуты таблицы Порядков для продавца в Лондоне ( вывод показывается в Рисунке 10.4 ): SELECT * FROM Orders WHERE snum IN ( SELECT snum FROM Salespeople WHERE city = "LONDON" ); =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE snum IN | | (SELECT snum | | FROM Salespeople | | WHERE city = 'London'); | | =============================================== | | onum amt odate cnum snum | | ----- -------- ---------- ----- ------ | | 3003 767.19 10/03/1990 2001 1001 | | 3002 1900.10 10/03/1990 2007 1004 | | 3006 1098.19 10/03/1990 2008 1007 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 10. 4: Использование подзапроса с IN В ситуации подобно этой, подзапрос - более прост для пользователя чтобы понимать его и более прост для компьютера чтобы его выполнить, чем если бы Вы использовали обьединение: SELECT onum, amt, odate, cnum, Orders.snum FROM Orders, Salespeople WHERE Orders.snum = Salespeople.snum AND Salespeople.city = "London"; Хотя это и произведет тот же самый вывод что и в примере с подзапро- сом, SQL должен будет просмотреть каждую возможную комбинацию строк из двух таблиц и проверить их снова по составному предикату. Проще и эф- фективнее извлекать из таблицы Продавцов значения поля snum где city = "London", и затем искать эти значения в таблице Порядков, как это де- лается в варианте с подзапросом. Внутренний запрос дает нам snums=1001 и snum=1004. Внешний запрос, затем, дает нам строки из таблицы Поряд- ков где эти поля snum найдены. Строго говоря, быстрее или нет работает вариант подзапроса, практи- чески зависит от реализации - в какой программе вы это используете. Эта часть вашей программы называемой - оптимизатор, пытается найти на- иболее эффективный способ выполнения ваших запросов. Хороший оптимизатор во всяком случае преобразует вариант обьединения в подзапрос, но нет достаточно простого способа для вас чтобы выяснить выполнено это или нет. Лучше сохранить ваши запросы в памяти чем пола- гаться полностью на оптимизатор. Конечно вы можете также использовать оператор IN, даже когда вы уве- рены что подзапрос произведет одиночное значение. В любой ситуации где вы можете использовать реляционный оператор сравнения (=), вы можете использовать IN. В отличие от реляционных операторов, IN не может зас- тавить команду потерпеть неудачу если больше чем одно значение выбрано подзапросом. Это может быть или преимуществом или недостатком. Вы не увидите непосредственно вывода из подзапросов; если вы полагаете что подзапрос собирается произвести только одно значение, а он производит различные. Вы не сможете объяснить различия в выводе основного запро- са. Например, рассмотрим команду, которая похожа на предыдущую: SELECT onum, amt, odate FROM Orders WHERE snum = ( SELECT snum FROM Orders WHERE cnum = 2001 ); Вы можете устранить потребность в DISTINCT используя IN вместо (=), подобно этому: SELECT onum, amt, odate FROM Orders WHERE snum IN ( SELECT snum FROM Orders WHERE cnum = 2001 ); Что случится если есть ошибка и один из порядков был акредитован к различным продавцам? Версия использующая IN будет давать вам все по- рядки для обоих продавцов. Нет никакого очевидного способа наблюдения за ошибкой, и поэтому сгенерированные отчеты или решения сделанные на основе этого запроса не будут содержать ошибки. Вариант использующий ( = ) , просто потерпит неудачу. Это, по крайней мере, позволило вам узнать что имеется такая пробле- ма. Вы должны затем выполнять поиск неисправности, выполнив этот под- запрос отдельно и наблюдая значения которые он производит. В принципе, если вы знаете что подзапрос должен( по логике) вывести только одно значение, вы должны использовать = . IN является подходя- щим, если запрос может ограниченно производить одно или более значе- ний, независимо от того ожидаете вы их или нет. Предположим, мы хотим знать комиссионные всех продавцов обслуживающих заказчиков в Лондоне: SELECT comm FROM Salespeople WHERE snum IN ( SELECT snum FROM Customers WHERE city = "London" ); Выводимыми для этого запроса, показанного в Рисунке 10.5, являются значения комиссионных продавца Peel ( snum = 1001 ), который имеет обоих заказчиков в Лондоне. Это - только для данного случая. Нет ника- кой причины чтобы некоторые заказчики в Лондоне не могли быть назначе- ными к кому-то еще. Следовательно, IN - это наиболее логичная форма чтобы использовать ее в запросе. =============== SQL Execution Log ============== | | | SELECT comm | | FROM Salespeople | | WHERE snum IN | | (SELECT snum | | FROM Customers | | WHERE city = 'London'); | | =============================================== | | comm | | ------- | | 0.12 | | | | | ================================================ Рисунок 10.5 Использование IN с подзапросом для вывода одного значения Между прочим, префикс таблицы для поля city необязателен в предыду- щем примере, несмотря на возможную неоднозначность между полями city таблицы Заказчика и таблицы Продавцов. SQL всегда ищет первое поле в таблице обозначенной в предложении FROM текущего подзапроса. Если поле с данным именем там не найдено, проверяются внешние запросы. В вышеупомянутом примере, "city" в пред- ложении WHERE означает что имеется ссылка к Customer.city( поле city таблицы Заказчиков). Так как таблица Заказчиков указана в предложении FROM текущего запроса, SQL предполагает что это - правильно. Это пред- положение может быть отменено полным именем таблицы или префиксом псевдонима, о которых мы поговорим позже когда будем говорить об соот- несенных подзапросах. Если возможен беспорядок, конечно же, лучше все- го использовать префиксы. ПОДЗАПРОСЫ ВЫБИРАЮТ ОДИНОЧНЫЕ СТОЛБЦЫ Смысл всех подзапросов обсужденных в этой главе тот, что все они вы- бирают одиночный столбец. Это обязательно, поскольку выбранный вывод сравнивается с одиночным значением. Подтверждением этому то, что SE- LECT * не может использоваться в подзапросе. Имеется исключение из этого, когда подзапросы используются с оператором EXISTS, который мы будем представлять в Главе 12. ИСПОЛЬЗОВАНИЕ ВЫРАЖЕНИЙ В ПОДЗАПРОСАХ Вы можете использовать выражение основанное на столбце, а не просто сам столбец, в предложении SELECT подзапроса. Это может быть выполнено или с помощью реляционных операторов или с IN. Например, следующий запрос использует реляционный оператор = ( вывод показывается в Рисун- ке 10.6 ): SELECT * FROM Customers WHERE cnum = ( SELECT snum + 1000 FROM Salespeople WHERE sname = Serres ); Он находит всех заказчиков чье значение поля cnum равное 1000, выше поля snum Serres. Мы предполагаем что столбец sname не имеет никаких двойных значений ( это может быть предписано или UNIQUE INDEX, обсуж- даемым в Главе 17, или ограничением UNIQUE, обсуждаемым в Главе 18 ); иначе =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cnum = | | (SELECT snum + 1000 | | WHERE Salespeople | | WHERE sname = 'Serres' | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ----- | | 2002 Giovanni Rome 200 1003 | ============================================= Рисунок 10.6: Использование подзапроса с выражением подзапрос может произвести многочисленые значения. Когда поля snum и сnum не имеют такого простого функционального значения как например первичный ключ , что не всегда хорошо, запрос типа вышеупомянутого не- вероятно полезен. ПОДЗАПРОСЫ В ПРЕДЛОЖЕНИИ HAVING Вы можете также использовать подзапросы внутри предложения HAVING. Эти подзапросы могут использовать свои собственные агрегатные функции если они не производят многочисленых значений или использовать GROUP BY или HAVING. Следующий запрос является этому примером ( вывод пока- зывается в Рисунке 10.7 ): SELECT rating, COUNT ( DISTINCT cnum ) FROM Customers GROUP BY rating HAVING rating > ( SELECT AVG (rating) FROM Customers WHERE city = " San Jose'; =============== SQL Execution Log ============ | | | SELECT rating,count (DISTINCT cnum) | | FROM Customers | | GROUP BY rating | | HAVING rating > | | (SELECT AVG (rating)snum + 1000 | | FROM Custimers | | WHERE city = 'San Jose' | |============================================ | | rating | | -------- -------- | | 200 2 | ================================================ Рисунок 10.7: Нахождение заказчиков с оценкой выше среднего в San Jose Эта команда подсчитывает заказчиков с оценками выше среднего в San Jose. Так как имеются другие оценки отличные от 300, они должны быть выведены с числом номеров заказчиков которые имели эту оценку. =============== РЕЗЮМЕ =============== Теперь вы используете запросы в иерархической манере. Вы видели, что использование результата одного запроса для управления другим, расши- ряет возможности позволяющие выполнить большее количество функций. Вы теперь понимаете как использовать подзапросы с реляционными оператора- ми также как и со специальным оператором IN, или в предложении WHERE или в предложении HAVING внешнего запроса. В следующих главах, мы будем разрабатывать подзапросы. Сначала в Главе 11, мы обсудим другой вид подзапроса, который выполняется от- дельно для каждой строки таблицы вызываемой во внешнем запросе. Затем, в Главе 12 и 13, мы представим вас нескольким специальным операторам которые функционируют на всех подзапросах, как это делает IN, за иск- лючением когда эти операторы могут использоваться только в подзапро- сах. *************** РАБОТА С SQL ************* 1. Напишите запрос, который бы использовал подзапрос для получения всех порядков для заказчика с именем Cisneros. Предположим, что вы не знаете номера этого заказчика, указываемого в поле cnum. 2. Напишите запрос который вывел бы имена и оценки всех заказчиков ко- торые имеют усредненые порядки. 3. Напишите запрос который бы выбрал общую сумму всех приобретений в порядках для каждого продавца, у которого эта общая сумма больше чем сумма наибольшего порядка в таблице. ( См. Приложение A для ответов. ) . 11. СООТНЕСЕННЫЕ ПОДЗАПРОСЫ. В ЭТОЙ ГЛАВЕ, МЫ ПРЕДСТАВИМ ВАС ТИПУ подзапроса о котором мы не го- ворили в Главе 10 - посвященной соотнесенному подзапросу. Вы узнаете как использовать соотнесенные подзапросы в предложениях запросов WHERE и HAVING. Сходства и различия между соотнесенными подзапросами и обь- единениями будут обсуждаться далее, и вы сможете повысить ваше знание псевдонимов и префиксов имени таблицы - когда они необходимы и как их использовать. КАК СФОРМИРОВАТЬ ========= СООТНЕСЕННЫЙ ПОДЗАПРОС =========== Когда вы используете подзапросы в SQL, вы можете обратиться к внут- реннему запросу таблицы в предложении внешнего запроса FROM , сформи- ровав - соотнесенный подзапрос. Когда вы делаете это, подзапрос выпол- няется неоднократно, по одному разу для каждой строки таблицы основно- го запроса. Соотнесенный подзапрос - один из большого количества тон- ких понятий в SQL из-за сложности в его оценке. Если вы сумеете овла- деть им, вы найдете что он очень мощный, потому что может выполнять сложные функции с помощью очень лаконичных указаний. Например, имеется один способ найти всех заказчиков в порядках на 3-е Октября ( вывод показывается в Рисунке 11.1 ): SELECT * FROM Customers outer WHERE 10/03/1990 IN ( SELECT odate FROM Orders inner WHERE outer.cnum = inner.cnum ); КАК РАБОТАЕТ СООТНЕСЕННЫЙ ПОДЗАПРОС В вышеупомянутом примере, "внутренний"(inner) и "внешний"(outer), это псевдонимы, подобно обсужденным в Главе 9. Мы выбрали эти имена для большей ясности; они отсылают к значениям внутренних и внешних запросов, соответственно. Так как значение в поле cnum внешнего запро- са меняется, внутренний запрос должен выполняться отдельно для каждой строки внешнего запроса. Строка внешнего запроса для которого внутрен- =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers outer | | WHERE 10/03/1990 IN | | (SELECT odate | | FROM Orders inner | | WHERE outer.cnum = inner.cnum); | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ----- | | 2001 Hoffman London 100 1001 | | 2003 Liu San Jose 200 1002 | | 2008 Cisneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 11.1: Использование соотнесенного подзапроса ний запрос каждый раз будет выполнен, называется - текущей стро- кой-кандидатом. Следовательно, процедура оценки выполняемой соотнесен- ным подзапросом - это: 1. Выбрать строку из таблицы именованной в внешнем запросе. Это будет текущая строка-кандидат. 2. Сохранить значения из этой строки-кандидата в псевдониме с именем в предложении FROM внешнего запроса. 3. Выполнить подзапрос. Везде, где псевдоним данный для внешнего зап- роса найден ( в этом случае "внешний" ), использовать значение для текущей строки-кандидата. Использование значения из строки-кандида- та внешнего запроса в подзапросе называется - внешней ссылкой. 4. Оценить предикат внешнего запроса на основе результатов подзапроса выполняемого в шаге 3. Он определяеть - выбирается ли строка-канди- дат для вывода. 5. Повторить процедуру для следующей строки-кандидата таблицы, и так далее пока все строки таблицы не будут проверены. В вышеупомянутом примере, SQL осуществляет следующую процедуру: 1. Он выбирает строку Hoffman из таблицы Заказчиков. 2. Сохраняет эту строку как текущую строку-кандидат под псевдонимом - "внешним". 3. Затем он выполняет подзапрос. Подзапрос просматривает всю таблицу Порядков чтобы найти строки где значение cnum поле - такое же как значение outer.cnum, которое в настоящее время равно 2001, - поле cnum строки Hoffmanа. Затем он извлекает поле odate из каждой стро- ки таблицы Порядков для которой это верно, и формирует набор значе- ний поля odate. 4. Получив набор всех значений поля odate, для поля cnum = 2001, он проверяет предикат основного запроса чтобы видеть имеется ли значе- ние на 3 Октября в этом наборе. Если это так(а это так), то он вы- бирает строку Hoffmanа для вывода ее из основного запроса. 5. Он повторяет всю процедуру, используя строку Giovanni как стро- ку-кандидата, и затем сохраняет повторно пока каждая строка таблицы Заказчиков не будет проверена. Как вы можете видеть, вычисления которые SQL выполняет с помощью этих простых инструкций - это полный комплекс. Конечно, вы могли бы решить ту же самую проблему используя обьединение, следующего вида ( вывод для этого запроса показывается в Рисунке 11.2 ): SELECT * FROM Customers first, Orders second WHERE first.cnum = second.cnum AND second.odate = 10/03/1990; Обратите внимание что Cisneros был выбран дважды, по одному разу для каждого порядка который он имел для данной даты. Мы могли бы устранить это используя SELECT DISTINCT вместо просто SELECT. Но это необяза- тельно в варианте подзапроса. Оператор IN, используемый в варианте подзапроса, не делает никакого различия между значениями которые выби- раются подзапросом один раз и значениями которые выбираются неоднок- ратно. Следовательно DISTINCT необязателен. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers first, Orders second | | WHERE first.cnum = second.cnum | | (SELECT COUNT (*) | | FROM Customers | | WHERE snum = main.snum; | | ============================================= | | cnum cname | | ----- -------- | | 1001 Peel | | 1002 Serres | ============================================= Рисунок 11. 2 Использование обьединения вместо соотнесенного подзапроса Предположим что мы хотим видеть имена и номера всех продавцов кото- рые имеют более одного заказчика. Следующий запрос выполнит это для вас ( вывод показывается в Рисунке 11.3 ): SELECT snum, sname FROM Salespeople main WHERE 1 < ( SELECT COUNT (*) FROM Customers WHERE snum = main.snum ); Обратите внимание что предложение FROM подзапроса в этом примере не использует псевдоним. При отсутствии имени таблицы или префикса псев- донима, SQL может для начала принять, что любое поле выводится из таб- лицы с именем указанным в предложении FROM текущего запроса. Если поле с этим именем отсутствует( в нашем случае - snum ) в той таблице, SQL будет проверять внешние запросы. Именно поэтому, префикс имени таблицы обычно необходим в соотнесенных подзапросах - для отмены этого предпо- ложения. Псевдонимы также часто запрашиваются чтобы давать вам возмож- ность ссылаться к той же самой таблице во внутреннем и внешнем запросе без какой-либо неоднозначности. =============== SQL Execution Log ============ | | | SELECT snum sname | | FROM Salespeople main | | WHERE 1 < | | AND second.odate = 10/03/1990; | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ----- | | 2001 Hoffman London 100 1001 | | 2003 Liu San Jose 200 1002 | | 2008 Cisneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 11.3: Нахождение продавцов с многочислеными заказчиками ИСПОЛЬЗОВАНИЕ СООТНЕСЕННЫХ ПОДЗАПРОСОВ ДЛЯ НАХОЖДЕНИЯ ОШИБОК Иногда полезно выполнять запросы которые разработаны специально так чтобы находить ошибки. Это всегда возможно при дефектной информации которую можно ввести в вашу базу данных, и, если она введена, бывает трудно ее определить. Следующий запрос не должен производить никакого вывода. Он просматривает таблицу Порядков чтобы видеть совпадают ли поля snum и cnum в каждой строке таблицы Заказчиков и выводит каждую строку где этого совпадения нет. Другими словами, запрос выясняет, тот ли продавец кредитовал каждую продажу ( он воспринимает поле cnum, как первичный ключ таблицы Заказчиков, который не будет иметь никаких двойных значений в этой таблице ). SELECT * FROM Orders main WHERE NOT snum = ( SELECT snum FROM Customers WHERE cnum = main.cnum ); При использовании механизма справочной целостности ( обсужденного в Главе 19 ), вы можете быть гарантированы от некоторых ошибок такого вида. Этот механизм не всегда доступен, хотя его использование жела- тельно во всех случаях, причем поиск ошибки запроса описанный выше, может быть еще полезнее. СРАВНЕНИЕ ТАБЛИЦЫ С СОБОЙ Вы можете также использовать соотнесенный подзапрос основанный на той же самой таблице что и основной запрос. Это даст вам возможность извлечть определенные сложные формы произведенной информации. Напри- мер, мы можем найти все порядки со значениями сумм приобретений выше среднего для их заказчиков ( вывод показан в Рисунке 11.4 ): SELECT * FROM Orders outer WHERE amt > ( SELECT AVG amt FROM Orders inter WHERE inner.cnum = outer.cnum ); =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders outer | | WHERE amt > | | (SELECT AVG (amt) | | FROM Orders inner | | WHERE inner.cnum = outer.cnum | | =============================================== | | onum amt odate cnum snum | | ----- -------- ---------- ----- ------ | | 3006 1098.19 10/03/1990 2008 1007 | | 3010 1309.00 10/06/1990 2004 1002 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 11.4: Соотнесение таблицы с собой Конечно, в нашей маленькой типовой таблице, где большиство заказчи- ков имеют только один порядок, большинство значений являются одновре- менно средними и следовательно не выбираются. Давайте введем команду другим способом ( вывод показывается в Рисунке 11.5 ): SELECT * FROM Orders outer WHERE amt > = ( SELECT AVG (amt) FROM Orders inner WHERE inner.cnum = outer.cnum ); =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders outer | | WHERE amt > = | | (SELECT AVG (amt) | | FROM Orders inner | | WHERE inner.cnum = outer.cnum); | | =============================================== | | onum amt odate cnum snum | | ----- -------- ---------- ----- ------ | | 3003 767.19 10/03/1990 2001 1001 | | 3002 1900.10 10/03/1990 2007 1004 | | 3005 5160.45 10/03/1990 2003 1002 | | 3006 1098.19 10/03/1990 2008 1007 | | 3009 1713.23 10/04/1990 2002 1003 | | 3010 1309.95 10/06/1990 2004 1002 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 11.5: Выбераются порядки которые > = средней сумме приобрете- ний для их заказчиков. Различие, конечно, в том, что реляционный оператор основного преди- ката включает значения которые равняются среднему ( что обычно означа- ет что они - единственые порядки для данных заказчиков ). СООТНЕСЕННЫЕ ПОДЗАПРОСЫ В ПРЕДЛОЖЕНИИ HAVING Также как предложение HAVING может брать подзапросы, он может брать и соотнесенные подзапросы. Когда вы используете соотнесенный подзапрос в предложении HAVING, вы должны ограничивать внешние ссылки к позициям которые могли бы непосредственно использоваться в самом предложении HAVING. Вы можете вспомнить из Главы 6 что предложение HAVING может использовать только агрегатные функции которые указаны в их предложе- нии SELECT или поля используемые в их предложении GROUP BY. Они явля- ются только внешними ссылками, которые вы можете делать. Все это пото- му, что предикат предложения HAVING оценивается для каждой группы из внешнего запроса, а не для каждой строки. Следовательно, подзапрос бу- дет выполняться один раз для каждой группы выведеной из внешнего зап- роса, а не для каждой строки. Предположим что вы хотите суммировать значения сумм приобретений по- купок из таблицы Порядков, сгруппировав их по датам, удалив все даты где бы SUM не был по крайней мере на 2000.00 выше максимальной ( MAX ) суммы: SELECT odate, SUM (amt) FROM Orders a GROUP BY odate HAVING SUM (amt) > ( SELECT 2000.00 + MAX (amt) FROM Orders b WHERE a.odate = b.odate ); Подзапрос вычисляет значение MAX для всех строк с той же самой датой что и у текущей агрегатной группы основного запроса. Это должно быть выполнено, как и ранее, с испошльзованием предложения WHERE. Сам под- запрос не должен использовать предложения GROUP BY или HAVING. СООТНЕСЕННЫЕ ПОДЗАПРОСЫ И ОБЬЕДИНЕНИЯ Как вы и могли предположить, соотнесенные подзапросы по природе близки к обьединениям - они оба включают проверку каждой строки одной таблицы с каждой строкой другой ( или псевдонимом из той же ) таблицы. Вы найдете что большинство операций которые могут выполняться с одним из них будут также работать и с другим. Однако имеется различие в прикладной программе между ними, такое как вышеупомянутая потребность в использовании DISTINCT с обьединением и его необязательность с подзапросом. Имеются также некоторые вещи кото- рые каждый может делать так, как этого не может другой. Подзапросы, например, могут использовать агрегатную функцию в предикате, делая возможным выполнение операций типа нашего предыдущего примера в кото- ром мы извлекли порядки усредненные для их заказчиков. Обьединения, с другой стороны, могут выводить строки из обеих сравниваемых таблиц, в то время как вывод подзапросов используется только в предикатах внеш- них запросов. Как правило, форма запроса которая кажется наиболее ин- туитивной будет вероятно лучшей в использовании, но при этом хорошо бы знать обе техники для тех ситуаций когда та или иная могут не рабо- тать. ================ РЕЗЮМЕ ================ Вы можете поздравлять себя с овладением большого куска из рассмотре- ных понятий в SQL - соотнесенного подзапроса. Вы видели как соотнесен- ный подзапрос связан с обьединение, а также, как как его можно исполь- зовать с агрегатными функциями и в предложении HAVING. В общем, вы те- перь узнали все типы подзапросов полностью. Следующий шаг - описание некоторых SQL специальных операторов. Они берут подзапросы как аргументы, как это делает IN, но в отличие от IN, они могут использоваться только в подзапросах. Первый из их, представ- ленный в Главе 12, - называется EXISTS. *************** РАБОТА С SQL ************* 1. Напишите команду SELECT использующую соотнесенный подзапрос, кото- рая выберет имена и номера всех заказчиков с максимальными для их городов оценками. 2. Напишите два запроса которые выберут всех продавцов ( по их имени и номеру ) которые в своих городах имеют заказчиков которых они не обслуживают. Один запрос - с использованием обьединения и один - с соотнесенным подзапросом. Которое из решений будет более изящным? ( Подсказка: один из способом это сделать, состоит в том, чтобы на- ходить всех заказчиков не обслуживаемых данным продавцом и опреде- лить, находится ли каждый из них в городе продавца. ) ( См. Приложение A для ответов. ) . 12. ИСПОЛЬЗОВАНИЕ ОПЕРАТОРА EXISTS. ТЕПЕРЬ, КОГДА ВЫ ХОРОШО ОЗНАКОМЛЕНЫ С ПОДЗАПРОСАМИ, мы можем гово- рить о некоторых специальных операторах которые всегда берут подзапро- сы как аргументы. Вы узнаете о первом из их в этой главе. Остальные будут описан в следующей главе. Оператор EXISTS используется чтобы указать предикату, - производить ли подзапросу вывод или нет. В этой главе, вы узнаете как использовать этот оператор со стандартными и ( обычно ) соотнесенными подзапросами. Мы будем также обсуждать специальные расмышления которые перейдут в игру когда вы будете использовать этот оператор как относительный аг- регат, как пустой указатель NULL, и как оператор Буля. Кроме того, вы можете повысить ваш профессиональный уровень относительно подзапросов исследуя их в более сложных прикладных программах чем те которые мы видели до сих пор. ========== КАК РАБОТАЕТ EXISTS? ========== EXISTS - это оператор, который производит верное или неверное значе- ние, другими словами, выражение Буля ( см. Главу 4 для обзора этого термина ). Это означает что он может работать автономно в предикате или в комбинации с другими выражениями Буля использующими Булевы опе- раторы AND, OR, и NOT. Он берет подзапрос как аргумент и оценивает его как верный если тот производит любой вывод или как неверный если тот не делает этого. Этим он отличается от других операторов предиката, в которых1 он не может быть неизвестным. Например, мы можем решить, изв- лекать ли нам некоторые данные из таблицы Заказчиков если, и только если, один или более заказчиков в этой таблице находятсяся в San Jose ( вывод для этого запроса показывается в Рисунке 12.1 ): SELECT cnum, cname, city FROM Customers WHERE EXISTS ( SELECT * FROM Customers WHERE city = " San Jose' ); Внутренний запрос выбирает все данные для всех заказчиков в San Jo- se. Оператор EXISTS во внешнем предикате отмечает, что некоторый вывод был произведен подзапросом, и поскольку выражение EXISTS было полным предикатом, делает предикат верным. Подзапрос( не соотнесенный ) был выполнен только один раз для всего внешнего запроса, и следовательно, =============== SQL Execution Log ============ | | | SELECT snum, sname, city | | FROM Customers | | WHERE EXISTS | | (SELECT * | | FROM Customers | | WHERE city = 'San Jose'); | | ============================================= | | cnum cname city | | ----- -------- ---- | | 2001 Hoffman London | | 2002 Giovanni Rome | | 2003 Liu San Jose | | 2004 Grass Berlin | | 2006 Clemens London | | 2008 Cisneros San Jose | | 2007 Pereira Rome | ============================================= Рисунок 12.1 Использование оператора EXISTS имеет одно значение во всех случаях. Поэтому EXISTS, когда использует- ся этим способом, делает предикат верным или неверным для всех строк сразу, что это не так уж полезно для извлечения определенной информа- ции. ВЫБОР СТОЛБЦОВ С ПОМОЩЬЮ EXISTS В вышеупомянутом примере, EXISTS должен быть установлен так чтобы легко выбрать один столбец, вместо того, чтобы выбирать все столбцы используя в выборе звезду( SELECT *) В этом состоит его отличие от подзапроса который ( как вы видели ранее в Главе 10 мог выбрать только один столбец ) . Однако, в принципе он мало отличается при выборе EXISTS столбцов, или когда выбираются все столбцы, потому что он прос- то замечает - выполняется или нет вывод из подзапроса - а не использу- ет выведенные значения. ИСПОЛЬЗОВАНИЕ EXISTS С СООТНЕСЕННЫМИ ПОДЗАПРОСАМИ В соотнесенном подзапросе, предложение EXISTS оценивается отдельно для каждой строки таблицы имя которой указано во внешнем запросе, точ- но также как и другие операторы предиката, когда вы используете соот- несенный подзапрос. Это дает возможность использовать EXISTS как вер- ный предикат, который генерирует различные ответы для каждой строки таблицы указанной в основном запросе. Следовательно информация из внутреннего запроса, будет сохранена, если выведена непосредственно, когда вы используете EXISTS таким способом. Например, мы можем вывести продавцов которые имеют многочисленых заказчиков ( вывод для этого запроса показывается в Рисунке 12.2 ): SELECT DISTINCT snum FROM Customers outer WHERE EXISTS ( SELECT * FROM Customers inner WHERE inner.snum = outer.snum AND inner.cnum < > outer.cnum ); =============== SQL Execution Log ============ | | | SELECT DISTINCT cnum | | FROM Customers outer | | WHERE EXISTS | | (SELECT * | | FROM Customers inner | | WHERE inner.snum = outer.snum | | AND inner.cnum < > outer.cnum); | | ============================================= | | cnum | | ----- | | 1001 | | 1002 | ============================================= Рисунок 12. 2: Использование EXISTS с соотнесенным подзапросом Для каждой строки-кандидата внешнего запроса ( представляющей заказ- чика проверяемого в настоящее время ), внутренний запрос находит стро- ки которые совпадают со значением поля snum ( которое имел продавец ), но не со значением поля cnum ( сответствующего другим заказчикам ). Если любые такие строки найдены внутренним запросом, это означает, что имеются два разных заказчика обслуживаемых текущим продавцом ( то-есть продавцом заказчика в текущей строке-кандидата из внешнего запроса ). Предикат EXISTS поэтому верен для текущей строки, и номер продавца по- ля (snum) таблицы указанной во внешнем запросе будет выведено. Если был DISTINCT не указан, каждый из этих продавцов будет выбран один раз для каждого заказчика к которому он назначен. КОМБИНАЦИЯ ИЗ EXISTS И ОБЬЕДИНЕНИЯ Однако для нас может быть полезнее вывести больше информации об этих продавцах а не только их номера. Мы можем сделать это объединив табли- цу Заказчиков с таблицей Продавцов ( вывод для запроса показывается в Рисунке 12.3 ): SELECT DISTINCT first.snum, sname, first.city FROM Salespeople first, Customers second WHERE EXISTS ( SELECT * FROM Customers third WHERE second.snum = third.snum AND second.cnum < > third.cnum ) AND first.snum = second.snum; =============== SQL Execution Log ============ | | | SELECT DISTINCT first.snum, sname, first.city | | FROM Salespeople first, Customers second | | WHERE EXISTS | | (SELECT * | | FROM Customers third | | WHERE second.snum = third.snum | | AND second.cnum < > third.cnum) | | AND first.snum = second.snum; | | ============================================= | | cnum cname city | | ----- -------- ---- | | 1001 Peel London | | 1002 Serres San Jose | ============================================= Рисунок 12.3: Комбинация EXISTS с обьединением Внутренний запрос здесь - как и в предыдущем варианте, фактически сообщает, что псевдоним был изменен. Внешний запрос - это обьединение таблицы Продавцов с таблицей Заказчиков, наподобии того что мы видели прежде. Новое предложение основного предиката ( AND first.snum = se- cond.snum ) естественно оценивается на том же самом уровне что и пред- ложение EXISTS. Это - функциональный предикат самого обьединения, сравнивающий две таблицы из внешнего запроса в терминах поля snum, ко- торое являются для них общим. Из-за Булева оператора AND, оба условия основного предиката должны быть верны в порядке для верного предиката. Следовательно, результаты подзапроса имеют смысл только в тех случаях когда вторая часть запроса верна, а обьединение - выполняемо. Таким образом комбинация объединения и подзапроса может стать очень мощным способом обработки данных. ИСПОЛЬЗОВАНИЕ NOT EXISTS Предыдущий пример дал понять что EXISTS может работать в комбинации с операторами Буля. Конечно, то что является самым простым способом для использования и вероятно наиболее часто используется с EXISTS - это оператор NOT. Один из способов которым мы могли бы найти всех про- давцов только с одним заказчиком будет состоять в том, чтобы инверти- ровать наш предыдущий пример. ( Вывод для этого запроса показывается в Рисунке 12.4:) SELECT DISTINCT snum FROM Customers outer WHERE NOT EXISTS ( SELECT * FROM Customers inner WHERE inner.snum = outer.snum AND inner.cnum < > outer.cnum ); EXISTS И АГРЕГАТЫ Одна вещь которую EXISTS не может сделать - взять функцию агрегата в подзапросе. Это имеет значение. Если функция агрегата находит любые строки для операций с ними, EXISTS верен, не взирая на то, что это - зна-| чение функции ; если же агрегатная функция не находит никаких строк, EXISTS неправилен. =============== SQL Execution Log ============ | | | SELECT DISTINCT snum | | FROM Salespeople outer | | WHERE NOT EXISTS | | (SELECT * | | FROM Customers inner | | WHERE inner.snum = outer.snum | | AND inner.cnum < > outer.cnum); | | ============================================= | | cnum | | ----- | | 1003 | | 1004 | | 1007 | ============================================= Рисунок 12.4: Использование EXISTS с NOT Попытка использовать агрегаты с EXISTS таким способом, вероятно по- кажет что проблема неверно решалась от начала до конца. Конечно, подзапрос в предикате EXISTS может также использовать один или более из его собственных подзапросов. Они могут иметь любой из различных типов которые мы видели ( или который мы будем видеть ). Та- кие подзапросы, и любые другие в них, позволяют использовать агрегаты, если нет другой причины по которой они не могут быть использованы. Следующий раздел приводит этому пример. В любом случае, вы можете получить тот же самый результат более лег- ко, выбрав поле которое вы использовали в агрегатной функции, вместо использования самой этой функции. Другими словами, предикат - EXISTS (SELECT COUNT (DISTINCT sname) FROM Salespeople) - будет эквивалентен - EXISTS (SELECT sname FROM Salespeople) который был позволен выше. БОЛЕЕ УДАЧНЫЙ ПРИМЕР ПОДЗАПРОСА Возможные прикладные программы подзапросов могут становиться многок- ратно вкладываемыми. Вы можете вкладывать их два или более в одиночный запрос, и даже один внутрь другого. Так как можно рассмотреть неболь- шой кусок чтобы получить всю картину работаты этой команды, вы можете воспользоваться способом в SQL, который может принимать различные ко- манды из большинства других языков. Имеется запрос который извлекает строки всех продавцов которые имеют заказчиков с больше чем одним текущим порядком. Это не обязательно са- мое простое решение этой проблемы, но оно предназначено скорее пока- зать улучшеную логику SQL. Вывод этой информации связывает все три на- ши типовых таблицы: SELECT * FROM Salespeople first WHERE EXISTS ( SELECT * FROM Customers second WHERE first.snum = second.snum AND 1 < ( SELECT COUNT (*) FROM Orders WHERE Orders.cnum = second.cnum )); Вывод для этого запроса показывается в Рисунке 12.5. =============== SQL Execution Log ============ | | | FROM Salespeople first | | WHERE EXISTS | | (SELECT * | | FROM Customers second | | WHERE first.snum = second.snum | | AND 1 < | | (SELECT CONT (*) | | FROM Orders | | WHERE Orders.cnum = second.cnum)); | | ============================================= | | cnum cname city comm | | ----- -------- ---- -------- | | 1001 Peel London 0.17 | | 1002 Serres San Jose 0.13 | | 1007 Rifkin Barselona 0.15 | ============================================= Рисунок 12.5: Использование EXISTS с комплексным подзапросом Мы могли бы разобрать вышеупомянутый запрос примерно так: Берем каждую строку таблицы Продавцов как строку-кандидат( внешний запрос ) и выполняем подзапросы. Для каждой строки-кандидата из внеш- него запроса, берем в соответствие каждую строку из таблицы Заказчи- ков( средний запрос ). Если текущая строка заказчиков не совпадает с текущей строкой продавца( т.е. если first.snum < > second.snum ), пре- дикат среднего запроса неправилен. Всякий раз, когда мы находим заказ- чика в среднем запросе который совдает с продавцом во внешнем запросе, мы должны рассматривать сам внутренний запрос чтобы определить, будет ли наш средний предикат запроса верен. Внутренний запрос считает число порядков текущего заказчика ( из среднего запроса ). Если это число больший чем 1, предикат среднего запроса верен, и строки выбираются. Это делает EXISTS предикат внешнего запроса верным для текущей строки продавца, и означает, что по крайней мере один из текущих заказчиков продавца имеет более чем один порядок. Если это не кажется достаточно понятным для вас в этой точке разбора примера, не волнуйтесь. Сложность этого примера - хороша независимо от того, как часто будете Вы использовать ее в деловой ситуации. Основная цель примеров такого типа состоит в том, чтобы показать вам некоторые возможности которые могут оказаться в дальнейшем полезными. После ра- боты со сложными ситуациями подобно этой, простые запросы которые яв- ляются наиболее часто используемыми в SQL, покажутся Вам элементарны- ми. Кроме того, этот запрос, даже если он кажется удобным, довольно из- вилистый способ извлечения информации и делает много работы. Он связы- вает три разных таблицы чтобы дать вам эту информацию, а если таблиц больше чем здесь указано, будет трудно получить ее напрямую (хотя это не единственный способ, и не обязательно лучший способ в SQL). Возмож- но вам нужно увидеть эту информацию относительно регулярной основы - если, например, вы имеете премию в конце недели для продавца который получил многочисленые порядки от одного заказчика. В этом случае, он должен был бы вывести команду, и сохранять ее чтобы использовать снова и снова по мере того как данные будут меняться ( лучше всего сделать это с помощью представления, которое мы будем проходить в Главе 20 ). ================ РЕЗЮМЕ ================ EXISTS, хотя он и кажется простым, может быть одним из самых непо- нятных операторов SQL. Однако, он облажает гибкостью и мощностью. В этой главе, вы видели и овладели большинством возможностей которые EXISTS дает вам. В дальнейшем, ваше понимание улучшеной логики подзап- роса расширится значительно. Следующим шагом будет овладение тремя другими специальными операто- рами которые берут подзапросы как аргументы, это - ANY, ALL, и SOME. Как вы увидете в Главе 13, это - альтернативные формулировки некоторых вещей которые вы уже использовали, но которые в некоторых случаях, мо- гут оказаться более предпочтительными. ************** РАБОТА С SQL ************** 1. Напишите запрос который бы использовал оператор EXISTS для извлече- ния всех продавцов которые имеют заказчиков с оценкой 300. 2. Как бы вы решили предыдущую проблему используя обьединение ? 3. Напишите запрос использующий оператор EXISTS который выберет всех продавцов с заказчиками размещенными в их городах которые ими не обслуживаются. 4. Напишите запрос который извлекал бы из таблицы Заказчиков каждого заказчика назначенного к продавцу который в данный момент имеет по крайней мере еще одного заказчика ( кроме заказчика которого вы вы- берете ) с порядками в таблице Порядков ( подсказка: это может быть похоже на структуру в примере с нашим трех-уровневым подзапросом ). ( См. Приложение A для ответов. ) . 13. ИСПОЛЬЗОВАНИЕ ОПЕРАТОРОВ ANY, ALL, И SOME. ТЕПЕРЬ, КОГДА ВЫ ОВЛАДЕЛИ ОПЕРАТОРОМ EXISTS, Вы узнаете приблизи- тельно три специальных оператора ориентируемых на подзапросы. (Факти- чески, имеются только два, так как ANY и SOME - одно и то же.) Если вы поймете работу этих операторов, вы будете понимать все типы подзапро- сов предиката используемых в SQL . Кроме того, вы будете представлены различным способам где данный запрос может быть сформирован используя различные типы подзапросов предиката, и вы поймете преимущества и не- достатки каждого из этих подходов. ANY, ALL, и SOME напоминают EXISTS который воспринимает подзапросы как аргументы; однако они отличаются от EXISTS тем, что используются совместно с реляционными операторами. В этом отношении, они напоминают оператор IN когда тот используется с подзапросами; они берут все зна- чения выведенные подзапросом и обрабатывают их как модуль. Однако, в отличие от IN, они могут использоваться только с подзапросами. ========= СПЕЦИАЛЬНЫЕ ОПЕРАТОРЫ ============ ANY или SOME Операторы SOME и ANY - взаимозаменяемы везде и там где мы используем ANY, SOME будет работать точно так же. Различие в терминологии состоит в том чтобы позволить людям использовать тот термин который наиболее однозначен. Это может создать проблему; потому что, как мы это увидим, наша интуиция может иногда вводить в заблуждение. Имеется новый способ нахождения продавца с заказчиками размещенными в их городах ( вывод для этого запроса показывается в Рисунке 13.1 ): SELECT * FROM Salespeople WHERE city = ANY (SELECT city FROM Customers ); Оператор ANY берет все значения выведенные подзапросом, ( для этого случая - это все значения city в таблице Заказчиков ), и оценивает их как верные если любой(ANY) из их равняется значению города текущей строки внешнего запроса. =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople | | WHERE city = ANY | | (SELECT city | | FROM Customers); | | ============================================= | | cnum cname city comm | | ----- -------- ---- -------- | | 1001 Peel London 0.12 | | 1002 Serres San Jose 0.13 | | 1004 Motika London 0.11 | ============================================= Рисунок 13. 1: Использование оператора ANY Это означает, что подзапрос должен выбирать значения такого же типа как и те, которые сравниваются в основном предикате. В этом его отли- чие от EXISTS, который просто определяет, производит ли подзапрос ре- зультаты или нет, и фактически не использует эти результаты. ИСПОЛЬЗОВАНИЕ ОПЕРАТОРОВ IN ИЛИ EXISTS ВМЕСТО ОПЕРАТОРА ANY Мы можем также использовать оператор IN чтобы создать запрос анало- гичный предыдущему : SELECT * FROM Salespeople WHERE city IN ( SELECT city FROM Customers ); Этот запрос будет производить вывод показанный в Рисунке 13.2. Однако, оператор ANY может использовать другие реляционные операторы кроме равняется ( = ), и таким образом делать сравнения которые явля- ются выше возможностей IN. Например, мы могли бы найти всех продавцов с их заказчиками которые следуют им в алфавитном порядке ( вывод пока- зан на Рисунке 13.3) SELECT * FROM Salespeople WHERE sname < ANY ( SELECT cname FROM Customers); =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople | | WHERE city IN | | (SELECT city | | FROM Customers); | | ============================================= | | cnum cname city comm | | ----- -------- ---- -------- | | 1001 Peel London 0.12 | | 1002 Serres San Jose 0.13 | | 1004 Motika London 0.11 | ============================================= Рисунок 13. 2: Использование IN в качестве альтернативы к ANY =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople | | WHERE sname < ANY | | (SELECT cname | | FROM Customers); | | ============================================= | | cnum cname city comm | | ----- -------- ---- -------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1003 Axelrod New York 0.10 | ============================================= Рисунок 13. 3: Использование оператора ANY с оператором "неравно" (<) продавцов для их заказчиков которые упорядоченны в алфавитном порядке ( вывод показан на Рисунке 13.3) SELECT * FROM Salespeople WHERE sname < ANY ( SELECT cname FROM Customers); Все строки были выбраны для Serres и Rifkin, потому что нет других за- казчиков чьи имена следовали бы за ими в алфавитном порядке. Обратите внимание что это является d основнjм эквивалентом следую- щему запросу с EXISTS, чей вывод показывается в Рисунке 13.4: SELECT * FROM Salespeople outer WHERE EXISTS ( SELECT * FROM Customers inner WHERE outer.sname < inner.cname ); =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople outer | | WHERE EXISTS | | (SELECT * | | FROM Customers inner | | WHERE outer.sname < inner.cname); | | ============================================= | | cnum cname city comm | | ----- -------- ---- -------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1003 Axelrod New York 0.10 | ============================================= Рисунок 13.4 Использование EXISTS как альтернатива оператору ANY Любой запрос который может быть сформулирован с ANY ( или, как мы увидим, с ALL ), мог быть также сформулирован с EXISTS, хотя наоборот будет неверно. Строго говоря, вариант с EXISTS не абсолютно идентичен вариантам с ANY или с ALL из-за различия в том как обрабатываются пус- тые( NULL ) значения ( что будет обсуждаться позже в этой главе ). Тем ни менее, с технической точки зрения, вы могли бы делать это без ANY и ALL если бы вы стали очень находчивы в использовании EXISTS ( и IS NULL ). Большинство пользователей, однако, находят ANY и ALL более удобными в использовании чем EXISTS, который требует соотнесенных подзапросов. Кроме того, в зависимости от реализации, ANY и ALL могут, по крайней мере в теории, быть более эффективными чем EXISTS. Подзапросы ANY или ALL могут выполняться один раз и иметь вывод используемый чтобы опре- делять предикат для каждой строки основного запроса. EXISTS, с другой стороны, берет соотнесенный подзапрос, который требует чтобы весь под- запрос повторно выполнялся для каждой строки основного запроса. SQL пытается найти наиболее эффективный способ выполнения любой команды, и может попробовать преобразовать менее эффективную формулу запроса в более эффективную (но вы не можете всегда рассчитывать на получение самой эффективной формулировки ). Основная причина для формулировки EXISTS как альтернативы ANY и ALL в том что ANY и ALL могут быть несколько неоднозначен, из-за способа использования этого термина в Английском языке, как вы это скоро уви- дите. С приходом понимания различия способов формулирования данного запроса, вы сможете поработать над процедурами которые сейчас кажутся Вам трудными или неудобными. КАК ANY МОЖЕТ СТАТЬ НЕОДНОЗНАЧНЫМ Как подразумевалось выше, ANY не полностью однозначен. Если мы соз- даем запрос чтобы выбрать заказчиков которые имеют больший рейтинг чем любой заказчик в Риме, мы можем получить вывод который несколько отли- чался бы от того что мы ожидали ( как показано в Рисунке 13.5 ): SELECT * FROM Customers WHERE rating > ANY ( SELECT rating FROM Customers WHERE city = Rome ); В английском языке, способ которым мы обычно склонны интерпретиро- вать оценку " больше чем любой ( где city = Rome ) " , должен вам со- общить что это значение оценки должно быть выше чем значение оценки в каждом случае где значение city = Rome. Однако это не так, в случае ANY - используемом в SQL . ANY оценивает как верно, если подзапрос на- ходит любое значение которое делает условие верным. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating > ANY | | (SELECT rating | | FROM Customers | | WHERE city = 'Rome'); | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ------ | | 2002 Giovanni Rome 200 1003 | | 2003 Liu San Jose 200 1002 | | 2004 Grass Berlin 300 1002 | | 2008 Cisneros San Jose 300 1007 | ============================================= Рисунок 13.5 Как оператор "больше чем" (>) интерпретируется ANY Если мы оценим ANY способом использующим грамматику Английского Язы- ка, то только заказчики с оценкой 300 будут превышать Giovanni, кото- рый находится в Риме и имеет оценку 200. Однако, подзапрос ANY также находит Periera в Риме с оценкой 100. Так как все заказчики с оценкой 200 были выше этой, они будут выбраны, даже если имелся другой заказ- чик из Рима(Giovanni) чья оценка не была выше ( фактически, то что один из выбранных заказчиков также находится в Риме несущественно). Так как подзапрос произвел по крайней мере одно значение которое сде- лает предикат верным в отношении этих строк, строки были выбраны. Что- бы дать другой пример, предположим что мы должны были выбирать все по- рядки сумм приоретений которые были больше чем по крайней мере один из порядков на 6-е Октября: SELECT * FROM Orders WHERE amt > ANY ( SELECT amt FROM Orders WHERE odate = 10/06/1990 ); Вывод для этого запроса показывается в Рисунке 13.6. Даже если самая высокая сумма приобретений в таблице (9891.88) - имелась на 6-е Октября, предыдущая строка имеет более высокое значение суммы чем другая строка на 6-е Октября, которая имела значение суммы = 1309.95. Имея реляционный оператор ">=" вместо просто " > ", эта стро- ка будет также выбирана, потому что она равна самой себе. Конечно, вы можете использовать ANY с другой SQL техникой, например с техникой обьединения. Этот запрос будет находить все порядки со зна- чением суммы меньшей чем значение любой суммы для заказчика в San Jo- se (вывод показывается в Рисунке 13.7): SELECT * FROM Orders WHERE amt < ANY ( SELECT amt FROM Orders A, Customers b WHERE a.cnum = b.cnum AND b.city = " San Jose' ); Даже если нименьший порядок в таблице был для заказчика из San Jose, то был второй наибольший; следовательно почти все строки будут выбра- ны. Простой способ запомнить, что < ANY значение меньшее чем наиболь- шее выбранное значение, а > ANY значение большее чем наименьшее выб- ранное значение. =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE amt > ANY | | (SELECT amt | | FROM Orders | | WHERE odate = 10/06/1990); | | =============================================== | | onum amt odate cnum snum | | ----- -------- ---------- ----- ------ | | 3002 1900.10 10/03/1990 2007 1004 | | 3005 5160.45 10/03/1990 2003 1002 | | 3009 1713.23 10/04/1990 2002 1003 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 13. 6: Выбранное значение больше чем любое(ANY) на 6-е Октября =============== SQL Execution Log ============== | | | WHERE amt > ANY | | (SELECT amt | | FROM Orders a, Customers b | | WHERE a.cnum = b.cnum | | AND b.city = 'San Jose'); | | =============================================== | | onum amt odate cnum snum | | ----- -------- ---------- ----- ------ | | 3001 18.69 10/03/1990 2008 1007 | | 3003 767.10 10/03/1990 2001 1001 | | 3002 1900.10 10/03/1990 2007 1004 | | 3006 1098.10 10/03/1990 2008 1007 | | 3009 1713.23 10/04/1990 2002 1003 | | 3007 75.10 10/04/1990 2004 1002 | | 3008 4723.00 10/05/1990 2006 1001 | | 3010 1309.88 10/06/1990 2004 1002 | ================================================ Рисунок 13. 7: Использование ANY с объединением Фактически, вышеуказанные команды весьма похожи на следующее - (вы- вод показан на Рисунке 13.8) : SELECT * FROM Orders WHERE amt < ( SELECT MAX amt FROM Orders A, Customers b WHERE a.cnum = b.cnum AND b.city = " San Jose' ); =============== SQL Execution Log ============== | | | WHERE amt < | | (SELECT MAX (amt) | | FROM Orders a, Customers b | | WHERE a.cnum = b.cnum | | AND b.city = 'San Jose'); | | =============================================== | | onum amt odate cnum snum | | ----- -------- ---------- ----- ------ | | 3002 1900.10 10/03/1990 2007 1004 | | 3005 5160.45 10/03/1990 2003 1002 | | 3009 1713.23 10/04/1990 2002 1003 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 13.8: Использование агрегатной функции вместо ANY ========= СПЕЦИАЛЬНЫЙ ОПЕРАТОР ALL ========== С помощью ALL, предикат является верным, если каждое значение выб- ранное подзапросом удовлетворяет условию в предикате внешнего запроса. Если мы хотим пересмотреть наш предыдущий пример чтобы вывести только тех заказчиков чьи оценки, фактически, выше чем у каждого заказчика в Париже, мы можем ввести следующее чтобы произвести вывод показанный в Рисунке 13.9: SELECT * FROM Customers WHERE rating > ALL (SELECT rating FROM Customers WHERE city = Rome ): =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating > ALL | | (SELECT rating | | FROM Customers | | WHERE city = 'Rome'); | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ------ | | 2004 Grass Berlin 300 1002 | | 2008 Cisneros San Jose 300 1007 | ============================================= Рисунок 13.9: Использование оператора ALL Этот оператор проверяет значения оценки всех заказчиков в Риме. За- тем он находит заказчиков с оценкой большей чем у любого из заказчиков в Риме. Самая высокая оценка в Риме - у Giovanni( 200 ). Следователь- но, выбираются только значения выше этих 200. Как и в случае с ANY, мы можем использовать EXISTS для производства альтернативной формулировки такого же запроса - ( вывод показан на Ри- сунке 13.10 ): SELECT * FROM Customers outer WHERE NOT EXISTS ( SELECT * FROM Customers inner WHERE outer.rating < = inner.rating AND inner.city = ■Rome■ ); =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers outer | | WHERE NOT EXISTS | | (SELECT * | | FROM Customers inner | | WHERE outer rating = inner.rating | | AND inner.city = 'Rome'); | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ------ | | 2004 Grass Berlin 300 1002 | | 2008 Cisneros San Jose 300 1007 | ============================================= Рисунок 13.10: Использование EXISTS в качестве альтернативы к ALL РАВЕНСТВА И НЕРАВЕНСТВА ALL используется в основном с неравенствами чем с равенствами, так как значение может быть "равным для всех" результатом подзапроса толь- ко если все результаты, фактически, идентичны. Посмотрите следующий запрос: SELECT * FROM Customers WHERE rating = ALL ( SELECT rating FROM Customers WHERE city = " San Jose' ); Эта команда допустима, но , c этими данными, мы не получим никакого вывода. Только в единственом случае вывод будет выдан этим запросом - если все значения оценки в San Jose окажутся идентичными. В этом слу- чае, можно сказать следующее : SELECT * FROM Customers WHERE rating = ( SELECT DISTINCT rating FROM Customers WHERE city = " San Jose' ); Основное различие в том, что эта последняя команда должна потерпеть неудачу если подзапрос выведет много значений, в то время как вариант с ALL просто не даст никакого вывода. В общем, не самая удачная идея использовать запросы которые работают только в определенных ситуациях подобно этой. Так как ваша база данных будет постоянно меняться, это неудачный способ, чтобы узнать о ее содержании. Однако, ALL может бо- лее эффективно использоваться с неравенствами, то есть с оператором "< >". Но учтите что сказанное в SQL что - значение которое не равняется всем результатам подзапроса, - будет отличаться от того же но сказан- ного с учетом граматики Английского языка. Очевидно, если подзапрос возвращает много различных значений, как это обычно бывает, ни одно отдельное значение не может быть равно им всем в обычном смысле. В SQL, выражение - < > ALL - в действительности соответствует " не равен любому " результату подзапроса. Другими словами, предикат верен, если данное значение не найдено среди результатов подзапроса. Следователь- но, наш предыдущий пример противоположен по смыслу этому примеру (с выводом показанным в Рисунке 13.11): SELECT * FROM Customers WHERE rating < > ALL ( SELECT rating FROM Customers WHERE city = " San Jose' ); =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating < > ALL | | (SELECT rating | | FROM Customers | | WHERE city = 'San Jose'); | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 13.11: Использование ALL с < > Вышеупомянутый подзапрос выберает все оценки для города San Jose. Он выводит набор из двух значений: 200 ( для Liu ) и 300 (для Cisneros). Затем, основной запрос, выбирает все строки, с оценкой не совпадающей ни с одной из них - другими словами все строки с оценкой 100. Вы може- те сформулировать тот же самый запрос используя оператор NOT IN: SELECT* FROM Customers WHERE rating NOT IN ( SELECT rating FROM Customers WHERE city = " San Jose' ); Вы могли бы также использовать оператор ANY: SELECT * FROM Customers WHERE NOT rating = ANY ( SELECT rating FROM Customers WHERE city = " San Jose' ); Вывод будет одинаков для всех трех условий. ПРАВИЛЬНОЕ ПОНИМАНИЕ ANY И ALL В SQL, сказать что - значение больше( или меньше ) чем любое(ANY) из набора значений - тоже самое что сказать, что оно больше( или меньше ) чем любое одно отдельное из этих значений. И наоборот, сказать что значение не равно всему(ALL) набору значений, тоже что сказать, что нет такого значения в наборе которому оно равно. КАК ANY, ALL, И EXIST ПОСТУПАЮТ ======= С ОТСУТСТВУЮЩИМИ И ======= НЕИЗВЕСТНЫМИ ДАННЫМИ Как было сказано, имеются некоторые различия между EXISTS и операто- рами представленными в этой главе относительно того как они обрабаты- вают оператор NULL. ANY и ALL также отличаются друг от друга тем как они реагируют если подзапрос не произвел никаких значений чтобы ис- пользовать их в сравнении. Эти различия могут привести к непредвиден- ным результатам на Ваши запросы если вы не будете их учитывать. КОГДА ПОДЗАПРОС ВОЗВРАЩАЕТСЯ ПУСТЫМ Одно значительное различие между ALL и ANY - способ действия в cиту- ации когда подзапрос не возвращает никаких значений. В принципе, вся- кий раз, когда допустимый подзапрос не в состоянии сделать вывод, ALL - автоматически верен, а ANY автоматически неправилен. Это означает, что следующий запрос SELECT * FROM Customers WHERE rating > ANY ( SELECT rating FROM Customers WHERE city = Boston ); не произведет никакого вывода, в то время как запрос - SELECT FROM Customers WHERE rating > ALL ( SELECT rating FROM Customers WHERE city = 'Boston' ); выведет всю таблицу Заказчиков. Когда нет никаких заказчиков в Boston, естественно, ни одно из этих сравнений не имеет значення. ANY И ALL ВМЕСТО EXISTS С ПУСТЫМ УКАЗАТЕЛЕМ( NULL ) Значения NULL также имеют некоторые проблемы с операторами наподобие этих. Когда SQL сравнивает два значения в предикате, одно из которых пустое (NULL), то результат неизвестен ( смотрите Главу 5 ). Неизвест- ный предикат, подобен неверному и является причиной того что строка не выбирается, но работать он будет иначе в некоторых похожих запросах, в зависимости от того, используют они ALL или ANY вместо EXISTS. Расс- мотрим наш предыдущий пример: SELECT * FROM Customers WHERE rating > ANY ( SELECT rating FROM Customers WHERE city = 'Rome' ); и еще один пример: SELECT * FROM Customers outer WHERE EXISTS ( SELECT * FROM Customers inner WHERE outer.rating > inner.rating AND inner.city = 'Rome' ); В общем, эти два запроса будут вести себя одинаково. Но предположим, что появилось пустое(NULL) значение в столбце rating таблицы Заказчи- ков: CNUM CNAME CITY RATING SNUM 2003 Liu SanJose NULL 1002 В варианте с ANY, где оценка Liu выбрана основным запросом, значение NULL делает предикат неизвестным а строка Liu не выбирается для выво- да. Однако, в варианте с NOT EXISTS когда эта строка выбрана основным запросом, значение NULL используется в предикате подзапроса, делая его неизвестным в каждом случае. Это означает что подзапрос не будет про- изводить никаких значений, и EXISTS будет неправилен. Это, естествен- но, делает оператор NOT EXISTS верным. Следовательно, строка Liu будет выбрана для вывода. Это основное расхождение, в отличие от других ти- пов предикатов, где значение EXISTS независимо от того верно оно или нет - всегда неизвестно. Все это является аргументом в пользу исполь- зования варианта формулировки с ANY. Мы не считаем что значение NULL является выше чем допустимое значение. Более того, результат будет тот же, если мы будем проверять для более низкого значения. ИСПОЛЬЗОВАНИЕ COUNT ВМЕСТО EXISTS Подчеркнем, что все формулировки с ANY и ALL могут быть в точности выполнены с EXISTS, в то время как наоборот будет неверно. Хотя в этом случае, также верно и то что EXISTS и NOT EXISTS подзапросы могут об- манывать при выполнении тех же самых подзапросов с COUNT(*) в предло- жения SELECT подзапроса. Если больше чем ноль строк выводе будет подс- читано, это эквивалентно EXISTS; в противном случае это работает также как NOT EXISTS. Следующее является этому примером (вывод показывается в Рисунке 13.12 ): SELECT * FROM Customers outer WHERE NOT EXISTS ( SELECT * FROM Customers inner WHERE outer.rating < = inner.rating AND inner.city = 'Rome' ); =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers outer | | WHERE NOT EXISTS | | (SELECT * | | FROM Customers inner | | WHERE outer.rating <= inner.rating | | AND inner.city = 'Rome'); | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ------ | | 2004 Grass Berlin 300 1002 | | 2008 Cisneros San Jose 300 1007 | ============================================= Рисунок 13.12: Использование EXISTS с соотнесенным подзапросом Это должно также быть выполнено как SELECT * FROM Customers outer WHERE 1 > ( SELECT COUNT (*) FROM Customers inner WHERE outer.rating < = inner.rating AND inner.city = 'Rome' ); Вывод к этому запросу показывается в Рисунке 13.13. Теперь Вы начинаете понимать сколько способов имеется в SQL. Если это все кажется несколько путанным на этой стадии, нет причины волно- ваться. Вы обучаетесь чтобы использовать ту технику которая лучше все- го отвечает вашим требованиям и наиболее понятна для вас. Начиная с этого места, мы хотим показать Вам большое количество возможностей, что бы вы могли найти ваш собственный стиль. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers outer | | WHERE 1 > | | (SELECT COUNT (*) | | FROM Customers inner | | WHERE outer.rating <= inner.rating | | AND inner.city = 'Rome'); | | ============================================= | | cnum cname city rating snum | | ----- -------- ---- ------ ------ | | 2004 Grass Berlin 300 1002 | | 2008 Cisneros San Jose 300 1007 | ============================================= Рисунок 13.13: Использование COUNT вместо EXISTS ============== РЕЗЮМЕ ================ Итак, вы прошли много чего в этой главе. Подзапросы не простая тема, и мы потратили много время чтобы показать их разновидности и неодноз- начности. То чему Вы теперь научились, вещи достаточно глубокие. Вы знаете несколько технических решений одной проблемы, и поэтому вы мо- жете выбрать то которое более подходит вашим целям. Кроме того, вы по- няли, как различные формулировки будет обрабатывать пустые значения (NULL) и ошибки. Теперь, когда вы полностью изучили запросы, наиболее важный, и веро- ятно наиболее сложный, аспект SQL, объем другого материала будет отно- сительно прост для понимания. Мы имеем еще одну главу о запросах, которая покажет вам как объеди- нить выводы любого числа запросов в единое тело, с помощью формирова- ния объединения многочисленых запросов используя оператор UNION. ************** РАБОТА С SQL ************** 1. Напишите запрос который бы выбирал всех заказчиков чьи оценки равны или больше чем любая( ANY ) оценка заказчика Serres. 2. Что будет выведено вышеупомянутой командой? 3. Напишите запрос использующий ANY или ALL, который бы находил всех продавцов которые не имеют никаких заказчиков размещенных в их го- роде. 4. Напишите запрос который бы выбирал все порядки с суммой больше чем любая ( в обычном смысле ) для заказчиков в Лондоне. 5. Напишите предыдущий запрос с использованием - MAX. ( См. Приложение A для ответов. ) .