Y 11x что является в данной функциональной зависимости зависимой переменной

Функция. Зависимые и независимые переменные. Область определения и область значений функции.

теория по математике 📈 функции

Определение понятия функции. Переменные.

Зависимость переменной у от переменной х, при которой любому значению переменной х соответствует единственное значение переменной у, называют функцией.

Ключевое слово, которое нужно запомнить в определении функции – это зависимость.

Например, человек идет на деловую встречу, но чувствует, что он опаздывает. Он ускоряет свой шаг, потому что от его скорости зависит время. Чем быстрее он двигается, тем меньше времени уйдет у него на дорогу. То есть время зависит от скорости.

Или, например, спортсмен метает ядро на дальнее расстояние. Чем сильнее будет бросок, тем дальше полетит ядро. Скорость полета зависит от силы толчка. Здесь опять прослеживается зависимость.

Например, функция задана формулой у = – 3х 2 – 7. Равносильная ей запись такая: f(x)= – 3х 2 – 7.

Области определения и значения функции

Все возможные значения независимой переменной (х) называют областью определения функции.

Все значения, которые принимает зависимая переменная (у) называют областью значений функции.

Если какая-либо функция у=f(x) задана формулой, а при этом ее область определения не указана, то считается, что она состоит из любых значений переменной, при которых выражение имеет смысл.

Области определения и значений школьных функций

1. Для линейной функции областью определения будет являться любое число.

Если у такой функции k≠0, то областью ее значений также будет являться любое число.

При k=0 область значений этой функции состоит из единственного числа b.

Например, функция задана формулой у = 7. Тогда ее область значения — это число 7, а область определения – любое число.

2. Гипербола задается формулой вида y = k/x.

Область определения такой функции – любое число, кроме нуля.

Область значений такой функции – аналогичная.

3. Функция, заданная формулой y= |x|, имеет область определения – любое число.

4. У функций у = х 2 и у = х 3 область определения – любое число.

Для того чтобы понимать, как находится область определения функции и рассмотреть примеры заданий на нахождение области определения функции, вспомним правила, при которых существуют ограничения и выражение не имеет смысл: нельзя делить на нуль; нельзя извлекать квадратный корень из отрицательного числа.

Пример 3. Рассмотрим, как находится область определения функций, которые заданы следующими формулами:

В знаменателе этого выражения содержится переменная х, поэтому надо проверить, при каком значении он может быть равным нулю и исключить это значение из области определения, так как на знаменатель делят, а на нуль делить нельзя.

Итак, имеем знаменатель х + 11. Приравниваем его к нулю, получаем х + 11 = 0. Решаем простое уравнение на нахождение неизвестного слагаемого и получаем х= – 11. Это число исключаем из области определения функции.

Ответ: (1) и (2) – множество всех чисел; (3) – любое число, кроме (-11) или х ≠ – 11; (4) х ≥0.

Источник

Y 11x что является в данной функциональной зависимости зависимой переменной. userinfo v8. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-userinfo v8. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка userinfo v8mishin05

У ДВУХ математических действий дифференцирования: по частному и по полному дифференциалам

должны быть и ДВА обратных действия интегрирования: с константой интегрирования и без константы!

Y 11x что является в данной функциональной зависимости зависимой переменной. 529438 600. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-529438 600. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 529438 600

Рассмотрим две числовые функции.

Для этого понадобятся две произвольные переменные. Обозначм их двумя буквами латинского алфавита. Можно любыми иными значками. Важно, чтобы эти знчки идентифицировались однозначно. Различные буквы означают различные переменные. Одинаковыыми буквами различные переменные обозначаться не могут, иначе такое обозначение приведет к логическому абсурду.

Итак, для удобства восприятия обозначим эти переменные буквами «икс»: x и «игрек»: y

Далее, необходимо выбрать для этих двух переменных функционал: правило (закон, алгоритм), которое будет устанавливать однозначную связь между значениями этих двух переменных.

Так как переменных две, то существуют два варианта функциональной зависимости. Либо переменная x принимает любые произвольные значения и, в зависимости от них, по заданному алгоритму (правилу), переменная y вынуждена принимать зависимые значения. Либо переменная y принимает свои значения произвольно, а переменная «x» вынуждена принимать свои значения в соответствии с установленным правилом (законом, алгоритмом).

Что я имею ввиду? Покажу схематично на конкретном примере:

Почему? Потому, что в учебниках отсутствует фраза: «функциональная зависимость двух переменных» при указании на выражение y = f(x). Изображены пять символов для визуализации данного математического объекта:

— латинская буква «игрек»;
— знак равенства;
— латинская буква «икс»;
— латинская буква «эф»
— скобки.
Я уже давал трактовку этих составных объектов общего выражения, за исключением знака равенства.
Функцией является зависимая переменная, которая записывается без скобок.

Итак, из двух переменных можно составить две функциональные зависимости при взаимообратных функционалах. То есть, любую аналитическую запись зависимости, в которой одна переменная выражена через другую, можно записать математически тождественно, изменив зависимость на обратную. Например: y = x 2 ; x = √y

Из одной переменной функциональную зависимость составить невозможно. У ребенка не может быть только папа или только мама. )))

Источник

Что такое функция?

Y 11x что является в данной функциональной зависимости зависимой переменной. 5fd391250ab9d005138771. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-5fd391250ab9d005138771. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 5fd391250ab9d005138771

7 класс, 11 класс, ЕГЭ/ОГЭ

Понятие функции

Определение функции можно сформулировать по-разному. Рассмотрим несколько вариантов, чтобы усвоить наверняка.

1. Функция — это взаимосвязь между величинами, то есть зависимость одной переменной величины от другой.

Знакомое обозначение y = f (x) как раз и выражает идею такой зависимости одной величины от другой. Величина у зависит от величины х по определенному закону, или правилу, которое обозначается f.

Вывод: меняя х (независимую переменную, или аргумент) — меняем значение у.

2. Функция — это определенное действие над переменной.

Значит, можно взять величину х, как-то над ней поколдовать — и получить соответствующую величину у.

В технической литературе можно встретить такие определения функции для устройств, в которых на вход подается х — на выходе получается у. Схематично это выглядит так:

Y 11x что является в данной функциональной зависимости зависимой переменной. 5fd3915cab3d6391169475. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-5fd3915cab3d6391169475. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 5fd3915cab3d6391169475

В этом значении слово «функция» используют и в далеких от математики областях. Например, так говорят о функциях ноутбука, костей в организме или даже о функциях менеджера в компании. В каждом перечисленном случае речь идет именно о неких действиях.

3. Функция — это соответствие между двумя множествами, причем каждому элементу первого множества соответствует один элемент второго множества. Это самое популярное определение в учебниках по математике.

Например, в функции у = 2х каждому действительному числу х ставит в соответствие число в два раза большее, чем х.

Область определения — множество х, то есть область допустимых значений выражения, которое записано в формуле.

Например, для функции вида

Y 11x что является в данной функциональной зависимости зависимой переменной. 5fd391bcaca36035546399. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-5fd391bcaca36035546399. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 5fd391bcaca36035546399

область определения выглядит так:

И записать это можно так: D (y): х ≠ 0.

Область значений — множество у, то есть это значения, которые может принимать функция.

Например, естественная область значений функции y = x2 — это все числа больше либо равные нулю. Можно записать вот так: Е (у): у ≥ 0.

Для примера рассмотрим соответствие между двумя множествами — человек-владелец странички в инстаграм и сама страничка, у которой есть владелец. Такое соответствие можно назвать взаимно-однозначным — у человека есть страничка, и это можно проверить. И наоборот — по аккаунту в инстаграм можно проверить, кто им владеет.

В математике тоже есть такие взаимно-однозначные функции. Например, линейная функция у = 3х +2. Каждому значению х соответствует одно и только одно значение у. И наоборот — зная у, можно сразу найти х.

Источник

Введение в функциональные зависимости

В этой статье мы поговорим о функциональных зависимостях в базах данных — что это такое, где применяются и какие алгоритмы существуют для их поиска.

Рассматривать функциональные зависимости мы будем в контексте реляционных баз данных. Если говорить совсем грубо, то в таких базах данных информациях хранится в виде таблиц. Далее мы используем приближенные понятия, которые в строгой реляционной теории не являются взаимозаменяемыми: саму таблицу будем называть отношением, столбцы — атрибутами (их множество — схемой отношения), а набор значений строки на подмножестве атрибутов — кортежем.

Y 11x что является в данной функциональной зависимости зависимой переменной. . Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка

Например, в таблице выше, (Benson, M, M organ) является кортежем по атрибутам (Пациент, Пол, Доктор).
Более формально это записывается в следующем виде: Y 11x что является в данной функциональной зависимости зависимой переменной. f94a01496c4cb2d41aa02716572ac992. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-f94a01496c4cb2d41aa02716572ac992. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка f94a01496c4cb2d41aa02716572ac992[Пациент, Пол, Доктор] = (Benson, M, M organ).
Теперь мы можем ввести понятие функциональной зависимости (ФЗ):

Определение 1. Отношение R удовлетворяет ФЗ X → Y (где X, Y ⊆ R) тогда и только тогда, когда для любых кортежей Y 11x что является в данной функциональной зависимости зависимой переменной. f94a01496c4cb2d41aa02716572ac992. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-f94a01496c4cb2d41aa02716572ac992. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка f94a01496c4cb2d41aa02716572ac992, Y 11x что является в данной функциональной зависимости зависимой переменной. 3013d17e0af4b2af14bfb0b9938e9794. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-3013d17e0af4b2af14bfb0b9938e9794. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 3013d17e0af4b2af14bfb0b9938e9794∈ R выполняется: если Y 11x что является в данной функциональной зависимости зависимой переменной. f94a01496c4cb2d41aa02716572ac992. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-f94a01496c4cb2d41aa02716572ac992. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка f94a01496c4cb2d41aa02716572ac992[X] = Y 11x что является в данной функциональной зависимости зависимой переменной. 3013d17e0af4b2af14bfb0b9938e9794. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-3013d17e0af4b2af14bfb0b9938e9794. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 3013d17e0af4b2af14bfb0b9938e9794[X], то Y 11x что является в данной функциональной зависимости зависимой переменной. f94a01496c4cb2d41aa02716572ac992. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-f94a01496c4cb2d41aa02716572ac992. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка f94a01496c4cb2d41aa02716572ac992[Y ] = Y 11x что является в данной функциональной зависимости зависимой переменной. 3013d17e0af4b2af14bfb0b9938e9794. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-3013d17e0af4b2af14bfb0b9938e9794. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 3013d17e0af4b2af14bfb0b9938e9794[Y ]. В таком случае говорят, что X (детерминант, или определяющее множество атрибутов) функционально определяет Y (зависимое множество).

Иными словами, наличие ФЗ X → Y означает, что если мы имеем два кортежа в R и они совпадают по атрибутам X, то они будут совпадать и по атрибутам Y.
А теперь по порядку. Рассмотрим атрибуты Пациент и Пол для которых хотим узнать, есть ли между ними зависимости или нет. Для такого множества атрибутов могут существовать следующие зависимости:

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Таким образом, функциональные зависимости позволяют определить имеющиеся связи между множествами атрибутов таблицы. Отсюда и впредь мы будем рассматривать наиболее интересные связи, а точнее такие X → Y, что они являются:

Y 11x что является в данной функциональной зависимости зависимой переменной. 61a3ff75a8a14a585ac7002cfa27dba1. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-61a3ff75a8a14a585ac7002cfa27dba1. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 61a3ff75a8a14a585ac7002cfa27dba1

Посчитаем ошибку для Доктор → Пациент из примера выше. Имеем два кортежа, значения которых разнятся на атрибуте Пациент, но совпадают на Докторе: Y 11x что является в данной функциональной зависимости зависимой переменной. f94a01496c4cb2d41aa02716572ac992. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-f94a01496c4cb2d41aa02716572ac992. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка f94a01496c4cb2d41aa02716572ac992[Доктор, Пациент] = (Robin, Ellis) и Y 11x что является в данной функциональной зависимости зависимой переменной. 3013d17e0af4b2af14bfb0b9938e9794. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-3013d17e0af4b2af14bfb0b9938e9794. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 3013d17e0af4b2af14bfb0b9938e9794[Доктор, Пациент] = (Robin, Graham). Следуя определению ошибки, мы должны учитывать все конфликтующие пары, а значит таковых будет две: (Y 11x что является в данной функциональной зависимости зависимой переменной. f94a01496c4cb2d41aa02716572ac992. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-f94a01496c4cb2d41aa02716572ac992. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка f94a01496c4cb2d41aa02716572ac992, Y 11x что является в данной функциональной зависимости зависимой переменной. 3013d17e0af4b2af14bfb0b9938e9794. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-3013d17e0af4b2af14bfb0b9938e9794. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 3013d17e0af4b2af14bfb0b9938e9794) и ее инверсия (Y 11x что является в данной функциональной зависимости зависимой переменной. 3013d17e0af4b2af14bfb0b9938e9794. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-3013d17e0af4b2af14bfb0b9938e9794. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 3013d17e0af4b2af14bfb0b9938e9794, Y 11x что является в данной функциональной зависимости зависимой переменной. f94a01496c4cb2d41aa02716572ac992. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-f94a01496c4cb2d41aa02716572ac992. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка f94a01496c4cb2d41aa02716572ac992). Подставим в формулу и получим:

Y 11x что является в данной функциональной зависимости зависимой переменной. c618f7dcebf9f693c851ed5c125b28ac. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-c618f7dcebf9f693c851ed5c125b28ac. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка c618f7dcebf9f693c851ed5c125b28ac

А теперь попытаемся ответить на вопрос: «А зачем оно все?». На самом деле, ФЗ бывают разные. Первый тип — это такие зависимости, которые определяются администратором на этапе проектирования базы данных. Их обычно немного, они строгие, а основное применение — нормализация данных и дизайн схемы отношения.

Второй тип — зависимости, представляющие «скрытые» данные и ранее неизвестные связи между атрибутами. То есть о таких зависимостях не думали в момент проектирования и их находят уже для имеющегося набора данных, чтобы потом на основе множества выявленных ФЗ сделать какие-либо выводы о хранимой информации. Как раз с такими зависимостями мы и работаем. Ими занимается целая область дата майнинга с различными техниками поиска и построенными на их основе алгоритмами. Давайте разбираться, чем могут быть полезны найденные функциональные зависимости (точные или приближенные) в каких-либо данных.

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Сегодня среди основных областей применения зависимостей выделяют очистку данных. Она подразумевает разработку процессов выявления «грязных данных» с последующим их исправлением. Яркими представителями «грязных данных» являются дубликаты, ошибки в данных или опечатки, пропущенные значения, устаревшие данные, лишние пробелы и тому подобное.

Пример ошибки в данных:

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Пример дубликатов в данных:

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Например, мы имеем таблицу и набор ФЗ, которые должны выполняться. Очистка данных в данном случае предполагает изменить данные таким образом, чтобы ФЗ стали верны. При этом число модификаций должно быть минимально (для данной процедуры существуют свои алгоритмы, на которых мы не будем сосредотачивать внимание в данной статье). Ниже приведен пример такого преобразования данных. Слева исходное отношение, в котором, очевидно, не выполняются необходимые ФЗ (красным цветом выделен пример нарушения одной из ФЗ). Справа представлено обновленное отношение, в котором зеленые ячейки показывают измененные значения. После проведения такой процедуры необходимые зависимости стали удерживаться.

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Другой популярной областью применения является дизайн базы данных. Здесь стоит напомнить про нормальные формы и нормализацию. Нормализация — это процесс приведения отношения в соответствие некоторому набору требований, каждый из которых определяется нормальной формой по-своему. Расписывать требования различных нормальных форм мы не станем (это делается в любой книге по курсу БД для начинающих), а лишь заметим, что каждая из них по-своему использует концепцию функциональных зависимостей. Ведь ФЗ по своей сути являются ограничениями целостности, которые учитываются при проектировании базы данных (в контексте этой задачи ФЗ иногда называют суперключами).

Рассмотрим их применение для четырех нормальных форм на картинке ниже. Напомним, что нормальная форма Бойса-Кодда является более строгой, чем третья форма, но при этом менее строгой, чем четвертая. Последнюю пока не рассматриваем, поскольку для ее постановки нужно понимание многозначных зависимостей, которые в данной статье нам не интересны.

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader
Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader
Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader
Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Еще одной областью, в которой зависимости нашли свое применение, является понижение размерности пространства признаков в таких задачах как построение наивного байесовского классификатора, выделение значимых признаков и репараметризация регрессионной модели. В оригинальных статьях эта задача называется определением избыточных признаков (feature redundancy) и релевантных (feature relevancy) [5, 6], и решается она с активным использованием концепций баз данных. С появлением таких работ мы можем говорить, что сегодня наблюдается запрос на решения, позволяющие объединить базу данных, аналитику и реализацию вышеперечисленных проблем оптимизации в один инструмент [7, 8, 9].

Для поиска ФЗ в наборе данных существует множество алгоритмов (как современных, так и не очень).Такие алгоритмы можно разделить на три группы:

Подробнее о данной классификации можно почитать [4]. Ниже представлены примеры алгоритмов на каждый из типов:

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

В настоящее время появляются новые алгоритмы, которые сочетают в себе сразу несколько подходов к поиску функциональных зависимостей. Примерами таких алгоритмов являются Pyro [2] и HyFD [3]. Разбор их работы предполагается в следующих статьях данного цикла. В этой статье мы лишь разберем основные понятия и лемму, которые необходимы для понимания техник выявления зависимостей.

Начнем с простого — difference- и agree-set, используемые во втором типе алгоритмов. Difference-set представляет собой множество кортежей, которые не совпадают по значениям, а agree-set наоборот — кортежи, совпадающие по значениям. Стоить отметить, что в данном случае мы рассматриваем только левую часть зависимости.

Также важным понятием, которое встречалось выше, является алгебраическая решетка. Так как многие современные алгоритмы оперируют данным понятием, нам нужно иметь представление о том, что это такое.

Для того чтобы ввести понятие решетки, необходимо определение частично упорядоченного множества (или partially ordered set, сокращенно — poset).

В качестве простейшего примера частично упорядоченного множества можно взять множество всех натуральных чисел N с обычным отношением порядка ⩽. Нетрудно проверить, что все необходимые аксиомы выполняются.

Более содержательный пример. Рассмотрим множество всех подмножеств <1, 2, 3>, упорядоченное отношением включения ⊆. Действительно, это отношение удовлетворяет всем условиям частичного порядка, поэтому ⟨P (<1, 2, 3>), ⊆⟩ — частично упорядоченное множество. На рисунке ниже изображена структура этого множества: если из одного элемента можно дойти по стрелочкам до другого элемента, то они находятся в отношении порядка.

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Нам потребуются еще два простых определения из области математики — супремум (supremum) и инфимум (infimum).

Определение 3. Пусть ⟨S, ⩽⟩ — частично упорядоченное множество, A ⊆ S. Верхняя граница A — это такой элемент u ∈ S, что ∀x ∈ A: x ⩽ u. Пусть U — множество всех верхних границ A. Если в U существует наименьший элемент, тогда он называется супремумом и обозначается как sup A.

Аналогично вводится понятие точной нижней границы.

Определение 4. Пусть ⟨S, ⩽⟩ — частично упорядоченное множество, A ⊆ S. Нижняя граница A — это такой элемент l ∈ S, что ∀x ∈ A: l ⩽ x. Пусть L — множество всех нижних границ A. Если в L существует наибольший элемент, тогда он называется инфимумом и обозначается как inf A.

Рассмотрим в качестве примера приведенное выше частично упорядоченное множество ⟨P (<1, 2, 3>), ⊆⟩ и найдем в нем супремум и инфимум:

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Теперь можно сформулировать определение алгебраической решетки.

Определение 5. Пусть ⟨P, ⩽⟩ — частично упорядоченное множество, такое что всякое двухэлементное подмножество имеет точные верхнюю и нижнюю границы. Тогда P называется алгебраической решеткой. При этом sup записывают как x ∨ y, а inf — как x ∧ y.

Проверим, что наш рабочий пример ⟨P (<1, 2, 3>), ⊆⟩ является решеткой. Действительно, для всяких a, b ∈ P (<1, 2, 3>), a∨b = a∪b, а a∧b = a∩b. Например, рассмотрим множества <1, 2>и <1, 3>и найдем их инфимум и супремум. Если мы их пересечем, то получим множество <1>, которое и будет являться инфимумом. Супремум же получим их объединением — <1, 2, 3>.

В алгоритмах выявления ФЗ пространство поиска зачастую представляется в форме решетки, где множества из одного элемента (читай первый уровень решетки поиска, где левая часть зависимостей состоит из одного атрибута) являют собой каждый атрибут исходного отношения.
В начале рассматриваются зависимости вида ∅ → Одиночный атрибут. Данный шаг позволяет определить, какие атрибуты являются первичными ключами (для таких атрибутов не бывает детерминантов, а потому левая часть пуста). Далее такие алгоритмы двигаются по решетке вверх. При этом стоит отметить, что решетку можно обходить не всю, то есть если на вход передать желаемый максимальный размер левой части, то дальше уровня с таким размером алгоритм идти не будет.

На рисунке ниже показано, как можно использовать алгебраическую решетку в задаче поиска ФЗ. Здесь каждое ребро (X, XY) представляет собой зависимость X → Y. Например, мы прошли первый уровень и знаем, что удерживается зависимость A → B (отобразим это зеленой связью между вершинами A и B). Значит далее, когда будем продвигаться по решетке вверх, мы можем не проверять зависимость A, C → B, потому что она будет уже не минимальной. Аналогично мы бы не стали ее проверять, если бы удерживалась зависимость C → B.

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader
Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Кроме того, как правило, все современные алгоритмы по поиску ФЗ используют такую структуру данных, как партиция (в первоисточнике — stripped partition [1]). Формальное определение партиции выглядит следующим образом:

Определение 6. Пусть X ⊆ R — набор атрибутов для отношения r. Кластер представляет собой набор индексов кортежей из r, которые имеют одинаковое значение для X, то есть c(t) = . Партиция представляет собой множество кластеров, исключающее кластеры единичной длины:

Y 11x что является в данной функциональной зависимости зависимой переменной. c051de9581916cdf0eeb97592ebf670e. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-c051de9581916cdf0eeb97592ebf670e. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка c051de9581916cdf0eeb97592ebf670e1\>$» data-tex=»display»/>

Простыми словами, партиция для атрибута X представляет собой набор списков, где каждый список содержит номера строк с одинаковыми значениями для X. В современной литературе структура, представляющая партиции, называется position list index (PLI). Кластеры единичной длины исключаются в целях сжатия PLI, потому что это кластеры, содержащие лишь номер записи с уникальным значением, которое всегда будет легко установить.

Рассмотрим пример. Вернемся все к той же таблице с пациентами и построим партиции для столбцов Пациент и Пол (слева появился новый столбец, в котором отмечены номера строк таблицы):

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

При этом, согласно определению, партиция для столбца Пациент на самом деле будет пустая, так как одиночные кластеры исключаются из партиции.

Партиции можно получать по нескольким атрибутам. И для этого существует два пути: пройдясь по таблице, построить партицию сразу по всем необходимым атрибутам, или же построить ее с помощью операции пересечения партиций по подмножеству атрибутов. Алгоритмы поиска ФЗ используют второй вариант.

Простыми словами, чтобы, например, получить партицию по столбцам ABC, можно взять партиции для AC и B (или любой другой набор непересекающихся подмножеств) и пересечь их между собой. Операция пересечения двух партиций выделяет кластеры наибольшей длины, общие для обеих партиций.

Давайте рассмотрим пример:

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

В первом случае мы получили пустую партицию. Если присмотреться к таблице, то действительно, одинаковых значений по двум атрибутам там нет. Если же мы немного модифицируем таблицу (случай справа), то уже получим непустое пересечение. При этом строки 1 и 2 и правда содержат одинаковые значения по атрибутам Пол и Доктор.

Далее нам понадобится такое понятие, как размер партиции. Формально:

Y 11x что является в данной функциональной зависимости зависимой переменной. 9c440a4c132043d8274a3ea163a6f8d5. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-9c440a4c132043d8274a3ea163a6f8d5. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка 9c440a4c132043d8274a3ea163a6f8d51\>|$» data-tex=»display»/>

Проще говоря, размер партиции представляет собой количество кластеров, входящих в партицию (помним, что единичные кластеры в партицию не входят!):

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

Теперь мы можем определить одну из ключевых лемм, которая для заданных партиций позволяет установить, удерживается зависимость или нет:

Лемма 1. Зависимость A, B → C удерживается, если и только если

Y 11x что является в данной функциональной зависимости зависимой переменной. d673e70136b3b482a21409e5744ebeb4. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-d673e70136b3b482a21409e5744ebeb4. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка d673e70136b3b482a21409e5744ebeb4

Согласно лемме, для определения, удерживается ли зависимость, необходимо выполнить четыре шага:

Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader
Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader
Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader
Y 11x что является в данной функциональной зависимости зависимой переменной. image loader. Y 11x что является в данной функциональной зависимости зависимой переменной фото. Y 11x что является в данной функциональной зависимости зависимой переменной-image loader. картинка Y 11x что является в данной функциональной зависимости зависимой переменной. картинка image loader

В данной статье мы разобрали такие понятия, как функциональная зависимость, приближенная функциональная зависимость, рассмотрели, где они применяются, а также какие алгоритмы поиска ФЗ существуют. Также мы подробно разобрали базовые, но важные понятия, активно используемые в современных алгоритмах по поиску ФЗ.

Ссылки на литературу:

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *