Y 11x что является в данной функциональной зависимости зависимой переменной
Функция. Зависимые и независимые переменные. Область определения и область значений функции.
теория по математике 📈 функции
Определение понятия функции. Переменные.
Зависимость переменной у от переменной х, при которой любому значению переменной х соответствует единственное значение переменной у, называют функцией.
Ключевое слово, которое нужно запомнить в определении функции – это зависимость.
Например, человек идет на деловую встречу, но чувствует, что он опаздывает. Он ускоряет свой шаг, потому что от его скорости зависит время. Чем быстрее он двигается, тем меньше времени уйдет у него на дорогу. То есть время зависит от скорости.
Или, например, спортсмен метает ядро на дальнее расстояние. Чем сильнее будет бросок, тем дальше полетит ядро. Скорость полета зависит от силы толчка. Здесь опять прослеживается зависимость.
Например, функция задана формулой у = – 3х 2 – 7. Равносильная ей запись такая: f(x)= – 3х 2 – 7.
Области определения и значения функции
Все возможные значения независимой переменной (х) называют областью определения функции.
Все значения, которые принимает зависимая переменная (у) называют областью значений функции.
Если какая-либо функция у=f(x) задана формулой, а при этом ее область определения не указана, то считается, что она состоит из любых значений переменной, при которых выражение имеет смысл.
Области определения и значений школьных функций
1. Для линейной функции областью определения будет являться любое число.
Если у такой функции k≠0, то областью ее значений также будет являться любое число.
При k=0 область значений этой функции состоит из единственного числа b.
Например, функция задана формулой у = 7. Тогда ее область значения — это число 7, а область определения – любое число.
2. Гипербола задается формулой вида y = k/x.
Область определения такой функции – любое число, кроме нуля.
Область значений такой функции – аналогичная.
3. Функция, заданная формулой y= |x|, имеет область определения – любое число.
4. У функций у = х 2 и у = х 3 область определения – любое число.
Для того чтобы понимать, как находится область определения функции и рассмотреть примеры заданий на нахождение области определения функции, вспомним правила, при которых существуют ограничения и выражение не имеет смысл: нельзя делить на нуль; нельзя извлекать квадратный корень из отрицательного числа.
Пример 3. Рассмотрим, как находится область определения функций, которые заданы следующими формулами:
В знаменателе этого выражения содержится переменная х, поэтому надо проверить, при каком значении он может быть равным нулю и исключить это значение из области определения, так как на знаменатель делят, а на нуль делить нельзя.
Итак, имеем знаменатель х + 11. Приравниваем его к нулю, получаем х + 11 = 0. Решаем простое уравнение на нахождение неизвестного слагаемого и получаем х= – 11. Это число исключаем из области определения функции.
Ответ: (1) и (2) – множество всех чисел; (3) – любое число, кроме (-11) или х ≠ – 11; (4) х ≥0.
mishin05
У ДВУХ математических действий дифференцирования: по частному и по полному дифференциалам
должны быть и ДВА обратных действия интегрирования: с константой интегрирования и без константы!
Рассмотрим две числовые функции.
Для этого понадобятся две произвольные переменные. Обозначм их двумя буквами латинского алфавита. Можно любыми иными значками. Важно, чтобы эти знчки идентифицировались однозначно. Различные буквы означают различные переменные. Одинаковыыми буквами различные переменные обозначаться не могут, иначе такое обозначение приведет к логическому абсурду.
Итак, для удобства восприятия обозначим эти переменные буквами «икс»: x и «игрек»: y
Далее, необходимо выбрать для этих двух переменных функционал: правило (закон, алгоритм), которое будет устанавливать однозначную связь между значениями этих двух переменных.
Так как переменных две, то существуют два варианта функциональной зависимости. Либо переменная x принимает любые произвольные значения и, в зависимости от них, по заданному алгоритму (правилу), переменная y вынуждена принимать зависимые значения. Либо переменная y принимает свои значения произвольно, а переменная «x» вынуждена принимать свои значения в соответствии с установленным правилом (законом, алгоритмом).
Что я имею ввиду? Покажу схематично на конкретном примере:
Почему? Потому, что в учебниках отсутствует фраза: «функциональная зависимость двух переменных» при указании на выражение y = f(x). Изображены пять символов для визуализации данного математического объекта:
— латинская буква «игрек»;
— знак равенства;
— латинская буква «икс»;
— латинская буква «эф»
— скобки.
Я уже давал трактовку этих составных объектов общего выражения, за исключением знака равенства.
Функцией является зависимая переменная, которая записывается без скобок.
Итак, из двух переменных можно составить две функциональные зависимости при взаимообратных функционалах. То есть, любую аналитическую запись зависимости, в которой одна переменная выражена через другую, можно записать математически тождественно, изменив зависимость на обратную. Например: y = x 2 ; x = √y
Из одной переменной функциональную зависимость составить невозможно. У ребенка не может быть только папа или только мама. )))
Что такое функция?
7 класс, 11 класс, ЕГЭ/ОГЭ
Понятие функции
Определение функции можно сформулировать по-разному. Рассмотрим несколько вариантов, чтобы усвоить наверняка.
1. Функция — это взаимосвязь между величинами, то есть зависимость одной переменной величины от другой.
Знакомое обозначение y = f (x) как раз и выражает идею такой зависимости одной величины от другой. Величина у зависит от величины х по определенному закону, или правилу, которое обозначается f.
Вывод: меняя х (независимую переменную, или аргумент) — меняем значение у.
2. Функция — это определенное действие над переменной.
Значит, можно взять величину х, как-то над ней поколдовать — и получить соответствующую величину у.
В технической литературе можно встретить такие определения функции для устройств, в которых на вход подается х — на выходе получается у. Схематично это выглядит так:
В этом значении слово «функция» используют и в далеких от математики областях. Например, так говорят о функциях ноутбука, костей в организме или даже о функциях менеджера в компании. В каждом перечисленном случае речь идет именно о неких действиях.
3. Функция — это соответствие между двумя множествами, причем каждому элементу первого множества соответствует один элемент второго множества. Это самое популярное определение в учебниках по математике.
Например, в функции у = 2х каждому действительному числу х ставит в соответствие число в два раза большее, чем х.
Область определения — множество х, то есть область допустимых значений выражения, которое записано в формуле.
Например, для функции вида
область определения выглядит так:
И записать это можно так: D (y): х ≠ 0.
Область значений — множество у, то есть это значения, которые может принимать функция.
Например, естественная область значений функции y = x2 — это все числа больше либо равные нулю. Можно записать вот так: Е (у): у ≥ 0.
Для примера рассмотрим соответствие между двумя множествами — человек-владелец странички в инстаграм и сама страничка, у которой есть владелец. Такое соответствие можно назвать взаимно-однозначным — у человека есть страничка, и это можно проверить. И наоборот — по аккаунту в инстаграм можно проверить, кто им владеет.
В математике тоже есть такие взаимно-однозначные функции. Например, линейная функция у = 3х +2. Каждому значению х соответствует одно и только одно значение у. И наоборот — зная у, можно сразу найти х.
Введение в функциональные зависимости
В этой статье мы поговорим о функциональных зависимостях в базах данных — что это такое, где применяются и какие алгоритмы существуют для их поиска.
Рассматривать функциональные зависимости мы будем в контексте реляционных баз данных. Если говорить совсем грубо, то в таких базах данных информациях хранится в виде таблиц. Далее мы используем приближенные понятия, которые в строгой реляционной теории не являются взаимозаменяемыми: саму таблицу будем называть отношением, столбцы — атрибутами (их множество — схемой отношения), а набор значений строки на подмножестве атрибутов — кортежем.
Например, в таблице выше, (Benson, M, M organ) является кортежем по атрибутам (Пациент, Пол, Доктор).
Более формально это записывается в следующем виде: [Пациент, Пол, Доктор] = (Benson, M, M organ).
Теперь мы можем ввести понятие функциональной зависимости (ФЗ):
Определение 1. Отношение R удовлетворяет ФЗ X → Y (где X, Y ⊆ R) тогда и только тогда, когда для любых кортежей , ∈ R выполняется: если [X] = [X], то [Y ] = [Y ]. В таком случае говорят, что X (детерминант, или определяющее множество атрибутов) функционально определяет Y (зависимое множество).
Иными словами, наличие ФЗ X → Y означает, что если мы имеем два кортежа в R и они совпадают по атрибутам X, то они будут совпадать и по атрибутам Y.
А теперь по порядку. Рассмотрим атрибуты Пациент и Пол для которых хотим узнать, есть ли между ними зависимости или нет. Для такого множества атрибутов могут существовать следующие зависимости:
Таким образом, функциональные зависимости позволяют определить имеющиеся связи между множествами атрибутов таблицы. Отсюда и впредь мы будем рассматривать наиболее интересные связи, а точнее такие X → Y, что они являются:
Посчитаем ошибку для Доктор → Пациент из примера выше. Имеем два кортежа, значения которых разнятся на атрибуте Пациент, но совпадают на Докторе: [Доктор, Пациент] = (Robin, Ellis) и [Доктор, Пациент] = (Robin, Graham). Следуя определению ошибки, мы должны учитывать все конфликтующие пары, а значит таковых будет две: (, ) и ее инверсия (, ). Подставим в формулу и получим:
А теперь попытаемся ответить на вопрос: «А зачем оно все?». На самом деле, ФЗ бывают разные. Первый тип — это такие зависимости, которые определяются администратором на этапе проектирования базы данных. Их обычно немного, они строгие, а основное применение — нормализация данных и дизайн схемы отношения.
Второй тип — зависимости, представляющие «скрытые» данные и ранее неизвестные связи между атрибутами. То есть о таких зависимостях не думали в момент проектирования и их находят уже для имеющегося набора данных, чтобы потом на основе множества выявленных ФЗ сделать какие-либо выводы о хранимой информации. Как раз с такими зависимостями мы и работаем. Ими занимается целая область дата майнинга с различными техниками поиска и построенными на их основе алгоритмами. Давайте разбираться, чем могут быть полезны найденные функциональные зависимости (точные или приближенные) в каких-либо данных.
Сегодня среди основных областей применения зависимостей выделяют очистку данных. Она подразумевает разработку процессов выявления «грязных данных» с последующим их исправлением. Яркими представителями «грязных данных» являются дубликаты, ошибки в данных или опечатки, пропущенные значения, устаревшие данные, лишние пробелы и тому подобное.
Пример ошибки в данных:
Пример дубликатов в данных:
Например, мы имеем таблицу и набор ФЗ, которые должны выполняться. Очистка данных в данном случае предполагает изменить данные таким образом, чтобы ФЗ стали верны. При этом число модификаций должно быть минимально (для данной процедуры существуют свои алгоритмы, на которых мы не будем сосредотачивать внимание в данной статье). Ниже приведен пример такого преобразования данных. Слева исходное отношение, в котором, очевидно, не выполняются необходимые ФЗ (красным цветом выделен пример нарушения одной из ФЗ). Справа представлено обновленное отношение, в котором зеленые ячейки показывают измененные значения. После проведения такой процедуры необходимые зависимости стали удерживаться.
Другой популярной областью применения является дизайн базы данных. Здесь стоит напомнить про нормальные формы и нормализацию. Нормализация — это процесс приведения отношения в соответствие некоторому набору требований, каждый из которых определяется нормальной формой по-своему. Расписывать требования различных нормальных форм мы не станем (это делается в любой книге по курсу БД для начинающих), а лишь заметим, что каждая из них по-своему использует концепцию функциональных зависимостей. Ведь ФЗ по своей сути являются ограничениями целостности, которые учитываются при проектировании базы данных (в контексте этой задачи ФЗ иногда называют суперключами).
Рассмотрим их применение для четырех нормальных форм на картинке ниже. Напомним, что нормальная форма Бойса-Кодда является более строгой, чем третья форма, но при этом менее строгой, чем четвертая. Последнюю пока не рассматриваем, поскольку для ее постановки нужно понимание многозначных зависимостей, которые в данной статье нам не интересны.
Еще одной областью, в которой зависимости нашли свое применение, является понижение размерности пространства признаков в таких задачах как построение наивного байесовского классификатора, выделение значимых признаков и репараметризация регрессионной модели. В оригинальных статьях эта задача называется определением избыточных признаков (feature redundancy) и релевантных (feature relevancy) [5, 6], и решается она с активным использованием концепций баз данных. С появлением таких работ мы можем говорить, что сегодня наблюдается запрос на решения, позволяющие объединить базу данных, аналитику и реализацию вышеперечисленных проблем оптимизации в один инструмент [7, 8, 9].
Для поиска ФЗ в наборе данных существует множество алгоритмов (как современных, так и не очень).Такие алгоритмы можно разделить на три группы:
Подробнее о данной классификации можно почитать [4]. Ниже представлены примеры алгоритмов на каждый из типов:
В настоящее время появляются новые алгоритмы, которые сочетают в себе сразу несколько подходов к поиску функциональных зависимостей. Примерами таких алгоритмов являются Pyro [2] и HyFD [3]. Разбор их работы предполагается в следующих статьях данного цикла. В этой статье мы лишь разберем основные понятия и лемму, которые необходимы для понимания техник выявления зависимостей.
Начнем с простого — difference- и agree-set, используемые во втором типе алгоритмов. Difference-set представляет собой множество кортежей, которые не совпадают по значениям, а agree-set наоборот — кортежи, совпадающие по значениям. Стоить отметить, что в данном случае мы рассматриваем только левую часть зависимости.
Также важным понятием, которое встречалось выше, является алгебраическая решетка. Так как многие современные алгоритмы оперируют данным понятием, нам нужно иметь представление о том, что это такое.
Для того чтобы ввести понятие решетки, необходимо определение частично упорядоченного множества (или partially ordered set, сокращенно — poset).
В качестве простейшего примера частично упорядоченного множества можно взять множество всех натуральных чисел N с обычным отношением порядка ⩽. Нетрудно проверить, что все необходимые аксиомы выполняются.
Более содержательный пример. Рассмотрим множество всех подмножеств <1, 2, 3>, упорядоченное отношением включения ⊆. Действительно, это отношение удовлетворяет всем условиям частичного порядка, поэтому ⟨P (<1, 2, 3>), ⊆⟩ — частично упорядоченное множество. На рисунке ниже изображена структура этого множества: если из одного элемента можно дойти по стрелочкам до другого элемента, то они находятся в отношении порядка.
Нам потребуются еще два простых определения из области математики — супремум (supremum) и инфимум (infimum).
Определение 3. Пусть ⟨S, ⩽⟩ — частично упорядоченное множество, A ⊆ S. Верхняя граница A — это такой элемент u ∈ S, что ∀x ∈ A: x ⩽ u. Пусть U — множество всех верхних границ A. Если в U существует наименьший элемент, тогда он называется супремумом и обозначается как sup A.
Аналогично вводится понятие точной нижней границы.
Определение 4. Пусть ⟨S, ⩽⟩ — частично упорядоченное множество, A ⊆ S. Нижняя граница A — это такой элемент l ∈ S, что ∀x ∈ A: l ⩽ x. Пусть L — множество всех нижних границ A. Если в L существует наибольший элемент, тогда он называется инфимумом и обозначается как inf A.
Рассмотрим в качестве примера приведенное выше частично упорядоченное множество ⟨P (<1, 2, 3>), ⊆⟩ и найдем в нем супремум и инфимум:
Теперь можно сформулировать определение алгебраической решетки.
Определение 5. Пусть ⟨P, ⩽⟩ — частично упорядоченное множество, такое что всякое двухэлементное подмножество имеет точные верхнюю и нижнюю границы. Тогда P называется алгебраической решеткой. При этом sup
Проверим, что наш рабочий пример ⟨P (<1, 2, 3>), ⊆⟩ является решеткой. Действительно, для всяких a, b ∈ P (<1, 2, 3>), a∨b = a∪b, а a∧b = a∩b. Например, рассмотрим множества <1, 2>и <1, 3>и найдем их инфимум и супремум. Если мы их пересечем, то получим множество <1>, которое и будет являться инфимумом. Супремум же получим их объединением — <1, 2, 3>.
В алгоритмах выявления ФЗ пространство поиска зачастую представляется в форме решетки, где множества из одного элемента (читай первый уровень решетки поиска, где левая часть зависимостей состоит из одного атрибута) являют собой каждый атрибут исходного отношения.
В начале рассматриваются зависимости вида ∅ → Одиночный атрибут. Данный шаг позволяет определить, какие атрибуты являются первичными ключами (для таких атрибутов не бывает детерминантов, а потому левая часть пуста). Далее такие алгоритмы двигаются по решетке вверх. При этом стоит отметить, что решетку можно обходить не всю, то есть если на вход передать желаемый максимальный размер левой части, то дальше уровня с таким размером алгоритм идти не будет.
На рисунке ниже показано, как можно использовать алгебраическую решетку в задаче поиска ФЗ. Здесь каждое ребро (X, XY) представляет собой зависимость X → Y. Например, мы прошли первый уровень и знаем, что удерживается зависимость A → B (отобразим это зеленой связью между вершинами A и B). Значит далее, когда будем продвигаться по решетке вверх, мы можем не проверять зависимость A, C → B, потому что она будет уже не минимальной. Аналогично мы бы не стали ее проверять, если бы удерживалась зависимость C → B.
Кроме того, как правило, все современные алгоритмы по поиску ФЗ используют такую структуру данных, как партиция (в первоисточнике — stripped partition [1]). Формальное определение партиции выглядит следующим образом:
Определение 6. Пусть X ⊆ R — набор атрибутов для отношения r. Кластер представляет собой набор индексов кортежей из r, которые имеют одинаковое значение для X, то есть c(t) = . Партиция представляет собой множество кластеров, исключающее кластеры единичной длины:
1\>$» data-tex=»display»/>
Простыми словами, партиция для атрибута X представляет собой набор списков, где каждый список содержит номера строк с одинаковыми значениями для X. В современной литературе структура, представляющая партиции, называется position list index (PLI). Кластеры единичной длины исключаются в целях сжатия PLI, потому что это кластеры, содержащие лишь номер записи с уникальным значением, которое всегда будет легко установить.
Рассмотрим пример. Вернемся все к той же таблице с пациентами и построим партиции для столбцов Пациент и Пол (слева появился новый столбец, в котором отмечены номера строк таблицы):
При этом, согласно определению, партиция для столбца Пациент на самом деле будет пустая, так как одиночные кластеры исключаются из партиции.
Партиции можно получать по нескольким атрибутам. И для этого существует два пути: пройдясь по таблице, построить партицию сразу по всем необходимым атрибутам, или же построить ее с помощью операции пересечения партиций по подмножеству атрибутов. Алгоритмы поиска ФЗ используют второй вариант.
Простыми словами, чтобы, например, получить партицию по столбцам ABC, можно взять партиции для AC и B (или любой другой набор непересекающихся подмножеств) и пересечь их между собой. Операция пересечения двух партиций выделяет кластеры наибольшей длины, общие для обеих партиций.
Давайте рассмотрим пример:
В первом случае мы получили пустую партицию. Если присмотреться к таблице, то действительно, одинаковых значений по двум атрибутам там нет. Если же мы немного модифицируем таблицу (случай справа), то уже получим непустое пересечение. При этом строки 1 и 2 и правда содержат одинаковые значения по атрибутам Пол и Доктор.
Далее нам понадобится такое понятие, как размер партиции. Формально:
1\>|$» data-tex=»display»/>
Проще говоря, размер партиции представляет собой количество кластеров, входящих в партицию (помним, что единичные кластеры в партицию не входят!):
Теперь мы можем определить одну из ключевых лемм, которая для заданных партиций позволяет установить, удерживается зависимость или нет:
Лемма 1. Зависимость A, B → C удерживается, если и только если
Согласно лемме, для определения, удерживается ли зависимость, необходимо выполнить четыре шага:
В данной статье мы разобрали такие понятия, как функциональная зависимость, приближенная функциональная зависимость, рассмотрели, где они применяются, а также какие алгоритмы поиска ФЗ существуют. Также мы подробно разобрали базовые, но важные понятия, активно используемые в современных алгоритмах по поиску ФЗ.
Ссылки на литературу: