Probability mass function что это
What is a Probability Mass Function (PMF) in Statistics?
A probability mass function, often abbreviated PMF, tells us the probability that a discrete random variable takes on a certain value.
For example, suppose we roll a dice one time. If we let x denote the number that the dice lands on, then the probability that the x is equal to different values can be described as follows:
There is an equal chance that the dice could land on any number between 1 and 6.
Here’s how we would write these probabilities as a probability mass function:
The left side of the diagram shows the probability associated with the outcomes on the right side:
One characteristic of a probability mass function is that all of the probabilities must add up to 1. You’ll notice that this PMF satisfies that condition:
Sum of probabilities = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.
The support of a probability mass function refers to the set of values that the discrete random variable can take. In this example, the support would be <1, 2, 3, 4, 5, 6>since the value of the dice can take on any of these values.
Outside of the support, the value for the PMF is equal to zero. For example, the probability that the dice lands on “0” or “7” or “8” is equal to zero since none of these numbers are included in the support.
Probability Mass Functions in Practice
The two most common examples of probability mass functions in practice are for the Binomial distribution and the Poisson distribution.
Binomial Distribution
If a random variable X follows a Binomial distribution, then the probability that X = k successes can be found by the following formula:
P(X=k) = nCk * p k * (1-p) n-k
For example, suppose we flip a coin 3 times. We can use the formula above to determine the probability of obtaining 0, 1, 2, and 3 heads during these 3 flips:
Poisson Distribution
If a random variable X follows a Poisson distribution, then the probability that X = k successes can be found by the following formula:
P(X=k) = λ k * e – λ / k!
For example, suppose a particular hospital experiences an average of 2 births per hour. We can use the formula above to determine the probability of experiencing 0, 1, 2, 3 births, etc. in a given hour:
Visualizing a PMF
We often visualize probability mass functions with bar charts.
For example, the following bar chart shows the probabilities associated with the number of births per hour for the Poisson distribution described in the previous example:
Note that the number of births could extend to infinity, but the probabilities become so low after 10 that we can’t even see them on a bar chart.
Properties of a PMF
A probability mass function has the following properties:
1. All probabilities are positive in the support. For example, the probability that a dice lands between 1 and 6 is positive, while the probability of all other outcomes is equal to zero.
2. All outcomes have a probability between 0 and 1. For example, the probability that a dice lands between 1 and 6 is 1/6, or 0.1666666 for each outcome.
3. The sum of all probabilities must add up to 1. For example, the sum of probabilities that a dice lands on a certain number is 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.
Что такое Product Market Fit и почему важно достичь его?
Задача любого продукта — привлечь как можно больше аудитории, которая согласится потратить свои деньги на предложенное решение проблемы. Часто продакты и предприниматели сталкиваются с проблемой: сделана крутая рекламная кампания, приходит много людей, но вот конверсия минимальная. Если вам такое знакомо, эта статья для вас. Сегодня поговорим о Product Market Fit (PMF), который многие почему-то не учитывают в работе.
Что такое Product Market Fit
Product Market Fit — соответствие продукта ожиданиям целевой аудитории, гармоничное сочетание с рынком, позволяющее повысить конверсии до небес и наращивать доходы.
Термин в 2007 году ввел Марк Андриссен — сооснователь Netscape и один из основных участников создания популярного браузера Mosaic. Марк дает следующее определение, чем является и не является product market fit:
«Вы всегда чувствуете, когда вы не достигли product/market fit. Клиенты не понимают ценности продукта, сарафанное радио не работает, использование растет медленно, обзоры в прессе скучные и пресные, цикл продаж очень длинный, большинство сделок срываются. И вы всегда чувствуете, когда вы достигли product/market fit.
Клиенты выстраиваются в очередь за продуктом, использование растет быстрее, чем вы успеваете закупать сервера. Деньги клиентов наполняют ваши счета. Вы нанимаете продажников и специалистов поддержки на максимальной скорости. Журналисты звонят, потому что узнали о новом горячем проекте и хотят обсудить его с вами. Вы получаете награды “Предприниматель года” от школы бизнеса Гарварда. Инвестиционные банкиры ждут у вашего дома.»
Дословных переводов термина много. Один говорит «соответствие продукта рынку», другой — «счастливый союз продукта и целевой аудитории». Определений много, но суть одна: PMF — показатель соответствия продукта ожиданиям потребителей. Если критерий не достигнут, продажи будут минимальными, успешность проекта низкая.
При достижении PMF бизнес начинает расти с молниеносной скоростью, а доходы увеличиваются каждый день. Если продукт исчезнет с рынка, целевая аудитория расстроится и попытается найти аналоги.
Звучит хорошо. В теории все просто: надо достичь product market fit и тогда продукт взлетит. Но проблема в том, что далеко не все понимают, как это сделать. Еще больше людей неправильно трактуют критерий. Далее поговорим, зачем вообще нужен PMF, как его достичь и измерить.
Зачем нужен Product Market Fit
Основная задача product market fit — создание фундамента, на котором в дальнейшем строится успешная и прибыльная работа компании. Без соответствия ожиданиям пользователей продаж не будет. Не будет продаж — не будет прибыли. Все очень просто.
Критерий используют для планирования изменений продукта. Если продукт не дотягивает до PMF, проводят анализ и исследование. Определяют, что добавить в функционал или оформление, чтобы соответствовать ожиданиям целевой аудитории.
Как найти Product Market Fit
Поиск PMF своего продукта — процесс не быстрый и не всегда получается с первого раза. После первой неудачи не останавливайтесь, продолжайте работать и успех не заставит себя долго ждать.
А когда product market fit найден, поддерживайте его. Иначе пользователи либо сами уйдут, потому что не захотят больше отдавать свои деньги, либо придут конкуренты и заберут потребителей в честной борьбе.
Найдите рынок для своего решения проблемы
Хорошо, если у вас уже есть идея, и еще лучше, если есть минимальный прототип продукта. Но перед запуском работы и вложением больших средств, надо понять, если ли у намеченной проблемы какой-то рынок? И будет ли ваше решение соответствовать ожиданиям целевой аудитории?
Для этого придется общаться. Много общаться с людьми, у которых есть проблема, решаемая вашим продуктом. Иными словами — интервьюирование потенциальных клиентов.
Не путайте этот процесс с прямыми продажами или донесением ценности решения. Вы ведь только ищите рынок. Поэтому надо понять, есть у людей такая проблема и насколько важное место она занимает в их жизни.
Проводя интервью с потенциальными клиентами, попутно оценивайте масштабы рынка. Насколько он большой сегодня? Какие перспективы развития есть в будущем? В какую сторону можно пойти для масштабирования бизнеса?
Нет смысла продолжать развивать продукт для маленького рынка. А если вы планируете привлекать средств от инвесторов, придется доказать им его потенциал и размеры.
Тестируйте рынок на способность покупать решение
Проверьте, насколько верны выводы, сделанные на первом этапе. Попробуйте продать свое решение потенциальным клиентам. Для этого нужен прототип с минимальным функционалом (читайте нашу статью про MVP). Предложите его аудитории, с которой проводили интервью.
Если потребители соглашаются отдавать свои деньги за ваше решение проблемы, значит, вы близки к PFM и развивает продукт в правильном направлении. В противном случае следует пересмотреть концепцию или попробовать ориентироваться на другой сегмент аудитории.
Продвигайте первую версию продукта по привычным маркетинговым каналам: SEO, контекстная реклама, социальные сети, партнерские программы, реферальная система и т.п.
Нет смысла тратить ресурсы и время на реализацию решения в полном объеме, если почва «не прощупана», не определена возможность продавать продукт.
А вы знали, что основатели Airbnb в начале своего пути действовали аналогичным образом? Они нашли людей с «болью» и предложили им обменять их средства на свое решение! Получив первые продажи и реальный доход, они убедились в перспективности затеи и приступили к развитию продукта.
Начните масштабирование идеи
Вы получили первых потребителей и их реакцию: отзывы, мнения, рекомендации по доработке и т.п. Учитывайте эту информацию при принятии решений о дальнейшем улучшении продукта. Решение должно отвечать ожиданиям пользователей. Иначе продажи так и останутся на минимальном уровне.
Это циклический процесс. Не бывает такого, что изучение мнений и отзывов заканчивается после первых доработок. Это нужно делать всегда по двум причинам:
мнение потребителей и их проблемы меняются, они хотят получать что-то новое за свои деньги;
если идея удачная, непременно появятся конкуренты, которые захотят забрать часть вашей аудитории.
Когда функционал дополнен и продукт еще больше соответствует ожиданиям потребителей, приступайте к привлечению новых потребителей. Часто на этом этапе возникает проблема: первые пользователи — новаторы, любители новых решений, которые пробуют уникальное, отличающееся от старого. Вам же нужен широкий рынок людей, которые сегодня решают проблему старыми методами.
Подходы к привлечению новаторов и простых пользователей отличаются. Прежде чем расширяться, подумайте, как продать решение второй группе аудитории? Выручка должна расти, а стоимость привлечения каждого нового пользователя снижаться.
Не забывайте про аналитику рекламных кампаний. Отслеживайте траты, конверсии и т.п. Определяйте эффективные каналы сбыта продукта и концентрируйтесь на них. От тех, которые дают маленькую пользу, отказывайтесь.
Цепочка «сбор мнений — доработка — масштабирование — сбор мнений» не должна обрываться. Повторяйте ее всегда, чтобы соответствовать Product Market Fit.
Как измерить Product Market Fit
По поводу измерения PMF споры не утихают с 2007 года, когда Марк Андриссен впервые упомянул о критерии. Аналитики привыкли работать с конкретными цифрами в Яндекс.Метрике, Google Analytics и других подобных системах. Но product market fit — это не конкретная метрика, не цифра, а состояние продукта.
Как говорил Марк Андриссен, если ваш продукт соответствует ожиданиям целевой аудитории, вы будете это чувствовать и видеть: о нем будут говорить, рекомендовать друзьям, количество пользователей и доходы постоянно увеличиваться в несколько раз. А если этого нет, значит, надо продолжать работу и подгонять решение проблемы под видение клиентов.
Единого мнения по измерению критерия нет. «Но ведь надо же на что-то ориентироваться?» — спросите вы. Да, надо. В ProductStar склоняются к оценке критерия по нескольким составляющим, о которых поговорим далее.
Посмотрите на доход
Самая очевидная и распространенная метрика — доход компании (продукта). Это экспресс-вариант оценки PMF без проведения опросов, оценки реакции рынка на проект и т.п.
Если прибыль организации постоянно увеличивается, причем стремительными темпами, скорее всего, ваше решение соответствует ожиданиям аудитории (PMF). В противном случае надо искать источник проблемы, устранять его и отслеживать заново.
Проверьте «сарафанное радио»
Если продукт соответствует ожиданиям потребителя, он обязательно посоветует его друзьям, родственникам, коллегам и т.п. В народе это известно как «сарафанное» радио. Может быть и противоположная ситуация: проект так сильно не понравился клиенту, что он расскажет все самое плохое о нем своим близким.
Проведите опрос среди пользователей, чтобы понять, в какую сторону работает «сарафанное» радио. Задайте вопрос: «Какова вероятность, что вы порекомендуете нас своим друзьями и близким?». Ответы — десятибалльная шкала от 0 до 10.
Участников опроса поделите на 3 сегмента:
оценки 9-10 — «адвокаты» бренда, они рекомендуют продукт своему окружению;
оценки 7-8 — нейтральные пользователи, они охотно применяют ваше решение, но не являются большими сторонниками;
оценки 0-6 — «критики» компании, которые при любой возможности рассказывают о вас плохое.
Посчитайте разницу (в процентах) между «адвокатами» и «критиками». Если получившееся значение больше нуля, продукт соответствует ожиданиям потребителе и наоборот. Общепринятых высоких или низких показателей нет, так как все зависит от сферы деятельности бизнеса.
Поговорите с клиентами
Еще один вариант с опросами, основанный на методе Шона Эллиаса. Собираете аудиторию и устраиваете опрос: «Вы расстроитесь, если продукт исчезнет с рынка?». Если положительно отвечают как минимум 4 из 10 респондентов (40%), вы достигли PMF.
Некоторые специалисты рекомендуют при этом сегментировать участников опроса. Здесь однозначной градации нет, но чаще используют следующую:
те, кто впервые попробовал продукт;
те, кто несколько раз взаимодействовали с продуктом;
те, кто постоянно пользуются решением.
Благодаря сегментированию вы получите более детальную информацию по продукту и сможете объективнее оценить соответствие критерию product market fit.
Изучите реакцию рынка на продукт
Ничто не говорит о продукте лучше, чем реакция рынка. Клиенты оставляют положительные отзывы? Продажи идут так интенсивно, что не хватает специалистов для их обработки? Скорее всего, ваш продукт достиг Product Market Fit.
Если отзывы отрицательные, «сарафанное» радио не работает, цикл продаж очень длительный, скорее всего, критерию продукт не соответствует. Проводите анализ, вносите изменения, дорабатывай функционал и отслеживайте реакцию рынка.
Часто используют один из вариантов для измерения PMF. Мы рекомендуем оценивать по всем систематично. Тогда точно сможете сказать, достиг ваш продукт product market fit или нет.
Мифы о Product Market Fit
Есть несколько заблуждений, с которыми сталкиваются новички:
PMF достигается с помощью «фишек» и точечных поправок (например, смена цвета кнопок). Все не так просто и происходит не быстро.
PMF можно измерять по количеству аудитории. При этом конкретных мерок нет: для какого-то рынка 10 клиентов — успех, а для какого-то 2 000 потребителей — полный провал.
Если product market fit достигнут, его невозможно потерять. Нет, мир слишком изменчив, причем новые тенденции образуются с молниеносной скоростью. Нужно регулярно следить за PMF, чтобы бизнес не пришел в упадок. Вспомните, что стало с производителями видеомагнитофонов? Потребители быстро перешли на CD-диски и DVD-проигрыватели. Производители, которые не успели подстроиться под изменения, давно перестали работать.
Если PMF достигнут, о конкуренции можно не думать. А если конкурент просто скопирует ваш продукт от и до и добавить несколько фичей? Этого хватит, чтобы забрать если не всю, то значимую часть аудитории. В 2007 году Apple выпустили первый iPhone, организовали новый рынок и первое время были на нем монополистами. Но конкуренты быстро сориентировались и начали делать свои сенсорные телефоны. Apple до сих пор приходится отслеживать PMF, чтобы не потерять лояльную аудиторию.
Ни в коем случае не следуйте этим заблуждениям. Рано или поздно они приведут ваш бизнес ко дну, с которого трудно выбраться. Всегда отслеживайте product market fit и старайтесь максимально соответствовать ожиданиям потребителей.
Product market fit — сложный критерий. Его нельзя оценить одной метрикой. Это состояние, которое определяется соответствием ожиданиям целевой аудитории. Если продукт такой, каким его видит потребитель, бизнес будет расти. В противном случае будут только убытки.
Регулярно следите за PMF. Заметили падение спроса и прибыли? Срочно измеряйте, ищите проблему и исправляйте ее. Методы измерения описаны в статье, используйте все в совокупности, чтобы получать точный результат. А если остались какие-то вопросы, задавайте их в комментариях, мы с радостью на них ответим!
Ещё больше о PMF можно узнать на нашем годовом курсе «Профессия: Продакт-менеджер»
Probability Mass and Density Functions
Building a deeper understanding of probability
Dec 1, 2020 · 5 min read
Probability mass and density functions are used to describe discrete and continuous probability distributions, respectively. This allows us to determine the probability of an observation being exactly equal to a target value (discrete) or within a set range around our target value (continuous). PMFs and PDFs are important to understand as you expand your knowledge of common statistical distributions!
Probability Mass Function — Discrete
The Probability Mass Function (PMF) provi d es the probability distribution for discrete variables. For example, rolling dice. There are 6 distinct possible outcomes that define the entire sample space <1, 2, 3, 4, 5, 6>. Note that we only have whole numbers, i.e. no 1.2 or 3.75. In the PMF, each discrete variable is mapped to its probability. In an ideal situation rolling a die, each of the six variables has a 1/6 probability of being rolled.
While the ideal distribution is 1/6 for each possible outcome 1 to 6, this rarely occurs in real-world scenarios. If we simulate an increasing number of trials we see that the distribution doesn’t match the ideal even with 100 dice rolls. As we increase orders of magnitude the simulated distribution approaches the theoretical PMF.
Expected Value —
The expected value provides the anticipated value from the resulting probability distribution, and it is calculated by multiplying each value by the probability of getting that value and summing for all possible outcomes.
For our ideal dice,
If the probability of all possible outcomes is the same, then the expected value equals the average value (sum of outcomes/num of outcomes, here the average value is just (1+2+3+4+5+6)/6 = 3.5.
But let’s look at our “100 Throws” example from above. We see there is a surplus of 4s and 6s thrown, and if we populate the expected value equation we get
The expected value was pulled upwards by the above average 4s and 6s.
Variance —
Variance measures how far spread are the values from the mean. Formally, the average of the squared differences from the mean.
Coming back to our “100 Throws” example. Remember our expected value is 3.61.
This seems about right considering in our PMF for “100 Throws” there were an above average number of both 1s and 6s which are far away from the expected value. There were a lot of 4s as well, but those are fairly close to the expected value so it doesn’t influence the variance as much because we are squaring the difference.
Probability Density Function — Continuous
Now that we’ve covered discrete variables, what about continuous variables? These are variables that don’t fit into fixed amounts, height for example. You can be 6′ tall or — if you have the most accurate tape measure ever made — 6.1248938′ tall! A key aspect of continuous variables is that there are an infinite number of possible outcomes.
The probability density function (PDF) shows where observations are more likely to occur in the probability distribution. Perhaps the most important thing to remember to understand PDFs is that the probability of any specific outcome is 0. We have to think in terms of bins or ranges of values to calculate the probability of seeing those values. Why is that?
Basically because your height will never be exactly 6′! It could be 6.00001 or 5.99999. We use a range of values instead, because we can calculate the probability that your height is between 5’11» and 6’1″. This spread is called the interval.
We can use PDFs to calculate probability by looking at the area under the curve for our interval. Mathematically, this is why a single point has 0 probability, the area of a point is 0. Because we have a continuous variable, we can use integrals to calculate the area under the curve between our interval with the following equation.
Plugging in our interval range to the above integral will calculate the probability of an observation being within the interval for our function.
Expected Value —
We can calculate the expected value for a continuous variable just as a discrete one, we just switch out the summation across the range for an integral to calculate the area under the curve for the entire range.
Variance —
Again, we are utilizing the same formula as for discrete random variables but substituting an integral for the summation because we cannot add a infinite number of points!
Visualization —
There are a few strategies for visualizing a PDF, shown here for the common weight-height dataset from Kaggle. First, we can bin the observations into a histogram. This is the simplest, but requires some arbitrary decision making especially because as the number of bins decreases because you will potentially obscure some patterns in the data. Second, you can use a parametric approximation. This sounds fancy, but it just entails using parameters to define our curve, mainly mean and standard deviation. Third, use a kernal density estimation (KDE) plot which is a fundamental data-smoothing method and more accurately follows the raw data. Learn more here. You can see that the parametric approach cannot account for the rounded off tip of the distribution and therefore overestimates around the mean.
Conclusion
I hope this article provided a useful overview of probability mass function (PMF) for discrete variables and probability density function (PDF) for continuous variables. Moving forward, these concepts will be useful for building intuition around common statistical distributions, like Gaussian, Exponential, Binomial, and Poisson. A future article(s) will explore some or all of these distributions, their use cases, and intuitions.
Connect
I’m always looking to connect and explore other projects!