Анализ данных в Tableau. Часть 2.

 Продолжаем исследовать популярность раменов. Сегодня посмотрим на рейтинги, поработаем с агрегацией и быстрыми вычислениями.


Для начала построим простейший бар-чарт с распределением брендов по странам. 

Чтобы посчитать количество брендов, сделаем дубль дименшна, затем через контекстное меню переведем тип в меру и назначим агрегацию  - COUNTD (количество уникальных значений)



Теперь внимание на сам чарт. Здесь лидером является Япония. Японцы назвали 58 брендов. Но отрыв не такой уж большой. Следом идут США, у которых 49 брендов. Как видим, в первой десятке все страны из азиатского региона (кроме США), что неудивительно. ведь рамен - это азиатское блюдо. 



Тогда давайте сосредоточимся именно на этом регионе. Воспользуемся фильтром, чтобы выбрать только азиатские страны. Построим новый тип виза - геокарту. Для этого выберем его на панели Show Me, а количество брендов по странам перенесем на полку Marks в Label, чтобы дополнительно видеть значения.



Теперь ближе к выводам. Во-первых, в наших данных нет одной страны этого региона - это Лаос. То, что там нет рамена, маловероятно. Все-таки рядом Тайланд и даже в Камбодже все-таки пару брендов знают. Сильно удивили Филиппины. Находясь в центре региона, количество известных брендов рамена всего лишь 5. А в маленьком Тайване, который чуть выше по карте уже 47! Вот такая разница в культуре потребления.

Пора перейти к рейтингу. В нашем случаем нет смысла считать рейтинг  в отрыве от страны и количества отзывов. Иначе единственная оценка в 5 баллов для единственного бренда даст 100% результат. Поэтому наша задача сравнивать средний бал по бренду с количеством отзывов, а для удобства мы хотим видеть еще и долю отзывов по бренду в своей стране.

Теперь фильтр по стране сделаем интерактивным. Для этого перейдем в пункт главного меню Analysis и найдем там Filters->CountryOfOrigin

Затем построим обычную таблицу, как в предыдущем посте. В качестве дименшенов возьмем страну и бренд, а в меры перенесем  Stars (агрегируем по среднему), Reviews (агрегируем по количеству) и еще нам нужно посчитать долю отзывов по бренду в своей стране. Для этого дублируем меру Reviews на полке и через контекстное меню, как на скрине, делаем быстрое вычисление в Percent of Total. (да это же оконные функции в SQL!)




Осталось убрать Country на полку в Filters, а саму таблицу преобразовать в барчарт и сделать сортировку по убыванию.



Теперь, нас не смутит высокий бал, оставленный потребителем, если он всего лишь один.  Качество рамена в Японии высокое и средний был стремится к 4, 75, но надо смотреть и на то, сколько человек проголосовало. Лидер в этой стране - Nissin.

А в Тайланде средний бал у рамена не такой высокий. У лидера Wai Nai всего 2,88, хотя по отзывам он на первой строчке.

И напоследок, мы посмотрим, какой бренд имеет наибольшую географию распространения. Сделаем простой барчарт с дименшенами Brand, CountryOfOrigin, а в мерах количество отзывов.



Как видим, Nissin является лидером не только в Японии, но и имеет наибольшую географию распространения - 14 стран. Та же тайландская Мама имеет отзывы из 4 стран. Интересно также противостояние Японии и Кореи - лидер японцев Nissin вообще отсутствует у корейцев и наоборот, корейский лидер Paldo имеет один отзыв в Японии (и наверно, это был корейский экспат).
И мы видим такую тенденцию и в других странах - прежде всего локальные бренды популярны у себя на родине, ну а продвижение в соседние страны или другие регионы зависит от амбиций руководства производителя и маркетингового бюджета.


Резюме


Сегодня мы немного углубились в возможности Tableau. Познакомились с переводом дименшенов в меры, построили гео и бар чарты, научились делать вычисления на лету,  а также нашли несколько важных инсайтов. А в следующем, заключительном посте, мы займемся созданием дашборда.























Комментарии

Популярные сообщения из этого блога

Быстрый импорт в базу данных с помощью DBeaver

Jupyter-фишки, которые облегчат жизнь аналитику

Два способа загрузить свой датасет в Python

5 приемов при работе с модулем datetime в Python

Чистка и препроцессинг данных. Готовим датасет для ML.