Анализ данных в Tableau. Часть 2.

- ноября 18, 2020

Продолжаем исследовать популярность раменов. Сегодня посмотрим на рейтинги, поработаем с агрегацией и быстрыми вычислениями.

Для начала построим простейший бар-чарт с распределением брендов по странам.

Чтобы посчитать количество брендов, сделаем дубль дименшна, затем через контекстное меню переведем тип в меру и назначим агрегацию - COUNTD (количество уникальных значений)

Теперь внимание на сам чарт. Здесь лидером является Япония. Японцы назвали 58 брендов. Но отрыв не такой уж большой. Следом идут США, у которых 49 брендов. Как видим, в первой десятке все страны из азиатского региона (кроме США), что неудивительно. ведь рамен - это азиатское блюдо.

Тогда давайте сосредоточимся именно на этом регионе. Воспользуемся фильтром, чтобы выбрать только азиатские страны. Построим новый тип виза - геокарту. Для этого выберем его на панели Show Me, а количество брендов по странам перенесем на полку Marks в Label, чтобы дополнительно видеть значения.

Теперь ближе к выводам. Во-первых, в наших данных нет одной страны этого региона - это Лаос. То, что там нет рамена, маловероятно. Все-таки рядом Тайланд и даже в Камбодже все-таки пару брендов знают. Сильно удивили Филиппины. Находясь в центре региона, количество известных брендов рамена всего лишь 5. А в маленьком Тайване, который чуть выше по карте уже 47! Вот такая разница в культуре потребления.

Пора перейти к рейтингу. В нашем случаем нет смысла считать рейтинг в отрыве от страны и количества отзывов. Иначе единственная оценка в 5 баллов для единственного бренда даст 100% результат. Поэтому наша задача сравнивать средний бал по бренду с количеством отзывов, а для удобства мы хотим видеть еще и долю отзывов по бренду в своей стране.

Теперь фильтр по стране сделаем интерактивным. Для этого перейдем в пункт главного меню Analysis и найдем там Filters->CountryOfOrigin

Затем построим обычную таблицу, как в предыдущем посте. В качестве дименшенов возьмем страну и бренд, а в меры перенесем Stars (агрегируем по среднему), Reviews (агрегируем по количеству) и еще нам нужно посчитать долю отзывов по бренду в своей стране. Для этого дублируем меру Reviews на полке и через контекстное меню, как на скрине, делаем быстрое вычисление в Percent of Total. (да это же оконные функции в SQL!)

Осталось убрать Country на полку в Filters, а саму таблицу преобразовать в барчарт и сделать сортировку по убыванию.

Теперь, нас не смутит высокий бал, оставленный потребителем, если он всего лишь один. Качество рамена в Японии высокое и средний был стремится к 4, 75, но надо смотреть и на то, сколько человек проголосовало. Лидер в этой стране - Nissin.

А в Тайланде средний бал у рамена не такой высокий. У лидера Wai Nai всего 2,88, хотя по отзывам он на первой строчке.

И напоследок, мы посмотрим, какой бренд имеет наибольшую географию распространения. Сделаем простой барчарт с дименшенами Brand, CountryOfOrigin, а в мерах количество отзывов.

Как видим, Nissin является лидером не только в Японии, но и имеет наибольшую географию распространения - 14 стран. Та же тайландская Мама имеет отзывы из 4 стран. Интересно также противостояние Японии и Кореи - лидер японцев Nissin вообще отсутствует у корейцев и наоборот, корейский лидер Paldo имеет один отзыв в Японии (и наверно, это был корейский экспат).

И мы видим такую тенденцию и в других странах - прежде всего локальные бренды популярны у себя на родине, ну а продвижение в соседние страны или другие регионы зависит от амбиций руководства производителя и маркетингового бюджета.

Резюме

Сегодня мы немного углубились в возможности Tableau. Познакомились с переводом дименшенов в меры, построили гео и бар чарты, научились делать вычисления на лету, а также нашли несколько важных инсайтов. А в следующем, заключительном посте, мы займемся созданием дашборда.

Поиск по этому блогу

Lets Analyse it!

Анализ данных в Tableau. Часть 2.

Резюме

Комментарии

Отправить комментарий

Популярные сообщения из этого блога

Jupyter-фишки, которые облегчат жизнь аналитику

Быстрый импорт в базу данных с помощью DBeaver

Подключаем Jupyter Notebook к Google Bigquery

Анализ данных в Tableau. Часть 3.

Два способа загрузить свой датасет в Python