Історія Airbnb, керована даними

AirBnB [Зображення [0] Ввічливість зображення: https://iacs.seas.harvard.edu/negotiation-tool-airbnb]

Користувачі на AirBnB можуть забронювати місце проживання у понад 34 000 містах у понад 190 країнах. Мета цієї публікації в блозі - проаналізувати дані, визначити проблеми та можливості та придумати уявлення про збільшення доходу. Ці дані були взяті з Kaggle. Якщо ви зацікавлені в подібних проектах, ознайомтеся з іншими моїми блогами тут.

Чому AirBnB хоча?

Ну, я хотів попрацювати над реальним набором даних, який мав би наслідки для реального світу з попередньою обробкою. AirBnB був найцікавішим набором даних, який я знайшов. Отже, ось ми.

Імпортуйте бібліотеки.

Імпортуйте набір даних.

Кадр даних [Зображення [1]]

Попередня обробка

Перетворити у формат дати та часу за допомогою мастила. Замініть -невідомо- гендер на NA.

Підсумок df [Зображення [2]]
  • Значення NA у стовпці date_first_booking кажуть, що користувач не забронював жодну кімнату.
  • Значення NA у віковій колонці означають, що користувач не вказав свій вік. Ми можемо заповнити фіктивні значення у віковій графі.
  • Значення NA у гендерному стовпці означає, що користувач не вказав свою стать.

Зауважте, що в гендерному стовпці є 95 688 значень NA та 117 763 заповнені значення. Отже, наш аналіз на основі гендерної демографії може бути не зовсім коректним у реальному світі.

Кількість значень NA у кожному стовпчику кадру даних.

colSums (is.na (поїзд_користувачі_2))
Кількість НС [Зображення [3]]

Віковий стовпець містить значення менше 18 і більше 80. Насправді вік містить значення розміром від 104 до 2014 року. Ми призначимо їм значення NA.

Щоб заповнити значення NA у віковій колонці, ми обчислимо середнє та стандартне відхилення стовпця вікових категорій. Тоді ми створимо n чисел у вигляді випадкових цілих чисел між середнім та стандартним відхиленням для заповнення значень NA. n - кількість значень NA у віковій колонці.

Створіть новий стовпець під назвою age_brackets і додайте його до кадру даних.

Нарешті, ми додамо 2 нові стовпці до кадру даних.

  • Перший стовпець - time_first_active_to_booking, який дорівнює кількості днів між date_first_booking та timetamp_first_active.
  • Другий стовпець - time_signup_to_booking, який дорівнює кількості днів між date_first_booking та дата_account_create

Перегляньте кількість NA в стовпці.

colSums (is.na (поїзд_користувачі_2))
Кількість НС [Зображення [4]]
  • Як видно з наведеної вище таблиці, лише стовпці date_first_booking, time_first_active_to_booking та gender мають значення NA. Це абсолютно добре.
  • Значення NA у стовпці date_first_booking означають, що користувач ще не забронював жоден готель.
  • Значення NA у гендерному стовпці означає, що користувач не вказав свою стать. time_first_active_to_booking походить від date_first_booking, тому він матиме значення NA.

Скиньте гендерні рівні. Якщо цього не зробити, рівень -unknown- все одно відображатиметься на рівнях (train_users_2 $ gender). Ми не хочемо цього, оскільки ми вже встановили всі невідомі гендерні значення на NA.

train_users_2 $ gender <- фактор (train_users_2 $ гендер)

Ми робимо з попередньою обробкою. Вау. : P

Дослідницький аналіз даних

Вік, стать та мова

Вік, стать та мова [Зображення [5]]
  1. Ми можемо бачити, що для статі дуже багато відсутніх значень. Більшість користувачів не заповнили свою гендерну інформацію на платформі.
  2. У другому сюжеті ми зауважуємо, що вікова група більшості користувачів лежить у віці від 25 до 47 років, а найбільше користувачів у віці до 30 років. Це говорить про те, що користувачі молоді та середнього віку домінують.
  3. Для компанії, що базується в США, не дивно, що найпоширенішою мовою на їхньому порталі / додатку є англійська.
  4. Якщо ми видалимо англійську мову із сюжету, китайська (zh) - наступна за популярністю мова на AirBnB, а за нею - французька та іспанська. Це говорить про те, що AirBnB, після США, справді популярний у французьких та іспаномовних країнах / громадах. У Франції розмовляють переважно французькою мовою, тому ми знаємо, що ця програма популярна у Франції. Але ми не можемо сказати, що це стосується іспанської мови, оскільки іспанською мовою розмовляють у багатьох країнах, включаючи Іспанію, Колумбію та США, серед багатьох інших.

Ці дані, поряд із місцем розташування користувача, можуть бути використані для визначення того, які регіони (у межах країни) використовують якою мовою. Тоді, можливо, ми могли б показувати цільову рекламу цим громадам.

Вік проти статі

Розподіл віку за статтю [Зображення [6]]

Виходячи з віку, майже немає різниці між кількістю чоловіків і жінок, які використовують AirBnB. Чоловіки та жінки в 30-х роках є найвизначнішими користувачами AirBnB.

Партнерський маркетинг a.k.a Реклама

Перш ніж ми почнемо аналізувати графіки, давайте розберемося, що таке партнерський маркетинг.

Партнерський маркетинг - це тип маркетингу на основі ефективності, в якому бізнес винагороджує одного або декількох філій для кожного відвідувача або клієнта, залучених власними маркетинговими зусиллями філій. Партнерський маркетинг швидко стає потужним способом збільшення продажів.

Партнерський постачальник та канал [Зображення [7]]

На двох сюжетах показано розподіл партнерських каналів, якими користуються різні афілійовані постачальники.

Прямий маркетинг, здійснений самим AirBnB, мав найбільше охоплення з точки зору маркетингу. Прямий маркетинг - це форма реклами, де організації спілкуються безпосередньо з клієнтами через різноманітні засоби масової інформації, включаючи текстові повідомлення, електронну пошту, веб-сайти, рекламні оголошення в Інтернеті, рекламні листи та цільове телебачення.

Google - близький другий партнерський постачальник, найпопулярнішим партнером якого є напівбрендинг. Бінг, Facebook та Craigslist є іншими "основними" учасниками.

Прямий маркетинг - канатна дорога [Зображення [8]]

Цільовий маркетинг на основі віку

Ці графіки показують порівняння використання платформи AirBnB на основі вікової демографії.

Цільовий маркетинг за віком [Зображення [9]]

Цільовий маркетинг на основі ґендерних питань

Ці графіки показують порівняння використання платформи AirBnB на основі ґендерної демографії.

Цільовий маркетинг за статтю [Зображення [10]]
  1. Більше жінок, ніж чоловіків, націлені на прямий партнерський канал.
  2. Те саме стосується і прямого афілійованого постачальника.
  3. Якщо ми видалимо прямий партнерський канал, ми помітимо, що напівмарочний та напівмарочний - це два найпопулярніші канали, за якими йдуть API та SEO (оптимізація пошукових систем). За винятком каналу API, всі інші канали обслуговують більше жінок, ніж чоловіків.
  4. Google як афілійований постачальник частіше зустрічається серед жінок, ніж чоловіків.
Цільовий маркетинг [Зображення [11]]

Додаток та спосіб реєстрації

Додаток та спосіб реєстрації [Зображення [12]]
  1. Реєстрація за допомогою електронної пошти - найпопулярніший варіант, за яким слід підписатися за допомогою Facebook. Жоден орган не любить пов'язувати свій обліковий запис Google зі своїм обліковим записом Airbnb.
  2. Переважна більшість людей отримує доступ до платформи AirBnB за допомогою браузерів на своїх комп’ютерах, а за ними додаток iOS. Той факт, що користувачів Android менше, ніж користувачів iOS, може здатися дивним, але пам’ятайте, що AirBnB - американська компанія, найбільша база користувачів якої - американці. iOS популярніший у США, ніж Android.
  3. Люди, ймовірно, не користуються цим додатком так багато. Це може бути, тому що вони не люблять інтерфейс або функціональність додатка Android / iOS. Можливо, веб-версія пропонує більше функціональних можливостей і простіша у використанні. Або люди не знають про додаток AirBnB.

Додаток та метод реєстрації на основі віку та статі

Вік та стать реєстрації [Зображення [13]]
  1. Як і очікувалося, літні люди взагалі не використовують смартфони для використання AirBnB. Велика кількість людей у ​​20, 30 та 40 роки використовують комп’ютери для доступу до платформи AirBnB. Можна було б очікувати, що «підковані» підлітки та 20-річні діти більше використовуватимуть смартфони, але це не так. (Зверніть увагу, що у віковій категорії 30 років набагато більше людей. Це припущення може бути помилковим.)
  2. Більшість жінок віддають перевагу реєстрації за допомогою своїх комп’ютерів, а більшість чоловіків віддають перевагу додаткам iOS / Android.
  3. Набагато більше людей у ​​30-х роках віддають перевагу реєстрації за допомогою електронної пошти порівняно з Facebook. Майже дивно однакова кількість людей у ​​20-ті та 30-ті роки вважають за краще зареєструватися за допомогою Facebook.
  4. Більше жінок, ніж чоловіки, вважають за краще використовувати методи реєстрації у Facebook та електронну пошту. Порівняно з іншими 2, метод реєстрації Google схожий на помилку 404, не існує.

Тип першого пристрою проти віку та статі

Перший тип пристрою -Gender [Зображення [14]]
  1. Маки - це найпопулярніші ноутбуки для доступу до платформи AirBnB, а потім Windows Desktop. Знову ж таки, Apple користується величезною популярністю у США.
  2. Айфони та iPad є другими найбільш широко використовуваними пристроями для доступу до платформи AirBnB.
Тип першого типу пристрою [Зображення [15]]
  1. Настільні комп'ютери Mac користуються великою популярністю серед людей 20-х та 30-х років, щоб отримати доступ до платформи AirBnB, а за нею - на робочому столі Windows.
  2. Ми спостерігаємо тенденцію до зменшення використання Macs у міру збільшення віку. Немає розбіжностей між настільними комп'ютерами Mac та Windows для людей 60-х років.
  3. Розумні телефони, однак, стають непопулярними у міру збільшення віку.

Бронювання та рахунки протягом багатьох років

Бронювання та акаунти [Зображення [16]]
  1. Кількість замовлень швидко збільшується з кожним роком.
  2. Різке падіння бронювання на 2015 рік відбувається тому, що ми маємо дані лише до 29–06–2015 років. фільтр (train_users_2, date_first_booking> = "2015-06-29")
  3. За кількістю створених облікових записів у нас є дані лише до 2014–06–30. фільтр (train_users_2, date_account_create> = "2014-06-30")

Кількість перших бронювань на рік

Перші бронювання [Зображення [17]]
  1. Кількість перших бронювань - найнижча близько січня. Це може бути, тому що рік щойно закінчився, тому люди не їдуть кудись так швидко. Крім того, на вулиці багато холодів?
  2. Кількість перших замовлень завжди збільшується між липнем та жовтнем. Це може бути в очікуванні таких фестивалів, як День подяки та Октоберфест (або літні канікули).
  3. Однак ми спостерігаємо різке зменшення кількості бронювання, починаючи з липня 2014 року до липня 2015 року.
«У липні 2014 року компанія Airbnb розкрила зміни дизайну сайту та мобільного додатку та представила новий логотип. Деякі вважають, що новий логотип візуально схожий на геніталії, але опитування споживачів Survata показало, що лише менша частина респондентів вважає, що це так ».

Google "AirBnB 2014", щоб знайти причину раптового зменшення кількості бронювань у 2014 році.

Кількість облікових записів, створених на рік

Перший рахунок [Зображення [18]]
  1. Цей сюжет дотримується аналогічної тенденції, як описаний вище.
  2. Кількість створених нових (перших) облікових записів менша за січень і зростає у вересні та жовтні.
  3. Люди, ймовірно, створюють нові акаунти для бронювання, а також порівнюють ціни між іншими послугами.

AirBnB, ймовірно, може знизити ціни або дати більше знижок та пропозицій протягом серпня, вересня та жовтня, щоб більше людей бронювало місця.

Час між реєстрацією та першим бронюванням залежно від віку та статі

Бронювання - Реєстрація [Зображення [19]]

Кольорові поля вказують на міжквартирний діапазон, який представляє середину 50% даних. Вуса простягаються з обох боків коробки. Вусики представляють діапазони для нижнього 25% та верхнього 25% значень даних, виключаючи залишків.

  1. Важлива більшість людей, незалежно від віку та статі номерів книг у день їх реєстрації. Середнє значення дорівнює 0.
  2. Більше 1000 днів після реєстрації на платформі ви можете побачити номери "чужих людей".
  3. "Час очікування" для середніх 50% користувачів із кожної вікової групи, як правило, зменшується з віком.

Час між першим бронюванням та першим заходом

Бронювання - Активне [Зображення [20]]
  1. Час між першим бронюванням та першою активністю користувачів 0 або близько 0 для багатьох людей.
  2. Є люди, які забронювали свою першу кімнату понад 100 днів після своєї першої активності на платформі AirBnB. Блін.

Час між першим бронюванням та реєстрацією

Бронювання - Реєстрація [Зображення [21]]
  1. Тут ми бачимо, що кількість днів є негативною для досить великої кількості людей. Люди забронювали номери за рік до створення акаунта. Окрім цього, дані здаються подібними до наведеного сюжету.
  2. Величезна кількість людей бронює номери в той же день, коли вони реєструються на платформі AirBnB.

Проаналізуємо негативні значення. Скільки існує негативних значень?

Негативний час [Зображення [22]]

Ми бачимо, що існує лише 29 негативних значень. Це означає, що було 29 користувачів, які змогли забронювати свої номери, не створивши акаунт!

Подивимося, в які роки це сталося Після фільтрації лише негативних значень time_signup_to_booking, тобто людей, які забронювали номери перед реєстрацією, ми побудуємо наступний графік. Цей графік говорить про те, що користувачі могли зареєструватися перед бронюванням на платформі AirBnB з 2010 по 2013 рік.

Підрахунок за рік бронювання перед реєстрацією [Зображення [23]]

Наступне твердження оприлюднило AirBnB.

"До початку 2013 року було декілька потоків, де користувач мав змогу забронювати, перш ніж повністю створити обліковий запис (за визначенням створення облікового запису, яке ми використовуємо сьогодні). Після початку 2013 року це вже неможливо ».

Результати

Бронюється проти не бронюється

NDF означає, що бронювання не проводилось.

Забронювали проти не бронювали [Зображення [24]]
  1. Очевидно більше інертних користувачів, ніж активних.
  2. Відношення чоловіків та жінок приблизно однакове для користувачів, які бронюють проти тих, хто цього не робить. Однак значення НС відрізняються. Є багато користувачів, які не вказують свою стать та не бронюють жодну кімнату.
  3. Люди в 30-х роках - це найвища кількість в лотах як для бронювання, так і для бронювання номерів. Співвідношення "Бронювали": "Не забронювали" менше 1 для людей у ​​20, 30 та 40-х роках. Незважаючи на те, що таке ж співвідношення є постійним для людей у ​​50-х, 60-х та 70-х.
  4. Як бачите, величезна кількість людей не закінчує бронювання номерів. У США найбільше бронювання після цього. Велика кількість цих бронювань повинна бути вітчизняною, оскільки сама компанія базується в США.

На графіку видно, що люди у віці 20, 30 та 40 років - основні клієнти AirBnB.

Частота країни призначення

Частота країни призначення [Зображення [25]]
  1. Найбільша кількість неактивних користувачів (людей, які не забронювали номер) - за 30 років.
  2. Жінки подорожують дещо більше, ніж чоловіки, що використовують AirBnB.
  3. Після США та інших країн Франція - наступне за популярністю напрямок.
  4. Більше жінок подорожує до Франції порівняно з чоловіками, тоді як більше чоловіків відвідують Канаду порівняно з жінками.

Зауважте, що подорожі не повинні бути лише міжнародними. Він може бути як національним, так і міжнародним, оскільки країна походження користувачів не передбачена в наборі даних.

Вплив Партнерського каналу на країну призначення

Вплив партнерських каналів на пункт призначення [Зображення [24]]
  1. Прямі партнерські канали відігравали головну роль для підтвердження бронювання.
  2. Напівпровідниковий партнерський канал відіграє важливу роль для підтвердження бронювання, особливо в США.

Вплив Партнерського постачальника на країну призначення

Вплив партнерських постачальників на пункт призначення [Зображення [25]]

Після прямого афілійованого постачальника Google відіграє важливу роль у підтвердженні бронювання.

Щомісячна статистика бронювання на основі статі

Щомісячні бронювання проти статі [Зображення [26]]
  1. Жінки завжди забронювали більше готелів на AirBnB, ніж чоловіки, за винятком одного місяця - грудня 2013 року.
  2. Ми можемо побачити, що загальна кількість бронювання досягла піку приблизно в липні, крім 2014 та 2015 років.

Щотижневі бронювання за ознаками статі

Тижневе бронювання проти статі [Зображення [27]]
  1. Кількість бронювання завжди найнижча протягом вихідних, тобто. Субота й неділя.
  2. Кількість бронювань завжди досягає найвищого рівня у четвер та п’ятницю. Люди, ймовірно, бронюють номери на вихідні по четвергах та п’ятницях.
  3. Бронювання готелів у чоловіків значно зменшується у неділю порівняно з суботами, але для жінок це навпаки.
  4. Кількість замовлень постійно збільшується з понеділка по п’ятницю, щоб зменшитись лише на вихідні.

Щоденне коливання кількості бронювань

Щоденне бронювання проти статі [Зображення [28]]

Ми спостерігаємо, що AirBnB від початку до 50 замовлень на день у 2010 році становив майже 200 замовлень на день у перші місяці 2014 року.
Після цього кількість знизилася до приблизно 100 бронювань на день.

Висновки

Перш ніж я почав працювати над цим, у мене було кілька заздалегідь сформованих уявлень про те, які результати я отримаю. Наприклад, я не очікував, що iOS буде надзвичайно популярним. Більше, ніж Android.

З 432 мільйонів смартфонів, проданих в останньому кварталі 2016 року, 352 мільйони керували Android (81,7 відсотка), а 77 мільйонів працювали під iOS (17,9 відсотка).

Продажі смартфонів у всьому світі у четвертому кварталі 2016 року (тисячі одиниць) [Зображення [29] кредитів: Gartner]

Різке падіння кількості користувачів у липні 2014 року також було несподіваним. Я маю на увазі, що компанія до цього моменту мала надзвичайний темп зростання. Все після цього почало йти в гору. Хоча ми маємо дані лише до середини 2015 року, хто знає, що бронювання може забрати після цього.

Хто б очікував, що кількість бронювання знизиться у вихідні? Звичайно, не я. Але, як виявляється, якщо ви хочете поїхати у вихідні, ви повинні забронювати готелі перед цим. Моє ліжко. : P

Бронювати номер перед тим, як створити рахунок? Ця частина зайняла у мене багато часу, щоб розібратися. Я думав, що помилився. Але коли я, нарешті, погукав це, виявилося, що це було можливо до початку 2013 року. AirBnB виправила помилку незабаром після цього.

Інша річ, яка зациклювалася, - люди в 30-х роках були активнішими на AirBnB порівняно з людьми 20-х років. ЯК? Я, звичайно, не очікував, що люди в 70-х роках подорожуватимуть, тим більше користуючись AirBnB. * _ *

Дякую за прочитане Пропозиції та конструктивна критика вітаються. :) Ви можете знайти мене на LinkedIn. Повний код ви можете переглянути тут.

Ви також можете ознайомитись з іншими моїми блоговими публікаціями Дослідницький аналіз набору даних FIFA 18 за допомогою R, Початок роботи з вуликом та GgPlot 'Em All | Покемон на Р.