Setki mieszkań z Airbnb trafiają na rynek najmu długoterminowego

Koro­na­wi­rus nie pozo­sta­je bez wpły­wu na wie­le ryn­ków. Wpro­wa­dzo­ny przez rząd stan zagro­że­nia epi­de­micz­ne­go wią­że się z zaka­zem naj­mu krót­ko­ter­mi­no­we­go, przez co w War­sza­wie do odwo­ła­nia nie może dzia­łać Airbnb. Jed­nak spła­ty kre­dy­tów nie zosta­ły zawie­szo­ne przez pań­stwo jak we Wło­szech, a czyn­sze wciąż trze­ba pła­cić, pod­czas gdy epi­de­mia wyda­je się nie odpusz­czać. Wła­ści­cie­le mogą być pozba­wie­ni docho­dów jesz­cze przez mie­sią­ce. Na por­ta­lach ogło­sze­nio­wych bły­ska­wicz­nie poja­wi­ły się miesz­ka­nia na wyna­jem dłu­go­ter­mi­no­wy, któ­re jesz­cze nie­daw­no były dostęp­ne na Airbnb. Aby spraw­dzić, ile takich ogło­szeń zosta­ło opu­bli­ko­wa­nych, porów­na­li­śmy głów­ne zdję­cie ofert na Airbnb sprzed kil­ku mie­się­cy ze zdję­cia­mi z ogło­szeń wynaj­mu miesz­kań dostęp­nych na oto­dom i Gumtree.

Łukasz Nawa­ro, Ana­li­tyk DELab UW

Łatwo spraw­dzić, czy zdję­cia są iden­tycz­ne. Wystar­czy jed­nak drob­na zmia­na, aby zdję­cia przed­sta­wia­ją­ce to samo nie były dokład­nie takie same, np. oto­dom do każ­de­go zdję­cia doda­je wła­sny znak wod­ny. Z pomo­cą przy­cho­dzi hashing, czy­li algo­rytm przy­po­rząd­ko­wu­ją­cy licz­bę (tra­dy­cyj­nie zapi­sy­wa­ną sys­te­mem szes­nast­ko­wym) do dowol­ne­go pli­ku, w tym obra­zów. Odmia­na haszo­wa­nia, któ­rą wyko­rzy­stu­je­my to per­cep­tu­al hashing.

Haszo­wa­nie wyko­rzy­sty­wa­ne jest mię­dzy inny­mi w kryp­to­gra­fii. Typo­we algo­ryt­my haszu­ją­ce (np. MD5) są zapro­jek­to­wa­ne tak, aby drob­na zmia­na w danych wej­ścio­wych powo­do­wa­ła dra­stycz­ną zmia­nę wyni­ku pro­ce­su. Dla przy­kła­du, MD5 tek­stu Inwo­ka­cji to 6b293ee472ccc0bd57a8e9956714eb1d, po zmia­nie jed­ne­go zna­ku (“gry­sze” zamiast “gru­sze”) MD5 to a9cd76abd0ef604f40c70f5029c8162d. Dzię­ki temu może­my łatwo spraw­dzić, czy tekst został dokład­nie prze­pi­sa­ny lub czy kod pro­gra­mu został popraw­nie pobra­ny ze stro­ny inter­ne­to­wej. Dowol­ny algo­rytm kryp­to­gra­ficz­ny (SHA‑1, BLAKE itd.) powi­nien zacho­wy­wać się tak samo.

Dla naszych zasto­so­wań potrze­bu­je­my, aby nie­wiel­ka zmia­na w danych wej­ścio­wych powo­do­wa­ła tyl­ko nie­wiel­ką zmia­nę na wyj­ściu, czy­li w osta­tecz­nym haszu. Hasz słu­ży nam do zmniej­sze­nia ilo­ści porów­ny­wa­nych danych. W ten spo­sób nie­wiel­kie mody­fi­ka­cje, któ­rych się spo­dzie­wa­my, nie spo­wo­du­ją dra­stycz­nej zmia­ny wyni­ku, i w zależ­no­ści od wybra­nej tole­ran­cji uzna­my tekst lub zdję­cie za “dosta­tecz­nie” podob­ne. Dobra­nie odpo­wied­nie­go roz­mia­ru hasza i tole­ran­cji to bar­dziej sztu­ka niż nauka – nie może­my dokład­nie spraw­dzić efek­tyw­no­ści algo­ryt­mu. Uży­li­śmy algo­ryt­mu phash z biblio­te­ki Ima­ge­Hash z hash_size 12 i pozwo­li­li­śmy na mak­sy­mal­nie 35 bitów róż­ni­cy mię­dzy hasza­mi. Pozwo­li­ło to cał­ko­wi­cie wyeli­mi­no­wać fał­szy­we pozy­tyw­ne wska­za­nia podo­bień­stwa na wstęp­nych, testo­wych danych. To usta­wie­nia raczej ostroż­ne, dobra­ne tak, aby uła­twić nam pra­cę. Przy­kła­do­we zmia­ny, któ­re przy­naj­mniej w nie­któ­rych przy­pad­kach nie powo­du­ją nad­mier­nej zmia­ny war­to­ści hasza, to prze­ska­lo­wa­nie obra­zu, doda­nie zna­ku wod­ne­go, roz­ja­śnie­nie obra­zu, obra­ca­nie kadru, drob­ne ucię­cie czy doda­nie nie­wiel­kich pasków z góry i dołu.

Uży­li­śmy pra­wie 150 tysię­cy uni­kal­nych zdjęć doty­czą­cych 18 tysię­cy ofert z por­ta­li ogło­sze­nio­wych, a wszyst­kie zdję­cia zaję­ły 13 giga­baj­tów miej­sca na dys­ku. Pobra­li­śmy listę ogło­szeń dwa razy (raz w week­end 21–22 mar­ca, raz w czwar­tek 26 mar­ca). Dane doty­czą­ce 17,5 tysią­ca ofert Airbnb pocho­dzą z bazy AirD­NA z wrze­śnia 2019 – jed­na z kolumn zawie­ra­ła link do głów­ne­go zdję­cia wyświe­tla­ją­ce­go się w danym ogło­sze­niu naj­mu krót­ko­ter­mi­no­we­go, w zde­cy­do­wa­nej więk­szo­ści przy­pad­ków ten obraz był wciąż dostęp­ny. Pierw­sze zdję­cie musi być zachę­ca­ją­ce (kolej­ne mogą doty­czyć np. ręcz­ni­ków lub wido­ku z okna, mniej istot­nych dla naj­mu dłu­go­ter­mi­no­we­go), dla­te­go zakła­da­my, że zosta­ło ponow­nie wyko­rzy­sta­ne – ale nie­ko­niecz­nie jako głów­ne. W naszych wyni­kach – na pod­sta­wie wyłącz­nie głów­ne­go zdję­cia Airbnb – zna­leź­li­śmy 461 miesz­kań, któ­re były wcze­śniej wysta­wio­ne na Airbnb, a obec­nie są moż­li­we do wyna­ję­cia na jed­nym z dwóch por­ta­li na ryn­ku dłu­go­ter­mi­no­wym. Na rynek tra­fia­ją zarów­no miesz­ka­nia ze Śród­mie­ścia, jak i z odle­głych dzielnic.

War­to zauwa­żyć, że spo­ra część ogło­szeń na oto­dom doty­czy naj­mu “śred­nio­ter­mi­no­we­go”, z pro­mo­cja­mi koń­czą­cy­mi się w okre­ślo­nym ter­mi­nie. Zosta­ło opu­bli­ko­wa­nych aż 98 takich ogło­szeń. Właściciel(e) ma(ją) naj­wy­raź­niej nadzie­ję na prze­cze­ka­nie trud­ne­go okre­su i powrót na Airbnb po uspo­ko­je­niu się sytu­acji. Świad­czy to też o pro­fe­sjo­na­li­za­cji ryn­ku Airbnb, gdyż wszyst­kie ogło­sze­nia ze “śred­nio­ter­mi­no­wy” w tytu­le mają znak wod­ny tej samej agencji.

Mamy świa­do­mość ogra­ni­czeń nasze­go bada­nia. Ide­al­ne dobra­nie war­to­ści para­me­trów do porów­ny­wa­nia zdjęć jest trud­ne, a nie­któ­re fir­my wpro­wa­dza­ją agre­syw­ne zna­ki wod­ne. Zbie­ra­li­śmy dane tyl­ko w tym tygo­dniu, przez co jeśli miesz­ka­nie prze­szło na rynek dłu­go­ter­mi­no­wy wcze­śniej, nie zosta­ło uwzględ­nio­ne. Nie porów­na­li­śmy dal­szych zdjęć z Airbnb. Nie spraw­dzi­li­śmy, czy miesz­ka­nia tra­fi­ły na sprze­daż. Dodat­ko­wo nie­któ­rzy mogli ogła­szać się tyl­ko przez inne por­ta­le (przede wszyst­kim Face­bo­oka i OLX). Nie zbu­do­wa­li­śmy też zaawan­so­wa­ne­go sys­te­mu sztucz­nej inte­li­gen­cji spraw­dza­ją­ce­go, czy poko­je ze zdjęć są iden­tycz­ne, tak więc jeśli zosta­ły zro­bio­ne nowe zdję­cia (bar­dziej dosto­so­wa­ne do naj­mu dłu­go­ter­mi­no­we­go), nie zna­leź­li­śmy tego. Ręcz­nie usu­nę­li­śmy fal­se posi­ti­ves. Nie­mniej jed­nak to wszyst­ko ozna­cza, że nasze sza­cun­ki są ostroż­ne i jeśli się pomy­li­li­śmy, ta licz­ba jest nie­do­sza­co­wa­na – w połą­cze­niu z nie­uwzględ­nio­ny­mi ogło­sze­nia­mi, sprze­da­żą itd. być może trze­ba było­by mówić o tysią­cach miesz­kań. Wciąż w porów­na­niu do zaso­bów miesz­ka­nio­wych War­sza­wy nie będzie to wiel­ka licz­ba (za wyjąt­kiem Śród­mie­ścia, gdzie miej­sca­mi co kil­ka­dzie­siąt metrów moż­na zna­leźć miesz­ka­nie daw­niej wynaj­mo­wa­ne na Airbnb), ale w połą­cze­niu z moż­li­wy­mi upad­ka­mi wie­lu sek­to­rów usług – a co za tym idzie, wyjaz­da­mi ludzi z War­sza­wy do miejsc pocho­dze­nia – może mieć zna­cze­nie dla mia­sta. Wszyst­ko zale­ży od szyb­ko­ści opa­no­wa­nia pan­de­mii, dzia­łań rzą­du i ska­li nad­cho­dzą­ce­go kryzysu.

Zain­te­re­so­wał Cię arty­kuł? Prze­czy­taj raport o Airbnb w War­sza­wie!


Nie­bie­ski: miesz­ka­nia, któ­re są dostęp­ne na Gum­tree lub oto­dom. Czer­wo­ny: loso­wo wybra­ny pod­zbiór innych ofert z Airbnb.

Przewiń do góry